中文四笔码的制作方法

文档序号:6601591阅读:178来源:国知局
专利名称:中文四笔码的制作方法
技术领域
本发明涉及中文的编码,具体的说是中文四笔编码的新方法。
辞书检索中的部首检字法是把所有汉字分成若干部首,检字时要先确定部首,再数出部首以外的部件笔画数。不同的辞书有不同数量的部首,部首最多的《说文解字》达5百多个,部首最少的《新华字典》也有189个,其中只有“横、竖、点、撇、折”5个部首为单笔,其余184个均为复笔。
要利用部首检字,则必须熟习辞书中部首检字的方法,实质上是必须熟记所用辞书的所有部首。从目前的情况看这是比较繁杂的,即使记住了,一段时间不使用又忘记了。
本发明的目的是要提供一种面向大众,简单方便的新的编码方案,即利用60个笔型和26个汉语拼音字母为代号,将文字进行定码。反过来再利用拟定的笔型和代号,即可迅速地检索到文字。本发明的编码并为计算机中文输入编码提供一种新方案。
本发明的目的是这样实现的首先制定一个相当于辞书中的部首的笔型,笔型分为笔画、基本字、部件三大类,共60个。然后用汉语拼音的26个字母分别为它们代号。这样笔画笔型规定为5种基本笔画,“横、竖、点、撇、折”分别用“A、O、I、E、U”五个单韵母为代号;基本字笔型是把汉字部首中使用频度最高的28个字作为基本字笔型,并分别用每个字音节的头一个字母为代号,如“人”为“R”,“大”为“D”,并编有口诀助记;部件笔型,本码把汉字部首中使用频度最高的27个部件作为部件笔型,如“犭、口、宀、冖、穴、辶、纟、亠、小、火、冂、十、廴、艹、扌”等等并编有口诀助记。这样利用笔型和代号就可以给每个单字或词语定码。反之定码的单字或词语即可以用本发明的笔型和代号进行检索了。
由于本发明的编码是在一般辞书的基础上经改进和优化而发展起来的,同时本码用汉语拼音字母作为拟定笔型的代号,笔型分笔画、字型和部件三种共60个。一个笔画为一个单笔,一个字型或部件为一个复笔,一个码最多为四笔,故称四笔码。它比最简化的《新华字典》部首还要简化,即还不到《新华字典》的三分之一,仅剩下60个,而且编成口诀便于记忆,只要记住这60个笔型和代号,就可以使用本码。所以本发明是面向大众便于学习和记忆的一种切实可行的检字新编码。本发明代码和规则并能为计算机输入汉字提供一种简单方便的音形结合的新代码。
本发明的具体的编码及方法由以下的实施例具体给出。
本发明首先制定一个笔型,笔型分为三大类,分别为笔画笔型、其本字笔型和部件笔型,总共有60个。其次本发明利用汉语拼音的26个字母分别为它们代号。这样利用笔型和代号就可以给单字或词语进行定码,其具体内容如下。
一、笔画笔型本码规定汉字的5种基本笔画“横、竖、点、撇、折”,分别用5个单韵母A、O、I、E、U为代号。另规定“提”归属于“横”,“捺”归属于“撇”,可用以下口诀助记。
横提A,撇捺E点丨折U竖为O二、基本字笔型本码把汉字部首中使用频度最高的28个字作为基本字笔型,分别用每个音节的头一个字母为该字的代号,它们是厶包括マ,代号为S。人包括与其形似的笔型(如八、 、入、亻、儿)代号为R。门代号为M。口代号为K。贝代号为B。石代号为S。车;代号为C。工代号为G。厂凡由横与撇相接的笔型(如厂、丆、等)代号均为C。广包括疒代号为G。彳;代号为C。足包括,代号为Z。金包括钅,代号为J。戈代号为G。子包括孑、廴,代号为Z。女代号为N。寸代号为C。心包括忄,代号为X。隹代号为Z。虫代号为C。鸟代号为N。文包括攵(反文),(折文儿)代号为W。王;代号为W。大代号为D。尸包括 、卩 、 、己、 等,代号为S。立代号为L。木包括 ,代号为M。禾包括 ,代号为H。可用以下口诀助记。
厶人门口贝石车工厂广彳足金戈子女寸心隹虫鸟文王大尸立木禾三、部件笔型本码把汉字部首中使用频度最高的27个部件作为部件笔型,竹犭V竹字头(),包括“竹”字及犭代号为V。
衣尾J“衣”字尾部的“、ㄑ”的代号均为J。
方框四方形的框架“囗”代号为F。
宝盖包括宝盖头(宀)、秃宝盖(冖)、穴宝盖(穴)的代号均为B。
撇折Z先撇后折相接而成的笔型,如“ク、匕、勹、 等,代号均为Z。部件“ 、几、 ”例外,注意“ ”区别于“ ”(“ 、几、 ”为三围形部件)。
连络旁“连”旁是“辶”,“络”旁是“纟”(含“糹、糸”)代号均为L。
兼举头“兼”头是“丷、”(含“冫、丬”),“举”头是“ ”,代号均为J。
叉下横T交叉笔下面有横的部件(如“土、士、主、、ㄓ、 、里”等)代号均为T(取该类笔型中使用频度最高的“土”的声母T为代号)。
点横N点下有横的部件(亠)代号为N。
八分两边X和H“八”分别写在某些笔画或复笔笔型两边的部件(如“小、不、 、束、未、末、来、本、果”等)代号均为X(取该类笔型中使用频度最高的“小”的声母X为代号)。例八“丷”分写在某些笔画或复笔型两边的部件(如“火、、业、半、 ”等)代号为均为H(取该类笔型中使用频度最高的“火”的声母H为代号)。“丷和“八”同时分写在两边的部件,从“丷”取代号H(如“米、来、 ”等)。
三围取Y一边有缺口,其余各边首尾相接的三面包围形(简称“三围”)部件(如“ 、冂、几、匚、 、、凵、 ”等)代号均为Y(取该类笔型中使用频度最高的“月”的声母Y为代号。“ ”非首尾相接,故不在此例。)三点D三点水“氵”的代号为D。
单叉真W折为V两单笔交叉,且是无曲折的直笔(如“十、ナ、 ”等),代号为W。如交叉笔中的一画或两画是折笔(如“ 、九、七、又、 、廴”等)以及一单笔与三围形部件中的一边相交叉的笔型(如“巾、 ”等),代号均为V。另部件“ ”代号也作V。
多叉直Q折为P三个以上直笔笔画相交的部件及直笔笔画与方形笔型相交叉的部件(如“艹、丰、 、中、 ”等)代号均为Q。如果交叉笔画中有折笔的部件(如“扌、 、聿、电、 、屯、 ”等)代号均为P。
可用如下口诀助记。
竹犭V,衣尾J方框宝盖撇折Z连络旁,兼举头叉下横T点横N
八分两边X或H三围取Y三点D单叉直W折为V多叉直Q折为P另外本码还作了以下的规定A、“讠、阝、卜、刂、”四个部件取其第一画为代号,即“讠”取“丶”代号丨,“阝”取“了“,代号为U,“卜”和“刂”均取“丨”,代号O。
B、并列的多个相同笔画,只当一画取号,如“二、三”取“一”,代号A;“ ”取“丨”,代号O;“彡”取“丿”,代号E;“ ”和“灬”取“丶”,代号I;“ ”取“∠”,“巛”取“ㄑ”,代号U。
C、部件里面四面或三面包围着两个以内笔画的,当作里面无笔画取号,如“日、目、田、四、囚、 ”等,当作“囗”取F;“月”当作“ ”,“风、凤”当作“几”,“山、凶”当作“凵”,“冈、 ”当作“冂”,“ ”当作“ ”,“臼”当作“ ”取Y;“ ”当作“尸”、“巴”当作“已”取S;“夕、 ”当作“ク”、“匀、勾”当作“勹”取Z;“丹”当作“ ”、“母”当作“ ”取P;“内”当作“ ”取V;“凡”当作“ ”取UU,等等。
D、凡是交叉的笔型都作为固定笔型,不予分解,如“果”不能分解为“日、木”,“内”不能分解为“冂、人”。
本发明的笔型代号对照表如下
有了笔型和代号,就可以给每一个字定码,一个字如果由四个以内的笔型组成的,分另把每个笔型代号按笔顺连起来,即为该字的编码,如“好”为NZ,“佳”为RTT,“煌”为HEFW。超过四个笔型的字,只取前两笔和后两笔,如“辉”、HABC。只有一个笔型的字,如果是属于28个基本字笔型的除用该笔型代号外,再加该字音节的第二个字母,如“人”为RE,如果属于28个基本字笔型以外的字,除取该字笔型代号外,再加该字音节的第一个字母,如“事”为PS。
单字编码最多取四个字母,最少取两个字母,虽然四个字母的编码占大多数,但在实际应用中,二、三个字母的编码占3/4强。
本码中的词语编码,如果是二字词,分别取每个字的前两个笔型,如“辉煌”为HAHE;如果是三字词,分别取第一个字的前两笔和后两字的第一笔,如“联合国”为AORF;如果是四个字词,分别取各字的第一笔,如“马到成功”为UAGG;超过四字的词语,分另取前三字的第一笔和最后一个字的第一笔,如“中华人民共和国”为QRRF。在实际使用中,词语多于单字,据粗略统计,平均每个字的编码少于2.4个字母。
本码可广泛收取汉字的单字和词语,若仅收取常用字、词,重码率是极低的。
权利要求
1.一种中文四笔编码的新方法,其特征是制定了一个相当于辞书中的部首的笔型,笔型分为笔画笔型、基本字笔型和部件笔型三大类,共60个,再利用汉语拼音26个字母分别为它们代号,有了笔型和代号就可以给每个单字或词语定码,反之定码的单字或词语即可以用规定的笔型和代号进行检索。
2.根据权利要求1所述的中文四笔码,其特征是笔画笔型规定汉字的5种基本笔画“横、竖、点、撇、折”,分别用5个单韵母A、O、I、E、U为代号,其中把“提”归属于“横”,“捺”归属于“撇”。
3.根据权利要求1所述的中文四笔码,其特征是基本字笔型把汉字部首中使用频度最高的28个字作为基本字笔型,分别用每个音节的头一个字母为该字的代号,它们是厶包括マ,代号为S人包括与其形似的笔型(如八、 、入、亻、儿)代号为R;门代号为M;口代号为K;贝代号为B;石代号为S;车代号为C;工代号为G;厂;凡由横与撇相接的笔型(如厂、、、)代号均为C;广包括疒代号为G;彳代号为C;足包括,代号为Z;金包括钅,代号为J;戈代号为G;子包括孑、廴代号为Z;女代号为N;寸代号为C;心包括忄,代号为X;隹代号为Z;虫代号为C;鸟代号为N;文包括攵(反文),(折文儿)代号为W;王代号为W;大代号为D;尸包括 、卩 、 、已、己、 ,代号为S;立代号为L;木包括,代号为M;禾包括 ,代号为H。
4.根据权利要求1所述的中文四笔码,其特征是部件笔型把汉字部首中使用频度最高的27个部件作为部件笔型,它们是竹犭V竹字头(),包括“竹”字及犭代号为V;衣尾J“衣”字尾部的“、ㄑ”的代号均为J;方框四方形的框架“囗”代号为F;宝盖包括宝盖头(宀)、秃宝盖(冖)、穴宝盖(穴)的代号均为B;撇折Z先撇后折相接而成的笔型,如“ク、匕、勹、 ,代号均为Z;连络旁“连”旁是“辶”,“络”旁是“纟”(含“糹、糸”)代号均为L;兼举头“兼”头是“丷、”(含“冫、丬”),“举”头是“ ”,代号为均为J;叉下横T交叉笔下面有横的部件(如“土、士、、 、廿、、里”)代号均为T;点横N点下有横的部件(亠)代号为N;八分两边X和H“八”分别写在某些笔画或复笔笔型两边的部件(如“小、不、 、束、未、末、来、本、果”)代号均为X;八“丷”分写在某些笔画或复笔型两边的部件(如“火、、业、半、 ”)代号为均为H;“丷”和“八”同时分写在两边的部件,从“丷”取代号H(如“米、来、 ”);三围取Y一边有缺口,其余各边首尾相接的三面包围形(简称“三围”)部件(如“ 、冂、几、匚、 、、凵、 ”)代号均为Y;三点D三点水“氵”的代号为D;单叉直W折为V两单笔交叉,且是无曲折的直笔(如“十、ナ、 ”),代号为W,如交叉笔中的一画或两画是折笔(如“ 、九、七、又、 、廴”)以及一单笔与三围形部件中的一边相交叉的笔型(如“巾、 、屮、 ”),代号均为V;另,部件“ ”代号也作V;多叉直Q折为P三个以上直笔笔画相交的部件及直笔笔画与方形笔型相交叉的部件(如“艹、丰、 、中、 ”)代号均为Q,如果交叉笔画中有折笔的部件(如“扌、 、聿、电、 、屯、 ”)代号均为P。
5.根据权利要求1所述的中文四笔码,其特征是“讠、阝、卜、刂 、”四个部件取其第一画为代号,即“讠”取“丶”代号I,“阝”取“了”,代号为U,“卜”和“刂”均取“丨”,代号O;并列的多个相同笔画,只当一画取号,如“二、三”取“一”,代号A;“ ”取“丨”,代号O;“彡”取“丿”,代号E;“ ”和“灬”取“丶”,代号丨;“ ”取“∠”,“巛”取“ㄑ”,代号U;部件里面四面或三面包围着两个以内笔画的,当作里面无笔画取号,如“日、目、田、四、囚、 ”,当作“囗”取F;“月”当作“ ”,“风、凤”当作“几”,“山、凶”当作“凵”,“冈、 ”当作“冂”,“ ”当作“ ”,“臼”当作“ ”取Y;“ ”当作“尸”、“巴”当作“已”取S;“夕、 ”当作“ク”、“匀、勾”当作“勹”取Z;“丹”当作“ ”、“母”当作“ ”取P;“内”当作“ ”取V;“凡”当作 取UU,凡是交叉的笔型都作为固定笔型,不予分解,如“果”不能分解为“日、木”,“内”不能分解为“冂、人”。
全文摘要
本发明公开了一种中文四笔编码的新方案,它规定了一个相当于辞书中的部首的笔型,笔型分为笔画笔型、基本字笔型和部件笔型三大类,共60个,然后用汉语拼音的26个字母分别为它们代号。这样利用拟定的笔型和代号,就可以给单字或词语进行定码,反之定码的单字或词语即可以用本发明的笔型和代号进行检索了。由于本码规定一个笔画为一个单笔,一个字型或一个部件为一个复笔,一个码最多为四笔,故称之为中文四笔码。
文档编号G06F3/023GK1150667SQ95117189
公开日1997年5月28日 申请日期1995年9月29日 优先权日1995年9月29日
发明者陈玉新 申请人:陈玉新
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1