正字法汉字编码的制作方法

文档序号:6601568阅读:613来源:国知局
专利名称:正字法汉字编码的制作方法
技术领域
本发明涉及汉字信息处理技术,特别是一种汉字字形书写标准化规范化的汉字编码方法。
现在,汉字编码方法已有许多种,有的也已应用于计算机输入系统,但在这些诸多汉字编码方法中,往往要求使用者去死记硬背一些繁锁的、难于理解的、学了易忘的、人为定义的规则,或者,要求使用者去死记硬背大量的字根、字元、部件、部首等等,而这些用字根、字元、部件、部首来组成的汉字往往不符合汉字的字形规范和人们书写的笔顺规则,有的甚至将汉字拆分得令人莫名其妙。例如“丁”加“口”不是“可”字,“一”加“四”加“小”不是“柬”字,违反了字形规范,又比如“冉”字的笔顺为“门”加“丨”加“二”,而不是“冂”加“土”,“戒”字的笔顺为“一”加“ ”加“ ”,而不是“戈 ”加“廾”,违反了笔顺规则。诸多例子数不胜数,对比在西文中,如英文单词在输入计算机时,人们不会将re-、-ty、-tion、-nal等构词结构用一些字母来代替,并不按英语的词形规范和书写规则来进行计算机输入,这等于要人们去接受一种莫名其妙的东西。
另外,汉语拼音是汉字的发音根本,但中国幅员辽阔,地方语音众多,每个人的发音不一定很标准,如果汉语走向世界,发音不准的问题就更容易使人们在使用拼音法、音形法等这类汉字编码方法时,在键盘上一试再试地进行猜测式操作。西文单词都可以用国际音标来发音,但人们不会用输入国际音标的方式来达到输入西文的目的。
众所周知,文字必须规范化,文字的规范化水平反映一个国家的文化水平,世界各国都很重视本国文字的规范化,我国也很重视汉字的规范化,先后发布了《印刷通用汉字字形表》、《现代汉语常用字表》、《现代汉语通用字表》等汉字标准,在这些字表当中,规定了汉字的笔画数目、笔画形状、笔画顺序和构件部位,它们是正确书写汉字的依据。1986年,国务院提出“逐步消除社会用字混乱的不正常现象”的要求,同样适用于诸多汉字编码方法中那些违反汉字规范化的现象。所以全体使用和学习汉语的人,都要用上述标准来指导识字和写字、规范汉字写法。规范的标准一经确立和公布,是要求全社会都认可和恪守的,具有强制人们遵循的含义,任何一个社会成员都无权发布变动或废除这种标准。
中华文化灿烂、悠久,汉语词句严谨、表达力丰富,层次分明、逻辑性强。汉字结构严明、单字组词能力强。现在世界上已有越来越多的人使用和学习汉语,在当今的计算机时代,要使方块形的汉字被计算机接受,就必须对汉字进行编码,使字数繁多、字形复杂、不易检索的汉字,在保持中华文字传统的前提下,使之能够既符合汉字书写的规范,又接近世界上大多数文字的形态,成为易于并喜欢被人们接受的、合乎全世界人民打字和检索习惯的编码形式。本发明的目的就在于向所有使用和学习汉语的人,从人人皆知的汉字书写规则和习惯出发,提供一种以汉字书写规范化的,不需死记硬背的,以最少记忆量的,无需任何口诀的,能在很短时间内学会(一般人,包括小学生能在15分种内学会并可上机操作)的汉字编码。使所有使用和学习汉语的人,能用世界上最流通的打字输入方式和字典检索方式来使用汉字,从而使中华文字真正地走向世界,与世界上大多数文字相接轨。
西文是以单词为基本单位的,而西文字母是组成西文单词的根本元素,比如,英文流通于全世界,其写法不是因地而异,而是全世界各地的英文写法都是一致的,不会出现面目各异的英文,达到了高度的规范化。书写英文字母以构成英文单词,同样在计算机上输入英文字母,以达到输入英文单词的目的。
中文是以单字为基本单位的,而汉字笔画形状是构成汉字的根本元素,只有按汉字笔顺规则书写笔画形状,才能组成字形标准化的汉字。因此,在计算机上,只有按笔顺规则输入汉字笔画形状代码,才能达到正确输入汉字的目的,不会强制人们去接受另一种莫名其妙的所谓“汉字”。
本发明的汉字编码更具体地说是将汉字笔画形状集分成八类,并用八个英文小写字母a、b、c、d、c、f、g、h分别表示,简称笔形字母代码,将汉字分解成笔画形状,按照汉字笔顺规则顺序排列,用笔形字母代码来编码的一种汉字编码。具体说明如下1.技术方案本发明归纳出组成汉字的基本笔画形状有32种,如下所示 如果用上表所示的32个笔画形状来定义计算机键盘当中的32个键,按汉字笔顺规则,用键入定义的笔画键来“一笔一画”地在键盘上书写汉字,就可达到输入汉字的目的。又因为汉字的笔画结构不同,所组成的汉字就不同,所以上述方案不会出现重码现象。对比在西文中,字母数超过26个的也为数不少,如德文、俄文、匈牙利文等等。因此,上述方案是可行的。但是,人们还是要记忆多达32个笔画形状键,或是其代码键,以及其在键盘上所处的位置。
另外人们的汉字书写习惯在书写汉字时,有些笔画形状不会被很明显的区分,比如“茶”字可能写成“茶”,“朝”字的第二笔画是撇还是竖,容易造成输入错误。又如“有”字的“ ”部首与“月”部首形状不同,可人们往往在使用时 与“月”不分.从而编错码。这类例子很多,因此限制了输入速度的提高,一般人难于实现盲打,但是,上述种种问题,都可用简单易学的正字法汉字编码来解决。
2.用英文小写字母a、b、c、d、c、f、g、h表示的八类笔画形状一笔形字母代码本发明将32种笔画形状,根据人们的书写习惯和运笔方向分成八类,分别用英文小写字母a、b、c、d、e、f、g、h表示1).a— (横、提);2).b丨亅丿 (竖、竖钩、撇、左向点);3).c丶(右向点、捺);4).d 乙(横折提、横折折、横折弯、横斜钩、横折弯钩);5).e く(竖钩、斜提、竖弯钩、撇折、竖折、撇点);6).f (横撇弯钩、横折折折钩、横折折撇、横折折折);7).g (弯钩、横折钩、横钩、横折、横竖、横撇);8).h (竖折折钩、竖折撇、竖折折)。
a类表示运笔向右和向右上方书写的二个笔画形状;b类表示运笔向下和向左下方书写的三个笔画形状以及一个“竖钩”笔画形状;(根据人们的书写习惯,将“竖钩”归纳入b类,这是一特殊情况)c类表示运笔向右下方向书写的二个笔画形状;d类表示这五个运笔方向基本相似的笔画形状,其记忆特征是这类笔画形状的小尾巴与英文小写字母d的小尾巴相似;c类表示开口向右和右上方的六个笔画形状,其记忆特征是与英文小写字母e的开口方向相似;f类表示这四个运笔方向基本相似的笔画形状,其记忆特征是这类笔画形状与阿拉伯数字“3”的形状相似;g类表示开口向左和向左下方的六个笔画形状,其记忆特征是与英文小写字母g的开口方向相似;h类表示这三个运笔方向基本相似的笔画形状,其记忆特征是这类笔画形状的向上一竖与英文小写字母h的向上一竖相似。
3.汉字笔顺规则本发明无任何人为定义的规则,但要求使用者严格执行汉字笔顺规则。
1).先横后竖;十(一、十)2).先撇后捺;人(丿、人)3).先上后下;三(一、二、三)4).先左后右;仁(亻、仁)5).先外后里问(门、问)6).先外后里再封口;国(冂、 国)7).先中间后两边;小(、小)8).点在上边或左上的先写;为( 为)六( 六)9).点在右上或字里的后写;叉( 又、叉)我( 我)10).两面包围结构的字(1)上右和上左包围结构先外后里;司( 司)厅(厂、厅)(2)左下包围结构先里后外;远(元、远)11).三面包围结构的字(1)缺口朝上的先里后外; 凶(乂、凶)(2)缺口朝下的先外后里;同(冂、同)(3)缺口朝右的,先上后里再左下。区(一、 区)汉字笔顺规则,是所有学习和使用汉字的人在初学阶段就必须牢牢掌握的,从识字乃至一生中,随时随地、经常不断地使用,是永远不会被忘记的一种规则。如遇到一些难以确定笔画顺序的字,可查阅1965年1月文化部和中国文字改革委员会发布的《印刷通用汉字字形表》或费锦昌先生编写的,由上海辞书出版发行的《汉字写法规范字典》。使人能一经查阅,受益匪浅、难于忘却,比如火( 火),垂( 千 垂),重( 重),爽( 爽),兆(丿 兆),脊( 脊),兜( 兜),丑( 丑),长( 长),官(宀 官),瑕( 瑕),兔(ク 免兔)。
4.编码实例本发明用笔形字母代码,严格要求以汉字笔顺规则来进行汉字编码。
例如“国”字,按汉字笔顺规则,是先后由(丨一一丨一、一)八个笔画形状组成的八划汉字,用笔形字母代码来分别表示这八个笔画形状,即为(bgaabaca),因此,“国”字的汉字编码就是这八个字母组成的字母串bgaabaca,并且是一个八划汉字,同理可以对任何汉字进行编码。
例如“汉字编码”这四个字的编码为汉(ccagc)字(cbggba)编(eeacgabbgabb)码(abbgagha)
用上述编码方法对汉字进行编码的过程,就是在计算机键盘上用八个英文字母键规范地、一笔一画地、击键书写的过程。这是个很自然的行为过程,非常简便,而且非常合乎人们的生活习惯,操作熟练后,可以很自然地实现盲打,相信就是小学生也能很容易地掌握这种取代式的编码方法,从而对任何汉字进行汉字编码。尽管这种汉字编码的码数长短不一,但没有哪一个国家要求对自己的文字先编成码数相同的代码后,再进行计算机输入。英文单词是由不同字母串组合而成的,其单词中的字母数有多有少,试想如果将10个字母组成的英文单词(motherland祖国)编为四位代码,这是不可思议的多此一举的事,如果将所有英文单词全部都编成所谓的四位代码,那么,英文将是另一种东西了。当然,构成汉字的笔画数是因单字而异,有的单字笔画数较多,是对计算机的输入速度有所影响,但纵观西文,由十个以上字母组成的西文单词也并不是少数,因此由字母组成的西文单词可以实现盲打,相信由笔画形状组成的汉字,用本发明的笔形字母代码也必然能实现盲打。因为用本发明在键入字母键的同时,就是一个书写汉字的过程,没有任何拆分、归类、拼接、猜测等思维过程,而这种思维过程所需要的思维时间,正是影响计算机输入速度提高的主要因素。
5,重码问题本发明的笔形字母代码,因为在每一类笔画形状中含有数个笔画形状,所以有极少量的重码现象存在,其离散度为Σn=1m8n]]>(其中n为笔画数,m为汉字集中单字的最多笔画数。)由公式可计算出汉字笔画数一画字二画字三画字四画字五画字六画字七画字…离散度8 64 512 4096 32768 262144 2097152由此可见,本发明的总离散度和总容量很大,汉字的笔画数越多,离散度越大,重码率越低,甚至无重码现象。对笔画数较少的汉字来说,因其数量不多,所以重码率也很低,因此,本发明的汉字编码具有重码率低的优点。
出现重码字时,重码字以字频为序显示在提示行中,用数字键来选字,如被选字恰是处在显示行的第一个位置的常用字,则可直接继续下文输入。
6.本发明的汉字检索(1).在计算机上检索汉字1°.汉字的单字输入用本发明的八个笔形字母代码,按汉字笔顺规则来一笔一画地输入汉字是本发明在计算机上检索汉字的根本方法和前提,也是非常容易学习、记忆和使用的,但为了提高输入速度,减少击键次数和充分利用键盘上其余的键,本发明按汉字笔顺规则,归纳出了由数个笔画形状组成的84种汉字构字部件,并用计算机键盘上的46个键的上下挡键名,分别对其一一定义,组成84个部件键名,如附表所示键名 构字部件 笔形字母代码 例字i讠 cd计j扌土工 士 aba 打坚地贡巩志k ebc 良伐龙l 厶ec既去式m门宀 cbg 门穴n冂ク 勹冖bg国奥奂尔用匀冥鼎水o口 bga 品p阝 fb陌g尸 gab 户霞r丷 cb摘州s氵 cca 汁t才艹廾 丌 abb 豺莫奔在鼻其耳u凵丩 cb凶纠乡尧v cba 益w广 丬 cab 应壮x又 gc 叉劲甬登蔡y夕夊久 bgc 多各灸缓z孑子 gba 孩子A bbg 船射奥B日月 bgaa 晶朋显衰C幺 eec 幻D田由 bgaba男寅E王aaba 全责琐F钅baaae钢G心becc 芯H目且旦 bgaaa眼宜是助直I禾babbc税J 鱼 bgbgabaa 鲜鲞Kbebc 农派L辶cfc 远M四皿 bgbba罢益衅N贝内冈办 bgbc 贡肉纲办梁O石古 abbga磊摘Pbbcaaaba 淮Q车acba 轮R虫bgabac 虹S弓gah 夷T木 abbc 桥茶U山 beb 岗岭V立 cacba妾端W纟eea 级X攵babc 政Y bcb 党敝Z止baba齿此牧告0十丁丆 厂ナab 卑订不左隔顾南凸面1小 忄bbc 孙尖怕耕2二aa 贰3三 aaa 身耳4  ba 乖旅占禹鼎片5力刀 卩 gb 历忍方皮部报也韦予6大 寸 abc 夺杖封益其7七ac 毛倾东切舜氏亡虐越8八人入 乂卜 bc 分个氽黄文外水暴以甫9九几 几 bd 旭肌船风丶 cg 母贯椽-彐  gaa 雪录建= 干于亍aab 杆字行肆那[ 儿 be 乐迎祝辉轮华臣] ga 民候; cc 舟滷, 亻 bb 作丘后乔勿州爪弟监 刂リ 才师副业.亠冫 ca 高冶/女 eba 要好aabba 寒!雨 abgbcccc雨雷@ 臼bbagaa 鼠# abba革巷$ 丰 aaab契邦%彳 彡 bbb 衍悠步彩卅带聚^火 cbbc灭灯& 鸟bgcha 鸽* 米cbabbc 粒( bacbac 笔) 羽 gcagca 翻谬- abgbba 贾鹿+ bcabc 绿犀( 酉abgbcaa 醒) gbb 貌灬 bccc 黑"ccb举< 饣 bge饮>  cgb礼衬?马 gha骂驶’ 巾犭bgb帆独因为这84个部件键名所代表的每个构字部件,都可用数个笔形字母代码来表示,所以用一个部件键名来一次输入数个笔形字母代码,以达到减少击键次数的目的。
在这84种构字部件中的每一种,是分别由一个或数个笔形字母代码相同的构字部件组成的,本发明利用了部件重码现象和汉字书写的笔画连续性以及人们所熟悉的汉字部首和部件,对于部件键名不需作特别记忆。使用者可在操作当中按汉字笔顺规则,在计算机键盘上以查寻方式键入相应的汉字构字部件键名,在键盘上规范化地书写汉字,逐步熟练直至达到快速盲打的目的。初学者可先使用本发明的汉字输入根本方法来达到汉字计算机输入的目的,然后为加快输入速度,用笔形字母代码与部件键名结合使用,按汉字笔顺规则来拼写汉字,以取大优先为原则,尽量取笔画数多的构字部件,以减少击键次数,提高输入速度。例如曹可分解为(一冂 日)即(an#B)我可分解为(丿扌 )即(bjk)象 可分解为(ク)即(nob)8)禺可分解为(日冂 丶)即(Bn4c)亥可分解为(亠 人)即(.u8)丑可分解为( 二)即(52)牛可分解为(十)即(40)车可分解为( 十)即(70)注牛、车与部首牛、车的笔画顺序不同。韦 可分解为(二 )即 25)龙 可分解为( )即 (0k)以 可分解为( 人)即 (18)乡 可分解为( ) 即(eu)必 可分解为( 丶) 即([rc)矗 可分解为(ナ — — 一)即(0Ha0Ha0Ha)虹 可分解为(虫工)即(Rj)在GB2312--80国家标准汉字集中的6763个汉字中,用本发明的笔形字母代码和84个部件键名结合使用的汉字输入击键数如下表所示击键次数 12 3 4 56 7 8 9组成字数 70 518 1258 1041 602 174 61 8 1因此,本发明的单字平均击键次数(加空格键)为(3733+6763)÷6763=1.55键。
本发明归纳出的84种汉字构字部件,可根据不同汉字集的用字量作适量的增减。增加构字部件可使击键次数减少,反之,则会增加击键次数。
2°.汉语词汇输入1).普通词汇输入用本发明的汉字编码来进行词语输入,同样按照汉字笔顺规则,可以用笔形字母代码来输入,也可以用部件键名来输入。无论是对二字词、三字词、四字词还是多字词,均取组成每个字的第一个构字部件,按字数逐个输入,并要求取部件笔画数最多的构字部件。如果遇到某字的第一个构字部件不在本发明归纳的84种部件之中,则取第一个笔画形状,用笔形字母代码输入。例如非常(bY) 电脑(nB)科学(A″) 共青团(#En)天安门(2mm)正字法(0ms)汉字编码(smWO) 人民政府(8]0w)军事委员会(naAo8)2).专用名词输入对组成专用名词的每一个汉字,取各汉字的第一个笔形字母代码来输入,其形式类似于西文中的专用名词字母缩写形式。例如中国共产党(bbacb)中华人民共和国(bbbgabb)中国人民解放军(bbbgbcb)(2).在字典中检索汉字千百年来,人们创造了许多汉字检索方法,其中汉字笔画检字法是比较受欢迎的,它要求首先确定汉字单字的笔画数,然后在与其笔画数相同的一大群汉字中逐个查找被检索的汉字,它比汉字部首检字法省去了一个汉字部首的归属过程。在这些检字法中,包括汉语拼音检字法,都需经过一个在检字表内检索汉字的过程,有时甚至还需在难检字表中检索汉字的过程,才能最后在字典内检索到汉字。因此,这些检字法都是间接的和比较繁锁的检字方法。
用本发明的汉字检索方法,首先对需要被检索的汉字进行编码,根据构成该字的笔画形状编成按汉字笔顺规则顺序排列的,用笔形字母代码来表示的字母串编码,然后按照英文字母的排列顺序在字典上直接检索汉字。英文字母的排列顺序是人所皆知的,用英文字母的排列顺序来检索汉字,不需任何汉字检索表。与世界上大多数文字的检索方法相同,达到了非常快速、简便、直接地检索汉字的目的。
7.本发明的优点及用途综上所述,显然,本发明具有符合汉字写法规范,易学难忘,记忆量少,规则简明,操作直观,击键与写字方式相同,容易推广且普及面大,击键次数少,便于实现盲打等优点。
本发明的用途广泛,不仅能用于汉字计算机输入系统,汉字排版,编辑系统及电脑打字机和中外文翻译机等方面。如将本发明的八类笔画形状用数码来表示,则可用于电报码的传输,而且还可用于图书资料和科技情报的目录索引及其检索等方面。
用本发明的汉字编码来编码汉语字典或词典,可用世界上多数文字字典的检索方法来检索汉字,能被世界上大多数人所接受和欢迎。
用本发明的汉字编码来进行汉字打字,符合世界上大多数文字的打字习惯,从而为我们带来一个真正的汉字打字机时代,使汉字更容易被全世界人民所接受,并使汉语能更快地走向世界。
权利要求
1.一种正字法汉字编码,其特征在于所述的汉字编码是用构成汉字的根本元素--汉字笔画形状的八种分类,以汉字字形写法标准--汉字笔顺规则为规范的编码。
2.根据权利要求1所述的正字法汉字编码,其特征在于所述的汉字笔画形状的八种分类,是将32个汉字笔画形状,根据其运笔方向分成八类,每一类分别用英文小写字母a、b、c、d、e、f、g、h来表示的代码(简称笔形字母代码)进行编码,它们是1).a— (横、提);2).b丨亅丿 (竖、竖钩、撇、左向点);3).c丶 (右向点、捺);4).d (横折提、横折折、横折弯、横斜钩、横折弯钩);5).c ∠く(竖钩、斜提、竖弯钩、撇折、竖折、撇点);6).f ㄋ (横撇弯钩、横折折折钩、横折折撇、横折折折);7).g (弯钩、横折钩、横钩、横折、横竖、横撇);8).h (竖折折钩、竖折撇、竖折折)。
3.根据权利要求1所述的正字法汉字编码,其特征在于按照所述的汉字笔顺规则,将汉字分解成汉字笔画形状来进行编码,规则是1).先横后竖;2).先撇后捺;3).先上后下;4).先左后右;5).先外后里6).先外后里再封口;7).先中间后两边;8).点在上边或左上的先写;9).点在右上或字里的后写;10).两面包围结构的字(1)上右和上左包围结构先外后里,(2)左下包围结构先里后外;11).三面包围结构的字(1)缺口朝上的先里后外,(2)缺口朝下的先外后里,(3)缺口朝右的,先上后里再左下。
4.根据权利要求1或2或3所述的正字法汉字编码,其特征在于所述的汉字编码是将组成汉字单字的笔画形状,按汉字笔顺规则顺序排列,用笔形字母代码表示的字母串编码。
5.根据权利要求4所述的正字法汉字编码,其特征在于用84种由数个笔形字母代码,按笔顺规则组成的构字部件来定义计算机键盘上46个键的上下档键名,所构成的部件键名与笔形字母代码结合使用,以较少的击键次数进行汉字的计算机输入,具体是键名 构字部件笔形字母代码 例字i 讠 cd计j 扌土工 士 aba 打坚地贡巩志k ebc 良伐龙l 厶 ec既去式m 门宀cbg 门穴n 冂ク勹 bg国奥奂尔用匀冥鼎水O 口 bga 品p 阝 fb陌g 尸gab 户霞r 丷cb摘州s 氵 cca 汁t 才艹廾 丌abb 豺莫奔在 其耳u 凵 丩 cb凶纠乡尧V  cba 益w 广丬cab 应壮x 又マ gc 叉劲甬登蔡y 夕夂久bgc 多各灸缓Z 孑子gba 孩子A bbg 船射奥B日月曰bgaa 晶朋显衰C幺eec 幻D田由 bgaba男寅E王aaba 全责琐F钅baaae钢G心becc 芯H目且旦 bgaaa眼宜是助直I禾babbc税J 鱼 bgbgabaa 鲜鲞K bcbc 农派L辶cfc 远M四皿bgbba罢益衅N贝内冈办bgbc 贡肉纲办梁O石古 abbga磊摘P bbcaaaba 淮Q车 acba 轮R虫 bgabac 虹S弓 gah 夷T木 abbc 桥茶U山 beb 岗岭V立 cacba妾端W纟 eea 级X 攵 babc政Y  bcb 党敝Z 止baba齿此牧告O 十丁丆 厂 ab 卑订不左隔顾南凸面1 小 忄 bbc 孙尖怕耕2 二 aa 贰3 三 aaa 身耳4 ba 乖旅占禹鼎片5 力刀 卩 gb 历忍方皮部报也韦丑予6 大 寸 abc 夺杖封益其7 七 ac 毛倾东切舜氏亡虐越8八人入 卜bc 分个氽黄文外水暴以甫9九几 bd 旭肌船风 cg 母贯椽-彐 gaa 雪录建= 干于亍 aab 杆宇行肆那[ 儿 be 乐迎祝辉轮华臣] ga 民候 ; cc 舟滷, 亻 bb 作丘后乔勿州爪弟监 刂 才师副业. 亠冫 ca 高冶/ 女 eba 要好aabba 寒!雨abgbcccc雨雷@ 臼 bbagaa 鼠# abba革巷$ 丰aaab契邦%彳 彡川 bbb 衍悠步彩卅带聚^火 cbbc灭灯& 鸟 bgcha 鸽* 米 cbabbc 粒(  bacbac 笔) 羽gcagca 翻谬 abgbba 贾鹿+bcabc 绿犀( 酉 abgbeaa 醒gbb 貌 灬 bccc黑ccb 举< 饣 bge 饮>  cgb礼衬?马 gha骂驶' 巾 犭bgb帆独
6.根据权利要求4所述的正字法汉字编码,其特征在于对汉语词汇无论是由几个汉字组成的词语,都分别取每个汉字的笔画数最多的第一构字部件进行计算机输入。
7.根据权利要求5所述的正字法汉字编码,其特征在于若某字的第一构字部件不属于84种构字部件中的,则取该字的第一笔画形状,用笔形字母代码及部件键名进行计算机输入。
8.根据权利要求4所述的正字法汉字编码,其特征在于对专用名词分别取每个字的第一笔画形状,用笔形字母代码进行计算机输入。
9.根据权利要求4所述的正字法汉字编码,其特征在于根据其字母串编码的字母排列,按英文字母的排列顺序编写字典和词典的检索方法。
全文摘要
正字法汉字编码,是以汉字字形写法的标准—汉字笔顺规则为规范的,用汉字笔画形状的八种分类的字母代码组成的汉字编码。构成汉字的笔画形状有32个,根据各笔画形状的运笔方向,将32个笔画形状分为八类,分别由英文小写字母abcdefgh表示,定义为笔形字母代码,将汉字分解成笔画形状,并按汉字笔顺规则顺序排列,用笔形字母代码来表示的字母串,即为正字法汉字编码。
文档编号G06F3/023GK1146572SQ9511179
公开日1997年4月2日 申请日期1995年10月6日 优先权日1995年10月6日
发明者方涛, 章斐 申请人:方涛, 章斐
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1