结构声形编码法及实用键盘的制作方法

文档序号:6405205阅读:439来源:国知局
专利名称:结构声形编码法及实用键盘的制作方法
技术领域
本发明属于一种新式汉字编码技术在电脑中实现的方法以及与其对应的专用输入装置,更确切地说属于一种汉字信息处理系统。
电子计算机的普及与推广对一个国家工农业生产、国防、文化教育的现代化均起着举足轻重的作用,这是全世界所公认的结论。由于我国文字的特殊结构给这一项工作带来一定的难度。所以,汉字编码方案及其在电子计算机实现信息传递的方法和配套装置已成为国内外计算机界关注的课题。各种类型编码方案层出不穷,众多优秀设计已经达到实用化程度,确实推动了我国计算机汉字化进程。总结起来,其编码方案都不外乎从两方面着手,一是利用汉字结构拆解,一是利用读音,或是二者的结合。学者们总是试图将汉字拆解为若干个部件,并给这些部件归类于某种代码,再利用这些代码组合排列形成一种编码方案,利用编码实现信息传递。然而,目前对汉字的拆解并未遵照现有汉字结构的习惯进行。为减少基本分解字元学者们硬行拆取部件付之以代码,用于形拼汉字。既使目前字元最少的张国防码《全国评测A类方案之一》(专利申请号87100844)也有五十字元之多。如著名的王永民码实际字元达227个。大量字元依靠26个字母键实现输入实际上给用户造成了沉重机械记忆的负担,对大面积推广应用代来一定的难度。其根本原因在于,学者们忽略了沿袭汉字结构中的习惯规律,放弃了原来汉字结构的基本部件中所内含的各种信息,这些习惯结构部件虽然数目也十分惊人,但由于汉字学习过程中的潜移默化作用反不须多加机械记忆负担。
本发明的目的是设计一种新的形音编码方案及其实用输入键盘,对汉字形体的拆解完全遵照几千年文字变化的基本规律,并补充适当的笔形与之结合的规律,配合读音声母代码形成一个完整的汉字信息传输处理系统。
本发明的基本构思是采用在汉字字典中常用的约190个偏旁和部首做为分解汉字形体的基本结构部件。虽然其基本部件数目繁多,但由于可以与字典对应,在从小学到中学的长期学习中已经习惯并熟悉了其主要部件的形体与名称,所以其真正需要机械记忆的量就很少。本发明利用其部件名称的声母做为部件代码实现形音码,如果部件没有独立名称,则采用其部件起笔笔形的名称声母做代码。基本笔形单元用来做辅助编码,共选用六个基本笔形单元横、竖、撇、点、捺、折,及三个辅助笔形单元,弯、拐、斜;均以其名称声母做代码(见图2)。按照以上的基本构形设计,加上一定的编码规则就可以实现常用汉字的编码方案;配合对应的实用键盘即组成一个完整的汉字信息传递处理系统。
下面将结合实例并附图表进一步说明本发明目的是如何实现的。
为实现本发明中汉字编码方案,将汉字的结构分为两大类,独体字与合体字,分别按各自的规则进行编码。独体字即笔形相连贯交叉;合体字即可按其结构分成不相连贯的几部分。在合体中按各部件的位置关系可分为十种结构,其中包括,上下、左右、上中下,左中右,上半包、侧半包,夹包围,下半包,全包围,品字形。(每种又分若干型式)。

图1即给出了按类型和结构分组的示意方法和具体汉字实例,其中方框字形中的数字表示习惯取码顺序,从而组成了一个在编码时可以做为参考的结构分解总表。在具体取码时首先按分解总表所示的方法将汉字拆解为2-3个基本单元,如果拆解的基本单元即为190个常用偏旁部首(即基本结构部件)则即可按偏旁部首名称的读音声母取出代码,如果基本单元为两个以上基本结构部件的组合,或者未按编码规定取足四码,则可继续拆解,其基本原则是拆上不拆下,拆右不拆左,拆大不拆小最终拆出取码的有效基本部件。如微彳
攵,其中
拆上不拆下(W)(左)(中)(右)实际拆取彳山攵WRVW(R)(V)(W)袱衤伏拆右(伏)不拆左(衤)取犬(F)(左)(右)实际取码衤伏犬FYFQ(Y)(F)(Q)谭讠覃早拆大不拆小TYTZ(T)(Y)(T)(Z)在以上基本规则下再遵循以下的编码具体规定即可实现对常用汉字的编码每个汉字均由本字读音声母,分解出的基本构件或基本笔形的名称读音声母做代码,双声母zh、ch、sh用I、U、V代替,无独立名称的基本部件用起部件起笔笔形的读音声母,一字四码,如不足四码的用“0”补齐。
具体编码时可分三种情形处理
1.独体字的编码取其本字读音的声母做为音码,用首、次、末笔笔形的读音声母做为二、三、四码,不足四码的以“0”补齐。例如首次末首次末首次末笔笔笔笔笔笔笔笔笔末 - -
末 - -
乙乙 0 0声横横捺声横横捺声拆母声声声母声声声母声母母母母母母母MHHNWHHNYIOO2.两部件的合体字一般情况下只取两部件的读音声母做二、三码,末部件补“0”。这种情况多用在正左右型,或正上下型结构。例如首次末首次末部部部部部部件件件件件件银金艮字宀子本字声声本部部声声声声母母母母母母编码YJGOZBZO3.三个以上(包括三个)部件的合体字,则分别拆解出首、次、末三部件,按三部件读音声母做二、三、四码,如部件名称不独立按其首笔形代码。
例如
附左右结构,右左右类型首次末附阝付寸声声声声母母母母FRFC犟上下结构上左右型首部件次部件末部件犟强虽牛声声声声母母母母编码JQSN癌左上包结构、内上下型首部件次部件末部件癌疒品山字病品山声声声声母母母母编码ABPV(sh)赢上中下结构下左中右型首部件次部件末部件赢讠口凡字声声声声母母母母编码YWKF根据以上提出的编码规则可以很方便的实现常用汉字一、二级字库的编码方案,极少有重码,因为各部件按汉语字典习惯拆取,使用起来也极易掌握。
为了进一步实现汉字的传输并与本编码方案对应配套设计了实用键盘布局。实用键盘的数字键与空格键仍与国际通用键盘相同,26个字母键的布局也遵守英文打字机键习惯分布格局以保证将来的实用键盘中西文兼容。在26个字母键帽的设置上体现出本发明的特点。图3即是该实用键盘的设计示意图。除去U、I、V三键分别用来代替ch、zh、sh三个双声母外,其余英文字母和汉语拼音字母均相对应设立,形义相关、并在每个键帽上设置了一个高频常用汉字和两个实现一字一码输入,尽可能选用高频常用汉字中的26个。在具体编码过程中可设计高频简码。为实现高速传输汉字信息,可将二级高频汉字417个以简码列出一字二码,由本字读音加首部件(或首笔形)读音组成。只要在计算机输入软件中设置相应的转换指令,可以方便地实现一字一键或二键的输入,(例如用空格符做结束符),从而大大地提高本系统的输入速度和实用价值。
为进一步提高本系统的实用速度,还可加入高频词库联想导引,在输入码的过程中引导高频词提示,显示在计算机显示屏的提示行上,以数字键实现高频词输送,这样将使本系统更加完善。
由于本发明所涉及到对汉字的拆解,完全按照汉字结构种类与型号特征分层次进行,其遵从的法则与汉文字典、传统语言文字习惯完全相同,没有施加任何创新与人为的定义,因而一讲即懂,一学即会,极有利于系统的推广与普及。经实际编码过程发现,重码率极低,操作简便。在高频简码,与联想词码的支持下可以实现高速度传输;在各类型电子计算机,中英文打字机、电传、汉字终端与智能系统上均可方便地加以实现和利用。
权利要求
1.一种借助汉字的结构与形声特点在电脑中实现汉字传输的信息处理系统,其特征在于该处理系统包括采用190个字典常用部首偏旁做汉字的基本结构部件、采用横、竖、撇、捺、点、折、弯、拐、斜做为汉字的基本笔形单元,并借助其基本结构部件和基本笔形单元习惯读音的声母代码实现基本汉字的编码方案,以及与该方案相对应的实用键盘。
2.根据权利要求1所说的信息处理系统,其特征在于汉字的编码方案遵守以下规则a.汉字结构分为独体与合体两大类,合体字又按可拆基本单元分为十种结构(上下、左右,上中下、左中右,上半包,侧半包,夹包围,下半包,全包围,品字形),每种结构,细分2-10种型式组成一个结构分解总表(图1),b.按十种结构分解出的基本单元为190个基本部件的组合时可继续拆取,原则为拆上不拆下,拆左不拆右,拆大不拆小,从而决定取码有效基本部件,c.取码的方法是按本字,基本部件或基本笔形单元(图2)的名称读音声母做为代码(zh、ch、sh用I、u、v代),无独立名称的基本部件,用其起笔笔形的代码,一字四码,d.独体字编码,采用本字读音声母为首码,首、次、未笔形代码为二、三、四码,不足四码补“0”,e.合体字编码,采用本字读音声母为首码,按结构分解中类型的顺序依次取首、次、末基本单元的部件名称读音声母为二、三、四码,不足四码或基本单元为复合部件时可继续分解,无法形成四码以“0”补齐。
3.根据权利要求1所说的信息处理系统,其特征在于与本汉字编码方案相对应的实用键盘采用标准英文打字机键分布格局,除分别用U、I、V,代替汉语拼音双声母ch、zh、sh外,其余英文字母和汉语拼音字母形义对应,并在每个键帽上设有以该字母为代码的常用字一个和常用基本结构部件两个(见图3)。
4.根据权利要求1或3所说的信息处理系统,其特征在于在汉字编码方案中可以设置高频字简码,一级高频字26个一字一码,直接由26个键上实现一键一字输入,二级高频字417个每字二码,由本字读音声母加首部件(或首笔形)代码组成在键盘上实现二键一字输入,输入码可以由空格键做结束符。
5.根据权利要求1所说的信息处理系统,其特征在于汉字编码方案中可以设置高频词码,并在未出现结束符输入时联想提示,依赖实用键盘上的数字键实现选择输入。
全文摘要
本发明所公开的汉字编码方案与实用键盘,是一种易于普及推广的中文信息电脑处理技术。它建立在汉字形音码的基础上,所具有新颖性与创造性的关键在于本方案对汉字的拆解完全遵循汉字造字的规律与习惯字典用法;注重形义结合,随其自然。基本参照字典常用190个常用偏旁部首与六种基本笔形结合而构成完整的编码方案。从而使任何使用者免去记忆之苦并易于达到熟练的程度,是一种极有推广价值的信息处理技术。
文档编号G06F3/023GK1035729SQ8810128
公开日1989年9月20日 申请日期1988年3月10日 优先权日1988年3月10日
发明者蔡来仪 申请人:蔡来仪
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1