汉字阴阳双极声韵形码输入系统的制作方法

文档序号:6410160阅读:176来源:国知局
专利名称:汉字阴阳双极声韵形码输入系统的制作方法
技术领域
本发明为专利申请92111818.x的同类分案申请,同属于计算机汉字编码输入系统。
本发明涉及计算机汉字编码输入系统。
衡量汉字编码的两个重要标准是输入速度和编码规则,这是两个相互制约的参数。编码码长和重码率从一定程度上可以反映编码的输入速度,最初的汉字编码,以提高输入速度为主,如仓颉码,五笔字型等,它们为编码码长,减少重码率和合理安排键击频率,人为地编造了一大套规则,而且为了进一步减少重码,还有许多字无任何规则地硬性规定其一个特定输入码。这些都大大影响了编码的易学性,随着简码和词汇码的出现,一些原先编码码长较长和重码率较高的编码都可以快速输入汉字。
简码可以使凡是利用标准英文键盘输入的编码,都能用三键(包括断码键)输入占总字频近80%的500多个高频字。词汇码能使词汇的输入达到2键/字以下。五笔字型的单字输入速度为3.89键/字,若采用了一、二、三简码和词汇码后,其流动文本的平均键入速度达2.9键/字。拼音被公认为重码率太高,输入太慢,然而目前出现一些编码,如声数码、自然码等都是以拼音码为主体的,但其输入速度却有超过五笔字型的趋势。近几年更有句输入、智能输入等手段,使得能够直接用拼音无重码地快速输入。由此可见,目前编码研究的重点,应是编码规则简单化。
何种编码才算作简单?为了使得拆解编码不过份集中在汉字的某个部位,通常都要将汉字拆分成几个形体单元进行编码,这些单元被称作部首、字元、字根等等,为了叙述方便,下文将这些通称为部件。目前出现的大量所谓简单编码,都是以部件来划分的,或取其形,或取其音,说是不需要记忆任何口诀,只要按部件取音,取笔画即可。然而,作为部件,却是一个完完全全的不确定概念首先从形体上,许多部件与其它部件的分界线并不明显,既可以看为是一个单独部件,也可以看成是其它部件的一部分;其次从部件名称上,除了一些常用部首有习惯称呼外,并无一统一的名称。也就是说,无论以部件是来取音还是取形,都是不确定的。为了提高输入速度,编码发明者们便选一些可以减少编码码长和重码率的部件作为其编码单元,并对用户声称无需记忆任何口诀,只需取部件的笔画或其名称即可。其实用户必需对这些部件的形状、名称都相当熟悉方可正常输入。汉字的组字部件至少达400个以上,用作编码的部件少则100以上,多则500-600。即使编码的部件是参照某某文件或某某字典而来,但绝大部分的人,是不会对某一文件或字典上的部件种类、名称了如指掌的。
可见,部件分解编码法不能算是一种很简单的编码法。
目前,最简单的编码音码为拼音码,形码为笔画码。但拼音码输入者必须熟悉英文打字。目前笔画码的一种为鸿钟码,但该码将基本笔画细分为37种,分在12个按键上,并且没有易记的键-笔画对应规则。每个字需按顺序依次每键一笔画地输入所有笔画,极不实用。使其达到实用的速度的手段是组合笔画,该码安排了88个组合笔画,用户要记住方可,且组合笔画的存在有对并不直观。
可见当前还缺少一种极简单的实用编码方法。
本发明的目的在于设计一种极其简单的编码方法,使其码长和重码率不致过高,并且能够兼顾专业输入,能够充分发挥现有的各种编码快速输入手段。
本发明的核心在于,利用汉字公认的明确信息作为编码基础,共有三个拼音、笔画、分部。小学二年级以上的入都会拼音,汉语拼音方案于58年即已标准化,因此,拼音是明确化的信息。本发明采用的笔画类型为明确化,采用目前公认的简易分法横、竖、撇、捺、折。
分部的含义为,除结构相当紧密的独体字外,其它所有字均分为阴部和阳部两大部分。上下,左右、里外、上中下和左中右结构,都将其上、左、里作为一个整体,而将剩下部分作为另一整体(中下和中右作为一个整体)。其中以首笔笔画写到的那一个整体称为阴部,另一个整体称为阳部。阴部和阳部是按字形界限划分的,对于界线不明显的,一律作为独体字处理。对于一些难以分辨的,可按个人习惯当作独体字或阴阳部进行编码都可以,即允许一字多码。
因为本发明采用的都是相当明确的编码信息,非黑则白,因此称本发明为阴阳双极编码或太极编码。
以下为本发明结合分部、笔画、拼音三大信息的编码实施方案。
一、阴阳形码将25个双笔画组合和5个单笔画结合键位座标安排到最靠近手指的30个按键中,见图1。
独体字编码取头5笔笔画。头2笔笔画按双笔画组合对应按键,其后3笔笔画均按单笔画对应按键。如“王”字,拆成11,2,1,其3键。
合体字,拆成阴部和阳部进行编码各部取头4笔笔画。取是4笔笔画的,按2个双笔画组合对应按键。只取足3笔,按“单笔画+双笔画”对应接键,只取足2笔的,接2个单笔画,对应接键。如“对”字,拆成5,4,1,24,共4键;“辨”字,拆成41、43、43、41,共4键。
对于不易分清是独体字还是合体字的,可按个人习惯,按独体字或合体字输入,系统中允许一字多码。
对独体字、阴部和阳部的取笔画,也可以不按顺序,而按首尾取笔画。如独体字取“头三画笔画+末二画笔画”,阴部和阳部取“头二画笔画+末二画笔画”。
为了进一步减少重码率,特设“日、月、人(亻)、口、扌(手),钅(金)、木、氵(灬)、土、艹(辶)”10个部件安排到键盘上,当拆分笔画时遇到这些部件,优先按其对应键,然后接着该部件之后继续拆分笔画。若阴部中只包含一个特设部件,没有其它笔画,则阴部此时应取足6画。如“铿”字,应拆成钅,22,54,12,共4键。
二、阴阳声形码首码为汉字的声母,次码、三码、末码为形码,取码规则同上,独体字取四笔画,合体字取六笔画,其中阴部二笔画,阳部四笔画。
三、阴阳声韵形码首码为汉字的声母,次码为韵母,三码、末码为形码。其中独体字取二笔画,合体字取四笔画,其中阴部和阳部都各二笔画。
该方法的声母和韵母键盘见图2、图3。本发明根据尽量减少拼音组合数的原则,将汉语的声母、韵母减少到23个,定义到键盘上,以留出一些键来做一些特殊用途。当遇到“无声母”拼音时,先按韵母盘输入韵母,再敲入韵母盘上的“无声母拼音输入键”。
当以上三种编码出现重码时,可用数字键进行选择。其中1、2、3、4、5、6分别代表横、竖、撇、捺、折、零画,当出现重码时,可按重码的最后一笔笔画或形码中未采用的一笔笔画进行选择,如有与1、2、3、4、5、6相重的重码字,则按其使用频序高低排在7、8、9、0数字键上。
本发明还设计了在101键盘单手数字键键盘(简称单手键盘)上使用的笔画盘,声母盘、韵母盘,如图4、图5、图6,使得本发明可以在仅有17键的单手键盘上输入。
本发明的优点是阴阳双极形码是一种比目前任何编码都更简单、更易学习的一种编码,它以汉字公认的、最明确、最简单的信息拆解编码,并且其输入按键直接与座标位置对应,不用熟悉英文键盘,即可快速输入汉字,且该编码重码率也远低于拼音码、笔画码等其它各类简易码。未接触计算机者,学习编码10分钟,即可不用手册,快速输入任意汉字。阴阳双极声形码适于熟悉英文键盘的操作员进行汉字输入。它的重码率比形码低,学习难度与形码一样,一点即会。阴阳双极声韵形码重码率极低,只需记住韵母与键盘的对应关系即可输入,它适于听打和看打。
本发明的单手键输入的笔画键盘,声母键盘,韵母键盘经过精心设计,使得能用单手高速输入汉字,编码码长为4键。
本发明将汉字字形分为独体字和合体字,将合体字分为阴部和阳部两大部分,能够快速、明确地分解汉字,恰当地分配取码密度。而且这样的取码方法,能够使绝大多数的部件在字形中的取码相同,使用较长一段对间后,输入者的识码接键过程由“整字——分解成独体字或阴部和阳部——分解出笔画——转换成座标——按键”逐渐过渡成“整字——部件——接键”,达到与字根编码同样快的见字按键反应速度。或者从另一个角度上说,本编码是将汉字的部件按其笔画归纳到相应的键位上。总之,采用阴、阳两大部的分法,使得笔画编码法也能达到与字根编码法一样快的输入速度。
实施实例编码表(其中12345分别表示横竖撇捺折)例编码分解 形码声形码 声韵形码字汉 441 54 H AN .Y/.H./. HS./字 445 51 Z I.P/NZ./N ZI./编 551 4513 B IAN /HPEB/PE BT/P码 1325 551 M AEG/HME/H MWE/输 1512 3412 SH UTWVWTVW VUTV入 3 4 R U,. R,. RU,.速 1251 454 SH UWH.LVW.L VUW.度 413 1221 D U.EWAD.WA DU.W


(图中12345分别表示横竖撇捺折)图125个双笔画组合和5个单笔画以及10个常用部首与英文键盘对应图。
图2声母与英文键盘对应图。
图3韵母与英文键盘对应图,其中代号Φ为无声母拼音输入键。
图4笔画组合与单手键盘对应图。
图5声母与单手键盘对应图。
图6韵母与单手键盘对应图。
权利要求
一种汉字声韵形码输入系统,利用经过重新定义的英文标准键盘进行汉字计算机输入,其特征包括(1)将合体字按其字形结构一次性分成阴、阳两部分,且只分一次;先写到的那一部分为阴部;
(2)将独体字、准独体字作为一个整体,不拆分;
(3)取汉字笔画的传统分法将汉字笔画分成横、竖、撇、捺、折5大类,这5种单笔画再两两组合成25种双笔画;
(4)将单笔画与双笔画分开定义在英文标准键盘上,并一一对应在英文标准键盘中离母键位置最近的30个按键上;
(5)25种双笔画接起笔笔画分成5个双笔画区,5种单笔画组成1个单笔画区;区中的次笔画依横、竖、撇、捺、折的自然顺序按几何坐标位置在键盘中自左向右排列;6个区的排列也依横、竖、撇、捺、折、单笔画的顺序与键盘按键的几何坐标位置相关;
(6)各笔画在键盘上的定义如下横区Q-一一 W-一丨E-一丿 R-一丶 T-一乙竖区A-丨一 S-丨丨D-丨丿 F-丨丶 G-丨乙撇区Z-丿一 X-丿丨C-丿丿 V-丿丶 B-丿乙捺区Y-丶一 U-丶丨I-丶丿 O-丶丶 P-丶乙折区H-乙一 J-乙丨K-乙丿 L-乙丶 ;-乙乙单笔画区N-一 M-丨 ,-丿 .-丶/-乙
(7)另定义“钅、木、氵、土、艹、日、月、人(亻)、口、扌”10个常用偏旁部首,作为比笔画优先的编码元素;
(8)“钅、木、氵、土、艹、日、月、人(亻)、口、扌”10个常用偏旁部首定义到“横、竖、撇、捺、折、竖竖、竖撇、竖点、横点、点竖”10个笔画元素对应的键位中;
(9)对于输入过程中所用的声母、韵母在英文键盘中的定义如下a、声母键盘Q-Q W-W R-R T-T Y-Y U-CH I-7H P-PS-S D-D F-F G-G H-H J-J K-K L-LZ-Z X-X C-C V-SH B-B N-N M-Mb、韵母键盘Q-ieW-ao E-e R-ai T-uai ianU-uü I-i O-er ongA-a ia S-anün D-in uang F-en iang G-ou iongH-ua iaoJ-uo K-unL-ui iuZ-ang X-ingC-eng üe V-ei B-ΦM-uan üan
(10)输入方法对于合体字取汉字声母1键、韵母1键、阴部一二笔画1键、阳部一二笔画1键利用键盘相应键位输入一个汉字;对于独体字取汉字声母1键、韵母1键、前2-4笔画(一二笔画1键、三四笔画1键)利用键盘相应键位输入一个汉字;
(11)在输入过程中,如取不足规则中所要求的笔画数,直接断码,末尾不加识别码。
全文摘要
本发明采用汉字最明确的分部、笔画、拼音三大信息进行编码,使得本发明编码的易学性远远超过现有任何拼音、笔画之类的简易码,并且输入速度不低于字根编码。熟悉双拼输入者学10分钟即可较快地输入任意汉字。
文档编号G06F3/023GK1217496SQ9610309
公开日1999年5月26日 申请日期1996年3月24日 优先权日1996年3月24日
发明者陈劲松 申请人:陈劲松
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1