利用规范部件码作补码的拼音输入法的制作方法

文档序号:6656207阅读:251来源:国知局
专利名称:利用规范部件码作补码的拼音输入法的制作方法
技术领域
本发明涉及ー种利用规范部件码作为补码的拼音输入汉字的方法。
背景技术
现行拼音输入法最大的不足之处就是字词输入时重码大多,特别是在常需要输入人名、地址的办事窗ロ等工作场合应用时尤其突出,影响了工作效率。因此ー些拼音输入法利汉字字形提取编码作为补码分离重码,但其提取字形补码的部件(或字根)大多欠缺科学和规范性。有的以部首来取补码,但很多字的部首不容易判断,影响输入效率。许多拼音补码技术只提供单层补码,许多字输入ー个补码时还有不少重码。应该具有多层补码,可以深度分离重码,即使应用于大字集字库时也能高效分离重码。最好该形码本身就是ー款科学高效、易学好用的成熟字形输入法,使用户学会该拼音的补码技术的同时等于学会了一款科学高效成熟的形码输入技术,一举两得,降低了学习成本。或者使用该形码的用户需要用拼音输入法输入汉字吋,也可以用该形码来分离拼音重码。 汉字输入作为ー项基本技能,无论是会读不会写的字,还是会写不会读的字都应该能够顺畅快速地输入。就这点而言,単一的拼音输入法或拼形输入法都是不能胜任的。拼音和拼形就像人的两条腿,互相支持,缺ー不可。所以学生应该掌握拼音输入法的同时,还应掌握ー门科学规范、易学好用的形码输入法。可以根据自身特点或场合需要选择使用拼音还是字形。当使用拼音输入汉字时,还也可以用该形码来分离拼音重码,补拼音之不足。该可做拼音补码的字形输入法应该具有如下特征I、以《现代常用字部件表》的基础部件作为其编码的部件基础。为了处理非常用字,可以在《信息规范》选取适当基础部件做为补充,还可适当补充ー些规范的合成部件。其补充的部件可以因所应用的字集范围大小而不同,但字集范围所对应的基础部件不能随意删减,不规范的“部件”也不能任意添加,不应该自主创造ー些不规范“字根”作为部件。2、采用笔画、笔形、笔顺、汉字书写规范、汉字结构、独体字规范等汉字基础教学中最基本的字形知识作为其编码的知识基础。这一点有重大的意义,它使汉字的编码方案不仅仅是为了满足信息处理应用的需要,也能反辅汉字教学,帮助掌握和普及科学的汉字知识,帮助识字记字、減少别字错字,帮助掌握正确的汉字书写方法,增强全社会的语言文字应用的规范意识。还能帮助汉字教育手段的更新和科学化、利用信息技术促进语文教学、提高教学效率,使中小学信息教育与汉语汉字教学保持一致,使悠久灿烂的汉字文化在信息时代能够健康地传承。3、易学性。不需要背繁杂的字根表,记忆负担小。可以短时间内学会基本的规则、并顺利地进入到打字练习的状态。从入门到精通没有明显的门槛,可以循序渐进地学习提闻。4、好用,打字轻松、快速而高效。拆字容易、取码自然直观、思维负担小。重码率低,特别是常用的字词重码要少,打字精确快速,很少需要用数字键选。编码容量大,可以方便地输入较大容量的常用词组。
5、建立汉语字形的键盘符号系统。英语是由26个拉丁字母构成的,这26个字母就是英语的键盘符号系统。科学的字形输入法也应当有反应汉字字形规律的键盘符号系统,该键盘符号必须能够编码表达所有的规范部件,并且该键盘符号在键盘上以双手运行键盘指法的舒适击键范围内有规律地排布。其只与汉字自身的规律相关,不以英文字母为參考背景,与英文字母在键盘上哪个位置没有任何关系。从实用性的要求出发,该键盘符号系统必须能够在计算机标准键盘的键帽上清晰地刻印容纳得下,便于学习者查看,方便教学和打字操作。所以每个键上的中文符号数量不能太多,不能刻印得密密麻麻的。6、计算机键盘各键位的负荷分配科学合理。必须根据各手指灵活性、耐疲劳性来分配各键击键负荷,使手感舒适协调、耐疲劳。7、键盘输入普适性。容易实现数字化编码,既能在标准计算机键盘上使用,也能在数字键盘上直接用数字高效地输入。我们已经或即将面临的是ー个通信设备、家电设备、生产设备等智能化的时代,它们都面临着汉字输入的问题,且基本上只能通过键数较少的数字键盘输入。如果ー款输入法不能数字化编码如何能适应这样的趋势?
8、社会普适性。通用于全社会,从初学识字起,到走出校门进入各行各业(无论从事何种职业),ー辈子都适用。适用于各种场合、各种方言地域。能满足职业录入员高速盲打的要求,应用于大字库时还能满足古籍研究人员输入古字的需要。9、与拼音编码具有较好的相容性。与拼音混合编码时,音形编码相互干扰较少,想打拼音就打拼音,想打字形就打字形,无需转换键。10、可应用于汉字排序检索,如字典查字。显然以具有如上10点特征的科学规范、易学好用的形码作为补码的拼音输入法也是现今社会的需要。

发明内容
本发明的目的是提供一种以规范部件码为补码的拼音输入法,该方法采用ー种称为规范部件码的编码作为拼音输入的补码,而实现汉字无重码或几乎无重码的输入,其可应用于计算机、通信设备、数码学习机、电子词典、PDA等掌上电子产品以及ー些高级机电设备上的汉字输入。为实现上述的发明目的,本发明提供了一种以规范部件码的编码作为拼音输入法补码的汉字输入法,该方法包括如下步骤(I)输入汉字的拼音编码;拼音编码为双拼或全拼;(2)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为參照,把该字划分成至少2个取码区,每个取码区提取I个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;(3)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入至少I个选定的部件码;采用上述方法输入汉字时,屏幕上最終所显示的所需输入的汉字可以迅速被锁定,实现无重码或几乎无重码的输入。其中所述的拼音编码可以是现在最常用的全拼编码,也可以是击键数更少的双拼编码。其中字形部分编码方案是发明人深入研究国家颁布的适用于中小学语文教学、民族地区汉语教学及对外汉语教学的《现代常用字部件表》(简称《部件表》),对其进行了大量的、深入的、细致的基础性统计研究,并全面深入地掌握其中的规律而得出的。它是科学、规范,易学好用的形码方案,能有效地分离拼音重码。采用上述方法输入汉字时,屏幕上最終所显示的所需输入的汉字可以自动地被加入到相应文件的相应之处,也可以通过确认键或数字选择键而加入到相应文件的相应之处。上述的拼音编码是指常见的全拼编码或双拼编码,双拼编码可以是自然码双拼、 微软双拼、拼音加加双拼、搜狗双拼……等等。拼音部分非常简单,是大众熟知的技木,下面详细阐述其字形部分的编码方案。其字形部分编码方案部分执行了国家颁布的笔画、笔顺规范、独体字规范、书写规范等,特别是执行了《部件表》的规范性要求,以其所颁布的514个基础部件为部件基础进行编码。由于《部件表》只是对3500个现代常用汉字进行部件拆分而得出的部件体系,且其中一些因书写部位不同笔形发生变异的部件没有设立(例如“尹”归入“手”而未在该部件体系中设立,同样还有“芦?……”等),所以该部件体系应用于信息处理时,需要补回“^”等因书写部位不同笔形发生变异的未设立的部件,同时针对非常用字编码的需要在《信息规范》中选取适当部件进行补充。另外,为了进一步提高相关字词的输入效率,简化拆字,降低编码的信息损耗率,更好体现汉字的字理结构,本方案部件体系在《部件表》514个基础部件的基础上作了如下几点不违反规范性的有益的补充I、因笔形变异而未在《部件表》中设立的15个部件从《信息规范》或《基础教学用现代汉语常用字部件》中选录补回尹七孑·1 ホ夺亦笋疋毋。2、因处理3500常用字之外的非常用字需要从《信息规范》中选录补充13个部件氺—尔电採夹肀屮くく乜卄。3、部件字的分区取码时分区的字形參照需要而从《信息规范》中选录补充的31个部件且も市苴TTtfn囬画垔由外クタ产户コ弔F肀兼粛W尹乃グ八又队幺。这些部件虽不直接在字拆成部件的过程中拆出,但在复码部件的分区取码时可作为分区的參考依据。4、从《基础教学用现代汉语常用字部件》中再引入32个部件尔共囊行北鼻比兵齿典阜骨鼓麻麦黾齐青黍香兴疋 邑音舆羽支周走足S。这其中有许多是《新华字典》的部首,其作为编码部件更能体现汉字的字理结构。这样补充后《新华字典》中所有部首都已收入作为部件使用。5、为了提高部分字的编码效果增加了“冏吉刃、余章祭关并並早令” 13个成字的规范部件。上述“囬吉刃、同# I”在计算机中的区位码分别是56EC、5402、5205、518F、Ε832、Ε83Β。6、当处理繁体字时,从《信息规范》选录补充的43个繁体部件“車爾鏖管華門鬥貝金TU■ 芎芎黽馬幾f *竿見! !亞EC東届爲畢薰醫飛龜卯羞產吝戶&昜長齊然”。补充了如上147个部件后,其部件总数为514+147 = 661个。这些部件分成两大类单笔部件和复笔部件。单笔部件是只有一个笔画构成的部件,即是ー(横)、丨(竖)、i (撇)、、(点)、こIマしL I 5组10个部件;其余部件至少有两个笔画构成,称为复笔部件。上述的部件码是指25个双笔画“一一、一 [、一 J、一、、一こ、丨ー、丨丨、丨J、I、、I こ、J 一、j I > j j > j、、j こ、、一、、丨、、j、、、、、こ、こ一、こ丨、Zj、こ
、或ここ”和5个单笔画“0、CD、の、Θ或 ”。它是印在键盘上的编码符号,用于部件的编码表达和键盘输入。相关的笔画分类按国家规定,即提归横类,捺归点类,竖钩归竖类,除竖钩外的其它弯曲或带钩的笔画都为折类。将这30个部件码印在计算机键盘上,可以得到如图I所示的中文键盘。这是本方案的原始键盘排布方案,该键盘分横、竖、撇、点、折5个区,其中GFDSA为横区、HJKLM为竖区、TREffQ为撇区、YUIOP为点区、NBVCX为折区;5组双笔画的分布规律都是从键盘中间向两边散开。在数字键盘上分別用1、2、3、4、5代表五个笔画一丨j、こ进行输入,例如部件码“j 一”用31输人。而单笔画部件码0Ο)(Ι)Θ 分别用61、62、63、64、65输入。部件和部件码的对应关系、部件的编码表达和键盘输入一、有的部件只对应ー个部件码,即由一个部件码进行编码表达和输入的部件称为单码部件。单码部件分两类,一类是单笔部件“一” “丨” “ j ” “、” “こ,マししつ”,其部件码分别是θ、①、の、Θ、 ,分别由G、J、T、U、N输入。另ー类是复笔部件,其部件码是部件的前两笔画的组合。例如“土士夫#才エホ廿世束更臣柬两南雨丐县市……”等单码部件的部件码就是部件的前两笔画组合“一 I ”,在中文键盘中用F输人,数字键盘上用12输入;其它单码部件的部件码也都是其前两笔画,如“禾”的部件码为“j 一”,“イ”的
部件码为“ J I ”,“ネ”的部件码为“ J i ”,“八”的部件码为“ J、”......以此类推。见
如下表表(I)单码部件表
权利要求
1.一种以规范部件码的编码作为拼音输入法补码的汉字输入法,其包括如下步骤 (1)输入汉字的拼音编码;所述的拼音编码为双拼编码或全拼编码; (2)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取I个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画; (3)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入至少I个选定部件码。
2.如权利要求I所述的方法,其中普通字的输入方法中,当拆分出的部件转化为部件码后,部件码的个数正好为4个时,选定该4个部件码作为选定部件码;而当部件码的个数超过4个时,则选定第一部件码、第二部件码、第三部件码和最末部件码作为选定部件码;当部件码的个数少于4个时,则选定所有部件码作为选定部件码,输入所有部件码之后加上一个增补部件码;所述的增补部件码是由所需输入汉字的末笔画和结构笔画组成;其中,末笔画是指所需输入汉字的末部件的末笔画,结构笔画是指反映所需输入汉字之结构的笔画。
3.如权利要求I所述的方法,其中部件字的输入方法中,当该字划分成的取码区数为4个,依次在这4个取码区提取部件码作为选定部件码;当该字划分成的取码区数超过4个,则在前三个和最后一个取码区提取部件码作为选定部件码;当该字划分成的取码区数为2个或3个,则所有取码区提取的部件码都为选定部件码,如果该字为单码部件字,输入每个选定部件码后未区部件码重复输入直到满4码止,如果该部件字为复码部件字,输入每个选定部件码后再加上一个增补部件码;所述的增补部件码是由所需输入部件字的末笔画和结构笔画组成;其中,末笔画是指所需输入部件字的末取码区的末笔画,结构笔画是指反映所需输入部件字之结构的笔画。
4.如权利要求I所述方法,其中非成字部件的输入方法中,当该字划分成的取码区数为3个或3个以上,则在前三个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,直接追加输入一个部件码“乙乙”;当该字划分成的取码区数只有2个,则在这2个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,末区的部件码重复输入一次,再追加输入一个部件码“乙乙”。
5.如权利要求3所述的方法,其中,“大人之二儿子文气又力一日乃七八九丁几土山” 20个部件字的输入方法为其所在键连敲四次。
6.如权利要求1、3、4、5之一所述的方法,其中,在步骤(2)中,按照下述的分区原则,划分所需输入的汉字的取码区 (A)要符合国家笔画、笔顺规范; (B)划分成的取码区总数尽可能少; (C)能离不连,能连不交; (D)前面的取码区尽可能取大; (E)“I”下的“ 口”及下的“一”跳过不参与分区取码。
7.如权利要求1-5之一所述的方法,其中,在12部件组部件“土*木#十”中选出至少包括“木土”之中三个部件的共三至五个部件,在44部件组中选出“? ”或“个 ”,在31部件组中选出“韦”,在55部件组中选出“乡”或“马”;把选出的部件调到相容性好的部件组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性规定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键; 所述的“调到相容性好的部件组所在的键”是指(一)“口木土?个 日虫*韦十目孑车马乡”十六个高重码部件之一可以调到14、21、22、23、24、33、42七个部件组之一,其中如果调到14部件组时,“帝”必须调离14部件组;(二)一些高重码部件可以调到“一级接收组”之外的个别部件组中与这些部件组的部件同键输入其中“? ”可以调到34、51或54部件组,“个a”可以调到51或54部件组,“日”可以调到52部件组,“虫”可以调到34部件组、“月”调走后的35部件组或54部件组,可以调到“人”调走后的34部件组,“韦”可以调到51或54部件组,“十”可以调到15、31、32、43、45、51或55部件组,“目”可以调到15、34、41、51或52部件组,“马”可以调到34、51、54、“月”调走后的35部件组或“i ”调走后的45部件组,“# ”可以调到34、51、54部件组、“月”调走后的35部件组或“石”调走后的13部件组,“车”可以调到34、51、52、54部件组、“月”调走后的35部件组、“石”调走后的13部件组或“韦”调走后的31部件组;其中的“调走”是指“月”可以调走到24、33、34、51或54部件组,“人”可以调走到24、32、33、52或55部件组,“串”可以调走到除了 12、25、`31,41四个部件组以外的部件组,“石”可以调走到33、34、51、53、54或“月”调走的35部件组,n ”可以调走到34、51或54部件组; 所述的八点相容性规定是指(一)高重码部件“口木土?个 日虫*韦十目子车马乡”以及有关部件“月人&石”共20个部件的键位相容性规定;(I) “十”不能与“口、土”同键,可以与其它18个部件之一同键输入;(2) “a”不能与“*、木、口、日或? ”同键,可以与其它部件之一同键;⑶“车”不能与“石、木、土、子、虫、口、韦、月、?或乡”同键,可以与其它部件之一同键;(4) “石”不能与“车、木、土、子、*、虫、口、目、韦、月、?、个、马或乡”同键,可以与其它部件之一同键;(5) “人”不能与“'木、口或日”同键,可以与其它部件之一同键;(6) “串”不能与同键,可以与其它部件之一同键;(7) “口木土?个日虫*韦財马乡月”这14个部件之间,除了“马*”、“廿目”、“日目”、“马日”、“马月”、“马个”、“马目”、“虫日”这8对部件可以安排到同一键外,其它任两个部件都不可以安排到同一键输入;(二)上述20个部件与0 CD O 之间的键位相容性规定上述20个部件中,除了“a木人十日土口”,另外的13个部件可以和一同键;除了“人”,其它部件可以和 同键,除了“十日土”,另外的部件可以和 同键;除了“土人口”,另外的部件可以和Q同键;除了“土日人口”,另外的部件可以和 同键。
8.如权利要求1-5之一所述的方法,其中,所述的单码部件及其相应的部件码和键盘输入方法如下
9.如权利要求8所述的方法,其中,把五甘、帝夫子古、*勹耳、十日、口本、二寸口、月用目、丁I、夕匕儿、人田、石、虫、目、?夂夂、广几、1_、马、i言、西面、韦金、子孑了等分别调到组代号为 11、12、13、14、21、22、23、24、31、32、33、34、35、41、42、43、44、45、51、53、54、55的部件组中同键输入,并增设为部件码,它们在计算机大键盘中的位置关系及数字键盘输入方法为
10.如权利要求1-5所述的方法,其中,所述的部件是下列的部件,部件分区采用优化分区方式,各部件相应的部件码和键盘输入方法如下
全文摘要
本发明公开了一种以规范部件码的编码作为补码的拼音输入法,该方法包括如下的步骤(1)输入汉字的拼音编码;拼音编码为双拼或全拼;(2)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;(3)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入至少1个选定部件码。采用上述方法输入汉字时,屏幕上最终所显示的所需输入的汉字可以迅速被锁定,实现无重码或几乎无重码的输入。本输入法的字形补码部分的编码本身是一款易学好用的字形输入法,它以国家制定的《现代常用字部件表》的基础部件为部件基础,以汉字教学的汉字基础知识为知识基础,具有高度的科学性和规范性,是“规范性”、“易学性”、“高效性”、“舒适性”的完美统一。
文档编号G06F3/023GK102830808SQ20111009105
公开日2012年12月19日 申请日期2011年4月2日 优先权日2010年7月1日
发明者杨春华 申请人:杨春华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1