六字元结构字根无重码输入系统的制作方法

文档序号:6569424阅读:312来源:国知局
专利名称:六字元结构字根无重码输入系统的制作方法
技术领域
本发明涉及计算机的汉字输入,它利用重新定义的计算机标准键盘来完成计算机的汉字输入。
本人专业从事计算机的汉字输入系统研究多年,已有多项成果、专利及专利申请。本发明主要解决汉字编码输入“易学”与“快速”的矛盾,要达到使用极少的字根实现汉字无重码输入的目的。
虽然计算机已由多媒体时代发展至网络时代,但由于人工智能水平所限,语音输入的精确方便性要完全取代键盘输入尚需时日。
随着计算机的使用越来越普及、大众化,庞大的非专业电脑使用者迫切需要一种方便、快捷的键盘输入方法。而就目前的研究成果和市场上的产品来看,大多数输入法都无法完美地解决“易学”与“快速”的矛盾。为了应付日益庞大的非专业用户的需求,绝大多数的输入法都是牺牲“速度”来换取易学性的。
那么,要发明什么样的编码才能既易学又快速呢?人人都知道字根编码打得快,可是人人都头痛背字根。其实,字根编码的难学还远远不止于背字根。
几十年的实践证明,对于笔画、笔形、字根(部件)、表形、拼音、表意、二维、数码、翻译等等各种汉字编码输入方式,要学习者达到60-100字/分钟的专业速度,“字根”编码方式是所有编码方式中达到时间最短的一种。这是由于“字根”是一个比较直观、固定的字形组合,它与键盘按键容易形成固定对应,如“钅”对应“A”、“木”对应“B”、“火”对应“C”键等,操作者练习一段时间容易形成条件反射。
这也就是为什么90%的快速编码都采用字根方案,光申请专利的字根方案大概就有二、三百种。
但是从传统的字根理论上讲,字根必须达到一定的数量,才能有效地离散编码,降低重码率。这就造成了字根编码的字根多、记忆量大,给非专业用户的学习和普及带来了很大难度。
字根编码的难学,不仅仅是因为它数量多,还在于字根的定义、界线难以确定和划分。
如“固”字,是拆成“囗十口”还是拆成“囗古”还是“口十口”?“完”是拆成“宀元”还是“宀二儿”?“田”是拆成“口十”还是“日丨”?“天”是拆成“二人”还是“一大”还是不拆?要想正确的拆分以上汉字,就必须要对系统定义的字根一个不丢地记熟,比如“古是不是字根?”“元是不是字根”“二是不是字根”“儿是不是字根”等等,不是字根的要拆成字根,是字根的不能拆。
而且必须要对字根的规则了如指掌。如光一个“田”字,就有至少四种不同的字根拆分法1、“日丨”(取大优先)2、“囗十”3、“口十”(囗与口等同一个字根)4、不拆成其它字根,按笔画输入或另定其它规则。
有时候发明人自己都不知道应该怎么拆,这是时候往往发明人是从降低重码率的角度出发选一种方案,而不从规则的角度出发,造成了输入者在学习这个字的拆分时感到莫名其妙。象五笔字型就是一个例子,许多字的拆分并不符合它自己的规则,因而遭致了很多专家的批评。
要知道对于学习者,一个特例就相当于增加了一条规则。
前一段时间涌现较多的取字根音首输入的方案和取字根首笔画对输入的方案,看似简单,不用逐个记忆每个字根的键位了,但是它们还是解决不了字根的划分与拆分问题,最终还是简单不了。你想一想,连权威辞典《辞海》、《新华字典》、《康熙字典》、国标字集对部首的划分与分类都不同,何况普通作者对部件、字根的划分呢?也正因为这个原因,本人十年前研究发明编码时,才忍痛舍弃了对字根编码法的研究,最后才发明了真正简单易学的汉字编码,并拿到了国家专利ZL92111818.X。
字根编码法自提出几十年来,经过几代专家的努力,“字根的难划分与难拆分”这一问题一直无法得到解决,它严重制约了字根输入法的应用与普及,使得字根输入法一直无法占据大众市场。
出于对字根的偏爱,本人一直未舍弃对字根编码的研究,又经过近十年的研究和努力,本人终于找到了解决这一问题的方法,本发明陈述的就是这一方案。
“人人都知字根好,可是字根太多了”。五笔字型130多,四笔声形300多,戴码六笔声形5、6百,最少的五十字元码,50个字根,实际上远不止50个。
能不能再少?哪一个发明人不想自己的字根数量尽量的少?可是字根少了重码怎么解决?通过使用计算机作为辅助工具,经过上千个方案的反复计算和筛选,本人终于将字根的数量最终缩小至6个。6个?不产生重码吗?汉字真的可以用这6个字根就囊括吗?这6个字根就是“钅木日月扌口”,输入过程中,如遇到这6个字根,直接按其对应的键位即可。但是,其它的字根、部件又怎么办呢?经过反复的论证和实验,本人独创性地提出“结构字根”拆字法。完满地解决了字根编码拆分的歧义性,去除了编码的拆分难度。
那么何谓“结构字根”呢?就是以汉字的天然结构作为界线划分字根,即大字根概念。所有的独体字由于是一个整体,无法划分,就将其整体作为一个字根。而对于上下、左右、包围结构等合体字,就按其上与下、左与右、里与外的自然形体界线来划分字根。
如“王”——“王”整体是一个字根
“田”——“田”整体是一个字根“盘”——分为“舟”“皿”两个字根(上下结构,上下分)“略”——分为“田”“各”两个字根(左右结构,左右分)“连”——分为“车”“辶”两个字根(半包围结构,里外分)“国”——分为“囗”“玉”两个字根(全包围结构,里外分)对于上中下、左中右的汉字就按上、中、下或左、中、右分为三个字根“曼”——分为“日”“皿”“又”“鼻”——分为“自”“田”“升”“鸿”——分为“氵”“工”“鸟”“街”——分为“彳”“圭”“亍”对于一些习惯性、约定俗成的分法予以尊重,同时用标准分法也可以输入“辩”——分为“辛讠辛”(大家习惯将该字分为左中右结构)或分为“辛讠”(按标准实际上它是两“辛”夹一“讠”的嵌套结构)“衷”——分为“亠中衣”(大家习惯将该字认为上中下结构)或分为“衣中”(按标准实际上它是一个“衣中”嵌套字)“撕”——分为“扌其斤”(大家习惯将该字分为左中右结构)或分为“扌斯”(形声字,按标准实际上它是一个“左右”结构)“滩”——分为“氵又亻隹”(习惯将该字分为左中中右结构)或分为“氵难”(形声字,按标准应该分为“左右”结构)“幕”——分为“艹日大巾”(习惯分为上中中下结构)或分为“莫巾”(形声字,按标准应该分为“上下”结构)“客”——分为“宀夂口”(习惯分为上中下结构)或分为“宀各”(上下包含,按标准应该分为“上下”结构)“萤”——分为“艹冖虫”(习惯分为上中下结构)或分为“萤虫”(上下包含,按标准应该分为“上下”结构)从以上例字可以看出,拆分汉字再也不是一个难题,不用再为了拆分一个汉字背遍所有的字根,只要有上下、左右、包围结构的常识就能拆分字根。
但是,拆分出来的字根又怎么录入呢?很明显,结构字根都是大字根,比传统意义的字根偏大,经常是几个小字根组成一个结构字根,数量也偏多,至少在一千个以上,如何在键盘上定位又比较容易记忆呢?在这里,本发明提出一种新方法,即不是用一次按键定位字根,而是用两次按键定位一个字根。每个字根输入其前四笔笔画,第一二笔画一个键、三四笔画一个键。
如“王”——“横横”“竖横”“禾”——“撇横”“竖撇”“火”——“点撇”“撇捺”“田”——“竖折”“横竖”但这样一来,会不会影响到条件反射的形成呢?这样的取法是不是又回到笔画对、笔形输入法的老路上去呢?不是,笔画对、笔形输入法要么是对整字取笔画对,要么是拆成小字根后取头两笔。对整字取笔画对会造成相同字根在各个字中的打法不一定一样,不能形成条件反射;拆成小字根后取头两笔仍然存在着拆分小字根的困难。
而现在可以轻松地以自然结构为界线将字拆成结构字根,一不存在拆分困难,二不用记字根,三可以保证相同字根结构字根在各个字中的打法相同,笔画对都取自每个字根的头部,容易形成条件反射。同时保证了易学性和快捷性。
比如,如果横横=H 竖横=G 竖折=A 横竖=J则“王”——“横横”“竖横”=HG“田”——“竖折”“横竖”=AJ那么,我们在每次输入“王”时都输入HG,每次输入“田”时输入AJ,很容易形成条件反射,打熟以后见到“王”就联想到HG两个键,见到“田”就联想到AJ两个键。而且一次就联想到两个键,比传统小字根的条件反射还快。
具体汉字的输入方法如下每个字最多输入4键,并按均分原则将4键分配到每个字根上。
一、占汉字总量90%以上的字是两个结构字根的字,象上下、左右、里外结构,每个字根各输两键。
二、剩下少量的汉字是三个结构字根的字,象上中下、左中右结构,第一二个字根每个字输一个键,第三个字根输两个键。
如果有些字被按习惯分法四个结构以上,(汉字的传统造字法中、以及国家标准中都没有上中中下、左中中右等四个及四个以上结构的字,它们按标准分法大都可以分为上下或左右结构,但有时一些习惯性的分法会将汉字分成四个结构以上,见以上例字),此时,应该输入一二三末字根各一键。
三、单个字根的字,即独体字,先输入该字根的两个键。
输入过程中,我们应该先打哪一字根呢,按照书写笔画顺序,先落笔写的字根先打。
比如“盘”顺序是“舟”“皿”“庆”顺序是“广”“大”“连”顺序是“车”“辶”“式”顺序是“弋”“工”到此,易学性解决了,条件反射问题也解决了。条件反射问题解决了是否就能输入快速呢?不是,条件反射的建立仅仅是快速输入的基础,汉字编码要想快速输入必须重码率要低。
那么按照上述的规则重码率是否就能很低呢?不行,那样重码率还是很高。怎么办呢?增加小字根数量?不可取,不能安排超过6个小字根,那样破坏了易学性。还是老问题,“好学的打不快,打快的不好学”。如果那么简单就能解决的话,就用不着几代人几十年的努力了。
不增加字根,不增加记忆量,又要减少重码率,怎么办呢?经过反复不断的设计、反复不断的测试、反复不断的失败,本方案最终在6个字根的基础上达到了五笔字型之类采用一、二百字根都没能达到的效果——国标一级字库无重码,国标一二级字库重码率趋于零!设计出的规则很简单一、三笔画取双合体字第一个结构字根即首字根如果只有三个笔画,则只需输入其头两笔画,第三笔画忽略不输。
如彳、广、山、工、犭、土、忄、氵、宀、马、女、纟……都只要敲一键——头两笔画即可,然后直接跳到下一个字根取码。
这一规则最大的作用是进一步加强了条件反射的对应,用户很容易形成“彳=D、广=T、忄宀=W、工土=J、马=P”的一一对应关系。等于又增加了几十个无需记忆的三笔画小字根,而且这些小字根都是按其头两笔笔画有规律地定义到键盘上。
二、竖折跳转合体字首字根的头两笔笔画如果是竖折,该字根只按一键,然后直接跳到下一个字根去取码。
如忠——打完“中”头两笔,然后直接跳转,取“心”的字根编码蚌——“虫”按一键,“丰”按两键罢——“四”按一键,“去”按两键贿——“贝”按一键,“有”按两键三、独体字取6画独体字补输其第五六笔笔画作为补码。
如西——输入横竖、折撇,补输“折横”重——输入撇横、竖折,补输“横横”里——输入竖折、横横、竖横四、编码不足4键的字,如与其它字重码,补输该字汉语拼音的首字母。
如刘——“点横”、“撇捺”、“竖竖”、补输“L”申——“竖折”、“横横”、“竖”、补输“S”慢——“点点”、“日”、“竖折”、补输“M”不懂拼音怎么办在等待用户补输拼音首字母时,屏幕上显示前面输入编码相重的汉字及序号,不懂拼音的用户可以直接按屏幕显示的序号输入汉字;采用了这些规则后,本编码实现了国标一级字库无重码,国标二级字库中虽有极少数重码,但由于这些重码字的使用频率小于百万分之一,可以忽略不计,即重码率趋近于零!总结本编码总共提到6个概念,掌握这6个概念就掌握了本编码6个小字根、结构宇根、三笔画取双、竖折跳转、独体字取6画、重码补声一、小字根精选出“钅木日月扌口”6个小字根,在输入过程中,如遇这6个小字根,优先输入其对应按键,不许将它们拆成笔画。
二、合体字的输入1、将合体字按照该字自然结构拆分成结构字根;2、两个字根的字(上下、左右、里外结构)每个字根各输入两键——一二笔画一键、三四笔画一键;3、三个字根的字(上中下、左中右结构)首、次字根各输一键,末字根输两键;4、如遇首字根为三笔画,则首字根只输入一键;5、如遇首字根头两笔为“竖折”,则也只输入一键“竖折”;6、不足4键补拼音首字母。
三、独体字的输入1、输入独体字的头6笔笔画——一二笔一键、三四笔一键、五六笔一键;2、如仍重码补拼音首字母。
四、词组的输入二字词各取每字的前两键三字词先取每字的第一键,然后取最后一字的第二键四字词先取前三字的第一键,然后取最后一个字的第一键五、容错汉字中虽没有上中中下、左中中右的字,但有些字被习惯性地分成这种结构,系统中预备了这种分法的容错码,输入方法为依次输入——首次三末字根各一键本编码的6个小字根及笔画都安排到标准英文键盘上的哪里呢?键盘的安排如下一、笔画的分类前面所提到的笔画是按传统分法、国家标准将汉字的笔画分成“横(含提)、竖(含竖左钩)、撇、点(含捺)、折(含其它所有折、弯、钩)”五大类,将它们的2 5种双笔画组合和5种单笔画——“横横、横竖、横撇、横点、横折、竖横、竖竖、竖撇、竖点、竖折、撇横、撇竖、撇撇、撇点、撇折、点横、点竖、点撇、点点、点折、折横、折竖、折撇、折点、折折、横、 竖、 撇、 点、 折”共30种笔画组合分别定义到键盘上;二、以区位法定义笔画组合在键盘上的几何定位规律输入按键共30个,取26个英文字母键及最靠近母键位置的“;,./”4个键作为编码输入的按键,将编码元素按照以下规律排列将双笔画对按其起笔笔画分成横、竖、撇、点、折5个区;单笔画单独一个区为单笔画区;将单笔画区定义到键盘的右下角;以右手母键位置为横区作为起始,横、竖、撇、点、折5个区分别按照顺时针定义到剩余的键盘位置上;
双笔画分区中第二笔画的位置及单笔画区中笔画的位置称之为“笔画位”;按照英文键盘的传统定义,键盘以“5”和“6”为界线分为左手按键区和右手按键区,并从中间向两边分别为食指按“横、竖”键、中指按撇键、无名指按点键、小指按折键;故笔画位在左手按键区中的排列自右向左,在右手按键区中的排列自左向右;三、六元素的定位“钅木日月扌口”6个偏旁部首分别定义到键盘中的“横、竖、撇、点、折、横点”六个笔画组合的对应键位中;四、根据上述几条规则,标准英文键盘与字根及笔画对应如下Q-点折 W-点点 E-点撇 R-点竖 T-点横 Y-折横 U-折竖 I-折撇 O-折点 P-折折A-撇折 S-撇点 D-撇撇 F-撇竖 G-撇横 H-横横 J-横竖 K-横撇 L-横点_口;-横折Z-竖折 X-竖点 C-竖撇 V-竖竖 B-竖横 N-横_钅M-竖_木,-撇_日.-点_月/-折扌例规——横横、撇点、竖折、撇折——HSZA章——点横、点撇、日 、横竖——TE,J行——撇撇、横横、竖、 ——DHMX(X为拼音首字母)人——撇捺 ——DR(R为拼音首字母)口——口——LK(加输拼音首字母K)重——撇横、竖折、横横 ——GZHZ(独体字)慢——点点、日、竖折——W,ZM(首字根只取一键)曼——日、竖折、折捺——,ZOM(上中下结构)蔓——横竖、日、竖折、折捺 ——J,ZO(按容错打法上中中下结构)街——撇撇、横竖、横横、竖 ——DJHM(左中右,末字根取两键)题——日、横竖、横撇、竖折 ——,JKZ连——横折、横竖、点折、捺——;JQ。庆——点横、横撇、捺 ——TK.Q贰——横折、横横、竖折——;HZE(注首字根两笔与该字两笔不同)规章——HSTE(每字各两键)计算机——QGMA(首次字各一键,最后一字两键)众所周知——SDAG(首、次、三、末字各一键)中华人民共和国——ZFSZ(首、次、三、末字各一键)本输入法已经开发成软件,可以在windows95/windows98/windows2000上使用。
本编码的一级简码30个占总字频17%,二级简码696个占总字频42%,三级简码3424个占总字频34%。在不允许词组输入的情况下,每一百个字中,仅约6个字需要用四个键输入。
由于无重码,无需选择,本编码可以很轻松地实现盲打,输入速度较五笔字型快(五笔字型的重码率比较高)。
在本输入法软件中,为了进一步提高输入速度,我们还定义“点竖”(R键)、“竖竖”(V键)和“竖撇”(C键)作为直上键,一些高频字、词可以在输入一个编码或两个编码后,按这些键结束输入并直接上屏,无需加按空格键上屏。
如“连”的编码原为“;JQ.”,现只要输入“;R”,无需按空格键直接上屏,相当于一级简码。
如“规”的编码原为“HSZA”,现只要输入“HSR”,无需按空格键直接上屏,相当于二级简码。
这一方法将一二级简码的空间扩大了2、3倍,极其有效地提高了输入速度,使得本输入法的录入速度远远大于象五笔字型之类字根的编码。
另在该软件中,还设置了一个字库选择按钮,用户可以通过该按钮直接切换编码针对的字库,是高频字字库或者是国标一级字库;也可以在国标字库集和国际大字符集、台湾BIG5码汉字库之间转换。这样可以加快常用字的输入效率。
用6个字根就实现了汉字的无重码高速输入,这是许多编码专家所意想不到的。本发明仅用6个字根就实现了无重码输入,同时做到了编码的易学和快速,解决了其它专家几十年都没有解决的问题,具有很大的创造性。
本人首次提出和引入了“结构字根”的概念,完美解决了多年来一直无法解决的字根的拆分问题,具有很高的学术价值。
同时,本人提出的用两个键定位一个字根的观点,也具有一定的学术价值。
总之,用6个字根就实现了无重码高速输入,是目前字根输入法中字根最少的,本发明中提到的很多观点和解决技术问题的方法都是比较新颖的,可以为以后他人的发明作借鉴。同时,本人提出的用两个键定位一个字根的观点,也具有一定的学术价值。
权利要求
1.一种计算机汉字输入系统,利用经过重新定义的英文键盘进行汉字计算机输入,其主要特征是只用了6个字根来进行计算机的输入,具体包括本编码输入系统主要有六个详细特征,在于6个小字根、结构字根、三笔画取双、竖折跳转、独体字取6画、重码补声(一)小字根精选出“钅木日月扌口”6个小字根,在输入过程中,如遇这6个小字根,优先输入其对应按键,不许将它们拆成笔画。(二)结构字根将汉字按传统分法分成独体字和合体字,将独体字整体作为一个字根;将合体字按照该字自然结构为界线拆分成结构字根;(三)合体字的输入<1>将合体字按照该字自然结构拆分成结构字根;<2>两个字根的字(上下、左右、里外结构)每个字根各输入两键——一二笔画一键、三四笔画一键;<3>三个字根的字(上中下、左中右结构)首、次字根各输一键,末字根输两键;<4>如遇首字根为三笔画,则首字根只输入一键;<5>如遇首字根头两笔为“竖折”,则也只输入一键“竖折”;<6>不足4键补拼音首字母;(四)独体字的输入<1>输入独体字的头6笔笔画——一二笔一键、三四笔一键、五六笔一键;<2>如仍重码补拼音首字母;(五)容错对于被习惯分为上中中下、左中中右等四个结构以上的字,依次输入——首次三末字根各一键(六)在等待用户补输拼音首字母时,屏幕上显示前面输入编码相重的汉字及序号,不懂拼音的用户可以直接按屏幕显示的序号输入汉字;(七)笔画的分类前面所提到的笔画是按传统分法分类的,将汉字的笔画分成“横、竖、撇、点、折”五大类,将它们的25种双笔画组合和5种单笔画——“横横、横竖、横撇、横点、横折、竖横、竖竖、竖撇、竖点、竖折、撇横、撇竖、撇撇、撇点、撇折、点横、点竖、点撇、点点、点折、折横、折竖、折撇、折点、折折、横、 竖、 撇、 点、 折”共30种笔画组合分别定义到键盘上;(八)以区位法定义笔画组合在键盘上的几何定位规律输入按键共30个,取26个英文字母键及最靠近母键位置的“;,./”4个键作为编码输入的按键,将编码元素按照以下规律排列将双笔画对按其起笔笔画分成横、竖、撇、点、折5个区;单笔画单独一个区为单笔画区;将单笔画区定义到键盘的右下角;以右手母键位置为横区作为起始,横、竖、撇、点、折5个区分别按照顺时针定义到剩余的键盘位置上;双笔画分区中第二笔画的位置及单笔画区中笔画的位置称之为“笔画位”;按照英文键盘的传统定义,键盘以“5”和“6”为界线分为左手按键区和右手按键区,并从中间向两边分别为食指按“横、竖”键、中指按撇键、无名指按点键、小指按折键;故笔画位在左手按键区中的排列自右向左,在右手按键区中的排列自左向右;(九)六小字根的定位“钅木日月扌口”6个偏旁部首分别定义到键盘中的“横、竖、撇、点、折、横点”六个笔画组合的对应键位中;(十)根据上述几条规则,标准英文键盘被重新定义成如下含义Q-点折 W-点点 E-点撇 R-点竖 T-点横 Y-折横 U-折竖 I-折撇 O-折点 P-折折A-撇折 S-撇点 D-撇撇 F-撇竖 G-撇横 H-横横 J-横竖 K-横撇 L-横点_口;-横折Z-竖折 X-竖点 C-竖撇 V-竖竖 B-竖横 N-横_钅M-竖_木,-撇_日-点_月/-折_扌
2.权利要求1所述的输入系统,其特征还在于,定义“点竖”(R键)、“竖竖”(V键)和“竖撇”(C键)作为直上键,一些高频字、词可以在输入一个编码或两个编码后,按这些键结束输入并直接上屏,无需加按空格键上屏。
3.权利要求1所述的输入系统,其特征还在于,其词组输入按以下方式二字词各取每字的前两键三字词先取每字的第一键,然后取最后一字的第二键四字词先取前三字的第一键,然后取最后一个字的第一键
4.权利要求1所述的输入系统,其特征还在于,系统设置一个字库选择按钮,用户可以通过该按钮直接切换编码针对的字库,在高频字库、国标一级、国标一二级、国标扩展字库、台湾BIG5码汉字库之间转换,以加快常用字的输入效率。
全文摘要
本发明是目前字根数最少的字根输入法,它仅用6个字根就实现了无重码输入汉字,一般人只要5-10分钟即可学会,极有规律的键盘分布,无须死记硬背。同时,本发明打破了传统字根的概念,提出崭新的“结构字根”的理论,极具学术参考价值。
文档编号G06F3/023GK1307266SQ0011404
公开日2001年8月8日 申请日期2000年1月27日 优先权日2000年1月27日
发明者陈劲松 申请人:孙小军, 吴劲生, 陈劲松
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1