汉字全能键盘输入方法

文档序号:6601548阅读:1719来源:国知局
专利名称:汉字全能键盘输入方法
本方案是有关汉字输入编码技术的一种优化键盘输入方法。将文字学、符号学等基础理论运用于计算机汉字处理技术领域。在计算机汉字输入技术蓬勃发展的基础上,寻求到一种含智能因素的多功能、具有选择性又符合正字、正义、正音规范和更加简便、快速、易学、好用、易于普及的汉字键盘输入方法。
当前世界研究汉字编码输入技术已成热点,发表的方案已有上千种,获专利的也有百余种,可谓学派林立。
随着信息时代的发展,中国文化影响正越来越扩大,如今汉字已经推向世界,全球使用汉字的人口约近四分之一;随着中国经济的腾飞,汉字在世界大面积的普及,可以说只是时间问题;汉字自身的优势是音节简单、文字内涵稳定性强,词量增多而汉字量不再增加,还有键盘输入比语音输入使用智能处理更容易实现,比书写输入速度快等优点,因此,汉字键盘输入技术所面临世界性的挑战将越来越激烈。目前,汉字键盘输入方法在数量的基础上层次与水平急待提高,智能型的键盘输入方法还刚刚开始。迫在眉捷的是需要乘世界性挑战的机会,继续推陈出新,促进更优秀的方案脱颖而出。
一般说,已经推出的汉字键盘输入方法有拼音类、音形结合类、拼形类等等。拼音类(包括整字读音码+拼形声母码)如新华码等,记忆量小,会读就会输入,但重码字多,速度慢,不会拼音、不会读字或读音不准的用户不能使用。音形结合类(包括一些含谐音的形码)如表形码,还有“认知码”等,能降低重码率,但这些方案中一个汉字有些部件用形码、有些部件用音码,操作过程中用户的思维走向时而转“音”,时而转“形”,心里负担重、速度减慢。
拼形类中的笔画类,字元少无需记忆,但重码字多,选字负担重,速度慢;拼形类中字元、字根、部件类,平均击键数降低、速度加快,但是普遍存在的一个问题是字根、字元数量较多,记忆量大;更突出的问题是使用西文标准键盘,只是间接借用,没有解决汉英符号之间的真正同形关系,不得不附加区、位、方位、坐位、坐姿等等转意的中介代码,或排序,或模拟、模糊象形,或只取某一笔画与英文某一字母和某一字母的某一部分相象形,还有自定义、人为口诀等等硬性规定,增加了复杂化程度,难学、难记忆;更值得关注的一个问题是一些方案为了能使计算机输入方便,往往忽视了汉字的造字规律,违背汉字造字结构,乱拆乱拼乱读音,给汉字识字教学规范化带来干扰,实际也给计算机汉字输入技术带来混乱和复什化;在汉字字型识别方面也出现了五花八门的分类,多达数十种或拾几种,少也有三种。这些问题尤其对非专门输录员的各种专业用户来说很难于熟练掌握,包括推广正热的“五笔字型”码,实属区位码法的一种,思维转折多、难记、易忘为众所共知,再如1985年至1994年之间的形码方案CN85104343A生造出非汉字的“新”字,赋于自造的读音,然后加取这个读音的第一字母为代码参加编码输入,这种“创造”实属违背汉字正字、正义、正音之典型;CN86105505A所取130个字元中只有部分中、英符号近形,渗杂了同义、同音码,还含数字符为代码;CN871105564A提出了中英文字符具有同形、同族关系,但只取英文字母某一部分与汉字某一笔画相似或模拟同形,失去形码的直观性;CN1050780A采用26个拉丁字母代替26类汉字字根方法,实际方案中却多用规定笔形,又添加了对汉字偏旁用大写英文字母为代码,参加编码的却是52个字母符号,还需频繁切换大小写键,操作繁琐;CN1058283A用数字和英文字母作为相似的中文字元的代码,实际方案却包含了同谐音和特例规定,如“y ”作为汉字“木”的代码,根据是自解义“y如同木苗”等等;CN1078562A用自定义口诀定义模糊码形;CN1077548A象形依据是频度高的汉字根归并对应英文字母的某形态特色,如确定英文字母“G”的形态特色是“头重,有一条尾”,故将频度高的汉字根“甲、彳、巾、斤……等归并以“G”为代码,解释不一、难学、难记;1994年公开的CN1083604A提出了中英文字母相“吻合”,但是,其“吻合”除同形以外,依然混杂了意、音等因素,如自称将英字母“C”上下切开成“厂”和“”形;又“C”音近汉字“四”的读音,将四笔画的“火、灬”和“厂、”归并用“C”作代码,如此划分相当复杂。CN1081266A和CN1085673A同一发明人,同谓“直接用英文字母的汉字编码法”,增添了汉字字元的东、南、西、北、杂、变态杂等六种位型和英文字母符号的坐姿东、西、南、北、东南,西北、西南、东北等读音的第一个字母为代码,使用户反复转折于这些位型、坐姿方位与其读音之间,反倒失去了形码直观性的原本优势,又回到音、形交错更加复杂化的老路上去。
至于对中文信息的处理方式用单字处理或词语处理各有千秋,目前多数方案采用单字输入为主含词语输入,还有句处理或意群处理等智能型方案,但还未能普及,其原因,除人们尚不习惯用词语输入之外,实际原因恐还在词语自身的划分是动态、变化的,不同于单字的稳定性,例如不同专业性质的现代中文信息资料中词语的选取是不相同的;而不同文化程度的用户选取的词语也不会是一致的,例如一个初学汉语的用户和一个熟背四字词、五字词和成语的用户,所取输入的词是不相同的;又因计算机词库里的词条量一般是固定而有限的,如“五笔字型码”词库存15000条词语,已经占有大量的内存储单元,其中双字词一万余条,三字词2500条,四字词1500条,句子有80条,但对一些真正需要用词、句处理的用户来说,似乎还不能满足,例如需要输入双字词“家庭”、三字词“家庭会”、四字词“家庭联产”,多字词“家庭联产承包”和“家庭联产责任承包制”等五种词条,“五笔字型码”在词库里存有“家庭”、“家庭副业,、“家庭出身”和“家庭联产责任制”四种词条,其中“家庭”两字已经重复存库四处,却还不能满足以上五种词条的需要,不能击键得词,如果用户需要输入其他更多的含“家庭”的新词语,则必须重新自造词条入库,或改用单字处理方式解决,如此,击键次数反而增加,并未带来方便,而一些初学汉语的用户对多字词和句处理的需求还尚不迫切,这大概就是多字词和句处理方案还有待人们文化水平的普遍提高和计算机技术的进一步发展才能普及的原由。
本方案名称为“汉字全能键盘输入方法”。
目的在克服以上所述种种现象与缺陷,为各类专业和非专业用户提供一种新的、易普及的汉字符号键盘输入法,并且有助于汉字识字教学规范化,为一些不认识汉字或不会读又需要学习汉字的用户提供使用计算机的机会。
一个方案提供的功能多与少、繁与简、速度快与慢,是否有利汉字识字教学规范化等是当前人们对汉字输入技术测评关心的问题,一般情况下较简便的方案必然带来快速度,而多功能与快速往往并不完全成正比,本方案恰恰着眼于既要多功能服务又要快速度的效果,解决这一矛盾本方案坚持的原则是在多功能的前提下,力争每一个功能自身简易,单一性强、尽量规范化,从而带来整个系统多功能,简便快速,符合正字、正义、正音规范要求。其设计要点是一、多功能本方案的“全能”本义就是指一个系统具有两种汉字输入方法配合两种字、词处理方式和智能软件辅助汉字输入,形成多种功能服务,真正做到直观、易记、好用。具体有如下几方面一一1、经研究认为汉字、英文的组字符号具有“形、音多维功能集一身”的共性,以此共性来优选汉字输入的元信息特征符号。一个好的汉字输入方法,首先要能解决好识别汉字的元信息特征。本方案从研究人类语言是一种特有的符号集理论入手,认为汉字、英文字虽然字型不相同,一是方块图形文,一是线性排列文,但同是符号集,必有其符号的共性。汉字造字始于“形”,以形拼字,不断演变,其特点是“形、义、音”三维功能集一身。而英文字母也是一种具有“形、音”功能集一身的组字词的符号集。紧紧掌握住这个共性来解决汉字输入的元信息特征符号的选取,为本方案的多功能内涵带来了神奇的效益。
首先根据国家教委正字、正义、正音的有关要求,遵循国家语言文字工作委员会建议规范化的201个偏旁部首,和国际标准字符集(ISO-IEC 10646-1、2),参考各类辞典,询查出它们的象形文起源、演变过程。汉字的这些组成部分都有象形文、有本义、有名称,还有正确读音;而英文字母也有形、有读音,并且客观存在相互对应、相同的因素和关系。例如汉字201个偏旁部首中的“子”是一个小儿形的象形文,与英文字母小写书写体“ ”对应象形;汉字“子”的读音“zi”的第一声母符号“Z”与英文字母“Z”对应相同;汉字偏旁部首“冖”,本义是指一块布向下覆盖的象形字,与英文字母大写印刷体“U”的倒置状“ ”对应相象形,名称是“平宝盖”,正确读音是“mi(绵)”,其第一声母符号“M”与英文字母符号“M”完全相同,因此本方案选取“冖”和“子”作为本系统的汉字输入元信息特征符号是十分恰当的,既符合汉字识字规律与习惯,也符合拼音与英文字母对应的读写习惯。运用中英文组字符号之间形与音集一身的共同特点,结合汉字组字频度和实用频度,从设计上确定了从汉字的偏旁部首中优选出组字和使用频度高、“形”能与英文字母符号相象形,同时其读音的第一声母符号与英文字母符号相同的160个符号作为本方案输入汉字的元信息特征符号,统称“元息符号”,它带给人们的是在一个系统中两种输入方法功能的服务。
2、一种汉字元息符号,两种分组方法,形成两种输入方法体系。
160个汉字“元息符号”以“形”分组,凡与某英文字母的五种字体形状包括大小写的印刷体和书写体、一种花体相象形的归并为一组,直接取英文键盘盘面的这个英文字母符号为代码,代码不分大小写,也不分字体。例如汉字元息符号“口”与英文字母小写印刷体“0”相象形;而汉字元息符号“口”与英文字母大写印刷体“O”相象形,则将“口、口”归并为一组,直接对应英文键盘盘面的“O”为代码参加汉字的编码进行输入。如此将汉字“元息符号”分成26个组,对应键盘相象形的26个英文字母符号为代码,在一定的规则下组成《纯象形符号输入法》体系。
同理,以上汉字“元息符号”再以音分组,凡是读音的第一个声母符号相同的归为一组,直接取相同的英文字母符号为其代码。例如以上汉字元息符号“口”读音“Kou”;“口”读音“Wei”第一声母符号分别是“K”“W”。分属二个组,直接取“K、W”为其代码。又如汉字元息符号“亠”,俗称“一点一横”,查小篆为“”,解凡字之结构,无义之字,读音“Toui”第一声母是“T”;又元息符号“土”作偏旁名称“提土旁”,“土”在下方称“土字底”,甲骨文写作“ ”,象土地上的土块,读音“tu”第一声母也是“T”,故“亠、土”分为一组,直接取英文字母“T”为代码,参加汉字的编码进行输入。160个汉字“元息符号”的读音的第一声母有22个,分22个组,分别以相同的22个英文字母为代码,在一定的规则下组成《纯声母符号输入法》体系。
3、一个系统提供两种输入方法功能服务。
本方案优点在于完全不同于当前的一些形、音混杂的表形码类,而是一个系统之内两种输入方法并存;一个体系纯粹用形,覆盖全部汉字;另一个体系纯粹用音,同样覆盖全部汉字,形、音码按体系分开,有利于纯化操作环境,好记、好用;同时,在一个系统之内形、音码两个体系亦可不必切换,满足用户在使用一种输入方法的过程中随时改用另一种方法。
4、同样的码长,不同的功效。
本方案两种输入方法体系都以码长4为限,汉字双字词的编码长为4等长码;汉字单个字的编码为1-3不等长码+空格;不必切换,达到双字词为主单字为辅混合输入和单纯单字输入两种功能服务。
5、一个双向双字词库提供多种处理字和词的功能。
汉字词语的动态、可变的特性往往给计算机用词、句处理中文信息带来困难,本方案恰恰掌握住这一特性的作用,将任何一种现代中文信息资料的词和句视由若干双字词和少数单字搭配组合而成,设有一个双向双字词库配合单字库,就能满足不同领域由这些双字词和单字搭配组合而成的各种三、四、五、多字词和句子的处理。一般情况下,一篇现代常用中文信息资料,输入的击键得词率一般是99%以上,优越于当前的常规词处理方案,亦优于句处理方案。例如,需要处理多字词“家庭联产责任承包制”和“家庭承包制”两词语,一般方案必须词库存入这二个词条,用户才能击键得词,就是说,尽管词库有上万的词条而没存有这两条,无论如何是满足不了用户要求的。一旦击键不得词再改用单字输入,那么击键次数增加。本方案只要从双向双字词库中提取双字词“家庭”、“联产”、“责任”、“承包”和单字“制”,不但能满足这两个词条的输入,还可满足用这些双字词和单字搭配组合而成的任何一条新的词条。
6、利用汉字方块图形文的字型特点,只需分辨一种字型,解决多种问题。
本方案减少了对汉字各种字型的分析、划分,只对“左右分体结构”的一种类型汉字作简明规定,并且把双字词也视作为左右分体“字”来处理,使一些复杂的问题简化了许多,例如汉字“圭、奎、哇、硅、佳、畦、鞋、鲑、褂等等都是由相同的“圭”和不同的偏旁部首搭配组成。本方案只对其中有“左偏”的汉字作两条规定(1)左右分体型汉字的“左偏”(包括双字词的“左边字”)限取1-2个“元息符号”的代码参加编码输入;对超过两个“元息符号”的“左偏”限取其首、末“元息符号”的代码参加编码输入。如汉字“鞋”的“左偏”革字由“廿、口、十”三个元息符号组成,只取“廿”和“十”的代码参加编码输入。即“鞋”的编码是“左偏”的“廿”、“十”和“右旁”的“土”的代码+空格。则双字词“鞋子”视“左边字”鞋同单字的“左偏”处理,取其首、末元息符号“廿”、“土”参加编码输入。(2)凡有“左偏”的分体汉字的输入“元息符号”不足3,添补该字“右下角”的一个笔画的代码参加编码输入;同理,一个双字词的输入元息符号不足4,添补该词的第二个字的右下角一个笔画的代码参加编码,若还不足码长4,继续重复击该笔画的代码,补足4等长码参加输入。如汉字、林”的输入“元息符号”是“木、木”不足码长3,添补该字右下角笔画“”的代码参加编码输入;双字词“山林”的输入元息符号是“山、木、木”不足码长4,添补该双字词右下角笔画“”的代码参加编码输入;而双字词“山水”的输入元息符号是“山、水”,码长不足4码,添补该双字词的右下角“”笔画的代码,仍不足4,重复击一次“”,达到双字词编码是码长4的要求。如此实施带来了比较好的效果,例如在《纯声母符号输入方法》体系中,如果对汉字“林”、“相”、“宋”不作左右分体结构字处理,其编码相同都是“MM+空格”;本方案采取只对“左右分体字”“林”和“相”各添补右下角一笔画的代码修正其编码,“林”的编码为“木、木、”的声母符号“MMN+空格”;而“相”的编码为“木、目、 ”的声母符号“MMG+空格”;汉字“宋”不是“左右分体字”,无需修正其编码,结果很好地消除了这一对三个重码字。如此,本方案多功能6的优点十分明显,避免了数十种字型的划分,只对一种极容易认辨的“左右分体字”作了两条规定,既体现了汉字方块图形文和“偏旁”的特殊作用,又解决了字和词输入不足码长的问题,同时很顺利的降低了重码率,优越于当前许多采用字型划分的方案。
7、发挥计算机辅助汉字输入的优势,采用智能软件支持,自动处理重码字、词;同时“提示栏”提示重码字、词,人机互补,完善功能。
计算机的发展已经普及于辅助设计,辅助教育,辅助许多需要辅助的领域,而辅助汉字输入技术更为迫切和理所应当,本方案采用智能软件支持,实现计算机自动匹配,同时用警铃和提示栏提示重码字、词,人机互补,完善重码字、词的处理功能。本方案重码率低,并且一对重码字、词数量少(多为一个编码对应两个重码字)。字与词无重码。
8、只用书写笔顺、尽量取大的一条规则,完成全部汉字、词的识别、拆选元息符号、取码等等功能。
本方案只用一条规则按书写笔顺,尽量取大,即识别汉字服从从左至右、自上而下的书写笔顺,尽量取最大的符号,拆选一个汉字的输入元息符号。例如汉字“俞”只能拆选 月、刂”三个输入元息符号,不能拆成最小笔画或其它等等。
9、同一“元息符号”在汉字结构中不同存在方式,予以不同的处理方法,获得多种作用。
一个“元息符号”可作为一个汉字的结构成份存在,亦可不作结构成份独立存在,或自身就是一个简单成字。本方案对作为字的结构成份的“元息符号”,只取其代码参加被组成的汉字编码字母串进行输入;对独立存在或是一个简单成字的“元息符号”则一律视同一个汉字的办法来处理,即按编码为1-3不等长码+空格输入;所不同之处,只是编码的第一个符号是这个“元息符号”自身的代码,其他两个符号才是拆选其结构成份的首、未“元息符号”的代码。例如汉字“元息符号”“厂”在汉字“厢”里为其结构成份“厂、木、目”之一,只取其象形代码“J”或声母代码“C”参加各自体系的编码进行输入;若作简单成字“厂”独立存在,则首先取其自身“厂”的代码,再取其结构成份“一”、“丿”的代码组成编码进行输入,其纯象形编码=JHJ+空格,纯声母编码=CYP+空格。
10、本方案的汉字编码只用26个或22个英文字母符号,不分大小写、不合数字、标点符号和功能键,保持键盘面上的各种符号同时供用户使用,满足各类用户输入汉字的同时输入各类公式、方程式、制表、标点符号等,达“全能”输入的功效,提高键盘使用率。
11、本方案的汉字输入只用英文标准键盘中间区域的英文字母键,提供双手击键与盲打的功能。
12、《纯声母符号编码法》体系还可扩大功能。
本系统除了160个“元息符号”的形、音编码以外,扩大到可以使用ISO-IEC10646-1、2国际标准字符集汉字的全部偏旁部首,用声母码输入。例如汉字“鼾”既可用“元息符号”“自、卄、干”的形、音码输入,亦可扩大用“左偏”“鼻”和“右旁”“干”的读音第一个声母符号为代码参加编码输入。
13、容错功能强本系统允许用户输入形、音和扩大了的偏旁部首的声母代码对某一个汉字或双字词进行输入;也允许输入错码或笔画颠倒。如汉字“长”允许用书写笔顺“丿、七、”三个元息符号的代码,也可允许人们用习惯错笔取“丨、丿、 ”三个元息符号的代码参加编码输入;或者有些“元息符号”含糊不清、或者忘了某一代码,可以输入一代替键参加编码输入,这时屏幕上显示用户需要输入的汉字或词和几个重码字、词供选择,并且显示行显示出正确的编码,给于纠错帮助。
二、简便、快速1、根据多功能1所述中英文组字符号之间具有“形、音集一身”的共性,汉字“元息符号”与英文字母符号个个有“形”,易直观,个个都有正确读音,易记忆,并有解义易理解,此为简便、快速之一。
2、根据多功能1所述。本系统优选的汉字输入“元息符号”符合规范要求,使人们基本上无需要离开国际标准字符集和国家语言文字工作委员会推荐的偏旁部首去另外建立许多“新”的组字概念和“新”的部件、字元、或字根等等,规范化带来简便、快速,此为二。
3、根据功能1所述。本系统优选的输入“元息符号”由214个缩小到160个,记忆量减少,此为简便、快速之三。
4、根据功能1、2所述。汉字“元息符号”与英文字母符号之间一一直接对应象形关系,直观汉字“元息符号”对应英文字母五种字体之形,象什么就对应什么形状,容易观察;所取代码不分大小写、不分字体、不附加任何坐姿、方向、方位等中介因素,只用盘面26个英文字母符号,此为简便、快速之四。
5、根据功能1、2所述。汉字“元息符号”的读音第一声母符号与英文字母符号之间相同关系,更是一一直接对应,无需增加记忆量,为简便、快速之五。
6、根据功能1、2和以上的5,只要会读160个“元息符号”就会处理中文信息,解除了整字不会读或读不准的忧患,为简便、快速之六。
7、根据功能1-3所述。一个系统两种输入方法功能,无需切换,操作简单,同时亦可切换使用,且内存储单元大幅度减少,为简便、快速之七。
8、功能1-3所述。一个系统两种输入方法体系,保持两个体系各自的单一性,象形码中汉英组字符号之间单一相象形;音码中汉英组字符号之间单一相同。一个体系中形、音代码不混杂交叉,各覆盖全部汉字,用户使用任一输入法都能简便、快速;操作过程中一个字、词用形或音码可以随意转换,无需切换更加简便、快捷,此为八。
9、功能5所述。一篇现代中文信息资料中的双字词频度一般是80-90%左右,采用双字词为主单字为辅混合处理方式比用单纯单字处理方式,输入速度将提高一倍左右;比较多字词或句处理方案来说,划分双字词比划分多字词或句子容易得多,任何一个有一般语文水平的用户都会划分,会操作,一般可以击键即得词,无需反复修正编码重新输入,输入速度更可成倍提高,此为简便、快速之九。
10、功能4所述。汉字、词一律以码长4为限,码短、速度快;字、词之间无需切换,直接混合输入,操作简便、加快速度,此为十。
11、根据功能6所述,将对全部汉字字型的分析、划分缩小到只要对“左右分体字”处理,增加直观性和容易程度,此为简便、快速十一。
12、据统计“左右分体”汉字占总字量的56%左右,本方案运用汉字方块图形文的字型特征,只把注意力集中在“左右分体”字上,符合人们认识汉字的习惯,输入速度至少提高50%,加上省略了许多字型分析和规则,易记忆、易操作,为简便、快速十二。
13、根据功能6所述。只对“左右分体”汉字限定选取“左偏”的1-2个元息符号,既可保证汉字整字的编码长度短,又可减少重码率,增加输入速度,此为简便、快速十三。
14、根据功能6所述。对“左右分体字”(包括双字词)中整字编码不足码长4(包括空格键),添补这个字(词)的“右旁”(右边字)右下角一个笔画的代码,右下角指方块字图右下方四分之一范围内的最右下一笔画,如以下字例右下角为“、”,如“孙、外”;右下角为“一”如“江、冱”;右下角为“丨”如“引、计”;右下角为“丿”,如“彤、矿”;右下角为“”如“冰、从”;右下角为“”如“籽、钊、村”;右下角为“乙”如“旭、虮”;右下角为“”如“孔”右下角为“ ”如“相、如、钥”;右下角为“ ”如“鸠、钙”等。容易辨认,可避免书写误笔,补码简便,还可较大幅度降低重码率,提高输入速度,为简便快速十四。
15、功能7所述,大型智能软件辅助汉字输入,自动处理重码字、词,输入速度迅速加快,此为简便、快速十五。
16、功能8所述,按书写笔顺、尽量取大的原则识别汉字、拆字、取码,会查汉字字典就会识别、输入汉字,不需要重新建立什么“新”的自定义规则和口诀等,此为简便快速十六。例如汉字“夫”,字典从“二”部,本方案亦拆选“二人”为夫,汉字“成、哉、划、我……等汉字字典一般归“戈”部,本方案亦优先拆取“戈”为元息符号; “国、围、回……等归“囗”部,本方案亦优先拆取“囗”元息符号的代码(形码为“O”;声母码为“W”)参加编码输入;此为简单、快速十六。
17、功能9、10、11所述,本方案只使用西文键盘中间区域的英文字母键,保留键盘上其他各键同时使用,有利双手击键和盲打,均为加快输入速度的办法,为简便、快速十七。
18、功能12、13所述,本方案容错和扩大功能都达到加速输入速度的目的;且扩大的符号集不超出规范化偏旁部首,符合人们掌握汉字造字规律和识字习惯,为用户带来更大方便和容错功能,就是说对一个汉字的输入,用户可以用形码、亦可用声母码,还可用扩大码,且允许一定范围的书写笔误成漏笔,此为简便、快速十八。
三、力求符合正字、正义、正音规范本方案遵循国家教委正字、正义、正音的有关要求,首先以国际标准字符集214个偏旁部首和国家语言文字工作委员会推荐的201个偏旁部首作为优选汉字输入的“元息符号”的依据,从根本上确保了配合汉字识字教学规范化的良好基础,同时进一步正本清源,从汉字造字起源、演变过程入手,寻根求源,查到汉字偏旁部首的象形文出处;解释本义;名称和正确读音;又研究英文字母符号对应拼音符号的形和音的特性,找出它们的共性关系,从而掌握住这些共性特点,对应汉英造字成份之间“形”和“音”的相互对应关系,从偏旁部首中优选本系统的汉字输入“元息符号”,分别取键盘盘面对应的字母符号为代码。例如汉字偏旁“冫”名称是“两点水”,查询其甲骨文为“ ”,解释“棚也、固结冰面如棚”;小篆为“ ”,解义象水凝成冰的纹理之形”,本义作“冻”解,读音“Bing”。本方案认为英文字母“V”亦可视为水面凝成冰的纹时之形,只是汉字演变成“冫”,与“V”的侧置“ ”状同形。其读音“Bing”的第一声母符号“B”与英文字母“B”完全相同,故优选“冫”为汉字输入元信息特征符号(统称“元息符号”),以英文字母“V”和“B”分别为其象形代码和声母代码,参加形、音两个输入方法体系进行编码输入。同理,汉字偏旁“匚”俗称“三框栏”或“区字框”,查小篆“匚”本义谓“受物之器”即藏物之器,读音“Fang(夫)”,查英文字母“C”相象形;读音的第一声母“F”与英文字母“F”完全相同,确定优选汉字“匚”为本系统的汉字输入“元息符号”,分别以“C”和“F”为象形代码和声母代码。如此,优选出的汉字“元息符号”(表一)符合规范要求;同时本方案拆字选元,组织编码的顺序也是采用汉字书写笔顺和尽量取大的原则,符合汉字造字规律和人们识字习惯,与汉字常用字典基本相一致,会查汉字字典就会识别字代码、输入汉字;本系统的其它有关设计和规则也力争符合汉字正字、正义、正音规范,有利于汉字识字教学、推广汉字。
四、本方案的实施例证1、计算机装配本系统软件开通后,《纯象形符号输入法》和《纯声母符号输入法》两个系统并存,供用户随意选用,不用切换,亦可切换;同时“双字词为主单字为辅混合处理方式”和“单纯单字处理方式”都适用于形、音两种输入方法,也无需切换,但优势在于使用“双字词为主单字为辅混合处理方式”。例如一则中文信息资料“必须减轻中、小学生过重的课业负担”。本方案视其是由“必须”、“减轻”、“学生”、“过重”、“课业”、“负担”六个“双字词”和“中、小、的”三个“单字”及一个“、”号组成,只要按原资料顺序匹配对以上六个双字词各取4等长元息符号和三个单字各取1-3不等长元息符号+空格,并一一对应英文字母符号取其代码组成编码字母串,进行输入。某一对双字词和字对应代码选用象形码或声母码不限,任用户自由采用。实施结果总击键32键(次),比用单纯单字处理少击28键(次),击键得词率为100%;比较用其他二、三、四、五或多字词、句处理方式的方案,划分词语容易,简便,击键得词率高,速度快。
2、对一个汉字的识别、选码、输入的实施按照本方案的汉字元息符号和书写笔顺、优先取大的一条规则,直观汉字其形、区别是否属“左右分体字”;按照1-3不等长码要求,选取“元息符号”,对照英文字母的五种书写体形状(图二)或读音符号(表二),直接取对应象形代码或声母代码,组成这个汉字的编码英文字母串进行输入。例如汉字“回”直观其形,不是“左右分体字”,取“元息符号”“囗”、“口”对照英文字母符号的字体分别与“O”与“o”相象,直接取“O”、“O”为象形代码组成这个汉字纯象形编码字母串“OO+空格”进行输入;或者取“囗”读音“Weo”的声母“W”和“口”的读音“Kou”的声母“K”组成这个汉字的纯声母编码字母串“KW+空格”,完成汉字“回”的输入。
又如汉字“答”直观其形,不属“左右分体字,其元息符号“、人、一、口”超过不等长1-3,取其中首、次、末三个“元息符号”“、人、口”,任选形、音码进行编码输入,则纯象形符号编码为元息符号“、人、口”,对应象形的英文字母“K、R、O”为代码即“KRO+空格”。而纯声母符号编码=元息符号“、人、口”的读音的第一声母“ZRK+空格”。
汉字“饮”直观其形,属“左右分体字”,左偏的元息符号“饣”不超过2,加“右旁”的首、末元息符号,符合1-3不等长的要求,任选形或音码进行输入。《纯象形》符号编码将元息符号“饣、ク、人”对照英文字母符号“NNr”相象形,取“NNR+空格”进行输入;《纯声母》符号编码将元息符号“饣、ク、人”的读音“Shi”、“do”、“Ren”的第一声母符号“SDR”+空格进行输入。
汉字“靴”直观其形,属“左右分体字”其“左偏”“革”超过两个“元息符号”,取首、末元息符号“廿、十”加“右旁”的末元息符号“七”,选用纯象形符号编码方法时对应英文字母“H”、“X”、“t”相象形,直接取英文字母串编码“HXT+空格”进行输入;纯声母符号编码方法取“廿、十、七”的读音”“Nian”、“Shi”、“qi”的第一声母符号串编码“NSQ+空格”进行输入;纯声母符号扩大方法取元息符号“革”、“亻”、“七”的读音“ge”、“Ren”、“qi”的第一声母符号串“GRQ”+空格进行输入。
3、元息符号自身的输入方法实施汉字“子”直观其形,属于本方案“元息符号”之一的自身,为简单成字,按元息符号独立存在的规则处理先取“子”自身的第一元息符号,再拆取“子”的元息符号“フ、 ”,达到1-3不等长码,选用形、音编码输入法。
纯象形符号编码为元息符号“子、フ、 ”对应英文字母“Z、Z、X”相象形,取字母符号串“ZZX+空格”进行输入;纯声母符号编码为元息符号“子、フ、 ”读音“Zi”、“Yi”、“Si”的第一声母符号串“ZYS+空格”进行输入。
汉字偏旁“亻”直观其形,为本方案元息符号自身之一,按“亻”独立存在的规则取“亻”自身符加其组成的元息符号“丿、丨”,任取形或音码进行输入。纯象形符号编码为元息符号“亻、丿、丨”的象形代码串“YJI+空格”。纯声母符号编码为元息符号“亻、丿、丨”的读音“Ren”、“Pi”、“Gun”的第一声母符号串“RPG+空格”。
5、对“汉字双字词”的识别,取码、输入的实施方法与步骤双字词“回答”取左边字“回”的“囗”、“口”和右边字“答”的首、末二个元息符号“竹、口”,满足双字词4等长码要求,任选用形或音码进行输入。
纯象形符号编码将该双字词的元息符号“囗、口、竹、口”对照英文字母字体形状与英文“O”、“O”、“K”、“O”相象形,直接取英文字母串“OOKO”为编码进行输入;纯声母符号编码取该词的元息符号“囗、口、竹、口”的读音“Wei”、“Kou”、“Zuo”、“Kou”的第一声母符号串“WKZK”进行输入。
双字词“靴子”取左边字首、末元息符号“廿、七”和右边字元息符号“子”,添补该双字词右下角笔画“ ”,任选《纯象形》编码“HTZJ”或《纯声母》编码“NQZG”进行输入。
双字词“山水”取、左边字”元息符号“山”和“右边字”元息符号“水”,不足4等长,添补右下角笔画“”仍不足4等长,继续重复“”的代码组成《纯象形》编码“WELL”或组成《纯声母》编码“SSNN”进行输入。
权利要求
1.汉字全能键盘输入方法,其特征在于“全能”。它创新地设计了一种《纯象形符号输入方法》和《纯声母符号输入方法》,两种方法体系共容于一个系统中,可切换各自独立运行;亦可无需切换,随时选用。为从小学二、三年级起学习拼音汉字的用户和不熟悉汉字拼音、不会读或读不准汉字的各类用户提供简便、易学的汉字键盘输入方法。
2.汉字全能键盘输入方法,其“全能”特征还在于设有一个双向双字词库,改变“单纯单字输入”为“双字词为主单字为辅混合输入”的处理方式,使中文信息输入的日常速度成倍提高;并保存“单纯单字输入”处理方式,同适用于本系统内的两种输入方法体系。
3.汉字全能键盘输入方法的特征在于采用智能软件支持,实现计算机辅助汉字输入,处理重码字、词,提高输入速度,增强容错、纠错能力,改善用户输入环境,轻松自如地输入汉字。
4.汉字全能键盘输入方法,特征在于码短、速度快。汉字、词输入码最长为4。双字词编码为4等长码;单字编码为1-3不等长码+空格键。
5.汉字全能键盘输入方法,特征在于汉字、词输入信息特征选取的基础是符合正字、正义、正音规范,掌握汉、英文组字符号“形、音功能集一体”的共性关系,以国家语言文字委员会推荐的常用汉字201个偏旁部首和国际标准汉字字符集(ISO-IEC 10646-1.2)的214个偏旁部首为依据,参考各类辞典询查出它们的起源、出处、象形文的形成和其本义,区别其名称和正确读音,结合组字频度和实用频度,优选出其中与英文字母五种字体对应相象形;其读音的第一声母符号又与英文字母对应相同的160个符号,作为本方案输入汉字的元信息特征符号,统称“元息符号”。
6.本方案使用的汉字输入“元息符号”总览表(表一),特征在于表述汉字组字符号客观存在的“形、义、音”内在关系。正本清源,纠正拆字、识别和解义特别是将名称错当读音的混乱现象,适合汉字识字教学。
7.本方案特征在于《纯象形》和《纯声母》符号输入方法两种体系,共享用总览表所列160个“元息符号”。一以“形”为依据,将表中相同象形的“元息符号”归并为一组,每一组取英文键盘对应相象形的字母键为代码,组成《纯象形》符号输入方法体系;二以“音”为依据,将表中“元息符号”读音的第一个声母符号相同的归并为一组,每一组取英文键盘对应相同的字母键为代码,组成《纯声母》符号输入方法体系。
8.本方案特征在于《纯象形》和《纯声母》符号输入方法,各自保持本体系的“纯一性”。就是说《纯象形符号编码》坚持直观汉字其形;直观“元息符号”之形;直观英文字母符号之形;以形取码,不包含任何谐音,区、位、排序等人为因素,也不附加或渗入任何中介转意代码如汉、英字母符号的方向、方位、坐姿等因素的代码;同理,《纯声母符号编码》坚持以“元息符号”的读音的第一声母符号为代码,不渗入任何其他因素的代码,包括第一声母以外的声、韵母。本系统的“象形”与“声母”代码亦不得相互渗杂混用于一个汉字、词中,“形”、“音”码各覆盖全部汉字。“纯一性”带给用户操作环境的纯化,思维方向单一,减少记忆量和难度,易掌握,加快输入速度。
9.本方案特征在于仅用英文键盘的26个和22个英文字母符号键作“形”、“音”代码,不包括数字符、标点符号和功能键,满足各类专业、非专业用户需要,提高键盘使用率。
10.本方案使用的汉字元息符号英文字母符号对应象形图表(图一)。直观汉字“元息符号”与英文字母符号五种字体包括大、小写的印刷体和书写体及一种花体的一一对应关系。
11.本方案使用的象形符号键盘图(图二)。“象形代码”,只用盘面26个英文键,不分大小写和字体。
12.本方案使用的汉字元息符号音码一览表(表二),会读这些“元息符号”就会输入中文信息资料。
13.根据权利要求1-12所述,本方案将汉字笔画归纳为横(一)竖(丨)撇(丿)点(、)捺()折钩(乙( ), ㄋ  )六种;还有十三个中文数字码一、二、三、四、五、六、七、八、九、十、廿(二十)、卅(三十)、 (四十),对应英文字母“形”、“音”代码表(表三)。
14.根据权利要求1-13所述,本方案对一个汉字的拆字取码原则遵循汉字书写笔顺,尽量取大。即先上后下,先左后右,按码长要求除空格键外拆选首、次、末三个“元息符号”,直接取对应的英文字母符号,分别以“形”或“音”码参加两种编码输入,如汉字“俞”的“元息符号”是“ 月、刂”,对应的“纯象形编码”是“ADN+空格”;“纯声母编码是“JYD+空格”。
15.本方案特征在于汉字象形文形成与书写笔顺不尽一致的少数汉字,从正字、正义判断。汉字“成、戊、哉、戴、我”等查“字典”同属“戈”部,则优先取“元息符号”戈;汉字“天”、“夫”按笔顺可同取“二人”,本方案从解义出发,取“一大”为天;“二人”为夫,更符合象形文形成的本义。同理,“矢”和“失”,取“大”为“矢”;“丿二人”为“失”,解义指丢(丿)掉二个人,从解义易理解好记忆,且能减少重码字。
16.根据权利4-14所述,本方案特征在于省略对汉字字型划分的复杂操作,只对占汉字56%的“左右分体字”在选码方面依据两条规则(1)对“左右分体字”的“左偏”(包括左侧部分如“剐”的左侧部分为“呙”)最多取首、尾两码为限,“右旁”(包括右侧部分)取首、尾或尾“元息符号”的代码,满足1-3不等长码+空格的规定。(2)对“元息符号”不足3的“左右分体字”,给予添补该字“右下角”一笔画的代码参加编码输入。确定“右下角一笔画”是该方块图形文右下方四分之一范围内的最右下角笔画如 此规则符合汉字识别习惯,易辨认,有益于降低重码率。
17.根据权利16所述,视双字词同“左右分体字”处理。(1)将双字词的“左边字”视作为同单字的“左偏”,最多取其首、末“元息符号”的代码参加编码,余下作为该词“右边字”的首、次、末或首、末“元息符号”之代码,满足双字词编码长为4。(2)对不足4等长码的汉字双字词,添补该词“右下角”笔画的代码,修正编码,仍不足等长4,继续重复该笔画代码,参加编码输入。
18.汉字全能输入法,特征在于“元息符号”自身独立输入的编码与汉字单字同等于1-3不等长码+空格,而不同点在于编码的第一码为其自身代码,依次才是这个“元息符号”的组成部分(包括首、未“元息符号”)的代码+空格。
19,本方案特征在于使用标准英文键盘的中间区域字母键,便于双手操作,易盲打,提高输入速度。
20.本方案特征在于智能软件支持的同时,警铃、窗口提示重码字、词,人机互补完善功能。并且改善选字办法,击提示键自动上字于显示屏后,再击提示键,自动覆盖、更改,至选择正确为止。字与词无重码。
21.容错功能强。一些书写笔顺有多种顺序的汉字,或有多种读音和编码的字、词,能容错输入;凡遇个别不明确的代码,容错击入“代替键”参加编码输入,显示栏显示这个容错编码表述的汉字和词,同时注明其正确编码,帮助用户识别。
22.本方案特征在于能扩大功能,采用国际标准汉字集的偏旁部首,取其读音的第一声母符号,直接作代码参加编码输入,方便于汉字识字教学选用。
23.根据权利1-22所述,本方案特征还在于选择性好。本系统“全功能”提供的“形”、“音”符号输入法;扩大的偏旁部首声母码输入法;双字词、单字输入处理方式;智能软件与人工互补以及容错功能等等,均不需切换操作,任需要选用。“形”、“音”码亦可切换,按体系独立运行,提高输入速度。
全文摘要
本方案由《纯象形》和《纯声母》两种汉字输入法共存一体,共享160个汉字“信息符号”和一个双向双字词库。两种方法均可双字词为主单字为辅混合输入及纯单字输入。“信息符号”与英文字母五种字体对应象形;其读音的第一声母又与英文字母对应,分别以键盘26个和22个键为代码,不用转意码、数字和功能键。用智能软件配合左右分体型汉字的输入规则,人机互补;多功能、任选;适合汉字教学,符合正字、正音规范;简便快速。
文档编号G06F3/023GK1146022SQ95108338
公开日1997年3月26日 申请日期1995年6月20日 优先权日1995年6月20日
发明者林钧礼, 马燮如 申请人:林钧礼, 马燮如
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1