汉字十类字元歌诀定位电脑输入法的制作方法

文档序号:98971阅读:852来源:国知局
专利名称:汉字十类字元歌诀定位电脑输入法的制作方法
汉字属于拼形文字,而且多数字系由三个以下字元或字形部件所构成。所以,码长最短(除少量重码字外,每字输入不超过三键)、并适宜于微机小键盘输入的拼形编码,早已成为国家有关科研部门的攻关课题。
汉字十类字元歌诀定位电脑输入法(简称十类字元歌诀定位码)即是一种三码拼形输入法。本方案按组成汉字的字元(笔画或部件),每个汉字最多取首、次、尾三码直接输入,并有40个高频或较高频字为单码输入,以及623个双码字(单、双码字在输入时要以空格键结尾)。目前已编码输入字数为国标一、二级汉字6763个,并具有装词能力。
本方案的形成可分为键盘布局和字元分类定位两个方面。
一.键盘布局为了使微机的西文键盘完全适宜于汉字的拼形输入,特将小键盘的47个字符键作了简单化、序列化而又整齐化的布局,即将小键盘的四排键,均分别以十个阿拉伯数字顺序命名,并使第二、三、四排键的数码序列与第一排键的原有数码一一对应,使之成为序列整齐的四十个基本键。为了区别各排键上下相对应的同样数码,将第二、三、四排各键的数字代码旁分别附以小字母b、c、d称作“附序码”,第一排键的附序码(a)则省略。各键的附序码与该键的数字代码合在一起称呼,纵向读作1、1b、1c、1d;2、2b、2c、2d……小键盘剩余的7个键称为识别键,即末一排左起第一个键代码为“
”,前三排每排右侧的两个键分别为①、②,③、④,⑤、⑥。在这些识别键位上未布置任何字元部件,因而在输入单字时这些键从不作为首码键来应用,故可于装词或编入标点符号等用途中作为机动键。
上述键盘布局完全体现了“洋为中用”,为汉字的拼形输入带来了极大方便。
下面是键盘布局图
以上键盘布局极其简单、明朗、横竖序列严整,任何人都能够一目了然,便于实际应用,故上图的键位名称不一定要在键帽上标出。
二.字元的分类与分组定位研究字元(笔画与部件)的分类定位方法,是能否达到“易学、易记、易用、易快、易检”等攻关目标的关键。本方案主要以形象归纳法对应选字元进行分类与分组定位,并研创了设置“领头字”、“副领头字”及编制“字元定位歌”等方法。
(一).字元分类按组成汉字的笔形、部件的起首或宏观形象特点,大致分为十类字元,以“形码分类歌”表明如下1横2竖3点小,4叉5撇6框口7折8八实框9,顶缀点撇化0头注这里利用了一部分“四角号码”惯例,但取码法则与“四角号码”完全不同。
为了使各基本键位的字元数量分配较为匀称并能够避免重码,因而对此十类中某些类别并不拘泥于一格,而按某些部件的形象特点作了适当调整。如将多数“竖插”部件及“耳”、“卩”、“阝”均归入竖类,“竖插”尾如“小”者,则归入点、小类;“才”、“攵”、“扌”列入叉类等;框口类与实框类亦只是各有侧重而已。所以,下面各类字元的分组定位规律及“字元定位歌”的编制,则是关系到“五易”的更重要的环节。
(二).各类字元的分组定位基本上按上述十个类别的划分,将本方案所应选的大量字元,列入一张模拟基本键位序列的“基本键位字元分类定位表”(此表附后)中。并将每类字元分成四个组,分别按排在属于该类的四个键位格内(如横类各组字元分别置于1、1b、1c、1d键位格内,竖类各组字元则分置于2、2b、2c、2d键位格内……)。在同一键位格内,又将同组字元按其不同宏观形象及笔画特点分作前、后二列,在排列上也尽可能使每列字元的形象特点有一定的规律。然后将全组的成字字元按顺序标以识别码,不成字字元则只有极少数标有识别码或借用识别码,每组识别码数最多6个。在排列中,对一些可与识别码谐音或有含义连系的字元,则尽量予以调整,如“头”、“已”、“亦”的识别码均为“①”,“两”、“二”、“耳”、“尔”、“儿”的识别码均为“②”,“三”、“山”为“③”,“士”、“十”、“事”、“豕”、“史”、“世”、“失”、“巳”均为“④”,“勿”、“午”、“毋”、“乌”为“⑤”等,从而不丢弃任何有助于记忆和应用的规律性因素。
(三).领头字与副领头字分类定位表中,每一组字元所占据的同一键位格中设有两个小方格,前一小方格内为领头字,后一小方格内为副领头字,领头字均为高频字或较高频字,规定只击一键和一次空格键。因为40个领头字约占汉字平均使用频度的20%以上,所以在应用中可使平均击键次数明显地减少。副领头字在输入该字时,需干打空格键之前加打识别键“
”。领头字与副领头字一律参与组码(无可参与者,如们、个、地、他、学、第、的、和、报、吧、这,则不参与),在组码时领头字与副领头字不含任何识别码。在每组领头字与副领头字的后面各带领一列字元。因领头字与副领头字可不受字形分类规律的限制,所以,领头字与副领头字的设置可使其后面所带领的字元在形象和序列上更有规律,并基本上最大限度地避免了重码。
(四).字元定位歌借助歌诀来加速记忆,是我国人民所惯用的一种传统方法。
在分类定位表中,每一个基本键位格内最下一行为“字元定位歌”。其上句确切地表明了该键位的领头字和其后面所带领的字元,下句则表明了副领头字及其后面所带领的字元。同时定位歌还明显地提示了各字元所含识别码的序数。
在字元定位歌的编写中,对许多原来没有名称的字元或字元组列,均赋与了形象化而又表达确切的名称。这不仅使每个字元部件都有其表达名称,并可使人由记忆某一种字元名称而记住了一群成串的字元组列。各类“字元定位歌”的上、下句均为七字歌,而且有相同或相近的尾韵,读起来流利顺口。对照其上面字元的形状特点和排列规律而读,极富有直观形象感,有些还有一定的理性感,因而很容易被人记忆。对具有初中程度的一般青、中、少年人来说,熟读和背诵“字元定位歌”比一年级孩童背记算术“九九歌”还要容易,2~4天即可将全部“字元分类定位表”记忆在头脑中,再经过短时间的计算机操作练习阶段,则可应用自如,一劳永逸。我们通过对12岁小学生、22岁青年及35岁以上中年人的训练实践表明,只要将领头字与副领头字的键位记住了,便已将全部字元的所处键位及其识别代码记忆并掌握了。
三.由烦而求简,由“五化”到“五易”本方案的研究表明如果对汉字形成的自然部件或相交叉的笔画不予拆分,在键位有限(40个基本键)、重码率有限(2.5%以下)而又使字元的排列定位有较严整的规律的条件下,则这种三码拼形输入方案所需选用的字元数量是庞大的。
由于本方案将含有笔顺二意性的字及笔画相交叉的字形部件(如“刀”、“刃”、“乃”、“及”,“尹”“事”、“聿”、“隶”等)几乎尽皆列为字元,而且对130多个形象很相似的字元(如
、刂、

,卜、
,艹、廾,卩、阝,丶、
,氺、水、
,七、
,丿、
,东、
,冂、
,几、几,
,厶、
,乙、
,幺、
,匕、
,足、,亻、人、
,四、皿,曰、
,央、夬,雨、
,且、
,隹、
等等)亦均未予以合并,加上能够参与组码的领头字(高频字)以及少量非必需部件(整字大部件),故字元多达540个,这与目前较知名的四码及三码拼形方案相比。字元数量显得多了许多。此乃由于本方案的研究系以“由烦求简”为宗旨。一方面力求避免一般拼形编码的严重弱点,即笔顺二意性与拆分二意性,以使用户在应用时免于多费思考和周折;其次,将各种形象相似又略有差异的字元均按规律并列于特定的字元组列中,则系为了在不增加记忆量的前提下使这些字元都有形可寻。除此之外,体现上述“宗旨”的最主要方面,是在方案设计的各个环节上,均力求从心理学的探索入手,紧紧抓住关系到“五易”的形象思维规律,使其具体地体现于本方案的“五化”特点之中。其五化为形象化、规律化、整齐化、序列化、歌诀化,由此“五化”而带来了“五易”,即易学、易记、易用、易快、易检。因而,本方案所选用的字元虽多,但在学习、记忆和应用时却显得比较容易和方便,不仅使专业操作员易于掌握应用,而且在只有小学毕业程度的中、青、少年人群中亦较易于普及,故大大提高了方案的实用性和可普及性。
四.重码率与重码字的处理重码数143(出现于134组码元)其中一级字之间重码数9对一、二级之间重码数70对二级字之间重码数64对(其中有18对为不成字偏旁部件之间相重)重码率2.1%
重码字的处理按常规取码键入时,同码字一起出现于屏幕提示行,同时发出鸣报音响。此时,操作者观看提示行而选择键入。
本方案是一种便于盲打的输入法,除遇重码外,均不要求在提示行中显示汉字,如果显示亦与输入取码无关,所以,除听到“重码”音响信号外,是不必观看提示行的。因而,可大大减轻操作员的视觉负担。
五.取码规则(一).一般规则1.凡三个以上字元构成的字,直接取首、次、尾三码。不取任何识别码。
2.双字元汉字的取码凡尾码部件含有识别码者,则在取首尾码后加取尾码部件的识别码,如“理”取1d9⑥,而不管其首码部件是否含有识别码;凡尾码字元无识别码而首码字元含有识别码者,则先取首码及其识别码,然后再取尾码,如“列”取1b②2;如两个字元均无识别码,则只取两码,如“出”取4b6c,“另”取69c,“林”取2b2b,并以空格键结尾。
3.一般单字元汉字的取码凡含有识别码的单字元汉字,均加取其识别码,再以空格键结尾,如“雨”取9c①,“之”取7b①。
4.领头字与副领头字的取码领头字只取一码,以空格键结尾,如“的”取4c,“是”取5c;副领头字取一码后须加取“◎”,然后再以空格键结尾,如“页”取1b◎,“食”取8c◎。领头字与副领头字在参与组码时不含任何识别码,如“限”取2d3,“俄”取8d5b,“忠”取1b5。
5.“日”字的取码单独的“日”字及汉字的左侧偏旁为一个单“日”者均按其领头字的键位取9,组成汉字其余部位的“日”字或“曰”字则一律取9b(都不含识别码),如“晒”取91④,“时”取96d,“晶”取9b9b9b。
(二).特殊规则凡不成字的笔画或部件一般不含识别码,在单独输入时则以“◎”补足三码,如“丨”、“刂”均取2◎◎,“
”取4◎◎,“丿”、“勹”均取5◎◎;少数不成字部件含有“借用识别码”者,则于加取该识别码之后,再以“◎”补足三码,如“
”取7b①◎,“钅”取8b④◎。而均不以空格键结尾。
个别成字部件亦不含识别码,则与不成字部件同样对待,如“厶”取7◎◎,“幺”取7d◎◎,亦不以空格键结尾。
注所谓“不成字部件”指《现代汉语词典》未列为单字的简单笔画或偏旁。
六、笔顺与拆分规则(一).除一般按照常规笔顺(由左而右、由上而下、由外而内……)取码外,请注意以下两点规则1.对下面几个含有“先中间后两旁”笔顺的汉字,亦定为由左而右取码,即“北”取 二 丨 匕 “非”取 三 丨 三“严”取 一 丶 厂 “率”取 亠 冫 十2.对含有“凵、山、
、辶、廴”等五种半包围部件的字,则按照由内而外取码,如“
”取水 凵 “幽”取幺 幺山“道”取
自辶 “建”取聿 廴“陋”取阝 一
“断”取米
斤(二).凡能得到成字部件者,均按笔画较多的成字部件取码,如“巫”取工 人人 “敢”取
耳攵“最”取 曰 耳 又 “死”取 歹 匕(三).一个汉字的各部件之间如有笔画相争,以便形成其各自的成字部件者,按如下法则处理1.首、次、尾相争,则优先满足首、尾部件,使其成为一个笔画较多的成字部件,如“行”取 彳 一 丁,而不取 彳 二 亅“鼓”取 士 口 又,而不取 十 豆 又2.若汉字仅有两个部件,则遇有笔画相争时,优先满足首码部件成为多笔字,如“亍”取 二 亅(1c ② 7),而不取 一 丁(1 1d ③)。
“壬”取 千 一(5 ② 1),而不取 丿 士(5 1c ④)。
但不允许将双部件字改作三部件取码,如“容”只可取宀谷,而不可取穴 人 口。
(四).少数汉字在取码时需将笔画拆分或拆断,一并列出如下“万”取一 丿
“爿”取
厂丨“禹”取丿 中
“禺”取田
“庸”取广 肀用 “
”取囗 耳戈“羲”取 丷 王 戈 “见”取 冂 丿 乚“免”取 
儿 “鬼”取甶 儿厶注后两个字(免,鬼)仍按简化前的写法取码,较符合人们的视觉习惯,故本方案未列入“
”。
(五)、取码时可能出现困难或错码的字例如下“巷”取共 巳 “离”取文 凵
“扁”取户 冂艹 “囱”取
夕“夏”取 一 自 夂 “成”取 戊 “
”取一 丨
“卖”取十 乛头“孛”取十
子 “尤”取
乚“尬”取  乚 介 “叉”取 又 丶“堇”取廿
“垂”取
“芽”取艹 一
“芜”取艹 一乚“熏”取
灬 “秉”取
“噗”取 囗 业 夫 “亟”取 了 囗 一
本汉字系统已经在IBM-PC和长城-0520型微机上实现。可配以WORDSTAR软盘作文书编辑等用途。
就申请人所知,与本发明有关的参考资料提供如下1.王永民著《五笔字型计算机汉字输入技术》1985年10月 河南科学技术出版社2.姜期楷《汉字三键字形编码输入法》1986年元月 北京铁路分局广安门车站电算室
权利要求
本发明请求保护的范围如下1、微型计算机输入汉字时的键盘布局设计。其特征是通用微机中部字符键的每一排均以10个阿拉伯数字顺序命名,并使此40个基本键在不同排行的相同数字代码上下一一对应,使之排列成一个上、下、左、右序列严整的平行四边形。区别其各排键对应的数字代码的方法是在第二、三、四排各键的数字代码旁分别附以小字母b、c、d。其余七个“识别键”则以
、①、②、③、④、⑤、⑥按一定顺序命名。
2.《基本键位字元分类定位表》(本发明的核心部分)及《汉字十类字元歌诀定位电脑输入法》说明书。其特征是按字元的宏观形象或笔画结构特点(包括五种基本笔画),将字元分为十个类别,并按一定规律分组分列而予以定位(键位);每键位设一个领头字和一个副领头字;每键位编有一句表达明确而顺口流利的等长歌诀。《基本键位字元分类定位表》的格式序列与键盘的布局设计相一致。本方案总的特点是实现了汉字三码拼形输入法的形象化、规律化、整齐化、序列化与歌诀化,为用户提供了一个便于记忆和掌握应用的汉字形码三键输入方法。
专利摘要
汉字十类字元歌诀定位电脑输入法是一种三码拼形输入法,并有40个高频字为单码输入。本输入系统已在IBM-PC和长城-0520型微机上实现。目前已输入字数为国标一、二级6763字。并有装词能力,重码率为2.1%,一级字重码仅9对,且便于盲打。
本输入法的键盘布局及《基本键位字元分类定位表》的研创体现了方案的形象化、规律化、整齐化、序列化和歌诀化。由此“五化”特征可带来实际应用时的“五易”即易学、易记、易用、易快、易检,因而具有较好的实用性和可普及性。
文档编号G06F3/023GK86102803SQ86102803
公开日1987年2月25日 申请日期1986年4月24日
发明者郭世彰 申请人:郭世彰导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1