太极码(两笔字型)汉字输入法的制作方法

文档序号:6406654阅读:709来源:国知局
专利名称:太极码(两笔字型)汉字输入法的制作方法
技术领域
本发明是一种电脑通用汉字输入方法,属于电信技术领域中的中文信息处理技术。
(一)电脑汉字输入技术的现状汉字输入技术要解决的核心问题,是如何实现从汉字字形到机器内部码的转换。实现这一转换有两种途径一种途径是由计算机模拟人的智能自动识别汉字,如电脑图形识别与电脑语音识别等;另一种途径是由人识别汉字并将它转换成汉字输入码,通过键盘操作输入电脑,再由电脑将汉字输入码转换成汉字机内码,这是目前汉字输入电脑的主要途径。汉字编码方案,则是后一种途径面对的关键问题,专门解决汉字与汉字输入码之间的对应关系。
迄今为止,汉字编码方案已有数百种,在电脑上实施的也有数十种。这些汉字编码方案可以分为形码、音码、音形码、序号码四大类。所谓形码,就是把具有一定形状的方块汉字,按照某种规则加以拆分、排序、编码。简单地说,就是用拆分字元的方法来编码。根据形码汉字输入方案对字形拆分的不同层次,又可以区分为基本笔画编码和字元编码两类(请参阅《汉字终端技术入门》第50-51页周关兴编著人民邮电出版社1990年2月)。
本方案就是属于形码类中的字元编码方案。目前,属于这一类的汉字编码方案很多,其中比较典型的有“五笔字型汉字输入法”、“仓颉字母输入法”、“大众汉字拼形输入技术”、“HPX汉字拼形输入法”、“联合45-3汉字拼形输入法”等。形码方案的共同特点是直观性好,尤其适宜于看底稿输入的场合。它不受操作者文化程度高低和各地方言不同的影响,只需按字形击键输入汉字。而字元编码方案的共同特点是编码规则复杂,学习记忆量大;但由于它的汉字编码码组比较短,重码少、操作效率高、实用性好,所以,是当前形码方案的主流。
(二)本发明的目的目前已有的汉字编码方案,易学易记的则输入速度低;输入速度高的则难学难记。本发明的目的,就是要扬其长而避其短,同时达到既易学易记又输入快速这两个互相矛盾的目标,使汉字输入电脑这一难关得到真正彻底的突破,让各个层次的电脑操作人员,都能轻松愉快地、高效率地使用中文电脑,使中华民族的传统文化,成功地跨越汉字输入电脑这一障碍,从而永远自立于世界民族文化之林。

发明内容本方案是根据中国传统文化中的太极图原理设计的。其核心思想是大自然是和谐的,任何错综复杂的事物总可以划分为两个既对立又联系的方面,并且无限可分;而汉字,就是这样一个矛盾的统一体。
总的原则,是将每个汉字看成一个已经制作好的、静止的刚性结构物。无论是分类、拆分、取码,都遵循这一原则。
本方案包括纯太极汉字输入法、太极汉字输入法、太极数汉字输入法三种汉字输入方式。它们通过约定的控制键相互切换。这三种输入方式完全基于同一构思,并遵循相同的取码规则。本文中未特别指明的,均指纯太极汉字输入法。
本方案以国标基本集(GB2312-80)中的一、二级汉字作为编码字集,插入五千个常用词组,并留有很大的扩充余地。
一、汉字字元的分类和布局1、基本笔画的分类。将多姿多态的汉字基本笔画划分为直画和折划两大类。直画包括横、竖、撇、捺、点、提等无急剧转折的笔画;折画包括折、弯、钩等有急剧转折的笔画。即不计笔画的长短、方向,只分曲直。因此,无论将笔画怎样翻转,其曲直的根本属性永不改变。这正如太极图,无论从哪个方向看,都是阴阳分明。
在此基础上,将汉字字元划分为类字元(只含直画)和折画类字元(含有折画)两大类,并分别分配到键盘字母键区的左、右两部分(或称两仪),分别与操作者的左、右手对应配合,从而形成左右太极图式。
2、笔画组合形式的分类。将错综复杂的笔画组合形式划分为相合(字元的全部笔画都不相交)和相交(字元的全部笔画都参与相交)两大类。
在此基础上,将汉字字元亦划分为相合字元与相交字元两大类,并分别分配到键盘字母键区的第一行和第二行,从而形成上下太极图式。
至此,经过两次对分,键盘字母区的第一行、第二行被划分为四个具有不同特征的区域(或称四象)。左上为直画相合区;左下为直画相交区;右上为折画相合区;右下为折画相交区。
汉字字元按照其本身特征,分别归纳到上述四个区域中的某一个区域。少数不符合条件的汉字部件,则须经过拆分后再归纳。
3、字元的归位。在上述按照字元的笔画形态和笔画组合形式分区的基础上,再行分位。即将每个区域按照从字母键区中线往边缘的顺序依次划分位号1、2、3、4、5。各个区域的字元,按照其笔画数,对号归位。
至此,每个太极码字元都很自然地有了自己唯一对应的键位。每一个键位,都隐含着字元的笔画形态、笔画组合形式、笔画数三重信息。实质上,键盘字母区已经成为了一张三维矩阵表。
4、特殊键的处理。
(1)在键盘字母区的中心部位,安排象征太极图阴阳鱼鱼眼的“口”(G键)和“□”(H键)。
“口”和“□”的区别是,定义“口”为方框内部全空的字元,否则皆为“□”。
(2)A键为学习键。在输入一个汉字的部分编码之后,再按A键代替尚未输完的部分编码,则可依次列出相关的(编码的前段与上述已输入的部分编码相同的)所有汉字及对应编码,供学习或选字之用。同时,可进行“的”字的一键输入。
5、汉字字元键位的判断方法。凡是不在上述第四款规定之内的字元,均按照上述第1、2、3款的规则归到键位;不符合条件的汉字字元(一般是既含相交笔画又含不相交笔画的字元)则应进行拆分,使拆分后的部件成为符合本方案规定的太极码字元,再行归位。
例如人,直画类、不相交、两画,键位在字母键区的左边、第一行、第2位;
丰,直画类、相交、四画,键位在字母键区的左边、第二行、第4位;
心,折画类、不相交、四画,键位在字母键区的右边、第一行、第4位;
也,折画类、相交、三画,键位在字母键区的右边、第二行、第3位;
开,拆分为一、廾,“一”在字母键区左边、第一行、第1位;“廾”在字母键区左边、第二行、第3位。
二、取码规则1、取码顺序先高后低;先左后右;先外后内。本方案的取码顺序原则,是将汉字看成已经写成的字,进行静态取码。即按照汉字中各字元所占据的位置依次取码。因此,取码顺序与汉字的书写顺序有的相同,有的不同。例如由,丨、日;甲,日、丨。
2、码数。每个汉字最多取四码。刚好四码的,依次输入即可;不足四码的,加按一次空格键;超过四码的,只取第一、二、三码和末码。出现重码字时,根据提示按数字键选字,并允许重复选字,不选字则按空格键或回车键即可;如果需要的是提示行的最左边的字,可以不按数字键,继续往下输入即可。
汉字的左偏旁和字头,最多取两码。超过两码的,只取首、末码。例如鲜,鱼字旁略去中间的田字而取首、末两码。
键位字元,可以一键输入,也可以拆分后取码输入。
3、拆分原则尽量先取笔画数较多的字元;尽量不拆分相交的笔画;尽量保持日、月、口、□字元的完整性(主要是指日、月、口、□字元与其它笔画相交的情形)。
4、取码规则歌取大不取小,拆合不拆交;
日月口□求完整,左旁字头两码挑;
每字最多取四码,键位字元一键敲。
5、示例中,TH;华,RJF;大,FT;地,ZK;美,EZFT。
三、高频字的处理。
1、“的”字独占A键,只须按一次A键即可,不必加按空格键。
2、其余各字母键均有一个与键位含义相同的高频字,只须按该键后加按一次空格键即可输入。
3、出现重码字时,高频字总是出现在提示行的最左边,此时不必按数字键,继续往下输入即可。
4、高频字的具体分布情况,请参阅附图。
四、词组输入方法。
1、二字词,每字取第一、二码。
2、三字词,第一字取第一、二码,第二字、第三字均只取首码。
3、四字词,每字各取首码。
4、超过四码的词,只取第一、二、三字和末字的首码。
5、词组输入在单字输入状态下进行,不必切换。
五、太极汉字输入法在上述纯太极汉字输入法的基础上,第三行字母键(底区),从左至右依次安排“土”、“火”、“水”、“木”、“金”、“日”、“月”共七个字元,就构成了太极汉字输入法。取码规则与纯太极汉字输入法完全相同。
太极码(两笔字型)键盘字元布局歌上合下交,左直右折;
笔画排序,五行日月;
口□居中,万事大吉。
六、太极数汉字输入法在前述纯太极汉字输入法的基础上,将各列字母键的字元分别归并到相应的数字键上,就构成了太极数汉字输入法,即用数字键输入汉字。但字母键区左半部分字元的排列顺序,改为按笔画数从左端开始排列。即数字1-5分别表示1-5画直画类字元;数字6-0分别表示1-5画折画类字元。取码规则完全与前述内容相同,仅在出现重码字时,取消首字默认的约定。
示例春,419;天,121;来,34;了,7。
(四)本发明的优点目前已有的数百种汉字编码方案,各有优缺点。但大体上是易学易记的则输入速度慢,而输入速度快的则难学难记。本方案的最大优点,就是既易学易记,又输入快速,同时达到了这两个互相矛盾的目标。
一、本方案最显著的特征,是汉字字元在键位上的分布遵循极为简单而直观的规律,且富于哲理。因此1、记忆量特别小,只有一般字元编码方案的几十分之一。所以,根本用不着贴键帽标签来帮助记忆和查找;可以大大缩短培训周期;较长时间不用也不容易遗忘;普遍适合于各种层次、各种年龄、各种职业的人员学习、使用。专职人员乐其速,兼职人员乐其简,便于在大范围内普及和推广。
2、字元容量大、通用性强,并且可以在不改动方案的前提下,自动扩充新出现的字元。
3、字元的分布规律,特别有利于配合操作者的手法和指法。左手为直画类,右手为折画类;第一行为相合(不相交)类,第二行为相交类;第三行为哲理类;字元笔画数则与手指自然序数一致。因此,容易培养和形成操作者的条件反射,有利于提高输入速度,减少输入差错。操作者经过适当训练,就会感到得心应手、舒适自然。
此外,字元的分布符合各个手指合理负担的原则,因而操作者不易感到疲劳。
二、本方案的取码顺序,是根据字元在汉字中的静态位置,而不是按书写汉字时的动态顺序,所以直观性强、规范性好,每个汉字的取码顺序都是唯一的,不因书写习惯的差异而不同。
三、本方案没有采用一般字元编码方案的“末笔字型识别码”,因而输入方法简单、便捷。虽有少量重码,但实际击键次数并不多(码组短、重码少);对于词组输入,影响更小。而操作者脑力劳动强度明显减轻,不易疲劳。权衡利弊,得多失少。
四、本方案中的太极数汉字输入法,首次采用了数字键字元编码(现有的数字键汉字编码方案,都是采用的基本笔画或复笔笔画编码)。由于字元分布合理,在最多只取四码的情况下,仍然使重码率大幅度降低。多数单字没有重码;有重码的,重码字一般只有几个,显示在第一页。因此,输入速度比现有的数字键汉字输入法高得多。同时,字元的笔画数与数字相对应,极为直观。


说明书附图,是一张本方案的字元布局示意图。本方案利用通用标准键盘(西文小键盘)上的字母键(或数字键)输入汉字。字元的分类和布局原则已如前述。下面对附图的图面作些说明。
一、各键位上标明的成字,为高频字。除“的”字只须按一次A键外,其余各字均须在按相应键之后加按一次空格键。
二、各键位上标明的成字,同时也是相应键位上的字元之一。
三、第一行和第二行字母键各键位所隐含的字元,并未在附图中全部列出,而是按照前述“字元的分类和布局”之原则,自动归位。
(六)实施一、本方案已在微机上实现。
二、汉字编码示例(纯太极输入法、太极输入法、太极数输入法)大江歌罢掉头东,FTEERGURPFTUKROFRFTKRFTCERGURPZUKRNFRFTKR213325720217829222182邃密群科济世穷;
IREIIOTIUGEDTRRFERFRLTIRJIREIIOTIUGEDTVRFCRFRLTIRJ8238891875331222322291827
面壁十年图破壁,RHWIFFTFRDTHTJRRGJJIFFTRHWIFZFRDTHTJRRGJJIFZ26482212231617225778221难酬滔海亦英雄。
JRRTITRREWHRERHERURDRHFURTJRRTITRRCWHRCRHERURDRHFURT7221812234623263272326272权利要求
1.纯太极汉字输入法本发明是一种电脑通用汉字输入法。本发明的主要特征是将汉字的基本笔画仅分成直画和折画两大类;将汉字的笔画组合形式仅分成相合(不相交)和相交两大类;通过两次对分把汉字字元划分为四大类,并分别分配到标准键盘字母区第一、二行的四个区域;然后,按照字元的笔画数依次排列在相应区域的键位上。在字母键区的中心部位,安排口(G键)和囗(H键)两个字元。A键为学习键,同时可进行“的”字的一键输入。因此,除A、G、H三个键位外,第一、二行字母键的每个键位,都隐含着字元的基本笔画形态、笔画组合形式、笔画数三重信息;每个字元都有与其唯一对应的键位。
2.在第一款内容的基础上,增加金、木、水、火、土、日、月共七个字元,并安排在字母键区的第三行,就构成了太极输入法。
3.在第一款内容的基础上,把字母键区的字元按列数分别归并到相应的数字键上,就构成了太极数输入法。
全文摘要
太极码(两笔字型)汉字输入法,属于电信领域中的中文信息处理技术。它首次解决了电脑汉字输入的简易性和高效率的矛盾。其主要特征是,将汉字基本笔画仅分成直画与折画两大类;将笔画组合形式仅分成相交与不相交两大类;字元在标准键盘上的布局遵循极为简单而直观的规律,记忆量特别小;同时,码组短、重码少、效率高、实用性强。本发明适合各种层次的电脑操作者使用,适宜于在大范围内普及和推广。
文档编号G06F3/023GK1076039SQ92107138
公开日1993年9月8日 申请日期1992年9月17日 优先权日1992年9月17日
发明者戴顺天 申请人:戴顺天
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1