汉字明码输入法的制作方法

文档序号:6575670阅读:2147来源:国知局
专利名称:汉字明码输入法的制作方法
技术领域
本发明与计算机的汉字输入方法有关,是采用汉字的笔画进行编码的方法来输入汉字,是一种形码输入法。
现有的汉字输入法,绝大多数都是针对国标GB2312-80中的6763个汉字进行编码的,对于GBK大汉字库的输入法则很少,而且,多因输入规则复杂或生僻汉字读音难,实际使用很困难。
本发明的目的是提供一种编码信息少而易取的、编码规则简单而易于掌握的形码输入法,用来既能解决GBK大汉字库的汉字输入,又不影响GB2312-80中的汉字及其词汇的正常输入。
本发明是这样实现的1、汉字的特点第一个特点汉字是由若干笔画组合而成的。我们把笔画归纳为五类,并用它的“类号”来代表第一类(1)从左向右的“横”;从左下向右上的“挑”;第二类(2)从上向下的“竖”;第三类(3)从右上向左下的“撇(点)”;第四类(4)从左上向右下的“捺(点)”;第五类(5)所有带“折”的笔画。这样,任意两个笔画可构成11、12、13......53、54、55共二十五种组合。我们用这些笔画组合的第一笔的类号作为排号,第二笔的类号作为位号,将这些组合分为五排、每排五位,安排在键盘的25个英文字母键上(见附图
),并用该字母作为相应组合的代码;剩余的一个英文字母“N”则作为单笔画的代码。
第二个特点是大多数汉字都是由一些汉字部件(包括成字部件)“拼合”而成的,形成某种“层次”结构。按照它们拼合的相对位置关系,我们把左右或上下拼合的称为“排列型”,内外拼合的称为“包含型”。而不是按上述方式拼合的或非拼合的,则称为“单一型”。
2、汉字刘码输入法的编码规则如下(1)汉字的编码由三个代码组成。
对拼合而成的汉字,我们按层次把它划分为两部分排列型汉字用“有字取大字,无字取首层”的规则来定出第一部分。例如,“京”字,从上至下共分为三层,一、二层不构成一个字,因此第一部分就取第一层“亠”;“熹”字则应取“喜”为第一部分,不能取“吉”或“士”。对包含型汉字则从构成“包含”的笔画处,划分为“包”和“被包”两部分,含首笔的为第一部分。在拼合而成的汉字中,若遇到与前一层无关的独立单笔画,则划入下一层。例如,“旧”字,首笔为“丨”,应与“日”一起算作一层;而“旦”字的末笔“一”划入下一层后,则单独作为第二部分。
把字分成两部分后,取第一部分的头两笔和第二部分的头两笔及尾两笔(当第二部分的笔画少于四笔时,头两笔及尾两笔可重复取用同一笔画),共得三个“两笔”,其对应的三个代码即是该字的编码。但在包含型的字中,有首、末笔同在第一部分的,如“国、栽、式、区”等字,为保证按笔顺取码,我们将该字的头两笔和尾两笔作为一码和三码,而第二个代码则规定为“N”。
单一型的汉字取头两笔和尾两笔,得到第一个和第二个代码。我们规定第三个代码同第二个代码。
这样,输入三个码后就可在“提示窗口”中查找所需汉字,并“按号”输入该字(同码字超过十个时需翻页)。汉字的排列顺序是,国标GB2312-80的一级汉字在先、二级汉字在后,而GBK中的其他字则排在最后。
除一级汉字外,每个字后都带有按双拼(代码见附图)标注的读音。
(3)词组的编码是依次取每个字的首码,每词四码。不足四码时,再用最后一字的二码、三码顺序补足。
(4)简码每个代码都可安排十个以该码为首码的“常用字”,作为简码字;任意两个代码的组合也可安排十个以该组合为前两码的“常用词组”,作为简码词。这样就有大约250多个简码字和2500多个简码词。
(5)用“?”作为查找单字或词组的查询键。
本发明有如下优点1,编码用的汉字信息只用了笔画和字型,代码种类少,而且提取规则简单;采用的“两笔组合”按五排、五位规则地分布在键盘上,一目了然,所以易学、易用,较好地解决了大汉字库的汉字输入问题。
2,本输入法的编码方案,若用来作为汉字字典的排序方案,就不会再有读不出音或分不清部首而出现的“难检字”问题,加之非常用字均带有读音,更增加了实用性。这样,可将汉字的输入方法与查字方法合二为一,更有利于这种方法的推广应用。
3,由于采用了“窗口显字,按号输入”的方法,不但安排了250多个简码字和2500多个简码词,而且,因整个编码容量扩大了10倍,能够安排更多的词组,保证各种词组都“应有尽有”,还为用户自己增添需要的专用词组创造了条件,使“以词组输入为主”成为可能。这些都大大地提高了汉字的输入速度。另外,一级汉字基本上都排在首页,对一般文章的输入不会因字库加大而感到不便。
本发明的《代码表》如下
本发明的附图刘码代码图(附后)
本发明的实施例如下1,单字“中”--PJJ;“国”--PNG;“一”--NNN;“行”--EHM。
2,词组“中国”--PPNG;“计算机”--ATJQ;“编码规则”--ZKHP;“刘码输入法”--GKMW。
3,简码A--被,之,该,证,请,让,谁,评,祝,论;KJ--需要,成功,不要,大概,破坏,区域,成本,有机,大事,成都。
权利要求
1,汉字刘码输入法,其特征在于汉字编码规则如下(1)汉字由若干笔画组合而成,我们根据笔画书写的运笔方向,将笔画分为五类,并用类号表示第一类(1)从左向右的“横”,从左下向右上的“挑”,第二类(2)从上向下的“竖”,第三类(3)从右上的左下的“撇(点)”,第四类(4)从左上向右下的“捺(点)”,第五类(5)所有带“折”的笔画,这样,任意两笔可构成11、12、13......53、54、55共二十五种组合,再以第一笔的类号为“排号”,第二笔的类号为“位号”,分五排五位有规律地安排在键盘的25个英文字母键上,并以相应字母为代码,剩于一个字母“N”则作为单笔画的代码,大多数汉字是由一些部件(包括成字部件)“拼合”而成的,我们根据拼合的相对位置,把这些汉字分为按左右或上下进行拼合的“排列型”和内外拼合的“包含型”,不是按上述方式拼合或非拼合的汉字则称为单一型,(2)单字的编码规则是一字三码,对拼合而成的汉字按拼合方向分成两部分,排列型汉字按“有字取大字,无字取首层”的规则定出第一部分,而包含型汉字则从构成包含结构的笔画处将字分成“包”和“被包”两部分,其中含首笔的为第一部分,然后取第一部分的头两笔和第二部分的头两笔及尾两笔,相应的三个代码即是该字的编码,但包含型字中首、尾笔同在第一部分的,为保持正确的笔顺,我们取头两笔和尾两笔分别作为第一码和第三码,而第二码规定为“N”,对单一型汉字则取头两笔及尾两笔,得到第一、第二码,而第三码规定同第二码,除一级汉字外,每个字后都带有双拼注音(见代码表),(3)词组的编码规则是先依次取每个字的第一码,每词四码,不足时,用最后一个字的二码、三码补足。
2,根据权利1所述的方法,其特征在于将汉字按国标GB2312-80的一级汉字、二级汉字和GBK中其他汉字的顺序排列,当同码字若超过十个时,则用翻页的方法查找后面的汉字。
3,根据权利要求1和2所述的方法,其特征在于将汉语拼音的韵母经过优化组合后,按分区、分组的方式有序地安排在键盘的26个英文字母键上,得到韵母的双拼代码,除zh、ch、sh分别用i、u、v作代码外,其余声母则与英文字母键一一对应。
4,根据权利要求1和2所述的方法,其特征在于用“?”键作为查询键,可代替2、3、4码查找单字或词组。
5,根据权利要求1所述的方法,其特征在于每个代码都安排了十个以它为首码的“简码字”,每两个代码组合都安排了十个以该组合为前两码的“简码词”。
6,根据权利要求1和2所述的方法,其特征在于代码表如下
全文摘要
本发明为针对GBK大汉字库的汉字《刘码》输入法,是按汉字字型来取笔画进行编码的形码输入法。其编码规则如下(1)把笔画分为五类,任意两笔共可构成25种组合,按笔画的类号分为五排、五位,安排在键盘的25个英文键上,并以该字母为代码(见附图)。(2)汉字的编码为“一字三码”。按汉字拼合的层次结构,将汉字分为“排列型”、“包含型”和“单一型”。前两种字型应“自然地”划分为两部分,然后取第一部分的头两笔和第二部分的头两笔及尾两笔,即可得该字编码的三个代码。而单一型汉字则取头两笔和尾两笔,得到一、二码,第三码同第二码。除一级汉字外,每个字后都带有双拼注音。(3)词组的编码规则是顺序取每一个字的第一码,一词四码,不足时用最后一个字的二码、三码顺序补足。(4)安排有250多个用一键的“简码字”和2500多个用两键的“简码词”。
文档编号G06F3/023GK1458566SQ0211374
公开日2003年11月26日 申请日期2002年5月16日 优先权日2002年5月16日
发明者刘永安 申请人:刘永安
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1