一种图形文字的输入方法及其键盘的制作方法

文档序号:6601559阅读:270来源:国知局
专利名称:一种图形文字的输入方法及其键盘的制作方法
技术领域
本发明属于文字信息处理领域,更准确地说,本发明涉及一种图形文字的输入方法及其键盘。
利用计算机进行文字识别信息处理时,首先要解决字形输入这个问题。对于字符较少的拼音文字,这早已不成其问题。对于字数众多、结构复杂的汉字,这个问题则比较复杂。迄今为止,我国已有数百种汉字编码键盘输入方案,其中有电报码一类无理编码,也有利用汉字音、形、义等信息特征的有理编码。利用汉字字形结构信息进行编码,抓住了汉字作为一种图形文字的本质特征,因而是方案最多,又最易为人们普遍接受的一种方法。
常见形码都要确立汉字的结构层次,一般认为汉字具有笔划、字根、单字三个层次,且大都遵循拆分单字、离析字根、处理笔划三个步骤。不同形码的差别主要在于具体处理手段上的差异。不少形码都列出一个字根表,不同形码的差别就集中反映在字根的数量及分类的区别上。事实上,汉字平均笔划数在十二划左右,常用汉字都比较简单,拆成字根后往往发现所需编码信息过少,以致重码率高,于是想方设法补加区别信息,使得使用起来很不方便。
我们目前所使用的文字是书写年代的遗物,其字形结构保留着太多的书写痕迹,对文字的电脑识别极为不利。文字从书写年代进入电脑时代,单靠优秀的编码方案显然是无法从根本上解决问题的,文字的电脑化显得愈来愈重要,我们的电脑操作人员要花费大量的时间学习文字的输入是一种巨大的社会浪费。我国文字改革已取得了巨大的成就,但我们应该看到,汉字简化后虽去掉了大量的视读冗余信息,却并非完全为汉字进入电脑服务,不少汉字结构显得过于简单,给编码工作带来一定困难,而且不少汉字部件并非真正意义上的规范化,因此有必要进一步规范汉字字形结构。
本发明的目的在于提供一种用一套有规律的简单图形作为图形文字字形结构信息特征单元来输入各种图形文字的方法,根据本方法的思想可以进一步对汉字字形进行规范化工作。
本发明的另一目的在于提供一种可以输入各种图形文字的键盘,利用该键盘,还可以输入各种合乎规范的图形符号。
本发明认为将一些有规律的简单图形作为图形文字字形结构的基本信息单元,可使数量众多、结构复杂、形状各异的图形文字及各种常用符号用这些简单图形来表示,按照一定的规则输入这些简单图形就可以完成相应的图形文字的输入。根据本发明提供的原理和方法,还可以创制一种完全合乎规范的文字符号和图形。
本发明将横竖直线段构成的最基本的图形称作字元。字元可以这样得到在一个正方形格子上,两个八卦符号垂直相交构成八卦图元,其阳爻所构成的图形称作字元。字元是一种相当规范的字符,结构简单,容易识别。通过归纳,字元具有这样十九种基本结构 日田。前三种只具一种方向,称一维字元,后十六种具有两个方向,称二维字元。
经过研究发现,拉丁字母与八卦图元基本结构间存在着对映关系A→ 、B→ 、C→ 、D→ 、E→ 、F→ 、G→ 、H→ 、I→ J→ 、K→ 、L→ 、M→ 、N→ 、O→ 、P→ 、Q→ 、R→ S→ 、T→ 、U→ 、V→ 、W→ 、X→ 、Y→ 、Z→ 。其中I表示向上或正向,R表示向下或反向。L、M、N、S、P、U、V、W各表示一定方向或旋转角度。如果用M表示将图形顺时旋转90°的话,则EM可表示将E旋转至 状态,依此我们可以输入处于八种位置状态的拉丁字母。同样原理我们可以输入某个字符旋转后的八种状态。
八卦图元不仅可以旋转变化,产生各种方位图形。还可以通过衍变产生各种复杂的字符。字元上的直线段被某一字元替代时可产生一阶字符,如“十”可衍变生成 丰、井、中、申、甘。一阶字符同样可衍变出二阶字符、高阶字符,如 可衍变出册、世、我。新字符中的替代字元可依次称作一阶字元、二阶字元、高阶字元。将字符中的字符字元特征和替代字元等结构信息提取出来,可完成该字符的输入如汉字“重”,其字元衍变依次为王→→重,一阶、二阶字元依次为三、日,输入“王、三、日”三个字元可完成该字符的输入。较为复杂的是由字元“一、 川、 ”等一维字元衍变出来的字符。如汉字“胡”,其衍变顺序可认为是 → → → ,分析起来比较麻烦。一般地,可将该字符拆分成几个独立的部件,即通常所说的字根。按照书写顺序,“胡”可拆分成“十、口、月”或“古、月”等形式,不同拆分意味着输入方法的不同。本方案将“胡”拆分成“十、口、月”,是因为这些部件更接近字元状态。本方案对字根有严格的定义,所谓字根是指若干互不接触的笔划构成的具有一维字元特征的组合,如二、三、川,或若干笔划互相接触且具有二维字元特征的组合,如口、日、月可见“古”不是本发明所称的字根,而“甲”则是一个字根。本发明根据字根的字元特征对字根进行分类,在汉字中,常见下列字根。
1、--丨丿 2、=二 亠 3、 刂 八丷几 4、 三氵彡六 兴 5、 巛 忄 心小川6、 厂尸  7、 斥斤8、 爪瓜9、 氏10、 乙 11、 刁 12、 刀 乃 刃13、 14、  15、 匕 16、 17、 18、 19、 20、 21、 22、 丁 丆 丌亻 丁兀丫个下甲歹 23、 皿 业上且止由丘曲24、  卜片及人25、 26、 ①十 ナ 九力七巾中申丹甘内电身 大火②扌牛串 丈女 木 夫③丰 車(车)柬 本 ④ 廾艹也世册我⑤ 卅 ⑥27、 于 千下予 午币开果牙雨两更年耳夭平矢乎 28、土土士主 虫出 生29、 30、 31、 工 亚西酉正 32、 33、 王壬五里重禺 34、 35、 阝 勹 几门 36、 臼37、匚匚 巴 38、 39、 月夕匀勺40、 (甘)41、 匹 42、 ( 巴)43、 44、 山45、 巨 46、彐 (雪)47、 用 48、 (凶)49、 (区) 50、 (丑)51、 口凹凸 52、 日曰目(母)53、 四54、 田(因国)上面列举了常见字根及其字元特征。可以看出,绝大多数字根均含有横竖直笔划,与其字元特征极其相似。在汉字中,只有少数字根全由斜笔构成,其基本结构为八、人、 ,实际上是某些规范字根旋转所得,本发明将其归入相应字元中。
汉字结构之所以复杂,不在于笔划的变化,而在于大多数汉字是由大大小小的字根拼成的。有的汉字字根多,有的字根少。根据书写的顺序,我们将汉字分解成上述字根的组合。例如解 用刀牛 放亠 乂然后输入字根所对应的字元即可输入该汉字。
有些字根本身就是一个汉字,它们称作独元字,如重、里;有些字根不能独立成字,如字根“ ”等。根据本发明对图形文字的认识,也可以将这些字根输入电脑。字根均由字元衍变而来,具有字元、一阶字元、二阶字元等信息特征。逐层输入信息单元即可,如输入字元“王三日”即可输入字根“重”。
根据本发明提供的方法,可以对汉字进行排序。我们先规定字元的先后顺序,将字根按字元、一阶字元、二阶字元的先后可排出顺序,然后可将汉字按字根的先后排出顺序。
八卦字元由两个八卦符号垂直相交构成,八卦符号可用二进制数字表示,同样我们可用二进制来表示八卦字元,用1表示阳,用0表示阴,根据从上至下,然后从左至右的顺序,可以给出其二进制编码。如干110010、土011010,输入0、1构成的代码即可输入相应的八卦字元。
八卦字元上的阳爻都有确定的位置,按照从上至下,然后从左至右的顺序,我们规定阳爻可能存在的位置依次为1、2、3、4、5、6,这样字元可用阿拉伯数字表示,如于125、土235。对于由八卦字元衍变出的字符,我们可以指出一阶、二阶字元所在位置。如“重” 2曰2。
将字根结构信息字元化后,有利于汉字输入电脑。同时我们还应看到,汉字中不仅存在横竖直笔,而且存在不少斜笔、曲笔、折笔,虽然可以相应地字元化,但总有些不规范的地方,而且个别字还造成了重码。如“千、干、于、乇”,其字元特征相同。其中“于、乇”有一阶字元,易区别,而“千”、“干”则较难区别,必要时可指出斜笔位置,如“千”可用字元干和数字1表示。
汉字楷书化后,字形已相当规范,但其它字体的汉字和其它文字却存在着大量曲笔和折笔,经过研究发现,图形文字中存在的十类基本笔划的结构特征恰好对应着十个阿拉伯数字的书写特征。即1对应各种长度和方位的直笔,如一丨丿2对应各种顺时针起笔的笔划,如 3对应各种顺时针起笔的笔划,如4对应各种反时针起笔的笔划,如 5对应各种反时针起笔的笔划,如6对应反时针起笔的多卷笔划,如 7对应各种顺时针起笔的笔划,如 8 9对应顺时针起笔起笔的笔划,如 0对应各种封闭的图形 我们将十个阿拉伯数字叫做笔元,各代表一类笔划或图形,将一个图形文字拆分成笔划的组合,输入笔元信息即可输入该图形文字,一般地,将图形文字的字元特征与笔元特征相结合,我们可以输入该图形文字。如乃 b o必要时可指出笔元所替代的字元部分或笔元所在位置,如乃 b o 这样我们可以用字元与笔元输入各种笔划构成的图形文字。
在一个键盘上,我们既可以输入字元又可以输入笔元,利用这样的键盘我们可以输入各种图形文字。
十个阿拉伯数字对应着10个笔元,26个拉丁字母对应着十六个字元的基本二维结构和8个方位指示命令及独元字组合的基本形状和一对正反向、横竖向、直曲笔转换的指示命令符号。利用标准小键盘我们就可以输入各种形状的图形和字符。例如我们约定I表示直笔、R表示曲笔、M表示左右结构的汉字或表示将字元顺时针旋转90°,那么,根据格式字型十字元+旋转角度+I或R可输入某个图形文字。如MEMIFMR则可输入图形 。当然按照一定的规则可输入更复杂的图形。总之可用10个数字表示10类笔元,拉丁字母中16个字母表示二维字元;8个表示有一定含义的八卦符号;2个表示一对相反或相对概念的符号,在键盘上标识它们,可以通过击键的方式输入各种字符,此外必要时还可增加相应的键位,例如空格符,一组指示字元上直笔位置的数字键和其它形状字元的键位。
本发明具有的优点在于1、它有一定的理论基础,本发明建立在下列哲学思想的指导上。
“大哉乾元,万物资始;至哉坤元,万物资生;天地感而万物化生;天地相遇,品物成章”;“道生一,一生二,二生三,三生万物,万物负阴而抱阳”。
2、字元结构符合电脑对图形文字的要求,本发明可以较好地协调“电脑的中文化”与“中文的电脑化”之间的矛盾,可为进一步规范图形文字提供一定的参考。
3、本发明处理汉字时,思路清晰,字根分解合乎逻辑,有一定思维能力的人一学就会,而且由于字根定义确切,易于分类。
4、它有利于图形文字计算机处理时内码、外码可保持对映关系。
由于汉字的处理是中文信息处理的重点,下面结合汉字的具体情况提供一种较好的实施途径。
汉字的情况比较复杂,对于独元字不少形码处理时信息不够,而对于合体字,则出现信息冗余,如何在一种方案中既能很好处理合体字,又能方便地输入独体字,关键在于字根的灵活处理上。
对于独元字,其字型可用字元“一”表示,如中、申、西、酉。对于合体字,其字型可用“”表示。
二表示上下结构的汉字,例古、吕、品、咒 表示左右结构的汉字,例如、胡、泊、杉三表示上中下结构的汉字,例章、复、合 表示左中右结构的汉字,例湖、例合体字的字形还可细分,但一般取上面四种字元形式作为合体字的字型信息即可。
对于字根较少的汉字,有必要将字型信息、一阶字元信息、二阶字元甚至笔元信息提取出来,如“九”,其字元信息为“十”,字型信息为“一”,一阶字元 、笔元“2”,输入“十 2一”即可输入汉字“九”。
常用的键盘键位并不多,无法使每个字元、笔元都占用一个键位,同时汉字中并不存在全部字元,而有的字元所属字根相当多,有的字元所属字根则很少甚至没有,这时可以采用常用字元和一阶字符标识字母键,非常用字元则酌情处理。在第一排字母键上可以安排“田日口 十个字符,在第二排字母键上安排“  ,在第三排字母键上安排“王干工丁土十 ”,在其它键位上还可安排些非常用字元,必要时可对键位进行调整。
上述二十六个码元分别代表的字元如下,田田,日日、 土, 一 则分成五类一阶字符十、权利要求
1.一种图形文字的输入方法,其特征在于将一套有规律的简单图形作为图形文字形状结构的基本信息单元,从图形文字中将其提取出来,按照一定的规则编成代码,输入代码即可完成图形文字的输入。
2.按照权利要求1的方法,其特征在于所述单元至少包括一组八卦字元,八卦字元是指两个八卦符号垂直相交时所构成的图形,其中由阳爻构成的图形称作图形文字的字元,字元反映了图形文字形状结构的基本特征。
3.按照权利要求2的方法,其特征在于所述字元可衍变出新的字符,新字符具有多层字元信息,可以将新字符转换成多个字元的集合。
4.按照权利要求2的方法,其特征在于所述八卦字元可用二进制数字表示,输入0与1即可完成八卦字元的输入。
5.按照权利要求2的方法,其特征在于可以指出八卦字元中各直笔的确定位置,对于字元衍变所得新字符,可指明替代字元的位置。
6.根据权利要求2的方法,其特征在于拉丁字母与八卦字元存在内在联系。
7.按照权利要求1的方法,其特征在于所述基本信息单元还包括一组阿拉伯数字,十个阿拉伯数字作为笔元,对应着图形文字中十类基本笔划。
8.一种用于输入图形文字的键盘,其特征在于包含用图形文字字形结构信息单元标识的键,通过击键,可完成图形文字的输入。
9.根据权利要求8所述的键盘,其特征在于所述键盘包含八卦字元标识的键。
10.根据权利要求8所述键盘其特征在于所述键盘包含笔元标识的键。
全文摘要
本发明属于文字信息处理技术领域,将图形文字输入计算机,可以按照一定的规则从图形文字字形结构上提取基本信息单元;八卦字元和阿拉伯数字笔元,输入这些信息单元的集合,即可将图形文字输入计算机,汉字作为一种特殊的图形文字,可根据其结构特点重新标识键盘,本方案可给出一种汉字的排序检字法。
文档编号G06F3/023GK1132367SQ95110690
公开日1996年10月2日 申请日期1995年3月31日 优先权日1995年3月31日
发明者胡敬禹 申请人:胡敬禹
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1