东方汉字字根编码法及东方汉字兼容外文编码键盘的制作方法

文档序号:6405307阅读:200来源:国知局
专利名称:东方汉字字根编码法及东方汉字兼容外文编码键盘的制作方法
技术领域
本发明为东方汉字字根编码法,它是一种新颖的形位编码法,以及依据这一方法设计的东方汉字兼容外文编码键盘。
汉字编码的科学性和实用性是我国目前要解决汉字信息处理,实现计算机汉化的关键和难点。为此,人们作出了大量的研究,如拼音法,音形法等,然而现有这些编码法要么重码太多,计算机识别困难,键入速度太慢,要么就是对计算机人员不光具有准确掌握汉语拼音知识的能力,同时还要具备分拆汉字的能力,这样就增加了学会使用的难度,上机实用性差,达不到汉字编码简练,键入速度快,实用易学,易普及的目的。
中国专利局已授予发明专利权的“优化五笔字型编码法及其键盘”。在我国汉字信息处理上确实向前迈进了一大步,尤其是它运用现有26个英文字母的标准键盘,根据汉字笔划顺划,字根结构,使汉字输入达到每分钟120-150个字,这对我国实现汉字信息处理现代化是一个很大的鼓舞,但正是由于它立足于利用原装26个英文字母键盘来对汉字进行信息处理,因而使得它对汉字上千个字根优化有限,就是在它优化的字根范围内,也不得不增加若干区分或转译层次,使其编码复杂化,如它的同位字根编码为“<键位代码>+<首笔代码>+<第二笔笔划代码>+<末笔笔划代码>”,因而带来汉字编码处理程序较长。又如在输入汉字前,首先要考虑汉字经分解后的字根数,对于超过四个字根或少于四个字根的汉字其编码程序的处理不一样,这样就要求操作者输入汉字时首先要把汉字拆分为若干字根,根据字根量,才能准确输入。
本发明提出的东方汉字字根编码法以及东方汉字兼容外文编码键盘,是本人经过八年多的努力探索研究而成的。东方汉字字根编码法是一种新颖的形位编码法。
其形-是指汉字的字根形和结构形。汉字的字根形有三种一笔独立的,如“丶、一、丨、丿、乙等”;几笔不交接的,如“八、冫、川、彡、巛等”;几笔交接穿插的,如“丁、十、日、月、中、母、册、又等”;汉字的结构形有九种独体形,如“大、目、木、口等”;夹形,如“坐、巫、兆等”;穿插形,如“秉、夷、吏等”;上下形,如“音、意、琴、晶等”;左右形,如“行、微、部、韶等”;半包围形,如“庆、屋、司、武、栽等”;开口形,如“凶、医、成、同等”;全包围形,如“园、因、团等”;载托形,如“运、爬、赶、题、处等”。
其位-是指字根在汉字结构中的位置次第。如“部”和“陪”字,均有三个相同的字根“立、口、阝”,因字根所处的位置不同,书写时,其先后次第也不同,而构成了两个不同读音,不同含意的字。又如“景”和“晾”字,不仅字根相同,书写时,其次第也相同,因其字根“日”所处的位置不同,结构形不同,而构成了两个不同读音,不同含意的字。再如“林”和“森”字,其字根只有一个相同的“木”,因其字根量的不同,结构形不同,而构成了两个不同读音,含意相近似的字。
字根是构成汉字的基本单元,相同或不同的字根之间相互并列、重叠、穿插、交接组合在一起,因其字根量的不同,字根组合方式不同,字根所处的位置不同,书写时的次第不同就是产生成千上万个汉字的基本原理和方法。
一、本发明就是在上述基本原理和方法的指导下,为实现汉字快速编码,在构字单元的选择上,采取了下列优化措施1.首先将1000左右的字根用于对8000多个汉字实施分拆统计,精选出构字能力强的字根,作为一个构字单元。
2.对8000多个汉字,按一般书写汉字的规律和习惯,根据字根所处位置的频率,优化出次第在前三位频率较高的字根,作为一个构字单元。
3.将含有四个以上字根的汉字,经过综合分析研究,选其部分汉字或两个以上的字根,作为一个构字单元,以便减少击键次数。
4.将人们比较容易分析为两个字根的部分独体字,不作为一个构字单元,分作为两个构字单元,减少其构字单元数量。
5.将汉字或字根的简写体或繁写体,变异体,变向体,均作为同一个构字单元。
这样就形成了“东方汉字字根编码总表”。(

图1)二、在字键和键盘的设计上,采取了以下几种手段1.将较常用的汉字分别选作每个字键的键名,并称作母字根。其余的汉字字根按其使用频率的高低分两行依次排列,这些字根称作子字根。并将这些汉字字根刻印在每个键帽上,有了明显的标记,就有利于见字编码和快速操作。
2.将音、形、意相近的汉字字根尽最大可能编入到同一个字键里,使其共用一个组配代码,便于实现联想或盲打。
3.为使每个字键帽上和整个键盘的清晰度更佳,将总表中的部分汉字字根的简写体或繁写体,变异体,变向体剔除不刻印在字键帽上,但应参加该字键组配汉字编码。
4.依据字根所处位置的次第频率和构字词能力的强弱以及手指击键功能的灵敏度,在键盘设计上体现科学、合理的布局,把键盘设计成60个键位,并分成左右两个区,共12行,10列,这样就可实现如下编码口诀“金木水火土,日月山石川。人民心目事,由己言二句。中国大开发,八方用力气。子女小习书,央(养)才非一夕。工厂干生产,重(种)禾长东西。门口见牛鱼,丰衣又足食”。从而大大提高人们的速记能力和击键速率,做到易学、易记、易用。若将编码键盘实体和编码方法印刷在一张纸上,使人人手中一份,便可以做到随时学,随时自我进行汉字编码模拟训练,这对计算机的普及和应用必将起到很大的推动作用。
5.为了达到一机多用,其外文字符在字键中的分布是西文字母按通用英文打字机键盘排列次序依次排列,其字符刻印在字键帽的左下角;俄文字母按通用的俄文打字机键盘排列(其中有4个字母略有改动),其字符刻印在字键帽的左上角;日文五十音图字符每段从左到右,每行从上至下依次排列,其平假名字符刻印在字键帽中的右上角,片假名字符刻印在字键帽中的右下角。同时将键帽上的汉文、西文、俄文、日文字符用四种颜色加以区别。
这样便设计成了“东方汉字兼容外文编码键盘”。(图2)三.汉字编码方法及汉字键入程序1.在汉字编码方法上,应按东方汉字字根编码总表中最大的字根进行编码。每个字键的键名,即母字根只击该键一次,作为该字的信息编码。其后的汉字,依排列次第分别连击二、三、四次键作为该字的信息编码。例如键名“西”其后字根是“雨、两、酉、、”,其键入程序是击一次键显示“西”,连击二次键显示“雨”,连击三次键显示“两”,连击四次键显示“酉”。后面两个字根不能直接键入显示,只作为提示须与其它字键中的字根相组配后才能显示所需的汉字。其它字键中的字根本身不成为其汉字都是这样处理。
2.若汉字是由两个以上字键中的汉字字根相组配,编码时,不论该汉字字根在键中的次第均作为同一个编码单元,只击该键一次。编码顺序按书写汉字的一般规律和习惯进行,即先上后下,先左后右,先外后里,先载托后乘载的原则。被分拆为两个字根的独体字,按书写第一笔的字根为先。例“秉”字,先击“禾”字根所在键,后击“彐”字根所在键。
3.由四个以上字根构成的汉字,一般只取前三个字根即可。若遇前三个字根取了后,屏幕提醒显示出二个汉字,若需前面的字,可不经处理继续进行操作,若需后面的字,即按选择键即可。若显示三个以上的汉字,则按所需的字,加击末尾字根所在键即可。例“裂”字,编码顺序是“一、夕、刂、衣”若只取前三个字根,得到的是“列、烈、裂”三个字,此时应加击“衣”所在键。
4.对汉字构成的词组、成语、短语、专用语、名人诗词等实现简码快速编码方法。由两个字或三个字构成的词组,则依汉字组词先后次序共取四个字根,第一个汉字须取前两个字根,若第一个字是一个字根,则取第二个字的前两个字根,若第二个字也是一个字根,则取第三个字的前两个字根。例“人民”,按一下“词语”功能键,然后击“人”、“民”所在键。“长城”则击“长”、“土、戊”所在键。“新生”则击“立、木”、“生”所在键。“说明”则击“讠、丷”、“日、月”所在键。“海南岛”则击“氵、”,“十”、“
”所在键。由四个汉字以上构成的词语均每字只取前一个字根。例“一箭双雕”则击“一、、又、冂”所在键。“中华人民共和国万岁”则击“中、亻、人、民、、禾、国、万、山”所在键即可。
本发明可对《新华字典》和《现代汉语词典》所收编的全部汉字进行编码,平均每字击键次数不到三次,一字最多只击四次(不含空位键)。重码少,便于取舍。
本发明可以建立一整套编码系列,如汉字信息码本,词汇信息码本,成语信息码本,专用词语信息码本,名人诗词信息码本,汉语主题词信息码本等。
由上述可以看出本发明提出的东方汉字字根编码法是一种适应能力较强的一种编码方法,其最大的优点是从汉字字形结构出发,完全符合汉字本质特征,而且直观,易学,实用。其键盘不仅是具有纯汉字信息处理功能,同时又具有国际上最广泛、最常用的几种文字信息处理功能。它是一种比较理想的国际通用键盘,必将发挥应有的作用。
权利要求
1.本发明为一种东方汉字字根编码法,其特征在于它是依据汉字的字根形,汉字的结构形和字根在汉字结构中所处的位置,次第及数量而对汉字及词语进行编码。
2.根据权利要求1所述的编码法,其特征在于依据这种编码方法对汉字分拆归并,择优精选出组合字词能力强,次第在前四位频率高的汉字字根,组成了《东方汉字字根编码总表》。
3.根据权利要求1和2所述的编码总表,其特征在于将编码总表中除去部分汉字字根的简写体,繁写体,变异体和变向体,均按编码总表将汉字字根分别刻印在相对应的60个字键帽上,这样就构成了《东方汉字兼容外文编码键盘》。
4.根据权利要求1所述的编码法,其特征在于将汉字字根形归纳为三种类型,即一笔独立型;几笔不交接型;几笔交接穿插型。每种类型包括若干笔画形态。
5.根据权利要求1所述的编码法,其特征在于将汉字结构形归纳为九种类型,即独体形;夹形;穿插形;载托形;上下形;左右形;半包围形;开口形;全包围形。每种类型包括若干结构形态。
6.根据权利要求1所述的编码方法,其特征在于编码顺序以书写汉字的一般规律和习惯,以书写第一笔的字根为先,即先上后下,先左后右,先外后里,先载托后乘载的原则进行。
7.根据权利要求1和3,其特征在于将60个字键划为十二行,十列,依次从中至两边,从下至上读为“金木水火土,日月山石川,人民心目事,由已言二句。中国大开发,八方用力气。子女小习书,央才非一夕。工厂干生产,重禾长东西。门口见牛鱼,丰衣又足食。”以每一个字键名形成编码口诀。
8.根据权利要求1和3,其特征在于外文字符在字键中的分布是西文字符按通用英文打字机键盘排列次序依次排列,其字符刻印在字键帽的左下角;俄文字符按通用的俄文打字机键盘排列次序依次排列,其字符刻印在字键帽的左上角;日文五十音图字符每段从左到右,每行从上至下依次排列,其平假名字符刻印在字键帽的右上角,片假名字符刻印在字键帽的右下角。每字键中将汉、西、俄、日文字符用不同的颜色加于区别,以便键盘一目了然。
9.根据权利要求1和3,其特征在于对汉字进行编码时,必须是按东方汉字字根编码总表中最大的字根进行编码。
10.根据权利要求1和3,其特征在于作键名的汉字,击该键一次作为该字的信息代码,其后的汉字则按字键中上行在前,下行接后的次第分别连击该键二、三、四次键作为该字的输入信息代码。若与其它字键中的汉字字根相组配编码时不论其汉字字根在该键中的次第,一律以该键名为代码,即只击该键一次作为该键中所有汉字字根的组配代码。
11.根据权利要求1和3,其特征在于对汉字进行编码时,按汉字一般书写规律和习惯,只取前三个字根即可。若屏幕上出现两个以上的汉字,经提示后,若需前一个字,可不必处理,若需后面的字,则取末尾字根。
12.根据权利要求1和3,其特征在于对《新华字典》和《现代汉语词典》所收编的全部汉字可以进行编码,码长不超过四个代码,平均每字击键次数不到三次,重码少易取舍,形成一套东方汉字信息编码本。
13.根据权利要求1和3,其特征在于增加汉字词语、西文、俄文、日文功能键,只须调档,即可按其所需文种进行编码。
14.根据权利要求1和3,其特征在于对汉语词组,成语,短语,专用词语,名人诗词实现简码快速输入检出,其编码方法是依词语的汉字次第分别取每字的一至二个字根进行编码。这样可根据需要建立词汇信息码本,成语信息码本,汉语主题词信息码本等,从而建立一整套中文编码系列。
全文摘要
本发明为《东方汉字字根编码法》以及依据这一方法设计的《东方汉字兼容外文编码键盘》。这一编码法主要根据汉字的字根形,汉字的结构形和字根在汉字结构中的位置,次第和数量对汉字进行编码,其键盘为60个字键,可对《新华字典》和《现代汉语词典》所收编的全部汉字进行编码,平均每字击键次数不到三次,为了使键盘具有多种功能,将西文、俄文、日文字符也布局在键盘上。采用这一新的汉字编码法使汉字编码更简练,操作直观,易学,输入键入率高,为我国汉字信息处理计算机化将起很大的作用。
文档编号G06F3/023GK1035013SQ8810976
公开日1989年8月23日 申请日期1988年12月29日 优先权日1988年12月29日
发明者李向东 申请人:李向东
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1