首音表形码汉字编码方法及其键盘的制作方法

文档序号:6336852阅读:400来源:国知局
专利名称:首音表形码汉字编码方法及其键盘的制作方法
技术领域
本发明属于计算机中文信息处理技术领域,涉及一种音形码汉字编码方法及其键盘。
目前,各种各样的汉字编码方法有很多,常见的有拼音码、五笔字型、表形码、认知码、自然码、沈码、钱码等。这些编码方法都有自己的许多优点,但也存在很多缺点,有的受汉语方言的影响,在使用中受到很大的限制,有的重码率很高,有的记忆量很大,有的部件与键盘的对应关系规律性较差,有的不根据汉字的书写顺序取码,不规范,有的要考虑汉字的字型结构,不易掌握,有的编码规则缺乏一贯性,容易产生歧义,总的来说,现有技术中的各种编码方法存在着“好学难用”和“好用难学”的缺点。
本发明的目的是提供一种符合国家语言文字规范、反映汉字字音信息和字形信息内在联系的,克服现有技术上述缺点的,记忆量小、规律性强、简码多、重码少、易学好用的汉字输入编码方案。
本发明的目的是这样来实现的提供一种汉字计算机输入的编码方法,采用国际标准键盘,汉字的第一码一般取其汉语拼音的首字母,第二、三、四码根据大部件优先的原则,按照书写顺序分别取首部件、次部件和末部件作为代码。键名字取二码,成字部件、非成字部件、二部件汉字取三码,其他汉字、词组、符号取四码。
本发明的基本笔画,根据《印刷通用汉字字形表》,分为横(一)、竖(丨)、撇(丿)、点(、)、折(乙)五种,分别用与其形似的数字键或字线键“1”、“I”、“J”、“,”、“Z”作代码。
本发明的基本部件分为键名字、成字部件、非成字部件、单笔画部件,根据一定的记忆规律安排在“0-9”十个数字键、“A-Z”二十六个字母键和“,”、“。”、“;”三个符号键上。
本发明单字的编码方法为键名字取二码,第一码为“V”,第二码为该键名字所在键位的代码;成字部件取三码,第一码为该汉字的汉语拼音的首字母,第二码和第三码均为它们所在键位的代码;二部件汉字取三码,第一码为该汉字的汉语语拼音的首字母,第二码为该汉字的首部件代码,第三码为该汉字的末部件代码;三部件或三部件以上的汉字取四码,第一码为该汉字的汉语拼音的首字母,第二码为该汉字的首部件代码,第三码为该汉字的次部件代码,第四码为该汉字的末部件代码。
本发明词组的编码均取四码,编码方法为二字词的第一码为第一个汉字的汉语拼音的首字母,第二码为第一个汉字的首部件代码,第三码为第二个汉字的汉语拼音的首字母,第四码为第二个汉字的首部件代码;三字词的前三码分别取每个汉字的汉语拼音的首字母,第四码为第三个汉字的首部件代码;四字词每码分别取每个汉字的汉语拼音的首字母;多字词每码分别取第一、二、三字和最后一字的汉语拼音的首字母。
本发明符号的编码方法为大多数符号取其习惯叫法的各个字的汉语拼音的首字母作为代码,不足四码的,第四码用“;”作代码,常用数字、制表符、英文字母,则用一个字母键加上一个或二个相对应的数字键或字母键来编码。
对于繁体字的输入,只要配上繁体字库,同样可以用本发明的编码规则。
本发明同时提供了本发明的汉字计算机输入编码方法所用的键盘以及部件键位的键盘设置。
为了便于理解本发明的技术方案,下面详细描述本发明的汉字编码方案和键盘设置的原理和具体方法。
1、输入键盘国际标准键盘。
2、定义键位数字键“1、2、3、…、0”;字母键“A、B、C、…、Z”;符号键“,”、“。”、“;”;空格键。
3、键盘设置

图1为本发明的键盘设置图,图中第一排左边的数字、字母、符号为键名,右边的汉字为一级简码,第二、三、四排为本发明的所有部件,其中第二排左边第一字为键名字。
(1)基本笔画的键盘设置本发明根据《印刷通用汉字字形表》,将笔画分为五类,即横、竖、撇、点、折五种笔画。其它笔画的归类是“提”视为“横”,“捺”视为“点”,“竖钩”视为“竖”,除“竖钩”外,所有带转折的笔画,均视为“折”。这五类笔画分别用“1”、“I”、“J”、“,”、“Z”作为代码,见下表
(2)基本部件的键盘设置基本部件分为键名字、成字部件、非成字部件和单笔画部件五种,大部分部件都定义在与其形似的数字键、字母键和符号键上,个别部件按读音、首笔画笔形或取意定义在相应的字母键上,下表给出了本发明的所有部件(包括单笔画部件)所定义的键位,并注明了部件与键位的关系。
4,取码顺序(1)按书写顺序。除了“国”字型和“巨”字型汉字以外.其它一切汉字均按《现代汉语通用字表》规定的书写顺序取码。如丰 三 丨无 二 儿毛 丿 二 夫 二 人果 日 本专 二 乙 、三部件以上的汉字按书写顺序取首部件,次部件、末部件。如
雾雨 丿 力屿 山 一 一躯 丿 丨 乂凑冫 三 大竖 丨 丨 立经 纟 乙 工“国”字形和“巨”字形汉字,作为一种变通,参照大多数编码方案的取码顺序,即从外到里的顺序。如国 囗 王 、困 囗 木团 囗 一 丿巨 匚 乙 一区 匚 ㄨ医 匚 矢(2)大部件优先。在取码过程中,如有大部件取大部件,没有大部件取小部件,没有小部件取单笔画部件。如“主”的首部件取“亠”不取“、”,“用”的首部件取“月”不取“ ”。
“产”的首部件取“立”不取“亠”,“路”的首部件取“足”不取“口”。
“练”的次部件取“ ”不取“一”,“应”的次部件取“ ”不取“、”。
“审”的次部件取“曰”不取“丨”,“瑰”的次部件取“白”不取“丿”。
“衅”的末部件取“十”不取“丨”,“锋”的末部件取“十”不取“丨”。
“朕”的末部件取“大”不取“人”,“医”的末部件取“矢”不取“大”。
在取末部件时,如果某些笔画已被前面的部件所用,则末部件应当取较小的部件。如“半”取“丨”不取“十”,“丰”取“丨”不取“十”。
“关”取“人”不取“大”,“朱”取“小”不取“木”。
本发明的取码必须严格按照书写顺序,不是一气呵成的部件,必须按笔画折分。如
5、单字的编码规则(1)键名字的编码键名汉字有39个,它们是
一二三四五六七八九十田之山女干禾雨上口尸金水月寸日廿及竹土广马大厂米目门木宀石这些键名字均取二码,第一码为“V”,第二码为这些汉字所在键位的代码,如“三”字的编码为“V3”,“金”字的编码为“VA”,“门”字的编码为“VN”。
(2)部件的编码部件汉字均取三码,第一码为该汉字的汉语拼音的首字母,第二码和第三码均为它们所在键位的代码。如
(3)二部件汉字的编码二部件汉字均取三码,第一码为该汉字的汉语拼音的首字母,第二码为该汉字的首部件代码,第三码为该汉字的末部件代码。如
(4)三部件或三部件以上汉字的编码大量的汉字都属于这类汉字,这类汉字均取四码,第一码为该汉字的汉语拼音的首字母,第二码为该汉字的首部件代码,第三码为该汉字的次部件代码,第四码为该汉字的末部件代码。如
(5)偏旁部首的编码
偏旁部首的的编码规则与单字的编码规则基本相同,所不同的是,偏旁部首的编码如不足四码,最后一码用“;”作代码。由于偏旁部首是从某单字演变过来的,所以,偏旁部首的读音根据原单字的读音,偏旁部首的编码见下表
(6)多音字的编码对于多音字,本发明采取多组编码的方法。如“长”编码为“CJ1 ,”或“ZJ1,”“参”编码为“CUXJ”或“SUXJ”“弄”编码为“N5XI”或“L5XI”“阿”编码为“AP1I”或“EP1I”(7)繁体字的编码对于繁体字,编码规则与简体字的编码规则一样。如“撥”编码为“BFZR”“東”编码为“D1G3”“将”编码为“JZ1F”“巽”编码为“YQH8”6、词组的编码规则词组包括双字词、三字词、四字词以及四字以上的多字词,无论多长的词组,其编码均为四码,编码规则如下(1)双字词的编码双字词的第一码为第一个汉字的汉语拼音的首字母,第二码为第一个汉字的首部件代码,第三码为第二个汉字的汉语拼音的首字母,第四码为第二个汉字的首部件代码。如革命GHMA 心情XUQO艺术YHSM 太阳TXYP(2)三字词的编码三字词的前三码分别是每个汉字的汉语拼音的首字母,第四码为第三个汉字的首部件代码。如计算机 JSJM 太平洋 TPYS国务院 GWYP 年轻人 NQRA(3)四字词的编码四字词的编码分别为每个汉字的汉语拼音的首字母。如天气预报 TQYB汉字编码 HZBM中国人民 ZGRM一国两制 YGLZ(4)多字词的编码多字词的编码分别为第一、二、三字和最后一字的汉语拼音的首字母。如中央电视台 ZYDT喜马拉雅山 XMLS毛泽东思想 MZDX中华人民共和国 ZHRG
7、符号的编码规则(1)习惯叫法为二字的符号的第一码为其习惯叫法的第一个字的汉语拼音的首字母,第二码为其习惯叫法的第一个字的汉语拼音的次字母,第三码为其习惯叫法的第二个字的汉语拼音的首字母,第四码为“;”。如“,”逗号编码为“DOH;”“。”句号编码为“JUH;”“;”分号编码为“FEH;”“、”顿号编码为“DUH;”“”冒号编码为“MAH;”“?”问号编码为“WEH;”(2)习惯叫法为三字的符号的第一、二、三码分别取其习惯叫法的每个字的汉语拼音的首字母,第四码为“;”。如“—”破折号的编码为“PZH;” “!”感叹号的编码为“GTH;”“≈”约等于的编码为“YDY;” “≠”不等于的编码为“BDY;”“☆”空五星的编码为“KWX;” “★”实五星的编码为“SWX;”(3)习惯叫法为四字的符号,分别取其习惯叫法的每个字的汉语拼音的首字母。如“《”左书名号的编码为“ZSMH” “》”右书名号的编码为“YSMH””’”左单引号的编码为“ZDYH” “‘”右单引号的编码为“YDYH”“≥”大于等于的编码为“DYDY” “≤”小于等于的编码为“XYDY”(4)常用数字的编码“(一)、(二)、(三)、…、(十)”;“①、②、③、…、⑩”;“I、II、III、…、XI、XII”等常用数字的第一码分别取“U、O、I”为代码;第二码、第三码分别以它们所对应的数字键为代码。如“(一)”的编码为“U1” “(十)”的编码为“U0”“①”的编码为“O1”“⑩”的编码为“O0”“I”的编码为“I1” “XII”的编码为“O12”(5)制表符的编码制表符的编码取二码,粗制表符的第一码为“,”,第二码为制表符的代码;细制表符的第一码为“。”,第二码为制表符的代码。九个制表符的代码分别为“1、2、3、…、9”九个数字键。如下表 如
的编码为“,1”
的编码为“。1”
的编码为“,2”
的编码为“。2”
的编码为“,3”
的编码为“。2”(6)英文字母的编码英文字母的编码取二码,大写英文字母的第一码为“,”,第二码为它所对应的字母键;小写英文字母的第一码为“。”,第二码为它所对应的字母键。如“A”的编码为“,A”“a”的编码为“。A”“B”的编码为“,B”“b”的编码为“。B”8、简码的设置本发明设置一级简码、二级简码和三级简码共三级,对于有简码的汉字,既可以用简码输入,也可以用全码输入。
一级简码一般用该汉字的汉语拼音的首字母作为代码,其中“这、以、有、为”分别用“O、I、U、V”作为代码,其输入方法为“代码加空格键”,现列表如下
一级简码的汉字可以规纳为下面一句话你爱人为了和平而没有去出发,小个的我在这就是不可以要他。
“1、2、3、…、0”十个数字和“;”、“,”、“。”、“/”四个符号视为一级简码,其输入方法与一级简码的输入方法相同。
本发明设置的二级简码汉字有700多个,常用数字和制表符也视为二级简码,这样,本发明的二级简码(包括符号)约有800个左右。见下表世纪码二级简码表1 2 3 4 5 6 7 8 9 0 Q W E R T Y U I O P A S D F G H J K L ;Z X C V B N M ,。Q 求凄秦黔球亲切情圈 群劝侵秋 请器屈全清腔抢晴其气签起庆强奇区前取曲权穷确W 万无王文 翁丸悟围维巍娃往委雾误味卫钨温腕物晚芜务 坞袜毋 威烷 问枉完碗E 恶儿恩 峨娥俄讹鄂洱 扼遏 鹅 厄 耳尔 额R 融韧瑞瓤软 蠕绕 如任认嚷阮人染 热 荣入 壤褥弱 辱燃 然 容T 屯天堂酮 童 惕团统退她体透台谈听陶途汤脱提题藤条筒趟痛通太厅糖眺同桃头跳Y 与于艳要玉意疑欲 亿因约岩又优移允业员院余油用摇易英匀 越应也友原益眼饮样义跃U ㈠㈡㈢㈣㈤㈥㈦㈧㈨㈩I ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩO ①②③④⑤⑥⑦⑧⑨⑩偶 呕沤 藕欧P 平 耪飘琵旁 贫 怕畔 帕 凭 霹评品陪铺派朋排迫萍牌篇培庞皮 爬判盼赔朴 破A 哀 懊岸 傲矮 凹啊阿 澳肮按暗蔼爱 熬袄 盎 安碍S 事示少署琐市输颂 索思绳岁始使私霜说虽属舍深胜势时世生算声社书杀所数睡色树实碎D 到动当帝东爹朵懂迪缔逮对得短怠点吨队锻洞胆打电董敌等地度导达盾道耽多杜定跌F 否夫丰罚珐方辅分风愤蜂纷峰妇份非吩防锋法服扶 芳复符赴福飞奋反烦 负枫富矾G 更规光 工高轨公 古国给岗观供稿 该贵隔钢港肝过果共各管赶疙改狗感关耿刚根官跟H 或魂辉黑环毫轰 贺怀回红幌好很和毁话号 会活航护旱花乎簧坏祸孩狠后火 贿杭户磺J 救进举贾玖就较 加惧界经即艰集积舅记叫阶今江脚接景基句简教疾已狡近精具解机家距K 可开 酷恐刻快困 恳 刊科 肯哭 渴胯扩颗苦看筐考康孔夸匡烤眶阔棵空砍L 来凉劣罗理立连 力怜累绿灵姥例利雷论另屡领流脸拉里劳乱篮老礼录龙乐料联鲁林良路;Z 政专掌罪珠主转 杂真蛀组崭蚤做种震战中展众治肿指最著自筑者祝子左质着职争枝字足X 下形学西现新辖 旭性虾细寻戏行秀心些响限叙消胸掀星昔向笑喜席习希欣翔县象想宣硝C 才次常醋 产车岔 朝虫纯崇叉传称参此吃除从沉船持昌苍长策城初翠存成差聪财材穿础V 一二三四五六七八九十田之山女干禾雨上口尸金水月寸日廿及竹土广马大厂 日门木宀石B 百冰帮罢班部比爸边勃蚌编崩 便稗霸北别辟镑波般把白薄备笔表被巴奔 并 闭本宝泵N 耐凝 酿弄南男纳 努您 能诺呢尼拿泥脑牛暖孽年疟那奈匿逆聂农柠宁碾M 面末 默玫盲 忙蚂绵帽妈们秒霉谋吗陌命满脉摸明莫每 埋麻民猛贸美睦名模密码Q W E R T Y U I O P A S D F G H J K L Z X C V B N Mq w e r t y u i o p a s d f g h j k l z x c v b n m注本表竖排的代码表示二级简码的第一码,横排的代码表示二级简码的第二码。
本发明对大部分的国标一级汉字都设置了三级简码,没有简码的一级汉字只有500多个。
国标二级汉字不设简码。
9、万能键的设置本发明将键盘上的[?]键作为万能键使用,“-”键为向前翻页键,“=”键为向后翻页键,利用万能键和翻页键可以实现对汉字的模糊查询。
10、本发明的特点(1)部件少。大多数汉字输入方法所选取的部件都在100个以上,有的是200多个、300多个,本发明所选取的基本部件在100个以下,因为部件少,故记忆量也就小。
(2)部件与键盘的对应关系规律性强。本发明将基本部件有规律地安排在39个键位上,大部分部件与键盘上的字母、数字、符号非常相似,看到部件马上能想到代码,所以,部件的代码也非常容易记忆。
(3)取码顺序的一贯性。本发明只根据书写顺序和大部件优先的原则取码,不需要考虑笔画之间的关系,也不需考虑部件之间的关系。由于取码顺序的一贯性,故本发明的汉字拆分也比较简单。
(4)无特殊规定。大多数汉字输入方法都有很多的特殊规定,如有的规定“我”的最后一笔为“丿”,有的规定“栽、载”等字的偏旁取底部,本发明无特殊规定。
(5)不需识别码。有些汉字入方法需要考虑识别码,既要考虑最后一笔的笔画,又要考虑汉字的间架结构,给初学者带来很大的困难。
(6)重码少。大多数汉字输入法在一级汉字中的重码有几十组,甚至几百组(有的虽然实现无重码,但记忆量很大),本发明在一级汉字中的重码不超过10对,是目前常见输入法中重码率最低的编码方案。
(7)简码多。本发明将国标一级汉字中的绝大多数汉字都设计了简码,没有简码的汉字只有500个左右。
(8)本发明虽然要用数字键,给操作带来一定的不便,但由于简码多,实际上不影响输入速度。
(9)本发明虽然要用读音信息,但在取音时仅取汉语拼音的首字母,对方言区的人及发音不准的入来说也适用。
(10)本发明最大的特点是规范,除了“国”字形和“巨”字形汉字外,一切汉字均按《现代汉语通用字表》的书写顺序取码,有多笔部件的取多笔部件,没有多笔部件的取单笔画部件,能引导人们正确书写汉字,特别适合标准化教学。
本发明的效果本发明符合国家语言文字规范,能反映汉字字音信息和字形信息的内在联系,克服了现有技术的许多缺点,记忆量小,规律性强,简码多,重码少,易学好用,达到了预期的目的。
权利要求
1.一种汉字计算机输入的编码方法,采用国际标准键盘,由键盘设置、取码顺序、编码规则三部分组成,其特征是一般汉字的编码由汉字的汉语拼音的首字母、首部件代码、次部件代码、末部件代码组成。词组的编码由汉字的汉语拼音的首字母和首部件代码组成。
2.根据权利要求1所述的编码方法,其特征是键盘设置分为基本笔画的键盘设置和基本部件的键盘设置。(1)基本笔画的键盘设置本发明将笔画分为五类,即横、竖、撇、点、折,这五类笔画分别用“1”、“I”、“J”、“,”、“Z”作为代码,见下表 (2)基本部件的键盘设置基本部件分为键名字、成字部件、非成字部件和单笔画部件五种,大部分部件都以与其形似的数字、字母和符号作代码,个别部件按读音、首笔画笔形或取意选取代码,见下表
3.根据权利要求1所述的编码方法,其特征是取码顺序根据“按书写顺序”和“大部件优先”原则。(1)按书写顺序。a、除了“国”字形和“巨”字形汉字以外, 其它一切汉字均按《现代汉语通用字表》规定的书写顺序取码。b、三部件以上的汉字按书写顺序取首部件、次部件、末部件。c、“国”字形和“巨”字形汉字,作为一种变通,参照大多数编码方案的取码顺序,即从外到里的顺序。(2)大部件优先。a、在取码过程中,如有大部件取大部件,没有大部件取小部件, 没有小部件取单笔画部件。b、在取末部件时,如果某些笔画已被前面的部件所用,则末部件应当取较小的部件。c、取码必须严格按照书写顺序,不是一气呵成的部件,必须按笔画折分。
4.根据权利要求1或2或3所述的编码方法,其特征是单字的编码规则为(1)键名字取二码,第一码为“V”,第二码为这些汉字所在键位的代码。(2)部件汉字取三码,第一码为该汉字的汉语拼音的首字母,第二码和第三码为它们所在键位的代码。(3)二部件汉字取三码,第一码为该汉字的汉语拼音的首字母,第二码为该汉字的首部件代码,第三码为该汉字的末部件代码。(4)三部件或三部件以上的汉字取四码,第一码为该汉字的汉语拼音的首字母,第二码为该汉字的首部件代码,第三码为该汉字的次部件代码,第四码为该汉字的末部件代码。(5)偏旁部首的的编码规则与单字的编码规则基本相同,所不同的是,偏旁部首的编码如不足四码,最后一码用“;”作代码。(6)多音字,采取多组编码的方法。(7)繁体字的编码规则与简体字的编码规则一样。
5.根据权利要求1或2或3所述的编码方法,其特征是词组的编码规则为(1)双字词的第一码为第一个汉字的汉语拼音的首字母,第二码为第一个汉字的首部件代码,第三码为第二个汉字的汉语拼音的首字母,第四码为第二个汉字的首部件代码。(2)三字词的前三码分别是每个汉字的汉语拼音的首字母,第四码为第三个汉字的首部件代码。(3)四字词的编码分别为每个汉字的汉语拼音的首字母。(4)多字词的编码分别为第一、二、三字和最后一字的汉语拼音的首字母。
6.根据权利要求1所述的编码方法,其特征是符号的编码规则为(1)习惯叫法为二字的符号的第一码为其习惯叫法的第一个字的汉语拼音的首字母,第二码为其习惯叫法的第一个字的汉语拼音的次字母,第三码为其习惯叫法的第二个字的汉语拼音的首字母,第四码为“;”。(2)习惯叫法为三字的符号的第一、二、三码分别取其习惯叫法的每个字的汉语拼音的首字母,第四码为“;”。(3)习惯叫法为四字的符号,分别取其习惯叫法的每个字的汉语拼音的首字母。(4)常用数字的第一码分别取“U、O、I”为代码;第二码、第三码分别以它们所对应的数字键为代码。(5)制表符的编码由“,”、“。”和9个数字键组成。(6)英文字母的编码由“,”、“。”和它们所对应的字母键组成。
7.根据权利要求1或4所述的编码方法,其特征是本发明设置一级简码、二级简码和三级简码共三级,对于有简码的汉字,既可以用简码输入,也可以用全码输入。一级简码一般用该汉字的汉语拼音的首字母作为代码,其中“这、以、有、为”分别用“O、I、U、V”作为代码,其输入方法为“代码加空格键”,现列表如下
一级简码的汉字可以规纳为下面一句话你爱人为了和平而没有去出发,小个的我在这就是不可以要他。
全文摘要
本发明是一种音形码,采用国际标准键盘,一般汉字的编码由汉字的汉语拼音的首字母、首部件、次部件、末部件代码组成,词组的编码由汉字的汉语拼音首字母和首部件代码组成。该方法只考虑汉语拼音的首字母和汉字的书写顺序,无需考虑翘舌音、韵母、笔形、笔画数、结构、字义和识别码,编码简单,具有符合国家语言文字规范、记忆量小、规律性强、重码少、易学好用等优点。
文档编号G06F3/023GK1343924SQ0012917
公开日2002年4月10日 申请日期2000年10月2日 优先权日2000年10月2日
发明者秦荣富 申请人:秦荣富
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1