汉字数码输入法及其数字键盘的制作方法

文档序号:6330417阅读:792来源:国知局
专利名称:汉字数码输入法及其数字键盘的制作方法
技术领域
本发明利用数字键盘输入汉字及其词语,属于汉字信息处理领域。本发明的基本思路是将汉字拆分为汉字部件,再将汉字部件拆分为拼形字母,即将全部汉字看成是由拼形字母空间排列组合而成的,从而发现了汉字字形的基因。将二十一个拼形字母分别放在二十一个键位上,已经很好地解决了汉字的输入问题。然而,由于互联网和无线通讯的迅速发展,以及电脑微型化和嵌入式的必然趋势,要求汉字输入必须在数字键盘完成。因此本发明人经过了大量的方案设计和测试分析,终于发现了汉字拼形字母在数字键盘上的分布规则,从而使众多汉字的各位数字代码十分均匀地分布在各个数字键上。将汉字及其词语按照编码规则转换为数码后,就可以十分方便地利用汉字数码在数字键盘上输入汉字及其词语了。
本发明是基于本发明人另一项发明《汉字数码》(专利申请号01107250.4)的基本原理,专门用于信息处理和通讯设备输入汉字及其它符号,并在以下五个方面取得重大突破一是用拼形字母符号分别表示二十一类拼形字母,便于在数字键盘上标注和识记;二是将码元减少至九个数字(1~9),保留三个键用作输入汉字必不可少的空格键、回车键和删除键;三是取消了汉字笔形的长短区别,使每个拼形字母对应一个数字键;四是给出了拼形字母在数字键盘上的分布规则,使拼形字母的数码转换做到了有规律可循;五是提出了新的补码规则,将汉字及其词语的最长码位控制在六位以内。
本发明基本上实现了汉字编码的规范化、数字化和无重码的要求
一是规范化。本发明在汉字部首的选取、汉字部件的确定、拼形字母的组合等方面,要求尽量符合现行的国家语言文字规范和标准,在此基础上制定了《拼形字母表》、《汉字部件数码规范》、《汉字部首数码规范》、《汉字字干数码规范》、《常用汉字数码规范》和《常用汉字词语数码规范》;二是数字化。本发明不仅实现了汉字及其词语的全数字编码,而且对标点符号、数学符号、英文字母和其它常用符号,都采用了数字编码;三是无重码。本发明将汉字及其词语混合编码,容纳了国家标准《信息交换用汉字编码字符集基本集》(GB2312-80)全部6763个汉字、《汉字键盘输入用通用词语集》(GB/T15732-1995)中99%的词语(共四万多条)、《信息处理用现代汉语常用词词表》中95%的词语(共两万七千多条)、《现代汉字词典》和《新华词典》中的绝大部分词语,以及世界上两百多个国家、地区的全名、简称及首都名、著名城市名、中国32个省、市、自治区全名、简称、两千多个地区级、县级行政区名、名山大川、著名旅游胜地名、中国56个民族名、中国主要山峰名、高原名、盆地名、平原名、江河名、湖泊名、岛屿名和宗教名、中外著名人物名、著名产品名等,通过补码和简码的处理,全部实现了无重码编码。
本发明方案如下一、拼形字母拼形字母表字母符号— 丨 / \  ∧字母名称横 竖 撇 捺 折横 折竖 折撇 折捺∥   丆 离横 离竖 离撇 离捺 连横 连竖 连撇 连捺 × 囗交横 交竖 交撇 交捺 封口上述拼形字母符号代表的意义列表如下
附表一是上述拼形字母形状的举例说明(摘要)。
二、数字键盘设定汉字笔形数(简称形数)和笔位数(简称位数)如下形数横笔-1 竖笔-2 撇笔-3 捺笔-4位数折笔-1 离笔-2 连笔-3 交笔-4拼形字母在数字键盘上按下列规则分布
根据上述规则将拼形字母标注在数字键盘上,一并标注常用标点符号和功能键如下图
三、汉字拆分为汉字部件规则1、连笔、交笔、折笔、口笔不可拆,离笔可拆。明——拆分为部件“日”、“月”
仪——拆分为“亻”、“丶”、 “乂”码——拆分为“石”、 “一”霜——拆分为 “目”2、离笔属固定组合的,不可拆。
洲——拆分为“氵”、“州”(“氵”和“州”不可拆)氘——拆分为“”、 (其中 和 不可拆)念——拆分为 “心”(其中 和“心”不可拆)巡——拆分为“巛”、“丶”、 (其中“巛”不可拆)3、部件内部有散笔画的,不可拆。
优——拆分为“亻”、“尤”(其中“尤”不可拆分为“尢”、“丶”)振——拆分为“扌”、“辰”(其中“辰”不可拆分为“厂”、“一” 蚤——拆分为“叉”,“虫”(其中“叉”不可拆分为“又”、“丶”)除——拆分为“阝”、 (其中 不可拆分为“于”、 4、除折笔、口笔外,按笔顺拆分。
甚——拆分为 “”载——拆分为“土”、 圆——拆分为“囗”、“口”、“冂”、 鄙——拆分为 “口”、“阝”附表二是常用汉字部件拆分规范表(摘要)四、汉字部件拆分为拼形字母规则
1、按笔顺提取部件的前两个笔划构成拼形字母,以此类推。
正——拆分为“”、“”、“一”隹——拆分为“亻”、“亠”、 “”半——拆分为“丷”、 “丨”卡——拆分为“”、“”、“丶”2、部件中的钩笔(含笔画乚)、折笔、口笔单独提取为拼形字母。
毛——拆分为 “一”、“乚”民——拆分为 “一” 叟——拆分为 “ 丨”、“又”西——拆分为“一”、“口”、“丿”、“”附表三是汉字部件数码规范(摘要)四、汉字编码规则独体字数码由前五位数码和最后一位数码组成。
力——数码取73( 丿)成——数码取8742(厂 兼——数码取116614(丷一十 合体字数码由两位部首数码和四位字干数码组成。
江——数码取2151( 一)蔡——数码取623911(十丨丿 一一)想——数码取659342(十 口 (一)汉字部首的数码提取规则1、部首是一个部件的,取该部件第一个和最后一个拼形字母数码。
排——部首是“扌”,部首数码取11(一 剽——部首是“刂”,部首数码取22(丨 )亿——部首是“亻”,部首数码取1(亻)2、部首是多个部件的,取第一个部件和最后一个部件的第一个拼形字母数码。
签——部首是“”,部首数码取88()颉——部首是“页”,部首数码取62(丆ハ)欲——部首是“谷”,部首数码取29(ハ、口)附表四是汉字部首数码规范(摘要)(二)汉字字干的数码提取规则l、字干是一个部件的,取该部件的前三个和最后一个拼形字母数码。
极——字干是“及”,字干数码取84( 乞——字干是“乙”,字干数码取5(乙)像——字干是“象”,字干数码取3895(丿 口 2、字干是两个部件的,取各个部件的第一个和最后一个拼形字母数码。
热——字干是“执”,字干数码取1134(一 丿丶)栓——字干是“全”,字干数码取538( ⊥)众——字干是“从”,字干数码取77(人人)3,字干是三个部件的,取前两个部件的第一个拼形字母数码,最后一个部件的第一个和最后一个拼形字母数码。
糖——字干是“唐”,字干数码取469(丶口)蓝——字干是“监”,字干数码取4878( 冂⊥)揆——字干是“癸”,字干数码取8137( 人)4、字干是四个以上部件的,取前三个和最后一个部件的第一个拼形字母的数码。
趱——字干是“赞”,字干数码取8872(冂 隔——字干是“鬲”,字干数码取1971(一口冂丷)撼——字干是“感”,字干数码取8194(厂一口 )
附表五是汉字字干数码规范(摘要)附表六是常用汉字数码规范(摘要)五、词语编码规则1、二字词语的数码分别由两个汉字的三位数码构成。三位数码取独体字的前两位和最后一位数码,合体字的字首第一位数码、字干第一位和最后一位数码(字干是一个部件时)或者字干的第一个和最后一个部件的第一位数码(字干是几个部件时)。蓝图647932“蓝”取647(十 冂)“图”取932(囗丿 水银285897“水”取285( “银”取897( 放宽888463“放”取888(亠乂)“宽”取463(丶十丿)容易459931“容”取459(丶 口)“易”取931(口丿 2、三字词语的数码分别由三个汉字的两位数码构成。两位数码取独体字的第一位和最后一位数码、合体字的字首第一位数码和字干第一位数码。
党委会293551“党”取29(丨口)“委”取35( ㄑ)“会”取51( 一)黑龙江927225“黑”取92(口 “龙”取72(ナ “江”取25( )通讯社844546“通”取84 丶)“讯”取45(丶 “社”取46(丶十)3、四字词语的数码分别由笫一、三汉字的一位数码和第二、四汉字的两位数码构成。一位数码取汉字的第一位数码。
拥政爱民158394“拥”取1(一)“政”取58()“爱”取3(丿)“民”取94 耳闻目睹545996“耳”取5()“闻”取45( )“目”取9(口)“睹”取96(口十)见缝插针753186“见”取7(冂)“缝”取53(ㄑ丿)“插”取1(一)“针”取86(十)4、五字词语的数码分别由前四个汉字的一位数码和最后一个汉字的两位数码构成。
中国共产党996829“中”取9(口)“国”取9(囗)“共”取6(十)“产”取8(亠)“党”取29(丨口)换汤不换药126165“换”取1(一)“汤”取2 “不”取6(丆)“换”取1(一)“药”取65(十ㄑ)5、五字以上词语的数码分别由前五个汉字的一位数码和最后一个汉字的一位数码构成。
树欲静而风不止623658“树”取6(十)“欲”取2 “静”取3 “而”取6(丆)“风”取5()“止”取8()附表七是常用汉字词语数码规范(摘要)六、补码规则编码规则中不足规定数码位数的,取汉字最后一个字母的第一个笔画数码作为补码,补足位数。
汉字“力”的数码是73,最后一个字母是撇,补码取3,所以汉字“力”的全部数码取733333汉字“度”的数码是48169,最后一个字母是“又”,其首笔画是折撇,补码取8,所以汉字“度”的全部数码是481698词语“十分”中的汉字“十”的数码是6,其首笔是横笔,补码取1,所以词语“十分”的数码是611273词语“一口气”中的汉字“一”的补码是1,汉字“口”的补码是2,所以词语“一口气”的数码是119281附表八是常用汉字补码规范(摘要)附表一 拼形字母形状举例说明(摘要) 附表二 常用汉字部件拆分规范表(摘要)阿口阝一口亅 熬 攵灬佰亻百阿阝一口丿 翱白 十习习败冂ハ攵埃厶矢 袄礻 拜 挨扌厶矢 傲亻 攵稗 十哎口艹乂 奥 大 斑 王唉口厶矢 懊忄 大 班 丷王哀亠澳氵 大 搬扌 几又皑白山己 芭艹巴 扳扌反癌疒口口口山 捌扌口力刂 般 几又蔼艹讠日勹 扒扌八 颁 刀 矮 禾女 叭口八 板 反艾艹乂 吧口巴 版片反碍石日 笆 巴 扮扌八刀爱丿 友 八八 拌扌半隘阝 皿疤疒巴 伴亻半鞍革宀女 巴巴瓣亠 瓜亠 氨 宀女拔扌 半半安宀女 跋 办办俺亻大电 靶革巴 绊半 按扌宀女 把扌巴 邦 阝暗日一日 耙 巴 帮 阝巾岸山厂干 坝冂  梆 阝胺月宀女 霸 革月榜 亠 方案宀女木 罢罒去 膀月亠 方肮月亠几 爸ハ乂巴绑 阝附表三 汉字部件数码规范(摘要)丷一 关丷 人 某一 //一 // 人一 11 1371632兼丷一十 羌丷 ナ 一厶丿 //—十 // \ —/\1166 13741634 丷一 丿差丷 ナ米丷十 //一///  //十∧1173 1375165扌一亅 着丷 ナ口丷十 一丨一 // 口 //十∧1211379165才一亅丿丷 ⊥ 瓦一 丶一丨/ // ⊥一∧\123 1381654求一亅戈一 车一∠十—丨 ∧ 一 \ \\ —十1235142166寸一亅丶弋一 丶 世一—丨\— \ \ 一124 144 166半丷 丨 州 一十// 丨 // —十//132 144 l661附表四 汉字部首数码规范(摘要)一—1 革—十16 灬 22 毛 \34 ∥1 —16 水丨∧25夕/\34丷 ∥ 1 车—十16 ∧25 耒 ∧35示——11羊∥十16 26 禾 ∧35扌——11单∥十16 26 彳/ 35∥—11—人17 斗 十26 九/∧35豆——11∥ 17山丨27 鬼/ 36鬲—∥11火∥人17 父 ×28 角/十36雨— 12 ∥⊥18 谷 口29 饣/36戈— 12 至—⊥18 3 鼻/丆36 ∥ 12 西—囗19 丿/ 3 青 37牙—/13 酉—囗19 3 37比—/13 首—囗19 冫 3 欠 人37彡∥/13 2 鱼/—3l勹/37寸—\14 丨 丨 2 舛/—31王 ⊥38弋—\14 2 鸟/—31身/丆38 —\14 八 2 32 血/⊥38瓦—\14 —21 干 丨 32 麦 囗39 ∥\ 14 ∥2l玉 32 舌 囗39束一∧15氵 —21 韦 丨 32香 囗39 —∧15 刂丨丨22 手 丨 32/囗39 —十15小丨 22 舟/ 32 白/囗39米//∧15小丨\\22 黍 丨32 自/口39甘一16忄\\丨22 犭//33 /囗39附表五 汉字字干数码规范(摘要)尚 口279迷 1545 衍丿亻一3521尔 小3122 数 攵1558 微丿亻山一3521忽勿心3142 日1619 魏禾 厶3536欠 人317皆 匕白1633兜 儿3663 彡3213毕 匕十1636メ 匕3813泰 3225 匕土1636乘千 匕 3835奉 3232 连车丶 1645 訇勹亠 口3839秦 3235 顷 1662 祭 3911奏 3237 戎一ナ 1742 匕灬4132 丿 329戒一廾 1742 寇宀一兀 4168春 日3291 丽一 1774 宣宀一日一4191狄犭火3317 丶 1847 容宀 口4259熏 灬、3322 亘一日一191 察宀 一4391狂犭王3338豆一口1911 宽宀艹冂儿4673卑 十336票 1911 览 冂儿4873猪犭者3369可一口亅 192 廛广里 土4926犹犭尤3374一口田1996 5128敖 攵3388 溥氵甫寸2111 敛 5128 免 342沙氵 丿 2113 约 勹丶5134刑开刂 3422 淫氵 壬2123俞 刂5172多夕夕3434奚 幺大2157拿 一口手5193夕 345 渠氵巨木2166 禽 一口 口5199乏丿之345 派氵 2186 脊冫 5357 匕十346 谷 口259倍亻亠 口 5819附表六 常用汉字数码规范(摘要)啊 971 肮 73853把 119 伴 5132保 5965阿 7192 昂 91677耙 35927瓣 8154堡 595埃 616487 盎 7747 坝 6172 半 132 饱 3637挨 11648凹 92222霸 121 办 7244宝 46384哎 9628 敖 38738罢 946 绊 51132 抱 1137唉 964 熬 3388 爸 289 邦 3778报 1179哀 8956 翱 39767白 391 帮 3777堡 595皑 3927 袄 453 柏 65391梆 65377 饱 3637癌 439 傲 5338 百 69 榜 6581宝 46384蔼 62493奥 3715 摆 1194 膀 7381抱 1137矮 8735 懊 2237 佰 5691 绑 51377 报 1179艾 6283 澳 21371败 7288 棒 65323 暴 9162碍 6991 芭 629277 拜 37332磅 69818 豹 71374爱 326 捌 119722 稗 3533 蚌 9736鲍 3137隘 71127扒 112 斑 3888 镑 83818 爆 17916鞍 1646 叭 9233 班 381 傍 5818杯 65652氨 8146 吧 992 搬 1132 谤 46818 碑 6933安 4658 笆 88927扳 1189 苞 62379 悲 8844俺 5749 八 23 般 32598胞 73379 卑 3976按 114 疤 4392 颁 2736 包 3797北 813暗 918 巴 9277 板 6589 褒 859 辈 8816岸 278 拔 11794版 4789 剥 7325背 8134胺 7346 跋 9879 扮 1127 薄 62211 贝 72333案 46586靶 1692 拌 11132雹 1237钡 83723附表七 常用汉字词语数码规范(摘要)阿爸712292阿坝县71677阿塞拜疆74337阿弟71217 阿富汗71412阿谀奉承74637阿斗71226 阿根廷71693挨家挨户14614阿 71255 癌细胞49597挨门逐户14764阿哥712192艾滋病68214唉声叹气96998阿妈71257 爱尔兰32321哀兵必胜872478阿妹71253 爱国心329342 矮杆作物86358阿婆71228 爱国者32936艾滋病毒62143阿嚏71296 爱好者32576碍手碍脚632676阿姨71251 爱科学323227 爱不释手36523埃及668844爱劳动326617 爱财如命37155挨打16811 爱人民32739爱厂如家381546挨冻168312爱学习322773 爱国精神393149挨饿168332爱祖国32479爱国热情393123挨个16852 安哥拉45191爱国人士393761挨近16885 安徽省45321爱国阵线39375挨骂16899 安家费454677 爱国志士393661挨整16818 安乐窝45624爱国主义393848挨着168139安理会45395爱护公物3142挨揍168133安眠药459965 爱美之心317442哎呀96891 安全部455387 爱民模范39466哎哟96895 安全带455367 爱莫能助369677哀愁89531 安全岛45533爱沙尼亚32195哀悼8952 安全阀45534爱说爱笑341383附表八 常用汉字补码规范(摘要)吏(丿)118(3)176(6)(丨)332(2)乚(乚)4(444)丁(丿)12(22)丙(丿)177(3)无(乚)334(4)川(丨)42(22)才(丿)123(3)夷(丿)177(3)井(丿)34(33)心(丶)442(4)寸(丶)124(4)西(丨)192(2)开(丿)34(33)之 45(88)乡(丿)13(33)八(丿)2(333)匕(乚)34(44)门 47(77)半(丨)132(2)刂(亅)22(22)乇(乚)34(44)广(一)48(11)并(丿)134(3)山(乚)27(66)戋(丿)342(3)户()49(77)羊(一)136(1)乎(亅)282(2)九 35(55) 几(丿)5(333)关(丿)137(3)平(丨)282(2)丸(丶)354(4)乙(乙)5(555)戈(丿)142(3)水(丿)285(3)丰(一)36(11)己()5(777)弋(丶)144(4)(丿)285(3)耒(丿)365(3)5(777)州(丶)144(4)夹(丿)287(3)夫(丿)37(33)工(一)51(11)甘(丨)161(2)夹(丿)287(3)天(丿)37(33)丐 517(7)米(丿)165(3)二(一)3(111)勿(丿)37l(3)爪(丿)52(33)车(一)166(1)三(一)31(11)韦(1)372(2) 亚(丿)528(3)世()166(6)毛(乚)314(4)壬(丨)38(22)凡(丶)54(44)火(丿)17(33)干(丨)32(22)王(丨)38(22)下(丶)54(44) 17(77) 千(丨)32(22)久 384(4) 正(一)541(1)巿(丨)l72(2)于(亅)32(22)夕(丶)384(4) 541(1)币(丨)172(2)禾(丿)325(3)玉(丶)384(4)瓜(丿)564(3)万(丿)173(3)末(丿)325(3)专(丶)384(4)幺(丶)564(4)屯(乚)174(4)未(丿)325(3)白(丨)391(2)伊(一)567(1)为(丶)174(4)击()327(6)自(丨)393(2)567(7)弟(丨)176(2)舌(丨)329(2)阜(一)396(1)女(丿)58(33)
权利要求
一、一种汉字输入方法及其键盘,其特征在于1、将汉字拆分为汉字部件,再将汉字部件拆分为拼形字母;2、将拼形字母有规律地分布在数字键盘上;3、将汉字及其词语按照编码规则转换为数码;4、利用数码在数字键盘上输入汉字及其词语。
二、如权利要求一所述的拼形字母列表如下拼形字母表字母符号—丨 / \ ∧字母名称横 竖 撇捺 折横 折竖 折撇 折捺 ∥  丆 离横 离竖 离撇 离捺 连横 连竖 连撇 连捺× 囗交横 交竖 交撇 交捺 封口上述拼形字母符号代表的意义列表如下
三、如权利要求一所述的拼形字母在数字键盘上的分布规则是
根据上述规则标注的拼形字母、标点符号及功能键的数字键盘图示如下
四、如权利要求一所述的汉字拆分为汉字部件的规则是1、连笔、交笔、折笔、口笔不可拆,离笔可拆;2、离笔属固定组合的,不可拆;3、部件内部有散笔画的,不可拆;4、除折笔、口笔外,按笔顺拆分。
五、如权利要求一所述的汉字部件拆分为拼形字母的规则是1、按笔顺提取部件的前两个笔划构成拼形字母,以此类推;2、部件中的钩笔(含笔画)、折笔、口笔单独提取为拼形字母。
六、如权利要求一所述的汉字编码规则是独体字数码由前五位数码和最后一位数码组成;合体字数码由两位部首数码和四位字干数码组成。
七、如权利要求六所述的汉字部首的数码提取规则是1、部首是一个部件的,取该部件第一个和最后一个拼形字母数码;2、部首是多个部件的,取第一个部件和最后一个部件的第一个拼形字母数码。
八、如权利要求六所述的汉字字干的数码提取规则是1、字干是一个部件的,取该部件的前三个和最后一个拼形字母数码;2、字于是两个部件的,取各个部件的第一个和最后一个拼形字母数码;3、字干是三个部件的,取前两个部件的笫一个拼形字母数码,最后一个部件的第一个拼形字母数码;4、字干是四个以上部件的,取前三个和最后一个部件的第一个拼形字母的数码。
九、如权利要求一所述的词语编码规则是1、二字词语的数码分别由两个汉字的三位数码构成,三位数码取独体字的前两位和最后一位数码,合体字的字首第一位数码、字干第一位和最后一位数码(字干是一个部件时)或者字干的第一个和最后一个部件的第一位数码(字干是几个部件时);2、三字词语的数码分别由三个汉字的两位数码构成,两位数码取独体字的第一位和最后一位数码、合体字的字首第一位数码和字干第一位数码;3、四字词语的数码分别由第一、三汉字的一位数码和第二、四汉字的两位数码构成,一位数码取汉字的第一位数码;4、五字词语的数码分别由前四个汉字的一位数码和最后一个汉字的两位数码构成;5、五字以上词语的数码分别由前五个汉字的一位数码和最后一个汉字的一位数码构成。
十、如权利要求八和权利要求九所述的编码规则中不足规定数码位数的,取汉字最后一个字母的第一个笔画数码作为补码,补足位数。
全文摘要
本发明公开了一种利用数字键盘输入汉字及其词语的方法,属于汉字信息处理领域,其特征是将汉字拆分为汉字部件,再将汉字部件拆分为拼形字母,把这些拼形字母有规律地分布在九个数字键上,按规则对汉字及其词组进行数字编码。该输入方法具有编码规范、简单易学、无重码等特点,可用于信息处理及通讯设备的汉字输入。
文档编号G06F3/023GK1333494SQ0110878
公开日2002年1月30日 申请日期2001年8月28日 优先权日2001年8月28日
发明者钟林 申请人:钟林
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1