一种电脑汉字输入法的制作方法

文档序号:6341707阅读:798来源:国知局
专利名称:一种电脑汉字输入法的制作方法
技术领域
本发明涉及一种电脑汉字输入法。
背景技术
现有的电脑汉字输入法按性质可分为五大类别数字码、笔画码、字根码、拼音码及音形结合码,现行的汉字编码有如下不足一现行的各种编码要么不规范,如各种字根码,把汉字拆分得支离破碎,破坏了汉字的整体结构,破坏了汉字的书写顺序;要么不易学,如各种字根码,字根既多且乱,规则既多且繁,没有十天半月也学不会;要么不够快,如拼音码、笔画码等,虽然好学,也够得上规范,可打字速度却慢得叫人难以接受。
二现行的编码有着一个通病就是字、词之间产生重码,打一个单字时常带出一个(或多个)与单字重码的词组。字、词重码的存在,既制约了系统的词库量,也制约了编码的速度,这种弊病是由于编码本身的先天不足的缺陷造成的。
三现行的编码还有一大误区认为编码越短越好,平均码长越短越好,重码率越低越好。为了片面追求短编码和低重码,各种编码无不编制简码。简码的存在,虽然在一定程度上提高了打字速度,但也相应地增加了记忆量。其实,要提高打字速度,不在于短码长和低重码,关键在于编码能否实现字、词编码的分离,增加词汇输入的比重,降低单字输入的几率;能否划分字、词的音节,实现自动分词功能,实现智能化连续语句输入。

发明内容
本发明的目的在于提出一种电脑汉字输入法,其特征是利用汉字的声母、韵母、偏旁及信息码四要素对汉字进行编码。
本发明所称的汉字的韵母共有35个,分为六大系统a系统a、ai、ao、an、ange系统e、ei、er、en、engo系统o、ou、ongi系统i、ia、ie、iu、in、ian、iao、ing、iang、iong
u系统u、ua、ui、un、uo、uai、uan、uangv系统v、ve、vn、van本发明所称的汉字的声母共有26个,分为三大类别声 母B、P、M、F;D、T、L、N;G、K、H;J、Q、X;Z、C、S;Zh、Ch、Sh、R准声母W、Y虚声母A、E、O在该方法中,没有声母的独韵母汉字(或称零声母汉字),以虚声母代表其声母1、属a系统的独韵母汉字,以虚声母A做声母;2、属e系统的独韵母汉字,以虚声母E做声母;3、属o系统的独韵母汉字,以虚声母O做声母;本发明所称的汉字的偏旁共有130个,该方法把汉字的整体分解为“偏旁”和“部件”两部分。汉字切除“偏旁”后的剩余部分称为“部件”,对于无偏旁的汉字而言,其字本身就是“部件”。
本发明所称的汉字的信息码为汉字的“部件”首笔画即汉字的“部件”的起笔笔型(第一笔画),汉字的首笔画有五种类型横(一),竖(丨),撇(丿),点(丶)折(乙),分别用数字代码1,2,3,4,5标识该方法用汉字的四要素(声母、韵母、偏旁、信息码)来对汉字进行四键编码,编码模式汉字编码的一、二、三、四码分别对应于汉字的声母、韵母、偏旁、信息码四要素的所在键位。即声母+韵母+偏旁+信息码(首笔画)该方法对词组的四键编码方法是二字词组取汉字的第1字的前二码与第2字的前二码组成编码,即 三字词组取汉字的第1字的前二码与第2字、第3字的第一码组成编码,即 四字及多字词组取汉字的第1字、第2字、第3字、第4字的第一码组成编码,即声母+声母+声母+声母第1字第2字第3字第4字该方法有如下特色1、规范。它的编码规则及内容一点都没有超出小学语文教学规范,它不随意拆分汉字,不考虑汉字字型,不破坏汉字整体结构,不改变汉字书写顺序。2、易学。它规则少、记忆少,编码所涉及到的声母、韵母、偏旁、笔画、声调符号等都是小学语文教学中反复教学的内容,自始至终贯穿于整个小学阶段,全套编码能在10分钟之内学会并操作。3、高效。重码率极低,取码直观、思维反应快速。4、汉字与词汇全四码混合编码无冲突,无需功能转换,编码就可实现字、词的混合输入。
本输入法所涉及的汉字的声母,韵母,偏旁,信息码四要素在电脑打字键盘的字符键上的映射定位如下键名 声母 韵母 偏旁信息码句号(。) 1横(一)、阴平 逗号(,) 2竖(丨)、阳平 点号(.) 3撇(丿)、上声 顿号(、) 4点(丶)、去声 冒号() 5折(乙)分号(;) 0零声母、零首笔WWua ia 扌寸手爪毛GGuai iu亻彳人大鬼KKuang iao 子女父身儿HHong iong 尸户歹殳门YYin辶廴走立足JJing 阝卩耳目鼻QQian 口舌口风齿XXiang 忄车心气舟AAa 艹廾木片竹BBai氵冫水雨丬PPao钅王金见贝MMan讠彡言页髟FFang 饣欠食米禾EEe 火力灬光方DDei土士山石田
TTer ie 日曰月辛酉LLen 礻勹示匚冂NNeng 礻攵衣巾文IZh i 冖宀穴斤韦耒UCh u 厂广疒白赤黑VSh v 纟缶四糸瓦皿RRou 刂刀戈弓矢ZZuan van 犭虍豸角革骨CCui ve 牛马羊豕鹿鼠SSun vn 虫鱼鸟羽隹OOuo o本发明所称的汉字的信息码还可为声调符。汉字的声调符有四种,即阴平 ,阳平 ,上声 ,去声 ,分别用数字代码1,2,3,4标识。声调符法编码模式为汉字编码的一、二、三、四码分别对应于汉字的声母、韵母、信息码、偏旁四要素的所在键位。即编码方法是声母+韵母+信息码(声调符)+偏旁本发明的汉字输入法定名为“无极码”,无极码具有简单、易学、快速、高效的特点,其具体内容及方法事例如下1-0 编码规范无极码的编码由汉字的声母、韵母、偏旁、信息码(声调符、笔画码)组成,所有的内容都遵循中小学语文教学规范。
1-1 声母与韵母1-1-1 声母在国家的汉语拼音方案中,汉字的声母只有21个,无极码为适应所有汉字编码的统一性,把汉字的声母扩充为26个,分为三大类别1、声 母B、P、M、F;D、T、L、N;G、K、H;J、Q、X;Z、C、S;Zh、Ch、Sh、R2、准声母W、Y3、虚声母A、E、O1-1-2 韵母在无极码中,汉字的韵母共35个,分为六大系统1、a系统a、ai、ao、an、ang
2、e系统e、ei、er、en、eng3、o系统o、ou、ong4、i系统i、ia、ie、iu、in、ian、iao、ing、iang、iong5、u系统u、ua、ui、un、uo、uai、uan、uang6、v系统v、ve、vn、van1-1-3 独韵母汉字的声母的确认汉字的汉语拼音的完整结构由声母、韵母、声调符号三部分组成,但在整个汉语体系中,有部分汉字缺少声母,以韵母的方式独立存在,无极码称之为“独韵母汉字”,为了统一汉字的编码,无极码以虚声母来代替独韵母汉字的声母。
1、属a系统的独韵母汉字,以虚声母A做声母;2、属e系统的独韵母汉字,以虚声母E做声母;3、属o系统的独韵母汉字,以虚声母O做声母;序号 汉字 汉语拼音 声母韵母(1)啊a A a(2)挨aiA ai(3)凹aoA ao(4)安anA an(5)肮ang A ang(6)遏e E e(7)而erE er(8)恩enE en(9)哦o O o(10) 欧ouO ou1-2汉字偏旁的确认无极码对汉字偏旁的确认方法与字典的“部首查字法”中汉字部首的确认方法一致。字典的部首多且繁,无极码对字典的部首进行精选取舍(只有130个)并称之为“偏旁”,偏旁数目少而精。
无极码把汉字的整体分解为“偏旁”+“部件”构成。把含有偏旁的汉字称为“有偏旁的汉字”,把不含偏旁的汉字称为“无偏旁的汉字”;
为了编码的统一性,无偏旁的汉字,用字母代码“O”来代表其偏旁。用做偏旁的汉字无“部件”,也就没有笔画码,其信息码用数字代码“0”来代表其部件的笔画码。
1-2-1 一般汉字偏旁的确认原则无极码对字典的部首进行了精选取舍,大部分汉字是一字一偏旁,只有少部分汉字存在一字双偏旁。对于含有双偏旁的汉字,必须确认其中的一个偏旁做为汉字的偏旁,另一个偏旁做部件。无极码根据中小学语文教学规范,结合汉字的“字形、字音、字义”等内在规律,从六个方面来确认汉字的偏旁(基本法则)。
1、以字音定偏旁根据汉字的常用读音来确认汉字的偏旁。
(1)芳、放、妨、房……都读fang(方)音,偏旁相应取“艹、攵、女、户”,不取“方”。
(2)纹、蚊、雯、紊……都读wen(文)音,偏旁相应取“纟、虫、雨、糸”,不取“文”。
2、以字形定偏旁根据汉字的整体结构来确认汉字的偏旁。
(1)鸺 左边是“休”,偏旁取“鸟”,不取“亻”。
(2)激 右边是“敫”,偏旁取“氵”,不取“攵”。
(3)拿 上部是“合”,偏旁取“手”,不取“人”。
(4)薰 下部是“熏”,偏旁取“艹”,不取“灬”。
3、以字义定偏旁根据汉字的基本含义来确认汉字的偏旁。
(1)泉 指溢出地表的水,偏旁取“水”不取“白”。
(2)仙 指超凡脱俗的人,偏旁取“亻”不取“山”。
4、以类别定偏旁根据汉字的物种属性来确认汉字的偏旁。
(1)鹏、鸺、鸹、鹘……,属鸟类动物,偏旁取“鸟”。
(2)芏、苇、芦、茑……,属草本植物,偏旁取“艹”。
(3)蚂、蚊、蚪、蚬……,属虫类动物,偏旁取“虫”。
5、以习惯定偏旁根据汉字的教学习惯来确认汉字的偏旁。
(1)问、闻、闷……,偏旁取“门”。
(2)尿、屎、尾……,偏旁取“尸”。
(3)囚、因、困……,偏旁取“口”。
6、以变体定偏旁根据汉字的偏旁变形来确认汉字的偏旁。
(1)采 上部是“爪”的变体,偏旁取“爪”。
(2)杰 下部是“火”的变体,偏旁取“灬”。
1-2-2特殊偏旁的处理原则1、对于含双重(叠加)偏旁的汉字,无极码把双重(叠加)偏旁“化二合一”,视为整体的“单一偏旁”来处理。
(1)琵 偏旁取“王”(王+王→王),首笔画取“比”的第一笔画(笔画1)。
类似字有琶、琴、瑟……(2)蠢 偏旁取“虫”(虫+虫→虫),首笔画取“春”的第一笔画(笔画1)。
类似字有蠡、蟊、螽……(3)楚 偏旁取“木”(木+木→木),首笔画取“疋”的第一笔画(笔画1)。
类似字有梵、梦、棼……(4)咒 偏旁取“口”(口+口→口),首笔画取“几”的第一笔画(笔画1)。
类似字有哭、器、嚣……2、对于既含有双重(叠加)偏旁又含有单一偏旁的汉字,无极码参照“基本法则”来处理。
1、以字音定偏旁(1)骂 读ma(马)音,偏旁取“口”(口+口→口)。
(2)麓 读lu(鹿)音,偏旁取“木”(木+木→木)。
2、以字义定偏旁(1)焚 偏旁取“火”。
(2)彬 偏旁取“彡”。
3、以字形定偏旁(1)婪 偏旁取“女”。
(2)郴 偏旁取“阝”。
1-3 笔画码与信息码1-3-1 笔画码汉字由笔画构成,汉字的基本笔画有五类横(一)、竖(丨)、撇(丿)、点(丶)、折(乙),其中点(丶)含笔画捺,横(一)含笔画提,折(乙)含横折、竖折、撇折、横钩、竖钩、弯钩等所有的含折、含钩的笔画。无极码把构成汉字的笔画用数字代码来表示,称为“笔画码”。
无极码把汉字的整体分解为两部分“偏旁”和“部件”。汉字切除偏旁后的剩余部分称为“部件”。偏旁汉字无“部件”。无偏旁的汉字,其字本身就是“部件”。部件的第一笔画、第二笔画、第三笔画……分别称为笔画1、笔画2、笔画3……(1)阶 切除偏旁“阝”后的部件为“介”,“介”的第一、第二、第三笔画分别为丿、丶、丿。
(2)法 切除偏旁“氵”后的部件为“去”,“去”的第一、第二、第三笔画分别为一、丨、一。
(3)发 无偏旁的汉字,其字本身就是部件,部件的第一、第二、第三笔画分别为乙、丿、丶。
(4)高 无偏旁的汉字,其字本身就是部件,部件的第一、第二、第三笔画分别为丶、一、丨。
1-3-2 信息码信息码是无极码识别和降低汉字重码的信息代码,无极码的信息码有两种首笔画和声调符。
1、首笔画汉字部件的第一笔画(笔画1)称为“首笔画”。
2、声调符汉字的声调符号有4个,即阴平 、阳平 、上声 、去声 笔画码与信息码的代码对应表 2-0 编码方法2-1 主体输入法2-1-1 汉字的编码方法2-1-1-1 方法之一首笔画法 声母+韵母+偏旁+信息码(首笔画)
1、有偏旁的汉字声母+韵母+偏旁+首笔画(1)刷(shua) 输入方法sh+ua+刂+乙无极码VZR5(2)例(li)输入方法l+i+亻+一无极码LIG12、无偏旁的汉字声母+韵母+O键+首笔画(O键←→偏旁)(1)甲(jia) 输入方法j+ia+O+丨无极码JWO2(2)就(jiu) 输入方法j+iu+O+ 无极码JGO43、键位偏旁汉字声母+韵母+键位+首笔画(键位←→偏旁)(1)方(fang) 输入方法f+ang+E+0(“方”在E键上)无极码FFE0(“方”无部件,信息码为0)(2)王(wang) 输入方法w+ang+P+0(“王”在P键上)无极码WFP0(“王”无部件,信息码为0)2-1-1-2 方法之二声调符法 声母+韵母+信息码(声调符)+偏旁1、有偏旁的汉字声母+韵母+声调符+偏旁(1)刷(shuā) 输入方法sh+ua+ +刂无极码VW1R(2)例(1ì) 输入方法1+i++亻无极码LI4G2、无偏旁的汉字声母+韵母+声调符+0键(0键←→偏旁)(1)甲(jiǎ)输入方法j+ia+ +0无极码JW10(2)就(jiù)输入方法j+iu++O无极码JG403、键位偏旁汉字声母+韵母+声调符+键位(键位←→偏旁)(1)方(fāng) 输入方法f+ang+ +E (“方”在E键上)无极码FF1E(2)王(wáng) 输入方法w+ang++P(“王”在P键上)
无极码WF2P2-1-2 词汇的编码方法1、二字词汇声韵+声韵我们(wo men) 输入方法w+o+m+en无极码WOMN2、三字词汇声韵+声+声计算机(ji sun ji) 输入方法j+i+s+j无极码JISJ3、四字词汇声+声+声+声恩将仇报(en jiang chou bao) 输入方法E+j+ch+b无极码EJUB4、多字词汇前四字的声母中华人民共和国输入方法zh+h+r+m无极码IHRM
权利要求
1.一种电脑汉字输入法,其特征是利用汉字的声母、韵母、偏旁及信息码四要素对汉字进行编码该方法所称的汉字的韵母共有35个,分为六大系统a系统a、ai、ao、an、ange系统e、ei、er、en、engo系统o、ou、ongi系统i、ia、ie、iu、in、ian、iao、ing、iang、iongu系统u、ua、ui、un、uo、uai、uan、uangv系统v、ve、vn、van该方法所称的汉字的声母共有26个,分为三大类别声母B、P、M、F;D、T、L、N;G、K、H;J、Q、X;Z、C、S;Zh、Ch、Sh、R准声母W、Y虚声母A、E、O在该方法中,没有声母的独韵母汉字,以虚声母代表其声母(1)、属a系统的独韵母汉字,以虚声母A做声母;(2)、属e系统的独韵母汉字,以虚声母E做声母;(3)、属o系统的独韵母汉字,以虚声母O做声母;该方法用汉字的四要素即声母、韵母、偏旁、信息码来对汉字进行四键编码,编码模式为汉字编码的一、二、三、四码分别对应于汉字的声母、韵母、偏旁、信息码四要素的所在键位。即声母+韵母+偏旁+信息码该方法所称的汉字的偏旁共有130个,该方法把汉字的整体分解为“偏旁”和“部件”两部分。汉字切除“偏旁”后的剩余部分称为“部件”,对于无偏旁的汉字而言,其字本身就是“部件”,其偏旁代码为字母o;该方法所称的汉字的信息码为汉字的“部件”的首笔画即汉字的“部件”的起笔笔型,汉字的首笔画有五种类型横(一),竖(丨),撇(丿),点(丶)折(乙),分别用数字代码1,2,3,4,5标识,对于,对于键位偏旁汉字无“部件”,信息码为数字代码0;本输入法所涉及的汉字的声母,韵母,偏旁,信息码四要素在电脑打字键盘的字符键上的映射定位如下WWua ia 扌寸手爪毛GGuai iu 亻彳人大鬼KKuang iao 子女父身儿HHong iong 尸户歹殳门YYin 辶廴走立足JJing阝卩耳目鼻QQian口舌口风齿XXiang 忄车心气舟AAa 艹廾木片竹BBai 氵冫水雨丬PPao 钅王金见贝MMan 讠彡言页髟FFang饣欠食米禾EEe 火力灬光方DDei 土士山石田TTer ie 日曰月辛酉LLen 礻勹示匚冂NNeng衤攵衣巾文IZhi 冖宀穴斤韦耒UChu 厂广疒白赤黑VShv 纟缶四糸瓦皿RRou刂刀戈弓矢ZZuan van犭虍豸角革骨CCui ve 牛马羊豕鹿鼠SSun vn 虫鱼鸟羽隹OOuo o
2.如权利要求1所述电脑汉字输入法,其特征在于该方法对词组的四键编码方法是二字词组取汉字的第1字的前二码与第2字的前二码组成编码,即声母+韵母+声母+韵母三字词组取汉字的第1字的前二码与第2字、第3字的第一码组成编码,即声母+韵母+声母+声母四字及多字词组取汉字的第1字、第2字、第3字、第4字的第一码组成编码,即声母+声母+声母+声母
全文摘要
本发明涉及一种电脑汉字输入方法及新型标准电脑打字键盘对称布局,该方法的特征是利用汉字的声母、韵母、偏旁、信息码四要素来编码汉字,使汉字输入法符合规范、易学、高效的要求,同时推出一种符合中文信息处理要求的标准键盘,该键盘采用对称布局设计,界面明了,功能强大,各种常用符号齐全,为中文信息处理及数理化公式的编辑带来方便,键盘与汉字输入法相辅相成,相得益彰,进而推动了汉字输入法的发展与完善。
文档编号G06F3/023GK1336579SQ0112846
公开日2002年2月20日 申请日期2001年9月13日 优先权日2001年9月13日
发明者任文 申请人:任文
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1