计算机汉字编码输入方法

文档序号:6336218阅读:406来源:国知局
专利名称:计算机汉字编码输入方法
技术领域
本发明涉及一种汉字输入方法,尤其涉及一种计算机汉字编码输入方法。
背景技术
随着科学技术的不断发展,计算机在各个领域中广泛的应用,由于计算机的输入键盘是按照西语的拉丁字母设置的,汉字的输入就必需进行转换,就产生了编码。在二十多年前曾出现的一种编码,解决了当时有无的问题,做出了一定贡献。改革开放以后,国家出现了经济腾飞、科学技术大发展、人民生活大提高的局面。在使用汉语的区域里,都离不开使用汉字,特别是在信息处理领域,就出现了一个汉字与一切新技术(包括计算机)如何融合,并如何促进一切新技术发展的问题。就其编码规则大都是设计者的单一思路,脱离了汉字的规范性,脱离了书写汉字的笔顺规律和笔形规律,让使用者学起来无规律可循,非死记硬背不可。造成常人难学易忘,必须培训专职人员长期专职应用,其他人很难掌握,因为学会了不用就容易忘记,致使大多数华人还是不能充分利用它。
汉字拆分是在形码界长期争论不休,并且至今没有得到很好解决的大问题。汉字如何拆分?意见很不一致,《五笔字型》有自己的拆分方法,汉字拆分的方法不合理,对计算机的输入必然会造成影响。汉字拆分的方法直接影响计算机的汉字输入,计算机的汉字输入与我国的教育脱节,学生们在学校里学习电脑而不与规范的计算机汉字输入接触;脱离规范性的汉字信息处理的状况,使汉字不适应汉语国际化的要求。学校培养出来的小学生、中学生、大学生、研究生,都不会规范的汉字输入。

发明内容
本发明的主要目的在于,提供一种能够见字知根、见字知形、见根知码并且符合汉字的规范化要求、符合汉字的教学要求、符合人们的思维习惯的计算机汉字编码输入方法。
全世界都公认中华民族具有五千年的文明史,文明史的标志和记载就是汉字。汉字的形体美的本身就是一门独有的不朽艺术,从古到今,各种流派的汉字书法艺术不知留下多少国宝级文物,汉字的迷人之处不仅在于它的造字的灵活性、创造性,还在于它所含信息量之大、表意之贴切、深刻、准确,表现力之丰富、精炼,遣词造句之灵活,这些都是其它文字所无法比拟的。正是由于汉字的固有特性,才使中华民族从古到今不知留下多少精美的不朽诗篇的和巨著诗经、唐诗、宋词、红楼梦、三国演义等。汉字的“字形”、“笔形”在汉字书法中受“笔顺”及汉字“形体美”的制约,这种制约在汉字书法中是十分必要的,也是汉字书法文化的重要内涵。汉字在“形”方面的主要内涵是笔形内涵、笔顺内涵、笔画内涵、字形内涵等,其内涵包含丰富信息,是规范化汉字编码的依据。
本发明解决其技术问题所采用的技术方案是运用计算机的键盘输入汉字的单字以及输入汉字的词组,将计算机标准键盘的A~Y的字母键设置为编码键,编码键的编码为两位数码,是由区域编码的数码号加位置编码的数码号构成编码键的编码,编码键的编码划分为五组区域编码,每组区域编码各自划分排列为五个位置编码,一区编码键为G(11)、F(12)、D(13)、S(14)、A(15),二区编码键为H(21)、J(22)、K(23)、L(24)、M(25),三区编码键为T(31)、R(32)、E(33)、W(34)、Q(35),四区编码键为Y(41)、U(42)、I(43)、O(44)、P(45),五区编码键为N(51)、B(52)、V(53)、C(54)、X(55)。
在字根与其编码(英文字母)间建立直通车,将计算机标准键盘的25个英文字母A-Y,分为“五区五位”,每个英文字母后括号内的两位数,就是该字母坐标代码,用A-Y这25个英文字母,能够概括全部汉字的字形编码,让使用者能够一见汉字,便知其“形”,即“见字识形”。
组合成一个汉字是由若干个单笔笔形构成单笔字根或由若干个笔形组合成的字根构成一个汉字,输入一个汉字前,确认属于大于等于4字根的一个汉字,依照笔形规则、笔顺规则、笔画规则,首先取“字根”首笔的笔形号确定“区域编码”,再取字根次笔的笔形号确定“位置编码”。
汉字可以拆分为三种字根单笔字根即八种单笔、部首和根字,根字具有某种特征的独立汉字,无论根字本身的笔画多少,只要拆分后出现单笔,被拆者就是根字。
汉字有形,笔形笔顺,决定根名,笔画规则,决定字形。五区五位,代码记清。八笔五号,笔号记准。见字知根,见字知形。见根知码,两根加形。汉字输入,最多四根。以字为根,单笔特征。部首根字,输入根本,部首输入一码取净,根字输入一码取整。字根代码首次笔定。笔画输入,辅助成分。汉字拆分不仅要符合汉字的造字原理,因为汉字的造字原理是形码编码的本源,同时还要符合人们的思维习惯,只要掌握汉字‘拆分规律’后,就能自如地进行对汉字的拆分,当然就能作到“见字知根”。汉字可以拆分为不用记忆的三种字根1、单笔字根(八种单笔);2、部首;3、“根字”。
“根字”都是具有某种特征的独立汉字,这种特征就是无论“根字”本身的笔画多少,将“根字”拆分后,就会出现一个或二个或三个单笔,这种单笔,无论是横、竖、撇、提、点、捺、折、钩中的哪一种,只要拆分后出现单笔,被拆者就是“根字”。对于“根字”不需要记忆,只需要观察“根字”的单笔特征即可。当“根字”作为“字中之字”时,才当作‘字根’看待,而一码取之。有的汉字虽然具备“根字”特征,但在汉字群中,从来都是独立的汉字(独体字),这也无妨大碍,因为它们不出现在“字中之字”中,就不会取它们为“根字”。这就是实现以“字”为“根”的汉字‘拆分规律’。
这里再特别强调一下“根字”的概念,是实现以“字”为“根”进行汉字拆分的一种规律性构思,不用大家死记硬背,就可以实现“见字知根”。
完全由部首和‘根字’构成的汉字,进行编码时依照笔形规则、笔顺规则、笔画规则,依次取根,最多取四根,汉字拆分后不会出现有单笔;两根加打字形码;三根取三码;大于或等于四根的取四根,即取一、二、三及末根;字根大于四根的汉字,且字根很多的汉字,依次取完一、二、三根后,末根须取剩余部分最大的汉字。
完全由部首和‘根字’构成的汉字,编码时根据四大规则,依次取根,最多取四根(这种汉字拆分后不会有单笔出现),两根加打字形码;三根取三码;大于或等于四根的取四根,即取一、二、三及末根。如果汉字的字根很多,依次取完一、二、三根后,末根须取剩余部分最大的汉字(这里与‘根字’无关),目的是使编码包含最大信息量。例如‘离’的编码‘文’、‘凵’、‘冂’、‘厶’;‘禽’的编码前三个‘字根’依次是‘人’、‘文’、‘凵’,剩余部分()是一个独立的汉字;‘俊’的编码‘亻’、‘厶’、‘八’、‘夂’;‘赣’‘立’、‘日’、‘十’、‘贡’(跳过部首‘夂’,‘贡’是剩余部分最大的汉字);‘懿’的编码前三个‘根’是‘士’、‘冖’、‘豆’、‘恣’(剩余部分最大的汉字是‘恣’);‘豁’‘宀’、‘丰’、‘口’、‘谷’;‘鞭’廿、口、十、便等。实际上,在编码过程中,除了对‘根字’或独体字编码外,你就不会遇到‘单笔’,因为‘单笔’全部都包含在‘根字’和具有‘根字’特征的独体字之中。
单笔字根的编码取笔形确定“区域编码”,“位置编码”为1。
完全由单笔画构成的汉字是‘根字’,这些汉字的编码是依笔顺取单笔,并且两个根字加字形码;如二、十、七、八、人、入、卜、丁、厂、刀、刁、乃、卜、了、儿、几、巛、夕、女、万、尸、弋、丈、弓、己、巳、已、万、寸、才、川、马’、门、及、也、与、飞、 予、牙、火、书、片、 瓦、长、氏、巨、戈、为、水、巴、心、车、毋、韦、五、母、必、永、凹、凸、臣、戎、臼等等。
由单笔、部首(或根字)构成的汉字必定是‘根字’,这些汉字的编码是依笔顺见部首打部首、见‘根字’打‘根字’、见单笔打单笔(两根加形码)如三、干、亍、亏、于、凡、乇、丸、勺、大、太、犬、尤、子、刃、口、巾、山、叉、勺、亡、爪、勿、开、井、乏、无、王、少、玉、瓜、匆、疋、旦、丰、尺、方、办、币、比、不、斤、见、斥、孔、乏、乎、归、东、丘、乍、电、皮、旦、左、氐、平、司、白、史、皿、发、龙、艮、舟、囟、夹、尧、来、戎、尽、虫、丙、叵、汤、民、曳、式、布、石、区、右、后、页、区、有、可、今、令、卮、师、血、自、向、百、吏、顷、匣、两、叵、耳、灰、丞、在、印、卯、存、乌、延、鸟、寿、卤、忒、昔、亘、丙、北、戊、吏、再、戒、攸、脊、卵、邦、甬、麦、束、声、身、卑、鬲、更、或、羊、半、衣、孝、考、前、册、步、舟、成、戍、戌、甚、垂、啬、青、具、直、柬、局、侯、候、畏、责、函、定、非、贵、叟、黄、毒、散、段、奉、乖、袁、鹿、祭、临、兹、衮、咸、眉、敖、戚、敢、曹、曾、奥、展、兼、断、惠、疑、襄、鼠、塞、赛、寨、寒、褰、謇、赛、蹇、囊等等。
对于‘根字’无需记忆,只需要观察它们的单笔特征即可。只有当它们作为‘字中之字’时,才把它们当作‘字根’看待,以一码取之。有的汉字具备‘根字’特征,但在汉字群中,从来都是独立的汉字即独体字,这也无妨大碍,因为不出现在‘字中之字’中,就不会取它们为‘根字’。这就是本发明实现以‘字’为‘根’的汉字‘拆分规律’。
这里再特别强调一下,‘根字’的概念,是本发明的一种设计理念,是实现以‘字’为‘根’进行汉字拆分的一种规律性构思,其构思是经反复实践后总结出来的,是可行的,不用死记硬背,就可以实现‘见字知根’。
确认属于2字根的一个汉字,须加字形,字形是依照两字根的排列只取G、H、T、Y、N各区之首的编码键。
字形与其代码(即英文字母)的建立关系,只取G编码键、H编码键、T编码键、Y编码键、N编码键,即各区域编码之首,两字根加‘字形’码。字形码来源于构成汉字的两个字根间的相对关系。
字形规则是构成汉字各自独立的字根相互排列的关系,字形是两个字根横排列,编码是G(11);字形是两个字根竖排列,编码是H(21);字形是一个字根从上左方或左下方包住另一个字根,编码是T(31);字形是一个字根从上右或右下方包住另一个字根,编码是Y(41);字形是两个字根盛或罩或穿透,编码是N(51)。
字形是指汉字的“形状”,也是指“两个”字根所构成的汉字“字根”间的相对关系。两个独立笔画块(汉字或部首)存在着横、竖排列以及各种“包围”、“盛”、“罩”、“穿透”关系,汉字的字形就是由此而来。例如八、林、杜、杠、酣、柄、赫、柯、汉、形、对、戏等,构成上述汉字的是两个各自独立的“字根”,它们之间的相对关系是“横”排列;二、士、土、主、王、六、文、旦、昌、吊、虽、胃、贾、某、炎、灸、字等,构成上述汉字的也是两个各自独立的字根,它们之间的相对关系是“竖”排列;厌、病、床、庞、疽、疝、瘕、尿、屎、唇、蜃等等,构成上述汉字的也是两个各自独立的字根,它们之间的相对关系是一个独立的字根,从“上左方”包住另一个字根;这、逗、述、边、廷、遇、遐、迁、虺、旭、尥、尬、尴等,构成上述汉字的也是两个独立的字根,它们之间的相对关系是一个独立的字根,从“左下方”包住另一个字根;甸、旬、匀、氕、氖、氚、氙、氤、等,构成上述汉字的也是两个各自独立的字根,它们之间的关系是一个独立的字根,从“上右方”包住另一个独立的字根;“乳”字是字根爫被字根孔从“右下方”包住;“盛”如杯中盛水,一个字根如“杯”,另一个字根如“水”。例如山、凶、凼等;“罩”如济公捉蟋蟀用的“罩子”,一个字根如“罩子”,另一个字根如“蟋蟀”,罩子“罩”住了“蟋蟀”,例如口、日、日、目、田、月、风、凤、夙、闪、闩、闫、闰、间、闸、闻、阈、阄、闲、凡、等;“穿透”是一个独立的字根“穿透”另一个独立的字根,十(丨穿透一)、小(亅穿透八)、巾(丨穿透冂)、大(人穿透一)、夫(人穿透二)、木(十穿透八)、末(木穿透一)、未(同末)、中(丨穿透口)、申(丨穿透日)、由(士穿透冂)、米(木穿透丷)、丹(亠穿透冂)、丰(丨穿透三)、朱(牛穿透八)、耒(丰穿透八)、乘(乖穿透八)等等。
笔形规则是构成汉字的基本笔形,构成汉字的基本笔形共有八种笔形,八种笔形分别为横、竖、撇、提、点、捺、折和钩,将构成汉字的八种笔形横、竖、撇、提、点、捺、折和钩划分在五组区域码内。
横包含“一”区域码为1,竖包含“丨”区域码为2,撇、提包含“丿、/”区域码为3,点、捺包含“丶、乀”区域码为4,折、钩包含“、乛、多种折笔、亅、、乚、多种钩笔”区域码为5。
构成汉字的笔形共有八种笔形横(一)、竖(丨)、撇(丿)、提(/)、点(丶)、捺(乀)、折(、乛、多种折笔)、钩(亅、、乚、多种钩笔)。汉字的‘笔形’在汉字书法中受‘笔顺’及汉字‘形体美’的制约,这种制约在汉字书法中是十分必要的,也是汉字书法文化的重要内涵。
笔形受笔顺制约主要表现如下横(一)笔在汉字书法中,由于要求书写速度快,在左偏旁的场合,人们都把特定的横(一)笔变成提笔。例如作为左偏旁的‘日’、‘月’、‘目’、‘耳’、‘工’、‘子’、‘土’、‘止’、‘正’、车等等作为左偏旁时,人们都把上述这些字的最后的横(一)笔变成提笔,这样可以提高书写速度;受汉字‘形体美’制约而改变汉字原来笔形的地方很多,这种改变的结果,把汉字整体变得飘逸、庄重、和谐、疏密有致。例如上‘小’下‘大’为‘尖’,‘可’、‘可’为‘哥’中的‘竖钩(亅)’笔变成竖(丨)笔,这种改变使‘尖’、‘哥’整体变得和谐、庄重;当‘辛’、‘半’作为左偏旁时,人们把它们最后的竖笔,变成撇笔,这样处理以后,使汉字‘辩’、‘辫’、‘叛’、‘判’等汉字,整体变得飘逸、和谐、疏密有致;当人们写‘荒’、‘流’时,把构成‘荒’、‘流’中的‘川’字的最后一个‘竖(丨)’笔变成‘竖折钩(乚)’笔,这种改变使‘荒’、‘流’等汉字,整体变得飘逸、庄重;当人们写‘犀’时,把构成‘犀’中的部首 的‘竖钩(亅)’笔变成竖‘丨’笔,这种改变使‘犀’整体变得疏密有致、庄重、和谐;当人们写‘变’、‘恋’、‘峦’等字时,把构成上述汉字的‘亦’的‘撇’和‘竖钩’笔,都变成‘竖’笔,这种改变使上述汉字整体变得端庄、和谐;还有,人们把构成形声字‘贸’和会意字‘留’中的‘卯’字的撇笔和竖笔相应变成了‘点’、‘撇’,使这类汉字变美;‘改’的左边本是‘己’、‘民’的上边本是‘巳’,但是‘己’和‘巳’的‘竖折钩’笔,这里都有改变,这使得‘改’、‘民’变美;解放后在推行简化字的过程中,专家们也是按照汉字书写传统进行的,除了简化外,笔形也有改变。例如‘金’旁变为‘钅’,即把‘点(捺)’变‘横’笔,也是古亦有之。会意字‘每’就是上‘人’下‘母’,只是‘人’的捺笔变为‘横’笔,‘人母’-何人无母,谓之‘每’也;‘食’旁变为‘饣’,‘点(捺)’变为‘横钩’笔,这种改变,对提高书写速度有利。上‘人’下‘小’读‘尔’,也是如此;还有在某些场合把‘月’和‘用’的撇笔变成‘竖’笔、把部首‘冂’的‘横竖折钩’变成‘横竖折’、在某些场合,将‘儿’的撇笔‘丿’起笔位置提高,在‘免’、‘象’、‘鬼’、‘见’等字中‘儿’就是处理的;把构成‘乳’中的‘孔’的‘竖折钩笔’的起笔位置提高以及‘字无双捺’等等,都是‘笔形’受汉字‘形体美’制约的表现。虽然笔形或起笔位置变了,但是字还是原字。但是,输入取码应该以实际笔形取码。
笔顺规则是完成书写字体笔画顺序的准则,笔顺规则为先上后下,先左后右,先外后内,先中间后两边,先里头后封口,先横后竖,先横后撇,先主体后穿心,先主体后配件。
汉字的笔顺是历经漫长的历史时期以及千千万万人在写字过程中所形成的共识,经过千百年来的约定俗成形成了共同遵守的一套笔画排序规则。每个汉字的笔顺都是固定的,具有唯一性,也是为了追求写字速度的必然结果。
笔顺规则是写字要先上后下、先左后右、先外后内、先中间后两边、先里头后封口、先横后竖、先横后撇、先撇后捺、先主体后穿心、先主体后配件。笔顺规则的核心是‘最短路线’原则,它即是笔顺规则的出发点,又是笔顺规则的归宿。
笔画规则是确定提取一个汉字基本笔形的笔画准则,笔画规则为一个汉字只提取四个基本字根,构成汉字的每一个笔画与笔画之间的相互位置及长短、离、连、多种多样的包围、盛、罩、穿透等等关系,按照笔顺规则提取一个汉字的第一字根、第二字根、第三字根和末字根,第一字根至第三字根之间,不准遗漏笔画增加笔画和改变笔形,第三字根和末字根之间允许跨过一笔或多笔,末字根必须包含一个汉字的最末笔形。
汉字是独立的方块字,方块汉字由笔画构成的,每一个笔画在汉字中依笔顺排列。由于汉字的造字原理所致,构成汉字的每一个笔画与笔画之间相互的位置及长短、离、连、多种多样的包围、盛、罩、穿透等等关系,在笔画较多的汉字中,笔画仍旧是一块一块的独立存在,这些独立存在的‘块’,大多是一个独立的汉字或部首。
依照字形规则、笔形规则、笔顺规则、笔画规则,取“字根”首笔的笔形确定区域编码,取“字根”次笔的笔形确定位置编码。
字形规则是指构成汉字的两个字根间的相对关系,将两根加‘字形’码的规则总结,为了便于记忆编成顺口溜如下横1竖2易区分;上左、左下包3形;上右、右下包为4;盛、罩、穿透为5形;字形诸号指区号;字形位号都是1;两根加形是规定;见字识形一见明。
由此得出两个字根横排列,字形码是G(11)、竖排列是H(21);一个字根从上左方或左下方包住另一个字根,字形码是T(31);一个字根从上右或右下方包住另一个字根,字形码是Y(41);‘盛’、‘罩’、‘穿透’,字形码是N(51)。
本发明的编码规则及取码规定概述形的内涵,规则来源;四大规则,编码指南八种笔形;严格笔顺;笔画结构;汉字有形,笔形笔顺,决定根名,笔画规则,决定字形。五区五位,代码记清。八笔五号,笔号记准。见字知根,见字知形。见根知码,两根加形。汉字输入,最多四根。以字为根,单笔特征。部首根字,输入根本,部首输入一码取净,根字输入一码取整。字根代码首次笔定。笔画输入,辅助成分。单笔字根,区由形定,位号为1。最大末根,须含末笔。词组输入,按照规定两字词组1212;三字词组1112;四字词组1111;多字词组111末1。单码字在两字词中出现时,击两次单码。
输入汉字的词组,输入汉字词组中两个字的词组的输入是提取第一个汉字的第一字根的编码和第二字根的编码,再取第二个汉字的第一字根的编码和第二字根的编码。
两字词组取第一字的第一、第二码和第二字的第一、第二码。例如词组PNXM;输入AWTY;汉字OCOX;振兴AGYY;中华MHRV;政治FTOC;技术AFFY;科学TOYY;发展NTNF;经济XCOY;伟大RGGW;祖国PMMG;学校YYFY;编码XPDX;腾飞QINT;讨论PAPW;研究DGOQ;决定INOG;歌颂FFWC;等等。
输入三个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第三个汉字的第二字根的编码。
三字词组取第一字的第一码,第二字的第一码,第三字的第一、第二码。例如解放军QYPA;国务院MQBO;北京市HYYM;天津市;GOYM;山西省HGKM;上海市HOYM;江苏省OFKM;八路军TMPA;内蒙古MFFM;哈萨克MFFM;青海省GOKM;安徽省OEKM;合肥市WQYM;太原市DDYM;南京市FYYM;重庆市TYYM;辨证法YPOF方法论YOPW;宣传部ORYM;等等。
输入四个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第四个汉字的第一字根的编码。
四字词组依次取每个字的第一码。例如一帆风顺GMQR;一蹴而就GMGY;闻所未闻UEGU;一无所有GGEG;科学技术TYAF;发展经济NNXO;发扬光大NALG;熟视无睹YPGM;视而不见PGGM;听而不闻MGGU;听之任之MYRY;正大光明GGLM;两袖清风GPOQ;束手无策GTGT;改革开放NFGY;丰功伟绩GFRX;丰衣足食GYMW;奋不顾身DGDT;随处可见BQGM;文字说明YOPM;半工半读IGIP等等。
输入多个字的词组即大于四个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和最末一个汉字的第一字根的编码。
多字词组依次取第一、第二、第三字的第一码,再取最后一个字的第一码。例如中华人民共和国MRTM;全国人民代表大会WMTW;中华全国工商联合会MRWW;中国共产党MMFL;全国委员会WMTW;全国劳动模范WMFF;石油输出国组织GOAX;政治指导员FOAM;全国妇女联合会WMVW;欲速则不达WFMD;全世界人民WFMN;共产主义青年团FYYM等等。
本发明是计算机汉字编码输入方法。重码率低,重码率低。有两大好处1、单字输入速度快;2、词组输入重码少,对提高汉字输入速度更有意义,特别在大量扩充词组库以后。
本发明特有的拆字方式,汉字拆分不用记忆,分为单笔字根、部首、‘根字’,尤其是‘根字’的拆分,解决了多年来未能解决的大问题。能够作到‘见字知根’、‘见字知形’、‘见根知码’;这样处理完全符合汉字的规范化要求、完全符合汉字的教学要求、完全符合人们的思维习惯。
规范性本发明的四大规则是《字形规则》、《笔形规则》、《笔顺规则》、《笔画规则》,四大规则是完全来源于汉字“形”的内涵,不加入任何设计者的主观臆造,它具有极强的规范性或日汉文化性;易学性使用者只要具备规范地书写汉字的基本素质,就自然地掌握了本发明的全部规则,只需1-2天就能学会并会使用,本发明能够“见根知码”、“见字识形”,彻底消除了汉字计算机输入的“瓶颈”,使用者无需要死记硬背。
社会性强中华民族是使用汉字的民族,无论是小学生、中学生、大学生乃至研究生、博士生,不管文化程度如何,要想规范地将汉字输入计算机要很困难。据统计99%以上的华人不会使用《五笔字型》,即便你下了很大功夫学会了,一段时间不用又忘了,且不规范。再就是学“拼音”,又慢且受发音限制。娃娃们从入学那天起,学习的是规范化汉字,同时又学习电脑。但,没有一种规范而易学的编码供老师教学生,老师和学生们都望眼欲穿地盼望国家推广一种规范而易学的汉字编码供他(她)们教学和学习,本发明正是他(她)们所需要的,也是全体华人所需要的,更是汉字国际化所需要的。
校正性强本发明具有极的规范性,有些人写汉字不规范,因而造成汉字输入计算机时操作不规范。本发明起到了维护汉字规范化的作用,这对提高全民族汉文化水准以及汉字走向国际化,具有特别重要的意义。
以下结合实施例对本发明详细说明。
具体实施例方式
实施例1运用计算机的键盘输入汉字的单字以及输入汉字的词组,将计算机标准键盘的A~Y的字母键设置为编码键,编码键的编码为两位数码,是由区域编码的数码号加位置编码的数码号构成编码键的编码,编码键的编码划分为五组区域编码,每组区域编码各自划分排列为五个位置编码,一区编码键为G(11)、F(12)、D(13)、S(14)、A(15),二区编码键为H(21)、J(22)、K(23)、L(24)、M(25),三区编码键为T(31)、R(32)、E(33)、W(34)、Q(35),四区编码键为Y(41)、U(42)、I(43)、O(44)、P(45),五区编码键为N(51)、B(52)、V(53)、C(54)、X(55)。
实施例2组合成一个汉字是由若干个单笔笔形构成单笔字根或由若干个笔形组合成的字根构成一个汉字,输入一个汉字前,确认属于大于等于4字根的一个汉字,依照笔形规则、笔顺规则、笔画规则,首先取“字根”首笔的笔形号确定“区域编码”,再取字根次笔的笔形号确定“位置编码”。
汉字可以拆分为三种字根单笔字根即八种单笔、部首和根字,根字具有某种特征的独立汉字,无论根字本身的笔画多少,只要拆分后出现单笔,被拆者就是根字。
实施例3完全由部首和‘根字’构成的汉字,进行编码时依照笔形规则、笔顺规则、笔画规则,依次取根,最多取四根,汉字拆分后不会出现有单笔;两根加打字形码;三根取三码;大于或等于四根的取四根,即取一、二、三及末根;字根大于四根的汉字,且字根很多的汉字,依次取完一、二、三根后,末根须取剩余部分最大的汉字。
单笔字根的编码取笔形确定“区域编码”,“位置编码”为1。
确认属于2字根的一个汉字,须加字形,字形是依照两字根的排列只取G、H、T、Y、N各区之首的编码键。
实施例4字形规则是构成汉字各自独立的字根相互排列的关系,字形是两个字根横排列,编码是G(11);字形是两个字根竖排列,编码是H(21);字形是一个字根从上左方或左下方包住另一个字根,编码是T(31);字形是一个字根从上右或右下方包住另一个字根,编码是Y(41);字形是两个字根盛或罩或穿透,编码是N(51)。
笔形规则是构成汉字的基本笔形,构成汉字的基本笔形共有八种笔形,八种笔形分别为横、竖、撇、提、点、捺、折和钩,将构成汉字的八种笔形横、竖、撇、提、点、捺、折和钩划分在五组区域码内。
横包含“一”区域码为1,竖包含“丨”区域码为2,撇、提包含“丿、/”区域码为3,点、捺包含“丶、乀”区域码为4,折、钩包含“、乛、多种折笔、亅、、乚、多种钩笔”区域码为5。
笔顺规则是完成书写字体笔画顺序的准则,笔顺规则为先上后下,先左后右,先外后内,先中间后两边,先里头后封口,先横后竖,先横后撇,先主体后穿心,先主体后配件。
笔画规则是确定提取一个汉字基本笔形的笔画准则,笔画规则为一个汉字只提取四个基本字根,构成汉字的每一个笔画与笔画之间的相互位置及长短、离、连、多种多样的包围、盛、罩、穿透等等关系,按照笔顺规则提取一个汉字的第一字根、第二字根、第三字根和末字根,第一字根至第三字根之间,不准遗漏笔画增加笔画和改变笔形,第三字根和末字根之间允许跨过一笔或多笔,末字根必须包含一个汉字的最末笔形。
依照字形规则、笔形规则、笔顺规则、笔画规则,取“字根”首笔的笔形确定区域编码,取“字根”次笔的笔形确定位置编码。
实施例5输入汉字的词组,输入汉字词组中两个字的词组的输入是提取第一个汉字的第一字根的编码和第二字根的编码,再取第二个汉字的第一字根的编码和第二字根的编码。
实施例6输入三个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第三个汉字的第二字根的编码。
实施例7输入四个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第四个汉字的第一字根的编码。
实施例8输入多个字的词组即大于四个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和最末一个汉字的第一字根的编码。
权利要求
1.一种计算机汉字编码输入方法,其特征是运用计算机的键盘输入汉字的单字以及输入汉字的词组,将计算机标准键盘的A~Y的字母键设置为编码键,编码键的编码为两位数码,是由区域编码的数码号加位置编码的数码号构成编码键的编码,编码键的编码划分为五组区域编码,每组区域编码各自划分排列为五个位置编码,一区编码键为G(11)、F(12)、D(13)、S(14)、A(15),二区编码键为H(21)、J(22)、K(23)、L(24)、M(25),三区编码键为T(31)、R(32)、E(33)、W(34)、Q(35),四区编码键为Y(41)、U(42)、I(43)、O(44)、P(45),五区编码键为N(51)、B(52)、V(53)、C(54)、X(55);组合成一个汉字是由若干个单笔笔形构成单笔字根或由若干个笔形组合成的字根构成一个汉字,输入一个汉字前,确认属于大于等于4字根的一个汉字,依照字形规则、笔形规则、笔顺规则、笔画规则,首先取“字根”首笔的笔形号确定“区域编码”,再取字根次笔的笔形号确定“位置编码”;汉字可以拆分为三种字根单笔字根即八种单笔、部首和根字,根字具有某种特征的独立汉字,无论根字本身的笔画多少,只要拆分后出现单笔,被拆者就是根字;完全由部首和‘根字’构成的汉字,进行编码时依照笔形规则、笔顺规则、笔画规则,依次取根,最多取四根,汉字拆分后不会出现有单笔;两根加打字形码;三根取三码;大于或等于四根的取四根,即取一、二、三及末根;字根大于四根的汉字,且字根很多的汉字,依次取完一、二、三根后,末根须取剩余部分最大的汉字;单笔字根的编码取笔形确定“区域编码”,“位置编码”为1;确认属于2字根的一个汉字,须加字形,字形是依照两字根的排列只取G、H、T、Y、N各区之首的编码键;字形规则是构成汉字各自独立的字根相互排列的关系,字形是两个字根横排列,编码是G(11);字形是两个字根竖排列,编码是H(21);字形是一个字根从上左方或左下方包住另一个字根,编码是T(31);字形是一个字根从上右或右下方包住另一个字根,编码是Y(41);字形是两个字根盛或罩或穿透,编码是N(51);笔形规则是构成汉字的基本笔形,构成汉字的基本笔形共有八种笔形,八种笔形分别为横、竖、撇、提、点、捺、折和钩,将构成汉字的八种笔形横、竖、撇、提、点、捺、折和钩划分在五组区域码内;横包含“一”区域码为1,竖包含“丨”区域码为2,撇、提包含“丿、/”区域码为3,点、捺包含“丶、ㄟ”区域码为4,折、钩包含“、乛、多种折笔、亅、、乚、多种钩笔”区域码为5;笔顺规则是完成书写字体笔画顺序的准则,笔顺规则为先上后下,先左后右,先外后内,先中间后两边,先里头后封口,先横后竖,先横后撇,先主体后穿心,先主体后配件;笔画规则是确定提取一个汉字基本笔形的笔画准则,笔画规则为一个汉字只提取四个基本字根,构成汉字的每一个笔画与笔画之间的相互位置及长短、离、连、多种多样的包围、盛、罩、穿透等等关系,按照笔顺规则提取一个汉字的第一字根、第二字根、第三字根和末字根,第一字根至第三字根之间,不准遗漏笔画增加笔画和改变笔形,第三字根和末字根之间允许跨过一笔或多笔,末字根必须包含一个汉字的最末笔形;依照字形规则、笔形规则、笔顺规则、笔画规则,取“字根”首笔的笔形确定区域编码,取“字根”次笔的笔形确定位置编码。
2.根据权利要求1所述的计算机汉字编码输入方法,其特征在于所述的输入汉字的词组,输入汉字词组中两个字的词组的输入是提取第一个汉字的第一字根的编码和第二字根的编码,再取第二个汉字的第一字根的编码和第二字根的编码;输入三个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第三个汉字的第二字根的编码;输入四个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第四个汉字的第一字根的编码;输入多个字的词组即大于四个字的词组是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和最末一个汉字的第一字根的编码。
全文摘要
本发明是计算机汉字编码输入方法。运用计算机的键盘输入汉字的单字以及输入汉字的词组,将计算机标准键盘的A~Y的字母键设置为编码键,编码键的编码为两位数码,是由区域编码的数码号加位置编码的数码号构成编码键的编码,编码键的编码划分为五组区域编码,每组区域编码各自划分排列为五个位置编码,进行编码时依照笔形规则、笔顺规则、笔画规则,依次取根,最多取四根。本发明特有的拆字方式,汉字拆分不用记忆,分为单笔字根、部首、‘根字’,尤其是‘根字’的拆分,解决了多年来未能解决的大问题。能够作到‘见字知根’、‘见字知形’、‘见根知码’;这样处理完全符合汉字的规范化要求、完全符合汉字的教学要求、完全符合人们的思维习惯。
文档编号G06F3/023GK1889021SQ20061001477
公开日2007年1月3日 申请日期2006年7月14日 优先权日2006年7月14日
发明者孙自匡 申请人:孙自匡
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1