一种查字打字用同一个编码的两笔字中文电脑查字打字法的制作方法

文档序号:15998025发布日期:2018-11-20 19:05阅读:321来源:国知局
本发明涉及汉字输入法
技术领域
,尤其涉及一种查字打字用同一个编码的查字打字相结合的二维两笔字中文电脑查字打字法。
背景技术
:当代人类社会最重大的科技发明是电子计算机。电子计算机的出现,对人类社会发展所起的作用是具有划时代的意义,它是一门影响到所有领域,所有学科的一门科学技术。其中在汉字输入领域,与电子计算机技术结合的产物就是汉字输入法,汉字输入法能够实现将汉字用计算机语言表达。国家早在1992年6月就明确提出:“汉字输入系统要和学生们的识字、写字、查字和打字结合起来”的“相结合”方针,为了实现计算机汉字输入系统和学生们的学习相结合,国家曾两渡立项重点攻关和二十多年的编码大战,提出的编码方案上千种,相结合问题没有解决。对于汉字进入计算机问题,就汉字本身而言已得到了解决,现在说的还没有解决是指汉字编码的简单性、规范性、排序性和结合性(国家教委:汉字输入系统要和学生们识字、写字、查字和打字相结合)等方面问题。要解决上述问题关键在于要解决相结合问题。相结合的关键是查字、打字相结合,查字、打字相结合的关键是查字,查字的关键是字典,字典的关键是汉字排序,是计算机汉字编码和字典检索码完全一致的汉字排序。有了这样的汉字排序,才能编出用同一编码查字打字相结合的新字典,有了这样的新字典,汉字输入系统和学生们的“识字、写字、查字和打字”结合起来的问题才能解决。汉字排序是千古难题作为现在已经在国内普及的拼音输入法,拼音没排序,是没有按汉语声母、韵母规律的排序,而是套用26个英文字母的排序来对中文排序。对英文来讲是成功的,对中文就不同了。中文的特点是一声四调,一音多字,一次排序不行,还要按声调进行二次排序。现在虽然字典,电脑都用拼音输入法,但是存在着缺点是重音字多。如读音“衣”的同音字就有110多个,不但字典要翻页,电脑更要不断的翻页。如果遇到不会读的字,拼音法就无法使用了。而拼音法是1958年出台的,它不能完全符合1992年提出的“四结合”要求。为了解决上述拼音输入法存在的技术问题,现有技术中出现了很多以汉字自行为基础的形码输入法。如公布号为CN103324299A的中国授权发明专利,提出了一种基于汉字基础部件的汉字象形码计算机输入法,该输入法中根据“GB13000.1字符集汉字部件”限定了560种汉字基础部件与英文字母的一一对应关系,也就是定义出560种单体字母或字母组合来一一对应560种汉字基础部件,在实际使用中其记忆难度可想而知。又如公布号为CN103760989A的中国授权发明专利,提出了一种和码横竖加撇捺字形技术与输入法,该输入法中把字根分为单笔画、核心形义字根与组合字根三个层次,把形状相同或相似的字根归并到一起,字根有码名和码值。各字根依其第一笔画的横竖撇捺分类,字根表分5个区,横类的字根占两个区,其它竖类撇类捺类各占一区,把第一笔画是横且与其它笔画相交的字根从横类字根中分离出来放在第三区,字根表的5个区是1横2竖3加4撇5捺,在区内字根依其对字义与字形的限定性由小到大的顺序分为五个位。单字最多分为四块,最多有4个码,单字取码以字块为基础。25个码形成25个字形字母,排布在单手键盘的25个输入键上,也用于输入软件上的输入码显示。和码字形技术对字形的学习与输入有益。该输入法方案所依托的字根分类方式或称为编码方式先按照横竖撇捺分类,之后分区,最后在各区相交,相交后每一区再按顺序分类,最终得到的字根数量虽少,但是每个字根的含义都有好多个,组合使用时重码率还是很高。又如公布号为CN104571593A的中国授权发明专利,提出了一种全部汉字汉词简易无重码统一输入法,该输入法用313构块拼写一切汉字;构块全都本有或汉语自然地赋有块音,串连每一字/词的最多4/5块音,即成该字/词的拼块音,如同德国人能依简明规则从德语词形直接读出词音,中国人也能依简明规则从汉语字形/词形直接读出字拼块音/词拼块音;默念字/词的拼块音同时便确定它的准码或拼块码,拼块码字典序是汉语全部约十万/百万标准字形/词形的简易无重码序。应用本发明,任何汉字/汉词的电脑手机输入,键/写/读完其简码或拼块码即输入该字/词;辞书文档检索,查得其准码即查得该字/词。又如公布号为CN104571593A的中国授权发明专利,提出了一种一种连山汉字输入方法,该输入法包括如下步骤:(1.1)将常用的汉字偏旁部首作为基本部首,形成部首库;(1.2)将部首库中的基本部首按连山易经的原理进行排列,形成27行9列的连山部首表,形成连山部首表,并将连山部首表中的每个主部首,分别映射至计算机键盘相应的键位;(1.3)将要输入的汉字进行部首划分,提取汉字的首部首和尾部首;(1.4)分别输入汉字首部首在连山部首表中的纵坐标字母和横坐标字母,输入尾部首在连山部首表中的纵坐标字母。该输入法中,按连山易经原理对部首分类时主观性太强,会导致后续输入时例外情况过多。又如公布号为CN104898862A的中国授权发明专利,提出了一种形母码汉字输入法,该输入法将汉字按汉字部件规范拆分单元分为基本形母、普通形母和组合形母,基本形母单独成字,在基本形母所在键名后加字母V;普通形母单独成字,在普通形母所在键名后加字的汉语拼音首字母;两码组成一字,输入两码所在键名的字母,少部分在两码后加字的汉语拼音首字母;三码组成一字,输入三码所在键名字母;四码组成一字,输入四码所在键名字母;超过四码组成一字,输入“首、二、中、末”四码所在键名;对于由两个字组成的词组,取“首末、首末”;对于由三个字组成的词组,取“首、首、首末”;对于由四个或四个以上字组成的词组,取“首、首、首、首”。该输入法中设定了26个基本形母分别与键盘上26个英文字母键对应;设置了146个普通形母,分配到键盘26个英文字母键上;设置了341个组合形母,分别从26个英文字母中选择1个或多个英文字母对应。之后利用上述基本形母、普通形母和组合形母,进行汉字编码。该编码由于形母数量过多,编码规则限定太多。上述所有的输入法都是基于设置新型的字根组合,然后利用字根组合对汉字进行编码,形成一套数据库,该库中每一个汉字对应一种字根组合。之后将字根与现有技术中标准键盘的案件形成对应关系。这种输入法设计思路没有问题,但是关键在字根设置是否科学,形成的汉字编码是否一一对应简单易用是关键。那么,上述所有授权专利中记载的输入法方案存在这同样的问题,那就是都是用二三十个代码代表二三百个甚至更多汉字信息(部件或字根),代码与字根不是1:1关系,导致编码太复杂可读性差。上述问题在公布号为CN1070750A的中国授权发明专利中得到了比较好的解决,该专利提出了一种两笔码汉字输入法,其利用直角坐标系原理,将汉字的横、竖、撇、捺、折五种笔素进行了十字交叉组合,形成了15个二维两笔字,之后利用该15个二维两笔字对每个汉字进行编码。将15个二维两笔字在标准键盘上选择15个按键建立一一对应关系即可实现汉字的输入。该方案中15个汉字信息(部件或字根)与15个代码是一一对应的。针对公布号为CN1070750A的中国授权发明专利,发明人发现其还存在着不完善之处,即在汉字输入过程中未对部首、少笔字、单笔画字的取码不科学。技术实现要素:本发明的目的在于提供一种基于查字打字用同一个编码的二维两笔字的中文电脑查字打字法,以解决现有技术中存在的汉字输入过程中未对部首、少笔字、单笔画字的取码不科学的技术问题。本发明提供的诸多技术方案中的优选技术方案所能产生的诸多技术效果详见下文阐述。为实现上述目的,本发明提供了以下技术方案:一种基于查字打字用同一个编码的二维两笔字的中文电脑查字打字法,包括以下步骤:S01:建立二维两笔字体系(如表1所示):表1选择横、竖、撇、捺、折五种基本笔画在直角坐标系中进行二维垂直交叉组合,组合得到15个由两笔画组成的两笔画汉字,称为二维两笔字;将15个所述二维两笔字分别与1~9、0、A、B、C、D、E等代码符号建立一一对应关系(如表2所示)形成所述二维两笔字体系;表2两笔字折捺横竖横撇横捺横折竖撇竖捺竖折撇捺撇折横横竖竖撇撇捺捺折折代码符号0123456789ABCDES02:建立二维两笔字十六进制代码系统(如表3所示):表3代码系统0123456789ABCDE16进制数000000010010001101000101011001111000100110101011110011011110两笔字折捺横竖横撇横捺横折竖撇竖捺竖折撇捺撇折横横竖竖撇撇捺捺折折将上述二维两笔字体系与十六进制代码结合,建立所述二维两笔字-代码-16进制数一一对应的所述二维两笔字十六进制代码系统;S03:建立汉字代码库对依汉字的结构特点,偏旁部首和笔顺规则,结合所述二维两笔字十六进制代码系统对汉字进行十六进制固定有序编码,方法为:(1)对汉字组成进行科学定义,定义由三个或不足三个笔画组成的构件为部首构件;定义由四个或四个以上笔画组成的构件为单体构件;定义由一个单体构件或一个部首构件组成的汉字为独体字;定义由一个部首构件与至少一个单体构件组成或者由至少两个单体构件组成的汉字为合体字;(2)对汉字取码数进行限定。限定汉字取码数量可以为一码、二码、三码或四码。(3)独体字编码按照汉字书写笔顺,取前三后一四个两笔字对应的所述代码组成的四位两笔字编码;(4)合体字编码按照汉字书写笔顺,取组成合体字的部首构件或单体构件的首码或首码与尾码组成的四位两笔字编码;S04:电脑打字在键盘上根据汉字对应的所述二维两笔字编码输入1~9、0、A、B、C、D、E等代码符号,系统根据所述汉字代码库调出对应汉字。可选的,本发明实施例的基于查字打字用同一个编码的二维两笔字的中文电脑查字打字法还包括:S05:建立汉字二维两笔字编码排序系统(如表4所示)按照所述二维两笔字编码大小,从小到大依次排列所有汉字对应的所述二维二维两笔字编码,形成所述汉字二维两笔字编码排序系统;表4S06:字典查字确定待查汉字的所述二维两笔字编码,按照所述二维两笔字编码大小在所述二维两笔字编码排序系统中找到其对应位置,进而找到该所述二维两笔字编码对应的汉字。可选的,根据所述的二维两笔字编码排序系统编写“中文电脑字典”,所述“中文电脑字典”中汉字排序,是按照所述二维两笔字编码大小进行排序的,且所述“中文电脑字典”的每一个汉字下均含有对该汉字的注音字母注音、汉字注音、拼音注音,汉字释义,汉字的结构、汉字的部首、汉字的笔画数和汉字的书写笔顺以及繁体字的直接查找等九大功能。可选的,在汉字取码过程中,对于不足四码的少笔画字,进行全笔画取码,其中:双笔画字取完为止;单笔画字取码过程中,其最后一个笔画与其前一个笔画组成汉字末尾加笔取码,所述汉字末尾加笔取码仍与15个所述两笔字对应;所述汉字末尾加笔取码只能出现在汉字编码的最后一码。可选的,偏旁部首重新定义由三个笔画组成,所述偏旁部首的取码,按照偏旁部首的书写笔顺,只取开始两个笔画对应的代码,放弃最后一个笔画的取码,与15个两笔字对应的代码相符合。可选的,定义“木”、“钅”、“”、“火”为四个多笔画偏旁部首构件,只取开始两个笔画对应的代码,放弃后边所有笔画的取码。可选的,合体字左侧构件出现单笔画,定义取码时去掉左侧构件中间一个笔画取码。可选的,对于三个以上构件组成的多体字,取码时依笔顺取各个分体字的首位码,或首、尾码组成汉字的四位二维二维两笔字编码。可选的,对于三个构件组成的多体字,按照笔顺取最左侧构件的首码和尾码、取中间构件的首码、取第三个构件的尾码组成四位二维两笔字编码。可选的,所述基于查字打字用同一个编码的二维两笔字的中文电脑查字打字法还包括代码口诀,所述代码口诀为:⑴有横有竖便是1;⑵有横有撇便是2;⑶有横有点便是3;⑷有横有折便是4;⑸有竖有撇便是5;⑹有竖有点便是6;⑺有竖有折便是7;⑻有撇有点便是8;⑼有撇有折便是9;⑽有折有点便是0;⑾横横A,竖竖B;⑿撇撇C,点点D;⒀有折有折便是E;所述代码口诀用于使用者快速在键盘上键入所述二维两笔字编码。本发明的查字打字用同一个编码的二维两笔字中文电脑查字打字法的有益效果在于汉字在取码输入时更加科学,逻辑性更强。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。本发明实施方式提供了一种查字打字用同一个编码的两笔字中文电脑查字打字法,其特征在于,包括以下步骤:S01:建立两笔字体系(如表1所示):表1选择横、竖、撇、捺、折五种基本笔画放在直角坐标系中进行二维垂直交叉组合,组合得到15个(由两笔画组成的两笔画汉字,称为二维)两笔字;将15个所述两笔字分别与1~9、0、A、B、C、D、E等代码符号建立一一对应关系(如表2所示)形成所述二维两笔字体系;表2两笔字折捺横竖横撇横捺横折竖撇竖捺竖折撇捺撇折横横竖竖撇撇捺捺折折代码符号0123456789ABCDES02:建立两笔字十六进制代码系统(如表3所示):表3代码系统0123456789ABCDE16进制数000000010010001101000101011001111000100110101011110011011110两笔字折捺横竖横撇横捺横折竖撇竖捺竖折撇捺撇折横横竖竖撇撇捺捺折折将上述两笔字体系与十六进制代码结合,建立所述两笔字-代码-16进制数一一对应的所述两笔字十六进制代码系统;S03:建立汉字代码库依汉字的结构特点,偏旁部首和笔顺规则,结合所述两笔字十六进制代码系统对汉字进行十六进制固定有序编码,方法为:(1)对汉字组成进行科学定义,定义由三个或不足三个笔画组成的构件为部首构件;定义由四个或四个以上笔画组成的构件为单体构件;定义由一个单体构件或一个部首构件组成的汉字为独体字;定义由一个部首构件与至少一个单体构件组成或者由至少两个单体构件组成的汉字为合体字;(2)对汉字取码数进行限定限定汉字取码数量可以为一码、二码、三码或四码;(3)独体字编码按照汉字书写笔顺,取前三后一四个两笔字对应的所述代码组成四位两笔字编码;(4)合体字编码按照汉字书写笔顺,取组成合体字的部首构件或单体构件的首码或首码与尾码组成四位两笔字编码;S04:电脑打字在键盘上根据汉字对应的所述两笔字编码输入1~9、0、A、B、C、D、E等代码符号,系统根据所述汉字代码库调出对应汉字。具体的,之所以选用横、竖、撇、捺、折五种笔画作为本发明实施方式的输入法,其原因在于上述这5种笔画在汉字的书写中是使用频率最高也是最基础的五种笔素。也只能是这五种笔素。笔画定义:在汉字书写时,从下笔到提笔,笔尖连续经过的路径,留下来的墨迹,定义为笔画或一个笔画。根据笔尖连续运笔的方向不同,笔画可分为下面五种,汉字笔画也只能是这五种。(1)横笔画:在水平方向,由左向右连续运笔,运笔方向不发生改变和转折的,称“横”笔画。(2)竖笔画:在垂直方向,由上往下连续运笔,运笔方向不发生改变和转折的,称“竖”笔画。(3)撇笔画:从右(或左)上方往左(或右)下方连续运笔,运笔方向不发生改变和转折的,称“撇”(或提)笔画。也就是把过去的“提”归“横”改为“提”归“撇”。(4)捺笔画:从左上方往右下方连续运笔,运笔方向不发生改变和转折的,称“捺(含点)”笔画。(5)折笔画:运笔方向发生改变或转折的这类笔画,称为“折”笔画。根据笔画定义,把过去的“竖钩”归“竖”改为“竖钩”归“折”。具体的,对数学领域的直角坐标系统,在建立两笔字体系中的应用做如下详细解释:如上述表1所示,本发明实施方式首次把数学领域中的有关理论---直角坐标系统引入汉字输入法领域。把横、竖、撇、捺、折五种笔画,放在直角坐标系统中。横坐标从左到右,纵坐标从上到下,对五种笔画进行二维垂直交叉组合成十五个由两个笔画组成的“两笔画汉字”,称为“二维两笔字”或“二维两笔码”,统称为“两笔字”。二维垂直交叉组合的两笔字,从表1中可以清楚地看出:相异笔画组合的两笔字有十种,相同笔画组合的两笔字有五种。具体的,通过直角坐标系统与5个基本笔画结合得出15个两笔字后,因计算机键盘上没有这十五种组合的“两笔字”符号,如果要把这些“两笔字”和计算机发生作用,就必须在键盘上寻找代替符号。需要将15个两笔字与标准代码进行对应,如标准代码可以为数字或字母等。键盘上只有二十六个英文字母,十个数字和四个标符号。经过分析比较后,决定选用和十六进制代码系统一样的,也是人们最熟悉、最常用的十个数字(0-9)和五个字母(A、B、C、D、E)为代码。而每一个两笔字代码,都是由横、竖、撇、捺、折五种笔画在二维表中的变化规律决定的。如“横竖”或“竖横”笔画组合的“二维两笔字”,不管这两个笔画是相交还是相分离,只要是出现在要取的两个顺笔,就可以把它看成是由“横竖”笔画组成的“二维两笔字”,其代码定义为“1”。同理“横撇”笔画组合的“二维两笔字”,其代码定义为“2”……。“横横”笔画组合的“二维两笔字”,其代码定义为“A”……,详见表2。具体的,利用这十五种“二维两笔字”的笔画,可以组合成任何一个汉字。反过来,任何一个汉字也可以用这十五种“二维两笔字”的笔画来表示。因此,对汉字编码就可以用这十五种“二维两笔字”来进行。只要记住这十五种“二维两笔字”及其代码,就可以对任何汉字进行十六进制固定有序编码,具体的就可以进行查字和打字了。这就是本技术的核心理论。汉字代码库的形式类似于现有技术中的各种字符库,区别在于其定义字符所采用的技术手段不同,具体如下:对汉字组成进行科学定义,定义由三个或不足三个笔画组成的构件为部首构件;定义由四个或四个以上笔画组成的构件为单体构件;定义由一个单体构件或一个部首构件组成的汉字为独体字;定义由一个部首构件与至少一个单体构件组成或者由至少两个单体构件组成的汉字为合体字。对汉字取码数进行限定,限定汉字取码数量可以为一码、二码、三码或四码。独体字编码按照汉字书写笔顺,取前三后一的四个两笔字编码对应的所述代码组成四位两笔字编码。合体字编码按照汉字书写笔顺,取组成合体字的部首构件或单体构件的首码或首码与尾码组成四位两笔字编码,具体编码实施例如下:多笔画的独体字编码以“商”为例,依笔顺取前三个两笔字和最后一个两笔字,组成汉字四位二维两笔字编码,具体如下:①取“商”字开始两个“捺横”笔画为首位码:亠=3②取“商”字三、四两个“捺撇”笔画为次位码:丷=8→〓3874③取“商”字五、六两个“竖折”笔画为次次位码:冂=7④取“商”字最后两个“折横”笔画为未位码:コ=4则3874就是“商”字的四位二维两笔字编码,查字和打字就用这个编码。多笔画的合体字编码以“粮”字为例,依笔顺取各个分体字的首位码,未位码组成汉字的四位二维两笔字编码,具体如下:①取“粮”字开始两个“捺撇”笔画为首位码:丷=8②取左边分体字(米)最后两个“撇捺”笔画为次位码:丶=8→〓8808③取右边分体字(良)开始两个“捺折”笔画为次次码:、┐=0④取“粮”字的最后两个“撇捺”笔画为未位码:ノㄟ=8则“8808”就是“粮”字的四位二维两笔字编码,查字和打字就用这个编码。多笔画的多体字编码以“糊”字为例,依笔顺取各个分体字的首位码,或首、尾码组成汉字的四位二维两笔字编码,具体如下:①取“糊”字开始的两个“捺撇”笔画为首位码:丷=8②取左边分体字(米)最后两个“撇捺”笔画为次位码:ノ丶=8→〓881A③取中间分体字(古)开始两个“横竖”笔画为次次码:十=1④取“糊”字最后两个“横横”笔画为未位码:二=A则“881A”就是“糊”字的四位二维两笔字编码。查字和打字就用这个编码。带偏旁部首的多体字编码以“獭”字为例,依笔顺取各个分体字的首位码,或首、尾码组成汉字的四位二维两笔字编码,具体如下:①取“犭”部首开始两个“撇折”笔画为首位码:犭=9②取中间分体字(束)开始两个“横竖”笔画为次位码:一丨=1→〓9188③取中间分体字(束)最后两个“撇捺”笔画为次次码:丿丶=8④取“獭”字最后两个“撇捺”笔画为未位码:丿丶=8则9188就是“獭”字的四位二维两笔字编码。查字和打字就用这个编码。少笔画字(不足四个编码的汉字)编码。1)最后不出单现笔画的:依笔顺,两笔取一码,取完为止,举例如下表所示:又十厂七人双计支五书买观防肉米后0124800011014E6038079739788818C142)最后出现单笔画的:依笔顺两笔取一码,最后出现的单笔画,要加笔取码,举例如下表所示:一工大才个小圣对正东评我兵足A112849869801104011149803212998512871283)左边出现单笔画的:要丢掉中间一笔,举例如下表所示:郃劲劫邴利即补邱邮盯初知秆0470591091872874070865577177A4089287428A14)带偏旁部首的汉字:偏旁部首部分,只取开始两笔编码,其余丢掉,举例如下表所示:权邛钊扑叹节灯汁块材忙吹笮1017274670B7C4D1148149634798221A本发明上述实施方式的有益效果在于:对汉字的编码手段更为完善,对于以写特殊情况进行了技术限定,使重码率得到了进一步的降低。编码不拆字,不读音,不受方言、地域影响,不会读的字,不会拼的字,一样通用。编码能和学生写字相结合,编码是按汉字的结构特点和笔顺规则进行的,和学生写字是一致的。编码能直接查找繁体字。繁体字简体字的汉字编码是不相同的,可以用编码分别去直接查找。重码少,用二维两笔字编码,七千八百多常用汉字的单码率高达80%,重码字少,一般都是三五个,最多的是九个字,它只有一个编码。作为可选的实施方式,在本发明上述实施方式的基础上,还包括步骤4,具体为:S05:汉字二维两笔字编码排序成功(如表4所示)按照所述二维两笔字编码的大小,从小到大依次排列所有汉字对应的所述二维两笔字编码,形成所述二维两笔字编码排序系统;表4S06:字典查字具体的,要想实现根据本发明实施方式的查字打字法查字,首要是需要对二维两笔字编码进行排序,以使汉字有一个对应排序。最后根据代码的顺序找到对应的汉字。本实施方式中,用二维两笔字编码方法,对汉字进行编码。然后按汉字编码的大小,从0,1,2开始,逐渐增大形成的有序排列,称汉字二维两笔字排序系统,简称二维两笔字排序系统。两笔字排序系统具有和十六进制一样的规律性和排序性,逻辑上容易理解,操作上简单易上手。作为可选的实施方式,在上述实施方式的基础上,根据所述的二维两笔字编码排序编写“中文电脑字典”,所述“中文电脑字典”中汉字排序是按照所述二维两笔字编码大小进行排序的,且所述中文电脑字典的每一个汉字下均含有对该汉字的注音字母注音、汉字注音,拼音注音,汉字释义,汉字的结构,汉字的部首,汉字的笔画数和汉字的书写笔顺以及繁体字的直接查找等九大功能。其中所述的汉字注音,是采用汉字对汉字进行的注音。具体的,作为一个综合的具有查字打字输入,字典作为一个技术特征,与二维码库以及电脑输入结合可以使查字更为便捷。一本字典,就是一个汉字排序。一个汉字排序,就是一本字典。有了新的汉字排序系统,就一定有新的字典。新的《中文电脑字典》编纂成功,解开了汉字输入瓶颈问题。也迎来了汉字输入系统进入中小学课堂和学生们的识字、写字、查字和打字结合起来”的中国计算机新时代。《中文电脑字典》编纂工作,就是按二维两笔字排序系统的大小,从0、1、2开始,一个字一个字的编写,录入。录入的每个字除了具有和《新华字典》一样的注音字母注音,拼音注音和汉字释义功能外。比它还增多了一种用汉字来注音的汉字注音;增多了汉字的结构,汉字的部首,汉字的笔画数和汉字的书写笔顺,以及繁体字的直接查找等六项功能。这些都是中小学生学习汉字所必须掌握的基本知识。《中文电脑字典》编入的汉字,能用编码直接查找的汉字,一共有九千二百多个。它是计算机一二级字库中的所有汉字,和简体字相对应的繁体字、异体字。《中文电脑字典》内容除了字典的正文外,在字典后面还附有拼音排序与二维两笔字对照检字表。考虑到我国是一个多民族国家,不可能人人都能正确使用普通话,为了满足各民族同胞对汉字读音的要求,决定增多一种用汉字来注音的汉字注音。让我国各民族同胞,海外侨胞,不懂拼音的,能通过汉字的注音来获得汉字的正确读音。为了适应信息时代要求和广大群众对繁体字、异体字的查找和录入需要,增多了简体字相对应的繁体字,异体字两千五百多。这样用编码直接查找的汉字总数,达到了九千二百多个。本发明实施方式的《中文电脑字典》具有以下技术特点:①编码不拆字,不读音,不受方言、地域影响,不会读的字,不会拼的字,一样通用。②编码能和学生们的写字相结合。编码是按汉字的结构特点和笔顺规则进行的,和学生写字是一致的。③编码能直接查找繁体字。繁体字简体字的汉字编码是不相同的,可以用编码分别去直接查找。④重码少。用二维两笔字编码,七千八百多常用汉字的单码率高达80%,重码字少,一般都是三五个,最多的是九个字,它只有一个编码。⑤字典功能:和“新华字典“比较,增多了一种(用汉字来注音的)汉字注音,增多了繁体字的直接查找和每个汉字的结构、部首、笔画数以及汉字的书写笔顺等六种功能。作为可选的实施方式,在汉字取码过程中,对于不足四码的少笔画字,进行全笔画取码,其中:双笔画字取完为止;单笔画字取码过程中,其最后一个笔画与其前一个笔画组成汉字末尾加笔取码,所述汉字末尾加笔取码仍与15个所述两笔字对应;所述汉字末尾加笔取码只能出现在汉字编码的最后一码。具体的,在过去的汉字编码中,对出现的单笔画,都是在键盘上定义五个字母键解决,这样解决的结果,使代码键从25个增加到了30个。本技术对不足四个编码的少笔画字,最后出现的单笔画。采用和前一个笔画组成“二维两笔字”的方法解决。并定义为“未位加笔取码”,简称“加笔取码”或“加笔码”。加笔取码只适用于少笔画字,只能出现在汉字编码的未位,不能出现在其它任何地方。编码采用加笔取码的方法来实现与其它二维两笔字编码统一。二维两笔字15个代码没有增加,仍然是15个。作为可选的实施方式,对于所述偏旁部首构件的取码,按照偏旁部首的笔顺,只取开始两个笔画对应的代码,放弃最后一个笔画的取码,与15个两笔字对应的代码相符合。并定义“木”、“钅”、“”、“火”为四个多笔画偏旁部首构件,只取开始两个笔画对应的代码,放弃后边所有笔画的取码。具体的,过去对偏旁、部首只定了形,没定好义。什么的是偏旁、部首,什么样的不是偏旁、部首,没有一个严格的科学理论依据,给学习带来一定困难。为了便于学习和掌握。本技术对偏旁、部首重新定义由三个笔画组成。这样定义的偏旁、部首,就有了一个量的概念,一看就懂,一用就会。对偏旁、部首的编码,就可以形成一个规律:依笔顺只取开始两个笔画编码,丢掉一笔。除此还定义“木”,“钅”,“”,“火”四个多笔画部首,在取笔画编码时,同样是取开始两个笔画编码,其余丢掉。采用这种丢笔的编码方法来实现与其它二维两笔字编码统一,二维两笔字15个代码没有增加,仍然是15个。(例如:艹取“B”,“忄”取“6”)。作为可选的实施方式,所述的查字打字用同一个编码的两笔字中文电脑查字打字法还包括代码口诀,所述代码口诀为:⑴有横有竖便是1;⑵有横有撇便是2;⑶有横有点便是3;⑷有横有折便是4;⑸有竖有撇便是5;⑹有竖有点便是6;⑺有竖有折便是7;⑻有撇有点便是8;⑼有撇有折便是9;⑽有折有点便是0;⑾横横A,竖竖B;⑿撇撇C,点点D;⒀有折有折便是E;所述代码口诀用于使用者快速在键盘上键入所述的二维两笔字编码。具体的,另外学习二维两笔字,不需要键盘配合,只用十三句编码口诀,就可以在课堂上进行汉字的编码教学和学习了。非常适合我国中小学生和广大群众学习使用。由于受到拆字编码不规范的影响,一些不规范汉字写法,已在社会上出现了。为了传承和弘扬我国汉字文化,保护汉字的规范性和统一性不受破坏。二维两笔字有规范的偏旁、部首,有规范的汉字结构和汉字书写规则。这样就可以用编码来纠正、引导学生规范地,正确地去认识汉字和书写汉字。一、用二维两笔字的编码来规范汉字的写法“成”字。写法不统一,一般是习惯。有的人是先写“横撇”,有的人是先写“撇折”。按国家汉字笔顺规范(下称规范)一书,规范的书写笔顺是先写“横撇”,规范的编码是(2E8)。不规范的书写笔顺是先写“撇折”,错误的编码是“948”。所以写“成”字,就必须按照2E8的笔顺来书写。也就是:横,撇,折,折,撇,捺的笔顺来书写“成”字。“青”字。规范的写法,开始两笔是“横横”,编码是A17A。错误的写法,开始两笔是“横竖”,错误的编码是(1A7A)。所以写“青”字时,必须按照A17A的笔顺来书写。“乌”和“鸟”两个字,是一点之差,书写往往不太注意就会写错,用二维两笔码来区分,相差就比较大。“乌”字规范正确写法的编码是“94”。“鸟”字规范正确写法的编码是“904”。因此,“乌”字要按正确编码“94”的笔顺书写,“鸟”字要按正确编码“904”的笔顺书写。二、用二维两笔字编码来引导学生规范地,正确地书写汉字有些汉字很容易写错,如精神充沛的“沛”字,把右边开始的第一个“横”笔画,错误的写成“捺(点)”笔画。规范写法的编码,是取左边“氵”开始“捺捺”两笔,取右边开始“横竖”两笔和最后“折竖”两笔组成“沛”字的三位二维两笔码,编码是(D17)。不规范写法是把右边第一个“横”笔画,错误的写成“捺(点)”笔画,就变成“点,横,竖,折,竖”,错误编码是(D377)。“妻”字。是上下型结构字,规范写法的编码是(4192)。错误的写法是把下面“女”字的第一个折笔画和上部分体字的竖笔画连在一起,视为一个笔画,它不规范写法编码是(4A92)。“男”字。规范正确写法的编码是(719)。它错误写法是把上部的竖笔画和下部的撇笔画连在一起视为一个笔画,错误的写法编码是(7A9)。“千”和“干”两个字,第一笔的运笔方向不同。“千”字第一笔是“撇”,正确编码是“21”;而“干”字的第一笔是“横”,正确编码是“A1”。三、用二维两笔字编码来纠正某些汉字的错误写法因为受到社会上一些不规范的拆字编码影响,出现了一些汉字书写笔顺不规范的错误。“可”字。规范正确写法是先写“横竖”最后写“折”(即竖勾),编码是(144)。由于受到社会上不规范的拆字的影响,一些人的错误写法是先写“丁”后写“口”。错误写法的编码是474。“为”字。规范正确写法是先写“点(捺)撇”后写“折点”,编码是(80)。由于受到社会不规范的折字影响,有些人先写“折撇(力)”后写“点点”的错误写法,错误编码是(9d)。“学”和“常”字。往往是把第一个笔画搞错,“学”字的第一笔是“点”不是“竖”,正确编码是D9E4,不是69E4。“常”字的第一个笔画是“竖”不是“点”,正确编码6977,不是D977。“运”和“动”的第一笔是“横”,不是“点”。“运”编码是A000,“动”编码是A09。四、字型相近易写错汉字,可用编码来确定汉字的规范写法有些汉字的字型很近似,不注意很容易写错。要纠正不规范写法,可以用编码来确定它的规范写法。请看下面这些汉字的字型很相近,但它的两笔字编码相差大,容易区别。如:剌(1487)刺(1787)、侯(5428)候(5728)、宦(8147)官(8744)、忘(39D)妄(392)、免(9729)兔(9720)、远(A900)运(A000)、戊(298)戌(248)、夭(28)天(A8)、戎(A98)戒(A598)、祆(06A8)袄(0828)、柿(1377)沛(D17、鸟(904)乌(94)具体实施例为了便于本领域技术人员理解本发明各实施方式,举出以下具体实施例:实施例一:“中”。中71(一)写字:丨一丨(二)编码:71①首位码丨=7④未位码一丨=1则71就是“中”字的二维两笔字编码。(三)查字:以71为检索码查《中文电脑字典》(四)打字:以71为汉字输入码上机打字录入。实施例二:“华”。华519(一)写字:丿丨丿乚一丨(二)编码:591①首位码丿丨=5②次位码丿乚=9④未位码一丨=1则591就是“华”字的二维两笔字编码。(三)查字:以591为检索码查《中文电脑字典》(四)打字:以“591”为汉字输入码上机打字录入。实施例三:“国”国7a13(一)写字:丨一一丨一丶一(二)编码:7A13①首位码丨=7③次次码丨一=1,②次位码一一=A④未位码丶一=3,则7A13为“国”字的二维两笔字编码。(三)查字:以7A13为检索码查《中文电脑字典》。(四)打字:以7A13为汉字输入码上机打字录入。实施例四:“國”國7143(一)写字:丨一丨一丿乚丿丶一(二)编码:7143①首位码丨=7③次次码一=4,②次位码一丨=1④未位码丶一=3,则7143为“國”字的二维两笔字编码。(三)查字:以7143为检索码查《中文电脑字典》。(四)打字:以7143为汉字输入码上机打字录入。实施例五:“亲”亲38A8(一)写字:丶一丶丿一一亅丿丶(二)编码:38A8①首位码丶一=3③次次码一一=A②次位码、丿=8④未位码丿丶=8则38A8为“亲”字的二维两笔字编码。(三)查字:以38A8为检索码查《中文电脑字典》。(四)打字:以38A8为汉字输入码上机打字录入。实施例六:“親”親3879(一)写字:丶一丶丿一一」丿丶丨一一一丿乚(二))编码:3879①首位码丶一=3③次次码丨=7②次位码丿丶=8④未位码丿乚=9则3879为“親”字的二维两笔字编码。(三)查字:以3879为检索码查《中文电脑字典》。(四)打字:以3879为汉字输入码,上机打字录入。实施例七:“粮”粮8808(一)写字:丶丿一丨丿丶丶一一丿丶(二)编码:8808①首位码丶丿=8③次次码丶=0②次位码丿丶=8④未位码丿丶=8则8808为“粮”字的二维两笔字编码.(三)查字:以8808为检索码查《中文电脑字典》。㈣打字:以8808为汉字输入码上机打字录入.。实施例八:“赞”赞2928(一)写字:丿一丨一丿丿一丨一丿乚丨丿丶(二)编码:2928①首位码丿一=2③次次码丿一=2②次位码丿=9④未位码丿丶=8则2928为“赞”字的二维两笔字编码(三)查字:以2928为检索码查《中文电脑字典》.(四)打字:以2928为汉字输入码,上机打字录入.实施例九:“媳”媳95ad(理论2)(一)写字:丿一丿丨一一一丿乚丶丶(二)编码:95ad①首位码丿=9③次次码一一=a②次位码丿丨=5④未位码丶丶=d则95Ad为“媳”字的二维两笔字编码。(三)查字:以95Ad为检索码查《中文电脑字典》(四)打字:以95Ad为汉字输入码上机打字录入。实施例十:“茫”茫bd34(理论2.3)(一)写字:一丨丨丶丶丿丶一(二)编码:bd34①首位码一丨=b③次次码丶一=3②次位码丶丶=d④未位码一=4则bd34为“茫”字的二维两笔字编码。(三)查字:以bd34为检索码查《中文电脑字典》(四)打字:以bd34为汉字输入码,上机打字录入。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有2条留言
  • 访客 来自[未知地区] 2019年01月15日 09:58
    查字打字用同一编码,繁体字、简体字一样通用。很适合我国中小学生使用。
    0
  • 访客 来自[未知地区] 2019年01月15日 09:55
    五种笔画编码,十五键输入。就能实现查字打字用同编码,繁体字一样通用,是当今最简单、最先进的了输入法。
    0
1