汉字数字形码快速输入法的制作方法

文档序号:11514552阅读:525来源:国知局
汉字数字形码快速输入法的制造方法与工艺
一、
技术领域
本发明涉及一种汉字数字十键输入编码技术,具体说是汉字数字形码快速输入法。二、
背景技术
:当前,随着电子终端设备(尤其是智能手机)及其适用性功能广泛应用于人们生活的方方面面,越来越多的过去甚至从未使用过计算机的人,也开始使用智能手机进行信息交流。这样,小键盘汉字快速输入问题尤其显得更加重要和突出。迄今为止,在汉字输入领域,具有快速输入、普及性和规范性汉字输入法仍是一个空白,这也是汉字在电子信息交流中的一个瓶颈制约问题。汉字输入技术总体上包括智能输入和编码输入两大类。汉字智能输入(如:扫描转换技术、语音输入技术和手写输入技术等),就扫描和语音输入技术而言无论如何改进,它们受应用领域或应用条件限制和不能及时纠错的原因,决定了无法取代具有随处可用、及时纠错的汉字编码输入技术,决定了它们都只能是辅助输入技术;而目前手写输入技术尽管比较方便简单,但由于其必须完整的写完每个单字的所有笔画,其输入速度无法超过书写汉字速度,而且不可能在实体键盘输入设备上使用,所以在大量文字输入时速度慢和通用性问题较为突出,只适合在智能触屏设备上少许文字输入;汉字编码输入技术就是根据汉字“音、形”两个可提取的特征进行不同设计而来。汉字编码方案很多,就至今仍应用的无非是形码和拼音两类。而当今仍流行的汉字形码快速输入法基本上是针对计算机全键盘开发的,都具有专业性强、需要专门培训方可使用,有难学易忘的缺点,因此它只适合专业人员在计算机上使用;而拼音输入法因建立在众人已有知识背景上,所以其易学性无可质疑。就当今人们被迫不得不广泛使用的拼音输入法所存在的问题是:就算我们可以忽略发音不准和方言的不便,拼音输入重码多、速度慢的老大难问题由于受汉字拼音自身局限至今无法解决;而且,由于长期使用拼音键盘录入代替手写汉字等多种原因,在社交平台中用同音别字和人们提笔忘字的现象越来越严重,长此以往汉字“形”的基本特征有逐渐弱化、消失的可能性;而字根拆分的形码恰好可以避免该现象产生,因此,形码汉字输入法应该是今后汉字输入法主流。综上所述,至目前为止,在众多汉字输入法中,可以说还没有一种是能被所有人接受和十分满意的汉字输入法。一种好的汉字形码输入法应该具备的特点是:其字根及编码规则设计原理应是建立在人们已有汉字知识背景基础上,而不是去独创一套有关汉字的新的概念。这样的设计思路才能容易被众人普遍并很快接受,稍经学习后经久不忘、上手快、提高迅速;重码少、词语全、输入快;拆字简单直观并符合国家有关语言文字标准;应该在各种终端设备上都可使用,并且可对汉字简体和繁体字采用同样字根方案、同样拆字编码规则同时输入,具有通用性。因此可以说汉字编码发展并没有走到尽头,它所要克服的是低水平徘徊、无创新的重复,它需要发展层次化、综合化及智能化技术,让汉字输入不再存在困难,这就是本汉字编码方案研究的意义所在。三、技术实现要素:本发明的目的在于提供一种能在各种需要汉字录入的智能终端设备上使用,具有可被各种年龄阶段、各种文化程度的人都能普遍接受、能自学成材、易学不忘、拆字直观简单、重码少输入速度快的普及型汉字数字形码快速输入法。为了达到上述目的,本发明汉字数字形码快速输入法针对各种可输入汉字的电子产品进行数字小键盘汉字输入方案设计,就是利用10个阿拉伯数字符号做汉字编码的码元(数字键),选用合理适量常用组字部件和五种基本笔画做汉字拆分编码字根,并按码元与字根对应关系,对汉字进行数字编码输入。按照国家有关标准统计,各种组成汉字的部件多达三百多个。如何从其中选用编码字根并确定与码元对应关系,是所有汉字形码输入法共同面临的两大难题。我们经多年大量研究分析和筛选对比,选用的字根数量适中、共用性强。这样,避免了在码元数少的前提下,字根太多难记而重码多的问题,又解决了字根太少字难拆、码太长的矛盾。本方案具体字根选用及其与码元键位对应原理如下:(一)汉字数字形码快速输入技术字根具体设计原理:本方案在字根与键位(码元)的对应关系上,巧妙利用汉字形成过程中常用的、并为人们共知“象形、会意”的原理,在大家共有汉语知识背景基础上,将所选字根按象形、会意和特征相同原则进行归类或对应排放。具体方法是:1、五种基本笔画:按国家规范分别对应为:1横提、2竖笔、3撇笔、4点捺和5折笔。2、转换法:将阿拉伯数字“1、2、3、4、5、6、7、8、9、0”对应转换为中文的“一、二、三、四、五、六、七、八、九、口”,并将它们及其形相似字根一起做为对应键的字根;3、同形单笔画连写计数法:将多点如“丷冫;氵;灬”按点数分别对应“2、3、4”数字键;将连续多横笔画,如“二、三”按横笔数分别对应“2、3”数字键。4、省略法:“竖、撇、折”三种单笔画同形状连写时只取一笔即可:将耳雨西、中止、月”六个组字频率高的字根,按其头笔或头码联想分别对应为“1耳雨西、2中止、5月”这六个字根其余笔画看作省略;5、与中文数字符号外形相似联想对应法:数字“3”键上,三彐非小;数字“4”键上,四罒灬火;.数字“6”键上,六宀冎;数字“7”键上,七匕;数字“8”键上,八入人(亻亽);数字“9”键上,九几乙。6、归类法:根据人们众所周知的汉字共同特征或共有属性,将其相同字根归结起来形成一类字根,以方便联想记忆。本方案共采用了以下五类:①点后连一笔类:指的是一点后与其它四种单笔画任何一笔相连的两笔结构,并按点联想对应在“4点”键上。如“丶亠州讠”。②折半框类:指的是由一个单纯折笔顶端和其它四种汉字单笔画之一相连,而形成三方包围一方开口的半包围框结构,并对应在“5折”键上。如“凵丩冂冖匚匸”。③单交叉类:指除已单取作字根结构外,其它任何两单笔画相交叉并形成一个交点的两笔画结构,规定排放在“6六”键上。如“十、又、力、乜乂……”。④多交叉类:指除已单取作字根的结构外,其它三笔画以上相互交叉连接在一起形成两个或两个以上交点的一类多笔画结构,并规定对应在“7七”键上,该类结构很多,其特征是相交不可拆分。如“扌丰韦肀丈车也女艹卌井册弗毋冉……”;在多交结构中如有“囗”形被穿通时其形成方框的连笔画也可省略,如“事、申、电、史、吏、曳、……”。⑤动物部首类:指汉字字典中本身是动物名称或多用于动物名称的一类部首,该类规定在“9九”键上。它们分别是:牛(牜)马羊()虫鱼鸟乌鼠臼鹿虍犭豸。7、繁体汉字特有字根:本方案是可以简繁体汉字同时编码输入,在繁体字库中为了减少拆字难度,特增加了“言幺食金”4个字根分别按省略法放在对应的“4言、5幺、8食金”三个键上,繁体字其它字根和归类方法与简体完全一致。综上所述,汉字数字形码快速输入法字根与数字键位(码元)对应关系总结下如下表:键名包含字根及类别1一耳雨西2二丨〢亅刂冫丷止中3三丿彡氵小彐非4四罒灬火丶乀点后连一笔(亠州讠[言]……)5五乛乚折半框(丩凵冂冖匚匸)6六宀冎单交叉(十又力乜乂乄)7七匕多交叉(扌丰韦肀艹女也车[車]卌井弗……)8八入人亻亽登祭[金]9九几乙动物类(牛牜羊盖马[馬]鱼[魚]虫鸟[鳥]乌[烏]鼠臼鹿犭豸虍)0口囗(二)汉字数字形码快速输入法的字词编码规则和方法是:1、本方案单个汉字拆分,应根据国家语言文字笔顺规范,大多数汉字按照字根书写先后依次拆分即可。2、一个单字同时有几种不同拆分方法时,应按先拆大字根后拆小字根、能拆大不拆小的原则进行拆分。3、对于半包框和全包框形结构单字,参考汉字部首规范,在框的笔画与框内字根笔顺有交错时,一律先拆外框后框内。4、本方案所归类的明显单交叉和多交叉结构其交叉笔画一律不拆开。5、本方案单字最大码长为六码,字根多于六个的单字也只取前五末一六码即可。(三)汉字数字形码快速输入法专用虚拟16键输入键盘设计与说明:本方案在使用于触屏终端设备上时,为了用户输入方便适用,特专门设计了一个16键虚拟输入键盘(见附图)。就其主要设计思路说明如下:1、考虑到本方案编码中,字根编码为“01、02、03”的组合使用频率高,将传统小键盘上数字“0”键调放在第一列数字4键前方。2、根据使用母指拼音的人已形成的习惯,本方案“*”键用于各种标点符号编码输入,所以将该键放在数字1前面。3、本键盘特设了一个“词语”键,在编码输入状态下,当输入完某个词语编码后,候选框却显示的是同码单字时,若点击该键一下直接跳到词语显示;若连续点击两下,则直接打开用户平时关闭的大字库,显示已输入编码对应的罕用字。若无该编码对应的罕用字或词语时可直接返回起始输入状态。该键定在数字0键下方;4、本键盘方案还特设了一个“帮助”键,用于本方案的输入功能设制和学习帮助,同时还具有查询已选中候选字的拼音和编码。5、本键盘还具有在微信上使用时人们喜欢的“表情”输入功能,在文本输入时不用切换可一键直接调出表情包,选择输入后返回文本输入状态。该键与“词语”为同一键。6、本键盘设计了在输入汉字时,因编码错误时可用“换行”键一键返回起始输入状态的功能;(四)汉字数字形码快速输入法特点和功能说明:1、易学性:由于本方案形码字根采用象形、归类的设计原理和字词拆分直观规范,所以具有简单易学、上手快和学会不易忘记的特点;2、普及性:本方案输入字词不受发音局限,且字根联想、归类方法符合众人对汉字的基本认知,所以适合各种文化层次人使用;3、实用性:本方案应用程序设计了很多的实用功能,不仅方便各种用户的不同需求,极大提高汉字输入速度,同时还可帮助有需要的用户进行字的拼音学习和词语查询学习;如词语的两种编码方案设计,就是照顾专业输入要求快而更多普通用户求简单、方便好用而设计。4、快速性:由于本方案的字词静态键选率(重码率)很低,在动态文本输入时重码率不超过3%、词语量超六万多条等特点,所以输入速度快,如在使用词语和高频字的情况下,专业输入时平均单字不足3码,在当今十个数字键汉字输入法中这是本方案最大优势;5、通用性:基于本方案的原理所设计的输入法可使用在各种有数字小键盘的设备上,同时用相同的字根方案和相同编码规则实现使用简、繁体字词地区用户都可应用;6、规范性:本方案有关设计都参照国家相关标准和规范,长期使用本方案输入汉字,有利于汉字书写笔顺规范化推广普及,有利于词语中单字正确使用;7、智能化:本方案在一些社交软件应用版本上,设计了利用大数据而基于本方案词语编码规则的整句输入智能匹配功能,方便好用也可及时纠错;还可利用人工智能技术进行不同层次智能辅助功能的深度开发,如输入界面击键时键位和候选框首字词的语音提示辅助功能,以方便视力不好的用户使用等。四、附图说明:图1:汉字数字形码快速输入法虚拟16键起始状态及功能键示意图。图2:汉字数字形码快速输入法虚拟16键编码状态字根对应关系及功能示意图。五、具体实施方式:(一)汉字数字形码快速输入法键位字根设计:根据前面所描述的本方案字根象形、归类设计原理,所得到汉字数字形码快速输入法键位(码元)相对应字根或类别如下表。由于该方案归类的“点后连一笔”、“折半框”、“单交叉”和“多交叉”四类不成字的字根数量众多、形状各异在表中不可能全部列举,在后文中涉及该四类不成字字根拆分举例时,分别用其类较典型符号作代表,即:“点连一笔亠或讠”、“折半框凵或匚”“单交叉乂”、“多交叉扌或井”。在下文字根拆分中用这些符号做本类字根拆分代表。汉字数字形码快速输入法字根与键位(码元)对应关系如下表:键名包含字根及类别1一耳雨西2二丨〢亅刂冫丷止中3三丿彡氵小彐非4四罒灬火丶乀点后连一笔(亠州讠[言]……)5五乛乚折半框(丩凵冂冖匚匸)6六宀冎单交叉(十又力乜乂乄)7七匕多交叉(扌丰韦肀艹女也车[車]卌井弗……)8八入人亻亽登祭[金]9九几乙动物类(牛牜羊盖马[馬]鱼[魚]虫鸟[鳥]乌[烏]鼠臼鹿犭豸虍)0口囗(二)本方案单字拆分与编码方法:1、单字的字根拆分方法:本方案单字拆分方法就是按照单字正确书写顺序,参考所选用的字根依次拆分即可。为了避免有些字出现多种拆分现象,参考形码较通用的规则,特作以下规定:①按照汉字正确书写笔顺,并根据所选字根依次拆分即可;如:员(口冂人)、击(扌凵)②字根能拆大不拆小;如:元(二丿乚)不能拆成(一一丿乚)。③一个字在同码长情况下有多种拆分时,一律大字根优先。如:云(二乛丶)不可拆成(一匸丶)④半框和全框形结构,当组成框的笔顺与框内有交错时,在拆分时一律先取框后取框内。如:冈(冂乂)、区(匚乂)、目(囗二)。⑤所有明显交叉结构一律不能拆开。如:干(一十)不可拆(二丨)。⑥在多交叉结构中间,夹有某个小字根,且其笔顺与多交有交错时,应先取多交叉结构后取其中的夹带字根;如:来(扌丷八)。2、单字编码方法:①十个数字键上都有本身是字的字根通常称为成字字根,成字字根编码为“本键位名+00”共三码。如:2键(二中止)编码都是“200”。②只有2-6个字根的单字,所有字根按拆分顺序全取。如:日(口一;01)、彗(丰丰彐;773)、兼(丷一井八;2078)、麻(亠丿十八十八;436868))、晶(口一口一口一;010101)。③多余6字根的字取前五末一字根,中间多余字根不取。如:攀(十八乂乂十……扌;686667)。(三)单字与词语的编码输入方法:1、单个汉字的输入方法:①高频字的输入:本方案每个码元键都选择了12个使用频率高的单字,通称为“高频字”,并按该字头码所对应的码元键排放;所有高频字均一码选择输入,但该字在词语中仍要按规定拆分编码。如:数字8键的高频字是你、他、们、等、但、年……②键名成字字根的输入:每个码元键上都有不同数量本身是单个汉字的字根,通称为“键名字”;键名字的编码输入方法是“该字键位名+00”选择输入。如:数字“5”键键名字为“五月”,它们的编码都是“500”。③其它单字按字根拆分取全码依次输入;有些字在未输完全码就已显示出来,也可立即确定输入。④字根多余6个以上的字最多取“前5末1码”共六码。2、“普及型”词语编码方法:指的是在输完某一个字的全码后,再按规定输入后面字的若干码不限码长的词语编码方法,或称为首字联想词语编码输入方法。①两字词首字全码联想编码输入法:指在输入两字词语时,先将首字取完全码,在不选择上屏的情况下,接着输入第二个字若干码直到该词出现在候选框中,然后选择输入。该方法在大多数情况下,第二个字只需要输入1-2码即可;少数码短而组词频率高的首字所组成的两字词,第二个字才取多码。如:“同志”输入编码为“5106……”或“51061……”或“510614……”,以上编码都可以输入“同志”这个词语。②三字及三字以上的词首字联想编码输入方法:该类词在取完首字编码后,其它字只取头一码即可。如:“同志们”编码为“51068”、“同甘共苦”编码为“510777”、“中华人民共和国”的编码为“2008857……”。3、专业型词语编码输入方法:该方法规定所有词语码长最多为六码,不足六码的词用确认键选择上屏即可。各类词语取码方法如下:①两字词:每个字固定取其头两码和末尾一码共三码,不足三码的字全取即可;如“干部”编码为“16612”、“国家”编码为“014612”。②三字词:每个字只取头尾各一码共两码,如:“同志们”编码为“506485”③四字词:前三个字只取头一码、最后一个字取头两码和末一码共计六码。如:“与时俱进”编码为“108744”、“国家教委”编码为“066367”④五字词:先取每个字头一码,再加上最后字尾码共计六码即可;如:“生产积极性”编码为“963621”、“中国共产党”编码为“207635”⑤六字词:每个字只取头码即可;如:“牛头不对马嘴”编码为“921690”、“垄断资本主义”编码为“622744”⑥七字以上词语:取前五个字和最后字头码共六码;如:“中华人民共和国”编码为“288570”;4、符号编码输入本编码方案可支持国家标准gb/t18031-2016所规定的全部符号输入,另外增加了输入文本文件常用的序号类、汉字偏旁部首类和拼音符号类,这些符号都按分类编码选择输入。它们分别是:常用符号编码为“*”、数字序号编码分别是“**1……**0”、偏旁部首编码为“***0……***9”、拼音符号编码为“****”。(四)虚拟16键盘输入界面设计与功能简介为了让广大智能手机用户更方便使用本输入法,充分发挥本方案在汉字输入中优势,本方案特别针对虚拟键盘输入做了独立的16键输入键盘设计。该设计不仅能极大提高汉字输入速度,还设制了具有特色性功能,满足了不同用户个性化需求。该虚拟键盘在使用时分别有起始(编辑)和编码输入两种不同显示状态,下面就其功能加以说明。这些功能在计算机小键盘输入时也同样可以使用,只是使用键位名称有所不同,在此不重复说明。1、虚拟16键盘在起始状态下(附图1)主要功能如下:①数字“1—0”键为字、词编码原始键。②“*”键在起始状态下为符号编码键,可对常用各类符号按本方案分类编码方法进行编码输入。③表情键:在显示框无编码起始状态时,表情键为调出表情包选择输入键,此功能在无表情输入设备上无效。④“#”键为输入法循环切换键,可在数字、拼音、英文等输入法间循环切换。⑤在数字“7”下方为“空格”键,在编辑状态下,用做空格。⑥在数字“8”的下方是“换行”键,在编辑状态下为文本换行功能。⑦在数字“9”键的下方为“帮助”键,在编辑状态下,此键为进入龙码输入法设制和帮助界面。2、虚拟16键盘在编码输入状态下(附图2)主要功能如下:①数字“0-9”键是显示字根的编码键,方便人们直观编码输入(此字根显示界面也可自由设制关闭)。②“问号”键此时为编码模糊输入键。即至少输入某字头一码后,将未知编码用问号代替进行模糊式查询输入。③“词→”键,在输入至少一码显示的是候选单字的状态下,击此键一次,可直接跳到同编码的词语显示;若连击此键多下,可依次跳到用户关闭的字库中检索同编码不常用字;如输入了某不足六码词语时,而显示框显示的是同码单字可用于快速跳转词语显示,方便用户偶尔输入罕见字时不必打开“gb18030大字符”字库,以便平时输入减少重码。;④“拼音查询”键,在候选框显示单字状态下,当移动光标选定某字或默认选中首字时,按下此键可查询该选中字的全部读音和编码,具有拼音编码查询功能;而此时若连击此键两下,可显示以该字为首的全部联想词语,并可选择输入。⑤此时空格键为输入显示框中向后移动光标,此功能在智能手机上也可用手势代替。⑥换行键此时为快速向前翻屏或处在第一屏时快速返回起始输入状态,但若只退一码应用“删除键”。(五)输入程序设计与主要功能本方案在各种终端上使用时,都可对输入法个性化功能进行自由设制,不同键盘其快捷键有所不同,这里以虚拟16键为例作简单介绍。当在本输入法起始状态下,点击“设制”键打开本方案程序设制界面如下:1、字库选择:双击可进行字库除基础字库外自由多选设制。2、词语编码方式选择:用户可根据自己习惯在本方案词语两种编码方案中任选一种并确定保存即可。3、词库选择:双击打开可进行除基础词库外的词库复选设制。4、词语联想(开启/关闭)。5、人工造词:在手机上打开可按提示导入用户手机联系人到用户词库并可按提示自由选择编码方式,也可手工输入或粘贴某条词语并编码保存到用户词库中,同时也可进行用户词库管理修改。6、输入键盘风格选择:双击可按提示进行单选操作并确定。7、自学帮助:打开可出现输入法自学文档。8、关于……:有关本方案版本、版权信息等。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1