一种能够输入语句、短语、词、字的智能汉字输入方法

文档序号:6365081阅读:671来源:国知局
专利名称:一种能够输入语句、短语、词、字的智能汉字输入方法
目前,已知的汉字输入方法的实质都只是一种字词输入方法。一般是将常用语句当成固定组合的词语,直接对其编码。再以编码查询字词库,找到库中对应的字词从而实现输入汉字的目的。然而,真正的汉字输入法应该是语句、短语、词、字都能输入。
现有汉字输入法的不足现有汉字输入方法主要分为两大类以字音为主的声码输入法、以单字的构成为主的形码输入法。
声码输入法的典型代表是汉语拼音输入法,其优点是对熟悉拼音的用户而言,基本不用学习,会了不易忘记。
其缺点是普通话不标准的用户使用不便,重码多,输入速度慢。
形码输入法的典型代表是五笔字型其优点是重码少,输入字词速度快。
其缺点是难学、难记,学会了不经常用也会忘掉。
尽管汉字输入法层出不穷、万“码”奔腾,然而,现有汉字输入法大都只在单字和词语范围,围绕易学性和重码率的怪圈在旋转。迄今,没有哪种输入法的用户量,超过了拼音和五笔。
输入法的易用性和重码问题的矛盾没有彻底解决。可以说,真正好学、好用、输入速度又快的汉字输入法,至今没有出现。
本发明专利,采用了字与字相容搭配的新颖思路,成功的解决了汉字语句输入问题和一般字词输入法中难以处理的易用性和重码率矛盾,这两大技术难题。
本智能汉字输入方法正是一种好学、好用、输入速度又快的优秀输入法,它包含一种语句输入方法和一种改良的字词输入方法,其中字词输入方法用于单字、短词的输入,语句输入方法用于句子、短语的输入,同时字词输入法又用来修改语句输入法所生成的句子。此外,它还有能够逐渐适合用户习惯进行自我完善、自动学习的智能特点。简叙如下尽管都知道使用词语输入比使用单字输入快得多,而使用语句输入又比词语输入更快。但是,由于汉语语言丰富多彩,短语、句子数不胜数,所以试图收集所有语句,将语句编码入库,再加以检索的通行方法根本就行不通。
本专利发明创造了一种新颖奇特的思路--从所有能够得到的语句资料中分析、统计出字与字在语句中的搭配关系以及字与字搭配的紧密程度,再将字与字的这种关系运用在汉字输入法中,解决语句构成问题和字词输入的重码问题。
A、原理不论是文章、文件、杂志、报纸、书籍还是口语,语言都不是毫无意义的单字的堆砌。字与字之间存在着无形的某些联系。象某某字常常与某某字搭配,某某字与某某从来就不搭边……。
公知,描述词与词之间的关系的是词性、语法;那么描述字、字与字之间关系的就是邻字相容关系、隔字相容关系(隔一字、隔两字……),本质上讲,词语可视为字与字之间有密切的联系的一种特例。量化邻字相容关系或隔字相容关系密切程度的就是邻字相容频、隔字相容频、隔两字相容频……。
只要从相当数量的正确的语句统计中得到正确的字与字的关系,那么利用这种关系,在键入各字的首声母后,依靠首声母字母,查询单字字库,查出每个位置上可能是哪些字的字集,然后运用字-字的相容组合和字的使用频度,就能够产生出正确的语句。
另一方面,在字词连输时,考虑已输的字词与将要输入的字词的关系,键入编码后,将关系密切的候选字词放在首选位置。这样一来,重码问题迎刃而解。
这是本专利发明的核心所在。
B、名词解释字集满足特定条件的所有可能单字的集合。
单字字频从大量汉语资料中统计得到的每个字的出现次数。
邻字相容频从大量汉语语句中统计出的一个字与其后紧随字(可搭配字)的字集及该搭配的出现次数。非词频例如“想申请专利”这五字统计“想申”“请专”就是邻字相容(可搭配字),显然不是词语。(它用途很广,能用于举一反三,--想申请、想申报、想申请/请专家、请专门的、请专业……)隔字相容频从语句中统计出的一个字与其后随隔字(第三字)的字集及该搭配的出现次数。还是“想申请专利”这五字,统计的隔字相容为“想-请”“申-专”、“请-利”。
隔两字相容频从语句中统计出的一个字与其后随隔两字(第四字)的字集及该搭配的出现次数。还是“想申请专利”这五字,隔两字相容为“想-专”“申-利”。
邻字相容频用于连续输入和智能造句时得到后续最可能的(候选)字集;隔字相容频、隔两字相容频是则用于对该(候选)字集的修订、筛选。
相容组合满足邻字相容、隔字相容、隔两字相容后的结果。
C.在字词的连续输入和产生语句的时候,考虑字与字的关系,能极大地减少错误的字词搭配的可能。
这里称字与字能够彼此搭配的关系叫相容关系,以相容关系筛选可用字词的过程称相容组合。
相容组合是减少错误的字词搭配的关键。
举例若J、s、Q分别为连续的第一个字、第二个字、第三个字的声母,由于每个声母上都有数百个字,显然,光靠声母会有很多很多的组合。
象家三前、就赛其、进司取……毫无意义的组合占绝大多数。
但是,只要按J、S声母邻字相容,相容后就会少掉大量组合,(比如就赛、键水、进司等不太可能在一起的就去掉了),同样,S、Q声母相容后能再少掉一大批;而且,J、S与S、Q的S声母上应该为同一个字,这又能去掉不少;(如“计算”与“所取”S声母上字不同)最后J、Q隔字相容后,就只有不多的几种可能了如计算器,决赛权,加速器……这还只是三字,倘若还有第四、第五、第六字,而且再考虑隔字相容、隔两字相容、隔三字相容…那么,离正确的目标将越来越近了。
D.短语、句子数不胜数,用于统计的资料绝对不全,但是本智能汉字输入法并不在乎这点。
因为,本专利发明具有组成原资料上并不存在的语句的造句能力!举例原始资料只有三个短语“邀请专门的”、“邀请大家”、“专家门诊”但是,本输入法在用户键入yqzj时,却能明智的组出语句“邀请专家”!证按照本输入法原始资料的统计方法可得到邻字相容“yq邀请、qz请专、专门、门的、请大、大家、zj专家、门诊”隔字相容“yz邀专、请门、专的、邀大、qj请家、专门、家诊”隔两字相容“邀门、请的、yj邀家、专诊”如果输入语句编码yqzj那么,用第一、二字的编码“yq”查邻字相容,得到前二字可以是“yq邀请……”用第二。三字的编码“qz”查邻字相容,得到第二、三字可以是“qz请专……”第二字“q”还要相同,所以可能的三字组合为“邀请专……”再以第一字、第三字的编码“y、z”查隔字相容查到“yz邀专……”所以“邀请专”作为前三个字被认为合格!又用第四字的编码“j”与第三字,查邻字相容,查出“zj专家……”说明第四字可以是“家”核对,用第一、第四字的编码“y--j”查隔两字相容文件查到“邀--家”行!再核对,用第二、第四字的编码“q-j”查隔字相容文件查到“请-家”也行!所以“邀请专家”是自动组出,并通过相容验证的合格语句。
如果计算时连频率算上,还能知道“邀请专家”属于常用的呢!!!(五)技术方案A、语句输入法产生语句的流程简单的说,组成的语句的每个字与相邻字必须满足邻字相容关系,并且每个字与间隔字必须满足隔字相容、隔两字相容的关系。
对三个字的语句而言,第一个字与第二个字必须邻字相容第二个字与第三个字必须邻字相容在这两个邻字相容字集中,第二字相同的才能构成三个字的语句构成的三字语句中,它的第一个字和第三个字还必须隔字相容才算正式合格。
对四个字的语句而言前三个字照章办理,此外合格的三字短语的末字,与第四字应该邻字相容合格的三字短语的首字,与第四字应该隔两字相容合格的三字短语的第二字,与第四字应该隔字相容这样得到的第四字才为正确的第四字。
对五个字的语句而言不再理睬第一个汉字了,将合格的四字短语,视为已有三字合格,将第五字视为要输的第四字。
照“四个字的语句”一样,如法泡制。
对更长的语句,依此类推。……要是,某位置上没有找到合格的字,那么,该处的字就按单字字频取最常用字替代了,相容关系也从该字起,重新计算。
B.对语句输入法产生语句的修改语句输入法中候选语句的也许并不完全正确,此时必须使用内置的字词输入法进行修改,修改方法是通过按键移动光标到不认可的字上,键入字词的拼音或音形编码,用字词输入法的方法选定正确的字词后,将从修改的字开始,再进行一次组句,如果再修改,就再组句直到完全正确。
举例 (由于句子编码是取每个字的读音首声母,显然编码与字一一对应。)例如“汉字输入的确需要一场大的革新”编码为hzsrdqxyycddgx但组句可能组成了“汉字输入的确需要异常大的工薪”。
修改它的步骤为连按特定修改键(假定左Alt向右,右Alt向左)使光标移动到了“y”即“异”字上,按“一”字的拼音yi的“i”或“一”字的形码“横--h”,在字词窗口选字。选定“一”后。将“需要一”作为确定字,编码c作为第四字的编码,经过相容组合,就能自动将“常”字改为了“场”,同样,继续相容组合,会自动将“工薪”改成了“革新”。
得到正确语句“汉字输入的确需要一场大的革新”C.本智能汉字输入法的人工智能。
字词输入时1在初输状态下,候选字词自动调频,即将最近用到过的字词排在候选字词的首位,其余字词位置顺序后移一位。
2在连输状态下,以最近已输上的字为参照,依字与字的相邻、相隔的相容关系和密切程度,排列候选字词的位置。
存在一个已输字时,候选字按“相邻字频率文件”中的最密切字优先候选。
存在多个已输字时,候选字按“相邻字频率文件”+“相隔字频率文件”相容后的字的最可能字优先候选。
比方说按单字输入已经输了“……力挽狂”这些字了,还要继续输入,键入“L”的时候,选字中“澜”字将排在第一。
3从用户的输入中,得到并记载或添加字与字的相容关系到相容文件中,使得相容文件的内容,更加符合用户的习惯。
语句输入时1如果在已有的用户语句库中,能够找到用户需要的语句,则将该句的句频增加。
2如果不在用户语句库中,而是自动生成的语句,那么,确认后,将它放入用户句库。
3如果语句是自动生成的并且经过了用户的修动,那么,不单要将这语句放入用户句库(临时句库),而且还要将其字与字的相容关系记到相容文件中去。
定期自动整理或人工整理将用户常用语句放入用户句库,清理邻字相容、隔字相容的文件,将使用过少的内容清除,删除临时句库。以提高输入法的运行效率。
F.完整的汉字输入法是由语句输入,字词输入法两部分组成。前述智能汉字输入方法的字词输入部分允许挂接任意的字词输入方法。
即允许采用以字音为主的拼音类字词输入法,允许采用以字形为主的形码类字词输入法允许采用音形结合类编码的字词输入法允许两种及以上编码组合的字词输入法)其显著特征是除了具有必备的拆字原则、组码规律、键盘分布、输入方法外,在连输状态下,以最近已输入的字为参照,依字与字的相邻、相隔的相容关系和密切程度,解决候选字词在有重码情况下的排列次序。
(六)实施例(1).一种能够输入语句、短语、词、句的智能汉字输入方法其特征是以汉语拼音为基础,以字与字间搭配的相容性为核心,通过一种语句输入方法和一种字词输入方法的交融,完成语句、短语、词、字的输入,其中字词输入法用于单字、短词的输入,语句输入法用于句子、短语的输入,同时字词输入法又用来修改语句输入法所生成的句子。
(2)、前述智能汉字输入法所采用的语句输入方法其特征是A.引入字与字之间搭配关系以及频度,顺序键入句中各字读音首声母所对应的英文键盘,通过字与字的相容组合,产生尽可能是用户希望的语句,它与嵌接的某种字词输入方法相互调用,从而实现汉字按句、短语、词、字都能正确输入的目的B.键盘分配,完全按照汉语拼音字母的写法,对应到普通英文字母键盘上A-阿;B-波;C-雌;D-得;E-呃;F-佛;G-哥;H-喝;J-基;K-科;L-勒;M-摸;N-呐;O-喔;P-坡;Q-欺;R-日;S-思;T-特;W-乌;X-希;Y-衣;Z-资;C.利用上述键盘的汉字语句输入方法如下按语句的汉字个数,一字一键,顺序取语句的各字读音的第一个字母。
a.编码查询已有的语句、短语库。
本输入法已经储存了经统计的足够常用语句。当键入各字的声母首码,首先按输入字符串在已储存的语句中查找。若找到,则将语句显示到候选窗。
如果不存在或不被认可,就转到自动生成候选的语句和短语模块。
(3).前述智能汉字输入法所采用的汉字输入的程序流程就以敲“yqzj”为例敲第一键(y)直接将一级简码字送入候选窗显示。“一、以、要、药……”敲第二键(q)用第一第二键,查相邻相容文件,将频率最高的几个词送入候选窗。
“要求、一切、以前、一千……”敲第三键(z)a,用第一第二键(yq)查邻字相容频文件,得到一个可能的两字组合集(集合1)(邀请、要求、一切、以前、要去、一千……)b,用第二第三键查邻字相容频文件,得到另一个可能的两字组合集(集合2)(集合2 请专、求证、去做、签字、去做……)
c,在集合1和集合2中,将第二键对应的字相同的元素取出,构成(集合3)即按集合1,2长度双重循环,判断集合1的第二字与集合二的第一字是否相同,相同则取出集合1的该元素,再加上集合2相应元素的第二字,放入集合3(集合3的每个元素由三个字构成,其频率等于构成元素的两元素频率的和)(集合3邀请专、要求证、要去做……)d,用第一第三键查隔字相容频文件,又得到一个两字组合集(集合4)(集合4邀-专、要-证、要-记……)e,按集合3,4长度双重循环,将集合3元素的第一字、第三字与集合4比较。若都相同则该元素为合格的三字组合,放到集合5。(集合5邀请专、要求证……)f,将集合5按频率高低顺序送入候选窗。
(要求证,邀请专……)敲第四键a,用集合5(要求证,邀请专……)的第一字,查隔两字相容频,生成四字组合(集合6)即用第四键+集合5第一字为子串,直接查隔两字相容频文件。得到可能的第四字,集合5+第四字得到四字组合(集合6)(频率依然叠加)(集合6 邀请专家;邀请专门,邀请专业、邀请专属……)b,用第三键+第四键+集合5第三为子串,直接查邻字相容频文件,得到两字组合集(集合7)(集合7 专家、专籍、专集……)c,用第四键+集合5第二字为子串,查隔字相容频文件,得到两字组合集(集合8)(集合8 请-家,请-军,请-决……)d,由集合7、集合8、得到允许的“后”三字组合(集合9)(集合9 请专家,请驻军,……)e,按集合6,9长度双重循环,集合6元素中凡是的后三字与集合7元素的三字相同的,归为最终的正确四字集(集合10)(集合10 邀请专家、邀请驻军……)d,将集合10按频率高低顺序送入候选窗。
敲第五键不考虑第一键、第一字。视为完成第三键后,刚敲入第四键处理。
敲更多的键如法炮制。
句子越长,生成句子的正确率越高。
关系图 (4).采用前述语句输入法融入一种(拼音、音形、查字典三组合的)字词输入法而构成智能汉字输入法的实例。
三组合的目的允许习惯使用汉语拼音的用户采用拼音输入允许不熟悉拼音的用户依照汉字字形输入允许对不认得的字采用查字典的方法输入1.一种(拼音、音形、查字典三组合的)字词输入方法其特征是A.音、形一体,每个汉字至少有两种类型的编码方式其一是标准汉语拼音其二是音形方式编码B.键盘分配
使用英文键盘,汉语拼音采用现行的标准拼音与英文键盘的键盘分配;音形方式采用的英文键盘,是按如下方式分配的A-阿;B-波;C-雌;D-得;E-呃;F-佛;G-哥;H-喝;J-基;K-科;L-勒;M-摸;N-呐;0-喔;P-坡;Q-欺;R-日;S-思;T-特;W-乌;X-希;Y-衣;Z-资;这23个声母与英文字母完全一致;鉴于字音为yi时,y不发音,加之y上重码过多,故,将所有作为字根和偏旁的发音为yi的字和偏旁,定义到I上;将发音为“淤”的所有字,在作为字根和偏旁时,定义在U上;即I-用于“衣乙以异已意易亦……”(作为字根或偏旁时)U-用于“于玉余予与育雨鱼……”(作为字根或偏旁时)英文键盘上“V”键,为特殊键C.音形方式的组码原则a.基本笔画按相同归并一点、两点、三点、四点,都算点(连击四下“D”)独撇、折撇、三撇都算撇(连击四下“P”)上框下框左框右框,大框,小框都算框(连击四下“K”)……b.独根字字的读音首声母+首笔画+第二笔画+末笔画。
万 W + 横(H)+ 折 (Z) + 撇(P)c.两根字字的读音首声母+第一根字、第二根字首声母+末字或末笔好 N女(N) +子(Z) +横(H)(笔画)鞭 B革(G) + 便(B)+ 更(G) (末字)d.三根字字的读音首声母+第一、二、三根字首声母众 Z人(R) 人(R) 人(R)e.多根字字的读音首声母+第一、二、末根字首声母赢 Y王(W) 口(K) 凡(F)D.利用上述键盘的汉字字词输入方法如下(a)音形方式输入汉字输入为3码-4码(1)单体字取字声母+首笔画声母+尾笔画声母;(2)合体字取字声母+偏旁念法的声母+字根字的声母+末字或末笔读音的声母;(末笔分为点、横、撇、捺、折、竖、提、勾)词组输入为4码(1)二字词取首字的声母+第二个字声母+首字的偏旁的声母+第二个字的偏旁的声母(2)三字词取第一、二、三个字声母+标识键“v”(3)多字词取第一、二、三、末字的声母;(b)拼音方式输入以标准的汉语拼音方式输入(d)所有的特殊输入都使用特殊键“V”开头,依次取名称中每个字的首码。
字典方式“V”+偏旁的读音首字母+笔画数罗马数Vlm+数字圆圈数Vyq+数字大写数Vdx+数字小写数Vxx+数字……(e)音形方式、拼音方式、字典方式在用于汉字输入时,不需要键盘切换(5)汉字输入法在输入语句、短语、词、字时的主要程序流程a.判断是否为特殊输入。
是,特殊处理
如vct12 表示,以查新华字典方式输字--“草头(ct)12画”vhp5 表示,以查新华字典方式输字--“禾旁(hp)5画”v12005.6 表示转换数字成货币金额“壹万贰千零伍元六角”vlm1 表示输入罗马(1m)数字I…………处理完后,更新,等待新的键入。
否,继续下项b。
b.判断是否拼音码。
是,按拼音编码查找字词,以初输状态排候选字序?……以续输状态排候选字序?……输出字词,更新,等待新的键入。
否,继续下项c。
c.判断是否为音形输入是,按编码查找字词,输出字词,初输?……续输?……更新,等待新的键入。
否,继续下项d。
d.按语句输入法生成语句。
e.用户是否认可语句输入法自动生成的语句认可,输出语句,该句放入句库,句频增加,更新,等待新的键入。
不认可, 移动光标,到语句中需要改动的位置,以输入字词的方式修改它,选定正确的字词后,将再进行一次组句,再修改下一处不认可的字,重复,直到认可。再记下用户的字字关系和语句。
(6)。为协调整个智能汉字输入法在使用上的方便和鼓励语句输入,输入时做了如下调配(由于拼音有韵母,与语句输入和多字词全取声母的输法不相冲突,所以以下描述不涉及到拼音,也无关以V开头的特殊输入)输入第一码声母,认为是单字输入。
输入两码,认为是双字词。(双字短语当成双字词,如行啊,是吗……)输入三码,首先认为是输入单字,再按“v”换到三字短语。(三字短语包含三字词)输入四码,首先认为是输入短语, (四字短语不包含四字词)再按“u”强行换到四码单字。(本情况极少用)或者按“v”表示输入四字词(成语)。
或者按“i”表示按一二三末输入长句。
输入五码及以上完全认为是一字一键的语句输入。
(七)本专利发明的重要意义本专利发明是彻底解决汉字输入的一种可实施方案。适合绝大多数普通电脑用户的使用,易学、易用、一说就会的特性加上一字一键的速度,必将跻身优秀汉字输入方法之列。
其自动调序,自动修正相容关系,自动记忆用户语句的优秀性能为汉字输入法实现一字低于一键的理想,提供了参照。
(八)附注字频、邻字相容频、隔字相容频、隔两字相容频文件的获得及其文件格式(1).频率统计文件单字字频、邻字相容频、隔字相容频、隔两字相容频的获得。
A供统计用的原始的资料的组成将小说、杂志、新闻、文件、网页、聊天记录、词库等词句多而错字少的文本文件组合成一个超大容量的文本文件。作为原始资料文件。
B原始资料的整理
先剔出原始资料中的非汉字成分(数字,英文,标点),并把非汉字符号作为短语分隔符号,一行变为多行。整理后的资料保留原始资料中的文字例如,整理前某行文字为“整理原始资料,获得频率文件单字字频、邻字相容频、隔字相容频”那么整理后,可得到整理原始资料获得频率文件单字字频邻字相容频隔字相容频(原来的一行变为了多行)C对整理好的文本文件的每行进行统计。统计每个单字的出现次数得到“单字字频”,统计每个字及相邻后一个字及其出现次数,得到“邻字相容频”。同理可得到“隔字相容频”“隔两字相容频”D对统计出的频率文件进行整理丢掉一些使用频率过低的相容关系。对邻字、隔字、隔两字相容频按字的拼音声母首字母排序。
E手工修整因小说人物名字而产生的错误相关字、相容频。
(2).邻字、隔字、隔两字相容频文件格式声码字相容字使用频率如aa啊呀11ab阿爸7ab阿伯10ac阿昌15。


ba笨啊43bb不薄54bb爸爸58。


zy作用185zy左右212zy自由165zz坐在89zz早在78zz最早74zz藏族62zz自在68zz在座53zz做做55(以二进制储存较好,节约空间,每条只占10Byte)邻字相容频、隔字相容频、隔两字相容频文件,文件格式相同。
(3).单字字频文件格式以汉字机内码为序的长整型数字,每个字的频率占4Byte。
(以二进制储存)(4).用户句库文件格式(普通文本格式)编码语句频率如……hhxx 好好学习3
ttxs 天天向上3ttxs 贪图享受11(5)临时用户句库与用户句库格式相同。
用户句库只保留用户的常用语,临时用户句库保留一周内用户用过的语句.
本智能汉字输入法之单字以音形编码时所采用的《字根键位表》见说明书附页说明相同相近的字根归并所有的点,不管多少都归成点D,所有横一横两横三横都在横H各种各样的框,都归成框K,各种各样的折都归成折Z……独撇、折撇、三撇 都算撇P,长竖短竖一竖两竖都在竖S2.新华字典的标准偏旁部首以它标准命名的字音首声母分配到键盘3.字根字,以其主要读音的首声母分配到键盘上4.不常用字或容易产生歧义的字,不作字根用,如黾、邑、臾、5.自定义了部分较常用的字根,以其构成的最常见字的字音命名。
如高字头、春字头、业字头、师字旁……
权利要求
权利要求1.一种能够输入语句、短语、词、句的智能汉字输入方法其特征是以汉语拼音为基础,以字与字间搭配的相容性为核心,通过一种语句输入方法和一种字词输入方法的交融,完成语句、短语、词、字的输入,其中字词输入法用于单字、短词的输入,语句输入法用于句子、短语的输入,同时字词输入法又用来修改语句输入法所生成的句子。
2.前述智能汉字输入法所采用的语句输入方法其特征是A.引入字与字之间搭配关系以及频度,顺序键入句中各字读音首声母所对应的英文键盘,通过字与字的相容组合,产生尽可能是用户希望的语句,它与嵌接的某种字词输入方法相互调用,从而实现汉字按句、短语、词、字都能正确输入的目的B.键盘分配,完全按照汉语拼音字母的写法,对应到普通英文字母键盘上A-阿;B-波;C-雌;D-得;E-呃;F-佛;G-哥;H-喝;J-基;K-科;L-勒;M-摸;N-呐;O-喔;P-坡;Q-欺;R-日;S-思;T-特;W-乌;X-希;Y-衣;Z-资;C.利用上述键盘的汉字语句输入方法如下按语句的汉字个数,一字一键或每字二、三键连键
3.前述语句输入方法中所采用的字与字之间搭配关系分为邻字相容、隔字相容两大类,搭配关系的密切程度称为频率分为a.邻字相容频从大量汉语语句中统计出的某个字与其后紧随字的(相邻可搭配)字集及该搭配的出现次数。b.隔字相容频从语句中统计出的一个字与其后随隔字(第三字)的字集及该搭配的出现次数。c.隔两字相容频从语句中统计出的一个字与其后随隔两字(第四字)的字集及该搭配的出现次数。**例以“申请专利” 这四个字而言邻字相容--“申请、请专、专利”隔字相容--“申-专、请-利”隔两字相容-“申--利”
4.前述语句输入法产生语句的核心实质是进行字与字搭配的相容组合其特征是将语句视为单个字的组合,用字去组合语句,合适的语句必须每个字与相邻字满足邻字相容关系每个字与间隔字满足隔字相容、隔两字相容的关系
5.前述智能汉字输入方法的字词输入部分允许采用任意类型的字词输入法,(允许采用以字音为主的拼音类字词输入法允许采用以字形为主的形码类字词输入法允许采用音形结合类编码的字词输入法允许两种及以上编码组合的字词输入法)其显著特征是如果采用了两种及以上输入方案,其中之一一定是汉语拼音。
全文摘要
本发明涉及一种能够输入语句、短语、词、字的智能汉字输入方法。它,攻克了资料有限而语句无穷的难关,能够靠有限的统计资料,举一反三地产生无穷无尽的正确的字词搭配,以应对语句的千变万化。它从研究和运用字与字的相容关系及搭配频度出发,不但解决了易学易用的输入法由于重码问题导致候选字过多影响输入的难题,而且解决了智能组句问题。具有以下优点输入简单、组句准确。说明书阐述的内容不仅仅只适用于本发明枚举的拼音、音形兼容的输入方法,而且适用于所有需要解决重码问题或需要智能成句的一切汉字输入法。
文档编号G06F3/023GK1485718SQ0214177
公开日2004年3月31日 申请日期2002年9月6日 优先权日2002年9月6日
发明者张承权, 宋敏 申请人:张承权, 宋敏
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1