输入法中对文字与数字信息建立关联的方法及系统的制作方法

文档序号:6432968阅读:321来源:国知局
专利名称:输入法中对文字与数字信息建立关联的方法及系统的制作方法
技术领域
本发明属于计算机、软件技术领域。
背景技术
当前的输入法工具,对于实际相关联的文字和数字信息之间,并不能有效地建立起关联,以及基于该关联的词库。比如,在专利撰写中,经常会将文字与数字标号连贯着输入,如“机身100”、“后壳 210”等等。当前的输入法,只能够对“机身”或“后壳”等连贯的字符形式进行关联,而对于包括有数字信息的内容则无能为力了。主要原因在于,数字信息内容通常需要利用输入法单独进行输入,与文字内容没有含义上的关联。

发明内容
本发明的目的,是提供一种输入法中对文字与数字信息建立关联的方法,以及建立对应词库的方法,以及配套的系统,利用本发明,能够有效地在文字信息和数字信息之间建立关联,提高用户字符信息的输入效率。本发明提供一种输入法中对文字与数字信息建立关联的方法,该方法包括有如下步骤步骤1,采集所在文档中的输入信息;步骤2,利用文字-数字规则对采集到的数据进行判定;步骤3,在采集到的数据符合文字-数字规则的情况下,将相应的文字-数字存入词库;步骤4,当再次采集到的字符串输入信息中,所对应的候选词包括有对应文字中至少部分一致的信息时,调出相应的未输入的数字加入,作为候选词列表的候选项输出。进一步,在步骤2中,所述的文字-数字规则是指采集到的前一字符信息为文字, 而随后输入的字符信息为数字。3.根据权利要求1或2所述的一种输入法中对文字与数字信息建立关联的方法, 其特征在于所述的文字,为非数字及标点的字符信息。进一步,在存储所对应的文字信息和数字信息时,将文字部分取为独立含义的内容,其步骤为,采集所在文档中载入的数字信息前的文字信息;通过以“词”或“短语”所在代表的独立含义为基本单位,来判定前述的文字信息, 最小的独立含义的文字内容;将前述的文字内容,取为具有独立含义的文字部分,用以和其后的数字内容建立关联。
进一步,所述文字的独立含义包括有相连贯的两个或两个以上时,设置一阶文字内容,或二阶或二阶以上文字内容。进一步,所述的二阶或二阶以上文字内容,其设置方式为,采集所在文档中载入的数字信息前的文字信息;通过以“词”或“短语”所在代表的独立含义的基本单位,来判定前述的文字信息, 最小的独立含义的文字内容,作为一阶文字内容;进一步向前判定是否具有关联性的“词”或“短语”,作为待定文字内容;继续采集文字内容,当待定文字内容重复的次数达到或超过预设阈值的情况下, 将其作为二阶或二阶以上文字内容的组成部分;将前述的二阶或二阶以上文字内容,取为具有独立含义的文字部分,用以和其后的数字内容建立关联。进一步,前述的预设阈值,为两次。进一步,所述的数字信息,包括相连贯的全部数字信息,其采集的步骤为,采集所在文档中紧随文字信息后载入的数字信息;采集相连贯的全部数字信息,作为用以和文字信息相关联的数字信息内容。进一步,所述的数字信息,包括有与数字相连贯的字母时,所述的数字信息还包括该字母,其处理步骤为,采集所在文档中紧随文字信息后载入的数字信息;进而判断数字信息之后是否还存在着连贯且没有间隔的字母;在存在该类字母的情况下,将其采集加入到数字信息之中。进一步,所述的数字信息随后设置有与数字相连贯的数量词时,所述的数字信息, 还包括该数量词。进一步,将所述的数字信息包括有数量词的处理步骤为,采集所在文档中紧随文字信息后载入的数字信息;进而判断数字信息之后是否还存在着连贯的数量词;在存在该类数量词的情况下,将其采集加入到数字信息之中。进一步,当具有数字信息的候选词在候选项上显示时,将文字信息部分作为候选词优先显示,将包括有数字信息的候选词置后显示。进一步,通过文字-数字相组合的形式所建立起来的词库,限定在建立文字-数字词库的当篇文档中有效。进一步,通过文字-数字相组合的形式所建立起来的词库限定在当篇文档中有效,其步骤为,建立文字-数字的组合形式,并将其加入到词库时,同时采集所在文档的识别信息;当针对于特定文档进行输入时,采集所在的文档的识别信息;判定当前的文档是否对应有已建立的文字-数字词库,如果有,则在针对于该文档进行输入操作时,调用前述词库。进一步,所述的文档的识别信息,是文档的名称,和/或文档的哈希值,和/或文档的存储链接,和/或文档的已有内容。
本发明还提供一种输入法中对文字与数字信息建立关联词库的方法,该方法包括有如下步骤步骤1,采集所在文档中的输入信息;步骤2,利用文字-数字规则对采集到的字符信息进行判定;步骤3,在采集到的字符信息符合文字-数字规则的情况下,将相应的文字-数字存入词库。进一步,采集到的字符信息符合文字-数字规则的情况下,且出现的频率达到或超过两次以上的情况下,将相应的文字-数字存入词库。进一步,通过文字-数字相组合的形式所建立起来的词库,限定在建立文字-数字的词库的当篇文档中有效。本发明还提供一种输入法中对文字与数字信息建立关联的系统,该系统包括字符信息采集模块,采集所在文档中的输入信息;字符信息判定模块,用于判定上述采集到的前一文字信息和随后输入的数字信息是否符合文字-数字规则;词库生成模块,用于将满足文字-数字规则的字符信息存入词库;候选词列表生成模块,当再次采集到的字符信息中,包括有文字部分中至少部分信息与词库中文字-数字规则的文字信息部分相一致时,调出相应的数字信息结合着所述的文字信息加入到候选词列表中。进一步,所述的文字-数字规则是指采集到的前一数字信息为文字,而随后输入的数字信息为数字。进一步,通过文字-数字相组合的形式所建立起来的词库,限定在建立文字-数字的词库的当篇文档中有效。


图1是本发明所述方法的流程图,为一种实施例。图2是一个实施例输入法中对文字信息与数字信息建立关联的示意图。图3是本发明所述建立词库的方法的流程4是本发明所述系统的结构框图,为一种实施例。
具体实施例针对于本发明主要功能的描述在现有的输入法中,针对于前面输入文字,后面输入数字的情况,无法将两者输入的内容关联起来。比如,前面已经输入了文字“机身”和数字“100”所组成的连贯内容“机身100”。 而在下次输入时,依照现有的技术,在只输入“机身,,两个字的拼音“ jishen”时,或者只输入“机”的拼音“ ji”时,不会在输入法界面中显示出“机身100”的候选词选项。而在本发明中,将这种原本非连贯输出的文字和数字之间建立起关联,从而使用户直接在候选词列表中选择即可,提高了用户的输入效率。本发明在撰写技术文档,比如专利文档时,尤其有价值。
下面通过举例对本发明作进一步的描述。参照图1所示,展示的是本发明所述的输入法中对文字与数字信息建立关联的方法的流程图,该方法包括如下步骤在步骤SlOl中,采集所在文档中的输入信息。利用输入法工具来直接采集用户的输入信息;或者,利用钩子函数一类的方式,直接从所在文档中进行采集。特别指出的是,本发明所需要采集的内容,包括文字信息,以及紧随在文字之后的数字信息。另外,也可以直接采集该文档中原有的数据信息进行分析。在步骤S102中,利用文字-数字规则对采集到的数据进行判定。本实施例中,所述的文字-字符规则指的是,前一部分字符信息为文字信息,而随后的字符信息为数字信息, 由该方式所组成的字符之间的组合规则。在步骤S103中,在采集到的数据符合文字-数字规则的情况下,将相应的文字-数字存入词库。即,将采集获得的前一输入部分为文字信息,后一输入部分为数字信息的情况,将其取为关联的信息内容,存储到所在的用户词库中。需要指出的是,在存储所对应的文字信息和数字信息时,还可以设置如下的规则(1)将文字部分,取为独立含义的内容。举例在“机身100”中,“机身”就是具有独立含义的内容。实施步骤举例采集所在文档中载入的数字信息前的文字信息;通过以“词”或“短语”所在代表的独立含义的基本单位,来判定前述的文字信息, 最小的独立含义的文字内容;将前述的文字内容,取为具有独立含义的文字部分,用以和其后的数字内容建立关联。(2)进一步,所述的文字的独立含义包括有相连贯的两个或两个以上时,还可以设置一阶文字内容,以及二阶文字内容,甚至二阶以上的文字内容。举例在“移动电话机身100”中,“机身”是一个具有独立含义的短语,适合将其作为一阶文字内容;而相关联的短语“移动电话”也代表着一个独立的含义,且和“机身”之间构成了双重的限定关系。这种情况下,就可以将“移动电话机身”整体上作为二阶文字内容。 诸如此类,还可以设置二阶以上的文字内容。实施步骤举例采集所在文档中载入的数字信息前的文字信息;通过以“词”或“短语”所在代表的独立含义的基本单位,来判定前述的文字信息, 最小的独立含义的文字内容,作为一阶文字内容;进一步向前判定是否具有关联性的“词”或“短语”,作为待定文字内容;继续采集文字内容,当待定文字内容重复的次数达到或超过预设阈值的情况下, 将其作为二阶或二阶以上文字内容的组成部分;将前述的二阶或二阶以上文字内容,取为具有独立含义的文字部分,用以和其后的数字内容建立关联。前述的预设阈值,比如说,可以取为两次。即,重复两次或两次以上,即可视为达到了有效的阈值。(3)所述的数字信息,包括相连贯的全部数字信息。比如说,“机身100是…”中的数字信息“100”,就包括了三个相连贯的数字信息, 将这三个数字字符全部采集。实施步骤举例采集所在文档中紧随文字信息后载入的数字信息;采集相连贯的全部数字信息,作为用以和文字信息相关联的数字信息内容。(4)所述的数字信息,在包括有与数字相连贯的字母时,所述的数字信息,还包括该字母。比如,“壳体200a是…”中,字母“a”和数字“200”两者连贯起来,共同构成了对 “壳体”进行标记的数字组合。实施步骤举例采集所在文档中紧随文字信息后载入的数字信息;进而判断数字信息之后是否还存在着连贯且没有间隔的字母;在存在该类字母的情况下,将其采集加入到数字信息之中。(5)所述的数字信息,还随后设置的与数字相连贯的数量词时,所述的数字信息, 还包括该数量词。比如,“壳体200甲是…”中,字符“甲”和数字“200”两者连贯起来,共同构成了对 “壳体”进行标记的数字组合。实施步骤举例采集所在文档中紧随文字信息后载入的数字信息;进而判断数字信息之后是否还存在着连贯的数量词;在存在该类数量词的情况下,将其采集加入到数字信息之中。在步骤S104中,当再次采集到的字符串输入信息中,所对应的候选词包括有对应文字中至少部分一致的信息时,调出相应的未输入的数字加入,作为候选词列表的候选项输出。结合着上面描述的方法,对应着图2所示的一个实施例进行详细说明在本实施例中,用户已经在文档010中输入过“壳体100”,利用前面所描述的方法,将其加入到了本发明所对应的词库中。当用户在编辑文档的过程中,想再次输入“壳体100”时。只要通过输入法界面200 的字符串输入区201输入“keti”时,由于“壳体”与前面存入到词库中的“壳体100”部分信息相一致,就会调出相应的未输入的“100”作为候选词以供用户选择,S卩在候选项202 显示出“1.壳体2.壳体1003.课题4.客体5.客梯”。需要说明的是,当候选词在候选项202上显示时,还包括一个优先级的问题,由于用户在字符串输入区201输入的是文字对应的字符串,在候选项202中的第一个候选项为对应的文字信息,而第二个候选词才是与符号建立起关联的候选词。对应着所述的方法,本发明还提供了一种输入法中对文字与数字信息建立关联词库的方法,参图3所示,它包括如下步骤步骤210,采集所在文档中的输入信息;
步骤220,利用文字-数字规则对采集到的字符信息进行判定;步骤230,在采集到的字符信息符合文字-数字规则的情况下,将相应的文字-数字存入词库。利用上述方法建立的关联词库,用以将用户输入的符合文字-数字规则的字符信息,作为候选词存储到关联词库中。当用户输入的字符信息与关联词库中已有的候选词的至少部分内容吻合时,该系统会自动调取与用户输入的字符信息相关的候选词,优先显示在候选词列表中,以供用户选择。例如,在关联词库中已经存储了这个候选词,当用户输入了字符信息“ jishen”或者“ ji”时,“机身100”就会调取出来优选显示在候选词列表中。进一步,在本发明中,通过文字-数字相组合的形式所建立起来的词库,还可以限定在建立文字-数字的词库的当篇文档中有效。这是因为这种文字-数字的组合形式,通常有很大的随机性,脱离了当篇文档,可能就要变化其组合方式了。在具体实施时,可以通过如下的步骤来实现在建立文字-数字的组合形式,并将其加入到词库时,同时采集所在文档的识别 fn息;当针对于特定文档进行输入时,采集所在的文档的识别信息;判定当前的文档是否对应有已建立的文字-数字词库,如果有的话,在针对于该文档进行输入操作时,调用前述词库。前述的文档的识别信息,指的是用以判定及区别文档的信息内容。典型的形式包括但不局限于文档的名称,文档的哈希值,文档的存储链接,文档的已有内容等。对应着所述的方法,本发明还提供了一种在输入法中对文字与数字信息建立关联的系统100。参图4所示,该系统包括字符信息采集模块110,采集所在文档中的输入信息;字符信息判定模块120,利用文字-数字规则对采集到的数据进行判定;词库生成模块130,在采集到的数据符合文字-数字规则的情况下,将相应的文字-数字存入词库;候选项生成模块140,当再次采集到的字符串输入信息中,所对应的候选词中包括有对应文字中至少部分一致的信息时,调出相应的未输入的数字加入,作为候选词列表的候选项输出。在实施过程中,预设文字-数字规则。然后通过字符信息采集模块110,字符信息采集模块110,采集用户利用输入法所进行的前一输入的字符信息。进而通过字符信息判定模块120,来判断所输入的信息是否前面部分是文字信息,随后是数字信息。在符合前述判断条件的情况下,将其文字-数字组合载入到词库生成模块130。当再次采集到用户所输入的字符串输入信息,所对应的候选词中假如包括有对应文字中至少部分一致的信息时,即可调出相应的未输入的数字加入,作为候选词列表的候选项输出。进一步,如前所述,通过词库生成模块130所生成的文字-数字相组合的形式的词库,限定在建立文字-数字的词库的当篇文档中有效。这样也是能够给使用带来便利的。而且,本发明适合在具有候选项的输入法中使用。以上是对本发明的描述而非限定,基于本发明思想的其它实施例,亦均在本发明的保护范围之中。
权利要求
1.一种输入法中对文字与数字信息建立关联的方法,其特征在于该方法包括有如下步骤步骤1,采集所在文档中的输入信息;步骤2,利用文字-数字规则对采集到的数据进行判定;步骤3,在采集到的数据符合文字-数字规则的情况下,将相应的文字-数字存入词库;步骤4,当再次采集到的字符串输入信息中,所对应的候选词包括有对应文字中至少部分一致的信息时,调出相应的未输入的数字加入,作为候选词列表的候选项输出。
2.根据权利要求1所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于在步骤2中,所述的文字-数字规则是指采集到的前一字符信息为文字,而随后输入的字符信息为数字。
3.根据权利要求1或2所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述的文字,为非数字及标点的字符信息。
4.根据权利要求1所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于在存储所对应的文字信息和数字信息时,将文字部分取为独立含义的内容,其步骤为,采集所在文档中载入的数字信息前的文字信息;通过以“词”或“短语”所在代表的独立含义为基本单位,来判定前述的文字信息,最小的独立含义的文字内容;将前述的文字内容,取为具有独立含义的文字部分,用以和其后的数字内容建立关联。
5.根据权利要求4所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述文字的独立含义包括有相连贯的两个或两个以上时,设置一阶文字内容,或二阶或二阶以上文字内容。
6.根据权利要求5所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述的二阶或二阶以上文字内容,其设置方式为,采集所在文档中载入的数字信息前的文字信息;通过以“词”或“短语”所在代表的独立含义的基本单位,来判定前述的文字信息,最小的独立含义的文字内容,作为一阶文字内容;进一步向前判定是否具有关联性的“词”或“短语”,作为待定文字内容; 继续采集文字内容,当待定文字内容重复的次数达到或超过预设阈值的情况下,将其作为二阶或二阶以上文字内容的组成部分;将前述的二阶或二阶以上文字内容,取为具有独立含义的文字部分,用以和其后的数字内容建立关联。
7.根据权利要求6所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于前述的预设阈值,为两次。
8.根据权利要求1所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述的数字信息,包括相连贯的全部数字信息,其采集的步骤为,采集所在文档中紧随文字信息后载入的数字信息;采集相连贯的全部数字信息,作为用以和文字信息相关联的数字信息内容。
9.根据权利要求1或8所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述的数字信息,包括有与数字相连贯的字母时,所述的数字信息还包括该字母, 其处理步骤为,采集所在文档中紧随文字信息后载入的数字信息; 进而判断数字信息之后是否还存在着连贯且没有间隔的字母; 在存在该类字母的情况下,将其采集加入到数字信息之中。
10.根据权利要求1所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述的数字信息随后设置有与数字相连贯的数量词时,所述的数字信息,还包括该数量词。
11.根据权利要求10所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于将所述的数字信息包括有数量词的处理步骤为,采集所在文档中紧随文字信息后载入的数字信息;进而判断数字信息之后是否还存在着连贯的数量词; 在存在该类数量词的情况下,将其采集加入到数字信息之中。
12.根据权利要求1所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于当具有数字信息的候选词在候选项上显示时,将文字信息部分作为候选词优先显示, 将包括有数字信息的候选词置后显示。
13.根据权利要求1所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于通过文字-数字相组合的形式所建立起来的词库,限定在建立文字-数字词库的当篇文档中有效。
14.根据权利要求13所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于通过文字-数字相组合的形式所建立起来的词库限定在当篇文档中有效,其步骤为,建立文字-数字的组合形式,并将其加入到词库时,同时采集所在文档的识别信息; 当针对于特定文档进行输入时,采集所在的文档的识别信息; 判定当前的文档是否对应有已建立的文字-数字词库,如果有,则在针对于该文档进行输入操作时,调用前述词库。
15.根据权利要求14所述的一种输入法中对文字与数字信息建立关联的方法,其特征在于所述的文档的识别信息,是文档的名称,和/或文档的哈希值,和/或文档的存储链接,和/或文档的已有内容。
16.一种输入法中对文字与数字信息建立关联词库的方法,其特征在于该方法包括有如下步骤步骤1,采集所在文档中的输入信息;步骤2,利用文字-数字规则对采集到的字符信息进行判定;步骤3,在采集到的字符信息符合文字-数字规则的情况下,将相应的文字-数字存入词库。
17.根据权利要求16所述的一种输入法中对文字与数字信息建立关联词库的方法,其特征在于采集到的字符信息符合文字-数字规则的情况下,且出现的频率达到或超过两次以上的情况下,将相应的文字-数字存入词库。
18.根据权利要求16所述的一种输入法中对文字与数字信息建立关联词库的方法,其特征在于通过文字-数字相组合的形式所建立起来的词库,限定在建立文字-数字的词库的当篇文档中有效。
19.一种输入法中对文字与数字信息建立关联的系统,其特征在于该系统包括字符信息采集模块,采集所在文档中的输入信息;字符信息判定模块,用于判定上述采集到的前一文字信息和随后输入的数字信息是否符合文字-数字规则;词库生成模块,用于将满足文字-数字规则的字符信息存入词库;候选词列表生成模块,当再次采集到的字符信息中,包括有文字部分中至少部分信息与词库中文字-数字规则的文字信息部分相一致时,调出相应的数字信息结合着所述的文字信息加入到候选词列表中。
20.根据权利要求19所述的一种输入法中对文字与数字信息建立关联的系统,其特征在于所述的文字-数字规则是指采集到的前一数字信息为文字,而随后输入的数字信息为数字。
21.根据权利要求19所述的一种输入法中对文字与数字信息建立关联的系统,其特征在于通过文字-数字相组合的形式所建立起来的词库,限定在建立文字-数字的词库的当篇文档中有效。
全文摘要
本发明提供了一种输入法中对文字与数字信息建立关联的方法及系统,属于计算机、软件技术领域。该方法包括有如下步骤步骤1,采集所在文档中的输入信息;步骤2,利用文字-数字规则对采集到的数据进行判定;步骤3,在采集到的数据符合文字-数字规则的情况下,将相应的文字-数字存入词库;步骤4,当再次采集到的字符串输入信息中,所对应的候选词包括有对应文字中至少部分一致的信息时,调出相应的未输入的数字加入,作为候选词列表的候选项输出。利用本发明,能够有效地在文字信息和数字信息之间建立关联,提高用户字符信息的输入效率。
文档编号G06F17/30GK102368235SQ20111026818
公开日2012年3月7日 申请日期2011年9月10日 优先权日2011年9月10日
发明者不公告发明人 申请人:上海量明科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1