一种用于确定提示信息的方法、装置和计算机设备的制作方法

文档序号:6353118阅读:391来源:国知局
专利名称:一种用于确定提示信息的方法、装置和计算机设备的制作方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于确定提示信息的方法、装置和计算机设备。
背景技术
现有技术中,为了便于用户输入其所希望输入的信息,往往会根据用户当前输入的字符串来将用户可能希望输入的信息作为提示信息提供给用户,例如,在根据用户在搜索框中输入的字符串来在下拉框中提供相应的选项,或者输入法中根据用户输入的字符串来提供相应的候选项等。现有技术中,往往通过对字符串的拼音进行划分后,获得对应的全拼或非全拼结果,并将全拼及非全拼结果对应的短文本信息按照各自的权重值排序进行展示出来。然而, 由于非全拼结果相对全拼结果往往具有更高的权重值,但全拼结果为用户实际希望输入的信息的可能性高于非全拼结果,并且,提示信息所包含的提示项数量有限,因此,容易造成并非用户所期望的非简拼结果排序靠前或者挤掉用户实际希望输入的全拼结果的情况。

发明内容
本发明的目的是提供一种用于确定提示信息的方法、装置和计算机设备。根据本发明的一个方面,提供一种计算机实现的用于基于短文本前缀来确定提示信息的方法,其中,该方法包括以下步骤a获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;b基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀与所述一个或多个短文本信息相对应的权重值;c根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息,所述提示信息包括一个或多个排序的提示项。根据本发明的另一个方面,还提供了一种用于基于短文本前缀来确定提示信息的提示装置,其中,该提示装置包括第一获取装置、用于获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;权重确定装置、用于基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述一个或多个短文本信息相对应的权重值;第一更新装置、用于根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息,所述提示信息包括一个或多个排序的提示项。与现有技术相比,本发明具有以下优点1)通过对不同预定拼音类型的短文本信息执行相应地权重调整策略,既能保留较好的全拼类型的提示项,又能提供减少用户输入操作的简拼类型的提示项,使得所呈现的提示项更符合用户的需求;2)能够快速遍历大量的短文本信息来获取各短文本前缀及其对应的提示信息,消耗资源少;幻通过采用根据本发明的方案所生成的提示信息库,能够快速获得与用户实时输入的输入序列相应的提示信息,满足了线上实时的需求。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图1为本发明一个方面的计算机实现的基于短文本前缀来确定提示信息的方法流程图;图2为本发明一个优选实施例的基于短文本前缀来确定提示信息的方法流程图;图3为本发明又一个优选实施例的基于短文本前缀来确定提示信息的方法流程图。图4为本发明一个方面的用于基于短文本前缀来确定提示信息的提示装置的结构示意图。图5为本发明一个优选实施例的用于基于短文本前缀来确定提示信息的提示装置的结构示意图;图6为本发明又一个优选实施例的用于基于短文本前缀来确定提示信息的提示装置的结构示意图。 附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示意出了本发明一个方面的计算机实现的基于短文本前缀来确定提示信息的方法流程图。其中,根据本发明的方法可通过计算机设备中的操作系统或处理控制器来完成,为简明起见,以下将所述操作系统或处理控制器统称为提示装置。其中,该计算机设备包括但不限于1)用户设备;2)网络设备。所述用户设备包括但不限于计算机、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在步骤Sl中,提示装置获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;其中,所述短文本前缀包括但不限于一个或多个字符组成的字符串,该字符串包括多种用于拼写语言的字符串,例如,中文的拼音字符串、日语的罗马字符串、韩语的拼音字符串等。所述短文本信息包括但不限于1)来自用户的输入序列;2)计算机设备当前需要处理的信息等。所述预定拼音类别包括但不限于1)全拼;幻非全拼等。其中所述全拼、 非全拼,是指对短文本信息解析得到短文本信息对应的拼写字符串后,该拼写字符串相对于短文本前缀的类别。具体地,提示装置可先获得所述短文本前缀,再根据所述短文本前缀来获取预设的与该短文本前缀相应的一个或多个短文本信息及分别与所述一个或多个短文本信息相对应的预定拼音类别;其中,提示装置获取所述短文本前缀的方式包括但不限于1)实时获取用户输入的输入序列,并将该实时获取的输入序列作为短文本前缀;2)获取预存储的短文本前缀。或者,提示装置先获得所述短文本信息,再对该短文本信息进行分析,由该短文本信息推得与该短文本信息相对应的短文本前缀及与所述短文本信息相对应的预定拼音类别。其中,提示装置获取所述短文本信息的方式包括但不限于1)获取来自用户的输入序列,并将该输入序列作为短文本信息;2)获取预存储的短文本信息。在步骤S2中,提示装置基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述一个或多个短文本信息相对应的权重值。具体地,第一预定规则中包括对根据短文本信息的预定拼音类别来对短文本信息采用不同权重确定方式的权重确定规则,提示装置根据该权重确定规则来获得短文本信息的权重值。其中,该权重确定规则包括以下任一规则1)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则将该短文本信息的初始权重值来作为权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则对该短文本信息的初始权重值进行降权处理,以获得所述权重值;2)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则对该短文本信息的初始权重值进行升权处理,以获得所述权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则将该短文本信息的初始权重值作为权重值;3)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则对该短文本信息的初始权重值进行升权处理,以获得所述权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则对该短文本信息的初始权重值进行降权处理,以获得所述权重值。其中,所述预设的初始权重值可以参考多项因素确定,例如,短文本信息的点击率,短文本信息被搜索的频次,短文本信息所对应的搜索结果的质量,预设的短文本信息初始权重值等。本领域技术人员应该理解,确定所述初始权重值的因素不以上述举例。需要说明的是,本领域技术人员应该理解,本发明所述的权重确定规则不以上述举例为限,事实上,只要是根据预定拼音类别,分别对短文本信息进行处理,以使非全拼类别的短文本信息对应的权重值相对全拼类别的短文本信息对应的权重值具有一定的降权幅度的方案,均应包含在本发明的范围内。其中,该权重确定规则参考以下至少一项因素来对所述初始权重值进行升权或降权处理1)所述短文本前缀的长度;具体地,对于升权处理,当短文本前缀的长度越长,其对应的短文本信息升权幅度越大,当短文本前缀的长度越短,其对应的短文本信息升权幅度越小;对于降权处理,当短文本前缀的长度越长,其对应的短文本信息降权幅度越大,当短文本前缀的长度越短,其对应的短文本信息降权幅度越小。2)所述短文本前缀所包含的元音个数;具体地,对于升权处理,当短文本前缀所包含的元音个数越多,其对应的短文本信息升权幅度越大,当短文本前缀所包含的元音个数越少,其对应的短文本信息升权幅度越小;对于降权处理,当短文本前缀所包含的元音个数越少,其对应的短文本信息降权幅度越小,当短文本前缀所包含的元音个数越多,其对应的短文本信息降权幅度越大。其中,所述元音包括但与不限于i)中文拼音中的单元音及组合元音字母,例如, a、e、i、o、u、ii、ai、ei、ui、ao、ou、iu、an、en、in 等;ii)日语罗马音中的元音字母,例如,a、 i、U、e、ο等;iii)韩语中的单元音(或称基本母音)和复合元音(或称双母音)字母等。 其中,组合元音或复合元音等在统计元音个数时可被统计为一个或多个元音。需要说明的是,提示装置同样可根据短文本前缀包含的辅音个数来确定升权或降权幅度,特别是对于一些辅音个数少于元音个数的语言,采用辅音个数作为判断标准更能节省资源。但根据辅音个数来判断升权或降权的规则与根据元音个数来判断升权或降权的规则相反,即对于升权处理,当短文本前缀所包含的辅音个数越少,其对应的短文本信息升权幅度越大,当短文本前缀所包含的辅音个数越多,其对应的短文本信息升权幅度越小;对于降权处理,当短文本前缀所包含的辅音个数越多,其对应的短文本信息降权幅度越小,当短文本前缀所包含的辅音个数越少,其对应的短文本信息降权幅度越大。3)与该短文本前缀相对应的所述短文本信息的长度;具体地,对于升权处理,当短文本信息的长度越长,其升权幅度越小,当短文本信息的长度越短,其升权幅度越大;对于降权处理,当短文本信息的长度越长,其降权幅度越大,当短文本信息的长度越短,其降权幅度越小。其中,提示装置根据所述权重确定规则来对初始权重进行升权或降权处理以确定所述权重值的方式包括但不限于1)直接根据短文本信息的预定拼音类别,参考上述三项因素中的任意一项或多项,来调节预设的所述短文本信息的初始权重值,以确定其在所对应的短文本前缀下的权
重值;例如,若预设短文本信息的初始权重值由短文本信息的被搜索频次/1000来得到,权重调节规则包括对于非全拼类型的短文本信息,在其初始权重值的基础上,减去根据短文本信息长度对应的值,以获得短文本信息的权重值;对于全拼类型的短文本信息,直接将其初始权重作为权重值的规则。对于短文本信息“wytsese”、“wymtf”、“wywz”、“五月天”、 “网易”、“网游”、“武艺”,提示装置所获得的该等短文本信息相应的搜索频次为Wytsese,9500 ;网易,8900;Wymtf,8950;五月天,10600;武艺,7400。提示装置根据该等短文本信息被搜索的频次,获得该等短文本信息各自的初始权重值,以及该等短文本信息相对应短文本前缀“wy”的预定拼音类型为Wytsese,9. 5,全拼;
9
网易,8. 9,非全拼;Wymtf,8. 95,全拼;五月天,10. 6,非全拼;武艺,7. 4,非全拼。其中,非全拼类别的短文本信息“五月天”、“网易”、“武艺”对应的短文本信息的长度对应的值分别为3、2、2,则搜索装置根据权重调节规则,将非全拼类别的短文本信息对应的初始权重值减去其短文本信息长度对应的值后,获得的短文本信息的权重值及其类别如下Wytsese,9. 5,全拼;网易,6. 9,非全拼;Wymtf,8. 95,全拼;五月天,7. 6,非全拼;武艺,5. 4,非全拼。又例如,权重调节规则包括对于非全拼类型的短文本信息,根据短文本前缀的长度、该短文本前缀包含的元音个数及短文本信息的长度,分别确定三个单项权重值,并将各单项权重值与所述初始权重值相加,以获得权重值;对于全拼类型的短文本信息,直接将其初始权重作为权重值的规则。其中,所述单项权重值可通过以下任一方式来确定i)直接将短文本前缀的长度、短文本前缀包含的元音个数或短文本信息的长度对应的值作为单项权重值;ii)对短文本前缀的长度、短文本前缀包含的元音个数或短文本信息的长度对应的值进行一定处理,例如,进行倒数或与其他预定参数进行预定的加减乘除或根据预定公式进行运算后,获得单项权重值;iii)通过判断短文本前缀的长度、短文本前缀包含的元音个数或短文本信息的长度对应的值所属的预定阈值范围,并获取所属预定阈值范围对应的单项权重值。则对于短文本前缀“wy”,提示装置所获得的一个短文本信息及其对应的初始权重值和预定拼音类别分别为网易,8. 9,非全拼。且提示装置根据前述单项权重值确定方式中的任一项获得的短文本前缀的长度、短文本前缀包含的元音个数及短文本信息长度所获得的单项权重值分别为-0. 5、-3、-0. 2,则根据8. 9-0. 5-3-0. 2所得的与短文本前缀“wy”及短文本信息“网易”对应的权重值为5. 2。2)提示装置根据上述三项因素中至少一项来获得短文本信息的权重调节值,再根据权重调节值及初始权重值来获得短文本信息在其对应的短文本前缀下的权重值,该方式将在后续内容中予以详述,在此不再赘述。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述权重确定规则来对初始权重进行升权或降权处理以确定所述权重值的实现方式,例如,根据短文本前缀长度及辅音个数来获得辅音站短文本前缀长度的比例,再根据该比例来确定权重值的方式等,均应包含在本发明的范围内。在步骤S3中,提示装置根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息,所述提示信息包括一个或多个排序的提示项。其中,本领域技术人员应可根据实际情况和需求来选择并设定提示信息中所包含的提示项的最大数量。具体的,当某一短文本前缀的提示信息未建立时,将与该短文本前缀对应的一个或多个短文本信息根据对应的权重值大小及预定拼音类别进行排序后,将所述一个或多个短文本信息作为提示项来建立所述短文本前缀的提示信息。或者,当某一短文本前缀已包含提示信息时,将短文本信息对应权重值与提示信息中的提示项对应的权重值进行比对, 如果比对结果显示短文本信息优于已有提示项,则将短文本信息作为新的提示项插入到提示信息中,并对提示信息中其余的提示项做相应调整,否则提示信息不变。例如,提示装置预设提示信息中提示项的最大数量为5,其中,对于短文本前缀 "jjw",尚无与其对应的提示信息,而所获得的与所述短文本前缀“jjw”对应的短文本信息及所述短文本信息相对于所述短文本前缀的权重值和预定拼音类别为jjwxc,9,全拼;贾静雯,6. 5,非全拼;jjww,7,全拼;jjwx,8. 5,全拼;佳吉物流,3,非全拼;j jwxchousenetcom, 2. 5,全拼。将上述短文本信息排序后,选择前5项作为所述短文本前缀“jjw”的提示信息,则获得短文本前缀“ jjw”的提示信息为jjwxc、jjwx, jjww、贾静雯、佳吉物流。又例如,当短文本前缀“jjw”已获得上述提示信息后,其又获得与其对应的短文本信息“基金网”,该短文本信息“基金网”相对于短文本前缀“jjw”的权重值为5,相对于短文本前缀的预定拼音类别为非全拼。则提示装置判断其权重值高于非全拼类别的短文本信息“佳吉物流”,并根据权重值排序,将短文本信息“基金网”作为新提示项插入到短文本前缀“jjw”的提示信息中,且将原来位置的提示项依次下移调整,去除多余的提示项后,获得短文本前缀“jjw”新的提示信息为jjWXC、jjwx, jjww、贾静雯、基金网。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息的实现方式,均应包含在本发明的范围内。需要进一步说明的是,尽管上述举例均以中文进行说明,但根据本发明的方案同样可适用于日语、韩语等具有拼音标注的语言。例如,对于日语而言,短文本前缀“kis”可对应类别为全拼的短文本信息“kiss”,亦可对应类别为简拼的短文本信息“警察”(片假名为计 O,罗马音为keisatu),并且,本领域技术人员应可同样可根据本发明的方案来获得短文本前缀“kis”的提示信息。作为本发明的优选方案之一,其中,所述步骤S2还包括步骤S21(图未示)和步骤 S22(图未示)。 在步骤S21中,提示装置基于第一预定规则,根据所述预定拼音类别,来确定所述短文本信息的权重调节值;其中,所述权重调节值根据短文本信息的预定拼音类型及在前述步骤S2中所述的与升权及降权处理相关的三项因素确定。
具体地,提示装置根据所述预定拼音类别,由所述第一预定规则中选择适用于与该短文本前缀对应的短文本信息的权重调节值确定规则。其中,该权重调节值确定规则通过以下规则,来确定与该短文本前缀及短文本信息对应的权重调节值1)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则提示装置确定权重调节值为预定透明权重值,该预定透明权重值使得提示装置在执行后续步骤S2后,所得的权重值与初始权重值相同;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则确定权重调节值为惩罚权重值,并根据所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中至少一项来确定该惩罚权重值,该惩罚权重值使得提示装置在执行后续步骤S2后,所得的权重值小于初始权重值;2)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则确定权重调节值为奖励权重值,并根据所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中至少一项来确定该奖励权重值,该奖励权重值使得提示装置在执行后续步骤S2后,所得的权重值大于初始权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则提示装置确定权重调节值为预定透明权重值;3)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则确定权重调节值为奖励权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则确定权重调节值为惩罚权重值。其中,确定所述奖励权重值及惩罚权重值的方式包括但不限于1)根据所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中至少一项对应的单项权重值获得。具体地,提示装置可直接将某一项单项权重值直接作为奖励或惩罚权重值,或者, 提示装置获得多项单项权重值,并对该多项单项权重值进行相应处理,例如,将该多项权重值分别乘以预定系数后相加,或者将该多项权重值相乘,或者以其他预定方式进行处理等, 以获得所述奖励权重值或惩罚权重值。其中,所述单项权重值的获取方式已在前述内容中予以详述,在此不再赘述。2)获得所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中任一项对应的单项权重值,然后再根据其他任一项或其他两项来对该单项权重值进行调整。例如,提示装置根据短文本前缀获得的单项权重值为8. 5,并获得该短文本前缀对应的该短文本信息长度为3,若权重调节值确定规则中包括当短文本信息长度在2-4之间时,将已获得的权重值下调0. 5的规则,则提示装置根据该规则,将短文本前缀对应单项权重值下调0. 5,获得短文本信息的权重值为8。本领域技术人员应该理解,确定所述奖励权重值及惩罚权重值的方式不以上述举例。需要说明的是,本领域技术人员应该理解,本发明所述的权重确定规则不以上述举例为限,事实上,只要是根据所述预定拼音类别,来确定所述短文本信息的权重调节值的实现方式,均应包含在本发明的范围内。在步骤S22中,提示装置根据所述权重调节值及预设的所述短文本信息的初始权重值,来确定所述权重值。具体的,提示装置通过对初始权重值及权重调节值进行相应处理,以获得所述权重值。其中所述相应处理包括但不限于乘、除、加、减及其他形式的函数运算等。并且在前述相应处理中还可进一步结合预定参数等。例如,在步骤Sl中,提示装置获取到短文本信息“新浪”,其对应的短文本前缀 “xl”及与该两者对应的预定拼音类别为非全拼,则在步骤S21中,提示装置判断短文本信息“新浪”与短文本前缀“xl ”对应的权重调节值为惩罚权重值,并且,权重调节值确定规则中预设惩罚权重值即为与短文本信息对应的短文本前缀长度的值,提示装置分析得到短文本前缀“xl”的长度为2,则根据权重调节值确定规则,获得惩罚权重值为2 ;在步骤S22中, 提示装置获得短文本信息“新浪”预设的初始权重值为12,并且,提示装置根据公式权重值=初始权重值-权重调节值,获得短文本信息“新浪”的权重值为10。又例如,在步骤Sl中,提示装置获取到短文本信息“新浪”,其对应的短文本前缀 “xinlang”及与该两者对应的预定拼音类别为全拼;则在步骤S21中,提示装置判断短文本信息“新浪”与短文本前缀“xinlang”对应的权重调节值为奖励权重值,并且,权重调节值确定规则中预设奖励调节值=短文本元音个数*5,提示装置分析得到短文本前缀“xinlang” 包含两个元音“in”和“ang”,则提示装置获得短文本信息“新浪”对应的权重调节值为10 ; 在步骤S22中,提示装置获得短文本信息“新浪”的初始权重值为9,并且,提示装置根据公式权重值=0. 5*权重调节值+初始权重值,获得短文本信息“新浪”的权重值为14。再例如,在步骤Sl中,提示装置对于获取到短文本信息“新浪”,提示装置根据“新浪”,其对应的短文本前缀“xl”确定及其与该两者对应的预定拼音类别为非全拼,则在步骤 S21中,提示装置判断短文本信息“新浪”与短文本前缀“xl”对应的权重调节值为惩罚权重值,并且,权重调节值确定规则中预设惩罚权重值为短文本前缀长度、短文本前缀包含的元音个数及短文本信息长度对应的单项权重值的平均值倒数,其中,权重调节规则包括直接将短文本前缀长度对应的值的倒数作为其对应的单项权重值,当短文本前缀包含的元音个数为零时,其预设的单项权重值为10,及将短文本信息长度对应的值乘以1.5以作为短文本信息对应的单项权重值的规则,则提示装置根据权重调节规则,分别获得短文本前缀长度、短文本前缀包含的个数及短文本信息长度对应的单项权重值为0. 5、10及3,并根据单项权重值获得惩罚权重值为1/(0. 5+10+3) = 0. 074 ;在步骤S22中,提示装置获得短文本信息“新浪”的初始权重值为9,并且,提示装置根据公式权重值=权重调节值*初始权重值,获得短文本信息“新浪”的权重值为0. 667。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于第一预定规则,根据所述预定拼音类别,来确定所述短文本信息的权重调节值,并根据所述权重调节值及预设的所述短文本信息的初始权重值,来确定所述权重值的实现方式,均应包含在本发明的范围内。作为本发明的优选方案之一,其中,本发明还包括步骤S4和步骤S5。在步骤S4中,提示装置判断所述短文本信息是否与所述提示信息所包含的任一提示项等同;其中所述等同包括但不限于1)完全相同;2)词义相同或相似;3)实际自然语言表意相同或相似等。其中,词义是否相同或相似通过词义分析来进行判断,实际自然语言是否相同或相似通过预设的同义词典来进行判断。例如,对于短文本信息“llOsh”和 “110上海”,根据预设的同义词典判断sh与上海相同,故而判断两者等同。在步骤S5中,当提示装置判断得到所述短文本信息与所述任一提示项等同时,则根据该短文本信息与该提示项与所述短文本前缀对应的预定拼音类别,来基于该短文本信息更新所述提示信息。具体的,对于某一短文本前缀,提示装置判定一短文本信息与该短文本前缀的提示信息中的某一提示项等同,若所述短文本信息相对该短文本前缀为全拼,而所述提示项相对所述短文本前缀的预定拼音类别为非全拼,则将所述短文本信息作为新提示项替换所述提示项,并根据短文本信息的权重值,将新提示项插入到提示信息的相应位置,并对其余提示项做相应调整,例如,删除权重值最小的一项,并将权重值小于新提示项的其他提示项向下移动一位等;若所述短文本信息相对该短文本前缀的预定拼音为非全拼,而所述提示项相对所述短文本前缀的预定拼音类别为全拼,则不进行调整。例如,对于短文本前缀“la”,其提示项及相应的提示项权重值为来年,8;恋爱,5.5;来啊,4;娄安,3;对于短文本信息“来”,其权重值为6,通过等同判断,“来”与“来啊”相等同,而短文本信息“来”相对于短文本前缀“ la”的预定拼音类型为全拼,而短文本信息“来啊”相对于短文本前缀“la”的预定拼音类别为非全拼,则将“来”作为短文本前缀“la”的新提示项, 替换“来啊”,将“来”按照其权重值和预定拼音类别插入到提示信息中,并对其余提示项依次做相应的调整,获得短文本前缀“la”的提示项为来年,7;来,6;恋爱,5.5;娄安,3。其中,前述步骤S2可在步骤S5之后执行,即当在步骤S2中,提示装置判断得到所述短文本信息未与所述任一提示项等同,提示装置基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述一个或多个短文本信息相对应的权重值。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断得到所述短文本信息与所述任一提示项等同时, 则根据该短文本信息与该提示项与所述短文本前缀对应的预定拼音类别,来基于该短文本信息更新所述提示信息的实现方式,均应包含在本发明的范围内。作为本发明的优选方案之一,其中,本发明还包括步骤S8。在步骤S8中,提示装置根据所述短文本前缀及所建立或更新的提示信息,来建立或更新提示信息库;具体的,当所述提示信息库中未包含该短文本前缀,则提示装置将该短文本前缀及其相应的提示信息添加至提示信息库中;当所述提示信息库中已包含该短文本前缀,则提示装置根据该短文本前缀对应的提示信息来更新提示信息库中该短文本前缀的提示信肩、ο本发明还包括步骤S9和步骤S10。在步骤S9中,提示装置实时获取来自用户的输入序列。在步骤SlO中,提示装置将所述输入序列作为一个短文本前缀在所述提示信息库中进行查询,以获取与该输入序列所对应的提示信息,作为该输入序列的提示信息。例如,用户输入序列为“xul”,提示装置将该输入序列作为一个短文本前缀在提示信息库中查询,获得短文本前缀“xl”的提示信息为“xls”、“xlmv”、“序列”、“新浪”,则将此提示信息作为用户输入序列的提示信息,返回给用户。作为本发明的优选方案之一,其中,所述步骤S3还包括步骤S3’。在步骤S3’中,提示装置基于第二预定规则,根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息;其中, 所述第二预定规则包括以下规则将全拼的短文本信息排序高于非全拼的短文本信息。具体地,在建立或更新提示信息的过程中,提示装置始终将全拼类型的短文本信息置于非全拼类型的短文本信息之前。根据本发明的方法,通过对不同预定拼音类型的短文本信息执行相应地权重调整策略,既能保留较好的全拼类型的提示项,又能提供减少用户输入操作的简拼类型的提示项,使得所呈现的提示项更符合用户的需求。图2为本发明一个优选实施例的基于短文本前缀来确定提示信息的方法流程图。 根据本实施例的方法包括步骤Si、步骤S2及步骤S3。其中,步骤Sl进一步包括步骤Sll 和步骤S12 ;所述步骤S3进一步包括步骤S31、步骤S32、步骤S33及步骤S34。在步骤Sll中,提示装置获取所述短文本信息。在步骤S12中,提示装置分析所述短文本信息,以获得其对应的一个预定拼音类别的短文本前缀。具体的,提示装置对获得的短文本信息进行分析,并以全拼或非全拼的方式提取短文本信息对应的字符串,以作为所述短文本信息所对应的短文本前缀,并根据所述提取方式来是否是短文本信息的全拼,来确定短文本信息在对应的短文本前缀下的预定拼音类别。例如,对于短文本信息“新浪”,提示装置分析得到其全拼字符串为“xinlang”,则其全拼类别的前缀可包括、”、、广、、^1”、“剋111”、“^111£1”、“^111£111”及“^111£1叫”,提示装置由上述七个短文本前缀中选择一个以进行后续处理,并确定所选择的短文本前缀与短文本信息“新浪”对应的预定拼音类别为全拼。又例如,对于短文本信息“新浪”,提示装置分析得到其非全拼字符串提取的字符串为“XI”,则其非全拼类别的前缀可包括“X”及“XI”,短文本处理装置由上述两个个短文本前缀中选择一个以进行后续处理,并确定所选择的短文本前缀与短文本信息“新浪”对应的预定拼音类别为非全拼。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述短文本信息获得其相应短文本前缀的实现方式,均应包含在本发明的范围内。步骤S2已在参照图1所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。在步骤S31中,提示装置根据提示信息中提示项的最大数量,或根据所述短文本信息对应的权重值与相同及/或不同预定拼音类别的提示项对应的权重值的比对结果,来获得第一比对结果。
其中,提示装置通过判断所述提示信息中所包含的提示项数量是否已经达到最大数量,并当提示项数量已经达到预定的最大数量时,进一步将短文本信息的权重值与提示信息中的预定提示项的权重值进行比对来获得第一比对结果;其中,所述预定提示项包括最后一项全拼提示项和/或最后一项非全拼提示项。具体的,根据短文本信息所包含的提示信息的不同,第一比对结果可包括以下任一种A)若所述短文本前缀的提示信息中所包含的提示项数量未达到最大数量,则所获得的第一比对结果中包含如下任一信息A1)所有提示项均为全拼类型,且提示项数量未达到最大数量;A》所有提示项均为非全拼类型,且提示项数量未达到最大数量;Α; )提示信息中的提示项包括全拼与非全拼类型,且提示项数量未达到最大数量;例如,预设每个提示信息中可包含5项提示项,对于短文本前缀“xel”,其对应的提示信息为“xelteWxelodWxelos”、“邪恶力量”共四项,即提示信息所包含的提示项数量未达到最大数量,则当获取到与短文本前缀“xel”相关的短文本信息“xelove”时,提示装置根据比对获得的第一比对结果为提示信息中的提示项包括全拼与非全拼类型,且短文本前缀“xel”的提示信息的提示项数量未满。B)若所述短文本前缀的提示信息所包含的提示项数量已达到最大数量,且提示装置判断得到提示信息中的所有提示项均为全拼类型或者均为非全拼类型,则提示装置将短文本信息权重值与最后一个提示项权重值进行比较,所获得的第一比对结果中包含如下任一信息B1)短文本信息的权重值大于最后一个提示项的权重值;或者B2)短文本信息的权重值小于最后一个提示项的权重值;例如,若前述短文本前缀“xel”对应的提示信息及各提示项的权重值为xeltek, 10 ;xeloda,8;xelos,7;xelove, 5 ;xelement,4 ;其中各项均为全拼提示项,对于短文本信息“xelod”,其权重值为6. 5,提示装置比较短文本信息“xelod”的权重值与最后一项提示项“xelement”的权重值,获得的第一比对结果包括短文本信息“xelod”权重值大于最后一项提示项“xelement”权重值;又如,对于短文本信息“邪恶力量”,其权重值为3,提示装置比较短文本信息“邪恶力量”的权重值和最后一项提示项“xelement”的权重值,获得第一比对结果包括短文本信息“邪恶力量” 小于最后一项提示项“xelement”的权重值。C)若所述短文本前缀的提示信息中的提示项已达到最大数量,且提示信息中的提示项包括全拼类型及非全拼类型,则提示装置查找提示信息中最后一个全拼及非全拼的提示项,并将短文本信息权重值与最后一个全拼提示项的权重值及最后一个非全拼提示项权重值的进行比对,则所获得的第一比对结果中包含如下任一信息C1)最后一个全拼提示项权重值最小;以)最后一个非全拼提示项权重值最小;c;3)短文本信息权重值最小。例如,对于短文本前缀“ XS ”,其对应的提示信息及各提示项的权重值为xswos, 10 ;
xs8,8;χ 世界,7;许嵩,5;小说,4;其中,前三项为全拼提示项,后两项为非全拼提示项。对于短文本信息“xsmd”,其权重值为9,提示装置在提示信息中查找并判断最后一项全拼提示项为“χ世界”,最后一项非全拼提示项为“小说”,则提示装置将“xsmd”分别与最后一项全拼提示项“χ世界”和最后一项非全拼提示项“小说”进行比较,获得第一比对结果为最后一项非全拼提示项的权重值最低。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述提示项的最大数量、短文本信息权重值、短文本信息的预定拼音类别以及提示项信息的权重值与预定拼音类别来获得第一比对结果的实现方式,均应包含在本发明的范围内。接着,在步骤S32中,提示装置根据所述第一比对结果判断所述短文本信息是否能够作为所述短文本前缀的提示项。具体的,提示装置根据以下规则来判断判断短文本信息是否能够作为所述短文本前缀的提示项1)若第一比对结果属于前述A)类第一比对结果,则提示装置判定将短文本信息作为所述短文本前缀的提示项;2)若第一比对结果属于前述Bi)类第一比对结果,则提示装置判定将短文本信息作为短文本前缀的提示项;若第一比对结果属于前述B2)类第一比对结果,则提示装置判定不将短文本信息作为短文本前缀的提示项;3)若第一比对结果属于前述Cl)或C2)类第一比对结果,则提示装置判定将短文本信息作为短文本前缀的提示项;若第一比对结果属于前述C3)类第一比对结果,则提示装置判定不将短文本信息作为短文本前缀的提示项。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述第一比对结果判断所述短文本信息是否能够作为所述短文本前缀的提示项的实现方式,均应包含在本发明的范围内。接着,在步骤S33中,当提示装置判断所述短文本信息能够作为所述短文本前缀的提示项时,根据所述第一比对结果获得第二比对结果。具体的,提示装置根据通过以下任一规则,来根据所述第一比对结果获得第二比对结果1)若第一比对结果属于前述Al)类第一比对结果,则提示装置根据第一比对结果来获取第二比对结果的方式包括但不限于al)若短文本信息类别为全拼,且提示装置能够获得短文本信息相对提示信息的跳变项,则第二比对结果包括所述跳变项;其中,所述跳变项表示在与短文本信息类别相同且权重值小于短文本信息权重值的提示项中,权重值最大的提示项;a》若短文本信息类别为全拼,且提示装置未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括短文本信息权重值小于所有提示项权重值的信息;a3) 若短文本信息类别为非全拼,则第二比对结果包括短文本信息类别为非全拼,且提示信息中所有提示项类别为全拼的信息。若第一比对结果属于前述A2)类第一比对结果,则提示装置根据第一比对结果来获取第二比对结果的方式包括但不限于a4)若短文本信息类别为非全拼,且提示装置能够获得短文本信息相对提示信息的跳变项,则第二比对结果包括所述跳变项;a5)若短文本信息类别为非全拼,且提示装置未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括短文本信息权重值小于所有提示项权重值的信息;a6)若短文本信息类别为全拼,则第二比对结果包括短文本信息类别为全拼,且提示信息中所有提示项类别为非全拼的信息;若第一比对结果属于前述A3)类第一比对结果,则提示装置根据第一比对结果来获取第二比对结果的方式包括但不限于a7)若短文本信息类别为全拼或非全拼,且提示装置能够获得短文本信息相对提示信息的跳变项,则第二比对结果包括所述跳变项;a8) 若短文本信息类别为全拼,且提示装置未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括短文本信息权重值小于所有全拼类别提示项权重值的信息;a9)若短文本信息类别为非全拼,且提示装置未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括权重值小于所有非全拼类别提示项权重值的信息。2)若第一比对结果属于前述Bi)类第一比对结果,则提示装置根据第一比对结果来获取第二比对结果的方式包括但不限于bl)若短文本信息类别为全拼,提示信息中所有提示项类别为全拼,则第二比对结果包括短文本信息相对提示信息的跳变项;b2)若短文本信息类别为非全拼,提示信息中所有提示项类别为非全拼,则第二比对结果包括短文本信息相对提示信息的跳变项;b3)若短文本信息类别为全拼,提示信息中所有提示项类别为非全拼,则第二比对结果包括短文本信息类别为全拼,且提示信息中所有提示项类别为非全拼的信息;b4)若短文本信息类别为非全拼,提示信息中所有提示项类别为全拼, 则第二比对结果包括短文本信息类别为全拼,且提示信息中所有提示项类别为非全拼的信肩、ο例如,短文本前缀“IX”对应的提示信息及各提示项的权重值为联想,7;流星雨,6;林熙蕾,5;林心如,3;李小龙,2;其中各项均为非全拼提示项,则对于短文本信息“1x570”,其权重值为8,相对于短文本前缀“lx”为全拼类型。根据前述步骤S31和步骤S32可判定短文本信息可以作为短文本前缀“lx”的提示项。由于提示信息中均为非全拼类型提示项,则提示装置根据前述获取方式b3)获得第二比对结果包括短文本信息“1x570”类别为全拼,且短文本前缀“lx” 的提示信息中所有提示项类别为非全拼的信息。3)若第一比对结果属于前述Cl)类第一比对结果,则提示装置根据第一比对结果所获取的第二比对结果包括cl)若短文本类别为全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为全拼类别及第一比对结果所包含的权重值最小项为全拼提示项的信息;c2)若短文本类别为非全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为非全拼类别及第一比对结果所包含的权重值最小项为全拼提示项的信息;例如,对于在步骤S31中所举的短文本前缀“xs”的例子,其提示项中前三项为全拼提示项,后两项为非全拼提示项。并且在步骤S32中判定短文本信息“xsmd”可以作为短文本前缀“xs”的提示项。其中短文本信息“xsmd”相对于短文本前缀“xs”属于全拼类型, 在短文本前缀“xs”的提示信息中,与短文本信息“xsmd”同为全拼类别且权重值小于短文本信息“xsmd”的提示项为“xs8”和“χ世界”,其中权重值最大的一项为提示项“xs8”,其权重为8,即获得短文本信息相对于提示信息的跳变项为第二提示项“xs8”,则第二比对结果包括第二提示项“xs8”、第二提示项为全拼类别,及权重值最小项为全拼提示项的信息。4)若第一比对结果属于前述C2)类第一比对结果,则提示装置根据第一比对结果所获取的第二比对结果包括c3)若短文本类别为全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为全拼及第一比对结果所包含的权重值最小项为非全拼提示项的信息;c4)若短文本类别为非全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为非全拼及第一比对结果所包含的权重值最小项为非全拼提示项的信息。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断所述短文本信息能够作为所述短文本前缀的提示项时,根据所述第一比对结果获得第二比对结果的实现方式,例如,将所述跳变项更改为表示在与短文本信息类别相同且权重值大于短文本信息权重值的提示项中,权重值最小的提示项并相应更改其他处理方式;或者,在所有情况下,均将短文本信息类别及提示项类别包含在第二比对结果中等,均应包含在本发明的范围内。接着,在步骤S34中,提示装置根据所述第二比对结果,将该短文本信息作为新提示项加入所述提示信息中,并根据所述第二比对结果来调整所述提示信息中各个提示项的排序。具体的,提示装置根据如下规则将短文本信息作为新提示项加入到提示信息,并相应调整其他提示项I)当获得前述al)、a4)或a7)类第二比对结果时,提示装置将短文本信息作为新提示项,插入到第二比对结果所包含提示项的位置,并将该位置的提示项及后续提示项相应后移一位;II)当获得前述a2)、a3)、a5)或a9)类第二比对结果时,提示装置将短文本信息作为新提示项,插入提示信息最后一位;例如,对于短文本前缀“xel”,其提示信息最大项为5,其对应的提示信息及各提示项的权重值为xeltek, 10 ;xeloda,8;xelos,7;xelove,5。对于短文本信息“邪恶力量第六季,其第二比对结果包括短文本信息类别为非全拼,且提示信息中所有提示项类别为全拼的信息,亦即如a3)所述情况,则根据规则II),提示装置将短文本信息“邪恶力量第六季”作为新提示项,插入到提示信息的最后一位。则短文本前缀“xel”的提示信息变为xeltek、xeloda、xelos、xelove、邪恶力量第六季。III)当获得前述a6)类第二比对结果时,提示装置将短文本信息作为新提示项, 插入到提示信息中第一项提示项的位置,并将所有提示项的位置后移一位。IV)当获得前述a8)类第二比对结果时,提示装置将短文本信息作为新提示项,插入到提示信息中第一项非全拼提示项的位置,并将所有非全拼提示项的位置后移一位。V)当获得前述bl)或b2)类第二比对结果时,提示装置将短文本信息作为新提示项,插入至第二比对结果所包含的跳变项的位置,并将该跳变项项及其后续提示项相应后移一位,并删除原提示信息中的最后一项提示项;VI)当获得前述b3)类第二比对结果时,提示装置将短文本信息作为新提示项,插入到提示信息中第一提示项的位置,并将所有提示项的位置后移一位,并删除原提示信息中最后一项提示项;VII)当获得前述b4)类第二比对结果时,提示装置将短文本信息作为新提示项, 替换原提示信息中的最后一项提示项;VI)当获得前述cl)、c3)或c4)类第二比对结果时,提示装置将短文本信息作为新提示项,插入至第二比对结果所包含的跳变项项的位置,并将该跳变项项及其后续提示项相应后移一位,并删除原提示信息中的最后一项提示项;例如,对于短文本前缀“xs”,其对应的提示信息及各提示项的权重值为xswos, 10 ;xs8,8;χ 世界,7;许嵩,5;小说,4;其中,前三项为全拼提示项,后两项为非全拼提示项。对于短文本信息“xsmd”,其权重值为9,与短文本前缀“xs”对应的预定拼音类别为全拼。根据前述步骤判断可知其属于cl)所述情况,其第二比对结果所对应的提示项为提示信息第二项。则根据规则VI),将短文本信息作为新提示项,插入至第二比对结果所对应的提示项的位置,即第二项的位置, 删除原提示信息中的最后一项提示项“小说”,并将第二项提示项“xs8”及其后续提示项“χ 世界”、“许嵩”、“小说”都相应后移一位,最后获得短文本前缀“xs”的提示信息为XSW0S、 xsmd λ xs8、χ世界、许嵩。VII)当获得前述d)类第二比对结果时,提示装置删除最后一项全拼提示项,并将所有与第二比对结果包含的跳变项之前的非全拼提示项位置上移一位后,将短文本信息作为新提示项插入至第二比对结果所对应的提示项的前一项位置。例如,对于前述短文本前缀“xs”,其对应的提示信息及各提示项的权重值为xswos, 10 ;xs8,8;χ 世界,5;许嵩,8;小说,6;
若对于短文本信息“销售”,权重值为7,根据所述步骤S31、步骤S32和步骤S33判断可知属于c2)所述情形,并且根据前述步骤可以得到跳变项为第五项“小说”。则根据规则VII),去除最后一项全拼提示项“χ世界”,将所有与第二比对结果对应的提示项之前的非全拼提示项位置上移一位,亦即将“小说”之前的非全拼提示项“许嵩”上移一位,并将短文本信息“销售”作为新提示项,加入到第二比对结果所对应的提示项的前一项位置,即提示信息的第四项中。最后获得调整后的短文本前缀“xs”的提示信息为XSW0S、XS8、许嵩、 销售、小说。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述第二比对结果及短文本信息的预定拼音类别来调整提示信息中的提示项的排序的实现方式,例如,当提示项已达到最大数量并且需要插入新的提示项时,将被删除的提示项任意设定为全拼或非全拼中权重值最小的一项;或者,若非全拼结果排序均高于全拼结果时,相应更改本实施所述的方法等,均应包含在本发明的范围内。需要进一步说明的是,所述第一比对结果及第二比对结果所包含的内容及在步骤 S32及步骤S34中,根据第一比对结果及第二比对结果来进行相应处理的方式并不以上述举例为限。例如,在步骤S31中,提示装置获取短文本信息与所有提示项的比对结果作为第一比对结果。接着,在步骤S32中,提示装置根据第一比对结果来获得其所需的第一判断信息,并根据该第一判断信息来判断短文本信息是否能够作为短文本前缀的提示项,其中,该第一判断信息可包括提示项个数、各提示项类别及其对应的权重值等,提示装置具体根据该等判断信息来判断短文本信息是否能够作为短文本前缀的提示项的方式已在前述内容中予以详述,并以引用的方式包含于此,不再赘述。接着,在步骤S33中,提示装置直接将第一比对结果作为第二比对结果。最后,在步骤S34中,提示装置根据第二比对结果来获得其所需的第二判断信息,以根据该第二判断信息来将该短文本信息作为新提示项加入所述提示信息中,并根据所述第二比对结果来调整所述提示信息中各个提示项的排序,其中,第二判断信息可包括短文本信息类别、短文本信息对于提示信息的跳变项等。根据本实施例的方法,通过重复步骤S31至S34,即能快速遍历由一个短文本信息所得的所有短文本前缀,当该短文本信息处理完毕后,即能释放用于处理该短文本信息所需的空间。因此,根据本实施例的方法通过少量的比较判断步骤即能获得所需结果,能够快速遍历大量的短文本信息来获取各短文本前缀及其对应的提示信息;并且,由于处理完一个短文本信息所对应的所有短文本前缀后,即可释放用于处理该短文本信息所需的空间, 而处理该短文本信息时所需的空间极小,因此,根据本实施例的方法消耗资源极少。图3为本发明再一个优选实施例的基于短文本前缀来确定提示信息的方法流程图。根据本实施例的方法包括步骤S11’、步骤S6和步骤S7。其中,所述步骤Sl还进一步包括步骤S13和步骤S14 ;所述步骤S3还进一步包括步骤S35和步骤S36。在步骤SIT中,提示装置获取所述短文本信息。接着,在步骤S6中,提示装置分析所述短文本信息,以获得短文本信息对应的各预定拼音类别的短文本前缀。具体的,提示装置对获得的短文本信息进行分析,并以全拼或非全拼的方式提取短文本信息对应的所有字符串,以作为所述短文本信息所对应的短文本前缀,并根据所述提取方式来是否是短文本信息的全拼,来确定短文本信息在对应的短文本前缀下的预定拼音类别。在步骤S7中,提示装置根据所述短文本信息及所获得的所述各预定拼音类别的短文本前缀来建立或更新对应关系库;其中,所述对应关系库中包括多个短文本前缀、该多个短文本前缀分别对应的短文本信息及具有对应关系的短文本前缀与短文本信息对应的预定拼音类别。具体的,当所述对应关系库未建立时,提示装置根据所述短文本信息及所获得的所述各预定拼音类别的短文本前缀来建立对应关系库。当所述对应关系库已建立时,提示装置在获取短文本信息及其对应的所有短文本前缀后,在对应关系库中查询所述短文本信息是否已包含在其对应的短文本前缀下,若所述短文本信息未包含在其对应的短文本前缀下,则将短文本信息及该短文本信息与短文本前缀相对应的预定拼音类别添加至该短文本前缀所对应的短文本信息中。提示装置还将该短文本信息与短文本前缀相对应的权重值添加至与该短文本前缀相关的信息中。例如,对于短文本信息“赶集网”,与其对应的短文本前缀包括“g”、“ga”、“gan”、
u· yy u‘ ‘ yy u‘ ‘ yy uyy u‘ ‘ yy u‘ ‘yy u‘ ‘,? u ‘ yy u ‘ ,?
ganj 、 ganji 、 ganji 、 ganjiw 、 ganjiwa 、 ganjiwan 、 ganjiwang 、 gj 、 gjw , 提示装置在对应关系库中查找前述短文本前缀,并获得短文本前缀“ganjiwang”和“gj”, 而其余短文本前缀不存在对应关系库中。“ ganj iwang”和“ gj ”在对应关系库中与短文本信息的对应关系为“ganjiwang” 赶集网,10,全拼;“gj”gjw,9,全拼;赶集,6,非全拼;提示装置分析得到短文本信息“赶集网”与短文本前缀“ganjiwang”的对应关系已经存在,因此则对短文本前缀“ganjiwang”进行操作;提示装置分析得到短文本信息“赶集网”未存在于短文本前缀“gj”对应的短文本信息中,且提示装置获得短文本信息“赶集网”相对于短文本前缀“gj,,的拼音类别为非全拼,且其相对于短文本前缀“gj”的权重值为7,则提示装置将短文本信息及其预定拼音类别添加至与短文本前缀“gj”的对应关系中,短文本前缀“gj”的对应关系更新为“gj”gjw,9,全拼;赶集网,7,非全拼;赶集,6,非全拼。对于尚未在对应关系库中建立的短文本前缀“g”、“ga”、“gan”、“ganj”、“ganji”、 “ganji”、“ganjiW”、“ganjiWa”、“ganjiWan”及“gjw”,提示装置将上述短文本前缀及该等短文本前缀与短文本信息“赶集网”的对应关系添加至对应关系库中。以短文本前缀“gjw”为例,提示装置获得短文本信息“赶集网”相对于短文本前缀 "gjw"的拼音类别为非全拼,且其相对于短文本前缀“gjw”的权重值为9,则将该短文本前缀和该短文本信息及其预定拼音类别添加至对应关系库中,则对应关系库中增加了短文本前缀“gjw”的对应关系,其当前的对应关系为“gjw”赶集网,9,非全拼。建立对应关系库后,当提示装置需要建立或更新提示信息时,提示装置执行步骤 S13。在步骤S13中,提示装置获取一个短文本前缀。其中,获取短文本前缀的方式包括但不限于
1)实时获取用户输入的输入序列,并将该实时获取的输入序列作为短文本前缀;2)获取预存储的短文本前缀。接着,在步骤S14中,提示装置根据所述短文本前缀,由所述对应关系库中获取与所述短文本前缀对应的一个或多个短文本信息及所述短文本前缀与分别所述一个或多个短文本信息相对应的预定拼音类别及权重值。具体的,提示装置根据获得的短文本前缀,在对应关系库中查询获得该短文本前缀,以及与所述短文本前缀对应短文本信息,以及该等短文本信息与所述短文本前缀对应的预定拼音类别及权重值。接着,步骤S2已在参照图1所示的实施例中予以详述,并以引用的方式包含于此, 不再赘述。接着,在步骤S35中,提示装置根据所述多个短文本信息对应的权重值及预定拼音类别,来确定所述多个短文本信息相对于所述短文本前缀的排序结果。具体的,提示装置根据全拼短文本信息在前,非全拼短文本信息在后,并对全拼及非全拼短文本信息,分别按照权重值有高至低进行排序的方式,来获得与短文本前缀对应的短文本信息的排序结果。例如,提示装置所获取的短文本前缀“gj”所对应的短文本信息及其权重值和相应的预定拼音类别为根据,3,非全拼;赶集网,4. 5,非全拼;赶集,6,非全拼;gjw,8,全拼;国家,6. 5,非全拼;感觉,2,非全拼;则提示装置根据全拼短文本信息在前,非全拼短文本信息在后,并对全拼及非全拼短文本信息,分别按照权重值有高至低进行排序的方式进行排序后,获得上述多个短文本信息相对于短文本前缀“gj”的排序结果为gjw,8,全拼;国家,6. 5,非全拼;赶集,6,非全拼;赶集网,4. 5,非全拼;根据,3,非全拼;感觉,2,非全拼。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述多个短文本信息对应的权重值及预定拼音类别,来确定所述多个短文本信息相对于所述短文本前缀的排序结果的实现方式,均应包含在本发明的范围内。在步骤S36中,提示装置根据所述提示信息中提示项的最大数量及所述排序结果,由所述多个短文本信息中选择相应的多个排序的提示项。其中,所述提示信息中提示项的最大数量可由本领域技术人员应可根据实际情况和需求来选择并设定。
具体的,提示装置预设提示信息所包含的提示项的最大数量为N。则提示装置由短文本前缀所对应的已经排序完成的多个短文本信息中选择排名前N位的短文本信息作为短文本前缀的提示项。例如,提示装置预设提示信息的提示项的最大数量为4,对于前述短文本前缀 “gj”,其相应的短文本排序结果为gjw,8,全拼;国家,6. 5,非全拼;赶集,6,非全拼;赶集网,4. 5,非全拼;根据,3,非全拼;感觉,2,非全拼。提示装置从该排序结果中选择排序为前四位的短文本信息作为短文本前缀“gj” 的提示项,来构成其提示信息。即短文本前缀“gj”的提示信息包括gjw、国家、赶集、赶集网。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于根据所述提示信息中提示项的最大数量及所述排序结果,由所述多个短文本信息中选择相应的多个排序的提示项的实现方式,均应包含在本发明的范围内。根据本实施例的方法,其通用性较强,易于进行系统维护。图4示意出了本发明一个方面的基于短文本前缀来确定提示信息的提示装置的结构示意图。根据本实施例的提示装置包括第一获取装置1、权重确定装置2和第一更新装置3。第一获取装置1获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;其中,所述短文本前缀包括但不限于一个或多个字符组成的字符串,该字符串包括多种用于拼写语言的字符串,例如,中文的拼音字符串、日语的罗马字符串、韩语的拼音字符串等。所述短文本信息包括但不限于1)来自用户的输入序列;2)计算机设备当前需要处理的信息等。所述预定拼音类别包括但不限于1)全拼;2)非全拼等。其中所述全拼、 非全拼,是指对短文本信息解析得到短文本信息对应的拼写字符串后,该拼写字符串相对于短文本前缀的类别。具体地,第一获取装置1可先获得所述短文本前缀,再根据所述短文本前缀来获取预设的与该短文本前缀相应的一个或多个短文本信息及分别与所述一个或多个短文本信息相对应的预定拼音类别;其中,第一获取装置1获取所述短文本前缀的方式包括但不限于1)实时获取用户输入的输入序列,并将该实时获取的输入序列作为短文本前缀;2)获取预存储的短文本前缀。或者,第一获取装置1先获得所述短文本信息,再对该短文本信息进行分析,由该短文本信息推得与该短文本信息相对应的短文本前缀及与所述短文本信息相对应的预定拼音类别。
其中,第一获取装置1获取所述短文本信息的方式包括但不限于1)获取来自用户的输入序列,并将该输入序列作为短文本信息;2)获取预存储的短文本信息。权重确定装置2基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述一个或多个短文本信息相对应的权重值。具体地,第一预定规则中包括对根据短文本信息的预定拼音类别来对短文本信息采用不同权重确定方式的权重确定规则,权重确定装置2该权重确定规则来获得短文本信息的权重值。其中,该权重确定规则包括以下任一规则1)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则将该短文本信息的初始权重值来作为权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则对该短文本信息的初始权重值进行降权处理,以获得所述权重值;2)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则对该短文本信息的初始权重值进行升权处理,以获得所述权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则将该短文本信息的初始权重值作为权重值;3)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则对该短文本信息的初始权重值进行升权处理,以获得所述权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则对该短文本信息的初始权重值进行降权处理,以获得所述权重值。其中,所述预设的初始权重值可以参考多项因素确定,例如,短文本信息的点击率,短文本信息被搜索的频次,短文本信息所对应的搜索结果的质量,预设的短文本信息初始权重值等。本领域技术人员应该理解,确定所述初始权重值的因素不以上述举例。需要说明的是,本领域技术人员应该理解,本发明所述的权重确定规则不以上述举例为限,事实上,只要是根据预定拼音类别,分别对短文本信息进行处理,以使非全拼类别的短文本信息对应的权重值相对全拼类别的短文本信息对应的权重值具有一定的降权幅度的方案,均应包含在本发明的范围内。其中,该权重确定规则参考以下至少一项因素来对所述初始权重值进行升权或降权处理1)所述短文本前缀的长度;具体地,对于升权处理,当短文本前缀的长度越长,其对应的短文本信息升权幅度越大,当短文本前缀的长度越短,其对应的短文本信息升权幅度越小;对于降权处理,当短文本前缀的长度越长,其对应的短文本信息降权幅度越大,当短文本前缀的长度越短,其对应的短文本信息降权幅度越小。2)所述短文本前缀所包含的元音个数;具体地,对于升权处理,当短文本前缀所包含的元音个数越多,其对应的短文本信息升权幅度越大,当短文本前缀所包含的元音个数越少,其对应的短文本信息升权幅度越小;对于降权处理,当短文本前缀所包含的元音个数越少,其对应的短文本信息降权幅度越小,当短文本前缀所包含的元音个数越多,其对应的短文本信息降权幅度越大。其中,所述元音包括但与不限于i)中文拼音中的单元音及组合元音字母,例如, a、e、i、o、u、ii、ai、ei、ui、ao、ou、iu、an、en、in 等;ii)日语罗马音中的元音字母,例如,a、
25i、U、e、ο等;iii)韩语中的単元音(或称基本母音)和复合元音(或称双母音)字母等。 其中,組合元音或复合元音等在统计元音个数时可被统计为ー个或多个元音。需要说明的是,权重确定装置2同样可根据短文本前缀包含的辅音个数来确定升权或降权幅度,特別是对于ー些辅音个数少于元音个数的语言,采用辅音个数作为判断标准更能节省资源。但根据辅音个数来判断升权或降权的规则与根据元音个数来判断升权或降权的规则相反,即对于升权处理,当短文本前缀所包含的辅音个数越少,其对应的短文本信息升权幅度越大,当短文本前缀所包含的辅音个数越多,其对应的短文本信息升权幅度越小;对于降权处理,当短文本前缀所包含的辅音个数越多,其对应的短文本信息降权幅度越小,当短文本前缀所包含的辅音个数越少,其对应的短文本信息降权幅度越大。3)与该短文本前缀相对应的所述短文本信息的长度;具体地,对于升权处理,当短文本信息的长度越长,其升权幅度越小,当短文本信息的长度越短,其升权幅度越大;对于降权处理,当短文本信息的长度越长,其降权幅度越大,当短文本信息的长度越短,其降权幅度越小。其中,权重确定装置2根据所述权重确定规则来对初始权重进行升权或降权处理以确定所述权重值的方式包括但不限于1)直接根据短文本信息的预定拼音类别,參考上述三项因素中的任意一项或多项,来调节预设的所述短文本信息的初始权重值,以确定其在所对应的短文本前缀下的权
重值;例如,若预设短文本信息的初始权重值由短文本信息的被搜索频次/1000来得到,权重调节规则包括对于非全拼类型的短文本信息,在其初始权重值的基础上,减去根据短文本信息长度对应的值,以获得短文本信息的权重值;对于全拼类型的短文本信息,直接将其初始权重作为权重值的规贝IJ。对于短文本信息“wytsese”、“wymtf”、“wywz”、“五月天”、 “网易”、“网游”、“武艺”,提示装置所获得的该等短文本信息相应的搜索频次为Wytsese,9500 ;网易,8900;Wymtf,8950;五月天,10600;武艺,7400。权重确定装置2根据该等短文本信息被捜索的频次,获得该等短文本信息各自的初始权重值,以及该等短文本信息相对应短文本前缀“wy”的预定拼音类型为Wytsese,9. 5,全拼;网易,8. 9,非全拼;Wymtf,8. 95,全拼;五月天,10. 6,非全拼;武艺,7. 4,非全拼。其中,非全拼类别的短文本信息“五月天”、“网易”、“武艺”对应的短文本信息的长度对应的值分别为3、2、2,则权重确定装置2根据权重调节规则,将非全拼类别的短文本信息对应的初始权重值减去其短文本信息长度对应的值后,获得的短文本信息的权重值及其类别如下
Wytsese,9. 5,全拼;网易,6. 9,非全拼;Wymtf,8. 95,全拼;五月天,7. 6,非全拼;武艺,5. 4,非全拼。又例如,权重调节规则包括对于非全拼类型的短文本信息,根据短文本前缀的长度、该短文本前缀包含的元音个数及短文本信息的长度,分别确定三个单项权重值,并将各单项权重值与所述初始权重值相加,以获得权重值;对于全拼类型的短文本信息,直接将其初始权重作为权重值的规则。其中,所述单项权重值可通过以下任一方式来确定i)直接将短文本前缀的长度、短文本前缀包含的元音个数或短文本信息的长度对应的值作为单项权重值;ii)对短文本前缀的长度、短文本前缀包含的元音个数或短文本信息的长度对应的值进行一定处理,例如,进行倒数或与其他预定參数进行预定的加减乘除或根据预定公式进行运算后,获得单项权重值;iii)通过判断短文本前缀的长度、短文本前缀包含的元音个数或短文本信息的长度对应的值所属的预定阈值范围,并获取所属预定阈值范围对应的单项权重值。则对于短文本前缀“wy”,权重确定装置2所获得的ー个短文本信息及其对应的初始权重值和预定拼音类别分别为网易,8. 9,非全拼。且权重确定装置2根据前述单项权重值确定方式中的任一项获得的短文本前缀的长度、短文本前缀包含的元音个数及短文本信息长度所获得的单项权重值分别为-0. 5,-3,-0. 2,则根据8. 9-0. 5-3-0. 2所得的与短文本前缀“wy”及短文本信息“网易”对应的权重值为5. 2。2)权重确定装置2根据上述三项因素中至少ー项来获得短文本信息的权重调节值,再根据权重调节值及初始权重值来获得短文本信息在其对应的短文本前缀下的权重值,该方式将在后续内容中予以详述,在此不再赘述。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述权重确定规则来对初始权重进行升权或降权处理以确定所述权重值的实现方式,例如,根据短文本前缀长度及辅音个数来获得辅音站短文本前缀长度的比例,再根据该比例来确定权重值的方式等,均应包含在本发明的范围内。第一更新装置3根据所述权重值及所述预定拼音类别,来基于所述ー个或多个短文本信息建立或更新所述短文本前缀对应的提示信息,所述提示信息包括一个或多个排序的提示项。其中,本领域技术人员应可根据实际情况和需求来选择并设定提示信息中所包含的提示项的最大数量。具体的,当某一短文本前缀的提示信息未建立吋,将与该短文本前缀对应的ー个或多个短文本信息根据对应的权重值大小及预定拼音类别进行排序后,第一更新装置3将所述ー个或多个短文本信息作为提示项来建立所述短文本前缀的提示信息。或者,当某一短文本前缀已包含提示信息吋,第一更新装置3将短文本信息对应权重值与提示信息中的提示项对应的权重值进行比对,如果比对结果显示短文本信息优于已有提示项,则将短文本信息作为新的提示项插入到提示信息中,并对提示信息中其余的提示项做相应调整,否则提示信息不变。例如,提示装置预设提示信息中提示项的最大数量为5,其中,对于短文本前缀 "jjw",尚无与其对应的提示信息,而所获得的与所述短文本前缀“jjw”对应的短文本信息及所述短文本信息相对于所述短文本前缀的权重值和预定拼音类别为jjwxc,9,全拼;贾静雯,6. 5,非全拼;jjww,7,全拼;jjwx,8. 5,全拼;佳吉物流,3,非全拼;j jwxchousenetcom, 2. 5,全拼。将上述短文本信息排序后,第一更新装置3选择前5项作为所述短文本前缀“ jjw" 的提示信息,则获得短文本前缀“jjw”的提示信息为jjwxc、jjwx, jjww、贾静雯、佳吉物流。又例如,当短文本前缀“jjw”已获得上述提示信息后,又获得与其对应的短文本信息“基金网”,该短文本信息“基金网”相对于短文本前缀“jjw”的权重值为5,相对于短文本前缀的预定拼音类别为非全拼。则第一更新装置3判断其权重值高于非全拼类别的短文本信息“佳吉物流”,第一更新装置3根据权重值排序,将短文本信息“基金网”作为新提示项插入到短文本前缀“jjw”的提示信息中,且将原来位置的提示项依次下移调整,去除多余的提示项后,获得短文本前缀“jjw”新的提示信息为jjwxc、jjwx、jjww、贾静雯、基金网。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述权重值及所述预定拼音类別,来基于所述ー个或多个短文本信息建立或更新所述短文本前缀对应的提示信息的实现方式,均应包含在本发明的范围内。需要进ー步说明的是,尽管上述举例均以中文进行说明,但根据本发明的方案同样可适用于日语、韩语等具有拼音标注的语言。例如,对于日语而言,短文本前缀“kis”可对应类别为全拼的短文本信息“kiss”,亦可对应类别为简拼的短文本信息“警察”(片假名为けいさつ,罗马音为keisatu),并且,本领域技术人员应可同样可根据本发明的方案来获得短文本前缀“kis”的提示信息。作为本发明的优选方案之一,其中,所述权重确定装置2还包括权重调节装置(图未示)和第一子确定装置(图未示)。权重调节装置基于第一预定规则,根据所述预定拼音类别,来确定所述短文本信息的权重调节值;其中,所述权重调节值根据短文本信息的预定拼音类型及在前述权重确定装置2中所述的与升权及降权处理相关的三项因素确定。具体地,权重调节装置根据所述预定拼音类别,由所述第一预定规则中选择适用于与该短文本前缀对应的短文本信息的权重调节值确定规则。其中,权重调节装置通过以下规则,来确定与该短文本前缀及短文本信息对应的权重调节值1)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则权重调节装置确定权重调节值为预定透明权重值,该预定透明权重值使得权重确定装置2完成操作后, 所得的权重值与初始权重值相同;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则确定权重调节值为惩罚权重值,并根据所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中至少ー项来确定该惩罚权重值,该惩罚权重值使得权重确定装置2完成操作后,所得的权重值小于初始权重值;2)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则权重调节装置确定权重调节值为奖励权重值,并根据所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中至少ー项来确定该奖励权重值,该奖励权重值使得权重确定装置2完成操作后,所得的权重值大于初始权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则权重调节装置确定权重调节值为预定透明权重值;3)若该短文本信息与该短文本前缀对应的预定拼音类别为全拼,则权重调节装置确定权重调节值为奖励权重值;若该短文本信息与该短文本前缀对应的预定拼音类别为非全拼,则权重调节装置确定权重调节值为惩罚权重值。其中,权重调节装置确定所述奖励权重值及惩罚权重值的方式包括但不限于1)根据所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中至少ー项对应的单项权重值获得。具体地,权重调节装置可直接将某ー项单项权重值直接作为奖励或惩罚权重值, 或者,权重调节装置获得多项单项权重值,并对该多项单项权重值进行相应处理,例如,将该多项权重值分别乘以预定系数后相加,或者将该多项权重值相乗,或者以其他预定方式进行处理等,以获得所述奖励权重值或惩罚权重值。其中,所述单项权重值的获取方式已在前述内容中予以详述,在此不再赘述。2)获得所述短文本前缀、该短文本前缀包含的元音个数及与该短文本前缀对应的短文本信息长度中任一项对应的单项权重值,然后再根据其他任一项或其他两项来对该单项权重值进行调整。例如,提示装置根据短文本前缀获得的单项权重值为8. 5,并获得该短文本前缀对应的该短文本信息长度为3,若预设权重调节值确定规则中包括当短文本信息长度在2-4之间时,将已获得的权重值下调0. 5的规则,则权重调节装置根据该规则,将短文本前缀对应单项权重值下调0. 5,获得短文本信息的权重值为8。本领域技术人员应该理解,确定所述奖励权重值及惩罚权重值的方式不以上述举例。需要说明的是,本领域技术人员应该理解,本发明所述的权重确定规则不以上述举例为限,事实上,只要是根据所述预定拼音类別,来确定所述短文本信息的权重调节值的实现方式,均应包含在本发明的范围内。第一子确定装置根据所述权重调节值及预设的所述短文本信息的初始权重值,来确定所述权重值。具体的,第一子确定装置通过对初始权重值及权重调节值进行相应处理,以获得所述权重值。其中所述相应处理包括但不限于乘、除、加、减及其他形式的函数运算等。并且在前述相应处理中还可进一步结合预定參数等。例如,第一获取装置1获取到短文本信息“新浪”,其对应的短文本前缀“XI”及与该两者对应的预定拼音类别为非全拼,则权重调节装置判断短文本信息“新浪”与短文本前缀“xl”对应的权重调节值为惩罚权重值,并且,权重调节值确定规则中预设惩罚权重值即为与短文本信息对应的短文本前缀长度的值,提示装置分析得到短文本前缀“xl”的长度为2,则根据权重调节值确定规则,获得惩罚权重值为2 ;第一子确定装置获得短文本信息“新浪”预设的初始权重值为12,并且,第一子确定装置根据公式权重值=初始权重值-权重调节值,获得短文本信息“新浪”的权重值为10。又例如,第一获取装置1获取到短文本信息“新浪”,其对应的短文本前缀 “xinlang”及与该两者对应的预定拼音类别为全拼;则权重调节装置判断短文本信息“新浪”与短文本前缀“xinlang”对应的权重调节值为奖励权重值,并且,权重调节值确定规则中预设奖励调节值=短文本元音个数*5,提示装置分析得到短文本前缀“xinlang”包含两个元音“ in”和“ang”,则权重调节装置获得短文本信息“新浪”对应的权重调节值为10 ;第一子确定装置获得短文本信息“新浪”的初始权重值为9,并且,第一子确定装置根据公式 权重值=0. 5*权重调节值+初始权重值,获得短文本信息“新浪”的权重值为14。再例如,第一获取装置1对于获取到短文本信息“新浪”,提示装置根据“新浪”,其对应的短文本前缀“xl”确定及其与该两者对应的预定拼音类别为非全拼,则权重调节装置判断短文本信息“新浪”与短文本前缀“xl ”对应的权重调节值为惩罚权重值,并且,权重调节值确定规则中预设惩罚权重值为短文本前缀长度、短文本前缀包含的元音个数及短文本信息长度对应的单项权重值的平均值倒数,其中,权重调节规则包括直接将短文本前缀长度对应的值的倒数作为其对应的单项权重值,当短文本前缀包含的元音个数为零吋,其预设的单项权重值为10,及将短文本信息长度对应的值乘以1. 5以作为短文本信息对应的单项权重值的规则,则权重调节装置根据权重调节规则,分别获得短文本前缀长度、短文本前缀包含的个数及短文本信息长度对应的单项权重值为0. 5、10及3,并根据单项权重值获得惩罚权重值为1バ0. 5+10+3) = 0. 074 ;第一子确定装置获得短文本信息“新浪”的初始权重值为9,并且,第一子确定装置根据公式权重值=权重调节值*初始权重值,获得短文本信息“新浪”的权重值为0. 667。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于第一预定规则,根据所述预定拼音类别,来确定所述短文本信息的权重调节值,并根据所述权重调节值及预设的所述短文本信息的初始权重值,来确定所述权重值的实现方式,均应包含在本发明的范围内。作为本发明的优选方案之一,其中,本发明还包括第二判断装置(图未示)和第二更新装置(图未示)。第二判断装置判断所述短文本信息是否与所述提示信息所包含的任一提示项等同;其中所述等同包括但不限于1)完全相同;2)词义相同或相似;3)实际自然语言表意相同或相似等。其中,词义是否相同或相似通过词义分析来进行判断,实际自然语言是否相同或相似通过预设的同义词典来进行判断。例如,对于短文本信息“ llOsh”和“ 110上海”, 根据预设的同义词典判断sh与上海相同,故而判断两者等同。当第二判断装置判断得到所述短文本信息与所述任ー提示项等同吋,第二更新装置根据该短文本信息与该提示项与所述短文本前缀对应的预定拼音类别,来基于该短文本信息更新所述提示信息。具体的,对于某一短文本前缀,第二判断装置判定一短文本信息与该短文本前缀的提示信息中的某一提示项等同,若所述短文本信息相对该短文本前缀为全拼,而所述提示项相对所述短文本前缀的预定拼音类别为非全拼,则第二更新装置将所述短文本信息作为新提示项替换所述提示项,并根据短文本信息的权重值,将新提示项插入到提示信息的相应位置,并对其余提示项做相应调整,例如,删除权重值最小的一项,并将权重值小于新提示项的其他提示项向下移动一位等;若所述短文本信息相对该短文本前缀的预定拼音为非全拼,而所述提示项相对所述短文本前缀的预定拼音类别为全拼,则第二更新装置不进行调整。例如,对于短文本前缀“la”,其提示项及相应的提示项权重值为来年,8;恋爱,5.5;来啊,4;娄安,3;对于短文本信息“来”,其权重值为6,第二判断装置通过等同判断,判定“来”与 “来啊”相等同,而短文本信息“来”相对于短文本前缀“la”的预定拼音类型为全拼,而短文本信息“来啊”相对于短文本前缀“la”的预定拼音类别为非全拼,则第二更新装置将“来” 作为短文本前缀“ la”的新提示项,替换“来啊”,将“来”按照其权重值和预定拼音类别插入到提示信息中,并对其余提示项依次做相应的调整,获得短文本前缀“la”的提示项为来年,7;来,6;恋爱,5.5;娄安,3。其中,前述权重确定装置可在第二更新装置之后执行,即当第二判断装置判断得到所述短文本信息未与所述任ー提示项等同,第二更新装置不执行相关操作,则权重确定装置基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述 ー个或多个短文本信息相对应的权重值。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断得到所述短文本信息与所述任ー提示项等同吋, 则根据该短文本信息与该提示项与所述短文本前缀对应的预定拼音类别,来基于该短文本信息更新所述提示信息的实现方式,均应包含在本发明的范围内。作为本发明的优选方案之一,其中,本发明还包括第二库更新装置(图未示)。第二库更新装置根据所述短文本前缀及所建立或更新的提示信息,来建立或更新提示信息库;具体的,当所述提示信息库中未包含该短文本前缀,则第二库更新装置将该短文本前缀及其相应的提示信息添加至提示信息库中;当所述提示信息库中已包含该短文本前缀,则第二库更新装置根据该短文本前缀对应的提示信息来更新提示信息库中该短文本前缀的提示信息。其中,本发明还包括实时获取装置(图未示)和查询装置(图未示)。实时获取装置实时获取来自用户的输入序列。查询装置将所述输入序列作为ー个短文本前缀在所述提示信息库中进行查询,以获取与该输入序列所对应的提示信息,作为该输入序列的提示信息。例如,实时获取装置实时获取用户输入序列为“xul ”,查询装置将该输入序列作为ー个短文本前缀在提示信息库中查询,获得短文本前缀“xl”的提示信息为“xls”、“Xlmv”、 “序列”、“新浪”,则将此提示信息作为用户输入序列的提示信息,返回给用户。作为本发明的优选方案之一,其中,所述所述第一更新装置还基于第二预定规则, 根据所述权重值及所述预定拼音类别,来基于所述ー个或多个短文本信息建立或更新所述短文本前缀对应的提示信息;其中,所述第二预定规则包括以下规则将全拼的短文本信息排序高于非全拼的短文本信息。具体的,第一更新装置在建立或更新提示信息的过程中,提示装置始终将全拼类型的短文本信息置于非全拼类型的短文本信息之前。根据本发明的方案,通过对不同预定拼音类型的短文本信息执行相应地权重调整策略,既能保留较好的全拼类型的提示项,又能提供减少用户输入操作的简拼类型的提示项,使得所呈现的提示项更符合用户的需求。图5为本发明一个优选实施例的基于短文本前缀来确定提示信息的提示装置的结构示意图。根据本实施例的提示装置包括第一获取装置1、权重确定装置2及第一更新装置3。其中,第一获取装置1进ー步包括第一子获取装置11和第一分析装置12 ;所述第一更新装置3进ー步包括第一比对装置31、第一判断装置32、第二比对装置33及插入装置 34。第一子获取装置11获取所述短文本信息。第一分析装置12分析所述短文本信息,以获得其对应的一个预定拼音类别的短文本前缀。具体的,第一分析装置12对获得的短文本信息进行分析,并以全拼或非全拼的方式提取短文本信息对应的字符串,以作为所述短文本信息所对应的短文本前缀,并根据所述提取方式来是否是短文本信息的全拼,来确定短文本信息在对应的短文本前缀下的预定拼音类別。例如,对于短文本信息“新浪”,第一分析装置12分析得到其全拼字符串为 "xinlang",则其全拼类别的前缀可包括“X”、“Xi”、“Xin”、“Xinl”、“Xinla”、“Xinlan” 及 “xinlang”,提示装置由上述七个短文本前缀中选择ー个以进行后续处理,并确定所选择的短文本前缀与短文本信息“新浪”对应的预定拼音类别为全拼。又例如,对于短文本信息“新浪”,第一分析装置12分析得到其非全拼字符串提取的字符串为“xl”,则其非全拼类别的前缀可包括“χ”及“xl”,提示装置由上述两个个短文本前缀中选择ー个以进行后续处理,并确定所选择的短文本前缀与短文本信息“新浪”对应的预定拼音类别为非全拼。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述短文本信息获得其相应短文本前缀的实现方式,均应包含在本发明的范围内。权重确定装置2已在參照图4所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。第一比对装置31根据提示信息中提示项的最大数量,或根据所述短文本信息对应的权重值与相同及/或不同预定拼音类别的提示项对应的权重值的比对结果,来获得第 ー比对结果。
其中,第一比对装置31通过判断所述提示信息中所包含的提示项数量是否已经达到最大数量,并当提示项数量已经达到预定的最大数量时,进ー步将短文本信息的权重值与提示信息中的预定提示项的权重值进行比对来获得第一比对结果;其中,所述预定提示项包括最后ー项全拼提示项和/或最后ー项非全拼提示项。具体的,根据短文本信息所包含的提示信息的不同,第一比对结果可包括以下任 ー种A)若所述短文本前缀的提示信息中所包含的提示项数量未达到最大数量,则所获得的第一比对结果中包含如下任一信息A1)所有提示项均为全拼类型,且提示项数量未达到最大数量;A》所有提示项均为非全拼类型,且提示项数量未达到最大数量;Α; )提示信息中的提示项包括全拼与非全拼类型,且提示项数量未达到最大数量;例如,预设每个提示信息中可包含5项提示项,对于短文本前缀“xel”,其对应的提示信息为“xeltek”、“Xel0da”、“Xel0S”、“邪恶力量”共四项,即提示信息所包含的提示项数量未达到最大数量,则当获取到与短文本前缀“xel”相关的短文本信息“xelove”吋,第 ー比对装置31根据比对获得的第一比对结果为提示信息中的提示项包括全拼与非全拼类型,且短文本前缀“xel”的提示信息的提示项数量未满。B)若所述短文本前缀的提示信息所包含的提示项数量已达到最大数量,且提示装置判断得到提示信息中的所有提示项均为全拼类型或者均为非全拼类型,则第一比对装置 31将短文本信息权重值与最后ー个提示项权重值进行比较,所获得的第一比对结果中包含如下任一信息B1)短文本信息的权重值大于最后ー个提示项的权重值;或者B2)短文本信息的权重值小于最后ー个提示项的权重值;例如,若前述短文本前缀“xel”对应的提示信息及各提示项的权重值为xeltek, 10 ;xeloda,8;xelos,7 ;xelove,5 ;xelement,4 ;其中各项均为全拼提示项,对于短文本信息“xelod”,其权重值为6. 5,第一比对装置31比较短文本信息“xelod”的权重值与最后ー项提示项“xelement”的权重值,获得的第一比对结果包括短文本信息“xelod”权重值大于最后ー项提示项“xelement”权重值; 又如,对于短文本信息“邪恶力量”,其权重值为3,第一比对装置31比较短文本信息“邪恶力量”的权重值和最后ー项提示项“xelement”的权重值,获得第一比对结果包括短文本信息“邪恶力量”小于最后ー项提示项“xelement”的权重值。C)若所述短文本前缀的提示信息中的提示项已达到最大数量,且提示信息中的提示项包括全拼类型及非全拼类型,则第一比对装置31查找提示信息中最后ー个全拼及非全拼的提示项,并将短文本信息权重值与最后ー个全拼提示项的权重值及最后ー个非全拼提示项权重值的进行比对,则所获得的第一比对结果中包含如下任一信息C1)最后ー个全拼提示项权重值最小;以)最后ー个非全拼提示项权重值最小;Ο)短文本信息权重值最小。例如,对于短文本前缀“xs”,其对应的提示信息及各提示项的权重值为
xswos, 10 ;xs8,8;χ 世界,7;许嵩,5;小说,4;其中,前三项为全拼提示项,后两项为非全拼提示项。对于短文本信息“xsmd”,其权重值为9,第一比对装置31在提示信息中查找并判断最后ー项全拼提示项为“χ世界”,最后ー项非全拼提示项为“小说”,则第一比对装置31将“xsmd”分别与最后一项全拼提示项 “X世界”和最后ー项非全拼提示项“小说”进行比较,获得第一比对结果为最后ー项非全拼提示项的权重值最低。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述提示项的最大数量、短文本信息权重值、短文本信息的预定拼音类别以及提示项信息的权重值与预定拼音类别来获得第一比对结果的实现方式,均应包含在本发明的范围内。接着,第一判断装置32根据所述第一比对结果判断所述短文本信息是否能够作为所述短文本前缀的提示项。具体的,第一判断装置32根据以下规则来判断判断短文本信息是否能够作为所述短文本前缀的提示项1)若第一比对结果属于前述A)类第一比对结果,则第一判断装置32判定将短文本信息作为所述短文本前缀的提示项;2)若第一比对结果属于前述Bi)类第一比对结果,则第一判断装置32判定将短文本信息作为短文本前缀的提示项;若第一比对结果属于前述B2)类第一比对结果,则第一判断装置32判定不将短文本信息作为短文本前缀的提示项;3)若第一比对结果属于前述Cl)或C2)类第一比对结果,则第一判断装置32判定将短文本信息作为短文本前缀的提示项;若第一比对结果属于前述C3)类第一比对結果, 则第一判断装置32判定不将短文本信息作为短文本前缀的提示项。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述第一比对结果判断所述短文本信息是否能够作为所述短文本前缀的提示项的实现方式,均应包含在本发明的范围内。接着,当第一判断装置32判断所述短文本信息能够作为所述短文本前缀的提示项时,第二比对装置33根据所述第一比对结果获得第二比对結果。具体的,第二比对装置33根据通过以下任一规则,来根据所述第一比对结果获得第二比对结果1)若第一比对结果属于前述Al)类第一比对结果,则第二比对装置33根据第一比对结果来获取第二比对结果的方式包括但不限于al)若短文本信息类别为全拼,且第二比对装置33能够获得短文本信息相对提示信息的跳变项,则第二比对结果包括所述跳变项;其中,所述跳变项表示在与短文本信息类别相同且权重值小于短文本信息权重值的提示项中,权重值最大的提示项;ぬ)若短文本信息类别为全拼,且第二比对装置33未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括短文本信息权重值小于所有提示项权重值的信息;a3)若短文本信息类别为非全拼,则第二比对结果包括短文本信息类别为非全拼,且提示信息中所有提示项类别为全拼的信息。若第一比对结果属于前述A2)类第一比对结果,则第二比对装置33根据第一比对结果来获取第二比对结果的方式包括但不限于a4)若短文本信息类别为非全拼,且第 ニ比对装置33能够获得短文本信息相对提示信息的跳变项,则第二比对结果包括所述跳变项若短文本信息类别为非全拼,且第二比对装置33未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括短文本信息权重值小于所有提示项权重值的信息;a6) 若短文本信息类别为全拼,则第二比对结果包括短文本信息类别为全拼,且提示信息中所有提示项类别为非全拼的信息;若第一比对结果属于前述A3)类第一比对結果,则第二比对装置33根据第一比对结果来获取第二比对结果的方式包括但不限于a7)若短文本信息类别为全拼或非全拼, 且第二比对装置33能够获得短文本信息相对提示信息的跳变项,则第二比对结果包括所述跳变项;a8)若短文本信息类别为全拼,且第二比对装置33未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括短文本信息权重值小于所有全拼类别提示项权重值的信息;a9)若短文本信息类别为非全拼,且第二比对装置33未能获得短文本信息相对提示信息的跳变项,则第二比对结果包括权重值小于所有非全拼类别提示项权重值的信息。2)若第一比对结果属于前述Bi)类第一比对结果,则第二比对装置33根据第一比对结果来获取第二比对结果的方式包括但不限于bl)若短文本信息类别为全拼,提示信息中所有提示项类别为全拼,则第二比对结果包括短文本信息相对提示信息的跳变项;b2) 若短文本信息类别为非全拼,提示信息中所有提示项类别为非全拼,则第二比对结果包括短文本信息相对提示信息的跳变项;b3)若短文本信息类别为全拼,提示信息中所有提示项类别为非全拼,则第二比对结果包括短文本信息类别为全拼,且提示信息中所有提示项类别为非全拼的信息;b4)若短文本信息类别为非全拼,提示信息中所有提示项类别为全拼,则第二比对结果包括短文本信息类别为全拼,且提示信息中所有提示项类别为非全拼的信息。例如,短文本前缀“IX”对应的提示信息及各提示项的权重值为联想,7;流星雨,6;林熙蕾,5;林心如,3;李小龙,2;其中各项均为非全拼提示项,则对于短文本信息“ 1x570”,其权重值为8,相对于短文本前缀“lx”为全拼类型。根据前述第一比对装置31和第一判断装置32所得结果可判定短文本信息可以作为短文本前缀“lx”的提示项。由于提示信息中均为非全拼类型提示项,则第二比对装置33根据前述获取方式b3)获得第二比对结果包括短文本信息“ 1x570” 类别为全拼,且短文本前缀“lx”的提示信息中所有提示项类别为非全拼的信息。3)若第一比对结果属于前述Cl)类第一比对结果,则第二比对装置33根据第一比对结果所获取的第二比对结果包括cl)若短文本类别为全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为全拼类别及第一比对结果所包含的权重值最小项为全拼提示项的信息;c2)若短文本类别为非全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为非全拼类别及第一比对结果所包含的权重值最小项为全拼提示项的信息;例如,对于在第一比对装置31所举的短文本前缀“xs”的例子,其提示项中前三项为全拼提示项,后两项为非全拼提示项。并且第一判断装置32判定短文本信息“xsmd”可以作为短文本前缀“xs”的提示项。其中短文本信息“xsmd”相对于短文本前缀“xs”属于全拼类型,在短文本前缀“xs”的提示信息中,与短文本信息“xsmd”同为全拼类别且权重值小于短文本信息“xsmd”的提示项为“xs8”和“χ世界”,其中权重值最大的ー项为提示项 “xs8”,其权重为8,即第二比对装置33获得短文本信息相对于提示信息的跳变项为第二提示项“xs8”,则第二比对结果包括第二提示项“xs8”、第二提示项为全拼类别,及权重值最小项为全拼提示项的信息。4)若第一比对结果属于前述C2)类第一比对结果,则第二比对装置33根据第一比对结果所获取的第二比对结果包括c3)若短文本类别为全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为全拼及第一比对结果所包含的权重值最小项为非全拼提示项的信息;c4)若短文本类别为非全拼,则第二比对结果包括短文本信息相对于提示信息的跳变项、短文本信息为非全拼及第一比对结果所包含的权重值最小项为非全拼提示项的信息。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断所述短文本信息能够作为所述短文本前缀的提示项时,根据所述第一比对结果获得第二比对结果的实现方式,例如,将所述跳变项更改为表示在与短文本信息类别相同且权重值大于短文本信息权重值的提示项中,权重值最小的提示项并相应更改其他处理方式;或者,在所有情况下,均将短文本信息类别及提示项类别包含在第二比对结果中等,均应包含在本发明的范围内。插入装置34根据所述第二比对结果,将该短文本信息作为新提示项加入所述提示信息中,井根据所述第二比对结果来调整所述提示信息中各个提示项的排序。具体的,插入装置34根据如下规则将短文本信息作为新提示项加入到提示信息, 并相应调整其他提示项I)当获得前述al)、a4)或a7)类第二比对结果时,插入装置34将短文本信息作为新提示项,插入到第二比对结果所包含提示项的位置,并将该位置的提示项及后续提示项相应后移一位;II)当获得前述a2)、a3)、a5)或a9)类第二比对结果时,插入装置34将短文本信息作为新提示项,插入提示信息最后一位;例如,对于短文本前缀“xel”,其提示信息最大项为5,其对应的提示信息及各提示项的权重值为xeltek,10 ;xeloda,8 ;xelos,7 ;xelove,5。对于短文本信息“邪恶力量第六季,其第二比对结果包括短文本信息类别为非全
36拼,且提示信息中所有提示项类别为全拼的信息,亦即如a3)所述情況,则插入装置34根据规则II),将短文本信息“邪恶力量第六季”作为新提示项,插入到提示信息的最后一位。则短文本前缀“xel”的提示信息变为xeltek、xeloda、xelos、xelove、邪恶力量第六季。III)当获得前述a6)类第二比对结果时,插入装置34将短文本信息作为新提示项,插入到提示信息中第一项提示项的位置,并将所有提示项的位置后移一位。IV)当获得前述a8)类第二比对结果时,插入装置34将短文本信息作为新提示项, 插入到提示信息中第一项非全拼提示项的位置,并将所有非全拼提示项的位置后移一位。V)当获得前述bl)或b2)类第二比对结果时,插入装置34将短文本信息作为新提示项,插入至第二比对结果所包含的跳变项的位置,并将该跳变项项及其后续提示项相应后移一位,并删除原提示信息中的最后ー项提示项;VI)当获得前述b3)类第二比对结果时,插入装置34将短文本信息作为新提示项, 插入到提示信息中第一提示项的位置,并将所有提示项的位置后移一位,并删除原提示信息中最后ー项提示项;VII)当获得前述b4)类第二比对结果时,插入装置34将短文本信息作为新提示项,替换原提示信息中的最后ー项提示项;VI)当获得前述cl)、c3)或c4)类第二比对结果时,插入装置34将短文本信息作为新提示项,插入至第二比对结果所包含的跳变项项的位置,并将该跳变项项及其后续提示项相应后移一位,并删除原提示信息中的最后ー项提示项;例如,对于短文本前缀“xs”,其对应的提示信息及各提示项的权重值为xswos, 10 ;xs8,8;χ 世界,7;许嵩,5;小说,4;其中,前三项为全拼提示项,后两项为非全拼提示项。对于短文本信息“xsmd”,其权重值为9,与短文本前缀“xs”对应的预定拼音类别为全拼。根据前述装置判断可知其属于cl)所述情況,其第二比对结果所对应的提示项为提示信息第二项。则插入装置34根据规则VI),将短文本信息作为新提示项,插入至第二比对结果所对应的提示项的位置,即第 ニ项的位置,删除原提示信息中的最后ー项提示项“小说”,并将第二项提示项“xs8”及其后续提示项“X世界”、“许嵩”、“小说”都相应后移一位,最后获得短文本前缀“xs”的提示信息 ノ、J :xswos、xsmd、xs8、χ 世界、许筒。VII)当获得前述U)类第二比对结果时,插入装置34删除最后一项全拼提示项, 并将所有与第二比对结果包含的跳变项之前的非全拼提示项位置上移一位后,将短文本信息作为新提示项插入至第二比对结果所对应的提示项的前ー项位置。例如,对于前述短文本前缀“xs”,其对应的提示信息及各提示项的权重值为xswos, 10 ;xs8,8;χ 世界,5;许嵩,8;
小说,6;若对于短文本信息“销售”,权重值为7,根据所述第一比对装置31、第一判断装置 32、第二比对装置33的执行结果判断可知属于c2)所述情形,并且根据执行结果可以得到跳变项为第五项“小说”。则插入装置34根据规则VII),去除最后ー项全拼提示项“χ世界”, 将所有与第二比对结果对应的提示项之前的非全拼提示项位置上移一位,亦即将“小说”之前的非全拼提示项“许嵩”上移一位,并将短文本信息“销售”作为新提示项,加入到第二比对结果所对应的提示项的前ー项位置,即提示信息的第四项中。最后获得调整后的短文本前缀“xs”的提示信息为XSW0S、XS8、许嵩、销售、小说。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述第二比对结果及短文本信息的预定拼音类别来调整提示信息中的提示项的排序的实现方式,例如,当提示项已达到最大数量并且需要插入新的提示项时,将被删除的提示项任意设定为全拼或非全拼中权重值最小的ー项;或者,若非全拼结果排序均高于全拼结果时,相应更改本实施所述的方法等,均应包含在本发明的范围内。需要进ー步说明的是,所述第一比对结果及第ニ比对结果所包含的内容及在第一比对装置31及第一判断装置32根据第一比对结果及第ニ比对结果来进行相应处理的方式并不以上述举例为限。例如,第一比对装置31获取短文本信息与所有提示项的比对结果作为第一比对結果。接着,第一判断装置32根据第一比对结果来获得其所需的第一判断信息,井根据该第一判断信息来判断短文本信息是否能够作为短文本前缀的提示项,其中,该第一判断信息可包括提示项个数、各提示项类别及其对应的权重值等,第一判断装置32具体根据该等判断信息来判断短文本信息是否能够作为短文本前缀的提示项的方式已在前述内容中予以详述,并以引用的方式包含于此,不再赘述。接着,第二比对装置33直接将第一比对结果作为第二比对结果。最后,插入装置34根据第二比对结果来获得其所需的第二判断信息,以根据该第二判断信息来将该短文本信息作为新提示项加入所述提示信息中, 井根据所述第二比对结果来调整所述提示信息中各个提示项的排序,其中,第二判断信息可包括短文本信息类别、短文本信息对于提示信息的跳变项等。根据本实施例的方案,通过第一比对装置31、第一判断装置32、第二比对装置33 及插入装置34执行多轮操作,即能快速遍历由ー个短文本信息所得的所有短文本前缀,当该短文本信息处理完毕后,即能释放用于处理该短文本信息所需的空间。因此,根据本实施例的方法通过少量的比较判断步骤即能获得所需结果,能够快速遍历大量的短文本信息来获取各短文本前缀及其对应的提示信息;并且,由于处理完ー个短文本信息所对应的所有短文本前缀后,即可释放用于处理该短文本信息所需的空间,而处理该短文本信息时所需的空间极小,因此,根据本实施例的方法消耗资源极少。图6本发明再一个优选实施例的基于短文本前缀来确定提示信息的提示装置的结构示意图。根据本实施例的提示装置包括第二子获取装置11’、第二分析装置6和第一库更新装置7。其中,所述第一获取装置1还进一歩包括前缀获取装置13和第三子获取装置 14 ;所述第一更新装置3还进一歩包括排序装置35和选择装置36。第二子获取装置11’获取所述短文本信息。接着,第二分析装置6分析所述短文本信息,以获得其对应的各预定拼音类别的短文本前缀。具体的,第二分析装置6对获得的短文本信息进行分析,并以全拼或非全拼的方式提取短文本信息对应的所有字符串,以作为所述短文本信息所对应的短文本前缀,井根据所述提取方式来是否是短文本信息的全拼,来确定短文本信息在对应的短文本前缀下的预定拼音类别。第一库更新装置7根据所述短文本信息及所获得的所述各预定拼音类别的短文本前缀来建立或更新对应关系库;其中,所述对应关系库中包括多个短文本前缀、该多个短文本前缀分别对应的短文本信息及具有对应关系的短文本前缀与短文本信息对应的预定拼音类別。具体的,当所述对应关系库未建立吋,第一库更新装置7根据所述短文本信息及所获得的所述各预定拼音类别的短文本前缀来建立对应关系库。当所述对应关系库已建立吋,第一库更新装置7在获取短文本信息及其对应的所有短文本前缀后,在对应关系库中查询所述短文本信息是否已包含在其对应的短文本前缀下,若所述短文本信息未包含在其对应的短文本前缀下,则将短文本信息及该短文本信息与短文本前缀相对应的预定拼音类别添加至该短文本前缀所对应的短文本信息中。第一库更新装置7还将该短文本信息与短文本前缀相对应的权重值添加至与该短文本前缀相关的信息中。例如,对于短文本信息“赶集网”,与其对应的短文本前缀包括“g”、“ga”、“gan”、 し ganj,,、“ ganji,,、“ ganji,,、“ ganjiw,,、“ ganjiwa,,、“ ganjiwan,,、“ ganjiwang,、‘’ gj,,、“gjw,,, 第一库更新装置7在对应关系库中查找前述短文本前缀,并获得短文本前缀“ganjiwang” 和“gj”,而其余短文本前缀不存在对应关系库中。“ganjiwang”和“gj”在对应关系库中与短文本信息的对应关系为"ganjiwang"赶集网,10,全拼;“gj”gjw,9,全拼;赶集,6,非全拼;第一库更新装置7分析得到短文本信息“赶集网”与短文本前缀“ganjiwang”的对应关系已经存在,因此则对短文本前缀“ganjiwang”进行操作;第一库更新装置7分析得到短文本信息“赶集网”未存在于短文本前缀“gj”对应的短文本信息中,且提示装置获得短文本信息“赶集网”相对于短文本前缀“gj,,的拼音类别为非全拼,且其相对于短文本前缀“gj ”的权重值为7,则第一库更新装置7将短文本信息及其预定拼音类别添加至与短文本前缀“gj”的对应关系中,短文本前缀“gj”的对应关系更新为 "gj,,:gjw,9,全拼;赶集网,7,非全拼;赶集,6,非全拼。对于尚未在对应关系库中建立的短文本前缀“g”、“ga”、“gan”、“ganj”、“ganji”、 “ganji”、“ganjiW”、“ganjiWa”、“ganjiWan” 及“ gjw”,第一库更新装置 7 将上述短文本前缀及该等短文本前缀与短文本信息“赶集网”的对应关系添加至对应关系库中。以短文本前缀“gjw”为例,第一库更新装置7获得短文本信息“赶集网”相对于短文本前缀“gjw”的拼音类别为非全拼,且其相对于短文本前缀“gjw”的权重值为9,则将该短文本前缀和该短文本信息及其预定拼音类别添加至对应关系库中,则对应关系库中増加了短文本前缀“gjw”的对应关系,其当前的对应关系为“gjw”赶集网,9,非全拼。
建立对应关系库后,当提示装置需要建立或更新提示信息吋,前缀获取装置13获取ー个短文本前缀。其中,获取短文本前缀的方式包括但不限于1)实时获取用户输入的输入序列,并将该实时获取的输入序列作为短文本前缀;2)获取预存储的短文本前缀。接着,第三子获取装置14根据所述短文本前缀,由所述对应关系库中获取与所述短文本前缀对应的ー个或多个短文本信息及所述短文本前缀与分別所述ー个或多个短文本信息相对应的预定拼音类别及权重值。具体的,第三子获取装置14根据获得的短文本前缀,在对应关系库中查询获得该短文本前缀,以及与所述短文本前缀对应短文本信息,以及该等短文本信息与所述短文本前缀对应的预定拼音类别及权重值。权重确定装置2已在參照图4所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。接着,排序装置35根据所述多个短文本信息对应的权重值及预定拼音类别,来确定所述多个短文本信息相对于所述短文本前缀的排序結果。具体的,排序装置35根据全拼短文本信息在前,非全拼短文本信息在后,并对全拼及非全拼短文本信息,分别按照权重值有高至低进行排序的方式,来获得与短文本前缀对应的短文本信息的排序結果。例如,排序装置35所获取的短文本前缀“gj”所对应的短文本信息及其权重值和相应的预定拼音类别为根据,3,非全拼;赶集网,4. 5,非全拼;赶集,6,非全拼;gjw,8,全拼;国家,6. 5,非全拼;感觉,2,非全拼;则排序装置35根据全拼短文本信息在前,非全拼短文本信息在后,并对全拼及非全拼短文本信息,分别按照权重值有高至低进行排序的方式进行排序后,获得上述多个短文本信息相对于短文本前缀“gj”的排序结果为gjw,8,全拼;国家,6. 5,非全拼;赶集,6,非全拼;赶集网,4. 5,非全拼;根据,3,非全拼;感觉,2,非全拼。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述多个短文本信息对应的权重值及预定拼音类別,来确定所述多个短文本信息相对于所述短文本前缀的排序结果的实现方式,均应包含在本发明的范围内。
选择装置36根据所述提示信息中提示项的最大数量及所述排序結果,由所述多个短文本信息中选择相应的多个排序的提示项。其中,所述提示信息中提示项的最大数量可由本领域技术人员应可根据实际情况和需求来选择并设定。具体的,选择装置36预设提示信息所包含的提示项的最大数量为N。则提示装置由短文本前缀所对应的已经排序完成的多个短文本信息中选择排名前N位的短文本信息作为短文本前缀的提示项。例如,选择装置36预设提示信息的提示项的最大数量为4,对于前述短文本前缀 “gj”,其相应的短文本排序结果为gjw,8,全拼;国家,6. 5,非全拼;赶集,6,非全拼;赶集网,4. 5,非全拼;根据,3,非全拼;感觉,2,非全拼。选择装置36从该排序结果中选择排序为前四位的短文本信息作为短文本前缀 “gj”的提示项,来构成其提示信息。即短文本前缀“gj”的提示信息包括gjw、国家、赶集、 赶集网。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于根据所述提示信息中提示项的最大数量及所述排序結果,由所述多个短文本信息中选择相应的多个排序的提示项的实现方式,均应包含在本发明的范围内。根据本实施例的提示装置,其通用性较强,易于进行系统维护。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括” ー词不排除其他単元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由ー个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的順序。
权利要求
1.一种计算机实现的用于基于短文本前缀来确定提示信息的方法,其中,该方法包括以下步骤a获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;b基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀与所述一个或多个短文本信息相对应的权重值;c根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息,所述提示信息包括一个或多个排序的提示项。
2.根据权利要求1所述的方法,其中,所述步骤b包括以下步骤-基于第一预定规则,根据所述预定拼音类别,来确定所述短文本信息的权重调节值; -根据所述权重调节值及预设的所述短文本信息的初始权重值,来确定所述权重值。
3.根据权利要求1或2所述的方法,其中,所述第一预定规则包括参考以下至少一项因素来确定所述权重值-所述短文本前缀的长度; -所述短文本前缀所包含的元音及/或辅音个数; -所述短文本信息的长度。
4.根据权利要求1至3中任一项所述的方法,其中,所述步骤c包括以下步骤-根据提示信息中提示项的最大数量及/或根据所述短文本信息对应的权重值与相同及/或不同预定拼音类别的提示项对应的权重值的比对结果,来获得第一比对结果; -根据所述比对结果判断所述短文本信息是否能够作为所述短文本前缀的提示项; -当判断所述短文本信息能够作为所述短文本前缀的提示项时,根据所述第一比对结果获得第二比对结果;-根据所述第二比对结果,将该短文本信息作为新提示项加入所述提示信息中,并根据所述第二比对结果来调整所述提示信息中各个提示项的排序。
5.根据权利要求1至3中任一项所述的方法,其中,所述步骤c包括以下步骤-根据所述多个短文本信息对应的权重值及预定拼音类别,来确定所述多个短文本信息相对于所述短文本前缀的排序结果;-根据所述提示信息中提示项的最大数量及所述排序结果,由所述多个短文本信息中选择相应的多个排序的提示项。
6.根据权利要求1至5中任一项所述的方法,其中,该方法还包括以下步骤 -判断所述短文本信息是否与所述提示信息所包含的任一提示项等同;-当判断得到所述短文本信息与所述任一提示项等同,则根据该短文本信息与该提示项与所述短文本前缀对应的预定拼音类别,来基于该短文本信息更新所述提示信息; 其中,所述步骤b还包括以下步骤-当判断得到所述短文本信息未与所述任一提示项等同,则基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述一个或多个短文本信息相对应的权重值。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤a包括以下步骤 -获取所述短文本信息;-分析所述短文本信息,以获得其对应的一个预定拼音类别的短文本前缀。
8.根据权利要求1至6中任一项所述的方法,其中,该方法包括以下步骤 -获取所述短文本信息;-分析所述短文本信息,以获得其对应的各预定拼音类别的短文本前缀; -根据所获得的所述短文本信息及所述各预定拼音类别的短文本前缀来建立或更新对应关系库;其中,所述对应关系库中包括多个短文本前缀、该多个短文本前缀分别对应的短文本信息及具有对应关系的短文本前缀与短文本信息对应的预定拼音类别; 其中,所述步骤a还包括以下步骤 -获取一个短文本前缀;-根据所述短文本前缀,由所述对应关系库中获取与其对应的一个或多个短文本信息及该短文本前缀与分别所述一个或多个短文本信息相对应的预定拼音类别及权重值。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括以下步骤-根据所述短文本前缀及所建立或更新的提示信息,来建立或更新提示信息库; 其中,该方法还包括以下步骤 -获取来自用户的输入序列;-将所述输入序列作为一个短文本前缀在所述提示信息库中进行查询,以获取与该输入序列所对应的提示信息,作为该输入序列的提示信息。
10.根据权利要求1至9中任一项所述的方法,其中,所述预定拼音类别包括全拼及非全拼。
11.根据权利要求10所述的方法,其中,所述步骤C包括以下步骤-基于第二预定规则,根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息; 其中,所述第二预定规则包括以下规则 将全拼的短文本信息排序高于非全拼的短文本信息。
12.一种用于基于短文本前缀来确定提示信息的提示装置,其中,该提示装置包括 第一获取装置、用于获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;权重确定装置、用于基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀与所述一个或多个短文本信息相对应的权重值;第一更新装置、用于根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息,所述提示信息包括一个或多个排序的提示项。
13.根据权利要求12所述的装置,其中,所述权重确定装置包括权重调节装置、用于基于第一预定规则,根据所述预定拼音类别,来确定所述短文本信息的权重调节值;第一子确定装置、用于根据所述权重调节值及预设的所述短文本信息的初始权重值, 来确定所述权重值。
14.根据权利要求12或13所述的提示装置,其中,所述第一预定规则包括参考以下至少一项因素来确定所述权重值 -所述短文本前缀的长度; -所述短文本前缀所包含的元音及/或辅音个数; -所述短文本信息的长度。
15.根据权利要求12至14中任一项所述的提示装置,其中,所述第一更新装置还包括第一比对装置、用于根据提示信息中提示项的最大数量及/或根据所述短文本信息对应的权重值与相同及/或不同预定拼音类别的提示项对应的权重值的比对结果,来获得第一比对结果;第一判断装置、用于根据所述比对结果判断所述短文本信息是否能够作为所述短文本前缀的提示项;第二比对装置、用于当判断所述短文本信息能够作为所述短文本前缀的提示项时,根据所述第一比对结果获得第二比对结果;插入装置、用于根据所述第二比对结果,将该短文本信息作为新提示项加入所述提示信息中,并根据所述第二比对结果来调整所述提示信息中各个提示项的排序。
16.根据权利要求12至14中任一项所述的提示装置,其中,所述第一更新装置包括 排序装置、用于根据所述多个短文本信息对应的权重值及预定拼音类别,来确定所述多个短文本信息相对于所述短文本前缀的排序结果;选择装置、用于根据所述提示信息中提示项的最大数量及所述排序结果,由所述多个短文本信息中选择相应的多个排序的提示项。
17.根据权利要求12至16中任一项所述的提示装置,其中,该提示装置还包括 第二判断装置、用于判断所述短文本信息是否与所述提示信息所包含的任一提示项等同;第二更新装置、用于当判断得到所述短文本信息与所述任一提示项等同,则根据该短文本信息与该提示项与所述短文本前缀对应的预定拼音类别,来基于该短文本信息更新所述提示信息;其中,所述权重确定装置还用于当判断得到所述短文本信息未与所述任一提示项等同,则基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀分别与所述一个或多个短文本信息相对应的权重值。
18.根据权利要求12至17中任一项所述的提示装置,其中,所述第一获取装置包括 第一子获取装置、用于获取所述短文本信息;第一分析装置、用于分析所述短文本信息,以获得其对应的一个预定拼音类别的短文本前缀。
19.根据权利要求12至17中任一项所述的提示装置,其中,该提示装置还包括 第二子获取装置,用于获取所述短文本信息;第二分析装置、用于分析所述短文本信息,以获得其对应的各预定拼音类别的短文本前缀;第一库更新装置、用于根据所获得的所述短文本信息及所述各预定拼音类别的短文本前缀来建立或更新对应关系库;其中,所述对应关系库中包括多个短文本前缀、该多个短文本前缀分别对应的短文本信息及具有对应关系的短文本前缀与短文本信息对应的预定拼音类别; 其中,所述第一获取装置还包括 前缀获取装置,用于获取一个短文本前缀;第三子获取装置、用于根据所述短文本前缀,由所述对应关系库中获取与其对应的一个或多个短文本信息及该短文本前缀与分别所述一个或多个短文本信息相对应的预定拼音类别及权重值。
20.根据权利要求12至19中任一项所述的提示装置,其中,该提示装置还包括第二库更新装置、用于根据所述短文本前缀及所建立或更新的提示信息,来建立或更新提示信息库;其中,该提示装置还包括实时获取装置、用于获取来自用户的输入序列;查询装置、用于将所述输入序列作为一个短文本前缀在所述提示信息库中进行查询, 以获取与该输入序列所对应的提示信息,作为该输入序列的提示信息。
21.根据权利要求12至劝中任一项所述的提示装置,其中,所述预定拼音类别包括全拼及非全拼。
22.根据权利要求21所述的提示装置,其中,所述第一更新装置还用于基于第二预定规则,根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息; 其中,所述第二预定规则包括以下规则 将全拼的短文本信息排序高于非全拼的短文本信息。
23.一种计算机设备,其中,该计算机设备包括如权利要求12至22中至少一项所述的提示装置。
全文摘要
本发明提供一种用于基于短文本前缀来确定提示信息的方法、装置及计算机设备,其中,本发明通过获取所述短文本前缀、该短文本前缀对应的一个或多个短文本信息及该短文本前缀分别与所述一个或多个短文本信息相对应的预定拼音类别;基于第一预定规则,根据所述预定拼音类别,来分别确定所述短文本前缀与所述一个或多个短文本信息相对应的权重值;并根据所述权重值及所述预定拼音类别,来基于所述一个或多个短文本信息建立或更新所述短文本前缀对应的提示信息。本发明优点在于1)使得所呈现的提示项更符合用户的需求;2)能够快速遍历大量的短文本信息来获取各短文本前缀及其对应的提示信息,消耗资源少。
文档编号G06F3/023GK102591470SQ20111000677
公开日2012年7月18日 申请日期2011年1月13日 优先权日2011年1月13日
发明者石磊 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1