拼音输入方法、装置、计算机设备及存储介质与流程

文档序号:28862125发布日期:2022-02-12 01:18阅读:122来源:国知局
拼音输入方法、装置、计算机设备及存储介质与流程

1.本技术涉及智能推荐技术领域,具体而言,本技术涉及一种拼音输入方法、装置、计算机设备及存储介质。


背景技术:

2.在用户需要使用拼音输入的时候,为了更快速地帮助用户找到需要输入的文本,需要基于拼音的自动语义联想推荐功能,比如用户开始打“lx”,弹窗中需反馈推荐列表,包含“利息多少”、“利息太高”等文本,用户可以从推荐的列表中选择自己想要的文本,如果都没有,用户继续打字,同时推荐列表根据用户的打字刷新推荐列表,但现有的自动语义联想推荐功能,当用户在键盘误触输入错误拼音时,仍然会优先推荐该错误拼音相应的文本,导致推荐的文本并非用户想要的结果,推荐精确度较低。


技术实现要素:

3.本技术的主要目的为提供一种拼音输入方法、装置、计算机设备及存储介质,以提高推荐精确度。
4.为了实现上述发明目的,本技术提供一种拼音输入方法,其包括以下步骤:
5.接收用户在空白输入框输入的第一目标首字母;
6.获取预存的所有候选文本,基于所述第一目标首字母,从所述候选文本中筛选出第一目标候选文本;其中,所述第一目标候选文本的首字对应拼音的首字母与所述第一目标首字母一致;
7.获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母,并计算每个所述下一个第一目标首字母在所述历史输入记录中出现的频率;
8.将每个所述下一个第一目标首字母与所述第一目标候选文本进行比对,从所述第一目标候选文本中筛选出第二目标候选文本;其中,所述第二目标候选文本的第二个字对应拼音的首字母与其中一个所述下一个第一目标首字母一致;
9.获取每个所述第二目标候选文本中每个字对应的首字母,得到每个所述第二目标候选文本的首字母串;
10.筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本;
11.计算所述第三目标候选文本的相邻首字母的对数,根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率;其中,所述第三目标候选文本衰减后的频率与所述对数成反比;
12.按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,获取排在前m位的所述第二目标候选文本,得到待推荐目标候选文本;其中,所述m为正整数;
13.将所述待推荐目标候选文本在所述空白输入框的上方进行显示。
14.优选地,所述按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,包括:
15.计算所述第二目标候选文本的实时输入热度;
16.获取预先为所述实时输入热度设置的第一权重;
17.获取预先为所述频率设置的第二权重;
18.基于所述频率、实时输入热度、第一权重及第二权重计算所述第二目标候选文本的评价值;
19.按照所述评价值从高到低的顺序对所述第二目标候选文本进行排序。
20.优选地,所述计算所述第二目标候选文本的实时输入热度,包括:
21.获取每个所述第二目标候选文本在过去中被选择的频次;
22.基于每个所述第二目标候选文本被选择的频次计算所有所述第二目标候选文本在过去中被选择的总频次;
23.根据每个所述第二目标候选文本被选择的频次及所述总频次计算每个所述第二目标候选文本的实时输入热度。
24.进一步地,所述接收用户在空白输入框输入的第一目标首字母之前,还包括:
25.响应于用户点击空白输入框的点击指令,获取实时输入热度排在前n位的候选文本,得到参考候选文本;其中,所述n为正整数;
26.将所述参考候选文本在所述空白输入框的上方进行显示;
27.所述接收用户在空白输入框输入的第一目标首字母之后,还包括:
28.将显示在所述空白输入框上方的所述参考候选文本进行隐藏。
29.进一步地,所述将所述待推荐目标候选文本在所述空白输入框的上方进行显示之后,还包括:
30.接收用户在空白输入框输入的第二目标首字母;
31.基于所述第二目标首字母,从所述第一目标候选文本中筛选出新的第一目标候选文本;其中,所述新的第一目标候选文本的第二个字对应拼音的首字母与所述第二目标首字母一致;
32.将所述第二目标首字母作为所述第一目标首字母,将所述新的第一目标候选文本作为所述第一目标候选文本;
33.返回执行所述获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母的步骤,直至得到新的待推荐目标候选文本;
34.利用所述新的待推荐目标候选文本更新显示在所述空白输入框上方的待推荐目标候选文本。
35.优选地,所述筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本,包括:
36.确定每个所述首字母串的所有相邻首字母;其中,每个所述相邻首字母由所述首字母串中的两个相邻的首字母组成;
37.获取所有相邻首字母的首字母在键盘中的位置信息;
38.根据所述位置信息判断是否含有在键盘中的位置也相邻的相邻首字母;
39.若是,则筛选出在键盘中的位置也相邻的相邻首字母所对应的首字母串,得到目标首字母串;
40.将所述目标首字母串对应的第二目标候选文本作为第三目标候选文本。
41.优选地,所述根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率,包括如下公式:
42.y=ye-ωt

43.其中,所述y为所述第三目标候选文本衰减前的频率,所述y为所述第三目标候选文本衰减后的频率,所述e为常数,所述t为对数,所述ω为衰减因子。
44.本技术还提供一种拼音输入装置,其包括:
45.接收模块,用于接收用户在空白输入框输入的第一目标首字母;
46.获取模块,用于获取预存的所有候选文本,基于所述第一目标首字母,从所述候选文本中筛选出第一目标候选文本;其中,所述第一目标候选文本的首字对应拼音的首字母与所述第一目标首字母一致;
47.确定模块,用于获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母,并计算每个所述下一个第一目标首字母在所述历史输入记录中出现的频率;
48.比对模块,用于将每个所述下一个第一目标首字母与所述第一目标候选文本进行比对,从所述第一目标候选文本中筛选出第二目标候选文本;其中,所述第二目标候选文本的第二个字对应拼音的首字母与其中一个所述下一个第一目标首字母一致;
49.所述获取模块,还用于获取每个所述第二目标候选文本中每个字对应的首字母,得到每个所述第二目标候选文本的首字母串;
50.筛选模块,用于筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本;
51.计算模块,用于计算所述第三目标候选文本的相邻首字母的对数,根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率;其中,所述第三目标候选文本衰减后的频率与所述对数成反比;
52.排序模块,用于按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,获取排在前m位的所述第二目标候选文本,得到待推荐目标候选文本;其中,所述m为正整数;
53.显示模块,用于将所述待推荐目标候选文本在所述空白输入框的上方进行显示。
54.本技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
55.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
56.本技术所提供的一种拼音输入方法、装置、计算机设备及存储介质,当接收到用户在空白输入框输入的第一目标首字母时,基于该第一目标首字母从候选文本中筛选出对应的第一目标候选文本,并根据历史输入记录确定第一目标首字母关联的所有下一个第一目标首字母及其频率,将每个下一个第一目标首字母与第一目标候选文本进行比对,筛选出第二目标候选文本,以得到含有用户下一个可能要输入的字的文本,然后获取每个第二目
标候选文本中每个字对应的首字母,得到每个第二目标候选文本的首字母串,筛选出每个首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本,以得到用户在打字时可能误触键盘导致的输入错误的第三目标候选文本,并对第三目标候选文本的频率根据相邻首字母的对数进行衰减作为第三目标候选文本的频率,最后按照频率从高到低的顺序对第二目标候选文本进行排序,筛选出排在前m位的第二目标候选文本作为待推荐目标候选文本,并显示在空白输入框的上方,以减少可能存在输入错误的第二目标候选文本的推荐,使显示的第二目标候选文本更符合用户期望得到的文本,提高推荐的精确度。
附图说明
57.图1为本技术一实施例的拼音输入方法的流程示意图;
58.图2为本技术一实施例的拼音输入装置的结构示意框图;
59.图3为本技术一实施例的计算机设备的结构示意框图。
60.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
61.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
62.本技术提出的一种拼音输入方法,以计算机设备为执行主体,该拼音输入方法用于解决现有的自动语义联想推荐功能,当用户在键盘误触输入错误拼音时,仍然会优先推荐该错误拼音相应的文本,导致推荐的文本并非用户想要的结果,推荐精确度较低的技术问题。参考图1,其中一个实施例中,该拼音输入方法包括如下步骤:
63.s11、接收用户在空白输入框输入的第一目标首字母;
64.s12、获取预存的所有候选文本,基于所述第一目标首字母,从所述候选文本中筛选出第一目标候选文本;其中,所述第一目标候选文本的首字对应拼音的首字母与所述第一目标首字母一致;
65.s13、获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母,并计算每个所述下一个第一目标首字母在所述历史输入记录中出现的频率;
66.s14、将每个所述下一个第一目标首字母与所述第一目标候选文本进行比对,从所述第一目标候选文本中筛选出第二目标候选文本;其中,所述第二目标候选文本的第二个字对应拼音的首字母与其中一个所述下一个第一目标首字母一致;
67.s15、获取每个所述第二目标候选文本中每个字对应的首字母,得到每个所述第二目标候选文本的首字母串;
68.s16、筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本;
69.s17、计算所述第三目标候选文本的相邻首字母的对数,根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率;其中,所述第三目标
候选文本衰减后的频率与所述对数成反比;
70.s18、按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,获取排在前m位的所述第二目标候选文本,得到待推荐目标候选文本;其中,所述m为正整数;
71.s19、将所述待推荐目标候选文本在所述空白输入框的上方进行显示。
72.如上述步骤s11所述,该空白输入框可以是用户未输入任何内容的聊天输入框,当检测到用户在聊天界面的空白输入框输入简拼时,接收用户在空白输入框输入的第一目标首字母。
73.其中,为了兼容错别字或者口语问题,本技术支持首字母简拼,可使用隐马尔科夫链,用于穷举候选文本中首字母可能组合,且可根据频率公式推算出,下一个首字母的可能组合频率。
74.具体的,根据用户在空白输入的首字母来寻找第一目标候选文本,如“利息”,首字母为“lx”,根据隐马尔科夫链的频率公式排序所有第一目标候选文本。其中,频率公式包括p(下一个拼音为i|客户输入首字母lx)=(客户输入首字母lx时,下一个拼音首字母为i的频数)/客户输入首字母lx的所有文本集合。以此类推,算出每个第一目标候选文本占所有第一目标候选文本的频率,按照此频率对所有第一目标候选文本进行排序,得到排序结果,并根据所述排序结果将所述第一目标候选文本在空白输入框的上方进行显示。
75.在一实施例中,还可设置一定阈值,如将该阈值设定为0.5,所有第一目标候选文本中,频率超过所述阈值的第一目标候选文本进行保留,并将此频率记录为p(p),以此为第一优先级排序索引排序,依照第一优先级排序对保留的第一目标候选文本进行排序,以筛选出用户想要的第一目标候选文本,提高推荐精确度。
76.此外,还可在第一目标候选文本的拼音的首字母的基础上进行汉字检索推荐,如利息,作为2_gram,在所有第一目标候选文本中进行首字母完全匹配,设置数值p(h)作为排序依据,如果第一目标候选文本与用户在空白输入框输入的所有首字母完全匹配,则将该第一目标候选文本优先排在前列,如完全匹配表示为p(h)=+1,如没有完全匹配上则表示为p(h)=+0,以此为第二优先级排序索引排序,优先推荐完全匹配的第一目标候选文本,便于用户查找想要的结果。
77.如上述步骤s12所述,当用户输入第一目标首字母时,则从当前的所有候选文本中筛选出首字的首字母与用户输入的第一目标首字母相同的候选文本,将其作为第一目标候选文本。其中,所述候选文本可以是该用户的输入热度排在前列的简拼所对应的文本。
78.如上述步骤s13所述,本实施例获取用户在键盘输入字母时的历史输入记录,该键盘可以是实体键盘或虚拟键盘,该历史数据记录中包括每个字母输入的频率,上一个首字母与下一个首字母同时出现的频率,从而根据历史输入记录计算第一目标首字母关联的所有下一个第一目标首字母在历史输入记录中出现的频率,即获取第一目标首字母下一个可能要输入的首字母。
79.如上述步骤s14所述,对每个下一个第一目标首字母与第一目标候选文本进行一一比对,具体是将每个下一个第一目标首字母与第一目标候选文本的第二个字对应拼音的首字母进行比对,筛选出第一目标候选文本中含有第一目标首字母及下一个第一目标首字母的第一目标候选文本,将其作为第二目标候选文本。例如,当首字母为w时,则第二目标候选文本可以是文字、文学、文本,首字母的下一个首字母分别是z、x、b,对应的频率可以是
80%、70%、60%。
80.如上述步骤s15所述,本实施例遍历每个第二目标候选文本中每个字对应的首字母,得到每个第二目标候选文本的首字母串,即该首字母串由第二目标候选文本中每个字对应的首字母组成。
81.如上述步骤s16-s17所述,然后判断每个首字母串的相邻首字母在键盘中的位置是否也存在相邻,并计算第三目标候选文本的相邻首字母的对数,根据对数对所述第三目标候选文本的频率进行衰减后作为第三目标候选文本的频率。其中,所述第三目标候选文本衰减后的频率与所述对数成反比。
82.例如,若第二目标候选文本为“文字一致”、“文学涵养”,则“文字一致”的首字母串为“wzyz”,由于每两个相邻的首字母“wz”、“zy”、“yz”在键盘中对应的位置并不相邻,则“文字一致”为不存在键盘相邻的首字母,标记为不存在相邻的第二目标候选文本,并将不存在相邻的“文字一致”的频率作为“文字一致”的目标频率;而“文学涵养”的首字母串为“wxhy”,由于每两个相邻的首字母中,“wx”、“xh”在键盘中对应的位置并不相邻,而“hy”在键盘中对应的位置相邻,则“文学涵养”为存在键盘相邻的首字母,标记为存在相邻的第二目标候选文本,且相邻对数为一对,则根据所述对数对“文学涵养”的频率进行衰减,得到目标频率,如将“文学涵养”的频率乘于0.9b,b为相邻的对数,得到“文学涵养”的目标频率。由于在键盘相邻的两个相邻首字母,一般是用户容易输入错误的字母,如用户在输入时,手指之间容易触碰到两个在键盘相邻的字母,因此本技术通过对存在键盘相邻的两个相邻首字母的第二目标候选文本的频率进行衰减,得到目标频率。
83.如上述步骤s18-s19所述,本实施例基于频率对第二目标候选文本进行排序,得到排序结果。其中,对于相邻首字母但在键盘中的位置不存在相邻的第二目标候选文本,则无需衰减,采用原来的频率进行排序;而对于相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,则采用衰减后的频率进行排序,然后根据排序结果将第二目标候选文本在空白输入框的上方进行显示,以减少可能存在输入错误的第二目标候选文本,使显示的第二目标候选文本更符合用户期望得到的候选文本。
84.本技术所提供的一种拼音输入方法,当接收到用户在空白输入框输入的第一目标首字母时,基于该第一目标首字母从候选文本中筛选出对应的第一目标候选文本,并根据历史输入记录确定第一目标首字母关联的所有下一个第一目标首字母及其频率,将每个下一个第一目标首字母与第一目标候选文本进行比对,筛选出第二目标候选文本,以得到含有用户下一个可能要输入的字的文本,然后获取每个第二目标候选文本中每个字对应的首字母,得到每个第二目标候选文本的首字母串,筛选出每个首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本,以得到用户在打字时可能误触键盘导致的输入错误的第三目标候选文本,并对第三目标候选文本的频率根据相邻首字母的对数进行衰减作为第三目标候选文本的频率,最后按照频率从高到低的顺序对第二目标候选文本进行排序,筛选出排在前m位的第二目标候选文本作为待推荐目标候选文本,并显示在空白输入框的上方,以减少可能存在输入错误的第二目标候选文本的推荐,使显示的第二目标候选文本更符合用户期望得到的文本,提高推荐的精确度。
85.在一实施例中,所述按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,可具体包括:
86.计算所述第二目标候选文本的实时输入热度;
87.获取预先为所述实时输入热度设置的第一权重;
88.获取预先为所述频率设置的第二权重;
89.基于所述频率、实时输入热度、第一权重及第二权重计算所述第二目标候选文本的评价值;
90.按照所述评价值从高到低的顺序对所述第二目标候选文本进行排序。
91.实时输入热度用于表征第二目标候选文本被选中的热度。本实施例可通过第二目标候选文本被用户选择的频次计算第二目标候选文本的实时输入热度,且该实时输入热度基于用户每次选择第二目标候选文本之后进行自动更新一次,然后获取预先为实时输入热度设置的第一权重,以及获取预先为频率设置的第二权重,一般地,第一权重小于第二权重,以优先排列用户最有可能想要的第二目标候选文本,最后基于所述频率、实时输入热度、第一权重及第二权重计算第二目标候选文本的评价值,基于评价值的高低对第二目标候选文本进行排序,如将评价值高的第二目标候选文本排在前列,将评价值低的第二目标候选文本排在后面。
92.其中,评价值的计算公式如下:
93.s=p1*a+p2*b;
94.其中,所述p1为第一权重,a为实时输入热度,p2为第二权重,b为频率。
95.在一实施例中,所述计算所述第二目标候选文本的实时输入热度,可具体包括:
96.获取每个所述第二目标候选文本在过去中被选择的频次;
97.基于每个所述第二目标候选文本被选择的频次计算所有所述第二目标候选文本在过去中被选择的总频次;
98.根据每个所述第二目标候选文本被选择的频次及所述总频次计算每个所述第二目标候选文本的实时输入热度。
99.本实施例获取每个第二目标候选文本被选择的频次,在每个第二目标候选文本在历史周期内被选择一次后,则在原有基础上进行累加一次,然后将所有第二目标候选文本被选择的频次进行累加,得到总频次,分别计算每个第二目标候选文本被选择的频次与所述总频次的比值,计算得到每个第二目标候选文本的实时输入热度,然后基于所述实时输入热度对第二目标候选文本进行排序,筛选出排在前列的第二目标候选文本,如将实时输入热度较高的第二目标候选文本排在前列,将实时输入热度较低的第二目标候选文本排在后面,以精确地计算第二目标候选文本的实时输入热度。
100.在一实施例中,所述接收用户在空白输入框输入的第一目标首字母之前,还可包括:
101.响应于用户点击空白输入框的点击指令,获取实时输入热度排在前n位的候选文本,得到参考候选文本;其中,所述n为正整数;
102.将所述参考候选文本在所述空白输入框的上方进行显示;
103.所述接收用户在空白输入框输入的第一目标首字母之后,还包括:
104.将显示在所述空白输入框上方的所述参考候选文本进行隐藏。
105.本实施例在用户点击空白输入框时,生成点击空白输入框的点击指令,此时获取实时输入热度排在前n位的候选文本,得到参考候选文本,将参考候选文本在空白输入框的
上方进行显示,以在用户输入首字母之前,为用户推荐实时输入热度较高的参考候选文本,以推荐用户可能要输入的文本。当接收到用户在空白输入框输入的第一目标首字母时,则将显示在空白输入框上方的参考候选文本进行隐藏,依照第一目标首字母得到待推荐目标候选文本。
106.在一实施例中,所述将所述待推荐目标候选文本在所述空白输入框的上方进行显示之后,还可包括:
107.接收用户在空白输入框输入的第二目标首字母;
108.基于所述第二目标首字母,从所述第一目标候选文本中筛选出新的第一目标候选文本;其中,所述新的第一目标候选文本的第二个字对应拼音的首字母与所述第二目标首字母一致;
109.将所述第二目标首字母作为所述第一目标首字母,将所述新的第一目标候选文本作为所述第一目标候选文本;
110.返回执行所述获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母的步骤,直至得到新的待推荐目标候选文本;
111.利用所述新的待推荐目标候选文本更新显示在所述空白输入框上方的待推荐目标候选文本。
112.在本实施例中,在接收到用户在空白输入框输入的第二目标首字母时,则基于第二目标首字母从第一目标候选文本中筛选出新的第一目标候选文本,该新的第一目标候选文本的第二个字对应拼音的首字母与第二目标首字母一致,即第一个字对应拼音的首字母与第一目标首字母一致,且第二个字对应拼音的首字母与第二目标首字母一致的新的第一目标候选文本。将第二目标首字母作为第一目标首字母,将新的第一目标候选文本作为第一目标候选文本,返回获取用户在键盘输入时的历史输入记录,根据历史输入记录确定第一目标首字母关联的所有下一个第一目标首字母的步骤及其后续步骤,直至得到新的待推荐目标候选文本,该新的待推荐目标候选文本基于第一目标首字母及第二目标首字母筛选得到,最后利用新的待推荐目标候选文本更新显示在空白输入框上方的待推荐目标候选文本,以基于用户输入的目标首字母实时更新待推荐目标候选文本,确保推荐的待推荐目标候选文本的准确性。
113.在一实施例中,所述筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本,可具体包括:
114.确定每个所述首字母串的所有相邻首字母;其中,每个所述相邻首字母由所述首字母串中的两个相邻的首字母组成;
115.获取所有相邻首字母的首字母在键盘中的位置信息;
116.根据所述位置信息判断是否含有在键盘中的位置也相邻的相邻首字母;
117.若是,则筛选出在键盘中的位置也相邻的相邻首字母所对应的首字母串,得到目标首字母串;
118.将所述目标首字母串对应的第二目标候选文本作为第三目标候选文本。
119.本实施例确定每个首字母串的所有相邻首字母,获取所有相邻首字母的首字母在键盘中的位置信息,根据位置信息判断是否含有在键盘中的位置也相邻的相邻首字母,若
判定含有在键盘中的位置也相邻的相邻首字母,则筛选出在键盘中的位置也相邻的相邻首字母所对应的首字母串,得到目标首字母串,将该目标首字母串对应的第二目标候选文本作为第三目标候选文本。例如,“文学涵养”的首字母串为“wxhy”,由于每两个相邻的首字母中,“wx”、“xh”在键盘中对应的位置信息并不相邻,而“hy”在键盘中对应的位置信息相邻,则“文学涵养”为存在键盘相邻的首字母,标记为存在相邻的第二目标候选文本。
120.在一实施例中,所述根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率,包括如下公式:
121.y=ye-ωt

122.其中,所述y为所述第三目标候选文本衰减前的频率,所述y为所述第三目标候选文本衰减后的频率,所述e为常数,所述t为对数,所述ω为衰减因子。
123.参照图2,本技术实施例中还提供一种拼音输入装置,包括:
124.接收模块11,用于接收用户在空白输入框输入的第一目标首字母;
125.获取模块12,用于获取预存的所有候选文本,基于所述第一目标首字母,从所述候选文本中筛选出第一目标候选文本;其中,所述第一目标候选文本的首字对应拼音的首字母与所述第一目标首字母一致;
126.确定模块13,用于获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母,并计算每个所述下一个第一目标首字母在所述历史输入记录中出现的频率;
127.比对模块14,用于将每个所述下一个第一目标首字母与所述第一目标候选文本进行比对,从所述第一目标候选文本中筛选出第二目标候选文本;其中,所述第二目标候选文本的第二个字对应拼音的首字母与其中一个所述下一个第一目标首字母一致;
128.所述获取模块12,还用于获取每个所述第二目标候选文本中每个字对应的首字母,得到每个所述第二目标候选文本的首字母串;
129.筛选模块15,用于筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本;
130.计算模块16,用于计算所述第三目标候选文本的相邻首字母的对数,根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率;其中,所述第三目标候选文本衰减后的频率与所述对数成反比;
131.排序模块17,用于按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,获取排在前m位的所述第二目标候选文本,得到待推荐目标候选文本;其中,所述m为正整数;
132.显示模块18,用于将所述待推荐目标候选文本在所述空白输入框的上方进行显示。
133.该空白输入框可以是用户未输入任何内容的聊天输入框,当检测到用户在聊天界面的空白输入框输入简拼时,接收用户在空白输入框输入的第一目标首字母。
134.其中,为了兼容错别字或者口语问题,本技术支持首字母简拼,可使用隐马尔科夫链,用于穷举候选文本中首字母可能组合,且可根据频率公式推算出,下一个首字母的可能组合频率。
135.具体的,根据用户在空白输入的首字母来寻找第一目标候选文本,如“利息”,首字
母为“lx”,根据隐马尔科夫链的频率公式排序所有第一目标候选文本。其中,频率公式包括p(下一个拼音为i|客户输入首字母lx)=(客户输入首字母lx时,下一个拼音首字母为i的频数)/客户输入首字母lx的所有文本集合。以此类推,算出每个第一目标候选文本占所有第一目标候选文本的频率,按照此频率对所有第一目标候选文本进行排序,得到排序结果,并根据所述排序结果将所述第一目标候选文本在空白输入框的上方进行显示。
136.在一实施例中,还可设置一定阈值,如将该阈值设定为0.5,所有第一目标候选文本中,频率超过所述阈值的第一目标候选文本进行保留,并将此频率记录为p(p),以此为第一优先级排序索引排序,依照第一优先级排序对保留的第一目标候选文本进行排序,以筛选出用户想要的第一目标候选文本,提高推荐精确度。
137.此外,还可在第一目标候选文本的拼音的首字母的基础上进行汉字检索推荐,如利息,作为2_gram,在所有第一目标候选文本中进行首字母完全匹配,设置数值p(h)作为排序依据,如果第一目标候选文本与用户在空白输入框输入的所有首字母完全匹配,则将该第一目标候选文本优先排在前列,如完全匹配表示为p(h)=+1,如没有完全匹配上则表示为p(h)=+0,以此为第二优先级排序索引排序,优先推荐完全匹配的第一目标候选文本,便于用户查找想要的结果。
138.当用户输入第一目标首字母时,则从当前的所有候选文本中筛选出首字的首字母与用户输入的第一目标首字母相同的候选文本,将其作为第一目标候选文本。其中,所述候选文本可以是该用户的输入热度排在前列的简拼所对应的文本。
139.本实施例获取用户在键盘输入字母时的历史输入记录,该键盘可以是实体键盘或虚拟键盘,该历史数据记录中包括每个字母输入的频率,上一个首字母与下一个首字母同时出现的频率,从而根据历史输入记录计算第一目标首字母关联的所有下一个第一目标首字母在历史输入记录中出现的频率,即获取第一目标首字母下一个可能要输入的首字母。
140.对每个下一个第一目标首字母与第一目标候选文本进行一一比对,具体是将每个下一个第一目标首字母与第一目标候选文本的第二个字对应拼音的首字母进行比对,筛选出第一目标候选文本中含有第一目标首字母及下一个第一目标首字母的第一目标候选文本,将其作为第二目标候选文本。例如,当首字母为w时,则第二目标候选文本可以是文字、文学、文本,首字母的下一个首字母分别是z、x、b,对应的频率可以是80%、70%、60%。
141.本实施例遍历每个第二目标候选文本中每个字对应的首字母,得到每个第二目标候选文本的首字母串,即该首字母串由第二目标候选文本中每个字对应的首字母组成。
142.然后判断每个首字母串的相邻首字母在键盘中的位置是否也存在相邻,并计算第三目标候选文本的相邻首字母的对数,根据对数对所述第三目标候选文本的频率进行衰减后作为第三目标候选文本的频率。其中,所述第三目标候选文本衰减后的频率与所述对数成反比。
143.例如,若第二目标候选文本为“文字一致”、“文学涵养”,则“文字一致”的首字母串为“wzyz”,由于每两个相邻的首字母“wz”、“zy”、“yz”在键盘中对应的位置并不相邻,则“文字一致”为不存在键盘相邻的首字母,标记为不存在相邻的第二目标候选文本,并将不存在相邻的“文字一致”的频率作为“文字一致”的目标频率;而“文学涵养”的首字母串为“wxhy”,由于每两个相邻的首字母中,“wx”、“xh”在键盘中对应的位置并不相邻,而“hy”在键盘中对应的位置相邻,则“文学涵养”为存在键盘相邻的首字母,标记为存在相邻的第二
目标候选文本,且相邻对数为一对,则根据所述对数对“文学涵养”的频率进行衰减,得到目标频率,如将“文学涵养”的频率乘于0.9b,b为相邻的对数,得到“文学涵养”的目标频率。由于在键盘相邻的两个相邻首字母,一般是用户容易输入错误的字母,如用户在输入时,手指之间容易触碰到两个在键盘相邻的字母,因此本技术通过对存在键盘相邻的两个相邻首字母的第二目标候选文本的频率进行衰减,得到目标频率。
144.本实施例基于频率对第二目标候选文本进行排序,得到排序结果。其中,对于相邻首字母但在键盘中的位置不存在相邻的第二目标候选文本,则无需衰减,采用原来的频率进行排序;而对于相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,则采用衰减后的频率进行排序,然后根据排序结果将第二目标候选文本在空白输入框的上方进行显示,以减少可能存在输入错误的第二目标候选文本,使显示的第二目标候选文本更符合用户期望得到的候选文本。
145.如上所述,可以理解地,本技术中提出的所述拼音输入装置的各组成部分可以实现如上所述拼音输入方法任一项的功能,具体结构不再赘述。
146.参照图3,本技术实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储候选文本、历史输入记录等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种拼音输入方法。
147.上述处理器执行上述的拼音输入方法,包括:
148.接收用户在空白输入框输入的第一目标首字母;
149.获取预存的所有候选文本,基于所述第一目标首字母,从所述候选文本中筛选出第一目标候选文本;其中,所述第一目标候选文本的首字对应拼音的首字母与所述第一目标首字母一致;
150.获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母,并计算每个所述下一个第一目标首字母在所述历史输入记录中出现的频率;
151.将每个所述下一个第一目标首字母与所述第一目标候选文本进行比对,从所述第一目标候选文本中筛选出第二目标候选文本;其中,所述第二目标候选文本的第二个字对应拼音的首字母与其中一个所述下一个第一目标首字母一致;
152.获取每个所述第二目标候选文本中每个字对应的首字母,得到每个所述第二目标候选文本的首字母串;
153.筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本;
154.计算所述第三目标候选文本的相邻首字母的对数,根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率;其中,所述第三目标候选文本衰减后的频率与所述对数成反比;
155.按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,获取排在前m
位的所述第二目标候选文本,得到待推荐目标候选文本;其中,所述m为正整数;
156.将所述待推荐目标候选文本在所述空白输入框的上方进行显示。
157.本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种拼音输入方法,包括步骤:
158.接收用户在空白输入框输入的第一目标首字母;
159.获取预存的所有候选文本,基于所述第一目标首字母,从所述候选文本中筛选出第一目标候选文本;其中,所述第一目标候选文本的首字对应拼音的首字母与所述第一目标首字母一致;
160.获取所述用户在键盘输入时的历史输入记录,根据所述历史输入记录确定所述第一目标首字母关联的所有下一个第一目标首字母,并计算每个所述下一个第一目标首字母在所述历史输入记录中出现的频率;
161.将每个所述下一个第一目标首字母与所述第一目标候选文本进行比对,从所述第一目标候选文本中筛选出第二目标候选文本;其中,所述第二目标候选文本的第二个字对应拼音的首字母与其中一个所述下一个第一目标首字母一致;
162.获取每个所述第二目标候选文本中每个字对应的首字母,得到每个所述第二目标候选文本的首字母串;
163.筛选出每个所述首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本;
164.计算所述第三目标候选文本的相邻首字母的对数,根据所述对数对所述第三目标候选文本的频率进行衰减后作为所述第三目标候选文本的频率;其中,所述第三目标候选文本衰减后的频率与所述对数成反比;
165.按照所述频率从高到低的顺序对所述第二目标候选文本进行排序,获取排在前m位的所述第二目标候选文本,得到待推荐目标候选文本;其中,所述m为正整数;
166.将所述待推荐目标候选文本在所述空白输入框的上方进行显示。
167.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
168.综上所述,本技术的最大有益效果在于:
169.本技术所提供的一种拼音输入方法、装置、计算机设备及存储介质,当接收到用户在空白输入框输入的第一目标首字母时,基于该第一目标首字母从候选文本中筛选出对应的第一目标候选文本,并根据历史输入记录确定第一目标首字母关联的所有下一个第一目标首字母及其频率,将每个下一个第一目标首字母与第一目标候选文本进行比对,筛选出
第二目标候选文本,以得到含有用户下一个可能要输入的字的文本,然后获取每个第二目标候选文本中每个字对应的首字母,得到每个第二目标候选文本的首字母串,筛选出每个首字母串的相邻首字母在键盘中的位置也存在相邻的第二目标候选文本,得到第三目标候选文本,以得到用户在打字时可能误触键盘导致的输入错误的第三目标候选文本,并对第三目标候选文本的频率根据相邻首字母的对数进行衰减作为第三目标候选文本的频率,最后按照频率从高到低的顺序对第二目标候选文本进行排序,筛选出排在前m位的第二目标候选文本作为待推荐目标候选文本,并显示在空白输入框的上方,以减少可能存在输入错误的第二目标候选文本的推荐,使显示的第二目标候选文本更符合用户期望得到的文本,提高推荐的精确度。
170.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
171.以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1