信息推送方法、设备和介质与流程

文档序号:28129865发布日期:2021-12-22 16:22阅读:90来源:国知局
信息推送方法、设备和介质与流程

1.本技术涉及信息技术领域,尤其涉及一种信息推送方法、设备和介质。


背景技术:

2.在行车过程中,为了避免分散用户的注意力,利用车载语音助手实现人机语音交互以完成特定领域的任务,例如播放新闻、播放音乐、查询餐厅等。
3.目前大部分车载语音助手是被动地执行查询动作,当用户发出语音为播放新闻时,车载语音助手接收语音后根据语音信息进行查询,而后将查询结果反馈给用户。
4.但是针对同样的查询条件,用户获得的查询结果是相同的,无法为用户提供准确信息,导致用户的体验感较差。
5.另外,当前一般推荐方法是一个应用或者一个垂域用一个单独的模型,这样就会占用资源比较多,如果只用了一个模型准确度又不高。


技术实现要素:

6.本技术提供一种信息推送方法、设备和介质,用以为用户提供准确信息,提高用户的体验感。
7.第一方面,本技术提供一种信息推送方法,包括:获取待识别语音的当前特征信息,所述当前特征信息包括当前意图信息和当前命名实体信息;获取历史语音的历史特征信息,所述历史语音包括获取待识别语音前的多轮对话的语音,所述历史特征信息包括识别历史语音获得对应的历史意图信息和历史命名实体信息;将所述当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息,所述推送模型是通过用户的多组样本信息训练获得的,每组所述样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括所述多轮对话中进行的至少一个语音对应的特征信息;根据所述推送信息为所述用户进行信息推送。
8.可选的,将将所述当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息,包括:按照待识别语音以及历史语音中每一语音发生的时间先后顺序组合当前特征信息和历史特征信息获得融合特征信息,所述推送模型利用所述融合特征信息获得输出的推送信息。
9.可选的,在获取待识别语音的特征信息之前,所述方法还包括:获取用户的多组样本信息,每组所述样本信息包括多个样本语音信息;针对每个样本语音信息,获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息;
获取每个样本语音信息对应的参考推送信息;分别利用所述多组样本信息中的每个所述样本语音信息和所述样本语音信息对应的所述参考推送信息对模型进行多次训练,获得所述推送模型。
10.可选的,获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息,包括:为每个样本语音信息挑选一个随机特征信息,所述随机特征信息包括:一个随机意图信息和一个随机命名实体信息,所述随机特征信息与对应的样本语音信息的特征信息不同;获取所述一次多轮对话中每一语音对应的特征信息,按照每一语音发生的时间先后顺序组合对应的特征信息,获得第一组合特征信息;将随机特征信息拼接在所述第一组合特征信息的前面获得第二组合特征信息作为每个样本语音信息。
11.可选的,所述为每个样本语音信息挑选一个随机特征信息,具体包括:获取所述多组样本信息中所有的意图信息和命名实体信息;从所述所有的意图信息和命名实体信息中挑选一个意图信息和命名实体信息进行组合,获得一个随机特征信息;若获得的随机特征信息与对应的样本语音信息中的特征信息相同,则重新挑选,直至所述获得的随机特征信息与对应的样本语音信息中的特征信息不同。
12.可选的,所述获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息,具体包括:获取用户特征信息,其中用户特征信息包括用户的属性特征、历史场景特征和历史行为特征的至少一种;利用每个样本语音信息的第二组合特征信息以及用户特征信息进行融合获得第三组合特征信息作为所述每个样本语音信息。
13.可选的,所述根据所述推送信息为所述用户进行信息推送,具体包括:根据用户的特征信息对所述推送信息进行筛选,获得所述推送信息中的第一信息;对所述第一信息进行排序,从所述第一信息中提取预设排名内的第二信息;对所述第二信息进行重排,去除重复信息和已推送过的信息,获得第三信息;为所述用户推送所述第三信息。
14.可选的,所述用户的特征信息包括用户的属性特征信息;所述根据所述用户的特征信息对所述推送信息进行筛选,获得所述推送信息中的第一信息,具体包括:根据所述用户的属性特征信息对所述推送信息进行筛选,筛选出符合所述用户的属性特征信息的第一信息。
15.可选的,所述用户的特征信息包括用户的历史行为特征信息;所述根据用户的特征信息对所述推送信息进行筛选,获得所述推送信息中的第一信息,具体包括:从所述推送信息中筛选出符合所述用户的历史行为特征信息的第一预设信息;
分别计算所述推送信息中每个信息与所述第一预设信息的第一相似度,筛选出所述第一相似度大于第一预设相似度的第一信息;相应地,所述对所述第一信息进行排序,从所述第一信息中提取预设排名内的第二信息,具体包括:根据所述第一相似度对所述第一信息进行排序,提取预设排名内的第二信息。
16.可选的,所述用户的特征信息包括用户的历史行为特征信息;所述根据用户的特征信息对所述推送信息进行筛选,获得所述推送信息中的第一信息,具体包括:计算所述用户的历史行为特征信息与预设用户的历史行为特征信息的第二相似度,筛选出所述第二相似度大于第二预设相似度的目标用户;从所述推送信息中筛选出符合所述目标用户的历史行为特征信息以及所述用户的历史行为特征信息的第一信息;相应地,所述对所述第一信息进行排序,从所述第一信息中提取预设排名内的第二信息,具体包括:计算所述第一信息中的每个信息与符合所述用户的历史行为特征信息的推送信息的第三相似度;根据所述第三相似度对所述第一信息进行排序,提取预设排名内的第二信息。
17.第二方面,本技术提供一种推送模型的训练方法,包括:获取用户的多组样本信息,每组所述样本信息包括多个样本语音信息;针对每个样本语音信息,获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息;获取每个样本语音信息对应的参考推送信息;分别利用所述多组样本信息中的每个所述样本语音信息和所述样本语音信息对应的所述参考推送信息对模型进行多次训练,获得所述推送模型。
18.可选的,获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息,包括:为每个样本语音信息挑选一个随机特征信息,所述随机特征信息包括:一个随机意图信息和一个随机命名实体信息,所述随机特征信息与对应的样本语音信息的特征信息不同;获取所述一次多轮对话中每一语音对应的特征信息,按照每一语音发生的时间先后顺序组合对应的特征信息,获得第一组合特征信息;将随机特征信息拼接在所述第一组合特征信息的前面获得第二组合特征信息作为每个样本语音信息。
19.可选的,所述为每个样本语音信息挑选一个随机特征信息,具体包括:获取所述多组样本信息中所有的意图信息和命名实体信息;从所述所有的意图信息和命名实体信息中挑选一个意图信息和命名实体信息进行组合,获得一个随机特征信息;若获得的随机特征信息与对应的样本语音信息中的特征信息相同,则重新挑选,直至所述获得的随机特征信息与对应的样本语音信息中的特征信息不同。
20.可选的,所述获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息,具体包括:获取用户特征信息,其中用户特征信息包括用户的属性特征、历史场景特征和历史行为特征的至少一种;利用每个样本语音信息的第二组合特征信息以及用户特征信息进行融合获得第三组合特征信息作为所述每个样本语音信息。
21.第三方面,本技术提供一种信息推送装置,包括:第一获取模块,用于获取待识别语音的当前特征信息以及历史语音的历史特征信息,所述当前特征信息包括当前意图信息和当前命名实体信息,所述历史语音包括获取待识别语音前的多轮对话的语音,所述历史特征信息包括识别历史语音获得对应的历史意图信息和历史命名实体信息;第二获取模块,用于将所述当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息,所述推送模型是通过用户的多组样本信息训练获得的,每组所述样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括所述多轮对话中进行的至少一个语音对应的特征信息;推送模块,用于根据所述推送信息为所述用户进行信息推送。
22.第四方面,本技术提供一种推送模型的训练装置,包括:获取模块,用于获取用户的多组样本信息,每组所述样本信息包括多个样本语音信息,针对每个样本语音信息,获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息,以及获取每个样本语音信息对应的参考推送信息;训练模块,用于分别利用所述多组样本信息中的每个所述样本语音信息和所述样本语音信息对应的所述参考推送信息对模型进行多次训练,获得所述推送模型。
23.第五方面,本技术提供一种电子设备,包括:存储器和处理器;存储器用于存储指令;处理器用于调用存储器中的指令执行第一方面及第一方面任一种可能的设计中的信息推送方法或第二方面及第二方面任一种可能的设计中的推送模型的训练方法。
24.第六方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,当电子设备的至少一个处理器执行该计算机指令时,电子设备执行第一方面及第一方面任一种可能的设计中的信息推送方法或第二方面及第二方面任一种可能的设计中的推送模型的训练方法。
25.第七方面,本技术提供一种计算机程序产品,所述计算机程序产品包括计算机指令,当电子设备的至少一个处理器执行该计算机指令时,电子设备执行第一方面及第一方面任一种可能的设计中的信息推送方法或第二方面及第二方面任一种可能的设计中的推送模型的训练方法。
26.本技术提供的信息推送方法,获取待识别语音的当前特征信息,以及历史语音的历史特征信息,当前特征信息包括当前意图信息和当前命名实体信息,历史语音包括获取待识别语音前的多轮对话的语音,历史特征信息包括识别历史语音获得对应的历史意图信息和历史命名实体信息。将当前特征信息以及历史特征信息输入推送模型中,输出推送信息,根据推送信息为用户进行信息推送。由于推送模型是通过用户的多组样本信息训练获
得的,且每组样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息。因此,推送模型是根据多轮对话的意图信息和命名实体信息训练获得的,推送模型的准确度较高。因而,在将待识别语音的当前特征信息以及历史语音的历史特征信息输入推送模型后,能够为用户推送更为准确的信息,提高用户的体验感。
附图说明
27.为了更清楚地说明本技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
28.图1为本技术一实施例提供的一种信息推送方法的流程图;图2为本技术一实施例提供的一种信息推送方法的流程图;图3为本技术一实施例提供的一种信息推送方法的流程图;图4为本技术一实施例提供的一种推送模型的训练方法的流程图;图5为本技术一实施例提供的信息推送装置的结构示意图;图6为本技术一实施例提供的推送模型的训练装置的结构示意图;图7为本技术一实施例提供的电子设备的硬件结构示意图。
具体实施方式
29.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术中的附图,对本技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
30.目前大部分车载语音助手是被动地执行查询动作,当用户发出语音为播放新闻时,车载语音助手接收语音后根据语音信息进行查询,而后将查询结果反馈给用户。但是针对同样的查询条件,用户获得的查询结果是相同的,无法为用户提供准确信息,导致用户的体验感较差。
31.针对上述问题,本技术提出了一种信息推送方法,获取待识别语音的当前特征信息,以及历史语音的历史特征信息,将当前特征信息以及历史特征信息输入推送模型中,输出推送信息,根据推送信息为用户进行信息推送。由于推送模型是通过用户的多组样本信息训练获得的,且每组样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息。因此,推送模型是根据多轮对话的意图信息和命名实体信息训练获得的,推送模型的准确度较高。因而,在将待识别语音的当前特征信息以及历史语音的历史特征信息输入推送模型后,能够为用户推送更为准确的信息,提高用户的体验感。
32.下面以具体地实施例对本技术的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
33.服务器获取用户的多组样本信息,每组样本信息包括多个样本语音信息,每个样
本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息,每个特征信息包括意图信息和命名实体信息。而后,服务器分别利用每组样本信息对模型进行多次训练,获得推送模型。并将获得的待识别语音的当前特征信息以及历史语音的历史特征信息输入推送模型中,输出推送信息。在获得推送模型输出的推送信息之后,服务器根据推送信息为用户进行信息推送。
34.图1示出了本技术一实施例提供的一种信息推送方法的流程图。本实施例的方法可以包括如下步骤:s101、获取待识别语音的当前特征信息以及历史语音的历史特征信息。
35.特征信息包括识别语音获得意图信息和命名实体信息。待识别语音的当前特征信息包括待识别语音的意图信息和命名实体信息。例如待识别语音为“放一首刘德华的歌”,待识别语音的意图信息为“播放音乐”,命名实体信息为“刘德华”,实体类型为歌手。例如待识别语音为“今天的体育新闻”,则待识别语音的意图信息为“播放新闻”,命名实体信息为“体育”,实体类型为“体育新闻”。
36.历史语音为在多轮对话中发生在待识别语音之前的对话的语音,多轮对话的语音能够结合用户待识别语音之前的多个信息,更准确的获取待识别语音的特征信息,一轮对话可以包括多个语音,一个语音例如可以包括一句话,多轮对话可以包括通过人机交互进行的几组对话。
37.历史语音的历史特征信息包括识别历史语音获得的对应的历史意图信息和历史命名实体信息。例如,历史语音为“帮我找个好吃的中餐馆”,则历史语音的历史意图信息为“查找餐馆”,历史语音的命名实体信息为“好吃的中餐馆”,实体类型为“餐厅”,“好吃的”可以理解为评分较高的。
38.本实施例中,可以利用神经网络分类模型识待识别语音的当前意图信息以及历史语音的历史意图信息,利用ner(named entity recognition,命名实体识别)模型识别待识别语音的当前命名实体信息以及历史语音的历史命名实体信息。
39.s102、将当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息。
40.推送模型是根据用户的多组样本信息训练获得的,利用一组样本信息对模型进行一次训练,多组样本信息对待训练的推送模型进行多次训练,从而获得推送模型。每组样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息。每组样本信息包括一次多轮对话,则多组样本信息包括多次多轮对话,一次多轮对话包括多个语音,多个语音中至少有一个语音具有可识别的特征信息。例如一次多轮对话为“用户:帮我找个好吃的餐馆;车载语音助手:中餐还是西餐;用户:中餐;”,则多轮对话中具有的特征信息包括的意图信息为“查询餐馆”,命名实体信息为“好吃的中餐馆”。
41.将待识别语音的当前特征信息以及历史语音的历史特征信息输入推送模型中,推送模型根据当前特征信息以及历史特征信息输出推送信息。具体的,按照待识别语音以及历史语音中每一语音(即待识别语音前的多轮对话的语音)发生的时间先后顺序组合当前特征信息和历史特征信息获得融合特征信息,所述推送模型利用所述融合特征信息获得输出的推送信息。由于结合多轮对话中的特征信息对模型进行训练,使得获得的推送模型能
够结合用户的多轮对话为用户推送信息,提高推送信息的准确度。
42.s103、根据推送信息为用户进行信息推送。
43.根据推送模型获得的推送信息可能是海量数据,需要对海量数据进行筛选,提取小部分信息推送给用户。具体的,可以通过召回、排序和重排的方式筛选出小部分信息。召回是指进行粗略的筛选,过滤掉大部分数据,留下用户感兴趣的上百条数据等。例如根据用户的属性、历史行为特征以及数据热度、流行度等进行筛选。排序是指对召回的数据进行排序,挑选符合用户的属性特征、行为特征、场景特征、物品特征等的信息。重排是指对预设排名内的信息再次进行筛选,避免将重复的信息或者已经推送过的信息或者与已经推送过的信息相似的信息或者同一类型的信息推送给用户。
44.本技术提供的信息推送方法,将待识别语音的当前特征信息以及历史特征信息输入推送模型中,输出推送信息,根据推送信息为用户进行信息推送。由于推送模型是通过用户的多组样本信息训练获得的,且每组样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息,多个样本语音样本的意图信息为同一个垂域下的意图,对应一个任务。因此,推送模型是根据多轮对话的意图信息和命名实体信息训练获得的,推送模型的在粗筛中就可以获得较高的准确度,减少排序、重排的计算量。因而,在将待识别语音的当前特征信息以及历史语音的历史特征信息输入推送模型后,能够为用户推送更为准确的信息,提高用户的体验感。
45.图2示出了本技术一实施例提供的一种信息推送方法的流程图。本实施例的方法对样本进行训练获得推送模型,可以包括如下步骤:s201、获取用户的多组样本信息,每组样本信息包括多个样本语音信息。
46.获取用户的多组样本信息,每组样本信息包括多个样本语音信息,每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息,语音对应的特征信息包括语音的意图信息和命名实体信息。例如一组样本语音信息中的多轮对话为“用户:播放音乐;车载语音助手:中文歌曲还是英文歌曲;用户:中文歌曲”,则一个样本语音信息即多轮对话中进行的语音包括的特征信息为:意图信息为“音乐”,命名实体信息为“中文歌曲”。如果再此基础上继续进行多轮对话“车载语音助手:播放哪个歌手的歌;用户:放刘德华的歌”,则可形成另一个样本语音信息,该样本语音信息中包括第一轮对话的特征信息,即包括的特征信息为:意图信息“音乐”,对应的命名实体信息为“中文歌曲”,第二轮对话的特征信息,意图信息“音乐”,命名实体信息“歌手”。
47.参考表1所示,一组样本信息包括四个样本语音信息,记为样本1、样本2、样本3和样本4,每个样本语音信息包括一个当前特性信息,每个样本语音信息可以包括一个或多个历史特征信息,也可以不包括历史特征信息,当前特征信息以及每个历史特征信息具有对应的意图和词槽,词槽即命名实体。即每个样本可以包括一个或多个特征信息。样本1包括当前特征信息1,不包括历史特征信息,当前特征信息1包括意图1和词槽1。样本2包括当前特征信息1以及历史特征信息2,当前特征信息包括意图2和词槽2,历史特征信息2包括意图1和词槽1。样本3包括当前特征信息1、历史特征信息2以及历史特征信息3,当前特征信息1包括意图3和词槽3,历史特征信息2包括意图2和词槽2,历史特征信息3包括意图1和词槽1。样本4包括当前特征信息1、历史特征信息2、历史特征信息3以及历史特征信息4,当前特征信息1包括意图4和词槽4,历史特征信息2包括意图3和词槽3,历史特征信息3包括意图2和
词槽2,历史特征信息4包括意图2和词槽1。
48.表1s202、针对每一样本语音信息,获取每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息。
49.每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息。可以理解的是,一次多轮对话包括多个语音,多个语音中至少有一个语音具有对应的特征信息,例如多个语音中的一个语音可识别获得至少一个意图信息和/或至少一个命名实体信息,或者多个语音中的一个语音包括意图信息,另一个语音包括命名实体信息。
50.作为一种实现方式,为每个样本语音信息挑选一个随机特征信息,随机特征信息包括一个随机意图信息和一个随机命名实体信息,随机特征信息与对应的样本语音信息的特征信息不同。而后获取一次多轮对话中每一语音对应的特征信息,按照每一语音发生的时间先后顺序组合对应的特征信息,获取第一组合特征信息。可以理解的是,每一语音对应的特征信息可以包括意图信息或命名实体信息,也可以包括意图信息和命名实体信息。随后,将随机特征信息拼接在第一组合特征信息的前面获得第二组合特征信息,作为每个样本语音信息。将随机特征信息与样本语音信息中的特征信息进行组合共同对模型进行训练,以在模型训练过程中加入干扰特征,增加模型的容错性和鲁棒性。而且将随机特征信息放在时间节点的第一个位置,代表时间顺序上最早,使得随机特征信息对模型的影响稍微小一点。
51.参考表2所示,一组样本信息包括四组样本语音信息,记为样本1、样本2、样本3和样本4,每个样本语音信息具有对应的随机特征信息。样本1具有随机特征1,随机特征1与样本1中的当前特征信息1不同,即随机特征1不会为意图1

词槽1。样本2具有随机特征2,随机特征2与样本2中的当前特征信息2以及历史特征信息2均不相同,即随机特征2不会为意图
2

词槽2,也不会为意图1

词槽1。样本3具有随机特征3,随机特征3与样本3中的当前特征信息1、历史特征信息2以及历史特征信息3均不相同,即随机特征3不会为意图3

词槽3,也不会为意图2

词槽2,也不会为意图1

词槽1。样本4具有随机特征4,随机特征4与样本4中的当前特征信息1、历史特征信息2、历史特征信息3以及历史特征信息4均不相同,即随机特征4不会为意图4

词槽4,不会为意图3

词槽3,也不会为意图2

词槽2,也不会为意图1

词槽1。
52.表2例如,获取多组样本信息中的所有的意图信息和命名实体信息,从所有的意图信息中随机挑选一个意图信息,从所有的命名实体信息中随机挑选一个命名实体信息,将挑选的意图信息和命名实体信息作为随机特征信息。例如,多组样本的数量为三组,每组样本信息包括五个样本语音信息,每个样本语音信息包括三轮对话,三轮对话例如均包括两个特征信息,则每个样本语音信息包括两个特征信息,五个样本语音信息包括十个特征信息,三组样本信息包括三十个特征信息,即三组样本信息包括三十个意图信息和三十个命名实体信息。从三十个意图信息中随机挑选一个意图信息,从三十个个命名实体信息中挑选一个命名实体信息,将挑选的一个意图信息和一个命名实体信息作为一个随机特征信息。
53.例如,还可以在获取多组样本信息中的所有的意图信息和命名实体信息之后,对所有的意图信息和命名实体信息进行随机组合,也可以与多组样本信息的特征信息不相同
的特征信息进行随机组合,获得意图实体表,每一组合包括一个意图信息和一个命名实体信息,对每一个组合进行编号,即每一个组合具有一个标识。而后随机选择一个编号,从意图实体表中选择该编号对应的意图信息和实体信息,将该编号对应的意图信息和实体信息作为一个随机特征信息。
54.需要注意的是,在为每个样本语音信息选择随机特征信息时,需要将选择的随机特征信息与对应的样本语音信息的特征信息进行比较,若选择的随机特征信息与对应的样本语音信息的特征信息不同,则将该选择的随机特征信息作为对应的样本语音信息的随机特征信息。若选择的随机特征信息与对应的样本语音信息中的特征信息相同,则需要重新挑选,直至获得的随机特征信息与对应的样本语音信息中的特征信息不同。
55.作为另一种实现方式,还可以获取用户的特征信息,用户特征信息包括用户的属性特征、历史场景特征和历史行为特征中的至少一种。获取用户的特征信息之后,利用每个样本语音信息的第二组合特征信息以及用户特征信息进行融合获得第三组合特征信息作为每个样本语音信息。
56.用户的属性特征包括:性别、年龄、户籍、学历、职业、爱好、身高、体重、性格中的一个或多个。历史场景特征包括:历史时间和/或历史地点。历史行为特征包括:历史行为记录,历史行为记录可以包括多个领域的行为记录,例如新闻领域:收听过的新闻、切换掉的新闻、某个新闻的收听完整程度和时长、对新闻的评价等;例如食物领域:订餐记录、对食物的评价等。推送信息包括各个信息的标识和特征,即推送信息包括多个信息,每一信息具有对应的的标识和特征,特征例如为新闻特征、音乐特征或餐馆特征等。新闻特征可以包括新闻的内容、热度、标题、关键词等,音乐特征可以包括歌曲热度、风格、歌手、歌名等,餐馆特征可以包括餐馆类型、菜品、菜名等。
57.s203、获取每个样本语音信息对应的参考推送信息。
58.每个样本语音信息具有对应的参考推送信息,参考推送信息可以是根据意图信息确定的。例如意图信息为“播放音乐”,参考推送信息可以为所有的音乐。例如意图信息为“餐馆”,参考推送信息可以为用户所在城市的所有餐馆等。
59.s204、分别利用多组样本信息中的每个样本语音信息和样本语音信息对应的参考推送信息对模型进行多次训练,获得推送模型。
60.利用一组样本信息中的每个样本语音信息和每个样本语音信息对应的参考推送信息对模型进行一次训练,多组样本信息可以对模型进行多次训练,从而获得推送模型。
61.作为一种实现方式,可以将样本语音信息以及随机特征信息进行组合后对模型进行训练,以提高模型的容错能力。
62.作为另一种实现方式,可以将样本语音信息、随机特征信息以及用户的特征信息组合后对模型进行训练,以使得模型在输出推送信息时结合用户的特征信息,提高推送信息的准确性。
63.s205、获取待识别语音的当前特征信息以及历史语音的历史特征信息。
64.s206、将当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息。
65.s207、根据推送信息为用户进行信息推送。
66.其中,步骤s205与图1实施例中的步骤s101实现方式类似,步骤s206与图1实施例
中的步骤s102实现方式类似,步骤s207与图1实施例中的步骤s103实现方式类似,本实施例在处不再赘述。
67.本技术提供的信息推送方法,利用多组样本信息对模型进行训练,获得准确度较高的推荐模型,从而能够利用该推送模型为用户提供准确信息,提高用户的体验感。
68.图3示出了本技术一实施例提供的一种信息推送方法的流程图。本实施例的方法可以包括如下步骤:s301、获取待识别语音的当前特征信息以及历史语音的历史特征信息。
69.s302、将当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息。
70.s303、根据用户的特征信息对推送信息进行筛选,获得推送信息中的第一信息。
71.由于推送信息可能包括大量数据,需要对推送信息进行筛选,去除部分推送信息,留下用户感兴趣的第一信息。可以利用召回算法根据用户的特征信息对推送信息进行筛选,获得推送信息中的第一信息,用户的特征信息包括属性特征信息、历史行为特征信息中的至少一种。
72.作为一种实现方式,可以采用基于内容的召回方式对推送信息进行筛选,基于内容的召回是将用户的属性特征与推送信息相结合的方式。具体的,根据用户的属性特征信息对推送信息进行筛选,筛选出符合用户的属性特征的第一信息,例如,用户的属性特征包括爱好,爱好为喜欢的歌星是刘德华,则可以去除与该属性特征不同的推送信息,只保留与用户的属性特征相同的推送信息,并将与用户的属性特征相同的推送信息作为第一信息。
73.作为另一种实现方式,可以采用协同过滤召回方式对推送信息进行筛选。协同过滤方式包括基于信息的协同过滤和基于用户的协同过滤。
74.基于信息的协同过滤可以包括,先从推送信息中筛选出符合用户的历史行为特征信息的第一预设信息。而后,分别计算推送信息中每个信息与第一预设信息的第一相似度,筛选出第一相似度大于第一预设相似度的第一信息。若第一预设信息包括一个信息,则分别计算推送信息中每个信息与一个信息的第一相似度。若第一预设信息包括多个信息,则分别计算多个信息中每个信息与推送信息中每个信息的第一相似度。
75.例如,历史行为特征信息包括历史行为记录,历史行为记录包括用户消费过物品a,从推送信息中筛选出符合物品a的第一预设信息,计算推送信息中各个信息与符合物品a的第一预设信息的第一相似度,比较各个第一相似度与第一预设相似度的大小,将第一相似度大于第一预设相似度的推送信息作为第一信息。
76.基于用户的协同过滤可以包括,先计算本用户的历史行为特征信息与预设用户的历史行为特征信息的第二相似度,预设用户例如可以为某数据库中的所有用户。而后,筛选出第二相似度大于第二预设相似度的目标用户,并从推送信息中筛选出符合目标用户的历史行为特征信息以及用户的历史行为特征信息的第二信息。
77.作为又一种实现方式,还可以在基于信息的协同过滤或基于用户的协同过滤选出部分信息后,再次利用热门度或流行度对该部分信息进行筛选,获得第一信息。热门度或流行度可以理解为点击量、播放量等。
78.s304、对第一信息进行排序,从第一信息中提取预设排名内的第二信息。
79.作为一种实现方式,在基于信息的协同过滤获得第一信息后,可以根据第一相似
度对第一信息进行排序,提取预设排名内的第二信息。
80.作为另一种实现方式,在基于用户的协同过滤获得第一信息后,可以计算第一信息中每个信息与符合本用户的历史特征信息的推送信息的第三相似度,根据第三相似度对第一信息进行排序,提取预设排名内的第二信息。
81.作为一种实现方式,还利用排序算法对第一信息进行排序,从第一信息中提取预设排名内的第二信息。排序算法包括:lr(logistic regression,逻辑回归)、gbdt (gradient boosting decision tree,梯度下降决策树)、wide(广义线性模型)以及deep(深度神经网络模型)中的至少一个。可以利用排序算法根据用户的特征信息对第一信息进行排序,例如可以利用逻辑回归算法对第一信息进行排序,可以利用逻辑回归算法和梯度下降决策树对第一信息进行排序,还可以利用广义现象模型和深度神经网络模型对第一信息进行排序。
82.逻辑回归算法是将用户的特征信息以及第一信息进行加权累计,通过sigmoid函数获得第一信息中每个信息的概率值, 而后可以根据各个信息的概率值由大到小进行排序,从排序结果中提取预设排名内的第二信息。
83.逻辑回归算法和梯度下降决策树是利用梯度下降决策树选择用户的特征信息中的部分信息,逻辑回归是将通过梯度决策树获得的部分信息与第一信息进行加权累计,通过sigmoid函数得到各个第一信息的概率值, 而后根据概率值由大到小进行排序,从排序结果中提取预设排名内的第二信息。
84.广义线性模型和深度神经网络模型是利用广义线性模型学习用户的特征信息,利用深度神经网络模型学习多轮对话的特征信息,从而获得与用户的特征信息以及多轮对话的特征信息等关联度更高的第二信息。
85.s305、对第二信息进行重排,去除重复信息和已推送过的信息,获得第三信息。
86.对第二信息进行重排,提取出重复的信息、属于同一类型的信息、已经推送过的信息,以及与已经推送过的信息相似度较高的信息,避免为用户推送重复的信息、同一类型的信息、已经推送过的信息,或者与已经推送过的信息相似度较高的信息等。
87.s306、为用户推送第三信息。
88.在对推荐模型输出的推送信息进行筛选、排序、重排后获得第三信息,将第三信息推送给用户。
89.本技术提供的信息推送方法,利用推送模型获得推送信息后,对推送信息继续一系列挑选后再对用户进行推送,从而使得对用户推送的信息更符合用户的需求,提高用户的体验感。
90.图4示出了本技术一实施例提供的一种推送模型的训练方法的流程图。本实施例的方法可以包括如下步骤:s401、获取用户的多组样本信息,每组样本信息包括一次多轮对话的多个样本语音信息。
91.多组样本信息中的每组样本信息包括多个样本语音信息,每个样本语音信息包括每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息,语音对应的特征信息包括语音的意图信息和命名实体信息。
92.s402、针对每一样本语音信息,获取每个样本语音信息包括一次多轮对话中进行
的至少一个语音对应的特征信息。
93.每个样本语音信息包括一次多轮对话中进行的至少一个语音对应的特征信息。可以理解的是,一次多轮对话包括多个语音,多个语音中至少有一个语音具有对应的特征信息,例如多个语音中的一个语音包括意图信息和命名实体信息,或者多个语音中的一个语音包括意图信息,另一个语音包括命名实体信息。所述样本语音信息包括多个应用领域相关的训练样本,比如推荐音乐、餐馆的样本,可将多个应用领域对应的特征信息组合成样本语音信息进行训练,获得的推荐模型就能实现使用一个推荐模型实现多个应用领域的推荐。
94.作为一种实现方式,为每个样本语音信息挑选一个随机特征信息,随机特征信息包括一个随机意图信息和一个随机命名实体信息,随机特征信息与对应的样本语音信息的特征信息不同。而后获取一次多轮对话中每一语音对应的特征信息,按照每一语音发生的时间先后顺序组合对应的特征信息,获取第一组合特征信息。随后,将随机特征信息拼接在第一组合特征信息的前面获得第二组合特征信息,作为每个样本语音信息。
95.例如,获取多组样本信息中的所有的意图信息和命名实体信息,从所有的意图信息中随机挑选一个意图信息,从所有的命名实体信息中随机挑选一个命名实体信息,将挑选的意图信息和命名实体信息作为随机特征信息。把随机特征信息作为可能存在的噪声信息,和样本中的语音特征信息一起训练,样本的语音特征信息可以包括不同应用领域的样本特征信息,因此可以仅仅使用一个推荐模型又不降低准确度。
96.需要注意的是,在为每个样本语音信息选择随机特征信息时,需要将选择的随机特征信息与对应的样本语音信息的特征信息进行比较,若选择的随机特征信息与对应的样本语音信息的特征信息不同,则将该选择的随机特征信息作为对应的样本语音信息的随机特征信息。若选择的随机特征信息与对应的样本语音信息中的特征信息相同,则需要重新挑选,直至获得的随机特征信息与对应的样本语音信息中的特征信息不同。
97.作为另一种实现方式,还可以获取用户的特征信息,用户特征信息包括用户的属性特征、历史场景特征和历史行为特征中的至少一种。获取用户的特征信息之后,利用每个样本语音信息的第二组合特征信息以及用户特征信息进行融合获得第三组合特征信息作为每个样本语音信息。
98.s403、获取每个样本语音信息对应的参考推送信息。
99.每个样本语音信息具有对应的参考推送信息,参考推送信息可以是根据意图信息确定的。例如意图信息为“播放音乐”,参考推送信息可以为所有的音乐。例如意图信息为“餐馆”,参考推送信息可以为用户所在城市的所有餐馆等。
100.s404、分别利用多组样本信息中的每个样本语音信息和样本语音信息对应的参考推送信息对模型进行多次训练,获得推送模型。
101.利用一组样本信息中的每个样本语音信息和每个样本语音信息对应的参考推送信息对模型进行一次训练,多组样本信息可以对模型进行多次训练,从而获得推送模型。
102.作为一种实现方式,可以将样本语音信息以及随机特征信息进行组合后对模型进行训练,以提高模型的容错能力。
103.作为另一种实现方式,可以将样本语音信息、随机特征信息以及用户的特征信息组合后对模型进行训练,以使得模型在输出推送信息时结合用户的特征信息,提高推送信
息的准确性。本技术提供的推送模型的训练方法,在模型训练的过程中结合多轮对话的特征信息,使得获得的推送模型具有更高的准确度,能够为用户提供准确信息。
104.图5示出了本技术一实施例提供的一种信息推送装置的结构示意图信息,如图5所示,本实施例的信息推送装置10用于实现上述任一方法实施例中对应于电子设备的操作,本实施例的信息装置10包括:第一获取模块11,用于获取待识别语音的当前特征信息以及历史语音的历史特征信息,当前特征信息包括当前意图信息和当前命名实体信息,历史语音包括获取待识别语音前的多轮对话的语音,历史特征信息包括识别历史语音获得对应的历史意图信息和历史命名实体信息;第二获取模块12,用于将当前特征信息以及历史特征信息输入推送模型中,根据当前特征信息和历史特征信息获得输出的推送信息,推送模型是通过用户的多组样本信息训练获得的,每组样本信息包括一次多轮对话的多个样本语音信息,每个样本语音信息包括所述多轮对话中进行的至少一个语音对应的特征信息。
105.推送模块13,用于根据推送信息为用户进行信息推送。
106.本技术实施例提供的信息推送装置10,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本实施例此处不再赘述。
107.图6示出了本技术一实施例提供的一种推送模型的训练装置的结构示意图信息,如图6所示,本实施例的信息推送装置20用于实现上述任一方法实施例中对应于电子设备的操作,本实施例的信息装置20包括:获取模块21,用户获获取用户的多组样本信息,每组样本信息包括一次多轮对话的多个样本语音信息,针对每个样本语音信息,获取每个样本语音信息包括多轮对话中进行的至少一个语音对应的特征信息,以及获取每一样本语音信息对应的参考推送信息;训练模块22,用于分别利用多组样本信息中的每个样本语音信息和样本语音信息对应的参考推送信息对模型进行多次训练,获得推送模型。
108.本技术实施例提供的信息推送装置20,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本实施例此处不再赘述。
109.图7示出了本技术实施例提供的一种电子设备的硬件结构示意图信息。如图7所示,该电子设备30,用于实现上述任一方法实施例中对应于电子设备的操作,本实施例的电子设备30可以包括:存储器31,处理器32和通信接口33。
110.存储器31,用于存储计算机指令。
111.处理器32,用于执行存储器存储的计算机指令,以实现上述实施例中的信息推送方法。具体可以参见前述方法实施例中的相关描述。
112.可选地,存储器31既可以是独立的,也可以跟处理器32集成在一起。
113.通信接口33,可以与处理器32连接。处理器32可以控制通信接口33来实现信息的接收和发送的功能。
114.本实施例提供的电子设备可用于执行上述的信息推送方法或推送模型的训练方法,其实现方式和技术效果类似,本实施例此处不再赘述。
115.本技术还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,计算机指令被处理器执行时用于实现上述的各种实施方式提供的方法。
116.本技术还提供一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。设备的至少一个处理器可以从计算机可读存储介质中读取该计算机指令,至少一个处理器执行该计算机指令使得设备实施上述的各种实施方式提供的方法。
117.本技术实施例还提供一种芯片,该芯片包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用并运行所述计算机指令,使得安装有所述芯片的设备执行如上各种可能的实施方式中所述的方法。
118.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制。尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1