本发明涉及语义识别,具体涉及一种融合用户特征的语义理解方法、装置及电子设备。
背景技术:
1、目前,语义理解作为nlp(natural language processing,即自然语言处理)领域中的一个重要能力分支。目前在各种人机对话系统中都得到了广泛的应用,如智能音箱、智能问答系统等。
2、针对从各类终端获取的用户输入,包括文本、语音等,转化为规范化的文本数据之后,进行语义理解,解析出用户的领域、意图及关键槽位,为用户提供相应的服务。
3、目前任务式对话系统中语义理解的一般实现方法可以分为两种:一是构建领域识别、意图识别及槽位识别三种识别任务联合的多任务联合模型,针对目标文本,同时识别出目标文本所属的领域、意图及包含的词槽。二是针对领域识别、意图识别及槽位识别三个任务分别构建识别模型,针对目标文本分别进行领域识别、意图识别及槽位识别。目前现有技术中普遍都只是宽泛地将用户特征结合至整个语音交互过程,为用户特供个性化的服务,没有考虑到在语义理解模块融入用户特征,实现针对不同用户的个性化语义理解服务。
4、经对现有技术分析,发现现有的技术实现方案存在如下的缺陷:
5、1、没有将用户特征融入语义理解过程中,实现个性化的语义理解能力。
6、2、识别资源的浪费。
7、3、用户划分粒度不精确,用户特征提取不符合实际业务场景。
8、4、没有结合内容热度进行语义理解。
技术实现思路
1、本发明实施例提供一种融合用户特征的语义理解方法、装置及电子设备,用以解决一般语义理解模型无法针对模糊文本输出一个准确的识别结果的技术问题。
2、第一方面,本发明实施例提供一种融合用户特征的语义理解方法,包括:
3、获取待处理文本,将待处理文本输入语义理解模型,基于语义理解模型对待处理文本进行第一次语义理解,得到初始语义理解结果;
4、根据初始语义理解结果判断是否需要进行第二次语义理解;
5、若确定需要进行第二次语义理解,则根据所述初始语义理解结果获取媒资信息,根据所述媒资信息获取媒资的内容热度特征和目标用户的用户特征;
6、将所述内容热度特征和所述用户特征输入语义理解模型进行处理,并结合所述初始语义理解结果得到最终语义理解结果。
7、在一个实施例中,所述将所述内容热度特征和所述用户特征输入语义理解模型进行处理,并结合所述初始语义理解结果得到最终语义理解结果,具体包括:将所述内容热度特征和所述用户特征输入语义理解模型,基于所述语义理解模型将所述内容热度特征和所述用户特征进行叠加,得到叠加后的偏置项;根据所述偏置项和所述初始语义理解结果中各个子任务的编码层的结果,得到最终语义理解结果。
8、在一个实施例中,所述根据初始语义理解结果判断是否需要进行第二次语义理解,具体包括:判断初始语义理解结果是否为预设意图且包括媒资信息,若是,则基于初始语义理解结果中的媒资信息,在媒资知识库中进行检索,得到检索结果;若检索结果表征初始语义理解中的槽位识别结果为模糊媒资,则确定需进行第二次语义理解。
9、在一个实施例中,所述根据所述媒资信息获取媒资的内容热度特征和目标用户的用户特征,具体包括:基于声纹识别,对待处理文本对应的语音进行识别,确定目标用户;查询得到初始语义理解中的槽位识别结果在不同领域的内容热度特征以及所述目标用户的用户特征。
10、在一个实施例中,所述各个子任务的解码层包括领域解码层、意图解码层和槽位解码层;所述根据所述偏置项和所述初始语义理解结果中各个子任务的编码层的结果,得到最终语义理解结果,具体包括:将所述偏置项输入语义理解模型,将所述偏置项和第一次语义理解时的领域解码层进行叠加得到新的领域解码层结果,根据所述新的领域解码层结果得到新的领域识别结果;根据新的领域识别结果生成对应领域的意图领域限制向量和槽位领域限制向量;将所述意图领域限制向量作用于所述意图解码层,将所述槽位领域限制向量作用于槽位解码层,得到最终语义理解结果。
11、在一个实施例中,所述根据初始语义理解结果判断是否需要进行第二次语义理解,具体包括:判断初始语义理解结果是否为预设意图且包括媒资信息,若确定初始语义理解结果为预设意图且包括媒资信息,则基于初始语义理解结果中的媒资信息,在媒资知识库中进行检索,得到检索结果;若检索结果表征初始语义理解中的槽位识别结果不是模糊媒资,则识别结束,输出识别结果;若确定初始语义理解结果不是预设意图或不包括媒资信息,则识别结束,输出识别结果。
12、第二方面,本发明实施例提供一种融合用户特征的语义理解装置,包括:
13、第一次语义理解模块,用于获取待处理文本,将待处理文本输入语义理解模型,基于语义理解模型对待处理文本进行第一次语义理解,得到初始语义理解结果;
14、判断模块,用于根据初始语义理解结果判断是否需要进行第二次语义理解;
15、第二次语义理解模块,用于若确定需要进行第二次语义理解,则根据所述初始语义理解结果获取媒资信息,根据所述媒资信息获取媒资的内容热度特征和目标用户的用户特征;将所述内容热度特征和所述用户特征输入语义理解模型进行处理,并结合所述初始语义理解结果得到最终语义理解结果。
16、第三方面,本发明实施例提供一种终端,包括存储器,收发机,处理器;
17、存储器,用于存储计算机程序;收发机,用于在所述处理器的控制下收发数据;处理器,用于读取所述存储器中的计算机程序并执行以下操作:
18、获取待处理文本,将待处理文本输入语义理解模型,基于语义理解模型对待处理文本进行第一次语义理解,得到初始语义理解结果;
19、根据初始语义理解结果判断是否需要进行第二次语义理解;
20、若确定需要进行第二次语义理解,则根据所述初始语义理解结果获取媒资信息,根据所述媒资信息获取媒资的内容热度特征和目标用户的用户特征;
21、将所述内容热度特征和所述用户特征输入语义理解模型进行处理,并结合所述初始语义理解结果得到最终语义理解结果。
22、第四方面,本发明实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的融合用户特征的语义理解方法的步骤。
23、第五方面,本发明实施例提供的一种非易失性存储介质,存储有计算机可执行指令,所述计算机可执行指令由处理器执行,以实现第一方面所述的融合用户特征的语义理解方法的步骤。
24、本发明实施例提供的一种融合用户特征的语义理解方法、装置及电子设备,通过结合用户声纹信息与用户历史行为,抽取用户特征,将其融入到语义理解模型中辅助进行用户文本的语义理解,解决了一般语义理解模型无法针对模糊文本输出一个准确的识别结果的问题,实现了针对不同用户千人千面的语义理解效果。同时,在语义理解模型中融入内容热度特征,当语义理解的结果中包含媒资信息(比如媒资内容名),且该媒资内容名对应多个领域时(如“三生三世”既是音乐又是视频),获取媒资的内容热度特征,将内容热度特征以偏置项的形式融入语义理解模型进行二次语义理解,获取最终结果,该方式使得模型的识别能够更加智能化,符合大部分用户追求热度的需求。