本技术涉及人工智能领域,尤其是自然语言处理领域,具体涉及一种语义分析方法、装置及电子设备。
背景技术:
1、在人工智能领域,人机智能语音交互常用于各种场景中,比如机器人客服、智能音箱、智能电视等等。人机智能语音交互过程中,机器方针对用户所说的语言是否能够做到完整、准确地分析,决定了人机智能语音交互是否准确以及用户使用体验是否良好。因此,语义完整度分析是人机智能语音交互过程中重要的一环。
2、相关技术采用的语义完整度分析方法,通过关键词和规则匹配的方式,根据人工总结的关键词匹配来判断用户所说的语音是否表达完整。若没有匹配成功,则表明用户表达完整,此时再根据接收到的语音信号给出对应的答复方案。此种方式过度依赖于人工总结的关键词,假设人工总结的关键词所表达的语义不够准确,容易存在人机交互过程中对用户所表达的意思产生误解,进而影响用户体验。
技术实现思路
1、有鉴于此,本技术实施例提供了一种语义分析方法、装置及电子设备,以解决现有的语义分析方法所存在的语义分析完整度较差的问题。
2、第一方面,本技术实施例提供了一种语义分析方法,所述方法包括:
3、获取用户输入的文本信号,将所述文本信号输入至目标语义分析模型中;
4、根据所述目标语义分析模型输出的语义完整度分类结果,确定目标分析结果;其中,所述目标语义分析模型预先通过如下方式训练得到:
5、利用预设训练样本数据对,对预设初始语义分析模型进行训练,以得到所述目标语义分析模型,其中,所述预设训练样本数据对至少包括:一条上文文本与一条所述上文文本对应的下文文本。
6、结合第一方面,在第二种可能的实施例中,所述预设训练样本数据对预先通过如下方式获得:
7、分别以上文文本、所述上文文本对应的下文文本构建特征向量对,以得到一组预设语料数据对;
8、根据所述上文文本和所述下文文本的完整程度,对所述预设语料数据对添加分类标签信息,以得到所述训练样本数据对,其中,所述分类标签信息值用于表征文本的完整程度。
9、结合第一方面的第二种可能的实施例,在第三种可能的实施例中,所述对预设初始语义分析模型进行训练,以得到目标语义分析模型,包括:
10、根据目标余弦相似度与所述分类标签信息值,构建目标损失函数,其中,所述目标余弦相似度为所述上文文本的上文特征向量与所述下文文本的下文特征向量之间的余弦相似度;
11、基于所述目标损失函数,利用预设梯度回传算法对所述预设初始语义分析模型的网络参数进行多次迭代更新;
12、若更新后的语义分析模型的损失值不再变化,则确定所述损失值不再变化的的语义分析模型为所述目标语义分析模型。
13、结合第一方面的第二种可能的实施例,在第四种可能的实施例中,所述方法还包括:
14、根据完整的下文文本以及所述完整的下文文本对应的上文文本,构建一组正预设语料数据对;
15、针对各目标正预设语料数据对,借助预设概率值,对所述目标正预设语料数据对中的下文文本进行截断,以获取目标截断后的下文文本;
16、基于所述目标截断后的下文文本以及所述完整的下文文本对应的上文文本,构建一组负预设语料数据对;
17、基于所述正预设语料数据对与所述负预设语料数据对,构建训练样本数据对集合。
18、结合第一方面,在第五种可能的实施例中,所述用户输入的文本信号为针对目标上文文本信号对应的下文文本信号,所述将所述文本信号输入至所述目标语义分析模型中,根据所述目标语义分析模型输出的语义完整度分类结果确定目标分析结果,包括:
19、基于所述目标上文文本信号、所述用户的下文文本信号构建特征向量对;
20、将所述特征向量对分别输入至所述目标语义分析模型,由所述目标语义分析模型计算所述特征向量对内两个特征向量之间的相似度;
21、若所述相似度大于预设相似度阈值,则确定所述用户输入的文本信号为完整的文本。
22、第二方面,本技术实施例提供了一种语义分析装置,所述装置包括:
23、获取模块,用于获取用户输入的文本信号,将所述文本信号输入至目标语义分析模型中;
24、分析模块,用于根据所述目标语义分析模型输出的语义完整度分类结果,确定目标分析结果;
25、训练模块,用于利用预设训练样本数据对,对预设初始语义分析模型进行训练,以得到所述目标语义分析模型,其中,所述预设训练样本数据对至少包括:一条上文文本与一条所述上文文本对应的下文文本。
26、结合第二方面,在第二种可能的实施例中,所述装置还包括:
27、样本数据处理模块,用于分别以上文文本、所述上文文本对应的下文文本构建特征向量对,以得到一组预设语料数据对;根据所述上文文本和所述下文文本的完整程度,对所述预设语料数据对添加分类标签信息,以得到所述训练样本数据对,其中,所述分类标签信息值用于表征文本的完整程度。
28、结合第二方面的第二种可能的实施例,在第三种可能的实施例中,所述训练模块,具体用于根据目标余弦相似度与所述分类标签信息值,构建目标损失函数,其中,所述目标余弦相似度为所述上文文本的上文特征向量与所述下文文本的下文特征向量之间的余弦相似度;基于所述目标损失函数,利用预设梯度回传算法对所述预设初始语义分析模型的网络参数进行多次迭代更新;若更新后的语义分析模型的损失值不再变化,则确定所述损失值不再变化的语义分析模型为所述目标语义分析模型。
29、结合第二方面的第二种可能的实施例,在第四种可能的实施例中,所述样本数据处理模块,还用于根据完整的下文文本以及所述完整的下文文本对应的上文文本,构建一组正预设语料数据对;针对各目标正预设语料数据对,借助预设概率值,对所述目标正预设语料数据对中的下文文本进行截断,以获取目标截断后的下文文本;基于所述目标截断后的下文文本以及所述完整的下文文本对应的上文文本,构建一组负预设语料数据对;基于所述正预设语料数据对与所述负预设语料数据对,构建训练样本数据对集合。
30、结合第二方面,在第五种可能的实施例中,所述用户输入的文本信号为针对目标上文文本信号对应的下文文本信号,所述分析模块具体用于:
31、基于所述目标上文文本信号、所述用户的下文文本信号构建特征向量对;
32、将所述特征向量对分别输入至所述目标语义分析模型,由所述目标语义分析模型计算所述特征向量对内两个特征向量之间的相似度;
33、若所述相似度大于预设相似度阈值,则确定所述用户输入的文本信号为完整的文本。
34、第三方面,本技术实施例提供了一种电子设备,所述电子设备包括:
35、处理器;以及
36、存储程序的存储器,
37、其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据第一方面任一所述的语义分析方法。
38、第四方面,本技术实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机根据第一方面任一所述的语义分析方法。
39、本技术实施例中提供的一个或多个技术方案,可以实现以下技术效果:
40、本技术实施例提供了一种语义分析方法、装置及电子设备,其中该方法通过预设的由至少一条上文文本与该上文文本对应的下文文本的训练样本对,对预设初始语义分析模型进行训练,以得到可以对上下文文本对进行语义分析的目标语义分析模型,在需要对用户输入的语句的完整度进行分析时,将用户输入的语句文本输入至该目标语义分析模型中,由该目标语义分析模型结合上下文关系,对该用户输入的语句文本的完整度进行分析,以输出完整度分类结果。选用本技术实施例,可在人机对话过程中,结合机器人表达的上文文本与用户输入对应的下文文本,对用户输入的语句的完整度进行判断,进而使得人机交互过程中,机器人对用户表达的意思进行精准理解,有效保障了用户的使用体验。