本发明涉及人机对话,尤其涉及一种对话内容生成方法、系统、存储介质及装置。
背景技术:
1、目前,随着人工智能技术的发展,各个行业都开始引入新的智能技术提高行业的服务体验。在人机对话场景下需要机器能够识别用户输入的问句,然后机器才能够进行回答。而多轮对话技术更为复杂,需要机器能够对多轮对话的上下文进行跟踪理解,并且回答的内容需要紧扣上下文。
2、但是,现有人机对话场景下的多轮对话技术,容易出现答非所问的情况,答案的准确度低。
技术实现思路
1、本发明的主要目的在于提供一种对话内容生成方法、系统、存储介质及装置,旨在解决现有人机对话场景下的多轮对话技术,容易出现答非所问的情况,答案的准确度低的技术问题。
2、为实现上述目的,本发明提供一种对话内容生成方法,所述对话内容生成方法包括以下步骤:
3、将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码;
4、对所述问句编码和所述知识图谱编码进行融合,获得融合结果;
5、基于融合结果生成所述对话问句对应的对话答案。
6、可选地,所述基于融合结果生成所述对话问句对应的对话答案的步骤,包括:
7、基于融合结果从所述预设领域数据库或所述对话问句中选取关键知识点;
8、根据所述关键知识点生成所述对话问句对应的对话答案。
9、可选地,所述将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码的步骤,包括:
10、通过双向lstm模型对对话问句进行知识编码,获得问句编码;
11、通过graph transformer算法模型对预设领域数据库中的实体关系数据进行知识编码,获得知识图谱编码。
12、可选地,所述将实体关系数据和对话问句分别进行知识编码,获得知识图谱编码和问句编码的步骤之前,还包括:
13、通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据;
14、基于所述实体关系数据构建预设领域数据库。
15、可选地,所述通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据的步骤之前,还包括:
16、对领域知识文本的实体和关系进行标注;
17、将标注后的领域知识文本划分为训练集、测试集以及验证集;
18、基于所述训练集、所述测试集以及所述验证集对初始关系抽取模型进行训练,获得预设关系抽取模型。
19、可选地,所述将标注后的领域知识文本划分为训练集、测试集以及验证集的步骤,包括:
20、对标注后的领域知识文本进行数据增强;
21、将增强后的领域知识文本划分为训练集、测试集以及验证集。
22、可选地,所述预设关系抽取模型包括:bertencoder模块、subjecttagger模块以及relation-specific object taggers模块。
23、此外,为实现上述目的,本发明还提出一种对话内容生成系统,所述对话内容生成系统包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的对话内容生成程序,所述对话内容生成程序配置为实现如上文所述的对话内容生成方法。
24、此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有对话内容生成程序,所述对话内容生成程序被处理器执行时实现如上文所述的对话内容生成方法。
25、此外,为实现上述目的,本发明还提出一种对话内容生成装置,所述对话内容生成装置包括:所述编码模块,用于将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码;
26、所述融合模块,用于对所述问句编码和所述知识图谱编码进行融合,获得融合结果;
27、所述生成模块,用于基于融合结果生成所述对话问句对应的对话答案。
28、在本发明中,公开了将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码,对问句编码和知识图谱编码进行融合,获得融合结果,基于融合结果生成对话问句对应的对话答案;由于本发明中,通过对预设领域数据库中的实体关系数据进行编码并融入对话问句中,避免了出现答非所问的情况,提升了对话答案的准确度。
1.一种对话内容生成方法,其特征在于,所述对话内容生成方法包括以下步骤:
2.如权利要求1所述的对话内容生成方法,其特征在于,所述基于融合结果生成所述对话问句对应的对话答案的步骤,包括:
3.如权利要求1所述的对话内容生成方法,其特征在于,所述将对话问句和预设领域数据库中的实体关系数据分别进行知识编码,获得问句编码和知识图谱编码的步骤,包括:
4.如权利要求1至3中任一项所述的对话内容生成方法,其特征在于,所述将实体关系数据和对话问句分别进行知识编码,获得知识图谱编码和问句编码的步骤之前,还包括:
5.如权利要求4所述的对话内容生成方法,其特征在于,所述通过预设关系抽取模型对领域知识文本进行实体关系抽取,获得实体关系数据的步骤之前,还包括:
6.如权利要求5所述的对话内容生成方法,其特征在于,所述将标注后的领域知识文本划分为训练集、测试集以及验证集的步骤,包括:
7.如权利要求5所述的对话内容生成方法,其特征在于,所述预设关系抽取模型包括:bertencoder模块、subjecttagger模块以及relation-specific object taggers模块。
8.一种对话内容生成系统,其特征在于,所述对话内容生成系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的对话内容生成程序,所述对话内容生成程序被所述处理器执行时实现如权利要求1至7中任一项所述的对话内容生成方法。
9.一种存储介质,其特征在于,所述存储介质上存储有对话内容生成程序,所述对话内容生成程序被处理器执行时实现如权利要求1至7中任一项所述的对话内容生成方法。
10.一种对话内容生成装置,其特征在于,所述对话内容生成装置包括:编码模块、融合模块以及生成模块;