基于知识图谱的大语言模型训练方法与流程

文档序号：37023038发布日期：2024-02-09 13:17阅读：来源：国知局

技术特征：

1.基于知识图谱的大语言模型训练方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于知识图谱的大语言模型训练方法，其特征在于，所述基于不同数据源的数据构建知识图谱的方法为：

3.根据权利要求1所述的基于知识图谱的大语言模型训练方法，其特征在于，所述基于每个知识图谱上任意两个实体之间的属性信息以及两个实体对应实体节点的搜索路径向量确定实体知识关联性的方法为：

4.根据权利要求3所述的基于知识图谱的大语言模型训练方法，其特征在于，所述基于每个知识图谱中两个实体之间属性信息的差异确定两个实体之间的属性相似度的方法为：

5.根据权利要求1所述的基于知识图谱的大语言模型训练方法，其特征在于，所述采用聚类算法基于每个知识图谱的加权实体关联图获取每个知识图谱中实体对应实体节点的聚类结果的方法为：

6.根据权利要求1所述的基于知识图谱的大语言模型训练方法，其特征在于，所述基于两个知识图谱中两个实体的簇内距离向量以及两个实体所在子树的相似程度确定所述两个实体之间的实体嵌入距离的方法为：

7.根据权利要求1所述的基于知识图谱的大语言模型训练方法，其特征在于，所述采用图卷积神经网络基于任意两个知识图谱中实体之间的实体嵌入距离、实体的属性信息以及上下文信息获取两个知识图谱中实体的对齐结果的方法为：

8.根据权利要求1所述的基于知识图谱的大语言模型训练方法，其特征在于，所述基于所有知识图谱中实体的对齐结果完成面向知识问答的大语言模型的训练的方法为：

技术总结
本发明涉及数字数据处理技术领域，提出了基于知识图谱的大语言模型训练方法，包括：基于不同数据源的数据构建知识图谱；基于知识图谱中每个实体对应的搜索路径确定搜索路径向量；基于两个实体之间的属性信息以及搜索路径向量确定实体知识关联性；采用聚类算法基于加权实体关联图获取每个知识图谱对应实体节点的聚类结果；基于两个知识图谱中不同实体对应实体节点所在聚类结果上的结构差异确定实体嵌入距离；采用图卷积神经网络基于实体嵌入距离、实体的属性信息以及上下文信息获取实体的对齐结果；基于所有实体的对齐结果完成面向知识问答的大语言模型的训练。本发明通过知识图谱中实体关系的融合补全，降低原始数据中的语义歧义和噪声干扰。

技术研发人员：屠静,王亚,赵策,苏岳,万晶晶,李伟伟,颉彬,周勤民,张玥,雷媛媛,孙岩,潘亮亮,刘岩
受保护的技术使用者：卓世科技（海南）有限公司
技术研发日：
技术公布日：2024/2/8

完整全部详细技术资料下载

当前第2页1 2