一种基于知识图谱的自动化构建知识库的方法与流程

文档序号:37467436发布日期:2024-03-28 18:50阅读:14来源:国知局
一种基于知识图谱的自动化构建知识库的方法与流程

本发明涉及认知智能,具体涉及一种基于知识图谱的自动化构建知识库的方法。


背景技术:

1、知识图谱的概念是google于2012年正式提出,用于改善搜索的质量。知识图谱除了显示其他网站的链接列表,还提供结构化及详细的关于主题的信息。其目标是,用户将能够使用此功能提供的信息来解决他们查询的问题,而不必导航到其他网站并自己汇总信息。

2、结合公开(公告)号:cn114911893a,公开(公告)日:2022-08-16,公开一种基于知识图谱的自动化构建知识库的方法及系统。该方法包括:获取非结构化的数据,并对数据进行处理以形成训练集文件和预测集文件;图形化地构建知识图谱的schema,用于描述领域中实体与实体之间的关系;根据构建的schema对训练集文件中的实体进行标注;利用标注后的文件和以及预先建立的规则集文件,训练用于预测实体间关系的服务模型;将预测集文件输入训练完成的服务模型,执行预测任务,得到预测结果即实体-关系-实体的三元组数据;将服务模型的预测结果转换为知识图谱,并将知识图谱自动化地添加到知识库中。本发明能够实现知识图谱的自动化构建,为利用数据洞察隐藏的关键信息提供了极大的便利。

3、在包括上述专利的现有技术中,随着海量数据的出现以及多数据源融合交叉使用,传统的数据管理模式受到了一定的限制,相比传统数据库,自动化构建知识库方法的出现,实现了对知识的高效管理。而这些数据库由于功能比较相近或者词条比较相似,所以使用者需要通过输入大致的需求方向,获取相关的经验,但是由于输入多为模糊语义,所以推荐的词条是无法被有效的过滤,全部罗列出来,这又需要使用者不断改变词条从而缩小罗列项目以便于找到需要的目标词条。


技术实现思路

1、本发明的目的是提供一种基于知识图谱的自动化构建知识库的方法,用于解决上述问题。

2、为了实现上述目的,本发明提供如下技术方案:

3、一种基于知识图谱的自动化构建知识库的方法,包括以下步骤:

4、s01、输入词条,通过专家标注法对该词条中目标和关系进行归纳,形成目标和关系标引规则库;

5、s02、根据专家标注的规则和机器学习规则训练机器学习模型;

6、s03、利用训练好的所述机器学习模型,对所述词条进行预测标注和解析,以获取该目标相关关系下的知识图谱。

7、作为优选的,所述s01对所述词条中目标和关系进行归纳包括以下步骤:

8、s11、获取词条中多个成词的字符串成多个初始词条;

9、s12、获取连续时间段内输入的多个相似词条,并逐个对多个相似词条的每一个字符串对应于一个初始词条,所述多个初始词条是连续的多个输入结果;

10、s13、基于语义分析,逐个对所述多个初始词条进行分析,并给出多个相似的多个语义搜索词条。

11、作为优选的,所述s12中对连续时间段内输入的多个相似词条的获取是在所述词条记录在所述词库中的情况下,若所述词条没有被使用过的时间超过第一时间阈值,将所述词条从所述词库中删除并记录到所述缓存中;

12、若在所述词条记录在所述缓存中的情况下,若所述词条没有被使用过的时间超过第二时间阈值,则认定为新的检索的词条。

13、作为优选的,所述s01对词条中目标和关系进行归纳采用以下步骤:

14、s14、对多个语义搜索词条进行清洗,对所述语义搜索词条进行重新审查和校验,删除重复的数据后,使语义搜索词条归一;

15、s15、将归一后的所述语义搜索词条转化成txt格式,并分别生成机器学习规则训练须需要的训练集和预测集文件。

16、作为优选的,所述机器学习模型基于图形化地知识图谱的schema,所述schema可被拖拽。

17、作为优选的,所述机器学习模型训练时通过最大化对数似然函数来求解模型的最优参数。

18、作为优选的,所述专家标注的规则是通过基于密度的聚类算法,对词条中目标和关系利用求解模型的最优参数进行分类识别得到分类结果和各分类的位置坐标,根据所述分类结果和所述各分类的位置坐标进行聚类,计算每一个分类的概率均值、标准差以及方差。

19、在上述技术方案中,本发明提供的一种基于知识图谱的自动化构建知识库的方法,具备以下有益效果:利用连续个词条的检索,对多个词条进行分析仪获取最接近初始词条的语义,然后根据语义创建知识图谱,并反馈至使用者,从而在基于使用者自定义词条的基础上,智能修调在降低使用者输入词条次数的基础上,更快的找到需求的目标词条。



技术特征:

1.一种基于知识图谱的自动化构建知识库的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于知识图谱的自动化构建知识库的方法,其特征在于,所述s01对所述词条中目标和关系进行归纳包括以下步骤:

3.根据权利要求1所述的一种基于知识图谱的自动化构建知识库的方法,其特征在于,所述s12中对连续时间段内输入的多个相似词条的获取是在所述词条记录在所述词库中的情况下,若所述词条没有被使用过的时间超过第一时间阈值,将所述词条从所述词库中删除并记录到所述缓存中;

4.根据权利要求1所述的一种基于知识图谱的自动化构建知识库的方法,其特征在于,所述s01对词条中目标和关系进行归纳采用以下步骤:

5.根据权利要求1所述的一种基于知识图谱的自动化构建知识库的方法,其特征在于,所述机器学习模型基于图形化地知识图谱的schema,所述schema可被拖拽。

6.根据权利要求1所述的一种基于知识图谱的自动化构建知识库的方法,其特征在于,所述机器学习模型训练时通过最大化对数似然函数来求解模型的最优参数。

7.根据权利要求1所述的一种基于知识图谱的自动化构建知识库的方法,其特征在于,所述专家标注的规则是通过基于密度的聚类算法,对词条中目标和关系利用求解模型的最优参数进行分类识别得到分类结果和各分类的位置坐标,根据所述分类结果和所述各分类的位置坐标进行聚类,计算每一个分类的概率均值、标准差以及方差。

8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述基于局部方差和后验概率分类器的视觉定位方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述基于局部方差和后验概率分类器的视觉定位方法的步骤。


技术总结
本发明公开了一种基于知识图谱的自动化构建知识库的方法,包括以下步骤:S01、输入词条,通过专家标注法对该词条中目标和关系进行归纳,形成目标和关系标引规则库;S02、根据专家标注的规则和机器学习规则训练机器学习模型;S03、利用训练好的所述机器学习模型,对所述词条进行预测标注和解析,以获取该目标相关关系下的知识图谱。该发明提供的基于知识图谱的自动化构建知识库的方法,利用连续个词条的检索,对多个词条进行分析仪获取最接近初始词条的语义,然后根据语义创建知识图谱,并反馈至使用者,从而在基于使用者自定义词条的基础上,智能修调在降低使用者输入词条次数的基础上,更快的找到需求的目标词条。

技术研发人员:魏爽,夏天舒,谢满德
受保护的技术使用者:信雅达科技股份有限公司
技术研发日:
技术公布日:2024/3/27
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1