本发明涉及知识图谱,尤其涉及一种基于图算法与文本搜索引擎的知识图谱系统。
背景技术:
1、知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法,是一种有向图结构,描述了现实世界中存在的实体、事件或者概念以及它们之间的相关关系。知识图谱的架构主要包括自身的逻辑结构以及体系架构,知识图谱在逻辑结构上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(第一实体,关系,第二实体)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的neo4j(图数据库)等。模式层构建在数据层之上,主要是通过本体库来规范数据层的一系列事实表达。知识图谱把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律。
2、在现有技术中,neo4j检索时仅可进行模糊匹配而不是基于语义相似度来匹配,这会降低检索召回率,导致neo4j的检索效率较低;传统的知识图谱在知识检索时直接使用结构化数据进行知识检索,导致检索效率和检索结果表现相对较差,部分传统的知识图谱使用了某个图计算算法辅助知识检索,但是该图计算算法在某些特定场景下检索表现不佳;传统的知识抽取方法需要定制知识抽取策略,在一定程度上降低了知识抽取的效率,另一方面,定制知识抽取策略、搭建知识抽取流程对操作人员来说存在一定的技术要求;在知识图谱内进行知识检索时需要构建检索范式,且不同场景下的检索范式会有所不同,缺乏针对场景定制化的检索范式管理。
技术实现思路
1、本发明的目的在于,提供一种基于图算法与文本搜索引擎的知识图谱系统,解决以上技术问题;
2、一种基于图算法与文本搜索引擎的知识图谱系统,包括,
3、图算法算子配置模块,基于图算法配置图算法算子,通过所述图算法算子生成查询语句,以进行知识检索;
4、知识检索模块,连接所述图算法算子配置模块,基于文本搜索引擎和图数据库对所述查询语句进行召回,以生成文本类数据;
5、知识抽取模块,连接所述知识检索模块,基于领域实体生成模型和结构化数据生成模型将所述文本类数据存入所述图数据库中,以进行知识抽取。
6、优选地,所述图算法算子的配置信息包括定时参数、算法参数、领域图谱、所述领域图谱的实体类别以及关系类别。
7、优选地,所述知识检索模块包括,
8、实体或关系属性约束召回单元,通过解析多跳查询,并基于所述文本搜索引擎召回候选实体或候选关系;
9、多跳结构约束召回单元,连接所述实体或关系属性约束召回单元,依据所述候选实体和所述候选关系生成图数据库查询语句,并通过所述图数据库查询语句从所述图数据库中召回候选路径;
10、候选路径排序单元,连接所述多跳结构约束召回单元,依据所述候选路径的匹配度进行排序;
11、编织文本类知识单元,连接所述候选路径排序单元,将所述匹配度最高的所述候选路径对应的实体关系填充至话术模板中,以输出所述文本类数据。
12、优选地,所述多跳查询包括多个所述查询语句。
13、优选地,所述领域实体生成模型从所述文本类数据中提取实体信息,基于定制化策略生成所述实体图算法算子的之间的关系,并转换为图数据格式,以存入所述图数据库中。
14、优选地,所述结构化数据生成模型将所述文本类数据转换成结构化数据,再将所述结构化数据转换为所述图数据格式存入所述图数据库中。
15、优选地,基于所述图算法算子的标识符获取所述图算法算子的属性标签和算子类型。
16、优选地,所述查询语句包括所述属性标签和所述算子类型。
17、优选地,所述定时参数用于设定所述图算法算子运行的时间间隔。
18、优选地,所述结构化数据包括实体和关系。
19、本发明的有益效果是:提高了检索效率,满足知识图谱在智能问答中知识检索的需求,支持不同场景的检索,降低了操作门槛,非专业技术人员也可以进行知识抽取操作。
1.一种基于图算法与文本搜索引擎的知识图谱系统,其特征在于,包括,
2.根据权利要求1所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述图算法算子的配置信息包括定时参数、算法参数、领域图谱、所述领域图谱的实体类别以及关系类别。
3.根据权利要求1所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述知识检索模块包括,
4.根据权利要求3所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述多跳查询包括多个所述查询语句。
5.根据权利要求1所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述领域实体生成模型从所述文本类数据中提取实体信息,基于定制化策略生成所述实体图算法算子的之间的关系,并转换为图数据格式,以存入所述图数据库中。
6.根据权利要求1所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述结构化数据生成模型将所述文本类数据转换成结构化数据,再将所述结构化数据转换为所述图数据格式存入所述图数据库中。
7.根据权利要求1所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,基于所述图算法算子的标识符获取所述图算法算子的属性标签和算子类型。
8.根据权利要求7所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述查询语句包括所述属性标签和所述算子类型。
9.根据权利要求2所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述定时参数用于设定所述图算法算子运行的时间间隔。
10.根据权利要求6所述的基于图算法与文本搜索引擎的知识图谱系统,其特征在于,所述结构化数据包括实体和关系。