建立油气田领域项目案例知识图谱、案例检索方法及装置与流程

文档序号:34075414发布日期:2023-05-06 21:52阅读:25来源:国知局
建立油气田领域项目案例知识图谱、案例检索方法及装置与流程

本发明涉及知识图谱,特别涉及一种建立油气田领域项目案例知识图谱方法、油气田领域项目案例的检索方法及装置。


背景技术:

1、目前随着知识图谱技术的兴起,在石油石化行业,国际石油企业如shell、bp、statoil、chevron等都引入并实施以知识图谱为中心的知识管理项目,来提高企业的生产效率,并从这些知识管理的项目中得到了较大的收益。

2、以节能项目为例,国内各个油气田企业内部积累了大量的节能技改措施,缺乏整体地、有效地分享,节能节水技术管理较为零散,油气田企业在节能改造项目的过程中关联技术推荐较弱,未能对各类节能技改措施项目实施过程中的知识进行沉淀积累和复用,同时,相关学术研究也缺乏油气田节能技术案例推荐技术研究。除了节能项目,在该行业的其他项目领域,也存在类似的问题,缺少方便、可靠的技术手段来帮助油气田企业检索、推送适用的案例,以促进生产效率提高和节能降耗。


技术实现思路

1、鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种建立油气田领域项目案例知识图谱方法、油气田领域项目案例的检索方法及装置,以帮助油气田企业检索、推送项目适用的案例,促进油气田企业的生产效率提高和节能降耗。

2、第一方面,本发明实施例提供一种建立油气田领域项目案例知识图谱的方法,包括:

3、搜集油气田领域目标项目相关的各案例的文本;

4、对目标项目的案例的文本内容进行分词处理,并将分词处理后得到的各个第一分词,分别划归于预设的多个分类维度中;所述分类维度包括下述任一项或多项的组合:文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型;

5、根据分类的结果创建所述油气田领域项目案例的知识图谱,所述知识图谱中的每个实体,分别与所述分类维度对应。

6、对目标项目的案例的文本内容进行分词处理之后,还包括:

7、剔除各个第一分词中的停用词和/或无意义词。

8、在一个实施例中,将分词处理后得到的各个第一分词,分别划归预设的多个分类维度中,包括:

9、对剔除停用词和/或无意义词后的各第一分词进行语义识别,根据语义,将各第一分词划归预设的多个分类维度中。

10、在一个实施例中,根据分类的结果创建所述油气田领域项目案例的知识图谱,包括:

11、遍历所搜集的案例的文本,针对每个案例的文本,将分词处理得到的各个第一分词,按照其所属的分类维度,分别创建知识图谱中对应类别的实体节点;

12、根据文本的内容,在知识图谱中,分别创建文本题目类别的实体节点,与关键词项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型类别的各实体节点之间的关联关系。

13、第二方面,本发明实施例提供一种油气田领域项目案例的检索方法,包括:

14、获取用户至少一条搜索记录,并对所述搜索记录进行分词处理,得到各第二分词;

15、使用各第二分词,与预先建立的油气田领域项目案例知识图谱中各关键词类别的实体节点进行匹配,确定与所述各第二分词所匹配的关键词类别的实体节点;

16、在所述知识图谱中,查找所述关键词类别的实体节点相连的文本题目类别的实体节点;

17、根据所述知识图谱中所述文本题目类别的实体节点与其他类别的实体节点的关联关系,查找与所述文本题目类别的实体节点关联的一跳其他类型的实体节点;

18、查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点;

19、根据查找出来的文本题目类型的实体节点,将文本题目所对应的案例的文本作为检索结果进行推荐。

20、在一个实施例中,查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点之后,还包括:

21、去掉所述文本题目类型的实体节点中重复出现的实体节点。

22、第三方面,本发明实施例提供一种建立油气田领域项目案例知识图谱的装置,包括:

23、文本搜集模块,用于搜集油气田领域目标项目相关的各案例的文本;

24、分词模块,用于对目标项目的案例的文本内容进行分词处理;

25、分类模块,用于将分词处理后得到的各个第一分词,分别划归于预设的多个分类维度中;所述分类维度包括下述任一项或多项的组合:文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型;

26、知识图谱创建模块,用于根据分类的结果创建所述油气田领域项目案例的知识图谱,所述知识图谱中的每个实体,分别与所述分类维度对应。

27、在一个实施例中,知识图谱创建模块,具体用于遍历所搜集的案例的文本,针对每个案例的文本,将分词处理得到的各个第一分词,按照其所属的分类维度,分别创建知识图谱中对应类别的实体节点;根据文本的内容,在知识图谱中,分别创建文本题目类别的实体节点,与关键词项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型类别的各实体节点之间的关联关系。

28、第四方面,本发明实施例提供一种油气田领域项目案例的检索装置,包括:

29、获取模块,用于获取用户至少一条搜索记录,并对所述搜索记录进行分词处理,得到各第二分词;

30、匹配模块,用于使用各第二分词,与预先建立的油气田领域项目案例知识图谱中各关键词类别的实体节点进行匹配,确定与所述各第二分词所匹配的关键词类别的实体节点;

31、查找模块,用于在所述知识图谱中,查找所述关键词类别的实体节点相连的文本题目类别的实体节点;根据所述知识图谱中所述文本题目类别的实体节点与其他类别的实体节点的关联关系,查找与所述文本题目类别的实体节点关联的一跳其他类型的实体节点;查找与所述其他类型的实体节点存在直接关联关系的一跳文本题目类型的实体节点;

32、推荐模块,用于根据查找出来的文本题目类型的实体节点,将文本题目所对应的案例的文本作为检索结果进行推荐。

33、第五方面,本发明实施例提供一种服务器,所述服务器包括存储器和处理器;其中,所述存储器存储有计算机程序,所述程序被处理器执行时能够实现如前述的建立油气田领域项目案例知识图谱的方法或实现如前述的油气田领域项目案例的检索方法。

34、第六方面,本发明实施例提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由系统芯片的处理器执行时,使得处理器能够执行如权利要求1-4任一项所述的建立油气田领域项目案例知识图谱的方法或实现如权利要求5或6所述的油气田领域项目案例的检索方法。

35、本发明实施例提供的上述技术方案的有益效果至少包括:

36、本发明实施例提供的建立油气田领域项目案例知识图谱方法、油气田领域项目案例的检索方法及装置,利用预先建立的油气田领域项目案例的知识图谱,在该知识图谱中包含文本题目、关键词、项目实施主体标识、项目实施周期、应用层级、项目效益、项目投资、涉及的装置、涉及的工艺流程和能源类型等多个与项目各维度相关类别的实体节点,以充分挖掘各实例中各个分类维度下的分词之间的关联关系,在检索时,对用户的搜索记录进行分词,得到关键词,再利用知识图谱,查找与关键词实体节点关联的文本题目类型实体节点,并根据文本题目类型实体节点,再找到之关联的其他类型实体节点,通过其他类型实体节点再查找与之关联的文本题目实体节点,最终以查找到的文本题目的实体节点对应的实例文本作为推荐的结果,本发明实施例在案例推荐过程中,除了依托关键词匹配常用手段之外,还利用了项目实施主体(例如项目来源单位)、实施周期、应用层级、节能效益、项目投资、涉及节能装置、涉及工艺流程的维度,扩大了项目案例或实例的推荐范围,利用知识图谱的方式,也有效提升了项目案例的推送效果。

37、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

38、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1