一种知识图谱构建方法及装置与流程

文档序号:19155838发布日期:2019-11-16 00:45阅读:159来源:国知局
一种知识图谱构建方法及装置与流程

本说明书涉及计算机科学技术领域,特别涉及一种知识图谱构建方法、装置、计算设备及计算机可读存储介质。



背景技术:

随着互联网的发展,网络数据内容呈现爆炸式增长的态势,由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战,知识图谱(knowledgegraph)以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。目前典型的人物关系知识图谱主要以家庭关系、社交关系为基础,包含的父子、母子、朋友、搭档、情侣关系依旧职业社交图谱包含的工作、职位、技能等职业社交关系,然而,现有人物关系知识图谱中的人物关系大多是静态的,不能支持从时间维度和地域维度挖掘人物之间的深层关系。



技术实现要素:

有鉴于此,本说明书实施例提供了一种知识图谱构建方法、装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面,提供了一种知识图谱构建方法,包括:

确定至少一个目标人物和至少两个地域名称,获取所述至少一个目标人物中每个所述目标人物对应的人物履历数据;

从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息;

从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息;

基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱。

根据本说明书实施例的第二方面,提供了一种知识图谱构建装置,包括:

实体确定模块,被配置为确定至少一个目标人物和至少两个地域名称,获取所述至少一个目标人物中每个所述目标人物对应的人物履历数据;

第一特征标签获取模块,被配置为从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息;

第二特征标签获取模块,被配置为从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息;

知识图谱构建模块,被配置为基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱。

根据本说明书实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述知识图谱构建方法的步骤。

根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述知识图谱构建方法的步骤。

本申请通过对至少一个目标人物对应的人物履历数据中进行特征标签的提取,依托特征标签从多个维度映射出所述目标人物的社会关系,同时,通过从抽取特征标签对应的时间区间以及特征标签与地域名称的包含关系,使得本申请构建的知识图谱能够支持用户从时间维度和地域维度对目标人物之间的特定社会关系进行深度的挖掘,推理出特定目标人物之间在特定时间段或特定地域具有的社会关系,从而进一步挖掘隐含的知识并丰富扩展知识图谱。

附图说明

图1是本申请实施例提供的计算设备的结构框图;

图2是本申请实施例提供的知识图谱构建方法的流程图;

图3是本申请实施例提供的知识图谱构建方法的另一流程图;

图4是本申请实施例提供的知识图谱构建方法的另一流程图;

图5是本申请实施例提供的知识图谱构建方法的另一流程图;

图6是本申请实施例提供的知识图谱构建方法的另一流程图;

图7是本申请实施例提供的知识图谱的示意图;

图8是本申请实施例提供的知识图谱构建装置的结构示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先,对本发明一个或多个实施例涉及的名词术语进行解释。

知识图谱:本质上知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。

实体:指的是具有可区别性且独立存在的某种事物,如某一个人、某一个城市、某一种植物等、某一种商品等等,世界万物有具体事物组成,此指实体,例如“中国”、“美国”、“日本”等,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。

关系:不同实体之间的某种联系,比如人-“居住在”-北京、张三和李四是“朋友”、逻辑回归是深度学习的“先导知识”等等。

属性:从一个实体指向它的属性,不同的属性类型对应于不同类型属性的边,例如“面积”、“人口”、“首都”是几种不同的属性,属性值主要指对象指定属性的值,例如960万平方公里等。

在本申请中,提供了一种知识图谱构建方法、装置、计算设备及计算机可读存储介质,在下面的实施例中逐一进行详细说明。

图1示出了根据本说明书一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。

计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。

在本说明书的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。

计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备100还可以是移动式或静止式的服务器。

其中,处理器120可以执行图2所示方法中的步骤。图2是示出了根据本申请一实施例的知识图谱构建方法的示意性流程图,包括步骤202至步骤208。

步骤202:确定至少一个目标人物和至少两个地域名称,获取所述至少一个目标人物中每个所述目标人物对应的人物履历数据。

在本申请的实施例中,系统根据用户的请求或用户的需求确定知识图谱中需要包含的至少一个目标人物和至少两个地域名称,并从一些公开的半结构化、非结构化和第三方结构化数据库的数据中收集所述至少一个目标人物中每个所述目标人物对应的人物履历数据,在每个人物履历数据中包含有所述目标人物在某些维度能够映射出所述目标人物的社会关系的特征标签,例如某个目标人物在某些特定时间段的教育经历中所就读过的若干个院校,或者在某些特定时间段的工作经历就职过的若干个社会组织,所述至少两个地域名称包括由行政区域划分得到的多个不同层级的行政区域,例如xxx省、xxx市或xxx行政区等。

步骤204:从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息。

在本申请的实施例中,系统从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息,例如,所述第一特征标签可以是所述目标人物就读过的若干个院校,则所述第一特征标签存在的时间区间可以是所述目标人物在每个院校的学习时间,所述第一特征标签对应的特征信息可以是在每个院校的就读专业和取得的学历。

步骤206:从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息。

在本申请的实施例中,系统从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息,例如,所述第二特征标签可以是所述目标人物就职过的若干个组织机构,则所述第二特征标签对应的时间区间可以是所述目标人物在每个组织机构的工作时间,所述第二特征标签对应的特征信息可以是在每个组织机构的职位。

步骤208:基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱。

在本申请的实施例中,系统将每个目标人物,每个地域名称以及每个目标人物对应的第一特征标签和第二特征标签作为实体节点,以每个目标人物与其对应的第一特征标签和第二特征标签之间的特定联系以及每个地域名称与第一特征标签和第二特征标签的特定联系为关系,以所述时间区间和特征信息作为时间属性和其他属性,构建基于人物履历的知识图谱结构。

可选的,在基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱之后,还包括:

在将所述知识图谱存储至图数据库中。

在本申请的实施例中,系统将构建完成的知识图谱存储至图数据库中,例如neo4j图形数据库等。

本申请通过对至少一个目标人物对应的人物履历数据中进行特征标签的提取,依托特征标签从多个维度映射出所述目标人物的社会关系,同时,通过从抽取特征标签对应的时间区间以及特征标签与地域名称的包含关系,使得本申请构建的知识图谱能够支持用户从时间维度和地域维度对目标人物之间的特定社会关系进行深度的挖掘,推理出特定目标人物之间在特定时间段或特定地域具有的社会关系,从而进一步挖掘隐含的知识并丰富扩展知识图谱。

在本申请的一个实施例中,如图3所示,在确定至少一个目标人物和至少两个地域名称,获取所述至少一个目标人物中每个所述目标人物对应的人物履历数据之后,还包括步骤302至步骤306:

步骤302:根据预存的地域数据构建所述至少两个地域名称中每个所述地域名称之间的包含关系。

在本申请的实施例中,系统能够获取公开的地域数据并根据预存的地域数据构建每个所述地域名称之间的包含关系,从而表示出每个地域名称的层次,例如,xxx省包含有xxx市,xxx市包含有xxx行政区等等。

步骤304:基于所述第一特征标签对应的标签数据构建所述地域名称与所述第一特征标签之间的包含关系。

在本申请的实施例中,系统能够获取公开的所述第一特征标签对应的标签数据,并基于所述第一特征标签对应的标签数据构建所述地域名称与所述第一特征标签之间的包含关系,在所述第一特征标签为所述目标人物就读过的若干个院校的情况下,系统可以基于公开的院校数据构建地域名称与院校的包含关系,例如,xxx市包含xxx大学。

步骤306:基于所述第二特征标签对应的标签数据构建所述地域名称与所述第二特征标签之间的包含关系。

在本申请的实施例中,系统能够获取公开的所述第二特征标签对应的标签数据,并基于所述第二特征标签对应的标签数据构建所述地域名称与所述第二特征标签之间的包含关系,在所述第二特征标签为所述目标人物就职过的若干个组织机构的情况下,系统可以基于公开的组织机构数据构建地域名称与组织机构的包含关系,例如,xxx市包含xxx公司。

本申请通过基于各类公开的数据获取地域数据和特征标签对应的标签数据,并将地域数据分别与特征标签进行关联即建立包含关系,使得本申请的知识谱图具有从地域维度分析目标人的深层社会关系的能力。

在本申请的另一个实施例中,如图4所示,所述从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息包括步骤402至步骤406:

步骤402:基于所述第一特征标签对应的标签数据构建至少一个第一特征列表。

在本申请的实施例中,系统基于所述第一特征标签对应的标签数据构建至少一个第一特征列表,在每个第一特征列表包含有相同类别的特征信息,在所述第一特征标签为所述目标人物就读过的若干个院校的情况下,系统可以基于公开的院校数据构建一个包含有多个院校名称的专业列表,例如xxx大学和/或xxx学院等,系统还可以基于公开的学科专业数据构建一个包含有多种专业信息的专业列表,例如法律系和/或计算机系等,系统还可以基于公开的学历数据构建一个包含有多种学历信息的学历列表,例如本科、硕士研究生和博士研究生等。

步骤404:根据每个所述第一特征列表从所述人物履历数据中抽取出所述第一特征标签以及所述第一特征标签对应的特征信息。

在本申请的实施例中,系统针对每个目标人物的人物履历数据中涉及所述第一特征标签的相关信息,通过将每个所述第一特征列表与每个目标人物的人物履历数据进行匹配,从所述人物履历数据中抽取出所述第一特征标签以及所述第一特征标签对应的特征信息,例如,在所述第一特征标签为所述目标人物就读过的若干个院校的情况下,系统针对人物履历数据中的教育经历数据:“在2000年至2004年就读于xxx大学法律系硕士研究生”,通过预先构建好的院校列表、专业列表以及学历列表对所述教育经历数据进行匹配,从而抽取出所述目标人物的院校名称(xxx大学)、专业名称(法律系)和学历名称(硕士研究生)。

步骤406:基于预设的时间规则从所述人物履历数据中抽取出所述第一特征标签对应的开始时间和结束时间,得到所述第一特征标签存在的时间区间。

在本申请的实施例中,系统针对每个目标人物的人物履历数据中涉及所述第一特征标签的相关信息,基于预设的时间规则获取所述第一特征标签存在的时间区间,例如,在所述第一特征标签为所述目标人物就读过的若干个院校的情况下,系统针对人物履历数据中的教育经历数据:“在2000年至2004年就读于xxx大学法律系硕士研究生”,基于预设的时间规则获取在“xxx大学”就读的时间区间为2000年至2004年。

本申请通过对目标人物的教育经历为特征标签对目标人物的人物履历数据进行知识提取,从而能够通过目标人物的就读时间和院校所在地对目标人物的具有相同学年度的同学关系的其他人物进行挖掘和推理。

在本申请的另一个实施例中,如图5所示,所述从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息包括步骤502至步骤506:

步骤502:基于所述第二特征标签对应的标签数据构建至少一个第二特征列表。

在本申请的实施例中,系统基于所述第二特征标签对应的标签数据构建至少一个第二特征列表,在每个第二特征列表包含有相同类别的特征信息,在所述第二特征标签为所述目标人物就就职过的若干个组织机构的情况下,系统可以基于公开的组织机构数据构建一个包含有多个组织机构名称的组织机构列表,例如xxx公司和/或xxx事务所等,系统还可以基于公开的职位数据构建一个包含有多种职位信息的职业列表,例如顾问和/或经理等。

步骤504:根据每个所述第二特征列表从所述人物履历数据中抽取出所述第二特征标签以及所述第二特征标签对应的特征信息。

在本申请的实施例中,系统针对每个目标人物的人物履历数据中涉及所述第二特征标签的相关信息,通过将每个所述第二特征列表与每个目标人物的人物履历数据进行匹配,从所述人物履历数据中抽取出所述第二特征标签以及所述第二特征标签对应的特征信息,例如,在所述第二特征标签为所述目标人物就读过的若干个组织机构的情况下,系统针对人物履历数据中的工作经历数据:“在2004年至2010年在xxx公司任职法律顾问”,通过预先构建好的组织机构列表以及职业列表对所述工作经历数据进行匹配,从而抽取出所述目标人物的组织机构名称(xxx公司)和职位名称(法律顾问)。

步骤506:基于预设的时间规则从所述人物履历数据中抽取出所述第二特征标签对应的开始时间和结束时间,得到所述第二特征标签存在的时间区间。

在本申请的实施例中,系统针对每个目标人物的人物履历数据中涉及所述第二特征标签的相关信息,基于预设的时间规则获取所述第二特征标签存在的时间区间,例如,在所述第二特征标签为所述目标人物就读过的若干个组织机构的情况下,系统针对人物履历数据中的工作经历数据:“在2004年至2010年在xxx公司任职法律顾问”,基于预设的时间规则获取在“xxx公司”就职的时间区间为2004年至2010年。

本申请通过对目标人物的工作经历为特征标签对目标人物的人物履历数据进行知识提取,从而能够通过目标人物的就职时间和组织机构所在地对目标人物的具有共事经历的其他人物进行挖掘和推理。

在本申请的另一个实施例中,如图6所示,所述基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱包括步骤602至步骤608:

步骤602:将所述目标人物、地域名称、第一特征标签和第二特征标签作为实体。

在本申请的实施例中,系统将所述目标人物、地域名称、第一特征标签和第二特征标签作为实体,例如,如图7所示,所述第一特征标签可以是院校,所述第二特征标签可以是组织机构。

步骤604:构建所述地域名称与所述第一特征标签和第二特征标签之间的包含关系。

在本申请的实施例中,系统将地域名称与所述第一特征标签之间的包含关系以及地域名称与所述第二特征标签之间的包含关系进行整合,得到所述地域名称与所述第一特征标签和第二特征标签之间的包含关系,例如,如图7所示,在所述第一特征标签为院校且所述第二特征标签为组织机构的情况下,在地域名称“xxx市”中既可以包含“xxx大学”,也可以包含“xxx公司”。

步骤606:构建所述目标人物与所述第一特征标签之间的第一特征关系,并将所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息作为所述第一特征关系的属性。

在本申请的实施例中,系统构建所述目标人物与所述第一特征标签之间的第一特征关系,并将所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息作为所述第一特征关系的属性,例如,如图7所示,在所述第一特征标签为院校且所述第二特征标签为组织机构的情况下,系统在每个所述目标人物与其就读的院校之间建立学习关系,并将抽取得出的所述目标人物的就读的时间区间、专业名称和学历名称作为所述学习关系的属性。

步骤608:构建所述目标人物与所述第二特征标签之间的第二特征关系,并将所述第二特征标签存在的时间区间和所述第二特征标签对应的特征信息作为所述第二特征关系的属性。

在本申请的实施例中,系统构建所述目标人物与所述第二特征标签之间的第二特征关系,并将所述第二特征标签存在的时间区间和所述第二特征标签对应的特征信息作为所述第二特征关系的属性,例如,如图7所示,在所述第一特征标签为院校且所述第二特征标签为组织机构的情况下,系统在每个所述目标人物与其就职的组织机构之间建立工作关系,并将抽取得出的所述目标人物的就职的时间区间和职位作为所述工作关系的属性。

本申请通过构建包含时间属性和地域属性的知识图谱,对知识图谱中的目标人物的社会关系进行动态挖掘,能够推理出人物之间的深层社会关系,例如,某个目标人物于2000年至2004年在xxx大学法律系进行硕士研究生学习,于2004年至2010年在xxx公司任职法律顾问,那么通过本申请构建的知识图谱就能够进一步挖掘得到于2000年至2004年在xxx大学学习的其他人物与所述目标人物具有统一学年度的同学关系,于2004年至2010年在xxx公司任职的其他人物与所述目标人物具有共事经历的同事关系,基于现有人物图谱并不能挖掘得到这些深层关系。

与上述方法实施例相对应,本说明书还提供了知识图谱构建装置实施例,图8示出了本说明书一个实施例的知识图谱构建装置的结构示意图。如图8所示,该装置包括:

实体确定模块801,被配置为确定至少一个目标人物和至少两个地域名称,获取所述至少一个目标人物中每个所述目标人物对应的人物履历数据;

第一特征标签获取模块802,被配置为从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息;

第二特征标签获取模块803,被配置为从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息;

知识图谱构建模块804,被配置为基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱。

可选的,所述装置还包括:

地域数据构建模块,被配置为根据预存的地域数据构建所述至少两个地域名称中每个所述地域名称之间的包含关系;

第一标签数据构建模块,被配置为基于所述第一特征标签对应的标签数据构建所述地域名称与所述第一特征标签之间的包含关系;

第二标签数据构建模块,被配置为基于所述第二特征标签对应的标签数据构建所述地域名称与所述第二特征标签之间的包含关系。

可选的,所述第一特征标签获取模块802包括:

第一列表构建单元,被配置为基于所述第一特征标签对应的标签数据构建至少一个第一特征列表;

第一实体抽取单元,被配置为根据每个所述第一特征列表从所述人物履历数据中抽取出所述第一特征标签以及所述第一特征标签对应的特征信息;

第一时间抽取单元,被配置为基于预设的时间规则从所述人物履历数据中抽取出所述第一特征标签对应的开始时间和结束时间,得到所述第一特征标签存在的时间区间。

可选的,所述第二特征标签获取模块803包括:

第二列表构建单元,被配置为基于所述第二特征标签对应的标签数据构建至少一个第二特征列表;

第二实体抽取单元,被配置为根据每个所述第二特征列表从所述人物履历数据中抽取出所述第二特征标签以及所述第二特征标签对应的特征信息;

第二时间抽取单元,被配置为基于预设的时间规则从所述人物履历数据中抽取出所述第二特征标签对应的开始时间和结束时间,得到所述第二特征标签存在的时间区间。

可选的,所述知识图谱构建模块804包括:

实体命名单元,被配置为将所述目标人物、地域名称、第一特征标签和第二特征标签作为实体;

第一关系抽取单元,被配置为构建所述地域名称与所述第一特征标签和第二特征标签之间的包含关系;

第二关系抽取单元,被配置为构建所述目标人物与所述第一特征标签之间的第一特征关系,并将所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息作为所述第一特征关系的属性;

属性抽取单元,被配置为构建所述目标人物与所述第二特征标签之间的第二特征关系,并将所述第二特征标签存在的时间区间和所述第二特征标签对应的特征信息作为所述第二特征关系的属性。

可选的,所述装置还包括:

存储模块,被配置为将所述知识图谱存储至图数据库中。

本申请通过对至少一个目标人物对应的人物履历数据中进行特征标签的提取,依托特征标签从多个维度映射出所述目标人物的社会关系,同时,通过从抽取特征标签对应的时间区间以及特征标签与地域名称的包含关系,使得本申请构建的知识图谱能够支持用户从时间维度和地域维度对目标人物之间的特定社会关系进行深度的挖掘,推理出特定目标人物之间在特定时间段或特定地域具有的社会关系,从而进一步挖掘隐含的知识并丰富扩展知识图谱。

本申请一实施例还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现以下步骤:

确定至少一个目标人物和至少两个地域名称,获取所述至少一个目标人物中每个所述目标人物对应的人物履历数据;

从所述人物履历数据中获取与所述目标人物对应的第一特征标签以及所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息;

从所述人物履历数据中获取与所述目标人物对应的第二特征标签以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息;

基于所述目标人物、地域名称、第一特征标签、第二特征标签、所述第一特征标签存在的时间区间和所述第一特征标签对应的特征信息以及第二特征标签存在的时间区间和所述第二特征标签对应的特征信息构建知识图谱。

本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述知识图谱构建方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该计算机可读存储介质的技术方案与上述的知识图谱构建方法的技术方案属于同一构思,计算机可读存储介质的技术方案未详细描述的细节内容,均可以参见上述知识图谱构建方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1