一种知识图谱构建方法及系统与流程

文档序号:33386277发布日期:2023-03-08 08:22阅读:26来源:国知局
一种知识图谱构建方法及系统与流程

1.本发明涉及大数据处理领域,特别涉及一种知识图谱构建方法及系统。


背景技术:

2.知识图谱是由节点和边构成的语义网络图,在大数据场景常用来进行知识建模。目前主流的用于知识建模的图谱结构包括属性图或语义图,但这两种图谱结构在面向工业级大数据处理时各有局限。为了提高大数据知识建模效率,本说明书一些实施例提供了一种增强语义的属性图知识建模方法及系统,在提高知识图谱的语义表征能力的同时,保证了知识图谱本身的规范性结构,以适应更复杂的数据要求。


技术实现要素:

3.本说明书实施例之一提供一种知识图谱构建方法,包括:获取知识图谱的本体定义数据;所述本体定义数据包括多个节点的节点定义数据;其中,节点定义数据包括节点属性值类型,节点属性值类型为基础类型、标准类型或概念类型;基础类型用于表征属性值的数据类型,标准类型用于表征属性值具有的固定格式,概念类型用于表征属性值具有的多层级结构;基于所述本体定义数据对实例数据进行处理,进而得到包括标准类型属性值和/或概念类型属性值的节点实例的知识图谱。
4.本说明书实施例之一提供一种知识图谱构建系统,包括:第一获取模块,用于获取知识图谱的本体定义数据;所述本体定义数据包括多个节点的节点定义数据;其中,节点定义数据包括节点属性值类型,节点属性值类型为基础类型、标准类型或概念类型;基础类型用于表征属性值的数据类型,标准类型用于表征属性值具有的固定格式,概念类型用于表征属性值具有的多层级结构;第一处理模块,用于基于所述本体定义数据对实例数据进行处理,进而得到包括标准类型属性值和/或概念类型属性值的节点实例的知识图谱。
5.本说明书实施例之一提供一种装置,包括处理器以及存储介质,存储介质存储有计算机指令,处理器用于执行计算机指令以实现前述识图谱构建方法。
6.本说明书实施例之一提供一种存储介质,用于存储知识图谱,所述知识图谱包括标准类型属性值和/或概念类型属性值的节点实例;标准类型用于表征属性值具有的固定格式,概念类型用于表征属性值具有的多层级结构。
附图说明
7.本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
8.图1是根据本说明书一些实施例所示的属性图示例;
9.图2是根据本说明书一些实施例所示的语义图示例;
10.图3是根据本说明书一些实施例所示的知识图谱构建方法的示例性流程图;
11.图4是根据本说明书一些实施例所示的知识图谱示例;
12.图5是根据本说明书一些实施例所示的知识图谱构建系统的模块图。
具体实施方式
13.为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
14.应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
15.如本说明书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和 /或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
16.本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
17.知识图谱是由节点和边构成的语义网络图,节点可以描述对象信息,边可以表达对象之间的关联,这符合大多数场景下的知识逻辑,因此在大数据场景常用来进行知识建模以直观、简洁的表征知识信息。
18.在部分应用场景下,知识图谱又可简称为图。知识图谱广泛应用于物理、化学、生物、医疗、交通运输、通信、互联网等技术领域。图中的节点表示对象。节点可以有多种类型,称作节点类型,用于指示各类对象。具体的,对象可以是用户、商户、账户、城市、概念、药物、公司、设备、现象、事件、属性等等。图谱中的边表示对象之间的关系,边也可以有多种类型,称作边类型,用于表征各类关系。例如,张三和李四是好友关系、社交账号与移动终端具有登录关系、账户a向账户b转账等等。为了方便描述,可以将表示“xx”对象的节点简称为“xx节点”,将表示“xx”关系的边简称为“xx边”。在不引起歧义的情况下,对象和节点、关系和边可以互换使用。
19.在具体的应用场景下,可以具有不同架构或不同知识表达侧重方向的知识图谱,如属性图以及语义图。
20.属性图是一种强调规范化、结构标准化的图结构。属性图中的节点对应实体,且节点设置有规范化的属性数据,可选的,边也可以设置有规范化的属性数据。其中,实体是指现实世界客观存在的事物,示例性的,实体对应的节点可以用于表征人、公司、设备、商户、账户等等。节点的属性数据用于对其对应的实体进行详细描述。以人节点为例,其属性数据可以包括年龄、性别、籍贯以及口味偏好等。边的属性数据用于对对应实体间的关系进行描述,以公司节点和人节点为例,其间的关系可以是雇佣,边的属性数据可以包括实习、长期
雇佣、外聘等。在属性图中,节点或边的属性数据一般具有标准的数据格式,而这些数据格式都是基础类型,如int(整型)、float(单精度浮点型)、double(双精度浮点型)、string (字符串)等。图1是本说明书一些实施例所示的属性图示例,其包括对应人的节点(如张三、李四)以及对应公司(如xx公司)的节点,每个节点具有其属性数据,节点之间具有边,边的类型包括好友关系和雇佣关系。
21.语义图是一种强调语义表达能力的图结构,以spo(subject-predicate-object)三元组为基本语义单元。其中,语义图中的节点对应主语s或宾语o,具体可以是实体也可以对应概念,节点之间的边对应谓词p。其中,概念又称为抽象知识,是人类在认知过程中,把所感知的事物的共同本质特点抽象出来,加以概括得到的知识。例如,性别、用行政区划表征的地址、对菜品进行归纳概括得到的菜系。在一些实施例中,可以认为实体的属性可以归为概念范畴。图2是本说明书一些实施例所示的语义图示例,图中圆形节点为主语节点,其以实体为主,方形节点为宾语节点,其可以是实体也可以是概念,图中的边则对应谓词p。示例性的,图中的“xx公司
”‑“
地址
”‑“
xx省xx市xx区xx街101号”组成一条spo三元组,表达xx公司的地址是xx省xx市xx区xx街101号的语义。可见,语义图中的每一个图元素三元组(节点-边-节点)对应spo三元组,具有丰富的语义。
22.对比图1和图2,可以发现,属性图有高效规范的结构,但直接表达的语义较弱,语义图的结构较为灵活,以表达spo三元组为目的,但其直接表达的语义丰富导致结构定义过于复杂,面向多元、时空类知识表达时又捉襟见肘。然而在多数大数据企业级应用场景,随着知识数据的积累,既有基于知识数据快速构建知识图谱的诉求又有知识标准化沉淀的诉求。为此本说明书实施例提供了一套面向工业大数据场景更加友好的知识建模框架,在属性图的基础上进行语义增强,提高知识图谱的语义表征能力的同时,保证了知识图谱本身的规范性结构。
23.在对本说明书实施例进行详细介绍之前,先介绍知识图谱的另一基本概念——本体定义数据(schema)。一般来说,知识图谱是指由一系列实例数据(包括节点实例以及节点实例之间的关系实例)构成的知识库。知识图谱的本体定义数据是指对知识图谱包括的节点、节点间关系进行定义的数据,其可以高效、抽象的描述知识图谱中实例数据所反映的知识逻辑,用于指导实例数据的收集,以及基于实例数据进行构图,得到知识图谱(也可以称为实例图或数据图)。具体的,知识图谱的本体定义数据可以包括用于节点的定义数据,其中,节点的定义数据可以表现为字段形式,节点字段可以理解为节点名称,如节点字段可以是“公司”、“用户”等,节点字段的取值则可以是节点的实例数据或简称为节点实例,如“张三”、“xx公司”等。节点字段可以对应有多个属性字段,属性字段可以是对节点描述信息的抽象,如属性字段可以是“地址”、“年龄”、“注册资本”等,属性字段的取值则可以是其对应节点实例的具体描述,如“建设路11号”、“28岁”、“500万”等。在一些实施例中,知识图谱的本体定义数据还可以包括用于定义节点间关系的边的定义数据,边的定义数据可以表现为关系描述。关系描述可以是节点间关系类型的抽象,如“雇佣关系”、“子母公司关系”、“好友关系”等。在一些实施例中,关系描述可以进一步包括关系属性,关系属性用于对关系描述做进一步说明,如“雇佣关系”可以具体是“临时雇佣”或者“正式雇佣”,“子母公司关系”可以进一步包括“全资控股关系”、“部分控股关系”等。通过关系描述可以在构建知识图谱时,确定两个节点实例之间是否具有边。
24.在一些实施例中,还可以确定图谱算子。图谱算子用于基于节点定义或关系描述,从大量实例数据中找出节点实例及其确定节点实例之间的关系。图谱算子亦可理解为图计算算法或方法,用于进行图谱构建的数据处理操作或运算。可以用数据处理/运算单元、程序代码、机器学习模型等各种方式实现。在一些实施例中,图谱算子可以对算子输入数据进行相应的数据处理/运算,完成数据的转化,并输出转化后的数据。在一些实施例中,图谱算子可以看作是建立在知识图谱的本体定义数据(包括实体定义与关系描述)上的算法或方法,亦可看作是本体定义数据的一部分。
25.图3是根据本说明书一些实施例所示的知识图谱构建方法的示例性流程图。
26.在一些实施例中,图3所示的流程300可以由计算设备实现。例如,可以由部署于计算设备之上的知识图谱构建系统500实现。如图3所示,流程300可以包括:
27.步骤310,获取知识图谱的本体定义数据。在一些实施例中,步骤310可以由第一获取模块510实现。
28.本体定义数据是知识图谱的基础,如前所述,在基于实例数据生成知识图谱之前需要先构造其本体定义数据。为了增强语义表达,本说明一些实施例对知识图谱本体定义数据中的属性值类型做了扩展,即属性值类型除了基础类型以外,还新增了标准类型以及概念类型。其中,基础类型用于表征属性值的数据类型,具体可以是int、float、double、string等类型。可以看出,基础类型定义的是基本的数据类型。
29.在具体应用时,节点的属性数据(或边的属性数据)中的一部分是具有固定格式的,例如电话号码、邮箱地址、mac地址等,这些数据本质上还是由基础类型的数据组成,为了提高知识构建的效率,本说明书一些实施例针对这类属性数据提出了标准类型,具体的,标准类型可以基于基础类型以及格式描述定义。其中,格式描述可以表现为正则表达式或其他约束性描述。例如,电话号码的标准类型可以定义为“^(13[0
‑ꢀ
9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$”,邮箱地址的标准类型可以定义为“^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$”等。在一些实施例中,基础类型以及格式表述可以被封装为一个类,通过将该类进行实例化,对节点的属性数据类型进行定义。示例性的,在某知识图谱的本体定义数据中可以包含语句“email:email”来对某节点的邮箱地址属性进行类型定义,其中,“email”为属性字段,“email”表征邮箱地址型的数据类型,可以看作是对“^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$”的封装。
[0030]
在又一些实施例中,属性数据还可以具有层级结构,例如行政区划(省—市—区)、菜系(一级菜系—二级菜系—三级菜系)等,这些数据本质上依然还是由基础类型的数据组成,但是具有一定的层级结构且这些层级结构相对稳定,这类属性数据一般是由人们对直接感知到的知识的抽象、概括,为了便于管理或使用而提出的层级状描述,因此,本说明书一些实施例针对这类属性数据提出了概念类型。具体的,概念类型可以基于基础类型以及层级描述定义。其中,层级描述可以包括层级数量、层级顺序以及每一层级的值域。以菜系的概念类型为例,层级描述可以表达为“一级菜系{西餐、中餐}—二级菜系{法式、意式、美式、

地中海}{川菜、粤菜、鲁菜、

湘菜}—三级菜系{

}{

}

{炒菜、火锅、烧烤}”,可以看出,菜系的概念类型包括三个层级,层级顺序由为一级、二级、三级顺序排列,式中{}内容为每一层级的值域,每个值域枚举列出其包含的元素。可以看出概念类型本身就蕴含了大量的知识内容,例如行政区划包含的层级以及每一值域固有的下级层级值域,在构建不同
的本体定义数据时通过定义概念类型的属性数据可以方便实现知识复用,提高了知识构建的效率。
[0031]
为了进一步增强语义,本说明书一些实施例还增加了属性图的节点类型,即除了实体节点以外,还包括事件节点的节点类型。其中,事件节点对应事件。事件是指现实社会中发生的具有一定影响力的事情。与实体节点不同的是,事件节点一般涉及两个以上的主体,而实体节点最多对应一个主体(如公司或用户)。相应的,事件节点具有两个以上对象属性,对象属性即事件的参与方信息,如可以是参与事件公司的名称、参与事件的人的身份信息。在一些实施例中,可以将对象属性的属性值类型定义为实体类型(可以用本体定义数据中的实体节点定义数据来表征),允许属性值类型为实体类型能够直接引用实体节点的信息来定义事件的参与方,在一定程度上高效的实现了知识复用,当属性值为实体类型时,这一条属性定义数据可以自动转化为关系定义数据。在一些实施例中,事件节点还包括时间属性、空间属性等,用于完整描述事件信息。在属性图中引入事件节点,可以通过知识图谱表征事件,不仅能将事件涉及的多主体进行组合,还能刻画事件的时间、空间演化。一方面,把这些事件作为标准事件沉淀之后,将来在构建其他知识图谱时若遇到相同事件的时候,可以直接引用已有的事件节点数据,提高了知识建模效率。另一方面,在一些风险控制或金融投资场景中,通过知识图谱沉淀风险事件的演化过程,通过知识图谱可以挖掘出这些事件的发展规律,这种沉淀的经验在未来再遇到同类事件的时候,是可复用的。
[0032]
某知识图谱的本体定义数据中包括企业涉诉事件节点的节点定义数据:
[0033]
companylitigationevent(企业涉诉事件){eventname(事件名)stringrelatedcompany(关联企业)companyrelatedperson(关联人)persondateofthecourtsession(开庭时间)timestampdomain(区域)adminarea}。
[0034]
其中,timestamp为开庭时间属性值的类型,属于标准类型;adminarea(行政区划) 为区域属性值的类型,属于概念类型。其中,关联企业属性以及关联人属性即为前述的对象属性,company为本体定义数据中的公司节点,用其表示关联企业属性的属性值为公司实体类型,person为本体定义数据中的自然人节点,用其表示关联人属性的属性值为自然人实体类型。相应的,可以理解为企业涉诉事件节点与company节点之间定义具有边,企业涉诉事件节点与person节点之间定义具有边。在一些实施例中,节点定义数据还可以包括类型标识,用于指示节点类型是实体、事件或概念。
[0035]
在一些实施例中,属性图的节点类型还包括概念节点。概念节点与前述的属性值类型之一的概念类型具有关联。与实体节点和事件节点不同,概念节点对应的实例数据即为概念类型的层级描述信息中的值域中的元素,其可以基于本体定义数据直接获得。以菜系为例,其层级描述中的值域包括“川菜”、“火锅”、“烧烤”,相应的,可以在知识图谱中设置概念节点“川菜”、概念节点“火锅”以及概念节点“烧烤”。在一些实施例中,概念节点的节点实例可以与本体定义数据中概念类型的层级描述中各值域的元素一一对应。在一些实施例中,概念节点也可以对应其他类型的属性数据,如邮箱地址节点。在知识图谱中引入概念节
点可以将属性数据节点化,并在实体节点类型的节点实例/事件节点类型的节点实例与概念节点的节点实例之间建立边连,可以丰富知识图谱的语义信息,进一步增强属性图的语义表达。
[0036]
图4所示的是本说明书一些实施例中的知识图谱及其本体定义数据示例。图中的本体层即为知识图谱的本体定义数据的可视化展示。本实施例通过本体定义数据包括6个节点(为本体定义数据层面的节点,非节点实例,或可称为节点类型)的节点定义数据,其中事件节点1对应贸易战事件、事件节点2对应疫情事件,概念节点1对应日期,概念节点2对应菜系,实体节点1对应人,实体节点2对应公司,节点之间的连线代表边定义数据,例如本体定义数据定义了事件节点1与概念节点1之间具有边连。进一步,可以为事件节点以及实体节点定义属性字段以及属性值类型,属性值类型可以选自基础类型、标准类型以及概念类型。关于节点定义数据的更多描述,可以参见前述的本体定义数据相关介绍以及企业涉诉事件节点的节点定义数据。
[0037]
步骤320,基于所述本体定义数据对实例数据进行处理,进而得到包括节点实例的知识图谱。在一些实施例中,步骤320可以由第一处理模块520实现。
[0038]
本体定义数据是知识图谱中节点与边的定义数据,其用于指导知识图谱实例数据的搜集与处理。例如,本体定义数据中定义了用户节点,相应的实例数据可以是张三、李四等。实例数据可以来自各业务领域的业务数据,如商品销售部门、金融服务平台等。
[0039]
在一些实施例中,可以根据知识图谱的本体定义数据,如实体节点的节点定义数据从对应的平台或业务领域的业务数据中获取相应的节点实例,其中节点实例还包括对应节点属性字段的属性数据。具体的,对于类型为实体节点以及事件节点的节点,可以从业务数据中获取相应的节点实例;对于与概念类型关联的概念节点则可以直接基于本体定义数据中概念类型的层级描述生成各值域中元素对应的节点实例,对于与标准类型关联的概念节点可以基于实体节点以及事件节点的节点实例的相关属性值生成节点实例。
[0040]
在一些实施例中,本体定义数据还可以包括图谱算子,其中进一步包括属性值标准化算子,用于将从业务数据获取的属性字段的属性值进行表达标准化处理,以符合其类型。例如,属性值标准化算子可以将电话号码属性的属性值的数据格式统一为13位数字格式,或者根据实例数据从各层级的值域中选择对应的元素,为相应的节点实例确定概念类型的属性值,如“xx公司”节点的属地属性值为“四川省—成都市—高新区”,又如mifs商铺的经营范围属性值为“中餐—川菜—火锅”。
[0041]
在一些实施例中,还可以基于本体定义数据中的边定义数据从业务数据中确定节点实例之间的边实例。例如,边定义数据定义了人节点之间可以具有“好友关系”,且业务数据显示张三在李四某社交app中,则可以基于此为“张三”节点与“李四”节点之间建立“好友关系”的边。
[0042]
在一些实施例中,需要借助图谱算子,如链指算子,为节点实例建立边。在一些实施例中,链指算子可以基于两个节点实例的属性值,建立相应两个节点实例的关系描述。“张三”节点具有偏好属性“火锅”,mifs商铺节点具有经营范围属性“中餐—川菜—火锅”,链指算子可以具有相似或相同的属性值为两个实例节点建立边,该边可以是“推荐关系”。在又一些实施例中,链指算子可以基于其中一个节点实例的属性值以及另一个节点的节点名称,建立相应两个节点实例的关系描述。例如,mifs商铺节点具有经营范围属性“中餐—
川菜—火锅”,图谱中存在概念节点实例“火锅”,链指算子可以基于相似或相同的属性值和节点名称为两个实例节点建立边,该边可以是“经营范围”。又例如,“张三”节点具有联系方式属性“123@163.com”,图谱中存在概念节点实例“123@163.com”,链指算子可以基于相似或相同的属性值和节点名称为两个实例节点建立边,该边可以是“联系方式”。在又一些实施例中,链指算子可以基于层级描述以及两个节点的节点名称,建立相应两个节点实例的关系描述。例如,图谱中存在概念节点实例“火锅”、概念节点实例“川菜”以及概念节点实例“中餐”,链指算子可以基于菜系的层级描述依次在“火锅”节点和“川菜”节点、“川菜”节点和“中餐”节点之间建立边,边可以是“属于关系”。
[0043]
图4中的实例层展示了基于其上的本体定义数据生成的知识图谱,其中事件1为事件节点1的实例数据,,事件2为事件节点2的实例数据,,实体1、2为实体节点1的实例数据,如分别为“张三”、“李四”,实体3为实体节点2的实例数据,如“xx公司”,概念1为概念节点1的实例数据,如“2019年”,概念21、22为概念节点2的实例数据,如分别为“川菜”、“火锅”。事件1与概念1之间关系为“发生时间”,实体3与概念1之间的关系为“成立时间”,事件2与概念21的关系为“关联场所经营范围”,实体1与实体2之间的关系为“好友关系”,实体2与实体3之间的关系为“雇佣关系”,事件2与实体2的关系为“关联主体”,实体 2与概念22之间的关系为“口味偏好”,概念22与概念21之间的关系为“属于关系”。
[0044]
通过流程300可以建立包含标准类型属性值和/或概念类型属性值的节点实例的知识图谱,知识图谱中还可以包括概念节点以及事件节点,提高了知识建模的效率,增强了图谱的语义表达,有利于知识沉淀与复用。
[0045]
本说明书的一些实施例还提供一种知识图谱构建装置,包括处理器以及存储介质,其中,存储介质存储有计算机指令,处理器用于处理计算机指令以实现前述的知识图谱构建方法。
[0046]
经过流程300得到的知识图谱可以存储在存储介质中,因此,本说明书一些实施例还提供了一种存储介质,存储有根据流程300得到的包含标准类型属性值和/或概念类型属性值的节点实例的知识图谱。
[0047]
图5是根据本说明书一些实施例所示的知识图谱构建系统的模块图。
[0048]
如图5所示,知识图谱构建系统500可以包括第一获取模块510以及第一处理模块 520。
[0049]
第一获取模块510可以用于获取知识图谱的本体定义数据;所述本体定义数据包括多个节点的节点定义数据;其中,节点定义数据包括节点属性值类型,节点属性值类型为基础类型、标准类型或概念类型;基础类型用于表征属性值的数据类型,标准类型用于表征属性值具有的固定格式,概念类型用于表征属性值具有的多层级结构。
[0050]
第一处理模块520可以用于基于所述本体定义数据对实例数据进行处理,进而得到包括标准类型属性值和/或概念类型属性值的节点实例的知识图谱。
[0051]
关于各模块的更多描述,可以参见图3的相关说明。
[0052]
应当理解,图5所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计
算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
[0053]
需要注意的是,以上对于系统及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。如可以将第一处理模块520拆分为两个以上的子模块。
[0054]
本说明书实施例可能带来的有益效果包括但不限于:(1)本说明书提供的知识图谱构建方法通过属性值的概念类型或概念节点引入了概念建模,可以使节点实例与行业或通用知识结合,实现了领域的通用知识沉淀以及高效复用。(2)引入事件节点的节点类型,可以通过图谱表征事件,不仅能将事件涉及的多实体进行组合,还能刻画事件的时间、空间演化。 (3)引入概念节点的节点类型,可以在图谱层面直观表示事件节点/实体节点与抽象知识的关联,以及概念节点之间的层级关系,高效的扩展了属性图的语义,有助于更加充分、精细的知识挖掘。需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
[0055]
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书实施例的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书实施例进行各种修改、改进和修正。该类修改、改进和修正在本说明书实施例中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
[0056]
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
[0057]
此外,本领域技术人员可以理解,本说明书实施例的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书实施例的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书实施例的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
[0058]
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用
的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、rf、或类似介质,或任何上述介质的组合。
[0059]
本说明书实施例各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如java、scala、smalltalk、eiffel、jade、emerald、c++、c#、 vb.net、python等,常规程序化编程语言如c语言、visualbasic、fortran2003、perl、 cobol2002、php、abap,动态编程语言如python、ruby和groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(lan)或广域网(wan),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(saas)。
[0060]
此外,除非权利要求中明确说明,本说明书实施例所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书实施例流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的处理设备或移动设备上安装所描述的系统。
[0061]
同理,应当注意的是,为了简化本说明书实施例披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书实施例对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
[0062]
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本技术权利要求最广范围有限制的文件(当前或之后附加于本技术中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义和/ 或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
[0063]
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书实施例的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1