实体关系获取方法及装置与流程

文档序号:31868967发布日期:2022-10-21 17:58阅读:61来源:国知局
实体关系获取方法及装置与流程

1.本公开的实施例涉及互联网技术领域,尤其涉及一种实体关系获取方法及装置。


背景技术:

2.关系抽取作为信息抽取重要的子任务,同样是从非结构化的文本中抽取结构化的信息,是从文本语料中抽取实体词之间的关系。
3.关系抽取是构建结构化知识库重要的一环,同时也可以应用于构建垂直领域知识图谱,支撑问答、搜索、推理等上层应用,在学术界和工业界均有广泛的研究。从数据构造和来源角度,目前业内常用的关系抽取方法主要有模板匹配方法、半监督的方法和有监督的方法等,其中,基于模板匹配的关系分类构建简单、适用于小规模特定领域,但召回率低、可移植性差,当遇到另一个领域的关系分类需要重新构建模板;基于半监督的方法适合大规模的关系任务并且具备发现新关系的能力,但也存在对初始种子较为敏感、存在语义漂移、准确率较低等问题;远程监督基于一个非常强的假设,实际上很多包含该实体对的句子并不代表此种关系,会引入大量噪声,导致实体关系识别的准确率较低;基于深度学习的有监督方法,通过神经网络自动提取关系抽取所需的特征,但是这些方法通常只利用了单一的词法信息或者语义信息。而过去大量的工作表明,关系抽取任务所需要的文本特征是丰富的、多元的,依赖单一层次的特征信息,分类器很难做出正确的预测。


技术实现要素:

4.本公开的实施例提供一种实体关系获取方法及装置,用以提高实体词关系抽取的准确率。
5.根据本公开的实施例的第一方面,提供了一种实体关系获取方法,包括:
6.对待识别语句中包含的实体词进行处理,得到所述实体词对应的实体词向量和实体词词性;
7.调用词法特征抽取层对所述实体词向量和所述实体词词性进行处理,得到所述实体词对应的词法级别特征信息;
8.调用句法特征抽取层根据所述词法级别特征信息对所述实体词进行处理,得到所述实体词对应的句法级别特征信息;
9.调用语义特征抽取层根据所述句法级别特征信息对所述实体词进行处理,得到所述实体词对应的语义特征信息;
10.根据所述语义特征信息,确定所述实体词之间的实体关系。
11.可选地,所述调用词法特征抽取层对所述实体词向量和所述实体词词性进行处理,得到所述实体词对应的词法级别特征信息,包括:
12.调用所述词法特征抽取层根据所述实体词向量对应的实体词在所述待识别语句中的位置关系,获取所述实体词向量对应的时序关系;
13.根据所述时序关系和所述实体词词性,确定所述实体词对应的词法级别特征信
息。
14.可选地,所述调用句法特征抽取层根据所述词法级别特征信息对所述实体词进行处理,得到所述实体词对应的句法级别特征信息,包括:
15.调用所述句法特征抽取层对所述待识别语句待识别语句对应的依存句法树进行处理,得到所述待识别语句对应的无向连接矩阵;
16.根据所述无向连接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
17.可选地,所述根据所述无向连接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息,包括:
18.调用所述句法特征抽取层获取所述依存句法树上的所述实体词与所述实体词对应的邻接实体词之间的实体词权重;
19.根据所述实体词权重,确定所述无向连接矩阵对应的邻接权重矩阵;
20.根据所述邻接权重矩阵和单位矩阵,生成目标邻接矩阵;
21.基于所述目标邻接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
22.可选地,所述调用语义特征抽取层根据所述句法级别特征信息对所述实体词进行处理,得到所述实体词对应的语义特征信息,包括:
23.调用所述语义特征抽取层根据所述句法级别特征信息,确定所述实体词对应的全局语义特征信息和局部语义特征信息;
24.将所述全局语义特征信息和局部语义特征信息作为所述实体词对应的语义特征信息。
25.可选地,所述根据所述语义特征信息,确定所述实体词之间的实体关系,包括:
26.将所述语义特征信息与所述实体词进行拼接处理,得到所述实体词之间的实体关系。
27.根据本公开的实施例的第二方面,提供了一种实体关系获取装置,包括:
28.实体词向量获取模块,用于对待识别语句中包含的实体词进行处理,得到所述实体词对应的实体词向量和实体词词性;
29.词法特征信息获取模块,用于调用词法特征抽取层对所述实体词向量和所述实体词词性进行处理,得到所述实体词对应的词法级别特征信息;
30.句法特征信息获取模块,用于调用句法特征抽取层根据所述词法级别特征信息对所述实体词进行处理,得到所述实体词对应的句法级别特征信息;
31.语义特征信息获取模块,用于调用语义特征抽取层根据所述句法级别特征信息对所述实体词进行处理,得到所述实体词对应的语义特征信息;
32.实体关系确定模块,用于根据所述语义特征信息,确定所述实体词之间的实体关系。
33.可选地,所述词法特征信息获取模块包括:
34.时序关系获取单元,用于调用所述词法特征抽取层根据所述实体词向量对应的实体词在所述待识别语句中的位置关系,获取所述实体词向量对应的时序关系;
35.词法特征确定单元,用于根据所述时序关系和所述实体词词性,确定所述实体词
对应的词法级别特征信息。
36.可选地,所述句法特征信息获取模块包括:
37.无向连接矩阵获取单元,用于调用所述句法特征抽取层对所述待识别语句待识别语句对应的依存句法树进行处理,得到所述待识别语句对应的无向连接矩阵;
38.句法特征信息确定单元,用于根据所述无向连接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
39.可选地,所述句法特征信息确定单元包括:
40.实体词权重获取子单元,用于调用所述句法特征抽取层获取所述依存句法树上的所述实体词与所述实体词对应的邻接实体词之间的实体词权重;
41.邻接权重矩阵确定子单元,用于根据所述实体词权重,确定所述无向连接矩阵对应的邻接权重矩阵;
42.目标邻接矩阵生成子单元,用于根据所述邻接权重矩阵和单位矩阵,生成目标邻接矩阵;
43.句法特征信息确定子单元,用于基于所述目标邻接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
44.可选地,所述语义特征信息获取模块包括:
45.全局语义特征确定单元,用于调用所述语义特征抽取层根据所述句法级别特征信息,确定所述实体词对应的全局语义特征信息和局部语义特征信息;
46.语义特征信息获取单元,用于将所述全局语义特征信息和局部语义特征信息作为所述实体词对应的语义特征信息。
47.可选地,所述实体关系确定模块包括:
48.实体关系获取单元,用于将所述语义特征信息与所述实体词进行拼接处理,得到所述实体词之间的实体关系。
49.根据本公开的实施例的第三方面,提供了一种电子设备,包括:
50.处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的实体关系获取方法。
51.根据本公开的实施例的第四方面,提供了一种可读存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一项所述的实体关系获取方法。
52.本公开的实施例提供了一种实体关系获取方法及装置,通过对待识别语句中包含的实体词进行处理,得到实体词对应的实体词向量和实体词词性,调用词法特征抽取层对实体词向量和实体词词性进行处理,得到实体词对应的词法级别特征信息,调用句法特征抽取层根据词法级别特征信息对实体词进行处理,得到实体词对应的句法级别特征信息,调用语义特征抽取层根据句法级别特征信息对实体词进行处理,得到实体词对应的语义特征信息,根据语义特征信息,确定实体词之间的实体关系。本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
附图说明
53.为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述
中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
54.图1为本公开的实施例提供的一种实体关系获取方法的步骤流程图;
55.图2为本公开的实施例提供的另一种实体关系获取方法的步骤流程图;
56.图3为本公开的实施例提供的一种实体关系获取装置的结构示意图;
57.图4为本公开的实施例提供的另一种实体关系获取装置的结构示意图。
具体实施方式
58.下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
59.实施例一
60.参照图1,示出了本公开的实施例提供的一种实体关系获取方法的步骤流程图,如图1所示,该实体关系获取方法具体可以包括如下步骤:
61.步骤101:对待识别语句中包含的实体词进行处理,得到所述实体词对应的实体词向量和实体词词性。
62.本公开的实施例可以应用于结合语句的词法、句法和语义特征信息确定语句中包含的实体词之间的实体关系的场景中。
63.待识别语句是指输入的用于对其中包含的实体词的实体关系进行抽取的语句。
64.在需要对待识别语句中包含的实体词的实体关系进行抽取时,在得到待识别语句之后,可以对待识别语句执行提取操作,以提取出待识别语句中包含的实体词,然后,对提取的实体词进行处理得到实体词对应的实体词向量和实体词词性。
65.在具体实现中,可以采用word2vec对实体词进行处理,以得到实体词对应的实体词向量,当然,也可以采用其它方式获取实体词对应的实体词向量,具体地,可以根据业务需求而定,本实施例对此不加以限制。
66.在具体实现中,可以采用词性分析工具对实体词进行分词,以得到实体词对应的实体词词性,如名词、动词、形容词等词性。当然,也可以采用其它方式获取实体词对应的实体词词性,具体地,可以根据业务需求而定,本实施例对此也不加以限制。
67.在对待识别语句中包含的实体词进行处理得到实体词对应的实体词向量和实体词词性之后,执行步骤102。
68.步骤102:调用词法特征抽取层对所述实体词向量和所述实体词词性进行处理,得到所述实体词对应的词法级别特征信息。
69.在本实施例中,词法特征抽取层是指用于抽取实体词的词法级别特征信息的网络层,在本示例中,词法特征抽取层可以为bi-lstm(双向长短记忆力网络)层,当然,也可以采用其它网络层,具体地,可以根据业务需求而定,本实施例对此不加以限制。
70.词法级别特征信息是指实体词对应的词法特征信息,在本实施例中,词法级别特征信息可以包含实词和虚词,其中,实词是指在句子中可以独立单人句子成分的词,虚词主
要起结构作用,用来表明词与词之间的关系,或语气等。在实际应用中,实词可以包括:名称、代词、数词、动词等,虚词可以包括:冠词、介词、连词、感叹词等。
71.在对待识别语句中包含的实体词进行处理得到实体词对应的实体词向量和实体词词性之后,可以将实体词向量和实体词词性作为词法特征抽取层的输入,调用词法特征抽取层对实体词向量和实体词词性进行处理,以得到实体词对应的词法级别特征信息,具体地,将在下述实施例二中进行详细描述,本实施例在此不再加以赘述。
72.在调用词法特征抽取层对实体词向量和实体词词性进行处理得到实体词对应的词法级别特征信息之后,执行步骤103。
73.步骤103:调用句法特征抽取层根据所述词法级别特征信息对所述实体词进行处理,得到所述实体词对应的句法级别特征信息。
74.句法特征抽取层是指用于抽取实体词的句法特征信息的网络层,在本实施例中,句法特征抽取层可以采用图卷积神经网络模型等,具体地,可以根据业务需求而定,本实施例对此不加以限制。
75.句法级别特征信息是指用于指示待识别语句的句子成分的特征信息。在实际应用中,句法级别特征信息可以包含主语、谓语、表语、宾语、补语等,其中,主语是指待识别语句主要说明的人或事物,谓语是指用于说明主语的动作或状态,表语是指在系动词之后表示主语的性质、特征、状态或身份等,宾语用于表示及物动词的对象或内容,补语用于补充说明主语或宾语等。
76.在调用词法特征抽取层对实体词向量和实体词词性进行处理得到实体词对应的词法级别特征信息之后,可以将词法级别特征信息和实体词作为句法特征抽取层的输入,调用句法特征抽取层根据词法级别特征信息对实体词进行处理,以得到实体词对应的句法级别特征信息,对于此过程将在下述实施例二中进行详细描述,本实施例对此不加以限制。
77.在调用句法特征抽取层根据词法级别特征信息对实体词进行处理得到实体词对应的句法级别特征信息之后,执行步骤104。
78.步骤104:调用语义特征抽取层根据所述句法级别特征信息对所述实体词进行处理,得到所述实体词对应的语义特征信息。
79.语义特征抽取层是指用于抽取实体词的语义特征信息的网络层,在本示例中,语义特征抽取层可以使用多尺寸卷积核的卷积神经网络,对于该语义特征抽取层的具体网络结构可以根据业务需求而定,本实施例对此不加以限制。
80.语义特征信息可以包括全局语义特征信息和局部语义特征信息,其中,全局语义特征信息是指实体词在待识别语句中的含义,局部语义特征信息是指实体词所具有的含义。
81.在调用句法特征抽取层根据词法级别特征信息对实体词进行处理得到实体词对应的句法级别特征信息之后,可以将实体词和句法级别特征信息作为语义特征抽取层的输入,调用语义特征抽取层根据句法级别特征信息对实体词进行处理,以得到实体词对应的语义特征信息,对于获取语义特征信息的具体过程将在下述实施例二中进行详细描述,本实施例对此不加以限制。
82.在调用语义特征抽取层根据句法级别特征信息对实体词进行处理得到实体词对应的语义特征信息之后,执行步骤105。
83.步骤105:根据所述语义特征信息,确定所述实体词之间的实体关系。
84.在调用语义特征抽取层根据句法级别特征信息对实体词进行处理得到实体词对应的语义特征信息之后,可以根据语义特征信息确定出实体词对应的实体关系,具体地,可以将抽取的实体词的语义特征信息与实体词的向量表示进行拼接,然后预测得出实体词之间的实体关系。
85.本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
86.本公开的实施例提供的实体关系获取方法,通过对待识别语句中包含的实体词进行处理,得到实体词对应的实体词向量和实体词词性,调用词法特征抽取层对实体词向量和实体词词性进行处理,得到实体词对应的词法级别特征信息,调用句法特征抽取层根据词法级别特征信息对实体词进行处理,得到实体词对应的句法级别特征信息,调用语义特征抽取层根据句法级别特征信息对实体词进行处理,得到实体词对应的语义特征信息,根据语义特征信息,确定实体词之间的实体关系。本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
87.实施例二
88.参照图2,示出了本公开的实施例提供的另一种实体关系获取方法的步骤流程图,如图2所示,该实体关系获取方法具体可以包括如下步骤:
89.步骤201:对待识别语句中包含的实体词进行处理,得到所述实体词对应的实体词向量和实体词词性。
90.本公开的实施例可以应用于结合语句的词法、句法和语义特征信息确定语句中包含的实体词之间的实体关系的场景中。
91.待识别语句是指输入的用于对其中包含的实体词的实体关系进行抽取的语句。
92.在需要对待识别语句中包含的实体词的实体关系进行抽取时,在得到待识别语句之后,可以对待识别语句执行提取操作,以提取出待识别语句中包含的实体词,然后,对提取的实体词进行处理得到实体词对应的实体词向量和实体词词性。
93.在具体实现中,可以采用word2vec对实体词进行处理,以得到实体词对应的实体词向量,当然,也可以采用其它方式获取实体词对应的实体词向量,具体地,可以根据业务需求而定,本实施例对此不加以限制。
94.在具体实现中,可以采用词性分析工具对实体词进行分词,以得到实体词对应的实体词词性,如名词、动词、形容词等词性。当然,也可以采用其它方式获取实体词对应的实体词词性,具体地,可以根据业务需求而定,本实施例对此也不加以限制。
95.在待识别语句中包含的实体词进行处理得到实体词对应的实体词向量和实体词词性之后,执行步骤202。
96.步骤202:调用所述词法特征抽取层根据所述实体词向量对应的实体词在所述待识别语句中的位置关系,获取所述实体词向量对应的时序关系。
97.在本实施例中,词法特征抽取层是指用于抽取实体词的词法级别特征信息的网络层,在本示例中,词法特征抽取层可以为bi-lstm(双向长短记忆力网络)层,当然,也可以采用其它网络层,具体地,可以根据业务需求而定,本实施例对此不加以限制。
98.时序关系是指实体词在待识别语句中的时序先后关系。
99.在获取到待识别语句中的实体词对应的实体词向量和实体词词性之后,可以将实体词向量和实体词词性作为词法特征抽取层的输入,调用词法特征抽取层根据实体词向量对应的实体词在待识别语句中的位置关系,获取实体词向量对应的时序关系,在本实施例中,词法特征抽取层可以从正反两个方向建模文本词汇之间的时序关系,能够很好地为关系抽取任务引入词法级别特征信息。
100.在获取到实体词向量对应的时序关系之后,执行步骤203。
101.步骤203:根据所述时序关系和所述实体词词性,确定所述实体词对应的词法级别特征信息。
102.词法级别特征信息是指实体词对应的词法特征信息,在本实施例中,词法级别特征信息可以包含实词和虚词,其中,实词是指在句子中可以独立单人句子成分的词,虚词主要起结构作用,用来表明词与词之间的关系,或语气等。在实际应用中,实词可以包括:名称、代词、数词、动词等,虚词可以包括:冠词、介词、连词、感叹词等。
103.在获取到实体词向量对应的时序关系之后,可以根据时序关系和实体词词性确定出实体词对应的词法级别特征信息,具体地,在获取到实体词向量在待识别语句中的时序关系之后,可以结合实体词对应的时序及实体词词性获取实体词对应的词法级别特征信息,即识别出实体词为待识别语句中的实词,还是虚词等。
104.在根据时序关系和实体词词性确定出实体词对应的词法级别特征信息之后,执行步骤204。
105.步骤204:调用所述句法特征抽取层对所述待识别语句待识别语句对应的依存句法树进行处理,得到所述待识别语句对应的无向连接矩阵。
106.句法特征抽取层是指用于抽取实体词的句法特征信息的网络层,在本实施例中,句法特征抽取层可以采用图卷积神经网络模型等,具体地,可以根据业务需求而定,本实施例对此不加以限制。
107.依存句法树是指结合待识别语句中的实体词,及实体词在待识别语句中的一维时序构建得到的句法树,其中,在句法树上是以实体词作为节点,对于依存句法树可以是预先采用现有的开源工具获取到的,在待识别语句一维时序上相距较远的两个实体词,在依存句法树上的距离通常较短,依存句法树可以很好的揭示文本句法结构,反映出两个实体词之间直接或间接的关系特征。
108.无向连接矩阵是指以待识别语句中的实体词为节点构建得到的矩阵。
109.在具体实现中,首先可以获取待识别语句对应的依存句法树,进而,可以将该依存句法树作为句法特征抽取层的输入,调用句法特征抽取层对依存句法树进行处理,以得到待识别语句对应的无向连接矩阵。
110.在得到待识别语句对应的无向连接矩阵之后,执行步骤205。
111.步骤205:根据所述无向连接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
112.句法级别特征信息是指用于指示待识别语句的句子成分的特征信息。在实际应用中,句法级别特征信息可以包含主语、谓语、表语、宾语、补语等,其中,主语是指待识别语句主要说明的人或事物,谓语是指用于说明主语的动作或状态,表语是指在系动词之后表示主语的性质、特征、状态或身份等,宾语用于表示及物动词的对象或内容,补语用于补充说
明主语或宾语等。
113.在得到待识别语句对应的无向连接矩阵之后,可以调用句法特征抽取层根据无向连接矩阵和词法级别特征信息确定出实体词对应的句法级别特征信息,具体地,可以先获取无向连接矩阵对应的邻接权重矩阵,然后结合邻接权重矩阵和词法级别特征信息确定实体词对应的句法级别特征信息,具体地,可以结合下述具体实现方式进行详细描述。
114.在本公开的实施例的一种具体实现方式中,上述步骤205可以包括:
115.子步骤s1:调用所述句法特征抽取层获取所述依存句法树上的所述实体词与所述实体词对应的邻接实体词之间的实体词权重。
116.在本实施例中,实体词权重是指依存句法树上的实体词与其邻接实体词之间的权重。
117.在句法特征抽取层获取到输入的待识别语句对应的依存句法树之后,可以获取依存句法树上的实体词与其对应的邻接实体词之间的权重,即实体词权重。
118.在得到实体词权重之后,执行子步骤s2。
119.子步骤s2:根据所述实体词权重,确定所述无向连接矩阵对应的邻接权重矩阵。
120.在得到实体词权重之后,可以根据实体词权重和无向连接矩阵,确定出无向连接矩阵对应的邻接权重矩阵,具体地,可以基于attention机制根据实体词权重确定出无向连接矩阵对应的邻接权重矩阵。
121.在根据实体词权重确定出无向连接矩阵对应的邻接权重矩阵之后,执行子步骤s3。
122.子步骤s3:根据所述邻接权重矩阵和单位矩阵,生成目标邻接矩阵。
123.目标邻接矩阵是指将邻接权重矩阵和单位矩阵相加得到的矩阵。
124.为了保证信息流向下一层,自身节点信息不丢失,可以给每个节点加上闭环,即为邻接权重矩阵加上单位矩阵,进而可以得到目标邻接矩阵。
125.在根据邻接权重矩阵和单位矩阵生成目标邻接矩阵之后,执行子步骤s4。
126.子步骤s4:基于所述目标邻接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
127.在得到目标邻接矩阵之后,可以基于目标邻接矩阵和词法级别特征信息确定出实体词对应的句法级别特征信息,具体地,在采用层级的句法特征抽取层时,对于句法特征抽取层的细节可以从图卷积网络(gcn)的(l-1)层流向第i层的过程,可以如下述公式(1)所示:
[0128][0129]
上述公式(1)中,a表示加上单位矩阵后的邻接权重矩阵,di表示第i个节点的度数,除于度数是为了实现归一化,消除对于度小的节点的不利影响。可以通过调整图卷积网络(gcn)层数调节引入当前节点的其他高阶邻居节点信息量,避免引入过多冗余信息,同时邻接权重矩阵可以学习到不同邻居节点对于当前节点的影响程度,自适应地过滤部分噪声。
[0130]
在根据无向连接矩阵和词法级别特征信息确定出实体词对应的句法级别特征信息之后,执行步骤206。
[0131]
步骤206:调用所述语义特征抽取层根据所述句法级别特征信息,确定所述实体词对应的全局语义特征信息和局部语义特征信息。
[0132]
语义特征抽取层是指用于抽取实体词的语义特征信息的网络层,在本示例中,语义特征抽取层可以使用多尺寸卷积核的卷积神经网络,对于该语义特征抽取层的具体网络结构可以根据业务需求而定,本实施例对此不加以限制。
[0133]
语义特征信息可以包括全局语义特征信息和局部语义特征信息,其中,全局语义特征信息是指实体词在待识别语句中的含义,局部语义特征信息是指实体词所具有的含义。
[0134]
在根据无向连接矩阵和词法级别特征信息确定出实体词对应的句法级别特征信息之后,可以将实体词和句法级别特征信息作为语义特征抽取层的输入,调用语义特征抽取层根据句法级别特征信息确定出实体词对应的全局语义特征信息和局部语义特征信息。具体地,本实施例使用多尺寸卷积核的卷积神经网络(cnn),以抽取实体词的不同粒度的语义信息,即全局语义特征信息和局部语义特征信息。
[0135]
在得到全局语义特征信息和局部语义特征信息之后,执行步骤207。
[0136]
步骤207:将所述全局语义特征信息和局部语义特征信息作为所述实体词对应的语义特征信息。
[0137]
在得到全局语义特征信息和局部语义特征信息,则可以将全局语义特征信息和局部语义特征信息作为实体词对应的语义特征信息。
[0138]
步骤208:将所述语义特征信息与所述实体词进行拼接处理,得到所述实体词之间的实体关系。
[0139]
在得到实体词对应的语义特征信息之后,可以将语义特征信息与实体词进行拼接处理,以得到实体词之间的实体关系,在具体实现中,需要获取两个实体词之间的实体词关系,在得到待识别语句中的任意两个实体词之后,可以将任意两个实体词的实体词向量与对应的语义特征信息进行拼接,从而可以得到任意两个实体词对应的拼接向量,进而可以结合拼接向量预测得到任意两个实体词之间的实体关系。
[0140]
本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
[0141]
本公开的实施例提供的实体关系获取方法,通过对待识别语句中包含的实体词进行处理,得到实体词对应的实体词向量和实体词词性,调用词法特征抽取层对实体词向量和实体词词性进行处理,得到实体词对应的词法级别特征信息,调用句法特征抽取层根据词法级别特征信息对实体词进行处理,得到实体词对应的句法级别特征信息,调用语义特征抽取层根据句法级别特征信息对实体词进行处理,得到实体词对应的语义特征信息,根据语义特征信息,确定实体词之间的实体关系。本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
[0142]
实施例三
[0143]
参照图3,示出了本公开的实施例提供的一种实体关系获取装置的结构示意图,如图3所示,该实体关系获取装置300具体可以包括如下模块:
[0144]
实体词向量获取模块310,用于对待识别语句中包含的实体词进行处理,得到所述实体词对应的实体词向量和实体词词性;
[0145]
词法特征信息获取模块320,用于调用词法特征抽取层对所述实体词向量和所述实体词词性进行处理,得到所述实体词对应的词法级别特征信息;
[0146]
句法特征信息获取模块330,用于调用句法特征抽取层根据所述词法级别特征信息对所述实体词进行处理,得到所述实体词对应的句法级别特征信息;
[0147]
语义特征信息获取模块340,用于调用语义特征抽取层根据所述句法级别特征信息对所述实体词进行处理,得到所述实体词对应的语义特征信息;
[0148]
实体关系确定模块350,用于根据所述语义特征信息,确定所述实体词之间的实体关系。
[0149]
本公开的实施例提供的实体关系获取装置,通过对待识别语句中包含的实体词进行处理,得到实体词对应的实体词向量和实体词词性,调用词法特征抽取层对实体词向量和实体词词性进行处理,得到实体词对应的词法级别特征信息,调用句法特征抽取层根据词法级别特征信息对实体词进行处理,得到实体词对应的句法级别特征信息,调用语义特征抽取层根据句法级别特征信息对实体词进行处理,得到实体词对应的语义特征信息,根据语义特征信息,确定实体词之间的实体关系。本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
[0150]
实施例四
[0151]
参照图4,示出了本公开的实施例提供的另一种实体关系获取装置的结构示意图,如图4所示,该实体关系获取装置400具体可以包括如下模块:
[0152]
实体词向量获取模块410,用于对待识别语句中包含的实体词进行处理,得到所述实体词对应的实体词向量和实体词词性;
[0153]
词法特征信息获取模块420,用于调用词法特征抽取层对所述实体词向量和所述实体词词性进行处理,得到所述实体词对应的词法级别特征信息;
[0154]
句法特征信息获取模块430,用于调用句法特征抽取层根据所述词法级别特征信息对所述实体词进行处理,得到所述实体词对应的句法级别特征信息;
[0155]
语义特征信息获取模块440,用于调用语义特征抽取层根据所述句法级别特征信息对所述实体词进行处理,得到所述实体词对应的语义特征信息;
[0156]
实体关系确定模块450,用于根据所述语义特征信息,确定所述实体词之间的实体关系。
[0157]
可选地,所述词法特征信息获取模块420包括:
[0158]
时序关系获取单元421,用于调用所述词法特征抽取层根据所述实体词向量对应的实体词在所述待识别语句中的位置关系,获取所述实体词向量对应的时序关系;
[0159]
词法特征确定单元422,用于根据所述时序关系和所述实体词词性,确定所述实体词对应的词法级别特征信息。
[0160]
可选地,所述句法特征信息获取模块430包括:
[0161]
无向连接矩阵获取单元431,用于调用所述句法特征抽取层对所述待识别语句待识别语句对应的依存句法树进行处理,得到所述待识别语句对应的无向连接矩阵;
[0162]
句法特征信息确定单元432,用于根据所述无向连接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
[0163]
可选地,所述句法特征信息确定单元432包括:
[0164]
实体词权重获取子单元,用于调用所述句法特征抽取层获取所述依存句法树上的所述实体词与所述实体词对应的邻接实体词之间的实体词权重;
[0165]
邻接权重矩阵确定子单元,用于根据所述实体词权重,确定所述无向连接矩阵对应的邻接权重矩阵;
[0166]
目标邻接矩阵生成子单元,用于根据所述邻接权重矩阵和单位矩阵,生成目标邻接矩阵;
[0167]
句法特征信息确定子单元,用于基于所述目标邻接矩阵和所述词法级别特征信息,确定所述实体词对应的句法级别特征信息。
[0168]
可选地,所述语义特征信息获取模块440包括:
[0169]
全局语义特征确定单元441,用于调用所述语义特征抽取层根据所述句法级别特征信息,确定所述实体词对应的全局语义特征信息和局部语义特征信息;
[0170]
语义特征信息获取单元442,用于将所述全局语义特征信息和局部语义特征信息作为所述实体词对应的语义特征信息。
[0171]
可选地,所述实体关系确定模块450包括:
[0172]
实体关系获取单元451,用于将所述语义特征信息与所述实体词进行拼接处理,得到所述实体词之间的实体关系。
[0173]
本公开的实施例提供的实体关系获取装置,通过对待识别语句中包含的实体词进行处理,得到实体词对应的实体词向量和实体词词性,调用词法特征抽取层对实体词向量和实体词词性进行处理,得到实体词对应的词法级别特征信息,调用句法特征抽取层根据词法级别特征信息对实体词进行处理,得到实体词对应的句法级别特征信息,调用语义特征抽取层根据句法级别特征信息对实体词进行处理,得到实体词对应的语义特征信息,根据语义特征信息,确定实体词之间的实体关系。本公开的实施例通过融合句法、词法、语义三种层次的特征信息,从而可以达到提高实体关系抽取的准确率的目的。
[0174]
本公开的实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施例的实体关系获取方法。
[0175]
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的实体关系获取方法。
[0176]
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0177]
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
[0178]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0179]
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在
上面对本公开的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
[0180]
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
[0181]
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0182]
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0183]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0184]
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
[0185]
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1