一种基于多粒度LSTM网络的深层语义匹配实体链接方法与流程

文档序号:14911438发布日期:2018-07-10 23:31阅读:来源:国知局

技术特征:

1.一种基于多粒度LSTM网络的深层语义匹配实体链接方法,其特征在于,所述实体链接方法包含以下结构和步骤:

(1)表面形式匹配:采用字符级别的双向LSTM网络(char-LSTM),抽取实体指称、候选实体的表面形式特征表示,同时能够包含一定程度上的词本身的语义信息。

(2)上下文语义匹配:采用词级别的双向LSTM网络(word-LSTM),对实体指称所在句子进行编码,将其输出作为实体指称的上下文语义特征向量。采用实体在知识图谱中的“结构上下文”,学习得到候选实体的上下文语义特征向量。

(3)相似性度量:对于实体指称、候选实体的表面形式特征向量以及上下文语义特征向量,分别计算表面形式和语义的匹配相似度得分,将表面形式匹配相似度和上下文语义匹配相似度结合作为实体指称-候选实体对最终的匹配相似度得分。

2.如权利要求1所述的方法,其特征在于,所述步骤(1)具体包括:

(1.1)对于给定的包含T个字符的实体指称m,输入即是m的字符形式;

(1.2)输入通过词向量层,将每个输入单元的字符转化为对应的字符向量;

(1.3)转换后得到的字符向量作为双向LSTM层的输入;

(1.4)取双向LSTM层最后的隐藏层状态作为输出,即实体指称m的表面形式特征向量。

3.如权利要求1所述的方法,其特征在于,所述步骤(2)具体包括:

(2.1)给定实体指称m及其所在的句子sen,将sen的每个单词都转换为对应的词向量;

(2.2)对于第i个词,将其词向量与位置向量拼接作为LSTM层的输入;

(2.3)将双向LSTM层的所有单元的输出输入到attention层,对各分量进行加权和非线性变换;

(2.4)采取知识表示学习的方法TransE,利用实体的结构化“上下文”来学习实体表示,得到候选实体的上下文特征向量。

4.如权利要求1所述的方法,其特征在于,所述步骤(3)具体包括:

(3.1)对于实体指称、候选实体的表面形式特征向量以及上下文语义特征向量,分别计算表面形式和语义这两个层面的相似度得分;

(3.2)将表面形式匹配相似度和上下文语义匹配相似度结合作为实体指称-候选实体对最终的相似度匹配得分;

(3.3)计算每个候选实体与实体指称之间的相似度得分,选取得分最高的实体作为最终答案。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1