一种基于深度神经网络的实体关系抽取方法与流程

文档序号:11950223阅读:来源:国知局

技术特征:

1.一种基于深度神经网络的实体关系抽取方法,其特征在于,包括:

步骤1,将句子的每个字或类别关键词分别映射到字向量或类别向量;

步骤2,根据所述字向量和所述类别向量对所述句子进行特征提取;

步骤3,将所述步骤2所提取的特征首尾相接输入全连接分类层,即得到抽取结果。

2.根据权利要求1所述的一种基于深度神经网络的实体关系抽取方法,其特征在于:所述步骤1是采用无标注语料训练获取所述字向量或所述类别向量。

3.根据权利要求1所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,所述步骤2中进行所述特征提取包括:进行字特征的提取、进行句子特征的提取和进行类别特征的提取。

4.根据权利要求3所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,进行所述字特征提取的方法包括:

采用滑动窗口机制获取字特征神经网络输入向量,将所述滑动窗口内的向量首尾相接,既得所述字特征。

5.根据权利要求4所述的一种基于深度神经网络的实体关系抽取方法,其特征在于:所述字特征神经网络的输入向量包括目标字,以及以所述目标字为中心的相邻距离小于等于k/2的字的字向量,所述k为滑动窗口的大小。

6.根据权利要求3所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,进行所述句子特征提取的方法包括:将句子的每个字映射到字向量,对用字向量表示的句子进行卷积运算,对所述卷积运算的结果进行池化运算得到所述句子特征。

7.根据权利要求6所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,所述对用字向量表示的句子进行卷积运算,具体是指:用数个卷积核对用字向量表示的句子进行卷积运算,得到数个向量集,所述向量集的个数与所述卷积核的个数相同。

8.根据权利要求7所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,对所述卷积运算的结果进行池化运算得到所述句子特征,具体是指:将卷积运算所得数个所述向量集分别作为一个池化区域,获取各个所述池化区域的最大值,将各个所述最大值首尾相连,即得到所述句子特征。

9.根据权利要求3所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,进行类别特征提取的方法包括:

使用普通神经网络依据类别关键词数据库,从句子中抽取类别关键词或代表类别关键词的字词,所述类别关键词和所述代表类别关键词的字词的集合即为所述类别特征。

10.根据权利要求1-9任一项所述的一种基于深度神经网络的实体关系抽取方法,其特征在于,还包括对所述抽取结果进行验证评测的步骤,所述验证评测具体是指:将所述抽取结果与人工标注结果进行对比,得到正确字数,将正确字数除以测试集的字数得到字标注准确率。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1