本申请涉及人工智能领域,尤其涉及一种实体识别方法、装置、设备、存储介质及计算机程序产品。
背景技术:
1、实体识别任务要求能准确预测文本中所包含的实体,例如文本为“他是李白”,该文本中所包含的实体为“李白”,实体识别任务即要求能准确预测出该文本中所包含的实体为“李白”而并非“他”、“是”、“他是”、“是李白”等。实体识别任务在搜索、推荐、知识图谱的构建等场景中有广泛应用,如何提高实体识别的准确性是当前的研究热点,但现有实体识别方法通常基于文本中各个字符对应的序列依赖特征来预测文本中所包含的实体,导致实体识别的准确性低。
技术实现思路
1、本申请实施例提供一种实体识别方法、装置、设备、存储介质及计算机程序产品,可以提高实体识别的准确性。
2、一方面,本申请实施例提供了一种实体识别方法,包括:
3、对目标文本进行语义特征编码处理,得到所述目标文本中各个字符对应的编码语义特征;
4、对所述各个字符对应的编码语义特征进行序列依赖特征提取处理,得到所述各个字符对应的序列依赖特征;
5、分别将所述各个字符对应的编码语义特征与相应的序列依赖特征进行特征融合处理,得到所述各个字符对应的融合特征;
6、基于所述各个字符对应的融合特征,对所述目标文本中所包含的实体进行预测处理,得到目标实体。
7、一方面,本申请实施例提供了一种实体识别装置,包括:
8、特征编码单元,用于对目标文本进行语义特征编码处理,得到所述目标文本中各个字符对应的编码语义特征;
9、特征提取单元,用于对所述各个字符对应的编码语义特征进行序列依赖特征提取处理,得到所述各个字符对应的序列依赖特征;
10、特征融合单元,用于分别将所述各个字符对应的编码语义特征与相应的序列依赖特征进行特征融合处理,得到所述各个字符对应的融合特征;
11、实体预测单元,用于基于所述各个字符对应的融合特征,对所述目标文本中所包含的实体进行预测处理,得到目标实体。
12、一方面,本申请实施例提供了一种实体识别设备,其特征在于,所述实体识别设备包括输入接口和输出接口,还包括:
13、处理器,适于实现一条或多条指令;以及,
14、计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行上述实体识别方法。
15、一方面,本申请实施例提供了一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行上述实体识别方法。
16、一方面,本申请实施例提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序存储在计算机存储介质中;实体识别设备的处理器从计算机存储介质中读取该计算机程序,处理器执行该计算机程序,使得实体识别设备执行上述实体识别方法。
17、本申请实施例中,可以提取目标文本中各个字符对应的编码语义特征以及提取目标文本中各个字符对应的序列依赖特征,并分别将各个字符对应的编码语义特征与相应的序列依赖特征进行特征融合处理,得到各个字符对应的融合特征,进而可以基于各个字符对应的融合特征预测目标文本中所包含的实体,得到目标实体;其中,将编码语义特征与序列依赖特征进行特征融合处理,可以实现特征的跨层融合,可以在各个字符对应的序列依赖特征的基础上引入相应字符对应的编码语义特征并进行特征交互,使得在基于各个字符对应的融合特征预测目标实体时,不仅可以参考目标文本中各个字符对应的序列依赖特征,还可以参考各个字符对应的编码语义特征,即可以同时参考目标文本中各个字符之间的序列关联性以及目标文本中各个字符的深度语义特征,可以提高实体识别的准确性。
1.一种实体识别方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述分别将所述各个字符对应的编码语义特征与相应的序列依赖特征进行特征融合处理,得到所述各个字符对应的融合特征,包括:
3.如权利要求2所述的方法,其特征在于,所述任一字符对应的编码语义特征以及所述任一字符对应的序列依赖特征为多维特征向量;
4.如权利要求1所述的方法,其特征在于,所述分别将所述各个字符对应的编码语义特征与相应的序列依赖特征进行特征融合处理,得到所述各个字符对应的融合特征,包括:
5.如权利要求1所述的方法,其特征在于,所述基于所述各个字符对应的融合特征,对所述目标文本中所包含的实体进行预测处理,得到目标实体,包括:
6.如权利要求5所述的方法,其特征在于,所述目标文本包括n个字符,所述多个实体标注标签的数量为k,n,k为正整数;
7.如权利要求6所述的方法,其特征在于,所述根据所述各个字符对应的k个标签预测概率,为所述多个候选标签序列进行评价处理,得到各个候选标签序列的评价分值,包括:
8.如权利要求1所述的方法,其特征在于,所述目标实体是通过调用训练后的实体识别模型预测得到的;
9.一种实体识别装置,其特征在于,包括:
10.一种实体识别设备,其特征在于,所述实体识别设备包括输入接口和输出接口,还包括:
11.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有计算机程序指令,所述计算机程序指令被处理器执行时,用于执行如权利要求1-8任一项所述的实体识别方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时,用于加载并执行如权利要求1-8任一项所述的实体识别方法。