针对桥梁管养文本数据的多特征融合命名实体识别方法、装置与流程

文档序号:35917216发布日期:2023-10-30 10:12阅读:来源:国知局

技术特征:

1.一种针对桥梁管养文本数据的多特征融合命名实体识别方法,其特征在于,包括:

2.根据权利要求1所述的方法, 其特征在于,所述对所述桥梁管养样本数据进行预处理,得到桥梁管养样本语句和桥梁管养样本词,包括:

3.根据权利要求2所述的方法, 其特征在于,所述对所述桥梁管养样本语句进行分词,得到所述桥梁管养样本词,包括:基于jieba库对所述桥梁管养样本语句进行分词,得到所述桥梁管养样本词。

4.根据权利要求1所述的方法, 其特征在于,所述对所述桥梁管养样本语句进行标注得到桥梁管养实体抽取样本词的标签以及桥梁管养实体分类样本词的标签,包括:

5.根据权利要求4所述的方法, 其特征在于,所述基于构建的实体类型词典,对所述桥梁管养样本语句进行实体分类标注得到所述桥梁管养实体分类样本词的标签之后,还包括:将所述桥梁管养实体分类样本词的标签转换成数字索引,以在基于所述桥梁管养样本语句和所述桥梁管养实体分类样本词的标签对实体分类模型进行多特征融合训练时,将所述数字索引做为所述实体分类模型的真实训练标签,以对所述实体分类模型进行多特征融合训练。

6.根据权利要求1所述的方法,其特征在于,所述实体抽取模型包括bert模型、text2vec模型、注意力模块、dense模块、crf模块,所述text2vec模型的参数被冻结;

7.根据权利要求1所述的方法, 其特征在于,所述实体分类模型包括:bies dense模块,characterwise dense模块,所述基于所述桥梁管养样本语句和所述桥梁管养实体分类样本词的标签对实体分类模型进行多特征融合训练,直至训练结束,得到完成训练的实体分类模型,包括:

8.一种针对桥梁管养文本数据的多特征融合命名实体识别装置,其特征在于,针对获取桥梁管养样本数据,并对所述桥梁管养样本数据进行预处理,得到桥梁管养样本语句和桥梁管养样本词;对所述桥梁管养样本语句进行标注得到桥梁管养实体抽取样本词的标签以及桥梁管养实体分类样本词的标签的情形,所述针对桥梁管养文本数据的多特征融合命名实体识别装置包括:

9.一种电子设备,其特征在于,针对获取桥梁管养样本数据,并对所述桥梁管养样本数据进行预处理,得到桥梁管养样本语句和桥梁管养样本词;对所述桥梁管养样本语句进行标注得到桥梁管养实体抽取样本词的标签以及桥梁管养实体分类样本词的标签的情形,所述电子设备包括:存储器以及处理器,所述存储器上存储有计算机可执行程序,所述计算机可执行程序被所述处理器运行时,执行如下步骤:基于所述桥梁管养样本语句和所述桥梁管养实体抽取样本词的标签对实体抽取模型进行多特征融合训练,直至训练结束,得到完成训练的实体抽取模型;

10.一种计算机程序产品,其特征在于,针对获取桥梁管养样本数据,并对所述桥梁管养样本数据进行预处理,得到桥梁管养样本语句和桥梁管养样本词;对所述桥梁管养样本语句进行标注得到桥梁管养实体抽取样本词的标签以及桥梁管养实体分类样本词的标签的情形,计算机程序产品上存储有计算机可执行程序, 所述计算机可执行程序被运行时执行如下步骤:


技术总结
本申请中提供一种针对桥梁管养文本数据的多特征融合命名实体识别方法、装置,方法包括:对桥梁管养样本语句进行标注得到桥梁管养实体抽取样本词的标签以及桥梁管养实体分类样本词的标签;基于桥梁管养样本语句和桥梁管养实体抽取样本词的标签对实体抽取模型进行多特征融合训练,直至训练结束,得到完成训练的实体抽取模型;基于桥梁管养样本语句和桥梁管养实体分类样本词的标签对实体分类模型进行多特征融合训练,直至训练结束,得到完成训练的实体分类模型;获取待处理的桥梁管养数据,并基于完成训练的实体抽取模型抽取桥梁管养专业词,基于完成训练的实体分类模型对桥梁管养专业词进行分类。

技术研发人员:杨雷,韦韩,郭洁,赵莺菲,程寿山
受保护的技术使用者:交通运输部公路科学研究所
技术研发日:
技术公布日:2024/1/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1