一种敏感词识别方法、装置、设备及介质与流程

文档序号:36101835发布日期:2023-11-21 16:32阅读:来源:国知局

技术特征:

1.一种敏感词识别方法,其特征在于,包括:

2.根据权利要求1所述的敏感词识别方法,其特征在于,所述多类别敏感词识别模型训练过程,包括:

3.根据权利要求2所述的敏感词识别方法,其特征在于,还包括:

4.根据权利要求1所述的敏感词识别方法,其特征在于,所述利用多类别敏感词识别模型对所述待检测文本数据进行敏感词识别,得到所述待检测文本数据对应的敏感词类别以及敏感词对应的位置之前,还包括:

5.根据权利要求4所述的敏感词识别方法,其特征在于,当敏感词识别模式为匹配模式和语义分析模式时;

6.根据权利要求4所述的敏感词识别方法,其特征在于,所述利用敏感词字典树确定所述待检测文本数据对应的敏感词类别以及所述敏感词对应的位置,包括:

7.根据权利要求1至6任一项所述的敏感词识别方法,其特征在于,所述获取待检测文本数据之后,还包括:

8.一种敏感词识别装置,其特征在于,包括:

9.一种电子设备,其特征在于,其包括:

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的敏感词识别方法。


技术总结
本申请涉及数据处理技术领域,尤其是涉及一种敏感词识别方法、装置、设备及介质。该方法包括获取待检测文本数据;确定待检测文本数据对应的词向量序列,词向量序列能够表示上下文信息;根据词向量序列利用膨胀卷积层进行膨胀卷积操作,得到第一特征向量;根据第一特征向量,利用特征提取层进行随机失活以及数据变换,得到第二特征向量;基于第二特征向量利用全连接层进行敏感词多分类分析,得到待检测文本数据对应的若干敏感词类别;根据第二特征向量利用CRF层,确定敏感词对应的位置以及对应的敏感词类别;提示敏感词类别,并根据敏感词对应的位置,将敏感词替换为预设符号,提高了敏感词识别效果以及效率。

技术研发人员:熊浩,万青玲,刘波
受保护的技术使用者:河北神玥软件科技股份有限公司
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1