本申请涉及计算机,特别是涉及一种低俗内容识别方法、装置、计算机设备以及存储介质。
背景技术:
1、随着互联网快速发展的时代,随着内容生产的门槛降低,各种内容的发布量以指数级的速度增长。这些内容来源来自各种内容创作机构,比如自媒体和机构的pgc(professional generated content,专业生产内容),ugc(user generated content,用户生成内容)。图文内容(包括图集)通过算法分发以feeds流展示获得了快速的发展。在过去半年内,视频内容在各个来源渠道的入库峰值日上传量已超过百万级别乃至千万级别。互联网上内容来源非常广泛也非常多,包括文各种各样的视频(包括短视频和小视频),这些内容来源渠道和质量层次不齐。随着ugc内容爆发式增长,信息流产品占领越来越多的用户时间。
2、目前,信息流产品上存在着大量低俗内容,例如软色情内容,软色情不是色情,但内容(包括视频包含的文字、图片或视频本身等)却又充满挑逗、诱惑、让人想入非非,其程度介于性感和色情之间。而目前针对这类低俗内容,当前大多数算法识别目标主要聚焦于人体部位的暴露,而忽视了其他性暗示、亲密行为、低俗着装等其他内容,因而导致低俗内容的识别准确率较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能有效提高低俗内容识别准确率的低俗内容识别方法、装置、计算机设备和存储介质。
2、一种低俗内容识别方法,所述方法包括:
3、获取待识别数据;
4、提取所述待识别数据中的图像数据与文本数据,所述文本数据包括内容文本以及标签文本;
5、获取所述图像数据的人体部位图像特征、所述内容文本的第一文本特征以及所述标签文本的第二文本特征,所述人体部位图像特征基于预设图卷积网络模型与预设迁移学习模型识别获取,所述预设图卷积网络基于不同人体部位之间关联关系的先验知识构建,所述预设迁移学习模型用于识别人体部位对应的低俗内容标签;
6、基于所述人体部位图像特征、所述第一文本特征以及所述第二文本特征,对所述待识别数据进行多模态融合识别,获取所述待识别数据对应的低俗内容识别结果。
7、一种低俗内容识别装置,所述装置包括:
8、数据获取模块,用于获取待识别数据;
9、数据提取模块,用于提取所述待识别数据中的图像数据与文本数据,所述文本数据包括内容文本以及标签文本;
10、特征提取模块,用于获取所述图像数据的人体部位图像特征、所述内容文本的第一文本特征以及所述标签文本的第二文本特征,所述人体部位图像特征基于预设图卷积网络模型与预设迁移学习模型识别获取,所述预设图卷积网络基于不同人体部位之间关联关系的先验知识构建,所述预设迁移学习模型用于识别人体部位对应的低俗内容标签;
11、多模态识别模块,用于基于所述人体部位图像特征、所述第一文本特征以及所述第二文本特征,对所述待识别数据进行多模态融合识别,获取所述待识别数据对应的低俗内容识别结果。
12、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
13、获取待识别数据;
14、提取所述待识别数据中的图像数据与文本数据;
15、获取所述图像数据的人体部位图像特征,以及所述文本数据中的文本特征;
16、基于所述人体部位图像特征以及所述文本特征,对所述待识别数据进行多模态融合识别,获取所述待识别数据对应的低俗内容识别结果。
17、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
18、获取待识别数据;
19、提取所述待识别数据中的图像数据与文本数据,所述文本数据包括内容文本以及标签文本;
20、获取所述图像数据的人体部位图像特征、所述内容文本的第一文本特征以及所述标签文本的第二文本特征,所述人体部位图像特征基于预设图卷积网络模型与预设迁移学习模型识别获取,所述预设图卷积网络基于不同人体部位之间关联关系的先验知识构建,所述预设迁移学习模型用于识别人体部位对应的低俗内容标签;
21、基于所述人体部位图像特征、所述第一文本特征以及所述第二文本特征,对所述待识别数据进行多模态融合识别,获取所述待识别数据对应的低俗内容识别结果。
22、一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现以下步骤:
23、获取待识别数据;
24、提取所述待识别数据中的图像数据与文本数据,所述文本数据包括内容文本以及标签文本;
25、获取所述图像数据的人体部位图像特征、所述内容文本的第一文本特征以及所述标签文本的第二文本特征,所述人体部位图像特征基于预设图卷积网络模型与预设迁移学习模型识别获取,所述预设图卷积网络基于不同人体部位之间关联关系的先验知识构建,所述预设迁移学习模型用于识别人体部位对应的低俗内容标签;
26、基于所述人体部位图像特征、所述第一文本特征以及所述第二文本特征,对所述待识别数据进行多模态融合识别,获取所述待识别数据对应的低俗内容识别结果。
27、上述低俗内容识别方法、装置、计算机设备和存储介质,通过获取待识别数据;提取待识别数据中的图像数据与文本数据;获取所述图像数据的人体部位图像特征、所述内容文本的第一文本特征以及所述标签文本的第二文本特征;而后基于人体部位图像特征、第一文本特征以及第二文本特征,对待识别数据进行多模态融合识别,获取待识别数据对应的低俗内容识别结果。本申请基于融合不同类型文本以及人体部位图像等多维度特征信息,来进行低俗内容的多模态融合识别,通过不同特征信息相互补充,能很大程度上提升低俗内容识别的准确率。
1.一种低俗内容识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述待识别数据包括视频数据,所述提取所述待识别数据中的图像数据与文本数据包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述视频数据进行抽帧处理,获取所述视频数据对应的图像数据包括:
4.根据权利要求1所述的方法,其特征在于,所述获取所述图像数据的人体部位图像特征包括:
5.根据权利要求4所述的方法,其特征在于,所述提取所述候选区域对应的人体部位之间的位置关联特征以及人体部位的语义特征,通过预设图卷积网络模型将所述人体部位之间的位置关联特征以及所述人体部位的语义特征融合,获取图像融合特征包括:
6.根据权利要求1所述的方法,其特征在于,所述文本数据包括内容文本以及标签文本中的至少一种,获取所述文本数据中的文本特征包括:
7.根据权利要求1所述的方法,其特征在于,所述基于所述人体部位图像特征以及所述文本特征,对所述待识别数据进行多模态融合识别,获取所述待识别数据对应的低俗内容识别结果包括:
8.一种低俗内容识别装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。