本发明涉及信息识别,特别涉及一种社交媒体敏感信息识别方法、装置、设备及存储介质。
背景技术:
1、近几年,社交媒体中的视频图像数据量迅速增长,并且通过对社交媒体上的图片、视频等内容进行分析预测,可以获取很多有价值的信息;但目前对于社交媒体中信息的筛选过程中,容易受到其中伪造信息的干扰,这样导致最终分析得到的结果不准确,在某些领域,例如军事领域,可能会导致严重的后果。由此可见,如何识别社交媒体中敏感信息的可靠性是本领域要解决的问题。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种社交媒体敏感信息识别方法、装置、设备及存储介质,可以结合用户画像提高敏感信息的可信度。其具体方案如下:
2、第一方面,本申请提供了一种社交媒体敏感信息识别方法,包括:
3、在社交媒体上抓取用户发送的内容以得到待识别信息;
4、通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;
5、根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;
6、将所述目标画像对应的所述第二敏感信息确定最终敏感信息。
7、可选的,所述通过预设敏感信息识别技术对所述待识别信息进行判断以得到第一敏感信息,包括:
8、根据预设敏感关键字集合对所述待识别信息进行筛选以得到包含敏感关键字的待识别信息;
9、通过预设图像识别技术以及预设语义识别技术分别对所述待识别信息中的图像以及语义进行判断以得到包含敏感图像和/或敏感语义的待识别信息;
10、基于所述包含敏感关键字的待识别信息以及包含敏感图像和/或敏感语义的待识别信息得到所述第一敏感信息。
11、可选的,所述将基于预设伪造信息识别模型对所述第一敏感信息进行判断得到为非伪造的信息确定为第二敏感信息,包括:
12、基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息;
13、基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息;
14、基于所述多媒体文件伪造敏感信息以及所述语义修改敏感信息得到所述第二敏感信息。
15、可选的,所述基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息之前,还包括:
16、利用生成对抗网络的生成器根据现有自然人用户发送的初始多媒体文件生成新的多媒体向量序列;
17、利用生成对抗网络的辨别器对所述新的多媒体向量序列以及所述初始多媒体文件对应的初始多媒体向量序列进行迭代训练,以得到用于识别多媒体向量序列对应的多媒体文件是否为凭空产生文件的所述预设多媒体文件伪造识别模型,以便基于所述预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息。
18、可选的,所述基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息之前,还包括:
19、对现有自然人用户发送的初始多媒体文件进行语义级别修改以得到修改后多媒体向量序列;
20、根据所述修改后多媒体向量序列利用生成对抗网络的生成器生成新的修改多媒体向量序列,并利用辨别器对所述新的修改多媒体向量序列以及所述修改后多媒体向量序列进行迭代训练以得到用于识别多媒体向量序列对应的多媒体文件是否为语义修改文件的所述语义修改识别模型,以便基于所述预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息。
21、可选的,所述根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像之前,还包括:
22、收集现有自然人用户信息,并根据所述自然人用户信息生成原始个体行为画像,以根据所述原始个体行为画像得到相应的原始用户信息向量序列;
23、利用生成对抗网络的生成器根据所述原始用户信息向量序列生成新的用户信息向量序列,并利用辨别器对所述新的用户信息向量序列以及所述原始用户信息向量序列进行迭代训练以得到用于识别个体行为画像的所述预设用户画像识别模型,以便利用所述预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像。
24、可选的,所述将所述目标画像对应的所述第二敏感信息确定最终敏感信息之后,还包括:
25、分别对个体行为画像为目标画像的所述最终敏感信息以及个体行为画像为非目标画像的敏感信息进行保存,以便工作人员进行处理。
26、第二方面,本申请提供了一种社交媒体敏感信息识别装置,包括:
27、信息抓取模块,用于在社交媒体上抓取用户发送的内容以得到待识别信息;
28、敏感信息识别模块,用于通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;
29、画像识别模块,用于根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;
30、敏感信息确定模块,用于将所述目标画像对应的所述第二敏感信息确定最终敏感信息。
31、第三方面,本申请提供了一种电子设备,包括:
32、存储器,用于保存计算机程序;
33、处理器,用于执行所述计算机程序以实现如上述的社交媒体敏感信息识别方法。
34、第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的社交媒体敏感信息识别方法。
35、由此可见,本申请可以在社交媒体上抓取用户发送的内容以得到待识别信息;然后通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;再根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;然后将所述目标画像对应的所述第二敏感信息确定最终敏感信息。由此可见,本申请可以在通过预设敏感信息识别技术以及预设伪造信息识别模型判断出敏感信息之后,再结合敏感信息对应的个体行为画像判断出最终敏感信息,这样一来,可以提高最终敏感信息的可信度,以便后续进行敏感信息分析的操作。
1.一种社交媒体敏感信息识别方法,其特征在于,包括:
2.根据权利要求1所述的社交媒体敏感信息识别方法,其特征在于,所述通过预设敏感信息识别技术对所述待识别信息进行判断以得到第一敏感信息,包括:
3.根据权利要求1所述的社交媒体敏感信息识别方法,其特征在于,所述将基于预设伪造信息识别模型对所述第一敏感信息进行判断得到为非伪造的信息确定为第二敏感信息,包括:
4.根据权利要求3所述的社交媒体敏感信息识别方法,其特征在于,所述基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息之前,还包括:
5.根据权利要求3所述的社交媒体敏感信息识别方法,其特征在于,所述基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息之前,还包括:
6.根据权利要求1所述的社交媒体敏感信息识别方法,其特征在于,所述根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像之前,还包括:
7.根据权利要求1至6任一项所述的社交媒体敏感信息识别方法,其特征在于,所述将所述目标画像对应的所述第二敏感信息确定最终敏感信息之后,还包括:
8.一种社交媒体敏感信息识别装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的社交媒体敏感信息识别方法。