本发明涉及信息识别,涉及一种冒充用户信息的识别方法及系统,尤其涉及冒充昵称和/或头像的识别方法及系统。
背景技术:
1、用户在使用社交软件时,会拥有专属头像和昵称,头像和昵称成为判断用户身份的重要依据。与此同时,冒充用户的头像和/或昵称进行行骗的情况也随之发生。作案用户通过冒待保护用户的头像和/或昵称进行诈骗,在此场景下,通过计算头像和/或昵称的相似度,可以有效识别冒充的昵称和/或头像,从而对诈骗行为进行识别。
2、现有图像/音频/文本/视频等媒体数据,在进行表征之后,均可以进行相似度的计算,媒介数据之间的相似程度便可以直观地进行量化,同时,不同的量化方法在会产生不同的结果。在实际反冒充诈骗业务场景中,通常通过匹配式检索判断嫌疑昵称是否为冒充昵称,通过将嫌疑头像与保护库中的头像进行人工比对,判断是否为冒充头像。上述方式虽然可以解决一些头像和/或昵称的完全冒充行为,但是识别效率较低问题,不利于及时发现冒充/诈骗行为。
技术实现思路
1、本发明提供了一种冒充用户信息的识别方法及系统,用于解决现有技术在进行嫌疑用户信息(冒充昵称和/或头像)识别时,识别效率较低的技术问题。
2、本发明提供了一种冒充用户信息的识别方法,包括:
3、s1、获取嫌疑用户信息;
4、s2、对所述嫌疑用户信息进行预处理,得到嫌疑用户数据;
5、s3、基于预置匹配算法,将所述嫌疑用户数据与预置保护库中的所有待保护用户数据进行匹配,根据匹配结果对所有所述待保护用户数据进行排序,得到待保护用户排序数据;
6、s4、基于预置召回策略和所述待保护用户排序数据,对所述待保护用户数据进行过滤,将满足预设需求的待保护用户数据记为过滤用户数据,将所述过滤用户数据对应的待保护用户信息输出为被冒充用户信息。
7、优选的,
8、所述嫌疑用户信息包括嫌疑昵称和嫌疑头像;所述嫌疑昵称和所述嫌疑头像相匹配;
9、所述待保护用户数据包括待保护昵称数据和待保护头像数据;所述待保护昵称数据和所述待保护头像数据相匹配;
10、所述预置匹配算法为预置昵称匹配算法或预置头像匹配算法;
11、所述预置召回策略为预置昵称召回策略或预置头像召回策略或预置昵称头像联合召回策略或预置头像昵称联合召回策略;
12、所述预设需求为预设昵称需求或预设头像需求或预设昵称头像联合需求或预设头像昵称联合需求;
13、所述过滤用户数据为过滤昵称数据或过滤头像数据或过滤昵称头像联合数据或过滤头像昵称联合数据。
14、优选的,步骤s2包括:
15、s2a、对所述嫌疑昵称进行文本预处理,得到嫌疑昵称数据。
16、优选的,步骤s2还包括:
17、s2b、对所述嫌疑头像进行图像预处理,得到嫌疑头像数据。
18、优选的,步骤s3包括:
19、s3a、基于所述预置昵称匹配算法,将所述嫌疑昵称数据与预置保护库中的所有待保护昵称数据进行匹配,根据昵称匹配结果对所有所述待保护昵称数据进行排序,得到待保护昵称排序数据。
20、优选的,步骤s3包括:
21、s3b、基于所述预置头像匹配算法,将所述嫌疑头像数据与预置保护库中的所有待保护头像数据进行匹配,根据头像匹配结果对所有所述待保护头像数据进行排序,得到待保护头像排序数据。
22、优选的,步骤s3包括:
23、s3c、基于所述预置昵称匹配算法,将所述嫌疑昵称数据与预置保护库中的所有待保护昵称数据进行匹配,根据昵称匹配结果对所有所述待保护昵称数据进行排序,得到待保护昵称排序数据;
24、基于所述预置昵称召回策略和所述待保护昵称排序数据,对所述待保护昵称数据进行过滤,将满足预设昵称需求的待保护昵称数据记为过滤昵称数据,将与所述过滤昵称数据匹配的待保护头像数据记为第一待保护头像数据;
25、基于所述预置头像匹配算法,将所述嫌疑头像数据与所述第一待保护头像数据进行匹配,根据第一头像匹配结果对所有所述第一待保护头像数据进行排序,得到第一待保护头像排序数据。
26、优选的,步骤s3包括:
27、s3d、基于所述预置头像匹配算法,将所述嫌疑头像数据与预置保护库中的所有待保护头像数据进行匹配,根据头像匹配结果对所有所述待保护头像数据进行降序排序,得到待保护头像排序数据;
28、基于所述预置头像召回策略和所述待保护头像排序数据,对所述待保护头像数据进行过滤,将满足预设头像需求的待保护头像数据记为过滤头像数据,将与所述过滤头像数据匹配的待保护昵称数据记为第一待保护昵称数据;
29、基于所述预置昵称匹配算法,将所述嫌疑昵称数据与所述第一待保护昵称数据进行匹配,根据第一昵称匹配结果对所有所述第一待保护昵称数据进行排序,得到第一待保护昵称排序数据。
30、优选的,在步骤s3a之后,步骤s4具体为:
31、s4a、基于所述预置昵称召回策略和所述待保护昵称排序数据,对所述待保护昵称数据进行过滤,将满足预设昵称需求的待保护昵称数据记为过滤昵称数据,将所述过滤昵称数据对应的待保护昵称输出为被冒充昵称。
32、优选的,在步骤s3b之后,步骤s4具体为:
33、s4b、基于所述预置头像召回策略和所述待保护头像排序数据,对所述待保护头像数据进行过滤,将满足预设头像需求的待保护头像数据记为过滤头像数据,将所述过滤头像数据对应的待保护头像输出为被冒充头像。
34、优选的,在步骤s3c之后,步骤s4具体为:
35、s4c、基于所述预置昵称头像联合召回策略和所述第一待保护头像排序数据,对所述第一待保护头像数据进行过滤,将满足预设昵称头像联合需求的第一待保护头像数据记为第一过滤头像数据,将所述第一过滤头像数据对应的待保护头像输出为被冒充头像,将与所述第一过滤头像数据匹配的待保护昵称数据对应的待保护昵称输出为被冒充昵称。
36、优选的,在步骤s3d之后,步骤s4具体为:
37、s4d、基于所述预置头像昵称联合召回策略和所述第一待保护昵称排序数据,对所述第一待保护昵称数据进行过滤,将满足预设头像昵称联合需求的第一待保护昵称数据记为第一过滤昵称数据,将所述第一过滤昵称数据对应的待保护昵称输出为被冒充昵称,将与所述第一过滤昵称数据匹配的待保护头像数据对应的待保护头像输出为被冒充头像。
38、优选的,步骤s2a具体包括:
39、对所述嫌疑昵称进行数字归一化、字母大小写转化、汉字繁简转化、火星文转化和通用词过滤,得到嫌疑昵称数据;
40、或基于预设语义表征模型对所述嫌疑昵称进行向量转化,得到嫌疑昵称数据。
41、优选的,步骤s2b具体包括:
42、对所述嫌疑头像进行图像缩放、图像翻转、图像二值化和图像压缩,得到嫌疑头像数据;
43、或基于预设图像表征模型对所述嫌疑头像进行向量转化,得到嫌疑头像数据。
44、优选的,在步骤s4之后还包括:
45、将所述被冒充用户信息存储为更新保护用户信息,基于所述更新保护用户信息对所述预置匹配算法进行更新。
46、优选的,在步骤s4之后还包括:
47、将所述被冒充用户信息与对应的所述嫌疑用户信息打包存储并展示。
48、优选的,在步骤s4之后还包括:
49、向所述被冒充用户信息对应的被冒充用户发送被冒充风险提醒。
50、一种冒充用户信息的识别系统,包括:
51、嫌疑信息获取模块,获取嫌疑用户信息;
52、嫌疑信息预处理模块,用于对所述嫌疑用户信息进行预处理,得到嫌疑用户数据;
53、信息匹配排序模块,用于基于预置匹配算法,将所述嫌疑用户数据与预置保护库中的所有待保护用户数据进行匹配,根据匹配结果对所有所述待保护用户数据进行降序排序,得到待保护用户排序数据;
54、识别输出模块,用于基于预置召回策略和所述待保护用户排序数据,对所述待保护用户数据进行过滤,将满足预设需求的待保护用户数据记为过滤用户数据,将所述过滤用户数据对应的待保护用户信息输出为被冒充用户信息。
55、从以上技术方案可以看出,本发明具有以下优点:
56、本技术提供了一种冒充用户信息的识别方法及系统,方法包括:获取嫌疑用户信息,然后对嫌疑用户信息进行预处理,得到嫌疑用户数据,进一步将嫌疑用户数据与预置保护库中的所有待保护用户数据进行匹配,根据匹配结果对所有待保护用户数据进行降序排序,得到待保护用户排序数据,最后基于预置召回策略和所述待保护用户排序数据,对所述待保护用户数据进行过滤,将满足预设需求的待保护用户数据记为过滤用户数据,将所述过滤用户数据对应的待保护用户信息输出为被冒充用户信息。
57、本技术提供的一种冒充用户信息的识别方法,首先将嫌疑用户信息与预置保库中的所有/指定待保护待保用户信息进行匹配,依据匹配结果(相似度)将待保护用户信息进行排序,进一步,采用预置召回策略对已经排序好的用户信息进行过滤,筛选出满足预设需求的待保护用户信息,采用先排序后过滤的方式对嫌疑用户信息进行识别,可有效提高识别效率,以较快的速度发现诈骗行为。