一种互联网app垃圾信息鉴定系统及方法

文档序号:10516667阅读:182来源:国知局
一种互联网app垃圾信息鉴定系统及方法
【专利摘要】本发明公开了一种互联网APP垃圾信息鉴定系统及方法,匹配鉴定模块采用历史垃圾信息数据作参考来鉴定指定类型的信息是否为垃圾信息或是垃圾信息的可疑程度值,以及垃圾信息的类型,还采用产生历史垃圾信息的用户数据或设备数据鉴定指定用户或设备,是否产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值,以及产生垃圾信息的类型;信息数据管理模块用于收集历史垃圾信息数据,并提供给匹配鉴定模块进行参考比较;用户数据管理模块用于收集产生历史垃圾信息的用户数据,并提供给匹配鉴定模块进行参考比较;设备数据管理模块用于收集产生历史垃圾信息的设备数据,并提供给匹配鉴定模块进行参考比较。采用本发明可大大提高鉴定效率,有效的遏制垃圾信息的传播。
【专利说明】
一种互联网APP垃圾信息鉴定系统及方法
技术领域
[0001]本发明涉及一种互联网信息技术,尤其涉及的是一种互联网APP垃圾信息鉴定系统及方法。
【背景技术】
[0002]现在互联网APP(AppliCat1n,智能应用程序)的垃圾信息非常泛滥,影响恶劣。产生垃圾信息的人,都是以团伙作战,遍历攻击市面上绝大部分主流的APP。尤其是一些UGC(UserGeneratedContent,用户产生内容)的APP,如社交类APP。其中包括了一些特点:
[0003]1、垃圾信息具有非常大的隐蔽性,比如说卖淫信息,会写成“学生微信125897”,甚至直接写成“weixinl25897”。有时候还会加入一些特殊的标点符号、错别字、随机数,甚至将文字绘制到图片中。而且会不断根据APP封杀情况进行演变。因此单从信息内容本身去鉴定,机器自动化实现难度很高,更多的是通过人工鉴定,效率很低。
[0004]2、虽然鉴定难度很高,但是这群垃圾信息团伙本身文化程度不高,而且攻击APP都比较集中。因此他们在不同APP中,产生垃圾信息的内容、用户、设备,都具有很大的集中性、高频性、重复性、相似性。如团伙高频使用同一批手机号码、同一批手机设备,疯狂的在不同APP中刷相同的广告。因此如果可以提供一个云平台系统,为所有的APP提供鉴定能力和经验数据的共享,那么对垃圾信息的鉴定效率将会大大提高,对维护互联网的良好环境有很大的作用。
[0005]3、现在市面上互联网的垃圾信息鉴定系统,更多的是单纯从信息内容本身鉴定,少有从垃圾信息的产生源头去跟踪控制,也没有针对APP之间共享鉴定经验数据的做法。
[0006]传统的互联网APP垃圾信息鉴定系统的技术原理为:1、对信息内容,如文字、图片进行匹配;2、匹配方法包括准确匹配、模板匹配、模糊匹配、神经网络自适应匹配;3、匹配吻合度达到一定阈值之后,就鉴定为垃圾信息。
[0007]其缺点为:在提前预防方面,只是基于已经产生的垃圾信息,进行匹配鉴定;没有对产生垃圾信息的来源,如用户、设备,进行有效的跟踪和利用,从而无法提前避免产生新的垃圾信息。
[0008]在鉴定准确度和效率方面,对于一些比较隐蔽的垃圾信息,如单纯的手机号码、微信号码,无法进行准确鉴定;不同APP之间,并没有共享鉴定方面的经验数据,效率有限;
[0009]举例1:一个用户在APP社区里面发了一张图片,里面的内容只是\eixinl589768”,实质上这是一个诈骗的微信号,但是传统的垃圾信息鉴定方法很难鉴定出来。
[0010]举例2:—个诈骗份子在一个APP中发了大量诈骗信息,他被该APP封号了,但是他仍然可以在另外一个APP继续发诈骗信息,直到又被封号为止。实际上,只要通过平台系统做到数据共享,诈骗份子在第二个APP注册的时候,就可以提前进行系统预警,严格监控其行为。
[0011]因此,现有技术还有待于改进和发展。

【发明内容】

[0012]本发明的目的在于提供一种互联网APP垃圾信息鉴定系统及方法,旨在解决现有的APP不能有效和快速的监控和识别垃圾信息的问题。
[0013]本发明的技术方案如下:
[0014]一种互联网APP垃圾信息鉴定系统,其包括匹配鉴定模块、信息数据管理模块、用户数据管理模块和设备数据管理模块,所述系统与APP的客户端或服务器互联传递数据,所述匹配鉴定模块采用历史垃圾信息数据作参考来鉴定指定类型的信息是否为垃圾信息或是垃圾信息的可疑程度值,以及垃圾信息的类型,还采用产生历史垃圾信息的用户数据或设备数据鉴定指定用户或设备,是否产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值,以及产生垃圾信息的类型;所述信息数据管理模块用于收集历史垃圾信息数据,并提供给匹配鉴定模块进行参考比较;所述用户数据管理模块用于收集产生历史垃圾信息的用户数据,并提供给匹配鉴定模块进行参考比较;所述设备数据管理模块用于收集产生历史垃圾信息的设备数据,并提供给匹配鉴定模块进行参考比较。
[0015]所述的系统,其所述指定类型的信息包括文字、图片、音频或视频。
[0016]所述的系统,其所述匹配鉴定模块鉴定的具体方法为:直接从信息内容本身进行匹配鉴定,匹配方法包括但不限于准确匹配、模板匹配、模糊匹配、摘要匹配、关键字匹配、神经网络自适应匹配;然后与历史垃圾信息数据进行比较,综合鉴定;与产生历史垃圾信息的用户数据进行比较,综合鉴定;与产生历史垃圾信息的设备数据进行比较,综合鉴定。
[0017]一种互联网APP垃圾信息鉴定方法,其具体流程如下:
[0018]步骤1:APP将用户提交的信息内容以及用户信息、设备信息、业务信息一同提交给鉴定系统,并指定鉴定的严格等级;或者APP向系统提交请求,请求鉴定指定用户或设备是否为产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值可疑程度值;
[0019]步骤2:系统会依据步骤I提交的内容,先按照指定的鉴定严格等级直接从信息内容本身进行匹配鉴定;然后与系统中存储的历史垃圾信息数据、产生历史垃圾信息的用户数据或产生历史垃圾信息的设备数据进行比较实施匹配鉴定,并将鉴定结果返回给APP;其输出的结果为是否为垃圾信息或是垃圾信息的可疑程度值以及垃圾信息的类型,其输出的结果为指定用户是否为产生垃圾信息的用户,或该用户产生垃圾信息的可疑程度值,以及产生垃圾信息的类型;其输出的结果还包括指定设备是否为产生垃圾信息的设备,或该设备产生垃圾信息的可疑程度值,以及产生垃圾信息的类型。
[0020]所述的鉴定方法,还包括步骤5:APP主动举报,APP后台服务器发现垃圾信息或产生垃圾信息的用户、设备,则主动向系统举报。
[0021]所述的鉴定方法,其还包括步骤6:垃圾信息告警通知,系统发现指定严重的垃圾信息骚扰行为,则向APP发送告警通知。
[0022]所述的鉴定方法,其所述信息内容包括:文字内容、图片文件或其URL、视频文件或其URL、音频文件或其URL;所述用户信息包括:用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间、用户最近操作时间;所述设备信息包括:手机MAC地址、手机頂EI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间、是否为虚拟机等;所述业务信息包括:APP识别ID、APP业务事件类型或APP业务事件操作时间。
[0023]所述的鉴定方法,其所述指定用户的范围包括但不限于指定的用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间或用户最近操作时间;所述指定设备的范围包括指定的手机MAC地址、手机頂EI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间或是否为虚拟机。
[0024]本发明的有益效果:本发明通过将不同APP的鉴定数据共享,大大提高鉴定效率。经过经验共享,以后在其他APP就可以提高鉴定准确度。同时能够鉴定用户产生的信息是否为垃圾信息,或垃圾信息的可疑程度值,以及垃圾信息的类型,能够有效的遏制垃圾信息的传播。
【附图说明】
[0025]图1是本发明提供的系统的功能模块框图。
【具体实施方式】
[0026]为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。
[0027]参见图1,本发明提供的系统为一个云端服务器系统,其包括:匹配鉴定模块、信息数据管理模块、用户数据管理模块和设备数据管理模块。所述系统与APP的客户端或在服务器互联传递数据。
[0028]所述匹配鉴定模块用于鉴定指定类型的信息,如文字、图片、音频、视频,是否为垃圾信息或是垃圾信息的可疑程度值,以及垃圾信息的类型。还用于鉴定指定用户或设备,是否产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值,以及产生垃圾信息的类型。
[0029]所述匹配鉴定模块鉴定的具体方法为:
[0030]直接从信息内容本身进行匹配鉴定,匹配方法包括但不限于准确匹配、模板匹配、模糊匹配、摘要匹配、关键字匹配、神经网络自适应匹配;
[0031]与历史垃圾信息数据进行比较,综合鉴定;与产生历史垃圾信息的用户数据进行比较,综合鉴定;与产生历史垃圾信息的设备数据进行比较,综合鉴定。
[0032]所述信息数据管理模块用于收集历史垃圾信息数据,并提供给匹配鉴定模块进行参考比较。
[0033]所述用户数据管理模块用于收集产生历史垃圾信息的用户数据,并提供给匹配鉴定模块进行参考比较;会考虑时间衰减因素,如一个用户距上次产生垃圾信息的时间间隔很久,则会将匹配的权重降低。
[0034]所述设备数据管理模块用于收集产生历史垃圾信息的设备数据,并提供给匹配鉴定模块进行参考比较;会考虑时间衰减因素,如一个设备距上次产生垃圾信息的时间间隔很久,则会将匹配的权重降低。
[0035]所述系统与APP交互的方式可以是与APP客户端进行或者是与APP的后台服务器进行,本发明优选实施例是与APP后台服务器进行交互。其具体流程如下:
[0036]步骤1:步骤1:APP将用户提交的信息内容以及用户信息、设备信息、业务信息一同提交给鉴定系统,并指定鉴定的严格等级;或者APP向系统提交请求,请求鉴定指定用户或设备是否为产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值可疑程度值;
[0037]其中信息内容包括:文字内容、图片文件或其URL、视频文件或其URL、音频文件或其URL;其中用户信息包括:用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间、用户最近操作时间等;其中设备信息包括:手机MAC地址、手机頂EI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间、是否为虚拟机等;其中业务信息包括:APP识别ID、APP业务事件类型、APP业务事件操作时间等;
[0038]步骤2:系统会依据步骤I提交的内容,先按照指定的鉴定严格等级直接从信息内容本身进行匹配鉴定;然后与系统中存储的历史垃圾信息数据、产生历史垃圾信息的用户数据或产生历史垃圾信息的设备数据进行比较实施匹配鉴定,并将鉴定结果返回给APP;其输出的结果为是否为垃圾信息或是垃圾信息的可疑程度值以及垃圾信息的类型,其输出的结果为指定用户是否为产生垃圾信息的用户,或该用户产生垃圾信息的可疑程度值,以及产生垃圾信息的类型;其输出的结果还包括指定设备是否为产生垃圾信息的设备,或该设备产生垃圾信息的可疑程度值,以及产生垃圾信息的类型。
[0039]其中,指定用户的范围包括但不限于指定的用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间、用户最近操作时间等;指定设备的范围包括但不限于指定的手机MAC地址、手机MEI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间、是否为虚拟机等。
[0040]如果内容为“卖面膜微信123456”,那么直接采用信息内容鉴定,就能鉴定为垃圾广告。如果内容为“微信123456”,那么直接采用信息内容鉴定,那么鉴别的准确度就不会太高,此时就要结合历史数据,从历史数据判断这个微信号是不是与垃圾信息相关。因此,两种方式是结合使用的。
[0041]步骤3:APP主动举报,APP后台服务器发现垃圾信息或产生垃圾信息的用户、设备,则主动向系统举报;系统会将相关信息进行收集,用于作后续权重判断;
[0042]例如:如果超过10个APP对同一个手机号码的用户举报为“发布诈骗信息的人”,则鉴定系统可自动将该用户定性为“极有可能发布诈骗信息的人”。
[0043]步骤4:垃圾信息告警通知,系统发现指定严重的垃圾信息骚扰行为,则向APP发送告警通知,告警通知的方式,包括但不限于邮件、短息、网络推送消息等方式。
[0044]鉴定垃圾信息的时候,可以按照不同信息的类型,设置鉴定的严格程度。比如,对于公开的内容,如发表文章、发表评论,鉴定的严格程度更高。对于私密的内容,如聊天内容,鉴定的严格程度可以低一些。
[0045]具体实施例
[0046]1、一个社交APP,每天有好几十万的聊天记录或图片数据。通过本发明的系统可以快速的判断出哪些聊天记录或则图片是垃圾信息,以及快速的定位到产生垃圾信息的用户、设备。
[0047]2、一个社交APP,正常每天注册有1000个用户,突然某天暴涨到I万个用户。通过本发明提供的系统则可快速的判断出哪些新注册用户可能是有问题的用户,这些用户过去在其他APP有不良的记录,极有可能会产生不良信息APP可以按照这个系统的判断情况,加以重点监控可疑用户。
[0048]还有日常UGC(用户产生数据)的审查、以及新增、活跃用户的变化,都需要考虑到垃圾信息的攻击,这也是此系统的使用场景。
[0049]本发明提供互联网APP垃圾信息鉴定系统,具有以下有益效果:1、不同APP可以通过此系统,鉴定用户产生的信息是否为垃圾信息,或垃圾信息的可疑程度值,以及垃圾信息的类型,如色情、暴力、政治、广告、虚假、诈骗等;2、不同APP可以通过此系统,鉴定指定用户是否为产生垃圾信息的用户,或产生垃圾信息的用户的可疑程序值;3、不同APP可以通过此系统,鉴定指定设备是否为产生垃圾信息的设备,或产生垃圾信息的设备的可疑程序值;4、系统在鉴定垃圾信息的同时,收集产生垃圾信息的源头信息,如用户信息、设备信息、APP业务信息,所述用户信息包括但不限于:用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间、用户最近操作时间等;所述设备信息包括但不限于:手机MAC地址、手机頂EI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间、是否为虚拟机等;所述APP业务信息包括但不限于:APP识别ID、APP业务事件类型、APP业务事件操作时间等,APP识别ID是指不同APP在这个鉴定系统中唯一识别ID,APP业务事件指用户提交信息的业务类型,如发表文章、评论、聊天等事件。5、不同APP可以通过此系统,在鉴定信息、用户、设备的时候,彼此共享历史经验数据,提高其准确度和效率。
[0050]本发明提供的系统能够使垃圾信息在一处APP传播后,就可迅速暴露被监控上,使其无法在任何APP继续作案。
[0051]应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
【主权项】
1.一种互联网APP垃圾信息鉴定系统,其特征在于,包括匹配鉴定模块、信息数据管理模块、用户数据管理模块和设备数据管理模块,所述系统与APP的客户端或服务器互联传递数据,所述匹配鉴定模块采用历史垃圾信息数据作参考来鉴定指定类型的信息是否为垃圾信息或是垃圾信息的可疑程度值,以及垃圾信息的类型,还采用产生历史垃圾信息的用户数据或设备数据鉴定指定用户或设备,是否产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值,以及产生垃圾信息的类型;所述信息数据管理模块用于收集历史垃圾信息数据,并提供给匹配鉴定模块进行参考比较;所述用户数据管理模块用于收集产生历史垃圾信息的用户数据,并提供给匹配鉴定模块进行参考比较;所述设备数据管理模块用于收集产生历史垃圾信息的设备数据,并提供给匹配鉴定模块进行参考比较。2.根据权利要求1所述的系统,其特征在于,所述指定类型的信息包括文字、图片、音频或视频。3.根据权利要求1所述的系统,其特征在于,所述匹配鉴定模块鉴定的具体方法为:直接从信息内容本身进行匹配鉴定,匹配方法包括但不限于准确匹配、模板匹配、模糊匹配、摘要匹配、关键字匹配或神经网络自适应匹配;然后与历史垃圾信息数据进行比较,综合鉴定;与产生历史垃圾信息的用户数据进行比较,综合鉴定;与产生历史垃圾信息的设备数据进行比较,综合鉴定。4.一种互联网APP垃圾信息鉴定方法,其特征在于,具体流程如下: 步骤1:APP将用户提交的信息内容以及用户信息、设备信息、业务信息一同提交给鉴定系统,并指定鉴定的严格等级;或者APP向系统提交请求,请求鉴定指定用户或设备是否为产生垃圾信息的用户或设备,或用户或设备产生的是垃圾信息的可疑程度值可疑程度值; 步骤2:系统会依据步骤I提交的内容,先按照指定的鉴定严格等级直接从信息内容本身进行匹配鉴定;然后与系统中存储的历史垃圾信息数据、产生历史垃圾信息的用户数据或产生历史垃圾信息的设备数据进行比较实施匹配鉴定,并将鉴定结果返回给APP;其输出的结果为是否为垃圾信息或是垃圾信息的可疑程度值以及垃圾信息的类型,其输出的结果为指定用户是否为产生垃圾信息的用户,或该用户产生垃圾信息的可疑程度值,以及产生垃圾信息的类型;其输出的结果还包括指定设备是否为产生垃圾信息的设备,或该设备产生垃圾信息的可疑程度值,以及产生垃圾信息的类型。5.根据权利要求4所述的鉴定方法,其特征在于,还包括步骤3:APP主动举报,APP后台服务器发现垃圾信息或产生垃圾信息的用户、设备,则主动向系统举报。6.根据权利要求4所述的鉴定方法,其特征在于,还包括步骤4:垃圾信息告警通知,系统发现指定严重的垃圾信息骚扰行为,则向APP发送告警通知。7.根据权利要求4、5或6所述的鉴定方法,其特征在于,所述信息内容包括:文字内容、图片文件或其URL、视频文件或其URL、音频文件或其URL;所述用户信息包括:用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间、用户最近操作时间;所述设备信息包括:手机MAC地址、手机頂EI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间、是否为虚拟机等;所述业务信息包括:APP识别ID、APP业务事件类型或APP业务事件操作时间。8.根据权利要求4、5或6所述的鉴定方法,其特征在于,所述指定用户的范围包括但不限于指定的用户名、用户ID、手机号码、邮箱、QQ号、微信号、微博号、第三方登录平台ID、用户注册时间或用户最近操作时间;所述指定设备的范围包括指定的手机MAC地址、手机頂EI号、手机制造商ID、电脑MAC地址、接入路由器MAC地址、APP内产生唯一设备ID、接入IP地址、设备最近操作时间或是否为虚拟机。
【文档编号】H04W12/12GK105873064SQ201610182354
【公开日】2016年8月17日
【申请日】2016年3月28日
【发明人】伍文华
【申请人】伍文华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1