一种用于检测互动平台中爆发信息的方法与设备的制作方法

文档序号:6432537阅读:91来源:国知局
专利名称:一种用于检测互动平台中爆发信息的方法与设备的制作方法
技术领域
本发明涉及网络技术领域,尤其涉及一种用于检测互动平台中爆发信息的技术。
背景技术
随着网络技术的不断发展,越来越多的用户通过网络互动平台进行信息的交流,进而达到了消息快速传播的目的,但是也随之出现一种在网络互动平台中爆发信息的现象。该信息爆发的现象通过在短时间之内有组织地、不断重复地发送相同或相似无意义内容,使其他正常用户无法进行正常发言,且正常发言会很快被大量无意义爆发信息所淹没。该信息爆发现象严重影响了互动平台中的正常秩序,阻碍了信息的正常发布和接收以及网络用户间的正常交流。因此,如何有效地检测互动平台中爆发信息,成为目前亟待解决的问题之一。

发明内容
本发明的目的是提供一种检测互动平台中爆发信息的方法与设备。根据本发明的一个方面,提供了一种计算机实现的用于检测互动平台中爆发信息的方法,其中,该方法包括以下步骤a获取互动平台中多个发布信息;b根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;c通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;d根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。根据本发明的另一方面,还提供了一种用于检测互动平台中爆发信息的设备,其中,该设备包括信息获取装置,用于获取互动平台中多个发布信息;群发模式获取装置,用于根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;爆发模式获取装置,用于通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置,用于根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。与现有技术相比,本发明通过判断互动平台中多个发布信息的爆发模式,进而确定与该爆发模式相对应的爆发信息,由此可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图I示出根据本发明一个方面用于检测互动平台中爆发信息的设备示意图;图2示出根据本发明一个方面用于检测互动平台中爆发信息的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图I示出根据本发明一个方面用于检测互动平台中爆发信息的设备示意图。检测设备I包括信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14。在此,检测设备I包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。具体地,信息获取装置11获取互动平台中多个发布信息。更具体地,信息获取装置11在预定的时间间隔内或连续地获取互动平台或互动平台的特定版块中多个发布信息,例如通过实时监听用户通过用户设备提交的发布信息提交请求,以获取用户输入的发布信息,或者在预定的时间间隔内周期性地通过约定的通信方式,如http、https等通信协议,从互动平台中提取最新的多个发布信息。例如,检测设备I为论坛的网络服务器,用户通过用户设备通过该论坛的网页输入界面输入一段文本信息作为发布信息,然后,用户设备将该发布信息作为该论坛的发帖包装成http请求并通过http通信协议提交到检测设备I的信息获取装置11,接着,信息获取装置11通过实时监听用户消息,接收并解析该http请求,获取其中的发布信息。再如,信息获取装置11每隔五分钟周期地提取互动平台中最新的多个发布信息。在此,所述互动平台包括但不限于社区、论坛、博客、微博,购物网站中对商品的点评、新闻评论、短信互动等。本领域技术人员应能理解上述获取多个发布信息的方式仅为举例,其他现有的或今后可能出现的获取多个发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。随后,群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式。具体地,群发模式获取装置12根据信息获取装置11获取的多个发布信息,通过例如对该些发布信息相互之间进行分析比对,以判断该些多个发布信息是否具有相同或相似的发布特征,进而获取与该些多个发布信息相对应的一个或多个群发模式。其中,所述群发模式意为由信息发布者发布的具有相同或相似发布特征的多个发布信息的信息发布模式,例如某一论坛中就某一热点话题,多个信息发布者发布具有多个相同关键词的帖子的信息发布模式,或者某一论坛中,由多个信息发布者发布的内容完全相同的帖子的信息发布模式。例如,信息获取装置11在论坛的网球版块中获取100个发布信息,群发模式获取装置12将该100个发布信息相互之间进行分析比对,以获得该100个发布信息中的90个发布信息的标题均具有关键词“李娜”、“夺冠”,则据此可获取与该90个发布信息相对应的一个群发模式。又例如,信息获取装置11在论坛的李宇春版块中获取的100个发布信息,群发模式获取装置12将该100个发布信息相互之间进行分析比对,判断获得其中有80个发布信息的标题中的中文字符均相同,进而可获取与该80个发布信息相对应的一个群发模式。本领域技术人员应能理解上述获取群发模式的方式仅为举例,其他现有的或今后可能出现的获取群发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。接着,爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式。具体地,爆发模式获取装置13将群发模式获取装置12获取的一个或多个群发模式在爆发模式库中进行匹配查询,例如将该一个或多个群发模式与该爆发模式库中的爆发模式进行匹配,或者通过将具有群发模式特征的多个发布信息相互之间进行比较分析,以提取其发布特征,进而将该些发布特征在爆发模式库中与多个爆发模式进行匹配,并据此匹配获得与该(些)群发模式相对应的一个或多个爆发模式。其中,所述爆发模式包括但不限于多个发布信息的标题内容的字符数值相同,多个发布信息内容在只保留中文字符时的中文字符数相同,信息发布者账号内容在只保留中文字符时相同,多个发布信息的标题内容为诗句,多个发布信息的内容为歌词等。在此,所述爆发模式库用于存储爆发模式。例如,群发模式获取装置12获取与网球版块中关键词均为“李娜” “夺冠”的90个发布信息相对应的一个群发模式;接着,爆发模式获取装置13将该些发布信息相互之间进行比较分析,以提取其全部发布特征为该些发布信息的标题中均含有关键词“李娜” “夺冠”,且该90个发布信息中的80个发布信息为含有“RE”的回复信息,进而将该些发布特征在爆发模式库中进行匹配查询,未匹配获得与该发布特征相对应的爆发模式。又例如,群发模式获取装置12获取80个发布信息相对应的一个群发模式,该群发模式为发布信息标题的中文字数均相同;接着,爆发模式获取装置13将该些发布信息相互之间进行比较分析,获取发布信息的标题中文字符均为“床前明月光,疑是地上霜”,进而在爆发模式库中匹配获得与该80个发布信息相对应的爆发模式为标题内容为相同诗句的爆发模式。本领域技术人员应能理解上述获取爆发模式的方式仅为举例,其他现有的或今后可能出现的获取爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。具体地,确定装置14根据爆发模式获取装置13获取的爆发模式,确定与该(些)爆发模式相对应的发布信息信息以作为爆发信息,其中,所述爆发信息意为具有符合爆发模式特征的发布信息。例如,爆发模式获取装置13获取的爆发模式为标题内容为相同诗句的爆发模式,确定装置14根据该爆发模式,提取其所对应的多个发布信息,并将该些发布信息作为爆发信息。本领域技术人员应能理解上述确定爆发信息的方式仅为举例,其他现有的或今后可能出现的确定爆发信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14之间是持续不断地工作。具体地,信息获取装置11获取互动平台中多个发布信息;随后,群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;接着,爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;接着,确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。在此,本领域技术人员应理解“持续”是指各装置分别按照设定的或实时调整的工作模式要求进行发布信息的获取、群发模式的获取、爆发模式的获取及爆发信息的确定,直至信息获取装置11在较长时间内停止对互动平台中多个发布信息的获取。优选地,所述爆发模式包括但不限于以下至少任一项-标题队列模式;-用户队列模式;-内容队列模式。具体地,标题队列模式包括但不限于1)多个发布信息的标题内容的字符数相 同;2)多个发布信息的标题内容中带有相同的特殊字符前缀;3)多个发布信息的标题内容中相同字符数与总字符的比值超过预设的比例阈值;4)多个发布信息的标题内容均不包含中文字符。例如,四个发布信息的标题内容为a床前明月光b疑是地上霜c举头望明月d低头思故乡该四个发布信息的标题内容字数相同,则该四个发布信息属于爆发模式中的标题队列模式,即“多个发布信息的标题内容的字符数相同”。又例如,五个发布信息的标题内容为a Fighting !b My friends !c Fighting !d My brothers !e Never give up !该五个发布信息的标题内容均不包含中文字符,则该五个发布信息属于爆发模式中的标题队列模式,即“多个发布信息的标题内容均不包含中文字符”。本领域技术人员应能理解上述标题队列模式仅为举例,其他现有的或今后可能出现的标题队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。用户队列模式包括但不限于1)信息发布者账号内容相同或相似2)在去除信息发布者账号内容中的无意义字符、数字等后其账号内容相同或相似;3)信息发布者账号内容中的中文字符相同或相似;4)在去除信息发布者账号内容中的无意义字符、数字等后其账号内容中的中文字符相同或相似。例如,五个发布信息的信息发布者账号内容为I)水军军团@12)水军军团@23)水军军团@34)水军军团&55)水军军团&6将该五个信息发布者账号内容中的无意义字符和数字“1”、“2”、“3”、“5”、“6”去除,所保留的中文字符均相同为“水军军团”,则该五个发布信息属于爆发模式中的用户队列模式。本领域技术人员应能理解上述用户队列模式仅为举例,其他现有的或今后可能出现的用户队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。内容队列模式包括但不限于1)多个发布信息内容的字符数值相同;2)多个发布信息内容的中文字符数相同;3)多个发布信息的内容均不包含中文字符。例如,四个发布信息的内容为1)#我军必胜##2)%我军必胜%3)@我军必胜@4)&我军必胜&在该四个发布信息内容只保留中文字符时,其中文字符均相同,则该四个发布信息属于爆发模式中的内容队列模式。其中,所述无意义字符意为不具有中文意义的符号,如空格符等。本领域技术人员应能理解上述内容队列模式仅为举例,其他现有的或今后可能出现的内容队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解,上述各项爆发模式不仅可以单独用于爆发信息的获取,还可以结合用于爆发信息的获取。本领域技术人员应能理解上述爆发模式仅为举例,其他现有的或今后可能出现的爆发模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在一个优选实施例中(参照图I),所述爆发模式获取装置13还通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。以下参照图I对该优选实施例进行详细描述,其中,信息获取装置11获取互动平台中多个发布信息;群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图I所描述的实施例中信息获取装置11、群发模式获取装置12和确定装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,爆发模式获取装置13将群发模式获取装置12获取的一个或多个群发模式在爆发模式库中进行匹配查询,并根据预置的辅助规则,例如多个发布信息的信息发布频次是否大于预置的信息发布频次,进而确定爆发模式。例如,群发模式获取装置12从曼联版块的20个发布信息中提取一个群发模式,该群发模式为该些发布信息的标题内容的中文字符字数相同;接着,爆发模式获取装置13将该群发模式在爆发模式库中进行匹配查询,获得与该群发模式相对应的爆发模式为标题队列爆发模式,并根据该20个发布信息的信息发布时间获得该曼联版块的信息发布频次,且该信息发布频次小于预置的信息发布频次阈值,进而判断该群发模式不是真正的标题队列爆发模式。本领域技术人员应能理解上述获取爆发模式的方式仅为举例,其他现有的或今后可能出现的获取爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,爆发模式获取装置13还可以根据该些辅助规则准确地判断群发模式在爆发模式库中进行匹配查询所获取的爆发模式是否正确,极大地提高确定爆发模式的准确性,实现有效地对爆发信息进行确定,进而降低将正常发布信息误定为爆发信息的误判率。优选地,爆发模式获取装置13结合基于但不限于以下至少任一项的所述预置的辅助规则,确定所述爆发模式-所述多个发布信息的发布时间;-与所述多个发布信息相对应的信息发布者的相关信息。具体地,基于所述多个发布信息的发布时间,可确定包括但不限于一个信息发布者的信息发布频次、整个互动平台的信息发布频次、互动平台中的某一板块的信息发布频次。例如,爆发模式获取装置13通过将群发模式在爆发模式库中进行匹配查询,以确定与该(等)群发模式相对应的爆发模式,但该爆发模式获取装置13根据该群发模式所对应的位于同一版块的多个发布信息的信息发布时间,所确定的该多个发布信息所在版块的平均信息发布频次小于预设的信息发布频次阈值,则爆发模式获取装置13判断该群发模式不是爆发模式。。所述多个发布信息相对应的信息发布者的相关信息包括但不限于信息发布者的注册时间、信息发布者是否在黑名单中、信息发布者的用户信用度等。例如,爆发模式获取装置13通过在爆发模式库中进行匹配查询,以确定与群发模式相对应的爆发模式,但该群发模式所对应的多个发布信息的发布者用户信息度高,则判断该群发模式不是爆发模式。。本领域技术人员应能理解,基于上述两项预置的辅助规则不仅可以单独用于辅助确定爆发模式,还可以结合用于辅助确定爆发模式。本领域技术人员应能理解上述确定爆发模式的方式仅为举例,其他现有的或今后可能出现的确定爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。更优选地,爆发模式获取装置13结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括但不限于以下至少任一项-信息发布者的历史行为记录;-信息发布者的注册时间;-信息发布者的IP地址;-信息发布者在单位时间内发布信息的数量。具体地,信息发布者的相关信息包括信息发布者的历史行为记录,其中,信息发布者的历史行为记录包括但不限于信息发布者的历史发布信息内容、信息发布者的历史发布信息时间记录、信息发布者的历史在线时长等。例如,爆发模式获取装置13将发布信息的信息发布者账号在历史行为数据库中进行匹配查询,以获得该信息发布者的历史发布信息均为正常发布信息,进而判断该信息发布者的用户信用度较高。其中,所述历史行为数据库用于存储信息发布者的历史行为记录,包括但不限于关系数据库,内存存储器,硬盘存储信息发布者的相关信息包括信息发布者的注册时间。爆发模式获取装置13根据信息发布者的注册时间,例如信息发布者的注册时间为当前时间的两年前,则判断该信息发布者的用户信用度较高。信息发布者的相关信息包括信息发布者的IP地址,基于信息发布者的IP地址,可确定包括但不限于该IP地址是否有历史爆发信息发出、该IP地址包含信息发布者账号的数量等。例如,爆发模式获取装置13根据信息发布者的IP地址,在地址数据库中进行匹配查询,以获取该IP地址未曾有大量具有相似特征的发布信息发出的历史记录,进而判断该信息发布者的用户信用度较高。其中,地址数据库用于存储曾经发布过发布信息的IP地址及其对应的历史发布信息。信息发布者的相关信息包括信息发布者在单位时间内发布信息的数量。例如,爆发模式获取装置13根据信息发布者在单位时间内发布信息的数量,与预定的信息发布频次阈值进行比较,当该信息发布者在单位时间内发布信息的数量小于该信息发布频次阈值,则判断该信息发布者的用户信用度较高。本领域技术人员应能理解,基于上述四项信息发布者的相关信息不仅可以单独用于辅助确定爆发模式,还可以结合用于辅助确定爆发模式。本领域技术人员应能理解上述信息发布者的相关信息仅为举例,其他现有的或今后可能出现的信息发布者的相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。更优选地,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该检测设备I还包括记录更新装置(未示出),记录更新装置根据所述爆发信息,更新所述信息发布者的历史行为记录。具体地,信息发布者的相关信息包括信息发布者的历史行为记录,记录更新装置根据确定装置14确定的与爆发模式相对应的爆发信息,以提取该等爆发信息的信息发布者的账号、该等信息发布者发布的爆发信息内容、该等信息发布者的发布爆发信息的时间、信息发布者的在线时长等信息,在诸如历史行为数据库中,添加该等信息发布者的历史行为记录。例如,记录更新装置根据确定装置14获取的在李宇春版块中的80个爆发信息,对该80个爆发信息进行分析,以提取该等爆发信息的信息发布者账号,以及该等信息发布者账号所对应的发布的爆发信息内容、该等发布信息者发布每个爆发信息所对应的时间、该等发布信息者在此次互动平台发生信息爆发时的在线时长,接着,记录更新装置根据信息发布者账号,在历史行为数据库中对该信息发布者账号所对应的历史行为记录进行添加。本领域技术人员应能理解上述更新历史行为记录的方式仅为举例,其他现有的或今后可能出现的更新历史行为记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在又一个优选实施例中(参照图I),检测设备I还包括预处理装置(未示出),预处理装置对所述多个发布信息进行预处理,获得预处理结果;其中,群发模式获取装置12还根据所述预处理结果,获取所述一个或多个群发模式。以下参照图I对该优选实施例进行详细描述,其中,信息获取装置11获取互动平台中多个发布信息;爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图I所描述的实施例中信息获取装置11、爆发模式获取装置13和确定装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,预处理装置对信息获取装置11获取的多个发布信息进行预处理,该预处理的方式包括但不限于去除多个发布信息中的无意义字符、去除多个发布信息中的数字等,以获取预处理结果;接着,群发模式获取装置12还根据该些预处理结果,获取一个或多个群发模式。例如,多个发布信息的内容为1)#我军必胜##
2)%我军必胜%3)@我军必胜@4)&我军必胜&预处理装置将该四个发布信息内容中的无意思字符去除,并保留中文字符以作为与处理结果a我军必胜b我军必胜c我军必胜d我军必胜接着,群发模式获取装置12还根据该预处理结果,将预处理结果a、b、c、d相互之间进行比较分析,以获取预处理结果a、b、c、d内容均相同的一个群发模式。本领域技术人员应能理解上述预处理的方式仅为举例,其他现有的或今后可能出现的预处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在再一个优选实施例中(参照图I),检测设备I还包括后处理装置(未示出),后处理装置根据所述爆发信息,对所述互动平台进行相应的后处理。以下参照图I对该优选实施例进行详细描述,其中,信息获取装置11获取互动平台中多个发布信息;群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图I所描述的实施例中信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,后处理装置根据确定装置14获取的爆发信息,对互动平台或互动平台的一个版块进行相应的后处理,例如将爆发信息全部删除,或通过停止对该互动平台或该互动平台的一个版块的域名解析、停止该互动平台服务器运行等方式,将该互动平台或互动平台的一个版块关闭。例如,确定装置14获取的某一论坛的爆发信息,即确定该论坛发生信息爆发现象,则后处理装置将该些爆发信息全部删除,或者后处理装置停止该互动平台一个版块的域名解析。本领域技术人员应能理解上述后处理的方式仅为举例,其他现有的或今后可能出现的后处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述后处理包括但不限于以下至少任一项-删除所述多个爆发信息;-禁止所述多个爆发信息的信息发布者发布信息。具体地,后处理的方式包括但不限于1)后处理装置将确定装置14获取的爆发信息全部删除;2)后处理装置根据确定装置14获取的爆发信息,以提取该些爆发信息所对应的信息发布者账号,并通过封禁该些信息发布者账号,从而禁止该些信息发布者发布信息。本领域技术人员应能理解,上述两项后处理方式不仅可以单独用于爆发信息的后处理,还可以结合用于爆发信息的后处理。本领域技术人员应能理解上述后处理的方式仅为举例,其他现有的或今后可能出现的后处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述后处理可以实现及时地对爆发信息及其信息发布者进行处理,最大程度地减少爆发信息对正常用户的负面影响,使得正常用户能够有效地获取互动平台的信息和进行互动沟通,并维护互动平台的正常运作秩序,进一步地,提升用户使用体验。在再一个优选实施例中(参照图I),检测设备I还包括模式库更新装置(未示出),模式库更新装置根据所述爆发信息,更新所述爆发模式库。以下参照图I对该优选实施例进行详细描述,其中,信息获取装置11获取互动平台中多个发布信息;群发模式获取装置12根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;爆发模式获取装置13通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;确定装置14根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图I所描述的实施例中信息获取装置11、群发模式获取装置12、爆发模式获取装置13和确定装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。模式库更新装置根据确定装置14获取的爆发信息,将该些爆发信息相互之间进行分析比对,以提取该些爆发信息之间具有的全部相同或相似的发布特征,并在爆发模式库中进行匹配查询,当任一相同或相似的发布特征未在爆发模式库中匹配成功时,则将该发布特征作为新的爆发模式添加进该爆发模式库。例如,确定装置14获取80个爆发信息,该80个爆发信息的标题均为“我军必胜谁与争锋”;接着,模式库更新装置将该发布信息标题为“我军必胜谁与争锋”的爆发模式在爆发模式库中进行匹配查询且未匹配成功,则模式库更新装置将发布信息标题为“我军必胜谁与争锋”的这一爆发模式添加进该爆发模式库。本领域技术人员应能理解上述更新爆发模式库的方式仅为举例,其他现有的或今后可能出现的更新爆发模式库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。图2示出根据本发明一个方面用于检测互动平台中爆发信息的方法流程图。在此,检测设备I包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。具体地,在步骤SI中,检测设备I获取互动平台中多个发布信息。更具体地,在步骤SI中,检测设备I在预定的时间间隔内或连续地获取互动平台或互动平台的特定版块中多个发布信息,例如通过实时监听用户通过用户设备提交的发布信息提交请求,以获取用户输入的发布信息,或者在预定的时间间隔内周期性地通过约定的通信方式,如http、https等通信协议,从互动平台中提取最新的多个发布信息。例如,检测设备I为论坛的网络服务器,用户通过用户设备通过该论坛的网页输入界面输入一段文本信息作为发布信息,然后,用户设备将该发布信息作为该论坛的发帖包装成http请求并通过http通信协议提交到检测设备1,接着,在步骤SI中,检测设备I通过实时监听用户消息,接收并解析该http请求,获取其中的发布信息。再如,在步骤SI中,检测设备I每隔五分钟周期地提取互动平台中最新的多个发布信息。在此,所述互动平台包括但不限于社区、论坛、博客、微博,购物网站中对商品的点评、新闻评论、短信互动等。本领域技术人员应能理解上述获取多个发布信息的方式仅为举例,其他现有的或今后可能出现的获取多个发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。随后,在步骤S2中,检测设备I根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式。具体地,在步骤S2中,检测设备I根据其在步骤SI中获取的多个发布信息,通过例如对该些发布信息相互之间进行分析比对,以判断该些多个发布信息是否具有相同或相似的发布特征,进而获取与该些多个发布信息相对应的一个或多个群发模式。其中,所述群发模式意为由信息发布者发布的具有相同或相似发布特征的多个发布信息的信息发布模式,例如某一论坛中就某一热点话题,多个信息发布者发布具有多个相同关键词的帖子的信息发布模式,或者某一论坛中,由多个信息发布者发布的内容完全相同的帖子的信息发布模式。例如,在步骤SI中,检测设备I在论坛的网球版块中获取100个发布信息,在步骤S2中,检测设备I将该100个发布信息相互之间进行分析比对,以获得该100个发布信息中的90个发布信息的标题均具有关键词“李娜”、“夺冠”,则据此可获取与该90个发布信息相对应的一个群发模式。又例如,在步骤SI中,检测设备I在论坛的李宇春版块中获取的100个发布信息,在步骤S2中,检测设备I将该100个发布信息相互之间进行分析比对,判断获得其中有80个发布信息的标题中的中文字符均相同,进而可获取与该80个发布信息相对应的一个群发模式。本领域技术人员应能理解上述获取群发模式的方式仅为举例,其他现有的或今后可能出现的获取群发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。接着,在步骤S3中,检测设备I通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式。具体地,在步骤S3中,检测设备I将其在步骤S2中获取的一个或多个群发模式在爆发模式库中进行匹配查询,例如将该一个或多个群发模式与该爆发模式库中的爆发模式进行匹配,或者通过将具有群发模式特征的多个发布信息相互之间进行比较分析,以提取其发布特征,进而将该些发布特征在爆发模式库中与多个爆发模式进行匹配,并据此匹配获得与该(些)群发模式相对应的一个或多个爆发模式。其中,所述爆发模式包括但不限于多个发布信息的标题内容的字符数值相同,多个发布信息内容在只保留中文字符时的中文字符数相同,信息发布者账号内容在只保留中文字符时相同,多个发布信息的标题内容为诗句,多个发布信息的内容为歌词等。在此,所述爆发模式库用于存储爆发模式。例如,在步骤S2中,检测设备I获取与网球版块中关键词均为“李娜” “夺冠”的90个发布信息相对应的一个群发模式;接着,在步骤S3中,检测设备I将该些发布信息相互之间进行比较分析,以提取其全部发布特征为该些发布信息的标题中均含有关键词“李娜” “夺冠”,且该90个发布信息中的80个发布信息为含有“RE”的回复信息,进而将该些发布特征在爆发模式库中进行匹配查询,未匹配获得与该发布特征相对应的爆发模式。又例如,在步骤S2中,检测设备I获取80个发布信息相对应的一个群发模式,该群发模式为发布信息标题的中文字数均相同;接着,在步骤S3中,检测设备I将该些发布信息相互之间进行比较分析,获取发布信息的标题中文字符均为“床前明月光,疑是地上霜”,进而在爆发模式库中匹配获得与该80个发布信息相对应的爆发模式为标题内容为相同诗句的爆发模式。本领域技术人员应能理解上述获取爆发模式的方式仅为举例,其他现有的或今后可能出现的获取爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S4中,检测设备I根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。具体地,在步骤S4中,检测设备I根据其在步骤S3中获取的爆发模式,确定与该(些)爆发模式相对应的发布信息信息以作为爆发信息,其中,所述爆发信息意为具有符合爆发模式特征的发布信息。例如,在步骤S3中,检测设备I获取的爆发模式为标题内容为相同诗句的爆发模式,在步骤S4中,检测设备I根据该爆发模式,提取其所对应的多个发布信息,并将该些发布信息作为爆发信息。本领域技术人员应能理解上述确定爆发信息的方式仅为举例,其他现有的或今后可能出现的确定爆发信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,检测设备I在步骤SI、步骤S2、步骤S3和步骤S4之间是持续不断地工作。具体地,在步骤SI中,检测设备I获取互动平台中多个发布信息;随后,在步骤S2中,检测设备I根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;接着,在步骤S3中,检测设备I通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;接着,在步骤S4中,检测设备I根据所述爆发模式,从所述多个 发布信息中确定与所述爆发模式相对应的爆发信息。在此,本领域技术人员应理解“持续”是指检测设备I在各步骤中分别按照设定的或实时调整的工作模式要求进行发布信息的获取、群发模式的获取、爆发模式的获取及爆发信息的确定,直至检测设备I在较长时间内停止对互动平台中多个发布信息的获取。优选地,所述爆发模式包括但不限于以下至少任一项-标题队列模式;-用户队列模式;-内容队列模式。具体地,标题队列模式包括但不限于1)多个发布信息的标题内容的字符数相同;2)多个发布信息的标题内容中带有相同的特殊字符前缀;3)多个发布信息的标题内容中相同字符数与总字符的比值超过预设的比例阈值;4)多个发布信息的标题内容均不包含中文字符。例如,四个发布信息的标题内容为a床前明月光b疑是地上霜c举头望明月d低头思故乡该四个发布信息的标题内容字数相同,则该四个发布信息属于爆发模式中的标题队列模式,即“多个发布信息的标题内容的字符数相同”。又例如,五个发布信息的标题内容为a Fighting !b My friends !c Fighting !d My brothers !e Never give up !该五个发布信息的标题内容均不包含中文字符,则该五个发布信息属于爆发模式中的标题队列模式,即“多个发布信息的标题内容均不包含中文字符”。本领域技术人员应能理解上述标题队列模式仅为举例,其他现有的或今后可能出现的标题队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。用户队列模式包括但不限于1)信息发布者账号内容相同或相似2)在去除信息发布者账号内容中的无意义字符、数字等后其账号内容相同或相似;3)信息发布者账号内容中的中文字符相同或相似;4)在去除信息发布者账号内容中的无意义字符、数字等后其账号内容中的中文字符相同或相似。例如,五个发布信息的信息发布者账号内容为I)水军军团@12)水军军团@23)水军军团@34)水军军团&55)水军军团&6将该五个信息发布者账号内容中的无意义字符和数字“1”、“2”、“3”、“5”、“6”去除,所保留的中文字符均相同为“水军军团”,则该五个发布信息属于爆发模式中的用户队列模式。本领域技术人员应能理解上述用户队列模式仅为举例,其他现有的或今后可能出现的用户队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。内容队列模式包括但不限于1)多个发布信息内容的字符数值相同;2)多个发布信息内容的中文字符数相同;3)多个发布信息的内容均不包含中文字符。例如,四个发布信息的内容为1)#我军必胜##2)%我军必胜%3)@我军必胜@4)&我军必胜&在该四个发布信息内容只保留中文字符时,其中文字符均相同,则该四个发布信息属于爆发模式中的内容队列模式。其中,所述无意义字符意为不具有中文意义的符号,如空格符等。本领域技术人员应能理解上述内容队列模式仅为举例,其他现有的或今后可能出现的内容队列模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解,上述各项爆发模式不仅可以单独用于爆发信息的获取,还可以结合用于爆发信息的获取。本领域技术人员应能理解上述爆发模式仅为举例,其他现有的或今后可能出现的爆发模式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在一个优选实施例中(参照图2),在步骤S3中,检测设备I还通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。以下参照图2对该优选实施例进行详细描述,其中,在步骤SI中,检测设备I获取互动平台中多个发布信息;在步骤S2中,检测设备I根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;在步骤S4中,检测设备I根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图2所描述的实施例中检测设备I在步骤SI、步骤S2和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述 。具体地,在步骤S3中,检测设备I将其在步骤S2中获取的一个或多个群发模式在爆发模式库中进行匹配查询,并根据预置的辅助规则,例如多个发布信息的信息发布频次是否大于预置的信息发布频次,进而确定爆发模式。例如,在步骤S2中,检测设备I从曼联版块的20个发布信息中提取一个群发模式,该群发模式为该些发布信息的标题内容的中文字符字数相同;接着,在步骤S3中,检测设备I将该群发模式在爆发模式库中进行匹配查询,获得与该群发模式相对应的爆发模式为标题队列爆发模式,并根据该20个发布信息的信息发布时间获得该曼联版块的信息发布频次,且该信息发布频次小于预置的信息发布频次阈值,进而判断该群发模式不是真正的标题队列爆发模式。本领域技术人员应能理解上述获取爆发模式的方式仅为举例,其他现有的或今后可能出现的获取爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,在步骤S3中,检测设备I还可以根据该些辅助规则准确地判断群发模式在爆发模式库中进行匹配查询所获取的爆发模式是否正确,极大地提高确定爆发模式的准确性,实现有效地对爆发信息进行确定,进而降低将正常发布信息误定为爆发信息的误判率。优选地,在步骤S3中,检测设备I结合基于但不限于以下至少任一项的所述预置的辅助规则,确定所述爆发模式-所述多个发布信息的发布时间;-与所述多个发布信息相对应的信息发布者的相关信息。具体地,基于所述多个发布信息的发布时间,可确定包括但不限于一个信息发布者的信息发布频次、整个互动平台的信息发布频次、互动平台中的某一板块的信息发布频次。例如,在步骤S3中,检测设备I通过将群发模式在爆发模式库中进行匹配查询,以确定与该(等)群发模式相对应的爆发模式,但该检测设备I根据该群发模式所对应的位于同一版块的多个发布信息的信息发布时间,所确定的该多个发布信息所在版块的平均信息发布频次小于预设的信息发布频次阈值,则检测设备I判断该群发模式不是爆发模式。。所述多个发布信息相对应的信息发布者的相关信息包括但不限于信息发布者的注册时间、信息发布者是否在黑名单中、信息发布者的用户信用度等。例如,在步骤S3中,检测设备I通过在爆发模式库中进行匹配查询,以确定与群发模式相对应的爆发模式,但该群发模式所对应的多个发布信息的发布者用户信息度高,则判断该群发模式不是爆发模
O O本领域技术人员应能理解,基于上述两项预置的辅助规则不仅可以单独用于辅助确定爆发模式,还可以结合用于辅助确定爆发模式。本领域技术人员应能理解上述确定爆发模式的方式仅为举例,其他现有的或今后可能出现的确定爆发模式的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。更优选地,在步骤S3中,检测设备I结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括但不限于以下至少任一项-信息发布者的历史行为记录;-信息发布者的注册时间;-信息发布者的IP地址;
-信息发布者在单位时间内发布信息的数量。具体地,信息发布者的相关信息包括信息发布者的历史行为记录,其中,信息发布者的历史行为记录包括但不限于信息发布者的历史发布信息内容、信息发布者的历史发布信息时间记录、信息发布者的历史在线时长等。例如,在步骤S3中,检测设备I将发布信息的信息发布者账号在历史行为数据库中进行匹配查询,以获得该信息发布者的历史发布信息均为正常发布信息,进而判断该信息发布者的用户信用度较高。其中,所述历史行为数据库用于存储信息发布者的历史行为记录,包括但不限于关系数据库,内存存储器,硬盘存储器等。信息发布者的相关信息包括信息发布者的注册时间。在步骤S3中,检测设备I根据信息发布者的注册时间,例如信息发布者的注册时间为当前时间的两年前,则判断该信息发布者的用户信用度较高。信息发布者的相关信息包括信息发布者的IP地址,基于信息发布者的IP地址,可确定包括但不限于该IP地址是否有历史爆发信息发出、该IP地址包含信息发布者账号的数量等。例如,在步骤S3中,检测设备I根据信息发布者的IP地址,在地址数据库中进行匹配查询,以获取该IP地址未曾有大量具有相似特征的发布信息发出的历史记录,进而判断该信息发布者的用户信用度较高。其中,地址数据库用于存储曾经发布过发布信息的IP地址及其对应的历史发布信息。信息发布者的相关信息包括信息发布者在单位时间内发布信息的数量。例如,在步骤S3中,检测设备I根据信息发布者在单位时间内发布信息的数量,与预定的信息发布频次阈值进行比较,当该信息发布者在单位时间内发布信息的数量小于该信息发布频次阈值,则判断该信息发布者的用户信用度较高。本领域技术人员应能理解,基于上述四项信息发布者的相关信息不仅可以单独用于辅助确定爆发模式,还可以结合用于辅助确定爆发模式。本领域技术人员应能理解上述信息发布者的相关信息仅为举例,其他现有的或今后可能出现的信息发布者的相关信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。更优选地,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该过程还包括步骤S5(未示出),在步骤S5中,检测设备I根据所述爆发信息,更新所述信息发布者的历史行为记录。具体地,信息发布者的相关信息包括信息发布者的历史行为记录,在步骤S5中,检测设备I根据其在步骤S4中确定的与爆发模式相对应的爆发信息,以提取该等爆发信息的信息发布者的账号、该等信息发布者发布的爆发信息内容、该等信息发布者的发布爆发信息的时间、信息发布者的在线时长等信息,在诸如历史行为数据库中,添加该等信息发布者的历史行为记录。例如,在步骤S5中,检测设备I根据其在步骤S4中获取的在李宇春版块中的80个爆发信息,对该80个爆发信息进行分析,以提取该等爆发信息的信息发布者账号,以及该等信息发布者账号所对应的发布的爆发信息内容、该等发布信息者发布每个爆发信息所对应的时间、该等发布信息者在此次互动平台发生信息爆发时的在线时长,接着,检测设备I根据信息发布者账号,在历史行为数据库中对该信息发布者账号所对应的历史行为记录进行添加。本领域技术人员应能理解上述更新历史行为记录的方式仅为举例,其他现有的或今后可能出现的更新历史行为记录的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在又一个优选实施例中(参照图2),该过程还包括步骤S6(未示出),在步骤S6中,检测设备I对所述多个发布信息进行预处理,获得预处理结果;其中,在步骤S2中,检测设备I还根据所述预处理结果,获取所述一个或多个群发模式。以下参照图2对该优选实施例进行详细描述,其中,在步骤SI中,检测设备I获取互动平台中多个发布信息;在步骤S3中,检测设备I通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;在步骤S4中,检测设备I根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图2所描述的实施例中检测设备I在步骤SI、步骤S3和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S6中,检测设备I对其在步骤SI中获取的多个发布信息进行预处理,该预处理的方式包括但不限于去除多个发布信息中的无意义字符、去除多个发布信息中的数字等,以获取预处理结果;接着,在步骤S2中,检测设备I还根据该些预处理结果,获取一个或多个群发模式。例如,多个发布信息的内容为1)#我军必胜##2)%我军必胜%3)@我军必胜@4)&我军必胜&在步骤S6中,检测设备I将该四个发布信息内容中的无意思字符“&”去除,并保留中文字符以作为与处理结果a我军必胜b我军必胜c我军必胜d我军必胜接着,在步骤S2中,检测设备I还根据该预处理结果,将预处理结果a、b、C、d相互之间进行比较分析,以获取预处理结果a、b、c、d内容均相同的一个群发模式。本领域技术人员应能理解上述预处理的方式仅为举例,其他现有的或今后可能出现的预处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在再一个优选实施例中(参照图2),该过程还包括步骤S7(未示出),在步骤S7中,检测设备I根据所述爆发信息,对所述互动平台进行相应的后处理。以下参照图2对该优选实施例进行详细描述,其中,在步骤SI中,检测设备I获取互动平台中多个发布信息;在步骤S2中,检测设备I根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;在步骤S3中,检测设备I通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;在步骤S4中,检测设备I根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图2所描述的实施例中检测设备I在步骤SI、步骤S2、步骤S3和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。具体地,在步骤S7中,检测设备I根据其在步骤S4中获取的爆发信息,对互动平台或互动平台的一个版块进行相应的后处理,例如将爆发信息全部删除,或通过停止对该互动平台或该互动平台的一个版块的域名解析、停止该互动平台服务器运行等方式,将该互动平台或互动平台的一个版块关闭。例如,在步骤S4中,检测设备I获取的某一论坛的爆发信息,即确定该论坛发生信息爆发现象,则在步骤S7中,检测设备I将该些爆发信息全部删除,或者在步骤S7中,检测设备I停止该互动平台一个版块的域名解析。本领域技术人员应能理解上述后处理的方式仅为举例,其他现有的或今后可能出现的后处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。优选地,所述后处理包括但不限于以下至少任一项-删除所述多个爆发信息;-禁止所述多个爆发信息的信息发布者发布信息。具体地,后处理的方式包括但不限于1)在步骤S7中,检测设备I将其在步骤S4中获取的爆发信息全部删除;2)在步骤S7中,检测设备I根据其在步骤S4中获取的爆发信息,以提取该些爆发信息所对应的信息发布者账号,并通过封禁该些信息发布者账号,从而禁止该些信息发布者发布信息。本领域技术人员应能理解,上述两项后处理方式不仅可以单独用于爆发信息的后处理,还可以结合用于爆发信息的后处理。本领域技术人员应能理解上述后处理的方式仅为举例,其他现有的或今后可能出现的后处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,所述后处理可以实现及时地对爆发信息及其信息发布者进行处理,最大程度地减少爆发信息对正常用户的负面影响,使得正常用户能够有效地获取互动平台的信息和进行互动沟通,并维护互动平台的正常运作秩序,进一步地,提升用户使用体验。在再一个优选实施例中(参照图2),该过程还包括步骤S8(未示出),在步骤S8中,检测设备I根据所述爆发信息,更新所述爆发模式库。以下参照图2对该优选实施例进行详细描述,其中,在步骤SI中,检测设备I获取互动平台中多个发布信息;在步骤S2中,检测设备I根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式;在步骤S3中,检测设备I通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式;在步骤S4中,检测设备I根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。其具体过程与前述参照图2所描述的实施例中检测设备I在步骤SI、步骤S2、步骤S3和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。在步骤S8中,检测设备I根据其在步骤S4中获取的爆发信息,将该些爆发信息相互之间进行分析比对,以提取该些爆发信息之间具有的全部相同或相似的发布特征,并在爆发模式库中进行匹配查询,当任一相同或相似的发布特征未在爆发模式库中匹配成功时,则将该发布特征作为新的爆发模式添加进该爆发模式库。例如,在步骤S4中,检测设备I获取80个爆发信息,该80个爆发信息的标题均为“我军必胜谁与争锋”;接着,在步骤S8中,检测设备I将该发布信息标题为“我军必胜谁与争锋”的爆发模式在爆发模式库中进行匹配查询且未匹配成功,则检测设备I将发布信息标题为“我军必胜谁与争锋”的这一爆发模式添加进该爆发模式库。本领域技术人员应能理解上述更新爆发模式库的方式仅为举例,其他现有的或今后可能出现的更新爆发模式库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
权利要求
1.一种计算机实现的用于检测互动平台中爆发信息的方法,该方法包括以下步骤 a获取互动平台中多个发布信息; b根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式; c通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式; d根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。
2.根据权利要求I所述的方法,其中,所述爆发模式包括以下至少任一项 -标题队列模式; -用户队列模式; -内容队列模式。
3.根据权利要求I或2所述的方法,其中,所述步骤c还包括 -通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。
4.根据权利要求3所述的方法,其中,结合基于以下至少任一项的所述预置的辅助规贝U,确定所述爆发模式 -所述多个发布信息的发布时间; -与所述多个发布信息相对应的信息发布者的相关信息。
5.根据权利要求4所述的方法,结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括以下至少任一项 -信息发布者的历史行为记录; -信息发布者的注册时间; -信息发布者的IP地址; -信息发布者在单位时间内发布信息的数量。
6.根据权利要求5所述的方法,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该方法还包括 -根据所述爆发信息,更新所述信息发布者的历史行为记录。
7.根据权利要求I至6中任一项所述的方法,其中,该方法还包括 -对所述多个发布信息进行预处理,获得预处理结果; 其中,所述步骤b还包括 -根据所述预处理结果,获取所述一个或多个群发模式。
8.根据权利要求I至7中任一项所述的方法,其中,该方法还包括 -根据所述爆发信息,对所述互动平台进行相应的后处理。
9.根据权利要求8所述的方法,其中,所述后处理包括以下至少任一项 -删除所述多个爆发信息; -禁止所述多个爆发信息的信息发布者发布信息。
10.根据权利要求I至9中任一项所述的方法,其中,该方法还包括 -根据所述爆发信息,更新所述爆发模式库。
11.一种用于检测互动平台中爆发信息的设备,该设备包括 信息获取装置,用于获取互动平台中多个发布信息; 群发模式获取装置,用于根据所述多个发布信息,获取与所述多个发布信息相对应的一个或多个群发模式; 爆发模式获取装置,用于通过在爆发模式库中进行匹配查询,从所述一个或多个群发模式中确定爆发模式; 确定装置,用于根据所述爆发模式,从所述多个发布信息中确定与所述爆发模式相对应的爆发信息。
12.根据权利要求11所述的设备,其中,所述爆发模式包括以下至少任一项 _标题队列模式; -用户队列模式; -内容队列模式。
13.根据权利要求11或12所述的设备,其中,所述爆发模式获取装置还用于通过在所述爆发模式库中进行匹配查询,结合预置的辅助规则,确定所述爆发模式。
14.根据权利要求13所述的设备,其中,结合基于以下至少任一项的所述预置的辅助规则,确定所述爆发模式 -所述多个发布信息的发布时间; -与所述多个发布信息相对应的信息发布者的相关信息。
15.根据权利要求14所述的设备,结合基于与所述多个发布信息相对应的信息发布者的相关信息的所述预置的辅助规则,确定所述爆发模式,其中,所述信息发布者的相关信息包括以下至少任一项 -信息发布者的历史行为记录; -信息发布者的注册时间; -信息发布者的IP地址; -信息发布者在单位时间内发布信息的数量。
16.根据权利要求15所述的设备,所述信息发布者的相关信息包括信息发布者的历史行为记录,其中,该设备还包括 记录更新装置,用于根据所述爆发信息,更新所述信息发布者的历史行为记录。
17.根据权利要求11至16中任一项所述的设备,其中,该设备还包括 预处理装置,用于对所述多个发布信息进行预处理,获得预处理结果; 其中,所述群发模式获取装置还用于根据所述预处理结果,获取所述一个或多个群发模式。
18.根据权利要求11至17中任一项所述的设备,其中,该设备还包括 后处理装置,用于根据所述爆发信息,对所述互动平台进行相应的后处理。
19.根据权利要求18所述的设备,其中,所述后处理包括以下至少任一项 -删除所述多个爆发信息; -禁止所述多个爆发信息的信息发布者发布信息。
20.根据权利要求11至19中任一项所述的设备,其中,该设备还包括 模式库更新装置,用于根据所述爆发信息,更新所述爆发模式库。
全文摘要
本发明的目的是提供一种用于检测互动平台中爆发信息的方法与设备,其中,检测设备通过获取互动平台中多个发布信息以确定爆发模式,进而根据所述爆发模式,从所述多个发布信息中确定爆发信息。与现有技术相比,本发明可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。
文档编号G06F17/30GK102982041SQ20111026270
公开日2013年3月20日 申请日期2011年9月6日 优先权日2011年9月6日
发明者李彦宏, 舒迅, 帅帅, 尹佳, 陈楚洁, 周天, 方勇, 王波 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1