本发明涉及互联网技术领域,具体涉及一种聊天信息的处理方法和服务器。
背景技术:
随着互联网技术的不断发展,通过网络中的各种平台、论坛、应用等进行聊天会话已成为当前互联网用户最常见的互动方式之一,目前,在各种聊天场景中,仍然存在大量的恶意用户发布包含广告、营销、拉人、语言攻击等不正当意图的聊天信息,还有很多是采用程序来发送长时间的刷屏信息,严重扰乱了聊天场景的正常秩序,损害了其他用户的正当利益。
如何在互联网聊天交互场景中准确有效地筛选出不合理的聊天信息以保障聊天环境的纯净性,是当前亟待解决的问题。
技术实现要素:
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的聊天信息的处理方法和服务器。
依据本发明的一个方面,提供了一种聊天信息的处理方法,其中,该方法包括:
通过数据接口接收各客户端发送的聊天信息发布消息;每条聊天信息发布消息中包括:用户标识,聊天信息,发布范围信息;将所述用户标识和聊天信息对应保存到聊天信息数据库中;
对于当前接收到的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,当该聊天信息的分值超过第一预设阈值时,过滤该聊天信息发布消息;
当该聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和,当该分 值总和超过第二预设阈值时,过滤该聊天信息发布消息;
当该分值总和未超过第二预设阈值时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
可选地,所述计算该聊天信息发布消息中的聊天信息的分值包括:
预设第一特征库,所述第一特征库中包括:多个关键字和各关键字对应的分值;
获取该聊天信息中的关键字,如果该聊天信息中的关键字与第一特征库中的关键字相匹配,则将所匹配的关键字的分值作为该聊天信息的分值。
可选地,所述获取该聊天信息中的关键字包括:
对该聊天信息进行简化处理,包括:过滤该聊天信息中的无意义的字符,和/或,对该聊天信息进行相似信息转换;
对简化处理后的聊天信息进行分词处理,根据分词处理结果提取出该聊天信息的关键字。
可选地,所述计算该聊天信息发布消息中的聊天信息的分值包括:
预设第二特征库,所述第二特征库中包括:多个正则表达式和各正则表达式对应的分值;
获取该聊天信息中的关键字,如果该聊天信息的内容与第二特征库中的正则表达式相匹配,则将所匹配的正则表达式的分值作为该聊天信息的分值。
可选地,该方法进一步包括:
当该分值总和超过第二预设阈值时,将该聊天信息发布消息所包含的用户标识放入封禁名单中;
对于当前接收到的聊天信息发布消息,判断该聊天信息发布消息中包含的用户标识是否在封禁名单中,是则,直接过滤该聊天信息发布消息。
可选地,所述将该聊天信息发布消息所包含的用户标识放入封禁名单中包括:根据该用户标识对应的分值总和设置该用户标识的封禁时间;
则该方法进一步包括:对于放入封禁名单中的每个用户标识,当满足该用户标识对应的封禁时间时,将该用户标识从封禁名单中删除。
可选地,所述聊天信息发布消息中进一步包括:发布时间信息;
当该分值总和未超过第二预设阈值时,该方法进一步包括:
从聊天信息数据库中获取对应于该聊天信息发布消息所包含的用户标识的发布时间信息;
根据所获取的各发布时间信息计算预设统计周期内该用户标识对应的用户发出的聊天信息的平均时间间隔,当该平均时间间隔小于预设时间长度时,过滤该聊天信息发布消息,并将该用户表示放入封禁名单中;
当该平均时间间隔不小于预设时间长度时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
可选地,该方法进一步包括:
通过数据接口接收客户端发送的聊天信息举报消息,每条聊天信息举报消息中包括:被举报的用户标识,被举报的聊天信息;
对于当前接收到的聊天信息举报消息,计算该聊天信息举报消息中的被举报的聊天信息的分值,当该被举报的聊天信息的分值超过第一预设阈值时,删除该被举报的聊天信息的记录;
当该被举报的聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息举报消息中的被举报的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,删除该被举报的聊天信息的记录,并将相应的被举报的用户标识放入封禁名单中。
依据本发明的另一个方面,还提供了一种聊天信息的处理服务器,其中,该服务器包括:
信息接收单元,适于通过数据接口接收各客户端发送的聊天信息发布消息;每条聊天信息发布消息中包括:用户标识,聊天信息,发布范围信息;将所述用户标识和聊天信息对应保存到聊天信息数据库中;
信息处理单元,适于对于当前接收到的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,当该聊天信息的分值超过第一预设阈值时,过滤该聊天信息发布消息;当该聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,过滤该聊天信息发布消息;当该分值总和未超过第二预设阈值时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
可选地,信息处理单元,适于预设第一特征库,所述第一特征库中包括:多个关键字和各关键字对应的分值;获取该聊天信息中的关键字,如果该聊天信息中的关键字与第一特征库中的关键字相匹配,则将所匹配的关键字的分值作为该聊天信息的分值。
可选地,信息处理单元,适于对该聊天信息进行简化处理,包括:过滤该聊天信息中的无意义的字符,和/或,对该聊天信息进行相似信息转换;对简化处理后的聊天信息进行分词处理,根据分词处理结果提取出该聊天信息的关键字。
可选地,信息处理单元,适于预设第二特征库,所述第二特征库中包括:多个正则表达式和各正则表达式对应的分值;获取该聊天信息中的关键字,如果该聊天信息的内容与第二特征库中的正则表达式相匹配,则将所匹配的正则表达式的分值作为该聊天信息的分值。
可选地,信息处理单元,进一步适于当该分值总和超过第二预设阈值时,将该聊天信息发布消息所包含的用户标识放入封禁名单中;对于当前接收到的聊天信息发布消息,判断该聊天信息发布消息中包含的用户标识是否在封禁名单中,是则,直接过滤该聊天信息发布消息。
可选地,信息处理单元,适于根据该用户标识对应的分值总和设置该用户标识的封禁时间;
信息处理单元,进一步适于对于放入封禁名单中的每个用户标识,当满足该用户标识对应的封禁时间时,将该用户标识从封禁名单中删除。
可选地,所述聊天信息发布消息中进一步包括:发布时间信息;
信息处理单元,进一步适于当该分值总和未超过第二预设阈值时,从聊天信息数据库中获取对应于该聊天信息发布消息所包含的用户标识的发布时间信息;根据所获取的各发布时间信息计算预设统计周期内该用户标识对应的用户发出的聊天信息的平均时间间隔,当该平均时间间隔小于预设时间长度时,过滤该聊天信息发布消息,并将该用户表示放入封禁名单中;当该平均时间间隔不小于预设时间长度时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
可选地,信息接收单元,进一步适于通过数据接口接收客户端发送的聊 天信息举报消息,每条聊天信息举报消息中包括:被举报的用户标识,被举报的聊天信息;
信息处理单元,进一步适于对于当前接收到的聊天信息举报消息,计算该聊天信息举报消息中的被举报的聊天信息的分值,当该被举报的聊天信息的分值超过第一预设阈值时,删除该被举报的聊天信息的记录;当该被举报的聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息举报消息中的被举报的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,删除该被举报的聊天信息的记录,并将相应的被举报的用户标识放入封禁名单中。
由上述可知,本发明提供的技术方案接收客户端发送的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,根据该分值来判断该聊天信息是否为合理的聊天信息,进一步地,还计算发送该聊天信息发布消息的用户的历史聊天信息的分值总和,根据该分值总和来判断该用户是否为正常用户,通过以上判断过滤不合理的聊天信息,过滤非正常的用户发起的聊天信息。依据此方案,对每条聊天信息进行计分,对每个用户进行累积计分,设定分值标准来衡量聊天信息的意图是否正当以及用户的聊天行为是否合理,细化了对不合理聊天行为的判断粒度,提高了判断的准确性,能够更为精确有效地过滤不合理聊天行为。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种聊天信息的处理方法的流程图;
图2示出了根据本发明一个实施例的一种聊天信息的处理服务器的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种聊天信息的处理方法的流程图。如图1所示,该方法包括:
步骤s110:通过数据接口接收各客户端发送的聊天信息发布消息;每条聊天信息发布消息中包括:用户标识,聊天信息,发布范围信息;将所述用户标识和聊天信息对应保存到聊天信息数据库中。
其中,聊天信息发布消息中的用户标识标示出相应聊天信息的发布者,聊天信息即为所发布的聊天信息的文本内容,发布范围信息标示出相应聊天信息在什么平台上发布,且标示出能够看到该聊天信息的用户范围;例如,一条聊天信息发布消息中包括:用户标识:“a”,聊天信息:“聊聊最近看的书”,发布范围:论坛b中积分在1000分以上的用户。
步骤s120:对于当前接收到的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,当该聊天信息的分值超过第一预设阈值时,过滤该聊天信息发布消息。
其中,每条聊天信息的分值用于衡量该聊天信息的合理性,当该聊天信息的分值超过第一预设阈值时,说明该聊天信息为不合理的聊天信息,应当进行过滤。
步骤s130:当该聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,过滤该聊天信息发布消息。
其中,所述聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和是指:该用户标识对应的用户所有的历史聊天信 息的分值总和,从总体反映该用户在一段时间内的聊天行为,当该分值总和超过第二预设阈值时,说明该用户在这一段时间内的聊天行为构成不合理现象,即该用户可能是非正常用户,则过滤该用户发送的聊天信息。
步骤s140:当该分值总和未超过第二预设阈值时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
可见,图1所示的方法接收客户端发送的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,根据该分值来判断该聊天信息是否为合理的聊天信息,进一步地,还计算发送该聊天信息发布消息的用户的历史聊天信息的分值总和,根据该分值总和来判断该用户是否为正常用户,通过以上判断过滤不合理的聊天信息,过滤非正常的用户发起的聊天信息。依据此方案,对每条聊天信息进行计分,对每个用户进行累积计分,设定分值标准来衡量聊天信息的意图是否正当以及用户的聊天行为是否合理,细化了对不合理聊天行为的判断粒度,提高了判断的准确性,能够更为精确有效地过滤不合理聊天行为。
在本发明的一个实施例中,步骤s120中所述计算该聊天信息发布消息中的聊天信息的分值包括:预设第一特征库,所述第一特征库中包括:多个关键字和各关键字对应的分值;获取该聊天信息中的关键字,如果该聊天信息中的关键字与第一特征库中的关键字相匹配,则将所匹配的关键字的分值作为该聊天信息的分值。
例如,第一特征库中预设广告信息相关的关键字,并为各关键字设置超过了第一预设阈值的分值;则当一个用户发布的聊天信息发布消息中的聊天信息为广告时,获取该聊天信息的关键字,在第一特征库中找到匹配的关键字的分值,超过第一预设阈值,过滤该聊天信息。同理,基于第一特征库,可以识别出聊天信息中的营销信息、拉人信息、语言攻击信息等不正当信息,进而进行相应的过滤,保证了各种网络平台中的聊天信息的纯净性。
其中,上述获取该聊天信息中的关键字包括:对该聊天信息进行简化处理,包括:过滤该聊天信息中的无意义的字符,和/或,对该聊天信息进行相似信息转换;对简化处理后的聊天信息进行分词处理,根据分词处理结果提取出该聊天信息的关键字。
在本发明的另一个实施例中,步骤s120中所述计算该聊天信息发布消息中的聊天信息的分值包括:预设第二特征库,所述第二特征库中包括:多个正则表达式和各正则表达式对应的分值;获取该聊天信息中的关键字,如果该聊天信息的内容与第二特征库中的正则表达式相匹配,则将所匹配的正则表达式的分值作为该聊天信息的分值。
例如,第二特征库中预设常见的广告语式的正则表达式,并为各正则表达式设置超过第一预设阈值的分值;当一个用户发布的聊天信息发布消息中的聊天信息为常见广告语式时,在第二特征库中找到与该聊天信息匹配的正则表达式并获取对应的分值,超过第一预设阈值便过滤该聊天信息。同理,基于第二特征库,可以识别出聊天信息中的营销语式、拉人语式、语言攻击语式等不正当信息,进而进行相应的过滤,保证了各种网络平台中的聊天信息的纯净性。
进一步地,在本发明的一个实施例中,图1所示的方法还包括步骤s150,分为以下几步:
步骤s151:当该分值总和超过第二预设阈值时,将该聊天信息发布消息所包含的用户标识放入封禁名单中。
其中,所述封禁名单中的所有用户标识对应的用户均为被确认的不合理用户,当一个用户在一段时间内的历史聊天信息的分值总和超过第二预设阈值,则确定该用户在该段时间内是不合理用户,将其放入封禁名单中。
步骤s152:对于当前接收到的聊天信息发布消息,判断该聊天信息发布消息中包含的用户标识是否在封禁名单中,是则,直接过滤该聊天信息发布消息。
其中,一个用户的历史聊天信息的分值总和超过第二预设阈值越高表示该用户的聊天行为的不合理程度越高,则在本发明的一个实施例中,步骤s151中的所述将该聊天信息发布消息所包含的用户标识放入封禁名单中包括:根据该用户标识对应的分值总和设置该用户标识的封禁时间;例如,分值总和越大设置封禁时间越长,则图1所示的方法进一步包括:对于放入封禁名单中的每个用户标识,当满足该用户标识对应的封禁时间时,将该用户标识从封禁名单中删除。
或者,在其他实施例中,可以根据该用户标识对应的分值总和设置该用户标识的解禁条件,例如,该解禁条件可以包括:通过充值进行解禁;用户标识对应的分值总和越多,则设置其解禁条件越高。对于放入封禁名单中的每个用户标识,当满足该用户标识对应的解禁条件时,将该用户标识从封禁名单中删除。本实施例依据通常情况下恶意用户不愿意付出代价的特点,筛选出偶然执行过不合理的聊天行为的正常用户。
进一步地,在本发明的一个实施例中,步骤s110中所述聊天信息发布消息中还包括:发布时间信息;当所述聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和未超过第二预设阈值时,图1所示的方法还包括步骤s160,分为以下几步:
步骤s161:从聊天信息数据库中获取对应于该聊天信息发布消息所包含的用户标识的发布时间信息。
步骤s162:根据所获取的各发布时间信息计算预设统计周期内该用户标识对应的用户发出的聊天信息的平均时间间隔,当该平均时间间隔小于预设时间长度时,过滤该聊天信息发布消息,并将该用户标识放入封禁名单中。
步骤s163:当该平均时间间隔不小于预设时间长度时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
例如,在一个游戏论坛中,用户a利用程序进行长时间刷屏干扰到其他用户的正常聊天交互,通过检测,发现用户a对应的每条聊天信息的分值没有超过第一预设阈值,并且,用户a在预设时间段内对应的所有聊天信息的分值总和也没有超过第二预设阈值,此时,进一步检测用户a在预设时间段内对应的所有聊天信息的发布时间,发现用户a所发布的每条聊天信息之间的时间间隔非常小,平均小于预设时间长度,说明该用户a所进行的是利用程序进行长时间刷屏的恶意聊天行为,因此,将该用户a的用户标识放入封禁名单中,以过滤该用户a发布的聊天信息。
进一步地,在本发明的一个实施例中,图1所示的方法还包括步骤s170,分为以下几步:
步骤s171:通过数据接口接收客户端发送的聊天信息举报消息,每条聊天信息举报消息中包括:被举报的用户标识,被举报的聊天信息。
步骤s172:对于当前接收到的聊天信息举报消息,计算该聊天信息举报消息中的被举报的聊天信息的分值,当该被举报的聊天信息的分值超过第一预设阈值时,删除该被举报的聊天信息的记录。
步骤s173:当该被举报的聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息举报消息中的被举报的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,删除该被举报的聊天信息的记录,并将相应的被举报的用户标识放入封禁名单中。
可见,本实施例进一步通过接收客户端发送的聊天信息举报消息来弥补上文所述方案中可能出现的判断遗漏,在接收到聊天信息举报消息后,对于聊天信息举报消息中的聊天信息和相应的用户标识对应的历史聊天信息重新进行计分评判,以获得更准确的判断结果进行进行处理,对网络平台中现存的被遗漏的不正当聊天信息和不合理用户进行过滤,以保证其他正常用户在所述网络平台上的用户体验。
图2示出了根据本发明一个实施例的一种聊天信息的处理服务器的示意图。如图2所示,该聊天信息的处理服务器200包括:
信息接收单元210,适于通过数据接口接收各客户端发送的聊天信息发布消息;每条聊天信息发布消息中包括:用户标识,聊天信息,发布范围信息;将所述用户标识和聊天信息对应保存到聊天信息数据库中。
信息处理单元220,适于对于当前接收到的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,当该聊天信息的分值超过第一预设阈值时,过滤该聊天信息发布消息;当该聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,过滤该聊天信息发布消息;当该分值总和未超过第二预设阈值时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
可见,图2所示的服务器接收客户端发送的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,根据该分值来判断该聊天信息是否为合理的聊天信息,进一步地,还计算发送该聊天信息发布消息的用户的历史聊天信息的分值总和,根据该分值总和来判断该用户是否为正常用户,通 过以上判断过滤不合理的聊天信息,过滤非正常的用户发起的聊天信息。依据此方案,对每条聊天信息进行计分,对每个用户进行累积计分,设定分值标准来衡量聊天信息的意图是否正当以及用户的聊天行为是否合理,细化了对不合理聊天行为的判断粒度,提高了判断的准确性,能够更为精确有效地过滤不合理聊天行为。
在本发明的一个实施例中,信息处理单元220,适于预设第一特征库,所述第一特征库中包括:多个关键字和各关键字对应的分值;获取该聊天信息中的关键字,如果该聊天信息中的关键字与第一特征库中的关键字相匹配,则将所匹配的关键字的分值作为该聊天信息的分值。
在本发明的一个实施例中,信息处理单元220,适于对该聊天信息进行简化处理,包括:过滤该聊天信息中的无意义的字符,和/或,对该聊天信息进行相似信息转换;对简化处理后的聊天信息进行分词处理,根据分词处理结果提取出该聊天信息的关键字。
在本发明的一个实施例中,信息处理单元220,适于预设第二特征库,所述第二特征库中包括:多个正则表达式和各正则表达式对应的分值;获取该聊天信息中的关键字,如果该聊天信息的内容与第二特征库中的正则表达式相匹配,则将所匹配的正则表达式的分值作为该聊天信息的分值。
进一步地,在本发明的一个实施例中,信息处理单元220,还适于当该分值总和超过第二预设阈值时,将该聊天信息发布消息所包含的用户标识放入封禁名单中;对于当前接收到的聊天信息发布消息,判断该聊天信息发布消息中包含的用户标识是否在封禁名单中,是则,直接过滤该聊天信息发布消息。
在本发明的一个实施例中,信息处理单元220,适于根据该用户标识对应的分值总和设置该用户标识的封禁时间;信息处理单元220,进一步适于对于放入封禁名单中的每个用户标识,当满足该用户标识对应的封禁时间时,将该用户标识从封禁名单中删除。
进一步地,在本发明的一个实施例中,所述聊天信息发布消息中还包括:发布时间信息;信息处理单元220,进一步适于当该分值总和未超过第二预设阈值时,从聊天信息数据库中获取对应于该聊天信息发布消息所包含的用 户标识的发布时间信息;根据所获取的各发布时间信息计算预设统计周期内该用户标识对应的用户发出的聊天信息的平均时间间隔,当该平均时间间隔小于预设时间长度时,过滤该聊天信息发布消息,并将该用户表示放入封禁名单中;当该平均时间间隔不小于预设时间长度时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
进一步地,在本发明的一个实施例中,信息接收单元210,还适于通过数据接口接收客户端发送的聊天信息举报消息,每条聊天信息举报消息中包括:被举报的用户标识,被举报的聊天信息;信息处理单元220,还适于对于当前接收到的聊天信息举报消息,计算该聊天信息举报消息中的被举报的聊天信息的分值,当该被举报的聊天信息的分值超过第一预设阈值时,删除该被举报的聊天信息的记录;当该被举报的聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息举报消息中的被举报的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,删除该被举报的聊天信息的记录,并将相应的被举报的用户标识放入封禁名单中。
需要说明的是,图2所示服务器的各实施例与图1所示方法的各实施例对应相同,上文中已有详细说明,在此不再赘述。
综上所述,本发明提供的技术方案接收客户端发送的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,根据该分值来判断该聊天信息是否为合理的聊天信息,进一步地,还计算发送该聊天信息发布消息的用户的历史聊天信息的分值总和,根据该分值总和来判断该用户是否为正常用户,通过以上判断过滤不合理的聊天信息,过滤非正常的用户发起的聊天信息。依据此方案,对每条聊天信息进行计分,对每个用户进行累积计分,设定分值标准来衡量聊天信息的意图是否正当以及用户的聊天行为是否合理,细化了对不合理聊天行为的判断粒度,提高了判断的准确性,能够更为精确有效地过滤不合理聊天行为。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定 编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当 理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一种聊天信息的处理服务器中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了a1、一种聊天信息的处理方法,其中,该方法包括:
通过数据接口接收各客户端发送的聊天信息发布消息;每条聊天信息发布消息中包括:用户标识,聊天信息,发布范围信息;将所述用户标识和聊天信息对应保存到聊天信息数据库中;
对于当前接收到的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,当该聊天信息的分值超过第一预设阈值时,过滤该聊天信息发布消息;
当该聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,过滤该聊天信息发布消息;
当该分值总和未超过第二预设阈值时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
a2、如a1所述的方法,其中,所述计算该聊天信息发布消息中的聊天 信息的分值包括:
预设第一特征库,所述第一特征库中包括:多个关键字和各关键字对应的分值;
获取该聊天信息中的关键字,如果该聊天信息中的关键字与第一特征库中的关键字相匹配,则将所匹配的关键字的分值作为该聊天信息的分值。
a3、如a2所述的方法,其中,所述获取该聊天信息中的关键字包括:
对该聊天信息进行简化处理,包括:过滤该聊天信息中的无意义的字符,和/或,对该聊天信息进行相似信息转换;
对简化处理后的聊天信息进行分词处理,根据分词处理结果提取出该聊天信息的关键字。
a4、如a1所述的方法,其中,所述计算该聊天信息发布消息中的聊天信息的分值包括:
预设第二特征库,所述第二特征库中包括:多个正则表达式和各正则表达式对应的分值;
获取该聊天信息中的关键字,如果该聊天信息的内容与第二特征库中的正则表达式相匹配,则将所匹配的正则表达式的分值作为该聊天信息的分值。
a5、如a1所述的方法,其中,该方法进一步包括:
当该分值总和超过第二预设阈值时,将该聊天信息发布消息所包含的用户标识放入封禁名单中;
对于当前接收到的聊天信息发布消息,判断该聊天信息发布消息中包含的用户标识是否在封禁名单中,是则,直接过滤该聊天信息发布消息。
a6、如a5所述的方法,其中,所述将该聊天信息发布消息所包含的用户标识放入封禁名单中包括:根据该用户标识对应的分值总和设置该用户标识的封禁时间;
则该方法进一步包括:对于放入封禁名单中的每个用户标识,当满足该用户标识对应的封禁时间时,将该用户标识从封禁名单中删除。
a7、如a1所述的方法,其中,所述聊天信息发布消息中进一步包括:发布时间信息;
当该分值总和未超过第二预设阈值时,该方法进一步包括:
从聊天信息数据库中获取对应于该聊天信息发布消息所包含的用户标识的发布时间信息;
根据所获取的各发布时间信息计算预设统计周期内该用户标识对应的用户发出的聊天信息的平均时间间隔,当该平均时间间隔小于预设时间长度时,过滤该聊天信息发布消息,并将该用户表示放入封禁名单中;
当该平均时间间隔不小于预设时间长度时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
a8、如a1-a7中任一项所述的方法,其中,该方法进一步包括:
通过数据接口接收客户端发送的聊天信息举报消息,每条聊天信息举报消息中包括:被举报的用户标识,被举报的聊天信息;
对于当前接收到的聊天信息举报消息,计算该聊天信息举报消息中的被举报的聊天信息的分值,当该被举报的聊天信息的分值超过第一预设阈值时,删除该被举报的聊天信息的记录;
当该被举报的聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息举报消息中的被举报的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,删除该被举报的聊天信息的记录,并将相应的被举报的用户标识放入封禁名单中。
本发明还公开了b9、一种聊天信息的处理服务器,其中,该服务器包括:
信息接收单元,适于通过数据接口接收各客户端发送的聊天信息发布消息;每条聊天信息发布消息中包括:用户标识,聊天信息,发布范围信息;将所述用户标识和聊天信息对应保存到聊天信息数据库中;
信息处理单元,适于对于当前接收到的聊天信息发布消息,计算该聊天信息发布消息中的聊天信息的分值,当该聊天信息的分值超过第一预设阈值时,过滤该聊天信息发布消息;当该聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息发布消息所包含的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,过滤该聊天信息发布消息;当该分值总和未超过第二预设阈值时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
b10、如b9所述的服务器,其中,
信息处理单元,适于预设第一特征库,所述第一特征库中包括:多个关键字和各关键字对应的分值;获取该聊天信息中的关键字,如果该聊天信息中的关键字与第一特征库中的关键字相匹配,则将所匹配的关键字的分值作为该聊天信息的分值。
b11、如b10所述的服务器,其中,
信息处理单元,适于对该聊天信息进行简化处理,包括:过滤该聊天信息中的无意义的字符,和/或,对该聊天信息进行相似信息转换;对简化处理后的聊天信息进行分词处理,根据分词处理结果提取出该聊天信息的关键字。
b12、如b9所述的服务器,其中,
信息处理单元,适于预设第二特征库,所述第二特征库中包括:多个正则表达式和各正则表达式对应的分值;获取该聊天信息中的关键字,如果该聊天信息的内容与第二特征库中的正则表达式相匹配,则将所匹配的正则表达式的分值作为该聊天信息的分值。
b13、如b9所述的服务器,其中,
信息处理单元,进一步适于当该分值总和超过第二预设阈值时,将该聊天信息发布消息所包含的用户标识放入封禁名单中;对于当前接收到的聊天信息发布消息,判断该聊天信息发布消息中包含的用户标识是否在封禁名单中,是则,直接过滤该聊天信息发布消息。
b14、如b13所述的服务器,其中,
信息处理单元,适于根据该用户标识对应的分值总和设置该用户标识的封禁时间;
信息处理单元,进一步适于对于放入封禁名单中的每个用户标识,当满足该用户标识对应的封禁时间时,将该用户标识从封禁名单中删除。
b15、如b9所述的服务器,其中,所述聊天信息发布消息中进一步包括:发布时间信息;
信息处理单元,进一步适于当该分值总和未超过第二预设阈值时,从聊天信息数据库中获取对应于该聊天信息发布消息所包含的用户标识的发布时间信息;根据所获取的各发布时间信息计算预设统计周期内该用户标识对应的用户发出的聊天信息的平均时间间隔,当该平均时间间隔小于预设时间长 度时,过滤该聊天信息发布消息,并将该用户表示放入封禁名单中;当该平均时间间隔不小于预设时间长度时,根据该聊天信息发布消息中的发布范围信息将该聊天信息发布消息推送至相应的各客户端。
b16、如b9-b15中任一项所述的服务器,其中,
信息接收单元,进一步适于通过数据接口接收客户端发送的聊天信息举报消息,每条聊天信息举报消息中包括:被举报的用户标识,被举报的聊天信息;
信息处理单元,进一步适于对于当前接收到的聊天信息举报消息,计算该聊天信息举报消息中的被举报的聊天信息的分值,当该被举报的聊天信息的分值超过第一预设阈值时,删除该被举报的聊天信息的记录;当该被举报的聊天信息的分值未超过第一预设阈值时,计算聊天信息数据库中对应于该聊天信息举报消息中的被举报的用户标识的聊天信息的分值总和,当该分值总和超过第二预设阈值时,删除该被举报的聊天信息的记录,并将相应的被举报的用户标识放入封禁名单中。