一种识别方法及装置的制造方法

文档序号:10471099阅读:139来源:国知局
一种识别方法及装置的制造方法
【专利摘要】本发明实施例提供一种识别方法,所述方法包括:确定待识别的符合预设条件的用户评论信息;将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;获取所述第一类用户终端返回的反馈信息;基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用户对用户评论信息评价的可信度。同时,本发明实施例还提供了一种识别装置。
【专利说明】
-种识别方法及装置
技术领域
[0001 ]本发明设及信息识别技术,具体设及一种识别方法及装置。
【背景技术】
[0002] 随着网络的日益普及,越来越多的用户选择通过在线教育平台进行学习与交流。 目前,随着在线教育平台提供的课程数量W及学习论坛使用人数不断增多,用户在在线教 育平台上产生的评论也呈爆炸式增长,由于在线教育平台的影响力比较大,出现了很多无 效评论,运些无效评论包括设黄、政治敏感、广告等评论信息,给在线教育平台带来了不好 的影响。
[0003] 并且,无效评论的评论特征是日益丰富、变化多样的,图1示出了一种有效评论与 无效评论混杂的截图示意图,在图1中所示出的Ξ条评论中,只有第二条是有效评论,第一 条与第Ξ条均为无效评论,在第一条与第Ξ条中,用实线框标出的内容均为广告内容,即在 评论中隐藏了广告内容。因此,通常判断一条评论是否无效需要做很多判断逻辑才能保证 一定精确度的打击,运意味着耗时比较长。但是,在线教育平台上无效评论产生的量和频率 都是非常惊人的,因此如何在不影响正常业务的吞吐量和性能的前提下,精确地打击无效 评论成为亟待解决的问题。

【发明内容】

[0004] 有鉴于此,本发明实施例为解决现有技术中存在的问题而提供一种识别方法及装 置。
[0005] 本发明的技术方案是运样实现的:
[0006] 本发明实施例提供一种识别方法,所述方法包括:
[0007] 确定待识别的符合预设条件的用户评论信息;
[000引将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户 终端;
[0009] 获取所述第一类用户终端返回的反馈信息;
[0010] 基于反馈信息、W及做出所述反馈信息的第一类用户的置信度参数确定所述待识 别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用 户对用户评论信息评价的可信度。
[0011] 上述方案中,所述确定待识别的符合预设条件的用户评论信息,包括:
[0012] 获取待处理的用户评论信息;
[0013] 对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉 部分不符合所述预设条件的用户评价信息;
[0014] 将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第 二级检测处理过滤掉部分不符合所述预设条件的用户评价信息,
[0015] 确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信 息并确定待识别的符合预设条件的用户评论信息。
[0016] 上述方案中,所述确定待识别的符合预设条件的用户评论信息,还包括:
[0017] 接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息;
[0018] 将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符 合预设条件的用户评论信息中。
[0019] 上述方案中,所述对所述待处理的用户评论信息进行第一级检测处理,包括下述 中的至少一种:
[0020] 对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件 的账号,则拦截与所述符合第二预设条件的账号相关的评论操作;
[0021] 对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述 同一账号在预设时间段内发布的用户评论信息进行拦截;
[0022] 对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。
[0023] 上述方案中,将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测 处理,包括:
[0024] 对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息,
[0025] 利用Μ个不同的判断策略对每一条用户评论信息进行分析,生成Μ个判断结果;其 中,所述Μ为正整数,所述Μ个判断策略均能独立识别用户评论信息所属的类别;
[0026] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果超出预设比例时,过滤掉所述用户评论信息;
[0027] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。
[0028] 上述方案中,所述将所述待识别的符合预设条件的用户评论信息按照预设策略分 发至第一类用户终端,包括:
[0029] 获取第一类用户终端的状态信息W及第一类用户账号的配置信息;
[0030] 基于所述第一类用户终端的状态信息W及所述第一类用户账号的配置信息确定 可分发的第一类用户终端的个数;
[0031] 将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类 用户终端。
[0032] 上述方案中,所述基于反馈信息、W及做出所述反馈信息的第一类用户的置信度 参数确定所述待识别的符合预设条件的用户评论信息所属的类别,包括:
[0033] 对于每一条待识别的符合预设条件的用户评论信息,
[0034] 将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所 述第一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息;
[0035] 将第二种反馈信息的计算参数值赋值为第二数值,其中,所述第二数值为负数,所 述第二种反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息;
[0036] 计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的 置信度参数的乘积进行累加;
[0037] 将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参 数的乘积进行累加;
[0038] 当累加值超出第一预设阔值,确定所述待识别的符合预设条件的用户评论信息所 属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第 二类别;和/或,
[0039] 当累加值的均值超出第二预设阔值时,确定所述待识别的符合预设条件的用户评 论信息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属 类别为第二类别。
[0040] 上述方案中,所述基于反馈信息、W及做出所述反馈信息的第一类用户的置信度 参数确定所述待识别的符合预设条件的用户评论信息所属的类别之后,所述方法还包括:
[0041] 重新计算做出所述反馈信息的第一类用户的置信度参数;
[0042] 基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的 置信度参数。
[0043] 上述方案中,计算做出所述反馈信息的第一类用户的置信度参数,包括:
[0044] 获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、 评论数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数;
[0045] 获取所述参数对应的权重信息;
[0046] 基于与所述第一类用户相关的参数的数据W及相应参数对应的权重信息计算第 一类用户的置信度参数。
[0047] 本发明实施例还提供一种识别装置,所述装置包括:
[004引确定模块,用于确定待识别的符合预设条件的用户评论信息;
[0049] 分发模块,用于将所述待识别的符合预设条件的用户评论信息按照预设策略分发 至第一类用户终端;
[0050] 获取模块,用于获取所述第一类用户终端返回的反馈信息;
[0051] 处理模块,用于基于反馈信息、W及做出所述反馈信息的第一类用户的置信度参 数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用 于表示第一类用户对用户评论信息评价的可信度。
[0052] 上述方案中,所述确定模块,还用于:
[0053] 获取待处理的用户评论信息;
[0054] 对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉 部分不符合所述预设条件的用户评价信息;
[0055] 将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第 二级检测处理过滤掉部分不符合所述预设条件的用户评价信息,
[0056] 确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信 息并确定待识别的符合预设条件的用户评论信息。
[0057] 上述方案中,所述确定模块,还用于:
[005引接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息;
[0059] 将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符 合预设条件的用户评论信息中。
[0060] 上述方案中,所述确定模块对所述待处理的用户评论信息进行第一级检测处理, 包括下述中的至少一种:
[0061] 对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件 的账号,则拦截与所述符合第二预设条件的账号相关的评论操作;
[0062] 对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述 同一账号在预设时间段内发布的用户评论信息进行拦截;
[0063] 对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。
[0064] 上述方案中,所述确定模块将经所述第一级检测处理之后剩余的用户评论信息进 行第二级检测处理,包括:
[0065] 对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息,
[0066] 利用Μ个不同的判断策略对每一条用户评论信息进行分析,生成Μ个判断结果;其 中,所述Μ为正整数,所述Μ个判断策略均能独立识别用户评论信息所属的类别;
[0067] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果超出预设比例时,过滤掉所述用户评论信息;
[0068] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。
[0069] 上述方案中,所述分发模块,还用于:
[0070] 获取第一类用户终端的状态信息W及第一类用户账号的配置信息;
[0071] 基于所述第一类用户终端的状态信息W及所述第一类用户账号的配置信息确定 可分发的第一类用户终端的个数;
[0072] 将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类 用户终端。
[0073] 上述方案中,所述处理模块,还用于:
[0074] 对于每一条待识别的符合预设条件的用户评论信息,
[0075] 将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所 述第一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息;
[0076] 将第二种反馈信息的计算参数值赋值为第二数值,其中,所述第二数值为负数,所 述第二种反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息;
[0077] 计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的 置信度参数的乘积进行累加;
[0078] 将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参 数的乘积进行累加;
[0079] 当累加值超出第一预设阔值,确定所述待识别的符合预设条件的用户评论信息所 属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第 二类别;和/或,
[0080] 当累加值的均值超出第二预设阔值时,确定所述待识别的符合预设条件的用户评 论信息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属 类别为第二类别。
[0081 ]上述方案中,所述装置还包括:
[0082] 评估模块,用于:
[0083] 重新计算做出所述反馈信息的第一类用户的置信度参数;
[0084] 基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的 置信度参数。
[0085] 上述方案中,所述评估模块,还用于:
[0086] 获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、 评论数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数;
[0087] 获取所述参数对应的权重信息;
[0088] 基于与所述第一类用户相关的参数的数据W及相应参数对应的权重信息计算第 一类用户的置信度参数。
[0089] 本发明实施例中,服务器先确定出不能明确用户评论信息所属类别的用户评论信 息,然后将运类用户评论信息均衡分发至第一类用户终端;再通过第一类用户终端返回的 反馈信息、W及做出所述反馈信息的第一类用户的置信度参数确定运类用户评论信息所属 的类别。如此,能在不影响正常业务的吞吐量和性能的前提下,结合在线平台沉淀的用户数 据对运类用户评论信息进行分类,精确打击无效的用户评论信息,从而构建一个有良好环 境的在线平台。
【附图说明】
[0090] 图1为有效评论与无效评论的截图示意图;
[0091 ]图2为本发明实施例提供的识别方法的实现流程示意图;
[0092] 图3为本发明实施例提供的待处理用户评论信息经第一级处理W及第二级处理的 示意图;
[0093] 图4为本发明实施例提供的在第一类用户终端呈现的待识别的符合预设条件的用 户评论信息的一种示意图;
[0094] 图5为本发明实施例提供的服务器与第一类用户终端交互的示意图;
[00M]图6为本发明实施例提供的一种识别系统的工作流程示意图;
[0096] 图7为本发明实施例提供的一种识别可疑评论的各方硬件实体的示意图;
[0097] 图8为本发明实施例提供的识别装置的组成结构示意图。
【具体实施方式】
[0098] 为了能够更加详尽地了解本发明的特点与技术内容,下面结合附图对本发明的实 现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
[0099] 在本发明提供的识别方法及信息处理装置的W下各实施例中,所设及的符合预设 条件的用户评论信息是指可疑的用户评论信息;所述预设条件是指尚不能明确用户评论信 息所属类别。服务器需要对所述符合预设条件的用户评论信息做进一步判断,W便于判断 出所述符合预设条件的用户评论信息是属于有效的评论信息还是无效的评论信息,进而根 据判断结论决定是否将所述符合预设条件的用户评论信息向各类用户展示。其中,所述无 效的评论信息是指含有与评论对象无关的内容的评论信息,如,设黄、政治敏感、广告等评 论信息;其中,所述评论对象可包括授课视频等内容;所述有效的评论信息是指与评论对象 有关的评论信息。
[0100] 下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
[0101] 实施例一
[0102] 本发明实施例提供一种识别方法,所述方法应用于服务器侧,如图2所述,所述方 法包括:
[0103] 步骤201、确定待识别的符合预设条件的用户评论信息。
[0104] 运里,所述用户评论信息主要是指用户在在线平台如在线教育平台、在线商务平 台、在线游戏平台等上所写的评论信息。
[0105] 其中,所述符合预设条件的用户评论信息是指可疑的用户评论信息;所述预设条 件是指尚不能明确用户评论信息所属类别。服务器需要对所述符合预设条件的用户评论信 息做进一步判断,W便于判断出所述符合预设条件的用户评论信息是属于有效的评论信息 还是无效的评论信息。
[0106] 其中,所述无效的评论信息是指与评论对象无关的评论信息,如,设黄、政治敏感、 广告等评论信息;其中,所述评论对象可包括授课视频等内容;所述有效的评论信息是指与 评论对象有关的评论?胃息。
[0107] 本实施例中,并不对用户评论信息的格式类型进行限定,所述用户评论信息可W 是文字、或图片、或音频、或视频等。
[0108] 如此,通过步骤201先确定出尚不能明确判定所属类别的用户评论信息,W待进一 步对运类用户评论信息进行判断,相对于现有技术中粗略地给出判断结论来说,提高了打 击无效评论信息的精确度。
[0109] 在一实施方式中,所述确定待识别的符合预设条件的用户评论信息,包括:
[0110] 获取待处理的用户评论信息;
[0111] 对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉 部分不符合所述预设条件的用户评价信息;
[0112] 将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第 二级检测处理过滤掉部分不符合所述预设条件的用户评价信息,
[0113] 确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信 息并确定待识别的符合预设条件的用户评论信息。
[0114] 运里,通过第一级检测处理,能够过滤掉少量的无效评论信息的同时,同时还能保 证请求的快速响应W及吞吐量。例如,通过第一级检测处理,能够识别出一些简单的关键 词,误判的几率几乎可W忽略。
[0115] 运里,通过第二级检测处理,是为了识别出更多的无效评论,可将所述第二级检测 处理设置为离线任务,在离线状态下进行。如此,更能节省识别无效评论所需的时间。
[0116] 下面,将对第一级处理W及第二级处理做详细描述。
[0117] 其中,所述对所述待处理的用户评论信息进行第一级检测处理,包括下述中的至 少一种:
[0118] 对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件 的账号,则拦截与所述符合第二预设条件的账号相关的评论操作;
[0119] 对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述 同一账号在预设时间段内发布的用户评论信息进行拦截;
[0120] 对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。
[0121] 运里,所述符合第二预设条件的账号是指账号出现异常情况的账号,所述异常情 况,包括:账号等级异常、最近被盗、活跃天数异常。
[0122] 运里,所述预设特征可W是关键字、关键词等。
[0123] 运里,通过第一级检测处理,能够过滤掉少量的无效评论信息的同时,同时还能保 证请求的快速响应W及吞吐量。例如,通过第一级检测处理,能够识别出一些简单的关键 词,误判的几率几乎可W忽略。
[0124] 其中,将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理, 包括:
[0125] 对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息,
[0126] 利用Μ个不同的判断策略对每一条用户评论信息进行分析,生成Μ个判断结果;其 中,所述Μ为正整数,所述Μ个判断策略均能独立识别用户评论信息所属的类别;
[0127] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果超出预设比例时,过滤掉所述用户评论信息;
[0128] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。
[0129] 举例来说,总共有5个判断策略,对某条用户评论信息进行判断时,有4个判断策略 给出的判断结果均为该条用户评论为无效,超出了预设比例,则确定该条用户评论为无效 评论,直接对该条用户评论进行拦截;对另一条用户评论信息进行判断时,有3个判断策略 给出的判断结果为该条用户评论为有效,有2个判断策略给出的判断结果为该条用户评论 为无效,则将该条用户评论确定为可疑评论,需要通过步骤203进一步对该条评论进行核 实。
[0130] 运里,通过第二级检测处理,能够尽最大力度的识别出无效评论。由于在第二级检 测处理中采用Μ个不同的判断策略对用户评论信息进行分析,能够识别出更多的无效评论。
[0131] 图3示出了待处理用户评论信息经第一级处理W及第二级处理的示意图,如图3所 示,第一级处理能过确认一部分无效评论W及有效评论,第二级处理能过确认大部分无效 评论W及有效评论,但是,若经过第二级处理之后,对所有的待处理的用户评论信息直接给 出判定定论,很可能发生不少的误判或漏判,因此,需要较为合理的找出第二级检测处理不 能肯定的可疑用户评论信息,然后再通过步骤203对存疑用户评论信息做进一步判断,如 此,能够增加识别无效评论的精确度。
[0132] 在另一实施方式中,所述确定待识别的符合预设条件的用户评论信息,还包括:
[0133] 接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息;
[0134] 将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符 合预设条件的用户评论信息中。
[0135] 运里,所述第二类用户可W是任何能够登录在线平台且发表评论的用户。
[0136] 有上述两个实施方式可知,待识别的符合预设条件的用户评论信息主要有两个来 源,来源一:服务器通过第一级处理W及第二级处理而获得的运类用户评论信息;来源二: 直接来自用户举报其自认为是符合预设条件的用户评论信息。
[0137] 如此,接收用户的举报,并负责的对用户所举报的内容进行分析,使得进入步骤 202的待识别的符合预设条件的用户评论信息更加全面,更有利于为用户营造一个良好的 在线平台的氛围。
[0138] 步骤202、将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第 一类用户终端。
[0139] 优选地,所述第一类用户终端是指第一类用户账号所在的终端。第一类用户可W 是在线平台所设及的内部人员,如在在线平台上授课的老师、通过在线平台听课的学员、在 线平台的网站管理员等。
[0140] 在一实施例中,所述将所述待识别的符合预设条件的用户评论信息按照预设策略 分发至第一类用户终端,包括:
[0141] 获取第一类用户终端的状态信息W及第一类用户账号的配置信息;
[0142] 基于所述第一类用户终端的状态信息W及所述第一类用户账号的配置信息确定 可分发的第一类用户终端的个数;
[0143] 将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类 用户终端。
[0144] 其中,所述状态信息包括第一类用户是否在线。
[0145] 也就是说,尽量将所述待识别的符合预设条件的用户评论信息分发给当前在线的 第一类用户账号所在终端,如此,第一类用户及时对所述待识别的符合预设条件的用户评 论信息做出判断的可能性比较大。
[0146] 其中,所述配置信息,包括是否同意接收所述待识别的符合预设条件的用户评论 信息。也就是说,服务器允许第一类用户修改自己的账号配置,第一类用户可W同意接收所 述待识别的符合预设条件的用户评论信息,对所述待识别的符合预设条件的用户评论信息 做出判断并反馈给服务器。如此,利用大众用户参与评论信息的反馈,构建一个有良好环境 的在线平台。当然,服务器允许第一类用户拒绝接收所述待识别的符合预设条件的用户评 论信息,如此,能够让自己免受运类用户评论信息的打扰。
[0147] 其中,所述均衡分发,是指尽量让所述待识别的符合预设条件的用户评论信息平 均分发到可分发的第一类用户终端中。
[0148] 如此,能够避免一些第一类用户接收到过多的可疑评论信息,而另一些第一类用 户接收到过少甚至未接收到可疑评论信息;让当前可分发的第一类用户终端尽量的均接收 到几个可疑评论信息,运样,每一个第一类用户既对分到的可疑评论不生反感,又能较快地 对分到的可疑评论做出判断,并向服务器反馈。
[0149] 举例来说,某在线教育平台总共有第一类用户100个,当前在线人员为50个;在一 个小时内产生8000条评论信息,服务器确定200条可疑评论信息,服务器将运200条可疑评 论信息分成50组,每组包含4条可疑评论信息,并向在线的运50个人员中一人随机派发两组 可疑评论信息,每个在线人员的终端均能收到8条可疑评论信息,且对于每一条可疑评论, 至少有一个终端能对该条可疑评论做出判断。如此,50个在线人员能较快地对分到的8条可 疑评论信息做出判断,对每个在线人员带来的干扰较小。
[0150] 步骤203、获取所述第一类用户终端返回的反馈信息。
[0151] 在一实施方式中,服务器在向第一类用户终端分发所述待识别的符合预设条件的 用户评论信息时,包括:
[0152] 为每一条待识别的符合预设条件的用户评论信息预留判断区域;
[0153] 在所述判断区域中设置有可供用户选择的标签;
[0154] 其中,所述标签至少包括:广告、设黄、正常、赞赏、暴力。
[0155] 在一实施方式中,第一类用户终端接收到携带有标签的待识别的符合预设条件的 用户评论信息之后,第一类用户终端显示所述携带有标签的待识别的符合预设条件的用户 评论信息;接收第一类用户的输入操作;将所述输入操作对应的信息发送至服务器。如此, 用户仅需勾选其认为所述待识别的符合预设条件的用户评论信息所属的标签即可。
[0156] 图4示出了一种在第一类用户终端呈现的待识别的符合预设条件的用户评论信息 的示意图,如图4所示,对于每一条待识别的符合预设条件的用户评论信息,分为信息展示 区域W及判断区域,在所述判断区域中有各类标签,如广告、设黄、正常、赞赏、暴力等标签, 可供用户选择;如此,既不影响第一类用户阅读所述用户评论信息,又方便第一类用户对各 类标签进行勾选。
[0157] 需要说明的是,获取的所述第一类用户终端返回的反馈信息的数量与发出的待识 别的符合预设条件的用户评论信息的条数可能不相等。例如,有些第一类用户可能没有注 意到所述待识别的符合预设条件的用户评论信息,或是没有时间给出反馈,或是拒绝对所 述待识别的符合预设条件的用户评论信息给出反馈等,运些原因均会导致获取的所述第一 类用户终端返回的反馈信息的数量与发出的待识别的符合预设条件的用户评论信息的条 数不相等。但是,运并不会对服务器后续对所述待识别的符合预设条件的用户评论信息的 类别的判断造成很大影响。
[0158] 步骤204、基于反馈信息、W及做出所述反馈信息的第一类用户的置信度参数确定 所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示 第一类用户对用户评论信息评价的可信度。
[0159] 在一实施例中,所述基于反馈信息、W及做出所述反馈信息的第一类用户的置信 度参数确定所述待识别的符合预设条件的用户评论信息所属的类别,包括:
[0160] 对于每一条待识别的符合预设条件的用户评论信息,
[0161] 将第一种反馈信息的计算参数值赋值为第一数值,可用数值A表示,其中,A为正 数,所述第一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息;
[0162] 将第二种反馈信息的计算参数值赋值为第二数值,可用数值B表示,其中,B为负 数,所述第二种反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息;
[0163] 计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的 置信度参数的乘积进行累加;
[0164] 将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参 数的乘积进行累加;
[0165] 当累加值超出第一预设阔值,确定所述待识别的符合预设条件的用户评论信息所 属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第 二类别;和/或,
[0166] 当累加值的均值超出第二预设阔值时,确定所述待识别的符合预设条件的用户评 论信息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属 类别为第二类别。
[0167] 运里,所述第一类反馈信息是指判定所述待识别的符合预设条件的用户评论信息 所属类别为第一类别的反馈信息;所述第二类反馈信息是指判定所述待识别的符合预设条 件的用户评论信息所属类别为第二类别的反馈信息。
[0168] 例如,所述第一类别是指无效评论,即与在线平台所设及内容无关的评论信息, 如,设黄、政治敏感、广告等评论信息;所述第二类别是指有效评论,如,与在线平台所设及 内容有关的评论信息。
[0169] 运里,所述第一预设阔值与所述第二预设阔值不相等。
[0170] 具体地,对每一条用户评论信息评分的计算公式可W为
其中,An表示为第一种反馈信息的计算参数赋的值,N表示第一类反馈信息的个数,Υη表示做 出第一类反馈信息的用户的置信度参数;Bm表示为第二种反馈信息的计算参数赋的值,Μ表 示第二类反馈信息的个数,Qm表示做出第二类反馈信息的用户的置信度参数。
[0171] 举例来说,服务器将同一条可疑评论信息发送给10个人,经对运10个人对该条评 论信息做出的反馈信息进行统计可知,运10个人对该条评论信息做出的判断结果为:无效、 无效、无效、无效、有效、无效、有效、无效、有效、无效;那么,将运10个人的反馈信息的计算 参数值分别赋值为A、A、A、A、B、A、B、A、B、A;A=1,B = -1运10个人的置信度参数的计算参数 值分别赋值为60%、70%、50%、30%、30%、40%、40%、20%、10%、30%;设A为l,B为-l,求 累加值为:60% X 1+70% X 1+50% X 1+30% X 1-30% X 1+40% X 1-40% X 1+20% X 1-10% X 1+30% X 1 = 2.2〉第一预设阔值=0.5,那么,则判断该条可疑评论信息为无效评论。
[0172] 参照图2所示技术方案,图5示出了一种服务器与第一类用户终端交互的示意图, 如图5所示,具体的,
[0173] 步骤501:服务器确定可接收可疑评论的用户终端;
[0174] 步骤502:服务器将所述待识别的可疑用户评论信息均衡分发至所确定的接收可 疑评论的用户终端;
[0175] 例如,如图6所示,服务器向终端1发送可疑评论A、B,服务器向终端2发送可疑评论 B、C,服务器向终端3发送可疑评论C、A,服务器向终端N发送可疑评论n、n+l,相应的,终端1 向服务器返回对可疑评论A、B的判断结果,终端2向服务器返回对可疑评论B、C的判断结果, 终端3向服务器返回对可疑评论A、C的判断结果;终端N向服务器返回对可疑评论n、n+l的判 断结果.
[0176] 步骤503:服务器根据各个终端的反馈信息W及终端所对应的第一类用户的置信 度参数计算每个可疑评论的评分。
[0177] 如此,服务器根据每一个用户的每一次评判,都会根据各项数据结合权重算出得 分并加入可疑评论的总分中,当总分超过一定值,那么该评论则被标记为"待进一步处理评 论",运些评论最终到管理后台让管理员进行最终处理。
[0178] 可选地,在执行步骤204之后,所述方法还包括:
[0179] 重新计算做出所述反馈信息的第一类用户的置信度参数;
[0180] 基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的 置信度参数。
[0181] 如此,能够及时对第一类用户的置信度参数进行更新,更能有助于结合第一类用 户的置信度参数对第一类用户所做出的反馈信息做出较为客观的评价,使得对可疑的用户 评论信息所属的类别的判断更为准确。
[0182] 在一实施方式中,计算做出所述反馈信息的第一类用户的置信度参数,包括:
[0183] 获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、 评论数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数;
[0184] 获取所述参数对应的权重信息;
[0185] 基于与所述第一类用户相关的参数的数据W及相应参数对应的权重信息计算第 一类用户的置信度参数。
[0186] 其中,所述上课时间段是指第一类用户所报名的课程的上课时间,如,甲用户报名 课程:英语;英语教学时间为8:00~9:00,则上课时间段为8:00~9:00。
[0187] 其中,所述成功证实他人的非法评论数,是指该用户对他人的评论信息的判断正 确的数量;
[0188] 其中,所述自身评论被判定为非法评论数,是指自己发表过的评论信息被判定是 非法评论的数量。
[0189] 在一具体实施例方式中,置信度参数的计算公式为:
[0190]
,其中,Total_score表示置信度参数,Xk表示影响置信度 因子,Ok表示影响置信度因子的权重系数,其中,K表示影响置信度因子的总数。
[0191 ]举例来说,Total_score = applied_num*al+comment_num*a^online_time*a3+ success」udge_rate*a4-illegal_comment_rate*a5。其中,Total_score 表不置信度参数, app 1 i ed_num表示报名课程数,comment_num表示评论数,onl ine_t ime表示上课时间段, success」udge_rate表示成功证实他人的非法评论数,illegal_comment_rate表示自身评 论被判定为非法评论数;其中,α1表示报名课程数的权重,表示评论数的权重,α3表示上 课时间段的权重,α4表示成功证实他人的非法评论数的权重,α5表示自身评论被判定为非 法评论数的权重;优选地,α 1 +α2+α3+α4+α5 =预设值;,所述α 1、α2、α3、α4、α5、Κ及预设值均 可W根据大重试验统计数据进化设走。例如,日1二0.04,日2 = 0.12,日3 = 0.32,日4 = 0.42, 口 5 =0.1,α1+α 化 α3+α4+α5 = 1。
[0192] 本实施例所述技术方案中,服务器确定待识别的符合预设条件的用户评论信息; 将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;获取 所述第一类用户终端返回的反馈信息;基于反馈信息、W及做出所述反馈信息的第一类用 户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述 置信度参数用于表示第一类用户对用户评论信息评价的可信度。如此,可W结合在线平台 沉淀的用户数据对符合预设条件的用户评论信息进行分类,能在不影响正常业务的吞吐量 和性能的前提下,精确打击无效的用户评论信息。
[0193] 实施例二
[0194] 基于实施例一所述技术方案,给出了一种识别系统的工作流程示意图,如图6所 示,所述识别系统,主要包括:串联监测系统、旁路监测系统、可疑评论分发系统、置信度评 估系统、评分系统;
[01Μ]其中,所述串联监测系统负责频率控制、账号信息检测、内容检测。
[0196]所述串联监测系统包括:频率控制模块,账号信息检测模块、内容检测模块;具体 地,
[0197] 所述频率控制模块,负责读取所述串联监测系统的频率配置信息,如频率配置信 息为一个用户账号1分钟内允许评论2次,根据IP地址,对用户进行评论频率进行控制,如果 超过一定频率,则进行拦截。
[0198] 所述账号信息检测模块,负责利用账号管理系统,如腾讯内部的账号系统,来查询 账号的异常情况,如果账号是异常的,如等级异常、最近被盗事件、活跃天数异常等,则可W 直接拦截此账号的评论操作。
[0199] 所述内容检测模块,主要负责根据一些关键词、重复性内容进行打击,如果命中敏 感关键词,则实时拦截。
[0200] 运里,所述串联监测系统具有基本的拦截打击能力,而且耗时很小,满足了程序性 能、吞吐量、W及基本打击的要求。虽然在打击无效评论的精确度上比较粗略简单,但是,所 述串联监测系统未发现的无效评论可W由后续的旁路监测系统进行进一步打击。
[0201] 所述旁路监测系统,负责接收经所述串联监测系统过滤之后剩余的用户评论信 息;通过第二级检测处理过滤掉部分不符合所述预设条件的用户评价信息,并将经过所述 第一级检测处理和第二检测处理过滤之后剩余的所述用户评价信息确定为待识别的符合 预设条件的用户评论信息。
[0202] 为了保证打击的精确度,又不影响正常业务的吞吐量和性能,将比较耗时的打击 分析做成了离线任务的形式,即将旁路监测系统的工作设置为离线任务的工作。
[0203] 具体地,所述旁路监测系统,负责分析评论中带有的外部连接(拉回连接内容进行 分析),W及图片(鉴别图片是否为黄图)和QQ(查询qq号码是否为黑名单或者被举报)号码。
[0204] 由于所述旁路监测系统在进行处理时采用大量的策略分析处理,采用了 W时间换 精确度的策略,力求最大力度的识别无效评论。若采用所述旁路监测系统之后,对所有的待 处理的用户评论信息直接给出判定定论,很可能发生不少的误判或漏判,因此,所述旁路监 测系统将其非常肯定的有效评论过滤掉,并将其非常肯定的无效评论打击掉,确定出其不 能肯定是有效评论还是无效评论的可疑用户评论信息,转入可疑评论分发系统进行分发。
[0205] 所述可疑评论分发系统进行分发,负责接收所述旁路监测系统发送的可疑用户评 论信息,还负责接收用户主动反馈的认为可疑用户评论信息;还负责将所述可疑用户评论 信息均衡分发至第一类用户终端,W由第一类用户对所述可疑评论进行判断。
[0206] 具体地,在第一类用户终端上,显示的可疑评论携带有可供用户选择的标签。
[0207] 所述可疑评论分发系统,在分发可疑评论时,考虑第一类用户终端的状态信息W 及第一类用户账号的配置信息等情况,优先向当前在线的用户W及选择同意接收对可疑评 论进行判断的用户分发可疑评论。
[0208] 所述置信度评估系统,负责计算做出所述反馈信息的第一类用户的置信度参数;
[0209] 所述评分系统,用于根据每一个第一类用户的评分W及做出所述反馈信息的第一 类用户的置信度参数对可疑评论进行评分,根据评分结果确定所述待识别的可疑评论所属 类别,即判断所述可疑评论是为有效评论还是无效评论。
[0210] 运里,每一个用户的每一次评判,都会根据各项数据结合权重算出得分并加入可 疑评论的总分中,当总分超过一定值,那么该评论则被标记为"待进一步处理评论",运些评 论最终到管理后台让管理员进行最终处理,管理员处理后,处理结果产生的数据又会作用 于我们的置信度评估系统。
[0211] 上述识别系统是一种高效、吞吐量大、打击精准、且可W结合利用在线本身平台沉 淀的用户数据的非法评论打击系统。
[0212] 实施例S
[0213] 图7示出了一种识别可疑评论的各方硬件实体的示意图,图7中包括:服务器1~4、 终端设备1-N,终端设备1-N通过有线网络或者无线网络与服务器进行信息交互,终端设备 包括手机、台式机、PC机、一体机等类型。其中,终端设备中安装了在线平台应用,采用本发 明实施例,基于图7所示的系统,服务器1接收海量的用户评论,对所述海量的用户评论进行 第一级处理,然后将经所述第一级检测处理之后剩余的用户评论发送至服务器2,由服务器 2对经所述第一级检测处理之后剩余的用户评论进行第二级检测处理,将经所述第二级检 测处理之后剩余的用户评论发送至服务器3,由服务器3确定待识别的可疑评论,并向当前 可接收可疑评论的终端均衡分发待识别的可疑评论,服务器3还接收终端返回的反馈信息, 从服务器4获取做出反馈信息的终端用户的置信度参数,根据各种反馈信息对应的数值与 做出所述相应反馈信息的第一类用户的置信度参数计算每条待识别的可疑评论的评分,根 据评分结果确定可疑评论是有效评论还是无效评论,将需要由管理员进一步确认的可疑评 论,发送至管理后台,由后台管理员进行处理;服务器4还用于对做出所述反馈信息的终端 用户做置信度评估。
[0214] 需要说明的是,上述图7的例子只是实现本发明实施例的一个系统架构实例,本发 明实施例并不限于上述图7所述的系统结构。
[0215] 实施例四
[0216] 基于实施例一所述技术方案,本发明实施例还提供一种识别装置,如图8所示,所 述识别装置包括:
[0217] 确定模块81,用于确定待识别的符合预设条件的用户评论信息;
[0218] 分发模块82,用于将所述待识别的符合预设条件的用户评论信息按照预设策略分 发至第一类用户终端;
[0219] 获取模块83,用于获取所述第一类用户终端返回的反馈信息;
[0220] 处理模块84,用于基于反馈信息、W及做出所述反馈信息的第一类用户的置信度 参数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数 用于表示第一类用户对用户评论信息评价的可信度。
[0221] 具体地,所述确定模块81,还用于:
[0222] 获取待处理的用户评论信息;
[0223] 对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉 部分不符合所述预设条件的用户评价信息;
[0224] 将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第 二级检测处理过滤掉部分不符合所述预设条件的用户评价信息,
[0225] 确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信 息并确定待识别的符合预设条件的用户评论信息。
[0。6]具体地,所述确定模块81,还用于:
[0227]接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息;
[0228] 将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符 合预设条件的用户评论信息中。
[0229] 具体地,所述确定模块81对所述待处理的用户评论信息进行第一级检测处理,包 括下述中的至少一种:
[0230] 对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件 的账号,则拦截与所述符合第二预设条件的账号相关的评论操作;
[0231] 对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述 同一账号在预设时间段内发布的用户评论信息进行拦截;
[0232] 对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。
[0233] 具体地,所述确定模块81将经所述第一级检测处理之后剩余的用户评论信息进行 第二级检测处理,包括:
[0234] 对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息,
[0235] 利用Μ个不同的判断策略对每一条用户评论信息进行分析,生成Μ个判断结果;其 中,所述Μ为正整数,所述Μ个判断策略均能独立识别用户评论信息所属的类别;
[0236] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果超出预设比例时,过滤掉所述用户评论信息;
[0237] 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判 断结果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。
[0238] 具体地,所述分发模块82,还用于:
[0239] 获取第一类用户终端的状态信息W及第一类用户账号的配置信息;
[0240] 基于所述第一类用户终端的状态信息W及所述第一类用户账号的配置信息确定 可分发的第一类用户终端的个数;
[0241] 将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类 用户终端。
[0242] 具体地,所述处理模块84,还用于:
[0243] 对于每一条待识别的符合预设条件的用户评论信息,
[0244] 将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所 述第一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息;
[0245] 将第二种反馈信息的计算参数值赋值为第二数值,其中,所述第二数值为负数,所 述第二种反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息;
[0246] 计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的 置信度参数的乘积进行累加;
[0247] 将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参 数的乘积进行累加;
[0248] 当累加值超出第一预设阔值,确定所述待识别的符合预设条件的用户评论信息所 属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第 二类别;和/或,
[0249] 当累加值的均值超出第二预设阔值时,确定所述待识别的符合预设条件的用户评 论信息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属 类别为第二类别。
[0250]上述方案中,优选地,所述装置还包括:
[0巧1]评估模块85,用于:
[0252] 重新计算做出所述反馈信息的第一类用户的置信度参数;
[0253] 基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的 置信度参数。
[0254] 具体地,所述评估模块85,还用于:
[0255] 获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、 评论数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数;
[0256] 获取所述参数对应的权重信息;
[0257] 基于与所述第一类用户相关的参数的数据W及相应参数对应的权重信息计算第 一类用户的置信度参数。
[0258] 本实施例所述识别装置可设置于服务器上。
[0259] 本领域技术人员应当理解,本实施例的识别装置中各单元的功能,可参照前述识 别方法的相关描述而理解,本实施例的识别装置中各单元,可通过实现本实施例所述的功 能的模拟电路而实现,也可W通过执行本实施例所述的功能的软件在智能终端上的运行而 实现。
[0260] 实际应用中,上述确定模块81、分发模块82、获取模块83、处理模块84、评估模块85 的具体结构均可对应于处理器。所述处理器具体的结构可W为中央处理器(CPU, Cental Processing 加 it)、微处理器(MCU,Mic;ro Controller 加 it)、数字信号处理器(DSP, Digital Si即al Processing)或可编程逻辑器件(PLCJrogrammable Logic Controller) 等具有处理功能的电子元器件或电子元器件的集合。其中,所述处理器包括可执行代码,所 述可执行代码存储在存储介质中,所述处理器可W通过总线等通信接口与所述存储介质中 相连,在执行具体的各模块的对应功能时,从所述存储介质中读取并运行所述可执行代码。 所述存储介质用于存储所述可执行代码的部分优选为非瞬间存储介质。
[0261] 所述确定模块81、分发模块82、获取模块83、处理模块84、评估模块85可W集成对 应于同一处理器,或分别对应不同的处理器;当集成对应于同一处理器时,所述处理器采用 时分处理所述确定模块81、分发模块82、获取模块83、处理模块84、评估模块85对应的功能。
[0262] 本实施例的识别装置,可W结合在线平台沉淀的用户数据对符合预设条件的用户 评论信息进行分类,能在不影响正常业务的吞吐量和性能的前提下,打击无效的用户评论 信息。
[0263] 在本申请所提供的几个实施例中,应该理解到,所掲露的设备和方法,可W通过其 它的方式实现。W上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为 一种逻辑功能划分,实际实现时可W有另外的划分方式,如:多个单元或组件可W结合,或 可W集成到另一个系统,或一些特征可W忽略,或不执行。另外,所显示或讨论的各组成部 分相互之间的禪合、或直接禪合、或通信连接可W是通过一些接口,设备或单元的间接禪合 或通信连接,可W是电性的、机械的或其它形式的。
[0264] 上述作为分离部件说明的单元可W是、或也可W不是物理上分开的,作为单元显 示的部件可W是、或也可W不是物理单元;既可W位于一个地方,也可W分布到多个网络单 元上;可w根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0265] 另外,在本发明各实施例中的各功能单元可W全部集成在一个处理单元中,也可 W是各单元分别单独作为一个单元,也可W两个或两个W上单元集成在一个单元中;上述 集成的单元既可W采用硬件的形式实现,也可W采用硬件加软件功能单元的形式实现。
[0266] 本领域普通技术人员可W理解:实现上述方法实施例的全部或部分步骤可W通过 程序指令相关的硬件来完成,前述的程序可W存储于计算机可读取存储介质中,该程序在 执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存 储器(Read-Only Memoir,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者 光盘等各种可W存储程序代码的介质。
[0267] 或者,本发明上述集成的单元如果W软件功能模块的形式实现并作为独立的产品 销售或使用时,也可W存储在一个计算机可读取存储介质中。基于运样的理解,本发明实施 例的技术方案本质上或者说对现有技术做出贡献的部分可软件产品的形式体现出来, 该计算机软件产品存储在一个存储介质中,包括若干指令用W使得一台计算机设备(可W 是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。 而前述的存储介质包括:移动存储设备、R〇M、RAM、磁碟或者光盘等各种可W存储程序代码 的介质。
[0268] W上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明掲露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应W所述权利要求的保护范围为准。
【主权项】
1. 一种识别方法,其特征在于,所述方法包括: 确定待识别的符合预设条件的用户评论信息; 将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端; 获取所述第一类用户终端返回的反馈信息; 基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的 符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用户对 用户评论信息评价的可信度。2. 根据权利要求1所述的方法,其特征在于,所述确定待识别的符合预设条件的用户评 论信息,包括: 获取待处理的用户评论信息; 对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉部分 不符合所述预设条件的用户评价信息; 将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第二级 检测处理过滤掉部分不符合所述预设条件的用户评价信息, 确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信息并 确定待识别的符合预设条件的用户评论信息。3. 根据权利要求1所述的方法,其特征在于,所述确定待识别的符合预设条件的用户评 论信息,还包括: 接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息; 将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符合预 设条件的用户评论信息中。4. 根据权利要求2所述的方法,其特征在于,所述对所述待处理的用户评论信息进行第 一级检测处理,包括下述中的至少一种: 对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件的账 号,则拦截与所述符合第二预设条件的账号相关的评论操作; 对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述同一 账号在预设时间段内发布的用户评论信息进行拦截; 对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。5. 根据权利要求2所述的方法,其特征在于,将经所述第一级检测处理之后剩余的用户 评论信息进行第二级检测处理,包括: 对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息, 利用Μ个不同的判断策略对每一条用户评论信息进行分析,生成Μ个判断结果;其中,所 述Μ为正整数,所述Μ个判断策略均能独立识别用户评论信息所属的类别; 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结 果超出预设比例时,过滤掉所述用户评论信息; 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结 果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。6. 根据权利要求1所述的方法,其特征在于,所述将所述待识别的符合预设条件的用户 评论信息按照预设策略分发至第一类用户终端,包括: 获取第一类用户终端的状态信息以及第一类用户账号的配置信息; 基于所述第一类用户终端的状态信息以及所述第一类用户账号的配置信息确定可分 发的第一类用户终端的个数; 将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类用户 终端。7. 根据权利要求1所述的方法,其特征在于,所述基于反馈信息、以及做出所述反馈信 息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类 别,包括: 对于每一条待识别的符合预设条件的用户评论信息, 将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所述第 一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息; 将第二种反馈信息的计算参数值赋值为第二数值,其中,第二数值为负数,所述第二种 反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息; 计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的置信 度参数的乘积进行累加; 将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参数的 乘积进行累加; 当累加值超出第一预设阈值,确定所述待识别的符合预设条件的用户评论信息所属类 别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第二类 另IJ;和/或, 当累加值的均值超出第二预设阈值时,确定所述待识别的符合预设条件的用户评论信 息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别 为第二类别。8. 根据权利要求1所述的方法,其特征在于,所述基于反馈信息、以及做出所述反馈信 息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类 别之后,所述方法还包括: 重新计算做出所述反馈信息的第一类用户的置信度参数; 基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的置信 度参数。9. 根据权利要求8所述的方法,其特征在于,计算做出所述反馈信息的第一类用户的置 信度参数,包括: 获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、评论 数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数; 获取所述参数对应的权重信息; 基于与所述第一类用户相关的参数的数据以及相应参数对应的权重信息计算第一类 用户的置信度参数。10. -种识别装置,其特征在于,所述装置包括: 确定模块,用于确定待识别的符合预设条件的用户评论信息; 分发模块,用于将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第 一类用户终端; 获取模块,用于获取所述第一类用户终端返回的反馈信息; 处理模块,用于基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确 定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表 示第一类用户对用户评论信息评价的可信度。11. 根据权利要求10所述的装置,其特征在于,所述确定模块,还用于: 获取待处理的用户评论信息; 对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉部分 不符合所述预设条件的用户评价信息; 将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第二级 检测处理过滤掉部分不符合所述预设条件的用户评价信息, 确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信息并 确定待识别的符合预设条件的用户评论信息。12. 根据权利要求10所述的装置,其特征在于,所述确定模块,还用于: 接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息; 将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符合预 设条件的用户评论信息中。13. 根据权利要求11所述的装置,其特征在于,所述确定模块对所述待处理的用户评论 信息进行第一级检测处理,包括下述中的至少一种: 对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件的账 号,则拦截与所述符合第二预设条件的账号相关的评论操作; 对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述同一 账号在预设时间段内发布的用户评论信息进行拦截; 对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。14. 根据权利要求11所述的装置,其特征在于,所述确定模块将经所述第一级检测处理 之后剩余的用户评论信息进行第二级检测处理,包括: 对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息, 利用Μ个不同的判断策略对每一条用户评论信息进行分析,生成Μ个判断结果;其中,所 述Μ为正整数,所述Μ个判断策略均能独立识别用户评论信息所属的类别; 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结 果超出预设比例时,过滤掉所述用户评论信息; 在所述Μ个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结 果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。15. 根据权利要求10所述的装置,其特征在于,所述分发模块,还用于: 获取第一类用户终端的状态信息以及第一类用户账号的配置信息; 基于所述第一类用户终端的状态信息以及所述第一类用户账号的配置信息确定可分 发的第一类用户终端的个数; 将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类用户 终端。16. 根据权利要求10所述的装置,其特征在于,所述处理模块,还用于: 对于每一条待识别的符合预设条件的用户评论信息, 将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所述第 一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息; 将第二种反馈信息的计算参数值赋值为第二数值,其中,所述第二数值为负数,所述第 二种反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息; 计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的置信 度参数的乘积进行累加; 将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参数的 乘积进行累加; 当累加值超出第一预设阈值,确定所述待识别的符合预设条件的用户评论信息所属类 别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第二类 另IJ;和/或, 当累加值的均值超出第二预设阈值时,确定所述待识别的符合预设条件的用户评论信 息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别 为第二类别。17. 根据权利要求10所述的装置,其特征在于,所述装置还包括: 评估模块,用于: 重新计算做出所述反馈信息的第一类用户的置信度参数; 基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的置信 度参数。18. 根据权利要求17所述的装置,其特征在于,评估模块,还用于: 获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、评论 数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数; 获取所述参数对应的权重信息; 基于与所述第一类用户相关的参数的数据以及相应参数对应的权重信息计算第一类 用户的置信度参数。
【文档编号】G06F17/30GK105824805SQ201610302495
【公开日】2016年8月3日
【申请日】2016年5月9日
【发明人】黄当武, 衡阵
【申请人】腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1