一种用于确定评论的有效性的方法与装置制造方法

文档序号:6628458阅读:107来源:国知局
一种用于确定评论的有效性的方法与装置制造方法
【专利摘要】本发明的目的是提供一种在网络设备中用于确定评论的有效性的方法和装置。其中,该方法包括:获取对于被评论对象的一个或多个评论;对所述一个或多个评论中的各个评论,确定所述评论所对应的评论特征;根据所述评论特征,确定所述评论的有效性。与现有技术相比,本发明基于评论特征来确定评论的有效性,从而有效地鉴别了评论是否为有效评论,有助于用户获取到更为有效的评论信息,从而提升用户体验。
【专利说明】一种用于确定评论的有效性的方法与装置

【技术领域】
[0001] 本发明涉及互联网领域,尤其涉及一种确定评论的有效性的方法与装置。

【背景技术】
[0002] 当前,互联网时代的用户越来越倾向于从网络上获取评论信息以做参考,例如当 用户需要更多地了解产品质量或商家信誉时,用户可以从网络上获取来自其他用户的评论 信息。然而,网络上存在的评论信息质量良莠不齐,其中甚至存在部分虚假或无效的评论信 息。如何自动鉴别评论信息的有效性是一个亟待解决的问题。


【发明内容】

[0003] 本发明的目的是提供一种用于确定评论信息的有效性的方法与装置。
[0004] 根据本发明的一个方面,提供一种用于确定评论的有效性的方法,其中,该方法包 括:
[0005] -获取对于被评论对象的一个或多个评论;
[0006] -对所述一个或多个评论中的各个评论,确定所述评论所对应的评论特征;
[0007] -根据所述评论特征,确定所述评论的有效性。
[0008] 根据本发明的另一个方面,提供一种用于确定评论的有效性的装置,其中,该装置 包括:
[0009] -用于获取对于被评论对象的一个或多个评论的装置;
[0010]-用于对所述一个或多个评论中的各个评论,确定所述评论所对应的评论特征的 装置;
[0011]-用于根据所述评论特征,确定所述评论的有效性的装置。
[0012] 根据本发明的再一个方面,提供一种搜索信息的方法,其中包括:
[0013] -基于来自用户设备的查询序列进行匹配查询,获取一条或多条搜索结果,其中包 括至少一个评论;
[0014] -根据所述评论的有效性,将所述至少一个评论提供给用户设备;
[0015] 其中,还包括,根据前述第一方面的方法来确定各个评论的有效性。
[0016] 根据本发明的又一个方面,提供一种搜索信息的装置,其中包括:
[0017] -用于基于来自用户设备的查询序列进行匹配查询,获取一条或多条搜索结果,其 中包括至少一个评论的装置;
[0018] -用于根据所述评论的有效性,将所述至少一个评论提供给用户设备的装置;
[0019] 其中,还包括,根据前述第二方面的用于确定各个评论的有效性的装置。
[0020] 与现有技术相比,本发明基于评论特征来确定评论的有效性,从而有效地鉴别了 评论是否为有效评论,有助于用户获取到更为有效的评论信息,从而提升用户体验。

【专利附图】

【附图说明】
[0021] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它 特征、目的和优点将会变得更明显:
[0022] 图1示出根据本发明一个方面的实施例的用于确定评论的有效性的方法流程图;
[0023] 图2示出根据本发明另一个方面的实施例的用于确定评论的有效性的装置的示 意图。
[0024] 附图中相同或相似的附图标记代表相同或相似的部件。

【具体实施方式】
[0025] 下面结合附图对本发明作进一步详细描述。
[0026] 图1示出根据本发明一个方面的实施例的用于确定评论的有效性的方法流程图。
[0027] 该用于确定评论的有效性的方法可以在网络设备上被实现。此处,所述网络设备 包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的 云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云 计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述 网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网 络)等。
[0028] 首先,在步骤S11中,网络设备获取对于被评论对象的一个或多个评论。此处,被 评论对象可以为任何实体或非实体,例如产品、商家、风景点、展览会等。网络设备可以通过 查询存储评论的数据库,或通过一定的接口与例如网站等交互来获取被评论对象的一个或 多个评论。
[0029] 接着,在步骤S12中,网络设备对所述一个或多个评论中的各个评论,确定所述评 论对应的评论特征。评论特征可以包括任何与评论有关的特征,例如其是否为好评、其是否 由经过实名认证的评论者所发布等各种特征。在一个实施例中,可以预先设定需要确定的 评论特征的类型。并且,在一个实施例中,还可以根据实际需要来调整需要确定的评论特征 的类型。
[0030] 在一个实施例中,评论特征包括评论者特征以及内容特征中的任一项。其中,评论 者特征可以包括例如评论者所使用的IP地址信息,评论者的注册信息,评论者进行评论的 时间相关信息,评论者所发出的评论的内容相关信息等中的任一项或任多项。内容特征可 以包括评论的内容中所包含的各个字符和/或词的分别的重复次数等信息。
[0031] 在一个实例中,网络设备可以通过查询数据库或通过一定的接口与其他设备进行 交互来来获取评论的评论者信息。然后网络设备可以从评论者信息中提取相应的信息作为 评论者特征。
[0032] 以针对产品"桔子手机"的评论为例来进行说明。其中,评论者"桔子粉"发出"桔 子手机值得拥有,好好好!!! "的评论。网络设备可以通过查询数据库或通过一定的接口与 其他设备进行交互获取到该评论者"桔子粉"的相关信息。例如,网络设备获取到"桔子粉" 发出评论时所使用的IP地址为"58. 22. 222. 2","桔子粉"的注册信息为实名注册,其绑定 手机号码为"18622222222","桔子粉"发出评论的时间为"2012/2/2","桔子粉"针对"桔子 手机"所发出的其他评论为"桔子手机就是好",从而网络设备确定该"桔子粉"评论者对桔 子手机所发出的评论均为好评。
[0033] 在另一个实例中,网络设备可以通过分析评论来获取内容特征,例如评论的内容 中所包含的各个字符和/或词的分别的重复次数等信息。例如,网络设备可以对评论进行 分词处理,并对于其中包含的每个字符和/词,统计其在评论中分别出现的次数。接上例, 网络设备针对"桔子手机值得拥有,好好好!!! "的评论进行分析,并得出其中包括词"桔 子"、"手机"、"值得"、"拥有"、"好",及符号","和"!",以及其在评论中分别出现的次数为 1、1、1、1、3、1和 3。
[0034] 接着在步骤S23中,网络设备根据评论特征,确定评论的有效性。具体地,在一个 实施例中,网络设备可以通过将评论特征与预定规则进行匹配来确定评论的有效性。例如, 预定规则可以为当评论者发出评论时所使用的IP地址为黑名单中的地址时,该评论为无 效评论。此处,地址黑名单可以是网络设备根据历史统计数据所预先设置的,并且地址黑名 单可以被动态更新。又例如,预定规则可以为当评论者未经过实名认证,并且其评论中某 个字符或词出现的次数大于等于3次时,该评论为无效评论;而当评论者经过实名认证,并 且其评论中某个字符或词出现的次数大于等于3次时,该评论为有效性较弱的评论。再例 如,预定规则可以为当评论者未经过实名认证,并且其针对待评论对象发出多条评论,其均 为同一评价度,例如好评或差评时,则该评论者所发出的这些评论的有效性较弱。或例如, 预定规则可以为当评论者在单位时间内,针对待评论对象发出的评论数量超过预定阈值, 并且评论中某个字符或词出现的次数大于等于3次时,该评论为无效评论。此处,预定阈值 为例如根据经验值来进行设置,并可以根据实际需要被动态调整。接上例,网络设备基于 上述预定规则,得出该"桔子粉"所发出的该"桔子手机值得拥有,好好好!!! "的评论符合 "当评论者经过实名认证,并且其评论中某个字符或词出现的次数大于等于3次时,该评论 为有效性较弱的评论"的规则,从而确定该评论的有效性较弱。
[0035] 在一个实例中,网络设备还可以获取某个评论者针对其他相关被评论对象所发出 的评论并分析相关特征。例如网络设备可以分析该评论者对其他被评论对象所发出的评论 的评价度,例如好评或差评,的相关特征。并结合预定规则,例如当评论者对其他相关评论 对象所发出的评论的评价度相同,例如均为好评或差评,并且该评论者对其他相关被评论 对象所发出的评论的总数超过预定阈值时,则该评论者针对本被评论对象所发出的评论的 有效性较弱。例如,网络设备可以获取"桔子粉"针对其他手机所发出的评论,并得出其对 其他手机发出的评论的评价度均为差评,并且对其他手机发出的评论数量为22条超过预 定阈值,从而根据这一特征及预定规则得出该"桔子粉"对桔子手机所发出的评论的有效性 较弱。
[0036] 本领域技术人员应理解,此处,对于评论特征及预定规则的相关描述仅为示例性 而非限定性描述,存在各种其他各种评论特征及预定规则而不背离本发明的精神或范畴, 并以引用的方式包含于此。
[0037] 在一个优选实施例中,网络设备可以根据针对待评论对象的一个或多个评论中的 各个评论的各自的评论特征,确定该各个评论之间的第一聚类关系和/或该各个评论的各 个评论者之间的第二聚类关系,然后根据各个评论的各自的评论特征,以及第一聚类关系 和/或第二聚类关系,来确定所述评论的有效性。
[0038] 此处,各个评论之间的第一聚类关系指根据各个评论的特征确定各个评论之间的 相似度,并根据相似度来确定的聚类关系。各个评论者之间的第二聚类关系指根据各个评 论者特征确定各个评论者之间的相似度,并根据所确定的相似度来确定的各个评论者之间 的聚类关系。
[0039] 在一个实施例中,网络设备可以预先规定对于各个评论或评论者之间需要进行 相似性对比的特征,并将各个评论或评论者之间基于各个特征的对比结果进行加权求和, 并根据加权求和的值是否高于预定阈值来确定第一聚类关系和第二聚类关系。此处,预定 的需要对比的特征,以及对不同特征所赋予的权重以及预定阈值均可以根据实际需要进行 调节。
[0040] 例如对于评论,可以预先规定需要对比的评论者特征以及内容特征。对于评论的 评论者特征,可以对比各个评论的评论者账号是否相同或是否来自同一 IP地址。对于各个 评论的内容特征,可以对比其是否具有相同的评价度,如好评或差评,还可以对比其评论内 容是否相似。
[0041] 又例如对于评论者,可以预先规定需要对比各个评论者的评论者账号特征以及评 论者发出评论的特征。对于评论者账号特征,可对比是否具有相同的结构特征,例如均为4 个字母加4个数字的结构,是否注册时使用相同的IP地址等特征。对于评论者发出评论的 特征可以对比各个评论者最后一次发出评论的IP地址,各个评论者发出评论所针对的待 评论对象,各个评论者发出评论的评价度,例如好评或差评等特征。
[0042] 以下以一评论者"桔子粉"对桔子手机所发出的"桔子手机值得拥有,好好好!!! " 的评论,以及另一评论者"水果粉"对桔子手机所发出的"这么好的桔子手机你拥有吗? "为 例来说明确定第一聚类关系以及第二聚类关系的方法。
[0043] 对于各个评论之间的第一聚类关系的确定,网络设备首先按照上文所述的方法得 出各个评论的特征。接着网络设备对需要对比的特征进行对比。在本例中,网络设备对比 该两条评论的评论者特征和内容特征。网络设备得出评论者"桔子粉"和"水果粉"所分别 作出的上述评论来自同一 IP地址,并且其评论内容相似度较高。网络设备将这两个对比特 征的对比结果按各自权重进行加权求和,当加权求和的结果超过预定阈值,确定该上述两 条评论满足第一聚类关系。
[0044] 对于各个评论者之间的第二聚类关系的确定,网络设备根据上文所述的方法得出 该两个评论者的特征。接着,网络设备对需要对比的特征进行对比。在本例中,网络设备对 比该两个评论者的评论者账号特征以及评论者发出评论的特征。网络设备得出评论者"桔 子粉"和"水果粉"的账号名称具有相同的结构(均由3个汉字组成),并且其注册时使用 的IP地址相同。此外,网络设备得出评论者"桔子粉"和"水果粉"所发出的评论均主要针 对桔子手机或相关其他手机,并且对于桔子手机的评价度均为好评,而对于其他相关手机 的评价度均为差评。网络设备将上述对比结果进行加权求和,当加权求和的结果超过预定 阈值,确定该"桔子粉"和"水果粉"两个评论者之间满足第二聚类关系。
[0045] 本领域技术人员应理解,此处,对于确定第一聚类关系以及第二聚类关系的相关 描述仅为示例性而非限定性描述,存在各种其他的实现方式而不背离本发明的精神或范 畴,并以引用的方式包含于此。
[0046] 应注意的是,在实施例中,可以仅确定第一聚类关系,或仅确定第二聚类关系,来 用于评论有效性的确定。
[0047] 在一个优选实施例中,网络设备可以根据所述各个评论的各自的评论特征,将所 述各个评论进行分组,然后根据所述各个评论的各自的评论特征,计算同一分组中的各个 评论之间的余弦距离,并根据所述各个余弦距离,确定所述同一分组中的各个评论之间的 第一聚类关系。
[0048] 在另一个优选实施例中,网络设备可以根据所述各个评论的各自的评论特征,将 所述各个评论的各个评论者进行分组,然后根据所述各个评论的各自的评论特征,计算同 一分组中的各个评论者之间的各个余弦距离,再根据所述各个余弦距离,确定所述同一分 组中的各个评论者之间的第二聚类关系。
[0049] 在以下的说明中,我们将使用表1中的例子来说明确定第一聚类关系和第二聚类 关系的上述方法。
[0050] 表 1
[0051]

【权利要求】
1. 一种用于确定评论的有效性的方法,其中,该方法包括: -获取对于被评论对象的一个或多个评论; -对所述一个或多个评论中的各个评论,确定所述评论所对应的评论特征; -根据所述评论特征,确定所述评论的有效性。
2. 根据权利要求1所述的方法,其中,所述评论特征包括以下至少任一项: -所述评论的评论者特征; -所述评论的内容特征。
3. 根据权利要求2所述的方法,其中,所述评论者特征包括以下任一项或任多项: -所述评论者所使用的IP地址信息; -所述评论者的注册相关信息; -所述评论者进行评论的时间相关信息; -所述评论者所发出的评论的内容相关信息; 其中,所述内容特征包括: -所述评论的内容中所包含的各个字符和/或词的分别的重复次数。
4. 根据权利要求1至3中任一项所述的方法,其中,所述根据所述评论特征,确定所述 评论的有效性的步骤包括: -根据所述一个或多个评论中的各个评论的各自的评论特征,确定所述各个评论之间 的第一聚类关系和/或所述各个评论的各个评论者之间的第二聚类关系; -根据所述一个或多个评论中的各个评论的各自的评论特征,以及所述第一聚类关系 和/或所述第二聚类关系,确定所述评论的有效性。
5. 根据权利要求4所述的方法,其中,所述根据所述一个或多个评论中的各个评论的 各自的评论特征,确定所述各个评论之间的第一聚类关系的步骤包括: -根据所述各个评论的各自的评论特征,将所述各个评论进行分组; -根据所述各个评论的各自的评论特征,计算同一分组中的各个评论之间的各个余弦 距离; -根据所述各个余弦距离,确定所述同一分组中的各个评论之间的第一聚类关系。
6. 根据权利要求4所述的方法,其中,所述根据所述一个或多个评论中的各个评论的 各自的评论特征,确定所述各个评论的各个评论者之间的第二聚类关系的步骤包括: -根据所述各个评论的各自的评论特征,将所述各个评论的各个评论者进行分组; -根据所述各个评论的各自的评论特征,计算同一分组中的各个评论者之间的各个余 弦距离; -根据所述各个余弦距离,确定所述同一分组中的各个评论者之间的第二聚类关系。
7. 根据权利要求4或6所述的方法,其中,还包括: -根据所述各个评论的各自的评论特征,并基于所述第二聚类关系,对所述各个评论的 各自的评论者的相关信息进行第一处理,其中,所述第一处理包括以下任一项或任多项: -加标签处理; -过滤处理; -降低权重处理。
8. 根据权利要求1至7中任一项所述的方法,其中,还包括: -根据所确定的所述一个或多个评论中的各个评论的有效性信息,对所述一个或多个 评论进行第二处理,其中所述第二处理包括以下任一项或任多项: -合并处理; -过滤处理; -降低权重处理。
9. 一种用于确定评论的有效性的装置,其中,该装置包括: -用于获取对于被评论对象的一个或多个评论的装置; -用于对所述一个或多个评论中的各个评论,确定所述评论所对应的评论特征的装 置; -用于根据所述评论特征,确定所述评论的有效性的装置。
10. 根据权利要求9所述的装置,其中,所述评论特征包括以下至少任一项: -所述评论的评论者特征; -所述评论的内容特征。
11. 根据权利要求10所述的装置,其中,所述评论者特征包括以下任一项或任多项: -所述评论者所使用的IP地址信息; -所述评论者的注册相关信息; -所述评论者进行评论的时间相关信息; -所述评论者所发出的评论的内容相关信息; 其中,所述内容特征包括: -所述评论的内容中所包含的各个字符和/或词的分别的重复次数。
12. 根据权利要求9至11中任一项所述的装置,其中,所述用于根据所述评论特征,确 定所述评论的有效性的装置包括: -用于根据所述一个或多个评论中的各个评论的各自的评论特征,确定所述各个评论 之间的第一聚类关系和/或所述各个评论的各个评论者之间的第二聚类关系的装置; -用于根据所述一个或多个评论中的各个评论的各自的评论特征,以及所述第一聚类 关系和/或所述第二聚类关系,确定所述评论的有效性的装置。
13. 根据权利要求12所述的装置,其中,所述用于根据所述一个或多个评论中的各个 评论的各自的评论特征,确定所述各个评论之间的第一聚类关系的装置包括: -用于根据所述各个评论的各自的评论特征,将所述各个评论进行分组的装置; -用于根据所述各个评论的各自的评论特征,计算同一分组中的各个评论之间的各个 余弦距离的装置; -用于根据所述各个余弦距离,确定所述同一分组中的各个评论之间的第一聚类关系 的装置。
14. 根据权利要求12所述的装置,其中,所述用于根据所述一个或多个评论中的各个 评论的各自的评论特征,确定所述各个评论的各个评论者之间的第二聚类关系的装置包 括: -用于根据所述各个评论的各自的评论特征,将所述各个评论的各个评论者进行分组 的装置; -用于根据所述各个评论的各自的评论特征,计算同一分组中的各个评论者之间的各 个余弦距离的装置; -用于根据所述各个余弦距离,确定所述同一分组中的各个评论者之间的第二聚类关 系的装置。
15. 根据权利要求12或14所述的装置,其中,还包括: -用于根据所述各个评论的各自的评论特征,并基于所述第二聚类关系,对所述各个评 论的各自的评论者的相关信息进行第一处理的装置,其中,所述第一处理包括以下任一项 或任多项: -加标签处理; -过滤处理; -降低权重处理。
16. 根据权利要求9至15中任一项所述的装置,其中,还包括: -用于根据所确定的所述一个或多个评论中的各个评论的有效性信息,对所述一个或 多个评论进行第二处理的装置,其中所述第二处理包括以下任一项或任多项: -合并处理; -过滤处理; -降低权重处理。
17. -种搜索信息的方法,其中包括: -基于来自用户设备的查询序列进行匹配查询,获取一条或多条搜索结果,其中包括至 少一个评论; -根据所述评论的有效性,将所述至少一个评论提供给用户设备; 其中,还包括,根据权利要求1至8中任一项所述的方法来确定各个评论的有效性。
18. -种搜索信息的装置,其中包括: -用于基于来自用户设备的查询序列进行匹配查询,获取一条或多条搜索结果,其中包 括至少一个评论的装置; -用于根据所述评论的有效性,将所述至少一个评论提供给用户设备的装置; 其中,还包括,根据权利要求9至16中任一项所述的用于确定各个评论的有效性的装 置。
【文档编号】G06F17/30GK104281665SQ201410499733
【公开日】2015年1月14日 申请日期:2014年9月25日 优先权日:2014年9月25日
【发明者】李书鹏, 刘晓明, 马锋, 王薇薇 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1