垃圾评论检测方法及设备的制造方法

文档序号:9375569阅读:193来源:国知局
垃圾评论检测方法及设备的制造方法
【技术领域】
[0001] 本发明总体涉及网络信息处理,具体涉及针对图像捕获设备的垃圾评论的检测方 法及设备。
【背景技术】
[0002] 近几年,随着互联网的发展,人们越来越喜欢在网络上表达自己的观点。例如,用 户可以在购买商品时在各大商业网站、论坛以及博客发表针对商品的评论。这些评论信息 对于产品提供者非常重要,其可以帮助产品提供者了解产品的缺点或不足,进而被用来改 善下一代产品。另一方面,这些评论信息对于其他用户也非常重要,其可以帮助其他用户快 速了解产品的性能、优缺点等,进而使得他们在挑选产品时可以做出更好的购买决定和选 择。
[0003] 然而,由于网络的开放性,人们可以在网站上任意书写评论,这导致某些评论的客 观性低下,从而产生垃圾评论。例如,用户可能由于不了解某产品的功能而认为该产品未能 达到其预期,从而导致对该产品的印象不佳并给出了过低的评价。再比如,来自某一公司的 员工可能对其公司自己的产品给出过高的评价,而贬低竞争对手的产品。这种客观性低下 的垃圾评价一方面使得产品提供者无法获知产品的真实缺陷以进行改善,另一方面影响了 其他用户快速了解产品的性能、优缺点,并且可能误导其他潜在用户。因此,希望能够确定 哪些评论是垃圾评论,以排除其对于产品提供者和其他潜在用户的干扰。
[0004] 目前,已经对于如何检测垃圾评价进行了很多研究。这些研究通常使用文字评论 信息和评论者信息来判断评论的客观性,从而确定评论是否是垃圾评论。例如,常见的垃圾 评论检测技术首先根据评论者先前的评论确定评论者的权威性,然后根据每个评论者的权 威性确定其评论是否是垃圾评论。然而,按照这一技术,需要花费大量的时间来人工地标记 诸如评论者先前的评论等数据;而且通过例如建立概率模型确定的评论者权威性并不总是 可靠的,从而导致垃圾评论的检测精度较低。

【发明内容】

[0005] 根据本发明的一个实施例,提供了一种图像捕获设备的垃圾评论的检测方法,包 括:提取一评论中的特征词和情感词,并确定该情感词的第一情感极性;确定由所述图像 捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;比较 所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性 不一致,则确定所述评论是垃圾评论。
[0006] 根据本发明的另一实施例,提供了一种图像捕获设备的垃圾评论的检测设备,包 括:提取单元,配置为提取一评论中的特征词和情感词,并确定该情感词的第一情感极性; 极性确定单元,配置为确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词 对应的图像特征的第二情感极性;比较单元,配置为比较所述第一情感极性和所述第二情 感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾 评论。
[0007] 根据本发明的另一实施例,提供了一种图像捕获设备的垃圾评论的检测方法,包 括对于评论中的每个观点进行下述处理:提取该观点中的特征词和情感词,并确定该情感 词的第一情感极性;确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对 应的图像特征的第二情感极性;比较所述第一极性强度和所述第二极性强度,并且如果所 述第一情感极性和所述第二情感极性不一致,则确定所述观点的客观性为不客观;以及包 括对各个观点的客观性进行加权平均,以计算所述评论的客观性并确定该评论是否为垃圾 评论,其中权重根据各个观点的重要性来确定。
[0008] 根据本发明实施例的图像捕获设备的垃圾评论的检测技术基于评论信息和相关 图像的一致性来判断评论的客观性,以确定评论是否是垃圾评论,由于其基于具体事实来 评价评论的客观性因而具有较高的检测精度。而且,该检测技术不需要花费大量的人工时 间进行处理,因而能够快速地检测出垃圾评论。
【附图说明】
[0009] 图1例示了一个针对图像捕获设备的评论以及相关的图像;
[0010] 图2示出了根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法的流 程图。
[0011] 图3例示了另一个针对图像捕获设备的评论以及相关的图像。
[0012] 图4例示了又一个针对图像捕获设备的评论以及相关的图像。
[0013] 图5示出了评论中的情感词的第一情感极性与图像特征的第二情感极性的可能 的对应关系。
[0014] 图6示出了当第一情感极性和所述第二情感极性一致并且均为负面时相机参数 设置的示例情形。
[0015] 图7示出了根据本发明实施例的图像捕获设备的垃圾评论的检测设备的功能配 置框图。
[0016] 图8示出了根据本发明实施例的图像捕获设备的垃圾评论的检测系统的总体硬 件框图。
【具体实施方式】
[0017] 为了使本领域技术人员更好地理解本发明,下面结合附图和【具体实施方式】对本发 明作进一步详细说明。
[0018] 首先对根据本发明实施例的图像捕获设备的垃圾评论的检测技术的基本思想进 行简要的介绍。
[0019] 图像捕获设备的用户在对图像捕获设备做出评论时,通常都会同时示出由该图像 捕获设备捕获的相关图像作为证据来证明其评论中的观点。例如,如图1所示,相机用户的 评论为:该相机不好,因为在背光时脸太黑。为了证明这一观点,该用户示出了在背光场景 下采用该相机拍摄的照片。鉴于这一情况,在根据本发明实施例的垃圾评论的检测技术中, 根据评论与由图像捕获设备捕获的相关图像中的对应图像特征的一致性来确定该评论是 否是垃圾评论。具体的,如果评论与相关图像中的对应图像特征的质量不一致,则可以确定 所述评论过高或者过低评价了相机因而是不客观的,属于垃圾评论。另一方面,如果评论和 对应图像特征的质量一致并且图像质量不佳,则进一步检查造成图像特征质量不佳的原因 是否是由于拍摄该相关图像时未正确设置图像捕获设备的拍摄参数造成的;如果是,则可 以确定对于图像捕获设备的评论是不客观的,属于垃圾评论。
[0020] 图像捕获设备可以是相机、摄像机、具有拍摄功能的智能电话等各种电子设备。在 下文中,以相机为例进行说明。
[0021] 〈第一实施例〉
[0022] 图2示出了根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法的流 程图。
[0023] 如图2所示,在步骤S201,提取一评论中的特征词和情感词,并确定该情感词的第 一情感极性。
[0024] 情感词是表达情感的词语,其可以是名词、动词、形容词、感叹词以及一些固定用 语。情感极性反映情感的趋向,可以包括例如正面情感、中性情感和负面情感。情感词和情 感极性均是本领域中的常用术语,此处不进行详细的介绍。
[0025] 包含单个观点的基本评论可以用一个五元组O1 = (ej,ak,Sl,h",tn)来表示,其中O 1 是评论者hn在时间tn发表的、对于目标对象/实体ej的ak特征/方面的意见,S 1是意见 O1的情感值。在本实施例中,仅需提取目标对象/实体(相机)的ak特征/方面和相关的 情感S1。例如,对于如上文中提到的示例评论"该相机不好,因为在背光时脸太黑"而言,需 要提取其中的特征词"脸"和情感词"黑"。
[0026] 可以采用本领域中任何公知的技术来从评论中提取特征词和情感词并确定情 感词的情感极性。例如,可以采用在Liu, B.的"Aspect-based Sentiment Analysis", Sentiment Analysis and Opinion Mining,2012 年(49-78 页),Morgan & Clay
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1