垃圾评论检测方法及设备的制造方法_2

文档序号:9375569阅读:来源:国知局
pool Publishers 或者 Pang, B.和 Lee, L.的"Opinion Mining and Sentiment Analysis", Foundations and Trends in Information Retrieval, 2008 年/I 月,1-135 页中介绍的方 法。为了避免不必要地混淆本发明的
【发明内容】
,此处不对该处理进行详细的描述。
[0027] 在步骤S202,确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词 对应的图像特征的第二情感极性。
[0028] 如前所述,图像捕获设备的用户在对图像捕获设备做出评论时,通常都会同时示 出由该图像捕获设备捕获的相关图像作为证据来证明其评论中的观点。因此,该相关图像 中具有与评论中的特征词对应的图像特征。在该步骤S202中,将确定与评论中的特征词对 应的图像特征,并确定相关图像中该图像特征的情感极性。下面将对该步骤中的具体处理 进行详细描述。
[0029] 首先需要确定与特征词和情感词对应的图像特征到底是哪个图像特征,这可以通 过例如查找预先设定的第一映射表来实现。表1示出了该第一映射表的一个示例。
[0030]

[0031] 表1
[0032] 该表1是根据例如相机的图像捕获设备的成像原理和功能等预先设定的。表1所 示的仅仅是一个示例,图像处理领域的技术人员可以容易地扩展该表。另外,根据目前的研 究,用户在评论产品的特征/方面时,使用的特征词和情感词是趋向于一致的,因此可以合 理地设置第一映射表以覆盖大多数评论,而不需要准备非常长的、穷举性的映射表以覆盖 所有评论。
[0033] 在确定了所述图像特征后,可以检测所述相关图像中该图像特征的质量,并由此 确定该图像特征的情感极性。例如,如果相关图像中该图像特征的质量良好,则情感极性是 正面的;如果该图像特征的质量不好,则情感极性是负面的;如果该图像特征的质量一般, 则情感极性是中性的。
[0034] 如何检测相关图像中该图像特征的质量是本领域中公知的,本领域技术人员可以 根据具体的图像特征采用各种适当的方式检测其质量。
[0035] 例如,假设评论者的评论是"室内照片总是很模糊",并且示出了如图3所示的图 像。对于这一情况,首先可以通过例如查找映射表确定对应的图像特征是灰度梯度值,通常 灰度梯度值越高,画面的边缘信息越丰富,图像越清晰。因此,在检测图像特征的质量时,可 以计算如图3所示的图像中的平均灰度梯度值,并且将其与通过统计多幅图像的灰度梯度 值确定的判断阈值进行比较来确定其质量。例如,如果计算得到的平均灰度梯度值小于10 则认为其是模糊,即质量不好,如果平均灰度梯度值大于14则认为其是清晰,即质量良好, 如果平均灰度梯度值在10和14之间则认为其是清晰度一般,即质量一般。
[0036] 再比如,假设评论者的评论是"相机拍摄的照片颜色不正,总是偏蓝",并且示出了 如图4所示的图像。对于这一情况,首先可以确定对应的图像特征是颜色分量。因此,在检 测图像特征的质量时,可以将如图4所示的RGB图像转变到CIE L*a*b*空间,其中L*表示 图像亮度,a*表示图像红/绿分量,b*表示图像黄/蓝分量。由于通常存在色偏的图像,在 a*和b*分量上的均值会偏离原点很远,方差也较小,因此通过计算图4所示的图像在a*和 b*分量上的均值和方差,就可确定是否存在色偏,进而可以确定图像质量如何。
[0037] 应当理解,上面所给出的两个例子仅仅是示例性的,而并非是对本发明的限制。本 领域技术人员可以根据具体的图像特征采用各种适当的方式检测其质量,并进而根据图像 特征的质量的好坏确定其情感极性。
[0038] 回到图2,在步骤S203,比较所述第一情感极性和所述第二情感极性,并且如果所 述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
[0039] 例如,以图4中所示的图像为例,"相机拍摄的照片颜色不正,总是偏蓝"这一评论 的情感极性是负面的;另一方面,假设如前所述通过计算图4所示的图像中颜色分量的均 值和方差,检测出该图像中颜色分量的质量一般,并由此确定其情感极性是中性的。在这样 的情况下,第一情感极性与第二情感极性不一致,即对于相机的评论与相关图像中的对应 图像特征的质量不一致,由此可以确定评论是不客观的,评论者有可能是有意地或者仅仅 是因为不喜欢图像的风格而贬低了相机,因此该评论属于垃圾评论。
[0040] 另一方面,对于相机的评论可能优于相关图像中的对应图像特征的质量。例如评 论是"相机拍摄的照片色彩鲜艳,很好看",即第一情感极性是正面的;而通过检测相关图像 中图像特征,发现图像中存在偏色,图像特征的质量不佳,即第二情感极性是负面的。此时, 第一情感极性与第二情感极性不一致,评论者有可能是有意地或者仅仅是因为个人喜好而 过高评价了相机,因此该评论也属于垃圾评论。
[0041] 以上详细描述了根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法。 在该实施例中,基于评论信息和相关图像的一致性来判断评论的客观性,从而检测出客观 性低下的垃圾评论。由于该检测方法基于评论和相关图像等具体事实而不是例如评论者的 权威性这一不可靠因素来确定评论的客观性,因而具有较高的检测精度。而且,该检测方法 不需要花费大量的人工时间进行处理,因而能够快速地检测出垃圾评论。
[0042] 〈第二实施例〉
[0043] 在根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法中,对于第一情 感极性与第二情感极性一致的评论,默认其是客观的评论,即不是垃圾评论。然而事实上, 当第一情感极性与第二情感极性一致时,针对图像捕获设备的评论也并不一定是客观的。 举例来说,即使针对相机的评论为负面的而且图像特征的质量也较差时(即第一情感极性 与第二情感极性一致且均为负面的时),也不能认定该负面评论是客观的,因为图像特征的 质量较差有可能是因为在使用相机拍摄图像时不适当的参数设置造成的,此时不应该认定 相机是不好的。
[0044] 具体的,图5示出了评论中的情感词的第一情感极性与图像特征的第二情感极性 的可能的对应关系。如图5所示,当第一情感极性与第二情感极性都是中性的或者都是负 面的时,不能确定对应的评论是否是客观的,因为第二情感极性未呈现正面有可能是因为 在使用相机拍摄图像时不适当的参数设置造成的,即如果正确的设置了参数,图像特征的 质量有可能是良好的,从而第二情感极性可能是正面的。
[0045] 针对上述情况,本实施例提供了一种改进的图像捕获设备的垃圾评论检测方法。 根据本实施例的图像捕获设备的垃圾评论的检测方法与第一实施例中描述的检测方法基 本相同,其区别仅在于在步骤S203中比较了第一情感极性和所述第二情感极性之后,对于 第一情感极性和第二情感极性一致的评论进行进一步的检查,以确定其是否是垃圾评论。 具体的,在步骤S204中,在所述第一情感极性和所述第二情感极性一致并且均不是正面的 情况下,确定所述图像捕获设备在拍摄所述相关图像时是否正确地设置了各个拍摄参数; 如果至少一个所述拍摄参数未正确设置,则确定所述评论是垃圾评论。该步骤S204对于相 机的评论是非正面的且图像特征质量不佳(一般或差)的情形进行进一步的检查。在该步 骤中对于每一个相关的拍摄参数进行检查,只要有任何一个拍摄参数未能正确设置,就可 以确定导致图像质量不佳的原因是相机拍摄参数未能正确设置,因此对于相机的非正面评 论是不客观的,属于垃圾评论;而如果每一个拍摄参数都正确设置了,则意味着图像特征质 量不佳的问题来自于相机的能力,因此对于相机的非正面评论是客观的
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1