一种基于胶囊网络的水军商品评论虚假检测装置及方法与流程

文档序号:18465000发布日期:2019-08-17 02:22阅读:208来源:国知局
一种基于胶囊网络的水军商品评论虚假检测装置及方法与流程

本发明涉及胶囊网络相关技术领域,特别涉及一种基于胶囊网络的水军商品评论虚假检测装置及方法。



背景技术:

随着互联网业务的发展,为了可以让用户根据自己的意图和其他消费者的评价来决定购买意向,各大电子商务平台开发了各种用户反馈机制,其中产品评价系统是最普及一种。由于许多用户在电商平台上倾向于在做出购买决定之前阅读相关的产品评论,所以某些不法者在电商平台利用评价系统注入大量虚假评论来左右产品的销量以达到盈利的目的。电商产生了海量的评论数据,再加上评论质量参差不齐,对于消费者而言,查阅和分析这些数据将面临巨大的挑战,已经远远超出了一个普通消费者的信息处理能力。海量的商品评论中,既包含了真实的、有价值的消费者体验和意见,也包含了相当一部分虚假评论。商品虚假评论背后是巨大商业利益的驱使,属于典型的不正当商业竞争,因此商品虚假评论泛滥必然会严重影响电商生态的健康发展。

因此,提出一种基于胶囊网络的水军商品评论虚假检测装置及方法来解决上述问题很有必要。



技术实现要素:

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种基于胶囊网络的水军商品评论虚假检测装置及方法,解决了上述背景技术中提出的问题。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

一种基于胶囊网络的水军商品评论虚假检测装置,包括评论获取单元、评论检测单元、虚假评论确认单元和数据共享集单元,所述评论获取单元的输出端电连接评论检测单元的输入端,所述评论检测单元的输出端电连接虚假评论确认单元的输入端,所述评论检测单元和数据共享集单元双向电连接,所述评论检测单元包括评论内容属性检测单元、评论者属性检测单元和评论商品属性检测单元。

可选的,所述评论内容属性检测单元包括自然语言相似度测试模块、评论语义人工智能识别测试模块和评论风格人工智能识别测试模块,所述自然语言相似度测试模块的输出端电连接评论语义人工智能识别测试模块的输入端,所述评论语义人工智能识别测试模块的输出端电连接评论风格人工智能识别测试模块的输入端。

可选的,所述评论者属性检测单元包括评论时间及频率对比模块、评论ip及mac地址对比模块、评论者地理位置对比模块、评论者活跃时间监测模块、关联移动终端设备型号对比模块和评论人名称分析模块。

可选的,所述评论时间及频率对比模块的输出端电连接评论ip及mac地址对比模块的输入端,所述评论ip及mac地址对比模块的输出端电连接评论者地理位置对比模块的输入端,所述评论者地理位置对比模块的输出端电连接评论者活跃时间监测模块的输入端,所述评论者活跃时间监测模块的输出端电连接关联移动终端设备型号对比模块的输入端,所述关联移动终端设备型号对比模块的输出端电连接评论人名称分析模块的输入端。

可选的,所述评论人名称分析模块包括用户名规律分析模块、提交信息时间间隔分析模块和同商品多评论分析模块。

可选的,所述用户名规律分析模块的输出端电连接提交信息时间间隔分析模块的输入端,所述提交信息时间间隔分析模块的输出端电连接同商品多评论分析模块的输入端。

可选的,所述评论商品属性检测单元包括商品实际描述匹配模块和商品实际销售排行匹配模块,所述商品实际描述匹配模块的输出端电连接商品实际销售排行匹配模块的输入端。

一种基于胶囊网络的水军商品评论虚假检测的方法,包括以下步骤:

a:评论获取:获取预设时段接收到的评论消息;

b:基于评论内容检测:根据评论所使用的词汇特征、来自不同评论者的评论内容及风格的相似度、评论的语义通过与数据共享集数据库进行对比来识别评论的真实性,并利用自然语言理解和人工智能进行识别;

c:基于评论者属性检测:根据评论发表的时间和频率、所涉及评论者、评论使用的ip或mac地址、评论者的地理位置、活跃时间、移动终端型号等,从中对比分析发现评论异常行为,从而识别评论的虚假性,再经过对评论人名称进行具体分析,根据用户名的规律、提交信息时间间隔、同商品多评论进行分析,当有相似或者相近的用户名时,即可判定为虚假评论,当提交信息时间间隔很短,即可判定为虚假评论,当对同样的商品多次评论,即可判定为虚假评论;

d:基于评论商品特征检测:根据产品的实际描述、实际销售排行等信息,对虚假评论进行对比识别,如果一个商品销量很好,但出现明显贬低性评论,则该评论即为虚假评论;

e:虚假评论确认:经过将获取评论对比数据共享集并分析之后,得到确定的虚假评论数据。

(三)有益效果

本发明提供了一种基于胶囊网络的水军商品评论虚假检测装置及方法,具备以下有益效果:

(1)、本发明有利于提高识别虚假评论的准确度,对商家评论具有更加优越的检测分析识别能力,能够胜任大部分的检测任务,具有较好的通用性,避免虚假评论误导其它用户消费。

(2)、本发明能够及筛选并识别非法评论等虚假评论,防止虚假评论恶意攻击优良商家,给商家提供了一个平等安全的网上环境。

附图说明

图1为本发明装置框图;

图2为本发明评论检测单元框图;

图3为本发明评论内容属性检测单元框图;

图4为本发明评论者属性检测单元框图;

图5为本发明评论商品属性检测单元框图。

图中:评论获取单元1、评论检测单元2、虚假评论确认单元3、数据共享集单元4、评论内容属性检测单元5、评论者属性检测单元6、评论商品属性检测单元7、自然语言相似度测试模块8、评论语义人工智能识别测试模块9、评论风格人工智能识别测试模块10、评论时间及频率对比模块11、评论ip及mac地址对比模块12、评论者地理位置对比模块13、评论者活跃时间监测模块14、关联移动终端设备型号对比模块15、评论人名称分析模块16、用户名规律分析模块17、提交信息时间间隔分析模块18、同商品多评论分析模块19、商品实际描述匹配模块20、商品实际销售排行匹配模块21。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明中,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接;可以是机械连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。

根据如图1-5所示,本发明供提供了一种技术方案:

一种基于胶囊网络的水军商品评论虚假检测装置,包括评论获取单元1、评论检测单元2、虚假评论确认单元3和数据共享集单元4,评论获取单元1的输出端电连接评论检测单元2的输入端,评论检测单元2的输出端电连接虚假评论确认单元3的输入端,评论检测单元2和数据共享集单元4双向电连接,评论检测单元2包括评论内容属性检测单元5、评论者属性检测单元6和评论商品属性检测单元7;

评论内容属性检测单元5包括自然语言相似度测试模块8、评论语义人工智能识别测试模块9和评论风格人工智能识别测试模块10,自然语言相似度测试模块8的输出端电连接评论语义人工智能识别测试模块9的输入端,评论语义人工智能识别测试模块9的输出端电连接评论风格人工智能识别测试模块10的输入端,评论者属性检测单元6包括评论时间及频率对比模块11、评论ip及mac地址对比模块12、评论者地理位置对比模块13、评论者活跃时间监测模块14、关联移动终端设备型号对比模块15和评论人名称分析模块16,评论时间及频率对比模块11的输出端电连接评论ip及mac地址对比模块12的输入端,评论ip及mac地址对比模块12的输出端电连接评论者地理位置对比模块13的输入端,评论者地理位置对比模块13的输出端电连接评论者活跃时间监测模块14的输入端,评论者活跃时间监测模块14的输出端电连接关联移动终端设备型号对比模块15的输入端,关联移动终端设备型号对比模块15的输出端电连接评论人名称分析模块16的输入端,评论人名称分析模块16包括用户名规律分析模块17、提交信息时间间隔分析模块18和同商品多评论分析模块19,用户名规律分析模块17的输出端电连接提交信息时间间隔分析模块18的输入端,提交信息时间间隔分析模块18的输出端电连接同商品多评论分析模块19的输入端;

评论商品属性检测单元7包括商品实际描述匹配模块20和商品实际销售排行匹配模块21,商品实际描述匹配模块20的输出端电连接商品实际销售排行匹配模块21的输入端。

一种基于胶囊网络的水军商品评论虚假检测的方法,包括以下步骤:

a:评论获取:获取预设时段接收到的评论消息;

b:基于评论内容检测:根据评论所使用的词汇特征、来自不同评论者的评论内容及风格的相似度、评论的语义通过与数据共享集数据库进行对比来识别评论的真实性,并利用自然语言理解和人工智能进行识别;

c:基于评论者属性检测:根据评论发表的时间和频率、所涉及评论者、评论使用的ip或mac地址、评论者的地理位置、活跃时间、移动终端型号等,从中对比分析发现评论异常行为,从而识别评论的虚假性,再经过对评论人名称进行具体分析,根据用户名的规律、提交信息时间间隔、同商品多评论进行分析,当有相似或者相近的用户名时,即可判定为虚假评论,当提交信息时间间隔很短,即可判定为虚假评论,当对同样的商品多次评论,即可判定为虚假评论;

d:基于评论商品特征检测:根据产品的实际描述、实际销售排行等信息,对虚假评论进行对比识别,如果一个商品销量很好,但出现明显贬低性评论,则该评论即为虚假评论;

e:虚假评论确认:经过将获取评论对比数据共享集并分析之后,得到确定的虚假评论数据。

需要说明的是,在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1