一种基于情感分析的ugc模糊综合评价方法_2

文档序号:9929515阅读:来源:国知局
提及多个 商品的指标,即(m+f+x)矣n;并且对商品评价信息提到的要素进行归类,在统计数量时,商 品情况+1。统计结束得到的权重要进行归一化处理,最后的结果作为模糊综合评价的各个 指标的权重,记为A={ai,a2,"_,a m},m表示指标的个数;
[0040] (3.2.4)确定模糊评价矩阵
[0041] 在商品情况、物流情况,服务情况的指标下,计算每个评价等级所占的比例,得到 以下m个指标构成的模糊评价矩阵R
[0043] (3.2.5)计算综合评价值
[0044]模糊综合评价模型为:
[0046]其中bj表示被评级对象从整体上看对评价等级模糊子集隶属程度,A表示评价指 标的相关权重,R是模糊评价矩阵;
[0048] 然后对B进行归一化处理,得到模糊综合评价集# = 3/1>,,最后用 M
[0049]
的值确定该商品的综合得分。 进一步的,分词器将消费者的观点句分割为评价对象、否定词、副词和情感词。
[0050] 优选的,程度副词的词库是从Hownet提供的219个中文程度级别词语中筛选出来 的,其中级别为〃极其、最"、〃很"、〃超〃这三个类别下共112个程度副词。
[0051] 常用的模糊合成算子以及特点见下表:
[0054] 本发明的模糊合成算子为Mh?)。
[0055] 本发明的有益效果是:
[0056] 本发明通过螺旋弹簧连接清洗刷,自适应各种鞋的尺寸,能清洗各种需要水洗的 鞋;清洗刷内设置绝缘导热夹层,实现对鞋的烘干。
【附图说明】
[0057] 下面结合附图和【具体实施方式】对本发明作进一步详细的说明。
[0058]图1为淘宝网站商品评价指标结构模型示意图。
[0059] 图2为本发明模糊综合评价流程图。
【具体实施方式】
[0060] 以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定 和覆盖的多种不同方式实施。
[0061] 如图1~图2所示,本发明公开一种基于情感分析的UGC模糊综合评价方法,包括以 下步骤:
[0062] (1)建立电子商务商品评价指标结构模型
[0063]经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘 宝购物时关心的因素,建立电子商务商品评价指标结构t吴型;
[0064] (2)文本情感分析
[0065] (2.1)信息抽取
[0066]随着web2.0的兴起,越来越多的消费者习惯在网络平台分享自己的观点、消费体 验等,其中这些观点提供了大量的有用信息供其他消费者参考。所以阅读和分析消费者评 价信息,提取消费者对商品的情感倾向,对于其他消费者的决策具有重要的参考价值。
[0067] 消费者评论情感分析,就是对某种商品的消费者评价信息进行有效的分析和挖 掘,识别出消费者评价信息的情感趋向,比如:消费者对商品质量的评价是好、一般或者是 坏;对商品物流环节、售后服务环节等相关情况可以分别进行分析。针对某一特定商品,统 计所有消费者的评价信息可以更好地了解商品的具体情况,弥补网络用户无法实地体验拟 购商品、从而可能会带来一些误判的不足。一条评论信息就是消费者对某商品的观点。 S. M. Kim等认为一个观点由主题、意见持有者、情感描述项和褒贬倾向性4个部分来描述,即 意见持有者针对某一特定商品表达出自己对该商品喜欢与否、对该商品质量的情感倾向性 [8]。在商品评论信息的分析过程中,意见持有者都是买过该商品的消费者,但是在评论信 息中很难找到意见持有者身份信息。
[0068] 本发明利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价 意见,并且累计关于商品的"好的评价信息"和"坏的评价信息"的数量;语句情感标签抽取 方法是指将一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行 情感标签的抽取与统计;以一件女式上衣商品的评论信息为例,展示情感标签抽取的结果, 见下表:
[0070] (2.2)情感极性判断
[0071] (2.2.1)初步判断
[0072] 信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用 hownet情感词语集和同义词词林]建立情感词典来直接确定其极性,比如"好"、"漂亮"相关 褒义词语记为" 1" ;如果在褒义词之前加有否定词,如不好、不喜欢记为"-1" ;如果一般或者 其它中性的描述,就记为"〇";如果无法直接查找到情感词语的极性,则利用上下文关系进 行判断,如果消费者评论语句中出现转折词语,比如"尽管…还是…","可","但是"的词语 出现时,则在基本情感提取结果上减1;如果出现递进关系的词语,比如"不但、不仅、而且" 的词语出现时,在评论语句的基本情感基础上加1;
[0073] (2.2.2)进一步判断
[0074] 情感描述性词语被副词修饰的情况下,情感极性强度会被加强,好的情感倾向在 程度副词的修饰下会更好,坏的情感倾向则会更坏,比如"很好、超符合、极其差",当一个评 论中的情感描述词被程度副词修饰时,如果情感极性通过步骤(2.2.1)中的方法被判断为" 1",则将其更改为" 2" ;如果情感极性通过步骤(2.2.1)中的方法被判断为"-1",则将其更改 为,,-2" ;
[0075] 评论信息的情感极性判断完成之后,会得到一个相对应的数值,有五种可能:2、1、 0、-1、-2,分别将这五种可能与五个等级相对应,如{2,1,0,-1,_2} = {较好,好,一般,差,极 差};
[0076] (3)模糊综合评价
[0077] (3.1)模糊统计
[0078] ①在每一次试验中都要确定指标集U中的固定元素 Bi中的一个uo是否属于可变动 的等级集合;每一次试验中,指标集都必须属于一个确定清晰的集合,而每一个消费者对商 品的评价都可以看做一个试验,如:针对一条消费者评价,商品的质量情况属于五个等级中 的哪一个,必须清晰、明确,
[0079] ②在每一条消费者评论中,uo是固定的,而评价等级A在随机变动;如果在所分析 的n条评论中,元素 uo属于A的次数为m,则元素 uo对A的隶属频率定义为:
[0081]当商品评论条数n足够大时,根据大数定律,元素 uo的隶属频率总是稳定于某一 数,这个稳定的数即为元素 uo对A的隶属度,模糊统计用来确定模糊评价方法的隶属度; [0082] (3.2)模糊评价
[0083] (3 ? 2 ? 1)构建模糊评价指标
[0084] 根据商品评价指标确定指标集,一级指标集记为U= {Ui U2…Um},其中i = l, 2,. . .,m,表示有m个一级指标;二级指标记为Ui={uii,ui2r",uin},表示第i个一级指标有n 个二级指标;一级指标集为U={B1 B2 B3},二级指标集为B1 = {C1 C2 C3};
[0085] (3 ? 2 ? 2)确定评价集V= {W,V2,…,Vn}
[0086] 每一个评价指标Ui有n个评价等级,淘宝评分系统用五颗星的评价方法,在这里用 常见的方法确定五个等级:{较好,好,一般,差,极差},评价等级与分数的对应关系为:I:较 好,好,一般,差,极差} = {5,4,3,2,1};
[0087] (3.2.3)确定评价指标权重
[0088]首先,统计商品的评论信息条数(n);然后,利用步骤(2)实现信息抽取;然后统计 评论中提及的商品情况(m)、物流情况(f)、服务情况(x);接着,分别计算这三个指标的评论 条数占总评论条数的百分比作为权重,具体权重计算方法为:商品自身情况的权重为m/(m+ f+x),物流情况权重为f/(m+f+x),服务情况权重为x/(m+f+x)。同一条评论中同时提及多个 商品的指标,即(m+f+x)矣n;并且对商品评价信息提到的要素进行归类,在统计数量时,商 品情况+1。统计结束得到的权重要进行归一化处理,最后的结果作为模糊综合评价的各个 指标的权重,记为A={ai,a2,"_,a m},m表示指标的个数;
[0089] (3 ? 2 ? 4)确定模糊评价矩阵
[0090]在商品情况、物流情况,服务情况的指标下,计算每个评价等级所占的比例,得到 以下m个指标构成的模糊评价矩阵R
[0092] (3.2.5)计算综合评价值
[0093]模糊综合评价模型为:
[0095]其中bj表示被评级对象从整体上看对评价等级模糊子集隶属程度,A表示评价指 标的相关权重,R是模糊评价矩阵;
[0097] 然后对B进行归一化处理,得到模糊综合评价集& = S / $>,,?,最后用 j,=\ ~5~ 4
[0098] 3的值确定该商品的综合得分。 2 以下结合具体实施例进行分析
[0099] 现在以淘宝平台某商品评论信息综合评价问题为例,说明模糊综合评价方法的具 体应用过程。首先,利用爬虫技术从淘宝平台搜集某商品评论信息,共收集了 10000条商品 评论信息,根据上文构建的商品指标体系结构模型,选择指标集1]={81,82 33},评价等级 为{较好,好,一般,差,极差}。
[0100] 利用本方法提出的确定模糊综合评价矩阵的方法,统计得到模糊评价矩阵见表3 [0101]表3某网站某商品的模糊评价矩阵
[0103] 对评价指标进行权重确定
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1