网购评论的分析处理方法与流程

文档序号:12008092阅读:来源:国知局
网购评论的分析处理方法与流程

技术特征:
1.一种网购评论的分析处理方法,其特征在于,包括:从某商品的网购评论中提取出的观点词和特征词,将所述观点词和特征词组成特征观点对;根据提取出的所述观点词确定所述观点词的情感倾向,其中,设置所述观点词的情感倾向向量(A)为A=<#pos,#neu,#neg>/<#pos+#neu+#neg>,#pos代表好评数量,#neu代表中评数量,#neg代表差评数量,根据设置所述观点词的情感倾向向量,对提取出的所述观点词确定其情感倾向值,如该观点词的情感倾向值高于设置的判断方向值,且通过否定词表中的否定词并没有出现在该观点词前/后时,则该观点词的情感倾向为正向;如低于设置的判断方向值,或通过否定词表中的否定词判断出在该观点词前/后出现时,则该观点词的情感倾向为负向;其中,所述否定词表中的否定词的初始设置,是通过把所有观点词的前一个词都收集出来,作为候选否定词,对于每个候选否定词,计算其平均否定强度,并按这个值排序,从平均否定强度比较高的否定词中挑出作为否定词表的否定词;根据所述情感倾向和所述特征观点对,计算出每个特征在该商品上的情感分布函数v,以及每个特征在该商品所属小类上的情感分布函数vC;根据v和vC的偏差得到该商品上不同特征词的分数,将分数值最高和/或最低的多个特征词作为该商品的优缺点评论。2.如权利要求1所述的网购评论的分析处理方法,其特征在于,所述从某商品的网购评论中提取出的观点词和特征词,进一步为:对某商品的网购评论中以形容词为主出现的词汇的比例和频率进行统计,将统计值最高的一个或多个词汇作为观点词,以及通过设置的条件从某商品的网购评论中选取出以名词为主的词汇进行统计,将统计值最高的一个或多个词汇作为特征词。3.如权利要求2所述的网购评论的分析处理方法,其特征在于,所述通过设置的条件从某商品的网购评论中选取出以名词为主的词汇进行统计,将统计值最高的一个或多个词汇作为特征词,进一步为:从某商品的网购评论中的选取出名词或词组为主的词汇,计算每个词汇在该商品所在小类的支持度值,以及该小类所属大类的支持度值;通过设置的条件将符合条件的名词或词组为主的词汇作为特征词。4.如权利要求3所述的网购评论的分析处理方法,其特征在于,所述通过设置的条件将符合条件的名词或词组为主的词汇作为特征词,进一步包括:通过设置的最低小类的支持度的阈值、最低大类的支持度的阈值、以及停用词表,判断选取出的名词或词组为主的词汇在该商品所在小类的支持度值是否大于最低小类的支持度的阈值,或者,判断选取出的名词或词组为主的词汇在该商品所在小类所属大类的支持度值是否大于最低大类的支持度的阈值,当上述条件之一满足时,判断该名词或词组为主的词汇是否出现在所述停用词表中,如没有出现,则将该名词或词组为主的词汇作为特征词。5.如权利要求1所述的网购评论的分析处理方法,其特征在于,所述根据v和vC的偏差得到该商品上不同特征词的分数,进一步为:根据v和vC的偏差通过1-cos(v,vC)的方式得到该商品上不同特征词的分数。6.如权利要求5所述的网购评论的分析处理方法,其特征在于,进一步为:根据v和vC的偏差通过(1-cos(v,vC))*log2(pos+neu+neg+1)的方式得到该商品上不同特征词的分数,其中,所述pos、所述neu、所述neg分别表示该特征在好评、中评、差评中被提及次数的期望值。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1