一种app软件用户评论一致性判断方法

文档序号:9524184阅读:535来源:国知局
一种app软件用户评论一致性判断方法
【技术领域】
[OOOU本发明设及一种APP软件用户评论一致性判断方法,属于APP软件用户评价领域。【背景技术】
[0002] 用户评论信息分析方法在商品领域日趋成熟,多数研究主要使用ICTCLAS作为用 户评论信息数据处理的工具,最后通过自然语言处理等方法来对用户评论信息进行分析。 例如,朱征宇等人提出一种改进《知网》的词汇语义相似度计算方法;尹洪波等人提出当否 定副词与程度副词共现时,句法语义可W相互推衍的规则;雇中凯等人通过对特征词和情 感词同时提取,并建立用户兴趣偏好模型,结合用户历史评分数据来改善传统协同过滤推 荐算法的推荐准确性;林钦和等人通过基于《化W化t》词典的程度语料库,设置6种类别的 程度副词,并定义5种极性参数来计算用户对产品的不同态度。上述研究针对商品的用户 评论信息进行挖掘和分析,将用户的情感倾向分为了正面、反面、中性Ξ个方面。
[0003] 目前,面对海量的移动应用,大多数用户在选择APP软件之前会查看APP软件信息 和用户评论。用户评论包括用户给APP软件所打的评分星级(通常为5个等级),W及描述 使用APP软件后的评论信息。用户的评论信息往往隐含了用户对APP软件的喜好程度及对 软件特定属性的关注程度等潜在信息。然而,由于网络评论的自由性和随意性,导致评论信 息与所给的评分星级不一致,或者评论信息与APP软件信息不一致。运给用户评价APP软 件的质量带来了困难,因此如何判断APP软件的用户评论是否一致成为需要解决的问题。
[0004] 本发明提出通过提取用户评论信息中的APP软件特征情感词对集,量化用户对 APP软件特征情感倾向程度,并将量化后的综合评分划分成5个等级等方法来判断APP软件 用户评论的一致性,有助于用户选择满足需求的APP软件。

【发明内容】
阳0化]针对上述问题,本发明提供了一种APP软件用户评论一致性判断方法,W用于帮 助用户选择所需的APP软件。
[0006] 本发明的技术方案是:一种APP软件用户评论一致性判断方法,首先提取APP软件 特征情感词对集;然后计算提取的APP软件特征情感词对集中情感词对的情感倾向程度得 分;最后判断情感倾向程度得分是否存在不等于零的情况来确定APP软件用户评论是否一 致。
[0007] 所述方法的具体步骤如下:
[0008] St巧1、提取APP软件特征情感词对集F=化,f2,. . .,;其中fx=(怖,WcUa) (X = 1,2,. . .,u)表示APP软件特征情感词对,Wh表示评论用户关注的APP软件特征词,Wa 为修饰特征Wh的情感词,Wd为修饰情感词Wa的副词;
[0009]Step2、设置X=1 ;
[0010] Step3、判断X是否小于或等于U:如果是,则执行步骤Step4 ;否则,执行步骤 Stepll;
[0011]Step4、判断t中的怖是否为空:如果是,则执行步骤Step6 ;否则,执行步骤 steps;
[0012] Step5、判断怖是否属于集合U:如果是,则执行步骤Step6 ;否则,计算怖与集合 U中每个词或词组的相似度a:如果am。,〉=α,则执行步骤Step6,否则,将t的情感倾向 程度得分F(X)赋值为0,X++,执行St巧3 ;
[001引 steps、判断t中的Wa是否为自定义网络情感词:如果是,则与自定义网络情感词 库匹配,并根据公式F(x) =F(d)冲(Z)计算F(x),X++,执行Step3 ;否则,执行Step7 ;
[0014] Step7、判断Wd是否为空:如果是,则与《化W化t》词典匹配,并根据公式F(x)= F(a)冲(d)冲(η)计算F(X),X++,执行Step3 ;否则,执行Steps;
[0015] Steps、判断t是否含否定副词:如果不含,则与《化W化t》词典匹配,并根据公式 F(X)=F(a)冲(d)计算F(X),X++,执行Step3;否则,执行Step9;
[0016]Step9、判断fx是否含程度副词:如果不含,则与《化W化t》词典匹配,并根据公式 F(x) = -0. 5冲(a)计算F(x),X++,执行Step3 ;否则,执行SteplO;
[0017] SteplO、判断t是否属于DNP形式:如果不属于,则与《化W化t》词典匹配,并根 据公式F(x) =0.6*F(d)冲(a)计算否定副词在程度副词之前的情感倾向程度得分F(x), X++,执行Step3 ;否则,根据公式F(x) = -0. 5冲(d)冲(a)计算程度副词在否定副词之前的 情感倾向程度得分F(X),X++,执行Step3;
[0018] Stepll、判断是否存在F(x) ! = 0 :
[0019] 如果存在F(x) ! =0,则根据公式
计算出用户对该APP软件每条评 论的综合评分F(0),再根据用户给APP软件所打的5个评分星级将综合评分F(0)划分成对 应的5个等级,如果量化后的评分星级与用户的评分星级相同,则输出"APP软件用户评论 一致",否则输出"APP软件用户评论不一致";
[0020] 如果不存在F(x) ! =0,则输出"APP软件用户评论不一致"; 阳02U 式中,U表示APP软件信息中特征集合,a。。,表示相似度a的最大值,α表示阔值 且α= 0. 1 ;F(x)表示用户评论中对第X个特征评论的情感倾向程度得分,t表示ΑΡΡ软件 特征情感词对集F中F(x) != 0的个数;F(d)为程度副词的极性参数:若存在程度副词, F(d)取值根据程度副词极性参数类别确定,若不存在程度副词,F(d)取值为1 ;F(n)为否定 副词的极性参数:若存在否定副词,F(n)取值为-0. 5,若不存在否定副词,F(n)取值为1 ; F(a)为情感词的原极性参数:如果情感词为正面,F(a)取值为1,如果情感词为反面,F(a) 取值为-1,如果情感词为中性,F(a)的取值为0. 1 ;F(z)表示自定义网络情感词语库中情感 词的原极性参数:如果自定义网络情感词语库中情感词为正面,F(z)取值为1. 6,如果自定 义网络情感词语库中情感词为反面,F(z)取值为-1. 6。
[0022] 所述程度副词极性参数类别分别五类:第一类,F(d)取值为1. 6 ;第二类,F(d)取 值为1. 4 ;第Ξ类,F(d)取值为1. 2 ;第四类,F(d)取值为0. 8 ;第五类,F(d)取值为0. 6。 阳02引所述5个评分星级对应的F(0)取值区间:5星,取值区间为(1,1.6] ;4星,取值区 间为[0.5, 1] ;3星,取值区间为(-0.5,0.5) ;2星,取值区间为[-1,-0.引;1星,取值区间 为[-1. 6, -1)。
[0024] 其中,情感词的正面、反面、中性根据《化w化t》词典匹配。 阳0巧]本发明的工作原理是:
[0026] 一种APP软件用户评论一致性判断方法,包括:
[0027] 提取APP软件特征情感词对集,用于对用户评论信息中的非结构化数据进行相应 的数据处理并提取APP软件特征情感词对集;
[0028] 判断用户评论信息与APP软件信息的一致性,用于判断用户评论信息中APP软件 特征情感词对集中的特征是否与当前APP软件信息特征一致;
[0029] 判断用户评论信息与评分星级的一致性,用于判断用户评论信息中用户对APP软 件特征的情感倾向程度综合评分是否与用户对APP软件所给的评分星级一致。
[0030] 本发明使用ICTCLAS2015作为数据处理的工具,进行用户评论信息的分词及词 性标注;基于雇中凯等人对特征词、情感词同时提取的方法,本发明对特征词、副词、情感词 进行同时提取,即提取APP软件特征情感词对集F。 阳03U 所述U表示APP软件信息中特征集合,am。,表示相似度a的最大值,α表示阔值 且α= 0.1,相似度计算使用的是朱征宇等人提出的改进《知网》的词汇语义相似度计算方 法,计算公式如下:
[0032] Sim(Wi,胖2) =max(Sim咕1,C2j)) 阳〇3引其中:i=l,2,...,n,j=l,2,...,m,Sim(Wi,W2)为词汇Wi与W2之间的相似度 值,Sim(Cii,Czi)为概念Cii与C2.i之间的概念相似度值。
[0034] APP软件用户评论是一种典型的网络评论,用户往往会使用许多网络情感词语。目 前,词典不能识别运部分网络情感词,但运些词语又能表达用户对APP软件一个或多个特 征的态度,从而对APP软件用户评论一致性的判断造成影响。因此,本发明建立了自定义 网络情感词语库,如:TMD/n_newo;rd、狗尿 /njieword、神器 /njieword、牛逼 /n_neword 等,并对运部分情感词进行权重极性的定义。运类词语大多表现为用户对APP软件的一个 或多个特征持非常强烈的态度。
[0035] 本发明基于《化W化t》词典的程度语料库,将林钦和等人的6种类别程度副词中 极性参数相同的类别进行合并,最终分为5种不同极性参数的类别,如表1所示。
[0036] 表1程度副词分类及极性参数表
[0037]
[0038] 对于否定副词的处理,本发明首先设置否定副词的极性参数为-0.5,由于否定副 词和程度副词共现语序情况可分为两种:1)程度副词在否定副词之前,是对否定副词所否 定程度的确定,否定程度是逐渐递增的,例如:"画面不好"和"画面很不好";2)否定副词在 程度副词之前,是对某个程度的否定,作用是把原来的程度降低,例如:"画面不非常好"和 "画面相对好",运两个例句表达的情感倾向程度大体相同。运种情况根据尹洪波等人提出 的在语义上能够相互推衍的,基于W上规则,根据公式F(x) =0.6冲(d)冲(a)计算否定副 词在程度副词之前的情感倾向程度得分F(x);根据公式F(x) =-0.5冲(d)冲(a)计算程度 副词在否定副词之前的情感倾向程度得分F(x)。
[0039] 所述将综合评分F(0)划分成对应的5个等级的划分过程:由上述过程可W计算 出综合评分F(0)的取值范围是[-1.6,+1.6],因为从表2中可W看出极性参数的最大值是 1.6,正面、反面情感词的极性分别为+1、-1,且本专利中的否定副词极性参数为-0.5。所W 5星中最大取值为1.6*1 = 1.6 ;4星的最大取值为1,最小值为-1* (-0.5) = 0.5,即5星 的取值区间为(1,1. 6],4星的取值区间为[0.5, 1]。用户综合评分划分区间如表2所示。
[0040] 表2用户综合评分划分区间 [0041 ]
[0042] 本发明的有益效果是:
[0043] (1)本发明定义并提取APP软件特征情感词对集,有助于更准确的判断用户评论 信息与评分星级的一致性; W44] 0)本发明将用户对APP软件的情感倾向程度划分成与评分星级对应的5个等级, W判断APP软件用户评论的一致性,有助于用户选择满足需求的APP软件; W45] 做本发明通过判断APP软件用户评论的一致性,有助于用户评价APP软件的质 量。
【附图说明】
[0046] 图1是本发明的流程图。
【具体实施方式】
[
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1