一种app软件用户评论有关性判断方法

文档序号:10612814阅读:158来源:国知局
一种app软件用户评论有关性判断方法
【专利摘要】本发明涉及一种APP软件用户评论有关性判断方法,属于APP软件用户评价领域。本发明首先提取APP软件每条评论的关键词集;然后计算提取的APP软件每条评论的关键词集对特征库中的有关性概率得分;最后通过判断有关性概率得分是否大于预设阈值的情况来确定APP软件用户评论是否与该APP软件有关。本发明定义并提取APP软件用户评论关键词集,有利于提高判断用户评论有关性的效率;将朴素贝叶斯文本分类方法进行了修改,结合词频统计的方法判断APP软件用户评论有关性概率得分,有助于给用户筛选出有关评论,减少对评论筛选的时间;通过判断APP软件用户评论的有关性,有助于用户评价APP软件的质量。
【专利说明】
一种APP软件用户评论有关性判断方法
技术领域
[0001] 本发明涉及一种APP软件用户评论有关性判断方法,属于APP软件用户评价领域。
【背景技术】
[0002] 用户评论在电子商务与微博领域的信息分析日渐成熟。多数对中文评论的研究使 用ICTCLAS进行信息处理,最后通过自然语言处理的方法来对处理后的用户评论信息进行 分析。例如,杨震等提出一种基于上下文重构的短文本情感极性判别研究;宋友等提出一种 基于正则表达式对网络通用文本处理方法。
[0003] 用户对于应用的选择一定基础上是来自于企业宣传和应用本身的知名度。但是对 于某些同种类型或有相似功能的应用,用户更愿意对比各APP间用户们对于应用的评价、描 述等来判断哪个应用更好或者更加适合自己。APP软件评价能够节约用户查看应用的其他 用户评论、评价等的时间,而且能够更快的告诉用户所关注应用的综合性评价,减少用户对 有关信息的筛选。目前对于APP评价,基本只有企业自己进行评测,可能会出现对APP不实的 介绍等。APP软件评价是第三方的,有助于对APP提出一个较为客观的介绍和评价。
[0004] 本发明提出通过提取APP软件用户评论关键词集,计算关键词集对特征库中的有 关性概率得分,并根据有关性概率得分判断APP软件用户评论的有关性,有助于用户选择满 足需要的APP软件。

【发明内容】

[0005] 针对上述问题,本发明提供了一种APP软件用户评论有关性判断方法,以用于帮助 用户从大量的APP评论中提取出与该APP软件有关的评论。
[0006] 本发明的技术方案是:一种APP软件用户评论有关性判断方法,首先提取APP软件 每条评论的关键词集;然后计算提取的APP软件每条评论的关键词集对特征库中的有关性 概率得分;最后通过判断有关性概率得分是否大于预设阈值的情况来确定APP软件用户评 论是否与该APP软件有关。
[0007] 所述方法的具体步骤如下:
[0008] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ;其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l ,··· ,η-1),n为分词以后词的个数;
[0009] Step2、根据num条用户评论的WordResulti和Featurei提取每条评论的关键词集 Keywordsi:
[0010] 提取Keywordsi方法:找到Featurei中为动词、名词和形容词词性所有的元素下标, 并将WordResulti中对应下标所有元素 Wj/fj存入Keywordsi;
[0011] Step3、判断current是否小于L,如果是,则执行步骤Step4 ;否则,执行步骤 Stepl3;其中,总迭代次数L=Lnum/imiexj,index表示每次迭代条数且满足不大于num,初始 时的当前迭代次数current = 0;
[0012] Step4、根据current与L,确定在第current次迭代时,第一条评论所在条数first、 最后一条评论所在条数last、i = f irst;
[0013] 其中,first = current氺index ;当 current = L_1 时,last = num;否贝lj,last = (current+1)*index_l;
[0014] Step5、判断i是否小于或等于last,如果是,则执行步骤Step6;否则,执行步骤 Stepl2;
[0015] Step6、判断第i条评论的Keywordsi是否为空,如果是,则执行步骤Stepll;否则执 行步骤Step7;
[0016] Step7、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):
[0017] 当Keywordsi中所有元素 wk/fk中fk都为形容词,则将其所有wk存入Testi,否则,对 元素 wk/fk中fk为动词、名词的元素,将其wk存入Testi,fk存入判断词性集TestFeaturei; [0018] steps、计算第i条评论有关性概率得分score,并将其特征词存入对应的特征库:
实中,第i条评论中包含被测词wk的特征库中文本个数Nk(k = 0,1,2,…,u-1),文档个数N=4,wk在对应特征库中出现频数为timesk,wk在对应特征库中平 均特征频数为m,u为Testi的元素个数;
[0019] Step9、判断有关性概率得分score是否大于阈值α,如果是,则执行步骤SteplO;否 则执行步骤Stepll;
[0020] SteplO、第i条评论有关性标记输出为"有关",i++,执行步骤Step5:
[0021] Stepll、第i条评论有关性标记输出为"无关",i++,执行步骤Step5;
[0022 ] Step 12、current++,执行步骤 Step3;
[0023] Stepl3、输出"完成所有迭代"。
[0024] 所述α = ?。
[0025] 本发明的工作原理是:
[0026]提取ΑΡΡ软件用户评论关键词集,用于对用户评论信息的内容进行处理并筛选出 ΑΡΡ软件用户评论关键词集;
[0027]计算贝叶斯与词频的综合概率得分,用于判断用户评论信息中ΑΡΡ软件用户评论 关键词集与特征库有关。
[0028]本发明使用ICTCLAS 2015作为数据处理工具,进行用户评论的分词及词性标记。
[0029] 本发明的有益效果是:
[0030] (1)本发明定义并提取ΑΡΡ软件用户评论关键词集,有利于提高判断用户评论有关 性的效率;
[0031] (2)本发明将朴素贝叶斯文本分类方法进行了修改,结合词频统计的方法判断ΑΡΡ 软件用户评论有关性概率得分,有助于给用户筛选出有关评论,减少对评论筛选的时间; [0032] (3)本发明通过判断ΑΡΡ软件用户评论的有关性,有助于用户评价ΑΡΡ软件的质量。
【附图说明】
[0033]图1是本发明的流程图;
[0034]图2为图1中步骤S1的具体流程;
[0035]图3为图1中步骤S2的具体流程;
[0036]图4为图1中步骤S8的具体流程;
[0037]图5为图1中步骤S9的具体流程。
【具体实施方式】
[0038] 实施例1:如图1-5所示,APP软件用户评论如表1所示,
[0039] 表 1
[0040]
[0041 ]所述APP软件用户评论有关性判断方法的具体步骤如下:
[0042] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {wo/fo,wi/fi,…,评论分词词性集Featurei= …灼},其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0043] 本发明利用ICTCLAS 2015作为数据处理的工具,进行用户评论的分词及词性标 注。本实施例中对用户评论信息分词结果为:"无意/v中/h/wj",提取分词结果集: WordResulto= {无意/v,中/f,α/wj},提取评论分词词性集:Featureo= {v,f,wj},此时num =1〇
[0044] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0045] 提取Keywordsi方法:找到Featurei中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/f j存入Keywordsi:
[0046] 本实施例中,Keywordso= {无意/v};
[0047] St ep3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=limm/indexj :,初始化当前迭代次数current = 0:
[0048] 本实施例中,定义index = l,则L=1;
[0049] Step4、判断current是否小于L:本实施例中,0〈1,执行步骤Step5;
[0050] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1&8〖,1=:[>;^8〖:本实施例中,第0次时:[ >;^8〖=0,1&8〖=0,1=0; [0051 ] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0052] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 不为空,执行步骤Step8;
[0053] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):
[0054] 当Keywordsi中所有元素 wk/fk中fk都为形容词,则将其所有wk存入Testi,否贝lj,对 元素 wk/fk中fk为动词、名词的元素,将其wk存入Testi,fk存入判断词性集TestFeaturei:本 实施例中,1^7¥(^(18〇={无意八}中€1^有动词,贝丨】其下68切={无意},下68七?6&加代〇={>}, isAllAdjust = false ;
[0055] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0056] 计算第i条评论的贝叶斯与词频的综合概率得分score时,需获取第i条评论中包 含被测词wk的特征库中文本个数Nk(k = 0,1,2,…,u-1),文档中含形容词特征库,名词特征 库,动词特征库,软件简介,其文档个数N = 4,wk在对应特征库中出现频数timesk,wk在对应 特征库中平均特征频数m,u为T e s t i的元素个数;根据公式计算s c 〇 r e :
[0057] 将特征词存入对应特征库:若特征词全为形容词,则将其特征词全存入形容词特 征词库并增加频数;否则存入对应特征库并增加频数;若特征词在对应特征库中不存在,则 先在对应特征库中新增该特征词,并将其频数设置为1:
[0058] 本实施例中,此时动词特征库中所有动词出现的频数总和为56,动词个数为14,则 动词特征库中平均特征频数avgv为56/14 = 4,贝fjTesto的wo其对应的m=4,N〇= 1,times〇 = l, 计算第〇条评论score = 0.9;
[0059] SteplO、判断score是否大于阈值α,本实施例中,〇.9〈1,执行步骤Stepl2;
[0060] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0061 ] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0062] Stepl3、current++ = 1,执行步骤 Step4;
[0063] Step4、判断current是否小于L:本实施例中,1 = 1,执行步骤Stepl4;
[0064] Stepl4、输出"完成所有迭代"。
[0065] 实施例2:如图1-5所示,
[0066] APP软件用户评论如表2所示,
[0067] 表 2
[0068]
[0069] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0070] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {wo/fo,wi/fi,…,评论分词词性集Featurei= …灼},其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0071 ] 本实施例中,WordResulto= {哈哈哈/〇},提取评论分词词性集:Featureo= {〇},此 时 num= 1 〇
[0072] 3丨6口2、根据]1111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:本实施例中,Keywordso = {};
[0073] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=[n_/index丨,初始化当前迭代次数current = 0:
[0074] 本实施例中,定义index = l,则L=1;
[0075] Step4、判断current是否小于L:本实施例中,0〈1,执行步骤Step5;
[0076] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0077] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0078] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 为空,执行步骤Stepl2;
[0079] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0080] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0081 ] Stepl3、current++ = 1,执行步骤 Step4;
[0082] Step4、判断current是否小于L:本实施例中,1 = 1,执行步骤Stepl4;
[0083] Stepl4、输出"完成所有迭代"。
[0084] 实施例3:如图1-5所示,
[0085] APP软件用户评论如表3所示,
[0086] 表 3
[0087]
[0088] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0089] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {wo/fo,wi/fi,…,评论分词词性集Featurei= …灼},其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0090] 本实施例中,WordResulto= {真/d,好/a,用/v},提取评论分词词性集:Featureo = {d,a,v},此时num=l〇
[0091 ] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0092] 提取Keywordsi方法:找到Featurei中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0093] 本实施例中,Keywordso= {好/a,用/v};
[0094] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=[numZindcx |,初始化当前迭代次数current = 0:
[0095] 本实施例中,定义index = l,则L=1;
[0096] Step4、判断current是否小于L:本实施例中,0〈1,执行步骤Step5;
[0097] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0098] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[00"] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 不为空,执行步骤Step8;
[0100] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):
[0101 ] 当Keywordsi中所有元素 Wk/fk中fk都为形容词,则将其所有Wk存入Testi,否则,对 于元素 wk/fk中fk为动词、名词的元素,将其wk存入Testi,fk存入判断词性集TestFeaturei: 本实施例中,Keywordso = {好/a,用/v}中fk有动词,贝lj其Testo = {用},TestFeatureo = {v}, isAllAdjust = false ;
[0102] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0103] 本实施例中,此时动词特征库中平均特征频数avgv为11.125,则Testo的wo其对应 的m=ll · 125,~=2,1:;[11168()=16,计算第0条评论8(30代=2.128;
[0104] SteplO、判断score是否大于阈值α,本实施例中,2.128>1,执行步骤Stepll;
[0105] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0106] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0107] Stepl3、current++ = 1,执行步骤 Step4;
[0108] Step4、判断current是否小于L:本实施例中,1 = 1,执行步骤Stepl4;
[0109] Stepl4、输出"完成所有迭代"。
[0110] 实施例4:如图1-5所示,
[0111] APP软件用户评论如表4所示,
[0112] 表4
[0113]
[0114] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0115] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {wo/fo,wi/fi,…,评论分词词性集Featurei= …灼},其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0116] 本实施例中,WordResulto= {差/a},提取评论分词词性集:Featureo= {a},此时 num= 1 〇
[0117] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0118] 提取Keywordsi方法:找到Featurei中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0119] 本实施例中,Keywordso= {差/a};
[0120] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=[num/index |,初始化当前迭代次数current = 0:
[0121] 本实施例中,定义index = l,则L=1;
[0122] Step4、判断current是否小于L:本实施例中,0〈1,执行步骤Step5;
[0123] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0124] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0125] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 不为空,执行步骤Step8;
[0126] Step8、根据第 first 条评论的 Keywordsi 提取被测词集 Testi= {ti, t2,…,tk} (k = 0,1,2,···,u_l):
[01 Z7]当Keywordsi中所有元素 wk/fk中fk都为形容词,则将其所有wk存入Testi,否则,对 元素 wk/fk中fk为动词、名词的元素,将其wk存入Testi,fk存入判断词性集TestFeaturei:本 实施例中,Keywordso= {差/a}中fk只有形容词,贝IJ其Testo = {差},isAllAdjust = true; [0128] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0129] 本实施例中,此时动词特征库中平均特征频数avgv为11.5,则Testo的wo其对应的m = 11.15,N〇=l,times。= 15,计算第0条评论 score = 1 · 791;
[0130] SteplO、判断score是否大于阈值α,本实施例中,1 ·791>1,执行步骤Stepll;
[0131] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0132] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0133] Stepl3、current++ = 1,执行步骤 Step4;
[0134] Step4、判断current是否小于L:本实施例中,1 = 1,执行步骤Stepl4;
[0135] Stepl4、输出"完成所有迭代"。
[0136] 实施例5:如图1-5所示,
[0137] APP软件用户评论如表5所示,
[0138] 表5
[0139]
[0140]所述APP软件用户评论有关性判断方法的具体步骤如下:
[0141] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0142] 本实施例中,WordResult〇={为什么/ryv,以前/f,安装/v,的/udel,了/y,,/wd, 现在/t,安装/v,不/d,了/y},Feature〇= {ryv,f,v,udel,y,wd,t,v,d,y},WordResulti = {不错/a},Featurei= {a},此时num=2〇
[0143] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0144] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0145] 本实施例中,Keywords〇= {安装/v},Keywordsi= {不错/a};
[0146] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 I^lilum/indexj,初始化当前迭代次数current = Ο:
[0147] 本实施例中,定义index = l,则L = 2;
[0148] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0149] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0150] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0151 ] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 不为空,执行步骤Step8;
[0152] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Testo= {安装},TestFeatureo = {v},isAllAdjust = false; [0153] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0154] 本实施例中,此时动词特征库中平均特征频数avgv为5.571,则Testo的wo其对应的 111 = 5.571,~=1,1:;[11168() = 34,计算第0条评论8(30代=6.682;
[0155] SteplO、判断score是否大于阈值α,本实施例中,6.682>1,执行步骤Stepll;
[0156] Step 11、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0157] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0158] Stepl3、current++ = 1,执行步骤 Step4;
[0159] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0160] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0161 ] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0162] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0163] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Testi = {不错},isAllAdjust = true;
[0164] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0165] 本实施例中,此时形容词特征库中平均特征频数avga*ll .25,则Testj^wo其对应 的m = 11 · 25,N〇 = 1,times〇= 19,计算第1条评论 score = 2 · 178;
[0166] SteplO、判断score是否大于阈值α,本实施例中,2.178>1,执行步骤Stepll;
[0167] Step 11、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0168] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0169] Step 13、current++ = 2,执行步骤 Step4;
[0170] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0171] Stepl4、输出"完成所有迭代"。
[0172] 实施例6:如图1-5所示,
[0173] APP软件用户评论如表6所示,
[0174] 表6
[0175]
[0176] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0177] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0178] 本实施例中,WordResult〇= {非常/d,不错/a},Feature〇= {d,a},WordResulti = {很/d,好/a} ;Featurei = {d,a},此时num=2〇
[0179] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0180] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0181 ]本实施例中,Keywords〇= {不错/a},Keywordsi= {好/a};
[0182] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=[n:um/iiidex|,初始化当前迭代次数CUrrent = 0:
[0183] 本实施例中,定义index = l,贝ljL = 2;
[0184] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0185] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0;
[0186] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0187] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywords。 不为空,执行步骤Step8;
[0188] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本实施例中,Test〇= {不错},isAllAdjust = true;
[0189] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0190] 本实施例中,此时动词特征库中平均特征频数avga*12.125,则Testo的wo其对应 的m = 12 · 125,N〇 = 1,times〇 = 21,计算第0 条评论 score = 2 · 214;
[0191 ] SteplO、判断score是否大于阈值α,本实施例中,2·214>1,执行步骤Stepll;
[0192] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0193] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl 3;
[0194] Stepl3、current++ = 1,执行步骤 Step4;
[0195] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0196] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1;
[0197] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0198] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0199] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Testi = {好},isAllAdjust = true;
[0200] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0201] 本实施例中,此时形容词特征库中平均特征频数avga*ll .25,则Testj^wo其对应 的m = 11 · 25,N〇 = 3,times〇 = 35,计算第1条评论 score = 3 · 739;
[0202] SteplO、判断score是否大于阈值α,本实施例中,3·739>1,执行步骤Stepll;
[0203] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0204] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0205] Stepl 3、current++ = 2,执行步骤 Step4;
[0206] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0207] Stepl4、输出"完成所有迭代"。
[0208] 实施例7:如图1-5所示,
[0209] APP软件用户评论如表7所示,
[0210] 表7
[0211]
[0212] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0213] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0214] 本实施例中,W〇rdResult〇= {为什么/ryv,下载/V,了/ule,没有/d,在/p,桌面/n, 上/f,出现/v,?/ww},Feature〇 = {ryv,v,ule,d,p,n,f,v,ww},WordResulti = {好/a,,/wd, 感谢/V,微信/nz,各位/rr,朋友/n},Featurei = {a,wd,v,nz,rr,n},此时num=2〇
[0215] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0216] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0217] 本实施例中,Keywords〇= {下载/v,桌面/n,出现/v},Keywordsi= {好/a,感谢/V, 微信/nz,朋友/η};
[0218] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 I^lilum/indexj,初始化当前迭代次数current = Ο:
[0219] 本实施例中,定义index = l,则L = 2;
[0220] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0221 ] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0222] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0223] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 不为空,执行步骤Step8;
[0224] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本实施例中,Testo={下载,桌面,出现},TestFeatureo = {v,n,v}, isAllAdjust = false ;
[0225] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0226]本实施例中,此时动词特征库中平均特征频数avgv为6.343,名词特征库中平均特 征频数avgn为3 · 852,则Test。的wo其对应的m = 6 · 343,N〇 = 1,times〇 = 25 ;wi对应的m = 3.852,Ni=l,time si = l;W2对应的m = 6.343,N2 = 1,time S2 = 1,计算第0条评论 score = 2.958;
[0227] SteplO、判断score是否大于阈值a,本实施例中,2.958>1,执行步骤Stepll;
[0228] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0229] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0230] Stepl3、current++ = 1,执行步骤 Step4;
[0231 ] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0232] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0233] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0234] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0235] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本实施例中,Testi = {感谢,微信,朋友},TestFeaturei = {v,nz,n}, isAllAdjust = false ;
[0236] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0237] 本实施例中,此时动词特征库中平均特征频数avgv为13.25,名词特征库中平均特 征频 avgn为 6 · 829,贝 ijTesti的 wo 其对应的 m= 13 · 25,N〇= 1,times〇 = 4,wi 其对应的 m=6 · 829, ~=2,1:;[11168。= 32,¥2其对应的111 = 6.829,1^。= 2,1:;[11168。= 4,计算第1条评论8(30代=7.535;
[0238] SteplO、判断score是否大于阈值α,本实施例中,7.535>1,执行步骤Stepll;
[0239] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0240] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0241 ] Stepl3、current++ = 2,执行步骤 Step4;
[0242] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0243] Stepl4、输出"完成所有迭代"。
[0244] 实施例8:如图1-5所示,
[0245] APP软件用户评论如表8所示,
[0246] 表 8
[0247]
[0248] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0249] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0250] 本实施例中,W〇rdResult〇= {小武/nr2},Feature〇= {nr2},WordResulti= {郞卫 忠/nr},Featurei= {nr},此时num=2〇
[0251 ] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0252] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0253] 本实施例中,Keywords〇= {小武/nr2},Keywordsi= {郞卫忠/nr};
[0254] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=lnum/iridex丨,初始化当前迭代次数current = 0:
[0255] 本实施例中,定义index = l,则L = 2;
[0256] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0257] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0;
[0258] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0259] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywords。 不为空,执行步骤Step8;
[0260] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Test〇= {小武},TestFeature〇= {nr2},isAllAdjust = false; [0261 ] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0262] 本实施例中,名词特征库中平均特征频数avgn为4.148,则Test。的w〇其对应的m = 4.148,心=1,1:;[11168。=1,计算第0条评论8(30代=0.882;
[0263] SteplO、判断score是否大于阈值α,本实施例中,0.882〈1,执行步骤3七6?12;
[0264] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0265] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0266] Stepl3、current++ = 1,执行步骤 Step4;
[0267] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0268] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0269] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0270] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0271 ] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Testi = {郞卫忠 },TestFeaturei = {nr},isAl lAd just = false;
[0272] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0273] 本实施例中,此时名词特征库中平均特征频avgn为4.296,则Test的《〇其对应的m =4.296,~=1,1:;[11168。=1,计算第1条评论8(30代=0.866;
[0274] SteplO、判断score是否大于阈值α,本实施例中,〇.866〈1,执行步骤Stepl2;
[0275] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0276] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0277] Step 13、current++ = 2,执行步骤 Step4;
[0278] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0279] Stepl4、输出"完成所有迭代"。
[0280] 实施例9:如图1-5所示,
[0281] APP软件用户评论如表9所示,
[0282] 表 9
[0283]
[0284] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0285] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {wo/fo,wi/fi,…,评论分词词性集Featurei= …灼},其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0286] 本实施例中,WordResulto= {呵呵/〇},Featureo= {〇},WordResulti = {哈哈/〇, !/ wt},Featurei= {o,wt},此时num=2〇
[0287] 3丨6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:本实施例中,Keywordso = {},Keywordsi = {};
[0288] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=|num/index |,初始化当前迭代次数current = 0:
[0289] 本实施例中,定义index = l,则L = 2;
[0290] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0291 ] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0292] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0293] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 为空,执行步骤Stepl2;
[0294] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0295] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0296] Stepl3、current++ = 1,执行步骤 Step4;
[0297] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0298] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0299] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0300] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 为空,执行步骤Stepl2;
[0301] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0302] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0303] Step 13、current++ = 2,执行步骤 Step4;
[0304] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0305] Stepl4、输出"完成所有迭代"。
[0306] 实施例10:如图1-5所示,
[0307] APP软件用户评论如表10所示,
[0308] 表1〇
[0309]
[0310] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0311] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0312] 本实施例中,WordResult〇= {嘻嘻/〇},Feature〇= {〇},WordResulti = {彭江/nr}, Featurei= {nr},此时num=2〇
[0313] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0314] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/f j存入Keywordsi:
[0315] 本实施例中,Keywordso= {},Keywordsi= {彭江/nr};
[0316] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=[num/inde>c |,初始化当前迭代次数current = 0:
[0317] 本实施例中,定义index = l,贝ljL = 2;
[0318] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0319] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0320] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0321 ] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 为空,执行步骤Stepl2;
[0322] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0323] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0324] Stepl3、current++ = 1,执行步骤 Step4;
[0325] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0326] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0327] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0328] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0329] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Testi = {彭江},TestFeaturei = {nr},isAllAdjust = false; [0330] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0331] 本实施例中,此时名词特征库中平均特征频avgn为4.819,则了68以的¥〇其对应的!11 = 4.819,N〇=l,times〇 = 1,计算第 1 条评论 score = 0 · 815;
[0332] SteplO、判断score是否大于阈值α,本实施例中,〇.815〈1,执行步骤Stepl2;
[0333] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0334] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0335] Stepl 3、current++ = 2,执行步骤 Step4;
[0336] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0337] Stepl4、输出"完成所有迭代"。
[0338] 实施例11:如图1-5所示,
[0339] APP软件用户评论如表11所示,
[0340] 表11
[0341]
[0342] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0343] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0344] 本实施例中,WordResul t〇= {后台/η,运行/vn,就/d,收/v,不/d,至lj/v,信息/η,提 不/ν,什么/ry,情况/n,?/ww},Feature〇= {n,vn,d,v,d,v,n,v,ry,n,ww},WordResulti = {爱/v,马仕/nr},Featurei= {v,nr},此时num=2〇
[0345] 3丨6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0346] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/fj存入Keywordsi:
[0347] 本实施例中,Keywords。= {后台/η,运行/vn,收/v,至lj/ν,信息/η,提示/v,情况/ n},Keywordsi= {爱/v,马仕/nr};
[0348] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L_=〖.num/indexj,.初始化当前迭代次数current = 0:
[0349] 本实施例中,定义index = l,则L = 2;
[0350] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0351 ] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0;
[0352] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0353] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywords。 不为空,执行步骤Step8;
[0354] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本实施例中,Test〇= {后台,运行,收,至丨」,信息,提示,情况},TestFeature〇 = {n,vn,v,v,n,v,n},isAllAdjust = false;
[0355] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0356] 本实施例中,此时动词特征库中平均特征频数avgv为7.314,名词特征库中平均特 征频数avg n为4 · 667,贝ijTesto的w〇其对应的m = 4 · 667,N〇 = 1,times〇 = 11; wi对应的m = 7 · 314,Νι = 1,timesi = 11;W2对应的m = 7 · 314,N2 = 2,times2 = 11;W3对应的m = 7 · 314,N3 = l,times3 = 19;W4)^i^9m = 4.667,N4=l,times4=ll,;W5)^i^9m = 7.314,N5 = l,times5 = 11; W6 对应的m=4 · 667,N6 = 1,t imes6 = 11,计算第0条评论score = 767 · 26;
[0357] SteplO、判断score是否大于阈值α,本实施例中,767.26>1,执行步骤Stepll;
[0358] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0359] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0360] Stepl3、current++ = 1,执行步骤 Step4;
[0361 ] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0362] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0363] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0364] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0365] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,丁〇81:1={愛,马仕},TestFeaturei = {v,nr},isAllAd just = false;
[0366] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0367] 本实施例中,此时动词特征库中平均特征频数avgv为7.429,名词特征库中平均特 征频3¥811为4.778,贝丨打681:1的¥()其对应的111=7.429,他=1,1:;[11168() = 4,¥1其对应的111=4.778, N0= 1,times0= 1,计算第1 条评论 score = 0 · 878;
[0368] SteplO、判断score是否大于阈值α,本实施例中,0.878〈1,执行步骤3七6?12;
[0369] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0370] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0371 ] Stepl3、current++ = 2,执行步骤 Step4;
[0372] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0373] Stepl4、输出"完成所有迭代"。
[0374] 实施例12:如图1-5所示,
[0375] APP软件用户评论如表12所示,
[0376] 表12
[0377]
L〇378」所述APP软仵用尸评论有夫性判断万法的具体步骤如卜:
[0379] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {wo/fo,wi/fi,…,评论分词词性集Featurei= …灼},其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0380] 本实施例中,WordResulto= {很/d,愛/v},Featureo= {d,v},WordResulti= {嘎 嘎/〇},Featurei= {〇},此时num=2〇
[0381 ] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi :
[0382] 提取Keywordsi方法:找到Featurei中为动词、名词和形容词词性所有的元素下标, 并将Keywordsi中对应下标所有元素 Wj/f j存入Keywordsi:
[0383] 本实施例中,Keywordso= {愛/v},Keywordsi= {};
[0384] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L=[!ium/index |,初始化当前迭代次数current = 0:
[0385] 本实施例中,定义index = l,则L = 2;
[0386] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0387] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 0,i = 0; [0388] Step6、判断i是否小于或等于last:本实施例中,0〈 = 0,执行步骤Step7;
[0389] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywordso 不为空,执行步骤Step8;
[0390] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Testo= {愛},TestFeatureo = {v},isAllAdjust = false;
[0391 ] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0392] 本实施例中,此时动词特征库中平均特征频数avgv为7.457,则Testo的wo其对应的 m = 7 · 457,N〇= 1,times〇 = 5,计算第 0条评论 score = 1 · 205;
[0393] SteplO、判断score是否大于阈值α,本实施例中,1 ·205>1,执行步骤Stepll;
[0394] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0395] Step6、判断i是否小于或等于last:本实施例中,1>0,执行步骤Stepl3;
[0396] Stepl3、current++ = 1,执行步骤 Step4;
[0397] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0398] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数1381:,1=;1^;^81::本实施例中,第1次时;1^;^8丨=1,138丨=1,1 = 1; [0399] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0400] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 为空,执行步骤Stepl2;
[0401] Stepl2、第i条评论有关性标记输出为"无关",i++:本实施例中,第0条评论有关性 标记输出为"无关",i++ = l,执行步骤Step6;
[0402] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0403] Step 13、current++ = 2,执行步骤 Step4;
[0404] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0405] Stepl4、输出"完成所有迭代"。
[0406] 实施例13:如图1-5所示,
[0407] APP软件用户评论如表13所示,
[0408]表13
[0409]
[0410] 所述APP软件用户评论有关性判断方法的具体步骤如下:
[0411] Stepl、提取APP软件num条用户评论,以及每条用户评论的评论分词结果集 WordResulti= {w〇/f〇,wi/fi,…,评论分词词性集Featurei= ,其中Wj为 词,fj为词性(i = 〇,l,…,num-1,j = 0,l,…,n-l):
[0412] 本实施例中,W〇rdResult〇= {太/d,好/a,了/y,!/wt,我/rr,非常/d,喜欢/vi}, Feature〇 = {d,a,y,wt,rr,d,vi},WordResulti= {只要/c,东西/n,好/a,,/wd,评价/V,也/ d,会/v,高/a,,/wd,良心/n,品牌/n},Featurei={c,n,a,wd,v,d,v,a,wd,n,n}, WordResult2= {不错/a,,/wd,值得/v,下载/v,!/wt},Feature2= {a,wd,v,v,wt}, WordResult3= {内容/n,丰富/a,,/wd,出乎/V,我/rr,所/usuo,料/V,啊/y,!/wt},Feature3 ={n,a,wd,v,rr,usuo,v,y,wt},此时num = 4〇
[0413] 3七6口2、根据11111]1条用户评论的¥(^(11^81111:和?631:11代提取每条评论的关键词集 Keywordsi:
[0414] 提取Keywordsi方法:找到Feature!中为动词、名词和形容词词性所有的元素下标, 并将WordResulti中对应下标所有元素 Wj/fj存入Keywordsi:
[0415] 本实施例中,Keywords〇= {好/a,喜欢/v},Keywordsi= {东西/n,好/a,评价/v,会/ v,高/a,良心/n,品牌/n},Keywords2 = {不错/a,值得/V,下载/v},Keywords3 = {内容/n,丰 富/a,出乎/v,料/v};
[0416] Step3、定义每次迭代条数index ( index必须满足不大于num),总迭代次数 L==|num/index|,初始化当前迭代次数current = 0:
[0417] 本实施例中,定义index = 2,则L = 2;
[0418] Step4、判断current是否小于L:本实施例中,0〈2,执行步骤Step5;
[0419] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = f irst:本实施例中,第0次时f irst = 0,last = 1,i = 0;
[0420] Step6、判断i是否小于或等于last:本实施例中,0〈 = 1,执行步骤Step7;
[0421 ] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第0条评论的Keywords。 不为空,执行步骤Step8;
[0422] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Test。= {喜欢},TestFeatureo= {v},isAllAd just = false,u =1;
[0423] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0424] 本实施例中,此时动词特征库中平均特征频数avgv为7.457,则Testo的wo其对应的 m = 7 · 457,N〇= 1,times〇 = 5,u= 1,计算第 0 条评论 score = 1 · 205;
[0425] SteplO、判断score是否大于阈值α,本实施例中,1 ·205>1,执行步骤Stepll;
[0426] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = l,执行步骤Step6;
[0427] Step6、判断i是否小于或等于last:本实施例中,1〈 = 1,执行步骤Step7;
[0428] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第1条评论的Keywordsi 不为空,执行步骤Step8;
[0429] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本实施例中,Testi = {东西,评价,会,良心,品牌},TestFeaturei = {n,v,v, n,n},isAllAdjust = false,u = 5;
[0430] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0431 ]本实施例中,此时动词特征库中平均特征频数avgv为7.457,名词特征库中平均特 征频数avgn为4 · 975,Testi的wo其对应的m = 4 · 975,N〇 = 1,times〇 = 20 ; wi其对应的m = 7.457,他=2,1:;[111681 = 32;¥2其对应的111 = 7.457,犯=2,1:;[111682 = 30;¥3其对应的111 = 4.975, N3 = 0,times3 = 0; W4 其对应的 m = 4 · 975,N4 = 1,times4= 12,u = 5,计算第1 条评论score = 132.9181;
[0432] SteplO、判断score是否大于阈值α,本实施例中,132.918D1,执行步骤Stepll;
[0433] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = 2,执行步骤Step6;
[0434] Step6、判断i是否小于或等于last:本实施例中,2>1,执行步骤Stepl3;
[0435] Stepl3、current++ = 1,执行步骤 Step4;
[0436] Step4、判断current是否小于L:本实施例中,1〈2,执行步骤Step5;
[0437] Step5、根据current与L,确定在第current次迭代时,第一条评论所在条数f irst 和最后一条评论所在条数last,i = first:本实施例中,第1次时first = 2,last = 3,i = 2; [0438] Step6、判断i是否小于或等于last:本实施例中,2〈 = 3,执行步骤Step7;
[0439] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第2条评论的Keywords。 不为空,执行步骤Step8;
[0440] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi = {ti,t2,…,tk} (k = 0,1,2,…,u_l):本实施例中,Test2= {值得,下载},TestFeature2= {v,v},isAllAdjust = false,u = 2;
[0441 ] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0442] 本实施例中,此时动词特征库中平均特征频数avgv为7.594,则Test 2的wo其对应的 m = 7 · 594,N〇 = 1,times〇 = 11 ;wi其对应的 m = 7 · 594,N〇 = 2,times〇 = 36,u = 2,计算第2 条评 论score = 10·836;
[0443] SteplO、判断score是否大于阈值α,本实施例中,10.836>1,执行步骤Stepll;
[0444] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = 3,执行步骤Step6;
[0445] Step6、判断i是否小于或等于last:本实施例中,3〈 = 3,执行步骤Step7;
[0446] Step7、判断第i条评论的Keywordsi是否为空:本实施例中,第3条评论的Keywords3 不为空,执行步骤Step8;
[0447] Step8、根据第first 条评论的Keywordsi 提取被测词集 Testi= {ti,t2,…,tk} (k = 0,1,2,…,u-1):本实施例中,Test3={内容,出乎,料},TestFeature3={n,v,v}, isAllAdjust = false,u = 3;
[0448] Step9、计算第i条评论得分score,并将其特征词存入对应的特征库:
[0449] 本实施例中,此时动词特征库中平均特征频数avgv为8.004,名词特征库中平均特 征频数avgn为5 · 100,Test3的wo其对应的m = 5 · 100,N〇 = 2,times〇 = 34 ;wi其对应的m = 8.004,~=1,1:;[1116 81 = 4;¥2其对应的111 = 8.004,% = 1,1:;[1116 82 = 8,11 = 3,计算第3条评论 score = ll .657;
[0450] SteplO、判断score是否大于阈值α,本实施例中,11 ·657>1,执行步骤Stepll;
[0451] Stepll、第i条评论有关性标记输出为"有关",i++:本实施例中,第0条评论有关性 标记输出为"有关",i++ = 4,执行步骤Step6;
[0452] Step6、判断i是否小于或等于last:本实施例中,4>3,执行步骤Stepl3;
[0453] Step 13、current++ = 2,执行步骤 Step4;
[0454] Step4、判断current是否小于L:本实施例中,2 = 2,执行步骤Stepl4;
[0455] Stepl4、输出"完成所有迭代"。
[0456] 词性解释:
[0457] η名词,t时间词,s处所词,f方位词,v动词,a形容词,b区别词,z状态词,r代词,m数 词,q量词,d副词,p介词,c连词,u助词,e叹词,y语气词,〇拟声词,h前缀,X字符串,w标点符 号。
[0458] 实施例14:如图1-5所示,一种APP软件用户评论有关性判断方法,首先提取APP软 件每条评论的关键词集;然后计算提取的APP软件每条评论的关键词集对特征库中的有关 性概率得分;最后通过判断有关性概率得分是否大于预设阈值的情况来确定APP软件用户 评论是否与该APP软件有关。
[0459] 上面结合附图对本发明的【具体实施方式】作了详细说明,但是本发明并不限于上述 实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前 提下做出各种变化。
【主权项】
1. 一种APP软件用户评论有关性判断方法,其特征在于:首先提取APP软件每条评论的 关键词集;然后计算提取的APP软件每条评论的关键词集对特征库中的有关性概率得分;最 后通过判断有关性概率得分是否大于预设阔值的情况来确定APP软件用户评论是否与该 APP软件有关。2. 根据权利要求1所述的APP软件用户评论有关性判断方法,其特征在于:所述方法的 具体步骤如下: Stepl、提取APP软件ruim条用户评论,W及每条用户评论的评论分词结果集WordResulti ={wo/fo,wiAfi,…,Wj化},评论分词词性集Featurei = ...fj};其中Wj为词,fj为词性 (i = 0,l,…,num-1,j = 0,l,…,n-l),n为分词W后词的个数; Step2、根据num条用户评论的WordResulti和Featurei提取每条评论的关键词集 Keywords!: 提取Keywords巧法:找到Featurei中为动词、名词和形容词词性所有的元素下标,并将 WordResulti中对应下标所有元素 Wj/f j存入Keywordsi; Step3、判断current是否小于L,如果是,则执行步骤Step4;否则,执行步骤Stepl3;其 中,总迭代次数L= Lnum,''index I,index表示每次迭代条数且满足不大于num,初始时的当前迭 代次数 current = 0; Step4、根据current与L,确定在第current次迭代时,第一条评论所在条数first、最后 一条评论所在条数last、i = f irst; 其中,f irst = current*index;当current = L-l时,1曰st = num;否卯J,1曰st= (current+ l)*index-l; Step5、判断i是否小于或等于last,如果是,则执行步骤Step6;否则,执行步骤Stepl2; Step6、判断第i条评论的Keywordsi是否为空,如果是,则执行步骤Stepll;否则执行步 骤Step7; Step7、根据第first条评论的Keywordsi提取被测词集Testi = ,tkKk = 0,1, 2,...,11-1): 当Keywordsi中所有元素 wkパk中fk都为形容词,则将其所有wk存入Testi,否则,对元素 wk/fk中fk为动词、名词的元素,将其wk存入化sti,fk存入判断词性集Tes巧'eaturei; steps、计算第i条评论有关性概率得分score,并将其特征词存入对应的特征库:;其中,第i条评论中包含被测词wk的特征库中文本个数Nk化= 0,1,2,…,U-1),文档个数N=4,wk在对应特征库中出现频数为timesk,wk在对应特征库中平 均特征频数为m,u为Testi的元素个数; Step9、判断有关性概率得分score是否大于阔值α,如果是,则执行步骤SteplO;否则执 行步骤Stepll; St邱10、第i条评论有关性标记输出为"有关",i++,执行步骤steps: St邱11、第i条评论有关性标记输出为"无关",i++,执行步骤steps; St 邱 12、cu;rrent++,执行步骤 Step3; St邱13、输出"完成所有迭代"。3.根据权利要求2所述的APP软件用户评论有关性判断方法,其特征在于:所述α = 1。
【文档编号】G06F17/30GK105975487SQ201610264134
【公开日】2016年9月28日
【申请日】2016年4月26日
【发明人】姜瑛, 向祺鑫, 冉猛, 李凌宇, 丁家满, 汪海涛, 刘英莉
【申请人】昆明理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1