一种基于众包的安卓应用演化推荐方法_2

文档序号:9727482阅读:来源:国知局
终处理的结果如图(3),经过AR-MINER处理后,我们获得用户的有用的评论集,方便了后面的处理过程。
[0050]步骤2)预处理如上过滤后的评论中没用的词语。我们使用自然语言预处理技术 (NLP)的托肯化和去除停用词(stopping)技术来去除无用的词语。a)托肯化:去除标点符号 (比如"0","?"),去除数字(比如"1","23")等。b)去除停用词(stopping):去除中文停用词, 比如语气词"啊","唉";连词"并且","不但";修饰词"很","基本","几乎"等。在图(4)中我 们可以看到预处理后的结果,两步操作之后,我们获得了预处理后的文档。
[0051] 步骤3)基于情感-方面-地区模型(SAR模型)对评论中的情感,方面,地区进行分 析,得到关于用户感情,方面以及地区的有效评论的特征诉求,主要过程有:a)情感我们通 过预定义的情感集,通过语义分析器判断出句子极性,这里我们主要取包含不好的情感的 评论。b)地区我们主要通过基于坐标的K-means算法,通过聚类过程判断在某个地区是否有 相关Αρρκ)方面我们通过基于句子层次的K-means算法,给每个句子一个相关的方面,最后 获取所有评论中的用户对于信息点的感受。我们在对预处理后的结果进行SAR分析后,结果 见图(5),这形成了我们做出修改推荐的基础。
[0052] 步骤4)提取多数用户对App的特征诉求。我们根据步骤(3)中获得的有效的评论特 征诉求,我们通过计算特征诉求中关键字出现的频率进行概率计算,找出其中多数人评论 中关心的特征以及要求。
[0054]步骤5)针对与当前APP同类的其他App,我们根据同类App的特征描述进行分析,利 用LDA主题模型产生特征关键字,通过计算其关键字的出现频率值,找出多数App共有的特 征。我们在知乎所在的类别社交里面选择了部分同类的App描述进行分析,并计算出了概 率,结果如图(6)所示,我们选择了易信,陌陌,G 〇〇gle+分析出了他们的特征,方便开发者从 同类App这一方面进行修改。
[0056]步骤6)排序。综合情感,方面,地区,多数用户对App的特征诉求以及同类App的特 征,我们利用SAR模型的概率值以及特征出现频率概率值,结合Top-n在线推荐算法对其排 序,将SAR模型中的推荐概率计算和关键字出现频率计算以及同类App的特征概率结合起 来。
[0057] pi指SAR模型的推荐概率:
[0059]即表示用户u在情感,方面,地区这三方面不喜欢APP t的概率。其中,t,s_,u,r,a, ct分别代表APP,负面情感,用户,地区,APP的方面以及APP的种类。
[0060] P2指关键字出现频率:
[0062] ρ = αρ1+βρ2
[0063] (α,β是输入参数权重)
[0064] Top-n推荐算法是根据一定的规则进行排序,得到所需的数据。我们主要是根据上 述概率大小进行排序,得出最优的η个数据进行推荐,形成最终的修改建议,根据上述概率 的排序,我们的最终结果见图(7),我们根据SAR模型的概率值以及特征出现频率概率值进 行的最终排序使得"知乎"的用户评论特征得到了有效的推荐。
[0065]另一方面,若开发者选择根据同类App的特征进行排序,我们根据社交一类App的 描述进行分析,最终呈现的结果如图(8),可以看到同类App的需求较多的特征也可以用来 向开发者推荐。
【主权项】
1. 一种基于众包的安卓应用演化推荐方法,其步骤如下: 步骤1)首先从移动应用市场的某个Android应用中提取用户对该应用的评论,然后基 于AR-MINER工具,过滤无用的评论,得到有用的用户评论集; 步骤2)使用自然语言预处理技术对有用的用户评论中的词语进行预处理,去除一些无 用的词语; 步骤3)基于情感-方面-地区模型,对评论中的情感,方面,地区进行分析,得到关于用 户感情,方面以及地区的有效评论的特征诉求; 步骤4)提取多数用户对App的特征诉求,根据步骤3)中获得的有效的评论特征诉求,计 算特征诉求中关键字出现的频率并进行概率计算,找出其中多数人评论中关心的特征以及 要求; 步骤5)针对与当前APP同类的其他App,根据同类App的特征描述进行分析,利用LDA主 题模型产生特征关键字,通过计算其关键字的出现频率值,找出多数App共有的特征; 步骤6)排序,综合情感,方面,地区,多数用户对App的特征诉求,利用SAR模型的概率值 以及特征出现频率概率值,结合Top-n在线推荐算法推荐出η个最优的修改意见;进行同类 App推荐时,通过同类App的特征关键字根据步骤5)中特征关键字概率进行排序推荐。2. 根据权利要求1所述的一种基于众包的安卓应用演化推荐方法,其特征在于步骤1) 中,通过爬取应用商店里面我们所需要修改的App的所有评论,基于AR-MINER工具,检索出 所有有用的评论。3. 根据权利要求1所述的一种基于众包的安卓应用演化推荐方法,其特征在于步骤2) 中使用NLP技术的预处理过程: a) 托肯化:去除标点符号,去除数字; b) 去除停用词、连词、修饰词。4. 根据权利要求1所述的一种基于众包的安卓应用演化推荐方法,其特征在于步骤3) 中对于用户评论中情感,地区,特征的提取: a) 情感:通过预定义的情感集,语义分析器判断出句子的极性,语义分析器包括预先 定义的一些关于情感的词语,极性分为good和not good两种,这里主要取包含not good情 感的评论; b) 地区:通过基于坐标的K-means算法,通过聚类过程得出评论中的用户地理位置,取 出这些用户需求的地理位置; c) 方面:通过基于句子层次的K-means算法,给每个句子一个相关的方面,最后获取所 有评论中的用户对于信息点的感受。5. 根据权利要求1所述的一种基于众包的安卓应用演化推荐方法,其特征在于步骤4) 中获取多数用户对App的特征诉求,通过计算步骤3)中关键字出现的频率:6. 根据权利要求1所述的一种基于众包的安卓应用演化推荐方法,其特征在于步骤5) 提取同类App的特征:通过对同类App的特征描述进行LDA主题分析,LDA是用来挖掘语义的, 提取主题的一个模型并给每个描述的句子一个主题,并且通过分析大多数同类App的特征, 通过公式计算其特征关键字出现的概率,推荐时我们根据其频率大小进行排序推荐,7.根据权利要求1所述的一种基于众包的安卓应用演化推荐方法,其特征在于步骤6) 的排序:若开发者选择从用户评论进行排序,综合情感,方面,地区,多数用户对App的特征 诉求,将情感-方面-地区模型中的推荐概率计算和关键字出现频率计算以及同类App的特 征概率结合起来: Pl指SAR模型的推荐概率:即表示用户u在情感,方面,地区这三方面不喜欢APP t的概率;其中,t,s_,u,r,a,ct分 别代表APP,负面情感,用户,地区,APP的方面以及APP的种类; P2指关键字出现频率:最终我们根据线性关系相结合: Ρ = αρ1+βρ2 (〇,0是输入参数权重)。
【专利摘要】本发明涉及一种基于众包的安卓应用演化推荐方法。本发明提取用户对该应用的评论,基于AR-MINER工具,对有用的用户评论中词语进行预处理,基于情感-方面-地区模型进行分析,得到关于用户的特征诉求并提取,计算特征诉求中关键字出现的频率进行概率计算,找出关心的特征以及要求,提取同类APP的特征,利用LDA主题模型产生特征关键字,找出共有特征,利用SAR模型的概率值以及特征出现频率概率值,结合Top-n在线推荐算法推荐出n个最优的修改意见,进行排序推荐。本发明克服了没有考虑交互性的缺陷。本发明提取了市场中同类软件的情感-方面-地区用户评论,据此推荐可更好地保障APP保持市场竞争力。
【IPC分类】G06F17/30
【公开号】CN105488206
【申请号】CN201510916068
【发明人】孙小兵, 夏海婷, 李斌, 李云
【申请人】扬州大学
【公开日】2016年4月13日
【申请日】2015年12月9日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1