一种基于霍克斯过程的移动应用流行度预测方法与流程

文档序号:17468704发布日期:2019-04-20 05:40阅读:497来源:国知局
一种基于霍克斯过程的移动应用流行度预测方法与流程

本发明涉及移动应用数据分析领域,特别是涉及一种基于霍克斯过程的移动应用流行度预测方法。



背景技术:

近年来,随着移动应用的发展,移动应用的种类和数量越来越多。移动应用逐渐改变了人们的生活方式,为人们提供了许多便捷的服务。随着移动应用的流行,越来越多的应用开发者加入到移动应用市场中,导致应用之间的竞争日益激烈。每隔一段时间,都会有许多新的应用出现,同时也会有许多旧的应用消亡。因此,对于移动应用及其开发者而言,为了能在竞争激烈的应用市场中不断发展,分析影响应用流行度的相关因素,并预测应用未来的流行度是很重要的。



技术实现要素:

本发明的目的是提供一种基于霍克斯过程的移动应用流行度预测方法,用于预测移动应用未来的流行度。

为实现上述目的,本发明提供了如下方案:

一种基于霍克斯过程的移动应用流行度预测方法,包括如下步骤:

s1、从应用商店中获取移动应用的相关数据;

s2、提取并分析影响移动应用流行度的复杂因素,用下载量来表示移动应用的流行度;

s3、基于霍克斯过程的理论,建立移动应用流行度预测的基本模型;

s4、针对复杂因素,基于霍克斯过程,建立移动应用流行度预测模型;

s5、基于建立的模型,预测移动应用未来的流行度。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述s1中相关数据包括:应用名称、应用类别、应用描述、版本记录、时间、评论、评分、下载量、排名。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述s1还包括对数据进行预处理,过滤下载量太小的移动应用。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述步骤s2提取的复杂因素包括:历史的流行度、应用的发布时长、版本更新、评论量、评分以及评论情感。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述s3中在对移动应用的流行度建模时,首先需要对下载事件的发生强度进行建模,得到由移动应用历史的流行度引起的当前时刻的流行度。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述下载事件的发生强度可以用来衡量一次下载发生的概率;所述下载事件的发生强度为:

其中:ht为历史流行度;λ0为背景强度;为从ti时刻到t时刻之间的所λ(t|ht)有下载事件引起的强度;ti为第i个下载事件发生的时间;φ(t-ti)表示第i个下载事件引起的强度,其中φ(τ)=(τ+c)-(1+θ),时间间隔τ=t-ti表示第i个下载事件发生时距离时刻t的时间间隔,c>0为底数;1+θ(θ>0)为指数项。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,针对复杂因素,给定移动应用a的历史流行度ht,在t时刻,移动应用a的下载事件的发生强度λ(t|ht)可以表示如下:

λ(t|ht)=λs(t)+λe(t)

其中,强度λe(t)是由历史流行度引起的,表示为:

强度λs(t)是由版本更新、评论、评分、情感等因素引起的,表示为:

其中表示版本更新和应用的发布时长对流行度的影响;su(t)表示在t时刻的版本更新状态,αu为版本更新因素的权重;ea(t)表示应用在t时刻的发布时长,多项式表示随着应用发布时长的增加,流行度的演化趋势,j表示因素ea(t)的指数项,表示因素的权重;

∑m=r,r′,sαmsm(t-1)表示评论、评分以及情感对流行度的影响;其中,sm表示评论sr、评分sr′和情感ss,αr、αr′和αs分别表示评论、评分和情感因素的权重。

进一步的,一种基于霍克斯过程的移动应用流行度预测方法,所述移动应用a在t时刻的流行度为:

其中,p(t)为移动应用在t时刻的流行度,它由背景强度λ0,应用的发布时长、评论、评分、评论情感λs(t),以及历史流行度共同决定。

本发明的有益效果为:发明公开了一种基于霍克斯过程的移动应用流行度预测方法,针对应用商店中获取的移动应用相关数据,提取并分析应用移动应用流行度的复杂因素,并针对复杂因素,基于霍克斯过程,建立流行度预测模型,进而可以更准确地预测移动应用未来的流行度,为移动应用开发者提供辅助决策。

附图说明

图1为本发明实施例提供的一种基于霍克斯过程的移动应用流行度预测方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种基于霍克斯过程的移动应用流行度预测方法包括以下步骤:

s1、根据移动应用的名字(如:“微信”),从在线应用商店中获取该应用相关的数据,包括:应用名称、应用类别、应用描述、版本记录、时间、评论、评分、下载量、排名。对数据进行预处理,过滤下载量太小的移动应用。

s2、从移动应用相关数据中提取并分析影响移动应用流行度的复杂因素(包括:历史的流行度、应用的发布时长、版本更新、评论量、评分以及评论情感),用下载量来表示移动应用的流行度。不同因素对移动应用的流行度有不同的影响,具体表现在:

历史的流行度会影响当前的流行度,通常情况下,以前比较流行的应用,未来也会比较流行,除非有其他外部因素的影响。

应用的发布时长是指当前时刻距离应用初始发布的时间。

版本更新记录了更新发布的时间,以及更新的内容。版本更新有助于改进、添加应用的功能。

评论量能够反映移动应用的流行度,评论量较大的应用通常会比较流行。

评分能够反映用户对移动应用的满意程度,从而影响应用的流行度。

评论情感能够反映用户对移动应用的情感倾向,从而影响应用的流行度。

s3、基于霍克斯过程的理论,建立移动应用流行度预测的基本模型。移动应用的流行度演化是一个长期的过程,在此过程中会有许多确定或不确定的因素影响移动应用的流行度演化,因此,可以把移动应用的流行度演化看成是一个随机过程。把移动应用在历史上的每一次下载当作一次随机事件,该事件在时间轴上随机发生。移动应用的流行度演化过程包含了很多次随机下载事件,并且每一次下载事件都会受到历史下载事件的影响。因此,移动应用的流行度演化过程可以看作是霍克斯过程,即移动应用历史的流行度会影响当前时刻的流行度。

在利用霍克斯过程对移动应用的流行度建模时,首先需要对下载事件的发生强度进行建模。下载事件的发生强度可以用来衡量一次下载发生的概率。给定移动应用a的历史流行度ht,在t时刻,移动应用a的下载事件的发生强度λ(t|ht)可以表示如下:

φ(τ)=(τ+c)-(1+θ)(2)

在公式(1)中,第一部分λ0为背景强度。第二部分表示从ti时刻到t时刻之间的所有下载事件引起的强度,ti为第i个下载事件发生的时间。φ(t-ti)表示第i个下载事件引起的强度。

公式(2)对φ进行了解释。时间间隔τ=t-ti表示第i个下载事件发生时距离时刻t的时间间隔。c>0为底数。时间间隔τ越大,则φ(τ)越小,即过去发生的事件对当前时刻的影响,比最近发生的事件对当前时刻的影响要小。因此,φ(τ)可以称为衰减函数。1+θ(θ>0)为指数项,θ越大,则φ(τ)越小。

即移动应用历史的流行度会影响当前时刻的流行度,并且影响是随着时间的增加逐渐衰减的。

由此,可以建立移动应用流行度预测的基本模型,得到由移动应用历史的流行度引起的当前时刻的流行度。

s4、针对复杂因素,基于霍克斯过程,建立移动应用流行度预测模型。移动应用的流行度演化是一个复杂的过程,许多复杂因素都会影响应用的流行度。移动应用的流行度不仅会受到历史流行度的影响,同时还会受到其他外界因素的影响(如:版本更新、评论、评分、情感等)。针对提取的复杂因素,基于霍克斯过程的理论,对这些复杂因素进行分析与建模,建立移动应用流行度预测模型。

针对上述复杂因素,给定移动应用a的历史流行度ht,在t时刻,移动应用a的下载事件的发生强度λ(t|ht)可以表示如下:

λ(t|ht)=λs(t)+λe(t)(3)

在公式(3)中,下载事件的发生强度λ(t|ht)由两部分构成,强度λs(t)是由版本更新、评论、评分、情感等因素引起的,而强度λe(t)是由历史流行度引起的,λe(t)可以用公式(1)表示。λs(t)可以表示如下:

在公式(4)中,强度λs(t)是由两部分构成。第一部分表示版本更新和应用的发布时长对流行度的影响。su(t)表示在t时刻的版本更新状态,αu为版本更新因素的权重。ea(t)表示应用在t时刻的发布时长,多项式表示随着应用发布时长的增加,流行度的演化趋势,j表示因素ea(t)的指数项,表示因素的权重。在不同时刻,版本更新对移动应用流行度的影响也是不一样的。在移动应用发布初期,由于移动应用的用户量较小,因此版本更新引起的流行度变化也会较小;随着移动应用发布时长的增加,应用的用户量也会增加,因此版本更新引起的流行度变化就会较大。因此,将版本更新su(t)与应用的发布时长ea(t)相乘来表示版本更新和应用的发布时长对流行度的影响。

第二部分表示评论、评分以及情感对流行度的影响。其中,sm表示评论sr、评分sr′和情感ss,αr、αr′和αs分别表示评论、评分和情感因素的权重。

s5、基于建立的模型,预测移动应用未来的流行度。基于上述建立的模型,对移动应用a的下载的发生强度λ(t|ht)进行积分运算,就能得到移动应用a在t时刻的流行度:

在公式(5)中,p(t)为移动应用在t时刻的流行度,它由背景强度λ0,应用的发布时长、评论、评分、评论情感λs(t),以及历史流行度共同决定。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1