一种用户APP行为的预测方法与流程

文档序号:18213895发布日期:2019-07-19 22:30阅读:278来源:国知局
一种用户APP行为的预测方法与流程

本发明涉及信息处理技术,尤其涉及一种终端用户的行为信息处理方法。



背景技术:

随着智能终端的快速发展,应用程序(又称为软件或app)已经成为人们生活、学习和工作中必不可少的通信交流,而应用软件开发人员为了能够拥有更多的app用户,通常会采用多种方法来提高用户的app使用体验,例如在app中集成更多的功能、调整app网页布局等。然而,在app中集成多个功能会直接导致app占用更多的终端内存,且增加的app功能适应性有限,并不一定适用所有的用户,而调整app网页布局提高用户使用体验的效果有限。



技术实现要素:

为解决上述技术问题,本发明公开了一种用户app行为的预测方法,包括:步骤s1,获取待预测的用户app行为数据n=[n1,n2,…,nm]t,其中ni为第i个用户app行为特征的数据,1≤i≤m,m为所述数据n中包括的数据个数;步骤s2,基于所述行为数据n获取用户app行为预测概率p;步骤s3,根据所述用户app行为预测概率p,预测用户app行为。

附图说明

图1是本发明用户app行为的预测方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,将结合附图对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。

图1是本发明用户app行为的预测方法流程图,该方法用于在获取到待预测的用户app行为数据之后进行实时行为预测。如图1所示,该方法包括:

步骤s1,获取待预测的用户app行为数据n=[n1,n2,…,nm]t,其中ni为第i个用户app行为特征的数据,1≤i≤m,m为所述数据n中包括的数据个数。在该步骤中,首先采集用于用户app行为预测的相关app行为数据n,所述行为数据n中包括分别与m个用户app行为特征相对应的数据。优选地,m的取值范围为[350,600],更优选地为500。

步骤s2,基于所述行为数据n获取用户app行为预测概率p。在该步骤中,θi为ni的权重,权重向量θ=[θ0,θ1,...,θm],所述函数h为用户app行为预测函数,即将所述行为数据n带入所述用户app行为预测函数h中可得到所述用户app行为预测概率p。

优选地,所述用户app行为包括:用户卸载行为、或用户阅读行为等多种类型的app行为。在本发明中,可设置不同的用户app行为预测函数以分别测试不同类型的用户app行为,例如设置专用于预测用户阅读行为的用户app行为预测函数h1,设置专用于预测用户卸载行为的用户app行为预测函数h2。

步骤s3,根据所述用户app行为预测概率p,预测用户app行为。具体地,在该步骤中,如果所述用户app行为预测概率p大于等于第一判断阈值,则判断所述用户app行为属性为1,即用户具有某种app行为;如果所述用户app行为预测概率p小于第一判断阈值,则判断所述用户app行为属性为0,即用户不具有某种app行为,其中所述“1”和所述“0”表示用户app行为预测属性类别,其定义和为构建所述用户app行为预测函数h而设置的“1”和“0”定义相同。优选地,所述第一判断阈值为[0.55,0.8]。经过多次试验可知,将所述第一判断阈值设置在[0.55,0.8]而非以0.5作为判断标准,可显著提高所述用户app行为预测函数的预测准确度。

优选地,步骤s3之后还可以包括步骤s4:根据用户app行为的预测结果向用户推送信息。例如根据用户app行为的预测结果向用户提供推荐信息,以便快速引导用户进行位置跳转,节约用户时间。

由上述内容可知,本发明将采集到的待预测的用户app行为数据输入到用户app行为预测函数中,可实现实时预测效果,计算量小;其次通过设置合理地判断标准,可进一步提高用户app行为预测的准确性,提高了用户app行为预测函数的适应能力。

进一步,基于用户app行为训练前数据集合t=[t1,t2,…,tp]及其相应的用户app行为属性集合l=[l1,l2,…,lp]获取用户app行为预测函数h中的权重向量θ,tr=[tr1,tr2,…,trm]t为第r个用户的app行为数据,p为t包括的用户数据数量,1≤r≤p,tri为所述第r个用户的第i个用户app行为特征的数据,m为tr中包括的行为特征数据个数;lr=0或者1,其中1表示第r个用户具有app行为,0表示第r个用户不具有app行为。

根据本发明,所述p和所述m可自定义设置,优选地,所述p≥10万,更优选地,所述p=20万;优选地,所述m的取值范围为[350,600],更优选地,所述m=500。

更进一步地,所述p≤min(p1,p2),其中p1为设备硬件运行能力限定的用户数据数量,p2为实际采集到的用户数据数量。为了能够快速获取有效的用户app行为预测函数,所述训练前数据集合t中的用户数据数量p应尽可能的大,但其数值受到设备硬件运行能力的限制。当所述训练前数据集合t中的用户数据数量p过大而超过硬件设备的运行能力,会使得获取用户app行为预测函数的时间过长而导致时间效率低下。

根据本发明,所述用户app行为包括:用户软件卸载行为、或用户阅读行为等多种类型的app行为。例如,当所述用户app行为为购买奶粉的用户是否还购买尿不湿的用户购买行为时,可设置与用户的该app行为相关的行为特征为:用户性别、用户年龄、家庭身份、收入、职业、浏览奶粉产品的时长、app操作顺序等等,设置用户的app行为属性“1”表示购买奶粉的用户还购买了尿不湿,“0”表示购买奶粉的用户没有购买尿不湿,此时,当获取购买了奶粉和尿不湿的一个用户app行为数据时,可得到所述训练前数据集合t中的一个用户app行为数据tr=[男,30,爸爸,…,30分钟,奶粉至尿不湿]t,其对应的用户app行为属性lr=1。本领域技术人员可知,所述用户app行为数据tr需要首先处理为可数字处理的表示方式,例如其中所述的用户性别变量被处理为0和1的数字表达方式。

具体地,所述权重向量θ使得的取值最小。在本发明中,使用迭代算法获取所述权重向量θ。具体地,可以采用多种迭代方法来获取所述θ,包括牛顿迭代法、梯度下降法等等。优选地,本发明采用梯度下降方法来获取所述θ以得到计算更快、预测性能更好地用户app行为预测函数。

从上述内容可知,本发明基于已知的大量用户app行为数据,通过设置合理的目标函数,得到可用于准确预测用户app行为的预测函数,使得用户app行为实时预测更快捷、更准确。

优选地,所述步骤s3之后还可以包括步骤s5,输出所述θ,以便系统、服务器或者是软件生产厂家知悉所有用户app行为特征对用户app行为预测的影响程度。

优选地,在本发明的一个实施例中,由服务端来执行所述步骤s1-s3,以便于合理利用服务端的运算资源和存储资源优势。优选地,可由服务端来执行基于用户app行为训练前数据集合t=[t1,t2,…,tp]及其相应的用户app行为属性集合l=[l1,l2,…,lp]获取用户app行为预测函数h中的权重向量θ;更优选地,可由服务端来分别获取用于测试不同类型的用户app行为的用户app行为预测函数。

进一步地,所述训练前数据集合t及其相应的用户app行为属性集合l根据用户app行为训练用数据集合y=[y1,y2,…,yp]及其相应的用户app行为属性集合q=[q1,q2,…,qp]确定,其中ys=[ys1,ys2,…,ysn]t为第s个用户对所有n个用户app行为特征的采样数据,1≤s≤p,p为所述训练用数据集合y包括的用户数据数量,ysh为第s个用户的第h个用户app行为特征的数据,n为ys中包括的数据个数;qs=0或者1,其中1表示第s个用户具有app行为,0表示第s个用户不具有app行为,n>m。优选地,所述n的取值范围为[800,2500],更优选地为1000。

具体地,所述t=a*y,a为m行n列的矩阵,其中,cvh为第h个用户app行为特征在用户app行为训练用数据集合y=[y1,y2,…,ym]中的贡献值。为根据y中与第h个行为特征对应的所有采样数据ysh的属性所划分的区间数量,例如对于行为特征“用户性别”来说,由于只有男性和女性之分,因此所述ri可以设置为2,即将所述“用户性别”划分为两个区间;对于行为特征“用户年龄”来说,可设置为[0,20],(20,40],(40,50],(50,70],(70,无穷大)。为了确保行为特征的贡献值有效,在针对每个行为特征划分区间时,要确保每个区间内都包含“1”类型的用户行为数据和“0”类型的用户行为数据;所述pyhk是rh中第k个区间中具有app行为(即行为属性为1)的用户数据数量占所有用户数据数量中具有app行为的用户数据数量的比例,pnhk是rh中第k区间内不具有app行为(即行为属性为0)的用户数据数量占所有用户数据数量中不具有app行为的用户数据数量的比例,1≤k≤ri。所述用户app行为属性集合l中的元素lr∈q表示第r个用户的app行为属性。

由上述内容可知,本发明可根据贡献值大小从训练用已知行为数据集合中选择指定的行为特征用于预测用户app行为,一方面可以排除对用户app行为预测作用小的行为特征,另一方面可以大幅度减少计算用户app行为预测函数的计算量,使获取的用户app行为预测函数更合理,能够显著提高用户app行为预测的准确度。

更进一步地,可根据用户app行为原始数据集合x=[x1,x2,…,xq]来获取所述训练用数据集合y,其中,xk=[xk1,xk2,…,xkn]t为第k个用户的app行为数据,q表示所述原始数据集合x中包含的用户数据数量,xkx为第k个用户的第x个用户app行为特征的数据,n为xk中包括的数据个数,1≤x≤n。优选地,使用集成在用户移动终端app内的sdk来采集所述用户app行为原始数据集合x或者所述训练用数据集合y。

优选地,使用抽样算法从所述原始数据集合x中获取所述训练用数据集合y,更优选的,所述抽样算法可以是随机抽样算法和/或分层抽样算法。使用抽样的方式来获取所述训练用数据集合y,可以使得所述训练用数据集合y中的采样分布更全面,有利于提高用户app行为预测函数的合理性。

更进一步地,对所述原始数据集合x进行预处理。其中,所述预处理包括人工预处理和/或机器预处理。采用机器预处理的方式和/或人工预处理的方式修正或剔除因数据丢失、恶意修改等原因而形成的错误数据和不合理数据,以使得用于获取用户app行为预测函数的数据真实接近实际情况,进而使得获取的用户app行为预测函数更准确。

根据本发明,所述行为数据n根据待预测的用户app行为原始数据n0=[n01,n02,…,n0n]t确定,其中,n0j为第j个用户app行为特征的原始数据,n为所述原始数据n0中包括的数据个数,1≤j≤n,n>m。具体地,n=a*no,a为m行n列的矩阵,其中,cvh为第h个用户app行为特征在用户app行为训练用数据集合y=[y1,y2,…,yp]中的贡献值,ys=[ys1,ys2,…,ysn]t为第s个用户对所有n个用户app行为特征的采样数据,1≤s≤p,n为ys中包括的数据个数;其中,rh为根据y中与第h个行为特征对应的所有采样数据ysh的属性所划分的区间数量;所述pyhk是rh中第k个区间中具有app行为的用户数据数量占所有用户数据数量中具有app行为的用户数据数量的比例,pnhk是rh中第k区间内不具有app行为的用户数据数量占所有用户数据数量中不具有app行为的用户数据数量的比例,1≤k≤ri。

此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1