一种基于用户间影响力的移动用户偏好预测方法与流程

文档序号:13427059阅读:178来源:国知局

本发明属于移动用户偏好获取技术领域,尤其是一种基于用户间影响力的移动用户偏好预测方法。



背景技术:

移动终端(智能手机、平板电脑)的普及以及无线网络(例如,3g、4g)的改善,使移动用户可以随时随地获取信息或移动网络服务。因此,移动用户期望可以从“信息海洋”中及时准确地获得个性化的信息或需求。在移动互联网中,由于移动网络服务的快速增长,对于移动用户来说,想要找到满足其需求的信息服务是非常耗时的。作为信息过滤工具,个性化推荐系统能解决该问题。个性化推荐系统已经应用到电子商务(例如,amazon,ebay,netflix)、信息检索(例如,谷歌、百度等)以及互联网广告等领域中,该个性化推荐系统的关键是如何准确预测用户偏好。

目前,在个性化推荐系统中,最常用的用户偏好预测方式是协同过滤,该方法是根据目标用户的近似邻居的偏好来预测目标用户的偏好,这些近似邻居与目标用户的偏好比较相似。然而,该种协同过滤方式存在数据稀疏问题。因此,研究人员利用矩阵分解技术或引入用户信任度、上下文信息等来解决数据稀疏性问题。虽然矩阵分解技术能够缓解数据稀疏性问题,但由于没有考虑用户之间的社会关系,所以无法准确发现目标用户的近似邻居集合。上下文的引入可以更精确地定位用户偏好,但上下文的引入进一步加剧了数据的稀疏性问题。根据研究发现,用户偏好不仅受近似邻居偏好的影响,它还受家人、朋友、同事、名人等的影响,因此信任度的引入可以改善用户偏好预测的准确性。借鉴上述研究方法,本发明将用户间的影响力引入到用户偏好预测方法中。

现有的用户影响力计算方法主要分为三类:基于网络拓扑结构的、基于用户行为的和基于用户交互行为的。基于网络拓扑结构的计算方法根据节点(如度中心度、紧密中心度)或边(如共同邻居、边界系数)来度量用户影响力。muruganatham等人考虑到每种中心度都有优缺点,所以使用了多种中心度方法来度量用户影响力。browm等通过分析网络的拓扑结构,使用改进的k-壳分解法度量推特用户的影响力。根据推特用户的账号信息,cossu利用用户特征以及推特用户所特有的特征来度量用户影响力,这些特征包括局部拓扑结构、全局拓扑结构以及和网络结构相关的其他特征。不管是基于节点的度量方法还是基于边的度量方法,它们都没有考虑用户行为信息,而是根据网络的拓扑结构简单地度量用户影响力,所以获得的用户影响力的精确度不高。

为了提高计算得到的用户影响力的准确性,研究人员通过分析用户行为来度量用户影响力,例如用户的登录行为、用户产生的信息数量(如评论、转发等)等。通过分析与经济相关的用户行为,bakshy等人根据社会信息计算用户在社会广告中的影响力。而muruganatham等人为了准确度量微博用户的影响力,考虑了网络的拓扑结构和用户行为两方面的因素。类似地,verenich等根据用户数量来度量用户的影响力,在该方法中引入了时间戳信息。rabiger等人提取了一些用户特征(例如,社区结构、活动、发布信息的质量、用户中心度)并使用监督学习方法学习用户影响力。在移动网络中,不仅可以利用用户的基本通信行为,例如语音通信的次数、时长、短信条数来度量用户的影响力,还可以结合微信、qq等即时通信软件中的转发、评论行为来度量用户的影响力。然而,基于网络拓扑结构和基于用户行为的影响力度量方法研究的是用户在网络中所具有的影响力,没有考虑用户间的影响力。

基于用户交互信息的影响力度量方法考虑了用户间的互动行为,例如转发、评论信息。anger等人构建的影响力模型中考虑了用户交流内容以及交互信息。cataldi等人通过分析用户间的交互信息,提出了基于域的用户影响力计算方法。通过分析用户的历史行为日志,利用最大似然估计的思想计算用户间的影响力;通过分析移动数据的特点,提出了基于网络拓扑结构和时间维度的影响力模型,该模型考虑了移动数据的动态性、用户行为以及部分用户交互行为,但是没有考虑上下文信息和用户偏好相似度的影响。

虽然基于用户交互信息的影响力度量方法考虑了用户的交互行为,但大多数都是应用在微信或微博网站中,在移动网络中的相关研究很少。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种设计合理、预测结果准确度高且稳定性强的基于用户间影响力的移动用户偏好预测方法。

本发明解决其技术问题是采取以下技术方案实现的:

一种基于用户间影响力的移动用户偏好预测方法,包括以下步骤:

步骤1、构建移动社会网络:读取移动用户行为数据,量化移动用户间的通信行为,构建以移动用户为节点,用户通信关系为边的移动社会网络;

步骤2、计算用户自身影响力:通过计算并融合基于移动社会网络拓扑结构的影响力和基于移动用户行为的影响力,计算用户自身影响力;

步骤3、计算用户间影响力:根据交互时长和交互次数对用户的各种交互行为进行量化,计算基于用户交互行为的影响力;通过分析移动用户行为,学习基于上下文感知的移动用户偏好,计算基于用户偏好相似度的影响力;并通过融合所述用户自身影响力、基于用户交互行为的影响力和基于用户偏好相似度的影响力,计算用户间影响力;

步骤4、预测移动用户偏好:根据计算得到的用户间影响力,选择目标用户的近似邻居,根据近似邻居的偏好预测目标用户的偏好。

而且,所述步骤1的移动社会网络的构建方法为:使用无向图g(v,e)表示移动社会网络,v表示网络中的节点集合,即移动用户集合;e表示网络中边的集合;用表示量化后的用户通信行为,当大于给定的阈值时,判定用户之间有关系,否则判定用户之间无关系,的计算公式如下:

上式中,ui∈u表示移动用户i,u表示移动用户集合;wl∈wij表示ui和uj使用的交互方式,wij表示ui和uj使用的交互方式的集合;表示ui和uj使用wl交互的时长;表示网络中所有用户使用wl交互时长的平均值;表示ui和uj使用wl交互的次数;表示网络中所有用户使用wl交互次数的平均值;a1和a2分别表示交互时长和交互次数的权重值,且a1+a2=1。

而且,所述步骤2的计算用户自身影响力的具体方法为:首先根据移动社会网络中节点的中心度目标用户和其邻居的平均交互量和目标用户对移动网络服务的使用量确定用户在移动社会网络中的地位,然后计算用户自身的影响力;

所述移动社会网络中节点的中心度的计算公式如下:

上式中,n=|u|表示网络中节点总的数量;ui表示节点ui的邻居集合;

其中,nj的计算公式如下:

上式中,ut表示用户ui通信录中包含的联系人的集合,θ的值被设定在(0,1)上;

所述目标用户和其邻居的平均交互量的计算公式如下:

上式中,ni=|ui|表示用户ui的邻居数量;

所述目标用户对移动网络服务的使用量的计算公式如下:

上式中,ns=|s|表示移动网络服务的种类数,表示用户ui使用过的移动网络服务类型的集合,表示用户ui使用过的移动网络服务的种类数,表示用户ui使用移动网络服务sk的时长,表示用户ui使用移动网络服务sk的次数。

所述用户自身影响力的计算公式如下:

上式中,λ1和λ2表示影响力的权重值,且λ1+λ2=1。

而且,所述步骤3的基于用户交互行为的影响力计算公式如下:

上式中,cr表示上下文实例,c表示上下文实例的集合,表示上下文实例cr的权重值;表示在上下文实例cr约束下,用户ui和用户uj交互行为的量化值,其计算公式如下:

上式中,wijr表示用户ui和用户uj在上下文实例cr约束下使用的交互方式的集合,表示用户ui和用户uj在上下文实例cr约束下使用wl进行交互的时长,表示用户ui和用户uj在上下文实例cr约束下使用wl进行交互的次数;

所述基于用户偏好相似度的影响力计算公式如下:

上式中,si,j表示用户ui和用户uj使用过的相同的移动网络服务的集合,si表示用户ui使用过的移动网络服务的集合,表示用户ui和用户uj的偏好相似度,其计算公式如下:

上式中,si,j,r表示在上下文实例cr约束下用户ui早于用户uj使用的移动网络服务的集合,表示在上下文实例cr约束下用户偏好的平均值,其计算公式如下:

上式中,表示在上下文实例cr约束下用户ui对移动网络服务sk的偏好值,其计算公式如下:

上式中,表示在上下文实例cr约束下用户ui对移动网络服务的sk使用量,其计算公式如下:

上式中,表示在上下文实例cr约束下用户ui对移动网络服务sk的使用时长,表示在上下文实例cr约束下用户ui对移动网络服务sk的使用次数;

所述用户间影响力的计算公式如下:

上式中,λi示影响力的权重值,且λ3+λ4+λ5=1。

而且,所述步骤4的具体方法为:根据计算得到的用户间影响力,选择k个对用户偏好影响最大的近似邻居,然后很据近似邻居的偏好预测目标用户的偏好,该预测目标用户的偏好的计算公式如下:

上式中,表示在上下文实例cr约束下用户ui未使用过,但他的近似邻居使用过的移动网络服务的集合。

本发明的优点和积极效果是:

本发明基于移动网络独有的特征,移动终端不仅为用户提供了通信和获取信息的途径,由于其软硬件的不断完善,还可以通过手机获取用户周围的上下文信息。例如,它不仅可以直接获得显性的上下文信息,例如时间、位置、天气等,通过推导或统计分析,还可以获得隐性的上下文信息,例如用户兴趣、社会关系等;并根据移动终端记录的用户行为,可以获得更真实的社会关系以及更准确地用户影响力,从而可以改善移动用户偏好预测的准确性。

附图说明

图1是本发明的处理流程图。

图2是采用本发明方法在a1被设置在[0,1]区间上,且步长按0.1变化、vthreshold被设置在[0,1]区间上,且步长按0.1变化时获得的结果的对比图;

图3是采用本发明方法在a1被设置在[0,1]区间上,且步长按0.1变化、vthreshold被设置为0.1时获得的结果的对比图;

图4是根据不同的用户偏好预测方法获得的结果的对比图。

具体实施方式

以下结合附图对本发明实施例作进一步详述:

一种基于用户间影响力的移动用户偏好预测方法,如图1所示,包括以下步骤:

步骤1、构建移动社会网络:读取移动用户行为数据,量化移动用户间的通信行为,构建以移动用户为节点,用户通信关系为边的移动社会网络;

所述步骤1的移动社会网络的构建方法为:使用无向图g(v,e)表示移动社会网络,v表示网络中的节点集合,即移动用户集合;e表示网络中边的集合;用表示量化后的用户通信行为,当大于给定的阈值时,判定用户之间有关系,否则判定用户之间无关系,的计算公式如下:

上式中,ui∈u表示移动用户i,u表示移动用户集合;wl∈wij表示ui和uj使用的交互方式,wij表示ui和uj使用的交互方式的集合;表示ui和uj使用wl交互的时长;表示网络中所有用户使用wl交互时长的平均值;表示ui和uj使用wl交互的次数;表示网络中所有用户使用wl交互次数的平均值;a1和a2分别表示交互时长和交互次数的权重值,且a1+a2=1。

在本实施例中,针对移动网络,将每个移动用户作为社会网络中的一个节点,以用户之间的通信行为作为社会网络的一条边,例如:基本的通信方式(语音、短信)和使用即时通信软件的交互(例如qq、微信、飞信、邮箱)。如果量化后的通信行为大于给定的阈值,则判定用户之间存在社会关系,即存在边。在量化用户行为时,不仅考虑了通信时长的影响,还考虑了通信次数的影响。

在本实施例中,设定时长的权重值a1在[0,1]区间上按步长0.1变化,判断用户间是否存在边的阈值vthreshold设定在[0,1]区间上按步长0.1变化,根据实验结果设定为最优值;设定a1在[0,1]区间上,且步长按0.1变化、vthreshold设置为0.1,根据实验结果设定为最优值。

步骤2、计算用户自身影响力:通过计算并融合基于移动社会网络拓扑结构的影响力和基于移动用户行为的影响力,计算用户自身影响力;

所述步骤2的计算用户自身影响力的具体方法为:用户自身影响力用表示,是指在社会网络中,移动用户ui由于自己的行为产生的对其他用户的影响力;用户自身影响力用于宏观地度量影响力。首先根据移动社会网络中节点的中心度目标用户和其邻居的平均交互量和目标用户对移动网络服务的使用量确定用户在移动社会网络中的地位,然后计算用户自身的影响力;

所述移动社会网络中节点的中心度的计算公式如下:

上式中,n=|u|表示网络中节点总的数量;ui表示节点ui的邻居集合;

其中,nj的计算公式如下:

上式中,ut表示用户ui通信录中包含的联系人的集合,θ的值被设定在(0,1)上;

所述目标用户和其邻居的平均交互量的计算公式如下:

上式中,ni=|ui|表示用户ui的邻居数量;

所述目标用户对移动网络服务的使用量的计算公式如下:

上式中,ns=|s|表示移动网络服务的种类数,表示用户ui使用过的移动网络服务类型的集合,表示用户ui使用过的移动网络服务的种类数,表示用户ui使用移动网络服务sk的时长,表示用户ui使用移动网络服务sk的次数。

所述用户自身影响力的计算公式如下:

上式中,λ1和λ2表示影响力的权重值,且λ1+λ2=1。

在本实施例中,所述步骤2的计算用户自身影响力具体包括以下步骤:计算节点的度中心度量化用户的通信行为在这个过程中分区了用户通信录中的联系人和陌生人的影响;量化用户对移动网络服务的使用量根据网络拓扑结构和用户行为计算用户自身影响力,计算公式如下:

根据多次实验结果,将θ设为0.8,λ1和λ2分别设置为0.4和0.6。

步骤3、计算用户间影响力:根据交互时长和交互次数对用户的各种交互行为进行量化,计算基于用户交互行为的影响力;通过分析移动用户行为,学习基于上下文感知的移动用户偏好,计算基于用户偏好相似度的影响力;并通过融合所述用户自身影响力、基于用户交互行为的影响力和基于用户偏好相似度的影响力,计算用户间影响力;

用户间影响力用表示,是指移动用户ui对用户uj的影响力,考虑了用户自身影响力、用户间的交互行为以及用户间共同偏好的影响。用户间影响力用于微观地度量影响力。

(1)所述基于用户交互行为的影响力计算公式如下:

上式中,cr表示上下文实例,c表示上下文实例的集合,表示上下文实例cr的权重值;表示在上下文实例cr约束下,用户ui和用户uj交互行为的量化值,其计算公式如下:

上式中,wijr表示用户ui和用户uj在上下文实例cr约束下使用的交互方式的集合,表示用户ui和用户uj在上下文实例cr约束下使用wl进行交互的时长,表示用户ui和用户uj在上下文实例cr约束下使用wl进行交互的次数。

(2)所述基于用户偏好相似度的影响力计算公式如下:

上式中,si,j表示用户ui和用户uj使用过的相同的移动网络服务的集合,si表示用户ui使用过的移动网络服务的集合,表示用户ui和用户uj的偏好相似度,其计算公式如下:

上式中,si,j,r表示在上下文实例cr约束下用户ui早于用户uj使用的移动网络服务的集合,表示在上下文实例cr约束下用户偏好的平均值,其计算公式如下:

上式中,表示在上下文实例cr约束下用户ui对移动网络服务sk的偏好值,其计算公式如下:

上式中,表示在上下文实例cr约束下用户ui对移动网络服务的sk使用量,其计算公式如下:

上式中,表示在上下文实例cr约束下用户ui对移动网络服务sk的使用时长,表示在上下文实例cr约束下用户ui对移动网络服务sk的使用次数。

(3)所述用户间影响力的计算公式如下:

上式中,λi示影响力的权重值,且λ3+λ4+λ5=1。

在本实施例中,所述步骤3引入了上下文信息,首先对上下文约束下的用户交互行为进行量化计算基于用户交互行为的用户间影响力通过分析上下文约束下的用户行为,对其进行量化并使用对数函数计算基于上下文感知的移动用户偏好在此基础上,引入时间戳信息,计算用户偏好相似度和基于用户偏好相似度的用户间影响力融合计算得到的各种影响力,包括用户自身影响力、基于用户交互行为的影响力和基于用户偏好相似度的影响力,计算用户间影响力的计算公式如下:

根据多次实验结果,a设置为2;在本发明中涉及的上下文实例有30个,因此需要设定的βr的值是30个,具体取值如下表所示;λ3、λ4和λ5分别设置为0.2、0.3和0.5。

步骤4、预测移动用户偏好:根据计算得到的用户间影响力,选择目标用户的近似邻居,根据近似邻居的偏好预测目标用户的偏好。

所述步骤4的具体方法为:根据计算得到的用户间影响力,选择k个对用户偏好影响最大的近似邻居,然后很据近似邻居的偏好预测目标用户的偏好,该预测目标用户的偏好的计算公式如下:

上式中,表示在上下文实例cr约束下用户ui未使用过,但他的近似邻居使用过的移动网络服务的集合。

在本实施例中,所述步骤4对计算得到的用户间影响力进行排序,选择对目标用户影响最大的top-k个用户作为目标用户的近似邻居,根据近似邻居的偏好预测目标用的偏好,计算公式如下:

根据实验结果,k被设置为20。

本实施例中考察在真实数据集上进行实验验证时,相比现有的方法,本发明的优势。

本实施例采用f和均方根误差rsme值来评价预测得到的用户偏好的准确性。f的计算公式如下:

上式中,p表示预测得到的用户偏好的准确率,r表示预测得到的用户偏好的召回率,计算公式如下:

上式中,ntr表示预测得到的正确的用户偏好的数量,nfr表示预测得到的错误的用户偏好的数量,nfn表示没有预测出的用户偏好的数量。

rsme的计算公式如下:

上式中,表示实际的移动用户偏好,表示预测得到的移动用户偏好。

本发明所述一种基于用户间影响力的移动用户偏好预测方法,将移动用户偏好预测方法分为构建移动社会网络、计算用户自身影响力、计算用户间影响力、预测移动用户偏好四个阶段。首先,读取移动数据,构建以移动用户为节点,用户关系为边的移动社会网络。然后,根据构建的移动社会网络以及用户是否在目标用户的通信录中,计算目标用户的度中心度,量化用户的通信行为以及用户对移动网络服务的使用量,在此基础上计算用户自身影响力。其次,通过分析上下文约束下的用户交互行为,计算基于用户交互行为的用户间影响力;通过分析上下文约束下的用户行为,计算基于上下文感知的移动用户偏好,引入时间戳信息,计算用户偏好相似度;计算基于用户偏好相似度的用户间影响力,并融合用户自身影响力和基于用户交互行为的用户间影响力。最后,根据计算得到用户间影响力,选择目标用户的近似邻居,并根据邻居用户的偏好预测目标用户的偏好。

为了证明本发明方法的优势,本文使用麻绳理工公开的真实数据集(包括94个移动用户在9个月内的行为以及上下文信息、朋友信息)进行实验。图2在a1被设置在[0,1]区间上,且步长按0.1变化、vthreshold被设置在[0,1]区间上,且步长按0.1变化时获得的社会关系准确度的对比图。图中可以看出当a1=0.1和a1=0.2,vthreshold=0.2时,获得的结果最好;当a1被设定为其他值时,vthreshold=0.1时,获得的结果最好。因此本发明将vthreshold设定为0.1。

图3在a1被设置在[0,1]区间上,且步长按0.1变化、vthreshold被设置0.1时获得的结果的社会关系准确性的对比图。图中可以看出当a1=0.5时获得的社会关系的精确度最高,因此本实施例中将a1设置为0.5。

图4为采用不同用户偏好预测方法获得的结果。从图4中可以看出,本发明提出的方法可以提高计算预测得到的用户偏好的准确性。

对比方法包括传统的协同过滤方法(cf)、基于矩阵分解的协同过滤方法(mfcf)、引入上下文的协同过滤方法(ccf)、引入用户间信任度的协同过滤方法(tcf)、基于browm等人提出的改进的k-壳分解法的用户偏好预测方法(ksd)、基于刘志鹏等人提出的基于时间的影响力模型的用户偏好预测方法(tig)以及本发明提出的方法(pm)。

与传统的协同过滤方法(cf)相比,本发明提出的方法在f上改进了0.0667,在rmse上减少了0.1325;与mfcf相比,本发明提出的方法在f上改进了0.0427,在rmse上减少了0.0446;与ccf相比,本发明提出的方法在f上改进了0.0739,在rmse上减少了0.1494;与tcf相比,本发明提出的方法在f上改进了0.019,在rmse上减少了0.0078;与ksd相比,本发明提出的方法在f上改进了0.0969,在rmse上减少了0.1633;与tig相比,本发明提出的方法在f上改进了0.0828,在rmse上减少了0.1534。

需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1