一种面向移动社交环境的用户行为预测方法_2

文档序号:9646874阅读:来源:国知局
事务数据表

[0047] 其中,表示一个记录内目标用户上一时刻的业务行为4和当前时刻的业务行 为1,Ik表示用户业务类型,分别表示新闻业务,视频业务,音乐业务,聊天文本业务,游戏 业务,网购业务,j是时间段标号,k是业务类型标号。
[0048] 下面以表1-2所示的事务数据表为例,设最小支持度阈值为20%,利用基于编码 的二维Apriori方法生成频繁项集的过程如下:
[0049] 第一步,扫描事务数据表,对事务项编码,形成项编码表,如表1-3所示:
[0050] 表1-3项编码表
[0051]
[0052] 第二步,根据项的编码计数,得到频繁1-项集Q,如表1-4所示:
[0053] 表1-4生成频繁1-项集Q
[0054]
[0055] 第三步,由Q生成L2,通过"与"运算就可获得结果,不需要重复扫描数据表,如表 1-5所示:
[0056] 表卜5由Q生成L2
[0057]
[0058] 由于本发明采用的基于编码的二维Apriori方法,所以只挖掘到频繁2-项集L2 结束。设最小置信度为75 %,则根据频繁项集求事务数据库D中的所有频繁关联规则, 此时,只需考虑长度大于1的频繁项目集。其中一个频繁集为A={為,,晃:},计算关联规 贝1J:丨'丨二,丨的置信度,其值为100%。根据最小置信度阈值,得到一条频繁关联规则: |為,丨二旧 /2}。频繁关联规则{令}二丨}所表达的含义是当前时刻用户的业务是^,则下 一时刻用户最可能产生的业务为12,两者之间具有一定关联关系。频繁集彳Λ,巧,的支持度 为 3/7。
[0059] 多用户关联分析过程:
[0060] 根据影响力因子公式获得用户m的η个朋友圈用户,然后采用基于编码的二维 Apriori方法将用户m分别及其η个朋友圈用户做关联分析。从挖掘出的频繁集中分析其 他朋友圈用户上一时刻的业务行为及用户m当前时刻的业务行为,从而预测下一时刻用户 m的业务行为。挖掘频繁集的过程与单个用户的业务行为的关联分析过程相同。与此同时, 将其他n-1个用户也分别与用户m做关联分析,挖掘出频繁集,挖掘过程与上述相同。
[0061] 2.朋友圈的划分
[0062] 移动社交环境中的用户通过上网方式与其他用户交互,故可以采用用户的在线时 长和交互次数作指标来划分用户m的η个朋友圈用户,具体划分由公式(1)获得。由于考 虑到实际情况,用户受自身的影响较大,所以用户受自身影响的影响力因子设为1^0= 1。 划分朋友圈用户是多用户关联分析的前提条件,有利于提高预测结果的准确性。
[0063] 3.数据融合
[0064] 为了给用户提供更准确的业务推荐服务,需将获得的η+1个关联分析结果做融合 分析。现将η+1个分析结果视为节点,假设各节点的方差分别为,各个节点支 持度的均值分别设为Xl,x2,....,xn+1,这些值彼此间相互独立,各个节点的权值系数分别为ω1;ω2, . . .,ωη+1,则引入权值系数后,节点的融合值就变为:
[0066] 权值系数4?须满足:
1是节点标号,为正整数,且1 < 1 <n+1。初
将每个朋友圈用户影响力因子与其对应的权值系数中和,则最 终的权值系数为:
[0069] 结合移动社交环境的特点,对每个节点多次采样取平均值,先求出各个节点关于 一个频繁关联规则支持度的方差,再根据式(3)求出各自的权值系数,然后根据(2)式求出 融合后的值X,X即为这个频繁关联规则的最终支持度,X越大则表明这个频繁关联规则发 生的可能性越高。具体的融合框图如图1所示,首先,目标用户与自身做关联分析,其次,目 标用户分别与朋友圈的η个用户做关联分析,最后,将这n+1种关联分析结果融合在一起, 预测目标用户下一时刻的业务行为。
[0070] 本发明即面向移动社交环境的用户行为预测方法具体的流程图如图2所示,实现 过程如下:
[0071] 第一步,通过基于编码的二维Apriori方法研究基于用户自身历史业务行为的关 联分析。
[0072] 第二步:采用影响力因子公式获得目标用户的η个朋友圈用户。
[0073] 第三步:通过基于编码的二维Apriori方法研究基于多用户历史业务行为的关联 分析。
[0074] 第四步:采用基于影响力因子公式改进的最优加权融合方法将n+1个关联分析结 果融合在一起。
[0075] 第五步:由融合结果分析用户的历史业务行为信息,预测其下一时刻的业务行为。
[0076] 本行业的技术人员应了解,本发明不受上述实施例的限制,上述实施例和说明书 中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各 种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由 所附的权利要求书其等效物界定。
【主权项】
1. 一种面向移动社交环境的用户行为预测方法,其特征在于,其具体过程如下: 步骤A,采用基于编码的二维Apriori方法实现用户行为的关联分析,所述用户行为是 指用户的业务行为,包括视频业务行为,新闻业务行为,聊天文本业务行为,所述关联分析 的具体步骤如下: 步骤A-1,将目标用户上一时刻的业务行为及当前时刻的业务行为做关联分析,首先 统计各条记录中目标用户上一时刻和当前时刻产生的业务行为,即各条记录中如果业务 行为发生记为1,不发生记为0,并对统计的数据进行二进制编码处理,然后采用与运算得 到频繁集,进而获得频繁关联规则,由频繁关联规则预测目标用户下一时刻产生的业务行 为; 步骤A-2,将目标用户当前时刻的业务行为分别与所述移动社交环境中的η个朋友圈 用户上一时刻的业务行为做关联分析,首先统计各条记录中目标用户当前时刻产生的业务 行为及所述η个朋友圈用户上一时刻产生的业务行为,即各条记录中,如果业务行为发生 记为1,不发生记为0 ;并对统计的数据进行二进制编码,然后采用编码与运算得到频繁集, 进而可获得频繁关联规则,由频繁关联规则,预测目标用户下一时刻产生的业务行为; 步骤Β,使用影响力因子公式,在目标用户的朋友圈中获得η个朋友圈用户,影响力因 子公式为:其中,7;?,,,,,,表示一个时间段内用户m和用户间的影响力因子;表示一个时间 段内用户m和用户同时在线的在线时长,i是用户标号,为正整数;SNm表示一个时间段内 用户m的在线时长;W(,"。,.)康示一个时间段内用户m和用户η或互的次数,INm表示一个时 间段内用户m总的交互次数;α,β为权重参数,且α+β= 1,α,β通过多次实验获得, 而且影响力因子町,,,,,i的值是介于0和1之间的,由于用户受自身的影响大,所W用户受自 身影响的影响力因子T;m,"〇 = 1 ; 步骤C,将步骤A中获得的n+1个关联分析结果视为n+1个节点,对其进行融合分析; 假设各节点的方差分别为。12,口;2,...吗^+1,各个节点支持度的均值分别设为Xi,X2,....,Xw,运些值彼此间相互独立,各个节点的权值系数分别为《1,《2,...,"。4,贝。 融合分析包含步骤如下: 步骤C-1,对每个节点多次采样取平均值,求出各个节点关于一个频繁关联规则支持度 的方差; 步骤C-2,求出各个节点最终的权值系数巧; 初始权值系数ω1为:则最终的权值系数苗为:其中,1是节点标号,为正整数,且1《1《n+1 ; 步骤C-3,求出节点融合值X;权值系数巧'必须满足:节点融合值X即为运个频繁关联规则的最终支持度, X越大则表明运个频繁关联规则发生的可能性越高,由此针对用户行为关联分析的预测建 模,提高用户行为预测的准确性。
【专利摘要】本发明提出了一种面向移动社交环境的用户行为预测方法。该方法首先通过基于编码的二维Apriori方法实现用户行为的关联分析:一方面将目标用户当前的业务行为及其上一时刻的业务行为做关联分析;另一方面先采用影响力因子公式分离出用户的<i>n</i>个朋友圈用户,获得各用户的影响力因子,然后将目标用户当前的业务行为分别及其<i>n</i>个朋友圈用户上一时刻的业务行为做关联分析;最后,采用基于影响力因子改进的最优加权融合方法将上述<i>n+</i>1个关联分析结果进行融合,预测目标用户下一时刻的业务行为。本发明方法考虑用户受到自身的影响以及朋友圈其他用户对其的影响,对移动社交网络的中用户行为进行预测,可有效地提高预测的准确性,适用于用户业务推荐。
【IPC分类】G06Q10/04, G06Q50/00
【公开号】CN105404943
【申请号】CN201510897272
【发明人】张晖, 王敏
【申请人】南京邮电大学
【公开日】2016年3月16日
【申请日】2015年12月8日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1