基于用户转发行为的微博阅读概率计算方法

文档序号:6535918阅读:667来源:国知局
基于用户转发行为的微博阅读概率计算方法
【专利摘要】本发明涉及一种基于用户转发行为的微博阅读概率计算方法,用于计算在一段给定的时间范围(T1,T2)内,一用户H的好友发送的一条微博Wx,其发送时间用tx表示,T1<tx<T2,被用户H阅读的概率,其具体操作步骤如下:首先,在给定的时间范围(T1,T2)内,查找时间tx之前用户H转发的最后一条微博Wi的原始发送时间点ti,以及时间tx之后用户H转发的第一条微博Wj的原始转发时间点tj;同时获取微博Wi的转发时间点ti′,和微博Wj的转发时间点t′j。然后,按照ti、ti′、tj和t′j的时间顺序,将ti、ti′、tj、t′j的关系分为6种情况。最后,分别按照6种情况计算微博Wx被用户H阅读的概率。使用本发明提出的基于用户转发行为的微博阅读概率计算方法计算微博的阅读概率,可以更准确的衡量用户的属性,方便其它微博应用,如:推荐系统、虚拟广告等。
【专利说明】基于用户转发行为的微博阅读概率计算方法
【技术领域】
[0001]本发明涉及一种基于用户转发行为的微博阅读概率计算方法,属于计算机应用【技术领域】。
【背景技术】
[0002]随着在线社交网络的高速发展,微博这种新型的社交网络在人们的生活中发挥着越来越重要的作用。因此,在微博中进行用户行为分析逐渐成为一个新兴的热点研究方向。
[0003]在已有研究中,关于用户行为的分析侧重于在微博中进行统计分析,例如:认证用户的个数、活跃用户的个数、用户的地理位置分布、用户每天发的微博个数与时间的关系、用户回复和转发情况等。在这些统计数据上进一步进行数据挖掘对微博中的应用,如:推荐系统、虚拟广告等都具有重要意义。
[0004]阅读行为和转发行为都属于用户行为。用户阅读其好友所发的微博,同时转发有意义的微博。现实中,用户往往关注许多好友,这些好友每天会发表大量的微博。因此,对一个用户而言,其能够阅读的微博数量巨大,而用户每天有特定的活动规律,因此这些微博中,有些微博有较大的可能性被阅读,而有些微博被阅读的可能性会很低。
[0005]近些年来,虽然研究人员做了大量关于社交网络的研究。但还没有研究人员根据用户的行为,研究其好友所发微博被阅读的概率。早期,研究人员根据用户的被关注程度计算用户的影响力,随后研究人员通过分析用户行为(转发、回复、提到)来计算用户的影响力,结果表明分别通过用户转发行为、用户回复发行为和用户提到(O)行为计算得到的用户影响力结果之间能够很好的相互关联,而这三个结果与通过被关注数计算得到的用户影响力不相关联,这表明通过被关注数计算得到的用户影响力的准确度更低。但分别通过用户转发行为、用户回复发行为和用户提到行为计算得到的用户影响力的方法存在一个明显的缺陷:这些研究没有更深层次的考虑用户的阅读行为。例如:用户每天查看微博的上线习惯。
[0006]用户阅读微博有一定的习惯,例如:当用户在浏览微博时,这些微博是按照时间倒序排列的。通常情况下,用户会从上到下阅读微博。当阅读完一页的时候,通过点击“更多”按钮阅读更早的微博。一旦遇到感兴趣的微博,用户会选择转发。根据这些习惯,2010年CIKM会议上,Zi Yang等人将用户好友所发的微博分为三类:转发、错过、忽略,并将这些习惯作为一个特征,系统的研究了转发行为的内在机制。
[0007]总体而言,已有的研究存在以下问题:
[0008](I)在计算用户影响力时没有考虑用户的行为习惯。导致这种计算方法不能很好的刻画用户的阅读行为。例如在极端情况下,用户好友会发表大量的微博,对用户而言阅读到所有的微博是不可能的。
[0009](2)虽然一些研究考虑了用户的阅读行为习惯,但是没有更深进一步的研究这些阅读习惯。
【发明内容】

[0010]本发明的目的是在于针对现有技术的缺点,提供一种基于用户转发行为的微博阅读概率计算方法。
[0011]一种基于用户转发行为的微博阅读概率计算方法,用于计算在一段给定的时间范围内(用符号(TpT2)表不,其中!、T2之间的时间间隔不小于I小时),一用户(用符号H表示)的好友发送的一条微博(用符号Wx表示,其发送时间用tx表示,T1UxCT2)被用户H阅读的概率(用符号P(Wx)表示),其具体操作步骤如下:
[0012]步骤一、在给定的时间范围(T1J2)内,查找时间仁之前用户H转发的最后一条微博(用符号Wi表不)的原始发送时间点(用符号ti表不,T1Cftx),以及时间tx之后用户H转发的第一条微博(用符号I表示)的原始转发时间点(用符号h表示,WT2);同时获取微博Wi的转发时间点(用符号t/表示,T1Ui' <τ2)和微博I的转发时间点(用符号t' J表示,T1U/ <T2)o
[0013]步骤二、在步骤一操作的基础上,按照微博Wi的原始发送时间点转发时间点t/,以及微博Wj的原始发送时间点tj和转发时间点t' j的时间顺序,将W、tj、t' j的关系分为以下6种情况:
[0014]情况I<T2 ;
[0015]情况2 = Wt/j<T2 ;
[0016]情况3 = WW <t’」〈Τ2。
[0017]情况4:在时间范围(TpT2)内,在时间tx之前未查找到用户H转发的最后一条微博Wi,即不存在\和^,但在时间^之后查找到用户H转发的第一条微博Wp且
Wt,j<T2 ;
[0018]情况5:在时间范围(T1J2)内,在时间tx之后未查找到用户H转发的第一条微博%,即不存在&和t' P但在时间^之前查找到用户H转发的最后一条微博Wi,且Wt/ <τ2 ;
[0019]情况6:在时间范围(T1J2)内,在时间tx之前未查找到用户H转发的最后一条微博1,同时在时间tx之后未查找到用户H转发的第一条微博Wp即tpt/、tpt' ^都不存在。
[0020]步骤三、在步骤二操作的基础上,当微博Wi的原始发送时间点转发时间点t/、微博I的原始发送时间点h和转发时间点t' ^之间的关系为步骤二中所述情况I时,则认为用户11在ti ^tx ^ tj时间范围内持续在阅读微博,因此判断用户H—定能阅读到微博Wx,因此微博Wx被用户H阅读的概率函数如公式(I)所示。
[0021]P(Wx)=I (I)
[0022]步骤四、在步骤二操作的基础上,当微博Wi的原始发送时间点转发时间点t/、微博%的原始发送时间点&和转发时间点t' ^之间的关系为步骤二中所述情况2时,则认为用户H在时间范围内有2次阅读过程。所述一次阅读过程是指在一段连续的时间范围内,用户持续在微博页面上从上向下阅读微博的过程。
[0023]用户H在Ui, t’ j)时间范围内的第1次阅读过程的开始时间为Ui, t/ )中的某一时刻,在此阅读过程中用户H转发了微博Wi ;用户H在(t” t'j)时间范围内的第2次阅读过程的开始时间为中的某一时刻,在此阅读过程中用户H转发了微博%。[0024]在第1次阅读过程中,用户在t/时刻转发了发布在\时刻的微博Wi,因此微博Wi被用户H读到的概率为I。由于第1次阅读过程的开始时间在\与^之间,因此,发布在t/时刻的微博在第1次阅读过程中被用户的读到的概率为O。因此,当IiStxSt/时,微博Wx被用户H阅读的概率函数是递减的,微博Wx被用户H阅读的概率可通过公式(2)得到。
[0025]
【权利要求】
1.一种基于用户转发行为的微博阅读概率计算方法,用于计算在一段给定的时间范围内,一用户H的好友发送的一条微博Wx,被用户H阅读的概率P(Wx),其中:一段给定的时间范围用符号(T1J2)表示,?\、Τ22间的时间间隔不小于I小时;微博Wx的发送时间用仁表示,T1U^T2 ;其特征在于:其具体操作步骤如下: 步骤一、在给定的时间范围(T1J2)内,查找时间^之前用户H转发的最后一条微博Wi的原始发送时间点以及时间仁之后用户H转发的第一条微博Wj的原始转发时间点\_,tx<tj<T2 ;同时获取微博Wi的转发时间点\',T^ti' <T2和微博Wj的转发时间点t' yt/ <τ2 ; 步骤二、在步骤一操作的基础上,按照微博Wi的原始发送时间点转发时间点t/,以及微博%的原始发送时间点&和转发时间点t' d勺时间顺序,将W、tpt' j的关系分为以下6种情况: 情况 ?」〈ν <τ2 ; 情况 2 = WV j<T2 ;
情况 3 = WW <t’ j<T2 ;情况4:在时间范围(TpT2)内,在时间仁之前未查找到用户H转发的最后一条微博Wi,即不存在\和t/,但在时间tx之后查找到用户H转发的第一条微博%,且T1UffT2 ;情况5:在时间范围(TpT2)内,在时间仁之后未查找到用户H转发的第一条微博%,SP不存在&和t' P但在时间tx之前查找到用户H转发的最后一条微博Wi,且T1UZV <T2 ;情况6:在时间范围(TpT2)内,在时间仁之前未查找到用户H转发的最后一条微博Wi,同时在时间tx之后未查找到用户H转发的第一条微博%,即tpt/、tpt' ^都不存在;步骤三、在步骤二操作的基础上,当微博Wi的原始发送时间点转发时间点、微博%的原始发送时间点和转发时间点t' j之间的关系为步骤二中所述情况I时,则认为用户11在\ ^tx ^ tj时间范围内持续在阅读微博,因此判断用户H—定能阅读到微博Wx,因此微博Wx被用户H阅读的概率函数如公式(I)所示; P(Wx)=I Cl) 步骤四、在步骤二操作的基础上,当微博Wi的原始发送时间点转发时间点、微博%的原始发送时间点和转发时间点t' j之间的关系为步骤二中所述情况2时,则认为用户H在(t” t’ j)时间范围内有2次阅读过程;所述一次阅读过程是指在一段连续的时间范围内,用户持续在微博页面上从上向下阅读微博的过程; 用户H在时间范围内的第1次阅读过程的开始时间为中的某一时亥IJ,在此阅读过程中用户H转发了微博Wi ;用户H在(t” t'j)时间范围内的第2次阅读过程的开始时间为中的某一时刻,在此阅读过程中用户H转发了微博Wj; 在第1次阅读过程中,用户在t/时刻转发了发布在\时刻的微博Wi,因此微博1被用户H读到的概率为I ;由于第1次阅读过程的开始时间在\与^之间,因此,发布在V时刻的微博在第1次阅读过程中被用户的读到的概率为O ;因此,当\≤tx≤t/时,微博Wx被用户H阅读的概率函数是递减的,微博Wx被用户H阅读的概率可通过公式(2)得到;

t.——T.1 I在第2次阅读过程中,用户在t/时刻转发了发表在时刻的微博%,因此微博Wj被用户H读到的概率为I ;由于用户在前一次阅读过程中已经阅读了发布在t时刻的微博,因此,在此次阅读过程中,\时刻和早于\时刻的微博的阅读概率都为O ;因此,当ti≤ tx ≤tj,微博Wx被用户H阅读的概率函数可通过公式(3)计算得到;
【文档编号】G06F17/30GK103761292SQ201410020499
【公开日】2014年4月30日 申请日期:2014年1月16日 优先权日:2014年1月16日
【发明者】宋丹丹, 杜建光, 廖乐健, 礼欣 申请人:北京理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1