一种面向网络电视用户的时序主题偏好预测方法与流程

文档序号:12279755阅读:来源:国知局

技术特征:

1.一种面向网络电视用户的时序主题偏好预测方法,其特征在于,包括以下步骤:

1)通过网络电视运营商服务器抓取用户d天内观看网络电视节目的基本数据,其中每一天的记录时间为00:00:00到23:59:59;

2)、针对抓取的基本数据设置电视节目观看最小时间tmin、时间区间长度L、电视节目的主题Tk(k=1,2,...n)的数量n;

3)、根据用户观看每条电视节目的起始时间和结束时间分别计算出每条电视节目的观看时间t,如果t<tmin,则删除该条电视节目;

4)、将d天的每一天按照从00:00:00到23:59:59依次等分成N个时间片段,从而得到d天的时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i},其中sj,i表示第i(i=1,2,...d)天的第j(j=1,2,...N)个时间片段,sj={sj,1,sj,2,...sj,i}表示第j(j=1,2,...N)个时间片段,通过时间片段集Sj,i={s1,1,s1,2,...s1,i,s2,1,s2,2,...s2,i,...sj,2,...sj,i}与用户观看电视节目的天数d构建得到用户d天观看的电视节目集Q={q1,1,q1,2,...q1,j,q2,1,q2,2,...q2,j,...qi,2,...qi,j},其中,qi,j表示该用户在第i天的第j个时间片段sj,i里观看的电视节目集;

5)、利用隐含狄利克雷分布(LDA)模型对电视节目集Q进行分析,得到n个关于电视节目的主题Tk(k=1,2,...n),以及每个电视节目分别落在主题Tk(k=1,2,...n)下的概率TPP={P1,1,…P1,k,…,P1,n,…,Pp,1,…Pp,k,…,Pp,n},其中,Pp,k表示电视节目p落在主题Tk下的概率;

6)、对每个主题Tk(k=1,2,...n)下的电视节目按照其在该主题Tk(k=1,2,...n)下的概率TPP从大到小依次进行排序,选取该主题Tk(k=1,2,...n)下前5个电视节目作为该主题Tk(k=1,2,...n)下隐含的偏好电视节目,并将该偏好电视节目的特征作为该主题Tk(k=1,2,...n)隐含的特征;

7)、对于步骤4中得到的每个用户观看电视节目集Q的每个元素qi,j中的电视节目p,根据其在n个主题Tk(k=1,2,...n)下的概率分布为{Pp,1,…,Pp,n},当则将该电视节目p替换为其对应的主题Tk(k=1,2,...n);

8)、根据得到用户在各个时间片段中各个主题Tk(k=1,2,...n)的分布比例,其中,Count(Tk|sj)表示主题Tk(k=1,2,...n)在第j个时间片段sj={sj,1,sj,2,...sj,i}出现的总次数;

9)、将步骤9中得到的该用户在第j个时间片段sj={sj,1,sj,2,...sj,i}里观看的主题Tk(k=1,2,...n)的分布比例按照从大到小进行排序,选取前m个分布比例累加和大于0.8的主题Tk(k=1,2...n)作为用户在该时间片段sj={sj,1,sj,2,...sj,i}内的偏好主题,从而得到每个时间片段的m个偏好主题;

10)、将步骤9中得到的每个时间片段的偏好主题以及该偏好主题下的5个偏好电视节目、偏好节目特征作为预测结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1