一种视频终端用户的兴趣识别方法及装置的制造方法_5

文档序号:9220132阅读:来源:国知局
述全局特征矩阵中每一个行号对应 一个终端标识时,所述对所述全局特征矩阵进行聚类,获得至少一个聚类结果,具体包括: 针对所述全局特征矩阵的每一个元素,由该元素的值、以及该元素所在的行号和列号, 组成一个三元组;并,删除元素的值为O的三元组; 对于剩余的每个三元组,将该三元组视为一个待配对单位,将该三元组的列号视为配 对标识,将具有不同配对标识的待配对单位两两配为一对,生成以配对后的待配对标识为 关键字key、以行号为值的二元组; 取出所有key相同的二元组组成二元组集合;并, 针对每个二元组集合,若该二元组集合中的二元组个数小于n,则删除该二元组集合; 对于剩余的每个二元组集合,将该二元组集合中的每个二元组进行倒置,得到以行号 为key、以配对后的配对标识为值的倒置二元组;以及,当该二元组集合中包括至少m个列 号时,将该二元组集合作为一个聚类结果; 将每个倒置二元组视为一个待配对单位、并将每个倒置二元组的值视为配对标识,返 回所述将具有不同配对标识的待配对单位两两配为一对,生成以配对后的待配对标识为key、以行号为值的二元组的步骤;并在循环执行指定的次数时结束操作。4. 根据权利要求1所述的方法,其特征在于,所述根据每个组合结果在每个设定时间 区间的播放时长之和,构建用户兴趣随时间的变化模型之后,所述方法还包括: 对所述至少一个视频终端的三维对应关系进行聚类,得到三维聚类结果;其中,每一个 三维聚类结果,不同视频终端的同一组合结果的同一设定时间区间的播放时长之和的差值 小于等于预设时长差值,且类成员数大于预设类成员数; 对于每一个三维聚类结果,取其聚类中心的三维对应关系作为该三维聚类结果所表示 的一类视频终端的用户的视频兴趣模式。5. 根据权利要求1所述的方法,其特征在于,所述根据每个组合结果在每个设定时间 区间的播放时长之和,构建用户兴趣随时间的变化模型,该用户兴趣随时间的变化模型中 包括组合结果对应的预设兴趣模型、设定时间区间和播放时长之和之间的三维对应关系, 具体包括: 构建维数为P*q的全〇兴趣-时间分布向量,其中,P为预设兴趣模型的个数,q为所述 指定时间段包括设定时间区间的个数;且预设兴趣模型在兴趣-时间分布向量的排列顺序 与在预设兴趣模型构成的兴趣列表中的排序相同;其中,组合结果按照设定顺序进行排序, 预设时间区间按照时间先后进行排序; 若视频终端的第j个组合结果对应的预设兴趣模型在兴趣列表中的排序为k,且第j个组合结果在第s个预设时间区间的播放时长之和为t>,则将兴趣-时间分布向量的第 p*(k_l)+s维的值更新为tjs;其中,p、q、j、k、s均为大于等于1的整数。6. -种视频终端用户的兴趣识别装置,其特征在于,所述装置包括: 获取模块,用于针对至少一个视频终端中的每一个视频终端,获取该视频终端的指定 时间段内的用户操作记录,所述用户操作记录中包括:播放过的各视频的视频标识、以及 各视频的开始播放时间和结束播放时间;其中,所述指定时间段包括至少两个设定时间区 间; 组合模块,用于根据预设兴趣模型包括的视频标识集合对操作记录中的视频标识进行 组合,得到至少一个组合结果,使得每一个组合结果对应一个预设兴趣模型,且每个组合结 果与对应的预设兴趣模型所包括的视频标识集合相同;其中,预设兴趣模型用于表示一类 用户的兴趣点为该视频兴趣模型中的视频标识集合对应的视频; 时长统计模块,用于针对每个组合结果中的每个视频标识对应的视频,根据该视频的 开始播放时间和结束播放时间,计算该视频在每个设定时间区间中的播放时长; 时长和计算模块,用于计算每个组合结果中的所有视频标识对应的视频,在每个设定 时间区间的播放时长之和; 三维对应关系建立模块,用于根据每个组合结果在每个设定时间区间的播放时长之 和,构建用户兴趣随时间的变化模型,该用户兴趣随时间的变化模型中包括组合结果对应 的预设兴趣模型、设定时间区间和播放时长之和之间的三维对应关系。7. 根据权利要求6所述的装置,其特征在于,所述装置还包括: 集合记录获取模块,用于获取至少两个视频终端中的每个视频终端的预设时长内的用 户行为记录,所述用户行为记录中包括:终端标识、播放过的各视频的视频标识; 全局特征向量构建模块,用于根据用户行为记录中的终端标识以及视频标识,构造与 所述视频终端集合对应的全局特征矩阵;其中,全局特征矩阵中各元素的取值为O或1,元 素取值为O时,表示该元素对应终端标识对应的视频终端未播放过该元素对应视频标识对 应的视频;元素取值为1时,表示该元素对应终端标识对应的视频终端播放过该元素对应 视频标识对应的视频; 聚类模块,用于对所述全局特征矩阵进行聚类,获得至少一个聚类结果;其中,每个聚 类结果表示至少n个终端标识和至少m个视频标识的对应关系,该对应关系用于表示所述 至少n个终端标识对应的视频终端均播放过所述至少m个视频标识对应的视频,其中,n、m 均为大于O的整数。8. 根据权利要求7所述的装置,其特征在于,所述聚类模块,具体包括: 优化单元,用于当所述全局特征矩阵中每一个行号对应一个终端标识时,针对所述全 局特征矩阵的每一个元素,由该元素的值、以及该元素所在的行号和列号,组成一个三元 组;并,删除元素的值为O的三元组; 配对单元,用于对于剩余的每个三元组,将该三元组视为一个待配对单位,将该三元组 的列号视为配对标识,将具有不同配对标识的待配对单位两两配为一对,生成以配对后的 待配对标识为关键字key、以行号为值的二元组; 二元组集合形成单元,用于取出所有key相同的二元组组成二元组集合; 删除单元,用于针对每个二元组集合,若该二元组集合中的二元组个数小于n,则删除 该二元组集合; 处理单元,用于对于剩余的每个二元组集合,将该二元组集合中的每个二元组进行倒 置,得到以行号为key、以配对后的配对标识为值的倒置二元组;以及,当该二元组集合中 包括至少m个列号时,将该二元组集合作为一个聚类结果; 执行单元,用于将每个倒置二元组视为一个待配对单位、并将每个倒置二元组的值视 为配对标识,触发所述配对单元执行操作;并在循环执行指定的次数时结束操作。9. 根据权利要求6所述的装置,其特征在于,所述装置还包括: 优化聚类模块,用于所述三维对应关系建立模块根据每个组合结果在每个设定时间区 间的播放时长之和,构建用户兴趣随时间的变化模型之后,对所述至少一个视频终端的三 维对应关系进行聚类,得到三维聚类结果;其中,每一个三维聚类结果,不同视频终端的同 一组合结果的同一设定时间区间的播放时长之和的差值小于等于预设时长差值,且类成员 数大于预设类成员数; 聚类代表选择模块,用于对于每一个三维聚类结果,取其聚类中心的三维对应关系作 为该三维聚类结果所表示的一类视频终端的用户的视频兴趣模式。10. 根据权利要求6所述的装置,其特征在于,所述三维对应关系建立模块,具体包括: 构建单元,用于构建维数为p*q的全0兴趣-时间分布向量,其中,P为预设兴趣模型 的个数,q为所述指定时间段包括设定时间区间的个数;且预设兴趣模型在兴趣-时间分布 向量的排列顺序与在预设兴趣模型构成的兴趣列表中的排序相同;其中,组合结果按照设 定顺序进行排序,预设时间区间按照时间先后进行排序; 生成单元,用于若视频终端的第j个组合结果对应的预设兴趣模型在兴趣列表中的排 序为k,且第j个组合结果在第s个预设时间区间的播放时长之和为tjs,则将兴趣-时间分 布向量的第P*(k_l)+s维的值更新为tjs;其中,p、q、j、k、s均为大于等于1的整数。
【专利摘要】本发明涉及一种视频终端用户的兴趣识别方法及装置,该方法包括:针对至少一个视频终端中的每一个视频终端,获取该视频终端的指定时间段内的用户操作记录;其中,指定时间段包括至少两个设定时间区间;根据预设兴趣模型包括的视频标识集合对操作记录中的视频标识进行组合,得到至少一个组合结果;针对每个组合结果中的每个视频标识对应的视频,根据该视频的开始播放时间和结束播放时间,计算该视频在每个设定时间区间中的播放时长;并,计算每个组合结果中的所有视频标识对应的视频,在每个设定时间区间的播放时长之和;根据每个组合结果在每个设定时间区间的播放时长之和,构建用户兴趣随时间的变化模型。本发明的方法适用范围更广。
【IPC分类】H04N21/258, H04N21/433
【公开号】CN104935967
【申请号】CN201510346531
【发明人】王炳飞
【申请人】北京数码视讯科技股份有限公司
【公开日】2015年9月23日
【申请日】2015年6月19日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1