一种多媒体文件相关度的确定方法及设备的制造方法_2

文档序号:8487830阅读:来源:国知局
述第一多媒体文件与所述第二多媒体文件的相关度 度量值。
2. 如权利要求1所述的方法,其特征在于,采用如下方式确定所述第一多媒体文件与 所述第二多媒体文件的访问相关度度量值: 针对每个用户的已访问多媒体文件集合,判断该已访问多媒体文件集合是否包含所述 第一多媒体文件和所述第二多媒体文件,若是,则将所述第一多媒体文件和所述第二多媒 体文件的关联访问次数累计一个计数单位; 将所述第一多媒体文件和所述第二多媒体文件的关联访问次数,确定为所述第一多媒 体文件与所述第二多媒体文件的访问相关度度量值。
3. 如权利要求2所述的方法,其特征在于,将所述第一多媒体文件和所述第二多媒体 文件的关联访问次数,确定为所述第一多媒体文件与所述第二多媒体文件的访问相关度度 量值,具体包括: 将所述第一多媒体文件和所述第二多媒体文件的关联访问次数进行归一化处理; 将归一化处理之后得到的归一化关联访问次数,确定为所述第一多媒体文件与所述第 二多媒体文件的访问相关度度量值。
4. 如权利要求1所述的方法,其特征在于,在根据确定的所述融合参数值、所述第一多 媒体文件与所述第二多媒体文件的访问相关度度量值、内容相关度度量值,确定所述第一 多媒体文件与所述第二多媒体文件的相关度度量值之前,还包括: 采用下式建立多媒体文件相关度确定模型: Yj=he(Xj) =Xj9 ; 其中,
表征第一多媒体文件i与任一第二多媒体文件j的相关度,
;表征第一多媒体文件i与任一第二多媒体文件j的内容相关度,#表征 第一多媒体文件i与任一第二多媒体文件j的访问相关度,0= a表征内容相关度度 量参数,0表征访问相关度度量参数,9表征多元特征的相关度度量融合参数,jG[l,n],n表征第二多媒体文件的个数。
5. 如权利要求4所述的方法,其特征在于,采用如下方式确定所述融合参数值: 基于通过相关多媒体文件访问接口进行访问的多媒体文件,为所述多媒体文件相关度 确定模型建立训练样本;并 基于所述训练样本确定所述多媒体文件相关度确定模型中访问相关度和内容相关度 对应的多元特征的相关度度量融合参数的值。
6. 如权利要求5所述的方法,其特征在于,基于通过相关多媒体文件访问接口进行访 问的多媒体文件,为所述多媒体文件相关度确定模型建立训练样本,具体包括: 从通过相关多媒体文件访问接口进行访问的相关多媒体文件对应的原多媒体文件中, 确定预设数量的原多媒体文件作为训练样本; 基于所述训练样本确定所述多媒体文件相关度确定模型中访问相关度和内容相关度 对应的多元特征的相关度度量融合参数的值,具体包括: 针对作为训练样本的每个原多媒体文件,确定该原多媒体文件分别与该原多媒体文件 对应的相关多媒体文件的访问相关度度量值和内容相关度度量值; 确定该原多媒体文件对应的相关多媒体文件通过该原多媒体文件的相关多媒体文件 接口访问的次数;并 将该原多媒体文件对应的相关多媒体文件通过该原多媒体文件的相关多媒体文件接 口访问的次数确定为该原多媒体文件分别与该原多媒体文件对应的相关多媒体文件的相 关度度量值; 根据作为训练样本的各原多媒体文件与各自对应的相关多媒体文件的访问相关度 度量值、内容相关度度量值、相关度度量值、以及多媒体文件相关度确定模型,构造损失函 数; 基于随机梯度下降算法,确定所述多媒体文件相关度确定模型中访问相关度和内容相 关度对应的多元特征的相关度度量融合参数的值。
7. 如权利要求1-6任一项所述的方法,其特征在于,在确定所述第一多媒体文件与所 述第二多媒体文件的相关度度量值之后,还包括: 将至少一个第二多媒体文件中的每个第二多媒体文件确定为所述第一多媒体文件的 相关多媒体文件;并 按照相关度越大排序越靠前的规则,根据所述至少一个第二多媒体文件分别与所述第 一多媒体文件的相关度,对所述至少一个第二多媒体文件进行排序。
8. -种多媒体文件相关度的确定设备,其特征在于,包括: 第一确定模块,用于确定第一多媒体文件与第二多媒体文件的访问相关度度量值、内 容相关度度量值、以及访问相关度和内容相关度对应的多元特征的相关度度量融合参数 值;其中,所述第二多媒体文件为一个或者多个;所述访问相关度用于表征所述第一多媒 体文件和所述第二多媒体文件被关联访问的情况;所述融合参数用于表征访问相关度和内 容相关度分别占的比重; 第二确定模块,用于根据确定的所述融合参数值、所述第一多媒体文件与所述第二多 媒体文件的访问相关度度量值、内容相关度度量值,确定所述第一多媒体文件与所述第二 多媒体文件的相关度度量值。
9. 如权利要求8所述的设备,其特征在于,所述第一确定模块,具体用于采用如下方式 确定所述第一多媒体文件与所述第二多媒体文件的访问相关度度量值:针对每个用户的已 访问多媒体文件集合,判断该已访问多媒体文件集合是否包含所述第一多媒体文件和所述 第二多媒体文件,若是,则将所述第一多媒体文件和所述第二多媒体文件的关联访问次数 累计一个计数单位;将所述第一多媒体文件和所述第二多媒体文件的关联访问次数,确定 为所述第一多媒体文件与所述第二多媒体文件的访问相关度度量值。
10. 如权利要求9所述的设备,其特征在于,所述第一确定模块,具体用于将所述第一 多媒体文件和所述第二多媒体文件的关联访问次数进行归一化处理;将归一化处理之后得 到的归一化关联访问次数,确定为所述第一多媒体文件与所述第二多媒体文件的访问相关 度度量值。
11. 如权利要求8所述的设备,其特征在于,还包括:模型建立模块; 所述模型建立模块,用于在所述第二确定模块确定所述第一多媒体文件与所述第二多 媒体文件的相关度度量值之前,采用下式建立多媒体文件相关度确定模型: Yj=he(Xj) =Xj9 ; 其中,
&表征第一多媒体文件i与任一第二多媒体文件j的相关度,
4表征第一多媒体文件i与任一第二多媒体文件j的内容相关度,^表征 第一多媒体文件i与任一第二多媒体文件j的访问相关度,0= 1,a表征内容相关度度 IP] 量参数,0表征访问相关度度量参数,9表征多元特征的相关度度量融合参数,jG[l,n],n表征第二多媒体文件的个数。
12. 如权利要求11所述的设备,其特征在于,所述第一确定模块,具体用于基于通过相 关多媒体文件访问接口进行访问的多媒体文件,为所述多媒体文件相关度确定模型建立训 练样本;并基于所述训练样本确定所述多媒体文件相关度确定模型中访问相关度和内容相 关度对应的多元特征的相关度度量融合参数的值。
13. 如权利要求12所述的设备,其特征在于,所述第一确定模块,具体用于从通过相关 多媒体文件访问接口进行访问的相关多媒体文件对应的原多媒体文件中,确定预设数量的 原多媒体文件作为训练样本;针对作为训练样本的每个原多媒体文件,确定该原多媒体文 件分别与该原多媒体文件对应的相关多媒体文件的访问相关度度量值和内容相关度度量 值;确定该原多媒体文件对应的相关多媒体文件通过该原多媒体文件的相关多媒体文件接 口访问的次数;并将该原多媒体文件对应的相关多媒体文件通过该原多媒体文件的相关多 媒体文件接口访问的次数确定为该原多媒体文件分别与该原多媒体文件对应的相关多媒 体文件的相关度度量值;根据作为训练样本的各原多媒体文件与各自对应的相关多媒体文 件的访问相关度度量值、内容相关度度量值、相关度度量值、以及多媒体文件相关度确定模 型,构造损失函数;并基于随机梯度下降算法,确定所述多媒体文件相关度确定模型中访问 相关度和内容相关度对应的多元特征的相关度度量融合参数的值。
14.如权利要求8-13任一项所述的设备,其特征在于,还包括:排序模块; 所述排序模块,用于在确定所述第一多媒体文件与所述第二多媒体文件的相关度度量 值之后,将至少一个第二多媒体文件中的每个第二多媒体文件确定为所述第一多媒体文件 的相关多媒体文件;并按照相关度越大排序越靠前的规则,根据所述至少一个第二多媒体 文件分别与所述第一多媒体文件的相关度,对所述至少一个第二多媒体文件进行排序。
【专利摘要】本发明实施例提供了一种多媒体文件相关度的确定方法及设备,包括:确定第一多媒体文件与第二多媒体文件的访问相关度度量值、内容相关度度量值、以及访问相关度和内容相关度对应的多元特征的相关度度量融合参数值;其中,第二多媒体文件为一个或者多个;访问相关度用于表征第一多媒体文件和第二多媒体文件被关联访问的情况;融合参数用于表征访问相关度和内容相关度分别占的比重;根据确定的融合参数值、第一多媒体文件与第二多媒体文件的访问相关度度量值、内容相关度度量值,确定第一多媒体文件与第二多媒体文件的相关度度量值。提高了效率。本发明涉及计算机数据挖掘及机器学习技术领域。
【IPC分类】G06F17-30
【公开号】CN104809165
【申请号】CN201510154127
【发明人】王洁, 李海涛, 宋宪明, 胡娟娟
【申请人】海信集团有限公司
【公开日】2015年7月29日
【申请日】2015年4月2日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1