一种多媒体数据处理方法及其设备的制造方法

文档序号:10655160阅读:472来源:国知局
一种多媒体数据处理方法及其设备的制造方法
【专利摘要】本发明实施例公开一种多媒体数据处理方法及其设备,其中方法包括如下步骤:基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息;采用RBM模型,并根据所述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应的第二多媒体数据的数据信息;根据所述目标用户标识对应的第二多媒体数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输出;其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒体数据为未操作的多媒体数据。采用本发明,可以最大化还原原始的输入数据,提高求解结果的稳定性。
【专利说明】
-种多媒体数据处理方法及其设备
技术领域
[0001] 本发明设及计算机技术领域,尤其设及一种多媒体数据处理方法及其设备。
【背景技术】
[0002] 协同过滤在音乐个性化领域中被广泛应用于挖掘用户对歌曲的喜好评分,但基于 Item-Based和User-Based的最近邻协同过滤方法仅仅应用于在浅层次中比较观察听歌流 水和操作数据,然后显示求取用户的相似偏好,无法挖掘深层次的用户关系数据,即无法获 取数据内部的潜因子。
[0003] 而采用奇异值分解(Singular Value Decomposition,SVD)的协同过滤方法,通过 利用矩阵分解技术可W将User-Item矩阵分解为两个小矩阵,每个小矩阵分别对应于用户 和物品的隐特征向量矩阵,W此求取数据内部的潜因子。然而,由于模型的输入数据较为稀 疏,从而导致优化的目标函数退化为一个非凸优化问题,所求解的结果是局部最优解,同时 也容易产生过拟合现象,导致所求取的潜因子与用户的实际情况有较大的偏差。

【发明内容】

[0004] 本发明实施例提供一种多媒体数据处理方法及其设备,可W最大化还原原始的输 入数据,提高求解结果的稳定性。
[0005] 本发明实施例第一方面提供了一种多媒体数据处理方法,可包括:
[0006] 基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息;
[0007] 采用受限玻尔兹曼机神经网络(Restricted Boltzmann Machine,RBM)模型,并根 据所述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应的第 二多媒体数据的数据信息;
[000引根据所述目标用户标识对应的第二多媒体数据的数据信息,对所述目标用户标识 对应的第二多媒体数据进行输出;
[0009] 其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒体数据为未操 作的多媒体数据。
[0010] 本发明实施例第二方面提供了一种多媒体数据处理设备,可包括:
[0011] 第一信息获取单元,用于基于多媒体交互应用获取目标用户标识对应的第一多媒 体数据的数据信息;
[0012] 第二信息获取单元,还用于采用RBM模型,并根据所述目标用户标识对应的第一多 媒体数据的数据信息,获取所述目标用户标识对应的第二多媒体数据的数据信息;
[0013] 第一数据输出单元,用于根据所述目标用户标识对应的第二多媒体数据的数据信 息,对所述目标用户标识对应的第二多媒体数据进行输出;
[0014] 其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒体数据为未操 作的多媒体数据。
[0015] 在本发明实施例中,通过将目标用户的已操作的多媒体数据的数据信息作为输入 数据,并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取,并最终 实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM 模型对未操作的多媒体数据的数据信息进行求取,能够最大化还原原始的输入数据,克服 了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果的影响,提高了求解结果 的稳定性。
【附图说明】
[0016] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W 根据运些附图获得其他的附图。
[0017] 图1是本发明实施例提供的一种多媒体数据处理方法的流程示意图;
[0018] 图2是本发明实施例提供的另一种多媒体数据处理方法的流程示意图;
[0019]图3是本发明实施例提供的一种RBM模型的举例示意图;
[0020] 图4是本发明实施例提供的一种多媒体数据处理设备的结构示意图;
[0021] 图5是本发明实施例提供的另一种多媒体数据处理设备的结构示意图;
[0022] 图6是本发明实施例提供的第一数据输出单元的结构示意图;
[0023] 图7是本发明实施例提供的又一种多媒体数据处理设备的结构示意图。
【具体实施方式】
[0024] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0025] 本发明实施例提供的多媒体数据处理方法可W应用于对多媒体交互应用的多媒 体数据进行数据信息求取W及数据输出的场景,例如:多媒体数据处理设备基于多媒体交 互应用获取目标用户标识对应的第一多媒体数据的数据信息,所述多媒体数据处理设备采 用RBM模型,并根据所述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用 户标识对应的第二多媒体数据的数据信息,所述多媒体数据处理设备根据所述目标用户标 识对应的第二多媒体数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输 出的场景等。通过采用RBM模型对未操作的多媒体数据的数据信息进行求取,能够最大化还 原原始的输入数据,克服了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果 的影响,提高了求解结果的稳定性。
[0026] 本发明实施例设及的多媒体数据处理设备可W为多媒体交互应用对应的后台服 务器,用于存储多媒体数据库、获取具备多媒体交互应用的用户终端上传的多媒体数据的 数据信息、向所述用户终端推送多媒体数据等;所述用户终端可W包括:平板电脑、智能手 机、掌上电脑W及移动互联网设备(MID)等终端设备;所述多媒体数据可W包括图片、视频、 音乐等数据,优选的,多媒体数据存在对应的数据标识,针对每一个用户终端,可W使用预 先分配的用户标识登录所述多媒体交互应用,W对多媒体数据库中的多媒体数据进行操 作,同时,针对每一个用户标识,所述多媒体数据库中的多媒体数据可W分类为第一多媒体 数据和第二多媒体数据,其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒 体数据为未操作的多媒体数据,操作包括但不限于数据浏览、数据下载、数据删除、数据收 藏等。
[0027] 下面将结合附图1和附图2,对本发明实施例提供的一种多媒体数据处理方法进行 详细介绍。
[0028] 请参见图1,为本发明实施例提供了一种多媒体数据处理方法的流程示意图。如图 1所示,本发明实施例的所述方法可W包括W下步骤SlOl-步骤S103。
[0029] SlOl,基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信 息;
[0030] 具体的,多媒体数据处理设备可W基于多媒体交互应用获取目标用户标识对应的 第一多媒体数据的数据信息,所述数据信息优选为根据目标用户标识记录的对多媒体数据 的操作情况所确定的评分数值,所述多媒体数据处理设备可W预先获取目标用户标识对应 记录的对多媒体数据的操作情况,并根据所述对多媒体数据的操作情况确定所述目标用户 标识对所述多媒体数据的数据信息,例如:针对数据下载的操作对应的数据信息为4分、针 对数据删除的操作对应的数据信息为0分、针对数据收藏的操作对应的数据信息为3分等。
[0031] S102,采用RBM模型,并根据所述目标用户标识对应的第一多媒体数据的数据信 息,获取所述目标用户标识对应的第二多媒体数据的数据信息;
[0032] 具体的,所述多媒体数据处理设备可W采用预先训练好的RBM模型,并根据所述目 标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应的第二多媒体 数据的数据信息。
[0033] 对所述RBM模型进行训练的过程可W为:所述多媒体数据处理设备基于多媒体交 互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息,优选 的,所述多媒体数据处理设备获取的至少一个用户标识为所述多媒体交互应用下的所有用 户标识,当然,为了保证在进行RBM模型训练时的输入数据的可靠性,W及提高RBM模型训练 的效率,所述多媒体数据处理设备获取的至少一个用户标识也可W为所述多媒体数据处理 设备基于活跃用户条件在所述所有用户标识中筛选出的至少一个用户标识。所述多媒体数 据处理设备可W根据所述每个用户标识对应的第一多媒体数据的数据信息,计算RBM模型 的权重参数值,可W理解的是,所述RBM模型包括可视层结点和隐藏层结点,所述权重参数 值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量W及隐藏层结点间 的偏移量,进一步的,所述多媒体数据处理设备可W将所述每个用户标识对应的第一多媒 体数据的数据信息转换为所述可视层结点,所述多媒体数据处理设备可W将所述每个用户 标识对应的第一多媒体数据的数据信息转化为一个数组,W此作为RBM模型训练的初始的 输入数据。所述多媒体数据处理设备可W采用对比散度算法对可视层结点和隐藏层结点进 行迭代编解码处理,可W理解的是,所述可视层结点的个数是由所述每个用户标识对应的 第一多媒体数据的数量决定的,所述隐藏层结点的个数为经验值,当迭代编解码处理后得 到的处理结果满足预设条件时,所述多媒体数据处理设备可W获取迭代编解码处理后的所 述RBM模型的权重参数值,所述多媒体数据处理设备将所述权重参数值添加至所述RBM模型 中。
[0034] 当训练好所述RBM模型后,所述多媒体数据处理设备可W将所述目标用户标识对 应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点,对所述第一可视层结点 进行编码处理W生成第一隐藏层结点对应的潜因子向量,所述多媒体数据处理设备对所述 第一隐藏层结点对应的潜因子向量进行解码处理W生成第二可视层结点,此时需要按照多 媒体数据的数量进行解码处理,所述多媒体数据处理设备在所述目标用户标识对应的每个 多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒体数据的数据信息。
[0035] S103,根据所述目标用户标识对应的第二多媒体数据的数据信息,对所述目标用 户标识对应的第二多媒体数据进行输出;
[0036] 具体的,所述多媒体数据处理设备可W根据所述目标用户标识对应的第二多媒体 数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输出,优选的,所述多媒 体数据处理设备可W对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排 序,在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体 数据,所述多媒体数据处理设备对所述预设数量的多媒体数据进行输出,优选的,所述多媒 体数据处理设备将所述预设数量的多媒体数据输出至使用所述目标用户标识登录所述多 媒体交互应用的用户终端。
[0037] 在本发明实施例中,通过将目标用户的已操作的多媒体数据的数据信息作为输入 数据,并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取,并最终 实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM 模型对未操作的多媒体数据的数据信息进行求取,能够最大化还原原始的输入数据,克服 了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果的影响,提高了求解结果 的稳定性。
[0038] 请参见图2,为本发明实施例提供了另一种多媒体数据处理方法的流程示意图。如 图2所示,本发明实施例的所述方法可W包括W下步骤S201-步骤S209。
[0039] S201,基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多 媒体数据的数据信息;
[0040] 具体的,多媒体数据处理设备基于多媒体交互应用获取至少一个用户标识中每个 用户标识对应的第一多媒体数据的数据信息,所述数据信息优选为根据目标用户标识记录 的对多媒体数据的操作情况所确定的评分数值,优选的,所述多媒体数据处理设备获取的 至少一个用户标识为所述多媒体交互应用下的所有用户标识,当然,为了保证在进行RBM模 型训练时的输入数据的可靠性,W及提高RBM模型训练的效率,所述多媒体数据处理设备获 取的至少一个用户标识也可W为所述多媒体数据处理设备基于活跃用户条件在所述所有 用户标识中筛选出的至少一个用户标识,例如:所述多媒体数据处理设备可W获取所述多 媒体交互应用下的所有用户标识的多媒体数据的流水数据,提取在3个月内,至少有10天进 行过数据浏览的操作,且每天浏览的多媒体数据不少于10个的至少一个用户标识等。所述 多媒体数据处理设备可W预先获取所有用户标识中每个用户标识对应记录的对多媒体数 据的操作情况,并根据所述对多媒体数据的操作情况确定所述每个用户标识对所述多媒体 数据的数据信息。
[0041] S202,根据所述每个用户标识对应的第一多媒体数据的数据信息,计算RBM模型的 权重参数值;
[0042] 具体的,所述多媒体数据处理设备可W根据所述每个用户标识对应的第一多媒体 数据的数据信息,计算RBM模型的权重参数值,可W理解的是,所述RBM模型包括可视层结点 和隐藏层结点,所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点 间的偏移量W及隐藏层结点间的偏移量,优选的,所述可视层结点用于表述所述每个用户 标识对应的第一多媒体数据的数据信息,所述隐藏层结点用于表述所述每个用户标识对应 的第一多媒体数据对应的抽象的隐形特征,例如:音乐数据的旋律、曲风、音律等抽象特征。 进一步的,所述多媒体数据处理设备可W将所述每个用户标识对应的第一多媒体数据的数 据信息转换为所述可视层结点,所述多媒体数据处理设备可W将所述每个用户标识对应的 第一多媒体数据的数据信息转化为一个数组,例如:评分数值的取值区间为0-4分,假设某 用户标识S对数据标识为1的第一多媒体数据的评分数值为3分,则对应转换的可视层结点 为(0,1,0,0,0),对数据标识为4的第一多媒体数据的评分数值为1分,则对应转换的可视层 结点为(〇,〇,〇,1,〇),对数据标识为5的第一多媒体数据的评分数值为4分,则对应转换的可 视层结点为(1,〇,〇,〇,〇)等,所述多媒体数据处理设备可W将上述得到的可视层结点转化 为一个数组(例如:矩阵),W此作为RBM模型训练的初始的输入数据。当然,上述评分数值的 取值区间W及可视层结点的维数的表达方式仅为举例,可W根据实际的应用需求,对取值 区间进行调整,同时对应调整可视层结点的维数等,针对不同取值区间W及不同的可视层 结点的维数,均可W执行本发明实施例的RBM模型的训练过程。
[0043] 所述多媒体数据处理设备可W采用对比散度算法对可视层结点和隐藏层结点进 行迭代编解码处理,可W理解的是,所述可视层结点的个数是由所述每个用户标识对应的 第一多媒体数据的数量决定的,所述隐藏层结点的个数为经验值,假设连接可视层结点和 隐藏层结点的权重值为W、可视层结点间的偏移量Visbias W及隐藏层结点间的偏移量 hi化ias,则可W得到下述公式:
[0047] 其中,W为一个a*b*c的S维矩阵,a是第一多媒体数据的数量,b是评分数值的取值范围,C是隐藏层结点的个数;表示可视层结点的数组中第i列第j行的子结点与隐藏层
[0044]
[0045]
[0046] 结点中的第k个结点的连线的权重;t和t+1可W表示连续两次迭代编解码处理的迭代次数; S的取值范围为1到m,表示用户标识为s,m为所述至少一个用户标识的数量;vS表示用户标 识为S的第一多媒体数据的数据信息(即初始的输入数据,初始的输入数据为5*a维的矩 阵),户1表示用户标识为S的第一多媒体数据在经过t次迭代编解码处理后得到的数据信息 (即第t次迭代所需的输入数据,同样也为5*a维的矩阵),vi/具体表示用户标识为S的可视 层结点的数组中第i列第j行的子结点数值(1或0);vi/t具体表示用户标识为S的可视层结 点的数组中第i列第j行的子结点在经过t次迭代编解码处理后得到的子结点数值(1或0)。
[0048] 请一并参见图3,h(隐藏层)包含的3个结点为隐藏层结点,V(可视层)包含的5个结 点为可视层结点,W表示h与V之间的各结点间的权重值,表示可视层结点的数组中第i列 第j行的子结点与隐藏层结点中的第k个结点的连线的权重,Vi/具体表示用户标识为S的可 视层结点的数组中第i列第j行的子结点数值(1或〇),hk具体表示隐藏层中的第k个隐藏层 结点,例如:针对音乐数据,可视层结点可W为针对每首音乐数据的评分数值(具体用数组 表现),其中"Missing rating"表示当前的音乐数据未被进行任何操作(例如:下载、收藏、 删除等),h中每个隐藏层结点可W表示为音乐数据中的抽象隐形特征(例如:旋律、曲风、音 律等),可W理解的是,由于可视层结点的数量要远远大于隐藏层结点的数量,当对可视层 结点进行迭代编解码处理后,经过可视层结点编码到隐藏层结点的降维处理,再经过隐藏 层结点到可视层结点的升维处理,容易出现数值的丢失,因此需要在进行RBM训练的过程 中,迭代计算出稳定的wj,拟弥补数值丢失的可能性。
[0049] 可W理解的是,迭代编解码处理中的第一次迭代过程可W包括将初始的输入数据 与隐藏层中的隐藏层结点编码为C维的潜因子向量,再由C维潜因子向量解码为第二次迭代 过程所需的输入数据,W此类推,则第t次迭代过程可W包括将第t-1次迭代编解码处理后 得到的输入数据与隐藏层中的隐藏层结点进行编码为C维的潜因子向量,再由C维的潜因子 向量解码为第t+1次迭代过程所需的输入数据,直至满足预设条件为止,其中,潜因子向量 的求取公式为:
[(K)加 ]
[0化1 ]
[0052] 其中,公式4为第一次迭代过程中编码后得到的潜因子向量,公式5为第t次迭代过 程中得到的潜因子向量,所述预设条件具体表示为连续两次迭代编解码处理后得到的输入 数据与初始的输入数据之间的值满足预设阔值,或者,所述预设条件为预设迭代次数等,例 如:t+1 = 100。
[0053] 当迭代编解码处理后得到的处理结果满足预设条件时,所述多媒体数据处理设备 可W获取迭代编解码处理后的所述RBM模型的权重参数值。
[0化4] S203,将所述权重参数值添加至所述RBM模型中;
[0055] 具体的,所述多媒体数据处理设备将所述权重参数值添加至所述RBM模型中。
[0056] S204,基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信 息;
[0057] 具体的,多媒体数据处理设备可W基于多媒体交互应用获取目标用户标识对应的 第一多媒体数据的数据信息,所述数据信息优选为根据目标用户标识记录的对多媒体数据 的操作情况所确定的评分数值,所述多媒体数据处理设备可W预先获取目标用户标识对应 记录的对多媒体数据的操作情况,并根据所述对多媒体数据的操作情况确定所述目标用户 标识对所述多媒体数据的数据信息,例如:针对数据下载的操作对应的数据信息为4分、针 对数据删除的操作对应的数据信息为0分、针对数据收藏的操作对应的数据信息为3分等。
[0058] S205,采用RBM模型,并根据所述目标用户标识对应的第一多媒体数据的数据信 息,获取所述目标用户标识对应的第二多媒体数据的数据信息;
[0059] 具体的,所述多媒体数据处理设备可W采用预先训练好的RBM模型,并根据所述目 标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应的第二多媒体 数据的数据信息。当训练好所述RBM模型后,所述多媒体数据处理设备可W将所述目标用户 标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点,对所述第一可视 层结点进行编码处理W生成第一隐藏层结点对应的潜因子向量,所述多媒体数据处理设备 对所述第一隐藏层结点对应的潜因子向量进行解码处理W生成第二可视层结点,此时需要 按照多媒体数据的数量进行解码处理,依据上述举例,假设多媒体数据库中存在n个多媒体 数据,ai为所述目标用户标识对应的第一多媒体数据的数量,ai小于或等于n,则第一可视层 结点转化的矩阵为5相1维矩阵,经过编码处理后生成C维的第一隐藏层结点对应的潜因子 向量,再经过解码处理后生成第二可视层结点对应的5*n维矩阵,并将5*n维矩阵转化为所 述目标用户标识对应的每个多媒体数据的数据信息,所述多媒体数据处理设备在所述目标 用户标识对应的每个多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒 体数据的数据信息。
[0060] S206,对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序,在 所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据;
[0061] S207,对所述预设数量的多媒体数据进行输出;
[0062] 具体的,所述多媒体数据处理设备可W对所述目标用户标识对应的第二多媒体数 据的数据信息进行数值排序,在所述目标用户标识对应的第二多媒体数据中选取数值排序 在前的预设数量的多媒体数据,所述多媒体数据处理设备对所述预设数量的多媒体数据进 行输出,优选的,所述多媒体数据处理设备将所述预设数量的多媒体数据输出至使用所述 目标用户标识登录所述多媒体交互应用的用户终端。
[0063] S208,根据所述目标用户标识的第一隐藏层结点对应的潜因子向量,匹配所述目 标用户标识的相似用户标识,并获取所述相似用户标识的多媒体数据列表;
[0064] S209,在所述多媒体数据列表中获取所述目标用户标识对应的第=多媒体数据, 并对所述第=多媒体数据进行输出;
[0065] 具体的,所述多媒体数据处理设备在获取到所述目标用户标识的第一隐藏层结点 对应的潜因子向量时,还可W根据所述目标用户标识的第一隐藏层结点对应的潜因子向 量,匹配所述目标用户标识的相似用户标识,并获取所述相似用户标识的多媒体数据列表, 所述多媒体数据处理设备在所述多媒体数据列表中获取所述目标用户标识对应的第=多 媒体数据,并对所述第=多媒体数据进行输出,例如:输出至使用所述目标用户标识登录所 述多媒体交互应用的用户终端,其中,所述第=多媒体数据为属于所述多媒体数据列表且 属于所述目标用户标识对应的第二多媒体数据的多媒体数据。
[0066] 在本发明实施例中,通过将目标用户的已操作的多媒体数据的数据信息作为输入 数据,并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取,并最终 实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM 模型对未操作的多媒体数据的数据信息进行求取,能够最大化还原原始的输入数据,克服 了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果的影响,提高了求解结果 的稳定性;通过依据活跃用户条件选取至少一个用户标识对应的多媒体数据的数据信息, 作为对RBM模型进行训练的输入数据,可W保证RBM模型训练时的输入数据的可靠性,同时 无需使用所有用户标识的数据信息,提高了 RBM模型训练的效率。
[0067] 下面将结合附图4-附图6,对本发明实施例提供的多媒体数据处理设备进行详细 介绍。需要说明的是,附图4-附图6所示的多媒体数据处理设备,用于执行本发明图1-图3所 示实施例的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未掲 示的,请参照本发明图1-图3所示的实施例。
[0068] 请参见图4,为本发明实施例提供了一种应用状态检测设备的结构示意图。如图4 所示,本发明实施例的所述多媒体数据处理设备1可W包括:第一信息获取单元11、第二信 息获取单元12和第一数据输出单元13。
[0069] 第一信息获取单元11,用于基于多媒体交互应用获取目标用户标识对应的第一多 媒体数据的数据信息;
[0070] 具体实现中,所述第一信息获取单元11可W基于多媒体交互应用获取目标用户标 识对应的第一多媒体数据的数据信息,所述数据信息优选为根据目标用户标识记录的对多 媒体数据的操作情况所确定的评分数值,所述多媒体数据处理设备1可W预先获取目标用 户标识对应记录的对多媒体数据的操作情况,所述第一信息获取单元11根据所述对多媒体 数据的操作情况确定所述目标用户标识对所述多媒体数据的数据信息,例如:针对数据下 载的操作对应的数据信息为4分、针对数据删除的操作对应的数据信息为0分、针对数据收 藏的操作对应的数据信息为3分等。
[0071] 第二信息获取单元12,用于采用RBM模型,并根据所述目标用户标识对应的第一多 媒体数据的数据信息,获取所述目标用户标识对应的第二多媒体数据的数据信息;
[0072] 具体实现中,所述第二信息获取单元12可W采用预先训练好的RBM模型,并根据所 述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应的第二多 媒体数据的数据信息。
[0073] 对所述RBM模型进行训练的过程可W为:所述多媒体数据处理设备1基于多媒体交 互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据的数据信息,优选 的,所述多媒体数据处理设备1获取的至少一个用户标识为所述多媒体交互应用下的所有 用户标识,当然,为了保证在进行RBM模型训练时的输入数据的可靠性,W及提高RBM模型训 练的效率,所述多媒体数据处理设备1获取的至少一个用户标识也可W为所述多媒体数据 处理设备1基于活跃用户条件在所述所有用户标识中筛选出的至少一个用户标识。所述多 媒体数据处理设备1可W根据所述每个用户标识对应的第一多媒体数据的数据信息,计算 RBM模型的权重参数值,可W理解的是,所述RBM模型包括可视层结点和隐藏层结点,所述权 重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量W及隐藏层 结点间的偏移量,进一步的,所述多媒体数据处理设备1可W将所述每个用户标识对应的第 一多媒体数据的数据信息转换为所述可视层结点,所述多媒体数据处理设备1可W将所述 每个用户标识对应的第一多媒体数据的数据信息转化为一个数组,W此作为RBM模型训练 的初始的输入数据。所述多媒体数据处理设备1可W采用对比散度算法对可视层结点和隐 藏层结点进行迭代编解码处理,可W理解的是,所述可视层结点的个数是由所述每个用户 标识对应的第一多媒体数据的数量决定的,所述隐藏层结点的个数为经验值,当迭代编解 码处理后得到的处理结果满足预设条件时,所述多媒体数据处理设备I可W获取迭代编解 码处理后的所述RBM模型的权重参数值,所述多媒体数据处理设备1将所述权重参数值添加 至所述RBM模型中。
[0074] 当训练好所述RBM模型后,所述第二信息获取单元12可W将所述目标用户标识对 应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点,对所述第一可视层结点 进行编码处理W生成第一隐藏层结点对应的潜因子向量,所述第二信息获取单元12对所述 第一隐藏层结点对应的潜因子向量进行解码处理W生成第二可视层结点,此时需要按照多 媒体数据的数量进行解码处理,所述第二信息获取单元12在所述目标用户标识对应的每个 多媒体数据的数据信息中筛选出所述目标用户标识对应的第二多媒体数据的数据信息。
[0075] 第一数据输出单元13,用于根据所述目标用户标识对应的第二多媒体数据的数据 信息,对所述目标用户标识对应的第二多媒体数据进行输出;
[0076] 具体实现中,所述第一数据输出单元13可W根据所述目标用户标识对应的第二多 媒体数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输出,优选的,所述 第一数据输出单元13可W对所述目标用户标识对应的第二多媒体数据的数据信息进行数 值排序,在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多 媒体数据,所述第一数据输出单元13对所述预设数量的多媒体数据进行输出,优选的,所述 第一数据输出单元13将所述预设数量的多媒体数据输出至使用所述目标用户标识登录所 述多媒体交互应用的用户终端。
[0077] 在本发明实施例中,通过将目标用户的已操作的多媒体数据的数据信息作为输入 数据,并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取,并最终 实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM 模型对未操作的多媒体数据的数据信息进行求取,能够最大化还原原始的输入数据,克服 了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果的影响,提高了求解结果 的稳定性。
[0078] 请参见图5,为本发明实施例提供了另一种多媒体数据处理设备的结构示意图。如 图5所示,本发明实施例的所述多媒体数据处理设备1可W包括:第一信息获取单元11、第二 信息获取单元12、第一数据输出单元13、第=信息获取单元14、参数值计算单元15、参数值 添加单元16、列表获取单元17和第二数据输出单元18。
[0079] 第=信息获取单元14,用于基于多媒体交互应用获取至少一个用户标识中每个用 户标识对应的第一多媒体数据的数据信息;
[0080] 具体实现中,所述第=信息获取单元14基于多媒体交互应用获取至少一个用户标 识中每个用户标识对应的第一多媒体数据的数据信息,所述数据信息优选为根据目标用户 标识记录的对多媒体数据的操作情况所确定的评分数值,优选的,所述第=信息获取单元 14获取的至少一个用户标识为所述多媒体交互应用下的所有用户标识,当然,为了保证在 进行RBM模型训练时的输入数据的可靠性,W及提高RBM模型训练的效率,所述第S信息获 取单元14获取的至少一个用户标识也可W为所述第=信息获取单元14基于活跃用户条件 在所述所有用户标识中筛选出的至少一个用户标识,例如:所述第=信息获取单元14可W 获取所述多媒体交互应用下的所有用户标识的多媒体数据的流水数据,提取在3个月内,至 少有10天进行过数据浏览的操作,且每天浏览的多媒体数据不少于10个的至少一个用户标 识等。所述多媒体数据处理设备I可W预先获取所有用户标识中每个用户标识对应记录的 对多媒体数据的操作情况,所述第=信息获取单元14根据所述对多媒体数据的操作情况确 定所述每个用户标识对所述多媒体数据的数据信息。
[0081] 参数值计算单元15,用于根据所述每个用户标识对应的第一多媒体数据的数据信 息,计算RBM模型的权重参数值;
[0082] 具体实现中,所述参数值计算单元15可W根据所述每个用户标识对应的第一多媒 体数据的数据信息,计算RBM模型的权重参数值,可W理解的是,所述RBM模型包括可视层结 点和隐藏层结点,所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结 点间的偏移量W及隐藏层结点间的偏移量,优选的,所述可视层结点用于表述所述每个用 户标识对应的第一多媒体数据的数据信息,所述隐藏层结点用于表述所述每个用户标识对 应的第一多媒体数据对应的抽象的隐形特征,例如:音乐数据的旋律、曲风、音律等抽象特 征。进一步的,所述参数值计算单元15可W将所述每个用户标识对应的第一多媒体数据的 数据信息转换为所述可视层结点,所述参数值计算单元15可W将所述每个用户标识对应的 第一多媒体数据的数据信息转化为一个数组,例如:评分数值的取值区间为0-4分,假设某 用户标识S对数据标识为1的第一多媒体数据的评分数值为3分,则对应转换的可视层结点 为(0,1,0,0,0),对数据标识为4的第一多媒体数据的评分数值为1分,则对应转换的可视层 结点为(〇,〇,〇,1,〇),对数据标识为5的第一多媒体数据的评分数值为4分,则对应转换的可 视层结点为(1,〇,〇,〇,〇)等,所述多媒体数据处理设备1可W将上述得到的可视层结点转化 为一个数组(例如:矩阵),W此作为RBM模型训练的初始的输入数据。当然,上述评分数值的 取值区间W及可视层结点的维数的表达方式仅为举例,可W根据实际的应用需求,对取值 区间进行调整,同时对应调整可视层结点的维数等,针对不同取值区间W及不同的可视层 结点的维数,均可W执行本发明实施例的RBM模型的训练过程。
[0083] 所述参数值计算单元15可W采用对比散度算法对可视层结点和隐藏层结点进行 迭代编解码处理,可W理解的是,所述可视层结点的个数是由所述每个用户标识对应的第 一多媒体数据的数量决定的,所述隐藏层结点的个数为经验值,假设连接可视层结点和隐 藏层结点的权重值为W、可视层结点间的偏移量Visbias W及隐藏层结点间的偏移量 hi化ias,则可W得到下述公式:
[0084]
[0085]
[0086]
[0087]其中,W为一个a*b*c的S维矩阵,a是第一多媒体数据的数量,b是评分数值的取值 范围,C是隐藏层结点的个数;表示可视层结点的数组中第i列第j行的子结点与隐藏层 结点中的第k个结点的连线的权重;t和t+1可W表示连续两次迭代编解码处理的迭代次数; S的取值范围为1到m,表示用户标识为s,m为所述至少一个用户标识的数量;vS表示用户标 识为S的第一多媒体数据的数据信息(即初始的输入数据,初始的输入数据为5*a维的矩 阵),户1表示用户标识为S的第一多媒体数据在经过t次迭代编解码处理后得到的数据信息 (即第t次迭代所需的输入数据,同样也为5*a维的矩阵),vi/具体表示用户标识为S的可视 层结点的数组中第i列第j行的子结点数值(1或0);vi/t具体表示用户标识为S的可视层结 点的数组中第i列第j行的子结点在经过t次迭代编解码处理后得到的子结点数值(1或0)。
[0088] 可W理解的是,迭代编解码处理中的第一次迭代过程可W包括将初始的输入数据 与隐藏层中的隐藏层结点编码为C维的潜因子向量,再由C维潜因子向量解码为第二次迭代 过程所需的输入数据,W此类推,则第t次迭代过程可W包括将第t-1次迭代编解码处理后 得到的输入数据与隐藏层中的隐藏层结点进行编码为C维的潜因子向量,再由C维的潜因子 向量解码为第t+1次迭代过程所需的输入数据,直至满足预设条件为止,其中,潜因子向量 的求取公式为:
[0089]
[0090]
[0091] 其中,公式4为第一次迭代过程中编码后得到的潜因子向量,公式5为第t次迭代过 程中得到的潜因子向量,所述预设条件具体表示为连续两次迭代编解码处理后得到的输入 数据与初始的输入数据之间的值满足预设阔值,或者,所述预设条件为预设迭代次数等,例 如:t+1 = 100。
[0092] 当迭代编解码处理后得到的处理结果满足预设条件时,所述参数值计算单元15可 W获取迭代编解码处理后的所述RBM模型的权重参数值。
[0093] 参数值添加单元16,用于将所述权重参数值添加至所述RBM模型中;
[0094] 具体实现中,所述参数值添加单元16将所述权重参数值添加至所述RBM模型中。 [00M]第一信息获取单元11,用于基于多媒体交互应用获取目标用户标识对应的第一多 媒体数据的数据信息;
[0096] 具体实现中,所述第一信息获取单元11可W基于多媒体交互应用获取目标用户标 识对应的第一多媒体数据的数据信息,所述数据信息优选为根据目标用户标识记录的对多 媒体数据的操作情况所确定的评分数值,所述多媒体数据处理设备1可W预先获取目标用 户标识对应记录的对多媒体数据的操作情况,所述第一信息获取单元11根据所述对多媒体 数据的操作情况确定所述目标用户标识对所述多媒体数据的数据信息,例如:针对数据下 载的操作对应的数据信息为4分、针对数据删除的操作对应的数据信息为0分、针对数据收 藏的操作对应的数据信息为3分等。
[0097] 第二信息获取单元12,用于采用RBM模型,并根据所述目标用户标识对应的第一多 媒体数据的数据信息,获取所述目标用户标识对应的第二多媒体数据的数据信息;
[0098] 具体实现中,所述第二信息获取单元12可W采用预先训练好的RBM模型,并根据所 述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应的第二多 媒体数据的数据信息。当训练好所述RBM模型后,所述第二信息获取单元12可W将所述目标 用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结点,对所述第一 可视层结点进行编码处理W生成第一隐藏层结点对应的潜因子向量,所述第二信息获取单 元12对所述第一隐藏层结点对应的潜因子向量进行解码处理W生成第二可视层结点,此时 需要按照多媒体数据的数量进行解码处理,依据上述举例,假设多媒体数据库中存在n个多 媒体数据,ai为所述目标用户标识对应的第一多媒体数据的数量,ai小于或等于n,则第一可 视层结点转化的矩阵为5*ai维矩阵,经过编码处理后生成C维的第一隐藏层结点对应的潜 因子向量,再经过解码处理后生成第二可视层结点对应的5*n维矩阵,并将5*n维矩阵转化 为所述目标用户标识对应的每个多媒体数据的数据信息,所述第二信息获取单元12在所述 目标用户标识对应的每个多媒体数据的数据信息中筛选出所述目标用户标识对应的第二 多媒体数据的数据信息。
[0099] 第一数据输出单元13,用于根据所述目标用户标识对应的第二多媒体数据的数据 信息,对所述目标用户标识对应的第二多媒体数据进行输出;
[0100] 具体实现中,所述第一数据输出单元13可W根据所述目标用户标识对应的第二多 媒体数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输出,优选的,所述 第一数据输出单元13可W对所述目标用户标识对应的第二多媒体数据的数据信息进行数 值排序,在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多 媒体数据,所述第一数据输出单元13对所述预设数量的多媒体数据进行输出,优选的,所述 第一数据输出单元13将所述预设数量的多媒体数据输出至使用所述目标用户标识登录所 述多媒体交互应用的用户终端。
[0101] 具体的,请一并参见图6,为本发明实施例提供了第一数据输出单元的结构示意 图。如图6所示,所述第一数据输出单元13可W包括:
[0102] 数据选取子单元131,用于对所述目标用户标识对应的第二多媒体数据的数据信 息进行数值排序,在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设 数量的多媒体数据;
[0103] 数据输出子单元132,用于对所述预设数量的多媒体数据进行输出。
[0104] 列表获取单元17,用于根据所述目标用户标识的第一隐藏层结点对应的潜因子向 量,匹配所述目标用户标识的相似用户标识,并获取所述相似用户标识的多媒体数据列表;
[0105] 第二数据输出单元18,用于在所述多媒体数据列表中获取所述目标用户标识对应 的第=多媒体数据,并对所述第=多媒体数据进行输出;
[0106] 具体实现中,所述第二信息获取单元12在获取到所述目标用户标识的第一隐藏层 结点对应的潜因子向量时,所述列表获取单元17可W根据所述目标用户标识的第一隐藏层 结点对应的潜因子向量,匹配所述目标用户标识的相似用户标识,并获取所述相似用户标 识的多媒体数据列表,所述第二数据输出单元18在所述多媒体数据列表中获取所述目标用 户标识对应的第=多媒体数据,并对所述第=多媒体数据进行输出,例如:输出至使用所述 目标用户标识登录所述多媒体交互应用的用户终端,其中,所述第=多媒体数据为属于所 述多媒体数据列表且属于所述目标用户标识对应的第二多媒体数据的多媒体数据。
[0107] 在本发明实施例中,通过将目标用户的已操作的多媒体数据的数据信息作为输入 数据,并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取,并最终 实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM 模型对未操作的多媒体数据的数据信息进行求取,能够最大化还原原始的输入数据,克服 了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果的影响,提高了求解结果 的稳定性;通过依据活跃用户条件选取至少一个用户标识对应的多媒体数据的数据信息, 作为对RBM模型进行训练的输入数据,可W保证RBM模型训练时的输入数据的可靠性,同时 无需使用所有用户标识的数据信息,提高了 RBM模型训练的效率。
[0108] 请参见图7,为本发明实施例提供了又一种多媒体数据处理设备的结构示意图。如 图7所示,所述多媒体数据处理设备1000可W包括:至少一个处理器1001,例如CPU,至少一 个网络接口 1004,用户接口 1003,存储器1005,至少一个通信总线1002。其中,通信总线1002 用于实现运些组件之间的连接通信。其中,用户接口 1003可W包括显示屏(Display)、键盘 化eyboard),可选用户接口 1003还可W包括标准的有线接口、无线接口。网络接口 1004可选 的可W包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可W是高速RAM存储器, 也可W是非不稳定的存储器(non-volatile memo巧),例如至少一个磁盘存储器。存储器 1005可选的还可W是至少一个位于远离前述处理器1001的存储装置。如图7所示,作为一种 计算机存储介质的存储器1005中可W包括操作系统、网络通信模块、用户接口模块W及数 据处理应用程序。
[0109] 在图7所示的多媒体数据处理设备1000中,用户接口 1003主要用于为用户提供输 入的接口,获取用户输入的数据;网络接口 1004主要用于与用户终端进行连接,与用户终端 进行数据交互;而处理器1001可W用于调用存储器1005中存储的数据处理应用程序,并具 体执行W下操作:
[0110] 基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息;
[0111] 采用RBM模型,并根据所述目标用户标识对应的第一多媒体数据的数据信息,获取 所述目标用户标识对应的第二多媒体数据的数据信息;
[0112] 根据所述目标用户标识对应的第二多媒体数据的数据信息,对所述目标用户标识 对应的第二多媒体数据进行输出;
[0113] 其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒体数据为未操 作的多媒体数据。
[0114] 在一个实施例中,所述处理器1001在执行基于多媒体交互应用获取目标用户标识 对应的第一多媒体数据的数据信息之前,还执行W下操作:
[0115] 基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体 数据的数据信息;
[0116] 根据所述每个用户标识对应的第一多媒体数据的数据信息,计算RBM模型的权重 参数值;
[0117] 将所述权重参数值添加至所述RBM模型中。
[0118] 在一个实施例中,所述RBM模型包括可视层结点和隐藏层结点,所述权重参数值包 括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量W及隐藏层结点间的偏 移量;
[0119] 所述处理器1001在执行根据所述每个用户标识对应的第一多媒体数据的数据信 息,计算RBM模型的权重参数值时,具体执行W下操作:
[0120] 将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点;
[0121] 采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理;
[0122] 当迭代编解码处理后得到的处理结果满足预设条件时,获取迭代编解码处理后的 所述RBM模型的权重参数值。
[0123] 在一个实施例中,所述处理器1001在执行采用受限玻尔兹曼机神经网络RBM模型, 并根据所述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识对应 的第二多媒体数据的数据信息时,具体执行W下操作:
[0124] 将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视 层结点,对所述第一可视层结点进行编码处理W生成第一隐藏层结点对应的潜因子向量;
[0125] 对所述第一隐藏层结点对应的潜因子向量进行解码处理W生成第二可视层结点;
[0126] 在所述第二可视层结点中获取所述目标用户标识对应的第二多媒体数据的数据 信息。
[0127] 在一个实施例中,所述处理器1001在执行根据所述目标用户标识对应的第二多媒 体数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输出时,具体执行W 下操作:
[0128] 对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序,在所述目 标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据;
[0129] 对所述预设数量的多媒体数据进行输出。
[0130] 在一个实施例中,所述处理器1001还执行W下操作:
[0131] 根据所述目标用户标识的第一隐藏层结点对应的潜因子向量,匹配所述目标用户 标识的相似用户标识,并获取所述相似用户标识的多媒体数据列表;
[0132] 在所述多媒体数据列表中获取所述目标用户标识对应的第=多媒体数据,并对所 述第=多媒体数据进行输出;
[0133] 其中,所述第=多媒体数据为属于所述多媒体数据列表且属于所述目标用户标识 对应的第二多媒体数据的多媒体数据。
[0134] 在本发明实施例中,通过将目标用户的已操作的多媒体数据的数据信息作为输入 数据,并采用RBM模型对目标用户标识的未操作的多媒体数据的数据信息进行求取,并最终 实现根据未操作的多媒体数据的数据信息对未操作的多媒体数据进行输出。通过采用RBM 模型对未操作的多媒体数据的数据信息进行求取,能够最大化还原原始的输入数据,克服 了非凸优化问题的局部最优解,降低稀疏的输入数据对求解结果的影响,提高了求解结果 的稳定性。
[0135] 本领域普通技术人员可W理解实现上述实施例方法中的全部或部分流程,是可W 通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质 中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁 碟、光盘、只读存储记忆体(Read-Only Memoir ,ROM)或随机存储记忆体(Random Access Memory ,RAM)等。
[0136] W上所掲露的仅为本发明较佳实施例而已,当然不能W此来限定本发明之权利范 围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
【主权项】
1. 一种多媒体数据处理方法,其特征在于,包括: 基于多媒体交互应用获取目标用户标识对应的第一多媒体数据的数据信息; 采用受限玻尔兹曼机神经网络RBM模型,并根据所述目标用户标识对应的第一多媒体 数据的数据信息,获取所述目标用户标识对应的第二多媒体数据的数据信息; 根据所述目标用户标识对应的第二多媒体数据的数据信息,对所述目标用户标识对应 的第二多媒体数据进行输出; 其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒体数据为未操作的 多媒体数据。2. 根据权利要求1所述的方法,其特征在于,所述基于多媒体交互应用获取目标用户标 识对应的第一多媒体数据的数据信息之前,还包括: 基于多媒体交互应用获取至少一个用户标识中每个用户标识对应的第一多媒体数据 的数据信息; 根据所述每个用户标识对应的第一多媒体数据的数据信息,计算RBM模型的权重参数 值; 将所述权重参数值添加至所述RBM模型中。3. 根据权利要求2所述的方法,其特征在于,所述RBM模型包括可视层结点和隐藏层结 点,所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量 以及隐藏层结点间的偏移量; 所述根据所述每个用户标识对应的第一多媒体数据的数据信息,计算RBM模型的权重 参数值,包括: 将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点; 采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理; 当迭代编解码处理后得到的处理结果满足预设条件时,获取迭代编解码处理后的所述 RBM模型的权重参数值。4. 根据权利要求1所述的方法,其特征在于,所述采用受限玻尔兹曼机神经网络RBM模 型,并根据所述目标用户标识对应的第一多媒体数据的数据信息,获取所述目标用户标识 对应的第二多媒体数据的数据信息,包括: 将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结 点,对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量; 对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点; 在所述第二可视层结点中获取所述目标用户标识对应的第二多媒体数据的数据信息。5. 根据权利要求1所述的方法,其特征在于,所述根据所述目标用户标识对应的第二多 媒体数据的数据信息,对所述目标用户标识对应的第二多媒体数据进行输出,包括: 对所述目标用户标识对应的第二多媒体数据的数据信息进行数值排序,在所述目标用 户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多媒体数据; 对所述预设数量的多媒体数据进行输出。6. 根据权利要求4所述的方法,其特征在于,还包括: 根据所述目标用户标识的第一隐藏层结点对应的潜因子向量,匹配所述目标用户标识 的相似用户标识,并获取所述相似用户标识的多媒体数据列表; 在所述多媒体数据列表中获取所述目标用户标识对应的第三多媒体数据,并对所述第 三多媒体数据进行输出; 其中,所述第三多媒体数据为属于所述多媒体数据列表且属于所述目标用户标识对应 的第二多媒体数据的多媒体数据。7. -种多媒体数据处理设备,其特征在于,包括: 第一信息获取单元,用于基于多媒体交互应用获取目标用户标识对应的第一多媒体数 据的数据信息; 第二信息获取单元,用于采用RBM模型,并根据所述目标用户标识对应的第一多媒体数 据的数据信息,获取所述目标用户标识对应的第二多媒体数据的数据信息; 第一数据输出单元,用于根据所述目标用户标识对应的第二多媒体数据的数据信息, 对所述目标用户标识对应的第二多媒体数据进行输出; 其中,所述第一多媒体数据为已操作的多媒体数据,所述第二多媒体数据为未操作的 多媒体数据。8. 根据权利要求7所述的设备,其特征在于,还包括: 第三信息获取单元,用于基于多媒体交互应用获取至少一个用户标识中每个用户标识 对应的第一多媒体数据的数据信息; 参数值计算单元,用于根据所述每个用户标识对应的第一多媒体数据的数据信息,计 算RBM模型的权重参数值; 参数值添加单元,用于将所述权重参数值添加至所述RBM模型中。9. 根据权利要求8所述的设备,其特征在于,所述RBM模型包括可视层结点和隐藏层结 点,所述权重参数值包括连接可视层结点和隐藏层结点的权重值、可视层结点间的偏移量 以及隐藏层结点间的偏移量; 所述参数值计算单元具体用于: 将所述每个用户标识对应的第一多媒体数据的数据信息转换为所述可视层结点; 采用对比散度算法对可视层结点和隐藏层结点进行迭代编解码处理; 当迭代编解码处理后得到的处理结果满足预设条件时,获取迭代编解码处理后的所述 RBM模型的权重参数值。10. 根据权利要求7所述的设备,其特征在于,所述第二信息获取单元具体用于: 将所述目标用户标识对应的第一多媒体数据的数据信息作为RBM模型的第一可视层结 点,对所述第一可视层结点进行编码处理以生成第一隐藏层结点对应的潜因子向量; 对所述第一隐藏层结点对应的潜因子向量进行解码处理以生成第二可视层结点; 在所述第二可视层结点中获取所述目标用户标识对应的第二多媒体数据的数据信息。11. 根据权利要求7所述的设备,其特征在于,所述第一数据输出单元包括: 数据选取子单元,用于对所述目标用户标识对应的第二多媒体数据的数据信息进行数 值排序,在所述目标用户标识对应的第二多媒体数据中选取数值排序在前的预设数量的多 媒体数据; 数据输出子单元,用于对所述预设数量的多媒体数据进行输出。12. 根据权利要求10所述的设备,其特征在于,还包括: 列表获取单元,用于根据所述目标用户标识的第一隐藏层结点对应的潜因子向量,匹 配所述目标用户标识的相似用户标识,并获取所述相似用户标识的多媒体数据列表; 第二数据输出单元,用于在所述多媒体数据列表中获取所述目标用户标识对应的第三 多媒体数据,并对所述第三多媒体数据进行输出; 其中,所述第三多媒体数据为属于所述多媒体数据列表且属于所述目标用户标识对应 的第二多媒体数据的多媒体数据。
【文档编号】G06F17/30GK106021314SQ201610294256
【公开日】2016年10月12日
【申请日】2016年5月5日
【发明人】黄安埠
【申请人】腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1