一种多媒体数据的聚类方法及装置的制造方法_2

文档序号：9217276阅读：来源：国知局

;是否观看过视频 Bj的信息。若在智能电视上表示用户1^观看过视频Bp则Ru=l，否则为R^=0。这里以表1来说明对矩阵R的含义，需要说明的是，真实的矩阵R具有百万级的维度，下述的表1仅仅是对矩阵R的含义进行说明，仅仅是一种示例。
[0032]表 1
[0033] 示例性的，假设视频的集合为和B={BpB2, . . .，BJ，若要计算&与B2间的相似度时，可以根据视频&与B2的各项参数信息间的相似程度以及现有的相似度计算公式来计算两者的相似度，这里以表2来说明对矩阵S的含义，需要说明的是，真实的矩阵S具有百万级的维度，下述的表2仅仅是对矩阵S的含义进行说明，仅仅是一种示例。
[0035] 表 2
[0036] 103、多媒体数据的聚类装置根据矩阵R、矩阵S以及矩阵F，将所有用户与所有多媒体数据进行聚类，得到矩阵Y。
[0037] 其中，上述的矩阵F的行和列均为用户的标识，该矩阵F的元素Fxy表示用户x 与用户y间是否为好友关系；上述的矩阵Y的行为组标识，该矩阵Y的列包括用户的标识和多媒体矩阵的标识，该矩阵Y的元素Yfl表示用户f属于组1的权重值，该矩阵Y的元素Ygl表示多媒体数据g属于组1的权重值。本实施例中的i, X，y,fG1，2,......，n ; j,a,b,g,G1, 2,......，m;1G1, 2,......，k;上述的n为用户个数，上述的m为记录中n个用户所观看的不重复的多媒体数据总和；上述的k为组个数。
[0038] 示例性的，随着社交网络的流行，每个人都维持着自己的社交关系。社交关系已经成为一种发掘用户可能邻居的潜在价值信息。假设用户的集合为U={UpU2, . . .，Un}，则定义用户与用户间的社会关系矩阵为矩阵F ，其中Fxy表示好友关系，若U，与Uy是好友关系则Fxy= 1，否则为Fxy= 0。这里以表3来说明矩阵F的含义，需要说明的是，真实的矩阵F具有百万级的维度，下述的表3仅仅是对矩阵F的含义进行说明，仅仅是一种示例。
[0039]
[0040] 表 3
[0041] 基于表3可知，假设用户仏与U4由于没有共同观看的视频认为其不为相似的用户，但是U1与U4是好友关系，补充了R矩阵由于数据稀疏导致的判断不准确。
[0042] 可选的，步骤103具体包括如下步骤：
[0043] 103a、多媒体数据的聚类装置根据聚类公式、矩阵R、矩阵S以及矩阵F，将所有用户与所有多媒体数据进行聚类，得到矩阵Y。
[0044] 其中，上述的聚类公式为：
[0046] (公式一）；其中，

上述的a为控制矩阵F权重，上述的0为控制矩阵S的权重。，
[0047] 示例性的是，在具体计算矩阵Y时，可以按照以下计算过程进行计算。但是需要说明的是，下述的计算过程仅是为一种示例，在实际应用中只要能够计算出矩阵Y的计算方法均为本发明保护的范围，再次不再赘述。
[0048] 首先，可以将公式一转化为公式二：
[0051] 其次，由于公式一为损失函数，当求损失函数的最小值时所对应的极值点就是P、Q 的值或是Y的值，因此，可以将公式二中的Tr(YTMY)，转换成叫nhP'7 (公式三）。
[0052] 其次，由于公式三为非凸函数，很难求取极值，因此，这里可以根据谱聚类的方式将用户和多媒体数据转换到低维的空间中，然后再同时聚类根据瑞利熵理论将公式三转换成公式四：
[0053]
(公式四）；其中，ZeR(m+B)xr，ZTZ=I，Z= [z"z2, ? ? ?zr]。Z的列向量为M的最小的r个特征值对应的特征向量。
[0054] 最后，再利用模糊c-means聚类方法将用户和视频聚类成组L，得到矩阵Y。
[0055] 本发明的实施例提供的多媒体数据的聚类方法，根据获取到的多媒体数据的属性信息矩阵R和矩阵S，该矩阵R的元素Ru表示用户i是否观看多媒体数据j，该矩阵S的元素Sab表示多媒体数据a与多媒体数据b间的相似度，然后，根据矩阵R、矩阵S以及矩阵F，将所有用户与所有多媒体数据进行聚类，得到矩阵Y，该矩阵F的元素Fxy表示用户x与用户y间是否为好友关系，该矩阵Y的元素Ygl表示多媒体数据g属于组1的权重值。这样通过矩阵F、矩阵R以及矩阵S中分别体现出的用户与用户之间、用户与多媒体数据之间以及多媒体数据与多媒体数据间的关联性，对用户与多媒体数据间进行更精细化的聚类，从而提高了终端对用户与多媒体数据聚类的准确性。
[0056] 基于图1对应的实施例提供的一种多媒体聚类方法，本实施例提供一种多媒体数据的推荐方法，如图2所示，该多媒体数据的推荐方法具体包括如下步骤：
[0057]201、多媒体数据的聚类装置获取多媒体数据的属性信息。
[0058] 202、多媒体数据的聚类装置根据多媒体数据的属性信息生成矩阵R和矩阵S。
[0059] 其中，上述的矩阵R的行和列分别表示用户的标识和多媒体数据的标识，该矩阵R的元素&表示用户i是否观看多媒体数据j;上述的矩阵S的行和列均为多媒体数据的标识，该矩阵S的元素Sab表示多媒体数据a与多媒体数据b间的相似度。上述的 i,bG1, 2,......，n;j,aG1, 2,......，m;上述的n为用户个数，上述的m为多媒体数据个数。
[0060] 203、多媒体数据的聚类装置根据所述矩阵R、所述矩阵S以及矩阵F，将所有用户与所有多媒体数据进行聚类，得到矩阵Y。
[0061] 其中，上述的矩阵F的行和列均为用户的标识，该矩阵F的元素Fxy表示用户x与用户y间是否为好友关系；上述的矩阵Y的行为组标识，该矩阵Y的列包括用户的标识和多媒体矩阵的标识，该矩阵Y的元素Yfl表示用户f属于组1的权重值，该矩阵Y的元素Ygl表示多媒体数据g属于组1的权重值。本实施例中的i,X，y,fG1，2,......，n; j, a,b,g,G1, 2,......，m;1G1, 2,......，k;上述的n为用户个数，上述的m为多媒体数据个数，上述的k为组个数。
[0062] 需要说明的是，本实施例中的步骤201至203的详细过程以及具体参数的介绍，可以直接参照上一实施例中步骤101至103中的详细描述，这里不再赘述。
[0063] 204、多媒体数据的聚类装置根据目标用户的标识从矩阵Y中确定出目标用户未观看的目标多媒体数据的标识。
[0064] 205、多媒体数据的聚类装置根据矩阵Y、目标用户的标识以及目标多媒体数据的标识，预测出目标用户对每个目标多媒体数据的评分。
[0065] 可选的，步骤205中目标用户对任一多媒体数据的评分过程具体包括如下步骤：
[0066] 205a、多媒体数据的聚类装置从目标用户未观看的多媒体数据中选择任一多媒体数据。
[0067] 205b、多媒体数据的聚类装置根据目标用户的标识和任一多媒体数据的标识，从矩阵Y中获取目标组的标识。
[0068] 其中，上述的目标组为目标用户与任一多媒体数据同属一组时对应的组标识。
[0069] 205cl、若在矩阵Y中确定出目标组，则多媒体数据的聚类装置在目标组中预测目标用户对任一多媒体数据的评分；根据评分以及目标用户属于目标组的权重值，计算出目标用户对任一多媒体数据的评分。
[0070] 205c2、若在矩阵Y中未确定出目标组，则多媒体数据的聚类装置直接将目标用户对任一多媒体数据的评分设置为〇。
[0071] 示例性的，若多媒体数据以电影为例，假设为目标用户U1推荐视频，若计算目标用户U1对目标电影&的评分时，从矩阵Y中查找出目标用户U1对目标电影Bi属于的共同组为组10〇和组2 (k2)时，则利用CF算法预测出来目标用户U1对目标电影&的预测评分分别为sjpS2，而目标用户U1属于匕和k2的权重分别为wJpW2，则目标用户U1对目标电影&的最终评分为W=si?Wl+s2 ?w2。若目标用户U1对目标电影&间没有共同所属的组则W= 0。
[0072]206、多媒体数据的聚类装置对目标用户对每个目标多媒体数据的评分进行排序，并根据目标用户需要推荐的多媒体数据的个数确定对目标用户推荐的多媒体数据。
[0073] 可选的，步骤206具体包括如下内容：
[0074] 206a、多媒体数据的聚类装置将目标用户

完整全部详细技术资料下载

当前第2页1 2 3 4