一种对用户和内容进行分类的方法、装置及计算设备的制造方法_3

文档序号:8282419阅读:来源:国知局
;8, (u7, a5)->7, (u7, a3)->2, (u8, a l)->3, (u9, a6)->8, (u4, a2)->8, (u8, a4)->10, (ul,a2)->2, (u8, a9)->2, (ulO, alO)->4, (u4, a9)->10, (ul,al)->10, (u2, a3)->5, (ulO, a3)->8, (u5, a7)->9, (u3, a3)->3, (u4, a6 )->6, (u7, a2)->4, (u4, a5)->10, (u7, a8)->3, (u9, a7)->3, (ul,a6)->2, (u3, a8)->9, (u4 ,a6)->3, (u7,al)->l, (u7,a9)->9, (u5,a9)->6, (u3,a4)->8}。
[0047] 访问量映射关系Fua对应到二维表见下表,表中的行为用户、列为内容,表中的各 取值为访问量:
[0048]
【主权项】
1. 一种对用户和内容进行分类的装置,驻留在计算设备中,适于将用户集合中的各用 户聚类为第一预定数目个用户类型,将内容集合中的各内容聚类为第二预定数目个内容类 型,所述装置包括: 初始化模块,适于为所述第一预定数目个用户类型中的每个用户类型指定用户集合中 的一个或多个用户,为所述第二预定数目个内容类型中的每个内容类型指定内容集合中的 一个或多个内容; 访问量计算模块,适于根据用户对内容的访问量,计算各用户类型对各内容的第一访 问量、各用户对各内容类型的第二访问量和各用户类型对各内容类型的第S访问量; 相似度计算模块,适于根据所述第二访问量和第=访问量,计算各用户与各用户类型 之间的相似度,根据所述第一访问量和第=访问量,计算各内容与各内容类型之间的相似 度;化及 分类模块,适于对于每个用户,选择与其相似度最高的用户类型作为该用户的用户类 型,对于每个内容,选择与其相似度最高的内容类型作为该内容的内容类型,并触发访问量 计算模块重新进行访问量计算和相似度计算模块重新进行相似度计算后,重新进行所述选 择,直到预定条件满足时,不再进行所述触发。
2. 如权利要求1所述的装置,其中,所述初始化模块进一步适于;根据已有的用户与用 户类型之间的映射关系,为已有一个或多个用户的用户类型指定该一个或多个用户,并为 没有用户的用户类型随机指定一个没有用户类型的用户;根据已有的内容与内容类型之间 的映射关系,为已有一个或多个内容的内容类型指定该一个或多个内容,并为没有内容的 内容类型随机指定一个没有内容类型的内容。
3. 如权利要求2所述的装置,其中,对于已有的用户与用户类型之间的映射关系,所述 相似度计算模块不计算该用户与各用户类型之间的相似度,且所述分类模块不改变该用户 的用户类型; 对于已有的内容与内容类型之间的映射关系,所述相似度计算模块不计算该内容与各 内容类型之间的相似度,且所述分类模块不改变该内容的内容类型。
4. 如权利要求2所述的装置,其中,所述访问量计算模块按照如下方式计算某个用户 类型对某个内容的访问量;获取该用户类型包括的所有用户;获取其中每个用户对该内容 的访问量;对所有访问量求和,得到该用户类型对该内容的访问量; 所述访问量计算模块按照如下方式计算某个用户对某个内容类型的访问量;获取该内 容类型包括的所有内容;获取该用户对其中每个内容的访问量;对所有访问量求和,得到 该用户对该内容类型的访问量; 所述访问量计算模块按照如下方式计算某个用户类型对某个内容类型的访问量;获取 该用户类型包括的所有用户W及该内容类型包括的所有内容;获取其中每个用户对其中每 个内容的访问量;对所有访问量求和,得到该用户类型对该内容类型的访问量。
5. 如权利要求4所述的装置,其中,所述相似度为基于最小值的相似系数、己氏相似系 数或者余弦相似系数。
6. 如权利要求5所述的装置,其中,所述相似度计算模块在计算两个向量的相似度前, 先对该两个向量的定义域取交集或并集后,再计算该两个向量的相似度。
7. 如权利要求1所述的装置,其中,所述预定条件为;触发所述访问量计算模块和相似 度计算模块的次数达到预设的次数;或者,本次的分类结果与上次的分类结果相比,用户类 型发生变化的用户比例小于预设的第一口限且内容类型发生变化的内容比例小于预设的 第二口限。
8. -种对用户和内容进行分类的方法,在计算设备中执行,适于将用户集合中的各用 户聚类为第一预定数目个用户类型,将内容集合中的各内容聚类为第二预定数目个内容类 型,所述方法包括: 初始化步骤;为所述第一预定数目个用户类型中的每个用户类型指定用户集合中的一 个或多个用户,为所述第二预定数目个内容类型中的每个内容类型指定内容集合中的一个 或多个内容; 访问量计算步骤;根据用户对内容的访问量,计算各用户类型对各内容的第一访问量、 各用户对各内容类型的第二访问量和各用户类型对各内容类型的第S访问量; 相似度计算步骤,根据所述第二访问量和第=访问量,计算各用户与各用户类型之间 的相似度,根据所述第一访问量和第=访问量,计算各内容与各内容类型之间的相似度;W 及 分类步骤;对于每个用户,选择与其相似度最高的用户类型作为该用户的用户类型,对 于每个内容,选择与其相似度最高的内容类型作为该内容的内容类型,并触发访问量计算 步骤重新进行访问量计算和相似度计算步骤重新进行相似度计算后,重新进行所述选择, 直到预定条件满足时,不再进行所述触发。
9. 如权利要求8所述的方法,其中,在所述初始化步骤中,根据已有的用户与用户类型 之间的映射关系,为已有一个或多个用户的用户类型指定该一个或多个用户,并为没有用 户的用户类型随机指定一个没有用户类型的用户;根据已有的内容与内容类型之间的映射 关系,为已有一个或多个内容的内容类型指定该一个或多个内容,并为没有内容的内容类 型随机指定一个没有内容类型的内容。
10. -种计算设备,包括如权利要求1?7中任一项所述的对用户和内容进行分类的装 置。
【专利摘要】本发明公开了一种对用户和内容进行分类的方法、装置及计算设备。所述装置包括:初始化模块,适于为每个用户类型指定一个用户,为每个内容类型指定一个内容;访问量计算模块,适于计算各用户类型对各内容的第一访问量、各用户对各内容类型的第二访问量和各用户类型对各内容类型的第三访问量;相似度计算模块,适于根据第二访问量和第三访问量,计算各用户与各用户类型之间的相似度,根据第一访问量和第三访问量,计算各内容与各内容类型之间的相似度;分类模块,适于对于每个用户,选择与其相似度最高的用户类型作为该用户的用户类型,对于每个内容,选择与其相似度最高的内容类型作为该内容的内容类型。
【IPC分类】G06F17-30
【公开号】CN104598601
【申请号】CN201510041042
【发明人】胡勇
【申请人】北京齐尔布莱特科技有限公司
【公开日】2015年5月6日
【申请日】2015年1月27日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1