用户偏好挖掘方法、装置、存储介质及计算机设备与流程

文档序号:33634057发布日期:2023-03-28 23:56阅读:38来源:国知局
用户偏好挖掘方法、装置、存储介质及计算机设备与流程

1.本技术涉及信息技术领域,尤其涉及一种用户偏好挖掘方法、装置、存储介质及计算机设备。


背景技术:

2.在信息技术不断发展的时代下,为了给用户提供更好的节目观看体验,iptv应运而生。iptv即交互式网络电视,是一种集互联网、多媒体和通讯技术于一体、利用宽带网作为介质向家庭用户提供包括数字电视在内的多种交互式服务的技术。iptv运营则能够进一步满足用户欣赏视频节目的个性化需求。
3.现有的iptv运营只对iptv用户进行简单分组或使用其他行业的用户偏好挖掘方法,无法对iptv用户的偏好进行精准挖掘,从而无法做到针对每个iptv用户的精细化运营。


技术实现要素:

4.本技术的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中无法做到针对每个iptv用户的精细化运营的技术缺陷。
5.第一方面,本技术提供了一种用户偏好挖掘方法,所述方法包括:
6.获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵;
7.获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;
8.基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户;
9.基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数idf值,以及确定所述目标用户在各个所述内容标签上的词频指数tf值、时间衰减系数和时长影响因子;
10.基于各个所述idf值、所述tf值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值;
11.根据各个所述偏好值,确定所述目标用户对应的偏好标签。
12.在其中一个实施例中,所述用户收视节目矩阵中的所述收视节目信息包括用户收视的节目、所述节目的收视时长、所述节目的总时长以及所述节目每次的收视时间,所述基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵的步骤,包括:
13.根据所述节目标签矩阵,为所述用户收视节目矩阵中所述用户收视的节目匹配对应的内容标签,得到所述目标矩阵。
14.在其中一个实施例中,所述基于所述目标矩阵,确定各个所述内容标签的idf值的步骤,包括:
15.基于所述目标矩阵,确定每个所述内容标签对应的用户数量,以及所述目标矩阵中的总用户数;
16.根据每个所述内容标签对应的用户数量和所述总用户数确定各个所述内容标签的idf值。
17.在其中一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的tf值的步骤,包括:
18.基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的第一收视总次数和第一收视总时长,以及该内容标签对应节目的第一节目总时长;
19.对每个所述内容标签,根据所述第一收视总次数、所述第一收视总时长以及所述第一节目总时长确定第一数值;
20.基于所述目标矩阵,确定所述目标用户对各个所述节目的第二收视总次数和第二收视总时长,以及所述目标用户对应节目的第二节目总时长;
21.根据所述第二收视总次数、所述第二收视总时长以及所述第二节目总时长确定第二数值;
22.对每个所述内容标签,根据所述第一数值和所述第二数值确定所述tf值。
23.在其中一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的时间衰减系数的步骤,包括:
24.基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目在第一收视时间和第二收视时间的时间差;
25.对每个所述内容标签,根据预设常量和所述时间差确定所述时间衰减系数。
26.在其中一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的时长影响因子的步骤,包括:
27.基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的目标收视总时长;
28.对每个所述内容标签,根据预设数值和所述目标收视总时长确定所述时长影响因子。
29.在其中一个实施例中,所述根据各个所述偏好值,确定所述目标用户对应的偏好标签的步骤,包括:
30.按照各个所述偏好值的数值大小,对各个所述偏好值对应的内容标签进行排序,得到排序结果;
31.根据预设选取个数对所述排序结果中的内容标签进行筛选;
32.将筛选后的内容标签作为所述目标用户的偏好标签。
33.第二方面,本技术提供了一种用户偏好的挖掘装置,包括:
34.节目标签矩阵构建模块,用于获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵;
35.用户收视节目矩阵构建模块,用于获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;
36.目标矩阵获取模块,用于基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户;
37.数值确定模块,用于基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数idf值,以及确定所述目标用户在各个所述内容标签上的词频指数tf值、时间衰减系数和
时长影响因子;
38.偏好值确定模块,用于基于各个所述idf值、所述tf值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值;
39.偏好标签确定模块,用于根据各个所述偏好值,确定所述目标用户对应的偏好标签。
40.第三方面,本技术提供了一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例中所述用户偏好挖掘方法的步骤。
41.第四方面,本技术提供了一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
42.所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行上述任一实施例中所述用户偏好挖掘方法的步骤。
43.从以上技术方案可以看出,本技术实施例具有以下优点:
44.本技术提供的一种用户偏好挖掘方法,包括:获取节目数据,并对节目数据中的每个节目匹配对应的内容标签,并根据每个内容标签构建节目标签矩阵;获取用户的收视数据,并根据收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;基于节目标签矩阵和用户收视节目矩阵得到目标矩阵,并确定目标用户;基于目标矩阵,确定各个内容标签的idf值,以及目标用户在各个内容标签上的tf值、时间衰减系数和时长影响因子;基于各个idf值、tf值、时间衰减系数和时长影响因子确定目标用户对各个内容标签的偏好值,并确定目标用户对应的偏好标签。通过改良的tf-idf算法并结合时间衰减算法和时长影响因子,可以提高用户偏好挖掘的精准度,提升内容推荐的触达率。
附图说明
45.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
46.图1为本技术实施例提供的一种用户偏好挖掘方法的流程示意图;
47.图2为本技术实施例提供的一种用户偏好挖掘方法实施过程示意图;
48.图3为本技术实施例提供的一种用户偏好的挖掘装置的结构示意图;
49.图4为本技术实施例提供的一种计算机设备的内部结构示意图。
具体实施方式
50.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
51.在一个实施例中,本技术提供了一种用户偏好挖掘方法,下述实施例以该方法应用于服务器为例进行说明。可以理解,执行用户偏好挖掘方法的服务器可以是单个服务器,
也可以是由多个服务器组成的服务器集群,本技术对此不作具体限制。如图1所示,该方法具体包括如下步骤:
52.s101:获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵。
53.本步骤中,获取节目数据,对节目数据进行类型标签化处理,也就是对节目数据中的每个节目匹配对应的内容标签,从而可以得到节目标签矩阵。
54.其中,每个节目可以匹配一个或多个内容标签,且不同节目对应的内容标签可以相同,例如,节目1匹配的内容标签为标签1,节目2匹配的内容标签为标签2和标签3,节目3匹配的内容标签为标签1和标签3。
55.s102:获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵。
56.本步骤中,获取用户的收视数据,并对该收视数据进行清洗,过滤无效数据,再根据收视数据中的用户信息和收视节目信息构建用户收视节目矩阵。
57.其中,用户收视节目矩阵可以是一个m*n的矩阵,在用户收视节目矩阵中,用户信息与收视节目信息相对应,也就是可以从该矩阵中得到用户所收视的节目,以及该节目对应的节目信息。
58.s103:基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户。
59.本步骤中,将节目标签矩阵和用户收视节目矩阵进行关联,可以得到目标矩阵,从目标矩阵的用户信息中可以确定目标用户。
60.其中,由于每个节目并不是包含了所有内容标签,所以得到的目标矩阵是一个稀疏矩阵。目标用户为目标矩阵各个用户中的任意一个。
61.s104:基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数idf值,以及确定所述目标用户在各个所述内容标签上的词频指数tf值、时间衰减系数和时长影响因子。
62.本步骤中,根据目标矩阵中的用户信息和节目信息,计算各个内容标签的idf值,同时计算出目标用户在各个内容标签上的tf值、时间衰减系数和时长影响因子。
63.其中,逆文本频率指数idf值是指一个内容标签普遍重要性的度量,词频指数tf值指的是某一个内容标签在该矩阵中出现的频率,时间衰减因子表征用户对内容标签的兴趣随时间衰减的程度,时长影响因子表征用户对内容标签的兴趣随收视时长变化的程度。
64.s105:基于各个所述idf值、所述tf值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值。
65.本步骤中,tf-idf的算法融合时间衰减系数和时长影响因子,计算出目标用户对各个内容标签的偏好值。
66.进一步地,在其中一个实施例中,可以计算tf值、idf值、时间衰减因子和时长影响因子的乘积,将乘积值作为目标用户对内容标签的偏好值。
67.s106:根据各个所述偏好值,确定所述目标用户对应的偏好标签。
68.本步骤中,在获得目标用户对各个内容标签的偏好值之后,基于各个偏好值的数值大小,按照选取规则,选取多个内容标签作为目标用户的偏好标签。
69.进一步地,对目标矩阵中的每个用户,确定该用户在各个内容标签上的偏好值之后,可以得到一个用户偏好矩阵,在该矩阵中,根据各个偏好值的数值大小,可以确定每个用户的偏好标签。
70.本技术提供的一种用户偏好挖掘方法,包括:获取节目数据,并对节目数据中的每个节目匹配对应的内容标签,并根据每个内容标签构建节目标签矩阵;获取用户的收视数据,并根据收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;基于节目标签矩阵和用户收视节目矩阵得到目标矩阵,并确定目标用户;基于目标矩阵,确定各个内容标签的idf值,以及目标用户在各个内容标签上的tf值、时间衰减系数和时长影响因子;基于各个idf值、tf值、时间衰减系数和时长影响因子确定目标用户对各个内容标签的偏好值,并确定目标用户对应的偏好标签。通过改良的tf-idf算法并结合时间衰减算法和时长影响因子,可以提高用户偏好挖掘的精准度,提升内容推荐的触达率。
71.在一个实施例中,所述用户收视节目矩阵中的所述收视节目信息包括用户收视的节目、所述节目的收视时长、所述节目的总时长以及所述节目每次的收视时间,所述基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵的步骤,包括:
72.根据所述节目标签矩阵,为所述用户收视节目矩阵中所述用户收视的节目匹配对应的内容标签,得到所述目标矩阵。
73.具体而言,节目标签矩阵中包括收视节目以及收视节目的内容标签,用户收视节目矩阵包括用户信息、用户收视的节目、节目的收视时长、节目的总时长以及节目每次的收视时间,故而,依据收视节目关联节目标签矩阵和用户收视节目矩阵,将用户收视节目矩阵中用户收视的节目匹配对应的内容标签,可以得到目标矩阵。
74.举例来说,若用户收视节目矩阵a为m*5的矩阵,其中a1表示用户的主键,a2表示用户收视的节目,a3表示节目的收视时长,a4表示节目的总时长,a5表示节目每次的收视时间。基于收视节目关联节目标签矩阵和用户收视节目矩阵a得到的目标矩阵p为m*n的矩阵,其中,p1表示用户的主键,p2表示用户收视的节目,p3~p(n-3)表示节目对应的内容标签,p(n-2)表示节目的收视时长,p(n-1)表示节目的总时长,pn表示节目每次的收视时间。
75.可以理解的是,由于存在大部分用户收看的节目内容都比较集中的情况,因此对节目进行标签化,能够在一定程度上解决数据稀疏性的问题,从而提升对用户偏好挖掘的精准度。
76.在一个实施例中,所述基于所述目标矩阵,确定各个所述内容标签的idf值的步骤,包括:
77.基于所述目标矩阵,确定每个所述内容标签对应的用户数量,以及所述目标矩阵中的总用户数;
78.根据每个所述内容标签对应的用户数量和所述总用户数确定各个所述内容标签的idf值。
79.具体而言,从目标矩阵中确定总用户数,以及每个内容标签对应的用户数量,通过公式计算确定各个内容标签的idf值。
80.进一步地,对每个内容标签,将该内容标签对应的用户数量与预设数值之和作为第一和数,总用户数与预设数值之和作为第二和数,第一和数与第二和数的商作为真数,以10为底数,取该真数的对数作为该内容标签的idf值。其中,预设数值可以为1。
81.举例来说,若对内容标签j计算idf值,公式具体为:
[0082][0083]
在一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的tf值的步骤,包括:
[0084]
基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的第一收视总次数和第一收视总时长,以及该内容标签对应节目的第一节目总时长;
[0085]
对每个所述内容标签,根据所述第一收视总次数、所述第一收视总时长以及所述第一节目总时长确定第一数值;
[0086]
基于所述目标矩阵,确定所述目标用户对各个所述节目的第二收视总次数和第二收视总时长,以及所述目标用户对应节目的第二节目总时长;
[0087]
根据所述第二收视总次数、所述第二收视总时长以及所述第二节目总时长确定第二数值;
[0088]
对每个所述内容标签,根据所述第一数值和所述第二数值确定所述tf值。
[0089]
具体而言,基于目标矩阵,对每个内容标签,确定目标用户对该内容标签对应节目的第一收视总次数和第一收视总时长,以及该内容标签对应节目的第一节目总时长,将第一收视总时长与第一节目总时长的比值乘以第一收视总次数,得到第一数值。基于目标矩阵,确定目标用户对各个节目的第二收视总次数和第二收视总时长,以及目标用户对应节目的第二节目总时长,将第二收视总时长与第二节目总时长的比值乘以第二收视总次数,得到第二数值。取第一数值与第二数值的比值,得到tf值。
[0090]
举例来说,若内容标签j计算tf值,公式具体为:
[0091][0092]
可以理解的是,结合实际情况,若单独只考虑次数会面临的问题包括某个内容标签对应节目的收视次数较多,但每次收视的时长却很短,或者,某个内容标签对应节目的收视次数很少,但每次收视的时长却很长。通过对tf值计算方式的改良,能够有效解决无法针对用户的偏好做精准挖掘的问题。
[0093]
在一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的时间衰减系数的步骤,包括:
[0094]
基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目在第一收视时间和第二收视时间的时间差;
[0095]
对每个所述内容标签,根据预设常量和所述时间差确定所述时间衰减系数。
[0096]
具体而言,基于目标矩阵,对每个内容标签,确定目标用户对该内容标签对应节目在第一收视时间和第二收视时间的时间差,将该时间差与预设常量的乘积值的负数作为指数,将e作为底数,做幂运算,得到时间衰减系数。
[0097]
其中,第一收视时间为目标用户最近一次收看该内容标签对应的节目,第二收视时间为第一收视时间的上一次收视时间。
[0098]
举例来说,若内容标签j计算时间衰减系数,公式具体为:
[0099]
α(j)=e-factor*δt
[0100]
其中,factor为预设常量,δt为第一收视时间和第二收视时间的时间差。
[0101]
在一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述容标签上的时长影响因子的步骤,包括:
[0102]
基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的目标收视总时长;
[0103]
对每个所述内容标签,根据预设数值和所述目标收视总时长确定所述时长影响因子。
[0104]
具体而言,基于目标矩阵,对每个内容标签,确定目标用户对该内容标签对应节目的目标收视总时长,以预设数值底数,取该目标收视总时长的对数作为时长影响因子。其中,预设数值可以是1.2
[0105]
举例来说,若内容标签j计算时长影响因子,公式具体为:
[0106]
β(j)=log
1.2
sum(j)
[0107]
在一个实施例中,所述根据各个所述偏好值,确定所述目标用户对应的偏好标签的步骤,包括:
[0108]
按照各个所述偏好值的数值大小,对各个所述偏好值对应的内容标签进行排序,得到排序结果;
[0109]
根据预设选取个数对所述排序结果中的内容标签进行筛选;
[0110]
将筛选后的内容标签作为所述目标用户的偏好标签。
[0111]
具体而言,按照各个偏好值的数值大小,对各个偏好值对应的内容标签进行从大到小排序,得到排序结果,根据预设选取个数对排序结果中的内容标签进行筛选,选取排序结果中前一个或多个内容标签,将筛选后的内容标签作为所述目标用户的偏好标签。
[0112]
其中,预设选取个数是大于或等于1的正整数,具体数值可根据实际情况确定。
[0113]
可以理解的是,目标矩阵中的内容是自动更新的,可以实时更新用户在各个内容标签上的偏好值,从而保证数据的实时性和准确性,再根据偏好值确定用户的偏好标签,进一步精准挖掘用户的偏好,减少人工运营,提升内容推荐的触达率。
[0114]
在一个示例中,如图2所示,本技术提供的用户偏好挖掘方法可以包括如下步骤:
[0115]
s201:获取节目数据集合,对节目数据集合中的每个节目匹配对应的内容标签,根据每个内容标签构建节目标签矩阵t;
[0116]
s202:获取用户收视数据集合,根据收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵a;
[0117]
s203:基于节目标签矩阵t和用户收视节目矩阵a得到目标矩阵p;
[0118]
s204:基于目标矩阵p,计算tf值、idf值、时间衰减因子α和时长偏好系数β;
[0119]
s205:根据tf值、idf值、时间衰减因子α和时长偏好系数β,确定用户标签偏好值;
[0120]
s206:选取偏好值靠前的标签作为用户的偏好标签。
[0121]
下面对本技术实施例提供的用户偏好的挖掘装置进行描述,下文描述的用户偏好的挖掘装置与上文描述的用户偏好挖掘方法可相互对应参照。
[0122]
在一个实施例中,本技术提供了一种用户偏好的挖掘装置。如图3所示,该装置具体包括节目标签矩阵构建模块301、用户收视节目矩阵构建模块302、目标矩阵获取模块
303、数值确定模块304、偏好值确定模块305和偏好标签确定模块306,其中:
[0123]
节目标签矩阵构建模块301,用于获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵;
[0124]
用户收视节目矩阵构建模块302,用于获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;
[0125]
目标矩阵获取模块303,用于基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户;
[0126]
数值确定模块304,用于基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数idf值,以及确定所述目标用户在各个所述内容标签上的词频指数tf值、时间衰减系数和时长影响因子;
[0127]
偏好值确定模块305,用于基于各个所述idf值、所述tf值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值;
[0128]
偏好标签确定模块306,用于根据各个所述偏好值,确定所述目标用户对应的偏好标签。
[0129]
在一个实施例中,所述用户收视节目矩阵中的所述收视节目信息包括用户收视的节目、所述节目的收视时长、所述节目的总时长以及所述节目每次的收视时间,所述目标矩阵获取模块303包括内容标签匹配单元,其中:
[0130]
内容标签匹配单元,用于根据所述节目标签矩阵,为所述用户收视节目矩阵中所述用户收视的节目匹配对应的内容标签,得到所述目标矩阵。
[0131]
在一个实施例中,所述数值确定模块304包括用户数确定单元和idf值确定单元,其中:
[0132]
用户数确定单元,用于基于所述目标矩阵,确定每个所述内容标签对应的用户数量,以及所述目标矩阵中的总用户数;
[0133]
idf值确定单元,用于根据每个所述内容标签对应的用户数量和所述总用户数确定各个所述内容标签的idf值。
[0134]
在一个实施例中,所述数值确定模块304包括第一收视数值确定单元、第一数值确定单元、第二收视数值确定单元、第二数值确定单元和tf值确定单元,其中:
[0135]
第一收视数值确定单元,用于基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的第一收视总次数和第一收视总时长,以及该内容标签对应节目的第一节目总时长;
[0136]
第一数值确定单元,用于对每个所述内容标签,根据所述第一收视总次数、所述第一收视总时长以及所述第一节目总时长确定第一数值;
[0137]
第二收视数值确定单元,用于基于所述目标矩阵,确定所述目标用户对各个所述节目的第二收视总次数和第二收视总时长,以及所述目标用户对应节目的第二节目总时长;
[0138]
第二数值确定单元,用于根据所述第二收视总次数、所述第二收视总时长以及所述第二节目总时长确定第二数值;
[0139]
tf值确定单元,用于对每个所述内容标签,根据所述第一数值和所述第二数值确定所述tf值。
[0140]
在一个实施例中,所述数值确定模块304包括时间差确定单元和时间衰减系数确定单元,其中:
[0141]
时间差确定单元,用于基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目在第一收视时间和第二收视时间的时间差;
[0142]
时间衰减系数确定单元,用于对每个所述内容标签,根据预设常量和所述时间差确定所述时间衰减系数。
[0143]
在一个实施例中,所述数值确定模块304包括目标收视总时长确定单元和时长影响因子确定单元,其中:
[0144]
目标收视总时长确定单元,用于基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的目标收视总时长;
[0145]
时长影响因子确定单元,用于对每个所述内容标签,根据预设数值和所述目标收视总时长确定所述时长影响因子。
[0146]
在一个实施例中,所述偏好标签确定模块306包括内容标签排序单元、内容标签筛选单元和偏好标签确定单元,其中:
[0147]
内容标签排序单元,用于按照各个所述偏好值的数值大小,对各个所述偏好值对应的内容标签进行排序,得到排序结果;
[0148]
内容标签筛选单元,用于根据预设选取个数对所述排序结果中的内容标签进行筛选;
[0149]
偏好标签确定单元,用于将筛选后的内容标签作为所述目标用户的偏好标签。
[0150]
在一个实施例中,本技术还提供了一种存储介质,所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述用户偏好挖掘方法的步骤。
[0151]
在一个实施例中,本技术还提供了一种计算机设备,所述计算机设备中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述用户偏好挖掘方法的步骤。
[0152]
示意性地,如图4所示,图4为本技术实施例提供的一种计算机设备的内部结构示意图,该计算机设备400可以被提供为一服务器。参照图4,计算机设备400包括处理组件402,其进一步包括一个或多个处理器,以及由存储器401所代表的存储器资源,用于存储可由处理组件402的执行的指令,例如应用程序。存储器401中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件402被配置为执行指令,以执行上述任意实施例的用户偏好挖掘方法。
[0153]
计算机设备400还可以包括一个电源组件403被配置为执行计算机设备400的电源管理,一个有线或无线网络接口404被配置为将计算机设备400连接到网络,和一个输入输出(i/o)接口405。计算机设备400可以操作基于存储在存储器401的操作系统,例如windows server tm、mac os xtm、unix tm、linux tm、free bsdtm或类似。
[0154]
本领域技术人员可以理解,图4中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0155]
本技术可以应用于包含显示界面及采集组件的终端,示例如手机及计算机等设
备。在用户授权的情况下,可以使用本技术提供的用户偏好挖掘方法采集授权用户的收视数据。示例如,在iptv视频平台上,使用本技术的用户偏好挖掘方法,采集授权用户的收视数据,以进行用户个性化推荐。
[0156]
本技术提供的用户偏好挖掘装置,可以应用于iptv运营领域,示例如,可以应用于网络电视等公共互联网平台,为用户欣赏视频节目提供一定的个性化需求。在使用本技术时,可以在具体的应用场合中,设立指示标志,以提醒用户在使用本技术的用户偏好挖掘装置时,会采集用户的收视数据,进而可以在获得用户授权的情况下,合法的采集用户的收视数据,以实现本技术的用户偏好挖掘装置。
[0157]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0158]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
[0159]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1