媒资推荐方法、装置、系统及计算机可读存储介质与流程

文档序号:24189049发布日期:2021-03-09 14:33阅读:97来源:国知局
媒资推荐方法、装置、系统及计算机可读存储介质与流程

1.本发明涉及媒资数据处理领域,尤其涉及一种媒资推荐方法、装置、系统及计算机可读存储介质。


背景技术:

2.在人工智能及大数据热潮的推动下,推荐系统被广泛应用到诸如视频、资讯和电商等面向用户的服务领域。推荐系统概括起来主要包含候选推荐结果召回和推荐结果的排序输出两个阶段,其中候选推荐结果召回的主要工作是针对系统不同的输入数据和业务场景,采用多种推荐算法生成推荐结果,并将所有结果组合成候选推荐结果集,推荐结果的排序输出的主要工作是针对召回阶段生成的候选推荐结果集进行排序优化,使得用户最感兴趣的物品能够排序到最前面。传统的视频服务网站往往需要大量专业的人员进行人工运营推荐,而现有的个性化智能推荐系统往往只需用户的行为日志数据就能达到甚至超过专业的人工运营效果,因而被广泛应用于各大主流视频网站。因此,针对现有的视频推荐系统,对推荐系统中的推荐算法及策略进行优化和改进是非常必要和有价值的。
3.现有的视频推荐系统主要存在以下问题:现有推荐系统中的推荐算法大都考虑用户短期的视频偏好进行关联推荐的视频可能并不是用户感兴趣的,从而导致推荐系统的准确率不高。


技术实现要素:

4.本发明的主要目的在于提出一种媒资推荐方法、装置、系统及计算机可读存储介质,旨在提高媒资推荐系统的准确率不高的问题,所述媒资推荐方法包括以下步骤:
5.获取预设历史时长内智能电视的每个用户观看媒资的观影数据,并根据所述观影数据计算所述用户对所观看的所述媒资的显性评分;
6.构建所述用户的id与所述媒资的id的显性评分矩阵,采用修正余弦算法计算所述显性评分矩阵中任意两种所述媒资之间的相似度;
7.分别以每种所述媒资为键值,按照所述相似度从大到小对多个所述媒资进行的排序,得到所述键值对应的媒资序列;
8.将所述媒资序列前m个所述媒资中已观看所述键值的所述用户未观看的所述媒资推荐至已观看所述键值的所述用户,其中,推荐顺序为所述相似度从大到小的顺序,所述m为正整数。
9.在一种实施方式中,所述观影数据包括所述预设历史时长内所述用户点击所观看的第i种所述媒资的点击参数n
i

adjusted
,所述预设历史时长内所述用户所观看的第i种所述媒资的平均完播率r
i

avg
,以及所述预设历史时长内所述用户所观看的第i种所述媒资的播放时长与所述预设历史时长内所述用户观看所有所述媒资的总时长比值r
i

percentage
,根据所述观影数据计算所述用户对所观看的所述媒资的显性评分步骤中的计算公式为:rating=(100*n
i

adjusted
+75*r
i

avg
+25*r
i

percentage
)/100*10,其中,所述rating为所述用户所观看
的第i种所述媒资的显性评分。
10.在一种实施方式中,所述n
i

adjusted
的计算公式为:n
i

adjusted
=n
i

click
/percentile(n,0.95),其中,所述percentile(n,0.95)表示所述预设历史时长内对每个所述用户点击第i种所述媒资的次数进行从小到大的排序,最大序号的95%的序号对应的次数;所述n
i

click
为所述预设历史时长内某个所述用户点击第i种所述媒资的总次数。
11.在一种实施方式中,所述r
i

avg
的计算公式为:所述t
i

watch
表示所述用户每次点击第i种所述媒资时的观看时长,所述t
i

video
表示第i种所述媒资完整播放时长,所述为所述用户点击第i种所述媒资的完整播放率。
12.在一种实施方式中,所述r
i

percentage
的计算公式为:r
percentage
=∑t
i_watch
/∑t
total
,所述∑t
i

watch
为所述用户在所述预设历史时长内观看第i种所述媒资的总时长,所述∑t
total
为所述用户在所述预设历史时长内观看所有所述媒资的总时长。
13.在一种实施方式中,所述采用修正余弦算法计算所述评分矩阵中任意两种所述媒资之间的相似度步骤中的相似度计算公式为:其中,所述(i,j)为包括媒资i和媒资j的媒资对;所述u
i
表示对媒资i有显性评分的用户集合;所述u
j
表示对媒资j有显性评分的用户集合;所述s
ui
为用户u对媒资i的显性评分正则化之后的结果,所述s
uj
为用户u对媒资j的显性评分正则化之后的结果。
14.在一种实施方式中,所述s
uj
的计算公式为:s
uj
=r
uj

μ
u
,其中,所述r
uj
为用户u对媒资j的显性评分,所述μ
u
为用户u对所有已观看所述媒资的显性评分的平均值。
15.此外,为实现上述目的,本发明还提供一种媒资推荐装置,所述媒资推荐装置包括:
16.获取模块,用于获取预设历史时长内智能电视的每个用户观看媒资的观影数据;
17.第一计算模块,用于根据所述观影数据计算所述用户对所观看的所述媒资的显性评分;
18.构建模块,用于构建所述用户的id与所述媒资的id的显性评分矩阵;
19.第二计算模块,用于采用修正余弦算法计算所述显性评分矩阵中任意两种所述媒资之间的相似度;
20.排序模块,用于分别以每种所述媒资为键值,按照所述相似度从大到小对多个所述媒资进行的排序,得到所述键值对应的媒资序列;
21.推荐模块,用于将所述媒资序列前m个所述媒资中已观看所述键值的所述用户未观看的所述媒资推荐至已观看所述键值的所述用户,其中,推荐顺序为所述相似度从大到小的顺序,所述m为正整数。
22.此外,为实现上述目的,本发明还提供一种媒资推荐系统,所述媒资推荐系统包括存储器、处理器及存储在存储器上并可在所述处理器上运行的媒资推荐程序,媒资推荐程
序被所述处理器执行时实现如上所述的媒资推荐方法的步骤。
23.此外,为实现上述目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有媒资推荐程序,所述媒资推荐程序被处理器执行时实现如上所述的媒资推荐方法的步骤。
24.本发明通过获取预设历史时长内智能电视的每个用户观看媒资的观影数据,并根据观影数据计算用户对所观看的媒资的显性评分;构建用户的id与媒资的id的显性评分矩阵,采用修正余弦算法计算显性评分矩阵中任意两种媒资之间的相似度;分别以每种媒资为键值,按照相似度从大到小对多个媒资进行的排序,得到键值对应的媒资序列;将媒资序列前m个媒资中已观看键值的用户未观看的媒资推荐至已观看键值的用户,可以通过调整预设历史时长将用户长期的观影习惯纳入推荐因素的参考范围,提高了媒资推荐系统的准确性,进一步地本实施例将用户在智能终端的隐性行为转换成显性评分,相似度的计算依托于显性评分的反馈才能实现,这为媒资推荐系统召回阶段的算法实现提供了更多的可能。
附图说明
25.图1为实现本发明各个实施例一种设备的硬件结构示意图;
26.图2为本发明媒资推荐方法第一实施例的流程示意图。
27.本发明目的的实现、功能特点及优点将结合实施例,参照附图做说明。
具体实施方式
28.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
29.本发明提供了一种媒资推荐系统,参照图1,图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
30.需要说明的是,图1即可为媒资推荐系统的硬件运行环境的结构示意图。本发明实施例媒资推荐系统可以是pc(personal computer,个人电脑),便携计算机,服务器等设备。
31.如图1所示,该媒资推荐系统可以包括:处理器1001,例如cpu,存储器1005,用户接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
32.可选地,媒资推荐系统还可以包括rf(radio frequency,射频)电路,传感器、wifi模块等等。
33.本领域技术人员可以理解,图1中示出的媒资推荐系统结构并不构成媒资推荐系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
34.如图1所示,作为一种计算机存储可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及媒资推荐程序。其中,操作系统是管理和控制媒资推荐系统硬件和软件资源的程序,支持媒资推荐程序以及其它软件或程序的运行。
35.图1所示的媒资推荐方法设备,可解决媒资推荐系统的准确率低的问题,用户接口1003主要用于侦测或者输出各种信息,如输入观影数据和反馈显示评分等;网络接口1004主要用于与后台服务器交互,进行通信;处理器1001可以用于调用存储器1005中存储的媒资推荐程序,并执行以下操作:
36.获取预设历史时长内智能电视的每个用户观看媒资的观影数据,并根据所述观影数据计算所述用户对所观看的所述媒资的显性评分;
37.构建所述用户的id与所述媒资的id的显性评分矩阵,采用修正余弦算法计算所述显性评分矩阵中任意两种所述媒资之间的相似度;
38.分别以每种所述媒资为键值,按照所述相似度从大到小对多个所述媒资进行的排序,得到所述键值对应的媒资序列;
39.将所述媒资序列前m个所述媒资中已观看所述键值的所述用户未观看的所述媒资推荐至已观看所述键值的所述用户,其中,推荐顺序为所述相似度从大到小的顺序,所述m为正整数。
40.本发明通过获取预设历史时长内智能电视的每个用户观看媒资的观影数据,并根据观影数据计算用户对所观看的媒资的显性评分;构建用户的id与媒资的id的显性评分矩阵,采用修正余弦算法计算显性评分矩阵中任意两种媒资之间的相似度;分别以每种媒资为键值,按照相似度从大到小对多个媒资进行的排序,得到键值对应的媒资序列;将媒资序列前m个媒资中已观看键值的用户未观看的媒资推荐至已观看键值的用户,可以通过调整预设历史时长将用户长期的观影习惯纳入推荐因素的参考范围,提高了媒资推荐系统的准确性,进一步地本实施例将用户在智能终端的隐性行为转换成显性评分,相似度的计算依托于显性评分的反馈才能实现,这为媒资推荐系统召回阶段的算法实现提供了更多的可能。
41.本发明移动终端具体实施方式与下述媒资推荐方法各实施例基本相同,在此不再赘述。
42.基于上述结构,提出本发明媒资推荐方法的各个实施例。
43.本发明提供一种媒资推荐方法。
44.参照图2,图2为本发明媒资推荐方法第一实施例的程示意图。
45.在本实施例中,提供了媒资推荐方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
46.在本实施例中,媒资推荐方法包括:
47.步骤s10,获取预设历史时长内智能电视的每个用户观看媒资的观影数据,并根据所述观影数据计算所述用户对所观看的所述媒资的显性评分;
48.步骤s20,构建所述用户的id与所述媒资的id的显性评分矩阵,采用修正余弦算法计算所述显性评分矩阵中任意两种所述媒资之间的相似度;
49.预设历史时长可设置为最近30天或最近10天等,智能电视为每个用户设置id,也为每个用户观看的媒资设置id,且将用户id与该用户观看的媒资的id进行关联绑定。观影数据包括观影的时间、预设历史时长内用户点击所观看的第i种媒资的点击参数、预设历史时长内用户所观看的第i种媒资的平均完播率、预设历史时长内用户所观看的第i种媒资的播放时长与预设历史时长内用户观看所有媒资的总时长比值等信息。显性评分指的是对用
户各类观影行为进行加权转化计算得出的用户对所观看的每种媒资的评分。
50.需要说明的是,在计算用户对媒资的显性评分之前,先对观影数据进行剔除,提出不符合常理的数据,主要是根据观影数据中的观影的时间进行剔除,例如获取到观影数据的实际时间是2020年8月3日零时零分零秒,但是观影数据中记录的观影的时间为2019年,很明显该观影数据为不符合常理的数据,将记录的观影的时间与获取到观影数据的实际时间不相符的观影数据剔除。
51.具体的,本实施例根据每个用户的观影数据计算每个用户对所观看的媒资的显性评分。
52.在一些实施例中,步骤根据所述观影数据计算所述用户对所观看的所述媒资的显性评分中的计算显性评分的公式为:rating=(100*n
i

adjusted
+75*r
i

avg
+25*r
i

percentage
)/100*10,其中,所述rating为所述用户所观看的第i种所述媒资的显性评分,所述n
i

adjusted
为所述预设历史时长内所述用户点击所观看的第i种所述媒资的点击参数,所述r
i

avg
为所述预设历史时长内所述用户所观看的第i种所述媒资的平均完播率,所述r
i

percentage
为所述预设历史时长内所述用户所观看的第i种所述媒资的播放时长与所述预设历史时长内所述用户观看所有所述媒资的总时长比值。
53.在一些实施例中,所述n
i

adjusted
的计算公式为:n
i

adjusted
=n
i

click
/percentile(n,0.95),其中,所述percentile(n,0.95)表示所述预设历史时长内对每个所述用户点击第i种所述媒资的次数进行从小到大的排序,最大序号的95%的序号对应的次数,例如用户数目为12个,最大序号为12,最大序号的95%按照四舍五入为序号11,若排在第11位的次数为23,那么将23作为percentile(n,0.95)的值;所述n
i

click
为所述预设历史时长内某个所述用户点击第i种所述媒资的总次数。
54.所述r
i

avg
的计算公式为:所述t
i

watch
表示所述用户每次点击第i种所述媒资时的观看时长,所述t
i

video
表示第i种所述媒资完整播放时长,所述为所述用户点击第i种所述媒资的完整播放率。
55.所述r
i

percentage
的计算公式为:r
percentage
=∑t
i_watch
/∑t
total
,所述∑t
i

watch
为所述用户在所述预设历史时长内观看第i种所述媒资的总时长,所述∑t
total
为所述用户在所述预设历史时长内观看所有所述媒资的总时长。
56.得到每个用户对所观看的媒资的显性评分,构造用户的id和媒资的id的显性评分矩阵,下表为显性评分矩阵的举例说明:显性评分的分值越大,表示用户的喜爱度越高,可以理解的是显性评分为零的表示用户未观看过。
[0057][0058]
采用修正余弦算法计算显性评分矩阵中任意两种媒资之间的相似度,例如上述显性评分矩阵,需计算任意两个媒资之间的相似度,由排列组合可知,通过上述的显性评分矩阵可获得个相似度。
[0059]
在一些实施例中,计算相似度的公式为:其中,所述(i,j)为包括媒资i和媒资j的媒资对;所述u
i
表示对媒资i有显性评分的用户集合;所述u
j
表示对媒资j有显性评分的用户集合;所述s
ui
为用户u对媒资i的显性评分正则化之后的结果,所述s
uj
为用户u对媒资j的显性评分正则化之后的结果。
[0060]
在一些实施例中,所述s
uj
的计算公式为:s
uj
=r
uj

μ
u
,其中,所述r
uj
为用户u对媒资j的显性评分,所述μ
u
为用户u对所有已观看所述媒资的显性评分的平均值。
[0061]
可以理解的是,所述s
ui
的计算公式为:s
ui
=r
ui

μ
u
,其中,所述r
ui
为用户u对媒资i的显性评分。
[0062]
步骤s30,分别以每种所述媒资为键值,按照所述相似度对多个所述媒资进行从大到小的排序,得到所述键值对应的媒资序列;
[0063]
步骤s40,将所述媒资序列前m个所述媒资中已观看所述键值的所述用户未观看的所述媒资推荐至已观看所述键值的所述用户,其中,所述m为正整数。
[0064]
同样以上述的显性评分矩阵为例,以id为1的媒资为键值,分别获取该键值与各个媒资的相似度,获取键值与id为2的媒资的相似度(相似度a)、键值与id为3的媒资的相似度(相似度b)、键值与id为4的媒资的相似度(相似度c)、键值与id为5的媒资的相似度(相似度d)、键值与id为6的媒资的相似度(相似度e),若d>b>a>c>e,那么以id为1的媒资为键值,根据相似度对媒资进行从大到小的排序,得到(id为5的媒资、id为3的媒资、id为2的媒资、id为4的媒资、id为6的媒资)这一媒资序列。m值可以设定,本实施例将m值设置为4,那么前m个媒资为id为5的媒资、id为3的媒资、id为2的媒资、id为4的媒资,但是还需从这4个媒资中提取出观看了键值的用户,即id为1的用户未观看的媒资,即id为4的媒资和id为5的媒资,按照相似度从大到小的顺序,依次将id为5的媒资、id为4的媒资推荐给id为1的用户。
[0065]
本实施例通过获取预设历史时长内智能电视的每个用户观看媒资的观影数据,并根据观影数据计算用户对所观看的媒资的显性评分;构建用户的id与媒资的id的显性评分矩阵,采用修正余弦算法计算显性评分矩阵中任意两种媒资之间的相似度;分别以每种媒资为键值,按照相似度从大到小对多个媒资进行的排序,得到键值对应的媒资序列;将媒资
序列前m个媒资中已观看键值的用户未观看的媒资推荐至已观看键值的用户,可以通过调整预设历史时长将用户长期的观影习惯纳入推荐因素的参考范围,提高了媒资推荐系统的准确性,进一步地本实施例将用户在智能终端的隐性行为转换成显性评分,相似度的计算依托于显性评分的反馈才能实现,这为媒资推荐系统召回阶段的算法实现提供了更多的可能。
[0066]
此外,本发明实施例还提出一种媒资推荐方法装置,所述媒资推荐装置包括:
[0067]
获取模块,用于获取预设历史时长内智能电视的每个用户观看媒资的观影数据;
[0068]
第一计算模块,用于根据所述观影数据计算所述用户对所观看的所述媒资的显性评分;
[0069]
构建模块,用于构建所述用户的id与所述媒资的id的显性评分矩阵;
[0070]
第二计算模块,用于采用修正余弦算法计算所述显性评分矩阵中任意两种所述媒资之间的相似度;
[0071]
排序模块,用于分别以每种所述媒资为键值,按照所述相似度从大到小对多个所述媒资进行的排序,得到所述键值对应的媒资序列;
[0072]
推荐模块,用于将所述媒资序列前m个所述媒资中已观看所述键值的所述用户未观看的所述媒资推荐至已观看所述键值的所述用户,其中,推荐顺序为所述相似度从大到小的顺序,所述m为正整数。
[0073]
本发明媒资推荐方法装置实施方式与上述媒资推荐方法各实施例基本相同,在此不再赘述。
[0074]
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质上存储有媒资推荐程序,媒资推荐程序被处理器执行时实现如上的媒资推荐方法的各个步骤。
[0075]
需要说明的是,计算机可读存储介质可设置在媒资推荐系统中。
[0076]
本发明计算机可读存储介质具体实施方式与上述媒资推荐各实施例基本相同,在此不再赘述。
[0077]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0078]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0079]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
[0080]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1