一种视频内容推荐方法、设备和系统的制作方法

文档序号:10555972阅读:291来源:国知局
一种视频内容推荐方法、设备和系统的制作方法
【专利摘要】本发明实施例提供一种视频内容推荐方法、设备和系统,视频内容推荐设备对用户历史观看数据进行分析,得到各种个性化喜好参数;根据各种个性化喜好参数和用户个体特性信息,对用户历史观看数据进行整理和交叉,得到按照个性化喜好参数和用户个体特性信息的分组观看数据;根据表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵对分组观看数据进行处理;基于处理结果,将各个视频内容对应的频道作为自变量得到对应的系数;按一定的比例折算成推荐权重系数Wi;根据不同的权重系数Wi进行对应视频内容的推荐。通过本发明的视频内容推荐方法、设备和系统,可以对不同频道进行精细的视频内容推荐。
【专利说明】
_种视频内容推荐方法、设备和系统
技术领域
[0001]本发明实施例涉及视频技术领域,尤其涉及一种视频内容推荐方法、设备和系统。
【背景技术】
[0002]近几年,互联网、网络视频、IT、家电甚至于消费类电子产品等企业纷纷通过多种跨界(如,跨屏、跨平台、跨网络、跨生态链等)向传统广电领域渗透。
[0003]随着上述企业不断的“攻城掠地”,无论是用户群体还是其市场份额,传统广电机构终于意识到危机的来临,部分地区的广电机构“领头羊”们开始紧盯着全球科技的新趋势、新技术,也想借此机会在云计算、大数据、云存储、3D、全息影像等方面发力。
[0004]随着互联网特别是社会化网络的快速发展,我们正处于信息过载的时代。用户面对过量的信息很难找到自己真正感兴趣的内容,而内容提供商也很难把优质的内容准确推送给感兴趣的用户。推荐系统被认为是解决这些问题的有效方法,它对用户的历史行为进行挖掘,对用户兴趣进行建模,并对用户未来的行为进行预测,从而建立了用户和内容的关系O
[0005]视频网站同样也面临着信息过载的问题,比如YouTube目前有数十亿视频条目,而且每分钟都有近1500分钟时长的视频被上传,而专业视频网站Hulu也有近20万的高质量视频,用户也很难从中找到自己真正感兴趣的内容;同时提高用户的观看和停留时间也非常重要,所以推荐系统对于视频网站来说是有必要的。
[0006]目前视频网站主要分为两种,一种是以用户产生内容为主的网站(UGC网站),比如国外的YouTube和国内的优酷、土豆等;另一种是专业视频内容为主的网站,比如国外的Hulu、Netflix和国内的奇艺、新浪大片、搜狐视频等。为了获得广告商和资本市场的青睐,国内UGC视频网站比如优酷和土豆也纷纷转型为两者兼备的模式。这两种视频网站的内容和用户行为都是不一样的,从而会导致相应的推荐系统的设计也会有一定差别。
[0007]相比较而言,UGC网站的视频数量多,内容比较丰富,但是质量良莠不齐,以短视频居多,而且没很好的内容数据。一般的推荐是基于单个视频的,而且会对视频质量做一定过滤(比如去重和限制最少观看次等);UGC内容生命周期比较短,所以推荐系统的设计比较强调时效性,把最新的视频推荐给用户,保持推荐的新鲜性;同时UGC网站的内容比较多样化并且用户一般没有很强的目的性,所以推荐要尽量多样化并且和用户最近的行为相关。
[0008]对于专业视频网站,内容一般有很好的结构化内容数据,基本上都是按照电视剧或者电影来统一组织视频,所以推荐一般都是基于剧集而不是单个视频;剧集按照现在是否在播又分为首播剧(On-airshow)和重播剧(Library show),相比较而言首播剧一般比较热门,用户获知的渠道很多并对其有明确的追看(Catch-up)需求,而过往剧集更适合推荐;视频的长度一般比较长而且剧集中有很多视频,用户的接受成本相对比较高,推荐的时机也是专业视频网站需要考虑的问题,比如周末或者节假日用户比较空闲而且一般没有首播剧,适合推荐一些较长的连续剧等。
[0009]当然除了这些不同点外,一般认为视频网站的推荐系统设计还应遵循一些基本的原则,比如系统能给出合理的推荐赢得用户的信任;系统能对用户的行为作出即时的反应;推荐的逻辑对用户透明;在适当时机鼓励用户积极参与和反馈;推荐的结果要提供足够的信息等。
[0010]从推荐产品形态上来看,目前在视频网站中使用的推荐有以下几类:相关推荐、个性化推荐以及个性化电视频道等。
[0011]相关推荐就是把用户正在观看或者浏览的视频的相关视频推荐给用户,也就是“喜欢这个视频的用户还喜欢”,结果展示出视频的重要信息(标题、缩略图、平均打分、类型、年代、时长、简介、导演、演员等),并且提供打分或者不感兴趣的选项来收集用户反馈。
[0012]个性化推荐是根据用户所有的历史行为推断出用户的兴趣,并以此推荐用户最可能感兴趣的视频列表。与相关推荐相比,个性化推荐综合使用了用户的所有历史行为,包括打分、观看、订阅、搜索、标注标签、分享和评论等,而不仅仅是当前的单个浏览或观看行为,所以更准确反映出用户的兴趣。从历史行为中反映的用户兴趣也可能会多样化,所以一般个性化推荐展示结果会按照相对独立的兴趣点(比如类型等)进行聚合。例如个性化推荐的展示形式:我们按照推荐视频的类型对结果进行聚合,用户也可以切换自己感兴趣的类型;结果有很详细的视频内容信息以及最有用的用户评论信息;推荐结果有解释;用户可以直接对推荐结果进行“已经看过”或者“感兴趣与否”的反馈,如果感兴趣还可以进一步收藏推荐结果或者直接进入观看页面等。
[0013]用户可以创建自己的频道,或者推荐系统根据用户的历史行为自动创建符合用户兴趣的视频节目频道。用户可以不间断地观看频道里面的视频,播放的过程中系统不断收集用户对视频的反馈(喜欢、不喜欢、跳过、看完等)实时调整推荐列表,让用户看到越来越满意的结果。
[0014]个性化推荐系统具有良好的发展和应用前景。目前,几乎所有的大型电子商务系统,如AmazorueBay等不同程度的使用了各种形式的推荐系统。国内方面,知名购物网站麦包包、凡客诚品、库巴网、红孩子等都率先选择了本土最先进的百分点推荐引擎系统构建个性化推荐服务系统。在日趋激烈的竞争环境下,个性化推荐系统能有效的保留客户,提高电子商务系统的服务能力。成功的推荐系统会带来巨大的效益。另一方面,各种提供个性化服务的Web站点也需要推荐系统的大力支持,国内推荐系统领航者百分点科技就Web站点个性化内容推荐方面也做出了贡献,在信息爆棚的今天,实施个性化阅读势在必行。
[0015]—般认为推荐系统的方法可以按照数据和模型两个维度进行分类。从使用的数据上来看,推荐系统可以分为协同过滤系统、内容过滤系统和社会化过滤系统等;从使用的模型来看可分为基于邻域的模型、矩阵分解模型和图模型等。
[0016]协同过滤是推荐系统中最著名的方法,它主要通过用户的历史行为分析出用户的兴趣并给用户做出推荐。协同过滤有很多算法,比较常见的有邻域算法(User CF和I tem CF等)、矩阵分解算法(或Latent Factor Model,如RSVD和SVD++等)和图算法等。目前视频网站中比较常用的协同过滤算法是Item CF,它的基本假设就是用户会喜欢跟自己之前喜欢视频比较类似的视频。因此在给这个用户做推荐的时候,需要先从用户的历史行为中得到他喜欢的视频列表,然后从剩下的视频中找到和用户之前喜欢列表最相似的视频推荐给他。可见这个方法最核心的就是怎样合理计算两个视频的相似度,比较常用的有余弦相似度或者皮尔逊相关系数等,实际使用的时候需要根据具体情况进行修正。一般认为Item CF算法比较简单、容易扩展,准确度比较高,能实时更新而且可以解释,可以处理显式(打分或者感兴趣)或者隐式反馈(其他如观看等行为),所以在实际的视频推荐系统中如Netflix、Hulu和YouTube都使用了它。协同过滤方法的一个重要缺点是不能冷启动,也就是对于新加入的视频或者用户都不能做出推荐,一般需要混合其他推荐方法(比如内容过滤等)来处理这个问题。
[0017]内容过滤的基本思想是给用户推荐和他们之前喜欢的视频在内容上相似的其他视频。比如用户喜欢看《两杆大烟枪》,那么内容过滤系统就会推荐盖.里奇的其他类似内容作品如《偷拐抢骗》等;如果用户喜欢《火影忍者》,系统就会推荐《火影忍者疾风传》或者其他热血类的日本动画。因此内容过滤的核心是怎样计算两个视频之间的内容相似度。一般情况下,计算视频的内容相似度是从视频内容(比如标题、类型、地区、出品公司、年代、导演、演员、剧情简介、用户标签、评论等)中抽取出关键词,然后确定这些关键词的权重,这样得到了这个视频的向量模型,再计算两个视频向量模型的相似度。随着专家标注系统Pandora在音乐推荐领域的大获成功,目前在视频领域也出现了类似的网站比如Jinni,它定义了描述电影基因的900多个标签(类型、剧情、类别、年代、地点、心情、适合的观影人群、好评、风格、态度、画面等),然后电影专家会给每部电影标注这些标签,从而可以得到每部电影的专家标注的向量空间并以此做出推荐。由于专家标注的工作量非常大又没有公认的收益,目前在实际中并没有大规模使用,一般视频网站还是使用比较传统的方法,结合视频的内容和用户的标签进行内容过滤。
[0018]社会化过滤的思想是用户的喜好可能会受他在社会网络中的好友影响。随着SNS网络的兴起,社会化网络的推荐越来越受到关注,比如视频搜索网站Clicker就利用Facebook的好友关系做出推荐;当然利用Facebook的另外一个好处是视频网站可以得到用户的更多信息,特别是一些站外的Like信息,这些也会帮助改善推荐质量。
[0019]视频推荐系统主要工作是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频展示给用户。因此一个完整的推荐系统,至少包括日志系统、推荐引擎和展示界面设计等部分。
[0020]日志系统主要收集用户的行为和对推荐系统的反馈。推荐引擎也分离线和在线两部分:离线系统主要负责生成视频相关矩阵,存储在数据库中,供在线系统实时查询和调用;在线系统负责实时响应用户的请求,在线提取和分析用户行为并生成最终推荐结果。
[0021]推荐引擎离线部分利用收集到的用户行为日志:计算出一系列的关联矩阵(比如视频之间的两两相似度、电影主题和视频的之间关联等);计算全局或者某些群体用户的对推荐系统反馈(比如用户行为的权重、推荐算法的权重等)。
[0022]在进行视频内容推荐时,面对的往往是在成千上万个小时的海量视频中大海捞针,传统上须要投入的人力和时间,简直让人不敢想象,也很不现实。因此,如何通过从海量视频中搜索特定目标并推荐给用户,已经成为当前视频内容推荐迫切须要解决的问题。
[0023]目前各种人工进行视频内容推荐筛选,无法对不同频道进行精细的视频内容推荐。

【发明内容】

[0024]本发明实施例提供一种视频内容推荐方法、设备和系统,用以解决现有技术中用户无法对不同频道进行精细的视频内容推荐的缺陷。
[0025]本发明的一方面提供一种视频内容推荐方法,包括:对用户历史观看数据进行分析,得到各种个性化喜好参数;根据各种个性化喜好参数和用户个体特性信息,对用户历史观看数据进行整理和交叉,得到按照个性化喜好参数和用户个体特性信息的分组观看数据;根据表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵对分组观看数据进行处理;基于处理结果,将各个视频内容对应的频道作为自变量得到对应的系数;按一定的比例将频道作为自变量得到对应的系数折算成推荐权重系数1;根据不同的权重系数W1进行对应视频内容的推荐。
[0026]本发明的另一方面提供一种视频内容推荐设备,包括:处理器、发送器、接收器;
[0027]接收器,用于接收用户观看数据;
[0028]处理器用于对用户历史观看数据进行分析,得到各种个性化喜好参数;根据各种个性化喜好参数和用户个体特性信息,对用户历史观看数据进行整理和交叉,得到按照个性化喜好参数和用户个体特性信息的分组观看数据;根据表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵对分组观看数据进行处理;基于处理结果,将各个视频内容对应的频道作为自变量得到对应的系数;按一定的比例将频道作为自变量得到对应的系数折算成推荐权重系数W1;根据不同的权重系数Wi确定对应的推荐视频内容;
[0029]发送器,用于发送推荐视频内容。
[0030]本发明的再另一方面提供一种视频内容推荐系统,包括网络传输系统和上述的视频内容推荐设备。
[0031]本发明实施例提供的一种视频内容推荐方法,设备和系统,可以对不同频道进行精细的视频内容推荐。
【附图说明】
[0032]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本发明一实施例的一种数字有线电视广播系统结构示意图;
[0034]图2为本发明另一实施例的一种UMTS通信系统结构示意图;
[0035]图3为本发明另一实施例中的一种视频内容推荐设备的结构示意图;
[0036]图4为本发明另一实施例的一种视频内容推荐方法的流程示意图。
【具体实施方式】
[0037]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0038]本文中描述的视频内容推荐方法及设备可用于各种视频系统,例如有线电视系统,视频网站,电子商务网站等等。
[0039]本文中描述的视频内容推荐方法及设备可以通过各种终端实现,例如电脑,电视剧和具有视频播放系统的无线终端。
[0040]其中,具有视频播放系统的无线终端,可以是指向用户提供语音和数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。具有视频播放系统的无线终端可以经无线接入网(例如,RAN,Rad1 Access Network)与一个或多个核心网进行通信,具有视频播放系统的无线终端可以是移动终端,如移动电话和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的具有视频播放系统的移动装置,它们与无线接入网交换语言和/或数据。例如,具有视频播放系统的个人通信业务(PCS,Personal Communicat1n Service)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(WLL,Wireless Local Loop)站、个人数字助理(PDA,PersonalDigital Assistant)等设备。具有视频播放系统的无线终端也可以称为系统、订户单元、订户站,移动站、移动台、远程站、接入点、远程终端、接入终端、用户终端、用户代理、用户设备或用户装备。
[0041]另外,本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符,一般表示前后关联对象是一种“或”的关系。
[0042]本发明实施例的视频内容推荐设备为一种视频内容提供设备或视频内容提供服务器,所示视频内容提供设备或视频内容提供服务器通过数字有线电视广播系统或无线网络通信系统给用户终端提供视频内容,用户终端可以是电脑,PDA,电视机,移动手机电视,车载移动电视等等。
[0043]模拟电视有NTSC、PAL和SECAM三种标准。目前,数字电视在美国、欧洲和日本各自形成三种不同的数字电视标准。美国的标准是先进电视制式委员会(AT SC ,AdvancedTelevis1n System Committee)标准;欧洲的标准是数字视频广播(DVB,Digital VideoBroadcasting)标准;日本的标准是综合业务数字广播(ISDB,Integrated ServicesDigital Broadcasting)标准。我国也制定了相关的标准:中国移动多媒体广播(CMMB,China Mobile Multimedia Broadcasting)标准,数字多媒体移动广播(DMB,DigitalMultimedia Broadcasting)标准。DVB传输系统涉及卫星、有线电视、地面、SMATV、MMDS等所有传输媒体。它们对应的DVB标准为:数字卫星广播系统标准(DVB-S)、数字有线电视广播系统标准(DVB-C)、数字地面电视广播系统标准(DVB-T)。
[0044]例如,如图1所示,为本发明一实施例的一种数字有线电视广播系统结构示意图,数字有线电视广播系统包括视频内容提供服务器10、前端系统11、网络系统12和用户终端13,其中,视频内容提供服务器10用于提供视频内容,前端系统11是整个数字有线电视系统的核心,网络系统12是系统的基础平台,用户终端13是实现最终的结果。
[0045]前端系统11是有线电视网络的信息源、交换中心,一般由数字卫星接收机、视频服务器、编解码器、复用器、QAM调制器、各种管理服务器以及控制网络部分等设备组成。数字电视前端系统11一般可分为四个主要部分:信号输入部分、信号处理部分、信号输出部分和系统管理部分,每一个部分都有其特定的功能,最终组成完整的数字电视前端系统。
[0046]输入部分,接收来自不同网络的许多节目,如卫星、开路接收等各种接入方式,也有的是本地的模拟电视节目经编码压缩以及视频服务器形成的,将接收的信号转换为统一的格式送入信号处理部分。
[0047]信号处理部分包括:解扰、复用、SI处理等,它是数字前端的核心。信号处理部分主要完成的是对所有节目进行解扰、截取、复用等处理。服务信息随时更新,以保证正确地引导机顶盒的正常工作,并且所有的应用数据均能正确地插入。另外,信号处理部分的管理,须采用集成的管理系统,在所有的前端处理部分,均以异步串行接口(ASI ,AsynchronousSerial Interface)作为标准接口,这样以后就能容易增加任何厂商所提供的设备,具有良好的兼容性。
[0048]信号输出部分接收信号处理部分已经处理的信息后,把它变成传输网络所需的信号格式,典型的64QAM调制器用于有线电视网。在调制器的使用中,对输出电平和频率的设置调试非常重要。
[0049]系统管理部分的各种管理服务器主要完成一些用户信息管理和计费工作,以及影视材料的管理工作和安全保密等。控制网络部分主要完成各种服务器中的各种信息传递工作及后台的影视材料和数据的交换。
[0050]网络部分12包括各种光发射机,各种光发射机组成的拓朴结构一般有星型结构、树型结构和星树型混合结构、以及两级光链路级联的双星型结构。
[0051]用户终端13,可以由数字机顶盒(STB)和显示器组成,或者由网络终端和显示器组成,利用有线电视网络作为传输平台,使用户享受数字电视、数据广播等全方位的信息服务。
[0052]视频内容提供设备或视频内容提供服务器不仅可以和数字有线电视广播系统结合,还可以和各种通信系统结合,用于向用户提供数字电视、数据广播等全方位的信息服务。
[0053 ]各种通信系统,例如当前2 G,3 G通信系统和下一代通信系统,例如全球移动通信(GSM,Global System for Mobile communicat1n)系统,码分多址(CDMA,Code Divis1nMultiple Access)系统,时分多址(TDMA,Time Divis1n Multiple Access)系统,宽带码分多址(WCDMA,Wideband Code Divis1n Multiple Access Wireless)系统,频分多址(FDMA,Frequency Divis1n Multiple Access)系统,正交频分多址(0FDMA,0rthogonalFrequency-Divis1n Multiple Access)系统,通用分组无线业务(GPRS,General PacketRad1 Service)系统,通用移动通信UMTS(Universal Mobile Telecommunicat1ns)系统,长期演进(LTE,Long Term Evolut1n)系统,以及其他此类通信系统。
[0054]例如,以UMTS网络为例,如图2所示,为本发明另一实施例的一种UMTS通信系统结构示意图。UMTS通信系统包括:相互通信的接入网和核心网,其中,接入网包括多个基站21和多个无线网络控制器22,核心网分为电路域(CS domain)和分组域(PS domain),CS域主要是话音业务,由相互连接的移动交换中心(MSC,Mobile Switching Center)服务器和媒体网关(MGff ,Media Gateway)组成,其中MSC服务器包括相互连接的访问移动交换中心(VMSC,Visited Mobile-services Switching Centre)23和网关移动交换中心(GMSC,Gateway Mobile Switching CenterdPS域主要是移动数据业务,主要由相互连接的服务GPRS支持节点(SGSN,Serving GPRS Support Node)26和网关GPRS支持节点(GGSN,Gateway GPRS Support Node)27组成。MGW25还连接(PSTN,Public Switched TelephoneNetwork) 28等。GGSN27通过因特网29连接视频内容提供服务器20。
[0055]视频内容提供服务器20用于提供视频内容,通过UMTS通信系统给用户终端提供视频内容。
[0056]视频内容提供服务器10和20具有相同的结构,视频内容提供服务器10和20还可以作为一种视频内容推荐设备,例如,如图3所示,为本发明另一实施例中的一种视频内容提供设备的结构示意图,其具体结构和工作过程如下。
[°°57] 视频内容推荐设备包括处理器(processor) 301、发送器(transmitter) 302、接收器303、通信接口(Communicat1ns Interface)304、存储器(memory)305和通信总线306 ;其中,处理器301、发送器302、接收器303、通信接口 304和存储器305通过通信总线306完成相互间的通信。
[0058]处理器301可能是一个中央处理器CPU,或者是特定集成电路ASIC(Applicati0nSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
[0059]存储器305用于存放程序代码,程序代码包括计算机操作指令。存储器305可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
[0060]通信接口304,用于实现这些装置之间的连接通信。
[0061]接收器303,用于接收用户观看数据。
[0062]处理器301用于执行程序代码,用于对用户历史观看数据进行分析,得到各种个性化喜好参数;根据各种个性化喜好参数和用户个体特性信息,对用户历史观看数据进行整理和交叉,得到按照个性化喜好参数和用户个体特性信息的分组观看数据;根据表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵对分组观看数据进行处理;基于处理结果,将各个视频内容对应的频道作为自变量得到对应的系数;按一定的比例将频道作为自变量得到对应的系数折算成推荐权重系数Wi;根据不同的权重系数Wi确定对应的推荐视频内容。
[0063]发送器302,用于发送推荐视频内容。
[0064]处理器301用于根据表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵对分组观看数据进行处理具体包括:处理器301用于将表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵置于混合效应模型公式(I),并根据混合效应模型公式(I)对分组观看数据进行运算。
[0065]在本发明的另一实施例中,所有权重系数Wi序列之和是100%。
[0066]混合效应模型,简称混合模型,亦称混合方差分量模型、方差分析模型m,既包含固定效应(Fixed Effect)模型,又包含随机效应(Random Effect)的统计模型。
[0067]固定效应类似于标准回归系数,直接有历史数据回归估计得到。
[0068]随机效应不是直接估计(尽管它可能取自事后估计),而是从它们的方差和协方差估计值中总结而来。随机效应以随机截距或者随机系数的形式呈现,数据的组织结构可能包括嵌套分组的多重水平。这样,在文献中,混合效应模型还被称为多水平模型和分层模型。用于拟合反应分布之变异的混合效应模型的混合效应命令以符合正态分布的随机效应为条件。
[0069]混合效应模型的复杂性和全面性能够有效捕捉数据的稳定特征(固定效应)和随机变化的特征(机效应)。
[0070]处理器301采用如下的混合效应模型公式(I)进行数据运算。
[0071]Yi = XiP+Zibi+ei 公式(I)
[0072]其中,X1= Z1K1是已知的(m Xp)协方差矩阵。任何相关的参数都会根据实际情况定义。其中,β表示固定效应,bi表示随机效应,其中,β和bi为频道作为自变量得到对应的系数;其中¥工表示因变量矩阵,表示分组观看数据,例如对于某个用户看过的视频组(要细分到不同类型属性视频)41表示自变量矩阵,表示用户个体特性信息,例如一个用户的用户个体特性信息(例如,年龄,性别,收入等);^表示误差项矩阵,是混合效应模型自带生成,不需要人工定义J1表示另一系列属性区别于X1的自变量矩阵,例如用户历史观看数据;K1表示一个权重系数,经过一系列事前设定满足X1 = Z1K15IU表示η个样本里第i个;P表示实际的矩阵运算结果反应的参数,不需要人工定义;i表示第i个样本中的序数i,为正整数,i =I,2,3,...,i0
[0073]其中,混合效应模型公式(I)还需要满足如下要求:
[0074]bi ?N(0,D)
[0075]ε? ?Ν(0,Σ?)
[0076]cov(bi,b2,...,bi;ei,e2,...,εΝ)=0
[0077]其中,bi?N(0,D)表示b服从标准正态分布,其中N(0,D)表示标准正态分布。
[0078]ei?N(0,Xi)表示ε服从标准正态分布,其中ε??Ν(0,Xi)表示对应的标准正太分布,Si表示加和运算。
[0079]cov(bi,b2,...,bi; ,ε2,...,£ν) =0表不协方差矩阵,cov表不协方差。
[0080]在本发明的另一方面,混合效应模型公式(I)的模型结果还参考因变量Yi的密度方程,定义为公式(2):
[0081]f (yi) = Jf (yi I bi)f (bi)dbi 公式(2)
[0082]其中,f(yi)表示密度方程表达式符号,yi表示因变量Yi里的元素,Hy1Ib1)表示用b来表达f (y)的密度方程,f (bi)表不b的密度方程,d表不微分符号。
[0083]本发明的另一实施例还提供一种视频内容推荐方法,由视频内容提供服务器(也即视频内容推荐设备)执行,如图4所示,为本发明另一实施例的一种视频内容推荐方法的流程示意图。
[0084]步骤401,对用户历史观看数据进行分析,得到各种个性化喜好参数。
[0085]例如,视频内容提供服务器对用户历史观看数据进行分析,得到用户偏好的视频所属类型,以及各种类型所喜欢观看的时间分布等。
[0086]步骤402,根据各种个性化喜好参数和用户个体特性信息,对用户历史观看数据进行整理和交叉,得到按照个性化喜好参数和用户个体特性信息的分组观看数据。
[0087]例如,视频内容提供服务器根据得到的各种个性化喜好参数,结合用户个体特性信息对对用户历史观看数据进行整理和交叉得到对应分组,例如,用户个体特性信息包括用户年龄、收入、社交平台活动的历史等数据,例如观看时间以及搭配的视频类型/长短,不同年龄收入甚至教育程度用户偏向的关键元素数据(例如演员,语种,视频流版本等)。
[0088]步骤403,根据表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵对分组观看数据进行处理。
[0089]例如,将表示历史观看数据的自变量矩阵、表示用户个体特性信息的自变量矩阵和表示分组观看数据的因变量矩阵置于混合效应模型公式(I),并根据混合效应模型公式
(I)对分组观看数据进行运算,其中,混合效应模型公式(I)参考前文。
[0090]步骤404,基于处理结果,将各个视频内容对应的频道作为自变量得到对应的系数。
[0091]例如,基于混合效应模型公式(I)的运算结果,将各个视频内容对应的频道作为自变量得到对应的系数,频道作为自变量得到对应的系数为混合效应模型公式(I)中的β和bi,其中,β表示固定效应,bi表示随机效应。
[0092]步骤405,按一定的比例将频道作为自变量得到对应的系数折算成推荐权重系数
W1
[0093]权重系数Wi是经过一些列计算方法合成的有关于Yi = XiiHZibAei里面β和bi的数学组合,所有权重系数Wi序列之和是100%。
[0094]步骤406,根据不同的权重系数W1进行对应视频内容的推荐。
[0095]在上述视频内容推荐方法的运用中,步骤402-405的操作细节和制定规则都是独立。根据不同的用户特征和内容库内容进行符合行业规则的分组。最后统一按照自定的映射规则换算成加和为100%的权重系数Wi序列,按照权重数值Wi序行实时的视频内容组合推荐。
[0096]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0097]在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0098]以上所描述的装置实施例仅仅是示意性的,所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0099]另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0100]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0101]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种视频内容推荐方法,其特征在于,包括: 对用户历史观看数据进行分析,得到各种个性化喜好参数; 根据所述各种个性化喜好参数和用户个体特性信息,对所述用户历史观看数据进行整理和交叉,得到按照所述个性化喜好参数和所述用户个体特性信息的分组观看数据;根据表示所述历史观看数据的自变量矩阵、表示所述用户个体特性信息的自变量矩阵和表示所述分组观看数据的因变量矩阵对所述分组观看数据进行处理; 基于所述处理结果,将各个视频内容对应的频道作为自变量得到对应的系数; 按一定的比例将所述频道作为自变量得到对应的所述系数折算成推荐权重系数W1; 根据不同的权重系数W1进行对应视频内容的推荐。2.根据权利要求1所述的方法,其特征在于,所述根据表示所述历史观看数据的自变量矩阵、表示所述用户个体特性信息的自变量矩阵和表示所述分组观看数据的因变量矩阵对所述分组观看数据进行处理具体包括: 将表示所述历史观看数据的自变量矩阵、表示所述用户个体特性信息的自变量矩阵和表示所述分组观看数据的因变量矩阵置于混合效应模型公式(I),并根据所述混合效应模型公式(I)对所述分组观看数据进行运算; 其中,所述混合效应模型公式(I)为:Yi = Xi^+Zibi+£i 其中,β表示固定效应,bi表示随机效应,其中,所述β和bi为所述频道作为自变量得到对应的系数;其中Yi表示因变量矩阵,表示分组观看数据;Xi表示自变量矩阵,表示所述用户个体特性信息;表示误差项矩阵,是混合效应模型自带生成;Z1表示另一系列属性区别于X1的自变量矩阵,表示所述历史观看数据;K1表示一个权重系数,经过一系列事前设定满足X1= ZiKi ,Xi = ZiKi是已知的(m X P)协方差矩阵;m表示η个样本里第i个;P表示实际的矩阵运算结果反应的参数;i表示第i个样本中的序数i,为正整数,i = l,2,3「_,i。3.根据权利要求2所述的方法,其特征在于,所述混合效应模型公式(I)还需要满足如下要求: bi ?N(0,D) Ei?Ν(0,Σ?)cov(bi,b2,...,bi;ei,e2,...,εΝ)=0 其中,bi?N(0,D)表不b服从标准正态分布,其中N(0,D)表不标准正态分布; ?Ν(0, Σ i)表不ε服从标准正态分布,其中ε??N(0,Σ i)表不对应的标准正太分布,Si表示加和运算; cov(bi,b2,...,bi; ει, ε2,...,ε〃)=O表不协方差矩阵,cov表不协方差。4.根据权利要求2或3所述的方法,其特征在于,所述混合效应模型公式(I)的模型结果还参考因变量Yi的密度方程: f(yi)=Jf(yi|bi)f(bi)dbi 其中,f(yi)表示密度方程表达式符号,yi表示因变量Yi里的元素,f (Y1Ib1)表示用b来表达f (y)的密度方程,f (bi)表不b的密度方程,d表不微分符号。5.根据权利要求1-3任意一项所述的方法,其特征在于,所有所述权重系数1序列之和是 100%。6.一种视频内容推荐设备,其特征在于,包括:处理器、发送器、接收器; 所述接收器,用于接收用户观看数据; 所述处理器用于对用户历史观看数据进行分析,得到各种个性化喜好参数;根据所述各种个性化喜好参数和用户个体特性信息,对所述用户历史观看数据进行整理和交叉,得到按照所述个性化喜好参数和所述用户个体特性信息的分组观看数据;根据表示所述历史观看数据的自变量矩阵、表示所述用户个体特性信息的自变量矩阵和表示所述分组观看数据的因变量矩阵对所述分组观看数据进行处理;基于所述处理结果,将各个视频内容对应的频道作为自变量得到对应的系数;按一定的比例将所述频道作为自变量得到对应的所述系数折算成推荐权重系数W1;根据不同的权重系数W1确定对应的推荐视频内容; 所述发送器,用于发送所述推荐视频内容。7.根据权利要求6所述的设备,其特征在于,所述处理器用于根据表示所述历史观看数据的自变量矩阵、表示所述用户个体特性信息的自变量矩阵和表示所述分组观看数据的因变量矩阵对所述分组观看数据进行处理具体包括: 所述处理器用于将表示所述历史观看数据的自变量矩阵、表示所述用户个体特性信息的自变量矩阵和表示所述分组观看数据的因变量矩阵置于混合效应模型公式(I),并根据所述混合效应模型公式(I)对所述分组观看数据进行运算; 其中,所述混合效应模型公式(I)为:Yi = Xi^+Zibi+£i 其中,β表示固定效应,bi表示随机效应,其中,所述β和bi为所述频道作为自变量得到对应的系数;其中Yi表示因变量矩阵,表示分组观看数据;Xi表示自变量矩阵,表示所述用户个体特性信息;表示误差项矩阵,是混合效应模型自带生成;Z1表示另一系列属性区别于X1的自变量矩阵,表示所述历史观看数据;K1表示一个权重系数,经过一系列事前设定满足X1= ZiKi ,Xi = ZiKi是已知的(m X P)协方差矩阵;m表示η个样本里第i个;P表示实际的矩阵运算结果反应的参数;i表示第i个样本中的序数i,为正整数,i = l,2,3「_,i。8.根据权利要求7所述的设备,其特征在于,所述处理器还用于根据所述混合效应模型公式(I)的如下要求进行运算: bi ?N(0,D) Ei?Ν(0,Σ?)cov(bi,b2,...,bi;ei,e2,...,εΝ)=0 其中,bi?N(0,D)表不b服从标准正态分布,其中N(0,D)表不标准正态分布; ?Ν(0, Σ i)表不ε服从标准正态分布,其中ε??N(0,Σ i)表不对应的标准正太分布,Si表示加和运算; cov(bi,b2,...,bi; ει, ε2,...,ε〃)=O表不协方差矩阵,cov表不协方差。9.根据权利要求7或8所述的设备,其特征在于,所述处理器还用于运算所述混合效应模型公式(I)的模型结果还参考因变量Yi的密度方程: f(yi)=Jf(yi|bi)f(bi)dbi 其中,f(yi)表示密度方程表达式符号,yi表示因变量Yi里的元素,f (Y1Ib1)表示用b来表达f (y)的密度方程,f (bi)表不b的密度方程,d表不微分符号。10.—种视频内容推荐系统,其特征在于,包括网络传输系统和根据权利要求6-9任意一项所述的视频内容推荐设备。
【文档编号】H04N21/466GK105915949SQ201510980566
【公开日】2016年8月31日
【申请日】2015年12月23日
【发明人】张雨薇
【申请人】乐视网信息技术(北京)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1