一种视频推送方法及装置与流程

文档序号:11155064阅读:291来源:国知局
一种视频推送方法及装置与制造工艺

本发明涉及视频技术领域,尤其涉及一种视频推送方法及装置。



背景技术:

网络视频,是指由网络视频服务商提供的、以流媒体为播放格式的、可以在线直播或点播的声像文件。视频网站是指在完善的技术平台支持下,让互联网用户在线流畅发布、浏览和分享视频作品。目前为了提升视频网站播放视频的点击率,有些网站会主动向视频播放客户端推送一些视频,以便引导客户端用户点击播放视频。

目前,为了进一步提升推荐视频的点击率,有些视频网站会保存用户在本站的观看历史,根据观看历史推测用户喜好视频的类别,并按照喜好视频的类别推荐本站其他视频给用户。该种视频推荐方式,在一定程度提高了视频点击率。但是对于使用该视频网站不够频繁的用户,由于其可使用的历史记录比较少,单单靠该种根据用户在视频网站上的观看记录分析用户喜好的结果,进而进行视频的推荐,可能使得推荐的视频不够准确,这样会造成推送失去意义。



技术实现要素:

有鉴于此,本发明实施例提供一种视频推送方法及装置,能够通过用户浏览器的历史访问记录,统计用户行为特征,推测用户喜好视频的种类,使得推荐的视频相对更准确。

为了实现上述发明目的,本发明实提供如下的技术方案:

一方面,本发明提供一种视频推送方法,包括:

对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签,并将所述网站的网址和所述标签存储在数据库中;

获取用户的历史访问网址;

根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表;

根据所述兴趣标签列表向用户推荐具有相同标签的视频,其中,所述视频在收录时已经按照不同内容进行了标记,每个收录的视频具有至少一个标签,所述标记的标签从网站标记的标签中选择。

另一方面,本发明还提供一种视频推送装置,包括:

标记单元,用于对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签;

存储单元,用于将所述网站的网址和所述标签存储在数据库中;

获取单元,用于获取用户的历史访问网址;

生成单元,用于根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表;

推荐单元,用于根据所述兴趣标签列表向用户推荐具有相同标签的视频,其中,所述视频在收录时已经按照不同内容进行了标记,每个收录的视频具有至少一个标签,所述标记的标签从网站标记的标签中选择。

本发明提供的视频推荐方法及装置,在进行视频推荐时,首先将互联网中的网站根据网站内容进行分类并标记,将收录的视频也根据视频播放的内容打上网站已经使用的标签;当向用户进行相关视频的推荐时,先基于用户的历史访问网址获取用户的兴趣爱好,在获取行为爱好之后,基于根据标签与用户,以及视频和网址之间的关联关系,确定出用户感兴趣的标签列表;最后根据所述兴趣标签列表向用户推荐具有相同标签的视频。与现有技术相比,其能够通过用户浏览器的历史访问记录,统计用户行为特征,推测用户喜好视频的种类,并按照该用户喜好的种类向用户推荐视频,使得推荐的视频相对更准确。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符 号表示相同的部件。在附图中:

图1示出了本发明实施例中的视频推送方法的流程图;

图2示出了本发明实施例中的根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表的方法流程图;

图3示出了本发明实施例中一种视频推荐装置的组成框图;

图4示出了本发明实施例中另一种视频推荐装置的组成框图;

图5示出了本发明实施例中另一种视频推荐装置的组成框图;

图6示出了本发明实施例中另一种视频推荐装置的组成框图;

图7示出了本发明实施例中另一种视频推荐装置的组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供一种视频推送方法,如图1所示,该方法包括:

101、对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签,并将所述网站的网址和所述标签存储在数据库中。

其中,对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签,该标签可以为一个,也可以为多个,具体根据网站内容确定。例如,该标签可以为但不局限于以下内容标签,财经、文化、娱乐、体育、科技、游戏、军事、数码等。

对互联网中的网站按照不同内容进行标记可以采用但不局限于爬虫技术和自然语言处理技术,具体的本发明实施例对此不进行限制,也可以采用其他可以实现的方法。其中,爬虫技术:一种按照一定的规则,自动地抓取网页信息的程序或者脚本。自然语言处理:通过自然语言对页面信息进行处理,具体是抽取出文章的正文,然后再使用词典对这篇正文进行解析,把文章分成句子,把句子分成词,可以判断每个词的内容以及情感值 (正面、负面、中性)等。当采用爬虫技术和自然语言处理技术对互联网中的网站按照不同内容进行标记时,可以使用如下的方法,该方法包括:

1、基于爬虫技术获取互联网中的网站。

2、通过自然语言处理技术分析所述网站的主题和特征。

3、根据所述主题和特征内容的不同对所述网站进行标记。

需要说明的,为了方便后续操作使用网站对应的标签,在为网站分配标签之后,将所述网站的网址和所述标签存储在数据库中。

102、获取用户的历史访问网址。

其中,用户的历史访问网址,一般存储在用户的历史浏览记录日志中。获取用户的历史访问记录,一般先要获取用户的历史浏览记录日志。目前,获取用户的历史浏览记录有很多方法,可以使用现有技术中的任一种,本发明实施例对此不进行限制。例如,通过在用户端安装网站的浏览器扩展应用,即探针程序。该探针程序将定期获取用户的历史浏览记录,并发送给对应的服务器。其中,该探针程序的实现可以采用但不局限于以下的方法,该方法为调用chrome浏览器编程接口的回调函数来统计URL。在获取了历史浏览记录日志之后,对所述历史浏览记录日志进行分析,获取用户的历史访问网址。

103、根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表。

104、根据所述兴趣标签列表向用户推荐具有相同标签的视频,其中,所述视频在收录时已经按照不同内容进行了标记,每个收录的视频具有至少一个标签,所述标记的标签从网站标记的标签中选择。

其中,根据所述兴趣标签列表向用户推荐具有相同标签的视频,该视频可以是用户没有看过的视频,也可以是看过的视频,具体的本发明实施例对此不进行限制。此处的相同指的是,只要待推荐的视频的标签中有一个标签与用户的兴趣标签列表中的某一个标签相同,则认为用户兴趣标签列表与待推荐的视频具有相同的标签。

本发明实施例中,在进行视频推荐时,首先将互联网中的网站根据网站内容进行分类并标记,将收录的视频也根据视频播放的内容打上网站已 经使用的标签;当向用户进行相关视频的推荐时,先基于用户的历史访问网址获取用户的兴趣爱好,在获取行为爱好之后,基于根据标签与用户,以及视频和网址之间的关联关系,确定出用户感兴趣的标签列表;最后根据所述兴趣标签列表向用户推荐具有相同标签的视频。与现有技术相比,其能够通过用户浏览器的历史访问记录,统计用户行为特征,推测用户喜好视频的种类,并按照该用户喜好的种类向用户推荐视频,使得推荐的视频相对更准确。

进一步的,在执行上述103根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表时,可以采用但不局限于以下的方法实现,该方法如图2所示,包括:

201、将所述历史访问网址与数据库中存储的所述网站的网址进行对比匹配。

202、统计匹配的历史访问网址对应标签的种类和出现的次数。

203、按照出现的次数对历史访问网址对应标签进行排序。

其中,在按照出现的次数对历史访问网址对应标签进行排序时,可以按照出现的次数从高到底的顺序对历史访问网址对应标签进行排序,也可以按照出现的次数从底到稿的顺序对历史访问网址对应标签进行排序,具体的本发明实施例对此不进行限制。

204、将排序后的标签生成用户感兴趣的兴趣标签列表。

为了保证推荐视频的准确性,一般选择出现次数比较多的标签对应的内容作为用户感兴趣的内容,所以在在所述排序模块按照出现的次数对历史访问网址对应标签进行排序之后,本发明实施例还提供如下的方法,该方法包括:

按照出现的次数从高到底的顺序,从所述排序的标签中取出预定数量的标签;所述将排序后的标签生成用户感兴趣的兴趣标签列表具体为:将选取处的标签生成用户感兴趣的兴趣标签列表。

需要说明的是,在执行本发明实施例进行视频推荐的过程中,推荐的视频也要根据视频播放内容进行标记,具体的可以采用但不局限以下的方法实现,该方法包括:在进行视频收录时获取所述视频的播放内容;从所 述网站标记的标签中选择与该播放内容相关的至少一个标签对所述收录的视频进行标记。

本发明实施例中,在进行视频推荐时,通过分析用户访问过的网站特征,分析用户喜好并推送用户可能感兴趣的视频,可以达到精确推送的效果,提高了用户体验。

基于上述方法实施例,本发明实施例还提供一种视频推送装置,该装置可以为视频服务器,如图3所示,该装置包括:

网站标记单元31,用于对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签。其中,网站标记单元31对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签,该标签可以为一个,也可以为多个,具体根据网站内容确定。例如,该标签可以为但不局限于以下内容标签,财经、文化、娱乐、体育、科技、游戏、军事、数码等。对互联网中的网站按照不同内容进行标记可以采用但不局限于爬虫技术和自然语言处理技术。当采用爬虫技术和自然语言处理技术对互联网中的网站按照不同内容进行标记时,可以使用如下的方式,该方式包括:基于爬虫技术获取互联网中的网站;通过自然语言处理技术分析所述网站的主题和特征;根据所述主题和特征内容的不同对所述网站进行标记。

存储单元32,用于将所述网站的网址和所述标签存储在数据库中。

网址获取单元33,用于获取用户的历史访问网址。其中,用户的历史访问网址,一般存储在用户的历史浏览记录日志中。获取用户的历史访问记录,一般先要获取用户的历史浏览记录日志。目前,获取用户的历史浏览记录有很多方法,可以使用现有技术中的任一种,本发明实施例对此不进行限制。例如,通过在用户端安装网站的浏览器扩展应用,即探针程序。该探针程序将定期获取用户的历史浏览记录,并发送给对应的服务器。

生成单元34,用于根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表。

推荐单元35,用于根据所述兴趣标签列表向用户推荐具有相同标签的视频,其中,所述视频在收录时已经按照不同内容进行了标记,每个收录的视频具有至少一个标签,所述标记的标签从网站标记的标签中选择。

进一步的,如图4所示,所述网址获取单元33包括:

第一获取模块331,用于获取用户的历史浏览记录日志。

第二获取模块332,用于对所述历史浏览记录日志进行分析,获取用户的历史访问网址。

进一步的,如图5所示,所述生成单元34包括:

对比模块341,用于将所述历史访问网址与数据库中存储的所述网站的网址进行对比匹配。

统计模块342,用于统计匹配的历史访问网址对应标签的种类和出现的次数。

排序模块343,用于按照出现的次数从高到底的顺序对历史访问网址对应标签进行排序。

生成模块344,用于将排序后的标签生成用户感兴趣的兴趣标签列表。

为了保证推荐视频的准确性,一般选择出现次数比较多的标签对应的内容作为用户感兴趣的内容后,如图6所示,所述生成单元34还包括:

选择模块345,用于在所述排序模块按照出现的次数从高到底的顺序对历史访问网址对应标签进行排序之后,按照出现的次数从高到底的顺序,从所述排序的标签中取出预定数量的标签;

所述生成模块344还用于,将选取处的标签生成用户感兴趣的兴趣标签列表。

需要说明的是,在执行本发明实施例进行视频推荐的过程中,推荐的视频也要根据视频播放内容进行标记,具体的,如图7所示,该装置还包括:

视频收录单元36,用于在进行视频收录时获取所述视频的播放内容;

视频标记单元37,用于从所述网站标记的标签中选择与该播放内容相关的至少一个标签对所述收录的视频进行标记。

本发明实施例中,在进行视频推荐时,首先将互联网中的网站根据网站内容进行分类并标记,将收录的视频也根据视频播放的内容打上网站已经使用的标签;当向用户进行相关视频的推荐时,先基于用户的历史访问网址获取用户的兴趣爱好,在获取行为爱好之后,基于根据标签与用户, 以及视频和网址之间的关联关系,确定出用户感兴趣的标签列表;最后根据所述兴趣标签列表向用户推荐具有相同标签的视频。与现有技术相比,其能够通过用户浏览器的历史访问记录,统计用户行为特征,推测用户喜好视频的种类,并按照该用户喜好的种类向用户推荐视频,使得推荐的视频相对更准确。

所述视频推送装置包括处理器和存储器,上述标记单元、存储单元、获取单元、生成单元、推荐单元、视频收录单元和视频标记单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来能够通过用户浏览器的历史访问记录,统计用户行为特征,推测用户喜好视频的种类,使得推荐的视频相对更准确。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:对互联网中的网站按照不同内容进行标记,使得每个网站获取对应标签,并将所述网站的网址和所述标签存储在数据库中;获取用户的历史访问网址;根据所述历史访问网址、数据库中存储的所述网站的网址和所述标签,生成用户感兴趣的兴趣标签列表;根据所述兴趣标签列表向用户推荐具有相同标签的视频,其中,所述视频在收录时已经按照不同内容进行了标记,每个收录的视频具有至少一个标签,所述标记的标签从网站标记的标签中选择。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的 形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光 盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1