一种视频热点片段提取方法、用户设备和服务器与流程

文档序号:11437561阅读:269来源:国知局
本申请涉及通信
技术领域
:,尤其涉及一种视频热点片段提取方法、用户设备和服务器。
背景技术
::随着互联网的快速发展,在线网络视频观看受到越来越多用户的喜爱。传统的视频门户网站,可以通过后台编辑节目的个人喜好引导用户观看该视频,每次视频上线之前,会通过人工在线观看数遍视频后,筛选出视频的热点片段并拟出醒目的标题标注在进度条上。目前,相对于人工编辑热点片段更有效的方法有两种,一是可以基于视频中弹幕数量与阈值的大小提取并标识热点片段,二是基于用户对视频播放器的操作信息获取用户对当前视频中的片段的喜好,例如通过快进快退的操作确定用户是否喜欢该片段,以此提取并标识热点片段。但是,这样一来,所有用户观看同一视频时,视频所在的页面的显示内容都相同,即标识的热点片段均相同。而实际上,不同的年龄段、性别、教育背景以及地域等的用户群体喜欢观看的视频题材、片段或视频环节等可能都不相同,使得不同的用户群体所需访问的视频热点片段也不相同,上述方法虽然相对于人工编辑热点片段效率高,但是不能针对不同用户群体提取不同用户群体所想要观看的视频热点片段,使得用户访问热点片段的准确度低,也会使得属于某些用户群体的热点片段无法提取和对用户呈现。技术实现要素:本申请实施例提供一种视频热点片段提取方法、用户设备和服务器,能够解决用户访问热点片段准确度低以及某些热点片段无法提取和对用户呈现的问题。一方面,提供一种视频热点片段的提取方法,包括:服务器根据用户的属性信息将用户分为多个用户群体,再根据多个用户群体中每个用户群体在观看视频内容时的操作信息,获取每个用户群体观看视频内容的热点片段,进而根据每个用户群体观看视频内容的热点片段获取对应于每个用户群体的热点片段的标签,并将对应于每个用户群体的热点片段的标签发送给相应的用户群体的用户设备。这样,本申请实施例可以按照多个用户群体,提取和呈现个性化的热点片段,可以提高用户访问热点片段的准确度,同时,相对于现有技术中给所有用户呈现的为同一热点片段,本申请实施例可以提取和呈现出被掩盖的属于某些用户群体的热点片段。在一种可能的设计中,服务器根据用户的属性信息将用户分为多个用户群体包括:服务器根据聚类算法对用户的属性信息进行分析,以将用户分为多个用户群体;服务器根据聚类算法对用户的属性信息进行分析,以将用户分为多个用户群体可以包括:服务器根据用户的属性信息构建用户的属性向量,获取用户的属性向量与聚类中心的欧氏距离,根据欧氏距离将用户划分至欧氏距离最近的聚类中心所在的簇,每个簇对应一个用户群体。于是,在本申请中,可以将用户按照属性分为多个用户群体,以便为每个用户群体找寻每个用户群体喜欢观看的热点片段。这里的属性可以由多种,例如可以为用户的年龄、性别以及职业等。在一种可能的设计中,服务器根据多个用户群体中每个用户群体在观看视频内容时的操作信息,获取每个用户群体观看视频内容的热点片段包括:对于每个用户群体,服务器根据该用户群体的操作信息获取该用户群体的热点片段的弹幕评论阈值或热度贡献阈值;对于每个用户群体,服务器根据弹幕评论阈值以及该用户群体的操作信息获取该用户群体的热点片段,或服务器根据热度贡献阈值以及该用户群体的操作信息获取该用户群体的热点片段。在本申请中,用户的操作信息即用户对观看视频内容反馈的数据,该反馈数据可以包括用户对视频内容的显性反馈或隐性反馈,显性反馈例如可以是用户对观看的视频内容的视频片段的实时弹幕评论,隐性反馈例如可以是用户对视频播放器的操作,是否前后拖动进度条或点击快进快退按钮,以及对在线视频内容的点击、浏览和收藏等,用以体现用户对视频内容的喜爱程度,使得服务器可以为多个用户群体获取到每个用户群体对应的热点片段。在一种可能的设计中,对于每个用户群体,服务器根据该用户群体的操作信息获取该用户群体的热点片段的弹幕评论阈值包括:对于每个用户群体,服务器获取该用户群体对视频内容的历史弹幕评论的数量与视频内容的视频片段的数量的比值,再获取比值与预设系数的乘积,乘积为该用户群体的热点片段的弹幕评论阈值;服务器根据弹幕评论阈值以及该用户群体的操作信息获取该用户群体的热点片段包括:对于每个用户群体,服务器确定该用户群体对视频内容的任一视频片段的弹幕评论数大于弹幕评论阈值时,将任一视频片段确定为用户群体的热点片段。也即每个用户群体对于某个视频片段的弹幕评论数量大于了该用户群体的对每个视频片段的平均弹幕数量时,确定该视频片段为该用户群体的热点片段。在一种可能的设计中,服务器根据每个用户群体观看视频内容的热点片段获取对应于每个用户群体的热点片段的标签包括:对于每个用户群体的热点片段,服务器构建该热点片段的关键词词表,关键词词表包括该热点片段的弹幕评论的关键词,再统计关键词词表中各词的词频,确定词频最高的关键词,将词频最高的关键词以及该用户群体对该热点片段评论的起止时间确定为该热点片段的标签。于是,在用户设备侧,可以在每个用户群体观看视频内容时,可以根据关键词以及热点片段的标签准确定位到每个用户群体感兴趣的热点片段,使得用户群体之间的热点片段呈现个性化,也不会使得每个用户群体都获取到的是相同的热点片段的标签。在一种可能的设计中,如果用户群体的操作信息为用户为播放器的历史操作信息,那么对于每个用户群体,服务器根据该用户群体的操作信息获取该用户群体的热点片段的热度贡献阈值包括:对于每个用户群体,服务器获取每个用户的每种操作类型的持续时间,操作类型包括快进、快退、向前拖动以及向后拖动;对于每个用户群体中的每个用户,服务器获取该用户的每种操作类型的热度贡献值,热度贡献值为该种操作类型的持续时间与该种操作类型的加权值的乘积,再与该种操作类型对应的视频片段时长的比值;对于每个用户群体,服务器获取该用户群体的热点片段的热度贡献阈值,热度贡献阈值为该用户群体的总热度贡献值与视频内容的视频片段的数量的比值,再与预设系数的乘积;对于每个用户群体,服务器根据热度贡献阈值以及该用户群体的操作信息获取该用户群体的热点片段包括:对于每个用户群体,服务器获取该用户群体对视频内容的各视频片段的热度贡献值的和,将热度贡献值的和大于热度贡献阈值的视频片段确定为该用户群体的热点片段。由于用户在视频片段播放时对播放器的快进、快退、向前拖动以及向后拖动都可以反馈出该用户对该视频片段的感兴趣程度,那么在获取到每个用户群体的热点片段后,可以为每个用户群体呈现不同的热点片段,可以提高用户访问热点片段的准确度,并提取出被掩盖的属于某些用户群体的热点片段。在一种可能的设计中,服务器根据每个用户群体观看视频内容的热点片段获取对应于每个用户群体的热点片段的标签包括:对于每个用户群体的热点片段,服务器将该用户群体在该热点片段播放时对播放器操作的各时间点中的最早时间点和最晚时间点确定为热点片段的标签。于是,每个用户群体就可以根据每个用户群体对应的热点片段的标签快速定位到每个用户群体感兴趣的热点片段。在一种可能的设计中,在服务器根据观看视频内容的用户的属性信息将用户分为不同的用户群体之前,该方法还包括:服务器接收用户设备发送的用户的属性信息。该属性信息可以从用户在用户设备中的注册信息中获取或者从用户在客户端中的注册信息获取,也可以通过其他方式获取,本申请不做限定。另一方面,提供一种视频热点片段的提取方法,包括:用户设备向服务器发送用户的属性信息;用户设备接收服务器发送的视频内容的热点片段的标签,根据标签在视频内容的显示部分显示热点片段的标签。用户在观看视频内容时,同时也将用户在观看视频内容时的操作信息以及业务数据也发送给服务器,业务数据可以表示为时序形式,每条业务数据可以包括会话标识(sessionid)、用户账号、视频播放起始时间、视频结束时间、播放类型、视频类型、视频id等,这样,服务器可以根据用户的属性信息以及用户在观看视频内容的操作信息以及业务数据获取每个用户群体观看视频内容的热点片段,并获取每个用户群体的热点片段的标签发送给用户设备,于是,每个用户群体的用户设备可以呈现个性化的热点片段的标签,提升用户访问热点片段的准确度,可呈现出了被掩盖的属于某些用户群体的热点片段。在一种可能的设计中,标签包括热点片段的关键词以及用户所属的用户群体对热点片段评论的起止时间,或标签包括用户所属的用户群体在热点片段播放时对播放器操作的各时间点中的最早时间点和最晚时间点。再一方面,提供一种服务器,包括:分类单元,用于根据用户的属性信息将用户分为多个用户群体;获取单元,用于根据分类单元划分的多个用户群体中每个用户群体在观看视频内容时的操作信息,获取每个用户群体观看视频内容的热点片段;获取单元,还用于根据获取单元获取的每个用户群体观看视频内容的热点片段获取对应于每个用户群体的热点片段的标签;发送单元,用于将获取单元获取的对应于每个用户群体的热点片段的标签发送给相应的用户群体的用户设备。在一种可能的设计中,分类单元用于:根据聚类算法对用户的属性信息进行分析,以将用户分为多个用户群体;分类单元具体用于:根据用户的属性信息构建用户的属性向量;获取用户的属性向量与聚类中心的欧氏距离;根据欧氏距离将用户划分至欧氏距离最近的聚类中心所在的簇,每个簇对应一个用户群体。在一种可能的设计中,获取单元用于:对于每个用户群体,根据该用户群体的操作信息获取该用户群体的热点片段的弹幕评论阈值或热度贡献阈值;对于每个用户群体,根据弹幕评论阈值以及该用户群体的操作信息获取该用户群体的热点片段,或根据热度贡献阈值以及该用户群体的操作信息获取该用户群体的热点片段。在一种可能的设计中,获取单元用于:对于每个用户群体,获取该用户群体对视频内容的历史弹幕评论的数量与视频内容的视频片段的数量的比值,再获取比值与预设系数的乘积,乘积为该用户群体的热点片段的弹幕评论阈值;对于每个用户群体,确定该用户群体对视频内容的任一视频片段的弹幕评论数大于弹幕评论阈值时,将任一视频片段确定为用户群体的热点片段。在一种可能的设计中,对于每个用户群体的热点片段,构建该热点片段的关键词词表,关键词词表包括该热点片段的弹幕评论的关键词;对于每个用户群体的热点片段,统计关键词词表中各词的词频,确定词频最高的关键词,将词频最高的关键词以及该用户群体对该热点片段评论的起止时间确定为该热点片段的标签。在一种可能的设计中,获取单元用于:对于每个用户群体,获取每个用户的每种操作类型的持续时间,操作类型包括快进、快退、向前拖动以及向后拖动;对于每个用户群体中的每个用户,获取该用户的每种操作类型的热度贡献值,热度贡献值为该种操作类型的持续时间与该种操作类型的加权值的乘积,再与该种操作类型对应的视频片段时长的比值;对于每个用户群体,获取该用户群体的热点片段的热度贡献阈值,热度贡献阈值为该用户群体的总热度贡献值与视频内容的视频片段的数量的比值,再与预设系数的乘积;对于每个用户群体,获取该用户群体对视频内容的各视频片段的热度贡献值的和,将热度贡献值的和大于热度贡献阈值的视频片段确定为该用户群体的热点片段。在一种可能的设计中,获取单元用于:对于每个用户群体的热点片段,将该用户群体在该热点片段播放时对播放器操作的各时间点中的最早时间点和最晚时间点确定为热点片段的标签。在一种可能的设计中,还包括接收单元,用于接收用户设备发送的用户的属性信息。又一方面,提供一种用户设备,包括:发送单元,用于向服务器发送用户的属性信息;接收单元,用于接收服务器发送的视频内容的热点片段的标签;显示单元,用于根据标签在视频内容的显示部分显示热点片段的标签。在一种可能的设计中,标签包括热点片段的关键词以及用户所属的用户群体对热点片段评论的起止时间,或标签包括用户所属的用户群体在热点片段播放时对播放器操作的各时间点中的最早时间点和最晚时间点。又一方面,本申请实施例提供了一种计算机存储介质,用于储存为上述物联网服务器所用的计算机软件指令,其包含用于执行上述方面所设计的程序。又一方面,本申请实施例提供了一种计算机存储介质,用于储存为上述服务器所用的计算机软件指令,其包含用于执行上述方面所设计的程序。本申请实施例提供一种视频热点片段的提取方法、用户设备和服务器,服务器根据用户的属性信息将用户分为多个用户群体,再根据多个用户群体中每个用户群体在观看视频内容时的操作信息,获取每个用户群体观看视频内容的热点片段,进而根据每个用户群体观看视频内容的热点片段获取对应于每个用户群体的热点片段的标签,并将对应于每个用户群体的热点片段的标签发送给相应的用户群体的用户设备。这样,本申请实施例可以按照多个用户群体,为每个用户群体提取和呈现个性化的热点片段,可以提高用户访问热点片段的准确度,同时,相对于现有技术中给所有用户呈现的为同一热点片段,本申请实施例可以提取和呈现出被掩盖的属于某些用户群体的热点片段。附图说明图1为本申请实施例提供的一种系统架构的示意图;图2为本申请实施例提供的一种系统架构的功能模块的示意图;图3为本申请实施例提供的一种视频热点片段的提取方法的流程示意图;图4为本申请实施例提供的一种为每个用户群体展现不同的热点片段的示意图;图5为本申请实施例提供的一种为每个用户群体展现不同的热点片段的示意图;图6为本申请实施例提供的一种视频热点片段的提取方法的流程示意图;图7为本申请实施例提供的一种为每个用户群体展现不同的热点片段的示意图;图8为本申请实施例提供的一种为每个用户群体展现不同的热点片段的示意图;图9为本申请实施例提供的一种服务器的结构示意图;图10为本申请实施例提供的一种服务器的结构示意图;图11为本申请实施例提供的一种用户设备的结构示意图;图12为本申请实施例提供的一种用户设备的结构示意图。具体实施方式本申请实施例可以应用在不同用户群体的用户设备(userequipment,ue)向用户呈现不同的热点片段的应用场景,实现不同用户群体的热点片段的个性化呈现。本申请的系统架构可以包括用户设备和服务器,用户设备可以有多个,服务器之间可以交互执行不同的方法流程,如图1所示为系统架构包括多个用户设备、服务器1和服务器2的架构示意图。用户设备可以为具有显示屏的以下任意一种,并且用户设备可以是静态的,也可以是移动的。用户设备可以包括但不限于:个人电脑(personalcomputer)、膝上型电脑(laptopcomputer)、平板电脑(tabletcomputer)、上网本(netbook)、移动终端(mobileterminal)、手持设备(handheld)、无绳电话(cordlessphone)、智能手表以及智能眼镜等。服务器1和服务器2可以是物理集群服务器或者虚拟云服务器等。在本申请实施例中,如图2所示,在系统架构包括用户设备0、服务器1和服务器2的情况下,每个用户设备0可以包括数据收集/发送模块01和呈现模块02,服务器1可以包括数据接收/存储模块11和数据发送模块12,服务器2可以包括历史数据获取模块21、用户分类模块22、热点片段获取模块23、标签提取模块24以及数据发送模块25。其中,数据收集/发送模块01和呈现模块02可以在用户设备不同的客户端的应用程序中实现。客户端中的数据收集/发送模块01可以用于收集观看视频内容的用户的属性信息并发送给服务器1,服务器1中的数据接收/存储模块11可以用于从各个客户端接收并存储接收到的观看视频内容的多个用户的属性信息,并汇聚得到的用户的属性信息通过数据发送模块12发送给服务器2,服务器2中的历史数据获取模块21用于接收多个用户的属性信息,用户分类模块22用于根据多个用户的属性信息对多个用户分类,得到多个用户群体,热点片段获取模块23用于根据每个用户群体观看视频内容时对视频内容的操作信息获取每个用户群体的热点片段,标签提取模块24用于根据每个用户群体的热点片段获取对应于每个用户群体的热点片段的标签,并将每个用户群体的热点片段的标签通过数据发送模块25发送给服务器1,服务器1中的数据接收/存储模块11在接收到每个用户群体的热点片段的标签后,之后观看该视频内容的用户的用户设备会接收到服务器1通过2数据发送模块12发送的热点片段的标签,不同用户群体的用户设备中的呈现模块所呈现的热点片段的标签不同,这样,能够提取到某些被掩盖的属于某些用户群体的热点片段,提高不同的用户群体访问热点片段的准确度。当然,如果系统架构有一个服务器时,该服务器1和服务器2的功能可以集群在一个服务器中。下面以各用户群体对视频内容的操作信息为历史弹幕评论信息为例进行说明。本申请实施例提供一种视频热点片段的提取方法,如图3所示,该方法包括:301、用户设备向服务器1发送用户的属性信息。这里发送属性信息的用户设备可以理解为用户在客户端中的注册信息,也可以是用户的其他注册信息,包括用户标识(identification,id)、年龄、性别和职业等,不同用户的属性信息可以相同,也可以不同。用户id可以是用户注册该客户端的账号,例如可以是手机号、或邮箱、或字符串等。该步骤可以由上述数据收集/发送模块01执行。302、服务器1接收并存储用户的属性信息,并将用户的属性信息发送给服务器2。服务器1在接收到各个用户设备用户的属性信息时,对接收到的不同用户的属性信息进行汇总,可以由上述数据接收/存储模块11执行,而后将汇总后的各个用户的属性信息通过数据发送模块12发送给服务器2。服务器2接收各个用户的属性信息可以由上述历史数据获取模块21执行。例如服务器1汇总后的用户的属性信息如表1所示。表1用户属性信息303、服务器2根据用户的属性信息将用户分为多个用户群体。该步骤可以由上述用户分类模块22执行。一种可能的实现方式为:服务器2可以简单的根据用户的年龄和性别等属性对用户进行分类、例如服务器2可以根据年龄的划分将用户分为:儿童用户观看群体、年轻人用户观看群体以及中老年用户观看群体。另一种可能的实现方式可以为:服务器2可以根据用户的属性信息,采用聚类算法对用户进行分类。例如服务器2采用k-means聚类算法。下面以k-means聚类算法为例进行说明。1)服务器2根据用户的属性信息构建用户的属性向量。例如用户的属性向量可以构建为:[年龄,性别,职业],其中年龄属性可以直接作为用户的属性向量对应位的值,性别属性中的“男”性可以在用户的属性向量对应位的值为1,“女”性可以在用户属性向量对应位的值为0,职业属性在用户的属性向量对应位的值可以为职业属性的词频向量的值。这里职业属性词频向量构建过程可以为:①构建词表:利用职业属性中所有出现的词构建词表,例如词表可以为[学生,公务员,工程师,护士,教师,律师];②构建词频向量:将每个用户的职业属性在词表中各词的词频,作为词频向量对应位的值,词频向量的长度即为词表长度。表1中汇总的用户的属性信息对应的用户的属性向量可以如表2所示。表2用户的属性向量以id为001的用户来说,其年龄为10岁,性别为男,职业为学生,那么该用户的属性向量中的年龄属性的值为10,性别属性的值为1,职业在词表的第一位,即学生的词频为1,其余词频的值为0,那么该用户的职业属性对应的词频向量的值为[1,0,0,0,0,0]。2)服务器2获取用户的属性向量与聚类中心的欧氏距离。服务器2可以先随机指定k-means的3个聚类中心的用户id分别为001、007和015,而后按照预设的欧氏距离公式,计算各用户的属性向量与各聚类中心的欧氏距离。例如用户id为002的用户属性向量[8,0,1,0,0,0,0,0]与聚类中心id为001的用户的属性向量[8,0,1,0,0,0,0,0]的欧氏距离为:按照这种计算方式,各用户的属性向量与各聚类中心的欧氏距离可以如表3所示。表3用户的属性向量与聚类中心的欧氏距离这样,根据上述计算得到的每个用户的属性向量与各聚类中心的欧氏距离,将各用户划分至距离最近的聚类中心所在的簇,每个簇对应一个用户群体。例如id002的用户到聚类中心[用户id001]的欧氏距离为2.2,到聚类中心[用户id007]的欧氏距离为17.1,到聚类中心[用户id015]的欧氏距离为39.0,因此将id002的用户划分至聚类中心[用户id001]所在的簇,即id002的用户属于[用户id001]所在的用户群体usergroup1。于是,聚类后的3个用户群体(usergroup1、usergroup2以及usergroup3)可以如下表4所示。表4聚类得到的各用户群体而后,在服务器2根据用户的属性信息将用户分为多个用户群体之后,服务器1可以根据多个用户群体中每个用户群体在观看视频内容时的操作信息,获取每个用户群体观看视频内容的热点片段,其具体实现方式可以为:对于每个用户群体,服务器2根据该用户群体的操作信息获取该用户群体的热点片段的弹幕评论阈值,而后根据弹幕评论阈值以及该用户群体的操作信息获取该用户群体的热点片段。下面以每个用户群体对视频内容的操作信息为用户对视频内容的历史弹幕评论信息为例继续进行说明。304、服务器1将从用户设备获取的每个用户群体对视频内容的历史弹幕评论信息发送给服务器2。服务器1可以从用户设备的客户端获取采集到注册信息的各个用户在对各个视频内容的历史弹幕评论信息,这里的历史弹幕评论信息可以是视频内容在上线之后的预设时间段内的弹幕评论信息,而后将每个用户群体对该视频内容在预设时间段内的弹幕评论信息发送给服务器2。其中,历史弹幕评论信息可以包括每个用户id评论的视频内容的视频id、视频片段id、对视频进行评论时的播放时间点以及弹幕评论。以每个用户群体观看春节联欢晚会视频的弹幕评论信息为例,用户对春节联欢晚会的弹幕评论信息可以如表5所示。表5用户观看春节联欢晚会视频的弹幕评论信息需要说明的是,步骤303中最终划分的用户群体中的每个用户不一定都会对春节联欢晚会视频进行评论,步骤304这里只提取对春节联欢晚会视频进行评论的用户的历史弹幕评论信息,同一个用户也有可能对同一视频内容进行多次评论。305、对于每个用户群体,服务器2获取用户群体对视频内容的历史弹幕评论的数量与视频内容的视频片段的数量的比值,再获取该比值与预设系数的乘积,该乘积为该用户群体的热点片段的弹幕评论阈值。按照步骤303中划分的每个用户群体,将对视频内容的历史弹幕评论信息进行分组,即一个用户不论对哪个视频片段进行了评论,都会将该用户的历史弹幕评论信息划分至该用户所属的用户群体。例如用户001对春节联欢晚会视频id的视频内容在视频内容的10.11s评论为tfboys好可爱,那么这条弹幕评论可以分到用户id001所在的用户群体usergroup1中,于是分组后的弹幕评论信息可以如表6所示。表6分组后的弹幕评论信息按照分组后的弹幕评论信息,对于每个用户群体,可以获取用户群体对视频内容的历史弹幕评论的数量与视频内容的视频片段的数量的比值,再获取该比值与预设系数的乘积,该乘积为用户群体观看视频内容的热点片段的弹幕评论阈值,预设系数可以为超参,可以根据对热点片段的热点强度需求设置。例如按照表6来说,取预设系数为1,usergroup1观看视频内容的热点片段的弹幕评论阈值=5/3=1.7,usergroup2观看视频内容的热点片段的弹幕评论阈值=7/3=2.3,usergroup3观看视频内容的热点片段的弹幕评论阈值=4/3=1.3,如表7所示。表7每个用户群体的热点片段的阈值306、对于每个用户群体,服务器2确定该用户群体对视频内容的任一视频片段的弹幕评论数大于弹幕评论阈值时,将任一视频片段确定为用户群体的热点片段。也就是说,对于任一用户群体,如果用户群体对同一视频片段的弹幕评论数量大于该用于群体的热点片段的弹幕评论阈值,则将该视频片段确定为该用户群体观看视频内容的热点片段。例如用户群体usergroup1对tfboys视频片段的弹幕评论数为3,usergroup1的热点片段的阈值为1.7,弹幕评论数为3大于阈值1.7,那么tfboys视频片段为usergroup1的热点片段,以此类推,上述表7对应的每个用户群体的热点片段可以如表8所示:表8每个用户群体的热点片段步骤304-306可以由上述热点片段获取模块23执行。307、服务器2根据每个用户群体观看视频内容的热点片段获取对应于每个用户群体的热点片段的标签,并将每个用户群体的热点片段的标签发送给服务器1。对于每个用户群体的热点片段,服务器2可以构建该热点片段的关键词词表,关键词词表包括该热点片段的弹幕评论的关键词,而后统计关键词词表中各词的词频,确定词频最高的关键词,将词频最高的关键词以及该用户群体对该热点片段评论的起止时间确定为该热点片段的标签。其中,服务器2可以采用java分词包hanlp提取每条弹幕评论的关键词。例如对于弹幕评论“tfboys好可爱”,通过hanlp提取出的关键词可以为:可爱和tfboys,这样,每个用户群体的每条弹幕评论提取出的关键词可以如表9所示。而后,根据每条弹幕评论的关键词构建每个用户群体的关键词词表,如表9所示,usergroup1对应的所有关键词为:可爱,tfboys,歌唱,不错,长大,则usergroup1对应的关键词词表可以为:[可爱,tfboys,歌唱,不错,长大],进而,服务器2统计各用户群体的关键词词表中各词的词频,例如,在上述关键词词表中,usergroup1对应的关键词中“tfboys”出现3次,其他关键词出现一次,那么usergroup1对应的词频向量为:[1,3,1,1,1],根据该词频向量,确定词频最高的关键词为“tfboys”,再加上用户群体对热点片段tfboys表演评论的起止时间为10.11-105.45,因此,usergroup1的热点片段的标签可以为“tfboys”以及10.11-105.45。表9关键词词表、对应的词频以及词频最高的关键词该步骤可以由上述标签提取模块24执行。308、服务器2将每个用户群体的热点片段的标签发送给服务器1。该步骤可以由上述数据发送模块25执行。309、服务器1保存每个用户群体的热点片段的标签,并将对应于每个用户群体的热点片段的标签发送给相应的用户群体的用户设备。在服务器1获取到每个用户群体的热点片段的标签后,如果在服务器1中保存的注册信息中的用户观看视频内容时,服务器1可以将视频内容的热点片段的标签发送给观看视频内容相应的用户群体的用户设备。该步骤可以由数据发送模块12执行。310、用户设备根据标签在视频内容的显示部分显示热点片段的标签。例如用户设备要播放视频内容时,从服务器1可以接收到该视频内容的热点片段的标签。用户设备根据接收到的标签个性化呈现热点片段。在一种可能的实现方式中,对于每个用户群体的热点片段,用户设备可以根据该用户群体对该热点片段评论的起止时间,在播放时间轴的该热点片段的起始时间处打上圆点,并根据起止时间在播放时间轴的热点片段区间以区分非热点片段的颜色标注,例如可以如图4所示,图4为根据表9展示的每个用户群体观看春节联欢晚会视频时的热点片段。在另一种可能的实现方式,对于每个用户群体的热点片段,用户设备可以在视频显示区域中以列表的形式,按照该用户群体对该热点片段评论的起止时间以及关键词向用户群体展示该热点片段,同一个用户群体所被展示的热点片段可能不止一个。按照表9的举例,呈现给usergroup1的热点片段列表如图5中的图(1)所示,呈现给usergroup2的热点片段列表如图5中的图(2)所示,呈现给usergroup3的热点片段列表如图5中的图(3)所示。该步骤可以由上述呈现模块02执行。这样一来,本申请实施例可以按照多个用户群体,提取和呈现个性化的热点片段,可以提高用户访问热点片段的准确度,同时,相对于现有技术中给所有用户呈现的为同一热点片段,本申请实施例可以提取和呈现出被掩盖的属于某些用户群体的热点片段。下面再以每个用户群体对视频内容的操作信息为用户对播放器的历史操作信息为例进行说明。本申请实施例提供一种视频热点片段的提取方法,如图6所示,包括:601、用户设备向服务器1发送用户的属性信息。602、服务器1接收并存储用户的属性信息,并将用户的属性信息发送给服务器2。603、服务器2根据用户的属性信息将用户分为多个用户群体。步骤601-603的实现方式可以参见上述步骤301-303。604、服务器1将从用户设备获取的播放器播放视频内容时,每个用户群体对播放器的历史操作信息发送给服务器2。用户对播放器的操作信息可以分为:快进、向前拖动、快退、向后拖动等。如果用户对视频内容的某些视频片段进行快进或向前拖动操作,表示用户对视频片段不感兴趣,服务器1可以记录快进操作或向前拖动操作的动作名称、动作起始时间点、动作结束时间点以及该视频片段时长,并获取该快进操作或向前拖动操作的动作持续时间跨度,例如,用户快进了10s或向前拖动10s,则记为-10s,表示快进操作或向前拖动操作对视频片段的热度贡献值具有负的贡献。如果用户对视频内容的某些视频片段进行快退或向后拖动操作,表示用户对视频片段感兴趣,想重复观看,服务器1可以记录快退操作或向后拖动操作的动作名称、动作起始时间点、动作结束时间点以及该视频片段时长,并获取该快退操作或向后拖动操作的动作持续时间跨度,例如,用于快退了10或向后拖动10s,则记为+10s,表示快退操作或向后拖动操作对视频片段的热度贡献值具有正的贡献。本申请的这一实施例仍然以播放器播放春节联欢晚会为例进行说明。对于观看春节联欢晚会这一视频内容的每个用户群体,服务器根据该用户群体中的每个用户对播放视频内容时的每种操作类型的起止时间获取每种操作类型的持续时间,例如表10为服务器1在预设时间段内记录的用户观看春节联欢晚会的各个视频片段时对播放器的历史操作信息。表10用户观看春节联欢晚会时对播放器的历史操作信息605、对于每个用户群体,服务器2根据该用户群体对播放器的历史操作信息获取该用户群体的热点片段的阈值。服务器2可以根据不同的用户群体,对播放器的历史操作信息进行分组,一个用户不论对哪个视频片段进行了播放器的操作,该用户都会被划分至该用户所在的用户群体。例如id的用户对春节联欢晚会视频中的tfboys表演视频片段在10.11s时开始进行快进操作至12.11时结束操作,那么这条操作信息就会被划分至usergroup1中,例如各用户群体的分组如表4所示,用户观看春节联欢晚会时对播放器的历史操作信息如表10所示,那么将对播放器的历史操作信息分组后的情况可以如表11所示。表11对播放器的历史操作信息的分组而后,根据每个用户群体中每个用户对播放器的操作信息获取该用户群体的热点片段的热度贡献阈值。由于播放视频片段时用户对播放器的不同操作信息能够反映出用户对该视频片段内容的喜好与否,因此,可以用播放视频片段时用户对播放器的不同操作信息来衡量视频片段的热度值。在本申请实施例中,每个用户的每种操作类型的热度贡献可以用热度贡献值的公式来计算。对于每个用户群体中的每个用户,每种操作类型的热度贡献值可以为操作类型的持续时间与操作类型的加权值的乘积,再与操作类型对应的视频片段时长的比值。例如对于快进操作,其热度贡献值的公式可以表示为:hota(ta,tv)=ka*ta/tv,hota表示快进操作的热度贡献值,ta表示快进时长,即快进这种操作类型的持续时间,tv表示对应的视频片段时长,ka为快进这类操作类型的加权值,范围可以为(0~1)。对于向前拖动操作,其热度贡献值的公式可以表示为:hotb(tb,tv)=kb*tb/tv,hotb表示向前拖动操作的热度贡献值,tb表示向前拖动时长,即向前拖动这种操作类型的持续时间,tv表示对应视频片段时长,kb为向前拖动这类操作类型的加权值,由于向前拖动可以表示用户对视频内容的讨厌程度比快进更强烈,故kb≥ka,kb的范围可以为(0~1)。对于快退操作,其热度贡献值的公式可以表示为:hotc(tc,tv)=kc*tc/tv,hotc表示快退操作的热度贡献值,tc表示快退时长,即快退这种操作类型的持续时间,tv表示对应视频片段时长,kc表示快退这类操作类型的加权值,范围(0~1)。对于向后拖动操作,其热度贡献值的公式可以表示为:hotd(td,tv)=kd*td/tv,hotd表示向后拖动操作的热度贡献值,td表示向后拖动时长,即向后拖动这种操作类型的持续时间,tv表示对应视频片段时长,kd为向后拖动这类操作类型的加权值,由于向后拖动可以表示用户对视频内容的喜欢程度比快退更强烈,故kd≥kc,kd的范围可以为(0~1)。按照上述各操作类型的热度贡献值的计算方式,可以获取每个用户群体的总热度贡献值,这里将每个用户群体的总热度贡献值可以表示为即该用户群体对播放器操作的热度贡献值之和。其中u表示任一用户群体对播放器操作的集合,hoti为hota、hotb、hotc、hotd中的一种。而后,可以将用户群体的总热度贡献值与视频内容的视频片段的数量的比值,再与预设系数的乘积表示为该用户群体观看视频内容的热点片段的热度贡献阈值,即用户群体的热点片段的热度贡献阈值=(用户群体的总热度贡献值/视频片段数)*c,c表示预设系数。如果将上述公式中的c、ka、kb、tc、kd的取值均取为1,按照表11中的情况,那么usergroup1的热点片段的阈值=(hota(-2,250)+hotc(20,250)+hotd(50,250)+hota(-10,300)+hotb(-20,280))/3=(-2*ka/250+20*kc/250+50*kd/250-10*ka/300-20*kb/280)/3=0.056;usergroup2的热点片段的阈值=(hotb(-30,250)+hotd(40,300)+hotc(10,300)+hotd(35,300)+hotc(30,300)+hota(-6,300)+hotb(-30,280))/3=(-30*kb/250+40*kd/300+10*kc/300+35*kd/300+30*kc/300-6*ka/300-30*kb/280)/3=0.045usergroup3的热点片段的阈值=(hota(-8,250)+hotb(-40,300)+hotd(40,280)+hotc(30,280))/3=(-8*ka/250-40*kb/300+40*kd/280+30*kc/280)/3=0.085于是,每个用户群体的热点片段的热度贡献阈值可以如表12所示。表12每个用户群体的热点片段的热度贡献阈值606、服务器2根据热度贡献阈值以及用户群体对对播放器的历史操作信息获取用户群体的热点片段。如果某一用户群体对某一视频片段的热度贡献值大于该用户群体的热点片段的热度贡献阈值,可以确定该视频片段为该用户群体的热点片段。也就是说,对于每个用户群体,服务器获取用户群体对视频内容的各视频片段的热度贡献值的和,将热度贡献值的和大于热度贡献阈值的视频片段确定为用户群体的热点片段。例如按照表12中的情况,在各权值取为1的情况下,usergroup1对tfboys表演的视频片段的总的热度贡献值=hota(-2,250)+hotc(20,250)+hotd(50,250)=-2*ka/250+20*kc/250+50*kd/250=0.272usergroup1对周杰伦表演的视频片段的总的热度贡献值=hota(-10,300)=-10*ka/300=-0.033usergroup1对宋祖英表演的视频片段总的热度贡献值=hotb(-20,280)=-20*kb/280=-0.071usergroup2对tfboys表演的视频片段的总的热度贡献值=hotb(-30,250)=-30*kb/250=-0.12usergroup2对周杰伦表演的视频片段的总的热度贡献值=hotd(40,300)+hotc(10,300)+hotd(35,300)+hotc(30,300)+hota(-6,300)=40*kd/300+10*kc/300+35*kd/300+30*kc/300-6*ka/300=0.363usergroup2对宋祖英表演的视频片段总的热度贡献值=hotb(-30,280)=-30*kb/280=-0.107usergroup3对tfboys表演的视频片段的总的热度贡献值=hota(-8,250)=-8*ka/250=-0.032usergroup3对周杰伦表演的视频片段的总的热度贡献值=hotb(-40,300)=-40*kb/300=-0.133usergroup3对宋祖英表演的视频片段总的热度贡献值=hotd(40,280)+hotc(30,280)=40*kd/280+30*kc/280=0.25由于usergroup1对tfboys表演片段的总的热度贡献值为0.272,而usergroup1的热点片段的热度贡献阈值为0.056,因为热度贡献值0.272>热度贡献阈值0.056,故tfboys表演片段属于usergroup1的热点片段。按照这种方式,每个用户群体对应的热点片段可以如表13所示。表13每个用户群体的热点片段607、对于每个用户群体的热点片段,服务器2将该用户群体在该热点片段播放时对播放器操作的各时间点中的最早时间点和最晚时间点确定为热点片段的标签。对于每个用户群体的热点片段,标签中的最早时间点为该用户群体对该热点片段的操作中在时间上最先一次操作的时间点,最晚时间点为该用户群体对该热点片段的操作中在时间上最后一次操作的时间点。按照表13中的情况,例如对于usergroup1的热点片段,用户001的动作起始时间点10.11s为最早时间点,用户002的动作起始时间点105.45s为最晚时间点,那么usergroup1的热点片段的标签为(10.11s,105.45s)。对于usergroup2的热点片段,用于007的动作结束时间点310.54s为最早时间点,用户011的动作结束时间点513.49s为最晚时间点,那么usergroup2的热点片段的标签为(310.54s,513.49s)。对于usergroup3的热点片段,用于015的动作结束时间点740.53为最早时间点,用户016的动作起始时间点850.25为最晚时间点,那么usergroup3的热点片段的标签为(740.53,850.25)。608、服务器1接收服务器2发送的对应于每个用户群体的热点片段的标签并保存,并将对应于每个用户群体的热点片段的标签发送给相应的用户群体的用户设备。在服务器1获取到每个用户群体观看视频内容时的热点片段的标签后,如果在服务器1中保存的注册信息中的用户观看视频内容时,服务器1可以将视频内容的热点片段的标签发送给观看视频内容相应的用户群体的用户设备。609、用户设备根据标签在视频内容的显示部分显示热点片段的标签。在一种可能的实现方式中,对于每个用户群体,用户设备可以根据该用户群体对播放器操作的各时间点中的最早时间点和最晚时间点,在播放时间轴的热点片段的最早时间点处打上圆点,并根据最早时间点和最晚时间点的热点片段区间以区分非热点片段的颜色标注,例如可以如图7所示,图7为根据表13展示的每个用户群体观看春节联欢晚会视频时的热点片段。在另一种可能的实现方式中,对于每个用户群体,用户设备可以在视频显示区域中以列表的形式,按照该用户群体对播放器操作的各时间点中的最早时间点和最晚时间点向用户群体展示热点片段,同一个用户群体所被展示的热点片段可能不止一个。按照表13的举例,呈现给usergroup1的热点片段列表如图8中的图(1)所示,呈现给usergroup2的热点片段列表如图8中的图(2)所示,呈现给usergroup3的热点片段列表如图8中的图(3)所示。这样一来,本申请实施例可以按照每个用户群体,为每个用户群体提取和呈现个性化的热点片段,可以提高用户访问热点片段的准确度,同时,相对于现有技术中给所有用户呈现的为同一热点片段,本申请实施例可以提取和呈现出被掩盖的属于某些用户群体的热点片段。上述主要从各个网元之间交互的角度对本发明实施例提供的方案进行了介绍。可以理解的是,各个网元,例如服务器、用户设备等为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。;本发明实施例可以根据上述方法示例对服务器、用户设备等进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。在采用对应各个功能划分各个功能模块的情况下,如果服务器1和服务器2的功能集群在一个服务器中,图9示出了上述实施例中所涉及的服务器的一种可能的结构示意图,服务器90包括:分类单元901,获取单元902,发送单元903以及接收单元904。分类单元901用于支持服务器执行图3中的过程303,图6中的过程603,获取单元303用于支持服务器执行图3中的过程304、305、306,图6中的过程605、606、607;发送单元903用于执行图3中的过程307、309,图6中的过程604,接收单元904用于支持服务器执行图3中的过程302,图6中的过程602、608。其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。在采用集成的单元的情况下,上述实施例中所涉及的服务器1和服务器2的一种可能的结构示意图可以如图2所示。例如,数据发送模块12和历史数据获取模块21可以用于支持服务器1执行图3中的过程302,以及图6中的步骤602和604,用户分类模块22可以用于支持服务器2执行图3中的过程303以及图6中的步骤603,热点片段获取模块23可以执行图3中的过程304-306,以及图6中的步骤605和606,标签提取模块24可以执行图3中的过程307以及图6中的步骤607,数据发送模块25可以执行图3中的过程308,以及图6中的步骤608,数据发送模块12可以执行图3中的过程309,以及图6中的步骤608。服务器1和服务器2还可以包括存储模块(图2中未示出),存储模块用于存储服务器1和服务器2的程序代码和数据。其中,用户分类模块22、热点片段提取模块23以及标签提取模块24可以是处理器或控制器,例如可以是中央处理器(centralprocessingunit,cpu),通用处理器,数字信号处理器(digitalsignalprocessor,dsp),专用集成电路(application-specificintegratedcircuit,asic),现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等等。历史数据获取模块21、数据发送光模块25、数据发送模块12以及数据接收模块11可以是收发器、收发电路或通信接口等。数据存储模块11可以是存储器。当用户分类模块22、热点片段提取模块23以及标签提取模块24为处理器,历史数据获取模块21、数据发送光模块25、数据发送模块12以及数据接收模块11为收发器,数据存储模块11为存储器时,如果服务器1和服务器2的功能集群在一个服务器中,本发明实施例所涉及的服务器可以为图10所示的服务器。参阅图10所示,该服务器10包括:处理器1012、收发器1013、存储器1011以及总线1014。其中,收发器1013、处理器1012以及存储器1011通过总线1014相互连接;总线1014可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。在采用对应各个功能划分各个功能模块的情况下,图11示出了上述实施例中所涉及的用户设备的一种可能的结构示意图,用户设备111包括:发送单元1111、接收单元1112和显示单元1113。发送单元1111用于支持用户设备执行图3中的过程301、图6中的过程601,接收单元1112用于支持用户设备执行图3中的过程309,图6中的过程608;显示单元1113用于支持用户设备执行图3中的过程310,图6中的过程609。其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。在采用集成的单元的情况下,图2示出了上述实施例中所涉及的用户设备的一种可能的结构示意图。用户设备0包括:数据收集/发送模块01和呈现模块02。例如,数据收集/发送模块01用于支持用户设备执行图3中的过程301、图6中的过程601,呈现模块02用户执行图3中的过程310,图6中的过程609。数据收集/发送模块01用于支持用户设备与其他网络实体的通信,例如与图2、图3、图6中示出的功能模块或网络实体之间的通信。用户设备0还可以包括存储模块03和处理模块04(图中未示出),存储模块03用于存储用户设备的程序代码和数据,处理模块04用于对用户设备的动作进行控制管理。其中,处理模块04可以是处理器或控制器,例如可以是中央处理器cpu,通用处理器,数字信号处理器dsp,专用集成电路asic,现场可编程门阵列fpga或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等等。数据收集/发送模块01可以是收发器、收发电路或通信接口等。存储模块03可以是存储器,呈现模块02可以是显示器或显示屏等。当处理模块04为处理器,数据收集/发送模块01为收发器,存储模块03为存储器,呈现模块为显示器时,本发明实施例所涉及的用户设备可以为图12所示的用户设备。参阅图12所示,该用户设备122包括:处理器1212、收发器1213、存储器1211、显示器1215以及总线1214。其中,收发器1213、处理器1212、显示器1215以及存储器1211通过总线1214相互连接;总线1214可以是外设部件互连标准pci总线或扩展工业标准结构eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。结合本发明公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器(randomaccessmemory,ram)、闪存、只读存储器(readonlymemory,rom)、可擦除可编程只读存储器(erasableprogrammablerom,eprom)、电可擦可编程只读存储器(electricallyeprom,eeprom)、寄存器、硬盘、移动硬盘、只读光盘(cd-rom)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于asic中。另外,该asic可以位于核心网接口设备中。当然,处理器和存储介质也可以作为分立组件存在于核心网接口设备中。本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1