用于生成模型的方法和装置与流程

文档序号:17066128发布日期:2019-03-08 22:56阅读:129来源:国知局
用于生成模型的方法和装置与流程

本申请实施例涉及计算机技术领域,具体用于生成模型的方法和装置。



背景技术:

随着计算机技术的发展,短视频类应用应运而生。用户可以利用短视频类应用上传、发布视频。服务器在接收到一个视频后,可以预测该视频的流行度,进而根据流行度进行视频推荐。

相关的方式,通常是从现有数据中提取热点视频(例如点击量大的视频)和非热点视频(例如点击量小的视频)。将这些视频按照来源地(例如国家)进行划分,针对每个来源地训练独立的模型,以预测视频的流行度。



技术实现要素:

本申请实施例提出了用于生成模型的方法和装置。

第一方面,本申请实施例提供了一种用于生成模型的方法,该方法包括:获取样本集,其中,样本集中的样本包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息;从样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至包含全连接层的卷积神经网络,其中,全连接层包含多个分支,每一个分支对应一个来源地;基于各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值;基于损失值与目标值的比较,确定卷积神经网络是否训练完成;响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型。

在一些实施例中,各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值,包括:将各分支所输出的信息和所提取的样本中的第二标注信息输入至预设的与相应的分支对应的损失函数,确定各分支的损失值;基于所提取的样本中的第一标注信息,确定各分支的损失值的权重;对各分支的损失值进行加权,确定样本的损失值。

在一些实施例中,基于所提取的样本中的第一标注信息,确定各分支的损失值的权重,包括:对于每一个分支,响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地相同,将该分支的损失值的权重确定为第一预设数值;响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地不同,将该分支的损失值的权重确定为第二预设数值。

在一些实施例中,该方法还包括:响应于确定卷积神经网络未训练完成,基于损失值,更新卷积神经网络中的参数,从样本集中重新提取样本,使用更新参数后的卷积神经网络作为卷积神经网络,继续执行训练步骤。

第二方面,本申请实施例提供了一种用于生成模型的装置,该装置包括:获取单元,被配置成获取样本集,其中,样本集中的样本包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息;训练单元,被配置成从样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至包含全连接层的卷积神经网络,其中,全连接层包含多个分支,每一个分支对应一个来源地;基于各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值;基于损失值与目标值的比较,确定卷积神经网络是否训练完成;响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型。

在一些实施例中,训练单元,进一步被配置成:将各分支所输出的信息和所提取的样本中的第二标注信息输入至预设的与相应的分支对应的损失函数,确定各分支的损失值;基于所提取的样本中的第一标注信息,确定各分支的损失值的权重;对各分支的损失值进行加权,确定样本的损失值。

在一些实施例中,训练单元,进一步被配置成:对于每一个分支,响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地相同,将该分支的损失值的权重确定为第一预设数值;响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地不同,将该分支的损失值的权重确定为第二预设数值。

在一些实施例中,该装置还包括:更新单元,被配置成响应于确定卷积神经网络未训练完成,基于损失值,更新卷积神经网络中的参数,从样本集中重新提取样本,使用更新参数后的卷积神经网络作为卷积神经网络,继续执行训练步骤。

第三方面,本申请实施例提供了一种用于生成信息的方法,包括:响应于接收到目标视频,将目标视频中的帧输入采用如上述第一方面中任一实施例所描述的方法生成的视频流行度预测模型,其中,目标视频带有用于指示目标视频的来源地的标识;将目标视频的来源地作为目标来源地,将视频流行度预测模型的全连接层中与目标来源地的对应的分支作为目标分支,将目标分支所输出的信息确定为目标视频的流行度。

在一些实施例中,该方法还包括:响应于确定目标视频的流行度大于预设阈值,确定目标视频为热点视频,将目标视频推送至目标用户。

第四方面,本申请实施例提供了一种用于生成信息的装置,包括:输入单元,被配置成响应于接收到目标视频,将目标视频中的帧输入采用如上述第一方面中任一实施例所描述的方法生成的视频流行度预测模型,其中,目标视频带有用于指示目标视频的来源地的标识;获取单元,被配置成将目标视频的来源地作为目标来源地,将视频流行度预测模型的全连接层中与目标来源地的对应的分支作为目标分支,将目标分支所输出的信息确定为目标视频的流行度。

在一些实施例中,该装置还包括:推送单元,被配置成响应于确定目标视频的流行度大于预设阈值,确定目标视频为热点视频,将目标视频推送至目标用户。

第五方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述第一方面和第三方面中任一实施例的方法。

第六方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面和第三方面中任一实施例的方法。

本申请实施例提供的用于生成模型的方法和装置,通过获取样本集,可以从中提取样本以进行卷积神经网络的训练。其中,样本集中的样本包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息。这样,将提取的样本中的样本视频的帧输入至卷积神经网络,便可以得到卷积神经网络的全连接层的各分支所输出的信息。而后,可以基于卷积神经网络的全连接层的各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值。最后,可以基于损失值与目标值的比较,确定卷积神经网络是否训练完成。如果卷积神经网络训练完成,就可以将训练后的卷积神经网络确定为视频流行度预测模型。从而,能够得到一种可以用于视频流行度预测的模型,且该模型适用于对不同的来源地的视频的流行度的预测,提高了模型的适用性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请的一个实施例可以应用于其中的示例性系统架构图;

图2是根据本申请的用于生成模型的方法的一个实施例的流程图;

图3是根据本申请的用于生成模型的方法的一个应用场景的示意图;

图4是根据本申请的用于生成模型的方法的又一个实施例的流程图;

图5是根据本申请的用于生成模型的装置的一个实施例的结构示意图;

图6是根据本申请的用于生成信息的方法的一个实施例的流程图;

图7是根据本申请的用于生成信息的装置的一个实施例的结构示意图;

图8是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于生成模型的方法或用于生成模型的装置的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频录制类应用、视频播放类应用、语音交互类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。

当终端设备101、102、103为硬件时,其上还可以安装有图像采集设备。图像采集设备可以是各种能实现采集图像功能的设备,如摄像头、传感器等等。用户可以利用终端设备101、102、103上的图像采集设备,来采集视频。

服务器105可以是提供各种服务的服务器,例如用于对终端设备101、102、103上传的视频进行存储、管理或者分析的视频处理服务器。视频处理服务器可以获取样本集。样本集中可以包含大量的样本。其中,上述样本集中的样本可以包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息。此外,视频处理服务器可以利用样本集中的样本,对卷积神经网络进行训练,并可以将训练结果(如生成的视频流行度预测模型)进行存储。这样,在用户利用终端设备101、102、103上传视频后,服务器105可以确定用户所上传的视频的流行度,进而,可以对该视频进行推送等操作。

需要说明的是,服务器105可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是,本申请实施例所提供的用于生成模型的方法一般由服务器105执行,相应地,用于生成模型的装置一般设置于服务器105中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,示出了根据本申请的用于生成模型的方法的一个实施例的流程200。该用于生成模型的方法,包括以下步骤:

步骤201,获取样本集。

在本实施例中,用于生成模型的方法的执行主体(例如图1所示的服务器105)可以通过多种方式来获取样本集。例如,执行主体可以通过有线连接方式或无线连接方式,从用于存储样本的另一服务器(例如数据库服务器)中获取存储于其中的现有的样本集。再例如,用户可以通过终端设备(例如图1所示的终端设备101、102、103)来收集样本。这样,上述执行主体可以接收终端所收集的样本,并将这些样本存储在本地,从而生成样本集。需要指出的是,上述无线连接方式可以包括但不限于3g/4g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。

此处,样本集中可以包括大量的样本。其中,样本可以包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息。

此处,某个视频是否为热点视频,可以预先根据一些指标进行确定。例如,若该视频的每天推荐量大于某指定数值(例如5000),则可以认为该视频为热点视频。或者,若该视频在指定时间段内的点击量大于某指定数值,则可以认为该视频为热点视频。同理,若该视频的每天推荐量小于某指定数值(例如500),则可以认为该视频不为热点视频。或者,若该视频在指定时间段内的点击量小于某指定数值,则可以认为该视频不为热点视频。

步骤202,从样本集中提取样本。

在本实施例中,执行主体可以从步骤201中获取的样本集中提取样本,以及执行步骤203至步骤206的训练步骤。其中,样本的提取方式和提取数量在本申请中并不限制。例如,可以是随机提取至少一个样本,也可以是从中提取样本视频的清晰度较好(即样本视频的帧的像素较高)的样本。

步骤203,将所提取的样本中的样本视频的帧输入至包含全连接层的卷积神经网络。

在本实施例中,上述执行主体可以将步骤202中提取的样本中的样本视频中的帧输入至包含全连接层的卷积神经网络。卷积神经网络可以对视频中的帧进行特征提取、分析等处理,进而输出信息。需要说明的是,所输入的样本视频中的帧,可以是随机抽取的一帧或多帧;也可以是按照指定时间间隔(例如1s或者2s等)从上述样本视频中抽取的多帧。此处不作限定。

此处,卷积神经网络使用各种现有的结构(例如densebox、vggnet、resnet、segnet等)。实践中,卷积神经网络(convolutionalneuralnetwork,cnn)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于图像处理有出色表现,因而,可以利用卷积神经网络进行样本视频中的帧特征的提取。

在本实施例中,卷积神经网络可以包含全连接层。除卷积层外,也可以根据需要设置其他层。例如卷积层、池化层、特征融合层等。其中,卷积层可以用于提取图像特征。池化层可以用于对输入的信息进行降采样(downsample)。特征融合层可以用于将所得到的各帧对应的图像特征(例如,可以是特征矩阵的形式,或者特征向量的形式)进行融合。例如,可以将不同帧对应的特征矩阵中的相同位置的特征值取平均,以进行特征融合,生成一个融合后的特征矩阵。全连接层可以用于将所得到的特征进行分类。

在本实施例中,卷积神经网络的全连接层可以包含多个分支,每一个分支对应一个来源地。全连接层的各分支是相互独立的。全连接层的前一层所输出的信息可以分别输入至各分支,各分支对所输入的信息进行独立地处理,从而得到各分支输出的信息。实践中,各分支可以看作相互独立的全连接层。此处,来源地可以按照国家进行划分。例如,将来源地可以被划分为中国、美国、泰国等。此处,还可以按照地区(例如中国的南方、北方等)、洲(例如亚洲、欧洲等)、城市(例如北京、上海等)等进行划分。此处不作限定。

在本实施例中,在将样本视频中的帧输入到卷积神经网络后,卷积神经网络的浅层(此处可以理解为全连接层之前的层,例如卷积层、池化层、特征融合层等)可以对所输入的帧依次进行特征提取、分析等处理。而后将处理后的信息输入至全连接层的各分支。各分支可以对所接收到的信息进行进一步计算,最终输出信息。此处,对于每一个分支,该分支最终输出的信息可以是样本视频的属于热点视频的概率。这里,可以将各分支所输出的概率作为卷积神经网络所预测出的样本视频在不同来源地的流行度。实践中,全连接层的各分支可以使用sigmoid函数或者softmax函数等函数,计算样本视频的流行度。各分支所计算出的流行度可以位于区间[0,1]。需要说明的是,视频的流行度可以用于表征该视频的受关注程度。通常,流行度越高,视频的点击量或者转发量越大。当视频的流行度大于某个预设阈值,则可以认为该视频为热点视频。

步骤204,基于各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值。

在本实施例中,上述执行主体可以基于各分支所输出的信息、所提取的样本中的标注信息(包含第一标注信息和第二标注信息)和预设的与各分支对应的损失函数,确定样本的损失值。此处,对于某一分支,该分支对应的损失函数可以是用来估量该分支所输出的信息(例如样本视频在该分支对应的来源地的流行度)与真实值(例如1或0,分别表征所输入的样本视频是否为热点视频)的不一致程度。它是一个非负实值函数。一般情况下,损失函数的值(损失值)越小,模型的鲁棒性就越好。损失函数可以根据实际需求来设置。

具体地,可以按照如下步骤确定样本的损失值:第一步,对于每一个分支,上述执行主体可以将该分支所输出的信息,以及样本中的第二标注信息代入至该分支对应的损失函数,得到该分支对应的损失值。第二步,可以确定所提取的样本中的第一标注信息所指示的来源地,以便确定该来源地对应的全连接层的分支。第三步,可以仅提取第二步所确定的分支对应的损失值,将该损失值作为样本的损失值。

在本实施例的一些可选的实现方式中,上述执行主体可以按照如下步骤确定该样本的损失值:

第一步,可以将各分支所输出的信息和所提取的样本中的第二标注信息输入至预设的与相应的分支对应的损失函数,确定各分支的损失值。

第二步,可以基于所提取的样本中的第一标注信息,确定各分支的损失值的权重。

可选的,可以将第一标注信息所指示的来源地所对应的分支的损失值的权重设置为某个指定值(例如1),将其余来源地对应的分支的损失值的权重设置为另一指定值(例如0)。需要说明的是,上述各指定值可以是技术人员基于大量数据统计和分析而预先制定的值。

可选的,可以首先对来源地进行分组。将第一标注信息所指示的来源地所属组中各来源地对应的分支的损失值设置为某个指定值(例如1),将其余组中各来源地对应的分支的损失值设置为另一指定值(例如0)。此处,对来源地进行分组,可以是根据来源地所属区域进行划分的。例如,来源地包括中国、韩国、德国等。则可以按照来源地所属的大洲,将来源地划分为亚洲组、欧洲组等。

可选的,可以按照如下步骤确定各分支的损失值的权重:对于每一个分支,响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地相同,可以将该分支的损失值的权重确定为第一预设数值(例如1);响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地不同,将该分支的损失值的权重确定为第二预设数值(例如0)。此处,第一预设数值、第二预设数值可以是技术人员基于大量数据统计和分析而预先制定的值。

第三步,可以对各分支的损失值进行加权,确定样本的损失值。

步骤205,基于损失值与目标值的比较,确定卷积神经网络是否训练完成。

在本实施例中,上述执行主体可以基于所确定损失值与目标值进行比较。根据比较结果确定卷积神经网络是否训练完成。需要说明的是,若步骤202中提取有多个(至少两个)样本,则执行主体可以将每个样本的损失值分别与目标值进行比较。从而可以确定每个样本的损失值是否小于或等于目标值。作为示例,如果步骤202中提取有多个样本,那么在每个样本的损失值均小于或等于目标值的情况下,执行主体可以确定卷积神经网络训练完成。再例如,执行主体可以统计损失值小于等于目标值的样本占提取的样本的比例。且在该比例达到预设样本比例(如95%),可以确定卷积神经网络训练完成。需要说明的是,目标值一般可以用于表示预测值与真实值之间的不一致程度的理想情况。也就是说,当损失值小于或等于目标值时,可以认为预测值接近或近似真实值。目标值可以根据实际需求来设置。

需要说明的是,响应于确定卷积神经网络已训练完成,则可以继续执行步骤206。响应于确定卷积神经网络未训练完成,可以基于所确定的损失值,更新卷积神经网络中的参数,从上述样本集中重新提取样本,使用更新参数后的卷积神经网络作为卷积神经网络,继续执行上述训练步骤。此处,可以利用反向传播算法求得损失值相对于模型参数的梯度,而后利用梯度下降算法基于梯度更新模型参数。需要说明的是,上述反向传播算法、梯度下降算法以及机器学习方法是目前广泛研究和应用的公知技术,在此不再赘述。需要指出的是,这里的提取方式在本申请中也不限制。例如在样本集中有大量样本的情况下,执行主体可以从中提取未被提取过的样本。

步骤206,响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型。

在本实施例中,响应于确定卷积神经网络训练完成,上述执行主体可以将训练后的卷积神经网络确定为视频流行度预测模型。

在本实施例的一些可选的实现方式中,在训练得到视频流行度预测模型之后,上述执行主体响应于接收到目标视频,可以将上述目标视频中的帧输入至上述视频流行度预测模型。其中,上述目标视频带有用于指示上述目标视频的来源地的标识。目标视频可以是终端设备上传的任一视频。接着,上述执行主体可以将上述目标视频的来源地作为目标来源地,将上述视频流行度预测模型的全连接层中与上述目标来源地的对应的分支作为目标分支,将上述目标分支所输出的信息确定为上述目标视频的流行度。从而可以实现对用户上传的视频的流行度的预测。

在本实施例的一些可选的实现方式中,响应于确定上述目标视频的流行度大于预设阈值,上述执行主体可以确定上述目标视频为热点视频,将上述目标视频推送至目标用户。此处,目标用户可以是随机选取的用户,也可以是根据预先设定的规则确定的用户。作为示例,可以将关注上传该目标视频的用户的其他用户确定为目标用户。

继续参见图3,图3是根据本实施例的用于生成模型的方法的应用场景的一个示意图。在图3的应用场景中,图3的应用场景中,用户所使用的终端设备301上可以安装有模型训练类应用。当用户打开该应用,并上传样本集或样本集的存储路径后,对该应用提供后台支持的服务器302可以运行用于生成模型的方法,包括:

首先,可以获取样本集。其中,上述样本集中的样本可以包括样本视频303、用于指示样本视频的来源地的第一标注信息304和用于指示样本视频是否为热点视频的第二标注信息305。之后,可以从上述样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至包含全连接层的卷积神经网络306,其中,上述全连接层包含多个分支,每一个分支对应一个来源地;基于各分支所输出的信息、所提取的样本中的标注信息(第一标注信息304和第二标注信息305)和预设的与各分支对应的损失函数,确定样本的损失值307;基于上述损失值与目标值的比较,确定卷积神经网络是否训练完成;响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型308。

本申请的上述实施例提供的方法,通过获取样本集,可以从中提取样本以进行卷积神经网络的训练。其中,上述样本集中的样本包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息。这样,将提取的样本中的样本视频的帧输入至卷积神经网络,便可以得到卷积神经网络的全连接层的各分支所输出的信息。而后,可以基于卷积神经网络的全连接层的各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值。最后,可以基于上述损失值与目标值的比较,确定卷积神经网络是否训练完成。如果卷积神经网络训练完成,就可以将训练后的卷积神经网络确定为视频流行度预测模型。从而,能够得到一种可以用于视频流行度预测的模型,且该模型适用于对不同的来源地的视频的流行度的预测,提高了模型的适用性。

进一步参考图4,其示出了用于生成模型的方法的又一个实施例的流程400。该用于生成模型的方法的流程400,包括以下步骤:

步骤401,获取样本集。

在本实施例中,用于生成模型的方法的执行主体(例如图1所示的服务器105)可以获取样本集。此处,样本集中可以包括大量的样本。其中,样本可以包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息。

步骤402,从样本集中提取样本。

在本实施例中,执行主体可以从步骤401中获取的样本集中提取样本,以及执行步骤403至步骤408的训练步骤。其中,样本的提取方式和提取数量在本申请中并不限制。例如,可以是随机提取至少一个样本,也可以是从中提取样本视频的清晰度较好(即样本视频的帧的像素较高)的样本。

步骤403,将所提取的样本中的样本视频的帧输入至包含全连接层的卷积神经网络。

在本实施例中,上述执行主体可以将步骤402中提取的样本中的样本视频中的帧输入至包含全连接层的卷积神经网络。此处,卷积神经网络可以包含全连接层。除卷积层外,也可以根据需要设置其他层。例如卷积层、池化层、特征融合层等。上述全连接层可以包含多个分支,每一个分支对应一个来源地。全连接层的各分支是相互独立的。其中,来源地可以按照国家进行划分。

在本实施例中,在将样本视频中的帧输入到卷积神经网络后,卷积神经网络的浅层(此处可以理解为全连接层之前的层,例如卷积层、池化层、特征融合层等)可以对所输入的帧依次进行特征提取、分析等处理。而后将处理后的信息输入至全连接层的各分支。各分支可以对所接收到的信息进行进一步计算,最终输出信息。此处,对于每一个分支,该分支最终输出的信息可以是样本视频的属于热点视频的概率。这里,可以将各分支所输出的概率作为卷积神经网络所预测出的样本视频在不同来源地的流行度。

步骤404,将各分支所输出的信息和所提取的样本中的第二标注信息输入至预设的与相应的分支对应的损失函数,确定各分支的损失值。

在本实施例中,上述执行主体可以将各分支所输出的信息和所提取的样本中的第二标注信息输入至预设的与相应的分支对应的损失函数,确定各分支的损失值。对于某一分支,该分支对应的损失函数可以是用来估量该分支所输出的信息(例如样本视频在该分支对应的来源地的流行度)与真实值(例如1或0,分别表征所输入的样本视频是否为热点视频)的不一致程度。它是一个非负实值函数。一般情况下,损失函数的值(损失值)越小,模型的鲁棒性就越好。损失函数可以根据实际需求来设置。作为示例,可以使用交叉熵损失函数等现有的损失函数。

步骤405,对于每一个分支,响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地相同,将该分支的损失值的权重确定为第一预设数值;响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地不同,将该分支的损失值的权重确定为第二预设数值。

在本实施例中,对于每一个分支,响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地相同,上述执行主体可以将该分支的损失值的权重确定为第一预设数值(例如1)。响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地不同,将该分支的损失值的权重确定为第二预设数值(例如0)。

步骤406,对各分支的损失值进行加权,确定样本的损失值。

在本实施例中,上述执行主体可以对各分支的损失值进行加权,确定样本的损失值。

步骤407,基于损失值与目标值的比较,确定卷积神经网络是否训练完成。

在本实施例中,上述执行主体可以基于所确定损失值与目标值进行比较。根据比较结果确定卷积神经网络是否训练完成。需要说明的是,若步骤402中提取有多个(至少两个)样本,则执行主体可以将每个样本的损失值分别与目标值进行比较。从而可以确定每个样本的损失值是否小于或等于目标值。作为示例,如果步骤402中提取有多个样本,那么在每个样本的损失值均小于或等于目标值的情况下,执行主体可以确定卷积神经网络训练完成。

需要说明的是,响应于确定卷积神经网络已训练完成,则可以继续执行步骤408。响应于确定卷积神经网络未训练完成,可以基于所确定的损失值,更新卷积神经网络中的参数,从上述样本集中重新提取样本,使用更新参数后的卷积神经网络作为卷积神经网络,继续执行上述训练步骤。此处,可以利用反向传播算法求得损失值相对于模型参数的梯度,而后利用梯度下降算法基于梯度更新模型参数。需要说明的是,上述反向传播算法、梯度下降算法以及机器学习方法是目前广泛研究和应用的公知技术,在此不再赘述。需要指出的是,这里的提取方式在本申请中也不限制。例如在样本集中有大量样本的情况下,执行主体可以从中提取未被提取过的样本。

步骤408,响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型。

在本实施例中,响应于确定卷积神经网络训练完成,上述执行主体可以将训练后的卷积神经网络确定为视频流行度预测模型。

从图4中可以看出,与图2对应的实施例相比,本实施例中的用于生成模型的方法的流程400体现了确定所提取的样本的损失值的一种方式。由此,本实施例描述的方案可以基于来源地不同的样本视频,训练得到一种能够对不同来源地的视频进行流行度预测的模型,提高了模型的适用性。

进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于生成模型的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图5所示,本实施例所述的用于生成模型的装置500包括:获取单元501,被配置成获取样本集,其中,上述样本集中的样本包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息;训练单元502,被配置成从上述样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至包含全连接层的卷积神经网络,其中,上述全连接层包含多个分支,每一个分支对应一个来源地;基于各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值;基于上述损失值与目标值的比较,确定卷积神经网络是否训练完成;响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型。

在本实施例的一些可选的实现方式中,上述训练单元502可以进一步被配置成:将各分支所输出的信息和所提取的样本中的第二标注信息输入至预设的与相应的分支对应的损失函数,确定各分支的损失值;基于所提取的样本中的第一标注信息,确定各分支的损失值的权重;对各分支的损失值进行加权,确定样本的损失值。

在本实施例的一些可选的实现方式中,上述训练单元502可以进一步被配置成:对于每一个分支,响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地相同,将该分支的损失值的权重确定为第一预设数值;响应于确定所提取的样本中的第一标注信息所指示来源地与该分支对应的来源地不同,将该分支的损失值的权重确定为第二预设数值。

在本实施例的一些可选的实现方式中,该装置还可以包括更新单元(图中未示出)。其中,上述更新单元可以被配置成响应于确定卷积神经网络未训练完成,基于上述损失值,更新卷积神经网络中的参数,从上述样本集中重新提取样本,使用更新参数后的卷积神经网络作为卷积神经网络,继续执行上述训练步骤。

本申请的上述实施例提供的装置,通过获取样本集,可以从中提取样本以进行卷积神经网络的训练。其中,上述样本集中的样本包括样本视频、用于指示样本视频的来源地的第一标注信息和用于指示样本视频是否为热点视频的第二标注信息。这样,将提取的样本中的样本视频的帧输入至卷积神经网络,便可以得到卷积神经网络的全连接层的各分支所输出的信息。而后,可以基于卷积神经网络的全连接层的各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值。最后,可以基于上述损失值与目标值的比较,确定卷积神经网络是否训练完成。如果卷积神经网络训练完成,就可以将训练后的卷积神经网络确定为视频流行度预测模型。从而,能够得到一种可以用于视频流行度预测的模型,且该模型适用于对不同的来源地的视频的流行度的预测,提高了模型的适用性。

请参见图6,其示出了本申请提供的用于生成信息的方法的一个实施例的流程600。该用于生成信息的方法可以包括以下步骤:

步骤601,响应于接收到目标视频,将目标视频中的帧输入至视频流行度预测模型。

在本实施例中,用于生成信息的执行主体(例如图1所示的服务器105,或者存储有视频流行度预测模型的其他服务器)响应于接收到目标视频,可以将上述目标视频中的帧输入至视频流行度预测模型。其中,上述目标视频带有用于指示上述目标视频的来源地的标识。

在本实施例中,视频流行度预测模型可以是采用如上述图2实施例所描述的方法而生成的。具体生成过程可以参见图2实施例的相关描述,此处不再赘述。

步骤602,将目标视频的来源地作为目标来源地,将视频流行度预测模型的全连接层中与目标来源地的对应的分支作为目标分支,将目标分支所输出的信息确定为目标视频的流行度。

在本实施例中,上述执行主体可以将上述目标视频的来源地作为目标来源地,将上述视频流行度预测模型的全连接层中与上述目标来源地的对应的分支作为目标分支,将上述目标分支所输出的信息确定为上述目标视频的流行度。从而可以实现对用户上传的视频的流行度的预测。

在本实施例的一些可选的实现方式中,响应于确定上述目标视频的流行度大于预设阈值,上述执行主体可以确定上述目标视频为热点视频,将上述目标视频推送至目标用户。此处,目标用户可以是随机选取的用户,也可以是根据预先设定的规则确定的用户。作为示例,可以将关注上传该目标视频的用户的其他用户确定为目标用户。

需要说明的是,本实施例用于生成信息的方法可以用于测试上述各实施例所生成的视频流行度预测模型。进而根据测试结果可以不断地优化视频流行度预测模型。该方法也可以是上述各实施例所生成的视频流行度预测模型的实际应用方法。利用上述各实施例所生成的视频流行度预测模型,可以预测来自各来源地的视频的流行度,提高了模型的适用性,减少了模型维护成本。同时,可以有效地预测出视频是否会成为热点视频,有助于进行针对性的视频推送。

继续参见图7,作为对上述图6所示方法的实现,本申请提供了一种用于生成信息的装置的一个实施例。该装置实施例与图6所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图7所示,本实施例所述的用于生成信息的装置700包括:输入单元701,被配置成响应于接收到目标视频,将上述目标视频中的帧输入采用如上述图2实施例所描述的方法生成的视频流行度预测模型,其中,上述目标视频带有用于指示上述目标视频的来源地的标识;获取单元702,被配置成将上述目标视频的来源地作为目标来源地,将上述视频流行度预测模型的全连接层中与上述目标来源地的对应的分支作为目标分支,将上述目标分支所输出的信息确定为上述目标视频的流行度。

在本实施例的一些可选的实现方式中,该装置还可以包括推送单元(图中未示出)。其中,所述推送单元可以被配置成响应于确定目标视频的流行度大于预设阈值,确定目标视频为热点视频,将目标视频推送至目标用户。

可以理解的是,该装置700中记载的诸单元与参考图6描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置700及其中包含的单元,在此不再赘述。

下面参考图8,其示出了适于用来实现本申请实施例的电子设备的计算机系统800的结构示意图。图8示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图8所示,计算机系统800包括中央处理单元(cpu)801,其可以根据存储在只读存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。在ram803中,还存储有系统800操作所需的各种程序和数据。cpu801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。

以下部件连接至i/o接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(cpu)801执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元和训练单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取样本集的单元”。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:从该样本集中提取样本,执行如下训练步骤:将所提取的样本中的样本视频的帧输入至卷积神经网络;基于卷积神经网络的全连接层的各分支所输出的信息、所提取的样本中的标注信息和预设的与各分支对应的损失函数,确定样本的损失值;基于该损失值与目标值的比较,确定卷积神经网络是否训练完成;响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频流行度预测模型。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1