一种特征数据库更新方法及装置与流程

文档序号：11250922阅读：400来源：国知局

本发明涉及视频处理技术领域，特别是涉及一种特征数据库更新方法及装置。

背景技术：

视频网站诞生于高速发展的互联网时代，区别于传统的电视媒体，网络媒体更具有互动性。用户不再受时间和地域的限制，可以在任意时间，观看视频网站上的节目内容。当越来越多的用户倾向于在视频网站上观看节目时，用户对于视频网站节目内容的质量要求也越来越高，例如，用户希望观看视频过程中能够减少广告播放的时间、快速跳过片头片尾等。

视频网站每天都需要同时接收大量电视台的直播信号，并将这些直播信号处理转化为以节目为单位的点播视频，供用户点播观看。其中处理的过程一般包括：去除电视节目中的广告、确定片头片尾的位置、将新闻视频分割为多个子新闻等等。这些处理要求实时性，如果这些操作全部由人工完成，工作量是极大的，需要多人进行每天24小时不间断的工作。为了能够快速的对各种节目的有效内容进行定位，需要对视频图像的信息进行检测，以去除视频中的片头、片尾、广告等内容。

由于各种视频的风格千差万别，以对视频的片头片尾进行检测为例，现有技术中，通常使用基于特征匹配的方法进行片头片尾的查找。基于特征匹配的方法具体为：预先获得片头和片尾的人工分割后的视频文件，对这些视频文件进行镜头检测、关键帧提取以及特征提取，获得描述每个镜头视觉唯一性的视觉特征，将这些特征预先建立一个特征数据库；当直播视频输入时，同样进行镜头检测、关键帧提取以及特征提取，根据提取到的特征，在特征数据库中进行查找，如果查找到特征数据库中有匹配的特征，即认为这个特征对应的镜头为一个片头镜头或者片尾镜头。

上述视频图像检测方法操作简单，比较通用，但是也存在明显缺点。对于特征数据库中不存在的视频特征无法实现特征匹配的检测，需要人工更新特征数据库中的视频特征，不断维护特征数据库，该方法的工作量较大，需要大量人力介入，工作效率较低。

技术实现要素：

本发明实施例的目的在于提供一种特征数据库更新方法和装置，以实现减少人力的工作量，提高工作效率的目的。具体技术方案如下：

本发明提供了一种特征数据库更新方法，所述方法包括：

获取多个视频文件；

针对每个视频文件，获取该视频文件的视频特征信息，并根据获取的视频特征信息，对该视频文件进行镜头分割，得到各镜头对应的视频片段；

提取各视频片段的关键帧，以及各关键帧的视频特征；

针对每个视频片段，根据该视频片段的视频特征，确定该视频片段的重复次数；

根据该视频片段的重复次数，确定是否将该视频片段的视频特征存储在预先建立的特征数据库中。

可选的，针对每个视频文件，获取该视频文件的视频特征信息包括：

通过电子节目指南信息获取该视频文件的视频特征信息。

可选的，所述针对每个视频片段，根据该视频片段的视频特征，确定该视频片段的重复次数，包括：

构建空数据库；

针对每个视频片段，分别统计该视频片段的视频特征的总数量和所述数据库中存在的该视频片段的视频特征的第一数量；

根据统计结果，判断该视频片段是否存在于所述数据库中；

如果否，则将该视频片段的视频特征存储在所述数据库中，并设置该视频片段的重复次数为初始值；

如果是，则更新该视频片段的重复次数。

可选的，所述根据统计结果，判断该视频片段是否存在于所述数据库中，包括：

当所述总数量大于所述第一数量的预设倍数时，确定该视频片段存在于所述数据库中。

可选的，所述更新该视频片段的重复次数包括：

将所述重复次数加1，得到更新后的重复次数。

可选的，所述根据该视频片段的重复次数，确定是否将该视频片段的视频特征存储在预先建立的特征数据库中，包括：

若该视频片段的重复次数大于预设阈值，则将该视频片段的视频特征存储在预先建立的特征数据库中。

可选的，所述若该视频片段的重复次数大于预设阈值，则将该视频片段的视频特征存储在预先建立的特征数据库中，包括：

若该视频片段的重复次数大于预设阈值，查找所述预先建立的特征数据库中是否存在该视频片段的视频特征；

若不存在，则将该视频片段的视频特征存储在预先建立的特征数据库中。

本发明还提供了一种特征数据库更新装置，所述装置包括：

获取模块，用于获取多个视频文件；

镜头分割模块，用于针对每个视频文件，获取该视频文件的视频特征信息，并根据获取的视频特征信息，对该视频文件进行镜头分割，得到各镜头对应的视频片段；

提取模块，用于提取各视频片段的关键帧，以及各关键帧的视频特征；

视频处理模块，用于针对每个视频片段，根据该视频片段的视频特征，确定该视频片段的重复次数；

存储模块，用于根据该视频片段的重复次数，确定是否将该视频片段的视频特征存储在预先建立的特征数据库中。

可选的，所述镜头分割模块，具体用于通过电子节目指南信息获取该视频文件的视频特征信息。

可选的，所述视频处理模块，包括：

新建子模块，用于构建空数据库；

统计子模块，用于针对每个视频片段，分别统计该视频片段的视频特征的总数量和所述数据库中存在的该视频片段的视频特征的第一数量；

判断子模块，用于根据统计结果，判断该视频片段是否存在于所述数据库中；

存储子模块，用于当所述判断子模块判断结果为否时，则将该视频片段的视频特征存储在所述数据库中，并设置该视频片段的重复次数为初始值；

更新子模块，用于当所述判断子模块判断结果为是时，则更新该视频片段的重复次数。

可选的，所述判断子模块，具体用于当所述总数量大于所述第一数量的预设倍数时，确定该视频片段存在于所述数据库中。

可选的，所述更新子模块，具体用于将所述重复次数加1，得到更新后的重复次数。

可选的，所述存储模块，具体用于若该视频片段的重复次数大于预设阈值，则将该视频片段的视频特征存储在预先建立的特征数据库中。

可选的，所述存储模块，具体用于查找所述预先建立的特征数据库中是否存在该视频片段的视频特征；若不存在，则将该视频片段的视频特征存储在预先建立的特征数据库中。

本发明实施例提供的特征数据库更新方法和装置，可以将每个视频文件进行镜头分割，得到各镜头对应的视频片段，提取各视频片段的视频特征，根据各视频片段的视频特征，确定各视频片段的重复次数，针对各视频片段的重复次数，判断是否将该视频片段存储在预先建立的特征数据库中，可以实现根据各个视频片段的视频特征和重复次数不断更新预先建立的特征数据库，更新后的特征数据库，不再需要大量人力介入和人工维护，提高了工作效率。当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的特征数据库更新方法的流程图；

图2为本发明实施例中镜头分割的方法流程图；

图3为本发明实施例中确定视频片段的重复次数的流程图；

图4为本发明实施例提供的特征数据库更新装置的结构图；

图5为本发明实施例的视频处理模块的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了减少人力的工作量，提高工作效率，本发明实施例提供了一种特征数据库更新方法及装置，以下分别进行详细说明。

图1为本发明实施例特征数据库更新方法的流程图，包括如下步骤:

步骤101，获取多个视频文件；

本发明实施例提供的方法可以应用于电子设备。具体地，该电子设备可以为台式计算机、智能移动终端、便携式计算机等。

在本发明实施例中，电子设备获取视频文件的方式有多种，例如，可以通过合作模式直接在交互式网络平台上获取视频文件；可以利用爬虫工具遍历交互式网络平台上的内容，获取视频文件；可以利用硬件解析工具导出数字电视机顶盒中的视频文件等。

本步骤中，电子设备可以获取多个电视台、多个频道的视频文件。不同的电视台包括有高清、普通画质的视频信号，例如，高清信号视频帧的纵横比为16:9，普通信号视频帧的纵横比为4:3。因为在提取特征帧的时候，不同视频帧的纵横比会互相干扰，所以可以将不同纵横比的视频帧进行分离提取，在获取多个视频文件的时候，可以按照不同画质的信号分开处理。

步骤102，针对每个视频文件，获取该视频文件的视频特征信息，并根据获取的视频特征信息，对该视频文件进行镜头分割，得到各镜头对应的视频片段；

将步骤101中获取到的多个视频文件，分别进行处理。针对每个视频文件，获取该视频文件的视频特征信息。其中，任一视频文件的视频特征信息可以包括：该视频文件所属电视台的名称、该视频文件的节目名称、类型、视频的起始时间等。

电子设备获取视频文件的视频特征信息的方法有多种，分别对应相应的获取视频文件的方法。例如，通过合作模式直接获取由交互式网络平台提供视频文件的视频特征信息；利用爬虫工具遍历交互式网络平台上的内容，获取视频文件的视频特征信息；利用硬件解析工具导出机顶盒中的视频文件的视频特征信息等。

本发明实施例中，针对每个视频文件，可以通过合作模式直接获取由交互式网络平台提供视频文件的视频特征信息。具体地，可以通过获取电子节目指南信息的方法获取该视频文件的视频特征信息。电子节目指南信息是指在交互式网络平台中提供给用户的电视节目信息导引，其中包含有节目的起始时间、节目名称等信息，基于电子节目指南信息中的提示，可以实现视频特征信息的粗略定位。

具体的，可以通过电子节目指南信息中的信息导引，建立带有字段的链表。对于来自于同一个电视台的视频文件，可以为每个电视节目建立一个字段，每个字段中包含电视台、节目名称、类型、起始时间等，一天内这个频道的字段构成一个电视台链表；还可以将每个电视台链表中任意一个节目，统计节目名称并且类型不属于广告的所有字段，构成一个节目重复链表。针对节目重复链表中每个字段，选取每个字段的节目对应的起始时间，例如，将开始时前5分钟和结束前5分钟的区域选定为目标区域，作为要研究的区域，更新节目重复链表中的目标区域。

对于相同电视台的电视台链表进行遍历，将不同时间范围内的电视台链表进行统计，对于其中任意一个节目，按照节目名称，统计类型不属于广告的所有字段，构成一个时间重复链表。对于时间重复链表中的每个字段，选取每个字段的节目对应的起始时间，例如，将开始时前5分钟和结束前5分钟的区域选定为目标区域，更新时间重复链表中的目标区域。

上述构建节目重复链表和时间重复链表为获取每个视频文件的视频特征信息的一种实现方法，实际应用中，并不限于这种方法。获取到各视频文件的视频特征信息后，电子设备还可以根据获取得到的视频特征信息，对各视频文件进行镜头分割。

镜头分割的目的是将目标区域的视频进行镜头检测，镜头检测的目的是将视频中相似的视频帧进行聚类、合并处理为一个镜头，将视频文件分割成以镜头为单位的片段。例如，将节目重复链表或时间重复链表更新的字段为镜头序号等。

步骤103，提取各视频片段的关键帧，以及各关键帧的视频特征；

本步骤中，针对上述镜头分割得到的各个视频片段，提取各视频片段的关键帧。对于得到的各视频片段，选出代表这个片段的镜头，并提取各镜头的关键帧，从而达到减小整体计算量的目的。

例如，可以根据预先设定的帧数m，在镜头中抽取m帧作为代表帧，计算抽取视频帧的间隔gap＝(e-s)/(m+1)，e代表当前帧的开始位置，s代表当前帧的结束位置，从当前帧开始以gap为间隔抽取视频帧，作为关键帧。

提取关键帧的视频特征时，为了避免不同电视台台标以及外加字幕等信息的干扰，可以预先设定关键帧的图像区域(x，y，w，z)中的像素参加视觉特征的计算，其中x代表这个图像区域的横轴起点坐标，y代表这个图像区域的横轴终点坐标，w代表这个图像区域的纵轴起点坐标，z代表这个图像区域的纵轴终点坐标。图像区域之外的像素不参加特征计算，区域内的像素称之为子图像。

对于子图像提取特征的方式有多种，一个简单的实施例为：将子图像的rgb值转化为灰度值，将灰度图像进行高斯模糊滤波，去除噪声干扰，将处理后的子图像，均分为4块，计算每块的离散余弦变换后的系数对应的hash编码，将4块分块的hash编码串起来组成视觉特征，对于一个镜头可以提取多个视觉特征。

步骤104，针对每个视频片段，根据该视频片段的视频特征，确定该视频片段的重复次数；

本步骤中，根据每个视频片段的视频特征，以镜头为单元，确定该视频片段的重复次数。确定重复次数方法可以为，对于一个镜头的每一个视频特征，都有其对应的hash编码，根据hash编码确定是否是同一个视频特征。将视频特征进行匹配，当相同镜头中的视频特征有重复时，统计该镜头即视频片段的重复次数。

通过确定各视频片段的重复次数，可以完成所有视频片段的匹配，以便后续对该视频片段进一步处理。对于每一个视频片段，都需要确定它的重复次数。

步骤105，根据该视频片段的重复次数，确定是否将该视频片段的视频特征存储在预先建立的特征数据库中。

根据步骤104中得到的视频片段的重复次数，可以确定是否将该视频片段的视频特征存储在预先建立的特征数据库中。通过视频片段的重复次数可以确定该视频片段是否处于目标区域，比如我们感兴趣的片段和镜头等。在实际应用中，片头、片尾或者插入到视频文件中的一段广告等都可以作为目标区域。

当重复次数满足一定条件时，例如，若该视频片段的重复次数大于预设阈值，则将该视频片段的视频特征存储在预先建立的特征数据库中。例如，在电子设备统计时间重复链表和节目重复链表中，以节目为粒度，视频片段中起始时间不同的字段个数的总和m，设定一个判断阈值ths＝a×m,0<a<1，a为常数。当重复次数大于ths时，那么这个视频片段就是目标区域，可能是片头、片尾或者插入到视频文件中的一段广告等。

本发明实施例提供的一种特征数据库更新方法，将每个视频文件进行镜头分割，得到各镜头对应的视频片段，提取各视频片段的视频特征，根据各视频片段的视频特征，确定各视频片段的重复次数，针对各视频片段的重复次数，判断是否将该视频片段存储在预先建立的特征数据库中，如果重复次数大于预设阈值并且预先建立的特征数据库不存在该视频片段的视频特征时，将该视频片段存储在预先建立的特征数据库中，以实现根据各个视频片段的视频特征和重复次数不断更新预先建立的特征数据库，更新后的特征数据库，不再需要大量人力介入和人工维护，提高了工作效率。

作为本发明实施例的一种实施方式，如图2所示，其示出了本发明实施例中镜头分割的方法流程图，该方法包括以下步骤：

步骤201，绘制输入的视频帧的三原色光模式(colormodel，rgb)值的颜色直方图；

通过现有的计算机程序软件，例如java等，可以将输入的视频帧中的图像进行rgb值转换。例如，可以用raster获取视频帧每一像素点的rgb值，由此计算每一个输入的视频帧的rgb值。并且，可以利用这些rgb值，采用opencv或者matlab绘制出每个视频帧的颜色直方图。

步骤202，计算时域相邻帧的颜色直方图的欧氏距离；

计算时域相邻帧的颜色直方图之间的欧式距离，即直方图上点与点之间的直线距离。

步骤203，根据欧式距离值，进行镜头分割。

如果欧式距离值大于预先设定的阈值th1，则认为镜头发生了切变，记录当前帧的开始位置e和结束位置s之间的所有视频帧为一个镜头；计算当前帧与当前帧之前的n帧之间的直方图的欧式距离，如果大于预先设定的阈值th2，则认为在此处发生了镜头渐变，记录当前帧的开始位置e1和结束位置s1之间的所有视频帧为一个镜头。如果上述条件都不满足，则确定当前帧处于一个镜头内部，继续检测镜头分割点，重复步骤201和步骤202。

作为本发明实施例的一种实施方式，针对每个视频片段，根据该视频片段的视频特征，确定该视频片段的重复次数的流程图，如图3所示，包括如下步骤：

步骤301，构建空数据库；

步骤302，针对每个视频片段，分别统计该视频片段的视频特征的总数量和数据库中存在的该视频片段的视频特征的第一数量；

将每个视频片段的视频特征的总数量进行统计，再将建立的空数据库中的该视频片段的视频特征的数量进行统计，并将该数量值记为第一数量。统计该视频片段视频特征的总数量和第一数量是为了确定该视频片段是否存在于数据库中。

步骤303，根据统计结果，判断该视频片段是否存在于数据库中；若是，执行步骤304a；若否，执行步骤304b；

根据统计得到的总数量和第一数量，当它们满足一定的关系时，由此判断该视频片段存在于数据库中。具体方法可以为，当总数量大于第一数量的预设倍数时，确定该视频片段存在于数据库中。

当统计得到的总数量大于第一数量的预设倍数时，则认为该视频片段存在于数据库中。例如，当该视频片段含有n个视频特征时，如果该视频片段在数据库中的视频特征的第一数量小于n/2时，则认为该视频片段不存在于数据库中；如果该视频片段在数据库中的视频特征的第一数量大于n/2时，则认为该视频片段存在于数据库中。当总数量大于第一数量的预设倍数时，则认为该视频片段的大部分特征都存储在数据库中，所以可以确定该视频片段存在于数据库中。预设倍数可以根据用户的需要任意设定。

步骤304a，将该视频片段的视频特征存储在数据库中，并设置该视频片段的重复次数为初始值；

如果该视频片段不存在于数据库中，则将该视频片段的视频特征存储在数据库中，并将该视频片段的重复次数设置为初始值。例如，将初次存储在数据库中的视频片段的重复次数设置为1。

步骤304b，更新该视频片段的重复次数。

如果判断一个视频片段存在于数据库中，则将该视频片段的重复次数更新，得到一个新的重复次数，具体可以更新为在原有的重复次数上加1，表明该视频片段又重复了1次。

作为本发明实施例的一种实施方式，电子设备将视频片段存储至预先建立的特征数据库中时，还可以根据确定的目标区域进一步判断该视频片段是否存在于预先建立的特征数据中。具体方法为，若该视频片段的重复次数大于预设阈值，查找预先建立的特征数据库中是否存在该视频片段的视频特征；若不存在，则将该视频片段的视频特征存储在预先建立的特征数据库中。

当该视频片段的重复次数大于预设阈值时，在将该视频片段的视频特征存储在预先建立的特征数据库中之前，电子设备可以先查找预先建立的特征数据库中是否存在该视频片段的视频特征，如果存在该视频片段的视频特征，则不需要存储该视频片段的视频特征。如果不存在该视频片段的视频特征，则需要存储该视频片段的视频特征。

本发明实施例查找预先建立的特征数据库中是否存在该视频片段的视频特征，是为了避免重复存储该视频片段的视频特征，浪费预先建立的特征数据库的空间，只有在没有存储该视频片段的视频特征的情况下，才会将该视频片段的视频特征存储在预先建立的特征数据库中。

本发明还提供了一种特征数据库更新装置，装置的结构图如图4所示，包括：

获取模块401，用于获取多个视频文件；

镜头分割模块402，用于针对每个视频文件，获取该视频文件的视频特征信息，并根据获取的视频特征信息，对该视频文件进行镜头分割，得到各镜头对应的视频片段；

提取模块403，用于提取各视频片段的关键帧，以及各关键帧的视频特征；

视频处理模块404，用于针对每个视频片段，根据该视频片段的视频特征，确定该视频片段的重复次数；

存储模块405，用于根据该视频片段的重复次数，确定是否将该视频片段的视频特征存储在预先建立的特征数据库中。

本发明实施例提供的一种特征数据库更新装置，将每个视频文件进行镜头分割，得到各镜头对应的视频片段，提取各视频片段的视频特征，根据各视频片段的视频特征，确定各视频片段的重复次数，针对各视频片段的重复次数，判断是否将该视频片段存储在预先建立的特征数据库中，可以实现根据各个视频片段的视频特征和重复次数不断更新预先建立的特征数据库，更新后的特征数据库，不再需要大量人力介入和人工维护，提高了工作效率。

可选的，镜头分割模块402，具体用于通过电子节目指南信息获取该视频文件的视频特征信息。

具体的，视频处理模块404的结构示意图，如图5所示，包括：

新建子模块501，用于构建空数据库；

统计子模块502，用于针对每个视频片段，分别统计该视频片段的视频特征的总数量和数据库中存在的该视频片段的视频特征的第一数量；

判断子模块503，用于根据统计结果，判断该视频片段是否存在于所述数据库中；

存储子模块504，用于当所述判断子模块判断结果为否时，则将该视频片段的视频特征存储在所述数据库中，并设置该视频片段的重复次数为初始值；

更新子模块505，用于当所述判断子模块判断结果为是时，则更新该视频片段的重复次数。

可选的，判断子模块503，具体用于当总数量大于第一数量的预设倍数时，确定该视频片段存在于数据库中。

可选的，更新子模块505，具体用于将重复次数加1，得到更新后的重复次数。

可选的，存储模块405，具体用于若该视频片段的重复次数大于预设阈值，则将该视频片段的视频特征存储在预先建立的特征数据库中。

可选的，存储模块405，具体用于查找预先建立的特征数据库中是否存在该视频片段的视频特征；若不存在，则将该视频片段的视频特征存储在预先建立的特征数据库中。

需要说明的是，本发明实施例的装置是应用上述特征数据库更新方法的装置，则上述特征数据库更新方法的所有实施例均适用于该装置，且均能达到相同或相似的有益效果。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘楠
技术所有人：北京奇艺世纪科技有限公司
我是此专利的发明人

上一篇：POI推荐方法、装置、设备及计算机可读存储介质与流程
上一篇：一种数据关联方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。