一种视频处理方法及装置、设备、存储介质与流程

文档序号：18162660发布日期：2019-07-13 09:24阅读：202来源：国知局

本申请涉及计算机技术，尤其涉及一种视频处理方法及装置、设备、存储介质。

背景技术：

伴随互联网的发展，互联网中的视频呈现爆炸式增长的态势。视频由于其包含丰富信息而备受关注，同时图像处理技术的成熟也推动视频分析的进步。

视频由于其包含丰富信息而备受关注，同时图像处理技术的成熟也推动视频分析的进步。一个视频会包括多个场景或行为，由于当前计算资源的限制和对处理时间的快速性要求，需要将视频合理分段且尽可能的保证每段视频的独立性与完全性，即分段后的每段视频包含且仅包含某个单独的场景或行为。

技术实现要素：

有鉴于此，本申请施例提供了一种视频处理方法及装置、设备、存储介质。

本申请实施例提供的视频处理方法包括：

获取目标视频中的视频帧集合；所述视频帧集合包括所述目标视频帧的全部或部分视频帧；根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧中确定第一分割帧；根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧。

本申请实施例提供的视频处理装置包括：获取单元、第一分割单元和第二分割单元；其中，

所述获取单元，用于获取目标视频中的视频帧集合；

所述第一分割单元，用于根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧中确定第一分割帧；

所述第二分割单元，用于根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧。

本申请实施例提供的电子设备包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行上述的视频处理方法的步骤。

本申请实施例提供的存储介质上存储有视频处理程序，所述视频处理程序被处理器执行时，实现上述的视频处理方法。

本申请实施例中，根据目标视频的视频帧集合中各视频帧的图像指纹特征，从视频帧集合中选取第一分割帧，再根据第一分割帧对应的视频帧的图像像素特征，从第一分割帧中选取目标分割帧，从而先根据对象级的视频图像低层次级特征对目标视频进行分割，得到粗粒度的分割结果，再根据像素级的视频图像低层次级特征对从粗粒度的分割结果中筛选细粒度的分割结果，保证分割结果的准确度的同时，提高视频分割的速度，同时满足速度和准确度的需求。

附图说明

图1为本申请实施例提供的视频分割方法的实现流程示意图一；

图2为本申请实施例关键帧示意图；

图3为本申请实施例分割效果示意图；

图4为本申请实施例提供的视频分割方法的实现流程示意图二；

图5为本申请实施例提供的视频分割方法的实现流程示意图三；

图6为本申请实施例提供的视频分割方法的实现流程示意图四；

图7为本申请实施例提供的视频分割方法的实现流程示意图五；

图8为本申请实施例提供的视频分割装置的结构示意图；

图9为本申请实施例提供的电子设备的结构组成示意图。

具体实施方式

以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所提供的实施例仅仅用以解释本申请，并不用于限定本申请。另外，以下所提供的实施例是用于实施本申请的部分实施例，而非提供实施本申请的全部实施例，在不冲突的情况下，本申请实施例记载的技术方案可以任意组合的方式实施。

在本申请的各种实施例中，获取目标视频中的视频帧集合；所述视频帧集合包括所述目标视频帧的全部或部分视频帧；根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧集合的视频帧中确定第一分割帧；根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧。

本申请实施例提供一种视频处理方法，该方法应用于电子设备，电子设备中的各功能模块可以由电子设备(如终端设备、服务器或服务器集群)的硬件资源，如处理器等计算资源、传感器等探测资源、通信资源协同实现。

电子设备可以是任何具有信息处理能力的电子设备，在一种实施例中，电子设备可以是智能终端，例如可以是笔记本等具有无线通信能力的移动终端。在另一种实施例中，电子设备还可以是不便移动的具有计算功能的终端设备，比如台式计算机、桌面电脑、服务器等。

当然，本申请实施例不局限于提供为方法和硬件，还可有多种实现方式，例如提供为存储介质(存储有用于执行本申请实施例提供的视频处理方法的指令)。

图1为本申请实施例视频处理方法的实现流程示意图一，如图1所示，该视频处理方法包括：

s101、获取目标视频中的视频帧集合；

所述视频帧集合包括所述目标视频帧的全部或部分视频帧检测所述目标部件；

电子设备中安装有视频处理应用程序，视频处理应用程序可接收通过摄像头采集的视频数据、也可基于网络从其他电子设备接收视频数据或将视频数据发送至其他的电子设备。

其中，电子设备可为终端设备或服务器。目标视频可为用户通过终端设备的摄像头采集的视频数据，可为通过网络从服务器下载至终端设备的视频数据，也可为用户通过终端设备上传至服务器的视频数据。

视频数据的编码格式可以为任意编码格式，本实施例中不做限定，如动态专家组(mpeg，movingpictureexpertsgroup、音频视频交错格式(avi，audiovideointerleaved)、可改变动态码率(rmvb，variablebitrate)、divx、xvid等。

当电子设备确定目标视频后，将根据设定的提取规则对目标视频进行帧提取，以获得目标视频数据的视频帧，基于获得的视频帧构成视频帧集合。视频帧集合可为目标视频的全部视频帧或部分视频帧。这里，提取规则可为指定的帧率或关键帧。

当提取规则执行的帧率时，根据指定的帧率对目标视频进行帧提取，这里，执行的帧率可根据目标视频的帧率确定，比如：与目标视频的帧率相同，或为目标视频帧的帧率的二分之一，或为目标视频帧的帧率的三分之一，本申请实施例对指定的帧率不进行任何的限制。比如：目标视频的帧率为15帧每秒(framepersecond，fps)，指定的帧率与目标视频的帧率相同为15fps，当目标视频为2分钟的视频时，提取的视频帧为15*2*60＝1800帧，由1800视频帧帧构成视频帧集合。又比如：目标视频的帧率为15帧每秒(framepersecond，fps)，指定的帧率与目标视频的帧率相同为7.5fps，当目标视频为2分钟的视频时，提取的视频帧为7.5*2*60＝900帧，由1900视频帧帧构成视频帧集合。

当提取规则执行的关键帧时，可通过关键帧差值方法获取目标视频中的关键帧。

在一实施例中，s101可以包括：获取所述目标视频的关键帧，并由所述关键帧组成所述视频帧集合。

关键帧为视频数据中角色或者物体运动或变化中的关键动作所处的那一帧。如图2所示，帧201为帧2011、帧2012、帧2013和帧2014的关键帧。帧202为帧2021、帧2022、帧2023和帧2024的关键帧。

目标视频帧的关键帧可由人工标注、或通过关键帧提取算法提取、或将目标视频输入具有关键帧提取算法的网络模型中，由网络模型对目标视频的关键帧进行提取，输出目标视频的关键帧。

关键帧提取算法可为基于抽样的方法、基于镜头边界法、基于颜色特征法、基于运动分析法、基于聚类的关键帧提取等。

s102、根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧集合的视频帧中确定第一分割帧；

在s103中确定目标视频的视频帧集合后，确定视频帧集合中每一视频帧的图像指纹特征。视频帧的图像指纹特征为以视频帧为对象来计算的视频帧的低层次特征，是图像的指纹字符串，比如：哈希(hash)特征。其中，可采用图像指纹算法来确定视频帧集合中各视频帧的图像指纹特征，图像指纹算法可为平均哈希算法、感知哈希算法、差异哈希算法等哈希计算哈希特征的算法。本申请实施例对图像指纹算法不进行任何的限定。

对于不同的视频帧，两个视频帧的图像指纹特征越相近，表征两个视频帧越相似，两个视频帧的图像指纹特征差距越大，表征两个视频帧相差越大。

当确定视频帧集合中各视频视频帧指纹特征后，将视频帧集合中任意相邻的两个视频帧的图像指纹特征进行比较，根据比较结果确定第一分割点，并将第一分割点对应的视频帧作为第一分割帧。

比如：目标视频的视频帧集合包括：帧1、帧2、帧3直至帧4000这4000个视频帧，根据每个视频帧的图像指纹特征从4000个视频帧中选取的第一分割帧包括：帧46、帧567、帧1234、帧2237、帧2456、帧2989、帧3208、帧3689。

第一分割帧可为第一分割点之前的视频帧或之后的视频帧，也可包括之前的视频帧和之后的视频帧两个视频帧。比如：第一分割点位于帧45和帧46之间，表征在帧45和帧46之间进行目标视频的分割，将帧45分割至前一视频分段，将帧46分割至后一视频分段，此时，第一分割帧可为帧45或帧46。其中，通过一个视频帧表示第一分割帧，可通过第一分割标识来表征该视频帧是第一分割点之前的视频帧还是第一分割点之后的视频帧。

在一实施例中，s102可以包括：根据所述视频集合中视频帧的图像指纹特征确定两个相邻的视频帧的第一帧间距离；如果所述第一帧间距离大于指定的第一帧间距离阈值时，确定所述第一帧间距离对应的视频帧为第一分割帧。

提取视频帧集合中每一视频帧的图像指纹特征，将视频帧集合中任意相邻的两个视频帧的图像指纹特征进行比较，得到对应两个视频帧的第一帧间距离。将第一帧间距离大于指定的第一帧间距离阈值的两个视频帧中的任一个作为第一分割帧。其中，第一帧间距离阈值可根据实际需求进行设置。

比如：目标视频的视频帧集合包括：帧1、帧2、帧3直至帧4000这4000个视频帧，确定这4000个视频帧中每个视频帧的图像指纹特征，将帧1的图像指纹特征和帧2的图像指纹特征进行比较，得到帧1和帧2的第一帧间距离，将帧2的图像指纹特征和帧3的图像指纹特征进行比较，得到帧2和帧3的第一帧间距离，将帧3的图像指纹特征和帧4的图像指纹特征进行比较，得到帧3和帧4的第一帧间距离，以此类推，得到任意两个相邻的视频帧的第一帧间距离；当第一帧间距离阈值为0.8时，帧44和帧45的第一帧间距离为0.56，帧45和帧46的第一帧间距离为0.85，帧46和帧47的第一帧间距离为0.23，则确定帧45和帧46之间的点为第一分割点，帧46为第一分割帧，以此类推，确定视频集合中的第一分割帧。

s103、根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧。

在s102中确定第一分割帧后，确定第一分割帧对应的视频帧，第一分割帧对应的视频帧为第一分割点前后的两个帧。比如：第一分割帧为帧45，为第一分割点之前的视频帧，则第一分割帧对应的视频帧为帧45和帧46；又比如：第一分割帧为帧46，为第一分割点之后的视频帧，则第一分割帧对应的视频帧为帧45和帧46。

根据图像像素算法计算第一分割帧对应的视频帧的图像像素特征。图像像素特征为像素级的视频图像低层次级特征，比如：颜色直方图、快速提取特征点和描述子(orientedfastandrotatedbrief，orb)特征等。颜色直方图可可以是基于不同的颜色空间，比如：rgb(红-绿-蓝)颜色空间、hsv(色彩-饱和度-值)颜色空间、cmyk((cyan-magenta-yellow，青-品-黄))颜色空间。本申请实施例对图像像素算法不进行任何的限定。

对于不同的视频帧，两个视频帧的图像像素特征越相近，表征两个视频帧的像素越相近。两个视频帧的图像像素特征差距越大，表征两个视频帧相差越大。比如：同一室内场景下的两个视频帧的图像指纹特征相近，不同室内场景下的两个视频帧的图像指纹特征相差较大。

当确定各第一分割帧对应的视频帧的图像像素特征后，将每一分割帧对应的两个视频帧的图像像素特征进行比较，根据比较结果确定目标分割点，并将目标分割点对应的视频帧作为目标分割帧。相邻视频帧为第一分割视频的第一分割点对应侧的相邻视频帧。

比如：第一分割帧包括：帧46、帧567、帧1234、帧2237、帧2456、帧2989、帧3208、帧3689。根据每一个第一分割帧对应的视频帧的图像像素特征从第一分割帧中选取的目标分割帧包括：帧46、帧1234、帧2237、帧2989、帧3689。

在一实施例中，s103可以包括：根据所述第一分割帧的图像像素特征，和所述第一分割帧的相邻视频帧的图像像素特征，确定所述第一分割帧对应的第二帧间距离；如果所述第二帧间距离大于指定的第二帧间距离阈值时，确定所述第二帧间距离对应的第一分割帧为目标分割帧。

将第一分割帧和与第一分割帧相邻的相邻视频帧作为第一分割帧对应的视频帧，提取第一分割帧对应的视频帧的图像像素特征，将第一分割帧对应的视频帧的两个视频帧的图像像素特征进行比较，得到对应两个视频帧的第二帧间距离。将第二帧间距离大于指定的第二帧间距离阈值的两个视频帧中的任一个作为目标分割帧。其中，第二帧间距离阈值可根据实际需求进行设置。

比如：第一分割帧包括：帧46、帧567、帧1234、帧2237、帧2456、帧2989、帧3208、帧3689。确定帧45、帧46、帧566、帧567、帧1233、帧1234、帧2236、帧2237、帧2455、帧2456、帧2988、帧2989、帧3207、帧3208、帧3688、帧3689这些视频帧中每个视频帧的图像像素特征，将帧45的图像像素特征和帧46的图像像素特征进行比较，得到帧45和帧46的第二帧间距离，将帧566的图像像素特征和帧567的图像像素特征进行比较，得到帧566和帧567的第二帧间距离，将帧1233的图像像素特征和帧1234的图像像素特征进行比较，得到帧1233和帧1234的第二帧间距离，以此类推，得到第一分割帧对应的两个视频帧的第二帧间距离；当第二帧间距离阈值为0.6时，帧45和帧46的第二帧间距离为0.9，帧566和帧567的第二帧间距离为0.52，则确定帧45和帧46之间的点为第二分割点，帧46为目标分割帧，帧567不是目标分割帧，以此类推，确定第一分割帧中的目标分割帧。

在实际应用中，当图像像素特征包括两种像素视频特征时，可先通过一种图像像素特征从第一分割帧中选取第二分割帧，再根据另一种图像像素特征从第二分割帧中选取目标分割帧。当图像像素特征包括三种像素视频特征：图像像素特征1、图像像素特征2和图像像素特征3时，可根据图像像素特征1从第一分割帧中选取第二分割帧，根据图像像素特征2从第二分割帧中选取第三分割帧，根据图像特征3从第三图像分割帧中选取目标分割帧。各选取过程同从上述从第一分割帧中直接选取目标分割帧的过程，在此不再赘述。

目标分割帧可作为对目标视频进行分割的分割帧，从而将目标视频根据场景或行为分割为多个视频分段，每个视频分段对应不同的场景或行为。同上例，通过帧46、帧1234、帧2237、帧2989、帧3689将时长为3分钟的目标视频分割为5个视频分段，分割为为：视频分段1：帧1-帧45，视频分段2：帧46至帧1233，视频分段3：帧1234至帧2988，视频分段4：帧2989至帧3688，视频分段5：帧3689至帧4000。其中，视频分段1为大海场景，视频分段2为室内场景1、视频分段3为室内场景2、视频分段4为街道场景1，视频分段4为街道场景2。

在实际应用中，将目标视频的目标分割点展示在目标视频的播放界面上，且在目标分割点所分割的每个视频分段上展示该视频分段对应的场景信息或行为信息。可如图3所示，在目标视频的播放界面上，可显示基于目标分割帧所确定的目标分割点p1和p2，且显示根据目标分割点p1和p2分割的各视频分段对应的场景：场景1、场景2和场景3。

本申请实施例提供的视频处理方法，根据图像指纹特征对目标视频进行粗分割，在对粗分割的结果进行图像像素特征的提取，对粗分割结果进行细分割，从而在第二次分割过程中，将根据图像指纹特征误判的分割帧筛除掉，仅保留判断正确的粗分割结果，且细分割的范围为粗分割的结果，很大程度的减小了精确分割的视频帧范围，保证分割结果的准确度的同时，提高视频分割的速度，同时满足速度和准确度的需求。

本申请实施例还提供一种视频处理方法，该方法应用于电子设备，电子设备中的各功能模块可以由电子设备(如终端设备、服务器或服务器集群)的硬件资源，如处理器等计算资源、传感器等探测资源、通信资源协同实现。

在本申请实施例中，图像像素特征包括全局像素特征和局部像素特征。其中，全局图像特征为基于视频帧的全部像素的图像特征，比如：颜色直方图，局部图像特征为基于视频帧的局部像素的图像特征，比如：orb特征。

图4为本申请实施例视频处理方法的实现流程示意图二，如图4所示，该视频处理方法包括：

s401、获取目标视频中的视频帧集合；

s402、根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧集合的视频帧中确定第一分割帧；

s403、根据所述第一分割帧对应的视频帧的全局像素特征，从所述第一分割帧中确定第二分割帧；

在s402中确定第一分割帧后，确定第一分割帧对应的视频帧，第一分割帧对应的视频帧为第一分割点前后的两个帧。比如：第一分割帧为帧45，为第一分割点之前的视频帧，则第一分割帧对应的视频帧为帧45和帧46；又比如：第一分割帧为帧46，为第一分割点之后的视频帧，则第一分割帧对应的视频帧为帧45和帧46。

根据全局像素算法计算第一分割帧对应的视频帧的全局像素特征，将每一第一分割帧对应的两个视频帧的全局像素特征进行比较，得到每一第一分割帧对应的全局帧间距离，将全局帧间距离大于指定的全局帧间距离阈值的第一分割帧确定为第二分割帧。

比如：第一分割帧包括：帧46、帧567、帧1234、帧2237、帧2456、帧2989、帧3208、帧3689。根据每一个第一分割帧对应的视频帧的全局像素特征从第一分割帧中选取的第二分割帧包括：帧46、帧1234、帧2237、帧2456、帧2989、帧3689。

s404、根据所述第二分割帧对应的视频帧的局部像素特征，从所述第一分割帧中确定目标分割帧。

根据局部像素算法计算第二分割帧对应的视频帧的局部像素特征，将每一第二分割帧对应的两个视频帧的局部像素特征进行比较，得到每一第二分割帧对应的局部帧间距离，将局部帧间距离大于指定的局部帧间距离阈值的第二分割帧确定为目标分割帧。

比如：第二分割帧包括：帧46、帧1234、帧2237、帧2456、帧2989、帧3689。根据每一个第二分割帧对应的视频帧的局部像素特征从第二分割帧中选取的目标分割帧包括：帧46、帧1234、帧2237、帧2989、帧3689。

在本申请实施例中，当根据图像像素特征对粗粒度的分割结果第一分割帧再次进行筛选，从粗粒度的分割结果中筛选细粒度的分割结果时，可依次通过全局像素特征和局部像素特征对第一分割帧进行筛选，从第一分割帧中选取第二分割帧，再从第二分割帧中选取目标分割帧，进一步地加快分割速度。

图5为本申请实施例视频处理方法的实现流程示意图三，如图5所示，该视频处理方法包括：

s501、获取目标视频中的视频帧集合；

s502、根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧集合的视频帧中确定第一分割帧；

s503、根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧；

s504、根据所述目标分割帧的图像像素特征，和所述目标分割帧的相邻视频帧的图像像素特征，确定所述目标分割帧对应的第三帧间距离；

在确定目标分割帧之后，将目标分割帧对应的两个视频帧的图像像素特征进行比较，得到目标分割帧对应的第三帧间距离。

确定第二帧间距离所依据的图像像素特征和确定第三帧间距离所依据的图像像素特征可为相同的图像像素特征，也可为不同的图像像素特征。比如：确定第二帧间距离所依据的图像像素特征和确定第三帧间距离所依据的图像像素特征同为颜色直方图；又比如：确定第二帧间距离所依据的图像像素特征为颜色直方图，确定第三帧间距离所依据的图像像素特征为orb特征。

s505、根据所述目标分割帧对应的第三帧距离确定置信度；

对目标分割帧对应的第三帧间距离进行计算，得到置信度。其中，可基于算术平均值、方差、加权平均等置信度算法来计算，也可将所有的第三帧间距离输入置信度计算模型，通过置信度计算模型来得到置信度，执行度模型所采用的置信度算法不进行任何的限制。

s506、根据所述目标分割帧的第三帧距离和所述置信度确定无效分割帧，从所述目标分割帧中筛除所述无效分割帧。

确定置信度后，将各目标分割点对应的第三帧间距离和置信度进行比较，将大于置信度的第三帧间距离对应的目标分割帧保留，将小于置信度的第三帧间距离对应的目标分割帧作为无效分割帧，从当前的目标分割帧中删除无效分割帧。

比如：确定的目标分割帧包括：帧46、帧1234、帧2237、帧2989、帧3689，基于各目标分割帧的图像像素特征确定各目标分割帧对应的第三帧间距离为：0.56、0.89、0.68、0.75、0.84，当置信度算法为取平均时，则确定的置信度为：0.744，则将0.56对应的目标分割帧帧46和0.68对应的目标分割帧帧2237确定为无效分割帧，将帧46和帧2237从目标分割帧中删除，则最终的目标分割帧为：帧1234、帧2989、帧3689。

本申请实施例中，在确定目标分割点后，基于各目标分割点对应的视频帧的图像像素特征计算置信度，基于置信度对目标分割点进行过滤，将无效分割点滤除，从而对目标分割点进行调整，将图像差异较小的两个视频帧对应的目标分割帧删除，提高视频分割的准确性。

图6为本申请实施例视频处理方法的实现流程示意图四，如图6所示，该视频处理方法包括：

s601、获取目标视频中的视频帧集合；所述视频帧集合包括所述目标视频帧的全部或部分视频帧；

s602、根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧集合的视频帧中确定第一分割帧；

s603、根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧；

s604、获取所述目标分割帧对应的视频分段的时长；

在s603中，确定目标分割帧后，基于目标分割帧对目标视频进行分段，得到每个目标分割帧对应的视频分段，并确定每个视频分段的时长。

s605、如果所述视频分段的时长不满足指定的时长，对所述视频分段对应的目标分割帧进行调整。

指定的时长可为以时长范围，指定的时长为根据实际需求设置的视频时长。

当一视频分段的时长满足时长范围时，保持该视频分段对应的目标分割点不变；当一视频分段的时长大于时长范围时，则对该视频分段继续进行分段，划分为满足时长范围的视频分段，则在当前目标分割点的基础上增加目标分割点；当一视频分段的时长小于时长范围时，则将该视频分段与相邻的视频分段进行合并，将该视频分段对应的目标分割点从当前的目标分割点中删除。

比如：指定的时长为：5秒至20秒；当一视频分段的时长超过20秒了，继续对该视频分段进行分段；如果一视频分段的视频长度小于5秒，那么当出现视频内容场景转换较快的部分，对该部分进行抛弃处理，与相邻的视频分段进行合并。

下面，通过具体的视频分割场景对本申请实施例提供的视频处理方法进行进一步说明，如图7。

s701、加载待处理视频，提取视频帧；

对于一个时长为3分钟的视频，1秒包括25帧，则3分钟包括4000帧。对4000个视频帧进行了三次筛选。

在实际应用中，对待处理视频进行视频帧提取之前，可先判断待处理视频是否满足分段要求，当待处理视频满足分段要求时，提取视频帧。其中，分段要求可为时长要求，也可确定待处理是否设置有分段标识，当设置有分段标识时，确定满足分段要求。

s702、计算各视频帧的哈希值，并进行第一次筛选，得到分割帧1；

获取4000帧中每个视频帧的哈希值，基于哈希值计算两个相邻的视频帧的哈希距离即第一帧间距离，比如：帧1和帧2的第一帧间距离、帧2和帧3的第一帧间距离，一直到帧3999到帧4000的第一帧间距离。当两个相邻的视频的第一帧间距离大于设定的哈希阈值(即第一帧间距离阈值)时，则确定这两个相邻帧的后一个帧为第一分割帧分割帧1，比如：当帧45和帧46的距离为0.8，大于阈值0.7时，则确定帧46为分割帧1。这里，得到多个分割帧1构成分割帧集合1，包括：帧46、帧567、帧1234、帧2237、帧2456、帧2989、帧3208、帧3689。

s703、计算各分割帧1对应的视频帧的颜色直方图，并进行第二次筛选，得到分割帧2；

计算分割帧集合1(帧46、帧567、帧1234、帧2237、帧2456、帧2989、帧3208、帧3689)中各视频帧与前一视频帧的颜色直方图，根据各分割帧1和前一视频帧的颜色直方图计算两个相邻视频帧的颜色直方图的距离即第二帧间距离，比如：帧45和帧46的第二帧间距离、帧566和帧567的第二帧间距离，直到所有的分割帧1和前一视频帧帧的第二帧间距离，当两个相邻的帧的第二帧间距离大于设定的直方图阈值(第二帧间距离阈值)时，则确定这两个相邻帧的后一个帧为分割帧2。比如：当帧45和帧46的第二帧间距离为0.7，大于阈值0.6时，则确定帧46为分割帧2，当帧566和帧567的第二帧间距离为0.5，小于阈值0.6时，则确定帧567虽为分割帧1但不为分割帧2，这里，得到多个分割帧2，构成分割帧集合2，包括：帧46、帧1234、帧2237、帧2456、帧2989、帧3689。

s704、计算各分割帧2对应的视频帧的orb特征，并进行第三次筛选，得到分割帧3；

计算分割帧集合2(帧46、帧1234、帧2237、帧2456、帧2989、帧3689)中各视频帧与前一视频帧的orb特征，根据各分割帧2和前一视频帧的orb特征计算两个相邻视频帧的orb特征的距离即第三帧间距离，比如：帧45和帧46的第三帧间距离、帧1233和帧1234的第三帧间距离，直到所有的分割帧2和前一视频帧帧的第三帧间距离，当两个相邻的帧的第三帧间距离大于设定的orb阈值(第三帧间距离阈值)时，则确定这两个相邻帧的后一个帧为分割帧3即目标分割点。比如：当帧45和帧46的第三帧间距离为0.7，大于阈值0.65时，则确定帧46为分割帧3，当帧2455和帧2456的第二帧间距离为0.55，小于阈值0.65时，则确定帧2456虽为分割帧2但不为分割帧3，这里，得到多个分割帧3构成的分割帧集合3，包括：帧46、帧1234、帧2237、帧2989、帧3689。

s705、根据分割帧3对应的视频帧的orb特征计算置信度，基于置信度对分割帧3进行筛选；

对于分割帧集合3(帧46、帧1234、帧2237、帧2989、帧3689)，基于orb特征(或颜色直方图特征)计算各分割帧3对应的矩阵，并对计算的帧45和帧46的距离、帧1233和帧1234、至帧3688和3689的距离求均值(算数平均、加权平均)，得到置信度。将距离小于置信度的分割帧3从分割帧集合3中取删除，仅保留距离大于置信度的分割帧3(帧1234、帧2989、帧3689)。

s706、根据时长要求对分割帧集合3进行调整。

根据分割帧集合2中的帧1234、帧2989、帧3689对待处理视频进行分段，得到数据分段1：帧1至帧1233、数据分段2：帧1234至帧2988、数据分段3：帧2989至帧3688、以及数据分段4：帧3689至帧4000，则数据分段1时长为：49.32秒，数据分段2时长为70.2秒，数据分段3时长为：28.04秒，数据分段3时长为：12.48秒。当时长要求为10秒至60秒时，将数据分段2继续进行分段，此时，可将分割帧3帧2237重新添加到分割帧集合3中。

在本申请实施例提供的视频处理方法中，基于以下特征快速的得到分割准确的、满足市场要求的视频片段：

1、分层计算视频帧间距离，以提高分割点计算速度；

2、对于所有分割点计算置信度，并确定分割点阈值；

3、根据视频分段时长要求，调整分割点位置。

为实现本申请实施例的方法，本申请实施例提供一种视频处理装置，应用于电子设备，该装置包括所包括的各单元、以及各单元所包括的各模块，可以通过电子设备中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为中央处理器(cpu，centralprocessingunit)、微处理器(mpu，microprocessorunit)、数字信号处理器(dsp，digitalsignalprocessor)或现场可编程门阵列(fpga，field-programmablegatearray)等。

如图8所示，该装置800包括：获取单元801、第一分割单元802和第二分割单元803；其中，

获取单元801，用于获取目标视频中的视频帧集合；

第一分割单元802，用于根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧中确定第一分割帧；

第二分割单元803，用于根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧。

在一实施例中，第一分割单元803，用于：

根据所述视频集合中视频帧的图像指纹特征确定两个相邻的视频帧的第一帧间距离；

如果所述第一帧间距离大于指定的第一帧间距离阈值时，确定所述第一帧间距离对应的视频帧为第一分割帧。

在一实施例中，第二分割单元803，用于：

根据所述第一分割帧的图像像素特征，和所述第一分割帧的相邻视频帧的图像像素特征，确定所述第一分割帧对应的第二帧间距离；

如果所述第二帧间距离大于指定的第二帧间距离阈值时，确定所述第二帧间距离对应的第一分割帧为目标分割帧。

在一实施例中，第二分割单元803，包括：

第一分割模块，用于根据所述第一分割帧对应的视频帧的全局像素特征，从所述第一分割帧中确定第二分割帧；

第二分割模块，用于根据所述第二分割帧对应的视频帧的局部像素特征，从所述第一分割帧中确定目标分割帧。

在一实施例中，装置800还包括：无效单元，用于：

根据所述目标分割帧的图像像素特征，和所述目标分割帧的相邻视频帧的图像像素特征，确定所述目标分割帧对应的第三帧间距离；

根据所述目标分割帧对应的第三帧距离确定置信度；

根据所述目标分割帧对应的第三帧距离和所述置信度确定无效分割帧，从所述目标分割帧中筛除所述无效分割帧。

在一实施例中，装置800还包括：调整单元，用于：

获取所述目标分割帧对应的视频分段的时长；

如果所述视频分段的时长不满足指定的时长，对所述视频分段对应的目标分割帧进行调整。

在一实施例中，获取单元801，用于：

获取所述目标视频的关键帧，并由所述关键帧组成所述视频帧集合。

需要说明的是，装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

本申请实施例提供一种电子设备，图9为本申请实施例电子设备的组成结构示意图，如图9所示，所述设备900包括：一个处理器901、至少一个通信总线902、至少一个外部通信接口903和存储器904。其中，通信总线902配置为实现这些组件之间的连接通信。其中，外部通信接口903可以包括标准的有线接口和无线接口。

其中，所述处理器901，配置为执行存储器中存储的视频处理程序，以实现以下步骤：

获取目标视频中的视频帧集合；所述视频帧集合包括所述目标视频帧的全部或部分视频帧；

根据所述视频帧集合中视频帧的图像指纹特征，从所述视频帧集合的视频帧中确定第一分割帧；

根据所述第一分割帧对应的视频帧的图像像素特征，从所述第一分割帧中确定目标分割帧。

相应地，本申请实施例再提供一种存储介质，即计算机可读存储介质，所述计算机可读存储介质上存储有视频处理程序，所述视频处理程序被处理器执行时实现上述的视频处理方法的步骤。

以上视频处理装置、电子设备和计算机可读存储介质实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请视频处理装置、电子设备和计算机可读存储介质实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

本申请实施例中，如果以软件功能模块的形式实现上述的视频处理方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，readonlymemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件和软件结合。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(readonlymemory，rom)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王建勋
技术所有人：联想（北京）有限公司
我是此专利的发明人

上一篇：一种抗肿瘤的多肽及其应用的制作方法
上一篇：一种视力测试方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。