视频数据处理方法、装置、服务器及计算机可读存储介质与流程

文档序号：15456056发布日期：2018-09-15 01:07阅读：139来源：国知局

本发明涉及数据处理技术领域，尤其是涉及视频数据处理方法、装置、服务器及计算机可读存储介质。

背景技术：

数据处理技术的发展对智能化的推进起到非常重要的作用。图像识别技术作为数据处理技术的重要分支，具有非常广泛的应用，并给实际生活带了很多便利。以将图像识别应用于视频领域为例，其方便用户快速获取感兴趣的图像数据。例如，通过根据用户上传的感兴趣的图像中提取的目标特征数据，依次与从视频中获取到的识别特征数据进行比对，在比对成功时从该视频中获取对应的图像数据作为用户感兴趣的图像数据推送给用户。

但，由于图像识别对待识别特征在视频中的出现角度有非常严格的要求(例如，在人脸识别过程中，只有画面中出现人的正脸才能被识别出，而出现人的侧脸等其他角度的画面则无法被识别)。致使利用图像识别技术为用户查找到的感兴趣的图像数据中，在同一时间只能从特定角度展示与感兴趣的图像相关的画面。故此，限制了图像识别技术在视频领域应用的进一步发展，从而不能满足用户日益增加的需求。

技术实现要素：

本发明实施例提供一种视频数据处理方法、装置、服务器及计算机可读存储介质，以改善上述技术问题。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供了一种视频数据处理方法，所述方法包括：获取目标特征数据；从采集到的识别特征数据中查找与所述目标特征数据匹配的匹配特征数据；其中所述识别特征数据为从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得，且每一识别特征数据对应一第一时间；基于与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

第二方面，本发明实施例还提供一种视频数据处理装置，所述装置包括：第一获取模块，用于获取目标特征数据；查找模块，用于从采集到的识别特征数据中查找与所述目标特征数据匹配的匹配特征数据；其中所述识别特征数据为从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得，且每一识别特征数据对应一第一时间；第二获取模块，用于确定与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

第三方面，本发明实施例还提供一种视频数据处理方法，所述方法包括：获取分别从多个不同角度采集的视频数据；对至少一个角度采集的视频数据进行识别，获取对应角度下的识别特征数据及每个所述识别特征对应的第一时间；如果获取到目标特征数据，从采集到的识别特征数据中查找与所述目标特征数据匹配的匹配特征数据；基于与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

第四方面，本发明实施例还提供一种视频数据处理装置，所述装置包括：获得模块，用于获取分别从多个不同角度采集的视频数据；第三获取模块，用于对至少一个角度采集的视频数据进行识别，获取对应角度下的识别特征数据及每个所述识别特征对应的第一时间；查找模块，用于如果获取到目标特征数据，从采集到的识别特征数据中查找与所述目标特征数据匹配的匹配特征数据；第二获取模块，用于基于与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

第五方面，本发明实施例还提供一种服务器，包括：存储器和处理器；其中，所述存储器用于存储一条或多条计算机指令，所述一条或多条计算机指令被所述处理器执行，以上述视频数据处理方法的步骤。

第六方面，本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述视频数据处理方法的步骤。

上述视频数据处理方法，通过从采集到的识别特征数据中查找与目标特征数据匹配的匹配特征数据。每一识别特征数据对应一第一时间，通过匹配特征数据可以获取到一对应的第一时间。由于，识别特征数据为从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得，且每个角度采集的视频数据与时间轴具有关联，因此，基于该第一时间，可以从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。也就是，基于匹配特征数据对应的第一时间可查找到从不同角度呈现匹配特征数据的图像数据，减少图像识别技术与视频技术融合存在的技术限制，以便更好的满足用户的需求。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明可能的应用环境示意图。

图2示出了本发明实施例提供的视频数据处理方法的步骤流程图之一。

图3为图2中步骤S103的子步骤流程图。

图4示出了本发明实施例提供的视频数据处理方法的步骤流程图之二。

图5示出了本发明第一实施例提供的视频数据处理方法的步骤流程图的一部分。

图6示出了本发明第一实施例提供的视频数据处理方法的步骤流程图的另一部分。

图7示出了本发明第二实施例提供的视频数据处理方法的步骤流程图。

图8示出了本发明第三实施例提供的视频数据处理方法的步骤流程图的一部分。

图9示出了本发明第三实施例提供的视频数据处理方法的步骤流程图的另一部分。

图10示出了本发明实施例提供的视频数据处理装置的示意图之一。

图11示出了本发明实施例提供的视频数据处理装置的示意图之二。

图12为本发明实施例提供的服务器的结构示意图。

图标：100-服务器；200-采集设备；201-第一获取模块；202-查找模块；203-第二获取模块；301-获得模块；302-第三获取模块；303-查找模块；304-第二获取模块；80-处理器；81-存储器；82-总线；83-通信接口。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例通过从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得的识别特征数据中获取与目标特征数据匹配的匹配特征数据对应的第一时间，再通过第一时间分别从多个角度采集的视频中获取对应该第一时间的图像数据。获取的图像数据可以在同一时间多角度的展示匹配特征数据，进而克服了由于图像识别对待识别特征在视频中的出现角度的严格要求，造成的为用户查找到的感兴趣的图像数据中，在同一时间只能从特定角度展示与感兴趣的图像相关的画面。因此，本发明较佳实施例相对于的提供了一种视频数据处理方法、装置、服务器及计算机可读存储介质。

图1示出了一种视频数据处理方法及装置可能的应用环境。可选地，如图1所示，服务器100与多个采集设备200通信连接。

上述采集设备200为视频采集设备。视频采集设备位于同一场景下的多个不同位置，且用于从多个不同角度进行视频数据采集。例如，位于同一个赛场的多台视频采集设备，分别被设置在运动场的多个位置，进而从多个角度对同一赛事进行视频数据的采集。可选地，上述视频采集设备可以是手持拍摄设备(例如，摄像机、手机)，也可以台式机位，还可以为运动相机等可手持可台式的设备。

请参考图2，图2示出了本发明实施例提供的一种视频数据处理方法流程图。该方法可以包括以下步骤：

步骤S101：获取目标特征数据；

步骤S102：从采集到的识别特征数据中查找与目标特征数据匹配的匹配特征数据；

步骤S103：基于与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

上述目标特征数据可以从预先存储的一个或多个特征数据中直接读取的，也可以为从根据接收到的待识别图像中提取的。上述待识别图像可以是用户输入或选中的图像数据。

上述识别特征数据可以是从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得。可选地，识别特征数据为利于预先选定的特征提取模型从多个不同角度采集的视频数据中的至少一个角度的视频数据的图像数据帧中提取获得的特征数据。例如，识别特征数据可以是利用预先选定的人脸特征提取模型从多个不同角度采集的视频数据中的至少一个角度的视频数据的图像数据帧中提取获得的人脸特征值。上述多个不同角度采集的视频数据可以是直播视频流，也可以录播视频。

上述匹配特征数据可以是与目标特征数据之间满足预设条件的识别特征数据。例如，预设条件为相似值超过预设值。

上述每一识别特征数据对应一第一时间。上述第一时间可以是与识别特征数据对应的时刻值。作为一种实施方式，第一时间可以是提取到该识别特征数据的图像数据帧被采集设备采集到的时刻值。例如，上午8:00:01一采集设备采集到一帧图像数据帧，且该图像数据帧中的特征数据被提取为识别特征数据，则该识别特征数据对应的第一时间为上午8:00:01。该方式更适宜于视频数据为直播视频流。进一步地，上述图像数据可以是图片数据，也可以是视频片段。例如，图像数据为每个角度下采集的视频数据中，在该第一时间所采集的图片。图像数据为每个角度下采集的视频数据中，包括该第一时间的时间段内被采集到的数据。

作为另一种实施方式，第一时间还可以是在同时播放多角度采集的视频数据过程中播放到包括该识别特征数据的图像数据帧的时刻值。例如，从上午8:00：00开始启动播放多角度采集的视频A及视频B，其中视频A播放到一帧包含识别特征数据a的图像数据帧a的时刻值为上午8:00:01，视频B播放到一帧包含识别特征数据b的图像数据帧b的时刻值为上午8:01:00，则该识别特征数据a对应的第一时间为上午8:01:00。该方式更适宜于录播视频。进一步地，上述图像数据可以是图片数据，也可以是视频片段。可选地，图像数据可以是通过以下方式获取：依据与匹配特征数据对应的第一时间及与该第一时间对应的启动播放时间获得的相对查找时间，再利用该相对查找时间从多个不同角度采集的视频数据中获取的图片数据或视频片段。接上例，匹配数据特征对应的第一时间为识别特征数据b，则根据对应的第一时间8:01:00及该第一时间对应的启动播放时间为8:00:00获得的对应的相对查找时间为01:00。再根据该相对查找时间，从视频A中获取包括对应的播放时刻为01:00的图像数据帧的图像数据及从视频B获取中获取包括对应的播放时刻为01:00的图像数据帧的图像数据。

下面对本方案实现的具体过程和细节进行介绍。

上述步骤S101的目的是获取与用户期望得到的视频或图片具有关联的目标特征数据。作为一种实施方式，目标特征数据可以是从用户上传或选中的待识别图像中通过特征提取获得。上述待识别图像是包括目标特征数据的图片，例如目标特征数据为面部特征数据，则待识别图像例如为人物头像图片，对应的目标特征数据则为从该人物头像图片中提取的面部的特征数据，或者例如目标特征数据为宠物特征数据，则待识别图像例如为该宠物的图片，对应的目标特征数据则为从该宠物的图片中提取的该宠物的特征数据。需要说明的是，可识别特征可以辨别该待识别图像展示内容所属分类。例如，当待识别图像是肢体特写图片，对应的目标特征数据则为从该肢体特征图片中提取的肢体特征；当待识别图像是动物特写图片，对应的从该动物特写图片的动物特征。作为另一种实施方式，目标特征数据可以从预先存储的一个或多个特征数据中直接读取的，也可以为从根据接收到的待识别图像中提取的。

上述步骤S102的目的是从至少一个角度采集到的视频数据中查找与用户输入的待识别图像或直接读取的目标特征数据之间具有关联的视频或图片。需要说明的是，上述具有关联的视频片段中包括至少一帧可以识别出与目标特征数据之间满足预设条件的识别特征数据的图像数据帧。可选地，步骤S102可以是通过将待识别图像对应的目标特征数据与从至少一个角度采集到的视频数据中获取的每一个识别特征数据进行比较，将与目标特征数据之间满足预设条件的识别特征数据确定为匹配特征数据。

在本发明实施例中，上述识别特征数据可以是从至少一个角度采集到的视频数据中获得的。上述至少一个角度采集到的视频数据可以是在采集设备200采集到的多个不同角度下的视频数据中选中的至少一个角度下的视频数据，也可以是多个采集设备200采集的多个不同角度的视频数据中随机确定的至少一个角度下采集的视频数据。可选地，上述选中的方式可以是为每一个预先划分的时间段选中的至少一个角度采集的视频数据。例如，三个从不同角度采集的视频A、视频B、视频C。这三个视频的起始时间均不超过8:00:00，预先划分了第一时段及第二时段，第一时段为8:00:00开始到8:10:00，第二时段为8:10:00开始到8:40:00，可以预先选定视频A和视频B在第一时段内对应的视频数据为用于采集识别特征数据的视频数据，可以选定视频C和视频B在第二时段内对应的视频数据为用于采集识别特征数据的视频数据。进一步地，在本实施例中，用于采集识别特征数据的至少一个角度采集的视频数据在实际运行过程中所对应的具体角度的视频数据还可以由管理人员或者用户在任意时刻切换。

进一步地，上述识别特征数据可以通过如下方式获得：按照预设时间间隔从至少一个角度采集的视频数据中抓取图像数据帧，再对抓取的每一所述图像数据帧进行预定特征检测。若抓取的所述图像数据帧中检测到预定特征，从该图像数据帧中获取该预定特征作为所述识别特征数据。上述预定特征可以是面部特征、肢体特征或动物特征等。例如，预定特征为面部特征，则按照预设时间间隔从选定的至少一个角度的视频数据中抓取图像数据帧，对抓取的每一所述图像数据帧进行面部特征检测，若检测到抓取到图像数据帧中出现面部特征，便利用预设的面部特征提取模型提取该面部特征以作为识别特征数据。需要说明的是，上述抓取图像数据帧的方式可以是从视频数据中的一图像数据帧开始，按照预设时间间隔在视频数据中进行图像数据帧抓取。例如，选中视频A作为用于抓取识别特征数据的视频数据，预设时间间隔为5s，则从视频A的第一帧图像数据帧开始，每隔5s从视频A中抓取一次图像数据帧，以使被抓取的相邻的两个图像数据帧对应的被采集设备200采集到的时间之间的间隔为5s。当然，若预先设定视频A在一时段内的部分作为用于采集识别特征数据的视频数据，则从视频A中与该时段起始时刻对应的图像数据帧开始，到视频A中与该时段结束时刻对应的图像数据帧之间，以5s为间隔进行图像数据帧的抓取。

上述步骤S103的目的是利用匹配特征参数对应的第一时间获取从不同角度呈现匹配特征数据的图像数据。从上述至少一个角度采集的视频数据中识别出的每一识别特征数据均对应一第一时间，例如第一时间可以是该识别特征数据所属图像数据帧被采集设备200采集到的采集时间。上述采集时间为属于指定时间轴的时刻值(例如，指定时间轴为北京时间)。

在本发明实施例，步骤S103可以是依据匹配特征数据对应的第一时间，从每个角度对应的视频数据中获取对应该第一时间的所述图像数据；步骤S103还可以是依据匹配特征数据对应的第一时间，从按照预设规则确定的较佳角度采集的视频数据中获取对应该第一时间的所述图像数据。需要说明的是，服务器100可以将该识别特征数据、对应的第一时间及提取到该识别特征数据的视频数据对应的采集角度信息进行对应存储。因此，上述确定较佳角度的预设规则为位置邻近提取到该将与该匹配特征数据的采集角度信息对应的采集角度之间的夹角小于预设角度阈值的采集角度作为较佳角度。例如，匹配特征数据对应的采集角度信息对应的采集角度为正南方向0°，预设角度阈值为45°，则属于东偏南45°到西偏南45°之间的采集角度均为较佳角度。进一步地，在采集设备200的安装位置为固定时，为了提高运算效率，可以将每一个采集设备200的采集角度可以预先存储于服务器100中。在采集设备200的安装位置为不固定时，可以根据每个采集设备200的实时位置及采集场景的中心位置确定每个采集设备200的采集角度。

由于每个采集设备200开始采集视频数据的起始时间各不相同，但各视频数据的起始时间均是属于指定时间轴的时刻值，且在开始采集视频数据之后采集设备200均会给采集到的每一帧图像数据帧均加一时间戳。因此，作为一种可能的实施方式，在第一时间为该识别数据特征所属图像数据帧被采集设备200采集到的采集时间时，可以是根据对应采集设备200采集视频数据的起始时间及对应的时间戳即可获得该图像数据帧的采集时间。反之，当获得一个第一时间时，通过根据采集该视频数据的起始时间，即可获得第一时间相对于该视频数据的查找时间戳。例如，采集设备A启动采集视频数据的起始时间为8:00:00，其采集的第一帧图像数据帧对应的时间戳为0s，则第一帧图像数据帧对应的采集时间为8:00:00，其采集的时间戳为200ms的图像数据帧对应的采集时间为8:00:00.200，若从时间戳为200ms的图像数据帧中提取到的识别特征数据，则该识别特征数据对应的第一时间为8:00:00.200。反之，获得的第一时间为8:00:200，则该第一时间在采集设备A所采集到的视频数据中对应的查找时间戳为200ms。作为另一种可能的实施方式，在第一时间为同时播放多角度采集的视频数据过程中播放到包括该识别特征数据的图像数据帧的时刻值时，将根据该第一时间及其对应的启动播放时间获取的相对查找时间作为查找时间戳。

可选地，如图3所述，上述步骤S103可以通过以下方式实现：

子步骤S1031，分别根据第一时间及多个角度对应的视频数据的起始时间，获取每个角度对应的视频数据的查找时间戳。

在本发明实施例中，匹配特征数据从识别特征数据中匹配获得，因此，匹配特征数据对应一第一时间。

作为一种实施方式，上述子步骤S1031可以是根据匹配特征数据对应的第一时间及每个角度对应的视频数据的起始时间，获取该第一时间在每一角度采集的视频数据所相对的时间戳作为其对应的查找时间戳。可选地，获取查找时间戳的方式可以包括：将第一时间依次与每个角度对应的视频数据的起始时间进行比较，若第一时间超过对应的起始时间，则第一时间减去对应的起始时间获得对应的查找时间戳；若第一时间未超过对应的起始时间，则生成无效时间戳。需要说明的是，若第一时间未超过对应的起始时间表示在第一时间该视频数据对应的采集设备200还未开始视频数据采集，也就是该视频数据中没有对应该第一时间的图像数据。

作为另一种实施方式，上述子步骤S1031还可以是根据匹配特征数据对应的第一时间及较佳角度对应的视频数据的起始时间，获取该第一时间在较佳角度下采集的视频数据所相对的时间戳作为其对应的查找时间戳。

子步骤S1032，根据对应的视频数据的所述查找时间戳，从每个角度对应的视频数据中获取包括该查找时间戳的所述图像数据。

在本发明实施例中，跟别根据查找时间戳从对应的视频数据中获取图像数据，该图像数据包括对应视频数据中时间戳为该查找时间戳的图像数据帧。需要说明的是，若未获得某一角度下采集的视频数据对应的查找时间戳或该角度下采集的视频数据对应的查找时间戳时间为无效时间戳，则不从该角度下采集的视频数据中获取图像数据。作为一种实时方式，可以以查找时间戳为基点选取一时间戳区间，获取视频数据中所有时间戳属于该时间戳区间的图像数据帧，以作为对应的图像数据。例如，对应视频A的查找时间戳为200ms，选定查找时间戳之前100ms和查找时间戳之后100ms作为时间戳区间，也就是100ms-300ms，再将视频A中时间戳属于100ms-300ms的图像数据帧作为对应的视频片段。或者例如，按照50ms为步进，将视频A中时间戳为150ms、200ms、250ms及300ms的图像数据帧抓出作为图片数据。

进一步地，在步骤S102中的识别特征数据可以是获得的视频数据中已携带的，也可以是在获得多个不同角度的视频数据时，从至少一个角度下的视频数据中采集并提取的。在视频数据中携带识别特征数据的优点在于效率高，适用于录像视频。而从至少一个角度下的视频数据中采集的识别特征数据则更具灵活性，因为可以识别出比携带数据更多的特征数据，适于实时性视频(例如，直播)，还可以确保提取的识别特征数据的完整性。具体地，可参见图4，若采用在获得多个不同角度的视频数据时，实时从至少一个角度下的视频数据中采集识别特征数据，则该方法还包括以下步骤：

步骤S201，获取分别从多个不同角度采集的视频数据。

在本发明实施例中，获取在同一个场景下采集不同角度的视频数据。上述不同角度采集的视频数据对应的起始时间可以各不相同，也可以均相同。

步骤S202，对至少一个角度采集的视频数据进行识别，获取对应角度下的识别特征数据及每个所述识别特征对应的第一时间。

在本发明实施例中，按照预设时间间隔分别从至少一个角度采集的视频数据中抓取图像数据帧。根据抓取的所述图像数据帧，提取识别特征数据。并生成每一识别特征数据对应的第一时间。需要说明的是，每一个识别特征数据所属的图像数据帧均对应一采集角度，该采集角度由采集到该图像数据帧的采集设备200确定，因此，每一个识别特征数据还对应一采集角度信息。

优选地，按照预设时间间隔从至少一个角度采集的视频数据中抓取图像数据帧可以是分别按照预设时间间隔从至少二个角度采集的视频数据中抓取图像数据帧。从至少二个角度采集的视频数据中抓取图像数据帧可以提高识别特征数据被识别出的效率。需要说明的是，由于在视频数据中，识别特征出现的角度不定，而图像识别技术对可被识别的特征的角度具有严格的要求。在同一时刻下一识别特征数据会以不同角度出现在不同角度采集的视频数据中。也就是存在同一时刻下一识别特征数据在一个角度的视频数据中无法被识别，但在另一个角度的视频数据中可以被识别。因此，选择进行图像视频帧抓取的角度越多，提取识别特征数据的效率越高。

若选择的是面部识别时，上述根据抓取的所述图像数据帧获取对应角度下的识别特征数据可以是对抓取的每一所述图像数据帧进行面部特征检测。当图像数据帧中检测到所述面部特征，从所述图像数据帧中提取该面部特征作为所述识别特征数据。

上述生成每一识别特征数据对应的第一时间的方式可以是:对从每个角度采集的视频数据中抓取的每一所述图像数据帧进行预定特征检测；若抓取的所述图像数据帧中检测到所述预定特征，从该图像数据帧中获取该预定特征作为所述识别特征数据，并将该图像数据帧对应的采集时间作为该识别特征数据的第一时间。上述预定特征可以是面部特征、动物特征、肢体特征等。

上述生成每一识别特征数据对应的第一时间的方式还可以是:在同时播放多角度采集的视频数据过程中，将播放到包括该识别特征数据的图像数据帧的时刻值作为对应的第一时间。

为了方便查询比对，可以将获取的每一个识别特征数据、其对应的第一时间及其对应的图像数据帧所属角度的视频数据信息进行对应存储。

下面以应用于图1中的服务器100中基于人脸图像处理的两个实例对本发明实施例提供的视频数据处理方法进行说明。

结合图5及图6所示，在第一实施例中，所述方法包括：

步骤S301，获取多个不同角度采集到的视频数据，并存储对应的每个采集设备200采集视频数据的起始时间。

在本实施例中，每获得一个角度下采集的视频数据均对应的将其对应的起始时间进行存储。

步骤S302，判断接收到的视频数据是否需要进行人脸识别图像处理。

在本实施例中，至少可以通过以下两种方式进行判断：(1)依据接收到的视频数据类型自动判断是否进行人脸图像处理，例如，若接收到的视频数据对应的类型为比赛视频时，可以判断其需要进行人脸识别图像处理；若接收到的视频数据对应的类型为动物记录片，则可以判断其不需要进行人脸识别图像处理。(2)可以根据接收到用户输入的指令进行判断是否对接收到的视频数据进行人脸图像处理。

步骤S303，当需要进行人脸识别图像处理时，按照预设时间间隔从获得的多个角度下采集的视频数据中的至少一个中抓取图像数据帧。

在本实施例中，可以是在多个角度下采集的视频数据中选中至少一个作为用于抓取图像数据帧的视频数据，当然选中的作为抓取图像数据帧的视频，可以由用户输入的选择信息确定，也可以随机确定，还可以随时切换。优选地，可以是从多个角度下采集的视频数据中选中至少二个作为用于抓取图像数据帧的视频数据，并分别依据预设时间间隔从选中的视频数据中进行图像数据帧抓取。

步骤S304，分别对抓取到的图像数据帧进行人脸特征检测，以判断在抓取到的图像数据帧中是否出现人脸。

在本实施例中，可以是在每抓取到一图像数据帧，就基于该图像数据帧执行上述步骤S304。还可以是将所有图像视频帧抓取完毕后，依次基于每一个被抓取的图像数据帧执行步骤S304。

步骤S305，从检测到出现人脸特征的图像数据帧进行特征数据提取。将提取到的每一个特征数据作为识别特征数据。

步骤S306，获取识别特征数据对应的图像数据帧的采集时间，作为该识别特征数据的第一时间。

上述图像数据帧的采集时间可以根据图像数据帧所述的视频数据的起始时间及该图像数据帧在该视频数据中被标记的时间戳计算获得对应的采集时间。例如，起始时间为8:00:00的视频数据中抓取到的时间戳为1s的图像数据帧，则其采集时间为8:00:01。

步骤S307，将获取的识别特征数据、其对应的第一时间及对应的图像数据帧所属的视频数据的采集角度信息进行对应存储。为了高效的存储，可以预先对每个采集角度进行编号，例如将采集角度为正南方向0°的视频数据标记为1号视频，且选中1号视频数据作为抓取图像数据帧的视频数据。若从1号视频数据中抓取的第二张图像数据帧中提取到了两个识别特征数据可以分别记作facetoken#1#2#1和facetoken#1#2#2，该第二张图像数据帧对应绝对时间为8:00:00.200，则将提取到的这两个识别特征数据及对应的第一时间，以facetoken#1#2#1，8:00:00.200和facetoken#1#2#2，8:00:00.200进行存储，以方便查询。

步骤S401，在接收到用户输入的人物头像图片时，提取该人物头像图片中面部特征数据作为目标特征数据。

在本实施例中，可以是在成功提取到目标特征数据后流程进入步骤S402。

步骤S402，利用预先设定的人脸匹配算法，将目标特征数据依次与上述识别特征数据进行比较。

步骤S403，从识别特征数据中筛选出与目标特征数据满足预设条件的匹配特征数据。

步骤S404，根据匹配特征数据确定对应的第一时间。例如，筛选出的匹配特征数据为facetoken#1#2#1，则通过查询可以获取其对应的第一时间为8:00:00.200。

步骤S405，基于每个角度采集的视频数据的起始时间，分别计算每个角度采集的视频数据中与该第一时间对应的时间戳，以作为查找时间戳。例如，视频A的起始时间为8:00:00，视频B的起始时间为8:00:00.100，视频C的起始时间为8:00:01，第一时间为8:00:00.200，则视频A与第一时间对应的查询时间戳为200ms，视频B与第一时间对应的查询时间戳为100ms，视频C与第一时间对应的查询时间戳为无效时间戳。

步骤S406，根据获得的查询时间戳，按照预先设定的规则，分别从对应的视频数据中获取包括查询时间戳的图像数据帧的视频片段。接上例，将视频A中对应时间戳大于100ms且小于300ms的图像数据帧及对应的音频数据作为对应的视频片段；将视频B中对应时间戳大于0ms且小于200ms的图像数据帧及对应的音频数据作为对应的视频片段。

步骤S407，向用户展示获取到的所有视频片段。

在第二实施例中，如图7所示，所述方法包括：

步骤S501，在接收到用户输入的人物头像图片时，提取该人物头像图片中面部特征数据作为目标特征数据。

在本实施例中，可以是在成功提取到目标特征数据后流程进入步骤S502。

步骤S502，利用预先设定的人脸匹配算法，将目标特征数据依次与获得的视频数据中所携带的识别特征数据进行比较。

优选地，获得的多个角度的视频数据中存在至少两个角度的视频数据携带对应的识别特征数据，且每个识别特征数据均对应一第一时间。

步骤S503，从识别特征数据中筛选出与目标特征数据满足预设条件的匹配特征数据。

步骤S504，根据匹配特征数据确定对应的第一时间。

步骤S505，基于每个角度采集的视频数据的起始时间，分别计算每个角度采集的视频数据中与该第一时间对应的时间戳，以作为查找时间戳。例如，视频A的起始时间为8:00:00，视频B的起始时间为8:00:00.100，视频C的起始时间为8:00:01，第一时间为8:00:00.200，则视频A与第一时间对应的查询时间戳为200ms，视频B与第一时间对应的查询时间戳为100ms，视频C与第一时间对应的查询时间戳为无效时间戳。

步骤S506，根据获得的查询时间戳，按照预先设定的规则，分别从对应的视频数据中获取包括查询时间戳的图像数据帧的视频片段。接上例，将视频A中对应时间戳大于100ms且小于300ms的图像数据帧及对应的音频数据作为对应的视频片段；将视频B中对应时间戳大于0ms且小于200ms的图像数据帧及对应的音频数据作为对应的视频片段。

步骤S507，向用户展示获取到的所有视频片段。

上述第一实施例及第二实施例适用的服务器100可以是主流的视频提供服务器100。下面通过第三实施例对本发明实施例提供的视频数据处理方法在应用于一些特殊的服务器100(例如，直播平台服务器)时进行说明。为了方便描述，第三实施例也基于人脸图像处理进行描述。

如图8及图9所示，在第三实施例中，所述视频数据处理方法可以包括以下步骤：

步骤S601，直播平台服务器接收主播客户端上传的视频数据及主播客户端对应的当前位置信息。

步骤S602，将当前位置信息数据在同一场景，且各不相同的多个主播客户端上传的视频数据作为多个角度采集的视频数据。例如，主播客户端A、主播客户端B及主播客户端C在实时上传视频数据的实况流时对应的位置信息均属于同一球场，且具体的位置各不相同，则将主播客户端A、主播客户端B及主播客户端C在实时上传视频数据作为多个角度采集的视频数据。

步骤S603，判断接收到的视频数据是否需要进行人脸识别图像处理。

步骤S604，当需要进行人脸识别图像处理时，按照预设时间间隔从需要进行人脸识别图像处理的视频数据中抓取图像数据帧。

步骤S605，分别对抓取到的图像数据帧进行人脸特征检测，以判断在抓取到的图像数据帧中是否出现人脸。

步骤S606，从检测到出现人脸特征的图像数据帧进行特征数据提取。将提取到的每一个特征数据作为识别特征数据。

步骤S607，获取识别特征数据对应的图像数据帧的采集时间，作为该识别特征数据的第一时间。

步骤S608，将获取的识别特征数据、对应的角度及其对应的第一时间进行对应存储。

步骤S701，当接收到用户查询目标场景的视频数据的指令时，接收用户输入的人物头像图片。

步骤S702，提取该人物头像图片中面部特征数据作为目标特征数据。

在本实施例中，可以是在成功提取到目标特征数据后流程进入步骤S703。

步骤S703，利用预先设定的人脸匹配算法，将目标特征数据依次与目标场景对应的多个角度采集的视频数据中获得的识别特征数据进行比较。

步骤S704，从识别特征数据中筛选出与目标特征数据满足预设条件的匹配特征数据。

步骤S705，根据匹配特征数据确定对应的角度以及第一时间。

步骤S706，基于对应的每个角度采集的视频数据的起始时间，分别计算每个角度采集的视频数据中与该第一时间对应的时间戳，以作为查找时间戳。

步骤S707，根据获得的查询时间戳，按照预先设定的规则，分别从对应的视频数据中获取包括查询时间戳的图像数据帧的视频片段。

步骤S708，向用户展示获取到的所有视频片段，以供用户选择观看。

图10示出了与上述方法相对应的一种视频数据处理装置，下述装置中的细节方案可以参照上述方法来实现，视频数据处理装置包括：

第一获取模块201，用于获取目标特征数据。

查找模块202，用于从采集到的识别特征数据中查找与所述目标特征数据匹配的匹配特征数据。其中所述识别特征数据为从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得，且每一识别特征数据对应一第一时间。

第二获取模块203，用于确定与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

如图11所示，在其他可能的实施方式中，上述视频数据处理装置所包括的：

获得模块301，用于获取分别从多个不同角度采集的视频数据。

第三获取模块302，用于对至少一个角度采集的视频数据进行识别，获取对应角度下的识别特征数据及每个所述识别特征对应的第一时间。

查找模块303，用于如果获取到目标特征数据，从采集到的识别特征数据中查找与所述目标特征数据匹配的匹配特征数据。

第二获取模块304，用于基于与所述匹配特征数据对应的第一时间，从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。

参见图12所示的服务器100的结构示意图，该服务器100包括：处理器80，存储器81，总线82和通信接口83，所述处理器80、通信接口83和存储器81通过总线82连接；处理器80用于执行存储器81中存储的可执行模块，例如计算机程序。

其中，存储器81可能包含高速随机存取存储器(RAM：Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口83(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接。

总线82可以是ISA总线、PCI总线或EISA总线等。图12中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器81用于存储程序，所述处理器80在接收到执行指令后，执行所述程序，前述揭示的过程定义的装置所执行的方法可以应用于处理器80中，或者由处理器80实现。

处理器80可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器80中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器80可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。该存储介质位于存储器81，处理器80读取存储器81中的消息，结合其硬件完成上述方法的步骤。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器80执行时实现前述实施例中涉及的视频数据处理方法的步骤。

综上所述，本发明实施例提供的一种视频数据处理方法、装置、服务器及计算机可读存储介质，通过从采集到的识别特征数据中查找与获取的目标特征数据匹配的匹配特征数据，再确定与所述匹配特征数据对应的第一时间，以便从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。由于，识别特征数据为从多个不同角度采集的视频数据中的至少一个角度的视频数据中识别获得，且每个角度采集的视频数据与时间轴具有关联，因此，基于该第一时间，可以从多个不同角度采集的视频数据中获取对应该第一时间的图像数据。也就是，基于匹配特征数据对应的第一时间可查找到从不同角度呈现匹配特征数据的图像数据，减少图像识别技术与视频技术融合存在的技术限制，以便更好的满足用户的需求。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋文龙;杜中强
技术所有人：成都市喜爱科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。