一种视频图像的处理方法、装置与系统与流程

文档序号:23011950发布日期:2020-11-20 12:12阅读:92来源:国知局
一种视频图像的处理方法、装置与系统与流程
本申请涉及深度学习应用领域,尤其涉及一种视频图像的处理方法、装置与系统。
背景技术
:近年来,基于神经网络的计算机视觉技术在安防、无人机等领域得到了广泛的应用。随着人工智能技术的进一步发展,这些计算机视觉算法有望在大数据时代中替代大量的人力劳动,实现对海量图像数据的智能分析与高效应用。但是目前的图像压缩算法大多针对人类视觉的感知特性而设计,忽略了对于计算机视觉应用的支持。这使得在图像的后端处理中,不得不将前端传回的码流先重建为人眼可见的图像,再对其进行智能分析。而事实上,图像压缩后得到的码流已包含了全部的图像信息,有望直接用于图像数据的智能处理中。在此基础上,实际应用中也需要码流保留被还原成图像的能力,以方便人眼对分析结果进行复核。因此,如何实现图像编码与计算机视觉应用的深度协同,是在大数据时代中经济、高效处理图像数据所要面对的关键问题。目前,绝大多数基于计算机视觉的智能分析算法都需要将码流完全解码恢复成图像后,才能对其进行分析处理。技术实现要素:有鉴于此,本申请提供一种视频图像的处理方法、装置与系统。具体地,本申请是通过如下技术方案实现的:根据本申请实施例的第一方面,提供一种视频图像的处理方法,应用于发送端设备,所述方法包括:利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到所述待分析数据的通用特征;利用预先训练的特征压缩网络对所述通用特征进行编码,并将所述通用特征对应的编码码流发送给接收端设备,以使所述接收端设备利用预先训练的特征解压缩网络对所述通用特征对应的编码码流解码得到所述通用特征后,利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。根据本申请实施例的第二方面,提供一种视频图像的处理方法,应用于接收端设备,所述方法包括:接收发送端设备发送的待分析数据的通用特征对应的编码码流;其中,所述编码码流是发送端设备利用预先训练的所述特征压缩网络对待分析数据的通用特征进行编码得到的,所述待分析数据的通用特征是所述发送端设备利用预先训练的通用特征提取网络对所述待分析数据进行特征提取得到的;利用预先训练的特征解压缩网络对所述待分析数据的通用特征对应的编码码流进行解码,以得到所述待分析数据的通用特征;利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。根据本申请实施例的第三方面,提供一种视频图像的处理装置,应用于发送端设备,所述装置包括:特征提取单元,用于利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到所述待分析数据的通用特征;编码单元,用于利用预先训练的特征压缩网络对所述通用特征进行编码;发送单元,用于将所述通用特征对应的编码码流发送给接收端设备,以使所述接收端设备利用预先训练的特征解压缩网络对所述通用特征对应的编码码流解码得到所述通用特征后,利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。根据本申请实施例的第四方面,提供一种视频图像的处理装置,应用于接收端设备,所述装置包括:接收单元,用于接收发送端设备发送的待分析数据的通用特征对应的编码码流;其中,所述待分析数据的通用特征对应的编码码流是发送端设备利用预先训练的特征压缩网络对所述待分析数据的通用特征进行编码得到的,所述待分析数据的通用特征是所述发送端设备利用预先训练的通用特征提取网络对所述待分析数据进行特征提取得到的;解码单元,用于利用预先训练的所述特征解压缩网络对所述待分析数据的通用特征对应的编码码流进行解码,以得到所述待分析数据的通用特征;智能分析单元,用于利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。根据本申请实施例的第四方面,提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述视频图像的处理方法。根据本申请实施例的第五方面,提供一种智能分析系统,包括发送端设备和接收端设备,其中:所述发送端设备,用于利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到所述待分析数据的通用特征;所述发送端设备,还用于利用预先训练的特征压缩网络对所述通用特征进行编码,并将所述通用特征对应的编码码流发送给所述接收端设备;所述接收端设备,用于接收发送端设备发送的待分析数据的通用特征对应的编码码流;所述接收端设备,还用于利用预先训练的所述特征解压缩网络对所述待分析数据的通用特征对应的编码码流进行解码,以得到所述待分析数据的通用特征;所述接收端设备,还用于利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。本申请实施例的视频图像的方法,通过利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到待分析数据的通用特征,并利用预先训练的特征压缩网络对该通用特征进行编码,进而,将该通用特征对应的编码码流发送给接收端设备,以使接收端设备利用预先训练的特征解压缩网络对通用特征对应的编码码流进行解码得到通用特征,并利用预先训练的智能分析网络对解码得到的通用特征进行智能分析,在不需要对待分析数据进行重建的情况下,实现了对待分析数据的智能分析,提高了智能分析效率,并降低了由于数据重建需要访问原始数据导致的用户隐私问题。附图说明图1是本申请一示例性实施例示出的一种视频图像的处理方法的流程示意图;图2是本申请一示例性实施例示出的一种视频图像的处理方法的流程示意图;图3是本申请一示例性实施例示出的一种对通用特征进行编码的流程示意图;图4是本申请一示例性实施例示出的一种对编码码流进行解码的流程示意图;图5是一种典型的图像编解码与目标识别系统的示意图;图6是本申请实施例提供的一种含重建图像的基于特征共享的图像压缩和目标识别的流程示意图;图7是本申请实施例提供的一种进行通用特征提取网络训练的视频图像的处理系统的架构示意图;图8a是本申请实施例提供的一种通用特征提取网络的示意图;图8b是本申请实施例提供的一种图像重建网络的示意图;图8c是本申请实施例提供的一种超先验网络的示意图;图9是本申请实施例提供的一种含隐私保护的基于特征共享的图像压缩和目标识别的流程示意图;图10是本申请实施例提供的一种视频图像的处理装置的结构示意图;图11是本申请实施例提供的一种视频图像的处理装置的结构示意图;图12是本申请实施例提供的一种视频图像的处理装置的结构示意图;图13是本申请实施例提供的一种电子设备的硬件结构示意图;图14是本申请实施例提供的一种智能分析系统的结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。为了使本领域技术人员更好地理解本申请实施例提供的技术方案,并使本申请实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中技术方案作进一步详细的说明。请参见图1,为本申请实施例提供的一种视频图像的处理方法的流程示意图,其中,该视频图像的处理方法可以应用于发送端设备,如图1所示,该视频图像的处理方法可以包括以下步骤:示例性的,该发送端设备可以为数据采集设备,如摄像机。步骤s100、利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到待分析数据的通用特征。示例性的,待分析数据可以包括但不限于待分析图像(如图片或视频帧画面)或待分析视频。本申请实施例中,发送端设备可以利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到待分析数据的特征(本文中称为通用特征)。步骤s110、利用预先训练的特征压缩网络对所提取的待分析数据的通用特征进行编码,并将该通用特征对应的编码码流发送给接收端设备,以使接收端设备利用预先训练的特征解压缩网络对该通用特征对应的编码码流解码得到通用特征后,利用预先训练的智能分析网络对解码得到的通用特征进行智能分析。本申请实施例中,发送端设备利用训练好的通用特征提取网络提取到待分析数据的通用特征时,可以利用训练好的特征压缩网络对所提取的通用特征进行编码,并将该通用特征对应的编码码流发送给接收端设备。示例性的,接收端设备接收到发送端设备发送的编码码流之后的处理流程可以参见图2所示方法流程中的相关描述,本申请实施例在此不做赘述。请参见图2,为本申请实施例提供的一种视频图像的处理方法的流程示意图,其中,该视频图像的处理方法可以应用于接收端设备,如图2所示,该视频图像的处理方法可以包括以下步骤:示例性的,该接收端设备可以为智能分析设备,如nvr(networkvideorecorder,网络视频录像机)或dvr(digitalvideorecorder,数字视频录像机)等。示例性的,发送端设备和接收端设备可以作为云平台中的设备承载在云系统中。步骤s200、接收发送端设备发送的待分析数据的通用特征对应的编码码流;其中,该待分析数据的通用特征对应的编码码流是发送端设备利用预先训练的特征压缩网络对待分析数据的通用特征进行编码得到的,待分析数据的通用特征是发送端设备利用预先训练的通用特征提取网络对待分析数据进行特征提取得到的。步骤s210、利用预先训练的特征解压缩网络对接收到的编码码流进行解码,以得到待分析数据的通用特征。示例性的,发送端设备提取待分析数据的通用特征,以及对通用特征进行编码,并将编码得到的编码码流发送给接收端设备的具体实现流程可以参见图1所示方法流程中的相关描述,本申请实施例在此不再赘述。本申请实施例中,接收端设备接收到发送端设备发送的编码码流时,可以利用预先训练的特征解压缩网络对接收到的编码码流进行解码,以得到待分析数据的通用特征。步骤s220、利用预先训练的智能分析网络对解码得到的通用特征进行智能分析。本申请实施例中,接收端设备对接收到的编码码流进行解码得到待分析数据的通用特征时,可以利用预先训练的智能分析网络对解码得到的通用特征进行智能分析。示例性的,该智能分析可以包括但不限于目标识别、目标行为识别、智能搜索或/和智能控制等。目标识别可以包括但不限于人脸识别、车辆识别、虹膜识别或/和指纹识别等。可见,在图1和图2所示方法流程中,发送端设备通过对待分析数据进行特征提取,并将对提取到的通用特征进行编码得到的通用特征对应的编码码流发送给接收端设备,由接收端设备解码得到通用特征后,基于该通用特征进行智能分析,在不需要进行对待分析数据进行重建的情况下,实现了对待分析数据的智能分析,提高了智能分析效率,并降低了由于数据重建导致的隐私泄漏风险。作为一种可能的实施例,上述通用特征网络的训练可以通过对包括通用特征提取网络、特征压缩网络、特征解压缩网络以及重建网络的特征压缩/解压缩模块进行训练的方式实现;智能分析网络的训练可以以训练样本经过训练好的通用特征提取网络处理后的输出特征为输入进行训练的方式实现。示例性的,为了提高通用特征提取网络所提取的特征(本文中称为通用特征)的泛用性,以及整个系统的可拓展性,对通用特征提取网络的训练,可以通过对包括通用特征提取网络、特征压缩网络、特征解压缩网络以及重建网络的特征压缩/解压缩模块进行训练的方式来实现,即以预设训练集中的训练样本作为特征压缩/解压缩模块的输入,重建网络输出的重建多媒体数据作为特征压缩/解压缩模块的输出,并基于重建多媒体数据与原多媒体数据之间的损失对特征提取网络、特征压缩网络、特征解压缩网络以及重建网络的参数进行优化调整。由于多媒体数据重建通常会需要尽可能的保留多媒体数据的特征,因此,通过对特征压缩/解压缩模块的训练的方式实现对通用特征提取网络的训练,可以提高训练好的通用特征提取网络所提取的特征的全面性,减少细节丢失,从而提高通用特征提取网络提取的特征的泛用性,以及整个系统的可拓展性。当完成通用特征提取网络的训练时,可以利用训练好的通用特征提取网络对待分析数据进行特征提取,以得到待分析数据的通用特征。示例性的,发送端设备完成了对特征压缩/解压缩模块的训练之后,可以利用训练好的特征压缩/解压缩模块中的通用特征提取网络的输出特征,即训练样本经过训练好的通用特征提取网络处理后的输出特征,作为智能分析网络的输入,对智能分析网络进行训练。示例性的,特征压缩/解压缩模块的训练以及智能分析网络的训练可以线下实现,例如由发送端设备和接收端设备之外的第三方设备线下训练,并将训练好的通用特征提取网络和特征压缩网络部署到发送端设备,以用于发送端设备对待分析所媒体数据的特征提取和编码;将训练好的特征解压缩网络和智能分析网络部署于接收端设备,以用于接收端设备对编码码流进行解码和智能分析。示例性的,特征压缩网络可以为超先验编码网络,特征解压缩网络可以为超先验解码网络。发送端设备中可以部署训练好的超先验编码网络和超先验解码网络。训练好的网络部署于发送端设备或接收端设备,可以通过网络将网络结构和训练好的网络参数发送给编码网络备和接收端设备,以使发送端设备和接收端设备基于接收到的网络结构和网络参数进行网络构建。由于通用特征提取网络的训练是以包括通用特征提取网络、特征压缩网络、特征解压缩网络以及重建网络的特征压缩/解压缩模块的输出进行反馈优化的,而并不是直接针对某一种具体的智能分析任务,且重建网络的优化目标是尽可能还原原图,因此,基于特征压缩/解压缩模块的训练得到的通用特征提取网络提取的特征会比较全面,细节丢失会比较少,具有较好的泛化性,可以应用于各类智能分析任务。举例来说,以目标识别(如人脸识别和车辆识别)为例,传统方案中,对特征提取网络的训练通常是结合智能分析应用需求进行训练的,即对于人脸识别的应用,进行特征提取网络训练时侧重的是人脸信息的特征提取;对于车辆识别的应用,进行特征提取网络训练时侧重的是车辆信息的特征提取,训练好的特征提取网络的适用场景有限。而按照本申请提供的方案训练得到的通用特征提取网络提取的特征细节丢失较少,在后续流程中既可以应用于人脸识别,也可以应用于车辆识别,且均可以得到较优的识别效果。此外,对于需要进行隐私保护的场景,可以不在接收端设备部署训练好的重建网络,以使接收端设备无法基于得到的通用特征进行多媒体数据重建,从而在不影响智能分析任务的执行的情况下,有效保护数据中的隐私。作为一种可能的实施例,特征压缩网络可以为超先验编码网络,特征解压缩网络可以为超先验解码网络;待分析数据的通用特征为通用特征对应的隐变量。如图3所示,步骤s110中,利用预先训练的特征压缩网络对通用特征进行编码可以通过以下步骤实现:步骤s111、将隐变量输入利用预先训练的超先验编码网络,以生成包括隐变量的统计特征的紧凑表达。步骤s112、对该紧凑表达进行量化和算术编码,以得到紧凑表达对应的编码码流。步骤s113、对紧凑表达对应的编码码流进行算术解码,并输入预先训练的超先验解码网络,以得到隐变量完整的统计特性。步骤s114、基于隐变量完整的统计特性,对隐变量进行量化和算术编码,以得到隐变量对应的编码码流。示例性的,通过训练好的通用特征提取网络提取到了待分析数据的通用特征可以为隐变量(即待分析数据的通用特征的隐变量表达)。为了优化通用特征的编解码性能,得到通用特征对应的隐变量时,还可以以该隐变量为输入,利用预先训练的超先验编码网络,生成包括隐变量统计特性的紧凑表达,并对该紧凑表达进行量化和算术编码,以得到紧凑表达对应的编码码流。示例性的,上述量化操作用于将浮点型特征转换为整型特征。在得到紧凑表达对应的编码码流时,可以在对该紧凑表达对应的编码码流进行算术解码后,输入预先训练的超先验解码网络,以得到隐变量完整的统计特征,并基于该隐变量完整的统计特征,对隐变量进行量化和算术编码,以得到隐变量对应的编码码流。示例性的,步骤s110中,将通用特征对应的编码码流发送给接收端设备,可以包括:将紧凑表达对应的编码码流以及隐变量对应的编码码流发送给接收端设备。作为一种可能的实施例,如图4所示,步骤s210中,利用预先训练的特征解压缩网络对接收到的编码码流进行解码,可以通过以下步骤实现:步骤s211、对紧凑表达对应的编码码流进行算术解码,并输入预先训练的超先验解码网络,以得到隐变量完整的统计特性。步骤s212、基于隐变量完整的统计特性,对隐变量对应的编码码流进行算术解码,以得到通用特征对应的隐变量。示例性的,接收端设备接收到发送端设备发送的待分析数据的通用特征对应的编码码流时,可以先对编码码流中的紧凑表达对应的编码码流进行算术解码,并输入预先训练的超先验解码网络,以得到隐变量完整的统计特性,并基于该隐变量完成的统计特征,对隐变量对应的编码码流的算术解码进行指导,通过对隐变量对应的编码码流进行算术解码,得到通用特征对应的隐变量。作为一种可能的实施例,步骤s210中,利用预先训练的特征解压缩网络对接收到的编码码流进行解码之后,还可以包括:利用预先训练的重建网络,对解码得到的通用特征进行数据重建。示例性的,重建网络的训练可以通过对上述特征压缩/解压缩模块的训练实现,具体训练流程可以参见上文中的相关描述,本申请实施例在此不再赘述。示例性的,可以将训练好的重建网络部署在接收端设备,例如,可以通过网络将重建网络的网络结构以及训练好的重建网络的网络参数发送给接收端设备,由接收端设备基于接收到的网络结构以及网络参数构建重建网络。当接收端设备对接收到的编码码流进行解码得到待分析数据的通用特征时,可以利用该训练好的重建网络,对解码得到的通用特征进行数据重建。为了使本领域技术人员更好地理解本申请实施例提供的技术方案,下面结合具体应用场景对本申请实施例提供的技术方案进行说明。下面先对传统图像编解码与目标识别系统的实现流程进行说明。请参见图5,为一种典型的图像编解码与目标识别系统的示意图,如图5所示,传统的图像编解码与目标识别系统实现流程中,需要先对图像进行解码,在重建图像上进行目标识别,从而带来了如下问题:1、编解码重建质量与目标识别性能独立:虽然编解码重建质量与目标识别精度有一定的线性相关性,但传统编码方法(如h.264、h.265)码率控制与目标识别精度脱离,例如,在对编解码网络进行训练时,单纯地基于psnr(peaksignaltonoiseratio,峰值信噪比)为目标进行训练,但是psnr高,并不意味着识别精度也会高,随着人工智能的普及,传统的图像编解码与目标识别系统已无法满足需求。2、传统图像编解码与目标识别系统中,目标识别基于重建图像,因此无论是否存在查看重建图像的需求,都需要重建图像,复杂度高。3、数据隐私重要性日益增加,传统图像编解码与目标识别系统仅能通过加密算法对数据进行保护,但加密的数据在使用时,是需要解密的,解密后数据存在泄漏的风险,无法在解码端保证每个环节都不会有重建图片的产生,从而可能会导致数据隐私的泄漏。目前解决上述问题的常见方案是shen等提出的使用共享特征的方式,将图像压缩网络得到的特征直接用于目标识别任务中,以及,torfason等提出通过端到端联合训练,将图像编码与目标识别/目标分割进行了融合。上述两种方法均借助深度神经网络打破既有图像压缩标准带来的限制,通过共享特征实现图像压缩和目标识别的融合。前者不考虑图像压缩与智能应用间的耦合,单纯的将图像压缩所得到的特征/码流输入智能识别网络,识别精度较低;后者图像编码与目标识别/目标分割任务的耦合主要通过端到端的联合训练来实现,压缩性能不足。两者均未充分考虑图像压缩和目标识别任务的内在联系,无法兼顾两种任务上的综合表现。下面对本申请实施例提供的视频图像的处理方案进行说明。以待分析数据为待分析图像,智能分析为目标识别为例。实施例一请参见图6,为本申请实施例提供的一种含重建图像的基于特征共享的图像压缩和目标识别的流程示意图,如图6所示,该流程可以包括以下步骤:示例性的,图6中的编码端可以是实施例中发送端设备的编码装置,解码端可以是实施例中接收端设备的解码装置。1、收集和整理规范的高清图像压缩与目标识别数据集(如kodak,imagenet或/和pascal等),构建神经网络训练集、测试集(训练样本之外的用于进行测试的样本)和交叉验证集(训练样本中的部分用于测试的样本)。示例性的,数据集的质量与预处理对整个神经网络的训练有着很大影响,以imagenet为代表高质量数据集,能为网络训练提供充足的高分辨率图像,提高网络泛化能力,避免过拟合。2、建立并训练多层的通用特征提取网络、超先验网络、图像重建网络和目标识别网络。示例性的,请参见图7,为本申请实施例提供的一种进行通用特征提取网络训练的视频图像的处理系统的架构示意图,如图7所示,特征压缩/解压模块包括通用特征提取网络、超先验网络(包括超先验编码网络和超先验解码网络)和图像重建网络,特征应用模块包括目标识别网络。需要说明的是,网络训练完成之后,接收端设备可以无配置重建网络,也可以配置有重建网络。示例性的,通用特征提取网络的示意图可以如图8a所示,图像重建网络的示意图可以如图8b所示,超先验网络(包括超先验编码网络和超先验解码网络)的示意图可以如图8c所示。示例性的,通用特征提取网络及图像重建网络中的激活函数选用无信息损失的激活函数(如sigmoid、leakrelu函数),并通过4次pooling下采样保证在取得较高压缩率的同时,为目标识别任务保留足够的细节特征。在隐变量的特征可迁移性上,将构成通用特征提取网络的基本单元精简为只包含一个卷积层的残差网络(如图8a的虚线框中部分所示),使整个网络仅包含6个卷积层,显著减少计算复杂度,提高隐变量泛化性。隐变量的特征通道数选用128通道,可在保证压缩效率的同时,显著减少其余网络的参数量。示例性的,本申请实施例提供的方案通过上述参数设置方式,保证了特征的压缩性能。需要说明的是,pooling次数越多,数据量减少越多,压缩率越高,但是损失会越大,无法保证目标识别质量;而pooling次数越少,损失会越小,但压缩率会越低,因此,pooling次数的选择需要均衡考虑压缩率需求和识别性能需求。增加卷积层可以轻微的提高压缩效率,但同时会损害智能分析精度,并增加计算量,因此,卷积层的数量的选择需要均衡考虑压缩效率、智能分析精度需求以及计算资源限制。增加隐变量的通道数事实上可以非常轻微的提高压缩效率,增加智能识别网络卷积层的通道数,可以比较有效地提高智能分析精度,但同时带来比较大的计算开销,因此,隐变量的通道数的选择需要均衡考虑智能分析精度需求和计算资源限制。示例性的,为了保持特征压缩/解压缩模块的泛用性及整个系统的可拓展性,在训练中可以先训练特征压缩/解压缩模块,再训练特征应用模块(即以训练好的特征压缩/解压缩模块中通用特征提取网络的输出特征作为特征应用模块的输入,即将训练样本经过训练好的通用特征提取网络处理后的输出特征作为特征应用模块的输入,对特征应用模块进行训练)。示例性的,训练过程中,梯度下降优化算法可以选用自适应优化器(如adam),图像重建的代价函数loss选用多尺度结构相似性(multiscalestructuralsimilarity,简称ms-ssim),以利用人眼视觉感知和目标识别网络对目标结构信息敏感的相似性。3、网络训练完后,将待分析图像输入通用特征提取网络得到其对应的隐变量表达。4、超先验编码网络以隐变量为输入,生成一个包含隐变量统计特性的紧凑表达,对该紧凑表达进行量化和算术编码后,进行算术解码,并输入超先验解码网络,以得到隐变量完整的统计特性,用以估计隐变量的码率并指导其算术编码,以便步骤5中可以基于该隐变量完整的统计特性,对隐变量进行量化和算术编码。5、将隐变量进行量化,并基于隐变量完整的统计特性,采用间距编码(rangecoder)对隐变量进行算术编码,其中隐变量的概率模型可采用指数分布族中的各类分布(如高斯分布、拉普拉斯分布等)。隐变量和紧凑表达算术编码后形成码流传输至解码端。示例性的,隐变量的数值分布越接近预设的概率模型,其码率越小。示例性的,上述“超先验编码+量化+算术编码”的过程可以称为熵编码。6、在解码端将紧凑表达对应的编码码流进行算术解码后,输入超先验解码,以得到隐变量完整的统计特性,并基于该隐变量完整的统计特性对隐变量对应的编码码流进行算术解码,得到通用特征对应的隐变量。示例性的,上述“超先验解码+算术解码”的过程可以称为熵解码。7、将解码后的隐变量分别输入图像重建网络和目标识别网络,得到重建图像与识别结果。实施例二请参见图9,为本申请实施例提供的一种含隐私保护的基于特征共享的图像压缩和目标识别的流程示意图,如图9所示,该流程为一种兼顾图像数据隐私与智能分析精度的图像压缩与智能应用,在实施实例一的基础上,不向解码端分发图像重建网络,仅分发基于特征的智能应用模块,比如目标识别网络。示例性的,图9中的编码端可以是实施例中发送端设备的编码装置,解码端可以是实施例中接收端设备的解码装置。由于无图像重建网络,因此,解码端无法重建与访问原始图像信息,可以在最大限度的保护原始图像数据私密性,同时不影响智能应用,用户可基于特征完成各类的智能分析服务。示例性的,上述实施例利用深度神经网络的特性,提出一种能够兼顾人眼感知与分析精度的基于特征共享的图像压缩和目标识别融合方法,以适应大数据时代对高效图像传输、分析、隐私保护的需求。与现有图像编码标准bpg相比,在相同图像重建质量上可以平均节省38%左右的码率;与此同时,在不进行图像重建、仅对码流熵解码的情况下,本本申请实施例中在高码率段能取得接近直接对原图进行目标识别的精度。考虑到解码端的图像重建网络与特征应用模块相互独立,在实际使用中可仅对解码端分发特征应用模块,使解码端无需重建与访问原始图像信息,即可对图像内容进行智能处理,相比传统方法,大大提高了原始图像数据的私密性。此外,由于相关的网络结构设计保证了隐变量的通用性,本申请实施例中的特征压缩模块可在不经过重新训练的情况下,适配用于其他计算机视觉任务的特征应用模块,具有更好的可扩展性。在压缩效率上,本申请实施例提供的方案在高清数据集上的同等比较中,在相同图像重建质量上可比现有bpg标准平均节省38%左右的码率。在目标识别精度上,对本申请实施例提供的方案在pascal数据集进行测试,使用平均精度均值(meanaverageprecision,简称map)作为评价标准,在仅对码流熵解码的情况下,本申请实施例提供的方案取得了接近在原图上进行目标识别的精度。示例性的,本申请实施例提供的方案在高清数据集上的平均压缩效率及在pascal数据集上的平均分类精度可以如表1所示:表1码率(bpp)0.170.560.690.8924(未压缩)结构性相似度0.9530.9870.9910.9931分类精度(map)72.0%73.2%75.1%74.2%75.4%可见,随着码率的升高,结构性相似度(即重建质量)和分类精度(即识别精度)均升高,但是码率变化较大的情况下,结构性相似度和分类精度的变化不明显,即码率降低较多时,结构性相似度和分类精度的下降并不明显,因此,当采用较小码率时,可以在保证结构相似度和分类精度的情况下,提高压缩率。需要说明的是,当带宽允许时,可以采用较高码率,以提高结构相似度和分类精度。以上对本申请提供的方法进行了描述。下面对本申请提供的装置进行描述:请参见图10,为本申请实施例提供的一种视频图像的处理装置的结构示意图,其中,该视频图像的处理装置可以应用于上述方法实施例中的发送端设备,如图10所示,该视频图像的处理装置可以包括:特征提取单元1010,用于利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到所述待分析数据的通用特征;编码单元1020,用于利用预先训练的特征压缩网络对所述通用特征进行编码;发送单元1030,用于将所述通用特征对应的编码码流发送给接收端设备,以使所述接收端设备利用预先训练的特征解压缩网络对所述通用特征对应的编码码流解码得到所述通用特征后,利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。在一种可能的实施例中,所述通用特征网络的训练是通过对包括所述通用特征提取网络、特征压缩网络、特征解压缩网络以及重建网络的特征压缩/解压缩模块进行训练的方式实现的;所述智能分析网络的训练是以训练样本经过训练好的所述通用特征提取网络处理后的输出特征为输入进行训练的方式实现的。在一种可能的实施例中,所述特征压缩网络为超先验编码网络,所述特征解压缩网络为超先验解码网络;所述待分析数据的通用特征为所述通用特征对应的隐变量;所述编码单元1020利用预先训练的所述特征压缩网络对所述通用特征进行编码,包括:将所述隐变量输入预先训练的所述超先验编码网络,以生成包括所述隐变量的统计特征的紧凑表达;对所述紧凑表达进行量化和算术编码,以得到所述紧凑表达对应的编码码流;对所述紧凑表达对应的编码码流进行算术解码,并输入预先训练的所述超先验解码网络,以得到所述隐变量完整的统计特性;基于所述隐变量完整的统计特性,对所述隐变量进行量化和算术编码,以得到所述隐变量对应的编码码流;所述发送单元1030将所述通用特征对应的编码码流发送给接收端设备,包括:将所述紧凑表达对应的编码码流以及所述隐变量对应的编码码流发送给所述接收端设备。请参见图11,为本申请实施例提供的一种视频图像的处理装置的结构示意图,其中,该视频图像的处理装置可以应用于上述方法实施例中的接收端设备,如图11所示,该视频图像的处理装置可以包括:接收单元1110,用于接收发送端设备发送的待分析数据的通用特征对应的编码码流;其中,所述待分析数据的通用特征对应的编码码流是发送端设备利用预先训练的特征压缩网络对待分析数据的通用特征进行编码得到的,所述待分析数据的通用特征是所述发送端设备利用预先训练的通用特征提取网络对所述待分析数据进行特征提取得到的;解码单元1120,用于利用预先训练的所述特征解压缩网络对所述待分析数据的通用特征对应的编码码流进行解码,以得到所述待分析数据的通用特征;智能分析单元1130,用于利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。在一种可能的实施例中,所述通用特征网络以及所述特征压缩网络的训练是通过对包括所述通用特征提取网络、所述特征压缩网络、特征解压缩网络以及重建网络的特征压缩/解压缩模块进行训练的方式实现的;所述智能分析网络的训练是以训练样本经过训练好的所述通用特征提取网络处理后的输出特征为输入进行训练的方式实现的。在一种可能的实施例中,所述特征压缩网络为超先验编码网络,所述特征解压缩网络为超先验解码网络;所述待分析数据的通用特征为所述通用特征对应的隐变量;所述待分析数据的通用特征对应的编码码流包括隐变量对应的编码码流以及紧凑表达对应的编码码流,所述紧凑表达包括所述隐变量的统计特征;所述解码单元1120利用预先训练的所述特征解压缩网络对所述待分析数据的通用特征对应的编码码流进行解码,包括:对所述紧凑表达对应的编码码流进行算术解码,并输入预先训练的所述超先验解码网络,以得到所述隐变量完整的统计特性;基于所述隐变量完整的统计特性,对所述隐变量对应的编码码流进行算术解码,以得到所述通用特征对应的隐变量。在一种可能的实施例中,如图12所示,所述装置还包括:重建单元1140,用于利用预先训练的所述重建网络,对解码得到的所述通用特征进行数据重建。请参见图13,为本申请实施例提供的一种电子设备的硬件结构示意图。该电子设备可以包括处理器1301、通信接口1302、存储器1303和通信总线1304。处理器1301、通信接口1302以及存储器1303通过通信总线1304完成相互间的通信。其中,存储器1303上存放有计算机程序;处理器1301可以通过执行存储器1303上所存放的程序,执行上文描述的视频图像的处理方法。本文中提到的存储器1303可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,存储器1302可以是:ram(radomaccessmemory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。示例性的,该电子设备可以为发送端设备,如视频监控前端(如ipc(internetprotocolcamera,网络摄像机)),或,接收端设备,如nvr或dvr等。本申请实施例还提供了一种存储有计算机程序的机器可读存储介质,例如图13中的存储器1303,该计算机程序可由图13所示电子设备中的处理器1301执行以实现上文中描述的视频图像的处理方法。本申请实施例还提供了一种计算机程序,存储于机器可读存储介质,例如图13中的存储器1303,并且当处理器执行该计算机程序时,促使处理器1301执行上文中描述的视频图像的处理方法。对应地,本申请还提供了图10~图12中任一所示装置的硬件结构。参见图13,该硬件结构可包括:处理器和机器可读存储介质,机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;所述处理器用于执行机器可执行指令,以实现本申请上述示例公开的方法。基于与上述方法同样的申请构思,本申请实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述计算机指令被处理器执行时,能够实现本申请上述示例公开的方法。示例性的,上述机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:ram(radomaccessmemory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。请参见图14,为本申请实施例提供的一种智能分析系统的结构示意图,如图14所示,该智能分析系统可以包括:发送端设备1410和接收端设备1420;所述发送端设备1410,用于利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到所述待分析数据的通用特征;所述发送端设备1410,还用于利用预先训练的特征压缩网络对所述通用特征进行编码,并将所述通用特征对应的编码码流发送给所述接收端设备1420;所述接收端设备1420,用于接收发送端设备1410发送的待分析数据的通用特征对应的编码码流;所述接收端设备1420,还用于利用预先训练的所述特征解压缩网络对所述待分析数据的通用特征对应的编码码流进行解码,以得到所述待分析数据的通用特征;所述接收端设备1420,还用于利用预先训练的智能分析网络对解码得到的所述通用特征进行智能分析。在一种可能的实施例中,所述通用特征网络的训练是通过对包括所述通用特征提取网络、所述特征压缩网络、所述特征解压缩网络以及重建网络的特征压缩/解压缩模块进行训练的方式实现的;所述智能分析网络的训练是以训练样本经过训练好的所述通用特征提取网络处理后的输出特征为输入进行训练的方式实现的。在一种可能的实施例中,所述接收端设备1420,还用于利用预先训练的所述重建网络,对解码得到的所述通用特征进行数据重建。需要说明的是,上述方法实施例、装置实施例和系统实施例的相关内容可以相互参照。在图14所示的智能分析系统中,发送端设备利用预先训练的通用特征提取网络对待分析数据进行特征提取,以得到待分析数据的通用特征,并利用预先训练的特征压缩网络对该通用特征进行编码,进而,将该通用特征对应的编码码流发送给接收端设备;接收端设备利用预先训练的特征解压缩网络对通用特征对应的编码码流进行解码得到通用特征,并利用预先训练的智能分析网络对解码得到的通用特征进行智能分析,在不需要对待分析数据进行重建的情况下,实现了对待分析数据的智能分析,提高了智能分析效率,并降低了由于数据重建需要访问原始数据导致的用户隐私问题。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1