对在低光照中捕获的视频进行编码的制作方法_2

文档序号：9757302阅读：来源：国知局

光照而产生的噪声可以将自身显现为视频中的色度斑点。除了是视觉上令人不愉快的伪影之外，斑点进行编码可能也是昂贵的（在比特率方面），从而给视频的想要部分的编码留下太少的比特。
[0022] 此外，在视频通话中，当进行通信时眼神交流和面部表情可以提供重要的信息。因此，在面部区域中包含阴影的黑暗视频对通信质量具有负面的影响。面部在低光照中的非自然色调常常是由于从发送侧的位于用户前面的显示器发出的光的冷色温而产生的。调整色调将减少在通信时人坐在计算机后面的感觉。
[0023] 可以使用以下的实施例来通过应用亮度提升、色度调整和/或降噪来减轻一个或多个这样的问题。可以基于低光照和噪声分类器来控制何时应用这些处理算法以及将这些处理算法应用到什么程度，马上将举例说明其细节。
[0024] 此外，在实现低光照增强器的实施例中的一个挑战是保持低的复杂度，以便促进实时处理。与本领域中的需要大量的处理的现有解决方案相比，以下的实施例被设计得在效率相对于计算复杂度方面达到了较好的折中。
[0025] 图1给出了从摄像机捕获的并且被分割成多个部分从而由视频编码器进行编码以便生成编码的比特流的输入视频信号的示意性示图。该信号包括按照时间被分割成多个帧 (F)的运动视频图像，每个帧表示在时间上处于不同的响应时刻（…t-1，t，t+Ι…）的图像。在每一帧内，帧按照空间被分割成多个部分，每个部分表示多个像素。这些部分例如可以被称为块。在某些方案中，帧被分割并且被再分割成不同等级的部分或块。例如，每个帧可以被分割成宏块(MB)，并且每个宏块可以被分割成块(b)，例如每个块表不帧内的8X8像素区域，并且每个宏块表示2 X 2块（16 X 16像素）的区域。在某些方案中，每个块也可以被分割成称为片(S)的部分，每个片包括多个宏块。
[0026] 图2是用于传送编码(压缩)形式的视频信号的通信系统的方框图。在发送侧，通信系统包括:视频摄像机2;预处理模块，其包括具有耦合至摄像机的输出的输入的低光照增强器4;编码器6,其具有耦合到低光照增强器4的输出的输入；以及发射机8,其具有耦合至编码器6的输出的输入。摄像机2被配置为从其环境捕获视频信号，即，从其环境中的移动场景捕获光，并且生成表示该场景的视频信号。所生成的信号(例如，通过初始的预处理阶段，未示出）被分割成诸如块、宏块和/或片之类的部分，如图1中所示的，并且以这样的形式被输出至低光照增强器4的输入。
[0027] 低光照增强器4被配置为对视频信号的帧进行预处理以执行在低光照条件下的增强，其实施例很快将被讨论。将已增强的帧从低光照增强器4输出至编码器6的输入，其中，在低光照增强器4预处理之后，对它们进行编码。应当注意，其中提到在低光照增强器4预处理之后编码器6对数据进行编码，这未必意味着整个视频是在编码之前进行预处理的。相反，随着每个帧或帧的一部分由低光照增强器预处理，该帧或部分接着在另一随后的帧或该帧的随后部分被预处理的同时被编码，以此类推。
[0028]编码器6将已编码的视频输出至发射机8的输入。发射机8具有耦合至或可以操作以耦合至通信介质的输出，所述通信介质例如包括一个或多个网络1〇(例如互联网和/或其它基于分组的网络）。发射机可以包括到网络10的有线和/或无线接口，并且可以经由有线和/或无线接口发送视频。在实时传输的情况下，随着每个帧或帧的一部分被编码器6编码，发射机8接着发送该帧或部分，同时编码器6继续对另一随后的帧或帧的随后部分进行编码，以次类推。
[0029] 在实施例中，发射机8、编码器6和/或包括低光照增强器4的预处理模块可以实现在相同的终端中，例如用户终端;例如，智能电话、平板、膝上型计算机等形式的移动用户终端;或像台式计算机一样的另一类型的用户终端。摄像机2可以在终端的内部或外部。编码器6、低光照增强器4和/或任何其它的预处理或后处理阶段可以用代码的形式来实现，所述代码存储在计算机可读存储介质(例如，磁和/或电子存储介质)上，并且被设置为在包括一个或多个处理单元的处理器上执行；例如，作为通信客户端应用（例如，具有视频通话的 VoIP客户端)的一部分。可替代地，并不排除编码器6、低光照增强器4和/或任何其它阶段的功能中的一些或全部是用专用硬件电路、或者可配置或可重新配置的硬件电路(例如，可编程门阵列(PGA)或现场可编程门阵列(FPGA))的形式实现的。在当前的意义中，"预处理"或 "处理"未必暗示软件在处理器上的执行，尽管这当然是一种实现。
[0030] 在接收侧，通信系统包括:接收机12;解码器14，其具有耦合至接收机12的输出的输入端；以及屏幕16,其具有耦合至解码器14的输出的输入。接收机12耦合至或可操作以耦合至通信介质，例如，所述一个或多个网络10,并且由此接收从编码器6经由发射机8和该网络10或其它通信介质发送的已编码视频。接收机12将接收到的已编码的视频信号传递至解码器14,所述解码器14对该信号进行解码并且输出该信号的解码的版本以通过屏幕16播出。
[0031] 在实施例中，接收机12和解码器14可以实现在相同的终端，例如用户终端，例如，智能电话、平板、膝上型计算机等的形式的移动用户终端;或像台式计算机一样的另一类型的用户终端。屏幕16可以在终端的内部或外部。解码器14可以用代码的形式来实现，所述代码存储在计算机可读存储介质(例如，磁和/或电子存储介质）中，并且被设置为在包括一个或多个处理单元的处理器上执行。可替代地，并不排除解码器14的功能中的一些或全部是用专用硬件电路、或者可配置或可重新配置的硬件电路(例如，PGA或FPGA)的形式实现的。 [0032]当然，应当理解的是，"接收侧"终端也可以被配置为对要被"发送侧"终端接收、解码和播放的视频进行预处理、编码和发送，但是出于解释说明的目的，根据如在图2中示意性地示出的发送侧和接收侧描述了本公开。
[0033] 图3提供了编码器6的示意性方框图。编码器6包括:预测编码模块18,其被设置为接收预处理的视频信号作为输入；以及耦合至预测编码器18的输出的熵编码器20。预测编码器18利用帧内和/或帧间编码对输入的视频信号的每一帧进行编码。帧内编码是通过相对于帧内的其它块或宏块来预测相同帧的诸如块或宏块之类的部分来执行的，而帧间编码是通过相对于一个或多个其它帧内的对应部分预测帧内的诸如块或宏块之类的部分来执行的。其它编码模式也可以为本领域技术人员所熟知。
[0034] 无论如何，该编码阶段的结果是生成信号的一个本本，在该版本中，用残差样本 (表示不同的块或图像部分之间的样本间差)而不是绝对样本值来表示每个块或宏块根据残差采样。残差值整体上在大小上比绝对值倾向于更小，其中残差值是根据绝对值产生的。残差样本从预测编码器18输出至熵编码器20的输入，用于进一步编码。熵编码器20的动作是利用比特长度较小的码对频繁(常常）出现的样本值进行编码，并且利用比特长度较长的码对不频繁(罕见）出现的样本值进行编码(而不是利用统一数量的比特来表示所有可能的样本值）。在编码器目的是生成小量值的残差样本的情况下，效果是零值和小量值的样本将最频繁地出现。因此，编码器6运行使得较小量值的残差样本在已编码比特流中占用较少的比特来编码，并且因此，与具有较大的差的帧相比，具有较小的帧内差和/或帧间差的帧在被编码时将产生更低的比特率。
[0035] 如本领域技术人员所熟知的，预测编码可以可选地也包含变换和/或量化。变换阶段将每帧的每个块或宏块的残差样本从空间域表示(每个颜色空间通道是根据像素的空间坐标进行表示的)变换到变换域表示，例如空间频域表示(每个颜色空间通道是用频域系数根据空间频率进行表示的）。例如，变换可以包括离散余弦变换(DCT)或Karhunen-Loeve变换(KLT)。在块或宏块的变换之后，量化器接着对块或宏块的所变换的样本进行量化。量化是指挑选在相对大的尺度上表示的或来自相对大的集合的值当中的样本，并且将它们转换成在相对小的尺度上表示的或来自相对小的集合的样本(其可以被称为量化等级）的过程。例如，量化可以指的是将有效连续的变量(例如，连续变量的数字近似)转换成限制于大体上离散的等级的集合的变量的过程。变换和量化使空间冗余能够被利用，如在变换域中，许多样本量化为零或至少量化为比其本在空间域中更小的值，因此增加了表示样本的零或小量值的值的数量，并且因此进一步降低了比特率。
[0036] 编码器6也可以包括耦合至预测编码模块18的比特率控制器21。比特率控制器21 被配置为针对已编码的比特流设置一定的目标比特率或"比特预算"，例如，将被花费在对给定的帧或帧的部分进行编码上的目标比特数。可以基于网络10上的可用带宽、或发射机8 的上行链路带宽、或其上运行有编码器6的处理器的处理资源、或这些因素的任何组合来设置这种预算。编码器6因此在每单位时间内具有可用于对视频信号的给定部分(例如，给定的帧或帧的部分)进行编码的一定数量的比特。比特率控制器21被配置为调整编码的一个或多个参数以尝试尽可能接近地满足比特率目标(可能允许某些误差幅度）。例如，比特率控制器可以调整量化粒度和/或

完整全部详细技术资料下载

当前第2页1 2 3 4 5