用于4K和8K应用的多级视频压缩、解压缩和显示的制作方法

文档序号：11162236阅读：910来源：国知局

本国际申请要求于2014年7月16日提交的美国临时专利申请No.62/025,365、于2014年12月29日提交的美国临时专利申请No.62/097,255以及于2015年4月21日提交的美国临时专利申请No.62/150,436的优先权，每个题为“MultilevelVideoCompression,DecompressionandDisplayfor4Kand8Kapplications”，发明人AngelDeCegama。这些申请中的每个通过引用完全并入本文，如同单独地并入。版权声明该申请包含受美国(18U.S.C.)和其他国家的版权法保护的材料。
技术领域：
本申请涉及视频压缩、传输、解压缩和显示。特别地，本发明涉及用于预处理和后处理视频信息的新装置和方法。更特别地，本发明涉及使用基于Haar小波的方法结合计算机实现的压缩和解压缩的装置。
背景技术：
：视频通信系统正在被越来越多的数据量淹没，并且当前的视频压缩技术几乎不能跟上计算机、电缆系统、移动装置和电视机的日益增长的需求。在整个世界中，在有线和无线通信网络上的视频数据业务迅速增加，这正在耗尽它们的物理能力，同时针对数百万用户的服务质量相应下降，特别是现在随着4K和8KUHD多媒体内容的引入。当前的暂时解决方案仍是提供大量基础设施投资，包括为城市和农村地区服务的广泛的电缆网络。然而，这种系统需要大量的基础设施、投资和时间。因此，出于商业原因，电缆提供商可能不愿意投入大量的资金来安装电缆基础设施。另一种当前的解决方案是安装用于视频内容的分发的光纤系统。尽管与电缆系统相比，光纤系统可以增加信息量，但是光纤系统遭受需要大量安装、修理和维修的类似问题。出于与电缆提供商的那些类似的商业原因，光纤供应商可能不愿意投资为农村或人口稀少地区服务所需的大量资金。另外，尽管电缆和光纤系统可以提高效率，但存储、发送和显示视频信息的成本相当高。因此，其他当前系统涉及编解码器的使用以在传输之前压缩视频和其他信息。当前使用了许多这样的编解码器。技术实现要素：尽管电缆和光纤系统的速度和容量都有了提高，但是这两个系统都受限于通过它们馈送的数据的压缩级别。随着内容提供商正在创建越来越多类型的视频信息，迫切需要提供对视频内容的常规处理、传输和显示的替代方案。这些问题通过相对廉价的移动装置(包括移动电话、膝上型计算机、和台式计算机等)在世界范围内的扩散而多方面地增加。移动装置针对常规电缆或光纤系统提出了特别困难的问题，并且随着无线通信的世界范围内的扩散，迫切需要替代方案。这里提出了基于先进技术的新解决方案，其允许在任何给定时间存在的通信基础设施在遥远的未来提供高质量的服务。这些解决方案包括方法的数学描述，以提高任何编解码器的视频压缩能力若干倍，而没有降低由编解码器本身单独产生的视频质量。4K/8KUHD内容本文提出的解决方案还解决了针对开始出现的新的4K超高清晰度(UHD)电视机产生超过高清晰度(HD)的1080p分辨率的内容的问题。这样的4K电视机通常使用输入到电视的现有蓝光盘的1080p内容，其具有将这样的输入“升级(upscale)”(使分辨率加倍)到4K的内部电路。取决于4K电视的质量，这种升级使用简单的技术，诸如像素复制和数学插值，具有相对于真实4K分辨率的相应视觉质量损失。本文提出的新方法针对感兴趣的个人和组织解决了这一质量问题。即使目前几乎没有针对8K内容的需求，本文提出的解决方案也可以以逐像素的相同展示的数学精度从4K内容创建8K内容。用于互联网递送的4K内容的压缩Netflix指示出4K内容的流式传输将需要至少15Mpbs。本文提出的解决方案可以提供小于2Mbps(在大多数情况下实际上约为1.5Mbps)的4K内容。使用本文提出的方法和装置，可以以1Mbps递送1080p分辨率，并且可以以0.15Mbps递送高质量的智能手机视频。应用存在许多类型的新技术的应用。它们包括：1.4K电视制造商，其中可以使用内部硬件(诸如某些4K电视机型中的Netflix播放器)来执行软件实现；2.4K手提电脑制造商，包括东芝、联想等，其中，通过使用快速和高效的计算机实现的方法，快速和高效的处理是期望的；3.机顶盒制造商在：a.蓝光播放器和降低了电视成本的4K电视之间，以及b.电缆公司盒和4K电视之间实现了新的方法和装置；4.Dongle制造商可以驱动4K电视无线地显示，并从任何地方接收高度压缩的视频；5.内容提供商(包括Netflix等)可以大幅降低用于4K显示器以及用于任何其他分辨率的视频递送成本。6.电缆盒和产生显着成本降低的60fps的视频流装置的芯片制造商，诸如STMicroelectronics等。7.内容创建者可以立即使用1080p分辨率来控制至观看者的4K内容递送的成本；8.用于安全的个人和组织使用的视频通信；9.政府应用；以及10.8K应用。本发明的方面解决了在有线和无线通信网络上快速增加的视频数据业务的问题，其耗尽了他们的物理能力，具有服务质量相应下降。随着4K和8K超高清晰度(“UHD”)多媒体内容的引入，当前可用的临时解决方案一直是对电缆、光纤和其他类似技术进行大量基础设施投资。不幸的是，这种投资是非常昂贵的，并且破坏在施工现场的区域中的居民生活。这样的基础设施发展与那些没有接入固定电缆或光纤提供商的人不相关。最近，我已经公开了使用Haar小波变换的某些计算机实现的方法。那些公开内容可以在美国专利No.8,031,782、No.8,503,543、PCT申请No.PCT/US2009/04879、美国专利申请No.61/190,585和美国专利申请No.13/958,945中被找到。这些专利和专利申请中的每个的内容通过引用完全并入本文。我现在采取了全新的方法来解决这个问题。新的解决方案基于新颖的计算机实现的处理步骤的应用，后者基于新的数学原理。这些解决方案将任何编解码器的视频压缩能力提高了几倍，而没有由编解码器本身单独产生的视频质量的降低。涉及的处理包括在将原始视频文件的视频帧传递到给定编解码器之前该原始视频文件的视频帧的准备。编解码器然后以其通常的方式处理接收到的帧以产生比没有初始处理的小得多的压缩视频文件。然后可以存储和/或发送压缩的视频文件。针对解压缩和回放，编解码器以其通常的方式解压缩该压缩的视频帧，并且然后将其传递到重建视频文件的后处理装置，当被显示时，该视频文件具有非常高的质量，其与在不使用预处理和后处理步骤的情况下仅由编解码器产生的质量相比是无差别的，但是处于高得多的比特率。附图说明本发明参考其具体实施例进行描述。参考附图可以理解本发明的其他特征，其中：图1A-图1C描绘了根据一个实施例的视频预处理。图1A描绘了在顶部示出的原始帧100具有像素的列和行，其中一些被标记。如图1B中示出的，应用小波变换。图1B描绘了执行水平小波变换110的实施例。如图1C中示出的，应用小波变换。图1C描绘了执行垂直小波变换120的实施例。图2A-图2C描绘了根据其中发生单级预处理和后处理的实施例的视频后处理。图2A描绘了视频解码器的输出200(pFrameIn)。图2B描绘了已使用逆小波变换(“IWT”)按行来解压缩的视频帧210(Img)。图2C描绘了按列来解压缩的视频帧220(pFrameOut)。图3A-图3E描绘了根据其中发生两级分辨率(压缩和解压缩)的实施例的视频后处理。图3A描绘了视频解码器的输出300(pFrameIn)。图3B描绘了按行的第一级逆小波变换(IWT)310(Img)。图3C描绘了按列的第一级IWT320(FrameOut)。图3D描绘了完成的第一级IWT并输入到第二级IWT330中(FrameIn＝FrameOut)。图3E描绘了按行的第二级IWT340(Img)。图3F描绘了按列的第二级IWT350(pFrameOut)，导致了两级分辨率。具体实施方式定义如本文使用的，术语“算法”是指在计算机中实现的操作步骤的数学描述，该计算机已经被专门编程以执行和实现该步骤。术语“一”和“一个”是指一个或多个。术语“包括了”是指“包括但不限于”。术语“由...组成”是指“包括并且限于”。术语“基本上由...组成”是指“包括字面上的元素及其等同物”。术语“专用计算机”是指被编程为执行和实现根据小波变换的包括预处理、压缩、传输、解压缩和传输的技术步骤的计算机装置。专用计算机还可以包含多个当前视频编解码器中的一个。术语“HD”是指高清晰度。术语“HWT”是指Haar小波变换。术语“UHD”是指超高清晰度。术语“WT”是指小波变换术语“IHWT”是指“逆Haar小波变换”。术语“变换”是指基于输入的输出图像或其部分的创建。术语“预处理器”是指被特别编程为根据HWT来执行处理的初始步骤的计算机模块，并且包括用于使用HWT来压缩视频帧的编程指令。如本文使用的，术语“帧预处理”、“帧尺寸预处理”和“帧尺寸减小”是指根据本发明的方面使用HWT来减小视频图像或视频帧的尺寸的处理。如此产生的帧也被称为“减小的帧”。术语“后处理器”是指被特别编程为使用逆HWT来执行发送的视频表示的解压缩的计算机模块。如本文使用的，术语“帧后处理”、“帧尺寸后处理”和“帧扩展”是指其中根据本发明的方法使用IHWT来扩展图像以产生高质量图像的处理。这样的帧也可以被称为“扩展帧”。应当理解，“扩展帧”可以是指在没有任何“预处理”、编码压缩和编解码器解压缩的情况下被扩展的图像。如本文使用的，当在视频信息的上下文中使用时术语“视频图像”具有与“视频帧”相同的含义，并且术语“图像”具有与“帧”相同的含义。术语“编解码器”是指用于编码和解码信息的计算机化方法，并且如应用于本发明的，是指大量不同的编解码技术，包括MPEG-4、H-264、VC-1以及用于美国专利号：7,317,840中公开的视频压缩/解压缩的基于小波的方法，该美国专利的内容通过引用完全并入本文。如应用于存储装置的术语“物理计算机可读介质”或“物理介质”包括软盘、光盘(CD)、磁带、纸张、闪存驱动器、穿孔卡或其上包含指令的其他物理实施例，该指令可以由计算机装置来检索并且使用被编程为根据本发明的方法来操作的专用计算机来实现。“非物理计算机可读介质”或“非物理介质”是指可以由计算机系统电子地接收并由计算机处理器存储和实施的信号。预处理本发明的预处理方法可以导致针对一级变换的1/4的帧的尺寸减小或者针对二级变换的1/16的帧的尺寸减小，等等。这可以在给定视频序列中针对所有帧而进行。然后，减小的帧被用于创建新的视频文件，例如以.avi格式。可以理解，也可以使用其他文件格式，包括例如OG3、Asf、QuickTime、RealMedia、Matroska、DIVX和MP4。然后将该文件输入到选择的任何可用的编解码器，并且由编解码器遵循其标准程序将该文件压缩到以下尺寸，该尺寸典型地从在没有帧尺寸减小的步骤的情况下获得的压缩尺寸的20％(一级WT)变动到小于10％(二级或多级WT)。这样的文件可以以非常显着的成本节省来存储和/或发送。通过与编解码器适当地对接，这样的过程可以逐帧地执行，而不必创建中间文件。图1描绘了根据实施例的视频预处理。图1A描绘了在顶部示出的原始帧100具有像素的列和行，其中一些被标记为：y0、y1、y2...yn-1和yn。如图1B中示出的，应用Haar小波变换，其中执行水平小波变换110。一些像素被标记为：y0、x0、x1、x2...xn-1和xn。如图1C示出的，应用Haar小波变换，其中执行垂直小波变换120。一些像素被标记为：y0、x0、x1…xn-1和xn。后处理针对每个帧的解压缩，以其正常方式使用编解码器，并且获得尺寸约等于原始未压缩文件尺寸的1/4(一级WT)或1/16、1/64等(两级或多级WT)的文件(例如，以.avi格式)。最后一步是生成文件，其中所有帧都是全尺寸，其中文件尺寸与原始未压缩的文件的尺寸相同。本文描述了用于实现相对于由没有初始帧尺寸减小的编解码器产生的解压缩帧的无质量损失的方法和系统。该步骤可以逐帧完成，而不产生中间文件，进一步提高了处理的效率。图2描绘了根据其中发生单级预处理和后处理的实施例的视频后处理。图2A描绘了视频解码器的输出200(pFrameIn)。图2B描绘已使用逆Haar小波变换(“IHWT”)按行来解压缩的视频帧210(Img)，并且图2C描绘了按列来解压缩的视频帧220(pFrameOut)。图3描绘了根据一个实施例的视频后处理，其中发生两级分辨率(压缩和解压缩)。图3A描绘了视频解码器的输出300(pFrameIn)。图3B描绘了按行的第一级逆小波变换(IWT)310(Img)。图3C描绘了按列的第一级IWT320(FrameOut)。图3D描绘了完成的第一级IWT并输入到第二级IWT330中。(FrameIn＝FrameOut)图3E描绘了按行的第二级IWT340(Img)，并且图3E描绘了按列的第二级IWT350(pFrameOut)，导致了两级分辨率。可以理解，一系列帧可以被预处理、压缩、发送、解压缩、后处理和实时显示，从而产生高质量视频，诸如电影或直播。因为可以非常快速地执行预处理、压缩、解压缩、后处理中的步骤，所以可以实时地观看再现的视频(例如，电影或直播)。应当理解，帧扩展可以被应用于任何输入图像(无论是被预处理的、被编解码器压缩的、被编解码器扩展的还是被其他处理的)以产生尺寸大于输入图像的尺寸的高质量视频图像。方面的描述本发明的方面基于小波变换(WT)的数学。本发明的实施例涉及将给定视频帧的抽取的WT在尺寸和内容上下降一个或多个级别，并且仅保留每个级别的低频部分。本发明的实施例包括用于减少存储包含了视频图像的电子文件所需的空间量的新系统和方法。应当理解，在不脱离本发明的情况下，本文描述的方面及其部分可以以任何组合被使用，并且如适当地以任何顺序被使用。在某些实施例中，视频文件的帧由本发明的方法和系统使用WT或HWT来预处理以将其尺寸减小4、16、64或甚至进一步的倍数。然后应用视频编解码器来进一步压缩显著地减小的尺寸的帧，以产生显著地小于没有使用帧预处理的文件的压缩文件。在一些实施例中，可以以类似的方式处理视频文件的所有帧以产生压缩文件或一系列压缩文件。然后可以在解压缩之前存储和/或发送压缩文件。在后处理中，处理步骤可以以其原始尺寸或具有高质量的更大尺寸恢复一个或多个独立视频帧。这通过在编解码器解压缩步骤之后可以使用的本发明的另一方面来实现。因此，在某些方面，本发明提供了一种用于视频图像压缩和解压缩的系统或装置，包括：第一计算机模块，用于使用直接小波变换(WT)或Haar小波变换(HWT)进行图像帧预处理；视频编解码器；第二计算机模块，用于使用WT或HWT的低频部分以及在WT或HWT之前的原始图像的每行和每列的第一个或最后一个像素进行图像帧后处理；以及输出装置。在其他方面，本发明提供了一种系统，其中第一计算机模块包括：输入缓冲区，用于存储视频图像帧；存储器装置，其存储用于帧预处理的指令，其中所述指令基于直接WT或HWT；处理器，用于实现用于帧预处理的所述指令；以及输出。在进一步的方面，本发明包括系统，其中所述第二计算机模块包括：输入缓冲区；存储器装置，其存储用于帧后处理的指令，其中所述指令基于使用WT或HWT的低频部分加上在WT或HWT之前的原始图像的每行和每列的第一个或最后一个像素；处理器，用于实现用于帧后处理的所述指令；以及输出。在更进一步的方面，本发明提供了进一步包括用于存储所述视频图像的后处理帧的另一存储装置的系统。在其他方面，本发明的系统包括用于使用抽取的WT或HWT并保留所述抽取的WT的低频部分并丢弃抽取的WT或HWT的高频部分进行帧预处理的指令。在仍然其他方面，本发明的系统包括用于通过使用WT或HWT的低频部分以及在WT或HWT之前的原始图像的每行和每列的第一个或最后一个像素并使用IWT或IHWT来重建输入图像来进行帧后处理以重建后处理帧的指令。在其他方面，本发明的系统包括用于帧后处理的指令，用于通过使用WT或HWT的低频部分以及在WT或HWT之前的原始图像的每行和每列的第一个或最后一个像素来重建完整尺寸的后处理帧。在进一步的方面，本发明提供了一种用于预处理视频图像帧的集成计算机装置，包括：计算机存储模块，其包含用于根据抽取的WT或HWT进行帧预处理的指令；以及处理器，用于通过保留低频部分并丢弃高频部分来处理所述抽取的WT或HWT。在额外的方面，本发明提供了一种用于对视频图像帧进行后处理的集成计算机装置，包括：计算机存储模块，其包含用于使用WT或HWT的低频部分以及在WT或HWT之前的原始图像的每行和每列的第一个或最后一个像素进行帧后处理的指令；以及处理器，用于处理所述计算以重建全尺寸视频图像。在更进一步的方面，本发明提供了一种计算机可读介质，包括：介质；以及其上的指令，用于使用WT或HWT来对视频帧进行预处理。在仍然额外的方面，本发明提供了一种计算机可读介质，包括：介质；以及其上的指令，用于使用WT或HWT的低频部分加上在WT之前的原始图像的每行和每列的第一个或最后一个像素来对减小的视频帧进行后处理以重建原始尺寸的视频帧。在其他方面，本发明提供了一种在没有预处理的情况下使用IHWT进行帧扩展的方法和装置。在仍然其他方面，本发明提供了一种用于在没有预处理或编解码器解压缩的情况下使用IHWT进行帧扩展的方法和装置。在进一步的方面，本发明提供了一种用于在没有预处理、编解码器压缩或编解码器解压缩的情况下使用IHWT进行帧扩展而的方法和装置。在这些上述方面的某些中，计算机可读物理介质是磁盘、光盘(CD)、磁带、纸张或穿孔卡。在本发明的方面中，使用了HaarWT。在本发明的其他方面，可以使用Daubechies-4、Daubechies-6、Daubechies-8、双正交或不对称小波。本发明的系统可以实时地提供视频图像的高质量再现。在一些方面，系统可以提供超过50％的存储空间减少。在其他方面，系统可以提供超过50％的传输成本减少，其中几乎没有可察觉的视觉质量的损失。在其他方面，本发明的系统可以提供70％至80％的存储成本减少。在额外的方面，与编解码器单独的压缩、传输和解压缩相比，本发明的系统可以提供70％至80％的传输成本减少，其中很少或没有可察觉的视觉质量损失。在其他方面，本发明提供了一种用于产生对象的视频图像的方法，包括以下步骤：a.提供所述对象的数字化图像帧；b.提供所述数字化图像帧的抽取的WT或HWT；c.丢弃所述抽取的WT的高频分量，从而产生预处理的帧；d.使用产生压缩的视频帧的视频编解码器来压缩所述预处理的帧；e.使用所述编解码器来解压缩所述压缩的视频帧；并且f.利用使用了WT或HWT的低频部分以及在WT或HWT之前的原始图像的每行和每列的最后一个像素的后处理来重建所述帧的全尺寸图像。在其他方面，本发明的方法在上述步骤d之后提供将所述压缩图像发送到远程位置的步骤。在仍然其他方面，本发明提供了一种方法，还包括在视频监视器上显示所述全尺寸图像。在这些方面的某些中，本发明提供了一种方法，还包括第二级预处理步骤。在这些方面的其他方面，本发明提供了一种方法，还包括预处理的第二级步骤和第三级步骤。在这些方面的其他方面，本发明包括一种方法，还包括帧尺寸扩展的第二级步骤和第三级步骤。在某些实施例中，本发明包括一种方法，其中编解码器选自由MPEG-4、H264、VC-1、H265和DivX组成的群组。在其他实施例中，本发明包括一种方法，其中所述编解码器是基于小波的编解码器或任何其他类型的编解码器。在某些方面，本发明的方法可以实时地提供视频图像的高质量视频再现。在一些方面，方法可以提供超过50％的存储空间减少。在其他方面，方法可以提供超过50％的传输成本减少，其中几乎没有可察觉的视觉质量的损失。在其他方面，与编解码器单独压缩、传输和解压缩相比，存储空间减少可以超过70％至80％，其中几乎没有视频质量的减少。某些方面包括用于对视频图像帧进行预处理的计算机装置，包括：输入端；计算机存储模块，其包含用于根据抽取的HaarWT对由所述输入端接收到的视频帧进行帧预处理的指令；处理器，用于通过保留低频部分并丢弃高频部分来处理所述抽取的WT；以及输出端；用于预处理的所述指令包括以下步骤：i.针对所有行i，将第一个像素存储在原始帧W0(i,0)的第一个元素中，并计算HWT的所有低频值并将它们存储在帧W0(i,j)中；并且ii.针对每个帧W0(i,j)的所有列j，将第一个像素存储在帧W(0,j)的第一个元素中，并计算HWT的所有低频值并将它们存储在帧W(i,j)中。额外的方面包括用于对视频图像帧进行后处理的计算机装置，包括：输入端；计算机存储模块，其包含用于使用HaarWT的低频部分进行帧后处理的指令，使用以下步骤：处理器，其被编程为执行以下步骤；i.针对帧Wx(i,j)的所有行i，将第一行复制到F0(0,j)＝Wx(0,j)；ii.针对所有列j，计算下一行F0(1,j)＝(2*Wx(1,j)+F0(0,j))/3；iii.针对所有列j，计算下一行F0(2,j)＝(2*Wx(2,j)-F0(1,j))/3)；iv.针对所有列j，计算下一行F0(3,j)＝2*Wx(2,j)-F0(2,j)；v.针对所有列j，类似地计算后续行；vi.将F0(i,j)的第一列复制到F(i,0)，F(i,0)＝F0(i,0)vii.针对F0(i,j)的所有行i，计算下一列F(i,1)＝((2F0(i,1)+F(i,0))/3；F(i,2)＝((2F0(i,2)+F(i,1))/3；F(i,3)＝((2F0(i,2)-F(i,2))；viii.针对所有列j>3，类似地计算后续列；并且ix.存储计算出的像素。其他方面包括用于视频图像压缩和解压缩的系统，包括：先前方面的用于图像帧预处理的第一计算机模块；视频编解码器；先前方面的用于图像帧后处理的第二计算机模块；以及输出装置；所述第一计算机模块或所述第二计算机模块是从由大型计算机、台式计算机、个人计算机、膝上型计算机、平板计算机、无线计算机和蜂窝电话组成的群组中选出的可编程处理装置。额外的方面包括计算机可读介质，包括：物理介质；以及其上的根据先前方面的对视频帧进行预处理的指令。仍然额外的方面包括计算机可读介质，包括：物理介质；以及其上的根据先前方面的对减小的视频帧进行后处理的指令。又进一步的方面包括前述方面的计算机可读介质，所述介质选自由软盘、光盘(CD)、磁带、纸张、闪存驱动器、穿孔卡、磁盘、可拆卸闪存装置和计算机处理器存储缓冲区组成的群组。另外，方面包括前述方面的系统，所述后处理器模块还包括两个过滤器，用于从由Y、U、V、R、G或B组成的群组中选择。进一步的方面包括一种用于产生对象的视频图像的方法，包括以下步骤：a.提供所述对象的数字化图像帧并将所述数字化图像帧存储在计算机处理器的存储器装置中；b.提供所述数字化图像帧的抽取Haar小波变换(WT)；c.丢弃所述抽取的WT的高频分量，从而根据以下步骤产生预处理的帧；i.针对所有行i，将第一个像素存储在原始帧W0(i,0)的第一个元素中，并计算HWT的所有低频值并将它们存储在帧W0(i,j)中ii.针对每个帧W0(i,j)的所有列j，将第一个像素存储在帧W(0,j)的第一个元素中，并计算HWT的所有低频值并将它们存储在帧W(i,j)中d.将每个帧W(i,j)传递到视频编解码器e.使用视频编解码器来压缩所述预处理的帧，从而产生压缩的视频帧；f.使用所述编解码器来解压缩所述压缩视频帧；并且g.通过执行以下步骤利用使用了WT的低频部分和在WT之前的原始图像的每行和每列的最后一个像素的后处理来重建所述帧的全尺寸图像：i.针对帧Wx(i,j)的所有行i，将第一行复制到F0(0,j)＝Wx(0,j)；ii.针对所有列j，计算下一行F0(1,j)＝(2*Wx(1,j)+F0(0,j))/3；iii.针对所有列j，计算下一行F0(2,j)＝(2*Wx(2,j)-F0(1,j))/3)；iv.针对所有列j，计算下一行F0(3,j)＝2*Wx(2,j)-F0(2,j)v.针对所有列j，类似地计算后续行；vi.将F0(i,j)的第一列复制到F(i,0)，F(i,0)＝F0(i,0)vii.针对F0(i,j)的所有行i，计算下一列F(i,1)＝((2F0(i,1)+F(i,0))/3；F(i,2)＝((2F0(i,2)+F(i,1))/3；F(i,3)＝((2F0(i,2)-F(i,2))；viii.针对所有列j>3，类似地计算后续列；并且h.显示帧F(i,j)。又一额外的方面包括前述方面的方法，包括单级帧尺寸减小。额外的方面包括前述方面的方法，还包括第二级帧尺寸减小。又一额外的方面包括前述方面的方法，还包括第三级帧尺寸减小。又一额外的方面包括前述方面的方法，包括单级帧尺寸扩展。仍然额外的方面包括前述方面的方法，还包括第二级帧尺寸扩展。仍然进一步的方面包括前述方面的方法，还包括第三级帧尺寸扩展。额外的方面包括如本文描述的系统。又进一步的方面包括如本文所描述的方法。在诸如安全、远程学习、视频会议、娱乐和远程医疗等领域中存在大量的视频压缩应用。实施例的描述以下描述和示例旨在说明本发明的方面，并且不旨在限制本发明的范围。本领域技术人员可以使用本文的公开内容和教导来创建其他实施例。在实施例中，一般描述包括根据流程图或伪代码或本文公开的源代码的编程。因此，这些实施例仅表示用于实施本发明的某些具体实施例。更一般地，本文公开的数学描述表示用于以基本上相同的方式实施本发明来实现基本上相同的功能以实现基本上相同的结果的许多基础。除了描述的流程图或描述的伪代码或描述的源代码之外，实现数学公式的额外方式每个都被认为是执行本发明的等同方式。那些实施例及其等同物中的每个都被认为是本发明的一部分。实施例的一般描述我已经开发了OpenCL/GPU计算机辅助应用程序和数学方法的实现。这种实现的示例的编程步骤的高级细节如下：A.视频预处理1.水平减小帧尺寸：针对每行保存第一个像素y0和所有像素的低频HWT。2.垂直减小帧尺寸：针对得到的细长帧的每列，保存第一个像素y0和所有像素的低频HWT。这些步骤可以针对更多级别的减小被重复，但是一个级别适合于许多用途。可以理解，上述两个预处理步骤可以以任何顺序被执行。B.视频后处理1.获得编解码器解压缩帧的中间低频HWT分量，如所需帧速率的不同版本的方法部分中指示出的。2.垂直增加帧尺寸：针对在步骤1中获得的帧的每行，通过应用描述的方法的公式来计算更高分辨率帧的接下来两行的像素，即，例如从y1我们得到y2和y3，其中y2＝((2x1+y1)/3)和y3＝2x1-y2，其中y1、y2和y3对应于沿着三行移动的每列的像素。在涉及主机CPU和多并行GPU视频卡(诸如可以使用OpenCL/CUDA编程的NVIDIAGTX980卡)的任何现代异构架构中，可以同时并行计算所有这样的行。3.水平增加帧尺寸：针对得到的细长的较高分辨率帧的每行，计算在先前计算出的像素之后的较高分辨率帧的两列的像素。例如，沿着每行的像素移动，从y1我们得到y2＝((2x1+y1)/3)和y3＝2x1-y2，从y2我们得到y4＝((2x2+y3)/3)和y5＝2x2-y4等等。使用如步骤2中的OpenCL/CUDA编程，所有行可以在具有由多并行视频图形卡组成的GPU和主CPU的硬件架构中并行地同时进行。可以理解，上述两个后处理步骤可以以任何顺序被执行。多级视频压缩、解压缩及其在HD和UHD中的应用本文提出的方法背后的数学原理或方式是小波变换(WT)或Haar小波变换(HWT)的那些。这是重要的，这是因为已经展示了人类使用WT的基本概念来在他们的大脑中处理所有感觉信息，特别是需要大量压缩的视觉信息。这种压缩涉及丢弃从人类感知的观点来看不相关的所有数据。用于视频数据预处理和后处理以与任何给定视频编解码器一起使用而不以任何方式修改编解码器的这种新方法是用于HD和UHD视频的下面的表1中示出的非常典型结果的基础。表1：视频编解码器压缩能力的提高(在不损失任何给定编解码器的视频质量的情况下)用于MPEG-4、H-264、VC-1的典型结果视频HD1080p比特率4KUDH比特率电影1Mbps1.5Mbps自然1Mbps1.5Mbps体育1.1Mbps1.75Mbps这些结果指示出，该技术可以大幅降低包括高清晰度和超高清晰度视频的高质量视频的存储和传输的当前成本。此外，现有基础设施可以被用于显着增加付费客户的数量，而不降低服务质量。这些显着的业务改进结果可以被实现而不干扰由任何组织当前使用的编解码器。所有需要的是将该技术的预处理和后处理模块在如下图中示出的现有处理序列中的插入。可编程计算机实现的方法的描述下面的描述表示使用Haar小波变换(HWT)来实现改进的预处理和后处理的方式。在将原始未压缩视频的视频帧传递到被用于额外视频压缩的任何视频编解码器之前，对其进行预处理。预处理包括首先水平地按帧的像素的行并且然后垂直地按帧的像素的列来取得每个视频帧的HWT的低频分量(图1A-1C)。可替换地，可以首先垂直地按帧的像素的列并且然后水平地按帧的像素的行来取得每个视频帧的HWT的低频分量给定的视频编解码器然后逐帧地压缩由预处理的帧组成的用于存储或传输的视频，并且然后其解压缩现在非常接近于编解码器之前的预处理帧的这样的帧。所述方法然后对来自解码器的接收到的帧进行后处理，并产生用于显示的视觉上与原始视频帧无法区分的帧(图2A-2C和3A-3E)。在视频帧的显示之前的最后后处理之前取得特定行或列，其具有以下结构。x0、x1、x2、x3、…xn，其中其中yi表示像素值。后处理的目的是从x值恢复原始像素y0、y1、y2、y3、…y2n、y2n+1。如果我们有HWT的高频分量，则这样的像素可以被准确地恢复。这种方法正是如此。首先，我们有：y1＝2x0–y0且x1＝(y2+y3)/2，其定义了低频HWT分量H1＝y2–y3)/2，其定义了高频HWT分量。然后，y2+y3＝2x1且y2-y3＝2H1使这两个等式做加法，我们得到：2y2＝2x1+2H1使它们做减法，我们得到：2y3＝2x1–2H1为了找到H1，我们首先定义y2的近似，其是代替准确的逆WT，其是：我们有以上近似：其给出了3(y2)’＝2x1+y1。然后由于y2的实际值由给出，所以我们可以通过下式从(y2)’获得y2：这给出了2y2＝2(y2)’–y1+3y2-2x1且简化后我们得到并且实际值为：其确认了初始估计的选择。因此，y3＝2x1-y2因此，给定y1，我们可以计算从以下获得的y2和y3的高频HaarWT分量H1y2＝x1+H1且y3＝x1-H1其中且此外，H1＝y2-x1，基于上述结果，其变为因此，我们可以使用基于先前像素值的有效方法从它们的低频HaarWT值获得给定视频帧的任何行或列的实际像素值yi。如果我们有以下描述的y1，则我们得到y2＝(2x1+y1)/3，y3＝2x1-y2，y5＝2x2-y4，y7＝2x3-y6等。关于y1，从y0计算第一个像素y1＝2x0-y0以及相应行或列的HaarWT的第一低频分量。y0是给定的，这是因为它是从原始帧保存的。使用该方法解压缩的视频帧的PSNR值的计算验证了该算法的精度。这种PSNR结果在下面被提出。不同版本的方法可以如从每行和每列的第一个像素和每行和每列的低频HaarWT中指示出的那样计算最终分辨率帧。可以进行额外步骤以便获得每秒帧数(fps)的不同值。如果原始输入视频的fps是可接受的，则不需要额外的步骤。如果更高的fps是所期的以增强快速运动视频的感知视频质量，则需要额外的处理步骤来生成相应的fps。这种处理步骤由在连续的给定帧之间计算具有低频HWT分量的中间帧组成。1.双帧速率：给定在相同帧位置中具有特定xi的两个已知连续帧，例如x1和x2，可以使用以下表达式来获得这种帧位置中的中间帧的低频HWT分量y1：y1＝((x2-x1)/2)+x1，然后将描述的方法应用于每行和每列中的新的中间帧HWT值的较高分辨率帧。2.三倍帧速率：类似地，可以在两个连续帧之间添加两个更多的中间帧，其中特定xi在每个帧位置中，给定例如使用以下表达式来获得特定帧位置的原始x1和x2值：y1＝((x2-x1)/3)+x1且y2＝x2-((x2-x1)/3)3.四倍帧速率：类似地，可以在两个连续帧之间添加具有yi值的三个更多的帧，其中使用以下表达式来获得特定帧位置中的xi值，例如x1和x2：y1＝((x2-x1)/4)+x1，y2＝((x2-x1)/2)+x1，y3＝x2-((x2-x1)/4)等等。这种版本的方法被大量地测试，并且验证其计算效率和期望的后处理视频的质量。使用Haar小波变换的视频处理的伪编码A.预处理下面的伪代码表示预处理视频的数学方式的应用的示例。将每个帧W(i,j)传递到视频编解码器B.后处理下面的伪代码表示后处理视频的数学方式的应用的示例。从视频编解码器接收解压缩的帧W(i,j)。如果需要所期帧速率，则从连续的W(i,j)帧生成中间帧Wx(i,j)将F0(i,j)的第一列复制到F(i,0)F(i,0)＝F0(i,0)针对F0(i,j)的所有行i，在电视机上显示帧F(i,j)。变换等级和压缩范围通过将预处理和后处理的级别增加再多一个级别，压缩率可以随着级别数量的每次增加而加倍。例如，针对2级，针对HD1080p的压缩率降至0.5Mbps，并且针对4KUHD的压缩率降至小于1Mbps。视频质量没有受到可察觉的损失。实现效率使用对应于16比特/字的64比特/像素(颜色分量)，使用并行化数字计算结构来获得本文提出的所有新的视频压缩结果。这就是为什么由于计算的精度而造成后处理的视频质量如此之高。应用于4K和8KUHD视频由于计算和存储要求，所以当前缺少4K和8K内容。然而，本描述可以通过考虑例如描述的用于4K的后处理方法来生成具有适当质量的这样的内容。我们已经看到，在最终的后处理步骤中，我们从尺寸为1920×1080帧的HD1080p开始，其被认为是尺寸为3840×2160的4K帧的HaarWT的低频分量。本文公开的方法从它们的低频HaarWT精确地计算了4K像素。类似地，通过使再多一个IWT处理级别从4K到8K的高精度，可以从HD内容获得8KUHD内容。当然，并且这样的内容可以容易地由可用的监视器和电视屏幕硬件使用本文提出的预处理和后处理方法来压缩、发送、存储和显示。换句话说，与2013年底在丹麦视频会议中以及2014年1月的拉斯维加斯消费电子展中讨论的数字相比，4KUHD视频需要1.5Mbps并且8KUHD视频需要1.75Mbps。这样的预测指示出4KUHD在几年内大量使用时将需要15Mbps。数学上精确增加任何图像分辨率的理由本文提出的方法提供用于从其低频分量计算逆Haar小波变换的技术，并且可以导致比给定图像更高分辨率的图像的计算，其可以被认为是计算出的更高分辨率图像的低频分量。因此，例如从1080p图像开始，可以精确地计算其低频分量是给定的1080p图像的4K分辨率图像。类似地，可以精确地计算其低频分量是4K分辨率图像的8K分辨率图像。类似地，可以精确地计算16K分辨率、32K分辨率或任何更高级别。这正是在计算多级直接和逆小波变换时任何给定图像发生的情况。这些描述提供了就在2014年所需的高质量视频的更好的视频压缩，其具有相应成本节省和卓越的视频质量。示例以下示例说明了本发明的某些方面，并不旨在限制其范围。相反，本领域普通技术人员可以使用本文的公开内容和教导来产生变型，所有变型都被认为是本发明的一部分。技术人员可以利用本文的教导和公开内容以使用相同的功能和方式或通过进行非实质性的改变来创建视频图像，以产生类似或相同的结果。所有这些都被认为是本发明的一部分。示例1：性能数据基于使用Haar小波变换的数学来计算帧像素的准确值的方法使用结合了所提出的预处理和后处理步骤的H264和H265视频编解码器进行了大量地测试。H265在H264上提供了压缩比的一些改进，但是它更复杂，并且不能被用于典型的便携式装置的实时性能，并且此外，之前使用H264编解码器讨论的方法比H265本身给出了更好的压缩。因此，使用具有上面讨论的预处理和后处理算法的H264视频编解码器获得了以下表2中给出的性能值。表2：公开的处理的性能值视频HD1080p比特率4KUHD比特率电影1Mbps1.5Mbps自然1Mbps1.5Mbps体育1.1Mbps1.75Mbps就PSNR值而言，下面的表3示出了针对上述比特率中的每个、针对不同视频类型重构的帧在单独的编解码器和具有本文公开的方法的编解码器之间的典型分贝(db)值的比较。表3：单独编解码器以及编解码器加上公开的处理的PSNR值示例2：结合软件实现的方法的装置预处理和后处理装置本文公开的方法可以在许多计算机化装置中被实现。计算机化处理步骤可以在预处理器中被实现，其执行抽取和基于Haar小波的压缩。这样的装置可以作为计算机系统的分离的独立部件来制造和提供，并且可以被添加到现有的计算机、移动装置、电视机、电缆盒、机顶盒或类似的这样的装置中。另外，本文公开的方法可以被实现为后处理器，其将来自编解码器的输出进行解压缩。这样的后处理器可以被附加到现有的计算机、电视机、移动装置、电缆盒、机顶盒或类似的装置。本发明包括用于根据本文公开的方法的帧的预处理和后处理的集成装置。预处理装置包含含有用于预处理的指令的存储器区域以及用于执行被包含在该存储器区域中的指令的处理器。这种结合的存储器和预处理装置可以是可单独被制造并且然后被并入视频系统中的集成电路。预处理装置至视频系统中的连接可以包括输入端，其中来自图像捕获装置(例如，相机)的帧可以被输入到预处理装置中。预处理装置的输出端可以被连接到编解码器。可选地，缓冲区可以被包括在预处理装置中。类似地，后处理装置可以包含含有根据本发明的方法的用于后处理的指令的存储器区域，并且还包括用于执行被包含在该存储器区域中的指令的处理器。这种结合的存储器和后处理装置可以是可单独被制造并且然后被并入视频系统中的集成电路。后处理装置至视频系统中的连接允许来自编解码器的解压缩的帧被输入到后处理装置中。出于显示的目的，后处理装置可以被附接到输出装置，诸如例如视频监视器、移动装置屏幕或电视机。缓冲区可以被包括在后处理装置中。示例3：彩色成像关于图像和视频帧，该方法首先被应用于列，并且然后被应用于行。此外，针对彩色图像，该方法可以分别被应用于亮度(Y)和色度(UV)分量。示例4：计算机可读介质计算机可读介质包含存储器区域，其包含用于根据本发明的方法的帧预处理的指令。物理装置包括软盘、闪速存储器、磁带驱动器或其他物理硬件组件。包含在这种装置上的指令可以被传送到外部预处理器以用于被包含在存储器区域中的指令的执行。另一个装置包含存储器区域，其包含用于根据本发明的方法的帧后处理的指令。物理装置包括软盘、闪速存储器、磁带驱动器或其他物理硬件组件。被包含在这种装置上的指令可以被传送到外部后处理器以用于被包含在存储器区域中的指令的执行。在其他实施例中，用于预处理、后处理和显示的编程指令可以使用无线、电缆、光纤或其他介质来发送。可以理解，预处理、编解码器和后处理方法可以被集成在一起以提供可以被并入到计算机、移动装置、电视机、电缆箱或类似装置中的系统。示例5：在大规模并行现代异构计算架构中的实现如今，即使手持移动装置包括使用了并行计算框架的多核平台。计算的计算机实现的原型可以使用OpenCL编程(参考文献5；OpenCLProgrammingbyExamplebyR.BangerandK.Bhattacharyya,2013PacktPublishingLtd.,UK，其全部内容通过引用并入本文)和用于NVIDIA显卡的CUDA语言(参考文献6；CUDAProgrammingbyShaneCook,2013Elsevier,Inc.，其全部内容通过引用并入本文)来开发，以便在便宜的4K电视机上展示用于实时显示4KUHD视频的高效和快速(60fps)处理。因此，除了最小的存储和传输成本以及高感知视频质量之外，低成本实现是该技术的另一个关键优点。这种大规模并行实现是该方法的固有本质的结果，可以被移植到不必具有相同架构或甚至相同供应商的多个装置。总之，这项技术可以使4K和8KUHD视频通信比预测的更早地可访问和可负担。工业实用性本发明的系统和方法可以被用于电信和视频工业中，以允许以降低的成本和具有减少的对计算机存储容量的要求来存储、发送和重放高质量视频。本发明的方面对于视频存储和传输的当前惊人的成本的减少的意义是显着的。参考文献在本申请中上下文列出的每个参考文献和文献的内容通过引用整体完全并入本文。1.TenLecturesonWaveletsbyIngridDaubechies,SocietyforIndustrialandAppliedMathematics.2.ANewWaveletTransformVideoCompressionAlgorithm,IEEE3rdInternationalConferenceonCommunicationsSoftwareNetworkds,2011,ZhangeShu.3.ThreeDimensionalWaveletTransformVideoCompression,1999IEEEInternationalConferenceonMultimedicaComputingandSystems,July1999,L.K.Levy.4.ANewandNovelImageCompressionAlgorithmusingWaveletFootprints,AcademicJournal2005,Vol.14,part6,page17,N.Malmurugan,A.Shamugan,S.Jayaraman,V.V.Dinesh,Chader.5.OpenCLProgrammingbyExamplebyR.BangerandK.Bhattacharyya,2013PacktPublishingLtd.,UK.6.CUDAProgrammingbyShaneCook,2013Elsevier,Inc.当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：安格尔·迪斯伽马;
技术所有人：雅玛兹资讯处理公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。