数据压缩和解压缩系统及方法

文档序号:7577190阅读:353来源:国知局
专利名称:数据压缩和解压缩系统及方法
技术领域
本发明涉及多媒体电话会议系统和方法,并且具体来说,涉及由这样的系统或方法使用的高速图形数据压缩和解压缩技术。
背景技术
在远程会议会场之间建立结合了声音和视觉显示的会议是费时、困难且昂贵的。一种公知的途径是视频与会(conferencing),这种视频与会涉及两个或多个由美国马萨诸塞州的安杜佛(Andover)的Picture Tel Corporation出售的那种类型的电视会议装置。这些装置是非常昂贵的,并且最优用途是支持全动个人对个人视频通信。它们通常采用ISDN线路来实现高速数据通信,这增加了总解决方案成本并且妨碍了系统的机动性。在很多情况下,对于有效的会议,全动视频并非必要。
传输计算机图形(CG)数据是不同种类的问题,相对来讲与视频与会不相关。不过,即使很简单的图形图像的电话传输也是非常浪费时间的。提出者当中的一般做法是显示计算机产生的目视辅助或图像。视频与会系统一般来说不提供用来将演示(presentation)图像与视频传输结合起来的便捷的桌面连通性。相反,可能需要调节视频与会系统,使得它的摄像机对准例如通过计算机显示器或多媒体投影仪来显示的演示图像的屏幕。不过,在实践中,视频与会系统中的分辨率是不够高的,导致了低质量的模糊图像,对于标准文本而言,这种模糊图像通常是无法看清的。
我们还知道,同时使用电话和计算机,与音频电话会议同时地通过计算机网络在本地会场和远程会场之间共享演示素材。按照公知的方法,为语音呼叫(通过电话网络)并且为数据和图像(通过计算机网络)人工建立独立的连接。
其它的数据与会系统使用中心的计算机服务器来构建和管理音频和数据连接。例如,Dunn等人的美国专利US5916302介绍了对数据会议的语音部分使用公共交换电话网络(“PSTN”)并且可通过计算机网络接入的中心服务器计算机来进行数据会议的视频或图像部分的分发。使用Dunn等人的系统的与会者使用个人计算机的Web浏览器软件访问服务器计算机来下载图像。
Watson的美国专利US6233605介绍了一种低带宽远程与会系统,这种系统对音频部分使用PSTN并且对可视部分使用联网的计算机。在开会之前,将代表可视图像的数据分发给会议参加者的计算机。在会议进行期间,一个与会者,即领导,定期向所有计算机发送选择信号,促使他们全部选择所分发的图像之一并且显示该图像。选择信号和电话会议是由单音频电话信道承载的。系统需要在电话会议之前分发代表图像,并且不会提出这种要求,以避免在对各个会场的计算机开始图像数据的下载进行人为干涉。此外,有一些类型的演示是无法预先显示而准备图像的,并且这牵扯到了软件应用程序的交互使用和显示,比如电子制表软件和制图程序。例如,预算计划和审查会话、设计会议以及远程教学可能会受益于在一个或多个会场以软件程序进行交互的能力,以及使软件程序几乎同时地在所有参会会场显示其输出的能力。
虽然很多会议室包括网络连接点,比如以太网的墙壁插座,但是大多数会议室不会保持计算机与网络连接。从而,为在各个会场使用的计算机配置网络连接需要大量的时间。连接网络的时间和困难还会因为使用那些被配置成由其它网络使用或在同一网络内的其它位置使用而没有为在会场使用而进行过配置的膝上型或其它移动式计算机而进一步增加。上面介绍的系统中,没有一种克服了与先于各个数据会议通话在各个会场配置用于与计算机网络相连接的计算机相关的困难。
已经考虑了使用无线互连通技术来减轻与构建多媒体数据与会系统相关的时间和复杂性负担。不过,不管是有线的还是无线的,互连系统传送图像数据比所期望的要慢得多。因此,这样的系统必须包括某种数据压缩和解压缩处理,以在不降低图像质量的前提下,在系统的各个组成部分之间传送图像数据。为了使系统具有适当的“互动性”,压缩和解压缩处理应当能够在一秒或更短时间内在各装置(比如膝上型计算机和视频投影仪)之间传送完整的1024×768像素(“XGA”)图像。
因此,存在着对包含无线高速互连通解决方案和数据与会控制机制的高度交互性与会设备的需求。

发明内容
因此,本发明的一个目的是,提供一种用于在多个装置当中在一秒钟或更短时间之内无线传输高分辨率彩色图像数据的数据压缩和解压缩设备和方法。
本发明的另一个目的是,提供这样一种设备和方法,该设备和方法是察觉不到损耗的,因此,保持了图像质量。
本发明的再一个目的是,提供这样一种设备和方法,该设备和方法使计算资源量最小。
在适于按照本发明的方式使用的数据与会系统中,两个或多个地理上分开的会场中的每一个具有电话接收机和与语音呼叫网络(比如PSTN或PBX)相耦合的数据与会设备。每个会场还具有一个显示装置,比如计算机显示器屏幕或电子投影仪,用于显示由图像源产生的图像数据所构成的图像。为了帮助实现会场之间的图像共享,每个会场的网络接口将数据与会设备的数据会议控制单元连接到独立于语音呼叫网络而链接着会场的数据网络上。
按照一种优选实施方式,数据会议控制单元、电话接收机和网络接口集成在一个数据与会扬声器电话设备中,该扬声器电话设备可以便利地安放在各个会场的会议桌上并且与数据网络无线连接,以帮助实现按照本发明的数据与会。
按照另外的实施方式,数据与会设备是采用在计算机工作站上运行的软件来实现的,该工作站还可以用作显示装置、电话接收机和/或图像源;或者采用作为简化数据与会设备的硬件来实现,这种硬件可以由单独的电话接收机、显示装置和图像源使用。按照本发明的数据与会设备可以包括无线网络连接和自动网络配置例程,用于将图像源(例如主持人的膝上型计算机)无线连接到数据网络。无线连接之间的数据传输速度通过本发明的数据压缩和解压缩得到了提高。
具体来说,本发明的数据压缩和解压缩处理采用双重压缩,来首先压缩数据(比如计算机屏幕图像),并且通过诸如IEEE 802.11b传输介质这样的无线网络传送压缩数据。然后使用双重解压缩对所传输的压缩图像数据进行解压缩,以重构原始的图像。组合的压缩和解压缩技术实现了高性能、高图像质量、良好的压缩,并且是感觉不到有损耗的。所述压缩和解压缩技术可以在虚拟的任何有线或无线通信信道上使用。
在本发明的优选数据压缩处理中,数据源是全屏彩色XGA图像,对其进行处理以获得位图。采用了两步压缩处理来获得所需的数据压缩量。第一步采用颜色转换压缩处理,而第二步采用Lempel-Ziv-Oberhumer(“LZO”)压缩处理,该第二步产生用于通过传输介质进行传输的压缩数据。
在本发明的优选数据解压缩处理中,对由LZO压缩处理得到的压缩数据进行两步解压缩处理。第一步采用LZO解压缩处理,而第二步采用颜色转换解压缩处理,该第二步产生用于还原基本上与原始位图相同的位图的解压缩数据。
要达到一秒等待时间的目标,需要高性能颜色转换。颜色转换一般来说要通过浮点运算来实现。不过一般来说可利用的运算资源是不足的,所以最好采用本发明的高速整型实施方式。采用了RGB到YCrCb共位4:2:0颜色转换来压缩图像数据。按照优选实施方式,输入RGB数据具有4:4:4格式,而输出YCrCb数据是以4:2:0格式产生的。当然,也可以采用其它的格式。高性能是通过采用乘系数整型算法实现的。采用了YCrCb到RGB解压缩处理来重新构成压缩图像。
通过参照附图进行的本发明的优选实施方式的下述详细说明,本发明的其它目的和优点将会变得显而易见。


附图1是简化的数据与会系统的框图,该数据与会系统包括按照本发明的第一优选实施方式的本地和远程数据与会设备;附图2是说明由附图1的系统执行的数据与会方法的流程图;附图3是表示数据与会系统的优选实施方式的网络图,其中本地数据与会设备包括用于与本地能够无线使用的投影仪和本地能够无线使用的图像源装置进行通信的无线联网设备;附图4是附图3的数据与会系统的网络图,其中本地数据与会设备还包括用于与底层结构无线联网接入点进行通信的无线联网硬件;附图5是表示本发明的数据压缩处理的简化功能框图;和附图6是表示本发明的数据解压缩处理的简化功能框图。
具体实施例方式
本申请中使用的专业名词,包括发明内容具体实施方式
和权利要求书部分中的术语,都应具有下述含义,除非由上下文另有明确说明,其中使用了“数据网络”-一种用于传输编码成数字信号的数据的网络,包括,例如,局域网(LAN)、广域网(WAN)、虚拟个人网(VPN)和因特网。数据网络可以包括一个或多个传输数据用的有线、无线或调制解调器传输路径段。路径段还可以包括PSTN、EKS、PBX、蜂窝、PCS、卫星电话和海事电话段。
“显示装置”-用于显示字符和图像的任何装置,包括诸如计算机监视器、光栅显示器之类的直观显示器以及诸如由位于美国俄勒冈州的Wilsonvi1le的InFocus Corporation(本发明的受让人)出售的那种类型的电子投影装置这样的间接显示器,不管它们安装在哪,也不管是否能够与数据网络直接连接。
“DTMF”(双音多频)-按下电话键盘的按键时产生的那种类型的音调,包括12种不同的音调对频率组合(用于一般称为“拨号音”拨号的拨号),以及不可在电话键盘上得到的其它的音调对频率组合。
“图像源”-生成、产生或再现代表一个或多个静止图像或视频帧的数据组或流的装置;图像源的实例包括个人计算机、膝上型计算机、诸如DVD播放器和VCR这样的视频播放装置(具有模拟或数字视频输出)、数码相机(静止或运动图像,包括“网络摄影”)、数字化扫描仪和个人数字助理(PDA)。
“按键”或“输入键”-人机交互装置,比如按钮、开关或能够通过鼠标点击或其它计算机输入动作激活的图形用户界面按钮;或者接收用来启动商谈程序或用来触发系统中的其它事件的一或多位数据的任何其它装置。
“网络装置接入码”或“网络接入码地址”-用于访问数据网络上的装置的任何类型的地址或代码;网络接入码的实例可以包括(不作限定之用)诸如域名、统一资源定位符(URL)、服从IPv4或IPv6(包括具有无等级域间路由(CIDR)的IPv4)的IP地址(包括静态、动态、符号和虚拟地址)和物理地址(例如,以太网地址)之类的网络地址;和/或诸如通话识别码、口令、点心文件(cookies)、密码或密钥以及数字签名之类的通行码。
“POTS”-“简易老式电话系统(plainold telephone system)”的首字母缩写;是一套广泛使用的电话接口和协议标准,它提供世界范围之内的语音电话服务提供方的网络之间的互操作性;POTS网络一般来说包括电路交换电话网络和由其使用的设备,虽然某些分组交换网络也可以与POTS网络连接。
“公共交换电话网络”(PSTN)-一套电话通信资源设备,可由全部公众使用。例子包括提供本地和长途陆基、无线、蜂窝、海事、无线电话和卫星电话服务的资源。
“电话接收机”-能够与语音网络连接的所有类型的装置,用于接收代表语音电信的模拟或数字信号,包括(不作限定)POTS、电话接收机装置、PBX电话接收机装置、EKS电话接收机装置、ISDN电话接收机、VoIP电话、扬声器电话、头戴电话、无线电话手机、蜂窝或PCS电话、带有电话仿真软件的计算机工作站和任何其它的模拟或分组电话装置。
“语音网络”-配置成用于处理语音呼叫的任何网络;一般来说是POTS网络,不过有可能包括分组交换网络和进行IP承载语音呼叫的数据网络的各部分。
“IP承载语音”(VoIP)-一种呼叫路径经过数据网络的语音呼叫;VoIP涉及数字化音频信号、使用网际协议(IP)通过分组交换数据网络传送数字化信号和将数字化信号转换回模拟声音,以在语音呼叫的接收端进行收听。
附图1表示一种数据与会系统100,该系统适于按照本发明的方式使用并且工作在本地会场102和远程会场104。本地会场102包括本地扬声器电话110,该本地扬声器电话110包括本地数据与会设备112。本地显示装置114(比如投影仪)和图像源116(比如膝上型计算机)也与本地数据与会设备112相连接。远程会场104包括与远程数据与会设备122相连接的远程扬声器电话120,该数据与会设备122挨个与远程显示装置124和图像源116(比如膝上型计算机)相连接。本地和远程数据与会设备112和122包括各自的本地和远程数据会议控制单元128和130,它们分别通过数据与会设备112和122的本地和远程网络接口134和136与数据网络132相连接。最好将本地和远程网络接口134和136与本地和远程数据会议控制单元128和130整合在一起,例如以装载有实现按照本发明的数据与会方法的软件的内嵌计算机的形式,下面将参照附图2进行介绍。本地和远程数据与会设备112和122还包括通过接入电话线(RJ-11插孔)、电话接收机的听筒线(RJ-22插孔)或者用于导线传送语音呼叫的音频信号的任何其它构件与语音网络146连接的各个本地和远程电话适配器140和142。将本地和远程电话适配器140和142通过数据接口(比如,PCI总线、并行端口或通用串行总线(USB)(未示出)),与各个本地和远程数据会议控制单元128和130连接起来,并且分别通过例如RJ-11插孔、RJ-22插孔或其它电话音频线(未示出)与扬声器电话110和120连接起来。
本地扬声器电话设备110、本地数据与会设备112以及本地显示装置114的配置和结构可以与相应的远程扬声器电话120、远程数据与会设备122和远程显示装置124在设计和安装上都相同,即,系统100在本地和远程会场102和104两边可以是对称的。不过,系统100的组成部分并不需要是对称的,就目前所说的问题是,不必是相同的。例如,分割或集成数据与会系统100的某些或全部组成部分的不同方案都在本发明的范围之内。而且,适于按本发明的方式使用的数据与会系统不必局限于两个会场并且可以用于建立单独一个会场内或具有多于两个会场的数据与会通话,并且可以同时显示一个或多个源图像。
附图2是表示由附图1的数据与会系统100执行的典型的数据与会方法200的流程图。在本地和远程扬声器电话110和120之间建立语音呼叫148(由通过附图1中的语音网络146的呼叫路径代表)(步骤210)。语音呼叫148可以使用传统的电话拨号(例如,北美范围内的7位数、10位数或11位数拨号;国际拨号;或PBX网络内的3位数、4位数或5位数拨号,以及EKS系统内的2位数或3位数拨号)或通过其它的方法(例如使用VoIP呼叫方法)来建立。每个电话适配器140和142可以包括一个音频桥(未示出),这个音频桥将各个扬声器电话110和120与语音网络146连接起来,并且使得电话适配器140和142能够被动地监视电话线,以确定其状态,例如,扬声器电话110和120是否摘机和语音呼叫148是否已经建立。
为了通过数据网络132在本地和远程会场102和104之间建立数据通信话路,在会场102和104之一或这两个会场上的用户使用一个输入键(未示出)在语音呼叫会话期间的任何时刻激活系统100。最好该输入键是可以由用户手动操纵的按钮。手动激活输入键对包含在启动数据与会的设备中的软件内的布尔变量进行了设定,其中所述软件促使启动数据与会的设备开始进入商谈进程(步骤220)(下文中称为“商谈进程”)。可以第二次手动激活所述输入键来终止数据通信会话。下面商谈进程的例子包括在本地会场102启动商谈进程;应当理解,按照另一种可选方案,商谈进程可以在远程会场104来启动。为了能通过语音网络146实现商谈进程,本地和远程电话适配器140和142包括产生音频信号(未示出)并且响应于命令在语音呼叫148中发送它们的电路,这些命令是由商谈进程发出的。电话适配器140和142还包括在通过语音呼叫148接收到这些音频信号时用于识别这些音频信号的电路。至少一部分依照商谈进程发送的音频信号编码有网络装置接入码。
网络装置接入码(下文中称为“网络接入码”或“接入码”)地址可以是任何类型的计算机网络地址,或数据网络地址,或者同数据与会设备112、124相关的编码,或同数据与会通话本身相关的编码,例如,域名、URL、遵从IPv4或IPv6(包括具有CIDR的IPv4)的IP地址、虚拟地址(比如多点传送群组地址)或物理地址(例如,以太网地址或其它MAC地址)、会话ID或通行码。这种地址的格式是预定的并且通常可由数据会议控制单元128和130的商谈进程使用,并且可以包括(例如)表示为一连串12个十进制数字的32位IPv4地址。用于传送网路接入码(和在接入商谈期间传送的任何其它数据)的音频信号可以包括空白与突发(blank-and-burst)技术、DTMF音频、陷波调制解调器信号以及其它类型的能够在主动语音呼叫话路中传送数据的采用电子手段产生的语音信号,其很少或不会打断语音呼叫并且不会终止语音呼叫会话。
在远程数据与会设备122上接收到音频信号并且随后确认了网络接入码之后,远程与会设备122以其网络接入码进行应答。此后,数据与会系统100通过语音呼叫148重新开始进行数据会议的音频会议部分(步骤230)。与音频会议的重新开始同时,本地和远程数据与会设备112和122经它们各自的网络接口模块134和136通过数据网络132建立数据网络话路160(步骤240),此时最好使用公知的网络协议。
本地图像处理子系统164可以包括帧缓冲器(未示出),该帧缓冲器用于从图像源装置116接收图像数据188的帧,并且用于检测由图像数据188表示的图像中的变化。当本地图像处理子系统164检测到变化时,对图像数据188的当前帧加以处理,以在本地显示装置114上进行显示(步骤250),并且,单独地,对其进行压缩,以在数据网络话路160中进行传送。不过,最好帧缓存和变化检测是在图像源装置116处采用软件方式进行的,以减少图像源116与本地数据与会设备112之间传输的数据188的量。
为了提高系统100的响应度和效率,本地和远程网络设备112和122最好包括各自的本地和远程图像处理子系统164和166,用以在经数据网络话路160进行传送之前对图像数据进行压缩,并且用以在接收的时候对图像数据进行解压缩。按照另一种可选实施方式,图像的压缩可以在图像源116处采用软件或硬件方式进行,而解压缩可以仅仅在将基本相同的未压缩图像传送给与本地和远程图像处理子系统164和166相连的各自的本地和远程显示装置114和124之前在所述本地和远程图像处理子系统164和166处进行。图像处理子系统164和166还可以在传送图形之前进行图像缩放,以重新制定图像的尺寸,从而适应各自的本地和远程显示装置114和124的像素分辨率。
除了进行数据网络会话160中的图像数据传输的操作之外,本地和远程数据与会设备112和122与各自的本地和远程显示装置114和124耦合在一起,用以交换用于控制所显示的图像的控制数据(未示出)、用以报告错误状态和用以传输对帮助实现数据会议有用的任何其它信息。
一旦建立了数据网络会话160和产生了图像数据,就使得数据与会系统100能够在数据会议的音频分量通过语音呼叫148运送(步骤230)的同时,经数据网络会话160在本地和远程会场102和104之间传输图像数据(步骤260)。图像数据在本地和远程会场102和104处进行显示(步骤270)。
通过消除了先于数据会议通话将图像数据发布给所有参会的数据与会会场或中心服务器的必要性,本发明使得图像能够实时地并且几乎与它们在图像源处的产生或播放同时地动态发布和显示。动态且实时的图像发布和显示还减少了各个参会数据与会会场处所需的图像数据存储量。按照本发明的数据与会系统还可以构成为,使得在数据与会通话终止之后,在与会会场不留下剩余的图像数据。
本领域的技术人员很容易理解,扬声器电话、数据会议控制单元、电话适配器、网络接口、图像处理子系统和显示装置的功能可以以各种不同的方式在各个演示会场进行划分和配置。而且,数据与会组成部分的配置和划分可能会导致各个数据会议会场之内的和与在会场处可接入的语音和数据网络之间的不同的布线方案。
附图3是表示数据与会系统300的优选实施方式的网络图,其中本地数据与会设备310包括无线联网设备(未示出),该无线联网设备用于在本地会场332与采取类似方式配备的图像源320和采取类似方式配备的显示装置330进行通信。在远程会场340,远程显示装置344、远程数据与会设备348和远程扬声器电话352与各个语音和数据网络360和362相连接。可以采用各种不同的无线联网技术中的任何一种作为本地数据与会设备310、图像源320和本地显示装置330的无线联网设备。例如,可以使用依据IEEE 802.11标准中的任何一项进行工作的设备。可由本发明使用的其它的无线联网技术包括家用射频(Home RF)、红外线网络接入以及任何其它的近距离和远距离无线联网系统和装置,包括诸如蓝牙(BLUETOOTH)这样的近距离对等无线联网。不过,本领域的技术人员将会意识到,不同无线联网技术所支持的数据传输速率和可用带宽会对系统性能有不利的影响。因此,为了在系统300的组成部分之间进行有效的无线传输,最好采用本发明的图像数据压缩和解压缩处理方法,本发明的压缩和解压缩处理方法将参照附图5和6加以介绍。
附图4是附图3的数据与会系统的网络图,其中本地数据与会设备310此外还包括用于与连接着数据网络430的底层结构无线联网接入点420进行通信的无线LAN硬件404。本领域的技术人员会理解,按照本发明,可以采用有线和无线联网连接方式的多种其它变形方式。附图3和4中所示的有线和无线联网的特定组合方式仅作示例之用,并且不应当理解为是对可由具体实现本发明的数据与会设备、系统组成部分以及数据压缩和解压缩处理方法使用的有线或无线联网方式的范围的限定。一般来说,任何连接传统数据与会系统的组成部分的网络连接手段都可由用于传送数据或语音承载信号的无线链路来替代,并且可以采用本发明的数据压缩和解压缩处理方法。
具体来说,本发明的数据压缩和解压缩处理采用双重压缩,来首先压缩数据(比如计算机屏幕图像),并且通过诸如IEEE 802.11b传输介质这样的无线网络传送压缩数据。然后使用双重解压缩对所传输的压缩图像数据进行解压缩,以重构原始的图像。组合的压缩和解压缩技术实现了高性能、高图像质量、良好的压缩,并且是感觉不到有损耗的。所述压缩和解压缩技术可以在虚拟的任何有线或无线通信信道上使用。
附图5表示本发明的优选数据压缩处理500。数据源是全屏、彩色、XGA图像(尽管也可以采用其它分辨率和色深度),对该数据源进行处理,以获得位图502。采用了两步压缩处理来获得所需的数据压缩量。第一步采用颜色转换压缩处理504,而第二步采用实时LZ,或者最好是采用LZO压缩处理506,该第二步产生用于通过传输介质进行传输的压缩数据。本领域技术人员会理解,术语LZ和LZO指的是算法,而不是指具有特定功能的特定的可执行应用程序。这些算法是数据压缩器,在应用程序中可以采用这样的数据压缩器来生成文件(数据集)压缩器。
附图6表示本发明的数据压缩处理600。对由LZO压缩处理506(附图5)得到的压缩数据进行两步解压缩处理。第一步采用LZO解压缩处理602,而第二步采用颜色转换解压缩处理604,该第二步产生用于还原位图606的解压缩数据,位图606基本上与位图502(附图5)相同。
LZO压缩和解压缩处理506和602可以通过在URL地址www.oberhumer.coin/opensource/lzo从因特网下载,以备有证明文件的开放源代码和目标码的方式得到。LZO实现了当前能够得到的最快的压缩和解压缩算法。LZO是使用ANSIC写成的实时的、可移植的、无损耗的数据压缩库,它实现了非常快速的压缩和极其快速的解压缩。LZO关心压缩速率甚于压缩比率。
LZO执行了具有下述特征的大量运算解压缩不需要存储器。压缩仅需要64千字节的存储空间。额外的压缩可以通过牺牲速度来实现,而解压缩速度不会降低。LZO包括产生预压缩数据以实现高压缩率的压缩层次。LZO包括需要8千字节存储空间的压缩层次。这种算法是线程安全且无损耗的。LZO支持重叠压缩和就地解压缩。LZO和LZO算法是在GUN通用公众许可(General Public License)的条款下发布的。
LZO可用于多种平台,包括DOS(16和32位)、Windows 3.x(16位)、Windows 95/98/NT、Linux、HPUX和DEC Alpha(64位)。还有报告说LZO可以在AIX、ConvexOS、IRIX、MacOS、Nintendo 64、PalmOS(Pilot)、PSX(Sony游戏站)、Solaris、SunOS、TOS(AtariST)和VxWorks下工作。
LZO压缩和解压缩处理506和602的优选集被称为miniLZO,它是LZO库的简化子集。MiniLZO实现了LZO1X-1压缩器和标准及安全LZO1X解压缩。除了快速压缩之外,它对于预压缩数据文件也是可用的,比如采用LZO1X-999压缩的文件。MiniLZO由一个C源文件和两个头文件组成。在i386平台上它编译为大约六千字节。
另一种可选的LZO压缩和解压缩算法的优选集称为LZOP,它采用LZO数据压缩库进行压缩服务。LZOP是目前可以得到的最快的压缩器和解压缩器。预编译的二进制代码可以在运行Windows95/98/ME/NT/2000/XP、32位DOS和OS/2的平台中加以应用。
本发明的数据压缩和解压缩处理500和600达到了这样一个目标在使用无线传输介质时,从例如膝上型计算机到例如投影仪传输完整的XGA图像,实现了一秒的等待时间。最坏情况的等待时间需要,在一秒之内将完整的XGA屏幕从膝上型计算机转移到投影仪上。假设XGA彩色图像具有每像素三字节(24位),该图像具有1024×768×24位的总位数,等于18874368位(2359296字节),要在一秒或更少的时间内传送这么多位的数据。
要想知道这个性能目标是否能够达到,必须要知道总的系统等待时间,在设计和配置出系统之前,这是不可能的。如果系统等待时间过长,必须要使用数据压缩方法(假设可以得到足够的运算能力)来压缩所要传输的数据量。数据压缩是计算强度很大的处理,一般来说与所需的压缩率成线性关系。例如,保持计算机性能恒定,40∶1的数据压缩一般来说需要10倍于同样数据的4∶1压缩的运行时间。另外,保持时间恒定,40∶1数据压缩需要10倍于4∶1数据压缩的运算能力。当然,本发明也可使用其它的分辨率和色深度组合降低方案。
采用TCP/IP的IEEE 802.11b无线传输系统每秒能够传送接近524000字节。假设必须要传送2359296字节,那么需要使用2359296除以524000等于4.5秒来传送未压缩的XGA数据帧。这意谓着在采用TCP/IP的802.11b系统中需要使用数据压缩来实现1秒等待时间。因此,需要大约4.5∶1的数据压缩率来实现一秒或更少的传送时间。
还需要考虑图像质量。数据压缩技术或者是无损耗或者是有损耗的。无损耗技术具有有限的压缩性能,而有损耗技术会产生图像伪痕。在“用无线介质代替有线介质”的目标下,图像必须是察觉不到有损耗的。就是说,用户应当不能够从视觉上察觉使用了数据压缩。
实现彩色图像的4.5∶1压缩是很困难的课题。这种压缩程度一般来说是通过采用公知的有损的JPEG压缩处理来实现的。只可惜,JPEG处理需要足够大的运算量,即,要消耗很长的时间。如果采用了JPEG处理,则必须要进行无法令人满意的折衷,以致发送了无法接受的具有明显伪痕的低质量图像。而且,在典型的数据与会系统中,可用于运行数据压缩和解压缩处理的运算量资源是有限的,因为计算机一般来说忙于运行应用程序,比如,PowerPoint、动画制作,这些应用程序使用了几乎所有的可用计算机资源。
“压缩”是通称性词语,意思是使数据集更小。不过,压缩的定义不解决如何实现压缩的问题。例如,截短和重编码是两种不同的压缩方法。各种类型的压缩利用了原始数据中的某些特征。在大多数压缩方案中,采用了超过一种这样的方法。例如,将原始数据转换成码字,然后对码字进行编码。在针对这种应用选择一种或多种方法的过程中,有一点很清楚,它们必须运行得很快,但是尽管需要4.5∶1的压缩率,仍然不知道多少时间可用于处理这个压缩。从实用的角度看,在只有一秒的等待时间的情况下,对于IEEE 802.11b,预算等待时间的大部分用在了无线信道上,并且实际上没有给压缩和解压缩留下一点。
假设,例如,5.5∶1的压缩率能够造成大约0.8秒的无线信道等待时间。这为对数据进行压缩和解压缩剩下了0.2秒的时间。假设是对称的算法,2359296字节必须要在0.1秒内压缩。因此,必须采用每秒能够压缩24兆字节的压缩算法,这种算法称为实时压缩器。而且,某些压缩器对彩色图像数据工作得很好,而某些则不太好。
使用优选的LZOP压缩处理,在1GHz奔III(Pentium III)上压缩完整的XGA屏幕图像的预计时间这样计算0.89除以12.3,等于0.072秒。在1GHz奔III(Pentium III)上解压缩完整的XGA屏幕图像的预计时间这样计算0.3除以12.3,等于0.024秒。
再次参照附图5和6,采用颜色转换压缩和解压缩处理504和604进一步减小了需要处理和传输的数据量。这是通过采用人类感知范围之外的色空间转换来实现的。RGB到YcrCb 4:2:0共位色空间转换满足这一要求,并且是专业576线数字视频应用系统和数字视频摄录一体机中采用的色空间转换。在24位RGB色空间模型中,每个像素需要三个字节。YCrCb 4:2:0共位色空间每个像素采用一个字节来描述Y,每四个像素采用一个字节来描述Cr,和每四个像素采用一个字节描述Cb。这样将需要由LZO压缩的数据量减少了一半。具体来说,通过将包含2359296字节的完整XGA屏幕图像转换成YCrCb色空间对其进行压缩,将数据压缩成了1179648字节。因为与上面的实例计算中所传输的数据相比,这是一半的数据量,因此将总的压缩时间估计为0.072除以二,等于0.036秒。
虽然LZOP对Waterloo Bragzone Colorset产生2.17∶1的压缩率,但是计算机产生的图形比摄影图像具有更高的可压缩度。因此,当采用计算机图形数据时,保守地讲可以得到额外的10%的压缩率,并且额定地可以得到25%。例如,如果对于计算机产生的图像压缩率增加了10%,1179648字节得以进一步压缩到了1179648除以2.39,等于493577字节。结果得到的信道内等待时间预计为493577除以524000,等于0.94秒。因此,本发明达到了一秒等待时间的目标。
要达到一秒等待时间的目标,需要高性能颜色转换。颜色转换一般来说要通过浮点运算来实现。不过一般来说可利用的运算资源是不足的,所以最好采用本发明的高速整型实施方式。
如上所述,采用了RGB到YCrCb共位4:2:0颜色转换。不过,有很多组可用于实现这一转换的颜色转换系数。下面的转换公式是从ITU-R BT.709-4技术标准第2部分中介绍的方法得出的。输入RGB数据具有4:4:4格式,而输出YCrCb数据是以4:2:0格式产生的。公式1-3包含Cr和Cb的乘系数形式,用以减少所需的相乘次数。
Y=0.2126R+0.7152G+0.0722B(1)Cr=0.6350(R-Y) (2)Cb=0.5389(B-Y) (3)通过优选地采用这些公式的乘系数整数形式,实现了更高的性能。下面的公式4-6等价于公式1-3,只是通过65536这个系数进行了放大,而表达为整型算法。通过将二进制小数点移到位15的左边,而得以采用了32位整型运算。
Y=13933R+46871G+4732B(4)Cr=41615(R-Yd) (5)Cb=35317(B-Yd) (6)YCrCb到RGB解压缩处理604采用三色条内插法来重新构成压缩图像。这个方法有助于防止图像重构期间的高速缓存出现差错、保持接收处理器的全速度。
本领域技术人员将会认识到,本发明的各部分可以采取与上面针对优选实施方式介绍的实现方式不同的方式来实现。例如,本发明并不局限于XGA图像数据的压缩和解压缩,而且也不限于一秒的等待时间目标。数据与会组成部分的结构并不限于所介绍的并且可以包括多个本地和远程图像源。图像可以以不同的形式来显示,包括分画面、并排、画中画、在用户的方向上或按照其它标准交替、旋转或者平铺。而且,本发明的数据与会设备以及压缩和解压缩处理可以采用在计算机工作站上运行的软件的方式来实现,该工作站还可以用作显示装置、电话接收机和/或图像源;或者采用作为简化数据与会设备的硬件来实现,这种硬件可以由单独的电话接收机、显示装置和图像源使用。
对于本领域的技术人员而言,显而易见,对本发明的上述实施方式的细节可以做出很多的改变,而不会超出本发明的基本原理。因此,应意识到,本发明还可应用于除了在多媒体数据与会中建立的之外的数据压缩和/或解压缩应用。因此,本发明的范围应当仅由所附的权利要求书来确定。
权利要求
1.一种数据压缩和解压缩方法,包括接收第一数据集,该第一数据集具有色空间格式;对所述色空间格式进行转换,以产生具有压缩色空间格式的数据集;通过实时压缩处理对具有压缩色空间格式的第一数据集进行压缩,以产生具有压缩色空间格式的压缩数据集;通过解压缩处理对具有压缩色空间格式的压缩数据集进行解压缩,以产生具有压缩色空间格式的解压缩数据集;和将压缩色空间格式重新转换为色空间格式,以产生具有色空间格式的第二数据集,该第二数据集与具有色空间格式的第一数据集基本上相同。
2.按照权利要求1所述的方法,其中实时压缩处理包括Lempel-Ziv-Oberhumer(“LZO”)压缩处理。
3.按照权利要求1所述的方法,其中解压缩处理包括LZO解压缩处理。
4.按照权利要求1所述的方法,还包括,在显示器上还原具有色空间格式的第二数据集。
5.按照权利要求1所述的方法,还包括,通过无线传输介质传送具有压缩色空间格式的压缩数据集,和接收具有压缩色空间格式的压缩数据集。
6.按照权利要求5所述的方法,其中传输介质包括IEEE 802.11传输介质、家用RF传输介质和蓝牙传输介质中的至少一种。
7.按照权利要求1所述的方法,其中色空间格式是红、绿、蓝(“RGB”)色空间格式。
8.按照权利要求1所述的方法,其中第一数据集包括XGA彩色图像数据。
9.按照权利要求8所述的方法,其中所述方法是在一秒钟或更短时间内进行的。
10.按照权利要求1所述的方法,其中压缩和解压缩处理至少之一包括miniLZO算法。
11.按照权利要求1所述的方法,其中压缩和解压缩处理至少之一包括LZOP算法。
12.按照权利要求1所述的方法,其中对色空间进行转换包括RGB到YCrCb 4∶2∶0共位颜色转换处理。
13.按照权利要求1所述的方法,其中对压缩色空间格式进行重新转换包括YCrCb 4∶2∶0共位到RGB颜色转换处理。
14.按照权利要求1所述的方法,其中色空间转换和重新转换是通过整型运算进行的。
全文摘要
本发明的优选数据压缩和解压缩处理(500,600)加速了彩色XGA图像(502)的传输。第一压缩步骤采用RGB到YCrCb颜色转换压缩处理(504),而第二步采用Lempel-Ziv-Oberhumer(“LZO”)压缩处理(506),来产生通过无线传输介质传输的压缩图像数据。优选的数据解压缩处理从LZO压缩处理接收压缩图像数据。第一解压缩步骤采用LZO解压缩处理(602),而第二解压缩步骤采用YCrCb到RGB颜色转换解压缩处理(604),以产生适于还原基本上与原始的XGA图像相同的图像(606)的解压缩数据。
文档编号H04N1/64GK1703714SQ200380101046
公开日2005年11月30日 申请日期2003年10月6日 优先权日2002年10月7日
发明者J·格利克曼 申请人:因佛卡斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1