多级图像的适应性压缩的制作方法

文档序号：7618217阅读：210来源：国知局

专利名称：多级图像的适应性压缩的制作方法
技术领域：
本发明涉及计算机环境中的通信，尤其涉及与多级图像相关联的数据的压缩。
背景技术：
由于计算机和网络技术从高成本、低性能的数据处理系统到低成本、高性能通信的进化，解题和娱乐系统已提供了一种划算的、节约时间的方法以减轻执行诸如通信、付帐单、购买、做预算以及收集信息等日常任务的压力。例如，通过有线或无线技术连接到因特网的计算系统，可在用户指尖向用户提供对来自遍布世界的网站和服务器的存储库的丰富信息的几乎即时访问。
图像的捕捉和传播是计算机行业中兴趣渐浓的一个领域。通常，有三种类型的图像或位图。例如，全色彩图像包括每个象素上数百万种的可能色彩。每个象素有三维色彩坐标{R，G，B}，每一个坐标以8-16字节表示。通常以JPEG(联合静态图像专家组)、JPEG2000、或者PNG(可移植网络图像技术)格式显示全色彩位图。色彩映射图像包括每个象素上可能的一些色彩。通常每个象素具有包含每种色彩{R，G，B}值的色彩表格中的索引值。色彩映射图像常常以GIF(图像交换格式)或PNG格式表示。二级图像(传真)采用每象素两种色彩(通常是黑和白)并通常被采用于文档图像。这样，常以TIFF(标签图像文件格式)或PNG格式来显示二级图像。
本领域中对便于经改进图像压缩和增强图像显示的系统和方法有未能满足的需求。

发明内容
为了提供对本发明某些方面的基本理解，以下提供本发明的简要内容。本“发明内容”部分并非是本发明的广泛纵览。它并非旨在标识本发明的关键或重要元素或是勾划本发明的范围。它的唯一目的是用简化形式介绍本发明的某些概念，作为以下提供的更详细说明的序幕。
在此揭示和声明的本发明在其中一方面中，涉及便于由白板和/或文档捕捉系统所产生图像的压缩的系统。通常，有三种类型的图像，每一种都由针对该类图像的编码译码器(codec)或算法进行最佳压缩。本发明提供一种用于色彩映射图像尤其是由捕捉白板图像所产生的色彩映射图像的编码译码器。通常，对于这样的图像，大多数象素都有背景色(例如白色)而小部分象素具有可由若干色彩(例如可从预定色彩表格中选取的)之一近似而来的色彩。色彩表格可具有相对较少的色调，像典型的干擦笔就限于所制造的几种色彩、色调等等。白板图像被视为是多级图像，其中每个象素值是对较小色彩值表格的索引(例如“级”)。
根据本发明一方面，通过多级编码译码(MLC)提供了用于多级图像有效表示的压缩算法。通常色彩映射图像的每个象素可能具有一些色彩。每个象素常具有包含对每种色彩{R，G，B}值的色彩表格中的索引值。通用的色彩映射图像编码译码器包括GIF和PNG。MLC便于比通用的GIF或PNG格式更好的色彩映射图像的压缩。此外，典型的经编码比特流包括能分别解码的诸组件，分别表示该图像的黑白和彩色版本。因而当限制带宽时，可从经编码比特流的一小部分来解码该图像的黑白版本。
根据本发明的相关方面，可提供双压缩功能使得输入图像的压缩可分两步进行。首先，对每个象素的背景/前景标记进行压缩以有效压缩图像的黑白表示—这可通过例如二级编码译码压缩器来完成。然后，对前景象素的色彩索引信息可通过熵编码器(例如来自Ziv-Lempel(LZ)系列)进行压缩。本发明的这一方面便于例如远程会议协作、信息交换、白板内容共享等等的增强。此外，MLC促进质量图像压缩以减轻可能的有害带宽限制。如果带宽受到极大的限制，本发明可把经编码信息拆分成黑白和彩色版本，然后仅传送黑白版本以遵从带宽限制(例如经硬接线、无线等等的传送)。
根据本发明的另一方面，可用诸如二级编码译码器(BLC)的二级编码器对前景/背景图像b(m，n)进行编码。通过向量量化或者类似过程可选择性地缩减色彩变换表的尺寸。由所有前景象素值形成的字符串(或向量)可用诸如LZ编码器的熵编码器进行编码。例如，可采用BLC编码器来编码黑白图像b(m，n)，并利用基于LZ77的zlib库来编码前景色彩。结合本发明，还可利用其它种类的二级编码器(例如TIFF、PNG)和字符串编码器(例如其它LZ变种)。
为了实现前述内容和相关目标，本发明的某些说明性方面结合以下说明书和附图进行详细描述。然而这些方面仅仅示出了本发明诸原理可在其中采用的各种方式的其中几种，且本发明旨在包括所有这些方面及其等效方案。结合附图阅读以下详细说明，本发明的其它优点和新特征将变得清楚。

图1示出根据本发明一方面便于对诸如白板的数字化捕捉的图像等多级图像的适应性压缩的系统100。
图2示出根据本发明一方面便于对诸如白板的数字化捕捉的图像等经压缩多级图像的适应性解压缩的系统200。
图3示出根据本发明一方面便于对诸如白板等的数字化捕捉的图像的多级图像的适应性压缩的系统300，它包括作推断的人工智能(AI)组件。
图4示出由白板捕捉系统产生的典型数字图像。
图5示出对应于图4彩色图像所产生的黑白图像。
图6示出根据本发明一方面通过估算彩色图像中每个象素的迭代反馈循环而便于从彩色图像构建黑白图像的方法600。
图7示出根据本发明一方面在压缩之前便于用可选的色彩表的缩减对多级图像的适应性压缩的方法700。
图8示出根据本发明一方面便于对诸如白板的数字化捕捉的图像等多级图像的适应性压缩的方法800。
图9和10示出根据本发明诸方面的示例性计算环境。
具体实施例方式
本发明参照附图进行说明，其中贯穿所有附图类似标记号代表类似元件。在以下说明中为作解释，陈述有很多具体细节以便提供对本发明的全面理解。然而没有这些具体细节也可实践本发明是显然的。在另外的实例中，为便于描述本发明，众所周知的结构和设备以框图形式示出。
如在本申请中所用，术语“组件”和“系统”旨在指计算机相关实体硬件、硬件和软件的组合、软件、或是执行中的软件。例如，组件可以是，但不限于，运行于处理器上的进程、处理器、对象、可执行程序、执行的线程、程序、和/或计算机。作为说明，运行于服务器上的应用程序和服务器都可作为组件。一个或多个组件可驻留于进程和/或执行的线程中，并且组件可位于一台计算机上和/或分布在两台或多台计算机上。
术语“推断”在此使用时，一般是指从通过事件和/或数据捕捉的一组观察中推理或推断系统、环境、和/或用户的状态的过程。推断可用来识别特定环境或行动，或产生例如对状态的概率分布。该推断是或然性的—即，所关心状态的概率分布计算是基于对数据和事件的考虑。推断也可指用来从一组事件和/或数据中组成更高级别事件的技术。这种推断导致了基于一组观察事件和/或存储事件数据对新事件或行动的构建，不管这些事件是否紧密时间接近性相关，及是否这些事件和数据来自一个或若干个事件和数据源。
本发明提供一种编码译码器，它用于色彩映射图像尤其是通过捕捉产生的色彩映射图像，例如白板的彩色图像(参见图4)。这些图像包括具有背景色(如白色)的大部分象素以及具有可由较小色彩表中若干色彩之一近似而来的色彩的小部分象素。该色彩表可具有相对较少的色调，像典型的干擦笔就限于所制造的几种色彩、色调等等。白板图像被视为是多级图像，其中每个象素值是对较小色彩值表格的索引(例如“级”)。
通常色彩映射图像的每个象素可能具有一些可能的色彩。每个象素常具有包含对每种色彩的{R，G，B}值的色彩表格的索引值。通用的色彩映射图像的编码译码器包括GIF和PNG。多级编码译码(MLC)促进比通用的GIF或PNG格式更好的色彩映射图像的压缩。此外，典型的经编码比特流包括能分别解码的诸组件，分别表示该图像的黑白和彩色版本。因而当限制带宽时，可从经编码比特流的一小部分来解码该图像的黑白版本(参见图5)。
图1示出根据本发明一方面便于对诸如白板的数字化捕捉的图像等多级图像的适应性压缩的系统100。控制组件102在操作上可与压缩组件104相耦合，该压缩组件104向系统100提供双压缩功能以压缩诸如数字捕捉的白板的多级图像。压缩组件104包括采用多级编码译码(MLC)的编码器106，该MLC是用于压缩多级图像的算法。编码器组件106通常原始图像的经压缩表示(比特流和/或文件)，它由若干部分组成标题信息(包含有关图像尺度、色彩数量及其它类似参数的信息)、经编码背景、以及经编码前景色字符串，如下所述。
例如，可向系统100输入图像x(m，n)，0≤m≤NR-1，0≤n≤NC-1(其中NR和NC分别是行数和列数)。每个象素x(m，n)可具有范围
内的值v，其中L是色彩的数量。真正的色彩值都存储于色彩表M＝{[r0g0b0]，[r1g1b1]，...，[rL-1gL-1bL-1]}，其中对于每个色彩索引0≤v≤L-1都有确定其相应色彩的RGB三色值。因而，输入数据是象素值x(m，n)和色彩表M。压缩组件104以及控制组件102，可确定输入图像的背景色彩vB。因为大多数象素是背景色，可将vB设定为等于由最大量象素所呈现的色彩值v。通常vB接近于白色，但是其它背景色也是可能的。可为包含有NR、NC和NB值的经压缩比特流(或文件)编写一标题。该标题可被设计为预留以后要定义的彩色表的空间。
压缩组件104和/或熵编码器106可通过以下公式将原始输入图像映射成相应的黑白图像b(m，n)b(m，n)＝0，如果x(m，n)＝VB(例如，象素在背景上)b(m，n)＝1，如果x(m，n)≠VB(例如，象素在前景上)然后可用二级编码译码器(BLC)对黑白图像进行编码，且可把由BLC产生的比特附加到输出比特流和/或文件中。对应于图4中图像的黑白图像b(m，n)的实例如图5所示。另外，编码器106可编码前景象素的色彩值。因为已从黑白图像b(m，n)得知前景象素的位置，可把所有前景象素的值按扫描顺序附加到字符串S＝{v0，v1，...，vF-1}中，其中F是前景象素的数量(通常F比象素的总量NR·NC小得多)。
为了编码字符串S，系统编码器106可采用两种模式“无损”模式，其中使用诸如Ziv-Lempel(LZ)编码器的适于可包含重复模式的字符串的熵编码器来对S中的前景值进行直接编码；以及“有损”模式，其中色彩表M被缩减为具有较少色彩的色彩表M’。然后在熵编码之前，可将图像x(m，n)中的原始索引替换成新色彩表的索引。如果所需模式是无损的，则用LZ编码器对字符串S进行编码并将得到的比特附加于输出比特流或文件。然后色彩表M可被写入输出比特流或文件的标题中以完成编码。
如果所需模式是有损的，可假设不需前景象素的色彩的完美重建，从而色彩就可以近似，只要在显示时近似色彩显得与原始色彩足够相似即可。例如，在有损模式中存在对编码器106的输入参数K、所需色彩数量L，其中K＜L。然后系统100可产生新的色彩表M′＝{[r′0g′0b′0]，[r′1g′1b′1]，...，[r′K-1g′K-1b′K-1]}，从而对于原始表M中的每种色彩[rgb]，在经缩减表M’中存在色彩[r′g′b′]，使新色彩[r′g′b′]与原始色彩[rgb]足够相似。这种色彩表缩减是向量量化问题的一个实例将向量组替换为较小组，使得较小组中条目对原始组中的那些是良好近似。因而，为了产生新表M’，压缩组件104和/或编码器106可采用诸如LBG(Linde-Buzo-Gray，在统计理论中也称为K-中值)或者八分树树算法的向量量化器设计算法。
一旦系统编码器106已产生了表M’，可采用标准的全搜索向量量化过程来把色彩重新分配给索引。对于每个前景象素，原始值v可由新值v’替换，例如通过对于b(m，n)＝1的所有(m，n)用x(m，n)＝v’来替换x(m，n)＝v，使得对应于v’的色彩[r′g′b′]是经缩减色彩表M’的所有色彩中与原始[rgb]色彩(对应于v)最接近的色彩。
然后由编码器106形成要编码的字符串S，其中S＝{v′0，v′1，...，v′F-1}且其中F是前景象素的数量。因为已缩减了S中每个元素的值的范围，将对应于无损模式压缩到比原始S更短的比特流。因而，在有损模式中，重建保真度中的较小缩减便于经压缩文件尺寸的较大缩减。此时，可把色彩表M’写入输出比特流的标题以完成编码。
图2示出根据本发明一方面便于对经压缩多级图像的适应性解压缩的系统200。取决于应用情况，给出编码器系统100或解码器系统200或两者。例如，打印机驱动器或经压缩文档产生器可仅包含编码器系统100；文件查看实用程序或者打印机控制软件可仅包含解码器系统200，而文档/图像处理/标记应用程序中的插件程序可包含编码器系统100和解码器系统200两者。
解码器206能可选择地取消编码。解码器206的主要操作可包括，例如阅读MLC生成比特流或文件的标题，以确定{NR，NC}(图像尺寸)、VB(背景色彩)、K(色彩数量)、以及色彩表M的参数。另外，解码器206可读取和解码第一比特流组件，它包含经编码黑白位图b(m，n)，并把背景色彩VB分配给b(m，n)＝0的所有象素x(m，n)。此外，解码器206可选地读取并解码第二比特流组件，它包含前景值的经编码字符串S，并根据开始读取的色彩表可选地把色彩分配给每个前景索引。当图像的黑白重建足够满足用户要求时，读取和/或解码第二比特流组件就不重要了。
现参见图3，系统300示出根据本发明一方面便于多级图像的适应性压缩。系统300包括便于进行由系统300接收的信息分析的控制组件302。控制组件与压缩组件304在操作上相关联，而压缩组件又包括编码器306。
另外，控制组件302包括可作关于系统300操作的推断的AI组件308。例如，AI组件可根据有关用户需要、接收用户装置的显示能力等等的信息来推断编码的适当模式(例如无损或有损)。根据另一示例，AI组件308可推断输入组件中象素色彩的适当色彩表格等等。此外，可采用AI组件308来作关于例如带宽可用性的判断和/或推断，使得如果带宽受较大限制，则无需有关前景象素色彩的信息就可传送输入图像的黑白版本。这样，系统300可向接收用户提供原始图像的有意义表示而规避了带宽限制。
根据相关方面，AI组件308可判断和/或推断接收经压缩图像的装置类型(例如部分地基于与来自接收装置的请求相关联的信息)，并可采用这样的推断来判断该装置是否能够接收和/或显示多级彩色图像。如果确定接收装置不能接收和/或显示多级图像(例如由于带宽限制、装置能力限制、接收装置暂时的不可用性等等)，则系统300可自动发送二级图像以便补偿接收装置的限制并仍然向接收用户提供具有意义的信息。
可由AI组件308提供的作推断的其它实例可包括例如有关用户喜好的推断。根据一实例，AI组件308可评估用户输入的喜好、信息等等，以便推断用户是否希望和/或能够接收原始图像的全色彩多级版本、经缩减色彩的多级版本、和/或输入图像的二级、黑白版本。例如，通过远程区域中手机来接收经压缩图像的用户可把手机设置为“漫游”，而AI组件308可识别漫游手机的有限接收能力，以允许作出有关要传送给手机的经压缩图像类型的推断。另外，可向用户提供由AI组件308所推断装置的接收能力相关的信息，使得可提示用户改变接收装置中的设置以便允许接收质量较高或较低的图像。
此外，系统300可把提供补充信息的用户界面显示给用户，这些信息包括诸如与不同质量水平的经压缩图像相关联的文件尺寸、关于发送和/或接收资源的用户可选选项、发送优先级、文件内容、作为接收装置能力函数的下载时间、减少下载时间和/或增加接收能力的建议等等。为增强用户查看体验必要的任何和所有信息都通过用户界面提供给用户。可以理解，前例实际上是说明性的，并非旨在限制AI组件308作推断的方式的范围，或者由AI组件308可作的推断数量。
术语“推断”在此使用时，一般是指从通过事件和/或数据捕捉的一系列观察中推理或推断系统、环境、和/或用户的状态的过程。推断可用来识别特定环境或行动，或产生例如各状态的概率分布。该推断是或然性的—即，相关状态的概率分布计算是基于对数据和事件的考虑。推断也可指用来从一系列事件和/或数据中组成更高级别事件的技术。这种推断导致了基于一系列观察事件和/或存储事件数据构造新事件或行动，而不管这些事件是否紧密时间接近性相关，及是否这些事件和数据来自一个或若干个事件和数据源。在结合本发明执行自动和/或推断的动作方面，可采用各种分类方案和/或系统(例如，支持向量机器、神经网络、专家系统、贝叶斯置信网络、模糊逻辑、数据融合引擎……)。
为了说明示出图4和5，其中例示数字捕捉之后可呈现的典型白板图像(图4)。图4中的彩色线条由不同灰色线条来表示。当受带宽限制时，可向用户展现对应于彩色图像(图4)的黑白图像(图5)以便于尽管是有限带宽和/或有限接收装置能力仍能与用户进行信息交换。例如，在捕捉了白板图像及其内容并将其发送给诸如带有简单LCD屏幕的手持式装置、传真机等等的具最小图形能力的接收装置等的事件中，可设定系统提供手持式装置可轻易理解并呈现的黑白图像。
尽管为便于简单解释，在此例如以流程图形式所示的一个或多个方法被显示和描述成一系列动作，应当理解和认为本发明并不限于动作的顺序，因为根据本发明部分动作可按不同顺序发生或与在此描述和显示的其它动作同步发生。例如，本领域人员将理解和认为，方法能另外表示为诸如在状态图中的一系列互相关联的状态或事件。此外，根据本发明为实现方法并不是所有的被说明动作都是必须的。
图6示出了根据本发明一方面用于诸如白板的经数字捕捉图像等等多级图像的适应性压缩的方法600。在602，可读取输入图像x(m，n)及其相关联色彩表。在602读取了输入图像x(m，n)及其相关联色彩表后，可开始背景处理，其包括在604-608上示出的各个动作。在604，确定关于出现频率最高的色彩vB＝背景色。在606，可确定黑白图像b(m，n)，在608它可通过二级编码器编码。背景处理如图7所示进行更详细描述。可以理解，如果所需要的仅是黑白图像则无需以下所述的前景处理就可实现如602-608所示的方法，从而可基于由与二级编码器编码的图像b(m，n)相关联的数据写出输出比特流。
然后方法可继续到610，其中前景象素值可加入基于M’的字符串S中。在612，前景色值的字符串S可通过熵编码器进行编码。最后，在614，可利用来自612步骤的经编码字符串S和来自608步骤的经编码黑白图像信息来写出输出比特流。因而610和612示出在前景处理期间发生的动作，其中前景处理参照图8作进一步的描述。
图7示出了根据本发明一方面多级图像的适应性压缩及其转换成二级图像的方法700。在702，确定有关图像中最频繁出现的色彩vB，从而将最频繁出现的色彩vB指定为“背景”色彩。例如，输入图像可包括一组象素x(m，n)，使得0≤m≤NR-1，0≤n≤NC-1(其中NR和NC分别是行数和列数)。图像中每个象素都具有范围
中的色彩值v，其中L表示可能的色彩数量。与象素相关联的真正色彩值可存储于色彩表M中，其中M＝{[r0g0b0]，[r1g1b1]，...，[rL-1gL-1bL-1]}并且对于每一种色彩索引0≤v≤L-1，都有确定其相应色彩的RGB三色值。例如，如果要压缩和转换的图像是经填画白板的数字图像，则该图像包括的大部分象素将展现白色。如果这样，白色将被赋予vB。因此，可通过例如柱状图计算来确定背景色vB计算每种色彩的出现次数，并将具有最大计数值的色彩赋予vB。
在704，开始通过图像中所有象素x(m，n)组的循环，且在706，确定关于每一单个象素是否展现等于vB的值。如果确定特定位置(m，n)上的固定象素x(m，n)具有与vB相等的色彩值，作为相应背景标记值b(m，n)被设定为0。如果确定象素x(m，n)色彩值与vB不相等，则在710特定象素的相应背景标记值b(m，n)被设定为1，即值“1”表示非背景色。换言之，b(m，n)＝1表示位置(m，n)对应于前景象素。如需要，可对经压缩比特流和/或文件编写包括值NR，NC和vB的标题。另外，可用指定色彩表相关信息的附加空间来构建标题。
一旦特定象素已进行估算并赋予了值，则可在712判断是否已处理图像中所有的象素(m，n)。如果在712确定尚未估算所有象素(m，n)的集，则方法可回到704作另一次象素估算迭代(即具有新的象素地址对(m，n))。然而，如果在712确定已处理了所有的象素(m，n)集，则可将原始图像x(m，n)映射成相应的黑白图像b(m，n)，其中如果x(m，n)＝vB则b(m，n)＝0，以及如果x(m，n)≠vB则b(m，n)＝1。然后方法继续到714，其中可通过例如二级编码器来对黑白图像b(m，n)进行编码。然后可将二级编码器编码的比特附加到输出比特流和/或文件中。
图8示出根据本发明一方面用于对诸如白板的数字化捕捉图像等等多级图像的适应性压缩的方法800。在802，确定关于在压缩与经捕捉图像相关联的数据时，是否需要有损模式。例如，结合流介质、电话等等采用典型的有损数据压缩编码译码器。根据一示例，可采用有损转换编码译码器，其中一个图像样本可被选择、被拆分成较小部分、转换成新的基本空间、以及最后进行量化和熵编码。根据另一示例，结合本发明可采用有损预测编码译码器，通过它可使用先前解码的编码译码器来预测当前图像。然后可量化并编码在预测和实际数据之间的误差。根据又一示例，可采用变换和预测有损编码译码器的组合。
如果选择了有损模式，则方法继续到804，其中色彩表M可通过向量量化技术、八分树缩减、矩心分析技术等等来缩减。需要有损模式来改进复杂图形的压缩。例如，可使用白色背景上的单种色彩(例如蓝色)来填画白板。如果像通常发生的一样曾用该蓝色标记笔改写在其它标记(如红色、黑色等等)上，则用来填画白板的蓝色标记会堆积在白板上这些别的色彩上。可删去具有与两种最频繁出现色彩值(例如白色背景和蓝色标记)不同的色彩值象素以提供表示白色背景上真实蓝色标记所需的纯粹最少的象素。可以理解，在前例中给出的特定色彩不作限制意义解释，因为除了白板之外本发明中其它背景色彩和/或标记、其它图像主题也是有可能的。
另外，如果白板以多种色彩填画(某些是主要的)，可采用有损模式来将色彩表M缩减为M’，其中M’包括大多数主要色彩的集。例如，如果主要使用蓝色、绿色和红色标记笔来填画白板，而使用橘色标记笔来画单根线条，则包括蓝色、绿色、红色和橘色的色彩表M可缩减为包括蓝色、红色和绿色的M’。根据该情形，橘色线条可用红色的来代表，因为红色是在经缩减色彩表M’中最相近的象素色彩。
在806，可将前景象素字符串初始化为“空。另外，如果在802确定不需要有损模式，则方法可直接继续到806，用于不缩减色彩表而初始化前景象素字符串S。然后，在808，可对图像中所有象素(m，n)开始循环。在810，确定关于参照方法700确定给定象素是否在前景中(例如b(m，n)＝1)。如果确定该象素不是前景象素(例如，它是背景象素b(m，n)＝0)，则方法回到808用于对剩下的象素作进一步迭代。如果在810确定象素是前景象素，则在812确定是否需要有损模式。如果需要有损模式，则在814将象素(m，n)的色彩值c替换成来自经缩减色彩表M’的最接近色彩c。在816，把象素(m，n)的新色彩值c附加到字符串S中。
在812确定不需要有损模式的事件中，方法直接从812继续到816，其中象素(m，n)的色彩值c将被附加到字符串S中。然后，在818，可确定是否已处理了所有象素(m，n)。如果仅处理了象素全集中的一部分，则方法返回到808以作另外的象素分析迭代。如果在818确定已估算了所有象素，则方法可继续到820，其中前景色彩值的字符串S可通过熵编码器(例如来自Ziv-Lempel(LZ)系列)进行编码。
应当注意，图6、7、和8示出根据本发明用于多级图像的适应性压缩的较佳实施例的流程图600、700和800。对于本领域技术人员，使用流程图600、700和800的变种是可能的，从而操作顺序也可改变为例如更适于特定硬件平台；这些变种仍然是本发明的实施例。
应当注意流程图600、700和800指定了编码器406的较佳实施例。从哪些流程图中指定的操作中，本领域技术人员可推导编码器206的相应流程图。
现在参照图9，示出了可操作来执行本发明架构的计算机的框图。为了提供本发明诸方面的其它上下文，图9和以下论述旨在对本发明诸方面在其中实现的适当计算环境900提供简要、一般的说明。尽管本发明是在运行于一台或多台计算机上的计算机可执行指令的一般上下文中说明的，本领域技术人员将认识到本发明也可结合其它程序模块和/或作为硬件和软件的组合来实现。通常，程序模块包括执行具体任务或实现具体抽象数据结构的例程、程序、组件、数据结构、等等。另外，本领域技术人员将理解本发明的方法也可通过其它计算机系统配置来实践，包括单处理器或多处理器计算机系统、小型计算机、大型计算机、以及个人计算机、手持式计算装置、基于微处理器的或可编程的消费电器等等，其中每个装置在操作上与一个或多个相关联装置耦合。本发明所说明的诸方面也可在分布式计算环境中实践，其中任务由经通信网络连接的远程处理设备执行。在分布式计算环境中，程序模块可置于本地和远程存储设备。
再参照图9，实现本发明各方面的示例性环境900包括计算机902，该计算机902具有处理单元904、系统存储器906、及系统总线908。系统总线908耦合系统组件，包括但不限于将系统存储器906耦合到处理单元904。处理单元904可以是各种可用处理器的任一种。双微处理器和其它多处理器架构也可被用作处理单元904。
系统总线908可以是若干类总线结构的任一种，它可进一步互连到存储器总线(有或没有存储器控制器)、外围总线、和使用各种可用总线架构任一种的局部总线。系统存储器906具有只读存储器(ROM)910和随机存储器(RAM)912。包含如起动时在计算机902元件间传送信息的基本例程的基本输入/输出系统(BIOS)，存储在诸如ROM、EPROM、EEPROM的非易失性存储器910上。
计算机902还包括内部硬盘驱动器914、磁盘驱动器916(例如读取或写入可移动磁盘918)和光盘驱动器920(例如读取CD-ROM 922，或读取或写入其它诸如DVD的大容量光学介质)。硬盘驱动器914、磁盘驱动器916、和光盘驱动器920分别通过硬盘驱动器接口924、磁盘驱动器接口926、和光盘驱动器接口928与系统总线908相连。这些驱动器和与之相关联的计算机可读介质提供数据、数据结构、计算机可读指令等等的非易失性存储。对于计算机902，驱动器和介质容纳了具适当数字化格式的广播编程的存储。尽管以上所述的计算机可读介质指向硬盘、可移动磁盘和CD，本领域技术人员将理解，其它类型的计算机可读介质，诸如zip盘、磁带盒、数字视频盘、闪存卡、盒式磁带等等，也能用于示例性操作环境，而且，任意这种介质可包含执行本发明方法的计算机可执行指令。
众多程序模块，包括操作系统930、一个或多个应用程序930、其它程序模块934、和程序数据936，可存储在驱动器和RAM 912中。可以理解本发明可用各种可购买的操作系统或操作系统的组合来实现。
用户可通过如键盘938和诸如鼠标940的定位装置向计算机902输入指令和信息。其它输入装置(未示出)可包括话筒、IR遥控器、游戏杆、游戏垫、卫星接收器、扫描仪等等。这些和其它输入装置通常通过与系统总线908耦合的输入装置接口942连接到处理单元904，但也可能通过其它接口相连，如并行端口、游戏端口、通用串行总线(USB)端口、IR接口等等。监视器944或其它类型显示装置也通过接口，如视频适配器946和系统总线908相连。除了显示器944，个人计算机通常包括其它外围输出装置(未示出)，如扬声器和打印机等。
计算机902可以在使用与一台或多台远程计算机，诸如远程计算机948经有线和/或无线通信的逻辑连接的网络化环境中运行。远程计算机948可以是工作站、服务器计算机、路由器、个人计算机、便携式计算机、基于微处理器的娱乐装置、对等装置或其它公共网络节点，而且通常包括上述与计算机902相关的许多或全部部件，尽管为简化起见在图1中仅显示了存储器存储装置950。所述逻辑连接包括局域网(LAN)952和广域网(WAN)954。这样的LAN和WAN网络化环境常见于办公室、企业范围计算机网络、内联网和因特网。
当用于LAN网络环境中时，计算机902通过有线和/或无线的通信网络接口或适配器956与局域网952连接。适配器956可有助于与LAN 952的有线或无线通信，其中包括用于与无线适配器956通信的无线接入点。当用于WAN网络环境中时，计算机902通常包括调制解调器958、或连接于LAN上的通信服务器、或具有其它用于在广域网954如因特网中建立通讯的装置。可以是内置式或外置式、有线或无线装置的调制解调器958与系统总线908通过串行端口接口942连接。在网络化环境中，与所述计算机902相关的程序模块或其一部分可存储在远程存储器/存储装置950中。可以理解，所示网络连接是示例性的，且也可以使用其它用于在计算机间建立通讯链路的装置。
计算机902与任意操作上置于无线通信中的无线装置或实体的通信是可操作的，例如打印机、扫描仪、台式和/或便携式计算机、便携式数字助理、任何关联于无线可检测标记的设备或地点(例如电话亭、报亭、厕所)、以及电话。这包括至少Wi-Fi和蓝牙TM无线技术。因而，通信可以是带有常规网络或至少两个装置之间特别通信的预定结构。
Wi-Fi或无线保真，使得家中沙发、旅馆房间内的床、或工作中的会议室无需接线就可与因特网连接。Wi-Fi是促使例如计算机的这种装置在室内和室外收发数据的像蜂巢式电话这类的无线技术；可在基站范围内的任何地方通信。Wi-Fi网络使用称为IEEE 802.11(a、b、g等)的无线电技术来提供安全、可靠、快速的无线连接。Wi-Fi网络能用于计算机之间的相互连接、与因特网、有线网络(使用IEEE802.3或以太网)的连接。Wi-Fi网络带有11兆比特/秒(Mbps)(802.11a)或54Mbps(802.11b)的数率，或包含两个频带(双频带)的产品在无许可证的2.4和5GHz的无线频带上操作，因此网络可提供类似于在许多办公室中使用的基本10BaseT有线以太网的实际性能。
本发明计算机902还可在HiperLAN技术中采用。HiperLAN是主要用于欧洲国家的无线局域网(WLAN)通信标准集。有两种规范HiperLAN/1和HiperLAN/2，两者都由欧洲通信标准学会制定。HiperLAN标准提供与在美国和其它采用国家中使用的IEEE 802.11WLAN标准相似的特征和能力。HiperLAN/1提供在无线频谱中5GHz范围内最高达20Mbps的通信。HiperLAN/2在相同RF频带中以最高54Mbps进行操作，并与用于发送和接收数据、图像、和语音通信的3G(第三代)WLAN系统兼容。HiperLAN/2有潜力，并有意用于结合5GHz RF频带中的相似系统在世界范围内实现。
现在参见图10，示出了根据本发明示例性计算环境1000的示意框图。系统1000包括一个或多个客户机1002。客户机1002可以是硬件和/或软件(例如线程、进程、计算装置)。客户机1002如可通过采用本发明包容cookie程序和/或相关联的上下文信息。系统1000还可包括一个或多个服务器1004。服务器1004也可以是硬件和/或软件(例如线程、进程、计算装置)。服务器1004可采用本发明包容线程来执行转换。在客户机1002和服务器1004间的一可能通信可能是以适于在两个或多个计算机进程间传送的数据包形式进行。数据包可包括例如cookie程序和/或相关联的上下文信息。系统1000包括可用来便于客户机1002和服务器1004间通信的通信框架1006(例如诸如因特网的全球通信网络)。
通信可通过有线(包括光纤)和/或无线技术来推动。客户机1002可与一个或多个用来存储客户机1002本地信息(例如cookie程序和/或相关联上下文信息)的客户机数据存储1008在操作上连接。类似地，服务器1004可与一个或多个用来存储对服务器1004是本地信息的服务器数据存储1010在操作上连接。
以上所述包括本发明的诸多示例。当然，为描述本发明而对组件或方法的每一能想到的组合进行描述是不可能的，但本领域普通技术人员明白，本发明的更多组合和更改是可能的。因此，本发明旨在包含所有这样的落在所附权利要求书精神和范围内的变更、修改、和变化。此外，就用于具体实施方式
或权利要求书的术语“具有”而言，这种术语意在以类似于在权利要求书中术语“包括”作连接词的方式作包含意义解。
权利要求
1.一种便于彩色映像图像压缩的方法，其特征在于，包括压缩彩色映像图像的象素的背景/前景标记；以及压缩所述彩色映射图像的前景象素的彩色索引信息。
2.如权利要求1所述的方法，其特征在于，还包括采用二级编码译码压缩器来压缩所述图像的黑白表示。
3.如权利要求1所述的方法，其特征在于，还包括采用LZ熵编码器来压缩所述图像前景象素的彩色索引信息。
4.如权利要求1所述的方法，其特征在于，还包括采用一解码器以选择性地解码与彩色映射图像的象素相关联的彩色索引信息和/或背景/前景标记信息，以便提供输出图像。
5.如权利要求1所述的方法，其特征在于，还包括产生对应于与所述图像相关联的经压缩文件的标题，其中所述标题包括表示所述图像背景色的值(vB)。
6.如权利要求5所述的方法，其特征在于，vB等于表示所述图像的最大数量象素所呈现的色彩值。
7.如权利要求5所述的方法，其特征在于，还包括通过把相应象素的值设置为等于或不等于vB的函数，来把所述图像映射成相对应的黑白图像。
8.如权利要求7所述的方法，其特征在于，还包括至少部分地基于从所述黑白图像确定的前景象素位置来编码前景象素的色彩值。
9.如权利要求8所述的方法，其特征在于，所述前景象素色彩值的编码包括把所述前景象素的值按扫描顺序附加到字符串(S)中。
10.如权利要求9所述的方法，其特征在于，采用无损压缩方案来编码所述字符串S。
11.如权利要求9所述的方法，其特征在于，采用有损压缩方案来编码所述字符串S。
12.如权利要求1所述的方法，其特征在于，压缩彩色索引信息包括执行八分树缩减。
13.如权利要求1所述的方法，其特征在于，压缩彩色索引信息包括执行向量量化。
14.如权利要求13所述的方法，其特征在于，执行向量量化包括采用Linde-Buzo-Gray算法。
15.如权利要求1所述的方法，其特征在于，压缩彩色索引信息包括一种用于使原始色彩和经编码色彩之间的均方误差最小的技术。
16.一种便于多级图像适应性压缩的系统，其特征在于，包括一控制组件，其接收数字图像并确定编码所述图像的适当模式；一压缩组件，其压缩与所述数字图像中象素相关联的背景/前景标记；以及一二级编码译码器，其编码包括与所述图像相关联的背景和前景象素信息的字符串。
17.如权利要求16所述的系统，其特征在于，所述压缩组件还压缩与多级图像中前景象素相关联的彩色索引信息。
18.如权利要求17所述的系统，其特征在于，所述压缩组件包括压缩所述彩色索引信息的LZ熵编码器。
19.如权利要求18所述的系统，其特征在于，还包括作与系统操作相关的判断和/或推导的AI组件。
20.如权利要求19所述的系统，其特征在于，所述AI组件采用向量机器、神经网络、专家系统、贝叶斯置信网络、模糊逻辑、数据融合引擎中的至少一个，以执行与系统操作相关的判断和/或推断。
21.如权利要求17所述的系统，其特征在于，背景和前景象素信息的经编码字符串具有一标题，其包括与图像尺寸、背景色、所述图像中的色彩数量、以及所述图像的色彩表相关的信息。
22.如权利要求21所述的系统，其特征在于，还包括一解码器，其读取所述标题和经编码字符串，并解码第一比特流组件和第二比特流组件。
23.如权利要求22所述的系统，其特征在于，所述第一比特流组件包括与所述原始图像的二级版本相关的信息。
24.如权利要求22所述的系统，其特征在于，所述第二比特流组件包括与所述原始图像的彩色版本相关的信息。
25.如权利要求24所述的系统，其特征在于，所述解码器根据所述色彩表把色彩赋予多个前景索引的每一个。
26.一种便于多级图像双压缩的系统，其特征在于，包括一控制组件，其分析与所述多级图像相关联的信息；一二级编码译码压缩器，其压缩背景和前景象素以构建所述多级图像的黑白表示；以及一熵编码器，其压缩与所述前景象素相关联的彩色索引信息。
27.如权利要求26所述的系统，其特征在于，所述熵编码器是Ziv-Lempel编码器。
28.如权利要求26所述的系统，其特征在于，所述控制组件分析带宽可用性以确定是否可成功地传送所述多级图像的黑白或彩色表示。
29.如权利要求28所述的系统，其特征在于，所述控制组件把经编码信息拆分成所述多级图像的黑白和彩色版本。
30.如权利要求29所述的系统，其特征在于，当带宽可用性在预定阈值之下时，所述控制组件仅传送所述多级图像的黑白版本。
31.一种便于多级图像双解压缩的系统，其特征在于，包括一控制组件，其分析与经压缩多级图像相关联的信息；以及一解码器，其读取具有一标题的背景和前景象素信息的经编码字符串，所述标题包括与图像尺寸、背景色、所述图像中的色彩数量、以及所述图像的色彩表相关的信息。
32.如权利要求31所述的系统，其特征在于，所述解码器基于从所述经编码字符串和标题收集的信息来解码第一比特流组件和第二比特流组件。
33.如权利要求32所述的系统，其特征在于，所述第一比特流组件包括与原始图像的二级版本相关联的信息。
34.如权利要求33所述的系统，其特征在于，还包括解码所述第一比特流组件的二级解码器。
35.如权利要求32所述的系统，其特征在于，所述第二比特流包括与原始图像彩色版本相关的信息。
36.如权利要求35所述的系统，其特征在于，还包括解码所述第二比特流组件的熵解码器。
37.如权利要求31所述的系统，其特征在于，所述解码器根据所述色彩表把色彩赋予多个前景索引的每一个。
38.一种便于多级图像适应性压缩的系统，其特征在于，包括一装置，用于接收图像；一装置，用于编码所述图像的前景和背景象素；以及一装置，用于用与所述前景象素相关联的值编码字符串。
39.如权利要求38所述的系统，其特征在于，还包括一装置，用于把与所述图像中象素色彩相关联的色彩表M缩减成与所述前景象素的色彩值相关联的彩色表M’。
40.如权利要求39所述的系统，其特征在于，所述用于缩减所述彩色表M的装置包括向量量化技术和八分树技术的至少其一。
全文摘要
本发明便于诸如白板的经捕捉数字图像等等多级图像的适应性压缩，该多级图像编码包括彩色图像组件和黑白图像组件的位流。基于用户需要、接收装置能力等等，彩色图像和黑白图像的任一个或两者都可以是对用户的输出。
文档编号H04N1/41GK1694486SQ200510070019
公开日2005年11月9日申请日期2005年4月29日优先权日2004年4月30日
发明者E·L·任斯豪, H·S·马尔瓦申请人:微软公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：E.L.任斯豪;H.S.马尔瓦
技术所有人：微软公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。