输入和输出彩色图象及连续变化色调图象的方法和设备的制作方法

文档序号:7572476阅读:229来源:国知局
专利名称:输入和输出彩色图象及连续变化色调图象的方法和设备的制作方法
技术领域
本发明涉及输入和输出彩色图象及单色连续色调变化图象的方法和设备。在本说明书中,“连续色调变化图象”被用作为一个概念,用以代表除了由白区和黑区组成的二元(二值)色调图象以外的各种方式的图象色调。其色调分级数有时为256、512或1024。在本说明书中,色调连续变化的图象有时被称作“连续变化色调图象”或简称“连续色调图象”。类似地,“二元色调图象”有时简写为“二元图象”。
通过把原始图象分解为基本色彩,可以把彩色图象分解为三种或四种基本色彩的图象。由于这一原因,对分解后的图象的处理可以按照单色连续色调变化图象同样的方式对待。把彩色图象分解成基本色彩图象或把各基本色彩图象合成为统一的彩色图象是一种公知技术。本发明的意义在于对单色连续变化色调的图象进行的处理。这样,下面的解释主要是关于对单色连续变化色调图象的处理。对彩色图象的处理可以转化为三次或四次对基本色彩图象的处理。
图象已经逐渐地被作为数字信息的集合来对待。数字信息具有二个意义,一是通过对图象取样,能把图象分解成象元(pixel);二是通过对每个象元的色调量化能把色调转换成有限的级数。换句话说,“数字”的意义在于空间上分离的离散象元以及在象元色调上离散的色度(degree)。
再有,各种图象应用领域中的目标图象一年比一年更复杂。图象处理所提供的服务领域正在扩展。目标图象不仅仅是照片,还有手画的图象、字符以及计算机图形。图象处理服务不仅局限于图象的生成,还扩展到对目标图象进行任意比例的放大,以及自由地画出和印刷所处理的图象。
这些不同的目的要求一种能够输入和输出各类图象、变换图象的尺寸和取向、以及再生高质量的目标图象的新方法。此外,还希望压缩图象数据和减少数据量,以节约存储器容量和缩短处理时间。
本发明针对的图象包括照片、美术字、印刷字、图表和广告标识或绘画。连续变化色调图象是指这些图象中的基本色的色调(强度)在空间上连续变化。本发明除了单色图象外也包括彩色图象,因为通过把目标彩色图象分解成基本色,能把彩色图象转换成四个或三个基本色单色图象。换句话说,本发明的目的是对彩色强度连续变化的图象进行图象处理。
连续变化色调图象被用作为简单二值图象(它简单地由黑区及黑区以外的白区构成)的反义词。这样,本发明的目的不仅包括色调变化的单色图象,也包括色调变化的彩色图象。然而,由于其丰富的普遍性,本发明也能处理更简单的二元图象。
所以,本发明的目标是读入连续色调图象,从输入图象得到多值数据,消除噪声,减少数据量,以较少存储器容量存储被压缩的数据,以及由数据再生出原始连续色调图象而且不损失其特点。
在彩色图象的情况中,本发明有准备地把读入的原始彩色图象分解成四个或三个基本色图象。然后本发明以同样的方式独立地处理这些基本色单色图象,即从分解的单色数据中得到多值数据,消除噪声,减少数据量,将压缩过的数据存入存储器,由数据再生出基本色图象而不损失其固有特征,以及把这些基本色图象合成为单一的连续色调彩色图象。
本申请要求对日本专利申请No.8-317017(317017、’96)的优先权,该专利申请递交于1996年11月12日,并在这里作为参考加以引用。
为输入、存储和再生连续色调图象,已有人提出了三类数据处理方法。
(A)位图(bit map)数据法,它把目标图象数据作为位图数据集合处理。
(B)离散余弦变换法(DCT法),它利用离散余弦变换压缩图象数据。
(C)函数近似法,它用特殊函数近似图象数据。
下面简单解释这三种已有方法。
(A)位图数据法是处理连续色调图象的最普通的方法,其作法是把目标图象分解成单个象元,确定单个象元的色调值(色度),无数据压缩地存储所有象元的色调值,以及直接从存储的色调值数据再生图象。这种方法存储所有象元的所有色调数据。这种处理是如此地简单,以至当前许多人采用位图法处理连续色调图象。
然而,这种方法以其大量数据而令人烦恼,因为此法必须存储所有象元的原始色调数据。如此大量的数据给位图数据法带来了致命的弱点。处理大量数据需要大容量存储器和很长的处理时间。
此外,本方法试图通过直接放大、缩小或变换所有有关象元的坐标来放大、缩小或变换目标图象,因为所有色调数据是作为单个象元的固有值存储的。位图计算降低了再生图象的质量。单个图象分量(Component)的外缘往往变模糊。一些人曾提出改进办法以克服图数据法的固有缺点①W.K.Pratt“数字图象处理”,Wiley Interseience,NewYork(1978),②J.A.Parker,R.V.Kenyon及D.E.Troxel“图象再取样内插法的比较,”IEEE Trans,MI,MI-2,1,pp.31-39(1983),③Kazuo toraichi,Masaru Kamada,Satomi Ishiuchi,Sai Yang及Ryoichi Mori,“使用样条(spline)内插改善视频硬拷贝图象质量”,Tans.IEICE Jpn(D)Vol.J71-D,No.7,pp.1276-1285(1988)④Akira Tanaka,Hideyuki Imai,Masaaki Miyakoshi,Jun Date,“用多重分辨力分析放大数字图象”,Trans.IEICE.Jpn(D-II)Vol.J79-D-II,No.5,pp819-825(1996)。
①和②建议用Sinc函数改善对位图数据的内括,并输出内插过的数据。③建议用分段多项式改善对位图数据的内插,并输出内插过的数据。④试图以多种分辨力的多重分辨力方法分析位图数据,并由这种分析对位图数据内插,并输出由多重分辨力分析内插的数据。这些试验能放大或缩小图象,因为根据某些规则内差可得到未知数据。这些改进仍由于大量的位图数据而令人烦恼,因为它们存储目标图象参数作为位图数据,并由所存储的位图数据来放大、缩小或再生图象。所以,这些建议不能最终解决位图数据法的固有困难。
(B)离散余弦变换法(DCT法)离散余弦变换法对于有连续变化色调的图象有效,但对于色调急剧变化的图象无能为力。色调的不连续性给DC带来“块畸变”或“边缘退化”。这种对快变化色调的不适用性导致的致命弱点是当图象包括各类图象时会降低图象质量。另一个弱点是目标图象被放大时图象会退化。放大、缩小或变换会降低图象质量。有人曾建议对DCT法进行改进以减轻质量降低程度。但这些尝试仍不足以克服这些困难。
⑤Koichi Fukuda,Hirohiko Minakuchi,Akira KawoKami,“对边缘块的DCT采用AR假说的静态图象编码方法”,Trans IEICEJpn(D-II)J76-D-II,4pp 827-834,(1993)。
⑦ Eiji shinbori及Mikio Takagi,“对DCT采用Gerchberg-Papoulis重复法来实现图象的高质量放大”,TransIEICE Jpn(D-II)J-76-D-II,No.9,pp1932-1940(1993)。
⑤建议用AR假设对DCT法进行改进,以减轻边缘部分质量降低程度。然而⑤不适用于放大、缩小或变换。⑥建议采用准再生(quasi-revival)方法来解决放大时的边缘部分质量降低问题。由于仍有令人烦恼的大数据量,这些改进仍不能用于解决本发明意欲解决的问题。
(C)函数近似法本方法试图利用一些函数来近似图象的各个部分。
⑦Takahiko Horiuchi,Yasuhiro Ohtaki,Kazuo Toraichi,“用于多字体自动近似的结点多步提取法”,Trans,IEE Jpn(C),Vol.113-C,No.12,pp1136-1143(1993)。
⑧日本专利申请4-259137号(259137/’92)⑨日本专利申请No.4-269646号(269646/’92)。
⑩ K.Toraichi,T.Horiuchi,R.E.Kalman,Y.Ohtaki及H.Nagasaki,“压缩Left Ventricular Cjneangioqrams数据量”,IEEE Trans.BME,Vol.40,No.6,pp579-588(1993)。
这三种处理方法⑦至⑨不是针对连续变化色调的图象,而是针对只有白象素和黑象素而无中间色调档次的二元色调图象。这些方法推导出黑部分的轮廓并处理这些轮廓。所以,这些方法完全不适用于连续变化色调的图象,如照片,其中不能清楚地确定其边缘线。二元色调方法不能处理连续变化色调图象。
⑩建议采用特殊函数来近似象元从左到右(即光栅顺序)构成的所有水平线,以此来处理医用连续变化色调图象。我们假定在x方向有I个象元,在y方向有J个象元。x方向定义为水平线上从左到右。y方向定义为垂直线上从顶到底。I和J为大数,例如512至2048。因为⑩要用一组特殊函数来近似沿水平向排列的具有多种色调的全部I个象元,而又不与象元原始值产生严重偏差,则近似函数必须是多个高阶多项式的集合。利用高阶函数以近似沿水平线排列的所有象元的大量色调值,使⑩的方法要受定义高阶函数所用大量参数之苦。过量的参数个数阻止了方法⑩去压缩数据以存于存储器中。参数数量是其一个缺点。在光栅顺序近似方法⑩中还有一个更严重的困难。这就是近似函数在y方向的不连续性。光栅顺序扫描近似法尊重x方向的连续性,但忽略了y方向的连续性。这样,在再生图象时常常在y方向出现严重的不连续性。y方向的不连续性降低了再生图象的质量,特别是在放大时更是如此。光栅扫描近似法⑩完全不能旋转或各向异性地放大图象。
y方向的不连续性和不能放大或变换是光栅顺序近似法⑩的固有的严重困难,这种方法按光栅顺序扫描图象,按这一同一顺序积累数据,并用一些函数来近似沿直线排列的数据。这样,光栅顺序扫描近似法仍不能适用于本发明试图解决的问题。换句话说,尚没有有效的方法来处理连续变化色调图象。
现在简要描述本发明的目的(1)自动压缩连续变化色调图象数据,(2)方便可行地放大、缩小和变换连续变化色调图象,以及(3)以小量数据来保存目标图象。
前述先有技术①至⑩不能满足这三项要求。
本发明的目的在于提供一种用于连续变化色调图象的输入和输出方法及设备,所包括的步骤是光学读入或作出原始的连续变化色调图象,压缩图象数据,把被压缩数据存于存储器,以及在短时间内以任意尺度以任意位置再生图象。本发明的另一目的是提供一种能自动压缩连续变化色调图象的图象数据的输入和输出方法及设备。本发明又一个目的是提供一种能放大、紧缩或变换连续变化色调图象又不降低图象质量的输入和输出方法及设备。再一个目的是提供一种以小量数据保存目标图象的输入和输出方法及设备。
本发明的目的还在于提供一种方便可行的输入和输出方法及设备,以把目标图象的图象数据转换成多变量矢量数据和在任意位置以任意尺度再生目标图象。再一个目的是提供一种输入和输出方法及设备,它能以压缩数据存储输入图象,并能在印刷机或计算机中处理被压缩的数据。再一个目的是提供一种输入和输出方法及设备,它能在两个远程终端之间无线或通过电话线传送图象数据。
为实现上述目标,并根据本发明的目的,下面将详细地描述各个实施例。
本发明的输入和输出设备包括一个图象存储装置,用于存储由图象扫描仪光学读入的图象或由其他图象输入装置读入的图象的图象数据。
A.图象存储装置1B.分区装置C.区域存储装置
D.边界提取装置E.分支总提取装置F.边界存储装置G.转折点提取装置H.边界近似装置I.区域数据存储器J.差图象产生装置K.差图象存储装置L.差图象分区装置M.差块存储装置N.数据近似装置O.压缩数据存储装置P.编码装置Q.编码数据输出装置R.编码数据存储装置S.编码数据输入装置T.解码装置U.差块恢复装置V.差图象提取装置W.连续色调图象再生装置X.连续色调图象输出装置一组上述装置对于处理单色图象是足够的。在彩色图象的情况中,在处理过程的开始步骤及最后步骤分别加上彩色分解装置和彩色合成装置。因此,这些增加的装置是y.彩色分解装置z.彩色合成装置所以,本发明把彩色图象分解成基本色单色图象,以相同的过程并行处理分解后的各个图象,得到各彩色的压缩数据,再生单色基本色图象,以及把一组基本色图象合成为一幅彩色图象。
上述处理把差(相减的)图象分成若干块。否则,可以由某些函数来近似整个差分图象,从而略去差图象分块及各块组合处理。另一种情况是,当不必对数据编码和解码时,装是P到T也可以略去。
现在参考图2所示示例图象SIDBA“女孩”作为连续变化色调图象的实例,来解释本发明的处理过程。
〔连续变化色调图象情况〕首先,由图象扫描仪读入“女孩”原始照片。这是图象的光学输入。另一种方法是也能在计算机显示器上绘出草图。然后,由分区装置将原始图象分成具有类似色调(密度)的区域。每个区域用平均色调均匀画出。被分成以平均色调绘出的多个区域的图象称作“平均色调图象”。平均色调图象存储于区域存储装置。
由于图象被分成大量区域,在相邻区域之间出现许多边界。每个边界封闭一个区域。每个边界是一个闭环。但是各个边界不是分离的。一些边界连在一起。有些三个或四个边界相遇的点。多于二个边界相遇的点称作“分支点”。分支点是确定边界的一类特征点。被二个相邻分支点分隔成的一段边界称作“边界段(interval)”。一个闭环边界是若干以分支点为终点的开放曲线构成的边界段的集合。分支点是由边界集合推演出来的。
另一类特征点是“转折点”,在转折点处边界段不连续地改变方向。分支点和转折点位于边界上,表现出边界的特征。转折点是通过调查边界的变化提取出来的。分支点和转折点是边界上的奇点。
一条边界由分支点分隔成若干边界段。边界段又由转折点分成局部线(Partial line)。由转折点和分支点分隔成的每个局部线是有二个端点的曲线或直线。在本说明中把边界段的局部线称作“子边界”。子边界由一些简单函数来近似。由于每个子边界没有转折点或分支点之类奇点,子边界能由低阶多项式近似。一旦由一些函数来近似子边界,所存储的子边界上点系列的坐标便可以放弃。子边界由分支点 转折点及近似函数来确定和存储,而不由单个点来确定和存储。放弃子边界上点系列的单个坐标减少了边界数据量。
差(相减)图象定义为原始图象与存储于区域存储装置中的平均色调图象之差。于是,差(相减)图象是从原始图象中减去平均色调图象而计算出来的。因为平均色调图象是用其自己的平均色调来画出每个区域的,所以从原始图象中减去平均色调图象即等效于计算其色调与局部平均色调之差。从原始图象中减去平均色调所产生的图象只是由色调的弱起伏构成。由相减造成的图象称作“差(相减)图象”。尽管有大量分区,差图象只有一个。差图象只包括色调的低频分量,它们的变化平缓。色调的高频分量已经分配给平均色调图象了。差(相减)图象可由一些适当的函数(见下文)近似。因为差图象只包含平缓变化的色调,低阶多项式足以近似这个相减图象。于是产生了表示相减图象的压缩数据。边界的函数近似及差图象的函数近似二者使这种方法极大地减少了数据量。
例如,如果假定原始图象和再生图象的质量为30dB(p-p/rms),表明数据量的位率(bitrate)的计算值是1.98〔位/象元〕。由于原始数据是表示成8〔位/象元〕,在本例中的数据压缩成原始数据量的大约25%。
上面针对在连续变化色调图象情况对本发明的数据处理所作的简单解释。本发明的主要目的是处理连续变化色调图象。二元色调图象是排除在连续色调变化图象的概念之外的。然而,二元图化是连续色调变化图象的简化极限。连续色调变化图象的处理远比对二元图象(黑/白)处理困难得多。对连续变化色调图象有效的方法也能应用于二元图象。本发明当然能以同样的方式处理二元图象。在二元图象中的具体处理比在连续色调图象中简单。参考图3解释了处理二元图象的实例。〔二元图象的情况〕图3显示出处理一个印成粗体字的原始二元中文字“智”。图3(a)是原始图象。这个字是在白色背景上写的黑字。白区和黑区的色调均为常数。原始图象是用图象扫描仪读入的,这与连续色调变化图象所用方式完全相同。这一方法推演出有类似色调的象元区域,用各区域的平均色调画出各区域,并把平均色调图象存储于区域存储装置。
由于目标是简单的二元图象,其边界恰好等于字的轮廓。在轮廓线内的平均色调等于黑区内的均一色调。所有边界是独立的、相互隔绝的而且彼此分开的。这些轮廓线既元交叉点也无分支点。没有边界把这个二元图分成多于二个区域。不存在三个或四个不同区域相接触的分支点。不存在分支点、分离的轮廓线、二值区域、以及区域的单调性都简化了对二元图象的处理。
在轮廓线上可能有转折点。于是边界(即轮廓线)可以在转折点分成子边界。在转折点切断的子边界没有奇点。子边界可以由一些适当的函数近似。黑区以单色调画出。图3(b)是存于区域存储装置内的平均色调图象。平均色调图象类似于图3(a)的原始图象。图3(c)给出边界,其边界恰好是二元图象中黑色部分的轮廓。图3(d)是提取分支点步骤之后的图。因为轮廓线不包括分支点,提取分支点对图没有影响。图3(d)等于图3(c)。
图3(e)给出在轮廓线上提取转折点的步骤。用黑点表示转折点。从原始图象(图3(a))中减去平均色调图象(图3b)计算出相减图象。因为平均色调图象 等于原始图象,所以差图象在整个平面上是灰的。图3(f)以灰色显示差图象。把起伏色调加到中间色调(L/2)上构成差色调。若无起伏,则差图象是单调灰色。其近似函数表示常系数简单平面。
在二元图象的情况里没有色调近似误差。这样,边界(即轮廓)是确定图象的唯一元素。对边界的准确表示允许本方法以具有编码可逆性的高质量来压缩图象数据。在本例中,位率是0.22〔位/象元〕。因为原始图象用1〔位/象元〕表示,用函数近似使数据压缩到22%。
上例讲清了输入图象数据、处理图象数据、压缩数据、及把被压缩数据存入存储器各步骤。因为输出数据的步骤是输入、压缩和存储图象数据的逆步骤。输出是由从输入到存储的处理过程自动确定的。除了连续色调图象外,本发明能处理二元图象。
通过下文中参考若干附图仅以实例给出的描述,将能更充分地理解本发明。这些附图是

图1的方框图给出用于连续色调图象的输入和输出设备的各个装置,包括图象存储装置、区域产生装置、特征点导出装置、相减图象产生装置、编码数据产生装置、再生数据产生装置、以及存储算术装置所得结果的存储装置。
图2(a)是“SIDBA/女孩”原始的起始图象,作为连续色调图象的一例。
图2(b)是把图2(a)的原始图象分成具有类似色调的区域并以平均色调画出每个区所得到的平均色调图象。
图2(c)是作为邻区之间边界从分区图象中提取出来的边界集合。
图2(d)是从边界中提取出来的分支点集合。
图2(e)是从边界中提取出来的转折点集合。
图2(f)是从原始图中减去平均色调图象得到的差图象。
图2(g)是把再生差图象与再生平均色调图象相加得到的再生图象。
图3(a)是粗体中文字“智的原始的起始图象,作为二元图象的一例。
图3(b)是把图3(a)的原始图象分成具有类似色调的区域并以平均色调画出每个区所得到的平均色调图象。
图3(c)是作为邻区之间边界从分区图象中提取出来的边界集合。在二元图象情况中,其边界与字的轮廓相同。
图3(d)是从边界中提取出来的边界和分支点集合。在二元图象的情况中没有分支点。
图3(e)是从边界中提取出来的转折点集合,用黑点表示。
图3(f)是从原始图(图3(a))中减去平均色调图象(图3(b))得到的差图象。
图3(g)是把再生的差图象与再生的平均色调图象相加得到的再生图象。
图4(a)是图2(a)所示起始图象“女孩”的平均色调图象,这里色调总步数为256,色调宽度参数是W=8。
图4(b)是图2(a)所示起始图象“女孩”的平均色调图象,这里色调总步数为256,色调宽度参数是W=16。
图4(c)是图2(a)所示起始图象“女孩”的平均色调图象,这里色调总步数为256,色调宽度参数是W=32。
图5(a)用于解释二维图象平面的整个范围,它在x方向有I个象元,在y方向有J个象元。与传统定义不同,这里的整数坐标点确定在象元的角上。其最左上角是原点(0,0)。x方向定义为从左向右。y方向定义为向下。最右下点是(I,J)。第i行、j列的象元的中心点表示为(i+0.5,j+0.5)。该象元由整数坐标点(i,j),(i+1,j),(i,j+1)及(i+1,j+1)构成的四角封闭。
图5(b)是图5(a)所示图象平面起始角部分的放大图。
图6(a)是使原始直线被放大的一组直线排列的9×1象元。
图6(b)是同样的直线排列象元图,给出把整数坐标定位于象元中心的一种坐标定义。
图6(c)是把整数点定义于象元中心的情况下直线排列象元的放大集合图。因为排列的象元集合在y方向无宽度,原始线在y方向不能被放大。
图6(d)是同样的直线排列象元图,给出另一种坐标定义把整数坐标定义在象元角处。
图6(e)是把整数点定义在象元角上的情况下图6(a)直线的放大图。因为直线象元集合即使在其垂直于长度的方向上也有确定的宽度,故原始线能被各向同性地放大。
图7(a)是一图象平面的全范围解释图,用于阐明以(2×2)窗口的光栅扫描来寻找图象平面上的分支点。该窗口从最左象元到最右象元扫描一行,再从左到右扫描下一行,依此类推。
图7(b)是在(2×2)窗中出现的四个象元举例。由于该窗口包括二白二灰象元,故中心点不是分支点。
图7(c)是在(2×2)窗口出现的四个象元举例。由于窗口包括一白、一灰和二黑象元,窗口中的中心点是一个分支点,在这一点有二个以上区域相遇。
图8(a)是有五个区域的解释性图象,给出其边界段的定义是边界的二分之点之间部分,γ、δ及ε是分支点。
图8(b)是图8(a)的放大部分,有二个分支点γ和δ,显示出边界段的定义。
图9(a)用于解释α=2的情况下局部方向矢量的定义。局部方向矢量是一个箭头,从突出(outstanding)点(ζ)之前二点的点(η)延伸到突出点(ζ)之后二点的点(κ)。
图9(b)用于说明沿边界系列移动的局部方向矢量的变化。
图10是在边界系列中每个点上定义的量化局部方向矢量图。
图11(a)是解释图,说明由量化局部方向矢量的改变来确定转折点。
图11(b)是象元集合,用以显示位于象元系列拐角的转折点。
图12(a)是差图象,它定义为原始图象与平均色调图象之差,这里是平均色调图象的色调宽度参数W=8的情况。
图12(b)是另一个差图象,它定义为原始图象与平均色调图象之差,这里是平均色调图象的色调宽度参数W=16的情况。
图12(c)是另一个差图象,它定义为原始图象与平均色调图象之差,这里是平均色调图象的色调宽度参数是W=32。
图13所示差图象分成沿长度方向和与其交叉方向分成小块,以利于近似差图象色调的算术处理。
图14(a)是将由本发明处理作为连续色调图象一例的“女孩”原始图象。
图14(b)是将由本发明处理作为二元图象一例的中文字“爱”的原始图象。
图15给出对于各种色调宽度参数W,其误差参数ε’(SNRdB)和位数每象元〔位/象元〕之间的关系。
图16(a)是由本发明对图14(a)的原始图象“女孩”进行数据压缩、存储和再生所得到的图象。
图16(b)是由本发明对图14(b)的中文字“爱”原始图象进行数据压缩、存储和再生所得到的图象。
图17(a)是小于图14(a)原始“女孩”图象的再生图象。
图17(b)是与图14(a)原始“女孩”图象相同大小的再生图象。
图17(c)是大于图14(a)原始“女孩”图象的再生图象。
图18(a)是无分支点闭环的简化轮廓。
图18(b)是有分支点闭环的简化边界。
图19是子段T/M=1的一阶(m=1)样条基函数N-1(t)的图示。
图20是子段T/M=1的二阶(m=2)样条基函数No(t)的图示。
图21是二阶样条基函数的双正交函数的图示。
图22是处理彩色图象方框图,图示出把原始彩色图象分解成基本色图象(Y)、(M)、(C)及(K),用本发明的方法处理每个基本色图象,再生基本色图象,以及把各基本色图象组合成单一的全彩色图象。
本发明由图1所示装置(A)至(X)处理连续色调图象,下面将对此进行详细解释。
〔 A.图象存储装置1〕一幅目标图象是有连续变化色调的写在一张纸上的绘画、图表、字符等或者照片。目标图象有时是用图象扫描仪光学输入并分解成具有色调参数的象元。另一种作法是用鼠标或数字化仪把绘画、图表或字符画在计算机屏幕上,或者是由某些记录介质(如软盘、硬盘或CD)提供的数字记录信息形式的目标图象。有多种方式把目标图象输入到本发明的设备中。
图象存储装置1(A)是存储输入图象全部象元色调的装置。在单色图象的情况中,一个象元只有单个色调参数,色调级数为例如256、512等。在彩色图象的情况,图象应分解成四或三个基本色图象。一旦目标按色彩分解,则目标图象能级转化成四或三个独立的单色图象。
一个象元有四或三个色调参数。每个基本色图象是一个单色连续色调图象。于是,处理过程可转化为单色图象的情况。输入图象可由定义在整个图象上的二维函数来表示,以给出色调分布。
输入图象的色调由定义在二维坐标上的连续函数f(x,y)给出。虽然色调分级是数字数,例如256、512等,但现在假定色调函数f(x,y)是取值在0和1之间的归一化函数。定义域(x,y)可根据目标图象而改变。在本例中,定义域(x,y)也假定为归一化的1×1见方的范围。通过归一化步骤,可以由归一化色调函数f(x,y)及归一化定义域(x,y)来代表任意的连续色调图象0≤f(x,y)≤1,0≤x≤1,0≤y≤1。
(1)在原始图象中,色调f(x,y)和位置(x,y)在允许区间内取连续值。然而,当由图象扫描仪读入图象时,这些变量取离散值。色调f(x,y)被量化为0和1之间的L级。x坐标也被量化为I点,y坐标被取样为J点。与连续函数f(x,y)及连续坐标(x,y)不同,取样的坐标值由离散点(xi,yj)表示,而量化色调由g(xi,yj)表示。
g(xi,yj){0,1,2,…,L-1},i=0,1,2,…,I-1,j=0,1,2,…,J-1(2)L是色调的离散级数。I是x方向象元数,J是y方向象元数。图象平面有I列和J行象元。象元坐标与边界坐标是不同的。边界坐标取在象元边角。象元坐标代表象元中心的坐标。这样,二者坐标彼此相差半个象元。象元总数是IJ。三个尺寸参数可自由地确定。这些参数越大,则再生图象的质量越高。参数I,J及L数越大,则要求存储器容量越大而处理时间越长。
图象存储装置1(A)按原样存储所有象元的全部数字化的色调参数。在数据压缩之前,所有图象数据必须暂时存府于图象存储装置(A)中。当然,这要消耗大存府容量,因为图象存储装置(A)包含所有的图象数据;所有象元的所有色调值。然而,当图象数据被本发明的步骤处理时,图象数据便立即被抹掉。当压缩处理完成之后,在计算机存储装置中便不再保留原始图象数据。这样,暂时占用存储器不会带来严重问题。
〔B.分区装置〕这是本发明的特征点之一。前述先有技术的图象处理方法①至⑩根本不把输入图象在空间上分割成多个区域。本发明按不同色调把图象在空间上分成多个区域。这种分区完全是一种初始的方式。分区对于输入图象而言既不是先天的也不是固有的。这里的分区不对应于图象中的具体的单个的目标。分区完全不同于二元色调图象中对于目标轮廓的提取。本发明强行造成这些在图象中原本不存在的区域。代替实际目标或事物,本发明在输入图象上想象地找出区域,并把图象划分成各单独的区域。
本发明是如何把图象划分成区域的呢?本发明选择彼此相邻并有相似色调的象元作为一个区域的成员。属于同一区域的判据是色调的相似性。如果二个相邻象元在允许的容限范围内有相似色调,则它们将被分类于同一区域。如果另二个相邻象元的色调差异超过了容限,则它们将被分到不同的区域。当然,象元的连续性在图象分区中是至关重要的。象元的连续性保证了区域的空间连续性。基于色调相似性的分区是本发明的特征。初步的基于色调的分区带来一些好处1.产生能级一些带有少量参数的适当函数来近似的边界;2.独立处理单个区域;以及3.通过把有类似色调的象元集中到共同区间,能实现数据压缩。
好处3是最重要的。每个人为提取的区域是具有几乎相同色调的象元的集合。
然后在每个区域中计算色调平均值。平均色调是定义于区域的参数。平均色调是一个区域中的公共的单一的值。但是,对于不同区域,其平均色调是不同的。
进一步的处理是,对所有区域计算单个象元色调与平均色调之差。单个象元的色调与平均色调之差称为“差色调”或“减色调”。在每个区域中差色调的平均值总是0。相减色调的变化小而且缓慢。差(相减)色调的变化能很容易地由低阶函数对所有区域来近似。
上述三个好处对本发明有实质意义。现在初步解释这三个特点的内在意义。在原始图象中色调可以随机地二维变化。在一些部分的色调变化可能是平滑和缓慢的,但在另一些部分则可能是急剧的和不连续的。因为近似函数必须逼真地反映色调变化,对于急剧的、不连续变化的部分的近似需要带有大量参数的高阶多项式。
参数个数增加会浪费数据处理时间和存储空间。除了在计算和累加过程中的不方便之外,由高阶多项式近似伴有另一个致命弱点。高阶多项式近似容易引入不必要的振荡,而这些振荡并不是原本包括在色调变化之中的。这不必要振荡的副产品降低了近似的精度。
用在大范围内延续的连续函数一举近似整个图象是愚蠢的。于是本发明把图象初步分成多个小区,这些小区只有色调类似的象元。有二个理由说明这种分区有利于由多项式近似。
一个理由是窄范围近似降低了多项式阶数并减少了确定多项式的参数个数。另一个理由是由低阶多项式近似降低了不必要的振荡,这些振荡原本是不包括在原始图象中的。
在这一步骤,图象已被分类成边界和区域。由于已选择了想象的区域作为具有类似色调象元的集合,其边界是不连续部分。色调随机变化的所有部分必定已包括在边界之中。换句话说,把图象分成区域的步骤把所有色调急剧变化的部分扫到了边界之中。边界是不连续部分的陷井。边界是色调函数中的奇异线。边界是色调变化中的奇点的集合。分区是扫除色调不连续并把它们集中到边界的最有效途径。
如果我们假定一个在整个输入图象上定义的色调函数,则奇异线已经全都归到了边界中。这样,各区域只有平滑变化部分而没有不断续。各单个区域适于由低阶多项式近似。
事实上,在分区步骤中,对每个单独区域计算出平均色调。当然对于不同区域其平均值是不同的。对于一个区域内的所有象元,其平均值是一个确定值。然后,以平均色调画出单个区域。以平均色调整画出的区域集合称作“平均色调图象”。
在一个区域内,计算出每个象元的色调与平均色调的偏差。这个偏差称作“差色调”,它定义为象元原始色调和区域平均色调之差。在每个区域中差色调的平均值总是0。在任何区域中相减(差)色调变化缓慢而且连续,因为已经把奇异性排除各区域之外了。相减色调的变化是这样的弱小,以致低阶多项式能以高精度近似相减色调。分区步骤对本发明是重要的。
如到现在粗略提到的那样,分区装置是把输入图象分成多个小区的装置,这些小区是有相似色调且彼此相邻的象元的集合。区域和边界的选择是为了减小区域内象元间的色调差,但把不连续色调集中到边界中。边界和区域集合对提高再生图象质量带来三个好处使边缘清晰、减小了数据量、以及缩短了处理时间。
对一些情况必须予以注意。本发明的分区步骤并不对图象中的实际目标画出轮廓,而是提取出一组有相似色调的象元放到一个区域中。分区不寻找固有的区域,而是强行造一些原本不存在的区域,并把图象分成这些想象的区域。
(步骤1)初始设置对每个象元(xi,yj)赋予区域标号“标号(xi,yj)”。标号(xi,yj)是取值或0或1的二元函数,用于表示一个显著的象元是否已被分类到某一区域。“0”表示该象元尚未被分区。“1”表示该象元已被分区。在初始阶段,所有象元都赋予标号“0”在开始时所有象元标号(xi,yj)=0(步骤2)初始操作对所有区域,最大色调、最小色调、平均色调分别表示为gmax、gmin、gav。由于这些是区域的参数,所以表示区域号的参数(r)应加在后面,如gmax(r)。但为了简便,这里略去了区域参数(r)。平均gav不是区域中所有象元的算术平均,而最大和最小的平均。
gav=(gmax+gmin)/2对输入图象按光栅顺序从最左上象元起扫描,以寻找零标号象元标号(xi,yj)=0。当发现一个0-标号象元时,赋予它标号1,即标号(xi,yj)=1,并把gmax和gmin同确定为该象元的色调g(xi,yj)。这样,开始时最左上象元的参数是标号(xi,yj)=1 (4)gmax=gmin=g(xi,yj)(5)这是光栅扫描一幅图象时的第一步操作。
(步骤3)现在由(xi,yj)表示待定象元,它属于第r区。通过采用“八邻点”概念,它代表待定象元周围上、下、右、左及斜交的八个象元,把输入图象分区。象元(xi,yj)的八个相邻象元可写成(xi+k,yi+l),这里k,l=0,-1或+1(k=l=0除外)。将标号(xi+k,yj+l)=0的零标号相邻象元与第r区平均色调gav=(gmax+gmin)/2比较。如果色调g(xi+k,yj+l)和平均色调gav之差的绝对值小于允许宽度W,即|gav-g(xi+k,yj+l)|<W (6)则相邻象元(xi+k,yj+l)被选作第r区的成员。否则,如果差值大于W,相邻象元(xi+k,yj+l)被判定为其他区的成员。按不等式(6)对象元分组对于本发明是很重要的。
分区操作由产生各区域及确定象元应属哪个区域的步骤组成。当相邻象元已被分类到某区时,象元(xi+k,yj+l)被加标号,于是标号函数变为1。
标号(xi+k,yj+l)=1(k,l=0,±1) (7)加标号意味着该象元被分类到一个区域,该区域的色调小起伏在容限W之内。如果有一个相邻象元满足不等式(6),则对待定象元(xi,yj)的操作结束。
但有时在八个相邻象元中有多个象元满足不等式(6)。当然,这些象元要被加入到当前区域。与此同时,极值gmax和gmin有时要被更新。为此,对于满足不等式(6)且被加标号的相邻象元(xi+k,yj+l)应并行完成下列步骤。相邻象元的色调g(xi+k,yj+l)与gmax和gmin比较。
如果g(xi+k,yj+l)大于gmax,则由g(xi+k,yj+l)替换gmax。如果g(xi+k,yj+l)小于gmin,则由g(xi+k,yj+l)替换gmin。换句话说,如果g(xi+k,yj+l)偏离当前区域的当前色调宽度,则被g(xi+k,yj+l)超出的极限将被g(xi+k,yj+l)重写。更新gmax和gmin保证了当前区域内所包括的所有色调处于gmin和gmax之间这一事实。由于相邻象元满足不等式(6),所以色调宽度决不会超过W,这将在下文中证明。如果g(xi+k,yj+l)<gmin(8)则gmin将被g(xi+k,yj+l)重写。gmin←g(xi+k,yj+l)类似地,如果g(xi+k,yj+l)>gmax(9)则gmax将被g(xi+k,yj+l)重写。gmax←g(xi+k,yj+l)。如果(8)式和(9)式都不成立,则gmax和gmin都保持原值。由于gmax和gmin被更新,属于当前第r区的象元的色调宽度被加宽了。然而,一旦一个象元被判定为第r区的象元,它便不会偏离由不等式(6)确定的值,因为更新的趋势是使最大值与最小值之间的宽度趋于等于W。
这可能不容易理解。因此,这里将简要证明这一性质。由于不等式(6),使一个区域的gmax和gmin之差小于或等于2W。在某一时刻,一个区域的象元色调宽度记为2U。换句话说,gmax-gmin=2U。在下一时刻,如果新加入该区域的象元色调g’小于当前gmin,则gmin被g’更新。平均值gav下降(gmin-g’)/2。现在该区域的最大色调gmax不变。当前gmax与新gav之差是gmax-gav+(gmin-g’)/2=(gmax-g’)/2<W。
这八结果表明该区域新的色调宽度仍小于2W。这样,一旦一个象元已被判定为一个区域的成员,该象元就永远是这同一区域的成员。
在分区步骤中,一个区域的成员数增加会增大gmax和gmin之差2U。差值2U上限是2W,即(gmax-gmin<2W)。然而,这不一定是差值(gmax-gmin)=2U收敛于2W。当然,某些区域的最后差值2U等于2W。但另一些区域的最后差值2U会小于2W。在任何情况下差值(gmax-gmin)决不会超过宽度2W。
然而,分区不是唯一确定的。分区取决于分类步骤的顺序。因为在一个待定象元(xi,yj)周围有多个相邻象元,一个相邻象元所伴随的区域依赖于加标号的顺序。中心象元(xi,yj)用C表示。C象元的二个相邻象元用D和E表示。C象元有色调g。D象元有色调例如g+0.9W,而E象元有色调例如g-0.9W。如果将D象元先于E象元分类到一个区域,则该区的平均值上升到g+0.45W。
由于g+0.45W-(g-0.9W)>W,E象元不能加入当前的第r区,而被分类到另一区域。C象元和D象元被分类到同一区域。E象元被分到另一区域。另一种作法是先于D象元判定E象元,平均值修正为g-0.45W。平均值的下降拒绝把D象元纳入第r区域。C象元和E象元组合到同一区域。D象元属于另一区域。
这样,分类取决于加标号的顺序。然而,在实际上分区是唯一的,因为加标号的顺序是预先确定的。换句话说,预先确定的加标号顺序决定了象元被分类到哪些区域。如果加标号的顺序变了,当然象元的分类会改变。这一事实表明,分区并非从输入图象中提取固有的内在特征。区域不对应于各固有目标。
有另一个例子来解释本发明的分区所具有的特点。假定有四个象元C、D、E、F按这里所到顺序排列,C、D、E、F象元各有色调g,g+0.9W,g-0.5W及g-0.9W,C、D、E象元被分到同一区域,而F象元被排除该区。
D象元和E象元的色调差为1.4W,但D象元和E象元属于同一区域。与此相反,E象元和F象元色调差仅为0.4W,但F象元被与E象元分开。边界未穿过最急剧的梯度,而是穿过平缓梯度处。这种不合理的分区结果来源于按色调与平均色调之差由不等式(6)进行分区,而不是按色调函数的二维差分。
如果靠肉眼观察来把图象分区,他所画出的边界将会穿过有大差分的色调陡斜率区。本发明的分区不同于这种由人的肉眼观察进行的直觉的自然分区。
(步骤4)前面的步骤1至3把所有满足不等式(6)的邻象元(xi+k,yj+l)分类到当前象元(xi,yj)的同一区域。然后,当前象元将转移到相邻象元之一(xi+k,yj+l)。这样,(xi,yj)←(xi+k,yj+l)。对新的当前象元重复步骤3。对满足不等式(6)的相邻象元重复步骤3便构成了有类似色调的象元组成的连续区域。
如果没有满足不等式(6)的相邻象元,则第r区完成。于是从不满足(6)式的最后一个象元起重复步骤3来构成第r+1区。当第r+1区完成,则由步骤3找出第r+2区。在输入图象上按光栅顺序产生全部区域。如前所述,当一个象元被分到一个区域时,该象元被标以标号=1。当所有象元有标号(xi,yj)=1时分区便告结束。
重复步骤2到4,找出了各区域。参数W是每个区中允许色调的共同宽度。宽度参数W越大,则区越大。较大区域的存在要求较长的时间处理区域数据。相反,较小宽度W增加区域数目和提取区域的时间。较小W可能减少用函数近似区域的时间。W的选择改变分区方式。
每个区域用属于该区的象元的平均色调“h”均匀画出。这里的平均色调h是真正的平均值,它是对当前区域所有象元的色调求和并用该区象元数除这个和数而得到的,它不同于前述平均值gav,gav是gmax和gmin的均值。这样,“h”对每个区域独立地确定。
用平均色调“h”画出各区域的图象称作“平均色调图象”。图4(a)、4(b)和4(c)分别展示出W=8、W=16和W=32的平均色调图色。图4(a)的W=8,显示出清晰的平均色调图象,它与输入图象完全相似,因为允许宽度太窄。图4(b)的W=16,显示出模糊的图象,墙壁上的暗条消失了。图4(c)显示出W=32的平均色调图象。由于单个区域的面积如此之大,以致该图象给人的印象不同于原始图象。例如,女孩的头发和面部失去了原有的特点。
〔C.区域存储装置〕区域存储装置存储平均色调图象,它代表以平均色调画面的各区域h(xi,yj)=0,1,2,…,L-1 (10)在每个区域的平均色调h为常数,与该区的单个象元无关。因为h是一个色调变量,h可取0,1,2,3,…,L-1中的任何值。平均色调是区域的函数。应在h后面加上区号(r)。但在h中略去了区号(r)的表达式。
〔D.边界提取装置〕边界提取装置实现的步骤是寻找相邻区域之间的边界。由于已由分区装置(B)确定了全部区域,与此同时已预先确定了边界。必须清楚地提取出边界作为相邻区域之间的线,因为在下一步要用函数来表示边界。与传统图象处理方法中二元图象的轮廓不同,本发明的边界不是象元的集合。一系列象元不意味着边界。在本发明中需对边界给予新的定义。
为了表示边界,引入了一种方便的坐标系。图5(a)显示出在输入图象上定义的坐标。该坐标在最左上点有原点(x,y)=(0,0)。图5(b)是原点(0,0)周围的放大部分。x坐标(横坐标)从原点向右水平延伸。y坐标(纵坐标)从原点向底部垂直延伸。通常,传统的方法习惯于取象元中心作为整数坐标点(m,n),这里m和n为整数。
不同于已有的方法,本发明把整数坐标点(m,n)给予象元的边角。每个象元由四个整数点(m,n)、(m+1,n)、(m+1,n+1)、(m,n+1)包围。每个象元的中心由一组半整数(m+0.5,n+0.5)表示。象元总数是I×J。整数x和y的个数为(I+1)和(J+1)。整数x=0,1,2,3,…或I。整数y=0,1,2,3,…,或J。
这样选择坐标系有二个好处。一个好处是(整数)坐标点能是区域之间的边界。另一个好处是能把单个象元构成的点或单象元宽度的线作为具有有限面积的区域来处理,而不是看作为有无限小面积。
第一个好处是相当方便于定义和确定边界。分区(B)把所有象元分到一些区域。每个象元被分到某个区域。没有象元被留下来作为边界。换句话说,边界不能包括象元。边界本身的定义是新的和奇特的。如果象元中心作为坐标点,则必定有一系列象元分配到边界中。一些象元将会确定区域,而另一些象元将会描述边界。边界不能由先前定义的坐标系严格地确定。
第二个好处是有效地放大、缩小和变换。如果象元中心与坐标点重合,则单个象元点或单个象元宽度的线就要表示为没有确定面积的点或线。如果点或线被放大,被放大的点或线也将只有单个象元宽度,因为一个无限小量即使乘以某个有限数也仍为无限小量。这样,对于有单个象元宽度的线,其放大就会是各向异性的。
本发明不取象元中心而是取象元的边角作为坐标点。这样,一个点(象元)或一点宽度的线也是具有有限面积的区域,它适于图象的放大或其他变换。
图6显示出二种坐标系之间放大的差别。原始图象是由9个排列象元组成的直线(如图6(a)所示)。如果整数坐标点位于象元中心(图6(b)),则放大线作为有同样单点宽度的线,尽管其长度乘上了放大率(如图6(c)所示)。这是因为原始线被请示成0×9。如果坐标点位于象元边角(图6(d)),则原始线是一个矩形,其面积为1×9。
这样,该线能被各向同性地沿长度方向和宽度方向放大,如图6(e)所示。按图5选择坐标系统能有效地真实放大或缩小。这样选择坐标也是本发明的新特点之一。本发明拒绝先前的坐标系,那种坐标系倾向于把象元与坐标点混淆,这是由于象元中心与坐标点吻合的缘故。
整个输入图象已由刚才解释的各步骤分成了区域。区域的数据必须被压缩,以节省存储容量和便于计算。显然,确定区域的最小元素是区域的轮廓。整个输入图象被分成区域,而所有区域都有轮廓。在轮廓之外有另一区域。这样,一个区域的轮廓宁可称为区域之间的“边界”。区域易于由边界确定。所以,通过提取边界并用少量参数表示边界,能使区域数据被压缩。
现在解释提取边界的作法。边界是离散边界点系列。边界点系列是边界上沿四个方向(上、下、右、右)连接的一组(整数)坐标点。由于坐标点定义为象元边角,连接的四联方式是自然的。(m,n)的四联邻点是(m+1,n)、(m-1,n)、(m,n-1)及(m,n+1)。二个相邻点的间距总是等于一个象元的侧边长度。
符号“R”代表区域的总数。符号“r”代表一个区域的号(r=0,1,2,…,R-1)。N(r)是包围第r区的边界点总数。k是边界上的点号(k=0,1,…,N(r)-1)。通常,边界点系列的全体表示为{xk(r),yk(r)}N(r)-1k=0R-1r=0,这里xk(r)是第r区边界第k点的x坐标,yk(r)是同一点的y坐标。后缀符号“N(r)-1k=0”的意思是对于点{xk(r),yk(r)},其点号k取0,1,2,3,…,N(r)-1全部值。另一个后缀符号“R-1r=0”的意思是区号r取0,1,2,3,…,R-1全部值。
全部象元已被分到区域中,无一不幸漏掉的象元,而边界是区域的轮廓。这样,易于从区域数据中提取出边界。由下列步骤寻找边界点系列。
(步骤1)初始调整r←0(开始处理第0区)(步骤2)提取第r区象元从区域存储装置(C)中存储的数据当中提取第r区象元。
(步骤3)追综边界点系列例如用光栅扫描象元方法,从第0区边界上找出任一点。以这个点作为初始点{xo(o),yo(o)},在第0区边界上顺时针追综点系列。于是边界数据被提取出来作为集合{xk(o),yk(o)}N(o)-1k=0。例如,链代码(chain code)方法可用于边界点系列追踪。
(步骤4)判定结束条件边界是闭环。虽然一个边界可能有分支点,但任何边界都是围绕某一区域而行的闭环。当围绕一个有限区域追踪一个边界时,其追踪者肯定返回到该边界上的起始点。边界点系列完全地由围绕第r区顺时针追踪该闭环提取出来。当围绕第r区的追踪结束时,r被(r+1)代替,r←r+1。由步骤3提取出包围第r+1区的点。重复步骤3和4,便对r=0,1,2,3…,R-1所有区域提取出边界。当r获得值R(r=R)时,全部边界点{xk(r),yk(r)}N(r)-1k=0R-1r=0已提取出来,于是处理过程结束。下面的处理将同样地应用于所有边界。因此,在下文的解释中为了简便而略去了区域后缀“r”。除了会因省略而造成误解的情况之外,其他后缀有时也被省略以简化表达式。
〔E.分支点提取装置〕各个边界是彼此不分离的闭环,它们彼此接触。边界常有这样的点,在那里多于二个边界相遇。多个边界相交的点称作“分支点”。一个边界显然不同于一个二元图象的轮廓,因为轮廓无分支点。分支点是边界上的一类特征点。分支点定为有相交边界或有多于二个区域在边界上接触的点。分支点提取装置寻找边界上的分支点。提取分支点是重要的。分支点给出由适当函数近似的线段的终点。
按照光栅顺序,用-(2×2)窗口在区域存储装置(C)中存储的平均色调图象上扫描,以此找出分支点。图7(a)显示出有四象元的(2×2)窗口的光栅扫描。这个窗口有四个象元,确定窗口中心点是否为分支点。如果四象元全为同一色调,则中心待定点不是分支点,因为在窗口中不存在边界。要在窗口中包括一个边界,则只少必须有一个象元的色调与其他象元不同。当窗口有二个不同色调时(如图7(b)所示),则中心待定点被判定为非分支点,因为分支点要求至少三个不同区域。当(2×2)窗口包括三个不同色调时(如图7(c)所示),中心点被判定为分支点。如果该窗口包含四个不同色调,中心点也是分支点。
〔F.边界存储装置〕
根据下述步骤使用分支点数据,将边界的全部属性存储于边界存储装置。
(步骤1)给边界点系列上的分支点分配代表分支点的标记。
(步骤2)边界上二个相邻分支点之间的部分称作“边界段”。对边界段给予边界段号。
边界段是一个函数近似单元。每个边界段在其二端有二个边界点。除了端点外,在边界段中没有分支点。在任何边界段中没有任何中间点是分支点。当二个相邻区域共同拥有一段时,该边界段在二个区域中以相同编号表示。
图8(a)显示出有五个不同色调区的图象例子。分支点是至少三个区域在其周围集结的点。本例中有三个分支点。图8(b)是图8(a)中圈出的包含二个分支点(γ)和(δ)部分的放大图。线γδ是属于二个邻区的一个边界段。
通过在分支点切断边界,使所有闭合边界被分成大量边界段。边界段加上后缀,表示成{xk(p),yk(p)}M(p)-1k=0P-1k=0。“P”是输入图象上边界段的总数。单个边界段由参数“P”表示,这里P=0,1,2,3,…,P-1。M(P)是在第p段中系列点的总数。在该段上的系列点以“k”标号(k-0,1,2,3,…,M(P)-1)。此外,Xk(P)是第p边界段中第k点的x坐标,yk(p)是第p边界段中第k点的y坐标。
〔G.转折点提取装置〕边界转折点定义为边界上的这样一点,在那里边界梯度急剧改变。边界转折点是边界上另一类重要点。边界转折点简称为“转折点”。梯度变化对应于曲率。这样,换句话说,转折点便是大曲率点。分支点和转折点表征边界。本发明进一步在转折点切断边界段。
这样,边界在分支点和转折点被两次分割。由分支点和转折点分割边界并用一些特殊函数来近似被分割部分,这是本发明的极好特点之一。边界上在分支点和转折点被分割成的各部分称作“子边界”。必须注意边界、边界段及子边界的区别。分支点把边界切割成多个边界段,而转折点把边界段切成多个子边界。
边界是最长的。子边界是三者当中最短的。换句话说,(边界)>(边界段)≥(子边界)。边界是一个闭环。边界段和子边界是有二端的线。边界段的二端是分支点。子边界的二端是分支点或转折点。因为边界中包括的分支点扰乱边界的系列近似,本发明从边界中排除分支点。因为边界段可能包括强烈弯曲点,这要求高阶多项式近似,故本发明排除了这些转折点。
通常,急剧变化曲线(这种情况下是色调)要求以高阶多项式近似。即使用高阶函数也难于近似随机变化的曲线。即使曲线的主要部分能由一高阶多项式近似,该多项式往往在曲线段的端点附近造成强烈的寄生振荡,如同Runge现象。不希望的寄生振荡是以任何近似函数近似曲线的急剧变化部分时出现的共同困难。本发明者们认为,如果从曲线中初步排除强烈变化部分,其他平滑变化部分便可由较低阶函数以较高精度近似而不发生寄生振荡。根据这一思想,本发明试图把急剧变化部分作为转折点而排除,并用较低阶函数来近似平滑的连续变化部分。这种近似的好处是低价函数近似、小数据量、以及以高保真度严格再生。
本发明成功地保持了图象的质量并压缩了数据量,因为本发明找出并排除了边界上的转折点,并去近似无奇点的子边界。具体地说,按下述步骤寻找转折点。
(步骤1)在边界点系列上的每一点定义一个局部方向矢量。局部方向矢量表示为“方向(p,k)”,这里p代表边界号,k代表该边界上的点号。方向(p,k)的意思是在第p边界上第k点{(xk(p),yk(p))}的局部梯度。当前点(xk(p),yk(p))的方向(p,k)定义为一个矢量,该矢量从点(xk-a(p),yk-a(p))至另一点(xk+a(p),yk+a(p));点(xk-a(p),yk-a(p))沿边界在当前点(xk(p),yk(p))之前a个单位长度,而点(xk+a(p),yk+a(p))沿边界在当前点之后a个单位长度。这里的单位长度是一个象元的侧边长度。这里所说“点”的意思是整数坐标点,即象元的边角。边界都是定义在“点”上而不是定义在象元上。
方向(p,k)=矢量(xk+a(p),xk-a(p),yk+a(p)-yk-a(p)) (11)这里“a”是表示矢量局部性的参数。该矢量在边界上跨过二点,相隔2a个单位长度。这二个点(xk-a(p),yk-a(p))及(xk+a(p),yk+a(p))夹住当前点(xk(p),yk(p))。参数“a”是一个整数,它的选择应能保证以最适当的方式提取边界的方向。如果a=1,方向(p,k)的角度只取八个值0,π/4,π/2,3π/4,π,5π/4,3π/2,及7π/4(一般性表示是mπ/4,0≤m=整数<8)。如果a=2,方向矢量取16个值,表示为mπ/4(0≤m=整数<8)及nπ/2±18.4°;0≤n=整数<4)。一般地,方向矢量(p,k)取8a个不同方向,它们由表达式〔nπ/2+tan-1{(S/(2a-S))}〕给出,这里n=0,1,2,3,而S=0,1,2,…,2a-1。如果参数a小,则矢量的确定易受噪声影响。如果参数a大,则矢量的确定对边界方向变化不敏感。
图9(a)和9(b)给出a=2时的例子,以阐明方向矢量的定义。图9(a)中在ζ处的局部方向矢量“方向(p,ζ)”是箭头ηk。各方块表示象元。边角点对应于整数坐标点(小点)。小点η在边界上小点ζ之前2个单元长度。小点κ在小点ζ之后2个单元长度。矢量不一定穿过当前(目标)点(小点),而在许多情况下与当前小点分离。图9(b)显示出局部方向矢量沿着边界的例子。边界从左上小点开始向右,在小点ν处转向下,在小点λ处转向右,在小点μ处向上,在ξ处转向右,在p处再转向下,如此继续。虽然边界是有28个小点的闭环,图9(b)只画出开始半段的11个矢量。因为边界在小点λ和μ处暂时凹陷,局部方向矢量紧靠二小点之前下降,而紧靠这二小点之后上升。矢量大致在边界小点上移动,但在转折点处引人注目地偏离边界,例如在p处。因为本例取a=2,矢量的角度限于0,18.4°,45°,71.6°,90°,…。
(步骤2)这一处理过程通过使角度偏斜来把局部方向矢量量化为45度宽度的8个方向。换句话说。矢量的方向空间被分成8个扇形区,由相对于X方向倾斜角度-22.5°,+22.5°,67.5°,112.5°,…,及292.5°确定。这些扇形区以平均倾斜角命名。这样,在-22.5°和+22.5°之间的区间命名为0°扇形区。+22.5°和67.5°之间的区间命名为45°扇形区。67.5°和112.5°之间的区间为90°扇形区。247.5°和292.5°之间的区间是270°扇形区。在同一扇形区中包括的矢量被认为是同一矢量。新的矢量再附以扇形区平均角。例如,如果倾角在247.5°到292.5°范围内,则对该矢量赋值270°。这种量化的目的是使局部方向矢量稳定以克服噪声。量化局部方向矢量称作“方向矢量”,以“方向(p,k)”表示。
图10给出对图9(b)所示局部方向矢量量化后得到的方向矢量。方向矢量的长度被归一化为1。矢量的位置也改变了。方向矢量的中点与当前小点重合,因为只有角度对于提取转折点有意义。而长度和起始点则是次要的。
量化减小了矢量方向的起伏。大多数矢量归到0°扇形区并给予0°倾角。图9(a)中倾角18°的矢量kη转化成量化值“0”扇形区并赋予0度倾角。只有图9(b)中的一个局部方向矢量从X轴倾斜45°,因而被归类于45°扇形区,并通过量化给予45°角。72°倾角的矢量归类于90°扇形区,并量化为90°。量化切掉了噪声,并得到了简化的方向矢量集合,如图10所示。当然,参数“a”的选择对结果有影响。太长的“a”使对边界方向的局部变化不敏感。太短的“a”会由于噪声造成误操作。
(步骤3)对所有边界段上的所有小点系列计算局部转折角θ(p,k)。在一边界段的小点{(Xk(p),yk(p))}处的转折角θ(p,k)定义为在当前小点之前6个单位长度处的方向矢量与当前小点后b个单位长度处的方向矢量之差。
局部转折角定度为“前b矢量”与“后b矢量”的内积除以二矢量长度之积。cosθ(p,k)=|Direction(p,k-b)·Direction(p,k+b)||Direction(p,k-b)||Direction(p,k+b)|----(12)]]>
θ的定义域是-π<θ≤π。方程(12)不能确定θ是正还是负,因为余弦函数是关于θ的偶函数。于是给θ的符号以附加条件。如果曲线是沿边界点系列的顺时针曲线,θ定义为正的。如果曲线是沿边界点系列的逆时针曲线,θ定义为负的。方程(12)不包括当前小点本身的方向,但包括当前小点(第k小点)之前b小点的第(k-b)小点处的方向矢量及当前第k小点之后b小点的第(k+b)小点处的方向矢量。
这里“b”是一个参数,表示确定边界转折的局部性。如果b太小,则转折角θ不能反映边界的大范围变化。如果b太大,则转折角忽略了边界的局部变化。本实施例取b=1,它由前1小点的矢量的角度和后1小点的矢量的角度之前来确定转折角。当然,取b=2,b=3,等等,也是可用的。
(步骤4)对边界r(r=0,1,2,…,P)上的所有小点K(k=0,1,2,…,N(r))计算出局部化转折角θ(p,k)。然后将θ与参数β比较。如果θ(p,k)大于β,则点(xk(p),yk(p))归类于转折点。换句话说,转折点满足下列不等式|θ(p,k)|≥β,(13)如果θ(p,k)小于β,该点不是转折点,而是中间的非转折点,在下面的近似中将被舍弃。β是一个预定参数,是介于-π和+π之间的常数,用于确定转折点的角度。
图11(a)给出图9和图10所示同一例子中系列点上的量化方向矢量及转折角。因为我们假定b=1,并假定顺时针弯曲给出正转折角,所以θ(p,k)=倾角(p,k-1)-倾角(p,k+1)。
倾角转折角第1小点0 0第2小点0 0第3小点0π/4第4小点-π/4π/2第5小点-π/2π/4第6小点-π/2 0第7小点-π/2未确定在初始3点,水平方向矢量(倾角=0)排成一行。图11(a)中第2小点的转折角为0。然后,第4矢量指向-45°。第3小点的转折角为45°(π/4)。在第5小点,矢量指向下(倾角=-π/4)。这样,第4转折角为90°(π/2)。第5转折角为45°(π/4)。于是,在拐角处的第4小点被提取出来作为转折点,因为这一小点有转折角π/2。在图11(b)中,只有拐角小点(p)是转折点。曲线点(ν),(λ),(ξ)及(μ)暂时未作为转折点提取出来。
可以用另一种更简单的方式定义转折角。如果转换角θ(p,k)定义为相邻矢量的倾角之差,则转折角θ(p,k)之和将总是等于当前矢量的倾角。该简单的方法将还认为曲线小点(γ)(λ),(ξ)及(μ)为转折点。但小点(γ),(λ),(ξ)及(μ)不是真正的转折点。必须在以后用某种手段把小点(γ)(λ),(ξ)及(μ)排除。本发明不需要这种步骤,因为从一开始就没有把(γ)(λ),(ξ)及(μ)看作是转折点。由于这一原因,本发明没有利用这种简单的定义。在本发明中,前述简单的求和规则不成立。
还有能有另一种较简单的方式定义转折角在待定点(L)周围取二点(K)和(M)(各图中未画出),画线(KL)和(LM),计算转折角∠KLM。如果∠KLM与2π偏离足够大,则判定待定点(L)为转折点。这可称作“离散曲率法”。这种方法会错误地把(γ)(λ),(ξ)及(μ)找出来作为转折点。离散曲率法的缺点是不能舍去假曲线点(γ)(λ),(ξ)及(μ)。
有人建议一种方法排除离散曲率法中的这种多余曲线点。例如,前面提到的⑦(Horiuchi,Ohtaki Toraichi,“用于多字体自动近似的结点多步提取法”,Trans.IEE Jpn(C),Vol 113-C,No.12,pp1136-1143,(1993))建议一种去掉已错误地提取出来的假转折点(如(γ)(λ),(ξ)及(μ))的方法。这样,本发明不采用这种简单的但会导致错误的离散曲率法。
〔H.边界近似装置〕前面的步骤已提取出边界、边界上的分支点及转折点。在这一步,由于边界已在分支点分成了边界段,故边界段无分支点。由于边界段已在转折点被分成子边界,故子边界再没有大曲率的转折点。换句话说,边界在分支点分成多个边界段,边界段在转折点分成多个子边界。子边界是没有奇异性的规则线。这里,边界近似装置(H)以适当的函数近似子边界。
子边界是直线或平滑曲线,因为已把有大曲率的转折点去掉了。对于子边界而言,“线”一词是指直线和平滑曲线。子边界的两端或为分支点或为转折点。分支点和转折点称为特征点。即,特征点=分支点+转折点。特征点是边界上的奇点。子边界除二端外没有奇点。
由前述步骤已提取出边界和特征点。边界是点的集合,由一组点系列坐标给出。象这样极大量的数据会占用大量存储位。除了极大量数据外,放大、缩小、转动、平移或其他变换难于对原始数据集合来实现。本发明不采取这种不方便的存储数据方式。相反,本发明试图压缩边界数据,以减轻存储负担和允许放大及其他变换。
特征点的坐标必须以某种方式存储。然而,有可能通过对线(子边界)上二相邻特征点之间的中间点系列进行近似来减小数据量。界于二特征点之间的子边界是能以低价多项式近似的平滑曲线或直线。
本发明者试图用窄域样条函数近似子边界。样条函数是常用于内插随机分布点的一组分段多项式。在那里改变多项式的那些点称作“结点”。每二个相邻结点之间的一段用一不同的m阶分段多项式表示。相邻的m阶多项式在其结点处有相同的质、相同的一阶差分,…,以及相同的(m-1)阶差分。但在结点处m阶差分不连续。
通常,通过把结点分布在适当位置可提高样条内插精度。寻找适于提高精度的最佳结点位置是样条近似的传统技术之一。
然而,本发明放弃分布结点的自由度,而是从近似过程一开始便自动确定结点位置。“T”表示一子边界的长度,小段(piece)数“M”是一新的参数,代表小段个数。就是说,子边界T被M相等发割的长度为(T/M)的小段。假定结点均匀分布在子边界上间隔长度为(T/M)的各点上。T和M自动确定结点位置。长度T取决于当前子边界。M是给出结点位置的可自由确定的参数,增大M可提高近似精度。
本发明采用的样条函数是一种归一化的B-样条。给予一子边界的结点位于以长度(T/M)分开的点上。除数M和维数m是确定样条函数的参数。对于不同的M和m,有许多组样条函数。M是分割一子边界的分割个数。被分成的长度称作“小段(piece)”。一小段的长度是T/M,表示为Δ=T/M。单个小段以加后缀k,l等表示。
近似采用一组样条基函数(或简称样条基)。一个样条函数是作为一组若干个多项式给出的局部化函数。本发明的近似是以样条基函数的线性组合来代表一任意曲线。M是定义在子边界上的小段数。M称作分段数,因为子边界被分成M小段。
维数m是样条基的阶。就是说,基本多项式的项的最高阶是m。例如,在某一小段上0阶(m=0)样条基是1,而在所有其他小段上均为0。其积分量1,因为它是归一化的。1阶(m=1)样条基是一三角形函数,伸展至相邻二小段且积分为1。2阶(m=2)样条基是在三个相邻小段上的平滑二次正函数。3阶(m=3)样条基是在两端振荡的伸展于四个相邻小段的三次函数。
一般地讲,第m阶样条基是伸展于(m+1)个小段上的m-阶多项式。m阶样条常被称作为(m+1)级(rank)样条,表示为Nq,m+1。然而,Nq,m+1常简写为Nq,略去(m+1)。由于归一化的缘故,任何阶样条基的积分都是1。应注意这样的事实,即对于不同的M样条基函数是不同的,因为样条基中通过Δ=T/M而包括于分段数M。m阶样条基函数由下式给出Nq(t)=(m+1)Δ-mΣw=0m+1(1)w{t(q·w)Δ}m{w!(m+1-w)!}----(14)]]>q=2,1,0,1,2,…,M-3(△=T/M)这里{a}+表示一个函数,当括号内的a为正数时它等于a,但当a是负数时它等于0。换句话说,当a>0时{a}+=a,但当a<0时{a}+=0。{t-(q+w)Δ}m是以t的m阶从(q+w)Δ起上升的函数。在上升点t=(q+w)Δ,其值本身、一阶差分、…及(m-1)阶差分均为0。Δ是小段长度。点(q+w)Δ是结点。∑{t-(q+w)Δ}m+表示从W=0到W=m+1在连结点t=(q+w)Δ加m阶函数。第一项在t=gΔ处上升。如果t<gΔ,Nq(t)=0。(m+1)阶函数消掉其他项之和。这样,t>(q+m+1)Δ,Nq(t)=0。
样条基Nq(t)是域为t=gΔ至t={q+m+1}Δ的对称函数,其峰值在t={q+(m+1)/2}Δ。m阶基函数把(m+2)个m阶多项式组合成复盖(M+1)个小段的山。在一些子边界上可以把维数“m”作为参数改变。然而,本实施例中把m固定为一常数。例如,本实施例利用二次函数(m=2)。当然,取m=3代替m=2将得到类似的结果。在任何情况下,本发明都不在半路上改变维数“m”。
尽管自由选择维数是样条内插的好处之一,但本发明从始至终决不改变“m”。本发明放弃非条内插的二个好处(自由选择结点和自由选择维数)。然而,固定结点和固定维数为本发明带来新的好处。因为维数已经固定,样条基便自动被确定,这有利于其后的计算步骤。
前面的步骤已从边界上去掉了分支点和转折点,并已准备了不含特征点(二端除外)的子边界。子边界包括低频分量。低维函数足以近似子边界图19是m=1的归一化样条基函数N-1(t)的图示,为简单计,它取一小段T/M=1。m=1的样条基是三角形峰值函数,不适于用三角形函数的线性组合表示任意曲线。把m=2代入等式(14)可得到二阶样条基Nq(t)=3Δ-2Σw=03(-1)w{t-(q+w)Δ}2.{w!(3-w)!}----(15)]]>q=2,-1,0,1,2,…,M-3(Δ-T/M).
图20给出归一化的二阶样条基Nq(t),这里m=2,q=0,T/M=1。为简单计,画此图时已假定小段长度T/M=Δ=1。一般情况下,横坐标单位是Δ=T/M,纵坐标单位是Δ-1。基No(t)有正的圆滑的峰,在三个小段中伸展。基函数No(t)从t=0处的0值缓慢上升,在t=3/2处达到极大值3/4,并缓慢下降,在t=3处降为0。基No(t)可用简单的二次多项式表示(a)0≤t<1t2/2 (16)(b)1≤t<2(3/4)-{t-(3/2)}2(17)(c)2≤t<3(t-3)2/2 (18)但若t<0和t≥3,No(t)=0。
在结点t=1,2,函数No(t)本身及一阶微分dNo/dt连续。但这里二阶微分d2No/dt2不连续。No(t)是归一化的,以使积分为1。二阶样条是样条函数中有平滑曲线的最简单函数。图20显示出No(t)各部分的区域。
No(t)是没有振荡的平衡好的函数。由于基Nq(t)延伸三个小段〔q,q+1〕〔q+1,q+2〕及〔q+2,q+3〕,在t=g和t=q+1之间的一段只由三个基Nq(t),Nq-1(t)及Nq-2(t)占据。
在小段〔q,q+1〕中有同样系数1的三个基之合为1。即在〔q,q+1〕中Nq(t)+Nq-1(t)+Nq-2(t)=1。这一事实表明,通过使基系数相等,二阶样条基甚至还能代表一直线。对任何其他小段及在所有子边界中这一事实都成立。对任何分段数M,通过使所有系数{Cq}等于同一常数,二阶样条基能表示任何直线。这样,即使是最简单的维数M=1,也能通过使三个x系数{Cxg}及y系数{Cyq}相等而表示出一条直线。
定义在所有小段上但在不同段上为不同多项式的函数称作“按步多项式(piecewise polynomids)”。二阶样条是能表示曲线的样条函数中最简单的一种。当然,也能把本发明建立在三阶样条基础上。然而,下文中对本发明的描述将在二阶样条函数构成的框架上进行。
对一个任意函数f(t)近似,是在所有有贡献的结点q上以系数f(t)=∑CqNq(t)来展开样条基。在延伸三小段的二阶样条情况下,N-2(t)对第0小段〔0,1〕有影响。最后的第M小段〔M-1,M〕有分量NM-3、NM-2及NM-1。所以,“q”的区间是从-2到(M-1)。有(M+2)个系数{Cq},但有0,1,2,…,M-1共M小段。
当前的目的是近似无奇点的子边界。一个边界本质上是一条连续线。实践中,本发明定义的边界是位于象元边角的一系列点。边界是一组连续相邻点。有两种方式追踪连续点系列四邻点方法和八邻点方法。八邻点方法把中心点与八邻点中的另一点相连接。四邻点方法把中心点与四邻点中的另一点结合。由于边界定义在象元边角(小点),八邻点方法不适用,因为连接二小点的链条会穿过象元。这样,本发明用四邻点方法连接边界上的点。
边界上的点称作边界点系列。点的总数用“n”表示。第k个点(0≤k≤n-1)用(xk,yk)表示。边界用一组连续连接的点{(xk,yk)}表示。
在当前步骤,图象存储装置仍保留着所有数据{(xk,yk)}。然而这数据量太大。希望通过某种内插技术以较小存储量存储规则的边界。前面已解释了用样条函数内插。子边界不能用样条函数近似,因为子边界是二维变量。
幸好数值“1”确定点系列的序号,并把第k点的xk和yk紧密联系起来。这种结构允许用中间变量重新表示。这中间的自变量是“t”。边界上的所有点k被分配某个t值。“tk”是赋给第k点的值。“tk”是随k均匀增大的函数。{tk}与{(xk,yk)}结合对点组{k}造成二组坐标{(tk,xk)}和{(tk,yk)}。由于tk是k的单调上升函数,故xk和yk是t的单值函数。这tkh性质使样条函数能近似{xk}和{yk}。
这里,将由Sx(t)近似{xk},由Sy(t)近似{yk}。函数Sx(t)是系数为{Cxq}的样条基{Nq(t)}的线性组合。Sx(t)=Σq=-2M-1CxqNq(t)----(19)]]>函数Sy(t)是系数为{Cyq}的样条基{Nq(t)}的线性组合。Sy(t)=Σq=2M-1CyqNq(t)----(20)]]>Nq(t)是如图20所示位于〔q,q+3〕上的山形函数。这种局部化是由Nq(t)中的q决定的而不是由t决定的。在二阶样条情况中,“Cq”代表局部化于q+(3/2)的概率。近似函数由确定2(M+2)个系数{Cxq}及{Cyq}来给出。在这一步骤中,不应把点数“n”与分小段数“M”混淆。如果子边界长,则n大,因为n是子边界的长度。如果子边界变化强烈,则M变大,因为M是子边界复杂性的度量。数据压缩把图象数据量从2n个{(xk,yk)}减小到2M+4个{(Cxq,Cyq)}。
中间变量“t”取连续值。在子边界上的第k点,t取值“tk”。但t取tk之外的其他连续值。因为t是连续变量,Sx(t)和Sy(t)能对t取微分。第k点坐标由Sx(tk)和Sy(tk)近似给出。然而,Sx(tk)和Sy(tk)不一定等于xk和yk,因为Sx(t)和Sy(t)是近似函数。
确定近似函数等效于确定系数{(Cxq,Cyq)}。有二种方式寻找最佳系数。一种方式是最小平方误差法。另一种是“双正交函数法”,这是本发明者首次提出的。后者计算系数所用时间比最小平方误差法所用时间短得多。本发明者相信,由本发明者创造的双正交函数的比最小平方误差法优越得多。由于可由二种方法计算系数,下面将解释最小平方误差法和双正交函数法这两种方法。
〔1.用最小平方误差法确定{(Cxq,Cyq)}〕最小平方误差法是通过计算xk与Sx(tk)之差及yk与Sy(tk)之差,平方这些差值,求这些差值之和,并使其和极小化这些步骤来计算系数{(Cxq,Cyq)}。在所有点上差值平方和用平方误差“Q”表示。Q由下式给出Q=Σk=0n-1{sx(tk)-xk}2+Σk=0n-1{sy(tk)-yk}2.----(21)]]>这里“k”代表子边界上的点,取值0,1,2,…,n-1。在Sx(t)和Sy(t)中的系数由对“Q”极小化确定。最小平方误差法取名于使平方误差极小化技术。代入等式(19)和(20),Q变换成Q=Σk=0n-1{Σq=-2M-1cxqNxq(tk)-x2}2+Σk=0n-1{Σq=-2M-1cyqNyq(tk)-yk}2.----(22)]]>等式(22)含有二种求和(∑)。对k求∑是当前子边界上n点求和。对q求∑是(M+2)个样条基函数求和。样条基是已知函数。(xk,yk)也是已知的。{Cxq}和{Cyq}是未知参数。如果Q已经取到极小值的话,当Cxq和Cyq改变一个无限小量时,在任何情况下Q总是增大。这样,在这一点上Q对Cxq和Cyq的2(M+2)个偏微分δQ/δCxj=0(j=2,-1,0,…,M-1)(23)δQ/δCyj=0(j=2,-1,0,…,M-1) (24)方程(22)和(23)产生Σk=0n-1Σq=-2M-1cxqNxq(tk)Nxj(tk)=Σk=0n-1xkNxq(tk).----(25)]]>类似地,由方程(22)和(24)产生Σk=0n-1Σq=-2M-1cyqNyq(tk)Nyj(tk)=Σk=0n-1ykNyj(tk).----(26)]]>由求解这些线性方程确定系数Cxq,Cyq。系数{(Cxq}的个数是(M+2)。Nxj(tk)的个数是n(M+2)。方程(25)和(26)为2(M-1)维线性方程。
近似从M=1开始。对某个M求解方程。如果结果不满足预定标准,分小段数目M增加1,变成M+1。重复解方程和检查结果,直至结果满足标准。
另一种作法是用矩阵运算来确定系数。系数{Cxq}可由(M+2)维列矢量Cx(q=-2,-1,0,…,M-1)表示。系数{Cyq}可由(M+2)维列矢量Cy(q=-2,-1,0,…,M-1)确定。基{Nxq(tk)}由(M+2)列、N行矩阵Nx(q=-2,-1,0,…,M-1;k=0,1,2,…,n)表示。“tN”表示矩阵“N”的转置矩阵。tN是n行、(M+2)列矩阵。方程(25)和(26)可由矩阵表示成tNxNxcx=Nxx(27)tNyNycy=Nyy.(28)这些矩阵确定Cx和Cy,因为x和y为已知矢量,Nx和Ny是已知矩阵。Nx和Ny无逆矩阵。因为它们不是方矩阵(行数=列数)。tNxNx之积是(M+2)×(M+2)方矩阵,它有逆矩阵(tNxNx)-1。于是cx=(tNxNx)-1Nxx (29)cy=(tNyNy)-1Nyy. (30)由方程(29)和(30)计算出系数{Cx}和{Cy}。由最小平方误差法计算系数{Cx}和{Cy}导致基于方程(25)和(26)或者基于方程(29)和(30)的计算。
当计算出{Cx}和{Cy}后,计算每一点k处的(xk,yk)与(Sx(tk),Sy(tk))之间的平方误差,将该平方误差与一预定值比较,并检验是否在所有点上的所有平方误差均小于预定值,以此来检验是否{Cx}和{Cy}满足标准。所以,用ε表示所有k中平方误差的根的最大值,ϵ=maxk=0n-1[{sx(tk)-xk}2+{sy(tk)-yk}2]1/2,----(31)]]>这里max表示对k=0,1,2,…,n-1而言其后各项〔…〕的极大值。应注意如下事实这个判据不是用所有平方偏差之和来估计误差,而是用位于某单个点处的最大偏差来估计误差。应注意,等式(31)不是最小平方误差方法的-个方程,而一个判据等式。虽然等式(31)与方程(21)略有相似,但等式(31)的意义与等式(21)完全不同。等式(21)是为实现用最小平方误差方法计算Cxq和Cyq的初始定义。而等式(31)给出检验所计算出的Cxq和Cyq是否能保真地近似子边界的标准。
等式(31)中的最大误差ε与一预定值进行比较,这个预定值是近似程度的度量。较小的ε会使近似数据Sx(tk)和Sy(tk)更靠近原始数据(xk,yk)。但较小的ε要求重复近似更多次,这要消耗更多时间。
ε的临界值应预先确定,以协调计算时间和再生保真度。例如,可取0.5作为临界值。在这种情况下,只要ε≥0.5,就要对M加1再重复近似步骤。当ε<0.5时近似步骤结束,当前系数便被用作为最后系数。标准ε<0.5的目的是以高保真度严格再生。
否则,临界值可预先确定为大于1的值。大临界值减少计算时间。除了节省时间外,这种较大临界值还适于再生边界更平滑的图象。应根据目的来确定临界值。
通常,对某一分段数M,当ε变成小于临界值时,近似过程便结束,其系数用作为最后的{Cxq、Cyq}。
如果ε仍大于临界值,通过把M增大为M+1来重复类似的计算。当然,当M改变时,所有小段q(q=-2,-1,0,1,…,M-1)和基{Nq(tk)}都改变。重新计算基和系数。然后将等式(31)的ε与临界值比较。当ε仍大于临界值时,对M加1并再重复类似的计算直至ε小于临界值。复杂的曲线要求多次重复近似计算直至ε小于临界值。最小平方误差方法只能用于小的分段数M。对于大M值。计算(XxNx)的逆矩阵是困难的。对于大分段数M,最小平方误差法变得不适用了。系数的计算需要一种更简单的方法以节省计算时间。首先由本发明者创造的下述方法满足这一要求。
〔2.由双正交函数法确定{Cxq,Cyq}〕双正交函数的概念本身是新的。首先解释函数的正交性。我们假定有一组由一参数指定的有限函数。如果有不同参数的二个函数之积在一积分区间上的积分为0,则称这组函数有正交性。例如,一组正弦函数或余弦函数有正交性,因为有不同参数的正弦函数或余弦函数之积在一个周期上的积分为0,换句话说,Sin(pt)和Sin(qt)之积在0到2π上的积分为0(p=q的情况除外)。∫02πsin(pt)sin(qt)dt=πδpq(p and q are integers).----(32)]]>δpq是Kronecker和δ,当p≠q时为0,但当p=q时为1。等式(32)表明当p=q时积分为π,但当p不同于q时积分总为0。一组正弦函数和余弦函数有理想的正交性。
一些其他特殊函数有正交性。例如,Legendre(勒让德)多项式Pm(t)在-1到+1区间乘积积分有这种正交性。∫-1+1Pm(t)Pn(t)dt=2δmn/(2n+1).----(33)]]>这个等式表明有不同参数的二个勒让德多项式之积在一个周期上的积分为零。由于勒让德函数未归一化,勒让德函数平方的积分不是1。当一个任意函数由带系数的勒让德函数无限级数展开时,能利用其正交性容易地计算出系数来。
贝塞尔(Bessel)函数Jm(t)有特殊的正交性。(b2-a2)∫0txJm(ax)Jm(bx)dx=t[bJm(at)Jm+1(bt)aJm(bt)Jm+1(at)]----(34)]]>贝塞尔函数无周期性,且有无限个零点。其正交性取如此奇怪形式。等式(34)不是一个定积分,而是一个不定积分。任意函数可展开成m阶贝塞尔函数{Jm(akx)}无限级数,它们有不同的零点因子ak,它是Jm(x)的零点,即Jm(ak)=0。可利用等式(34)给出的正交性来计算系数。
Hermite多项式Hp(t)具有简单的正交性。二个Hermite多项式Hp(t)和Hq(t)之积在负无限到正无限的积分为零,但p=q的情况除外。∫-∞+∞Hp(t)Hq(t)dt=δpq.----(35)]]>除了这些类似的函数外,一些未知的函数系列有正交性。例如,代表能量的哈密尔顿算符H的本征函数{ψp}满足如下薛定鄂Schroedinger方程Hψp=Epψp, (36)二个不同本征函数之积从负无穷到正无穷的积分为零∫-∞+∞ψp(t)ψq(t)dt=δpq.----(37)]]>不论ψp(t)为已知还是未知,由于本征值Ep不同,本征函数{ψp(t)}都简单的正交性。
有许多其他由一个参数指定的有正交性的函数集保,这意味着不同参数的函数乘积的积分为零。由一个参数来区分的一组函数在其成员之间有正交性,这是普通的事。对于一个特殊函数集合,正交性是相当普通的、平常的性质。有时这组无限函数称作“正交函数系”。如果函数是归一化的,则这组函数进一步称作“归一化正交函数系”。当任意一个函数要展开成带系数的函数的无限线性组合时,正交性是计算系数用的一个方便的特性。例如,假定要由薛定鄂方程的本征函数{ψp(t)}展开成下式f(t)=Σp=0∞cpψp(t).----(38)]]>则系数Cp可简单地由f(t)和ψp(t)乘积的积分给出。用ψq(t)乘等式(38)两侧,积分其乘积,得到∫-∞∞f(t)ψq(t)dt=Σp=0∞∫-∞∞ψq(t)cpψp(t)dt=Σp=0∞δpqcp=cq.----(39)]]>这个结果表明,当一函数展开成带系数的函数级数时,其系数能容易地由乘积f(t)ψp(t)的积分确定。
这些组函数具有正交性的原因在于这些函数无限地振荡于过零线的正值区和负值区。所有上述函数都上下振荡直至无穷。不同参数的函数有不同的振型。不同参数的函数乘积的积分总为零,这是因为在乘积中不同振型彼此抵消。
然而,任何阶的样条函数基没有正交性。例如,二阶(m=2)样条基Nq(t)是局部化于t=(q+1.5)Δ的山型函数。二个样条基Nq(t)tNp(t)乘积的积分决不会为零。∫Nq(t)Np(t)dt≠0。样条函数不构成正交函数系。
样条函数集合是一个非正交函数系。样条函数是相当珍贵的函数。是什么使样条函数失去了正常性。
其一是样条函数的极其简单性。样条函数有一个山形,其山脚几乎没有振荡。只取正值,其二价(m=2)样条函数不低于零而且不震荡,如图20所示。样条基从不振荡穿过零线。所以,在样条函数中是拒绝正交性的。高阶样条函数,例如3阶或4阶函数的“山脚”有弱振荡。在“山脚”的振荡太弱,以致不能消除不同参数基乘积的积分。
是什么压低了样条函数中的振荡?为何样条函数几乎不引起振荡?样条函数是人造的函数,它的贡献是以尽可能小振荡的平滑曲线来内插离散点。这样,当然样条函数没有振荡。弱振荡等效于第m阶样条函数在结点处的m阶微商不连续。m阶样条是C(m-1)级函数,它能被求微商直到(m-1)次,但不能被微商超过(m-1)次。
样条函数不是无限次可微商函数。相反,对于正弦函数,余弦函数,勒让德函数,Hermite函数以及薛定鄂方程的解这些具有正交性的例子,无限次微商是完全可能的。可实现无限次微商给予这些函数强振荡。正交性源于强振荡。
与这些完全的正交函数相反,m阶样条函数不能进行m次微商,以达到压缩振荡的目的。简单的山形有利于计算。但是,由于简单的山形失去了正交性而产生了困难。
由于缺少正交性,当把任意函数展开成带有系数的样条基线性组合时,计算系数相当困难。非正交性阻碍了样条展开从方程(39)的二阶形式转换成三阶形式。系数{Cq}不能由方程(39)这种简单的推导得到。于是,样条展开迫使人们用复杂的最小平方误差方法计算系数。
然而,以类似方程(39)的简单积分来计算样条展开的{Cq}仍具有相当大的吸引力。对于样条展开,也强烈需要类似方程(39)的方法。非正交性拒绝直接把方程(39)应用于样条函数。这样,本发明者为样条函数人为制造了正交函数{Lq(t)},以便用类似方程(39)的计算而不是最小平方误差法,从而以较简单的方式计算{Cq}。这种新函数是用如下关系定义的。当任意函数f(t)以样条函数展开时,则需要{Lq(t)},素数{Cq}能由乘积f(t)Lq(t)的简单积分计算出来。即当f(t)表示成f(t)=Σq=-2M-1cqNq(t),----(40)]]>时,系数{Cq}能简单地由下式给出cq=∫0Tf(t)Lq(t)dt.----(41)]]>Lq(t)是为正交化样条函数Nq(t)而新提出的函数。如果这组函数有正交性,则Lq(t)就会象正弦函数、余弦函数等那样与Nq(t)完全相同了。由于样条函数没有正交性,样条函数需要新的人造正交函数。方程(41)定义了人造正交函数的理想形式。什么是正交函数?这种正交函数集在地球上能存在吗?把存在性问题先放在一边,这人造函数Lq(t)称作Nq(t)的“双正交函数”。双正交函数须满足正交性∫0TLp(t)Nq(t)dt=δpq(p,q=-2,-1,0,1,2,...,M-1)----(42)]]>需要方程(42)的理由可由方程(40)代入(41)来理解。二个函数乘积的定积分有时称作内积,这类似于矢量运算。内积等于零这一事实等效于二个函数正交这一事实。由于样条函数是非正交函数,分别有不同参数p和q的样条Np(t)和Nq(t)的内积有确定值,由qpq表示,∫0TNp(t)Nq(t)dt=gpq(p,q=-2,-1,0,1,2,...,M-1)----(43)]]>内积qpq能计算出来。包括分段数M,qpq是差值(p-q)的函数。(p-q)的范围窄,因为Nq(t)或Np(t)是局部化函数,只占有(m+1)小段。对于介于-m和+m之间的差值(p-q)(-m≤(p-q)≤+m),内积qpq有一确定值。在m=2的情况下,内积qpq取如下值
当p=q,gpq=1,(44)当p=q±1, gpq=1/3, (45)当p=q±2, gpq=1/24, (46)否则gpq=0. (47)样条基的内积集合可看作是(M+2)×(M+2)方阵G。样条内积矩阵G的方便特性是每当分段数M改变时,对任何M可由方程(44)至(47)得知G的所有分量。为改进近似而使M增至M+1时,可由存储器立即给出矩阵G而无需计算其分量。对任意M,样条内积矩阵G总是一个已知矩阵。G的另一个方便特性是计算逆矩阵G-1的可实现性,因为G是一个对称矩阵。
任意函数可在其定义区间〔0,T〕中表示为样条基函数{Nq(t)}的线性组合。双正交函数Lp(t)本身可表示为具有系数{dpq}的{Nq(t)}的线性组合,Lp(t)=Σq=-2M-1dpqNq(t).----(48)]]>把方程(48)代入方程(42),产生Σs=-2M-1∫0TdpsNs(t)Nq(t)dt=δpq.----(49)]]>乘积Ns(t)Nq(t)的积分是方程(43)的qsq。方程(49)变成Σs=-2M-1dpsgsq=δpq.----(50)]]>一组展开系数{dps}可被认为是(M+2)×(M+2)方阵D的分量。如前所述,一组内积{qsq}构成方阵G。Kronecker的δ构成(M+2)×(M+2)单位矩阵I。方程(50)可重写成简单的矩阵方程
DG=1.(51)这样,可由样条内积矩阵G的逆给出系数矩阵D。
D=G-1.(52)在方程(44)至(47)中已给出G的分量。由G能容易地计算出D。这样,对任何M,矩阵D也是已知矩阵,这是一个很方便的性质。可应用矩阵运算来以样条函数近似子边界。一个任意函数f(t)展开成如方程(40)的样条基,f(t)=Σq=-2M-1cqNq(t).----(40)]]>以Lp(t)乘方程(40)的二项,并对t积分这二项,得到∫0TLq(t)f(t)dt=Σq=-2M-1∫0TLp(t)cqNq(t)dt.----(53)]]>方程(42)的双正交性把方程(53)左侧项简化成∑δpqCq=Cp。如方程(41)预测的那样,展开系数Cp由下式给出cp=∫0TLp(t)f(t)dt.----(54)]]>由于Lp(t)是已知函数,Cp可直接由方程(54)给出。另外,方程(54)能转化为样条基表达式cp=Σq=-2M-1dpq∫0TNq(t)f(t)dt.----(55)]]>由于{dpq}是已知系数,{Cp}能立即计算出来。对于确定系数{Cp},方程(54)和(53)是等效的。
下面进一步弄清楚样条基Nq(t)与双正交Lq(t)的关系。样条基Nq(t)是一个简单的几乎没有振荡的平稳函数。如图20所示,二阶样条基无振荡。即使较高阶样条的振荡也很弱。与此相反,双正交函数Lp(t)是一个伴随强振荡的快变化函数,这种强振荡是为抵消乘积Lp(N)Np(t)中的平稳Np(t)所需要的。
现在用带系数{Uqp}的双正交函数Lp(t)来展开样条函数Nq(t),Nq(t)=∑UqpLp(t)。Lp和Lq的内积用Jpq表示。∫Lp(t)Lq(t)dt=(Lp·Lq)=Jpq。可由一组{Jpq}构成矩阵J。现在把J称作正交内积矩阵。类似地,以一组系数{Upq}构成系数矩阵U。J和U是(M+2)(M+2)矩阵。由于δpq=(Lp·Nq)=∑(Lp·Ls)Uqs=∑JspUqs,类似方程(51),有UJ=I. (56){dpq}矩阵D把Lp和Nq连系起来。D是连系Nq与Lp的{Upq}矩阵U。于是,UD=I,UJ=I,DG=I. (57)方程(56)和(57)给出四个矩阵D、J、U及G的简单关系D=J(58)U=G=D-1=J-1. (59)方程(58)是说正交的(Lp·Lq)内积矩阵J等于双正交的{dpq}系数矩阵D,{dpq}是Lp在{Nq}上展开时Nq上的系数。与此相反,方程(59)是说样条内积(Np·Nq)矩阵G等于样条系数{Upq}矩阵U,{Upq}是当Np在{Lq}上展开时在Lq上的系数。方程(59)保证D=J是U=G的逆。所以,这四个矩阵不是独立的。如果一个矩阵被确定,其他三个便自动被确定。这是很方便的性质。
反之,当任意函数f(t)在双正交函数{Lq(t)}展开时,即f(t)=∑CqLq(t)时,可由对{Nq(t)}和f(t)乘积积分来计算系数{Cq}。即Cq=(f,Nq)。{Nq}和{Lq}有这种互补性。这样,{Lq}是{Nq}的双正交函数。同时,{Nq}是{Lq}的双正交函数。
现在由双正交函数法而不是由最小平方误差法计算子边界展开系数。在子边界中,第k点坐标(xk,yk)已由中间变量表达式分解成(tk,xk)和(tk,yk)。于是xk以样条基Nq(t)展开成方程(19)的Sx(t)=∑CxqNq(t)。而yk以样条基Nq(t)展开成方程(20)的Sy(t)=∑CyqNq(t)。由连续函数Sx(t)及Sy(t)给出近似的子边界。现在以双正交函数法计算系数{Cxq}及{Cyq}。sx(t)=Σq=-2M-1cxqNq(t)----(19)]]>sy(y)=Σq=-2M-1cyqNq(t)----(20)]]>根据前述原理,双正交函数把系数表示为cxq=∫0Tsx(t)Lq(t)dt,----(60)]]>cyq=∫0Tsy(t)Lq(t)dt.----(61)]]>系数还不能直接计算,因为Sx(t)和Sy(t)仍为未知。然而这一事实不会造成问题。已知数据是(tk,xk)和(tk,yk)。将xk代入Sx(tk),将yk代入Sy(tk),并在点k(k=0,1,2,…,n-1)处求和代替〔0,T〕上的积分,得到cxq=Σk=0n-1xkLq(tk),----(62)]]>cyq=Σk=0n-1ykLq(tk).----(63)]]>这些方程给出系数{Cxq}和{Cyq}。因为正交基Lq(t)是已知函数,Lq(tk)能直接算出。当然,当M改变时,正交基Lq(t)也变,因为Lq(t)中包含M。然而,可对于可能的M,将Lq(t)存于一个表中。这样,能立即从表中取出x=xk的Lq(tk)值。
另一种方法是从样条基{Nq(t)}计算出系数cxq=Σk=0n-1Σp=-2M-1xkdqpNp(tk),----(64)]]>cyq=Σk=0n-1Σp=-2M-1ykdqpNp(tk).----(65)]]>矩阵{dqp}是样条内积矩阵{qqp}的逆矩阵。这样,对于所有可能的M,{dqp}是已知值。Np(tk)由存储的表中得到。虽然方程(64)和(65)似乎相当复杂,这种计算是轻而易举的。除了少数几段外,在几乎全部定义域上样条基Nq(t)为0。如前所述,Np(t)是局部化函数,它在t=pΔ处上升,在t=(p+1.5)Δ处达到峰值,在t=(p+3)Δ处消失。这里Δ=T/M,T是子边界总长度,M是分小段数,Δ是一小段的单位长度。在n点中的第k点,在〕〔0,T〕中取t=tk。如果{tk}在〔0,T〕中均匀分布,只有当p/M≤k/n≤(p+3)/M. (66)时Np(tk)有正的确定值。
对于k值,在(M+2)个分量中只有三个p值满足不等式(66)。其他(M-1)个基Np(tk)都为零。每个k有三个非零样条基Nq(tk)。然后,和的3n倍给出方程(64)中的系数Cxq。类似地,和的3n倍可得到Cyq。基于方程(62)和(63)或方程(64)和(65)的双正交函数法在计算系数方面远优越于由方程(29)和(30)或方程(25)和(26)实现的最小平方误差法。当然,本发明能由最小平方误差法实现。但本发明宁愿采用双正交函数法,它能大大缩短计算时间。
利用这些计算,双正交函数法得到2(M+2)个系数。然后,用前述估计最小平方误差法结果的同样方法估计其近似程度。这种估计方式要求所有原始点(xk,yk)与近似点(Sx(tk),Sy(tk))之间的距离必须小于一个预定临界值。距离的最大值由ε表示,ϵ=maxk=0n-1[{sx(tk)-xk}2+{sy(tk)-yk}2]1/2.----(67)]]>临界值是可根据其目的自由确定的一个参数。例如,当临界值设为0.5时,由不等式ε<0.5. (68)来估计结果。如果不等式(68)成立,近似过程将结束,当前系数{Cxq}和{Cyq}将被采纳为最后系数。如果不等式(68)还不满足,则分段数M增至M+1,并重复同一过程,直至满足(68)式。
上面已经完全解释了由样条函数近似子边界。样条函数近似足以适用于近似由连续变化色调图象事后产生的区域。当然,同样的近似能应用于只由二色(例如黑和白)构成的二元色调图象。在二元色调图象的情况中,图象的天生轮廓成为边界。有时需要更严格地再生边界。为此目的,从边界集合中提取直线、园和弧并用其他函数表示它们,可能会有好处。
〔I.区域数据存储装置〕到目前所完成的这些步骤把输入图象分成多个由类似色调象元组成的区域,对各区域平均其色调,提取区域间的边界,寻找分支点和转折点,用带系数的样条基线性组合表示分支点或转折点之间的子边界,并确定样条展开线性组合的系数。通过这些步骤积累了各区域的属性。从而获得了大量的区域属性。区域数据存储装置(I)存储许多属性作为区域数据;(1)输入图象的尺寸;
(2)区域个数;(3)各区域的平均色调;(4)边界信息,(5)边界数,(6)边界的起始点和被分段数M,(7)样条近似基函数系数。
这里(1)是指输入图象的水平长度和垂直长度,它需要4字节,如表1所示。(2)表示被分区装置(B)分割区域的个数。这个数目取决于输入图象的情况。它需要存储器的2个字节。(3)是已由分区装置(B)计算出的并已存入区域存储装置(C)的所有区域的平均色调。K1表示现在分区数。每个区有一个平均色调。(3)需要K1个字节用于存储。
这里首次出现的边界信息(4)确定区域和子边界之间的关系。区域已经编号,子边界也已编号。一个区域由多个子边界包围。一个子边界在其两侧与二个区域接触。必须给出某些信息以弄清楚区域和子边界之间的关系。边界信息包含二类参数。一类是包围一个当前区域的子边界个数。另一类是边界相对于区域的方向。
子边界的方向不是一个能容易理解的概念。这里子边界的方向确定该区域存在于该子边界的哪一侧。每个区域有一个序号但没有坐标指示其位置。边界有其自己的坐标来指示其位置。这样,区域不能由自身来指明。必须通过与包围当前区域的子边界的关系来确定区域的位置。确定区域存在于子边界的哪一侧是重要的。一个区域能由包围该区域的子边界及该区域相对于边界的方向唯一地确定。边界信息需要4K1个字节。
(5)是指除二端外无特征点的子边界的个数。一个边界是完全包围一个区域的闭合环。一个边界被分支点分成若干个边界段。一个边界段又被转折点分成若干个子边界。(5)需要4字节存储。
(6)表示近似所有子边界所用的起始点和分小段个数M。K2表示子边界个数。起始点对于确定样条函数近似中的t=0点是必须的。(6)需要8K2字节。(7)是为近似子边界在样条基上的系数{Cxq}和{Cyq}的具体值。(7)需要∑(Mxk2+Myk2)字节,这里k2是子边界号(k2=0,1,2,3,…,K2-1),Mxk2是x方向分小段数,Myk2是y方向分小段数。区域数据的个数列于表1。
表1显示出三类信息。表1中(1)是原始图象信息。(2)、(3)、(4)是区域信息,(5)、(6)、(7)是边界信息。原始图象已分解成区域和边界。每个区域有一平均色调。每个子边界有关于函数近似的具体内容(locus)。余下的是什么?余下的是各区域中的象元单个色调的信息。平均色调不能完全代表原始图象中的色调分布,因为平均色调只是对一个区域有一个值。
表1区域数据的数据量
K1区域个数,K2边界个数,Mxk2边界K2在x方向分小段个数,Myk2边界K2在y方向分小段个数〔J.差图象产生装置〕到现在为止的处理提取出有类似色调的象元部分作为区域,对各区域赋予平均色调,提取围绕区域的边界,在分支点把边界切割成边界段,在转折点把边界段分成子边界,并用函数近似这些子边界。图2(b)显示的平均色调图象对所有区域给出各自的平均色调。区域存储装置(c)按原样存储图2(b)的图象。一个区域涂以一平均色调h。平均色调图象与图2(a)的原始图象相似,因为原始的连续变化色调被转换成平均色调图象的按步变化色调。一般情况下平均色调能相当好地代表各区域的色调。如前面解释的那样,相似程度依赖于色调宽度W。
在色调细节上,平均色调图象不同于原始图象。平均色调图象忽略了单个区域中色调的局部变化,因为每个区域被用平均色调均匀地画上了。为了以高保真度再生图象,必须考虑色调的小起伏。
一个区域中任意象元的色调不一定等于该区域的平均色调,而是在许多情况中都与平均色调不同。再有,色调是从象元到象元改变的。现在强烈需要一个新的创造来考虑单个色调相对于平均色调的起伏。满足这一需求的是现在要解释的差图象产生装置(J)。差色调(diff)定义为当前象元色调(g)与同一区域平均色调(h)的偏差(g-h)。即diff=g-h,或者(象元色调g)=(差色调)+(平均色调h)。
下一个问题是如何掌握差色调。原样存储所有象元的差色调不是一个好策略,因为这会浪费太多存储器。另一种方式可以是对每个单个区域内的差色调进行近似的方法,因为差色调定义于每个区域,而这些区域已由边界确定。然而,由于边界条件的复杂性,在各区域内的近似会是复杂的,因为对于各区域,其边界不是规则的方块,而是随机的闭合环。对每个区域给出边界条件是困难的。区域内的近似也会由于不充分的复杂近似而受到数据量的困扰。如此大量数据需要有新的突破以处理差色调。
本发明者不采用局部化的处理,而是产生了一各广域处理方法来处理各区域中单个象元的起伏色调。本发明者已建立了一个用于广域处理的差(色调)图象新概念。代替单个的窄小区域,想象一个“差(色调)图象”作为具有不同色调的所有区域的集合。为简单计,差色调图象简称为“差图象”。“差图象”概念是本发明最重要的内容之一。
差图象的大小等于输入图象的大小,因为曾被分开的所有区域又统一成差图象。在差图象中所有边界和区域似乎都消失了。然而,差图象在色调上不同于原始图象。差图象是由差色调diff=g-h构成的,而原始图象是由全色调g构成的。
“差图象”定义为由原始输入图象中减去平均色调而构成的图象。如前面解释的那样,一个象元(xi,yi)有一原始色调g(xi,yi),一个区域有一平均色调h。虽然平均色调h(r)原是定义在一个区域中的,但平均色调h(r)也指定给属于该区域(r)的单个象元(xi,yi),如图10所表示的那样。对每个单个象元,平均色调定义为h(xi,yi)=h(r)。差图象是以具有差色调diff(xi,yi)=g(xi,yi)-h(xi,yi).(69)的所有象元(xi,yi)构成的。
应该指出的是,(xi,yi)的定义范围不限于一个区域,而是输入图象的全部范围。由于所有区域结合在一起,在差图象中边界消失了。另一个奇妙的特性是色调起伏小,因为由等式(6)diff(xi,yi)的绝对值总是小于W。这样,差图象比原始图象更单调、更平滑。
图2(f)给出一个差图象,图2(f)的色调几乎是灰的,与图2(a)所示输入图象相比,其变化小得多。为什么差图象有灰色调呢?色调已由等式(2)量化为L级。这样,差图象的基色调是L/2。等式(6)保证差图象中的起伏小于W。于是所有象元的色调局限在(L/2-W)和(L/2+W)之间的很窄范围,它们在色调上是灰的。起伏很小的原因在于已由平均色调去掉了起伏的大部分。图2(b)的平均色调图象吸收了大部分起伏。
差图象中色调起伏依赖于W。图12(a)、12(b)和12(c)给出W=8、W=16、W=32的差图象,分别对应于图4(a)、4(b)和4(c)的平均色调图象。图12(a)是W=8的几乎是均匀的平缓的差图象。人们几乎不能找出“女孩”的踪迹。由于W小,区域变得很窄小,区域的数目大,它以单调灰色均匀画出整个图象。例如,假定整个色调级为256(L=256),中间色调为128。在W=8的情况中,在差图象的全部区域中色调g(x,y)局限于120至136(120≤g(x,y)-≤136)的窄小区间内。总体上的灰色调是小W(=8)的合理结果。原始图象的几乎所有色调变化都已被分配到W=8的图4(a)所示平均色调图象中。平均色调图象和差图象是互补的。在W=8的情况中,图4(a)的平均色调图象类似于图2(a)的原始图象。
图12(b)给出W=16的差图象。出现了一幅朦胧的模糊图象,但人们几乎不能识别出图象。由于W稍有增大,从W=8的均匀灰色中显现出了朦胧图象。其余的图象变化则赋予了图4(b)的平均色调图象。
图32给出W=32的差图象。图象比W=16时的图象清楚得多。人们能找出女孩的模糊形状。与W=16的情况相比,原始图象中的更多特点传送给W=32的差图象。相反,图4(c)的平均色调图象给人以与原始“女孩”相距远得多的印象,失去了色调的细节变化。
对W=8、W=16、及W=32的比较告诉我们在平均色调图象和差图象之间的互补关系。由于g(x,y)=h(x,y)+diff(x,y),原始图象的色调分成平均色调图象和差图象。窄宽度W(例如W=8)分配给平均色调图象的色调变化要比分配给差图象的色调变化多得多。宽的宽度,如W=32,则把更多的色调变化分配给差图象而不是分配给平均色调图象。决定向平均色调图象和差图象分配比例的是区域色调宽度。
大W还是小W哪个更好?这是下一个问题。色调宽度W是一个区域内最大色调差值的一半。大的W使区域面积扩大。平均色调图象与原始图象偏离得远。差图象有原始图象的某些特点。大W减小了区域数目和边界数目,这节省了边界近似的处理时间和存储区域数据及边界数据的存储区。然而,大W的缺点是在差图象中有大的色调起伏。有这样大色调起伏的差图象需要大量参数去近似。除了参数个数问题外,大W降低近似的精度。这样,大W增大了近似差图象的负担。
当W小时,区域的面积变小。小区域增加了区域、特征点(转折点及分支点)及子边界的数目。小W增大区域数据量并把更多的特征分配给平均色调图象而不是差图象。由于色调变化小,差图象几乎为均匀的灰色调。变化小使能用低阶函数以少量参数对差图象进行高保真近似。小W的好处是数据量小而高保真再生,但有区域数量大和确定边界时间长的问题。W值的确定应协调区域数据量和差图象数据量。通常,小W能以处理时间的消费来提高近似的精度。
〔K.差图象存储装置〕差图象存储装置(K)存储差图象中所有象元(xi,yi)的差色调diff(xi,yi)。(i,j)是定义在原始图象上的象元编号(i=0,1,…,I-1;j=0,1,…,J-1)。当然,可以逐区域存储差色调,因为象元已被分成区域。然而,差图象存储器是按象元序号(i,j)来存储差色调,忽略象元对区域的成员关系。差图象diff(xi,yi)与原始图象有相同大小(i=0,1,…,I-1;j=0,1,…,J-1)。由于差图象不受分区造成的限制,所以对差图象的近似完全不受复杂边界条件及大量区域数据所造成困难的影响。并图象是作为定义在整个图象范围的所有坐标(xi,yi)的二维函数diff(xi,yi)存储的。由于diff(xi,yi)有小的色调起伏,低阶多项式能以小误差近似diff(xi,yi)。
〔L.差图象分区装置〕这里提供了又一个创造来减少近似差图象所需时间和数据量。差图象不是成由多个部分图象组成的,而是统一全部区域的单个图象。以下步骤与单个区域无关。
差图象与原始图象有相同大小,不受区域分割的影响。原始图象的垂直排列象元数表示为“I”,而同一原始图象的水平排列象元数表示为“J”。差图象有I行垂直排列象元和J列水平排列象元。由于所有区域已组合成一个差图象,差图象有矩形形状,它适于函数近似。
这样可能产生一个基本的问题。差图象的大小等于原始图象的大小。近似原始图象和近似差图象有重大差别吗?对差图象的近似清楚地不同于对原始图象的近似。如果以同样形式的函数去近似原始图象,那么由于原始图象中包括激烈的变化,分区数M和系数数就会很大。即使有大量系数,其近似也会是粗糙和不精确的。对于函数近似而言,差图象远远优越于原始图象。
差图象是适于函数近似的空间图象。如图12(a)(W=8)所示,色调在整个图象范围内几乎是均匀的。均匀性是差色的一个重要性质。色调急剧变化的部分已事先作为边界从原始图象中排除了。边界吸收了不规则部分。各区域有围绕平均色调的极小起伏,因为diff=g-h。差图象的平均值为0,而且起伏是小的。如前面解释的那样,在全色调L=256的情况下,W=8的差图象由120和136之间的色调组成。这种小起伏使能用一低阶函数实现高保真近似。为有利于对差图象进行函数近似,还需要一个创造。
当然,可以一次性地近似整个(I×J)差图象。近似计算将重复进行,直至误差落入容差(临界值)之下。由于差图象太宽,要近似整个差图象会占用长时间。把差图象分成多个小块并以二维函数近似单个小块会有效地节省时间。
这样,本实施例把差图象按长度和按交叉分成Q个小矩形或方形块。矩形块最好是方形块,因为对x方向和y方向的处理是对称的。在方块的情况中,把块的单位长度定为I和J的公约数,便能以方块复盖一个差图象而没有多余的重叠部分。即I=ms和J=ns,这里m和n是整数。在实践中,一个方块的边长定为b=S+1,以便以一个象元宽度重叠相邻块。一个象元宽度重叠有利于块的组合。如果在块的边缘处相邻象元彼此不重叠,就会在块放大或块缩小时丢失相邻块之间的结合线。块边缘一个象元宽度的重叠用于避免发生这种裂缝。
由于上述理由,差图象分区装置(L)把差图象分成小块。图13示意说明差图象的分区。在每个单独块中独立地近似差色调。
否则,如果把原始图象分成块,而不是把差图象分块,则当把块组合起来时其结合线就会是不连续的和受干扰的。在结合线处的这种不连续性在这里称作“块畸变”。直接分区处理会受这种块畸变的困扰。然而,本实施例完全不受块畸变的影响,因为分区边界已完全吸收了随机变化色调部分,而差图象以单调灰色复盖。
然而,不对差图象分区也能实现本发明。分成多个块是为缩短计算时间的一种创造。当节省时间不甚重要时,可直接以二维函数近似差图象而不把它分块。
〔M.差块存储装置〕差色调{diff(xiq,yjq)}Q按块存于差块存储装置(M)。Q是块的总数。(xiq,yjq)是指在第q块中的第i个象元的坐标,这里q是块序号(q=0,1,2,…,Q-1)。diff(xiq,yjq)是第q块中第i点的差色调。
〔N.数据近似装置〕数据近似装置(N)以二维样条函数近似差块。近似的大小是确定的,例如在以前情况中的bxb。这是本发明中的第二次近似。第一次近似是对边界的一维近似,边界没有一定的大小。对差边的近似是第二次近似,这是最重要的近似。近似的对象有二维宽度。这样,将用二变量函数近似差图象。
本发明采用二维样条函数近似各块的色调。然而,不用二维样条,也能用三维样条来近似同样的差块。差块展开在二变量基函数ψmn(x,y)上。块中的色调分布表示为样条基的线性组合,即样条基乘以系数后相加。x和y的定义域是〔0,1〕,即T=1。M是x方向分块数。N是y方向分块数。样条基由下式给出ψmn(x,y)=(3MN)2Σk=13Σl=03(-l)k+1{x-(k+m)(T/M)}+2{y-(l+n)(T/N)}+2(3-k)!k!(3-l)!l!----(70)]]>0≤x≤1,0≤y≤1.(71)在等式(70)中,{α}+表示当α≥0时为α,当α<0时为0。y方向分块数N与基Nq(t)不同。ψmn(x,y)是单变量样条Nm(x)和Nm(y)的乘积。不等式(71)声明x和y的定义域为〔0,1〕。在实际图象平面中块的大小为b×b。于是,这里以x/b代替x,以y/b代替y,使坐标归一化。这样,定义域归一化为〔0,1〕×〔0,1〕。由于T=1,在x方向小段单位宽度是1/M,在y方向是1/N。虽然块是方形的,M和N不一定相等,因为通常在x方向和y方向的色调变化程度是不同的。给出非零ψmn(x,y)的x和y范围是m/M<x<(m+3)/M,n/N<y<(n+3)/N.(72)这是对(x,y)的方形范围。在方形之外ψmn(x,y)=0。最大值是在x=(m+1.5)/M和y=(n+1.5)/N处出现的9/16。等式(71)对x和y的二重积分为1,因为它已归一化了。这个数据近似装置(N)以一函数S(x,y)近似每块的diff(x,y),S(x,y)是{ψmn(x,y)}以系数{Cmn}的线性组合。块差色调近似函数S(x,y)由下式给出s(x,y)=Σn=-2N-1Σm=-2M-1cmnψmn(x,y)----(73)]]>由确定{Cmn}来建立块函数,因为{ψmn}是已知函数。计算系数{Cmn}的方式类似于确定子边界时所用方式。为确认块差色调,最小平方误差法和双正交函数法都是可用的。这两种方法在前文中都已描述过作为近似子边界的方式。由本发明者创造的双正交函数法优越于最小平方法。这样,这里的系数{Cmn}只由双正交函数法计算。当然,参考前述步骤也能容易地将最小平方法应用于差色调近似。
如前面解释的,单变量样条基Np(x)缺少正交性。作为Nm(x)和Nn(y)乘积的二变量样条基ψmn(x,y)当然也缺少正交性。通过定义二变量双正交函数Φpq(x,y),也能轻而易举地计算出系数{Cmn}。样条基ψmn(x,y)和双正交基Φpq(x,y)满足二重正交条件∫01∫01ψmn(x,y)φpq(x,y)dxdy=δmpδnq.----(74)]]>利用双正交基(如果它们存在的话),等式(73)中的系数{Cmn}可简单地由下式表示cmn=∫01∫01S(x,y)φmn(x,y)dxdy.----(75)]]>双正交基Φmn(x,y)有二个变量和二个后缀。由于ψmn(x,y)是Nm(x)和Nn(y)的普通乘积,Φmn(x,y)可由寻找Lp(x)的类似方式确定。等式(70)简化成ψmn(x,y)=Nm(x)Nn(y). (76)Lp(x)是Nm(x)的双正交函数。∫01Nm(x)Lp(x)dx=δmp----(77)]]>∫01Nn(y)Lq(y)dy=δnq.----(78)]]>满足等式(74)的二变量正交基Φpq(x,y)由下式唯一确定Φpq(x,y)=Lp(x)Lq(y).(79){Lp(x)}是定义在〔0,1〕上的已知函数。对所有0≤x≤1的x值准备一个Lp(x)值表是方便的。由(75)式和(79)式,Cmn由下式给出cmn=∫01∫01S(x,y)Lm(x)Ln(y)dxdy.----(80)]]>在实践中,S(x,y)是为近似diff(xi,yi)而引入的未知函数。这样,在式(80)中由diff(xi,yi)代替S(x,y)。在双正交基Lm和Ln上,{Cmn}有如下具体表达式cmn=ΣiΣjdiff(xi,yj)Lm(xi)Ln(yj)/MN.----(81)]]>对i和j求和将在SXS象元的当前块中包含的所有象元(xi,yj)上进行。由于Lm(x)和Ln(y)是已知函数,式(81)能被计算。另一种作法是式(81)可由样条基Np(x)和Nq(y)进一步转换成cmn=Σp=-2M-1Σq=-2N-1dmpdnqΣiΣjdiff(xi,yj)Np(xi)Nq(yj)/MN.----(82)]]>下面简述其理由。二变量双正交基Φmn(x,y)由张量dmnpq与二变量样条ψpq(x,y)相关联φmn(x,y)=Σp=-2M-1Σq=-2N-1dmnpqψpq(x,y).----(83)]]>由于ψpq(x,y)是Np和Nq的直接乘积,张量dmnpq是dmp和dnq的乘积,dmnpq=dmpdnq.(84)反之,ψmn(x,y)由另一张量{Umnpq}与Φpq(x,y)耦合,如下式所示ψmn(x,y)=Σp=-2M-1Σq=-2N-1umnpqφpq(x,y).----(85)]]>张量umnpq也能写作Ump和Unq之乘积,umnpq=umpUnq.(86)这组系数{Cmn}可由式(81)或式(82)计算。式(82)包含Np(x)和Nq(y)乘积,它对每个限定点有确定值。对p/M≤xi≤(p+3)/M,Np(xi)有一定值,否则为零。有三个基有一定值。这样,式(82)只有9项有非零值。式(82)中的求和是9项之和而不是(M+1)(N+1)项之和。通常,K×H表示块的大小。如果埠是方块,K=H=S,Cmn由9(K+1)(H+1)次计算得到。块总数是Q。图象总大小是I×J。这些参数满足关系KHQ=IJ. (87)分段数M和NJ控制近似程度的参数。从M=1和N=1起始,对M和N每次加1来重复近似过程,直至近似满足要求。这种重复近似类似于先前的边界近似。然而,边界近似与块色调近似之间有四点差别。一个差别是函数的维数;边界近似基于一维函数,但块色调近似使用二维函数。另一差别是对象的大小。边界近似处理各种长度的子边界。色调近似处理有一定范围的块。再一个差别是对象。边界近似处理几何曲线。色调近似处理有确定的L个步长的每点色调。另一区别是变量。边界近似使用中间自变量t来描述因变量(x,y)作为t的函数。色调近似直接把坐标ψpq(x,y)作为自变量描述色调,色调是一个因变量,作为自变量(x,y)的函数。
近似的准确性由SNR(信号噪声比)来估计,它定义为SNR=10log10L2(K+1)(H+1)Σi=0KΣj=0H{S(xi,yj)-diff(xi,yj)}2.----(88)]]>这里L是全色调级数,例如L=256,K和H是块的x方向和y方向长度。对i和j求和表明对块中所有象素求和。如果块是方形,则K=H=S。{S(xi,yj)-diff(xi,yj)}是在象元(xi,yj)的色调近似误差。对误差平方,沿x方向和y方向对平方误差求和,再除以(K+1)(H+1),便得到平均平方误差。平均平方误差被除以L2来归一化。归一化平均平方误差的倒数是近似精度的度量。这个倒数越大,表明近似精度越高。式)88(把归一化平均平方误差倒数包括在对数中。SNR的单位是dB(分贝)。
SNR=QdB表明根本无信号,因为误差等于整个色调范围L。SNR=20dB意味着每个象元的平均误差约为全范围L的1/10。SNR=40dB表明每个象元的平均误差约为全范围L的1/100。临界值ε’被预先确定,作为对近似准确度的估计。换句话说,由分别把M和N增大到M+1和N+1,重复块色调近似,直至SNR>ε’. (89)当近似达到满足不等式(89)的精度时,计算终止,当前的M,N及{Cmn}分别被确认为最后的M,N及{Cmn}。ε’是控制近似正确性的重要参数。较大的ε’是保证较高的精确度,但需要较长的时间。确定ε’是一个有决定性的问题。应根据目标图象的目的确定ε’。例如,应赋予ε’30dB到40dB的值。当不等式(89)成立时,对第q块的近似函数便设定了,因为M、Cmn及ψmn已被确定。
对所有块(q=0,1,2,3,…,Q-1)将进行类似的近似。最后,对所有块得到了一组差色调系数{Cmn(q)}Q-1q=0。这里简单地把数据M、N及{Cmn(q)}Q-1q=0称作“压缩数据”,它应与存在区域存储装置(I)中的“区域数据”清楚地区分开。区域数据也是区域、分支点、转折点和子边界的压缩数据,但直接称作“区域数据”。块色调近似数据可以称作“块色调压缩数据”,但现在直称“压缩数据”。
近似是逐块进行的。如前所述,把差图象分成块并近似块色调的目的是减少计算时间。当然,在本发明中分块处理是可选的。如果可忽略对计算时间的限制,当然可能近似整个差图象而不分块。在这种情况下,装置和步骤(L)和(M)应被去掉,差图象存储(K)步骤和装置应直接在后面跟随数据近似(N)。近似应在x方向I象元和y方向J象元这样的广大范围中进行。
前面解释的方式准备了转换系数{dmnpq},它把双正交基与样条基关联起来,并通过双正交基把块色调在样条基上展开。由{dmn}构成的矩阵D是由二样条基Np和Nq的内积构成的矩阵G的逆矩阵,如式(51)和(52)所示。式(64)和(65)是计算{Cxq}和{Cyq}的适当方程,无需知道双正交基的具体形式。
另一种方式是可以直接计算双正交基。本发明者在其论文中首次给出该双正交基的具体形式(11)T.Horiuchi“可采用的系统模型及其在桌面印刷系统的应用的研究”,论文,筑波大学,1995。
双正交基Lm(t)是Lm(t)=Σk=0Th2∫-1/2h1/2hexp{2πjf(k-m)b}Σp=0T{sinπ(fh-p)π(fh-p)}6dfNk(t),----(90)]]>这里h是小段的长度,即h=T/M。式(90)不能解析地积分,但能用计算机进行数值计算。图21给出二阶正交基。其积分是1(∫Lm(t)dt=1)。与不同序号样条基Nk(t)的乘积的积分为0(∫Lm(t)Nk(t)dt=0,m≠k)。是峰值两侧的负振荡部分使积分变为0。负值部分的存在对于消除相邻基Lm(t)和Nm+1(t)乘积Lm(t)和Nm+1(t)的积分是至关重要的(∫Lm(t)Nm+1(t)dt=0)。振荡块速衰减。与同序号样条基Nm(t)乘积的积分是1(∫Lm(t)Nk(t)dt=0,m≠k)。首次给出双正交基具体形式的人是本发明者。计算双正交基并把单个值{Lm(t)}列入表中是有用的。
〔O.压缩数据存储装置〕数据近似装置(N)把代表各块中色调分布的压缩数据提供给压缩数据存储装置(O)。压缩数据包括每块的x方向分段数M,y方向分段数N及系数{Cmn}。压缩数据中包含二维色调数据,这完全不同于包括特征点和边界信息的区域数据。表2表示出压缩数据存储装置(O)中存储的数据量。
表2块近似的数据量
〔P.编码装置〕到现在为止的步骤已产生了存于(I)中的区域数据和存于(O)中的压缩数据。当然,可以按这些数据原样存储。否则,也可以对这些数据进一步压缩并把双重压缩的数据存于其他存储器中。编码是进一步压缩数据的一种手段。在信息处理技术中通过把数据编码来减少信息量,这并不是新的,而是众所周知的。有几种不同的方法编码数据。例如,本发明利用霍夫曼编码方法。除霍夫曼法以外的其他方法也是可用的。由于霍夫曼编码法对于信息处理技术方面的专家是公知的,这里不描述对曾被压缩的数据进行编码的细节。对(I)的区域数据和(O)的压缩数据都进行编码。编码步骤减少了数据量,但反过来增加了处理时间。采取编码步骤是可选的,应根据图象处理的目的而定。当应该减少时间时,应略掉编码步骤。当应该节省存储器时,步骤中应包括对曾压缩一次的数据编码。
〔Q.编码数据输出装置〕编码装置(P)对区域数据和压缩数据编码,而编码数据输出装置(Q)以位信号系列输出编码数据。编码不仅对压缩数据有效,而且对保密有效。由于数据已由某种方法编码,为恢复数据,必须以同一方法对数据解码。没有解码手段的第三者不能恢复数据。编码起到保护密秘的作用。
〔R.编码数据存储装置〕编码数据存储装置(R)存储区域数据和压缩数据的编码信息。存于这一装置(R)中的数据能根据输出请求在任何时候被读出。(A)至(R)这些装置是输入图象、压缩图象数据、存储区域数据和压缩数据系列。这些是数据处理的前一部分。图象处理的后一部分是另一个系列读出数据、解码数据、恢复图象数据和在某种输出装置上输出再生图象。
本发明不是按照原样存储图象数据,而是通过下列步骤存储充分压缩的数据提取有相似色调的象元集合作为区域,以平均色调画出每个区域从而产生平均色调图象,提取边界,在分支点分割边界并在转折点分割成子边界,用中间变量样条近似来近似子边界,从输入图象中减去平均色调图象以造成差图象,以及由二维样条函数近似差图象。所存储的数据包括区域数据和压缩数据。
如前面解释的,把差图象分块和逐块近似差色调的步骤不是本发明固有的必须步骤。不把差图象分块而是一次完成近似整个差图象也是可能的。这另一种方式去掉了差图象分区装置(L)和差块图象存储装置(M)。
编码和解码步骤也是可选的。去掉编码和解码处理是可能的。在这种情况下,编码装置(P)、编码数据输出装置(Q)、编码数据存储装置(R)及编码数据输入装置(S)都将从处理过程中删掉。区域数据和压缩数据将按原样存储。
到此所作的描述阐明了输入、压缩和存储图象数据的步骤。除了存于计算机的RAM中外,被压缩的数据还可存于软盘、硬盘或光盘中。数据的存储可以是短暂时间的、临时的或永久的,取决于目标图象及操作者的目的和意愿。
下面的描述涉及从存储的数据恢复原始图象。这处理的后一半,即恢复步骤,只是前一半即输入、压缩和存储数据的逆过程。恢复步骤不包含新的内容,它由解码、提取差图象、恢复区域、重建连续变化色调图象和以某种手段输出连续变化色调图象。由于数据已作为样条函数展开级数的系数存储,故以放大的尺度或缩小的尺度来再生目标图象是现实可行的。简单的计算实现图象的旋转或各向异性放大。由于所恢复步骤不再有任何新内容,对这些步骤只作简单描述以免冗长。
〔S.编码数据输入装置〕编码数据输入装置(S)读入包含区域数据和压缩数据的累积编码数据。如果在前一半处理中略去了步骤(P)、(Q)和(R),则编码便不必要,于是累积的数据将提供给一个差块再生装置(U)。
可在对操作者方便的任何时候向编码数据输入装置(S)读入装置。当最终图象数据已存入软盘、光盘或硬盘时,数据应被直接从存储装置读入。此外,通过电话电缆或光纤电缆传送数据,从而把位于远方的存储装置中存储的数据输入也是可行的。
〔T.解码装置〕解码装置对来自编码数据输入装置的编码数据解码。解码方法必须与编码方法对应。如果数据已由霍夫曼编码法编码,则数据应由霍夫曼方法解码。如果没有适当的解码软件,数据不能被解码。这样,信息对第三者保密。
〔U.差块恢复装置〕差决恢复装置(U)从包含x分段数M、y分段数N及展开系数{Cpq}的解码压缩数据中提取差色调块。差色调是逐块恢复的。在一块中取样点(xi,yj)处的差色调S(xi,yj)表示为S(xi,yj)=Σq=-2N-1Σp=-2M-1cpqψpq(xi,yj).----(91)]]>系数{Cpq}由解码压缩数据给出。二变量样条基是单变量样条函数Np和Nq的乘积,它们已对可能的M和N计算出来并列表存储起来。等效地,式(91)可重写成S(xi,yi)=Σq=-2N-1Σp=-2M-1cpqNp(xi)Nq(yj).----(92)]]>如前所述,Np(xi)依赖于维数m和分段数据M。本实施例固定m为m=2。但m=3,m=4或m=5等等也是可用的。反之,M是自由的可调节参数,它控制近似的精确程度。由于m已经固定,Np(x)由确定M来唯一确定。再有,M只是作为小段宽度(T/M)出现在Np(x)中。Np(x)对M的依赖弱于对m的依赖。Np(x)的形式会被m改变,但不受M影响。M是小段分段数,小的宽度为(T/M),这里T是Np(x)上的定义域。Np(x)只在从第p小段到第(P+2)小段这三小段中有一定值,Np(x)=0.5{(x/Δ)-p}2/Δ for pΔ≤x≤(p+1)Δ(93)Np(x)={(x/Δ)-p-1}{p+2-(x/Δ)}/Δ+0.5/Δ for(p+1)Δ≤x≤(p+2)Δ (94)Np(x)=0.5{p+3-(x/Δ)}2/Δfor(p+2)Δ≤x≤(p+3)Δ.(95)除上面的三小段外,对其他小段Np(x)等于零。ψpq(x,y)作为Np(x)和Nq(y)乘积,是只在9个方形中有一定值的局部化函数,这9个方形是从x=pΔ至x=(p+3)Δ及从y=qΔ至y=(q+3)Δ。对所有块完成式(91)或式(92)得到所有Q个块的差色调S(xi,yj)。
〔V.差图象提取装置〕差图象提取装置(V)按长度和按交叉将全部Q个差图象块结合起来,以单象元宽度的边线与外围块重叠。这样便提取出一个统一的(I×J)差图象。
〔W.连续色调图象再生装置〕连续变化色调图象再生装置(W)通过恢复子边界、把子边界加到差图象上、把子边界统一到边界中从而恢复各区域、把平均色调h(q)加到包围在每区(q)中的每一点(xi,yj)的差色调S(xi,yj)上、以及对点(xi,yj)赋予连续变化色调g(xi,yj)(g(xi,yj)=h(q)+S(xi,yj))这些步骤,来恢复连续变化色调图象。
边界由如下步骤提取。所有转折点和分支点已被给予在原始图象上定义的坐标上。这些特征点被写在差色调图象上。由特征点给出子边界的起始点。坐标{Cxp,Cyq}从存储器中读出。子边界由函数Sx(t)和Sy(t)给出,它们由样条基的线性组合表示sx(t)=Σp=-2M-1cxpNp(t),----(96)]]>sy(t)=Σq=-2N-1cyqNq(t).----(97)]]>
这些函数用t作为独立的中间变量以表示x和y之间的关系。t的定义域限定在例如〔0,1〕。利用式(96)和(97)可计算出任意t处的Sx和Sy。子边界{(xi,yj)}由在t=ti处计算Sx(t)和Sy(t)给出,ti是在间隔〔0,1〕中以某一小间隔赋予t的。由计算全部子边界上的点系列,能恢复全部边界。由结合子边界确定区域(q)。边界和区域之间的关系是已建立的。所有象元(xi,yj)无例外地被分类到一些区域。每个区域(q)有一平均色调h(q)作为一个属性已存储在区域数据存储装置(I)。把第q区的平均色调h(q)加到属于第q区的所有象元的差色调S(xi,yj)上,于是提取出总色调g(xi,yj)g(xi,yj)=S(xi,yj)+h(q).(98)差色调是灰色的,取(L/2)-W和(L/2)+W之间的窄宽度的值,这里L是色调分级数,L/2是中间色调(灰色),2W是一个区域内包含的象元的色调宽度。但恢复的色调g(xi,yj)不限于这个窄范围之内,因为h(q)是逐区变化的。差色调S(x,y)代表色调的精细变化。
〔X.连续色调图象输出装置〕到此已计算出确定连续变化色调图象的所有参数。最后,所产生的图象必须以一种具体形式由打印机、切割绘图仪、雕刻机等输出到一张或一条纸、布、木、金属上。由于图象是由计算再生的,所以放大或缩小图象尺寸是可行的。希望用大型打印机或宽的切割绘图仪来放大目标图象。除了在纸张上画平的二维图象外,自动雕刻机在厚木板或厚金属板上造成三维图象。
例如,可以采用版面编辑器(layout editor)从样条基系数再生出图象,该编辑器能再生出的图象大小从边长1mm的小方形到900mm宽16000mm长的宽长矩形。这种再生图象可由例如具有分辨力大于600DPI(每英寸点数)的post-script打印机输出。
上面对本发明处理单色连续变化色调图象进行了全面的解释。可由所解释的从(A)到(X)各步骤和装置来输入、压缩、存储、再生和输出单色连续色调图象。然而,如果原始图象是彩色连续变化色调图象,从(A)到(X)的装置和步骤就不够了。然而,在处理彩色图象中没有任何重大困难。一幅彩色图象可分解成三个或四个分量(原色)。这些分量的任何一个都是单色图象。这样,一幅彩色图象总能由分量色彩分解转换成三或四个单色图象。一旦把目标彩色图象分解成单色连续变化色调图象,前面提到的从(A)到(X)步骤能被应用于输入、压缩、存储、再生和输出每幅单色图象。然后,这三或四个单色图象能被合成为统一的彩色图象。所以,除了从(A)到(X)的步骤和装置外,彩色图象还需要彩色分解装置(Y)和彩色合成装置(Z)。彩色分解装置(Y)把输入彩色图象分解成四或三个分量单色图象。彩色合成装置(Z)把四或三个再生单色图象合成为统一的彩色图象。
〔y.彩色分解装置〕有二种方式对彩色图象编码。一种是“组合编码”,它对彩色信号按原样编码,不进行分解。另一种是“分量编码”,它把彩色图象分解成分量图象,再对每个分量图象编码。本发明采用分量编码,它把彩色图象分解成分量图象,这些分量图象适于用从(A)到(X)的步骤和装置来处理。为此目的,彩色分解装置(Y)把输入图象分解成分量。有几种方式把彩色图象分解成分量单色图象。已广泛应用三原色分量集RGB(红、绿、兰)来把彩色分量图象混合成统一的彩色图象,这类似于彩色电视或彩色摄影。本发明中可采用RGB方法把彩色图象分解成红、绿、兰单色图象。然而,RGB分解的一个缺点是相关性很强,不太适于编码。
相反,分解成原色YUV的三分量分解是另一种更好的作法。Y、U及V由R、G、B按下列关系线性组合而成Y=0.299R+0.587G+0.114B。U=R-Y。V=B-Y.YUV分解已经经常应用于彩色信息传递,这种分解是基于R、G、B线性组合而成的三分量Y、U、V。YUV彼此相关性差,最适于编码,因为编码结果是决定性确定的。本发明可利用或者是RGB三分量分解或者是YUV三分量分解来实现。
不同于光的合成与分解,基于其他原色YMC(黄、洋红、深兰)通常用于由混合染料、漆或颜料来产生颜色。YMC是RGB的补色。即Y=1-B,M=1-G,C=1-R。“YMC”有时被写作“CMY”。
然而,在彩色印刷中YMC分解不能总是完全地合成黑色。于是四分量合成YMCK(黄、洋红、深兰、黑)被用于在彩色印刷中补足黑色调。可通过把彩色图象分解成任何当前已知的原色集来把本发明应用于彩色连续变化色调图象1.RGB2.YUV3.YMC4.YMCK。
彩色图象将基于RGB方法或YUV方法分解,以在计算机显示器上显示目标图象。此外,彩色图象将分解成原色YMC以在纸、布等上面印刷目标图象。一幅彩色图象被分解成三个或四个原色彩单色图象。每个单色图象输入到图1所示多个连续变化色调图象图象存储装置(A),并以同样步骤并行或串行处理。最好是同时在三个或四个类似装置中并行处理三个或四个单色图象。
图22给出彩色分解一图象处理一彩色合成的步骤。在第4种情况(YMCK)中,彩色分解装置(Y)把彩色图象分解成四原色Y、M、C、K。四图象输入到四个独立的图象处理装置,它们是如图1所示的完全相同的系统。被分配本征色的每个单独的图象处理装置压缩图象数据、存储被压缩数拓、并输出恢复的本征色单色图象。
〔Z.彩色合成装置〕Y、M、C、K彩色的恢复图象由彩色合成装置(Z)合成并作为单个彩色图象输出。这种合成必须与分解相对应。某些输出机器能自动对分量图象成合。在这种情况下,彩色合成装置(Z)可略掉。
〔最佳实施例〕为了检验本发明的性能,本发明的方法被用于“(1)SIDBA/女孩”作为连续色调图象的例子,“(2)爱”(MS哥特字体)作为二元色调图象的例子。图14(a)是“女孩”的原始图象。图14(b)是“爱”的原始图象。
〔例1女孩〕本发明中分区参数W和误差估计容限ε’是可调节的。于是,通过改变W和ε’之值来检验其结果。图2(a)是与图14(a)相同的原始图象。图2(b)是区域存储装置(C)中存储的平均色调图象。平均色调图象由具有平均色调的区域组成。小W由于区域和边界个数增多而增加了处理时间。图2(c)是边界图。反之,大W减少边界和区域数目。图2(e)给出分支点的分布。W控制区域、边界、分支点和转折点。
图2(f)给出差图象,它是从原始图象中减去平均色调图象再加上中间值gm=L/2(L色调总分级数)产生的。这样,差图象的所有象元具有gm-W和gm+W之间的中间色调。如果W小,则差图象中包含原始图象的特征就少。差图象与平均色调图象是互补的,因为差图象色调与平均色调图象之和总是等于原始图象色调。平均色调图象带有的特征越多,差图象带有的色调就越少。图2给出输入处理系列。输出处理是输入处理的逆过程。
W是决定其特征在平均色调图象或差图象比例的参数。图4说明平均色调图象随W变化而变化的情况。图4(a)代表W=8的平均色调图象,它有许多窄区域。由于W小,平均色调图象很好地表现出原始图象的特征。W=32的平均色调图象表出其特征不充分,因为区域数太小,而区域太宽。
图12显示出差图象随W变化的转变情况。图12(a)是W=8的差图象,它有接近中间色度L/2的几乎均匀的色调,因为几乎所有特征都被吸收到图4(a)的平均色调图象中。在W=16的差图象中出现了一个女孩的模糊图象。W=32的差图象带有女孩的某些特征。W=8的图象由于其色调起伏小而最适于近似。低分段数的样条能以高精度近似这种小变化的色调。
W和ε’是控制再生图象质量的重要参数。然而,ε’的影响不象W那样清楚。差图象近似容限ε’是控制处理结果的重要参数,ε’确定信号噪声比的可允许下限。为增强再生图象的质量,ε’以30dB至40dB为好。较高的ε’会把质量提得更高,但会增加数据量,会需要更大的存储容量。
通过改变W和SNR参数来计算每象元的位数〔位/象元〕,以研究信息密度对W和ε’的依赖性。图15给出计算结果。原始图象表示为256个色调级(8位)。对原始图象,每象元位数为8位/象元。W=80和ε’(SNR)=30dB给出2.2位/象元。W=80和ε’=26dB把数据量减少到1.4位/象元,这约为原始图象的六分之一。即数据被压缩为接近1/6。通常,大W减少分区数,但在差图象中引起色调起伏。即使对这样的大W,通过采取高ε’值也能使近似接近于原始图象。通过W=96和ε’=30dB的处理,图14(a)的原始图象再生为图16(a)的再生图象。虽然W大,由于高ε’值,使再生图象(图16(a))带有原始图象(图14(a))的明显特征。
图17(a)、17(b)、17(c)显示出W=16和ε’=40dB的不同尺度再生图象。图17(a)是缩小的再生图象。图17(b)是相同大小的再生图象。图17(c)是放大的图象。函数近似使本发明能变换图象,如放大、缩小、各向异性放大或转动。
〔例2爱〕本发明的主要目的是处理连续色调图象。当然,本发明能处理二元色调图象,它比连续变化色调图象简单得多。本发明以图1所示同样步骤处理二元色调图象。然而,原始图象只有二色调。当按色调差别把图象分成多个区域时,这些区只有二个色调值。区域与白部分及黑部分严格相同。当L=256时,平均色调可确定为或者是0或者是256。在每个区中无色调起伏。
平均色调图象与原始二色调图象相同。边界与确定的图形、字符等的轮廓重合。差图象是均匀的灰图象,其中所有象元有256/2=128个色调级。在原始图象中每象元位数是1位/象元。不论W和ε’取何值,差图象总是由常系数最低分段数样条近似。当“爱”由本发明处理时,每象元位数是0.22位/象元。由本发明将数据量压缩成原始数据量的四分之一。
图16(b)是图14(b)的再生二元色调图象。图14(b)的原始图象在弱倾斜部分有锯齿状轮廓。再生图象(图16(b))免除了锯齿状轮廓的影响。函数近似消去轮廓线上出现的锯齿状噪声。平滑的轮廓使再生图象的质量高于原始图象。本发明改进了图象质量。这一事实证明了本发明的划时代特征。
在本发明中,除了W和ε’外,还有另一个重要参数ε。它是子边界近似用的容限ε(式(31)或式(67))。对于二元图象由于边界与固有轮廓重合,边界近似相当重要。较小的容限把近似精度提得更高,并不总是希望严格不变的再生,因为原始图象伴随某些缺陷,如图14(b)的锯齿轮廓线。通过确定适当的容限ε,能消除这种缺陷。
本发明把连续色调图象读入图象存储器,把输入图象分区,对每个区域中的象元色调取平均,造成平均色调图象,提取区域边界,把边界在特征点分成子边界,用多变量矢量表示子边界,用函数近似子边界,从原始图象中减去平均色调图象从而造成差图象,以及用二变量函数近似差图象,通过这些处理过程本发明成功地压缩数据以节省存储空间。函数近似急剧地减少了表示图象的数据量。被压缩后的数据量小,这有利于存储、再生和放大。通过电话线把数据传到远处也是可行的。
传统的图象处理依赖于位图操作,通常是积累直接与象元关联的数据。由于数据牢牢固定于象元上,几乎不可能放大或缩小图象,因为位图操作需要巨大计算量去作放大等操作。
本发明依靠函数近似,能在短时间内产生放大图象、转动图象或各向异性放大图象而不降低质量。本发明给出最适用于计算机、印刷机、和信息远程传送的图象处理。
虽然本发明的主要目的是处理连续变化色调图象,本发明对二元色调图象也是可用的。本发明能处理任意形式的图象,例如照片、插画、印刷字符、手稿、计算机图形等等。
权利要求
1.一种输入和输出连续变化色调图象的设备,包括图象存储装置(A),用于存储由图象扫描仪光学输入的图象、由其他输入装置输入的图象或在计算机中产生的图象的输入图象,这种输入图象是作为定义在确定数目象元上的连续变化色调集合存储的,这些象元沿图象平面中的水平(x)方向和垂直(y)方向排列;分区装置(B),用于将输入图象分成由类似色调的相邻象元组成的多个区域,并计算出每个区域的平均色调;区域存储装置(C),用于存储平均色调图象,它是以平均色调画出每个区域而产生的;边界提取装置(D),用于提取分割邻区的边界,作为定义在象元边角上的点系列;分支点提取装置(E),用于提取分支点,这些点位于边界上与多于二个区域接触的位置,作为把边界分成多个边界段的分支点;边界存储装置(F),用于存储由相邻分支点限定的每个边界段上各点的二维坐标(x,y);转折点提取装置(G),用于提取边界段上以大于确定值的角度转折处的点,作为把边界段分成子边界的转折点;边界近似装置(H),用于产生终止于分支点或转折点的子边界的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量t和因变量x、y的单变量样条基的线性组合来重复近似每个子边界,通过增大M和N进行重复近似,直至误差小于一临界值;区域数据存储装置(I),用于存储子边界近似函数信息和把子边界关联于区域的信息;差图象产生装置(J),用于从输入图象中减去平均色调图象从而产生差图象;差图象存储装置(K),用于存储在差图象中沿x方向和y方向排列的象元的差色调;数据近似装置(N),用于产生差图象的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)及因变量S(表示色调)的二变量样条基的线性组合来重复近似差图象,通过增大分段数M和N进行重复近似,直至误差小于一临界值;压缩数据存储装置(O),用于存储差图象近似函数的参数;差图象提取装置(V),用于从压缩数据提取差图象;连续色调图象再生装置(W),用于再生连续变化色调图象,作法是从区域存储装置(C)读出边界和平均色调数据,在差图象上画出边界,造成由边界封闭的区域,并把平均色调加到各区域中每个象元的差色调上;以及连续色调图象输出装置(X),用于输出再生的连续变化色调图象。
2.如权利要求1中所述的设备,还包括编码装置(P),用于对来自区域数据存储装置(I)的边界和平均色调的区域数据以及来自压缩数据存储装置(O)的差图象压缩数据进行编码;编码数据输出装置(Q),用于输出区域数据和压缩数据的编码信息;编码数据存储装置(R),用于存储区域数据和压缩数据的编码信息;编码数据输入装置(S),用于输入来自编码数据存储装置(R)的编码信息;以及解码装置用于通过对编码数据解码来恢复区域数据和压缩数据的信息;这里的差图象提取装置(V)从被解码装置(T)解码的压缩数据中提取差图象。
3.如权利要求2中所述的设备,还包括差图象分区装置(L),用于把来自差图象存储装置(K)的差图象分成多个块;差块存储装置(M)、用于存储块及每块中的差色调;差块恢复装置(U),用于从压缩数据再生差块;其中数据近似装置(N)用于产生差块的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)及因变量S(表示色调)的二变量样条基的线性组合来重复近似每个差块,通过过增大分段数M和N进行重复近似,直至误差小于一临界值,而差图象提取装置(W)把各差块组合起来,从而造成差图象。
4.一种输入和输出彩色图象的设备,包括图象存储装置(A),用于存储由图象扫描仪光学输入的彩色图象、由其他输入装置输入的彩色图象或在计算机中产生的彩色图象的输入图象,这种输入图象是作为各原色及其定义在确定数目象元上的原色连续变化色调集合存储的,这些象元沿图象平面中的水平(x)方向和垂直(y)方向排列;彩色分解装置(Y),用于把输入图象数据分解成一组原色图象并造成各原色的连续变化色调数据;个数为原色数的分区装置(B),用于将每个原色的输入图象分成由类似色调的相邻象元组成的多个区域,并对每个原色计算出每个区域的平均色调;区域存储装置(C),用于存储平均色调图象,它是对每个原色以平均色调画出每个区域而产生的;边界提取装置(D),用于对每个原色提取分割邻区的边界,作为定义在象元边角上的点系列;每个原色的分支点提取装置(E),用于提取分支点,这些分支点位于边界上与多于二个区域接触的位置,作为把边界分成多个边界段的分支点;边界存储装置(F),用于存储由相邻分支点限定的每个边界段上各点的二维坐标(x,y);转折点提取装置(G),用于提取边界段上以大于确定值的角度转折处的点,作为把边界段分成多个子边界的转折点;边界近似装置(H),用于产生终止于分支点或转折点的子边界的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量t和因变量x、y的单变量样条基的线性组合来重复近似每个子边界,通过增大M和N进行这处重复近似,直至误差小于一临界值;区域数据存储装置I,用于存储子边界近似函数信息和子边界与区域的关系信息;差图象产生装置(J),用于从输入图象中减去平均色调图象从而产生差图象;差图象存储装置(K),用于存储在差图象中沿x方向和y方向排列的象元的差色调;数据近似装置(N),用于产生差图象的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)及因变量S(表示色调)的二变量样条基的线性组合来重复近似差图象,通过增大分段数M和N进行这种重复近似,直至误差小于一临界值;压缩数据存储装置(O),用于存储差图象近似函数的参数;差图象提取装置(V),用于从压缩数据提取差图象;连续色调图象再生装置(W),用于再生每个原色的连续变化色调图象,作法是从区域存储装置(C)读出边界和平均色调数据,在差图象上画出边界,造成由边界封闭的区域,并把平均色调加到各区域中每个象元的差色调上;彩色合成装置(Z),用于把各原色的连续变化色调图象合成为统一的彩色图象;以及彩色图象输出装置用于输出统一的彩色图象。
5.如权利要求4中所述的设备,还包括编码装置(P),用于对来自区域数据存储装置(I)的边界和平均色调的区域数据以及来自压缩数据存储装置(O)的差图象压缩数据进行编码;编码数据输出装置(Q),用于输出区域数据和压缩数据的编码信息;编码数据存储装置(R),用于存储区域数据和压缩数据的编码信息;编码数据编码装置(S),用于输入来自编码数据存储装置(R)的编码信息;以及编码装置用于通过对编码装置数据解码来恢复区域数据和压缩数据的信息;其中差图象提取装置(V)从被解码装置(T)解码的压缩数据中提取差图象。
6.如权利要求5中所述的设备,还包括差图象分区装置(L),用于把来自差图象存储装置(K)的差图象分成多个块;差块存储装置(M),用于存储块及每块中的差色调;差块恢复装置(U),用于从压缩数据再生差块;其中数据近似装置(N)用于产生差块的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)及因变量S(表示色调)的二变量样条基的线性组合来重复近似每个差块,通过增大分段数M和N进行重复近似,直至误差小于一临界值,而差图象提取装置(W)把各差块组合起来,从而造成差图象。
7.一种输入和输出连续变化色调图象的方法,包括如下步骤把由图象扫描仪光学输入的图象、由其他输入装置输入的图象或在计算机中产生的图象的输入图象存储于图象存储装置(A),作为定义在确定数目象元上的连续变化色调集合,这些象元沿图象平面中的水平(x)方向和垂直(y)方向排列;将输入图象分成由类似色调的相邻象元组成的多个区域;计算每个区域的平均色调;将平均色调图象存储于区域存储装置(C)中,该平均色调图象是以平均色调画出每个区域而产生的;提取分割邻区的边界,作为定义在象元边角上的点系列;提取位于边界上与多于二个区域接触的点,作为把边界分成多个边界段的分支点;把由相邻分支点限定的每个边界段上各点的二维坐标(x,y)存储于边界存储装置(F);提取边界段上以大于确定值的角度转折处的点,作为把边界段分成子边界的转折点;产生终止于分支点或转折点的子边界的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量t和因变量x、y的单变量样条基的线性组合来重复近似每个子边界,通过增大M和N进行重复近似,直至误差小于一临界值;把子边界近似信息及子边界和区域的关系存储于区域数据存储装置(I);从输入图象中减去平均色调图象从而产生差图象;把差图象中沿x方向和y方向排列的象元的差色调存储于差图象存储装置(K);产生差图象的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)及因变量S(表示色调)的二变量样条基的线性组合来重复近似差图象,通过增大分段数M和N进行重复近似,直至误差小于一临界值;把差图象近似函数的参数存于压缩数据存储装置(O);从压缩数据提取差图象;从边界存储装置(F)读出边界数据;从区域存储装置(C)读出平均色调数据;在差图象上画边界;造成由边界封闭的区域;把平均色调加到各区域中每个象元的差色调上;再生连续色调图象;以及输出再生的连续变化色调图象。
8.如权利要求7中所述的方法,进一步包括如下步骤对来自区域数据存储装置(I)的边界和平均色调的区域数据以及来自压缩数据存储装置(O)的差图象压缩数据进行编码;输出区域数据和压缩数据的编码信息把区域数据和压缩数据的编码信息存储于编码数据存储装置(R);从编码数据存储装置(R)输入编码信息;通过对编码数据解码来恢复区域数据和压缩数据的信息;以及从解码的压缩数据中提取差图象。
9.如权利要求8中所述的方法,进一步包括如下步骤把来自差图象存储装置(K)的差图象分成多个块;把块及每块中的差色调存于差块存储装置(M);以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)和因变量S(表示色调)的二变量样条基的线性组合来重复近似每个差块,通过增大分段数M和N进行这种重复近似,直至误差小于一临界值。通过确定样条基上的系数来产生近似函数;把差块的分段数M和N及近似函数系数存于压缩数据存储装置(O);对分段数和系数构成的压缩数据进行编码;存储分段数和系数构成的编码压缩数据;解码被编码的压缩数据;由压缩数据再生差块;把差块组合在一起;以及由组合的差块提取出差图象。
10.如权利要求9中所述的方法,其中,其色调处于色调宽度2W之内的相邻象元被分类于同一区域,而且通过改变色调宽度可以调节具有处在2W色调宽度内的中间色调的差图象。
11.如权利要求9中所述的方法,其中在差块中的色调S(x,y)由二变量样条基ψmn(x,y)近似成S(x,y)=∑Cmnψ(x,y),其系数{Cmn}由Cmn=∑∑diff(xi,yj)Φmn(xi,yj)给出,这里diff(xi,yj)是在(xi,yj)的差色调,它定义为diff(x,y)=g(x,y)-h(q),g(x,y)是原色调,h(q)是该区的平均色调,Φmn(x,y)是ψmn(x,y)的双正交基,满足等式(Φmn·ψpq)=δmpδnq。
12.如权利要求9中所述的方法,其中所述子边界的坐标(xi,yj)由单变量样条基Np(t)和Nq(t)近似为Sx(t)=∑CpNp(t)及Sy(t)=CqNq(t),系数{Cp}和{Cq}由Cp=∑xiLq(xi)及Cq=∑yiLq(yi)给出,这里Lp(x)和Lq(y)是Np(x)和Nq(y)的双正交基,满足等式(Nm(x)·Lp(x))=δmp及(Nn(y)·Lq(y)=δnq。
13.一种输入输出彩色图象的方法,包括如下步骤把由图象扫描仪光学输入的彩色图象、由其他输入装置输入的彩色图象或在计算机中产生的彩色图象的输入图象数据作为原色及定义在确定数目象元上的原色连续变化色调集合存于图象存储装置(A),这些象元沿图象平面中的水平(x)方向和垂直(y)方向排列;把输入的彩色图象数据分解成多个原色图象;造成各原色的连续变化色调数据;把各原色的输入图象每个都分成由类似色调的相邻象元组成的多个区域,对每个原色图象计算每个区域中的平均色调;对每个原色,将以平均色调画出每个区而产生的平均色调图象存储于区域存储装置(C)中;对所有原色,提取分割相邻区域的边界,作为定义在象元边角的点的系列;提取位于边界上与多于二个区域接触的点,作为把边界分成多个边界段的分支点;把由相邻分支点限定的每个边界段上各点的二维坐标(x,y)存于边界装置(F);提取边界段上以大于确定值的角度转折处的点,作为把边界段分成多个子边界的转折点;产生终止于分支点或转折点的子边界的近似函数,作法是以双正交函数或最小二乘方法用分段数为M和N的有自变量t和因变量x,y的单变量样条基的线性组合来重复近似每个子边界,通过增大M和N进行这种重复近似,直至误差小于一临界值;把子边界近似函数信息和子边界与区域的关系信息存储于区域数据存储装置从输入图象中减去平均色调图象,从而产生差图象;把差图象中沿x方向和y方向排列的象元的差色调存储于差图象存储装置(K);产生差图象的近似函数,作法是以双正交函数法或最小二乘方法用分段数为M和N的有自变量(x,y)(定义在图象平面中)及因变量S(表示色调)的二变量样条基的线性组合来重复近似差图象,通过增大分段数M和N来进行这种重复近似,直至误差小于一临界值;把差图象近似函数系数存储于压缩数据存储装置(O);从压缩数据中提取差图象;从边界存储装置(F)读出边界数据;从区域存储装置(C)读出平均色调数据;在差图象上画出边界;造成由边界封闭的区域;把区域平均色调加到区域中象元的差色调上;对每个原色产生连续变化色调图象;把每个原色的连续变化色调图象组合成统一的彩色图象;以及输出统一的彩色图象。
14.如权利要求13中所述的方法,还包括如下步骤对所有色彩,对取自区域数据存储装置(I)的由边界和平均色调构成的区域数据进行编码;对每种色彩,对取自压缩数据存储装置(O)的差图象压缩数据进行编码;输出区域数据和压缩数据的编码信息;把区域数据和压缩数据的编码信息存储于编码数据存储装置(R);输入来自编码数据存储装置(R)的编码信息;通过对编码数据进行解码来恢复区域数据和压缩数据的信息;以及从解码压缩数据中提取差图象。
15.如权利要求14中所述的方法,还包括如下步骤对每种原色,把取自差图象存储装置(K)的差图象分成多个块;对所有原色,把块和每块中的差色调存储于差块存储装置(M);对双正交函数法或最小二乘法用分段数为M和N的有自变量(x,y)(定义在图象平面中)和因变量S(表示色调)的二变量样条基的线性组合来重复近似每个差块,通过增大分段数M和N来进行这种重复近似,直至误差小于一临界值。通过确定样条基上的每个系数来产生近似函数;把差块的分段数M和N及近似函数系数存储于压缩数据存储装置(O);对分段数和系数构成的压缩数据进行编码;存储由分段数和系数构成的编码的压缩数据;解码被编码的压缩数据;由压缩数据再生差块;把差块组合在一起;以及由组合的差块提取出差图象。
16.如权利要求15中所述的方法,其中所述差块中的色调S(x,y)由二变量样条基ψmn(x,y)近似为S(x,y)=∑Cmnψ(x,y),其系数{Cmn}由Cmn=∑∑diff(xi,yj)Φmn(xi,yj)给出,这里diff(xi,yj)是在(xi,yj)的差色调,它定义为diff(x,y)=g(x,y)-h(q),g(x,y)是原色调,h(q)是区域的平均色调,Φmn(x,y)是ψmn(x,y)的双正交基,满足等式(Φmn·ψpq)=δmpδnq。
17.如权利要求16中所述的方法,其中所述子边界坐标(xi,yj)由单变量样条基Np(t)和Nq(t)近似为Sx(t)=∑CpNp(t)和Sy(t)=CqNq(t),其系数{Cp}和{Cq}由Cp=∑xiLq(xi)及Cq=∑yiLq(yi)给出,这里Lp(x)和Lq(y)是Np(x)和Nq(y)的双正交基,满足等式(Nm(x)·Lp(x))=δmp及(Nn(y)·Lq(y)=δnq。
全文摘要
本发明为一种输入、压缩、存储和再生连续变化色调图象或彩色图象的设备,其输入步骤是:读入连续变化图象,把图象分成由相似色调象元组成的多个区域,计算每个区域的平均色调,用平均色调画每个区域从而产生平均色调图象,提取人为分割相邻区域的边界,寻找边界上的分支点和转折点,用双正交函数法近似终止于分支点或转折点的子边界的坐标,存储近似函数系数作为边界数据,从输入图象减去平均色调图象从而产生差图象,以及存储近似函数系数。
文档编号H04N1/393GK1182247SQ9711001
公开日1998年5月20日 申请日期1997年4月4日 优先权日1996年11月12日
发明者堀内隆彦, 春木亮二 申请人:株式会社筑波软件研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1