改进的用于表示目标轮廓的轮廓近似方法

文档序号：6409278研发日期：1995年阅读：260来源：国知局

技术简介：
本专利针对传统轮廓近似方法在精度与计算复杂度间的矛盾，提出结合多边形近似、离散正弦变换(DST)及曲率分析的改进方案。通过动态增加高曲率区域的顶点，分段处理轮廓线，利用DST系数量化误差并反馈调整，实现精度与编码效率的平衡。方法在保证重建轮廓精度的同时，通过阈值判断优化顶点分布，降低传输数据量。
关键词：轮廓近似,曲率分析

专利名称：改进的用于表示目标轮廓的轮廓近似方法
技术领域：
本发明涉及一种用于视频信号编码器中的轮廓近似方法，更具体地，涉及一种改进的用于精确重建目标轮廓的轮廓近似方法。
在数字视频系统、如电视电话、电视会议及高清晰度电视系统中，为了确定每个视频帧信号需要大量数字数据，因为在视频帧信号中的视频行信号内包括一系列的被称为象素值的数字数据。但是，由于在传统的传输信道中可获得的频带宽度是有限的，为了通过这种传输信道传输大量的数字数据，不可避免地要通过使用各种数据压缩技术来压缩或减少数据量，尤其是在如电视电话及电视会议系统这样的低比特率视频信号编码器的情况下。
这些用于低比特率编码系统对视频信号进行编码的方法中的一种是所谓的面向目标的分析综合编码技术(见Michael Hotter写的“基于运动两维目标的面向目标的分析综合编码“Signal ProcessingImage Comunication，第二卷4期第409至428页(1990年12月))。
根据该面向目标的分析综合编码技术，输入视频图象视分成目标及用于确定其运动的三组参数，每个目标的轮廓及象素数据通过不同的编码信道被处理。
尤其是，在处理目标轮廓图象时，轮廓信息对于物体形状的分析及综合是很重要的。用于表示轮廓信息的传统编码方法是一种链式编码技术。但是，链式编码方法需要大量的比特，尽管在轮廓信息中未损失掉比特。
在这方面，对轮廓近似的多种方法已被建议出来，例如多边形近似及B-样条函数近似法。在多边形近似法中其缺点之一是轮廓图象表示粗糙。B-样条函数近似法正相反，能更精确地表示轮廓图象，但它需要高阶多项式来减小近似误差，由此增加了视频编码器的整体计算复杂性。
为了改善整体计算复杂性问题而导入的一种技术是采用多边形近似及离散正弦变换(DST)的轮廓近似法。该技术被描述在与此同一持有人的待审查美国专利申请，系列号NO.08/423604中，其名称为“用于表示目标轮廓的轮廓近似装置”，申请日为1995年4月17日。但是，在处理复杂的轮廓图象时，上述采用多边形近似及DST的技术可能得出与原始轮廓图象很不相同的重建图象。
因此，本发明的主要目的是提供一种在视频信号编码器中使用的改进的轮廓近似方法，它能够降低在编码的轮廓信息中的近似误差。
根据本发明，提供了一种用于视频信号编码器中的用于表示目标轮廓图象的轮廓近似方法，其包括(a)确定轮廓图象上的一些顶点；(b)利用多个直线段来适配该轮廓图象，以提供轮廓图象的多边形近似，每个直线段连接两个相邻的顶点；(c)提供一直线段两顶点的位置作为线段数据；(d)对于一直线段确定一些抽样点并提供代表该抽样点位置的抽样点信息，所述抽样点将每条直线分成等长的小线段；(e)计算在直线段的每个抽样点及顶点上的第一次误差，该第一次误差表示连接两顶点的直线段及这两顶点间轮廓线之间的距离；(f)将抽样点及顶点上的第一次误差变换成一组离散正弦变换系数；(g)将每组离散正弦变换系数转换成一组量化的变换系数；(h)将该组量化的变换系数转换成一组重建的第一次误差；(i)基于每个直线段的线段数据、抽样点信息及该组第一次误差提供一重建的轮廓线；(j)计算第二次误差，它是重建的轮廓线及其相应的轮廓线之间的失配象素数目；(k)将第二次误差与一预定阈值相比较；(l)如果第二次误差小于所述阈值，则对轮廓线的该组量化的变换系数及线段数据进行编码；或如果第二次误差等于或大于所述阈值，则通过在该轮廓线上增加一个附加顶点使该轮廓线再分成一对新的分段轮廓线，并对相对于每个新分段的轮廓线的直线段重复步骤(c)至(l)；及(m)对在步骤(a)中确定的顶点形成的所有直线段重复步骤(c)至(l)。
从以下结合附图对优选实施例的描述中，本发明的上述及其它目的和特征将变得更加明显，附图为

图1表示本发明的用于表示轮廓图象的轮廓近似装置的方框图；图2A至2C表示一个示例的轮廓图象的多边形近似处理过程；图3A及3B为示例图，其中每个图表示出连接两个顶点的直线段及其相应轮廓图象之间的误差；图4A至4C例举表示根据本发明的附加顶点增设操作；及图5表示根据本发明的曲率计算图。
参见图1，它表示本发明的用于表示以视频信号表达的目标轮廓图象的轮廓近似装置。
代表目标轮廓的轮廓图象数据被传送到一个多边形近似单元100，第一及第二次误差检测单元120及150以及曲率计算单元160。在多边形近似单元100上，利用多边形近似技术对轮廓图象进行近似。该轮廓图象的多边形近似是通过利用线段适配轮廓图象的传统近似算法来获得的。
参见图2A至2C，它表示根据多边形近似技术对一例举的轮廓图象10的分段处理过程。
首先，选择两个起始顶点。如果轮廓图象是开环形的，则选择两个端点，例如图2A中所示的A及B作为起始顶点。另一方面，如果轮廓图象是闭环形式的，则选择轮廓上两个最远的点作为起始顶点。然后，确定出轮廓上的距线段AB的最远点，如果线段AB及该最远点、例如C点之间的距离Dmax大于一预定阈值时，该点C就成为一个顶点。这个过程重复进行，如图2C中所示，直到对于每个线段的Dmax小于预定阈值TH1时为止。
对于一个给定轮廓，其顶点的数目取决于预定阈值TH1。如从图2C中可看到的，利用较小的阈值，由线段来表示轮廓图象可变得更精确，其代价是降低了编码效率。
再参照图1，代表轮廓图象10的确定出的顶点如A、B、C、D及E的位置的顶点信息，如图2C所示，由多边形近似单元100提供给缓冲器110。
缓冲器110接收来自多边形近似单元100的顶点信息并作为顶点数据存储该信息。在多边形近似单元100上确定出的所有顶点的顶点信息均存储在缓冲器110中后，就开始了本发明处理的轮廓近似，例如利用一个过程控制器(未示出)从例如图2C中所示的线段AD开始。这就是，响应于来自过程控制器的起始信号，该缓冲器110将代表该线段例如AD的两个顶点位置的线段数据提供给抽样电路115。
抽样电路115为每个直线段确定预定数量，例如为4个的抽样点，其中这些抽样点将线段分成等长度的分线段，并将代表确定的抽样点位置的抽样点信息及线段数据通过导线L11提供给第一次误差检测单元120及轮廓重建单元145。
基于来自于抽样电路115的线段数据及抽样点信息及导线L10上的轮廓图象数据，第一次误差检测单元120计算每个抽样点及线段顶点上的第一次误差。第一次误差代表连接顶点的直线段及两顶点间的轮廓线之间的距离。
图3A及3B示出了代表直线段及相应轮廓线之间的第一次误差的示例图，其中图3A描绘出直线段AD及其相应的轮廓线之间的第一次误差，及图3B表示出直线段DC及其相应轮廓线之间的第一次误差。每个误差d1至d4或d1’至d4’代表直线段AD上的每个抽样点S1至S4或直线段DC上的每个抽样点S1’至S4’与相应轮廓线之间的距离。如从图3A及3B中可看到的，对于顶点的近似误差均为“零”。因为所有的顶点都位于轮廓上。
由第一次误差检测单元120计算的第一次误差被提供给离散正弦变换(DST)单元125。该DST单元125对线段的一组第一次误差执行一维DST操作，以产生一组DST系数。该组DST系数提供给量化(Q)单元130。量化单元130使该组DST系数量化，以通过导线L12将对应于直线段的一组量化DST系数提供给逆向量化(IQ)单元135及方式选择单元155，用于进一步的处理。
在逆向量化单元135，该组量化的DST系数被变换回一组重建的DST系数。然后在逆向DST单元140上，该组重建的DST系数被逆变换成一组重建的第一次误差。此后，将这组重建的第一次误差提供给轮廓重建单元145。
基于来自于IDST单元140的该组重建的第一次误差及来自抽些电路115的线段数据和抽样点信息，轮廓重建单元145产生出一条重建的轮廓线，并将该重建的轮廓线数据提供给第二次误差检测单元150。
第二次误差检测单元150计算第二次误差，它是位于来自轮廓重建单元145的重建的轮廓线与自导线L10上的轮廓图象数据提供的与其对应的原始轮廓线之间的失配象素的数目，并提供在导线L13上的第二次误差及提供在导线14上的线段数据、即重建的轮廓线两顶点的位置数据。参照图4A，它表示对于线段AD的原始轮廓线100及示例的重建轮廓线200。在此情况下，第二次误差相当于在被轮廓线100及200所包围的区域300中所包含的象素数目。
在方式选择单元155，将第二次误差与预设阈值TH2相比较。如果第二次误差小于预设阈值TH2，则该方式选择单元155将来自量化单元130的量化的DST系数及来自于第二次误差检测单元150的相应轮廓线的线段数据分别通过导线L16及L17提供给轮廓编码器165；并提供第一许可信号给缓冲器110。在此情况下，由缓冲器110将用于待处理的下一线段的一对顶点例如D及C的线段数据提供给抽样电路115；并重复上述处理过程直到轮廓图象的所有线段均被处理为止，一要是线段的第二次误差小于预设阈值TH2的话。
另一方面，如果对于重建的轮廓线的第二次误差等于或大于阈值TH2，则根据本发明通过在原始轮廓线上再增加一个附加顶点使相应于每个重建的轮廓线的原始轮廓线进一步被分段。这就是，如果对于重建的轮廓线的第二次误差等于或大于阈值TH2时，方式选择单元155就将用于线段顶点的线段数据及第二许可信号分别提供给曲率计算单元160及缓冲器110。在曲率计算单元160，对应来自方式选择单元155的线段数据，计算原始轮廓线上每个被选择的象素的曲率。
参见图5，它表示根据本发明的在曲率计算单元160上进行的曲率计算过程听的明用图。首先，如图5所示，轮廓线上每第N个、例如第六个象素被选择作为目标象素，例如T1、T2或T3。然后通过每对相邻的两个目标象素、如T1及T2划一条直线。通过某一目标象素的两条直线形成的角度变化被规定为这个目标象素的曲率。然后，曲率计算单元160将代表每个目标象素位置及曲率的目标象素信息提供给附加顶点选择单元170。
附加顶点选择单元170将来自曲率计算单元160的目标象素的各曲率作出比较，并从它们中选择出具有最大曲率的一个目标象素、例如图4A中所示的F，作为附加顶点，并将代表该附加顶点位置的附加顶点信息提供给缓冲器110。该附加顶点信息被作为顶点数据存储在缓冲器110中。因此，通过在两个顶点、例如A及D之间增加例如一个附加顶点F，可将具有大的失配的一个复杂轮廓线，例如图4A中所示的轮廓线100分成两个不太复杂的轮廓线，如图4B及图4所示，它们可以通过DST被更精确地近似。
然后，响应于第二许可信号，缓冲器110将用于顶点A及F的线段数据提供给抽样电路115；并对线段AF重复进行上述的轮廓近似处理。
与此同时，在轮廓编码器165，通过使用例如JPEG(Joint Photographic Experts Group)的二进制算术码对导线L16上的每组量化的DST系数进行编码，而对导线L17上的线段数据通过使用例如固定长度码无压缩地进行编码，因为这些顶点很少相关。包括被编码量化的DST系数及线段数据的编码数字信号被传输到一个发送器，用于将其发送出去。
虽然本发明是相对特定的实施例作出描述的，但显然对于熟悉本领域的技术人员而言，在不偏离以下权利要求书中所限定的本发明精神和范围的情况下，可以作出各种变化及改型。
权利要求
1.一种用于视频信号编码器中的用于表示目标轮廓图象的轮廓近似方法，包括(a)确定轮廓图象上的一些顶点；(b)用多个直线段来适配该轮廓图象，以提供轮廓图象的多边形近似，每个直线段连接两个相邻的顶点；(c)提供一直线段两顶点的位置作为线段数据；(d)对于一直线段确定一些抽样点并提供代表抽样点位置的抽样点信息，所述抽样点将每条直线分成等长的小线段；(e)计算在直线段的每个抽样点及顶点上的第一次误差，该第一次误差表示连接两顶点的直线段与这两顶点间轮廓线之间的距离；(f)将抽样点及顶点上的第一次误差变换成一组离散正弦变换系数；(g)将每组离散正弦变换系数转换成一组量化的变换系数；(h)将该组量化的变换系数转换成一组重建的第一次误差；(i)基于每个直线段的线段数据、抽样点信息及该组第一次误差提供一重建的轮廓线；(j)计算第二次误差，它是重建的轮廓线及其相应的原始轮廓线之间的失配象素数目；(k)将第二次误差与一预定阈值相比较；(l)如果第二次误差小于所述阈值，则对轮廓线的该组量化的变换系数及线段数据编码；或如果第二次误差等于大于所述阈值，则通过在该轮廓线上增加一个附加顶点使该轮廓线再分成一对新的分段轮廓线，并对相应于每个新分段轮廓线的直线段重复步骤(c)至(l)；及(m)对在步骤(a)中确定的顶点形成的所有直线段重复步骤(c)至(l)。
全文摘要
一种轮廓近似方法，基于轮廓图像上像素的曲率，通过在复杂的轮廓线上增加附加的顶点来精确地重建目标轮廓。将具有最大曲率的目标像素选择为附加顶点。
文档编号G06T9/20GK1131875SQ9511645
公开日1996年9月25日申请日期1995年9月7日优先权日1995年3月20日
发明者金镇宪申请人:大宇电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金镇宪
技术所有人：大宇电子株式会社
我是此专利的发明人

上一篇：数形自通码汉字键位输入技术的制作方法
下一篇：住址识别方法、住址识别装置及纸件类自动处理系统的制作方法

该领域下的技术专家

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！