用于对视频信号中的对象的轮廓进行编码的方法和装置的制作方法

文档序号：6410754阅读：206来源：国知局

专利名称：用于对视频信号中的对象的轮廓进行编码的方法和装置的制作方法
技术领域：
本发明涉及一种对表示于视频信号中的对象的轮廓进行编码的方法和装置；并且，更具体地，涉及一种能够对包含于视频信号中的对象的轮廓进行有效编码的方法和装置。
背景技术：
在诸如可视电话、电话会议和高清晰度电视系统的数字电视系统中，由于在视频信号中的视频信号中的视频信号包含一系列被称为象素值的的数字数据，就需要大量的数字数据来定义每一视频帧信号。然而，由于传统传输信道的可用频带宽度有限，为了经其传送大量数字数据，就不可避免地要通过使用各种数据压缩技术来压缩或减少数据量，尤其是在象可视电话和电话会议系统一样低比特率视频信号编码的情形下。
面向对象的分解-合成编码技术是一种用于为低比特率编码系统对视频信号进行编码的技术。其中输入视频图象被分成多个对象并且用于定义每一对象的运动、轮廓和象素数据的三组数据通过不同的编码信道被处理。
此面向对象的编码方案中的一例就是所谓的MPEG(运动图象专家组)阶段4(MPEG-4)，设计它是用于提供一个在诸如低比特率通信、交互式多媒体(如游戏机、交互式电视等)和监视的应用中允许基于内容的对话、改进的编码效率和/或通用可达性的音-像编码标准。(例如，参见MPEG-4 Video Verification Model Version 2.0，国际标准化组织，ISO/IECJTC1/SC29/WG11 N1260，1996年3月)根据MPEG-4，一个输入的视频图象被分成许多视频对象平面(VOP’S)，该视频对象平面对应于在一个用户能够访问和操作(剪切、粘贴等)的位流中的实体，该视频对象平面可被称作一个对象。每个VOP的宽和高可以是包围每个对象的16个象素(一个宏块大小)的最小倍数量，以便编码器对该输入视频图象的处理是在一个VOP接一个VOP的基础上，即在一个对象接一个对象的基础上进行的。该VOP包括由Y、U、V分量组成的彩色信息及由例如一个二进制掩码所表示的形状信息。
在对一个对象的轮廓图象进行处理的过程中，轮廓信息对于分解和合成一个对象形状是至关重要的。表示轮廓信息的传统编码技术是一项链式编码技术。虽然该轮廓信息可以被其没有任何丢失地忠实地编码，但它要求大量的数据表示它。
多边逼近技术是一种被引入的减少表示一个对象的轮廓的数据量的技术，其中首先选择两个起始顶点。若轮廓是一个开环，则两端点被选作起始顶点。另一方面，若轮廓是一个闭环形状，则该轮廓上的两个最远的点被选作起始顶点。然后确定轮廓上离连接这两个起始顶点的直线段最远的点。如果该最远点距该直线段的距离大于一个预定限值，则此最远点成为一个顶点。对每一直线段重复此过程，直到最远点和所述每一直线段的小于或等于该预定限值为止，其中每一直线段连接两个相邻顶点。上述处理的结果是，确定了许多顶点并且通过用多条直线段适配该轮廓来逼近一个对象的轮廓。于是，为其发送而对表示轮廓上顶点位置的顶点信息进行了编码。
即使可能通过用连接的直线段代表该轮廓的方法可以大量减少待发送的数据量，此法仍会导致逼近该轮廓时计算复杂性的增加，因而为了在低比特速率编码解码系统中成功地实现该技术，仍期望进一步减少数据量。
因此，本发明的主要目的是提供一种轮廓编码方法和设备，该方法和设备能够表示一个轮廓的图象，同时减少了计算复杂性并且实现了大量减少所发送的数据量。
根据本发明，提供了一种用于对表示于视频信号中的对象的轮廓进行编码的方法，该方法包含以下步骤(a)通过平均该轮廓的象素位置而检测该对象的轮廓的形心；(b)根据形心确定该轮廓上的一组主顶点，通过用一条直线连接每一对相邻的主顶点而逼近该轮廓；(c)在该组主顶点的基础上在该轮廓上获取一组次顶点；及(d)对该组主顶点、该组次顶点及该形心进行编码以由此提供一个数字编码轮廓信号。
附图的主要说明从下面将给出的与附图相联系的优选实施例的描述中可显而易见本发明的以上和其它目的以及特征。

图1示出了用于对轮廓图象编码的本发明的装置的方框图；图2表示图1中所示的主顶点检测块的详细方框图；图3说明了一个其中有一个形心并被分成8条分段直线的示例性轮廓；及图4A至4C描述检测次顶点的过程。
优选实施例的详细说明参考图1，示出了本发明装置的方框图，该装置用于对表示于一个视频信号中的一个对象的轮廓图象进行编码。
表示一个对象的轮廓的轮廓图象数据被输入一个形心计算块100、并联的一个主顶点检测块110及一个次顶点检测块120。
形心计算块100通过平均该轮廓上的所有象素位置的坐标而找到该对象的轮廓的形心，并且将形心位置数据提供经主顶点检测块110和一个信道编码器150。
根据本发明，主顶点检测块110根据该轮廓图象数据及该形心位置数据来确定轮廓的主顶点。
参考图2，描述了一个主顶点检测块110的详细方框图，该主顶点检测块110包括一个大小检测部分111和一个主顶点确定部分113。大小检测部分111通过例如对轮廓象素，即位于该轮廓上的象素的计数而检测该轮廓的大小，并将分割该轮廓的径向线的数目提供给主顶点确定部分113，在该主顶点部分113根据该轮廓的大小来确定径向线的数目是以如此方法进行的径向线数随轮象素数的增加而增加。
参考图3，说明了根据本发明的优选实施例的一个执行于主顶点检测部分113的主顶点检测过程，在该主顶点检测过程中标记数据50代表了一个闭环形式的轮廓。如图3所示，响应于径向线数目M及形心位置数据，主顶点确定部分113顺时针方向画出了出自形心C的M条径向线，例如M1至M8，始于参考径向线M1，其中每时紧邻的径向线间的夹角为(2π/M)弧度，M是一个大于1的整数，参考径向线的画法是从形心C竖直向上画。随后，主顶点确定部分113检测在轮廓50上的主顶点并确定形心C和每一个主顶点间的距离，其中主顶点被定义为该轮廓和一条径向线的一个交点，即在径向线上的轮廓象素的位置，对主顶点的标号是例如顺时针的，始于参考径向线M1上的第一主顶点A1。如果径向线(例如M3)与该轮廓的交点超过一个(例如A3、A3’和A3”)，则与形心的距离最接近于其紧挨的前面一个主顶点(例如A2)和形心C间的距离的点(例如A3)被选作相应的主顶点。如果参考径线与该轮廓的交点超过一个，则可以选与形心的距离最小的点作为第一主顶点。通过在每一对紧邻的主顶点间画一条直线获得了逼近该轮廓50的线段LS1至LS8，由此得到一个封闭多边形。
于是，代表了检测出的主顶点(例如A1至A8)的位置和标号的主顶点信息通过线L10从主顶点确定部分113提供给图1中所示的次顶点确定块120。代表了形心C和主顶点A1至A8间的各距离D1至D8的距离信息，也由此经线L20被提供给主编码器130，对距离标号的方式与对主顶点标号的方式相同。
返回参见图1，在主编码器130，根据第一主顶点A1的距离D1，通过使用传统DPCM(差值脉冲编码调制)技术而对该距离信息编码。此方法是设D1为初始预测值，计算预测值和D2间的差值，通过将D2作为新的预测值使用而获得D3的差值。此过程一直继续到算出了最后一个主顶点的差值为止。然后将包括该初始预测值的已编码主顶点信息，即DPCM数据，传送至信道编码器150。
同时，响应于被应用至此的轮廓图象数据及来自主顶点检测块110的主顶点信息，次顶点检测块120通过使用传统多边形逼近技术而确定次顶点。次顶点检测块120逐一计算从两相邻主顶点间的轮廓线上的每个轮廓象素至其间多边形上的线段的距离；其上具有至该线段最大距离的一个轮廓象素被选出来，而且若其距离大于一个预定的限值DM，则定义其为一个相应的次顶点。这就是说，如可在图4A中看到的，如果在线段(如A2A3或A3A4)和最远轮廓象素(如P1或P2)间的距离(如d1或d2)大于预定的限值DM，则点P1或P2成为一个次顶点。一旦通过上述过程为轮廓确定了所有的次顶点，通过用一条直线连接每一对紧邻的顶点就能获得逼近该轮廓的一个封闭多边形的线段，上述顶点包括主顶点和次顶点。如4B所示，对于被封闭多边形逼近的轮廓来说，用与上述同样的方法重复选取在新形成的轮廓段上具有至该线段例如P2A3最大距离的轮廓象素(例如P3)作为一个相应的次顶点，直到该最大距离等于或小于预定的限值DM，由此，如图4C所示，检测次顶点P1、P2和P3。
在本发明的另一个实施例中，次顶点检测块120在两相邻主顶点间的每一个轮廓段上的每一个轮廓象素处计算该轮廓的曲率，在一个轮廓象素处的轮廓的曲率表示经过该轮廓象素的两条直线间的角度变化，其中的两条直线是从该轮廓象素至轮廓的另外两个象素画出的，另外两个象素位于沿该轮廓的两个不同方向距该象素有预定数目个象素之处。一旦为轮廓段确定了在轮廓象素处的曲率，次顶点检测块120选取轮廓段上所有具有大于预定限值CM的曲率的轮廓象素；并将按其曲率值从大到小选出的最多达预设数P个的轮廓象素确定为次顶点，P为正整数。如果所选的轮廓象素的数目小于或等于预设数，则将所有选出的轮廓象素都确定为次顶点。如果所选的轮廓象素数目大于预设数，则按其曲率值从大到小选出预设数目个轮廓象素并确定为次顶点。这就是说，所有在轮廓段内选出的次顶点的曲率都大于限值CM并且不小于未选中的轮廓象素的曲率，而且轮廓段的次顶点的数目不大于预设数P。在一份共有未决的申请中，描述了一种用于计算轮廓曲率的技术，该专利为中国专利申请号No.95116451.1，申请于1995年9月7日，名称为“用于表示一个对象的轮廓的改进的轮廓逼近方法”(“IMPROVED CONTOURAPPROXIMATION METHOD FOR REPRENTING A CONTOUR OF AN OBJECT”)表示检测到的次顶点的位置的次顶点信息及主顶点信息被从次顶点检测块120提供至次编码器140。根据本发明的优选实施例，次编码器140为每一个次顶点找到一个最近的主顶点，并计算次顶点与其的位移；而且通过使用如JPEG(连接图象专家组)和算法码来给每一个次顶点的标号和位移编码，由此给信道编码器150提供已编码的次顶点信息。
信道编码器150从形心位置数据、已编码主和次顶点信息中以适于其发送的形式产生一个数字编码轮廓信号，其中数字编码轮廓信号包括用于由主顶点和次顶点形成多边形逼近轮廓图象的顺序信息。
虽对本发明的描述参考了具体实施例，在不背离如下权利要求所定义的本发明的精神和范围的前提下，可以做出各种变化和修改，这一点对本领域中的技术人员是显而易见的。
权利要求
1.一种用于对表示于视频信号中的一个对象的轮廓进行编码的方法，包括如下步骤(a)通过对轮廓上的象素位置求平均值而检测该对象的轮廓的形心；(b)根据该形心确定轮廓上的一组主顶点，通过用一条直线连接每一对紧邻的主顶点而逼近该轮廓；及(c)对该组主顶点和形心进行编码以由此提供一个数字编码轮廓信号。
2.根据权利要求1的方法，在步骤(c)以下还包括如下步骤(d)根据该组主顶点确定轮廓上的一组次顶点；及(e)对该组次顶点进行编码。
3.根据权利要求1的方法，其中所述步骤(b)包括以下步骤(b11)从该形心画M径向直线，包括一条以预定方式形成的参考径向线，其中每对紧邻的径向线间的夹角是(2π/M)弧度，M是一个大于1的整数；(b12)确定该组主顶点，每一主顶点表示一个该轮廓和一条径向线的交点；及(b13)从参考径向线的主顶点开始给该组主顶点标号。
4.根据权利要求3的方法，在步骤(a)以下它还包括检测该轮廓的大小的步骤。
5.根据权利要求4的方法，其中所述的数字M是根据该轮廓的大小确定的。
6.根据权利要求3的方法，其中所述步骤(b12)还包括这个步骤当一条径向线与该轮廓的交点超过一个时，选择其离形心的距离与其最近的上一个主顶点和形心间的距离最接近的一个点作为主顶点。
7.根据权利要求6的方法，其中所述步骤(c)包括以下步骤；(c11)在每一个主顶点处计算一个误差，该误差表示该形心和所述每个主顶点间的距离；及(c12)根据主顶点的误差获取差分误差。
8.根据权利要求2的方法，其中所述步骤(b)包括以下步骤(b21)从形心画M条径向线，包括一条以预定方式形成的参考径向线，在M条径向线中每对紧邻的径向线间的夹角是(2π/M)弧度，M是一个大于1的整数；(b22)确定某组主顶点，每一个主顶点表示该轮廓和一条径向线的一个交点；及(b23)从参考径向线的主顶点开始对该组主顶点标号。
9.根据权利要求8的方法，在步骤(a)以后，它还包括检测该轮廓的大小的步骤。
10.根据权利要求9的方法，其中所述数字M是根据该轮廓的大小确定的。
11.根据权利要求8的方法，其中所述步骤(b22)还包括步骤当一条径向线与该轮廓的交点多于一个时，选择其至该形心的距离与其最近的上一个主顶点和该形心之间的距离最接近的一点作为主顶点。
12.根据权利要求11的方法，其中所述步骤(c)包括以下步骤(c21)在每一个主顶点处计算误差，该误差表示该形心和所述每个主顶点间的距离；及(c22)根据该主顶点的误差获取差分误差。
13.根据权利要求12的方法，其中所述步骤(d)通过利用多边逼近技术确定了某组次顶点。
14.如权利要求13的方法，其中所述步骤(e)包括以下步骤(e11)找到距每一个次顶点最近的主顶点和二者之间的位移；及(e12)为离每一个次顶点最近的主顶点的标号和该位移编码。
15.根据权利要求12的方法，其中所述步骤(d)包括以下步骤(d21)在两个相邻主顶点间的轮廓段上计算该轮廓的曲率；及(d22)按其曲率值从大到小的次序将该轮廓段上预设数目个象素确定为次顶点，其每一个曲率值大于一个预定的限值。
16.根据权利要求15的方法，其中所述步骤(e)包括以下步骤(e21)找到距每一个次顶点最近的一个主顶点和二者之间的位移；及(e22)为距每一个次顶点最近的主顶点的标号和该位移编码。
17.根据权利要求16的方法，其中在该轮廓段上的一个象素处的该轮廓的曲率表示两条经过该象素的直线间的夹角变化，两条线中的每一条都是经该象素和轮廓上的另一个象素画出的，另一个象素位于沿该轮廓段的每个方向距该象素有预定数目个象素之处。
18.一种用于对表示于视频信号中的一个对象的轮廓进行编码的设备，它包含设备，用于通过对轮廓上的象素位置进行平均而检测该对象的轮廓的形心；设备，用于根据该形心确定轮廓上的一组主顶点，通过用一条直线连接每对紧邻的主顶点来逼近该轮廓；及设备，用于对该组主顶点和该形心进行编码以由此提供一个数字编码轮廓信号。
19.根据权利要求18的设备，该设备还包括设备，用于根据该组主顶点确定轮廓上的一组次顶点；及设备，用于对该组次顶点进行编码。
20.根据权利要求18的设备，其中所述主顶点确定装置包括设备，用于从形心画M条径向线，包括一条以预定方法形成的参考径向线，其中每对紧邻径向线间的夹角是(2π/M)弧度，M是一个大于1的整数；设备，用于确定某组主顶点，每一主顶点表示该轮廓和一条径向线的交点；及设备，用于从参考径向线的主顶点开始对该组主顶点进行标号。
21.根据权利要求20的设备，该设备还包含用于检测该轮廓的大小的装置。
22.根据权利要求21的设备，其中所述数字M是根据该轮廓的大小确定的。
23.根据权利要求20的设备，其中所述主顶点检测装置还包括当一条径向线与该轮廓的交点多于一个时，用于将至形心的距离最接近于其最近的上一个主顶点与该形心间的距离的点选作主顶点的装置。
24.根据权利要求23的设备，其中所述主顶点编码装置包括装置，用于在每一个主顶点处计算一个误差，该误差表示该形心和所述每个主顶点间的距离；及装置，用于根据主顶点的误差获取差分误差。
25.根据权利要求19的设备，其中所述主顶点确定装置包括装置，用于从形心画出M条径向线，包括一条以预定方法形成的参考径向线，其中每对紧邻径向线间的夹角是(2π/M)弧度，M是一个大于1的整数；装置，用于确定某组主顶点，每一主顶点表示该轮廓和一条径向线的交点；及装置，用于从该参考径向线的主顶点开始对该组主顶点进行标号。
26.根据权利要求25的设备，该设备还包括用于检测该轮廓的大小的装置。
27.根据权利要求26的设备，其中所述数字M是根据该轮廓的大小确定的。
28.根据权利要求25的设备，其中所述的主顶点确定装置还包括当一条径向线与该轮廓的交点多于一个时，用于将距该形心的距离最接近于其最邻近的前一个主顶点与该形心间的距离的点选作主顶点的装置。
29.根据权利要求28的设备，其中所述的主顶点编码装置包括装置，用于在每一个主顶点处计算一个误差，该误差表示该形心和所述每一个主顶点间的距离；及装置，用于根据主顶点的误差获得差分误差。
30.根据权利要求29的设备，其中所述的次顶点确定装置通过利用多边形逼近技术来确定某组次顶点。
31.根据权利要求30的设备，其中所述的次顶点编码装置包括装置，用于找到距每一个次顶点最近的主顶点和二者之间的位移；及装置，用于给离每一个次顶点最近的主顶点的标号和该位移编码。
32.根据权利要求29的设备，其中所述次顶点确定装置包括装置，用于在两个相邻主顶点间的轮廓段上计算该轮廓的曲率；及装置，用于按其曲率值由大到小的顺序将该轮廓段上预设数目个象素确定为次顶点，其每一个曲率的值都大于一个预定的限值。
33.根据权利要求32的设备，其中所述次顶点编码装置包括装置，用于找到离每一个次顶点最近的一个主顶点和二者之间的位移；及装置，用于给离每一个次顶点最近的主顶点的标号和该位移编码。
34.根据权利要求33的设备，其中在该轮廓上一个象素处的该轮廓的曲率表示经过该象素的两条直线间的夹角变化，两条直线中的每一条是经过该象素及另一个象素画出的，另一个象素位于沿该轮廓段的每一方向距该象素有预定数目个象素之处。
全文摘要
一种给表示于视频信号中的一个对象的轮廓图象编码的方法。首先通过将该轮廓上的象素位置进行平均来检测该对象的轮廓的形心。根据该形心确定该轮廓上的一组主顶点。然后,根据该组主顶点确定轮廓上的一组次顶点。给该组主顶点,该组次顶点及该形心编码以提供一个数字编码轮廓信号。
文档编号G06T9/20GK1170316SQ9611997
公开日1998年1月14日申请日期1996年9月5日优先权日1996年7月9日
发明者金镇宪申请人:大宇电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金镇宪
技术所有人：大宇电子株式会社
我是此专利的发明人

上一篇：计算机系统的画面展开装置的制作方法
上一篇：汉字词字字形输入方法(正阳码)及双阳码的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。