运动估计技术的制作方法

文档序号：7736769阅读：261来源：国知局

专利名称：运动估计技术的制作方法
运动估计技术
背景技术：
让许多设备具有视频和图像处理能力正变得越来越普遍。例如，很多便携和固定设备现在能够捕捉、显示、编码和/或压缩视频应用的图像。这些能力通常将大量负载施加在设备的资源上，诸如其处理和存储资源上。结果，诸如视频编码之类的操作可导致设备不能执行另外的任务和/或设备电池寿命的减少。因此，需要用于改进这种操作的效率的技术。附图简述在附图中，相似的附图标记一般指示相同、功能类似和/或结构类似的元件。其中元件第一次出现的附图由附图标记中最左面的数字指示。将参考附图描述本发明，附图中

图1是示例性装置的图；图2是示例性帧的图；图3是示出示例性操作的流程图；图4是示例性实现方式的图；图5是示出示例性操作的流程图；以及图6是可包括在图像编码模块内的示例性实现方式的图。
具体实施例方式实施例提供用于运动估计的技术。例如，实施例可确定当前图像中块的误差度量下界值，其中误差度量下界值中的每一个对应于参考图像中的搜索位置。基于分离阈值，可从搜索位置标识多个候选位置。然后从候选位置标识匹配位置。基于匹配位置，确定运动向量。通过利用这种技术，可有利地实现计算效率的提高。贯穿此说明书，对“一个实施例”或“一实施例”的引用意味着结合该实施例描述的特定特征、结构或特性被包含于至少一个实施例中。因此，在本说明书通篇中的多个位置中短语“在一个实施例中”或“在实施例中”的出现不一定全部指的是同一实施例。而且，特定特征、结构、或特性可按照任何合适的方式在一个或多个实施例中组合。图1是利用了本文公开的技术的示例性装置100的示图。该装置可包括各种元件。例如，图1示出装置100包括图像源102和图像编码模块104。这些元件可以硬件、软件或其任何组合实现。图像源102向图像编码模块104提供像素值。更具体地，图1示出可将这些像素值安排到信号流122中，该信号流122表示一个或多个图像。因此，信号流122可包括具有多个像素值的帧或字段的序列。每个帧/字段(也称为图像)可对应于特定的时间或时间间隔。在实施例中，信号流122是数字的。或者，信号流122可以是模拟的。在实施例中，图像源102可包括存储例如视频内容和/或图像的存储介质(例如，存储器)。或者，图像源104可包括向图像编码模块104提供信号流122的通信介质。这种通信介质可以是有线的或无线的。又或者，图像源102可包括用于捕捉图像并生成对应信号的元件的布置。例如，在实施例中，图像源102可包括光学组件和图像传感器。这种光学组件可包括一个或多个光学设备(例如，透镜、反射镜等)以将视场内的图像投影到图像传感器内的多个传感器元件上。此外，光学组件可包括控制其光学设备的布置的机构。例如，这种机构可控制聚焦操作、光圈设置、缩放操作、快门速度、有效焦距等。然而，各实施例不限于这些示例。这种图像传感器可包括传感器元件(例如，互补金属氧化物半导体(CM0Q传感器、电荷耦合器件(CCD)等)的阵列。这些元件可生成模拟强度信号(例如，电压)，其对应于入射到传感器上的光。此外，图像传感器还可包括将模拟强度信号转换成数字编码的强度值的模数转换器ADC。进而，图像传感器可在信号流122中传送这些值。图像编码模块104编码信号流122中传送的图像信号以产生经编码的信号124。这种编码可根据一种或多种技术。例如，图像编码模块104可利用各种压缩技术以利用信号流122所固有的冗余(例如，空间冗余和/或时间冗余)。这些技术可包括块匹配算法。块匹配算法(BMA)包括确定运动向量(在本文中也称为位移向量)。运动向量估计块从参考图像至当前图像的水平和垂直位移。这些运动向量的确定也被称为运动估计。因此，图1示出包括运动估计模块106的图像编码模块104。运动估计模块106确定图像或帧内的块的运动向量(例如，宏块)。进而，图像编码模块104可将这些运动向量包括在经编码的信号124中。在实施例中，图像编码模块104可遵循例如一个或多个运动图像专家组(MPEG)标准，诸如MPEG-2和/或MPEG-4。同样，图像编码模块104可遵循国际电信联盟(ITU)电信标准化部门(ITU-T)建立的一个或多个标准。这种标准的例子包括H. 26UH. 263和H. 264. 然而，各实施例不限于这些示例。如上所述，图像编码模块104从数据流122生成经编码的信号124。进而，装置100 可将经编码的信号122存储在存储介质中(例如存储器)。装置100还可解码并输出(例如显示)经编码的信号124。此外，装置100可将经编码的信号IM经由一个或多个网络 (未示出)发送到远程设备。在接收后，远程设备可存储、解码和/或输出(例如显示)对应的图像。装置100可被实现在各种设备中，诸如手持装置或嵌入式系统。这种设备的示例包括移动无线电话、IP语音(VoiP)电话、个人计算机(PC)、个人数字助理(PDA)和数码相机。此外，这种系统还可被实现在基于陆线的视频电话中，这种视频电话采用标准公共交换电话网络(PSTN)电话线、集成数字服务网络(ISDN)电话线和/或分组网络(例如，局域网 (LAN)、因特网等)。然而，各实施例不限于这些示例。各实施例的操作将参考以下附图和示例进一步描述。一些附图可包括逻辑流程。尽管此处呈现的这些附图可包括特定的逻辑流程，但可以认识到，该逻辑流程仅仅提供如何实现此处所述的一般功能的示例。此外，除非另外指出，不一定必须按照所呈现的顺序执行给定的逻辑流程。另外，给定的逻辑流程可由硬件元件、由处理器执行的软件元件或其任意组合来实现。实施例不限于该上下文。如上所述，实施例可从未经编码的像素数据生成经编码的图像信号。例如，图1的图像编码模块104可采用编码技术，该编码技术利用连续图像之间的时间冗余。因此，可参考前一参考图像来表示当前图像的各方面。例如，这些编码技术可确定与当前图像或帧中的块(例如，宏块)相关联的运动向量。更具体地，每个运动向量表示对应块在前一参考图像和当前图像之间作出的位移。绝对差之和(SAD)作为用于确定运动向量的基础(或度量)已经获得广泛的采用。这是由于其简单和直接的实现方式。可计算SAD，如以下方程式(1)所表达的。
权利要求
1.一种方法，包括确定当前图像中的块的多个误差度量下界值，其中所述误差度量下界值中的每一个对应于参考图像中的搜索位置；基于分离阈值，从多个搜索位置中选择多个候选位置；将候选位置之一标识为当前图像中的块的匹配位置；以及基于当前图像中的块和匹配位置，确定运动向量。
2.如权利要求1所述的方法，其特征在于，所述误差度量下界值中的每一个是经二次采样的绝对差之和(SSAD)值。
3.如权利要求1所述的方法，其特征在于，所述标识包括计算每个候选位置的误差度量；以及选择误差度量中的最小值。
4.如权利要求3所述的方法，其特征在于，所述多个候选位置包括零位移位置。
5.如权利要求3所述的方法，其特征在于，所述误差度量中的每一个是绝对差之和 (SAD)值。
6.如权利要求3所述的方法，其特征在于，还包括确定分离阈值。
7.如权利要求1所述的方法，其特征在于，还包括至少基于运动向量来编码当前图像。
8.一种装置，包括存储介质，用于存储当前图像和参考图像的像素数据；块选择模块，用于选择当前图像内的块；以及向量计算模块，用于确定所选的块的多个误差度量下界值，其中所述误差度量下界值中的每一个对应于参考图像中的搜索位置；基于分离阈值从多个搜索位置中选择多个候选位置；将候选位置之一标识为当前图像中的块的匹配位置；以及基于当前图像中的块和匹配位置来确定运动向量。
9.如权利要求8所述的装置，其特征在于，所述误差度量下界值中的每一个是经二次采样的绝对差之和(SSAD)值。
10.如权利要求8所述的装置，其特征在于，误差度量中的每一个是绝对差之和(SAD)值。
11.如权利要求8所述的装置，其特征在于，向量计算模块还确定所述分离阈值。
12.一种装置，包括存储介质，用于存储当前图像和参考图像的像素数据；编码器，用于对当前图像进行编码，其中所述编码器包括运动估计模块以生成图像内的块的运动向量；以及其中所述运动估计模块包括向量计算模块，用于确定所选的块的多个误差度量下界值，其中所述误差度量下界值中的每一个对应于参考图像中的搜索位置；基于分离阈值从多个搜索位置中选择多个候选位置；将候选位置之一标识为当前图像中的块的匹配位置；以及基于当前图像中的块和匹配位置来确定运动向量。
13.如权利要求12所述的装置，其特征在于，所述误差度量下界值中的每一个是经二次采样的绝对差之和(SSAD)值。
14.如权利要求12所述的装置，其特征在于，误差度量中的每一个是绝对差之和(SAD)值。
15.如权利要求12所述的装置，其特征在于，向量计算模块还确定所述分离阈值。
16.一种包括机器可访问介质的制品，所述机器可访问介质上存储了指令，当所述指令被机器执行时导致机器确定当前图像中的块的多个误差度量下界值，其中所述误差度量下界值中的每一个对应于参考图像中的搜索位置；基于分离阈值从多个搜索位置中选择多个候选位置；将候选位置之一标识为当前图像中的块的匹配位置；以及基于当前图像中的块和匹配位置来确定运动向量。
17.如权利要求16所述的制品，其特征在于，当所述指令被机器执行时导致机器确定所述分离阈值。
18.如权利要求16所述的制品，其特征在于，所述误差度量下界值中的每一个是经二次采样的绝对差之和(SSAD)值。
19.如权利要求16所述的制品，其特征在于，误差度量中的每一个是绝对差之和(SAD)值。
20.如权利要求16所述的制品，其特征在于，所述多个候选位置包括零位移位置。
全文摘要
公开了用于运动估计的技术。例如，实施例可确定当前图像中块的误差度量下界值，其中误差度量下界值中的每一个对应于参考图像中的搜索位置。基于分离阈值，可从搜索位置中标识多个候选位置。然后从候选位置标识匹配位置。基于匹配位置，确定运动向量。
文档编号H04N7/32GK102172030SQ200980139834
公开日2011年8月31日申请日期2009年12月22日优先权日2008年12月31日
发明者D·布金申请人:英特尔公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｄ·布金
技术所有人：英特尔公司
我是此专利的发明人

上一篇：数字广播接收装置及数字广播接收方法
上一篇：不同类型的通信的线程间指示的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。