用于视觉搜索的直方图映射的基于上下文的编码的方法_2

文档序号：9278230阅读：来源：国知局

的上下文可以假定56个值，S卩，0到55的值。此外，RM模型采用直方图映射元素的循环扫描，扫描从矩阵的中心开始并且转至矩阵的侧面。因此，其中55个元素的矩形尚未编码的中心区域已经无需上下文而仅采用单模型算术上下文进行了编码。还需要以总共57个元素向此概率值发信号，所述元素将作为信号发送以在特定块大小和比特率下对直方图映射进行最佳编码。块大小和比特率的组合在下文中被称为测试点。考虑到每个上下文值是使用4个字节储存的，并且对于每个测试点而言，S卩，在特定块大小的比特率，分配了 57(上下文尺寸）X4(每上下文值的字节）X2(0和1概率）字节，这导致需要大量潜在的存储器。
[0016] 就训练的需要而言，在RM所采用方法中，每个测试点，即，特定块大小下的比特率，需要经过训练。除非对于每个测试点而言完整的上下文是储存在特定的表上的，因此导致较大的表，否则编码器和对应的解码器需要在相同训练数据集上训练以提供完全相同的结果，由此对于保证不同制造商或服务提供商的编码器和解码器之间的互操作性而言呈现了一个问题。

【发明内容】

[0017] 本发明的目标是提供用于压缩从图像中提取的本地特征的位置信息的改进的技术。
[0018] 此目标通过独立权利要求的特征实现。进一步的实施形式通过从属权利要求、说明书以及图式是显而易见的。
[0019] 本发明是基于通过以二重近似对图像的标准的基于总和的上下文进行近似可以解决上述缺点的发现的。根据第一近似，针对每个测试点仅储存了三个值（例如，出自57个值）。此外，通过固定块大小，仅储存了一个比特率的值，而其它的是通过第二近似衍生的。
[0020] 为了详细描述本发明，将使用以下术语、缩写和符号：
[0021] VS:视觉搜索。VS被称作自动系统识别在图像或在图像的序列中所描绘的对象的能力，方法是仅分析图像或图像的序列的视觉方面，而无需采用任何外部数据，例如，文本描述、元数据等。
[0022] AR:增强现实。AR可以被认为是视觉搜索的高级应用，具体而言应用于移动域。当在一系列帧中所描绘的对象已经被识别之后，额外内容（一般是合成对象）叠加到真实场景，因此"增强"真实内容。
[0023] SIFT:尺度不变特征转换。
[0024] SURF:加速强健特征。
[0025] MPEG-7 :运动图片专家组第7号根据ISO/IEC15938定义了多媒体内容描述接口 (部分13)，其专用于用于视觉搜索的标准的发展。
[0026] ⑶VS:用于视觉搜索的紧凑描述符。
[0027] 比特率：由CDVS标准化定义的每图像的预定字节的规定的操作点。
[0028] RM:参考模型。
[0029] VGA:视频图像阵列（分辨率640x480)，也称为完整分辨率。
[0030] 本地特征：本地特征是围绕图像中的关键点的补丁的紧凑描述，其对于旋转、照射和透视变形是不变的。
[0031] 描述符：本地特征。
[0032] 关键点：在图像中，在其上计算描述符的点一般涉及场景的独特的元素，例如，转角、特定模式等。这些点一般称为关键点、关注点或兴趣点。
[0033] 上下文：用于在算术编码阶段中使用的不同符号的概率值与之相关联的值的组。
[0034] 上下文曲线：根据可能的上下文值描述用于算术编码阶段的概率值的变化的几何曲线，
[0035] 压缩上下文表示：用于构建针对特定块大小和特定编码大小的上下文的近似的初始信息。
[0036] 上下文信息值：用于对针对给定块大小的全部比特率的压缩上下文表示信息进行近似的信息。
[0037] 根据第一方面，本发明涉及用于图像的直方图映射的基于上下文的编码的方法，直方图映射表示图像的关键点的位置信息，所述方法包括：提供或获得与应用于图像的矩阵表示的空间网格的给定编码大小和给定块大小相关联的压缩上下文表示信息以获得直方图映射；从压缩上下文表示信息中通过应用近似算法计算针对给定编码大小和给定块大小的上下文；以及使用针对给定编码大小和给定块大小计算的上下文对直方图映射进行编码。近似算法还可以被称作上下文计算算法。
[0038] 通过使用此类压缩上下文表示信息，可以减小储存或传输上下文所需的大小（例如，以字节计）、上下文值和对应的概率。根据第一方面的方法利用描述对应于上下文的不同上下文值的真实概率的上下文曲线（通常通过使用训练数据进行训练获得）可以得到很好的近似的发现。
[0039] 另外，互操作性得到改进，因为编码器并不需要在与用于解码编码直方图映射信息的解码器相同的训练数据组上进行训练。编码器是与解码器可互操作的。
[0040] 在根据第一方面的第一实施形式中，与给定编码大小和给定块大小相关联的压缩上下文表示信息包括：上下文的上下文值和与上下文值相关联的概率值；以及允许计算与上下文的至少一个其它上下文值相关联的概率值的其它信息。
[0041]因此在根据第一方面或根据第一实施形式的第二实施形式中，允许计算上下文的至少一个其它上下文值的概率的其它信息包括：斜率信息；或其它上下文值和与其它上下文值相关联的其它概率值。
[0042] 在根据第一或第二实施形式的第三实施形式中，与给定编码大小和给定块大小相关联的压缩上下文表示信息进一步包括：另一上下文值，以及与所述另一上下文值相关联的概率，所述另一上下文值以及与所述的上下文值相关联的概率通过单模型算术编码被用在与所述空间网格相关联的所述直方图的中心元素的基于上下文编码中。
[0043] 因此在根据第一方面或根据前述实施形式中的任何一个的第四实施形式中，从编码大小和块大小的组中选择给定编码大小和给定块大小。
[0044] 因此在根据第一方面或根据前述实施形式中的任何一个的第五实施形式中，编码大小的组包括以下值中的至少一个、若干个或全部：512、1024、2048、4096、8192和16384字 T。
[0045] 因此在根据第一方面或根据前述实施形式中的任何一个的第六实施形式中，压缩上下文表示信息提供用于来自编码大小和块大小的组的给定编码大小和给定块大小的每个组合，其中提供可以包括：例如，从存储器中进行储存和检索，例如，从查找表中，或经由接收器从另一设备进行接收。
[0046] 因此在根据第一方面或根据前述实施形式中的任何一个的第七实施形式中，获得压缩上下文表示信息的步骤包括：针对给定编码大小和给定块大小通过使用另一近似算法从与给定块大小相关联的一组上下文信息值中计算压缩上下文表示信息。另一近似算法也可以被称作压缩上下文计算算法。
[0047] 通过使用此类二重近似，S卩，第一近似（压缩上下文计算算法）和第二近似（上下文计算算法），可以进一步减少上下文表的使用。当应用第二近似时，近似上下文可以通过使用非常少的值（例如，3个）储存。当块大小是固定的时，必须储存仅一个比特率的值，而用于其它的值可以通过第一近似衍生。
[0048] 在根据第七实施形式的第八实施形式中，与给定块大小相关联的上下文信息值的组包括：针对给定编码大小的上下文的压缩上下文表示值；以及允许计算针对另一编码大小的上下文的压缩上下文表示值的另一信息。
[0049] 在根据第八实施形式的第九实施形式中，允许计算针对另一编码大小的上下文的压缩上下文表示值的另一信息包括：斜率信息；或针对其它编码大小的另一压缩上下文表示值。
[0050] 在根据第八或第九实施形式的第十实施形式中，给定编码大小是编码大小的组的最小编码大小。
[0051] 最小编码大小可用于对针对特定块大小下图像的全部编码大小的全部压缩上下文表示值进行近似。
[0052] 在根据第八到第十实施形式中的任何一个的第^ 实施形式中，给定编码大小和给定块大小选自编码大小和块大小的组，并且其中上下文信息值的组提供用于来自块大小的组中的每个块大小；其中提供可以包括例如从存储器中进行储存和检索，例如，从查找表中，或经由接收器从另一设备中接收。
[0053] 因此在根据第一方面或根据前述实施形式中的任何一个的第十二实施形式中，基于上下文的编码是基于总和的算术编码并且直方图映射是指示空间网格的对应块中关键点的存在或不存在的二进制矩阵表示。
[0054] 根据第二方面，本发明提供具有程序代码的当在计算机上运行时用于执行根据第一方面或第一方面的任何实施形式的方法的

完整全部详细技术资料下载

当前第2页1 2 3 4 5