数据压缩装置和数据压缩方法

文档序号:10694424阅读:597来源:国知局
数据压缩装置和数据压缩方法
【专利摘要】维压缩部(13)通过将从图像中提取出的特征量与由0和1的2元的元素构成的纠错码的检查矩阵进行乘法计算来进行压缩。
【专利说明】
数据压缩装置和数据压缩方法
技术领域
[0001 ]本发明设及用于将数据压缩得较短的数据压缩装置和数据压缩方法。
【背景技术】
[0002] 将图像、声音及传感器等的数据本身、或从该数据提取出的特征量与具有随机数 作为元素的矩阵相乘,从而生成压缩数据。将维压缩所设及的数据的元素数称作维数。在现 有的维压缩中,将mXn矩阵的元素设定为实数值,将随机选择的值用作元素,构成矩阵。η是 原来的数据的维数,m是压缩后的数据的维数。并且,n>m。
[0003] 如上述那样,通过压缩图像、声音及传感器等的数据本身、或其特征量来减少检 索、识别、预测等所设及的数据处理量,实现高速化,能够在短时间内处理一个作业、或者能 够在某个一定时间内执行更多作业或更复杂的作业。
[0004] 例如,图4所示的图像匹配系统是运样的系统:从服务器装置200的图像数据库 下,DB)201所保持的多个样本图像中检索与终端装置100拍摄的照片(检索图像101)等接近 的图像。在该系统中,终端装置100的特征量提取部102从检索图像101中提取特征量。在特 征量提取中使用SIFT (Scale-Invar iant化日1:11'0 Transform:尺度不变特征变换)的情况 下,对于1个图像提取多个(通常几十至几百个)128字节/个的特征量向量。
[0005] 现有的维压缩部103使用随机投影矩阵对上述特征量进行维压缩。在此使用的随 机投影矩阵是式(1),随机投影矩阵的元素 a(r,c)为a(r,c)~N(0,1),遵从平均为0、差异值 为1的正态分布。
[0006] Aerxn (1)
[0007] 在设特征量为X= (X1,X2, . . .,Xn)时,根据yT = AxT计算压缩后的特征量y= (yi, 72,...,ym)。运里,yT,xT的「τ」表示转置。
[0008] 在如上述那样使用SIFT的情况下,則字节=8位来表现特征量向量X的元素 Xi,表 现为n=128。此外,在能够W8位来表现随机投影矩阵A的各元素 a(r,c)的情况下,压缩后的 特征量向量y的元素 yk能够用式(2)进行计算。
[0009] yk = xi · a化,1)+X2 · a化,2)+...+Xi · a化,i)+...+Xn · a化,η) (2)
[0010] 因此,在随机投影矩阵A的元素与特征量向量X的元素相乘中,将与列数的量相应 的128 = 27个加到2字节=16位中,因此,最大16巧=23位成为压缩后的特征量向量y的元素 yk的量化尺寸。压缩后的特征量向量y的长度能够表述为m维的向量,在将维设定为m=40的 情况下,能够从压缩前的128压缩至40。
[0011] 而且,在非专利文献1中,关于缩小压缩后的特征向量y的元素 yk的量化尺寸的方 式进行了讨论,示出了例如在上述的示例中将元素 yk的尺寸从最大23位压缩至1~5位左右 的方式。在该方法中,在维持特征量间的距离的条件下进行维压缩。
[0012] 在量化尺寸缩小部104使用上述非专利文献1的方法压缩特征量的量化尺寸的情 况下,将一个特征量为128 X 8 = 1024位的数据量压缩至m=40、量化尺寸4位时,压缩后的数 据量为128 X40/128 X4 = 160位,将数据量压缩至160/1024 = 15.6%。
[0013] 在服务器装置200侧,特征量提取部102也从图像数据库201保存的样本图像中提 取特征量,维压缩部103和量化尺寸缩小部104对特征量进行压缩。
[0014] 例如,如果在图像数据库201中有10000个样本图像,则服务器装置200针对各样本 图像进行特征量提取和数据压缩,检索部205将各样本图像与从终端装置100传送来的检索 图像101的被压缩后的特征量进行比较,检索出接近检索图像101的样本图像。
[0015] 现有技术文献
[0016] 非专利文献
[0017] 非专利文献 1 :Mu Li,Shantanu Rane,Pet;ros Boufounos,"Quantized Embeddings of Scale Invariant Image Features for Mobile Augmented Reality'', Multimedia Signal Processing(MMSP),2012IEEE 14th International Workshop on Digital Object Identifier,p.1-6

【发明内容】

[0018] 发明要解决的课题
[0019] 可是,在上述方法的情况下,存在下述运样的课题:在为了维压缩而计算yT时需要 mXn个乘法计算,因此,压缩前的数据量增大,在压缩率为相同程度的情况下,计算量呈指 数函数的形式增大。
[0020] 例如,在n = 128、m=40的情况下,需要mXn = 5120个乘法计算,在n = 1280、m = 400 的情况下,需要mXn = 512000个乘法计算。运样,压缩前的数据量变成10倍,计算量变成100 倍。此外,由于随机地选择矩阵的元素而导致压缩后的性质产生偏差,会发生检索时的正解 率劣化的情况。
[0021] 本发明是为了解决上述的课题而完成的,其目的在于减少数据压缩时的计算量。
[0022] 用于解决课题的手段
[0023] 本发明的数据压缩装置是下述运样的装置:在压缩从信息通信设备取得的数据或 数据的特征量时,利用数据或特征量和纠错码的检查矩阵的运算来生成压缩数据。
[0024] 本发明的数据压缩方法是下述运样的方法:在压缩从信息通信设备取得的数据或 数据的特征量时,利用数据或特征量和纠错码的检查矩阵的运算来生成压缩数据。
[0025] 发明的效果
[0026] 根据本发明,在压缩数据时,使用纠错码的检查矩阵作为随机投影矩阵,因此,能 够减少计算量。
【附图说明】
[0027] 图1是示出组装有本发明实施方式1的数据压缩装置的信息通信设备的结构的框 图。
[0028] 图2是示出组装有实施方式1的数据压缩装置的信息通信设备的动作的流程图。
[0029] 图3是用于说明确定实施方式1的维压缩部的压缩维的方法的曲线图。
[0030] 图4是示出使用现有的数据压缩方法的图像匹配系统的结构的框图。
【具体实施方式】
[0031] W下,为了更加详细地说明本发明,根据附图对用于实施本发明的方式进行说明。
[0032] 实施方式1.
[0033] 在实施方式1中,如图1所示,W使用组装有本发明的数据压缩装置的信息通信设 备(终端装置10、服务器装置20)构成的图像匹配系统为例对数据压缩方法进行说明。终端 装置10是平板电脑(Personal Computer)、智能手机、监视录像机等,具有检索图像取得部 11、特征量提取部12、维压缩部13(数据压缩装置)和量化尺寸缩小部14。能够在与该终端装 置10之间进行通信的服务器装置20具有图像数据库21、特征量提取部12、维压缩部13(数据 压缩装置)、量化尺寸缩小部14和检索部25。
[0034] 终端装置10、服务器装置20分别由未图示的CPU(Central Processing Unit:中央 处理单元)构成,该CPU通过执行内部存储器所存储的程序来实现作为特征量提取部12、维 压缩部13、量化尺寸缩小部14、检索部25的功能。并且,维压缩部13也可W由专用的运算电 路构成。
[0035] 图像数据库21由皿D化ard Disk化ive:硬盘驱动器)等构成。
[0036] 接下来,参照图2所示的流程图,对终端装置10的详细情况进行说明。
[0037] 在终端装置10中,检索图像取得部11取入从照相机等接收的图像作为匹配对象的 检索图像,输出至特征量提取部12 (步骤ST1)。
[0038] 特征量提取部12提取检测图像的特征,输出至维压缩部13(步骤ST2)。作为特征量 提取方法,虽然大多是SIFT等的应用例,但可W是任何特征量提取方法。例如,在SIFT中,选 择图像中的几十至几百个特征点(称作关键点),针对各个该关键点输出128字节的特征量 向量。在此,将该128字节的特征量向量的维设为128,看作128维的向量。
[0039] 维压缩部13使用纠错码的检查矩阵对特征量提取部12所输出的特征量向量进行 维压缩(步骤ST3)。在此所使用的纠错码的检查矩阵是具有2元{0,1}作为元素的矩阵,设定 为式(11)。并且,纠错码的检查矩阵也可W由式(12)那样的具有非2元作为元素的矩阵。
[0040] 在W下的说明中,作为纠错码的检查矩阵,使用如式(11)那样的、具有2元{0,1}作 为元素的随机码的检查矩阵。
[0043] 在此,P为2 W外的自然数。
[0044] 在设特征量提取部12提取的特征量为x=(xi,x2,. . .,xn)时,根据y=(yi,y2,..., ym)=化计算维压缩部13进行维压缩后的压缩后特征量。
[0045] 在特征量提取部12使用SIFT的情况下,字节=8位来表述特征量向量X的元素 xi,可W表述为n= 128。此外,能够位来表述检查矩阵Η的各元素 Mr, C),压缩后的特征 量向量y的元素 yk能够用式(13)进行计算。
[0046] yk = xi · h化,1 )+X2 · Mk,2)+...+Xi · h化,i)+...+Xn · h化,η) (13)
[0047] 在由2元的元素构成的检查矩阵的情况下,元素为0的位置删除计算,仅在1所处的 位置对XI进行加法即可。因此,针对特征量向量X的元素8位,对最大列数的量的128 = 27个进 行加法,因此,最大扣7 = 15位成为压缩后的特征量向量y的元素 yk的量化尺寸。此外,压缩 后的特征量向量y的长度能够表述为m维的向量,在将维设定为m=40的情况下,能够从压缩 前的128压缩至40。
[0048] 此时,与不使用纠错码的检查矩阵的现有维压缩(图4的维压缩部103)之间的差异 是计算量。
[0049] 在现有示例中,为了求出一个压缩后的特征量向量y的元素 yk,需要η次的乘法计 算和η-1次的加法计算,并且,需要将该计算重复特征量向量y的长度m次,因此,最终,需要 nm次的乘法计算和(n-1 )m次的加法计算。
[0050] 另一方面,在实施方式1中,在随机编码的情况下,检查矩阵Η的各元素为1的概率 和为0的概率都为1/2,因此,为了求出一个元素 yk,平均进行n/2-l次的加法计算即可,即使 将该计算重复特征量向量y的长度m次,最终,平均进行(n/2-l)m次的加法计算就够了。
[0化1 ] 在此次的示例的情况下,在现有示例中,需要nm= 128 X 40 = 5120次的乘法计算和 (n-l)m = 5080次的加法计算。另一方面,在实施方式1中,只要进行(n/2-l)m=2520次的加 法计算即可,能够大幅减少计算量。
[0052] 然后,如上述非专利文献1那样,量化尺寸缩小部14缩小压缩后的特征量向量y的 元素 yk的量化尺寸,从最大15位压缩至1~5位左右(步骤ST4)。此时,W能够大致维持特征 量间的相对距离的大小关系的方式预先进行评价,预先确定能够大致维持距离的大小关系 的压缩维。
[0053] 目P,使用图3对确定方法的一例进行说明。装置的设计者准备了分别从4个不同的 角度来拍摄200种建筑物的照片800张( = 200X4),对相同的建筑物的照片分配相同的ID编 号。此外,作为目标,准备了拍摄该200种建筑物中的1个而得到的照片(与前面的800张照片 不同)。然后,利用k-邻近法(取出距目标最近的k个数据并采取多数决定)从800张中检测出 拍摄到距目标建筑物最近的建筑物的照片。图3示出了其检测结果,纵轴是检测成功率,横 轴是压缩维。将k设定为10,对目标建筑物的特征量与800张照片的建筑物的特征量之间的 距离进行比较,将与相同的建筑物的特征量之间的距离较近的ID编号在k=10个中占多数 的情况作为检测成功。在将目标性能设定为检测成功率95%的情况下,压缩后的维可W选 择40。利用运种方法等确定的压缩维被预先设定在维压缩部13。
[0054] 将一个特征量为128X8 = 1024位的原来的数据量压缩至m = 40和量化尺寸4位的 情况下,压缩后的数据量为128X40/128X4 = 160位,能够将数据量压缩至160/1024 = 15.6%。
[0055] W上是通过终端装置10实现的数据压缩方法。
[0056] 并且,在上述说明中,虽然示出了压缩检索图像的特征量的示例,但也可W压缩检 索图像本身。
[0057] 在一方的服务器装置20中,也针对图像数据库21所保存的样本图像,特征量提取 部12利用与上述相同的方法提取特征量,维压缩部13利用与上述相同的方法进行使用了纠 错码的检查矩阵的维压缩,量化尺寸缩小部14利用与上述相同的方法进行量化尺寸的缩 小。此时,在服务器装置20侧,在计算维压缩时,也可W减少与终端装置10侧相同的计算量。
[0058] 例如,如果在图像数据库21中有10000张样本图像,则特征量提取部12、维压缩部 13W及量化尺寸缩小部14针对各个样本图像进行特征量提取和数据压缩,将压缩后的特征 量向检索部25输出。
[0059] 检索部25对从终端装置10传送来的检索图像的被压缩后的特征量与从量化尺寸 缩小部14输入的各样本图像的被压缩后的特征量进行比较,检索出接近检索图像的样本图 像。
[0060] 目P,维压缩部13的压缩大致维持了特征量间的相对距离的大小关系,因此,检索部 25利用k-邻近法(取出距目标最近的k个数据并采取多数决定)等方法能够判别终端装置10 的检索图像与图像数据库21中所保存的哪个样本图像接近。其结果是,具有能够抑制由压 缩所导致的正解率劣化的特征。该情况下,k-邻近法的检索对象成为压缩后的特征量,因 此,在基于单纯的比较的检索中,能够将处理时间缩短至15.6%。
[0061] 根据W上内容,根据实施方式1,维压缩部13通过将数据或从该数据提取出的特征 量与纠错码的检查矩阵相乘而生成压缩数据,因此,能够减少计算量。
[0062] 特别是,通过使用由0和1的2元元素构成的随机码的检查矩阵作为纠错码的检查 矩阵,能够将用于压缩的计算量从使用现有的随机投影矩阵的情况下的nm次的乘法计算和 (n-l)m次的加法计算减少至只有(n/2-l)m次的加法计算。
[0063] 实施方式2.
[0064] 引用图1所示的图像匹配系统对实施方式2的数据压缩装置进行说明。
[0065] 在该实施方式2中,使用如上式(11)那样由2元{0,1}的元素构成的LDP"Low- Density Parity-化eck)码的检查矩阵作为维压缩部13(数据压缩装置)在维压缩中使用的 纠错码的检查矩阵。
[0066] 并且,虽然省略说明,也可W使用如上式(12)那样由非2元的元素构成的LDPC码的 检查矩阵。
[0067] 通常,LDPC码的列的平均权重是4,行的平均权重是(列的平均权重)X n/m。即,列 的权重是包含在矩阵的1列中的1的数量。此外,行的权重是包含在矩阵的1行中的1的数量。 例如,在n= 128、m=40的情况下,行的权重为4 X 128/40 = 12.8。在LDPC码的情况下,具有运 样的特征:即使η或m增大,运些列的权重、行的权重也不会变化。
[0068] 在上述实施方式1中说明的随机码的检查矩阵的情况下,列内的1的数量平均为η/ 2,行内的1的数量平均为m/2,与LDPC码的检查矩阵成比例地,列、行的1的数量增多,并且, 矩阵内的1的总数为平方,因此,该总数也增多。另一方面,在LDPC码的检查矩阵的情况下,1 的数量始终是固定且稀疏的,因此,与随机码的检查矩阵相比,1的总数压倒性地减少。
[0069] 例如,在n=128、m = 40的情况下,随机码中的1的总数是(列的平均权重)X(列数) = 40/2X 128 = 2560个。另一方面,在LDPC码的情况下,1的总数成为(列的平均权重)X(列 数)=4 X 128 = 516个,压倒性地少。
[0070] 在此,作为一例,在式(14)中示出了 n = 28、m = 21的LDPC码的检查矩阵H。
[0071]
[0072] 与上述实施方式1相同,能够位来表述LDPC码的检查矩阵Η的各元素 h(r,c),压 缩后的特征量向量y的元素 yk能够用上式(13)进行计算。
[0073] LDPC码的检查矩阵Η的元素为0的位置删除计算,仅在1所处的位置对XI进行相加 即可,因此,针对压缩前的特征量向量X的元素1字节=8位,对作为与行权重的量相应的(列 的平均权重)Xn/m=12.8个而所需的二进制数表述24的4位进行加法,最大8+4=12位成为 压缩后的特征量向量y的元素 yk的量化尺寸。此外,压缩后的特征量向量y的长度能够表述 为m维的向量,在将维设定为m = 40的情况下,能够从压缩前的128压缩至40。
[0074] 此外,在实施方式2中,为了求出一个元素 yk,在此次的实例中,平均进行行权重= 12.8次的加法计算即可,即使将该加法计算重复特征量向量y的长度m次,平均进行(12.8- l)Xm = 472次的加法计算就够了。由此,与使用现有的随机投影矩阵的情况下的计算量(nm = 5120次的乘法计算和(n-l)m = 5080次的加法计算)相比,能够大幅减少计算量。此外,使 用LDP邱马的检查矩阵的情况下的计算量比使用随机码的检查矩阵的情况下的计算量更少。
[0075] 根据W上内容,根据实施方式2,维压缩部13在压缩数据或从该数据提取出的特征 量时,通过使用稀疏的LDPC码的检查矩阵,能够大幅减少计算量。此外,LDPC码的检查矩阵 的元素是规则的,因此,还能够期待抑制压缩性能的偏差的效果。而且,压缩前的特征量的 维数η越大,则压缩效率越高,因此,LDPC码的检查矩阵特别是在处理几百W上的较长的特 征量时是有效的。
[0076] 并且,在上述实施方式1中示出了使用随机码的检查矩阵的示例,在上述实施方式 2中示出了使用LDP邱马的检查矩阵的示例,但是,除此W外,还可W使用BCH码、里德-索罗口 码、循环码等。运些码具有运样的特征:在处理较短的特征量时能够在抑制成功率降低的情 况下进行压缩。此外,也可W是除上述列举的纠错码W外的码,可W根据条件应用适当的纠 错码。
[0077] 此外,在上述实施方式1、2中,作为检查矩阵,虽然例示了由2元{0,1}的元素构成 的矩阵,但也可W是由3个元素{-1,0,1}构成的矩阵。例如,也可W是通过将上式(14)的矩 阵中的ο直接设定为0、将1的部分分配为-1或1而成的下式(15)的矩阵。在使用式(15)那样 的检查矩阵的情况下,维压缩部13在数据或从该数据提取出的特征量中W行为单位对与检 查矩阵的元素为1或-1的位置对应的值进行加法或减法,生成压缩数据。
[0078] 无论使检查矩阵的元素为2元{0,1}还是3个元素{-1,0,1},计算量自身都没有什 么较大的差异,因此,只要选择在性能评价中显示出更好的性能的一方即可。
[0079]
[0080] 除上述W外,本发明能够在其发明的范围内对各实施方式进行自由的组合、或进 行各实施方式的任意的结构要素的变形、或在各实施方式中进行任意的结构要素的省略。
[0081] 产业上的可利用性
[0082] 如上所述,本发明的数据压缩装置使用纠错码的检查矩阵W较少的计算量来压缩 数据,因此,适合用于根据图像、声音及传感器等的数据来高速地执行检索、识别、预测等的 处理的装置等。
[00削标号说明
[0084] 10、100:终端装置;11:检索图像取得部;12、102:特征量提取部;13、103:维压缩部 (数据压缩装置);14、104:量化尺寸缩小部;20、200:服务器装置;21、201:图像数据库;25、 205:检索部;101:检索图像。
【主权项】
1. 一种数据压缩装置,其对从信息通信设备取得的数据或所述数据的特征量进行压 缩,其特征在于, 所述数据压缩装置利用所述数据或所述特征量和纠错码的检查矩阵的运算来生成压 缩数据。2. 根据权利要求1所述的数据压缩装置,其特征在于, 使用由〇和1的2元的元素构成的检查矩阵作为所述纠错码的检查矩阵,在所述数据或 所述特征量中,以行为单位对与所述检查矩阵的元素为1的位置对应的值进行加法,生成压 缩数据。3. 根据权利要求1所述的数据压缩装置,其特征在于, 使用由〇、1和-1的3个元素构成的检查矩阵作为所述纠错码的检查矩阵,在所述数据或 所述特征量中,以行为单位对与所述检查矩阵的元素为1或-1的位置对应的值进行加法或 减法,生成压缩数据。4. 根据权利要求2所述的数据压缩装置,其特征在于, 使用随机码的检查矩阵作为所述纠错码的检查矩阵。5. 根据权利要求2所述的数据压缩装置,其特征在于, 使用LDPC码的检查矩阵作为所述纠错码的检查矩阵。6. 根据权利要求2所述的数据压缩装置,其特征在于, 使用BCH码的检查矩阵作为所述纠错码的检查矩阵。7. 根据权利要求2所述的数据压缩装置,其特征在于, 使用里德-索罗门码的检查矩阵作为所述纠错码的检查矩阵。8. 根据权利要求2所述的数据压缩装置,其特征在于, 使用循环码的检查矩阵作为所述纠错码的检查矩阵。9. 一种数据压缩方法,压缩从信息通信设备取得的数据或所述数据的特征量,其特征 在于,包括以下步骤: 利用所述数据或所述特征量和纠错码的检查矩阵的运算来生成压缩数据。
【文档编号】H03M7/30GK106063133SQ201480076704
【公开日】2016年10月26日
【申请日】2014年3月5日
【发明人】松本涉, 山崎贵司
【申请人】三菱电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1