基于新的邻域函数的三维自组织映射图像编码方法

文档序号:10661354阅读:401来源:国知局
基于新的邻域函数的三维自组织映射图像编码方法
【专利摘要】本发明公开一种基于新的邻域函数的三维自组织映射图像编码方法,首先,对图像样本进行不断学习训练,得到最佳匹配模式库;其次,对待编码的图像进行分块处理,并将这些待编码图像块与最佳匹配模式库中的模式矢量进行图像模式匹配,编码每个块在模式库中的匹配模式的索引。本发明具有模式库调整速度快,模式库训练效率高的特点。
【专利说明】
基于新的邻域函数的三维自组织映射图像编码方法
技术领域
[0001]本发明涉及图像编码技术领域,具体涉及一种基于新的邻域函数的三维自组织映 射图像编码方法。
【背景技术】
[0002] 图像编码也称图像压缩,是指在满足一定质量(信噪比的要求或主观评价得分)的 条件下,以较少比特数表示图像或图像中所包含信息的技术。基于神经网络的图像编码是 近年来出现的一种新的图像编码方法。人工神经网络在图像压缩中的应用是通过初步模拟 人体神经系统的局部初级功能,根据图像本身的特点,自主的对其进行压缩编码。自组织神 经网络在图像编码邻域有广泛的应用。
[0003] 自组织映射(361卜0找3]1丨2;[1^]\^1。,简称30]\0算法是1(〇11〇11611从人脑神经元的组 织原理上受到启发而提出的一种具有自组织特性的人工神经网络算法。该算法模拟了人脑 神经系统对某一图形或某一频率特定兴奋的特征,同时考虑了可以人工实现的条件,在数 据挖掘和图像模式识别等领域得到了深入的研究和应用,是一种高效的数据聚类方法。S0M 网络采用双层网络结构,分为输入层和映射层,输入层用于感知输入模式,每个输入神经元 通过权值与每个映射层神经元连接,映射层输出结果,映射层的神经元互相连接。传统S0M 网络一般采用一维输入层和二维映射层,它能有效地处理一维和二维信号。近年来,三维图 像和视频等三维信号的处理日益引起了关注,然而传统S0M算法并不能直接用于三维信号 的处理。三维S0M算法很好地解决了这一问题,能有效地将二维输入映射为三维输出,实现 了三维信号的非线性映射。
[0004] 邻域函数是S0M算法的重要组成部分,为了保证收敛,需满足随迭代时间逐渐减小 的原则。在训练的初始阶段,邻域半径较大,随着训练次数的增加,网络逐渐趋于稳定,只需 对获胜节点进行较细微的权值调整,因而邻域半径不断缩小。邻域函数通常取线性函数或 指数函数。然而,这些邻域函数存在一定问题,如模式库调整速度慢,模式库训练效率低等, 影响了三维S0M算法的性能。

【发明内容】

[0005] 本发明所要解决的技术问题是现有S0M算法的模式库调整速度慢和训练效率低的 问题,提供一种基于新的邻域函数的三维自组织映射图像编码方法。
[0006] 为解决上述问题,本发明是通过以下技术方案实现的:
[0007] 基于新的邻域函数的三维自组织映射图像编码方法,包括如下步骤:
[0008] 步骤1、对图像样本进行不断学习训练,得到最佳匹配模式库;
[0009] 步骤1.1、对图像样本进行分块,每个图像块为一个训练矢量,共得到含L个训练矢 量的训练矢量集;
[0010] 步骤1.2、从训练矢量集中选择N个训练矢量来构成初始化模式库,该初始模式库 中的训练矢量称为模式矢量,且初始模式库中的模式矢量排列成三维立体结构;上述N< < L;
[0011]步骤1.3、设定邻域函数
[0013] 其中,Bo为最小邻域,为最大邻域,Q为邻域衰减常数、C2为训练次数;j = 0, 1,…,N-1,N为设定的三维自组织映射网络的大小;t = 0,1,…,L-1,L为训练矢量集中训练 矢量的个数;
[0014] 步骤1.4、输入一个训练矢量,并分别计算该训练矢量与初始模式库中的各个模式 矢量的失真,从中选择出与训练矢量失真最小的模式矢量作为获胜模式矢量;
[0015] 步骤1.5、调整获胜模式矢量及其三维邻域范围内的模式矢量;
[0016] 步骤1.6、返回步骤1.4重新选择一个训练矢量,直到输入完所有的训练矢量,得到 最佳匹配模式库;
[0017] 步骤2、对待编码的图像进行分块处理,并将这些待编码图像块与最佳匹配模式库 中的模式矢量进行图像模式匹配,编码每个块在模式库中的匹配模式的索引。
[0018] 上述步骤1.2中,采用随机法从训练矢量集中选择N个训练矢量来构成初始模式 库。
[0019] 上述步骤1.4中,采用下式计算训练矢量与模式矢量的失真山(t);
[0020] dj(t)=||X(t)-Wj⑴ ||2
[0021] 其中,Wj (t)为模式矢量,X (t)为训练矢量;j = 0,1,…,N-1,N为设定的三维自组织 映射网络的大小;t = 0,1,…,L-l,L为训练矢量集中训练矢量的个数。
[0022] 上述步骤1.5中,根据下式调整获胜模式矢量及其三维邻域范围内的模式矢量
[0024]其中,Wj(t+1)为第t+Ι次训练时的模式矢量,Wj(t)为第t次训练时的模式矢量,X (t)为训练矢量,f为获胜模式矢量,为获胜模式矢量f在第t次训练时的邻域函数,α (t)为第t次训练时的学习速度函数;j = 0,1,…,N-1,Ν为设定的三维自组织映射网络的大 小;t = 0,1,…,L-l,L为训练矢量集中训练矢量的个数。
[0025] 上述步骤2具体为:
[0026]步骤2.1、将待编码的图像分块,其中待编码的图像分块大小与图像样本的分块大 小相一致;
[0027] 步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真, 并编码具有最小失真的模式矢量在模式库中的索引;
[0028] 步骤2.3、对待编码的所有图像进行步骤2.2的处理,得到待编码的图像的码流。
[0029] 与现有技术相比,本发明具有如下特点:模式库调整速度快,模式库训练效率高。
【附图说明】
[0030] 图1为模式库的训练过程。
[0031] 图2为三维自组织映射图像编码过程。
【具体实施方式】
[0032]下面结合实施例,对本
【发明内容】
作进一步地详细说明,但本发明的实施方式不限 于此。
[0033] 一种基于新的邻域函数的三维自组织映射图像编码方法,包括如下步骤:
[0034]步骤1)对图像样本进行不断训练,得到最佳匹配的模式库。参见图1。
[0035]步骤1.1)设定3DS0M网络大小为(N,M),其中N、M分别为模式库的大小、模式库中模 式矢量的大小。
[0036]步骤1.2)对图像样本分块,块的大小一般取8X8。每个图像块为一个训练矢量,共 得到含L个训练矢量的训练矢量集{X(t);t = 0,l,…,L-1}。用随机法从训练矢量集中选择N (N< <L)个训练矢量来构成初始化模式库{Wj (0); j = 0,1,…,N-1},并将初始模式库中的 模式矢量排列成三维立体结构。
[0037]步骤1 · 3)将初始化邻域设定为Nj(0),j = 0,1,…,N-1。
[0038] 步骤1.4)输入一个训练矢量集中的训练矢量X = (XI,X2,…,xm)t。
[0039] 步骤1.5)选择均方误差失真准则,均方误差为山(t)=| |X(t)-Wj(t)| I2,分别计算 该训练矢量与模式库中各模式矢量的失真山(t);并选择具有最小失真的模式矢量为获胜 模式矢量f。
[0040] 步骤1.6)按下式调整获胜模式矢量.f及其三维邻域A、(t)范围内的模式矢量,
[0042]其中,~⑴为邻域函数,通常选用单调递减函数
分别为获胜模式矢量f的最小邻域和最大邻域,&为邻域衰减常数,C2为训练次数。在 训练的初始阶段,邻域半径较大,随着训练次数的增加,网络逐渐趋于稳定,只需对获胜节 点进行较细微的权值调整,因而邻域半径不断缩小。a(t)为学习速度函数,它反映了模式矢 量调整的幅度大小,一般选用单调递减函数《(〇=4e^,式中Ai为训练开始时的最大学习速 度,Ti为学习衰减常数。
[0043]步骤1.7)返回步骤步骤1.4),直到输入完训练矢量集中所有的训练矢量,即得到 最佳匹配模式库。
[0044] 步骤2)对待编码图像进行图像模式识别,编码每个块在模式库中的匹配模式的索 弓丨。参见图2。
[0045] 步骤2.1、将待编码图像分块,其中待编码图像分块大小与图像样本的分块大小一 致;
[0046] 步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真, 并选择具有最小失真的模式矢量作为该图像块的匹配模式,对该图像块编码时只编码其匹 配模式在模式库中的索引;
[0047] 采用均方误差准则即下式来计算待编码图像块与最佳匹配模式库中各模式矢量 的失真bW);
[0048] ^(^)=1 |Y(t7 ) I I2
[0049] 其中,Wj (V )为模式矢量,Y(V )为待编码图像块;j = 0,1,…,N-l,N为设定的三维 自组织映射网络的大小;V =0,1,…,K-1,K为待编码图像块的个数。
[0050] 步骤2.3、对待编码图像每一个子图像块进行步骤2.2的处理,完成了对图像的编 码。
[0051] 具体地,为了说明本方法的性能,做了大量的仿真实验,实验图像选择分辨率为 512父512\81^的标准亮度测试图像1^1^、?叩?從 8,用于模式库训练和图像编码。重建图 像品质的客观评价采用峰值信噪比式中Emse为原始图像与重建图像之
,. 间的均方误差。图像压缩比为
式中Μ为模式矢量的维数,Β〇为原始图像的每像 素比特数,为模式矢量地址比特数。
[0052]实验分别用基于指数邻域函数的三维S0M算法和基于本专利新的邻域函数的三维 S0M算法设计图像模式识别模式库,并通过编码后重建图像的质量来比较基于这两种邻域 函数的三维S0M算法的性能,其中训练矢量数为40960,模式库大小为1024。表1为选取不同 实验图像时,基于指数邻域函数的三维S0M算法和基于本专利新的邻域函数的三维S0M算法 用于图像模式识别编码的重建图像的峰值信噪比(PSNR)。
[0053] 表1重建图像的PSNR
[0054]
[0055] 由表1可以看出,基于本专利新的邻域函数的三维S0M算法的性能比基于指数邻域 函数的三维S0M算法提高了0.0909-0.3013dB。
【主权项】
1. 基于新的邻域函数的三维自组织映射图像编码方法,其特征是,包括如下步骤: 步骤1、对图像样本进行不断学习训练,得到最佳匹配模式库; 步骤1.1、对图像样本进行分块,每个图像块为一个训练矢量,共得到含L个训练矢量的 训练矢量集; 步骤1.2、从训练矢量集中选择N个训练矢量来构成初始化模式库,该初始模式库中的 训练矢量称为模式矢量,且初始模式库中的模式矢量排列成三维立体结构;上述N< <L; 步骤1.3、设定邻域函数其中,Bo为最小邻域,B1为最大邻域,C1为邻域衰减常数、C2为训练次数;j = O,1,…,N-I, N为设定的三维自组织映射网络的大小;t = 0,1,…,L-I,L为训练矢量集中训练矢量的个 数; 步骤1.4、输入一个训练矢量,并分别计算该训练矢量与初始模式库中的各个模式矢量 的失真,从中选择出与训练矢量失真最小的模式矢量作为获胜模式矢量; 步骤1.5、调整获胜模式矢量及其三维邻域范围内的模式矢量; 步骤1.6、返回步骤1.4重新选择一个训练矢量,直到输入完所有的训练矢量,得到最佳 匹配模式库; 步骤2、对待编码的图像进行分块处理,并将这些待编码图像块与最佳匹配模式库中的 模式矢量进行图像模式匹配,编码每个块在模式库中的匹配模式的索引。2. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法,其特征是, 步骤1.2中,采用随机法从训练矢量集中选择N个训练矢量来构成初始模式库。3. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法,其特征是, 步骤1.4中,采用下式计算训练矢量与模式矢量的失真山(t); dj(t)= I |x(t)-ffj(t) 112 其中,Wj(t)为模式矢量,X(t)为训练矢量;j = 0,I,…,N-I,N为设定的三维自组织映射 网络的大小;t = 0,1,…,L_1,L为训练矢量集中训练矢量的个数。4. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法,其特征是, 步骤1 .5中,枏抿下忒调整莊胖樽忒玍量及其=維郃域茹闱内的樽忒玍量共中,WjU+l)73弟t+Ι次训练时的悮式天重,WjU)为弟t次训练时的模式矢量,X(t)为 训练矢量,f为获胜模式矢量,'· W为获胜模式矢量f在第t次训练时的邻域函数,a(t)为 第t次训练时的学习速度函数;j = 0,1,…,N_1,N为设定的三维自组织映射网络的大小;t = O,1,…,L-I,L为训练矢量集中训练矢量的个数。5. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法,其特征是, 步骤2具体为: 步骤2.1、将待编码的图像分块,其中待编码的图像分块大小与图像样本的分块大小相 一致; 步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真,并编 码具有最小失真的模式矢量在模式库中的索引; 步骤2.3、对待编码的所有图像进行步骤2.2的处理,得到待编码的图像的码流。
【文档编号】H04N19/597GK106028043SQ201610316588
【公开日】2016年10月12日
【申请日】2016年5月13日
【发明人】黎洪松, 程福林
【申请人】桂林电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1