一种融合神经种群编码模型的3D主观质量预测方法与流程

文档序号：11844751阅读：来源：国知局

技术特征：

1.一种融合神经种群编码模型的3D主观质量预测方法，其特征在于，包括如下步骤：

S1、建立基于支持向量回归的3D主观质量预测模型；

S2、基于失真深度图得到视差图；

S3、计算视差图在神经种群编码模型下的13维响应；

S4、将所述13维响应联合失真深度图的纹理特征和失真特征参数作为3D主观质量预测模型的输入，得到3D图像体验质量值。

2.根据权利要求1所述3D主观质量预测方法，其特征在于：步骤S1中所述3D主观质量预测模型的数学形式为：

$<mrow> <mi>p</mi> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>l</mi> </munderover> <mrow> <msub> <mi>α</mi> <mi>j</mi> </msub> <mi>exp</mi> </mrow> <mo>{</mo> <mo>-</mo> <mfrac> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>x</mi> <mi>v</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> <msup> <mi>σ</mi> <mn>2</mn> </msup> </mfrac> <mo>}</mo> <mo>+</mo> <mi>c</mi> </mrow>$

其中p为预测得到的主观质量分数,该分数为平均主观意见分MOS值，取值范围为1-5，其中1代表3D体验非常不舒服，5代表3D体验非常舒服；x_v为深度图中提取的特征向量，x_j为训练集中的特征向量；l为训练集的大小，a_j,σ²和b是在训练集上训练得到的参数。

3.根据权利要求2所述3D主观质量预测方法，其特征在于：训练集上训练过程包括如下步骤：

S11、建立数据库；

S12、进行支持向量回归SVR训练，对数据做归一化；

S13、应用高斯核函数；

S14、用交叉验证和网格搜索法得到最优的参数。

4.根据权利要求3所述3D主观质量预测方法，其特征在于：步骤S11中，在高码率与低码率两种码率下,分别选取MPEG标准测试序列M个场景的图片，每个场景变化N个平坦块的编码参数得到纹理平坦失真比变化的深度图；利用失真深度图和固定质量的纹理图合成3D图片在标准测试环境下进行主观实验评分得到图像的主观质量值；最终得到一个大小为M×N×2的3D图像数据集。

5.根据权利要求3所述3D主观质量预测方法，其特征在于：步骤S12中，运用开发软件matlab的支持向量机svm工具箱可以非常便捷的完成SVR训练，归一化就是指把数据都按比例转成0—1之间的数字。

6.根据权利要求1所述3D主观质量预测方法，其特征在于：步骤S2中

失真深度图中的深度值到世界坐标系中的深度值转化关系如下，

$<mrow> <mi>z</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mfrac> <mi>v</mi> <mn>255</mn> </mfrac> <mo>·</mo> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <msub> <mi>z</mi> <mrow> <mi>n</mi> <mi>e</mi> <mi>a</mi> <mi>r</mi> </mrow> </msub> </mfrac> <mo>-</mo> <mfrac> <mn>1</mn> <msub> <mi>z</mi> <mrow> <mi>f</mi> <mi>a</mi> <mi>r</mi> </mrow> </msub> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>z</mi> <mrow> <mi>f</mi> <mi>a</mi> <mi>r</mi> </mrow> </msub> </mfrac> </mrow> </mfrac> </mrow>$

其中v是失真深度图中的深度值，z_near是图中最靠近相机的深度值，z_far是最远离相机坐标点的实际深度值。

7.根据权利要求4所述3D主观质量预测方法，其特征在于：步骤S3中，视觉神经细胞对于视差的响应由以下公式拟合：

$<mrow> <msub> <mi>R</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>R</mi> <mn>0</mn> <mi>i</mi> </msubsup> <mo>+</mo> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>·</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mn>0.5</mn> <mrow> <mo>(</mo> <msup> <mrow> <mo>(</mo> <mi>d</mi> <mo>-</mo> <msubsup> <mi>d</mi> <mn>0</mn> <mi>i</mi> </msubsup> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>/</mo> <msubsup> <mi>σ</mi> <mi>i</mi> <mn>2</mn> </msubsup> <mo>)</mo> </mrow> </mrow> </msup> <mo>·</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mrow> <mo>(</mo> <mn>2</mn> <msub> <mi>πf</mi> <mi>i</mi> </msub> <mo>(</mo> <mrow> <mi>d</mi> <mo>-</mo> <msubsup> <mi>d</mi> <mn>0</mn> <mi>i</mi> </msubsup> </mrow> <mo>)</mo> <mo>+</mo> <msub> <mi>Φ</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>$

其中，i代表第i种神经细胞的d是每个像素点以角度定义的视差；是基本响应；A_i是高斯核的振幅；是高斯函数的中心；σ_i是高斯函数的标准差；f_i是频率；Φ_i是相位。

8.根据权利要求1所述3D主观质量预测方法，其特征在于：步骤S3中神经种群编码模型下的13维响应，其中第i种神经细胞反应的期望以下列公式拟合：

$<mrow> <mi>E</mi> <mo>[</mo> <msub> <mi>r</mi> <mi>i</mi> </msub> <mo>]</mo> <mo>=</mo> <munder> <mo>Σ</mo> <mi>d</mi> </munder> <mi>P</mi> <mo>[</mo> <mi>d</mi> <mo>]</mo> <mo>·</mo> <msub> <mi>R</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>,</mo> <mn>1</mn> <mo>≤</mo> <mi>i</mi> <mo>≤</mo> <mn>13</mn> <mo>,</mo> </mrow>$

其中，P[d]是视差d的概率。

9.根据权利要求1所述3D主观质量预测方法，其特征在于：步骤S4中所述纹理特征和失真特征，包括：失真深度图的纹理块个数占比、纹理块的平均块失真、纹理块与平坦块的失真比。

10.根据权利要求9所述3D主观质量预测方法，其特征在于：

所述纹理块指在深度图中纹理复杂度大于纹理复杂度阈值的编码块；

所述平坦块指在深度图中纹理复杂度小于所述纹理复杂度阈值的编码块；

所述纹理块个数占比指在深度图中纹理块的个数与编码块总数之比；

所述纹理块的平均块失真指在失真深度图中每个纹理块相对于对应的参考深度图的纹理块的失真之和的算术平均值；

所述平坦块的平均块失真指在失真深度图中每个平坦块相对于对应的参考深度图中的平坦块的失真之和的算术平均值；

所述纹理块与平坦块的失真比指纹理块的平均块失真与平坦块的平均块失真之比。

完整全部详细技术资料下载

当前第2页1 2 3