一种图像格式识别方法及装置与流程

文档序号:14653874发布日期:2018-06-08 22:38阅读:153来源:国知局
一种图像格式识别方法及装置与流程

本发明实施例涉及图像技术,尤其涉及一种图像格式识别方法及装置。



背景技术:

随着3D设备的不断发展,越来越多的3D设备进而同时实现显示2D图像和3D图像。其中,3D图像的显示是通过将左右格式的图像进行图像交织实现,其中,左右格式的图像包括左右格式(LR格式)图像以及左2D图右深度图格式(2D+Z格式)图像。

目前,上述三种格式的一般是通过如下方式识别:一、通过人工识别图像格式后,手动输入图像格式,识别速度慢,误差大,且耗费大量的人力资源;二、通过识别文件头的方式确定图像格式,但是,目前市场上没有对2D/3D图像或者视频的统一规范,无法对不同的文件头标识进行统一地识别,导致图像格式识别率差。



技术实现要素:

本发明实施例提供一种图像格式识别方法及装置,以实现自动识别的图像格式。

第一方面,本发明实施例提供了一种图像格式识别方法,其中方法包括:

获取待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;

提取所述预设兴趣区域的特征参数;

将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。

进一步的,所述特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。

进一步的,所述机器学习模型为两个,其中将所述特征参数输入至少一个机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型,包括:

根据所述特征参数确定所述待识别图像是否包括深度图;

根据所述特征参数确定所述待识别图像是否是独立的二维图像;

根据深度图识别结果和/或二维图像的识别结果确定所述待识别图像的格式类型。

进一步的,根据深度图识别结果和/或二维图像的识别结果确定所述待识别图像的格式类型,包括:

若所述待识别图像包括深度图,则确定所述待识别图像的格式类型为二维图与深度图组合格式;

若所述待识别图像是独立的二维图像,则确定所述待识别图像的格式类型为二维图像格式;

若所述待识别图像不包括深度图,且所述待识别图像不是独立的二维图像,则确定所述待识别图像的格式类型为左右图像格式。

进一步的,在获取待识别图像之前,还包括:

建立至少一个待训练的机器学习模型;

根据预设训练样本集对所述待训练的机器学习模型进行训练,并根据训练结果对所述待训练的机器学习模型进行优化,生成所述机器学习模型。

第二方面,本发明实施例还提供了一种图像格式识别装置,该装置包括:

兴趣区域获取模块,用于获取待识别图像的至少三个预设兴趣区域,其中所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配;

特征参数提取模块,用于提取所述预设兴趣区域的特征参数;

图像格式识别模块,用于将所述特征参数输入至少一个具有图像识别功能的机器学习模型,根据所述机器学习模型的输出结果确定所述待识别图像的格式类型。

进一步的,所述特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和和区域一致性特征。

进一步的,所述机器学习模型为两个,所述图像格式识别模块包括:

第一识别模型,用于根据所述特征参数确定所述待识别图像是否包括深度图;

第二识别模型,用于根据所述特征参数确定所述待识别图像是否是独立的二维图像;

识别结果确定单元,用于根据所述第一识别模型和/或所述第二识别模型的识别结果确定所述待识别图像的格式类型。

进一步的,所述识别结果确定单元具体用于:

若所述待识别图像包括深度图,则确定所述待识别图像的格式类型为二维图与深度图组合格式;

若所述待识别图像是独立的二维图像,则确定所述待识别图像的格式类型为二维图像格式;

若所述待识别图像不包括深度图,且所述待识别图像不是独立的二维图像,则确定所述待识别图像的格式类型为左右图像格式。

进一步的,所述装置还包括:

模型建立模块,用于在获取待识别图像之前,建立至少一个待训练的机器学习模型;

模型训练模块,用于根据预设训练样本集对所述待训练的机器学习模型进行训练,并根据训练结果对所述待训练的机器学习模型进行优化,生成所述机器学习模型。

本发明实施例通过获取待识别图像的多个预设兴趣区域,提取了图像中心区域和至少两个对应区域的特征参数,将该特征参数输入至少一个机器学习模型,并根据机器学习模型的输出结果确定待识别图像的格式类型,解决了手动输入格式类型耗费人力与时间,或者文件头标识不统一无法准确识别图像格式的问题,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。

附图说明

图1是本发明实施例一提供的一种图像格式识别方法的流程图;

图2是本发明实施例一提供的预设兴趣区域的示意图;

图3A是本发明实施例二提供的一种图像格式识别方法的流程图;

图3B是本发明实施例二提供的一种图像格式识别方法的流程图;

图4是本发明实施例三提供的一种图像格式识别方法的流程图;

图5是本发明实施例三提供的Adaboost训练识别误差逐级降低示意图;

图6是本发明实施例三提供的Adaboost验证识别误差逐级降低示意图;

图7是本发明实施例四提供的一种图像格式识别装置的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一提供的一种图像格式识别方法的流程图,本实施例可适用于自动识别图像格式的情况,该方法可以由本发明实施例提供的图像格式识别装置来执行,该装置可采用软件和/或硬件的方式实现。参见图1,该方法具体包括:

S110、获取待识别图像的至少三个预设兴趣区域,其中,预设兴趣区域包括图像中心区域和至少两个对应区域,至少两个对应区域的位置信息基于图像中心区域相匹配。

本实施例中,待识别图像可以是任意格式图像,示例性的,待识别图像可以是独立的二维图像,或者是能够进行图像交织的SBS(Side-By-Side)格式图像,其中SBS格式图像可以包括左右格式(LR格式)图像以及左2D图右深度图格式(2D+Z格式)图像,且不同格式的图像的显示策略不同。

本实施例中,在待识别图像中选择至少三个预设兴趣区域,其中,预设兴趣区域包括图像中心区域和至少两个对应区域,至少两个对应区域的位置信息基于图像中心区域相匹配。其中,图像中心区域为以待识别图像的中心线为轴线的规则区域,示例性的,图像中心区域为矩形区域。中心线将待识别区域划分为两部分图像,至少两个对应区域分别位于两部分图像的对应位置。位于相匹配位置的两个对应区域的图形一致,大小相同,有利于提高待识别图像的格式类型的准确度。其中,对应区域可以是规则区域,也可以不规则区域。

示例性的,参见图2,图2是本发明实施例一提供的预设兴趣区域的示意图。图2中图像中心区域C位置以待检测图像的中心线为轴线设置,中心线将待检测图像划分为左侧图像和右侧图像,在上述两部分图像中包含位置匹配的三组对应区域,且对应区域形状、大小相同,且相对于各部分图像的位置相同。需要说明的是,图2仅是一个预设兴趣区域的一种选择实例,本实施例中,预设兴趣区域的数量和位置可随机选择,或者根据待识别图像尺寸等设置。

本实施例中,预设兴趣区域包括多组对应区域,避免了单一对应区域检测图像时导致的数据单一,识别误差大的问题。预设兴趣区域包括图像中心区域,不同格式类型的图像中心区域存在明显差异,是识别图像类型的一个重要因素。其中,2D图像的图像中心区域为连续图像,图像中心区域的像素值变化差异较小;SBS格式图像中心区域为两个图像边缘的组合,图像中心区域的像素值变化差异较大。本实施例中,将图像中心区域确定为一个预设兴趣区域,增加了只图像格式识别的依据,提高了图像格式识别的准确度和可靠性。

S120、提取预设兴趣区域的特征参数。

其中,特征参数用于表征预设兴趣区域的图像特征。可选的,特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。

可选的,上述各特征参数基于YUV通道计算。

区域基调特征由各预设兴趣区域的像素平均值表示,示例性的,参见图2,各预设兴趣区域的区域基调特征可根据如下公式(1)实现:

其中,Il、Ir和Ic分别为图2中对应预设兴趣区域的各像素点的像素值,l表示左侧区域,r表示右侧区域,c表示图像中心区域,#用于表示各对应预设兴趣区域的各像素点数量。

区域基调差异特征可根据位置匹配的对应区域的像素平均值之差的绝对值确定,其中,对应区域可以是左右对应区域,还可以是上下对应区域。在一个实施例中,区域基调差异特征可以是左右区域基调差异特征,示例性的,参见图2,对应区域的基调差异特征可根据如下公式(2)实现:

|mean(Il)-mean(Ir)| (2)

区域色彩差异特征由任意两个预设兴趣区域的直方图之差的绝对值表示。示例性的,参见图2,各预设兴趣区域的色彩差异特征可根据如下公式(3)实现:

∑|hist(Il)-hist(Ir)|,∑|hist(Il)-hist(Ic)|,∑|hist(Ir)-hist(Ic)| (3)

其中,hist()是图像直方图计算函数。

区域一致性特征可由各预设兴趣区域的梯度绝对值的平均值表示。示例性的,参见图2,各预设兴趣区域的一致性特征可根据如下公式(4)实现:

mean(|grad(Il)|),mean(|grad(Ir)|),mean(|grad(Ic)|) (4)

本实施例中,提取预设兴趣区域的多种特征参数,避免了根据单一特征识别图像导致识别误差大的问题。

S130、将特征参数输入至少一个具有图像识别功能的机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型。

其中,机器学习模型可根据图像特征参数识别图像的格式类型,机器学习模型可以是一个或多个。示例性的,机器学习模型可以是经过训练的分类器或者神经网络,可选的,机器学习模型为级联机器学习模型。示例性的,机器学习模型包括但不限于Adaboost和Random Forest。本实施例中,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。

需要说明的是,SBS格式图像还可以包括上下格式图像或者上2D图下深度图格式图像,可根据本发明实施例提供的图像格式识别方法识别。

可选的,在步骤S130之后,可根据格式类型,将待识别图像以对应的显示策略进行图像显示。

本实施例的技术方案,通过获取待识别图像的多个预设兴趣区域,提取了图像中心区域和至少两个对应区域的特征参数,将该特征参数输入至少一个机器学习模型,并根据机器学习模型的输出结果确定待识别图像的格式类型,解决了手动输入格式类型耗费人力与时间,或者文件头标识不统一无法准确识别图像格式的问题,实现了根据图像参数自动识别图像格式类型,提高了图像格式类型的识别效率和准确度。

实施例二

图3A是本发明实施例二提供的一种图像格式识别方法的流程图,在上述实施例一的基础上,进一步的提供了将特征参数输入至少一个机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型的方法。相应的,该方法具体包括:

S210、获取待识别图像的至少三个预设兴趣区域。

其中,所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配。

S220、提取预设兴趣区域的特征参数。

S230、根据特征参数确定待识别图像是否包括深度图。

本实施例中,机器学习模型包括第一识别模型和第二识别模型。其中,第一识别模型基于深度图的像素灰度值特征识别图像中是否包括深度图。深度图为灰度图像,U通道与V通道的输出值均接近128。可选的,通过检测待识别图像右侧区域U通道和V通道的最大值和最小值的差值是否小于第一预设值,若是,则确定待识别图像包含深度图。可选的,通过检测待识别图像右侧区域U通道和V通道的区域一致性特征是否小于第二预设参数,若是,则确定待识别图像包含深度图。可选的,通过检测待识别图像右侧区域U通道和V通道的最大值和最小值分别与数值128的差值的绝对值是否小于第三预设值,若是,则确定待识别图像包含深度图,避免了待识别图像中包含大量纯色的非灰度图像,导致识别错误的情况。其中,第一预设值、第二预设值和第三预设值可根据图像识别精度需求或者历史识别结果确定。

本实施例中,第一识别模型可以是决策树,也可以是Adaboost分类器,其中,Adaboost分类器的级数可根据第一识别模型的识别精度和计算速度确定。

S240、根据特征参数确定待识别图像是否是独立的二维图像。

本实施例中,第二识别模型例如可以是Adaboost分类器,可选的,采用单层决策树作为弱分类器。其中,Adaboost分类器的级数可根据第二识别模型的识别精度和计算速度确定。

单独的二维图像指的是待识别图像为一个完整的2D图像,而不是由两个图像组合而成。

S250、根据深度图识别结果和/或二维图像的识别结果确定待识别图像的格式类型。

本实施例中,根据两个机器学习模型的分类结果确定待识别图像的格式类型。本实施例中,将特征参数输入两个机器学习模型,并根据两个机器学习模型的输出结果综合确定待识别图像的格式类型。可选的,根据两个机器学习模型的输出结果综合确定待识别图像的格式类型包括:待识别图像包括深度图,则确定待识别图像的格式类型为二维图与深度图组合格式;若待识别图像是独立的二维图像,则确定待识别图像的格式类型为二维图像格式;若待识别图像不包括深度图,且待识别图像不是独立的二维图像,则确定待识别图像的格式类型为左右图像格式。

本实施例中,通过两个机器学习模型确定待识别图像的格式类型,相对于一个机器学习模型,简化了机器学习模型的复杂度,降低了机器学习模型的成本,提高了图像格式识别速度。

本实施例的技术方案,通过第一识别模型根据特征参数确定待识别图像是否包括深度图,第二识别模型根据特征参数确定待识别图像是否是独立的二维图像,并根据两个机器学习模型的输出结果确定待识别图像的格式类型,简化了机器学习模型的复杂度,实现了快速自动识别图像格式。

在上述实施例的基础上,需要说明的是,不限定步骤S240和步骤S230的执行顺序,可以是同步执行,还可以是先执行步骤S240和步骤S230中的任意一个。示例性的,先判断所述待识别图像是否包括深度图,再根据深度图的识别结果,进一步确定所述待识别图像是否是独立的二维图像。参见图3B,图3B是本发明实施例二提供的一种图像格式识别方法的流程图。

S310、获取待识别图像的至少三个预设兴趣区域。

S320、提取预设兴趣区域的特征参数。

S330、根据特征参数确定待识别图像是否包括深度图,若是,则执行步骤S340,若否,则执行步骤S350。

S340、确定待识别图像的格式为二维图与深度图的组合格式,并停止对该待识别图像的识别。

S350、根据特征参数确定待识别图像是否是独立的二维图像,若是,则执行步骤S360,若否,则执行步骤S370。

S360、确定待识别图像的格式为二维图像格式。

S370、确定待识别图像为左右图像格式。

实施例三

图4是本发明实施例三提供的一种图像格式识别方法的流程图,在上述实施例的基础上,进一步的增加了机器学习模型的训练方法。相应的,该方法具体包括:

S410、建立至少一个待训练的机器学习模型。

S420、根据预设训练样本集对待训练的机器学习模型进行训练,并根据训练结果对待训练的机器学习模型进行优化,生成机器学习模型。

示例性的,若机器学习模型为一个,则预设训练样本集包括:二维图与深度图组合格式图像、二维图像格式图像和左右图像格式图像;若机器学习模型为两个,则第一识别模型的预设训练样本集包括二维图与深度图组合格式图像,第二识别模型的预设训练样本集包括二维图像格式图像和左右图像格式图像。

本实施例中,机器学习模型可以是分类器,示例性的,以Adaboost分类器为例介绍机器学习模型的训练过程。需要说明的是,Adaboost分类器仅是一个可选择实例,可根据不同的用户需求选择不同的分类器。

机器学习模型为M级Adaboost分类器,设置样本数量为N的样本空间S={(x1,y1),...,(xn,yn)},其中,xi为第i各样本的特征值向量,yi为第i个样本的分类结果,本实施例中,yi可以是+1和-1,wi为第i个样本的权重。

设置第K(K≤M)阶弱分类器为hk(X),并设置K阶弱分类器合并所得强分类器为样本初始权重为wi=1/N,i=1...N。

对于Adaboost分类器各若分类器的误差为:

或者

其中,ε为一个较小值。

根据上述误差更新Adaboost分类器中各样本权重:

并对上述样本权重进行归一化处理,使得∑wi(K+1)=1。本实施例中,可选的,将单层决策树或者决策树作为Adaboost分类器的若分类器。

可选的,机器学习模型为级联机器学习模型。示例性的,机器学习模型可以是30级,其中,机器学习模型中级数越高,其输出结果的精度越高,30级仅是一个实施例中的机器学习模型的示例,对此不做限定。示例性的,参见图5和图6,图5是本发明实施例三提供的Adaboost训练识别误差逐级降低示意图,图6是本发明实施例三提供的Adaboost验证识别误差逐级降低示意图。

S430、获取待识别图像的至少三个预设兴趣区域。

其中,所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配。

S440、提取预设兴趣区域的特征参数。

S450、将特征参数输入至少一个具有图像识别功能的机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型。

本实施例的技术方案,通过建立练至少一个机器学习模型,通过学习训练使得该机器学习模型具有识别图像格式的能力,能够自动识别输入的待识别图像的格式类型,解决了人为干预图像格式识别的问题,实现了图像格式识别的自动化与智能化,提高了识别准确率和效率。

实施例四

图7是本发明实施例四提供的一种图像格式识别装置的结构示意图,该装置具体包括:

兴趣区域获取模块510,用于获取待识别图像的至少三个预设兴趣区域,其中,所述预设兴趣区域包括图像中心区域和至少两个对应区域,所述至少两个对应区域的位置信息基于所述图像中心区域相匹配。

特征参数提取模块520,用于提取预设兴趣区域的特征参数。

图像格式识别模块530,用于将特征参数输入至少一个具有图像识别功能的机器学习模型,根据机器学习模型的输出结果确定待识别图像的格式类型。

可选的,预设兴趣区域包括图像中心区域和至少两个对应区域,至少两个对应区域的位置信息基于图像中心区域相匹配。

可选的,特征参数包括如下至少一项:区域基调特征、区域色彩差异特征、区域基调差异特征和区域一致性特征。

可选的,机器学习模型为两个,图像格式识别模块530包括:

第一识别模型,用于根据特征参数确定待识别图像是否包括深度图;

第二识别模型,用于根据特征参数确定待识别图像是否是独立的二维图像;

识别结果确定单元,用于根据第一识别模型和/或第二识别模型的识别结果确定待识别图像的格式类型。

可选的,识别结果确定单元具体用于:

待识别图像包括深度图,则确定待识别图像的格式类型为二维图与深度图组合格式;

若待识别图像是独立的二维图像,则确定待识别图像的格式类型为二维图像格式;

若待识别图像不包括深度图,且待识别图像不是独立的二维图像,则确定待识别图像的格式类型为左右图像格式。

可选的,装置还包括:

模型建立模块,用于在获取待识别图像之前,建立至少一个待训练的机器学习模型;

模型训练模块,用于根据预设训练样本集对待训练的机器学习模型进行训练,并根据训练结果对待训练的机器学习模型进行优化,生成机器学习模型。

本发明实施例提供的图像格式识别装置可执行本发明任意实施例所提供的图像格式识别方法,具备执行图像格式识别方法相应的功能模块和有益效果。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1