类神经网络辨识效能提升方法及其相关辨识效能提升装置与流程

文档序号：20919755发布日期：2020-05-29 13:59阅读：352来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

类神经网络辨识效能提升方法及其相关辨识效能提升装置与流程

本发明涉及一种图像辨识方法与其装置，特别是有关一种应用在图像辨识的类神经网络辨识效能提升方法及类神经网络辨识效能提升装置。

背景技术：

以类神经网络演算为基础的传统图像辨识技术直接使用原始监控图像作为输入信息。原始监控图像内含的信息量庞大，大幅限制图像辨识效能的提升；即便从原始监控图像选取小范围的特定图像进行图像辨识，试图通过减少信息量来提高运算效能，小范围特定图像内的待测对象仍会受周围复杂环境背景影响，无法快速精确地得到所需辨识结果。因此，如何设计一种有助于改善类神经网络辨识效能提升的方法，即为相关监控产业的重点发展课题之一。

技术实现要素：

本发明涉及一种应用在图像辨识的类神经网络辨识效能提升方法及类神经网络辨识效能提升装置，以解决上述之问题。

本发明进一步公开一种类神经网络辨识效能提升方法，其包括分析输入图像以取得前景信息，利用该前景信息生成前景屏蔽，以及该输入图像经由该前景屏蔽转换为输出图像。该输出图像作为类神经网络辨识的导入数据，以提升对象辨识效能。

本发明进一步公开一种类神经网络辨识效能提升装置，其包括图像产生器以及运算处理器。该图像产生器用来取得输入图像。该运算处理器电连接该图像产生器。该运算处理器用来分析该输入图像以取得前景信息，利用该前景信息生成前景屏蔽，以及该输入图像经由该前景屏蔽转换为输出图像，可有效改善类神经网络算法在复杂环境下的对象辨识效能。该输出图像作为类神经网络辨识的导入数据以提升对象辨识效能。

本发明的类神经网络辨识效能提升方法及其装置先从输入图像分离出前景信息，按照前景信息的像素值分布定义出前景屏蔽，输入图像经前景屏蔽的转换能有效过滤掉非必要信息，所生成输出信息作为类神经网络辨识的导入数据可提高类神经网络辨识准确度。输入图像不限于rgb、yuv、hsl或hsv等色彩模式。输入图像及其转换所得前景信息、前景屏蔽与输出图像属各像素值的运算，故皆具有实质相同的图像尺寸。此外，输出图像的像素灰阶值可选择性局限在特定范围内，目的在于减少类神经网络辨识效能提升装置所需的储存容量，进一步有效地处理大容量图像信息。

附图说明

图1为本发明实施例的类神经网络辨识效能提升装置的功能方块图。

图2为本发明实施例的类神经网络辨识效能提升方法的流程图。

图3至图6分别为本发明实施例的输入图像在不同转换阶段的示意图。

图7为本发明实施例的生成前景屏蔽的流程图。

图8为本发明实施例的前景信息直方图的示意图。

图9为本发明实施例的用在解析前景屏蔽的像素分布类型的示意图。

其中，附图标记说明如下：

10类神经网络辨识效能提升装置

12图像产生器

14运算处理器

i监控画面

i1输入图像

i2前景信息

i3前景屏蔽

i4输出图像

h前景信息的直方图

h1第一直方模型

h2第二直方模型

s1第一群

s2第二群

步骤s200、s202、s204、s206、s208、s210

步骤s700、s702、s704、s706、s708、s710、s712、s714、s716

具体实施方式

请参阅图1，图1为本发明实施例的类神经网络辨识效能提升装置10的功能方块图。类神经网络辨识效能提升装置10可包括电连接在一起的图像产生器12以及运算处理器14。图像产生器12用来取得输入图像i1。图像产生器12可为图像获取器，直接取得监控范围的图像信息作为输入图像i1；或者，图像产生器12还可为图像接收器，以有线或无线方式接收外部图像获取器所生图像信息当成输入图像i1。输入图像i1主要用在以类神经网络(convolutionalneutralnetworks,cnn)为基础的对象辨识技术；因此，运算处理器14执行一套类神经网络辨识效能提升方法，可有效改善类神经网络算法在复杂环境下的对象辨识效能。

请参阅图2至图6，图2为本发明实施例的类神经网络辨识效能提升方法的流程图，图3至图6分别为本发明实施例的输入图像i1在不同转换阶段的示意图。图2所述类神经网络辨识效能提升方法适用在图1所示类神经网络辨识效能提升装置10。首先，执行步骤s200与步骤s202，取得关联于监控范围的监控画面i，并利用对象侦测技术在监控画面i选定输入图像i1的范围。图3所示实施态样在监控画面i内选定一个小范围的输入图像i1，然实际应用不限于此；例如可将监控画面i全幅皆当成输入图像i1。接着，执行步骤s204与步骤s206，产生输入图像i1的背景信息，计算输入图像i1与背景信息的差异而取得前景信息i2。输入图像i1可通过高斯混合模型(mixtureofgaussians,mog)或以类神经网络算法为基础的背景差分(backgroundsubtraction)建立背景信息，或由其它任意算法取得背景信息。

步骤s204与s206分析输入图像i1以取得前景信息i2。前述的先取得背景信息、再计算输入图像i1与背景信息的差值仅为前景信息i2的多种取得方式之一，实际应用当不限于此。接下来，执行步骤s208与步骤s210，利用前景信息i2生成前景屏蔽i3，再通过前景屏蔽i3将输入图像i1转换为输出图像i4。如监控画面i获取自复杂环境，例如交通繁忙的道路或人车混杂的路口，即便从监控画面i划出小范围的输入图像i1，输入图像i1仍会涵盖许多影响侦测准确度的背景图案。本发明通过前景信息i2过滤掉输入图像i1的背景对象，如图6所示输出图像i4的背景对象已被抹去，因此输出图像i4作为类神经网络辨识的导入数据，能减少复杂环境下的背景对象干扰，有效提升对象辨识效能及侦测准确度。

请参阅图3至图8，图7为本发明实施例的生成前景屏蔽i3的流程图，图8为本发明实施例的转换自前景信息i2的直方图h的示意图。首先，执行步骤s700与步骤s702，计算前景信息i2的直方图h，并且将直方图h依像素值范围划分为多个群；例如划分成第一群s1与第二群s2，其中第一群s1的像素值范围小在第二群s2的像素值范围。再来执行步骤s704，将第二群s2的像素数量相比于预定参数。预定参数可依统计数据而定，例如根据监控画面i所处环境决定、或设定第二群s2与第一群s1之间像素数量比例来定义预定参数。第二群s2的像素数量大于预定参数，表示输入图像i1内有动态对象；第二群s2的像素数量小于预定参数，尚不确定输入图像i1内对象保持静止或受噪声干扰。

若第二群s2的像素数量大于预定参数，表示输入图像i1与背景信息之间有明显变化，执行步骤s706，设定前景门槛；举例来说，前景门槛可为直方图h所有像素均值的百分之四十。前景门槛的百分比不限于此数值，端视设计需求而定。然后，执行步骤s708，前景信息i2内其像素值高于前景门槛的像素归类为第一组像素，低于前景门槛的像素归类为第二组像素。接着执行步骤s710，将前景屏蔽i3内其位置对应于第一组像素及第二组像素的像素值分别设为第一数值与第二数值，生成前景屏蔽i3。举例来说，第一数值可为1，如图5所示的前景屏蔽i3的无网格区域，并且第二数值可为0，如图5所示的前景屏蔽i3的网格区域。

若第二群s2的像素数量小于预定参数，输入图像i1与背景信息之间变化不大，执行步骤s712，判断第一群s1是否符合特定条件。特定条件指第一群s1具有较多数量的像素，实际数目应视所处环境及统计数据而定。如第一群s1符合特定条件，表示直方图h里像素分布集中在低档范围，视为输入图像i1内的对象保持静止，执行步骤s714，前景屏蔽i3内所有像素的像素值设为第一数值；第一数值为1时，该张输入图像i1可直接当成输出图像i4，作为类神经网络辨识的导入数据。如第一群s1不符合特定条件，表示直方图h里像素分布散乱，解读为输入图像i1受到噪声干扰，执行步骤s716，前景屏蔽i3内所有像素的像素值设为第二数值；第二数值为0时，直接舍弃该张输入图像i1。

步骤s210中，输入图像i1经由前景屏蔽i3转换为输出图像i4，可选择直接计算输入图像i1的所有像素值分别与前景屏蔽i3的对应像素值的乘积，所得乘积即为输出图像i4的各像素值；或者，计算出输入图像i1所有像素值分别与前景屏蔽i3对应像素值的乘积之后，可进一步从该些乘积筛选出其位置对应到前景屏蔽i3内不属于第二数值的像素位置的第一组乘积、以及属于第二数值的像素位置的第二组乘积。第二组乘积可归类为背景，如将其设定成第二数值，输出图像i4里属于第二组乘积的背景像素为黑色，可能会影响输出图像i4内对象的色彩呈现效果，故可将第二组乘积替换为参考值(如图6所示输出图像i4的单斜线区域)，并结合第一组乘积与该些参考值作为输出图像i4的各像素值。举例来说，输出图像i4内待测对象(例如行人)的色彩一般多为黑白信息，如将第二组乘积定为第二数值(黑色)，容易和待测对象图案混淆，故可将第二组乘积选择性设为其它颜色，例如灰色，明确区隔待测对象与背景。

请参阅图7至图9，图9为本发明实施例的用来解析前景屏蔽的像素分布类型的示意图。步骤s704将第二群s2的像素数量相比于预定参数，本发明可进一步预设如图9所示的第一直方模型h1及第二直方模型h2。若前景信息i2的直方图h相似第一直方模型h1，意即第二群s2的像素数量较多(大于预定参数)，可接续执行步骤s708；若第二群s2的像素数量偏少(小于预定参数)，进一步执行步骤s712，判断前景信息i2的直方图h是否相似于第二直方模型h2。如直方图h相似第二直方模型h2，意即符合第一群s1具有较多数量像素的特定条件，执行步骤s714生成相关前景屏蔽i3；如直方图h不同于第二直方模型h2，意即第一群s1的像素数量较少而不符特定条件，执行步骤s716以舍弃此输入图像i1。第一直方模型h1可呈现出预定参数的可视化图形样式，第二直方模型h2可呈现出特定条件的可视化图形样式，然实际样式当不限于前揭实施例。

综上所述，本发明的类神经网络辨识效能提升方法及其装置先从输入图像分离出前景信息，按照前景信息的像素值分布进行分类以定义出不同情境下的前景屏蔽，输入图像经前景屏蔽的转换能有效过滤掉非必要信息，所生成输出信息作为类神经网络辨识的导入数据，即能提高类神经网络辨识准确度。特别一提的是，输入图像不限于rgb、yuv、hsl或hsv等色彩模式。输入图像及其转换所得前景信息、前景屏蔽与输出图像属各像素值的运算转换，故皆具有实质相同的图像尺寸。此外，输出图像的像素灰阶值可选择性限定在0～128的范围内，目的在于减少类神经网络辨识效能提升装置所需的储存容量，进一步有效地处理大容量图像信息；因此前景屏蔽属于二值图，输出图像属于256级或128级灰阶图。相比现有技术，本发明将输入图像的背景噪声滤掉，有助于改善类神经网络辨识的效能提升。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘诚杰;魏家博;王傅民;祁家玮
技术所有人：晶睿通讯股份有限公司
我是此专利的发明人

上一篇：一种多功能纱网门窗的制作方法
上一篇：一种可拆卸纱窗的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。

相关技术

网友询问留言已有0条留言

还没有人留言评论。精彩留言会获得点赞！

1

精彩留言，会给你点赞！

bp神经网络相关技术