一种图像识别方法和装置与流程

文档序号：14474691阅读：129来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及图像处理领域，尤其是涉及到一种图像识别方法和装置。

背景技术：

随着科技的飞速发展，图像识别技术越来越成熟，目前在很多领域都能应用到图像识别技术，例如，对人脸图像进行识别验证，或者对用户的签名字迹进行验证等都应用到了图像识别技术。

现在的图像识别技术，一般都是将采集到的图像与预先存储的图像进行像素的比对，根据比对后两张图像的相似度进行识别验证。当相似度超过预定数值时，确定采集到的图像识别成功，当相似度小于预定数值时，判定采集到的图像识别失败。

但是，目前的图像识别只是针对图像和特征来进行识别，在很多情况下，图像发生了轻微改变，而图像内容没有变化。此时利用目前的图像识别技术，就会出现识别错误的问题。

技术实现要素：

本发明实施例提供了一种图像识别方法和装置，解决了目前的图像识别技术在图像发生轻微改变时，容易产生识别错误的问题。

依据本申请的第一方面，提供了一种图像识别方法，所述方法包括：

获取待处理图像信息；

将所述待处理图像信息的尺寸处理为预定尺寸；

对预定尺寸的待处理图像信息进行模数转化；

利用预设图像识别模型，对模数转化后的待处理图像信息进行识别验证，所述预设图像识别模型是预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的。

依据本申请的第二方面，提供了一种图像识别装置，所述装置包括：

获取单元，用于获取待处理图像信息；

处理单元，用于将所述待处理图像信息的尺寸处理为预定尺寸；

转化单元，用于对预定尺寸的待处理图像信息进行模数转化；

识别验证单元，用于利用预设图像识别模型，对模数转化后的待处理图像信息进行识别验证，所述预设图像识别模型是预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的。

依据本申请的第三方面，提供了一种存储设备，其上存储有计算机程序，所述程序被处理器执行时实现第一方面所述的图像识别方法。

依据本申请的第四方面，提供了一种图像识别装置，所述装置包括存储设备和处理器，

所述存储设备，用于存储计算机程序；

所述处理器，用于执行所述计算机程序以实现第一方面所述的图像识别方法。

借由上述技术方案，本申请提供的一种图像识别方法和装置，为了方便对图像的统一处理，先将获取到的图像的尺寸处理为预定尺寸，并根据图像中每个像素的色彩对应的数字，对该图像进行模数转化，转化成一串数字序列，然后将该数字序列输入到预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的预设图像识别模型中，进行识别验证，确定该图像中的内容。通过上述方案，即使图像内容发生了轻微改变，利用预设图像识别模型也能够进行准确的识别，有效提高了图像识别的准确率。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本申请的图像识别方法的一个实施例的流程图；

图2为本申请中的训练图像的示意图；

图3为拆分出来的图像片段的示意图；

图4为图像的数字序列输入图像训练模型后的示意图；

图5为识别界面中的一个实例示意图；

图6为识别界面中的一个操作实例示意图；

图7为识别界面中的另一个操作实例示意图；

图8为本申请的图像识别装置的一个实施例的结构框图；

图9为本申请的图像识别装置的实体的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例提供了一种图像识别方法和装置，能够利用预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的预设图像识别模型，来识别图像中的内容，这样即使图像发生轻微变化，也能够对图像进行准确的识别。

如图1所示，本申请实施例的图像识别方法包括：

步骤101，获取待处理图像信息。

步骤102，将待处理图像信息的尺寸处理为预定尺寸。

步骤103，对预定尺寸的待处理图像信息进行模数转化。

步骤104，利用预设图像识别模型，对模数转化后的待处理图像信息进行识别验证。

其中，预设图像识别模型是预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的。

在上述技术方案中，由于获取的待处理图像信息的尺寸是各种各样的，这样不方便处理，因此需要将待处理图像信息的尺寸处理为预定尺寸(例如，预定尺寸为18*18)。预设图像识别模型无法直接对待处理图像信息进行识别，需要将待处理图像信息进行模数转化，将每个像素所对应的色彩转化成相应的数字，将这些数字组合成一串数字序列。然后利用预设图像识别模型对这一串数字序列进行识别，确定该待处理图像信息中的图像内容。其中，利用不同形状、不同角度、不同光线(即不同变化状态)，但具有相同图像内容的图像信息对预设图像识别模型进行学习训练，预设图像识别模型经过若干的图像内容训练后，能够准确的识别出获取到的各个图像中的内容。这样即使图像发生轻微变化，也能够准确的识别出图像中的内容。

在具体实施例中，在步骤104之前，方法还包括：

步骤1041，采集不同的样本图像信息。

步骤1042，将样本图像信息进行分组，得到的分组中包含相同图像内容且不同变化状态的待训练图像信息。

步骤1043，将待训练图像信息的尺寸处理为预定尺寸。

步骤1044，对预定尺寸的待训练图像信息进行模数转化。

步骤1045，将模数转化后的待训练图像信息输入到图像训练模型中进行学习训练，得到预设图像识别模型。

在上述技术方案中，需要将大量的样本图像信息按照图像内容进行分组，将所有具有相同的内容的图像都归为一组，并将该组与对应的图像内容关联在一起，这样就得到了多组待训练图像信息。其中，可以样本图像信息内容中的数字、文字、符号，或者代表的动物、植物、物品种类等，对样本图像信息进行分组。

将这多组待训练图像信息进行尺寸处理以及模数转换处理之后，依次利用各组待训练图像信息对图像训练模型进行训练，使得到的预设图像识别模型能够识别各个图像的内容。

在具体实施例中，若预设图像识别模型对待处理图像信息识别验证错误，则方法还包括：

步骤105，接收识别验证错误的待处理图像信息对应的纠正结果。其中，该纠正结果为用户手动输入的待处理图像信息对应的正确内容。

步骤106，根据纠正结果，将识别验证错误的待处理图像信息作为待训练图像信息，对预设图像识别模型进行重新学习训练，得到新的图像识别模型。

具体的，从预设图像识别模型中搜索该纠正结果对应的分组，若有对应的分组，则将待训练图像信息放入该组中，并进行训练，若没有对应的分组，则根据该纠正结果重新建立分组，将待训练图像信息放入新建的分组中，并进行训练。

步骤107，利用新的图像识别模型，对后续的待处理图像信息进行识别验证。

在上述技术方案中，有的待处理图像信息预设图像识别模型会识别错误，针对这种情况，为了进一步提高预设图像识别模型的识别率，需要利用该识别错误的待处理图像信息对预设图像识别模型进行训练。通过这种方式，每当遇到识别错误的图像时，预设图像识别模型都要利用该图像进行训练，这样就会使预设图像识别模型的识别率越来越高。

在具体实施例中，步骤1045具体包括：

步骤10451，确定模数转化后的不同待训练图像信息分别对应的分组。

步骤10452，按照确定的分组，将模数转化后的不同待训练图像信息分别输入到图像训练模型中进行学习训练，得到包含不同分组的预设图像识别模型。

步骤104具体包括：

按照预设图像识别模型中与模数转化后的待处理图像信息对应的分组，将模数转化后的待处理图像信息输入到预设图像识别模型进行识别验证。

在上述技术方案中，图像训练模型能够按照不同的分组，根据待训练图像信息进行训练，使得训练后的预设图像识别模型，能够对不同的图像进行识别验证，进而识别出图像中的内容。

例如，将多个手写的数字“1”的图像都归为数字“1”这一组，利用这一组的图像对图像训练模型进行训练后，得到预设图像识别模型具有能够识别手写“1”的功能。当用户输入自己手写的“1”字图像时，预设图像识别模型将该“1”字图像与预先训练的所有“1”字图像进行比对识别。进而判断出用户自己手写的图像的内容是“1”。

在具体实施例中，步骤104具体还包括：

步骤104’，预设图像识别模型将模数转化后的待处理图像信息中的各项数字依次进行验证。

步骤104”，将各项数字的验证结果进行结合，确定待处理图像信息对应的识别验证结果。

在上述技术方案中，经过模数转化后的待处理图像信息是一串数字序列，预设图像识别模型会对该数字序列中的每项数字都进行验证，例如，判断该数字序列属于某项内容的概率，然后将各项数字得到的概率进行累加，进而确定该待处理图像信息是否属于某项内容。

在具体实施例中，步骤101具体包括：

步骤1011，获取摄像头拍摄的待处理图像信息，或从图库中调取待处理图像信息。

步骤1012，提取待处理图像信息中的图像特征。

步骤1013，按照图像特征对待处理图像信息进行拆分，其中，拆分后的待处理图像信息的数量与图像特征的数量相同。

则步骤102具体包括：

将拆分后的待处理图像信息的尺寸处理为预定尺寸。

例如，用户在纸上写了多个数字“1”“3”“6”，用户可以选择用摄像机拍摄后放入图库中，然后再从图库中调取该图像，也可以直接打开摄像头直接获取该图像。然后提取图像中“非白色”的图像特征，即“1”“3”“6”对应的图像特征，进而得到三个图像特征。将带有该三个图像特征的图像拆分出来，得到三个图像片段。这样就可以利用预定图像识别模型分别对这三个图像片段进行识别，判断出图像中的内容是数字“1”“3”“6”，并将“1”“3”“6”呈现给用户。

通过上述技术方案，能够利用预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的预设图像识别模型，来识别图像中的内容，这样即使图像发生轻微变化，也能够对图像进行准确的识别。

依据本申请的另一个实施例，提出了一种图像识别方法，具体为：

为了使训练得到的预定图像识别模型能够更好的对图像进行识别，需要利用大量的图像数据来对图像训练模型进行训练，才能出现相应的效果。

例如，采集大量“8”的手写图像(如图2所示)对图像训练模型进行训练，过程包括：

对写有“8”的图像进行筛选甄别，然后将图像中的每个具有“8”的图像拆分出来，拆分成多个同样大小比例的图片。

首先将这些“8”的图片进行尺寸处理，处理成固定比例尺寸18*18的图片。然后在根据这些图片中每个像素对应的色彩，转化成一串数字的序列(对于图像训练模型来说，图片就是一串代表每个像素颜色的数字)，将图3中的图片转化成代表图3中每个像素颜色的数字，具体为：

215,161,108,108,194,247,247,247,240,240,240,240,255,255,255,255,215,161,215,108,55,55,89,194,247,247,181,181,240,240,255,255,255,255,215,108,215,108,108,161,89,89,194,194,65,65,123,240,255,255,255,255,215,108,215,108,108,215,194,89,89,89,65,123,65,123,239,255,255,255,215,108,245,140,88,192,222,156,24,24,123,222,123,73,196,253,253,253,245,140,245,192,88,192,222,222,90,24,172,222,172,73,139,253,253,253,245,192,245,192,88,140,222,222,90,24,123,222,222,123,83,196,253,253,245,192,245,245,88,88,222,222,90,24,73,222,222,172,83,196,253,253,245,245,247,247,135,80,191,191,67,67,40,152,207,207,88,143,255,255,247,247,247,247,191,80,129,129,67,129,96,96,152,96,88,143,255,255,247,247,247,247,247,135,67,67,129,191,152,40,96,40,88,199,255,255,247,247,247,247,247,247,191,129,191,253,207,96,96,152,199,255,255,255,247,247,255,255,255,255,249,247,255,255,245,130,73,188,255,255,255,255,255,255,255,255,255,255,255,255,255,255,245,188,73,130,221,255,255,255,255,255,255,255,255,255,255,255,255,255,245,245,130,73,188,255,255,255,255,255,255,255,255,255,255,255,255,255,245,245,188,73,155,255,255,255,255,255,215,161,108,108,194,247,247,247,240,240,240,240,255,255,255,255,215,161,215,108,55,55,89,194,247,247,181,181,240,240,255,255,255,255,215,108,

然后，如图4所示，将这一串数字序列输入到图像训练模型中，利用图像训练模型将这些数字转化为更加统一和容易识别的代码，根据代码输出识别结果，即近似“8”或不近似“8”。进而训练出预定图像识别模型。

这样，在利用预定图像识别模型进行图像识别时，就可以根据多种不同的输出，把需要识别的图像进行分组，进而根据该组对应的图像内容来识别图像。

本申请的预定图像识别模型能够快速的同时对几百个图像节点进行运算，并识别各个图像节点对应的图像内容。该预定图像识别模型可以设置在手机、电脑、平板、笔记本等终端设备上。

又如：用户打开预定图像识别模型的识别界面，点击识别界面中的“相机”按钮，将终端的相机切换至前置摄像头(其中预定图像识别模型开启时，会将摄像头默认为后置摄像头)。将图像移动至前置摄像头的可视区域，并利用前置摄像头对该图像进行获取。

预定图像识别模型对该获取的图像进行快速识别时，对该获取的图像中的数字识别错误。此时证明该预定图像识别模型还不够完善，需要利用该获取的图像进行进一步的训练。

具体训练过程为：

例如，如图5-7所示，首先点击预定图像识别模型中的“显示”按钮，打开训练界面，在对应该获取的图像的识别结果中手动改为正确的数字“4”，然后点击“修改添加”按钮，将该获取的图像以及对应的正确识别结果均添加至预定图像识别模型中。最后，点击“更新配置文件”按钮，对预定图像识别模型进行更新，更新完成后，点击“关闭”按钮，关闭训练界面，重新进入识别界面。这样更新后的预定图像识别模型会对训练结果进行记录，进而提高预定图像识别模型对数字“4”的识别效率。

通过上述技术方案，能够通过移动设备的摄像头来获取图像，并利用获取的图像对预定图像识别模型进行进一步的训练，从中获取到图像的识别信息，并将这些识别信息建立成识别信息数据库。进而将该识别信息数据库应用到各个领域的图像识别中。

进一步的，作为图1方法的具体实现，本申请实施例提供了一种图像识别装置，如图5所示，该装置包括：获取单元21、处理单元22、转化单元23和识别验证单元24。

获取单元21，用于获取待处理图像信息；

处理单元22，用于将待处理图像信息的尺寸处理为预定尺寸；

转化单元23，用于对预定尺寸的待处理图像信息进行模数转化；

识别验证单元24，用于利用预设图像识别模型，对模数转化后的待处理图像信息进行识别验证，预设图像识别模型是预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的。

在具体实施例中，装置还包括：

采集单元，用于采集不同的样本图像信息；

分组单元，用于将样本图像信息进行分组，得到的分组中包含相同图像内容且不同变化状态的待训练图像信息；

处理单元22，还用于将待训练图像信息的尺寸处理为预定尺寸；

转化单元23，还用于对预定尺寸的待训练图像信息进行模数转化；

训练单元，用于将模数转化后的待训练图像信息输入到图像训练模型中进行学习训练，得到预设图像识别模型。

在具体实施例中，若预设图像识别模型对待处理图像信息识别验证错误，则装置还包括纠正单元，

纠正单元，用于接收识别验证错误的待处理图像信息对应的纠正结果；

训练单元，用于根据纠正结果，将识别验证错误的待处理图像信息作为待训练图像信息，对预设图像识别模型进行重新学习训练，得到新的图像识别模型；

识别验证单元24，用于利用新的图像识别模型，对后续的待处理图像信息进行识别验证。

在具体实施例中，训练单元具体包括：

分组模块，用于确定模数转化后的不同待训练图像信息分别对应的分组；

训练模块，用于按照确定的分组，将模数转化后的不同待训练图像信息分别输入到图像训练模型中进行学习训练，得到包含不同分组的预设图像识别模型；

识别验证单元24，还用于按照预设图像识别模型中与模数转化后的待处理图像信息对应的分组，将模数转化后的待处理图像信息输入到预设图像识别模型进行识别验证。

在具体实施例中，识别验证单元24具体包括：

数字验证模块，用于预设图像识别模型将模数转化后的待处理图像信息中的各项数字依次进行验证；

确定模块，用于将各项数字的验证结果进行结合，确定待处理图像信息对应的识别验证结果。

在具体实施例中，获取单元21具体包括：

获取模块，用于获取摄像头拍摄的待处理图像信息，或从图库中调取待处理图像信息；

提取模块，用于提取待处理图像信息中的图像特征；

拆分模块，用于按照图像特征对待处理图像信息进行拆分，其中，拆分后的待处理图像信息的数量与图像特征的数量相同；

处理单元22，还用于将拆分后的待处理图像信息的尺寸处理为预定尺寸。

基于上述图1所示方法，相应的，本申请实施例还提供了一种存储设备，其上存储有计算机程序，程序被处理器执行时实现图1所示方法对应的步骤。

基于上述图1所示方法和图8所示装置的实施例，本申请实施例还提供了一种图像识别装置，如图9所示，包括存储设备32和处理器31，其中存储设备32和处理器31均设置在总线33上。

存储设备32，用于存储计算机程序；

处理器31，用于执行计算机程序以实现图1所示方法对应的步骤。

通过本申请的上述技术方案，能够利用预先通过相同图像内容且不同变化状态的图像信息进行学习训练得到的预设图像识别模型，来识别图像中的内容，这样即使图像发生轻微变化，也能够对图像进行准确的识别，有效提高了图像识别的准确率。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本申请可以通过硬件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是cd-rom，u盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施场景所述的方法。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本申请所必须的。

本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述，不代表实施场景的优劣。

以上公开的仅为本申请的几个具体实施场景，但是，本申请并非局限于此，任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张彬
技术所有人：深圳市大熊动漫文化有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。