一种图像识别方法和系统的制作方法

文档序号：6485575阅读：179来源：国知局

一种图像识别方法和系统的制作方法
【专利摘要】本发明涉及一种图像识别系统和方法。在图像识别客户端识别图像的基本属性，同时将已经识别元素以及前端要识别请求要素组合成识别文件；图像识别控制服务器获取客户端发送的识别文件以及原始图像数据，根据识别内容对将要识别的图像以及要识别的要求，将识别文件以及原始图像数据分发到不同的图像识别服务器上，图像识别服务器根据识别要求对指定图像进行进一步识别。采用本发明所述的方法和系统实现将图像识别过程分级化，从而可有效的利用客户端和服务器的计算资源。
【专利说明】一种图像识别方法和系统
【技术领域】
[0001]本发明属于计算机图像处理、模式识别、移动通信等交叉【技术领域】，具体涉及一种图像识别方法和系统。
【背景技术】
[0002]现有的图像识别一般采用OCR技术，该技术可以有效的分辨出图像中的文字信息，并识别速度较快，占用资源较少，而对图像中的人物等进行识别速度较慢，并占用系统资源的较多。当前利用移动终端对图像数据采集后的处理方式主要有两种，一种是直接子移动终端通过图像识别软件对图像中各种要素进行信息抽取，然后结合采集该图片的相关属性信一块存储到数据库或文件中。另一种方式是将采集的照片直接通过无线网络等方式上传到后台服务器，利用后台服务器高性能的资源对图像实施图像识别。第一种处理方式主要存在的问题是客户端进行图像采集的过程效率较低。由于图像识别软件是个占用系统资源比较高，这样在采集的流程环节，由于在图像识别环节耗时比较大，影响了后面对数据属性相关的采集。第二种处理方式的重点是将图像识别环节放到后台，可以有效提高采集的流程。但这种完全将图像识别环节放到后台方式，势必使得移动终端不能实时的获取部分需要的数据，占用网络资源比较大。即，其首先需要将图片通过网络上传到后台的服务器，同时在后台服务器完成识别工作后，又通过网络将提取后的信息发送到客户端。同时，在这种模式下，还存在的问题就是需要将同该图片关联的信息都要和图片一块发送到后台，这就是需要解决图片和其关联信息的数据同步问题。
[0003]随着移动终端的发展，实时在线数据采集的应用越来越广泛。在数据采集环节中，对图像数据的采集及识别是经常面临的技术问题，同时，由于移动终端的硬件及环境的影响，快速的识别出所采集元素中的各要素为实际中所经常碰到的问题。

【发明内容】

[0004]针对现有技术中存在的缺陷，本发明的目的是提供一种图像识别方法、装置和系统。实现对图像的分层分级识别，利用客户端识别图像的一部分元素，并将识别后的信息以及针对该图片的其它一些采集数据信息按规则XML组合后再打包到文件中，形成新的文件，然后将该新的文件传递到后台控制服务器和后台服务器，由图像识别控制服务器根据要识别的图像特性再分发到不同的识别服务器进行对应的信息识别，从而实现图像信息的分层分阶段获取，可有效的利用客户端的性能。
[0005]为达到以上目的，本发明采用的技术方案是:一种图像识别系统，该图像识别系统包括:至少一个图像识别客户端，图像识别客户端，用于识别图像的基本属性，同时将已经识别元素以及前端要识别请求要素组合成文件；一图像识别控制服务器，获取客户端发送的识别文件以及原始图像数据，根据识别内容对将要识别的图像以及要识别的要求，将识别文件以及原始图像数据分发到不同的图像识别服务器上；至少一个图像识别服务器，根据识别要求对指定图像进行进一步识别。优选地，所述基本属性包括文字和/或数字。[0006]进一步，所述图像识别控制服务器依据图像识别客户端设备的不同，发送不同的策略指令，使得客户端能够完成多级的识别处理。图像识别服务器对于识别完成状态可拉平处理，即不同的客户端完成识别不一样，在图像识别服务器端补全，达成一致的识别效果。
[0007]本发明还提供一种图像识别系统，包括一发送端和一接收端，其特征在于:所述发送端包括:一图像识别单元，用于识别图像的基本属性；一图像文件组合单元，对所述图像识别单元已经识别的图像基本属性进行编码组合，同原始图像进行整合；一文件传输发送单元，将经图像文件组合单元整合后的文件传输至接收端；所述接收端包括，一文件分解单元，将接收到的文件进行分解，分离出原始图像和已经识别的图像基本属性；以及一图像继续识别单元，对原始图像的未识别的信息进行识别。所属基本属性为文字和/或数字。
[0008]更进一步，所述图像文件组合单元对原始图像进行整合进一步包括将所述识别出的图像基本信息以XML格式表示，并重新组合到新的文件中。所述图像文件组合单元进一步将XML文件按字节流方式写入到原始文件的头部形成新的文件，同时在新的文件中标示出XML文件的长度，便于后面的分离操作。所述新的文件包括一文件头，用于存储XML信息，所述文件头由头标志、XML文件长度、XML内容组成。
[0009]本发明还提供一种图像识别的方法，该方法包括:步骤一、对图像的基本属性进行识别；步骤二、对已经识别的图像基本属性进行编码组合，并同原始图像进行整合；步骤三，将整合后的文件传输；步骤四，接收传输的文件，并对接收到的文件进行分解，分离出原始图像和已经识别的图像基本属性；步骤五，对原始图像的未识别的信息进行识别。
[0010]优选地，所述步骤二中对原始图像进行整合的步骤包括:将所述识别出的图像基本信息以XML格式表示，将XML文件格式添加到原始文件头中，形成新的文件。
[0011]进一步，所述步骤五中对接收到的文件进行分解包括:首先，读取XML文件到内存中，其次，计算XM L文件的长度XMLLength ;第三，读取原始图像文件到内存中，并计算原始图像的长度ImageLength ;第四，建立新的内存空间对象大小，该大小为XMLLength+ImageLength+size (unsigned char)+size (int)字节长度,其中size()用于判断数据类型长度；第五，将文件头标志、XML大小、以及XML文件按字节复制到上述新建的内存空间中；第六，将原始图像的所有字节都拷贝到上述新建的内存空间中，该原始图像的数据为追加形式的拷贝，不覆盖文件头标志、XML大小、以及XML文件的数据；第七，将上述新建的内存空间中的数据输出至新的文件。
[0012]更进一步，所述对接收到的文件进行分解的步骤进一步包括:首先，读取文件到内存，其次，判断文件标识是否符合要求，若符合要求则获取XML文件的长度XMLLength ;第三，建立新的XML内存空间，用于存放提取的XML文件，从文件流的flag+size (int)位置开始提取XMLLength长的字节的数据到上述新建的XM L内存空间中，上述flag为文件标识的长度，其中sizeO用于判断数据类型长度；第四，将上述XML内存块中的数据转换成XML格式；第五，建立新的图片内存空间，将接收的文件中剩余部分的字节拷贝到该新建的图片内存空间中，并将其转换为与原始图像相同的图片格式。
[0013]本发明的效果在于:在客户端资源比较低的情况下可有效的利用不同的资源的性能；并且，将第一次识别的元素再反向打包到图片文件中，一方面增加了图像网络传输的安全性，另一方面避免了图片和相关属性信息以及已经识别信息的分割，同时也避免了后台的重复识别工作。服务器可依据客户端图像识别设备的不同，发送不同的策略指令，使得客户端能够完成多级的识别处理，可支持客户端效率最大化或者识别最大化。服务器端对于识别完成状态可拉平处理，即不同的客户端完成识别不一样，在服务器端补全，达成一致的识别效果。
【专利附图】

【附图说明】
[0014]图1是本发明提供的图像识别系统的示意图；
[0015]图2是本发明所述图像识别系统的结构图；
[0016]图3是本发明对图像基本属性进行识别的流程图；
[0017]图4是本发明对XML和原始图像组合的原理图；
[0018]图5是本发明对XML文件和原始图像文件进行组合的流程图；
[0019]图6是本发明对组合文件进行分离的流程图；
[0020]图7是本发明提供的图像识别的方法示意图。
【具体实施方式】
[0021]下面结合附图和【具体实施方式】对本发明作进一步描述。
[0022]如图1所示，本发明的第一实施方式提供一种图像识别系统。该图像识别系统包括；
[0023]一图像识别客户端，图像识别客户端，用于识别图像的基本属性，同时将已经识别元素以及前端要识别请求要素组合成文件；优选地，所述基本属性包括文字和/或数字。
[0024]一图像识别控制服务器，获取客户端发送的识别文件以及原始图像数据，根据识别内容对将要识别的图像以及要识别的要求，将识别文件以及原始图像数据分发到不同的图像识别服务器上。
[0025]至少一个图像识别服务器，根据识别要求对指定图像进行进一步识别。
[0026]本发明的第二实施方式提供一种图像识别系统，参见图2，该系统包括发送端I和接收端2，所述发送端I包括:一图像识别单元，用于图像基本属性的识别，所述基本属性包括文字和/或数字；一图像文件组合单元，该单元对所述图像识别单元已经识别的图像进行编码组合，并同原始图像进行整合；一文件传输发送单元，将经图像文件组合单元整合后的文件传输至接收端。
[0027]所述接收端2包括一文件分解单元，将接收到的文件进行分解，分离出原始图像和已经解析的图像内容数据；以及一图像继续识别单元，用于对原始图像的其它未识别的信息进行识别。
[0028]为了更清楚地说明本发明的宗旨，以下对上述第一实施方式和第二实施方式进行进一步解释。由于移动终端(发送端的一种实施方式)一般内存和处理器的速度比服务器要低，因此可以考虑利用移动终端对图像中耗时比较低，占用资源比较低的元素进行识别，主要文字信息，数字信息内容，即图像基本属性。而对图像中其它比较复杂的元素(如人脸图像等)通过后台服务(接收端的一种实施方式)来实现识别。
[0029]在本发明的基于第二实施方式的第三实施方式中，为了避免后台服务对前台已经识别的元素重新进行识别，可以将已经识别的元素通过XML格式标志出来并重新组合到图像文件中，这样后台根据指定的规则定义就可以直接解析出要识别的元素，而将重要工作的都放在图像其它部分的识别性能上。这样可有效的考虑到终端资源低但对部分内容又有显示的需要的需求，而又充分的利用后台高性能将复杂部分进行实现并又不需要将前台已经实现的部分重复识别工作。
[0030]更进一步，图像识别控制服务器可依据客户端图像识别设备的不同，发送不同的策略指令，使得客户端能够完成多级的识别处理，可支持客户端效率最大化或者识别最大化。一个更为优选的实施方式中，图像识别服务器端对于识别完成状态可拉平处理，即不同的客户端完成识别不一样，在服务器端补全，达成一致的识别效果。
[0031]进一步参见附图3，在第一层图像(以JPG、PNG图像为例，但本领域的技术人员应当能够想到更多图片格式，例如BMP、GIF、TIFF等)识别中，主要对图片中基本的属性信息进行识别。例如，对身份证图像而言，主要信息是身份证号码，姓名，性别，民族等图像基本属性。在移动终端(或者其它具有识别功能的客户端)对上述信息进行识别后，将这些信息按XML规则格式进行组装，此封装的目的是为了在后面第二层图像识别过程中便于快速的处理。对XML的规则，按以下非限制性的XML方式进行该XML样式表达如下(如身份证):
[0032]
【权利要求】
1.一种图像识别系统，该图像识别系统包括:至少一个图像识别客户端，图像识别客户端用于识别图像的基本属性，同时将已经识别元素以及前端要识别请求要素组合成文件；一图像识别控制服务器，获取客户端发送的识别文件以及原始图像数据，根据识别内容对将要识别的图像以及要识别的要求，将识别文件以及原始图像数据分发到不同的图像识别服务器上；至少一个图像识别服务器，根据识别要求对指定图像进行进一步识别。
2.如权利要求1所述的图像识别系统，其特征是，所述基本属性包括文字和/或数字。
3.如权利要求1所述的图像识别系统，其特征是，所述图像识别控制服务器依据图像识别客户端设备的不同，发送不同的策略指令，使得客户端能够完成多级的识别处理。
4.如权利要求1、2或3所述的图像识别系统，其特征是，图像识别服务器对于识别完成状态可拉平处理，即不同的客户端完成识别不一样，在图像识别服务器端补全，达成一致的识别效果。
5.一种图像识别系统，包括一发送端和一接收端，其特征在于:所述发送端包括:一图像识别单元，用于识别图像的基本属性；一图像文件组合单元，对所述图像识别单元已经识别的图像基本属性进行编码组合，同原始图像进行整合；一文件传输发送单元，将经图像文件组合单元整合后的文件传输至接收端；所述接收端包括，一文件分解单元，将接收到的文件进行分解，分离出原始图像和已经识别的图像基本属性；以及一图像继续识别单元，对原始图像的未识别的信息进行识别。
6.如权利要求5所述的图像识别系统，其特征是，所属基本属性为文字和/或数字。
7.如权利要求6所述的图像识别系统，其特征是，所述图像文件组合单元对原始图像进行整合进一步包括将所述识别出的图像基本信息以XML格式表示，并重新组合到新的文件中。
8.如权利要求7所述的图像识别系统，其特征是，所述图像文件组合单元进一步将XML文件按字节流方式写入到原始文件的头部形成新的文件，同时在新的文件中标示出XML文件的长度。
9.如权利要求8所述的图像识别系统，其特征是，所述新的文件包括一文件头，用于存储XML信息，所述文件头由头标志、XML文件长度、XML内容组成。
10.一种图像识别的方法，该方法包括:步骤一、对图像的基本属性进行识别；步骤二、对已经识别的图像基本属性进行编码组合，并同原始图像进行整合；步骤三，将整合后的文件传输；步骤四，接收传输的文件，并对接收到的文件进行分解，分离出原始图像和已经识别的图像基本属性；步骤五，对原始图像的未识别的信息进行识别。
11.如权利要求10所述的图像识别方法，其特征是，所述步骤二中对原始图像进行整合的步骤包括:将所述识别出的图像基本信息以XML格式表示，将XML文件格式添加到原始文件头中，形成新的文件。
12.如权利要求10所述的图像识别方法，其特征是:所述步骤五中对接收到的文件进行分解包括:首先，读取XML文件到内存中，其次，计算XML文件的长度XMLLength ;第三，读取原始图像文件到内存中，并计算原始图像的长度ImageLength ;第四，建立新的内存空间对象大小，该大小为 XMLLength+ImageLength+size (unsigned char) +size (int)字节长度，其中sizeO用于判断数据类型长度；第五，将文件头标志、XML大小、以及XML文件按字节复制到上述新建的内存空间中；第六，将原始图像的所有字节都拷贝到上述新建的内存空间中，该原始图像的数据为追加形式的拷贝，不覆盖文件头标志、XML大小、以及XML文件的数据；第七，将上述新建的内存空间中的数据输出至新的文件。
13.如权利要求12所述的图像识别方法，其特征是，所述对接收到的文件进行分解的步骤进一步包括:首先，读取文件到内存，其次，判断文件标志是否符合要求，若符合要求则获取XML文件的长度XMLLength ;第三，建立新的XML内存空间，用于存放提取的XML文件，从文件流的flag+size (int)位置开始提取XMLLength长的字节的数据到上述新建的XML内存块中，上述flag为文件标志的长度，其中sizeO用于判断数据类型长度；第四，将上述XML内存块中的数据转换成XML格式；第五，建立新的图片内存空间，将接收的文件中剩余部分的字节拷贝到该新建的图片内存空间中，并将其转换为与原始图像相同的图片格式。
【文档编号】G06F17/30GK103455786SQ201210169473
【公开日】2013年12月18日申请日期:2012年5月28日优先权日:2012年5月28日
【发明者】李欣, 余兵, 戎滨, 郑佳栋, 曹五丰申请人:北京山海经纬信息技术有限公司, 方正国际软件(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李欣;余兵;戎滨;郑佳栋;曹五丰
技术所有人：北京山海经纬信息技术有限公司;方正国际软件（北京）有限公司
我是此专利的发明人

上一篇：安置数据库的方法和系统的制作方法
上一篇：图像模糊度的确定方法和设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。