图像识别方法及系统的制作方法

文档序号：9417874阅读：661来源：国知局

图像识别方法及系统的制作方法
【技术领域】
[0001] 本发明涉及图像识别领域，尤其涉及一种图像识别方法及系统。
【背景技术】
[0002] 目前，计算机软件在进行字符识别时通常是使用标准OCR(光学字符识别）或者模板进行匹配，这些方案都只能处理标准字符，而且需要提供大量的样本库文件，无法对具有缩放、旋转、重叠和扭曲的字符进行识别，这使得现有技术对变形字或手写体字符等特殊字符的识别存在很大难度，并且缺少准确性。

【发明内容】

[0003] 本发明要解决的技术问题是为了克服现有技术中对变形字或手写体字符等特殊字符的识别不准确的缺陷，提供一种图像识别方法及系统。
[0004] 本发明是通过以下技术方案解决上述技术问题的：
[0005] 本发明提供一种图像识别方法，其特点是，该图像识别方法包括：
[0006] S1、从待识别的图片中获取该图片包含的图像；
[0007] S2、将该图像切分成若干切片，每个切片包含一个字符；
[0008] S3、根据每一切片的像素点，分别计算每一切片对应的形状上下文；
[0009] S4、根据形状上下文的特征值进行搜索，找到与切片所包含的字符最接近的样本作为识别结果。
[0010] 本技术方案基于形状上下文自动识别图片中的字符，具有很高的识别准确性，同时，本技术方案还不需要预存大量的样本文件，能够减少的样本文本的存储量，提高识别效率。
[0011] 较佳地，步骤S1包括：
[0012] Sn、将待识别的图片进行灰度处理；
[0013] S12、将灰度处理后的图片进行二值化处理；
[0014] S13、对二值化处理后的图片包含的图像进行描边处理；
[0015] S14、去除该图像中孤立的像素点；
[0016] S15、补齐该图像的边缘。
[0017] 本技术方案对待识别的图片进行了预处理，预处理主要是为了方便后续的切分和减少后续识别中的干扰因素，其中，步骤S 15能够去除干扰因素，提高识别的准确率。
[0018] 较佳地，S2包括：
[0019] S21、根据联通分量将该图像切分成X个切片，X为正整数；
[0020] S22、若X等于该图像包含的字符数，则执行S3，若X小于该图像包含的字符数，则根据横向投影将该X个切片切分成若干个切片。
[0021] 本技术方案可以更准确的切分，保证待识别的字符完整性，提高重叠字符识别的准确率。
[0022] 较佳地，S3包括对每一切片分别执行以下步骤：
[0023] S31、将切片中每一像素点分别转换成对数极坐标；
[0024] S32、将每一对数极坐标分别转换为一维矩阵；
[0025] S33、将所有的一维矩阵合并成一 m*n的二维矩阵，m为切片的像素点数，η为一维矩阵的长度，该m*n的二维矩阵为切片对应的形状上下文。
[0026] 其中，极坐标的使用可以忽略字符的旋转对识别字符造成的影响，提高识别的准确性。
[0027] 较佳地，S31包括：
[0028] S311、将待转换为对数极坐标的像素点作为极坐标的圆心，半径为切片中像素点之间的最大距离，并对半径进行归一化处理。
[0029] 其中，对极坐标进行归一化处理可以将转换成极坐标的集合等比例压缩在半径为 1的极坐标集合中，忽略字符的缩放对识别字符造成的影响，提高识别的准确性。
[0030] 较佳地，S32通过以下步骤将对数极坐标转换为一维矩阵：
[0031] S321、将极坐标圆的半径和角度进行等量划分；
[0032] S322、根据划分后每个区域内的像素点数得出二维矩阵；
[0033] S323、将S322得到的二维矩阵转化成一维矩阵；
[0034] S324、将一维矩阵进行一维傅里叶变换。
[0035] 其中，S324可以忽略字符的扭曲变形对识别字符造成的影响，提高识别的准确性。
[0036] 较佳地，S4包括：
[0037] S41、根据形状上下文的特征值在样本库中进行搜索，利用匈牙利算法进行二分图匹配，找到距离最近的样本作为识别结果。
[0038] 传统的匹配算法是简单的根据每个点的比较去进行匹配，存在一对多的匹配，而且无法区分具有包含关系的字符，如：6和9, 3和8等。而本技术方案使用的匈牙利算法保证只存在一对一匹配，而且通过极坐标的半径和角度的奇数划分可以轻松的区分具有包含关系的字符，提尚字符识别的准确率。在本技术方案中，匈牙利算法既可以提尚准确率，还可以减少识别的时间（时间复杂度为O(VE))，提高效率。
[0039] 本发明还提供一种图像识别系统，其特点是，该图像识别系统包括：
[0040] -获取单元，用于从待识别的图片中获取该图片包含的图像；
[0041] -切分单元，用于将该图像切分成若干切片，每个切片包含一个字符；
[0042] -计算单元，用于根据每一切片的像素点，分别计算每一切片对应的形状上下文；
[0043] -识别单元，用于根据形状上下文的特征值进行搜索，找到与切片所包含的字符最接近的样本作为识别结果。
[0044] 较佳地，该获取单元包括：
[0045] -灰度处理模块，用于将待识别的图片进行灰度处理；
[0046] -二值化处理模块，用于将灰度处理后的图片进行二值化处理；
[0047] 一描边模块，用于对二值化处理后的图片包含的图像进行描边处理；
[0048] -去除模块，用于去除该图像中孤立的像素点；
[0049] -图像生长模块，用于补齐该图像的边缘。
[0050] 较佳地，该切分单元包括：
[0051] -切片模块，用于根据联通分量将该图像切分成X个切片，X为正整数；
[0052] -比较模块，用于在X等于该图像包含的字符数时调用该计算单元，以及在X小于该图像包含的字符数时根据横向投影将该X个切片切分成若干个切片。
[0053] 较佳地，该计算单元用于对每一切片分别调用以下模块：
[0054] 一坐标转换模块，用于将切片中每一像素点分别转换成对数极坐标；
[0055] -矩阵转换模块，用于将每一对数极坐标分别转换为一维矩阵；
[0056] -矩阵合并模块，用于将所有的一维矩阵合并成一 m*n的二维矩阵，m为切片的像素点数，η为一维矩阵的长度，该m*n的二维矩阵为切片对应的形状上下文。
[0057] 较佳地，该坐标转换模块还用于将待转换为对数极坐标的像素点作为极坐标的圆心，半径为切片中像素点之间的最大距离，并对半径进行归一化处理。
[0058] 较佳地，该矩阵转换模块包括：
[0059] -划分模块，用于将极坐标圆的半径和角度进行等量划分；
[0060] -二维矩阵生成模块，用于根据划分后每个区域内的像素点数得出二维矩阵；
[0061] --维矩阵生成模块，用于将该二维矩阵生成模块得到的二维矩阵转化成一维矩阵；
[0062] -傅里叶变换模块，用于将一维矩阵进行一维傅里叶变换。
[0063] 较佳地，该识别单元包括：
[0064] -匹配模块，用于根据形状上下文的特征值在样本库中进行搜索，利用匈牙利算法进行二分图匹配，找到距离最近的样本作为识别结果。
[0065] 在符合本领域常识的基础上，上述各优选条件，可任意组合，即得本发明各较佳实例。
[0066] 本发明的积极进步效果在于：对具有缩放、旋转、重叠和扭曲的手写体字符或变形字符等特殊字符进行准确地识别，减少所需的样本文件，减少识别所需的时间，提高识别效率。
【附图说明】
[0067] 图1为本发明的实施例的图像识别方法的流程图。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何晓力;张勇;李可玮;
技术所有人：携程计算机技术（上海）有限公司;
我是此专利的发明人

上一篇：一种二维码赋码打印方法
上一篇：基于图像的语种识别方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。