一种文字识别方法与流程

文档序号：12126084阅读：2697来源：国知局

本发明涉及图像识别技术领域，尤其是涉及一种计算机故障检测系统及方法一种文字识别方法。

背景技术：

随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用，图像中信息越来越引起人们的关注。其中嵌入在图像中的文字是图像语义内容的一种重要表达方式，能够提供一些人们所需要的重要信息。例如图像中的文字可以是该图像的内容概述，如果能够自动提取和识别图像中的文字，就可以让计算机自动理解图像内容。让计算机像人类一样识别图像中的文字，对于图像和视频的存储、分类、理解及检索等来说具有极其重要的意义，它主要应用在中文信息处理、办公室自动化、及其翻译、人工智能等高技术领域，有着广泛的应用前景和商业价值。目前对图像中的文字一般只是通过简单的图像分割处理来进行识别，无法根据图像中的文字特征来进行自适应调节，导致现有的图像文字识别方法精度较低，无法满足实际应用的需求。

技术实现要素：

鉴于以上内容，有必要提供一种计算机故障检测系统及方法一种文字识别方法，目的在于解决现有的图像文字识别方法对文字的识别精度较低的技术问题。

本发明的目的通过以下技术方案实现：

一种文字识别方法，包括以下步骤：

获取待识别图像；

对已获取图像预处理：阈值化处理获得前景信息及背景信息单一的图像；图像倾斜校正以校正图像，所述图像倾斜校正包括以下步骤：对已阈值化处理图像取为待校正文本，待校正文本通过霍夫变换，提取图像中的直线，根据所述直线的长度和倾斜角度，对所述直线进行过滤；针对过滤后的直线，确定所述倾斜角度的中位数为所述待校正文本图像的倾斜角度；根据所述待校正文本图像的倾斜角度，对所述待校正文本图像进行旋转；

分析处理图像：分析图像的行间纹理特征，获取图像的文字矩阵参数；

分割图像：基于所述文字矩阵参数对图像进行切割，形成若干个子图像，获取图像的文字字块；

识别：对文字字块进行单独处理，获取文字字块的图像特征，并对所述图像特征进行识别。

进一步的，所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。

进一步的，所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。

进一步的，所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。

进一步的，将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示，背景用第二像素值表示，统计图像的矩阵坐标中每行第二像素值的个数，获取一数组；统计对若干行高参数，参数取平均值统计，获取字体大小参数。

进一步的，所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理，获取文字字块中的文字信息，并根据所述文字信息在预置的系统文字库中进行比对，根据比对结构确定图像中的文字。

进一步的，所述分析处理图像还包括对文字字块进行膨胀处理。

进一步的，所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。

本发明有益效果：本发明通过识别图像的矩阵行高纹理特征进行分析，计算出图像文字的矩阵参数，再基于文字相关的矩阵参数估算出文字字体大小参数，然后在对每一个文字快进行分割，并对文字子块进行识别，提高了切分文字子块的准确性，从而提高文字识别的精度。

【具体实施方式】

一种文字识别方法，其特征在于，包括以下步骤：

获取待识别图像；待识别图像可以是任何需要进行文字识别的图像，待识别图像可以来自外部设备。待识别图像可以是原始图像，也可以是对原始图像进行预处理后得到的图像，待识别的图像可以是jpg、bmp、png等图像格式。

对已获取图像预处理，包括阈值化处理、阈值化处理和倾斜校正。阈值化处理：所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。图像的阈值化有利于图像的进一步处理，获得前景信息及背景信息单一的图像，使图像变得简单，而且数据量减小，能凸显出感兴趣的目标的轮廓。阈值化处理：由于待识别图像的品质受限于输入设备、环境、以及文档的印刷质量，在对图像中印刷体字符进行识别处理前，需要根据噪声的特征对待识别图像进行去噪处理，提升识别处理的精确度，图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。倾斜校正：由于扫描和拍摄过程涉及人工操作，输入计算机的待识别图像或多或少都会存在一些倾斜，在对图像中印刷体字符进行识别处理前，就需要进行图像方向检测，并校正图像方向。本实施例中倾斜校正具体可为包括以下步骤：对已阈值化处理图像取为待校正文本，待校正文本通过霍夫变换，提取图像中的直线，根据所述直线的长度和倾斜角度，对所述直线进行过滤；针对过滤后的直线，确定所述倾斜角度的中位数为所述待校正文本图像的倾斜角度；根据所述待校正文本图像的倾斜角度，对所述待校正文本图像进行旋转。二值矩阵中每个字符点都转化为极坐标系中的一条直线，图像空间坐标系中处于一条直线位置上的所有字符点在极坐标系中会相交于一点；然后将极坐标系中数值超过某一阈值的点标记为图像空间坐标系中对应位置处的一条直线；最后，对图像空间坐标系中的每一条直线，根据位于这条直线上的字符点的信息，就能得到对应的线段。

分析处理图像，分析图像的行间纹理特征，获取图像的文字矩阵参数；将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示，背景用第二像素值表示，统计图像的矩阵坐标中每行第二像素值的个数，获取一数组；统计对若干行高参数，参数取平均值统计，获取字体大小参数。

分割图像：基于所述文字矩阵参数对图像进行切割，形成若干个子图像，获取图像的文字字块；在进行图像切割前还包括对图像中文字区域中的文字进行判断排列方向，可以对文字字块逐行逐列扫描像素，得到文字字块中文字的行间距和列间距，并计算文字行的高度方差及文字列的宽度方差。该文字行的高度方差用于反映文字行高度的一致性，而该文字列的宽度方差用于反映文字列宽度的一致性。然后综合该文字间距和文字行的高度或文字列的宽度的一致性等因素来判断该文字是横向排列还是纵向排列。例如，若行间距大于列间距，并且文字行高度一致，则判定文字区域中文字是横向排列。若列间距大于行间距，并且文字列宽度一致，则判定文字区域中文字是纵向排列。对文字字块的切分结果进行修正，例如包括将错误切分后的文字行或列合并，或对英文首字母与第二字母的错误切分进行修正

识别：对文字字块进行单独处理，获取文字字块的图像特征，并对所述图像特征进行识别；使用经过版面分析及单字切分操作后的该文字字块从文字区域中提取文字之前，还可以对该文字字块进行膨胀处理，然后使用该文字字块保留文字边缘梯度，去除局部背景梯度的干扰，从而从该文字区域中将每一个文字提取出来，并对所提取文字进行归一化处理，即将所有文字缩放到统一大小，最后提取每个文字的特征进行识别。

上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭示如上，然而并非用以限定本发明，任何本领域技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰，均仍属于本发明技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何新霞;
技术所有人：广西大学;
我是此专利的发明人

上一篇：一种IP网络有源音箱的制作方法与工艺
上一篇：基于光学加密和解密技术的图像加密和解密方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。