一种便携式字符识别装置及方法与流程

文档序号：15493162发布日期：2018-09-21 21:03阅读：132来源：国知局

本发明涉及一种便携式字符识别装置及方法，属于字符识别技术领域。

背景技术：

在书本、杂志、报刊以及海报等查询网址链接，或根据邮递单号追踪邮件物流信息时，都需要手动输入长串字符信息。手动输入不仅麻烦，而且容易输错字符。因此，如何快速准确高效识别字符有待解决。关于字符的识别，提供一种便携式的字符识别方法及装置。步骤为：首先采集感兴趣的字符图片数据区域；其次，对感兴趣的字符区域图像根据常见字符宽高比及边缘间距切分字符并得到单个字符的个数；然后，对单个字符进行特征提取，通过字符分类及匹配来完成字符的识别。最后，将识别的字符通过蓝牙传输给用户端(手机或电脑)，并通过语音喇叭语音播报。

技术实现要素：

本发明所要解决的问题是：提供一种便携式字符识别装置及方法，减少人工手动输入字符的繁琐，提高字符识别的准确率。

为了解决上述问题，本发明提供了一种便携式字符识别装置，其特征在于，包括以下部件：

cmos黑白摄像头，用于采集待识别的字符数据区域，获取的待识别区域左上角与显示屏左上角处重合，从而实现待识别字符区域的定位，并通过iic总线与bram存储器相连；

lcd显示屏，用于定位并显示待识别的字符区域；

字符识别ip核，用于实现字符识别处理的核心模板，并将字符数据存储在bram存储器中，并通过axi接口与微处理器相连；

微处理器，用于启动或者控制字符识别ip核，并在linux操作系统上面加载蓝牙驱动，通过蓝牙将字符数据传输给用户端；

bram存储器，用于存储字符识别数据，减轻微处理器的负担，并通过i/o接口与微处理器相连；

语音喇叭，用于语音播报识别的字符结果。

优选地，所述字符识别ip核中采集字符图像、定位待识别区域及图像二值化处理之后，根据印刷体常见字符的边缘间距以及宽高比进行字符切分，得到单个字符个数；对单个字符进行特征提取，通过字符分类匹配为数字、字母及符号，识别后并顺次输出。

优选地，所述微处理器启动或控制字符识别ip核并通过字符识别方法来完成字符的识别过程，微处理器在linux操作系统上运行，加载该装置硬软件驱动，包括蓝牙驱动，对识别的字符结果数据装置通过蓝牙将字符数据传输给用户端。

优选地，所述用户端为手机和电脑。

本发明还提供了一种字符识别方法，其特征在于，包括以下步骤：

步骤a1：采集待识别的字符数据区域，使待识别区域左上角与显示屏左上角处重合，从而实现对待识别字符区域的定位；

步骤a2：将待识别的字符区域图像分成多块，并行计算每一块图像的灰度直方图并确定阈值，完成图像二值化处理；

步骤a3：根据待识别字符区域图像高度、常见字符边缘间距及宽高比，对可能的字符间隔区域作中值滤波处理，实现字符切分并得到单个字符的个数；

步骤a4：对单个字符进行特征提取，通过字符分类及匹配来完成字符的识别；将识别字符串通过蓝牙传送给用户端(手机和电脑)，并通过语音喇叭语音播报。

优选地，所述步骤a2具体为：将待识别的字符区域分割成多块小区域图像，并行计算每块区域图像的灰度直方图。对直方图曲线进行平滑处理，选取当前像素的前后各10个像素包括当前像素，共21个像素的值求和并取平均值作为当前像素值，直到不再出现大于5个像素局部区域的最小值，即波谷，从而实现对阈值的动态选取；将小于阈值的像素群的像素值设定为黑色，反之为白色，形成只有黑白二色的图像，从而完成图像的二值化处理。

优选地，所述a3具体为：为了减少计算量并兼顾各个邻域方向的噪声，在可能出现字符间隔的区域作“米”字形中值滤波处理以此消除孤立的噪声点，即将字符区域网格化，比如形成5×5的网格，检测垂直段、水平段及对角线段的像素点，检测形状类似于中文汉字“米”，若垂直段均为背景，则判断此处为字符间隔；依此类推检测后面的字符区域间隔，从而实现单个字符的切分并得到单个字符的个数。

优选地，所述a4具体为：在单个字符区域中，选取两个对角线方向的位置算子来计算灰度共生矩阵，并根据灰度共生矩阵的熵来对数字、字母和符号进行分类；进一步针对数字、字母或者符号有不同的特征匹配方法。

更优选地，所述数字或字母采取的特征匹配方法为通过其左右外型特征来进行提取，具体为：对网格化的单个字符图像扫描，当扫描线遇到字符的第一个像素和图像边界时，定义左外型特征值为字符图像中第i行最左侧边界点与字符图像左侧边界之差，右外型特征值为图像中第i行最右侧边界点与字符图像右侧边界之差；将单个字符图像分成多块小区域图像后，区域图像的取样位置按照斐波那契数列的形式进行设置，即从第三项开始，当前取样位置为前两项取样位置之和；同时，对每一块小区域不同的行和列进行不均匀取样，从而得到字符图像的左外型特征值和右外型特征值，提取数字字母的左右外型特征完成匹配；符号采取的特征匹配方法为通过符号图像的水平和垂直两个方向来统计符号数据特征，水平全穿过扫描即从水平方向扫描网格化的图像，统计扫描线穿越符号区域的次数和像素个数，求其n阶中心矩和n阶原点矩，形成一个特征描述；然后垂直半穿过扫描，即扫描图像的上半部分。

更优选地，所述步骤a4还包括：字符分类用于从字符特征数据中并行分离字母、数字以及符号；字符分类采用数的思想进行分类，数包括根节点、子节点、叶子节点以及字数森林等等，数的根节点与其他子节点相连；分类过程从根节点开始，根据字符特征以及决策规则对根节点进行划分，重复这个过程，直到叶子节点不能再划分；此时，每个叶子节点都只有一个相应的类别标记，比如字母、数字或者符号，测试样本就被标记为它所到达的叶子节点的类别标记；对字符进行判决，根据特征判别是否为数字、字母以及符号，当识别出第一个字符为字母时，优先下一个字符匹配字母；如果第一个字符识别为数字时，则下一个字符优先匹配数字，这样赋予其优先权使得识别更加迅速。因此，可以将字符分类为字母、数字或者符号。将得到的包含不同特征的字符与分类器进行不断的训练对比，方便下一次识别时遇到相同的字符便可以直接识别，从而节省字符的识别时间。

本发明通过cmos黑白色摄像头采集字符图片信息，并在lcd显示屏中手动定位待识别字符区域；将数据存储于bram中，然后通过i/o与字符识别ip核相连；微处理器与字符识别ip核通过axi接口相连，启动或者控制字符识别ip核，并在linux操作系统上加载蓝牙驱动并与ipex接口相连；在字符识别ip核中完成字符的切分、单个字符特征提取及分类匹配为字母、数字或符号，识别并顺次输出。通过语音喇叭播放字符识别结果；通过蓝牙将字符数据传输给用户端(手机和电脑)，当用户接收设置的传输申请时，设置将字符数据传输给用户；反之，用户拒绝传输申请，则结束。

本发明能够快速便捷地对字符进行定位和匹配，具有较好的识别率、适应性和稳定性。

附图说明

图1为实施例提供的便携式字符识别装置的结构框图；

图2为实施例提供的便携式字符识别方法的流程图；

图3为实施例提供的便携式字符识别装置外观的主视图；

图4为图3的后视图。

具体实施方式

为使本发明更明显易懂，兹以优选实施例，并配合附图作详细说明如下。

实施例

如图1所示，为本实施例提供的便携式字符号识别装置的结构框图，核心部分包括：

lcd显示屏，用于定位并显示待识别的字符区域；

字符识别ip核，用于实现字符识别处理的核心模板，并将字符数据存储在bram存储器中，并通过axi接口与微处理器相连；

微处理器，用于启动或者控制字符识别ip核，并在linux操作系统上面加载蓝牙驱动，通过蓝牙将字符数据传输给用户端(手机和电脑)；

bram存储器，用于存储字符识别数据，减轻微处理器的负担，并通过i/o接口与微处理器相连；

语音喇叭，用于语音播报识别的字符结果。

如图2所示，为本实施例提供的字符识别方法的流程图，具体包括以下步骤：

a1：采集待识别的字符数据区域，使待识别区域左上角与显示屏左上角处重合，从而实现对待识别字符区域的定位；

a2：把待识别的字符区域图像分成多块，并行计算每一块图像的灰度直方图并确定阈值，完成图像二值化处理；

a3：根据待识别字符区域图像高度、常见字符边缘间距及宽高比，对可能的字符间隔区域作中值滤波处理，实现字符切分并得到单个字符的个数；

a4：对单个字符进行特征提取，通过字符分类及匹配来完成字符的识别。将识别字符串通过蓝牙传送给用户端(电脑和手机)，并通过语音喇叭语音播报。

针对字符图像，步骤a2进一步包括：将待识别的字符区域分割成多块小区域图像，并行计算每块区域图像的灰度直方图。对直方图曲线进行平滑处理，选取当前像素的前后各10个像素包括当前像素，共21个像素的值求和并取平均值作为当前像素值，直到不再出现大于5个像素局部区域的最小值(波谷)，从而实现对阈值的动态选取。将小于阈值的像素群的像素值设定为黑色，反之为白色，形成只有黑白二色的图像，从而完成图像的二值化处理。

步骤a3进一步包括：为了减少计算量并兼顾各个邻域方向的噪声，在可能出现字符间隔的区域作“米”字形中值滤波处理以此消除孤立的噪声点。即将字符区域网格化，比如形成5×5的网格，检测垂直段、水平段及对角线段的像素点，检测形状类似于中文汉字“米”，若垂直段均为背景，则判断此处为字符间隔。依此类推检测后面的字符区域间隔，从而实现单个字符的切分并得到单个字符的个数。

步骤a4进一步包括：在单个字符区域中，选取两个对角线方向的位置算子来计算灰度共生矩阵，并根据灰度共生矩阵的熵来对数字、字母和符号进行分类。不同的字符拥有不同的特征矩阵，与其它字符进行区分。单个字符包括数字(10个)、英文大小写字母(52个)以及其它符号。进一步针对数字、字母或者符号有不同的特征匹配方法。

对于数字或字母采取的匹配方法：通过其左右外型特征来进行提取。具体方法为：对网格化的单个字符图像扫描，当扫描线遇到字符的第一个像素和图像边界时，定义左外型特征值为字符图像中第i行最左侧边界点与字符图像左侧边界之差，右外型特征值为图像中第i行最右侧边界点与字符图像右侧边界之差。将单个字符图像分成多块小区域图像后，区域图像的取样位置按照斐波那契数列的形式进行设置，即从第三项开始，当前取样位置为前两项取样位置之和；同时，对每一块小区域不同的行和列进行不均匀取样，从而得到字符图像的左外型特征值和右外型特征值，提取数字字母的左右外型特征完成匹配。

对于符号采取的匹配方法：通过符号图像的水平和垂直两个方向来统计符号数据特征。水平全穿过扫描即从水平方向扫描网格化的图像，统计扫描线穿越符号区域的次数和像素个数，求其n阶中心矩和n阶原点矩，形成一个特征描述；然后垂直半穿过扫描，即扫描图像的上半部分。

步骤a4还包括：字符分类用于从字符特征数据中并行分离字母、数字以及符号，其中包括：

字符分类：采用数的思想进行分类，数包括根节点、子节点、叶子节点以及字数森林等等，数的根节点与其他子节点相连。分类过程从根节点开始，根据字符特征以及决策规则对根节点进行划分，重复这个过程，直到叶子节点不能再划分。此时，每个叶子节点都只有一个相应的类别标记，比如字母、数字或者符号，测试样本就被标记为它所到达的叶子节点的类别标记。因此，可以将字符分类为字母、数字或者符号。将得到的包含不同特征的字符与分类器进行不断的训练对比，方便下一次识别时遇到相同的字符便可以直接识别，从而节省字符的识别时间。对字符进行判决，根据特征判别是否为数字、字母以及符号，当识别出第一个字符为字母时，优先下一个字符匹配字母；如果第一个字符识别为数字时，则下一个字符优先匹配数字，这样赋予其优先权使得识别更加迅速。

如图3、4所示，为实施例提供的便携式字符识别装置的外观：

装置正面包括显示屏，在左上角处定位(用小黑色圆形区域标识)并采集待识别字符区域，并显示字符识别结果；按钮1为装置开/关机按钮，用于装置的开机或者关机；按钮2为cmos摄像头开/关按钮，用于拍摄字符图片；按钮3为发送/接收数据按钮，用于发送字符结果数据给用户或者接受用户的反馈。

装置反面包括语音喇叭，用于语音播报识别的字符结果；蓝牙，用于装置通过蓝牙将数据传输给用户；电池，用于为装置提供正常的电量，保持装置正常运行。

综上所述，根据本发明实施例提出的字符识别方法，采集待识别的字符数据区域，使待识别区域左上角与显示屏左上角处重合，从而实现待识别字符区域的定位；把待识别的字符区域图像分成多块，并行计算每一块图像的灰度直方图并确定阈值，完成图像二值化处理；根据待识别字符区域图像高度、常见字符边缘间距及宽高比，实现字符切分并得到单个字符的个数；对单个字符进行特征提取，通过字符分类及匹配来完成字符的识别，通过语音喇叭播放字符识别结果；根据用户的选择是否将字符数据传通过蓝牙传输给用户。本方法通过设计硬件ip核完成字符识别，提高识别效率和精度，且方便快捷。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：范红;肖敏;顾奕文;温佳静;张丽平;夏天
技术所有人：东华大学
我是此专利的发明人

上一篇：一种通讯线缆分光箱的制作方法
上一篇：一种便于移动的电信光纤箱的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。