一种实现逐行扫描的方法及系统的制作方法

文档序号:9811050阅读:434来源:国知局
一种实现逐行扫描的方法及系统的制作方法
【技术领域】
[0001]本发明涉及图片处理技术领域,尤其涉及一种实现逐行扫描的方法及系统。
【背景技术】
[0002]因为扫描笔的笔尖开口固定,而书本、试卷等书籍的字体和行距是不同的,扫描的图片可能包含多行的文本,利用扫描笔扫描时很容易把多余的数据扫描进去,从而影响文字识别和搜索的准确度。因此如何实现逐行扫描,以提高文字识别和搜索的准确度是目前亟需解决的问题。

【发明内容】

[0003]本发明提供了一种实现逐行扫描的方法及系统,通过获取图片的横向中心线,把距离所述横向中心线最近的文字行作为逐行扫描的结果,实现逐行扫描,提高文字识别和搜索的准确度。
[0004]为实现上述设计,本发明采用以下技术方案:
[0005]—方面,提供了一种实现逐行扫描的方法,该方法,包括:
[0006]逐行扫描文本得到图片,获取所述图片的横向中心线;
[0007]识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;
[0008]把所述最近的文字行作为逐行扫描结果。
[0009]优选地:
[0010]所述逐行扫描文本得到图片,获取所述图片的横向中心线,包括:
[0011]逐行扫描文本得到图片,将所述图片进行灰度化处理得到灰度化图片;
[0012]将所述灰度化图片进行二值化处理得到二值化图片;
[0013]获取所述二值化图片的横向中心线;
[0014]所述识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行,包括:
[0015]确定所述二值化图片中的连续白色像素行形成的空白分隔行;
[0016]根据所述空白分隔行识别出二值化图片中的黑色像素行形成的文字行;
[0017]确定距离所述二值化图片的横向中心线最近的文字行。
[0018]优选地,所述把所述最近的文字行作为逐行扫描结果,包括:从所述二值化图片中,截取所述最近的文字行作为逐行扫描结果。
[0019]优选地,所述把所述最近的文字行作为逐行扫描结果,包括:从所述二值化图片中,抹掉除所述最近的文字行之外的文字行作为逐行扫描结果。
[0020]优选地,所述从所述二值化图片中,抹掉除所述最近的文字行之外的文字行,包括:
[0021]确定所述最近的文字行的高度方向的上边缘线和下边缘线;
[0022]从二值化图片中把上边缘线往上的黑色像素点转变成白色像素点;把下边缘线往下的黑色像素点转变成白色像素点。
[0023]优选地,所述从所述二值化图片中,抹掉除所述最近的文字行之外的文字行,包括:
[0024]确定所述最近的文字行的上方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;或
[0025]确定所述最近的文字行的下方的空白分隔行,从所述二值化图片中把下方的空白分隔行往下的黑色像素点转变成白色像素点;或
[0026]确定所述最近的文字行的上方的空白分隔行和下方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;把下方的空白分隔行往下的黑色像素点转变成白色像素点。
[0027]另一方面,提供了一种实现逐行扫描的系统,该系统,包括:
[0028]获取模块,用于逐行扫描文本得到图片,获取所述图片的横向中心线;
[0029]文字行识别模块,用于识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;
[0030]逐行扫描模块,用于把所述最近的文字行作为逐行扫描结果。
[0031]优选地:
[0032]所述获取模块,包括:
[0033]灰度化单元,用于逐行扫描文本得到图片,将所述图片进行灰度化处理得到灰度化图片;
[0034]二值化单元,用于将所述灰度化图片进行二值化处理得到二值化图片;
[0035]获取单元,用于获取所述二值化图片的横向中心线;
[0036]所述文字行识别模块,包括:
[0037]空白分隔行确定单元,用于确定所述二值化图片中的连续白色像素行形成的空白分隔行;
[0038]文字行识别单元,用于根据所述空白分隔行识别出二值化图片中的黑色像素行形成的文字行;
[0039]文字行确定单元,用于确定距离所述二值化图片的横向中心线最近的文字行。
[0040]优选地,所述逐行扫描模块包括:
[0041]截取单元,用于从所述二值化图片中,截取所述最近的文字行作为逐行扫描结果。
[0042]优选地,所述逐行扫描模块包括:
[0043]抹掉单元,用于从所述二值化图片中,抹掉除所述最近的文字行之外的文字行作为逐行扫描结果。
[0044]优选地,所述抹掉单元,包括:
[0045]边缘确定单元,用于确定所述最近的文字行的高度方向的上边缘线和下边缘线;
[0046]转变单元,用于从二值化图片中把上边缘线往上的黑色像素点转变成白色像素点;把下边缘线往下的黑色像素点转变成白色像素点。
[0047]优选地,所述抹掉单元用于:
[0048]确定所述最近的文字行的上方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;或
[0049]确定所述最近的文字行的下方的空白分隔行,从所述二值化图片中把下方的空白分隔行往下的黑色像素点转变成白色像素点;或
[0050]确定所述最近的文字行的上方的空白分隔行和下方的空白分隔行,从所述二值化图片中把上方的空白分隔行往上的黑色像素点转变成白色像素点;把下方的空白分隔行往下的黑色像素点转变成白色像素点。
[0051]与现有技术相比,本发明的有益效果为:逐行扫描文本得到图片,获取所述图片的横向中心线;识别出所述图片中的文字行,确定距离所述横向中心线最近的文字行;把所述最近的文字行作为逐行扫描结果。本发明通过获取图片的横向中心线,把距离所述横向中心线最近的文字行作为逐行扫描的结果,实现逐行扫描,提高文字识别和搜索的准确度。
【附图说明】
[0052]为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
[0053]图1是本发明【具体实施方式】中提供的一种实现逐行扫描的方法的第一实施例的方法流程图一。
[0054]图2是本发明【具体实施方式】中提供的一种实现逐行扫描的方法的第二实施例的方法流程图一。
[0055]图3是本发明【具体实施方式】中提供的一种实现逐行扫描的方法的第二实施例的方法流程图二。
[0056]图4是本发明【具体实施方式】中提供的一种实现逐行扫描的系统的第一实施例的结构方框图。
[0057]图5是本发明【具体实施方式】中提供的一种实现逐行扫描的系统的第二实施例的结构方框图一。
[0058]图6是本发明【具体实施方式】中提供的一种实现逐行扫描的系统的第二实施例的结构方框图二。
【具体实施方式】
[0059]为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060]请参考图1,其是本发明【具体实施方式】中提
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1