试卷卷面表格自动检测方法

文档序号:6459575阅读:167来源:国知局
专利名称:试卷卷面表格自动检测方法
技术领域
本发明涉及的是一种表格自动检测方法,具体是一种试巻巻面表格自动检测的方法。
背景技术
在教学过程中,试巻作为一种重要的教学评估手段广泛的应用于各类学校中,然 而教师需要花费大量的时间对试巻巻面信息进行处理和统计。如何对如此大量的试巻 中的信息进行自动录入和处理,是目前面临的难题。因此,对试巻巻面信息自动录入 和处理具有很大的研究价值和应用前景。表格是试巻巻面中信息的主要表达方式,大 量的表格信息的输入计算机成为困扰人们的一种繁琐工作,直接影响试巻巻面信息的 录入和处理效率。因此,对试巻巻面表格自动检测的研究具有很重要的意义。当今国内外流行的表格自动阅读机都是采用一种特定颜色或特制墨水印制表格 线和固定栏,使用者用另一种颜色填写,在扫描时滤去表格线和固定栏,这种方法简 单,但不能处理大量的普通纸张表格。而且不能自动提取表格的结构信息,它实际上 避开了表格图象分折问题。直接对表格图像进行分析,不但能够快速处理图象数据, 而且能够容忍图象轻微倾斜和少量断线虚线,允许字符跨过和粘连表格线。目前,对表格图像进行分析的方法主要有投影法和点搜索法。前者通过求取水 平和垂直方向的投影峰值来判断表格线,但是如果表格线本身较短或较细且具有轻微 倾斜,可能在表格线处不能形成峰值,这样就很难准确的检测出表格。后者通过跟踪 图象的边缘点来获得表格轮廓,然而它对于断线、表格线与字符粘连不能获得满意结 果。

发明内容
本发明的目的在于克服现有技术的不足,提供一种准确、高效,易于实现的试巻 巻面表格自动检测方法,满足实际应用的需求。 为了达到上述目的,本发明的构思是对试巻巻面图像进行预处理和细化,利用Hough变换找出试巻巻面图像的倾斜 角度,同时抽取出试巻巻面中水平和垂直的表格线段,结合上述倾斜角度,把水平和 垂直线段组合成表格,最终达到检测试巻巻面表格的目的。本发明利用了计算机处理领域的模式识别技术和图像处理技术,能够对倾斜的试巻巻面图像进行处理,并且利用了图像处理算法,能够快速、准确的检测出试巻巻面 图像中的表格。该方法容易实现,并具有较高的可靠性和准确率。 根据上述的发明构思,本发明是采用以下技术方案来实现的一种试巻巻面表格自动检测方法,其特征在于通过摄像头获取实时试巻巻面图 像,经过预处理和细化后,利用Hough变换找出巻面图像的倾斜角度,然后抽取出 试巻巻面中的水平和垂直线段,最后结合倾斜角度把水平和垂直线段组合成表格;其 具体操作步骤如下-(1) 利用Hough变换找出倾斜角度的步骤① 输入样本将试巻巻面图象由摄像头和图象采集卡经模数转换后输入计算机;② 预处理计算机对得到的实时试巻图象进行灰度化、二值化、平滑去噪、细化 等处理;③计算倾斜角度对试巻巻面图像进行Hough变换,并判断出试巻巻面图像是否倾斜,如果出现倾斜则计算出试巻巻面图像的倾斜角度e。(2) 抽取出水平和垂直线段结合上述倾斜角度,通过投影抽取出试巻巻面图像中的水平和垂直线段。(3) 形成表格 把上述抽取出的水平和垂直线段组合成表格。以下对本发明的方法作进一步的说明所述的试巻巻面图象,是利用摄像头实时 采集的,因此图像受到噪声和外界因素的影响,在进行处理前, 一般来说要对图象进 行预处理。对试巻巻面图像的预处理包括以下过程灰度化、二值化、平滑去噪。由 于本方法要对整幅试巻巻面图像进行处理,为了减小计算量和提高算法速度,细化的 很必要的,在本方法中采用的是并行细化算法,该细化方法具有很好的实用性,获取 的图像骨架避免了过度腐蚀,并且还具有良好的连通性。所述的计算倾斜角度,是利用Hough变换得到试巻巻面图像的倾斜角度。Hough变换的基本思想是由图像空间目标像素的坐标去计算参数空间中参考点的可能轨 迹,并在一个累加器中给计算出的参考点计数。如果参数空间是极坐标(P, e),则 坐标变换的公式为<formula>formula see original document page 4</formula>这里的x 、 y是像素的直角坐标。由此,H0Ugh变换算法设计为(1) 在p、 e合适的最大值与最小值之间建立一个离散的参数空间;(2) 建立一个累加器A(p, e),并将每一个元素置为o;(3) 选取图像中超过门限值的每一个目标像素点(x,y),对每一个e的取值&,计算 p' =;ccos(A) + ;/sin(^),并在相应的累加器加l。在累加矩阵A(p, e)中,对应的某一个列A,使得A(p, 0)具有局部较大值, 所以可以设定一个合适的门限值T,取7WmaxJ(一)......................................... (2)这里义<1,然后利用该门限值对A(p , e)进行变换,当a(p, e)《T时,A(p, 8)=0。对A(p, e)进行列累加,得到J'(0)。最后,选取的乂(60最大元素所对应的角度为发现的倾斜角度e。所述的抽取水平和垂直线段,是利用投影的方法,结合上述倾斜角度得到水平和 垂直的线段。投影的方法即使对试巻巻面图像的每一行或每一列的像素点p进行叠加, 如果pi,既像素点p为黑像素点,则加l。所述的形成表格,就是利用上诉得到的倾斜角度和水平、垂直线段组合成表格。本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点能够实现倾斜图像中表格的检测,并且对于断线的情况能够得到满意的效果。同时,本 发明的方法,直接对试巻巻面的图像进行处理,对于不用版式和风格的试巻均试用, 而且准确率高,容易实现,能够大大提高巻巻面信息自动录入和处理的效率。本发明 的方法还适用于其它表格自动录入和处理系统,具有很好的实用价值。


图1为试巻巻面图像图。图2为预处理和细化后的试巻巻面图像图。图3为水平投影图。图4为垂直投影图。图5为水平线段图。图6为垂直垂直线段图。图7为检测表格结果图;具体实践方式实施例一为了更好的理解本发明的技术方案,结合附图就实施例进一步详细描 述。本试巻巻面表格自动检测方法的具体操作步骤如下(1) 利用Hough变换找出倾斜角度 CD输入样本通过摄像头获得试巻巻面实时图象,其中学号部分和分数部分图象如图1所示。 ②预处理计算机对得到的实时试巻图象进行灰度化、二值化、平滑去噪、细化等处理如图 2所示。③计算倾斜角度对试巻巻面图像进行Hough变换,并判断出试巻巻面图像是否倾斜,如果出现倾斜者计算出试巻巻面图像的倾斜角度e。(2) 抽取出水平和垂直线段结合上述倾斜角度,对试巻巻面图像进行水平投影和垂直投影,如图3, 4随时, 然后抽取出试巻巻面图像中的水平和垂直线段,如图5, 6所示。 (4)形成表格根据上述抽取出来的表格线段,组合成表格,结果如图7所示。
权利要求
1.一种试卷卷面表格自动检测方法,其特征在于通过摄像头获取实时的试卷卷面图像,经过预处理和细化后,利用Hough变换找出试卷图像的倾斜角度,然后抽取出试卷卷面中的水平和垂直线段,最后结合倾斜角度把水平和垂直线段组合成表格其具体操作步骤如下(1)利用Hough变换找出倾斜角度的步骤①输入样本将试卷卷面图像由摄像头和图像采集卡经模数转换后输入计算机;②预处理计算机对得到的实时试卷卷面图像进行灰度化、二值化、平滑去噪、细化处理;③计算倾斜角度对试卷卷面图像进行Hough变换,并判断出试卷卷面图像是否倾斜,如果出现倾斜,计算出试卷卷面图像的倾斜角度。(2)抽取出水平和垂直线段结合上述倾斜角度,通过投影抽取出试卷卷面图像中的水平和垂直线段。(3)形成表格把上述抽取出的水平和垂直线段组合成表格。
全文摘要
本发明涉及计算机处理领域的模式识别技术,具体涉及一种试卷卷面表格的自动检测方法。本方法是通过摄像头获取实时的试卷卷面图像,经过预处理和细化后,利用Hough变换找出卷面图像的倾斜角,然后抽取出试卷卷面中的水平和垂直线段,最后结合倾斜角度把水平和垂直线段组合成表格。采用本发明所述的方法,可以大大提高表格类文档以及票据自动录入和识别的效率和准确率。
文档编号G06K9/36GK101315668SQ200810039999
公开日2008年12月3日 申请日期2008年7月1日 优先权日2008年7月1日
发明者冯运亮, 孙峰杰, 罗珍茜, 雷 薛 申请人:上海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1