一种作业图像定位与分割方法及其装置与流程

文档序号:14941519发布日期:2018-07-13 20:58阅读:268来源:国知局
本发明涉及图像处理与模式识别
技术领域
,具体涉及一种作业图像定位与分割方法及其装置。
背景技术
:随着电子信息技术的快速发展,以及移动终端的迅速普及,在中小学教学领域,新的辅助教育与学习方式不断涌现。标准化的辅助考试方法已经相当普及,通过事先印制特定的答题卡,并要求学生在考试时将答案填涂到相应位置,最后通过机器读取答题卡实现自动判卷功能。该方法优点是处理速度快、准确,减轻了教师判卷的负担;其缺点是设备价格比较昂贵、对答题卡质量要求比较高,并且只能处理客观题。基于图像处理方式的试卷分析,一般需要使用高速扫描仪对试卷进行扫描,并通过识别事先定义的标记块对试卷及内容进行提取和分析。使用高速扫描仪扫描试卷,对于考试还可以考虑使用,如果是平时每次的作业分析,由于不是每个学生都有扫描仪,需要老师将学生作业收集并扫描,这无疑增加了教师的工作负担,也与作业电子化初衷相违背。目前现有技术大都集中于试卷分析,包括试卷中题目的分割与自动判卷等,很少有人关注到作业的电子化处理与分析。对于试卷处理,现有的技术通常假设试卷图像通过高速扫描仪进行扫描或拍照获取,并完全得到。然而,实际上在拍照获取试卷图像过程中,为了获取完整的试卷或作业纸张将不可避免的引入一些背景图像(如放置作业的课桌等)。这些背景图像将为试卷和作业的分析引入噪声,例如作业纸张与课桌边界就是一条清晰的直线,此外不同环境光照的差别也给图像提取增加了难度。此外,对于图像分析,一般要求在试卷或作业纸张中标注特定的标定块,而且在使用中要保持标定块的完整和整洁,对试卷纸张和印刷要求较高。技术实现要素:有鉴于此,本发明的目的在于克服现有技术的不足,提供一种作业图像定位与分割方法及其装置,该方法能够准确的将作业纸图像从复杂的背景图像中提取出来,并进一步将各个题目分割保存。为实现以上目的,本发明采用如下技术方案:一种作业图像定位与分割方法,包括:s1:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;s2:对所述梯度图像进行重构处理,得到重构后的梯度图像;s3:对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;s4:根据所述边缘信息,对所述作业纸张图像的边界进行定位;s5:提取所述作业纸张图像,并分割出各个题目。可选的,所述步骤s1中对所述作业图像进行预处理,包括:s11:对获取的作业图像进行灰度化处理,得到作业灰度图像;s12:对所述灰度图像进行平滑去噪处理。可选的,所述步骤s12中对所述灰度图像进行平滑去噪处理,包括:对所述灰度图像进行均值滤波处理或中值滤波处理。可选的,所述步骤s2中对所述梯度图像进行重构处理,包括:s21:采用种子区域生长算法对所述梯度图像进行图像分割处理;s22:对所述分割后的图像进行处理,得到重构后的梯度图像。可选的,所述步骤s21包括:s211:在所述梯度图像中选取种子像素点(x0,y0),种子区域的像素点梯度均值gmean为该种子像素点的梯度值g(x0,y0);s212:以种子像素点为中心,分别将种子像素点的每一个四邻域像素点的梯度值与种子区域的像素点梯度均值进行比较;s213:如果二者差值的绝对值小于或等于预设阈值,则将该邻域像素点添加入所述种子区域,重新计算所述种子区域的像素点梯度均值gmean,并将该邻域像素点作为种子像素点,继续执行s212;s214:如果二者差值的绝对值大于预设阈值,则停止向该邻域像素点生长。可选的,所述步骤s22包括:将步骤s21最终遍历得到的种子区域内的像素点梯度值保持不变;将所述种子区域外的像素点的梯度值清零,从而得到重构后的梯度图像。可选的,所述步骤s4中根据所述边缘信息,对所述作业纸张图像的边界进行定位,包括如下步骤:s41:通过直线检测方法检测所述边缘信息中的直线,并根据各直线之间的极径和极角关系对直线进行分组合并处理;s42:根据合并处理后的直线间相互夹角关系定位出所述作业纸张图像的边界。可选的,所述步骤s5中,在提取所述作业纸张图像后,还包括:对提取出来的所述作业纸张图像进行倾斜矫正;对倾斜矫正后的作业纸张图像进行横向投影,并根据所述作业纸张图像的横向投影结果提取出各个题目。可选的,本发明还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由客户端的处理器执行时,使得客户端能够执行一种作业图像定位与分割方法,所述方法包括:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;对所述梯度图像进行重构处理,得到重构后的梯度图像;对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;根据所述边缘信息,对所述作业纸张图像的边界进行定位;提取所述作业纸张图像,并分割出各个题目。可选的,本发明还提供了一种对作业图像进行定位与分割的装置,包括:处理器和用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;对所述梯度图像进行重构处理,得到重构后的梯度图像;对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;根据所述边缘信息,对所述作业纸张图像的边界进行定位;提取所述作业纸张图像,并分割出各个题目。本发明采用以上技术方案,所述方法包括:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;对所述梯度图像进行重构处理,得到重构后的梯度图像;对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;根据所述边缘信息,对所述作业纸张图像的边界进行定位;提取所述作业纸张图像,并分割出各个题目。本发明中提取作业图像的方法简便易行,通过拍照即可进行图像分析,并且不需要事先对作业纸张印制特殊标记块;该方法能够准确的将作业纸张图像从复杂的背景图像中提取出来,并进一步将各个题目分割保存;此外,本发明提出的基于重构后的梯度图像进行边缘检测的方法,能够使作业纸张图像的提取对复杂的背景和光照变化具有更好的鲁棒性。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明作业图像定位与分割方法一种可选的处理流程图;图2是本发明作业图像定位与分割方法另一种可选的处理流程图;图3是本发明作业图像定位与分割方法处理得到的梯度图像;图4是本发明作业图像定位与分割方法重构后的梯度图像。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。如图1所示,本发明提供了一种可选的作业图像定位与分割方法,包括:s1:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;s2:对所述梯度图像进行重构处理,得到重构后的梯度图像;s3:对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;s4:根据所述边缘信息,对所述作业纸张图像的边界进行定位;s5:提取所述作业纸张图像,并分割出各个题目。具体的,所述步骤s1中对所述作业图像进行预处理,包括:s11:对获取的作业图像进行灰度化处理,得到作业灰度图像;s12:对所述灰度图像进行平滑去噪处理。进一步的,所述步骤s12中对所述灰度图像进行平滑去噪处理,包括:对所述灰度图像进行均值滤波处理或中值滤波处理。对于均值滤波:对待处理的当前像素,选择一个模板,该模板由其邻近的若干个像素组成,用模板的均值替代原像素值。计算公式如下:在以上公式中,m代表邻域像素的个数,f(x,y)代表邻域像素值。在本发明中,例如,采用了8邻域像素滤波法,(x,y)的8邻域像素分布如下:1238(x,y)4765均值滤波的权系数矩阵模板如下:像素(x,y)滤波后的像素值g(x,y)计算方法如下,其中i代表原图像:在获得平滑去噪处理后的灰度图像之后,继而计算该灰度图像的梯度,图像中的梯度值就是图像灰度值显著变化的地方。在本发明中我们使用sobel算子进行梯度的计算。sobel算子有两个,一个是检测水平边缘的梯度;另一个是检测垂直的梯度。图像梯度的计算方式如下:g(x,y)=dx(i,j)+dy(i,j);其中dx和dy分别代表图像x方向和y方向的梯度,dx和dy的计算方式如下:dx(i,j)=i(i+1,j)-i(i,j);dy(i,j)=i(i,j+1)-i(i,j);其中i、j代表像素的索引位置。如图2所示,作为本发明另一种可选的作业图像定位与分割方法,所述步骤s2中对所述梯度图像进行重构处理,包括:s21:采用种子区域生长算法对所述梯度图像进行图像分割处理;s22:对所述分割后的图像进行处理,得到重构后的梯度图像。如图3所示,从s1得到的梯度图像中可以看到,作业纸张的边界是很明显的,但是如何从中提取出纸张图片还是很有挑战性的。主要的问题在于纸张之外的背景图像对于直线提取影响很大,纸张范围内的梯度值对于纸张边界影响不大,本步骤s2处理的目标就是去除纸张边界之外的梯度高的像素值。需要说明的是,所述步骤s21包括:s211:在所述梯度图像中选取种子像素点(x0,y0),种子区域的像素点梯度均值gmean为该种子像素点的梯度值g(x0,y0);s212:以种子像素点为中心,分别将种子像素点的每一个四邻域像素点的梯度值与种子区域的像素点梯度均值进行比较;s213:如果二者差值的绝对值小于或等于预设阈值,则将该邻域像素点添加入所述种子区域,重新计算所述种子区域的像素点梯度均值gmean,并将该邻域像素点作为种子像素点,继续执行s212;s214:如果二者差值的绝对值大于预设阈值,则停止向该邻域像素点生长。所述步骤s22包括:将步骤s21最终遍历得到的种子区域内的像素点梯度值保持不变;将所述种子区域外的像素点的梯度值清零,从而得到重构后的梯度图像,如图4所示。需要进一步说明的是,步骤s3采用canny边缘检测算法对所述重构后的梯度图像进行边缘检测,具体处理步骤为:(1)应用高斯滤波来平滑图像,去除噪声;(2)找寻图像的强度梯度;(3)应用非极大值抑制来消除边误检(本来不是但检测出来是);(4)应用canny算子双阈值的方法来决定可能的边界;(5)利用滞后技术来跟踪边界。最终得到所述梯度图像中作业纸张图像的边缘信息。需要补充说明的是,所述步骤s4中根据所述边缘信息,对所述作业纸张图像的边界进行定位,包括如下步骤:s41:通过直线检测方法(例如:霍夫变换)检测所述边缘信息中的直线,由于图像中存在噪声,对于同一条直线,在霍夫变换后会获得几条直线,这些直线的位置或角度稍有偏差。对于霍夫变换后得到的每一条直线都包含两个参数(ρ,ξ),其中ρ代表极径(原点到该直线的距离),ξ则代表极角(直线与x轴的角度)。在本步骤中,我们根据直线的这两个参数分别设两个阈值,并将霍夫变换后得到的任意两条直线的距离和角度差值均在阈值要求内的直线进行合并;s42:根据合并处理后的直线间相互夹角关系定位出所述作业纸张图像的边界。按照通常的作业纸张,其边界的夹角是90度,则对于合并处理后的直线,根据直线间相互夹角90度±误差值,来定位出所述作业纸张图像的边界。可以理解的是,所述步骤s5中,在提取所述作业纸张图像后,还包括:s51:对提取出来的所述作业纸张图像进行倾斜矫正;s52:对倾斜矫正后的作业纸张图像进行横向投影,并根据所述作业纸张图像的横向投影结果提取出各个题目。本发明在实际使用中,对于手动拍照得到的图像将不可避免的存在倾斜变形,因此需要执行倾斜矫正;对倾斜矫正后的作业纸张图像进行横向投影,横向投影就是每行非零像素值的个数,可知,同一个答题框内的横向投影是连续的多个非零像素,而相邻两个答题框之间区域的横向投影是全白,即零像素值,根据这一特征提取出各个题目。本发明还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由客户端的处理器执行时,使得客户端能够执行一种作业图像定位与分割方法,所述方法包括:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;对所述梯度图像进行重构处理,得到重构后的梯度图像;对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;根据所述边缘信息,对所述作业纸张图像的边界进行定位;提取所述作业纸张图像,并分割出各个题目。本发明还提供了一种对作业图像进行定位与分割的装置,包括:处理器和用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取作业图像,对所述作业图像进行预处理,并获取所述作业图像的梯度图像;对所述梯度图像进行重构处理,得到重构后的梯度图像;对所述重构后的梯度图像进行边缘检测,得到所述梯度图像中作业纸张图像的边缘信息;根据所述边缘信息,对所述作业纸张图像的边界进行定位;提取所述作业纸张图像,并分割出各个题目。可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。需要说明的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属
技术领域
的技术人员所理解。应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。本
技术领域
的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。此外,上述提到的存储介质可以是只读存储器,磁盘或光盘等。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1