一种采集答题卡的答题信息的方法及装置的制作方法

文档序号：6402702阅读：176来源：国知局

专利名称：一种采集答题卡的答题信息的方法及装置的制作方法
技术领域：
本申请涉及信息处理技术领域，特别涉及一种采集答题卡的答题信息的方法及其对应的装置。
背景技术：
随着信息化技术的发展，在一定规模的考试中对答题信息的采集已由传统人工判别方式转变为电子化处理，比如，将答卷设计为标准答题卡形式，由应试者利用铅笔等特定工具填涂候选答案区域，然后通过电子化手段识别出被填涂的区域，从而确定答题卡上的答题信息，这种电子化采集答题信息的方式大大提高了工作效率。现有技术中，一种常用的电子化手段是使用光标阅读机(OMR)采集答题卡信息。为保证光标阅读机正常工作，答题卡必须满足较高的制作要求。比如，答题卡的纸张应当具有长纤维、薄厚均匀、挺括程度、施胶度高、光滑度好、涨缩小以及印刷套印和基准边裁切精度高等特点。如果预先制作的答题卡不满足这些条件，光标阅读机(OMR)在连续阅读答题卡时可能会因纸张薄厚不均，挺括程度低、光滑度差等原因出现大量双张、卡纸等现象，因施胶度低产生掉渣、掉粉的现象，因纸张涨缩太大或印刷套印和裁切精度不够使光标阅读机定位不准，从而读不到或读错数据。另外，除这种对答题卡的制作要求外，通常还需要应试者严格按照预定的填写规范填涂答题卡。上述光标阅读机(OMR)采集答题卡信息的方式一方面提高了答题卡的制作成本，给应试者带来了不便，另一方面，在实际应用过程中，如果没有制作出完全符合上述要求的答题卡或者没有按照规范填写答题卡时，均可能导致采集到的答题信息与真实信息出现偏差，降低了采集答题卡答题信息的效率和准确性
发明内容

为解决上述技术问题，本申请实施例提供了一种采集答题卡的答题信息的方法及其对应的装置，以便在采集答题卡的答题信息过程中降低对答题卡的过高要求、降低制作成本，增加应试者的便利性，提高采集答题信息的效率和准确性。本申请提供的采集答题卡的答题信息的方法包括:获取答题卡图像，所述答题卡图像包括初略的非答题区域；在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S ；判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并判断该种子像素点的相邻像素点是否为第一预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，重新执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空；将颜色为预设颜色的像素点所包围的区域确定为答题区域；识别所述答题区域内的填涂信息以确定答题卡的答题信息。
优选地，在获取答题卡图像之后，选择种子像素点之前，所述方法还包括:将所述答题卡图像转换为灰度图，对所述灰度图内的像素点的灰度值进行非连续的数值化处理使灰度图内的像素点的灰度值的种类为有限数量。进一步优选地，所述将答题卡图像转换为灰度图具体包括:获取答题卡图像的各个像素点的RGB分量，将各个像素点的RGB分量的平均值作为相应像素点的灰度值。进一步优选地，所述非连续的数值化处理为二值化处理，则所述对灰度图内的像素点的灰度值进行非连续的数值化处理具体包括:将灰度图内的各个像素点的灰度值与预设灰度阀值进行比较，如果大于预设灰度阀值，则将该像素点的灰度值更新为第一预设灰度值；如果小于预设灰度阀值，则将该像素点的灰度值更新为第二预设灰度值。优选地，在确定答题区域之后，识别答题区域内的填涂信息之前，所述方法还包括:从初略的非答题区域向答题区域扫描，判断每次扫描线上的像素点中第一预设颜色的像素点与非预设颜色的像素点是否满足预设条件，如果满足，则将当前扫面线与答题区域的交叉处确定为答题区域的边角；将确定出来的全部边角连成的最大区域调整为便于识别答题区域内的填涂信息的答题区域。优选地，所述识别答题区域内的填涂信息确定答题卡的答题信息具体包括:计算每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数，当大于个数预设阀值时，将该大于个数预设阀值的填涂区域作为答题信息；或者，比较每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数大小，将个数排在前N位的填涂区域作为答题信息，所述N为每个题号对应的正确填涂区域的数量。优选地，通过移动终端获取答题卡图像。本申请还提供了一种采集答题卡的答题信息的装置。该装置包括:答题卡图像获取单元、种子像素点选择单元、第一判断单元、第二判断单元、答题区域确定单元和答题信息识别单元，其中:所述答题卡图像获取单元，用于获取答题卡图像，所述答题卡图像包括初略的非答题区域；所述种子像素点选择单元，用于在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S ；所述第一判断单元，用于判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并触发第二判断单元；所述第二判断单元，用于判断种子像素点的相邻像素点是否为第一预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，触发第一判断单元执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空；

所述答题区域确定单元，用于将颜色为第一预设颜色的像素点所包围的区域确定为答题区域；
所述答题信息识别单元，用于识别所述答题区域内的填涂信息以确定答题卡的答题息。优选地，所述装置还包括:答题卡图像预处理单元，该预处理单元包括灰度图转换子单元和数值化处理子单元，其中:所述灰度图转换子单元，用于在获取答题卡图像之后、选择种子像素点之前，将所述答题卡图像转换为灰度图；所述数值化处理子单元，用于对所述灰度图内的像素点的灰度值进行非连续的数值化处理使灰度图内的像素点的灰度值的种类为有限数量。进一步优选地，所述灰度图转换子单元将答题卡图像转换为灰度图具体包括:获取答题卡图像的各个像素点的RGB分量，将各个像素点的RGB分量的平均值作为相应像素点的灰度值。进一步优选地，非连续的数值化处理为二值化处理，则所述数值化处理子单元对灰度图内的像素点的灰度值进行非连续的数值化处理具体包括:将灰度图内的各个像素点的灰度值与预设灰度阀值进行比较，如果大于预设灰度阀值，则将该像素点的灰度值更新为第一预设灰度值；如果小于预设灰度阀值，则将该像素点的灰度值更新为第二预设灰度值。优选地，所述装置还包括答题区域纠偏单元，该纠偏单元包括答题区域边角确定子单元和答题区域调整子单元，其中:所述答题区域边角·确定子单元，用于在确定答题区域之后，识别答题区域内的填涂信息之前，从初略的非答题区域向答题区域扫描，判断每次扫描线上的像素点中第一预设颜色的像素点与非预设颜色的像素点是否满足预设条件，如果满足，则将当前扫描线与答题区域的交叉处确定为答题区域的边角；所述答题区域调整子单元，用于将确定出来的全部边角连成的最大区域调整为便于识别答题区域内的填涂信息的答题区域。优选地,所述答题信息识别单元包括像素点个数计算子单元或像素点个数比较子单元，其中:所述像素点个数计算子单元，用于计算每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数，当大于个数预设阀值时，将该大于个数预设阀值的填涂区域作为答题信息；所述像素点个数比较子单元，用于比较每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数大小，将个数排在前N位的填涂区域作为答题信息，所述N为每个题号对应的正确填涂区域的数量。本申请实施例在获得答题卡图像后从初略的非答题区域中选择种子像素点构建集合，然后对该集合内像素点及其相邻像素点进行遍历判断像素点是否为预设颜色，如果是，则将其移除集合，如果否，则将其加入到该集合中，循环执行上述步骤直至集合为空，在集合为空后即可借此确定答题区域，进而通过识别该答题区域确定答题卡上的答题信息。与现有技术相比，由于本申请实施例是通过获取答题卡图像并对答题卡的图像进行处理得到答题信息，在采集答题卡的答题信息过程中对答题卡没有特殊的要求，降低了答题卡的制作成本。此外，本申请实施例对应试者采用何种工具进行填涂也没有专门需求，增加了应试者的便利性。再者，由于对答题卡的制作和应试者采用工具没有特殊规定，将不再产生因答题卡制作或填涂工具不规范带来的答题卡效率和准确性的问题，即提高了答题信息的效率和准确性。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本申请的采集答题卡的答题信息的方法实施例的流程图；图2为一种示例性的常用的答题卡样本；图3为矩形答题卡中的答题区域和非答题区域对比示意图；图4(a)为未进行预处理的答题卡图像；图4(b)为经过预处理后的答题卡图像；图5(a)为纠偏处理过程中扫描线和扫描线移动方向示意图；图5(b)为未进行纠偏处理的答题区域形状示意图；图5(c)为经·过纠偏处理后的答题区域形状示意图；图6为本申请的采集答题卡的答题信息的装置实施例的结构框图。
具体实施例方式为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。参见图1，该图示出了本申请的采集答题卡的答题信息的方法实施例的流程。该流程包括:步骤SlOl:获取答题卡图像，所述答题卡图像包括初略的非答题区域；对于答题卡而言，通常包括用于应试者作答的答题区域和答题卡边缘等部分的非答题区域。参见图2，该图示例性地出了一种常用的答题卡样本，在该答题卡中黑框圈定的矩形区域为答题区域，黑框向外到答题卡边线的区域为非答题区域。一般而言，在获取答题卡图像时较难准确地仅仅获取到答题区域。因此，大多数情况下，获取到的答题卡图像将包括两部分，即答题区域和非答题区域，答题区域是应试者答题的区域，包含答题信息，非答题区域是答题区域之外的部分，用于裁剪、装订、标识文字等。在未对答题卡图像进行处理之前，答题区域与非答题区域之间的划分边界是大致而初略的，即对于电子化设备而言，在答题卡图像未进行特殊处理时，其并不清楚哪些像素点所在的区域为答题区域，哪些像素点之外的区域为非答题区域，但通常情况下，靠近答题卡边缘部分的像素点处于非答题区域，靠近答题卡的中心部分的像素点为答题区域。需要说明的是:在上述描述中，以图2所示的答题卡为例进行了说明，但本申请实施例对答题卡的具体形状并不作任何限制，其可以为矩形、三角形，甚至不规则的形状，只要它们具有答题区域和非答题区域即能满足实现本申请发明目的需要。对于获取答题卡图像的方式和工具，本申请实施例同样不作任何限制，在实际应用过程中可以根据具体情况进行选择。比如，对于获取答题卡图像的方式，可以是静态的，也可以是动态的，前者如预先将答题卡图像存储到一个图像库中，当需要对图像库中的答题卡图像进行处理并获取其答题信息时，再可从图像库中读入需要的答题卡图像；后者如直接通过现场采集答题卡图像获取，不进行预先存储(或缓存)。对于获取答题卡图像的工具，可以是一切具有拍摄功能的影像设备，比如照相机。考虑到便利性问题，本申请优选采用移动终端来获取答题卡图像，但在使用移动终端获取答题卡图像时，通常情况下必须考虑移动终端CPU的处理能力，拍摄的答题卡图像的像素应当与移动终端CPU的处理能力相适应。步骤S102:在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S;在答题卡中确定了初略的非答题区域后，即可从该区域中选择一个或多个像素点作为种子像素点，将选择的种子像素点放入预先构建的集合S内。这里选择种子像素点的方式可以是随机选择，因为本申请实施例采取“逐渐收拢”的方式逼近真实的答题区域与非答题区域的分界线，任一选择的种子像素点都会呈现“收敛”态势，其并不会因随机选择种子像素点而影响到答题区域和非答题区域的真实界限的确定。当然，在实际应用过程中，为了加快处理的收敛速度，可以按照一定的预设规则选择种子像素点，比如，在答题卡规则的矩形情形下，可以在答题卡的多个边角处选择种子像素点，一种优选的方式是从答题卡的左上、左下、右上、右下处分别选择I个点作为种子像素点放入集合S之中。此外，在实际应用过程中，考虑到某些情况下初略的答题区域也可能出现与答题区域的外框线相同的预设颜色(第一预设颜色)的区域，为避免出现“收拢”错误，优选种子像素点为非第一预设颜色的像素点。步骤S103:判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并判断该种子像素点的相邻像素点是否为第一预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，重新执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空；所述第一预设颜色与答题区域的外包络线的颜色相同；本步骤的最终目的在于寻找答题区域与非答题区域之间的界限，该步骤采取在非答题区域选择一个像素点后，如果该像素点不是预设的颜色，比如白色(假设预设的颜色为黑色)，则将该点填充为黑色，并考察该像素点的相邻像素点的颜色，如果该相邻像素点也不是预设的颜色，则将其填充为黑色，并将其放入集合S中作为新的种子像素点，以便在下一次继续判断其相邻像素点的颜色。由于初略答题区域内原本为黑色的像素点不会进入集合S之中，原本为白色的像素点将被填充为黑色，且该像素点将放入集合S之中，并进一步考察其相邻像素点的黑白情况，从而通过这种方式使初略的答题区域向着答题区域方向逐渐变为黑色，由于答题卡的答题区域在其外围具有一个明显的黑色线(该黑色线由答题卡的中心向边缘方向具有多层像素点)，这种方式将在答题区域的黑色线处停下来，即集合S变为空。步骤S104:将颜色为第一预设颜色的像素点所包围的区域确定为答题区域；通过前述步骤的“逐渐进逼”的方式，将在答题卡图像中明显区分为两个区域，以前述黑白色为例，一个区域为全黑的黑色区域，另一个区域为非全黑的杂色区域，这两个不同区域色的交界线即为答题区域和非答题区域的真实分界线，即颜色为第一预设颜色的像素点所包围的区域即为答题区域。参见图3，该图示例性地给出了在答题卡为矩形形状下答题区域和非答题区域区分的情况，图中外围黑色部分为非答题区域，被黑色区域包围的以白色为主的杂色部分为答题区域。步骤S105:识别所述答题区域内的填涂信息以确定答题卡的答题信息。通过前述步骤准确确定答题区域后，即可识别答题区域的填涂信息，进而确定答题卡的答题信息。识别答题区域内的填涂信息的方式较多，比如:一种方式是:先计算每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数，这里的第二预设颜色可以与第一预设颜色相同，也可以不同，可以是任何一种方便应试者的颜色，以前述黑白色为例，即是计算每个填涂区域内的黑色像素点的个数，当该个数大于个数预设阀值时，说明将应试者填涂了该区域，则该填涂区域即是答题信息。举例而言，假设每个题号对应4个填涂区域A、B、C、D，依次计算这4个填涂区域内黑色像素点的个数，计算出来的个数值分别为O、100、0、0，将其预设的个数阀值50进行比较，发现B填涂区域的黑色像素点个数大于预设阀值50，其他A、C、D像素点小于预设阀值50，则说明B即是应试者填涂的答案。另一种方式是:先比较每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数大小，将个数排在前N位的填涂区域作为答题信息，所述N为每个题号对应的正确填涂区域的数量。这种方式与上述方式不同的是各个填涂区域相互进行比较，对比较结果按序确定答题信息。举例而言，假设每个题号对应5个填涂区域A、B、C、D、E，依次计算这5个填涂区域内黑色像素点的个数，计算出来的个数值分别为0、100、20、80、90，对它们进行排序后为100 (B)、90 (E)、80 (D)、20 (C)、0 (A)，如果预先规定的正确答案个数为3个，则选择B、E、D这3个作为应试者的答题信息。前述两种方式在实际应用过程中既可以单独适用，也可以混合使用，比如，对于单选题，可以采用第一种方式，对于多选题可以采用第二种方式。除了上述这些方式外，实际上还可以采用任何其他能够识别出答题信息的方式，比如，如果是单项选择题，在计算出各个填涂区域的预设颜色像素点个数后，选择这些个数最大的那个填涂区域作为应试者的答题信息，如果是不定项选择题，在计算出各个填涂区域的预设颜色像素点个数后，将这些个数逐一与预设阀值进行比较，大于阀值的填涂区域即可作为应试者的答题信息。需要说明的是:在确定答题卡上每个题号对应的填涂区域时，可以采用与母版答题卡匹配的方式，比如，母版答题卡中记录了每个填涂区域的坐标范围，当填涂区域为矩形时，以矩形的左上角坐标(xl，yl)和右下角标坐标(x2，y2)表示填涂区域，当对答题卡图像进行处理识别出答题区域后，即可根据该答题区域中的坐标值与母版答题卡答题区域中的坐标进行匹配，确定填涂区域。举例而言，当母版答题卡中题号为2的A填涂区域的坐标值为[(xl，yl)，(x2，y2)]，在答题卡图像中的答题区域也找到了坐标值为[(xl，yl), (x2, y2)]的区域，则可以确定该区域即为A填涂区域。再比如，可以根据预设的答题卡的每个填涂区域的大小，结合整个答题卡的面积确定每个填涂区域。本实施例在获得答题卡图像后从初略的非答题区域中选择种子像素点构建集合，然后对该集合内像素点及其相邻像素点进行遍历判断像素点是否为预设颜色，如果是，则将其移除集合，如果否，则将其加入到该集合中，循环执行上述步骤直至集合为空，在集合为空后即可借此确定答题区域，进而通过识别该答题区域确定答题卡上的答题信息。与现有技术相比，本实施例可以取得如下的技术效果:(I)由于本实施例是通过获取答题卡图像并对答题卡的图像进行处理得到答题信息而非直接针对答题卡本身进行，使答题卡采用何种材质，是否具有长纤维、薄厚均匀、挺括程度、施胶度高、光滑度好、涨缩小以及印刷套印和基准边裁切精度高等特点对处理结果均不发生大的影响，即对答题卡没有特殊的要求，降低了答题卡的制作成本。(2)由于本实施例对答题卡的制作没有特殊要求，使得并不会因为答题卡的制作缺陷给采集答题卡上的答题信息的准确性和效率受到影响，也即是说，整体而言，本实施例提高了采集答题信息的准确性和效率。据测试，采用本实施例的技术方案平均只需要300ms左右即可识别出答题卡信息，识别的正确率能够达到95 %以上。(3)由于本实施例是将填涂区域的预设颜色的像素点个数与预设阀值进行比较来确定答题信息，不再采用识别C含量(比如以2B铅笔填涂)的多少来确定是否填涂某个区域，使应试者可以采用任何颜色的填涂工具均可，只要该填涂工具的颜色为预先规定的，就不会妨碍对答题卡的答题信息的采集，由此可见，在本实施例中，对应试者采用何种工具进行填涂没有专门需求，增加了应试者的便利性。上述实施例详细介绍了本申请的技术方案，其已实现了本申请的发明目的，取得了相应的技术效果。但是，在实际应用过程中，在某些情况下，还可以对上述实施例进行变形，以获得更优的效果。如，拍照设备在获取答题卡图像时通常受设备硬件限制以及拍照时周围光线的影响，使获得的答题卡图像出现图像质量不高、光线不均匀等现象。这些现象将降低答题信息采集的准确性。为此，本申请优选在获取答题卡图像之后，选择种子像素之前，对答题卡图像按照如下的方式进行预处理:将所述答题卡图像转换为灰度图，对所述灰度图内的像素点的灰度值进行非连续的数值化处理使灰度图内的像素点的灰度值的种类为有限数量。图4示出经过上述预处理前后的答题卡图像，其中图4(a)是预处理前的答题卡图像；图4(b)是预处理后的答题卡图像。下面对该预处理过程进行具体说明:将答题卡图像转换为灰度图的目的在于去除杂色对采集答题卡答题信息的干扰，使答题卡的图像尽可能均匀、锐化，转换灰度图的具体实现方式较多，这里示意性的给出一种方法:均值法，该方法对于答题卡图像的每个像素点，先获取其RGB分量，即红(R)、绿(G)、蓝(B)三个分量的值，然后求其平均值，将该平均值作为该像素点的灰度值，公式如下:Point(R, G, B) = Point((R+G+B)/3，(R+G+B)/3，(R+G+B)/3)式中:Point表示一个像素点的色值，R代表红色分量值，G代表绿色分量值，B代表蓝色分量值。对像素点的灰度值进行非连续的数值化处理的目的在于使待处理的图像的颜色数量减少，有利于后续的处理。该过程是将灰度图内的像素点的色度值由整体上连续转换为有限的离散的几个灰度值。一种实现上述目的的方式是进行“二值化”处理，即将灰度图的色度值的数量变为两种，比如黑白两色。具体过程为:将灰度图内的各个像素点的灰度值与预设灰度阀值进行比较，如果大于预设灰度阀值，则将该像素点的灰度值更新为第一预设灰度值(比如黑色)；如果小于预设灰度阀值，则将该像素点的灰度值更新为第二预设灰度值(比如白色)。在实际应用时，还可能采用进一步的优化措施:将整个灰度图划分为N个小正方形的格式(比如，每个格子大小为50X50像素)，然后对于每个格子，计算其内像素点的平均灰度值，以该平均灰度值作为二值化的阈值，灰度值小于该阈值的点设置为一个预设灰度值，灰度值大于该阈值的点设置为另一个预设灰度值。还比如，在某些情况下，对答题卡进行拍摄时拍摄的角度可能与答题卡不正对，这时获取到的答题卡图像将出现偏斜，如果不进行“纠偏”，将影响到对答题区域内填涂区域的识别。为此，本申请优选在确定答题区域之后，识别答题区域内的填涂信息之前，对确定的答题区域进行纠偏处理，具体过程如下:第一步骤:从初略的非答题区域向答题区域扫描，判断每次扫描线上的像素点中预设颜色的像素点与非预设颜色的像素点是否满足预设条件，如果满足，则将当前扫描线与答题区域的交叉处确定为答题区域的边角；实现对答题区域的纠偏处理，需要先确定答题区域的边角，本步骤的目的即在于确定答题区域的边角。以答题区域为矩形区域为例，可以先从答题卡图像的左上角划出一条自左下到右上的线作为扫描线，然后将该扫描线自左上角向右下角移动，即从初略的非答题区域向答题区域扫描，参见图5(a)所示，图中不带箭头的出现表示扫描线，待箭头的线表示扫描线移动方向，每扫描一次，计算该扫描线覆盖的像素点中预设颜色的像素点和非预色颜色像素点的数量，判断这些像素点的数量是否满足预设条件，如果满足，则说明当前扫描线与答题区域的交叉处即是答题区域的左上边角。同理，可以按照上述方式找到答题区域的左下、右上、右下边角，最终确定的答题区域的边角如图5(a)中四个白色圆圈所示。需要说明的是:这里的预设条件可以是各种不妨碍发明目的实现的条件。比如，在以白色像素点为预设颜色的像素点、以黑色为非预设颜色的像素点的情况下，预设条件可以为白色像素点的数量达到预设阀值，当通过前述步骤计算出某次扫描线上的白色像素点的数量达到预设阀值(如30个)，其余像素点均为黑色时，则可以认为寻找到了答题区域的边角。还比如，预设条件可以为白色像素点的数量与黑色像素点的数量之间的比值是否为预设阀值，当通过前述步骤计算出某此扫描线上的两类像素点的比值达到预设阀值，则可以认为寻找到了答题区域的边角。需要说明的是:答题卡的边角可以确定得尽可能小，以致该边角即为答题卡的四个顶点，为达到这个目的，可以在寻找到满足预设条件的扫描线后，将该扫描线向后回退，退到仅有一个或预设数量的白色像素点时，将此时的扫描线与答题区域交叉处确定为边角(或顶点)。采用这种“先前进后回退”的方式的目的另一方面还在于可以避免“误判”，即将非答题区域内因填充第一预设像素不完全出现的个别像素点颜色为非第一预设像素的连片区域确定为答题区域的边角(或顶点)。第二步骤:将确定出来的全部边角连成的最大区域调整为便于识别答题区域内的填涂信息的答题区域。仍以答题区域为矩形区域为例，按照前述第一步的方式可以确定出答题区域的4个边角，然后将这4个边角连接起来，即构成待调整的答题区域，沿着该答题区域的边线切割下答题区域，再将其拉伸为矩形，从而实现了对图像的纠偏处理。参见图5(b)、5 (c)，其中:图5(b)是纠偏处理前的答题区域的形状，图5 (c)是纠偏处理后的答题区域的形状。对答题区域纠偏后，大大方便了对大题区域内的填涂信息的识别，提高了识别填涂信息的准确性。上述内容详细叙述了本申请的采集答题卡的答题信息的方法实施例，相应地，本申请还提供了一种采集答题卡的答题信息的装置实施例。参见图6，该图示出了本申请的采集答题卡的答题信息的装置的结构框图。该装置包括:答题卡图像获取单元601、种子像素点选择单元602、第一判断单元603、第二判断单元604、答题区域确定单元605和答题信息识别单元606，其中:答题卡图像获取单元601，用于获取答题卡图像，所述答题卡图像包括初略的非答题区域；种子像素点选择单元602，用于在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S ；第一判断单元603，用于判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并触发第二判断单元；第二判断单元604，用于判断种子像素点的相邻像素点是否为预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，触发第一判断单元执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空；所述第一预设颜色与答题区域的外包络线的颜色相同；答题区域确定单元605，用于将颜色为预设颜色的像素点所包围的区域确定为答题区域；答题信息识别单元606，用于识别所述答题区域内的填涂信息以确定答题卡的答题息。本装置实施例的工作过程是:在答题卡图像获取单元601获取到包括初略的非答题区域的答题卡图像后，种子像素点选择单元602在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S，然后由第一判断单元603判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并触发第二判断单元604，由其判断种子像素点的相邻像素点是否为预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，触发第一判断单元603执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空。此后，由答题区域确定单元605将颜色为预设颜色的像素点所包围的区域确定为答题区域，最后，答题信息单元606识别所述答题区域内的填涂信息以确定答题卡的答题信息。本装置实施例在获得答题卡图像后从初略的非答题区域中选择种子像素点构建集合，然后对该集合内像素点及其相邻像素点进行遍历判断像素点是否为预设颜色，如果是，则将其移除集合，如果否，则将其加入到该集合中，循环执行上述步骤直至集合为空，在集合为空后即可借此确定答题区域，进而通过识别该答题区域确定答题卡上的答题信息。与现有技术相比，由于本装置实施例是通过获取答题卡图像并对答题卡的图像进行处理得到答题信息，在采集答题卡的答题信息过程中对答题卡没有特殊的要求，降低了答题卡的制作成本。此外，本申请实施例对应试者采用何种工具进行填涂也没有专门需求，增加了应试者的便利性。再者，由于对答题卡的制作和应试者采用工具没有特殊规定，将不再产生因答题卡制作或填涂工具不规范带来的答题卡效率和准确性的问题，即提高了答题信息的效率和准确性。上述装置实施例在某些情况下还可以进行进一步改进优化。比如，上述装置实施例还可以包括:答题卡图像预处理单元607，该预处理单元包括灰度图转换子单元6071和数值化处理子单元6072，其中:灰度图转换子单元6071，用于在获取答题卡图像之后、选择种子像素点之前，将所述答题卡图像转换为灰度图。该子单元将答题卡图像转换为灰度图可以按照如下方式实现:获取答题卡图像的各个像素点的RGB分量，将各个像素点的RGB分量的平均值作为相应像素点的灰度值；数值化处理子单元6072，用于对所述灰度图内的像素点的灰度值进行非连续的数值化处理使灰度图内的像素点的灰度值的种类为有限数量。当上述的非连续的数值化处理为“二值化”处理时，数值化处理子单元6072对灰度图内的像素点的灰度值进行非连续的数值化处理可以按照如下方式实现:将灰度图内的各个像素点的灰度值与预设灰度阀值进行比较，如果大于预设灰度阀值，则将该像素点的灰度值更新为第一预设灰度值；如果小于预设灰度阀值，则将该像素点的灰度值更新为第二预设灰度值。通过这种对答题卡图像的预处理，可以克服拍摄图像受到拍摄设备硬件限制或者周围光线引起的图像质量不高、光线不均匀等缺陷，从而减少这些外在因素对采集答题卡上的答题信息的准确性和效率的影响。还比如,上述装置实施例还可以包括答题区域纠偏单元608,该纠偏单元包括答题区域边角确定子单元6081和答题区域调整子单元，其中:答题区域边角确定子单元6081，用于在确定答题区域之后，识别答题区域内的填涂信息之前，从初略的非答题区域向答题区域扫描，判断每次扫描线上的像素点中预设颜色的像素点与非预设颜色的像素点是否满足预设条件，如果满足，则将当前扫面线与答题区域的交叉处确定为答题区域的边角；答题区域调整子单元6082，用于将确定出来的全部边角连成的最大区域调整为便于识别答题区域内的填涂信息的答题区域。除上述通过在上述装置实施例基础上增加功能单元以扩展优化技术效果的方式夕卜，还可以通过进一步细化上述装置实施例的结构组成实现效果优化。比如，上述答题信息识别单元606可以具有多种具体实现方式，不同的实现方式对应着不同的结构组成。本申请优选答题信息识别单元606包括:像素点个数计算子单元6061或像素点个数比较子单元，其中:所述像素点个数计算子单元，用于计算每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数，当大于个数预设阀值时，将该大于个数预设阀值的填涂区域作为答题信息；像素点个数比较子单元，用于比较每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数大小，将个数排在前N位的填涂区域作为答题信息，所述N为每个题号对应的正确填涂区域的数量。
需要说明的是:为了叙述的简便，本说明书的上述实施例以及实施例的各种变形实现方式重点说明的都是与其他实施例或变形方式的不同之处，各个情形之间相同相似的部分互相参见即可。尤其，对于装置实施例的几个改进方式而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例的各单元可以是或者也可以不是物理上分开的，既可以位于一个地方，或者也可以分布到多个网络环境下。在实际应用过程中，可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的，本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。以上所述仅是本申请的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。
权利要求
1.一种采集答题卡的答题信息的方法，其特征在于，所述方法包括: 获取答题卡图像，所述答题卡图像包括初略的非答题区域；在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S ；判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并判断该种子像素点的相邻像素点是否为第一预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，重新执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空；所述第一预设颜色与答题区域的外包络线的颜色相同；将颜色为第一预设颜色的像素点所包围的区域确定为答题区域；识别所述答题区域内的填涂信息以确定答题卡的答题信息。
2.根据权利要求1所述的方法，其特征在于，在获取答题卡图像之后，选择种子像素点之前，所述方法还包括:将所述答题卡图像转换为灰度图，对所述灰度图内的像素点的灰度值进行非连续的数值化处理使灰度图内的像素点的灰度值的种类为有限数量。
3.根据权利要求2所述的方法，其特征在于，所述将答题卡图像转换为灰度图具体包括: 获取答题卡图像的各个像素点的RGB分量，将各个像素点的RGB分量的平均值作为相应像素点的灰度值。
4.根据权利要求2所述的方法，其特征在于，所述非连续的数值化处理为二值化处理，则所述对灰度图内的像素点的灰度值进行非连续的数值化处理具体包括: 将灰度图内的各个像素点的灰度值与预设灰度阀值进行比较，如果大于预设灰度阀值，则将该像素点的灰度值更新为第一预设灰度值；如果小于预设灰度阀值，则将该像素点的灰度值更新为第二预设灰度值。
5.根据权利要求1所述的方法，其特征在于，在确定答题区域之后，识别答题区域内的填涂信息之前，所述方法还包括: 从初略的非答题区域向答题区域扫描，判断每次扫描线上的像素点中预设颜色的像素点与非预设颜色的像素点是否满足预设条件，如果满足，则将当前扫描线与答题区域的交叉处确定为答题区域的边角；将确定出来的全部边角连成的最大区域调整为便于识别答题区域内的填涂信息的答题区域。
6.根据权利要求1所述的方法，其特征在于，所述识别答题区域内的填涂信息确定答题卡的答题信息具体包括: 计算每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数，当大于个数预设阀值时，将该大于个数预设阀值的填涂区域作为答题信息；或者，比较每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数大小，将个数排在前N位的填涂区域作为答题信息，所述N为每个题号对应的正确填涂区域的数量。
7.根据权利要求1至6中任何一项所述的方法，其特征在于，通过移动终端获取答题卡图像。
8.一种采集答题卡的答题信息的装置，其特征在于，该装置包括:答题卡图像获取单元、种子像素点选择单元、第一判断单元、第二判断单元、答题区域确定单元和答题信息识别单兀，其中: 所述答题卡图像获取单元，用于获取答题卡图像，所述答题卡图像包括初略的非答题区域；所述种子像素点选择单元，用于在所述初略的非答题区域内选择至少一个像素点作为种子像素点放入集合S ；所述第一判断单元，用于判断集合S内的种子像素点的颜色是否为第一预设颜色，如果不是，则将该种子像素点填充为第一预设颜色，并触发第二判断单元；所述第二判断单元，用于判断种子像素点的相邻像素点是否为第一预设颜色，如果不是，则将该相邻像素点填充为第一预设颜色，从集合S中移除所述种子像素点，并将该相邻像素点作为新的种子像素点放入集合S，触发第一判断单元执行判断集合S内的种子像素点的颜色是否为第一预设颜色的步骤，直至集合S为空；所述第一预设颜色与答题区域的外包络线的颜色相同；所述答题区域确定单元，用于将颜色为第一预设颜色的像素点所包围的区域确定为答题区域；所述答题信息识别单元，用于识别所述答题区域内的填涂信息以确定答题卡的答题信肩、O
9.根据权利要求8所述的装置，其特征在于，所述装置还包括:答题卡图像预处理单元，该预处理单元包括灰度图转换子单元和数值化处理子单元，其中: 所述灰度图转换子单元，用于在获取答题卡图像之后、选择种子像素点之前，将所述答题卡图像转换为灰度图；所述数值化处理子单元，用于对所述灰度图内的像素点的灰度值进行非连续的数值化处理使灰度图内的像素点的灰度值的种类为有限数量。
10.根据权利要求9所述的装置，其特征在于，所述灰度图转换子单元将答题卡图像转换为灰度图具体包括: 获取答题卡图像的各个像素点的RGB分量，将各个像素点的RGB分量的平均值作为相应像素点的灰度值。
11.根据权利要求9所述的装置，其特征在于，所述非连续的数值化处理为二值化处理，则所述数值化处理子单元对灰度图内的像素点的灰度值进行非连续的数值化处理具体包括: 将灰度图内的各个像素点的灰度值与预设灰度阀值进行比较，如果大于预设灰度阀值，则将该像素点的灰度值更新为第一预设灰度值；如果小于预设灰度阀值，则将该像素点的灰度值更新为第二预设灰度值。
12.根据权利要求8所述的装置，其特征在于，所述装置还包括答题区域纠偏单元，该纠偏单元包括答题区域边角确定子单元和答题区域调整子单元，其中: 所述答题区域边角确定子单元，用于在确定答题区域之后，识别答题区域内的填涂信息之前，从初略的非答题区域向答题区域扫描，判断每次扫描线上的像素点中第一预设颜色的像素点与非预设颜色的像素点是否满足预设条件，如果满足，则将当前扫描线与答题区域的交叉处确定为答题区域的边角；所述答题区域调整子单元，用于将确定出来的全部边角连成的最大区域调整为便于识别答题区域内的填涂信息的答题区域。
13.根据权利要求8所述的装置，其特征在于，所述答题信息识别单元包括像素点个数计算子单元或像素点个数比较子单元，其中: 所述像素点个数计算子单元，用于计算每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数，当大于个数预设阀值时，将该大于个数预设阀值的填涂区域作为答题息; 所述像素点个数比较子单元，用于比较每个题号对应的各个填涂区域内具有第二预设颜色的像素点的个数大小，将个数排在前N位的填涂区域作为答题信息，所述N为每个题号对应的正确填涂区域的数量。`
全文摘要
本申请实施例公开了一种采集答题卡的答题信息的方法。该方法包括获取包括初略的非答题区域的答题卡图像；在非答题区域内选择至少一个像素点作为种子像素点放入集合；在集合内的种子像素点的颜色为非预设颜色，时，将其填充为第一预设颜色，并在该种子像素点的相邻像素点为非预设颜色，时，将该相邻像素点填充为预设颜色，移除前述种子像素点，将该相邻像素点作为新的种子像素点放入集合，重新执行上述判断步骤，直至集合为空；将为预设颜色的像素点包围的区域确定为答题区域；识别答题区域内的填涂信息确定答题卡的答题信息。本申请还公开了一种采集答题卡的答题信息的装置。本申请实施例可降低成本，方便应试者，提高识别准确性和效率。
文档编号G06K9/00GK103246873SQ20131015714
公开日2013年8月14日申请日期2013年4月28日优先权日2013年4月28日
发明者李勇, 唐巧, 郭常圳申请人:北京贞观雨科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李勇;唐巧;郭常圳
技术所有人：北京贞观雨科技有限公司
我是此专利的发明人

上一篇：指纹遥控器验证设备的制作方法
上一篇：一种基于目录级可伸缩的Bloom Filter位图表的并行文件搜索方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。