一种基于增强现实技术的教学方法及系统与流程

文档序号：17669256发布日期：2019-05-15 22:56阅读：131来源：国知局

本发明属于信息技术领域，具体地，涉及一种基于增强现实技术的教学方法及系统。

背景技术：

目前的教学过程中，普遍使用图书、玩具、实物教具等实体教学物品，随着教育信息化的不断推进，电视机(电子显示屏)、电子白板、投影仪、交互一体机等电子设备大量进入课堂，越来越多的教学内容开始以数字化的方式呈现。

基于认知心理学和神经教育学的大量研究说明，实物操作对于学生感受真实的世界、理解和掌握抽象知识有极大的意义。但电子课件属于平面式的展示形式，并不包括对实际物体或教具的接触与使用，例如，对幼儿园和小学低年级学生来说，从游戏式、体验式学习为主的课堂环境，逐渐步入以抽象课本、集中教学为主的课堂环境是巨大的挑战，再加上他们年龄小、注意力集中时间短，面对枯燥的平面化、抽象化的学习内容，很容易疲劳和走神，因此纯电子课件式的教学也存在其局限性。

当前的课堂逐渐演变为传统玩教具和电子设备共存的室内教学环境，虽然环境较过往使用粉笔、黑板的教学方式有了诸多的改进，但依然无法解决实体教学物品与电子课件内容之间缺乏联系，课堂互动体验不佳，无法实现课堂数据的采集分析以及对个性化教学支持不足等问题。

技术实现要素：

本发明提供了一种基于增强现实技术的教学方法及系统，解决了现有技术中实体教学与电子课件缺乏联系，无法开展个性化教学的问题，提高了课堂互动体验。

为了实现上述目的，本发明提供了一种基于增强现实技术的教学系统，所述教学系统包括一个或多个摄像头、增强现实装置及教学道具，其中，

所述教学道具包含边框及位于所述边框内的教学内容区，和/或，所述教学道具包含一个或多个不同颜色的三维多边形道具；

所述一个或多个摄像头用于采集所述教学道具的图像；

所述增强现实装置通过有线或无线方式连接所述一个或多个摄像头，用于对采集到的所述教学道具的图像进行增强现实处理，识别出所述图像中的教学内容信息，并输出所述教学内容信息。

可选地，在本发明提供的另一实施例中，所述教学系统还包括显示装置，所述显示装置内置或独立于所述增强现实装置，用于显示所述输出的教学内容。

可选地，在本发明提供的另一实施例中，所述教学道具还包括方向标识，所述方向标识位于所述内容区域内，或置于所述边框上。

可选地，在本发明提供的另一实施例中，本发明实施例还提供当所述教学道具包含边框及位于所述边框内的教学内容区时，则所述增强现实装置用于对采集到的图像进行增强现实处理，识别出所述图像中的教学内容信息，包括：

所述增强现实装置用于识别出所述教学道具图像中的边框，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息。

可选地，在本发明提供的另一实施例中，当所述摄像头采集图像范围内出现所述至少两个教学道具时，则所述增强现实装置用于识别出所述图像中的教学内容信息，并输出所述教学内容，包括：

所述增强现实装置用于识别出所述至少两个教学道具的教学内容信息，并根据所述至少两个教学道具的摆放距离，将所述教学内容信息进行组合，输出组合后的教学内容信息。

本发明实施例还提供了一种基于增强现实技术的教学方法，所述教学方法包括：

一个或多个摄像头采集教学道具的图像，所述教学道具包含边框及位于所述边框内的教学内容区，和/或，所述教学道具包含一个或多个不同颜色的三维多边形道具；

增强现实装置对采集到的所述教学道具的图像进行增强现实处理，识别出所述图像中的教学内容信息，输出所述教学内容信息。

可选地，当所述教学道具包含边框及位于所述边框内的教学内容区时，则所述增强现实装置对采集到的图像进行增强现实处理，识别出所述图像中的教学内容信息，包括：

识别出所述教学道具图像中的边框，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息。

可选地，所述识别出所述教学道具图像中的边框，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息，包括：

对所述图像进行二值化处理、几何形态分析、聚类分析处理，识别出所述边框的拟合数据，确定所述边框的位置及所述边框内教学内容区的位置，并利用机器学习法识别出所述边框内教学内容区中的教学内容信息。

可选地，当所述教学道具还包括方向标识，则所述确定所述边框的位置及所述边框内教学内容区的位置之后，还包括：

识别出所述方向标识，并按照所述方向标记将所述边框及所述教学内容区的位置转正。

可选地，当所述摄像头采集图像范围内出现所述至少两个教学道具时，则所述增强现实装置用于识别出所述图像中的教学内容信息，并输出所述教学内容，包括：

本发明实施例的方法及系统具有下列优点：

本发明实施例中，通过摄像头、增强现实装置与教学道具的组合，使得实体的教学道具能够被摄像头采集并被增强现实装置识别，从而实现人机交互，能够更好的帮助幼儿或小学生进行更加巨像的学习与互动，同时通过本发明实施例提供的识别方法，根据方向标识，可识别出任意角度摆放的教学道具，同时可根据任意两张教学卡摆放位置的远近，确定是否进行教学内容的组合，相比于传统的ar识别，提高了识别率及识别速度。

附图说明

图1是本发明实施例1中基于增强显示技术的教学组成架构图；

图2a是本发明实施例1中教学工具边框及教学内容区示意图；

图2b是本发明实施例1中教学工具带方向标识的边框及教学内容区示意图；

图2c是本发明实施例1中教学工具边框及教学内容区另一示意图；

图3是本发明实施例1中教学系统在实际应用场景中的示意图；

图4是本发明实施例2中增强现实装置结构示意图；

图5是本发明实施例3中基于ar技术的教学方法流程图；

图6是本发明实施例3中识别教学工具方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例1

为达到以上目的，如图1所示，本发明提供了一种基于增强现实技术的教学系统100，该系统包括：一个或多个摄像头101、增强现实装置102及教学道具103，其中，

教学道具103包含边框及位于所述边框内的教学内容区，和/或，所述教学道具103包含一个或多个不同颜色的三维多边形道具；

教学道具可以是单独的拼音、声调、汉字或数字的教学卡(教学卡材质可以是纸片、塑料片、木质、橡胶或金属片等材质)，也可以是拼音、汉字和/或数字的组合教学卡，还可以是某些印有拼音、声调、汉字或数字的教具，例如书本、小棍、直尺、三角尺、教尺/教鞭、圆规等常规教具。目前市面上应用于现实增强教学的教学道具中，均是采用具备二维码或射频识别等具备特定识别标识的一些教学道具，而本发明实施例中，创造性地提出了一种全新的教学道具，区别于目前市面上所有的教学道具，本发明实施例中，教学道具103具备边框，该边框可以呈封闭式(或半封闭式)且具备一定宽度，边框颜色与教学内容区的底色区别明显，例如边框颜色可以是黑色，教学内容区底色可以是白色，或者，边框颜色为白色，教学内容区颜色为黑色(如图2a所示)。边框为多边形，如三角形、矩形、菱形和梯形等，边框也可以为椭圆、正圆形。为了方便说明，本发明实施例以四边形教学卡为例，如图2a所示，该四边形可以为方形或近似方形，如正方形、长方形、圆角矩形等，且边框与教学内容区间隔一定的宽度。教学道具103具备边框这一特征具备如下技术效果：可通过增强显示技术快速定位并识别出边框，从而快读识别出边框内的教学区的教学内容。与现有的增强现实识别技术相比，本发明实施例中先识别边框后识别教学内容的方案，保证了识别教学道具103的时间更短，识别准度更高。可选地，为方便能从任意角度采集到教学道具中的教学内容，对于一些不同方向看起来有歧义的内容(如6和9，u和n)，教学道具103还包括方向标识，所述方向标识位于所述内容区域内，或置于所述边框上。如图2b所示，方向标识可以是较厚的其中一边的边框(即一边厚，其余三边窄)，也可以是一个点，两个矩形边角，一条横线等。如果边框是圆形，则可以在圆形边框的其中一段加入方向标识，例如圆形边框正上方的某一段加粗，或加入一个或多个点，或加入某些不规则图形。方向标识具备如下技术效果：可快速定位到教学内容的方向，从而快速定位并识别教学内容的信息，提高了识别的准确率及速度。图2c是本发明实施例中教学道具103的一个组成示例，图2c是一张教学卡，卡内具备一圆角矩形的封闭式边框，边框具备一定的宽度(可分为内边框及外边框)，且边框与教学内容区有一定的间隔。此外，该边框满足底边厚其余三边薄的特征，底边即为该教学卡的方向标识。本发明实施例可快速定位并识别边框，并根据方向标识识别出该教学卡的旋转角度，从而快速识别出边框内教学内容区中的教学内容信息。

可选地，本发明实施例中，教学道具103包含一个或多个不同颜色的三维多边形道具，如七巧板等实物道具，本发明实施例可以对不同颜色，不同形状(例如等边三角形、钝角三角形、四边形等)实物道具进行识别，不仅能精确定位该实物道具在空间哪一个具体位置，还能够给出旋转角度，是否需要摆正等提示性信息，方便与学生的教学互动。

所述一个或多个摄像头101用于采集所述教学道具103的图像；

需要说明的是，本发明实施例对摄像头的数量并无限制，单摄像头或多摄像头方案均可。单摄像头的成本低，可应用于大部分教学场景，而多摄像头可安装在不同的位置，采集图像的范围更大，且多摄像头(例如双摄像头)可测景深，对于空间图像采集效果更好。为方便说明，本发明实施例采用单摄像头作为示例进行说明。

所述增强现实装置102通过有线或无线方式连接所述一个或多个摄像头101，用于对采集到的所述教学道具103的图像进行增强现实处理，识别出所述图像中的教学内容信息，并输出所述教学内容信息。

需要说明的是，增强现实(augmentedreality,ar)也被称之为混合现实。它通过电脑技术，将虚拟的信息应用到真实世界，真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。ar技术具备以下特点：一.虚实结合。它可以使计算机窗口与图表叠印于现实对象。二.实时交互。它可以使从简单的人面对屏幕交流发展到将自己融合于周围的空间与对象中。正因为ar技术具备如此的特点，因此，ar技术可应用于教学领域，可以让幼儿或学生深度参与互动，增强课堂的趣味性。

本发明实施例中，增强现实装置102可以是一个单独的ar处理装置，独立于摄像头101而存在，与摄像头101进行连接，也可以是一个内置有摄像头101的集成电路板，增强现实装置102可以是arm板/fpga板，可以具备典型的冯诺依曼结构，如包含了cpu、bus总线、ram、rom、输入/输出接口及相应的电路结构等。可选地，增强现实装置102还可以集成有显示装置104，当增强现实装置102将采集到的图像进行处理之后，通过输出接口输出处理后的教学内容信息至显示装置104，显示装置104可显示该处理后的教学内容信息。显示装置104也可以独立于该增强现实装置102而作为教学系统100的组成部分，可选地，显示装置104可以为电视、个人电脑、移动终端、带有触摸功能的电子屏幕等显示设备，用户(教师或学生)也可以对显示设备104上显示的教学内容进行点击或滑动操作，实现人机交互。

可选地，当所述教学道具103包含边框及位于所述边框内的教学内容区时，则所述增强现实装置102用于对采集到的图像进行增强现实处理，识别出所述图像中的教学内容信息，具体为：

所述增强现实装置102用于识别出所述教学道具103图像中的边框，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息。

更具体地，增强现实装置102用于在接收到摄像头101输出的图像后，首先，使用自适应阈值算法将摄像头101采集的图像转换为黑白二值图像，以突显出教学道具101的边框。自适应阈值算法的判断依据为：

其中

其中，v为像素的灰度值，n(v)为v附近的像素集合，c是预先设置的的阈值，v’代表领域n(v)里面的像素点。

其次，对该结果进行二值轮廓提取，即对二值图像中的连通区域进行扫描，得到区域的轮廓线条、区域的面积、周长等数据。

再次，进行轮廓筛选，即对上一步提取的轮廓进行快速几何形态分析，仅保留形似四边形的轮廓，以减少后续步骤的处理时间。具体而言，首先使用局部平均的方法对轮廓线进行一次平滑，然后使用近邻差分法计算轮廓线上每个点的切向量，最后使用分级聚类方法对所有的切向量坐标进行分析，若形成的显著聚类恰好为4个，则认为该轮廓形似四边形。

进一步地，对上一步处理结果进行四边拆分。基于上一步的聚类分析结果，将4个显著聚类对应的轮廓点坐标提取到4个集合中，对应为四边形4条边的拟合数据。

进一步地，对上一步的拟合数据进行最小二乘拟合。上一步生成的四条边的数据可分别进行直线拟合从而得到四条边的方程，本发明中使用最小二乘算法来进行直线拟合，优化目标为：

完成四条边的拟合之后即可确定教学道具101的边框在图像中的具体位置。

进一步地，对邻近区域图像矫正，由于拍摄角度多种多样，卡片在图像中会产生形变。使用上一步得到的边框可对卡片的形变进行矫正，此时卡片内容还可能有0度、90度、180度、270度这四种不同的朝向。

进一步地，对方向标识进行检测。本发明实施例使用机器学习方法对卡片中的方向标识进行检测与识别，通过采集上千张不同朝向的卡片图像，并进行标注(例如，可以进行5个类别，分别是0度、90度、180度、270度、无方向标识)，之后使用深度神经网络进行训练，可得到一个方向标识分类器，可对上一步得到的结果进行方向标识检测与判别。该方案训练得到的分类器对方向标识的识别准确率可达到99.6％以上。

进一步地，按标识旋转图像。对于检测到方向标识的卡片，可按方向标记将卡片转正。

进一步地，获取所有方向图像。对于没有检测到方向标记的卡片，本发明实施例直接生成4个不同方向的图像供后续内容识别算法分析。

进一步地，对卡片内容进行识别。本发明使用机器学习方法对卡片内容进行识别，首先在样本数据库中有数百至上千张已定义的卡片，对这些样本提取方向梯度直方图特征(hog)之后，训练svm多类别分类器；若数据库中的样本非常多(超过一千)，也可直接使用深度神经网络进行训练。使用分类器对上一步得到的图像进行判别(若前面没有检测到方向标识，则对4个方向的图像都进行判别，只要其中一个有效即可)，判别之后根据结果再与数据库中的标准样本进行一次比对(验算)，验算通过之后认为成功检测到结果。

最后，输出识别结果。若上一步成功识别到卡片，则将卡片的类别、位置、方向信息输出。

可选地，当所述摄像头101采集图像范围内出现所述至少两个教学道具时，则所述增强现实装置102用于识别出所述图像中的教学内容信息，并输出所述教学内容，具体为：

所述增强现实装置102用于识别出所述至少两个教学道具的教学内容信息，并根据所述至少两个教学道具的摆放距离，将所述教学内容信息进行组合，输出组合后的教学内容信息。以教学道具为教学卡为例，当识别出教学内容分别为拼音“e”和“i”时，若识别出的教学卡距离较近(即二者像素位置距离低于预设的一阈值)，则直接输出“e”和“i”的组合“ei”。以此类推，当识别出的教学内容分别为拼音“e”和拼音四声调其中的第一声，且二者呈严格的上下摆放，且摆放距离低于预先设置的一阈值，则输出带有第一声调的拼音“ē”。

可选地，教学系统100还可以包括麦克风、鼠标、键盘等输入设备，便于后续与学生用户进行人机交互。

图3提供了本发明实施例的教学系统在实际应用的一个实例。可看出，利用本发明实施例提供的教学系统，老师可进行多样化且个性化的教学。例如，老师在教授数学知识时，可以通过触摸屏或键盘来出题，学生可以用手举起数字卡片来回答，教学系统通过检测、识别摄像头拍摄到的数字卡片可得知学生的回答，再通过与老师出的题进行比对检查答案是否正确。在学习拼音时，学生可以使用不同的声母、韵母卡片在桌上摆放出不同的组合，教学系统通过ar装置检测、识别并定位到学生摆放的卡片，并进行分析，如果能组合成一个完整的拼音，就在屏幕上显示相应的拼音组合，同时还可以显示出其中一个对应的汉字与图片，并通过扬声器发出标准的读音。在学习汉字时，学生可以把不同的汉字放在桌上的不同区域放置不同的汉字卡片，同时屏幕上出现与汉字对应的形象，并且与桌上的汉字相对位置一致。学生可以进一步根据屏幕上出现的形象来讲故事。可加强学生对汉字的印象，同时让学生发挥想象力构建不同的故事。另，当电子屏幕上显示一个图形，学生可以用积木(如七巧板等)在桌上尝试拼出看到的图形，系统通过摄像头分析学生的完成情况，并给出提示；当学生完成任务之后可以播放胜利动画作为奖励。也可以支持多个学生一起拼，比比谁更快。此外，本发明实施例不仅能用于针对低年级的幼儿，同样地，也可以应用于初高中、大学等任意一种实体教学场景，在兼顾教学质量的同时也能带来趣味化及个性化需求。

本发明实施例提供了一种基于ar技术的教学系统，通过摄像头、ar装置与教学道具的组合，可360度快速识别实体的教学道具并进行显示。在满足多样化个性化的教学需要的同时，还提高了识别速度及识别精度。另，相比于传统的ar识别技术及目前市面上的ar产品，本发明创造性地采用了独有的教学道具，并深度定制并优化了与之相关的ar识别技术，教学道具可以只采用普通卡片的形式而无需额外嵌入价格昂贵的特定标识物，不仅降低了成本，更容易带来商业上的成功。

实施例2

如图4所示，本发明实施例提供了一种ar装置200，包括所述增强现实装置包括输入接口201、输出接口202、处理器203及存储器204，所述输入接口201与一个或多个摄像头相连接，用于接收所述一个或多个摄像头采集的教学道具图像；所述处理器203用于采集到的所述教学道具的图像进行增强现实处理，识别出所述图像中的教学内容信息，并通过所述输出接口输出所述教学内容信息。

可选地，ar装置200可以是一个单独的ar处理装置，独立于摄像头而存在，与摄像头连接交互，也可以是一个内置有摄像头的集成电路板，增强现实装置可以是arm板/fpga板，ar装置200还可以集成有显示装置205，当ar装置200将采集到的图像进行处理之后，通过输出接口202输出处理后的教学内容信息至显示装置205，显示装置205可显示该处理后的教学内容信息。

可选地，当所述教学道具包含边框及位于所述边框内的教学内容区时，则所述处理器用于对采集到的图像进行增强现实处理，识别出所述图像中的教学内容信息，具体为：

所述处理器203用于识别出所述教学道具图像中的边框，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息。

具体地，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息，具体可参见实施例1的描述(说明书第8页第4段至第10页第2段)，在此不再累述。

可选地，当所述摄像头采集图像范围内出现所述至少两个教学道具时，则所述处理器203用于识别出所述图像中的教学内容信息，并输出所述教学内容，包括：

所述处理器203用于识别出所述至少两个教学道具的教学内容信息，并根据所述至少两个教学道具的摆放距离，将所述教学内容信息进行组合，输出组合后的教学内容信息。以教学道具为教学卡为例，当识别出教学内容分别为拼音“e”和“i”时，若识别出的教学卡距离较近，即二者像素位置距离低于预设的一阈值，则直接输出“e”和“i”的组合“ei”。以此类推，当识别出的教学内容分别为拼音“e”和拼音四声调其中的第一声，且二者呈严格的上下摆放，且摆放距离低于预先设置的一阈值，则输出带有第一声调的拼音“ē”。

本发明实施例中，ar装置通过采集到的所述教学道具的图像进行增强现实处理，识别出所述图像中的教学内容信息，并通过所述输出接口输出所述教学内容信息。

实施例3

如图5所示，本发明实施例提供一种基于ar技术的教学方法，该方法如下：

s301.一个或多个摄像头采集教学道具的图像，所述教学道具包含边框及位于所述边框内的教学内容区，和/或，所述教学道具包含一个或多个不同颜色的三维多边形道具；

教学道具可以是单独的拼音、声调、汉字或数字的教学卡(教学卡材质可以是纸片、塑料片或金属片等材质)，也可以是拼音、汉字和/或数字的组合教学卡，还可以是某些印有拼音、声调、汉字或数字的教具，例如直尺、三角尺、教尺/教鞭、圆规等常规教具。目前市面上应用于现实增强教学的教学道具中，均是采用具备二维码或射频识别等具备特定识别标识的一些教学道具，而本发明实施例中，创造性地提出了一种全新的教学道具，区别于目前市面上所有的教学道具，本发明实施例中，教学道具具备边框，该边框可以呈封闭式且具备一定宽度，边框颜色与教学内容区的底色区别明显，例如边框颜色可以是黑色，教学内容区底色可以是白色，或者，边框颜色为白色，教学内容区颜色为黑色(如图2a所示)。边框为多边形，如三角形、矩形、菱形和梯形等，也可以为椭圆或正圆形。为了方便说明，本发明实施例以四边形教学卡为例，如图2a所示，该四边形可以为方形或近似方形，如正方形、长方形、圆角矩形等，且边框与教学内容区间隔一定的宽度。教学道具具备边框这一特征具备如下技术效果：可通过增强显示技术快速定位并识别出边框，从而快读识别出边框内的教学区的教学内容。与现有的增强现实识别技术相比，本发明实施例中先识别边框后识别教学内容的方案，保证了识别教学道具的时间更短，识别准度更高。可选地，为方便能从任意角度采集到教学道具中的教学内容，对于一些不同方向看起来有歧义的内容(如6和9，u和n)，教学道具还包括方向标识，所述方向标识位于所述内容区域内，或置于所述边框上。如图2b所示，方向标识可以是较厚的其中一边的边框(即一边厚，其余三边窄)，也可以是一个点，两个矩形边角，一条横线等，如果边框是圆形，则可以在圆形边框的其中一段加入方向标识，例如圆形边框正上方的某一段加粗，或加入一个或多个点，或加入某些不规则图形。方向标识具备如下技术效果：可快速定位到教学内容的方向，从而快速定位并识别教学内容的信息，提高了识别的准确率及速度。图2c是本发明实施例中教学道具的一个组成示例，图2c是一张教学卡，卡内具备一圆角矩形的封闭式边框，边框具备一定的宽度(可分为内边框及外边框)，且边框与教学内容区有一定的间隔。此外，该边框满足底边厚其余三边薄的特征，底边即为该教学卡的方向标识。本发明实施例可快速定位并识别边框，并根据方向标识识别出该教学卡的旋转角度，从而快速识别出边框内教学内容区中的教学内容信息。

可选地，本发明实施例中，教学道具包含一个或多个不同颜色的三维多边形道具，如七巧板等实物道具，本发明实施例可以对不同颜色，不同形状(例如等边三角形、钝角三角形、四边形等)实物道具进行识别，不仅能精确定位该实物道具在空间具体哪一个具体位置，还能够给出旋转角度，是否需要摆正等提示性信息，方便与学生的教学互动。

s302.增强现实装置对采集到的所述教学道具的图像进行增强现实处理，识别出所述图像中的教学内容信息，输出所述教学内容信息。

可选地，当所述教学道具包含边框及位于所述边框内的教学内容区时，则所述增强现实装置对采集到的图像进行增强现实处理，识别出所述图像中的教学内容信息，具体为：

识别出所述教学道具图像中的边框，根据所述边框确认所述教学内容区的位置，并对所述教学内容区进行识别，识别出所述图像中的教学内容信息。

可选地，上述步骤具体为：

更具体地，上述步骤如图6所示，具体为：

s3021.图像二值化。使用自适应阈值算法将摄像头采集的图像转换为黑白二值图像，以突显出教学道具的边框。自适应阈值算法的判断依据为：

其中

其中，v为像素的灰度值，n(v)为v附近的像素集合，c是预先设置的的阈值，v’代表领域n(v)里面的像素点。

s3022.对该结果进行二值轮廓提取，对二值图像中的连通区域进行扫描，得到区域的轮廓线条、区域的面积、周长等数据。

s3023.进行轮廓筛选，即对上一步提取的轮廓进行快速几何形态分析，仅保留形似四边形(本发明实施例使用场景包括但不限于四边形，仅以四边形为例进行说明)的轮廓，以减少后续步骤的处理时间。具体而言，首先使用局部平均的方法对轮廓线进行一次平滑，然后使用近邻差分法计算轮廓线上每个点的切向量，最后使用分级聚类方法对所有的切向量坐标进行分析，若形成的显著聚类恰好为4个，则认为该轮廓形似四边形。

s3024.对s3023的处理结果进行四边拆分。基于上一步的聚类分析结果，将4个显著聚类对应的轮廓点坐标提取到4个集合中，对应为四边形4条边的拟合数据。

s3025.对s3024的拟合数据进行最小二乘拟合。上一步生成的四条边的数据可分别进行直线拟合从而得到四条边的方程，本发明中使用最小二乘算法来进行直线拟合，优化目标为：

完成四条边的拟合之后即可确定教学道具101的边框在图像中的具体位置。

s3026.对邻近区域图像矫正。以教学道具101为一张或多张教学卡片为例，由于拍摄角度多种多样，卡片在图像中会产生形变。使用上一步得到的边框可对卡片的形变进行矫正，此时卡片内容还可能有0度、90度、180度、270度这四种不同的朝向。

s3027.对方向标识进行检测。本发明实施例使用机器学习方法对卡片中的方向标识进行检测与识别，通过采集上千张不同朝向的卡片图像，并进行标注(例如，可以进行5个类别，分别是0度、90度、180度、270度、无方向标识)，之后使用深度神经网络进行训练，可得到一个方向标识分类器，可对上一步得到的结果进行方向标识检测与判别。该方案训练得到的分类器对方向标识的识别准确率可达到99.6％以上。

s3028a.按标识旋转图像。对于检测到方向标识的卡片，可按方向标记将卡片转正。转正即将该卡片转至水平位置。

s3028b.获取所有方向图像。对于没有检测到方向标记的卡片，本发明实施例直接生成4个不同方向的图像供后续内容识别算法分析。

s3029.对卡片内容进行识别。本发明使用机器学习方法对卡片内容进行识别，首先在样本数据库中有数百至上千张已定义的卡片，对这些样本提取方向梯度直方图特征(hog)之后，训练svm多类别分类器；若数据库中的样本非常多(超过一千)，也可直接使用深度神经网络进行训练。使用分类器对上一步得到的图像进行判别(若前面没有检测到方向标识，则对4个方向的图像都进行判别，只要其中一个有效即可)，判别之后根据结果再与数据库中的标准样本进行一次比对(验算)，验算通过之后认为成功检测到结果。

s3020.输出识别结果。若上一步成功识别到卡片，则将卡片的类别、位置、方向信息输出。

可选地，当所述教学道具还包括方向标识，则所述确定所述边框的位置及所述边框内教学内容区的位置之后，还包括：

识别出所述方向标识，并按照所述方向标记将所述边框及所述教学内容区的位置转正。

可选地，当所述摄像头采集图像范围内出现所述至少两个教学道具时，则所述增强现实装置识别出所述图像中的教学内容信息，并输出所述教学内容，具体为：

识别出所述至少两个教学道具的教学内容信息，并根据所述至少两个教学道具的摆放距离，将所述教学内容信息进行组合，输出组合后的教学内容信息。例如，当识别出教学内容分别为拼音“e”和“i”时，若识别出的教学卡距离较近，即二者像素位置距离低于预设的一阈值，则直接输出“e”和“i”的组合“ei”。以此类推，当识别出的教学内容分别为拼音“e”和拼音四声调其中的第一声，且二者呈严格的上下摆放，且摆放距离低于预先设置的一阈值，则输出带有第一声调的拼音“ē”。

利用本发明提供的教学方法，老师可进行多样化且个性化的教学。例如，老师在教授数学知识时，可以通过触摸屏或键盘来出题，学生可以用手举起数字卡片来回答，教学系统通过检测、识别摄像头拍摄到的数字卡片可得知学生的回答，再通过与老师出的题进行比对检查答案是否正确。在学习拼音时，学生可以使用不同的声母、韵母卡片在桌上摆放出不同的组合，教学系统通过ar装置检测、识别并定位到学生摆放的卡片，并进行分析，如果能组合成一个完整的拼音，就在屏幕上显示相应的拼音组合，同时还可以显示出其中一个对应的汉字与图片，并通过扬声器发出标准的读音。在学习汉字时，学生可以把不同的汉字放在桌上的不同区域放置不同的汉字卡片，同时屏幕上出现与汉字对应的形象，并且与桌上的汉字相对位置一致。学生可以进一步根据屏幕上出现的形象来讲故事。可加强学生对汉字的印象，同时让学生发挥想象力构建不同的故事。另，当电子屏幕上显示一个图形，学生可以用积木(如七巧板等)在桌上尝试拼出看到的图形，系统通过摄像头分析学生的完成情况，并给出提示；当学生完成任务之后可以播放胜利动画作为奖励。也可以支持多个学生一起拼，比比谁更快。

本发明实施例提供了一种基于ar技术的教学方法，通过摄像头、ar装置与教学道具的组合，可360度快速识别实体的教学道具并进行显示。在满足多样化个性化的教学需要的同时，还提高了识别速度及识别精度。另，相比于传统的ar识别技术及目前市面上的ar产品，本发明创造性地采用了独有的教学道具，并深度定制并优化了与之相关的ar识别技术，教学道具可以只采用普通卡片的形式而无需额外嵌入价格昂贵的特定标识物，不仅降低了成本，更容易带来商业上的成功。

应理解，在本申请的各种实施例中，各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本说明书的各个部分均采用递进的方式进行描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点介绍的都是与其他实施例不同之处。尤其，对于装置和系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例部分的说明即可。

最后，需要说明的是：以上所述仅为本申请技术方案的较佳实施例而已，并非用于限定本申请的保护范围。显然，本领域技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋卿;葛凯麟
技术所有人：彼乐智慧科技（北京）有限公司
我是此专利的发明人

上一篇：一种气动式水口料分切装置及方法与流程
上一篇：一种摩天轮式自行车停车装置的制作方法