一种基于特征识别的教学辅助大数据智能分析方法与流程

文档序号:14911764发布日期:2018-07-10 23:36阅读:102来源:国知局
本发明涉及一种大数据智能分析方法,特别是涉及一种基于特征识别的教学辅助大数据智能分析方法。
背景技术
:随着大数据分析技术的日益发展,人们开始着力于将大数据技术应用于教育领域,如公开号为CN107316261A、CN106023013A、CN104573071A等中国发明专利申请中均有相关的记载。而在课堂上,一般至少有几十名学生,老师在教学时无法时刻观察每个学生的动作,从而可能会降低学生与老师之间的互动,或者使老师无法及时发现未认真听课的学生。因此,对学生的行为、动作分析就显得十分重要,但是目前国内还没有专门分析学生行为、动作的技术。因此申请人提出一种基于特征识别的教学辅助大数据智能分析方法,其能够提取学生行为特征,从而识别学生的动作,以进行教学监督、提高教学质量等。技术实现要素:有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种基于特征识别的教学辅助大数据智能分析方法。为实现上述目的,本发明提供了一种基于特征识别的教学辅助大数据智能分析方法,包括如下步骤:S1、获取学生静态图像;S2、提取出图像的方向梯度特征;S3的机器学习训练出的模型通过计算判断是否属于某一个类别;S3、机器学习;S4、滑动窗口;S5、选取动作分类下的概率最大的动作,识别动作;S6、对S5中动作发出人进行脸部识别。优选地,S2、取出图像的方向梯度特征,包括如下步骤:S21、彩色图像转换成对应的灰度图像,并且把灰度图看作一个三维图像,图像上的每一个像素点都用(x,y,gray)表示,其中x代表该像素点在图像中的x坐标,y代表该像素点在图像中的y坐标,gray代表该像素点的灰度值,转化公式如下:Gray=0.3*R+0.59*G+0.11*B;S22、调节图像的色彩对比度,减少因为局部光照不均匀产生的阴影对梯度特征造成的影响,采用Gamma校正法,具体计算公式如下:I(x,y)=I(x,y)gamma取gamma>1,则可以让灰度比较暗的部分提高对比度;S23、对图像上的每一个像素点都计算其的梯度特征,这里可提取出像素之间的梯度关系,同时还可更进一步地抑制光照对图像的影响,具体计算公式如下:表格中代表由S22中得到的灰度图像对应像素的灰度值;由于灰度图像的方向有x方向和y方向,因此梯度方向需要分别计算两个方向的梯度并且根据幅值公式求出梯度大小:根据幅值公式求出点(x,y)的梯度大小和梯度方向:S24、将图像按像素分成若干个“细胞区间”,对每个“细胞区间”内的所有像素点的灰度方向进行统计;S25、将“细胞单元”中提取的梯度特征进行标准化,将若干个相邻的“细胞单元”提取到的梯度特征拼接为一个较大区域的梯度特征然后利用二范数标准化的方式将梯度特征标准化的,具体如下:假设v是标准化前的特征向量,||v||2代表特征向量v的二范数,求取公式为:标准化后的特征向量为:其中,ε是一个很小的数值,防止上面公式中分母出现近似于0的情况,ε可以是0.01S26、将所有由“细胞区间”组成的区间中的梯度特征向量标准化以后,需要将所有区间中的梯度特征向量进行拼接,组成整个图像对应的梯度特征向量,图像的梯度特征向量维度计算公式如下:其中,size是最终求出的图像的梯度特征的维度,BlockSize.width和BlockSize.height是区间对应的宽度和高度,CellSize.width和CellSize.height是“细胞区间”对应的宽度和高度,WinSize.width和WinSize.height对应的是检测图像对应的宽度和高度,BlockStride.width和BlockStride.height对应的是区间步进的宽度和高度,nbin优选地,S3、机器学习,包括如下步骤:S2中求取出每一个样本图像的梯度特征以后,采用SVM将学生一类行为动作的梯度特征进行训练,对应分类模型;分类模型可以是举手、阅读、写字等梯度特征模型;S31、用户首先标记出一些相关的检索结果作为正样本和一些检索不相关的负样本,然后图像检索系统基于这些反馈样本更新检索的结果;交替上述两个步骤的交替进行,可让计算机逐渐学习用户的需求,增强检索功能;S311、将图像梯度特征空间分为多个区域,其中,具体分类平面最远的正样本作为最相关样本,距离分类平面最近的样本作为最具有信息量的样本;S312、基于SVM的图像检索系统的关联反馈方法:SVM是一种有效的二分类、多分类算法,下面以二分类问题为例(且yi={+1,-1}),多分类问题可以类比;其中,xi是一个n维特征向量,yi是特征向量所属的类别信息,SVM通过一个超平面将两类样本点进行划分,即:wTx+b=0其中,w是一个输入向量,x是一个自适应权重向量,b是一个偏置,SVM通过最大化几何边界获得最优超平面的参数w和b,并且满足:yi(wTxi+b)≥+1通过引入拉格朗日系数,求解对偶问题可获得:并且同时满足:αi≥0在对偶模式中,数据点仅出现内积形式,为了获得数据的更好表达,可以将这些数据点通过替换操作映射到希伯特内积空间中:xi·xj→φ(xi)·φ(xj)=K(xi,xj)其中,K(·)是一个和函数;可获得对偶问题的和函数表示形式:对于任意给定的和函数,SVM分类器可以表示为:F(x)=sgn(f(x))其中,f(x)是SVM分类超平面的决策函数:对于给定图像样本,当|f(x)|越高时,相应的预测确信度越高,相反当|f(x)|越低时,相应的预测确信度越低。优选地,S4、滑动窗口,包括如下步骤:S41、选定图像区域,将图像选定为感兴趣区域;S42、将选定的感兴趣区域等比例缩放到特征检测窗大小;S43、将符合大小的图像求取HOG特征;S44、将求取出的HOG与前面通过SVM训练好的模型进行对比,对待测区域进行动作分类;S45、选定的图像区域右移一个步长,直到滑动窗口移动到图像本行的最右端;S46、选定的图像区域下移一个步长直到滑动窗口移动到图像的最后一行;S47、放大选定图像区域的大小;S48、重复S41到S47,即可遍历当前图片所有大小的区域。优选地,S5、选取动作分类下的概率最大的动作,识别动作,包括如下步骤:S51、遍历滑动窗口的所有检测图像并且建立图像金字塔;S52、收集当前所有含有当前动作分类的目标窗口,并统计得到最高相应的窗口W;S53、消除所有与窗口W有明显重叠的窗口;S54、移动到下一个有最高响应确信度的窗口,在当前尺度下重复S51-S53;S55、在这个过程完成后,移动图像金字塔的下一个尺度,并重复S51-S55的过程。优选地,S6、对S5中动作发出人进行脸部识别,包括如下步骤:S61、采用等价模式的LBP特征提取方式,将LBP编码方式“等价”为0和1之间的跳变问题;S62、在系统的设计过程中,把二进制编码中跳变次数小于2次的LBP编码统一归类为一个等价模式类,通过这样的改进方式,二进制编码的种类会大大减少,而且不会丢失信息,二进制的编码数量也从原来的2p减少为p·(p-1)+2种,其中,p表示邻域内的采样像素点的个数。本发明的有益效果是:本发明能够识别出学生的行为、动作,及大地方便了对学生的管理且有利于教学质量的提高。附图说明图1是本发明细胞区间划分示意图。图2是LBP转换方式示意图。具体实施方式下面结合附图和实施例对本发明作进一步说明:参见图1-图2,一种基于特征识别的教学辅助大数据智能分析方法,包括如下步骤:S1、获取学生静态图像,采用图像获取设备,如相机等获取学生静态图像;S2、提取出图像的方向梯度特征;S3、机器学习;S4、滑动窗口;S5、选取动作分类下的概率最大的动作,识别动作;S6、对S5中动作发出人进行脸部识别。进一步地,S2、取出图像的方向梯度特征,包括如下步骤:S21、因为颜色对梯度特征的贡献度不大,为了后续计算的效率,将彩色的三通道(RGB)转换成对应的灰度图像,并且把灰度图看作一个三维图像,图像上的每一个像素点都可以用(x,y,gray)表示,其中x代表该像素点在图像中的x坐标,y代表该像素点在图像中的y坐标,gray代表该像素点的灰度值(0到255),转化公式如下:Gray=0.3*R+0.59*G+0.11*B;S22、调节图像的色彩对比度,减少因为局部光照不均匀产生的阴影对梯度特征造成的影响,这个步骤同时可以抑制高频噪声对图像梯度特征的影响,主要用到的方法为Gamma校正法,具体计算公式如下:I(x,y)=I(x,y)gamma取gamma>1,则可以让灰度比较暗的部分提高对比度;S23、对图像上的每一个像素点都计算其的梯度特征(包括梯度大小和梯度方向),这个步骤可以提取出像素之间的梯度关系,同时可以更进一步地抑制光照对图像的影响,具体计算公式如下:H(x-1,y-1)H(x,y-1)H(x+1,y-1)H(x-1,y)H(x,y)H(x+1,y)H(x-1,y+1)H(x,y+1)H(x+1,y+1)表格中代表由S22中得到的灰度图像对应像素的灰度值,如:H(x,y)代表在灰度图的(x,y)处的灰度值为H(x,y);由于灰度图像的方向有两个(x方向和y方向),因此梯度方向需要分别计算两个方向的梯度并且根据幅值公式求出梯度大小:根据幅值公式求出点(x,y)的梯度大小和梯度方向:S24、将图像按像素分成若干个“细胞区间”,对每个“细胞区间”内的所有像素点的灰度方向进行统计。在本发明中,每个“细胞区间”的大小为8像素*8像素,对梯度方向采用每20度作为区间划分,梯度大小作为统计时的权值;假设“细胞单元”中的某一像素(x,y)的梯度大小G(x,y)=2,α(x,y)=137.6°,则应该在统计时将这个像素所在区域z6增加2个统计量;S25、将“细胞单元”中提取的梯度特征进行标准化,因为图像不同“细胞单元”中的光照强度可能受到光照强度的影响是不一样的,有时候梯度变化会很大,在本发明中,采用的是将若干个相邻的“细胞单元”提取到的梯度特征拼接为一个较大区域的梯度特征然后利用二范数标准化的方式将梯度特征标准化的,具体原理如下:假设v是标准化前的特征向量,||v||2代表特征向量v的二范数,求取公式为:标准化后的特征向量为:其中,ε是一个很小的数值,防止上面公式中分母出现近似于0的情况;S26、将所有由“细胞区间”组成的区间中的梯度特征向量标准化以后,需要将所有区间中的梯度特征向量进行拼接,组成整个图像对应的梯度特征向量,图像的梯度特征向量维度计算公式如下:其中,size是最终求出的图像的梯度特征的维度,BlockSize.width和BlockSize.height是区间对应的宽度和高度,CellSize.width和CellSize.height是“细胞区间”对应的宽度和高度,WinSize.width和WinSize.height对应的是检测图像对应的宽度和高度,BlockStride.width和BlockStride.height对应的是区间步进的宽度和高度,nbin代表的是Step4中梯度角度统计中使用到的区域通道数;在本发明中,取CellSize.width=CellSize.height=8,BlockSize.width=BlockSize.height=16,BlockStride.width=BlockStride.height=8,WinSize.width=64,BlockStride.height=128,nbin=9。S3、机器学习,求取出每一个样本图像的梯度特征以后,需要使用机器学习的方法将学生一类行为动作的梯度特征进行训练,对应分类模型;本发明使用的训练方法是SVM(SupportVectorMachine,支持向量机),这是一种有监督的统计学习算法,能够最小化经验误差和最大化几何边缘。本发明基于内容的图像检测系统,主要包括如下步骤:用户首先标记出一些相关的检索结果作为正样本和一些检索不相关的负样本,然后图像检索系统基于这些反馈样本更新检索的结果;交替上述两个步骤的交替进行,可以让计算机逐渐学习用户的需求,增强检索功能;具体如下:将图像梯度特征空间分为多个区域,其中,具体分类平面最远的正样本作为最相关样本,距离分类平面最近的样本作为最具有信息量的样本;基于SVM的图像检索系统的关联反馈方法:SVM是一种有效的二分类、多分类算法,下面以二分类问题为例(且yi={+1,-1}),多分类问题可以类比;其中,xi是一个n维特征向量,yi是特征向量所属的类别信息,SVM通过一个超平面将两类样本点进行划分,即:wTx+b=0其中,w是一个输入向量,x是一个自适应权重向量,b是一个偏置。SVM通过最大化几何边界获得最优超平面的参数w和b,并且满足:yi(wTxi+b)≥+1通过引入拉格朗日系数,求解对偶问题可获得:并且同时满足:αi≥0在对偶模式中,数据点仅出现内积形式,为了获得数据的更好表达,可以将这些数据点通过替换操作映射到希伯特内积空间中:xi·xj→φ(xi)·φ(xj)=K(xi,xj)其中,K(·)是一个和函数;可获得对偶问题的和函数表示形式:对于任意给定的和函数,SVM分类器可以表示为:F(x)=sgn(f(x))其中,f(x)是SVM分类超平面的决策函数:对于给定图像样本,当|f(x)|越高时,相应的预测确信度越高,相反当|f(x)|越低时,相应的预测确信度越低。本发明能够检测固定区域学生的行为动作,还能实现如下功能:检测图像中同一种动作的多个目标,确定检测到这些动作的这些目标在当前图像中的位置。要做到这两点,需要使用滑动窗口的方法。滑动窗口是用于计算机视觉的一种技术,它包括图像中要移动部分(滑动窗口)的检查以及使用图像金字塔对各部分进行检测。这是为了在多尺度下检测对象。滑动窗口通过扫描较大图像的较小区域解决定位文图,进而在同一图像的不同尺度下重复扫描。这种技术需要将每幅图像分解成多个部分,然后丢掉那些不太可能包含对象的部分,并对剩余部分进行分类。滑动窗口的核心思路主要是每次针对一个感兴趣区域并且比例放缩到H特征检测窗大小然后执行相应的特征提取和分类;S4、滑动窗口,包括如下步骤:S41、选定图像区域,将图像选定为感兴趣区域;S42、将选定的感兴趣区域等比例缩放到特征检测窗大小;S43、将符合大小的图像求取HOG特征;S44、将求取出的HOG与前面通过SVM训练好的模型进行对比,对待测区域进行动作分类;S45、选定的图像区域右移一个步长,直到滑动窗口移动到图像本行的最右端;S46、选定的图像区域下移一个步长直到滑动窗口移动到图像的最后一行;S47、放大选定图像区域的大小。S48、重复S41到S47,即可遍历当前图片所有大小的区域。滑动窗口的方法会带来区域重叠的问题,区域重叠指的是在对图像执行动作分类判断时同一动作相邻的滑动窗口有重合部分的现象。每个窗口每次都会丢掉几个像素,这意味着一个滑动窗口可以同一个学生的同一个动作的不同位置进行匹配,这时,需要使用非最大抑制算法对重合图像进行筛选,非最大抑制算法可以将给定的一组重叠区域,用最大评分或者最大区域进行筛选出最能代表出学生动作位置的区域。非极大值抑制(NMS)非极大值抑制顾名思义就是抑制不是极大值的元素,搜索局部的极大值。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。这里不讨论通用的NMS算法,而是用于在目标检测中用于提取分数最高的窗口的。例如在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是该动作分类下的概率最大),并且抑制那些分数低的窗口。S5、选取动作分类下的概率最大的动作,具体的步骤如下:S51、遍历滑动窗口的所有检测图像并且建立图像金字塔;S52、收集当前所有含有当前动作分类的目标窗口(确信度超过一定的阈值),并统计得到最高相应的窗口W;S53、消除所有与窗口W有明显重叠(重叠区域面积百分比超过一定阈值)的窗口;S54、移动到下一个有最高响应确信度的窗口,在当前尺度下重复上述过程。S55、在这个过程完成后,移动图像金字塔的下一个尺度,并重复S51-S55的过程。优选地,S6,脸部识别,包括如下步骤:在判断到学生动作之后,需要通过人脸识别的方法判断动作是由哪个学生做出的,人脸检测与识别技术同样需要用到特征提取和机器学习的方法,在本发明使用的人脸特征是LBP(LocalBinaryPattern,中文为局部二值模式)特征和Adaboost训练方法。原始的LBP特征描述方法和计算方法,包括如下步骤:对于图像上选定的任意一个像素点(x,y),它的灰度值记为H(x,y),以H(x,y)为阈值和它邻近的3*3区域内的另外8个像素点的灰度值进行比较,如果相邻像素的灰度值大于H(x,y),则标记为1;如果相邻像素的灰度值小于H(x,y),则标记为0,最后将临近像素的二进制值编码为十进制数,公式如下:其中,LBP(xc,yc)表示的是像素点(xc,yc)处的LBP特征值,ic表示的是像素点(xc,yc)处的灰度值,ip表示的是像素点(xp,yp)处的灰度值,像素点(xp,yp)处于像素点(xc,yc)的邻近区域,函数s(·)是比较函数,具体如下;这样,LBP(xc,yc)就可以反映像素点(xc,yc)处的LBP特征。UniformPatternLBP特征(又被称作等价模式或均匀模式),针对原始的LBP特征提取对计算量的时间和存储空间是随着LBP计算区域的大小成指数级上增的,如:3*3的区域的二进制编码范围是0-28,4*4的区域的二进制编码范围是0-215,32*32的区域的二进制编码范围是0-21023。这样巨大的二进制编码方式不利于特征的提取、存储以及后续的机器学习。在本发明中,使用了等价模式的LBP特征提取方式,使得原始的LBP特征得到降维,使数据量减少的情况下同时不失能最好地还原图像的LBP特征。为了解决上面所说的二进制编码模式较多的问题,本发明使用等价模式的LBP特征提取方式,包括如下步骤:将LBP编码方式“等价”为0和1之间的跳变问题,如:00000000(0次跳变),11111111(0次跳变),10010111(4次跳变)。在系统的设计过程中,把二进制编码中跳变次数小于2次的LBP编码统一归类为一个等价模式类,通过这样的改进方式,二进制编码的种类会大大减少,而且不会丢失信息,二进制的编码数量也从原来的2p减少为p·(p-1)+2种,其中,p表示邻域内的采样像素点的个数。如:3*3的区域的统一模式二进制编码范围是0-58,4*4的区域的二进制编码范围是0-212,32*32的区域的二进制编码范围是0-932。本发明未详述之处,均为本领域技术人员的公知技术。以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本
技术领域
中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1