一种适用分层分类设计的自适应测试的被试参数估计方法与流程

文档序号:22679687发布日期:2020-10-28 12:39阅读:76来源:国知局

本发明涉及测试题目参数分析技术领域,具体为一种适用分层分类设计的自适应测试的被试参数估计方法。



背景技术:

对于自适应测验来说,尤其是分层分类题目,如何利用题目参数抽取适应测试者的题目以及估计被试参数,是一项重要工作。自适应测试中的分层分类题目,需要利用题目参数抽取适应测试者的题目,需要分层分类抽取,从而能够准确获得测试者在不同层级不同类别下的参数,并在测试长度尽可能简短的前提下保证测试者能力估计的准确性。



技术实现要素:

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种适用分层分类设计的自适应测试的被试参数估计方法,解决了现有的方法在面对众多的分层分类测试数据时,难以通过简短的测试长度预估测试者能力,且准确性不高的问题。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:一种适用分层分类设计的自适应测试的被试参数估计方法,包括以下步骤;

步骤一、设置估计需求的精度δa;

步骤二、在题库中随机抽取定量的题目给予被试者作答,抽取的题目分别属于不同层级和不同类型,抽取题目的数量根据实际需求而定;

步骤三、确定抽取的题目在每个层级每个类别的特征值c、抽取的题目本身的直接特征值n、抽取的题目的综合特征值m与被试者此次测试前在每个层级每个类别上的特征值x的估计值;

步骤四、在初始计算完成后,使用被试者正确作答题目的最大n值和误答题目的最小n值的均值,减少δa作为下一道题目抽取n值的下限,增加δa作为下一道题目抽取n值的上限,得到n值范围;

步骤五、由于初始测试的题目没有相同的分层分类,对于被试者作答过的分层分类,使用正确作答题目对应x值增加δa作为被试x值的估计值,或者使用错误作答题目对应x值减少δa作为被试x值的估计值,对于被试者没有作答的分层分类,使用正确作答题目的最大m值和错误作答题目的最小m值的均值,减去当前n值范围的中间值作为被试x值的估计值;

步骤六、在符合n值范围的前提下,从题库中分别随机抽取没有施测的分层分类和已经施测的分层分类,供本次和下次使用,在被试分层分类作答后,依据被试作答情况,修正当前n值范围和被试x值的估计值,之后再次抽题;

步骤七、在当前n值稳定后,停止测验,使用当前被试x值的估计值作为被试者在此分层分类的题目参数。

优选的,所述步骤三中c=arctan(q总/p总),n=arctan(q/p)与x=arctan(q总/p总),所述p与q分别表示正确率与错误率,所述p总与q总分别表示同一层级与类别上总的正确率与总的错误率。

优选的,所述正确率=正确作答数/题目总数、错误率=错误作答数/题目总数,通过现有计算机程序可以实现对于正确率与错误率的统计。

优选的,所述步骤三中根据每个层级每个类别的特征值c与题目本身的直接特征值n确定题目的综合特征值m。

优选的,所述步骤三中,在数据量有限的前提下,各层级各类别无法直接认定是否处于同一尺度下,需要对每个层级每个类别的特征值c和题目本身的直接特征值n分别中心化再加和作为题目的综合特征值m。

优选的,所述步骤七中当前n值稳定的状况,指的是停止规则,在理想的情况下,被试者在做够一定数量的题目后,n值就不再变化了,在实际应用中,可以根据的具体情况来定。

有益效果

本发明提供了一种适用分层分类设计的自适应测试的被试参数估计方法。具备以下有益效果:

在自适应测验传统方法中,更注重的结果是被试能力估计的准确性,而对分层分类题目的重视程度不足。本方法依据题目参数,包括题目所属层级和分类,及题目综合的属性的角度值或弧度值,抽取相应题目逐渐接近测试者的能力各参数的角度值或弧度值,从而最终获得测试者在各层级和分类的水平。本方法立足于实际需要设置被试估计的准确性要求,尤其侧重于使用分层分类题目的现有参数来估计被试未施测的分层分类参数,从而获得被试者在分层分类题目中的全面信息。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种技术方案:一种适用分层分类设计的自适应测试的被试参数估计方法,包括以下步骤:

步骤一、设置估计需求的精度δa。

步骤二、在题库中随机抽取定量的题目给予被试者作答,抽取的题目分别属于不同层级和不同类型,抽取题目的数量根据实际需求而定。

步骤三、确定抽取的题目在每个层级每个类别的特征值c、抽取的题目本身的直接特征值n、抽取的题目的综合特征值m与被试者此次测试前在每个层级每个类别上的特征值x的估计值。步骤三中c=arctan(q总/p总),n=arctan(q/p)与x=arctan(q总/p总),所述p与q分别表示正确率与错误率,所述p总与q总分别表示同一层级与类别上总的正确率与总的错误率。

步骤四、在初始计算完成后,使用被试者正确作答题目的最大n值和误答题目的最小n值的均值,减少δa作为下一道题目抽取n值的下限,增加δa作为下一道题目抽取n值的上限,得到n值范围。

步骤五、由于初始测试的题目没有相同的分层分类,对于被试者作答过的分层分类,使用正确作答题目对应x值增加δa作为被试x值的估计值,或者使用错误作答题目对应x值减少δa作为被试x值的估计值,对于被试者没有作答的分层分类,使用正确作答题目的最大m值和错误作答题目的最小m值的均值,减去当前n值范围的中间值作为被试x值的估计值。

步骤六、在符合n值范围的前提下,从题库中随机抽取没有施测的分层分类和已经施测的分层分类,供本次和下次使用,在被试分层分类作答后,依据被试作答情况,修正当前n值范围和被试x值的估计值,之后再次抽题。在施测过程中,被试者会先抽几道题作为初测(见步骤2),之后才是正式测验。

步骤七、在当前n值稳定后,停止测验,使用当前被试x值的估计值作为被试者在此分层分类的题目参数。

本实施例中,所述正确率=正确作答数/题目总数、错误率=错误作答数/题目总数,通过现有计算机程序可以实现对于正确率与错误率的统计。

本实施例中,所述步骤三中根据每个层级每个类别的特征值c与题目本身的直接特征值n确定题目的综合特征值m。

本实施例中,所述步骤三中,在数据量有限的前提下,各层级各类别无法直接认定是否处于同一尺度下,需要对每个层级每个类别的特征值c和题目本身的直接特征值n分别中心化再加和作为题目的综合特征值m。

本实施例中,步骤七中当前n值稳定的状况,指的是停止规则,在理想的情况下,被试者在做够一定数量的题目后,n值就不再变化了,在实际应用中,可以根据的具体情况来定。例如,被试者最后作答的10道题,n值变化范围在30°以内,就可以判断停止测验。

使用本方法时,首先设置估计需求的精度δa=5°,现假使测试题库中共有20道题,初测抽取3道题,依次确定3道题在每个层级每个类别的特征值c、本身的直接特征值n、抽取的题目的综合特征值m与被试者此次测试前在每个层级每个类别上的特征值x的估计值,当被试者已经做完了3道题,使用被试者正确作答题目的最大n值和误答题目的最小n值的均值,减少5°作为下一道题目抽取n值的下限,增加5°对于被试者作答过的分层分类,使用正确作答题目对应x值增加5°作为被试x值的估计值,或者使用错误作答题目对应x值减少5°作为被试x值的估计值,对于被试者没有作答的分层分类,使用正确作答题目的最大m值和错误作答题目的最小m值的均值,减去当前n值范围的中间值作为被试x值的估计值;作为下一道题目抽取n值的上限,得到n值范围;上述3道题就是已经被测试者做过,属于施测后的题目,3道题目属于的分层分类属于已经施测的分层分类,没有施测的还有17道题,17道题属于的分层分类属于没有施测的分层分类,在符合上述n值范围的前提下,从题库中随机抽取没有施测的分层分类供被试者下次使用,已经施测的分层分类,可以给下一个被试者使用,也可以不用,在被试者分层分类作答后,依据被试作答情况,修正当前n值范围和被试x值的估计值(修正方法依照步骤4进行),之后再次抽题;在理想的情况下,被试者在做够一定数量的题目后,n值就不再变化了,而在实际应用中,可以根据的具体情况来定。此次可以是规定被试者最后作答的10道题,n值变化范围在30°以内,就可以判断停止测验,进而使用当前被试x值的估计值作为被试者在此分层分类的题目参数,进而得出对于被试者面对单次测试题库中分层分类题目的能力水平。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下。由语句“包括一个......限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素”。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1