试题评估方法及装置与流程

文档序号:18452310发布日期:2019-08-17 01:21阅读:315来源:国知局
试题评估方法及装置与流程

本公开涉及测评技术领域,具体而言,涉及一种试题评估方法及装置。



背景技术:

在测量理论和计算机技术的发展下,要将大规模的测试题库建设成自适应功能的测试系统,整个题库建设工作必须建立在科学的、先进的心理教育测量学的理论基础之上,即通过为试题添加合适的试题难度标签,满足不同水平测试者的要求。目前,传统的测评技术是通过人工判断对试题难度进行预估,评估有效性有待提高。



技术实现要素:

有鉴于此,本公开提供一种试题评估方法及装置。

本公开提供一种试题评估方法,应用于电子设备,所述电子设备预存有试题库,所述试题库中的每个试题均预先设定有第一猜测参数、第一试题难度参数以及第一试题区分度参数;所述方法包括:

基于所述试题库,生成测试试题集,所述测试试题集中包括至少一个试题。

基于所述测试试题集,对各用户进行测试,获取各用户测试每个试题的测试正确率。

针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

根据修正后的结果更新所述试题库。

进一步的,所述电子设备预存有每个试题对应的知识点以及每个试题对应的知识点的学习时间,在获取各用户测试每个试题的测试正确率后,所述方法还包括:

针对每个试题,获取各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长。

判断所述时长是否在第一预设时间段内。

如果在所述第一预设时间段内,增加该试题的第一猜测参数的权重值,得到该试题的第二猜测参数。

针对每个试题,基于irt模型,根据该试题的第二猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

根据修正后的结果更新所述试题库。

进一步的,如果所述时长不在所述第一预设时间段内,所述方法还包括:

判断所述时长是否在第二预设时间段内。

如果在所述第二预设时间段内,减少该试题的第一猜测参数的权重值,得到该试题的第三猜测参数。

针对每个试题,基于irt模型,根据该试题的第三猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

根据修正后的结果更新所述试题库。

进一步的,如果所述时长不在所述第二预设时间段内;

针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

根据修正后的结果更新所述试题库。

进一步的,所述方法还包括:

根据设定条件,增加所述试题库的试题量。

本公开提供一种试题评估装置,应用于电子设备,所述试题评估装置包括存储模块、生成模块、获取模块、计算模块以及处理模块。

所述存储模块存储有试题库,所述试题库中的每个试题均预先设定有第一猜测参数、第一试题难度参数以及第一试题区分度参数。

所述生成模块用于基于所述试题库,生成试题集,所述试题集中包括至少一个试题。

所述获取模块用于基于所述试题集,对各用户进行测试,获取各用户测试每个试题的测试正确率。

所述计算模块用于针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

进一步的,所述试题评估装置还包括执行模块;所述存储模块还预存有每个试题对应的知识点以及每个试题对应的知识点的学习时间。

针对每个试题,所述获取模块还用于在获取各用户测试每个试题的测试正确率后,获取各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长。

所述执行模块用于判断所述时长是否在第一预设时间段内。

如果在所述第一预设时间段内,所述执行模块用于增加该试题的第一猜测参数的权重值,得到该试题的第二猜测参数。

所述计算模块用于针对每个试题,基于irt模型,根据该试题的第二猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

进一步的,如果所述时长不在所述第一预设时间段内,所述执行模块还用于判断所述时长是否在第二预设时间段内。

如果在所述第二预设时间段内,所述执行模块用于减少该试题的第一猜测参数的权重值,得到该试题的第三猜测参数。

所述计算模块用于针对每个试题,基于irt模型,根据该试题的第三猜测参数以及各用户测试该试题的正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

进一步的,如果所述时长不在所述第二预设时间段内;所述计算模块用于针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

本公开提供的试题评估方法及装置,应用于电子设备,在电子设备中预存有试题库,试题库中的每个试题均预先设定有第一猜测参数、第一试题难度参数以及第一试题区分度参数,基于试题库,生成测试试题集,在生成测试试题集后,以该测试试题集对各用户进行测试,获取各用户测试每个试题的测试正确率,针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数,以该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及该试题的第二试题区分度参数对该试题的第一试题区分度进行修正,得到修正后的结果,并根据修正后的结果更新试题库,实现了对试题库中每个试题的难度和区分度的有效评估,精确性较高,工作量小,并且基于irt模型,根据用户的测试正确率以及试题的第一猜测参数,计算得到试题的第二试题难度参数以及第二试题区分度参数,能真实的反映出用户的真实能力水平,实现有效评估。

为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本公开的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本公开所提供的电子设备的方框示意图。

图2为本公开所提供的试题评估装置的一种方框示意图。

图3为本公开所提供的试题评估方法的一种流程示意图。

图4为本公开所提供的试题评估方法的另一种流程示意图。

图5为本公开所提供的试题评估方法的又一种流程示意图。

图6为本公开所提供的试题评估方法的又一种流程示意图。

图标:100-电子设备;10-试题评估装置;11-存储模块;12-生成模块;13-获取模块;14-计算模块;15-处理模块;16-执行模块;20-存储器;30-处理器;40-通信单元。

具体实施方式

下面将结合本公开中附图,对本公开中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在测量理论和计算机技术的发展下,要将大规模的测试题库建设成自适应功能的测试系统,整个题库建设工作必须建立在科学的、先进的心理教育测量学的理论基础之上,即通过为试题添加合适的试题难度标签,满足不同水平测试者的要求。

目前,传统的测评技术是通过人工根据用户群体估算试题的难易程度以及试题的区分度,不仅工作量大,而且误差较大,进而,根据估算的试题的难易程度以及区分度,将试题组合成试题集对用户进行测试,根据测试结果判断用户的真实能力水平,其可信度也不高,不能真实反映出用户的真实能力水平,而基于项目反应理论(itemresponsetheory,irt)的计算机自适应测验能够避免传统测验带来的缺陷,在最大程度上反映出考生的真实能力水平上。

相对于传统的基于经典测量理论(classicaltesttheory,ctt)的固定序列测验已不能满足人们对测验准确性和可靠性的要求,,利用ctt分析的结果无法进行比较,无法有效地分析题目是否符合测量学和考试要求,而irt由于其样本独立性,可以较好地解决这个问题。但是,基于irt理论的教学测验中,其采用题库的试题难度标签也是由人工判断,工作量大,且误差也较大。

基于上述研究,本公开提出了一种试题评估方法及装置,以改善上述问题。

请结合参阅图1,本公开提供的试题评估方法应用于图1所示的电子设备100。由所述电子设备100执行本公开所提供的试题评估方法。在本公开中,所述电子设备100可以是,但不限于,个人电脑(personalcomputer,pc)、笔记本电脑、个人数字助理(personaldigitalassistant,pda)或服务器等具有处理能力的电子设备100。

所述电子设备100包括图2所示的试题评估装置10、存储器20、处理器30以及通信单元40;所述存储器20、处理器30以及通信单元40各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互直接可通过一条或多条通讯总线或信号线实现电性连接。所述试题评估装置10包括至少一个可以软件或固件(firmware)的形式存储于所述存储器20中的软件功能模块,所述处理器30通过运行存储在存储器20内的软件程序以及模块,从而执行各种功能应用以及数据处理。

所述存储器20可以是,但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。

所述处理器30可以是一种集成电路芯片,具有信号的处理能力。所述处理器30可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等。

所述通信单元40用于通过网络建立所述电子设备100与其他外部设备之间的通信连接,并通过所述网络进行数据传输。

请结合参阅图3,图3为本公开所提供的试题评估方法的流程示意图。下面对图3所示的试题评估方法的具体流程进行详细阐述。

步骤s10:基于所述试题库,生成测试试题集。

其中,在所述电子设备100中预存有试题库,所述试题库中的每个试题均预先设定有第一猜测参数、第一试题难度参数以及第一试题区分度参数。基于所述试题库,根据所述试题库中的每个试题的第一猜测参数、第一试题难度参数以及第一试题区分度参数,从所述试题库中筛选出试题,生成测试试题集,所述测试试题集中包括至少一个试题。

步骤s20:基于所述测试试题集,对各用户进行测试,获取各用户测试每个试题的测试正确率。

其中,在生成所述测试试题集后,根据该测试试题集对各用户进行测试,并获取各用户测试每个试题的测试正确率。

步骤s30:针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

其中,irt模型的意义在于描述出“成功解答某一特定考试项目的可能性”和“被测试者能力”,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算该试题的第二试题难度参数以及第二试题区分度参数的计算公式如下:

其中,p(θ)代表能力为θ的用户在特定试题上测试的测试正确率;θ表示用户的能力;a表示试题区分度参数;b表示试题难度参数;c表示猜测参数;d为常数1.7。

针对不同的用户,每个用户的能力通过预先测试所得,并保存在所述电子设备100中。测试用户的能力可以有多种,可选地,在本公开中,用户的能力可根据用户答对测试题的题数来评估,即根据用户答对测试题的正确率或得分来评估用户的能力。例如,选取多种试题(相同于一套期末试卷)预估用户的能力,根据用户答对在选取的多种试题中,答对试题的题目数占总题数的占比来评估用户的能力。一般在选取试题时,都会选取比较有意义考试的试题来评估测试者的能力,例如对于学生用户来说,则可以选取期中、期末考试试题。对于不同的用户,每个用户的能力也会不同,进而在特定题目上作答正确的概率也会不同。

针对每一个用户来说,其能力是已知并且保存在所述电子设备100中的,在获取各用户测试该试题的测试正确率后,将该试题第一猜测参数、各用户的能力以及各用户测试该试题的测试正确率代入上述公式,即可计算得到该试题的第二试题难度参数以及第二试题区分度参数。例如,用户1的能力为θ1,测试该试题的测试正确率为p(θ1),第一猜测参数为c1,用户2的能力为θ2,测试该试题的测试正确率为p(θ2),第一猜测参数为c1,用户3的能力为θ3,测试该试题的测试正确率为p(θ3),第一猜测参数为c1,将θ1、p(θ1)和c1代入上述公式,将θ2、p(θ2)和c1代入上述公式,将θ3、p(θ3)和c1代入上述公式,经过计算,即可得到该试题的第二试题难度参数以及第二试题区分度参数。

步骤s40:针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

其中,针对每个试题,在计算得到该试题的第二试题难度参数以及第二试题区分度参数后,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

步骤s50:根据修正后的结果更新所述试题库。

其中,在根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正后,根据修正后的结果更新所述试题库,以对所述试题库中的试题的第一试题难度参数和第一试题区分度参数进行修正,进而完成对试题的难度和区分度的有效评估。在完成对所述试题库中的试题的难度和区分度的有效评估后,根据评估后的试题难度和区分度,向用户推送试题,对用户进行测试,精确性较高,可信度较高,且能真实的反映出用户的真实能力水平。

在本公开中,在每次根据所述试题库,生成测试试题集,对用户进行测试后,都会对所述试题库中的试题的难度参数和区分度参数进行修正,重新评估试题的难度和区分度。针对所述试题库中的每个试题,其试题难度参数和区分度参数都会随着用户的测试,不断进行修正,进而,为试题添加合适的试题难度标签,保证试题的试题难度参数和区分度参数的可行度,从而满足不同水平测试者的要求。

进一步的,在本公开中,所述试题库中的每个试题初始的试题难度参数和试题区分度参数可通过专家调查法设定数值,也可以直接给每个试题初始的试题难度参数和试题区分度参数建立初始值。所述试题库中的每个试题的猜测参数可通过题型设定,对于客观题,其猜测参数设定为随机概率值,例如,若客观题为选择题,其猜测参数则设定为1/选项个数,若客观题为判断题,其猜测参数则设定为1/2;对于主观题,其猜测参数可设定为0。

对于用户来说,在不同的学习阶段,用户对知识点的掌握程度偏差是较大,例如,刚刚学习完某一个知识点,用户对该知识点的掌握程度较高,猜测能力则会提高一点,对该知识点对应的试题的测试正确率则高一些,但这不能说明该试题难度不高,又例如,对于某一个知识点,学习时间已经过了很久,用户对该知识点已经有遗忘,猜测能力则会降低一点,对该知识点对应的试题的测试正确率则低一些,但这个不能说明该试题难度很高。

基于此,请结合参阅图4,进一步的,所述电子设备100预存有每个试题对应的知识点以及每个试题对应的知识点的学习时间,在获取各用户测试每个试题的测试正确率后,所述方法还包括以下步骤。

步骤s60:针对每个试题,获取各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长。

其中,所述电子设备100中预存有每个试题对应的知识点的学习时间,针对每个试题,获取各用户测试该试题的测试时间与该试题对应的知识点的学习时间,计算得到各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长。

步骤s70:判断所述时长是否在第一预设时间段内。

其中,如果在所述第一预设时间段内,执行步骤s71。如果不在所述第一预设时间段内,执行步骤s72。

步骤s71:增加该试题的第一猜测参数的权重值,得到该试题的第二猜测参数。

其中,所述第一预设时间段表示对该试题对应的知识点刚刚学习完不久,所述第一预设时间段可以根据实际情况而设定,在本公开中,可选的,所述第一预设时间段可以设置为该试题对应的知识点的学习时间之后的10个小时,即10个小时内,例如,该试题对应的知识点的学习时间为9点,则所述第一预设时间段则为9点之后的10个小时,即9点到19点这个时间段内。

若各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长在所述第一预设时间段内,即各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长小于10个小时,则增加该试题的第一猜测参数的权重值,即增加上述公式中c的值,得到第二猜测参数。在得到所述第二猜测参数后,执行步骤s711至步骤s713。

s711:针对每个试题,基于irt模型,根据该试题的第二猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

其中,步骤s711的具体过程可参照上述步骤s30的过程。

s712:针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

其中,步骤s712的具体过程可参照上述步骤s40的过程。

s713:根据修正后的结果更新所述试题库。

其中,步骤s713的具体过程可参照上述步骤s50的过程。

进一步的,请结合参阅图5,如果所述时长不在所述第一预设时间段内,执行步骤s72。

步骤s72:判断所述时长是否在第二预设时间段内。

其中,如果所述时长在所述第二预设时间段内,执行步骤s73,如果所述时长不在所述第二预设时间段内,执行步骤s74。

步骤s73:减少该试题的第一猜测参数的权重值,得到该试题的第三猜测参数。

其中,所述第二预设时间段表示对该试题对应的知识点学习完有一段时间,所述第二预设时间段可以根据实际情况而设定,在本公开中,可选的,所述第二预设时间段可以设置为该试题对应的知识点的学习时间之后的一周至当前时间,即大于一周,例如,该试题对应的知识点的学习时间为9点,则所述第二预设时间段则为一周后的9点至当前时间。

若各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长在所述第二预设时间段内,即各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长大于一周,则减少该试题的第一猜测参数的权重值,即减小上述公式中c的值,得到第二猜测参数。在得到所述第二猜测参数后,执行步骤s731至步骤s733。

步骤s731:针对每个试题,基于irt模型,根据该试题的第三猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

其中,步骤s731的具体过程可参照上述步骤s30的过程。

步骤s732:针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

其中,步骤s732的具体过程可参照上述步骤s40的过程。

步骤s733:根据修正后的结果更新所述试题库。

其中,步骤s733的具体过程可参照上述步骤s50的过程。

进一步的,请结合参阅图6,如果所述时长不在第二预设时间段内,执行步骤s74。

步骤s74:针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

其中,若所述时长不在所述第一预设时间段内和所述第二预设时间段内,则所述时长位于第三预设时间段,在这个时间段内,用户对知识点的掌握程度偏差是较小的,可以不用对猜测参数进行调整。在本公开中,可选的,所述第一预设时间段可以设置为该试题对应的知识点的学习时间之后10个小时内,所述第二预设时间段可以设置为该试题对应的知识点的学习时间之后的一周至当前时间,例如,该试题对应的知识点的学习时间为9点,所述第一预设时间段则为9点之后的10个小时,即9点到19点这个时间段内,所述第二预设时间段则为一周后的9点至当前时间这个时间段内,则所述第三预设时间段为19点到一周后的9点这个时间段内,即大于10个小时小于一周这个时间段。

若各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长在所述第三预设时间段内,即各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长大于10个小时小于一周,则根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。其具体过程可参照上述步骤s30的过程。在计算得到该试题的第二试题难度参数以及第二试题区分度参数后,执行步骤s741至步骤s742。

步骤s741:针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正。

步骤s742:根据修正后的结果更新所述试题库。

其中,步骤s741至步骤s742的具体过程可参照上述步骤s40至步骤s50的过程。

进一步地,在根据修正后的结果更新所述试题库后,所述方法还包括以下步骤。

基于更新后的所述试题库,针对更新后的所述试题库中每个试题,根据该试题修正后的试题难度参数、试题区分度参数以及该试题对应的知识点,向用户推送用于测试的试题。

在本公开中,基于更新后的所述试题库,针对更新后的所述试题库中每个试题,根据该试题对应的知识点以及修正后的试题难度参数、试题区分度参数,对该试题的难度和区分度重新评估后,向用户推送用于测试的试题。

针对多个用户,可以由用户设定试题难度范围、试题区分度范围以及试题知识点,根据用户设定的范围以及试题知识点,基于更新后的所述试题库,对更新后的所述试题库中的每个试题对应的知识点、每个试题修正后的试题难度参数以及试题区分度参数进行筛选,向用户推送符合设定要求的试题。除此之外,在本公开中,还可以由用户设定题型和题量,根据用户设定的题型和题量向用户推送试题。例如,针对多个学生测试时,可以由教师设定各种题型的题量、试题的难度范围、试题的区分度范围以及试题知识点等,进而,则可根据设定的题型、题量、试题的难度范围、试题的区分度范围以及试题知识点向学生推送试题。

针对个人用户,所述电子设备100具有记忆功能,对用户每次测验的具体情况都进行记忆,包括测试的试题、测试试题对应的知识点、测试的测试正确率等。对于个人用户,由用户设定试题知识点,根据用户设定的试题知识点以及用户的能力,对更新后的所述试题库中的每个试题对应的知识点、每个试题修正后的试题难度参数以及试题区分度参数进行筛选,并根据艾宾浩斯曲线,向用户推送设定的知识点相关试题,并且试题的难度根据用户能力提高而提高。可选的,针对个人用户,也可以由用户设定试题难度范围和试题区分度范围。

进一步的,为了提高测试的精确性,在本公开中,可根据设定条件,增加所述试题库的试题量。

其中,用于增加所述试题库的试题可以由用户所出,用户新增的试题在存入至所述试题库时,根据设定条件,判断用户新增的试题是否符合要求。可选的,在本公开中,针对个人用户,所述设定条件可以为重复值,用户新增的试题在存入至所述试题库时,判断用户新增的试题是否在所述试题库中存在,若存在,则用户新增的试题不存入所述试题库中,若不存在,则将用户新增的试题存入所述试题库中,针对多个用户,例如学生用户,所述设定条件可以为重复值和使用量,用户在将新增的试题存入至所述试题库时,判断用户新增的试题是否在所述试题库中存在,若存在,则用户新增的试题不存入所述试题库中,若不存在,判断用户的使用量是否大于预设值,若用户新增的试题使用量大于所述预设值,则将用户新增的试题存入至所述试题库中。在将新增的试题存入至所述试题库中时,会对新增试题的试题难度参数和试题区分度参数设定初始值。

进一步的,请返回结合参阅图2,本公开提供一种试题评估装置10,应用于电子设备100,本公开提供的试题评估装置10包括存储模块11、生成模块12、获取模块13、计算模块14以及处理模块15。

所述存储模块11存储有试题库,所述试题库中的每个试题均预先设定有第一猜测参数、第一试题难度参数以及第一试题区分度参数。

所述生成模块12用于基于所述试题库,生成试题集,所述试题集中包括至少一个试题。

所述获取模块13用于基于所述试题集,对各用户进行测试,获取各用户测试每个试题的测试正确率。

所述计算模块14用于针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块15用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

进一步的,所述试题评估装置10还包括执行模块16;所述存储模块11还预存有每个试题对应的知识点以及每个试题对应的知识点的学习时间。

针对每个试题,所述获取模块13还用于在获取各用户测试每个试题的测试正确率后,获取各用户测试该试题的测试时间距离该试题对应的知识点的学习时间的时长。

所述执行模块16用于判断所述时长是否在第一预设时间段内。

如果在所述第一预设时间段内,所述执行模块16用于增加该试题的第一猜测参数的权重值,得到该试题的第二猜测参数。

所述计算模块14用于针对每个试题,基于irt模型,根据该试题的第二猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块15用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

进一步的,如果所述时长不在所述第一预设时间段内,所述执行模块16还用于判断所述时长是否在第二预设时间段内;

如果在所述第二预设时间段内,所述执行模块16用于减少该试题的第一猜测参数的权重值,得到该试题的第三猜测参数。

所述计算模块14用于针对每个试题,基于irt模型,根据该试题的第三猜测参数以及各用户测试该试题的正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块15用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

进一步的,如果所述时长不在所述第二预设时间段内;

所述计算模块14用于针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数。

所述处理模块15用于针对每个试题,根据该试题的第二试题难度参数对该试题的第一试题难度参数进行修正,以及根据该试题的第二试题区分度参数对该试题的第一试题区分度参数进行修正,并根据修正后的结果更新所述试题库。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的试题评估装置10的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。

综上,本公开提供的试题评估方法及装置,应用于电子设备,在电子设备中预存有试题库,试题库中的每个试题均预先设定有第一猜测参数、第一试题难度参数以及第一试题区分度参数,基于试题库,生成测试试题集,在生成测试试题集后,以该测试试题集对各用户进行测试,获取各用户测试每个试题的测试正确率,针对每个试题,基于irt模型,根据该试题的第一猜测参数以及各用户测试该试题的测试正确率,计算得到该试题的第二试题难度参数以及第二试题区分度参数,以该试题的第二试题难度参数对该试题的第一试题难度参数进行修正以及该试题的第二试题区分度参数对该试题的第一试题区分度进行修正,得到修正后的结果,并根据修正后的结果更新试题库,实现了对试题库中每个试题的难度和区分度的有效评估,精确性较高,工作量小,并且基于irt模型,根据用户的测试正确率以及试题的第一猜测参数,计算得到试题的第二试题难度参数以及第二试题区分度参数,能真实的反映出用户的真实能力水平,实现有效评估。

除此之外,本公开提供的试题评估方法及装置,针对试题库中的每个试题,其试题难度参数和区分度参数都会随着用户的测试,不断进行修正,进而保证试题库中的每个试题的试题难度参数和区分度参数的可信度,满足不同水平测试者的要求。

在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

以上所述仅为本公开的可选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1