一种用户能力的评估方法、装置及存储介质与流程

文档序号:21185766发布日期:2020-06-20 18:06阅读:149来源:国知局
一种用户能力的评估方法、装置及存储介质与流程

本申请涉及领域,具体而言,涉及一种用户能力的评估方法、装置及存储介质。



背景技术:

随着科技的发展,人们的学习方式也发生了翻天覆地的变化,从纸质化的学习转变为电子化的学习。在电子平台上,为了更好更快地找到适合自己的学习课程,人们通常会先进行自我能力的测试,根据能力测试结果选择与之匹配的学习产品以及方式,从而可以极大的提高学习效率。

在目前的能力测试中,通常是根据用户对测试题的作答结果,即通过考虑用户作答的正确与否来评估用户的能力,但这种衡量能力的标准不够全面,难以评估到用户真实的能力。



技术实现要素:

本申请实施例的目的在于提供一种用户能力的评估方法、装置及存储介质,用以实现评估到用户真实的能力。

第一方面,本申请实施例提供了一种用户能力的评估方法,所述方法包括:

从测试题库中选择出试题的难度值与用户的当前能力值匹配的测试题;将所述测试题推送给所述用户;获取所述用户作答完成所述测试题的作答耗时以及作答结果;根据所述作答耗时以及所述作答结果调整所述当前能力值,获得所述用户调整后的能力值。

在本申请实施例中,在对用户的能力进行测试评估的过程中,通过将用户作答完成测试题的作答耗时也考虑在内,以通过作答耗时和作答结果来多维度的全面评估用户能力,能够实现评估到用户真实的能力。

结合第一方面,在第一种可能的实现方式中,根据所述作答耗时以及所述作答结果调整所述当前能力值,获得所述用户调整后的当前能力值,包括:

利用预设的irt模型处理所述作答结果,获得所述用户的第一能力调整值,以及利用预设的耗时与能力的关系函数处理所述作答耗时和所述当前能力值,获得所述用户的第二能力调整值;根据所述当前能力值、所述第一能力调整值和所述第二能力调整值,确定出所述调整后的能力值。

在本申请实施例中,由于irt模型能够准确的评估出测试题的难度与用户的能力之间差,因此通过irt模型能够准确的确定出第一能力调整值。此外,由于关系函数能够反映出作答耗时和当前能力值的关系,那么通过该关系函数能够准确的确定出作答耗时所对应的第二能力调整值。因此,通过准确的确定出第一能力调整值和第二能力调整值,便能够实现准确的调整用户的能力。

结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,利用预设的耗时与能力的关系函数处理所述作答耗时和所述当前能力值,获得所述用户的第二能力调整值,包括:

基于所述当前能力值和所述作答耗时,确定出所述作答耗时与所述当前难度的相关度;利用所述关系函数处理所述作答耗时、所述相关度、所述测试题预设的所有作答耗时的平均值以及所述所有作答耗时的标准差,获得所述第二能力调整值。

在本申请实施例中,在衡量第二能力调整值的过程中,通过将所有作答耗时的平均值以及标准差考虑在内,使得对第二能力调整值的衡量有一个明确的参考,以便更加准确的确定出第二能力调整值。

结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,基于所述当前能力值和所述作答耗时,确定出所述作答耗时与所述当前难度的相关度,包括:

利用于预设的皮尔逊相关函数计算所述当前能力值和所述作答耗时,确定出所述相关度;

其中,所述皮尔逊相关函数为:x表示所述作答耗时,y表示所述当前能力值。

在本申请实施例中,通过皮尔逊相关函数来确定当前能力值和作答耗时的相关度,以在确定第二能力调整值过程中将当前能力值也考虑在内,从而更准确的确定出第二能力调整值。

结合第一方面,在第四种可能的实现方式中,在获得所述用户调整后的当前能力值之后,所述方法还包括:

确定出所述当前能力值、所述调整后的能力值以及所述用户所有的历史能力值的标准差;判断所述标准差是否小于预设值;若小于,结束评估所述用户的能力;若不小于,利用从所述测试题库中选择出试题的难度值与调整后的能力值匹配的测试题,继续对所述用户的能力进行评估。

在本申请实施例中,通过标准差是否小于预设值可以判断对用户能力的评估是否出现收敛的情况,若出现,则说明对用户能力的评估已经趋于稳定,因而实现准确的评估出用户能力。

结合第一方面,在第五种可能的实现方式中,确定出所述试题的难度值的步骤包括:

利用极大似然估计法计算历史中作答所述测试题所得的所有作答结果,确定出所述试题的难度值。

在本申请实施例中,通过历史中作答测试题所得的所有作答结果,可以客观且准确的确定出该试题的难度值。

第二方面,本申请实施例提供了一种用户能力的评估装置,所述装置包括:

试题选择推送模块,用于从测试题库中选择出试题的难度值与用户的当前能力值匹配的测试题;将所述测试题推送给所述用户;

用户能力调整模块,用于获取所述用户作答完成所述测试题的作答耗时以及作答结果;根据所述作答耗时以及所述作答结果调整所述当前能力值,获得所述用户调整后的能力值。

结合第二方面,在第一种可能的实现方式中,

所述用户能力调整模块,用于利用预设的irt模型处理所述作答结果,获得所述用户的第一能力调整值,以及利用预设的耗时与能力的关系函数处理所述作答耗时和所述当前能力值,获得所述用户的第二能力调整值;根据所述当前能力值、所述第一能力调整值和所述第二能力调整值,确定出所述调整后的能力值。

结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,

所述用户能力调整模块,用于基于所述当前能力值和所述作答耗时,确定出所述作答耗时与所述当前难度的相关度;利用所述关系函数处理所述作答耗时、所述相关度、所述测试题预设的所有作答耗时的平均值以及所述所有作答耗时的标准差,获得所述第二能力调整值。

结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述用户能力调整模块,用于利用于预设的皮尔逊相关函数计算所述当前能力值和所述作答耗时,确定出所述相关度;

其中,所述皮尔逊相关函数为:x表示所述作答耗时,y表示所述当前能力值。

结合第二方面,在第四种可能的实现方式中,所述用户能力调整模块在获得所述用户调整后的当前能力值之后,所述用户能力调整模块,还用于确定出所述当前能力值、所述调整后的能力值以及所述用户所有的历史能力值的标准差;判断所述标准差是否小于预设值;若小于,结束评估所述用户的能力;若不小于,利用从所述测试题库中选择出试题的难度值与调整后的能力值匹配的测试题,继续对所述用户的能力进行评估。

结合第二方面,在第五种可能的实现方式中,所述用户能力调整模块,还用于利用极大似然估计法计算历史中作答所述测试题所得的所有作答结果,确定出所述试题的难度值。

第三方面,本申请实施例提供了一种具有计算机可执行的非易失程序代码的计算机可读存储介质,所述程序代码使所述计算机执行如第一方面以及第一方面的任一种可能的实现方式所述的用户能力的评估方法。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种用户能力的评估方法的流程图;

图2为本申请实施例提供的一种用户能力的评估方法中irt模型的函数曲线示意图;

图3为本申请实施例提供的一种电子设备的结构框图;

图4为本申请实施例提供的一种用户能力的评估装置的结构框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

请参阅图1,本申请实施例提供了一种用户能力的评估方法,该用户能力的评估方法可以由电子设备执行,该电子设备可以是终端或者服务器,其中,终端可以是个人电脑(personalcomputer,pc)、平板电脑、智能手机、个人数字助理(personaldigitalassistant,pda)等;服务器可以为网络服务器、数据库服务器、云服务器或由多个子服务器构成的服务器集成等。

具体的,该用户能力的评估方法可以包括:步骤s100、步骤s200、步骤s300和步骤s400。

步骤s100:从测试题库中选择出试题的难度值与用户的当前能力值匹配的测试题。

步骤s200:将选择出的测试题推送给该用户。

步骤s300:获取该用户作答完成该测试题的作答耗时以及作答结果。

步骤s400:根据作答耗时以及作答结果调整该用户的当前能力值,获得该用户调整后的能力值。

下面将对用户能力的评估方法的流程进行详细地说明。

本实施例中,在执行步骤s100之前,电子设备可以先确定出测试题的难度值。作为确定测试题的难度值的一种示例方式,电子设备可以预先计算出每道需要放入测试题库的测试题的难度值。然后,电子设备在执行步骤s100的过程中,电子设备可以直接获取每一道需要拿来匹配的测试题的难度值,以配合步骤s100的执行。而作为确定测试题的难度值的另一种示例方式,电子设备可以先将各测试题放入到测试题库中,然后在执行步骤s100以选择匹配的测试题的过程中,电子设备可以动态的计算每一道需要拿来匹配的测试题的难度值,以配合步骤s100的执行。

可以理解到,由于电子设备对每道测试题的难度值的计算方式都大致相同,为便于理解,下面将以计算某一道测试题的难度值为例对两种方式分别予以说明。

作为第一种示例方式,电子设备中预先录入有该历史中各用户作答该测试题所得的作答结果,那么电子设备可以利用预设的极大似然估计法,计算历史中作答该测试题所得到的所有作答结果,从而确定出该测试题的难度值。

具体的,电子设备可以先将所有的作答结果分为两类,比如将每个作答正确的结果全部标注为1,以及将每个作答错误的结果全部标注为0,这样便将所得的作答结果分为0和1两类。然后,电子设备可以将分为两类的作答结果放入到极大似然估计法预设的函数中,该函数如下式1所示:

在式(1)中,yi表示为0或者为1的作答结果,且作答结果一共有m个,pi表示irt模型的函数。

本实施例中,irt模型的函数可以如下式2所示:

式(2)所示出的曲线可以如图2所示,结合图2说明式(2),在式(2)中,d为常数1.702、ai表示测试题的区分度值、bi表示测试题的难度值、ci表示测试题的猜测值、θ表示用户的能力值、pi(θ)表示测试题被答对的概率值。

其中,区分度值表示测试题是否可以将用户的作答结果(比如作答结果为分数)区分开,区分度值可以影响图2示出的曲线的中部斜率,若斜率越小,测试题那么就很难将用户的作答结果区分开。测试题的难度值影响图2示出的曲线在横轴方向上的位移,测试题的难度值越大,则用户作答想要获得比较好的作答结果就需要用户的能力值比较高。猜测值表示用户即使对测试题一点先经验知识都没有,靠蒙也能蒙对的概率,比如猜测值为0.25则表示测试题有0.25的概率猜对。

进一步的,结合式(1)、式(2)以及分为两类的作答结果,电子设备可以采用迭代的方式计算出测试题的难度值。

比如,电子设备可以预设测试题被答对的概率值为0.5,且该试题被答对的概率值是固定值。然后,电子设备预估出测试题的区分度值、测试题的猜测值以及用户的能力值。这样,电子设备便可以基于这些预估的值以及预设的固定值,结合式(2)以对式(1)求导,便可以确定出测试题的难度值。然后,电子设备继续预估出测试题的区分度值以及测试题的猜测值,并利用预估出的值、确定出的值以及预设的固定值,便可以求导确定出用户的能力值。然后,电子设备再预估出测试题的区分度值,并利用预估出的值、确定出的值以及预设的固定值,继续求导确定出测试题的猜测值。之后,电子设备进一步利用前述所有确定出的值以及预设的固定值,便可以求导确定出测试题的区分度值。在确定出测试题的区分度值、测试题的猜测值以及用户的能力值的基础上,电子设备可以对确定出测试题的区分度值、测试题的猜测值以及用户的能力值进行调整,然后获得新预估测试题的区分度值、测试题的猜测值以及用户的能力值,这样电子设备便可以重复上述过程,以进行迭代计算。当迭代到确定出测试题的难度值以及测试题的区分度值的变化已经趋于稳定,电子设备停止迭代,以最后迭代确定出测试题的难度值以及测试题的区分度值作为最终的计算结果。

进一步的,为确保测试题库中的测试题能够便于评估用户的能力,那么测试题库中的测试题的难度不能太大或太小,以及区分度值也不能太大或太小。因此,电子设备可以判断最终确定出的测试题的难度值是否在预设的难度范围内,以及判断最终确定出的测试题的区分度值是否在预设的区分度范围内。若都在,表示该测试题的难度合适且区分度也合适,因此可以将该测试题加入到测试题库中;否则,则将该测试题丢弃,并继续计算下一道测试题的难度值以及区分度值。

可以理解到,当需要对测试题库进行更新时,可以将需要更新到测试题库中的测试题也进行上述流程的处理,以实现对测试题库的动态更新。

作为第一种示例方式,电子设备可以将所有的测试题都预先加入到测试题库中,在执行步骤s200而计算测试题的难度值时,电子设备可以基于前述计算测试题的难度值以及区分度值的流程,计算每一道需要拿来匹配的测试题的难度值以及区分度值。并且,在计算出测试题的难度值以及区分度值后,电子设备可以判断计算出的测试题的区分度值是否在预设的区分度范围内。若在预设的区分度范围内,表示该测试题的区分度也合适,因此可以执行步骤s100,以将计算出的该测试题的难度值与用户的当前能力值匹配;否则,则将该测试题丢弃,并继续计算下一道测试题的难度值以及区分度值。

步骤s100:从测试题库中选择出试题的难度值与用户的当前能力值匹配的测试题。

本实施例中,电子设备可以随机的从测试题库中选择出一道测试题,并将该测试题的难度值与该用户的当前能力值匹配,看看是否能匹配上。例如,电子设备预设有每种测试题的难度范围,以及预设了每种测试题的难度范围所匹配的一种能力范围,比如,测试题的难度范围为(-1,1)与能力范围(-1,1)匹配,测试题的难度范围为[-2,1)与能力范围[-2,1)匹配,测试题的难度范围为[-3,2)与能力范围[-3,2)匹配,测试题的难度范围为(1,2]与能力范围(1,2]匹配,测试题的难度范围为(2,3]与能力范围(2,3]匹配等,那么电子设备便可以判断该测试题的难度值所在的难度范围与该用户的当前能力值所在的能力范围是否匹配。

若确定不匹配,电子设备可以将当前选择出的测试题抛弃,并继续随机选择下一道测试题来进行匹配,直至确定出匹配的测试题。

需要说明的是,若本次测试是用户在测试过程中的第一次测试,电子设备可以默认用户的当前能力值为电子设备预设的初始水平,比如默认用户的当前能力值为0。随着测试不断进行,电子设备可以基于用户对测试题作答的情况不断调整用户的当前能力值,那么若本次测试是用户在测试过程中的第n次测试(n为大于1的整数),则用户的当前能力值便是基于第n-1测试的情况而进行调整的能力值。

若确定匹配,说明该测试题适合本次测试,故电子设备可以进一步执行步骤s200。

步骤s200:将选择出的测试题推送给该用户。

电子设备可以将该选择出的测试题推送到该用户所使用的客户端,那么用户便可以通过客户端来对该测试题进行作答。

步骤s300:获取该用户作答完成该测试题的作答耗时以及作答结果。

客户端可以对用户的作答进行监控,在用户完成作答该测试题时,客户端通过监控可以记录用户作答完成该测试题的作答耗时,以及记录该用户对测试题的作答结果。客户端可以将记录到作答耗时以及作答结果实时的反馈给电子设备,那么电子设备便可以获取到该用户作答完成该测试题的作答耗时以及作答结果。

电子设备获取到作答耗时以及作答结果后,电子设备可以进一步执行步骤s400,以调整对用户能力的评估。

步骤s400:根据作答耗时以及作答结果调整该用户的当前能力值,获得该用户调整后的能力值。

本实施例中,为更准确的调整用户的能力值,电子设备在基于作答结果调整用户的能力值的同时,电子设备还基于作答耗时调整用户的能力值。

作为示例性的方式,电子设备可以利用预设的irt模型处理该作答结果,从而获得用户的第一能力调整值,其中,根据作答结果的不同,计算出的第一能力调整值可以为正也可以为负。同样的,电子设备还可以利用预设的耗时与能力的关系函数处理作答耗时和用户的当前能力值,获得用户的第二能力调整值,其中,根据作答耗时和用户的当前能力值的不同,计算出第二能力调整值同样可以为正也可以为负。最后,电子设备基于用户的当前能力值、第一能力调整值和第二能力调整值,便可以确定出调整后的能力值;例如,电子设备将用户的当前能力值、第一能力调整值和第二能力调整值加总,获得和值即是调整后的能力值。

本实施例中,作为利用关系函数处理作答耗时和用户的当前能力值的具体方式,电子设备可以基于用户的当前能力值和作答耗时,确定出该作答耗时与用户的当前难度的相关度。这样,电子设备利用预设的关系函数处理该作答耗时、该确定出的相关度、该测试题预设的所有作答耗时的平均值以及测试题预设的所有作答耗时的标准差,便可以获得第二能力调整值。例如,电子设备先确定出作答耗时与该测试题预设的所有作答耗时的平均值的差值,再确定出该差值与测试题预设的所有作答耗时的标准差的商值,最后,再确定出商值与该相关度的乘积,该乘积即为第二能力调整值。

可以理解到,为准确的确定出相关度,电子设备可以预设皮尔逊相关函数,并利用该皮尔逊相关函数来计算当前能力值和作答耗时,以准确的确定出相关度。比如,皮尔逊相关函数可以如下式(3)所示:

其中,式(3)中的x表示作答耗时,式(3)中的y表用户的当前能力值。

本实施例中,电子设备在获得用户调整后的当前能力值之后,电子设备可以利用当前能力值、调整后的能力值、以及该用户在确定出当前能力值之前历史确定出的所有的历史能力值,确定出当前能力值、调整后的能力值以及所有的历史能力值的标准差,并判断该标准差是否小于预设值。可以理解到,若当前能力值是第一次确定出的能力值,说明在当前能力值之前没有历史能力值,即所有的历史能力值为空,那么电子设备可以直接确定出当前能力值以及调整后的能力值的标准差。

若不小于该标准差,说明对用户能力值的评估还没呈收敛状,即调整后的能力值还不够稳定,不能够反映出用户的真实能力,那么电子设备利用从测试题库中选择出试题的难度值与调整后的能力值匹配的测试题,继续对用户的能力进行评估,直至将能力值调整到小于该标准差。

若小于,说明对用户能力值的评估已经呈收敛状,即调整后的能力值已经足够稳定,调整后的能力值能够反映出用户的真实能力,因而电子设备可以结束评估用户的能力,将调整后的能力值推送给客户端,以使用户获知自身的测试结果。

请参阅图3,基于同一发明构思,本申请实施例提供了一种电子设备10,该电子设备10可以包括连接到客户端的通信接口11、用于执行程序指令的一个或多个处理器12、总线13、和不同形式的存储器14,例如,磁盘、rom、或ram,或其任意组合。示例性地,计算机平台还可以包括存储在rom、ram、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。

存储器14用于存储程序,处理器12用于调用并运行存储器14中的程序以执行前述的用户能力的评估方法。

请参阅图4,基于同一发明构思,本申请实施例还提供了一种用户能力的评估装置100,该用户能力的评估装置100可以包括:

试题选择推送模块110,用于从测试题库中选择出试题的难度值与用户的当前能力值匹配的测试题;将所述测试题推送给所述用户。

用户能力调整模块120,用于获取所述用户作答完成所述测试题的作答耗时以及作答结果;根据所述作答耗时以及所述作答结果调整所述当前能力值,获得所述用户调整后的能力值。

可选的,所述用户能力调整模块120,用于利用预设的irt模型处理所述作答结果,获得所述用户的第一能力调整值,以及利用预设的耗时与能力的关系函数处理所述作答耗时和所述当前能力值,获得所述用户的第二能力调整值;根据所述当前能力值、所述第一能力调整值和所述第二能力调整值,确定出所述调整后的能力值。

可选的,所述用户能力调整模块120,用于基于所述当前能力值和所述作答耗时,确定出所述作答耗时与所述当前难度的相关度;利用所述关系函数处理所述作答耗时、所述相关度、所述测试题预设的所有作答耗时的平均值以及所述所有作答耗时的标准差,获得所述第二能力调整值。

需要说明的是,由于所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请一些实施例还提供了一种计算机可执行的非易失的程序代码的计算机可读储存介质,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该计算机可读存储介质上存储有程序代码,该程序代码被计算机运行时执行上述任一实施方式的用户能力的评估方法的步骤。

本申请实施例所提供的用户能力的评估方法的程序代码产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。

综上所述,在对用户的能力进行测试评估的过程中,通过将用户作答完成测试题的作答耗时也考虑在内,以通过作答耗时和作答结果来多维度的全面评估用户能力,能够实现评估到用户真实的能力。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1