一种基于最大团算法的自动等质组卷方法及组卷系统与流程

文档序号:17989991发布日期:2019-06-22 00:42阅读:236来源:国知局
一种基于最大团算法的自动等质组卷方法及组卷系统与流程

本发明涉及特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法的技术领域,特别涉及一种基于最大团算法的自动等质组卷方法及组卷系统。



背景技术:

随着计算机技术和互联网的发展,教育的信息化程度越来越高,在线教育的深入要求计算机多媒体技术提供更多样化的教学辅助。

当前,考试仍是检验教学成果的重要方式,在一些情况下,教学评估会用到等质试卷,即每份试卷由试题库中不同的题目组成但能近似等效地测试学生的能力,并且这些试卷之间的重复题目不超过给定数量。为了形成统一的试卷质量和格式,老师的人工选题、知识点比例分配、难度和区分度排版、分析和对比试卷等一系列过程耗时非常长,操作不便。

现有技术中,基于组卷的巨大工作量,为了更大限度地利用试题库,新的组卷算法被不断提出,一个好的组卷算法应能保证试卷的随机性和客观性,试卷的难度、知识点覆盖、每个知识点所占比例都可以得到预先设定,除了使得系统提供尽可能高的实用性,还需具备一定的针对性和可扩展性,而这些是现有技术的组卷算法所不具备的。



技术实现要素:

为了解决上述问题,本发明提出了一种优化的基于最大团算法的自动等质组卷方法及组卷系统,以项目反应理论作为试卷质量的评估标准,先用分支定界算法最大化从题库中的出卷数量,再用最大团算法生成一组等质试卷。

本发明所采用的技术方案是,一种基于最大团算法的自动等质组卷方法,所述方法包括以下步骤:

步骤1:用户通过用户注册和登录模块登录;

步骤2:用户根据需求输入组卷参数,提交;

步骤3:组卷算法模块收到组卷参数后读取预置题库,以最大团算法进行组卷;

步骤4:输出试卷,构建组卷分析报告存储于数据库。

优选地,所述组卷参数包括题目类型、知识点和其他参数;任一题目类型对应有数量和排版时的相对位置;任一知识点对应有题量百分比。

优选地,所述其他参数包括难度系数分布、区分度系数、最大重叠题数和期望组卷数量。

优选地,所述步骤3包括以下步骤:

步骤3.1:组卷算法模块获取组卷参数和预置题库中的数据;

步骤3.2:过滤预置题库中题目类型和知识点与组卷参数的题目类型和知识点不匹配的题目;

步骤3.3:将过滤后的题目按题目类型和知识点分类;以分支定界算法产生若干道试题;

步骤3.4:以最大团算法从备选试卷中生成差异最大的一组等质试卷;

步骤3.5:生成试卷并进行渲染,统计实际输出试卷中的知识点占比和信息函数。

优选地,所述步骤3.1中,预置题库以爬虫技术从任一在线题库获取,题目的区分度系数为在[0,3]的正态分布中的随机数。

优选地,所述步骤3.3中,以分支定界算法产生若干道试题包括以下步骤:

步骤3.3.1:定义q为存储当前扩展节点的优先级队列,初始为空,q'为存储q中节点所扩展的点节的优先队列,初始为空,以bound表示界,初始为无穷;

步骤3.3.2:添加一份题数为0的试卷至队列q

步骤3.3.3:从q中选择第一个节点q,选择题库中的一道试题加入到试卷q,重新计q的价值,如果更新后的价值小于bound,则把q加入q',并调整bound

步骤3.3.4:判断q是否为空,若是,进行下一步,否则,重复步骤3.3.3;

步骤3.3.5:将q'的元素移动至q,若迭代次数未达到试卷的题数,重复步骤3.3.3,否则,输出q'中的试卷。

优选地,所述步骤3.4包括以下步骤:

步骤3.4.1:以试卷总数n为顶点数,顶点集为v[i,i+1,…,n],以cnt[i]表示v[i,i+1,…,n]的最大团数量,res用于存储当前的最大团顶点;

步骤3.4.2:从n到1逆向枚举顶点集i,以i开始构造团,并把i加入到res

步骤3.4.3:从i+1n顺序枚举与i相连的顶点j,如果cnt[i]+|res|小于等于当前最大团数量的最大值,则表示即使从i+1n的所有点都加入团仍不能构成比现在更大的团,直接返回;否则,枚举当前团中的所有顶点,检查是否每个顶点都和j点相连,若是,则把j加入到res,判断递归结束则进行下一步,递归未结束则重复步骤3.4.3,若非每个顶点都和j点相连,则继续枚举下一个节点;

步骤3.4.4:res中的顶点集就是所求的最大团。

优选地,所述组卷分析报告包括步骤3.5统计的实际输出试卷中的知识点占比、组卷参数信息、可下载的组卷链接和基于irt理论的组卷的学习者能力对比曲线图。

优选地,所述方法产生的所有输出结果通过组卷历史任务界面列表展示,包括当前用户所有已提交的任务;列表展示的内容包括组卷编号、预览链接、下载链接、详细报告和状态;所述状态包括正在运行、已完成和异常终止。

一种采用所述的基于最大团算法的自动等质组卷方法的组卷系统,所述系统包括:

一用户注册和登录模块,用于录入和读取用户信息;

一组卷参数选择模块,用于提供用户对题目类型、知识点及其占比、难度系数分布、期望区分度系数、组卷间最大重叠题数和期望组卷数进行选择,得到组卷参数信息;

一组卷算法模块,用于接收所述组卷参数选择模块确认后的组卷参数信息,自动调用算法程序选择组卷参数,对应所选组卷参数得到若干份输出的等质组卷;

一查看组卷报告模块,用于接收所述组卷算法模块输出的若干份等质组卷,得到组卷参数信息、可下载的组卷链接和基于irt理论的组卷信息函数对比曲线图。

本发明提供了一种优化的基于最大团算法的自动等质组卷方法及组卷系统,用户通过用户注册和登录模块登录后,在组卷参数选择模块根据需求输入组卷参数,提交,组卷算法模块收到组卷参数后读取预置题库,以最大团算法进行组卷后输出试卷,构建组卷分析报告存储于数据库,通过查看组卷报告模块得到组卷参数信息、可下载的组卷链接和基于irt理论的组卷信息函数对比曲线图。

本发明使得试卷制作者能够方便、快捷地根据预置题库制作出一组期望参数下的等质试卷。系统较完善地实现了组卷模块,组卷的可选参数丰富,能满足大部分组卷的需求;以现有的知识点为例,并以irt理论作为评判试卷品质的依据,相比于让难度系数和区分度系数分别逼近的方法,更好地考虑了难度系数和区分度系数之间的关系,同时能更有效地利用题库。系统的查看试卷详细报告模块使得组卷的结果可视化,将知识点比例和信息函数这些无法严格满足的指标以图形差异的形式反馈给用户,使得用户能够直观感受到组卷效果。

附图说明

图1为本发明的自动等质组卷方法的流程图;

图2为本发明的组卷系统的结构示意图。

具体实施方式

下面结合实例与附图对本发明做进一步的详细描述,但本发明的保护范围并不限于此。

本发明涉及一种基于最大团算法的自动等质组卷方法,所述方法包括以下步骤。

步骤1:用户通过用户注册和登录模块登录。

本发明中,用户注册和登录所需要的信息可以依据本领域技术人员的需求自行设置,如用户名、密码、联络信息等。

步骤2:用户根据需求输入组卷参数,提交。

所述组卷参数包括题目类型、知识点和其他参数;任一题目类型对应有数量和排版时的相对位置;任一知识点对应有题量百分比。

所述其他参数包括难度系数分布、区分度系数、最大重叠题数和期望组卷数量。

本发明中,组卷参数选择模块接收用户选择的题目类型、知识点及其占比、难度系数分布、期望区分度系数、组卷间最大重叠题数和期望组卷数,得到待确认的组卷参数信息,并将确认后的组卷参数信息发送给组卷算法模块,组卷算法模块自动调用算法程序,根据所选组卷参数的不同经几分钟不等得到输出的等质组卷,发送给查看组卷报告模块,得到组卷参数信息、可下载的组卷链接和基于irt理论的组卷信息函数对比曲线图。

步骤3:组卷算法模块收到组卷参数后读取预置题库,以最大团算法进行组卷。

所述步骤3包括以下步骤。

步骤3.1:组卷算法模块获取组卷参数和预置题库中的数据。

所述步骤3.1中,预置题库以爬虫技术从任一在线题库获取,题目的区分度系数为在[0,3]的正态分布中的随机数。

步骤3.2:过滤预置题库中题目类型和知识点与组卷参数的题目类型和知识点不匹配的题目。

本发明中,过滤掉题库中题目类型或包含知识点在用户要求之外的题目,将可能参与组卷的试题按题目类型和知识点分类,题目类型包括选择题、填空题和计算题。

步骤3.3:将过滤后的题目按题目类型和知识点分类;以分支定界算法产生若干道试题。

所述步骤3.3中,以分支定界算法产生若干道试题包括以下步骤:

步骤3.3.1:定义q为存储当前扩展节点的优先级队列,初始为空,q'为存储q中节点所扩展的点节的优先队列,初始为空,以bound表示界,初始为无穷;

步骤3.3.2:添加一份题数为0的试卷至队列q

步骤3.3.3:从q中选择第一个节点q,选择题库中的一道试题加入到试卷q,重新计q的价值,如果更新后的价值小于bound,则把q加入q',并调整bound

步骤3.3.4:判断q是否为空,若是,进行下一步,否则,重复步骤3.3.3;

步骤3.3.5:将q'的元素移动至q,若迭代次数未达到试卷的题数,重复步骤3.3.3,否则,输出q'中的试卷。

本发明中,利用分支定界算法生成满足除了重叠题数外所有约束的多份试卷,搜索方向为题数增长的方向,即,从题数i的情况扩展到题数i+1的情况,当题数达到目标题数则结束。

本发明中,为实现广搜,利用队列的数据结构,队列中存放所有可以向下扩展的节点,扩展的节点需要满足上下界才能进入队列,这包含了三个约束,分别是知识点覆盖、知识点偏差和学习者能力值偏差,算法中采用了三个界。

本发明中,步骤3.3.3是为了尝试扩展结点q

步骤3.4:以最大团算法从备选试卷中生成差异最大的一组等质试卷。

所述步骤3.4包括以下步骤:

步骤3.4.1:以试卷总数n为顶点数,顶点集为v[i,i+1,…,n],以cnt[i]表示v[i,i+1,…,n]的最大团数量,res用于存储当前的最大团顶点;

步骤3.4.2:从n到1逆向枚举顶点集i,以i开始构造团,并把i加入到res

步骤3.4.3:从i+1n顺序枚举与i相连的顶点j,如果cnt[i]+|res|小于等于当前最大团数量的最大值,则表示即使从i+1n的所有点都加入团仍不能构成比现在更大的团,直接返回;否则,枚举当前团中的所有顶点,检查是否每个顶点都和j点相连,若是,则把j加入到res,判断递归结束则进行下一步,递归未结束则重复步骤3.4.3,若非每个顶点都和j点相连,则继续枚举下一个节点;

步骤3.4.4:res中的顶点集就是所求的最大团。

本发明中,运行分支定界算法后,会得到一组满足除了重叠题数外所有约束的试卷,最大团算法则是要找出尽可能多的一组试卷且其两两之间满足重叠题数约束。

本发明中,首先把每份现有的试卷看成一个节点,对于任意两个节点,统计两个节点之间重叠的题数,如果这个数字不大于用户给出的最大重叠题数,则在这两个点之间连一条边,以bron–kerbosch算法寻找图中的最大团。bron–kerbosch算法是一个基于深度优先搜索的算法,其指定搜索顺序,即搜索i节点后不再搜索标号比i小的节点,且利用动态规划的思想,设num[i]为试卷集v[i,i+1,…,n]n为试卷总数)的最大团数目,目标是求num[1],从n到1枚举节点,可以发现num[i]=max(num[i]+1,num[i+1])

本发明中,步骤3.4.3中,为了试探点j能否加入到当前团中,可以枚举当前团中的所有顶点,检查是否每个顶点都和j点相连。

步骤3.5:生成试卷并进行渲染,统计实际输出试卷中的知识点占比和信息函数。

所述组卷分析报告包括步骤3.5统计的实际输出试卷中的知识点占比、组卷参数信息、可下载的组卷链接和基于irt理论的组卷的学习者能力对比曲线图。

本发明中,使用项目反应理论(itemresponsetheory,irt)来评价试卷的质量。项目反应理论认为,通过被试对具有一定难度和区分度等特征的项目的反应可以确定被试的潜能特征和倾向,它所建立的模型可以表达被试的特性水平和他对项目所作的反应之间的关系。

本发明中,对试题的质量进行评分时,项目反应理论使用一个logitic函数,即项目反应函数,对给定的特征水平作出正确反应的概率进行估计,这种条件概率是项目特征值或参数的函数。具体来说,以代表学生对试题i的反应(0表示不正确,1表示正确),θ代表所要测量的特性,即学习者的能力,则有其中,,表示第i题的区分度参数,,表达第i题的难度系数,题库中已经提供了每道试题的区分度和难度系数,组卷者只需要在系统中输入对于总体试卷的区分度参数和难度参数,系统在试卷生成阶段(基于分枝定界算法)将次作为约束来生成试卷集合,进而输入到最大团算法中进行处理,得到最终的等质试卷集。

步骤4:输出试卷,构建组卷分析报告存储于数据库。

所述方法产生的所有输出结果通过组卷历史任务界面列表展示,包括当前用户所有已提交的任务;列表展示的内容包括组卷编号、预览链接、下载链接、详细报告和状态;所述状态包括正在运行、已完成和异常终止。

一种采用所述的基于最大团算法的自动等质组卷方法的组卷系统,所述系统包括:

一用户注册和登录模块,用于录入和读取用户信息;

一组卷参数选择模块,用于提供用户对题目类型、知识点及其占比、难度系数分布、期望区分度系数、组卷间最大重叠题数和期望组卷数进行选择,得到组卷参数信息;

一组卷算法模块,用于接收所述组卷参数选择模块确认后的组卷参数信息,自动调用算法程序选择组卷参数,对应所选组卷参数得到若干份输出的等质组卷;

一查看组卷报告模块,用于接收所述组卷算法模块输出的若干份等质组卷,得到组卷参数信息、可下载的组卷链接和基于irt理论的组卷信息函数对比曲线图。

本发明中,以c++语言实现分枝定界、最大团算法和项目反应函数三个模块,利用php+mysql实现在线组卷平台。

本发明中,用户注册和登录模块中,用户登录后可进行的操作有:选择“智能组卷”进行新组卷参数的输入;选择“我的组卷”预览输出的组卷、获取历史组卷下载链接和查看历史组卷的详细报告。

本发明中,组卷参数选择模块对用户输入的参数接收具体过程为:用户选择包括选择、填空、计算三种题型在内的题目类型及相应数量、排版时的相对位置;用户选择系统后台预置的科目章节知识点,并为所选知识点调整其在试卷中的占比;用户选择组卷其他参数,包括难度系数分布、区分度系数、最大重叠题数和期望组卷数量;用户确认组卷参数信息后系统自动跳转至用户历史组卷任务界面。

本发明中,用户历史组卷任务界面中包括以下内容:系统列出用户所有已提交的任务,包括组卷编号、预览链接、下载链接、详细报告。其中组卷任务可能处于正在运行、已完成或异常终止的状态,异常终止的原因可能是组卷程序错误或无法生成当前参数下的期望组卷。

本发明的用户通过用户注册和登录模块登录后,在组卷参数选择模块根据需求输入组卷参数,提交,卷算法模块收到组卷参数后读取预置题库,以最大团算法进行组卷后输出试卷,构建组卷分析报告存储于数据库,通过查看组卷报告模块得到组卷参数信息、可下载的组卷链接和基于irt理论的组卷信息函数对比曲线图。本发明使得试卷制作者能够方便、快捷地根据预置题库制作出一组期望参数下的等质试卷。系统较完善地实现了组卷模块,组卷的可选参数丰富,能满足大部分组卷的需求;以现有的知识点为例,并以irt理论作为评判试卷品质的依据,相比于让难度系数和区分度系数分别逼近的方法,更好地考虑了难度系数和区分度系数之间的关系,同时能更有效地利用题库。系统的查看试卷详细报告模块使得组卷的结果可视化,将知识点比例和信息函数这些无法严格满足的指标以图形差异的形式反馈给用户,使得用户能够直观感受到组卷效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1