一种基于线下数据和贝叶斯概率的英语能力测评方法与流程

文档序号:20704825发布日期:2020-05-12 16:15阅读:167来源:国知局
一种基于线下数据和贝叶斯概率的英语能力测评方法与流程

基于线下数据和贝叶斯概率的英语能力测评方法,本发明属于计算机辅助教育领域。



背景技术:

在自适应教育的背景下,英语在线测评成为衡量学生当前能力点掌握情况的一种方法。英语在线测评包括题目的选择以及结果的评判。传统方法中测评题目的选择是从题库中抽取一定数量的题目,测评结果的评判是根据学生做题的准确度来衡量。但是这种测评方法存在许多弊端,主要有以下两点:

其一,题目数量和测评结果精准度呈正相关关系,即学生做题越多,测评结果越精准。若想得到更精准的结果,无疑是加大题目数量,给学生增加负担;

其二,轻量级英语测评的测评结果是根据学生做题的准确度来衡量,忽略了能力点的相关性,但是通过对线下英语测评数据的统计研究发现,英语的各项能力点之间并不是相互独立的,如果不考虑它们之间的相关性,就无法保证测评结果的精准度。

本发明针对传统测评方法的不足,做出了以下三点改进:

其一,将线下英语测评数据利用集成学习的方法进行建模,选出具有代表性的题目,减少测评题目数量;

其二,线下数据通过贝叶斯条件概率生成最大概率能力等级模型,考虑到了能力点之间的相关性,能够在减少测评题目的情况下,保证测评结果精准度不变;

其三,线上数据可以通过最大概率能力等级模型,得出学生当前最大概率的能力点掌握等级。



技术实现要素:

本发明提出一种基于线下数据和贝叶斯概率的英语能力测评方法,包括代表性题目选择方法、最大概率能力等级模型生成方法和在线英语能力等级计算方法。

代表性题目选择方法:首先收集学生线下的测评题目数据以及测评结果数据,然后利用集成学习的方法对数据做分类建模,模型达标后得到各题目的重要性指标,这个重要性指标指该题目对学生的测评结果的影响程度,最后根据各题目的重要性指标选择达标题目。

最大概率能力等级模型生成方法:对已选择出的测评题目按照作答顺序进行排序,根据线下的测评题目数据和测评结果数据,用贝叶斯条件概率计算出学生在各作答情况下测评结果的概率分布情况,生成最大概率能力等级模型。

在线英语能力等级计算方法:将线上的学生测评数据输入最大概率能力等级模型中,输出学生当前最大概率的能力点等级。

附图说明

图1代表性题目选择方法流程图。

图2最大概率能力等级模型生成流程图。

图3在线英语能力等级计算方法流程图。

具体实施步骤

本发明主要分为三部分,第一部分为代表性题目选择方法,首先收集到学生的线下英语测评题目数据和测评结果数据,测评题目数据是学生做客观题的对错情况,测评结果数据是学生的能力点等级,能力点包括词汇、语法、听力、口语、阅读、写作六项,然后将线下的学生测评数据划分为训练集和测试集,测评题目数据作为特征,测评结果数据作为标签,利用xgboost、lightgbm、randomforest这三种集成学习方法对训练集进行建模训练,并用测试集对模型进行评估,评估指标为f1值,保存达标模型,最后分别输出三个模型的题目重要性指标,对三种指标进行算术平均后选取达标的题目;第二部分是最大概率能力等级模型生成方法,数据集是第一部分选取的达标题目和测评结果,利用贝叶斯条件概率计算出学生在各答题情况下测评结果的概率值,生成最大等级概率模型;第三部分是在线英语能力等级计算方法,将学生的线上英语测评数据传入最大等级概率模型,得到学生各个能力点的最大概率等级。

结合一个具体的实例方法,操作流程步骤如下:

1)收集学生在托福自适应学习系统上的测评题目数据和测评结果数据;

2)利用图1方法选出代表性测评题目;

3)利用图2方法生成最大概率能力等级模型;

4)利用图3方法输出学生最大概率的能力点等级。



技术特征:

1.一种基于线下数据和贝叶斯概率的英语能力测评方法,该方法主要有三种特征。

2.特征一:代表性题目选择方法,将学生线下的测评题目数据以及测评结果数据,利用集成学习的方法对数据做分类建模,模型达标后得到各题目的重要性指标,根据重要性指标选择达标题目。

3.特征二:最大概率能力等级模型生成方法,根据线下的测评题目数据和测评结果数据,用贝叶斯条件概率计算出学生在各作答情况下,测评结果的概率分布情况,生成最大概率能力等级模型。

4.特征三:在线英语能力等级计算方法,将线上的学生测评数据传入最大概率能力等级模型中,输出学生当前最大概率的能力点等级。


技术总结
在自适应教育的背景下,英语在线测评成为衡量学生当前能力点掌握情况的一种方法。本发明针对传统英语在线测评方法的不足,提出一种基于线下数据和贝叶斯概率的英语能力测评方法,该方法包括代表性题目选择方法、最大概率能力等级模型生成方法和在线英语能力等级计算方法。本发明的优点在于在保证测评结果精准度不变的情况下,减少测评题目的数量。

技术研发人员:潘昭宇;赵璞;贾艳明
受保护的技术使用者:北京博智天下信息技术有限公司
技术研发日:2018.11.02
技术公布日:2020.05.12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1