一种基于用户行为的作文评测方法与流程

文档序号:15760974发布日期:2018-10-26 19:17阅读:165来源:国知局

本发明涉及机器学习相关技术领域,尤其是指一种基于用户行为的作文评测方法。



背景技术:

随着人们生活水平的提高,人们对于外语学习的热情日益高涨。研究如何有效快速地自动评测作文有着重要的意义,不但可以显著地减少作文老师的工作量,而且可以提高作文学习的效能。目前,作文评测主要是人工评测。人工评测需要专门的老师或者专业人员,同时需要人工反复地阅读以给出专业的评价,由于人的主观意志,不同人员打分可能出现分数不一样的情况,如果分数相差比较打,这样会对学生的学习造成困扰。随着现代科学技术的发展,用户行为分析的发展进入快车道,在新的领域应用越来越多。



技术实现要素:

本发明是为了克服现有技术中存在上述的不足,提供了一种能够快速提高作文学习效能的基于用户行为的作文评测方法。

为了实现上述目的,本发明采用以下技术方案:

一种基于用户行为的作文评测方法,包括训练阶段和评测阶段,所述的训练阶段指的是:建立用户行为数据集,利用深度学习技术来训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型,根据特征打分模型提取特征,最终训练得到作文打分模型;所述的评测阶段指的是:对使用者进行用户行为收集,提取条理结构特征、语言表达难度特征、语言表达多样性的特征,利用作文打分模型进行作文评测。

本发明提出了作文评测方法,通过采集过往用户行为建立用户行为数据集,通过深度学习算法提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征,在作文打分模型上进行打分,得到最终的作文评测得分。本发明运行用户行为分析技术、信号处理技术和机器学习方法,实现了对学习者的作文进行准确、自动的评测,能够快速提高作文学习效能。

作为优选,所述的训练阶段步骤如下:

(1)建立用户行为数据集,将过往用户行为情况记录下来,将用户行为按照标准化进行处理,和同时对应的作文的条理结构特征、语言表达难度特征、语言表达多样性的人工打分进行关联;

(2)运用上一步的数据集,结合深度学习模型训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型;

(3)利用特征打分模型对步骤(1)中的数据集提取作文的条理结构特征、语言表达难度特征、语言表达多样性的特征得分,并根据线性回归算法训练最终的作文打分模型。

作为优选,在步骤(1)中,用户行为包括:打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率,用户行为的标准化指的是:打字快慢,以词/秒为度量单位;简单词的错误率、复杂词错误率、简单词更正成功率和复杂词更正成功率,均以百分比为度量单位;心率,以次/分钟为度量单位;其中:条理结构特征、语言表达难度特征、语言表达多样性的特征均分为五个等级,其中五个等级分别对应的数值为0、1、2、3、4。

作为优选,在步骤(2)中,所述的深度学习模型包括深度神经网络、卷积神经网络和循环神经网络;深度学习是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法,提取的特征包括条理结构特征、语言表达难度特征、语言表达多样性,这些特征是深度学习算法自动学习得到,之后对用户行为数据集中相应的用户行为上进行标注即可。

作为优选,在步骤(3)中,线性回归算法公式如下:y=ax+b,该公式是向量形式,其中,y是最终得分,a和b是作文打分模型参数,a是矢量,b是标量,x是提取的特征向量。

作为优选,所述的评测阶段步骤如下:

(a)收集用户行为数据,包括:打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率,将用户行为数据按照标准值进行处理;

(b)根据训练得到的深度学习模型,对用户行为数据进行处理,提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征;

(c)利用训练得到的作文打分模型,并根据提取的特征对作文进行评测。

本发明的有益效果是:运行用户行为分析技术、信号处理技术和机器学习方法,实现了对学习者的作文进行准确、自动的评测,能够快速提高作文学习效能。

具体实施方式

下面结合具体实施方式对本发明做进一步的描述。

一种基于用户行为的作文评测方法,包括训练阶段和评测阶段,训练阶段指的是:建立用户行为数据集,利用深度学习技术来训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型,根据特征打分模型提取特征,最终训练得到作文打分模型;评测阶段指的是:对使用者进行用户行为收集,提取条理结构特征、语言表达难度特征、语言表达多样性的特征,利用作文打分模型进行作文评测。

其中:训练阶段步骤如下:

(1)建立用户行为数据集,将过往用户行为情况记录下来,将用户行为按照标准化进行处理,和同时对应的作文的条理结构特征、语言表达难度特征、语言表达多样性的人工打分进行关联;用户行为包括:打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率,用户行为的标准化指的是:打字快慢,以词/秒为度量单位;简单词的错误率、复杂词错误率、简单词更正成功率和复杂词更正成功率,均以百分比为度量单位;心率,以次/分钟为度量单位;其中:条理结构特征、语言表达难度特征、语言表达多样性的特征均分为五个等级,其中五个等级分别对应的数值为0、1、2、3、4;

(2)运用上一步的数据集,结合深度学习模型训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型;深度学习模型包括深度神经网络、卷积神经网络和循环神经网络;深度学习是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法,提取的特征包括条理结构特征、语言表达难度特征、语言表达多样性,这些特征是深度学习算法自动学习得到,之后对用户行为数据集中相应的用户行为上进行标注即可;

(3)利用特征打分模型对步骤(1)中的数据集提取作文的条理结构特征、语言表达难度特征、语言表达多样性的特征得分,并根据线性回归算法训练最终的作文打分模型;线性回归算法公式如下:y=ax+b,该公式是向量形式,其中,y是最终得分,a和b是作文打分模型参数,a是矢量,b是标量,x是提取的特征向量。

评测阶段步骤如下:

(a)收集用户行为数据,包括:打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率,将用户行为数据按照标准值进行处理;

(b)根据训练得到的深度学习模型,对用户行为数据进行处理,提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征;

(c)利用训练得到的作文打分模型,并根据提取的特征对作文进行评测。

本发明提出了作文评测方法,通过采集过往用户行为建立用户行为数据集,通过深度学习算法提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征,在作文打分模型上进行打分,得到最终的作文评测得分。本发明运行用户行为分析技术、信号处理技术和机器学习方法,实现了对学习者的作文进行准确、自动的评测,能够快速提高作文学习效能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1