一种基于用户行为的作文评测方法与流程

文档序号：15760974发布日期：2018-10-26 19:17阅读：165来源：国知局

本发明涉及机器学习相关技术领域，尤其是指一种基于用户行为的作文评测方法。

背景技术：

随着人们生活水平的提高，人们对于外语学习的热情日益高涨。研究如何有效快速地自动评测作文有着重要的意义，不但可以显著地减少作文老师的工作量，而且可以提高作文学习的效能。目前，作文评测主要是人工评测。人工评测需要专门的老师或者专业人员，同时需要人工反复地阅读以给出专业的评价，由于人的主观意志，不同人员打分可能出现分数不一样的情况，如果分数相差比较打，这样会对学生的学习造成困扰。随着现代科学技术的发展，用户行为分析的发展进入快车道，在新的领域应用越来越多。

技术实现要素：

本发明是为了克服现有技术中存在上述的不足，提供了一种能够快速提高作文学习效能的基于用户行为的作文评测方法。

为了实现上述目的，本发明采用以下技术方案：

一种基于用户行为的作文评测方法，包括训练阶段和评测阶段，所述的训练阶段指的是：建立用户行为数据集，利用深度学习技术来训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型，根据特征打分模型提取特征，最终训练得到作文打分模型；所述的评测阶段指的是：对使用者进行用户行为收集，提取条理结构特征、语言表达难度特征、语言表达多样性的特征，利用作文打分模型进行作文评测。

本发明提出了作文评测方法，通过采集过往用户行为建立用户行为数据集，通过深度学习算法提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征，在作文打分模型上进行打分，得到最终的作文评测得分。本发明运行用户行为分析技术、信号处理技术和机器学习方法，实现了对学习者的作文进行准确、自动的评测，能够快速提高作文学习效能。

作为优选，所述的训练阶段步骤如下：

（1）建立用户行为数据集，将过往用户行为情况记录下来，将用户行为按照标准化进行处理，和同时对应的作文的条理结构特征、语言表达难度特征、语言表达多样性的人工打分进行关联；

（2）运用上一步的数据集，结合深度学习模型训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型；

（3）利用特征打分模型对步骤（1）中的数据集提取作文的条理结构特征、语言表达难度特征、语言表达多样性的特征得分，并根据线性回归算法训练最终的作文打分模型。

作为优选，在步骤（1）中，用户行为包括：打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率，用户行为的标准化指的是：打字快慢，以词/秒为度量单位；简单词的错误率、复杂词错误率、简单词更正成功率和复杂词更正成功率，均以百分比为度量单位；心率，以次/分钟为度量单位；其中：条理结构特征、语言表达难度特征、语言表达多样性的特征均分为五个等级，其中五个等级分别对应的数值为0、1、2、3、4。

作为优选，在步骤（2）中，所述的深度学习模型包括深度神经网络、卷积神经网络和循环神经网络；深度学习是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法，提取的特征包括条理结构特征、语言表达难度特征、语言表达多样性，这些特征是深度学习算法自动学习得到，之后对用户行为数据集中相应的用户行为上进行标注即可。

作为优选，在步骤（3）中，线性回归算法公式如下：y=ax+b，该公式是向量形式，其中，y是最终得分，a和b是作文打分模型参数，a是矢量，b是标量，x是提取的特征向量。

作为优选，所述的评测阶段步骤如下：

（a）收集用户行为数据，包括：打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率，将用户行为数据按照标准值进行处理；

（b）根据训练得到的深度学习模型，对用户行为数据进行处理，提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征；

（c）利用训练得到的作文打分模型，并根据提取的特征对作文进行评测。

本发明的有益效果是：运行用户行为分析技术、信号处理技术和机器学习方法，实现了对学习者的作文进行准确、自动的评测，能够快速提高作文学习效能。

具体实施方式

下面结合具体实施方式对本发明做进一步的描述。

一种基于用户行为的作文评测方法，包括训练阶段和评测阶段，训练阶段指的是：建立用户行为数据集，利用深度学习技术来训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型，根据特征打分模型提取特征，最终训练得到作文打分模型；评测阶段指的是：对使用者进行用户行为收集，提取条理结构特征、语言表达难度特征、语言表达多样性的特征，利用作文打分模型进行作文评测。

其中：训练阶段步骤如下：

（1）建立用户行为数据集，将过往用户行为情况记录下来，将用户行为按照标准化进行处理，和同时对应的作文的条理结构特征、语言表达难度特征、语言表达多样性的人工打分进行关联；用户行为包括：打字快慢、简单词的错误率、复杂词的错误率、简单词更正成功率、复杂词更正成功率和心率，用户行为的标准化指的是：打字快慢，以词/秒为度量单位；简单词的错误率、复杂词错误率、简单词更正成功率和复杂词更正成功率，均以百分比为度量单位；心率，以次/分钟为度量单位；其中：条理结构特征、语言表达难度特征、语言表达多样性的特征均分为五个等级，其中五个等级分别对应的数值为0、1、2、3、4；

（2）运用上一步的数据集，结合深度学习模型训练条理结构特征、语言表达难度特征、语言表达多样性的特征打分模型；深度学习模型包括深度神经网络、卷积神经网络和循环神经网络；深度学习是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法，提取的特征包括条理结构特征、语言表达难度特征、语言表达多样性，这些特征是深度学习算法自动学习得到，之后对用户行为数据集中相应的用户行为上进行标注即可；

（3）利用特征打分模型对步骤（1）中的数据集提取作文的条理结构特征、语言表达难度特征、语言表达多样性的特征得分，并根据线性回归算法训练最终的作文打分模型；线性回归算法公式如下：y=ax+b，该公式是向量形式，其中，y是最终得分，a和b是作文打分模型参数，a是矢量，b是标量，x是提取的特征向量。

评测阶段步骤如下：

（b）根据训练得到的深度学习模型，对用户行为数据进行处理，提取有关作文的条理结构特征、语言表达难度特征、语言表达多样性的特征；

（c）利用训练得到的作文打分模型，并根据提取的特征对作文进行评测。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蒋阳波
技术所有人：校宝在线（杭州）科技股份有限公司
我是此专利的发明人

上一篇：一种双平壁钢塑复合管的制作方法
上一篇：一种二芳基喹啉衍生物的制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。