一种基于大数据条件下的个性化课程定制方法与流程

文档序号：18001404发布日期：2019-06-25 22:53阅读：171来源：国知局

本发明涉及教育信息技术领域，尤其是涉及一种基于大数据条件下的个性化课程定制方法。

背景技术：

在全社会普遍的个性化学习需求的大背景下，平台管理者往往希望能考虑不同的历史操作对象情况，如学习需求或学习动机的差异等，设计出个性化的学习支持服务工具，并提供感兴趣的课程资源与内容，提高学习的效率。课程推荐是在线学习平台系统中的典型服务功能，根据平台用户的兴趣特征，为用户推荐个性化的课程资源与内容。在现有的有关在线课程推荐的研究大多是基于推荐方法的研究，推荐的课程资源不能很好的符合用户的需求，导致用户在学习平台上面选择自身需要的课程资源过程上面浪费较多的时间。

技术实现要素：

有鉴于此，本发明的目的在于提供一种基于大数据条件下的个性化课程定制方法，使学习平台推荐给用户的课程资源能够更加准确的符合用户的需求，缓解现有的学习平台推荐的课程资源不能很好地符合用户的需求的技术问题。

第一方面，本发明实施例提供了一种基于大数据条件下的个性化课程定制方法，应用于学习平台，包括：获取历史操作对象在所述学习平台的操作行为数据，其中，所述历史操作对象的数量为多个；利用所述操作行为数据对多个所述历史操作对象进行聚类分析，得到多个所述历史操作对象的多个类别信息；在获取到目标用户的课程定制请求之后，在所述多个类别信息中确定目标用户的所属的目标类别信息；确定所述目标类别信息中的目标操作对象的多个学习资源，所述目标操作对象为所述目标类别信息中操作时间满足预设要求的历史操作对象；基于所述多个学习资源的属性信息，在所述多个学习资源中确定目标学习资源；所述属性信息包括：所述目标操作对象对学习资源的浏览频次信息和/或对所述学习资源的评价信息；将所述目标学习资源作为目标用户的定制化课程发送给所述目标用户。

进一步地，利用所述操作行为数据对多个所述历史操作对象进行聚类分析，得到多个所述历史操作对象的类别信息包括：对所述操作行为数据进行数据归一化处理，得到归一化数据；基于所述归一化数据计算每个历史操作对象的行为特征的权重值，其中，所述行为特征包括：登陆时间间隔，课程资源浏览频次，学习时间长度；基于所述行为特征的权重值对所述历史操作对象进行聚类分析，得到多个类别信息。

进一步地，对所述操作行为数据进行数据归一化处理，得到归一化数据包括：基于所述操作行为数据，确定各个历史操作对象的学习行为指标；所述学习行为指标包括以下至少之一：历史操作对象的登陆时间间隔指标，课程资源浏览频次指标，学习时间长度指标；利用线性归一化方法对所述学习行为指标进行归一化处理，得到各个历史操作对象的归一化数据。

进一步地，计算所述归一化数据中每个历史操作对象的行为特征的权重值包括：利用熵值法计算所述归一化数据中每个历史操作对象的行为特征的权重值。

进一步地，基于所述行为特征的权重值对所述历史操作对象进行聚类分析，得到多个类别信息包括：在多个历史操作对象中选择多个初始聚类对象；基于所述行为特征的权重值，计算各个历史操作对象与所述多个初始聚类对象之间的距离，得到多个第一距离；基于所述多个第一距离和所述多个初始聚类对象，利用k-means聚类算法将所述多个历史操作对象划分成多个类别，得到多个类别信息。

进一步地，在所述多个类别信息中确定目标用户的所属的目标类别信息包括：基于所述行为特征的权重值，分别计算所述目标用户与所述多个初始聚类对象之间的距离，得到多个第二距离；基于所述多个第二距离，在所述多个类别信息中确定所述目标用户的目标类别信息。

进一步地，基于所述行为特征的权重值，计算各个历史操作对象与所述多个初始聚类对象之间的距离，得到多个第一距离包括：计算历史操作对象ai的归一化数据与初始聚类对象bj的归一化数据之间的差值，得到目标差值cij；其中，i依次取1至i，j依次取1至j，i为所述历史操作对象的数量，j为所述初始聚类对象的数量，所述目标差值cij包括以下至少之一：时间间隔指标差值，频次指标差值，学习时间长度指标差值；计算所述目标差值cij关于所述历史操作对象ai的行为特征的权重值的加权平均值；将所述加权平均值作为所述历史操作对象ai和所述初始聚类对象bj之间的第一距离。

进一步地，基于所述多个第二距离，在所述多个类别信息中确定所述目标用户的目标类别信息，包括：将所述多个第二距离中最小第二距离所对应的初始聚类对象的类别信息，确定为所述目标用户的目标类别信息。

进一步地，基于所述多个学习资源的属性信息，在所述多个学习资源中确定目标学习资源，包括：将所述多个学习资源中览频次信息最高的第一学习资源和所述多个学习资源中评价信息最高的第二学习资源，确定为所述目标学习资源。

第二方面，本发明实施例还提供一种具有处理器可执行的非易失的程序代码的装置，所述程序代码使所述处理器执行上述第一方面所述方法。

在本发明实施例中，首先，获取历史操作对象在学习平台的操作行为数据；利用操作行为数据对多个历史操作对象进行聚类分析，得到多个历史操作对象的多个类别信息；然后，在获取到目标用户的课程定制请求之后，在多个类别信息中确定目标用户的所属的目标类别信息；确定目标类别信息中的目标操作对象的多个学习资源，目标操作对象为目标类别信息中操作时间满足预设要求的历史操作对象；最后，基于多个学习资源的属性信息，在多个学习资源中确定目标学习资源；将目标学习资源作为目标用户的定制化课程发送给目标用户。本发明提供的方法通过对大数据的分析，可以使学习平台推荐给用户的课程资源能够更加准确的符合用户的需求，缓解现有的学习平台推荐的课程资源不能很好地符合用户的需求的技术问题。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于大数据条件下的个性化课程定制方法的流程图；

图2为本发明实施例提供的一种获取历史操作对象在学习平台的操作行为数据的方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

根据本发明实施例，提供了一种基于大数据条件下的个性化课程定制方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种基于大数据条件下的个性化课程定制方法的流程图，如图1所示，该方法应用于学习平台，具体包括如下步骤：

步骤s102，获取历史操作对象在学习平台的操作行为数据，其中，历史操作对象的数量为多个。

可选地，操作行为包括以下至少之一：登录在线学习平台、学习课程视频、记录电子笔记、进行在线测试、发起资源共享、进行作业管理、进行论坛交流以及离开在线学习平台等。

步骤s104，利用操作行为数据对多个历史操作对象进行聚类分析，得到多个历史操作对象的多个类别信息。

可选地，在本发明实施例中，采用k-means聚类分析方法对多个历史操作对象进行聚类分析，得到多个历史操作对象的类别信息。其中，类别信息的个数可以根据实际需要而任意设定。

步骤s106，在获取到目标用户的课程定制请求之后，在多个类别信息中确定目标用户的所属的目标类别信息。

步骤s108，确定目标类别信息中的目标操作对象的多个学习资源，目标操作对象为目标类别信息中操作时间满足预设要求的历史操作对象。

例如，将目标类别信息中操作时间大于等于预设时间长度的操作对象确定为目标操作对象。可选地，目标操作对象的个数可以为一个或者多个。优选地，在本发明实施例中，目标操作对象的个数为一个，具体地，目标操作对象为目标类别信息中操作时间最长的历史操作对象。

步骤s110，基于多个学习资源的属性信息，在多个学习资源中确定目标学习资源；属性信息包括：目标操作对象对学习资源的浏览频次信息和/或对学习资源的评价信息。

可选地，将多个学习资源中览频次信息最高的第一学习资源和多个学习资源中评价信息最高的第二学习资源，确定为目标学习资源。

步骤s112，将目标学习资源作为目标用户的定制化课程发送给目标用户。

在本发明实施例中，首先，获取历史操作对象在学习平台的操作行为数据；利用操作行为数据对多个历史操作对象进行聚类分析，得到多个历史操作对象的多个类别信息；然后，在获取到目标用户的课程定制请求之后，在多个类别信息中确定目标用户的所属的目标类别信息；确定目标类别信息中的目标操作对象的多个学习资源，目标操作对象为目标类别信息中操作时间满足预设要求的历史操作对象；最后，基于多个学习资源的属性信息，在多个学习资源中确定目标学习资源；将目标学习资源作为目标用户的定制化课程发送给目标用户。本发明提供的方法通过对大数据的分析，可以使学习平台推荐给用户的课程资源能够更加准确的符合用户的需求，缓解了用户在学习平台上面因选择自身需要的课程资源而浪费较多的时间的技术问题。

可选地，在本发明实施例中，获取历史操作对象在学习平台的操作行为数据的方法，包括：基于服务器端的数据采集方法和基于客户端的数据采集方法。

具体地，基于服务器端的数据采集方法通常利用服务器端采用以下两种格式进行数据收集：通用日志格式clf(commonlogformat)和扩展日志格式eclf(extendedcommonlogformat)。基于服务器端的数据采集方法可以保障在线行为发生的实时性，当学习者发生新的行为操作时，就会在相应的日志中增添一条新的记录。

基于客户端的数据采集方法，主要方法是利用javascript语言创建的cookie进行数据采集，但在数据采集之前需要获得用户的许可。其中，cookie是能将学习者对在线学习平台的操作行为信息存储在特定的位置，且当需要时可以从此特定的位置中读取这些数据的一种技术。cookie的命名格式:user@domain，其中user是本地用户名，domain是所访问的网站的域名。

优选地，获取历史操作对象在学习平台的操作行为数据的方法，还可以采用基于服务器端和客户端相结合的web日志采集方法，如图2所示，具体包括以下步骤：

步骤s201，数据采集，具体包括时间采集和行为数据采集过程。服务器把平台用户对课程的所有请求及操作过程都进行了记录，并以文本的形式保存在日志中。尽管不同的web服务器记录日志的格式不尽相同，但几乎都保存以下内容:学习者的域名、发出的用户名字、发出注册的时间、请求的方式，如:get,post或head、请求的目标文件名、请求的结果、返回的数据大小、url所引用的网页等。

具体地，如图2所示，时间采集过程包括：服务器端在历史操作对象(即图中的学习者)登录在线学习平台并进行学习者身份验证时，进行时间采集，获取历史操作对象的登录时间；服务器端在历史操作对象在离开在线学习平台时，再次进行时间采集，获取历史操作对象的登出时间。

如图2所示，行为数据采集过程包括：服务器端从web日志中获取关于历史操作对象的以下信息：课程视频信息、电子笔记信息、在线测试信息、资源共享信息、作业管理信息以及论坛交流信息。

步骤s202，数据预处理，主要包括对数据采集步骤获取的日志进行清理、过滤以及重组。web日志的预处理在web数据采集中是至关重要的，会直接影响后续分析的进行，预处理的结果将作为在线学习行为分析的数据基础。

可选地，在本发明实施例中，步骤s104具体包括如下步骤：

步骤s1041，对操作行为数据进行数据归一化处理，得到归一化数据。

数据归一化处理构建的基于rfl在线学习行为分类指标体系中各指标的取值存在差异情况，其中，rfl在线学习行为分类指标体系中，r为recency的首字母，在本发明实施例中代表历史操作对象的登录时间间隔；f为frequency的首字母，在本发明实施例中代表历史操作对象对学习平台中的课程资源浏览频次；l为length的首字母，在本发明实施例中代表历史操作对象在学习平台的学习时间长度。

在进行聚类分析之前应进行数据归一化处理。其中，由指标f的定义可知其与在线学习稳定程度正向相关，指标l也与在线学习稳定程度正向相关，而指标r与在线学习稳定程度负向相关。

可选地，本发明实施例采用max-min方法对各指标进行归一化处理，具体包括如下步骤：

步骤s10411，基于操作行为数据，确定各个历史操作对象的学习行为指标；学习行为指标包括以下至少之一：历史操作对象的登陆时间间隔指标，课程资源浏览频次指标，学习时间长度指标；

步骤s10412，利用线性归一化方法对学习行为指标进行归一化处理，得到各个历史操作对象的归一化数据。

其中max-min归一化又叫做线性归一化，线性归一化的公式为：

xnorm＝(x-xmin)/(xmax-xmin)。

其中，xnorm是归一化后的数值，xmax，xmin为归一化前数据的最大值和最小值。线性归一化方法把数据压缩到区间[0,1]之间，是原数据的等比缩放。如果最大值和最小值相等需要注意是没法归一化的。所有的值相等没有区别。

步骤s1042，基于归一化数据计算每个历史操作对象的行为特征的权重值，其中，行为特征包括：登陆时间间隔，课程资源浏览频次，学习时间长度。

优选地，在本发明实施例中，采用熵值法计算归一化数据中每个历史操作对象的行为特征的权重值。

熵值法是一种客观赋权方法。在具体使用过程中，熵值法根据各指标的变异程度，利用信息熵计算出各指标的熵值，再通过熵值对各指标的权重进行修正，从而得出较为客观的指标权重。在具体应用时，可根据各指标值的变异程度，利用熵来计算各指标的熵权，利用各指标的熵权对所有的指标进行加权，从而得出较为客观的评价结果。

熵值法的一般步骤为：

现有m个待评项目，n个评价指标，形成原始数据矩阵r＝(rij)m×n：

其中，rij为第j个指标下第i个项目的评价值。

求各指标值权重的过程为：

(1)计算第j个指标下第i个项目的指标值的比重pij：

(2)计算第j个指标的熵值ej：其中：k＝1/lnm。

(3)计算第j个指标值的权重值wj：

步骤s1043，基于行为特征的权重值对历史操作对象进行聚类分析，得到多个类别信息。具体地，包括如下步骤：

步骤s10431，在多个历史操作对象中选择多个初始聚类对象。

步骤s10432，基于行为特征的权重值，计算各个历史操作对象与多个初始聚类对象之间的距离，得到多个第一距离。

步骤s10433，基于多个第一距离和多个初始聚类对象，利用k-means聚类算法将多个历史操作对象划分成多个类别，得到多个类别信息。

其中，k-means聚类算法是一种基于质心的划分方法，输入聚类个数k，以及包含n个历史操作对象的数据库，输出满足方差最小标准的k个聚类。下面举例说明k-means聚类算法具体步骤如下，例如：

(1)从n个历史操作对象中任意选择k个对象作为初始聚类中心(即，上述初始聚类对象)。

(2)计算每个历史操作对象与这些初始聚类中心(或者新的中心对象)的距离；并根据最小距离对相应历史操作对象进行聚类划分，得到多个类别。

(3)计算每个类别的均值，得到新的中心对象。

(4)计算标准测度函数，当满足一定条件，如函数收敛时，则算法终止；如果条件不满足则回到步骤(2)。

可选地，在上述步骤s10432中，基于行为特征的权重值，计算各个历史操作对象与多个初始聚类对象之间的距离，得到多个第一距离，具体过程如下：

计算历史操作对象ai的归一化数据与初始聚类对象bj的归一化数据之间的差值，得到目标差值cij；其中，i依次取1至i，j依次取1至j，i为历史操作对象的数量，j为初始聚类对象的数量，目标差值cij包括以下至少之一：时间间隔指标差值，频次指标差值，学习时间长度指标差值；

计算目标差值cij关于历史操作对象ai的行为特征的权重值的加权平均值；

将加权平均值作为历史操作对象ai和初始聚类对象bj之间的第一距离。

可选地，步骤s106包括如下步骤：

步骤s1061，基于行为特征的权重值，分别计算目标用户与多个初始聚类对象之间的距离，得到多个第二距离。可选地，第二距离的计算过程可以参考上述第一距离的计算过程。

步骤s1062，基于多个第二距离，在多个类别信息中确定目标用户的目标类别信息。

优选地，将多个第二距离中最小第二距离所对应的初始聚类对象的类别信息，确定为目标用户的目标类别信息。

通过以上描述可知，本发明提供的方法通过对大数据的分析，提出了基于在线学习行为的个性化课程推荐方法，首先依据聚类结果划分出多个类别信息；其次，在目标用户所在的类别中找出确定目标类别信息，把最相近的用户浏览次数或评价最高的课程资源推荐给目标用户。通过分析在线学习行为进行个性化课程推荐，能够提高学习平台中的学习资源被访问的机会；延长用户滞留时间，提高用户对平台的粘性；增加资源访问或课程的选择机会；帮助用户发现感兴趣的资源或课程，从而提高用户学习的积极性。本发明实施例提供的方法还可以使学习平台推荐给用户的课程资源能够更加准确的符合用户的需求，缓解了用户在学习平台上面因选择自身需要的课程资源而浪费较多的时间的技术问题。

本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质，程序代码使处理器执行本实施例提供的上述方法。

在这里示出和描述的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制，因此，示例性实施例的其他示例可以具有不同的值。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李顺波;赵祚;房经纬
技术所有人：京工博创（北京）科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。