在线教育大数据技术平台的制作方法

文档序号:17118005发布日期:2019-03-15 23:31阅读:902来源:国知局
在线教育大数据技术平台的制作方法

本发明涉及在线教育大数据技术领域,特别是涉及一种在线教育大数据技术平台。



背景技术:

目前,我国教育资源分布不均匀,市场需求复杂多样,发展在线教育大数据技术研发对提升我国教育信息化水平,培育教育信息消费等新的经济增长点都有积极的促进作用。

据《2013年中国在线教育报告》显示,近几年国内在线教育迅猛发展,其中2004-2012年的市场规模复合增长率达到22.5%,预计2017年将达到2860亿元。国泰君安证券测算,到2017年市场规模有望达到目前的三倍。一方面,我国教育行业支出与gdp比值不到美国的一半,为印度的3/4,未来教育支出有巨大的提升空间;另一方面,我国互联网渗透率由2008年的23%提升至2013年的45%,随着互联网的快速兴起,教育从线下逐渐转移到线上是发展趋势。

随着在线教育的迅猛发展,“数据驱动学校,分析变革教育”的大数据时代已经来临,但是在线教育团队目前大多采用单纯的考察指标粗犷式推广方式,这种方式已经远远不能满足在线教育运营的需求,而为在线教育运营提供更为灵活的使用各种观测维度,更为全面地考察用户行为,更为精准的广告投放和营销活动推送,成为大势所趋。

在此背景下,迫切需要研发一种在线教育大数据技术平台,



技术实现要素:

本发明提供了一种在线教育大数据技术平台,该平台能够通过学习全生命轨迹分析,更准确直观的把握重点学生的行为习惯,更精准的制定在线教育运营策略;能够根据学生特征,快速提取运营目标用户群,运营团队针对不同的细分用户,投放广告和举办营销活动,提升运营效率。

本发明解决所述问题的技术方案为:

一种在线教育大数据技术平台,包括大数据核心平台和在线教育大数据应用平台;

所述大数据核心平台,用于提供大数据基础能力;

所述在大数据核心平台的支撑下,在具体应用的数据运营中,利用大数据关联分析、预测性分析等技术深入分析和挖掘数据隐含数据信息,实现基于大数据的精细化在线教育应用运营管理。

进一步地,所述大数据核心平台包括云计算平台、大数据etl、大数据基础内核、大数据分析挖掘和大数据运营服务五个子系统;

所述云计算平台子系统,将物理资源虚拟化为虚拟机资源池,灵活调用软硬件资源,实现对用户的按需访问,并在运行过程中能够根据用户并发量不同,实时迁移虚拟机资源。

所述大数据etl子系统,在大数据平台的基础上,对教育信息系统的相关数据进行抽取、清洗转换和加载,并通过调度引擎进行任务调度与监控,从而提供数据整合的解决方案。

所述大数据基础内核子系统,利用大数据基础能力中所使用的storm流计算、mapreduce批量计算等,实现大数据的存储、计算和分析。

所述大数据分析挖掘子系统,利用数据探索、挖掘建模和模型评估,对大数据基础内核子系统存储和处理的结构和非结构化数据进行分析和挖掘。

所述大数据运营服务子系统,结合在线教育业务需求,实现统计分析、用户标签和运营管理,满足在线教育产品策划人员和运营人员的用户分类、用户流失预测和产品优化与设计的业务运营需求。

进一步地,所述在线教育大数据应用平台包括成长超市、作业通和天天向上三个子系统;

所述成长超市子系统,汇聚大量本地知名教育机构和全国优质教育资源,是按照孩子成长阶段需求及个性化学习需求规律打造的一款精品教育资源应用,包括德、智、体、美、劳和娱乐六大内容模块;

所述作业通子系统,是一款针对学生的拍照答题app,拥有全网最大的题库和最高的识别准确率,帮助孩子按时完成作业,同时养成良好的学习习惯;

所述天天向上子系统,是基于云技术及移动互联网技术自主开发的网络学习空间在线教育云平台,通过云平台支撑的教育云空间可以快速搭建学校空间、班级空间、教师空间、学生空间、家长空间、教研机构空间,为各级教育主管部门及学校、机构轻松建设实名制网络学习空间人人通。

有益效果:

本发明通过学习生命轨迹分析,帮助在线教育运营精准地掌握每一个用户付费风格,学习进度,学习难点等,更准确直观的把握重点学生的行为习惯,从而更精准的制定在线教育运营策略;平台为日常核心运营数据提供实时的数据统计分析功能,快速反应运营问题,为在线教育运营提供更多的参考和优化建议,使之具备快速的反应能力;同时平台能够根据学生特征,快速提取运营目标用户群,运营团队针对不同的细分用户,投放广告和举办营销活动,让运营团队真正做到了为用户所想,满足用户对产品的各项需求,提高整体运营能力。

本发明将深刻改变教育理念和教育思维方式,利用大数据关联分析、预测性分析等技术可以深入分析和挖掘数据背后所隐含的许多充满想象力的数据信息,帮助在线教育创业团队和企业在有限的人力、有限的资源、有限的现金流的现实条件下,提高盈利能力和创新力,提升运营效率。

附图说明

图1为本发明图系统总体架构图。

具体实施方式

下面将结合本发明实施例中的附图及具体实施例进一步说明本发明的技术方案。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。

本发明提供了一种在线教育大数据技术平台,包括大数据核心平台和在线教育大数据应用平台;大数据核心平台包括云计算平台、大数据etl、大数据基础内核、大数据分析挖掘和大数据运营服务五个子系统。在线教育大数据应用平台包括成长超市、作业通和天天向上三个子系统。

整个系统在架构上主要分为大数据核心平台和在线教育大数据应用平台两大部分,系统体系架构如图1所示。

大数据核心平台是提供大数据基础能力的基础平台。由大数据核心平台包括云计算平台、大数据etl、大数据基础内核、大数据分析挖掘和大数据运营服务五个子系统构成。

云计算平台子系统,其特征是将物理资源虚拟化为虚拟机资源池,灵活调用软硬件资源,实现对用户的按需访问,而且在运行过程中根据用户并发量不同,实时迁移虚拟机资源。提供底层硬件资源的管理、虚拟化功能。主要包括:主机管理、虚拟机管理(重点强调虚拟机的生命周期管理,包括有创建、启动、重启、暂停、关闭、删除)、镜像管理、模板管理、dhcp分配等。

大数据etl平台子系统是在大数据平台的基础上,对教育评价系统的各数据源的相关数据进行抽取、清洗转换和加载,并通过调度引擎进行任务调度与监控,从而提供数据整合的解决方案。大数据etl平台主要由数据抽取、数据清洗转换、数据加载三部分组成。数据抽取是采用分布式抽取、数据同步功能将结构化数据和非结构化数据抽取到大数据云etl的过程。在抽取的过程中需要选择不同的抽取方法,这样可以尽可能的提高etl的运行效率。数据抽取包括分布式抽取和数据同步步骤;数据清洗转换是通过规则引擎的设置,对源数据库中出现二义性、重复、不完整、违反业务或逻辑规则等问题的数据进行统一的处理,一般包括如:null值处理,日期格式转换,数据类型转换等等。转换主要包括不一致的数据转换、数据粒度的转换,以及一些业务规则的计算。数据加载是把清洗转换后的数据,按照预先定义好的数据仓库模型,加载至数据仓库。主要通过接口数据文件入库功能来实现。

大数据基础内核子系统是利用大数据基础能力中所使用mapreduce批量计算、hdfs分布式文件存储、hbase半结构化数据存储等,实现教育评价大数据的存储、计算和分析。mapreduce批量计算负责解决并行计算问题,mapreduce是一种简化并行计算的编程模型,是一个处理和生成超大数据集的算法模型的相关实现。hdfs是一个高度容错的分布式文件系统,设计用于在低成本硬件上运行,它提供高吞吐量应用程序数据访问功能,尤其适合带有超大型数据集的应用程序,hdfs为大数据内核提供了高性能的分布式文件存储服务。hbase半结构化数据存储提供了一种处理半结构化数据的方案,它是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用该技术可在廉价pcserver上搭建起大规模结构化存储集群。

大数据分析挖掘子系统是利用数据探索、挖掘建模和模型评估,对大数据基础内核平台存储和处理的结构和非结构化数据进行分析和挖掘,从而支持用户的业务和管理活动,大数据分析挖掘子系统由数据探索、挖掘建模和模型评估三部分构成;数据探索通过对数据进行初步研究,从而更好的理解数据的特殊性质,这样有助于选择合适的数据预处理和数据分析技术。数据探索提供数据的基本统计描述包括中心趋势度量、度量数据散布两种;挖掘建模是使用数据挖掘算法创建预测模型,同时解释模型和业务目标的特点,通过实施将数据挖掘结果作用于业务过程。在线教育大数据挖掘建模的常用算法,有k-means聚类分析、cart决策树、apriori相关分析、mahout随机森林等;模型评估提供模型评估的常用技术,如保持方法和随机二次抽样、交叉验证和自助方法以及评估图表来进行模型的评估。大数据分析挖掘的模型评估最常用的方法为交叉验证和评估图表。

大数据运营服务子系统是结合在线教育业务需求,实现统计分析、用户标签和运营管理,满足在线教育产品策划人员和运营人员的用户分类、用户流失预测和产品优化与设计的业务运营需求。建设用户标签体系,通过用户行为特征进行分析、归纳、推理和挖掘,提炼出客户的轮廓。从用户基本属性出发进行分群,强调用户真实需求与特征,打造全面的用户标签体系,特征标签覆盖基本属性、学习特征、消费行为、3个方面,全面支撑在线教育产品大数据运营需求。采用定量化和定性化方法相结合的方法追踪分析用户行为,清晰、全方位把握用户特征。目标用户群提取是基于用户标签体系和运营目标,快速、精确地提取出符合要求的目标用户群。

在线教育大数据应用平台由成长超市、作业通和天天向上三个子系统构成。其中成长超市子系统按照孩子成长阶段需求及个性化学习需求规律,以德、智、体、美、劳和娱乐六大内容模块打造的一款精品教育资源应用,主要服务于中小学生、家长、教师和教育商家。成长超市汇聚大量本地知名教育机构和全国优质教育资源(名校资源为主),为家长和孩子提供一站式教育解决方案。同时还融入家校互动(校讯通)等功能,满足家校、家长间的互动交流。作业通针对学生的拍照答题app,拥有全网最大的题库和最高的识别准确率,帮助孩子按时完成作业,同时养成良好的学习习惯。使用作业通学生拍照题目就自动能获得答题,作业通拥有全球领先的图像识别技术,是目前准确率最高的答题软件,作业题题库目前支持数学、物理、化学、生物、地理、英语,作文等科目,数千名名师每日更新,是提高成绩的利器。天天向上子系统是立足k12的教育互联网平台,主要使用对象是教育主管部门、学校、老师、学生、家长,支持文字、图片、视频、文档等多种格式,可以通过pc电脑、手机客户端、平板电脑等多种方式上网使用,极大地降低了信息化应用门槛,使得网络学习空间建设与应用快速普及,促进教与学、教与教、学与学的全面互动。通过天天向上云空间的应用,为学校、老师、学生、家长构筑了一个以学生成长记录为核心,以校园、班级文化建设为纽带,以教、学资源共建共享为驱动的管理、学习、交流、分享网络。

本说明书中未作详细描述的内容所与本领域专业技术人员公知的现有技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1