一种基于大数据的高考志愿填报方法与流程

文档序号:12272496阅读:1042来源:国知局

本发明涉及高考报考领域,特别涉及一种基于大数据的高考志愿填报方法。



背景技术:

中国教育在线提供了比较全面的高校搜索、专业搜索、生源地高考分批分数线、大学录取线、高校各省录取人数查询和专业录取线等搜索功能。百度教育提供了根据考生生源地、考生类型(文理科)、录取批次、估分以及报考分析(保底、稳妥、冒险)等条件,搜索出比较适合考生报考的学校,所展示的信息有学校、所在地、录取年份、最高分、平均分、省控分和录取概率等信息。

目前,中国教育在线只提供搜索服务,也就是简单的查询,没有进行数据分析,其不能进行智能推荐。百度教育在提供搜索服务的基础上,采用大数据分析技术,提供录取风险和概率等信息。但百度教育根据历史数据做分析,没有今年模拟数据做参考,缺乏智能推荐的修正数据。这样通常会造成考生报考的盲目性,影响报考的成功率。



技术实现要素:

本发明要解决的技术问题在于,针对现有技术的上述不能智能推荐、报考盲目性较大、影响报考的成功率的缺陷,提供一种能智能推荐、避免报考的盲目性、提高报考的成功率的基于大数据的高考志愿填报方法。

本发明解决其技术问题所采用的技术方案是:一种基于大数据的高考志愿填报方法,所述方法包括:

A、高考信息采集:高考信息采集功能可以实现全国范围内网站的信息采集,全面覆盖各个高校网站、志愿录取网站、历年高校统计等网站。采集的数据来源包括网站、论坛、博客、微博等诸多类型的媒体。信息采集的要素包括:标题、作者、信息正文、来源(当前网站)、发布时间、链接等多种要素。在采集站点配置方面,可以根据不同的站点灵活设定采集策略,允许用户配置站点起始URL、URL过滤规则、抓取深度、抓取网页数量、扫描间隔、所属频道等采集主要网站、论坛、博客、采集的开始时间、频率、采集优先级等,对于网站中需要重点监控的频道可以设成更新站点并设置较高采集频率,每个网站的采集方案可进行保存、查看和修改。同时可对网页进行增量更新,保证重复的网页不再下载。

B、高考信息检索:检索本地搜索引擎采集到信息,还能实时调用云平台搜索引擎的检索结果,把检索结果和本地搜索引擎采集到信息进行整合,自动去除重复链接,使用户查询到在大量高考网站中出现的信息;用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数。

提供了分布式检索和负载均衡集群服务器,实现分布式检索和负载均衡功能,满足大数据量和高并发的检索要求。用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数、规章制度等信息内容。同时可以按照信息的来源、时间段等要素进行组合,确保用户搜索到真正需要的内容。

C、热门专业分析:通过遍布全国的蜘蛛采集集群服务器,实时采集与高考相关的各种信息数据,并且基于统计的文本信息处理方法实现能对信息的热点信息的自动聚类,并结合往年高考热门专业的情况,通过比对分析对未来热门专业的预期判断;

D、历年录取情况分析:通过对目标院校历年的录取情况进行分析,并以形式丰富多样的各种统计图表进行展示,使用户能够全面掌握录取情况,为填报志愿提供辅助;

E、考生录取情况预测:在获取了考生高考信息后,针对考生选择的院校、专业,将考生情况与录取情况分析结果进行比对,对考生可能被目标院校专业录取的情况进行预测,为填报志愿提供辅助;

F、考生信息上传:用户使用考生信息上传功能,将考生的高考信息上传至服务器,在后续分析及预测时,能够自动获取考生的各种信息。还支持手动添加信息内容,也支持用户从本地或网上上传文件作为发送信息的附件。

本发明的高考志愿填报方法对高考信息进行深入挖掘,通过互联网对高考信息挖掘和信息库的整合,过滤和屏蔽垃圾信息,提取高考全国范围内近几年高校志愿录取率、录取分数,结合今年参考高考的人数、今年规章制度等情况进行统计分析,分析出各个高校今年志愿录取趋势、志愿录取范围、起伏程度以及各个高校志愿录取线,为高考学子提供志愿辅助。

附图说明

图1是本发明的高考志愿填报方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

一种基于大数据的高考志愿填报方法,如图1所示所述方法包括如下步骤:

A、高考信息采集:高考信息采集功能可以实现全国范围内网站的信息采集,全面覆盖各个高校网站、志愿录取网站、历年高校统计等网站。采集的数据来源包括网站、论坛、博客、微博等诸多类型的媒体。信息采集的要素包括:标题、作者、信息正文、来源(当前网站)、发布时间、链接等多种要素。在采集站点配置方面,可以根据不同的站点灵活设定采集策略,允许用户配置站点起始URL、URL过滤规则、抓取深度、抓取网页数量、扫描间隔、所属频道等采集主要网站、论坛、博客、采集的开始时间、频率、采集优先级等,对于网站中需要重点监控的频道可以设成更新站点并设置较高采集频率,每个网站的采集方案可进行保存、查看和修改。同时可对网页进行增量更新,保证重复的网页不再下载。

B、高考信息检索:检索本地搜索引擎采集到信息,还能实时调用云平台搜索引擎的检索结果,把检索结果和本地搜索引擎采集到信息进行整合,自动去除重复链接,使用户查询到在大量高考网站中出现的信息;用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数。

提供了分布式检索和负载均衡集群服务器,实现分布式检索和负载均衡功能,满足大数据量和高并发的检索要求。用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数、规章制度等信息内容。同时可以按照信息的来源、时间段等要素进行组合,确保用户搜索到真正需要的内容。

C、热门专业分析:通过遍布全国的蜘蛛采集集群服务器,实时采集与高考相关的各种信息数据,并且基于统计的文本信息处理方法实现能对信息的热点信息的自动聚类,并结合往年高考热门专业的情况,通过比对分析对未来热门专业的预期判断;

D、历年录取情况分析:通过对目标院校历年的录取情况进行分析,并以形式丰富多样的各种统计图表进行展示,使用户能够全面掌握录取情况,为填报志愿提供辅助;

E、考生录取情况预测:在获取了考生高考信息后,针对考生选择的院校、专业,将考生情况与录取情况分析结果进行比对,对考生可能被目标院校专业录取的情况进行预测,为填报志愿提供辅助;

F、考生信息上传:用户使用考生信息上传功能,将考生的高考信息上传至服务器,在后续分析及预测时,能够自动获取考生的各种信息。还支持手动添加信息内容,也支持用户从本地或网上上传文件作为发送信息的附件。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1