高校录取分数线预测方法、设备及计算机可读存储介质与流程

文档序号:16507540发布日期:2019-01-05 09:07阅读:319来源:国知局
高校录取分数线预测方法、设备及计算机可读存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种高校录取分数线预测方法、设备及计算机可读存储介质。



背景技术:

目前,高校录取分数线的预测并没有通用的算法,常见的算法有线差法、线性回归、灰色预测等。

“线差法”是将录取区间均等分为8等份,自下而上第三等份相应的点位所对应的分数为黄金点位。如某高校最高录取分数tmax=680分,最低录取分数tmin=600分,则录取区间=80分,黄金点位对应的分数为t=630分。因3/8分所在的点位是一个黄金点位,其“投入产出比”最高的。一般而言,若分数在600至630分之间,录取概率会大大降低;若分数高于630,录取概率会提升,但是可能要浪费一些分数。

线性回归是一种传统的机器学习算法,就是通过直线的方式拟合高校历年录取最低分,从而得到最新年份的录取最低分。在实际应用中,线性回归同时也考虑了线差法,通过减去控制线的方式来统一高效的历年录取分数线。这种方式简单,但是考虑因素单一。线性回归法只是从数值上定量分析了数据的走势,然后缺乏对相关因素的影响,因此计算误差较大。

高校录取分数线可收集的相关历史数据不多,且这些数据分布没有明显的规律。根据这些数据部分清楚、部分不清楚且带有不确定性的特征,可以引用灰色预测模型来进行分数线的预测。该预测过程是,先预测高校每个专业录取最低分、平均分;然后将所有专业的最低分作为高校的最低分,记作m。对于录取概率评估模型,当分数为m时,录取概率为50%;当分数等于高校平均分时,录取概率为100%。这种算法考虑了数据的不确定性,但该算法将每个高校的录取分数线进行独立预测,没有考虑到高校在录取过程中的相互影响问题。例如,a高校在500分招录100个考生,b高校在500分招录200个考生,假设500分的考生总数300,如果今年a高校提高招录人数,由原来的100提高到150,那么b高校的招录就将直接受到影响。另外,专业的招录数据并不是每年都及时公开,即使公开,每个省份的专业招录数据格式存在不统一的情况,因此,专业数据的收集也是该算法另一个瓶颈所在。

线差法和线性回归法都较为简单,但考虑因素单一,因此误差较大。灰度预测算法考虑到了志愿填报过程中的随机性和不确定性,通过现有确定的数据预测高校录取分数线,但其预测针对单个高校,缺乏招录过程中高校录取的相互影响,再者,专业录取信息并不是每个高校都会及时公开,该部分数据收集困难,也会给该算法的灵活性和快速响应造成困难。



技术实现要素:

本发明的主要目的在于提供一种高校录取分数线预测方法、设备及计算机可读存储介质,旨在解决现有高校录取分数线预测算法灵活性差和误差大的技术问题。

为实现上述目的,本发明提供一种高校录取分数线预测方法,所述高校录取分数线预测方法包括步骤:

当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;

根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。

优选地,所述根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表的步骤包括:

将所述历史高考成绩表中的历史高考分数转换成标准高考分数;

通过所述标准高考分数将所述高校历史录取数据中的历史录取分数转换成标准录取分数,其中,所述高校历史录取数据为预设年份的录取数据,所述历史高考成绩表为预设年份的高考成绩表;

根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表;

通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表。

优选地,所述根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表的步骤包括:

在各高校的所述标准录取分数中获取各高校的标准录取平均分、标准录取最低分和标准录取最高分;

将所述标准录取平均分对应减去所述标准录取最低分,得到第一特征值;

将所述标准录取最高分减去所述标准录取最低分,得到第二特征值;

将所述第一特征值与预设伽玛分布特征表中形状参数进行对比,将所述第二特征值与所述预设伽玛分布特征表中尺寸参数进行对比,以在所述预设伽玛分布特征表中查找到所述高校的拟合结果;

根据所述拟合结果计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表。

优选地,所述通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表的步骤包括:

通过所述标准录取分数表计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数总和;

通过所述考生人数总和,以及各高校在所述标准录取分数下所录取的考生人数计算每一所述标准录取分数对应考生被各高校录取的比例,以得到所述考生去向表。

优选地,所述将所述历史高考成绩表中的历史高考分数转换成标准高考分数的步骤包括:

计算所述历史高考成绩表中历年高考分数的均值和标准差,得到概率密度函数;

将所述概率密度函数和预设概率密度函数进行对比,以确定所述历年高考分数和所述标准高考分数之间的映射关系;

根据所述映射关系将所述历史高考分数转换成标准高考分数。

优选地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线的步骤包括:

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档;

获取所述模拟投档的投档结果,在所述投档结果中提取各高校的录取分数;

在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线。

优选地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤之前,还包括:

设置模拟投档的预设投档次数;

所述将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤包括:

将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行所述预设投档次数的模拟投档;

所述在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线的步骤包括:

在所述录取分数中提取各高校在所述预设投档次数中的投档最低分,并计算所述预设投档次数中投档最低分的平均值;

将所述平均值对应作为各高校的录取分数线。

优选地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线的步骤之后,还包括:

根据所述预设投档次数的投档最低分建立各高校的录取概率表。

优选地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤包括:

遍历一分一段的所述当年高考成绩表,确定所述当年高考成绩表中各个分数对应的考生人数;

对所述当年高考成绩表中同一分数对应的考生进行预设次数模拟投档,并按照预设随机数生成策略生成一个随机数;

通过所述考生去向表、所述随机数和当前进行模拟投档的分数确定目标高校;

增加所述目标高校的录取人数,得到所述目标高校的当前录取人数;

根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作。

优选地,所述根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作的步骤包括:

通过所述目标高校的高校录取计划表确定所述目标高校的预测录取人数;

若所述当前录取人数大于或者等于所述预测录取人数,则确认所述目标高校已完成模拟投档工作,并在所述考生去向表中删除所述目标高校;

若所述当前录取人数小于所述预测录取人数,则确认所述目标高校未完成模拟投档工作。

此外,为实现上述目的,本发明还提供一种高校录取分数线预测设备,所述高校录取分数线预测设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的高校录取分数线预测程序,所述高校录取分数线预测程序被所述处理器执行时实现如下步骤:

当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;

根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有高校录取分数线预测程序,所述高校录取分数线预测程序被处理器执行时实现如下步骤:

当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;

根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线。

本发明通过当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线。本发明在预测各高校录取分数线过程中,考虑到了各高校的录取计划、往年的考生去向表、各高校录取情况等影响因素,能真实反映各高校的实际录取情况,降低了预测各高校录取分数线的误差,提高了高校录取分数线预测算法的灵活性,且相比于现有的线差法、线性回归、灰色预测等录取分数线预测方法,使最终预测所得的录取分数线具备更高的可信度。

附图说明

图1是本发明实施例方案涉及的设备的网络架构图;

图2为本发明高校录取分数线预测方法较佳实施例的流程示意图;

图3为本发明实施例中根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表的一种流程示意图;

图4为本发明实施例中将所述历史高考成绩表中的历史高考分数转换成标准高考分数的一种流程示意图;

图5a为本发明实施例中第一正态分布的示意图;

图5b为本发明实施例中第二正态分布的示意图;

图6为本发明实施例中根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表的一种流程示意图;

图7为本发明实施例中将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线的一种流程示意图;

图8为本发明实施例中将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的一种流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的解决方案主要是:当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。以解决现有高校录取分数线预测算法灵活性差和误差大的问题。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图。

本发明实施例高校录取分数线预测设备可以是pc,也可以是平板电脑、计算机等的终端设备。

如图1所示,该高校录取分数线预测设备可以包括:处理器1001,例如cpu,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,高校录取分数线预测设备还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块等等。

本领域技术人员可以理解,图1中示出的高校录取分数线预测设备结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统以及高校录取分数线预测程序。其中,操作系统是管理和控制客服机器人硬件和软件资源的程序,支持高校录取分数线预测程序以及其它软件和/或程序的运行。

在图1所示的高校录取分数线预测设备中,用户接口1003主要用于侦测获取指令等。而处理器1001可以用于调用存储器1005中存储的高校录取分数线预测程序,并执行以下步骤:在高校录取分数线预测设备中,处理器可以用于调用存储器中存储的高校录取分数线预测程序,并执行以下步骤:

当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;

根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。

进一步地,所述根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表的步骤包括:

将所述历史高考成绩表中的历史高考分数转换成标准高考分数;

通过所述标准高考分数将所述高校历史录取数据中的历史录取分数转换成标准录取分数,其中,所述高校历史录取数据为预设年份的录取数据,所述历史高考成绩表为预设年份的高考成绩表;

根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表;

通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表。

进一步地,所述根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表的步骤包括:

在各高校的所述标准录取分数中获取各高校的标准录取平均分、标准录取最低分和标准录取最高分;

将所述标准录取平均分对应减去所述标准录取最低分,得到第一特征值;

将所述标准录取最高分减去所述标准录取最低分,得到第二特征值;

将所述第一特征值与预设伽玛分布特征表中形状参数进行对比,将所述第二特征值与所述预设伽玛分布特征表中尺寸参数进行对比,以在所述预设伽玛分布特征表中查找到所述高校的拟合结果;

根据所述拟合结果计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表。

进一步地,所述通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表的步骤包括:

通过所述标准录取分数表计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数总和;

通过所述考生人数总和,以及各高校在所述标准录取分数下所录取的考生人数计算每一所述标准录取分数对应考生被各高校录取的比例,以得到所述考生去向表。

进一步地,所述将所述历史高考成绩表中的历史高考分数转换成标准高考分数的步骤包括:

计算所述历史高考成绩表中历年高考分数的均值和标准差,得到概率密度函数;

将所述概率密度函数和预设概率密度函数进行对比,以确定所述历年高考分数和所述标准高考分数之间的映射关系;

根据所述映射关系将所述历史高考分数转换成标准高考分数。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线的步骤包括:

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档;

获取所述模拟投档的投档结果,在所述投档结果中提取各高校的录取分数;

在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤之前,处理器1001还可以用于调用存储器1005中存储的高校录取分数线预测程序,执行以下步骤:

设置模拟投档的预设投档次数;

所述将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤包括:

将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行所述预设投档次数的模拟投档;

所述在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线的步骤包括:

在所述录取分数中提取各高校在所述预设投档次数中的投档最低分,并计算所述预设投档次数中投档最低分的平均值;

将所述平均值对应作为各高校的录取分数线。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线的步骤之后,处理器1001还可以用于调用存储器1005中存储的高校录取分数线预测程序,执行以下步骤:

根据所述预设投档次数的投档最低分建立各高校的录取概率表。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤包括:

遍历一分一段的所述当年高考成绩表,确定所述当年高考成绩表中各个分数对应的考生人数;

对所述当年高考成绩表中同一分数对应的考生进行预设次数模拟投档,并按照预设随机数生成策略生成一个随机数;

通过所述考生去向表、所述随机数和当前进行模拟投档的分数确定目标高校;

增加所述目标高校的录取人数,得到所述目标高校的当前录取人数;

根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作。

进一步地,所述根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作的步骤包括:

通过所述目标高校的高校录取计划表确定所述目标高校的预测录取人数;

若所述当前录取人数大于或者等于所述预测录取人数,则确认所述目标高校已完成模拟投档工作,并在所述考生去向表中删除所述目标高校;

若所述当前录取人数小于所述预测录取人数,则确认所述目标高校未完成模拟投档工作。

基于上述的结构,提出高校录取分数线预测方法的各个实施例。

参照图2,图2为本发明高校录取分数线预测方法较佳实施例的流程示意图。

在本实施例中,提供了高校录取分数线预测方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

所述高校录取分数线预测方法包括:

步骤s10,当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表。

当侦测到获取高考数据的获取指令时,根据所侦测的获取指令获取高校历史录取数据、高考成绩表和高校录取计划表。需要说明的是,为了兼顾预测结果的准确性和预测速度,所获取的高校录取数据为预设年份的录取数据。在本发明实施例中,预设年份可设置为3年,或者4年等。如当预设年份为4年时,即获取当年往前计算4年各高校历史录取数据,如当前年份为2017年,则需要获取各高校2016年、2015年、2014年和2013年的历史录取数据。在高校历史录取数据中,包括了该高校各年的录取人数、录取最高分、录取最低分、录取平均分和录取批次等。所获取的高考成绩表包括预设年份的历史高考成绩表和当年高考成绩表。在本发明实施例中,所使用的高考成绩表为一分一段式的,即一个高考分数作为一个区间,对应着录取人数。若所获取的高考成绩表为多分一段式,如两分一段式,或者是五分一段式,则采用线差法或者是整体分布差值法将多分一段式的高考成绩表转换成一分一段式的高考成绩表。高校录取计划表包括各高校当年的预测录取人数。若该高校在录取过程中区分市内考生和市外考生,则高校录取计划表还包括市内预测录取人数和市外预测录取人数;若该高校在录取过程中区分省内考生和省外考生,则高校录取计划表还包括省内预测录取人数和省外预测录取人数;若区分文理科,则高校录取计划表还可包括文科预测录取人数和理科预测录取人数。由此可知,高校录取计划表根据不同情况可包括不同的数据。

在根据获取指令获取高校历史录取数据、高考成绩表和高校录取计划表过程中,可通过爬虫工具在高考门户网站获取高校历史录取数据、高考成绩表和高校录取计划表。在本实施例中,高考门户网站包括但不限于阳光高考、招生办和各高校官网。爬虫工具包括但不限于八爪鱼采集器和造数云爬虫。

当获取到高校历史录取数据时,对所获取的高校历史录取数据按照预设检验规则进行检验。预设检验规则包括但不限于各高校的录取最高分应大于录取平均分、录取平均分应大于录取最低分、以及录取最低分应小于该高校所录取批次的省控线(当某个高校降分录取时,则会出现录取最低分小于该高校所录取批次的省控线)。需要说明的是,不同省份不同批次的省控线是不同的。若所获取的高校历史录取数据不符合预设检验规则,则重新从其它网站中获取该高校历史录取数据,如若之前不是从该高校的官网中获取的高校历史录取数据,则可重新在该高校的官网中获取高校历史录取数据;若录取最低分小于该高校所录取批次的省控线,则将该该高校的录取最低分修改为省控线。如广东某个高校属于第二批次,第二批次的省控线为520分,但所获取的该高校录取最低分为514分,则将该高校的录取最低分修改为520分,以使所获取的高校历史录取数据符合预设检验规则。

由于各高校历史录取数据公布的网点、时间和格式的不一致,因此,为了便于后续对各个高校录取分数线的预测。因此,在获取到各个高校历史录取数据后,将所获取的高校历史录取数据按照预设格式存储。在本实施例中,预设格式为将各高校历史录取数据按照“高校名称、录取年份、录取批次、录取最高分、录取最低分、录取平均分和录取人数”的格式存储。在其它实施例中,预设格式也可为其它格式,在此不再赘述。可以理解的是,一个高校在不同录取年份中,都对应着录取批次、录取最高分、录取最低分、录取平均分和录取人数。

步骤s20,根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表。

当获取到高校历史录取数据和高考成绩表时,根据高校历史录取数据和高考成绩表中的历史高考成绩表计算考生去向表。需要说明的是,历史高考成绩表和高校历史录取数据所对应的年份是相同的。在历史高考成绩表中,可以知道某一高考分数所对应的考生人数。在考生去向表中,可以知道相同分数的考生被各个高校录取的比例。

步骤s30,将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。

当得到考生去向表时,将高校录取计划表、考生去向表和高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。具体地,在将高校录取计划表、考生去向表和高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档过程中,可以获取各高校在录取过程中的录取最低分,通过模拟投档过程中所获取的录取最低分预测得到各高校的录取分数线。

本实施例通过当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线。本发明在预测各高校录取分数线过程中,考虑到了各高校的录取计划、往年的考生去向表、各高校录取情况等影响因素,能真实反映各高校的实际录取情况,降低了预测各高校录取分数线的误差,提高了高校录取分数线预测算法的灵活性,且相比于现有的线差法、线性回归、灰色预测等录取分数线预测方法,使最终预测所得的录取分数线具备更高的可信度。

进一步地,提出本发明高校录取分数线预测方法第二实施例。

所述高校录取分数线预测方法第二实施例与所述高校录取分数线预测方法较佳实施例的区别在于,参照图3,步骤s20包括:

步骤s21,将所述历史高考成绩表中的历史高考分数转换成标准高考分数。

由于每年高考难易程度不一样,所获取的历史高考成绩表中的历史高考分数也不一样。如当2014年高考相对于2013年高考比较容易时,2014年高考分数相对于2013年来说会比较高,因此在整合历年高考成绩表的高考分数过程中就会存在由于每年高考难易程度不一,导致无法将历年高考成绩表中的高考分数进行整合的问题。为了避免这个问题,在获取到历史高考成绩表时,将历史高考成绩中的历史高考分数转换成标准高考分数。

进一步地,参照图4,步骤s21包括:

步骤s211,计算所述历史高考成绩表中历年高考分数的均值和标准差,得到概率密度函数。

步骤s212,将所述概率密度函数和预设概率密度函数进行对比,以确定所述历年高考分数和所述标准高考分数之间的映射关系。

步骤s213,根据所述映射关系将所述历史高考分数转换成标准高考分数。

可以理解的是,当将任一年的高考分数描绘在一个图中时,高考分数的分布会出现两头小中间大的特征,符合正态分布的特征。因此,在本实施例中,通过正态分布将历史高考成绩表中的历史高考分数转换成标准高考分数,具体过程为:计算历史高考成绩表中历年高考分数的均值和标准差,得到与正态分布对应的概率密度函数,并将概率密度函数与预设概率密度函数进行对比,以确定历年高考分数和标准高考分数之间的映射关系,根据映射关系将历史高考分数转换成标准高考分数。如当用u1表示均值,用σ1表示标准差时,概率密度函数可表示为norg(μ1,σ1^2)。预设概率密度函数可表示为ns(μ2,σ2^2)

具体地,当概率密度函数对应的第一累积概率与预设概率密度函数中的第二累积概率相等时,由于第一累积概率对应的分数为历史高考分数,因此历史高考分数对应的标准高考分数即为第二累积概率对应的分数。需要说明的是,预设概率密度函数对应的位置参数和方差可根据具体情况而设置,如在本发明实施例中,可将预设概率密度函数中的均值设置为500,即μ2=500,标准差设置为100,即σ2=100。可以理解的是,均值为概率密度函数中的位置参数,标准差为概率密度函数中的尺度参数。

可参照图5a和图5b,图5a是均值为50,方差为10的正态分布,记为第一正态分布,第一正态分布对应的概率密度函数即为历史高考成绩表对应的概率密度函数。图5b是均值为60,方差为15的正态分布,记为第二正态分布,第二正态分布对应的概率密度函数为预设概率密度函数。需要说明的是,标准差的平方等于方差。在图5a中,历史高考分数x1对应的第一累积概率为s1;在图5b中,标准高考分数x2对应的第二累积概率为s2。若s1=s2,则历史高考分数x1就被映射到标准高考分数x2,即历史高考分数x1转换成标准高考分数后就是x2所对应的值。

步骤s22,通过所述标准高考分数将所述高校历史录取数据中的历史录取分数转换成标准录取分数,其中,所述高校历史录取数据为预设年份的录取数据,所述历史高考成绩表为预设年份的高考成绩表。

当将历史高考分数转换成标准高考分数后,将高校录取数据中的历史分数转换成标准录取分数。其中,高校历史录取数据为预设年份的录取数据,历史高考成绩表为预设年份的高考成绩表。如当将2015年的高考分数转换成高考标准分数后,得到2015年高考分数与高考标准分数之间的对照表,然后将2015年各高校录取数据中的历史录取分数都转换成标准录取分数。在对照表中,即可确定2015年高考分数和标准高考分数之间的映射关系。在该对照表中,2015年任一高考分数都对应着唯一的高考标准分数。具体地,如当由对照表可知,2015年的500分转换成高考标准分数为505分,505分转换成高考标准分数为510时,若2015年a高校的录取分数为504分至560分,则按照2015年高考分数与高考标准分数之间的对照表将a高校的录取分数转换成标准录取分数。

步骤s23,根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表。

当得到标准录取分数后,计算同一标准录取分数下,各个高校在预设年份中所录取的考生人数,以得到标准录取分数表。通过标准录取分数表可以统计预设年份中各高校在同一标准录取分数下所录取的考生人数,解决了由于每年高考难易程度不一,无法统计预设年份各高校在同一录取分数下所录取的考生人数的问题(若不转换成标准录取分数,由于每年高考难易程度不一,若直接将各高校的历史录取数据直接整合统计,将会导致最终预测的录取分数线存在较大误差)。

进一步地,参照图6,步骤s23包括:

步骤s231,在各高校的所述标准录取分数中获取各高校的标准录取平均分、标准录取最低分和标准录取最高分。

具体地,当得到各高校的标准录取分数后,通过各高校的标准录取分数计算对应计算各高校标准录取平均值,并在各高校的标准录取分数中对应获取标准录取最高分和标准录取最低分。可以理解的是,在各高校的标准录取分数中对应获取标准录取最高分和标准录取最低分过程中,可将各高校的标准录取分数按照从高到低,或者从低到高的顺序排序,以获取标准录取最高分和标准录取最低分。

步骤s232,将所述标准录取平均分对应减去所述标准录取最低分,得到第一特征值。

步骤s233,将所述标准录取最高分减去所述标准录取最低分,得到第二特征值。

在获取到标准录取平均分、标准录取最高分和标准录取最低分时,将标准录取平均分减去标准录取最低分所得的差值作为第一特征值,将标准录取最高分减去标准录取最低分所得的差值作为第二特征值。

步骤s234,将所述第一特征值与预设伽玛分布特征表中形状参数进行对比,将所述第二特征值与所述预设伽玛分布特征表中尺寸参数进行对比,以在所述预设伽玛分布特征表中查找到所述高校的拟合结果。

将第一特征值与预设伽玛分布特征表中的形状参数进行对比,将第二特征值与预设伽玛分布特征表中的尺寸参数进行对比,计算得到第一特征值与形状参数的第一差值,以及第二特征值与尺寸参数的第二差值,并计算第一差值和第二差值的和,确定第一差值和第二差值之和最小对应的形状参数和尺寸参数,记为目标形状参数和目标尺寸参数。在预设伽玛分布特征表查找出与目标形状参数和目标尺寸参数对应的最大值、平均值和最小值,记为目标最大值、目标平均值和目标最小值,该目标形状参数、目标尺寸参数、目标最大值、目标平均值和目标最小值即为高校的拟合结果。在本实施例中,除了采用差值法确定目标形状参数和目标尺寸参数,还可以采用权重法等方法确定目标形状参数和目标尺寸参数,具体过程在此不再赘述。

进一步地,用α表示形状参数,β表示尺寸参数。当存在至少两个目标形状参数和目标尺寸参数时,以形状参数α作为选择标准,选择与第一特征值差值较小的形状参数作为最终目标形状参数,与该最终目标形状参数对应的尺寸参数作为最终目标尺寸参数,该最终目标形状参数和最终目标尺寸参数为高校的拟合结果。如当第一差值为9,第二差值为10时,存在的目标形状参数有α1=9,α2=9.1;β1=9.9,β2=10,则α1作为最终目标形状参数,β1作为最终目标尺寸参数。

在本实施例中,预设伽玛分布特征表为标准伽玛分布表,即在预设伽玛分布特征表中,偏移量为零,且预设伽玛分布特征表对应的伽玛分布概率密度函数只与其形状参数和尺寸参数相关。由伽玛分布的特征可知,标准伽玛分布的最小值为0,平均值为α/β,当伽玛分布概率密度函数的值等于0.97或者0.99所对应的值作为标准伽玛分布的最大值。可以理解的是,最大值所对应的伽玛分布概率密度函数的值也可以为其它数值,在此不再赘述。

需要说明的是,在本实施例中,形状参数和尺寸参数的取值范围,以及形状参数和尺寸参数的变化步长可根据具体需要而设置。通过形状参数和尺寸参数的取值范围,以及形状参数和尺寸参数的变化步长可得到多个伽玛分布,且该多个伽玛分布是不连续的。在本实施例中,用集合g表示形状参数和尺寸参数取值范围内的所有伽玛分布,通过伽玛分布概率密度函数即可提取集合g中每个伽玛分布的最小值、平均值和最大值,以得到预设伽玛分布特征表。

如在本实施例中,将形状参数α的取值范围设置为(0,20),尺寸参数β的取值范围设置为(0,100),形状参数α和尺寸参数β的步长都设置为0.01。通过遍历取值范围内所有形状参数α和尺寸参数β,计算出每个伽玛分布的最小值,平均值和最大值,并存储每个伽玛分布的最小值,平均值和最大值。通过每个伽玛分布的最小值,平均值和最大值创建预设伽玛分布特征表,在预设伽玛分布特征表中,应包括每个伽玛分布概率密度函数的形状参数α、尺寸参数β、最小值、平均值、最大值。其中,最小值始终为0。

步骤s235,根据所述拟合结果计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表。

当确定拟合结果后,根据拟合结果计算同一标准录取分数下,各个高校在预设年份中所录取的考生人数,以得到标准录取分数表。具体地,通过目标形状参数和目标尺寸参数对应的目标伽玛分布概率密度函数计算出目标最大值和目标最小值范围内任一分数的概率,将计算所得的概率乘以该高校的录取人数,即可得到该高校在预设年份中所录取的考生人数,得到标准录取分数表。

如当a高校对应的目标最大值为600,目标最小值为560时,当通过目标伽玛分布概率密度函数计算得到2013年a高校在578分对应的概率为0.15,且a高校在2013年中录取的总人数为1000人,则a高校在这2013年中在578分录取的人数为1000*0.15=150人。

步骤s24,通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表。

当得到标准录取分数分数表时,通过标准录取分数表计算同一标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表。需要说明的是,在标准录取分数表中,可以知道各高校在每一预设年份,每个标准录取分数下所录取的考生人数。

进一步地,步骤s24包括:

步骤a,通过所述标准录取分数表计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数总和。

步骤b,通过所述考生人数总和,以及各高校在所述标准录取分数下所录取的考生人数计算每一所述标准录取分数对应考生被各高校录取的比例,以得到所述考生去向表。

通过标准录取分数表计算同一标准录取分数所对应的考生被各高校录取的比例的具体过程为:通过标准录取分数表计算同一标准录取分数下,每一预设年份中每个高校所录取的考生人数,将每一高校在每一预设年份所录取的考生人数相加,所得结果即为各个高校在同一标准录取分数,在预设年份中所录取的考生人数总和。当得到考生人数总和后,将各个高校在该标准录取分数下所录取的考生人数除以该标准录取分数下的考生人数总和,得到每一标准录取分数对应考生被各个高校录取的比例。通过该方法计算出从0到最高标准录取分数中每个标准录取分数考生被不同高校录取的比例,从而得到考生去向表。需要说明的是,在考生去向表中,可以知道任一标准录取分数对应考生被不同高校录取的比例。

如当标准录取分数表存在a、b和c三个高校时,通过标准录取分数表可知,对于标准录取分数568,a高校在2013年录取的考生人数为150,2014年录取的考生人数为130,2015年录取的考生人数为158,2016年录取的考生人数为172;b高校在2013年录取的考生人数为130,2014年录取的考生人数为100,2015年录取的考生人数为98,2016年录取的考生人数为132;c高校在2013年录取的考生人数为110,2014年录取的考生人数为116,2015年录取的考生人数为124,2016年录取的考生人数为100,则a、b和c三个高校在2013年、2014年、2015年和2016年这年所录取的考生人数总和sum=150+130+158+172+130+100+98+132+110+116+124+100=1520,则在568分的考生,被a高校录取的比例为(150+130+158+172)/1520=40.13%(保留两位小数点),被b高校录取的比例为(130+100+98+132)/1520=30.26%,被c高校录取的比例为(110+116+124+100)/1520=29.60%。

需要说明的是,在本发明实施例中,可先将历史高考成绩表中的历史高考分数转换成标准高考分数,然后再计算标准录取分数表,也可先计算标准录取分数表,然后再将历史高考成绩表中的历史高考分数转换成标准高考分数。

进一步地,提出本发明高校录取分数线预测方法第三实施例。

所述高校录取分数线预测方法第三实施例与所述高校录取分数线预测方法第一实施例的区别在于,参照图7,步骤s30包括:

步骤s31,将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档。

当得到高校录取计划表、考生去向表和高考成绩表时,获取高考成绩表中的当年高考成绩表,并将高校录取计划表、考生去向表和当年高考成绩表蒙特卡洛模拟中,进行模拟投档。需要说明的是,当年高考成绩表是一分一段表,且在将当前高考成绩表输入蒙特卡洛模拟之前,已将当前高考成绩表中的各个分数已转换成标准高考分数,具体转换过程与将历史高考成绩表中的历史高考分数转换成标准高考分数的过程一致,在此不再赘述。

可以理解的是,在模拟投档过程中,优先将当年高考成绩表中分数按照从高到低的顺序进行模拟投档。

进一步地,参照图8,步骤s31包括:

步骤s311,遍历一分一段的所述当年高考成绩表,确定所述当年高考成绩表中各个分数对应的考生人数。

步骤s312,对所述当年高考成绩表中同一分数对应的考生进行预设次数模拟投档,并按照预设随机数生成策略生成一个随机数。

通过蒙特卡洛模拟进行模拟投档的具体过程为:遍历一分一段的当年高考成绩表,确定当年高考成绩表中各个分数对应的考生人数,对当年高考成绩表中同一分数对应的考生进行预设次数模拟投档,并按照预设随机数生成策略生成一个随机数。可以理解的是,每一个考生只能被一所高校录取,每个考生只有一份档案,因此预设次数与该分数下对应的考生人数相等。如当526分对应的考生人数有100个,则预设次数等于100,即需要进行100次的模拟投档,每一次对该分数下的一个考生进行模拟投档。在本实施例中,将按照预设随机数生成策略生成的随机数记为r,随机数r的取值范围为0≤r≤1。预设随机数生成策略为均匀分布策略,在均匀分布策略在,所生成的随机数与考生去向表有关。若某一标准录取分数对应的考生进入a高校的比例较大,则在模拟投档过程中,该标准录取分数对应的考生进入a高校的比例依旧较大。可以理解的是,在模拟投档过程,可对不同的标准录取分数和高校设置不同的随机数生成策略来控制模拟投档过程中各高校录取比例。在其它实施例中,预设随机数生成策略可为其它常用的随机数生成策略,在此不再赘述。

步骤s313,通过所述考生去向表、所述随机数和当前进行模拟投档的分数确定目标高校。

当确定随机数后,在考生去向表中查找与当前进行模拟投档的分数相等的标准录取分数,记为目标标准录取分数。确定目标标准录取分数对应的录取高校,以及该目标标准录取分数对应考生被各个录取高校录取的比例,根据该比例确定各个录取高校在目标标准录取分数下的录取范围。若随机数在该录取高校的录取范围内,则将该录取高校记为目标高校;若随机数不在该录取高校的录取范围内,则表明该录取高校不是目标高校。需要说明的是,当前进行模拟投档的分数已转换成标准分数。

如若当前进行模拟投档的分数为600分,则在考生去向表中查找到600分对应录取高校,若查找到录取高校为b、d和h,且目标标准录取分数对应考生被b高校录取的比例为20%,被d高校录取的比例为56%,被h高校录取的比例为24%,则b高校的在600分的录取范围为大于或者等于0,小于或者等于0.20;d高校的在600分的录取范围为大于0.20,小于或者等于0.76;h高校的在600分的录取范围为大于0.76,小于或者等于1。若当前600分的某个考生对应的随机数为0.4,则该考生被d高校录取,即d高校为目标高校;若600分的某个考生对应的随机数为0.1,则该考生被b高校录取,即b高校为目标高校。

步骤s314,增加所述目标高校的录取人数,得到所述目标高校的当前录取人数。

步骤s315,根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作。

当确定目标高校后,增加目标高校的录取人数,具体地,将目标高校的录取人数增加一,得到目标高校的当前录取人数。当确定目标高校的当前录取人数后,获取目标高校的高校录取计划表,确定目标高校的预测录取人数,根据目标高校的当前录取人数和预测录取人数判断目标高校是否已完成模拟投档工作。

进一步地,步骤s315包括:

步骤b,通过所述目标高校的高校录取计划表确定所述目标高校的预测录取人数。

步骤c,若所述当前录取人数大于或者等于所述预测录取人数,则确认所述目标高校已完成模拟投档工作,并在所述考生去向表中删除所述目标高校。

步骤d,若所述当前录取人数小于所述预测录取人数,则确认所述目标高校未完成模拟投档工作。

获取目标高校的高校录取计划表,在高校录取计划表中获取目标高校的预测录取人数,判断目标高校的当前录取人数是否大于或者等于预测录取人数。当目标高校的当前录取人数大于或者等于预测录取人数时,确认该目标高校已完成模拟投档工作,并在考生去向表中删除与该目标高校对应的数据,实现了在后续的模拟投档过程中不会有考生再被该目标高校录取,以提高模拟投档速度。当目标高校的当前录取人数小于预测录取人数时,确认目标高校未完成模拟投档工作,在后续的模拟投档过程中继续对该目标高校进行模拟投档。

步骤s32,获取所述模拟投档的投档结果,在所述投档结果中提取各高校的录取分数。

步骤s33,在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线。

当对当前高考成绩表中的所有分数完成模拟投档后,得到模拟投档的投档结果,在投档结果中提取各高校的录取分数,将各高校的录取分数从高到低排序,或者从低到高排序,以确定各高校在模拟投档过程中的投档最低分,投档最高分,将该投档最低分作为各高校的录取分数线。进一步地,还可计算各个高校在模拟投档过程中的投档平均分。如当a高校的投档最低分为520分,b高校的投档最低分为546分时,则a高校的投档分数线为520分,b高校的投档分数线为546分。

进一步地,当某个高校有各个专业录取数据,也可通过高校录取分数线预测方法预测该高校各个专业的录取分数线。

进一步地,提出本发明高校录取分数线预测方法第四实施例。

所述高校录取分数线预测方法第四实施例与所述高校录取分数线预测方法第三实施例的区别在于,高校录取分数线预测方法还包括:

步骤e,设置模拟投档的预设投档次数。

步骤s31还可以包括:

步骤f,将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行所述预设投档次数的模拟投档。

为了提高模拟投档结果的准确性,设置模拟投档的预设投档次数。可以理解的是,所设置的预设投档次数越大,所预测的各高校的录取分数线越准确,但是所设置的预设投档次数越大,模拟投档所耗费的时间也就越长。因此可根据具体需要设置预设投档次数,如可以将预设投档次数设置为5次,或者10次等。

在设置模拟投档的预设投档次数后,将高校录取计划表、考生去向表和高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行预设投档次数的模拟投档。

步骤s33包括:

步骤g,在所述录取分数中提取各高校在所述预设投档次数中的投档最低分,并计算所述预设投档次数中投档最低分的平均值。

步骤h,将所述平均值对应作为各高校的录取分数线。

当每完成一次模拟投档后,每个高校都会存在一个投档结果,若将预设投档次数记为n,则在完成n次模拟投档后,每个高校都会存在n个投档结果。在这n个投档结果中,每个高校会存在n个投档最高分,n个投档平均分和n个投档最低分。在本实施例中,分别用cmax、cavg、cmin对应表示投档最高分集合,投档平均分集合和投档最低分集合。

获取各个高校的n个投档最低分,计算n个投档最低分的平均值,n个投档最低分的平均值即为对应各个高校的录取分数线。如当进行3次模拟投档后,a高校的3个投档最低分为511、526和518,则a高校的录取分数线为(510+526+518)/3=518。

进一步地,可将投档最高分集合和投档平均分集合与各预设年份中实际投档最高分和实际投档平均分进行对比,计算投档最高分集合和实际投档最高分之间的第一相似度,以及投档平均分集合和实际投档平均分之间的第二相似度。当第一相似度和第二相似度越大,表明通过模拟投档所得的录取分数线准确性越高。计算第一相似度和第二相似度的方法包括但不限于最小二乘法、差值法和方差法。

本实施例通过多次模拟投档,得到多个投档最低分,将这多个投档最低分的平均值作为高校的录取分数线,提高了所预测的高校录取分数线的准确性。

进一步地,高校录取分数线预测方法还包括:

步骤i,根据所述预设投档次数的投档最低分建立各高校的录取概率表。

为了确定投档最低分集合中录取分数线的误差分布情况,通过正态分布来拟合投档最低分的误差分布,以建立各高校的录取概率表,以便于考生更准确地判断其被某高校的录取概率。

具体地,将投档最低分集合cmin中的各个投档最低分作最低分正态分布,最低分正态分布对应误差分布概率密度函数中的位置参数u为投档最低分的平均值,通过最低分集合cmin中的每次模拟投档的投档最低分和投档最低分的平均值计算得到方差σ^2,得到最低分正态分布对应误差分布概率密度函数中的尺度参数为σ,通过该误差分布概率密度函数计算每个投档最低分的录取概率。如当经过5次模拟投档后,a高校的投档最低分集合为cmin={500,501,510,519,520},集合cmin中投档最低分的平均值=(500+501+510+519+520)/5=510,即误差分布概率密度函数中的位置参数u=510,集合cmin中的最高分为520,最低分为500。由正态分布的性质计算可得,3σ=10,则σ=3.33,σ^2=11.09。由此可知,a高校录取分数线的误差分布概率密度函数为n(510,11.09)。因此,从投档最低分的平均值510开始,通过误差分布概率密度函数计算大于,以及小于510分各分数的累积概率,通过该累积概率建立各高校的录取概率表。可以理解的是,累积概率即为投档最低分的录取概率。如当通过误差分布概率密度函数计算得到500分的录取概率为3%,510分的录取概率为50%,520分数的录取概率为99%时,选择录取概率从1%到99%的分值制作高校的录取概率表。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有高校录取分数线预测程序,所述高校录取分数线预测程序被处理器执行时实现如下步骤:

当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;

根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。

进一步地,所述根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表的步骤包括:

将所述历史高考成绩表中的历史高考分数转换成标准高考分数;

通过所述标准高考分数将所述高校历史录取数据中的历史录取分数转换成标准录取分数,其中,所述高校历史录取数据为预设年份的录取数据,所述历史高考成绩表为预设年份的高考成绩表;

根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表;

通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表。

进一步地,所述根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表的步骤包括:

在各高校的所述标准录取分数中获取各高校的标准录取平均分、标准录取最低分和标准录取最高分;

将所述标准录取平均分对应减去所述标准录取最低分,得到第一特征值;

将所述标准录取最高分减去所述标准录取最低分,得到第二特征值;

将所述第一特征值与预设伽玛分布特征表中形状参数进行对比,将所述第二特征值与所述预设伽玛分布特征表中尺寸参数进行对比,以在所述预设伽玛分布特征表中查找到所述高校的拟合结果;

根据所述拟合结果计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表。

进一步地,所述通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表的步骤包括:

通过所述标准录取分数表计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数总和;

通过所述考生人数总和,以及各高校在所述标准录取分数下所录取的考生人数计算每一所述标准录取分数对应考生被各高校录取的比例,以得到所述考生去向表。

进一步地,所述将所述历史高考成绩表中的历史高考分数转换成标准高考分数的步骤包括:

计算所述历史高考成绩表中历年高考分数的均值和标准差,得到概率密度函数;

将所述概率密度函数和预设概率密度函数进行对比,以确定所述历年高考分数和所述标准高考分数之间的映射关系;

根据所述映射关系将所述历史高考分数转换成标准高考分数。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线的步骤包括:

将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档;

获取所述模拟投档的投档结果,在所述投档结果中提取各高校的录取分数;

在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤之前,所述高校录取分数线预测程序被处理器执行时实现如下步骤:

设置模拟投档的预设投档次数;

所述将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤包括:

将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行所述预设投档次数的模拟投档;

所述在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线的步骤包括:

在所述录取分数中提取各高校在所述预设投档次数中的投档最低分,并计算所述预设投档次数中投档最低分的平均值;

将所述平均值对应作为各高校的录取分数线。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,以预测各高校的录取分数线的步骤之后,所述高校录取分数线预测程序被处理器执行时实现如下步骤:

根据所述预设投档次数的投档最低分建立各高校的录取概率表。

进一步地,所述将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档的步骤包括:

遍历一分一段的所述当年高考成绩表,确定所述当年高考成绩表中各个分数对应的考生人数;

对所述当年高考成绩表中同一分数对应的考生进行预设次数模拟投档,并按照预设随机数生成策略生成一个随机数;

通过所述考生去向表、所述随机数和当前进行模拟投档的分数确定目标高校;

增加所述目标高校的录取人数,得到所述目标高校的当前录取人数;

根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作。

进一步地,所述根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作的步骤包括:

通过所述目标高校的高校录取计划表确定所述目标高校的预测录取人数;

若所述当前录取人数大于或者等于所述预测录取人数,则确认所述目标高校已完成模拟投档工作,并在所述考生去向表中删除所述目标高校;

若所述当前录取人数小于所述预测录取人数,则确认所述目标高校未完成模拟投档工作。

本发明计算机可读存储介质具体实施方式与上述高校录取分数线预测方法各实施例基本相同,在此不再赘述。

此外,本发明实施例还提出一种高校录取分数线预测装置,该高校录取分数线预测装置内置于高校录取分数线预测设备中,或者与高校录取分数线预测设备连接,具体地,高校录取分数线预测装置包括:

获取模块,用于当侦测到获取高考数据的获取指令时,根据所述获取指令获取高校历史录取数据、高考成绩表和高校录取计划表;

计算模块,用于根据所述高校历史录取数据和所述高考成绩表中的历史高考成绩表计算得到考生去向表;

投档模块,用于将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中进行模拟投档,以预测各高校的录取分数线。

进一步地,所述计算模块包括:

转换单元,用于将所述历史高考成绩表中的历史高考分数转换成标准高考分数;通过所述标准高考分数将所述高校历史录取数据中的历史录取分数转换成标准录取分数,其中,所述高校历史录取数据为预设年份的录取数据,所述历史高考成绩表为预设年份的高考成绩表;

计算单元,用于根据所述标准录取分数,计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表;通过所述标准录取分数表计算同一所述标准录取分数所对应的考生被各高校录取的比例,以得到考生去向表。

进一步地,所述计算单元包括:

获取子单元,用于在各高校的所述标准录取分数中获取各高校的标准录取平均分、标准录取最低分和标准录取最高分;

第一计算子单元,用于将所述标准录取平均分对应减去所述标准录取最低分,得到第一特征值;将所述标准录取最高分减去所述标准录取最低分,得到第二特征值;

第一对比子单元,用于将所述第一特征值与预设伽玛分布特征表中形状参数进行对比,将所述第二特征值与所述预设伽玛分布特征表中尺寸参数进行对比,以在所述预设伽玛分布特征表中查找到所述高校的拟合结果;

所述第一计算子单元还用于根据所述拟合结果计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数,以得到标准录取分数表。

进一步地,所述计算单元还用于通过所述标准录取分数表计算同一所述标准录取分数下,各高校在所述预设年份中所录取的考生人数总和;通过所述考生人数总和,以及各高校在所述标准录取分数下所录取的考生人数计算每一所述标准录取分数对应考生被各高校录取的比例,以得到所述考生去向表。

进一步地,所述转换单元还包括:

第二计算子单元,用于计算所述历史高考成绩表中历年高考分数的均值和标准差,得到概率密度函数;

第二对比子单元,用于将所述概率密度函数和预设概率密度函数进行对比,以确定所述历年高考分数和所述标准高考分数之间的映射关系;

转换子单元,用于根据所述映射关系将所述历史高考分数转换成标准高考分数。

进一步地,所述投档模块包括:

投档单元,用于将所述高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行模拟投档;

提取单元,用于获取所述模拟投档的投档结果,在所述投档结果中提取各高校的录取分数;

确定单元,用于在所述录取分数中确定各高校的投档最低分,将所述投档最低分对应作为各高校的录取分数线。

进一步地,所述投档模块还包括:

设置单元,用于设置模拟投档的预设投档次数;

投档单元还用于将高校录取计划表、所述考生去向表和所述高考成绩表中的当年高考成绩表输入蒙特卡洛模拟中,进行所述预设投档次数的模拟投档;

所述确定单元还用于在所述录取分数中提取各高校在所述预设投档次数中的投档最低分,并计算所述预设投档次数中投档最低分的平均值;将所述平均值对应作为各高校的录取分数线。

进一步地,所述高校录取分数线预测装置还包括:

建立模块,用于根据所述预设投档次数的投档最低分建立各高校的录取概率表。

进一步地,所述投档单元包括:

确定子单元,用于遍历一分一段的所述当年高考成绩表,确定所述当年高考成绩表中各个分数对应的考生人数;

投档子单元,用于对所述当年高考成绩表中同一分数对应的考生进行预设次数模拟投档;

生成子单元,用于按照预设随机数生成策略生成一个随机数;

确定子单元,用于通过所述考生去向表、所述随机数和当前进行模拟投档的分数确定目标高校;

增加子单元,用于增加所述目标高校的录取人数,得到所述目标高校的当前录取人数;

判断子单元,用于根据所述当前录取人数和所述目标高校的高校录取计划表判断所述目标高校是否已完成模拟投档工作。

进一步地,所述判断子单元还用于通过所述目标高校的高校录取计划表确定所述目标高校的预测录取人数;若所述当前录取人数大于或者等于所述预测录取人数,则确认所述目标高校已完成模拟投档工作,并在所述考生去向表中删除所述目标高校;若所述当前录取人数小于所述预测录取人数,则确认所述目标高校未完成模拟投档工作。

本发明高校录取分数线预测装置具体实施方式与上述高校录取分数线预测方法各实施例基本相同,在此不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1