一种高精度的客运预测方法及客运预测系统与流程

文档序号:23092508发布日期:2020-11-27 12:47阅读:337来源:国知局
一种高精度的客运预测方法及客运预测系统与流程

本发明涉及交通预测智能管理技术领域,尤其涉及一种高精度的客运预测方法及客运预测系统。



背景技术:

客运量预测是铁路建设项目前期研究和设计工作的基础,合理、客观的客流预测数据将直接关系到铁路建设项目的经济成本、运营效率及建成运营后的经济效益。

然而,随着移动互联网时代的到来,12306网站、手机客户端售票渠道已经上线运行,产生了大量的交易、日志信息,事件处理模块需要对这些数据进行存储和处理,从而获取有用的信息,但目前并没有一个完整的客运需求预测系统来进行综合的整合数据资源,通过选择适合的算法来合理预测客运需求,并对客运信息进行综合查看展示。因此,如何根据现有运输通道的数据,建设一个科学的面向整个运输通道的客运专线客运预测系统显得尤为必要。



技术实现要素:

本发明的实施例提供了一种高精度的客运预测方法及客运预测系统,已解决现有技术中存在的技术问题。

为了实现上述目的,本发明采取了如下技术方案。

一种高精度的客运预测方法,包括:

获取客运历史数据;

基于该客运历史数据,分别建立近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型;

对该近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行评估,获得客运预测结果。

优选地,建立近似非齐次指数序列灰色预测模型的过程包括:

设x(0)为原始数据序列,x(1)为x(0)的一阶累加生成序列,获得算式

x(0)=(x(0)(1),x(0)(2),…,x(0)(n))(1)和

通过该算式(1)和(2),获得近似非齐次指数规律的离散灰色模型

其中,δ为迭代初始值修正项,为迭代初始值,为原始序列数据的拟合值,α,β,γ,δ为近似非齐次指数规律的离散灰色模型的参数,根据最小二乘法的算式

(α,β,γ)t=(btb)-1bty(4)和

获得;

该算式(4)和(5)中

y=[x(1)(2),x(1)(3),…,x(1)(n)]t(6)

建立开放式地理数据优化模型的过程包括:

为系统特征数据序列(或称因变量序列),为相关因素数据序列,的一阶累加生成序列(1-ago序列,的紧邻均值生成序列,获得开放式地理数据优化模型(8);式中,h1(k-1)和h2分别为开放式地理数据优化模型的线性修正项和灰色作用量;

建立多变量优化灰色预测模型的过程包括:

设原始序列的一阶累加生成序列(1-ago序列)为获得背景值系数为ξ∈[0,1]的多变量优化灰色预测模型的初始式

式中,参数列的最小二乘估计满足

多变量优化灰色预测模型的时间响应式为:

进一步获得多变量优化灰色预测模型的最终还原式:

其中,

优选地,对近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行评估的过程包括:

获取评估数据;

分别通过名称相似度方法、数据类型相似度方法和取值范围相似度方法中的一种或多种,以精确度指标并结合该评估数据对近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行模式匹配;

优选地,分别通过名称相似度方法、数据类型相似度方法和取值范围相似度方法中的一种或多种,并结合该评估数据对近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行模式匹配的过程包括:

精确度指标通过式获得;

将评估数据分为未定义取值范围的属性a1和已定义取值范围的属性a2;

基于该未定义取值范围的属性a1,通过单独使用名称相似度方法和组合使用名称相似度方法、数据类型相似度方法,以精确度指标并结合该未定义取值范围的属性a1对近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行模式匹配;

基于该已定义取值范围的属性a2,通过单独使用名称相似度方法,组合使用名称相似度方法、数据类型相似度方法,组合使用名称相似度方法、数据类型相似度方法和取值范围相似度方法,以精确度指标并结合该已定义取值范围的属性a2对近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行模式匹配。

优选地,还包括对该近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行测试的过程。

第二方面,本发明提供一种高精度的客运预测系统,包括:

数据获取模块,用于获取客运历史数据;

数据库,用于存储客运历史数据;

数据分析模块,用于基于客运历史数据,分别建立近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型;

应用预测模块,用于对该近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行评估,获得客运预测结果;

可视化交互模块,用于输出该客运预测结果,以及接收预测请求。

优选地,数据获取模块获取客运历史数据的过程包括:对客运原数据进行抽取和清洗,获得客运历史数据。

由上述本发明的实施例提供的技术方案可以看出,本发明提供的一种高精度的客运预测方法及客运预测系统,解决以往的客运预测方法单一,预测结果精度与可靠性较低,没有一个完整的客运需求预测系统来进行综合的整合数据资源的技术问题。本发明提供近似非齐次指数序列灰色预测模型dngm(1,1)、ogm(1,n)模型、obgm(1,n)模型三种预测模型,解决了预测方法单一,预测结果精度与可靠性较低等问题。客运预测系统解决了目前并没有一个完整的客运需求预测系统,来进行综合的整合数据资源,通过选择适合的算法来合理预测客运需求,并对客运信息进行综合查看展示的问题。本预测方法和预测系统可以对铁路管理决策者和工作者提供有效的支持。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的一种高精度的客运预测方法的处理流程图;

图2为本发明提供的一种高精度的客运预测系统的逻辑框图;

图3为本发明提供的一种高精度的客运预测系统的系统流程图;

图4为本发明提供的一种高精度的客运预测系统的总体架构图;

图5为本发明提供的一种高精度的客运预测系统的预测流程设计图。

图中:

201.数据获取模块202.数据库203.数据分析模块204.应用预测模块205.可视化交互模块。

具体实施方式

下面详细描述本发明的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。

本发明的目的是提供一种高精度的客运预测方法及客运预测系统,旨在解决当前客运预测方法单一,预测结果精度与可靠性较低,没有一个完整的客运需求预测系统来进行综合的整合数据资源。

根据对于客运需求预测系统的使用方式不同,用户主要可分为两大类。第一类是决策者,通过对于基础客流数据的可视化展示,分析趋势走向与预测结果等,为铁路客运组织做出相应的决策;第二类是工作人员,进行数据采集并录入工作,实现对数据的删除、修改以及查找。

客运需求预测系统遵循星型数据仓库模型、遵循多维(md)和rolap理论并支持标准的olap分析和oltp报表,同时遵循j2ee、ssh2、xml等多种业界主流的、先进的技术标准等,界面操作简单,流程清晰,无论是报表还是统计图形,均采用所见即所得方式;面向决策人员提供多维度的数据分析功能,给予客流数据最直观的可视化图表展示,满足决策需要;面向底层的业务人员提供零编程、交互式分析功能,而非定制的分析报表,提供各种定制接口和调用接口webservices服务,满足第三方开发需要。

参见图1,本发明提供一种高精度的客运预测方法,包括:

获取客运历史数据;

基于该客运历史数据,分别建立近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型;

对该近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行评估,获得客运预测结果。

其中,该客运历史数据可以从公共平台上获得,例如从中国统计信息网、国家统计局官网、新浪新闻、新华日报、今日头条、长途客车网、中国南方航空官网、国际航空官网、12306官网、万年日历网以及天气网等相关网站获取到的初始文本信息进行加工处理,淘汰不合理信息、垃圾信息、过时信息等使之达到建模需求。

在本发明提供的实施例中,建立预测模型包括针对全国客运需求预测,目前所给出的预测模型为以下三种预测模型,系统将通过脚本语言进行算法实现。

(1)近似非齐次指数序列灰色预测模型dngm(1,1)

设x(0)为原始数据序列,x(1)为x(0)的一阶累加生成序列,即

x(0)=(x(0)(1),x(0)(2),…,x(0)(n))(1)

为近似非齐次指数规律的离散灰色模型dngm(1,1)。其中δ为迭代初始值修正项,为迭代初始值,为原始序列数据的拟合值。α,β,γ,δ为dngm(1,1)模型的参数,根据最小二乘法则有

(α,β,γ)t=(btb)-1bty(4)

其中

y=[x(1)(2),x(1)(3),…,x(1)(n)]t(6)

(2)开放式地理数据优化模型ogm(1,n)

为系统特征数据序列(或称因变量序列),为相关因素数据序列(或称自变量序列),的一阶累加生成序列(1-ago序列,即的紧邻均值生成序列(即亦称灰色预测模型的背景值,其中0.5称为背景值系数),则称

为gm(1,n)的优化模型,简称ogm(1,n)模型。其中h1(k-1)和h2分别称为ogm(1,n)模型的线性修正项及灰色作用量。

(3)多变量优化灰色预测模型obgm(1,n)

在灰色理论中,背景值系数是影响多变量灰色预测模型性能的一个重要参数。然而在ogm(1,n)模型中为了简化建模过程,将背景值系数取为0.5。为此有人应用粒子群算法(pso)对模型的背景值系数进行优化,提出了一个新的多变量优化灰色预测模型obgm(1,n)。

设原始序列的一阶累加生成序列(1-ago序列)为则称

是背景值系数为ξ∈[0,1]的ogm(1,n)模型。若存在ξ∈[0,1]使得序列的平均相对模拟误差百分比最小,则称ogm(1,n)模型具有最优背景值系数ξ,并将该多变量灰色预测模型记为obgm(1,n)模型。

其中,参数列的最小二乘估计满足

obgm(1,n)模型的时间响应式为:

obgm(1,n)模型的最终还原式为:

其中,

在本发明提供的实施例中,上述的对三个预测模型进行评估的过程包括:对于模式匹配采用组合相似度比较的方式进行,包括名称相似度、数据类型相似度和取值范围相似度。实验过程中,分别对基于几种相似度单独或组合的方式对实验数据进行了模式匹配,采用精确度的指标对其匹配准确率进行评价。评价指标精确度定义如式(3-1)所示:

其中c为正确匹配的属性数量,i为未能正确匹配的属性数量。

由于取值范围相似度仅仅针对已定义取值范围的属性而言,故实验对比数据将属性分为未定义取值范围的属性a1和已定义取值范围的属性a2。针对未定义取值范围的属性a1,进行单独使用名称相似度simn、组合使用名称及数据类型相似度simnt两次模式匹配;针对已定义取值范围的属性a2,进行单独使用名称相似度simn、组合使用名称及数据类型相似度simnt和组合使用三种相似度simntr三次模式匹配。

在本发明提供的优选实施例中,还包括对三个预测模型进行测试的过程,具体过程为利用经过测试满足需求的模型进行数据预测,及时解决系统出现的问题,完成相应功能调整与完善,若在系统测试期间如出现重大问题,测试期须顺延。

第二方面,如图2和3所示,本发明提供一种用于执行上述预测方法的高精度的客运预测系统,包括:

数据获取模块201,用于获取客运历史数据;

数据库202,用于存储数据获取模块201获取的客运历史数据;

数据分析模块203,用于基于客运历史数据,分别建立近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型;

应用预测模块204,用于对该近似非齐次指数序列灰色预测模型、开放式地理数据优化模型和多变量优化灰色预测模型进行评估,获得客运预测结果;

可视化交互模块205,用于输出该客运预测结果,以及接收预测请求。

在本实施例中,客运系统元数据管理是整个系统流程的基础,一方面通过规划设计完成元数据的定义,明确数据资源的含义和标准;一方面通过元数据管理功能完成了数据采集、汇总、整合、分析应用等阶段的数据、制度规范的准备和制定工作;并在整个业务过程中通过元数据对各环节、各阶段存在的各种数据进行全方位描述,使系统中的数据信息全程可解读、可管理。

客运系统数据采集阶段,首先通过采集任务配置,根据数据的实际情况灵活调整采集任务,设置采集的对象、采集时间、采集周期、审核级别的等任务属性。并向元数据管理人员提供元数据增补变动的需求。数据采集功能通过数据采集、交换处理、数据汇总、导入加载等服务功能实现对各路局公司的统计数据采集,采集上来的数据进入系统,可对于数据进行汇总处理。

客运需求预测即对数据综合分析应用等一些列分析服务,将客运需求预测方法用在系统上,可利用gis平台、bi工具,及各种统计分析软件进行多种形式的查询、分析、挖掘和预测应用。系统平台集成相关的数据分析工具,实现配置管理。从分析所需数据、到分析所需的工具、算法、功能,乃至分析结果的展现形式均可自行定义,这样就提供了一个可扩展的分析平台供用户自行进行分析活动。

客运需求预测系统的数据可视化是在基础数据分析功能的基础上实现的,同时还需要保证良好的交互功能。基础数据统计部分应当提供常用的统计图表实现,如直方图、饼状图、折线图等,快速展示数据的分布情况。常用数据可视化部分应提供层次数据、网络数据、文本数据、地理数据、多维数值数据的可视化。数据交互则是指数据与用户之间良好的可交互性,可根据用户的实际需求来选择要展示内容,来实现更可靠和直观的可视化展示。

图4为系统总体架构图,分为数据应用层、数据分析层、数据存储层、数据可视化层及平台管控。

数据应用层是使各路局决策者可以通过报表、图表和图形的方式,简便、快捷地访问系统中的各种数据并进行各种分析预测操作,查看大数据平台的分析结果并形成报表,如可以通过web浏览器访问门户。在登录门户后,系统将按照应用户的授权、角色展现存储在大数据平台上的集成信息。

前端展示平台采用b/s架构,由一整套组件或服务构成,并通过功能强大、基于web的通信框架相连接,满足应用户不同的应用需求。这些组件既可以独立存在,也可以相互转化和调应用,并且均可在一个界面里实现。为报表查询和分析呈现以及数据集成提供了最完善、最可靠的平台。

数据分析层构建在数据存储层之上,旨在通过算法模型对数据进行深度挖掘对数据存储层数据进行多维分析,发现数据中的价值。客运需求预测系统提供海量异构数据的监测和分析,构建包括数据统计分析、多维分析、预测分析、数据挖掘工具等模块的数据处理,对客运相关数据进行分析和计算预测,满足系统的分析挖掘需求。

数据存储层主要实现从业务系统、外部数据、互联网数据中,将相关业务数据进行网络爬虫、抽取、转换并加载到客运需求预测系统中。其中关键的部分就是etl过程,etl过程中的主要环节就是数据抽取、数据转换和加工、数据装载。应用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的模型,将数据加载到中去。

数据抽取是指从数据源中抽取数据的过程。实际应用中,数据源较多采用的是关系数据库,其他数据源也有文件形式,例如txt文件、excel文件、xml文件等。由于从数据源中抽取的数据不一定完全满足目的库的要求,例如数据格式的不一致、数据输入错误、数据不完整等等,因此要对抽取出的数据进行数据转换和加工。

数据可视化是利用人眼的感知能力,对数据进行交互的可视表达,以增强认知的技术,目的是将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息。数据可视化层将分析结果以地理信息、历史波动、网络拓扑、统计图表等方式进行可视化呈现。

客运需求预测系统的数据管控涉及到元数据管理、数据质量管理、数据安全管理、平台运维等几个领域,目标是保证数据的时效性、合法性、完整性、一致性、可审计和安全性以及平台的管理。

(1)监控告警是监视各个模块的cpu、内存、网络等资源使应用情况,当资源占应用超过设定的阈值时,向系统管理员发出警报。

(2)用户管理是管理平台中的应用户角色,配置各个应用户的应用访问权限。

(3)集群管理是配置集群中各个模块的启动、停止、查看模块的状态,同时可以配置模块的具体参数。

(4)当机器出现故障的时候,模块系统自动切换到备份的机器。

(5)元数据管理包括词汇表的发展、数据元素和实体的定义、规则和算法以及数据特征。

(6)对源数据、数据加工处理中的数据制定严格的数据质量标准,严格控制数据入库。

在本实施例中,客运需求预测系统的搭建以成熟开源技术为主,通过数据集成、数据管理、需求预测、标准代码规范、数据可视化技术等,实现对于数据流的全程监管和控制,完成用户需求。

图5所示,为预测流程设计图。在所需的程序算法设计问题和数据分析处理的过程中,会涉及到大量的数学运算,其中既包括一般的矩阵运算,解决优化问题时的差分法,也包括许多正交化、最小二乘法、数值计算等求解过程。虽然现代数值计算数学理论已经得到了很好的发展,大部分计算问题都具有高效的标准解,但是用计算机模拟复杂模型的计算量仍然很大。目前国际流行通用的工程计算软件r/python等语言中涵盖了模型拟合工具,为这一问题提供了解决方案。

客运需求预测模块利用python/r语言写好相应的计算函数,然后打包成jar包供java调用。系统用户调用基础数据管理功能模块中的基础数据和预测模型管理模块模型实现算法,从而实现预测,得出预测数据后提供给客运需求分析模块向用户展示。

综上所述,本发明提供的一种高精度的客运预测方法及客运预测系统,解决以往的客运预测方法单一,预测结果精度与可靠性较低,没有一个完整的客运需求预测系统来进行综合的整合数据资源的技术问题。本发明提供近似非齐次指数序列灰色预测模型dngm(1,1)、ogm(1,n)模型、obgm(1,n)模型三种预测模型,解决了预测方法单一,预测结果精度与可靠性较低等问题。客运预测系统解决了目前并没有一个完整的客运需求预测系统,来进行综合的整合数据资源,通过选择适合的算法来合理预测客运需求,并对客运信息进行综合查看展示的问题。本预测方法和预测系统可以对铁路管理决策者和工作者提供有效的支持。本发明的预测方法和系统还具有如下优点:

基于网络和gis技术建立b/s结构的数据共享网站,实现基于浏览器的共享数据快速浏览、下载和应用;

地理数据的发布以webgis方式发布,并可以为权限用户提供查询、下载服务;

元数据的发布应为所有用户提供查询、下载服务;

文本数据的发布应为权限用户提供查询、下载服务;

下载数据的格式应为公开的数据交换格式;

提供专业的数据应用工具下载服务。

应提供用户多种直接进入数据库的途径,至少应包括:通过搜索引擎检索结果进入方式、通过元数据进入方式、通过数据分类进入方式等;

应提供符合本科学数据中心(网)数据检索、查询特点的搜索引擎。搜索结果除列表显示外,还应当向用户提供缩微图查询方式或多行数据内容的表结构浏览方式等多种信息展示服务模式。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1