快递月揽件量的预测方法、装置、设备和存储介质与流程

文档序号:23543003发布日期:2021-01-05 20:53阅读:97来源:国知局
快递月揽件量的预测方法、装置、设备和存储介质与流程

本发明属于业务量预测的技术领域,尤其涉及一种快递月揽件量的预测方法、装置、设备和存储介质。



背景技术:

预测是大数据最核心的应用,大数据预测将传统意义预测拓展到“现测”。大数据预测的优势体现在它把一个非常困难的预测问题,转化为一个相对简单的描述问题,而这是传统小数据集根本无法企及的。从预测的角度看,大数据预测所得出的结果不仅仅得到处理现实业务简单、客观的结论,更能用于帮助企业经营决策,收集起来的资料还可以被规划,引导开发更大的消费力量。

时间序列数据挖掘以事物在不同时刻的状态所形成的数据为研究对象,通过对时间序列数据的特征进行分析和研究,揭示事物的发展变化规律,用于指导人们的社会、经济、军事和生活等活动。时间序列挖掘对人类社会、科技和经济的发展具有重大意义,正逐渐成为数据挖掘的研究热点之一。

随着物流行业的快速发展,业务量(快递件量)的管控关系着物流公司的业务能否正常进行。因此,对件量进行预测就显得尤为重要。

对于物流领域的件量预测问题,件量总是随时间发生变化的,当前业内主要采用人工预测或粗略的方法来预测快递的揽件量(如月揽件量),与实际件量相差较大,预测件量不准确,不利于公司的业务开展。



技术实现要素:

本发明的目的是提供一种快递月揽件量的预测方法、装置、设备和存储介质,提高件量预测的准确性。

为解决上述问题,本发明的技术方案为:

一种快递月揽件量的预测方法,包括:

步骤s1:获取揽件量的历史数据,对历史数据进行预处理,选取出至少一历史周期的月目标数据集;

步骤s2:创建基于线性回归及小波分析的件量预测模型,将月目标数据集输入所述件量预测模型,得到件量预测模型的参数;

步骤s3:基于所述参数及月目标数据集,采用所述件量预测模型对下一周期的月揽件量进行预测,输出预测值。

根据本发明一实施例,所述步骤s1进一步包括:

清洗历史数据,替换空数据及异常数据;

将历史数据按月进行划分,并计算每个月的揽件量总和,得到多个数值;

将多个数值进行分组,以12个数值为一组,得到所述月目标数据集。

根据本发明一实施例,所述步骤s2进一步包括:

基于线性回归及小波分析的件量预测模型的计算公式如下:

其中,y表示模型输出的预测值,x表示时间序列,a、b、c、ω、都是模型参数。

根据本发明一实施例,所述步骤s2进一步包括:

所述月目标数据集包含多个历史周期的数据,一个历史周期为一年,按年计算每个月的揽件量总和,得到多组数据;

将多组数据分别输入所述件量预测模型,得到多组模型参数;

对多组模型参数进行附加权重,整合为一组模型参数作为所述件量预测模型的固定参数。

根据本发明一实施例,所述步骤s3进一步包括:

基于所述固定参数,将一历史周期的月目标数据集输入件量预测模型,输出下一周期的月揽件量预测值。

根据本发明一实施例,所述步骤s3之后,还包括:比较件量预测模型输出的预测值与件量实际值的大小,计算误差;并根据误差调整件量预测模型的参数。

一种快递月揽件量的预测装置,包括:

数据预处理模块,用于获取揽件量的历史数据,对历史数据进行预处理,选取出至少一历史周期的月目标数据集;

模型创建模块,用于创建基于线性回归及小波分析的件量预测模型,将月目标数据集输入所述件量预测模型,得到件量预测模型的参数;

件量预测模块,用于基于所述参数及月目标数据集,采用所述件量预测模型对下一周期的月揽件量进行预测,输出预测值。

根据本发明一实施例,快递月揽件量的预测装置还包括模型校验模块,用于比较件量预测模型输出的预测值与件量实际值的大小,计算误差;并根据误差调整件量预测模型的参数。

一种快递月揽件量的预测设备,包括:

存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;

所述至少一个处理器调用所述存储器中的所述指令,以使得所述快递月揽件量的预测设备执行本发明一实施例中的快递月揽件量的预测方法。

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本发明一实施例中的快递月揽件量的预测方法。

本发明由于采用以上技术方案,使其与现有技术相比具有以下的优点和积极效果:

本发明一实施例中的快递月揽件量的预测方法,针对当前物流行业主要采用人工预测或粗略的方法来预测快递的月揽件量,与实际件量相差较大,导致预测件量不准确的问题,通过对件量的历史数据进行处理,得到月目标数据集,利用基于线性回归及小波分析的件量预测模型进行预测,提高月揽件量预测的准确性,为物流工作的有序开展提供有力的数据基础,从而提高物流企业的工作效率。

附图说明

图1为本发明一实施例中的快递月揽件量的预测方法流图;

图2为本发明一实施例中的快递月揽件量的预测装置的框图;

图3为本发明一实施例中的快递月揽件量的预测设备的示意图。

具体实施方式

以下结合附图和具体实施例对本发明提出的一种快递月揽件量的预测方法、装置、设备和存储介质作进一步详细说明。根据下面说明和权利要求书,本发明的优点和特征将更清楚。

实施例一

请参考图1,本实施例中的快递月揽件量的预测方法,包括:

步骤s1:获取揽件量的历史数据,对历史数据进行预处理,选取出至少一历史周期的月目标数据集。

在本实施例中,件量历史数据是指物流行业中存储的件量数据,也可以是某统计机构公布的某段时间内物流行业中件量的数据。件量包含揽件量,当然可以是发件量,本实施例以揽件量为例。在数据库中,无论是线上还是线下,均会存储揽件量的信息。该些信息可以但不限于包含:件量的类型、时间、数量。时间可以是按天存储,也可以是按照周存储,也可以按照录入系统的具体时间存储。

对获取的历史数据进行预处理,包括:清洗历史数据,替换空数据及异常数据;将历史数据按月进行划分,并计算每个月的揽件量总和,得到多个数值;将多个数值进行分组,以12个数值为一组,得到月目标数据集。

其中,清洗历史数据,去除获取的历史数据中不需要的信息及替换异常数据。通常在对数据进行统计分析之前,需要将一些不规则数据滤除掉,以确保分析的准确性。数据清洗是一个减少数据错误与不一致性的过程,主要是检测并删除或改正不规则数据。

在本实施例中,主要是针对月揽件量进行预测,因此可以去除历史数据中包含的单号信息及地址信息。在这些历史数据中,可能会出现空数据或数值异常(如非数值表示)的数据,将这些空数据或数值异常的数据用其相邻的数据替换。

具体地,历史数据包含揽件量,可以根据不同的业务场景从数据库中调取各网点揽件量(有订单、无订单)信息,下面将以某网点的揽件量为测试数据,历史数据所在日期为2011/01/01-2017/12/31,获得的历史数据经过数据清洗后可以如下表所示。

上表列出了历史数据中1个月的件量揽收数据。按照上表的格式,将2011年到2017年的历史数据做好处理。

然后,将这7年的件量历史数据按月进行划分,计算每个月的揽件量总和,得到多个数值;将多个数值进行分组,以12个数值为一组,得到月目标数据集。也就是说,计算2011年到2017年每个月的月揽件量,一年有12个月,相应的就有12个月揽件量的数值。选取2011年到2016年的月揽件量的数值,按年分组,共得到六组数据,作为月目标数据集。而剩下的2017年的月揽件量数据作为后续的模型验证数据。

步骤s2:创建基于线性回归及小波分析的件量预测模型,将月目标数据集输入件量预测模型,得到件量预测模型的参数。

在统计学中,线性回归(linearregression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。

在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。最常用的线性回归建模是给定x值的y的条件均值是x的仿射函数。不太一般的情况,线性回归模型可以是一个中位数或一些其他的给定x的条件下y的条件分布的分位数作为x的线性函数表示。像所有形式的回归分析一样,线性回归也把焦点放在给定x值的y的条件概率分布,而不是x和y的联合概率分布(多元分析领域)。

线性回归是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。

线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方法来拟合,比如用最小化“拟合缺陷”在一些其他规范里(比如最小绝对误差回归),或者在桥回归中最小化最小二乘损失函数的惩罚。相反,最小二乘逼近可以用来拟合那些非线性的模型。

本实施例采用线性回归与小波分析的方法,创建件量预测模型。其基本思想是对波形曲线拟合,找到其中规律,进行下一步预测。该件量预测模型的计算公式如下:

其中,y表示模型输出的预测值,x表示时间序列,a、b、c、ω、都是模型参数。

将2011年到2016年的揽件量历史数据组成六组数据,分别输入该件量预测模型,得到六组模型参数对这六组模型参数进行附加权重,如各组模型参数的权重的总和为1。在对模型参数进行附加权重,可根据越接近下一周期(即2017年)的历史数据得到的模型参数组,其附加权重越大,来进行权值分配。

然后,将附加权重后的这六组模型参数进行整合,化为一组模型参数。这组模型参数就作为该件量预测模型的固定参数了,之后的对月揽件量的预测,就使用这组模型参数了。

步骤s3:基于模型参数及月目标数据集,采用件量预测模型对下一周期的月揽件量进行预测,输出预测值。

根据上述件量预测模型的计算公式:在a、b、c、ω、这些模型参数已知的前提下,可画出相应的波形曲线。选取2011-2016年1月份的揽件量值,对其做线性回归,得到回归曲线,预测2017年1月份的揽件量值。然后,根据2017年1月份的预测值及之前确定的模型参数,得出2017年2-12月的月揽件量预测值。

为了验证件量预测模型的准确性,将模型输出的2017年1-12月的月揽件量预测值与实际2017年1-12月的历史月揽件量值进行比较,计算误差。如误差较大,则可根据误差调整件量预测模型的参数。

通过上述快递月揽件量的预测方法,可达到95%以上的预测准确性,较以前的方法(只能达到80%的准确率)大大提升了月揽件量预测的准确性,为物流工作的有序开展提供有力的数据基础,从而提高物流企业的工作效率。

实施例二

本发明还提供了一种快递月揽件量的预测装置,参看图2,该装置包括:

数据预处理模块1,用于获取揽件量的历史数据,对历史数据进行预处理,选取出至少一历史周期的月目标数据集;

模型创建模块2,用于创建基于线性回归及小波分析的件量预测模型,将月目标数据集输入件量预测模型,得到件量预测模型的参数;

件量预测模块3,用于基于所述参数及月目标数据集,采用件量预测模型对下一周期的月揽件量进行预测,输出预测值。

模型校验模块4,用于比较件量预测模型输出的预测值与件量实际值的大小,计算误差;并根据误差调整件量预测模型的参数。

上述数据预处理模块1、模型创建模块2、件量预测模块3及模型校验模块4的具体内容及实现方法,均如实施例一中所述,在此不再赘述。

实施例三

上述实施例二从模块化功能实体的角度对本发明快递月揽件量的预测装置进行详细描述,下面从硬件处理的角度对本发明快递月揽件量的预测设备进行详细描述。

请参看图3,该快递月揽件量的预测设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对快递月揽件量的预测设备500中的一系列指令操作。

进一步地,处理器510可以设置为与存储介质530通信,在快递月揽件量的预测设备500上执行存储介质530中的一系列指令操作。

快递月揽件量的预测设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如windowsserve、vista等等。

本领域技术人员可以理解,图3示出的快递月揽件量的预测设备结构并不构成对快递月揽件量的预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质。该计算机可读存储介质中存储有指令,当该指令在计算机上运行时,使得计算机执行实施例一中的快递月揽件量的预测方法的步骤。

实施例二中的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件的形式体现出来,该计算机软件存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置及设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式。即使对本发明作出各种变化,倘若这些变化属于本发明权利要求及其等同技术的范围之内,则仍落入在本发明的保护范围之中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1