线路信息预测方法、装置、计算机设备和存储介质与流程

文档序号:30230612发布日期:2022-06-01 04:59阅读:65来源:国知局
线路信息预测方法、装置、计算机设备和存储介质与流程

1.本技术涉及计算机技术领域,特别是涉及一种线路信息预测方法、装置、计算机设备和存储介质。


背景技术:

2.随着计算机技术的发展,出现了价格预测技术,价格预测技术可应用于多个领域,比如,价格预测技术可应用于物流领域中的无车承运平台,该无车承运平台拥有承运端及货主端的自主定价权,承运端和货主端在平台注册,工作模式为由货主端发布任务,平台定价,承运端接单。
3.传统技术中,在货主端发布任务后,无车承运平台会根据任务中的运输需求,包括起始地、目的地、到达时间以及运输吨位等设置参考价,若司机能接受参考价则直接成交,否则进入人工调价模式,当人工调价完成时任务成交。
4.然而,传统方法中,由于参考价设置不准确,经常需要通过人工与平台交互进行调价,操作繁琐,存在任务成交效率低的问题。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种能够提高任务成交效率的线路信息预测方法、装置、计算机设备和存储介质。
6.一种线路信息预测方法,所述方法包括:
7.接收携带预测线路标识的线路信息预测请求;
8.根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据;
9.将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果;
10.获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
11.在其中一个实施例中,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据之前,还包括:
12.获取预设时间段内的携带线路标识的历史线路日期信息以及价格信息;
13.根据历史线路日期信息以及价格信息,对初始时间序列模型进行训练,得到已训练的时间序列模型。
14.在其中一个实施例中,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据包括:
15.根据预测线路标识,获取对应的待预测线路信息;
16.根据预设特征关键字从待预测线路信息中获取第一待预测特征数据,并确定与待预测线路信息对应的待预测线路日期信息;
17.将待预测线路日期信息输入已训练的时间序列模型,得到第二待预测特征数据;
18.归集第一待预测特征数据和第二待预测特征数据,得到特征数据。
19.在其中一个实施例中,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果之前,还包括:
20.获取携带线路标识的历史线路信息;
21.根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据;
22.将历史线路特征数据输入初始线路信息预测模型,得到已训练的线路信息预测模型。
23.在其中一个实施例中,根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据包括:
24.根据线路标识对历史线路信息进行归类,得到与线路标识对应的目标线路信息;
25.根据预设特征关键字从目标线路信息中获取第一线路特征数据,并确定与目标线路信息对应的目标线路日期信息;
26.将目标线路日期信息输入已训练的时间序列模型,得到与目标线路日期信息对应的第二线路特征数据;
27.归集第一线路特征数据和第二线路特征数据,得到携带线路标识的历史线路特征数据。
28.在其中一个实施例中,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果包括:
29.将特征数据输入已训练的至少两个线路信息预测模型,得到多个线路信息预测模型预测结果;
30.计算多个线路信息预测模型预测结果的平均值,得到与预测线路标识对应的待比对线路信息预测结果。
31.在其中一个实施例中,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果包括:
32.当待比对线路信息预测结果大于固定成本信息时,根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,得到线路信息预测结果。
33.一种线路信息预测装置,所述装置包括:
34.接收模块,用于接收携带预测线路标识的线路信息预测请求;
35.特征构造模块,用于根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据;
36.预测模块,用于将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果;
37.比对模块,用于获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
38.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
39.接收携带预测线路标识的线路信息预测请求;
40.根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据;
41.将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果;
42.获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
43.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
44.接收携带预测线路标识的线路信息预测请求;
45.根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据;
46.将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果;
47.获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
48.上述线路信息预测方法、装置、计算机设备和存储介质,通过在接收到携带预测线路标识的线路信息预测请求后,利用预测线路标识和时间序列模型实现对特征数据的构造,从而可以根据该特征数据和线路信息预测模型实现线路信息预测,得到待比对线路信息预测结果,进而可以通过比对固定成本信息、历史成本信息以及待比对线路信息预测结果,实现兜底,得到线路信息预测结果,整个过程能够实现准确的线路信息预测,从而可以减少人工调价干预,提高任务成交效率。
附图说明
49.图1为一个实施例中线路信息预测方法的应用环境图;
50.图2为一个实施例中线路信息预测方法的流程示意图;
51.图3为一个实施例中线路信息预测方法的示意图;
52.图4为另一个实施例中线路信息预测方法的示意图;
53.图5为又一个实施例中线路信息预测方法的示意图;
54.图6为再一个实施例中线路信息预测方法的示意图;
55.图7为另一个实施例中线路信息预测方法的示意图;
56.图8为一个实施例中线路信息预测装置的结构框图;
57.图9为一个实施例中计算机设备的内部结构图。
具体实施方式
58.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
59.本技术提供的线路信息预测方法,可以应用于如图1所示的应用环境中。其中,货
主终端102通过网络与服务器104进行通信,承运终端106通过网络与服务器104进行通信。当使用货主终端的用户需要发布任务时,会发送携带预测线路标识的线路信息预测请求至服务器104,服务器104接收携带预测线路标识的线路信息预测请求,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果,获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果,推送线路信息预测结果至使用承运终端106的司机。其中,货主终端102和承运终端106可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
60.在一个实施例中,如图2所示,提供了一种线路信息预测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
61.步骤202,接收携带预测线路标识的线路信息预测请求。
62.其中,预测线路标识是指用于表征需要预测的线路的标识,线路标识包括线路编码和车辆长度。比如,预测线路标识具体可以是运输线路标识,包括运输线路的起始地、目的地以及所需车辆长度。线路信息预测请求是指用户发送的进行线路信息预测的请求。比如,线路信息预测请求具体可以是用户发送的进行线路参考价评估的请求。
63.具体的,当使用终端的用户需要进行线路信息预测时,会发送携带预测线路标识的线路信息预测请求至服务器,服务器会接收到携带预测线路标识的线路信息预测请求。举例说明,服务器具体可以是无车承运平台,当使用终端的货主需要发布货物运输任务时,会在终端上选择起始地、目的地以及所需车辆长度,终端会响应用户选择的起始地、目的地以及所需车辆长度生成运输线路标识,发送携带运输线路标识的参考价评估的请求至无车承运平台,无车承运平台会接收到携带运输线路标识的参考价评估的请求。
64.步骤204,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据。
65.其中,时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。时间序列模型是指基于已有的时间序列数据通过曲线拟合和参数估计实现预测的模型。比如,时间序列模型具体可以是prophet模型,prophet模型是加性模型,分别用不同的部分来拟合时间序列不同的趋势,叠加起来则是整个时间序列模型:prophet模型可用如下公式来表示:y(t)=g(t)+s(t)+h(t)+ε
t
,在本技术中,其中的g(t)是趋势函数,表示时间序列上的非周期变化,s(t)是刻画时间序列中的周期性(季节性)变化,其形式为傅里叶级数,h(t)用于拟合节假日和特殊日期,比如春节以及进行大型促销的日期等。
66.其中,特征数据是指与预测线路标识对应的线路特征数据,用于表征与预测线路标识对应的预测线路的特征。比如,线路特征数据具体可以是特征向量,线路特征具体包括短期趋势价格特征、长期趋势价格特征以及其他维度特征等。需要说明的是,本技术中所涉及到的特征数据都可以数值来表示。进一步的,其中的短期趋势价格特征用于表征短期趋势,包括预设短期时间段内的成交价等。比如,短期趋势价格特征具体可以是前3天成交价的平均值以及前3个线路包的成交价等。其中,前3个线路包的成交价是指前3个预设线路包
时间段内的成交价,举例说明,如图3所示,当与预测线路标识对应的待预测线路日期信息为2019年10月1日-2019年10月31日时,前3个线路包的成交价具体可以是指过去180天内前3个预设线路包时间段内的成交价(即同线路编码下前3个线路包的成交价)。
67.其中,长期趋势价格特征用于表征长期趋势,包括预设长期时间段内的分位数价格、描述性统计值、周月周期特征以及成交价等。比如,分位数价格具体可以是指预设长期时间段内的所有价格的25%、40%、50%、75%等位置的价格,描述性统计值具体可以是指预设长期时间段内的所有价格的众数、中位数、平均数、最小值等。周月周期特征用于表征周周期特征以及月周期特征,其中的周周期特征是指针对每周内的每一天的特征,即依据星期属性对数据进行区分。月周期特征是指针对每年内的每个月的特征,即依据月份属性对数据进行区分。成交价是指预设长期趋势时间段内的平均成交价。比如,成交价具体可以是最近7天内的成交价、最近15天内的成交价。
68.其中,其他维度特征是指除了短期趋势价格特征以及长期趋势价格特征外的其他特征,包括线路成本价格,线路基本属性、车辆基本属性、车辆出行属性等。比如,线路成本价格具体可以是指路桥费、油费等。线路基本属性具体可以是指里程、城市流向、网点流向等。车辆基本属性具体可以是指车辆长度、吨位等。车辆出行属性业务类型和紧急程度等,其中的业务类型包括是属于临时出行还是计划出行,紧急程度包括出行属于紧急、特急或常规等。
69.需要说明的是,本技术中的特征数据是指已经进行过数据预处理的数据,数据预处理包括缺失值处理和异常值处理等。缺失值处理是指针对缺失值的数据使用删除或者填充的方式进行处理。异常值处理是指将价格为1-10元或者单公里价格(总价/里程)超过1000的异常值进行剔除。通过这种方式,可以减小异常值或缺失值对线路信息预测的干扰,从而提高线路信息预测的准确度。
70.具体的,服务器会先根据预测线路标识从存储有线路数据的预设数据库中,获取与预测线路标识对应的待预测线路信息,进而根据与所需的特征数据对应的预设特征关键字,从待预测线路信息中筛选出部分待预测特征数据,再确定与待预测线路信息对应的待预测线路日期信息,根据待预测线路日期信息和已训练的时间序列模型,得到与待预测线路日期信息对应的部分待预测特征数据,综合所有待预测特征数据,得到特征数据。
71.步骤206,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果。
72.其中,线路信息预测模型是指用于根据特征数据进行线路信息预测的模型。比如,线路信息预测模型具体可以是指用于根据特征数据进行参考价评估的模型。举例说明,线路信息预测模型具体可以是树模型,如xgboost(extreme gradient boosting,极端梯度提升)等。待比对线路信息预测结果是指已训练的线路信息预测模型的输出结果。比如,待比对线路信息预测结果具体可以是指输出的线路价格。举例说明,如表1所示,其中的预测线路标识为线路编码+车长,输入的特征数据包括前1天成交价、前2天成交价、众数、中位数、均值、周/月单公里价格、里程、紧急程度为常规、业务类型为临时出行等,从表中可以看到,线路信息预测模型输出的待比对线路信息预测结果(即线路价格)为180。
73.表1
[0074][0075]
具体的,服务器会将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果。以xgboost模型为例进行说明,在进行线路信息预测时,特征数据会落在xgboost模型中每棵树对应的一个叶子节点上,每个叶子节点对应一个分数值,通过将每棵树对应的分数加起来就可以得到待比对线路信息预测结果。
[0076]
步骤208,获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
[0077]
其中,固定成本信息表示与预测线路标识对应的预测线路的固定成本,比如,固定成本信息具体可以是路桥费与油费之和。历史成本信息标识与预测线路标识对应的预测线路在进行预测之前的基准价格和成交价格。其中,基准价格具体可以是指历史同期基准价格,比如,具体可以是指去年的成交价格平均值。成交价格具体可以是指近期成交价格,近期的时间节点可按照需要自行设置,比如,成交价格具体可以是指近一个月内的成交价格平均值。
[0078]
具体的,在得到待比对线路信息预测结果后,服务器会获取与预测线路标识对应的固定成本信息以及历史成本信息,通过比对固定成本信息、历史成本信息以及待比对线路信息预测结果进行兜底,得到线路信息预测结果。通过进行兜底,可以实现对异常线路信息预测结果的检测,以实现准确线路信息预测。进一步的,若在进行线路信息预测之前,已经使用过该线路信息预测模型对相同预测线路进行线路信息预测,即存在历史线路信息预测数据存在于预设数据库中,服务器会在进行比对之前从预设数据库中获取历史线路信息预测数据,比对历史线路信息预测数据和待比对线路信息预测结果,当历史线路信息预测数据和待比对线路信息预测结果的偏差满足预设偏差要求时,才进一步获取与预测线路标识对应的固定成本信息以及历史成本信息进行比对,否则直接推送异常提示至管理人员进行处理。其中,预设偏差要求可按照需要自行设置,比如,预设偏差要求具体可以是历史线路信息预测数据和待比对线路信息预测结果的偏差小于预设偏差阈值。
[0079]
再进一步的,当历史线路信息预测数据和待比对线路信息预测结果的偏差满足预设偏差要求时,服务器会进一步比对待比对线路信息预测结果和相同预测线路下的历史成交价格阈值,若待比对线路信息预测结果大于历史成交价格阈值,则获取与预测线路标识对应的固定成本信息以及历史成本信息进行比对,若待比对线路信息预测结果小于或者等于历史成交价格阈值,则先将历史成交价格阈值更新为待比对线路信息预测结果,再获取
与预测线路标识对应的固定成本信息以及历史成本信息进行比对。其中的历史成交价格阈值可根据历史成交价格自行设置,比如,历史成交价格阈值具体可以是历史成交价格的50%分位数价格。
[0080]
上述线路信息预测方法,通过在接收到携带预测线路标识的线路信息预测请求后,利用预测线路标识和时间序列模型实现对特征数据的构造,从而可以根据该特征数据和线路信息预测模型实现线路信息预测,得到待比对线路信息预测结果,进而可以通过比对固定成本信息、历史成本信息以及待比对线路信息预测结果,实现兜底,得到线路信息预测结果,整个过程能够实现准确的线路信息预测,从而可以减少人工调价干预,提高任务成交效率。
[0081]
在其中一个实施例中,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据之前,还包括:
[0082]
获取预设时间段内的携带线路标识的历史线路日期信息以及价格信息;
[0083]
根据历史线路日期信息以及价格信息,对初始时间序列模型进行训练,得到已训练的时间序列模型。
[0084]
其中,历史线路日期信息是指在预设时间段内与线路标识对应的线路的所属日期。比如,历史线路日期信息具体可以是xx年xx月xx日这样的格式。价格信息是指与历史线路日期信息对应的成交价格,比如,价格信息具体可以是指成交价的每公里单价,可以通过与历史线路日期信息对应总成交价以及总里程得到,总成交价和总里程作为历史数据是存储在预设数据库中的。其中的预设时间段可以按照需要自行设置。比如,预设时间段具体可以是指近六个月。
[0085]
具体的,服务器会获取预设时间段内的携带线路标识的历史线路日期信息以及价格信息,以历史线路日期信息以及价格信息为输入,对初始时间序列模型进行训练,得到已训练的时间序列模型。举例说明,如图4所示,为利用prophet模型对2019年3月至2019年12月的历史线路日期信息以及单公里价格信息进行预测分析的结果。可以看到,每周三的单公里价格较高,周末较低,每个月的单公里价格在逐月递减,到9月后有轻微上升。
[0086]
本实施例中,通过根据历史线路日期信息以及价格信息,对初始时间序列模型进行训练,得到已训练的时间序列模型,能够利用历史线路日期信息以及价格信息等时间序列特征实现对时间序列模型的训练。
[0087]
在其中一个实施例中,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据包括:
[0088]
根据预测线路标识,获取对应的待预测线路信息;
[0089]
根据预设特征关键字从待预测线路信息中获取第一待预测特征数据,并确定与待预测线路信息对应的待预测线路日期信息;
[0090]
将待预测线路日期信息输入已训练的时间序列模型,得到第二待预测特征数据;
[0091]
归集第一待预测特征数据和第二待预测特征数据,得到特征数据。
[0092]
其中,待预测线路信息是指与预测线路标识对应的存储在预设数据库中的历史线路信息。第一待预测特征数据是指与预测线路标识对应的可直接得到的线路特征数据。比如,第一待预测特征数据具体可以是指与短期趋势价格特征、长期趋势价格特征(除周周期特征、月周期特征外)以及其他维度特征等对应的特征数据。第二待预测特征数据是指与预
测线路标识对应的不可直接得到的线路特征数据。比如,第二待预测特征数据具体可以是指与长期趋势价格特征中的周月周期特征对应的特征数据。举例说明,与周月周期特征对应的特征数据具体可以是指价格信息。预设特征关键字与特征相对应,特征具体包括短期趋势价格特征、长期趋势价格特征以及其他维度特征等。
[0093]
具体的,服务器会根据预测线路标识从预设数据库中获取对应的待预测线路信息,根据预设特征关键字遍历待预测线路信息,获取第一待预测特征数据,并确定与待预测线路信息对应的待预测线路日期信息,将待预测线路日期信息输入已训练的时间序列模型,得到第二待预测特征数据,归集第一待预测特征数据和第二待预测特征数据,得到特征数据。进一步的,这里的将待预测线路日期信息输入已训练的时间序列模型,得到第二待预测特征数据是指将待预测线路日期信息输入已训练的时间序列模型,已训练的时间序列模型依据待预测线路日期信息的星期属性、月份属性以及节假日属性等,预测与待预测线路日期信息对应的价格信息。
[0094]
本实施例中,通过根据预测线路标识,获取对应的待预测线路信息,根据预设特征关键字从待预测线路信息中获取第一待预测特征数据,并根据待预测线路日期信息与已训练的时间序列模型获取第二待预测特征数据,能够实现对特征数据的获取。
[0095]
在其中一个实施例中,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果之前,还包括:
[0096]
获取携带线路标识的历史线路信息;
[0097]
根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据;
[0098]
将历史线路特征数据输入初始线路信息预测模型,得到已训练的线路信息预测模型。
[0099]
其中,历史线路信息是指已成交的线路信息。历史线路特征数据是指根据历史线路信息构造的特征数据。
[0100]
具体的,服务器会从预设数据库中获取携带线路标识的历史线路信息,根据线路标识对历史线路信息进行划分,得到与各线路标识对应的历史线路信息,再根据与各线路标识对应的历史线路信息和已训练的时间序列模型,构造携带线路标识的历史线路特征数据,最后将历史线路特征数据输入初始线路信息预测模型,实现对初始线路信息预测模型的训练,得到已训练的线路信息预测模型。如前面所举例,本实施例中的线路信息预测模型,具体可以是指xgboost模型,xgboost模型是基于gbdt((gradient boosting decison tree,算法梯度提升树)的在算法和工程上的改进,除了工程上的实现,xgboost与gbdt比较大的不同是目标函数的定义。xgboost的目标函数为:
[0101][0102]
其中的为损失函数,ω(f
t
)为正则项,constant为常数项。损失函数的基本核心思想为不断添加树进行特征分裂,每添加一个树,就是学习一个新函数f(x),去拟合上次预测的残差,通过训练完成得到k棵树,得到已训练的线路信息预
测模型。正则项即如何定义树的复杂度。具体在进行模型参数调整时,可以使用网格搜索,即在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。其原理就像是在数组里找最大值。
[0103]
进一步的,本实施例中提供在进行参数调优时的优选参数为:params={'colsample_bytree':0.9,'learning_rate':0.01,'max_depth':7,'min_child_weight':1,'n_estimators':900,'subsample':0.8}。更进一步的,为了防止线路信息预测模型在训练集表现好,而测试集上表现不好的过拟合问题,本实施例中采用k折交叉验证的方式同时训练多个线路信息预测模型,增加预测结果的稳定性。举例说明,以2020年3月举例,我们训练3个模型,分别为:将2020年2月数据抽出作为验证集合,对应3月前其他数据作为训练集合,将2020年1月数据抽出作为验证集合,对应3月前其他数据作为训练集合,将2019年12月数据抽出作为验证集合,对应3月前其他数据作为训练集合,最终在进行线路信息预测时,预测结果取三个模型预测结果的均值。
[0104]
本实施例中,通过根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据,将历史线路特征数据输入初始线路信息预测模型,得到已训练的线路信息预测模型,能够实现对线路信息预测模型的获取。
[0105]
在其中一个实施例中,根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据包括:
[0106]
根据线路标识对历史线路信息进行归类,得到与线路标识对应的目标线路信息;
[0107]
根据预设特征关键字从目标线路信息中获取第一线路特征数据,并确定与目标线路信息对应的目标线路日期信息;
[0108]
将目标线路日期信息输入已训练的时间序列模型,得到与目标线路日期信息对应的第二线路特征数据;
[0109]
归集第一线路特征数据和第二线路特征数据,得到携带线路标识的历史线路特征数据。
[0110]
具体的,服务器会根据线路标识对所有历史线路信息进行归类,得到与各线路标识对应的目标线路信息,再根据预设特征关键字遍历目标线路信息,获取第一线路特征数据,并确定与目标线路信息对应的目标线路日期信息,将目标线路日期信息输入已训练的时间序列模型,得到与目标线路日期信息对应的第二线路特征数据,归集第一线路特征数据和第二线路特征数据,得到携带线路标识的历史线路特征数据。
[0111]
本实施例中,通过根据线路标识,获取对应的目标线路信息,根据预设特征关键字从目标线路信息中获取第一线路特征数据,并根据目标线路日期信息与已训练的时间序列模型获取第二线路特征数据,能够实现对历史线路特征数据的获取。
[0112]
在其中一个实施例中,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果包括:
[0113]
将特征数据输入已训练的至少两个线路信息预测模型,得到多个线路信息预测模型预测结果;
[0114]
计算多个线路信息预测模型预测结果的平均值,得到与预测线路标识对应的待比对线路信息预测结果。
[0115]
具体的,为了防止线路信息预测模型在训练集表现好,而测试集上表现不好的过
拟合问题,采用k折交叉验证的方式同时训练多个线路信息预测模型,增加预测结果的稳定性,从而在利用已训练的线路信息预测模型得到待比对线路信息预测结果时,服务器会将特征数据输入已训练的至少两个线路信息预测模型,得到多个线路信息预测模型预测结果,计算多个线路信息预测模型预测结果的平均值,得到与预测线路标识对应的待比对线路信息预测结果。
[0116]
本实施例中,通过将特征数据输入已训练的至少两个线路信息预测模型,得到多个线路信息预测模型预测结果,计算多个线路信息预测模型预测结果的平均值,得到与预测线路标识对应的待比对线路信息预测结果,能够增加预测结果的稳定性。
[0117]
在其中一个实施例中,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果包括:
[0118]
当待比对线路信息预测结果大于固定成本信息时,根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,得到线路信息预测结果。
[0119]
其中,预设指导价格输出逻辑是指预先设置的对历史基准价和历史成交价以及待比对线路信息预测结果的比较逻辑,即根据三者的大小顺序输出不同的价格结果。如图5所示,以历史基准价为18年基准价,历史成交价为近期成交价,待比对线路信息预测结果为模型价为例进行说明,预设指导价格输出逻辑可以如图5所示,根据三者的大小顺序可输出不同的价格结果,即线路信息预测结果。
[0120]
具体的,服务器会先比对比对固定成本信息和待比对线路信息预测结果,当待比对线路信息预测结果小于或者等于固定成本信息时,将固定成本信息替换为新的待比对线路信息预测结果,进一步根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,根据三者的大小顺序,确定线路信息预测结果。当待比对线路信息预测结果大于固定成本信息时,直接根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,根据三者的大小顺序,确定线路信息预测结果。
[0121]
举例说明,根据三者的大小顺序,确定线路信息预测结果具体可以分为以下几种情况:1)当待比对线路信息预测结果>历史基准价>历史成交价时,线路信息预测结果为历史成交价;2)当待比对线路信息预测结果>历史成交价>历史基准价时,线路信息预测结果为历史成交价;3)当历史基准价>待比对线路信息预测结果>历史成交价时,线路信息预测结果为历史成交价;4)当历史基准价>历史成交价>待比对线路信息预测结果时,线路信息预测结果为历史成交价;5)当历史成交价>待比对线路信息预测结果>历史基准价时,线路信息预测结果为待比对线路信息预测结果;6)当历史成交价>历史基准价>待比对线路信息预测结果时,线路信息预测结果为待比对线路信息预测结果
[0122]
本实施例中,通过比对固定成本信息和待比对线路信息预测结果、以及根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,得到线路信息预测结果,能够实现对待比对线路信息预测结果的兜底,从而实现准确线路信息预测。
[0123]
在其中一个实施例中,如图6所示,通过一个流程图来说明本技术的线路信息预测方法,该线路信息预测方法包括以下几个步骤:
[0124]
1)对原始数据进行预处理:通过分析历史线路信息的线路成本价格、线路基本属性、车辆基本属性、时间维度的价格特征、业务需求类型(计划、临时)和不同区域等数据,进行缺失值和异常值处理,数据归集,定义线路标识。
[0125]
2)针对不同维度进行特征工程,选择出相关重要特征,这里的不同维度包括短期趋势价格特征、长期趋势价格特征以及其他维度特征等。相关重要特征如图6所示包括最高目标价、近期成交价、总里程、车型、任务时长、油费、路桥费、提前期等。
[0126]
3)进行模型训练:在对xgboost模型进行训练之前,先利用回归模型、时序模型(即时间序列模型,这里的时间序列模型需要进行预先训练)以及深度神经网络基于选择出的相关重要特征,构造与xgboost模型对应的携带线路标识的历史线路特征数据,根据携带线路标识的历史线路特征数据对xgboost模型进行训练,得到已训练的线路信息预测模型。
[0127]
4)进行模型预测:接收携带预测线路标识的线路信息预测请求,根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据,将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的模型预测价,将模型预测价输入兜底模块,输出模型线路指导价(即获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果)。具体的,进行模型预测的过程可以如图7所示,图7中的静态模型即是指线路信息预测模型,线路信息预测模型输入模型预测价后,服务器首先比对模型预测价和路桥费与油费之和(即固定成本信息),当模型预测价大于路桥费与油费之和时,对模型预测价进行兜底分析,当模型预测价小于或者等于路桥费与油费之和时,将路桥费与油费之和更新为模型预测价,对模型预测价进行兜底分析。这里的进行兜底分析即根据预设指导价格输出逻辑比对模型预测价和历史成本信息中的最高目标价(即历史基准价)和近期成交价(即历史成交价),得到模型指导价(即线路信息预测结果)。
[0128]
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0129]
在一个实施例中,如图8所示,提供了一种线路信息预测装置,包括:接收模块802、特征构造模块804、预测模块806和比对模块808,其中:
[0130]
接收模块802,用于接收携带预测线路标识的线路信息预测请求;
[0131]
特征构造模块804,用于根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据;
[0132]
预测模块806,用于将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果;
[0133]
比对模块808,用于获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
[0134]
上述线路信息预测装置,通过在接收到携带预测线路标识的线路信息预测请求
后,利用预测线路标识和时间序列模型实现对特征数据的构造,从而可以根据该特征数据和线路信息预测模型实现线路信息预测,得到待比对线路信息预测结果,进而可以通过比对固定成本信息、历史成本信息以及待比对线路信息预测结果,实现兜底,得到线路信息预测结果,整个过程能够实现准确的线路信息预测,从而可以减少人工调价干预,提高任务成交效率。
[0135]
在其中一个实施例中,线路信息预测装置还包括时间序列模型训练模块,时间序列模型训练模块用于获取预设时间段内的携带线路标识的历史线路日期信息以及价格信息,根据历史线路日期信息以及价格信息,对初始时间序列模型进行训练,得到已训练的时间序列模型。
[0136]
在其中一个实施例中,特征构造模块还用于根据预测线路标识,获取对应的待预测线路信息,根据预设特征关键字从待预测线路信息中获取第一待预测特征数据,并确定与待预测线路信息对应的待预测线路日期信息,将待预测线路日期信息输入已训练的时间序列模型,得到第二待预测特征数据,归集第一待预测特征数据和第二待预测特征数据,得到特征数据。
[0137]
在其中一个实施例中,线路信息预测装置还包括线路信息预测模型训练模块,线路信息预测模型训练模块用于获取携带线路标识的历史线路信息,根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据,将历史线路特征数据输入初始线路信息预测模型,得到已训练的线路信息预测模型。
[0138]
在其中一个实施例中,线路信息预测模型训练模块还用于根据线路标识对历史线路信息进行归类,得到与线路标识对应的目标线路信息,根据预设特征关键字从目标线路信息中获取第一线路特征数据,并确定与目标线路信息对应的目标线路日期信息,将目标线路日期信息输入已训练的时间序列模型,得到与目标线路日期信息对应的第二线路特征数据,归集第一线路特征数据和第二线路特征数据,得到携带线路标识的历史线路特征数据。
[0139]
在其中一个实施例中,预测模块还用于将特征数据输入已训练的至少两个线路信息预测模型,得到多个线路信息预测模型预测结果,计算多个线路信息预测模型预测结果的平均值,得到与预测线路标识对应的待比对线路信息预测结果。
[0140]
在其中一个实施例中,比对模块还用于当待比对线路信息预测结果大于固定成本信息时,根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,得到线路信息预测结果。
[0141]
关于线路信息预测装置的具体限定可以参见上文中对于线路信息预测方法的限定,在此不再赘述。上述线路信息预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0142]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该
内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储携带线路标识的历史线路信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种线路信息预测方法。
[0143]
本领域技术人员可以理解,图9中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0144]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
[0145]
接收携带预测线路标识的线路信息预测请求;
[0146]
根据预测线路标识和已训练的时间序列模型,得到与预测线路标识对应的特征数据;
[0147]
将特征数据输入已训练的线路信息预测模型,得到与预测线路标识对应的待比对线路信息预测结果;
[0148]
获取与预测线路标识对应的固定成本信息以及历史成本信息,比对固定成本信息、历史成本信息以及待比对线路信息预测结果,得到线路信息预测结果。
[0149]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设时间段内的携带线路标识的历史线路日期信息以及价格信息,根据历史线路日期信息以及价格信息,对初始时间序列模型进行训练,得到已训练的时间序列模型。
[0150]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据预测线路标识,获取对应的待预测线路信息,根据预设特征关键字从待预测线路信息中获取第一待预测特征数据,并确定与待预测线路信息对应的待预测线路日期信息,将待预测线路日期信息输入已训练的时间序列模型,得到第二待预测特征数据,归集第一待预测特征数据和第二待预测特征数据,得到特征数据。
[0151]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取携带线路标识的历史线路信息,根据历史线路信息和已训练的时间序列模型,得到携带线路标识的历史线路特征数据,将历史线路特征数据输入初始线路信息预测模型,得到已训练的线路信息预测模型。
[0152]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据线路标识对历史线路信息进行归类,得到与线路标识对应的目标线路信息,根据预设特征关键字从目标线路信息中获取第一线路特征数据,并确定与目标线路信息对应的目标线路日期信息,将目标线路日期信息输入已训练的时间序列模型,得到与目标线路日期信息对应的第二线路特征数据,归集第一线路特征数据和第二线路特征数据,得到携带线路标识的历史线路特征数据。
[0153]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将特征数据输入已训练的至少两个线路信息预测模型,得到多个线路信息预测模型预测结果,计算多个线路信息预测模型预测结果的平均值,得到与预测线路标识对应的待比对线路信息预测结果。
[0154]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当待比对线路信息预测结果大于固定成本信息时,根据预设指导价格输出逻辑比对待比对线路信息预测结果和历史成本信息中的历史基准价和历史成交价,得到线路信息预测结果。
only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0167]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0168]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1