基于注意力加权的冷链物流需求估计方法与流程

文档序号:23656055发布日期:2021-01-15 13:53阅读:159来源:国知局
基于注意力加权的冷链物流需求估计方法与流程

本发明涉及物流需求估计领域,特别设计基于注意力加权的冷链物流需求估计方法。



背景技术:

冷链物流作为新技术发展,在我国物流中的地位越来越重要。冷链物流作为新技术发展,在我国物流中的地位越来越重要。冷链物流已经变成现代物流的重要组成部分,对我国的国计民生有着重要的影响。

新的世纪,冷链物流对人们生活的影响越来越大,许多地方都重视冷链物流的发展。但是在发展规划出台之前,需要进行规划发展的可行性分析,因为当冷链产品供大于求时会造成投资的浪费,当冷链产品供不应求时,满足不了人们的需求。因此冷链物流需求预测是整个可行性分析的至关重要的一步。



技术实现要素:

为了解决上述存在问题,本发明在多种数据的基础上,提出一种基于注意力加权的冷链物流需求估计方法,本发明通过注意力加权来增强对各种数据对于冷链物流的注意力焦点,同时结合交替最小二乘算法的矩阵分解能力,实现冷链物流需求预测,为达此目的,本发明的具体步骤如下,其特征在于:

步骤1:收集被测区域的gdp、人口总数、人均可支配收入、蔬菜销量、水果销量数据和对应的冷链物流需求数据,把不同数据当作冷链物流需求预测的特征,组成特征数据矩阵;

步骤2:计算特征数据矩阵中各特征的注意力权重,结合注意力权重对特征重新标定,形成新的特征数据矩阵;

步骤3:将特征数据和对应的冷链物流需求量组成混合矩阵rm*n,将混合矩阵分解成低维矩阵xu和yi;

步骤4:将低维矩阵xu和yi相乘得到新的混合矩阵r'm*n,继而得到待测的冷链物流需求量。

进一步,步骤1中的特征数据矩阵可以表示为:

d={gi,ti,pi,vi,fi}(1)

其中,gi代表i时刻的gdp值,ti代表i时刻的人口总数,pi代表i时刻的人均可支配收入,vi代表i时刻蔬菜销量,fi代表i时刻水果销量。

进一步,步骤2中使用注意力加权对特征重新标定的具体步骤为:

步骤2.1空间注意力机制模块把特征数据矩阵d通过1×1的卷积层进行降维:

c=conv1d(2)

步骤2.2通过tanh激活函数得到w×h的特征映射m:

m=tanh(c)(3)

其中,w和h分别是特征矩阵集合的行和列;

步骤2.3通过卷积层和sigmoid激活函数对m进行归一化操作生成0~1的注意力权重:

σ=sigmoid(conv2m)(4)

其中,conv1和conv2表示卷积操作;

步骤2.4获得特征加权的特征输出d'

d'=σ×d(5)

进一步,步骤3中将混合矩阵分解为低维矩阵:

步骤3.1将从重新标定的特征和对应标签组成混合矩阵rm*n:

rm*n={d',li}(6)

li为第i时刻的冷链物流需求量,将待测时间对应的冷链物流需求量统一置为空,来保持矩阵大小的统一性,m和n分别为混合矩阵的行和列;

步骤3.2将混合矩阵设置为两个低维矩阵的乘积:

xm*k和是rm*n分解出的低维矩阵,k是低维矩阵的维数,为了等两边尽可能相等,构造交替最小二乘法的平方误差损失函数:

其中λ为参数,rui、xu和yi分别是rm*n、xm*k和yn*k的不同表示,λ(|xu|2+|yi|2)是防止过拟合引入的误差变量。

步骤3.3先取随机值固定xu;

步骤3.4对l(x,y)求解yi的偏导,并令偏导为0,可求解yi:

yi=(xtx+λi)-1xtri(9)

步骤3.5将步骤2.4求解的yi固定,同理求出xu:

xu=(yty+λi)-1ytru(10)

步骤3.6不断重复步骤3.4和步骤3.5,直到l(x,y)达到目标值或达到最大迭代次数,得到低维矩阵xu和yi。

进一步,步骤4中构造新的混合矩阵r'm*n:

r'm*n=xu×yi(11)

新的混合矩阵r'm*n将原先置空的冷链物流需求量也表达出来,这些值对应了待求的冷链物流需求量。

本发明基于注意力加权的冷链物流需求估计方法,有益效果在于:

1.本发明利用注意力加权算法,增强了对冷链物流需求影响大的特征的注意力焦点;

2.本发明交替最小二乘法,提高了对各参数特征的分解能力;

3.本发明在损失函数中添加误差变量,提高了模型的鲁棒性,避免了模型的过拟合;

4.本发明算法复杂度低,实时性强。

附图说明

图1本发明的流程图;

图2空间注意力机制模块图;

具体实施方式

本发明提出了基于注意力加权的冷链物流需求估计方法,旨在提高各个参数特征对冷链物流需求估计的重要性,区分不同参数特征间的差异性,同时提高冷链物流需求估计稳定性和准确性。图1为本发明的流程图。下面结合流程图对本发明的步骤作详细介绍。下面结合附图与具体实施方式对本发明进一步描述:

步骤1:收集被测区域的gdp、人口总数、人均可支配收入、蔬菜销量、水果销量数据和对应的冷链物流需求数据,把不同数据当作冷链物流需求预测的特征,组成特征数据矩阵;

步骤1中的特征数据矩阵可以表示为:

d={gi,ti,pi,vi,fi}(1)

其中,gi代表i时刻的gdp值,ti代表i时刻的人口总数,pi代表i时刻的人均可支配收入,vi代表i时刻蔬菜销量,fi代表i时刻水果销量。

步骤2:计算特征数据矩阵中各特征的注意力权重,结合注意力权重对特征重新标定,形成新的特征数据矩阵;

被测区域的gdp、人口总数、人均可支配收入、蔬菜销量、水果销量数据对于冷链物流需求都有着及其重要的影响,但不同的参数特征对于冷链物流需求的重要性都不一样,需求对每个参数进行加权区分,步骤2中使用注意力加权对特征重新标定的具体步骤为:

步骤2.1空间注意力机制模块把特征数据矩阵d通过1×1的卷积层进行降维:

c=conv1d(2)

空间注意力机制模块如图2所示。

步骤2.3通过tanh激活函数得到w×h的特征映射m:

m=tanh(c)(3)

其中,w和h分别是特征矩阵集合的行和列;

步骤2.4通过卷积层和sigmoid激活函数对m进行归一化操作生成0~1的注意力权重:

σ=sigmoid(conv2m)(4)

其中,conv1和conv2表示卷积操作;

步骤2.5获得特征加权的特征输出d'

d'=σ×d(5)

步骤3:将特征数据和对应的冷链物流需求量组成混合矩阵rm*n,将混合矩阵分解成低维矩阵xu和yi;

步骤3中将混合矩阵分解为低维矩阵:

步骤3.1将从重新标定的特征和对应标签组成混合矩阵rm*n:

rm*n={d',li}(6)

li为第i时刻的冷链物流需求量,将待测时间对应的冷链物流需求量统一置为空,来保持矩阵大小的统一性,m和n分别为混合矩阵的行和列;

步骤3.2将混合矩阵设置为两个低维矩阵的乘积:

xm*k和是rm*n分解出的低维矩阵,k是低维矩阵的维数,为了等两边尽可能相等,构造交替最小二乘法的平方误差损失函数:

其中λ为参数,rui、xu和yi分别是rm*n、xm*k和yn*k的不同表示,λ(|xu|2+|yi|2)是防止过拟合引入的误差变量。

步骤3.3先取随机值固定xu;

步骤3.4对l(x,y)求解yi的偏导,令偏导为0,可求解yi:

yi=(xtx+λi)-1xtri(9)

步骤3.5将步骤2.4求解的yi固定,同理求出xu:

xu=(yty+λi)-1ytru(10)

步骤3.6不断重复步骤3.4和步骤3.5,直到l(x,y)达到目标值或达到最大迭代次数,得到低维矩阵xu和yi。

步骤4:将低维矩阵xu和yi相乘得到新的混合矩阵r'm*n,继而得到待测的冷链物流需求量。

步骤4中构造新的混合矩阵r'm*n:

r'm*n=xu×yi(11)

新的混合矩阵r'm*n将原先置空的冷链物流需求量也表达出来,这些值对应了待求的冷链物流需求量。本发明将对冷链物流需求影响大的参数gdp、人口总数、人均可支配收入、蔬菜销量和水果销量数据作为对其求解的特征,由于每个特征对于冷链物流需求量的影响是不同的,同时每个特征是不能线性映射冷链物流需求量的。因此使用注意力加权算法对每个特征重新标定,以提高对冷链物流需求量影响大的特征权重,弱化对冷链物流需求量小的特征权重,来解决不同特征之间的差异性问题。交替最小二乘法利用矩阵降维的思想,实现各个特征对冷链物流需求量的非线性映射。

以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1