基于麻雀搜索算法-深度信念网络的日太阳辐射估计模型

文档序号:26956720发布日期:2021-10-16 04:23阅读:127来源:国知局
基于麻雀搜索算法-深度信念网络的日太阳辐射估计模型
基于麻雀搜索算法

深度信念网络的日太阳辐射估计模型
技术领域
1.本发明属于新能源发电技术领域,具体涉及基于麻雀搜索算法

深度信念网络的日太阳辐射估计模型。


背景技术:

2.随着化石燃料的逐渐减少,太阳能作为可再生能源的代表现在正成为人类使用能源中重要的组成部分,并且在应用技术上不断进步。太阳辐射是影响光伏发电技术的重要原因,因此,为了降低光伏发电系统不确定性所带来的危害以及提高太阳能与光能间的转化效率,需要我们建立模型来对太阳辐射进行估计。地表某个水平面能接受到的太阳辐射量又被许多方面所影响,这当中最为重要的是大气因素。因此估算太阳辐射要分析多种大气变量对太阳辐射的作用,从而能够更好地进行工程实施运用。
3.太阳辐射估计方法通常可以分为以下三种主要方法,即基于卫星图像的方法,随机模型,以及经验关系方法。基于卫星图像的方法主要是利用对地静止卫星的高时空分辨率,以及卫星衍生的大气参数来驱动复杂的辐射传输模型以获得辐射估算值。然而,卫星的设备成本相当高昂,限制了这一方法的广泛使用。随机算法可用历史观测平均值生成太阳辐射估算值,但是如果没有可用的测量数据,那么就不能用于模型验证。经验关系方法主要是用经验关系通过其他容易获得的气象数据(例如日照时间,最高温度、最低温度,降水和湿度等)来估计太阳辐射。目前也已有许多机器学习技术被用于太阳辐射估计,相比于传统的经验模型,它可以有效地结合各种天气输入并且模型适应性好,展现了强大的应用优势。虽然机器学习模型在辐射估计领域得到了应用并且得到了比较准确的进度,但是他们仍然是存在着不小的缺陷。它们在训练大数据样本上通常效率比较低。
4.因此,深度学习算法能够更好的解决这些问题,与传统的机器学习模型相比,深度学习模型在大数据分析上有着非凡的优势,因而可以用于太阳辐射的估计领域。深度学习方法通常面临许多参数的影响,但是众所周知,设置深度学习参数主要凭借经验方法,但这需要太多的时间和精力。由于群智能优化算法是一种随机优化技术,在解决优化问题时有出色的搜索能力,因此广泛用于优化神经网络以提高收敛速度。


技术实现要素:

5.发明目的:本发明提供基于麻雀搜索算法

深度信念网络的日太阳辐射估计模型,能提高辐射估计的准确度,保证光伏发电系统的可靠运行,更好地工程实践运用。
6.技术方案:为实现上述发明目的,本发明的基于麻雀搜索算法

深度信念网络的日太阳辐射估计模型,包括以下步骤:
7.(1)获取气象参数数据,空气污染数据和日太阳总辐射数据,采用互信息理论选取最佳输入变量;
8.(2)对上述输入变量建立估算模型,比较估算误差大小,确定最优的输入变量;
9.(3)在选取最优输入变量集合的基础上,建立基于深度信念网络dbn的太阳辐射估
算模型;
10.(4)对深度信念网络模型进一步分析,采取麻雀搜索算法对深度信念网络参数进行优化,建立基于麻雀搜索算法

深度信念网络模型;具体为:
11.设n只麻雀的位置可以表示为以下矩阵x:
[0012][0013]
式中,d代表着待优化问题的维度;然后,可以通过以下向量表示对应的适应度值:
[0014][0015]
式中,f指的是适应度值。
[0016]
进一步地,所述步骤(1)包括以下步骤:
[0017]
(1.1)计算互信息值:
[0018]
(1.2)随机变量x、y间的互信息i(x,y)可以定义为:
[0019][0020]
式中,x∈x,y∈y,p(x,y)是x和y的联合概率分布函数,p(x)和p(y)分别是x和y的边缘概率分布函数;
[0021]
(1.3)根据步骤(1.1)得到的结果运用最大相关最小冗余算法选取输入变量;
[0022]
最大相关测度指标为:
[0023][0024]
式中,s是特征x的集合,c是分类目标,x
i
是第i个特征,i(x
i
;c)是特征x
i
和类c间的互信息;d反映输入变量与输出目标之间的相关性;
[0025]
最小冗余测度指标为:
[0026][0027]
式中,s是特征x的集合,x
j
是第j个特征,i(x
i
;x
j
)是特征x
i
和特征x
j
间的互信息;r反映输入变量间的冗余性;
[0028]
最大相关最小冗余(mrmr)算法标准:
[0029][0030]
式中,s是特征x的集合,c是分类目标,i(x
i
;c)是特征x
i
和类c间的互信息,i(x
i
;x
j
)是特征x
i
和特征x
j
间的互信息;
[0031]
如果使用增量搜索方法,转化成优化问题:
[0032][0033]
式中,s
m
‑1是已选择特征x
i
的集合,x

s
m
‑1是剩下的特征空间,i(x
j
;c)是剩下的特征x
j
和类c间的互信息,i(x
j
,x
i
)是特征x
j
和特征x
i
间的互信息。
[0034]
进一步地,步骤(2)所述的估算误差通过以下,公式实现:
[0035][0036]
式中,n为测试样本中数据样本的个数,y
u
和分别为第u个测试点辐射的真实值和预测值。
[0037]
进一步地,所述的步骤(4)中,在麻雀搜索算法中,优先找到食物的发现者都具有良好的适应度值;此外,由于发现者负责寻找食物并指导整个群体的位置流动;因此,生产者可以在各种地方寻找食物;根据上述规则,每次迭代期间,发现者按照下式进行位置更新:
[0038][0039]
式中,t表示当前迭代次数,j=1,2,3,....,d;item
max
指的是迭代次数最多的常数;x
i,j
代表着第i个体在第j维中的位置;代表着第t次迭代时的位置,代表着第t+1次迭代时的位置;α∈(0,1]是一个随机数;r2(r2∈[0,1])和st(st∈[0.5,1])各自代表着警报值和安全阈值;q是一个随机数,服从正态分布;l代表一个1
×
d的矩阵,里面每个元素均是1。
[0040]
进一步地,所述的步骤(4)中,
[0041]
当r2<st时,表示目前周围是安全的,没有捕食者,发现者进入广泛搜索模式;但如果r2≥st,代表一些个体发现了捕食者的存在,并且和其他个体发出了报警声,这时候所有个体都应该去其他地方搜索食物;
[0042]
在觅食过程中,一些加入者会时刻监视着发现者;一旦它们察觉到发现者已经找到了更好的食物,它们会立即离开现在的位置去争夺食物;如果获胜,则马上能够得到它的食物,否则还是跟着发现者找食物;加入者按照下式进行位置更新:
[0043][0044]
式中,x
p
是当前发现者所在的最佳位置,代表着第t次迭代时发现者所在的最佳位置,代表着第t+1次迭代时发现者所在的最佳位置;x
worst
代表目前全局最差的位置;a表示一个1
×
d的矩阵,里面每个元素随机赋值为1或者是

1,并且a
+
=a
t
(aa
t
)
‑1;当i>n/2的时候,第i个加入者适应度值较低,它没有获得食物,这时候需要去别的地方发现食
物,来获取更多的能量。
[0045]
进一步地,所述的步骤(4)中,
[0046]
假设意识到危险的个体占群体总数量中的10%到20%;这些个体的初始位置是随机生成的,表示为:
[0047][0048]
式中,x
best
代表目前的全局最佳位置代表着第t次迭代时全局最佳位置;代表着第t次迭代时全局最差的位置;β代表步长控制参数,是一个服从均值为0,方差为1的正态分布的随机数;k∈[

1,1]也是一个随机数,f
i
代表着当前个体的适应度值;f
g
和f
w
各自指的是目前全局最佳适应度值和最差适应度值;ε是一个极小的常数,避免产生零分误差;
[0049]
当f
i
>f
g
时,代表此时个体正处于种群的边缘,容易被捕食者所攻击;x
best
代表这个位置的个体是群体里最好的位置,同样也是十分安全的;当f
i
=f
g
时,代表处于中间的个体察觉到了危险,要去接近其它个体;k代表麻雀移动的方向,也代表着步长控制参数。
[0050]
有益效果:与现有技术相比,本发明在考虑污染参数作为输入的前提下,提出基于麻雀搜索算法

深度信念网络的日太阳辐射估计模型,用麻雀搜索算法对深度信念网络进行改进,估算的准确度得到了提高;保证光伏系统的可靠运行,更好地工程实践运用。
附图说明
[0051]
图1为平均绝对百分比误差mape折线图;
[0052]
图2为均方根误差rmse折线图;
[0053]
图3为2017年1月北京日太阳总辐射估算值与真实值变化曲线。
具体实施方式
[0054]
下面结合附图对本发明作进一步详细说明。
[0055]
本发明公开了基于麻雀搜索算法

深度信念网络的日太阳辐射估计模型,具体包括以下步骤:
[0056]
1、获取气象参数数据,空气污染数据和日太阳总辐射数据,采用互信息理论选取最佳输入变量。具体包括以下步骤:
[0057]
(1)计算互信息值:
[0058]
随机变量x、y间的互信息i(x,y)可以定义为:
[0059][0060]
式中,x∈x,y∈y,p(x,y)是x和y的联合概率分布函数,p(x)和p(y)分别是x和y的边缘概率分布函数;
[0061]
(2)运用最大相关最小冗余算法选取相关性大的输入变量:
[0062]
最大相关测度指标为:
[0063][0064]
式中,s是特征x的集合,c是分类目标,x
i
是第i个特征,i(x
i
;c)是特征x
i
和类c间的互信息;d反映输入变量与输出目标之间的相关性。
[0065]
最小冗余测度指标为:
[0066][0067]
式中,s是特征x的集合,x
j
是第j个特征,i(x
i
;x
j
)是特征x
i
和特征x
j
间的互信息;r反映输入变量间的冗余性。
[0068]
最大相关最小冗余(mrmr)算法标准:
[0069][0070]
式中,s是特征x的集合,c是分类目标,i(x
i
;c)是特征x
i
和类c间的互信息,i(x
i
;x
j
)是特征x
i
和特征x
j
间的互信息。
[0071]
如果使用增量搜索方法,可以写成优化问题:
[0072][0073]
式中,s
m
‑1是已选择特征x
i
的集合,x

s
m
‑1是剩下的特征空间,i(x
j
;c)是剩下的特征x
j
和类c间的互信息,i(x
j
,x
i
)是特征x
j
和特征x
i
间的互信息。
[0074]
2、对上述输入变量建立估算模型,比较估算误差大小,确定最优的输入变量。具体包括以下步骤:
[0075]
(1)设置初始特征集合为空集,对排序的输入变量集合通过前向搜索策略逐个添加变量至已选特征集合并建立估算模型,通过比较估算误差大小,确定最优的输入变量:
[0076]
可选的,预测数据与真实数据之间的误差为平均绝对百分比误差mape:
[0077][0078]
式中,n为测试样本中数据样本的个数,y
u
和分别为第u个测试点辐射的真实值和预测值。
[0079]
可选的,预测数据与真实数据之间的误差为均方根误差rmse:
[0080][0081]
式中,n为测试样本中数据样本的个数,y
u
和分别为第u个测试点辐射的真实值和预测值。
[0082]
3、在选取最优输入变量集合的基础上,建立基于深度信念网络(dbn)的太阳辐射估算模型。
[0083]
根据步骤(3)构建的dbn模型得到估算结果,并与bp神经网络以及支持向量机(svm)的表现进行对比。图1,图2展示了当根据排序结果依次增加输入量(t,d,o3,pm
10

pm
2.5
,no2,aqi,so2,co)作为模型训练样本时,测试样本估算结果与实际量测值之间mape、rmse的不同。由上表可示,可以看出加入污染参数作为输入能有效提高估算的准确性,当按序加入的污染参数为pm
2.5
,pm
10
,no2和o3时,模型均可以得到最好的辐射估计结果,并且基于mrmr

dbn的模型相比较于其他两个,误差更小。
[0084]
4、对深度信念网络模型进一步分析,采取麻雀搜索算法对深度信念网络参数进行优化,建立基于麻雀搜索算法

深度信念网络模型。表1列出了基于麻雀搜索算法

dbn模型进行估计的误差值,对比可以看出,基于麻雀搜索算法

dbn模型估算得到的日辐射数据与真实值之间的误差更小。
[0085]
表1基于麻雀搜索算法

dbn模型的估算误差
[0086][0087]
表2列出在选取最佳训练样本组合t,d,pm
2.5
,pm
10
,no2和o3时,基于麻雀搜索算法

dbn模型在2017年1月1日至1月31日北京日太阳总辐射真实值与估算值之间的误差。图3为对应曲线,根据图表清晰地看出基于麻雀搜索算法

dbn的模型估算得到的日太阳总辐射值与真实值之间的走向基本一致,大部分真实值和估算值能够很好的吻合,但是也可以看出在一个月的上旬有一定的出入,这是因为辐射本身波动性就比较大。但是总体分析误差指标以及误差值可以看出,基于麻雀搜索算法

dbn的模型对比于初始模型,估算准确度有所提升。
[0088]
表2基于麻雀搜索算法

dbn模型的2017年1月北京日太阳总辐射估算值与真实值误差
[0089]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1