基于多变量信息及径向基函数网络的垃圾产生量预测方法与流程

文档序号：11251519阅读：684来源：国知局

本发明涉及垃圾产生量预测方法。

背景技术：

近年我国经济迅猛发展，人们的生活消费水平也随之大大提高，不过人们日常生活垃圾量伴随着人们生活消费水平的提高呈现逐渐递增的趋势，甚至出现了“垃圾围城”的现象。对垃圾产生量的有效预测能够帮助环卫部门制定合理的环卫决策，因此，对垃圾产生量的预测具有现实意义。

垃圾产生量影响因素的确定会直接影响垃圾产生量预测结果，所以影响因素的确定是非常关键的。通常可以通过分析相关性进行变量选择。多变量信息基于信息熵理论，既能描述线性关系，又能描述变量间的非线性关系，且其能够同时衡量相关性和冗余性。常见的预测方法有多元线性回归分析法、灰色系统模型、组合预测法等，这些方法由于没考虑相关因素的变动对预测模型的影响，导致预测精度不太高。多元线性回归分析方法容易出现多重共线性导致预测失真。神经网络预测方法具有良好的非线性映射能力及自适应、自学习和良好的泛化能力。

技术实现要素：

本发明要克服现有技术的上述缺点，提供一种基于多变量信息及径向基函数网络的有效的垃圾产生量预测算法，既考虑影响因素与垃圾产生量之间的相关性，又考虑到影响因素间的冗余性，并且提高预测的准确率。

本发明的基于多变量信息及径向基函数网络的垃圾产生量预测方法，包括以下步骤：

1)、拟定垃圾产生量影响因素；

2)、基于互信息确定垃圾产生量影响因素；

3)、基于径向基函数网络初步预测垃圾产生量；

4)、垃圾产生量预测误差方向修正

进一步，所述步骤(2)由以下步骤组成：

(2.1)输入训练数据集训练数据集u＝d(f,c),其中f表示所有的输入变量，c表示类变量；

(2.2)初始化选择特征集s＝φ，s为选择特征集，φ为空集；

(2.3)确定首个特征变量。计算所有输入变量与类变量的互信息i(fi；c)，fi∈f，选择使互信息i(fi；c)达到最大值的输入变量fi，将该输入变量加入到特征集中s＝s+{fi}，并从输入集剔除f＝f-{fi}；

(2.4)遍历f中的所有元素，计算该元素fi与特征集s及类变量c间的多变量信息i(fi；s；c)，满足maxi(fi；s；c)＞βi(s；c)，β是用户自定义量，则选择该fi，s＝s+{fi}，f＝f-{fi}

(2.5)循环步骤(2.4)直至不存在元素fi。

(2.6)输出选择特征集s。

进一步，所述步骤(3)由以下步骤组成：

(3.1)样本输入；

(3.2)采用最小-最大变化进行数据预处理；

(3.3)初始化径向基函数网络隐藏层节点个数k；

(3.4)采用k-means++聚类确定网络聚类中心点；

(3.5)确定径向基函数扩展常数及初始化权值；

(3.6)计算径向基函数网络输出；

(3.7)计算当前预测值与真实值之间的方差，若方差小于设定的最小方差或者当迭代次数达到总迭代次数时，则终止径向基网络训练；否则采用梯度下降法修正中心、扩展常数及权值，进入步骤(3.6)；

进一步，所述步骤(4)由以下步骤组成：

(4.1)计算每个省份在径向基函数网络初始预测后的相对平均误差，公式如下：

m为输入样本的数量，y为样本实际值；y'径向基函数网络初始预测值，为相对平均误差；

(4.2)通过如下公式计算修正后的预测值：

y”为误差反向修正后的预测值，y'为径向基函数网络初始预测值。

本发明的技术构思是：选择影响因素时，需要平行相关性和冗余性，使最大相关性最小冗余性，多变量信息能够同时衡量相关性和冗余性。预测垃圾产生量时，需要尽可能提高预测的准确率，采用误差修正的方式从而提高预测的准确率。

本发明的优点是：影响因素确定时，既考虑了相关性又考虑了冗余性，算法能够较好地预测各省份垃圾产生量。

附图说明

图1是本发明的总的流程图

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1，基于多变量信息及径向基函数网络的垃圾产生量预测算法，包括以下步骤：