基于GEP算法的小白菜价格预测方法与流程

文档序号:12672130阅读:291来源:国知局
本发明涉及农产品价格预测方法。更具体地说,本发明涉及一种基于GEP算法的小白菜价格预测方法。
背景技术
:由于众多现有的农业电子商务网所提供的小白菜价格数据多样化,现有小白菜价格预测算法无法适应网站所提供多类型数据,不能准确即时反应小白菜价格变化。GEP技术是借鉴生物遗传的基因表达规律提出的知识发现新技术,该技术的特点是:(1)它们在“杂交-变异-新种群-选择”的进化论思想方面相似;(2)GA是用简单编码解决简单问题,GP是用复杂编码解决复杂问题,GEP则是用简单编码解决复杂问题;(3)GEP融合了GA和GP的优点;(4)GEP的先天优势使得组合爆炸和早熟容易克服;(5)基因表达式编程不需对结果公式形状做主观假定,而认为真理在训练数据中,以基本变量和运算符为遗传物质,通过遗传、变异,逐代进化出更接近事物本质的公式。技术实现要素:本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。本发明还有一个目的是提供一种基于GEP算法的小白菜价格预测方法。为了实现根据本发明的这些目的和其它优点,提供了一种基于GEP算法的小白菜价格预测方法,包括以下步骤:步骤一,采集目标地区的小白菜L天的价格数据,抽取第i天到第j天之间的价格数据用多种函数模型进行拟合出多个价格预测函数;步骤二,抽取第m天到第n天之间的价格数据,计算步骤一得到的多个价格预测函数的适应度值,适应度值的计算公式为:其中,yt表示第t天根据各价格预测函数算出的预测价格,dt为第t天的实际价格,K为预测价格与对应时间的实际价格差的最大值;步骤三,计算适应度值最大的价格预测函数的复相关系数,复相关系数的计算公式为:其中,yt表示第t天根据适应度值最大的价格预测函数算出的预测价格,dt为第t天的实际价格,为第m天到第n天之间适应度值最大的价格预测函数算出的预测价格的平均值;步骤四,将步骤二得到的适应度值最大的价格预测函数与步骤三得到的复相关系数相乘,即得小白菜价格预测函数;其中,[m,n]与[i,j]的范围不相同。优选的是,在本发明中1≤i<j<m<n≤L。优选的是,在本发明中连续采集天数L≥180,(j-i+1):(n-m+1)=11:5。优选的是,在本发明中函数模型包括:LINEST函数、LOGEST函数、TREND函数、GROWTH函数、FROECAST函数。优选的是,在本发明中L天中每日价格数据为多个农产品网站同日的小白菜价格数据的平均值。优选的是,在本发明中单个农产品网站的当日价格数据通过以下步骤得到:步骤a,每日间隔30s从目标农产品网站采集一次价格,然后将所有价格按照时间顺序排序;步骤b,按组距和组数对步骤a中的经过排序的价格进行分组,组距为每日的价格的最大值与最小值之差除以组数,组数k的计算公式为:k=1+3.322lgs;其中,s为步骤a中采集的每日价格的数量,k取其数值的整数部分;步骤c,用每组价格内包含的价格的数量除以每日价格的数量,得每组价格内包含的价格的数量占每日价格数量的比例;步骤d,选取步骤c中比例在0.00135~1之间的分组,计算所有选取的分组中所有价格的平均值,即为农产品网站的当日价格数据。优选的是,在本发明中在所述步骤一中,L天的价格数据在抽取前经过3o·准则提取,具体方法如下:计算出L天价格数据的均值μ与标准差o·,然后剔除L天价格数据中分布在(μ-3o·,μ+3o·)范围以外的数据。本发明至少包括以下有益效果:1、本发明对小白菜价格预测的准确度较现有的小白菜价格预测算法更高。2、本发明中的核心函数关系式由GEP技术自动产生,具有人工干预少,自动化程度高的特点。3、通过对数据分析经验的积累,可以自动优化算法,极大程度上提高了预测精度。本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。具体实施方式下面结合实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。实施例1:步骤一,采集广西常乐地区2015年全年的价格数据,以2015年1月1号为第1天,抽取第1天到第90天之间的价格数据如表1所示,用LINEST函数和LOGEST函数模型进行拟合出函数表达式分别为:y=1.471+0.036x1-0.034x2,其中,x1为待测天数,x2为小白菜需求量。步骤二,抽取第244天到第273天之间的价格数据如表2所示,计算步骤一得到的两个价格预测函数的适应度值,适应度值的计算公式为:其中,yt表示第t天根据各价格预测函数算出的预测价格,dt为第t天的实际价格,K为预测价格与对应时间的实际价格差的最大值。Y=1.471+0.036x1-0.034x2的适应度值为0.885,的适应度值为0.903.步骤三,计算适应度值最大的价格预测函数的复相关系数,复相关系数的计算公式为:其中,yt表示第t天根据适应度值最大的价格预测函数算出的预测价格,dt为第t天的实际价格,为第244天到第365天之间适应度值最大的价格预测函数算出的预测价格的平均值。由复相关系数的计算公式可得计算结果为R=0.954。步骤四,将步骤二得到的适应度值最大的价格预测函数与步骤三得到的复相关系数相乘,即得小白菜价格预测函数为说明本方法的有效性,分别用本方法和基于TGA算法的小白菜预测方法对广西常乐地区2016上半年的价格进行预测,实际价格以农村联合合作社的价格为准,本方法的准确率为90%,而基于TGA算法的小白菜预测方法的准确率为70%。表1(表中数据按从左到右顺序与天数对应)1.6341.6651.6531.6781.6871.4541.4431.3431.4481.4691.2771.2451.2321.3461.3381.3271.0431.0131.4661.4781.4691.4771.5061.5431.5331.5441.5141.2531.5761.5901.8901.86618451.7901.7991.7561.7741.6881.7031.7001.7431.7621.7681.7871.8101.8851.8901.9301.9461.9561.9671.9882.0122.0142.1132.1332.2152.2262.2322.1032.0002.0542.0161.8831.8671.8981.8541.8301.7811.7721.1311.6651.6801.6891.6121.6031.6231.5771.5441.4631.4871.4851.4901.5001.4701.5211.5221.5001.5331.529表2(表中数据按从左到右顺序与天数对应)1.7431.7681.7561.8671.8981.8541.7621.7681.7871.6871.6651.6801.6891.6341.6651.6531.5901.2531.5761.5901.5771.5441.4631.4771.5061.5431.5331.5441.5141.522实施例2在实施例1的基础上,使用本发明的方法对广西常乐地区2016年上半年的小白菜价格进行预测,其中,步骤一中的价格数据采集自中国农业信息网、新农村商网、农博网、阿里巴巴和环球农业网,2015年每日价格数据为上述网站同日的小白菜价格数据的平均值,与实际市场价格误差在0.02%,数据准确率较高。实施例3在实施例2的基础上,对每日采集的价格数据先做处理,以中国农业信息网为例:步骤a,计算机每隔30s从网站上保存一次价格数据,当日就可以得到2880个价格数据,然后将所有价格按照时间顺序排序。步骤b,将2880代入k=1+3.322lgs,得到组数k=12,再将该日价格的最大值与最小值之差除以组数12得到组距,根据组距和组数对步骤a中的经过排序的价格进行分组。步骤c,用每组价格内包含的价格的数量除以2880,得每组价格内包含的价格的数量占该日价格数量的比例。步骤d,选取步骤c中比例在0.00135~1之间的分组,计算所有选取的分组中所有价格的平均值,即为农产品网站的当日价格数据。原始数据经过选取后,异常数据点被剔除,提高了拟合得到的函数的准确度。通过对比处理与未处理的数据进行拟合得到的函数分别进行小白菜价格预测,发现处理后的数据拟合得到的函数预测准确度高出2%。实施例4在实施例1的基础上,对步骤一中2015年的价格数据进行3o·准则提取,具体方法如下:计算第1天至第243天价格数据的均值1.633与标准差0.134,然后剔除第1天至第243天价格数据中分布在(1.231,2.035)范围以外的数据。原始数据经过选取后,异常数据点被剔除,提高了拟合得到的函数的准确度。通过对比处理与未处理的数据进行拟合得到的函数分别进行小白菜价格预测,发现处理后的数据拟合得到的函数预测准确度高出5%。尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1