混合生物地理学的大数据挑战下多层感知器训练优化方法与流程

文档序号:15388112发布日期:2018-09-08 00:48阅读:272来源:国知局

本发明属于大数据处理技术领域,尤其涉及一种混合生物地理学的大数据挑战下多层感知器训练优化方法。



背景技术:

目前,业内常用的现有技术是这样的:

由于科学实验,金融交易和海量数据的规模越来越大,网络,迫切需要能够从这些大数据中提取有意义的信息的工具。因此,基于神经网络(nn)的机器学习软件变得很有前途。an是一种计算方法,由几个简单和相互关联的处理元素组成,这些处理元素在人脑的神经元结构之后被松散地建模。神经网络可以表示为一个高度复杂的非线性动态系统。神经网络具有一些独特的特征:(a)高维度,(b)广泛的互连性(c)适应性和(d)自组织能力。前馈神经网络(fnns)在机器学习和大数据挖掘的各个领域已经得到普及,以解决分类和回归问题。虽然双层fnn是实际应用中最常用的神经网络,但不适合解决非线性问题。多层感知器(mlp)是在输入层和输出层之间具有一个或多个隐藏层的前馈神经网络,在处理非线性问题(如模式分类,大数据预测,和函数逼近。以前的研究表明,具有一个隐藏层的mlp能够近似任何连续或不连续的功能。因此,研究具有一个隐层的mlp已经引起了研究界的广泛关注。理论上,mlp的学习过程的目标是找到连接的权重和偏差的最佳组合,以便为给定的列车和测试数据实现最小误差。然而,训练mlp最常见的问题之一是该算法趋于收敛于局部最小值。由于mlp可以由多个局部极小值组成,因此很容易被困在其中一个中,而不是在全局最小值上收敛。这是大多数基于梯度的学习方法(如基于反向传播(bp)的神经网络)的常见问题。学习速率和动量的初始值也会影响基于bp神经网络的收敛性,这些变量的值不适合导致它们的发散。因此,许多研究集中在使用新的启发式优化方法或进化算法来解决mlp学习算法的问题。经典的应用方法是粒子群优化(pso)算法,蚁群优化(aco)和人工蜂群(abc)。然而,免费午餐定理(nfl)指出,没有启发式算法最适合于解决所有优化问题。他们中的大多数都有自己的副作用,总的来说,使用这些方法没有显着的改善。例如,遗传算法(ga)可以降低陷入局部最小值的概率,但是它们仍然收敛速度慢。一种称为生物地理学优化(bbo)的新型优化方法。是基于生物有机体的地理分布可以用数学方程来表示的动机。它是一个分布式的范例,它试图模拟那些与本地环境相互作用的未成熟个体的集体行为,从而有效地识别复杂搜索空间中的最优解。有许多相关的研究表明,bbo算法是一种进化算法,可以为每个人提供一个特定的进化机制。这种机制使得bbo算法在非均匀训练过程中比基于梯度的算法成功率更高和健壮性更强。而且,与pso或aco相比,bbo算法的变异算子可以提高其开发能力。这使得bbo算法在训练mlp中胜过pso。用bbo训练了一个模糊神经网络,用于分类诊断心肌病的图片特征。使用4个标准数据集为测试bbo算法在mlp训练中的能力提供了一个综合的测试平台。

综上所述,现有技术存在的问题是:目前的mlp训练方法存在局部最小和大数据环境下收敛缓慢等问题,使得基于神经网络的分类算法不够准确,运算速度较慢。参与本专利的算法后能有效改善mlp训练时的局部最小问题,并能够提高分类算法的运算时间。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种混合生物地理学的大数据挑战下多层感知器训练优化方法。

本发明是这样实现的,一种大数据环境下基于混合生物地理分布优化算法的多层感知器训练优化方法,一利用混沌理论和生物地理分部优化算法对感知器各参数进行优化,以期提高感知器对大数据环境中,数据分类的准确性,

具体包括:

步骤一,输入:栖息地规模n,最大迁移率e,迁入率和迁出率i,最大变异率mmax;

步骤二,根据公式初始化一组mlps的参数;

步骤三,根据公式更新每个栖息地相关参数的均方差;每个栖息地的适应度函数由mse来衡量,优化栖息地的his值;

步骤四,根据公式计算mlp的迁入率和迁出率;并随机使用迁入率和迁出率来优化非最优集合的栖息地参数;

步骤五,选择部分mlps,并通过混沌映射重新计算mlps权重或偏差;

步骤六,保存mse值小的mlps;

步骤七,达到预定义的代数或者找到接受的问题解决方案,则循环将终止;否则,请转到步骤三进行下一次迭代;

步骤八,输出:具有最小mse的mlp。

进一步,利用混沌理论和生物地理分部优化算法对感知器各参数进行优化,以期提高感知器对大数据环境中,数据分类的准确性,并使用公式中的对数模型,并且每当需要一个随机值时,根据一下公式生成一个值:

上式中xn+1∈[0,1],为逻辑参数;当μ等于4时,迭代产生值其遵循伪随机分布;而初始值的微小差异x1会导致结果的的巨大差异。

进一步,适应度函数采用均方差mse表示,并用于评估所有训练样本,mse为:

其中q是训练样本的数量,xk是第k个训练样本使用的期望输出值,dik是第k个训练样本的第i个输入单元的实际输出值,第i个样本的hsi值由hsi(ci)得出。

进一步,在bbo变异阶段的收敛性方法为:x(x1,x2,.......xn)表示mlp中的权重和偏差的向量,xi∈r和则定义为相反的向量是x'(x1',x2',......xn'),其元素为x′i=mini+maxi-xi:

1)在n维搜索中生成向量x(x1,x2,.......xn)及其相反的x'(x1',x2',......xn')空间;

2)评估两点,hsi(x)和hsi(x')的适应性;

3)如果hsi(x)小于等于hsi(x'),则用x'替换x;否则,继续使用x。

本发明的另一目的在于提供一种多层感知器训练优化方法的神经网络的机器学习系统。

综上所述,本发明的优点及积极效果为:本发明采用混沌理论来提高bbo的性能,计算量很小,在本发明中,迁移和突变机制相结合,提高了bbo的探索和发现能力,提出了一种新的迁移算子来提高bbo在mlp训练中的性能;提出了一种hcbbo算法来训练mlp。四个基准的大数据集(balloon,iris,心脏和车辆)被用来测试hcbbo在训练mlp的有效性。实验结果与三种最先进的算法进行了统计比较:bbo,pso和ga。本发明是第一个将混合混沌系统与bbo算法相结合的来训练mlp;在hcbbo的变异算子中使用了名为obl的方法来提高算法的收敛性。从图1中不难发现,本发明的运行时间相对于现有算法的运行时间要短;图2-5的结果表明,与bbo,pso和ga相比,hcbbo具有更好的收敛能力。将应用训练好的神经网络分析大型医学数据,并将更新颖的数据挖掘算法集成到hcbbo中。

附图说明

图1是本发明实施提供的混合生物地理学的大数据挑战下多层感知器训练优化方法流程图。

图2是本发明实施提供的带有一个隐藏层的mlp示意图。

图3是本发明实施提供的栖息地的物种模型示意图。

图4是本发明实施提供的每个算法的总运行时间示意图。

图5是本发明实施提供的虹膜数据集算法的收敛曲线示意图。

图6是本发明实施提供的心脏数据集算法的收敛曲线示意图。

图7是本发明实施提供的气球数据集算法的收敛曲线示意图。

图8是本发明实施提供的车辆数据集算法的收敛曲线示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

下面结合附图对本发明的应用原理作进一步描述。

如图1所示,本发明实施例提供的混合生物地理学的大数据挑战下多层感知器训练优化方法包括以下步骤:

s101:栖息地规模n,最大迁移率e和i(迁入率和迁出率),最大变异率mmax;

s102:通过公式等式的混沌映射初始化一组mlp(栖息地);

s103:对于每个栖息地,计算其相对参数的均方误差;适应度函数的基本规则是保持较小的mse值。然后精英栖息地由hsi的价值确定;

s104:根据中的迁入率和迁出率;概率性地使用迁入率和迁出率来修改每个非精英栖息地;

s10:5:选择mlp的数量,并通过混沌映射重新计算(变异)一些权重或偏差;

s106:保存一些低mse的mlp;

s107:如果达到了预定义的代数或者找到了可接受的问题解决方案,则该循环将终止,否则,请转到s103进行下一次迭代;

s108:输出:具有最小mse(hsi)的mlp。

下面结合附图对本发明的应用原理作进一步的描述。

1、本发明提供的mlp符号为:

本发明其余部分使用的符号代表一个完全连接的前馈mlp网络一个隐藏层(如图2所示)。mlp由一个输入层,一个输出层和一个隐藏层组成。mlp是使用反向传播(bp)学习算法训练的。令n表示输入节点的数量,m表示隐藏节点的数量,l表示输出节点的数量。令输入权重wi,j将第i个输入连接到第j个隐藏单元,输出权重wout(j,k)将第j个隐藏单元连接到第k个输出。输入的加权总和首先由等式:

其中n是输入节点的数量,wij是输入中第i个节点的连接权重层到隐层的第j个节点,xi表示第i个输入,θj表示阈值第j个隐藏节点。

每个隐藏节点的输出计算如下:

f(j)=1/(1+exp(-sj))j=1,2,...,m(2)

在计算隐藏节点的输出之后,最终的输出可以定义如下:

其中wjk是从第j个隐藏节点到第k个输出节点的连接权重,θk'是第k个输出节点的偏差。

学习错误e(适应度函数)计算如下:

其中q是训练样本的数量,xik是第k个输入单元的期望输出训练样本被使用,dik是第k个训练样本的第i个输入单元的实际输出用过的。

从上面的等式可以看出,mlp中的输出的最终值取决于连接权重和偏差的参数。因此,训练mlp可以被定义为找到连接的权重和偏差的最优值的过程,以便实现来自某些给定输入的期望输出。

2、本发明提供的拟议的混合bbo培训mlp方法如下:基于生物地理学的优化(bbo)是一种基于种群的优化算法,受进化和不同生态系统中捕食者和猎物的平衡的启发。实验表明,使用bbo获得的结果至少与其他基于种群的算法相竞争。在一些现实世界的问题和基准函数上,它已经被证明胜过了一些着名的启发式算法,如pso,ga和aco。

bbo算法的步骤可以描述如下。一开始,bbo生成一个随机数的名为栖息地的搜索代理,它们被表示为问题变量的向量(类似于ga中的染色体)。接下来,每个代理人被分配移民,迁移和突变率,模拟不同生态系统的特点。此外,还定义了一个称为hsi(栖息地适宜性指数)的变量来衡量每个栖息地的适应度。在这里,hsi值越高表明生境越适合生物物种的栖息地。换句话说,具有高hsi值的bbo的解决方案表现出优越的结果,而具有低hsi值的解决方案则表明低劣的结果。

在迭代过程中,从一次迭代到下一次迭代保持一套解决方案,每个栖息地基于其概率适应的迁入率和迁出率,发送和接收来自不同栖息地的居民。在每次迭代中,随机数量的居民也偶尔发生变异。随着算法的进展,每个解决方案都会通过向邻居学习而自适应。这里,每个解决方案参数被表示为适合性指标变量(siv)。

bbo的过程由迁移和变异两个阶段组成。在迁移阶段,每个生境的移民(k)和移民(k)率如图3所示。一个栖息地居民的大量居民增加了移民的可能性,并降低了移民的可能性。在突变期,bbo的突变因子尽可能地保持栖息地的分布。与遗传算法中的突变因子相比,bbo的突变因子不是随机设置的,而是取决于每个栖息地物种数量的概率。

移民(k)和移民(k)的数学公式可写成如下:

其中i是最大移民率,e是最大移民率,smax是最大移民数量,sk是k的居住人数。

每个生境的突变,改善bbo的探索,定义如下:

这里mmax是用户定义的变异的最大值,pmax是栖息地包含的概率,pn是第n个栖息地的变异概率,可以得到:

bbo算法的完整过程:

i:φ→{hn,hsin}

while(condition=t)

γ=(n,m,λ,τ,ω,m)

end;

i:h,hsin初始化栖息地生态系统并计算每个相应的hsi。

γ=(n,m,λ,τ,ω,m)是一个转换函数,它从一个最优化修改生态系统迭代到下一个。六元组的元素可以定义如下:n是栖息地的数量;m是siv的数量;λ是入境率;τ是移民率;ω是迁移算子,m是变异算子。

3、本发明提供的用于训练mlp的混合cbbo算法如下:

使用启发式算法来训练mlp有三种不同的方法。在第一种方法中,采用启发式算法来查找权重和偏差的组合以提供mlp的最小误差。在第二种方法中,启发式算法被用来找到适用于特定问题的mlp的适当架构。在第三种方法中,可以使用启发式算法来调整基于梯度的学习算法的参数。

(1)混沌系统

混沌理论是指对混沌动力系统的研究,称为“蝴蝶效应”。作为非线性动力系统,混沌系统对其初始条件非常敏感,初始条件的微小变化可能会导致这些系统的最终结果发生显着变化。

在本发明中,混沌系统被应用于bbo而不是随机值用于初始化。意味着混沌映射代替随机值为启发式算法提供混沌行为。在处理bbo算法的过程中,计算最重要的随机值,以选择在迁移阶段迁移新栖息地的栖息地。利用混沌映射,使用公式(10)中的对数模型,并且每当需要一个随机值时,从的区间中选择一个值。

这里xn+1∈[0,1],并被命名为逻辑参数。当μ等于4时,迭代的产生值将遵循伪随机分布。这意味着,在初始值的微小差异x1会导致其长期行为的巨大差异。使用这个特性来避免bbo算法的局部收敛。

(2)栖息地适宜性指数(适应度函数)

在mlp的训练阶段,每个训练数据样本应该参与计算每个候选解决方案的his。均方误差(mse)被用来评估所有训练样本。mse定义如下:

q是训练样本的数量,xk是第k个输入单元的期望输出一世训练样本被使用,dik是第k个训练样本的第i个输入单元的实际输出用过的。因此,第i个候选人的hsi值由hsi(ci)e(ci)给出。

(3)反向学习

为了改善bbo算法在变异阶段的收敛性,使用了一种名为opposition-basedlearning(obl)的方法。基于反对的学习的主要思想是同时考虑一个估计及其相反的目的,以便更好地逼近当前的候选解。

假设x(x1,x2,.......xn)表示mlp中的权重和偏差的向量,xi∈r和则定义相反的向量是x'(x1',x2',......xn'),其元素为x′i=mini+maxi-xi。obl方法的算法可以是描述如下:

1)在n维搜索中生成向量x(x1,x2,.......xn)及其相反的x'(x1',x2',......xn')空间。

2)评估两点,hsi(x)和hsi(x')的适应性。

3)如果hsi(x)hsi(x'),则用x替换x';否则,继续x。

因此,矢量及其相反的矢量被同时评估以获得拟合者。

(4)mlp的hcbbo概述

为了保证具有一定质量和多样性的初始种群,使用混沌系统和obl方法的组合来生成初始种群。通过融合局部搜索策略和bbo算法的迁移和变异阶段,hcbbo的勘探和开发能力可以很好地平衡。

本发明提供的hcbbo算法框架为:

(1):输入:栖息地规模n,最大迁移率e和i(迁入率和迁出率),最大变异率mmax;

(2):通过公式等式的混沌映射初始化一组mlp(栖息地);

(3):对于每个栖息地,根据公式(11)计算其相对参数的均方误差。而适应度函数的基本规则是保持较小的mse值。然后精英栖息地由hsi的价值确定;

(4):根据公式(8)中的迁入率和迁出率;概率性地使用迁入率和迁出率来修改每个非精英栖息地;

(5):选择mlp的数量,并通过混沌映射重新计算(变异)一些权重或偏差;

(6):保存一些低mse的mlp;

(7):如果达到了预定义的代数或者找到了可接受的问题解决方案,则该循环将终止,否则,请转到(3)进行下一次迭代;

(8):输出:具有最小mse(hsi)的mlp。

下面结合实验分析对本发明的应用效果作详细的描述。

1、本发明提出的hcbbo算法,利用matlab软件环境(v2009)开发了一系列实验。系统配置如下:a)cpu:inteli7b)ram:4gbc)操作系统:windows8.基于[9,24,25]中描述的工作,选择四个公开可用的分类大数据集基准的系统:1)气球,2)虹膜,3)心脏和4)车辆。所有这些数据集可以从加利福尼亚大学欧文分校(uci)机器学习知识库免费获得,从而确保可复制性。表1列出了这些数据集的特征。

表1

在本发明中,比较了上面表1中描述的基准数据集的4种算法bbo,pso,ga和hcbbo的性能。由于为这些算法手动选择合适的参数是耗时的,所以初始参数和属性结构对于经典的bbo算法和hcbbo算法(调整为表2),都是在中选择的。

表2

为了提高实验的准确性,每个算法运行20次。每个算法的运行时间(rt)和收敛曲线如图4-8所示。从图4可以看出,hcbbo的平均计算时间比bbo得到的最佳时间低8~13%。也低于本实验中所有其他算法的计算时间。运行时间的减少可以归因于obb提高了hcbbo的搜索能力。

图5-图8中的收敛曲线表明,在所有算法中,hcbbo在所有数据集上收敛速度最快。在图5中,在相同的实验条件下,hcbbo150代后达到最佳参数值,而bbo在200代后仍不能收敛到最佳值。对于其他经典问题,hcbbo收敛速度更快(图6-图8)。统计上讲,hcbbo在所有分类数据集上表现最好,因为它能够比其他任何算法更好地避免局部最小值。对于所选择的数据集,hcbbo分类结果优于所有其他算法。

本发明提出了一种hcbbo算法来训练mlp。四个基准的大数据集(气球,虹膜,心脏和车辆)被用来调查hcbbo在培训mlp的有效性。性能结果与三种最先进的算法进行了统计比较:bbo,pso和ga。a)这是第一个将混合混沌系统与bbo算法相结合的研究工作来训练mlp;b)在hcbbo的变异算子中使用了名为obl的方法来提高算法的收敛性。c)结果表明,与bbo,pso和ga相比,hcbbo具有更好的收敛能力。将来,将应用训练好的神经网络分析大型医学数据,并将更新颖的数据挖掘算法集成到hcbbo中。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1