一种基于人工免疫网络的多智能体数据挖掘方法

文档序号:8299105阅读:133来源:国知局
一种基于人工免疫网络的多智能体数据挖掘方法
【技术领域】
[0001] 本发明涉及数据挖掘领域,具体是涉及一种基于人工免疫网络的多智能体数据挖 掘方法。
【背景技术】
[0002] 随着大数据时代的来临,从大量数据中抽取或发现有用的关系或模式、知识成为 时下研宄的热点,这个过程也称为数据挖掘。其中,聚类和分类是数据挖掘的主要任务。将 人工免疫系统算法引入到数据挖掘领域是近年来的研宄热点。目前,关于人工免疫系统在 数据挖掘领域应用的算法都是以decastro的经典免疫网络算法aiNet为框架进行改进和 变型的,主要技术都是克隆选择、变异、网络抑制。然而,生物免疫系统是一个复杂的动态自 适应系统,要完全模拟出生物免疫系统的机制是很困难的。目前,众多的免疫网络算法模型 都只是从单一角度模拟了免疫系统某一部分的功能,对自然机理还没能很好的描述。而且, 目前众多的免疫网络算法都是基于随机概率操作,缺乏对人工免疫网络的动态行为分析, 导致数据的分类和聚类效果不佳。

【发明内容】

[0003] 本发明的目的在于克服现有技术之不足,通过将多智能体技术融合至人工免疫网 络算法中以适用于数据挖掘中的聚类、分类以及数据压缩。
[0004] 本发明解决其技术问题所采用的技术方案是提供一种基于人工免疫网络的多智 能体数据挖掘方法,具体包括以下步骤:
[0005] (1)将原始数据分为训练数据和测试数据,于训练数据中随机抽取一部分作为抗 体,其他作为抗原;将抗体排列成网格矩阵并对每个抗体在网格中进行编号;
[0006] (2)输入一抗原至网格矩阵中,依次计算其与网格矩阵中各抗体的亲和度和自信 值,并进行邻域克隆选择,生成一抗体集;
[0007] (3)对该抗体集进行邻域协作操作和/或领域竞争操作;
[0008] (4)重复步骤(2) -(3),直到每个抗原都和网格矩阵中每个抗体进行操作,所有 抗原训练完毕,得到记忆细胞集M' ;
[0009] (5)对记忆细胞集M'进行网络抑制操作,得到记忆细胞集M,其中记忆细胞集M中 每一抗体生成属于自己的类别标签;
[0010] (6)运用记忆细胞集M对测试数据进行聚类和分类。
[0011] 优选的,所述每一个输入的抗原是跟抗体在邻域内进行操作,对于网格矩阵中某 一抗体Amn的邻域定义为:Loc.Amn=(Am_n,Am_n,Am+n,Am+n),其中,
【主权项】
1. 一种基于人工免疫网络的多智能体数据挖掘方法,其特征在于包括以下步骤: (1) 将原始数据分为训练数据和测试数据,于训练数据中随机抽取一部分作为抗体,其 他作为抗原;将抗体排列成网格矩阵并对每个抗体在网格中进行编号; (2) 输入一抗原至网格矩阵中,依次计算其与网格矩阵中各抗体的亲和度和自信值,并 进行邻域克隆选择,生成一抗体集; (3) 对该抗体集进行邻域协作操作和/或邻域竞争操作; (4) 重复步骤(2) -(3),直到每个抗原都和网格矩阵中每个抗体进行操作,所有抗原 训练完毕,得到记忆细胞集M' ; (5) 对记忆细胞集M'进行网络抑制操作,得到记忆细胞集M,其中记忆细胞集M中每一 抗体生成属于自己的类别标签; (6) 运用记忆细胞集M对测试数据进行聚类和分类。
2. 根据权利要求1所述的基于人工免疫网络的多智能体数据挖掘方法,其特征在于: 所述每一个输入的抗原是跟抗体在邻域内进行操作,对于网格矩阵中某一抗体Am的邻域 走乂为 iLoc.A-z (A "+),其中, Ls是所述|WJ格矩阵的阶数。
3. 根据权利要求2所述的基于人工免疫网络的多智能体数据挖掘方法,其特征在于: 步骤(2)进一步包括以下子步骤: (2a)计算输入抗原与某一抗体邻域内各抗体的欧式距离为初始亲和度; (2b)以各个抗体初始亲和度的平均值为阈值,选择与输入抗原距离小于该阈值的抗体 作为待克隆抗体集; (2c)对待克隆抗体集中的每个抗体进行克隆增殖; (2d)对克隆增殖后的抗体进行变异; (2e)重新计算输入抗原与变异后各抗体的亲和度,以输入抗原与各变异抗体亲和度的 平均值为阈值,选取距离小于该阈值的抗体生成所述抗体集。
4. 根据权利要求3所述的基于人工免疫网络的多智能体数据挖掘方法,其特征在于: 所述克隆增值是3倍克隆增值。
5. 根据权利要求1所述的基于人工免疫网络的多智能体数据挖掘方法,其特征在于: 所述邻域协作包括赋予每个抗体一个自信度的属性并对抗体的自信度属性进行调整和迭 代的步骤。
6. 根据权利要求1所述的基于人工免疫网络的多智能体数据挖掘方法,其特征在于: 所述邻域竞争操作具体为: (3a)计算输入抗原与某一抗体邻域内各抗体的亲和度,并选择亲和度最高和最低的抗 体; (3b)对亲和度最高的抗体进行克隆并放入所述抗体集,重新计算抗原与所述抗体集内 的抗体的亲和度; (3c)根据重新计算后抗体集里面每个抗体亲和度大小的排名情况,选择亲和度最高的 抗体替代步骤①中亲和度最低的抗体。
7.根据权利要求1所述的基于人工免疫网络的多智能体数据挖掘方法,其特征在于: 步骤(6)具体是通过计算所述记忆细胞集M'中抗体两两之间的距离的平均值,当记忆细胞 集M'中两个抗体间的距离小于该平均值则删除其中亲和度较小的一个的方法获得所述记 忆细胞集M。
【专利摘要】本发明公开了一种将多智能体技术和人工免疫网络相结合的数据挖掘方法,将多智能体技术的典型策略融入到免疫网络中。算法引入了邻域克隆选择,操作过程从局部到整体,能够更加全面地模拟免疫网络的自然进化模型;同时在网络训练过程中增加了抗体间的竞争和协作操作,提高了网络的动态分析能力。该算法在数据挖掘中,既能提高数据聚类的准确性,也能够提高数据分类的精确度。
【IPC分类】G06F17-30
【公开号】CN104615679
【申请号】CN201510029881
【发明人】林小煌, 骆炎民
【申请人】华侨大学
【公开日】2015年5月13日
【申请日】2015年1月21日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1