基于聚类分析算法的组串群选优化联动控制技术

文档序号:26009765发布日期:2021-07-23 21:29阅读:120来源:国知局
基于聚类分析算法的组串群选优化联动控制技术

本发明涉及组串群选联动控制技术领域,尤其涉及基于聚类分析算法的群选优化联动控制技术。



背景技术:

生产线在批量生产工作中的选配案例个数十分庞大,在定时间内可形成成千上百的案例,如此大量的案例会存在少数的稳定的优质案例,有必要采用流式大数据的数据挖掘分析技术,从长期积累的大量生产数据中学习提取出特征规律,再根据这些规律结合当前生产线各选配过程状态,对选配环节各参数如在线组串、缓存件的数目、尺寸链的顺序作出预测,根据预测结果对选配生产过程作出反馈控制,最大化生产效率。

组串群选参数如组串数量、缓存件数量等直接决定了选配过程中的选配盘进料机构、下料机构、缓存等机构控制,进而决定了选配成功率。本发明首先利用聚类分析对历史选配过程信息进行数据挖掘、分析,并在大数据平台上实现,然后根据当前对本批次选配过程的情况,采用cbr机制预测串选参数,指导选配算法,反馈控制联动件,提高了选配效率的同时,解决了生产线联动控制技术的难题。



技术实现要素:

本发明所要解决的技术问题是针对背景技术中所涉及到的缺陷,提供一种基于聚类分析的组串群选优化联动控制技术,该技术根据选配生产评价指标筛选出一批优质案例,经过层层优化,形成一个良性的自学习过程,可以极大地提高选配模型预测的准确性,降低组选配验证集与测试集的数量和容量。

本发明为解决上述技术问题采用以下技术方案:

一种基于聚类分析的组串群选优化联动控制技术,其数据处理的基本流程为:

步骤1:从大数据存储服务器当中获取选配过程数据案例;

步骤2:联动控制系统对历史数据预处理,按预制条件剔除不合规定的选配指标案例;

步骤3:选配过程聚类规则自学习,即优化聚类中心;

步骤4:基于快速搜索与密度峰值cfsfdp聚类算法对装配线的数据进行分析;

步骤5:基于cbr机制进行组串群选参数预测;

步骤6:由在线组串数量预测、缓存尺寸链预测及组串群选参数预测数据产生优化选配方法;

步骤7:物联网系统将当前选配过程信息发送至大数据服务器,将学习优化后的参数部署至各选配流程控制设备,完成后跳到步骤1.

一种基于聚类分析算法的组串群选优化联动控制技术,其使用的cfsfdp聚类算法流程是:首先通过使用一个截断距离来计算每个点的局部密度,然后计算各数据点与局部密度高于它们的数据点之间的最小距离,接着根据计算出的每个点的局部密度和最小距离绘制决策图,并通过使用决策图中人工辅助选取聚类的中心,之后将剩余的非聚类中心的数据点划分到与之距离最近的聚类中心所在的簇中,最后再根据各簇的密度阈值将所得到的簇划分为簇核心和簇光晕两部分,从而得到最终的聚类结果。使用cfsfdp算法进行聚类时只需要计算一次距离,并且不需要进行迭代,因此算法的计算速度很快。

cfsfdp算法的运行流程如下所示:

数据点i的局部密度ρi有两种计算方式:基于截断核的计算方式和基于高斯核的计算方式。使用截断核计算局部密度ρi的方式如公式所示:

其中

δij为数据点之间的距离,dc为截断距离即距离阈值。使用该计算方式得到的数据点的局部密度ρi通常等于该数据点周围与之距离小于dc的数据点的个数,因此可以得出结论:与数据点xi的距离小于dc的点越多,得到的局部密度ρi就越大。使用高斯核计算局部密度ρi的方式如公式所示:

使用截断核计算局部密度和使用高斯核计算局部密度这两种计算方式的区别在于使用截断核计算得到的结果为离散值而使用高斯核计算得到的结果为连续值。

数据点与局部密度比其高的数据点之间的距离δi是通过计算数据点i与比该数据点局部密度高的其他数据点的距离得到的,数据点之间的距离δi可以根据公式计算得到。

数据点与局部密度比其高的数据点之间的距离δi为数据点i与比该数据点局部密度ρi更高的其他数据点的所有距离中的最小值,但对于局部密度ρi最高的点,数据点之间的距离δi取与其他数据点与之距离的最大值。

一种基于聚类分析算法的组串群选优化联动控制技术,其群选参数在线预测的流程为:

步骤1:选配过程数据案例初步筛选,要想使这些案例有价值为后续的优秀案例聚类分析服务,必须先剔除掉那|些较差的案例;

步骤2:选配过程案例距离的规则自学习,用基于划分的方法(partitioning-basedmethods),首先给出一个初始的分组方法,以后通过反复迭代的方法改变分组,使得每次改进之后的分组方案都比前一次好。

步骤3:基于快速搜索与密度峰值cfsfdp算法进行聚类分析,由于选配案例均是高纬度数据类型,因此选用余弦距离公式作为衡量两类案例之间的距离度量。

一种基于聚类分析算法的组串群选优化联动控制技术,其cbr机制进行组串群选参数预测的策略为:

步骤1:生成问题实例,输入加工要求、工件形状特征和材料信息作为求解问题的初始条件,用统一的知识表示方法加以组织,形成问题实例。

步骤2:实例的检索匹配,按照一定的检索匹配策略从实例库中搜索相似的零部件选配实例。当检索的相似实例较少或没有得到相似匹配实例时可以对检索条件进行修改调整,以选取更多的相似实例。

步骤3:实例修改与保存,对检索匹配出的零部件选择结果和装配参数等信息进行修改优化,使其更好地适合新情况。将修改后的信息作为新问题的解决方案,经过确认和验证,将新的问题及其解决方案组织成新的实例,存储在实例库中。

一种基于聚类分析算法的组串群选优化联动控制技术,其算法在大数据平台并行化的策略为:聚类中心的自动化选择过程主要需要为每个数据点计算三个参数:该数据点与其他数据点的距离dij、局部密度ρi以及距离δi。

第一为计算各数据点的dij具体过程,划分数据集分区分成p个,分布到p个worker节点;将完整的数据集拷贝到这p个分区;在每个分区划分到该分区的数据点与整个数据集其他数据点的距离,以点为键归约所有距离,master归约所有worker上的距离。

第二为计算局部密度ρi具体的过程,将上一步计算得到的dij矩阵广播到之前的p个worker节点,在每个分区的数据点对应的exp(-(dij/dc)2)矩阵,使用breeze并行计算各数据点的局部密度ρi,并返回ρi给主机,master对所有ρi进行降序排列。

第三为计算局部密度δi具体的过程,将上一步计算得到的按局部密度降序的排名num广播到之前的p个worker节点,然后在每个分区为该分区内的数据点取得num比其大的数据点,在每个分区为该分区内的数据点对应的距离dij排序,按照公式求距离δi,以点为键规约所有距离,master归约所有worker上的距离δi。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:

1.本发明建立一种基于聚类分析算法的组串群选优化联动控制技术,该技术根据生产指标对实时数据进行聚类分析,产生高效、稳定的选配方案。

2.本发明利用匹配算法得到的优秀案例形成预测结果,并组件相应的测试集,经过预测方案的层层优化,极大地提高选配的准确性。

3.本发明通过优化聚类算法的并行化计算方式,使聚类的准确度、运行时间、加速比以及扩展比这几个方面的性能得到了提升。

附图说明

图1是本发明基于聚类分析算法的组串群选优化联动控制总体框图;

图2是本发明cfsfdp算法决策图;

图3是本发明基于基于聚类分析算法的组串群选参数在线预测流程。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明:

1)如图1所示为基于聚类分析算法的组串群选优化联动控制技术的总体框图,首先根据选配生产评价指标筛选出一批优质案例建立训练集:针对这批优质案例采用加权系数的k平均聚类算法划分为不同的簇,使得各样本之间到聚类中心的距离最短,然后使用各簇的聚类中心代表各簇建立对应的训练模型,这样不但进一步减少了历史案例库中案例的数量,而且找到一批相对高效、稳定的选配案例。最后根据当前选配线的生产情况,与这批典型案例进行匹配,根据匹配到的优秀案例形成生产预测结果,形成相应的测试集。这种预测方案,随着选配过程的层层优化,形成一个良性的自学习过程,可以极大地提高选配模型预测的准确性,降低组串选配验证集与测试集的数量和容量。并与神经网络、支撑向量机等传统智能算法进行比较,并同时应用于本小节以下方案中,分析应用效果。

2)其使用的聚类算法为cfsfdp算法,它的核心思想在于其对于聚类中心的刻画,该算法认为一个数据集中的聚类中心应该具备以下两个特征:

(1)该数据点本身的密度大,即在其周围的数据点的密度均不超过其自身。

(2)该数据点距离其他比其密度更高的数据点相对较远。

在选择出聚类中心后再将数据集中剩余的数据点划分到各个簇中,并对簇进行簇核心与簇光晕的划分。

cfsfdp算法根据数据点距离δi与数据点的局部密度ρi绘制决策图,通过使用决策图人工辅助选取数据集的聚类中心,绘制的决策图如图2所示。cfsfdp算法将δi值大且ρi值较大的点认定为簇的聚类中心,即在决策图中处于右上角区域与其他点分离明显的点。在确定数据集的聚类中心之后需要做的便将剩余的非聚类中心的数据点按照局部密度ρi从大到小一次划分到局部密度比其高且与之距离最近的数据点所在的簇中。在完成了非聚类中心数据点的划分后便得到了初步的聚类结果。

cfsfdp算法不同于基于密度的dbscan的聚类算法,其对于较低密度的数据点没有将它们判定为数据集的噪声,而是为初步聚类得到的每一个簇引入了一个光晕的概念,簇的光晕中就包含了其他算法中所定义的噪声以及数据集中的离散点。cfsfdp算法将一个簇划分为簇核心和簇光晕两个部分,属于簇核心部分的数据点的局部密度ρi较大,而属于簇光晕部分的数据点的局部密度ρi较小,局部密度ρi较小的点则包含了簇的噪声点以及数据集的离散点。

为了将簇划分为簇核心与簇光晕两部分,cfsfdp算法对聚类得到的簇引入了“边界区域”的概念。“边界区域”的定义为:数据点属于该簇,但在与该数据点的距离小于dc的范围内存在属于其他簇的数据点,由这些数据点构成的区域范围称为该簇的“边界区域”。在经过前面聚类中心选择和非聚类中心数据的划分得到初步的簇后,先对每个簇计算其“边界区域”,在取得每个簇的“边界区域”后,再将计算“边界区域”中局部密度的均值将其作为该簇的簇核心与簇光晕分割的阈值ρb。最后根据该簇中的数据点的局部密度ρi与该簇的密度阈值ρb的关系将该簇数据点划分到簇核心或者簇光晕中,若该簇内的数据点的局部密度ρi大于ρb,则该数据点划分到该簇的簇核心中,否则将其划分到该簇的簇光晕中。经过将各簇进行簇核心与簇光晕的划分之后便得到了cfsfdp算法最终的聚类结果。

3)如图3所示为基于聚类分析算法的组串群选参数在线预测流程,基于案例推理(casebasedreasoning,cbr)的预测是人工智能理论发展较为成熟的一个分支,它是一种基于过去的实际经验或经历的推理,使用的主要推测知识不是具体的规则而是案例,这些案例记录了过去发生的种种相关情节或情景。对基于案例推理来讲,求解一个问题的结论不是通过链式推理产生的,而是从记忆力或案例库中找到与当前场景最相关的案例。

本发明的组串选配参数预测,采用cbr思想,当前的各选配流程参数作为一个新实例出现,系统根据检索算法,从上一步聚类求解出的最优选配案例库中检索出与当前问题最相近的案例,依据求解该案例的经验和方法来解决当前问题。优势是,随着选配实践的增加,增量式的学习使案例库的覆盖度随选配系统使用逐渐增大,预测的效果也会越来越好。本发明的串选参数预测分为两层;第一层采用聚类分析方法,将案例库中的案例分为若干簇,并找到可以代表各簇的聚类中心。第二层采用最近相邻算法先判断当前选配过程案例与哪一聚类中心最为相似,找到与所给案例最为相似的一簇,然后在此簇下再次应用最近相邻案例所对应的各选配参数,就是串|选算法选出的预测结果,

4)快速搜索与密度峰值cfsfdp聚类算法是alex和alessandro提出的一个聚类算法,该算法的核心思想在于对聚类中心的选择上。cfsfdp算法认为一个簇的中心具有两个特点:1)一个簇的中心自身的密度大(该数据点周围的数据点的数量多),即作为聚类中心它是被密度不超过它的密度的数据点包围的。2)聚类中心与其他密度较大的数据点之间的距离较远。基于这两个特点cfsfdp算法中对于聚类中心的选择主要需要计算两个参数,数据点的局部密度ρi和距离δi。

为了计算局部密度ρi和距离δi,首先需要计算数据点之间的距离,在计算距离时本发明选择使用欧几里德距离公式。将数据集在n个分区备份,之后将计算距离的任务分成n个任务,每个分区独立执行一个任务,各分区计算完成后再将求得的距离合并。在计算每个数据点的局部密度ρi时,将数据集划分为几个partitions,并将之前计算得到的距离矩阵广播到每个分区,每个分区进行该分区内数据点的局部密度计算。计算距离δi时同样将数据集划分为几个partitions,并将距离矩阵和各数据点的局部密度广播到每个分区,每个分区进行该分区内数据点的距离计算。

当计算出了每个数据点的局部密度ρi和距离δi之后,本发明提出的cfsfdp算法需要计算归一化后的局部密度ρi和距离δi的乘积以及计算各自的概率密度。这些计算设计的过程也均是独立的,且互相之间没有依赖关系,可以进行并行计算。

在聚类中心选取完成之后,将选取的聚类中心广播到各个worker,然后每个worker将分区内的数据点划分到其所属的类簇中时只需要选择与该数据点距离最近的且局部密度比其大的聚类中心所在的类簇,划分的过程各worker是独立操作的,因此所有的worker可以并行执行该任务。

最后对于簇核心与簇光晕的划分可以将不同的簇放到不同的计算节点上并行化的进行划分,并且在划分过程中所涉及的簇内局部密度、“边界区域”的平均簇内局部密度、判断簇内数据点与平均簇内局部密度的关系这些计算过程均可以通过并行化计算的方式提高计算效率。

本发明创造的主要保护技术点:

(1)适应于聚类分析的组串群选优化联动控制方法及其数据处理流程。

(2)基于cfsfdp聚类算法的处理流程。

(3)对组串群选算法参数的预测处理。

(4)优化聚类算法的并行化计算方式。

本发明适用于串选优化的联动控制技术,该技术根据选配生产评价指标筛选出一批优质案例,经过层层优化,形成一个良性的自学习过程,可以极大地提高选配模型预测的准确性。

本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1