一种基于密度峰值聚类算法的交通流模式识别方法与流程

文档序号:16694404发布日期:2019-01-22 19:21阅读:434来源:国知局
一种基于密度峰值聚类算法的交通流模式识别方法与流程

本发明涉及一种聚类算法,尤其涉及一种基于密度峰值聚类算法的电梯交通模式识别方法。



背景技术:

电梯群控系统是现代高层建筑中必不可少的垂直运输工具。设计良好的电梯群控系统,不仅能为乘客提供优质的服务,而且增加了建筑物的使用价值。电梯群控系统的核心是电梯群控调度算法,交通流是影响电梯群控调度算法性能的一个重要因素。对建筑物内的交通流状况进行准确分类,在不同的交通流状况下选用合适的电梯群控调度算法,可有效提高电梯系统的服务质量和各项性能指标。

为了准确地识别交通流模式,研究人员提出了很多方法。由于其自身特性,模糊逻辑尤其适用于识别流量模式。xuy-g,luof.trafficpatternrecognitionmethodfornovelelevatorsystem[j].kongzhililunyuyingyong/controltheory&applications,2005,22(6):900-4.中提出了模糊逻辑规则来对交通模式进行分类,但没有考虑相关输入数据,例如一天中的时间或乘客到达或离开的速率。hikitas,komayak.anewelevatorgroup-supervisorycontrolsystemusingfuzzyrule-base[j].transactionsofthesocietyofinstrumentandcontrolengineers,1989,25(1):99-104.提出了另一种能够使用一组模糊规则,然而,这个模型缺乏基于典型标准的任何控制策略。根据统计学习理论,可以通过使用具有二次损失函数的支持向量机(svm)来预测需求,这被称为最小二乘支持向量机luof,xuy-g,caoj-z.elevatortrafficflowpredictionwithleastsquaressupportvectormachines;proceedingsofthemachinelearningandcybernetics,2005proceedingsof2005internationalconferenceon,f,2005[c].ieee.。tynit,ylinenj.methodandapparatusforallocatingpassengersbyageneticalgorithm[m].googlepatents.2005.设计了一个系统通过使用从实际输入需求获得的统计数据来获得来识别交通流模式。这种方法泛化能力强,克服了对训练数据的依赖性,但存在计算时间长的缺点,影响了交通流的在线分类。

国内学者中,秦臻等秦臻,赵建勇,严义.基于多值分类svm的电梯交通模式识别[j].计算机工程,2011,37(9):201-3.提出一种基于多值分类svm的电梯交通模式识别方法。采用直接多值分类svm对采集的电梯交通流数据进行分析,得到交通模式分类器,从而解决电梯交通流模式识别中多输入、多输出的非线性系统辨识问题。杨广全等杨广全,朱昌明,王向红,etal.基于粒子群k均值聚类算法的电梯交通模式识别[j].控制與決策,2007,22(10):1139-42.提出一种基于粒子群k均值聚类算法的电梯交通模式识别方法。该方法通过对此前一周的原始客流数据进行聚类分析,得到相应交通模式的聚类中心坐标。胡志刚,杨广全,乔现玲.基于小波支持向量机的电梯交通流预测模型[j].系统仿真学报,2009,19):6321-4.中考虑到电梯交通流本身所存在的非线性,复杂性和随机性,提出了一种基于小波支持向量机的电梯交通流预测模型。



技术实现要素:

本发明提出一种基于密度峰值聚类算法的交通流模式识别方法,与已有方法相比,密度峰值聚类算法只需要1个参数,易于实现,计算速度快,且具有稳定的聚类效果,能满足群控系统实时性的要求。该方法可作为电梯群控系统的一个模块,辅助电梯群控系统作出决策,以提高电梯群控系统在各种交通状况下的服务性能。

一种基于密度峰值聚类算法的电梯交通模式识别方法,包括以下步骤:

步骤1:根据下式计算计算距离矩阵;

dij=d(xi,xj)=||xi-xj||2

令数据集x=(x1,...,xn),xi是m维向量,表示一个数据点;

步骤2:根据下式计算每个数据点的局部密度ρi

其中,dc为截断距离;

步骤3:根据下式计算每个数据点与高密度点之间的距离δi

步骤4:画出判定图并选择类簇中心;

步骤5:把每个数据点都归属到最近的类簇中心;

步骤6:输出每个数据点所属类簇的向量y。

有益效果:

本发明提出一种基于密度峰值聚类算法的电梯交通流模式识别方法,具有以下优势:

第一,继承了密度聚类算法的优点(不需要指定聚类数并可以对任意形状数据聚类);

第二,可以较好适应不同类簇具有不同密度的数据集。

第三,适应任意度量作为距离。

第四,算法是确定性算法,而非迭代算法,计算量较小。第五,可排除异常值与噪声点。

本发明方法不需要任何先验知识就能准确识别交通模式。与已有方法相比,密度峰值聚类算法只需要1个参数,易于实现,计算速度快,且具有稳定的聚类效果,能满足群控系统实时性的要求。该方法可作为电梯群控系统的一个模块,辅助电梯群控系统作出决策,以提高电梯群控系统在各种交通状况下的服务性能。

附图说明

图1为实施例1某大厦多租户办公大楼2天的交通流数据图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

电梯交通模式识别是以电梯系统交通流特征数据为基础。交通流是指由乘客数、乘客出现的周期及乘客分布情况描述的状态量,反映了电梯群控系统所处的交通状况。

交通流的变化规律主要与建筑物的用途有关,在不同类型的大楼呈现出不同的特点。对于典型的办公大楼,主要的交通模式有:上行高峰模式、下行高峰模式、午间交通模式、层间交通模式以及空闲模式等。

在交通模式识别中,通常采用的交通流特征数据包括:单位时间内进入门厅的人数、离开门厅的人数以及层间移动的人数等。为了进一步识别2路和4路交通模式,可增加最大层和次大层客流数据。选取5分钟作为客流特征数据收集和交通模式识别的时间间隔。

密度聚类把类簇看成是数据空间中的稠密区域,这些区域的中间由只包含少量数据点的稀疏空间隔开。这类算法的优点是对类簇的分布形状没有任何要求。

提出最早的密度聚类算法是dbscan(density-basedspatialclusteringofapplicationswithnoise)。dbscan需要两个参数:eps和形成高密度区域所需要的最少点数(minpts),它由一个任意未被访问的点开始,然后探索这个点的eps邻域,如果eps邻域里有足够的点,则建立一个新的聚类,否则这个点被标签为杂音。如果一个点位于一个聚类的密集区域里,它的eps邻域里的点也属于该聚类,当这些新的点被加进聚类后,如果它(们)也在密集区域里,它(们)的eps邻域里的点也会被加进聚类里。这个过程将一直重复,直至不能再加进更多的点为止,这样,一个密度连结的聚类被完整地找出来。然后,一个未曾被访问的点将被探索,从而发现一个新的聚类或杂音。这种方法的优点是可以发现任意形状的类簇,不需要人工指定类簇的数目,以及有机制处理异常点。它的缺点是很难确定eps和minpts的值,如果类簇之间密度差别较大的话会无法确定异常值。vdbscan(varieddensitybasedspatialclusteringofapplicationswithnoise)可以检测到密度不同的类簇,并且也可以自动根据类簇的密度自动选择eps,缺点是计算复杂度太高。

本发明针对dbscan等密度聚类算法存在的问题,提出了一种基于密度峰值聚类算法的电梯交通模式识别方法,该算法将数据点局部密度定义为与其距离小于某阈值的数据点个数,聚类中心定义为那些具有局部密度极大值的数据点。算法首先计算每一数据点的局部密度及其与密度更高数据点的最小距离;然后通过两者绘制决策图,人工选择聚类中心;最后,对剩余数据点,按照与它距离最近的密度更高数据点所属类别进行归类。该算法有以下优点:第一,继承了密度聚类算法的优点(不需要指定聚类数并可以对任意形状数据聚类)。第二,可以较好适应不同类簇具有不同密度的数据集。第三,适应任意度量作为距离。第四,算法是确定性算法,而非迭代算法,计算量较小。第五,可排除异常值与噪声点。

具体地,dpc算法基于这样一个假设:对于一个数据集,聚类中心被一些低局部密度的数据点包围,而且这些局部低密度的点距离其他有局部高密度的点的距离都比较大。在这样的模型中,dpc主要有两个需要计算的量:第一,局部密度ρi;第二,与高密度点之间的距离δi。

令数据集x=(x1,...,xn),xi是m维向量,表示一个数据点。定义数据点之间的距离为欧氏距离

dij=d(xi,xj)=||xi-xj||2(1)

局部密度ρi的定义为

其中

dc称为截断距离。与第i个数据点的距离小于截断距离的数据点越多,那么此数据点的局部密度就越大。

与高密度点之间的距离δi定义为

即与密度比数据点i大的最近数据点的距离。对于局部密度最大的数据点,定义其δi为

在聚类过程中,同时具有相对较高的距离和局部密度作为聚类中心。而具有相对较高的距离,但是局部密度却较小的数据点作为异常点。对于那些非异常点,将会被归类到比他们的密度更大的最相近的类中心所属的类别中。

实验例:

如图1所示,实验所用数据为某大厦多租户办公大楼2天的交通流数据,从7点到19点采集数据,采集时间间隔为5分钟,一天得到144个数据,总共有288个交通流数据点。

由群体智能聚类算法的聚类结果可知,第1类对应上午非高峰时间段的混合交通模式,聚类中心坐标为(25.21,17.69,3.06);第2类对应下午非高峰时间段的混合交通模式,聚类中心坐标为(33.13,31.66,22.15);第3类对应午间交通交通模式,聚类中心坐标为(68.12,73.50,61.59);第4类对应上行的高峰模式,聚类中心坐标为(80.86,9.72,6.54);第5类对应下行高峰模式,聚类中心坐标为(21.21,67.66,15.78)。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1