基于split-merge策略的人群分组检测方法

文档序号：9235702阅读：464来源：国知局

基于split-merge策略的人群分组检测方法
【技术领域】
[OOOU 本发明属于图像处理技术及模式识别领域，特别设及一种基于split-merge策略的人群分组检测方法。
【背景技术】
[0002] 单人行为识别是计算机视觉领域备受关注的前沿方向，已有多年的研究历史，而近年来，由于视频监督、人机交互、基于视频的内容检索的需求越来越大，群体行为识别渐渐成为了计算视觉和模式识别的研究热点之一。作为群体行为识别的基础，人群分组检测该一研究方面也受到了研究学者们越来越多的关注。但是由于一般场景的复杂性、人数的不固定型、人之间交互关系的多变性，检测人群分组该一研究领域具有极大的挑战。
[0003] 在目前现存的人群分组检测算法中，有一系列算法是基于F-化rmation， F-化rmation是Kendon在1990年提出的一个概念；当两个甚至更多的人维持一定的空间和方向关系，他们之间围成的区域就是所谓的F-化rmation, F-formation由S个空间区域构成，也就是o-space, p-space and r-space。其中最重要的部分是o-space,例如几个人进行交谈时，他们的目光方向大概会汇集到一点，而他们中间围成的凸形区域既o-space。检测不同的群体是靠寻找o-space实现的，一旦找到一个o-space,也就意味着检测出一个群组。但是该种方法只限于检测几个人"谈话"该种情况，局限性比较大。另外有些方法虽然不再局限于某种特定类型的群组，但是对于包含人数较多的群组，效果并不是很理想。还有一些方法是利用人的轨迹特征，根据人的运动方向和速度来进行分群检测，但该种方法主要适用于人物是运动的状态。

【发明内容】

[0004] 对于一般的场景而言，由于存在各种不同的人群，比如较为普遍的"排队"、"谈话"、"走路"等，传统的方法大多是针对某一种特定形式的人群进行检测，尚且存在很大的局限。本发明的目的在于提出一种基于split-merge策略的人群分组检测方法。其特征是，该方法包括如下步骤：
[0005] 步骤1将视频监控场景中的个体分为静态和动态两种，分别W社会距离模型和社会力量模型为基础，模拟量化场景中个体之间的交互关系。对于动态、静态该两种状态的人，最后分别用一个权值矩阵把表示个体之间交互程度的权值聚集起来；
[0006] 步骤2将场景中两种状态的人分别用无向权值图表示，图的顶点表示人，顶点之间的权值，也就是上一步计算出来的权值，表示个体之间的交互程度，检测人群分组的问题就转化为对无向权值图的聚类问题，本文采用基于split-merge策略的方法对无向权值图进行聚类。
[0007] 作为本发明的进一步改进，所述步骤1具体包括：
[000引步骤11根据场景中人物的轨迹特征，W及人物的轨迹变化情况，将人分成动态、静态两种状态；
[0009] 步骤12对于状态为静态的目标人物，基于社会距离模型（Social Distance Model)，根据每个人的人脸方向W及位置，定义其社交区域，根据任意两人的社交区域相交情况，量化其之间的交互关系。对场景中的目标人物两两计算，最后用一个权值矩阵来表示所有的权值；
[0010] 步骤13对于状态为动态的目标人物，我们基于社会力量模型（Social Force Model)来模拟量化人之间的交互关系。社会力量模型解决的问题是；已知人群分组情况来推测每个人的轨迹。而本文把人群分组检测看成该个问题的逆向问题；已知每个人的运动轨迹，推测场景中的人群分组情况。
[0011] 作为本发明的进一步改进，所述步骤2具体包括：
[0012] 步骤21split阶段；根据量化后的每两个人之间的交互关系，也就是权值矩阵中相应的权值，设定一个阔值，只要两个人之间的权值大于阔值，就把该两个目标人物分到一个小的子组里面。若场景中一共有n个静态个体，该样场景中的静态个体就被分为个子组；
[0013] 步骤22merge阶段；对上一步产生的所有子组进行合并，只要两个子组有交集，就把该两个子组合并成一个较大的子组；
[0014] 步骤23不停的迭代上一步骤，直到最后形成的子组之间交集为空，那么最后的每个子组就表示检测出了一个人群分组，对于最后无向权值图中不属于任何子组的孤立的顶点，表示场景中不属于任何人群进行单独活动的个体。
[00巧]有益效果；
[0016] 由于一般场景中不止存在一种人群，而存在人数差异较大形式各不相同进行不同交互活动的人群，现存的一些人群分组检测算法大多只局限于检测某种特定形式的人群，或者是人物数量和组成都比较简单的人群。本发明基于运用在图像分割领域的 split-merge算法：先确定一个分裂合并的准则，即区域特征一致性的测度，当图像中某个区域的特征不一致时就将该区域分裂成若干个相等的子区域，当相邻的子区域满足一致性特征时则将它们合成一个大区域，直至所有区域不再满足分裂合并的条件为止。基于此，本发明提出了一种基于split-merge策略的人群分组检测方法，能够实现对更为一般的场景中的人群分组检测。在对场景中的人物模拟量化之后，用无向权值图表示，检测人群分组就转化为基于图的聚类算法。传统的基于图的聚类算法一般对局部结构的相似性有很好的表达。难W获取数据真实的全局相似性。而本文提出的基于split-merge策略的聚类方法能把握全局，忽视局部差异。该方法适用于更为普遍的监控场景，而不再局限与某种特定的人群，同样适用于包含人数比较多的人群。
【附图说明】
[0017] 图1发明的主流程图。
[0018] 图2基于社会距离模型定义人的社交区域。
[0019] 图3无向权值图表示场景中所有个体，然后基于split-merge策略进行无向权值图聚。
[0020] 图4本文方法在Collectivity Activity dataset数据库上的检测实例。
【具体实施方式】
[0021] 下面结合附图和实例对本发明作进一步说明，应指出的是，所描述的实例仅旨在便于对本发明的理解，而对其不起任何限定作用。
[002引基于split-merge策略的人群分组检测方法，包括如下步骤；
[0023] 步骤1将视频监控场景中的个体分为静态和动态两种，分别W社会距离模型和社会力量模型为基础，模拟量化场景中个体之间的交互关系。对于动态、静态该两种状态的人，最后分别用一个权值矩阵把表示个体之间交互程度的权值聚集起来；
[0024] 步骤2将场景中两种状态的人分别用无向权值图表示，图的顶点表示人，顶点之间的权值，也就是上一步计算出来的权值，表示个体之间的交互程度，检测人群分组的问题就转化为对无向权值图的聚类问题，采用基于split-merge策略的方法对无向权值图进行聚类。如图1，是双语词典的构建过程图所示：
[0025] 权值矩阵的构建过程包括：
[0026] 步骤11根据场景中人物的轨迹特征，通过计算一定时间内人物的轨迹变化情况，将人分成动态、静态两种状态；
[0027] 步骤12对于状态为静态的目标人物，基于社会距离模型（Social Distance Model)，根据每个人的人脸方向W及位置，定义其社交区域，根据任意两人的社交区域相交情况，量化其之间的交互关系。对场景中的目标人物两两计算，最后用一个权值矩阵来表示所有的权值；
[002引步骤13对于状态为动态的目标人物，我们基于社会力量模型（Social Force Model)来模拟量化人之间的交互关系。社会力量模型解决的问题是；已知人群分组情况来推测每个人的轨迹。而本文把人群分组检测看成该个问题的逆向问题；已知每个人的运动轨迹，推测场景中的人群分组情况。
[0029] 步骤12基于社会距离模型量化静态人之间社会交互程度。具体的操作过程有：
[0030] (1)用集合N = (1，...，n}表示场景中所有静态的人。假设已知其中个体i的人脸方向和位置信息，定义一个楠圆区域E (。，a, b)，该个楠圆模拟了 i该个人的社交区域范围。。是楠圆的中屯、，（a, b)分别是楠圆的长轴短轴。因为通常情况下人的注意力主要集中在他的前面，所W楠圆中屯、应当沿着人的面部朝向移动一定距离C。图2表示了两个人的社交区域。
[0031] (2)对任意的两个人i和j，引入距离馬，其中ij表示i和j该两个人的距 y 离，j'表示射线。与楠圆E(Ci，a，b)的交点，如果Ru的大小在区间[(U]内，就说明i和 j存在交互。两个人离得越近，存在交互的可能性越大。我们用权值量化两个人的交互程

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈昌红;陈乔;刘峰;
技术所有人：南京邮电大学;
我是此专利的发明人

上一篇：股市情绪的确定方法和装置的制造方法
上一篇：基于类间可分性的完全二叉树svm多分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。