基于split-merge策略的人群分组检测方法

文档序号:9235702阅读:464来源:国知局
基于split-merge策略的人群分组检测方法
【技术领域】
[OOOU 本发明属于图像处理技术及模式识别领域,特别设及一种基于split-merge策略 的人群分组检测方法。
【背景技术】
[0002] 单人行为识别是计算机视觉领域备受关注的前沿方向,已有多年的研究历史,而 近年来,由于视频监督、人机交互、基于视频的内容检索的需求越来越大,群体行为识别渐 渐成为了计算视觉和模式识别的研究热点之一。作为群体行为识别的基础,人群分组检测 该一研究方面也受到了研究学者们越来越多的关注。但是由于一般场景的复杂性、人数的 不固定型、人之间交互关系的多变性,检测人群分组该一研究领域具有极大的挑战。
[0003] 在目前现存的人群分组检测算法中,有一系列算法是基于F-化rmation, F-化rmation是Kendon在1990年提出的一个概念;当两个甚至更多的人维持一定的空间 和方向关系,他们之间围成的区域就是所谓的F-化rmation, F-formation由S个空间区域 构成,也就是o-space, p-space and r-space。其中最重要的部分是o-space,例如几个人 进行交谈时,他们的目光方向大概会汇集到一点,而他们中间围成的凸形区域既o-space。 检测不同的群体是靠寻找o-space实现的,一旦找到一个o-space,也就意味着检测出一个 群组。但是该种方法只限于检测几个人"谈话"该种情况,局限性比较大。另外有些方法虽 然不再局限于某种特定类型的群组,但是对于包含人数较多的群组,效果并不是很理想。还 有一些方法是利用人的轨迹特征,根据人的运动方向和速度来进行分群检测,但该种方法 主要适用于人物是运动的状态。

【发明内容】

[0004] 对于一般的场景而言,由于存在各种不同的人群,比如较为普遍的"排队"、"谈 话"、"走路"等,传统的方法大多是针对某一种特定形式的人群进行检测,尚且存在很大的 局限。本发明的目的在于提出一种基于split-merge策略的人群分组检测方法。其特征是, 该方法包括如下步骤:
[0005] 步骤1将视频监控场景中的个体分为静态和动态两种,分别W社会距离模型和社 会力量模型为基础,模拟量化场景中个体之间的交互关系。对于动态、静态该两种状态的 人,最后分别用一个权值矩阵把表示个体之间交互程度的权值聚集起来;
[0006] 步骤2将场景中两种状态的人分别用无向权值图表示,图的顶点表示人,顶点之 间的权值,也就是上一步计算出来的权值,表示个体之间的交互程度,检测人群分组的问题 就转化为对无向权值图的聚类问题,本文采用基于split-merge策略的方法对无向权值图 进行聚类。
[0007] 作为本发明的进一步改进,所述步骤1具体包括:
[000引步骤11根据场景中人物的轨迹特征,W及人物的轨迹变化情况,将人分成动态、 静态两种状态;
[0009] 步骤12对于状态为静态的目标人物,基于社会距离模型(Social Distance Model),根据每个人的人脸方向W及位置,定义其社交区域,根据任意两人的社交区域相交 情况,量化其之间的交互关系。对场景中的目标人物两两计算,最后用一个权值矩阵来表示 所有的权值;
[0010] 步骤13对于状态为动态的目标人物,我们基于社会力量模型(Social Force Model)来模拟量化人之间的交互关系。社会力量模型解决的问题是;已知人群分组情况来 推测每个人的轨迹。而本文把人群分组检测看成该个问题的逆向问题;已知每个人的运动 轨迹,推测场景中的人群分组情况。
[0011] 作为本发明的进一步改进,所述步骤2具体包括:
[0012] 步骤21split阶段;根据量化后的每两个人之间的交互关系,也就是权值矩阵 中相应的权值,设定一个阔值,只要两个人之间的权值大于阔值,就把该两个目标人物分 到一个小的子组里面。若场景中一共有n个静态个体,该样场景中的静态个体就被分为 个子组;
[0013] 步骤22merge阶段;对上一步产生的所有子组进行合并,只要两个子组有交集,就 把该两个子组合并成一个较大的子组;
[0014] 步骤23不停的迭代上一步骤,直到最后形成的子组之间交集为空,那么最后的每 个子组就表示检测出了一个人群分组,对于最后无向权值图中不属于任何子组的孤立的顶 点,表示场景中不属于任何人群进行单独活动的个体。
[00巧]有益效果;
[0016] 由于一般场景中不止存在一种人群,而存在人数差异较大形式各不相同进行不 同交互活动的人群,现存的一些人群分组检测算法大多只局限于检测某种特定形式的 人群,或者是人物数量和组成都比较简单的人群。本发明基于运用在图像分割领域的 split-merge算法:先确定一个分裂合并的准则,即区域特征一致性的测度,当图像中某 个区域的特征不一致时就将该区域分裂成若干个相等的子区域,当相邻的子区域满足一 致性特征时则将它们合成一个大区域,直至所有区域不再满足分裂合并的条件为止。基于 此,本发明提出了一种基于split-merge策略的人群分组检测方法,能够实现对更为一般 的场景中的人群分组检测。在对场景中的人物模拟量化之后,用无向权值图表示,检测人群 分组就转化为基于图的聚类算法。传统的基于图的聚类算法一般对局部结构的相似性有很 好的表达。难W获取数据真实的全局相似性。而本文提出的基于split-merge策略的聚类 方法能把握全局,忽视局部差异。该方法适用于更为普遍的监控场景,而不再局限与某种特 定的人群,同样适用于包含人数比较多的人群。
【附图说明】
[0017] 图1发明的主流程图。
[0018] 图2基于社会距离模型定义人的社交区域。
[0019] 图3无向权值图表示场景中所有个体,然后基于split-merge策略进行无向权值 图聚。
[0020] 图4本文方法在Collectivity Activity dataset数据库上的检测实例。
【具体实施方式】
[0021] 下面结合附图和实例对本发明作进一步说明,应指出的是,所描述的实例仅旨在 便于对本发明的理解,而对其不起任何限定作用。
[002引基于split-merge策略的人群分组检测方法,包括如下步骤;
[0023] 步骤1将视频监控场景中的个体分为静态和动态两种,分别W社会距离模型和社 会力量模型为基础,模拟量化场景中个体之间的交互关系。对于动态、静态该两种状态的 人,最后分别用一个权值矩阵把表示个体之间交互程度的权值聚集起来;
[0024] 步骤2将场景中两种状态的人分别用无向权值图表示,图的顶点表示人,顶点之 间的权值,也就是上一步计算出来的权值,表示个体之间的交互程度,检测人群分组的问题 就转化为对无向权值图的聚类问题,采用基于split-merge策略的方法对无向权值图进行 聚类。如图1,是双语词典的构建过程图所示:
[0025] 权值矩阵的构建过程包括:
[0026] 步骤11根据场景中人物的轨迹特征,通过计算一定时间内人物的轨迹变化情况, 将人分成动态、静态两种状态;
[0027] 步骤12对于状态为静态的目标人物,基于社会距离模型(Social Distance Model),根据每个人的人脸方向W及位置,定义其社交区域,根据任意两人的社交区域相交 情况,量化其之间的交互关系。对场景中的目标人物两两计算,最后用一个权值矩阵来表示 所有的权值;
[002引步骤13对于状态为动态的目标人物,我们基于社会力量模型(Social Force Model)来模拟量化人之间的交互关系。社会力量模型解决的问题是;已知人群分组情况来 推测每个人的轨迹。而本文把人群分组检测看成该个问题的逆向问题;已知每个人的运动 轨迹,推测场景中的人群分组情况。
[0029] 步骤12基于社会距离模型量化静态人之间社会交互程度。具体的操作过程有:
[0030] (1)用集合N = (1,...,n}表示场景中所有静态的人。假设已知其中个体i的人 脸方向和位置信息,定义一个楠圆区域E (。,a, b),该个楠圆模拟了 i该个人的社交区域范 围。。是楠圆的中屯、,(a, b)分别是楠圆的长轴短轴。因为通常情况下人的注意力主要集 中在他的前面,所W楠圆中屯、应当沿着人的面部朝向移动一定距离C。图2表示了两个人的 社交区域。
[0031] (2)对任意的两个人i和j,引入距离馬,其中ij表示i和j该两个人的距 y 离,j'表示射线。与楠圆E(Ci,a,b)的交点,如果Ru的大小在区间[(U]内,就说明i和 j存在交互。两个人离得越近,存在交互的可能性越大。我们用权值量化两个人的交互程
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1