用于检测场景中的感兴趣的对象的系统的制作方法

文档序号:9602560阅读:496来源:国知局
用于检测场景中的感兴趣的对象的系统的制作方法
【专利说明】
[0001] 政府权利
[0002] 本发明是在美国政府的REF ASPS项目(合同号为154318)下由政府支持做出的。 政府对本发明具有特定权利。
[0003] 相关申请的交叉参考
[0004] 这是于 2013 年 6 月 4 日提交的标题为 "A device for detecting pedestrians in an outdoor scene utilizing an 'Any Attention'mechanism',的美国临时申请 No. 61/830896的非临时专利申请。
[0005] 本发明的背景 (1)
技术领域
[0006] 本发明涉及一种检测系统,并且更具体地,涉及一种用于在场景的图像中检测特 定对象的系统。 (2)
【背景技术】
[0007] 视频系统和其它场景监测系统通常用于在特定场景中检测和识别对象。对象识别 接收输入图像并输出图像类别,然而对象检测(也称为对象定位)接收输入图像并且输出 在图像中的检测到特定对象类别的位置。例如,安全系统理想地检测人或物体在特定视场 内的存在,并且通知相关人员该入侵。然而,如果动物(例如鹿)进入安全区域,则通知警 报将被视为假警报。如可以想到的,假警报(或误报)趋向于使用户不敏感并且基本上使 安全系统贬值。因此,希望具有一种可以提供快速和有效的对象检测的系统。现有系统趋 向于在对象检测时具有一定程度的误差,如上所述,该误差使对象检测系统贬值。因此,一 直需要一种用于有效地检测场景中的感兴趣的对象的系统。

【发明内容】

[0008] 描述了一种用于检测场景中的感兴趣的对象的系统。该系统包括存储器和一个或 更多个处理器。在存储器上编码有可执行指令,使得当执行指令时,所述一个或更多个处理 器执行如本文中列出的操作。例如,系统接收场景的图像帧,并且从该图像帧提取特征,这 些特征为描述符。描述符被量化以产生视觉词(PH0W)特征的金字塔直方图。实现滑动窗 口协议,以使窗口在图像上滑动并且分析落入窗口内的PH0W特征。然后,该系统确定PH0W 特征是否表示感兴趣的对象,并且如果是的话,则将窗口指定为检测到的感兴趣的对象在 图像中的位置。
[0009] 确定PH0W特征是否表示感兴趣的对象要求多个操作,诸如,将窗口细分为一组网 格(bin)。在每个网格中编译PH0W特征的直方图,直方图表示在每个网格中发现的PH0W 特征的计数。通过卡方同质内核变换(Chi-Square homogeneous kernel transform)来 变换直方图。然后,将变换后的直方图馈送到支持向量机(SVM)分类器,以针对每个特征 生成SVM分数,该SVM分数表示图像中的对象与目标对象的相似度。利用正切S型曲线 (sigmoid)压缩(squash) SVM分数,使得SVM分数的范围在-1. 0至1. 0。然后,SMV分数被 收集到分数列表中。使用非极大值抑制缩减分数列表,以生成缩减的分数列表。最后,阈值 被应用至缩减的分数列表,以消除低于预定阈值的任何分数并且生成对象分数,该对象分 数表示场景中的特定对象是感兴趣的对象的可能性。
[0010] 在另一方面,被提取的特征是密集尺度不变特征变换(SIFT)描述符(DSIFT)。
[0011] 在又一方面,在提取特征时,以三个独立尺度提取特征。
[0012] 在另一方面,量化描述符以生成PH0W特征还包括以下操作:针对每个描述符执行 KD-树查询以识别与描述符最相似的学习的特征,所识别的特征为PH0W特征。
[0013] 此外,在实现滑动窗口协议时,图像帧被划分成多个条带,使得每个条带内均是在 图像帧中的该位置处能够运行的窗口。
[0014] 此外,该系统实现显著性掩码,以确定所述图像帧中的用于利用所述滑动窗口协 议进行处理的关注区域和所述图像帧中的将被所述滑动窗口协议忽略的区域。
[0015] 最后,如上所述,本发明还包括计算机程序产品和计算机实现方法。计算机程序产 品包括存储在非暂时性计算机可读介质上的可由具有一个或更多个处理器的计算机执行 的计算机可读指令,使得当执行指令时,所述一个或多个处理器执行本文中列出的操作。另 选地,该计算机实现方法包括以下动作:使计算机执行这种指令并且执行所产生的操作。
【附图说明】
[0016] 本发明的目标、特征和优点将从结合参考以下附图的本发明的多个方面的以下详 细描述变得明显,其中:
[0017] 图1是示出根据本发明的原理的系统的组件的框图;
[0018] 图2是具体实现根据本发明的原理的一方面的计算机程序产品的图解;
[0019] 图3是示出当在自然场景中检测到两个人时的检测器系统的图像;
[0020] 图4是示出根据本发明的原理的检测器系统的处理流程的框图;
[0021] 图5是示出根据本发明的原理的同质内核变换的处理流程的框图;
[0022] 图6是示出根据本发明的原理的多线程处理的图解;
[0023] 图7是针对根据本发明的原理的多线程化的DSIFT组件的框图;
[0024] 图8是针对根据本发明的原理的多线程化的描述符量化组件的框图;
[0025] 图9是针对根据本发明的原理的多线程滑动窗口组件的框图;以及
[0026] 图10是示出具有显著性掩码的关注模型的图解。
【具体实施方式】
[0027] 本发明涉及一种检测系统,并且更具体地,涉及一种用于在场景的图像中检测特 定对象的系统。提供以下描述以使本领域普通技术人员能够制造和使用本发明并且将其结 合到特定应用的上下文中。各种修改以及在不同应用中的各种使用对于本领域技术人员将 是显而易见的,并且在此定义的一般原理可以被应用至大范围的实施方式。因此,本发明不 旨在限于所提供的实施方式,而是旨在将符合与本文中公开的原理和新特征一致的最广范 围。
[0028] 在以下详细描述中,阐述大量具体细节以便提供对本发明的更彻底理解。然而,对 于本领域技术人员而言明显的是,本发明可以被实践,而不用必须限制于这些具体细节。在 其它实例中,以框图形式而不是详细地示出公知结构和设备,以便避免使本发明模糊。
[0029] 读者的注意力在于与本说明书同时提交并且与本说明书一起公开供公众检验的 所有论文和文件,并且所有这样的论文和文件的内容在此通过参考被结合。在本说明书中 公开的所有特征(包括任何所附权利要求、摘要和附图)都可以由用于相同、等效或类似目 的的可选特征来代替,除非另外明确说明。因此,除非明确说明,否则所公开的每个特征仅 是一系列等效或类似特征的一个示例。
[0030] 此外,在不明确说明用于执行特定功能的"装置"或用于执行特定功能的"步骤"的 权利要求中的任何元件都不被解释为如在35U. S. C.部分112的第6段中规定的"装置"或 "步骤"条款。具体地,在权利要求中的"步骤"或"动作"的使用在本文中不旨在援引35U. S.C. 112的第6段的规定。
[0031] 在详细描述本发明之前,提供了本发明的多个主要方面的描述。接着,介绍给读者 提供对本发明的一般理解。最后,提供本发明的具体细节以给出特定方面的理解。
[0032] (1)主要方面
[0033] 本发明具有三个"主要"方面。第一方面是用于在场景中检测感兴趣的对象(例 如,行人)的系统。该系统通常为计算机系统操作软件的形式或为"硬编码"指令集的形式。 该系统可以被结合到提供不同功能的广泛多种设备中。第二个主要方面是通常为软件形式 的使用数据处理系统(计算机)操作的方法。第三个主要方面是计算机程序产品。该计算 机程序产品通常表示存储在非暂时性计算机可读介质(诸如,光存储设备(例如,光盘(CD) 或数字多功能光盘(DVD))、或磁存储设备(诸如,软盘或磁带))中的计算机可读指令。另 外,计算机可读介质的非限制性示例包括硬盘、只读存储器(ROM)、以及闪存型存储器。这些 方面将在下面更详细地描述。
[0034] 在图1中提供示出本发明的系统(即,计算机系统100)的示例的框图。计算机系 统100被配置成执行计算、处理、操作和/或与程序或算法相关联的功能。在一方面,本文 中论述的特定处理和步骤被实现为驻留在计算机可读存储器单元内并且由计算机系统100 的一个或更多个处理器执行的一系列指令(例如,软件程序)。当被执行时,所述指令使得 计算机系统1〇〇执行特定动作,并且表现出特定行为,如本文中所述的。
[0035] 计算机系统100可以包括被配置成传输信息的地址/数据总线102。此外,一个或 更多个数据处理单元(诸如,处理器1〇4(或处理器))与
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1