对象检测装置以及对象检测方法

文档序号:6534416阅读:137来源:国知局
对象检测装置以及对象检测方法
【专利摘要】提供一种能够提高从输入了的数据检测检测对象的精度的对象检测装置以及对象检测方法。对象检测装置(10)具有:多级别数据生成部(152),根据从数据输入部(150)取得了的输入数据,生成作为表现检测对象的程度的信息级别相互不同的多个数据;评价值计算部(153),针对多个数据的各个,计算表示检测对象可能性的程度的评价值;以及对象判定部(154),在针对信息级别相互不同的多个数据的各个计算出的评价值根据信息级别的上升而上升的上升程度是在输入数据中包括检测对象的情况的上升程度的下限值以上的情况下,判定为在输入数据中包括检测对象。
【专利说明】对象检测装置以及对象检测方法

【技术领域】
[0001] 本发明涉及从输入了的数据检测检测对象的对象检测装置以及对象检测方法。

【背景技术】
[0002] 以往,为了防止犯罪、照片或者视频的摄影检索或者整理等各种目的,研究了从图 像、声音或者传感器信号这样的数据,检测脸、人物等检测对象的技术。特别,近年来,广泛 研究了使用通过机器学习生成了的分类器而从图像检测检测对象的技术。例如,判定在图 像中是否拍摄了人物的分类器使用从拍摄了人物的多个学习用图像和未拍摄人物的多个 学习用图像的各个抽出了的特征量,通过对在特征量空间中将人物的特征量分布的空间和 其以外的空间分开的识别边界进行机器学习来生成。该分类器如果被输入从图像抽出了的 特征量,则根据该特征量在特征量空间中位于识别边界的哪一侧,判定在该图像中是否拍 摄了人物。
[0003] 但是,拍摄了人物的图像以及未拍摄人物的图像是各种各样的,一般难于发现能 够将它们完全分离的识别边界。特别,从拍摄了例如如在衣架上挂着的上衣等那样与人物 类似的物品的图像抽出了的特征量相对识别边界位于人物的特征量分布的空间侧的可能 性高,有误判定为在该图像中拍摄了人物的可能。
[0004] 因此,例如,在专利文献1中,提出了与装置的设置环境的特性符合地使分类器学 习的物体检测装置。该物体检测装置在设置了监视照相机时使用来自监视照相机的图像而 使分类器学习。
[0005] 专利文献1 :日本特开2009-230284号公报


【发明内容】

[0006] 专利文献1记载的物体检测装置通过在设置监视照相机之后使用来自监视照相 机的图像而使分类器学习,能够降低如在设置场所中存在的衣架上挂起来的上衣那样,将 与作为检测对象的一个例子的人物类似的物品误判定为人物。但是,专利文献1记载的物 体检测装置在使分类器学习之后新配置了与检测对象类似的物品的情况下,未使用拍摄了 该物体的图像而使分类器学习,所以有将该物体误判定为检测对象的可能性。
[0007] 物体检测装置通过使用大量的图像来进行机器学习,能够提高检测对象的检测精 度。但是,拍摄了检测对象以外的物品的图像各种各样,难于针对拍摄了具有与从拍摄了检 测对象的图像抽出的特征量类似的特征量的物体的所有图像,以完全防止误判定的方式, 使分类器学习。产生这样的误判定的问题不仅存在于使用分类器来检测检测对象的情况, 而且也存在于在通过模式匹配法等其他方法检测检测对象的情况,进而该问题不仅存在于 从图像检测检测对象的情况,而且也存在于在从声音、传感器信号等各种数据检测检测对 象的情况。
[0008] 本发明的目的在于提供一种能够提高从输入了的数据检测检测对象的精度的对 象检测装置以及对象检测方法。
[0009] 用于解决上述课题的本发明提供一种判定在从数据输入部取得了的输入数据中 是否包括检测对象的对象检测装置。上述对象检测装置具有:多级别数据生成部,根据输入 数据,生成作为表现检测对象的程度的信息级别相互不同的多个数据;评价值计算部,针对 多个数据的各个,计算表示检测对象可能性的程度的评价值;以及对象判定部,在针对信息 级别相互不同的多个数据的各个计算出的评价值根据信息级别的上升而上升的上升程度 是在输入数据中包括检测对象的情况的上升程度的下限值以上的情况下,判定为在输入数 据中包括检测对象。
[0010] 另外,信息级别优选为多个数据的各个表现检测对象的细节的程度。
[0011] 或者,信息级别优选为多个数据的各个适合于检测对象的特征表现的程度。
[0012] 另外,对象判定部优选为针对每个信息级别,求出从关于该信息级别的评价值减 去关于比该信息级别低预定阶段的信息级别的评价值得到的差,将求出了的差的合计值以 及最大值中的某一个求出为上升程度。
[0013] 或者,优选为对象判定部从信息级别低的一方起,依次求出从关于该信息级别的 评价值减去关于比该信息级别低预定阶段的信息级别的评价值得到的差,每当求出该差 时,将求出了的差的累积值求出为上升程度,判定求出了的上升程度是否为下限值以上,在 求出了的上升程度是下限值以上的情况下,判定为在输入数据中包括检测对象。
[0014] 或者,优选为对象判定部将从关于全部的信息级别的评价值的最大值减去最小值 得到的差、以及关于全部的信息级别的评价值的最大值相对最小值的比中的某一个求出为 上升程。
[0015] 或者,优选为对象判定部在上升程度是下限值以上、并且关于针对信息级别相互 不同的多个数据的各个计算出的评价值的统计性代表值即代表评价值是预定值以上的情 况下,判定为在输入数据中包括检测对象,在上升程度小于下限值的情况、或者代表评价值 小于预定值的情况下,判定为在输入数据中不包括检测对象。
[0016] 另外,优选为输入数据是图像数据,多级别数据生成部生成信息级别越高则清晰 度越高、且信息级别越低则清晰度越低的清晰度相互不同的多个数据作为信息级别相互不 同的多个数据。
[0017] 进而,优选为多级别数据生成部生成对输入数据分别应用了信息级别越高则滤波 器尺寸越小、且信息级别越低则滤波器尺寸越大的平均化滤波器的多个数据作为清晰度相 互不同的多个数据。
[0018] 或者,优选为多级别数据生成部生成信息级别越高则对输入数据重叠越少的量的 噪声、信息级别越低则对输入数据重叠越多的量的噪声的多个数据作为信息级别相互不同 的多个数据。
[0019] 或者,优选为输入数据是图像数据,多级别数据生成部生成信息级别越高则图像 的可懂度越高、且信息级别越低则图像的可懂度越低的图像的可懂度相互不同的多个数据 作为信息级别相互不同的多个数据。
[0020] 进而,优选为多级别数据生成部生成信息级别越高则使输入数据的像素值的阶度 数越多、且信息级别越低则使输入数据的像素值的阶度数越少的多个数据作为图像的可懂 度相互不同的多个数据。
[0021] 或者,优选为多级别数据生成部生成信息级别越高则使对在输入数据中表示检测 对象的部分进行掩膜重叠的程度越低、且信息级别越低则使对在输入数据中表示检测对象 的部分进行掩膜重叠的程度越高的多个数据作为信息级别相互不同的多个数据。
[0022] 或者,优选为多级别数据生成部生成关于检测对象的特征量,生成针对特征量使 信息量相互不同的多个数据作为信息级别相互不同的多个数据,以使信息级别越高则使特 征量表示的信息量越大、且信息级别越低则使信息量越小。
[0023] 进而,优选为多级别数据生成部生成信息级别越高则对特征量乘以越大、且信息 级别越低则对特征量乘以越小的1以下的正的系数的多个数据作为使信息量相互不同的 多个数据。
[0024] 或者,优选为输入数据是图像数据,在多级别数据生成部中,信息级别越高则对输 入数据以越小的程度进行几何变换、且信息级别越低则对输入数据以越大的程度进行几何 变换来生成多个数据作为信息级别相互不同的多个数据。
[0025] 进而,优选为几何变换是使图像旋转的变换,在多级别数据生成部中,作为几何变 换了的多个数据,生成信息级别越高则图像的旋转角度越小、且信息级别越低则图像的旋 转角度越大的多个数据。
[0026] 或者,优选为几何变换是将图像变换为梯形的变换,在多级别数据生成部中,作为 几何变换了的多个数据,生成信息级别越高则梯形的底边与上边之比越接近1、且信息级别 越低则梯形的底边与上边之比越远离1的多个数据。
[0027] 或者,优选为输入数据是时系列信号,在多级别数据生成部中,作为信息级别相互 不同的多个数据,生成信息级别越高对输入数据应用了通过频带越宽的带通滤波器、且信 息级别越低对输入数据应用了通过频带越窄的带通滤波器的多个数据。
[0028] 或者,优选为输入数据是时系列信号,在多级别数据生成部中,作为信息级别相互 不同的多个数据,生成信息级别越高则以越高的采样频率采样了输入数据、且信息级别越 低则以越低的采样频率采样了输入数据的多个数据。
[0029] 或者,优选为输入数据是时系列信号,在多级别数据生成部中,作为信息级别相互 不同的多个数据,生成以信息级别越高则使输入数据的振幅越大、且信息级别越低则使输 入数据的振幅越小的方式,使输入数据的振幅分别衰减了的多个数据。
[0030] 或者,优选为输入数据是声音信号,在多级别数据生成部中,作为信息级别相互不 同的多个数据,生成以信息级别越高则使输入数据的振幅越小、且信息级别越低则使输入 数据的振幅越大的方式,使输入数据的振幅分别放大而产生了削波的多个数据。
[0031] 或者,优选为输入数据是时系列信号,在多级别数据生成部中,作为信息级别相互 不同的多个数据,生成信息级别越高则使分割输入数据的值可取的范围的阶段数越多、且 信息级别越低则使阶段数越少地针对输入数据分别量化了的多个数据。
[0032] 另外,优选为评价值计算部具有以如果输入了多级别数据生成部生成的数据则输 出评价值的方式,使用至少包括检测对象的数据而预先学习了的分类器。
[0033] 或者,优选为还具有预先存储根据包括检测对象的数据生成了的参照数据的存储 部,评价值计算部将多级别数据生成部生成的数据与参照数据类似的程度计算为评价值。 [0034] 根据用于解决上述课题的本发明的其他方式,提供在对象检测装置中,判定在从 数据输入部取得了的输入数据中是否包括检测对象的对象检测方法。在上述对象检测方法 中,包括:根据输入数据,生成作为表现检测对象的程度的信息级别相互不同的多个数据, 针对多个数据的各个,计算表示检测对象可能性的程度的评价值,在针对信息级别相互不 同的多个数据的各个计算出的评价值根据信息级别的上升而上升的上升程度是检测对象 包含于输入数据中的情况的上升程度的下限值以上的情况下,判定为在输入数据中包括检 测对象。
[0035] 根据用于解决上述课题的本发明的其他方式,提供使对象检测装置判定在从数据 输入部取得了的输入数据中是否包括检测对象的对象检测用计算机程序。上述对象检测用 计算机程序包括使计算机执行下述内容的命令:根据输入数据,生成作为表现检测对象的 程度的信息级别相互不同的多个数据,针对多个数据的各个,计算表示检测对象可能性的 程度的评价值,在针对信息级别相互不同的多个数据的各个计算出的评价值根据信息级别 的上升而上升的上升程度是检测对象包含于输入数据中的情况的上升程度的下限值以上 的情况下,判定为在输入数据中包括检测对象。
[0036] 本发明的对象检测装置以及对象检测方法起到能够提高从输入了的数据检测检 测对象的精度这样的效果。

【专利附图】

【附图说明】
[0037] 图1A是示出信息级别和评价值的关系的一个例子的图形。
[0038] 图1B是示出信息级别和评价值的关系的一个例子的图形。
[0039] 图2是第一实施方式的对讲机的概略结构图。
[0040] 图3是第一实施方式的对讲机的控制部的概略结构图。
[0041] 图4A是拍摄了人物的脸的图像的例子。
[0042] 图4B是未拍摄人物的脸的图像的例子。
[0043] 图5是示出滤波器尺寸和评价值的关系的一个例子的图形。
[0044] 图6A是拍摄了人物的脸的图像的例子。
[0045] 图6B是未拍摄人物的脸的图像的例子。
[0046] 图7是示出滤波器尺寸和评价值的关系的一个例子的图形。
[0047] 图8是示出滤波器尺寸和评价值的差分累积值的关系的一个例子的图形。
[0048] 图9是示出滤波器尺寸和评价值的差分累积值的关系的一个例子的图形。
[0049] 图10是示出第一实施方式的对讲机的对象检测处理的动作的流程图。
[0050] 图11是用于说明掩膜重叠区域的示意图。
[0051] 图12是示出第二实施方式的对讲机的对象检测处理的动作的流程图。
[0052] 图13是第三实施方式的监视系统的概略结构图。
[0053] 图14是第三实施方式的监视装置的控制部的概略结构图。
[0054] 图15是示出第三实施方式的监视装置的对象检测处理的动作的流程图。
[0055] 图16是第四实施方式的监视系统的概略结构图。
[0056] 图17是第四实施方式的中枢装置的控制部的概略结构图。
[0057] 图18是示出第四实施方式的中枢装置的对象检测处理的动作的流程图。
[0058] 图19是第五实施方式的悲鸣传感器的概略结构图。
[0059] 图20是第五实施方式的悲鸣传感器的控制部的概略结构图。
[0060] 图21是示出第五实施方式的悲鸣传感器的对象检测处理的动作的流程图。
[0061] 图22是第六实施方式的人体传感器的概略结构图。
[0062] 图23是第六实施方式的人体传感器的控制部的概略结构图。
[0063] 图24是示出第六实施方式的人体传感器的对象检测处理的动作的流程图。
[0064] 符号说明
[0065] 10 :对讲机;
[0066] 11、21、41 :摄像部;
[0067] 12 :输出部;
[0068] 13、22、42、53、62、72 :接口部;
[0069] 14、24、44、54、64、74 :存储部;
[0070] 15、25、45、55、65、75 :控制部;
[0071] 150、250、550、650、750 :数据输入部;
[0072] 151、251、551、651、751 :切出部;
[0073] 152、252、552、652、752 :多级别数据生成部;
[0074] 153、253、553、653、753 :评价值计算部;
[0075] 154、254、554、654、754 :对象判定部;
[0076] 155 :鸣动控制部;
[0077] 20、40 :监视装置;
[0078] 23、43、51、63、73 :通信部;
[0079] 255、655、755 :通知控制部;
[0080] 555 :显示控制部;
[0081] 30、50:中枢装置;
[0082] 52 :显示部;
[0083] 60 :悲鸣传感器;
[0084]61:集音部;
[0085] 70 :人体传感器;
[0086] 71 :信号取得部。

【具体实施方式】
[0087] 以下,参照附图,说明本发明的一个实施方式的对象检测装置。
[0088] 对象检测装置根据成为检测处理的对象的输入数据,求出检测对象特有的特征 量,将求出了的特征量输入到通过机器学习生成了的分类器,计算表示检测对象可能性的 程度的评价值,根据计算出的评价值,判定在输入数据中是否包括检测对象。
【发明者】在精心 研究的结果发现,如果根据输入数据生成信息级别相互不同的多个数据,并根据多个数据 的各个计算评价值,则该信息级别变化所致的评价值的变化的方式在包括检测对象的输入 数据和不包括检测对象的输入数据中大幅不同。数据的信息级别是该数据表现检测对象的 特征的程度,是该数据表现检测对象的特征的细节的程度(可表现的程度)、或者该数据适 合于检测对象的特征表现的程度。
[0089] 图1A以及图1B示出表示数据的信息级别和数据的检测对象可能性的程度的评价 值的关系的一个例子。图1A的图形100表示在输入数据中包括检测对象的情况的信息级别 和评价值的关系的一个例子,图1B的图形101表示在输入数据中不包括检测对象的情况的 信息级别和评价值的关系的一个例子。在图1A以及图1B中,横轴是信息级别,纵轴是评价 值。如图1A所示,在输入数据中包括检测对象的情况下,在信息级别上升了时,评价值处于 呈现急剧的上升的倾向。另一方面,如图1B所示,在输入数据中不包括检测对象的情况下, 即使信息级别上升,评价值也不呈现在输入数据中包括检测对象的情况的程度的急剧的上 升。另外,不论评价值自身的高低如何,都发现这样的倾向。即,在尽管在输入数据中包括 检测对象,但关于根据输入数据求出了的检测对象的特征量在特征量空间中相对识别边界 位于并非检测对象的一侧的情况下,评价值处于在信息级别上升了时呈现急剧的上升的倾 向。另一方面,在尽管在输入数据中不包括检测对象,但关于根据输入数据求出了的检测对 象的特征量在特征量空间中相对识别边界位于检测对象侧的情况下,该评价值处于即使信 息级别上升也不呈现急剧的上升的倾向。
[0090] 因此,本发明的一个实施方式的对象检测装置根据输入数据生成信息级别相互不 同的多个数据,针对生成了的每个数据,求出关于检测对象的特征量,将求出了的特征量输 入到通过机器学习生成了的分类器,分别计算评价值。然后,对象检测装置求出计算出的评 价值根据信息级别的上升而上升的上升程度,在求出了的上升程度是在输入数据中包括检 测对象的情况的上升程度的下限值以上的情况下,判定为在输入数据中包括检测对象。即, 在对象检测装置中,并非通过关于检测对象的特征量在特征量空间中相对识别边界位于哪 一侧,而通过变更了信息级别时的特征量相对识别边界的位置的变化,判定在输入数据中 是否包括检测对象。由此,提高对象检测装置从输入数据检测检测对象的精度。
[0091] 以下,参照附图,说明安装了本发明的第一实施方式的对象检测装置的对讲机。该 对讲机设置于门厅等,在呼叫按钮被按压了时,对门厅等进行摄影,判定在摄影了的图像中 是否拍摄了人的脸。然后,该对讲机在摄影了的图像中拍摄了人的脸的情况下,使在室内设 置了的蜂鸣器鸣动而对家人通知来访者的访问,另一方面,在摄影了的图像中未拍摄人的 脸的情况下,判定为开玩笑地按压呼叫按钮而不使蜂鸣器鸣动。即,本实施方式的对讲机将 输入数据作为图像数据,将检测对象设为人物的脸。
[0092] 图2是示出本实施方式的对讲机的概略结构的图。对讲机10如图2所示,具有摄 像部11、输出部12、接口部13、存储部14以及控制部15。以下,详细说明对讲机10的各部。 [0093] 摄像部11是对设置了对讲机10的门厅等进行摄影的照相机,例如具有二维地排 列而输出与受光了的光量对应的电信号的光电变换兀件(例如CCD传感器、C-M0S等)、和 用于在该光电变换元件上使监视区域的像成像的成像光学系。摄像部11与接口部13连接, 将摄影了的摄影图像送到接口部13。
[0094] 能够将摄影图像设为阶度级或者彩色的多阶度的图像。在本实施方式中,使摄影 图像成为具有横320像素X纵240像素,具有8比特的亮度分辨率的阶度级图像。但是, 作为摄影图像,也可以使用具有该实施方式以外的分辨率以及阶度的例子。
[0095] 输出部12是报告部的一个例子,具有例如蜂鸣器。输出部12配置于房屋内,与接 口部13连接,如果从接口部13输入了蜂鸣器鸣动信号,则使蜂鸣器鸣动而对家人报告来访 者的访问。
[0096] 接口部13具有与摄像部11以及输出部12连接的接口电路、例如视频接口以及音 频接口或者通用串行总线这样的依照串行总线的接口电路。接口部13与控制部15经由例 如总线连接,将从摄像部11接受了的摄影图像送到控制部15。另外,接口部13将从控制部 15接受了的蜂鸣器鸣动信号输出到输出部12。
[0097] 存储部 14 具有 ROM (Read Only Memory,只读存储器)、RAM (Random Access Memory,随机访问存储器)等半导体存储器。存储部14存储用于控制对讲机10的计算机 程序以及各种数据,在与控制部15之间输入输出这些信息。在各种数据中包括脸的参照数 据。
[0098] 控制部15是对象检测装置的例子,具有CPU (Central Processing Unit,中央处理 单兀)、DSP (Digital Signal Processor,数字信号处理器)、MCU (Micro Control Unit,微 控制单元)等至少一个处理器及其周边电路。控制部15将从接口部13接受了的摄影图像 存储到存储部14。然后,控制部15读出在存储部14中存储了的摄影图像,判定在该摄影图 像中是否拍摄了脸,并且控制输出部12的蜂鸣器的鸣动。
[0099] 图3是示出控制部15的概略结构的图。如图3所示,在控制部15中,作为通过在 处理器上动作的软件安装的功能模块,具有数据输入部150、切出部151、多级别数据生成 部152、评价值计算部153、对象判定部154以及鸣动控制部155。
[0100] 另外,控制部15具有的这些各部也可以用独立的集成电路、固件、微型处理器等 构成。
[0101] 以下,详细说明控制部15的各部。
[0102] 数据输入部150从存储部14读出摄影图像,送到切出部151。
[0103] 切出部151从自数据输入部150取得了的摄影图像依次切出作为检测处理的对象 的预定尺寸的图像,将切出了的图像送到多级别数据生成部152。切出部151在摄影图像内 设定多个切出位置,并且在根据摄像部11的设置状态和来访者的个人差设想的摄影图像 上的来访者的脸的尺寸的范围内设定多个切出的图像的尺寸,依次切出设定了的位置和尺 寸的组合的数量的部分图像。例如,切出位置能够设定为从摄影图像的左上端在级别方向 上逐次错开切出的图像的级别方向的长度的一半的位置、以及从这些位置进而在垂直方向 上逐次错开切出的图像的垂直方向的长度的一半的位置。以下,将切出部151切出了的图 像称为部分图像。在本实施方式中,部分图像是输入数据的例子。
[0104] 多级别数据生成部152根据输入数据,生成信息级别相互不同的多个数据,将生 成了的数据与信息级别对应起来送到评价值计算部153。以下,将信息级别相互不同的多个 数据称为多级别数据。本实施方式的多级别数据生成部152根据从作为输入数据的摄影图 像切出了的部分图像,生成多个信息级别相互不同的图像(以下称为个别级别图像),将原 来的部分图像以及生成了的个别级别图像生成为多级别数据。
[0105] 在本实施方式的多级别数据生成部152中,作为多级别数据,生成信息级别越高 则清晰度越高、且信息级别越低则清晰度越低的、清晰度相互不同的多个图像。多级别数据 生成部152生成通过对部分图像实施平均化处理而降低了清晰度的个别级别图像。例如, 多级别数据生成部152通过对部分图像分别应用信息级别越高则滤波器尺寸越小、且信息 级别越低则滤波器尺寸越大的平均化滤波器,生成清晰度相互不同的多个个别级别图像。 如果将平均化滤波器的滤波器尺寸设为n (例如n是2?30的整数),则在个别级别图像的 各像素中设定处于在部分图像中以对应的像素为中心的n像素Xn像素的范围的像素的像 素值的平均值。即,使滤波器尺寸越大,该平均化滤波器的通过频带越窄,该个别级别图像 成为模糊的图像而清晰度变低,所以该个别级别图像能够表现脸的特征的程度变低而信息 级别变低。例如,信息级别被决定为1至30这30个阶段。于是,信息级别为1时的滤波器 尺寸被设定为30,每当信息级别变大1时,滤波器尺寸被设定为变小1的值。另外,在信息 级别是作为最高的值的30时,利用未应用平均化滤波器的原来的部分图像。
[0106] 评价值计算部153针对在多级别数据中包含的各数据的每一个,计算表示检测 对象可能性的程度的评价值,将各评价值与信息级别对应起来发送到对象判定部154。本 实施方式的评价值计算部153具有作为作为对人物的脸的识别有用的一个以上的特征 量的脸特征量使用了类哈尔(Haar-Like)特征量的实值Adaboost(自适应增强算法) (Real-Adaboost)分类器。类哈尔特征量是在图像区域中任意地设定了的多个邻接矩形 区域之间的亮度差。关于类哈尔特征量的详细,例如,在Paul Viola and Michael Jones, ''Rapid Object Detection using a Boosted Cascade of Simple Features",IEEE CVPR, vol. 1,pp. 511-518,2001 中公开。
[0107] 实值Adaboost分类器由多个弱分类器、和将各弱分类器的判定结果综合而判定 的强分类器构成。在各弱分类器中,使用针对各弱分类器的每一个预先决定了的类哈尔特 征量,根据图像计算特征量。各弱分类器在对应的部分图像中拍摄了脸的可能性越高则输 出越高的值,可能性越低则输出越低的值。另一方面,强分类器将利用各弱分类器的输出值 的总和作为评价值输出。另外,该评价值取至少三个以上的值,例如连续值。
[0108] 另外,关于将与哪个邻接矩形区域有关的类哈尔特征量用作各弱分类器,根据拍 摄了脸的多个学习用脸图像以及未拍摄脸的多个学习用非脸图像(以下将学习用脸图像 以及学习用非脸图像统称为学习用图像)通过事先学习决定。学习步骤的概略如以下所 述。
[0109] (1)进行事先学习的计算机针对各学习用图像,在图像区域中设定多个邻接矩形 区域,分别计算与设定了的各邻接矩形区域有关的类哈尔特征量。
[0110] (2)计算机决定针对各学习用图像的权重。权重的初始值针对各学习用图像成为 相同的值。
[0111] (3)计算机关于设定了的邻接矩形区域的各个,针对与该邻接矩形区域有关的每 个类哈尔特征量,根据关于学习用脸图像设定了的权重,计算学习用脸图像的概率密度分 布W+j。另外,j是与类哈尔特征量的值对应的编号。同样地,计算机关于设定了的邻接矩 形区域的各个,针对与该邻接矩形区域有关的类哈尔特征量的每个值,根据关于学习用非 脸图像设定了的权重,计算学习用非脸图像的概率密度分布w-j。另外,计算机也可以通过 将各类哈尔特征量的值可取的范围分割为多个而对各类哈尔特征量进行量化,计算概率密 度分布w+j以及概率密度分布W」。
[0112] (4)计算机针对各类哈尔特征量,根据学习用脸图像的概率密度分布W?和学习用 非脸图像的概率密度分布W」,根据以下的式,计算评价值Z。
[0113] 【式1】

【权利要求】
1. 一种对象检测装置,判定在从数据输入部取得的输入数据中是否包括检测对象,其 特征在于,具有: 多级别数据生成部,根据所述输入数据,生成作为表现所述检测对象的程度的信息级 别相互不同的多个数据; 评价值计算部,针对所述多个数据的各个,计算表示所述检测对象可能性的程度的评 价值;以及 对象判定部,在针对所述信息级别相互不同的多个数据的各个计算出的所述评价值根 据所述信息级别的上升而上升的上升程度是在所述输入数据中包括所述检测对象的情况 的所述上升程度的下限值以上的情况下,判定为在所述输入数据中包括所述检测对象。
2. 根据权利要求1所述的对象检测装置,其特征在于, 所述对象判定部针对每个所述信息级别,求出从该信息级别的所述评价值减去比该信 息级别低预定阶段的信息级别的所述评价值得到的差,将求出了的所述差的合计值以及最 大值中的某一个求出为所述上升程度。
3. 根据权利要求1所述的对象检测装置,其特征在于, 所述对象判定部从所述信息级别低的一方起,依次求出从该信息级别的所述评价值减 去比该信息级别低预定阶段的信息级别的所述评价值得到的差,每当求出该差时,将求出 了的所述差的累积值求出为所述上升程度,判定求出了的所述上升程度是否为所述下限值 以上,在求出了的所述上升程度是所述下限值以上的情况下,判定为在所述输入数据中包 括所述检测对象。
4. 根据权利要求1所述的对象检测装置,其特征在于, 所述对象判定部将从全部的所述信息级别的所述评价值的最大值减去最小值得到的 差、以及全部的所述信息级别的所述评价值的最大值相对最小值的比中的某一个求出为所 述上升程度。
5. 根据权利要求1所述的对象检测装置,其特征在于, 所述对象判定部在所述上升程度是所述下限值以上、并且针对所述信息级别相互不同 的多个数据的各个计算出的所述评价值的统计性代表值即代表评价值是预定值以上的情 况下,判定为在所述输入数据中包括所述检测对象,在所述上升程度小于所述下限值的情 况、或者所述代表评价值小于所述预定值的情况下,判定为在所述输入数据中不包括所述 检测对象。
6. 根据权利要求1?5中的任意一项所述的对象检测装置,其特征在于, 所述信息级别是所述多个数据的各个表现所述检测对象的细节的程度。
7. 根据权利要求6所述的对象检测装置,其特征在于, 所述输入数据是图像数据, 所述多级别数据生成部生成所述信息级别越高则清晰度越高、且所述信息级别越低则 清晰度越低的清晰度相互不同的多个数据作为所述信息级别相互不同的多个数据。
8. 根据权利要求7所述的对象检测装置,其特征在于, 所述多级别数据生成部生成对所述输入数据分别应用了所述信息级别越高则滤波器 尺寸越小、且所述信息级别越低则滤波器尺寸越大的平均化滤波器的多个数据作为所述清 晰度相互不同的多个数据。
9. 根据权利要求6所述的对象检测装置,其特征在于, 所述多级别数据生成部生成所述信息级别越高则对所述输入数据重叠越少的量的噪 声、所述信息级别越低则对所述输入数据重叠越多的量的噪声的多个数据作为所述信息级 别相互不同的多个数据。
10. 根据权利要求6所述的对象检测装置,其特征在于, 所述输入数据是图像数据, 所述多级别数据生成部生成所述信息级别越高则图像的可懂度越高、且所述信息级别 越低则图像的可懂度越低的图像的可懂度相互不同的多个数据作为所述信息级别相互不 同的多个数据。
11. 根据权利要求10所述的对象检测装置,其特征在于, 所述多级别数据生成部生成所述信息级别越高则使所述输入数据的像素值的阶度数 越多、且所述信息级别越低则使所述输入数据的像素值的阶度数越少的多个数据作为所述 图像的可懂度相互不同的多个数据。
12. 根据权利要求1?5中的任意一项所述的对象检测装置,其特征在于, 所述信息级别是所述多个数据的各个适合于所述检测对象的特征表现的程度。
13. 根据权利要求12所述的对象检测装置,其特征在于, 所述多级别数据生成部生成所述信息级别越高则使对在所述输入数据中表示所述检 测对象的部分进行掩膜重叠的程度越低、且所述信息级别越低则使对在所述输入数据中表 示所述检测对象的部分进行掩膜重叠的程度越高的多个数据作为所述信息级别相互不同 的多个数据。
14. 根据权利要求12所述的对象检测装置,其特征在于, 所述多级别数据生成部生成所述检测对象的特征量,生成针对所述特征量使所述信息 量相互不同的多个数据作为所述信息级别相互不同的多个数据,以使所述信息级别越高则 使所述特征量表示的信息量越大、且所述信息级别越低则使所述信息量越小。
15. 根据权利要求14所述的对象检测装置,其特征在于, 所述多级别数据生成部生成所述信息级别越高则对所述特征量乘以越大、且所述信息 级别越低则对所述特征量乘以越小的1以下的正的系数的多个数据作为使所述信息量相 互不同的多个数据。
16. 根据权利要求12所述的对象检测装置,其特征在于, 所述输入数据是图像数据, 在所述多级别数据生成部中,所述信息级别越高则对所述输入数据以越小的程度进行 几何变换、且所述信息级别越低则对所述输入数据以越大的程度进行几何变换来生成多个 数据作为所述信息级别相互不同的多个数据。
17. -种对象检测方法,在对象检测装置中,判定在从数据输入部取得的输入数据中是 否包括检测对象,其特征在于,包括: 根据所述输入数据,生成作为表现所述检测对象的程度的信息级别相互不同的多个数 据, 针对所述多个数据的各个,计算表示所述检测对象可能性的程度的评价值, 在针对所述信息级别相互不同的多个数据的各个计算出的所述评价值根据所述信息 级别的上升而上升的上升程度是所述检测对象包含于所述输入数据中的情况的所述上升 程度的下限值以上的情况下,判定为在所述输入数据中包括所述检测对象。
【文档编号】G06T7/00GK104412302SQ201380034610
【公开日】2015年3月11日 申请日期:2013年6月28日 优先权日:2012年6月29日
【发明者】黑川高晴, 宗片匠 申请人:西科姆株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1