检测装置以及检测方法

文档序号：9649164阅读：381来源：国知局

检测装置以及检测方法
【专利说明】检测装置以及检测方法
[0001]本申请主张以在2014年9月9日申请的日本专利申请特愿2014-183717为基础的优先权，并将该基础申请的全部内容援引于本申请。
技术领域
[0002]本发明涉及检测装置以及检测方法。
【背景技术】
[0003]以往已知一种被称为智能(intelligent) AF的技术，其是AF(AutoFocus，自动聚焦)技术的一种，通过解析摄像图像来推断操作者希望拍摄的被摄体(关注被摄体)，并使焦点(focus)自动对准到该推断出的关注被摄体。根据智能AF，能够通过简易的操作来拍摄关注被摄体。
[0004]但是，在智能AF中，在操作者希望拍摄的被摄体(关注被摄体)与被推断为关注被摄体的被摄体不一致的情况下，操作者需要进行使焦点变更到正确的关注被摄体的操作。
[0005]此外，在智能AF中，在使焦点对准到摄像图像所包含的多个被摄体中的任意一个来进行拍摄之后，即使想要使焦点对准到其他被摄体来进行拍摄，也难以变更焦点。
[0006]此外，在智能AF中，在使用自拍器(self timer)进行拍摄时，在自拍器起动后难以变更焦点。
[0007]为了解决这样的课题，例如，JP特开2011-35771号公报中公开的摄像装置构成为，输出分别表示从图像中识别出的多个被摄体的声音，操作者能够基于该声音输出来选择关注被摄体。
[0008]但是，在上述专利文献1的摄像装置中，存在输出表示从图像中识别出的被摄体的声音需要花费时间、在识别出相互类似的多个被摄体的情况下难以任选其一这样的课题。因此，需要简单并且确切地从摄像图像中检测操作者希望拍摄的被摄体。此外，不局限于从摄像图像中检测拍摄对象的被摄体，即使对于一般的图像而言，也需要简单并且确切地从图像中检测所希望的检测对象。

【发明内容】

[0009]本发明鉴于上述的课题而作，其目的在于，使得能够简单并且确切地从图像中检测所希望的检测对象。
[0010]本发明的一个方式是一种从图像中对检测对象进行检测的检测装置，具备:输入部，其输入指定所述检测对象的语句；判别部，其根据通过所述输入部而输入的语句，来判别所述检测对象的指定所涉及的属性；选择部，其根据由所述判别部判别出的属性，来选择所述检测对象的检测方法；和检测部，其通过由所述选择部选择的检测方法，从所述图像中对所述检测对象进行检测。
[0011]本发明的另一方式是一种从图像中对检测对象进行检测的检测装置，具备:变换部，其将通过输入声音的声音输入部而输入的声音变换为语句；提取部，其从由所述变换部变换得到的语句中提取名称以外的特征；和检测部，其从所述图像中对具有与由所述提取部提取出的特征类似的特征的所述检测对象进行检测。
[0012]本发明的又一方式是一种是从图像中对检测对象进行检测的检测方法，包括:输入处理，输入对所述检测对象进行指定的语句；判别处理，根据通过所述输入处理而输入的语句，来判别所述检测对象的指定所涉及的属性；选择处理，根据通过所述判别处理而判别出的属性，来选择所述检测对象的检测方法；和检测处理，利用通过所述选择处理而选择的检测方法，从所述图像中对所述检测对象进行检测。
[0013]根据下面的【具体实施方式】以及对应的附图，本发明的上述以及其他目的和新颖的特征会变得更加清楚。但应清楚认识到，附图仅仅用于例示，并不旨在定义本发明的限制。
【附图说明】
[0014]若结合以下附图来考虑以下的详细记述，则能够得到本申请的更深一层的理解。
[0015]图1是例示实施方式所涉及的检测装置的硬件结构的框图。
[0016]图2是例示实施方式所涉及的检测装置的功能结构的框图。
[0017]图3A是用于说明词语“甜瓜”的属性判别信息的图。图3B是用于说明词语“红色”的属性判别信息的图。图3C是用于说明词语卜''y”的属性判别信息的图。
[0018]图4A是例示特征信息表的结构的图。图4B是例示检测优先度表的结构的图。
[0019]图5是用于说明实施方式所涉及的检测装置所执行的摄像处理的流程图。
[0020]图6是用于说明实施方式所涉及的检测装置所执行的对象(object)检测处理的流程图。
[0021]图7是用于说明实施方式所涉及的检测装置所执行的名称检测处理的流程图。
[0022]图8是表示目标(target)图像的一个例子的图。
[0023]图9是表不目标图像的其他例子的图。
[0024]图10是表不目标图像的其他例子的图。
[0025]图11是表示目标图像的其他例子的图。
[0026]图12是表示目标图像的其他例子的图。
【具体实施方式】
[0027]以下，参照附图来详细地说明本发明的实施方式所涉及的检测装置以及检测方法。另外，对图中相同或者同等的部分赋予相同的符号。
[0028]本实施方式所涉及的检测装置构成为如图1所示。检测装置1具备摄像部10、处理部20和接口 30。
[0029]摄像部10通过按照后述的操作部32所受理的基于操作者的操作来拍摄被摄体，从而生成拍摄了被摄体的摄像图像(实时取景图像、取景图像)。
[0030]摄像部10包含光学透镜11和图像传感器12。
[0031]光学透镜11具备使从被摄体射出的光进行会聚的透镜、和用于调整焦点、曝光、白平衡等拍摄设定参数的外围电路。
[0032]图像传感器12例如具备CO) (ChargeCoupledDevice，电荷親合元件)、CMOS (ComplementaryMetalOxideSemiconductor，互补型金属氧化物半导体)等。图像传感器12获取通过光学透镜11使光会聚而成像的被摄体的光学像，并将获取到的光学像的电压信息通过模拟/数字变换器(未图示)来变换为数字图像数据。然后，将所得到的数字图像数据输出到图像输出部24。
[0033]处理部20对摄像部10所生成的摄像图像实施后述的检测处理。此外，处理部20通过执行各种程序，实现检测装置1的各种功能。
[0034]处理部20包含CPU (CentralProcessingUnit，中央处理器)21、暂时存储部22、主存储部23和图像输出部24。
[0035]CPU21通过执行存储于主存储部23的控制程序对检测装置1整体进行控制。此夕卜，CPU21通过执行存储于主存储部23的、包含轮廓检测程序、词素解析程序在内的各种程序，来实现检测装置1的各种功能。
[0036]暂时存储部22例如具备RAM(RandomAccessMemory，随机存取存储器)等。暂时存储部22作为CPU21的工作存储器而发挥作用，暂时存储包含通过摄像部10而生成的实时取景图像在内的各种图像数据、从声音处理部34提供的声音数据以及程序等。
[0037]主存储部23具备非易失性存储器(例如闪存、硬盘)，固定地存储包含检测装置1整体的控制所需要的控制程序、词素解析程序在内的各种程序以及包含对照图像数据在内的各种固定数据等。主存储部23将所存储的程序、数据提供给CPU21、图像输出部24。
[0038]图像输出部24通过对摄像部10拍摄到的图像数据实施规定处理(例如，使分辨率降低的处理)来生成实时取景图像。图像输出部24将基于摄像部10的摄像图像提供给暂时存储部22进行存储，并且将生成的实时取景图像提供给后述的显示部31进行显示。
[0039]此外，图像输出部24读出存储于暂时存储部21、主存储部23的图像数据，生成与该图像数据相对应的RGB (R (Red，红色)，G(Green，绿色)，B(Blue，蓝色))信号，并输出到后述的显示部31。
[0040]接口 30受理来自外部的操作输入、图像以及声音数据输入，并且向外部输出声音数据、图像数据。
[0041]接口 30包含显示部31、操作部32、声音输入部33、声音处理部34、声音输出部35和外部接口 36。
[0042]显示部31例如具备IXD(LiquidCrystalDisplay，液晶显示器)、CRT (CathodeRayTube，电子射线管)、有机 EL (ElectroLuminescence，电致发光)显不器等，基于从图像输出部24提供的图像数据，显示包含实时取景图像在内的各种图像。
[0043]操作部32受理基于操作者的操作输入。操作部32具备键盘，并且具备包含快门按钮、取消按钮、用于选择检测装置1的动作模式的模式选择按钮等在内的各种操作按钮。操作部32将所受理的操作输入提供给摄像部10、CPU21等。
[0044]另外，显示部31和操作部32也可以通过彼此重叠配置的所谓的触摸面板来构成。
[0045]声音输入部33具备麦克风，从外部受理包含操作者的声音的模拟声音信号的输入。所输入的模拟声音信号被送出到声音处理部34。
[0046]声音处理部34将从声音输入部33提供的模拟声音信号变换为数字声音信号，并提供给暂时存储部22。此外，声音处理部34读出存储于暂时存储部22、主存储部23的数字声音信号，变换为模拟声音信号而输出到声音输出部35。
[0047]声音输出部35具备扬声器、头戴式耳机等，将从声音处理部34提供的模拟声音信号输出到外部。
[0048]外部接口 36是用于与检测装置1的外部的设备交换数据的接口。外部接口 36例如将摄像图像变换为USB (UniversalSerialBus，通用串行总线)标准的数据，并经由USB线缆与外部的设备之间收发数据。
[0049]检测装置1在功能上构成为如图2所示。检测装置1具备识别部101、距离测定部102、输入部103、提取部104、判别部105、选择部106、特征信息存储部107、检测部108、执tx部109和拍摄部110。
[0050]另外，检测装置1虽然与通常的照相机同样地具有眨眼检测功能、人物检测功能等，但在下面，以本实施方式中特征性的、从摄像图像中对通过操作者声音输入的语句而指定的检测对象进行检测的功能为中心来进行说明。
[0051]识别部101将摄像部10所生成的摄像图像作为目标图像，对目标图像实施对象?颜色?脸部识别处理，来识别目标图像所包含的对象物0B。所谓目标图像，是指成为检测装置1所执行的检测处理的对象的图像。
[0052]例如，如后述的图8?图12所示的目标图像TGa?TGe(以下统称为目标图像TG)那样，目标图像是包含摄像部10拍摄到的各种

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：中野加奈子;村木淳;坂本升平;松田英明;
技术所有人：卡西欧计算机株式会社;
我是此专利的发明人

上一篇：虚拟摄像方法
上一篇：静止图像提取方法以及实现该方法的图像处理装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。