一种自动识别装置的制作方法

文档序号:18419683发布日期:2019-08-13 20:31阅读:198来源:国知局
一种自动识别装置的制作方法

本实用新型涉及图像处理技术领域,尤其涉及一种自动识别装置。



背景技术:

现在在当前的各种智能手机上,可以做到图像识别物体的功能,但是它们都有各种依赖条件(或者说缺点):

必须在线,就是必须连接互联网。因为做图像识别的“计算”是在远程服务器,无法做到离线的“计算”。势必在有些必须离线,或者高速运算的场景下就不适合。

有些做到离线的产品,无法做到低功耗,长时间运行。因为“计算”的功耗耗费CPU。还有摄像头也无法做到长时间开启。对电池的消耗是非常大的,用1小时左右就无法工作了。

响应速度慢。当前无论是“在线”,还是“离线”的产品。都存在的问题是速度跟不上。“在线”产品需要有网络的开销,并且传输的是图片,数据量大,时间开销就大。“离线”产品的计算能力有限,计算力比较弱,所以响应时间也比较长。

成本高。智能手机的零售价中档一些的,都要1500+RMB。况且智能计算需要配置比较高的硬件。

如何使自动识别装置克服上述缺点就成为本领域技术人员亟待解决的技术问题之一。



技术实现要素:

本实用新型解决的技术问题是如何在进行自动识别时,降低功耗、提高响应速度、无需在线且降低成本。

为解决上述技术问题,本实用新型实施例提供一种自动识别装置,包括:摄像头、取景器、ARM处理器、快门开关和视觉处理器,其中:

所述摄像头用于拍摄待识别图像;

所述取景器用于辅助所述摄像头进行取景;

所述ARM处理器与所述摄像头进行电连接,用于对所述待识别图像进行预处理,并根据视觉处理器件处理后的信息得到识别结果;

所述快门开关与所述ARM处理器进行电连接且与所述摄像头进行物理连接,用于触发所述摄像头以及所述ARM处理器;

所述视觉处理器件与所述ARM处理器进行电连接,用于对预处理后的待识别图像进行卷积神经网络分析以提取特征数值,并根据特征数值计算分类概率。

可选地,所述摄像头的视觉角度与所述取景器的视角角度一致。

可选地,所述装置还包括:显示器,与所述ARM处理器进行电连接,以显示所述待识别图像和/或识别结果。

可选地,所述ARM处理器与所述视觉处理器件之间通过USB接口或者板载方式进行连接。

可选地,所述ARM处理器与所述快门开关之间通过GPIO接口进行连接。

可选地,所述装置还包括:外壳,所述取景器、所述快门开关和所述摄像头的镜头位于所述外壳外部,其余位于所述外壳内部。

可选地,所述装置还包括:扬声器,与所述ARM处理器进行电连接,用于语音输出所述识别结果。

可选地,所述装置还包括:电源,与所述ARM处理器和所述视觉处理器件进行电连接,用于分别为所述ARM处理器以及所述视觉处理器件提供电能。

可选地,所述ARM处理器为树莓派ZERO手机,所述视觉处理器件为神经计算棒,所述摄像头为CSI摄像头,所述取景器为旁轴光学取景器。

可选地,所述装置还包括:通信器件,与所述ARM处理器进行电连接,用于与外界进行信息传输。

与现有技术相比,本实用新型实施例的技术方案具有以下有益效果:

1)由于采用取景器,从而无需常开摄像头,可以随开随用;此外,ARM 处理器的工作功耗一般小于1w,视觉处理器件的工作功耗一般小于1w,因此大大降低了装置的功耗,相应提高了待机时间。

2)视觉处理器件的浮点性能可达100GFLOPs,而台式高端机(eg: i7-8700k)只有59.26GLOPs,从而可以提高响应速度,本实用新型装置可以做到连续极速智能识别物体。

3)本实用新型装置的体积可以和普通相机差不多大小,从而具有较高的便携性,易于携带。

4)本实用新型装置无需连接互联网,从而使用范围更广泛。

5)本实用新型装置的零售价可以在控制在1000RMB以内,从而大大降低了成本。

附图说明

图1是本实用新型实施例一种自动识别装置的结构示意图;

图2是本实用新型实施例中摄像头与取景器的位置关系示意图;

图3是本实用新型实施例中一种自动识别装置的产品化示意图。

具体实施方式

如背景技术所述,现有技术中多采用智能手机作为自动识别装置,从而具有必须在线、功耗低、响应速度慢以及成本高的缺点。

为此,本实用新型提出了一种自动识别装置,除了摄像头和快门开关之外,还包括;

可随开随用的取景器,从而达到节省功耗的目的;

功耗较低的ARM处理器,从而既节省功耗,又降低成本,还减小体积;

功耗较低且浮点性能较高的视觉处理器件,从而达到节省功耗,提高响应速度,以及无需连接互联网的目的。

为使本实用新型的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本实用新型的具体实施例做详细的说明。

参考图1所示,本实施例提供一种自动识别装置,具体可以包括:

摄像头10,所述摄像头用于拍摄待识别图像;

取景器20,所述取景器用于辅助所述摄像头进行取景;

ARM处理器30,所述ARM处理器30与所述摄像头10进行电连接,用于对所述待识别图像进行预处理,并根据视觉处理器件40处理后的信息得到识别结果;

快门开关50,所述快门开50与所述ARM处理器30进行电连接且与所述摄像头10进行物理连接,用于触发所述摄像头10以及所述ARM处理器 30;

视觉处理器件40,所述视觉处理器件40与所述ARM处理器30进行电连接,用于对预处理后的待识别图像进行卷积神经网络分析以提取特征数值,并根据特征数值计算分类概率。

本实施例可以解决自动识别拍摄的图像中的物体的问题,并且可以实现移动化,轻量化,离线工作,便携,低功耗,长时间待机工作的目的。

需要说明的是,本实施例的装置可以用在各种图像识别相关的场景中,包括但不限于以下情况:

1)博物馆里的物体识别移动设备;

2)可以识别花草百科的智能相机;

3)可以识别鸟类大全的智能相机;

4)可以作为儿童物体识别教学工具。

下面分部件进行详细说明。

所述摄像头10用于拍摄待识别图像,其受快门开关50控制,当按下快门开关50后就可以进行拍摄,并在拍摄后将拍摄的待识别图像发送给ARM 处理器30。

本实施例中可以选择不同视角的摄像头10,且摄像头10需要与ARM处理器30可以配套使用,其具体的选择对于本实用新型技术领域的技术人员是熟知的,在此不再赘述。

所述取景器20用于辅助所述摄像头进行取景,其一般位于摄像头10镜头的上方,从而无需常开摄像头10,只在取景合适真正想要拍摄的时候才打开摄像头10,最终节省电能。

为了保证取景器20中看到的景象与摄像头10拍摄的景象保持一致,需要使取景器的视角角度与所述摄像头的视角角度保持一致,具体参见图2(此时的取景器具体为光学旁轴取景器,但也可以为其它取景器)。

具体地,可以根据摄像头的视角角度来选择不过规格的光学取景器,而摄像头10的视角角度可以采用下面的方式确定:

对摄像头10拍摄的画面的中心,裁剪一定像素区域(比如:300*300,具体可以根据tensorflow的模型确定)的图像,然后估算出摄像头10的视角角度。

所述ARM处理器30是整个装置的承载,具体是基于ARM架构的微型电脑/计算板,其具有低功耗,长时间待机以及可扩展的能力。

所述ARM处理器30与所述摄像头10、所述快门开关20以及所述视觉处理器件40之间具有电连接关系。

其中,所述ARM处理器30与所述视觉处理器件40之间既可以通过USB 接口进行连接,也可以通过板载方式进行连接。

其中,所述ARM处理器30与所述快门开关50之间可以通过GPIO接口进行连接。

所述ARM处理器30在获取待识别图像后可以对其进行预处理,以满足后续卷积神经网络分析的要求,并将预处理后的待识别图像发送给视觉处理器件40。

所述ARM处理器30包括存储单元(图中未示出),其存储所有可以识别的物体的特征数值及对应的物体信息,另外,所述待识别图像也会存储在该存储单元中。

所述快门开关50不仅与所述ARM处理器30进行电连接,而且与所述摄像头10进行物理连接,从而在按下快门开关后就可以进行拍摄待识别图像,并触发ARM处理器30获取所述待识别图像,其对于本领域技术人员是熟知的,在此不再赘述。

所述视觉处理器件40,支持卷积神经网络分析,用于对待识别图像进行图像卷积运行,逐步提取特征数值,最终计算出分类概率,且得出识别结果 (即识别出图像里面是什么物体)。

所示视觉处理器件40也包括存储单元,用于存储卷积网络模型。

所述装置还包括:电源(图中未示出),与所述ARM处理器和所述视觉处理器件进行电连接,用于分别为所述ARM处理器以及所述视觉处理器件提供电能。

所述装置还可以包括:显示器70,如LCD显示屏,其与所述ARM处理器30进行电连接,以显示所述待识别图像和/或识别结果

所述装置还可以包括:扬声器60,其与所述ARM处理器30进行电连接,用于语音输出所述识别结果。

需要说明的是,在本实用新型的其它实施例中可以仅包括显示器或仅包括扬声器,其不限制本实用新型的保护范围。

此外,为了使该装置产品化,参考图3所示,所述装置还可以包括:外壳,即工业化集成设计。

具体地,所述取景器、所述快门开关以及所述摄像头的镜头位于所述外壳外部,其余部件位于所述外壳内部。

需要说明的是,图3中并未示出取景器和快门开关等部件。

进一步地,所述装置还可以包括:通信器件(图中未示出),与所述ARM 处理器进行电连接,用于与外界进行信息传输。

所述通信器件可以包括:蓝牙、wifi等无线通信器件,也可以包括USB 接口等有线通信器件,其都在本实用新型的保护范围内。

所述通信器件具体可以将待识别图像以及识别结果等发送给其它装置,也可以接收其它装置发来的其它信息。

与智能手机相比,本实施例具有下面的优点:

1)由于采用取景器,从而无需常开摄像头,可以随开随用;此外,ARM 处理器的工作功耗一般小于1w,视觉处理器件的工作功耗一般小于1w,因此大大降低了装置的功耗,相应提高了待机时间,待机时间可以长达几天,而智能手机处于待机状态仅为1天左右。

2)视觉处理器件的浮点性能可达100GFLOPs,而台式高端机(eg: i7-8700k)只有59.26GLOPs,从而可以提高响应速度,本实用新型装置可以做到连续极速智能识别物体。

3)本实用新型装置的体积可以和普通相机差不多大小,从而具有较高的便携性,易于携带。

4)本实用新型装置无需连接互联网,从而使用范围更广泛。

5)本实用新型装置中,ARM处理器的零售价60-90RMB,视觉处理器件的零售价600-700RMB,摄像头的零售价20RMB,取景器的零售价20RMB,再加上外壳、电池等,整个装置的零售价可以在控制在1000RMB以内,从而大大降低了成本。

在一个具体例子中,所述自动识别装置可以包括:

CSI摄像头(即摄像头),用于拍摄待识别图像;

旁轴光学取景器(即取景器),用于辅助所述摄像头进行取景;

树莓派ZERO手机(即ARM处理器),与所述CSI摄像头电连接,用于对所述待识别图像进行预处理,并根据神经计算棒处理后的信息得到识别结果;

快门开关,与所述树莓派ZERO手机通过GPIO接口进行电连接,且与所述CSI摄像头进行物理连接,用于触发所述摄像头以及所述ARM处理器;

神经计算棒(即视觉处理器),与所述树莓派ZERO手机通过USB接口或者板载方式进行电连接,用于对预处理后的待识别图像进行卷积神经网络分析以提取特征数值,并根据特征数值计算分类概率。

上述描述了该装置的硬件部分,为了使该装置能正常工作,还可以在该装置中安装相应地软件部分,具体包括:

在ARM处理器中安装linux操作系统;

在视觉处理器中安装Movidius NCS sdk软件,其中存储单元存储 TensorFlow Image Classification Network(关于tensorflow模型计算推测,可以选用inception_v3或者mobilenets);

在摄像头中安装并启动摄像头程序。

下面简单描述本装置的工作过程:

1)开机自动启动程序,等待快门开关的GPIO信号;

2)采用取景器进行取景选择;

3)当对取景器的取景结果满意时,则按下快门开关;

4)摄像头就开始拍摄待识别图像;

5)ARM处理器对摄像头拍摄的图像进行保存和预处理;

6)视觉处理器件对预处理后图像进行模型推测,并将计算的概率信息发送给ARM处理器;

7)ARM处理器获知识别结果;

8)在显示屏上以文本形式显示识别结果或通过扬声器语音播报识别结果。

其中,视觉处理器件中tensorflow的分类模型,可以对照片进行至少1000 项的分类预测,就是说能告诉你照片里面的是什么物品,而且这些模型可以做扩展,可以自己训练自己的数据模型,即做到定制化。

虽然本实用新型披露如上,但本实用新型并非限定于此。任何本领域技术人员,在不脱离本实用新型的精神和范围内,均可作各种更动与修改,因此本实用新型的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1