一种导盲系统的制作方法

文档序号:11779724阅读:286来源:国知局
一种导盲系统的制作方法与工艺

本申请涉及导盲技术领域,尤其涉及一种导盲系统。



背景技术:

盲是世界上严重的社会和公共卫生问题之一。人类70%以上的信息都是通过视觉来获取的,视力问题很大程度上限制了盲人进行信息获取。由于盲人视力上的缺陷,在面对市面种类繁多的钱币时,无法获取钱币的信息,因此很大程度上限制了盲人独立生活。



技术实现要素:

本申请的实施例提供一种导盲系统,用于辅助盲人获取钱币信息。

为达到上述目的,本申请的实施例采用如下技术方案:

提供一种导盲系统,用于辅助盲人获取钱币信息,包括:图像采集设备、处理模组以及语音输出设备;所述图像采集设备和所述语音输出设备耦合至所述处理模组;

所述处理模组用于控制所述图像采集设备获取待检测钱币图像,根据所述待检测钱币图像获取所述钱币的类别以及根据所述钱币的类别获取对应的钱币信息;所述处理模块还用于控制所述语音输出设备通过语音对所述钱币信息进行播报。

本申请的实施例提供的导盲系统包括:图像采集设备、处理模组以及语音输出设备;图像采集设备和语音输出设备耦合至处理模组,其中,处理模组可以控制图像采集设备获取待检测钱币图像,根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息;处理模块还用于控制语音输出设备通过语音对钱币信息进行播报,由于本申请实施例提供的导盲系统在进行图像采集获取待检测钱币图像时,无需过多对钱币放置位置进行限制,且不用考虑图像采集时的光照强度、光照位置等的影响,所以对钱币的识别过程中的操作简单易行,适用于盲人日常生活中获取钱币信息,即本申请实施例可以辅助盲人获取钱币信息。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请的实施例提供的导盲系统的示意性结构图之一;

图2为本申请的实施例提供的导盲系统所执行的方法的步骤流程图之一;

图3为本申请的实施例提供的检测区域的示意性结构图之一;

图4为本申请的实施例提供的导盲系统所执行的方法的步骤流程图之二;

图5为本申请的实施例提供的导盲系统所执行的方法的步骤流程图之三;

图6为本申请的实施例提供的检测区域的示意性结构图之二;

图7为本申请的实施例提供的导盲系统所执行的方法的步骤流程图之四;

图8为本申请的实施例提供的导盲系统的示意性结构图之二;

图9为本申请的实施例提供的导盲系统的示意性结构图之三;

图10为本申请的实施例提供的导盲系统的示意性结构图之四。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。需要说明的是,下文所提供的任意多个技术方案中的部分或全部技术特征在不冲突的情况下,可以结合使用,形成新的技术方案。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请实施例中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。如果不加说明,本文中的“多个”是指两个或两个以上。

在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

需要说明的是,本申请实施例中,除非另有说明,“多个”的含义是指两个或两个以上。

还需要说明的是,本申请实施例中,“的(英文:of)”,“相应的(英文:corresponding,relevant)”和“对应的(英文:corresponding)”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。

本申请实施例所提供的技术方案的基本原理为:针对现有技术中的钱币识别方式不适用于盲人日常生活中获取钱币信息的问题,本申请实施例中通过获取钱币的图像,然后根据钱币的图像获取钱币的类别,再根据钱币类别获取对应的钱币信息;最后通过语音对钱币信息进行播报。由于盲人可以通过听觉获取钱币信息,而且对钱币的识别过程中的操作简单易行,所以本申请实施例可以适用于辅助盲人获取钱币信息。

基于上述内容,本申请实施例提供一种导盲系统。

示例性的,本申请实施例中的导盲系统可以包括:头戴式导盲装置、导盲眼镜、手机、便携式计算机、袖珍式计算机、手持式计算机、数码相框、掌上电脑、导航仪等终端设备,或者导盲系统也可以包括:终端设备、无线通信网络以及网络服务器。

参照图1所示,本申请实施例提供的导盲系统10包括:图像采集设备11、处理模组12以及语音输出设备13;图像采集设备11和语音输出设备12耦合至处理模组12。

处理模组12用于控制图像采集设备11获取待检测钱币图像,根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息;处理模块11还用于控制语音输出设备13通过语音对钱币信息进行播报。

示例性的,上述的图像采集模块11可以是单目摄像头、双目摄像头等图像传感器中的一种或多种。处理模组12可以是处理器,也可以是多个处理元件的统称。例如,中央处理器(英文名称:centralprocessingunit,简称:cpu)。处理模组12还可以为其他通用处理器、数字信号处理器(英文名称:digitalsignalprocessing,简称:dsp)、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。处理模组12还可以为专用处理器,该专用处理器可以包括基带处理芯片、射频处理芯片等中的至少一个。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。语音输出设备13可以是扬声器、功放机、音箱、耳机等音频输出设备。

需要说明的是,本申请实施例中的钱币可以为纸币,也可以为硬币,还可以其他类型的钱币。此外,本申请实施例中的钱币的币种可以为人民币、美元、英镑、欧元等。

还需要说明的是,钱币信息信息可以包括钱币的:币种(例如:人民币、美元、英镑、欧元等)、面额(例如:1元、2元、5元、10元、100元等)、版本(例如:第五套人民币、第三套人民币、新版美元等)等信息。

示例性的,在处理模组12控制图像采集设备11获取待检测钱币图像的过程中:处理模组可以控制图像采集设备从一个视角对钱币进行图像采集,或者控制图像采集设备从多个视角对钱币进行图像采

集。此外,同一视角也可以对钱币进行多次图像采集,然后基于采集的图像的清晰度、完整度等选取其中的一张或多张作为待检测钱币图像。

此外,当从多个视角对钱币进行图像采集时,处理模组12和图像采集设备11可以通过执行如下操作来实现:

用户将钱币放置于图像采集装置的采集范围之内,然后对钱币进行移动和/或翻转,处理模组12控制图像采集装置11在用户对钱币进行移动和/或翻转的过程中多次对钱币进行图像采集,从而实现从多个视角对钱币进行图像采集。或者设置图像采集设备11包括多个可以独立采集图像的装置,且多个可以独立采集图像的装置分别设置于不同的位置。当进行图像采集时,处理模组12控制多个设置于不同位置的图像采集装置分别从一个视角对钱币进行图像采集,从而实现从多个视角对钱币进行图像采集。例如:图像采集设备包括两个相对的摄像头,对钱币进行图像采集采集时,用户将钱币放置在两个摄像头之间,两个摄像头分别采集钱币正面和反面的图像。

本申请的实施例提供的导盲系统包括:图像采集设备、处理模组以及语音输出设备;图像采集设备和语音输出设备耦合至处理模组,其中,处理模组可以控制图像采集设备获取待检测钱币图像,根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息;处理模块还用于控制语音输出设备通过语音对钱币信息进行播报,由于本申请实施例提供的导盲系统在进行图像采集获取待检测钱币图像时,无需过多对钱币放置位置进行限制,且不用考虑图像采集时的光照强度、光照位置等的影响,所以对钱币的识别过程中的操作简单易行,适用于盲人日常生活中获取钱币信息,即本申请实施例可以辅助盲人获取钱币信息。

可选的,处理模组12根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息,包括:处理模组12在待检测钱币图像上截取检测区域;检测区域以待检测钱币图像的中心为中心;对截取到的检测区域的图像进行处理获取第二处理图像;第二处理图像为灰阶图像且第二处理图像的像素大小为预设值;从第二处理图像中提取检测特征;分别计算检测特征与各个钱币的特征模板的欧氏距离(英文名称:euclideanmetric,别称:欧几里得度量);获取匹配特征模板;匹配特征模板为与检测特征的欧氏距离最小的特征模板;根据匹配特征模板获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

即,参照图2所示,处理模组12可以通过执行如下步骤来实现根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

s21、在待检测钱币图像上截取检测区域。

其中,检测区域以待检测钱币图像的中心为中心。

示例性的,参照图3所示,待检测钱币图像31的中心为310,检测区域32的中心与待检测钱币图像31的中心310重合。需要说明的是,图3中以待检测钱币图像31和检测区域32均为矩形为例进行说明,但本申请实施例并不限定于此,待检测钱币图像31和检测区域32也可以为其他形状。

s22、对截取到的检测区域的图像进行处理获取第二处理图像。

其中,第二处理图像为灰阶图像且第二处理图像的像素大小为预设值。

示例性的,对截取到的检测区域的图像进行处理获取第二处理图像具体可为:首先将检测区域的图像转换为灰阶图像,然后对灰阶图像进行归一化处理。当然也可以通过其他图像处理方式检测区域的图像进行处理,本申请实施例中不限定对检测区域的图像进行图像处理的方式,以能够将检测区域的图像处理为像素大小为预设值的灰阶图像为准。

示例性的,预设值具体可以为100像素*100像素。

s23、从第二处理图像中提取检测特征。

示例性的,检测特征具体可以为:尺寸尺度不变特征变换(英文名称:scale-invariantfeaturetransform,简称:sift)特征。

s24、分别计算检测特征与各个钱币的模板特征的欧氏距离。

s25、获取匹配特征模板。

其中,匹配特征模板为与检测特征的欧氏距离最小的特征模板。

s26、根据匹配特征模板获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

进一步的,在上述步骤s24中处理模组12需要计算检测特征与各个钱币的模板特征的欧氏距离,因此在步骤s24之前处理模组12还需要对各个钱币的特征模板进行提取并保存,以便于在步骤s24中读取各个钱币的特征模板进行计算。因此处理模组12还用于获取各个钱币的模板图像;对各个钱币的模板图像进行处理获取对应的第一处理图像;第一处理图像为灰阶图像且第一处理图像的像素大小为预设值;从各个第一处理图像中提取特征模板并保存。

即,参照图4所示,处理模组12对各个钱币的特征模板进行进行提取并保存可以通过执行如下步骤来实现。

s41、获取各个钱币的模板图像。

具体的,获取各个钱币的模板图像具体可以为获取各种钱币正面、反面原始比例的稿清图像作为钱币的模板图像。例如:获取美元的模板图像具体可以为:分别获取1美元、2美元、5美元、10美元、20美元、50美元以及100美元正面、反面原始比例的稿清图像,并将获取的14张图像作为钱币的模板图像。

s42、对各个钱币的模板图像进行处理获取对应的第一处理图像。

其中,第一处理图像为灰阶图像且第一处理图像的像素大小为预设值。

示例性的,对各个钱币的模板图像进行处理获取第一处理图像具体可为:首先将各个钱币的模板图像转换为灰阶图像,然后对灰阶图像进行归一化处理。同样,本申请实施例中也不限定对各个钱币的模板图像进行图像处理的方式,以能够将各个钱币的模板图像处理为像素大小为预设值的灰阶图像为准。

s43、从各个第一处理图像中提取模板特征并保存。

示例性的,处理模组12可以将各个钱币的模板特征保存在本地数据库中,也可以将各个钱币的模板特征保存在远端服务器中。

需要说明的是,检测特征与模板特征为相同类型的特征。例如:模板特征为sift特征,则检测特征也为sift特征。

还需要说明的是,上述步骤s41、s42和s43为特征模板提取及保存过程,在一些实施例中,可以无需执行上述s41、s42和s43。例如:在首次使用时已将模板特征提取并保存在本地数据库中,在下一次通过图2所示实现方式来获取钱币信息时,可以直接从本地数据库中调取模板特征,而无需重复执行上述步骤s41、s42和s43。

还需要说明的是,若对每一种钱币均执行上述步骤s41、s42和s43可以丰富模板特征,进而可以在获取钱币的类别时可以对每一种钱币进行识别分类,但目前世界已存在1200多种钱币,钱币种类繁多,若对每一个钱币均执行上述步骤s41、s42和s43,则需要较多的计算资源、存储资源,而大部分模板特征在盲人日常生活中用不到,造成资源浪费,因此在实际使用时可以仅对一部分钱币执行上述步骤s41、s42和s43,且用户可以根据实际需求增加或删除部分模板特征。

进一步的,处理模组12还用于判断检测特征与各个特征模板的欧氏距离的最小值是否小于或等于阈值;若是,将与检测特征的欧氏距离最小的特征模板作为匹配特征模板;若否,判断已对待检测钱币图像旋转的次数是否等于预设次数;若已对待检测钱币图像旋转的次数小于预设次数,对待检测钱币图像旋转预设角度并重新截取检测区域;

处理模组12用于在待检测钱币图像上截取检测区域,包括:在获取到待检测钱币图像后在待检测钱币图像上截取检测区域以及在旋转待检测钱币图像后,在待检测钱币图像上截取检测区域。

即,参照图5所示,上述步骤s25中,处理模组12获取匹配特征模板可以通过执行如下步骤来实现。

s281、判断检测特征与各个特征模板的欧氏距离的最小值是否小于或等于阈值。

在步骤s281中,若检测特征与各个特征模板的欧氏距离的最小值小于或等于阈值,则执行步骤s282;若检测特征与各个特征模板的欧氏距离的最小值大于阈值,则执行步骤s283。

s282、将与检测特征的欧氏距离最小的特征模板作为匹配特征模板。

s283、判断已对待检测钱币图像旋转的次数是否等于预设次数。

示例性的,预设次数可以为1次、2次、3次、10次等。

在步骤s283中,若已对待检测钱币图像旋转的次数小于预设次数,例如:预设次数为1次,尚未对待检测钱币图像进行过旋转;再例如:预设次数为10次,对待检测钱币图像进行过5次旋转;则执行步骤s284并返回步骤s21中重新执行步骤s21至s283;若已对待检测钱币图像旋转的次数等于预设次数,则说明未能将检测特征与模板特征匹配成功,结束检测。此时可以输出“未检测到钱币”或者“检测失败”。

s284、将待检测钱币图像旋转预设角度。

示例性的,参照图6所示,图6中以将待检测钱币图像旋转的角度a为45度为例进行说明。需要说明的是,预设角度还可以为其他角度,例如:10度、30度、90度等。此外,旋转预设角度可以为顺时针旋转预设角度,也可以为逆时针旋转预设角度。

需要说明的是,在上述实施例中,若预设次数设置的越大,则步骤s21至s283被重复执行的次数越多,计算耗时越长,但将检测特征与模板特征匹配成功的可能性越大。反之,若预设次数设置的越小,步骤s21至s283被重复执行的次数越少,计算耗时越短,但将检测特征与模板特征匹配成功的可能性越小。因此预设次数的大小可以根据实际需求进行设定。

可选的,处理模组12根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息,包括:处理模组在待检测钱币图像中提取预设特征;对预设特征进行分类获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

即,参照图7所示,处理模组12还可以通过执行如下步骤来获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

s71、在待检测钱币图像中提取预设特征。

可选的,上述实施例中的预设特征可以是手动设置的特征,例如:haar特征(英文名称:haar-likefeatures)、方向梯度直方图(英文名称:histogramoforientedgradient,简称:hog)特征、局部二值模式(英文名称:localbinarypattern,简称:lbp)特征。上述实施例中的预设特征也可以是通过机器学习方法,比如通过深度学习方法自动学习获取的图像特征。

s72、对预设特征进行分类获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

具体的,上述实施例中对预设特征进行分类的分类方法可以为:采用支持向量机(英文名称:supportvectormachine,简称:svm)进行分类、迭代(英文名称:adaboost)分类器进行分类或者最邻近算法进行分类,进而根据钱币的类别获取对应的钱币信息。

可选的,处理模组12根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息,包括:处理模组具体用于通过深度神经网络分类法对待检测钱币图像进行分类获取钱币的类别以及根据钱币的类别获取对应的钱币信息。

即,直接通过预先训练好的深度神经网络分类器对待检测钱币图像进行分类,从而获取钱币的类别并根据钱币的类别获取对应的钱币信息。

可选的,参照图8所示,处理模组12包括:第一处理单元121、第二处理单元122以及网络通信单元123;

第一处理单元121,用于控制图像采集设备获取待检测钱币图

像,并将采集到的图像通过网络通信单元123发送至第二处理单元122;

第二处理单元122用于根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息,并通过网络通信单元123将获取到的钱币信息返回至第一处理单元121。

即,上述根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息的实现过程可以在终端设备内部完成,也可以通过远程服务设备协助完成。当根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息的过程通过远程服务设备协助完成时,处理模组12的网络通信单元123将第一处理单元121获取的待检测钱币图像发送至第二处理单元122中,第二处理单元122根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息,并通过网络通信单元123将获取到的钱币信息返回至第一处理单元123。

可选的,参照图9所示,导盲系统还包括头盔900;图像采集设备11、处理模组12以及语音输出设备13设置在头盔900上。

可选的,参照图10所示,导盲系统还包括:语音输入设备14;

处理模组12还用于通过语音输入设备14采集语音指令;具体用于当采集到用于指示进行钱币识别的指令时,控制图像采集设备11获取待检测钱币图像,根据待检测钱币图像获取钱币的类别以及根据钱币的类别获取对应的钱币信息。通过这种方式,能够使得导盲系统根据盲人的触发进入到钱币图像获取的流程,从而采用相应的钱币识别的模板进行识别,这样能够有效的提高钱币识别的效率和精度。

示例性的,语音输入设备14可以为麦克风。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1