图像识别方法、系统、电子设备和计算机程序产品与流程

文档序号:14845910发布日期:2018-06-30 14:59阅读:263来源:国知局
图像识别方法、系统、电子设备和计算机程序产品与流程

本申请涉及图像识别技术领域,特别涉及一种图像识别方法、系统、电子设备和计算机程序产品。



背景技术:

中国是世界盲人最多的国家,作为社会群体中的特殊人群,他们终生生活在无边的黑暗中,因此常常会遇到各种难题。

基于摄像头的智能图像识别可以提升盲人生活的便利,而拍摄的图像质量对后续的识别功能至关重要。定焦摄像头只能在一定的景深范围内的拍摄出清晰的图像,适用范围受限;而自动聚焦摄像头在用户不介入的情况下经常聚焦不准,导致拍摄的图像,无法进行后续的精细的图像识别。



技术实现要素:

本申请实施例提供了一种图像识别方法、系统、电子设备和计算机程序产品。

第一方面,本申请实施例提供了一种图像识别方法,所述方法,包括:

采用中焦焦距采集识别对象所在的场景图像;

根据所述场景图像确定识别焦距;

采用所述识别焦距对所述识别对象进行识别。

第二方面,本申请实施例提供了一种电子设备,所述电子设备包括:

存储器,一个或多个处理器;存储器与处理器通过通信总线相连;处理器被配置为执行存储器中的指令;所述存储介质中存储有用于执行第一方面所述方法中各个步骤的指令。

第三方面,本申请实施例提供了一种与包括显示器的电子设备结合使用的计算机程序产品,所述计算机程序产品包括计算机可读的存储介质和内嵌于其中的计算机程序机制,所述计算机程序机制包括用于执行上述第一方面所述方法中各个步骤的指令。

第四方面,本申请实施例提供了一种图像识别系统,所述图像识别系统包括:图像获取单元和移动计算处理单元;

所述图像获取单元为焦距可控的摄像头,其中焦距可控范围包括长焦焦距、中焦焦距和短焦焦距;或者,

所述图像获取单元为三个以上定焦摄像头,其中,长焦摄像头至少一个,中焦摄像头至少一个,短焦摄像头至少一个;

所述移动计算处理单元为第二方面所述的电子设备;

所述移动计算处理单元通过通用串行总线USB,或者,无线通信方式与所述图像获取单元连接。

有益效果如下:

本申请实施例中,采用中焦焦距采集识别对象所在的场景图像,根据场景图像确定识别焦距,采用识别焦距对识别对象进行识别,实现了在无用户的干预和输入的情况下,自动对环境进行识别,基于环境选择适当的焦距达到最好的拍摄效果,进而提升识别精准性,大大提高盲人生活的便利性。

附图说明

下面将参照附图描述本申请的具体实施例,其中:

图1为本申请实施例中的一种电子设备的结构示意图;

图2本申请实施例中的一种图像识别方法流程示意图;

图3本申请实施例中的一种图像识别方法实现思路示意图。

具体实施方式

为了使本申请的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以互相结合。

基于摄像头的智能图像识别可以提升盲人生活的便利,而拍摄的图像质量对后续的识别功能至关重要。定焦摄像头只能在一定的景深范围内的拍摄出清晰的图像,适用范围受限;而自动聚焦摄像头在用户不介入的情况下经常聚焦不准,导致拍摄的图像,无法进行后续的精细的图像识别。

为了提升图像拍摄质量,提高盲人生活的便利性。本申请实施例提供了一种图像识别方法,采用中焦焦距采集识别对象所在的场景图像,根据场景图像确定识别焦距,采用识别焦距对识别对象进行识别,实现了在无用户的干预和输入的情况下,自动对环境进行识别,基于环境选择适当的焦距达到最好的拍摄效果,进而提升识别精准性,大大提高盲人生活的便利性。

本申请提供的图像识别方法,可以用于如下的图像识别系统中。该图像识别系统包括:图像获取单元和移动计算处理单元。

1、图像获取单元

图像获取单元用于获取当前焦距下的图像。但本申请中的图像获取单元的焦距可以被移动计算处理单元控制并修改,而且焦距可调范围大,比如可以清晰拍摄几厘米的文字到几十米之的红绿灯或者交通标志牌。因此,本申请中的图像获取单元的具体实现形式可以有多种。

例如:图像获取单元为焦距可控的摄像头,其中焦距可控范围包括长焦焦距、中焦焦距和短焦焦距。此种情况下摄像头的数量不进行限制,但焦距可控的摄像头至少1台。

再例如,图像获取单元为三个以上定焦摄像头,其中,长焦摄像头至少一个,中焦摄像头至少一个,短焦摄像头至少一个。

在实际应用中,图像获取单元可以位于可穿戴式眼镜上,如位于导盲眼镜上。

2、移动计算处理单元

移动计算处理单元可以通过USB(Universal Serial Bus,通用串行总线),或者,无线通信方式(如蓝牙方式)与图像获取单元连接。

移动计算处理单元负责控制图像获取单元的焦距、图像采集、场景粗分类、具体的图像识别以及语音播报输出。

例如,移动计算处理单元,可以控制图像获取单元的焦距为中焦焦距,通过焦距为中焦焦距的图像获取单元采集识别对象所在的场景图像。

再例如,移动技术处理单元,还可以控制图像获取单元的焦距为识别焦距,通过焦距为识别焦距的图像获取单元采集识别对象的第一图像。

再例如,移动技术处理单元,还可以在确定识别完成之后,控制图像获取单元的焦距为中焦焦距。

移动计算处理单元在具体应用时,可以为如图1所示的电子设备。该电子设备可以为通用的智能手机。该电子设备包括:存储器101,一个或多个处理器102;以及收发组件103,存储器、处理器以及收发组件103通过通信总线(本申请实施例中是以通信总线为I/O总线进行的说明)相连;所述存储介质中存储有用于执行图2所示的图像识别方法中各个步骤的指令,进而实现采用中焦焦距采集识别对象所在的场景图像,根据场景图像确定识别焦距,采用识别焦距对识别对象进行识别的功能,实现了在无用户的干预和输入的情况下,自动对环境进行识别,基于环境选择适当的焦距达到最好的拍摄效果,进而提升识别精准性,大大提高盲人生活的便利性。

不难理解的是,在具体实施时,就为了实现本申请的基本目的而言,上述的并不必然的需要包含上述的收发组件103。

参见图2,本实施例提供的图像识别方法,包括:

201,采用中焦焦距采集识别对象所在的场景图像。

201-1,移动计算处理单元通过USB,或者,蓝牙等无线通信方式与图像获取单元建立连接。

201-2,移动计算处理单元通过该连接采用中焦焦距采集识别对象所在的场景图像。

具体为:

1)如果图像获取单元为焦距可控的摄像头,则

(1)移动计算处理单元通过该连接将图像获取单元的焦距调整在中间距离,此时图像获取单元的当前焦距为中焦焦距。

(2)图像获取单元采集当前焦距下的识别对象所在的场景图像,将该场景图像传送给移动计算处理单元,实现移动计算处理单元通过焦距为中焦焦距的图像获取单元采集识别对象所在的场景图像。

2)如果图像获取单元为三个以上定焦摄像头,其中,长焦摄像头至少一个,中焦摄像头至少一个,短焦摄像头至少一个,则

(1)移动计算处理单元通过该连接在图像获取单元中选择中焦摄像头。

(2)选择的中焦摄像头采集识别对象所在的场景图像,将该场景图像传送给移动计算处理单元,实现移动计算处理单元通过焦距为中焦焦距的图像获取单元采集识别对象所在的场景图像。

202,根据场景图像确定识别焦距。

在步骤201中采集到场景图像之后,会对场景图像进行粗分类,得到粗分类的场景,即得到场景图像所属粗场景。根据该所属粗场景确定具体识别时的识别焦距,以便调整镜头到相应的识别焦距上,在此采集图像,然后调用相应的图像识别功能。

步骤202的具体实现过程如下:

202-1,通过场景粗分类模型对场景图像进行粗分类,确定场景图像所属粗场景。

其中,粗场景为长焦场景,中焦场景或者短焦场景。粗场景对应一或多个图像识别功能。不同的粗场景对应的图像识别功能不同,且对应的图像识别功能的数量可以相同也可以不同。

例如,对于粗场景为长焦场景的情况,长焦场景对应的图像识别功能只有一个,即红绿灯识别功能。

再例如,对于粗场景为短焦场景的情况,短焦场景对应的图像识别功能为两个,即读书识别功能和物品识别功能。

再例如,对于粗场景为中焦场景中的情况,中焦场景对应的图像识别功能为多个,其中一个图像识别功能为人脸识别功能。

本实施例中的粗场景除长焦场景,中焦场景或者短焦场景之外,还可以根据实际情况进行增加。每个粗场景对应的图像识别功能的数量及具体功能,也可以根据实际情况进行调整。本实施例不对粗场景包括的具体类别,粗场景对应的图像识别功能的具体数量及具体功能,以及粗场景包括的类别,对应图像识别功能的数量及功能的调整时间、调整形式进行限定。

另外,场景粗分类模型是通过对长焦场景的样本、中焦场景的样本以及短焦场景的样本进行深度学习得到的。

具体的,

1、基于中焦镜头采集三个场景下的图像样本,比如使用长焦场景时一般为红绿灯识别场景,可以采集此类场景图像作为该场景类别的样本;使用中焦场景时一般为人脸识别场景,可以采集行人距离较近而且正面的场景图像作为该场景类别的样本;使用短焦场景时一般为OCR(Optical Character Recognition,光学字符识别)识别场景,可以采集读书之类场景图像作为该场景类别的样本。

2)基于CNN(Convolutional Neural Network,卷积神经网络)进行训练,比如采用resnet网络进行训练。

在训练完毕后即得到训练好的场景粗分类模型,在步骤202-1中可以利用训练好的场景粗分类模型和权重对场景图像进行分类,根据输出概率的大小判别属于哪个粗场景,实现基于深度学习采用CNN对步骤201中采集的场景图像进行粗分类识别。

202-2,将所属粗场景对应的焦距确定为识别焦距。

执行至此,得到对识别对象进行实际识别时的识别焦距,实现基于不同的粗场景动态改变焦距的功能,提升后续识别时的图像拍摄质量,进而提升识别精准性,大大提高盲人生活的便利性。

203,采用识别焦距对识别对象进行识别。

203-1,采用识别焦距采集识别对象的第一图像。

移动技术处理单元控制图像获取单元的焦距为识别焦距,通过焦距为识别焦距的图像获取单元采集识别对象的第一图像。

具体为:

1)如果图像获取单元为焦距可控的摄像头,则

(1)移动计算处理单元通过与图像获取单元建立的连接将图像获取单元的焦距调整在识别焦距距离,此时图像获取单元的当前焦距为识别焦距。

(2)图像获取单元采集当前焦距下的识别对象所在的场景图像,将该场景图像传送给移动计算处理单元,实现移动计算处理单元通过焦距为识别焦距的图像获取单元采集识别对象的第一图像。

2)如果图像获取单元为三个以上定焦摄像头,其中,长焦摄像头至少一个,中焦摄像头至少一个,短焦摄像头至少一个,则

(1)移动计算处理单元通过与图像获取单元建立的连接在图像获取单元中选择识别焦距对应的摄像头。

(2)选择的摄像头采集识别对象所在的场景图像,将该场景图像传送给移动计算处理单元,实现移动计算处理单元通过焦距为识别焦距的图像获取单元采集识别对象的第一图像。

203-2,若所属粗场景对应一个图像识别功能,则调用所属粗场景对应的图像识别功能,对第一图像进行识别。

如果所属粗场景下只有一个图像识别功能,比如所属粗场景为长焦场景,长焦场景对应的图像识别功能只有一个红绿灯识别功能,则可以直接调用红绿等识别功能。

调用红绿灯识别功能,根据第一图像确定识别对象为红灯、绿灯或者黄灯;或者,调用红绿灯识别功能,根据第一图像确定识别对象为红灯、绿灯、黄灯或者非红绿黄灯。

例如,在红绿灯识别功能中,通过深度神经网络识别第一图像,实现红灯、绿灯、黄灯的判别,或者,通过深度神经网络识别第一图像,实现红灯、绿灯、黄灯或者非红绿黄灯的判别。

此方案的具体实现过程可参考步骤202-1中对场景图像进行粗分类的实现过程。

再例如,在红绿灯识别功能中,通过目标检测方式,对第一图像中的红灯、绿灯、黄灯三种目标进行检测,或者,通过目标检测方式,对第一图像中的红灯、绿灯、黄灯或者非红绿黄灯四种目标进行检测。

其中,目标检测方式包括但不限于基于SSD(Single Shot MultiBox Detector)目标检测模型的检测。

203-3,若所属粗场景对应多个图像识别功能,则通过场景细分类模型对第一图像进行细分类,确定第一图像在所属粗场景中对应的图像识别功能;调用第一图像在所属粗场景中对应的图像识别功能,对第一图像进行识别。

若所属粗场景对应多个细分的图像识别功能,则可以先进行场景细分类,再调用具体的图像识别功能。

例如,若所属粗场景为短焦场景,短焦场景对应的图像识别功能为两个:读书识别功能和物品识别功能。此时,可以先通过卷积神经网络,或者,通过CNN,基于手里拿的是什么东西判断是OCR场景还是物体识别场景(具体实现方式可以参考步骤202-1中对场景图像进行粗分类的实现过程),若为OCR场景则调用读书识别功能,否则调用物品识别功能。

具体的,

1,通过场景细分类模型对第一图像进行识别,确定识别对象为书籍、报刊、或者,非书籍报刊的物品。

其中,报刊包括报纸、杂志等发行刊物。

2,若识别对象为书籍,或者,若识别对象为报刊,则确定第一图像在所属粗场景中对应的图像识别功能为读书识别功能,调用读书识别功能识别第一图像,即进行OCR识别。

OCR识别后,还可以通过语音播报的形式输出识别结果。

在实际应用时,调用读书识别功能识别第一图像的过程,还可以进行如下优化实现:

当完成一次OCR识别输出后,再次采集识别对象的图像对图像进行分析是否需要在再次识别。因为盲人看书时可能会上下左右前后移动书本,这种情况下,不需要再次识别,只有当用户翻页时才需要再次进行OCR识别,这样就可以避免重复从头播报,有效提升用户体验。

具体实现如下:

在调用读书识别功能识别第一图像的同时,连续采集识别对象的第二图像。每当采集到一张第二图像,确定该张第二图像与第一图像之间的内容相似性,若内容相似性低于第一阈值,则停止第二图像的连续采集,进行再次OCR的识别,即将该张第二图像作为新的第一图像,重新执行调用读书识别功能识别新的第一图像,同时,连续采集识别对象的新的第二图像,确定该张新的第二图像与第一图像之间的内容相似性,若内容相似性低于第一阈值,则停止第二图像的连续采集,进行再次OCR的识别以及连续采集识别对象的新的第二图像,确定该张新的第二图像与第一图像之间的内容相似性及后续步骤,如此循环,直至识别对象的识别。

例如,首先保存第一帧OCR识别时的图像,然后不断采集图片与其进行内容相似性判断,如果相似性低于一个设定阈值,则认为用户可能已经翻页,需要重新进行OCR识别,否则认为用户是在移动当前页,不需要再次OCR识别。

对于确定该张第二图像与第一图像之间的内容相似性的过程,可以通过特征点匹配的方式实现。

具体的,提取该张第二图像中的第二特征点,提取第一图像中的第一特征点,根据与第一特征点匹配的第二特征点的数量确定该张第二图像与第一图像之间的内容相似性。

例如,分别提取第一帧图像和当前帧图像的ORB/SIFT点,进行匹配,根据匹配成功点的个数进行判断,成功匹配的点越多则表示相似性越高。

3,若识别对象为非书籍报刊的物品,则确定第一图像在所属粗场景中对应的图像识别功能为物品识别功能,调用物品识别功能识别第一图像。

执行至此,完成识别对象的精确识别。

在进行识别之后,本实施例提供的图像识别方法还会判断该场景下的图像识别功能是否使用结束,即判断是否识别完成。如果识别完成,则移动计算处理单元会重新调整图像获取单元(如摄像头)的焦距到中焦位置,即控制图像获取单元的焦距为中焦焦距,进入下一次工作循环。

具体为:

1)如果图像获取单元为焦距可控的摄像头,则移动计算处理单元通过与图像获取单元建立的连接将图像获取单元的焦距调整在中间距离,此时图像获取单元的当前焦距为中焦焦距,完成调整图像获取单元的焦距到中焦位置的工作。

2)如果图像获取单元为三个以上定焦摄像头,其中,长焦摄像头至少一个,中焦摄像头至少一个,短焦摄像头至少一个,则移动计算处理单元通过与图像获取单元建立的连接在图像获取单元中选择中焦摄像头作为下次拍照的默认摄像头,完成调整图像获取单元的焦距到中焦位置的工作。

另外,判断是否识别完成的方式包括但不限于:不断采集图像进行处理,根据该场景下图像识别功能的输出结果判断当前识别功能是否结束。

例如,对于长焦场景下的红绿灯识别功能,如果第四类别(非红绿黄灯)的概率最高,则认为该功能结束。

具体的,在调用红绿灯识别功能,根据第一图像确定识别对象为红灯、绿灯、黄灯或者非红绿黄灯之后,若根据第一图像确定识别对象为非红绿黄灯,则确定识别完成,结束图像识别方法。若根据第一图像确定识别对象为红灯、绿灯或者黄灯,则连续采集识别对象的第二图像,每当采集到一张第二图像,调用红绿灯识别功能,根据该张第二图像确定识别对象为红灯、绿灯、黄灯或者非红绿黄灯,若根据该张第二图像确定识别对象为非红绿黄灯,则确定识别完成,停止第二图像的连续采集,结束图像识别方法。

再例如,对于短焦场景下的读书识别功能,可以跟据输出OCR字符的个数以及置信度来判断,如果字符很少或者字符置信度很低们则认为读书识别功能结束。

具体的,在连续采集识别对象的第二图像之后,还会每当采集到一张第二图像时,调用读书识别功能识别该张第二图像中的字符个数和字符置信度。若该张第二图像中的字符个数小于第二阈值和/或该张第二图像中的字符置信度小于第三阈值,则确定识别完成,停止第二图像的连续采集,结束图像识别方法。

再例如,对于中焦场景中的人脸识别功能,可以进行人体/人脸检测,判断场景内有无符合一定尺寸大小的人体/人脸,如果没有,则认为人脸识别功能结束。

具体的,在调用第一图像在所属粗场景中对应的图像识别功能,对第一图像进行识别之后,连续采集识别对象的第二图像,每当采集到一张第二图像,对该张第二图像中的人体或者人脸进行检测,若检测结果为无人体,且无人脸,或者,检测结果为人体尺寸小于第四阈值,或者,检测结果为人脸尺寸小于第五阈值,则确定识别完成,停止第二图像的连续采集,结束图像识别方法。

执行至此,完成本实施例提供的图像识别方法。该方法的基本思路参见图3,具体为:将盲人需要的图像识别功能根据使用距离划分为长焦(对应远距离)、中焦(对应中间距离)、短焦(对应近距离)使用场景,比如交通灯识别需要长焦拍摄,人脸识别需要中焦拍摄,OCR需要短焦拍摄。在图像识别系统工作时移动计算处理单元先控制图像获取单元(如焦距可控的摄像头)焦距在中焦的位置,采集一幅识别对象所在的场景图像,虽然这种情况下对于短焦场景和长焦场景拍摄的图像不够清晰或者目标区域的分辨率不够,但是本申请可以对图像进行粗略的分类识别,判断适用长焦的场景、还是适用短焦的场景或者是中焦的场景,然后根据粗分类的场景类型确定识别焦距,调节摄像机镜头到对应的识别焦距上,接着再次采用识别焦距采集识别对象的一张图像,然后调用对应场景的图像识别功能;如果该场景下有若干个细分的功能,可以先进行场景细分类,然后再调用具体的图像识别功能。最后还可以通过语音播报的方式将识别结果反馈到盲人。

有益效果:

本申请实施例,采用中焦焦距采集识别对象所在的场景图像,根据场景图像确定识别焦距,采用识别焦距对识别对象进行识别,实现了在无用户的干预和输入的情况下,自动对环境进行识别,基于环境选择适当的焦距达到最好的拍摄效果,进而提升识别精准性,大大提高盲人生活的便利性。

另一方面,本申请实施例还提供了一种与包括显示器的电子设备结合使用的计算机程序产品,所述计算机程序产品包括计算机可读的存储介质和内嵌于其中的计算机程序机制,所述计算机程序机制包括用于执行下述各个步骤的指令:

采用中焦焦距采集识别对象所在的场景图像;

根据场景图像确定识别焦距;

采用识别焦距对识别对象进行识别。

可选地,根据场景图像确定识别焦距,包括:

通过场景粗分类模型对场景图像进行粗分类,确定场景图像所属粗场景;

将所属粗场景对应的焦距确定为识别焦距;

其中,粗场景对应一或多个图像识别功能;

粗场景为长焦场景,中焦场景或者短焦场景;

场景粗分类模型是通过对长焦场景的样本、中焦场景的样本以及短焦场景的样本进行深度学习得到的。

可选地,采用识别焦距对识别对象进行识别,包括:

采用识别焦距采集识别对象的第一图像;

若所属粗场景对应一个图像识别功能,则调用所属粗场景对应的图像识别功能,对第一图像进行识别;

若所属粗场景对应多个图像识别功能,则通过场景细分类模型对第一图像进行细分类,确定第一图像在所属粗场景中对应的图像识别功能;调用第一图像在所属粗场景中对应的图像识别功能,对第一图像进行识别。

可选地,所属粗场景为长焦场景,长焦场景对应的图像识别功能为红绿灯识别功能;

调用所属粗场景对应的图像识别功能,对第一图像进行识别,包括:

调用红绿灯识别功能,根据第一图像确定识别对象为红灯、绿灯或者黄灯;或者,

调用红绿灯识别功能,根据第一图像确定识别对象为红灯、绿灯、黄灯或者非红绿黄灯。

可选地,调用红绿灯识别功能,根据第一图像确定识别对象为红灯、绿灯、黄灯或者非红绿黄灯之后,还包括:

若根据第一图像确定识别对象为非红绿黄灯,则确定识别完成,结束图像识别方法;

若根据第一图像确定识别对象为红灯、绿灯或者黄灯,则连续采集识别对象的第二图像,每当采集到一张第二图像,调用红绿灯识别功能,根据该张第二图像确定识别对象为红灯、绿灯、黄灯或者非红绿黄灯,若根据该张第二图像确定识别对象为非红绿黄灯,则确定识别完成,停止第二图像的连续采集,结束图像识别方法。

可选地,所属粗场景为短焦场景,短焦场景对应的图像识别功能为读书识别功能和物品识别功能;

通过场景细分类模型对第一图像进行细分类,确定第一图像在所属粗场景中对应的图像识别功能,包括:

通过场景细分类模型对第一图像进行识别,确定识别对象为书籍、报刊、或者,非书籍报刊的物品;

若识别对象为书籍,或者,若识别对象为报刊,则确定第一图像在所属粗场景中对应的图像识别功能为读书识别功能;

若识别对象为非书籍报刊的物品,则确定第一图像在所属粗场景中对应的图像识别功能为物品识别功能。

可选地,第一图像在所属粗场景中对应的图像识别功能为读书识别功能;

调用第一图像在所属粗场景中对应的图像识别功能,对第一图像进行识别,包括:

调用读书识别功能识别第一图像,同时,连续采集识别对象的第二图像;

每当采集到一张第二图像,确定该张第二图像与第一图像之间的内容相似性,若内容相似性低于第一阈值,则停止第二图像的连续采集,将该张第二图像作为新的第一图像,重新执行调用读书识别功能识别新的第一图像,同时,连续采集识别对象的新的第二图像,确定该张新的第二图像与第一图像之间的内容相似性及后续步骤。

可选地,确定该张第二图像与第一图像之间的内容相似性,包括:

提取该张第二图像中的第二特征点,提取第一图像中的第一特征点;

根据与第一特征点匹配的第二特征点的数量确定该张第二图像与第一图像之间的内容相似性。

可选地,连续采集识别对象的第二图像之后,还包括:

每当采集到一张第二图像,调用读书识别功能识别该张第二图像中的字符个数和字符置信度;

若该张第二图像中的字符个数小于第二阈值和/或该张第二图像中的字符置信度小于第三阈值,则确定识别完成,停止第二图像的连续采集,结束图像识别方法。

可选地,第一图像在所属粗场景中对应的图像识别功能为中焦场景中的人脸识别功能;

调用第一图像在所属粗场景中对应的图像识别功能,对第一图像进行识别之后,还包括:

连续采集识别对象的第二图像;

每当采集到一张第二图像,对该张第二图像中的人体或者人脸进行检测;

若检测结果为无人体,且无人脸,或者,检测结果为人体尺寸小于第四阈值,或者,检测结果为人脸尺寸小于第五阈值,则确定识别完成,停止第二图像的连续采集,结束图像识别方法。

有益效果:

本申请实施例,采用中焦焦距采集识别对象所在的场景图像,根据场景图像确定识别焦距,采用识别焦距对识别对象进行识别,实现了在无用户的干预和输入的情况下,自动对环境进行识别,基于环境选择适当的焦距达到最好的拍摄效果,进而提升识别精准性,大大提高盲人生活的便利性。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1