一种文字拾取装置和方法与流程

文档序号：12176217阅读：431来源：国知局

本发明涉及终端应用领域，尤其涉及一种文字拾取装置和方法。

背景技术：

目前，盲人或弱视人员因为视力问题在生活中存在诸多不便，例如，到餐厅吃饭时无法一个人通过纸质菜单点菜，出门时无法自己观看公交站牌等，当前，随着各种终端应用的广泛发展，如何将终端应用于盲人或弱视人员的生活中，帮助其解决因视力问题带来的上述困扰，是相关技术人员亟需解决的问题。

技术实现要素：

本发明的主要目的在于提出了一种文字拾取装置和方法，能够通过终端了解文字内容，解决了盲人或弱视人员因视力问题带来的无法阅读的困扰。

为实现上述目的，本发明提供了一种文字拾取装置，该装置包括：拍摄模块和播放模块。

拍摄模块，用于在预设的文字拾取模式下，对自身所在终端的摄像头前的物体进行拍摄。

播放模块，用于将所拍摄的动态图像中的文字转化为语音进行播放。

可选地，该装置还包括：检测模块和模式进入模块。

检测模块，用于检测文字拾取模式的触发条件。

模式进入模块，用于当检测到触发条件并确定该触发条件有效时，进入文字拾取模式。

可选地，拍摄模块对自身所在终端的摄像头前的物体进行拍摄包括：

检测摄像头前的物体；其中该物体上与摄像头相对的一面上包括文字信息。

根据预设条件调整焦距。

将包括文字信息的物体中文字部分的中央区域作为拍摄焦点并进行拍摄。

可选地，该装置还包括提醒模块。

提醒模块，用于当该物体上与摄像头相对的一面上不包括文字信息时，发出提醒信息。

提醒信息包括：预设位置上的马达的振动。

可选地，预设条件包括：文字大小。

拍摄模块根据预设条件调整焦距包括：

检测当前焦距下动态图像中的文字大小。

将检测出的文字大小与预设的文字尺寸相比较。

当检测出的文字大小与预设的文字尺寸一致时保持当前焦距。

当检测出的文字大小与预设的文字尺寸不一致时，调整摄像头的焦距为第一焦距，令动态图像中的文字大小与预设的文字尺寸一致。

可选地，该装置还包括：第一确定模块。

第一确定模块，用于在根据预设条件调整焦距之前，根据用户的指纹尺寸确定预设的文字尺寸。

可选地，第一确定模块根据用户的指纹尺寸确定预设的文字尺寸包括：

采集用户触摸终端屏幕时的指纹信息；指纹信息中包括所述指纹尺寸。

从指纹尺寸中提取指纹高度和宽度。

将指纹高度和宽度确定为预设的文字尺寸中的文字高度和宽度。

可选地，该装置还包括：第二确定模块。

第二确定模块，用于检测对所拍摄的动态图像的触摸操作并确定触摸位置。

播放模块，还用于将触摸位置处对应的文字转化为语音进行播放。

可选地，该装置还包括：文字位置确定模块。

文字位置确定模块用于：

在确定触摸位置之后，将触摸位置的坐标与照片中每个文字的坐标相比较，当触摸位置的坐标与动态图像中任意一个文字的坐标一致时，确定触摸位置与文字相对应；当触摸位置的坐标与动态图像中每个文字的坐标均不一致时，确定触摸位置与文字不对应。

可选地，文字位置确定模块还用于：

在确定触摸位置以后，当触摸位置处没有对应文字时，检测距离当前触摸位置最近的第一文字所在的位置。

确定第一文字所在的位置与当前触摸位置的相对方向。

控制相应方向上的预设马达进行振动。

可选地，播放模块将触摸位置处对应的文字转化为语音进行播放包括：

当触摸位置处于一行文字或一列文字所在的直线上时，将一行文字或一列文字转化为语音进行播放。

可选地，该装置还包括：设置模块。

设置模块用于：

将与纵向上相邻的文字均保持预设的第一间距，并且在横向上处于相同的直线上的多个文字作为一行文字。

将与横向上相邻的文字均保持预设的第二间距，并且在纵向上处于相同的直线上的多个文字作为一行文字。

此外，为实现上述目的，本发明还提供了一种文字拾取方法，该方法包括：

在预设的文字拾取模式下，对终端的摄像头前的物体进行拍摄。

将所拍摄的动态图像中的文字转化为语音进行播放。

可选地，该方法还包括：

检测文字拾取模式的触发条件。

当检测到触发条件并确定该触发条件有效时，进入文字拾取模式。

可选地，对自身所在终端的摄像头前的物体进行拍摄包括：

检测摄像头前的物体；其中该物体上与摄像头相对的一面上包括文字信息。

根据预设条件调整焦距。

将包括文字信息的物体中文字部分的中央区域作为拍摄焦点并进行拍摄。

可选地，该方法还包括：

当该物体上与摄像头相对的一面上不包括文字信息时，发出提醒信息。

该提醒信息包括：预设位置上的马达的振动。

可选地，预设条件包括：文字大小。

根据预设条件调整焦距包括：

检测当前焦距下动态图像中的文字大小。

将检测出的文字大小与预设的文字尺寸相比较。

当检测出的文字大小与预设的文字尺寸一致时保持当前焦距。

当检测出的文字大小与预设的文字尺寸不一致时，调整摄像头的焦距为第一焦距，令动态图像中的文字大小与预设的文字尺寸一致。

可选地，该方法还包括：在根据预设条件调整焦距之前，根据用户的指纹尺寸确定预设的文字尺寸。

可选地，根据用户的指纹尺寸确定预设的文字尺寸包括：

采集用户触摸终端屏幕时的指纹信息；该指纹信息中包括指纹尺寸。

从指纹尺寸中提取指纹高度和宽度。

将指纹高度和宽度确定为预设的文字尺寸中的文字高度和宽度。

可选地，该方法还包括：

检测对所拍摄的动态图像的触摸操作并确定触摸位置。

将触摸位置处对应的文字转化为语音进行播放。

可选地，所述方法还包括：

可选地，该方法还包括：

在确定触摸位置以后，当触摸位置处没有对应文字时，检测距离当前触摸位置最近的第一文字所在的位置。

确定第一文字所在的位置与当前触摸位置的相对方向。

控制相应方向上的预设马达进行振动。

可选地，将触摸位置处对应的文字转化为语音进行播放包括：

当触摸位置处于一行文字或一列文字所在的直线上时，将一行文字或一列文字转化为语音进行播放。

可选地，该方法还包括：

将与纵向上相邻的文字均保持预设的第一间距，并且在横向上处于相同的直线上的多个文字作为一行文字。

将与横向上相邻的文字均保持预设的第二间距，并且在纵向上处于相同的直线上的多个文字作为一行文字。

本发明提出了一种文字拾取装置和方法，该装置包括：拍摄模块、第一确定模块和播放模块。拍摄模块在预设的文字拾取模式下，对自身所在终端的摄像头前的物体进行拍摄。播放模块将所拍摄的动态图像中的文字转化为语音进行播放。通过本发明实施例方案，能够通过终端了解文字内容，解决了盲人或弱视人员因视力问题带来的无法阅读的困扰。

附图说明

图1为实现本发明各个实施例一个可选的移动终端的硬件结构示意图；

图2为如图1所示的移动终端的无线通信系统示意图；

图3为本发明实施例的文字拾取装置组成框图；

图4为本发明实施例的文字拾取方法流程图；

图5为本发明实施例的文字拾取方法示意图；

图6为本发明实施例的文字拾取方法中图像太小时用户点击时的示意图；

图7为本发明实施例的文字拾取方法中进行调焦后用户点击时的示意图；

图8为本发明实施例的文字拾取方法中却听提醒马达的实施例示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

现在将参考附图描述实现本发明各个实施例一个可选的移动终端。在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身并没有特定的意义。因此，"模块"与"部件"可以混合地使用。

移动终端可以以各种形式来实施。例如，本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面，假设终端是移动终端。然而，本领域技术人员将理解的是，除了特别用于移动目的的元件之外，根据本发明的实施方式的构造也能够应用于固定类型的终端。

图1为实现本发明各个实施例的移动终端的硬件结构示意。

移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端，但是应理解的是，并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。

无线通信单元110通常包括一个或多个组件，其允许移动终端100与无线通信系统或网络之间的无线电通信。例如，无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。

广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且，广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供，并且在该情况下，广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在，例如，其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地，广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H)，前向链路媒体(MediaFLO^@)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。

移动通信模块112将无线电信号发送到基站(例如，接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。

无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。

短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙^TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂^TM等等。

位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术，GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法，从而根据经度、纬度和高度准确地计算三维当前位置信息。当前，用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外，GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。

A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风1220，相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送，可以根据移动终端的构造提供两个或更多相机1210。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据)，并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。

用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息，并且可以包括键盘、锅仔片、触摸板(例如，检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地，当触摸板以层的形式叠加在显示单元151上时，可以形成触摸屏。

感测单元140检测移动终端100的当前状态，(例如，移动终端100的打开或关闭状态)、移动终端100的位置、用户对于移动终端100的接触(即，触摸输入)的有无、移动终端100的取向、移动终端100的加速或减速移动和方向等等，并且生成用于控制移动终端100的操作的命令或信号。例如，当移动终端100实施为滑动型移动电话时，感测单元140可以感测该滑动型电话是打开还是关闭。另外，感测单元140能够检测电源单元190是否提供电力或者接口单元170是否与外部装置耦接。感测单元140可以包括接近传感器1410将在下面结合触摸屏来对此进行描述。

接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外，具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式，因此，识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。

另外，当移动终端100与外部底座连接时，接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如，音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示单元151、音频输出模块152、警报单元153等等。

显示单元151可以显示在移动终端100中处理的信息。例如，当移动终端100处于电话通话模式时，显示单元151可以显示与通话或其它通信(例如，文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时，显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。

同时，当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时，显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看，这可以称为透明显示器，典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式，移动终端100可以包括两个或更多显示单元(或其它显示装置)，例如，移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。

音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时，将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且，音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。

警报单元153可以提供输出以将事件的发生通知给移动终端100。典型的事件可以包括呼叫接收、消息接收、键信号输入、触摸输入等等。除了音频或视频输出之外，警报单元153可以以不同的方式提供输出以通知事件的发生。例如，警报单元153可以以振动的形式提供输出，当接收到呼叫、消息或一些其它进入通信(incomingcommunication)时，警报单元153可以提供触觉输出(即，振动)以将其通知给用户。通过提供这样的触觉输出，即使在用户的移动电话处于用户的口袋中时，用户也能够识别出各种事件的发生。警报单元153也可以经由显示单元151或音频输出模块152提供通知事件的发生的输出。

存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等，或者可以暂时地存储己经输出或将要输出的数据(例如，电话簿、消息、静态图像、视频等等)。而且，存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。

存储器160可以包括至少一种类型的存储介质，所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且，移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。

控制器180通常控制移动终端的总体操作。例如，控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外，控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块1810，多媒体模块1810可以构造在控制器180内，或者可以构造为与控制器180分离。控制器180可以执行模式识别处理，以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。

电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。

这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施，这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施，在一些情况下，这样的实施方式可以在控制器180中实施。对于软件实施，诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施，软件代码可以存储在存储器160中并且由控制器180执行。

至此，己经按照其功能描述了移动终端。下面，为了简要起见，将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此，本发明能够应用于任何类型的移动终端，并且不限于滑动型移动终端。

如图1中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。

现在将参考图2描述其中根据本发明的移动终端能够操作的通信系统。

这样的通信系统可以使用不同的空中接口和/或物理层。例如，由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地，长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例，下面的描述涉及CDMA通信系统，但是这样的教导同样适用于其它类型的系统。

参考图2，CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造，所述接口包括例如E1/T1、ATM，IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是，如图2中所示的系统可以包括多个BSC2750。

每个BS270可以服务一个或多个分区(或区域)，由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者，每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配，并且每个频率分配具有特定频谱(例如，1.25MHz,5MHz等等)。

分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下，术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者，特定BS270的各分区可以被称为多个蜂窝站。

如图2中所示，广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。如图1中所示的广播接收模块111被设置在移动终端100处以接收由BT295发送的广播信号。在图2中，示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。

在图2中，描绘了多个卫星300，但是理解的是，可以利用任何数目的卫星获得有用的定位信息。如图1中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外，可以使用可以跟踪移动终端的位置的其它技术。另外，至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。

作为无线通信系统的一个典型操作，BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280，其提供用于与PSTN290形成接口的额外的路由服务。类似地，PSTN290与MSC280形成接口，MSC与BSC275形成接口，并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。

基于上述可选的移动终端硬件结构以及通信系统，提出本发明方法各个实施例。

如图3所示，本发明第一实施例提出了一种文字拾取装置1，该装置包括：拍摄模块01和播放模块02。

拍摄模块01，用于在预设的文字拾取模式下，对自身所在终端的摄像头前的物体进行拍摄。

播放模块02，用于将所拍摄的动态图像中的文字转化为语音进行播放。

可选地，该装置还包括：检测模块03和模式进入模块04。

检测模块03，用于检测文字拾取模式的触发条件。

模式进入模块04，用于当检测到触发条件并确定该触发条件有效时，进入文字拾取模式。

可选地，拍摄模块01对自身所在终端的摄像头前的物体进行拍摄包括：

检测摄像头前的物体；其中该物体上与摄像头相对的一面上包括文字信息。

根据预设条件调整焦距。

将包括文字信息的物体中文字部分的中央区域作为拍摄焦点并进行拍摄。

可选地，该装置还包括提醒模块05。

提醒模块，用于当该物体上与摄像头相对的一面上不包括文字信息时，发出提醒信息。

提醒信息包括：预设位置上的马达的振动。

可选地，预设条件包括：文字大小。

拍摄模块01根据预设条件调整焦距包括：

检测当前焦距下动态图像中的文字大小。

将检测出的文字大小与预设的文字尺寸相比较。

当检测出的文字大小与预设的文字尺寸一致时保持当前焦距。

当检测出的文字大小与预设的文字尺寸不一致时，调整摄像头的焦距为第一焦距，令动态图像中的文字大小与预设的文字尺寸一致。

可选地，该装置还包括：第一确定模块06。

第一确定模块06，用于在根据预设条件调整焦距之前，根据用户的指纹尺寸确定预设的文字尺寸。

可选地，第一确定模块06根据用户的指纹尺寸确定预设的文字尺寸包括：

采集用户触摸终端屏幕时的指纹信息；指纹信息中包括所述指纹尺寸。

从指纹尺寸中提取指纹高度和宽度。

将指纹高度和宽度确定为预设的文字尺寸中的文字高度和宽度。

可选地，该装置还包括：第二确定模块07。

第二确定模块07，用于检测对所拍摄的动态图像的触摸操作并确定触摸位置。

播放模块02，还用于将触摸位置处对应的文字转化为语音进行播放。

可选地，该装置还包括：文字位置确定模块08。

文字位置确定模块08用于：

在确定触摸位置之后，将触摸位置的坐标与动态图像中每个文字的坐标相比较，当触摸位置的坐标与动态图像中任意一个文字的坐标一致时，确定触摸位置与文字相对应；当触摸位置的坐标与照片中每个文字的坐标均不一致时，确定触摸位置与文字不对应。

可选地，文字位置确定模块08还用于：

在确定触摸位置以后，当触摸位置处没有对应文字时，检测距离当前触摸位置最近的第一文字所在的位置。

确定第一文字所在的位置与当前触摸位置的相对方向。

控制相应方向上的预设马达进行振动。

可选地，播放模块03将触摸位置处对应的文字转化为语音进行播放包括：

当触摸位置处于一行文字或一列文字所在的直线上时，将一行文字或一列文字转化为语音进行播放。

可选地，该装置还包括：设置模块09。

设置模块09用于：

将与纵向上相邻的文字均保持预设的第一间距，并且在横向上处于相同的直线上的多个文字作为一行文字。

将与横向上相邻的文字均保持预设的第二间距，并且在纵向上处于相同的直线上的多个文字作为一行文字。

此外，为实现上述目的，本发明还提供了一种文字拾取方法，如图4、图5所示，该方法包括S101-S102：

S101、在预设的文字拾取模式下，对终端的摄像头前的物体进行拍摄。

在本发明实施例中，为了帮助盲人或弱视人员阅读纸张、墓碑、牌照等各种物体上的文字，以便于其了解文字内容，本发明实施例方案可以通过终端对该终端前的物体进行拍摄，并且捕捉所拍摄的动态图像中的文字信息，将该文字信息以语音形式播放出来，解决了盲人或弱视人员因视力问题带来的无法阅读的困扰。

在本发明实施例中，为了与一般的拍照或拍摄动作相区别，本发明实施例方案需要在预设的模式下完成，如上述的文字拾取模式，该文字提取模式用于通过终端的摄像头寻找位于摄像头前的、与摄像头相对的一面包含文字信息的物体，并对该物体进行拍摄，将拍摄的动态图像中的文字信息转化成语音信息进行播放。需要说明的是，在进行语音播放时不限于文字信息，还可以是数字信息、符号信息等。并且上述的动态图像可以是通过摄像头拍摄出来的视频图像，也可以是摄像头在拍摄期间捕捉到的实时的动态图像。

在本发明实施例中，可以通过以下方案进入该文字拾取模式。

可选地，该方法还包括S201-S202：

S201、检测文字拾取模式的触发条件。其中，该触发条件包括手指操作和/或语音命令。

在本发明实施例中，终端可以实时地或周期性地检测消息处理模式的触发条件。另外，为了节省终端资源，还可以通过消息通知的方式获取该触发条件，例如，当预设的压力传感器、指纹识别装置、扫描装置、语音识别装置以及按键(该案件包括硬件按键和软件形式的按键)等检测到某种手指操作或语音命令时发出通知消息，以便终端确认该手指操作或语音命令是否为文字拾取模式的触发条件。需要说明的是，该触发条件可以包括但不限于手指操作和/或语音命令。在不同的实施例中，该触发条件可以设置为任意一种可以实施的操作或命令等。例如，该触发条件还可以是一种凌空手势，通过终端中预设的接近传感器来对该凌空手势进行检测。

S202、当检测到触发条件并确定该触发条件有效时，进入文字拾取模式。

在本发明实施例中，通过步骤S201对文字拾取模式的触发条件进行检测以后，还需要确定该触发条件的有效性。例如，当检测到某一个预设的文字拾取模式的触发按键上的按动操作时，需要检测该按动操作的持续时间，当按动操作的持续时间小于或等于预设的时间阈值时则可以确定该按动操作无效，即文字拾取模式的触发条件无效。又例如，当预设的接近传感器检测到触发消息处理模式的凌空手势时，如果该凌空手势的保持时间小于或等于预设的时间阈值，则同样可以确定该凌空手势无效，即文字拾取模式的触发条件无效。通过本发明实施例的方案，可以有效地防止误操作的发生。

在本发明实施例中，当确定检测到的触发条件有效时，便可以触发终端进入预设的文字拾取模式了。在该文字拾取模式下，用户可以对终端前的物体进行拍摄，以便终端将拍摄的动态图像中的文字转化为语音，便于向终端用户播放。

在本发明实施例中，可以通过以下方案对终端前的物体进行拍摄。

可选地，对终端的摄像头前的物体进行拍摄包括S301-S302：

S301、检测摄像头前的物体；其中该物体上与摄像头相对的一面上包括文字信息。

在本发明实施例中，由于预设的文字拾取模式主要是为了将动态图像中的文字进行提取，以便将问题转化为语音进行播放。因此，在文字拾取模式下，终端进行拍摄时会检测终端的拍摄场景中包括文字信息的物体。在本发明实施例中，可以通过预设的图像识别系统完成对文字的检测和识别过程。

可选地，该方法还包括：当该物体上与摄像头相对的一面上不包括文字信息时，发出提醒信息。该提醒信息包括：预设位置上的马达的振动。

在本发明实施例中，在终端拍摄之前，当终端未检测到终端当前的场景中存在包含文字信息的物体时，为了提醒用户变换拍摄场景，尤其是提醒盲人或弱视人员，可以发出预设的提醒信息。需要说明的是，该提醒信息可以包括以下一种或多种：铃声、音乐、语音、振动、闪光灯。例如，可以控制终端预设位置处的马达产生振动。因为终端中可以包括一个或多个马达，分别设置于不同的位置，以实现不同的功能，当终端前的物体不包括文字信息时，仅令某一预定位置的马达产生振动，从而达到提醒用户的目的。该预设位置可以是终端上的任意位置，只要方便用户感知马达的振动即可。

S302、根据预设条件调整焦距。

在本发明实施例中，终端在捕捉到拍摄场景中的包含文字信息的物体以后，需要根据预设的条件对终端摄像头进行调焦，以拍摄出符合预设条件的动态图像。

可选地，该预设条件包括：文字大小。

在本发明实施例中，可以通过调焦将文字部分的文字大小调节到合适的值，以便用户在点击时，防止照片中的文字太小造成点击错误的现象发生，尤其是对于盲人和弱视人员来说，在不需要直接收听由动态图像中的文字信息直接转化成的语音信息时(例如，想要锻炼手指触摸能力时)，可以依靠手指的点击来确定选中的文字并倾听该文字的内容，在看不到或看不清动态图像中的文字的情况下，如果其文字太小，用户容易一直点击错误，如图6所示，这势必为用户带来很差的体验感。因此，需要在拍摄之前先进行调焦，以便拍摄出的动态图像符合要求的文字大小，方便用户点击。

可选地，该方法还包括：在根据预设条件调整焦距之前，根据用户的指纹尺寸确定预设的文字尺寸。

在本发明实施例中，根据上述内容可知，在拍摄之前，需要预先确定该文字大小的标准，以便终端在进行调焦时直接将该预设数值作为调焦的依据。由于预先确定动态图像中的文字大小的标准是为了避免文字太小造成点击错误的现象发生，文字太大时动态图像内能够容纳的文字太少。因此，在本发明实施例中，可以根据用户手指的尺寸或大小来确定动态图像的文字大小的标准。具体地，可以通过以下方案来实现。

可选地，根据用户的指纹尺寸确定预设的文字尺寸包括S401-S402：

S401、采集用户触摸终端屏幕时的指纹信息；该指纹信息中包括指纹尺寸。

在本发明实施例中，终端可以根据用户的历史使用情况在用户曾经触摸终端屏幕时即采集并保存用户的指纹信息，也可以在预设的指纹信息采集模式下采集用户的指纹信息，并从中获取指纹的尺寸信息。

S402、从指纹尺寸中提取指纹高度和宽度。

在本发明实施例中，用户的指纹尺寸中包括指纹的高度和宽度。在本发明实施例方案中，指纹高度是指获取的指纹轮廓中纵向上轮廓线之间的距离最大值；指纹宽度是指获取的指纹轮廓中横向上轮廓线之间的距离最大值。由于每次进行指纹识别时获得的指纹轮廓不可能完全相同，因此可以通过多次采集求平均值的方式获取一个指纹高度和宽度的平均值作为指纹高度和宽度的标准值。另外，为了使得在拍摄时获得足够大的文字大小，可以在多次采集后从中选择一个最大值作为指纹高度和宽度的标准值。

S403、将指纹高度和宽度确定为预设的文字尺寸中的文字高度和宽度。

在本发明实施例中，获得了指纹高度和宽度的标准值以后，便可以将该标准的指纹高度和宽度作为确定文字尺寸的标准了。例如，直接将指纹高度和宽度作为预设的文字尺寸中的文字高度和宽度，或者将指纹高度和宽度扩大预设的比例后作为预设的文字尺寸中的文字高度和宽度。例如该预设比例可以是1％，5％等。这里该预设比例不能设置的太大，以免文字过大使得照片容纳的文字太少。另外，在确定文字大小时，可以不用同时确定出文字大小中的文字高度和宽度，可以根据用户的触摸习惯来确定其中一项即可。例如，用户习惯手指横向触摸，则可以仅确定文字的宽度；用户习惯手指纵向触摸，则可以仅确定文字的高度。

通过以上方案，便可以获取拍摄时文字大小的标准了，根据该标准对摄像头进行调焦便可以获取适合用户的文字动态图像了。

在本发明实施例中，在根据文字大小进行调焦时，具体可以通过以下方案完成调焦工作。

可选地，根据预设条件调整焦距包括S401-S404：

S401、检测当前焦距下动态图像中的文字大小。

在本发明实施例中，根据预设的文字大小进行调焦之前，可以先检测当前焦距下摄像头获取的动态图像中的文字大小，以判断该文字大小是否已经符合预设的标准的文字尺寸，并且便于根据当前文字大小对动态图像进行调整。在本发明实施例中，对于当前焦距下动态图像中的文字大小的检测同样可以通过预设的图像识别装置进行图像识别来实现。

S402、将检测出的文字大小与预设的文字尺寸相比较。

在本发明实施例中，检测出当前焦距下动态图像中的文字大小以后，通过将该文字大小与预设的文字尺寸相比较获取当前焦距下动态图像中的文字大小的具体信息，并且针对不同的比较结果分别进行以下处理。

S403、当检测出的文字大小与预设的文字尺寸一致时保持当前焦距。

在本发明实施例中，当检测出的文字大小与预设的文字尺寸一致时，即检测出的文字大小与预设的文字尺寸完全相同或差异量小于或等于预设的差异量阈值时，既可以将当前焦距作为拍摄焦距。

S404、当检测出的文字大小与预设的文字尺寸不一致时，调整摄像头的焦距为第一焦距，令动态图像中的文字大小与预设的文字尺寸一致。

在本发明实施例中，当检测出的文字大小与预设的文字尺寸不一致时，即检测出的文字大小与预设的文字尺寸完全不相同，并且差异量大于预设的差异量阈值时，则可以对当前焦距进行调整，使得动态图像中的文字大小与预设的文字尺寸保持一致，并将调整后的焦距，即本发明实施例方案中的第一焦距确定为拍摄焦距。

S303、将包括文字信息的物体中文字部分的中央区域作为拍摄焦点并进行拍摄。

在本发明实施例中，确定摄像头的焦距以后，为了使得拍摄出的动态图像以文字部分为主，可以将包括文字信息的物体中文字部分的中央区域作为拍摄焦点。

在本发明实施例中，通过以上调整便可以获得合适的拍摄焦距和焦点了，根据该焦距和焦点进行拍摄便可以获得适合用户的文字图像了。

可选地，检测对所拍摄的动态图像的触摸操作并确定触摸位置；将触摸位置处对应的文字转化为语音进行播放。

在本发明实施例中，通过以上方案进行动态图像拍摄以后，用户便可以根据该动态图像获取照片中的文字信息了。

需要说明的是，终端可以通过图像识别装置提取动态图像中的文字信息，并将提取的文字信息按照动态图像中的位置进行排列，最终获取动态图像中文字信息的电子形式。在获取该文字信息的电子形式以后，可以直接将该电子形式的文字信息转化为语音信息播放出来，也可以在检测到用户对终端屏幕上的动态图像的触摸操作后将相应的文字转化为语音播放出来。具体地，动态图像拍摄完毕后会显示在终端的界面上，用户可以对终端界面上的动态图像进行触摸或点击等操作，终端对该触摸或点击操作进行检测，并确定触摸或点击的位置，以便根据该位置确定其对应的文字，如图7所示。

在本发明实施例中，可以采用任意可以实施的检测方法、算法和装置完成上述的检测方案，对于具体的检测方法、算法和装置不做限制。

在本发明实施例中，由于对于盲人或弱视人员来说，看不到或看不清屏幕动态图像上的具体位置，因此在触摸时很可能所触摸的位置并没有文字。在这种情况下，可以通过以下方案确定触摸位置处是否存在文字。

可选地，该方法还包括：

在确定触摸位置之后，将触摸位置的坐标与动态图像中每个文字的坐标相比较，当触摸位置的坐标与动态图像中任意一个文字的坐标一致时，确定触摸位置与文字相对应；当触摸位置的坐标与动态图像中每个文字的坐标均不一致时，确定触摸位置与文字不对应。

在本发明实施例中，由于终端可以对屏幕上显示的动态图像中的文字根据屏幕左边分别确定各个文字的坐标。同理，终端还可以确定用户的触摸位置的具体坐标，因此，终端可以将用户触摸位置的坐标与每个文字坐标相比较，这两个坐标一致时，说明触摸位置与文字相对应，即触摸位置落在文字上，当这两个坐标不一致时，说明触摸位置与文字不对应，即触摸位置未落在文字上。需要说明的是，在本发明实施例方案中，一致是指完全相同或者差异量小于或等于预设的差异阈值，不一致是指完全不相同或者差异量大于预设的差异阈值。

可选地，该方法还包括S501-S502：

S501、在确定触摸位置以后，当触摸位置处没有对应文字时，检测距离当前触摸位置最近的第一文字所在的位置。

在本发明实施例中，在触摸位置处没有对应文字的情况下，需要终端对用于给予提醒，以便用户及时进行触摸位置的调整。在本发明实施例方案中，终端可以先检测出距离当前的触摸位置最近的文字，并确定出该文字在终端屏幕上的位置，以便用户指导用户将手指移动到相应的位置，如图8所示。具体指导方案可以通过下述方案实现。

S502、确定第一文字所在的位置与当前触摸位置的相对方向。

在本发明实施例中，当确定出距离当前的触摸位置最近的文字，如本发明实施例方案中的第一文字的位置信息以后，如该第一文字在终端屏幕上的坐标，便可以确定出当前触摸位置与该第一文字的位置的相对方向，例如，十点钟方向。

S503、控制相应方向上的预设马达进行振动。

在本发明实施例中，可以预先在终端上设置多个方向指示马达，在步骤S502中确定出第一文字与当前触摸位置的相对方向以后，便可以控制相应方向上的预设马达进行振动，以便指引用户下一步需要调整的方向。在本发明实施例方案中，该马达的具体位置的确定可以是以终端屏幕中心为起点，沿第一文字与当前触摸位置的相对方向延伸所确定的马达，如图8所示。

需要说明的是，在其它实施例中还可以采用其他的指引方案，不限于上述方案。例如，可以通过语音提示的方式给予用户指引，例如，“请向左移动”、“请向上移动”。在本发明实施例中，左边即终端屏幕面向用户时，横坐标负方向所指示的方向；左边即终端屏幕面向用户时，横坐标正方向所指示的方向；上边即终端屏幕面向用户时，纵坐标正方向所指示的方向；下边即终端屏幕面向用户时，纵坐标负方向所指示的方向。

S102、将触摸位置处对应的文字转化为语音进行播放。

在本发明实施例中，通过以上方案检测出用户触摸处的文字以后，或者指引用户触摸到文字以后，便可以将触摸位置处对应的文字转化为语音信息进行播放了。需要说明的是，由于文字信息转化为语音信息已经是比较成熟的技术，在此不再赘述，并且对于选择的转化方法、算法、软件及装置等均不作具体限制。

另外，对于动态图像中的文字到语音的转化过程可以在获取文字动态图像时直接进行，即在拍摄过程中直接进行，也可以在确定用户所触摸的文字以后再进行，具体方式可以根据用户的应用场景自行定义，在此不作限制。

在本发明实施例中，在获取到文字动态图像时直接将动态图像中的文字信息转化为语音信息时，可以直接对动态图像中的文字按照预设顺序，例如从上到下和/或从左到右的顺序进行语音播放，也可以根据上述方案，在用户触摸相应的文字时进行语音播放。为了适合两种播放方式的随意选择，可以预先设置相应的播放模式，例如，选择播放模式和自动播放模式。在选择播放模式下，需要检测用户的触摸操作，从而对触摸位置处对应的文字进行播放。在自动播放模式下，还可以自动按照预设顺序对动态图像中的文字进行语音播放。

另外，在上述的选择播放模式下，为了使得用户快速了解动态图像中的文字内容，提高播放效率，还可以采用以下播放方法。

可选地，将触摸位置处对应的文字转化为语音进行播放包括：

当触摸位置处于一行文字或一列文字所在的直线上时，将一行文字或一列文字转化为语音进行播放。

在本发明实施例中，当检测到用户所触摸位置对应的文字处于一行或一列文字中时，可以直接向用户播放该行或该列文字所对应的内容。另外，如果该行文字具有相邻的一行或多行文字，可以向用户发出提醒，例如，语音提醒，提醒用户是否需要继续播放下一行或上一行的文字内容。同理，如果该行文字具有相邻的一列或多列文字，也可以向用户发出提醒，提醒用户是否需要继续播放下一列或上一列的文字内容。用户可以采用语音确认方式，或这预设的操作确认方式对该提醒进行反馈。终端根据反馈结果播放下一行或下一列文字内容，或者停止播放。

在本发明实施例中，在终端对一行或一列的文字进行识别之前，需要终端预先对一行或一列的概念进行定义，以便终端根据该预先定义去确认是否存在一行或一列文字。具体可以通过以下方案实现。

可选地，该方法还包括：

将与纵向上相邻的文字均保持预设的第一间距，并且在横向上处于相同的直线上的多个文字作为一行文字。

将与横向上相邻的文字均保持预设的第二间距，并且在纵向上处于相同的直线上的多个文字作为一行文字。

在本发明实施例中，终端可以对动态图像中的每个文字与相邻文字的距离进行检测，并且可以确定每一个文字的坐标，根据每个文字的坐标值确定哪些文字在一条直线上。因此，基于上述终端功能，并且根据行与列的概念，便可以确定出一行文字即与纵向上相邻的文字均保持预设的第一间距，并且在横向上处于相同的直线上的多个文字；一列文字即与横向上相邻的文字均保持预设的第二间距，并且在纵向上处于相同的直线上的多个文字。

在本发明实施例中，对于上述方案中的第一间距和第二间距的具体数值不做限制。该第一间距和第二间距可以根据不同的应用场景为不同的数值。

至此，便介绍完了本发明实施例的全部基本特征，需要说明的是，上述内容均是本发明实施例方案的一个或多个具体实施方式，在其它实施例中还可以采用其他的实施方式，任何与本发明实施例相同或相似的实施方式，以及本发明实施例的基本特征的任意组合，均在本发明实施例的保护范围之内。

本发明提出了一种文字拾取装置和方法，该装置包括：拍摄模块和播放模块。拍摄模块在预设的文字拾取模式下，对自身所在终端的摄像头前的物体进行拍摄。播放模块将所拍摄的动态图像中的文字转化为语音进行播放。通过本发明实施例方案，能够通过终端了解文字内容，解决了盲人或弱视人员因视力问题带来的无法阅读的困扰。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李光宇;王猛;
技术所有人：努比亚技术有限公司;
我是此专利的发明人

上一篇：一种原料抓取设备的制作方法与工艺
上一篇：一种改进型钢瓶底座结构的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。