一种盲用电子阅读器和助盲阅读方法

文档序号：2527755阅读：204来源：国知局

专利名称：一种盲用电子阅读器和助盲阅读方法
技术领域：
本发明涉及盲人用品技术领域，更具体地说，特别涉及一种盲用电子阅读器和助盲阅读方法。
背景技术：
盲人及视力障碍人士，是社会的弱势群体，视觉能力的缺失使得他们无法以最直观的方式获取信息。盲人获得客观世界中的信息的主要方式为听觉和触摸，因此，如何将客观世界的各种信息转化为盲人能够接受的方式就是本领技术人员的重要研究课题，其中要解决的问题之一就是如何将文字信息传递给盲人。目前，盲人或者视力障碍人士获取文字信息的主要方式有如下几种通过计算机辅助软件把电子文字信息转化为语音；通过辅助设备将纸质文字资料转化为触摸感知的信息；或者通过辅助设备将纸质文字信息转化为语音信息。显然相比较而言，将文字信息转化为声音信息更为直观易懂。现有技术中，有一种盲用电子读书机，包括电源管理模块、系统控制模块、音频驱动模块、收音机处理模块、录音处理模块、显示驱动模块、文字识别模块、语音合成模块、DAISY解析模块、语音导航模块、文件管理模块、系统设置模块和键盘驱动模块等，是将电子文字信息转化为声音信息，盲人使用此读书机来听电子书、daisy书、音乐、收音机，并可以录音，但是对于纸质的文字信息却无法获知。综上所述，现有技术中的盲用电子读书机，存在无法获取纸质文字信息的技术缺陷。

发明内容
本发明要解决的技术问题为提供一种盲用电子阅读器，可以识别纸质文字并转化
为声音信息。为了达到上述目的，本发明的技术方案是这样实现的本发明提供了一种盲用电子阅读器，包括获取单元、OCR识别单元、语音处理单元、电源管理单元、输入单元、中央处理单元、显示屏、ROM存储单元；所述获取单元，用于通过扫描或者拍照将纸质文字转化为电子图片格式数据；所述OCR识别单元，用于通过OCR识别技术将电子图片识别为电子文本文档；所述语音处理单元，用于采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。其中，所述获取单元，包括摄像头和闪光灯，所述摄像头固定设置于所述外壳上，闪光灯设置在外壳内部，与所述摄像头固定连接；所述摄像头与所述ROM存储单元电性连接；所述摄像头为Q302Z ;所述闪光灯为LED闪光灯XL3528SWT4。其中，所述电源管理单元，包括开机键和电源管理芯片；所述开机键设置在所述外壳上，与所述电源管理芯片电性连接；所述电源管理芯片与所述中央处理单元电性连接。其中，所述输入单元为键盘或者触摸屏。
其中，所述语音处理单元包括语音合成单元和声卡；所述语音合成单元与所述声卡电性连接；所述语音合成单元与所述ROM存储单元和所述中央处理单元电性连接。其中，还包括录音单元和收音单元；所述录音单元,包括录音芯片，所述录音芯片与所述ROM存储单元和中央处理单元电性连接；所述收音单元，包括收音芯片，所述收音芯片与所述声卡和中央处理单元电性连接。本发明还公开一种助盲阅读方法，包括步骤步骤A，通过扫描或者拍照将纸质文字转化为电子图片格式数据；步骤B，通过OCR识别技术将电子图片识别为电子文本文档；步骤C，采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。其中,所述步骤A包括步骤将摄像头设置为微距模式，在距纸质文字8-12厘米的距离进行拍摄并存储，将纸质文字转化为电子图片格式数据；和/或，通过便携式CCD扫描棒将将纸质文字扫描成图片并存储，将纸质文字转化为电子图片数据格式。其中，所述步骤C中解码之后播放之前还包括步骤将解码后的Daisy文件按照Smil文件、NCC文件、主文件进行分类后分别解析；按照Daisy的标签格式进行关键字匹配检索，并建立索引，同时按照索引进行文件定位和声音定位。其中，所述步骤B之后、所述步骤C之前还包括步骤将多种结构的电子文本文档的内容进行适配处理转换为统一的组织结构和格式。本发明具有如下技术效果本发明的一种盲用电子阅读器和助盲阅读方法，包括获取单元、OCR识别单元、语音处理单元、电源管理单元、输入单元、中央处理单元、显示屏、ROM存储单元。其中获取单元，可以对文字信息进行拍照或扫描，将纸质文字信息转化为电子图片并存储在所述ROM存储单元，而OCR识别单元通过OCR识别技术将拍摄的文字图片进行识别，识别其中的文字信息，并通过语音处理单元合成为语音并播放，从而实现了将纸质文字转化为声音信息。进一步地，应用daisy文件解码技术，进行关键字匹配检索，可实现根据关键字对文本文档和语音数据文件进行定位；进一步地，将多种结构的电子文本文档的内容进行适配处理转换为统一的组织结构和格式，便于管理和使用。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明的一种盲用电子阅读器的一个实施例的结构示意图；图2为本发明的一种盲用电子阅读器的另一个实施例的结构示意图；图3为本发明的一种助盲阅读方法的一个实施例的流程图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。实施例一本实施例提供了一种盲用电子阅读器，参见图1所示，包括获取单元、OCR识别单元、语音处理单元、电源管理单元、输入单元、中央处理单元、显示屏、ROM存储单元。所述获取单元，用于通过扫描或者拍照将纸质文字转化为电子图片格式数据。所述OCR识别单元，用于采用OCR文字识别技术实现对拍摄或扫描所获取的电子图片中的文字进行识别，转换成电子文本文档后发送至所述ROM存储单元进行存储。所述语音处理单元，用于采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。其中，所述输入单元、所述中央处理单元、所述OCR识别单元、所述语音处理单元、所述显示屏、所述ROM存储单元和所述摄像单元置于该阅读器的外壳内部。所述中央处理单元与所述电源管理单元、所述输入单元、所述OCR识别单元、所述语音处理单元、所述显示屏、所述ROM存储单元和所述摄像单元电性连接。所述ROM存储单元电性连接与所述摄像单元、所述OCR识别单元和所述语音处理单元电性连接。在本实施例中，所述电源管理单元，包括开机键和电源管理芯片。所述开机键设置在所述外壳上，与所述电源管理芯片电性连接；所述电源管理芯片与所述中央处理单元电性连接。其中，所述外壳，用于放置内部各功能部件，采用硬质塑料或者铝合金材质。所述电源管理单元，用于根据用户指令和中央处理单元的控制指令控制该阅读器的开启或者关闭，并将外部的高压交流电源转换为各部件所需要的低压直流电源。所述输入单元，用于输入用户的操作指令，可以为键盘也可以为触摸屏。具体地，如果为触摸屏，应注意该触摸屏应在触摸屏的表面设置相应的凸起，以使盲人知道该凸起所对应的触摸区，或者该触摸屏可通过用户触摸的压力大小和触摸次数或者间隔来判断操作指令。所述中央处理单元，用于对其他各部件进行控制和协调，并进行部分数据处理工作。所述显示屏，用于显示电子文档信息。所述ROM存储单元，用于存储有摄像单元拍摄的图片数据和由OCR识别单元处理后的电子文档数据。优选地，参见图2所示，优选地，该阅读器包括外壳、电源管理单元、输入单元、中央处理单元、OCR识别单元、语音处理单元、显示屏、ROM存储单元、摄像单元、录音单元和收
音单元。在本实施例中，所述电源管理单元，也包括开机键和电源管理芯片，所述电源管理芯片为 XC6206P332MR。所述输入单元，为键盘，设置各种操作命令的按键，用于输入用户的操作指令。例如，可以包括选择当前工作模式的模式切换按键等。优选地，该键盘型号为T06B。在本实施例中，优选地，所述中央处理单元为三星的S3C6410芯片，所述显示屏为LCD 显示屏 EClamp237。在本实施例中，所述语音处理单元包括语音合成单元和声卡。所述语音合成单元与所述声卡电性连接；所述语音合成单元与所述ROM存储单元和所述中央处理单元电性连接。优选地，所述声卡为WM9714LGEFL。在本实施例中，所述摄像单元，包括摄像头和闪光灯，所述摄像头固定设置于所述外壳上，闪光灯设置在外壳内部，与所述摄像头固定连接；所述摄像头与所述ROM存储单元电性连接。在本实施例中，优选地,所述摄像头为自动对焦摄像头，具体地所述摄像头为Q302Z ;和/或，所述闪光灯为LED闪光灯XL3528SWT4。在本实施例中，还包括录音单元和收音单元；所述录音单元，包括录音芯片，所述录音芯片与所述ROM存储单元和中央处理单元电性连接；所述收音单元，包括收音芯片，所述收音芯片与所述声卡和中央处理单元电性连接。优选地，所述录音芯片，型号为KS-6027P，收音芯片的型号为RDA5807HS。本发明实施例一提供的阅读器，能够利用OCR文字识别技术实现将书本上的文字转换成电子文档，然后采用TTS语音合成技术将电子文本转换为声音，让盲人可以真正的无障碍的“听书”。实施例二本实施例提供一种助盲阅读方法，参见图3所示，包括步骤步骤S110，通过扫描或者拍照将纸质文字转化为电子图片格式数据。其中OCR文字识别分为拍照识别和扫描棒识别两种方式，拍照识别是通过自动对焦摄像头的微距模式，在距文字一定的距离进行拍摄，然后将所拍摄的图片通过OCR技术识别为文字，并通过TTS语音播放出来。具体地，将摄像头设置为微距模式，在距纸质文字8-12厘米的距离进行拍摄并存储，将纸质文字转化为电子图片格式数据。优选地，在10厘米距离处进行拍摄。扫描棒识别是通过便携式CCD扫描棒将将纸质文字扫描成图片并存储，将纸质文字转化为电子图片数据格式。具体地，是通过便携式CCD扫描棒将纸质书上的文字扫描成图片存入tf卡，然后将tf卡插入到听书郎上，通过听书郎上面的电子眼的OCR识别功能将图片识别成文字。优选地，使用300万像素cmos摄像头模组进行图像采集和简单的图像预处理。步骤S111，通过OCR识别技术将电子图片识别为电子文本文档。OCR (Optical Character Recognition,光学字符识别)识别，即将扫描仪或数码相机获取的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。
步骤S112，采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。将Daisy文件按照Smil文件、NCC文件、主文件进行分类后分别解析，提取各文件的内容信息、章节信息、音频信息、时间信息以及内容信息、章节信息、音频信息和时间信息的对应关系；根据提取的各种信息和对应关系，进行关键字匹配检索，并建立索引，同时按照索引进行文件定位和声音定位。这样可以实现根据用户输入的关键字对文件进行定位，方便阅读。DAISY书是一种数字有声书，Smil文化和NCC文件和主文件并不是传统意义上的音频文件可以直接播放的，它们里面存放的是DAISY书的内容、章节信息、音频文件等一一对应关系，而这些文件有很多，解析是为了将这些关系建立索引，让音频和文字内容--对应。其中Daisy文件统一存入树形结构，在播放的时候通过标准接口统一调用。优选地，音频播放采用基于DirectShow音频解码播放接口实现,可以同时支持多个音频同时播放。优选地，将多种结构的电子文本文档的内容进行适配处理转换为统一的组织结构和格式。即针对电子书内容结构的多样性，设计一种通用的适合个人数字助理等嵌入式设备的电子书内容组织结构和格式。采用一种形式化描述和自动规则处理机制，将多种结构的电子书内容进行适配处理，形成通用结构的电子书内容，以便后续的统一处理。目前盲人数字助理支持TXT、HTML、DOC等格式文本的逐字、逐句、逐段朗读，满足盲人的多样需求。优选地，还应添加全程语音导航模块，实现该产品的全程语音导航，使盲人能够无障碍的使用本机；同时优选地，基于语音导航可以为盲人定制一款盲人专用的电子词典；并设置基于windows mobile系统的wordpad进行改进编写的电子书，具有同时支持txt、doc两种格式的电子书功能，同时支持文本高亮，自动翻页、自动朗读等功能。本发明的一种盲用电子阅读器和助盲阅读方法，采用基于300万CMOS摄像头或者扫描棒的OCR图像识别技术，实现文字到语音的转化，并可全程语音导航，且带有语音导航的电子词典以及DAISY播放器。优选地，本发明提供的阅读器，还设置统一的调用接口，将word、txt、html三种格式多种结构的的电子文本文档分别进行处理与所述调用接口相适配，使word、txt、html三种格式的电子文本文档以同样的格式显示。将word、txt、html三种格式的文本文档在后台对进行不同处理，在调用接口相同的情况下，达到表面上的统一，并提取其中的文本信息，通过语音合成模块转换为语音信
肩、O最后应说明的是:以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
权利要求
1.一种盲用电子阅读器，其特征在于，包括获取单元、OCR识别单元、语音处理单元、电源管理单元、输入单元、中央处理单元、显示屏、ROM存储单元；所述获取单元，用于通过扫描或者拍照将纸质文字转化为电子图片格式数据；所述OCR识别单元，用于通过OCR识别技术将电子图片识别为电子文本文档；所述语音处理单元，用于采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。
2.根据权利要求1所述的盲用电子阅读器，其特征在于，所述获取单元，包括摄像头和闪光灯，所述摄像头固定设置于所述外壳上，闪光灯设置在外壳内部，与所述摄像头固定连接；所述摄像头与所述ROM存储单兀电性连接；所述摄像头为Q302Z ；所述闪光灯为LED闪光灯XL3528SWT4。
3.根据权利要求1所述的盲用电子阅读器，其特征在于，所述电源管理单元，包括开机键和电源管理芯片；所述开机键设置在所述外壳上，与所述电源管理芯片电性连接；所述电源管理芯片与所述中央处理单元电性连接。
4.根据权利要求1所述的盲用电子阅读器，其特征在于，所述输入单元为键盘或者触摸屏。
5.根据权利要求1所述的盲用电子阅读器，其特征在于，所述语音处理单元包括语音合成单元和声卡；所述语音合成单元与所述声卡电性连接；所述语音合成单元与所述ROM存储单元和所述中央处理单元电性连接。
6.根据权利要求4所述的盲用电子阅读器，其特征在于，还包括录音单元和收音单元；所述录音单元，包括录音芯片，所述录音芯片与所述ROM存储单元和中央处理单元电性连接；所述收音单元，包括收音芯片，所述收音芯片与所述声卡和中央处理单元电性连接。
7.一种助盲阅读方法，其特征在于，包括步骤: 步骤A，通过扫描或者拍照将纸质文字转化为电子图片格式数据；步骤B，通过OCR识别技术将电子图片识别为电子文本文档；步骤C，采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。
8.根据权利要求7所述的助盲阅读方法，其特征在于，所述步骤A包括步骤: 将摄像头设置为微距模式，在距纸质文字8-12厘米的距离进行拍摄并存储，将纸质文字转化为电子图片格式数据；和/或，通过便携式CCD扫描棒将将纸质文字扫描成图片并存储，将纸质文字转化为电子图片数据格式。
9.根据权利要求7所述的助盲阅读方法，其特征在于，所述步骤C中解码包括步骤: 将Daisy文件按照Smil文件、NCC文件、主文件进行分类后分别解析，提取各文件的内容信息、章节信息、音频信息、时间信息以及内容信息、章节信息、音频信息和时间信息的对应关系；根据提取的各种信息和对应关系，进行关键字匹配检索，并建立索引，同时按照索引进行文件定位和声音定位。
10.根据权利要求7所述的助盲阅读方法，其特征在于，所述步骤B之后、所述步骤C之前还包括步骤: 设置统一的调用接口，将word、tXt、html三种格式的电子文本文档分别进行处理与所述调用接口相适配，使word、txt`、html三种格式的电子文本文档以同样的格式显示。
全文摘要
本发明公开了一种盲用电子阅读器，包括获取单元、OCR识别单元、语音处理单元、电源管理单元、输入单元、中央处理单元、显示屏、ROM存储单元；获取单元，用于通过扫描或者拍照将纸质文字转化为电子图片数据；OCR识别单元，用于通过OCR识别技术将电子图片识别为电子文本文档；语音处理单元，用于采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。本发明还公开一种助盲阅读方法，包括步骤通过扫描或者拍照将纸质文字转化为电子图片格式数据；通过OCR识别技术将电子图片识别为电子文本文档；采用TTS语音合成技术将电子文本文档转换为语音数据流后解码并播放。该阅读器和方法有效地帮助盲人阅读纸质文字。
文档编号G09B5/04GK103077625SQ20131003656
公开日2013年5月1日申请日期2013年1月30日优先权日2013年1月30日
发明者李重周, 杨志明申请人:中国盲文出版社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李重周;杨志明
技术所有人：中国盲文出版社
我是此专利的发明人

上一篇：电光学装置、电光学装置的驱动方法以及电子设备的制作方法
上一篇：一种自转角led显示屏的制作方法