一种针对视力障碍人群的辅助阅读眼镜的制作方法

文档序号：6620368阅读：374来源：国知局

一种针对视力障碍人群的辅助阅读眼镜的制作方法【专利摘要】本发明涉及一种针对视力障碍人群的辅助阅读眼镜，包括安装在眼镜上的微型摄像头、处理器、文本转语音模块、安装到眼镜架的上耳机以及电源；本发明将微型摄像头摄取的文本文件图像经处理器处理为文本文件，再将文本文件经文本转语音模块转换为音频文件，音频文件经耳机输出。由于本发明通过图片转文字信息以及文字转语音信息后，通过耳机输出文字信息的语音信号，使得视力障碍人群能够通过本发明直接阅读文本文件，给视力障碍人群的阅读代来极大的方便。【专利说明】-种针对视力障碍人群的辅助阅读眼镜【
技术领域：
】[0001]本发明是属于便携式智能终端【
技术领域：
】，特别是一种达到文字识别和朗读功能的针对视力障碍人群的辅助阅读眼镜。【
背景技术：
】[0002]随着科技高速的发展，越来越多的可穿戴智能设备，出现在人们的视线中，如智能手机、智能手表、智能眼镜等。但日益严重的视力问题困扰着视力障碍人群，阅读对于视力障碍人群来说俨然已经成为一个不可忽视的问题，如何利用现有的技术帮助视力障碍人群阅读也正成逐渐被关注。[0003]在现有的智能眼镜中，更多的是考虑到娱乐性质。如谷歌眼镜可以通过声音控制拍照、视频通话和辨明方向，以及上网冲浪、处理文字信息和电子邮件，它更多的是将功能集中在利用眼镜进行娱乐社交，如将拍摄到的图片通过语音指令上传到网络上或者通过眼镜和好友进行视频聊天，这些功能更多的是利用了现有的技术让穿戴着拥有更好的娱乐体验而没有涉及到辅助阅读模块。如何准确的获取图片，然后进行识别，最后进行语音输出是辅助阅读眼镜的关键，现有对文字识别技术主要有笔输入识别，OCR技术识别，扫描设备识别三大类：[0004]笔输入识别：笔输入是利用一支定位笔（Stylus)在一块与计算机相连的书写板上写字，利用压敏或电磁感应的原理，将笔在书写板（tablet)上运动轨迹的坐标输入给计算机，计算机运行识别软件，将汉字笔迹图形转变成汉字的标准代码。笔输入的核心技术就是识别软件，通常称为"联机（on-line)"手写汉字识别系统，它是一种最自然、最简单的汉字输入方式，为计算机增加了一种汉字非键盘输入的新功能。[0005]OCR技术识别：0CR(opticalcharacterrecognition,光学符号识别）输入系统是一种汉字文稿的自动输入方式，将一份文稿的图像输入给计算机，计算机取出每个文字的图像，将其转换成汉字的编码。由于是对扫描后所接受的图像文件进行处理、识别，统称"脱机（off-line)"汉字识别系统。[0006]扫描设备识别：扫描输入设备是一种高精度的光电一体化产品，它将汉字文稿通过电荷稱合器件CCD(chargecoupleddevice)检测文稿的光信号转换为电信号，经过模拟/数字转换器转化为数字信号传输给计算机。计算机接受的是文稿的数字图像，其图像上的汉字可能是印刷汉字，也可能是手写汉字，然后对这些图像中的汉字进行识别。[0007]目前国内外对文字识别技术都有一定的研究，笔输入识别由于设备复杂，不便于携带且造价相对昂贵，所以现在基本很少被使用。扫描设备识别技术识别精度较高，且识别范围广泛，但由于扫描设备造价昂贵，不便于携带，扫描设备识别很少应用于便携式设备。OCR技术识别简单，精度较高，适用于便携设备先已被广泛用于金融，保险，税务，工商，电子商务，快递业。由于可编程的智能芯片的高速发展，OCR应用前景愈加广泛，技术也愈加成熟。[0008]现有利用OCR技术的识别软件也越来越多，但市场上还没有一款利用OCR技术的辅助阅读眼镜，所以针对现状，本发明提出一种针对视力障碍人群的辅助阅读眼镜设备。它具有组装简单，识别精度高，便于携带，试用人群广泛，造价低廉等优势，能较好的解决现有的视力障碍人群阅读困难的问题。【
发明内容】[0009]本发明的目的是提供一种利用将嵌入在眼镜上的摄像头摄取到的图片信息送入微处理器处理，最后转换成微处理器和语音播放设备能够识别的信号进行播放的针对视力障碍人群的辅助阅读眼镜，以克服现有技术的不足。[0010]为了实现上述目的，本发明所采用的技术方案是：[0011]一种针对视力障碍人群的辅助阅读眼镜，其特点是：所述眼镜包括：[0012]微型摄像头：嵌入在眼镜上，用于将摄取到图片传输给处理器；[0013]处理器：用于将接收到的图片进行文字识别，并将识别后的文字转换为文本信息；[0014]文本转语音模块：将处理器输出的文本信息转换成语音信号（音频文件）；[0015]耳机：安装到眼镜架的上，将文本转语音模块输出的语音信号进行播放。[0016]电源：用于给微型摄像头、处理器以及文本转语音模块提供电源。[0017]还包括：[0018]内存卡：存储程序和自然语言词语数据库；[0019]自然语言处理模块：将处理器中识别到文本信息与内存卡中的自然语言词语数据库中的信息进行匹配，匹配成功后输出给文本转语音模块。[0020]所述微型摄像头为两个，将两个摄像头的焦点设置在一个点上，两个摄像头摄取到的图片基本相同。[0021]本发明还提供一种所述针对视力障碍人群的辅助阅读眼镜的实施方法，所述实施方法包括以下步骤：[0022]第一步骤：启用微型摄像头，拍摄获取图像；[0023]第二步骤：将拍摄到的图像传送至处理器，在处理器中对图像进行灰度化，二值化，分割，提取，将图像转换成处理器能够识别的数字量；[0024]第三步骤：处理器利用线性检测倾斜法对图像进行检测矫正；完成后，对图像进行文本切割，即在文本上选择标度，将需要的文本信息切割出来；切割出来的文本进行精确化；精确化后的文本信息再进行统计特征提取，将需要的文本提取出来转换为计算机信息存储；[0025]第四步骤：将存储文本信息送入自然语言处理模块，自然语言处理模块将文本信息与内存卡中的自然语言词语数据库中的信息进行匹配，在自然语言词语数据库中，存有常用的自然词语组合，将提取到的文本信息与库中词语进行匹配，匹配成功后输出到文本转语首t旲块；[0026]第五步骤：文本转语音模块成功识别的文本信息通过耳机输出语音。[0027]由于本发明通过图片转文字信息以及文字转语音信息后，通过耳机输出文字信息的语音信号，使得视力障碍人群能够通过本发明直接阅读文本文件，给视力障碍人群的阅读代来极大的方便。【专利附图】【附图说明】[0028]图1为本发明的原理框图。[0029]图2为本发明的实现流程图。具体实施方案[0030]下面结合附图和实施例对本发明作进一步的详细描述。[0031]图1是本发明的原理框图，具体实施包括一下步骤：[0032]启用微型摄像头，摄像头对焦函数自动开始执行，在目标文本区域选取焦点进行对焦拍摄获取图像。[0033]将拍摄到的图像送数字图像处理器，在数字图像处理器中对图像进行灰度化，二值化，分割，提取，将图像转换成处理器能够识别的数字量：[0034]A.灰度化：将采集到的RGB图片转换为灰度图片；[0035]B.降噪：用灰度线性相加法，提高信噪比；[0036]C.二值化：分析待处理的灰度图像，在一定范围内筛选出一个合适的阈值，进而确定该范围内每一像素点是属于目标点还是背景点，最终生成二值化图像；[0037]处理器选择0MAP4430MCU，该MCU是可编程MCU，事先将编写好的OCR识别程序烧入MCU中，在数字图像处理器处理得到的数字图像送入该处理器后，处理器首先对图像进行倾斜检测和矫正，利用线性检测倾斜法进行检测矫正；完成后，对图像进行文本切割，即在文本上选择标度，将需要的文本信息切割出来；切割出来的文本进行精确化；精确化后的文本信息再进行统计特征提取，将需要的文本提取出来转换为计算机信息存储：[0038]A.倾斜检测：图像有可能倾斜，所以利用投影法进行倾斜检测。当文档未倾斜时，其水平投影具有某些显著的特征，如振幅和频率在水平方向上具有最大值，波峰和波谷各自的间距分别对应于字符的高度和行间距。基于投影的方法正是利用图像在倾斜方向投影的特殊性，来测试图像是否倾斜，该方法一般沿若干角度方向投影，根据这些投影的某些特征的特殊性（如均方差特征在投影方向和倾斜方向吻合时最大）来求得文本倾斜角。[0039]B.如果检测到文本有倾斜，需要选择笛卡尔坐标系矫正法进行倾斜矫正；[0040]C.文本信息分析：图片经过上述处理过程后，已经将文字信息显示出来，文字为黑色，背景为白色，选择利用投影的方法进行文本信息分析，将需要的文字信息分析出来；[0041]D.将文本信息分析出来后，利用区域迭代分割法进行分割；[0042]E.文字归一化：对文本进行归一化处理，文字归一化处理主要是方便后续的处理运算，选择利用线性归一化的方法，即按照比例对图像进行伸缩变换；[0043]F.文字细化：归一化后，有可能出现文字的变形，这个时候就需要对文字信息进行细化方便后续处理，细化过程选择利用串行算法，该算法用mXn的窗口对字符像素点进行逐一判断，如果满足删除条件，则直接删除。[0044]G.文字特征提取：将细化后的文本信息特征提取出来方便微处理器处理，文字特征提取时选择利用文本图像信息统计方法提取。[0045]文字识别处理处理后的图像已经是计算机信息，将这些信息送入自然语言库，在自然语言库中，存有常用的自然词语组合，将提取到的文本信息与库中词语进行匹配，匹配成功后然后输出到语音模块。[0046]最后的语音输出模块是对成功识别的文本信息进行语音输出，利用入耳式耳塞输出。[0047]本发明所有的需要电源供电的模块都利用嵌入到眼镜镜框中的微型锂电池进行供电，为了保证电池的可重复利用，在镜框架下预留了MUSB口，当电池电量用完后用常见的充电线即可对电源充电。[0048]端口驱动部分，是事先编写好的程序，为了保证电源能够给各个部分正常供电以及信息在各个处理器中正常的流动，需要对每个处理进行端口驱动，本发明选择常用的数据端口驱动，让数据能够正常的传递，以及最后的输出。[0049]图2是整体的软件流程图：[0050]其中摄像头采集，利用事先在MCU中的应用程序接口将需要的程序写入MCU，如实时对焦函数，图像传送函数等，以此来控制摄像头采集的正常工作。[0051]数字图像处理器中存储有事先编写好的数字图像处理程序，在摄像头将图像传送过来后进行程序执行，对图像进行处理，最后再对处理后的图像进行判断，如果处理成功则送入下个处理器处理，如果不成功，则让摄像头继续采集处理。[0052]处理器部分存储有OCR识别模块程序，其中包括每个模块的算法程序，当送入图像信息后，执行OCR程序对图像信息进行识别，同样在最后也对识别结果进行判断，识别成功后就送入到下个模块，识别不成功就继续识别直至识别成功为止，以此保证识别精度。[0053]自然语言处理库则是对识别到的文本信息进行再一次的精确匹配，保证最后输入到语音模块的文本信息是能够被接受的文本，保证了文本信息的完整可读性。[0054]最后的文本转语音模块则是对识别到的精确文本信息进行转换，转换成能被耳机输出的语音信号，从而达到朗读的目的。[0055]本发明方法不限于眼镜，也可以在其他便携式设备上实施，方法与上述方法类似，不再赘述。[0056]本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。【权利要求】1.一种针对视力障碍人群的辅助阅读眼镜，其特征在于：所述眼镜包括：微型摄像头：嵌入在眼镜上，用于将摄取到图片传输给处理器；处理器：用于将接收到的图片进行文字识别，并将识别后的文字转换为文本信息；文本转语音模块：将处理器输出的文本信息转换成语音信号；耳机：安装到眼镜架的上，将文本转语音模块输出的语音信号进行播放。电源：用于给微型摄像头、处理器以及文本转语音模块提供电源。2.如权利要求1所述的针对视力障碍人群的辅助阅读眼镜，其特征在于：还包括：内存卡：存储程序和自然语言词语数据库；自然语言处理模块：将处理器中识别到文本信息与内存卡中的自然语言词语数据库中的信息进行匹配，匹配成功后输出给文本转语音模块。3.如权利要求1所述的针对视力障碍人群的辅助阅读眼镜，其特征在于：所述微型摄像头为两个，将两个摄像头的焦点设置在一个点上，两个摄像头摄取到的图片基本相同。4.一种利用权利要求1-3任一项所述的针对视力障碍人群的辅助阅读眼镜的实施方法，其特征在于：所述实施方法包括以下步骤：第一步骤：启用微型摄像头，拍摄获取图像；第二步骤：将拍摄到的图像传送至处理器，在处理器中对图像进行灰度化，二值化，分害!]，提取，将图像转换成处理器能够识别的数字量；第三步骤：处理器利用线性检测倾斜法对图像进行检测矫正；完成后，对图像进行文本切割，即在文本上选择标度，将需要的文本信息切割出来；切割出来的文本进行精确化；精确化后的文本信息再进行统计特征提取，将需要的文本提取出来转换为计算机信息存储；第四步骤：将存储文本信息送入自然语言处理模块，自然语言处理模块将文本信息与内存卡中的自然语言词语数据库中的信息进行匹配，在自然语言词语数据库中，存有常用的自然词语组合，将提取到的文本信息与库中词语进行匹配，匹配成功后输出到文本转语音模块；第五步骤：文本转语音模块成功识别的文本信息通过耳机输出语音。5.如权利要求4所述的针对视力障碍人群的辅助阅读眼镜的实施方法，其特征在于：所述第二步骤具体为：A.灰度化：将采集到的RGB图片转换为灰度图片；B.降噪：用灰度线性相加法，提高信噪比；C.二值化：分析待处理的灰度图像，在一定范围内筛选出一个合适的阈值，进而确定该范围内每一像素点是属于目标点还是背景点，最终生成二值化图像。6.如权利要求4所述的针对视力障碍人群的辅助阅读眼镜的实施方法，其特征在于：所述第三步骤具体为：A.倾斜检测：利用投影法对文档进行倾斜检测，当文档未倾斜时，到步骤C;B.如果检测到文本有倾斜，选择笛卡尔坐标系矫正法对文档进行倾斜矫正；C.文本信息分析：图片经过上述处理过程后，已经将文字信息显示出来，文字为黑色，背景为白色，利用投影的方法进行文本信息分析，将需要的文字信息分析出来；D.将文本信息分析出来后，利用区域迭代分割法进行分割；E.文字归一化：利用线性归一化的方法对文本进行归一化处理，即按照比例对图像进行伸缩变换；F.文字细化：归一化后，利用串行算法对字符像素点进行逐一判断；G.文字特征提取：将细化后的文本信息利用文本图像信息统计方法提取转换为计算机信息存储。【文档编号】G06K9/46GK104143084SQ201410340235【公开日】2014年11月12日申请日期:2014年7月17日优先权日:2014年7月17日【发明者】肖攸安,陈明,周萧申请人:武汉理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖攸安;陈明;周萧
技术所有人：武汉理工大学
我是此专利的发明人

上一篇：一种基于文件头和压缩参数的jpeg图片原始性检测方法
上一篇：一种笔记本电脑防盗系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。