基于汉字识别的导盲系统和导盲方法

文档序号：1230590阅读：508来源：国知局

专利名称：基于汉字识别的导盲系统和导盲方法
技术领域：
本发明涉及图像与语音识别技术领域，尤其涉及一种基于汉字识别的导盲系统和导盲方法。
背景技术：
人类摄取的外界信息80%来源于视觉，视觉障碍人群每天在日常生活和社会交往中都会遇到诸多不便。导盲杖和导盲犬作为非常有用的行动辅助系统被非常广泛地采用。但是，使用盲杖的人能感知到的范围非常有限，而导盲犬的价格又十分昂贵。于是，非常有必要发明一种方法，做成硬件设备，使得视觉存在障碍的人们可以方便的通过它理解周围的环境。
经对现有文献的检索发现，陈可中在2003年申请的专利"盲人交叉路口电子导航器"(专利申请号03237354.6，专利公开号CN2638031)中，利用绿灯的亮灭控制继电器，选择提示"绿灯，可以通行"或"红灯，禁止通行"的语音芯片，把相应的语音提示信号放大，经过发送线圈发送，接受线圈感应语音信号经过放大后由扬声器输出，这样用语音提示导盲。但是发送线圈发送的信号是低频信号，很容易受到马路上各种低频信号的干扰，这种导盲只能在红绿灯路口使用，应用范围有限。牛金海等在"视觉假体将光明带给盲人的电子设备" 一文(中国科学E辑信息科学 2007 Vol.37 No. 10 pp. 1354-1362 )中提到的视觉假体，是侵入式的，
即通过电子设备来实现视觉假体。这种手段需要通过手术向患者体内植入芯片或电极，造价甚高，复杂繁琐，很可能导致排异或者炎症，继而性能下降，
3逐步老化，甚至不能使用，而且目前技术尚未成熟，还不能为患者提供十分清晰的视觉。

发明内容
本发明针对上述现有技术的不足，提供了一种基于汉字识别的导盲系统和导盲方法，通过电子设备识别汉字并将其转化成对应汉字语音，辅助盲人的日常生活。
本发明的技术方案是，一种基于汉字识别的导盲系统，其特征是所述导
盲系统包括CCD摄像机、DSP处理平台、耳机和汉字语音库；
其中，CCD摄像机用于摄取汉字图像，并将图像传输给DSP处理平台；
DSP处理平台对摄取的汉字进行数据处理与识别，之后将结果发送给汉字语
音库，由语音库系统通过语音映射找出相应的语音片段，最后通过耳机将汉
字的读音发送出去。
所述DSP处理平台的DSP采用DM642处理器。一种基于汉字识别的导盲方法，其特征是所述方法包括
步骤1:将包含有汉字的图像通过摄像头采集到DSP处理平台；步骤2: DSP处理平台对传入的图像进行预处理，包括倾斜校正和滤除干扰噪声；
步骤3:利用投影-变换系数的汉字识别方法，从图像中提取出汉字；步骤4:将识别出的汉字输出到语音库中，通过语音映射找出相应的语音
片段；
步骤5:从耳机播放出汉字的语音。
本发明的效果在于，采用CCD摄像机结合DSP多媒体处理的模式进行汉字图像识别，速度快且准确率高；该系统和方法突破了传统导盲方式感知的限制；同时相对于视觉假体的技术方案，成本更低，实施更容易。

图1是基于汉字识别的导盲系统示意图。
图2是基于汉字识别的导盲方法流程图。
具体实施例方式
下面结合附图，对优选实施例作详细说明。应该强调的是，下述说明仅仅是示例性的，而不是为了限制本发明的范围及其应用。
图1是基于汉字识别的导盲系统示意图。图1中，CCD摄像机先将汉字图像摄取，并将图像传输给DSP处理平台。DSP处理平台收到采集信息后，首先对摄取的汉字进行数据处理，包括倾斜校正和滤除干扰噪声；而后利用投影-变换系数的汉字识别方法进行识别。识别之后，将结果发送给汉字语音库进行语音处理，语音库系统通过语音映射，找出相应的语音片段。最后，进行语音输出，即将语音片段通过耳机，把汉字的读音发送出去。
图2是基于汉字识别的导盲方法流程图。图2中，步骤201:摄像头先采集包含有汉字的图像到DSP处理平台；DSP处理平台的DSP采用DM642处理器。
步骤202: DSP处理平台对传入的图像进行预处理，包括倾斜校正和滤除干扰噪声。
步骤203:利用投影-变换系数的汉字识别方法，从图像中提取出汉字。步骤204:将识别出的汉字输出到语音库中，通过语音映射找出相应的语音片段。
步骤205:从耳机播放出汉字的语音。
本发明提供的导盲系统，可以做成双目摄像头，即导盲系统有两个CCD 摄像头。可将导盲系统固定放置在盲人的头顶，进行街道路牌上的文字识别。在马路上，盲人戴的导盲系统的摄像头捕获路牌，识别路牌上的汉字，在语音库中寻找对应的语音，然后从耳机中输出汉字对应的语音，告诉盲人所在的是哪一条街。
另外，在超市中，盲人戴的导盲系统的摄像头捕获商品分类标签，识别分类标签上的汉字，在语音库中寻找对应的语音，后从耳机中输出汉字对应的语音，告诉盲人超市中物品的分类区，也可以帮助识别货物架上的商品标签，帮助盲人找到所需物品。
.本发明提供的导盲系统采用CCD摄像机结合DSP处理平台的技术，识别图像范围广、识别率高，而且处理速度快；导盲方法运用成熟的图像处理技术和语音映射技术，处理精确高效。本发明克服了传统导盲方式感知的限制；同时相对于视觉假体的技术方案，成本更低，实施更容易。
以上所述，仅为本发明较佳的具体实施方式
，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。
权利要求
1、一种基于汉字识别的导盲系统，其特征是所述导盲系统包括CCD摄像机、DSP处理平台、耳机和汉字语音库；其中，CCD摄像机用于摄取汉字图像，并将图像传输给DSP处理平台；DSP处理平台对摄取的汉字进行数据处理与识别，之后将结果发送给汉字语音库，由语音库系统通过语音映射找出相应的语音片段；最后通过耳机将汉字的读音发送出去。
2、根据权利要求l所述的一种基于汉字识别的导盲系统，其特征是所述 DSP处理平台的DSP采用DM642处理器。
3、一种基于汉字识别的导盲方法，其特征是所述方法包括步骤1:将包含有汉字的图像通过摄像头采集到DSP处理平台；步骤2: DSP处理平台对传入的图像进行预处理，包括倾斜校正和滤除干扰噪声；步骤3:利用投影-变换系数的汉字识别方法，从图像中提取出汉字；步骤4:将识别出的汉字输出到语音库中，通过语音映射找出相应的语音片段；步骤5:从耳机播放出汉字的语音。
全文摘要
本发明公开了图像与语音识别技术领域中的一种基于汉字识别的导盲系统和导盲方法。技术方案是，所述导盲系统包括CCD摄像机、DSP处理平台、耳机和汉字语音库。所述导盲方法是，摄像头采集包含有汉字的图像到DSP处理平台；DSP处理平台对传入的图像进行预处理；利用投影-变换系数的汉字识别方法，从图像中提取出汉字；将识别出的汉字输出到语音库中，通过语音映射找出相应的语音片段；从耳机播放出汉字的语音。本发明突破了传统导盲方式感知的限制；相对于视觉假体的技术方案，成本更低，实施更容易。
文档编号A61H3/00GK101427969SQ200810187218
公开日2009年5月13日申请日期2008年12月18日优先权日2008年12月18日
发明者牛金海申请人:苏州莱迪斯特电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：牛金海
技术所有人：苏州莱迪斯特电子有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。