一种基于fpga的语音手势转换装置的制造方法

文档序号:10080376阅读:549来源:国知局
一种基于fpga的语音手势转换装置的制造方法
【技术领域】
[0001]本实用新型涉及语音识别装置,具体涉及在正常人与言语障碍者之间相互交流的一种基于FPGA的语音手势转换装置。
【背景技术】
[0002]根据国家计委统计,我国目前有听力障碍2780万,每年都在剧增,这些人在工作、生活以及外界的交流上出现了严重的障碍,为了解决这些问题,人们制造了许多类型的助听器,它一个小型扩音器,把原本听不到的声音加以扩大,再利用听障者的残余听力,使声音能送到大脑听觉中枢,而感觉到声音。虽然给言语障碍者带来极大方便,但还存在以下不足:
[0003]存在探测语音盲区,在外界环境复杂时干扰多,接受效果不佳,不能满足听力损失严重者的需求;
[0004]外形惹人注目且笨重,需用口袋或挂式耳戴,有损于他们的自尊心;
[0005]当今市场急需一种新型方式来解决以上存在的不足,解决言语障碍者与正常人交流问题。
[0006]申请号为“CN201310033370.0”的中国专利中,公开了名称为“一种语音手势交互翻译装置及其控制方法”的发明专利,包括手势翻译器和语音翻译器;所述手势翻译器,用于获取第一用户的手势动作,与预存的手语数据进行匹配、输出该手势动作对应的词语信息,转换为语音信号进行播放;所述语音翻译器与所述手势翻译器通信连接,用于获取第二用户的语音信号,将所述语音信号转换为文字信息后与预存的手语数据进行匹配、生成该文字信息对应的手势动作,将手势动作按顺序进行显示。该语音翻译器并没有说明其采用何种处理器,而实现同步翻译对处理的处理能力有一定要求,采用普通处理器易存在功耗高、翻译存在一定延时的问题。
【实用新型内容】
[0007]针对上述存在的技术问题,本实用新型提供了一种基于FPGA的语音手势转换装置,以解决言语障碍者与外界交流困难,以及现有语音手势转换装置功耗高、存在转换延时的问题,设计了一种语音手势转换装置,通过FPGA的功能专一性能够有效提高语音转化成手势及文字的速度,实现同时翻译,且该装置功耗低,可持续运行时间长。
[0008]—种基于FPGA的语音手势转换装置,包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的N1sII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。
[0009]进一步的,所述语音输入装置为MIC输入器。
[0010]进一步的,所述显示模块为IXD显示屏。
[0011]进一步的,所述存储模块包括同步动态随机存储器和静态随机存储器。
[0012]进一步的,所述语音编/解码芯片与所述FPGA模块通过I2C总线完成数据的传输。
[0013]本实用新型设置了 FPGA模块作为本语音手势转换装置的处理模块,有效地提高了数据之间转化的速度,通过N1sII处理器实现语音的识别和处理,对应的文字和手势显示于LCD显示屏上,有效地解决言语障碍者与正常人交流问题,且本装置操作方便,识别率高,通过语音识别,手势图像的显示,在正常人和言语障碍的人交流中相当于交流过程中加入一个中枢纽带,带来极大的帮助,具有重大现实价值和意义。
【附图说明】
[0014]为了更清楚地说明本实用新型实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实用新型的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为一种基于FPGA的语音手势转换装置的模块示意图;
[0016]图3为一种基于FPGA的语音手势转换装置的功能流程图;
[0017]图2为训练HMM模型的流程图。
【具体实施方式】
[0018]本实用新型公开了一种基于FPGA的语音手势转换装置,通过FPGA的功能专一性能够有效提高语音转化成手势及文字的速度,实现同时翻译,且该装置功耗低,可持续运行时间长。
[0019]下面将结合本实用新型中的附图,对本实用新型中的技术方案进行清楚、完整地描述,显然,所描述的仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
[0020]参见图1所示,本实用新型公开了一种基于FPGA的语音手势转换装置(FPGA:Field — Programmable Gate Array,即现场可编程门阵列),包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的N1sII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。
[0021]所述语音输入装置为MIC输入器,(MIC:microphone,即麦克风)所述显示模块为LCD显示屏,所述存储模块包括同步动态随机存储器和静态随机存储器,所述语音编/解码芯片与所述FPGA模块通过I2C总线完成数据的传输。
[0022]MIC输入器接受非特定人的说话语音并将语音信号传送给语音编/解码芯片;
[0023]通过语音编/解码芯片的感应器获得实时的语音数字信号,然后将其送至FPGA,在FPGA中采用N1sII处理器实现语音的识别和处理,语音输入后进行预处理和HMM训练,在预处理阶段对音库中的语音数据进行分析,提取相应的语音参数(基频和谱参数),根据提取的语音参数进行建模,建立HMM模型,根据观察状态序列找到产生这一序列的潜在的隐含状态序列,算出每一种隐状态序列组合对应的观察状态序列的概率,概率最大的那个组合对应的就是隐状态序列组合。识别出语音的结果,将语音数字信号转化成文字;
[0024]将文字转换为预先存入存储模块中的手势图像内容,并在LCD上显示手势图像和文字。
[0025]参见图2所示,本装置基于HMM进行语音识别(HMM:hidden Markov model,即隐马尔科夫模型),其识别流程如下:
[0026](1)进行语音输入,将输入语音的特征矢量序列和参考模式库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作为识别的中间候选结果输出;
[0027](2)利用最大似然估计法Viterbi解码器来识别语音的数字码,输入的语音采样值通过预处理提取出特征向量,将每一帧的紧邻矢量指针被送到数字模型,系统选择最大匹配概率的模型;
[0028](3) HTK训练工具使用训练语料和相应的标注文件来估计HMM模型集的参数,最后将语音转换成文字,通过FPGA的处理,将文字内容对应的手势图像和文字在液晶屏LCD上显不ο
[0029]参见图3所示,训练ΗΜΜ模型的流程为:
[0030](1)用户输入若干次语音训练,用户对着麦克风说话,将用于的录音送入语音识别丰吴块;
[0031](2)语音识别模块接受到录音后,系统经过上述预处理和特征提取后得到特征矢量序列,然后通过特征建模模块建立训练语音的参考模式库;
[0032](3)对词汇中的0-10这11个阿拉伯数字和50个简单孤立词进行ΗΜΜ训练。将不同用户和阿拉伯数字的相同加权梅尔倒谱矩阵与编码本进行比较,其相对应的ΗΜΜ模型的观察矢量被发送到Baum-Welch算法来训练输入指针序列模型。通过不同用户寻找P1、P2、Pn的平均值使得到的模型通用化。
[0033]以上内容是结合具体的优选实施方式对本实用新型所作的进一步详细说明,不能认定本实用新型的具体实施只局限于这些说明。对于本实用新型所属技术领域的普通技术人员来说,在不脱离本实用新型构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本实用新型的保护范围。
【主权项】
1.一种基于FPGA的语音手势转换装置,其特征在于,包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的N1sII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。2.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述语音输入装置为MIC输入器。3.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述显示模块为IXD显示屏。4.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述存储模块包括同步动态随机存储器和静态随机存储器。5.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述语音编/解码芯片与所述FPGA模块通过I2C总线完成数据的传输。
【专利摘要】本实用新型公开了一种基于FPGA的语音手势转换装置,包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的NiosII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。本实用新型旨在解决言语障碍者与外界交流困难,以及现有语音手势转换装置功耗高、存在转换延时的问题。
【IPC分类】G06F17/28, G10L15/26
【公开号】CN204990296
【申请号】CN201520743955
【发明人】杨鸿武, 白祖仕, 甘振业
【申请人】西北师范大学
【公开日】2016年1月20日
【申请日】2015年9月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1