一种语音识别模块的制作方法

文档序号:13509555阅读:859来源:国知局

本实用新型属于语音识别领域,具体地涉及一种语音识别模块。



背景技术:

近些年来人工语音智能技术的应用广泛增加,大量的语音识别技术相继运用在各类电子产品当中已经渐渐成为了一种趋势,各类语音识别技术也都有各自的特点。但现有的常见语音识别在实际产品应用上依然存在成本高、开发周期较长的缺陷;功能实现上,环境杂音或者噪音对语音识别效果影响较大,比如当机器正在播放一些反馈语音或者音乐的时候,如果用户这时候发出控制指令,设备不能够快速正确的识别,无法很好的实现打断识别效果。



技术实现要素:

本实用新型的目的在于提供一种语音识别模块用以解决上述的问题。

为实现上述目的,本实用新型采用的技术方案为:一种语音识别模块,包括语音采集单元、语音识别芯片、微处理器、存储单元和语音播放单元,所述语音采集单元的输出端接语音识别芯片的输入端,所述语音识别芯片的输出端分别接微处理器和语音播放单元的输入端,所述存储单元与语音识别芯片连接,所述存储单元用于存储包括语音指令的数据,所述微处理器的控制输出端接外部设备,所述语音识别芯片设有线性回波消除器,所述线性回波消除器用于对语音采集单元采集到的语音信号进行线性回波消除。

进一步的,所述语音识别芯片还包括线性声学回声消除器、降噪单元、非线性声学回声消除器、DSP单元和自动语音识别单元,所述语音采集单元采集到的语音信号依次经过线性声学回声消除器、降噪单元、非线性声学回声消除器、DSP单元和线性回波消除器处理后,传输给自动语音识别单元进行语音识别。

进一步的,所述微处理器为MCU,所述语音识别芯片的输出端通过I2S总线与MCU的输入端连接,所述MCU的控制输出端通过I2S总线接外部设备。

进一步的,所述存储单元为Flash单元,所述Flash单元通过SPI总线与语音识别芯片连接。

进一步的,所述语音采集单元为麦克风单元。

更进一步的,所述麦克风单元的麦克风数量为4个。

进一步的,所述语音播放单元由喇叭来实现。

更进一步的,还包括语音放大单元,所述语音识别芯片的输出端通过语音放大单元接语音播放单元。

进一步的,还包括电源单元,所述电源单元为整个模块供电。

本实用新型的有益技术效果:

1、采用模块化设计,使用方便,体积占用小,开发周期短,成本相对低。

2、语音识别芯片内部集成了全面的语音处理技术如语音消噪、降噪和回声消除等各类技术,显著的提高识别效率,尤其是芯片内部集成了线性回波消除器(LEC),当配置模块后的设备整机本身正在播放一些反馈语音或音乐,如果用户这时候发出控制指令,设备能够快速实现打断识别效果,并正确的识别人声命令来做出回应,实现精准的识别率。

附图说明

图1为本实用新型具体实施例的结构框图。

具体实施方式

现结合附图和具体实施方式对本实用新型进一步说明。

如图1所示,一种语音识别模块,包括电源单元1、语音采集单元2、语音识别芯片8、微处理器4、存储单元3和语音播放单元7。

电源单元1为整个语音识别模块供电,本具体实施例中,电源单元1接语音识别芯片8,通过语音识别芯片8为整个语音识别模块供电。电源单元1可以是电池单元或适配器单元。

所述语音采集单元2用于采集用户语音指令,并将采集到的语音信号传输给语音识别芯片8。本具体实施例中,语音采集单元2为麦克风单元,麦克风单元2的麦克风可以根据实际应用选择至多4个,避免相关拾音方位的影响。

所述语音识别芯片8对麦克风单元2传输过来的语音信号进行处理和识别,并将识别的语音指令传输给微处理器4,微处理器4根据接收到的语音指令输出相关动作指令给到外部设备5进行动作处理。

本具体实施例中,微处理器4为MCU,当然,在其它实施例中,也可以是单片机或PLC控制器等。MCU4通过I2S总线与语音识别芯片8连接,MCU4的控制输出端通过I2S总线接外部设备5。

所述存储单元3与语音识别芯片8连接,所述存储单元3用于存储包括语音指令的数据,其大小根据语音指令的需求数据大小进行选择。本具体实施例中,存储单元3为Flash单元,Flash单元3通过SPI总线与语音识别芯片8连接。当然,在其它实施例中,存储单元3也可以是EEPRON等其它存储单元,此是本领域技术人员可以轻易实现的,不再详细说明。

语音识别芯片8根据识别的语音指令调用Flash单元3存储的对应反馈语音指令,反馈语音指令经过语音识别芯片8处理后发送给语音播放单元7进行播放反馈,以确定识别的语音指令是否正确,防止对外部设备5进行误操作。

本具体实施例中,语音播放单元7为喇叭单元,当然,在其它实施例中,语音播放单元7也可以是其它可以进行语音播报的单元,此是本领域技术人员可以轻易实现的,不再详细说明。

本具体实施例中,所述语音识别芯片8包括线性声学回声消除器(AEC)81、降噪单元(NR)82、非线性声学回声消除器(NLAEC)83、DSP单元84、线性回波消除器(LEC)85和自动语音识别单元(ASR)86,所述麦克风单元2采集到的语音信号依次经过线性声学回声消除器(AEC)81、降噪单元(NR)82、非线性声学回声消除器(NLAEC)83、DSP单元84和线性回波消除器(LEC)85处理后,传输给自动语音识别单元(ASR)86进行语音识别,得到识别的语音指令。

其中,线性声学回声消除器(AEC)81、降噪单元(NR)82、非线性声学回声消除器(NLAEC)83、DSP单元84、线性回波消除器(LEC)85和自动语音识别单元(ASR)86均为比较成熟的技术,具体可以参照现有技术,此是本领域技术人员可以轻易实现的,不再详细说明。

当然,语音识别芯片8还可以根据实际需要包括增益单元等,此是本领域技术人员可以轻易实现的,不再详细说明。

本具体实施例中,还包括语音放大单元6,所述语音识别芯片8的输出端通过语音放大单元6接语音播放单元7。反馈语音指令经过语音识别芯片8处理后发送给语音放大单元6放大后,再输出至语音播放单元7进行播放反馈,以确定识别的语音指令是否正确,防止对外部设备5进行误操作。语音放大单元6采用现有的语音放大芯片,此是本领域技术人员可以轻易实现的,不再详细说明。

工作过程:电源模块1给整个模块供电,语音识别芯片8就开始一直处于待触发的状态,当麦克风单元2接收到语音触发指令并识别通过,那么语音识别芯片8在设定的时间内(超出设定时间进行语音指令输入将需要重新输入触发词命令进行触发语音识别芯片8)都处于待接收语音指令的状态,当麦克风单元2在设定的时间内再次接收到相关语音指令后,将采集到的语音信号发送给语音识别芯片8,语音识别芯片8对接收到的语音信号进行识别,并将识别的语音指令传输给微处理器4,微处理器4根据接收到的语音指令输出相关动作指令给到外部设备5进行动作处理,同时,语音识别芯片8根据识别的语音指令调用Flash单元3存储的对应反馈语音指令,反馈语音指令经过语音识别芯片8处理后发送给语音放大单元6放大后,再输出至语音播放单元7进行播放反馈,以确定识别的语音指令是否正确,防止对外部设备5进行误操作。

本实用新型采用模块化设计,使用方便,体积占用小,开发周期短,成本相对低;语音识别芯片内部集成了全面的语音处理技术如语音消噪、降噪和回声消除等各类技术,显著的提高识别效率,尤其是芯片内部集成了线性回波消除器(LEC),当配置模块后的设备整机本身正在播放一些反馈语音或音乐,如果用户这时候发出控制指令,设备能够快速实现打断识别效果,并正确的识别人声命令来做出回应,实现精准的识别率。

尽管结合优选实施方案具体展示和介绍了本实用新型,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本实用新型的精神和范围内,在形式上和细节上可以对本实用新型做出各种变化,均为本实用新型的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1