一种离线语音ASR解码交互音箱的制作方法

文档序号:25642014发布日期:2021-06-25 16:50阅读:185来源:国知局
一种离线语音ASR解码交互音箱的制作方法

本实用新型涉及交互音箱技术领域,具体为一种离线语音asr解码交互音箱。



背景技术:

智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。典型的应用场景-语音助手,自从iphone4s推出siri后,智能语音交互应用得到飞速发展。中文典型的智能语音交互应用如:虫洞语音助手、讯飞语点已得到越来越多的用户认可。

现有的ai语音交互音箱整体结构固定,外形单一,在语音识别技术,也被称为自动语音识别automaticspeechrecognition,(asr),其目标是将人类的语音中的词汇内容转换为计算机可读的二进制编码或者字符序列。然后计算机通过特定的解码序列转换成识别的内容,现有只能识别输入的语音。



技术实现要素:

本实用新型的目的在于提供一种离线语音asr解码交互音箱,具有采用在txd处加一只反向二极管防止由于采用超低功耗的单片机使电源通过txd对单片机进行供电而造成usrt通信中断,然后采用了可转换模式,就可使本产品的识别方式在咪头和麦克风之间进行转换,使识别方式多样化的优点,解决了现有技术中的问题。

为实现上述目的,本实用新型提供如下技术方案:一种离线语音asr解码交互音箱,包括箱体,所述箱体的底部上安装有底板,底板上分别有usb接口、uart通信电路、主控电路、咪头和语音识别电路,主控电路与传输通道管和解码电路。

优选的,所述语音识别电路的ld3320芯片u0与ys-模块引脚相接,其引脚31与有源晶振连接,引脚34-41八位并口的通讯方式与主控电路23的引脚30-37连接,ld3320芯片u0的引脚13和14与咪头24连接、引脚25和26与麦克风连接,引脚15、16以及引脚27和28与喇叭连接。

优选的,所述主控电路中的stc11l08xe芯片u1的引脚14接在晶振片y1一端和电容c5的并联接口,引脚15接在晶振片y1的另一端和电容c6,电容c5和电容c6供接地并与引脚16并联,stc11l08xe芯片u1的引脚38接在电源开关u2的端角3上。

优选的,所述解码电路中的排针p2的端角1和3与咪头连接,排针p2的端角2、4和6通过spi通信与主控电路连接,排针p2的7-14通过八位并口的通讯方式与主控电路连接,排针p2的端角16、18和20接在麦克风上。

优选的,所述咪头中的音频转换接口p3端角分别与ld3320芯片u0的引脚9和10相接。

优选的,所述uart通信电路中的ch340e通信芯片u3的端角10串联电容c7接地,ch340e通信芯片u3的端角9串联电阻r7接在stc11l08xe芯片u1的引脚7上,ch340e通信芯片u3的端角8接反向二极管d4接在stc11l08xe芯片u1的引脚5上。

与现有技术相比,本实用新型的有益效果如下:

本离线语音asr解码交互音箱,采用一个8位的主控然后配上了实现asr技术的ld3320解码芯片,之间进行目前最快的8位并口通信方式,ld3320将识别的音频信号采集整理然后转化为二进制编码,采用八位的stc11l08位主控,封装形式为lqfp44,特别之处是采用ch340e在txd处加一只反向二极管防止由于采用超低功耗的单片机使电源通过txd对单片机进行供电而造成usrt通信中断,然后采用了可转换模式,通过一个跳线帽,就可使本产品的识别方式在咪头和麦克风之间进行转换,使识别方式多样化。

附图说明

图1为本实用新型的整体结构图;

图2为本实用新型的语音识别电路原理图;

图3为本实用新型的底板电路图。

图中:1、箱体;2、底板;21、usb接口;22、uart通信电路;23、主控电路;24、咪头;25、语音识别电路;3、传输通道管;4、解码电路。

具体实施方式

下面将结合本实用新型实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本实用新型保护的范围。

请参阅图1-2,一种离线语音asr解码交互音箱,包括箱体1,箱体1的底部上安装有底板2,底板2上分别有usb接口21、uart通信电路22、主控电路23、咪头24和语音识别电路25,主控电路23与传输通道管3和解码电路4。

主控电路23中的stc11l08xe芯片u1的引脚14接在晶振片y1一端和电容c5的并联接口,引脚15接在晶振片y1的另一端和电容c6,电容c5和电容c6供接地并与引脚16并联,stc11l08xe芯片u1的引脚38接在电源开关u2的端角3上。

解码电路4中的排针p2的端角1和3与咪头24连接,排针p2的端角2、4和6通过spi通信与主控电路23连接,排针p2的7-14通过八位并口的通讯方式与主控电路23连接,排针p2的端角16、18和20接在麦克风上。

咪头24中的音频转换接口p3端角分别与ld3320芯片u0的引脚9和10相接。

uart通信电路22中的ch340e通信芯片u3的端角10串联电容c7接地,ch340e通信芯片u3的端角9串联电阻r7接在stc11l08xe芯片u1的引脚7上,ch340e通信芯片u3的端角8接反向二极管d4接在stc11l08xe芯片u1的引脚5上。

请参阅图3,语音识别电路25的ld3320芯片u0与ys-模块引脚相接,其引脚31与有源晶振连接,引脚34-41八位并口的通讯方式与主控电路23的引脚30-37连接,ld3320芯片u0的引脚13和14与咪头24连接、引脚25和26与麦克风连接,引脚15、16以及引脚27和28与喇叭连接。

通过采用asr技术的ld3320芯片将从咪头24或麦克风处获取的音频信号进行a/d,d/a数模转换之后将取得的二进制参数进行编码通过spi或8位并口通信传输给底板2上面的主控电路23,主控电路23进行处理后通过对预先存在flash里面的语句进行对拟合对比进而得出相对应的语句,然后主控芯片通过uart通信电路22方式将处理过后的音频信号和语句输出到电脑的上位机中,通过上位机的控制,来以类似对话的形式获取用户所需要的信息,来提升医疗消毒领域人员的工作效率。

本方案采用一个8位的主控然后配上了实现asr技术的ld3320解码芯片,之间进行目前最快的8位并口通信方式,ld3320将识别的音频信号采集整理然后转化为二进制编码,通过8位并口通信传输给主控然后主控将二进制编码进行解析打包通过uart通信电路22用micro接口向电脑以每秒9600次的方式发送数据包给电脑,然后电脑通过上位机来语音播报整个系统目前的实时状况,采用八位的stc11l08位主控,封装形式为lqfp44,特别之处是采用ch340e在txd处加一只反向二极管防止由于采用超低功耗的单片机使电源通过txd对单片机进行供电而造成usrt通信中断,然后采用了可转换模式,通过一个跳线帽,就可使本产品的识别方式在咪头24和麦克风之间进行转换,使识别方式多样化。

综上所述:本离线语音asr解码交互音箱,采用一个8位的主控然后配上了实现asr技术的ld3320解码芯片,之间进行目前最快的8位并口通信方式,ld3320将识别的音频信号采集整理然后转化为二进制编码,采用八位的stc11l08位主控,封装形式为lqfp44,特别之处是采用ch340e在txd处加一只反向二极管防止由于采用超低功耗的单片机使电源通过txd对单片机进行供电而造成usrt通信中断,然后采用了可转换模式,通过一个跳线帽,就可使本产品的识别方式在咪头24和麦克风之间进行转换,使识别方式多样化。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本实用新型的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本实用新型的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本实用新型的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1