一种多维语音特征提取实时可视化装置

文档序号：34828870发布日期：2023-07-20 11:51阅读：35来源：国知局

本技术涉及一种实时语音可视化设备，具体为一种多维语音特征提取实时可视化装置。

背景技术：

1、语音特征提取是指对语音信号进行分析，将声音转换成计算机可识别的数字序列或向量，提取出具有代表性的特征参数。通常情况下，用于语音识别和声音分类等任务中的语音特征有很多，而对这些多维语音特征进行可视化处理，实现图形化显示，便于数据理解与分析，有利于发现隐藏在语音数据中的现象和规律。

2、现有设备虽能对语音特征进行可视化处理，但无法实现实时的可视化操作，仍需人工提取语音特征进而进行可视化呈现，提取过程所使用的设备复杂，携带、安装不方便，甚至需要组装，导致提取操作繁琐且耗时长，工作效率低，限制了语音数据的分析进程。

技术实现思路

1、本实用新型的目的在于提供一种多维语音特征提取实时可视化装置，支持用户一边进行语音输入，一边进行实时的语音特征提取及可视化呈现，具备快速、简单、易操作的优点，解决了现有语音特征提取及可视化技术中不易操作且费时的问题。

2、为实现上述目的，本实用新型提供如下技术方案：一种多维语音特征提取实时可视化装置，包括语音录入、语音特征提取和语音可视化三大模块。所述语音录入模块用于采集用户语音，包括麦克风与声卡，与主体连接。所述语音特征提取模块用于对用户音频进行语音识别与语音特征提取，包括装置主体内部的中央处理器和存储器，连接语音录入模块和语音可视化模块。所述语音可视化模块用于对已提取的语音特征进行时频域转换，以频谱图的形式呈现语音特征，与显示器相连，通过显示屏呈现语音波形图。

3、在一种实施方式中，本实用新型提供的装置，包括壳体(1)、控制面板(2)和显示屏(10)，所述壳体(1)表面嵌有显示屏(10)和电源键(11)，与控制面板(2)相连，所述控制面板(2)上表面接有麦克风(5)，所述麦克风(5)底部与收纳凹槽(6)相连，所述麦克风(5)右侧设有音量旋钮(8)与选择按键(7)，所述控制面板(2)正面嵌有规则排列的扩音孔(9)，所述控制面板一侧嵌有充电口(3)与usb接口(4)，所述控制面板(2)内部设有声卡(12)、中央处理器(13)和存储器(14)。

4、在一种实施方式中，所述显示屏(10)嵌于壳体(1)表面，与控制面板(2)固定连接。

5、在一种实施方式中，所述麦克风(5)底部与收纳凹槽(6)旋转相连，可旋转调整方向或平行置于收纳凹槽(6)内。

6、在一种实施方式中，所述选择按键(7)包括3个按键(7)：中部的开始/暂停/确认按键(7)，左右两侧的选择按键(7)。

7、在一种实施方式中，语音录入模块包括麦克风与声卡，用于接收音频信号并将音频信号转化为数字信号。

8、在一种实施方式中，语音特征提取模块的存储器用于存储进行语音分析的音频，中央处理器用于实时提取所录入音频的多维度语音特征。对音频进行预加重、分帧、加窗、端点检测等预处理后，提取语音段。通过快速傅里叶变换进行频域转换，利用梅尔倒谱系数提取25维语音特征。

9、在一种实施方式中，语音可视化模块与语音特征提取模块相连，语音处理模块完成语音特征提取之后，对语音信号的时域和频域信息进行实时加工，通过显示器实现语音特征的图形化显示。

10、与现有技术相比，本实用新型具有以下有益效果：

11、本实用新型将语音录入、语音特征提取以及语音可视化模块相连，通过中央处理器进行实时的语音信号的分析与可视化处理，通过显示器进行图形化呈现，实现了多维语音特征实时提取与可视化在线处理，避免了现有技术中离线操作语音特征提取及可视化带来的繁琐程序，简单易操作的同时又节省了语音数据分析的时间。同时，通过体积较小的壳体(1)、控制面板(2)和显示屏(10)的结构设计，能够实现利用小体积装置进行语音特征提取，简化语音提取过程，同时简化语音提取所需设备。

技术特征：

1.一种多维语音特征提取实时可视化装置，包括壳体(1)、控制面板(2)和显示屏(10)，其特征在于：所述壳体(1)表面嵌有显示屏(10)和电源键(11)，与控制面板(2)相连，所述控制面板(2)上表面接有麦克风(5)，所述麦克风(5)底部与收纳凹槽(6)相连，所述麦克风(5)右侧设有音量旋钮(8)与选择按键(7)，所述控制面板(2)正面嵌有规则排列的扩音孔(9)，所述控制面板一侧嵌有充电口(3)与usb接口(4)，所述控制面板(2)内部设有声卡(12)、中央处理器(13)和存储器(14)。

2.根据权利要求1所述的一种多维语音特征提取实时可视化装置，其特征在于：所述显示屏(10)嵌于壳体(1)表面，与控制面板(2)固定连接。

3.根据权利要求1所述的一种多维语音特征提取实时可视化装置，其特征在于：所述麦克风(5)底部与收纳凹槽(6)旋转相连，可旋转调整方向或平行置于收纳凹槽(6)内。

4.根据权利要求1所述的一种多维语音特征提取实时可视化装置，其特征在于：所述选择按键(7)包括3个按键：中部的开始/暂停/确认按键，左右两侧的选择按键。

技术总结
本技术公开了一种多维语音特征提取实时可视化装置，涉及智能交互技术的设备结构，应用于语音识别技术领域，包括：壳体和控制面板。所述壳体表面嵌有显示屏，与控制面板固定相连。所述控制面板为矩形结构，且控制面板的内部安装有中央处理器，并且控制面板的上表面安装有麦克风、收纳凹槽、选择按键、扩音孔、充电口和USB接口。所述麦克风与中央处理器电性相连，用于采集语音信号，并将其传输至中央处理器。本技术通过语音处理模块进行语音特征提取及实时可视化处理，利用显示屏呈现图形化语音特征。实现了对实时提取语音特征的图形化描述，解决了语音特征可视化呈现耗时长、不易操作的问题。

技术研发人员：燕浩,张丽敏,李扬,张琰龙,蔡浩,姚雨晴,朱莹,文笛雅
受保护的技术使用者：西安外国语大学
技术研发日：20221028
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：燕浩张丽敏李扬张琰龙蔡浩姚雨晴朱莹文笛雅
技术所有人：西安外国语大学
我是此专利的发明人

上一篇：穿戴式视网膜脱离患者术后头部限制体位装置
上一篇：一种破碎装置的制作方法