语音监测系统的制作方法

文档序号：16760491发布日期：2019-01-29 17:41阅读：166来源：国知局

本发明涉及语音监测技术领域，具体为语音监测系统。

背景技术：

现在智能穿戴设备发展方兴未艾，智能手表可以实时检测心率，步伐，睡眠，但却没有一项可以监测人语言时间和语句数量的设备。人每天的语言数量与大脑的活跃程度息息相关。人的衰老，伴随着语言数量的渐渐减少，伴随着语句的渐渐缩短。如果能很好的监测到语言的数量，语句长短的变化。就能很好的预判人的衰老进程。同时也是对人一天大脑活跃程度的进行很好的记录。鉴于此，我们提出语音监测系统。

技术实现要素：

本发明的目的在于提供语音监测系统，以满足监测语言的数量，语句长短的变化，进而预判人的衰老进程。

为实现上述目的，本发明提供如下技术方案：

语音监测系统，包括检测手环以及移动端，所述检测手环内置有语音检测模块，所述移动端内置有语音分析模块，所述语音检测模块和所述语音分析模块之间通过信息传输模块传输数据，所述语音检测模块包括输入模块、预处理模块、断点检测模块、特征提取模块、语音识别模块、特征匹配模块、输出模块以及语音训练模块；

所述输入模块用于对语音信号进行采集；

所述预处理模块用于对采集到的语音信号进行初步处理；

所述断点检测模块用于对采集到的语音信号中找出有效语音信号的开始和结束点；

所述特征提取模块用于去除语音信号中对于语音识别无用的冗余信息，保留能够反映语音本质特征的信息，形成特征矢量序列，以便用于后续处理；

所述语音识别模块用于对采集的语音信号进行识别和处理；

所述特征匹配模块用于对采集的语音信号中本质特征的信息进行匹配；

所述输出模块用于对匹配合格的语音信号进行输出；

所述语音训练模块用于对每次语音配对进行记录并建立语音数据库。

作为优选，所述预处理模块包括模数转换模块、分帧模块、数据加窗模块以及预加重模块；

所述模数转换模块用于将语音信号的频率控制在65hz-1100hz之内；

所述分帧模块用于将语音信号控制在10ms-30ms之间，并保持相对平稳；

所述数据加窗模块用于对分帧后的语音信息进行时域和频域的分析；

所述预加重模块用于对信号进行高频补偿，使得信号频谱平坦化，以便于进行频谱分析和声道参数分析。

作为优选，所述语音识别模块包括语言解码模块和算法模块；

所述语言解码模块针对输入的语音信号，根据己经训练好的hmm声学模型、语言模型及字典建立一个识别网络，根据搜索算法在该网络中寻找最佳的一条路径，这个路径就是能够以最大概率输出该语音信号的词串，已确定语音样本所包含的文字；

所述算法模块用于搜索寻找最优词串。

作为优选，所述语音训练模块包括声学模型模块、语音模型模块以及语言建模模块；

所述声学模型模块用于识别时可以将待识别的语音的特征参数同声学模型进行匹配，得到识别结果；

所述语音模型模块用于计算一个句子出现概率的概率模型；

所述语言建模模块用于结合汉语语法和语义的知识，描述词之间的内在关系，从而提高识别率，减少搜索范围。

作为优选，所述信息传输模块包括uart参数设置模块、蓝牙传输模块、蓝牙接收模块、安全模块以及pin码模块；

所述uart参数设置模块用于设置通信协议长度、波特率以及硬件控制流参数；

所述蓝牙传输模块用于将信息通过蓝牙方式传输；

所述蓝牙接收模块用于将信息通过蓝牙方式接收；

所述安全模块用于保障蓝牙通信中的数据安全；

所述pin码模块用于保证仅有可靠的设备通过蓝牙与模块互相通信。

作为优选，所述语音分析模块包括信息记录模块、信息统计模块、信息分析模块以及图像模块；

所述信息记录模块用于对传输的数据进行保持和记录；

所述信息统计模块用于对记录后的数据进行分类统计；

所述信息分析模块用于对分类后的数据进行数字化分析；

所述图像模块用于对数字化分析后的数据进行图像直观的显示。

作为优选，所述信息记录模块包括时间记录模块、时间区间记录模块以及单句长短记录模块；

所述时间记录模块用于对语音记录的时间进行储存；

所述时间区间记录模块用于对语音记录的时间段进行储存；

所述单句长短记录模块用于对每个语音记录的长短时间进行储存。

与现有技术相比，本发明的有益效果：

1、该语音监测系统，通过语音识别模块对采集的语音信号进行识别和处理，通过特征匹配模块用于对采集的语音信号中本质特征的信息进行匹配，通过输出模块对匹配合格的语音信号进行输出，通过语音训练模块对每次语音配对进行记录并建立语音数据库，便于对语音信息进行收集和处理。

2、该语音监测系统，通过预处理模块，便于对语音信息进行分帧和预加重，进而使得信号进行高频补偿，使得信号频谱平坦化。

3、该语音监测系统，通过语言解码模块针对输入的语音信号，根据己经训练好的hmm声学模型、语言模型及字典建立一个识别网络并通过算法模块352搜索寻找最优词串。

4、该语音监测系统，通过蓝牙传输模块，将信息通过蓝牙方式传输；通过蓝牙接收模块，将信息通过蓝牙方式接收。

5、该语音监测系统，通过信息分析模块，对对分类后的数据进行数字化分析；通过图像模块，对数字化分析后的数据进行图像直观的显示。

6、该语音监测系统，通过信息记录模块，能够对语音记录的时间、语音记录的时间段以及每个语音记录的长短时间进行储存，便于分析。

7、该语音监测系统，通过无线骨传导喉麦对语言进行辅助拾音，避免因老年人声音较小和外界嘈杂干扰大等因素，导致出现语音被遗漏现象，提高记录的准确性。

附图说明

图1为本发明的整体工作示意图；

图2为本发明的整体结构模块图；

图3为本发明的语音检测模块示意图；

图4为本发明的预处理模块示意图；

图5为本发明的语音训练模块示意图；

图6为本发明的语音识别模块图；

图7为本发明的语音分析模块示意图；

图8为本发明的信息记录模块示意图；

图9为本发明的信息传输模块示意图；

图10为本发明的检测手环和无线骨传导喉麦连接图。

图中：1、检测手环；2、移动端；3、语音检测模块；31、输入模块；32、预处理模块；321、模数转换模块；322、分帧模块；323、数据加窗模块；324、预加重模块；33、断点检测模块；34、特征提取模块；35、语音识别模块；351、语言解码模块；352、算法模块；36、特征匹配模块；37、输出模块；38、语音训练模块；381、声学模型模块；382、语音模型模块；383、语言建模模块；4、信息传输模块；41、uart参数设置模块；42、蓝牙传输模块；43、蓝牙接收模块；44、安全模块；45、pin码模块；5、语音分析模块；51、信息记录模块；511、时间记录模块；512、时间区间记录模块；513、单句长短记录模块；52、信息统计模块；53、信息分析模块；54、图像模块；6、无线骨传导喉麦。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

实施例1

语音监测系统，如图1至图3所示，包括检测手环1以及移动端2，检测手环1内置有语音检测模块3，移动端2内置有语音分析模块5，语音检测模块3和语音分析模块5之间通过信息传输模块4传输数据，语音检测模块3包括输入模块31、预处理模块32、断点检测模块33、特征提取模块34、语音识别模块35、特征匹配模块36、输出模块37以及语音训练模块38，输入模块31用于对语音信号进行采集，预处理模块32用于对采集到的语音信号进行初步处理，断点检测模块33用于对采集到的语音信号中找出有效语音信号的开始和结束点，特征提取模块34用于去除语音信号中对于语音识别无用的冗余信息，保留能够反映语音本质特征的信息，形成特征矢量序列，以便用于后续处理，语音识别模块35用于对采集的语音信号进行识别和处理，特征匹配模块36用于对采集的语音信号中本质特征的信息进行匹配，输出模块37用于对匹配合格的语音信号进行输出，语音训练模块38用于对每次语音配对进行记录并建立语音数据库。

本实施例中，检测手环1内由音频放大模块、mcu、触摸屏、电源四部分组成。音频放大模块完成对外部声音信号的采集和放大。将声音信号转化为电信号，并放大到0-3v；mcu的adc参考电压为其电源电压3.3v；音频放大模块的输出信号不超出mcu的adc的电压范围，并且能够获得最大的量化精度；mcu对音频放大模块输入的声音信号进行ad转换，然后提取并识别信号特征，另外，mcu还控制触摸屏的显示和读取触摸屏点击位置。触摸屏负责显示操作界面，并接收用户操作；电源为电池供电。

进一步的，在本系统的音频放大模块中使用小型话筒完成声电信号转换，两个9014三极管构成两级共基极放大电路，在每一级中加电压负反馈，稳定放大倍数。

具体的，触摸屏采用尺寸为2.5寸，分辨率为240×320的lcd触摸屏，lcd触摸屏是一种可接收触摸点击输入信号的感应式液晶显示装置，当接触或点击屏幕时，触摸控制器可读取触摸点位置，如此可通过屏幕直接接受用户的操作。

本实施例的语音监测系统在使用时，通过预处理模块32对采集到的语音信号进行初步处理，通过断点检测模块33对采集到的语音信号中找出有效语音信号的开始和结束点，通过特征提取模块34去除语音信号中对于语音识别无用的冗余信息，保留能够反映语音本质特征的信息，形成特征矢量序列，以便用于后续处理，通过语音识别模块35对采集的语音信号进行识别和处理，通过特征匹配模块36用于对采集的语音信号中本质特征的信息进行匹配，通过输出模块37对匹配合格的语音信号进行输出，通过语音训练模块38对每次语音配对进行记录并建立语音数据库，便于对语音信息进行收集和处理。

实施例2

作为本发明的第二种实施例，为了便于对语音信息进行预处理，本发明人员设置预处理模块32，如图4所示，预处理模块32包括模数转换模块321、分帧模块322、数据加窗模块323以及预加重模块324，模数转换模块321用于将语音信号的频率控制在65hz-1100hz之内，分帧模块322用于将语音信号控制在10ms-30ms之间，并保持相对平稳，数据加窗模块323用于对分帧后的语音信息进行时域和频域的分析，预加重模块324用于对信号进行高频补偿，使得信号频谱平坦化，以便于进行频谱分析和声道参数分析。

本实施例中，每帧取20ms，为了使前后帧之间保持平滑过渡，帧移10ms，即前后帧之间交叠10ms。

进一步的，为了便于后续语音处理，需对分帧后的信号加窗，加窗方式如式y(n)＝y(n)w(n),0≤n≤n-1，式中y(n)是加窗后的信号，y(n)是输入信号，w(n)是窗函数，n是帧长。

具体的，窗函数为汉明窗，可以有效地克服泄露现象，应用范围也最为广泛。

本实施例中，通过模数转换模块321，将语音信号的频率控制在65hz-1100hz之内；通过分帧模块322，将语音信号控制在10ms-30ms之间；通过数据加窗模块323，对分帧后的语音信息进行时域和频域的分析；通过预加重模块324，对信号进行高频补偿，使得信号频谱平坦化。

实施例3

作为本发明的第三种实施例，为了便于对语音信息进行识别，本发明人员设置语音识别模块35，如图6所示，语音识别模块35包括语言解码模块351和算法模块352，语言解码模块351针对输入的语音信号，根据己经训练好的hmm声学模型、语言模型及字典建立一个识别网络，根据搜索算法在该网络中寻找最佳的一条路径，这个路径就是能够以最大概率输出该语音信号的词串，已确定语音样本所包含的文字，算法模块352用于搜索寻找最优词串。

本实施例中，语音识别模块35采用隐马尔可夫模型hmm进行声学模型建模。

本实施例中，通过语言解码模块351针对输入的语音信号，根据己经训练好的hmm声学模型、语言模型及字典建立一个识别网络并通过算法模块352搜索寻找最优词串。

实施例4

作为本发明的第四种实施例，为了便于对语音信息进行训练，本发明人员设置语音训练模块38，如图5所示，语音训练模块38包括声学模型模块381、语音模型模块382以及语言建模模块383，声学模型模块381用于识别时可以将待识别的语音的特征参数同声学模型进行匹配，得到识别结果，语音模型模块382用于计算一个句子出现概率的概率模型，语言建模模块383用于结合汉语语法和语义的知识，描述词之间的内在关系，从而提高识别率，减少搜索范围。

本实施例中，通过识别时可以将待识别的语音的特征参数同声学模型进行匹配，得到识别结果；通过语音模型模块382用于计算一个句子出现概率的概率模型；通过语言建模模块383用于结合汉语语法和语义的知识，描述词之间的内在关系，从而提高识别率，减少搜索范围。

实施例5

作为本发明的第五种实施例，为了便于对语音信息进行传输，本发明人员设置信息传输模块4，如图9所示，信息传输模块4包括uart参数设置模块41、蓝牙传输模块42、蓝牙接收模块43、安全模块44以及pin码模块45，uart参数设置模块41用于设置通信协议长度、波特率以及硬件控制流参数，蓝牙传输模块42用于将信息通过蓝牙方式传输，蓝牙接收模块43用于将信息通过蓝牙方式接收，安全模块44用于保障蓝牙通信中的数据安全，pin码模块45用于保证仅有可靠的设备通过蓝牙与模块互相通信。

本实施例中，信息传输模块44为型号csrbc2的高度整合模块级蓝牙芯片，主要包括基带控制器、2.4～2.5ghz的数字智能无线电以及程序数据存储器，该模块，提供无线标准uart接口，支持多种波特率本实施例中的，本实施例中，优选速率为460.8kbps。

本实施例中，通过uart参数设置模块41，设置通信协议长度、波特率以及硬件控制流参数；通过蓝牙传输模块42，将信息通过蓝牙方式传输；通过蓝牙接收模块43，将信息通过蓝牙方式接收；通过安全模块44，保障蓝牙通信中的数据安全；通过pin码模块45，保证仅有可靠的设备通过蓝牙与模块互相通信。

实施例6

作为本发明的第六种实施例，为了便于对语音信息进行分析，本发明人员设置语音分析模块5，如图7所示，语音分析模块5包括信息记录模块51、信息统计模块52、信息分析模块53以及图像模块54，信息记录模块51用于对传输的数据进行保持和记录，信息统计模块52用于对记录后的数据进行分类统计，信息分析模块53用于对分类后的数据进行数字化分析，图像模块54用于对数字化分析后的数据进行图像直观的显示。

本实施例中，通过信息记录模块51，对传输的数据进行保持和记录；通过信息统计模块52，对对记录后的数据进行分类统计；通过信息分析模块53，对对分类后的数据进行数字化分析；通过图像模块54，对数字化分析后的数据进行图像直观的显示。

实施例7

作为本发明的第七种实施例，为了便于对语音信息进行记录，本发明人员设置信息记录模块51，如图8所示，信息记录模块51包括时间记录模块511、时间区间记录模块512以及单句长短记录模块513，时间记录模块511用于对语音记录的时间进行储存，时间区间记录模块512用于对语音记录的时间段进行储存，单句长短记录模块513用于对每个语音记录的长短时间进行储存。

本实施例中，通过时间记录模块511对语音记录的时间进行储存；通过时间区间记录模块512对语音记录的时间段进行储存；通过单句长短记录模块513对每个语音记录的长短时间进行储存。

实施例8

作为本发明的第八种实施例，在具体实施过程中，由于老年人声音较小和外界嘈杂干扰大，仅仅通过手环1记录，不容易拾音，导致语音会被遗漏，鉴于此，本发明人员增加无线骨传导喉麦6，如图10所示，无线骨传导喉麦6和检测手环1通过蓝牙进行传输。

本实施例的无线骨传导喉麦6在使用时，将无线骨传导喉麦6套在老人的脖子上，无线骨传导喉麦6和检测手环11之间通过蓝牙传输，并通过无线骨传导喉麦6对语言进行辅助拾音，避免因老年人声音较小和外界嘈杂干扰大等因素，导致出现语音被遗漏现象，提高记录的准确性。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的仅为本发明的优选例，并不用来限制本发明，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：江海洋;江永行;邓居云;刘正兵;赵贵虎;余峰
技术所有人：江海洋
我是此专利的发明人