一种基于语音时频特征融合的TMD检测模型、构建方法及系统

文档序号:45433174发布日期:2026-05-07 12:51阅读:5来源:国知局

本发明涉及风险预测,特别涉及一种基于语音时频特征融合的tmd检测模型、构建方法及系统。


背景技术:

1、随着现代生活节奏的加快和工作压力的增加,tmd(颞下颌关节紊乱病)的发病率呈上升趋势,影响着各个年龄段的人群。作为一种常见的口腔颌面疾病,tmd不仅会引起疼痛和下颌运动障碍,还可能对患者的发音功能造成一定影响。传统的tmd诊断主要依赖于专科医生的临床检查、影像学检查和患者主观症状描述,过程较为繁琐,且缺乏客观、量化的评估手段,容易受到医生经验和患者表达能力的影响。尤其在缺乏颞下颌关节专科医生的基层或地方城市,这种依赖高度专业经验的诊断模式往往难以实现,导致许多患者无法获得及时、准确的诊断与干预治疗。

2、近年来,人工智能技术的迅速发展为tmd的智能辅助诊断提供了新的思路。越来越多的研究开始尝试利用图像、传感器以及语音等多种模态数据进行tmd识别与病情分析。


技术实现思路

1、本发明目的是提供一种基于语音时频特征融合的tmd检测模型、构建方法及系统,解决现有技术中存在的上述问题。

2、本发明解决上述技术问题的技术方案如下:

3、一种基于语音时频特征融合的tmd检测模型的构建方法,包括如下步骤:

4、步骤s01:构建初始的tmd检测模型;

5、tmd检测模型包括时序特征提取模块、频域全局特征嵌入模块和分类模块;

6、时序特征提取模块,其用于根据语音信号的mfcc特征提取语音信号的时序特征;频域全局特征嵌入模块,其用于将语音信号的频域中的与tmd相关的声学特征嵌入到时序特征中,生成时频融合特征向量;

7、分类模块,其用于根据时频融合特征向量,判断语音信号对应的患者是否为tmd患者;

8、步骤s02:从语音数据库中提取tmd患者和非tmd患者的语音信号,将tmd患者和非tmd患者的语音信号的mfcc特征和声学特征分别输入时序特征提取模块和频域全局特征嵌入模块,将对应是否为tmd患者作为标签,对初始的tmd检测模型进行训练,获得用于检测的tmd检测模型;

9、其中,声学特征包括基频、声响、短时过零率、基频扰动和振幅扰动。

10、本发明的有益效果是:本发明提出的tmd检测模型包括时序特征提取模块、频域全局特征嵌入模块和分类模块,时序特征提取模块以原始语音信号中提取的 mfcc 特征作为输入基础,考虑到mfcc在表征tmd患者语音特征时可能存在一定的局限性,在tmd检测模型中引入了频域全局特征嵌入模块,该频域全局特征嵌入模块通过将频域中的与tmd相关的声学特征(基频、声响、短时过零率、基频扰动和振幅扰动)嵌入到时序特征表示中,增强了整体特征表达能力,在更全面地刻画tmd相关语音异常的基础上,显著提升了tmd检测模型的准确性和鲁棒性,从而提升了tmd检测模型对tmd相关语音异常的识别效果,这一设计有助于更全面地挖掘语音信号中隐藏的病理信息,探索基于语音信号的tmd辅助诊断方法,旨在提供一种非侵入、便捷且具有潜在广泛应用价值的tmd辅助诊断方法。

11、本发明还公开了一种基于语音时频特征融合的tmd检测模型,为采用上述基于语音时频特征融合的tmd检测模型的构建方法获得的用于检测的tmd检测模型。

12、本发明还公开了一种基于语音时频特征融合的tmd检测系统,包括语音采集模块和采用上述的用于检测的tmd检测模型;

13、语音采集模块,其用于采集待诊断患者的语音信号,获得语音信号的mfcc特征和频域中的与tmd相关的声学特征;其中,声学特征包括基频、声响、短时过零率、基频扰动和振幅扰动;

14、用于检测的tmd检测模型的时序特征提取模块,其用于根据mfcc特征提取语音信号的时序特征;

15、用于检测的tmd检测模型的频域全局特征嵌入模块,其用于将声学特征嵌入到时序特征中,生成时频融合特征向量;

16、用于检测的tmd检测模型的分类模块,其用于根据时频融合特征向量,判断待诊断患者是否为tmd患者。


技术特征:

1.一种基于语音时频特征融合的tmd检测模型的构建方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的构建方法,其特征在于,所述时序特征提取模块为基于x-vectors 模型的时序特征提取模块。

3.根据权利要求2所述的构建方法,其特征在于,所述基于x-vectors 模型的时序特征提取模块包括语音时序特征提取网络和话语级特征提取模块;

4.根据权利要求3所述的构建方法,其特征在于,所述频域全局特征嵌入模块,其具体用于在整段语音上分别计算所述声学特征的统计描述指标,构建维度为103维的频域全局特征向量;对所述频域全局特征向量进行归一化处理,通过全连接层将103 维的频域全局特征降维为64维的频域特征,再将其嵌入到基于x-vectors 模型的时序特征提取模块生成的256维的时域特征表示中,融合后得到长度为320维的时频融合特征向量。

5.根据权利要求4所述的构建方法,其特征在于,所述分类模块,其具体用于采用多层全连接层对所述时频融合特征向量进行非线性整合。

6.一种基于语音时频特征融合的tmd检测模型,其特征在于,为采用权利要求1至5任一所述基于语音时频特征融合的tmd检测模型的构建方法获得的用于检测的tmd检测模型。

7.一种基于语音时频特征融合的tmd检测系统,其特征在于,包括语音采集模块和采用权利要求6所述的用于检测的tmd检测模型;


技术总结
本发明涉及一种基于语音时频特征融合的TMD检测模型、构建方法及系统,包括:时序特征提取模块,其用于根据MFCC特征提取语音信号的时序特征;频域全局特征嵌入模块,其用于将语音信号的频域中的与TMD相关的声学特征嵌入到时序特征中;分类模块,其用于判断语音信号对应的患者是否为TMD患者;提取语音信号,将TMD患者和非TMD患者的语音信号的MFCC特征和声学特征分别输入时序特征提取模块和频域全局特征嵌入模块,对初始的TMD检测模型进行训练,获得用于检测的TMD检测模型;本发明增强了整体特征表达能力,显著提升了TMD检测模型的准确性和鲁棒性,从而提升了TMD检测模型对TMD相关语音异常的识别效果,有助于更全面地挖掘语音信号中隐藏的病理信息。

技术研发人员:李程,程波,邬兰,王双瑛,岳圆,赵思语,杨福华,邓通,张洁伊,李冰劼
受保护的技术使用者:武汉大学中南医院
技术研发日:
技术公布日:2026/5/6
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!