基于语音的帕金森症检测方法及检测系统的制作方法

文档序号:9688744阅读:768来源:国知局
基于语音的帕金森症检测方法及检测系统的制作方法
【技术领域】
[0001] 本发明设及信号处理和机器学习技术领域,具体设及一种基于语音的帕金森症检 测方法及检测系统。
【背景技术】
[0002] 人类的语音是由人的发音器官在大脑控制下的生理运动产生的。人的发音器官由 Ξ部分组成:①肺和气管产生气源;②喉和声带组成声口;③由咽腔、口腔、鼻腔组成声道, 运些器官无一不受到中枢神经的控制。神经内科的帕金森症会损坏大脑皮层的神经元从而 影响发音器官,使得患病者和健康者语音有所不同,故使用语音检测帕金森有一定的理论 依据。
[0003] 目前医学领域的帕金森检测方法一般都是临床观察,即专科医生根据患者住院期 间各项统计数据W及平时观察,评测患者是否患有帕金森疾病。运样的检测方法虽然准确 性较高,可是耗时长、医疗资源投入较大、不利于帕金森疾病的初期大规模检测和后期长期 治疗。

【发明内容】

[0004] 本发明的目的是提供基于语音的帕金森检测方法,用W解决传统解决方案带来的 耗时、耗力、成本高等不利因素。结合当前"互联网+"创业背景,本发明还提出了基于语音的 帕金森检测系统实现方案。与临床观察相比,本方案只需测试者提供一段语音样本,计算机 软件会自动分析该语音并快速判断患者是否患有帕金森疾病。
[0005] 基于语音的帕金森症检测方法,包括从采集到的被检测者的语音中提取与帕金森 症相关的特征,按提取的先后顺序将全部特征记录到一个向量中并使用SVM分类器对该向 量进行分类,分类结果即是检测结果。
[0006] 所述提取与帕金森症相关的特征的步骤为:
[0007] 步骤101、在安静的环境中录制一段平稳元音/a/,记为A;
[000引步骤102、计算J31的每一帖的基音周期,
[0009]
[0010] 公式中的X表示输入信号,V表示相对于η延迟了 V个点,X (η)表示第η个信号;
[00川步骤103、将井1所有帖对应的基音周期组合到一起,即为卵周期向量Τ,对向量Τ取 倒数即为基频向量F,取基频向量F均值为化,最大值为Fhi,最小值为Flo;
[0012] 步骤104、对1的基频向量F,提取出绝对基频变化率J i 11 er (ab S)和基频变化百 分率 Jitter%,
[0013]
[0014]
[001引其中N为基频向量F的长度,Fi表示第i个基频;
[0016]步骤105、对刀1的振幅序列A计算分贝振幅变化率化immer(dB)和平均均值变化率 Shimmer(relative),
[0019]其中N为序列A长度,Ai表示第i个信号;
[0020] 步骤106、量化语音信号刀1中由于声带不完全闭合而产生的信噪比,
[002。HNRdB= 10*l0glO[Rxx(lmax)/( l-Rxx(lmax))]
[0022] HNR = 10* [ ( 1 -Rxx (Imax ) ) /Rxx (Imax )]
[0023] 其中Rxx为自相关函数,Imax是具有自相关的全局最大样本点;
[0024] 步骤107、量化被检测者发音困难程度,将基频向量F按照下式转化为对数半音序 列,
[00 巧]P〇,per=121〇g2(F/l27)22
[0026] 对所述对数半音序列进行过滤,使半音序列的频谱变平,经过变平后的序列为r, 计算r的概率密度p(r),求取PPE,
[0027]
[0028] 其中L表示对数半音序列长度。
[0029] 所述训练SVM分类器的过程为:
[0030] 步骤201、采集训练样本集,记作DS,DS中每一条的训练样本属性为XI,对应标记为 yi;
[0031] 步骤202、初始化SVM分类器,
[00对其中a为优化目标,C为容错率,Xi、yi为训练样本及其标签值,N为样本数量;
[0036] 步骤203、将训练样本集DS中的每条样本属性及其标签(yi,xi)代入步骤202的公 式,求优化目标a,b和W,SVM分类器训练结束。
[0037] 所述样本分类的步骤为:
[0038] 步骤301、将Vectorl作为输入变量,代入下式,
[0039] f(x)=wWb
[0040] 其中W和b为步骤203中优化所得结果,所得的f (Vectorl)为Vectorl所属类别,即 原始语音所属类别;
[0041] 步骤302、根据f(Vectorl)结果判断测试者是否患有帕金森症。
[0042] 本发明还提供一种基于语音的帕金森症检测方法,包括将专业机构收集的帕金森 语音数据集进行语音信号处理得到训练样本集,然后训练SVM分类器,接着,使用该SVM分类 器对被检测者的语音样本数据进行分类,根据分类结果判断被检测者是否患有帕金森症, 所述被检测者的语音样本数据通过W下过程得到:从采集到的被检测者的语音中提取与帕 金森症相关的特征,按提取的先后顺序将全部特征记录到一个向量中。
[0043] 本发明的整个处理过程都由计算机软件分析完成,显然能够有效的解决临床观察 帕金森时周期长,成本高等问题,具有快速、高效、低成本、极端环境操作简单可靠等特点。
[0044] 另一方面,本发明提出一种基于语音的帕金森症检测系统,W智能的实现帕金森 症的初步诊断,该系统包括:
[0045] 语音采集装置,用于采集被检测者发出的特定语音;语音信号处理系统,用于从所 述语音中提取与帕金森症相关的特征,按提取的先后顺序将全部特征记录到一个向量中;
[0046] SVM分类系统,用于训练SVM分类器和进行样本分类,根据分类结果判断被检测者 是否患有帕金森症,其中,SVM分类器的训练样本来自专业机构收集的帕金森语音数据集。
[0047] 所述语音采集装置数量至少为一个。
[004引本发明通过简单的硬件架构,利用软件算法实现了帕金森症初步诊断的自动化, 只通过语音即可做出初步判断,结构简单,智能化程度高。
【附图说明】
[0049] 图1为实施例一基于语音的帕金森症检测系统结构示意图;
[0050] 图2为实施例一基于语音的帕金森症检测系统的又一结构示意图;
[0051 ]图3为实施例二基于语音的帕金森症检测方法流程图;
[0052] 图4为实施例二中从语音中提取与帕金森症相关的特征的流程图;
[0053] 图5为实施例二中SVM分类流程图。
【具体实施方式】
[0054] 为了使本发明的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并 不用于限定本发明。
[00对实施例一
[0056]如图1和图2所示,与每个被检测者对应有一台语音采集装置,该语音采集设备可 W是智能手机或平板电脑等智能终端,通过软件来采集被测试者发出的特定语音,接着语 音信号处理系统从语音中提取与帕金森症相关的特征,按提取的先后顺序将全部特征记录 到一个向量中,然后SVM分类系统利用专业机构提供的帕金森训练样本集训练SVM分类器并 对上述向量进行样本分类,根据分类结果判断被检测者是否患有帕金森症。
[0057] 实施例二
[0058] 图3到图5示出了基于语音的帕金森症检测方法的流程。
[0059] 该方法主要分为Ξ部分,一是录制特定音频:本方法需要测试者在相对安静的环 境下录制一段连续的元音/a/;二是语音病理特征提取:在获取测试语音后,即可使用语音 信号处理技术提取语音中和帕金森相关的病理特征(基频、Jitter、化immer等特征),运些 特征能够区别出病患者和健康者;Ξ是SVM分类:分类器会按照预先学习好的算法模型,对 样本进行分类,W判断样本是否患有帕金森。
[0060] 录制特定语音:测试者录制一段连续平和的元音/a/,在录制音频时应该尽量在安 静的环境下使用专业的录音设备,录制的语音不宜太长或太短,录制过程中不宜中断,语气 正常即可。为方便描述,记测试者语音为J3_i。
[0061] 语音病理特征提取:过程如图4所示,待录制好特定语音打1后,即可使用语音信号 处理技术提取A中和帕金森相关的病理特征。语音中和帕金森相关的病理特征主要为化、 Fhi、Flo、Jitte;r(%)、Jitte;r(Abs)、RAP、RAP、Ji tter :抓P、化 immer、化 immer (dB)、 Shimmer :APQ3、Shimmer :APQ5、APQ、Shimmer:DDA、NHR、HNR、RPDE、D2、DFA、spread1、 spread2、PPE等,运些特征主要分为基频、基频变化率、振幅变化率、信噪比、基音周期赌五 大类,下面按病理特征提取的先后顺序讲述语音病理特征提取过程。
[00创(一)基频特征
[0063] 人在发音时,根据声带是否振动可W将语音信号分为清音和浊音,清音实际上是 白噪音,无规律可循。和清音不同,在一段时间内,浊音会具有明显的规律性,所谓的基音周 期就是指发浊音时声带振动的周期性,其倒数称之为基音频率(简称基频)。基音频率是数 字语音处理中非常重要的参数,其提取技术较为成熟,图5即为当前提取基音周期的一般流 程(周期倒数即为频率)。
[0064] 对输入的原始语音段,首先需经过滤波器、短时能量分析和采样操作,运Ξ步处理 主要完成将模拟信号转化为数字信号(带通滤波)、将连续信号转为离散信号(采样)。从整 体上分析,离散化后的数字信号依旧没有规律性,运是由于语音信号是非稳态信号,它的特 征是随时间变化的,但在一个很短的时间段内(一般为5ms-50ms)语音信号具有相对稳定的 特征,即语音的短时平稳性
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1