基于语音混合信息特征协同优选判别的帕金森症检测装置的制作方法

文档序号：11252363阅读：601来源：国知局

本发明涉及电子医疗器械，具体涉及到一种基于语音混合信息特征协同优选判别的帕金森症检测装置。

背景技术：

帕金森症是一种多发于中老年的渐进性中枢神经系统变性疾病，又称巴金森氏症或柏金逊症，多在60岁以后发病。在帕金森症患者中，有50％～80％的病例起病隐袭，早期难以察觉而常被忽视，因此容易造成漏诊。但该病一旦形成将对患者生活造成影响。在发病早期，患者主要表现为功能障碍，如手指震颤、语音障碍和发音困难等。有研究表明语言功能性障碍是早期帕金森症的典型症状之一，有超过90％的帕金森症患者出现声带损伤，并伴随有大脑语言功能区病变。研究还表明，检测语言功能性障碍并能对其进行分级可以通过提取帕金森症病人语音语言学参数，并进行模式识别分类的方式。因此，检测语言障碍将有助于实现高准确性的帕金森病早期诊断。

目前基于语音的帕金森病诊断的主流研究方法是：先提取语音特征，然后采用机器学习方法对其进行分析，实现分类。这些特征类型是通过语言病理学家先验知识获取的。其中包括了声带振动的基音频率、频率微扰、幅度微扰、谐波信噪比等。little等人最早利用基于核方法的支持向量机分类器对受试者的语音信号进行分类，revett等人建立粗糙集对帕金森病数据进行特征选择，pei-fangguo等人利用遗传算法进行了特征选择分析，saker等人使用统计学中的集中趋势和离差矩阵进行特征分析。上述这些研究取得了一定的分类诊断效果，大都是对特征进行优选分析或者转换，其缺陷是：

(1)现有研究大多处于理论研究阶段，产品化较少；

(2)现有的各种分类算法，在分类器训练时难以避免误差严重的样本对分类器的误导。

技术实现要素：

为了解决上述问题，本发明提供一种基于语音混合信息特征协同优选判别的帕金森症检测装置，一方面将现有的研究算法产品化，另一方面，在分类器训练时，通过样本特征进行权值筛选，有效提高帕金森症的真的准确性。

为实现上述目的，本发明所采用的具体技术方案如下：

一种基于语音混合信息特征协同优选判别的帕金森症检测装置，其关键在于包括：信号采集器、处理器以及结果输出模块；

所述信号采集器：用于获取诊断对象的语音信息；

所述处理器：包括用于提取语音特征的特征提取模块以及预先训练好的分类器，通过所述分类器判断诊断对象是否属于帕金森症患者；

所述结果输出模块：用于输出分类器的判断结果。

进一步地，所述处理器中的分类器按以下步骤进行预先训练：

s1:提取样本数据集，首先选择m个受试者，受试者中包括帕金森患者和健康者，利用信号采集器分别采集每个受试者n个语音片段，每个语音片段采集至少一种发音内容，包括连续元音字母发音、数字发音、单词发音和短语句发音，通过特征提取模块从每个语音片段中提取k个特征参数，从而构成样本数据集，m、n、k均为正整数；

s2：特征集变换，将同一受试者中n个语音片段所对应的k个特征参数扩展为一个n*k维的特征矩阵，然后采用留一法交叉验证，将样本数据集分为训练样本集和测试样本集，训练样本对应的测试样本集来自于不同的受试者；

s3：权重计算和特征重构，基于训练样本集，采用relief算法计算混合特征的权重，基于其权重大小，构造阈值，进行特征选择，从而得到优选后的混合特征子集；

s4：分类器训练和测试，通过步骤s3获得重构后的训练样本集与测试样本集；设计分类器并重新对其进行训练和测试，直到分类结果达到预设指标，训练完成得到最终的分类器。

采用上述的技术方案，通过权重值对训练样本集进行筛选，对训练样本集进行了优选，从而可以提取出与帕金森症相关性大的样本数据，从而用分类器进行分类的时候，提高了分类准确性，从而提高了帕金森症的诊断准确率。

进一步地，所述分类器为线性svm分类器、knn分类器或rf分类器。

进一步地，所述分类器为多核svm分类器。

进一步地，根据步骤s3优选后的混合特征子集，从诊断对象中提取对应的语音片段，并采集对应的特征参数，构成特征向量，输入最终的分类器中进行分类判别，输出测试结果。

进一步地，所述分类器采用类准确率、灵敏度以及特异度三项指标来评价其是否满足预设条件，其中：

1)类准确率

2)灵敏度

3)特异度

其中,tp为真阳性，tn为真阴性，fp为假阳性，fn为假阴性。

进一步地，步骤s1提取样本数据集时，选择40个受试者，包括20个帕金森病患者，其中6个女性，14个男性，20个健康者，其中10个女性，10个男性，每个受试者分别采集到26个语音片段，然后针对每个语音片段提取出26个特征参数。

进一步地，还设置有语音引导装置，该语音引导装置用于输出预设的语音片段，引导测试对象发音。通过增设语音引导装置，将标准的语音片段预设到设备中，通过播放标准语音片段引导测试对象发音，使其临床应用更加方便。

本发明的显著效果是：

本发明将基于语音数据实现帕金森病诊断的方法进行了产品化实现，在分类器训练时，通过relief算法对语音段样本进行了优选，使得分类器的分类准确率，灵敏度及特异度均有提高，设备的临床应用性强。

附图说明

图1为本发明实施例提供的原来框图；

图2为本发明实施例中分类器训练的方法流程图；

图3为基于relief算法计算所得各个特征的权值关系图；

图4为所选特征数量与分类准确率的关系图。

具体实施方式

为了使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

如图1所示，本实施例提供一种基于语音混合信息特征协同优选判别的帕金森症检测装置，信号采集器、处理器、存储器、结果输出模块以及语音引导装置，

所述信号采集器：通常包括麦克风和音频信号采集模块，用于获取诊断对象的语音信息；

所述处理器：包括用于提取语音特征的特征提取模块以及预先训练好的分类器，通过所述分类器判断诊断对象是否属于帕金森症患者；

所示存储器：用于存储训练样本、测试样本以及预设的语音片段；

所述结果输出模块：设为显示器输出或语音播报输出，用于输出分类器的判断结果；

所述语音引导装置：用于输出预设的语音片段，引导测试对象发音。

在本实施例中，语音引导装置可以省略，临床诊断时由医务人员口头引导，对应的存储器中可以不用预先存储语音片段，但是设置语音引导装置后，设备的智能性和临床应用性更强，诊断时可以直接由设备预先播报标准发音的语音片段，诊断对象跟读设备的发音，使得语音信号采集更加标准化。

同时，如果处理器中的分类器已经训练好，不用重复训练的情况下，存储器中的训练样本和测试样本可以省略，设备中直接加载训练好的分类器即可满足分类要求，由此以来，本发明的另一实施方式是，不设置单独的存储器，处理器自带存储功能，用于存储已经训练好的分类器以及对应的特征提取算法。

如图2所示，基于上述装置，本发明的另一改进点在于所述处理器中的分类器训练方式不同，在本实施例中按照以下方式进行：

s1:提取样本数据集

本例中首先选择40个受试者，包括20个帕金森病患者，其中6个女性，14个男性，20个健康者，其中10个女性，10个男性，利用信号采集器分别采集每个受试者26个语音片段，然后针对每个语音片段提取出26个特征参数。

采集过程中每个语音片段采集至少一种发音内容，包括连续元音字母发音、数字发音、单词发音和短语句发音。

s2：特征集变换，将同一受试者中26个语音片段所对应的26个特征参数扩展为一个26*26维的特征矩阵，然后采用留一法交叉验证，将样本数据集分为训练样本集和测试样本集，训练样本对应的测试样本集来自于不同的受试者；

relief算法最早由kira提出，最初局限于两类数据的分类问题。relief算法是一种特征权重算法(featureweightingalgorithms)，根据各个特征和类别的相关性赋予特征不同的权重，权重小于某个阈值的特征将被移除。relief算法中特征和类别的相关性是基于特征对近距离样本的区分能力。算法从训练集d中随机选择一个样本r，然后从和r同类的样本中寻找最近邻样本h，称为nearhit，从和r不同类的样本中寻找最近邻样本m，称为nearmiss，然后根据以下规则更新每个特征的权重：如果r和nearhit在某个特征上的距离小于r和nearmiss上的距离，则说明该特征对区分同类和不同类的最近邻是有益的，则增加该特征的权重；反之，如果r和nearhit在某个特征的距离大于r和nearmiss上的距离，说明该特征对区分同类和不同类的最近邻起负面作用，则降低该特征的权重。以上过程重复m次，最后得到各特征的平均权重。特征的权重越大，表示该特征的分类能力越强，反之，表示该特征分类能力越弱。relief算法的运行时间随着样本的抽样次数m和原始特征个数n的增加线性增加，因而运行效率非常高。

本实施例所选择的分类器为多核svm分类器，包括一个线性核函数和一个高斯核函数，作为同等替换，也可以选择单独的线性svm分类器、knn分类器或rf分类器。

本例中选定的线性核函数为：高斯核函数为：且多核svm分类器的核函数为：k(x,xi)＝0.8k1(x,xi)+0.2k2(x,xi)；

在具体实施时，分类器采用类准确率、灵敏度以及特异度三项指标来评价其是否满足预设条件，其中：

1)类准确率

2)灵敏度

3)特异度

其中,tp为真阳性，tn为真阴性，fp为假阳性，fn为假阴性。

当分类器训练达到预设标准后，利用训练好的分类器对测试对象进行诊断，从诊断对象中提取对应的语音片段，并采集对应的特征参数，构成特征向量，输入最终的分类器中进行分类判别，便可输出测试结果。

在具体实施时，步骤s1中的样本数据集也可以从现有的帕金森病数据库中直接提取，比如选用little教授创建的数据集或sakar教授于2013年创建的training_data数据集，从而简化训练样本和测试样本信息的采集。

为进一步理解本发明的技术效果，接下来通过列举具体数据做进一步说明。

本例中合并26个语音段的语音特征，形成676个新特征，组成混合特征集。

如图3所示为混合特征权重图。各特征权重值为所有受试者采用留一法交叉验证后，每个受试者特征权重值线性叠加所得，横坐标为语音段序号，纵坐标为特征序号。

权重值大的色块的分布区域相对较为集中且数量较少，绝大部分色块的权重值较小。可以发现，基于同样的特征和不同语音段，权重差别较大。以a，b两处色块区域为例，其所处的特征序号为7和17。相对于第1-5个语音段来说，这两个特征非常有效。但对于第6-9个语音段来说，这两个特征非常差。这说明，定量分析不同语音段和特征的相互关系非常重要。结合这两个特征和第1-5个语音段可以发现，它们的组合形成的特征权重非常大，这说明它们之间具有很明显的协同效应。第1-5个语音段对应的是‘a’，‘o’，‘u’，‘1’，‘2’，第7个特征和第17个特征的含义分别是振幅微扰‘shimmer’及基音周期标准差‘standarddeviation’。根据语音学原理可以发现，当发这5个语音的时候，需要较好的稳定性，而振幅微扰和周期标准差能够较好的表征(评估)发音的稳定性。由于帕金森病人存在发音障碍，当其在发这5个语音段时，难以保持较好的稳定性，因此这两个特征就能够在此时，精确的识别其帕金森病状态，从而实现准确分类。

图4为采用relief加权算法优选后混合特征数量与分类准确率的关系图，混合特征按权重大小排序后，取前n个特征来进行分类识别，得到分类准确率。横坐标为优选后混合特征数目，纵坐标为分类准确率。

由图4可以看出，当混合特征达到20左右以后，分类准确率迅速上升到70％以上。当所选特征数目＝363时，分类准确率达到最大，为82.5％。设比例系数k＝所选特征数目/特征总数，k＝1/2，准确率为80％；k＝1/4，准确率80％；k＝1/6，准确率为70％；k＝1/8，准确率65％。可以看出混合特征数量与分类准确率关系比较明确，但大多数情况下，分类准确率变化都比较平稳。

进一步地，本发明与参考文献sakarbe,isenkulme,sakarco,etal.collectionandanalysisofaparkinsonspeechdatasetwithmultipletypesofsoundrecordings.[j].ieeejournalofbiomedical&healthinformatics,2013,17(4):828-834所提出的算法进行了对比，具体如表1所示。

上述参考文献中较好的分类结果是基于svm(线性和径向基核函数)。因此，为了公平比较，本发明与其分别进行比较。此外，该表中仍然包含了上述参考文献的分类准确率结果。

从该表可以发现，相较于现有方法，本发明取得了较为明显的改进效果。在准确率上，本发明从67.5％提高到82.5％，改进了22％；在灵敏度上，本发明仍然保持了现有方法的最高水平80％；在特异度上，本发明从65％提高到85％，改进了30.8％。相较于参考文献的结果，本发明从52％提高到82.5％，改进了58.6％，由此可见，其效果非常明显，分类准确率，灵敏度及特异度均有显著提高。

表1本发明分类结果对比

最后需要说明的是，上述描述为本发明的优选实施例，本领域的普通技术人员在本发明的启示下，在不违背本发明宗旨及权利要求的前提下，可以做出多种类似的表示，这样的变换均落入本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李勇明;谢廷杰;王品;郑源林;张小恒;承欧梅;张艳玲
技术所有人：重庆大学
我是此专利的发明人

上一篇：语义处理服务器及用于语义处理的方法与流程
上一篇：航空座舱环境自适应语音特征模型训练方法与流程