一种基于矢量空间的帕金森病数据集分类方法与流程

文档序号:20032291发布日期:2020-02-28 10:32阅读:799来源:国知局
一种基于矢量空间的帕金森病数据集分类方法与流程
本发明涉及帕金森病数据集分类方法,特别是一种矢量空间下的帕金森病数据集分类方法。
背景技术
:帕金森病是一种多发于中老年的渐进性中枢神经系统变性疾病,在帕金森病患者中,有50%~80%的病例起病隐袭,早期难以察觉而常被忽视,检测语言障碍将有助于实现高准确性的帕金森病早期诊断,现有基于语音特征的帕金森病数据集分类方法算法复杂度很高,并不利于工程实现,本发明实现了一种算法复杂度很低而不失准确率的帕金森病数据集分类方法。技术实现要素:针对现有技术,本发明提供了一种矢量空间下算法复杂度低而不失准确率的帕金森病数据集分类方法。该方法包括以下步骤:(1)对m个受试者(m1健康人,m2患者)每人采集h0段语音,每段语音提取n个帕金森语音相关特征,构成特征矩阵其中(2)语音特征集变换。变换后语音特征集为其中(3)将变换后的数据集s′按留一法划分为训练集及相应标签和测试集及相应标签yt=bm,其中标签bm∈{0,1};(4)零均值(z-score)标准化训练集生成新集合xstd,并在xstd的矢量空间中计算健康人语音特征集向量空间质心及患者语音特征集向量空间质心(5)计算xt与xp,xq的欧式距离xt的所属类别为class(min(dt,p,dt,q)),即类别与距离较近一方保持一致;(6)按留一法遍历所有样本计算帕金森病分类准确率其中class(min(dt,p,dt,q))为测试样本预测类别,bt为测试样本实际类别;附图说明图1是根据本发明的一个实施例构成的系统方框图;具体实施方式本发明提出的矢量空间下的帕金森病数据集分类方法结合附图及实施例进一步说明如下:本发明的方法流程如图1所示,包括以下步骤:(1)样本数据集由m个受试者(m1健康人,m2患者)每人采集h0段语音,每段语音提取n个帕金森语音相关特征构成;(2)样本数据集进行转换构成特征矩阵;(3)将特征矩阵按留一法划分为训练集和测试集;(4)零均值(z-score)标准化训练集生成新集合xstd,并在xstd的矢量空间中计算健康人语音特征集向量空间质心及患者语音特征集向量空间质心计算xt与xp,xq的欧式距离xt的所属类别为class(min(xp,xq)),即类别与距离较近一方保持一致;(5)按留一法遍历所有样本计算帕金森病分类准确率本发明的上述技术方案与现有技术方案相比较,具有以下优点:a、相比已有方法计算复杂度极低;b、准确率较高;本发明上述方法各步骤的具体实施例详细说明如下:上述训练过程步骤(1)中数据集由sakar等人建立并从加州大学欧文分校(uci)机器学习数据库网站获取。主要选取名为“trainning_data”的数据集,其中包含m=40名受试者,m1=20名健康受试者,m2=20患者受试者,每一个测试对象包含了h0=26个语音样本,具体样本参考表1,每一个语音样本设置n=26个特征,具体特征参考[1]:b.e.sakar,m.e.isenkul,c.o.sakar,a.sertbas,f.gurgen,s.delil,h.apaydin,o.kursun.collectionandanalysisofaparkinsonspeechdatasetwithmultipletypesofsoundrecordings.ieeejournalofbiomedical&healthinformatics.17,828-834(2013).来设定。表1:语音样本信息样本序列样本描述第1个持续元音aaa第2个持续元音ooo第3个持续元音uuu第4个~第13个数字1~10第14个~第17个预设的短句第18个~第26个预设的单词当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1