基于人工智能的早期阿尔茨海默病诊断系统的制作方法

文档序号:16760908发布日期:2019-01-29 17:42阅读:610来源:国知局
基于人工智能的早期阿尔茨海默病诊断系统的制作方法

本发明属于人工智能领域,更具体的涉及一种基于人工智能的早期阿尔茨海默病诊断方法。



背景技术:

阿尔茨海默病(ad)是一种起病隐匿的进行性发展的神经系统退行性疾病。2017年,仅美国就有570万人患有该疾病,相关医疗费用支出高达2320亿美元。随着老龄化社会的到来,阿尔茨海默病的发病趋势呈现快速增长的态势。目前,尚无治疗阿尔茨海默病的特效药物。早发现,早干预,早治疗是诊治ad的唯一手段。

诊断ad的医学手段有1、神经心理学测验(简易精神量表(mmse)),2、神经影像学检查(ct、mri、pet)3、脑脊液检测(β淀粉样蛋白、tau蛋白检测),4、基因检测(淀粉样蛋白前体蛋白基因、早老素1、2基因、载脂蛋白apoe4基因)。技术手段2、3、4不仅对人体有创伤,而且花费不菲,不适用于早期ad的普筛。技术手段1也存在需要专业医生介入评判的缺点。

专利cn108200492a公开了一种语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备,提供了一种语音控制优化方法、装置以及集成入耳式麦克风的耳机和穿戴设备,涉及智能穿戴设备技术领域。其中,语音控制优化方法包括:接收音频信号,在音频信号进入语音识别系统(asr)之前,对音频信号进行声学滤波,获取预处理音频;预处理音频被麦克风采集,经过模拟电路滤波后通过模数转换生成数字音频;数字音频经由语音识别系统(asr)被处理为有效语音指令;根据有效语音指令触发智能设备的相应功能。

本发明采用一种新型的nlp技术,相对于上述专利将文本分成不同的指令类型,本发明是将文本分成两类:患者、健康人,采用新型的nlp算法,在诊断阿尔茨海默病(ad)中具有显著的效果。



技术实现要素:

1、发明目的。

本发明提出了一种基于人工智能的早期阿尔茨海默病诊断方法。

2、本发明所采用的技术方案。

本发明公开了一种基于人工智能的早期阿尔茨海默病诊断方法,获取文字朗读录音后通过asr程序自动翻译成文本;然后将文本按照如下的nlp处理方法判断患者是否患有ad,具体为:

步骤1、采集预设数量的学习样本,按照ad患者和健康人的标签分类成ad组和健康人组;

步骤2、将文本中的词汇按照出现频率高低排序,对ad患者组抽取前n个高频词,构成集合a;对健康人组抽取前m个高频词,构成集合b;

步骤3、c=(a∪b)-(a∩b),按照上述公式得到新的集合c;

步骤4、根据新集合c重新选择文本;

步骤5、采用线性线性分类器,得到学习模型;

步骤6、将学到的模型用于系统,判断用户是否患有ad。

更进一步,所述的步骤5中,线性分类时,将两个样本合并,并随机抽取n%做训练样本,剩余(100-n)%为测试样本。

更进一步,线性线性分类器包括支持向量机、朴素贝叶斯、决策树、随机森林对样本进行分类学习,得到学习模型。

本发明公开了一种基于人工智能的早期阿尔茨海默病诊断系统,包括朗读文字获取模块,获取文字朗读录音后通过人工智能asr程序自动翻译成文本;

nlp判断ad模块,将文本按照如下的nlp处理方法判断患者是否患有ad具体为:

采集预设数量的学习样本,按照ad患者和健康人的标签分类成ad组和健康人组;

将文本中的词汇按照出现频率高低排序,对ad患者组抽取前n个高频词,构成集合a;对健康人组抽取前m个高频词,构成集合b;

c=(a∪b)-(a∩b),按照上述公式得到新的集合c;

根据新集合c重新选择文本;

采用线性线性分类器,得到学习模型;

将学到的模型用于测试,给出用户是否患有ad的判断。

更进一步,采用线性线性分类器进行线性分类时,将两个样本合并,并随机抽取n%做训练样本,剩余(100-n)%为测试样本。

更进一步,线性线性分类器包括支持向量机、朴素贝叶斯、决策树、随机森林对样本进行分类学习,得到学习模型。

3、本发明所产生的技术效果。

(1)本发明提出的新型nlp处理系统,根据美国的dementiabank语音库测试,可实现早期阿尔茨海默病(ad)的诊断,模型正确率为87.5%,召回值r为92.16%,准确率p为85.45%,f值为88.68%,分类效果最优。

(2)与传统nlp算法相比,新算法分别求取ad组和健康人组的特征,采用特征集的集合运算,实现了对传统nlp算法特征的有效降维,不仅提高了识别的正确率,而且降低了内存空间的需求,加快了运算速度。

(3)本发明可用于电脑终端,也可以用于移动终端,使用者只需要按照提示说几分钟的话,无需专业医生的介入分析,机器通过人工智能就能给出用户是否患有ad的判断。该方法不对人体产生创伤,费用低廉,诊断速度快,简便易用,是一种对早期ad进行大规模筛选的有效技术手段。

附图说明

图1早期ad筛选诊断技术原理图。

具体实施方式

实施例

首先,使用者讲述一段文字,该段文字录音后通过asr程序自动翻译成文本。然后将文本送入nlp处理程序,该程序会自动给出患者是否患有ad的判断。整个系统可以在电脑上完成,也可以移植到智能手机上,全程不需要专业医生参与,诊断快捷,费用低廉,适合对大规模人群进行ad筛选。

整个系统的核心技术是nlp,其判断原理如下。

1、找到足够数量的学习样本,按照ad患者和健康人的标签分类成ad组和健康人组;

2、将文本中的词汇按照出现频率高低排序,对ad患者组抽取前n个高频词,构成集合a;对健康人组抽取前m个高频词,构成集合b;

3、c=(a∪b)-(a∩b),按照上述公式得到新的集合c;

4、根据新集合c重新选择文本(即将原文本中的不存在在c集合中的词汇删除,形成新的词汇文本);

5、采用线性线性分类器(支持向量机(svm)、朴素贝叶斯(nb)、决策树(dt)、随机森林(rf)等)对样本进行分类学习,得到学习模型;

6、将学到的模型用于系统,判断用户是否患有ad。

这里采用的是美国的dementiabank语音库,选取242个健康样本和237个ad样本。(因为是实验测试,所以在第4步,线性分类时,会随机抽取80%做训练样本,剩余20%为测试样本来评价模型。在实际系统中,用户的输入就是测试样本。)

1、对242个健康样本组,采用n=125(经验值,一般设置为全体文本的总词汇量(本测试是1092个词汇)的1/10左右),得到词汇集合a;

2、对237个ad样本组,采用m=126(经验值),得到词汇集合b;

3、根据公式求得集合c,其大小为57;

4、将健康样本组与ad样本组混合后,根据集合c,将文本转换成[479,57]的矩阵,随机抽取80%的样本训练;

5、采用开源的python工具tpot,智能自动化选择线性分类器(支持向量机(svm)、朴素贝叶斯(nb)、决策树(dt)、随机森林(rf)等),得到模型;

6、用剩余20%的测试样本对模型进行测试,得出:

模型正确率为87.5%,召回值r为92.16%,准确率p为85.45%,f值为88.68%。分类效果最优。

与传统nlp算法相比,新算法分别求取ad组合健康人组的特征,实质上实现了特征的降维处理(从[479,1092]降到了[479,57]),不仅提高了识别的正确率,而且降低了内存空间的需求,加快了运算速度。

本发明可用于电脑终端,也可以用于移动终端,使用者只需要按照提示说几分钟的话,通过人工智能,无需专业医生的介入分析,机器就能给出用户是否患有ad的判断。该方法不对人体产生创伤,费用低廉,诊断速度快,简便易用,是一种对早期ad进行大规模筛选的有效技术手段。

对照例

传统nlp算法:选取242个健康样本和237个ad样本,合并成具有479个样本的大集合(因为是实验测试,所以在第3步,线性分类时,会随机抽取80%做训练样本,剩余20%为测试样本来评价模型。在实际系统中,用户的输入就是测试样本。)。

1、计算合并后的总样本组的词汇量(n=1092),按照词频由高到低顺序排列得到词汇集合a

2、根据集合a,将原文本转化成[479,1092]的矩阵

3、采用线性分类器(支持向量机(svm)、朴素贝叶斯(nb)、决策树(dt)、随机森林(rf)等),在矩阵中随机抽取80%的数据进行训练,得到模型;

4、用剩余20%的测试样本对得到的模型进行测试,得出:

模型正确率为62.5%,召回值r为52.94%,准确率p为69.23%,f值为60.00%。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1