一种中医辅助诊断系统的制作方法

文档序号:16888865发布日期:2019-02-15 22:53阅读:661来源:国知局
一种中医辅助诊断系统的制作方法

本发明涉及智能导诊、计算机自动诊断技术领域,特别是指一种中医辅助诊断系统。



背景技术:

中医理论是中国古代长期实践,不断传承积累下来的传统医学。几千年来,中医理论自身不断自我完善并发展,在临床实践中与西医相结合取得了非常好的结果,尤其是针对世界性难治病,其疗效非常显著。在中医的理论中,人生病时的症状最终可以被划分为399类,例如,呼吸困难、头晕、胸痛等。

现在的医疗健康领域中,各个医院为了顺应时代的发展,都纷纷建立了医院管理信息系统,各种医疗信息子系统进入医院日常管理工作中,如电子病历系统。电子病历中收集到的数据不仅包括患者的姓名、年龄、性别等基本资料,还包括之前治疗时的疾病症状和治疗方案等。

因此,如何利用大量医疗健康数据,进行个性化的分析,学习并自适应数据中的变化,对于个性化医疗,智能导诊具有非常重要的意义。

现有技术中,还没有利用现存的医疗健康数据进行疾病症状辅助诊断的系统。



技术实现要素:

本发明要解决的技术问题是提供一种中医辅助诊断系统,以解决现有技术所存在的没有利用现存的医疗健康数据进行疾病症状辅助诊断的问题。

为解决上述技术问题,本发明实施例提供一种中医辅助诊断系统,包括:

信息预处理模块,用于对输入的患者病历信息进行编码,生成相应的离散二值化数据序列;

症状预测模块,用于根据生成的离散二值化数据序列,利用层次实时记忆模型对患者未来症状进行预测;

辅助诊断模块,用于将预测得到的患者未来症状与预先建立的名老中医经验知识库进行相似度匹配,从所述名老中医经验知识库中提取与预测症状相似度最高的若干诊断方案。

进一步地,所述患者病历信息包括:基本信息和症状;所述基本信息包括:患者年龄、患者性别和时间。

进一步地,所述信息预处理模块包括:

时间编码器,用于对输入的病历信息中的时间进行编码,生成相应的离散二值化数据序列;

数字编码器,用于对输入的病历信息中的年龄、性别和症状进行编码,生成相应的离散二值化数据序列。

进一步地,每类症状的评分是按照患者叙述的严重程度确定的。

进一步地,所述症状预测模块,用于根据生成的离散二值化数据序列,利用层次实时记忆模型中的空间池学习患者症状分布的空间序列,根据空间池的学习结果,利用层次实时记忆模型中的时间池学习患者症状出现的时间序列,对患者未来症状进行预测。

进一步地,所述辅助诊断模块,具体用于将预测得到的患者未来症状在预先建立的名老中医经验知识库中进行匹配,利用预设算法中的余弦相似度计算名老中医经验知识库中的症状与预测症状之间的相似度并进行排序,根据排序结果,选出相似度最高的若干个患者的诊断方案。

进一步地,所述余弦相似度表示为:

其中,cos(θ)表示余弦相似度,x1k、x2k分别表示当前患者信息中的的第k维特征和所述名老中医经验知识库中存储的病人信息的第k维特征,n表示一共有n维特征。

本发明的上述技术方案的有益效果如下:

上述方案中,通过信息预处理模块对输入的患者病历信息进行编码,生成相应的离散二值化数据序列;症状预测模块根据生成的离散二值化数据序列,利用层次实时记忆模型对患者未来症状进行预测;辅助诊断模块将预测得到的患者未来症状与预先建立的名老中医经验知识库进行相似度匹配,从所述名老中医经验知识库中提取与预测症状相似度最高的若干诊断方案。这样,基于层次实时记忆模型的中医辅助诊断系统,能够对患者身体健康状况进行预测并从名老中医经验知识库中选出相似度最高的若干个诊断方案,以帮助医生提前发现患者的健康隐患,并提供治疗参考,从而从辅助治疗与预防相结合的角度出发,为中医的临床辅助诊断提供智能化指导,实现疾病的辅助诊断功能,同时为个性化医疗,智能导诊提供支持。

附图说明

图1为本发明实施例提供的中医辅助诊断系统的结构示意图;

图2为本发明实施例提供的中医辅助诊断系统的工作原理示意图;

图3为本发明实施例提供的工作日/周末编码示意图;

图4为本发明实施例提供的周五的日期编码示意图;

图5为本发明实施例提供的星期日的日期编码示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

本发明针对现有的没有利用现存的医疗健康数据进行疾病症状辅助诊断的问题,提供一种中医辅助诊断系统。

如图1所示,本发明实施例提供的中医辅助诊断系统,包括:

信息预处理模块11,用于对输入的患者病历信息进行编码,生成相应的离散二值化数据序列;

症状预测模块12,用于根据生成的离散二值化数据序列,利用层次实时记忆(hierarchicaltemporalmemory,htm)模型对患者未来症状进行预测;

辅助诊断模块13,用于将预测得到的患者未来症状与预先建立的名老中医经验知识库进行相似度匹配,从所述名老中医经验知识库中提取与预测症状相似度最高的若干诊断方案。

本发明实施例所述的中医辅助诊断系统,通过信息预处理模块对输入的患者病历信息进行编码,生成相应的离散二值化数据序列;症状预测模块根据生成的离散二值化数据序列,利用层次实时记忆模型对患者未来症状进行预测;辅助诊断模块将预测得到的患者未来症状与预先建立的名老中医经验知识库进行相似度匹配,从所述名老中医经验知识库中提取与预测症状相似度最高的若干诊断方案。这样,基于层次实时记忆模型的中医辅助诊断系统,能够对患者身体健康状况进行预测并从名老中医经验知识库中选出相似度最高的若干个诊断方案,以帮助医生提前发现患者的健康隐患,并提供治疗参考,从而从辅助治疗与预防相结合的角度出发,为中医的临床辅助诊断提供智能化指导,实现疾病的辅助诊断功能,同时为个性化医疗,智能导诊提供支持。

在前述中医辅助诊断系统的具体实施方式中,进一步地,所述患者病历信息包括:基本信息和症状;所述基本信息包括:患者年龄、患者性别和时间。

本实施例中,患者性别可以用0和1来区分男女。在实际应用中,患者就医时可叙述自己的具体症状,医生会将患者口述的身体不适症状输入系统,且系统会自动为该症状数据标注时间,所以最终输入到系统中的是带有时间戳的结构化数据。

在前述中医辅助诊断系统的具体实施方式中,进一步地,每类症状的评分是按照患者叙述的严重程度确定的。

本实施例中,针对某一类症状,若是没有发生则用0表示,若有发生,则医生则按患者叙述进行1到10的严重程度打分。

在前述中医辅助诊断系统的具体实施方式中,进一步地,如图2所示,所述信息预处理模块包括:

时间编码器,用于对输入的病历信息中的时间进行编码,生成相应的离散二值化数据序列;

数字编码器,用于对输入的病历信息中的年龄、性别和症状进行编码,生成相应的离散二值化数据序列。

本实施例中,病历中时间的部分通过时间编码器进行编码,而年龄、性别和症状的部分通过数字编码器进行编码,从而使得信息预处理模块中所有输入数据(时间、性别、年龄和症状)都被转换成层次实时记忆模型能够处理的格式,即离散二值化数据,为接下来的空间池和时间池的数据处理做好准备工作。

本实施例中的编码的过程与人体外部感觉器官获取信息的过程类似,如人的耳蜗在处理声音时,会将其获取到的声音频率与声音强度在内部毛细胞中转化为一个稀疏的活跃神经元集合。频率段不相同的声音会刺激不同的毛细胞,当某一个特定的频率段声音被感知到的时候,该频率段对应的毛细胞就会对神经元产生一定刺激并向大脑发射信号,而被刺激的神经元会将声音编码为离散的二值化表征。这种编码方式使得表征具有一定的抗噪性,因为每个毛细胞都对应着一个频率段,这个频率段与相邻的毛细胞会有所重叠。这个特征可以保证在一些毛细胞坏死的情况下,信息依然能保证准确有效。

本实施例中,时间编码器主要是对医生输入症状的时间进行编码。它实际上是多个类编码器,即多特征编码。日期时间具有天生的分类特征,每周分为7天(7个类),每天分为24小时(24个类)。

在许多情况下,可以将日期和时间的特征编码为完全离散的类别。在这种情况下,编码应该使用最小化任何类别编码之间的重叠这种方式。最简单的方法是为每个选项专用一些位。任何选项的编码都将其专用位激活,其余位置无效,如图3所示。

这种编码对于添加到数据流非常有用,因为在数据流中,流中的模式在工作日与周末不同。添加此编码可确保层次记忆模型在工作日和周末接收不同的输入模式,从而可以更轻松地学习两个时段的单独预测。然而,这种差异可能并不是明确的或者离散的。中午的模式有时可能类似于早晨的模式,但其他日子可能更像是普通的晚间模式。在这些情况下,只需转换为数值并使用标量编码器生成稀疏分布表征。

但是,特别是在日期和时间的情况下,除了连续之外,类别可以是循环的。例如,星期五是工作日,但与星期四是不同的。周日晚上是周末,但又不像周六晚上。可以从0到6的整数表示星期几,其中,0表示星期日,6表示星期六。日期编码器会创建一个良好的表示,除了周六和周日的编码很少或没有重叠,因为它们位于范围的两端。在这些循环情况下,编码必须“换行”。对于此示例,将在编码中使用少量位。在实际实现中,将需要更多位激活,因此需要更多的总位。理解这一点的最简单方法是使用图表,如图4所示的周五的日期编码。

从周五的日期编码可以看出周五的日期编码中心是落在周五的,也就是说,其显示了星期五的编码表示以及每个编码中心落在何处的注释。而星期日的日期编码包括最开始和最后的位,如图5所示。

本实施例中,数字编码器的编码过程为:

1)选择编码区间,最小值为minval,最大值为maxval

2)计算编码区间为range=maxval-minval

3)选择分装数据的桶数为buckets

4)选择w为每个表征的活跃位数量

5)计算总的位数为n=buckets+w-1

6)对于给定值v,选择其掉落的分装桶i=floor[buckets*(v-minval)/range]

以下是对症状在0和10之间变化的位置编码示例。0代表该症状未出现,1到10代表症状出现的严重程度。

1)最小值是0,最大值是10

2)计算编码区间为range=10-0=10

3)选择将区间分装为10桶

4)选择3为每个表征的活跃位数量

5)计算总的位数为n=buckets+w-1=12

6)现在可以选择7这个值所掉落的分装桶i=floor[10*(7-0)/10]=7

7)表示将是12位,从第7位开始有3个连续的有效位:000000111000

这种编码方法很简单,提供了相当大的灵活性,但要求提前知道适当的数据范围。如果数据超出最小值和最大值,则数字编码器无法正常工作。通常情况会将最小的桶用于低于该范围的值,将最大的桶用于高于该范围的值。因此,高于该范围的所有值将具有相同的表示,并且类似于低于该范围的那些值。

数字编码器中分装桶的数量由数据自身的噪声程度决定。对于较清洁的数据,可以增加分装桶的数量以提高预测的精确度。相反,如果数字的噪声比较大,则应减少分装通的数量提高编码的抗噪性。

本实施例中,信息预处理模块将时间、年龄、性别和症状数据转换成了层级实时记忆能够识别的01比特串之后,症状预测模块将应用htm对患者症状进行预测。

在前述中医辅助诊断系统的具体实施方式中,进一步地,如图2所示,所述症状预测模块,用于根据生成的离散二值化数据序列,利用层次实时记忆模型中的空间池学习患者症状分布的空间序列,根据空间池的学习结果,利用层次实时记忆模型中的时间池学习患者症状出现的时间序列,对患者未来症状进行预测。

本实施例中,htm是一种类脑计算方法,其模型仿照人类大脑皮层将自身分为不同的区域。在区域中,诸多的柱状细胞形成固定的网络结构并组成了柱状区域。空间池为区域分配固定数量的柱状细胞,通过已二值化的症状数据来最终确定最高程度活跃的柱状区域,学习已有症状的空间序列(也可以称为:空间模式)。编码将年龄、性别和症状数据转换成了层级实时记忆模型能够识别的01比特串之后,比特串仅仅是离散的,但未必稀疏。

本实施例中,空间池是层次实时记忆模型的一个重要组成部分。编码负责将性别、年龄、时间和症状数据转化为离散二值化数据序列,离散二值化数据序列输入空间池以后,会将来自上一层的非常长的症状数据稀疏化,转换成长度固定且位数较少的编码,获得不变的表征,记住频繁出现的模式。空间池的具体工作如下:

1)首先是接收来自性别、年龄、时间和症状转化而来的二进制位组成的输入。

2)为区域分配固定数量的柱状区域来接收二值化的病历信息输入。每个柱状区域有与其相关联的树突区域。每个树突区域有一个潜在突触的集合来表示输入的子集。每个潜在突触有一个连通值。基于它们的连通值,一些潜在突触会变得有效。

3)对于给定的症状数据,柱状区域的有效突触数量是与活跃输入位(即值为1)有关的。

4)活跃突触的数量要乘以“促进”系数,该系数是由某个症状相对于周围其他症状的活跃频率动态决定的。

5)在受到促进后达到最高程度活跃的柱状区域会使在抑制半径内除固定百分比的柱状区域外的其它柱状区域暂时丧失机能。抑制半径由输入的传播范围动态决定的。这样便有了一个活跃柱状区域的稀疏集合。

6)对于每个活跃的柱状区域,调整所有潜在突触的连通值。与活跃输入位相对应的突触的连通值会增加。与不活跃输入位对应的突触的连通值会减少。连通值的发化可能会使一些突触从有效变得无效,反之亦然。

通过这样不断的学习,不断强化活跃的神经,弱化不活跃的神经,每个柱状细胞慢慢学习到了一个模式,从而将离散二值化数据序列转化为症状稀疏分布的活跃细胞柱,一起组成共同的症状的稀疏离散表征并输出,以供时间池进行学习。

一个空间池对模式进行学习的效果与参数的设定有很大的关系,主要是会涉及到学习的细致程度以及学习的快慢。总结来说,空间池涉及到的参数及意义如表1所示:

表1空间池参数表

在层次实时记忆模型中,时间池主要负责两件事:

1)学习由空间池生成的症状稀疏分布的活跃细胞柱

2)捕获当前输入症状中的时间序列,根据当前已出现的症状,结合时间池对空间池生成的症状稀疏分布的活跃细胞柱得学习结果,预测接下来一段时间患者的症状。

时间池的工作过程具体可以包括:

步骤1:计算每个细胞的活跃状态。当一个细胞活跃后,它会与比它先活跃起来的细胞建立连接

步骤2:计算每个细胞的预测状态。细胞可以通过关注它们的连接预测它们何时会被激活

步骤3:更新神经连通状态。

时间池算法中,当一个细胞被激活的时候,它会与上一刻被激活的所有细胞形成突触连接。时间池对症状发生的时间序列进行学习之后,这些突触连接可以识别出症状序列中的模式。当某个症状模式被识别出来时,树突的峰值信号会引起细胞体的去极化,使细胞进入预测态,在下一时刻的前馈症状数据输入出现时优先被激活。通过这种方式,可以根据输入的症状数据进行预测。

与空间池相同,时间池上参数的不同也会导致学习效果上的差异,时间池中最为关键的几个参数如表2所示:

表2时间池参数

在前述中医辅助诊断系统的具体实施方式中,进一步地,所述辅助诊断模块,具体用于将预测得到的患者未来症状在预先建立的名老中医经验知识库中进行匹配,利用预设算法中的余弦相似度计算名老中医经验知识库中的症状与预测症状之间的相似度并进行排序,根据排序结果,选出相似度最高的若干个患者的诊断方案。

本实施例中,辅助诊断是将预测得到的患者未来症状在预先建立的名老中医经验知识库中进行匹配,利用预设算法中的余弦相似度计算名老中医经验知识库中的症状与预测症状之间的相似度,寻找所述名老中医经验知识库中症状最相似的患者的诊断方案并进行排序,找出前若干个(例如,五个)相似度最高的患者的诊断方案反馈给医生,这样可以帮助医护工作者做出最佳诊断、优化治疗方案、改善患者预后。该系统能够帮助基层医疗机构医生提高诊疗水平,规范诊疗标准,保障服务质量,降低医疗费用,最终达到帮助患者改善健康的目的。

本实施例中,预先建立的名老中医经验知识库包括但不限于:电子病历、诊断方案,在实际应用中,也可以包括其他的与患者健康有关的信息,例如,体检报告。

在前述中医辅助诊断系统的具体实施方式中,进一步地,所述余弦相似度表示为:

其中,cos(θ)表示余弦相似度,x1k、x2k分别表示当前患者信息中的的第k维特征和所述名老中医经验知识库中存储的病人信息的第k维特征,n表示一共有n维特征。

本实施例中,n是由病人基本信息和399个症状所组成,即n=402,在实际应用中,n的取值由实际应用场景确定。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1