一种基于糖尿病数据库的大数据挖掘系统的制作方法

文档序号:18036095发布日期:2019-06-28 23:20阅读:177来源:国知局
一种基于糖尿病数据库的大数据挖掘系统的制作方法

本发明涉及大数据技术领域,具体涉及一种基于糖尿病数据库的大数据挖掘系统。



背景技术:

糖尿病是一组以高血糖为特征的代谢性疾病。高血糖则是由于胰岛素分泌缺陷或其生物作用受损,或两者兼有引起。中医文献是数千年来无数医家代代相传累积起来的医学理论与医疗经验的结晶,记录了数千年来防病治病的丰富经验,对现今的医疗实践和医疗科研仍有重要的指导作用和应用价值,因此中医文献的数字化具有重要意义。

在《时珍国医国药》,2015年06期中发表的名为《糖尿(消渴)病文献数字化方法的研究》的论文中,公开了一种糖尿病文献数字化方法,对古今文献进行了整理,对症状命名,症状量化进行规范化,同时还对辩证名称、方剂、药名进行规范化,并根据此方法建立了糖尿病文献信息标准数据库,并得到规范化病案数据字库表单,且当为医案表单时,条件属性为症状名,决策属性为证型名。

现有的技术对于中医文献中的医案数据只是进行规范化的整理和优化,无法做到将繁多、杂乱的数据库进行可视化的数据挖掘,进而影响到中医文献数据库的应用和推广。



技术实现要素:

为了解决上述的技术问题,本发明的目的在于提供一种基于糖尿病数据库的大数据挖掘系统。

本发明所要解决的技术问题为:

如何对糖尿病中医文献标准数据库进行可视化的数据挖掘,使医生能够更加简单方便的使用糖尿病中医文献标准数据库。

本发明的目的可以通过以下技术方案实现:

一种基于糖尿病数据库的大数据挖掘系统,包括医院端子系统和云服务器,多个医院端子系统均与云服务器通信连接,所述云服务器包括云计算模块、对比数据存储模块、标准数据库存储模块、通信模块,所述医院端子系统包括人机交互模块、医案记录模块、回访模块和通信模块;

所述医院端子系统用于筛选出糖尿病相关的诊断书,并发送至云服务器,其中所述人机交互模块用于医生输入诊断数据并传输至医案记录模块,所述医案记录模块用于将诊断数据转化为包含病人信息、症状、证型和治疗时长的诊断书,并对筛选出糖尿病相关的诊断书,生成医案数据存储在本地,所述回访模块用于在完成疗程后对糖尿病患者的治疗效果进行回访,并对治疗效果分为三个等级,分别为差、无变化、良,并与对应的诊断书以进行关联,作为回访数据,且并根据回访结果选择上传或是本地存储;

所述云服务器用于对接收的数据进行筛选,并通过与标准数据库中的数据比对后进行分析,进而对标准数据库进行优化和数据挖掘,其中所述对比数据存储模块用于存储所有医院端子系统发送的数据,所述标准数据库存储模块用于存储糖尿病中医文献的标准数据库,所述云计算模块用于数据的处理和计算;

所述云计算模块的处理步骤如下:

步骤一、对标准数据库存储模块中的糖尿病中医文献标准数据库进行整理,获取医案表单中所有的症状数据和证型数据,对症状数据去重并进行编号,得到症状标准数据库z={z1,z2,…,zn},对证型数据去重并进行编号,得到证型标准数据库f={f1,f2,…,fm};

步骤二、读取所述对比数据存储模块中存储的医案数据,获取医案数据中的病人症状、证型以及药方,并将病人症状与症状标准数据库z进行对比,证型与证型标准数据库f进行对比,得到该医案数据的病人症状集合z’和证型f’,将病人症状集合z’和证型f’存储至对比数据存储模块中;

步骤三、将糖尿病中医文献标准数据库内每个医案号中的症状进行提取,形成医案号症状集合zi,其中i为医案号,将病人症状集合z’依次与医案号症状集合zi进行对比,根据重复率计算公式,计算出所有医案号与病人症状集合z’的重复率,获取重复率高于α%的所有医案号,其中a不小于90,并获取对应各个医案号的证型,得到证型集合f’;

步骤四、若证型集合f’中只有一种证型且与证型f’相同,则筛选出病人症状集合z’与医案号症状集合zi相同的元素,并生成备选标志症状集合b,将所有医案号对应的备选标志症状集合b进行交运算,得到该医案数据对应的标志症状集合b’,将所有证型集合f’中只有一种证型且与证型f’相同的医案数据对应的标志症状集合b’依照证型标准数据库f进行分组,相同证型分为一组,将各组的标志症状集合b’进行交运算,得到各证型的共有症状集合t,对各证型的共有症状集合t筛选,筛选出不属于其他证型的共有症状集合t的元素,作为该证型的优选标志症状集合,将该组内其他的元素作为参考标志症状集合,并根据优选标志症状集合和参考标志症状集合已经对应证型生成症状-证型参考表。

进一步的,所述重复率计算公式为其中相同数为病人症状集合z’与医案号症状集合zi相同的元素数量,缺少数为属于医案号症状集合zi,且不属于病人症状集合z’的元素数量,多余数为不属于医案号症状集合zi,且属于病人症状集合z’的元素数量,总数为医案号症状集合zi中的元素总数。

进一步的,所述医院端子系统的执行步骤如下:

s1、医生在诊断后操作人机交互模块输入诊断书并发送;

s2、医案记录模块接收诊断书后,判断是否诊断为糖尿病,若不是,则不对诊断书进行存储,若是,则将标记为医案数据后存储至本地;

s3、回访模块读取存储在本地的诊断书,从中获取病人的治疗时长,计算出病人的疗程结束日期,在疗程结束日期后一个月内,若再次读取到相同病人的诊断书,则根据诊断书对上个疗程的治疗效果分为三个等级,分别为差、无变化、良,若疗程结束日期后一个月内未读取到相同病人的诊断书,则提示医生进行人工回访,医生回访后将回访的数据通过人机交互模块进行输入,传输至回访模块后,将上个疗程的治疗效果分级为差、无变化、良;

s4、回访模块完成治疗效果的分级,且分级结果为良后,将医案数据通过通信模块传输至云服务器进行存储,若分级结果为无变化或是差,则将回访数据与医案数据进行关联,并将回访数据存储至本地。

进一步的,步骤四中,若证型集合f’中证型种类为两种,且其中一种证型占比小于β%,则将两种证型标注为q和p,并将医案号症状集合zi与病人症状集合z’进行差集运算,得到属于医案号症状集合zi,且不属于病人症状集合z’的元素构成备选区别症状集合z0,并与医案号对应的证型关联,根据q与p对备选区别症状集合z0进行分组,再进行并运算,得到分别对应q的优选区别症状集合z0q和对应p的优选区别症状集合z0p,获取所有医案数据对应q的优选区别症状集合z0q进行交运算,再对应p的优选区别症状集合z0p进行交运算,得到对应q的标准区别症状集合z0q’和对应p的标准区别症状集合z0p’,并生成q-p标准区别症状表。

本发明的有益效果:

(1)通过设置在各个医院中的医院端子系统,可对医院的诊疗数据进行汇总和筛选,形成对比用的大数据,根据需要上传至云服务器中。

(2)通过回访模块对采集到的数据进行诊断效果的判断,保证上传的数据均真实有效,诊断准确度高,且通过自动或提示进行人工回访的方式,有效的保证数据完整性。

(3)云计算模块对糖尿病中医文献标准数据库和上传的数据进行整理,并将两者对比和计算,得到各个证型的症状-证型参考表,将原本杂乱无序的数据库以可视化的形式直观的展示,方便医生使用糖尿病中医文献标准数据库。同时对数据进一步挖掘,得到q-p标准区别症状表,可将两种证型的区别症状进行可视化的展示,进一步方便医生使用糖尿病中医文献标准数据库。

附图说明

下面结合附图对本发明作进一步的说明。

图1是本发明的系统框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,本实施例提供了一种基于糖尿病数据库的大数据挖掘系统,包括医院端子系统和云服务器,医院端子系统设置在全国的三甲医院,多个医院端子系统均与云服务器通信连接,云服务器采用分布式服务器,云服务器包括云计算模块、对比数据存储模块、标准数据库存储模块、通信模块,医院端子系统包括人机交互模块、医案记录模块、回访模块和通信模块;

医院端子系统用于筛选出糖尿病相关的诊断书,并发送至云服务器,其中人机交互模块内置有根据糖尿病中医文献标准数据库建立的症状描述库和证型描述库,用于供医生输入时选取,人机交互模块用于医生输入诊断数据并传输至医案记录模块,医案记录模块用于将诊断数据转化为包含病人信息、症状、证型和治疗时长的诊断书,并对筛选出糖尿病相关的诊断书,生成医案数据存储在本地,回访模块用于在完成疗程后对糖尿病患者的治疗效果进行回访,并对治疗效果分为三个等级,分别为差、无变化、良,并与对应的诊断书以进行关联,作为回访数据,且并根据回访结果选择上传或是本地存储;

云服务器用于对接收的数据进行筛选,并通过与标准数据库中的数据比对后进行分析,进而对标准数据库进行优化和数据挖掘,其中对比数据存储模块用于存储所有医院端子系统发送的数据,标准数据库存储模块用于存储糖尿病中医文献的标准数据库,云计算模块用于数据的处理和计算;

云计算模块的处理步骤如下:

步骤一、对标准数据库存储模块中的糖尿病中医文献标准数据库进行整理,获取医案表单中所有的症状数据和证型数据,对症状数据去重并进行编号,得到症状标准数据库z={z1,z2,…,zn},对证型数据去重并进行编号,得到证型标准数据库f={f1,f2,…,fm};如整理后的症状标准数据库为z={夜尿轻,盗汗轻,…,体重减轻},证型标准数据库为f={气阴两虚,阴虚热盛,…,阴阳两虚}

步骤二、读取对比数据存储模块中存储的医案数据,且存储的医案数据的样本数不少以10万,获取医案数据中的病人症状、证型以及药方,并将病人症状与症状标准数据库z进行对比,证型与证型标准数据库f进行对比,得到该医案数据的证型f’以及病人症状集合z’,其中z’中元素数量不定,将病人症状集合z’和证型f’存储至对比数据存储模块中;如病人症状集合z’={z1,z3,z8,z9,z10,z14},证型f’为阴阳两虚。

步骤三、将糖尿病中医文献标准数据库内每个医案号中的症状进行提取,形成医案号症状集合zi,其中i为医案号,如z3表示医案号为3对应的所有症状,如医案号症状集合z3={z1,z3,z8,z9,z10,z13,z14},将病人症状集合z’依次与医案号症状集合zi进行对比,根据重复率计算公式,重复率计算公式为其中相同数为病人症状集合z’与医案号症状集合zi相同的元素数量,根据上述数据,为6个,缺少数为属于医案号症状集合zi,且不属于病人症状集合z’的元素数量,为1个,多余数为不属于医案号症状集合zi,且属于病人症状集合z’的元素数量,为0个,总数为医案号症状集合zi中的元素总数,为7个。计算出所有医案号与病人症状集合z’的重复率为92.85%高于90%,因此选取该医案号,获取重复率高于90%的所有医案号,并获取对应各个医案号的证型,得到证型集合f’;

步骤四、若证型集合f’中只有一种证型且与证型f’相同,如元素均为阴阳两虚,则筛选出病人症状集合z’与医案号症状集合zi相同的元素,并生成备选标志症状集合b,按上述例子,医案号为3对应的备选标志症状集合b={z1,z3,z8,z9,z10,z14},将所有医案号对应的备选标志症状集合b进行交运算,得到该医案数据对应的标志症状集合b’,如b’={z1,z3,z10,z14},将所有证型集合f’中只有一种证型且与证型f’相同的医案数据对应的标志症状集合b’依照证型标准数据库f进行分组,相同证型分为一组,将各组的标志症状集合b’进行交运算,得到各证型的共有症状集合t,如症状集合t={z3,z10,z14},对各证型的共有症状集合t筛选,筛选出不属于其他证型的共有症状集合t的元素,作为该证型的优选标志症状集合,如优选标志症状集合={z10,z14},将该组内其他的元素作为参考标志症状集合={z3},并根据优选标志症状集合和参考标志症状集合已经对应证型生成症状-证型参考表。能够帮助医生根据证型进行辅助判断。

医院端子系统的执行步骤如下:

s1、医生在诊断后操作人机交互模块输入诊断书并发送;

s2、医案记录模块接收诊断书后,判断是否诊断为糖尿病,若不是,则不对诊断书进行存储,若是,则将标记为医案数据后存储至本地;

s3、回访模块读取存储在本地的诊断书,从中获取病人的治疗时长,计算出病人的疗程结束日期,在疗程结束日期后一个月内,若再次读取到相同病人的诊断书,则根据诊断书对上个疗程的治疗效果分为三个等级,分别为差、无变化、良,自动获取病人的复查记录,免去人工回访的工序,若疗程结束日期后一个月内未读取到相同病人的诊断书,则提示医生进行人工回访,尽可能保证数据的完整性,医生回访后将回访的数据通过人机交互模块进行输入,传输至回访模块后,将上个疗程的治疗效果分级为差、无变化、良;

s4、回访模块完成治疗效果的分级,且分级结果为良后,将医案数据通过通信模块传输至云服务器进行存储,若分级结果为无变化或是差,则将回访数据与医案数据进行关联,并将回访数据存储至本地。有用的数据发送云端,无用数据存储本地,减少云服务器的存储压力。

步骤四中,若证型集合f’中证型种类为两种,且其中一种证型占比小于80%,说明存在分歧,则将两种证型标注为q和p,并将医案号症状集合zi与病人症状集合z’进行差集运算,得到属于医案号症状集合zi,且不属于病人症状集合z’的元素构成备选区别症状集合z0,进行初步筛选,并与医案号对应的证型关联,根据q与p对备选区别症状集合z0进行分组,再进行并运算,得到分别对应q的优选区别症状集合z0q和对应p的优选区别症状集合z0p,获取所有医案数据对应q的优选区别症状集合z0q进行交运算,再将对应p的优选区别症状集合z0p进行交运算,如q和p分别为气阴两虚和阴虚热盛,则只采用证型集合f’只有气阴两虚和阴虚热盛这两种证型对应的医案数据进行运算,保证q-p的区别度,得到对应q的标准区别症状集合z0q’和对应p的标准区别症状集合z0p’,并生成q-p标准区别症状表。能够帮助医生区别q和p的判断。

本实施例在工作过程中,通过设置在各个医院中的医院端子系统,可对医院的诊疗数据进行汇总和筛选,形成对比用的大数据,根据需要上传至云服务器中。通过回访模块对采集到的数据进行诊断效果的判断,保证上传的数据均真实有效,诊断准确度高,且通过自动或提示进行人工回访的方式,有效的保证数据完整性。云计算模块对糖尿病中医文献标准数据库和上传的数据进行整理,并将两者对比和计算,得到各个证型的症状-证型参考表,将原本杂乱无序的数据库以可视化的形式直观的展示,方便医生使用糖尿病中医文献标准数据库。同时对数据进一步挖掘,得到q-p标准区别症状表,可将两种证型的区别症状进行可视化的展示,进一步方便医生使用糖尿病中医文献标准数据库。

以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1