一种医疗数据采集分析系统的制作方法

文档序号:15025216发布日期:2018-07-27 17:26阅读:903来源:国知局

本发明涉及数据分析领域,具体涉及一种医疗数据采集分析方法及系统。



背景技术:

既往患者的数据无法跟随患者移动,不容易对患者进行跟踪随访,对于国内患者失访现象非常严重,这就是为什么我国临床试验研究起步和进展缓慢的根本原因,我国患者在全世界排第一,但是临床研究在世界上排不上号,正式因为患者的数据没有保存,无法对各种手术治疗方法进行比对,分析,无法提供有效的数据说明,严重阻碍了医学研究工作的开展,和医学事业的发展。



技术实现要素:

本发明所要解决的技术问题是提供一种医疗数据采集分析方法及系统。

本发明解决上述技术问题的技术方案如下:

一种医疗数据采集分析方法,包括以下步骤:

S1、将原始数据上传至数据平台;

S2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;

S3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;

S4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;

S5、对分析结论进行整理和分类,构建治疗方案知识库。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步的,所述步骤S1的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。

进一步的,所述步骤S1之前,还包括在前置服务器上对原始数据进行筛选和整理的步骤。

进一步的,所述步骤S4中的对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。

一种医疗数据采集分析系统,包括以下部分:

数据平台,用于存储上传的原始数据;

格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;

数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;

统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;

治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。

进一步的,所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。

进一步的,还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。

进一步的,所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。

本发明的有益效果是:本发明有针对性的采集人员的整个临床诊疗数据,分布式的存储可以存储海量的医疗数据,通过对大量的有效数据进行分析,做出临床辅助诊断、疾病预警和分析患者的行为,在临床上可以帮助医生更好的根据患者的临床信息制定更加有效的、精确的、个性化的治疗方案。实现了将病人的多次、异地的诊疗信息自动关联起来。

附图说明

图1为本发明方法流程图;

图2为本发明系统流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

本发明的医疗数据采集分析方法,包括以下步骤:

在有条件部署前置服务器的地方,在前置服务器上部署数据采集工具,通过数据采集工具对数据进行整理和筛选后上传到数据平台;在没有条件部署前置服务器的地方,通过数据上报平台将数据上传到数据平台;

由于上传到数据平台的数据既包含结构化数据,如检验结果,病人基本信息等,又包括非结构化数据,如检查结果,病史等,为了更好的对这些数据进行分析,本发明没有使用传统的关系模型来描述这些数据,而是采用了 RDF来描述这些数据。为了将这些数据转换为RDF格式的数据,本发明采用了基于CRF(条件随机域)和依存语法相结合的语义标注算法将这些数据转换为RDF格式的数据;

将这些RDF格式的数据进行分析,根据病人的基本信息通过数据挖掘算法将同一个病人的RDF数据关联起来存储到基于分布式文件系统的Hbase数据库中;

运用统计方法,机器学习方法对Hbase数据库中的数据进行分析,得出数据中的规律,分析出数据的潜在意义;

将分析后的数据运用在医疗领域,做出临床辅助诊断,帮助医生更好的根据患者的临床信息制定更加有效的、精确的、个性化的治疗方案。

一种医疗数据采集分析系统,包括以下部分:

数据平台,用于存储上传的原始数据;

格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;

数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;

统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;

治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。

所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。

本系统还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。

所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。

与现有技术相比,本发明具有以下的有益效果:

(1)实现了医疗数据的海量存储;

本发明采用了高可靠性、高性能、面向列、可伸缩的分布式存储系统Hbase,可以实现将海量的医疗数据存储起来,便于后面的分析。

(2)实现了对非结构化数据的分析;

为了有效的对非结构化的数据进行有效处理,本发明采用了基于CRF(条件随机域)和依存语法相结合的语义标注算法将非结构化数据转换为RDF格式的数据。

(3)实现了将病人的多次、异地的诊疗信息自动关联起来

本发明通过数据挖掘算法对标注后的RDF格式的数据进行关联分析,将同一个病人的多次、异地的诊疗信息关联起来存储到数据平台。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1