一种基于云计算的大数据健康管理系统及方法与流程

文档序号:16475582发布日期:2019-01-02 23:33阅读:421来源:国知局
一种基于云计算的大数据健康管理系统及方法与流程

本申请涉及健康管理领域,特别地,涉及一种基于云计算的大数据健康管理系统及方法。



背景技术:

随着人们生活质量的提高,对个人身体健康的关注度不断提高,传统的笨重的大型健康监护仪已经不能满足人们的需要;同时我国现在面临人口老龄化和医疗资源紧缺的难题,慢性病的发病率呈逐年上升趋势,国民需要确认合适的途径和设备来实现对自己健康状况的管理。为了实现对生理参数的实时性检测,实现对身体状况的了解,装备智能硬件的便携式、微型化的健康监护仪得到了大力的研究和开发。

然而目前市场上大多数便携式医疗设备,只具备根据单机采集数据来评估个人目前状态,缺乏大规模的数据处理能力、多维度的数据分析能力和深入的数据挖掘能力,即时收集的人体体征数据中蕴含大量有用信息,甚至是可以用来诊断和预防常见疾病的数据。

随着大数据和云计算技术的成熟,使得基于大数据的个性化和精准医疗成为可能;精准医疗的最终目标是为病人设计出最佳医疗方案,一起达到医疗效果最大化和副作用最小化的有效医疗模式。由于互联网的迅猛发展,可以通过物联网、大数据等高科技手段,普及健康生活、优化健康服务、建设健康环境,通过探索健康服务模式创新,统筹解决关系居民健康的重大和长远问题。



技术实现要素:

本发明依托物联网、云计算和大数据等,实现了对用户健康的管理,为用户提供定制的个性化健康服务,提供健康保障,提高医疗资源的分配效率。

本发明的第一方面提供了一种基于云计算的大数据健康管理系统,包括:括数据采集模块、大数据分析平台和智能终端;

数据采集模块用于采集用户健康数据,并将用户健康数据传送给大数据分析平台;

大数据分析平台用于接收和保存用户健康数据,并基于医疗知识搭建诊断和预测模型,根据用户健康数据,对常见的疾病进行风险评估和预测;

智能终端用于向用户显示健康数据、风险评估和预测的结果以及提供个性化医疗服务。

本发明的另一方面,所述数据采集模块包含一个或多个监控终端、环境检测模块和信息收集模块;所述监控终端通过智能移动终端向大数据分析平台传送生命体征数据;所述环境检测模块通过所述智能移动终端定位用户所在位置,联网获得当前时间用户所在位置处的环境参数,或者,所述环境检测模块通过监控终端来测量当前的环境参数;所述信息收集模块通过用户自己填写上传,或者从医院或合作医疗机构经用户授权的方式收集用户信息。

本发明的另一方面,所述大数据分析平台基于hadoop的分析平台,包括数据存储层和数据处理层;

所述数据存储层包括mysql数据库、hbase和hdfs,采用mysql数据库来存储结构化数据,采用hbase存储非结构化数据,采用hdfs存储文件数据;

所述数据处理层采用mapreduce软件框架,包括数据预处理模块、特征工程模块、模型训练模块和模型融合模块;

所述诊断和预测模型是基于先验知识的专家系统或者基于数据驱动的机器学习。

本发明的另一方面,中数据预处理模块用于对数据进行清洗、采样、缺失值填充、异常值处理、小波变换、时域频域分析和标准化操作;特征工程模块是基于预处理后的数据,根据先验医疗知识和实际情景来构造特征,或者对特征进行降维自动构建特征;模型训练模块根据情况选择使用mahout工具包中分类模型;模型融合模块用于融合之前采用不同算法获得的结果。

本发明的另一方面,所述用户健康数据包括用户的生命体征数据、环境参数、用户的病历信息、健康档案、体检报告和个人基本信息。

本发明的另一方面,所述个性化医疗服务包括实时监控、数据管理、病历管理、健康档案、健康提醒、健康常识、远程医疗、病患分级和数据共享中的一个或多个。本发明的第二方面提供了一种基于云计算的大数据健康管理方法,包括如下步骤:

(1)数据采集模块采集用户健康数据,并将用户健康数据上传到大数据分析平台上;

(2)大数据分析平台接收和保存用户健康数据;

(3)基于医疗知识搭建诊断和预测模型,根据用户健康数据,对常见的疾病进行风险评估和预测;

(4)用户通过智能终端获得用户健康数据、风险评估和预测的结果以及个性化医疗服务。

本发明的又一方面,在保存用户健康数据时,大数据分析平台根据数用户健康数据的类型分别采用不同的存储方式,结构化数据采用mysql数据库来存储,非结构化数据采用hbase进行高效实时存储,文件数据采用hdfs存储。

本发明的又一方面,基于先验知识的专家系统或者基于数据驱动的机器学习搭建所述诊断和预测模型;所述风险评估和预测的过程依次包括数据预处理、特征工程、模型训练和模型融合四个步骤,在数据预处理步骤中对数据进行清洗、采样、缺失值填充、异常值处理、小波变换、时域频域分析和标准化操作,然后进入特征工程步骤,基于预处理后的数据,根据先验医疗知识和实际情景来构造特征,或者对特征进行降维自动构建特征;接着进入模型训练步骤,根据情况选择使用mahout工具包中分类模型;最后进入模型融合步骤,融合之前采用不同算法获得的结果,来提高预测准确率。

本发明的又一方面,用户健康数据包括用户的生命体征数据、环境参数以及用户的病历信息、健康档案、体检报告和个人基本信息;所述个性化医疗服务包括实时监控、数据管理、病历管理、健康档案、健康提醒、健康常识、远程医疗、病患分级和数据共享中的一个或多个。

本发明的上述技术方案具有如下有益的技术效果:

1.基于大数据的数据分析平台依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术,克服了高并发、多种监控终端采集数据不断增加而增加的存储效率、计算效率快速下降的问题,提高了数据处理的实时性,实现了对海量数据的分布式存储和并行计算。而且采用分布式架构有效解决了高并发,大数据量,特征维度高情况下数据处理时间大幅度上升的难题,大数据算法能够挖掘出海量数据中的隐藏有效信息,结合先验医疗知识,能够对一些常见的疾病的诊断具有重要参考价值。

2.数据采集模块数据来源广泛,包含心电仪、血糖仪、血压仪等监控终端采集的用户体征数据,环境参数,用户编辑的或者授权从医疗机构获得的病历信息,健康档案,体检报告,个人基本信息。

3.建立两种诊断模型方法:基于先验知识的专家系统;基于数据驱动的机器学习模型。建立机器学习模型,模型能够自动学习,从数据中归纳出有用的规则,而且弥补了传统专家系统需要大量先验知识的缺点。可以根据预测对象的不同选择hadoop的算法包。

4.基于大数据分析平台的结论,为用户提供了全面的、个性化的医疗服务。

附图说明

图1是本发明的健康管理系统的结构示意图;

图2是数据采集模块的结构示意图;

图3是大数据分析平台的结构示意图;

图4是大数据分析平台的数据处理流程图。

1:数据采集模块;2:大数据分析平台;3:智能终端;11:监控终端;12:环境检测模块;13:信息收集模块;21:hadoop分析平台;22:数据存储装置;23:算法库。

具体实施方式

为了方便本领域的技术人员能够更好地理解,下面将结合本发明实施和附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

从图1可以看出,本发明的一种基于大数据的健康管理系统包括三个部分,分别是数据采集模块1、大数据分析平台2和智能终端3。

如图2所示,数据采集模块1包含一个或多个用于采集用户的生命体征数据的监控终端11,这些监控终端可以是便携式心电仪、血糖仪、血压仪、电子体温计、尿常规检测仪、体脂仪或者人体红外热成像分布仪等,所监测的生命体征数据包括人体心电、温度、血压、血氧、血糖、心率、尿常规和人体影像空间等。监控终端11通过智能移动终端将用户的生命体征数据上传到大数据分析平台2的服务器集群或者数据库中,这些数据经过简单的信号去噪和压缩,以规定的数据格式存储于数据库或hdfs(hadoopdistributedfilesystem的简称,hadoop分布式文件系统)中。智能移动终端可以是蓝牙或者wifi模块。智能移动终端通过互联网下载安装相应的app,即可实现上述数据传送功能。

此外,数据采集模块1还包含环境检测模块12。环境检测模块12通过两种方式来获得环境参数,第一种方式是通过智能移动终端定位用户所在位置,联网获得当前时间用户所在位置的环境参数,比如温度、辐射、pm2.5等信息;第二种方式是通过监控终端测量当前环境的参数,将环境参数传回大数据分析平台进行分析。

此外,数据采集模块1还包括信息收集模块13,用于收集用户的病历信息、健康档案、体检报告、个人基本信息等数据,将这些数据作为大数据诊断和预测常见疾病的依据之一。信息收集模块13可以通过用户自己填写上传,或者从医院等合作医疗机构经用户授权获取用户信息,其中个人基本信息中用户可编辑的信息包括性别、年龄、居住地址、职业、病历、手术史、家族病史、睡眠、有害物质接触情况、饮食习惯。

大数据分析平台的硬件设备主要包括linux服务器集群、cpu和内存。大数据分析平台是基于hadoop的分析平台21,包括数据存储层和数据处理层两部分,如图3所示。

数据存储装置22包括mysql数据库、hbase(hadoopdatabase的简称)和hdfs,数据存储层根据数据特点将上述健康数据分别存储到数据存储装置22的不同的数据库中,这些用户健康数据可分为结构化数据和非结构化数据,结构化数据采用mysql数据库来存储,非结构化数据采用hbase(hadoopdatabase的简称)进行高效实时存储。对于占用内存较大的文件数据会采用hdfs存储。

数据处理层采用mapreduce软件框架,根据用户上传的生命体征数据,结合保存的用户病历、健康档案、体检报告等信息,完成对用户健康状况的诊断和预测。可以根据不同的预测对象和目标需要来从算法库23中选择调用和集成不同的算法。算法库23包括三个部分,分别是机器学习算法库、深度学习算法库和数据预处理算法库,机器学习算法库包括xgoost、catboost、svm、随机森林、逻辑回归等算法,深度学习算法库包括cnn、rnn、lstm、deepfm等算法,数据预处理算法库包括特征提取、相关性分析、pca降维、归一化、数据清洗等算法。常用的算法包括xgboost等机器学习算法包、统计分析数据包、神经网络工具包。

如图3所示,数据处理层的工作流程依次包括数据预处理2a、特征工程2b、模型训练2c和模型融合2d四个步骤。首先,在数据预处理2a步骤中,对数据进行清洗、采样、缺失值填充、异常值处理、小波变换、时域频域分析和标准化等操作。然后进入特征工程步骤2b,基于预处理后的数据,根据先验医疗知识和实际情景来构造特征,或者根据pca主成分分析、lda线性判别分析等方法对特征进行降维自动构建特征。之后,在模型训练步骤2c中,根据情况选择使用mahout工具包中分类模型,可供选择的分类模型包括逻辑回归,支持向量机,简单贝叶斯,xgboost等,当预测未来的健康状况时,模型训练模块可以提取用户过去一段时间的信息构建特征,也可以使用arima,lstm等时序问题常见模型,最后,进入模型融合步骤2d,通常使用stacking,blend等方法来融合之前采用不同算法获得的结果,达到提高预测准确率的目的。

在实施例一中,某一具体处理过程如下:数据处理层调用hadoop平台,并启动mapreduce分布式引擎和spark引擎,查询hdfs数据库或hbase中的用户生命体征状态数据,以及保存的用户病历、健康档案、体检报告、个人基本信息等数据,对这些数据进行预处理。通过scala或者java的api调用算法对预处理后的数据进行预测。其中对于数据输入划分后由多个map任务并行处理,其输出经shuffle后,通过网络copy到不同的reduce节点上,对reduce输出的结果,结构化数据存储于mysql数据库,非结构化数据存储于hdfs中。

数据处理层针对健康数据建立的诊断模型分为两类,基于先验知识的专家系统和数据驱动的机器学习系统。人的身体健康是一个需要整体考虑的问题,因此综合众多检测终端的信息,可以对人的身体状况进行全面细致的分析。

方法一:根据专家知识和医疗词典,模拟某一疾病专家的思维方式。其优点是可以博采众长,其工作不受环境和时间限制。缺点是知识获取困难,学习能力较差。

方法二:建立机器学习模型。根据已标记的数据,机器学习的模型能够自动学习,从数据中归纳出有用的规则。如果数据量足够,机器学习模型的准确率甚至比人类专家还要高。而且不需要大量的先验知识,如果收集的有先验知识,可以作为特征输入,提高模型的性能。

由此可知,基于大数据的数据分析平台依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术,克服了高并发、多种监控终端采集数据不断增加而增加的存储效率、计算效率快速下降的问题,提高了数据处理的实时性,实现了对海量数据的分布式存储和并行计算。而且采用分布式架构有效解决了高并发,大数据量,特征维度高情况下数据处理时间大幅度上升的难题,大数据算法能够挖掘出海量数据中的隐藏有效信息,结合先验医疗知识,能够对一些常见的疾病的诊断具有重要参考价值。

大数据分析平台将通过多种途径收集的用户健康数据,存储于服务器和数据仓库中,结合大数据分析平台的分析计算、专业的医疗知识和医疗服务资源,通过智能终端3向用户提供个性化、定制化的全面健康服务。这些健康服务包括8个方面,如下所示:

1、实时监控

根据手机等终端的应用实时跟踪用户定位,基于位置提供当前环境的信息,比如温度,湿度,紫外线辐射,pm2.5指数,噪声等,给出相应的健康建议。还可以通过便携式医疗设备和智能终端,采集心电、血压等体征数据,通过长期累计的数据,诊断和预测常见疾病的发病率。当用户生命体征数据严重异常时,将警报信息发送给亲友或者合作机构。

2、数据管理

用户具有对监控终端采集的用户生命体征数据进行增删改查的权限,同时获取大数据分析平台的数据处理层的结论,以诊断报告和可视化图表的形式呈现,为用户的健康状况提供参考。

3、病历管理

根据用户之前的患病、就诊记录,作为个性化的健康数据来源,为用户提供个性化的医疗建议,同时为医生提供参考。

4、健康档案

将由医院获得或者用户自己填写的个人信息,比如职业、年龄、家族病史、饮食习惯、睡眠等,存储到云数据库中,作为健康数据,为提供个性化的医疗服务作为参考。

5、健康提醒

通过分析多种途径采集的包括体征数据、健康档案、病历等信息,由云平台的评估模型得出相应的结论,定期提醒或者在一段时间内严重异常时发出警报。提醒内容包括就诊建议、服药建议、饮食建议和身体锻炼建议

6、健康常识

根据云平台的评估模型获取用户的健康情况,通过短信、微信公众号、邮件等多种形式,有针对性地向用户普及有关疾病的注意事项。

7、远程医疗

发挥远程通信技术和全息影像的优势,通过网络实现远程问诊,用户可以在线与医生交流,医生在线查看用户的健康数据和健康管理报告,让用户在任何地点任意时间享受到较高水平的医疗服务,提高了就医效率。

8、病患分级

结合诊断结论,为用户就医提供参考。根据用户的患病可能性划分,按照其疾病的轻重缓急和严重程度进行分级,推荐到社区诊所,二级医院和三甲医院,合理分配了医疗资源,提高就医效率。

9、数据共享

打破信息孤岛,将个人、家庭、医院、健康服务商和政府机构的数据联系起来。而且用户可以建立好友关系网络,以及添加个人医生,了解亲友的健康情况和享受个性化的医疗服务。

应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1