基于医院数据的高速计算分析方法

文档序号:8258945阅读:218来源:国知局
基于医院数据的高速计算分析方法
【技术领域】
[0001]本发明涉及一种数据分析方法,具体是基于医院数据的高速计算分析方法。
【背景技术】
[0002]目前医院各个应用系统由多个应用软件厂商提供,各厂商系统信息存储在SQLServer、Oracel、Sybase、Access等异构的数据库系统中,且数据各自分布存储。医院现有的数据计算分析技术,主要是先通过各个子系统数据库查询、运算、分析,得出各自的分析结果,然后在汇总得到一个总的报表。由于所有的分析、计算都要从庞大的海量数据中进行查询及运算,使得查询运算的效率大大降低,分析一个复合的指标就需要从多个数据库中进行查询,以获得所需指标,再综合计算,分往往查询与运算的时间都是好几个小时,甚至十几个小时,随着数据量的增加,效率会更低,只能通过添加高性能的运算服务器,以提高查询运算的效率。现有的海量数据计算分析技术根本无法做到对海量数据的实时分析与计算,且需要投入大量的高性能服务器资源以配合分析与计算。医院难以及时掌控运营全貌,且还存在手工进行一些报表的加工,比如计算、合并等,速度非常缓慢。对于医院特别是大型三甲医院的管理者和决策者来说,如何对医院运行的情况进行快速的了解和相应是目前医院要解决的一个重大问题。

【发明内容】

[0003]本发明的目的在于提供效率高、成本低的基于医院数据的高速计算分析方法,以解决上述【背景技术】中提出的问题。
[0004]为实现上述目的,本发明提供如下技术方案:
基于医院数据的高速计算分析方法,将医院中HIS、CIS、CRM、EMR、LIS应用系统的数据通过ETL模块完成提取、转化及加载,然后将转化后的数据统一通过HDFS分布式存储模块进行三备份分布式存储,然后再由算法处理模块对转化后的数据通过优化组合的算法包及数据模型进行数据预处理操作,形成中间结果数据,并将中间结果数据存储在中间结果数据存储模块中;再利用不同的WEB应用模块由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即能完成对用户分析请求的结果反馈。
[0005]与现有技术相比,本发明的有益效果是:本发明主要解决的是面对不断增长的业务数据,将各个系统中不同格式的数据,经过ETL模块对数据提取、转换和加载之后,统一存储到HDFS分布式存储服务器中,由医疗行业专用优化组合算法将各类业务数据进行高效的数据预处理,形成一系列的中间结果数据集。再通过WEB应用模块调用相关的中间结果数据集,以实现为医院不同角色秒级提供所需实时计算分析结果。通过该方法可使医院各类管理人员充分利用现有各个系统数据资源,快速有效的得到真实的、准确的分析运算结果,实时为各个管理人员提供运营决策依据。有效的提高了海量数据的分析运算效率。同时在资源利用率上,较现有的海量数据分析技术可节省大量的硬件设备资源及人员成本。
【附图说明】
[0006]图1是本发明原理图。
【具体实施方式】
[0007]下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0008]实施例1
请参阅图1,本发明实施例中,基于医院数据的高速计算分析方法,将医院中HIS、CIS、CRM, EMR、LIS应用系统的数据通过ETL模块完成提取、转化及加载,然后统一通过HDFS分布式存储模块进行三备份分布式存储,然后再由算法处理模块对转化后的数据通过优化组合的算法包及数据模型进行数据预处理操作,最终形成一系列的中间结果数据,并存储在中间结果数据存储模块中。最后利用不同的WEB应用模块由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即可完成对用户分析请求的结果反馈。对操作用户的指标分析请求响应时间达到秒级,甚至毫秒级的实时响应。
[0009]本发明中HIS, Hospital Informat1n System,是医院管理和医疗活动中进行信息管理和联机操作的计算机应用系统。
[0010]CIS,Clinical Informat1n System 临床信息系统。
[0011]CRM, Customer Relat1nship Management客户关系管理系统,是一种旨在改善企业与客户关系的新型管理机制。
[0012]EMR, Electronic Medical Record电子病历,也叫计算机化的病案系统或称基于计算机的病人记录。
[0013]LIS, Laboratory Informat1n System即实验室(检验科)信息系统,主要是在医务系统方面。
[0014]本发由于采用了优化组合的算法包及数据模型进行数据预处理操作,每次的操作用户指标查询请求,只需要从经过数据预处理模块的中间结果数据中提取相关数据参与运算,不需要从完整的原始数据中进行查询和运算,分析运算效率由现有技术所需的几个小时,十几个小时的漫长等待时间,提升为秒级,甚至毫秒级的实时响应,大大提高了分析运算效率,同时整个分析运算过程只需要普通的PC服务器资源即可完成,大大节省了硬件服务器资源的投入。
[0015]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
[0016]此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
【主权项】
1.基于医院数据的高速计算分析方法,其特征在于,将医院中m、CIS、CRM、EMR、LIS应用系统的数据通过ETL模块完成提取、转化及加载,然后将转化后的数据统一通过HDFS分布式存储模块进行三备份分布式存储,然后再由算法处理模块对转化后的数据通过优化组合的算法包及数据模型进行数据预处理操作,形成中间结果数据,并将中间结果数据存储在中间结果数据存储模块中;再利用不同的WEB应用模块并由操作用户提交分析请求,能够直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即能完成对用户分析请求的结果反馈。
【专利摘要】本发明公开了基于医院数据的高速计算分析方法,将医院中各个应用系统的数据通过ETL模块完成提取、转化及加载,然后通过HDFS分布式存储模块进行三备份分布式存储,再由算法处理模块对转化后的数据进行数据预处理操作,形成中间结果数据,并将其存储在中间结果数据存储模块中;再利用不同的WEB应用模块由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过简单的运算即能完成对用户分析请求的结果反馈。发明能快速有效的得到真实的、准确的分析运算结果,实时为各个管理人员提供运营决策依据;有效的提高了海量数据的分析运算效率,同时节省大量的硬件设备资源及人员成。
【IPC分类】G06F17-30
【公开号】CN104573074
【申请号】CN201510040167
【发明人】刘文豪, 黎志文
【申请人】广东帝弘数据技术有限公司
【公开日】2015年4月29日
【申请日】2015年1月27日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1