医疗大数据关联存储系统及方法与流程

文档序号:12596545阅读:373来源:国知局
医疗大数据关联存储系统及方法与流程

本发明涉及医疗信息化的技术领域,尤其涉及一种医疗大数据关联存储系统及方法。



背景技术:

目前,随着我国经济持续稳定的发展和现代科技的日新月异,人们越来越多的关注自身健康,在满足日常工作和生活的需求之外,人们也迫切希望通过网络或者手机上网就能随时查看流行病的季节信息、了解每种疾病下的用药情况以及针对自身疾病获得一些个性化的推荐服务等。对于公共卫生机构,它们希望各个社区居民的医疗数据能够自动汇总,并自动对这些数据进行统计分析,统计的结果用来进行流行病的趋势分析和爆发预警,从而为制定防治干预计划提供有力的参考依据。

随着国家新医改政策的颁布和实施,与健康直接相关的医疗行业开始迅猛发展,医疗数据越来越趋于高度集中化。在海量医疗数据的访问上,存在大规模数据统计分析的服务,而且需要尽可能快的查询响应时间。由于医疗数据规模很大,医疗数据之间具有强关联性,不同类型的用户对同一数据具有不同的观察视角,从而对医疗数据的存储模型有很高的要求以应付灵活多变的数据请求,大规模数据上还存在大量已知的或者未知的数据分析需求,查询的总类多,需要支持各种定制性查询。由此可见,用户对查询医疗数据的要求高,对海量医疗数据的存储与管理要求就越高,因此现有医疗数据存储系统简单地采用传统数据库、商业并行数据库或者SQL数据库对海量医疗数据进行存储已不能满足实际情况和需求。



技术实现要素:

本发明的主要目的在于提供一种医疗大数据关联存储系统及方法,旨在解决现有医疗数据存储系统对海量医疗数据进行分散存储而影响医疗数据分析处理效率的问题。

为实现上述目的,本发明提供了一种医疗大数据关联存储系统,运行于云服务器中,所述云服务器通过通信网络与多个医疗数据源建立通信连接,并通过数据库连接与大数据存储仓库连接,该系统包括:

数据采集模块,用于从多个医疗数据源收集每一个患者的原始医疗数据;

数据清洗模块,用于对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;

数据抽取模块,用于从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息,以及根据每一个患者的身份信息为每一个患者产生一个身份标识号;

数据关联模块,用于将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表;

数据存储模块,用于将所述患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将所述患者就诊信息表存储在大数据存储仓库中的第二分区数据库中。

优选的,所述数据采集模块从多个医疗数据源收集每一个患者的原始医疗数据的方式为:设定一个定时器脚本的执行时间和执行周期,以及按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集每一个患者的原始医疗数据。

优选的,所述数据清洗模块对每一个患者的原始医疗数据进行清洗转换处理的方式为:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据。

优选的,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。

优选的,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据,所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历。

本发明还提供了一种医疗大数据关联存储方法,应用于云服务器中,所述云服务器通过通信网络与多个医疗数据源建立通信连接,并通过数据库连接与大数据存储仓库连接,所述医疗大数据关联存储方法包括步骤:

从多个医疗数据源收集每一个患者的原始医疗数据;

对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;

从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息;

根据每一个患者的身份信息为每一个患者产生一个身份标识号;

将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表;

将所述患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将所述患者就诊信息表存储在大数据存储仓库中的第二分区数据库中。

优选的,所述从多个医疗数据源收集每一个患者的原始医疗数据的步骤包括如下步骤:

设定一个定时器脚本的执行时间和执行周期;

按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集每一个患者的原始医疗数据。

优选的,所述对每一个患者的原始医疗数据进行清洗转换处理的步骤包括如下步骤:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词;将原始医疗数据中的一个词的不同形式转换为相同形式;删除原始医疗数据中重复的数据。

优选的,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。

优选的,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据,所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历。

相较于现有技术,本发明所述医疗大数据关联存储系统及方法采用上述技术方案,带来的技术效果为:通过采集不同的医疗数据源中的医疗数据,并将对医疗数据进行清洗转换处理得到规范医疗数据,从而使得医疗数据采集更加全面、更加准确。此外,将每个患者的身份标识号作为体征信息表与就诊信息表之间的关联关系,并将患者的体征信息表与就诊信息表分开存储在大数据存储仓库的不同分区数据库中,减轻了系统负载,提高了数据处理效率,避免了访问医疗数据时产生冲突,加快了对医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。

附图说明

图1是本发明医疗大数据关联存储系统优选实施例的架构图;

图2是本发明医疗大数据关联存储方法优选实施例的流程图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为更进一步阐述本发明为达成上述目的所采取的技术手段及功效,以下结合附图及优选实施例,对本发明的具体实施方式、结构、特征及其功效进行详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

参考图1所示,图1是本发明医疗大数据关联存储系统优选实施例的应用环境架构示意图。在本实施例中,所述医疗大数据关联存储系统10应用并运行于云服务器1中,所述云服务器1通过通信网络3与多个医疗数据源2(图1中以两个为例进行说明)建立通信连接,以及通过数据库连接5与大数据存储仓库4连接。所述通信网络3可以是有线通信网络或无线通信网络。在本实施例中,所述通信网络3优选为无线通信网络,包括但不限于,GSM网络、GPRS网络、CDMA网络、TD-SCDMA网络、WiMAX网络、TD-LTE网络、FDD-LTE网络等无线传输网络。所述数据库连接5可以为一种开放数据库连接(Open Database Connectivity,ODBC)以及Java数据库连接(Java Data Base Connectivity,JDBC)。

所述云服务器1是一种云平台或云平台中的一台服务器,通过云服务器1的数据传输能力、数据存储能力及数据处理能力,可以快速地从不同的医疗数据源2采集到不同的原始医疗数据。所述医疗数据源2存储有患者的原始医疗数据,可以为产生临床数据的医院信息系统,例如HIS系统、EMR、LIS、PACS系统,也可以为体检中心、私人诊所和急救中心等任何适合的临床业务系统。所述大数据存储仓库4包括第一分区数据库41以及第二分区数据库42,第一分区数据库41用于存储有患者体征信息表,第二分区数据库42用于存储有患者就诊信息表。所述患者体征信息表用于存储从不同医疗数据源2采集的患者的生命体征数据,所述患者就诊信息表用于存储从不同医疗数据源2采集的患者的历史就诊数据。

在本实施例中,所述云服务器1包括,但不仅限于,医疗大数据关联存储系统10、通信单元11、存储单元12以及处理单元13。所述通信单元11为一种有线通讯接口或者为无线通讯接口,例如,支持GSM、GPRS、WCDMA、CDMA、TD-SCDMA、WiMAX、TD-LTE、FDD-LTE等通讯技术的通讯接口。所述存储单元12可以为一种只读存储单元ROM,电可擦写存储单元EEPROM、快闪存储单元FLASH或固体硬盘等。所述的处理单元13可以为一种中央处理器(Central Processing Unit,CPU)、微控制器(MCU)、数据处理芯片、或者具有数据处理功能的信息处理单元。

所述医疗大数据关联存储系统10,包括但不仅限于,数据采集模块101、数据清洗模块102、数据抽取模块103、数据关联模块104以及数据存储模块105。本发明所称的模块是指一种能够被所述云平台服务器1的处理单元13执行并且能够完成固定功能的一系列计算机程序指令段,其存储在所述云平台服务器1的存储单元12中。

所述数据采集模块101用于从多个不同的医疗数据源2收集每一个患者的原始医疗数据。一般地,患者的原始医疗数据的生成和采集通常来自于医院信息系统所产生的临床数据,例如HIS系统、EMR、LIS、PACS系统,但是随着物联网的发展,患者的原始医疗数据还可以来自于体检中心、私人诊所和急救中心等任何适合的临床业务系统。具体地,所述数据采集模块101具体用于设定一个定时器脚本的执行时间和执行周期,以及按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集原始医疗数据。

所述数据清洗模块102用于对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据。在本实施例中,由于从不同的医疗数据源2收集上来的原始医疗数据可能有坏数据、不合理的数据或者是重复的数据等,因此数据清洗模块102需要利用ETL(抽取(extract)、转换(transform)、加载(load))数据过滤转换组件对所收集的原始医疗数据进行清洗转换处理得到规范医疗数据,从而并保证了医疗数据的准确性,并为医疗数据的存储节省了存储空间。具体地,所述数据清洗模块102对每一个患者的原始医疗数据进行清洗转换处理的方式为:利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据等处理。

所述数据抽取模块103用于从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息,以及根据每一个患者的身份信息为每一个患者产生一个身份标识号(ID)。在本实施例中,所述生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据、血糖数据等数据信息。所述历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历等数据信息。

所述数据关联模块104用于将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表。在本实施例中,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。

所述数据存储模块105用于将患者体征信息表存储在大数据存储仓库4中的第一分区数据库41中,并将患者就诊信息表存储在大数据存储仓库4中的第二分区数据库42中。由于每个患者的身份标识号是唯一,因此将每个患者的身份标识号作为患者体征信息表与患者就诊信息表之间的关联关系,并将患者体征信息表与患者就诊信息表分开存储在大数据存储仓库4的不同分区数据库中,避免了访问医疗数据时产生冲突,加快了对海量医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。

为实现本发明目的,本发明还提供了一种医疗大数据关联存储方法。如图2所示,图2是本发明医疗大数据关联存储方法优选实施例的流程图。在本实施例中,所述的医疗大数据关联存储方法包括如下步骤:

步骤S21,从不同的医疗数据源收集每一个患者的原始医疗数据;具体地,数据采集模块101从多个不同的医疗数据源2收集每一个患者的原始医疗数据。一般地,患者的原始医疗数据的生成和采集通常来自于医院信息系统所产生的临床数据,例如HIS系统、EMR、LIS、PACS系统,但是随着物联网的发展,患者的原始医疗数据还可以来自于体检中心、私人诊所和急救中心等任何适合的临床业务系统。在本实施例中,数据采集模块101对每一个患者的原始医疗数据进行清洗转换处理的步骤包括步骤:设定一个定时器脚本的执行时间和执行周期,按照定时器脚本的执行时间和执行周期从不同的医疗数据源采集原始医疗数据。

步骤S22,对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据;具体地,数据清洗模块102对每一个患者的原始医疗数据进行清洗转换处理得到每一个患者的规范医疗数据。在本实施例中,由于从不同的医疗数据源2收集上来的原始医疗数据可能有坏数据、不合理的数据或者是重复的数据等,因此数据清洗模块102需要利用ETL(抽取(extract)、转换(transform)、加载(load)数据过滤转换组件对所收集的原始医疗数据进行清洗转换处理得到规范医疗数据,从而并保证了医疗数据的准确性,并为医疗数据的存储节省了存储空间。具体地,数据清洗模块102对每一个患者的原始医疗数据进行清洗转换处理的步骤包括步骤:利用利用ETL数据过滤转换组件移除原始医疗数据中无意义的词,将原始医疗数据中一个词的不同形式转换为相同形式,以及删除原始医疗数据中重复的数据等处理。

步骤S23,从每一个患者的规范医疗数据中抽取每一个患者的身份信息和生命体征数据;具体地,数据抽取模块103从每一个患者的规范医疗数据中抽取每一个患者的身份信息、生命体征数据和历史就诊信息。在本实施例中,所述患者的生命体征数据包括患者的身高数据、体重数据、血压数据、脉搏数据、心率数据、血氧数据以及血糖数据等数据信息。所述患者的历史就诊信息包括患者的历史就诊时间、历史就诊医院、历史就诊科室以及历史电子病历等数据信息。

步骤S24,根据每一个患者的身份信息为每一个患者产生一个身份标识号;具体地,数据抽取模块103根据每一个患者的身份信息为每一个患者产生一个身份标识号,作为每一个患者唯一的身份标识。

步骤S25,将每一个患者的身份标识号与该患者的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与该患者的历史就诊信息进行关联并建立一个患者就诊信息表;具体地,数据关联模块104将每一个患者的身份标识号与患者各自对应的生命体征数据进行关联并建立一个患者体征信息表,并将每一个患者的身份标识号与患者各自对应的历史就诊信息进行关联并建立一个患者就诊信息表。在本实施例中,所述患者体征信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的生命体征数据,所述患者就诊信息表的表头字段存储每一个患者的身份标识号,所述患者体征信息表的内容字段存储每一个患者对应的历史就诊信息。

步骤S26,将患者体征信息表存储在大数据存储仓库中的第一分区数据库中,并将患者就诊信息表存储在大数据存储仓库中的第二分区数据库中;具体地,数据存储模块105将患者体征信息表存储在大数据存储仓库4中的第一分区数据库41中,并将患者就诊信息表存储在大数据存储仓库4中的第二分区数据库42中。在本实施例中,由于每个患者的身份标识号是唯一,每个患者的身份标识号作为患者体征信息表与患者就诊信息表之间的关联关系,并将患者体征信息表与患者就诊信息表分开存储在大数据存储仓库4的不同分区数据库中,因此增强了数据结构化存储以及避免了访问医疗数据时产生冲突,加快了云服务器1对医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。

本发明所述医疗大数据关联存储系统及方法通过采集不同的医疗数据源2中的医疗数据,并将对医疗数据进行清洗转换处理得到规范医疗数据,从而使得医疗数据采集更加全面、更加准确。此外,将每个患者的身份标识号作为体征信息表与就诊信息表之间的关联关系,并将患者的体征信息表与就诊信息表分开存储在大数据存储仓库的不同分区数据库中,减轻了系统负载,提高了数据处理效率,避免了访问医疗数据时产生冲突,加快了对医疗数据的读取与处理速度,从而能够提高医疗服务水平与患者的满意度。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效功能变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1