一种医疗数据的处理方法及装置与流程

文档序号:16237095发布日期:2018-12-11 22:42阅读:283来源:国知局
一种医疗数据的处理方法及装置与流程

本申请涉及大数据领域,尤其涉及一种医疗数据的处理方法及装置。

背景技术

随着大数据时代的来,大数据在人类生活中扮演着越来越重要的作用。在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。信息经济阶段将迎来大数据时代,数据的收集、挖掘、连接、分析和运用,成为国家综合竞争力的新标志。医疗大数据对于精准医疗、疾病风控和预警等有着重要的意义。目前医疗大数据也是随着医疗资源的数字化进程而突飞猛进。医院信息化程度日趋成熟,医院信息系统(his)、电子病历系统(emr)、影像采集与传输系统(pacs)、实验室检查信息系统(lis)、病理系统(ps),甚至包括手术管理系统、耗材及物流管理系统等等。这些信息系统每日产生大量的数据,多源异构的数据类型汇聚在一起。随着各类工作数字化程度的增高,数据量的累计已经进入到eb(计算机存储单位,全称exabyte,中文名为艾字节,64位计算机系统的可用最大的虚拟内存空间为1eb,数据转换公式1eb=1024pb=1152921504606847000b)级,并很快将进入zb(计算机存储单位,中文名为泽字节,全称zettabyte,代表的是十万亿亿字节)级别。

然而目前医疗数据存储于医院内由不同公司设计和开发的各个子系统中,形成了若干的数据孤岛,数据难以进行流通。数据被困在医院系统内部,只能被本院的医生所使用,难以产生更大的价值。

并且,医疗数据对隐私性有极高的要求,在非脱敏(脱敏是指去除所有和病人身份信息相关的信息,并不做标记)的情况下流通会涉及严重的伦理性问题。目前医院对于医疗数据进行完全的脱敏处理,但是完全脱敏后的数据无法对一个人多年的病史形成连续的记录和分析,难以形成更多有价值的成果。

综上所述,目前的医疗数据,很难形成医疗大数据,被用于数据挖掘和分析。



技术实现要素:

本申请提供了一种医疗数据的处理方法及装置,目的在于解决如何将医疗数据处理成为可用于数据挖掘和分析的医疗大数据的问题。

为了实现上述目的,本申请提供了以下技术方案:

一种医疗数据的处理方法,包括:

以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据;

将所述就诊数据转换为预设的组织形式,得到标准化的就诊数据,所述预设的组织形式中的数据项包括:医疗数据标识,所述医疗数据标识通过将病人的信息插入随机数,并将插入随机数的病人的信息进行哈希运算生成。

可选的,所述预设的组织形式中的数据项还包括:

哈希值;

所述哈希值依据所述预设的组织形式中的所有数据项进行哈希运算得到。

可选的,所述预设的组织形式中的数据项还包括:

本次就诊信息;

所述本次就诊信息包括:诊疗时间、医院、籍贯、性别、年龄、疾病种类、检查项目、诊疗结果和病历信息。

可选的,所述预设的组织形式中的数据项还包括:

数据版本;

所述数据版本用于记录当前数据组织形式的版本。

可选的,还包括:

将具有相同的医疗数据标识的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

一种医疗数据的处理方法,包括:

获取具有相同的医疗数据标识的标准化的就诊数据;所述标准化的就诊数据依据前述的方法获得;

将具有相同的医疗数据id的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

一种医疗数据的处理装置,包括:

获取模块,用于以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据;

转化模块,用于将所述就诊数据转换为预设的组织形式,得到标准化的就诊数据,所述预设的组织形式中的数据项包括:医疗数据标识,所述医疗数据标识通过将病人的信息插入随机数,并将插入随机数的病人的信息进行哈希运算生成。

可选的,所述预设的组织形式中的数据项还包括:

哈希值;

所述哈希值依据所述预设的组织形式中的所有数据项进行哈希运算得到。

可选的,所述预设的组织形式中的数据项还包括:

本次就诊信息;

所述本次就诊信息包括:诊疗时间、医院、籍贯、性别、年龄、疾病种类、检查项目、诊疗结果和病历信息。

可选的,所述预设的组织形式中的数据项还包括:

数据版本;

所述数据版本用于记录当前数据组织形式的版本。

可选的,还包括:

构成模块,用于将具有相同的医疗数据标识的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

一种医疗数据的处理装置,包括:

获取模块,用于获取具有相同的医疗数据标识的标准化的就诊数据;所述标准化的就诊数据使用前述的装置获得;

构成模块,用于将具有相同的医疗数据id的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

本申请所述的医疗数据的处理方法及装置,以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据,将所述就诊数据转换为预设的组织形式,得到标准化的就诊数据,所述预设的组织形式中的数据项包括:医疗数据标识,所述医疗数据标识通过将病人的信息插入随机数,并将插入随机数的病人的信息进行哈希运算生成。基于医疗数据标识的生成方式,医疗数据标识能够代表用户但不会泄露用户的信息,并且,将就诊数据转换为标准化的就诊数据,使得就诊数据具有统一的数据组织形式,所以,标准化的就诊数据具有较高的可追溯性和流通性,为后续的数据挖掘和分析奠定了基础。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种医疗数据的处理方法的流程图;

图2为本申请实施例公开的医疗数据的组织形式的示例图;

图3为本申请实施例公开的生成医疗数据id的方法的流程图;

图4为本申请实施例公开的一种医疗数据的处理装置的结构示意图。

具体实施方式

本申请实施例公开的医疗数据的处理方法,对医疗数据进行处理,使得处理后的医疗数据具有统一的组织形式,以具备较好的流通性,同时,使得处理后的医疗数据能够兼顾隐私性(不可知病人信息)和可追溯性(可追溯同一个病人的数据),从而将医疗数据组织为医疗大数据,为后续的数据挖掘和分析奠定基础。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施例公开的一种医疗数据的处理方法,包括以下步骤:

s101:以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据。

具体的,可以从目前的各个医疗数据系统中,获取就诊数据。医疗数据系统包括但不限于医院信息系统(his)、电子病历系统(emr)、影像采集与传输系统(pacs)、实验室检查信息系统(lis)、病理系统(ps)、手术管理系统、耗材及物流管理系统。原始医疗数据即存储在上述系统中的医疗数据。

就诊数据包括但不限于病人信息和本次就诊信息,其中,本次就诊情况可以包括但不限于:诊疗时间、医院、籍贯、性别、年龄、疾病种类、检查项目、诊疗结果和病历信息。

s102:将就诊数据转换为预设的组织形式,得到标准化的就诊数据。

本实施例中,预设的组织形式如图2所示,包括以下数据项:

1、医疗数据标识(简称id):依据病人的信息生成,生成医疗数据id的信息,为病人唯一对应的信息,也就是说,更够区别不同病人的信息。例如,病人的信息可以为病人的身份证号。

生成医疗数据id的具体过程如图3所示,包括以下步骤:

s301:在病人的信息中插入随机数。其中,随机数可以插入在病人的信息中的随机位置,随机数的长度随机选取。

s302:对插入随机数的病人的信息进行哈希运算,得到固定长度的字符串,该字符串作为该病人的医疗数据id。哈希运算的次数为预设数量,例如为2,哈希运算算法可以参见现有的算法,例如sha256算法。

采用图3所示的方法生成的医疗数据id,因为采用了病人唯一对应的信息,因此,具有唯一性,又因为采用了插入随机数和哈希运算的方式,因此,具有保密性,通过医疗数据id不能获知病人的信息。

2、诊疗时间:用于记录患者诊疗的时间,通常由医院统一填写,可以直接从就诊数据中获取。

3、医院:用于记录患者诊疗时就诊的医院,通常由医院统一填写,可以直接从就诊数据中获取。

4、籍贯:用于记录患者籍贯,通常由医院统一填写,可以直接从就诊数据中获取。

5、性别:用于记录患者性别,通常由医院统一填写,可以直接从就诊数据中获取。

6、年龄:用于记录患者年龄,通常由医院统一填写,可以直接从就诊数据中获取。

7、疾病种类:用于记录患者的疾病种类,参考《国家疾病分类与代码应用指导手册》,由医院统一填写,可以直接从就诊数据中获取。

8、检查项目:用于记录患者就诊过程中进行的检查的类别和结果,可从各数据子系统中抽取和预处理后得到

9、诊疗结果:用于记录患者治疗后的结果,从就诊数据中提取。

10、病历信息:用于记录患者在诊治过程中的诸多信息,各子目录由疾病诊治的知识图谱构成,可以表征某次诊疗的全过程,从就诊数据中提取(就诊数据中的病历信息从前述医疗数据系统中收集)。

病历信息的具体内容可参见图2中所示。

11、哈希值:以上所有的数据项进行哈希运算(例如sha256)获得,目的在于,验证数据在传输过程中是否被篡改,保障数据的一致性。

12、数据版本:用于记录当前数据组织形式的版本,便于后期的更新和维护。

在以上各个数据项中,医疗数据id为病人信息,诊疗时间、医院、籍贯、性别、年龄、疾病种类、检查项目、诊疗结果和病历信息为本次就诊信息,其中,诊疗时间、医院、籍贯、性别、年龄、疾病种类、检查项目和诊疗结果也包括在就诊信息中,可以从就诊数据中直接获得(也可能进行数据格式的转换,得到统一格式的数据)。哈希值和数据版本为数据信息。

从s102可见,任意一条最小单位的就诊数据,均被转换为预设的组织形式的标准化的就诊数据,因此,使得各条就诊数据具有统一的组织形式。

s103:将具有相同的医疗数据id的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

从图1所示的过程可以看出,本实施例中,以病人为本体、以单次诊疗记录为最小单位,记录医疗数据,依靠医疗数据id的唯一性,可在系统中获取一个病患所有记录的医疗数据,同时可以通过每次的诊疗数据恢复出病人终身的医疗数据,为后续分析该病患的医疗数据提供便利。同时,可以在不泄露个人数据隐私的情况保障医疗数据的可追溯性,并提供了标准的医疗数据组织形式,有利于提高医疗数据的流通性。因此,将医疗数据组织为医疗大数据,为后续的数据挖掘和分析奠定基础。

需要说明的是,图1中的s101-s102可以由医疗数据处理平台执行,为各个终端提供标准化的就诊数据。s103可以由终端执行,可选的,在终端将具有相同的医疗数据id的标准化的就诊数据构成列表之前,需要先从医疗数据处理平台下载标准化的就诊数据,在下载后,可以先使用标准化的就诊数据哈希值验证标准化的就诊数据是否被篡改,如没有被篡改,则可以执行s103,否则,丢弃该数据或提示重新获取。

平台和终端的架构,更有利于提高医疗数据的流通性。

需要说明的是,在采用上述架构的情况下,可由医疗数据处理平台执行

图3所示的过程生成医疗数据id,也可以由病人自行生成(可由专用终端生成)医疗数据id后上传至医疗数据处理平台,医疗数据处理平台并不参与医疗数据id的生成过程,这种去中心化(是指不由特定机构指定)的生成方式,能够进一步保证医疗数据id的隐私性和安全性。

当然,图1所示的过程,也可以由医疗数据处理平台执行,终端可以从平台处直接获取一个病患所有记录的诊疗的医疗数据。

图4为本申请实施例公开的一种医疗数据的处理装置,包括:获取模块、转化模块,可选的,还可以包括构成模块。

其中,获取模块用于以一个病人的一次就诊为最小单位,从原始医疗数据中获取就诊数据。转化模块用于将所述就诊数据转换为预设的组织形式,得到标准化的就诊数据。构成模块用于将具有相同的医疗数据标识的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

预设的组织形式的具体形式以及以上各个模块的功能的具体实现方式,可以参见上述方法实施例,这里不再赘述。

图4所示的装置,可以在不泄露个人数据隐私的情况保障医疗数据的可追溯性,并提供了标准的医疗数据组织形式,有利于提高医疗数据的流通性。因此,将医疗数据组织为医疗大数据,为后续的数据挖掘和分析奠定基础。

需要说明的是,图4中的获取模块和转化模块,可以设置在医疗数据处理平台上,图4中的构成模块可以设置在终端上。

本申请实施例还公开了另一种医疗数据的处理装置,包括获取模块和构成模块。其中,获取模块用于获取具有相同的医疗数据标识的标准化的就诊数据,标准化的就诊数据的获取可以通过图4所示的装置中的获取模块和转化模块实现。构成模块,用于将具有相同的医疗数据id的标准化的就诊数据构成列表,以获得一个病患所有记录的诊疗的医疗数据。

也就是说,本实施例所述的医疗数据的处理装置,具体的实体可以为终端。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1