一种医疗隐私数据交换文件生成方法

文档序号:9631612阅读:239来源:国知局
一种医疗隐私数据交换文件生成方法
【技术领域】
[0001]本发明涉及一种用于医疗隐私数据的数据交换文件的生成方法。
【背景技术】
[0002]在医疗卫生领域存在着大量内网业务系统和外网(Internet)服务网站之间的数据交换的场景,出于安全性的要求,内外网之间一般采用单向网闸或物理隔断,数据库之间无法直接互联互通,需要采用文件的方式作为数据交换的中介。
[0003]但是传统的数据文件格式无法包容数据库大字段、数据库之间字段类型和名称的差异性、X光片、医疗影像音视频等大文件,且存在去隐私画、操作系统对单个文件大小限制的问题,需要有新的方法处理数据库大字段、数据库之间字段类型和名称的差异性、音视频等大文件以及数据去隐私。

【发明内容】

[0004]本发明的目的是提供一种处理数据库大字段、数据库之间字段类型和名称的差异性、音视频等大文件以及数据去隐私的方法。
[0005]为了达到上述目的,本发明的技术方案是提供了一种医疗隐私数据交换文件生成方法,其特征在于,包括以下步骤:
[0006]步骤1、计算源数据表的数据数量,根据数据数量/数据交换文件最大数据数量,计算出数据交换文件的个数m ;
[0007]步骤2、按数据交换文件的个数m建立带有顺序号的数据交换文件目录,对数据进行分割存储,在每个数据交换文件目录下建立子目录data,用于存放大字段及大文件;
[0008]步骤3、将顺序号为1的数据交换文件目录作为当前的数据交换文件目录;
[0009]步骤4、在当前数据交换文件目录下建立数据表转换定义文件,该数据表转换定义文件至少包括源数据表格式定义SourceTable、目标数据表格式定义DestTable、源数据表字段和目标数据表字段之间的映射关系FieldMapping ;
[0010]步骤5、按照源数据表的格式采集源数据表的格式生成数据文件,如果数据文件大于数据交换文件最大数据数量,则进入步骤4 ;
[0011]步骤6、在数据交换文件目录下建立数据校验文件;
[0012]步骤7、将数据交换文件目录及其子目录data进行压缩,压缩完成后删除数据交换文件目录及其子目录data;
[0013]步骤8、判断是否有未采集的数据,如果有未采集的数据,则使用顺序号递增的数据交换文件目录作为当前数据交换文件目录,进入步骤4,如果没有未采集的数据,则进入步骤9。
[0014]步骤9、结束。
[0015]优选地,在所述步骤2中,所述数据交换文件目录的命名规则为:源数据表名+目标数据表名+交换时间+顺序号,其中:顺序号为1?m。
[0016]优选地,在所述步骤4中,所述数据表转换定义文件的命名规则为:源数据表名+目标数据表名。
[0017]优选地,在所述步骤4中,所述源数据表格式定义SourceTable包括以下字段:
[0018]源数据表名TableName、源数据表的主键字段名PrimaryKey、n个源数据表的字段FieldDefine ;
[0019]所述目标数据表格式定义DestTable包括以下字段:
[0020]目标数据表名TableName、目标数据表的主键字段名PrimaryKey、n个目标数据表的字段。
[0021]优选地,每个所述源数据表的字段FieldDefine或每个所述目标数据表的字段DestTable包括以下字段:
[0022]字段名FieldName、字段类型FieldType、字段总长度FieldLength、字段小数点后的长度FieldLength2、是否允许空值FieldNull、是否隐私字段Privacy。
[0023]优选地,所述η个源数据表的字段FieldDefine与所述η个目标数据表的字段存在映射关系,则所述源数据表字段和目标数据表字段之间的映射关系FieldMapping包括η对互为映射关系的源数据表字段名SourceFieldName及目标数据表字段名DestFieldName0
[0024]优选地,在所述步骤5中,所述数据文件的命名包括源数据表名,所述数据文件的格式为:
[0025]字段长度+字段值+字段长度+字段值+...,其中:
[0026]如果字段值为空,则字段长度为-1,不填写字段值;
[0027]如果字段值为大字段,则将字段值的内容以文件方式存放在子目录data下,字段值填写不含路径的文件名,文件名命名规则为:字段名+顺序号,顺序号从1开始计数;
[0028]如果字段值为存放文件的路径,则将该文件复制到子目录data下,字段值填写不含路径的文件名。
[0029]优选地,在所述步骤6中,所述数据校验文件的文件命名包括源数据表名,所述数据校验文件包括:数据记录条数DataCount、源数据表名+数据文件的数字签名DataS i gnature、数字签名方法 S i gnatureMe thod。
[0030]本发明提供的方法,有利于内外网环境下的医疗隐私数据交换,保证了网络安全性,降低了系统维护成本。本发明方法中数据格式文件数据表定义和映射,有利于异构数据库之间的格式转换,有利于不同表名和不同字段名之间的转换,有利于异构系统间的数据交换,有利于对隐私字段的标记和识别。本发明采用数据格式文件分割、大字段文件独立存出、自包含校验、隐私字段标记的方法,能兼容大规模数据量的采集和交换,能够保证数据的可靠性,避免数据因网络传输而导致的错误,从而保证为业务处理提供正确的数据。
【具体实施方式】
[0031]为使本发明更明显易懂,兹以优选实施例作详细说明如下。
[0032]本发明提供了一种医疗隐私数据交换文件生成方法,其步骤为:
[0033]步骤1、计算源数据表的数据数量,根据数据数量/数据交换文件最大数据数量,计算出数据交换文件的个数m,如果不能整除则进位1。
[0034]步骤2、按数据交换文件的个数m建立数据交换文件目录。数据交换文件目录的命名规则为:源数据表名+目标数据表名+交换时间(4位年2位月2位日2位24小时制小时2位分钟2位秒)+顺序号,其中:顺序号为1?m。对数据进行分割存储,在每个数据交换文件目录下建立子目录data,用于存放大字段及大文件。
[0035]步骤3、将顺序号为1的数据交换文件目录作为当前的数据交换文件目录。
[0036]步骤4、在当前数据交换文件目录下建立数据表转换定义文件,其命名规则为:源数据表名+目标数据表名,该数据表转换定义文件至少包括源数据表格式定义SourceTable、目标数据表格式定义DestTable、源数据表字段和目标数据表字段之间的映射关系 FieldMapping。
[0037]源数据表格式定义SourceTable包括以下字段:
[0038]源数据表名TableName、源数据表的主键字段名PrimaryKey,以逗号分割、η个源数据表的字段FieldDefine ;
[0039]目标数据表格式定义DestTable包括以下字段:
[0040]目标数据表名TableName、目标数据表的主键字段名PrimaryKey,以逗号分割、η个目标数据表的字段。
[0041 ] 每个源数据表的字段FieldDefine和每个目标数据表的字段DestTable包
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1