一种异构临床医疗信息共享系统和方法

文档序号:6469569阅读:309来源:国知局
专利名称:一种异构临床医疗信息共享系统和方法
技术领域
本发明属于信息技术领域,涉及一种共享系统,尤其涉及一种异构临床医疗信息共享系 统;本发明还涉及上述共享系统的共享方法。
背景技术
数据元在科学数据的汇交、分发、服务和应用环节,以及数据的采集、加工和处理环节 中,起到了确立数据名称、含意、表示格式、标识等方面的特征的作用。通用数据元的重用 是数据共享的重要组成部分。由于目前所有的数据共享都是基于网络进行的,如何能够自动 生成网络可以访问的数据,以及为临床医生提供简便的数据录入界面是一个非常具有挑战性 的工作。
一、基本数据元的定义与数据录入
临床数据管理系统在临床试验相关的临床研究中具有举足轻重的地位,它的主要宗旨是 确认资料收集的完整性和正确性,并且试验数据可以很好地支持统计分析,以及最后对其试 验结果的阐述和解释。上世纪80年代,随着临床试验的大量开展,人们开始探索利用计算机 管理临床研究数据,从最初的数据本地录入系统到后来基于网络的数据录入系统。临床数据 管理系发展地越来越完善。目前,大规模的临床数据管理系统已经在大的Parma公司中使用, 开发模式多是以临床试验的需求为导向,个性化开发模式。另一方面,临床医疗数据随着医 院信息化的开展也在不断地增加。临床医生对患者数据的管理,也就不再局限于表单的填写 或手工的统计。临床医生对于数据管理的要求越来越大。
当然,由临床医生开发或定制这样一个系统是不经济或者没有可行性的,而这个问题在 发展中国家尤为突出。因此,在进行临床试验时,厂商或课题组会向临床医生提供一个程序 或网络入口来收集项目相关的数据。然而,临床医生却不能用这些系统来研究自己感兴趣的、 特殊的问题。因此,目前临床医生特别是发展中国家,例如中国,会使用EXCEL、 SPSS或 SAS等统计分析或电子表格软件来进行数据的收集和整理。由于这些工具以数据分析见长, 所以这些工具的使用过程中会引入许多的错误,例如错行输入、不规范输入,这些问题会给 后期的数据清晰过程带来很大的问题,并会影响数据分析结果。因此,临床医生缺乏有效的 临床数据管理系统,造成了大量的临床有用信息的无意义丢失。
针对这种情况,生物医学信息学研究人员已经着手开发一些可以为临床医生免费使用的临床试验信息管理系统。OpenClinica项目是美国NIH资助的一个开源的临床试验软件平台, 用于管理各种各样的临床试验的数据,可以用于临床数据的递交、验证和注释,同时可以用 于数据的过滤与抽提以及研究的监察和报告。OpenClinica系统提供了 CRF表设计、在线数据 录入、临床研究管理、数据导出以及报告输出等内容。这个系统将CRF表的设计交给临床研 究人员,而系统负责管理CRF表以及由CRF表所产生的数据。这是一个非常值得借鉴的模式。
OpenClinica系统的前提假设市表单已经设计完成,可以开始进行数据的录入。然而,CRF 表的设计过程实际上是一个复杂、精细,需要多人参与的过程,往往需要进行多次的修改和 严格的定义。OpenClinica采用Excel表格进行数据的定义与描述。这种形式对于数据的定义 不严格,而且数据之间的关联往往不能很好地定义。
这方面,在流行病学领域的Epidata软件可以允许用户定制数据模型,并对数据进行定义。 由于其数据模型的定义与展现可以在一个平台下浏览和修改,甚至可以用文本编辑器进行修 改,因此在流行病学领域的表单制定方面得到了广泛的应用。
然而,这些信息系统对于用户在数据填写当中的灵活性还不能很好的支持。例如,对于 患者的随访数据的记录,由于随访次数不定,这些基于关系型数据库的软件系统往往采用了 空间预留的方法来解决这个问题。基于关系型数据库,也可以通过采用更为抽象的模型(如 HL7RIM模型)来定义和记录数据。数据噪音是影响临床试验结果分析最大的问题,目前数 据填写的质量主要依靠填写人员的教育,但是这种抽象模型在临床试验的数据填写过程中较 难理解,开发成本较高,并且有可能会影响录入数据的质量。
—、基本数据兀与数据访问
目前,如果要最小代价地访问数据,最有效的方法是模型驱动开发途径。例如,caBIG项 目。caDSR是美国癌症研究所的caBIG项目核心层的一部分,是用来管理基本数据元,支持 数据标准化。正如Dennis所描述的,caDSR提供了一个CDE Browser的工具,允许研究组长 从已经成为标准的基本数据元中选取基本数据元,组成病例报告表(case reportform, CRF)。 这种方式是元数据管理的理想状态,希望所有的人使用相同的语言,利用通用数据元设计基 于UML模型和数据模型,这在实际操作中这种工作方式往往会干扰PI正常的工作程序,而 且临床医生需要学习新的知识才能胜任这份工作。因此,在实际的应用中不会往往很难接受。
基于以上技术上的不足,本发明设计了以下基于网格的异构临床医疗信息共享的方法和 系统。

发明内容
6本发明所要解决的技术问题是提供一种异构临床医疗信息共享系统,该系统可以自动 生成语义完整的可用于临床文档传输和共享的标准临床文档,实现临床信息的无缝连接和有 效共享。
此外,本发明还提供上述信息共享系统的共享方法。 为解决上述技术问题,本发明采用如下技术方案 一种异构临床医疗信息共享系统,该系统包括 术语集模块,用于规范共享文档中所使用的术语;
文档模板生成模块,用于定义标准临床数据文档的组成元素及个元素之间的关系并自动 生成文档模板;
文档管理模块,用于文档管理,用户通过该文档管理模块对医疗文档进行管理,进行录 入、修改、査询操作、及文档的传输和共享;以及 存储临床数据的数据库;
所述术语集模块、文档模板生成模块、文档管理模块、数据库依次连接。 作为本发明的一种优选方案,所述系统还包括连接所述术语集模块的方言术语注册模块,
用用户在制定临床文档时根据需要使用自定义术语。
作为本发明的一种优选方案,所述系统还包括连接所述术语集模块的方言映射模块,用
于将用户自定义方言术语集映射到标准数据集。
作为本发明的一种优选方案,所述文档模板生成模块包括一模板自动生成单元,将系统
图形用户界面上的部件生成底层的模板文档。
作为本发明的一种优选方案,所述数据拥有者可自由地在自治与共享之间转换;数据消
费者通过网格查询系统,利用本地数据元査询多个数据库的数据。
作为本发明的一种优选方案,所述术语集模块为一个标准化的临床术语集合,包括目前
国内国际上通用的临床检测术语、通用的临床信息传输标准及用户根据需要自定义的方言术语。
作为本发明的一种优选方案,所述方言术语注册模块对用户的请求给予应答,使用特定 的算法为每个用户分配一个唯一的标识符,注册装置根据用户的唯一标识符为该用户的方言
进行注册;只有通过注册的方言才可出现在术语集合中。
作为本发明的一种优选方案,所述方言映射模块在用户需要进行文档传输或者需要文档 共享时,将用户自定义的方言术语按照制定的算法映射到国际通用的医疗文档标准术语集上。
作为本发明的一种优选方案,所述文档模板生成模块为用户提供了自动生成文档模板的功能;对文档模板的制定有进一步限定,自动生成的文档模板的基本结构是参照国际标准制 定的,每个模块下的内容可以根据用户需求个性化定制;所述文档模板生成模块产生的文档 模板具有通用性、可读性。
作为本发明的一种优选方案,文档模板生成模块生成的不同文档部分所使用的标准术语
集合的子集不同。
作为本发明的一种优选方案,所述文档模板生成模块可以对已经存在的模板进行修改; 所述文档模板生成模块提供将模板提交到文档管理模块,以便用于文档的录入的功能。
作为本发明的一种优选方案,所述文档管理模块可以进行文档的录入、修改、査询;文 档管理模块可将数据库中的文档导出成适合数据挖掘的文档形式;通过文档管理模块录入的
文档机构,必须符合临床信息共享系统所对定的文档结构标准,该模板为通过文档生成装置 生成的文档模板,或为符合存贮、机构标准的任何模板;对文档管理模块管理的文档有进一 步要求,文档必须符合临床信息共享系统所规定的文档结构的;通过文档管理模块对文档数 据库中的文档进行管理;所述文档管理模块具有权限分配功能,用户只能操作特定的文档。
一种异构临床医疗信息共享方法,所述方法包括
文档结构的定义和表述步骤;
文档模板生成步骤,用于定义临床数据标准文档的组成元素及个元素之间的关系并自动 生成文档模板。
作为本发明的一种优选方案,所述方法还包括术语注册步骤,用户在制定临床文档时根 据需要使用自定义术语。
作为本发明的一种优选方案,所述方法还包括使用文档模板创建标准文档步骤。
作为本发明的一种优选方案,所述方法还包括文档管理步骤,用户对医疗文档进行管理, 迸行录入、修改、查询操作、及文档的传输和共享。
作为本发明的一种优选方案,所述方法还包括自动解析文档模板结构的步骤,根据文档 模板的结构自动生成文档录入的界面。
作为本发明的一种优选方案,所述文档模板生成步骤包括用户根据实际需要,通过一 模板自动生成单元,将图形用户界面上的部件生成底层的模板文档。
作为本发明的一种优选方案,所述每个文档模板成为一个数据字典;每个数据字典包括 元素和元素分组;
所述元素为数据字典中最小的结构单位,可为多种数据类型;
所述元素分组为共同描述某一临床概念的多个元素或元素组的集合;元素组包含元素、
8或元素分组、或元素和元素分组的组合。
作为本发明的一种优选方案,对临床上常见的一对多数据,使用了动态组的概念;动态 组的数量可动态添加,祖内组织了经常在一起使用的元素和分组。
作为本发明的一种优选方案,对临床上多选的数据,使用了多选组的概念,以组织用户 希望用多选形式展现的数据;所述多选的数据在后期的査询和导出过程中均按照布尔类型基 本数据元对待。
作为本发明的一种优选方案,所述术语注册步骤中,用户向术语注册中心提交注册请求, 注册中心给予应答;
机构和用户方言术语的注册代号由设定的编码机制实现; 每个机构会得到一个唯一的标识该机构的标识符; 每个用户术语会根据机构代码、术语特征得到一个唯一的标识符。
作为本发明的一种优选方案,所述标准文档是可以用于临床文档共享传输的信息的集合, 或者加入设定信息后、可以用于传输和共享的信息的集合。
本发明的有益效果在于本发明通过各临床术语集合的整合和映射,及用户方言术语的 补充,扩大临床术语集合的覆盖范围,增加术语描述的灵活性,使得临床实体的描述更加贴 近真实情况。通过临床数据字典、标准文档生成装置,实现标准临床文档的自动生成,最终 通过映射,建立完善的临床文档数据库,对标准临床文档进行管理。当用户定义数据字典后, 系统可以自动生成语义完整的可用于临床文档传输和共享的标准临床文档,实现临床信息的 无缝连接和有效共享。


图l为本发明的系统架构图。
图2为本发明的术语集组成示意图。
图3为本发明的系统架构图。
图4为本发明方法的流程图。
图5为本发明的标准文档结构示意图。
图6a为采用客户端/服务器形式的系统结构示意图。
图6b为采用本地服务形式的系统结构示意图。
图6c为采用浏览器/服务器形式的系统结构示意图。
9图7为本发明使用客户端/服务器及浏览器/服务器混合架构实现的系统结构示意图。 图8为基于基本数据元数据共享的整体架构图。
具体实施例方式
下面结合附图详细说明本发明的优选实施例。 实施例一
请参阅图l,本发明揭示了一种异构临床医疗信息共享系统,该系统包括术语集模块ll、 方言术语注册模块12、方言映射模块13、文档模板生成模块14、文档管理模块15、数据库 16;方言术语注册模块12、方言映射模块13连接所述术语集模块11,术语集模块ll、文档 模板生成模块14、文档管理模块15、数据库16依次连接。
术语集模块11用于规范共享文档中所使用的术语。术语集模块为一个标准化的临床术语 集合,包括目前国内国际上通用的临床检测术语、通用的临床信息传输标准及用户根据需要 自定义的方言术语。术语集模块ll是对临床实体及实体间关系的描述的语义集合,应用于本 系统的术语集可以是任何已经标准化的用于临床数据表示与传输的术语集合;如可以是这些 国际标准和规范的子集、并集、交集等。同时系统容忍一定的非标准化术语,在系统中称为 "方言"术语。
方言术语注册模块12用于用户在制定临床文档时根据需要使用自定义术语。所述方言术 语注册模块对用户的请求给予应答,使用特定的算法为每个用户分配一个唯一的标识符,注 册装置根据用户的唯一标识符为该用户的方言进行注册;只有通过注册的方言才可出现在术 语集合中。用户可通过方言术语注册模块12向系统提交自定义的术语集合,通过注册中心认 证后,注册中型为每个用户自定义的方言集合分配一个唯一的标识符,该用户术语集合中的 术语可以自动编号,则方言集合中的每个术语将得到唯一的标识符。
方言映射模块13用于将用户自定义方言术语集映射到标准数据集;其可以将用户定义的
方言通过一定的映射算法映射到已有的术语集合中,在用户进行共享与交换过程中保证了术 语的统一性和通用性,这里的映射算法可以是用于词汇映射的任何一种算法,系统实现时可
以根据实际情况进行选择。方言映射模块13在用户需要进行文档传输或者需要文档共享时,
将用户自定义的方言术语按照制定的算法映射到国际通用的医疗文档标准术语集上。
文档模板生成模块14用于定义标准临床数据文档的组成元素及个元素之间的关系并自动
生成文档模板。文档模板生成模块14为用户提供了自动生成文档模板的功能;对文档模板的制定有进一步限定,自动生成的文档模板的基本结构是参照国际标准制定的,每个模块下的 内容可以根据用户需求个性化定制;所述文档模板生成模块产生的文档模板具有通用性、可 读性。文档模板生成模块14生成的不同文档部分所使用的标准术语集合的子集不同。此外, 文档模板生成模块14可以对已经存在的模板进行修改;所述文档模板生成模块提供将模板提 交到文档管理模块,以便用于文档的录入的功能。
在文档定义时,用户只允许选择系统术语集模块ll中的术语对临床事件进行描述,使用 术语集模块ll以外的术语会被系统识别为非法请求。同时文档的结构是根据临床文档标记标 准定义好的,保证了临床文档结构标准化。文档每个部分可以使用的术语也是事先定义好的, 使用定义外的术语或者使用定义外的结构会被系统识别为非法请求。当用户定义好文档结构 后,文档模板生成模块14会自动生成临床数据文档的模板,这种模板记录了临床文档的内容 和结构,遵循某种医疗文档标记与传输协议,可以用于数据的交换和共享。在文档模板定义 时的协议和规范可以是目前已有的任何一种通用的协议和规范。
另外,文档模板生成模块可以包括一模板自动生成单元,用以将系统图形用户界面上的 部件生成底层的模板文档。
文档管理模块15用于文档管理,.用户通过该文档管理模块对医疗文档进行管理,进行录 入、修改、査询操作、及文档的传输和共享。文档管理模块15是连接用户和文档数据库16 的接口,是用户对标医疗文档进行管理的工具。用户通过文档管理模块15对医疗文档进行录 入、修改、查询等操作,同时可以通过文档管理模块15进行文档的传输和共享。它可以使用 任何编程语言实现,可以移植到任何操作平台。文档管理模块15可将数据库中的文档导出成 适合数据挖掘的文档形式;通过文档管理模块录入的文档机构,必须符合临床信息共享系统 所对定的文档结构标准,该模板为通过文档生成装置生成的文档模板,或为符合存贮、机构 标准的任何模板;对文档管理模块管理的文档有进一步要求,文档必须符合临床信息共享系 统所规定的文档结构的;通过文档管理模块对文档数据库中的文档进行管理;所述文档管理 模块具有权限分配功能,用户只能操作特定的文档。
数据库16用于对使用标准化模板创建的医疗文档进行存储,其可以是适用于医疗文档存 储的任何类型的数据库,如关系型数据库、XML数据库,也可以是任何一种已经存在商业数据 库产品或者根据需要自己开发的数据库产品;可以是和标准文档存储兼容的医疗机构已有的 数据库,也可以是仅存放标准临床文档的专用数据库。
整个临床信息共享系统可通过软件、硬件等多种途径实现,具有很强的可移植性,与所使用的操作系统平台无关。本系统中,数据拥有者可自由地在自治与共享之间转换;数据消 费者通过网格査询系统,利用本地数据元査询多个数据库的数据。数据拥有者可自由地在自 治与共享之间转换,这种转化并不影响数据拥有者的数据安全,而且不需要IT工程的修改。
请参阅图2,图2展示了临床信息共享系统术语集模块11的一个优选实施例。在该实施 例中使用了目前国际和国内标准化的医疗信息标记和传输协议。HL7词汇集112是国际标准组 织认证的HL7组织制定的医疗文档传输协议HL7协议中定义的词汇集。中国医院信息基本数 据集标准113是中华人民共和国卫生部制定的用于各医疗服务单位之间进行数据传输的标准, 该实施例中使用的是1.0版本。SN0MED编码114主要用于临床数据编码、检索及分析。系统 自有术语集115集合了系统设计开发过程中根据实际需要针对某一应用领域的专业术语集, 例如可以是为了描述结直肠癌家系数据而定义的家系描述术语集、为了研究肝癌基因组而增 加的癌症基因组描述术语集等。用户根据自己的习惯及需要定义自己的术语集,即方言术语 集116。
根据CDA标准,本实施例使用HL7词汇集112和中国医院信息基本数据集标准113作为 标准临床文档的文档头部基本术语集。使用SNOMED词汇集114和系统自有词汇集115作为标 准文档体部的术语集。方言术语集116可以用于定义文档的头部117和体部118。
方言术语集116可以和系统的术语进行映射,保证术语集合的标准化和统一性,为实现 临床数据的共享提供语意基础。
本发明同时揭示上述异构临床医疗信息共享系统的信息共享方法。所述方法包括 文档结构的定义和表述步骤;
文档模板生成步骤,用于定义临床数据标准文档的组成元素及个元素之间的关系并自动 生成文档模板;
术语注册步骤,用户在制定临床文档时根据需要使用自定义术语;该步骤中,用户向术 语注册中心提交注册请求,注册中心给予应答;机构和用户方言术语的注册代号由设定的编 码机制实现;每个机构会得到一个唯一的标识该机构的标识符;每个用户术语会根据机构代 码、术语特征得到一个唯一的标识符;
使用文档模板创建标准文档步骤;
文档管理步骤,用户对医疗文档进行管理,进行录入、修改、査询操作、及文档的传输和共享;
自动解析文档模板结构的步骤,根据文档模板的结构自动生成文档录入的界面。 所述每个文档模板成为一个数据字典;每个数据字典包括元素和元素分组;所述元素为 数据字典中最小的结构单位,可为多种数据类型;所述元素分组为共同描述某一临床概念的 多个元素或元素组的集合;元素组包含元素、或元素分组、或元素和元素分组的组合。
对临床上常见的一对多数据,使用了动态组的概念;动态组的数量可动态添加,组内组 织了经常在一起使用的元素和分组。对临床上多选的数据,使用了多选组的概念,以组织用 户希望用多选形式展现的数据;所述多选的数据在后期的査询和导出过程中均按照布尔类型 基本数据元对待。
所述标准文档是可以用于临床文档共享传输的信息的集合,或者加入设定信息后、可以 用于传输和共享的信息的集合。
以下是有关本发明有关基本数据元的定义及数据录入、数据访问的介绍。 一、基本数据元的定义与数据录入
数据元是一个通过一组属性描述其定义、标识、表示和允许值的数据单元。 一般来说,数 据元由三部分组成对象类、特征和表示。对象类是人们希望研究、搜集和存储其相关数据 的事物,比如人、房屋和订单等。在本发明中,所涉及的数据均以患者(或某一种疾病的患 者)为中心在收集数据,因此所有的数据的对象类均为患者,因此在构建基本数据元过程中 将隐去此定义。故本发明中所有的数据元只需定义特性和表示,也就是说特性与表示之间是 一对多的关系。但是,为了语义上保持一致,本发明不允许在同一个模型中定义同名数据元。
1.公用数据元字典
公用数据元字典(以下简称为字典)是指一组用于从事某一种疾病研究所要收集的数据 项,其目的就是统一对数据的定义,保证应用的一致性。它是数据信息模型的载体,也是用 户建模过程中主要编辑的文件。字典以XML文档的形式存储,文件的根(Root)为Dictionary 元素,应有字典名称、作者、创建时间和目的等描述信息。这些信息是字典注册的主要信息。 依据不同版本字典所收集的信息,可以通过字典之间转换定义进行转换。字典中的每一个条 目的定义可以有若干种属性,这些属性的命名和定义本发明参考了科学数据共享工程技术标 准(SDS/T 2131-2004和IS0/IEC 11179),并采用了最小信息量的原则。目前,本系统中目 前考虑的数据元定义属性包括标识符、名称、英文名、说明、表示、值域和版本信息。这些属性的定义如下。
a) 标识符
定义在数据元字典中,为数据元分配的与语言无关的唯一标识。 英文名称metadatalndentifier 数据类型字符串 值 域自由文本 短 名mdid
注 解必选项最大出现次数为1:必须是第一个著录项目、标识符须唯一,由 字母(含下划线)和数字组成(参考《科学数据共享元数据内容》)。
通过应用如下规则,来做到注册系统内部的唯一性。标识符由三部分组成 一部分是 注册系统自身的编码(4个大写字母),加下划线;第二部分是数据字典在本注册系统中的编 号,为9位数字(如果预计将来会很多,可以预留到9位数字),第三部分是数据字典自身基 本数据元条目编号,9位数字。由此,标识符总共是20位。
b) 名称
定 义数据元的中文名称,是标识数据元的主要手段。 英文名称- DefinitionChinese 数值类型字符串 值 域自由文本 短 名defCn
注 解必选项最大出现次数为l。元数据实体名称如果使用英文,则以一个大写字 母开头。元数据名中不能使用空格,可以是多个单词连写,其中每个单词开头为大写字母。
元数据名称在同一个数据字典内是唯一的。长度限定在18个以内(这个长度可以参考当前流 行的数据库的字段的最大长度进行调整)。对于中文字符限定为9位。
c) 英文名称
定 义数据元的英文名称 文名称DefinitionEnglish 数值类型字符串 值 域自由文本 短 名defEn
注 解基本数据源的英文名称,这个英文名要尽量的简短,不允许有空格,只允许字
14母、数字和下划线,可以是多个单词连写,其中每个单词开头为大写字母。长度限定在18个
以内(这个长度可以参考当前流行的数据库的字段的最大长度进行确定)。
d) 说明
定义关于数据元的含义和基本特征的说明,并使之区别于其他数据元。 英文名characterization 数值类型字符串
值 域自由文本 短名- charatz
注解对CDE—个简短的描述,最好限制在1000字以内。也可以参考文献等等。
e) 表示
定义数据元值的数据类型及字符串长度的组合表达格式。 英文名representation
数值类型字符串 值域自由文本 短名represent
注解表示参考《公用数据元目录》第5部分,同见附录l
f) 值域
定义元数据元素取值范围。数据元取值范围或相关内容的说明。如所采用的代码标准, 或通过枚举等方式给出所有可能的取值。 英文名- ValueRange 数值类型不定 值域不定
短名s range 注解条件选择项。
g) 版本
定义数据元所在的数据字典的版本标识。 英文名- PublishVersion 数值类型字符串
值域自由文本
短名..version
15注解这个version的信息是从数据字典的version信息中获得的,也就是所在更新数据 字典的同时,也就更新了CDE的版本信息。
上述CDE的基本信息是字典中每一个条目都必需进行逐一定义。为了与基本数据元注册系 统兼容,上述项目是必须填写内容,再需要的情况下,可以用于基本数据元的定义。
在CDE属性的选择中,本实施例选择了最小信息量的原则,这是针对通用的需求。为了满 足用户个性化需求,系统还应允许添加新的、标准以外的CDE属性。
2. 如何与HL7标准兼容
HL7 (Health Level Seven)是医疗卫生信息交换标准。HL7消息的开发方法包括构造参 考信息模型的过程、定义数据类型、词汇范围的协调以及XML (Extensible Markup Language) 数据交换标准的实现规范。HL7在为建立医疗卫生计算机信息系统中的交互操作性标准的中具 有无可争辩的重要地位。
HL7CDA定义了一种文档扩展标准,针对数据交换规定了 "临床文档"的结构和语义。CDA 必须在HL7 RIM的框架下才能够理解。但是,CDA文档既可以独立于消息,也可以包装在HL7 消息中进行传送。因为CDA文档本身不能够保证这个文档在交换后没有改动,因此CDA文档 依赖于一个文档管理系统。因此,如果要对CDA进行存储,最好有一个XML文档管理系统。 目前,开源软件系统——eXist是一个原生的XML数据库,可以充当这个文档管理系统的角色。
3. 控制性词汇
系统将维护一个控制性医学术语集(标准的术语集vs用户自己创建),在系统实现中将 用于实现自动完成。在某些情况下,术语集会很大,可以优先显示使用频率最高的5-IO项, 在用户输入下一个字时同理选择性输出。因此,需要记录词频信息。
对于枚举信息,用户可以通过上下键,或鼠标来点选需要的术语。如果术语集中没有的术 语,在这个系统中是不能输入的,如果用户要输入这个术语,就必须要创建新的术语。然后 输入。对于用户录入数据集中已经有的术语,将自动进行信息的录入,例如编码的自动完成。 如果在术语中,没有相关的术语,那么用户可以创建,系统将显示术语创建的界面,接受用 户定义。用户需要定义,内容与CDE其他的基本元素定义相同,唯一不同的是,这些信息是 单独维护的,称为术语表。在这些术语表中, 一定要预留与标准术语表的映射关系接口。
自动完成功能也提供给其他的输入框,但是其他的输入框因为有单独的CDE定义,所以没 有不能输入的功能,只是简单的辅助输入功能。用户可以灵活地添加。另外医学控制性词汇以外,还可以使用己有的地理和地理编码标准,对病人的地址、邮编、 国家、省进行描述。
4.对于"值域"核心数据元的思考
基本数据元定义标准中,只定义了三种基本类型,分别是数值型、字符型和日期型。"值 域"是一个条件选择项,对于不同的数据类型有不同的属性设置。其中,字符和日期/时间型 变量的属性设置最为简单,只要设置"模式"属性。例如,身份证号码是有规则可循,可以通 过设置模式检查数据的正确性。再如,电话号码如果需要输入区号,可以用模式加以限制。
数值型变量相对比较复杂,因为同样是数值型变量含义可以不同,适用的统计学方法也 不同。例如,l和2,既可以表示是与否(如男性或女性),也可以表示完全互斥的分组(如, l工人/2农民),又可以表示等级(如,l级/2级),甚至可以表示两个测量结果(如,1米/2 米)。
如果只以变量类型这个属性来定义这个数据元,就不能区分出变量间彼此的区别。因此, 为了区分开数值型变量,增加了变量测量尺度(measurement scale)属性。在统计学中,按 照对事物描述的精确程度,将所采用的测量尺度从低级到高级分为4个层次定类尺度、定 序尺度、定距尺度和定比尺度。但是,这四个级别在实际应用中概念有重复,有必要重新定 义。
定类变量和定序变量根据变量水平的个数,可以分为两分类和多分类变量。后者根据变 量水平是否有序,可以分为无序和有序变量。无序多分类变量是定类多分类变量;有序多分 类变量是定序多分类变量。对于定类多分类变量,在实际应用中存在着多选和单选的问题, 因此需要分别对待。
定距变量是对事务类别或次序之间间距的测度,计量结果可以进行加减运算。这样的变 量有体温。
定比变量是能够测算两个测度之间比值的一种计量尺度。其与定居变量的差别在于有一 个固定的绝对"零点"。定距变量中的"零"并不表示"没有",而只是一个测量值,,而定比 变量中的"零"就真正代表"没有"。可以进行加减乘除运算。
由于定距与定比变量的统计学方法基本上一致,所以多数统计学书籍将两者合并为连续 型变量。因此本系统也采用了这种合并分类方法。
综上所述,本实施例将变量类型按精确度从低到高以次定义为二分类变量、定类多分
类变量、定序多分类变量、连续性变量。定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。 定类变量仅能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序或等级。因 此,从描述的精确度上讲,信息量是最少的,在统计学上只能计算频数和频率。使用定类变 量对事物进行分类时,必须符合穷尽和互斥的原则。穷尽的原则就是指每一个个体都必须能 够归为一个类别,互斥的原则是每个个体都只能归为一个类别。
在很多场合下都能碰到变量为二分类的资料,例如性别、某一天是否下雨等等。在生物 医学领域,二分类变量多应用于反应变量,如患者是否发生肿瘤转移等等。这种两分类的变
量,可以用布尔变量(是/否)或数字(1/0)来表示。本系统采用布尔类型来定义二分数据。
值得一提的是,某些情况下,布尔氏记录可能需要考虑第三级定义。例如,性别。通常可以
有男/女之分,但是有些情况下,性别难以区分,可能需要定义为"unknown"。这时数据就转 变为多分类问题。因此,二分类变量是多分类的特殊情况。
如上所述,定类多分类变量在展现形式上会有两种单选或多选。首先,为了解决"多 选"问题,本系统引入了分组的概念。例如,如果有多个症状需要询问患者时,将所有的症 状定义为二分类变量,然后将这些变量定义在一个组的下面。这种方法也称为"多重二分法"。 针对这个问题通常还有多重分类法,在本系统中可以通过多重分组实现(需要核实)。因 此,在值域中将不会出现针对多选形式的定类多分类变量的定义,而只有单选形式的定类多 分类变量。
在某些情况下,表格设计过程中可能需要患者输入不在已确定选项内的类型,例如输入 既往病史时,可能罗列中的疾病不足以包括患者的情况。因此需要有"其他"选项,别且能 够接收患者的输入。如果有多个必须是用"/"分隔。
其次,为了解决单选问题,本发明设计了一个枚举创建机制,对于每一个反应项都要需 要定义编号(value)、定义(label)和注解(notation)。值得注意的是,在实际应用过程 中用户—(如医生)会考虑到知识的不完备性,希望填表者填写不在其中的内容,这一点对于 表格的进一步完善非常重要。但是,如何在创建的SCHEMA中实现这一点是一个值得研究的问 题。
定序多分类变量,是对事务之间的等级或顺序差别的反应。这种变量只能存在单选问题, 解决方案与定类多分类变量的单选形式相同。
关于连续性变量,本实施例更多考虑的是数据在计算机存储过程中的准确性。因为浮点 型数据的保存与整形是有区别的。因此,本系统用实数和整数两种类型数据来定义连续性变 量。同时需要定义变量的最小值和最大值用于简单的数据检査。另外,与其他类型的数据不
18同的是,连续性变量有缺失值问题a因此可以考虑设置一个缺失值属性。
综上所述,在值域的设置时有六种类型可以考虑,他们分别是字符串、日期、布尔氏变 量(二分类变量)、单选分类(多分类变量单选类型)、整数(连续型变量)和实数(连续型 变量)。
其中对于布尔氏变量/两分类单选之间本发明建议用户使用后者。这样系统的扩展性比较
强。例如,大多数情况下对于性别只需要Female和Male这两项就可以了,但是在某些情况 下是不能确定的(如胎儿),这时就需要另外一个定义如两性人(hermaphrodite)。
关于数据地动态添加;在很多情况下,会需要考虑,根据用户地需要来决定添加数据。当 然,每一次提供的表格都是一样的。目前,不支持再分组、多行。
5. Schema的更新与数据的转移。
如前所述,在研究过程中数据字典会发生变化。在2.X版本中,增加字典注册功能,当 用户要求覆盖某一个字典时,系统不会把原先的字典覆盖,会重新创建一个新的字典,而将 前者至于非active状态,在必要的时候,用户可以重新取出。
然后,系统调用xml文档的图形化mapping软件,进行文档的转换,由系统根据两次schema 的修订,对未改动,直接转换;对于修改的CDE提示用户进行定义。因此,在进行修改的字 典注册时,系统要求用户上传XSLT文件,来进行数据的转换。
6. 对数据元的分组
为了满足用户对于数据元分类(组)和数据展示的需求,本发明扩展了分组的定义,提 出了常规组、多选组和动态组的概念。
对于数据元的分类有等级的需求,并可能会有多级定义。这些数据的分类是没有具体的 对应数据,而只是若干通用数据元归属其下。例如,病史。这个基本数据元下可能会有大约 几十项数据,而病史中有可以分症状。症状中又有便频。便频不是一个基本数据元,基本数 据是每日大便的次数,这个数据根据是否〉2次来定义。这类分组被称为常规组,也就是常规 意义上的分组。
为了能展现多选题的形式,本发明定义了多选组。在多选组中,有一个约定就是其下面 的数据都是布尔变量。系统会自动地为其添加其他选项,后者是一个字符串。这就是多选组。 许多数据,例如基因芯片数据,可能会有多个字段的数据。本发明引入动态组。用户在实 际应用中可以自行添加一组值进行输入。目前,l.X版本还有许多不足,例如,字段名应该显示在输入框上面。有必要增加一个上传按钮,允许用户上传一个文件,文件中的内容将被导
入到网页中,但不是显示所有,只显示前50项。上传的文档,将作为附件保存一个连接在这 个XML文档中。用于后续的审核。
7医疗领域特殊数据类型的定义
本项目主要定位在医疗领域,所以需要特化一些特殊的数据类型,但这些数据类型还是基 于基本数据元。
1) 比值类型滴度数据(1: 64)和少数几种比值,在某些具体的情况下,为了方便起见, 会用分子进行结果的报告,例如报告32而不是1/32。这些习惯做法通常容易导致混淆,在本 系统中将使用严格的格式。可以看出,滴度数据实际上是由两个数字组成。因此在基本数P 元导出时,将以数字类型定义。基本数据元的定义要定义分子和分母。按照实数的定义进行 定义,并提供单位选项,可以不选。默认的情况分母必须大于0。在导出基本数据元的时候, 分子和分母作为两个数据元导出。导出的名字在现有名的基础上加"_分子"和"一分母"。Ratio
的定义和展现参考如下。
2) 索引值,(没有单位的数字),使用Real Number数据类型。可以用PQ类型,带有一个 无量纲的单位(dimensionlessunit)。例如,1或%。(因此,这种类型可以再低版本中添加)。 主要是为了满足数据单位问题中数据单位的约定。实际上就是作为一个数字存储。
二基本数据元与数据访问
本发明基于网格的数据共享系统还可以包括基于XML的医疗数据收集系统和数据库、 网格服务系统、基本数据元注册服务系统、基于xQuery的数据査询系统、患者注册系统、集 中式医疗图像存储系统,以下分别叙述。
1) 建立基于XML的医疗数据收集系统和数据库
本发明的模型设计模块可以允许用户设计CRF表单,并自动转换为web表单,进行数据 的录入和检查。数据存储于eXist XML数据库当中,可以利用xQuery进行数据的查询。 为了满足sql熟悉的用户对sql的需求,本发明采用了 sql2xquery的转化。
2) 建立网格服务系统
建立网格服务系统,在这个系统的基础之上,建立网格服务注册系统,注册所有的XML数 据库及数据服务信息,可以通过XML数据库的API来访问其中的数据。
3) 建立基本数据元注册服务系统
20利用利用模型设计模块的提供1ocal/remote/caDSR三个选项,分别用于在不同的数据库 中査询注册的基本数据元。如果基本数据元存在,那么就在此XML的元素中加一个属性值 ^ocal/feemote/^caDSR三个不同的属性,并将数据库中的值赋给此属性。例如患者姓名
〈Pat i entName 1 ocal=sc0001 X/Pat i entN咖e〉
本方法充分利用了 XML半结构化数据库的优势,利用XML元素的属性值对基本数据元进行 映射和修改。这样做的最大好处是,数据拥有者不需要按照标准数据元的名称来建立自己基 本数据元,但对基本数据元的定义可以采用注册服务中心的标准定义方法,从而达到语义上 的一致。从而能够在采用和与标准保持一致的前提下,而对自身已有工作最小改动。
通过这种方式,本发明就将基本数据元映射到一个标准的数据集上。需要指出的是,通过 这种方式,数据的模型将被修改,但是通用数据元的名称并不修改,数据拥有者还是用自己 的术语进行数据的收集和查询,从而达到了 "方言"与"普通话"通行的状况。由数据管理 后台,按照修改后的数据模型对己有数据进行核对。
4) 建立基于xQuery的数据查询系统,进行联合査询 两种方式
1统一语言法査询的时候,首先在数据库中找到患者姓名所对应的编码,例如sc0001, 然后利用xQuery对系统进行查询。
2本地术语査询时用户可以选择本地还是网格査询。无论哪一种,用户输入的都是本地 术语,不同的是,网格査询选项,将根据用户的定义利用网格标准语言进行网格语义査询。
5) 数据集的语义重复问题
在一个表单中,用户定义的基本数据元是不允许有重复的,这一点也是符合逻辑的,并且 容易通过软件实现。
在用户进行标准数据元映射时,需要对组进行定义,并利用术语系统进行语义定义,例如 术后信息,人工将这个词拆成术后(sc003)和信息(sc005)两个词,并在术语系统中查找 这两个术语,如果没有将申请添加新的术语条目,并记录此基本数据元的来源数据库、xpath 以及对应的标准数据元。并将这连两个术语拼接作为语义的唯一值(sc003sc005)。并在基本 数据元注册系统中查询(group表),如果在标准数据集中没有,则申请新的group值。同时, 组的类型,也将称为语义的一部分。
在定义基本数据元的过程中, 一般组包括多选组的定义,与group组相同。两外单选在增 加值的时候需要引用术语系统的定义。例如性别(sc008),男(s001),女(sc002)等等。
难度最大的是动态组数据的定义,例如随访。在査询的时候需要能够查询出患者每次随访的日期?那么在数据定义的时候,可以获得动态组的定义,并在这个组下定义了随访日期的 这个基本数据元。由于定义了动态组信息,所以可以将这个属性付给这个基本数据源。在査 询的时候可以对这样的基本数据源获得多个信息。
6) 数据安全访问问题
目前,eXist数据库提供了数据库访问权限,在数据collection以及元素级别上没有访 问权限。
通过限制网格查询对数据元素名査询的限制,也就可以保证数据的安全。 一方面,用户的 元素名是本地名称,很难为外界知晓,另一方面,网格查询只能通过元素的remote属性来査 询,这使得数据拥有者在数据共享方面游刃有余。可以灵活的指定权限以及共享数据。
7) 患者注册系统
对于异构医疗数据最大的挑战之一就是,基于患者的医疗数据的整合。例如,在疾病控制 中心,每天会处理非常多的数据,而这些数据是来自于多个医院,如何将这些数据与己有数 据的患者识别是非常头痛的一件事情。但是,只要能够识同一个患者,那么所有关于这个人 的数据就可以汇总在一起。
例如院内医疗信息的共享。院内医疗信息的共享, 一方面是信息的互查。由于在不同科室, 检测与关注的内容不同,但是在语义上患者的基本信息是一致的。可以通过这些信息进行査 询。但是,在某些特殊情形下,不同的医疗信息系统均有自己的患者唯一编号,在这种情形 下,构建一个患者注册系统,将非常有利于信息的互查。
信息安全性的考虑。由于这些信息将涉及患者的隐私信息,因此能够进行患者信息mapping 的人,必须是患者的主治医生,或其上级医师。系统中将给患者一个临时号码,这个号码有 一个审核状态,如果通过设定算法能够100%确定为为患者本人,那么这些信息将被进行关联, 多个号码及其系统将进行组合映射。
识别患者身份的算法。取患者的姓名/身份证号码/…信息,每一个项赋予相当的权重, 通过进行简单的加减操作来。
8) 集中式医疗图像存储系统
本发明将采用caBIG的NCIA系统来集中存储患者的医疗图像数据。这些数据将由用户自 行管理,访问需要权限控制,通过这种方式来访问数据。
综上所述,本发明通过各临床术语集合的整合和映射,及用户方言术语的补充,扩大临 床术语集合的覆盖范围,增加术语描述的灵活性,使得临床实体的描述更加贴近真实情况。通过临床数据字典、标准文档生成装置,实现标准临床文档的自动生成,最终通过映射,建 立完善的临床文档数据库,对标准临床文档进行管理。当用户定义数据字典后,系统可以自 动生成语义完整的可用于临床文档传输和共享的标准临床文档,实现临床信息的无缝连接和 有效共享。
实施例二
请参阅图3,图3是本发明系统的优选实施例。在本实施例中,用户通过OID注册中心 301提交方言术语,0ID注册中心301为每个用户设置的方言术语分配一个唯一的标识符;此 时系统允许用户在定义文档时使用方言。词汇集302是一个包括用户方言集在内的术语集合, 其可以包括任何标准化的术语标准和规范,可以为图2所示的术语集优选实施例。在该实施 例中,用户定义的临床文档模板被成为数据字典,记录了临床文档的元素和个元素间的关系, 通过数据字典生成303产生数据字典。在本实施例中,所使用的文档标记标准为CDA文档标 准,所有的临床文档均按照CDA文档的格式要求进行定义,所有的CDA文档均为XML文 档形式,用户通过CDA文档管理界面304对文档进行管理。所有的文档将按照HL7标准的 RIM模型进行存储,因此存储CDA文档的数据库在本实施例为RIM数据库305。应该注意这 里的RIM数据库可以是任何能够很好的支持RIM数据模型的数据库类型,它可以是XML数 据库,也可以是关系型数据库。如果为关系型数据库,可以使用映射机制,将XML格式的 CDA文档转换为相对应的关系型数据库存储表格。
图4是上述优选实施例的工作流程图。如果在用户定义数据字典时,需要按照习惯使用 某些自定义术语,则用户向OID注册中心提出注册申请,OID注册中心接受申请,给予每个 术语唯一的标识号,用户生成自己的方言术语集合,方言术语集合404和已有术语集合403 共同组成了用户定义数据字典的术语集404。用户使用新的术语集405根据临床记录的需求, 使用数据字典生成装置制定CDA文档模板406,然后生成CDA文档407,最后通过管理界面 对这些标准化的文档进行管理408。当文档需要进行传输和共享时,由于用户定义的方言可能 在另一个用户中并不存在,此时可以使用系统的术语映射机制将方言映射到标准术语集,实 现了术语的同一。
因为在CDA文档制定过程中均使用标准化的术语,同时CDA文档格式是标准化的,因 此通过整个流程所产生的文档是标准化的可以用于交换、传输的临床文档,从而实现了临床 文档的真正共享408。
23实施例三——数据结构
请参阅图5,图5是本系统的一个实施例中数据结构的表示方法,在该实施例中每个文
档模板称为一个数据字典501,数据字典501记录了一份标准临床文档的结构。数据字典由元 素502和分组503组成,分组和元素结合,进行层次组合,形成了文档结构树,体现文档中 各种数据之间的关系。
元素即文档的基本数据元(common data element, CDE),是文档系统中最基本的数据单元。 每一个元素具有一个唯一的名字,且具有一定的属性,在整个数据字典中处在一定的层次关 系中。数据元素可以是字符串、整数、常数、日期、布尔变量和单选分类。单选分类中提供 至少两个选项,在这些选项中用户只能选择其中一个,临床文档中的单选题目即可设置成单 选分类。
分组是多个元素的集合,这些元素共同描述某一语意。分组下可以再设置分组。每个分 组有一个唯一的分组名,并具有一定的属性。
系统建议使用的分组有三种,分别为常规组、动态组和多选组。
常规组只作为元素的归类和数据组织方式,其他的组系此组的派生类。在常规组下可以 创建任意类型组和元素。
多选组是为了组织用户希望用多选形式展现的一组数据。这些数据具有特殊性,在后期 的査询和导出过程中均按照布尔类型基本数据元对待。此组下的数据均为布尔变量数据,不 能添加其他类型的数据。
动态组(dynamic group)在进行数据收集时,有些信息可能需要多次重复,而每次重复 的信息可能会很多,因此需要用"组"来组织。在一个对象的某种属性对应多个属性值的时 候可以使用动态组,动态组实现了一对多的功能。
实施例四——架构实现方式
图6a采用客户端/服务器形式完成医疗文档共享。用户通过客户端的模板生成装置,生 成临床标准文档模板,将文档模板通过模板转换装置转换成可用于客户端输入的格式,并通 过网络将模板上传到服务器端。用户通过客户端的数据管理程序对服务其上的数据进行操作。 从而实现了医疗文档的集中存储和分布式管理,进而实现医疗文档的共享。
图6b采用本地服务形式的形式完成了医疗文档的共享。文档模板的生成,文档的管理和 文档的存储均在本地计算机完成。此种形式需要本地计算机提供网络接口,当需要进行数据 传输和共享时,本地计算机通过网络接口,将本地数据传递给其他用户,完成医疗数据的共
24享。
图6C采用浏览器/服务器形式实现医疗文档数据的共享,此时用户本地计算机上只需要 安装有可以浏览网页的浏览器,标准文档生成装置和文档管理装置均安装在服务器端,本地 用户通过网络连接到服务器并使用网络浏览器调用安装于服务器上的文档模板生成装置和文 档管理装置,创建新的文档模板,填写录入新的数据,实现对数据的远程操作。
图6仅提出了本系统可能的实现形式,在具体实施过程中,根据实际情况,系统可以是
以上三种方法的任何一种,也可能是这三种实现形式的综合。
图7是本系统使用客户端/服务器架抅及浏览器/服务器架构所构建的优选实施例。在该实 施例中,数据字典生成装置702、方言术语注册装置703作为客户端的服务软件安装在客户端 的计算机上。用户在本地,调用数据字典生成装置创建临床文档的模板。该模板可以是根据 科室、临床试验的特点自定义的任何结构,字典中各个元素及不同的分组之间形成一种树形 的层次结构,这种结构记录了文档中各个组成部分的逻辑关系。当用户需要使用方言数据来 描述临床对象时,调用本地的方言术语注册装置703,为每一个方言生成唯一的识别码。当用 户完成数据字典的定义时,使用数据字典上传装置,将定义好的数据字典上传到服务其上。 数据字典上传装置可以集成到数据字典生成装置702中,也可以单独形成一个模块,在此实 施例中,数据字典生成装置集成了数据字典的生成,数据字典的上传,数据字典的展示功能。 当数据字典上传成功后,服务器端会根据用户定义的数据字典自动生成适合浏览器显示的文 档结构,次功能可以整合到医疗信息数据管理系统705中。用户通过浏览器701访问位于服 务器704上的医疗信息数据管理系统705,对医疗文档数据库706中的数据进行査找、添加、 修改等操作。
实施例五——数据共享
图8是基于基本数据元数据共享的整体架构图。在该实施例中,网格服务器801由四个 主要模块组成,它们分别是患者注册802、组织机构注册803、元数据注册804以及数据服务 注册805组成,也就是说中心服务器只是存储元数据信息和数据服务信息,所有的数据都在 数据拥有者。另外,网格服务器将提供数据査询功能。同时,网格服务器通过患者注册802 模块,可以与个人医疗信息档案807交互;通过组织机构注册803与医院信息系统交互806; 通过元数据注册804与其他网格系统交互;通过服务注册805访问所有的数据源。
图8中结直肠癌809、骨质疏松810和肝癌811代表了各种研究人员需要研究的疾病,不 同疾病的研究人员会共享某些基本数据元,并会拥有自己特殊的数据元。通过这种方式,数
25据拥有者可以在自治数据与共享数据之间进行自由地选择。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这 里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替 换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本 质特征的情况下,本发明可以以其他形式、结构、布置、比例,以及用其他元件、材料和部 件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其他变形 和改变。
如,术语集模块可以使用其他词汇集或数据集标准。
权利要求
1、一种异构临床医疗信息共享系统,其特征在于,该系统包括术语集模块,用于规范共享文档中所使用的术语;文档模板生成模块,用于定义标准临床数据文档的组成元素及个元素之间的关系并自动生成文档模板,收集管理元数据;文档管理模块,用于文档管理,用户通过该文档管理模块对医疗文档进行管理,进行录入、修改、查询操作、及文档的传输和共享;以及存储临床数据的数据库;所述术语集模块、文档模板生成模块、文档管理模块、数据库依次连接。
2、 根据权利要求1所述的异构临床医疗信息共享系统,其特征在于所述系统还包括连接所 述术语集模块的方言术语注册模块,用于用户在制定临床文档时根据需要使用自定义术 语,并方言术语集映射到标准数据集;所述方言术语注册模块对用户的请求给予应答,使 用特定的算法为每个用户分配一个唯一的标识符,注册装置根据用户的唯一标识符为该用 户的方言进行注册;只有通过注册的方言才可出现在术语集合中,数据拥有者及可自由地 在自治与共享之间转换;通过网格査询系统,利用本地数据元査询多个数据库的数据。
3、 根据权利要求1所述的异构临床医疗信息共享系统,其特征在于所述文档模板生成模块 包括一模板自动生成单元,将系统图形用户界面上的部件生成底层的模板文档;所述文档 模板生成模块为用户提供了自动生成文档模板的功能;对文档模板的制定有进一步限定, 自动生成的文档模板的基本结构是参照国际标准制定的,每个模块下的内容可根据用户需 求个性化定制;所述文档模板生成模块产生的文档模板具有通用性、可读性。
4、 根据权利要求1所述的异构临床医疗信息共享系统,其特征在于文档模板生成模块生成 的不同文档部分所使用的标准术语集合的子集不同所述文档模板生成模块可以对已经存 在的模板进行简单的覆盖修改。
5、 根据权利要求1所述的异构临床医疗信息共享系统,其特征在于所述文档管理模块可以 进行文档的录入、修改、查询;文档管理模块可将数据库中的文档导出成适合数据挖掘的 文档形式;通过文档管理模块录入的文档,必然符合临床信息共享系统所对定的文档结构 标准,该模板为通过文档生成装置生成的文档模板,或为符合存贮、机构标准的任何模板; 对文档管理模块管理的文档有进一步要求,文档必须符合临床信息共享系统所规定的文档 结构的;通过文档管理模块对文档数据库中的文档进行管理;所述文档管理模块具有权限 分配功能,用户只能操作特定的文档。
6、 一种异构临床医疗信息共享方法,其特征在于所述方法包括基于元数据的文档结构的定义和表述步骤; 依据临床医学常用的13种数据类型对数据进行定义; 为数据结构化预留医学自然语言处理接口 ;文档模板生成步骤,用于定义临床数据标准文档的组成元素及个元素之间的关系并自 动生成文档模板。
7、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述方法还包括术语注 册步骤,用户在制定临床文档时根据需要使用自定义术语。
8、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述方法还包括使用文档模板创建标准文档步骤,自动解析文档模板结构的步骤,根据文档模板的结构自动生成 文档录入的界面。
9、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述方法还包括文档管 理步骤,用户对医疗文档进行管理,进行录入、修改、查询操作、及文档的传输和共享。
10、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述文档模板生成 步骤包括用户根据实际需要,通过一模板自动生成单元,将图形用户界面上的部件生成 底层的模板文档。
11、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述每个文档模板 成为一个数据字典;每个数据字典包括元素和元素分组;所述元素为数据字典中最小的结构单位,可为多种数据类型;所述元素分组为共同描述某一临床概念的多个元素或元素组的集合;元素组包含元 素、或元素分组、或元素和元素分组的组合。
12、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于对临床上常见的一 对多数据,使用了动态组的概念;动态组的数量可动态添加,组内组织了经常在一起使用 的元素和分组。
13、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于对临床上多选的数 据,使用了多选组的概念,以组织用户希望用多选形式展现的数据;所述多选的数据在后 期的査询和导出过程中均按照布尔类型基本数据元对待。
14、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述术语注册步骤 中,用户向术语注册中心提交注册请求,注册中心给予应答;机构和用户方言术语的注册代号由设定的编码机制实现; 每个机构会得到一个唯一的标识该机构的标识符;每个用户术语会根据机构代码、术语特征得到一个唯一的标识符。
15、 根据权利要求6所述的异构临床医疗信息共享方法,其特征在于所述标准文档是可 以用于临床文档共享传输的信息的集合,或者加入设定信息后、可以用于传输和共享的信息的集合。
全文摘要
本发明揭示一种异构临床医疗信息共享系统及方法,所述系统包括术语集模块、文档模板生成模块、文档管理模块、存储临床数据的数据库;所述术语集模块、文档模板生成模块、文档管理模块、数据库依次连接。术语集模块,用于规范共享文档中所使用的术语;文档模板生成模块,用于定义标准临床数据文档的组成元素及个元素之间的关系并自动生成文档模板,收集管理元数据;文档管理模块,用于文档管理,用户通过该文档管理模块对医疗文档进行管理,进行录入、修改、查询操作、及文档的传输和共享。本发明通过临床数据字典、标准文档生成装置,实现标准临床文档的自动生成;最终通过映射,建立完善的临床文档数据库,对标准临床文档进行管理和共享。
文档编号G06F19/00GK101452503SQ20081020372
公开日2009年6月10日 申请日期2008年11月28日 优先权日2008年11月28日
发明者李作峰 申请人:上海生物信息技术研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1