一种临床研究数据的采集方法、装置、设备及存储介质与流程

文档序号:27495916发布日期:2021-11-22 15:44阅读:195来源:国知局
一种临床研究数据的采集方法、装置、设备及存储介质与流程

1.本发明实施例涉及计算机技术领域,尤其涉及一种临床研究数据的采集方法、装置、设备及存储介质。


背景技术:

2.临床研究是通过采集相关的临床研究指标,通过对采集到的指标数据的统计分析,证实临床科学假设的过程,具体可以包括制定研究计划,采集研究数据和产生研究结果三个步骤。而开展一项临床研究需要独立采集大量的临床数据,且中间过程的临床数据采集是影响临床研究的研究效率的最关键一个步骤。
3.目前临床研究的数据采集主要由研究者设计完成所需要的病例报告表(case report form,crf)格式后,从各种电子和纸质的临床文档中根据需要的crf格式进行手动提取或誊写。这种方式需要花费大量的时间在原始文档的阅读、理解和摘录过程中。由此可见,目前的数据采集方式依赖于人工经验,速度慢,精确率低。


技术实现要素:

4.本发明实施例提供了一种临床研究数据的采集方法、装置、设备及存储介质,以实现快速精准的采集临床研究所需的数据。
5.第一方面,本发明实施例提供了一种临床研究数据的采集方法,包括:
6.响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;
7.获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;
8.基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
9.第二方面,本发明实施例还提供了一种临床研究数据的采集装置,包括:
10.研究项目确定模块,用于响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;
11.采集参数确定模块,用于获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;
12.研究数据采集模块,用于基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
13.第三方面,本发明实施例还提供了一种计算机设备,设备包括:
14.一个或多个处理器;
15.存储装置,用于存储一个或多个程序;
16.当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如本发明任意实施例所提供的临床研究数据的采集方法。
17.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机
程序,该程序被处理器执行时实现如本发明任意实施例所提供的临床研究数据的采集方法。
18.本发明实施例通过响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中,通过根据研究项目的项目属性自动确定目标临床研究数据的采集参数,基于确定的采集参数从预先构建的临床数据库中获取临床研究数据采集请求对应的目标临床研究数据,实现了快速精准的采集临床研究所需的数据,提高了临床研究的效率。
附图说明
19.图1是本发明实施例一所提供的一种临床研究数据的采集方法的流程图;
20.图2是本发明实施例二所提供的一种临床研究数据的采集方法的流程图;
21.图3是本发明实施例三所提供的一种数据抽取模块的处理流程示意图;
22.图4是本发明实施例四所提供的一种临床研究数据的采集装置的结构示意图;
23.图5是本发明实施例五所提供的一种计算机设备的结构示意图。
具体实施方式
24.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
25.实施例一
26.图1是本发明实施例一所提供的一种临床研究数据的采集方法的流程图。本实施例可适用于采集临床研究所需的数据时的情形。该方法可以由临床研究数据的采集装置执行,该临床研究数据的采集装置可以采用软件和/或硬件的方式实现,例如,该临床研究数据的采集装置可配置于计算机设备中。如图1所示,该方法包括:
27.s110、响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目。
28.在本实施例中,临床研究数据采集请求可以为研究人员发起的,用于采集研究项目所需的临床研究数据的请求。其中,临床研究数据采集请求中可以包括待采集临床研究数据对应的研究项目,以及研究项目的部分项目属性。示例性的,研究人员可以在临床研究数据的采集装置关联的操作界面编辑研究项目,项目属性等信息,点击控件触发临床研究数据采集请求,临床研究数据的采集装置检测到研究人员触发的临床研究数据采集请求后,对临床研究数据采集请求进行解析,获得临床研究数据采集请求关联的研究项目。其中,研究人员编辑的内容可以包括研究项目的研究内容、研究项目的研究类型等项目属性。可选的,对临床研究数据采集请求进行解析,获得临床研究数据采集请求关联的研究项目可以通过关键词匹配的方式实现。
29.s120、获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数。
30.在本实施例中,研究项目的项目属性可以直接从临床研究数据采集请求中获取,还可以通过对临床研究数据采集请求中获取的内容进行处理得到。可选的,研究项目的项目属性包括项目类型、项目内容、关键事件、研究指标等。其中,项目内容需要从临床研究数据采集请求中获取;当临床研究数据采集请求中携带有项目类型时,项目类型可直接从临床研究数据采集请求中获取,若临床研究数据采集请求中不携带项目类型,可以通过对项目内容的语义分析确定项目类型;关键事件和研究指标的获取方式与项目类型相似,可以通过临床研究数据采集请求获取,也可以通过对研究内容的语义分析获取。优选的,获取研究项目的项目类型、关键事件及研究指标,包括:获取研究项目关联的类型作为项目类型;根据项目研究的研究内容确定关键事件和研究指标。为简化用户操作,可以由用户定义项目类型,并将携带有项目类型的临床研究数据采集请求发送至临床研究数据的采集装置,临床研究数据的采集装置从临床研究数据采集请求中获取项目类型,并根据项目内容分析得到关键事件和研究指标。
31.在本发明的一种实施方式中,获取研究项目的项目属性,根据项目属性确定临床研究数据采集请求的采集参数,包括:获取研究项目的项目类型、关键事件及研究指标;根据项目类型确定目标临床研究数据的采集时序参数;根据关键事件确定目标临床研究数据的数据采集逻辑;根据研究指标确定目标临床研究数据的数据采集路径。当研究项目的项目属性包括项目类型、关键事件及研究指标时,在确定采集参数时,分别基于项目类型确定采集时序参数、基于关键事件确定数据采集逻辑、基于研究指标确定数据采集路径。具体的,考虑到临床研究所需要的数据通常是有时序标签的,将采集时序参数作为采集参数之一。例如一个检验指标血红蛋白的值,在一个具体临床疾病治疗过程中,不同的时间检验出的数值具有不同的临床意义,在临床研究中通常需要分不同的研究阶段来划分和对比。其中,采集时序参数可以包括采集阶段以及采集时间范围。数据采集逻辑可以为采集的目标事件,数据采集路径可以包括采集的目标指标以及目标指标的值域范围。其中,目标指标的值域范围可以预先设定。
32.可选的,根据项目类型确定目标临床研究数据的采集时序参数,包括:根据项目类型确定项目研究阶段,基于项目研究阶段的阶段节点确定研究项目的采集时间戳,将以采集时间戳为基准,时间段为设定时间段的时间范围作为采集时序参数。以研究内容为“研究使用阿司匹林治疗前后血小板指标差异”为例,研究类型为“治疗前后指标差异”,则研究阶段可以划分为“治疗前”,“治疗后”,相应的,研究阶段的阶段节点为阿司匹林的服用时间,即医嘱执行时间,则将以医嘱时间为基准,时间段为设定时间段的时间范围作为采集时序参数。其中,时间段可以根据实际需求设置。
33.可选的,在确定采集参数后,为提高数据采集的准确度,可以将采集参数展示,以使研究人员确认采集参数是否合理,在研究人员确认采集参数合理后,执行后续操作,在研究人员认定采集参数不合理时,根据研究人员的调整生成合理的采集参数,再执行后续操作。
34.s130、基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
35.确定采集参数后,从临床数据库中筛选出与采集参数匹配的临床数据作为目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中,
以使研究人员可以通过目标数据集中的目标临床研究数据进行临床研究。
36.本发明实施例通过响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中,通过根据研究项目的项目属性自动确定目标临床研究数据的采集参数,基于确定的采集参数从预先构建的临床数据库中获取临床研究数据采集请求对应的目标临床研究数据,实现了快速精准的采集临床研究所需的数据,提高了临床研究的效率。
37.实施例二
38.图2是本发明实施例二所提供的一种临床研究数据的采集方法的流程图。本实施例在上述实施例的基础上,进行了进一步优化。具体的,在上述实施例的基础上,增加了构建包含标准临床数据的临床数据库的操作。如图2所示,方法包括:
39.s210、获取医院信息系统数据库中的原始临床数据。
40.医院信息系统数据库中包含有各种病历的数据,如电子病历数据、检验检查数据等。在本实施例中,获取医院信息系统数据库中的原始临床数据,处理后作为临床研究数据采集的候选数据。可选的,可以建立一个中间数据库,通过识别原始库中的数据结构和数据涵义,进行一些表结构映射,将医院信息系统数据库中的原始临床数据先采集至中间数据库。例如原始数据库中存在医嘱表的药品名称字段(yz_order.drugname),需要对应到中间库的医嘱表的药品通用名字段(order.common_drugname)。
41.s220、对原始临床数据进行标准化处理,得到标准临床数据,并将标准临床数据存储至临床数据库中。
42.医院信息系统数据库中的原始临床数据数据格式繁多。在本实施例中,将医院信息系统数据库中的原始临床数据统一为同一标准的标准临床数据,并将标准临床数据存储至临床数据库中,使得临床研究数据采集时,能够从临床数据库中快速精准的采集到临床研究所需的数据。
43.可选的,对原始临床数据进行标准化处理可以包括数据清洗、数据归一、数据结构化操作。可以理解的是,上述操作的过程不受限制,只要能处理得到标准统一的标准临床数据即可。
44.一个实施例中,对原始临床数据进行标准化处理,得到标准临床数据,包括:将原始临床数据的数据基本格式进行数据清洗,得到清洗临床数据;对清洗临床数据进行字段归一化,得到归一化临床数据;对归一化临床数据进行结构化,得到标准临床数据。可选的,可以通过数据清洗、数据归一、数据结构化的顺序对原始临床数据进行标准化处理。具体的,数据清洗主要为在中间库中对数据基本格式进行统一清洗,如对不同的时间格式、英文字段的大小写统一、去除字符前后的无效空格字段、部分小数数据统一成整数数据进行数据清洗,可通过hive内置的udf函数以及人为定义和新增的udf函数方法实现。数据归一主要为根据疾病数据标准对字段的定义进行标准化。例如将药品名称以atc(一种通用的国际药品分类标准)为标准字典对原始临床数据进行归一处理。数据结构化主要为根据预先定义的字段对原始临床数据进行结构化,如定义肿瘤专病字段“胃癌诊断分型”,字段标准值域包含“隆起型”,“局限溃疡型”,“浸润溃疡性”,“弥漫浸润性”,根据上述定义将原始临床
数据中的描述“胃食管交界处隆起型中,低分化腺癌”,“表浅平坦型o

iib,低分化腺癌”,“胃体局限溃疡性低分化腺癌”统一至上述某一字段。
45.其中,对归一化临床数据进行结构化,得到标准临床数据,包括:将归一化临床数据输入至预先训练的疾病标准数据模型中,得到疾病标准数据模型输出的标准临床数据。可选的,可以训练疾病标准数据模型定义字段对数据进行结构化。在疾病标准数据模型中制定一系列的自然语言处理规范,基于指定的自然语言处理规范将原始临床数据中的描述信息结构化为定义的字段信息。
46.s230、响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目。
47.s240、获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数。
48.s250、基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
49.本实施例在上述实施例的基础上,增加了构建包含标准临床数据的临床数据库的操作,通过获取医院信息系统数据库中的原始临床数据,对所述原始临床数据进行标准化处理,得到标准临床数据,并将所述标准临床数据存储至所述临床数据库中,实现了临床数据库中数据的标准化,进而使得临床研究数据的采集更加快速精准。
50.实施例三
51.本实施例在上述方案的基础上,提供了一种优选实施例。本发明实施例提供的临床研究数据的采集方法可以通过数据采集装置执行。在本实施例中,数据采集装置包括两个处理模块:数据处理模块和数据抽取模块。其中,数据处理模块用于将医院信息系统的数据库中的数据进行标准化处理,并将标准化处理后的数据存储至中间库(即临床数据库)中;数据抽取模块用于在检测到数据采集请求时,基于数据采集请求生成采集参数,根据采集参数从临床数据库中获取采集请求所需的数据。
52.具体的,数据处理模块从原始医院信息系统的数据库中进行数据处理得到中间库。这个过程中,包含初步采集、数据清洗、数据归一和数据结构化四个子步骤。
53.其中,初步采集时需建立一个中间数据库(即中间库),通过识别原始库(即原始医院信息系统的数据库)中的数据结构和数据涵义,进行一些表结构映射等操作,将数据先采集至中间数据库。例如,原始数据库中存在医嘱表的药品名称字段(yz_order.drugname),需要对应到中间库的医嘱表的药品通用名字段(order.common_drugname)。表结构映射的具体实现方式可参照现有的结构映射的方式,在此不再赘述。
54.数据清洗具体为在中间库中对数据基本格式进行统一清洗。例如原始数据库中的原始数据存在不同的医嘱执行时间:“2019.12.31”、“2019.08.03 09:20:20”、“2020

10

02 19:24:22”,需要按统一的日期标准格式清洗为“2019

12

31 00:00:00”、“2019

08

03 09:20:20”、“2020

10

02 19:24:22”。除时间外,数据清洗还包括英文字段的大小写统一、去除字符前后的无效空格字段、部分小数数据统一成整数数据(根据业务需要可采用四舍五入或向上/向下取整)。数据清洗可以采用hive内置的udf函数以及人为定义和新增的udf函数方法实现。
55.数据归一需要根据疾病数据标准对字段的定义进行标准化。例如疾病数据标准中
对药品名称要求以atc(anatomical therapeutic chemical)为标准字典对原始数据进行归一处理。如原始数据中同一药品存在不同的名称描述:“二甲双胍”、“2甲双胍”,“二甲双呱”,需要按atc分类将上述名称归一为“二甲双胍”,并附atc码“a10ba02”。数据归一的实现方式可参见现有的数据归一方法,在此不再赘述。
56.数据结构化需要根据预先定义的疾病字段对数据进行结构化。例如疾病标准数据模型中可以定义一个肿瘤专病字段“胃癌诊断分型”,字段标准值域包含“隆起型”,“局限溃疡型”,“浸润溃疡性”,“弥漫浸润性”,而原始的病历文本中描述包括“胃食管交界处隆起型中,低分化腺癌”,“表浅平坦型o

iib,低分化腺癌”,“胃体局限溃疡性低分化腺癌”等等。可选的,疾病字段的定义可以通过疾病标注数据模型实现,通过疾病标准数据模型制定一系列的自然语言处理(natural language processing,nlp)规范,基于制定的nlp规范实现数据结构化。以肿瘤专病字段“胃癌诊断分型”为例,需要对“胃癌诊断分型”字段不同的标准值域指定不同的自然语言处理规范。nlp规范可以通过nlp标注平台通过机器学习方法进行原始语义识别,或是通过正则等文本规则的方式进行识别。例如对“隆起型”的一条nlp规范进行确定:*隆起型*,那么可以将上述原始文本中的前两条识别为标准的值域“隆起型”。
57.数据抽取模块在检测到临床研究数据的数据采集请求后,根据临床研究的需要在关联项目中指定采集参数。整体来说,采集过程可以为:首先e

crf的结构进行设计,设计内容中可以指定需要采集的字段内容,并同时定义采集字段的时序逻辑以及事件逻辑,完成e

crf设计后,按以上设计的采集逻辑执行数据采集,将这些数据存储到临床研究项目内的子数据库。
58.图3是本发明实施例三所提供的一种数据抽取模块的处理流程示意图。如图3所示,数据抽取模块包括业务输入层、逻辑层和执行层。业务输入层用于定义研究类型、定义关键事件和定义研究指标后,逻辑层用于根据研究类型识别数据抽取阶段的设计方法并确定关联数据抽取时序,根据关键事件识别事件的数据属性并确定关联数据抽取逻辑,根据研究指标识别指标的数据属性并确定关联数据抽取路径。执行层用于根据关联数据抽取时序、关联数据抽取逻辑和关联数据抽取路径执行数据抽取操作,并将抽取到的数据作为目标临床研究数据输出至目标数据集合。其中,关联数据抽取时序可以为采集阶段及采集时间范围。
59.在本实施例中,通过设计采集逻辑采集精准的目标临床研究数据。示例性的,假设某项临床研究需要采集所有研究对象的血小板计数,考虑到一个患者的某一次就诊可能进行过多次血常规检查,则该患者可能包含多次血小板计数的数据,而具体采集哪次血小板计数的数据作为目标临床研究数据需要根据研究的背景和目的来决定。假设临床研究是为了研究阿司匹林药物影响后的血小板水平,则需要定义一个采集血小板计数指标的时间范围,例如服用阿司匹林后3天以内,然后只有范围还不够,一个范围内仍然有可能多次测量血小板,因此还需要定义这个范围内采集哪一次的测量值,例如是第一次、最后一次、最大值或是最小值。通过上述方式设置采集逻辑可以采集到精准的目标临床研究数据。
60.具体的,定义采集逻辑包含以下四个步骤:定义研究类型、定义事件和指标、研究阶段自动设置和确认、抽取逻辑自动设置和确认和执行数据抽取。上述步骤中,根据研究的类型和指标特性来定义和设置研究阶段以及指标的抽取逻辑。
61.定义研究类型:本实施例中,研究类型是与研究时序数据相关的一个特性,在研究
项目的创建过程中可以完成这项定义。示例性的,当研究项目为“研究使用阿司匹林治疗前后血小板指标差异”时,用户可以将研究类型定为“治疗前后指标差异”。每个研究类型均会自动指向一个研究阶段的设计方法,就本例子而言,“治疗前后指标差异”会自动将研究阶段分为“治疗前”,“治疗后”。
62.定义事件和指标:前一步骤已经完成了对阶段的初步划分,需要进一步确认按什么事件进行划分阶段抽取什么指标,即需要对研究的具体内容进行定义。例如,研究内容为“研究使用阿司匹林治疗前后血小板指标差异”,可以通过语义分析的方法确定关键事件和研究指标,将阿司匹林确定为关键事件,将血小板指标确定为研究指标。根据这里确认的事件和指标后续便可以自动完成阶段和指标的设置。
63.研究阶段自动设置和确认:研究阶段是指临床研究中的一个大的阶段范围,研究阶段的时序性即表示了所需要的研究指标的时序性,因此首先需要对阶段的时序性进行确定。前述过程中已经定义了研究类型(治疗前后)和关键事件(使用阿司匹林),阶段将自动关联相关设置内容提供进行进一步确认,设置内容包括:一个关键事件的研究指标(阿司匹林对应内容这个事件指标),这个指标的具体值域范围(医嘱内容包含有阿司匹林),一个与这个指标相关的一个时间戳(医嘱执行时间),一个这个时间戳的时间范围(医嘱执行范围之后3天以内,本时间范围根据常态进行自动设置)。以上完整的定义内容可以解释为:在这个事件(是由另一个指标定义的)相关的时间范围内抽取指定的指标。进一步的,该研究阶段设置可以进一步进行人工确认和修改,例如将事件范围根据要求具体的要求修改为医嘱执行之后1天以内。
64.抽取逻辑自动设置和确认:完成阶段自动设置和确认后,已经可以定义一个大致抽取指标的时间范围,需要进一步确定抽取指标的唯一性。由于上述步骤已经完成指标的定义,即血小板计数,根据疾病模型中对指标的参考值域范围定义,可以自动关联抽取规则(血小板计数<100*109),并且按常态定义抽取的次数(首次)。该定义内容可以理解为为:在之前定义的时间范围内,抽取符合某个规则条件的某一次(或某些次)数据。
65.执行数据抽取:完成上述步骤的确认后,即可执行数据抽取,并将抽取的数据添加至目标数据集。
66.本发明实施例提供的临床研究数据的采集方法能够使临床研究者更快速地收集到研究项目所需要的完整数据集;排除了人工录入的差错,进而提高了研究指标的准确性;通过数据处理模块使得用于研究的指标的范围得到增加,通过数据抽取模块使得指标采集的时序性得到解决,最终实现更加精准的采集到符合研究需要的指标,使得研究的范围得到扩大;另外,数据抽取模块中对研究类型、事件、指标的定义,可以完成研究指标时序逻辑和抽取逻辑的快速自动设置。
67.实施例四
68.图4是本发明实施例四所提供的一种临床研究数据的采集装置的结构示意图。该临床研究数据的采集装置可以采用软件和/或硬件的方式实现,例如该临床研究数据的采集装置可以配置于计算机设备中。如图4所示,该装置包括研究项目确定模块410、采集参数确定模块420和研究数据采集模块430,其中:
69.研究项目确定模块410,用于响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;
70.采集参数确定模块420,用于获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;
71.研究数据采集模块430,用于基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
72.本发明实施例通过研究项目确定模块响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;采集参数确定模块获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;研究数据采集模块基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中,通过根据研究项目的项目属性自动确定目标临床研究数据的采集参数,基于确定的采集参数从预先构建的临床数据库中获取临床研究数据采集请求对应的目标临床研究数据,实现了快速精准的采集临床研究所需的数据,提高了临床研究的效率。
73.可选的,在上述方案的基础上,采集参数确定模块420包括:
74.项目属性获取单元,用于获取研究项目的项目类型、关键事件及研究指标;
75.时序参数确定单元,用于根据项目类型确定目标临床研究数据的采集时序参数;
76.采集逻辑确定单元,用于根据关键事件确定目标临床研究数据的数据采集逻辑;
77.采集路径确定单元,用于根据研究指标确定目标临床研究数据的数据采集路径。
78.可选的,在上述方案的基础上,项目属性获取单元具体用于:
79.获取研究项目关联的类型作为项目类型;
80.根据项目研究的研究内容确定关键事件和研究指标。
81.可选的,在上述方案的基础上,时序参数确定单元具体用于:
82.根据项目类型确定项目研究阶段,基于项目研究阶段的阶段节点确定研究项目的采集时间戳,将以采集时间戳为基准,时间段为设定时间段的时间范围作为采集时序参数。
83.可选的,在上述方案的基础上,装置还包括标准临床数据模块,包括:
84.原始数据获取单元,用于获取医院信息系统数据库中的原始临床数据;
85.标准数据生成单元,用于对原始临床数据进行标准化处理,得到标准临床数据,并将标准临床数据存储至临床数据库中。
86.可选的,在上述方案的基础上,标准数据生成单元具体用于:
87.将原始临床数据的数据基本格式进行数据清洗,得到清洗临床数据;
88.对清洗临床数据进行字段归一化,得到归一化临床数据;
89.对归一化临床数据进行结构化,得到标准临床数据。
90.可选的,在上述方案的基础上,标准数据生成单元具体用于:
91.将归一化临床数据输入至预先训练的疾病标准数据模型中,得到疾病标准数据模型输出的标准临床数据。
92.本发明实施例所提供的临床研究数据的采集装置可执行本发明任意实施例所提供的临床研究数据的采集方法,具备执行方法相应的功能模块和有益效果。
93.实施例五
94.图5是本发明实施例五所提供的一种计算机设备的结构示意图。图5示出了适于用
来实现本发明实施方式的示例性计算机设备512的框图。图5显示的计算机设备512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
95.如图5所示,计算机设备512以通用计算设备的形式表现。计算机设备512的组件可以包括但不限于:一个或者多个处理器516,系统存储器528,连接不同系统组件(包括系统存储器528和处理器516)的总线518。
96.总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器516或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
97.计算机设备512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
98.系统存储器528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)530和/或高速缓存存储器532。计算机设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储装置534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd

rom,dvd

rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
99.具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
100.计算机设备512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该计算机设备512交互的设备通信,和/或与使得该计算机设备512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口522进行。并且,计算机设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与计算机设备512的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
101.处理器516通过运行存储在系统存储器528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的临床研究数据的采集方法,该方法包括:
102.响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;
103.获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;
104.基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
105.当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的临床研究数据的采集方法的技术方案。
106.实施例六
107.本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所提供的临床研究数据的采集方法,该方法包括:
108.响应于检测到的临床研究数据采集请求,确定临床研究数据采集请求关联的研究项目;
109.获取研究项目的项目属性,根据项目属性确定目标临床研究数据的采集参数;
110.基于采集参数从预先构建的临床数据库中获取目标临床研究数据,并将目标临床研究数据添加至临床研究数据采集请求关联的目标数据集中。
111.当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法操作,还可以执行本发明任意实施例所提供的临床研究数据的采集方法的相关操作。
112.本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
113.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
114.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
115.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商
来通过因特网连接)。
116.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1