临床试验报告自动录入方法及装置、电子设备、存储介质与流程

文档序号:24046200发布日期:2021-02-23 18:51阅读:339来源:国知局
临床试验报告自动录入方法及装置、电子设备、存储介质与流程

[0001]
本公开涉及计算机技术领域,尤其涉及一种临床试验报告自动录入方法、临床试验报告自动录入装置、电子设备及计算机可读存储介质。


背景技术:

[0002]
随着信息时代的来临,各个企业内部会积累大量的数据,为了针对数据进行有效决策,通常会根据这些数据生成相关报告。特别在医疗领域,为了建立一份临床试验报告,以供医生分析、学习或研究,通常会由医疗人员从电子系统或纸质病历中大量的翻阅和查找临床试验报告所需的数据,然后将这些数据人工填写进报告中。然而,上述方法极大的依赖人力资源,不可避免的会出现数据转录错误或漏掉重要信息的情况,造成时间以及人力成本的极大消耗,且不能保准临床试验报告的准确性。因此,如何高效、准确的使数据自动录入临床试验报告,是现有技术亟待解决的问题。
[0003]
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

[0004]
本公开提供了一种临床试验报告自动录入方法、临床试验报告自动录入装置、电子设备及计算机可读存储介质,进而至少在一定程度上克服现有的临床试验报告依赖人工填写且准确性较低的问题。
[0005]
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0006]
根据本公开的第一方面,提供一种临床试验报告自动录入方法,包括:获取受试者的全维度数据集合;根据临床试验报告的第一配置信息,对所述全维度数据集合进行数据映射处理,以填充所述受试者的临床试验报告;根据临床试验报告的第二配置信息,从所述全维度数据集合中提取所述受试者的异常事件信息;将所述受试者的异常事件信息补充录入至所述受试者的临床试验报告。
[0007]
在本公开的一种示例性实施例中,所述第一配置信息包括全维度数据集合中的医疗数据与临床试验报告中的试验报告数据之间的指标映射规则以及数据转换规则;所述根据临床试验报告的第一配置信息,对所述全维度数据集合进行数据映射处理,以填充所述受试者的临床试验报告,包括:根据所述指标映射规则将所述全维度数据集合中医疗数据的指标映射为所述试验报告数据的指标,并根据所述数据转换规则将所述医疗数据转换为对应指标的试验报告数据;将所述试验报告数据填充至所述受试者的临床试验报告。
[0008]
在本公开的一种示例性实施例中,在将所述试验报告数据填充至所述临床试验报告之前,所述方法还包括:对所述试验报告数据进行校验,保留通过校验的所述试验报告数据;其中,所述校验包括以下任意一种或多种的组合:确认所述试验报告数据中不包含未知类型字符;确认所述试验报告数据未超出对应的数值范围;确认所述试验报告数据的长度
未超出对应的长度阈值。
[0009]
在本公开的一种示例性实施例中,所述第一配置信息包括基于规则的配置文件或基于知识图谱的配置文件。
[0010]
在本公开的一种示例性实施例中,所述第二配置信息包括基于关键词的正则表达式;所述根据临床试验报告的第二配置信息,从所述全维度数据集合中提取所述受试者的异常事件信息,包括:利用所述正则表达式,在所述全维度数据集合中查找与所述正则表达式匹配的字符串;提取所述全维度数据集合中所述字符串对应的文本信息,作为所述受试者的异常事件信息。
[0011]
在本公开的一种示例性实施例中,所述获取受试者的全维度数据集合,包括:从医院信息管理系统获取所述受试者的第一类数据,从病历录入系统获取所述受试者的第二类数据;对所述第一类数据和所述第二类数据进行整合处理,以得到所述受试者的所述全维度数据集合。
[0012]
在本公开的一种示例性实施例中,所述临床试验报告包括病例报告表。
[0013]
根据本公开的第二方面,提供一种临床试验报告自动录入装置,包括:数据获取模块,用于获取受试者的全维度数据集合;第一处理模块,用于根据临床试验报告的第一配置信息,对所述全维度数据集合进行数据映射处理,以填充所述受试者的临床试验报告;第二处理模块,用于根据临床试验报告的第二配置信息,从所述全维度数据集合中提取所述受试者的异常事件信息;报告生成模块,用于将所述受试者的异常事件信息补充录入至所述受试者的临床试验报告。
[0014]
在本公开的一种示例性实施例中,所述第一配置信息包括全维度数据集合中的医疗数据与临床试验报告中的试验报告数据之间的指标映射规则以及数据转换规则;第一处理模块包括:数据转换单元,用于根据所述指标映射规则将所述全维度数据集合中医疗数据的指标映射为所述试验报告数据的指标,并根据所述数据转换规则将所述医疗数据转换为对应指标的试验报告数据;报告填充单元,用于将所述试验报告数据填充至所述受试者的临床试验报告。
[0015]
在本公开的一种示例性实施例中,临床试验报告自动录入装置还包括:校验模块,用于在将所述试验报告数据填充至所述临床试验报告之前,对所述试验报告数据进行校验,保留通过校验的所述试验报告数据;其中,所述校验包括以下任意一种或多种的组合:确认所述试验报告数据中不包含未知类型字符;确认所述试验报告数据未超出对应的数值范围;确认所述试验报告数据的长度未超出对应的长度阈值。
[0016]
在本公开的一种示例性实施例中,所述第一配置信息包括基于规则的配置文件或基于知识图谱的配置文件。
[0017]
在本公开的一种示例性实施例中,所述第二配置信息包括基于关键词的正则表达式;第二处理模块包括:数据查找单元,用于利用所述正则表达式,在所述全维度数据集合中查找与所述正则表达式匹配的字符串;信息提取单元,用于提取所述全维度数据集合中所述字符串对应的文本信息,作为所述受试者的异常事件信息。
[0018]
在本公开的一种示例性实施例中,数据获取模块包括:第一获取单元,用于从医院信息管理系统获取所述受试者的第一类数据,从病历录入系统获取所述受试者的第二类数据;第二获取单元,用于对所述第一类数据和所述第二类数据进行整合处理,以得到所述受
试者的所述全维度数据集合。
[0019]
在本公开的一种示例性实施例中,所述临床试验报告包括病例报告表。
[0020]
根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一种临床试验报告自动录入方法。
[0021]
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种临床试验报告自动录入方法。
[0022]
本公开的示例性实施例具有以下有益效果:
[0023]
获取受试者的全维度数据集合,根据临床试验报告的第一配置信息,对全维度数据集合进行数据映射处理,以填充受试者的临床试验报告,根据临床试验报告的第二配置信息,从全维度数据集合中提取受试者的异常事件信息,将受试者的异常事件信息补充录入至受试者的临床试验报告。一方面,以第一配置信息以及第二配置信息的形式对全维度数据集合进行标准化处理而得到临床试验报告,该过程实现了临床试验报告的自动化录入,减少了对人工操作的依赖,提高了效率,并且降低了人为失误对临床试验报告的准确性造成的影响;另一方面,本示例性实施例是基于受试者的全维度数据集合,确定的临床试验报告,由于全维度数据集合包含关于受试者的丰富的医疗数据,因此,提高了临床试验报告的全面性,进而使临床试验报告具有较强的有效性和可分析性;再一方面,临床试验报告通过自动录入以及补充录入的形式确定,保证了临床试验报告中数据录入的完整性和全面性。
[0024]
应当理解的是,以上的一般描述和后文的细节述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0025]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]
图1示意性示出本示例性实施例中一种临床试验报告自动录入方法的流程图;
[0027]
图2示意性示出本示例性实施例中一种临床试验报告自动录入方法的子流程图;
[0028]
图3示意性示出本示例性实施例中另一种临床试验报告自动录入方法的流程图;
[0029]
图4示意性示出本示例性实施例中一种临床试验报告自动录入装置的结构框图;
[0030]
图5示意性示出本示例性实施例中一种用于实现上述方法的电子设备;
[0031]
图6示意性示出本示例性实施例中一种用于实现上述方法的计算机可读存储介质。
具体实施方式
[0032]
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结
构或特性可以以任何合适的方式结合在一个或更多实施方式中。
[0033]
本公开的示例性实施例首先提供了一种临床试验报告自动录入方法,可用于生成关于受试者的临床试验报告,其中,临床试验报告是指针对受试者的基本信息、治疗方案、以及治疗过程等信息的记录报告。本示例性实施例的应用场景可以是:通过本示例性实施例的方法录入关于受试者的临床试验报告,以便医生对试验方案进行分析或调整等。
[0034]
下面结合附图1对本示例性实施例做进一步说明,如图1所示,临床试验报告自动录入方法可以包括以下步骤s110~s140:
[0035]
步骤s110,获取受试者的全维度数据集合。
[0036]
其中,受试者是指作为医疗研究的载体,参与到医疗研究过程中的合作者。全维度数据集合中可以包括受试者的医疗数据,具体,可以包括受试者的基本信息,例如年龄、身高、性别等个人信息;或者状态信息,例如受试者在试验过程中出现咳嗽、气促、高热、乏力、寒颤3天、咳痰1周、体温39℃等外在症状信息;或者病理信息,例如受试者曾经患有何种疾病,其发生的原因、原理和疾病过程中发生的细胞、组织和器官的结构、功能和代谢方面的改变及其规律;再或者受试者在治疗过程中的检查信息,例如尿液、血常规、肾功能等详细的检测结果信息等等。此外,全维度数据集合中还可以包括关于受试者的其他医疗信息,例如治疗方案、使用的药物、病史等等,本公开对此不做具体限定。
[0037]
在本示例性实施例中,医疗人员从一特定的数据库中获取受试者完整或部分的数据,以确定全维度数据集合,例如特定的数据库可以是受试者全生命周期标准数据集。另外,也可以将受试者的部分信息输入到系统中,使其通过在其他数据库中查找该受试者的其他信息,以得到完整的全维度数据集合,从而可以根据系统中的受试者信息确定临床试验报告。
[0038]
为了使全维度数据集合更加全面,在一示例性实施例中,步骤s110可以包括以下步骤:
[0039]
从医院信息系统获取所述受试者的第一类数据,从病历录入系统获取所述受试者的第二类数据;
[0040]
对所述第一类数据和所述第二类数据进行整合处理,以得到所述受试者的所述全维度数据集合。
[0041]
其中,医院信息管理系统是指可以为医院所属各部门提供受试者诊疗信息和行政管理信息的平台,其可以包括his(hospital information system,医院信息系统)、lis(laboratory information system,实验室(检验科)信息系统)、emr(electronic medical record,计算机化的病案系统)等等,医院信息管理系统可以包括受试者大部分甚至全部的医疗信息,即为第一类数据。第二类数据可以是指未录入医院信息管理系统的医疗信息,例如刚刚获取,未及时上传医院信息管理系统的病历信息,其可以通过医院的病历录入系统获取。本示例性实施例通过从病历录入系统获取第二类数据,结合第一类数据确定受试者的初始医疗信息,可以丰富初始医疗信息,建立更为全面的受试者医疗信息数据库。
[0042]
考虑到从不同平台获取的数据可能存在格式不统计、标准不规范等情况,例如从his平台获取到关于白细胞的数据为“白细胞:(5~9)
×
109/l”,从lis平台获取到关于白细胞的数据为“wbc:(5~9)
×
109/l”,或者从医院信息管理系统中获取受试者的检查数据为“是否吸烟:否”,而在病历录入系统中获取的检查数据为“该受试者不吸烟”等。需要说明的
是,上述例子仅作为示意性示例,实际应用中,从不同平台获取的数据及数据类型可以相同,也可以不同。鉴于上述问题,本示例性实施例在获取第一类数据以及第二类数据后,可以对其进行数据整合,使其成为格式统一、标准统一、语义统一的数据,即对不同数据源获取的数据进行整理、清洗、转换后整合为一个特定数据集,数据整合的采取的方式可以有多种,本公开对此不做具体限定。
[0043]
步骤s120,根据临床试验报告的第一配置信息,对全维度数据集合进行数据映射处理,以填充受试者的临床试验报告。
[0044]
在本示例性实施例中,可以根据第一配置信息对全维度数据集合进行处理,以使全维度数据集合中的医疗数据能够自动填充受试者的临床试验报告。通常,不同的受试者其对应的临床试验报告也不相同,例如肺病受试者与流感受试者所接受的检查项目、治疗过程、服用药物等信息均不相同,即不同的临床方案具有不同的临床试验报告。第一配置信息可以是能够反映临床试验报告与医疗数据关系的信息,其可以是临床试验报告或医疗数据的具体内容,例如肺病受试者的临床试验报告包括胸部x线平片、胸部ct(computed tomography,计算机断层扫描)、肺功能检测、用药类型,根据这些第一配置信息可以确定在全维度数据集合中与其对应的胸部x线平片、胸部ct、肺功能检测、用药类型的内容等等。临床试验报告是指用于记录受试者医疗信息的报告,医疗人员可以根据临床试验报告监测试验进程,以针对受试者情况作出试验方案的调整。
[0045]
特别的,临床试验报告可以为crf(case report form,病例告表),crf是指一种可视的、电子版的文件,用于记录受试者的所有治疗方案要求的信息,是指一种按照试验方案的规定所设计的一种文件。在本示例性实施例中,当确定采取哪种crf,其第一配置信息也可以被相应确定,例如crf的主题为“缺血性肾病功能进展”时,其所研究的主题和治疗方案将被确定,具体的,可以确定需要对受试者哪个部位进行ct、需要获取受试者的哪些检测指标(如血常规、蛋白定量、肾脏b超)等等,这些信息可以与全维度数据集合中对应的内容形成映射关系,该映射关系可以认为是crf的第一配置信息等等。
[0046]
步骤s130,根据临床试验报告的第二配置信息,从全维度数据集合中提取受试者的异常事件信息。
[0047]
步骤s140,将受试者的异常事件信息补充录入至受试者的临床试验报告。
[0048]
全维度数据集合中可以包括受试者在试验过程的事件信息,例如中性粒细胞计数、血小板或血红蛋白的数量,或者治疗持续一个周期后的体征监测数据等等,全维度数据集合中还可以包括一些关于受试者的异常事件信息,如血压升高、恶心、呼吸困难等不良反应,这些不良反应都可以用于对受试者的病症进行分析,以更好的推进治疗进程。在本示例性实施例中,为了更为全面的捕获受试者的异常事件信息,可以据临床试验报告的第二配置信息,从全维度数据集合中提取受试者的异常事件信息。其中,第二配置信息可以是指全维度数据集合中异常事件信息的医疗数据与临床试验报告的映射关系,使得根据该映射关系能够使异常事件信息的医疗数据录入临床试验报告中。
[0049]
在实际应用中,可能会出现由于受试者个人身体特点、饮食或其他因素导致的与病症无关的异常事件,例如肺病受试者由于饮食过多导致的恶心与其病症本身没有关系,则恶心这一不良反应即可以认为是无效异常事件,在本示例性实施例中,为了生成有效的临床试验报告,还可以通过人工校验的方式,对无效的异常事件进行筛选,例如肺病受试者
的异常事件包括:肺部ct呈现阴影或肿块、胸部沉重感、呼吸困难、心慌等,经过校验,确定该受试者的有效异常事件信息为:呼吸困难、恶心、头晕等,而恶心、头晕对心肺类疾病来说并非属于具有可研究性的异常事件,因此可以将恶心、头晕等异常事件信息移除。除了不良反应外,异常事件信息还可以包括试验方案之间是否冲突、试验过程中的药物是否包含违禁药物等等,本公开对此不做具体限定。
[0050]
基于上述说明,在本示例性实施例中,获取受试者的全维度数据集合,根据临床试验报告的第一配置信息,对全维度数据集合进行数据映射处理,以填充受试者的临床试验报告,根据临床试验报告的第二配置信息,从全维度数据集合中提取受试者的异常事件信息,将受试者的异常事件信息补充录入至受试者的临床试验报告。一方面,以第一配置信息以及第二配置信息的形式对全维度数据集合进行标准化处理而得到临床试验报告,该过程实现了临床试验报告的自动化录入,减少了对人工操作的依赖,提高了效率,并且降低了人为失误对临床试验报告的准确性造成的影响;另一方面,本示例性实施例是基于受试者的全维度数据集合,确定的临床试验报告,由于全维度数据集合包含关于受试者的丰富的医疗数据,因此,提高了临床试验报告的全面性,进而使临床试验报告具有较强的有效性和可分析性;再一方面,临床试验报告通过自动录入以及补充录入的形式确定,保证了临床试验报告中数据录入的完整性和全面性。
[0051]
在本示例性实施例中,第一配置信息中包括了临床试验报告中的试验报告数据与全维度数据集合中的医疗数据的映射关系,根据第一配置信息可以从全维度数据集合中提取临床试验报告中所需的数据,并根据这些数据生成受试者的临床试验报告。
[0052]
在实际应用中,将医疗数据整理为临床试验报告时,由于数据种类繁多且数据差异性较大,可能会出现临床试验报告中部分数据无法正常生成的情况,例如数据单位不统一、数据格式不一致等等,需要对数据进行一定的处理。本公开提供以下几种具体的示例性方法,但下述内容不应对本公开的保护范围造成限定:
[0053]
(1)第一配置信息可以包括全维度数据集合中的医疗数据与临床试验报告中的试验报告数据之间的指标映射规则以及数据转换规则。其中,指标映射规则是指在字段不同、含义相同的指标之间建立的映射关系,举例而言,医疗数据和临床试验报告的试验报告数据中均包含血糖这一指标,但是两边所采用的指标字段可能不同,如医疗数据中的血糖为中文或英文的编码,试验报告数据中的血糖为其医学符号,甚至医疗数据中包含了从多个来源(如多种血液分析仪器)获得的血糖数据,其指标字段均不同,因此,建立指标映射规则可以将这些指标关系对应起来。数据转换规则是指在具有映射关系的指标之间,若其数据的格式或类型不同,如何相互转换的规则,举例而言,同样是血糖这一指标,其数据所采用的计量单位、数据编码方式、数据存储格式、数据结构等都可能不同,对于图像数据,其分辨率大小、压缩格式、尺寸等也可能不同,因此,建立数据转换规则可以在相同含义的指标下,对数据进行转换,特别是将初始医疗信息的数据转换为对应的试验报告数据。
[0054]
基于此,如图2所示,步骤s120可以包括以下步骤:
[0055]
步骤s210,根据指标映射规则将全维度数据集合中医疗数据的指标映射为试验报告数据的指标,并根据数据转换规则将医疗数据转换为对应指标的试验报告数据;
[0056]
步骤s220,将试验报告数据填充至受试者的临床试验报告。
[0057]
其中,根据指标映射规则,可以查找临床试验报告所需的指标在医疗数据中对应
的指标,进而提取这些指标的数据,例如在关于心肺类的临床试验报告中,其所需的指标可以包括胸部x线平片、胸部ct与纤支镜检查、血清ige检测、肺功能检查等,查找这些指标在医疗数据中对应的指标字段;将查找到的指标字段下的数据提取出来,按照数据转换规则,转换为对应的临床试验报告中的数据格式,从而获得了临床试验报告所需的全部数据;再进行一定的整理加工,生成临床试验报告。
[0058]
(2)第一配置信息也可以包括基于知识图谱的指标层级关系。其中,知识图谱是事先配置的以临床试验报告的主题为关键词,显示关键词与各个层级的医学知识、指标之间关联的可视化图谱。举例而言,crf的主题为“缺血性肾病功能进展”,关键词为“缺血性肾病”,以其为中心,配置放射状的关系图谱,与“缺血性肾病”最为关联的医学知识词位于内侧圆上,每个医学知识词再关联到下一级词,依此类推,最终形成了多层级的图谱。基于知识图谱,可以转换形成指标层级关系,即为第一配置信息。通过这种形式的第一配置信息,可以在全维度数据集合中查找进入该指标层级关系的所有相关数据,将这些数据整理后形成具有指标层级关系的临床试验报告。
[0059]
(3)可以结合上述(1)和(2)的方式,具体而言,步骤s120中获得的第一配置信息可以包括基于规则的配置文件和基于知识图谱的配置文件。
[0060]
其中,由全维度数据集合到临床试验报告的过程可以参考上述(1)的方式,在得到试验报告数据后,将其按照基于知识图谱的配置文件中的指标层级关系进行整理,可以得到表单形式的临床试验报告。
[0061]
考虑到临床试验报告的试验报告数据中可能会存在一些异常数据,例如在数据整合阶段,某些数据出现异常,从而造成部分数据缺失或数据格式混乱等情况,为了使录入的临床试验报告中的数据更准确,在一示例性实施例中,在步骤s220之前,临床试验报告自动录入方法还可以包括以下步骤:
[0062]
对试验报告数据进行校验,保留通过校验的试验报告数据;
[0063]
其中,上述校验可以包括以下任意一种或多种的组合:
[0064]
(1)、确定试验报告数据中不包含未知类型字符;
[0065]
(2)、确认试验报告数据未超出对应的数值范围;
[0066]
(3)、确认试验报告数据的长度未超出对应的长度阈值。
[0067]
在本示例性实施例中,对试验报告数据进行校验,可以视为对试验报告数据的筛选机制,保留通过校验的试验报告数据,以确保临床试验报告生成的准确性。对试验报告数据进行校验具体可以包括上述多种情况,当上述三种情况其中之一不满足条件时,即认为试验报告数据不能通过校验。上述情况(1)是为了确保试验报告数据中不包含与临床试验报告无关的未知类型字符,例如试验报告数据为“白##*:(5~9)
×
109/l”,其中出现“白##*”无法识别的未知类型字符,影响医疗人员对临床试验报告的分析和审阅。未知类型字符可以是不符合数据类型的任何字符,例如在数值类数据中出现的非数值的字符可以认为是未知类型字符,在文本类数据中出现的特殊符号可以认为是位置类型字符,在某些情况中,“空格”、“破折号”都可以认为是未知类型字符,本公开对此不做具体限定;上述情况(2)和(3)是为了确定试验报告数据的可靠性,例如试验报告数据为血压值,血压值可波动范围为50~200,如果出现血压值为300的数据,则可以认为该数据为异常数据,不予通过校验。同理,试验报告数据的长度通常会设置固定的长度阈值,例如血压值的长度阈值为3位,
如果出现血压值为00000050,则系统可能无法准确识别其所表示的真实血压值,因此,本示例性实施例中可以不保留超出对应的长度阈值的试验报告数据等等。需要说明的是,上述数值范围和长度阈值,可以根据数据类型具体设置,例如根据历史数据得到的血压范围、血糖范围作为数值范围,或者根据临床经验得到关于数据的正常数值长度,将其作为长度阈值等等,本公开对此不做具体限定。
[0068]
在一示例性实施例中,第二配置信息包括基于关键词的正则表达式;上述步骤s130可以包括以下步骤:
[0069]
利用正则表达式,在全维度数据集合中查找与正则表达式匹配的字符串;
[0070]
提取全维度数据集合中字符串对应的文本信息,作为受试者的异常事件信息。
[0071]
其中,正则表达式是指一种规则表达式,本示例性实施例可以基于正则表达式从全维度数据集合中抽取出与正则表达式匹配的字符串。即可以为不同的异常事件信息的关键词构建对应的且通用的正则表达式,并将这些正则表达式存储于正则表达式集合中,当获取到全维度数据集合中的任意一个医疗数据后,从正则表达式集合中调用正则表达式,以从全维度数据集合中抽取相应的异常事件信息的数据。例如为违禁药物的类型、名称或者试验过程中受试者可能出现的不良反应的症状关键词(如“心慌”、“气短”)构建对应的正则表达式,通过提取全维度数据集合中所有与正则表达式匹配的字符串,确定字符串所对应的文本信息,即可以确定受试者全部的异常事件信息,从而将其录入临床试验报告中。
[0072]
图3示出了本示例性实施例中另一种临床试验报告自动录入方法的流程图,具体过程可以包括以下步骤:
[0073]
步骤s301,从医院信息管理系统中获取关于受试者的第一类数据;
[0074]
步骤s302,从病历录入系统中获取关于受试者的第二类数据;
[0075]
步骤s303,对第一类数据与第二类数据进行整合处理,得到受试者的全维度数据集合;
[0076]
步骤s304,根据临床试验报告的第一配置信息,对全维度数据集合进行数据映射处理,以填充受试者的临床试验报告;
[0077]
步骤s305,根据临床试验报告的第二配置信息,从全维度数据集合中提取受试者的异常事件信息;
[0078]
步骤s306,对试验报告数据进行校验;
[0079]
步骤s307,将未通过校验的试验报告数据移除;
[0080]
步骤s308,将通过校验的试验报告数据以及异常事件信息整理为临床试验报告。
[0081]
本公开的示例性实施例还提供了一种临床试验报告自动录入装置。参照图4,该装置400可以包括,数据获取模块410,用于获取受试者的全维度数据集合;第一处理模块420,用于根据临床试验报告的第一配置信息,对全维度数据集合进行数据映射处理,以填充受试者的临床试验报告;第二处理模块430,用于根据临床试验报告的第二配置信息,从全维度数据集合中提取受试者的异常事件信息;报告生成模块440,用于将受试者的异常事件信息补充录入至受试者的临床试验报告。
[0082]
在一示例性实施例中,第一配置信息可以包括全维度数据集合中的医疗数据与临床试验报告中的试验报告数据之间的指标映射规则以及数据转换规则;第一处理模块包括:数据转换单元,用于根据指标映射规则将全维度数据集合中医疗数据的指标映射为试
验报告数据的指标,并根据数据转换规则将医疗数据转换为对应指标的试验报告数据;报告填充单元,用于将试验报告数据填充至受试者的临床试验报告。
[0083]
在一示例性实施例中,临床试验报告自动录入装置还可以包括:校验模块,用于在将试验报告数据填充至临床试验报告之前,对试验报告数据进行校验,保留通过校验的试验报告数据;其中,校验包括以下任意一种或多种的组合:确认试验报告数据中不包含未知类型字符;确认试验报告数据未超出对应的数值范围;确认试验报告数据的长度未超出对应的长度阈值。
[0084]
在一示例性实施例中,第一配置信息包括基于规则的配置文件或基于知识图谱的配置文件。
[0085]
在一示例性实施例中,第二配置信息可以包括基于关键词的正则表达式;第二处理模块包括:数据查找单元,用于利用正则表达式,在全维度数据集合中查找与正则表达式匹配的字符串;信息提取单元,用于提取全维度数据集合中字符串对应的文本信息,作为受试者的异常事件信息。
[0086]
在一示例性实施例中,数据获取模块可以包括:第一获取单元,用于从医院信息管理系统获取受试者的第一类数据,从病历录入系统获取受试者的第二类数据;第二获取单元,用于对第一类数据和第二类数据进行整合处理,以得到受试者的全维度数据集合。
[0087]
在一示例性实施例中,临床试验报告可以包括病例报告表。
[0088]
上述装置中各模块/单元的具体细节在方法部分的实施例中已经详细说明,未披露的细节内容可以参见方法部分的实施例内容,因此此处不再赘述。
[0089]
本公开的示例性实施例还提供了一种能够实现上述方法的电子设备。
[0090]
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0091]
下面参照图5来描述根据本公开的这种示例性实施例的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0092]
如图5所示,电子设备500以通用计算设备的形式表现。电子设备500的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530、显示单元540。
[0093]
其中,存储单元存储有程序代码,程序代码可以被处理单元510执行,使得处理单元510执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元510可以执行图1所示的步骤s110~s140,也可以执行图2所示的步骤s210~s220等。
[0094]
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)521和/或高速缓存存储单元522,还可以进一步包括只读存储单元(rom)523。
[0095]
存储单元520还可以包括具有一组(至少一个)程序模块525的程序/实用工具524,这样的程序模块525包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0096]
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储
单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0097]
电子设备500也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备500交互的设备通信,和/或与使得该电子设备500能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口550进行。并且,电子设备500还可以通过网络适配器560与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与电子设备500的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0098]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施例的方法。
[0099]
本公开的示例性实施例还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
[0100]
参考图6所示,描述了根据本公开的示例性实施例的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0101]
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0102]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0103]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有
线、光缆、rf等等,或者上述的任意合适的组合。
[0104]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0105]
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0106]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施例,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0107]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
[0108]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1