一种应用于临床科研的数据采集系统及方法与流程

文档序号:17735708发布日期:2019-05-22 03:10阅读:287来源:国知局
一种应用于临床科研的数据采集系统及方法与流程
本发明涉及应用于医疗领域的电子信息化和网络化技术,尤其涉及一种应用于临床科研的数据采集系统。
背景技术
:电子病历(emr,electronicmedicalrecord),也叫计算机化的病案系统或称基于计算机的病人记录(cpr,computer-basedpatientrecord)。它是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历。emr是病人在医院诊断治疗全过程的原始记录,它包含有首页、病程记录、检查检验结果、医嘱、手术记录、护理记录等等。电子病历不仅指静态病历信息,还包括提供的相关服务。是以电子化方式管理的有关个人终生健康状态和医疗保健行为的信息,涉及病人信息的采集、存储、传输、处理和利用的所有过程信息。经过十几年的积累,尽管我国拥有海量的大数据,但却缺乏有效的加工分析能力,其中最主要的问题在于临床业务系统和科研数据采集系统无法统一,科研数据的采集来源于临床业务系统,但两者缺乏统一的数据标准,导致科研数据的真实性和可溯源性大打折扣。技术实现要素:本发明要解决的技术问题是:为了解决临床业务系统和科研数据采集系统无法统一,科研数据的采集来源于临床业务系统,但两者缺乏统一的数据标准,导致科研数据的真实性和可溯源性大打折扣的问题,本发明提供了一种应用于临床科研的数据采集系统及方法来解决上述问题。本发明解决其技术问题所采用的技术方案是:一种应用于临床科研的数据采集方法,包括以下步骤:s1基础数据准备:创建具有唯一标识的元素并设定元素规则,创建科研病历模板,设定科研病历模板中的科研项目并将所述科研项目和所述元素绑定,然后将所述科研病历模板发布到基础数据库;s2科研病历数据采集:根据科研项目调用对应的科研病历模板,将科研病人数据填写入所述科研病历模板中形成科研病历并存储到临床数据库,所述科研病人数据对应绑定到每个具有唯一标识的元素且对应唯一的时间信息;s3清洗科研病历数据:创建科研项目,导入所述临床数据库中对应的科研病历,然后根据元素规则清洗科研病历数据,清洗之后的科研病历数据保存到科研数据库中。根据本发明的一个实施例,所述步骤s1中唯一标识的元素的创建方法为每个所述元素被配置一个唯一对应的编码。根据本发明的一个实施例,病人就诊医生下诊断后,如果诊断属于科研项目,则调用对应的科研病历模板并填写科研病历,否则写普通病历。根据本发明的一个实施例,所述步骤s3中定时从临床数据库中抽取科研病人的科研数据。根据本发明的一个实施例,所述步骤s1中维护所述元素的属性,元素的属性包括数据类型、大小、长度和分类,并且绑定到所述元素的唯一标识。根据本发明的一个实施例,所述步骤s3中,创建科研项目包括如下步骤:s301创建模块,在模块维护界面自由勾选之前创建的元素,一个模块由多个元素组成;s302创建访视界面,一个访视界面由多个模块组成;s303创建科研项目,一个科研项目由多个访视界面组成。根据本发明的一个实施例,所述步骤s3中,清洗科研数据包括以下步骤:s311选择创建的科研项目;s312选择科研项目下的科研病人;s313展现访视界面,访视界面中根据所述元素绑定的唯一标识导入对应的科研病人数据;s314根据元素规则对访视界面所有科研病人数据进行数据校验、逻辑检查;s315针对访视界面中有疑问的数据,发疑问给对应的医生提醒修改以确保科研病人数据的准确性;s316导出清洗后的所有元素对应的科研病人数据,对科研病人数据进行统计分析及利用。另一方面,为了实现上述数据采集,本发明还提供一种应用于临床科研的数据采集系统,包括:元素库维护模块,用于创建元素库,元素库中每个元素具有唯一标识;病历模板编辑模块,用于创建科研病历模板并绑定到元素库中的元素;科研系统,用于从病历数据库中抽取科研数据并清洗,并生成最终的科研数据。另一方面,为了实现上述数据采集,本发明还提供一种应用于临床科研的数据采集系统,包括:元素库,被配置为创建并存储有若干个元素,每个所述元素关联一个唯一标识;科研病历模板,被配置为创建多个填写条目,每个所述填写条目关联一个元素的唯一标识,所述填写条目包括与一个元素对应的条目主题和被配置为能够填入文本内容的填写区域;文本内容输入模块,被配置为获取输入并在所述填写区域生成文本内容;临床数据库,被配置为存储所述科研病历;标注模块,被配置为采集若干个科研病历的同一填写条目中的文本内容,利用实体名词与词性的对照表对文本内容进行分词和标注得到训练语料,根据训练语料获取词性模型,将词性模型与对应的填写条目的唯一标识关联;训练模块,被配置为使用条件随机场算法和特征模板对训练语料进行计算获得分词模型,将分词模型与对应的填写条目的唯一标识关联;科研表单,被配置为创建多个录入条目,所述录入条目包括元素和被配置为能够填入科研数据的录入区域,所述元素对应一个元素并且它们关联相同的唯一标识;限定所述科研数据所对应的词性标注;分词模块,被配置为利用分词模型对一个科研病历中具有相同唯一标识的填写条目的文本内容进行分词得到分词集合;词性获取模块,将所述分词集合输入到具有相同唯一标识的分词模型中得到词性标注集合;录入模块,通过唯一标识得到相应分词集合和词性标注集合,根据所述科研数据所对应的词性标注,将相应的分词作为科研数据填入所述录入区域。根据本发明的一个实施例,所述科研表单还被配置为对科研数据中的分词限定至少一个特征阈值;所述数据采集系统还包括校验模块,被配置为将科研数据中的分词的实际特征值与特征阈值进行比较并给出校验结果。根据本发明的一个实施例,所述科研病历和科研表单按照医院科目的种类进行分类,每种科目下的科研病历中的元素适应其科目需求,每种科目下的科研表单中的元素适应其科目需求。根据本发明的一个实施例,还包括选取模块,被配置为能够在科研病历中新增或者删除填写条目,还被配置为能够在科研表单中新增或删除录入条目。根据本发明的一个实施例,还包括科研访视模块,被配置为综合多个所述科研表单。根据本发明的一个实施例,还包括科研项目模块,被配置为综合多个所述科研访视模块。本发明的有益效果是,这种应用于临床科研的数据采集系统统一化了科研病历和科研表单中包含的元素,是科研表单中的科研数据与科研病历中的文本内容具有统一的数据标准,确保了科研数据的真实性和可溯源性。附图说明下面结合附图和实施例对本发明进一步说明。图1是本发明的一种应用于临床科研的数据采集方法的流程图;图2是本发明的一种应用于临床科研的数据采集系统的实施例的框架图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本发明的应用于临床科研的数据采集方法包括以下步骤:s1基础数据准备:创建具有唯一标识的元素并设定元素规则,创建科研病历模板,设定科研病历模板中的科研项目并将科研项目和元素绑定,然后将科研病历模板发布到基础数据库;s2科研病历数据采集:根据科研项目调用对应的科研病历模板,将科研病人数据填写入科研病历模板中形成科研病历并存储到临床数据库,所述科研病人数据对应绑定到每个具有唯一标识的元素且对应唯一的时间信息;s3清洗科研病历数据:创建科研项目,导入临床数据库中对应的科研病历,然后根据元素规则清洗科研病历数据,清洗之后的科研病历数据保存到科研数据库中。根据本发明的一个实施例,步骤s1中唯一标识的元素的创建方法为每个元素被配置一个唯一对应的编码,该编码可以采用二进制或十进制,例如,创建元素:体温,绑定唯一的编码:000001,在步骤s1中可以维护元素的属性,元素的属性包括数据类型、大小、长度和分类,并且绑定到元素的唯一标识,也就是说元素的属性也会对应到唯一的标识,此外在步骤s1中还会设定元素规则,元素规则用于清洗科研数据,例如体温的元素规则为36-38度。根据本发明的一个实施例,步骤s2中病人就诊医生下诊断后,如果诊断属于科研项目,则调用对应的科研病历模板并填写科研病历,否则写普通病历,在填写科研病历时,由于科研病历模板绑定了具体的元素,因此科研数据也会和元素以及元素的唯一标识对应,同时为了能够准确调用科研数据,科研数据还被配置为对应唯一的时间信息,即每次填写科研病历时都需要输入时间信息。根据本发明的一个实施例,步骤s3中定时从临床数据库中抽取科研病人数据,调取科研病人数据时是根据元素的唯一标识及唯一对应的时间信息进行调用,多个唯一对应的时间信息形成时间戳,通过时间戳可以得到出多个不同时间点下的科研数据,在调用数据时根据时间戳调用所需的科研数据。根据本发明的一个实施例,步骤s3中,创建科研项目包括如下步骤:s301创建模块,在模块维护界面自由勾选之前创建的元素,一个模块由多个元素组成;s302创建访视界面,一个访视界面由多个模块组成;s303创建科研项目,一个科研项目由多个访视界面组成。根据本发明的一个实施例,步骤s3中,清洗科研数据包括以下步骤:s311选择创建的科研项目;s312选择科研项目下的科研病人;s313展现访视界面,访视界面中根据元素绑定的唯一标识以及唯一对应的时间信息导入对应的科研病人数据;s314根据元素规则对访视界面所有科研病人数据进行数据校验、逻辑检查;s315针对访视界面中有疑问的数据,发疑问给对应的医生提醒修改以确保科研病人数据的准确性;s316导出清洗后的所有元素对应的科研病人数据,对科研病人数据进行统计分析及利用。本发明还提供一种应用于临床科研的数据采集系统,包括:元素库维护模块,用于创建元素库,元素库中每个元素具有唯一标识;病历模板编辑模块,用于创建科研病历模板并绑定到元素库中的元素;科研系统,用于从临床数据库中抽取科研数据并清洗,并生成最终的科研数据。如图2所示,本发明提供了一种应用于临床科研的数据采集系统,包括:元素库,被配置为创建并存储有若干个元素,每个元素关联一个唯一标识;元素是指例如体温、症状、用药、肿瘤类型等等。科研病历,被配置为创建多个填写条目,每个填写条目关联一个元素的唯一标识,填写条目包括与一个元素对应的条目主题和被配置为能够填入文本内容的填写区域;例如与元素体温对应的条目主题为体温,文本内容为38℃;与元素症状对应的条目主题为症状,文本内容为发热。文本内容输入模块,被配置为获取输入并在填写区域生成文本内容;医护人工可以通过文本内容输入模块在科研病历的填写区域输入文本内容,填写区域也可以通过此模块直接从其它系统中直接获取文本内容,例如从验血科室直接获得验血结果。临床数据库,被配置为存储科研病历。标注模块,被配置为采集若干个科研病历的同一填写条目中的文本内容,利用实体名词与词性的对照表对文本内容进行分词和标注得到训练语料,根据训练语料获取词性模型,将词性模型与对应的填写条目的唯一标识关联;参见表1可以看出,不同元素所对应的实体名词和词性标注有不同也有相同的地方。训练模块,被配置为使用条件随机场算法和特征模板对训练语料进行计算获得分词模型,将分词模型与对应的填写条目的唯一标识关联;实体名词词性标注举例元素唯一标识数值sz37/36.5/38体温000001单位dw℃体温000001形容词xrc良性、恶性肿瘤类型000005学名xm子宫肌瘤肿瘤类型000005形容词xrc粉碎性、轻度骨折000233部位bw腿部、手部骨折000233表1科研表单,被配置为创建多个录入条目,录入条目包括元素和被配置为能够填入科研数据的录入区域,元素对应一个元素并且它们关联相同的唯一标识;限定科研数据所对应的词性标注;分词模块,被配置为利用分词模型对一个科研病历中具有相同唯一标识的填写条目的文本内容进行分词得到分词集合;词性获取模块,将分词集合输入到具有相同唯一标识的分词模型中得到词性标注集合;录入模块,通过唯一标识得到相应分词集合和词性标注集合,根据科研数据所对应的词性标注,将相应的分词作为科研数据填入录入区域。在其它的一些实施例,科研表单还被配置为对科研数据中的分词限定至少一个特征阈值;例如条目主题为体温,相应的科研数据为45℃,限定体温的一个特征阈值为40℃,那么明显录入的数据有误,那么通过校验模块,为将科研数据中的分词的实际特征值与特征阈值进行比较并给出校验结果,并通知医护人员说明错误情况。根据其它的一些实施例,科研病历和科研表单按照医院科目的种类进行分类,每种科目下的科研病历中的元素适应其科目需求,每种科目下的科研表单中的元素适应其科目需求。例如内科的科研病历中包含的元素一般为内脏名称、症状等等,而骨科的科研病历中包含的元素一般为骨折、骨髓、症状等等。每个科目对应的科研病历和科研表单都配有一个条目库,通过选取模块医护人员能够从条目库中挑选需要的填写条目增加到科研病历中新增,或者从科研病历中删除某些填写条目,通过选取模块也能够在科研表单中新增或删除录入条目。除此以为,系统还包括科研访视模块和科研项目模块,科研访视模块综合了多个科研表单,科研项目综合多个科研访视模块。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1