用于对医疗数据集进行搜索和统计的方法、系统和计算机可读存储介质与流程

文档序号:11386961阅读:210来源:国知局
用于对医疗数据集进行搜索和统计的方法、系统和计算机可读存储介质与流程
本发明涉及医疗数据领域,尤其涉及用于对医疗数据集进行搜索和统计的方法、系统和计算机可读存储介质。
背景技术
:在医学领域,为了进行疾病的诊断、治疗、研究以及个人健康的促进等目的,通常产生大量数据。最初,人们用基于纸的记录方法来记录这些医疗数据。然而,基于纸的记录方法不仅不便保存,而且难以搜索。为了解决基于纸的记录方法的问题,随着计算机的广泛应用,基于纸的医疗数据逐渐被电子医疗数据所取代。医疗数据包括各种类型,例如但不限于:医疗临床数据、临床研究数据(包括临床研究和临床试验等数据)、个人健康数据等。一般而言,电子医疗数据(以下简称医疗数据)用包括一个或多个指标项和相应的指标数据的医疗数据集的形式被存储。所述医疗数据集可以采用各种形式,比如文件和各种类型的通用或专用数据库。以临床研究数据集为例,已经开发出了电子数据采集(edc)系统,通常,电子数据采集系统通常基于电子病例报告表(ecrf),所述电子病历报告表包括与临床研究相关联的电子数据,这些电子数据通常按照指标项和与该指标项相关联的指标数据来定义。然而,一方面,现在的临床研究已经跨度周期也越来越长,内容越来越细化。另一方面,现有的临床研究系统或者是电子数据采集系统仅实现单个临床研究的电子病例报告表的设计、数据录入和病例的搜索和统计,但没有考虑多个临床研究的情况。当多个临床研究之间存在关联关系的情况下,现有系统无法实现不同临床研究之间的病例的搜索和统计。举例而言,在肝病领域,可能存在酒精肝的研究和脂肪肝研究,但往往受试者会同时诊断为患酒精肝同时也患脂肪肝,如果搜索酒精肝研究和脂肪肝研究中诊断为脂肪肝的患者,目前临床研究需要在不同临床研究数据集中单独搜索,无法通过统一入口进行搜索;同时如果统计脂肪肝患者,所使用药物情况,也无法通过统一入口进行统计。特别是,当每个临床研究采用自己的电子记录表格式的情况下,无法进行跨研究的搜索和/或统计。在一个示例中,记录患者诊断情况的指标项在一个研究中被定义为“临床诊断”,而在另一个研究中可能被定义为“诊断结果”。在另一个示例中,性别指标项在一个研究中包括男和女,而在另一个研究中则包括m和f。这种指标项或指标数据在不同临床研究数据集间的差异带来了在多个临床研究中同时进行准确搜索和统计的挑战。此外,当该多个医疗数据集为不同种类的医疗数据集时(比如既包括临床研究数据集,又包括个人健康数据集),问题变得更加严重,因为不同种类的数据集中的数据往往是按照不同格式存储的,这使得跨不同种类的医疗数据集进行准确搜索和统计变得更加困难。现有的通用搜索或者垂直搜索虽然能够基于文本进行医疗数据的搜索,但这种搜索方式不仅效率低,而且搜索结果通常不准确或者不完整,难以达到预想的效果。因此,需要一种能够在多个甚至多种类型的医疗数据集中进行搜索和/或统计(即跨医疗数据集的搜索和统计)的方法和系统。技术实现要素:为了在多个医疗数据集中同时进行搜索和/或统计,本发明提供了用于对医疗数据集进行搜索和统计的方法、系统和计算机可读介质。根据本发明的一个方面,提供一种用于搜索医疗数据集数据的方法,所述方法包括:接收来自用户的客户端计算设备的搜索查询,其中所述搜索查询包括搜索条件,所述搜索条件至少包括指标项和指标条件;在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果;以及将所述搜索结果传送至所述客户端计算设备以呈现给所述用户。根据本发明的另一方面,提供一种用于搜索医疗数据集的方法,所述方法包括:在客户端设备处从用户接收搜索查询,其中所述搜索查询包括搜索条件,所述搜索条件至少包括指标项和指标条件;将所述搜索查询发送至服务器计算设备以在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果;以及从所述服务器计算设备接收所述搜索结果以呈现给用户。根据本发明的另一方面,提供一种用于搜索医疗数据集的系统。所述系统包括:存储器;通信接口;处理器,与所述存储器和通信接口通信地连接,所述处理器操作以:接收来自用户的客户端计算设备的搜索查询,其中所述搜索查询包括搜索条件,所述搜索条件至少包括指标项和指标条件;在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果;以及将所述搜索结果传送至所述客户端计算设备以呈现给所述用户。根据本发明的另一方面,提供一种用于搜索医疗数据集的系统,其特征在于,所述系统包括:存储器;通信接口;处理器,与所述存储器和通信接口通信地连接,所述处理器操作以:在客户端设备处从用户接收搜索查询,其中所述搜索查询包括搜索条件,所述搜索条件至少包括指标项和指标条件;将所述搜索查询发送至服务器计算设备以在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果;以及从所述服务器计算设备接收所述搜索结果以呈现给用户。根据本发明的另一方面,提供一种包括存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被处理器执行时使得所述处理器执行一种如上所述的用于搜索医疗数据集的方法,所述方法包括:接收来自用户的客户端计算设备的搜索查询,其中所述搜索查询包括搜索条件,所述搜索条件至少包括指标项和指标条件;在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果;以及将所述搜索结果传送至所述客户端计算设备以呈现给所述用户。根据本发明的另一方面,提供一种包括存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被处理器执行时使得所述处理器执行一种用于搜索医疗数据集的方法,所述方法包括:在客户端设备处从用户接收搜索查询,其中所述搜索查询包括搜索条件,所述搜索条件至少包括指标项和指标条件;将所述搜索查询发送至服务器计算设备以在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果;以及从所述服务器计算设备接收所述搜索结果以呈现给用户。根据本发明的又一方面,提供一种用于对医疗数据集进行统计的方法,所述方法包括:在多个医疗数据集中进行搜索以获得搜索结果;从用户的客户端计算设备接收统计请求,所述统计请求至少包括分析指标以及统计操作;基于所述统计请求对所述搜索结果进行统计以获得统计结果;以及将所述统计结果传送给客户端计算设备以供呈现给所述用户。根据本发明的又一方面,提供一种用于对医疗数据集进行统计的方法,其特征在于,所述方法包括:将来自用户的搜索请求发送给服务器计算设备以在多个医疗数据集中进行搜索以获得搜索结果;向服务器计算设备发送统计请求,所述统计请求至少包括分析指标以及统计操作;从所述服务器计算设备接收统计结果,所述统计结果是基于所述统计请求对所述搜索结果进行统计得到的;以及将所述统计结果呈现给所述用户。根据本发明的又一方面,提供一种用于对医疗数据集进行统计的系统,其特征在于,所述系统包括:存储器;通信接口;处理器,与所述存储器和通信接口通信地连接,所述处理器操作以:在多个医疗数据集中进行搜索以获得搜索结果;从用户的客户端计算设备接收统计请求,所述统计请求至少包括分析指标以及统计操作;基于所述统计请求对所述搜索结果进行统计以获得统计结果;以及将所述统计结果传送给客户端计算设备以供呈现给所述用户。根据本发明的又一方面,提供一种用于对医疗数据集进行统计的系统,其特征在于,所述系统包括:存储器;通信接口;处理器,与所述存储器和通信接口通信地连接,所述处理器操作以:将来自用户的搜索请求发送给服务器计算设备以在多个医疗数据集中进行搜索以获得搜索结果;向服务器计算设备发送统计请求,所述统计请求至少包括分析指标以及统计操作;从所述服务器计算设备接收统计结果,所述统计结果是基于所述统计请求对所述搜索结果进行统计得到的;以及将所述统计结果呈现给所述用户。根据本发明的又一方面,提供一种存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被处理器执行时使得所述处理器执行一种用于搜索临床研究数据的方法,其特征在于,所述方法包括:在多个医疗数据集中进行搜索以获得搜索结果;从用户的客户端计算设备接收统计请求,所述统计请求至少包括分析指标以及统计操作;基于所述统计请求对所述搜索结果进行统计以获得统计结果;以及将所述统计结果传送给客户端计算设备以供呈现给所述用户。根据本发明的又一方面,提供一种存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被处理器执行时使得所述处理器执行一种用于搜索临床研究数据的方法,其特征在于,所述方法包括:将来自用户的搜索请求发送给服务器计算设备以在多个医疗数据集中进行搜索以获得搜索结果;向服务器计算设备发送统计请求,所述统计请求至少包括分析指标以及统计操作;从所述服务器计算设备接收统计结果,所述统计结果是基于所述统计请求对所述搜索结果进行统计得到的;以及将所述统计结果呈现给所述用户。通过上述技术方案,本发明能够在多个医疗数据集甚至多种类型的医疗数据集中进行搜索和/或统计(即跨医疗数据集的搜索和统计),同时确保搜索和/或统计的准确性和完整性。本
发明内容不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。附图说明为了描述能够获得上述和其它优点和特征的方式,各实施例的更具体的描述将通过参考各附图来呈现。可以理解,这些附图只描绘了示例实施例,并且因此不被认为是对其范围的限制,将通过使用附图并利用附加特征和细节来描述和解释各实施例,在附图中:图1示出了可以在其中实现本发明的各实施例的示例性的计算设备。图2示出了可以在其中实现本发明的各实施例的示例性的计算环境。图3示出了根据本发明的一实施例的用于确定搜索范围的图形用户界面。图4示出了根据本发明的一实施例的根据本发明的一实施例的用于确定搜索条件的图形用户界面的一个示例。图5示出了根据本发明的一实施例的用于确定搜索条件的图形用户界面的另一示例。图6示出了根据本发明的一实施例的从服务器计算设备角度的用于对多个医疗数据集进行搜索的方法的流程图。图7示出了根据本发明的一实施例的从客户端计算设备角度的用于对多个医疗数据集进行搜索的方法的流程图。图8示出了根据本发明的一实施例的用于接收分析指标的图形用户界面的一个示例。图9示出了根据本发明的一实施例的用于接收要执行的统计操作的图形用户界面的一个示例。图10示出了根据本发明的一个实施例的用于接收分析区间的图形用户界面的一个示例。图11示出了根据本发明的一个实施例的用于显示统计结果的图形用户界面的一个示例。图12示出了根据本发明的一实施例的从服务器计算设备角度的用于对多个医疗数据集进行统计的方法的流程图。图13示出了根据本发明的一实施例的从客户端计算设备角度的用于对多个医疗数据集进行统计的方法的流程图。具体实施方式根据本发明的各实施例,公开了通过统一的界面对多个医疗数据集进行搜索和/或统计的方法和系统。在下文中,一些讨论是以临床研究数据集为医疗数据集的示例的。但应理解,医疗数据集可以是除临床研究数据集以外的各种医疗数据集,包括但不限于医疗临床数据集、临床试验数据集、个人健康数据集等。在下文中,首先参考图1-2描述可以在其中实现本发明的各实施例的示例性的计算设备和计算环境,然后参考图3-7来描述根据本发明的实施例的用于对多个医疗数据集进行搜索的方法,然后参考图8-13来描述根据本发明的实施例的用于对多个医疗数据集进行统计的方法。参考图1,其示出了可以在其中实现本发明的各实施例的示例性的计算设备100。计算设备现在越来越多地采取多种多样的形式。例如,计算设备可以是手持式设备、电器、膝上型计算机、台式计算机、大型机、分布式计算设备或甚至常规上不被认为是计算设备的设备。在本说明书以及权利要求书中,术语“计算设备”被广义地定义为包括任何设备或系统(或其组合),该设备或系统包含至少一个物理有形的处理器以及其上能含有可由处理器执行的计算机可执行指令的物理有形的存储器。存储器可以采取任何形式,并可以取决于计算设备的性质和形式。计算设备可以分布在网络环境中,并可包括多个组分计算设备。如图1所示,在其最基本的配置中,计算设备100通常包括至少一个处理单元102和存储器104。存储器104可以是物理系统存储器,该物理系统存储器可以是易失性存储器、非易失性存储器、或两者的某种组合。术语“存储器”在此也可用来指诸如物理存储介质等非易失性大容量存储。如果计算设备是分布式的,则处理、存储器和/或存储能力也可以是分布式的。如此处所使用的那样,术语“模块”或“组件”可以指在计算设备上执行的软件对象或例程。此处所描述的不同组件、模块、引擎,以及服务可以实现为在计算设备上执行的对象或进程(例如,作为分开的线程)。在随后的描述中,参考由一个或多个计算设备执行的动作描述了各实施例。如果这样的动作是以软件实现的,则执行动作的相关联计算设备的一个或多个处理器响应于已经执行了计算机可执行指令来引导计算设备的操作。这样的操作的示例涉及对数据的操纵。计算机可执行指令(以及被操纵的数据)可被存储在计算设备100的存储器104中。计算设备100还可包含允许计算设备100例如通过网络与其他设备通信的通信接口110。在一个示例中,可选地,计算设备100还可包括输入设备106。输入设备106可以是能够用于向计算设备输入信息的任何设备。输入设备106的示例包括但不限于:键盘、鼠标、指示笔、语音输入设备(比如话筒)、触摸输入设备(比如触摸屏)等。输入设备的另一示例包括用于捕捉用户姿势的摄像头等。在一个示例中,可选地,计算设备100还可包括输出设备108。输出设备108可以是可向用户输出信息的任何设备。输出设备108的示例包括但不限于显示器、扬声器等。尽管图中未示出,但应理解,在各实施例中,处理器102、存储器104、输入设备106、输出设备108和通信接口110中的一者或多者之间可以相互通信,诸如经由通用穿行总线等。需要注意的是,这里描述的各实施例可包括或利用专用或通用计算机,该专用或通用计算机包括诸如例如一个或多个处理器和系统存储器等计算机硬件,如以下更详细讨论的。这里描述的各实施例还包括用于承载或存储计算机可执行指令和/或数据结构的物理和其他计算机可读介质。这样的计算机可读介质可以是可由通用或专用计算机系统访问的任何可用介质。存储计算机可执行指令的计算机可读介质是物理存储介质。承载计算机可执行指令的计算机可读介质是传输介质。由此,作为示例而非限制,本发明的各实施例可包括至少两种显著不同的计算机可读介质:计算机存储介质和传输介质。计算机存储介质包括ram、rom、eeprom、cd-rom或其他光盘存储、磁盘存储或其他磁存储设备、或可用于存储计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的任何其他介质。参考图2,其示出了本发明可以在其中实现的计算环境200的一个实施例。在一个实施例中,计算环境200包括客户端计算设备202和服务器计算设备204,其中客户端计算设备202和服务器计算设备204可以通过网络(例如因特网)进行通信。“网络”被定义为使得电子数据能够在计算机系统和/或模块和/或其它电子设备之间传输的一个或多个数据链路。当信息通过网络或另一个通信连接(硬连线、无线、或者硬连线或无线的组合)传输或提供给计算机时,该计算机将该连接适当地视为传输介质。传输介质可包括可用于携带计算机可执行指令或数据结构形式的所需程序代码装置且可由通用或专用计算机访问的网络和/或数据链路。上述的组合也应被包括在计算机可读介质的范围内。此外,在到达各种计算机系统组件之后,计算机可执行指令或数据结构形式的程序代码装置可从传输介质自动转移到计算机存储介质(或者相反)。例如,通过网络或数据链路接收到的计算机可执行指令或数据结构可被缓存在网络接口模块(例如,“nic”)内的ram中,然后最终被传输到计算机系统ram和/或计算机系统处的较不易失性的计算机存储介质。因而,应当理解,计算机存储介质可被包括在还利用(或甚至主要利用)传输介质的计算机系统组件中。计算机可执行指令例如包括,当在处理器处执行时使通用计算机、专用计算机、或专用处理设备执行某一功能或某组功能的指令和数据。计算机可执行指令可以是例如二进制代码、诸如汇编语言之类的中间格式指令、或甚至源代码。尽管用结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述特征或动作。更具体而言,上述特征和动作是作为实现权利要求的示例形式而公开的。本领域的技术人员将理解,本发明可以在具有许多类型的计算机系统配置的网络计算环境中实践,这些计算机系统配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式设备、多处理器系统、基于微处理器的或可编程消费电子设备、网络pc、小型计算机、大型计算机、移动电话、pda、寻呼机、路由器、交换机等等。本发明也可在其中通过网络链接(或者通过硬连线数据链路、无线数据链路,或者通过硬连线和无线数据链路的组合)的本地和远程计算机系统两者都执行任务的分布式系统环境中实施。在分布式系统环境中,程序模块可以位于本地和远程存储器存储设备两者中。需要注意,尽管在附图中将客户端计算设备和服务器计算设备示出为不同的计算设备,但在一些实施例中,客户端计算设备和服务器计算设备可以是同一计算设备。在一个实施例中,客户端计算设备202可用于接收来自用户的输入以及向用户提供输出。在一个示例中,客户端计算设备202可向用户提供图形用户界面,以供用户通过该图形用户界面提供对搜索请求或统计请求的输入。客户端计算设备202在接收到用户的搜索查询或统计请求之后,可将该搜索查询或统计请求发送给服务器计算设备204。该客户端计算设备202还可从服务器计算设备接收搜索结果或统计结果,以便呈现给用户。所述搜索结果或统计结果可按各种方式实现,比如经由图形用户界面,经由语音输出等。客户端计算设备202接收搜索请求/统计请求、传送搜索请求/统计请求以及呈现搜索结果/统计结果的方式在下文中更详细地描述。在一个实施例中,服务器计算设备204可包括存储于其存储器中的医疗数据集数据库。所述医疗数据集数据库中包括多个医疗数据集数据。所述医疗数据集数据例如可以是电子病历表的形式。所述医疗数据集数据库可以采用现有技术中已知的各种类型的数据库,包括但不限于:1.传统的关系型数据库(oracle\sqlserver\mysql\postgresql等);2.非关系型数据库(mongodb\hive\hbase等);3.内存数据(redis\memcahed等);4.高性能数据挖掘框架(spark/hadoop等)。在一些实施例中,优选地,所述医疗数据集采用统一格式,所述统一格式可以是一种标准格式。例如,所述医疗数据集可采用根据cdisc(clinicaldatainterchangestandardconsortium临床数据交换标准协会)标准定义的格式。例如,一个医疗数据集的指标项可以是cdisc标准的全部指标项的子集。符合cdisc标准的一个医疗数据集的部分指标项的示例如下:指标名称指标含义lbres_a1谷丙转氨酶(alt)lbres_a5胆汁酸lbdat检查日期lbres_b1肌酐lbcat分类而在其它实施例中,所述医疗数据集可以是不符合cdisc标准的定制格式。比如,与上面的示例相对应的不符合cdisc标准的医疗数据集的部分指标项的示例如下:指标名称指标含义gbzam谷丙转氨酶(alt)dzs胆汁酸jcrq检查日期jg肌酐fl分类需要注意,以上仅是定制格式的一个示例,所述医疗数据集可采用各种其它定制格式。除了指标名称外,指标数据也可以是符合cdisc标准的格式,也可以是定制格式。例如,在一个医疗数据集中,检查日期数据项可采用“月-日-年”的格式,而在另一医疗数据集中,检查日期数据项可采用“日-月-年”的格式。又例如,在一个医疗数据集中,肌酐数据项采用mg/dl为单位,而在另一医疗数据集中,肌酐数据项采用umol/l为单位。为便于描述,以临床研究数据集为例,下面示出了医疗数据集的几个具体示例。例如,对于icu病人营养实施状况断面调查临床研究,临床研究数据集可以包括:性别,c反应蛋白,淋巴细胞百分比,白蛋白,随机血糖,动脉血乳酸,血清钠,血清钾,血细胞比积,白细胞计数,血浆,血清等。在另一个示例中,对于中国大陆药物性肝损伤多中心、前瞻、非干预性队列研究,临床研究数据集可以包括:性别,谷丙转氨酶(alt),谷草转氨酶(ast),ast/alt比值,碱性磷酸酶(alp),谷氨酰转肽酶(ggt),总胆红素(tbil),直接胆红素(dbil),胆汁酸,白蛋白(alb),总蛋白(tp),γ-球蛋白,肌酐(scr),尿素氮(bun),空腹血糖,甘油三酯(tg),胆固醇(tc),低密度脂蛋白(ldh),高密度脂蛋白(hdh),白细胞计数,血浆,血清等。在另一个示例中,对于中国大陆医院住院患者药物性肝损伤发生及治疗现况的回顾性流行病学研究,临床研究数据集可以包括:性别,谷丙转氨酶(alt),谷草转氨酶(ast),谷氨酰转肽酶(ggt),碱性磷酸酶(akp),胆汁酸,总胆红素(tbil),直接胆红素(dbil),总蛋白(tp),白蛋白(alb),血清肌酐(scr),血清尿素氮(bun),血糖检查,空腹血糖,凝血酶原标准化比值,肿瘤标志物,甲胎蛋白,血浆,血清等。需要指出,上面的示例仅是说明性的,不应当认为是限制。从上面的示例可以看出,不同的临床研究数据集在所包含的指标项的数量、指标名称和指标数据方面可能有所不同。这在跨临床研究进行搜索时带来了困难。此外,以上仅是临床研究数据集的示例。在要搜索的医疗数据集还包括其它类型的数据集(比如医疗临床数据集、个人健康数据集等)的情况下,不同类型的数据集之间的数据格式之间的差异可能更大。这使得在跨不同类型的医疗数据进行搜索时具有更多的困难。所述医疗数据集中的医疗数据可以是由相关研究人员输入的。在这种情况下,优选地,提示用户按照标准(比如cdisc标准)输入医疗数据。在替代方案中,医疗数据为现有医疗数据,或者是从现有医疗数据转换来的。在这种情况下,医疗数据可以是不符合cdisc标准的定制格式,如同上面所描述的。服务器计算设备204可接收来自客户端计算设备202的搜索请求或统计请求。服务器计算设备204在接收到搜索请求或统计请求之后,可进行搜索操作或统计操作。搜索操作或统计操作的示例在下文更详细地描述。在传统的医疗数据处理中,通常仅能够对单个医疗数据集(比如单个临床研究数据集)进行搜索,且这种搜索经常需要用户对该医疗数据集的数据结构的专业知识。然而,现有技术中缺少在不知晓特定医疗数据集的具体数据结构的情况下对医疗数据集进行准确搜索和/或统计的解决方案。此外,不同的医疗数据集可能具有不同的数据格式和数据结构,这使得跨多个医疗数据集执行搜索和/或统计操作具有困难。而且,在该多个医疗数据集包括不同种类的医疗数据集(比如包括医疗临床数据集、临床研究数据集和个人健康数据集中的两个或更多个)的情况下,问题变得更加严重,这是因为多种类型的医疗数据集在数据格式和数据结构方面通常具有显著的差异,而很少有人具有关于这些不同的医疗数据集的具体知识。为了解决上述问题,本发明提供了一种方法、系统和计算机存储介质,以实现跨多个医疗数据集的搜索/统计操作,以便获得准确的搜索/统计结果。下面,以临床研究数据集作为医疗数据集的示例,对上述方法、系统和计算机存储介质进行详细描述。需要指出的是,本发明不限于临床研究数据集,而是可以应用于各种医疗数据集,包括医疗临床数据集、临床研究数据集、个人健康数据集以及其它医疗数据集中的一者或多者或其各种组合。参看图3,其示出了根据本发明的一实施例的用于确定搜索范围的图形用户界面。在一个可选步骤中,用户可通过客户端计算设备202选择搜索范围。该搜索范围可包括一个或多个医疗数据集。优选地,该搜索范围包括一个或多个(优选为多个)医疗数据集。如图所示,客户端计算设备例如可显示各医疗数据集。在一个示例中,所述医疗数据集例如可来自服务器计算设备的数据库。用户可通过本领域中已知的各种方式来选择一个或多个医疗数据集,比如通过选中一个或多个复选框,以作为要在其中进行搜索的医疗数据集。需要指出的是,上述可选步骤并不是必需的。比如,可以默认将服务器计算设备中所存储的所有医疗数据集均包括在搜索范围中,以便用户可以在所有医疗数据集中进行搜索操作。又比如,用户可以设置默认搜索范围,比如从事某几项临床研究的用户可将特定的几个临床研究数据集设置为默认搜索范围。在下次执行搜索时,可直接针对默认搜索范围进行搜索。在用户选择一个或多个医疗数据集作为搜索范围之后,优选地,在一个可选步骤中,可以根据用户所选择的医疗数据集来对标准树中的指标项进行过滤和/或合并,所述过滤或合并的结果可以在后续步骤中用于用户对搜索条件的选择。例如,用户选择了“icu病人营养实施状况断面调查临床研究”,“对于中国大陆药物性肝损伤多中心、前瞻、非干预性队列研究”和“中国大陆医院住院患者药物性肝损伤发生及治疗现况的回顾性流行病学研究”三个临床研究数据集。这些临床研究数据集的具体指标项如同上面所举的示例。这三个临床研究数据集一起包括以下指标项:c反应蛋白,淋巴细胞百分比,白蛋白,随机血糖,动脉血乳酸,血清钠,血清钾,血浆,血清,血细胞比积,白细胞计数,谷丙转氨酶(alt),谷草转氨酶(ast),ast/alt比值,碱性磷酸酶(alp),谷氨酰转肽酶(ggt),总胆红素(tbil),直接胆红素(dbil),胆汁酸,白蛋白(alb),总蛋白(tp),γ-球蛋白,肌酐(scr),尿素氮(bun),空腹血糖,甘油三酯(tg),胆固醇(tc),低密度脂蛋白(ldh),高密度脂蛋白(hdh),肿瘤标志物,甲胎蛋白,碱性磷酸酶(akp),血清肌酐(scr),血糖检查,空腹血糖,凝血酶原标准化比值,肿瘤标志物,甲胎蛋白,抗线粒体抗体(ama),抗平滑肌抗体(sma),hiv抗体等。对三个临床研究数据集中都包括的指标项进行合并之后,经修改的标准树包括以下指标项:c反应蛋白,淋巴细胞百分比,白蛋白,随机血糖,动脉血乳酸,血清钠,血清钾,血细胞比积,白细胞计数,谷丙转氨酶(alt),谷草转氨酶(ast),ast/alt比值,碱性磷酸酶(alp),谷氨酰转肽酶(ggt),总胆红素(tbil),直接胆红素(dbil),胆汁酸,白蛋白(alb),总蛋白(tp),γ-球蛋白,肌酐(scr),尿素氮(bun),空腹血糖,甘油三酯(tg),胆固醇(tc),低密度脂蛋白(ldh),高密度脂蛋白(hdh),肿瘤标志物,甲胎蛋白,碱性磷酸酶(akp),血清肌酐(scr),血糖检查,空腹血糖,凝血酶原标准化比值,肿瘤标志物,甲胎蛋白。3个研究中没有的指标项(即:抗线粒体抗体(ama),抗平滑肌抗体(sma),hiv抗体)被过滤掉。所述指标项的合并和/或过滤操作也可以按照与上面的示例不同的其它方式来进行。经过上述合并和/或过滤操作,可以得到经修改的标准树。需要指出的是,在与所选择的医疗数据集相对应的医疗数据树不与标准树相一致的情况下,可以在该医疗数据树中的指标项和该标准树中的指标项之间进行映射,以便可以对指标项进行合并。例如,表示检查日期的指标项在一个医疗数据集中的指标项名称可以为“jcrq”,而在标准树中对应的指标项名称为“lbdat”,此时可在“jcrq”指标项和“lbdat”指标项之间建立映射,从而能够实现上述合并和/或过滤操作。参考图4,其示出了根据本发明的一实施例的用于确定搜索条件的图形用户界面的一个示例。例如,用户可通过点击该图形用户界面上的按钮来添加搜索条件。例如,可通过点击图4中的“添加搜索条件”按钮来添加搜索条件。参考图5,其示出了根据本发明的一实施例的用于确定搜索条件的图形用户界面的另一示例。例如,在用户选择添加搜索条件之后(例如通过点击图4中的按钮),可向用户显示一个或多个指标项,以供用户从中进行选择。在一个示例中,所述一个或多个指标项可来自标准树。优选地,所述一个或多个指标项可来自包括经过滤和/或合并的指标的经修改的标准树,诸如上面参考图3所述的。如图5所示,在左侧显示了经修改的标准树,该经修改的标准树与用户所选择的要在其中进行搜索的医疗研究相关联。例如,在图5中左侧所显示的标准树中,可以仅显示与用户所选择的医疗研究中的指标相对应的标准指标项。在本发明中,应用了标准树的概念。标准树是指一种树形的数据结构(其表示可以参考图5中间部分左侧的树形结构),作为用来表示医疗数据集的模板。在一些示例中,所述标准树是按照cdisc标准或其子集来定义的。在这些示例中,所述标准树的各指标项是从cdisc标准中定义的指标项中选择的。在另一些示例中,所述标准树是按照不同于cdisc标准的另一种标准来定义的。而在又一些示例中,所述标准树是由用户(诸如系统设计人员)按照需要定义的。在所述标准树中,可存在多个节点,其中可包括一个根节点。所述根节点(例如图5中的“指标分类”)可包括一个或多个一级叶节点(例如图5中的“基本信息”、“临床诊断”等等),而每个一级叶节点(例如图5中的“临床诊断”)可包括一个或多个二级叶节点(例如图5中的“临床诊断变化”)。每个节点中可包括一个或多个数据项(例如,图5中的“临床诊断”二级子节点)可包括“诊断名称”、“rucam评分”等数据项。需要指出的是,为便于理解,指标项可被显示为对应的中文名称,比如“lbdat”可被显示为“检查日期”等等。随后,用户可以选择所显示的一个或多个指标项。例如,如图5所示,用户可选择“临床诊断”中的“rucam评分”指标项。随后,用户可针对该指标项输入指标条件。例如,在选择rucam评分指标项之后,用户可选择“rucam评分大于20”这一指标条件。在一个示例中,用户可针对一指标项选择多个指标条件,例如,“rucam评分大于20”或“rucam评分小于5”。用户可以按照这种方式添加一个或多个指标项以及指标条件,以构成搜索条件。需要指出的是,尽管图4-5示出了通过特定方式来选择确定搜索条件,但这仅作为示例而非限制。用户可以采用本领域中已知的任何技术来确定搜索条件,比如通过手动输入搜索条件的表达式等,这些均落入本发明的范围。然而,可以看出,通过提供基于标准树的树形用户界面以供用户选择指标项,使得用户在无需知晓各医疗数据集的具体知识的情况下,能够选择相应的指标项进行搜索,从而提高了系统的可用性。在确定搜索条件(以及在一些示例中还包括搜索范围)之后,所述搜索条件(和/或搜索范围)可作为搜索查询被从客户端计算设备202例如经由网络传送至服务器计算设备204。所述搜索查询可采用各种形式,包括但不限于:a)http的form请求;b)http的xml请求;c)http的json请求;d)http的自定义报文格式;e)tcp的form请求;f)tcp的xml请求;g)tcp的json请求;h)tcp的自定义报文格式。此外,对搜索查询的传送可以采用各种传输技术,包括但不限于:tcp/http/https等协议。在一些实施例中,所述传输可以采用加密传输技术。在一个实施例中,优选地,服务器计算设备接收到来自用户设备的搜索查询之后,可以对所选择的指标条件进行补充处理。在一个示例中,所述补充处理包括所选择的指标条件进行转义。所述转义使得所述指标条件能够用于在搜索范围中的各个医疗数据集中进行搜索。在一个示例中,所述转义可包括将所述搜索条件中的指标项映射到相应医疗数据集中适用的指标项。例如,“lbdat”指标项可被映射到“jcrq”指标项。在一个示例中,所述转义还可包括将搜索条件中的指标条件转换为相应医疗数据集中适用的指标条件。具体请参看一下示例。继续以上示例,假设用户选择了“icu病人营养实施状况断面调查临床研究”(下称“研究一”),“对于中国大陆药物性肝损伤多中心、前瞻、非干预性队列研究”(下称“研究二”)和“中国大陆医院住院患者药物性肝损伤发生及治疗现况的回顾性流行病学研究”(下称“研究三”)三个临床研究数据集作为搜索范围。而且,用户选择了以下搜索条件:“性别为男并且谷丙转氨酶(alt)大于100(单位u/l)并且血清>6(mmol/l)”。此时,服务器计算设备204可对上述搜索条件进行转义。转义过程的一个示例如下。假设存在以下情形:在标准树中,性别定义为男/女。研究一中性别定义为男/女,在研究二中性别定义为男性/女性,在研究三中性别定义为f/m;在标准树中,谷丙转氨酶(alt)的单位为u/l。研究一没有使用该指标,研究二中使用单位u/l,研究三中使用单位u/l;以及在标准树中,血清的单位为mmol/l。研究一中使用单位mmol/l,研究二中使用单位mmol/l,研究三中使用单位mg/dl。为了在上述三个医疗数据集中进行搜索,上述搜索条件分别被转义为以下搜索条件:在研究一中该搜索条件被转换为“性别为男并且谷丙转氨酶(alt)大于100(u/l)并且血清>6(mmol/l)”。在研究二中该搜索条件被转换为“性别为男性并且谷丙转氨酶(alt)大于100(u/l)并且血清>6(mmol/l)”。上述转换是基于mmol/l和mg/dl的转换规则:1mmol/l=18mg/dl。在研究三中该搜索条件被转换为“性别为f并且谷丙转氨酶(alt)大于100(u/l)并且血清>6*18(mg/dl)”。经过上述转换,可以实现在以上三个医疗数据集中的搜索,从而实现了跨多个医疗数据集的搜索。需要理解,上面对搜索范围的补充处理以及对所选择的指标条件的补充处理可以在服务器计算设备204处进行,也可以在客户端计算设备202处进行。随后,可根据用户所选择的搜索条件在用户所选择的一个或多个医疗数据集中进行搜索。所述搜索可采用本领域已知的各种搜索技术,包括但不限于:1.sql语言(包含各种数据库支持的sql语言和各种数据库支持的特殊的sql语言);2.各种技术框架和数据库支持的map/reduce技术;3.各种技术框架和数据库支持的aggregate技术;4.各种技术框架和数据库支持的查找serach/find技术;5.各种技术框架和数据库支持的数据过滤(filter)技术。具体使用的搜索技术可至少部分取决于所使用的数据库的类型。在一个示例中,对于不同的医疗数据集,可使用不同的搜索技术。可选地,服务器计算设备进行搜索之后,可以对搜索结果进行处理。所述处理可包括将搜索结果进行标准化。在一个示例中,所述标准化可以指代基于标准树将所述搜索结果进行标准化。以下示出对搜索结果进行标准化的示例。继续以上的搜索过程的示例,假设该搜索过程获得以下搜索结果:1.研究一没有数据返回;2.研究二返回的数据中性别为男性,谷丙转氨酶(alt)单位为u/l,血清的单位为mmog/l;3.研究三返回的数据中性别为f,谷丙转氨酶(alt)单位为u/l,血清的单位为mmog/l。此时,可对搜索结果执行以下标准化过程:研究二的数据根据转换关系性别男性转换为男,谷丙转氨酶(alt)和血清保持不变。研究三的数据根据转换关系性别f转换为男,谷丙转氨酶(alt)保持不变,而血清根据1mmol/l=18mg/dl需要除以18转换单位为mmol/l。在经过上述处理之后,可例如对搜索结果进行合并。在一个示例中,可以按照时间顺序将搜索结果中的各条病历进行显示。在另一个示例中,可以逐个研究地将搜索结果中的各条病历进行显示。接下来,服务器计算设备可将搜索结果传送至客户端计算设备。所述搜索结果的传送可按照各种格式进行,包括但不限于:a)http的json格式;b)http的xml格式;c)http的自定义格式;d)http的文件格式;e)ftp的文件格式;f)tcp的json格式;g)tcp的xml格式;h)tcp的自定义格式;i)tcp的文件格式;j)ftp的文件格式。对搜索结果的传送可以采用各种传输技术,包括但不限于:http/https/tcp/ftp等协议。类似地,搜索结果的传送可以采用加密传输技术。接下来,可在客户端计算设备上,例如客户端计算设备的显示器上,显示搜索结果。所述搜索结果可以采用各种格式,诸如但不限于:html/pdf/word/excel/png/jpeg/svg/text等。参考附图5,其示出了显示对多个医疗数据集的搜索结果的界面。需要指出的是,虽然图5示出了显示搜索结果的特定用户界面,但是搜索结果的呈现可采用本领域技术人员所知的用于呈现信息的任何手段,其均在本发明的范围内。可选地,用户可以将搜索结果导出并保存。所述搜索结果可以按照各种方式被导出并保存,包括但不限于:html/pdf/word/excel/png/jpeg/svg/text等格式。优选地,可允许用户将搜索查询(搜索范围和搜索条件)保存为自定义搜索条件。通过将搜索查询保存为自定义的搜索条件,当用户之后期望进行相同搜索时,可直接选择该自定义的搜索条件来进行搜索。参考图6,其中示出了根据本发明的一实施例的从服务器计算设备角度的用于对多个医疗数据集进行搜索的方法600的流程图。该方法600包括,在步骤602,接收来自用户的客户端计算设备的搜索查询。所述搜索查询可包括搜索条件,所述搜索条件可至少包括指标项和指标条件。优选地,所述搜索查询还包括搜索范围,其中所述搜索范围标识要在其中进行搜索的所述多个临床研究医疗数据集。在一些示例中,所述多个医疗数据集是由用户通过呈现在所述客户端计算设备上的图形用户界面选择的。如上所述,在用户选择医疗数据集之后,可根据用户所选择的所述多个医疗数据集将标准树中的指标进行过滤和/或合并。接下来,将标准树(或经过指标过滤和/或合并之后的经修改的标准树)显示在客户端计算设备上,以供用户从中选择在所述搜索条件中包括的所述指标项,以便由客户端计算设备传送到服务器计算设备。在一些实施例中,在进行搜索之前,可先对所述搜索查询进行转义。所述转义可包括将所述搜索条件中的指标项映射到所述至少一个医疗数据集中适用的指标项,如同上文所描述的。所述转义还可包括将所述搜索条件中的指标条件转换为所述至少一个医疗数据集中适用的指标条件,如同上文所描述的。该方法600还包括,在步骤604,在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果。如上所述,所述搜索可采用各种搜索技术。在一些实施例中,在对搜索范围内的每个医疗数据集进行搜索以获得搜索针对该医疗数据集的搜索结果之后,将针对这些医疗数据集的搜索结果进行处理。所述处理可包括将所述多个医疗数据集中的搜索结果进行标准化。所述处理还可包括将经标准化的搜索结果进行合并以形成所述搜索结果。所述处理还可包括其它处理,如同上文所描述的。该方法600还包括,在步骤606,将所述搜索结果传送至所述客户端计算设备以呈现给所述用户。如上所述,所述呈现可采用本领域技术人员已知的各种方式。参考图7,其中示出了根据本发明的一实施例的从客户端计算设备角度的用于对多个医疗数据集进行搜索的方法700的流程图。该方法700包括:在步骤702,在客户端设备处从用户接收搜索查询。所述搜索查询可包括搜索条件,所述搜索条件可至少包括指标项和指标条件。该方法700还包括,在步骤704,将所述搜索查询发送至服务器计算设备以在多个医疗数据集中对所述搜索条件进行搜索以获得搜索结果。该方法700还包括,在步骤706,从所述服务器计算设备接收所述搜索结果以呈现给用户。需要指出的是,上面参考方法600描述的一些特征,同样适用于方法700的各步骤。比如,所述搜索查询还包括搜索范围,其中所述搜索范围标识要在其中进行搜索的所述多个医疗数据集,等等。除了进行跨医疗数据集的搜索之外,本发明还提供了用于进行跨医疗数据集的统计的方法、系统以及计算机可读介质。下面结合图8-13对用于对医疗数据集进行统计的方法、系统和计算机可读介质进行描述。为进行跨医疗数据集的统计,首先可从用户接收统计查询。可选地,所述统计查询可包括搜索范围。也就是说,可首先从用户接收搜索范围。所述搜索范围可包括一个或多个(优选为多个)医疗数据集。请参考图3,用户可利用与图3中的用于确定搜索范围的图形用户界面类似的图形用户界面来输入搜索范围。该过程与上面描述的搜索方法中用于从用户接收搜索范围的过程类似,在此不再赘述。接着,可选地,可通过客户端计算设备从用户接收搜索条件。上面参考图4-5所述的用于从用户接收搜索条件的描述同样适用于统计操作。接下来,参考图8,可通过客户端计算设备202从用户接收一个或多个分析指标。所述分析指标指示用户想要针对该指标进行统计分析的指标项,比如患者的性别、年龄等。与上面针对搜索所描述的类似,可向用户呈现标准树或经过滤/合并的标准树,以供用户从中选择分析指标。如果需要,可以对指标项和/或指标数据进行转义和/或映射操作,如同上面针对搜索过程所述的。参考图9,图9示出了根据本发明的一实施例的用于接收要执行的统计操作的图形用户界面的一个示例。如图所示,可通过客户端计算设备上显示的该图形用户界面从用户接收要针对所选择的分析指标执行的统计操作(图9中示为分析目的)。所述统计操作包括对搜索结果中的分析指标的指标数据进行计数、求和、求平均值、求方差、求协方差、求中值、求众值、求中距、以及求频次百分比等。所述统计操作还可包括本领域已知的其它统计操作。在进行统计操作之前,如果有必要,可对上述分析指标的指标数据进行标准化操作。标准化操作的示例可以参考上面针对搜索过程所描述的标准化过程。参考图10,图10示出了根据本发明的一实施例的可选的用于接收分析区间的图形用户界面的一个示例。可选地,可通过客户端计算设备从用户接收针对所选择的分析指标的分析区间,比如设置年龄范围为10岁-20岁,20-30岁等等。如果需要,可以对所述分析区间进行转义和/或映射操作以及标准化操作,如同上面针对搜索过程所述的。随后,将所述分析指标、统计操作(以及可选的分析区间)作为统计请求发送给服务器计算设备204。服务器计算设备在接收到统计请求之后,如果需要,可由所述服务器计算设备对所述分析指标和/或所述分析区间等执行预处理。所述预处理例如可包括上面针对搜索过程所述的转义/映射操作等。接下来,服务器计算设备可根据所述分析指标、所述统计操作、以及可选的所述分析区间对搜索结果执行所述统计操作以获得搜索结果。如上所述,所述统计操作可包括但不限于对所述搜索结果中的分析指标的指标数据进行以下的一者或多者:计数、求和、求平均值、求方差、求协方差、求中值、求众值、求中距、以及求频次百分比。优选地,如有必要,可将在多个医疗数据集中的统计结果进行标准化和/或合并以得到所述统计结果。标准化和/或合并的过程可参考上面针对搜索过程进行的描述。所述统计操作还可包括生成各种格式的统计图表,诸如但不限于饼图/柱状图/折线图/表格等。所述统计图表可以采用2d或者3d的形式。随后,统计结果可被返回给客户端计算设备以供呈现给用户。统计结果的传送可以采用各种传输技术,包括但不限于http/https/tcp/ftp等协议。类似地,统计结果的传送可以采用加密传输技术。在一个优选实施例中,可将所述统计请求保存为自定义统计条件,以供用户在稍后通过所述自定义统计条件执行统计。参考图11,图11示出了根据本发明的一个实施例的用于显示统计结果的图形用户界面的一个示例。如图中所示,可以以本领域技术人员公知的任何方式来显示统计结果,包括但不限于:饼图、柱状图、线图、表格等。显示统计结果的具体方式可由用户经由客户端计算设备来选择。参考图12,图12示出了根据本发明的一实施例的从服务器计算设备角度的用于对多个医疗数据集进行统计的方法1200的流程图。该方法1200包括,在步骤1202,在多个医疗数据集中进行搜索以获得搜索结果。该步骤例如可通过上面描述跨医疗数据集搜索方法进行。该方法1200还包括,在步骤1204,从用户的客户端计算设备接收统计请求,所述统计请求至少包括分析指标以及要执行的统计操作。所述分析指标是通过在客户端计算设备上显示的用户界面上所显示的标准树或其子集中进行选择得到的。所述标准树及其子集(比如经过指标项的合并/过滤的经修改的指标数)在上面进行了描述。优选地,如有必要,可对所述分析指标执行转义,以便所述分析指标可用于来自多个医疗数据集的搜索结果。优选地,如有必要,可对所述分析指标对应的指标数据进行标准化,以便可以对来自多个医疗数据集的指标数据进行统计。该统计操作例如可包括以下的一者或多者:计数、求和、求平均值、求方差、求协方差、求中值、求众值、求中距、以及求频次百分比。该方法1200还包括,在步骤1206,基于所述统计请求对所述搜索结果进行统计以获得统计结果。优选地,该统计结果是通过将在多个医疗数据集中的统计结果进行合并得到的。该方法1200还包括,在步骤1208,将所述统计结果传送给客户端计算设备以供呈现给所述用户。优选地,可将所述统计请求保存为自定义统计条件,以供用户在稍后通过所述自定义统计条件执行统计。参考图13,图13示出了根据本发明的一实施例的从客户端计算设备角度的用于对多个医疗数据集进行统计的方法1300的流程图。该方法1300包括,在步骤1302,将来自用户的搜索请求发送给服务器计算设备以在多个医疗数据集中进行搜索以获得搜索结果。该方法1300还包括,在步骤1304,向服务器计算设备发送统计请求,所述统计请求至少包括分析指标以及统计操作。该方法1300还包括,在步骤1306,从所述服务器计算设备接收统计结果,所述统计结果是基于所述统计请求对所述搜索结果进行统计得到的。该方法1300还包括,在步骤1308,将所述统计结果呈现给所述用户。可以理解,根据本发明的各实施例的方法可以用软件、固件或其组合来实现。在一个实施例中,公开了一种系统,该系统包括存储器;通信接口;和处理器,与所述存储器和通信接口通信地连接,所述处理器操作以实现本文所述的各实施例的方法,如方法600、700、1200、1300中的一者或多者。在另一个实施例中,公开了一种包括存储于其上的计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在被处理器执行时使得所述处理器执行本文所述的各实施例的方法,如方法600、700、1200、1300中的一者或多者。本发明可具体化为其它具体形式而不背离其精神或本质特征。所描述的实施例在所有方面都应被认为仅是说明性而非限制性的。因此,本发明的范围由所附权利要求书而非前述描述指示。落入权利要求书的等效方案的含义和范围内的所有改变应被权利要求书的范围所涵盖。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1