医学分析系统的制作方法

文档序号:6593555阅读:318来源:国知局
专利名称:医学分析系统的制作方法
技术领域
本发明涉及一种医学分析系统。特别地,本发明涉及对应的方法和对应的计算机
程序产品。
背景技术
乳腺癌是由多个分子改变的积累驱动的复杂遗传性疾病。最近的在高通量基因 组、转录组学和表观基因组技术方面的分子进展已经使得能够集中于乳腺癌的分子复杂性 并且帮助指导癌症预测和治疗预测。Perou等人证实乳腺癌可以基于它们的基因表达谱分类成不同的组。雌激素 受体阳性(ER+)组的特征在于典型地由乳腺腔上皮细胞表达的一组基因的较高表达 (‘luminal,癌症)。ER分支包括三个肿瘤亚型1)过表达ERBB2 (HER2) ;2)表达乳腺基底 细胞特征性的基因(基底样癌症);和幻正常样样品。临床重要性是ER+肿瘤典型地显示 良好的预后和基底样和HER2肿瘤具有差的预后。基因表达谱化也导致两种基因表达分析-Oncotype Dx和MammaPrint-的发展,其 对于早期淋巴结阴性乳腺癌决定患者乳腺癌复发的风险。Oncotype Dx分析21个基因的表 达并且计算复发分数以确定患者癌症复发的可能性和他们从化疗可能得到的益处的评估。 MammaPrint分析70个基因的表达并且允许将具有早期乳腺癌的患者(<61岁)分类为具 有高或低远处转移风险。高风险患者然后可以用更攻击性的治疗进行管理。很多其它分子谱化(molecular profiling)技术被用于解决类似的临床问题。代 表性寡聚核苷酸微阵列分析(ROMA)检测基因组增殖和删除并且已经使得能够检测某些拷 贝数变异图案(copy number variation patterns)并测量它们与患者存活的相关性。在癌症诊断例如乳腺癌和局部化的癌症的初步治疗之后,医生具有很多治疗选 择。如何能够做出“正确的”治疗决定?传统地,诊断成像通过表征肿瘤的位置、形态和扩 散在癌症治疗选择中发挥了关键作用。癌症与DNA内的变化及其调控潜力相关,患者肿瘤 细胞分子谱的特定特征能够将临床医生引导到“正确的”治疗。今天,分子测试基于单基因测试如前述ER、PR和HER2基因表达分类患者。但是, 对于使用DNA甲基化和基因表达的改进的测试,在具有类似临床分类和范围的肿瘤内仍然 存在显著的治疗响应变化。DNA甲基化影响基因调节而没有遗传密码的改变。异常的DNA 甲基化谱与疾病如癌症相关。基因表达谱化在整个基因组的水平评价基因活性。数个小团体和大公司在分子治疗规划领域努力,例如Agendia (MammaPrint 是预 后测试)和Genomic Health (Oncoype Dx)。这些公司的目标领域是对于乳腺癌患者的子 集,化疗的患者分层(例如具有淋巴结阴性、ER阳性肿瘤的患者)。此外,是Adjuvant !,其 致力于使用临床因素例如年龄、肿瘤大小、节状况、等级而提供决策支持和治疗规划服务。但是,分子分类的进一步细化(refinement)能够导致不一致的临床意义。因此, 存在对分子谱化方案的临床需要,其中该方案将提供改进的诊断、预后、响应预测以提供正 确的化疗,以及后续措施(follow-up)来监控癌症复发。
因此,改进的医疗决策工具或系统将是有利的,并且特别地更有效和/或可靠的 系统将是有利的

发明内容
因此,本发明优选寻求单独地或以任何组合减轻、缓解或消除一个或多个上面提 到的缺点。特别地,作为本发明的一个目标,可以看到提供一种医学分析系统,该系统解决 了上面提到的现有技术中存在的问题,以快速和/或可靠的方式为一名或多名患者找出合 适治疗。因此,本发明的一个目标涉及患者的有效诊断和在治疗规划中辅助临床医生。特 别地,本发明的一个目标是提供一种医学分析系统,该系统在实现该目标和其它目标时解 决了上面提到的现有技术中存在的问题。因此,本发明的第一方面涉及用于对从至少一名患者获得的数据进行临床前 (pre-clinical)和/或临床分析的医学分析系统,该系统包括内部数据库(IDB),该数据库包括数据、分析结果、流程定义(flow definitions) 和工具定义(tool definitions)的集合,以及用于利用数据库仓库(database repository)的工具的其他相关数据,数据库访问单元(database access unit,DA),该单元适于提供对所述内部数据 库的访问,流程定义单元(flow definition unit,FD),该单元提供可配置分析流程 (configurable flow of analysis)的执行以及多个数据模态(data modalities)的可视 化,所述多个数据模态包括第一生物分子模态,包括与所述患者有关的生物分子数据,和第二临床模态,包括与所述患者有关的临床数据,工具执行引擎(TEE),具有所述系统的界面,以配置和启动(instantiate)工作于 一个或多个所述数据模态的一个或多个工具,工具仓库(tool r印ository),该仓库包括所述系统被配置来执行的工具的集合, 所述工具遵守一组规则以便使其能在图形用户界面(GUI)中可视化它们的执行,一个或多个相关联的外部数据库(EDB),所述一个或多个外部数据库代表存储在 所述系统本身中的数据或存储在不同于所述内部数据库(IDB)的数据库中的数据,和图形用户界面(GUI),所述界面同时可视化数据、分析结果、和一个或多个工具执 行的结果,并且其中所述界面进一步适于同时可视化1)所述第一生物分子模态的结果,和2)所述第二临床模态的结果。本发明特别地,但并非排他地,有利于获得用于设计个人化治疗的多模态方法 (multimodal approach) 0因此,本发明推动了完全集成的基因组设计和分析工具箱,其使 得能够访问关于患者的临床信息以及有关的分子信息(例如,基因表达以及差异化DNA甲 基化)。此外,本发明推动了多种机器学习工具(machine learningtools)的集成,所述机 器学习工具专用于a)基因表达谱化,b)DNA甲基化谱化,c)组合临床参数与分子水平信息,d)组合临床、生物学知识和分子数据,和/或d)通过统计工具集成分子模态。本发明允许可配置的生物信息工具执行流程,便于使用先进方式分析多个模态的 数据和浏览来自印鉴发现(signature-discovery)方法的数据和结果。其向新的和现有的 工具的(动态组)提供精简接口(lightweight interface)并使它们能够在改变很少或不 改变的情况下执行。该方案的优点在于分析过程的快速实行和执行,并且容易将方法和结果传达给临 床医生和其他感兴趣方。根据第一方面的系统可应用在处于临床前情形的至少一个患者。一个优点是关于 所述患者的数据和信息可被所述系统使用来发现生物分子印鉴。这样做的另一个优点是所 述系统可在系统中集成所述患者的数据以扩展可用数据。根据第一方面的系统还可被应用于一组患者。根据第一方面的系统可应用于处于临床情形的一个患者。因此,所述系统使得医 师能够鉴别出患者数据中的任何生物分子/临床印鉴,从而辅助对患者的诊断和进一步的 治疗。按照前述内容,根据第一方面的系统还可以作为临床决策支持系统(CDS)。根据第一方面的系统还可被配置为使得所述第一生物分子模态和所述第二临床 模态是可通过机器学习算法集成的,所述集成的结果在所述图形用户界面中是可视化的。 这种设置的主要优点是其使得能够在非常大和复杂的数据收集中发现复杂的生物分子印鉴。进一步地,根据第一方面的系统还可被配置成使得所述第一生物分子模态和所述 第二临床模态是可通过统计算法集成的,所述集成的结果在所述图形用户界面中是可视化 的。根据第一方面的系统还可被配置为使得所述第一生物分子模态和所述第二临床 模态是基于它们各自的基因组注释(genomic annotation)可集成的,所述集成的结果在所 述图形用户界面中是可视化的。在一个另外的实施方式中,根据第一方面的系统可被配置为使得所述第一生物分 子模态是基于高通量数据采样模态的。所述系统因此使得能够在包括其他模态数据的环境 中分析高通量的数据。根据第一方面的系统可被配置为使得由所述高通量数据采样模态提供的样本包 括关于至少100. 000个参数/物种(species)的数据。根据第一方面的系统还可被配置为使得所述第一生物分子模态选自于由高通量 基因表达谱化、DNA甲基化状态谱化、比较基因组杂交分析所组成的组。这些模态生成大且 复杂的数据集,其可被应用于所述系统并用来鉴别所述模态的生物分子印鉴。在根据第一方面的系统的一个特定版本中,所述流程定义单元(FD)包括至少一 个另外的生物分子模态。该版本的系统集成了更多的生物分子模态。在根据第一方面的系统的一个另外的版本中,所述另外的生物分子模态选自于由 高通量基因表达谱化、DNA甲基化状态谱化、比较基因组杂交分析、和SNP谱所组成的组。在根据第一方面的系统中,所述患者可具有临床病症(clinical condition),选 自于由癌症、心血管疾病、代谢性疾病、胃肠疾病、神经系统疾病所组成的组。该系统的一个优点是其使得能够使用所述系统来发现与具体病症相关的生物分子和临床印鉴,以及接着 将所述系统和印鉴应用于临床设定中。在第二方面中,本发明涉及用于发现与具体临床病症相关的生物分子或临床印鉴 的方法,包括使用根据本发明第一方面的医学分析系统。本发明特别地,但并非排他地,有利于用于发现与临床病症有关的生物分子或临 床印鉴,所述临床病症选自于由癌症、心血管疾病、代谢性疾病、胃肠疾病、神经系统疾病所 组成的组。更特别地,但并非排他地,有利的是本方法可以发现与乳腺癌或结肠癌有关的生 物分子或临床印鉴。已知乳腺癌和结肠癌与异常的基因表达谱/DNA甲基化谱相关联。进一步地,根据第二方面的方法可以用于发现印鉴,所述印鉴选自于由基因表达 印鉴、DNA甲基化状态印鉴、比较基因组杂交印鉴、和SNP印鉴所组成的组。这些模态典型 地生成大量数据,其需要高容量系统来显示任何生物分子存在。在第三方面,本发明涉及用于临床决策支持的方法,包括使用根据本发明第一方 面的医学分析系统。本发明还提供了,患者数据被应用于所述系统用于鉴别与临床病症相关的生物分 子或临床印鉴。该实施方式的优点是所述生物分子/临床印鉴的应用可被用来指示患者是 否可能患上与所述印鉴相关的临床病症。在第四方面,本发明涉及计算机程序产品,该计算机程序产品适于使得计算机系 统能够控制根据本发明第二方面的分析方法,其中所述计算机系统包括至少一部具有与之 相关的数据存储装置的计算机。本发明的这一方面是特别地,但并非排他地,有利的,因为本发明可通过使得计算 机系统能够实施本发明第二方面操作的计算机程序产品来实现。因此,设想的是一些已知 的医学分析系统可通过在控制所述医学分析系统的计算机系统上安装计算机程序产品而 变成根据本发明运行。这种计算机程序产品可以在任何种类的计算机可读介质上提供,例 如,基于磁或光的介质,或是通过基于计算机的网络,如互联网提供。本发明的第一、第二、第三和第四方面每个都可以与任何其他方面进行组合。本发 明的这些及其他方面从后面描述的实施方案将来看将是显而易见的并且将参照后面描述 的实施方式进行阐释。


本发明现在将参考附图,仅以实施例的方式进行解释说明,其中图1显示出所述系统的体系结构。图2显示出数据访问、分析、和临床决策的概念性流程方案(conceptual flow scenario)。图3显示出所述系统关于分析环境(analysis context)和视觉显示的状态。图4显示出本发明系统的主屏幕的一个实例。图5显示出从数据库下载患者信息的一个实例。图6显示出与组织病理模态(histopathological modahty)有关的屏幕的一个实 例。
图7显示出与比较基因组杂交(CGH)模态有关的屏幕的一个实例。图8显示出与基因表达模态有关的屏幕的一个实例。图9显示出与DNA甲基化模态有关的屏幕的一个实例。图10显示出与两组基因表达印鉴探察有关的屏幕的一个实例,一个只使用基因 表达数据,而另一个使用基因表达数据连同DNA甲基化数据。图11显示出用于基因表达印鉴的特征浏览器的一个实例。图12显示出用于基因表达印鉴的基因卡(Genecard)链接的一个实例。图13显示出与DNA甲基化印鉴探察有关的屏幕的一个实例。图14显示出用于DNA甲基化标志的特征浏览器的一个实例。图15显示出用于甲基化印鉴的临床决策支持(⑶S)屏幕的一个实例。图16显示出与遗传算法概括工具(genetic algorithm summary tool)有关的屏 幕的一个实例。图17显示出与两个遗传算法概括工具输出压缩有关的拆分屏幕的一个实例。图18显示出与基因同时出现(co-occurrence)工具有关的屏幕的一个实例。图19显示出与甲基结合位点工具有关的屏幕的一个实例。图20显示出与从上到下分级分选(top down hierarchical sorting,TDHS)有关 的屏幕的一个实例。图21显示出与基因表达过滤工具有关的屏幕的一个实例。图22显示出与多模态相关特征分析一图形输出有关的屏幕的一个实例。图23和M显示出与多模态相关特征分析一文本输出有关的屏幕的一个实例。图25显示出用于基因表达的⑶S屏幕的一个实例。图沈显示出基于遗传算法(GA)工具的四种可能的输出,该工具被设计为自动演 化(evolve)最佳预测样品的基础真实印鉴标记化(ground truth labeling)的特征子集。图27显示出发现的所有候选特征子集与在后处理分析中发现有意义的特征子集 的性能值的比较。图观显示出可视化多个特征的基因表达印鉴的特征浏览器的一个实例。图四显示出描述产生基因印鉴元数据(meta-data)可视化方法的流程图。图30显示出呈现基因印鉴元数据分布的一个实例。图31显示出从上到下分级分选(TDHS)的一个实例。图32显示出基因表达和DNA甲基化数据的相关性的一个实例。现在,本发明将在接下来进行更加详细地介绍。
具体实施例方式特别是在现今的癌症护理中,存在着对基于分子生物信息学的翻译临床工具 (translational clinical tools)的需求。发明人利用本发明公开了一种用于临床决策的 工具,使得临床决策依赖于基因组和表观基因组测量模态以及临床参数例如组织病理学结 果和存活信息。本发明的一个目标是促进发现临床病症的分子谱并使得它们能够用于临床设定 中。本发明描述了新技术以从组织样品获得基因组信息并辅助诊断、决定适当疗法、及后续措施。^BJAWPhysician Accessible Preclinical Analytics Application(PAPAyA) 集成了强大的统计和机器学习工具组,其可以对不同模态间的连接起到杠杆作用。所述 系统可容易地扩展和重新配置以支持将已有研究方法和工具集成在强大数据分析流水线 中。PAPAyA使得能够对来自临床研究的数据进行分析,设计新的临床假设,并且通过为临 床医生提炼分子谱而有助于临床决策支持。带有其关于乳腺癌分子谱的表现的实例的当前 PAPAyA配置被用于呈现工作中的所述系统。发明人提出一种用于设计个人化疗法的多模态分子方法。特别地,所述方法聚焦 于肿瘤亚型化并且鉴别将最有可能响应化疗(如Here印tin)的患者亚群,产生预言性的诊 断测试。发明人提供了一种基因组设计和分析工具箱的原型,其改进表征乳房和卵巢癌症 患者活组织检查样本的分子谱的临床前发现。发明人还提供了来自决策分析工具组的结 果,其有助于患者分层并预测治疗响应。本发明的系统提供了一种可配置平台,其使得能够基于高通量分子测量对临床研 究结果进行分析和诠释。本发明的系统组合了生物信息学软件方法,以用于翻译研究、临床 前,并部分用于临床应用。本发明的系统覆盖以下方面一多模态的集成分析以推断关于最重要的基因/位点(loci)的关联信息,其可能 有助于结果和患者状态(并将被用于治疗应答)。除了临床参数,如组织等级、结(node)、 ERA3R状态和结果外,发明人还提供了加入来自基因表达和DNA甲基化的患者信息。一组合各种机器学习工具来分析该数据(在文献中对这些工具的介绍之外)一使用这种集成的分析用于诊断、预后、治疗应答、及后续措施。发明人提供了来自决策分析工具组的结果,以浏览患者信息和基因印鉴,并单独 地分析基因表达谱以及差异化的DNA甲基化谱,并基于相关性和同时出现做出推论。这些 工具依赖于高通量基因表达谱化以及基于患者信息比如肿瘤尺寸、激素和组织病理参数的 其他临床预测和预后指数。发明人使用基因组设计和分析工具箱(Genomic Design and Analysis Toolbox, GDAT),称为Papaya,提供了这些工具和结果,其包含帮助乳腺癌和卵巢癌阶段临床前发现 的方法。具体地,这些工具包括特征子集选择、分类、聚类(clustering)方法和从上到下分 级分选以及决策分析,加入关于蛋白质-DNA相互作用、临床预后指数、DNA甲基化和基因表 达谱化数据的生物学知识。我们呈现来自杠杆化多个分子模态,例如高通量基因表达谱化 和DNA甲基化谱化的GDAT的结果,从而进一步改进诊断。本发明的系统通过组合所发现的分子印鉴和成像及额外的临床信息提供了全面 的视角。此外,所述系统可被用作形成诊断、选择治疗方向(例如,激素或化疗)并适当地 监视疾病的发展和后续情况中的辅助工具。所述系统还可用于提供分子信息包(例如,组 合的分子印鉴和对应的元数据),作为对临床医生或第三方决策支持系统的服务。另外,所 述系统可被用于开发和提供分子一药物一增强的临床指南,其可根据患者的分子谱进行定 制。高通量基因组数据分析的一些挑战在于与克服高测量和生物噪声,大量的特征 和有限的患者样本。本发明提供利用多个分子模态和临床信息的统计学上严密的方法,这可能消除许多伪信号(spurious signals),因此我们可以聚焦于疾病的根本生物学 (underlying biology)。将更多传统临床结果预测因子与从肿瘤本身得到的分子信息(例如,甲基化和基 因表达)融合被认为是有用的,但是学习如何诠释概率信息并将结果与医师和患者交流是 一个主要挑战。本发明提供了该问题的解决方案。本系统可辅助个人化医学在临床中的应用。存在着对将患者的临床、组织病理、和分子谱考虑在内的集成决策支持系统的清 晰临床需求。这样的系统将提供一站式解决方案,来帮助肿瘤会诊委员会(tumor board) (放射科医师、病理医师、外科医生、放射治疗医师和肿瘤医师)做出有足够信息的决策。上面的介绍主要是用于临床研究的临床前实施方式。在另一实施方式中,本发明 可以像临床应用那样类似地使用。系统本系统的结构体系具有以下组件,还可参照图IA ;⑶I 图形用户界面组合了同步显示数据、分析结果、以及工具执行结果的组件。数据访问(DA)提供对研究信息、测量、和分析结果的数据库的访问。流程定义(FD)提供基因组数据分析和临床/分子数据浏览步骤的可配置流程的 执行。工具执行引擎(TEE)提供应用界面,以无缝配置和启动来自各种平台的工具。这 允许应用扩展,新工具容易地无需改动或改动很少增加到所述配置和流程中。内部数据库(IDB)研究数据、分析结果、流程和工具定义的集合,以及用于利用 数据库仓库的外部工具的任何其他数据。工具“仓库” (TR)本申请被配置来执行的工具的集合。这些工具服从基础规则组 以便可以可视化它们的执行。外部数据库(EDB)外部工具使用的所有数据及其他文件的集合,存储在文件系 统的某些位置,或存储在不同于IDB的数据库中。本发明系统的轻微改动的结构体系在图IB中示出,其中图IA的流程定义(FD) 和数据访问(DA)被组合到图IB的流程控制中。类似地,通用用户界面(general user interface,⑶I)被细分成图IB中所示的用户界面、显示和操作模块。如图IB中所示,下 方的结构也被小小地改动,其中数据库管理系统与模块“工具”和“外部数据”一起示出。因此,本发明的一个方面涉及用于对从至少一名患者获得的数据进行临床前和/ 或临床分析的医学分析系统,该系统包括内部数据库(IDB),该数据库包括数据、分析结果、流程定义和工具定义的集合,以 及用于利用数据库仓库的工具的其他相关数据,数据库访问单元(DA),该单元适于提供对所述内部数据库的访问,流程定义单元(FD),该单元提供可配置分析流程的执行以及多个数据模态的可视 化,所述多个数据模态包括第一生物分子模态,包括与所述患者有关的生物分子数据,和第二临床模态,包括与所述患者有关的临床数据,工具执行引擎(TEE),具有所述系统的界面,以配置和启动工作于一个或多个所述数据模态的一个或多个工具,工具仓库,该仓库包括所述系统被配置来执行的工具的集合,所述工具遵守一组 规则以便使其能在图形用户界面(GUI)中可视化它们的执行,一个或多个相关联的外部数据库(EDB),所述一个或多个外部数据库代表存储在 所述系统本身中的数据或存储在不同于所述内部数据库(IDB)的数据库中的数据,和图形用户界面(GUI),所述界面同时可视化数据、分析结果、和一个或多个工具执 行的结果,并且其中所述界面进一步适于同时可视化1)所述第一生物分子模态的结果,和2)所述第二临床模态的结果。在一个实施方式中,该医学分析系统被应用于至少一个在临床前情形 (pre-clinical situation)中的患者。在另一个实施方式中,该医学分析系统被应用于一 组患者。在又一个实施方式中,该医学分析系统在临床情形中被应用于一个患者。在又一 个实施方式中,该医学分析系统起临床决策支持系统(CDS)的作用。在所述临床前情形中,患者数据可被应用于所述系统以扩展数据和/或用于鉴别 与癌症、心血管疾病、代谢性疾病、胃肠疾病、或神经系统疾病范围中的临床病症相关的生 物分子或临床印鉴。在本发明的一个实施方式中,本发明的系统是作为辅助个人化疗法设计的多模态方法。所述系统提供一完全集成的基因组设计和分析工具箱,其使得能够访问关于患者的临床信息以 及关联的分子信息(例如,基因表达以及差异性DNA甲基化)一多种机器学习工具的集成,所述机器学习工具专用于a)基因表达谱化,b)DNA 甲基化谱化,c)组合临床参数与分子水平信息,d)组合临床、生物学知识和分子数据,d)通 过统计工具集成分子模态本发明允许生物信息工具的可配置执行流程,便于以先进方式来浏览数据和来自 印鉴发现过程的结果。其向现有工具(的动态组)提供了精简接口并使它们能够改变很少或不改变而被 执行。该方案的优点在于分析过程的快速实行和执行,并且容易将方法和结果传达给临 床医生和其他感兴趣方。模态在本发明的一个实施方式中,根据在前权利要求任一项所述的医学分析系统,其 中所述第一生物分子模态和所述第二临床模态是可通过机器学习算法集成的,所述集成的 结果在图形用户界面中是可视化的。在本发明的第二实施方式中,根据在前权利要求任一项所述的医学分析系统,其 中所述第一生物分子模态和所述第二临床模态是可通过统计算法集成的,所述集成的结果 在图形用户界面中是可视化的。在本发明的第三实施方式中,根据在前权利要求任一项所述的医学分析系统,其 中所述第一生物分子模态是基于高通量数据采样模态的。
11
在本发明情况下高通量分析指的是解决生物或临床问题的生物数据的大规模分 析,在提交本申请的时候使用传统方法是难以实现的。高通量进一步由生成分析数据的模 态限定。高通量基因表达分析典型地涉及对表达谱的分析,包括每个样本数千表达产物的 数据。来自单个微阵列实验的基因表达数据可追踪数量范围从几千到几十万的基因在几百 种刺激下的活动。高通量DNA甲基化状态谱化(比如高通量差异性甲基化杂交(DMH)微阵列或MOMA 微阵列)包括每样本100,000个CpG位点/岛(sites/islands)的数据。质谱蛋白质组学典型地涉及在测量装置(measurement setup)中同时测量蛋白质 肽的100,000个质荷比(m/z)值,其包括一个或多个质谱仪和额外的步骤以聚焦生物样本 中的一种特定蛋白质子集。因此,在一个实施方式中,高通量被定义为在单个测量(例如,在微阵列上)中从 100, 000到几百万范围的这种测试。具体地,基因表达数据典型地测量10,000个基因表达 谱,DNA甲基化测量CpG岛中100,000个碎片的甲基化状态,质谱蛋白质组学典型地测量 100,000 个 m/z 值。在另一实施方式中,高通量指的是适用于所有模态的区分水平,将是它们的使得 数百万生化、遗传、或药理测试能够快速同步执行的性能。在一个实施方式中,由所述高通量数据采样模态所提供的样本包括关于至少 100. 000个参数/物种的数据。本发明的系统使得能够集成宽范围的模态,包括但不限于高通量模态。在一个实施方式中,所述第一生物分子模态选自于由高通量基因表达谱化、DNA甲 基化状态谱化、比较基因组杂交分析、质谱蛋白质组学、单核苷酸多态性(SNP)及其他全基 因组测序模态所组成的组。在另一实施方式中,第一生物分子模态选自于由组织学模态,比如免疫组织学、 ELISA、酶活性、PCR如Q-PCR、RT-PCR所组成的组。在一个实施方式中,第二临床模态包括与患者有关的临床数据,涉及的数据比如 是年龄、性别、来自患者体检的信息以及其他由临床医生收集的信息(例如,来自询问患者 的数据)。除了第一生物分子模态,所述系统使得能够集成多个生物分子模态。因此,在一个 另外的实施方式中,流程定义单元(FD)包括至少一个另外的生物分子模态。所述额外的一个或多个生物分子模态或模态组可以是本文描述的任意生物分子 模态。因此,在一个实施方式中,所述另外的生物分子模态选自于由高通量基因表达谱化、 DNA甲基化状态谱化、比较基因组杂交分析、和SNP谱所组成的组。在一个另外的实施方式中,第一生物分子模态和所述第二临床模态的集成是基于 它们各自的基因组注释可集成的,其中所述集成的结果在图形用户界面中是可视化的。所 述基因组注释可以是基因名称、功能、通路信息、Gene Onto 1 ogy。系统中的流程、状态和处理图2提供了一种非限定性的概念性流程方案。为了实施该系统,在本实施方式中 定义出五种屏幕类型
患者屏幕目的论证验证患者(样本)如何与印鉴数据库匹配。数据样本(包括甲基化/表达谱、和既往病史、临床指数)、印鉴。工具与印鉴匹配,有关的(匹配的)印鉴的概括。控制下载患者;扩展印鉴;选择印鉴概括(例如,基因等级、通路、……);决策支持。印鉴屏幕目的示出印鉴的内容和性能(任选地在样品或一组印鉴的环境中)数据印鉴(一组或多组基因/位点)、注释(到额外资源的链接,如NCBI)。工具匹配、有关的(匹配的)印鉴的概括(统计数据概括)。控制导航到“分析”或导航到分析中的早期步骤,改变视图从而强调或去掉视觉 元素(或甚至完全地改变视图一例如,从顺序的基因列表到热图)。工具1对工具2屏幕目的提供同时显示2个工具输出的方式,为对比目的和多模态数据集成具有从 工具1 “驱动”工具2的选项。数据任何数据一取决于工具工具任意工具。实施例1)工具1 =分级聚类vs.工具2 =从上到下的分级分选。实施例2)关 于基因表达数据的工具Ivs.关于甲基化数据的工具1。控制提供参数并驱动工具2。导航返回被调用的地方。工具屏幕目的在预定义的环境信息(例如,当前样品、当前印鉴、当前来自其他工具的输 出)内执行工具数据任何数据一取决于工具工具任意工具。控制基础(Rudimentary)参数输入。应使用默认参数,并且如果需要的话可以在 扉页(fly)上改变。为后续工具调用取得一些流程环境并更新环境。导航返回被调用的地 方。导航到类似工具。导航到在线路中位于其前方的工具。CDS 屏幕目的可视化关于如何可以将患者样本匹配结果翻译成CDS类输出的一种或多种
相法ο数据基于分析和注释的数据(Sata)工具无。仅给出信息。例如,临床指数、疗程规划控制一些数据可含有到外部资源的超链接(例如PubMed出版物、通路信息)。导 航返回被调用的地方。在本发明的一个实施方式中,所述流程是使用状态和可能的转换(动作)定义的, 如图3中的实例中那样。每个状态还具有与之相关联的屏幕类型。为了实施允许的转换, 在该实施方式中我们具体规定一来源状态转换起源的状态
一到达状态得到的状态一介绍动作的自定义文本(free-text description)介绍一动作类型工具调用(将调用外部工具);常规(将执行内部定义的动作);按 钮(将从屏幕上提供的按钮调用外部工具)一工具如果可用的话,是对要调用的工具的介绍的指示器。一现有限制(constraint)需要通过先前的动作设置或解除记号(flag)以便允 许该动作发生。一设置限制该动作将设置的记号。一解除限制该动作将解除的记号。应用从初始状态开始。一旦输入状态,所述应用查询转换表并基于输入的状态以 及系统中的设置和解除的限制编译所有可能的转换的子集。流程定义单元使用该规范在用 户浏览数据和工具时维持系统的状态。以下的数据结构定义了流程、链接到所述流程的工具以及其参数流程定义
。-。…,.、‘‘state_from当前状态Type工具执行操作;内部转换;...Description自定义文本介绍Action工具名(previous slide);初始化;内部动作constraint—e用户定义的变量,其可以被^置成定义限制。例如甲基化模态活 性vs. ■ 模态活性;分析模式vs.决策支持模式;等constraint—sconstraintustate—to下一状态 工具定义
权利要求
1.用于对从至少一名患者获得的数据进行临床前和/或临床分析的医学分析系统,该 系统包括内部数据库(IDB),该数据库包括数据、分析结果、流程定义和工具定义的集合,以及用 于利用数据库仓库的工具的其他相关数据,数据库访问单元(DA),该单元适于提供对所述内部数据库的访问, 流程定义单元(FD),该单元提供可配置分析流程的执行以及多个数据模态的可视化, 所述多个数据模态包括第一生物分子模态,包括与所述患者有关的生物分子数据,和 第二临床模态,包括与所述患者有关的临床数据,工具执行引擎(TEE),具有所述系统的界面,以配置和启动工作于一个或多个所述数据 模态的一个或多个工具,工具仓库,该仓库包括所述系统被配置来执行的工具的集合,所述工具遵守一组规则 以便使其能在图形用户界面(GUI)中可视化它们的执行,一个或多个相关联的外部数据库(EDB),所述一个或多个外部数据库代表存储在所述 系统本身中的数据或存储在不同于所述内部数据库(IDB)的数据库中的数据,和图形用户界面(GUI),所述界面同时可视化数据、分析结果、和一个或多个工具执行的 结果,并且其中所述界面进一步适于同时可视化1)所述第一生物分子模态的结果,和2)所述第二临床模态的结果。
2.根据权利要求1所述的医学分析系统,其中所述的医学分析系统被应用于至少一名 处于临床前情形的患者。
3.根据权利要求1所述的医学分析系统,其中所述的分析系统被应用于一组患者。
4.根据权利要求1所述的医学分析系统,其中所述的分析系统被应用于一名处在临床 情形的患者。
5.根据权利要求1所述的医学分析系统,其中所述的医学分析系统作为临床决策支持 系统(⑶S)起作用。
6.根据权利要求1所述的医学分析系统,其中所述第一生物分子模态和所述第二临 床模态是能够通过机器学习算法集成的,所述集成的结果能够在所述图形用户界面中可视 化。
7.根据权利要求1所述的医学分析系统,其中所述第一生物分子模态和所述第二临床 模态是能够通过统计算法集成的,所述集成的结果能够在所述图形用户界面中可视化。
8.根据权利要求1所述的医学分析系统,其中所述第一生物分子模态和所述第二临床 模态是能够基于它们各自的基因组注释集成的,所述集成的结果能够在所述图形用户界面 中可视化。
9.根据权利要求1所述的医学分析系统,其中所述第一生物分子模态基于高通量数据 采样模态。
10.根据权利要求9所述的医学分析系统,其中由所述高通量数据采样模态提供的样 本包括关于至少100.000个参数/物种的数据。
11.根据权利要求1所述的医学分析系统,其中所述第一生物分子模态选自于由高通量基因表达谱、DNA甲基化状态谱、比较基因组杂交分析所组成的组。
12.根据权利要求1所述的医学分析系统,其中所述流程定义单元(FD)包括至少一个 另外的生物分子模态。
13.根据前述权利要求任一项所述的医学分析系统,其中所述另外的生物分子模态选 自于由高通量基因表达谱、DNA甲基化状态谱、比较基因组杂交分析、和SNP谱所组成的组。
14.根据权利要求13所述的医学分析系统,其中所述患者具有选自癌症、心血管疾病、 代谢性疾病、胃肠疾病、神经系统疾病的临床病症。
15.用于发现与具体临床病症相关的生物分子或临床印鉴的方法,包括使用权利要求 1所述的医学分析系统。
16.根据权利要求15所述的方法,其中所述临床病症选自于由癌症、心血管疾病、代谢 性疾病、胃肠疾病、神经系统疾病所组成的组。
17.根据权利要求16所述的方法,其中所述癌症是乳腺癌或结肠癌。
18.根据权利要求1所述的方法,其中所述印鉴是基因表达印鉴、DNA甲基化状态印鉴、 比较基因组杂交印鉴和SNP印鉴。
19.用于临床决策支持的方法,包括使用根据权利要求1所述的医学分析系统。
20.根据权利要求19所述的方法,其中患者的数据被应用于所述系统来鉴别与临床病 症相关的生物分子或临床印鉴。
21.计算机程序产品,该程序产品适于使得计算机系统能够控制根据权利要求1所述 的医学分析系统,其中所述计算机系统包括具有与之相关的数据存储装置的至少一部计算 机。
全文摘要
本发明涉及患者的有效诊断以及治疗规划中的辅助临床医生。特别地,本发明提供了一种使得能够细化分子分类的医学分析系统。所述系统提供了一种分子谱化方案,其将允许改进的诊断、预后、应答预测从而提供正确的化疗,以及后续措施以监测癌症复发。
文档编号G06F19/00GK102084366SQ200980117341
公开日2011年6月1日 申请日期2009年5月6日 优先权日2008年5月12日
发明者A·I·D·布库尔, A·J·贾尼夫斯基, J·J·A·范利尤文, N·巴纳吉, N·迪米特罗瓦, S·卡马拉卡兰, V·V·瓦拉丹, Y·H·阿尔萨法迪 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1