使用所测分析物改进疾病诊断的方法

文档序号:9457279阅读:411来源:国知局
使用所测分析物改进疾病诊断的方法
【技术领域】
[0001]本发明涉及改进疾病诊断的准确性的方法,并且涉及包括所测分析物与二元结果的相关性的相关联的诊断测试。
【背景技术】
[0002]其中三个或多个自变量用于关联二元结果(诸如存在或不存在给定疾病)的相关方法通常与聚类或邻域搜索法、回归法和小波分析法一起使用。在疾病预测的情况下,测量血液或血清的常见成分并且使用这些浓度作为各种疾病状态预测的自变量来尝试关联。在结果是“疾病”或“非疾病”的给定疾病状态的情况下,通常使用逻辑回归法。其他技术包括例如遗传算法。这些方法的预测能力高度依赖于选择用于该方法的成分分析物。本领域的技术人员认识到,似乎有预测能力的许多分析物和参数在实践中不会改进诊断和分析能力。
[0003]回归方法使用自变量中的趋势以与结果关联。线性方法是基于线性趋势且逻辑回归是基于对数趋势。在生物疾病预测中通常使用逻辑回归。
[0004]分组聚类方法考察对类似结果分组的变量相关拓扑学。该聚类方法的优点是它可以找到其中趋势不连续但在趋势上具有拓扑局部逆转的相关性。这种方法虽然高度非线性且易受具有小测量误差的局部高度可变结果的影响,但在生物用途中可以更具预测性。此外,这两种方法通常都可以与聚类法组合小规模应用于整体回归方法。
[0005]然而,逻辑上似乎关联的一些自变量在实践中不显示预测趋势。因此,所需要的是通过利用迄今还没有为疾病状态的诊断贡献出有用信息的患者特异性和群体特异性变量来改进诊断准确性的方法。
[0006]已经完成了发现生物标记物的大量研究,生物标记物可以单独或组合地预测疾病状态且具有足够的可重复性和供临床使用的预测能力。这项研究具有有限成功或没有成功。高丰度蛋白(HAP)已经被大量研究以发现可以作出这一预测的单一蛋白。已经发现无数实例例,但没有足够低的假阴性水平,以便用标记物为患者筛查疾病。结果,这种单一生物标记物只能用于治疗监测,除前列腺癌的PSA之外。该测试要求指示活检是适当的的浓度严重倾斜,以降低导致假阳性水平非常高的假阴性。指示需要活检的多达80%的男性实际上是前列腺癌阴性。
[0007]也已发现DNA标记在一些情况下对于子类型的癌症非常好,但出于与如上所述HAP的相同原因同样不适合用于筛查。
[0008]还研究了使用多种蛋白的蛋白质组学方法。该项工作再次集中于HAP或高水平效应蛋白。该项工作由蛋白质测量的多重方法支配,诸如免疫测定、芯片和质谱法。更早的工作在卵巢癌方面已经取得了一些成功。然而,所有这些方法的问题是,所选的许多蛋白与健康至疾病的进展不具有很强的相关性(并且许多与疾病状态不具有已知的生物相关性,例如,如通常是质谱法的情况下)O此外,质谱经受严重过采样问题,这是由于通过分光光度计询问全血清样品的蛋白质水平并因此使相关算法的训练困难的事实所致。在质谱法的情况下,全血清样品可以具有超过200个蛋白和10000个质谱峰。
[0009]在诊断领域一直需要利用对诊断目的比HAP更有用的低丰度蛋白的技术,以及提供低丰度生物标记物的分析的分析技术。

【发明内容】

[0010]形成本专利申请的一部分的权利要求中阐述了本发明和各种实施例。不限于前述内容,在优选的方面,在优选的实施例中,本发明涉及使用多变量(多变量)相关方法改进用于预测疾病状态的方法的预测能力和诊断准确性。这些方法包括蛋白质组学、代谢组学和涉及确定如在体液和组织样品中发现的各种生物标记物的水平的其他技术。
[0011]发明人预期的和本申请中讨论的各种实施例包括元变量的使用,特别是使用调整所测生物标记物分析物对相关性分数的影响的方法。这种元变量可基于免疫系统应答的专门知识和可能的测量误差的知识来识别。这些方法可以应用到训练集模型的构建或诊断中的盲样。
[0012]在一个实施例中,本发明涉及一种用于诊断疾病的方法,包括以下步骤:a)确定来自受试者的盲样中的至少三种预定分析物的浓度山)选择与受试者相关的一个或多个兀变量,其在与已知有或没有疾病的群体成员的受试者相关的群体中变化;c)将分析物的浓度转换为一个或多个群体分布特征和一个或多个元变量的函数,以计算表示每种分析物的伪浓度;d)将伪浓度与确定用于已知有或没有疾病的群体成员的伪浓度的训练集模型比较;和e)确定比较是否指示该受试者具有疾病。预期确定预定分析物的浓度(或水平)的步骤(a)可以在与该方法的其余步骤的不同的时间和地点进行。类似地,该方法的其他(多个)步骤可以全部或部分在不同的时间和地点实施。因此,本发明人还预期包含更少步骤、特别是只有步骤(b)-(e)的方法作为他们的发明。
[0013]在本发明的一个方面,上述方法使用至少三种、至少四种、至少五种或至少六种或更多种分析物,它们被测量或确定取自受试者或患者的生物样品中它们的水平。在另一个方面,上述方法涉及给定疾病存在或不存在的评估或预测,这种实体组织癌包括但不限于乳腺癌、前列腺癌和肺癌。
[0014]在一些实施例中,元变量是年龄。在某些实施例中,元变量选自由以下组成的组:绝经前、期间和绝经后状态、柔毛、体重、样品源的地理位置、体脂百分比、种族(race)或种族混合(racial mix)或族群(ethnicity)、物种或时间段的时代(或范围)。
[0015]在另一实施例中,本文所描述的“比较”步骤涉及使用选择技术的的相关方法,包括但不限于:聚类、邻域搜索、回归或小波分析方法。而且,任选地可以包括使用不一致训练集模型。这种不一致训练集模块可视情况与本发明的任何方法使用,诸如与转换步骤相关的方法,可用次级训练集模型重复比较和确定,能够识别受试者群体中的非疾病病症,其部分模仿疾病状态中的血清分析物的变化,但不是由与疾病本身的病症或病理学相对的疾病状态引起的。因此,相关的实施例包括次级训练集模型,以及用于三种状态的疾病评价和预测:非疾病,部分模仿疾病状态的非疾病病症以及疾病状态。
[0016]在本发明的另一个方面,本发明的方法是通过使用微处理器由计算机执行的,且任选地进一步包括以下步骤:以有利于保健实践者的形式输出分数,诸如作出疾病诊断的医生。
[0017]本发明的某些实施例利用用于标准化的数学方法和浓度的不规则或不连续分布的平滑,其包括使用测量的浓度与对于非疾病和疾病状态的蛋白质的浓度的年龄调整平均值的比值的对数以及非疾病和疾病状态的蛋白质的浓度的比值的对数,单独的样品是预测的,使得在相关中使用的所得的新自变量的分布被压缩以帮助相关计算。
[0018]在本发明的另一方面,自变量和兀变量之间的关系包括与疾病和非疾病状态之间的关系的非线性程度相关的自变量的群体分布特征、一个或多个组(高斯或非高斯)、组平均值(group mean values)、组平均数(group average values)、组中值(group medianvalues)和组动态范围值。
[0019]本发明的某些实施例包括基于在相关群体中的典型受试者中的疾病进展过程中的单独的生物标记物上调或下调特性(诸如子分组或非线性的程度)的常规(或专门)知识,调整训练集模型以加权单独的生物标记物的影响。
[0020]某些其他实施例包括基于对双标记平面足够的双标记平面拓扑不稳定性的常规(或专门)知识,调整训练集模型以加权单独的生物标记物的影响,以显著改变风险分数或疾病状态预测,其中这些不稳定性是由每个双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。
[0021]在其他实施例中,基于生物标记物测定的不确定性的常规(或专门)知识,诸如可能发生在测定结果曲线上的非常低或非常高水平处的不确定性,调整训练集模型以加权单独的生物标记物的影响。
[0022]在本发明的另一个方面,不一致训练集模型被用来调整或校正由于足够的双标记平面上拓扑不稳定性导致的结果预测中显示不稳定性的单独的盲样,以显著改变给定盲样的风险分数,其中不稳定性是由双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。
[0023]另一实施例涉及诊断和治疗的更个性化用药方法,其中单独的蛋白(或其他分析物,诸如代谢物)浓度的基线值被确定用于受试者一段时间,包括受试者在非疾病状态的一段时间,而不是期望预测疾病的存在或其诊断的疾病的群体值。
[0024]本发明的另一方面涉及包括信号传导蛋白的低丰度生物标记物的测量,其包括至少三个种类的每个中的至少一种生物标记物,包括:免疫系统炎症标记物、肿瘤抗血管生成标记物、细胞凋亡标记物、血管生成蛋白相关标记物和组织标记物。在本发明的实施例中,低丰度生物标记物是非常低丰度的蛋白,在取自给定受试者的至少约20%的相关群体的样品中浓度水平低于约lpg/ml。
[0025]本发明的另一个实施例涉及在选自包括免疫系统炎症标记物、肿瘤抗血管生成标记物、细胞凋亡标记物、血管生成蛋白和组织标记物的种类的至少三种生物标记物的生物样品中的浓度的确定,其中除组织标记物外的至少三种生物标记物的任何一种或多种是低丰度蛋白,对于期望诊断或预测疾病的可能性用于在具有该疾病的亚群中的给定受试者的至少约20%的相关群体,确定浓度低于约lpg/ml。
[0026]在优选的实施例中,疾病是癌症,更具体地为实体瘤。
[0027]在其他实施例中,对至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种生物标记物进行评估(或确定其水平)。
[0028]本发明的另一个方面涉及其中至少一种确定(或测量)的分析物的浓度值低于LOD的评估或分析,其中这种分析物的浓度值由对于分析物的LOD和最低读数之间的直线或其他合适的标准曲线拟合方法确定。优选地,没有分析物被赋予零或负值,并且类似样品中没有分析物被赋予小于约为该分析物的最低接受值的值。
[0029]在其他实施例中,本发明涉及具有用于检测低于它们的LOD的一种或多种分析物、两种或多种分析物、三种或多种分析物、四种或多种分析物、五种或多种分析物、六种或多种分析物、七种或多种分析物、八种或多种分析物、九种或多种分析物或十种或多种分析物的试剂的诊断试剂盒。
[0030]本发明的另一实施例涉及用于完成本文所述的任何方法、诊断预测和分析(包括该说明书中所讨论的任何一个或多个步骤)的计算机系统和微处理器介导的设备和系统。
【附图说明】
[0031]在下面描述和并入说明书中并构成说明书的一部分的以下附图示出根据本发明的示例性实施例,并且不应被认为限制本发明的范围,因为本发明可允许其他同等有效的实施例。附图不一定按比例绘制,并且出于清楚和简明的目的,某些特征和附图的某些视图可以按比例放大或示意性显示。
[0032]图1是表示构建训练集模型(或诊断模型)然后产生用于评估具有疾病状态或非疾病状态的盲样的诊断分数的过程的流程图。
[0033]图2表示在为细胞因子白介素6的情况下的典型的群体分布。
[0034]图3表示显示诊断方法中使用的两种生物标记物的伪浓度的十分之一这种平面的双标记平面。
[0035]图4示出具有训练集数据点的双标记平面。
[0036]图5示出没有训练集数据点的双标记平面。
[0037]图6示出具有其中免疫系统响应的影响被降低的阴影区的双标记面。
[0038]图7示出具有其中拓扑稳定性问题的影响被降低的阴影区的双标记平面。
[0039]图8示出具有其中已知的测定测量不确定性的影响被降低的阴影区的双标记平面。
[0040]图9示出具有拓扑不稳定测试失败并用不一致算法校正的两个样品的盲测的结果O
[0041]图10示出在使用10个双标记平面显示训练集模型I的训练集癌症分数的情况下乳腺癌的临床研究的结果。
[0042]图11示出在使用105个双标记平面显示训练集模型II的训练集癌症分数的情况下乳腺癌的临床研究的结果。
[0043]图12示出具有运行临床研究的盲样的实际诊断的结果。
[0044]图13示出具有盲样数据点的蛋白质TNFa的校准曲线。
[0045]图14示出5%癌症分数误差的TNFa蛋白测定误差线
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1