用于确定吸烟状态的方法和组合物的制作方法

文档序号:511199阅读:360来源:国知局
用于确定吸烟状态的方法和组合物的制作方法
【专利摘要】提供了其表达水平与吸烟状态相关的外周血标志物。公开了使用高度信息性的标志物开发的预测模型,以及使用该标志物提供对于受试者吸烟状态的生物化学代理的系统、试剂盒和方法。在一些实施方式中,吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
【专利说明】用于确定吸烟状态的方法和组合物
[0001]相关申请的交叉引用
[0002]本申请要求2011年8月29日提交的美国临时申请N0.61/528,616的利益,该申请的全部公开内容为所有目的通过引用并入本文。
【背景技术】【技术领域】
[0003]本发明涉及用于基于标志物表达的测量确定吸烟状态的预测模型、其使用方法及用于其实施的计算机系统和软件。
_4] 相关技术的描述
[0005]吸烟是世界上造成可预防的死亡的首要原因,导致世界范围内每年超过5百万人死亡,其中约~500,000例死亡在美国发生(1,2)。吸烟已证明对人体健康有害,其增加了多种疾病的风险,包括许多形式的癌症(肺癌、胰腺癌)和心血管/肺疾病(动脉粥样硬化、慢性阻塞性肺病)(3,4,5)。香烟包含超过4,000种化合物,其中许多已证明是致癌的或毒性的;这些化合物能够通过肺泡进入循环系统,并分布到身体的不同器官,因而导致损害
(6)。在这一过程中,免疫系统的循环性细胞暴露于这些化合物,这可能导致基因表达的变化(其可使用已建立的技术进行评估)。
[0006]未满足的临床和科学需要
[0007]可铁宁是尼古丁的代谢物并出现在吸烟者的血液和尿中。因此,血液或尿中可铁宁的生化测量提供了吸烟状态的标志物,但需要专门的分析方法。使用易得的通用分子生物学工具如定量RNA测量或核酸测序反应的通用分析方法提供了确定吸烟状态的独立途径并可以作为从患者样品获得的平行或多重的核酸基测量系列的部分来完成。

【发明内容】

[0008]本文描述的是用于对从受试者获得的样品进行评分的计算机执行的方法,其中所述评分指示所述受试者的吸烟状态,该方法包括:获得与所述样品相关的数据集,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或F0XP3,其中标志物4是GOPC或MCM和其中标志物5是LEFl或CCR7 ;和通过计算机处理器使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指示。
[0009]在一些实施方式中,所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据,其中标志物I是CLDND1,其中标志物2是LRRN3,其中标志物3是MUCl,其中标志物4是GOPC且其中标志物5是LEFl。在一些实施方式中,所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中两个或更多个的定量表达数据。在一些实施方式中,所述数据集包括标 志物1、标志物2、标志物3、标志物4和标志物5中三个或更多个的定量表达数据。在一些实施方式中,所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中四个或更多个的定量表达数据。在一些实施方式中,所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据。
[0010]在一些实施方式中,所述方法进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。在一些实施方式中,所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
[0011]在一些实施方式中,所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
[0012]在一些实施方式中,所述数据集进一步包括用于计算所述评分的临床因素。在一些实施方式中,所述临床因素选自性别和高血压。在一些实施方式中,所述临床因素是性别。
[0013]在一些实施方式中,所述解释函数是基于预测模型。在一些实施方式中,所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。在一些实施方式中,所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。在一些实施方式中,所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
[0014]在一些实施方式中,获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。在一些实施方式中,获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。
[0015]在一些实施方式中,获得储存在存储器上的所述数据集。在一些实施方式中,所述定量表达数据来自杂交数据。在一些实施方式中,所述定量表达数据来自聚合酶链反应数据。在一些实施方式中,所述定量表达数据来自序列数据。
[0016]本文还描述了用于对从受试者获得的样品进行评分的计算机执行的方法,包括:获得与所述样品相关的数据集,其中所述数据集包括用于计算评分的临床因素及选自CLDNDl、IL7R、LRRN3、CCR7、MUC1、F0XP3、GOPC, MCM3、LEFl 和 CCR7 的至少一个标志物的定量表达水平值;和通过计算机处理器使用解释函数从所述数据集确定所述评分,其中所述评分是所述受试者的吸烟状态的指示。在一些实施方式中,所述数据集包括CLDND1、LRRN3、MUCUG0PC和LEFl的定量表达数据。在一些实施方式中,所述数据集包括两个或更多个标志物的定量表达数据。在一些实施方式中,所述数据集包括三个或更多个标志物的定量表达数据。在一些实施方式中,所述数据集包括四个或更多个标志物的定量表达数据。在一些实施方式中,所述数据集包括五个或更多个标志物的定量表达数据。
[0017]本文还描述了用于对从受试者获得的样品进行评分的系统,其中所述评分指示所述受试者的吸烟状态,该系统包括:用于储存与所述样品相关的数据集的存储器,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或F0XP3,其中标志物4是GOPC或MCM3和其中标志物5是LEFl或CCR7 ;和与所述存储器通讯偶联的处理器,其用于使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指示。
[0018]本文还描述了储存计算机可执行的程序代码的计算机可读存储介质,所述程序代码包括:用于储存与所述样品相关的数据集的程序代码,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或F0XP3,其中标志物4是GOPC或MCM3且其中标志物5是LEFl或CCR7 ;和用于使用解释函数从所述数据集确定评分的程序代码,其中所述评分是所述受试者的吸烟状态的指示。
[0019]本文还描述了用于对从受试者获得的样品进行评分的方法,其中所述评分指示受试者的吸烟状态,该方法包括:从所述受试者获得样品,其中所述样品包含多种分析物;将所述样品与试剂接触;生成所述试剂与所述多种分析物之间的多种复合物;检测所述多种复合物以获得与所述样品相关的数据集,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或F0XP3,其中标志物4是GOPC或MCM3和其中标志物5是LEFl或CCR7 ;和使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指示。
[0020]本文还描述了用于对从受试者获得的样品进行评分的试剂盒,其中所述评分指示受试者的吸烟状态,该试剂盒包括:包含用于从获自所述受试者的样品确定标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据的多种试剂的试剂组,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或F0XP3,其中标志物4是GOPC或MCM3和其中标志物5是LEFl或CCR7 ;和使用所述多种试剂从所述样品确定数据集中的定量表达数据的说明,其中所述说明包括通过计算机处理器使用解释函数从所述数据集确定评分的说明,其中所述评分是所述受试者的吸烟状态的指示。
[0021]在一个实施方式中,本发明提供了通过使用包括表1中所列的一个或多个标志物的定量表达数据的数据集确定受试者的吸烟状态的方法,其通过分析所述数据集以确定所述标志物的表达水平而进行,其中所述标志物的所述表达水平与所述受试者的所述吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。在一个实施方式中,所述受试者的吸烟状态可用于评估发生吸烟相关疾病的风险,如慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌或哮喘。在一个实施方式中,所述分析步骤通过将所述标志物的表达水平与阈值比较来进行。在其它实施方式中,所述数据集包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个 、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的定量表达数据。所述标志物可以与吸烟状态正相关或负相关,且所述标志物的表达水平与非吸烟者相比在吸烟者中可以提高或降低。在其它方面中,本发明的方法在一台或多台计算机上执行。在一些实施方式中,所述数据集通过分析样品以通过试验测定表达值而获得。在其它实施方式中,所述数据集直接或间接地从已经处理所述样品以通过试验测定所述数据的第三方获得。所述数据集中的数据可以反映使用基于核苷酸的分析如qRT-PCR分析、杂交分析或测序反应分析进行的测量。在一些实施方式中,本发明的方法使用计算机处理器执行。本发明还包括用于确定受试者的吸烟状态的系统。所述系统包括用于储存数据集的存储器和与所述存储器通讯偶联用于分析所述数据集以确定所述标志物的表达水平的处理器。在其它实施方式中,本发明包括储存计算机可执行程序代码的计算机可读存储介质,该程序代码包括用于储存与从受试者获得的样品相关的数据集的程序代码(该数据集选自表1的标志物的定量表达数据)和用于分析所述数据集以确定所述标志物的表达水平的程序代码(其中所述表达水平与所述受试者的吸烟状态正相关或负相关)。在再其它的实施方式中,本发明的系统包括用于储存包括选自表1的标志物的阈值的数据集的存储器。所述阈值可以与从非吸烟受试者或非吸烟受试者群体获得的表达数据相关。本发明的再其它的实施方式包括用于确定受试者的吸烟状态的试剂盒,其包括用于从获自所述受试者的样品确定选自表1的标志物的定量表达数据的试剂组和使用所述试剂从所述样品确定定量表达数据并分析所述数据集以确定所述标志物的表达水平的说明,所述标志物的表达水平与所述受试者的吸烟状态正相关或负相关。所述说明可以进一步包括用于分析的阈值和/或用于生成指示吸烟状态的评分的解释函数。该试剂盒可以包括用于选自表1的超过一个标志物的试剂,例如至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物。本发明的实施方式还包括预测模型和相关的解释函数,其在所述定量表达数据上运行以生成指示受试者的吸烟状态的评分。所述预测模型可以是偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。在某些实施方式中,标志物包括raNDl、LRRN3、MUCl、G0PC或LEFl或者选自表1的其表达与⑶ND1、LRRN3、MUC1、GOPC和LEFl相关的标志物。在一些实施方式中,所述解释函数是log (pr (吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDNDl-3.4034*LRRN3_L 4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。在其它实施方式中,所述解释函数是表7中给出的解释函数。[0022]附图简要说明
[0023]本发明的这些和其它的特征、方面和优势参照以下说明和附图将变得更好理解,其中:
[0024]图1是表明通过应用预测模型将样品分为吸烟者和非吸烟者类别的分类与相同样品的可铁宁水平之间的关系的图。
[0025]详细说明
[0026]一般地,用于权利要求和说明书中的术语意图解释为具有本领域技术人员所理解的通常含义。某些术语在下面定义以提供进一步的澄清。在通常含义与提供的定义冲突的情况下,采用提供的定义。
[0027]术语“Ct”指循环阈值并定义为其中荧光值高于设定阈值的PCR循环数。因此,低Ct值对应于高表达水平,和高Ct值对应于低表达水平。
[0028]术语“Cp”指交叉点并定义为在实时PCR仪(如,例如,LightCycler)中标准品的扩增曲线的对数-线性部分的最佳拟合与噪声带(按照背景荧光测量设定)的交叉。
[0029]术语“FDR”意指错误发现率。FDR可以通过分析随机排列数据集和将在给定p-值阈值下基因的平均数制表来估计。[0030]术语“GL”、“GM”和“⑶”分别指算法开发数据集中该基因的Cp的第一百分位、中值和第99百分位。
[0031]术语“标志物”或“多个标志物”包括,但不限于,脂质、脂蛋白、蛋白质、细胞因子、趋化因子、生长因子、肽、核酸、基因和寡核苷酸,以及其相关复合物、代谢物、突变、变体、多态性、修饰、片段、亚基、降解产物、要素和其它分析物或样品衍生的量度。标志物也可以包括突变的蛋白质。突变的核酸、拷贝数的变异和/或转录物变体,在其中这类突变、拷贝数的变异和/或转录物变体可用于产生预测模型或可用于使用相关标志物(例如该蛋白质或核酸的非突变形式,可变转录物,等)开发的预测模型中的情况中。
[0032]术语“闻度相关的基因表达”或“闻度相关的标志物表达”指具有足够的相关性水平以允许其可互换地用于冠状动脉疾病的预测模型中的基因或标志物表达值。例如,如果具有表达值X的基因X用于构建预测模型,具有表达值Y的高度相关的基因y可以以对于本领域技术人员很容易理解的直接方式代入该预测模型中并具有本公开的益处。假定基因X和y的表达值之间具有近似线性的关系以使得Y=a+bX,则X可以以(Y-a)/b代入预测模型中。对于非线性相关性,可以使用将基因I的表达值有效地转换为基因X的相应表达值的类似的数学变换。术语“高度相关的标志物”或“高度相关的替代标志物”指基于例如上述标准可以代入和/或添加到预测模型中的标志物。高度相关的标志物可以以至少两种方式使用:(1)用高度相关的标志物替代原始标志物并产生用于预测吸烟状态的新模型;或(2)在现有的用于预测吸烟状态的模型中用高度相关的标志物替代原始标志物。
[0033]术语“哺乳动物”包括人和非人类,并包括,但不限于人、非人类灵长动物、犬科动物、猫科动物、鼠科动物、牛科动物、马科动物和猪。
[0034]术语“集合基因(metagene) ”指其表达值经组合以产生可以用作预测模型中的成分的一组基因(Brunet, J.P.等 Proc.Natl.Acad.Sciences2004; 101 (12): 4164-9)。
[0035]术语“样品”可以包括从受试者获取的单一细胞或多细胞或细胞片段或等分的体液,其通过包括静脉穿刺、排泄、射精、`按摩、活组织检查、针吸、灌洗样品、刮擦、手术切开或介入的方式或者其它本领域技中已知的方式获取。
[0036]术语“受试者”包括细胞、组织或有机体、人或非人类,无论是在体内、离体或体外,也无论是男性或女性。
[0037]术语“获得与样品相关的数据集”包括获得从至少一个样品测定的数据的集合。获得数据集包括获得样品,和处理所述样品以通过试验测定数据。该短语也包括例如从已经处理所述样品以通过试验确定该数据集的第三方接收数据的集合。另外,该短语包括从至少一个数据库或至少一篇公开文献或数据库和公开文献的组合挖掘数据。数据集可以由本领域技术人员通过多种已知的方式(包括储存在存储器上)获取。
[0038]必须注意,如本说明书和所附的权利要求中所用的,单数形式“一” “一个”和“该”包括复数指代,除非上下文明确规定另外的情况。
[0039]方法
[0040]标志物和临床闵素
[0041]本发明的一个或多个标志物的量可以表示为值。值可以是通过在特定条件下评定样品得到的一个或多个数值。所述值可以例如通过在实验室中进行的分析以试验方式从样品获得测量值或者可选地从服务提供商如实验室或从数据库或其上储存数据集的服务器(例如在存储器上)获得数据集而获得。
[0042]在一个实施方式中,一个或多个标志物的量可以是与通过在特定条件下评定样品得到的表1中给出的基因的表达水平相关的数值。表1的列标签表示以下:“探针名称”是在Agilent Human Whole Genome Arrays (Agilent Technologies, Santa Clara, CA)中发现的探针的名称;“基因名称”指按照 Human Genome Organization (HUGO) Gene NomenclatureCommittee(HGNC)提供的准则的人基因的名称。关于各个人基因的进一步的信息如登录号和别名可以通过将该基因名称输入HGNCgenenames.0rg网页上的检索页中找到。例如,在2011年8月10日将术语“LRRN3”输入HGNC网页的简单检索字段中返回LRRN3的批准的基因名称(leucine rich repeat neuronal3)、LRRN3 的序列登录 ID(GenBankAB060967; RefSeq: NMOO1099658)和 LRRN3 的早先代码或异名(FIGLER5, FLJl 1129, NLRR3)。进一步的人基因名称提供在下面的实施例章节中。本领域技术人员认识到,表1中提供的“基因名称”信息明确地识别用作本发明中的生物标志物的基因,并能够使用表1中的“基因名称”信息获得关于所命名的基因的蛋白质和核酸序列的信息而无需过度的实验。这类信息使得本领域技术人员能够容易地使用本说明书中描述的多种方法中的任一种获得这些标志物的定量表达水平数据。“吸烟对数优势(Smoking Log Odds) ”指生物标志物与吸烟状态的相关性的标准统计度量。表1中的正值表示该标志物与吸烟状态正相关,而负值表示该标志物与吸烟状态负相关(即,该与否定的(“非吸烟”)吸烟状态相关)。因此,如果表达随增加的吸烟而降低,则该标志物在表1中具有正值,而如果表达随增加的吸烟而提高,则该标志物在表1中具有正值。“吸烟P”指标志物与吸烟状态的相关性(正或负)的统计学显著性。
[0043]在一个实施方式中,标志物的相关值可以包括在与从受试者获得的样品相关的数据集中。数据集可以包括两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个、十一个或更多个、十二个或更多个、十三个或更多个、十四个或更多个、十五个或更多个、十六个或更多个、十七个或更多个、十八个或更多个、十九个或更多个、二十个或更多个、二十一个或更多个、二十二个或更多个、二十三个 或更多个、二十四个或更多个、二十五个或更多个、二十六个或更多个、二十七个或更多个、二十或八个或更多个、二十九个或更多个、或者三十个或更多个表1中给出的标志物的标志物表达值。数据集可以包括表1中给出的标志物的亚集或完整集合及现在已知或随后确定为与吸烟状态正相关或负相关的其它标志物。例如,数据集可以包括SASH1、P2RY6、MUC1、LRRN3、MGAT3和CLDNDl的表达值。在另一个实施方式中,数据集可以包括CLDND1、LRRN3、MUC1、G0PC和LEFl的表达值。其它组合更详细地描述于下面的实施例章节中。数据集也可以将标志物的表达值与临床因素组合,例如性别。数据集也可以将标志物的表达值与受试者性别的指示符组合(即受试者是男性还是女性的指示)。数据集也可以将标志物的表达值与受试者的高血压状态的指示符组合。
[0044]在另一个实施方式中,本发明包括获得与受试者相关的样品,其中该样品包括一个或多个标志物。该样品由受试者或第三方(例如医学专业人员)获取。医学专业人员的例子包括医生、急诊医生、护士、第一急救者、心理专家、医用物理学人员、从业护士、外科医生、牙医和本领域技术人员已知的任何其它明显的医学专业人员。样品可以包括外周血细胞、分离的白细胞或者从外周血 细胞或分离的白细胞提取的RNA。样品可以从任何体液获得,例如,羊水、房水、胆汁、淋巴、乳汁、间质液、血液、血浆、耳垢(耳屎)、考珀氏液(预射精液)、乳糜、食糜、女性射出液、经血、粘液、唾液、尿液、呕吐物、泪液、阴道润滑液、汗液、血清、精液、皮脂、脓、胸水、脑脊液、滑液、细胞内液和玻璃体液。在一个实例中,样品通过抽血获得,其中医学专业人员从受试者抽血,如通过注射器。体液然后可以进行测试以使用分析方法测定一个或多个标志物的值。该一个或多个标志物的值然后可以由进行所述分析的同一方使用本发明的方法进行评估或发送到第三方以使用本发明的方法进行评估。
[0045]众所周知的是吸烟状态与某些吸烟相关疾病的风险相关。这些包括慢性阻塞性肺病(COPD)、慢性支气管炎、肺气肿、肺癌、哮喘(11,12)。因此,本发明的方法可用于提供评估个体发生一种或多种吸烟相关疾病的风险的独立预测因子。来自本发明的方法的结果可以输入到使用吸烟状态以评估吸烟相关疾病风险的多种诊断方法的任一种中。这些结果可代替或附加于个体自己报告的吸烟状态而使用,例如,用于向医生,向保险承担者或向对于评估个体发生一种或多种吸烟相关疾病的风险感兴趣的任何其它实体提供患者病史数据。
[0046]解释函数
[0047]在一个实施方式中,解释函数可以是由预测模型产生的函数。解释函数也可以由多个预测模型产生。在一个实施方式中,解释函数可以采取以下形式:log(Pr(吸烟者)/(1-Pr (吸烟者))=15.7306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.7166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O ;Pr=概率。其它解释函数在表7中给出。
[0048]在一个实施方式中,预测模型可以包括偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。在一个实施方式中,预测模型也可以包括支持向量机、二次判别分析或LASSO回归模型。参见Elements ofStatistical Learning, Springer2003, Hastie, Tibshirani, Friedman,其在此为所有目的通过引用并入。预测模型性能可以通过曲线下面积(AUC)表征。在一个实施方式中,预测模型性能通过0.68-0.70范围的AUC表征。在一个实施方式中,预测模型性能通过0.70-0.79范围的AUC表征。在一个实施方式中,预测模型性能通过0.80-0.89范围的AUC表征。在一个实施方式中,预测模型性能通过0.90`-0.99范围的AUC表征。解释函数可以使用如以下实施例中所示的信息性标志物的组合或使用其表达与吸烟状态高度相关的单一基因开发。在某些实施方式中,用于基于单一基因进行分类的方法使用逻辑回归或线性判别分析(LDA)开发。
[0049]分析方法
[0050]用于一个或多个标志物的分析方法的实例包括DNA分析、微阵列、基于测序的分析(其中测序分子的数目被计数且该计数用于确定表达水平)。测序的分子可以是对应于mRNA转录物的cDNA。其它分析方法包括聚合酶链反应(PCR)、RT_qPCR、测序分析、Southern印迹、Northern印迹、抗体结合分析、酶联免疫吸附分析(ELISA)、流式细胞分析、蛋白质分析、Western印迹、浊度法、比浊法、色谱法、质谱法、免疫分析,包括,例如,但不限于RIA、免疫荧光、免疫化学发光、免疫电化学发光或竞争免疫分析、免疫沉淀及下面的实施例章节中描述的分析方法。来自该分析的信息可以是定量的且被发送至本发明的计算机系统。该信息也可以是定性的,如观察的模式或荧光,其可以由使用者或者通过阅读器或计算机系统自动地转化成定量的量度。在一个实施方式中,受试者也可以向计算机系统提供分析信息以外的信息,如临床因素(例如,性别)。
[0051]除使用RT-qPCR评估表达水平外,其它形式如微阵列或RNA测序可以使用。例如,为使基于RT-qPCR数据的预测模型与微阵列数据互作(crosswalk),阵列数据首先进行标准归一化。然后回归线进行拟合以从各个模型基因的阵列值预测其PCR值。各回归的拟合值然后作为预测子插入吸烟模型中。为使预测模型与RNA测序互作,模型基因的靶向重测序使用下一代测序平台完成。原始序列阅读片段与相应的所靶向的基因比对,且原始表达水平通过计算覆盖的深度(depth of coverage)来评估。原始值通过每样品的原始序列总数和靶序列的长度归一化。然后回归线进行拟合以从各个模型基因的归一化序列值预测其PCR值。各回归的拟合值作为预测子插入吸烟模型中。
[0052]信肩、性标志物组
[0053]除了本申请中通过名称、登录号或序列确定的特定的示例性标志物外,包括在本发明的范围内的还有吸烟状态的所有可操作的预测模型及其用于使用与示例性序列具有至少90%或95%或至少97%或更高的同一性或者编码与由示例性的基因或序列编码的蛋白质具有至少90%或95%或至少97%或更高同一性的蛋白质的变体序列的表达值对样品进行评分和任选地分类样品的方法。序列同一性百分比可以使用本领域技术人员公知的算法确定,包括例如,BLASTn和BLASTp,如Stephen F.Altschul等,J.Mol.Biol.215:403-410 (1990)中所描述的和在由 National Institutes of Health 维护的National Center for Biotechnology Information网站上提供的。下面描述根据本发明的实施方式的所有可操作的预测模型及其用于附加于或替代示例性标志物表达值而使用现在已知或随后发现与示例性标志物表达值的表达高度相关的标志物表达测量对样品进行评分或任选地分类样品的方法。出于本发明的目的,这些高度相关的基因包括在所要求保护的发明的文字范围内或可选地作为示例性标志物的等同物包括在内。具有与示例性标志物的表达值高度相关的表达值的标志物的鉴别及其用作预测模型的成分的用途明显在本领域的普通技能范围内。下面的实施例章节提供了用于鉴别高度相关的标志物和将它们替代吸烟状态的预测模型中的算法标志物的方法及其用于对样品进行评分和任选地分类样品的方法的多种实例。`
[0054]计算机执行
[0055]在一个实施方式中,计算机包括至少一个与芯片组偶联的处理器。与芯片组偶联的还有内存、存储装置、键盘、图形适配器、点击装置和网络适配器。显示器与图形适配器偶联。在一个实施方式中,芯片组的功能性通过内存控制中心和I/o控制中心提供。在另一个实施方式中,内存与处理器直接偶联而不是与芯片组偶联。
[0056]存储装置是能够保持数据的任何装置,如硬盘、只读光盘存储器(⑶-ROM)、DVD或固态存储装置。内存保持指令和处理器使用的数据。点击装置可以是鼠标、轨迹球或其它类型的点击装置,并与键盘组合使用以将数据输入计算机系统中。图形适配器将图像和其它信息显示在显示器上。网络适配器将计算机系统与局域网或广域网偶联。
[0057]如本领域中已知的,计算机可以具有与前面描述的部件不同的部件和/或其它的部件。另外,计算机可以缺乏某些部件。此外,存储装置可以对于计算机是本地的或远程的(如在存储区域网(SAN)中实现的)。
[0058]如本领域中已知的,计算机适用于执行程序模块以提供本文描述的功能性。如本文中所用的,术语“模块”指用于提供特定功能性的计算机程序逻辑。因此,模块可以在硬件、固件和/或软件中执行。在一个实施方式中,程序模块存储在存储装置上,加载到内存中并通过处理器执行。
[0059]在两个或更多个核酸或多肽序列的情况中,术语百分“同一性”是指两个或更多个序列或子序列在进行比较和比对以实现最大对应时具有指定百分比的相同核苷酸或氨基酸残基,如使用下面描述的序列比较算法之一(例如,BLASTP和BLASTN或技术人员可得的其它算法)或通过目视检查测量的。取决于应用,百分〃同一性〃可以存在于所比较序列的区域上,例如,功能域上。或者可选地,存在于两个待比较序列的全长上。
[0060]对于序列比较,通常一个序列作为测试序列与其比较的参照序列。当使用序列比较算法时,测试序列和参照序列输入到计算机中,如果必要的话,指定子序列坐标,并指定序列算法程序参数。序列比较算法然后基于指定的程序参数计算测试序列相对于参照序列的百分序列同一性。
[0061]可以进行比较序列的最佳比对,例如通过Smith & Waterman, Adv.Appl.Math.2:482 (1981)的局部同源性算法,通过 Needleman & ffunsch, J.Mol.Biol.48:443 (1970)的同源性比对算法,通过 Pearson & Lipman, Proc.Nat’ 1.Acad.Sc1.USA85:2444(1988)的相似性检索方法,通过这些算法的计算机执行(WisconsinGenetics Software Package 中的 GAP、BESTFIT、FASTA 和 TFASTA, Genetics ComputerGroup, 575Science Dr.,Madison, Wis.)或通过目视检查(一般参见Ausubel 等,见下文)。
[0062]适合用于确定百分序列同一性和序列相似性的算法的一个实例是BLAST算法,其描述于Altschul等,J.Mol.Biol.215:403-410(1990)中。用于进行BLAST分析的软件通过 National Center for Biotechnology Information 是公开可得的。
[0063]本文描述的实体的实施方式可以包括其它的和/或与此处描述的模块不同的模块。另外,归因于该模块的功能性可以通过其它实施方式中的其它或不同的模块执行。此外,本说明书偶而省略术语“模块”以为了清楚和方便的目的。
[0064]试剂盒
[0065]本发明提供用于确定选自表1的一个或多个标志物的定量表达数据的试剂盒及使用所述数据确定受试者的吸烟状态的说明。任选地,试剂盒可以包括包装。试剂盒可以包括用于进行基于核苷酸的分析如qRT-PCR分析、杂交分析或测序分析的试剂以测定选自表I的该一个或多个标志物的表达水平。试剂盒可以包括用于进行本说明书中描述的任何其它类型的分析的试剂。该试剂可以是探针和引物(如表4中所示的那些)或其它类似试剂。该试剂可以是探针,如表1或表2中确定的探针。说明可以包括用于在所述定量表达数据上运行的解释函数。解释函数可以由预测模型产生。说明可以包括可由吸烟受试者或吸烟受试者群体或者由非吸烟受试者或非吸烟受试者群体确定的阈值。说明可以包括用于将定量表达数据与阈值进行比较以确定吸烟状态的方法。
实施例
[0066]以下是用于实现本发明的特定实施方式的实施例。该实施例仅提供用于说明性的目的而并非意图以任何方式限制本发明的范围。已努力确保所使用的数字(例如,量、温度等等)的准确性,但一些实验误差 和变异显然应当是允许的。[0067]除非另外说明,本发明的实施采用本领域技术范围内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。参见,例如T.E.Creighton, Proteins:Structures and Molecular Properties(W.H.Freeman and Company, 1993) ;A.L.Lehninger,Biochemistry(Worth Publishers, Inc., current addition);Sambrook等,Molecular Cloning:A Laboratory Manual (2nd Edition, 1989);Methods InEnzymology(S.Colowick and N.Kaplan eds., Academic Press,Inc.) ;Remington'sPharmaceutical Sciences,18th Edition(Easton, Pennsylvania:Mack PublishingCompany, 1990);Carey 和 Sundberg Advanced Organic Chemistry3rd Ed.(Plenum Press)卷 A 和 B(1992)。
[0068]材料和方法_9] 统计学方法
[0070]所有统计学方法使用R软件包进行。在下面更详细地描述和说明了使用的统计学方法。
[0071]某因诜择
[0072]用于RT-PCR的基因基于重要性、倍数变化、途径分析和文献支持进行选择。基于基因:基因相关性的分层聚类确保RT-PCR基因代表多个簇。归一化基因基于低变异性、中等到高表达及与病例:对照状态、性别、年龄或细胞计数的非显著相关性进行选择。
[0073]PCR统计分析
[0074]使用单变量和多变量逻辑回归评估临床/人口统计学因素的吸烟状态相关性。基因表达与吸烟状态和其它临床/人口统计学因素的相关性通过强力的逻辑回归评估(未调整的和性别/年龄调整的)。7
[0075]全某闵纟目微阵列分析`
[0076]阶段1- PREDICT 发现。
[0077]我们对从210名导管室患者分离的RNA进行全基因组微阵列分析,该患者进入设计用于鉴别与冠状动脉疾病相关的基因表达印记的前瞻性临床试验(PREDICT)中。
[0078]血液在插管时在PAXgen管中收集。RNA使用Agencourt RNAdvance系统通过自动方法分离,并使用(Invitrogen (现为 Life Technologies), Carlsbad, CA)定量。RNA用 Cy3采用制造商(Agilent, Santa Clara, CA)推荐的方法进行标记并与全基因组阵列(AgilentHuman Whole Genome Arrays)杂交。
[0079]阵列归一化
[0080]Agilent处理的用于阵列归一化的信号值缩放到100的调整平均值,然后进行log2变换。标准阵列QC度量(存在的百分比、成对相关性和信号强度)用于质量评估,导致210个PREDICT样品中的12个被排除。
[0081]阵列分析
[0082]对于PREDICT阵列,在给定配对设计的情况下,使用条件逻辑回归。错误发现率用于说明多重比较。GOEAST用于确定基因本体(GO)项的过度表现(over-representation)。
[0083]阵列特征数据使用Agilent Feature Extraction软件提取并利用分位数归一化进行归一化。
[0084]算法计算和变换[0085]数据预加工和QC步骤
[0086]I)对于各算法基因/样品计算三重的孔的中位值
[0087]a.如果一个孔没有呼叫(call),则使用两个剩余的孔的中位值
[0088]b.如果两个或三个孔没有呼叫,则基因算法对该样品接受没有呼叫
[0089]c.计算算法基因SD的中位值。如果这一值大于0.15,则样品对于高重复SD(highreplicate SD)是不合格的。
[0090]2)对于各算法基因i,最低Cp值通过用GLi代替小于GLi的值产生。该值代表算法开发集中该基因的Cp的第一百分位。
[0091]3)对于各算法基因i,最高Cp值通过用OTi代替大于OTi的值产生。该值代表算法开发集中该基因的Cp的第99百分位。
[0092]4)对于各算法基因i,计算其Cp值和GUi之间差异的绝对值,其中GMi代表算法开发集中该基因的中位Cp。这一值在算法基因中求和。如果总和大于27.17,则样品对于Expression Profile Out of Range是不合格的。27.17代表算法开发集内这一度量的最大值。
[0093]在某些情况中,对于受试者不计算算法评分,其理由包括低PAXgene?管血液
量、实验室QC不合格等。这些失败的发生频率被制表,尽管这些受试者不包括在分析集中。
[0094]为鉴别其表达水平与吸烟相关的基因,使用强线性模型(8),其中吸烟状态用作因变量且年龄、性别和基因表达用作自变量。表1包含4988个探针(代表4214个基因),其显示出与吸烟状态的显著相关性(p〈0.05)。1933个探针在吸烟者中下调(由负的吸烟对数优势表明)和3055个探针在吸烟者中上调(由正的吸烟对数优势表明)(表1)。
[0095]表1
[0096]
【权利要求】
1.用于对从受试者获得的样品进行评分的计算机执行的方法,其中所述评分指示所述受试者的吸烟状态,该方法包括: 获得与所述样品相关的数据集,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或F0XP3,其中标志物4是GOPC或MCM和其中标志物5是LEFl或CCR7 ;和 通过计算机处理器使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指示。
2.权利要求1的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据,其中标志物I是CLDND1,其中标志物2是LRRN3,其中标志物3是MUCl,其中标志物4是GOPC且其中标志物5是LEFl。
3.权利要求1的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中两个或更多个的定量表达数据。
4.权利要求1的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中三个或更多个的定量表达数据。
5.权利要求1的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中四个或更多个的定量表达数据。
6.权利要求1的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据。
7.权利要求1-6中任一项 的方法,进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。
8.权利要求7的方法,其中所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
9.权利要求1-8中任一项的方法,其中所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
10.权利要求1-9中任一项的方法,其中所述数据集进一步包括用于计算所述评分的临床因素。
11.权利要求10的方法,其中所述临床因素选自性别和高血压。
12.权利要求11的方法,其中所述临床因素是性别。
13.权利要求1-12中任一项的方法,其中所述解释函数是基于预测模型。
14.权利要求13的方法,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
15.权利要求1-14中任 一项的方法,其中所述解释函数是log(pr (吸烟者)/ (l_Pr (吸烟者))=15.78306+0.3876*SEX-3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。
16.权利要求1-15中任一项的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
17.权利要求1-16中任一项的方法,其中获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。
18.权利要求1-17中任一项的方法,其中获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。
19.权利要求1-18中任一项的方法,其中获得储存在存储器上的所述数据集。
20.权利要求1-19中任一项的方法,其中所述定量表达数据来自杂交数据。
21.权利要求1-20中任一项的方法,其中所述定量表达数据来自聚合酶链反应数据。
22.权利要求1-21中任一项的方法,其中所述定量表达数据来自序列数据。
23.用于对从受试者获得的样品进行评分的计算机执行的方法,包括: 获得与所述样品相关的数据集,其中所述数据集包括用于计算评分的临床因素及选自CLDNDl、IL7R、LRRN3、CCR7、MUC1、FOXP3、GOPC, MCM3、LEFl 和 CCR7 的至少一个标志物的定量表达水平值;和 通过计算机处理器使用解释函数从所述数据集确定所述评分,其中所述评分是所述受试者的吸烟状态的指示。
24.权利要求23的方法,其中所述数据集包括CLDND1、LRRN3、MUC1、G0PC和LEFl的定量表达数据。
25.权利要求23的方法,其中所述数据集包括两个或更多个标志物的定量表达数据。
26.权利要求23的方法,其中所述数据集包括三个或更多个标志物的定量表达数据。
27.权利要求23的方法,其中所述数据集包括四个或更多个标志物的定量表达数据。
28.权利要求23的方法,其中所述数据集包括五个或更多个标志物的定量表达数据。
29.权利要求23-28中任一项的方法,进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。
30.权利要求29的方法,其中所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
31.权利要求23-30中任一项的方法,其中所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
32.权利要求23-31中任一项的方法,其中所述临床因素选自性别和高血压。
33.权利要求32的方法,其中所述临床因素是性别。
34.权利要求23-33中任一项的方法,其中所述解释函数是基于预测模型.
35.权利要求34的方法,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
36.权利要求23-35中任一项的方法,其中所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。
37.权利要求23-36中任一项的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
38.权利要求23-37中任一项的方法,其中获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。
39.权利要求23-38中任一项的方法,其中获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。
40.权利要求23-39中任一项的方法,其中获得储存在存储器上的所述数据集。
41.权利要求23-40中任一项的方法,其中所述定量表达数据来自杂交数据。
42.权利要求23-41中任一项的方法,其中所述定量表达数据来自聚合酶链反应数据。
43.权利要求23-42中任一项的方法,其中所述定量表达数据来自序列数据。
44.用于对从受试者获得的样品进行评分的系统,其中所述评分指示所述受试者的吸烟状态,该系统包括: 用于储存与所述样品相关的数据集的存储器,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或FOXP3,其中标志物4是GOPC或MCM3和其中标志物5是LEFl或CCR7 ;和 与所述存储器通讯偶联的处理器,其用于使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指示。
45.权利要求44的系统,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据,其中标志物I是CLDND1,其中标志物2是LRRN3,其中标志物3是MUCl,其中标志物4是GOPC和其中标志物5是LEFl。
46.权利要求44的系统,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中两个或更多个的定量表达数据。
47.权利要求44的系统,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中三个或更多个的定量表达数据。
48.权利要求44的系统,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中四个或更多个的定量表达数据。
49.权利要求44的系统,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据。
50.权利要求44-49中任一项的系统,进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。
51.权利要求50的系统,其中所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
52.权利要求44-51中任一项的系统,其中所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
53.权利要求44-52中任一项的系统,其中所述数据集进一步包括用于计算所述评分的临床因素。
54.权利要求53的系统,其中所述临床因素选自性别和高血压。
55.权利要求54的系统,其中所述临床因素是性别。
56.权利要求44-55中任一项的系统,其中所述解释函数是基于预测模型。
57.权利要求56的系统,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
58.权利要求44-57中任一项的系统,其中所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。
59.权利要求44-58中任一项的系统,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
60.权利要求44-59中任一项的系统,其中获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。
61.权利要求44-60中任一项的系统,其中获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。
62.权利要求44-61中任一项的系统,其中获得储存在存储器上的所述数据集。
63.权利要求44-62中任一项的系统,其中所述定量表达数据来自杂交数据。
64.权利要求44-63中任一项的系统,其中所述定量表达数据来自聚合酶链反应数据。
65.权利要求44-64中任一项的系统,其中所述定量表达数据来自序列数据。
66.储存计算机可执行的程 序代码的计算机可读存储介质,所述程序代码包括: 用于储存与所述样品相关的数据集的程序代码,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或FOXP3,其中标志物4是GOPC或MCM3且其中标志物5是LEFl或CCR7 ;和 用于使用解释函数从所述数据集确定评分的程序代码,其中所述评分是所述受试者的吸烟状态的指示。
67.权利要求66的介质,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据,其中标志物I是CLDND1,其中标志物2是LRRN3,其中标志物3是MUCl,其中标志物4是GOPC且其中标志物5是LEFl。
68.权利要求66的介质,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中两个或更多个的定量表达数据。
69.权利要求66的介质,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中三个或更多个的定量表达数据。
70.权利要求66的介质,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中四个或更多个的定量表达数据。
71.权利要求66的介质,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据。
72.权利要求66-71中任一项的介质,进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。
73.权利要求72的介质,其中所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘.
74.权利要求66-73中任一项的介质,其中所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
75.权利要求66-74中任一项的介质,其中所述数据集进一步包括用于计算所述评分的临床因素。
76.权利要求75的介质,其中所述临床因素选自性别和高血压。
77.权利要求76的介质,其中所述临床因素是性别。
78.权利要求66-77中任一项的介质,其中所述解释函数是基于预测模型。
79.权利要求78的介质,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
80.权利要求66-79中任一项的介质,其中所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。
81.权利要求66-80中任一项的介质,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
82.权利要求66-81中任一项的介质,其中获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。
83.权利要求66-82中任一项的介质,其中获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。`
84.权利要求66-83中任一项的介质,其中获得储存在存储器上的所述数据集。
85.权利要求66-84中任一项的介质,其中所述定量表达数据来自杂交数据。
86.权利要求66-85中任一项的介质,其中所述定量表达数据来自聚合酶链反应数据。
87.权利要求66-86中任一项的介质,其中所述定量表达数据来自序列数据。
88.用于对从受试者获得的样品进行评分的方法,其中所述评分指示受试者的吸烟状态,该方法包括: 从所述受试者获得样品,其中所述样品包含多种分析物; 将所述样品与试剂接触; 生成所述试剂与所述多种分析物之间的多种复合物; 检测所述多种复合物以获得与所述样品相关的数据集,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或FOXP3,其中标志物4是GOPC或MCM3和其中标志物5是LEFl或CCR7 ;和 使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指/Jn ο
89.权利要求88的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据,其中标志物I是CLDND1,其中标志物2是LRRN3,其中标志物3是MUCl,其中标志物4是GOPC和其中标志物5是LEFl。
90.权利要求88的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中两个或更多个的定量表达数据。
91.权利要求88的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中三个或更多个的定量表达数据。
92.权利要求88的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中四个或更多个的定量表达数据。
93.权利要求88的方法,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据。
94.权利要求88-93中任一项的方法,进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。
95.权利要求94的方法,其中所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
96.权利要求88-95中任一项的方法,其中所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
97.权利要求88-96中任一项的方法,其中所述数据集进一步包括用于计算所述评分的临床因素。
98.权利要求97的方法,其中所述临床因素选自性别和高血压。
99.权利要求98的方法,其中所述临床因素是性别。
100.权利要求88-99中任一项的方法,其中所述解释函数是基于预测模型。
101.权利要求100的方法,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
102.权利要求88-101中任一项的方法,其中所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。
103.权利要求88-102中任一项的方法,其中所述解释函数是选自由表7中的解释函数构成的组的解释函数。
104.权利要求88-103中任一项的方法,其中所述定量表达数据来自杂交数据。
105.权利要求88-104中任一项的方法,其中所述定量表达数据来自聚合酶链反应数据。
106.权利要求88-105中任一项的方法,其中所述定量表达数据来自序列数据。
107.用于对从受试者获得的样品进行评分的试剂盒,其中所述评分指示受试者的吸烟状态,该试剂盒包括: 包含用于从获自所述受试者的样品确定标志物1、标志物2、标志物3、标志物4和/或标志物5中一个或多个的定量表达数据的多种试剂的试剂组,其中标志物I是CLDNDl或IL7R,其中标志物2是LRRN3或CCR7,其中标志物3是MUCl或FOXP3,其中标志物4是GOPC或MCM3和其中标志物5是LEFl或CCR7 ;和 使用所述多种试剂从所述样品确定数据集中的定量表达数据的说明,其中所述说明包括通过计算机处理器使用解释函数从所述数据集确定评分的说明,其中所述评分是所述受试者的吸烟状态的指示。
108.权利要求107的试剂盒,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据,其中标志物I是CLDND1,其中标志物2是LRRN3,其中标志物3是MUCl,其中标志物4是GOPC和其中标志物5是LEFl。
109.权利要求107的试剂盒,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中两个或更多个的定量表达数据。
110.权利要求107的试剂盒,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中三个或更多个的定量表达数据。
111.权利要求107的试剂盒,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5中四个或更多个的定量表达数据。
112.权利要求107的试剂盒,其中所述数据集包括标志物1、标志物2、标志物3、标志物4和标志物5的定量表达数据。
113.权利要求107-112中任一项的试剂盒,进一步包括用于通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险的说明。
114.权利要求113的试剂盒,其中所述吸烟相关疾病是慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和/或哮喘。
115.权利要求107-114中任一项的试剂盒,其中所述数据集包括选自表1中的至少一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个另外的标志物的定量表达数据。
116.权利要求107-115中任一项的试剂盒,其中所述数据集进一步包括用于计算所述评分的临床因素。
117.权利要求116的试剂盒,其中所述临床因素选自性别和高血压。
118.权利要求117的试剂盒,其中所述临床因素是性别。`
119.权利要求107-118中任一项的试剂盒,其中所述解释函数是基于预测模型。
120.权利要求119的试剂盒,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
121.权利要求1-120中任一项的试剂盒,其中所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。
122.权利要求107-121中任一项的试剂盒,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
123.权利要求107-122中任一项的试剂盒,其中所述定量表达数据来自杂交数据。
124.权利要求107-123中任一项的试剂盒,其中所述定量表达数据来自聚合酶链反应数据。
125.权利要求107-124中任一项的试剂盒,其中所述定量表达数据来自序列数据。
126.用于确定受试者的吸烟状态的方法,包括: 获得与从所述受试者获得的样品相关的数据集,其中所述数据集包括选自表1的标志物的定量表达数据;和 分析所述数据集以确定所述标志物的表达水平,其中所述标志物的所述表达水平与所述受试者的所述吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。
127.权利要求126的方法,进一步包括利用所述受试者的所述确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险。
128.权利要求127的方法,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
129.权利要求126的方法,其中所述分析步骤进一步包括将所述标志物的所述确定的表达水平与阈值相比较,其中所述确定的表达水平与所述阈值之间的差异指示肯定的吸烟状态。
130.权利要求129的方法,其中所述阈值与从非吸烟受试者或非吸烟受试者群体获得的表达数据相关。
131.权利要求126的方法,其中所述分析步骤进一步包括将解释函数应用于所述标志物的所述确定的水平以生成评分,其中所述评分是所述受试者的吸烟状态的指示。
132.权利要求131的方法,进一步包括利用所述受试者的所述确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险。
133.权利要求132的方法,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
134.权利要求131的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
135.权利要求126的方法,其中所述数据集包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的定量表达数据。
136.权利要求135的方法,其中所述分析步骤进一步包括将解释函数应用于所述标志物的所述确定的水平以生成评分,其中所述评分是所述受试者的吸烟状态的指示。
137.权利要求136的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
138.权利要求136的方法,其中所述解释函数是log(pr (吸烟者)/ (1-Pr (吸烟者))=15.78306+0.3876*SEX-3.3368*CLDNDl-3.4034钆RRN3-1.4847蝴UC1+5.920淋G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。
139.权利要求126的方法,其中所述标志物的所述表达水平与所述受试者的所述吸烟状态正相关。
140.权利要求129的方法,其中所述标志物的所述表达水平显著高于所述阈值。
141.权利要求126的方法,其中所述标志物的所述表达水平与所述受试者的吸烟状态负相关。
142.权利要求129的方法,其中所述标志物的所述表达水平显著低于所述阈值。
143.权利要求126的方法,其中所述方法在一台或多台计算机上执行。
144.权利要求126的方法,其中获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。
145.权利要求126的方法,其中获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。
146.权利要求126的方法,其中所述定量表达数据从基于核苷酸的分析获得。
147.权利要求146的方法,其中所述定量表达数据从qRT-PCR分析、杂交分析或通过测序反应获得。
148.用于确定受试者的吸烟状态的方法,包括: 从所述受试者获得样品,其中所述样品包含选自表1的标志物; 将所述样品与试剂接触; 生成所述试剂与所述标志物之间的复合物; 检测所述复合物以获得与所述样品相关的数据集,其中所述数据集包括所述标志物的定量表达数据;和 分析所述数据集以确定所述标志物的表达水平,其中所述标志物的所述表达水平与所述受试者的吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。
149.权利要求148的方法,进一步包括利用所述受试者的确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险。
150.权利要求149的方法,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
151.权利要求148的方法,其中所述分析步骤进一步包括将所述标志物的所述确定的表达水平与阈值相比较,其中所述确定的表达水平与所述阈值之间的差异指示肯定的吸烟状态。
152.权利要求151的 方法,其中所述阈值与从非吸烟受试者或非吸烟受试者群体获得的表达数据相关。
153.权利要求148的方法,其中所述分析步骤进一步包括将解释函数应用于所述标志物的所述确定的水平以生成评分,其中所述评分是所述受试者的所述吸烟状态的指示。
154.权利要求153的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
155.权利要求148的方法,其中所述数据集包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的定量表达数据。
156.权利要求155的方法,其中所述分析步骤进一步包括将解释函数应用于所述标志物的所述确定的水平以生成评分,其中所述评分是所述受试者的吸烟状态的指示。
157.权利要求156的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
158.权利要求156的方法,其中所述解释函数是log(pr (吸烟者)/ (1-Pr (吸烟者))=15.78306+0.3876*SEX-3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。
159.权利要求148的方法,其中所述标志物的所述表达水平与所述受试者的所述吸烟状态正相关。
160.权利要求151的方法,其中所述标志物的所述表达水平显著高于所述阈值。
161.权利要求148的方法,其中所述标志物的所述表达水平与所述受试者的所述吸烟状态负相关。
162.权利要求151的方法,其中所述标志物的所述表达水平显著低于所述阈值。
163.用于确定受试者的吸烟状态的计算机执行的方法,包括:在存储器中储存与从所述受试者获得的样品相关的数据集,其中所述数据集包括选自表1的标志物的定量表达数据;和 通过计算机处理器分析所述数据集以确定所述标志物的表达水平,其中所述标志物的所述表达水平与所述受试者的所述吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。
164.权利要求163的方法,进一步包括利用所述受试者的确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险。
165.权利要求164的方法,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
166.权利要求163的方法,其中所述分析步骤进一步包括将所述标志物的所述表达水平与阈值相比较,其中所述表达水平与所述阈值之间的差异指示肯定的吸烟状态。
167.权利要求166的方法,其中所述阈值与从非吸烟受试者或非吸烟受试者群体获得的表达数据相关。
168.权利要求163的方法,其中所述分析步骤进一步包括将解释函数应用于所述标志物的所述确定的水平以生成评分,其中所述评分是所述受试者的吸烟状态的指示。
169.权利要求168的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
170.权利要求163的方法,其中所述数据集包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的定量表达数据。
171.权利要求170的方法,其中所述分析步骤进一步包括将解释函数应用于所述标志物的所述确定的水平以生成评分,`其中所述评分是所述受试者的吸烟状态的指示。
172.权利要求171的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
173.权利要求171的方法,其中所述解释函数是log(pr (吸烟者)/ (1-Pr (吸烟者))=15.78306+0.3876*SEX-3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。
174.权利要求163的方法,其中所述标志物的所述表达水平与所述受试者的吸烟状态正相关。
175.权利要求166的方法,其中所述标志物的所述表达水平显著高于所述阈值。
176.权利要求163的方法,其中所述标志物的所述表达水平与所述受试者的吸烟状态负相关。
177.权利要求166的方法,其中所述标志物的所述表达水平显著低于所述阈值。
178.用于确定受试者的吸烟状态的系统,所述系统包括: 用于储存与从受试者获得的样品相关的数据集的存储器,其中所述数据集包括选自表I的标志物的定量表达数据;和 与所述存储器通讯偶联的处理器,其用于分析所述数据集以确定所述标志物的表达水平,其中所述标志物的所述表达水平与所述受试者的吸烟状态正相关或负相关,因而确定所述受试者的吸烟状态。
179.权利要求178的系统,其中所述处理器经编程以利用所述受试者的所述确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险。
180.权利要求179的系统,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
181.权利要求178的系统,进一步包括用于储存包含选自表1的标志物的阈值的数据集的存储器。
182.权利要求181的系统,其中所述阈值与从非吸烟受试者或非吸烟受试者群体获得的表达数据相关。
183.权利要求178的系统,其中与所述样品相关的所述数据集包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的定量表达数据。
184.权利要求178的系统,其中所述处理器经编程以将解释函数应用于所述标志物的所述确定的水平并生成评分,其中所述评分是所述受试者的吸烟状态的指示。
185.权利要求184的系统,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
186.权利要求183的系统,其中所述处理器经编程以将解释函数应用于所述确定的表达水平并生成评分,其中所述评分是所述受试者的吸烟状态的指示。
187.权利要求186的系统,其中所述解释函数是log(pr (吸烟者)/ (1-Pr (吸烟者))=15.78306+0.3876*SEX-3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。
188.储存计算机可执行程序`代码的计算机可读存储介质,所述程序代码包括: 用于储存与从受试者获得的样品相关的数据集的程序代码,其中所述数据集包括选自表1的标志物的定量表达数据;和 用于分析所述数据集以确定所述标志物的表达水平的程序代码,其中所述标志物的所述表达水平与所述受试者的吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。
189.权利要求188的计算机可读存储介质,进一步包括用于基于所述确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险的程序代码。
190.权利要求189的计算机可读存储介质,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
191.权利要求188的计算机可读存储介质,进一步包括用于将解释函数应用于所述确定的水平以生成评分的程序代码,其中所述评分是所述受试者的吸烟状态的指示。
192.权利要求191的计算机可读存储介质,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
193.权利要求191的计算机可读存储介质,其中所述解释函数是log(pr(吸烟者)/(1-Pr (吸烟者))=15.78306+0.3876*SEX_3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=1,和如果为女性,则SEX=O,且Pr是概率。
194.用于确定受试者的吸烟状态的试剂盒,包括: 用于从获自所述受试者的样品确定选自表1的标志物的定量表达数据的试剂组;和使用所述试剂组从所述样品确定定量表达数据并分析所述数据集以确定所述标志物的表达水平的说明,其中所述标志物的所述表达水平与所述受试者的吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。
195.权利要求194的试剂盒,其中所述说明进一步包括利用所述受试者的确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险的说明。
196.权利要求195的试剂盒,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
197.权利要求194的试剂盒,其中所述说明进一步包括进行基于核苷酸的分析的说明。
198.权利要求194的试剂盒,其中所述定量表达数据包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的数据。
199.用于确定受试者的吸烟状态的试剂盒,包括: 基本上由用于从获自所述受试者的样品确定选自表1的标志物的定量表达数据的多种试剂组成的试剂组;和 使用所述多种试剂从所述样品测定定量表达数据并分析所述数据集以确定所述标志物的表达水平的说明,其中所述标志物的所述表达水平与所述受试者的吸烟状态正相关或负相关,从而确定所述受试者的吸烟状态。
200.权利要求199的试 剂盒,其中所述说明进一步包括利用所述受试者的确定的吸烟状态评估所述受试者发生吸烟相关疾病的风险的说明。
201.权利要求200的试剂盒,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
202.权利要求36的试剂盒,其中所述说明进一步包括进行基于核苷酸的分析的说明。
203.权利要求36的试剂盒,其中所述定量表达数据包括选自表1中的至少两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的数据。
204.用于对从受试者获得的样品进行评分的计算机执行的方法,其中所述评分指示所述受试者的吸烟状态,该方法包括: 获得与所述样品相关的数据集,其中所述数据集包括选自表1的多个标志物的定量表达数据; 通过计算机处理器使用解释函数从所述数据集确定评分,其中所述评分是所述受试者的吸烟状态的指示。
205.权利要求204的方法,进一步包括通过计算机处理器基于所述评分确定所述受试者发生吸烟相关疾病的风险。
206.权利要求204的方法,其中所述吸烟相关疾病选自慢性阻塞性肺病、慢性支气管炎、肺气肿、肺癌和哮喘。
207.权利要求204的方法,其中所述数据集包括选自表1中的至少三个、四个、五个、六个、七个、八个、九个、十个、十一个 、十二个、十三个、十四个、十五个、十六个、十七个、十八个、十九个、二十个或更多个标志物的定量表达数据。
208.权利要求204的方法,其中所述解释函数是基于预测模型。
209.权利要求208的方法,其中所述预测模型选自偏最小二乘模型、逻辑回归模型、线性回归模型、线性判别分析模型、脊状回归模型和基于树的递归划分模型。
210.权利要求204的方法,其中获得与所述样品相关的所述数据集包括获得所述样品和处理所述样品以通过试验确定所述数据集。
211.权利要求204的方法,其中获得与所述样品相关的所述数据集包括直接或间接地从已经处理所述样品以通过试验确定所述数据集的第三方接收所述数据集。
212.权利要求204的方法,其中所述定量表达数据源自杂交数据。
213.权利要求204的方法,其中所述定量表达数据源自聚合酶链反应数据。
214.权利要求204的方法,其中所述定量表达数据源自序列数据。
215.权利要求204的方法,其中所述数据集包括选自表1的至少一个、至少两个、至少三个、至少四个或至少五个标志物的数据。
216.权利要求215的方法,其中所述标志物包括CDNDl、LRRN3、MUCl、GOPC或LEFl或者选自表1的其表达与CDND1、LRRN3、MUC1、G0PC和LEFl相关的标志物。
217.权利要求216的方法,其中所述的其表达与⑶NDl相关的标志物是IL7R。
218.权利要求216的方法,其中所述的其表达与LRRN3相关的标志物是CCR7。
219.权利要求216的方法,其中所述的其表达与MUCl相关的标志物是F0XP3。
220.权利要求216的方法,其中所述的其表达与GOPC相关的标志物是MCM3。
221.权利要求216的方法,其中所述的其表达与LEFl相关的标志物是CCR7。
222.权利要求215的方法,其中所述数据集包括选自表1的至少五个标志物。
223.权利要求222的方法,其中所述至少五个标志物是CLDNDl、LRRN3、MUCl、GOPC和LEFl或者其表达与CLDND1、LRRN3、MUC1、GOPC和LEFl相关的标志物。
224.权利要求222的方法,其中所述解释函数是log(pr (吸烟者)/ (1-Pr (吸烟者))=15.78306+0.3876*SEX-3.3368*CLDND1_3.4034*LRRN3_1.4847*MUCl+5.9209*G0PC+2.27166*LEF1,其中如果为男性,则SEX=I,和如果为女性,则SEX=O,且Pr是概率。
225.权利要求215的方法,其中所述解释函数是选自由表7中给出的解释函数构成的组的解释函数。
【文档编号】C12Q1/68GK103890193SQ201280048279
【公开日】2014年6月25日 申请日期:2012年8月24日 优先权日:2011年8月29日
【发明者】S·罗森伯格, M·R·埃拉肖夫, P·贝尼克, J·A·温格罗维 申请人:心脏Dx公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1