用于诊断胃肠胰神经内分泌瘤的组合物、方法和试剂盒与流程

文档序号:11285485阅读:450来源:国知局
相关申请的交叉引用本发明要求2014年9月15日提交的u.s.s.n.62/050,465的权益和优先权,其内容以其整体结合到本文中。发明背景胃肠胰(gep)神经内分泌瘤(gep-nen),亦称为胃肠胰神经内分泌肿瘤和神经内分泌肿瘤(net),在美国是第二最流行的胃肠(gi)道恶性肿瘤。在过去三十年期间在美国,发病率和流行率已增加了100-600%,存活率没有显著增加。gep-nen的异质性和复杂性使得诊断、治疗和分类变得困难。这些肿瘤缺少通常与其它癌症相关的若干突变,和在很大程度上不存在微卫星不稳性。参见tannapfela,vomschlosss,karhoffd等“brafgenemutationsarerareeventsingastroenteropancreaticneuroendocrinetumors,”amjclinpathol2005;123(2):256-60;banckm,kanwarr,kulkarniaa等“thegenomiclandscapeofsmallintestineneuroendocrinetumors,”jclininvest2013;123(6):2502-8;zikusokamn,kiddm,eickg等moleculargeneticsofgastroenteropancreaticneuroendocrinetumors.cancer2005;104:2292-309;kiddm,eickg,shapiromd等microsatelliteinstabilityandgenemutationsintransforminggrowthfactor-betatypeiireceptorareabsentinsmallbowelcarcinoidtumors,”cancer2005;103(2):229-36。自组织来源例如活检确定的个体组织病理学亚型与不同的临床行为有关,然而没有明确的公认病理学分类或预测方案,阻碍了治疗评估和随访。现有的gep-nen诊断和预后方法包括成像(例如ct或mri)、组织学、测量与nen相关的循环激素和蛋白质例如嗜铬粒蛋白a,和检测一些基因产物。可用的方法受到以下限制,例如,低的灵敏性和/或特异性,不能检测早期疾病,或暴露于放射风险。gep-nen经常无法诊断,直到它们转移,并且经常不可治疗。此外,随访困难,特别是在带有残留疾病负荷的患者中。对用于检测gep-nen(包括稳定的和进行性gep-nen),例如用于诊断、预后、预测、分期、分类、治疗、监测和风险评估,和用于研究和理解该疾病的发病机理、恶性和侵袭性的分子因素的特异和灵敏的方法和试剂,存在需要。例如,需要这样的方法和试剂,其可重复和直接地以低风险暴露收集,例如非侵入性外周血检验,可简单、快速和相对低成本地进行。通过提供用于在循环外周血样品中准确诊断、检测和监测gep-nen的存在和/或gep-nen的类型或阶段的新的组合物、方法和试剂盒,本申请解决了上述问题。另外,所描述的实施方案可用于鉴定患者发生进行性gep-nen的风险水平,和/或确定在手术后或生长抑素治疗后的人患者中残留或再发性进行性gep-nen的风险。此外,其可用作预测对疗法例如肽受体放射疗法(prrt)的反应的预后。发明简述在一个方面,本发明涉及在循环血液中测量的胃肠胰神经内分泌瘤(gep-nen)生物标记物,其检测可用于诊断、预后和预测方法。所提供的目标包括gep-nen生物标记物,生物标记物的特征性亚组和小组,结合和检测生物标记物的试剂,包含所述试剂的试剂盒和系统,和检测生物标记物(例如在生物样品例如血液中)的方法和组合物,以及其预后、预测、诊断和治疗用途。提供用于gep-nen预后、检测和诊断的试剂、试剂组和包含所述试剂的系统。通常,所述系统包括多种试剂(例如一组试剂),其中多种试剂特异性结合和/或检测在gep-nen生物标记物小组中的多种gep-nen生物标记物。所述试剂可以是特异性结合一种或多种gep-nen生物标记物的分离的多肽或多核苷酸。例如,提供结合gep-nen生物标记物小组的分离的多核苷酸和多肽组,和其方法和用途。还提供所述试剂、组合物、系统和试剂盒用于gep-nen和相关病况、综合征和症状的预后、诊断和预测方法和用途。例如,提供用于gep-nen或其结果、阶段或侵袭性水平或风险,或相关病况的检测、诊断、分类、预测、治疗监测、预后或其它评价的方法和用途。在一些实施方案中,通过以下来进行所述方法:检测gep-nen生物标记物、更通常是多种gep-nen生物标记物、例如选自一小组生物标记物的特征性亚组的存在、不存在、表达水平或表达谱,和/或与正常或参比表达水平或谱或标准比较这样的信息。因此,在一些实施方案中,所述方法通过获得生物学试验样品和检测本文所述的gep-nen生物标记物的存在、不存在、表达水平评分或表达谱来进行。例如,所述方法可用本文提供的任何试剂系统,例如多核苷酸或多肽进行。例如,所述方法一般使用一种或多种所提供的系统进行。提供用于检测和区别许多不同的gep-nen类型或阶段的方法、试剂和组合物。示例性的gep-nen类型和阶段包括稳定的疾病(sd)和进行性的(高活性)疾病(pd)。在一个方面,提供可用于特异性和灵敏性检测gep-nen的不同阶段,例如稳定的疾病(sd)或进行性的疾病(pd)状态的gep-nen的方法和组合物;在一些方面,所述方法和组合物可用于预测疾病进展、治疗反应和转移。本文提供的方法和组合物可用于诊断、预后、预测、分期、分类、治疗、监测gep-nen疾病、评估gep-nen疾病的风险和研究与gep-nen疾病有关的分子因素。提供这样的方法,与其它诊断和预后方法相比,其能够快速、简单和相对低成本地进行。提供这样的方法和组合物,其可用于定义基于基因表达的gep-nen分类,因此可用于允许例如在早期阶段疾病,或使用组织学阴性样品,预测恶性肿瘤和转移,提供准确分期,促进合理疗法,和开发用于gep-nen-特异性治疗的大的经验证临床数据集。gep-nen生物标记物可包括一个生物标记物亚组,其表达在存在或不存在gep-nen时是不同的,或与gep-nen的存在或不存在有关,或在特定分类、阶段、侵袭性、严重性、程度、转移、症状、风险、治疗反应性或功效,或伴随的综合征方面是不同的,或与特定分类、阶段、侵袭性、严重性、程度、转移、症状、风险、治疗反应性或功效,或伴随的综合征有关。gep-nen生物标记物亚组通常包括至少22种gep-nen生物标记物。在一些实施方案中,生物标记物亚组包括至少22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或51种gep-nen生物标记物,或包括22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或51种gep-nen生物标记物,或约22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或51种gep-nen生物标记物。例如,在一些方面,生物标记物亚组包括至少22或至少38或至少51种生物标记物。在一个特定的实例中,亚组包含至少22种生物标记物,或约22种生物标记物,或22种生物标记物,其选自38种生物标记物的小组。在一些实施方案中,生物标记物亚组包括至少22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37或38种生物标记物,其选自38种生物标记物的小组。因为所述系统、方法和试剂盒包含特异性地与小组中的生物标记物结合或杂交的多种试剂,生物标记物的数量通常与特定系统中的试剂的数量有关。例如,提供的方法包括包含至少22种结合试剂的方法,所述试剂分别与至少22种gep-nen生物标记物的亚组特异性杂交或结合。在一些方面,生物标记物亚组包括至少22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37种和/或全部的以下基因产物组,包括多核苷酸(例如38种转录物)和多肽:pnma2、nap1l1、fzd7、slc18a2/vmat2、nol3、sstr5、tph1、raf1、rsf1、sstr3、sstr1、cd59、araf、aplp2、kras、morf4l2、trmt112、mki67/ki67、sstr4、ctgf、spata7、zfhx3、phf21a、slc18a1/vmat1、zzz3、tecpr2、atp6v1h、oaz2、pank2、pld3、pqbp1、rnf41、smarcd3、bnip3l、wdfy3、commd9、braf和/或glt8d1基因产物。在一个特定的实例中,22种生物标记物的亚组包括pnma2、nap1l1、fzd7、slc18a2、nol3、sstr5、tph1、raf1、rsf1、sstr3、sstr1、cd59、araf、aplp2、kras、morf4l2、trmt112、mki67、sstr4、ctgf、spata7和zfhx3基因产物。提供的方法、试剂和系统包括能够在人血液样品中分类或检测gep-nen的那些方法、试剂和系统。在一些实施方案中,提供的系统和方法可在人血液样品中鉴定或分类gep-nen。在一些实例中,系统可以至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,例如至少80%的特异性、灵敏性和/或准确性提供这样的信息。在一些实施方案中,所述系统可预测对gep-nen治疗、例如手术干预或药物疗法(例如、生长抑素类似物疗法)的治疗反应性,或确定在所述治疗之后患者是否已变得临床稳定的,或对所述治疗有反应或无反应。在一些情况下,所述方法和系统以至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特异性、灵敏性和/或准确性,例如以至少90%准确性这样进行。在一些情况下,其可以至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特异性、灵敏性和/或准确性,例如以至少85%的灵敏性和特异性区分治疗和未治疗的gep-nen。在一些情况下,所述系统可确定关于之前诊断有gep-nen的受试者的诊断或预后信息,例如受试者是否具有gep-nen的稳定疾病(sd)状态或进行性疾病(pd)状态,或完全缓解,例如,在临床上分类为具有稳定疾病、进行性疾病,或完全缓解。在一些实施方案中,用于检测生物标记物的试剂,例如多核苷酸或多肽试剂组,和其应用,能够区别在生物学样品中gep-nen的存在和不存在,区别gep-nen和粘膜样品和gep-nen样品,和/或区别gep-nen的特定类型或亚型,例如侵袭性(高活性)和良性(低活性)gep-nen样品。在一个方面,所述系统能够分类或检测在人血液样品或人唾液样品中的gep-nen。在一个方面,人样品是全血,或自全血制备的核酸或蛋白质,没有对任何特定细胞群进行首次分选或富集。在一个方面,所述系统包括结合至少22种gep-nen生物标记物亚组中的生物标记物的试剂。在一些实施方案中,除了结合gep-nen生物标记物的试剂之外,提供的系统还包含一种或多种结合用于归一化或作为对照的基因产物,例如持家基因产物包括alg9基因产物的试剂。在一些实施方案中,所述方法包括选择选自38种生物标记物的小组的至少22种生物标记物的亚组,其用于产生gep-nen和gep-nen的不同阶段的分类器。在一些实施方案中,所述方法进一步包括使来自人患者的试验样品与特异于亚组中的生物标记物的多种试剂接触。用于所述方法的生物学试验样品可以是任何生物学样品,例如组织、生物学流体或其它样品,包括血液样品,例如血浆、血清、全血、血沉棕黄层或其它血液样品、组织、唾液、血清、尿或精液样品。在一些方面,样品获自血液。通常,试验样品获自gep-nen患者。试剂可以是用于检测生物标记物的任何试剂,和通常是分离的多核苷酸或分离的多肽或蛋白质,例如抗体,例如与包括至少22种gep-nen生物标记物的gep-nen生物标记物的亚组或小组特异性杂交或结合的那些。在一些实施方案中,所述方法通过使试验样品与一种提供的试剂,更通常与多种提供的试剂,例如一种提供的系统,例如特异性结合gep-nen生物标记物亚组的一组多核苷酸接触进行。在一些实施方案中,多核苷酸组包括dna、rna、cdna、pna、基因组dna或合成的寡核苷酸。在一些实施方案中,所述方法包括在检测(例如通过rt-pcr,例如qpcr)之前,分离来自试验样品的rna的步骤。因此,在一些实施方案中,gep-nen生物标记物,例如其表达水平的检测,包括检测rna的存在、不存在或量。在一个实例中,rna通过pcr或通过杂交来检测。在一个方面,多核苷酸包括有义和反义引物,例如对生物标记物亚组中的每一种gep-nen生物标记物特异性的引物对。在该实施方案的一个方面,gep-nen生物标记物的检测通过pcr,通常是定量或实时pcr进行。例如,在一个方面,检测通过以下来进行:通过逆转录产生来自试验样品的cdna;然后使用与gep-nen生物标记物小组特异性杂交的有义和反义引物对扩增cdna,和检测扩增产物。在一些实施方案中,gep-nen生物标记物包括mrna、cdna或蛋白质。在一些实施方案中,所述方法进一步包括确定在试验样品中在亚组中选择的生物标记物的数学推导的表达水平评分。这是maarc-net评分(net的多分析物风险分类)。其具有两个量表0-8和换算为100%的百分比衍生,即0-100%。数学推导的maarc-net评分是自预测性分类算法建立的分类器的产物,例如支持向量机(svm)、线性判别分析(lda)、k-最近邻域(knn)和/或朴素贝叶斯(nb)。在一些实例中,分类器自svm、lda、knn和nb分类算法的组合和10-倍交叉验证设计产生。在一些实施方案中,所述方法进一步包括在正常或参比样品中确定在亚组中的生物标记物的数学推导的表达水平评分的步骤,通常在归一化和比较步骤之前进行。正常或参比样品可来自健康患者或具有gep-nen的患者。在试验样品来自gep-nen患者的情况下,正常或参比样品或水平可来自相同或不同的患者。例如,正常或参比样品可来自gep-nen患者的预期不包含gep-nen的组织、流体或细胞,或gep-nen细胞。另一方面,正常或对照样品来自在治疗干预之前或之后,例如在手术或化学干预之后的gep-nen患者。在另一方面,参比或正常样品来自对应于健康个体的试验样品的gep-nen或转移的组织或流体,例如正常的肠嗜铬细胞(ec)制备物或小肠(si)样品,或正常的肝、肺、骨、血液、唾液或其它体液、组织或生物学样品。在另一个实施方案中,试验样品来自gep-nen患者的转移、血浆或全血,或其它流体,和参比样品来自原发肿瘤或荧光活化细胞(fac)-分选的肿瘤细胞。在其它方面,试验样品来自血液,和试验生物学样品来自治疗后的gep-nen患者,和参比样品来自与试验生物学样品相同的治疗前gep-nen患者;参比样品来自未包含gep-nen细胞的组织或流体;参比样品来自健康个体;参比样品来自gep-nen之外的癌症;参比样品来自ec细胞或si组织;试验生物学样品来自转移的gep-nen,和参比样品来自非转移的gep-nen;或与获得试验生物学样品的gep-nen患者相比,参比样品来自不同分类的gep-nen。在一个方面,试验生物学样品来自治疗前的gep-nen患者,和正常或参比样品来自治疗后的gep-nen患者。在另一方面,正常或参比样品来自gep-nen患者的非转移组织。在一些情况下,进行归一化步骤以将在试验样品中在亚组中的生物标记物的表达评分水平归一化至在参比样品中在亚组中的生物标记物的表达评分水平。在一些情况下,进行比较步骤以确定在归一化的表达水平评分和预定的截止值或评分阈值之间是否存在差异,例如显著差异。某些预定的截止值或评分阈值指示gep-nen的不同阶段,而其它指示发生进行性gep-nen的不同风险水平,即低、中等或高。在一个方面,所述方法包括比较归一化的表达水平评分与经选择以排除对照或参比样品的预定的截止值,其中高于预定的截止值的归一化的表达水平指示gep-nen,其中截止值是约2(在0-8的量表中,或在0-100%的量表中为13.4%)。在另一方面,所述方法包括比较归一化的表达水平评分与经选择以排除非-进行性gep-nen的预定的截止值,其中高于预定的截止值5(在0-8的量表中,或在0-100%的量表中为43.4%)的归一化的表达水平指示进行性gep-nen。在另一方面,所述方法进一步包括鉴定人患者发生进行性gep-nen的风险水平,其中低于约5(或43.4%)的归一化的表达水平评分指示发生进行性gep-nen的低风险水平,在约5和7(43.4%-63.4%)之间的归一化的表达水平评分指示发生进行性gep-nen的中等风险水平,和在约7和8(>63.4%)之间的归一化的表达水平评分指示发生进行性gep-nen的高风险水平。在一些情况下,随后对于单个基因的实际表达水平(并非数学推导的表达水平评分)进行测定,其中鉴定发生进行性gep-nen的中等风险水平进一步包括确定第一状态的中等风险,其中在非-进行性的参比样品和试验样品之间的归一化的表达水平评分是约5(43.4%),smarcd3的归一化的表达水平低于第一阈值,和tph1的表达水平低于第二阈值。在其它情况下,鉴定发生进行性gep-nen的中等风险水平进一步包括确定第二状态的中等风险,其中在非-进行性的参比样品和试验样品之间的归一化的表达水平评分是约6(52.7%),vmat1的归一化的表达水平等于或高于0,和phf21a的表达水平等于或高于第一阈值。在一些情况下,鉴定发生进行性gep-nen的中等风险水平进一步包括确定第三状态的中等风险,其中在非-进行性的参比样品和试验样品之间的归一化的表达水平评分是约7(63.4%),vmat1的表达水平等于或高于0,和phf21a的表达水平等于或低于第一阈值。在其它情况下,鉴定发生进行性gep-nen的高风险水平进一步包括确定zzz3的归一化的表达水平评分,其中zzz3的表达水平评分等于或小于14。还提供了提供的生物标记物、试剂、系统和检测方法用于在手术后人患者中确定残留或再发性进行性gep-nen的风险的方法和用途。在这样的情况下,鉴定在手术后试验样品中残留或再发性进行性gep-nen的风险水平,其中归一化的表达水平评分低于约5(43.4%)指示低风险水平,归一化的表达水平评分在约5和7(43.4-63.4%)之间指示中等风险水平,和归一化的表达水平评分在约7和8(>63.4%)之间指示高风险水平。在一些情况下,鉴定残留或再发性进行性gep-nen的风险水平进一步包括确定在至少一个基因簇中的基因产物的表达水平评分升高,如在来自患者的手术前试验样品和手术后试验样品之间确定的。在一些实施方案中,至少一个基因簇包括增殖组(proliferome)、信号组(signalome)、分泌组(secretome)i和ii、多能组(plurome)、表观基因组(epigenome)、多能组、sstr组和其组合。在其它实施方案中,至少一个基因簇包括pd簇、nd簇、td簇和id簇。pd簇包括增殖组、信号组、分泌组ii、多能组和表观基因组。nd簇包括araf1、braf、kras、raf1、ki67、nap1l1、nol3、glt8d1、pld3、pnma2、vmat2、tph1、fzd7、morf4l2和zfhx3。td簇包括分泌组(i)、多能组和sstr组。id簇包括增殖组、分泌组(ii)、多能组和表观基因组。在其它实施方案中,确定在至少一个基因簇中基因产物的表达升高包括评价多个基因簇算法,包括pda、nda、tda和ida算法。在一些实施方案中,所述方法进一步包括根据残留或复发性进行性gep-nen的中等或高风险水平的指示通过手术或疗法之一治疗患者。还提供了提供的生物标记物、试剂、系统和检测方法用于在生长抑素类似物治疗后的患者中确定残留或再发性进行性gep-nen的风险的方法和用途。在这样的情况下,鉴定生长抑素治疗失败的风险水平,其中归一化的表达水平评分低于约5(43.4%)指示低风险水平,归一化的表达水平评分在约5和7(43.4-63.4%)之间指示中等风险水平,和归一化的表达水平评分在约7和8(>63.4%)之间指示高风险水平。所述方法可进一步包括确定在来自人患者的治疗前试验样品和治疗后试验样品之间在至少一个sstr组和增殖组基因簇中的表达水平评分的差异,其中表达评分的水平增加指示残留或再发性进行性gep-nen的风险增加。在一些情况下,根据残留或复发性进行性gep-nen的中等或高风险水平和至少一个sstr组和增殖组基因簇的表达水平增加的指示,将生长抑素类似物给予人患者。除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。在说明书中,单数形式也包括复数,除非上下文清楚地另外指明。尽管类似于或等同于本文描述的那些的方法和材料可用于实施或测试本发明,但下文描述了合适的方法和材料。本文提及的所有出版物、专利申请、专利和其它参考资料通过引用结合到本文中。并未承认本文引述的参考资料是要求保护的发明的现有技术。在冲突的情况下,以本说明书,包括定义为准。此外,材料、方法和实例仅是说明性的,和不意图是限制性的。根据以下详细描述和权利要求,本发明的其它特征和优点将是明显的。附图简述图1a-1e是显示相对于正常的肠粘膜对照,自神经内分泌肿瘤(net)组织的affymetrix人外显子1.0st阵列推论的标记物基因小组的差异外显子表达的图。(a)tph1、(b)vmat2、(c)scg5、(d)cga和(e)ptprn2的rma-归一化的外显子表达在正常(绿色)和肿瘤(样品)中可视化。图2a–2e是显示通过逆转录聚合酶链反应(rt-pcr)验证标记物基因的选择剪接的图。相对于正常的粘膜对照,标记物基因a)tph1、(b)vmat2、(c)scg5、(d)cga和(e)ptprn2在net样品中差异表达。图3是显示使用连续加入在gep-net样品中使用10倍交叉验证的结果获得的多达22个显著增量调节的基因(p<0.05),四种分类算法(svm、lda、knn和bayes)的预测准确性的线图。图4a–4c是显示在试验组中数学推导的maarc-net评分的图。a)在对照、sd和pd中0-4评分的频率分布;b)在相同的样品组中使用0-8评分的频率分布;c)a)和b)中两种评分的每一种的相关性评估。图5a-5b是显示在试验组中maarc-net评分和接受器工作特征(roc)分析的图。在图5a中,与对照相比net具有显著升高的评分,其中pd的值高于sd。在图5b中,显示了对照对比gep-nets的roc曲线,其中auc为>0.98,p<0.0001。*p<0.05对比对照,#p<0.05对比sd(双尾mann-whitneyu检验)。图6a–6b是a)在独立的组中maarc-net评分的图,其中与稳定的疾病(sd)相比,进行性的疾病(pd)net具有显著更高的升高评分;和b)在sd和pd中0-8评分的频率分布图。#p<0.0001对比sd(双尾mann-whitneyu检验)。图7a–7b是a)sd对比pdnet的roc的图,其中auc>0.93,p<0.0001和b)使用截止评分≥7正确识别的sd和pdnet的百分比的图。图8是netest1的列线图,其表明如何获得评分和如何将患者分类为不同的疾病类别。图9是图8的列线图的应用的图。显示了使用图8的列线图,正确预测的sd和pdnet的百分比,包括疾病活性的水平。图10a–10b是在a)试验组和b)独立组中,各自显示在sd和pdnet肿瘤中0-8评分的频率分布的图。图11a–11b是a)在合并组中在sd和pd中0-8评分的频率分布和b)对比netest评分,sd或pd的评分的风险概率的图。图12是netest2a的列线图,包括了评分和风险分类。上图包括按0-8评分的maarc-net;下图是0-100%换算形式。图13是netest2的列线图,包括了风险种类描述。图14a-14b是代表了重新聚焦于net的瘤形成标志的图示。图14a显示了根据hanahand,weinbergra:hallmarksofcancer:thenextgeneration.cell2011、144(5):646-674,肿瘤(腺癌)来源的标志的描述。图14b显示了根据hanahan和weinberg分类的net标志。图15a–15b是显示在a)正常粘膜和b)net中的基因簇的归一化的基因表达的图。图16是在正常粘膜(nm)和net中通过pda和nda算法评价的归一化的基因表达的图。图17a–17c是在a)正常粘膜、b)sd相关的基因簇和c)pd相关的基因簇中归一化的基因表达的图。图18是在独立的试验组中归一化的基因表达的图,其中评价了pd和sd肿瘤中的基因。图19a–19b是显示在a)试验组和b)独立组中pda和nda基因簇算法的归一化的基因表达的图。图20a–20b是显示a)在合并组中pda和nda基因簇算法的归一化的基因表达,和b)用于区分sd与pd的pda和nda的roc分析曲线,其中*p<0.05对比sd的图。图21a–21b是显示在a)试验组和b)独立组中通过tda和ida基因簇算法评价的归一化的基因表达的图。图22a–22b是显示a)用于区分sd与pd的tda和ida,和b)单个基因簇的每一个的roc分析的图。图23a–23b是显示a)手术前和手术后病况的netest评分和b)水平手术前和手术后病况的循环嗜铬粒蛋白a(cga)的交替的图。图24a–24b是显示在a)手术前疗法病况和b)手术后疗法病况中netest列线图的差异的图示。图25a–25b是显示在r0(完全切除)和r1/2(不完全切除)病况二者中a)数学推导的评分和b)嗜铬粒蛋白a的百分比变化的图。图26a–26d是显示在手术前和手术后病况中对于基因衍生的算法a)pda、b)nda、c)tda和d)ida的netest评分的差异的图。图27a–27i是显示在手术前和手术后病况中对于基因衍生的簇a)sstr组、b)增殖组、c)信号组、d)代谢组、e)分泌组、f)分泌组、g)多能组、h)表观基因组和i)凋亡组的netest评分的差异的图。图28是netest3的列线图,包括了手术相关的算法和基因簇。图29a–29b是显示各自在稳定的疾病(sd)病况和生长抑素类似物(ssa)治疗失败(等同于pd病况)中,a)netest评分和b)循环cga水平的差异的图。图30a–30d是显示在稳定治疗的患者(sd)和治疗失败(pd)中,基因衍生的算法a)pda、b)nda、c)tda和d)ida的差异的图。图31a–31i是显示在稳定治疗的患者(sd)和ssa治疗失败(等同于pd病况)中基因衍生的簇,具体而言a)sstr组、b)增殖组、c)信号组、d)代谢组、e)分泌组、f)分泌组、g)多能组、h)表观基因组和i)凋亡组中的差异的图。图32a–b是显示根据a)基因衍生的簇算法和b)用于区分治疗失败(等同于pd病况)与对照的基因簇的roc分析的图。图33a–b是显示对于a)用于在分类为sd的患者中定义治疗失败的基因衍生的簇算法和簇,和b)胜过sstr组和增殖组的组合的最佳3(best-of-3)中的每一个,正确识别的百分比的图。图34是生长抑素类似物治疗的患者的列线图,包括数学推导的评分以及sstr组、增殖组和它们的组合。图35a–35b是显示ssa的治疗功效和具有低/高netest评分的发生疾病复发的患者的比例的图。图36a–36b是显示在发生图像阳性疾病复发之前netest升高(>80%)或cga异常的时间点,以及在图像阳性疾病复发之前这些事件发生的次数的图。图37a–37d是显示在长期随访(a)之前的netest评分,和具有升高的评分(b,d)或无疾病时间(d)的患者的复发次数的图。图38a–38f是包括在a-b)sstr组、c-e)全部基因和d-f)高相关基因(kras、sstr4和vps13c)中预测的ki67指数对比ki67指数的图。图39a–39f是显示在基因簇或算法之间的相关性(线性回归)的图,a)sstr组和ki67,b)tda和ki67,c)增殖组和ki67,d)pda和ki67,e)ida和ki67,和f)pda和ki67,各自对比ki-67指数。图40a–40d是对于sstr组(组i:(a)和(c))和所有基因(组ii:(b)和(d)),建模预测的suvmax(肿瘤摄取–受体密度/靶标利用率的度量)的图。图41a–41f是在单个基因(a-b)、sstr组(c-e)和所有基因(d-f)中,建模mtv(分子肿瘤体积–肿瘤负荷的度量)的图。图42a–42c是显示在鉴定有(a)新损伤(通过成像)、(b)进行性的疾病(通过recist)和(c)手术后的患者中的zfhx3表达的图。图43a–43b是显示在(a)保持稳定的gep-nen疾病状态的患者,对比(b)发生进行性的gep-nen疾病状态的患者中的zfhx3表达的图。图44a–44c是代表a)肽受体放射核素疗法(prrt)的功效、b)在反应者(r)和无反应者(nr)中在6m随访(fup)时netest评分对比临床状态的变化;和(c)在6mfup时cga水平对比临床状态的变化的图。图45是显示在治疗之前和之后在反应者和无反应者中的netest之间的一致性的图,以及另外与cga比较。图46a–46b显示对于治疗反应,netest评分对比cga的准确性。图47a–47d显示在治疗前的血液样品中netest基因的两个亚组,信号组和代谢组的表达,以及在反应者(r)和无反应者(nr)之间的差异,各自以及当并入生物学指数时的预测效用(47b),用于单独预测治疗反应(商数)或作为与等级的组合(组合)的效用(47c)和用于预测prrt疗法的结果的组合的度量(47d)。发明详述所有人基因的四分之三经历选择剪接。鉴定和定义癌症特异性剪接变体因此对于开发生物-标记物测定法是有利的。描述的实施方案源自令人惊讶的发现,即net标记物基因的特定的癌症特异性剪接变体可用于在生物标记物诊断方法中使肿瘤和正常样品之间的差异最大化。本发明提供在有需要的受试者中检测胃肠胰神经内分泌瘤(gep-nen)的方法,包括通过使来自受试者的试验样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定试验样品的至少22种生物标记物的表达水平,其中22种生物标记物选自aplp2、araf、atp6v1h、bnip3l、braf、cd59、commd9、ctgf、fzd7、glt8d1、kras、mki67/ki67、morf4l2、nap1l1、nol3、oaz2、pank2、phf21a、pld3、pnma2、pqbp1、raf1、rnf41、rsf1、slc18a1/vmat1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tecpr2、tph1、trmt112、wdfy3、zfhx3和zzz3;通过使参比样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定来自参比样品的至少22种生物标记物的表达水平;归一化试验样品中的至少22种生物标记物的表达水平至参比样品中的至少22种生物标记物的表达水平;比较试验样品中的至少22种生物标记物的归一化的表达水平与预定的截止值;当归一化的表达水平等于或大于预定的截止值时,确定在受试者中存在gep-nen;或当归一化的表达水平低于预定的截止值时,确定在受试者中不存在gep-nen,其中预定的截止值在0-8的maarc-net评分系统量表中是2,或在0-100%的量表中是0%。评分根据“多数票”策略,和自二元分类系统开发,从而样品被识别为“正常”和给予评分0,或识别为“肿瘤”和评分为“1”。评分范围可为0(四个识别均“正常”)至4(四个识别均“肿瘤”)。每个“识别”是四种不同的学习算法之一的二元结果(对于正常为“0”,或对于肿瘤为“1”):支持向量机(svm)、线性判别分析(lda)、k-最近邻域(knn)和朴素贝叶斯(bayes)。这四种学习算法的每一种在内部训练组上进行训练,包括67个对照和63个gep-nen。在该训练组中,差异表达的基因(对照对比gep-nen)使用t-检验被鉴定为显著的。根据该训练组,每种学习算法经训练以区分正常和肿瘤基因表达至显著性为至少p<0.05的水平内。根据多数票策略,小于2个“正常”识别的那些样品被分类为gep-nen。至少22种生物标记物可包括aplp2、araf、cd59、ctgf、fzd7、kras、mki67/ki67、morf4l2、nap1l1、nol3、pnma2、raf1、rsf1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tph1、trmt112和zfhx3。所述方法可进一步包括当归一化的表达水平等于或高于预定的截止值时,确定在受试者中存在进行性gep-nen,其中预定的截止值在0-8的量表中是5,或在0-100%的量表中小于55%。所述方法可进一步包括鉴定受试者发生进行性gep-nen的风险水平。所述方法进一步包括当归一化的表达水平是小于在0-8的量表中的预定的截止值5,或小于在0-100%的量表中的55%时,鉴定发生进行性gep-nen的低风险水平;当归一化的表达水平等于或大于在0-8的量表中的预定的截止值5和小于预定的截止值7,或等于或大于在0-100%的量表中的55%和小于75%时,鉴定发生进行性gep-nen的中等风险水平;或当归一化的表达水平等于或大于在0-8的量表中的预定的截止值7,或等于或大于在0-100%的量表中的75%时,鉴定发生进行性gep-nen的高风险水平。所述生物标记物可以是rna、cdna或蛋白质。当生物标记物是rna时,rna可以逆转录以产生cdna(例如通过rt-pcr),和检测产生的cdna表达水平。生物标记物的表达水平可通过在生物标记物和标记的探针或引物之间形成复合物检测。当生物标记物是rna或cdna时,rna或cdna通过在rna或cdna和标记的核酸探针或引物之间形成复合物检测。在rna或cdna和标记的核酸探针或引物之间的复合物可以是杂交复合物。当生物标记物是蛋白质时,蛋白质可以通过在蛋白质和标记的抗体之间形成复合物检测。标记可以是任何标记,例如荧光标记、化学发光标记、放射性标记等。试验样品可以是获自受试者的任何生物学流体。优选地,试验样品是血液、血清、血浆或肿瘤组织。参比样品可以是获自不具有肿瘤疾病、不显示肿瘤疾病的症状或未诊断有肿瘤疾病的受试者的任何生物学流体。优选地,参比样品是血液、血清、血浆或非肿瘤组织。有需要的受试者可以是诊断有gep-nen的受试者、具有至少一种gep-nen症状的受试者或具有发生gep-nen的诱因或家族史的受试者。受试者可以是任何哺乳动物。优选地,受试者是人。术语受试者和患者在本文可互换使用。所述方法可进一步包括用手术或药物疗法治疗鉴定为具有发生进行性gep-nen的中等风险水平或高风险水平的受试者。药物疗法可以是生长抑素类似物治疗或肽受体放射疗法疗法(prrt)。所述方法可进一步包括用在至少6个月期间、12个月期间、18个月期间或24个月期间规则或定期监测,治疗鉴定为具有发生进行性gep-nen的低风险水平的受试者。本发明还提供在受试者中区分稳定的和进行性gep-nen的方法,包括根据本发明的方法,确定来自受试者的试验样品的至少22种生物标记物的归一化的表达水平等于或大于预定的截止值5和小于预定的截止值6;通过使试验样品和参比样品与特异性检测smarcd3的表达和tph1的表达的多种试剂接触,检测来自试验样品和来自参比样品的smarcd3和tph1的表达水平;将试验样品中的smarcd3和tph1的表达水平归一化至参比样品中的smarcd3和tph1的表达水平;分别比较试验样品中的smarcd3和tph1的归一化的表达水平与第一个和第二个预定的截止值;和当smarcd3的归一化的表达水平大于第一个预定的截止值和tph1的表达水平等于或大于第二个预定的截止值时,确定在受试者中存在稳定的gep-nen,或当smarcd3的归一化的表达水平等于或小于第一个预定的截止值和tph1的表达水平小于第二个预定的截止值时,确定在受试者中存在进行性gep-nen,其中第一个预定的截止值在0-8的量表中是1.3和其中第二个预定的截止值在0-8的量表中是4。第一个预定的截止值1.3对应于在0-100%的量表中的12%,和其中第二个预定的截止值4对应于在0-100%的量表中的41%。本发明还提供在受试者中区分稳定的和进行性gep-nen的方法,包括根据本发明的方法,确定来自受试者的试验样品的至少22种生物标记物的归一化的表达水平等于或大于预定的截止值6和小于预定的截止值7;通过使试验样品和参比样品与特异性检测vmat1的表达和phf21a的表达的多种试剂接触,检测来自试验样品和来自参比样品的vmat1和phf21a的表达水平;归一化试验样品中的vmat1和phf21a的表达水平至参比样品中的vmat1和phf21a的表达水平;分别比较试验样品中的vmat1和phf21a的归一化的表达水平与第一个和第二个预定的截止值;和当vmat1的归一化的表达水平等于或大于第一个预定的截止值和phf21a的表达水平小于第二个预定的截止值时,确定在受试者中存在稳定的gep-nen,或当vmat1的归一化的表达水平等于或大于第一个预定的截止值和phf21a的表达水平等于或大于第二个预定的截止值时,确定在受试者中存在进行性gep-nen,其中第一个预定的截止值在0-8的量表中是0和其中第二个预定的截止值在0-8的量表中是1.2。第一个预定的截止值0对应于在0-100%的量表中的0%,和其中第二个预定的截止值1.2对应于在0-100%的量表中的8%。本发明还提供用于在受试者中区分稳定的和进行性gep-nen的方法,包括根据本发明的方法,确定来自受试者的试验样品的至少22种生物标记物的归一化的表达水平等于或大于预定的截止值7和小于预定的截止值8;通过使试验样品和参比样品与特异性检测vmat1的表达和phf21a的表达的多种试剂接触,检测来自试验样品和参比样品的vmat1和phf21a的表达水平;归一化试验样品中的vmat1和phf21a的表达水平至参比样品中的vmat1和phf21a的表达水平;分别比较试验样品中的vmat1和phf21a的归一化的表达水平与第一个和第二个预定的截止值;和当vmat1的归一化的表达水平等于或大于第一个预定的截止值和phf21a的表达水平大于第二个预定的截止值时,确定在受试者中存在稳定的gep-nen,或当vmat1的归一化的表达水平等于或大于第一个预定的截止值和phf21a的表达水平等于或小于第二个预定的截止值时,确定在受试者中存在进行性gep-nen,其中第一个预定的截止值在0-8的量表中是0和其中第二个预定的截止值在0-8的量表中是1。第一个预定的截止值0对应于在0-100%的量表中的0%,和其中第二个预定的截止值1对应于在0-100%的量表中的7%。本发明还提供在受试者中区分稳定的和进行性gep-nen的方法,包括根据本发明的方法,确定来自受试者的试验样品的至少22种生物标记物的归一化的表达水平等于预定的截止值8;通过使试验样品和参比样品与特异性检测zzz3的表达的至少一种试剂接触,检测来自试验样品和参比样品的zzz3的表达水平;归一化试验样品中的zzz3的表达水平至参比样品中的zzz3的表达水平;比较试验样品中的zzz3的归一化的表达水平与预定的截止值;和当zzz3的归一化的表达水平等于或小于预定的截止值时,确定在受试者中存在进行性gep-nen,其中预定的截止值在0-8的量表中是1。预定的截止值1对应于在0-100%的量表中的18%。本发明的方法进一步包括通过使来自受试者的试验样品和参比样品与特异性检测16种生物标记物的每一种的表达的多种试剂接触,测定试验样品和参比样品的16种生物标记物的每一种的表达水平,其中所述16种生物标记物包含ki67、nap1l1、nol3、tecpr2、araf1、braf、kras、raf1、pqbp1、tph1、commd9、morf4l2、rnf41、rsf1、smarcd3和zfhx3;合计试验样品的16种生物标记物的每一种的表达水平以产生进行性诊断i总测试值和合计参比样品的16种生物标记物的每一种的表达水平以产生进行性诊断i总参比值,其中与进行性诊断i总参比值相比,进行性诊断i总测试值的值增加指示在受试者中存在进行性gep-nen。本发明的方法进一步包括通过使来自受试者的试验样品和参比样品与特异性检测15种生物标记物的每一种的量的多种试剂接触,测定试验样品和参比样品的15种生物标记物的每一种的表达水平,其中所述15种生物标记物包含araf1、braf、kras、raf1、ki67、nap1l1、nol3、glt8d1、pld3、pnma2、vmat2、tph1、fzd7、morf4l2和zfhx3;将试验样品的15种生物标记物的每一种的表达水平进行平均以产生进行性诊断ii测试值和将参比样品的15种生物标记物的每一种的表达水平进行平均以产生进行性诊断ii参比值,其中与进行性诊断ii参比值相比,进行性诊断ii测试值的值增加指示在受试者中存在进行性gep-nen。本发明的方法进一步包括通过使来自受试者的试验样品和参比样品与特异性检测7种生物标记物的每一种的量的多种试剂接触,测定试验样品和参比样品的7种生物标记物的每一种的表达水平,其中所述7种生物标记物包含pnma2、vmat2、commd9、sstr1、sstr3、sstr4和sstr5;合计试验样品的7种生物标记物的每一种的表达水平以产生进行性诊断iii总测试值和合计参比样品的7种生物标记物的每一种的表达水平以产生进行性诊断iii总参比值,其中与进行性诊断iii总参比值相比,进行性诊断iii总测试值的值增加指示在受试者中存在进行性gep-nen。本发明的方法进一步包括通过使来自受试者的试验样品和参比样品与特异性检测11种生物标记物的每一种的量的多种试剂接触,测定试验样品和参比样品的11种生物标记物的每一种的表达水平,其中所述11种生物标记物包含ki67、nap1l1、nol3、tecpr2、pqbp1、tph1、morf4l2、rnf41、rsf1、smarcd3和zfhx3;合计试验样品的11种生物标记物的每一种的表达水平以产生进行性诊断iv总测试值和合计参比样品的11种生物标记物的每一种的表达水平以产生进行性诊断iv总参比值,其中与进行性诊断iv总参比值相比,进行性诊断iv总测试值的值增加指示在受试者中存在进行性gep-nen。本发明还提供在手术后受试者中确定复发性或再发性进行性gep-nen的风险的方法,包括通过使来自受试者的试验样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定试验样品的至少22种生物标记物的表达水平,其中所述22种生物标记物选自aplp2、araf、atp6v1h、bnip3l、braf、cd59、commd9、ctgf、fzd7、glt8d1、kras、mki67/ki67、morf4l2、nap1l1、nol3、oaz2、pank2、phf21a、pld3、pnma2、pqbp1、raf1、rnf41、rsf1、slc18a1/vmat1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tecpr2、tph1、trmt112、wdfy3、zfhx3和zzz3;通过使参比样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定来自参比样品的至少22种生物标记物的表达水平;归一化试验样品中的至少22种生物标记物的表达水平至参比样品中的至少22种生物标记物的表达水平;比较试验样品中的至少22种生物标记物的归一化的表达水平与预定的截止值;当归一化的表达水平小于在0-8的量表中的预定的截止值2,或小于在0-100%的量表中的0%时,鉴定不存在手术后复发性或再发性进行性gep-nen的风险;当归一化的表达水平小于在0-8的量表中的预定的截止值5,或小于在0-100%的量表中的55%时,鉴定手术后复发性或再发性进行性gep-nen的低风险水平;当归一化的表达水平等于或大于在0-8的量表中的预定的截止值5和小于预定的截止值7,或等于或大于在0-100%的量表中的55%和小于75%时,鉴定手术后复发性或再发性进行性gep-nen的中等风险水平;或当归一化的表达水平等于或大于在0-8的量表中的预定的截止值7,或等于或大于在0-100%的量表中的75%时,鉴定手术后复发性或再发性进行性gep-nen的高风险水平。本发明还提供在用生长抑素治疗的受试者中确定复发性或再发性进行性gep-nen的风险的方法,包括通过使来自受试者的试验样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定试验样品的至少22种生物标记物的表达水平,其中所述22种生物标记物选自aplp2、araf、atp6v1h、bnip3l、braf、cd59、commd9、ctgf、fzd7、glt8d1、kras、mki67/ki67、morf4l2、nap1l1、nol3、oaz2、pank2、phf21a、pld3、pnma2、pqbp1、raf1、rnf41、rsf1、slc18a1/vmat1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tecpr2、tph1、trmt112、wdfy3、zfhx3和zzz3;通过使参比样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定来自参比样品的至少22种生物标记物的表达水平;归一化试验样品中的至少22种生物标记物的表达水平至参比样品中的至少22种生物标记物的表达水平;比较试验样品中的至少22种生物标记物的归一化的表达水平与预定的截止值;当归一化的表达水平等于或大于预定的截止值时,确定在受试者中存在gep-nen,或当归一化的表达水平低于预定的截止值时,确定在受试者中不存在gep-nen,其中预定的截止值在0-8的maarc-net评分系统量表中是2,或在0-100%的量表中是0%;当gep-nen存在时,通过使来自受试者的试验样品和参比样品与特异性检测8种生物标记物的每一种的表达的多种试剂接触,测定试验样品和参比样品的8种生物标记物的每一种的表达水平,其中所述8种生物标记物包含ki67、nap1l1、nol3、tecpr2、sstr1、sstr2、sstr4和sstr5;合计试验样品的8种生物标记物的每一种的表达水平以产生进行性诊断v总测试值和合计参比样品的8种生物标记物的每一种的表达水平以产生进行性诊断v总参比值,其中与进行性诊断v总参比值相比,进行性诊断v总测试值的值增加指示在受试者中存在复发性或再发性进行性gep-nen。本发明还提供在有需要的受试者中确定gep-nen的肽受体放射核素疗法(prrt)的反应的方法,包括通过使来自受试者的试验样品和参比样品与特异性检测8种生物标记物的每一种的表达的多种试剂接触,测定试验样品和参比样品的8种生物标记物的每一种的表达水平,其中所述8种生物标记物包含araf1、braf、kras、raf1、atp6v1h、oaz2、pank2、pld3;归一化试验样品中的8种生物标记物的表达水平至参比样品中的8种生物标记物的表达水平;比较试验样品中的8种生物标记物的归一化的表达水平与预定的截止值;当8种生物标记物的归一化的表达水平大于预定的截止值时,确定在受试者中存在prrt-反应性gep-nen,其中预定的截止值在0-8的量表中是5.9。本发明还提供在有需要的受试者中确定gep-nen的肽受体放射核素疗法(prrt)的反应的方法,包括(a)进行第一轮prrt疗法:通过使来自受试者的第一轮试验样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定第一轮试验样品的至少22种生物标记物的表达水平,其中所述22种生物标记物选自aplp2、araf、atp6v1h、bnip3l、braf、cd59、commd9、ctgf、fzd7、glt8d1、kras、mki67/ki67、morf4l2、nap1l1、nol3、oaz2、pank2、phf21a、pld3、pnma2、pqbp1、raf1、rnf41、rsf1、slc18a1/vmat1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tecpr2、tph1、trmt112、wdfy3、zfhx3和zzz3;通过使参比样品与特异性检测至少22种生物标记物的表达的多种试剂接触,检测来自参比样品的至少22种生物标记物的表达水平;归一化第一轮试验样品中的至少22种生物标记物的表达水平至参比样品中的至少22种生物标记物的表达水平;(b)进行第二轮prrt疗法,通过使来自受试者的第二轮试验样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定试验样品的至少22种生物标记物的表达水平,其中所述22种生物标记物选自aplp2、araf、atp6v1h、bnip3l、braf、cd59、commd9、ctgf、fzd7、glt8d1、kras、mki67/ki67、morf4l2、nap1l1、nol3、oaz2、pank2、phf21a、pld3、pnma2、pqbp1、raf1、rnf41、rsf1、slc18a1/vmat1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tecpr2、tph1、trmt112、wdfy3、zfhx3和zzz3;通过使参比样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定来自参比样品的至少22种生物标记物的表达水平;归一化第二轮试验样品中的至少22种生物标记物的表达水平至参比样品中的至少22种生物标记物的表达水平;(c)确定来自(a)的归一化的表达水平与来自(b)的归一化的表达水平的变化率;(d)当变化率大于前-prrt疗法截止值时,确定存在prrt-反应性gep-nen,其中前-prrt疗法截止值在0-8的量表中是1。本发明还提供在有需要的受试者中确定gep-nen进展的方法,包括通过使来自受试者的试验样品与特异性检测zfhx3的表达的试剂接触,测定试验样品的zfhx3的表达水平;通过使参比样品与特异性检测zfhx3的表达的试剂接触,测定来自参比样品的zfhx3的表达水平;归一化试验样品中的zfhx3的表达水平至参比样品中的zfhx3的表达水平;比较试验样品中的zfhx3的归一化的表达水平与预定的截止值;当归一化的表达水平等于或大于预定的截止值时,确定在受试者中gep-nen进展,其中预定的截止值在0-8的量表中是0.5。本发明还提供在有需要的受试者中预测gep-nen的肿瘤增殖的方法,包括(a)通过使试验样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定来自受试者的试验样品的至少22种生物标记物的表达水平,其中所述22种生物标记物选自aplp2、araf、atp6v1h、bnip3l、braf、cd59、commd9、ctgf、fzd7、glt8d1、kras、mki67/ki67、morf4l2、nap1l1、nol3、oaz2、pank2、phf21a、pld3、pnma2、pqbp1、raf1、rnf41、rsf1、slc18a1/vmat1、slc18a2/vmat2、smarcd3、spata7、sstr1、sstr3、sstr4、sstr5、tecpr2、tph1、trmt112、wdfy3、zfhx3和zzz3;通过使参比样品与特异性检测至少22种生物标记物的表达的多种试剂接触,测定来自参比样品的至少22种生物标记物的表达水平;归一化试验样品中的至少22种生物标记物的表达水平至参比样品中的至少22种生物标记物的表达水平;比较试验样品中的至少22种生物标记物的归一化的表达水平与预定的截止值;当归一化的表达水平等于或大于预定的截止值时,确定在受试者中存在gep-nen,或当归一化的表达水平低于预定的截止值时,确定在受试者中不存在gep-nen,其中预定的截止值在0-8的maarc-net评分系统量表中是2,或在0-100%的量表中是0%;(b)当gep-nen存在时,通过使来自受试者的试验样品和参比样品与特异性检测3种生物标记物的每一种的表达的多种试剂接触,测定试验样品和参比样品的3种生物标记物的每一种的表达水平,其中所述3种生物标记物包含kras、sstr4和vps13c;合计试验样品的3种生物标记物的每一种的表达水平以产生进行性诊断vi总测试值和合计参比样品的3种生物标记物的每一种的表达水平以产生进行性诊断vi总参比值,其中与进行性诊断vi总参比值相比,进行性诊断vi总测试值的值增加指示在受试者中存在gep-nen的肿瘤增殖。所述方法其中(b)进一步包括通过使来自受试者的试验样品和参比样品与特异性检测3种生物标记物的每一种的表达的多种试剂接触,测定试验样品和参比样品的3种生物标记物的每一种的表达水平,其中所述3种生物标记物包含sstr1、sstr2和sstr5;合计试验样品的3种生物标记物的每一种的表达水平以产生进行性诊断vii总测试值和合计参比样品的3种生物标记物的每一种的表达水平以产生进行性诊断vii总参比值,其中与进行性诊断vii总参比值相比,进行性诊断vii总测试值的值增加指示在受试者中存在gep-nen的肿瘤增殖。如本文所用的,术语“gep-nen生物标记物”和“net生物标记物”与生物学分子,例如基因产物同义,其本身的表达或存在(例如表达水平或表达谱)或与一种或多种其它生物标记物相比(例如相对表达),根据gep-nen疾病的存在、不存在、类型、类别、严重性、转移、位置、阶段、预后、相关症状、结果、风险、可能性或治疗反应性或预后而不同(即,增加或降低),或与其这样的预测因素正相关或负相关。如本文所用的,术语“多核苷酸”或核酸分子意指长度至少10个碱基或碱基对的核苷酸的聚合形式,核糖核苷酸或脱氧核糖核苷酸或任一类型的核苷酸的修饰形式,和意欲包括单链和双链形式的dna。如本文所用的,在微阵列分析中用作探针的核酸分子或核酸序列优选地包括核苷酸链,更优选地dna和/或rna。在其它实施方案中,核酸分子或核酸序列包括其它类型的核酸结构,例如dna/rna螺旋、肽核酸(pna)、锁核酸(lna)和/或核酶。因此,本文使用的术语“核酸分子”还涵盖包含非天然核苷酸、修饰的核苷酸和/或显示与天然核苷酸相同功能的非核苷酸结构单元的链。如本文所用的,在多核苷酸的情况下使用的术语“杂交”等意指常规杂交条件,优选地例如在50%甲酰胺/6xssc/0.1%sds/100μg/mlssdna中杂交,其中杂交温度高于37度和在0.1xssc/0.1%sds中的洗涤温度高于55摄氏度,和最优选地是指严格杂交条件。术语“血液活检”是指确定表现有症状的患者是否具有可分类为良性(低活性)或恶性(高活性/转移)的病况的血液诊断研究。本文使用的关于gep-nen的不同类型或阶段的术语"分类"是指使用统计学技术编译和分析表达数据以提供分类来辅助gep-nen的阶段或类型的诊断的行为。本文使用的术语“分类器"是指以预定水平的统计学显著性区分疾病状态的算法。二类分类器是使用样品的测量数据点和将数据分类为两组之一的算法。多类分类器是使用样品的测量数据点和将数据分类为多组之一的算法。“分类器”将区别随机选择的癌症样品与随机选择的良性样品的概率,即接受器工作特征(roc)曲线的曲线下面积(auc)最大化。本文使用的术语"归一化"或“归一化子”是指根据标准值针对效果进行调整的差异值的表述,所述效果产生于由于样品处理、样品制备和质谱测量导致的技术变化而非样品中的蛋白质浓度的生物学变化。例如,当测量差异表达的蛋白质的表达时,蛋白质表达的绝对值可根据表达基本上恒定的标准蛋白质表达的绝对值表示。本文使用的术语"病况"一般是指疾病、事件或健康状态的变化。术语"诊断"和"诊断的"也分别涵盖术语"预后"和"预后的",以及在两个或更多个时间点应用这样的程序以随时间监测诊断和/或预后,和根据其的统计学建模。此外,术语诊断包括:a.预测(确定患者是否将可能发生侵袭性疾病(高增殖性/侵袭性)),b.预后(预测患者是否将可能在未来预选择的时间具有更好或更差的结果),c.疗法选择,d.治疗药物监测,和e.复发监测。本文使用的关于生物学样品的术语"提供"是指自受试者直接或间接获得生物学样品。例如,"提供"可指自受试者直接获得生物学样品的行为(例如通过血液抽取、组织活检、灌洗等)。同样,"提供"可指间接获得生物学样品的行为。例如,提供可指自直接获得样品的一方实验室接收样品的行为,或自档案室获得样品的行为。"准确性"是指测量或计算的数量(试验报告值)与其实际(或真实)值的一致性的程度。临床准确性涉及真实结果(真阳性(tp)或真阴性(tn))对比错误分类的结果(假阳性(fp)或假阴性(fn))的比率,和可表示为灵敏性、特异性、阳性预测值(ppv)或阴性预测值(npv),或可能性、优势率等其它度量。本文使用的术语"生物学样品"是指可能包含一种或多种生物标记物蛋白质的生物学来源的任何样品。生物学样品的实例包括组织、器官或体液,例如全血、血浆、血清、组织、灌洗液或用于检测疾病的任何其它样品。本文使用的术语"受试者"是指哺乳动物,优选地人。本文使用的关于病况的术语"治疗"可指阻止病况、减慢病况的发生或发生速度、减少发生病况的风险、阻止或延缓发生与病况有关的症状、减少或终止与病况有关的症状、产生病况的完全或部分消退,或其一些组合。生物标记物水平可由于治疗疾病而改变。生物标记物水平的改变可通过本发明测量。生物标记物水平的改变可用于监测疾病进展或疗法。"变化"、"改变"或"明显不同"是指与合理可比较的状态、特征、度量等的可检测的变化或差异。这样的变化可以是全部的或没有变化。它们可以递增的,和不需要是线性的。它们可以是按数量级变化的。变化可以是增加或降低1%、5%、10%、20%,30%、40%、50%、60%、70%、80%、90%、95%、99%、100%或更多,或0%和100%之间的任何值。或者,变化可以是1倍、1.5倍、2倍、3倍、4倍、5倍或更多倍,或1倍和5倍之间的任何值。变化可以统计学显著的,p值为0.1、0.05、0.001或0.0001。术语“疾病流行率”是指在特定一段时间内所有新和旧病例或事件发生的数量。流行率表示为事件数是分子和有风险群体是分母的比率。术语“疾病发病率”是指在一段特定时间内发生一些新病况的风险的度量;在一些时间期间新病例的数量,其更好地表示为具有分母的比例或比率。术语“稳定的疾病”是指存在gep-nen,然而gep-nen已被治疗和保持在稳定的病况的诊断,即不是进行性的疾病,如通过成像数据和/或最佳临床判断所确定的。术语“进行性的疾病”是指存在高活性状态的gep-nen的诊断,即疾病未被治疗和不是稳定的,或已被治疗和对疗法没有反应,或已被治疗和仍保持活性疾病,如通过成像数据和/或最佳临床判断所确定的。术语“表达水平评分”或“netest评分”是指数学推导的分类器算法的输出值,其自分类算法,即svm、lda、knn和bayes的组合产生。该评分范围在0和100%之间。来自试验样品的表达水平评分,在与参比或对照样品的表达水平评分比较时,可用于诊断gep-nen的存在、gep-nen的不同阶段、预测患有某一阶段gep-nen的风险,或在治疗后人患者中确定gep-nen复发的风险。gep-nen疾病状态之间的区别基于预确定的表达水平评分阈值和/或范围,如在本申请中进一步定义的。gep-nen的诊断和预后具有困难,这部分地由于该疾病的多样化的症状和综合征导致,例如类癌瘤综合征、腹泻、面红、出汗、支气管收缩、胃肠出血、心脏疾病、间断性腹痛,其经常数年保持没有表现。可用的诊断方法包括解剖学定位,例如通过成像,例如x-射线、胃肠内窥镜、腹部计算机断层摄影(ct)、组合的立体定向放射手术(srs)/ct,和mri,和一些基因产物的检测,例如嗜铬粒蛋白a。已知的方法受限于例如低特异性和/或灵敏性和/或检测早期疾病的能力。检测单一的生物标记物不完全令人满意,例如在人血液样品中鉴定恶性肿瘤,和预测复杂结果例如纤维化和转移。参见michielss,koscielnys,hillc,"interpretationofmicroarraydataincancer,"brjcancer2007;96(8):1155-8。可用方法的局限性促进了病理学分类、分期和预测、治疗发生和监测治疗效果中的困难。本文提供的实施方案为解决这些局限性的方法和组合物。在一个方面,本申请涉及检测和鉴定gep-nen生物标记物和这样的生物标记物的小组,例如在生物学样品中。提供用于在生物学样品(通常血液样品)中检测生物标记物、检测生物标记物的表达水平和识别或结合生物标记物的方法和组合物(例如试剂,例如多核苷酸)。还提供模型和生物数学算法,例如监督的学习算法,和使用它们以预测、分类和评价gep-nen和相关结果,例如预测风险程度、对治疗的反应、转移或侵袭性,和确定gep-nen亚型的方法。使用提供的实施方案检测生物标记物可用于改进gep-nen诊断和预后,和提供治疗方案的信息。在一些方面,通过提供的实施方案检测生物标记物和/或表达水平证实或指示gep-nen或gep-nen细胞例如循环gep-nen细胞(cnc)的存在、不存在、阶段、分类、位置、亚型、侵袭性、恶性、转移、预后或其它结果。提供的方法和组合物可用于肿瘤定位,和预测或检测转移、微转移和小损伤,和/或检测风险程度、复发可能性、治疗反应性或缓解,和提供合适疗程的信息。例如,检测生物标记物(例如在循环中)可用于检测早期和原发性gep-nen(例如以在之前通过另一方法,例如解剖定位认为"阴性"的患者中鉴定gep-nen疾病或转移)。提供的方法和组合物可用于设计、实施和监测治疗策略,包括患者特异性治疗策略。在一个实例中,gep-nen生物标记物的检测的表达水平用作治疗功效的代替标记物,例如以监测手术疗法(例如肿瘤去除)、靶向药物疗法(例如抑制肿瘤分泌/增殖)和通过检测肿瘤的缓解或复发(甚至小的微转移的形式)的其它治疗方法的效果。所述方法还可用于评价临床症状和结果,和用于gep-nen的组织学分级和分子表征。提供的生物标记物包括gep-nen生物标记物,和其亚组和小组。提供的gep-nen生物标记物包括基因产物,例如dna、rna,例如转录物和蛋白质,其在gep-nen疾病中和/或在不同阶段或亚型的gep-nen中,或在不同的gep-nen肿瘤中差别表达,例如在转移与非转移肿瘤、不同程度的侵袭性的肿瘤、高与低风险肿瘤、有反应与无反应肿瘤、显示不同病理学分类和/或对特定疗程的反应可能性的肿瘤中差别表达的基因产物,以及与gep-nen疾病、阶段或类型,或与神经内分泌细胞或相关的细胞-类型的特征有关的那些。例如,生物标记物包括其表达与以下相关或其表达涉及以下的基因产物:肿瘤发生、转移或激素产生,或原发性或转移gep-nen的表型,例如粘附、迁移、增殖、凋亡、转移和激素分泌,和通常与肿瘤或恶性相关的那些。所述生物标记物包括gep-nen细胞分泌产物,包括激素和胺,例如胃泌素、生长素释放肽、胰多肽、p物质、组胺和血清素,和生长因子,例如肿瘤生长因子-β(tgf-β)和结缔组织生长因子(ctgf),其可在循环中检测。分泌产物可随肿瘤亚型和来源而不同。在一个实例中,生物标记物是与调节基因型(即粘附、迁移、增殖、凋亡、转移和/或激素分泌)有关的基因产物,它们是各种gep-nen亚型、阶段、侵袭性程度或治疗反应性的基础。已经发现总共51种差别表达的生物标记物基因用于诊断、预后、和/或监测gep-nen。关于这51种差别表达的gep-nen生物标记物以及持家基因alg9的其它细节见于表1。表1:gep-nen生物标记物/持家基因序列信息这51种gep-nen生物标记物包括:akap8l(激酶(prka)锚定蛋白质8-样)、aplp2(淀粉样蛋白β(a4)前体-样蛋白质2)、araf1(v-raf鼠肉瘤3611病毒癌基因同源物)、atp6v1h(atpase,h+运输,溶酶体50/57kda,vi亚基h)、bnip3l(bcl2/腺病毒e1b19kda相互作用蛋白质3-样)、braf(v-raf鼠肉瘤病毒癌基因同源物bl)、c21orf7(染色体21开放阅读框7)、cd59(cd59分子,补体调节蛋白质)、commd9(comm结构域包含9)、ctgf(结缔组织生长因子)、enpp4(外核苷酸焦磷酸酶/磷酸二酯酶4)、fam131a(序列相似性家族131,成员a,转录物变体2)、flj10357(rho鸟嘌呤核苷酸交换因子(gef)40(arhgef40)、fzd7(鬈毛同源物7(果蝇))、glt8d1(糖基转移酶8结构域包含1,转录物变体3)、hdac9(组蛋白脱乙酰基酶9,转录物变体6)、hsf2(热休克转录因子2,转录物变体1)、ki-67(单克隆抗体ki-67鉴定的抗原)、kras(v-ki-ras2kirsten大鼠肉瘤病毒癌基因同源物)、leol(pafl/rna聚合酶ii复合物组分同源物(酿酒酵母))、morf4l2(死亡因子4样2,转录物变体1)、nap1l1(核小体装配蛋白质1-样1)、nol3(核仁蛋白质3(具有card结构域的凋亡抑制剂),转录物变体3)、nudt3(nudix(核苷二磷酸连锁部分x)-型基序3)、oaz2(鸟氨酸脱羧酶抗酶蛋白2)、pank2(泛酸激酶2)、phf21a(phd指蛋白21a,转录物变体1)、pkd1(多囊性肾病1(常染色体显性),转录物变体2)、pld3(磷脂酶d家族,成员3,转录物变体1)、pnma2(副肿瘤抗原ma2)、pqbp1(多谷氨酰胺结合蛋白1,转录物变体2)、raf1(v-raf-1鼠白血病病毒癌基因同源物1)、rnf41(环指蛋白41,转录物变体4)、rsfl(重塑和间距因子1)、rtn2(reticulon2,转录物变体1)、smarcd3(swi/snf相关的,基质相关的,肌动蛋白依赖性染色质调节物,亚家族d,成员3,转录物变体3)、spata7(精子发生相关7、转录物变体2)、sstl(生长抑素受体1)、sst3(生长抑素受体3)、sst4(生长抑素受体4)、sst5(生长抑素受体5,转录物变体1)、tecpr2(tectoninβ-propeller重复包含2,转录物变体2)、tph1(色氨酸羟化酶1)、trmt112(trna甲基转移酶11-2同源物(酿酒酵母))、vmat1(溶质载体家族18(囊泡单胺)、成员1)、vmat2(溶质载体家族18(囊泡单胺),成员2)、vps13c(空泡蛋白质分选13同源物c(酿酒酵母),转录物变体2b)、wdfy3(wd重复和fyve结构域包含3)、zfhx3(锌指同源框3,转录物变体b)、zxdc(锌指c,转录物变体2)和zzz3(锌指,zz-型包含3),包括基因产物,通常是人基因产物,包括转录物、mrna、cdna、编码序列、蛋白质和多肽,以及编码蛋白质和多肽的多核苷酸(核酸),包括天然存在的变体,例如等位基因变体、剪接变体、转录物变体和单核苷酸多态性(snp)变体。例如,生物标记物包括具有本文所公开的序列的多核苷酸、蛋白质和多肽,和其天然存在的变体。用于归一化51种标记物基因的表达的持家基因是人alg9(天冬酰胺-连锁的糖基化9,α-1,2-甘露糖基转移酶同源物)。这51种差异表达的生物标记物基因中,38种生物标记物基因可用于产生数学推导的表达水平评分,用于诊断、监测和/或预测gep-nen和/或gep-nen的不同状态的存在。这38种gep-nen生物标记物包括:pnma2、nap1l1、fzd7、slc18a2/vmat2、nol3、sstr5、tph1、raf1、rsf1、sstr3、sstr1、cd59、araf、aplp2、kras、morf4l2、trmt112、mki67/ki67、sstr4、ctgf、spata7、zfhx3、phf21a、slc18a1/vmat1、zzz3、tecpr2、atp6v1h、oaz2、pank2、pld3、pqbp1、rnf41、smarcd3、bnip3l、wdfy3、commd9、braf和glt8d1。用于产生数学推导的表达水平评分用于诊断、监测和/或预测gep-nen的存在的这38种生物标记物基因中,可能需要至少22种生物标记物基因以产生足够的分类器。这至少22种生物标记物基因包括pnma2、nap1l1、fzd7、slc18a2、nol3、sstr5、tph1、raf1、rsf1、sstr3、sstr1、cd59、araf、aplp2、kras、morf4l2、trmt112、mki67、sstr4、ctgf、spata7和zfhx3。alg9生物标记物/持家基因包括人alg9基因产物,包括天然变体,例如等位基因变体和其同源物和类似物。在一个实例中,alg9生物标记物/持家基因是具有seqidno:1(称为nm_024740.2)所示的核苷酸序列,或包含其蛋白质编码部分的多核苷酸,其天然变体或由这样的多核苷酸编码的蛋白质。akap8l生物标记物包括人akap8l基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,akap8l生物标记物是具有seqidno:2(称为nm_014371.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。aplp2生物标记物包括人aplp2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,aplp2生物标记物是具有seqidno:3(称为nm_001142276.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。araf1生物标记物包括人araf1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,araf1生物标记物是具有seqidno:4(称为nm_001654.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。atp6v1h生物标记物包括人atp6v1h基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,atp6v1h生物标记物是具有seqidno:5(称为nm_015941.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。bnip3l生物标记物包括人bnip3l基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,bnip3l生物标记物是具有seqidno:6(称为nm_004331.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。braf生物标记物包括braf基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,braf生物标记物是具有seqidno:7(称为nm_004333.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。c21orf7种生物标记物包括c21orf7基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,c21orf7种生物标记物是具有seqidno:8(称为nm_020152.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。cd59生物标记物包括cd59基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,cd59生物标记物是具有seqidno:9(称为nm_203331.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。commd9生物标记物包括commd9基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,commd9生物标记物是具有seqidno:10(称为nm_001101653.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。ctgf生物标记物包括ctgf基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,ctgf生物标记物是具有seqidno:11(称为nm_001901.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。enpp4生物标记物包括enpp4基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,enpp4生物标记物是具有seqidno:12(称为nm_014936.4)的所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。fam131a生物标记物包括fam131a基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,fam131a生物标记物是具有seqidno:13(称为nm_001171093.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。flj1035生物标记物包括flj1035基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,flj1035生物标记物是具有seqidno:14(称为nm_018071.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。fzd7种生物标记物包括fzd7基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,fzd7种生物标记物是具有seqidno:15(称为nm_003507.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。glt8d1生物标记物包括glt8d1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,glt8d1生物标记物是具有seqidno:16(称为nm_001010983.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。hdac9生物标记物包括hdac9基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,hdac9生物标记物是具有seqidno:17(称为nm_001204144.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。hsf2生物标记物包括hsf2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,hsf2生物标记物是具有seqidno:18(称为nm_004506.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。ki-67种生物标记物包括ki-67基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,ki-67种生物标记物是具有seqidno:19(称为nm_001145966.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。kras生物标记物包括kras基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,kras生物标记物是具有seqidno:20(称为nm_004985.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。leo1生物标记物包括leo1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,leo1生物标记物是具有seqidno:21(称为nm_138792.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。morf4l2生物标记物包括morf4l2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,morf4l2生物标记物是具有seqidno:22(称为nm_001142418.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。nap1l1生物标记物包括nap1l1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,nap1l1生物标记物是具有seqidno:23(称为nm_139207.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。nol3种生物标记物包括nol3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,nol3种生物标记物是具有seqidno:24(称为nm_001185057.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。nudt3种生物标记物包括nudt3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,nudt3种生物标记物是具有seqidno:25(称为nm_006703.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。oaz2生物标记物包括oaz2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,oaz2生物标记物是具有seqidno:26(称为nm_002537.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。pank2生物标记物包括pank2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,pank2生物标记物是具有seqidno:27(称为nm_024960.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。phf21a生物标记物包括phf21a基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,phf21a生物标记物是具有seqidno:28(称为nm_001101802.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。pkd1生物标记物包括pkd1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,pkd1生物标记物是具有seqidno:29(称为nm_000296.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。pld3种生物标记物包括pld3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,pld3种生物标记物是具有seqidno:30(称为nm_001031696.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。pnma2生物标记物包括pnma2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,pnma2生物标记物是具有seqidno:31(称为nm_007257.5)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。pqbp1生物标记物包括pqbp1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,pqbp1生物标记物是具有seqidno:32(称为nm_001032381.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。raf1生物标记物包括raf1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,raf1生物标记物是具有seqidno:33(称为nm_002880.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。rnf41生物标记物包括rnf41基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,rnf41生物标记物是具有seqidno:34(称为nm_001242826.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。rsf1生物标记物包括rsf1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,rsf1生物标记物是具有seqidno:35(称为nm_016578.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。rtn2生物标记物包括rtn2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,rtn2生物标记物是具有seqidno:36(称为nm_005619.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。smarcd3种生物标记物包括smarcd3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,smarcd3种生物标记物是具有seqidno:37(称为nm_001003801.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。spata7种生物标记物包括spata7基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,spata7种生物标记物是具有seqidno:38(称为nm_001040428.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。sstr1生物标记物包括sstr1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,sstr1生物标记物是具有seqidno:39(称为nm_001049.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。sstr3种生物标记物包括sstr3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,sstr3种生物标记物是具有seqidno:40(称为nm_001051.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。sst4生物标记物包括sst4基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,sst4生物标记物是具有seqidno:41(称为nm_001052.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。sst5生物标记物包括sst5基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,sst5生物标记物是具有seqidno:42(称为nm_001053.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。tecpr2生物标记物包括tecpr2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,tecpr2生物标记物是具有seqidno:43(称为nm_001172631.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。tph1生物标记物包括tph1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,tph1生物标记物是具有seqidno:44(称为nm_004179.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。trmt112生物标记物包括trmt112基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,trmt112生物标记物是具有seqidno:45(称为nm_016404.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。vmat1生物标记物包括vmat1基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,vmat1生物标记物是具有seqidno:46(称为nm_003053.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。vmat2生物标记物包括vmat2基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,vmat2生物标记物是具有seqidno:47(称为nm_003054.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。vps13c生物标记物包括vps13c基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,vps13c生物标记物是具有seqidno:48(称为nm_001018088.2)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。wdfy3种生物标记物包括wdfy3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,wdfy3种生物标记物是具有seqidno:49(称为nm_014991.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。zfhx3种生物标记物包括zfhx3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,zfhx3种生物标记物是具有seqidno:50(称为nm_001164766.1)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。zxdc生物标记物包括zxdc基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,zxdc生物标记物是具有seqidno:51(称为nm_001040653.3)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。zzz3生物标记物包括zzz3基因产物,包括天然变体,例如等位基因变体,和其同源物和类似物。在一个实例中,zzz3生物标记物是具有seqidno:52(称为nm_015534.4)所示的核苷酸序列或包含其蛋白质编码部分的多核苷酸,其天然变体,或由这样的多核苷酸编码的蛋白质。在一些实施方案中,多核苷酸小组进一步包括一种或多种能够特异性杂交至"持家"或参比基因的多核苷酸,所述基因是例如其表达差异是已知的或预期与分析的变量的差异不相关的基因,所述变量例如gep-nen或其它肿瘤疾病的存在或不存在、各种gep-nen亚型的区别、转移、粘膜或其它组织类型、预后指示和/或其它表型、预测或结果。在一些方面,这样的持家基因的表达水平经检测和用作总体表达水平标准,例如以在各样品间归一化对gep-nen生物标记物获得的表达数据。持家基因是本领域众所周知的。通常,持家基因包括一个或多个特征为特别适合于分析gep-nen样品的基因,例如alg9。参见kiddm等,"genechip,genormandgastrointestinaltumors:novelreferencegenesforreal-timepcr."physiolgenomics2007;30:363-70。在本申请中,alg9是选择的持家基因。本发明提供检测gep-nen生物标记物和鉴定、分离和富集表达gep-nen生物标记物的肿瘤和细胞的方法、组合物和系统。例如,提供用于检测gep-nen生物标记物的试剂、试剂组和系统,和其使用方法,包括诊断和预后应用。在一个实施方案中,试剂是蛋白质、多核苷酸或其它分子,其特异性结合或特异性杂交至gep-nen生物标记物。试剂包括多核苷酸、例如探针和引物,例如有义和反义pcr引物,其具有与多核苷酸生物标记物的同一性或互补性,例如mrna,或蛋白质,例如抗体,其特异性结合至这样的生物标记物。还提供包含试剂的组和试剂盒,例如特异性杂交或结合生物标记物小组的试剂。因此,本文提供的系统,例如微阵列,多核苷酸组和试剂盒,包括具有核酸分子、通常dna寡核苷酸,例如引物和探针的那些,其长度通常在15个碱基和数千碱基之间变化,例如在20个碱基和1千个碱基之间、在40和100个碱基之间,和在50和80个核苷酸之间或在20和80个核苷酸之间。在一个方面,核苷酸微阵列、试剂盒或其它系统的大部分(即至少60%)的核酸分子能够杂交至gep-nen生物标记物。在一个实例中,提供包含特异性杂交至生物标记物的多核苷酸的系统,例如核酸微阵列,以根据提供的方法,检测和测量表达水平的变化和确定生物标记物的表达谱。这样的系统,例如微阵列,包括包含能够杂交至至少22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95或100种或更多种生物标记物,例如以下生物标记物组的至少22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或51种和/或全部的多核苷酸的那些:pnma2、nap1l1、fzd7、slc18a2/vmat2、nol3、sstr5、tph1、raf1、rsf1、sstr3、sstr1、cd59、araf、aplp2、kras、morf4l2、trmt112、mki67/ki67、sstr4、ctgf、spata7、zfhx3、phf21a、slc18a1/vmat1、zzz3、tecpr2、atp6v1h、oaz2、pank2、pld3、pqbp1、rnf41、smarcd3、bnip3l、wdfy3、commd9、braf和glt8d1基因产物。在一些方面,系统,例如微阵列的至少60%或至少70%、至少80%或更多的核酸分子能够杂交至生物标记物小组中的生物标记物。在一个实例中,在这样的核苷酸微阵列上固定的探针包含至少22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95或100种或更多种生物标记物,例如能够杂交至至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95或100种或更多种生物标记物,例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或51或更多种生物标记物的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或51或更多种核酸分子,其中每种核酸分子能够特异性杂交至不同的一种生物标记物,至少使得许多不同的生物标记物可结合。在一个实例中,微阵列上的或多核苷酸组中的剩余的核酸分子,例如40%或至多40%的核酸分子能够杂交至一组参比基因或一组归一化基因(例如持家基因),例如用于归一化以减少系统偏倚。系统偏倚导致由阵列间差异引起的总体性能变化,其可归因于例如阵列制造、染色和扫描的不一致,和标记的rna样品之间的变异,其可归因于例如纯度的差异。系统偏倚可在微阵列实验中在操作样品期间引入。为减少系统偏倚,测定的rna水平优选地针对背景非特异性杂交校正,和归一化。使用这样的参比探针是有利的,但不是强制的。在一个实施方案中,提供多核苷酸组或系统,例如微阵列,其中至少90%的核酸序列能够杂交至gep-nen生物标记物;进一步的实施方案包括这样的系统和组,其中至少95%或甚至100%的多核苷酸杂交至生物标记物。本文公开了示例性的合适的多核苷酸,例如pcr引物。能够杂交至生物标记物的不同区域的其它核酸探针和引物当然也适合结合提供的系统、试剂盒和方法而使用。本发明提供检测和定量生物标记物的方法,包括检测生物标记物的存在、不存在、量或相对量,例如表达水平或表达谱。通常,所述方法是基于核酸的方法,例如测量生物标记物mrna表达的存在、量或表达水平。这样的方法通常通过使多核苷酸试剂与生物学样品例如试验样品和正常和参比样品接触进行,例如以定量样品中的核酸生物标记物(例如mrna)的表达水平。根据提供的实施方案的生物标记物的检测和分析可用本领域已知的任何合适的方法进行。例如,在生物标记物是rna生物标记物时,使用rna检测和定量方法。定量或检测核酸表达水平、例如mrna表达的示例性的方法是众所周知的,和包括rna印迹和原位杂交(parker和barnes,methodsinmolecularbiology106:247-283,1999);rnase保护测定法(hod,biotechniques13:852-854,1992);和定量或半定量逆转录聚合酶链反应(rt-pcr)(weis等,trendsingenetics8:263-264、1992),基于测序的基因表达分析的代表性的方法包括基因表达系列分析(sage)和通过大规模平行标记测序(massivelyparallelsignaturesequencing,mpss)的基因表达分析。因此,在一个实施方案中,生物标记物或生物标记物小组的表达包括rna表达;方法包括测定生物标记物的rna,例如获自和/或存在于患者样品中的rna的水平,和根据对于生物标记物或生物标记物小组测定的rna表达水平,进行分析、诊断或预测判定。rna样品可以许多方式处理,如本领域已知的。自样品分离rna的数种方法是众所周知的,包括硫氰酸胍-苯酚-氯仿提取,其可使用试剂进行,其为一种专利制剂(参见chomczynskip,sacchin(2006)."thesingle-stepmethodofrnaisolationbyacidguanidiniumthiocyanate-phenol-chloroformextraction:twenty-somethingyearson".natprotoc1(2):581-5)。在此方法中,用于提取rna和dna;氯仿和离心用于分离rna与其它核酸,接着用乙醇连续洗涤以清洗rna样品。rna样品可自收获时的样品例如细胞或组织新鲜制备;或者,它们可自在-70℃储存直至处理用于样品制备的样品制备。或者,组织或细胞样品可在本领域已知的保持rna质量的其它条件下贮存和/或经历所述其它条件,包括固定,例如用福尔马林或类似的试剂;和用以下孵育:rnase抑制剂,例如(pharmingen)或(ambion);水溶液例如(assuragen)、hepes-谷氨酸缓冲液介导的有机溶剂保护作用(hope)和rcl2(alphelys);和非水溶液,例如通用分子固定剂(sakurafinetekusainc.)。离液核酸分离裂解缓冲液(boom方法,boom等jclinmicrobiol.1990;28:495-503)也可用于rna分离。在一个实施方案中,rna通过用孵育样品,接着rna清洗,自血沉棕黄层分离。将rna溶于焦碳酸二乙酯水中,和经分光光度法测量,和等分液在bioanalyzer(agilenttechnologies,paloalto,ca)上分析以评估rna质量(kiddm等"theroleofgeneticmarkers—nap1l1,mage-d2,andmta1—indefiningsmall-intestinalcarcinoidneoplasia,"annsurgoncol2006;13(2):253-62)。在另一个实施方案中,rna使用qiaamprnabloodminikit自血浆分离;在一些情况下,与方法相比,该方法允许通过实时pcr更好地自血浆检测显著更多的持家基因。在另一个实施方案中,rna例如以类似的方式使用qiaamprnabloodminikit直接自全血分离。自固定的石蜡包埋的组织作为rna源分离rna的方法是众所周知的,和通常包括mrna分离、纯化、引物延伸和扩增(例如:t.e.godfrey等,molec.diagnostics2:84-91[2000];k.specht等am.j.pathol.158:419-29[2001])。在一个实例中,rna自样品例如血液样品使用qiaamprnabloodminikitrna提取。通常,rna自组织提取,接着除去蛋白质和dna和分析rna浓度。可包括rna修复和/或扩增步骤,例如逆转录rna用于rt-pcr的步骤。rna生物标记物的表达水平或量可通过本领域已知的任何方法测定或定量,例如通过相对于持家基因或相对于同时测量的其它基因的rna水平,定量rna表达。测定基因的rna水平的方法是技术人员已知的,和包括但不限于rna印迹、(定量)pcr和微阵列分析。rna生物标记物可经逆转录以产生cdna,和本发明的方法可包括检测和定量产生的cdna。在一些实施方案中,cdna通过与标记的探针形成复合物检测。在一些实施方案中,rna生物标记物通过与标记的探针或引物形成复合物直接检测。通过杂交与rna特异性相互作用的标记的探针,接着通过凝胶电泳分离rna,可进行rna印迹以定量特定生物标记物基因或基因产物的rna。探针例如用放射性同位素或化学发光底物标记。与所述核酸表达产物相互作用的标记的探针的定量用作度量以测定表达水平。对于在两种独立样品之间的核酸表达产物总量的差异,通过比较已知在样品间表达水平没有差异的基因的表达水平,或通过在测定表达水平前加入已知量的rna,测定的表达水平可以用例如内部或外部校准器归一化。对于rt-pcr,生物标记物rna经逆转录为cdna。逆转录聚合酶链反应(rt-pcr)例如使用杂交至目的rna序列的特异性引物和逆转录酶进行。此外,rt-pcr可用沿rna随机杂交的随机引物例如随机六聚体或十聚体,或杂交至mrna的聚(a)尾的寡聚d(t),和逆转录酶进行。在一些实施方案中,样品,例如来自患有或疑似患有gep-nen或相关症状或综合征的患者的样品中的生物标记物的rna表达水平使用定量方法测定,例如通过实时rt-pcr(qpcr)或微阵列分析。在一些实施方案中,定量聚合酶链反应(qpcr)用于定量核酸的表达水平。在一个方面,生物标记物的检测和测定表达水平使用rt-pcr、genechip分析、定量实时pcr(qrt-pcr)或类癌瘤组织微阵列(tma)免疫染色/定量进行,例如以比较不同样品群中的生物标记物rna,例如mrna或其它表达产物的水平,表征基因表达模式,区别紧密相关的mrna,和分析rna结构。在一个实例中,qpcr使用实时pcr(rtpcr)进行,其中产物的量在扩增反应期间,或通过终点测量(其中测定最终产物的量)监测。如技术人员已知的,rtpcr例如通过以下进行:使用核酸嵌入剂,例如溴化乙锭或绿色i染料,其与所有产生的双链产物相互作用,导致在扩增期间荧光增加,或例如使用标记的探针,其与产生的目的基因双链产物特异性作用。特别提供了可使用的备选检测方法,例如树状聚体信号扩增、杂交信号扩增和分子信标。在一个实施方案中,使用高容量cdna档案试剂盒(appliedbiosystem(abi),fostercity,ca),按照制造商的提议方案(简言之,使用2微克总rna/50微升水,与50ul的包含逆转录缓冲液、脱氧核苷酸三磷酸溶液、随机引物和multiscribe逆转录酶的2xrt混合物混合),进行总rna的逆转录。rt反应条件是众所周知的。在一个实例中,rt反应使用以下热循环仪条件进行:10mins、25℃;120min.、37℃{参见kiddm等"theroleofgeneticmarkers—nap1li、mage-d2,andmta1—indefiningsmall-intestinalcarcinoidneoplasia,"annsurgoncol2006;13(2):253-62)。为测量单个转录物水平,在一个实施方案中,根据制造商的提议,使用assays-on-demandtm产品与abi7900序列检测系统{参见kiddm,eickg,shapiromd等microsatelliteinstabilityandgenemutationsintransforminggrowthfactor-betatypeiireceptorareabsentinsmallbowelcarcinoidtumors.cancer2005;103(2):229-36)。在一个实例中,在标准条件下使用universalpcrmastermixprotocol,通过在7.2ul水、0.8ul20·assays-on-demand引物和探针混合物和8ul2xtaqmanuniversalmaster混合物中在384-孔光反应板中混合cdna,在以下条件下进行循环:50℃、2min.;95℃;10min.;95℃15min.、60°1min,50个循环{参见kiddm等"theroleofgeneticmarkers—nap1li、mage-d2,andmta1—indefiningsmall-intestinalcarcinoidneoplasia,"annsurgoncol2006;13(2):253-62)。通常,来自实时pcr的结果使用内部标准和/或通过与持家基因的表达水平比较归一化。例如,在一个实施方案中,来自上述qpcr的原始act(δct=作为扩增函数的循环次数的变化)数据使用众所周知的方法,例如genorm归一化{参见vandesompelej,depreterk,pattynf等accuratenormalizationofreal-timequantitativert-pcrdatabygeometricaveragingofmultipleinternalcontrolgenes.genomebiol2002;3(7):research0034)。通过持家基因表达水平归一化也是众所周知的。参见kiddm等"genechip,genorm,andgastrointestinaltumors:novelreferencegenesforreal-timepcr,"physiolgenomics2007;30(3):363-70。微阵列分析包括使用固定在表面上的选择的核酸分子。这些核酸分子,称为探针,能够杂交至核酸表达产物。在优选的实施方案中,探针暴露于标记的样品核酸、杂交、洗涤和测定样品中的与探针互补的核酸表达产物的(相对)量。微阵列分析允许同时测定大量基因的核酸表达水平。在本发明的方法中,优选同时测量至少5个根据本发明的基因。可进行背景校正,例如根据避免扣除背景后的负强度值的"偏置(offset)"方法。此外,可进行归一化以使每个单一阵列的两个通道相当,例如使用全局loess归一化和标度归一化,其确保按比例缩放log比率,以在阵列间具有相同的中位数绝对偏差(mad)。蛋白质水平可例如使用基于抗体的结合测定法测量。酶标记的、放射性标记的或荧光标记的抗体可用于检测蛋白质。示例性的测定法包括酶联免疫吸附测定(elisa)、放射免疫测定(ria)、蛋白质印迹测定和免疫组织化学染色测定。或者,为了同时测定多种蛋白质的表达水平,使用蛋白质阵列,例如抗体阵列。通常,生物标记物和持家标记物在生物学样品中检测,例如组织或流体样品,例如血液,例如全血、血浆、血清、粪便、尿、唾液、泪液、血清或精液样品,或自这样的组织或流体制备的样品,例如细胞制备物,包括来自血液、唾液或组织例如肠粘膜、肿瘤组织和包含和/或疑似包含gep-nen转移的组织的细胞,或脱落的肿瘤细胞,例如肝、骨和血液。在一个实施方案中,特定的细胞制备物通过细胞悬浮液或来自组织的流体或流体例如粘膜例如肠粘膜、血液或血沉棕黄层样品的荧光激活细胞分选(facs)获得。在一些实施方案中,样品获自gep-nen患者,疑似具有gep-nen的患者,一般具有和/或疑似具有癌症的患者,显示一种或多种gep-nen症状或综合征或测定有gep-nen风险的患者,或经历治疗或具有完全治疗的gep-nen患者,包括疾病得到缓解和/或认为得到缓解的患者。在其它实施方案中,样品获自没有gep-nen疾病的人、例如健康个体或具有不同类型的癌症的个体,所述癌症例如腺癌,例如胃肠腺癌或乳腺癌、前列腺癌或胰腺癌或胃癌或肝癌之一,例如食管癌、胰腺癌、胆囊癌、结肠癌或直肠癌。在一些实施方案中,样品获自gep-nen肿瘤或转移。在其它实施方案中,样品获自gep-nen患者,但获自预期不包含gep-nen或gep-nen细胞的组织或流体;这样的样品可用作参比或正常样品。或者,正常或参比样品可以是来自没有gep-nen疾病的患者的组织或流体或其它生物学样品,例如相应的组织、流体或其它样品,例如正常血液样品、正常小肠(si)粘膜样品、正常肠色素(ec)细胞制备物。在一些实施方案中,样品是全血样品。因为神经内分泌肿瘤转移,它们通常将细胞脱落至血液。因此,在血浆和血液样品中检测本文提供的gep-nen生物标记物小组可用于在早期时间点鉴定gep-nen和用于预测肿瘤转移的存在,例如即使解剖学定位研究是阴性的。因此,提供的试剂和方法可用于早期诊断。因此,在一些实施方案中,所述方法可在1ml或约1ml的全血中鉴定gep-nen分子标记或表达谱。在一些方面,分子标记或表达谱在冷冻前稳定长达四个小时(例如,当静脉放血后样品在4-8℃冷却)。在一个方面,使用获自肿瘤组织的样品,能够诊断、预后或预测给定的gep-nen相关结果的方法也能够使用血液样品进行相同的诊断、预后或预测。许多现有的检测和诊断方法需要7-10天以产生可能的阳性结果,和成本可能很高。因此,在一个方面,提供的方法和组合物可用于改进简单性和减少与gep-nen诊断相关的成本,和使得早期诊断可行。因此,在一个实例中,生物标记物在循环中检测,例如通过在血液样品例如血清、血浆、细胞例如获自血沉棕黄层的外周血单核细胞(pbmc)或全血样品中检测。在一些癌症中,肿瘤特异性转录物已在全血中检出。参见sieuwertsam等"molecularcharacterizationofcirculatingtumorcellsinlargequantitiesofcontaminatingleukocytesbyamultiplexreal-timepcr,"breastcancerrestreat2009;118(3):455-68和mimorik等"alarge-scalestudyofmt1-mmpasamarkerforisolatedtumorcellsinperipheralbloodandbonemarrowingastriccancercases,"annsurgoncol2008;15(10):2934-42。cellsearchtmctctest(veridexllc)(描述于kahanl.,"medicaldevices;immunologyandmicrobiologydevices;classificationoftheimmunomagneticcirculatingcancercellselectionandenumerationsystem.finalrule,"fedregist2004;69:26036-8)使用涂覆有epcam-特异性抗体的磁珠,其检测上皮细胞(ck-8/18/19)和白细胞(cd45),如描述于sieuwertsam,kraanj,bolt-devriesj等"molecularcharacterizationofcirculatingtumorcellsinlargequantitiesofcontaminatingleukocytesbyamultiplexreal-timepcr,"breastcancerrestreat2009;118(3):455-68。该方法已用于在转移的前列腺癌(daniladc,hellerg,gignacga等circulatingtumorcellnumberandprognosisinprogressivecastration-resistantprostatecancer.clincancerres2007;13(23):7053-8)、结肠直肠癌(cohensj,alpaughrk,grosss等isolationandcharacterizationofcirculatingtumorcellsinpatientswithmetastaticcolorectalcancer.clincolorectalcancer2006;6(2):125-32)和乳腺癌(cristofanillim,buddgt,ellismj等circulatingtumorcells,diseaseprogression,andsurvivalinmetastaticbreastcancer.nengljmed2004;351(8):781-91)中检测循环肿瘤细胞(ctc),和监测疾病进展和治疗功效。这种和其它已有的方法对于gep-nen细胞的检测尚未完全满意,其可显示可变的表达和/或不表达细胞角蛋白(参见vaneedens等classificationoflow-gradeneuroendocrinetumorsofmidgutandunknownorigin,"humpathol2002;33(11):1126-32;caiyc等"cytokeratin7and20andthyroidtranscriptionfactor1canhelpdistinguishpulmonaryfromgastrointestinalcarcinoidandpancreaticendocrinetumors,"humpathol2001;32(10):1087-93,和本文描述的在29种gep-nen样品的两种中检测epcam转录物表达的研究)。在可用的循环肿瘤细胞检测方法中考虑的因素是在外周血中相对少量的细胞,通常约1个/106个外周血单核细胞(pbmc)(参见rossaa等"detectionandviabilityoftumorcellsinperipheralbloodstemcellcollectionsfrombreastcancerpatientsusingimmunocytochemicalandclonogenicassaytechniques,"blood1993;82(9):2605-10),和白细胞污染的可能。参见sieuwertsam等"molecularcharacterizationofcirculatingtumorcellsinlargequantitiesofcontaminatingleukocytesbyamultiplexreal-timepcr,"breastcancerrestreat2009;118(3):455-68;mimorik等)和可用方法的技术复杂性。这些因素可使可用的方法不完全满足临床实验室使用。在一些实施方案中,在吖啶橙(ao)染色和吸收后使用已知的方法,神经内分泌细胞经facs-分选至异质性,如描述于kiddm等"isolation,purificationandfunctionalcharacterizationofthemastomyseccell,"amjphysiol2006;291:g778-91;modlinevi等"thefunctionalcharacterizationofnormalandneoplastichumanenterochromaffincells,"clinendocrinolmetab2006;91(6):2340-8。在一些实施方案中,提供的检测方法用于在2-3ml血液或更少中检测、分离或富集gep-nen细胞和/或生物标记物。该方法使用标准实验室仪器进行,因此容易在临床实验室条件下进行。在一个实例中,以平均成本大约20-30/样品,在12小时内获得读出。本发明提供本文提供的试剂和检测方法的诊断、预后和预测用途,例如用于诊断、预后和预测gep-nen、相关的结果和治疗反应性。例如,可用的gep-nen分类方法受到限制,部分地由于不正确的分类并且个体损伤或肿瘤可发展成不同的gep-nen亚型或模式,和/或含有超过一个gep-nen亚型。例如在预测对治疗的反应或准确区别可在临床过程和治疗反应中明显不同的具有相似组织病理学特征的肿瘤和预测治疗反应性的能力方面,已知的分类框架受到限制。因此对基于分子或基因的分类方案存在需要。提供的方法和系统,包括基于gep-nen-特异性预测性基因的模型,解决这些问题,和可用于鉴定和分析预测生物学行为的分子参数和根据这样的参数进行的预测。提供的诊断、预后和预测方法是利用统计学分析和生物数学算法和预测模型以分析关于gep-nen生物标记物和其它标记物例如持家基因的表达的检测的信息的那些。在一些实施方案中,表达水平、检测的结合或其它信息经归一化和针对参比值,例如正常样品或标准品中的表达水平进行评估。提供的实施方案包括使用关于gep-nen生物标记物的表达的检测和测量的信息,例如在分类、分期、预后、治疗设计、治疗选项评价和gep-nen疾病结果预测,例如预测转移发生中分类和预测gep-nen的方法和系统。在一些实施方案中,所述方法用于建立gep-nen诊断,例如早期疾病或转移的诊断或检测,定义或预测疾病程度,鉴定早期散布或转移,预测结果或预后,预测进展,分类疾病活性,监测治疗反应性,检测或监测复发和促进早期治疗干预。例如,提供的方法和算法包括用于分类、分期、预后、治疗设计、评价治疗选项和预测gep-nen疾病结果,例如预测转移发生的那些。在一个实施方案中,方法、算法和模型可用于诊断监督,例如常规监督和患者随访。在一些实施方案中,方法、算法和模型提供早期诊断;在一个方面,方法能够检测低体积肿瘤,和检测循环肿瘤细胞,包括在疾病的早期阶段,例如检测少至3个或约3个循环gep-nen细胞/毫升血液。在一些实施方案中,早期疾病迹象允许早期治疗干预,此时疗法更有效,这可改进存活率和疾病结果。例如,在一个实施方案中,所述方法可用于早期检测gep-nen的复发和/或转移,例如在治疗后,例如在手术或化学干预后。在一些方面,所述方法在治疗干预后每周或每月进行,例如在人血液样品中。在一些方面,所述方法能够检测太小而不能通过常规方法,例如通过成像方法检出的微转移。例如,在一个方面,所述方法能够检测小于1厘米(cm)的转移,例如为1cm、0.9cm、0.8cm、0.7cm、0.6cm、0.5cm、0.4cm、0.3cm、0.2cm或0.1cm,或约1cm、0.9cm、0.8cm、0.7cm、0.6cm、0.5cm、0.4cm、0.3cm、0.2cm或0.1cm的转移,例如在肝中。例如,提供的方法和系统包括在受试者或样品中确定gep-nen的存在或不存在(或两者)的那些,其正确识别率在56和92%之间,例如至少或至少约65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%正确识别率。在一些情况下,所述方法可用于以至少或至少约70%、7%5、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特异性或灵敏性进行诊断。在其它方面,与其它诊断方法,例如成像和可用生物标记物的检测相比,所述方法能够在治疗后或在起始疾病进展期间在较早期阶段检测gep-nen的复发、转移或散布。在一些方面,生物标记物的检测的表达水平和/或表达标记与疾病的进展、疾病严重性或侵袭性、缺少治疗反应性、减少治疗功效、gep-nen相关事件、风险、预后、gep-nen的类型或类别或疾病阶段明显相关。提供的实施方案包括在治疗开发、策略和监测,包括评价对治疗的反应和考虑可能的肿瘤自然史和患者的一般健康的患者-特异性或个体化治疗策略中使用提供的生物标记物和其检测的方法。gep-nen管理策略包括手术—为了治愈(很少实现)或细胞减少—放射性干预—例如,通过化疗栓塞或射频消融—化疗、冷冻消融和用生长抑素和生长抑素类似物(例如sandostatin(醋酸奥曲肽注射液))治疗以控制由释放的肽和神经胺引起的症状。生物学试剂,包括干扰素和激素疗法,和生长抑素-标记的放射性核苷酸正在研究中。在一个实例中,冷冻消融释放gep-nen组织进入血液,其进而引起症状,如描述于mazzagliapj等“laparoscopicradiofrequencyablationofneuroendocrinelivermetastases:a10-yearexperienceevaluatingpredictorsofsurvival,”surgery2007;142(l):10-9。化学治疗试剂,例如系统性细胞毒性化学治疗试剂,包括依托泊苷、顺铂、5-氟尿嘧啶、链脲菌素、多柔比星;血管内皮生长因子抑制剂、受体酪氨酸激酶抑制剂(例如sunitinib、sorafenib和vatalanib)和哺乳动物雷帕霉素靶蛋白(mtor)抑制剂(例如temsirolimus和依维莫司),和其组合,例如以治疗弥散性和/或分化较差的/侵袭性疾病。其它治疗方法是众所周知的。在一些实施方案中,检测和诊断方法结合治疗使用,例如在治疗前和/或后通过每周或每月进行所述方法。在一些方面,表达水平和表达谱与疾病进展、治疗的无效或有效、和/或疾病的复发或其缺乏有关。在一些方面,表达信息指示不同的治疗策略是优选的。因此,本文提供了治疗方法,其中gep-nen生物标记物检测方法在治疗之前进行,然后用于监测治疗效果。在开始或重新开始治疗后的各个时间点,生物标记物的表达水平或表达谱的显著变化(例如与治疗前,或在治疗后的某一其它时间点,和/或在正常或参比样品中的表达或表达谱相比)指示治疗策略成功或不成功,疾病复发,或应使用不同的治疗方法。在一些实施方案中,在进行检测方法后改变治疗策略,例如除了当前方法之外,通过加入不同的治疗干预,或替换当前的方法,通过增加或降低当前方法的侵袭性或频率,或停止或重建治疗方案。在另一方面,生物标记物的检测的表达水平或表达谱首次鉴定gep-nen疾病,或提供gep-nen疾病的首次的确定诊断或分类。在该实施方案的一些方面,根据表达水平或表达谱和/或确定的分类设计治疗方法。所述方法包括反复方法,从而在生物标记物检测方法之后开始或改变治疗干预,接着继续周期性监测、重新评估和改变、停止或加入新治疗方法,任选继续监测。在一些方面,所述方法和系统确定测定的受试者是否对治疗有反应,例如在临床上分类为完全缓解或显示稳定的疾病的受试者。在一些方面,所述方法和系统确定受试者是否是未治疗的(或治疗-i,即未接受治疗)或是无反应的(即,临床上分类为“进行性的”)。例如,提供了区别治疗有反应和无反应的患者和区别稳定疾病的患者或完全缓解的患者和进行性疾病的患者的方法。在各个方面,所述方法和系统以至少或约65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%正确识别率(即、准确性)、特异性或灵敏性进行这样的识别。在一些方面,诊断或预测或预后结果的灵敏性或正确识别率大于,例如显著大于,使用已知的诊断或预后方法,例如检测和测量循环cga或其它单一蛋白质所获得的。通常,诊断、预后和预测方法,通常在初始步骤中根据它们建立可准确预测和分类gep-nen和/或gep-nen的不同阶段的分类器的能力,选择生物标记物的亚组。用于评价基因表达差异的许多众所周知的方法中的任一种可用于选择生物标记物亚组。例如,准确的分类器可基于地形的、基于图形识别的方案,例如支持向量机(svm)(noblews.whatisasupportvectormachine?natbiotechnol.2006;24(12):1565-7)。基于机器学习的技术对于开发复杂的自动和/或目标算法用于分析高维度和多峰生物医学数据,通常是需要的。在一些实例中,svm—监督学习算法的变体—结合提供的方法和系统使用。svm已用于以>90准确性预测星形细胞瘤的等级,和以74-80%的准确性预测前列腺癌(glotsosd,tohkaj,ravazoulap,cavourasd,nikiforidisg.automateddiagnosisofbraintumoursastrocytomasusingprobabilisticneuralnetworkclusteringandsupportvectormachines.intjneuralsyst2005;15(l-2):1-11;glotsosd,tohkaj,ravazoulap,cavourasd,nikiforidisg.automateddiagnosisofbraintumoursastrocytomasusingprobabilisticneuralnetworkclusteringandsupportvectormachines.intjneuralsyst2005;15(1-2):1-11)。用于建立准确分类器的其它算法包括线性判别分析(lda)、朴素贝叶斯(nb)和k-最近邻域(knn)方案。这样的方法可用于鉴定在肿瘤病况中的单个或多变量改变(drozdovi,tsokas,ouzounisca,shaham.genome-wideexpressionpatternsinphysiologicalcardiachypertrophy.bmcgenomics.2010;11:55;freemantc,goldovskyl,broschm等construction,visualization,andclusteringoftranscriptionnetworksfrommicroarrayexpressiondata.ploscomputbiol2007;3(10):2032-42;zampetakia,kiechls,drozdovi等plasmamicrornaprofilingrevealslossofendothelialmir-126andothermicrornasintype2diabetes.circres.2010;107(6):810-7.epub2010jul22;dhawanm,selvarajas,duanzh.applicationofcommitteeknnclassifiersforgeneexpressionprofileclassification.intjbioinformresappl.2010;6(4):344-52;kawarazakis,taniguchik,shirahatam等conversionofamolecularclassifierobtainedbygeneexpressionprofilingintoaclassifierbasedonreal-timepcr:aprognosispredictorforgliomas.bmcmedgenomics.2010;3:52;vandebrielrj,vanloverenh,meredithc.alteredcytokine(receptor)mrnaexpressionasatoolinimmunotoxicology.toxicology.1998;130(1):43-67;urgarde,voodert,vosau等metagenesassociatedwithsurvivalinnon-smallcelllungcancer.cancerinform.2011;10:175-83.epub2011jun2;pimentelm,amichaim,chuak,brahaml.validatinganewgenomictestforirritablebowelsyndromegastroenterology2011;140(suppl1):s-798;lawlorg,rosenbergl,ahmeda等increasedperipheralbloodgata-3expressioninasymptomaticpatientswithactiveulcerativecolitisatcolonoscopy.gastroenterology2011;140(suppl1))。在一些实施方案中,用于gep-nen和/或gep-nen的不同阶段的准确分类器基于svm、lda、nb和knn方案的组合。这称为用于net的多分析物-算法风险分类器(maarc-net)。使用预测算法和模型的方法使用统计学分析和数据压缩方法,例如本领域众所周知的那些。例如,表达数据可转化(例如in-transformed)和输入统计学分析程序,例如genomicsuite("partek,"genomicssuitetm,ed.revision6.3st.louis:partekinc,2008)或类似的程序,例如。数据经压缩和分析用于比较。是否认为表达水平评分或值的差异是显著的可通过众所周知的统计学方法确定,和通常通过指定针对特定的统计学参数的阈值,例如阈值p-值(例如p<0.05)、阈值s-值(例如+0.4,s<-0.4或s>0.4)或认为差异是显著的其它值进行,例如其中在两种不同的样品中生物标记物的表达被认为分别显著下调或上调,例如代表了两个不同的gep-nen亚型、肿瘤、阶段、定位、侵袭性或gep-nen或正常或参比样品的其它方面。在一个方面,算法、预测模型和方法基于自作为各种gep-nen亚型的基础的调节基因簇(即、sstr组、增殖组、信号组、代谢组、分泌组、分泌组、多能组、表观基因组和凋亡组)有关的基因表达的生物标记物。在一个方面,所述方法应用数学公式、算法或模型鉴定特定的截止点,例如预定的表达水平评分,其区别正常和gep-nen样品、gep-nen和其它癌症,和各种亚型、阶段和疾病或疾病结果的其它方面。在另一方面,所述方法用于预测、分类、预后和治疗监测和设计。在一个方面,预测实施方案可用于鉴定预测生物学行为的分子参数,和使用参数预测各种gep-nen相关的结果。在这些实施方案的一个方面,使用机器学习方法,例如开发复杂的自动和目标算法用于分析高维度和多峰生物医学数据。本文使用的"roc曲线"是指二元分类器系统的真阳性率(灵敏性)针对假阳性率(特异性)的曲线,因为其区别阈值是变化的。roc曲线可等同地表示为将阳性中的真阳性分数(tpr=真阳性率)相对于阴性中的假阳性分数(fpr=假阳性率)作图。roc曲线上的各点表示灵敏性/特异性对,对应于具体判定阈值。auc表示roc曲线下面积。auc是1)gep-nen生物标记物的亚组或小组和2)roc曲线的诊断准确性的总体指示。auc通过“梯形规则”来确定。对于给定的曲线,数据点通过直线段连接,垂直线从横坐标竖立到各数据点,和计算如此建立的三角形和梯形的面积总和。在本文提供的方法的某些实施方案中,gep-nen的亚组或小组具有范围约0.75-1.0的auc。在某些这些实施方案中,auc范围为约0.50-0.85、0.85-0.9、0.9-0.95或0.95-1.0。为了比较表达水平评分或其它值,和为了根据gep-nen生物标记物表达来鉴定表达谱(表达标记)或调节性标记,将数据压缩。压缩通常通过主分量分析(pca)或类似的技术以描述和可视化高维度数据的结构。pca允许在不同的样品中,例如在正常或参比和试验样品之间和在不同的肿瘤类型中可视化和比较gep-nen生物标记物表达,和测定和比较表达谱(表达标记、表达模式)。在一些实施方案中,表达水平数据例如通过实时pcr获得,和简化或压缩成例如主分量。pca用于减少数据(例如测量的表达值)的维度成不相关的主分量(pc),其解释或代表了数据中的大部分变量,例如约50%、60%、70%、75%、80%、85%、90%、95%或99%的变量。在一个实例中,pca是3-分量pca,其中使用三个pc,其总体代表数据中的大部分的变量,例如约75%、80%、85%、90%或更多变量(jolliffeit,"principlecomponentanalysis,"springer,1986)。pca作图,例如3-分量pca作图用于绘制数据成三维空间,用于可视化,例如通过分别指定第一(1st)、第二(2nd)和第三(3rd)pc为x-、y-和z-轴。pca可用于确定各种样品中的生物标记物的表达谱。例如,单个样品类型(例如各肿瘤类型、亚型或等级,或正常样品类型)的减少表达数据在pca坐标系统中定位,和定位数据用于确定单个转录物表达谱或标记。在一个方面,通过作图或定义形心(质心;平均表达)确定各样品的表达谱,其对应于或代表样品的单个转录物表达谱(调节性标记),如通过主组分向量给出的,如通过生物标记物小组的pca确定的。一般而言,在该坐标系统中被相对大的距离分开的两个形心或定位点代表了两个相对不同的转录物表达谱。同样,相对接近的形心代表了相对类似的谱。在这种表示中,对于不同的样品,形心间的距离反向地等同于类似性度量(较大距离=较小类似性),使得在形心间大的距离或分隔指示具有不同转录物表达标记的样品。形心接近性指示样品间的类似性。例如,不同的gep-nen肿瘤样品的形心间的相对距离代表了它们的调节性标记或转录物表达谱的相对相似性。在一个方面,统计学和比较分析包括确定两种生物标记物的表达水平或值之间的逆相关性。在一个实例中,这种相关性和各个表达向量之间的角的余弦(较大的角=较低的类似性)用于鉴定相关的基因表达簇(gabrielkr,"thebiplotgraphicdisplayofmatriceswithapplicationtoprincipalcomponentanalysis,"biometrika1971;58(3):453)。在一些实施方案中,在两种或更多种生物标记物的表达水平和/或gep-nen的存在或不存在、亚型、阶段或其它结果之间存在线性相关。在一个方面,在提供的gep-nen生物标记物和生物学样品的特征之间,例如在生物标记物(和其表达水平)和各种gep-nen亚型之间(例如良性对比活性疾病)存在表达-依赖性相关。皮尔森相关性(pc)系数(r2)可用于评价在各对值之间、例如在不同生物学样品的生物标记物的表达水平之间(例如肿瘤亚型)和在各对生物标记物之间的线性关系(相关性)。该分析可用于通过计算各对生物标记物的pc系数,线性分离表达模式的分布(在各个类似性矩阵的x-和y-轴上作图)。可设定各种线性相关程度的阈值,例如(r>0.50,或0.40)的高线性相关的阈值。线性分类器可应用于数据集。在一个实例中,相关系数是1.0。在一个实施方案中,调节簇通过使用统计学分析构建相关性网络确定,例如以鉴定由生物标记物的小组的亚组构成的调节簇。在一个实例中,确定pc相关系数和用于构建这样的相关性网络。在一个实例中,网络通过在具有高于预定义的阈值的r的转录物对之间拉延边界鉴定。相关性程度可提供关于再现性和稳健性的信息。本文还提供目标算法、预测模型和地形学分析方法,和使用它们分析高维度和多峰生物医学数据(例如使用提供的检测gep-nen生物标记物小组的表达的方法获得的数据)的方法。如上所述,目标算法、模型和分析方法包括根据地形学的数学分析、基于模式识别的方案例如支持向量机(svm)(noblews.whatisasupportvectormachine?natbiotechnol.2006;24(12):1565-7)、线性判别分析(lda)、朴素贝叶斯(nb)和k-最近邻域(knn)方案、以及其它监督学习算法和模型,例如决策树、感知器和正则判别分析(rda),和本领域众所周知的类似模型和算法(gallantsi,"perceptron-basedlearningalgorithms,"perceptron-basedlearningalgorithms1990;1(2):179-91)。在一些实施方案中,应用特征选择(fs)以从数据集、例如gep-nen生物标记物表达数据集除去大部分冗余特征,和产生相关的gep-nen生物标记物亚组。fs提高泛化能力,加速学习过程,和改进模型解译能力。在一个方面,使用"贪心向前(greedyforward)"选择方法来应用fs,选择最相关的特征亚组用于稳健的学习模型。(pengh,longf,dingc,"featureselectionbasedonmutualinformation:criteriaofmax-dependency,max-relevance,andmin-redundancy,"ieeetransactionsonpatternanalysisandmachineintelligence,2005;27(8):1226-38)。在一些实施方案中,支持向量机(svm)算法用于通过在n个数据集之间增加界限而分类数据(cristianinin,shawe-taylorj.anintroductiontosupportvectormachinesandotherkernel-basedlearningmethods.cambridge:cambridgeuniversitypress,2000)。在一些实施方案中,预测模型包括决策树,其将关于一个项目的观察结果映射为关于其目标值的结论(zhangh,singerb."recursivepartitioninginthehealthsciences,"(statisticsforbiologyandhealth):springer,1999)。树的叶子表示分类,和分枝表示转移成各个分类的特征的关联。其已经有效地(70-90%)用于预测转移性乳腺癌(yuletal"tgf-betareceptor-activatedp38mapkinasemediatessmad-independenttgf-betaresponses,"emboj2002;21(14):3749-59)以及结肠癌(zhanghetal"recursivepartitioningfortumorclassificationwithgeneexpressionmicroarraydata.,"procnatlacadsciusa2001;98(12):6730-5)的预后,以>90%准确性预测星形细胞瘤的分级(glotsosdetal"automateddiagnosisofbraintumoursastrocytomasusingprobabilisticneuralnetworkclusteringandsupportvectormachines,"intjneuralsyst2005;15(1-2):1-11),和以74-80%准确性预测前列腺癌(mattfeldttetal."classificationofprostaticcarcinomawithartificialneuralnetworksusingcomparativegenomichybridizationandquantitativestereologicaldata,"patholrespract2003;199(12):773-84)。该技术的效率已通过10倍交叉验证测量(piroozniametal"acomparativestudyofdifferentmachinelearningmethodsonmicroarraygeneexpressiondata,"bmcgenomics2008;9suppl1:s13)。预测模型和算法进一步包括感知器,一种形成前馈神经网络和映射输入变量至二元分类器的线性分类器(gallantsi."perceptron-basedlearningalgorithms,"perceptron-basedlearningalgorithms1990;1(2):179-91)。其已用于预测乳腺癌的恶性(markeymketal."perceptronerrorsurfaceanalysis:acasestudyinbreastcancerdiagnosis,"computbiolmed2002;32(2):99-109)。在该模型中,学习速率是常量,其调节学习的速度。较低的学习速率改进分类模型,同时增加处理变量的时间(markeymketal."perceptronerrorsurfaceanalysis:acasestudyinbreastcancerdiagnosis,"computbiolmed2002;32(2):99-109)。在一个实例中,使用0.05的学习速率。在一个方面,感知器算法用于区别局部或原发性肿瘤和对应的转移肿瘤。在一个方面,使用三次数据扫描,以产生明确将数据分隔成各类的决策边界。预测模型和算法进一步包括正则判别分析(rda),其可用作其它数据挖掘技术的灵活备选方案,包括线性和二次判别分析(lda、qda)(lilienrh,faridh,donaldbr."probabilisticdiseaseclassificationofexpression-dependentproteomicdatafrommassspectrometryofhumanserum.,"jcomputbiol2003;10(6):925-46.;cappellend,luong-nguyennh,bongiovannis,etal."transcriptionalprogramofmouseosteoclastdifferentiationgovernedbythemacrophagecolony-stimulatingfactorandtheligandforthereceptoractivatorofnfkappab."jbiolchem2002;277(24):21971-82)。rda的正则化参数γ和λ用于设计lda和qda之间的中等分类器。当γ=0和λ^ο时进行qda,而当γ=0和λ=1时进行lda(picona,goldli,wangj,cohena,friedmane.asubsetofmetastatichumancoloncancersexpresseselevatedlevelsoftransforminggrowthfactorbeta1.cancerepidemiol.biomarkersprev.1998;7(6):497-504)。为了减少过度拟合,选择rda参数以最小化交叉验证误差,同时不等于0.0001,因此迫使rda产生lda、qda和l2之间的分类器(pimai,aladjemm.,"regularizeddiscriminantanalysisforfacerecognition,"patternrecognition2003;37(9):1945-48)。最后,在机器学习中正则化本身已广泛用于克服过度拟合(evgeniout,pontilm,poggiot."regularizationnetworksandsupportvectormachines.,"advancesincomputationalmath2000;13(l):l-50.;jis,yej.kernel"uncorrelatedandregularizeddiscriminantanalysis:atheoreticalandcomputationalstudy.,"ieeetransactionsonknowledgeanddataengineering2000;20(10):1311-21)。在一个实例中,正则化参数定义为γ=0.002和λ=0。在一个实例中,对于每个类对,对所有转录物指定s-值,其然后通过减少s-值进行排列。进行rda,例如21次,使得第ν次迭代由前n个评分转录物组成。可通过rda分类器的10倍交叉验证进行误差评估。这可通过分割组织数据集为互补的亚组,对一个亚组(称为训练集)进行分析和对其它亚组验证分析(称为验证集或试验集)而进行。在一个实例中,错分类误差经平均以减少总体预测评估的可变性,与其它方法(包括步步为营法和弃一交叉验证)相比,这可提供更准确的误差评估方法(kohavir."astudyofcross-validationandbootstrapforaccuracyestimationandmodelselection.,"proceedingsofthefourteenthinternationaljointconferenceonartificialintelligence,1995;2(12):1137-43)。在一个实例中,进行组织分类选择,例如通过如下计算每个基因和每个类对的等级评分(s):其中μcl和μc2分别表示第一和第二类的均值,和σc1和σc2是类间标准偏差。大的s值指示在各类内显著差异表达("倍数变化")和低的标准偏差("转录物稳定性")。基因可通过递减的s值进行分选,和用作正则判别分析算法(rda)的输入。可评价、验证和交叉验证算法和模型,例如以验证模型的预测和分类能力,和评价特异性和灵敏性。在一个实例中,径向基函数用作核函数,和10倍交叉验证用于测量分类的灵敏性(cristianinin,shawe-taylorj."anintroductiontosupportvectormachinesandotherkernel-basedlearningmethods.,"cambridge:cambridgeuniversitypress,2000)。各个分类模型和算法可通过提供的方法进行比较,例如使用本文提供的训练和交叉验证,以比较预测模型预测特定结果的性能。提供的方法、系统和预测模型的实施方案是可重复的,具有高的动态范围,可检测小的数据变化,和使用简单方法、低成本进行,例如用于在临床实验室中实施。提供试剂盒和其它制品用于本文所述的诊断、预后、预测和治疗应用。在一些实施方案中,试剂盒包括载体、包裹或包装,其经分区以接收一个或多个容器,例如小瓶、管、板和孔,其中各容器包括本文提供的方法中使用的一种单独的元件,和在一些方面,进一步包括带有使用说明书的标签或插页,例如按本文所述使用。在一个实例中,单个容器包括用于检测本文提供的gep-nen生物标记物的单种试剂;在一些实例中,单个容器包括用于检测持家基因和/或归一化的试剂。例如,所述容器可包含试剂,例如探针或引物,其经可检测地标记,或可被可检测地标记。在方法使用核酸杂交进行检测的情况下,试剂盒还可具有包含用于扩增靶核酸序列的核苷酸的容器。试剂盒可包括包含报告子的容器,例如生物素结合蛋白,例如抗生物素蛋白或链霉抗生物素蛋白,其结合报告分子,例如酶、荧光或放射性同位素标记;这样的报告子可与例如核酸或抗体一起使用。试剂盒通常包含上述容器和与其附带的一个或多个其它容器,其包含从商业和用户客户角度需要的材料,包括缓冲液、稀释液、滤器、针头、注射器;载体、包裹、容器、小瓶和/或管标签,其列出内容物和/或使用说明书,和带有使用说明书的包装插页。可在容器上或伴随容器一起提供标签,以指示组合物用于特定的治疗或非-治疗应用,例如预后、预防、诊断或实验室应用,和还可指示体内或体外使用的指导,例如本文描述的那些。指导和/或其它信息也可包括在插页或标签上,所述插页或标签包括在试剂盒上或伴随试剂盒一起。标签可在容器上或伴随容器一起。当形成标签的字母、数字或其它符号被模塑或蚀刻在容器本身上时,标签可在容器上;当标签提供在还容纳容器的器托或载器内时,标签可伴随容器,例如作为包装插页。标签可指示组合物用于诊断、治疗、预防或预后病况,例如gep-nen。在另一个实施方案中,提供包含组合物,例如氨基酸序列、小分子、核酸序列和/或抗体,例如可用于诊断、预后或治疗gep-nen的材料的制品。制品通常包含至少一个容器和至少一个标签。合适的容器包括例如,瓶、小瓶、注射器和试管。容器可自各种材料形成,例如玻璃、金属或塑料。容器可容纳氨基酸序列、小分子、核酸序列、细胞群和/或抗体。在一个实施方案中,容器容纳用于检查细胞的mrna表达谱的多核苷酸,以及用于此目的的试剂。在另一个实施方案中,容器包含抗体、其结合片段或特异性结合蛋白,用于评价在生物学样品、例如血液或细胞和组织中的gep-nen生物标记物的蛋白质表达或用于相关的实验室、预后、诊断、预防和治疗目的;用于这些用途的指示和/或指导可包括在这样的容器上或伴随这样的容器,以及用于这些目的的试剂和其它组合物或工具。制品可进一步包含第二容器,包含药学上可接受的缓冲液、例如磷酸缓冲盐水、林格溶液和/或葡萄糖溶液。其可进一步包括从商业和用户客户角度需要的其它材料,包括其它缓冲液、稀释液、滤器、搅拌器、针头、注射器和/或包装插页,以及使用指示和/或说明书。netmarkergenesinprimarynet的差异表达–使用affymetrix人外显子1.0st阵列进行局部小肠net的外显子水平筛选,以定义与对照(正常肠粘膜)比较的在神经内分泌肿瘤组织中的选择剪接事件。外显子表达分析鉴定了在正常肠粘膜和net肿瘤组织之间1287个差异表达的基因。529个基因上调和758个下调。例如,net标记物基因亚组特别集中于cga、tph1、vmat2、scg5和ptprn2。在该亚组中net标记物基因的rma-归一化的外显子表达显示于图1,在正常(绿色)和肿瘤(红色)样品中。这些基因中,tph1是所有外显子在肿瘤中差异表达的唯一基因(fc>1.5、p<0.05),而cga是所有外显子在肿瘤和正常样品间表达保持不变的唯一基因。在vmat2的17个差异表达的外显子中鉴定了2个,和在scg5的9个中鉴定了8个。在ptprn2中,30个外显子中的6个差异表达。这些结果证实,需要特异性引物/探针组以使肿瘤和正常基因表达之间的差异最大化。通过rt-pcr验证net标记物基因的选择剪接–参照图2,使用逆转录聚合酶链反应(rt-pcr),验证差别的外显子转录物水平的发现结果。所有标记基因外显子,包括tph11-2、vmat29-10、scg52-3和ptprn212-13,经确认是在肿瘤样品对比正常粘膜中差异表达的,cga4-5是个例外。来自图1和2的基因组和rt-pcr数据分别鉴定了在net中发生差异剪接并且候选生物标记物,例如vmat2需要使用特异性引物/探针组以有效地捕获靶转录物的表达差异。为了在血液中评价相关性,进行外周net血液样品的微阵列分析。上调的基因(n=1,397)包括go-fat项,例如“rna剪接”、“囊泡介导的运输”和“染色质修饰”,这与这些过程在net病理学中的已知作用一致。血液转录物组与gep-net转录物组的比较鉴定了236个上调的基因,检查了其中72个作为生物标记物的应用。初步筛查鉴定了与对照相比,51个基因在肿瘤血液样品中上调。42个基因(83%)自多个外显子转录。对于在血液中的这些基因,测试了最少2个引物/探针组,以定义最相关的组合用于靶标扩增。对于引物/探针组,持家基因和51个验证的目的靶标和外显子描述于表2。对在表2中的各gen-nen生物标记物鉴定的扩增子位置按表1中的下划线序列鉴定。表2:引物细节用于数学推导的(maarc-net)评分系统–四种分类算法(svm、lda、knn和bayes)和10倍交叉验证设计的最小基因集的描述,用于建立分类器以在血液中鉴定gep-net。参见modlini,drozdovi,kiddm:theidentificationofgutneuroendocrinetumordiseasebymultiplesynchronoustranscriptanalysisinblood.plosone2013,e63364。这些分类器在训练组上建立,和在对照和肿瘤病例之间显著上调的特征通过t-检验计算。参考图3,表2中表征的51个基因的检查鉴定了包括至少22个基因足以建立准确的(>0.85)分类器。图3显示了各分类器算法的预测准确性,使用连续添加至多27个使用10倍交叉验证的结果在gep-net样品中获得的显著上调的基因(p<0.05)。使用连续添加的27个基因,svm、lda、knn和bayes算法区别gep-net与对照血液样品的平均准确性是相当的–分别为0.89(0.85-1.0)、0.89(0.86-0.93)、0.88(0.85-0.93)和0.86(0.85-0.93)。四种分类器的“多数票”组合实现0.88的准确性。足以建立准确分类器的至少22个基因用于开发maarc-net评分系统,和在表3中表征。表3:在数学推导的maarc-net评分系统中包括的22个基因倍数变化p-值调整的p-值pnma20.8195156.74e-213.43e-19nap1l10.6624344.9e-181.25e-16fzd70.7998583.82e-156.5e-14slc18a20.5240461.08e-121.37e-11nol30.8095717.22e-107.36e-09sstr50.8773221.64e-091.4e-08tph10.4591851.75e-071.27e-06raf10.3165091.54e-067.86e-06rsf10.5300541.74e-068.07e-06sstr30.5552693.82e-061.62e-05sstr10.4930521.73e-056.81e-05cd590.262572.7e-059.82e-05araf0.2283324.07e-050.000138aplp20.2281534.42e-050.000141kras0.2058229.92e-050.000298morf4l20.3198260.0001690.000453trmt1120.2696180.0011250.002524mki670.1912450.0034680.007074sstr40.3138070.0037340.007324ctgf0.1968450.0076650.01303spata70.2886250.014670.02338zfhx30.132480.0313540.045687数学推导的maarc-net评分系统的精修–基于单个pcr的基因表达包括在评分中。参见modlini,drozdovi,kiddm,plosone2013。该评分根据“多数票”策略和自二元分类系统开发,从而样品被识别为“正常”和给予评分0或识别为“肿瘤”和评分为“1”。评分范围可为0(四次识别均为“正常”)至4(四次识别均为“肿瘤”)。每次“识别”是四种不同的学习算法之一的二元结果(对于正常为“0”或对于肿瘤为“1”):支持向量机(svm)、线性判别分析(lda)、k-最近邻域(knn)和朴素贝叶斯(bayes)。这四种学习算法各自在包括67个对照和63个gep-nen的内部训练组上训练。在该训练组中,使用t-检验,差异表达的基因(对照对比gep-nen)被鉴定为显著的。根据训练组,每种学习算法经训练以区分正常和肿瘤基因表达至至少p<0.05的显著性水平内。根据多数票策略,小于2次“正常”识别的那些样品被分类为gep-nen。参考图4a,样品审查鉴定了85%的对照显示评分“0”。没有肿瘤评分为“0”。roc分析鉴定了评分2是正常样品(对照)对比肿瘤(评分>2)的截止。对于在两个独立组中鉴定gep-net,该方法显示正确识别率91-97%,其中灵敏性和特异性为85-98%和93-97%。参见modlini,drozdovi,kiddm,plosone2013。这些数据初始源自于130个样品的试验数据组(n=67对照,n=63net)。试验组中固有两类net–临床定义为治疗的、稳定的疾病(sd:n=35)和未治疗的、进行性的疾病(pd:n=28)。分类算法还将肿瘤识别分为两组“治疗的”和“未治疗的”。0-4的二元分类因此被修正以代表对于每个具体样品的3种可能的识别:“正常”、“肿瘤(治疗的)”和“肿瘤(未治疗的)”。应用许多规则以产生修正的多数票策略。“正常”的识别指定为值0;“治疗的”肿瘤的识别指定为值1;“未治疗的”肿瘤的识别指定为值2。例如,如果样品产生四次“正常”识别,对每次识别指定值0,从而总计评分为0。如果样品产生四次“治疗的”肿瘤的识别,对识别指定值1,从而总计评分为4。如果样品产生四次“未治疗的”肿瘤的识别,对每次指定“2”,从而总计评分为8。修正的多数票策略中的评分范围可因此为0-8。试验数据组(n=130)的检查用于确立修正的多数票-来源的评分是否可用作“治疗”反应的度量。类似于图4a所示的公开的0-4评分,大多数net患者显示修正的多数票评分>2,如图4b所示。参考图4c,多数票和修正的多数票评分显著相关(r2=0.89、p<0.0001)。参考图5a,与对照相比,试验组中的数据分析确定了肿瘤中修正的数学衍生评分(0-8)显著升高,并且相对于sd,在pd中最高。参考图5b,产生了对照对比gep-net(sd和pd组合)的接受器工作特征(roc)曲线。roc曲线是对预测子可能的灵敏性和特异性潜在组合的组的概括。roc曲线是诊断试验的不同可能割点的真阳性率(灵敏性)相对于假阳性率(1-特异性)的图。图5b是试验组和对照样品组中灵敏性和特异性值分布之间的功能关系的图示。曲线下面积(auc)是(1)修正的数学衍生评分和(2)接受器工作特征(roc)曲线的诊断准确性的总体指示。auc可以通过“梯形规则”来确定。对于给定的roc曲线,数据点通过直线段连接,垂直线从横坐标竖立到每个数据点,并且计算如此建立的三角形和梯形的面积之和。图5b中的roc曲线确定了可以利用经修正的数学衍生评分来区分对照和gep-net,其表现出auc>0.98,p<0.0001;*p<0.05与对照组比较;#p<0.05与sd比较(双尾mann-whitneyu检验)。随后在独立组(sd:n=111,pd:n=48)中检查了修正的数学衍生评分。参考图6a,独立组中的评分显著升高,表现出p<0.0001。参考图6b,在sd和pd患者中修正的数学衍生评分的频率分布图证实了pd样品表现出更高的分数,#p<0.0001与sd比较(双尾mann-whitneyu检验)。参考图7a,产生第二个roc曲线,以确定修正后的数学衍生评分是否可用于区分sd与pd。在试验组(sd:n=35,pd:n=28)中,roc分析确定了该分数可用于区分pd与sd肿瘤,auc为0.93。>6.5的分数截止(即≥7的分数)对于检测pd具有85%的敏感性和83%的特异性(似然比:4.97)。参考图7b,评估了经修正的数学衍生评分系统在独立组(n=111sd,n=48pd)中区分sd和pd的效用。正确识别的百分比范围在70-90%之间,使用≥7的截止值。对于sd,使用≥7的截止值,89%的net被正确预测,而67%的pd被正确预测。性能指标为:灵敏性=67%,特异性=89%,ppv=73%,npv=86%。因此,数据表明从0-8范围的数学衍生的maarc-net评分可用于区分对照和gep-net。评分系统的应用和“netest1”的列线图的开发-为了区分对照和net,≥3的截止值具有95%的灵敏性和94%的特异性。使用截止值≥2,灵敏性可以提高到98%。为了区分sd和pd,可以使用≥7的截止值(灵敏性为85%和特异性为83%)。使用截止值≥5,灵敏性可以提高到96%。因此,数学衍生的maarc-net评分范围为0-2(对照);2-5(sd);和5-8(pd)。这些评分可以转换为表4所示的百分比。表4:数学衍生的评分百分比数学衍生的评分0-22-55-77-8疾病列线图评分00-55%55-75%75-100%低中等高参考图8,来自表4的评分百分比可以在表示“netest1”的列线图中显示。netest1列线图证实了如何实现修正后的数学衍生评分,以及如何将患者分类到不同类别gep-nen(无疾病,稳定疾病或进行性疾病)。参考图9,评估了netest1列线图的效用。示出了使用图8的netest1列线图正确预测sd和pd的值。总体而言,netest1列线图确定80%的sd患者表现为低或中度疾病活性,84%的pd患者表现出高疾病活性。在临床定义为稳定或进行性疾病(最佳临床判断和/或成像数据)的患者中检查评分系统的应用和“netest2”-maarc-net衍生的netest评分(0-8)的列线图的开发。试验组(图10a)或独立组(图10b)中每个亚型的分数的频率分布表明sd患者的中值netest值为4,pd患者的范围为7-8。然而,sd患者可以显示maarc-net衍生的评分>4,而pd可以显示分数<7。完整患者组(试验组+独立组)的评估表明,最高频率sd评分为4(30%-图11a),而46%的pd具有8分(图11a)。风险概率评估确定了0-5之间的netest评分与sd相关,具有≥90%的确定性(图11b)。8分最有可能是pd(>90%)。然而,6和7分无法准确区分sd与pd。基于图11a和11b的这些结果,可以更新来自图8的netest1列线图以包括风险值。图12的netest2a列线图包括了包含评分和风险分类的netest。为了升级风险评估netest2a列线图,可以评估sd和pd样品中的个体基因表达。在sd和pd样品中最大差异表达的基因被鉴定并用于决策树中以产生用于定义netest评分是sd还是pd的规则。这种方法为netest2提供了基础。5的netest评分具有识别sd样品的几率>90%(如图11-12所示)。评分为5(sd对比pd)的患者之间的各51个基因表达谱的比较确定smarcd3和tph1的表达作为候选差异标志物。使用以下规则:如果smarcd3≤0.13和tph1<4,则识别为pd。这允许定义进行性疾病的100%准确性。netest评分为6,具有约50%的几率区分sd与pd样品。基因表达谱分析鉴定了vmat1和phf21a作为候选物。roc分析定义了每个区别pd与sd的auc为:vmat1:roc=0.835phf21a:roc=0.733使用规则:如果vmat1≥0和phf21a<1.2则识别为sd如果vmat1≥0和phf21a≥1.2则识别为pd这允许定义进行性疾病的100%准确性和定义sd的90%准确性。总体准确性为93%。netest评分为7,具有约50%几率将sd与pd样品区分开。对于netest评分为6,基因表达谱分析鉴定了vmat1和phf21a二者作为候选物。roc分析定义了每个区别pd与sd的auc为:vmat1:roc=0.835phf21a:roc=0.733使用规则:如果vmat1≥0和phf21a>1则识别为sd如果vmat1≥0和phf21a≤1则识别为pd这允许定义进行性疾病的100%准确性和定义sd的95%准确性。总体准确性为97.5%。netest评分为8,具有≥90%的几率将样品识别为pd。zzz3的表达被鉴定为候选者。roc分析将该基因的auc定义为1.0。使用规则:如果zzz3≤14则识别为pd这允许定义进行性疾病并与sd区分的100%准确性。参考图13,使用该单独的基因表达信息来最终确定“netest2”列线图,其为患者提供准确的疾病分类谱。在图13的netest2列线图中使用的netest评分和个体基因表达信息的组合在表5中进一步详细描述。表5:netest2列线图信息准确性低风险稳定疾病netest评分0-590–100%中等风险稳定疾病(i)netest评分6(低phf21a)90-100%中等风险稳定疾病(ii)netest评分7(高phf21a)95–100%中等风险稳定疾病(iii)netest评分8(高zzz3)100%中等风险进行性疾病(i)netest评分6(高phf21a)100%中等风险进行性疾病(ii)netest评分7(低phf21a)97.5–100%高风险进行性疾病netest评分8(低zzz3)100%定义临床相关基因-为了进一步精修评分系统,检查了基因簇表达,并开发了算法来捕获信息。个体基因簇结合生物学信息,其可以增强数学衍生的maarc-net评分系统。可以将重点放在表6包括的文献挑选的基因簇中。表6:每个簇中包含的基因参考图14a,示出了肿瘤的标记,包括描绘肿瘤(腺癌)来源的标志。参考图14b,示出了基于hanahan和weinberg分类的net标志。图14中所示的9个簇的值源自基因添加。除基因簇外,还对两种算法进行了评估:1)“pda”算法,其包括增殖组、信号组、分泌组ii、多能组和表观基因组的总和(pda算法也称为进行性诊断i);2)“nda”算法,其包括与疾病相关的15个基因的表达:这些包括araf1,braf,kras,raf1,ki67,nap1l1,nol3,glt8d1,pld3,pnma2,vmat2,tph1,fzd7,morf4l2和zfhx3(nda算法也称为进行性诊断ii)。对基因求和,得出了平均值。在评估血液样品中9种基因簇和两种算法的价值之前,评估其在net肿瘤组织中的表达以证实这些与net相关。分别参考图15b和15a,可以将22个net中的表达与正常粘膜中的表达(n=10)进行比较。评估确定,九个簇中有七个对net是特异性的(与正常粘膜相比)。特别是,net中的信号组、代谢组、分泌组(i)和(ii)、表观基因组、凋亡组和sstr组的表达升高(p<0.05)。net中的凋亡组基因减少,而net和正常粘膜之间的增殖组没有差异。关于算法,图16显示了与正常粘膜相比,net肿瘤组织中的pda和nda中的每一个都显著增加(p<0.05)。此后,在血液样品中评估每个簇的表达。我们检查了试验组(n=130),并评估了它们的表达是否与sd或pd相关。在对照和sd/pd之间的基因表达中注意到显著差异,如图17和表7所示。表7:基因簇和临床结果簇名称convssdconvspdsdvspd增殖组p<0.05p<0.05ns生长因子信号组p<0.05nsp<0.05代谢组nsp<0.05ns分泌组i(一般性)p<0.05p<0.05p<0.05分泌组ii(进行性)p<0.05p<0.05p<0.05表观基因组nsp<0.05p<0.05凋亡组p<0.05p<0.05ns多能组p<0.05p<0.05nssstr组p<0.05p<0.05p<0.05ns=不显著双尾mann-whitneyu检验这些数据表明,可以使用基因簇来区分sd和pd与对照,以及鉴别sd和pd之间的差异。参考图18,在独立组(n=159)中检查基因簇结果,评估sd与pd中的每个簇。在独立组中,增殖组、分泌组(ii)、多能组和表观基因组显著增加。接下来,在两个数据集(独立和试验组)的每一个中评估pda和nda。参考图19a,在试验组中对于两种算法中的任一种,在sd和pd之间没有鉴定显著差异。参考图19b,pda和nda中的每一个在独立组中升高。接下来,每个算法被包括在合并组(试验+独立:n=222)中,并且评估了它们用于预测sd与pd的效用。参考图20a,在合并组中,与sd相比,在pd中pda和nda二者升高。参考图20b,roc分析确定了表8中列出的pda和nda的以下参数。表8:合并组中的roc分析参数,pda和ndapdandaauc0.72±0.0340.6±0.03895%ci0.652–0.7850.525–0.675p-值<0.00010.014roc截止值5874基于试验(tda)和独立(ida)组中的基因簇表达差异评估了另外两种算法。tda在试验组中包括sd和pd之间显著差异的基因簇的总和。这些包括tda:分泌组(i)、多能组和sstr组(tda算法也称为进行性诊断iii);和ida:增殖组、分泌组(ii)、多能组和表观基因组(ida算法也称为进行性诊断iv)。在试验组和独立组中评估每个算法。参考图21a,在试验组中与sd相比,在pd中tda显著升高。参考图21b,在独立组中tda和ida算法均显著提高。接下来,在合并组中用两种算法进行roc分析。roc分析确定了表9中列出的tda和ida的以下参数。表9:合并组中的roc分析参数,tda和idatdaidaauc0.62±0.040.70±0.03495%ci0.542–0.6980.637–0.770p-值0.003<0.001roc-截止值>43>46图22a中示出了用于区分sd和pd的tda和ida的算法生成的roc曲线。用于区分sd和pd的每个簇的算法生成的roc曲线在图22b中示出。图22a和22b中的roc曲线证明了对于sd和pd的差异,auc范围为0.51(gf信号组)至0.72(多能组)。因此,捕获该信息的个体基因簇表达和算法包含与临床观察相关的生物相关信息。这些为定义临床相关的maarc-net评分系统提供依据。netest基因临床应用的证明-netest评分的临床应用以及相关基因簇和算法的评分现在将被定义。进行手术切除net如何改变循环基因标志的检查,以证明试验如何具有作为手术治疗完整性的度量的效用。检查手术前和手术后>1个月的29例手术治疗患者的参数。作为一组,如图23a所示,maarc-net评分从平均6.58±1.48显著下降到3.65±1.6(p<0.0001)。嗜铬粒蛋白a(cga)是用于net的先前已知的单一生物标志物测定法中使用的基因,如图23b所示,未显著降低(58.5±137.9ng/ml对比55.25±154.8)。netest1如何进行的检查,即netest评分在手术治疗前和手术治疗后中的变化,包括在图24中。在手术之前,62%的患者被包括在高疾病类别中。手术后为0%(χ2=24,p=5x10-8)。手术影响疾病状态的替代评估由手术方法的百分比变化提供-没有残留疾病(r0)的证据相对于残留疾病包括转移的证据。参考图25a,与r1/r2组(不完全切除)相比,r0组(完全切除)中maarc-net评分的水平显著降低(p<0.003)。为了更好地定义手术的作用,检查了四种算法中的每一种。pda(99.3±21对比41.1±7.5,p<0.0001;图26a),nda(45.8±10.3对比29.6±7.8,p<0.01;图26b),tda(133.3±32.3对比43.8±9.3,p<0.0001;图26c)和ida(86.1±19.3对比34.1±7.2,p<0.0001;图26d)中确定了(手术后)显著下降。参考图27,单个簇的检查确定了sstr组、增殖组、gf信号组、代谢组、分泌组i/ii和表观基因组术前和术后的显著降低。参考表10,肿瘤组织的手术切除与循环基因表达降低至与四种算法的每种算法和9种基因中的6种的sd的roc截止值不相同或低于所述roc截止值的水平相关。表10:手术切除、基因簇和每种算法之间的关系所有进行手术的患者均可视为显示进行性/活性疾病。手术后,根据所使用的算法,29名患者中的3-7名患者(10-24%)的评分或算法指示进行性疾病。手术显著降低了循环肿瘤标志,可以为肿瘤切除程度以及残留活性疾病提供证据。因此,试验的临床实用性通过与手术前血液相比,检查评分、算法和簇和评估来定义。手术后样品中例如pda或增殖组的表达升高的证据表明残留的进行性(高活性疾病)。参考图28,示出了包括手术相关算法和基因簇的netest3列线图。组合评分以及基因簇的改变,例如增殖组的显著增加将指示手术后的疾病再生长。值得注意的是,虽然术后成像确定了r0患者n=1(10%)中的疾病,但是在1个月时6例(60%)中基因评分升高明显。随后,两名r0个体在6个月时出现阳性成像。标准药物治疗对循环net标志的影响-对循环net标志评估了针对net的标准药理学疗法,生长抑素(用于治疗>80%患者)的功效。在通过成像和最佳临床判断被认为是sd(n=63)或pd(n=26)的用生长抑素类似物治疗的患者中进行了标志物评估。用生长抑素类似物后是sd的那些患者被认为是稳定治疗的患者,而用生长抑素类似物后是pd的那些患者被认为是失败的治疗。参考图29a,sd组的maarc-net评分明显低于治疗失败的评分:3.33±0.21对比5.77±0.3(p<0.001)。参考图29b,两个组中嗜铬粒蛋白a无显著差异(44.7±17.2ng/ml对比102.4±58.7)。与pd相比,算法的评估显示了sd中它们每一个显著不同。具体而言,pda(62.8±11.4对比153.9±36.2,p<0.002;图30a),nda(6±0.6对比13.5±3,p<0.03;图30b),tda(56.8±7.4对比154±37.2,p<0.02;图30c)和ida(51.7±11.1对比140.5±36,p<0.0005;图30d)。参考图31,各个簇的检查确定了相对于pd组,sd组中的sstr组、增殖组、分泌组ii、多能组和表观基因组显著较低。这些数据表明尽管生长抑素类似物(ssa)治疗,但显示进行性疾病的患者在maarc-net评分,以及四种算法和特定基因簇中的每一种中表现出增加,包括增殖,以及表观基因组的增加。因此,评估ssa治疗是否有效的一个机制是评估这些参数的评分是否改变。然而,鉴于sd和pd组之间的这些参数中的每一个的重叠,更好地定义pd组将是有帮助的。为此,可以将失败治疗中的循环标志表达与对照中的那些进行比较。这种方法背后的假设是有效的治疗(即sd)可以使标志归一化。推论是pd将与正常显著不同。为了确定这一点,使用roc分析来检查正常的循环转录物并与pd进行比较。检查所有四种算法以及基因簇。参考图32,数据的分析确定了算法(图32a)和选择的簇(图32b)区分了对照与用ssa治疗的pd。单个簇的数据包含在表11中。表11:对于ssa治疗失败的那些和对照,基因簇与每种算法之间的关系算法/簇auc95%cip-值pd的rocnda0.98±0.010.965-1.00<0.0001>3pda0.92±0.040.851-0.994<0.0001>40tda0.99±0.010.975-1.01<0.0001>29ida0.91±0.040.828-0.998<0.0001>31sstr组0.98±0.010.95-1<0.0001>22增殖组0.97±0.020.94-1<0.0001>14gf信号组0.71±0.070.564-0.855<0.002>5代谢组0.56±0.070.41-0.7ns<8分泌组(i)0.98±0.020.944-1<0.0001>4分泌组(ii)0.62±0.070.486-0.759ns>1.6多能组0.61±0.080.454-0.763ns<0.7表观基因组0.86±0.050.756-0.962<0.0001>16凋亡组0.73±0.060.618-0.834<0.001<0.95根据表11中的数据,在sd病例中检查nda和tda以及sstr组、增殖组和分泌组(i),以评估这些参数是否与治疗功效的临床评估相关。个别算法或基因簇的评估确定了样品在33-75%的病例中被分类为显示疾病(图33a)。与最佳3评分(56%)相比,sstr组和增殖组的升高组合导致预测为显示进行性疾病的病例数最少(28%)(图33b)。参考图34,命名为“netest4”的生长抑素类似物治疗患者的列线图因此包括maarc-net评分以及sstr组、增殖组及其组合。netest和基因表达用于预测生长抑素类似物功效的效用-为了评估netest在治疗中的效用,评估了ssa与临床确定的结果(按recist标准)之间的关系。在二十八名患者中收集了治疗前和每月的样品。成像可用于对治疗前和治疗期间的疾病模式进行分期和分类(最多12个月随访)。在这个前瞻性样品组中,ssa导致进行性疾病患者数量的显著减少(图35a)。在ssa治疗之前和治疗期间每月收集的血液样品中也测定了评分,以评估早期改变是否预示结果,即对治疗的反应。参考图35b,结果表明在治疗期间在任何时间点测量的提高的netest评分(80-100%活性)是治疗反应性的预测。参考图36a,在检测临床显著性疾病(pd)之前,从48至252天(平均=105天)发生netest(80-100%)的显著升高。cga的平均时间为70天(范围:0-196天)。netest更有信息性,发生在较早的时间(p=0.04),并且在比cga(57%表现为>25%的升高,p=0.016)更多的患者(在100%中观察到高活性)中。参考图36b,在14名患者中,netest(80-100%评分)的升高发生在比图像可识别疾病进展(241天)的显著更早的时间(94.5天)(*p<0.0001,χ2=19)。cga的类似分析确定了这与基于图像的评估没有差异(图36b,185.5天与241天)。cga变化发生明显晚于netest(p=0.002,χ2=13.6)。netest和基因表达用于预测疾病复发的效用-netest的效用为了评估netest疾病复发的效用,netest和临床确定的结果(按recist标准)之间的关系在长期前瞻性研究中评估。在三十四名患者中采集了治疗前和间隔长达五年的样品。成像可用于对治疗前和治疗期间的疾病模式进行分期和分类(最多65个月随访)。在该前瞻性样品组中,与sd患者(中位数:26%,范围7-94%;p=0.01)相比,pd患者(中位数:75%,范围53-94%)的初始netest评分显著升高(图37a)。8名sd患者的水平>40%。在这些中,7例出现疾病复发的中位数为12.2个月(范围3.6-57.7;图37b)。参考图37c,七名初始sd患者(netest评分低)没有发生复发性疾病。中位随访时间为58个月(范围:32-64)。随时间过程,鉴定了进行性疾病的十六个事件。每个都与升高的netest相关(评分>80%)。参考图37d,评分升高的患者的进展中位时间为13.4个月(范围:3.6-57)。总的来说,netest升高的23/24事件与中位数约13个月的疾病复发发生有关。持续低分的7/7是无病的(最多5年)。试验的准确性为97%。net基因作为肿瘤增殖和成像的替代量度的效用-评估了netest基因以及基因簇用作组织病理学和成像参数的替代标记物的效用。特别关注ki-67指数(肿瘤增殖的标记)和基于生长抑素的成像(例如68ga-pet)。这是为了证明netest及其要素作为标准临床度量的辅助手段可具有临床效用。作为示例,ki-67测量是基于组织的,因此是侵入性的。证明血液来源的相关性将提供肿瘤生长的实时测量,而不需要活检。这些分析在两个单独的数据集中进行:数据集1(n=28)和数据集2(n=22)。数据集1包括收集用于治疗干预的患者,即肽受体放射性核素治疗(prrt)。数据集2包括显示疾病稳定并正在进行常规随访的患者。ki-67指数的替代物:多变量回归分析在两组中的任一组中未鉴定个体基因表达与ki-67指数(肿瘤增殖的标志物)之间的任何显著相关性。参考图38a和38b,生长抑素受体表达的检查在每个肿瘤组中确定了与ki67的显著相关性(r=0.9,p=2×10-8)。在netestest中所有基因的检查确定了与ki-67(r=0.93-98,p=10-9-10-13,图38c-e)的显著更高的相关性。单一最有信息的基因是sstr4(图38d-f)。这些数据首先表明,netest作为一个整体可以用作液体活检,以确定肿瘤的增殖指数,即提供用于基于组织的组织病理学测量的替代标志物。其次,循环生长抑素受体基因的表达也可以用作肿瘤增殖的度量。增殖组+sstr组算法也称为进行性诊断v;高度相关的基因(kras,sstr4和vps13c)算法也称为进行性诊断vi;高度相关的基因+sstr组算法也称为进行性诊断vii。参考图39,显示了基因簇(sstr组和增殖组)或算法中的每一个和ki-67指数之间的相关性(线性回归)。单个基因簇的检查证实,sstr组和增殖组与ki-67指数相关(r=0.16-0.25,p<0.05,图39a,c)。算法分析确定了nda和tda算法与ki-67指数高度相关(r=0.34-0.42,p<0.002,图39b,f),而pda和ida较不相关(r=0.14-0.17,p=0.06,图39d,e)。这些结果表明,包括生物学相关的肿瘤信息例如sstr组的基因簇和算法可以用作肿瘤组织增殖的度量。与基于生长抑素的成像的关系:接下来检查试验中的基因是否与基于生长抑素的成像的两个变量,suvbmax(肿瘤摄取-受体密度/靶可用性的度量)和mtv(分子肿瘤体积-肿瘤负荷的度量)相关。多变量回归分析没有确定任何与suvmax相关的单一基因。然而,sstr组以及netest基因二者作为一组与suvmax有很好的相关性。两组的相关性范围对于sstr组(图40a-b)为r=0.88-0.94(p<10-7)和对于net基因组为r=0.97-0.98,p<10-13(图40c-d)。多变量回归分析将zfhx3鉴定为组1中mtv的标志物(r=0.98,图41a),而tph1与组2中的mtv相关(r=0.76,图41b)。类似于suvmax,sstr组以及netest基因二者作为一组与mtv良好相关。两组的相关性范围对于sstr组(图41c-e)为r=0.72-0.77(p<10-4)和对于net基因组为r=0.91-0.95,p<10-12(图41d-f)。这些数据表明,netest中的基因相关并可用于估计基于生长抑素类似物的疗法的目标可用性以及提供肿瘤负荷的度量。这两个方面对于指导治疗以及测量治疗功效至关重要。zfhx3作为疾病评估的标志物:如图41a所示,鉴定zfhx3作为mtv的最佳标志物,表明该基因的表达可能具有作为肿瘤负荷及其变化的度量的临床效用。zfhx3是通过控制细胞周期阻滞参与神经元分化调节的锌指蛋白。因此随后丧失细胞周期阻滞的zfhx3表达的丧失与肿瘤增殖和新损伤的发展和/或疾病进展有关。检查zfhx3的测量是否可以在net中提供新的生长/进展的标记物,和zfhx3的这种改变是否可能反映对治疗或治疗失败(进展)的反应。最初在具有新损伤迹象的患者中评估了该基因的表达。参考图42a,已经发展出新损伤(通过成像鉴定)的患者表达显著降低的zfhx3。参照图42b,那些被确定为sd的患者也具有比进行性的患者显著更高的水平。此外,参照图42c,手术后基因的表达增加。参考图43,一个组的长期随访(>3年)确定了保持稳定的患者在该时间段内没有表现出zfhx3表达的变化,而发展为进行性疾病的患者具有显著较低的表达水平。这些数据表明zfhx3表达与新损伤的发展相关,并且表达降低可用于定义疾病进展。netest和基因表达用于治疗功效预测的效用-为了进一步评估netest在治疗中的效用,评估了prrt与临床定义(按recist标准)结果之间的关系。在治疗前以及随访中收集了54例患者的样品。成像可用于对治疗前和治疗后的疾病模式进行分期和分类(3和6个月随访)。在该前瞻性样品组中,放射治疗显著导致进行性疾病患者数量的减少(图44a)。在6个月的随访期间对治疗没有反应的患者,即分类为进行性疾病的患者,显示netest评分增加。在该时间点,sd患者的评分显著降低(图44b)。注意到cga没有显著改变(图44c)。netest中的改变与治疗反应的变化匹配(图45)。生物标志物和结果的度量确定了netest的准确性为89%,灵敏性为75%,特异性为100%,ppv为100%,npv为83%(图46a)。参考图46b,cga的准确性为24%,灵敏性为17%,特异性为40%,ppv为40%,npv为17%。netest显著优于cga(卡方=27.4;p=1.2×10-7)。预处理netest评分以及分级是可用的并且用于鉴定基因表达和临床参数的组合是否预示结果,即对治疗的反应。参考图47a,netest基因亚组的表达水平在治疗前在反应者和无反应者之间显著不同。这些包括与生长因子信号传导相关的基因(gf信号组:araf1,braf,kras和raf1)以及与代谢相关的基因(包括atp6v1h,oaz2,pank2,pld3)。具体来说,prrt反应者在prrt前表现出显著升高的生长因子信号传导(9.4±1.3对比5.3±0.7,p=0.05)和显著升高的代谢组学基因表达(4.37对比2.3±0.6,p=0.03)。通过将基因表达求和,将两个“簇”(gf信号组+代谢组)整合为“生物学指数”,能够自无反应者预测未来的prrt反应者。5.9(归一化基因表达)的截止值对于预测反应(>5.9预测的prrt反应者)显示≥85%的特异性,导致auc为0.74±0.08(z统计量=2.915,p=0.0036)(图47b)。没有临床参数预测prrt反应,除了肿瘤等级之外。低等级肿瘤对治疗有反应(77%),而约50%的高级损伤与反应相关。仅分级有65%准确性(p=0.1)。相比之下,包括生物学指数(“gf信号组”+“代谢组”)和肿瘤分级组合的“预测商”显著(92%)更准确。预测商的auc(0.90±0.07)显著优于单独用于预测治疗反应的组织学等级(auc=0.66,面积差异0.23,z统计量2.25,p=0.024)(图47c)。预测商在临床上也是有用的。患者可分为低等级/高ome和高等级/低ome组。后者的pfs(17个月)显著低于低等级/高ome组(pfs未达到,对数秩:26.8;p<0.0001:图47d)。危害比为53.3。这些结果表明评分的改变与治疗反应相关,并且在治疗之前的循环net转录物测量预测prrt的结果。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1