乳腺癌的生物标志的制作方法

文档序号:6122377阅读:319来源:国知局

专利名称::乳腺癌的生物标志的制作方法乳腺癌的生物标志相关申请案本申请案主张2005年5月26日申请的美国暂时申请案60/685,459的优先权,该案全部内容特别并入本案参考。
技术领域
:一般而言,本发明关于临床诊断法。
背景技术
:乳腺癌为在女性中最常被诊断出来的癌症。在其仍可切除且有治愈机会下,症状前筛选以侦测早期乳腺癌可大大地降低乳腺癌相关的死亡率。不幸的是,只有63%的乳腺癌(1992-1999,美国)在诊断时被发现(Je腿l,A.ds丄(2004)CACancerJ.Clin.54:8-29)。即使以乳房X光摄影通常会错过或是没看到小病变,特别是在年轻女性及胸部组织密集的女性中(Antman,K.andShea,S.(1999)JAMA281:1470-1472)。有潜力辨识这些对造影技术而言为不可见的小病变的分子标志将提供在瘤肿(neoplasm)侵袭组织之前真正治疗它的机乳腺癌为高度异质。已经研究、用于乳腺癌早期侦测的大部分以分子为主的方法针对特定因子例如致癌基因、肿瘤抑制基因、生长因子、肿瘤抗原或其他基因产物。固有的问题为这些因子没有一个能够单独算是大多数的乳腺癌且有些对癌症或对胸部组织不具特异性,因此,这些方法的敏感度及特异性都低。目前,没有任一个分子生物标志被推荐用于乳腺癌早期侦测(Smith,R.A.e"丄(2004)CACancerJ.Clin.54:41-52)。人类乳腺由源自乳头且通过周围基质往胸壁的叉状分枝的分离乳管泡(ductal-alveolar)系统组成。大部分的乳腺癌(70-80%)被认为是从内衬于这些结构的末端乳管的上皮细胞形成。乳房上皮脱落细胞成为更新的组织且在乳管的腔室分泌液体。这些液体通过位于乳头的6至9个分离洞口而离开每个乳房,且其可使用两种非侵入性步骤的任何一种收集乳头吸引术(nippleaspiration)及乳管灌洗法(ductallavage)。在乳头吸引术中,简单的手提式吸杯放置于乳头上且用于自乳头开口快速获得浓缩的液滴。这些液滴经毛细管收集。此技术可成功用在大部分的女性(Sartorius,0.W.e"丄(1977)J.Natl.CancerInst.59:1073-1080)且产量典型为数微升至100微升(Klein,P.s丄(2001)BreastJ.7:378—387;Hsiung,R.a丄(2002)CancerJ.8:303-310)。由于乳头吸引的液体(NAF)只来自乳头的紧接的邻近区域且产量不可预测时,于是设计出乳管灌洗法系统。此方法涉及乳头抽吸以局部化NAF的生产腺体。之后使用微导管插管NAF的生产腺体且以生理食盐水灌洗。因其冲洗乳管全长,乳管灌洗液体(DLF)可提供较佳的细胞及肿瘤释放出的蛋白质的来源。与血清相比,乳房液体可能提供较佳的乳腺癌生物标志来源,因其呈现的蛋白质是特异性地来自乳房组织。因此,以可识别大部分乳腺癌病例的多样蛋白质组筛选一大群患者的乳房液体是有利的。
发明内容本发明是基于,至少部分基于乳头吸引液体(NAF)及乳管灌洗液体(DLF)中乳腺癌生物标志的发现。因此,本发明提供一种鉴定受试者乳腺癌状况的方法,包括(a)测量来自受试者的生物样本的至少一种生物标志,其中,至少一种生物标志选自由表1生物标志所组成的群组;及(b)关联测量与乳腺癌状况。在一种具体实施例中,至少一种生物标志是通过在SELDI探针吸附表面捕捉生物标志且以激光解析电离质谱质谱测定法(laserdesorption-ionizationmassspectrometry)侦领lj被捕捉的生物标志而测量。在另一种具体实施例中,至少一种生物标志以免疫检定法(immunoassay)测量。在一种具体实施例中,该吸附剂为IMAC-Cu2+吸附剂。在另一种具体实施例中,该吸附剂为生物特异性吸附剂(例如,生物特异性吸附剂包括抗防御素-l(defensin-l)、a_防御素-2、a-防御素-3a-l-抗胰蛋白酶抑制物的C端片段1或a-l-抗胰蛋白酶抑制物的C端片段2的抗体)。在一种具体实施例中,该关联是由软件分类演算法而实现。在另一种具体实施例中,乳腺癌状况选自乳腺癌及非乳腺癌。在另一种具体实施例中,乳腺癌状况选自第I期或第II期原发性原位乳腺癌及非乳腺癌。在另一种具体实施例中,若该测量关联于该乳腺癌,该方法进一步包括投予受试者至少一种治疗,该治疗选自下列群组手术、放射治疗及化学疗法。在一种具体实施例中,至少一种生物标志为a-防御素(例如,a-防御素为a-防御素-l、a-防御素-2或a-防御素-3)。在另一种具体实施例中,该生物标志为a-l-抗胰蛋白酶抑制物的C端片段(例如a-1-抗胰蛋白酶抑制物的C端片段1或a-1-抗胰蛋白酶抑制物的C端片段2)。在一种具体实施例中,测量至少两种生物标志。在另一种具体实施例中,测量至少三种生物标志。在另一种具体实施例中,该方法进一步包括测量至少一种能够区别乳腺癌及非癌症的生物标志,且其中,该生物标志不是a-防御素-1、a-防御素-2、a-防御素-3、BF-4、ci-l-抗胰蛋白酶抑制物的C端片段1或a-l-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,本发明提供一种决定乳腺癌进程的方法,包括(a)第一次测量来自受试者的生物样本的至少一种选自下列群组的生物标志a-防御素-l、a-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2;(b)第二次测量来自该受试者的生物样本的该至少一种生物标志;及比较第一次测量及第二次测量;其中,该比较测量决定乳腺癌的进程。在另一种具体实施例中,该方法进一步包括(d)在处理受试者后测量至少一种生物标志,及关联该测量与疾病进展。在另一种具体实施例中,该方法包括测量来自受试者的样本的至少一种选自下列群组的生物标志a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及ci-l-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,本发明提供一种包括纯化的生物标志的组合物,其中,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,本发明提供一种包括生物特异性捕捉剂的组合物,该捕捉剂特异地结合选自于下列群组的生物标志a-防御素-l、a-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-1-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,本发明提供一种组合物,其包括与生物标志结合的生物特异性捕捉剂,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、BF_4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,本发明提供一种试剂盒,其包括(a)包括至少一种捕捉剂附着于其上的固相载体,其中,该捕捉剂与至少一种生物标志结合,该生物标志选自下列群组a-防御素-l、a-防御素-2及a-防御素-3;以及(b)使用该固相载体侦测该至少一种生物标志的说明书。在一种具体实施例中,包括捕捉剂的固相载体为SELDI探针。在一种具体实施例中,该捕捉剂为頂AC-Cu2+吸附剂。在另一种具体实施例中,该试剂盒进一歩包括(c)含有至少一种生物标志的容器,该生物标志选自下列群组a-防御素-1、a—防御素-2、a—防御素一3、BF_4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,该试剂盒进一步包括(c)一种lKd阻断透析剂。在另一种具体实施例中,本发明提供一种试剂盒,其包括(a)包括至少一种捕捉剂附着于其上的固相载体,其中,该捕捉剂与至少一种生物标志结合,该生物标志选自下列群组a-防御素-1、d-防御素-2、ci-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段l及a-l-抗胰蛋白酶抑制物的C端片段2;以及(b)含有至少一种该生物标志的容器。在一种具体实施例中,包括捕捉剂的固相载体为SELDI探针。在一种具体实施例中,该捕捉剂为1區^012+吸附剂。在另一种具体实施例中,本发明提供一种软件产品,其包括(a)存取样本的数据的程式,该数据包括至少一种生物标志的测量,该生物标志选自下列群组a-防御素-1、a-防御素-2、a—防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2;以及(b)执行分类演算法的程式,其分类该样本的乳腺癌状况作为该测量的函数。在另一种具体实施例中,本发明提供一种包括以质谱测定法或免疫检定法侦测至少一种生物标志的方法,该生物标志选自下列群组a-防御素-l、a-防御素-2、a-防御素-3、BF_4、a-l-抗胰蛋白酶抑制物的C端片段1及ofa-l-抗胰蛋白酶抑制物的C端片段2。在另一种具体实施例中,本发明提供一种包括将关于乳腺癌状况的诊断结果传达至受试者的方法,该乳腺癌状况是由来自受试者的样本的至少一种生物标志的相关性所决定,该生物标志选自下列群组a-防御素-l、a-防御素-2、a-防御素-3、BF-4、抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。在一种具体实施例中,该诊断结果经由电脑产生的媒介物传达至受试者。在另一种具体实施例中,本发明提供一种辨识与生物标志相互作用的化合物的方法,该生物标志选自下列群组a-防御素-l、ci-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2,其中,该方法包括(a)将生物标志与测试化合物接触;以及(b)决定该测试化合物是否与生物标志相互作用。在另一种具体实施例中,本发明提供一种调节细胞中生物标志浓度的方法,该生物标志选自下列群组a-防御素-1、a—防御素一2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段l及a-1-抗胰蛋白酶抑制物的C端片段2,其中,该方法包括将该细胞与化合物接触,其中,该化合物调节该生物标志的表达或翻译后处理。在另一种具体实施例中,本发明提供一种治疗受试者症状的方法(例如乳腺癌),其中,该方法包括投予治疗有效量的化合物至受试者,其中,该化合物调节生物标志的表达或翻译后处理,该生物标志是选自于下列组成的群组a-防御素-1、a—防御素-2、a—防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。图示简单说明图1描述取自5位原发侵袭性癌症患者(C6、CIl、C14、C16及C26)以及取自五位正常控制组(N4、N15、N32、N33及N36)的乳头吸引液体的蛋白质图谱(profile)的假拟胶图。使用lug(微克)的总蛋白质于IMAC-Cu芯片阵列(chiparray)上获得质谱。来自不同受试者的NAF的一般蛋白质表达图谱各异,而相同检体三重复分析所得质谱则具有高度再现性。图2描述生物标志的训练与测试。训练样本NAF(A组与B组,代表两个经非监督式聚类分析(unsupervisedclusteranalysis)所辨i只的亚群)。测试样本收集组合(pooled)的DLF(C组)。所选出的生物标志以箭头指示。BF1至3显示为三个高峰聚类(M/Z3375,3447及3490)且在C6及C14升高而被选做A组最有效的辨识者。BF4(M/Z)4079在C11及C16升高,而BF5(M/Z4680)在C26升高;这两个标志都可区别B组癌症对非癌症检体。在测试数据中证实癌症中BF1至3及BF5升高。图3证明使用抗HNP1至3的单株抗体,BF1至3的抗体捕捉。该抗体的胺基连接至AminoLirik珠子且与两个具有高BF1至3高峰(NAF-C6与NAF-C14)的NAF检体培养。所显示为原始NAF-C6(A)与C14(C)的质谱;以及由两个相同检体捕捉到的蛋白质质谱(分别为B与D)。图4描述以ELISA对HNP1至3定量分析。以SELDI分析的BF1至3高峰振幅(顶部)关联于经ELISA测量的丽P1至3高浓度(底部)。图5描述从13位乳腺癌高危险群的女性中得到的42个DLF样本中的HNP1至3浓度(以ELISA测量)(A);以及在每个样本中相对应的蛋白质浓度(B)。在患者11中观察到HNP1至3持续升高(在两个时间点中,该位女性的6个样本中的5个样本)且HNP在样本中的低度表达不是因为缺乏蛋白质。图6描述在亚群A中显示出差异表达的BCl至3的数据;以及在亚群B中显示出差异表达的BC4与5。BC1至3之后经辨识为人类中性粒细胞多肽1至3(HNP1至3)。根据质谱中的相似度划分成组A与B;经非监督式聚类分析辨识。所有NAF检体来自M.D.AndersonCancerCenter。HNP1至3与BC5的升高也同样在来自约翰霍普金斯大学的一对组合DLF检体中观察到。图7证实在4位有侵袭性癌症的受试者(4/25)、1位有DCIS的受试者(1/3)与1位有ADH的受试者(1/3)的癌症/患病乳房中观察到BC5的上升表达(箭头)。没有一个对侧控制组(contra-lateralcontrol)的乳房显示其BC5为阳性,包括所有控制组受试者的乳房(数据未显示)。使用来自DCIS及ADH受试者的数据显示质谱再现性。作为比对,来自先前数据的C26质谱亦包含于其中。图8描述以EL工SA测量的HNP1至3浓度(毫微克/微克(ng/ug))。A:5个癌症受试者(c)的癌症乳房及5个健康控制组的乳房(n)的NAF样本从M.D.AndersonCancerCenter获得。在5个癌症病例中的2个观察到上升的HNP1至3,为浓度70-80ng/ug;B:先前数据,来自西北大学的DLF。为乳腺癌高危险群(5年盖尔危险率(Gailrisk)〉1.6或先前有小叶癌病史)的女性每6至12个月进行双侧乳管灌洗法。在受试者11观察到HNP1至3持续上升;C:NAF.1:侵袭性受试者控制组乳房;2:侵袭性受试者癌症乳房;3:DCIS控制组乳房;4:DCIS癌症乳房;5:ADH控制组乳房;6:ADH患病乳房;7:低危险群控制组受试者(无第1级相关家族史及具有小于2次的先前切片检查);8:高危险群控制组受试者(第1级相关家族史或有大于或是等于2次先前切片检查)。D:目前数据,DLF在西北大学收集。从58个高危险群受试者(5年盖尔危险率〉1.6或先前有小叶癌病史)的149个双侧乳管灌洗法取得的检体测量HNP1至3的基准线表达。图9A至9B描述BF-5经胰蛋白酶分解后的质谱。A:BF-5经胰蛋白酶分解后的质谱。B:A经胰蛋白酶分解后的1842高峰的质量片段的Mascot标记。图10A至10B描述BF-5的质谱。A:BF-5的质谱。B:BF-5至2发明详细说明1.引言生物标志为有机的生物分子,比较其在一种表现型状况的受试者样本中(例如,带有疾病)与在另一种表现型状况的受试者样本中(例如,不带疾病)为有差异性地呈现。若计算在不同群组中的生物标志平均值或中{直表达程度于统计学上为显著时,则生物标志在不同的表达型状况视为有差异性地呈现。于其它测试中,常见用于计算统计学上显著的检定其中包括T检定(t-test)、ANOVA、Kruskal-Wallis、Wilcoxon、Mann-Whitney及比值比(oddsratio)。单独或组合的生物标志提供测量受试者属于一种或另一种表现型状况的相关危险率。因此,生物标志为用于疾病(诊断法)、药物治疗有效性(治疗诊断科技(theranostics))及药物毒性的有用标志。2.乳腺癌的生物标志2.1.生物标志本发明提供以多胜肽为主的生物标志,其在患有乳腺癌的受试者中有差异性地呈现,特别是在乳腺癌患者与正常人(非乳腺癌)比较下。生物标志由质谱测定法测定的质荷比、飞行时间式(time-of-flight)质谱测定法中的光谱高峰形式及其对吸附剂表面的结合特性而辨别。这些特征提供测定特定侦测的生物分子是否为本发明的生物标志的方法。在区别生物分子的方法中,这些特征呈现出生物分子固有的特征且但并非作为分辨该生物分子的限制。在一态样中,本发明提供呈单离型态的生物标志。生物标志使用来自CiphergenBiosystems,Inc.(Fremont,CA)("Ciphergen")的蛋白质芯片阵列以SELDI技术发现。样本从被诊断患有乳腺癌的受试者(切片检査法证实为第I期或第II期单侧原发侵袭性乳腺癌)及被诊断为正常的受试者中经乳头吸引术或乳管灌洗法收集。施用样本至SELDI生物芯片,且样本中多胜肽光谱经CiphergenPBSII质谱仪的飞行时间式质谱测定法产生。使用蛋白质芯片软件3.0(Ciphergen)收集与评估原始光谱。手动选择信号/杂讯>5的合格质量高峰(目测检查),且标准化高峰强度为所选择质量区域(在这个例子中,其介于3kDa及135kDa)的总离子流。将二重复分析中所得的该高峰强度平均,之后转换成对数用于结果分析。此方法将于实施例有更详细的描述。因而发现的生物标志如表l所列。该「蛋白质芯片分析」一栏指的是发现生物标志的层析流份(chromatographicfraction)、生物标志所结合的生物芯片种类及洗涤条件如各例所示。表l<table>tableseeoriginaldocumentpage16</column></row><table>本发明的生物标志以经质谱测定法测定的质荷比为特征。每个生物标志的质荷比提供于表l中「M」之后。因此,例如,M3447具有测量出的质荷比为3447。质荷比由CiphergenBiosystems,Inc.PBS-II蛋白质芯片读数器质谱仪产生的质谱测定。此仪器具有质量准确率约+/-0.15%。此外,此仪器具有质量分辨率(massresolution)约400至1000m/dm,其中,m为质量而dm为在O.5峰高时的质谱宽度。使用BiomarkerWizardu"车欠件(CiphergenBiosystems,Inc.)测定生物标志的质荷比。BiomarkerWizard通过聚类由PBSII所测定的所有分析光谱的相同高峰的质荷比、取聚类中最高与最低质荷比且再除以2而指派出生物标志的质荷比。因此,所提供的质量反映出这些说明。本发明的生物标志进一步由飞行时间式质谱测定法的光谱高峰的形式辨别。质谱显示的高峰所代表的生物标志如图3所示。假拟胶图显示的条纹所代表的生物标志如图1与2所示。本发明生物标志进一步以其于层析表面的结合性质为特征。生物标志在以磷酸盐缓冲液(PBS)洗涤后与金属亲和性捕捉芯片阵列(例如Ciphergen皿C-Cu芯片)结合。本发明生物标志的某些身份BF-1、BF-2、BF-3、BF-5-1及BF-5-2已决定并显示于表1。做出该决定的方法于实施例中描述。对于身份己经决定的生物标志,其是否存在可由
技术领域
中已知的其他方法测定。特别是,BF-1、2及3经辨识分别为人类中性粒细胞多肽2、l及3(HNP-2、l及3),亦已知分别为a-防御素-2、1及3。HNP-1、2及3已知其特征为胜肽抗生素,其主要由人类嗜中性白血球制造,即使某些肿瘤亦可能产生具有相同能力的a-防御素。近期研究已辨识出HNP-1、2及3不同的作用活性,包括在肾细胞癌的肿瘤细胞增生(Miiller,CA.ds丄(2002)Am.J.Pathol.160:1311—1324)。HNP-1、2及3亦已知分别为a-防御素-1、2及3(见美国专利申请公开案US2004/0091498,此案并入本文参考)。人类a_防御素-1的胺基酸序列为ACYCRIPACIAGERRYGTCIYQGRLWAFCC(如SEQIDN0:1所示)。人类a_防御素-2的胺基酸序列为CYCRIPACIAGERRYGTCIYQGRLWAFCC(如SEQIDNO:2所示)。人类a_防御素_3的胺基酸序列DCYCRIPACIAGERRYGTCIYQGRLWAFCC(如SEQIDN0:3所示)。同样,BF-5-1已经辨识为a-l-抗胰蛋白酶抑制物(AAT)的C端片段。BF-5-1的胺基酸序列为LEAIPMSIPPEVKFNKPFWLMIDQNTKSPLFMGK丽PTQK(如SEQIDNO:4所示)。BF-5-2已经辨识为a-l-抗胰蛋白酶抑制物(AAT)的C端片段。BF-5-2的胺基酸序列为EAIPMSIPPEVKFNKPFVFLMIDQNTKSPLFMGK丽PTQK(如SEQIDNO:5所示)。因此,所例示的生物标志在本发明的方法中有用的为a-防御素。a-防御素为一个蛋白质家族,包括约94个胺基酸残基。特别是,a-防御素3为94个胺基酸蛋白质,其为GenBankAccessionNo.NP—005208的基因的表达产物。SEQIDN0:3为a-防御素3的C端片段。a-防御素1为94个胺基酸蛋白质,其为GenBankAccessionNo.:NP一004075的基因的表达产物。a-防御素由AbCam(CatalogNumberab12757)(Cambridge,MA)的抗体辨识。特定的a-防御素生物标志如表1所示为SEQIDNOs:1至3。进一步,在本发明方法中有用的生物标志为a-l-抗胰蛋白酶抑制物(AAT)的C端片段。a-l-抗胰蛋白酶抑制物为含有约418个胺基酸残基的蛋白质且为GenBankAccessionNo.:K01396的基因的表达产物。本发明所例示的标志包括抗胰蛋白酶抑制物的C端片段,例如长度为大约30、35、40、45或50个胺基酸残基的片段。a-1-抗胰蛋白酶抑制物由AbCam(CatalogNumberab9399)(Cambridge,MA)的抗体辨识。如表1所示特定的a-l-抗胰蛋白酶抑制物生物标志为SEQIDNOs:4及5。因为本发明的生物标志以质荷比、结合特性及光谱形式为特征,其可由质谱测定法侦测而不需要知道其特定身份。然而,如需要,身份未经测定的生物标志可由,例如测定多胜肽的胺基酸序列辨识。例如,生物标志可由一些酵素如,胰蛋白酶或V8蛋白酶做胜肽比对,及分解片段的分子量可用来搜寻序列资料库中所符合的以各种酵素产生的分解片段的分子量。或者,蛋白质生物标志可使用串联式(tandem)MS技术定序。在此方法中,蛋白质以例如凝胶电泳单离。切下含有生物标志的条纹且蛋白质经蛋白酶分解。以第一个质谱仪分离个别蛋白质片段。该片段之后经碰撞诱发冷却,其使胜肽成片段且产生多胜肽阶梯。多胜肽阶梯之后以串联式MS的第二个质谱仪分析。多胜肽阶梯部分质量的不同而辨识序列中的胺基酸。整个蛋白质可以这个方法定序,或序列片段可经资料库探勘找到身份候选者。侦测生物标志的较佳生物来源为乳头吸引液体(NAF)或乳管灌洗液体(DLF)。然而,在其他具体实施例中,生物标志可在血液、血清、血浆或尿液中侦测到。本发明的生物标志为生物分子。因此,本发明提供呈单离形态的生物分子。该生物标志可从生物液体如NAF或DLF中单离。其可以任何
技术领域
中已知的方法根据其质量及结合特征而单离。例如,如此处所述,含生物分子的样本经层析分离,以及用例如,丙烯醯胺凝胶电泳进一步分离。依对生物标志身份的知识亦可使用免疫亲和性层析法单离。3.生物标志及蛋白质的不同型态蛋白质常以多种不同型态存在于样本中。这些型态可因翻译前修饰及翻译后修饰其中之一或两者而导致。翻译前修饰型态包括等位基因变异(allelicvariant)、剪接变异(splicevariant)及RNA编辑型态(RNAeditingform)。翻译后修饰型态包括因蛋白质裂解(proteolyticcleavage)(例如,信号序列(signalsequence)的裂角军或母蛋白质的片段)、糖基化、磷酸化、脂化、氧化、甲基化、半胱胺酸化(cysteinylation)、磺酸化及乙醯化所导致的型态。当在样本中侦测或测量到蛋白质时,区别蛋白质不同型态的能力端靠差异的性质及用来侦测或测量的方法。例如,使用单株抗体的免疫检定法将侦测到含有该表位的蛋白质的所有型态且将无法区别它们。然而,使用2种抗体针对蛋白质上不同表位的夹心免疫检定法将侦测到含有2种表位的蛋白质的所有型态而不会侦测到只含有1种表位的蛋白质型态。在诊断分析中,当使用特殊方法侦测到的型态不论其为任何特定型态,其同样为良好的生物标志,则不能区别蛋白质不同型态便只有很小的影响。然而,当蛋白质的特定型态(或特定型态的子群)与使用特定方法一起侦测到的不同型态群相比为较佳的生物标志,则分析的能力可能受到考验。在此情况下,使用可以区别蛋白质型态与专一地侦测及测量所需蛋白质型态的分析方法较有用。区别分析物不同的型态或专一地侦测分析物的特定型态则称为「解析」分析物。质谱测定法为解析蛋白质的不同型态特别有用的方法学,因为不同型态典型具有可由质谱测定法解析的不同质量。因此,若对于某一疾病,蛋白质的某一种型态与生物标志的另一种型态相比为较好的生物标志,在传统的免疫检定法无法区别型态且不能特异地检测有用的生物标志时,质谱测定法可能能够特异地侦测及测量有用的型态。一种有用方法为将质谱测定法与免疫检定法结合。首先,使用一种生物特异性捕捉剂(例如,抗体、适体(aptamer)或辨识生物标志及生物标志其他型态的亲和体(Affibody))用来捕捉有兴趣的生物标志。较佳为,将生物特异性捕捉剂结合至固相如珠子、孔盘、膜或阵列。在洗去未结合材料后,以质谱测定法侦测及/或测量被捕捉的分析物。(此方法亦将导致捕捉与蛋白质结合的蛋白质互动物(interactor)或被抗体所辨识的蛋白质相互作用物且其本身可能为生物标志)质谱测定法的各种形式均有用于侦测蛋白质型态,包括激光解析方法如传统MALDI或SELD工及电喷射电离法。因此,当此处提及侦测特定蛋白质或测量特定蛋白质的量,意指解析或不解析蛋白质的各种型态而侦测及测量蛋白质。例如,「测量a-防御素」的步骤包括以不区分样本中蛋白质各种型态的方法(例如,某些免疫检定法不区分a-防御素-1、a-防御素-2及ci-防御素-3)及以从其他型态中区分某些型态或测量蛋白质特定型态(例如,任何及/或全部的a-防御素-1、a-防御素-2及a-防御素-3,单独或组合)的方法测量a-防御素。反之,当需要测量蛋白质特定型态时,具体指明该特定型态。例如,「测量a-防御素-l」意指从其他a-防御素的型态例如,a-防御素-2及a-防御素-3,区别测量出a-防御素-1。同样,提及「测量a-1-抗胰蛋白酶抑制物的C端片段」包括测量抗胰蛋白酶抑制物C端片段的任一及/或所有型态例如,在受试者测试样本中,个别的a-1-抗胰蛋白酶抑制物C端片段l及/或a-1-抗胰蛋白酶抑制物C端片段2或其组合。4.侦测乳腺癌的生物标志本发明的生物标志可由任何适合的方法侦测。为这目的可使用的侦测范例包括光学方法、电化学方法(电位测定法及电流滴定法(amperometry)技术)、原子力显微镜及射频(radiofrequency)方法例如多极性共振光谱学(multipolarresonancespectroscopy)。除了显微镜学外,共焦及非共焦光学方法的例子为萤光、冷光、化学冷光、吸收率、反射率、透光率及双折射或折射率(例如表面等离子共振、椭偏仪、共振镜法、光栅耦合器波导法或干涉术)的侦测。在一种具体实施例中,样本由生物芯片的方法分析。生物芯片一般包括固相基材并具有捕捉剂(亦称为吸附剂或亲和剂)附着的平坦表面。通常,生物芯片的表面包括多个可编址的位置,每个都有捕捉剂妙入亡口口o蛋白质生物芯片为适用于捕捉多胜肽的生物芯片。许多蛋白质生物芯片在本
技术领域
中提及。此类生物芯片包括例如,由CiphergenBiosystems,Inc.(Fremont,CA)、PackardBioscienceCompany(MeridenCT)、Zyomyx(Hayward,CA)、Phylos(Lexington,MA)及Biacore(Uppsala,Sweden)所制造的蛋白质生物芯片。此类蛋白质生物芯片的例子如下列专利或公开的专利申请案所述U.S.专利号6,225,047;PCT国际公开号WO99/51773;U.S.专利号6,329,209;PCT国际公开号WO00/56934及U.S.专利号5,242,828。4.1.质谱测定法的侦测在一较佳的具体实施例中,本发明的生物标志由质谱测定法侦测,其为一种运用质谱仪侦测气相离子的方法。质谱仪的例子为飞行时间式、磁扇形场式、四极滤质器、离子阱、离子回旋共振、静电扇形场式分析器及上述的混合。在进一步较佳方法中,质谱仪为激光解析/电离质谱仪。在激光解析/电离质谱测定法中,分析物置于质谱测定法探针表面,适于接合质谱仪探针介面的设备将分析物置于电离能量下使得电离且导入质谱仪中。激光解析质谱仪运用激光能量,典型来自紫外光激光,亦有红外线激光,从表面将分析物释出以挥发及电离分析物,并使质谱仪离子光学与分析物接触。通过LDI做蛋白质分析可采用MALDI或SELDI的形式。4.1.1.SELDI于本发明使用的较佳质谱测定技术为「表面增强激光解析及电离」或"SELDI"例如,在Hutchens及Yip的U.S.专利号5,719,060及6,225,047中所述者。其提及解析/电离气相离子光谱测定法(例如质谱测定法),其中分析物經捕捉在SELDI质谱测定法探针表面(此处为一种或多种生物标志)。SELDI亦被称做「亲和性捕捉质谱测定法」或「表面增强亲和性捕捉」("SEAC")。此型涉及探针的使用,其在探针表面的物质透过物质与分析物之间非共价亲和性互动(吸附)而捕捉分析物。此物质广泛称做「吸附剂」、「捕捉剂」、「亲和剂」或「结合部分」。此类探针可称做「亲和性捕捉探针」且具有「吸附表面」。此捕捉剂可为任何能够结合分析物的物质。通过物理吸附或化学吸附,捕捉剂附着至探针表面。在某些具体实施例中,探针具有已经附着于表面的捕捉剂。在其他具体实施例中,探针经前活化且包括能够结合捕捉剂的反应部分例如,透过反应形成共价键或配位共价键。环氧化物及醯基-咪唑为共价结合如,抗体或细胞受体的多胜肽捕捉剂的有用反应部分。氨基三乙酸(nitrilotriaceticacid)及亚氨基二乙酸为有用反应部分,作为与金属离子结合的螯合剂,与含组胺酸的胜肽非共价相互作用。吸附剂通常分类为层析吸附剂及生物特异性吸附剂。「层析吸附剂」指典型用于层析术的吸附物质。层析吸附剂包括例如离子交换物质、金属螯合物(例如氨基三乙酸或亚氨基二乙酸)、固定化金属螯化物、疏水性相互作用吸附剂、亲水性相互作用吸附剂、染剂、简单生物分子(例如核苷酸、胺基酸、简单糖类及脂肪酸)及混合型吸附剂(例如疏水吸引/静电排斥吸附剂)。「生物特异性吸附剂」指含有生物分子的吸附剂,该生物分子例如核酸分子(例如适体)、多胜肽、多醣类、脂质、类固醇或这些物质的共轭物(例如醣蛋白、脂蛋白、醣脂、核酸(例如DNA-蛋白质共轭物)。在某些例子,生物特异性吸附剂可为大分子结构如多蛋白复合体、生物膜或病毒。生物特异性吸附剂的例子为抗体、受体蛋白质及核酸。生物特异性吸附剂典型比层析吸附剂对标的分析物具有较高的特异性。再者,用于SELDI的吸附剂的例子可见于U.S.专利号6,225,047。「生物选择性吸附剂」指与分析物结合亲和性为至少l(TM的吸附剂。由CiphergenBiosystems,Inc.所制造的蛋白质生物芯片包含在可编址位置附着层析吸附剂或生物特异性吸附剂的表面。Ciphergen蛋白质芯片(ProteinChipr阵列包括NP20(亲水性);H4及H50(疏水性);SAX-2、Q-10以及(离子交换);WCX-2及CM-10(阳离子交换);頂AC-3、頂AC-30及頂AO50(金属螯化物);以及PS-IO、PS-20(带有醯基-咪唑、环氧化物的反应表面)及PG-20(经由醯基-咪唑耦合的蛋白质G)。疏水性蛋白质芯片阵列具有异丙基或壬基苯氧基-聚(乙二醇)甲基丙烯酸的官能性。阴离子交换蛋白质芯片阵列具有季铵的官能性。阳离子交换蛋白质芯片阵列具有羧酸盐的官能性。固定化金属螯化物蛋白质芯片阵列具有氨基三乙酸的官能性aMAC3及頂AC30)或0-甲基丙烯醯基-N,N-双-羧基甲基酪胺酸的官能性(BIAC50),其通过螯合吸附过渡金属离子如铜、镍、锌及镓。预先活化蛋白质芯片阵列具有醯基-咪唑或环氧化物的官能基,其可与蛋白质上的基团反应作共价键此类生物芯片进一步于美国专利号6,579,719(HutchensandYip,"RetentateChromatography",J匿17,2003);美国专禾!j号6,897,072(Richs义"ProbesforaGasPhaseIonSpectrometer"May24,2005);美国专利号6,555,813(Beecher"s义"SampleHolderwithHydrophobicCoatingforGasPhaseMassSpectrometer",April29,2003);美国专利公开号U.S.2003-0032043Al(PohlandPapa叫"LatexBasedAdsorbentChip",July16,2002);以及PCT国际公开号WO03/040700(Ums7,"HydrophobicSurfaceChip",May15,2003);美国专利公开号US2003-0218130Al(Boschettids厶"BiochipsWithSurfacesCoatedWithPolysaccharide-BasedHydrogels",April14,2003)及美国专利公开号U.S.2005-059086Al(Huange力s丄,"PhotocrosslinkedHydrogelBlendSurfaceCoatings",March17,2005)中描述。一般而言,带有吸附剂表面的探针与样本接触的时间足以使样本里可能表达的生物标志与吸附剂结合。经过培养时期后,洗涤基材以移除未结合的物质。可使用任何适合的洗涤溶液;较佳为使用水性溶液。分子维持结合的程度可通过调整洗涤的严格度(stringency)操作。洗涤液的洗提特征根据例如pH、离子强度、疏水性、混乱趋性(chaotr叩ism)程度,清洁强度及温度。除非探针具有SEAC及SEND两种特征(如此处所述),之后将能量吸收分子施加至带有结合生物标志的基材。在另一方法中,探针可由结合于固相的免疫吸附剂捕捉生物标志,该吸附剂具有与生物标志结合的抗体。洗涤吸附剂以移除未结合物质后,该生物标志自固相洗提而出且施用于与生物标志结合的SELDI芯片而经侦测并以SELDI分析。在气相离子光谱仪如飞行时间式质谱仪中侦测与基材结合的生物标志。以离子化源如激光离生物标志,以离子光学装置收集所产生的离子,之后质量分析仪分散且分析通过的离子。之后侦测器将所侦测到的离子资讯转换为质荷比。生物标志的侦测典型涉及信号强度的侦测。因此,可测定生物标志的量及质量。4.1.2.SEND激光解析质谱测定法的另一种方法叫做表面增强净解析("SEND")。SEND涉及使用含有与探针表面("SEND探针")化学性结合的能量吸收分子的探针。术语「能量吸收分子」(EAM)表示能够吸收来自激光解析/电离源的能量的分子,且之后用于解析及电离与之接触的分析物分子。EAM种类包括用于MALDI的分子,通常指为「基质」且以肉桂酸衍生物、芥子酸(SPA)、氰基-羟基-肉桂酸(CHCA)及二羟苯甲酸、阿魏酸及羟基苯乙酮衍生物为例子。在某些具体实施例中,能量吸收分子并入线性或交联聚合物例如聚甲基丙烯酸酯。例如,组合物可为a-氰基-4-甲基丙烯醯基氧基肉桂酸与丙烯酸酯的共聚合物。在另一种具体实施例中,组合物为a-氰基-4-甲基丙烯醯基氧基肉桂酸、丙烯酸酯与3-(三-乙氧基)硅烷基丙基甲基丙烯酸酯的共聚合物。在另一种具体实施例中,组合物为a-氰基-4-甲基丙烯醯基氧基肉桂酸与十八烷基甲基丙烯酸酯("C18SEND")的共聚合物。SEND进一步于美国专利号6,124,137及PCT国际公开号WO03/64594(Kitagawa,"MonomersAndPolymersHavingEnergyAbsorbingMoietiesOfUseInDesorption/IonizationOfAnalytes,,,August7,2003)中描述。SEAC/SEND为一种激光解析质谱测定法,其中捕捉剂及能量吸收分子两者均附着于样本呈现表面。SEAC/SEND探针因而通过亲和性捕捉及电离/解析而捕捉分析物且不需施用于外部基质。CI8SEND生物芯片为一种SEAC/SEND,包括C18部分,其作用为捕捉剂,以及CHCA部分,其作用为能量吸收部分。4,1.3.SEPAR另一种LDI叫做表面增强光不稳定附着及释放("SEPAR")。SEPAR涉及使用具有附着于该表面的部分的探针与分析物共价键结,之后在曝光后例如激光,通过打断于该部分內的光不稳定键而释出分析物(见美国专利号5,719,060)。依据本发明,SEPAR及其他型态的SELDI适于侦测生物标志或生物标志量变曲线。4.1.4.亂DIMALDI为传统用于分析如,蛋白质及核酸的生物分子的激光解析/电离法。在MALDI方法中,样本与基质混合且直接沉淀在MALDI芯片。然而,生物样本如,血清或尿液的复杂性使得此方法若无前分级样本则较为不理想。因此,在某些具体实施例中,较佳先以生物特异性物质(例如抗体)或耦合于固相载体如,树脂(例如,在离心管柱中)的层析物质捕捉生物标志。与本发明的生物标志结合的特定亲和性物质如上所述。于亲和性物质上纯化后,洗提出生物标志,之后以MALDI侦测。4.1.5.质谱测定法中其他型态的電离在另一方法中,以LC-MS或LC-LC-MS侦测生物标志。此涉及经一次或二次通过液相层析术解析样本中的蛋白质,接着以质谱测定法分析,典型为电喷射离子化。4.1.6.数据分析以飞行时间式质谱测定法做分析物分析产生飞行时间式光谱。飞行时间式光谱最后分析典型不代表信号来自对样本電离能量的单一脉冲,而是来自一些脉冲的信号总和。此减少杂讯且增加动态范围(dynamicrange)。此飞行时间式数据之后经数据处理。在Ciphergen's蛋白质芯片⑧软件中,数据处理典型包括TOF至M/Z转换以产生质谱、基准线扣除以消除仪器抵销(offset)以及高频率杂讯过滤以减少高频率杂讯。'通过生物标志解析及侦测产生的数据可使用可编程数字电脑分析。电脑程式分析数据而指出所侦测到的生物标志的量,以及视需要指出对每个所侦测的生物标志的信号强度及测定的分子质量。数据分析可包括测定生物标志信号强度及移除脱离预定统计分布区域的数据等步骤。例如,可通过计算与一些范围相关的每个高峰高度来标准化所观察的高峰。电脑可将所得数据转换成各种形式显示。可显示标准光谱,但在一有用的形式中,光谱图只保留高峰高度及质量资讯产生较清楚的影像且使得带有几乎相同分子量的生物标志更易察见。在另一有用的形式中,比较二个或更多个光谱,光谱合宜地强调出独特的生物标志以及在样本间经上调控(up-regulate)或下调控(down-regulate)的生物标志。使用这些形式中任一种,可立即测定特定的生物标志是否存在样本中。分析通常涉及光谱中辨识高峰,其代表来自分析物的信号。高峰的选择可凭目力完成,但软件亦可得,如Ciphergen'sProteinChip软件试剂盒中一部份,其可自动侦测高峰。一般来说,此软件的作用为通过辨识具有信号对杂讯比例超过所选择之门槛的信号,以及在高峰信号的质心标记高峰质量。在一个有用的运用中,比较许多光谱以辨识在一些所选择比例之质谱中出现的相同高峰。一种此类软件聚类在所界定的质量范围内,出现在各种光谱的所有高峰,以及指派质量(M/Z)给接近质量(M/Z)聚类中点的所有高峰。用于分析数据的软件可包括一种程式,其将演算法运用至信号分析以测定是否该信号代表与本发明生物标志相符的信号高峰。软件亦可提供关于所观察之生物标志高峰的数据至分类树或ANN分析以测定生物标志高峰或生物标志高峰组合使否存在,显示在检验下特定临床参数的状况。数据分析对各种直接或间接得自样本质谱分析的参数可能为「关键的」。这些参数包括,但不限于一个或多个高峰的存在或缺少、高峰的形状或高峰群组、一个或多个高峰的高度、一个或多个高峰高度的对数值及其他高峰高度数据的计算操作。4.1.7.SELDI侦测乳腺癌生物标志的一般程序侦测本发明的生物标志的较佳程序如下。可直接施加测试的生物样本,例如NAF于生物芯片而不需任何额外的操作。在冷冻干燥及透析移除多余盐分后,可直接施用样本例如,DLF于生物芯片。亦可分馏样本例如,尺寸大小排除层析术、阴离子或阳离子交换层析术或其他分级方法。测试样本之后与含有IMAC吸附剂的亲和性捕捉探针(较佳为頂AC30-Cu蛋白质芯片阵列(CiphergenBiosystems,Inc.))接触,如表1所示。使用洗掉未结合分子又可以保留生物标志的缓冲液洗涤探针。对每个生物标志都适合的洗涤溶液为表l所示的缓冲液。以激光解析/电离质谱测定法侦测生物标志。或者,若可得辨识生物标志的抗体例如,与a-防御素-l至3相关,可将抗体附着于探针表面如预先活化的PS10或PS20蛋白质芯片阵列(CiphergenBiosystems,Inc.)。这些抗体可捕捉样本中的生物标志至探针表面。之后,可使用例如,激光解析/电离质谱测定法侦测生物标志。4.2.免疫检定法侦测在另一种具体实施例中,可以免疫检定法测量本发明之生物标志。免疫检定法需要生物特异性捕捉剂如,抗体以捕捉生物标志。抗体可由
技术领域
中已知的方法制造例如,以生物标志使动物免疫。可通过生物标志结合特征自样本中单离生物标志。或者,若已知多胜肽生物标志的胺基酸序列,可以
技术领域
中已知的方法合成多胜肽并用于产生抗体。本发明考量传统免疫检定法包括例如,夹心免疫检定法包含ELISA或萤光免疫检定法,以及其他酵素免疫检定法。在SELDI免疫检定法中,用于生物标志的生物特异性捕捉剂附着于MS探针表面,例如,预先活化蛋白质芯片阵列。之后透过此试剂在生物芯片上特异地捕捉生物标志,以及以质谱测定法侦测所捕捉的生物标志。5.测定受试者乳腺癌状况5.1.单一标志本发明的生物标志可用于诊断测试以评估受试者的乳腺癌状况例如,诊断乳腺癌。术语「乳腺癌状况」包括任何疾病可区别的表达形式,包括非疾病。例如,疾病状况包括,但未限于疾病的存在或不存在(例如乳腺癌与非乳腺癌)、发展成疾病的风险、疾病阶段、疾病'进程(例如,随着时间疾病的发展或疾病缓解)及对疾病治疗的有效程度或反应。基于状况,可指示进一步的步骤包括额外的诊断测试或治疗步骤或疗法。诊断测试正确预测状况的能力通常为分析敏感性、分析特异性或在接受者作业特征("ROC")曲线下的面积。敏感性为试验预测为阳性时真阳性的比例,而特异性为试验预测为阴性时真阴性的比例。ROC曲线提供试验敏感性为卜特异性的函数。在ROC面积下区域越大,试验的预测值越有力。其他有用测量试验效用为阳性预测值及阴性预测值。阳性预测值为当试验为阳性时,实际为阳性的比例。阴性预测值为当试验为阴性时,实际为阴性的比例。本发明的生物标志在不同的乳腺癌状况显示统计学上的差异为至少p《0.05、pp《10一3、p《10—4或p《10—5。单独或组合使用这些生物标志的诊断测试显示至少75%、至少80%、至少85%、至少90%、至少95%、至少98%及约100%的敏感性及特异性。表1所列的每个生物标志在乳腺癌中有差异性地呈现,因而每个个别有助测定乳腺癌状况。该方法涉及,首先,使用此处所述的方法例如以SELDI生物芯片捕捉,接着以质谱测定法侦测测量受试者样本中所选择的生物标志;其次,测量与区别阳性乳腺癌状况与阴性乳腺癌状况的诊断量或分界(cut-off)相比。诊断量代表高于或低于经分类为患有特定乳腺癌状况受试者的生物标志测量值。例如,若在乳腺癌期间生物标志与正常人相比为上调控,之后高于诊断分界的测量值提供乳腺癌的诊断结果。或者,若在乳腺癌期间生物标志为下调控,之后低于诊断分界的测量值提供乳腺癌的诊断结果。一般了解在
技术领域
中,依据诊断者的喜好调整用于分析特定的诊断分界可提高诊断阵列的敏感性或特异性。特定诊断分界的测定通过,例如此处所做,测量来自患有不同乳腺癌状况受试者,其统计学上显著样本量中的生物标志量,以及绘出符合诊断者所需要程度之特异性与敏感性的分界。5.2.标志组合当个别的生物标志均为有用的诊断生物标志,已发现生物标志组合比单一的生物标志对特定的状况可提供更好的预测值。特别是,样本中多数个生物标志侦测可提高测试的敏感性及/或特异性。至少两种生物标志的组合有时称为「生物标志图谱」或「生物标志指纹」。在某些情况下(例如,使用生物特异性试剂如,抗体侦测生物标志时),侦测a-防御素-1、2或3作为单一生物标志,在此称为「a-防御素」。在其他情况下,侦测a-l-抗胰蛋白酶抑制物的C端片段l及a-1-抗胰蛋白酶抑制物的C端片段2作为单一生物标志,在此称为「ci-l-抗胰蛋白酶抑制物的C端片段」。从10个NAF检体获得的高峰强度数据(见下列实施例)作为选择候选生物标志的训练数据。由于所得质谱个别可行性(凭目力检查),先实行非监督式聚类分析(MATLAB)。观察两个聚类,一个由检体C6、C14、N32、N33及N36所组成(群组A)。另一个由检体Cll、C16、C26、N4及N15所组成(群组B)。接着在每个亚群使用ProPeak(3ZInformatics,Charleston,SC)实行监督式聚类分析且选择可有效地分别癌症及非癌症数据的生物标志。ProPeak执行统一最大分离性分析(UMSA)演算法之线性版,其为最先被报告用于微阵列数据分析16。ProPeak在SELDI蛋白质阵列数据分析的运用先前已有详细描述7。简言之,分析每个检体且当作一独立点投射于三维组成空间,其中每个点的位置使用高峰密度数据以线性回归来源复合指数测定。各个高峰的排列代表其对癌症及非癌症检体最大分类的贡献。在此例中,用目力检查具有高区别力的高峰且选择5个在癌症中升高的高峰(在群组A中3个高峰,在群组B中2个高峰)做进一歩评估。来自患有单侧原位乳管癌患者的癌症及非癌化乳房的一对组合DLF样本测试潜在的生物标志(在JohnsHopkinsHospital收集)。分别组合来自9个癌化乳房的ll个DLF样本、7个非癌化乳房的13个DLF之等量蛋白质以代表癌症及非癌症乳管。使用如分析NAF所述相同芯片程序在一独立实验中产生蛋白质图谱(profile)。5.3.乳腺癌状况测定乳腺癌状况典型涉及根据诊断测试结果将受试者分类为二种或更多种群组(状况)中的一种。此处所述之诊断测试可用于在一些不同状态的分类。5.3.1.疾病存在在一种具体实施例中,本发明提供测定受试者中乳腺癌存在与否的方法(状况乳腺癌与非乳腺癌)。通过测量相关生物标志决定乳腺癌存在与否,之后提交至分类演算法或与特定风险程度相关的生物标志参考量及/或模式比较。5.3.2.测定发展成疾病的风险在一种具体实施例中,本发明提供一种测定受试者中发展成疾病的风险的方法。生物标志量或模式为各种风险状态的特征例如高、中或低。由测量相关生物标志决定发展成疾病的风险,之后提交至分类演算法或与特定风险程度相关的生物标志参考量及/或模式比较。5.3.3.测定疾病阶段在一种具体实施例中,本发明提供测定受试者中疾病阶段的方法。疾病的每个阶段具有特有量的生物标志或一组生物标志(一种模式)的相关量。测量相关生物标志以决定疾病阶段,之后提交至分类演算法或与特定阶段相关的生物标志参考量及/或模式比较。5.3.4.测定疾病演进(发展/缓解)在一种具体实施例中,本发明提供测定受试者中疾病演进的方法。疾病演进意指随着时间疾病状况的变化,包括疾病进程(更糟)及疾病缓解(改善)。生物标志的量或相关量(例如模式)随着时间变化。因此,这些标志的趋势随着时间朝患病或不患病增加或减少显示出疾病的演进。因此,此方法涉及在至少两个不同的时间点例如,第一次及第二次测量受试者中一种或多种生物标志,以及若有任何量的变化比较之。根据这些比较决定疾病演进。5.4.报告状况本发明的附加具体实施例是关于将分析结果或诊断或两者传达给技术员、治疗者或患者例例如,在某些具体实施例中,将使用电脑传达分析结果或诊断或两者给有兴趣的一方例如治疗者及其患者。在一些具体实施例中,实施分析或分析试验结果的国家或管辖范围不同于传达结果或诊断的国家或管辖范围。在一本发明较佳的具体实施例中,在获得诊断结果后,尽快传达测试受试者中关于任何此处所述的生物标志存在与否的诊断结果给受试者。诊断结果可通过处理受试者的治疗者传达给受试者。或者,可通过电子邮件传送诊断结果给测试受试者或以电话传达给受试者。可使用电脑藉电子邮件或电话传达诊断结果。在某些具体实施例中,使用电脑硬体及软件组合可产生含有诊断测试结果的讯息且自动传送给受试者,其对电信领域中熟谙技术人士而言为常见的。保健导向传达系统的例子述于U.S.专利号6,283,761中;然而,本发明并不限于使用此特定传达系统的方法。在本发明方法的某些具体实施例中,在不同的(例如国外)管辖范围可实行全部或部分方法步骤,包括样本的分析、疾病的诊断及分析结果或诊断的传达。5.5.受试者处理在诊断乳腺癌状况方法的某些具体实施例中,该方法进一步包括根据状况处理受试者治疗。此类处理包括在测定乳腺癌状况之后,治疗者或临床医生采取的行动。例如,若治疗者做出乳腺癌的诊断结果,之后可能接着某些处理疗法,例如,处方或手术的实行、化学疗法及/或放射治疗。或者,对非乳腺癌的诊断结果或是非乳腺癌接着可能有进一步的测试以测定患者可能遭受的特定疾病。同样,若诊断测试对乳腺癌状况为非决定性结果,可能需要进一步的测试。本发明的附加具体实施例是关于将分析结果或诊断或两者传达给技术员、治疗者或患者例例如,在某些具体实施例中,将使用电脑传达分析结果或诊断或两者给有兴趣的一方例如治疗者及其患者。在一些具体实施例中,实施分析或分析试验结果的国家或管辖范围不同于传达结果或诊断的国家或管辖范围。在一本发明较佳的具体实施例中,在获得诊断结果后,尽快传达测试受试者中关于任何表I所述生物标志存在与否的诊断结果给受试者。诊断结果可通过受试者的处理治疗者传达给受试者。或者,可通过电子邮件传送诊断结果给测试受试者或以电话传达给受试者。可使用电脑藉电子邮件或电话传达诊断结果。在某些具体实施例中,使用电脑硬体及软件组合可产生含有诊断测试结果的讯息且自动传送给受试者,其对电信领域中熟谙技术人士而言为常见的。保健导向传达系统的例子述于U.S.专利号6,283,761中;然而,本发明并不限于使用此特定传达系统的方法。在本发明方法的某些具体实施例中,在不同的(例如国外)管辖范围可实行全部或部分方法步骤,包括样本的分析、疾病的诊断及分析结果或诊断的传达。6.用于诊断乳腺癌状况的分类演算法的产生在一些具体实施例中,使用样本如「已知样本」产生的光谱(例如质谱或飞行时间式光谱)数据之后可用于「训练」分类模型。「已知样本」为已先被分类过的样本。来自光谱且用于形成分类模型的数据可指为「训练数据组」。一旦经训练,分类模型可辨识使用未知样本产生的光谱数据模式。分类模型之后可用于分类未知样本。其有用于例如,预测特定生物样本是否与某些生物情况有关(例如患病与不患病)。用于形成分类模型的训练数据组可包括原始数据或前处理数据。在一些具体实施例中,原始数据可直接从飞行时间式光谱或质谱获得,之后如上述可视需要经「前处理」。使用任何适合的统计分类(或「学习」)方法形成分类模型,其意于根据数据中呈现的客观参数分离数据成类。分类方法可为监督式或非监督式。监督式及非监督式分类过程的例子于Jain,"StatisticalPatternRecognition:AReview",Z5Efi17ys/ssc亡70T751oz尸3tfe7y7爿zajy5^'sa/7t/i/ac力i/7e7/7Z"eJJige;7ce,Vol.22,No.1,January2000所述,其教示并入本文参考。在监督式分类,呈现含有己知类别例子的训练数据至学习机构,该学习机构学习定义每个已知类别的一个或多个关系组。之后可能施用新数据于学习机构,使用习得的关系分类新数据。监督式分类处理的例子包括线性回归处理(例如多元线性回归(MLR)、偏最小二乘回归(PLS)及主成分回归(PCR))、二元决策树(例如递归分区处理如CART-分类及回归树)、类神经网路(artificialneuralnetwork)如倒传递网路(backpropagationnetwork)、鉴另U分析(discriminantanalysis)(例如贝氏分类器(Bayesianclassifier)或费雪(Fischer)分析)、逻辑分类器及支援向量分类器(supportvectorclassifier)(支援向量机)。较佳的监督式分类方法为递归分区处理。递归分区处理使用递归分区树分类未知样本的光谱。关于递归分区处理的进一步细节于U.S.专利申请号20020138208Al,Paulses义"Methodforanalyzingmassspectra"提供。在其他具体实施例中,创造出的分类模型可使用非监督式学习方法形成。非监督式分类意为根据训练数据组中的相似性学习分类,而不预先分类训练数据组的光谱。非监督式学习方法包括聚类分析。聚类分析意为划分数据为「聚类」或群组,该「聚类」或群组理想地具有彼此非常相似的组员且与其他聚类的组员相比非常不相似。之后使用一些距离公制测量相似性,该距离公制测量数据项目间的距离及聚类彼此较相近的数据项目。聚类技术包括MacQueen'sK平均值演算法及Kohonen's自组织映射(Self-OrganizingMap)演算法。宣称用于分类生物资讯的学习演算法描述于例如,PCT国际公开号WO01/31580(Barnhill"s丄,"Methodsanddevicesforidentifyingpatternsinbiologicalsystemsandmethodsofusethereof")、美国专利申请号20020193950A1(Gavin"s丄,"Methodoranalyzingmassspectra")、美国专利申请号20030004402Al(Hitt<2丄,"Processfordiscriminatingbetweenbiologicalstatesbasedonhiddenpatternsfrombiologicaldata")及美国专利申请号20030055615Al(ZhangandZhang,"Systemsandmethodsforprocessingbiologicalexpressiondata,,)。可在任何适合的数字电脑形成及使用分类模型。适合数位电脑包括微电脑、微型电脑或大型电脑使用任何标准或特殊的操作系统如Unix、Windows或Linux为基础的操作系统。所使用的数位电脑可实际上与用于创造有兴趣的光谱之质谱仪分开或可与质谱仪结合。根据本发明具体实施例的训练数据组及分类模型可经由数位电脑所执行或使用的电脑程式而体现。电脑程式可储存在任何适合的电脑可读式媒体包括光碟、磁碟、光学棒、磁棒、光学磁带、磁带等,且可以任何适合的电脑程式语言包括C、C++、visualbasic等写成。上述之学习演算法有用于发展已发现的生物标志分类演算法或发现乳腺癌的新生物标志。接着,通过提供使用单独或组合的生物标志的诊断值(例如分界点)使分类演算法形成诊断测试的基础。7.物之组成在另一态样中,本发明提供一种根据本发明生物标志物的组成。在一种具体实施例中,本发明提供纯化型态的本发明的生物标志。纯化的生物标志具有抗原作用以诱发抗体。纯化的生物标志亦具有在分析程序中当作标准品的作用。如本文所用,「纯化的生物标志」为已从其他蛋白质及胜肽、及/或发现生物标志的生物样本中之其他物质所单离出来的生物标志。可使用任何
技术领域
中已知的方法纯化生物标志包括,但不限于机械分离(例如离心)、硫酸铵沉淀、透析(包括尺寸大小排除透析)、尺寸大小排除层析术、亲和性层析术、阴离子交换层析术、阳离子交换层析术及金属螯合层析术。可以任何适合的方式例如,在层析管柱中或在生物芯片上实行此类方法。在另一种具体实施例中,本发明提供一种生物特异性捕捉剂特异地与本发明生物标志结合,视需要为纯化型态。较佳者,生物特异性捕捉剂为抗体。在一种具体实施例,生物特异性捕捉剂为与a-防御素-1、2及3结合的抗体。这些抗体能够特异地与3个a-防御素中的任何一个结合,但不能区别它们。在另一个具体实施例中,生物特异性捕捉剂为可以区别三个a-防御素的抗体。此抗体很可能与生物标志的N端结合,N端的胺基酸序列不同。在另一种具体实施例中,本发明提供一种生物特异性捕捉剂特异地与a-l-抗胰蛋白酶抑制物C端片段1或a-l-抗胰蛋白酶抑制物C端片段2结合。此抗体能够专一地与两个a-1-抗胰蛋白酶抑制物中任一个结合,但不能够区别它们。在另一种具体实施例中,生物特异性捕捉剂为能够区别两个a-1-抗胰蛋白酶抑制物的抗体。此抗体很可能与生物标志的N端结合,N端的胺基酸序列不同。在另一种具体实施例中,本发明提供介于本发明生物标志与生物特异性捕捉剂之间的复合物,该复合物特异地与生物标志结合。在其他具体实施例中,生物特异性捕捉剂与固相结合。例如,本发明考量含有衍出生物特异性捕捉剂的珠子或芯片的装置与本发明之生物标志结合,同样,含有本发明之生物标志的装置与生物特异性捕捉剂结合。在另一种具体实施例中,本发明提供含有附着吸附剂例如层析吸附剂的固态基材的装置,该吸附剂进一步与本发明生物标志结合。8.侦测乳腺癌生物标志的试剂盒在另一态样中,本发明提供一种诊断乳腺癌状况的试剂盒,根据本发明使用试剂盒侦测生物标志。在一种具体实施例中,试剂盒包括固相载体如芯片、微量滴定盘或珠子或具有捕捉剂附着于其上的树脂,其中,该捕捉剂与本发明生物标志结合。因此,例如,本发明试剂盒可包括用于SELDI的质谱测定探针如ProteinChip"阵列。生物特异性捕捉剂的例子中,试剂盒可包括有反应表面的固相载体及含有生物特异性捕捉剂的容器。试剂盒亦可包括洗涤溶液或制造洗漆溶液的说明书,其中,捕捉剂与洗涤溶液的组合允许将固相载体上所捕捉的生物标志用于之后得侦测,通过例如质谱测定法侦测。试剂盒可包括一种以上的吸附剂,每个呈现在不同的固相载体上。在一进一步的具体实施例中,此试剂盒可包括以标签或分开的插页之型态说明适合的操作参数的说明书。例如,说明书可通知消费者关于如何收集样本、如何洗涤探针或所侦测的特定生物标志。在另一种具体实施例中,试剂盒可包括一个或多个含有生物标志样本的容器,作为校准的标准物。9.测定医药的治疗功效在另一种具体实施例中,本发明提供测定医药治疗功效的方法。这些方法有用于执行药物临床试验上及监控患者对药物的发展。治疗或临床试验包括在特定疗程投予药物。该疗程可包括单一药物剂量或随着时间多种药物剂量。医生或临床研究员随着投予的演进监控在患者或受试者的药物效果。若药物对症状有医药影响,本发明的生物标志量或相关量(例如模式或量变曲线)往非疾病量变曲线改变。例如,生物标志a-防御素-l至3随着疾病而升高。因而,在治疗演进期间,可追踪受试者内此类生物标志量的演进。因此,此方法涉及测量接受药物治疗的受试者中一种或多种生物标志并将生物标志量与受试者的疾病状况相关联。此方法的一个具体实施例涉及在药物治疗演进中至少两个不同时间点例如第一次与第二次测定生物标志浓度,若有改变,则比较生物标志量的变化。例如。可在药物投予前后或药物投予期间两个不同时间点测量生物标志。根据这些比较决定治疗的效果。若治疗有效,生物标志将趋于正常,而若治疗无效,则生物标志将趋向疾病征兆。根据这些比较决定治疗的效果。若治疗有效,生物标志将趋于正常,而若治疗无效,则生物标志将趋向疾病征兆。10.乳腺癌生物标志使用于筛选分析及治疗乳腺癌的方法本发明之方法亦具有其他应用。例如,可使用生物标志筛选活体外或活体内调节生物标志表达的化合物,其中该化合物在治疗或预防患者乳腺癌可能有用。在另一实施例中,可使用生物标志监控对乳腺癌治疗的反应。在再另一实施例中,可使用生物标志于遗传研究中以测定受试者是否有发展乳腺癌的风险。因此,例如,本发明的试剂盒可包括含有金属亲和性捕捉作用(如蛋白质生物芯片(例如CiphergenIMAC蛋白质芯片阵列,亦即ProteniChip阵列))或生物特异亲和性捕捉作用(如,含有对cx-防御素-1至3或a-1-抗胰蛋白酶抑制物C端片段的抗体之蛋白质生物芯片)的固相基材及用于洗涤基材的PBS缓冲液,以及提供在芯片上测量本发明的生物标志的程序以及使用这些测量诊断乳腺癌的说明书。一开始可通过辨识与表1所列的一种或多种生物标志相互作用的化合物来筛选适于治疗测试的化合物。经由实施例,筛选可能包括重组表达表1所列的生物标志、纯化生物标志及固定生物标志在基材上。之后典型为在水性环境中测试化合物与基材接触且测量测试化合物与生物标志之间的互动,例如通过将测量洗提率作为盐浓度的函数。某些蛋白质可辨识及分裂表l中之一种或多种生物标志,在这样的情况下,可通过在标准分析例如,蛋白质凝胶电泳中监测一种或多种生物标志的分解来侦测蛋白质。在一相关的具体实施例中,可测量测试化合物抑制表1中一种或多种生物标志活性的能力。
技术领域
中熟谙技艺人士将了解依照生物标志的作用与特性,用来测量特定生物标志活性的技术各异。例如,可分析生物标志的酵素活性,前提为可获得适当的基材以及基材浓度或反应产物的出现容易测量。潜在治疗测试化合物抑制或增强所给生物标志活性的能力可经由测量测试化合物存在或不存在时的催化率测定。亦可测量测试化合物干扰表1生物标志其中之一的非酵素性(例如结构)作用或活性。例如,可经由光谱学监测测试化合物存在或不存在时含有表l生物标志其中之一的多重蛋白复合体自我组装。或者,若生物标志为转录非酵素性增强子,通过测量测试化合物存在或不存在时,活体内或活体外生物标志依赖转录的程度可辨识干扰生物标志提高转录能力的测试化合物。可投予能够调节表1中任一生物标志活性的测试化合物至受苦于乳腺癌或其他癌症的患者或有发展成乳腺癌或其他癌症风险的患者。例如,若特定生物标志活体内的活性为避免乳腺癌蛋白质的累积,则投予增加特定生物标志活性的测试化合物可降低患者患上乳腺癌的风险。反之,若增强的生物标志活性是乳腺癌起始的原因(至少为部分原因),投予降低特定生物标志活性的测试化合物可降低患者患上乳腺癌的风险。在一附加的态样中,本发明提供辨识有用于治疗疾病例如,乳腺癌之化合物的方法,其中该疾病与a-防御素-l至3及/或C1-1-抗胰蛋白酶抑制物C端片段1及/或2的修饰后型态增加的浓度有关。例如,在一种具体实施例中,可筛选细胞萃取物或表达基因库(expressionlibrary)寻找催化裂解全长a-防御素-l至3或a-l-抗胰蛋白酶抑制物C端片段1及/或2以分别形成截断的a-防御素-l至3或a-1-抗胰蛋白酶抑制物C端片段1及/或2的化合物。在一此类筛选分析的具体实施例中,通过将萤光团附着至a-防御素-l至3或a-l-抗胰蛋白酶抑制物C端片段1及/或2,可侦测a-防御素-1至3或a-1-抗胰蛋白酶抑制物C端片段1及/或2的裂解,当a-防御素-l至3或a-l-抗胰蛋白酶抑制物C端片段1及/或2未被裂解时,萤光团维持不发光,而当蛋白质被裂解,则萤光团发出萤光。或者,使得胺基酸x与y之间的醯胺键不可裂解之修饰后全长a-防御素-l至3或a-l-抗胰蛋白酶抑制物C端片段1及/或2的变体可被用来选择性地结合或「捕捉」活体内该位置裂解全长a-防御素-1至3或a-l-抗胰蛋白酶抑制物C端片段1及/或2的细胞蛋白酶。筛选及辨识蛋白酶及其目标的方法于科学文献中有详细记载,例如,在Lopez-Ottineta丄(NatureReviews:3:509-519(2002))中。在另一种具体实施例中,本发明提供治疗或降低疾病例例如,乳腺癌发展或可能性的方法,该疾病与截断的a-防御素-l至3及/或a-l-抗胰蛋白酶抑制物C端片段1及/或2的增加浓度有关。例如,在已辨识出一种或多种蛋白质裂解全长a-防御素-l至3或d-l-抗胰蛋白酶抑制物C端片段1及/或2后,可筛选组合化学库寻找抑制已辨识蛋白质裂解活性的化合物。筛选此类化合物化学库的方法在
技术领域
中为已知。见例如L叩ez-0tinda丄(2002)。或者,可根据a—防御素-1至3及a-l-抗胰蛋白酶抑制物C端片段1及/或2的结构聪明地设计出抑制化合物。在临床阶段,筛选测试化合物包括在受试者暴露于测试化合物前后,从测试受试者中获得样本。可测量及分析样本中表l所列的一种或多种生物标志的浓度以测定在暴露于测试化合物之后,生物标志浓度是否变化。可如本文所述用质谱测定法分析样本,或者,可以任何
技术领域
中熟谙技艺人士已知适当的方法分析样本。例如,可直接以西方墨点法(Westernblot)使用特异结合至生物标志的放射线标记抗体或萤光标记抗体测量表1所列之一种或多种生物标志浓度。或者,可测量编码一种或多种生物标志的威NA浓度的变化,并将变化与投予至受试者的所给测试化合物并置使显出相互关系。在一进一步的具体实施例中,可使用活体外方法及材料测量一种或多种生物标志表达程度的变化。例如,可将表达或能够表达表l之一种或多种生物标志的人类组织培养细胞与测试化合物接触。将例行检査已经测试化合物治疗的受试者中任何可能因为治疗导致的生理影响。特别是,将评估测试化合物降低受试者患病可能性的能力。或者,若投予测试化合物至先前已经诊断为乳腺癌的受试者,将筛选测试化合物减缓或停止疾病发展的能力。11.实施例11.1.实施例1.发现乳腺癌生物标志一般了解本文所述实施例及具体实施例仅用于说明目的,且对
技术领域
中熟谙技艺人士来说,按照该些实施例的各种修饰或变化也视为已由本案所建议并包括在本发明的精神与范围及附加的权利要求范畴中。为了所有的目的,本文所引用的所有出版物、专利及专利申请案并入本文参考。11.2.实施例2.材料级方法s11.2.1.多中心(multi-center)研究设计为最小化各机构在患者选择及液体收集程序上潜在的偏差,以及为了最大化本发现的应用性,我们从3个机构UniversityofTexasM.D.AndersonCancerCenter;JohnsHopkinsHospital中的SidneyKi醒elComprehensiveCancerCenter;以及DepartmentofSurgery.FeinbergSchoolofMedicine,NorthwesternUniversity征募乳吸引术及乳管灌洗两种液体样本。在每个地点的样本收集经各自的InstitutionalReviewBoardeach认可,及目前的蛋白质体研究经JohnsHopkinsUniversity的InstitutionalReviewBoard认可。11.2.2.患者一乳头吸引液体(NAF)从UniversityofTexasM.D.AndersonCancerCenter获得NAF样本。适于双侧乳头吸引术的患者为经切片检查法证实为第I期或第II期单侧原发侵袭性乳腺癌者。若患者先前已经历过乳晕下手术可能中断末端乳管系统,这样的患者被排除。若受试者为年过40岁且经身体检查和乳房造影正常发现证实无乳房疾病或癌症的迹象同样适合参与。此次研究中获得10个液体样本,5个来自乳腺癌患者的癌化乳房,而其他5个来自健康捐赠者的乳房。11.2.3.收集程序一乳头吸引液体(NAF)以乳头吸引术使用类似于动力式挤乳帮浦的手提式吸杯收集乳管液体,该动力式挤乳帮浦用于从泌乳女性挤压出乳汁。此设备由塑胶杯连接到聚合物管子部分而组成。管子附着至标准注射器用以创造缓和的真空。此设备原先是在Sartoriuse"丄(Sartorius,0.W.e力s丄(1977)J.Natl.CancerInst.59:1073-1080)使用及叙述,且从ProductHealth,Inc.(MenloPark,CA)购买,以用于收集NAF。在吸弓1之前,以少量的0mnipr印胶(D.0.Weaver及Co.,Aurora,C0)清洁乳头以移除角质拴塞,之后以酒精棉清洁。取少量的乳液置于乳房上且从胸腔壁往乳头温和按摩乳房1分钟。将吸杯置于乳头且拉开注射器活塞到5至10mL的程度直到看见乳管液体。收集液滴到10PL刻度微量吸移管(DrummondScientificCo.,Broomall,PA)。从两个乳房获得样本,且为每位患者及每个乳房纪录NAF的出现及所得收集过后立刻将NAF样本润洗到含有500u1无菌磷酸盐缓冲食盐水的离心管,该无菌磷酸盐缓冲食盐水补充有蛋白酶抑制物AEBSF(4-[2-胺基乙基]-苯磺醯基氟化物HCl;0.2mM)、亮肽素(leup印tin)(50g/mL)、牛蛋白(aprotinin)(2g/mL)及二硫苏糖醇(DTT,0.5mM)。之后以1500RPM离心样本10分钟以移除不溶物质且以50ul分装收集上清液。11.2.4.患者一乳管灌洗液体(DLF)两个机构贡献DLF样本给本研究。在约翰霍普金斯医院的SPORE捐赠临床试验中,切片检査法证实第I或II期单侧原发性乳腺癌的女性在手术前适合乳房液体收集。分别从患者的患癌乳房及对侧「正常」乳房中收集1至3个乳管的DLF。研究当时,获得42个检体,25个来自9个患癌症的乳房,17个来自7个对侧乳房,且这些检体来自共14名患者。在西北医院的分开试验中,招募因5年盖尔危险率预估量大于1.6%、1个一等亲或2个二等亲患有乳腺癌或有LCIS病史的危险性增加女性做黛莫芬(tamoxifen)治疗。这些女性在进入时经历DL,决定是否服用黛莫芬预防乳腺癌,且之后经重复的DL6至12个月。此次试验从选择不服用黛莫芬的13个高危险群女性获得42个DLF检体。11.2.5.收集程序一乳管灌洗液体(DLF)先实行乳头吸引术以辨识出生产液体乳管(FYD)。若可见乳头液体,以单管腔微导管插管FYD且以生理食盐水灌洗。插管之前,可以乳晕周边渗透约5mL1%木卡因(lidocaine)补充麻醉,通常乳管树的麻醉为一旦将导管的尖端插入乳管口,经乳头腺管括约肌徐徐滴入2至3mL的1%木卡因。在慢慢灌输大约2mL的食盐水后,实行间歇乳房按摩且重复此过程四至五次,以致于总灌输量为约10至20mL。在8x8的格子记录生产液体及经乳管插管位置,且在插入伯罗伦(prolene)缝线后照相以协助日后在西北试验中再插管。收集过后立刻将样本以1500RPM离心10分钟以移除不溶物质,且收集上清液作为接下来蛋白质体分析。11.2.6.蛋白质体分析的样本准备收集过后将所有样本储存在-80。C且将冷冻分装,然后于干冰上运送约翰霍普金斯。所收到的NAF检体不需要进一步的处理,反之,先将DLF冷冻干燥,之后使用带有1kDa分子量阻断的Tube-O-Dialyzer(Upstate,NY)以磷酸盐缓冲食盐水透析DLF—整夜以移除过多盐分。使用BCA蛋白质分析试剂盒(Pierce,Rockford,IL)测量每个液体中的蛋白质浓度。11.2.7.SELDI分析一开始评估各种蛋白质体芯片的在蛋白质的数目及解析度方面的化学性质(疏水性、阴离子、阳离子及金属亲和性)以测定哪一个亲和化学性质提供最佳的图谱。选择固定化金属亲和性捕捉芯片阵列(IMAC30)。IMAC30上的活性位置含有氨基三乙酸基团螯合金属离子。蛋白质透过组胺酸、色胺酸、半胱胺酸或磷酸化胺基酸结合至IMAC30阵列上的螯化金属。为提供最佳的蛋白质表达,亦测试每次分析所需的最低液体蛋白质,及结合与洗涤条件。简言之,根据制造说明书(CiphergenBiosystems,CA),将皿C30芯片阵列使用96孔式的生物处理器(维持12x8点芯片)以CuS04前处理。在Cu2+并到芯片表面后,拆开生物处理器蛋白质乳房液体样本至经前处理的点且使其在室温下风干。随机分配检体至蛋白质芯片阵列,包括相同样本的三重复。施加样本后,将生物处理器再组合且以100ml的PBS洗涤5分钟2次,接着以100ml的dH20快速润洗两次以移除结合不紧密的物质。风干之后,制备0.5ml的饱和芥子酸(SPA)于50%乙腈,施加0.5%三氟乙酸二次至各点作为能量吸收分子。使用PBS-II蛋白质芯片读数器(PrtoteinChipReader)(CiphergenBiosystems,CA)侦测结合至芯片表面的蛋白质。使用自动分析程序控制数据取得过程。每个光谱为80次激光射击平均值,且以已知的胜肽或蛋白质混合物做外部校准。分子量测定误差为0.05%。11.2.8.数据分析用于此次研究的数据分析过程涉及下列歩骤(a)高峰侦测。使用蛋白质芯片软件3.0(CiphergenBiosystems,CA)收集及评估原始光谱。收集所有质谱且减去基准线。手动选择带有信号/杂讯>5的合格质量高峰(目测检验)且将高峰强度标准化为所选择质量区域的总离子流。在此案,其介于3kDa及135kDa。将在三重复分析中所辨识的每个M/Z之高峰强度的平均,之后转换成对数用于接下来的分'析。(b)使用训练数据选择生物标志。我们己使用来自IO个NAF检体所获得之高峰强度数据作为选择候选生物标志的训练数据。因所获得的质谱之受试者变化性(目测检查),先实行非监督式聚类分析(MATLAB),根据一般蛋白质表达模式识别任何潜在患者子群。观察两个聚类,一个由检体C6、C14、N32、N33及N36(群组A)所组成。另一个由检体Cll、C16、C26、N4及N15(群组B)所组成。之后在每个亚群使用ProPeak(3ZInformatics,Charleston,SC)实行监督式聚类分析,且选择可有效地区分癌症与非癌症数据的生物标志。ProPeak执行统一最大分离性分析(UMSA)演算法的线性版,该技术最先被报告用于微阵列数据分析(Zhang,Z.s丄In:LinSMandJohnsonKF(eds.),MethodsofMicroarraydataanalysis:papersfromCAMDA'00.Boston:KluwerAcademicPublishers;2001.p.125-136)。应用ProPeak于SELDI蛋白质阵列数据分析已于先前报导中详细描述(Li,J."s丄(2002)Clin.Chem.48:1296-1304)。简言之,分析每个检体且当作一独立点投射于三维组成空间,其中每个点的位置使用高峰密度数据以线性回归来源复合指数测定。各个高峰的排列代表其对癌症及非癌症检体最大分类的贡献。在此案中,我们用目力检査有高区别力的高峰且选择5个在癌症中升高的高峰(在群组A中3个高峰,在群组B中2个高峰)做进一步评估。(c)使用独立测试数据确认生物标志。在来自约翰霍普金斯医院所收集的DLF检体中测试潜在生物标志的效力。此研究所获得的42个1mLDLF分装中,24个产生超过接下来的SELDI分析所需的3Pg蛋白质。等量组合分别来自9个癌化乳房的ll个DLF、7个非癌化乳房的13个DLF的蛋白质以表示癌症及非癌症乳房。在独立实验中,使用如分析NAF所述之相同芯片程序产生组合检体的蛋白质图谱。11.2.9.SELDI-T0F-MS免疫捕捉BF1至3使用对抗与人类HNP1、2及3(Alphadiagnostics,SanAntonio,TX)共有的16-aa胜肽之亲和性纯化兔子抗体实行免疫捕捉。遵照制造说明书,使用AminoLinkPlusImmobilizationKit(Pierce,Rockford,IL)将抗体连接至AminoLink珠子。于捕捉实验中使用带有高度BF1至3(C4与C14)的2个NAF检体,且如前所述,在IMAC-Cu蛋白质芯片阵列上分析所捕捉的胜肽。11.2.10.用ELISA定量测量HNP1至3使用夹心固相酵素连结免疫吸附分析(ELISA)测量HNP1至3的浓度。该试齐IJ盒为HyCuItBiotechnology的产品,由Netherlands,CellSciences,Canton,MA.销售。将每个样本稀释(实行前实验测定每个样本适当的稀释系数)及二重复测量。11.3.实施例3.结果11.3.1.乳房液体的蛋白质体图谱使用我们最佳化的芯片程序及含有1Pg全蛋白质的乳房液体样本能够获得具再现性的蛋白质图谱。图l显示来自5个原发侵袭性癌症患者的癌化乳房(C6、Cll、C14、C16、C26)及5个正常控制组的乳房(N4、N15、N32、N33、N36)之乳头吸引液体的蛋白质图谱假拟胶图。不同受试者的一般蛋白质表达图谱各异,反之相同检体的三重复分析质谱具有高度再现性。小于3000的M/Z(质量/电荷)离子信号主要为基质物质的杂讯,且在135,000侦测到最大的M/Z。我们已手动选择73个蛋白质高峰(信号/杂讯>5,3K至135K的M/Z)作为接下来生物标志评估。11.3.2.使用训练数据选择生物标志使用IO个NAF检体作为训练样本。首先,我们实行非监督式聚类分析,根据其蛋白质表达数据辨别任何潜在患者子群。形成二个聚类,聚类A由检体C6、C14、N32、N33及N36所组成及聚类B由检体Cll、C16、C26、N4及N15所组成(图2)。这些检体全部都在标准化程序下,于2001年的4个月内的不同天收集,且两个亚群之间未观察到明显的年纪不同、更年期状况。选择在各亚群中有区别力的生物标志,接着使用ProPeak实行监督式分析。根据生物标志在各群组中对癌症及非癌症检体最大分类的贡献排列高峰我们选择5个具有最高区别力的高峰(在群组A中3个,在群组B中2个)做进一步评估。5个所选高峰的M/Z值为3375(BF1)、3447(BF2)、3490(BF3)、4079(BF4)及4680(BF5)(于图2箭头所示者)。BFl至3显示为3个高峰的聚类且在C6及C14升高,被选为群组A中最有效的辨别者。BF4在C11及C16升高,而BF5在C26升高。这2个标志在群组B中可共同地区别癌症与非癌症检体。整体来说,需要最低限度3个高峰(BF1/2/3、BF4及BF5)来正确分类全部5种癌症病例。11.3.3.使用独立测试数据确认生物标志从约翰霍普金斯医院收集的样本的一对经组合DLF检体测试确认BF1至5。获得的42个1mlDLF分装中,24个产生超过接下来的SELDI分析所需的3ug蛋白质。这些24个样本包括来自9个患癌症乳房的11个DLF、7个对侧非癌症乳房的13个DLF。因为每个癌化乳房只有1个乳管栖息肿瘤且并未采样所有乳管,癌化乳房的液体生产乳管可能不必然包括带有肿瘤的乳管。一开始,计画使用细胞学作为辨识癌症乳管的黄金指标,但失败,因为大多数样本(33/42)缺乏细胞(〈10个细胞)。为增加获得癌症及非癌症乳管真阳性及真阴性检体代表的机率,分别等量组合9个癌化乳房(DLF-C)之全部11个乳管及7个非癌化乳房(DLF-N)之13个乳管的蛋白质,创造出一对组合DLF检体。如图2C所示,组合DLF样本的一般蛋白质表达模式类似群组A的NAF,且与非癌症控制组比较,确认在癌症中BF1至3及BF5的上升。应注意先前在群组A或B中都观察到BF1至3及BF5的上升,组合DLF样本因此呈现两个亚群的特征。在组合DLF检体中,不见相对应于BF4的高峰,此标志的效力因而仍未经证实。经确认,BF1至3为人类中性粒细胞多肽1至3(HNP1至3)。通过搜寻蛋白质资茅斗库(NationalCenterforBiotechnolgyInformationandSwiss-Prot,两者于网路上均可获得),我们发现BF1至3的分子量3375(BF1)、3447(BF2)及3490(BF3)与人类中性粒细胞多肽1至3(HNP1至3)的分子量相符。虽然一些肿瘤亦可产生相同能力的HNP1至a然HNP1至3主要为由人类嗜中性白血球制造的胜肽抗生素。HNP1至3除了在天生的抗微生物免疫力中所具有的作用活性不同的,最近的研究亦已暗示着其在肿瘤细胞增殖上的影响。使用对抗HNP1至3的单株抗体而经由SELDI-T0F-MS免疫捕捉证实BF1至3的身份为HNP1至3。将抗体胺基连结至珠子,并与2个带有高度BF1至3高峰的NAF检体(NAF-C6及NAF-C14)培养。NAF-C6及C14的原始质谱以及从2个样本中各自所捕捉之蛋白质的光谱如图3所示。3个胜肽经抗体捕捉且显示出与BFl至3完全相同的分子量及表达模式(注意在NAF-C14中,BF3的相对强度与BF1及2有关)。用定量免疫检定法测量HNP1至3的浓度证实SELDI的发现。以ELISA定量分析HNP1至3进一步确认在NAFC4及C14中HNP1至3的上升。BFl至3的高度高峰振幅关联于ELISA所测得的高浓度HNPl至3(图4)。在C6中,HNP的浓度为11905ng/ml、C14为8816ng/ml;比正常控制组的平均值172ng/ml(范围19至643ng/ml)高出50倍以上。为研究在乳房液体中升高的HNP浓度是否是因为血液污染,亦测量商业组合标准血清样本以及4位外观上健康的女性、4位患有良性乳房疾病的女性、4位患有原位乳管癌及4位患有侵袭性乳腺癌女性的20个储存血清样本中之HNP1至3。在组合(pooled)商业血清中的HNP1至3浓度经测定为41ng/ml(数值绘图于图4)。在储存血清中的HNP范围为11ng/ml至456ng/ml且平均值为44ng/ml。不管癌症/非癌症状况,血清中相对低浓度的丽P显示这些液体样本中HNP的来源不可能是因为血液污染。来自乳腺癌高危险群女性的DLF中之HNP1至3浓度。以ELISA在来自13个乳腺癌高危险群女性的42个DLF检体(在6至12个月间隔重复双侧乳房灌洗,在西北大学收集)中进一步测试HNP1至3对乳腺癌的特异性。只在一位女性(患者11)中观察到HNP1至3的上升,反之来自其他12位女性的所有36个样本经测试为阴性(图五A)。在相距8个月的2个时间点,收集来自患者11左乳房2个乳管及右乳房1个乳管总共6个液体样本。在第一个时间点所有3个乳管中及在第二个时间点2个乳管中观察到高浓度的HNP1至3(图5A)。根据此患者的细胞学及组织学数据,未侦测到癌症。为剔除测量HNP1至3上蛋白质产量的可能影响,亦在图5B绘制每个样本中相对应的蛋白质浓度。未观察到HNP1至3浓度与蛋白质产量之间的关联性,低量HNP的表达并不是因为样本中缺乏蛋白质。11.4.实施例4完成每个标准程序的NAF样本收集。在每个类型中的样本数目总结于表2。表2:双侧NAF收集患者数目NAF数目(N)第i期/n期侵袭性癌症28成对NAF(22*2)未成对末癌化(3)未成对非末癌化(3)原位4成对NAF(2*2)未成对末癌化(l)未成对非末癌化(l)ADH5成对NAF(3氺2)未成对ADH(3)未成对ADH控制组(l)控制组33成对NAF(2C^2)未成对(13)总数70117获得来自西北大学的乳管灌洗检体。这群组由收集自58位乳腺癌高危险群女性(5年盖尔危险率〉1.6或先前有小叶癌病史)的149个双侧乳管灌洗检体所组成。11.4.1.蛋白质体图谱于蛋白质芯片阵列上实施三重复的所有NAF样本的蛋白质体图谱。在目前的数据中侦测到先前已辨识的2个潜在生物标志(HNP1至3及BF5,图6)并分别以高峰强度(BF-5,图7)及ELISA(HNP1至3,图8)评估其表达程度。11.4.2.HNP1至3的表达在高危险群中观察到HNP1至3的表达升高,其与先前在癌症病例上的观察相比较呈现较显著的程度。11.4.3.辨识BF5分离含有BF5的单一胶体条纹。将从胶体洗提出来的物质送到JohnsHopkinsCoreFacility(故胜肽指纹法(fingerprinting)及胜肽定序。BF5经辨识为a-l-抗胰蛋白酶抑制物的C端片段(AAT)。单一条纹含有2个C端片段被命名为BF-5-1及BF-5-2。BF-5-1经测定为a-l-抗胰蛋白酶抑制物的C端片段(AAT),带有胺基酸序列LEAIPMSIPPEVKFNKPFVFLMIDQNTKSPLFMGK丽PTQK。BF-5-2经测定为a-l-抗胰蛋白酶抑制物的C端片段(AAT),带有胺基酸序列EAIPMSIPPEVKFNKPFVFLMIDQNTKSPLFMGKWNPTQK。本文已显示胰蛋白酶分解的质谱及胰蛋白酶片段1842的Mascot片段模式(加底线者),以及比较所观察与所预测的BF5-1及2的质量。在4679.4、4694.0、4707.9的多个高峰与在母离子4663.6中1、2及3个氧化甲硫胺酸(M)相符(见图9及10)。收集额外的检体确认标志。从患有侵袭性乳腺癌、DCIS、ADH及目前未患癌症的女性收集双侧NAF做比较。从西北大学获得来自乳腺癌高危险群女性的额外DLF检体。评估2个先前已辨识的生物标志。在4个患有侵袭性癌症受试者(4/25)、1个患有DCIS受试者(l/3)及1个患有ADH受试者(1/3)的癌症/患病乳房中观察到BF5上升。没有1任何对侧控制组乳房显示BF5阳性,包括所有控制组受试者的乳房。BF5显然为特异性(除了1位患有ADH的受试者例外)以及具有限的敏感性。在高危险群中观察到HNP1至3,与在癌症病例上的观察比较呈现较高的浓度。权利要求1.一种鉴定受试者乳腺癌状况的方法,包括(a)测量来自受试者的生物样本中的至少一种生物标志,其中,该至少一种生物标志选自表1生物标志所组成群组;以及(b)关联测量与乳腺癌状况。2.如权利要求l所述的方法,其中,该至少一种生物标志是通过在SELDI探针吸附剂表面捕捉生物标志以及以激光解析电离质谱测定法侦测所捕捉的生物标志而测量。3.如权利要求l所述的方法,其中,该至少一种生物标志是由免疫检定法测量。4.如权利要求1所述的方法,其中,该样本为乳头吸引液体(NAF)。5.如权利要求1所述的方法,其中,该样本为乳管灌洗液体(DLF)。6.如权利要求l所述的方法,其中,该关联是由软体分类演算法实施。7.如权利要求l所述的方法,其中,乳腺癌状况选自乳腺癌及非乳腺癌。8.如权利要求7所述的方法,其中,若该测量与乳腺癌相关,该方法进一步包括投予至少一种治疗至受试者,该治疗选自下列群组手术、放射治疗及化学疗法。9.如权利要求1所述的方法其中,该乳腺癌状况选自第I期或第II期原发性原位乳腺癌及非乳腺癌。10.如权利要求l所述的方法,其中,该至少一种生物标志为ci-防御素。11.如权利要求10所述的方法,其中,该a-防御素为a-防御素-l、a-防御素-2或a-防御素-3。12.如权利要求l所述的方法,其中,测量至少2种生物标志。13.如权利要求12所述的方法,其中,该至少2种生物标志选自下列所组成的群组a-防御素-1、a-防御素-2、a-防御素-3、a-1_抗胰蛋白酶抑制物的C端片段1及a-1-抗胰蛋白酶抑制物的C端片段2。14.如权利要求l所述的方法,其中,测量至少三种生物标志。15.如权利要求14所述的方法,其中,该至少三种生物标志为a-防御素-1、a-防御素-2及a-防御素-3。16.如权利要求1所述的方法,进一步包括测量至少一种生物标志,其中,该生物标志能够区别乳腺癌及非癌症,且其中,该生物标志不是a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1或a-1-抗胰蛋白酶抑制物的C端片段2。17.如权利要求2所述的方法,其中,该吸附剂为頂AC-Cu2+吸附剂。18.如权利要求2所述的方法,其中,该吸附剂为生物特异性吸附剂。19.如权利要求18所述的方法,其中,该生物特异性吸附剂包括抗防御素-1、a-防御素-2及a-防御素-3的抗体。20.—种决定乳腺癌进程的方法,包括(a)第一次测量来自受试者的生物样本的至少一种选自下列群组的生物标志a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2;(b)第二次测量受试者生物样本的该至少一种生物标志;以及(c)比较第一次测量及第二次测量,其中,由该比较测量决定乳腺癌的进程。21.如权利要求20所述的方法,进一步包括(d)在处理受试者后,测量至少一种生物标志,并关联该测量与疾病进展。22.—种包括测量来自受试者的样本的至少一种生物标志的方法,该生物标志选自下列群组a-防御素-l、a-防御素-2、a-防御素_3、BF_4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。'23.—种包括纯化的生物标志的组合物,其中,该生物标志选自于下列群组a-防御素-l、a-防御素-2、a-防御素_3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。24.—种包括生物特异性捕捉剂的组合物,该捕捉剂特异结合到选自下列群组的生物标志a-防御素-l、a—防御素-2、a—防御素一3、BF_4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。25.—种包括结合到生物标志的生物特异性捕捉剂的组合物,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。26.—种试剂盒包括(a)包括至少一种捕捉剂附着于其上的固相载体,其中,该捕捉剂与至少一种生物标志结合,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、d-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2;以及(b)使用该固相载体侦测该至少一种生物标志的说明书。27.如权利要求26所述的试剂盒,其中,该包括捕捉剂的固相载体为SELDI探针。28.如权利要求26所述的试剂盒,其中,该捕捉剂为IMAC-&2+吸附剂。29.如权利要求26所述的试剂盒,进一步包括(c)含有至少一种选自下列群组的生物标志的容器a-防御素-l、a-防御素-2、a-防御素-3、BF-4、抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。30.如权利要求26所述的试剂盒,进一步包括(c)一种1Kd阻断透析剂。31.—种试剂盒包括(a)包括至少一种捕捉剂附着于其上的固相载体,其中,该捕捉剂与至少一种生物标志结合,该生物标志选自下列群组a-防御素-l、a-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段l及a-l-抗胰蛋白酶抑制物的C端片段2;以及(b)含有至少一种生物标志的容器。32.如权利要求31所述的试剂盒,其中,该包括捕捉剂的固相载体为SELDI探针。33.如权利要求31所述的试剂盒,其中,该捕捉剂为頂AC-Cu2+吸附剂。34.—种软件产品,包括(a)存取样本数据的程式,该数据包括至少一种生物标志的测量,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2;以及(b)执行分类演算法的程式,其分类该样本的乳腺癌状况作为该测量的函数。35.—种包括以质谱测定法或免疫检定法侦测至少一种生物标志的方法,该生物标志选自下列群组a-防御素-l、a-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及ci-l-抗胰蛋白酶抑制物的C端片段2。36.—种包括将关于乳腺癌状况的诊断结果传达至受试者的方法,该乳腺癌状况由来自受试者的样本的至少一种生物标志的关联性决定,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-l-抗胰蛋白酶抑制物的C端片段1及a-1-抗胰蛋白酶抑制物的C端片段2。37.如权利要求36所述的方法,其中,该诊断结果经电脑产生的媒介物传达至受试者。38.—种辨识与生物标志相互作用的化合物的方法,该生物标志选自下列群组a-防御素-1、ci-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2,其中,该方法包括(a)将该生物标志与测试化合物接触;以及(b)测定该测试化合物是否与该生物标志相互作用。39.—种调节细胞的生物标志浓度的方法,该生物标志选自下列群组a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-1_抗胰蛋白酶抑制物的C端片段1及a-1-抗胰蛋白酶抑制物的C端片段2,其中,该方法包括将该细胞与化合物接触,其中,该化合物调节生物标志的表达或转翻译后处理。40.—种治疗受试者症状的方法,其中,该方法包括投予治疗有效量的化合物至受试者,其中,该化合物调节生物标志的表达或翻译后处理,该生物标志选自下列所组成的群组a-防御素-1、a-防御素-2、a-防御素-3、BF-4、a-1-抗胰蛋白酶抑制物的C端片段1及a-l-抗胰蛋白酶抑制物的C端片段2。41.如权利要求40所述的方法,其中,该症状为乳腺癌。全文摘要本发明提供以蛋白质为主的生物标志及生物标志组合,其用于鉴定患者体内的乳腺癌状况。特别是,本发明生物标志用于将受试者样本分类为乳腺癌或非乳腺癌。该生物标志可由SELDI质谱测定法测定。文档编号G01N33/574GK101223445SQ200680026379公开日2008年7月16日申请日期2006年5月25日优先权日2005年5月26日发明者D·W·尚,J·李,S·苏库马尔申请人:约翰·霍普金斯大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1