蛋白质阵列及其用途的制作方法

文档序号:6002274阅读:706来源:国知局
专利名称:蛋白质阵列及其用途的制作方法
技术领域
本发明公开的实施方案涉及蛋白质阵列领域,产生蛋白质阵列的方法,及所述阵列在研究及诊断疾病中的用途等。I蛋白质阵列允许平行进行多个基于蛋白质的测定。与单独的测定相比其提供了大大增加的通量。它们典型地每个测定使用较少的试剂及每个测定需要较短的时间。由此,阵列通常大大降低每个测定的成本,即使考虑到建造阵列的成本也如此。此外,在阵列中同时进行多个测定提供了单独测定的重复(redundancy)以及以多种方式测定同一参数的能力,使得与单独的测定相比获得改善的结果精确性和准确性。此外,全基因组蛋白质阵列提供了检测蛋白质组范围的(proteome wide)蛋白质-分子相互作用的可能性。这种基因组范围的(genome wide)检查是了解蛋白质之间相互作用、解码抗体结合特异性和交叉反应以及鉴别诊断和患者分层的生物标志等应用的有力工具。已经描述了蛋白质阵列的一些主要形式。在正相(forward phase)蛋白质微阵列中,将经充分确定的特定靶特异性的捕获蛋白固定在阵列中指定位置,通过样品与所述阵列结合的位置和强度鉴别及量化靶化合物。正相阵列的主要应用是查询各个样品以同时确定大量不同成分的存在和量。在正相阵列的一个典型类型中,所述阵列由特异于特定抗原的全套抗体(a panoply of antibodies)组成,所述阵列用于测量样品中这些抗原的存在和量。在反相阵列(reverse phase array)中,将全套样品排成阵列,然后用鉴别试剂探查,典型用单特异性试剂探查,如特异于特定抗原的抗体。反相阵列的主要用途是鉴定大量样品中一或至多几种成分的存在和量。反相阵列的一个举例的应用是筛选一系列单特异性试剂,如特异于特定抗原的抗体,针对一组不同的细胞类型。已经公布了关于蛋白质阵列的许多综述,这些综述描述了目前的蛋白质阵列技术的类型、使用、优势和缺点,所述文献包括Joos and Bachmann(2009), “Proteinmicroarrays:potentials and limitations, ’^Frontiers in Biosciences 14:4376-4385 ;Chan et al. (2004) , “Protein microarrays for multiplex analysis of signaltransduction pathways, Mature Medicine 10(12):1390-1396 ;Hartmann et al. (2009),“Protein microarrays for diagnostic assays,,’Anal. Bioanal. Chem. 393:1407-1416及 Caron et al. (2007), “Cancer Immunomics Using Autoantibody Signature forBiomarker Discovery,,,Molecular & Cellular Proteomocis 6. 7:1115-1122。其它的参考文献在下文VII章节中提供。先前的蛋白质阵列典型包含相对较少数目的纯化的蛋白质,或者是通过大量先前阵列的DNA在宿主细胞中反向转染制成的,所述宿主细胞在生长及转染的DNA表达之后在原位裂解。前一种阵列的限制是可以实际获得的蛋白质数量,即所述阵列中每种蛋白质必需克服的蛋白质纯化的难度。后一种阵列的限制是转染和表达结果中的异质性,及得自在原位表面上裂解的汇合细胞的蛋白质密度的限制。由于这些及许多其它原因,目前使用的蛋白质阵列具有多种限制和缺点,因此需要改良的蛋白质阵列及提供现有技术不具备的功能性的阵列。II通过下文编号的段落以例证和描述本文揭示的本发明的一些方面和实施方案。在本文描述了许多其它方面,这些将为本领域技术人员显而易见。在编号的段落中使用的短语“任何前述或者下文”是指在编号的段落中阐述的各个元件可以任何方式组合,其用于提供对于任何这种组合的明确支持。申请人保留在本申请或者任何后续或相关申请中通修改而对整体或部分进行清楚地解释的权利和/或要求任何由此而得到的组合的权利I. 01.产生蛋白质阵列的方法,包括将包含相应的多个蛋白质的多个细胞裂解物 施加于支持物上相应多个位置,其中所述多个蛋白质在所述相应多个细胞中通过相应多个外源DNA而表达,I. 02.产生蛋白质阵列的方法,包括将包含蛋白质P1至Pn的裂解物L1至Ln施加于支持物上的位置31至5 ,其中每种裂解物Lx是包含在其中通过外源DNA Dx而表达的蛋白质Px的细胞Cx的裂解物,并被施加于位置Sx,其中P1至Pn彼此均不相同,S1至Sn彼此均不相同,n是大于I的整数,及X是I至n的整数。在如本文所述实施方案中,X是基因组中基因、基因座或者蛋白质编码区的一部分,特别如在本文别处所述。在下文所述实施方案中,X是给定数目的生物体的基因、基因座或者蛋白质编码基因。1.03.产生蛋白质阵列的方法,包括将蛋白质P1至Pn施加于支持物上的位置S1至Sn,其中每种蛋白质Px在细胞Cx中通过外源DNA Dx表达,并被施加于位置Sx,其中P1至Pn彼此均不相同,S1至Sn彼此均不相同,n是大于I的整数,及X是I至n的整数。1.04.产生蛋白质阵列的方法,包括将包含相应多个蛋白质的多个裂解物施加于支持物上相应多个位置,从而产生所述多个蛋白质的阵列,其中所述裂解物是通过这样的方法产生的,所述方法包括在相应多个细胞集落或培养物中通过在所述集落或培养物的细胞中的相应多个外源DNA表达多个蛋白质,并裂解每个所述多个细胞集落或培养物,从而产生包含所述相应多个蛋白质的相应多个裂解物。I. 05.产生蛋白质阵列的方法,包括在相应多个细胞集落或培养物中通过在所述集落或培养细胞中的相应多个外源DNA表达两或多个蛋白质;裂解每个所述细胞集落或培养物,从而产生包含所述相应多个蛋白质的相应多个裂解物;将包含所述相应多个蛋白质的所述多个裂解物施加于支持物上相应多个位置;从而产生所述多个蛋白质的阵列。2. 01.前述或如下任一方法,其中所述蛋白质在所述细胞中通过所述DNA过表达。 2. 02.前述或如下任一方法,其中所述蛋白质在所述裂解物中以高浓度存在。2. 03.前述或如下任一方法,其中除了对照物之外,至少50、60、75、80、85、90、95、99或100%的所述蛋白质是所述细胞中总蛋白质的至少0. 01、0. 025,0. 05,0. 10,0. 15、0. 25,0. 35,0. 50,0. 75,1. 00,1. 25,1. 50,1. 75,2. 00,2. 25,2. 50,2. 75,3. 00,3. 50,4. 00、4. 50,5. 00,5. 50,6. 00,7. 50、10. 0,15. 0 或者 20%。2. 04.前述或如下任一方法,其中除了对照物之外,至少50、60、75、80、85、90、95、99或100%的所述蛋白质在所述细胞中通过外源DNA表达,其表达量明显高于所述蛋白质在所述细胞中的任何内源表达。2.05.前述或如下任一方法,其中除了对照物之外,至少50、60、75、80、85、90、95、99或100%的所述蛋白质在所述细胞中通过所述DNA表达,其表达量是所述蛋白质在所述细胞中任何内源表达的至少 I. 5,2. 0,2. 5,3. 0,4. 0 5. 0,7. 5、10、15、20、25、30、40、50、75、100、125、150、200、250、300、400、500、750、1,000,1, 500 或者更多倍。2. 06.前述或如下任一方法,其中除了对照物之外,至少50、60、75、80、85、90、95、99或100%的所述蛋白质是所述裂解物中总蛋白质的至少0. 01,0. 025,0. 05,0. 10,0. 15、
0.25,0. 35,0. 50、. 075,1. 00,1. 25,1. 50. I. 75,2. 00,2. 25,2. 50,2. 75,3. 00,3. 50,4. 00、4. 50,5. 00,5. 50,6. 00,7. 50、10. 0,15. 0 或者 20%。2.07.前述或如下任一方法,其中除了对照物之外,至少50、60、75、80、85、90、95、99或100%的所述裂解物,每种裂解物中每种蛋白质的浓度是至少1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800 或 900ug/ml 或者至少
1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800或900mg/ml。3.01.前述或如下任一方法,其中所述蛋白质共包含至少20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或98%的由生物体基因组编码的蛋白质。在实施方案中,
所述生物体是哺乳动物。在实施方案中,所述生物体是小鼠、大鼠、绵羊、山羊、狗或灵长类动物中任一种动物。3. 02.前述或如下任一方法,其中所述蛋白质共包含由人基因组编码的蛋白质的至少 20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95 或 98%。3. 03.前述或如下任一方法,其中所述阵列包含生物体的至少1,000、2,000、3,000,4, 000,5,000,6,000,7,000,8,000,9,000,10,000,11,000,12,000,13,000,14,000、15,000,16, 000,17, 000,18, 000,19, 000,20,000,21,000,22,000,23,000,24,000,25,000、26,000,27, 000,28, 000,29, 000 或 30,000 个不同基因座的蛋白质。3. 04.前述或如下任一方法,其中所述阵列包含至少1,000,2, 000,3, 000,4, 000、5,000,6, 000,7, 000,8, 000,9, 000,10, 000,11, 000,12, 000,13, 000,14,000,15,000、16,000,17,000,18,000,19,000,20,000、21、000、22,000,23,000,24,000,25,000,26,000、27,000,28, 000,29, 000 或 30,000 个不同蛋白质。3. 05.前述或如下任一方法,其中所述阵列包含已经施加所述蛋白质的至少I,000,2,000,3,000,4,000,5,000,6, 000,7, 000,8, 000,9, 000,10, 000,11, 000,12, 000、13,000,14,000,15,000,16,000,17,000,18,000,19,000,20,000、21、000、22,000,23,000、24,000,25, 000,26, 000,27, 000,28, 000,29, 000 或 30,000 个位置。3. 06.前述或如下任一方法,其中每cm2具有至少10、25、50、75、100、150、200、250、350、500、750、1,000,2,000,3,000,4,000,5,000,6,000,7,500,10,000,15,000 或20, 000个位置。 3. 07.前述或如下任一方法,其中每cm2施加至少10、25、50、75、100、150、200、250、350、500、750、1,000,2,000,3,000,4,000,5,000,6,000,7,500,10,000,15,000 或20,000个所述裂解物。3. 08.前述或如下任一方法,其中每cm2施加至少10、25、50、75、100、150、200、250、350、500、750、1,000,2,000,3,000,4,000,5,000,6,000,7,500,10,000,15,000 或20, 000个所述蛋白质。3. 09.前述或如下任一方法,其中每cm2具有至少10,25,50,75,100,150,200,250,350,500,750,I, 000,2,000,3,000,4,000,5,000,6,000,7,500,10,000,15,000 或 20,000个位置,及所述蛋白质施加于至少50、60、70、80、90或95%所述位置。3. 10.前述或如下任一方法,其中所述斑点(spots)的直径是10-50、25_75、50-100、75-150 100-200,150-250,200-300,250-350,300-400,400-500,500-750,400-800,750-1, 000u mo3.11.前述或如下任一方法,其中所述特征的面积是10-50、25-75、50-100、75-150 100-200、150-250、200-300、250-350、300-400、400-500、500-750、400-800、750-1,250、1,000-2, 000、1,500-3,000,2, 500-5,000 u m2。3. 12.前述或如下任一方法,其中所述特征(斑点)的中心至中心的间距是5-15、10-20、15-25、20-40、25-50、25-75、50-100、75-150、100-150、125-175、150-225、200_250、225-275,250-350,300-400 或 400-500u m。4. 01.前述或如下任一方法,其中每种裂解物中的蛋白质浓度是至少1,2,3,5,10,15,20,25,35,50,100,150,200,250,300,350,400,450,500,600,700,800 或 900 u g/mil或者至少 1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800 或 900mg/ml。4. 02.前述或如下任一方法,其中除了对照物之外,对于至少50、60、75、80、85、90、95、99或100%的所述裂解物而言,裂解物蛋白质的量是至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1,000,1,500,2,000 或 2,500
个裂解物细胞的总蛋白质的量。
4. 03.前述或如下任一方法,其中除了对照物之外,对于至少50、60、75、80、85、90、95、99或100%所述蛋白质而言,通过外源DNA表达的所述蛋白质的量是在至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1,000、1,500,2, 000或2,500个表达所述蛋白质的细胞中通过所述外源DNA表达的所述蛋白质的量。5.01.前述或如下任一方法,其中所述细胞是真核细胞。5.02.前述或如下任一方法,其中所述细胞是原核细胞。5. 03.前述或如下任一方法,其中所述细胞是HEK293、COS、CVl、BHK、CHO、HeLa,LTK或NIH 3T3细胞中的任一或多种细胞。5.04.前述或如下任一方法,其中所述细胞是HEK293T细胞。
6. 01.前述或如下任一方法,其中一或多种所述外源DNA编码所述蛋白质之一。6. 02.前述或如下任一方法,其中一或多种所述外源DNA编码所述蛋白质之一,及每一这种外源DNA中的每一这种蛋白质由cDNA、基因组DNA或者合成的DNA编码。6. 03.前述或如下任一方法,其中一或多种所述外源DNA是表达构建体,其包含在所述细胞中有效转录的顺式作用元件,与编码所述蛋白质之一的DNA可操纵地连接。在实施方案中,所述顺式作用元件包括启动子。6. 04.前述或如下任一方法,其中一或多种所述外源DNA是表达构建体,其包含在所述细胞中有效转录的启动子(及任选其它顺式作用遗传元件),其与编码所述蛋白质之一的DNA可操纵地连接,其中所述在每一所述一或多种外源DNA中编码所述蛋白质的DNA是cDNA、基因组DNA或者合成的DNA。6.05.前述或如下任一方法,其中所述启动子是CMV、SV40或MMTV启动子中的任
一或多种启动子。6. 06.前述或如下任一方法,其中一或多种所述外源DNA编码嵌合蛋白质,所述嵌合蛋白质主要包含与标签序列以正确符合读框方式融合的所述阵列蛋白质的氨基酸序列,以有效地进行附着、固定、捕获、纯化、检测和/或量化中的任一或多项。6. 07.前述或如下任一方法,其中所述标签是GST、HA、V5、HIS、DDK (或FLAG)或者myc标签中的任一或多个标签。6. 08.前述或如下任一方法,其中所述标签是myc/FLAG标签。6. 09.前述或如下任一方法,其中所述表达构建体是pCMV6_entry表达载体。6. 10.前述或如下任一方法,其中所述外源DNA包含非同源重组激活编码所述蛋白质阵列的蛋白质的内源基因表达的构建体。6. 11.前述或如下任一方法,其中所述外源DNA包含用于同源重组激活编码所述阵列蛋白质的内源基因表达的构建体。7.01.前述或如下任一方法,其中所述支持物是本文别处描述或列举的任何支持物。7. 02.前述或如下任一方法,其中所述支持物包含硝化纤维。7. 03.前述或如下任一方法,其中所述支持物包含硝化纤维包被的载玻片。8. 01.前述或如下任一方法,其中所述蛋白质纯化自所述裂解物,之后施加于所述支持物。
8. 02.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之前纯化为至少 50%、60%、70%、75%、80%、85%、90%、95%、97%、98%、99% 纯的。8. 03.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之前纯化,以将至少50%、60%、70%、75%、80%、85%、90%、95%、97%、98%、99%的总蛋白质施加于所述支持物。8. 04.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之前通过亲和性层析进行纯化。8. 05.前述或如下任一方法,其中所述蛋白质包含亲和性标签,且在施加于所述支持物之前通过特异于所述亲和性标签的亲和性层析纯化。8. 06.前述或如下任一方法,其中所述蛋白质包含肽亲和性标签,且在施加于所述支持物之前通过特异于所述肽亲和性标签的亲和性层析纯化。
8. 07.前述或如下任一方法,其中所述蛋白质包含DDK亲和性标签,且在施加于所述支持物之前通过使用特异于DDK标签的抗体进行免疫亲和性层析而纯化。9.01.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之后纯化自所述裂解物。9.02.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之后纯化至至少 50%、60%、70%、75%、80%、85%、90%、95%、97%、98%、99% 或者更均质纯的。9. 03.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之后纯化,以使得至少50%、60%、70%、75%、80%、85%、90%、95%、97%,. 98%、99%或者全部蛋白质固定在所述支
持物上。9.04.前述或如下任一方法,其中所述蛋白质在施加于所述支持物之后纯化,纯化是通过结合所述支持物上特异于通过外源DNA表达的蛋白质的亲和性组分及除去未结合的材料而进行。9. 05.前述或如下任一方法,其中所述蛋白质包含亲和性标签,并在施加于所述支持物后纯化,纯化是通过结合所述支持物上特异于所述标签的亲和性组分及除去未结合的材料而进行。9. 06.前述或如下任一方法,其中所述蛋白质包含肽亲和性标签,并在施加于所述支持物后纯化,纯化是通过结合所述支持物上特异于所述肽标签的亲和性组分及除去未结合的材料而进行。9. 07.前述或如下任一方法,其中所述蛋白质包含DDK亲和性标签,并在施加于所述支持物后纯化,纯化是通过结合所述支持物上特异于所述DDK亲和性标签的亲和性组分及除去未结合的材料而进行。在实施方案中,所述DDK特异性亲和性标签是DDK-特异性抗体。10.01.前述或如下任一蛋白质阵列,其是通过前述任何方法产生的。10. 02.前述或如下任一蛋白质阵列,其包含至少1,000、2,000、3,000、4,000、5,000,6, 000,7, 000,8, 000,9, 000,10, 000,11, 000,12, 000,13, 000,14,000,15,000、16,000,17,000,18,000,19,000,20,000、21、000、22,000,23,000,24,000,25,000,26,000、27,000,28, 000,29, 000 或 30,000 种不同蛋白质。10. 03.前述或如下任一蛋白质阵列,其包含生物体基因组的至少1,000、2,000、3,000,4, 000,5, 000,6, 000,7, 000,8, 000,9, 000,10, 000,11, 000,12, 000,13, 000,14, 000、15,000,16, 000,17, 000,18, 000,19, 000,20,000,21,000,22,000,23,000,24,000,25,000、26,000,27, 000,28, 000,29, 000 或 30,000 个不同基因座。10. 04.前述或如下任一蛋白质阵列,其包含至少20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或98%的由生物体基因组编码的蛋白质。10. 05.前述或如下任一蛋白质阵列,其中每cm2具有至少10、25、50、75、100、150、200、250、350、500、750、1,000,2, 000,3, 000,4, 000,5, 000,6, 000,7, 500,10, 000,15,000 或20, 000个裂解物。10. 06.前述或如下任一蛋白质阵列,其中每cm2具有至少10、25、50、75、100、150、200、250、350、500、750、1,000,2, 000,3, 000,4, 000,5, 000,6, 000,7, 500,10, 000,15,000 或
20,000个通过所述外源DNA表达的所述蛋白质。 10. 07.前述或如下任一蛋白质阵列,其中施加所述蛋白质的至少25,50、60、75、80、85、90、95、99或100%的位置,通过所述外源DNA表达的所述蛋白质的量是至少在每种蛋白质在其中表达的 100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1,000、1,500,2, 000或2,500个细胞中通过所述外源DNA表达的所述蛋白质的量。10.08.前述或如下任一蛋白质阵列,其包含排列标志(alignment markers)。11. 01.确定一或多种抗体与蛋白质的抗体特异性和/或交叉反应的方法,包括将抗体与前述或如下任一蛋白质阵列接触,以及确定所述抗体与其的结合。在实施方案中,所述蛋白质阵列包含由前述或如下任一基因组编码的所有蛋白质的大部分(substantialfraction)。11. 02.确定抗体制备物的一或多种特异性和/或一或多种交叉反应性的方法,包括将抗体制备物与前述或如下任一蛋白质阵列接触,以及确定所述制备物中抗体与其的结合。在实施方案中,所述抗体制备物是全细胞抗血清。在实施方案中,所述蛋白质阵列包含由前述或如下任一基因组编码的蛋白质的大部分。11.03.确定抗体或抗体制备物的结合特异性的方法,包括确定所述抗体或抗体制备物与前述或如下任一蛋白质阵列的结合,根据由此确定的与所述阵列的结合情况鉴别与其特异性结合的蛋白质。在实施方案中,所述蛋白质阵列包含由前述或如下任一基因组编码的蛋白质的大部分。11.04.确定疾病的蛋白质生物标志的方法,包括确定来自一或多个健康个体与来自一或多个患病个体的样品与前述或如下任一蛋白质阵列的结合,根据来自健康与患病个体的样品的结合的差异确定所述疾病的蛋白质生物标志。在实施方案中,所述蛋白质阵列包含由前述或如下任一基因组编码的蛋白质的大部分。11.05.确定自身免疫疾病的生物标志的方法,包括确定蛋白质阵列与前述或如下任一含有抗体的样品的结合,所述样品来自一或多个健康对象及来自患有自身免疫疾病的一或多个对象,根据来自健康对象与来自患有自身免疫疾病的对象的样品中抗体结合的差异确定所述自身免疫疾病的蛋白质生物标志。在实施方案中,所述蛋白质阵列包含由如述或如下任一基因组编码的蛋白质的大部分。11.06.确定特征在于存在在健康个体中不存在的抗体的疾病的生物标志的方法,包括确定蛋白质阵列与前述或如下任一样品的结合,所述样品来自一或多个健康对象及来自患有特征在于存在在健康个体中不存在的抗体的疾病的一或多个对象,根据来自健康对象与来自患有所述疾病的对象的样品中抗体结合的差异确定所述疾病的蛋白质生物标志。在实施方案中,所述蛋白质阵列包含由前述或如下任一基因组编码的蛋白质的大部分。11.07.诊断特征在于存在在健康个体中不存在的抗体的疾病的方法,包括确定蛋白质阵列与任一前述或如下来自可能患有所述疾病的对象的含有抗体的样品的结合,及根据所述样品中抗体与所述阵列的结合而确定所述疾病的存在与否。在实施方案中,所述蛋白质阵列包含由前述或如下任一基因组编码的蛋白质的大部分。11. 08.监测信号转导途径的方法,包括确定蛋白质阵列与包含信号转导途径蛋白质的任一前述或如下样品的结合,从而所述结合是所述蛋白质存在与否和/或存在量的指征。在实施方案中,所述样品是全细胞裂解物。在实施例中,所述样品包含其中通过外源DNA的蛋白质表达可以改变所述信号转导途径的蛋白质的细胞。在实施方案中,监测所述蛋白质的丰度、翻译后修饰或者稳定性中的任一或多种改变。在实施方案中,蛋白质结合是通过使用一或多种蛋白质特异性抗体检测的。在实施方案中,与蛋白质阵列的结合用于解码 通过外源DNA表达的蛋白质与一或多个信号转导途径的内源蛋白质之间的功能联系。在实施方案中,接连进行一些确定及监测一或多个信号转导途径中蛋白质状况的改变。11.09.确定小分子与蛋白质之间相互作用的方法,包括确定蛋白质阵列与包含所述小分子的前述或如下样品的结合情况。在实施方案中,所述小分子是任一或多种小的有机分子、脂肪、脂肪酸、脂肪酸酯、脂质、糖、聚糖、核酸、多核苷酸、氨基酸、肽或多肽,或者任何其它小分子。在实施方案中,所述小分子可以通过用检测标志进行标志而检测。在实施方案中,所述小分子的结合是通过使用结合与所述阵列结合的小分子的二级试剂检测的。III除非特别定义,在本文使用的单词、术语和短语的含义是本领域技术人员通常已知的含义。为了清晰所见,在下文举例解释了某些术语和短语。这些举例的解释只是有助于理解本发明,其不是限制本发明的,且不应理解为以任何方式限制本发明。裂解物L1至Ln是指从I至n连续编号的多个(n个)裂解物,其中n至少是2。一些裂解物可以是相同或者它们可以全部是不同的。细胞(通常是一群细胞)C1至Cn是指从I至n连续编号的多个(n个)细胞(通常为n个细胞群),其中n至少是2。一些细胞可以是相同的或者它们可以全部是不同的。蛋白质P1至? 是指从I至n连续编号的多个(n个蛋白质),其中n至少是2。一些蛋白质可以是相同的或者它们可以全部是不同的。位置S1至Sn是指从I至n连续编号的多个(n个)位置(通常是阵列中位置),其中n至少是2。一些蛋白质是相同的或者它们可以全部是不同的。一些或者全部蛋白质的身份(identity)可以已知或未知。0應01至0 是指从I至n连续编号的多个(n个)DNA,其中n至少是2. —些DNA可以是相同或者它们可以全部是不同的。一些或全部DNA的身份可以已知或未知。这些名称中使用的术语“分别的”(及“相应的”)是指其之间的相应性。例如,在S1至Sn位置的通过DNA D1至Dn表达蛋白质P1至Pn的细胞C1至Cn的裂解物L1至Ln分别是指在位置S1通过DNA D1表达蛋白质P1的C1细胞的裂解物L1,在位置S2通过DNA D2表达蛋白质P2的C2细胞的裂解物L2,如此类推,直至在位置Sn通过DNA Dn表达蛋白质Pn的Cn细胞的裂解物Ln。如本文所用,抗体包括多克隆抗体及单克隆抗体及其衍生物,包括但不限于如下抗体F(ab)2和F(ab)片段,包括以下的片段;杂交(嵌合)抗体分子,如Winter etal. (1991) Nature 349:293-299 及美国专利 No. 4,816,567)所述;Fv 分子(非共价异源二聚体)JBInbar et al. (1972)Proc Natl Acad Sci USA 69:2659-2662 及 Ehrlich etal. (1980)Biochem 19:4091-4096)所述;单链 Fv 分子(sFv),如 Huston et al. (1988)Proc Natl Acad Sci USA 85:5879-5883所述;二聚体和三聚体抗体片段构建体;小抗体(minibody),如 Pack et al. (1992) Biochem 31:1579-1584 及 Cumber et al. (1992)J. Immunology 149B: 120-126 所述;人源化抗体分子,如 Riechmann et al. (1988)Nature332:323-327、Verhoeyan et al. (1988) Science 239:1534-1536 及在 1994 年 9 月21日公开的英国专利出版物No. GB 2,276,169所述;以及得自这些分子的任何功能片段,如保留抗原结合性质的片段。术语抗原在本文中广泛地用于表示在体内激发免疫应答的任何物质,典型地是通过与抗体T细胞受体或者其它抗原结合抗体、T细胞受体或者其它抗原结合免疫系统分子 的结合。抗原典型具有一或多个表位。如本文所用,术语阵列通常是指离散位置的有序排列。蛋白质阵列典型是离散位置中蛋白质的有序排列。通常蛋白质阵列包含在表面上的一系列离散位置,在一或多个位置放置蛋白质。典型地,所述位置、特别是其中放置了蛋白质的那些位置,是在所述阵列中的已知部位,所述位置典型具有空间地址,如二维命名,在二维Cartesian坐标系中类似于x、y坐标。显然,阵列可以以任何希望的几何学制成,其它寻址方案可用于指出阵列中位置和/或蛋白质的独特部位。在实施方案中,阵列中的一些或所有蛋白质是已知蛋白质。本文所用术语DNA是指多脱氧核糖核苷酸,包括修饰形式的天然发生的DNA,如具有不常见碱基的DNA、掺入标志或者化学修饰的DNA。虽然本文关于DNA描述了一些实施例和实例,但是其它多核苷酸如RNA可以几乎相同方式使用。此外,当RNA被导入宿主细胞中时,其典型被转变为DNA,因此短语“通过外源DNA表达”包括得自导入RNA的表达。如本文所用,DDK是指肽标签,商业上称作FLAG。术语DDK和FLAG在本文可互换使用。表位是抗原的由抗体识别(结合)的单独的特异性特征(如结构特征)。抗原包含一或多个表位。不同的抗体可以结合指定抗原上的相同或不同的表位。蛋白质抗原上的表位可以通过氨基酸序列的连续或不连续部分限定。如本文所用,重组蛋白质是指使用分子克隆技术产生的蛋白质,如通过外源多核苷酸如外源DNA表达的蛋白质。如本文别处更详细的论述,通过外源多核苷酸的蛋白质表达可以通过在宿主细胞中导入编码所述蛋白质的多核苷酸或者通过在宿主细胞中导入使得内源基因表达增加的多核苷酸而产生,如通过启动子激活,或者通过其它方法进行。如本文所用,特异性结合配偶体是指特异性结合靶的试剂(agent)。特异性结合是指所述试剂可以辨别靶与其它非靶物质,所述靶如抗原或者抗原内的表位。抗体特异于抗原,所述抗原是特异性结合配偶体的一个实例。特异性结合配偶体的含义是特异性的,其可用于在典型是非特异性结合的作用的背景噪音之上检测靶。例如,蛋白质的特异性结合配偶体可以检测特异性特征,如所述蛋白质的序列或者拓扑构象。特异性特征可例如是指定顺序的氨基酸或者指定的化学组分。例如,特异性结合蛋白质的抗体可以特异于蛋白质的一个短氨基酸序列,其可以特异于特定的氨基酸修饰,如酪氨酸的磷酸化(磷酸酪氨酸),或者其可特异于蛋白质中特定的碳水化合物构型(多糖结构),等等。支持物在本文广义是指提供其上可施加蛋白质以形成阵列的表面的结构。典型地,支持物是固体并且是产生阵列及使用阵列所必需的结构稳定的支持物。支持物可具有一或多种成分,如固体的载玻片及在阵列中固定蛋白质的硝化纤维“垫”。IV附图
和表简述表I是不出根据本文描述的本发明的各个实施方案产生阵列的一般方法的不意图。图I是示出模块阵列布局的示意图,子阵列的放大图阐明了一式两份样品和对照 物的布局。图2示出在Schott硝化纤维包被的载玻片支持物上一式两份点印的3720个裂解物(共7500个斑点)的蛋白质阵列。(A)示出在用胶体金染色后的阵列,以观测总蛋白质。(B)示出在抗-FLAG抗体免疫染色后的阵列,以观测每种裂解物中通过外源DNA表达的蛋白质。图3是用于在细胞中通过外源DNA表达蛋白质的pCMV6_entry表达载体的示意图。该图示出载体的主要功能性,包括在真核细胞中强力转录的CMV启动子,用于在真核细胞中复制的SV40复制起点,DDK-myc标签编码区,具有多克隆限制位点的区域,赋予分别在原生生物和真核生物中的抗生素抗性的卡那霉素/新霉素抗性基因,用于在真核生物中转录体的聚腺苷酸化的聚腺苷酸化信号,以及用于在原核生物中DNA复制的fi细菌复制起点。图4示出鉴定的抗_p53抗体与点印在Schott硝化纤维包被的载玻片支持物上的3720个裂解物的蛋白质阵列的结合特异性。(A)示出在用抗FLAG抗体免疫染色后的阵列,以观测每种裂解物中通过外源DNA表达的蛋白质。(B)示出在用抗_p53抗体免疫染色后的阵列。有一个阳性裂解物,以箭头示出。检测到无交叉反应。(C)示出含有结合p53抗体的斑点的一部分阵列的放大图。(C)中上图示出该放大图中的抗-FLAG免疫染色,包括对照蛋白质的系列稀释。(C)中下图示出一式两份的斑点结合p53抗体的反应(用箭头示出)。图5例证了蛋白质阵列解码通过全细胞免疫产生的单克隆抗体的应用。(A)示出用单克隆抗体对所述阵列进行的免疫染色。阳性信号以虚线框和箭头表示。插图示出高放大倍数的阳性区域,以箭头表示一式两份的E-钙粘着蛋白I (E-Cadhedrin I)阳性信号。(B)示出Western印迹分析结果,证实所述单克隆抗体对于E-I丐粘着蛋白I的特异性。图6例证了使用蛋白质裂解物阵列鉴别乳腺癌的生物标志。左侧图示出用来自乳腺癌患者的血清对阵列进行免疫染色的结果。阳性反应区域在虚线框内,用箭头表示,示出放大区域A、B和C的放大图。右侧图示出用正常的对照血清进行的对照免疫染色。放大的区域A、B和C相应于左侧图示出的放大的区域A、B和C。所述对照血清在由乳腺癌患者血清免疫染色的位置未免疫染色,但是在C中在所述阵列的不同位置可见对照血清中的自身抗体的反应。表2是使用从裂解物中纯化的蛋白质产生阵列的实施方案示意图。在实施方案中,所述蛋白质用DDK表位加标签,通过使用抗-DDK抗体免疫亲和性纯化。图7示出从10个随机选择的全细胞裂解物中通过使用抗-DDK抗体高产量免疫亲和性纯化而纯化的10个myc-FLAG(DDK)标签的蛋白质的SDS-PAGE均质性。表3是使用在支持物上原位蛋白质纯化产生阵列的实施方案示意图。图8是使用在支持物上纯化步骤产生阵列的实施方案示意图,其中FLAG-标签的蛋白质固定在抗-FLAG包被的支持物上,洗去其它蛋白质,产生纯化的蛋白质阵列。图9示出在抗-FLAG抗体包被的硝化纤维支持物上从裂解物中在支持物上免疫亲和性纯化FLAG标签的蛋白质。(A)示出在抗-FLAG抗体包被的支持物上产生的阵列的一小部分。(B)示出未使用抗-FLAG抗体包被产生的匹配阵列的一小部分。在(A)和(B)中,上方插图示出用抗-myc抗体免疫染色,以观测这部分阵列中点印的myc,下方插图示出用抗 ^肌动蛋白抗体的免疫染色,示出不包含FLAG标签的蛋白质的(非特异性)结合。表I培养宿主细胞——> 将外源DNA引入细胞——> 对通过外源DNA表达蛋白的细胞进行克隆繁殖(每个克隆群体通过外源DNA表达一种蛋白)—— >制备每个细胞群体的裂解物(每种裂解物含有一种通过外源DNA表达的蛋白)—— > 将裂解物点样至支持物以制作阵列。表2培养宿主细胞——> 将外源DNA引入细胞——> 对通过外源DNA表达蛋白的细胞进行克隆繁殖(每个克隆群体通过外源DNA表达一种蛋白)—— >制备每个细胞群体的裂
解物(每种裂解物含有一种通过外源DNA表达的蛋白)-> 将通过外源DNA表达的蛋白
纯化——>将纯化的蛋白点样至支持物。表3培养宿主细胞——> 将外源DNA引入细胞——> 对通过外源DNA表达蛋白的细胞进行克隆繁殖(每个克隆群体通过外源DNA表达一种蛋白)一>制备每个细胞群体的裂解物(每种裂解物含有一种通过外源DNA表达的蛋白)——>将纯化的蛋白点样至支持物——>去除未附着的蛋白。V本文描述的实施方案提供了蛋白质阵列、产生蛋白质阵列的方法、使用蛋白质阵列的方法以及掺入蛋白质阵列的装置。在某些实施方案中,提供了确定蛋白质-蛋白质相互作用、证实抗体特异性及鉴别交叉反应种类、解码(decode)抗体特异性、鉴别生物标志、诊断疾病及分层患者群等的方法。如在本文实施方案中进一步例证,阵列中的蛋白质包含于细胞裂解物中。在实施方案中,裂解物是从在其中通过外源DNA表达蛋白质的细胞中制备的。在实施方案中,裂解物是从通过外源DNA过表达蛋白质的细胞中制备的。在实施方案中,包含不同的过表达的蛋白质的裂解物被施加于阵列中特定位置,由此蛋白质的身份通过其在阵列中的位置获知。在各个实施方案中,过表达的蛋白质的结构和/或功能可以是已知的或者可以是未知的。在实施方案中,外源DNA激活内源基因的过表达。在实施方案中,外源DNA编码蛋白质。在实施方案中,外源DNA包含cDNA及使得所述cDNA编码的蛋白质过量产生。在实施方案中,所述细胞是哺乳动物细胞。在实施方案中,所述细胞是人细胞。在实施方案中,所述蛋白质是哺乳动物蛋白质。在实施方案中,所述蛋白质是人蛋白质。在实施方案中,阵列包含指定数量的基因。在实施方案中,阵列包含由基因组如人基因组编码的蛋白质的指定部分。在实施方案中,蛋白质在固定之前自裂解物中纯化。在实施方案中,蛋白质是包含亲和性标签的融合蛋白,并且通过免疫亲和性纯化方法被纯化,然后固定在阵列中。在实施方案中,蛋白质包含FLAG亲和性标签,并且通过使用抗-FLAG抗体的免疫亲和性而被纯化。在实施方案中,蛋白质在应用后通过结合亲和性试剂包被的支持物而在原位纯化自裂解物。在实施方案中,蛋白质是融合蛋白,其包含结合亲和性试剂的亲和性标签,所述蛋白质通过亲和性标签与亲和性试剂之间的相互作用而特异性结合用所述亲和性试剂包被的支持物,裂解物中的未结合的蛋白质从支持物中除去。在实施方案中,所述亲和性标签是FLAG标签,所述亲和性试剂是抗-FLAG抗体。在实施方案中,蛋白质阵列用于确定蛋白质-蛋白质之间相互作用。在实施方案中,阵列用于鉴别、确定和/或量化蛋白质特异性结合和/或与其交叉反应的蛋白质。
在实施方案中,蛋白质阵列用于确定抗体的特异性和/或交叉反应性,所述抗体包括多克隆抗体和单克隆抗体及抗体衍生物。在实施方案中,阵列用于解码抗体,即鉴别抗体结合的蛋白质,如特别是当所述蛋白质是未知的情况中。在实施方案中,蛋白质阵列用于确定自身免疫血清中抗体结合的蛋白质。在实施方案中,所述自身免疫疾病是狼疮、RA或MS中的任一或多种疾病。在实施方案中,蛋白质阵列用于鉴别健康和/或疾病的自身免疫标志。在实施方案中,蛋白质阵列用于确定健康和/或疾病的自身免疫标志。在实施方案中,所述自身免疫标志是自身免疫疾病或癌症的标志。在实施方案中,所述自身免疫疾病是狼疮、RA或MS中的任一或多种疾病。在实施方案中,蛋白质阵列用于确定非蛋白质物质与蛋白质的结合。在实施方案中,蛋白质阵列用于鉴别非蛋白质物质的蛋白质结合配体。阵列产牛方法在实施方案中,阵列是通过对于一群蛋白质的每种蛋白质制备包含所述蛋白质的细胞裂解物并将所述裂解物施加于支持物上一个位置而形成,其中每种蛋白质的裂解物被施加于不同位置,所述裂解物的施加形成在支持物上的蛋白质阵列,并且蛋白质通过外源DNA在用于制备裂解物的细胞中表达。图I示出了根据本发明的实施方案从细胞裂解物中产生阵列的一般方案。图I示出了根据表I所述实施方案的一般方法产生的二维蛋白质阵列。表2示出了根据一个实施方案产生阵列的方法,其中蛋白质在形成阵列之前从裂解物中纯化。表3示出了根据一个实施方案产生阵列的方法,其中蛋白质在形成所述阵列后通过原位亲和性方法纯化。在本文描述的本发明的各方面中,实施方案涉及涵盖由生物体基因组中基因表达的蛋白质的大部分(substantial fraction)。在某些实施方案中,另外涉及这样的阵列,其中蛋白质在施加于所述支持物之前在宿主细胞中通过外源DNA过表达。某些进一步的实施方案涉及这样的阵列,其中所述阵列中蛋白质的浓度高于在其表达于其中的宿主细胞中的浓度,在实施方案中涉及这样的阵列,其中所述阵列中蛋白质浓度高于在其通过外源DNA表达于其中的宿主细胞中浓度。如本文例证,在实施方案中,产生阵列的方法可应用任何合适的方法以在细胞中通过外源DNA(或者其它多核苷酸)表达蛋白质,使细胞裂解并将裂解物(或者纯化自其中的蛋白质)施加于支持物,以形成阵列。根据各个举例的实施方案的表达蛋白质、产生裂解物及将所述裂解物(或者纯化的蛋白质)施加于支持物以形成阵列的方法在下文更详细描述,并在实施例中进一步例证。形成阵列的蛋白质在本文描述的本发明的实施方案中,形成阵列的蛋白质是在宿主细胞中通过外源多核苷酸、通常是DNA而获得的。在实施方案中,所述宿主细胞是真核细胞。在实施方案中,所述细胞是哺乳动物细胞。在实施方案中,所述细胞是人细胞,如在本文别处进一步论述。在实施方案中,在宿主细胞中表达蛋白质的多核苷酸如DNA是文库成员。关于这点,术语文库是指多核苷酸如DNA的集合或者一组DNA。在实施方案中,文库可包含指定数目的独特基因座、基因、蛋白质编码基因或者区域、开放读框或者基因组等,如哺乳动物基因组,如小鼠、大鼠、山羊、绵羊、猪、牛、马、猴、大猩猩或者人基因组。在这点上,“座”或“基因座”是指染色体上独立(distinct)位置。基因座通过核 苷酸序列与基因组内指定染色体区域包括可被一起剪接的所有可能的外显子而精确作图。由于可变外显子用途和/或不同的剪接,一个以上的转录体可源自一个基因组座。因此,每个独特的基因座可以由多个表达克隆表示,每个克隆均含有源自相同的独特基因座的不同转录体的多核苷酸。如本文所用,包含基因座的蛋白质是指相应于基因座的蛋白质,在此其被编码。在人基因座中的基因、蛋白质编码基因、独特的基因座等的总数是不断进行研究的主题。例如,见Nature 431,931-945(21 October 2004)及描述人基因数目的其它文章所述。NCBI存放了来自人基因组的广泛的、综合的、非冗余的系列核苷酸序列,在本文称作参考序列集合(RefSeq)。所述集合是精心整理(curated)及持续更新的,在例如 Pruitt KD, Katz KS, Sicotte H, Maglott DR, Trends Genet.2000 Jan;16 (I):44-47、Pruitt KD,Maglott DR, Nucleic Acids Res 2001 Jan I;29 (I):137-140、The NCBIhandbook[Internet].Bethesda(MD): National Library of Medicine(US), NationalCenter for Biotechnology Information, 2002 Oct. Chapter 17, The ReferenceSequence (RefSeq) Project (available via http: //ncbi. nlm. nih. rov/entrez)中描述。表达蛋白质的多核苷酸的序列以及基因座和基因的数目可以位于RefSeq及其它数据库,如 GenBank、SwissProt、GenSeq、EMBL> UniProt、ASD、IMGT> IPD、IPI。在实施方案中,这种文库包含基因组中大部分独特基因座,如基因组如人基因组中至少 5、10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、97、99%(及在此之间的数值)的独特基因座。在实施方案中,这种文库可包含基因组中大部分基因,如基因组如人基因组中至少 20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、97、99% 或更多(及在此之间的数值)的基因。在实施方案中,这种文库可包含基因组中大部分的基因,如基因组如人基因组中至少 5、10、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、97、99%或更多(及在此之间的数值)的蛋白质编码基因。在实施方案中,这种文库包含特定数目的独特基因座、基因、蛋白质编码区、开放读框等的多核苷酸如 DNA,如至少 5,000、6,000、7,000、8,000、9,· 000、10,000、11,000、12,000,13, 000,14, 000,15, 000,16, 000,17,000,18,000,19,000,20,000,21,000,22,000、24,000,26, 000,28, 000,30, 000,35, 000,40, 000个基因座、基因、蛋白质编码基因、开放读框等。子阵列在实施方案中,蛋白质阵列基于特定的一般蛋白质特征被组织成子阵列,如功能或结构特征,当蛋白质在细胞周期期间或者在发育期间表达时,或者在其在生物体中表达的情况中,或者在其位于细胞中的情况中,其对指定代谢途径的参与,其与疾病的关系等。在实施方案中,阵列和/或子阵列可以集合通过参与特定疾病而相关的蛋白质。在实施方案中,阵列和/或子阵列可以集合蛋白质,如跨膜(质膜)蛋白质;G_蛋白偶联受 体;G蛋白偶联受体,非嗅觉的(non-olfactory) ;G_蛋白偶联受体,嗅觉的;激素受体;类固醇激素受体;神经递质受体;酶;激酶;胞质蛋白;细胞器蛋白,核蛋白;核膜蛋白;内质网;线粒体;溶酶体酶;细胞骨架;免疫系统;组织类型蛋白质(例如乳腺、前列腺、脑、心脏等);离子通道蛋白;核激素受体,细胞色素P450 ;磷酸酶;蛋白酶;磷酸二酯酶;蛋白质运输;ATP-结合盒(ANC);细胞因子;同源框和HOX基因;整联蛋白;转运蛋白;DexH/D蛋白质家族(RNA代谢)等。通讨外源DNA产牛蛋白质在实施方案中,蛋白质在从中产生裂解物的细胞中通过外源DNA表达,即细胞中蛋白质的量-及因此在裂解物中的量-主要由外源DNA产生。在实施方案中,蛋白质在细胞中通过外源DNA过表达,其是指所述蛋白质在细胞中以超过在不存在外源DNA及其作用的条件下产生的量而产生。在实施方案中,蛋白质是在细胞中内源产生的,但是其通过外源DNA由所述细胞产生明显更高的水平。在实施方案中,蛋白质通过外源DNA过量产生,所述量明显超过在不存在所述外源DNA的条件下的量。在实施方案中,所产生的蛋白质的量是在无外源DNA的细胞中产生的量的至少I. 2,1. 5,2. 0,2. 5,3. 0,3. 5,4. 0,4. 5,5. 0,6. O、7.0,8.0,9.0、10、25、50、75、100、150、200、250、300、400、500、750、1,000,2, 000,3, 000、5,000,7, 500、10,000 或更多倍。表汰蛋白质的外源DNA外源DNA是指在基因组天然环境(setting)中非天然存在的DNA,即不是在其未改变的内源环境中的未改变的内源基因。典型地,外源DNA是通过熟知的重组DNA技术导入细胞中的DNA。通常外源DNA编码表达的蛋白质,以其天然形式、作为突变蛋白或者融合蛋白形式表达。在实施方案中,在这点上,外源DNA以表达载体或构建体形式被导入细胞中,如下文更详细论述。外源DNA也可以是不编码过表达的蛋白质的激活物DNA,如通过非同源重组起作用的RAGE构建体。其可以是仅包含表达的蛋白质的基因的一部分的激活物DNA,如通过同源重组激活基因的构建体。其可以是编码蛋白质的构建体,如表达构建体,在这种情况中所述编码区可以是未中断的或者中断的。其可以是其它外源DNA,使得在细胞中产生希望量的一或多种阵列蛋白质。表汰载体在实施方案中,阵列中的蛋白质是在细胞中通过外源DNA表达,所述外源DNA是表达载体(也称作表达构建体),其编码所述蛋白质及其中所述蛋白质的编码序列与表达控制序列(也称作顺式作用控制序列)可操纵地连接,以进行希望的转录及最终在宿主细胞中产生所述蛋白质。在实施方案中,表达载体自主复制,如在细胞中作为附加体元件存在的那些载体。在实施方案中,表达载体整合进宿主细胞DNA中,如与宿主细胞DNA —起复制的那些载体。任何合适的表达控制序列均可用于在细胞中产生蛋白质。这种表达控制序列包括但不限于启动子、增强子、核糖体作用位点如核糖体结合位点、聚腺苷酸化位点、转录剪接序列、转录终止序列、稳定mRNA的序列及对于在宿主细胞中通过外源DNA产生蛋白质起致使、调节、促进、增加和/或实现希望的作用的其它序列。可以根据宿主相容性、可诱导的表达、高mRNA拷贝数及其它希望的结果而选择这种控制序列。在实施方案中,关于这点对于细菌宿主可使用的启动子包括trp、lac、tac或T7启动子,对于酵母是alpha因子、醇氧化酶或者PGH启动子,以及对于真核细胞如哺乳动物细胞是MMTV、SV40、CMV和RSV “启动子”。在本发明某些实施方案中可使用的表达载体例如是pCMV6_entry,其在图3中示出。将外源DNA导入细朐中
任何合适的系统或者方法均可用于将DNA或其它多核苷酸导入细胞中,以表达产 生本发明实施方案中所述阵列的蛋白质。关于这方面,有许多可以使用的熟知方法导入DNA及其它多核苷酸,如在下文列出的参考文献中描述的那些方法。在参考文献及别处描述的合适方法中,可用于本文所述本发明实施方案中的是磷酸钙沉淀、电穿孔、注射、DEAE-葡聚糖介导的转染、与脂质体融合、与增强其被吸收进细胞中的试剂结合以及百度转导等方法。可以使用将DNA及其它多核苷酸导入细胞中的方法,其中在进入细胞之后,所述DNA (或者其它多核苷酸)存在于染色体外或者整合进宿主细胞染色体中。根据熟知的方法,所述DNA或其它多核苷酸可以被瞬时、组成型和/或可诱导地表达。在导入细胞中的多核苷酸不是DNA的情况中,通常是这样的情况,即其被拷贝成DNA,该DNA最终是表达感兴趣的蛋白质的模板。MM如上所述,表达感兴趣的蛋白质的细胞可以通过如下方式产生将外源DNA(或者其它多核苷酸)导入宿主细胞中,选择已经接受所述DNA的细胞,使所述细胞克隆增殖,证实其表达感兴趣的蛋白质,然后贮存和/或进一步扩增所述细胞以产生足够的细胞群,用以产生足以产生希望的阵列的裂解物。合适的方法为本领域熟知及常规使用,例如在下文列出的关于分子克隆的参考文献中所述方法。在实施方案中,产生阵列的蛋白质可以在任何合适细胞类型中产生,例如但不限于原核细胞或者真核细胞,包括细菌、植物或者动物细胞、酵母或哺乳动物细胞,以及人细胞,如 COS、CVU BHK, CHO、HeLa, LTK、NIH 3T3、293,及 ΗΕΚ293,如 ΗΕΚ293Τ 细胞。裂解物裂解物可以通过使用任何合适的方法从细胞中产生。在实施方案中,裂解方法保留了所述蛋白质的希望的结构和/或功能特征。许多这样的方法为本领域技术人员熟知。例如,裂解物可以通过使用无洗漆剂(detergentless)的缓冲液及具有洗漆剂的缓冲液产生,所述缓冲液如包括RIPA缓冲液、含有SDS的裂解缓冲液、低渗裂解缓冲液等,裂解细胞的方法为本领域熟知,包括但不限于洗涤剂裂解、超声裂解及在压力(French Press)下裂解等。在实施方案中,阵列中至少20、30、40、50、60、70、80、90、95或100%的裂解物中每种裂解物中蛋白质的浓度是至少 1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800or 900 微克 /ml、1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800 或 900mg/ml,或者 I、2、3、4 或 5gm/ml。在实施方案中,在阵列的至少20、30、40、50、60、70、80、90、95或100%裂解物中通过重组DNA表达的蛋白质的浓度是裂解物中总蛋白质的至少O. 01,0. 05,0. 10,0. 20,0. 50、
0.75,1. 00,2. 00,3. 00,4. 00,5. 00,10. 0,15. 0,20. 0%。在实施方案中,裂解物浓度是O. 2_4mg/ml,通过外源DNA表达的蛋白质是总蛋白质的 O. 1-2%。在实施方案中,其中重组蛋白质在施加于阵列之前被纯化,对于施加于阵列的至少20、30、40、50、60、70、80、90、95或100%蛋白质而言,施加缓冲液中的重组蛋白质浓度是
1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800或者900 μ g/ml,1、2、3、5、10、15、20、25、35、50、100、150、200、250、300、350、400、450、500、600、700、800 或者 900mg/ml,或者 I、2、3、4 或 5gm/ml。支持物阵列可以在任何合适支持物上产生,可以在一部分中或在几部分中。在实施方案中,固体支持物可以是不溶基质的任何材料,并且可具有刚性或半刚性表面。在实施方案中,支持物是膜,如硝化纤维、尼龙等,以及适合作为支持物施加蛋白质产生阵列的其它膜材料。这种膜支持物可以是独立的(free standing)或者可以是自身被支持的,如在载玻片上的硝化纤维膜。在实施方案中,支持物可以是玻璃,如载玻片,硅,包括在集成电路和MEM装置中的元件表面,及塑料,包括塑料平板,如微滴定平板,包括例如96孔、384孔微滴定平板,以及其它容量的那些。举例的固体支持物包括但不限于基材(substrates),如硝化纤维(例如在载玻片上的膜或者微滴定孔形式),聚氯乙烯(例如玻璃上或微滴定孔内的片材),聚苯乙烯胶乳(例如玻璃上或微滴定平板中的珠),聚偏氟乙烯,重氮感光纸,尼龙膜,活性珠,磁性反应珠等。特别的支持物包括平板、小珠、圆盘、毛细管、中空纤维、针(needles)、插针(pins)、固体纤维、纤维素珠、多孔玻璃珠、硅胶、任选与二乙烯基苯交联的聚苯乙烯珠,嫁接的共聚合株(grafted co-poly bead),聚丙烯酰胺珠,乳胶珠,任选与N_N’ -二-丙烯酰乙二胺交联的二甲基丙烯酰胺珠,以及用疏水性聚合物包被的玻璃颗粒。在实施方案中,蛋白质通过共价和/或非共价结合附着于支持物。在实施方案中,蛋白质可以未修饰形式附着,或者其可以被修饰为便于附着或者便于在附着后除去或者这二者。在实施方案中,蛋白质可以被修饰为便于或者使得可以与如下材料附着玻璃、聚赖氨酸、聚苯乙烯、聚丙烯酸酯、聚酰亚胺、聚丙烯酰胺、聚乙烯、聚氯乙烯、聚二乙炔、聚苯乙炔(polyphenylene-vinylene)、多肽、多聚糖、聚砜、聚卩比咯、聚咪唑、聚噻吩、聚醚、epoxies、二氧化硅玻璃、硅胶、硅氧烷、多磷酸酯、水凝胶、琼脂糖、纤维素,和/或其它支持物,包膜或薄膜。在这些中是用硝化纤维包被的载玻片,如Schott Nexterion硝化纤维玻片。裂解物施加于支持物
蛋白质,如在裂解物中通过外源基因表达的那些蛋白质,可以多种方式施加于阵列中。在实施方案中,使用微阵列打印机(microarray printer)施加。微阵列打印机根据其打印尖端结构和点印样品机制而可以分成三类quill pins(split pins)、piezoelectric (喷墨)点样仪(spotters),及固体针(solid pins) (Barbulovic-Nad etal.,2006)。由Aushon开发的固体针式阵列仪(solid pin arrayer)特别设计用于印刷复杂混合物,如细胞裂解物,并且它能良好使用粘性蛋白质溶液在玻片上产生均匀斑点(Spurrier et al.,2008)。使用这种点样仪的均匀性非常好,如图2A所示,其示出用胶体金染色的一个阵列。斑点中的总蛋白质在整个阵列上是均匀的,并且每个亚阵列中的浓度系列显示出合适的缩放(scaling),其类似地在整个阵列上也是均匀的。阵列几何学与斑点密度阵列可以多种形式、大小、模块性制成,且其可以具有多种位置、蛋白质、特征、特征大小、特征空间、特征占有率、对照物、排列标志和参考等。在实施方案中,在阵列中每cm2具有至少10、25、50、75、100、150、200、250、350、500、750、1,000,2, 000,3, 000,4, 000,5, 000,6, 000,7, 500,10, 000,15, 000 或 20,000 个位 置。在实施方案中,在阵列上不同位置每cm2施加至少10、25、50、75、100、150、200、250、350、500、750、1,000,2,000,3,000,4,000,5,000,6,000,7,500,10,000,15,000 或20, 000个裂解物。在实施方案中,在阵列上施加于不同位置的每cm2具有至少10、25、50、75、100、150、200、250、350、500、750、1,000,2, 000,3, 000,4,000,5,000,6,000,7,500,10,000、15,000或20,000个通过外源DNA表达的蛋白质。在实施方案中,在阵列上每cm2具有至少10、25、50、75、100、150、200、250、350、500、750、1,000,2, 000,3, 000,4, 000,5, 000,6, 000,7, 500,10, 000,15, 000 或 20,000 个位置,所述蛋白质施加于所述位置的至少50、60、70、80、90或95%的位置。在实施方案中,裂解物和/或蛋白质施加于斑点(特征)中,其直径为10-50、25-75、50-100、75-150 100-200、150-250、200-300、250-350、300-400、400-500、500_750、400-800,750-1, 000 μ m。在实施方案中,阵列中包含裂解物或蛋白质的特征的面积是10-50、25_75、50-100、75-150 100-200、150-250、200-300、250-350、300-400、400-500、500-750、400-800,750-1, 250、1,000-2,000、1,500-3,000,2, 500-5,000 μ m2。在实施方案中,阵列中特征(斑点)的中心至中心间距是5-15、10-20、15_25、20-40、25-50、25-75、50-100、75-150、100-150、125-175、150-225、200-250、225-275、250-350,300-400 或 400-500um。在实施方案中,蛋白质斑点大小的直径是110-300 μ m。在实施方案中,阵列上位置和/或蛋白质的中心至中心的间距是150-250 μ m。使用阵列检测结合情况任何合适的方法均可用于检测和/或测量某些物质与蛋白质阵列中蛋白质的结合情况。在实施方案中,使用固相测定法。在实施方案中,使用夹心测定法。在实施方案中,使用基于放射性、比色、化学发光和/或荧光测定的方法。在某些实施方案中,关于抗体结合测定,可使用例如任何合适的免疫测定,包括如RIA (放射免疫测定)、ELISA (酶联免疫吸附测定)、EIA(酶-免疫测定)、免疫荧光测定,以及免疫沉淀测定等。在实施方案中,使用直接标记(labeling)方法,其中所述物质被直接标记,其与阵列中蛋白质的结合通过检测和/或测量直接结合的标记而确定。在实施方案中,使用间接标记方法,其中所述物质的结合通过不是所述物质一部分的检测部分与不是所述阵列上蛋白质的一部分的相互作用而检测。例如,在间接ELISA结合中,抗体与阵列中的蛋白质的结合通过与第一抗体结合的标记的第二抗体检测。可用于实施方案中的比色、放射性测定和荧光测定检测标记包括但不限于若丹明(rhodamine)或其衍生物,生物素,抗生物素蛋白,链霉抗生物素蛋白,荧光化合物,如 Cy3、Cy5、Alexa-555、Alexa-647、Dylight-549 或 Dylight_649a,化学发光化合物,如_■甲基Rf唳酷等。在实施方案中,酶-免疫测定可用于进行检测。本领域熟知许多这种测定且常规使用,其可易于应用于蛋白质阵列,如在Voller, A.,“The Enzyme LinkedImmunosorbent Assay(ELISA),,,1978,Diagnostic Horizons 2,1-7,MicrobiologicalAssociates Quarterly Publication, Walkersvilie, Md. ;Voller, A. et al.,1978, J.Clin. Pathol. 31, 507-520; Butler, J. E. , 1981, Meth. EnzymoI. 73, 482-523 及 Maggio, E.(ed. ), 1980, Enzyme Immunoassay, CRC Press, Boca Raton, Fla.中所描述。
ELISA利用酶反应从生色或发荧光的底物中产生生色产物(吸光性)或荧光产物,或者从化学发光底物中发光。可以使用一或多种酶。在简便的实施中,将作用于生色底物的酶与抗体缀合。将缀合物与例如固定在微滴定平板孔中的蛋白质一起保温。在保温之后,洗去未与阵列中的蛋白质结合的缀合物。将产生信号的底物如生色底物加入孔中,保温一段时间使得任何酶缀合物均与微滴定平板孔中的蛋白质充分结合,以产生生色产物。在线性反应方案中,生色的量与结合的缀合物的量成比例。对于蛋白质阵列而言,反应产物通常沉淀在所述表面上或者与所述表面结合,由此其不从抗体结合的位置扩散。酶反应的使用大大放大了来自每个结合事件的信号。ELISA可使用两或多种酶进行额外的扩增。本领域已知许多ELISA,且其可易于适应用于本文描述的蛋白质阵列。许多酶已经成功用于可用于本发明实施方案中的ELISA中,包括但不限于苹果酸脱氢酶,葡萄球菌核酸酶,S-5-类固醇异构酶,酵母醇脱氢酶,α-甘油磷酸酯脱氢酶,磷酸丙糖异构酶,辣根过氧化物酶,碱性磷酸酶,天冬酰胺酶,葡萄糖氧化酶,β -半乳糖苷酶,核糖核酸酶,脲酶,过氧化氢酶,葡萄糖-6-磷酸脱氢酶,葡糖淀粉酶及乙酰胆碱酯酶。这些酶(及其它酶)的任何合适底物和标记均可用于ELISA中,如丹不限于(如上所述)生色底物、荧光底物、生物发光底物和化学发光底物,这些底物分别产生生色产物、荧光产物和化学发光产物。也可以使用放射标记。可用于实施方案中的荧光标记包括但不限于如下标记异硫氰酸荧光素,若丹明,藻红蛋白,藻青蛋白,别藻蓝蛋白,邻苯二醛,及荧光胺。可用于实施方案中的化学发光标记包括但不限于鲁米诺(Iuminol),异鲁米诺,恒温(theromatic) Π丫唳酯,咪唑,B丫唳盐和草酸酯。可用于实施方案中的生物发光标记包括但不限于萤光素,荧光素酶和水母发光蛋白。可以使用任何合适的标记,前述标记只是其中已知的一些标记,在ELISA及其它结合测定中已经揭示和应用的更有效的标记在这方面可以是有效的。使用蛋白质阵列筛选结合配体可以鉴别与阵列中多肽(蛋白质)反应或者与其结合的任何类型的样品或物质(在本文称作试剂(agent))的相互作用,在实施方案中,阵列用于检测与阵列中蛋白质的结合,如样品(及其成分)或试剂的结合,如候选结合化合物或者抗体。关于这方面的举例的应用在下文描述。在实施方案中,所述试剂是阵列中蛋白质的特异性结合配偶体,如抗体、受体配体、适体、多肽及其它结合分子。所述试剂可以是修饰多肽的酶或者其它物质,如激酶(其使蛋白质磷酸化)。所述试剂可包含结合蛋白质(多肽)的任何物质或成分,包括但不限于化学化合物,生物分子如多肽(氨基酸),脂质,核酸(核苷酸及多核苷酸),以及碳水化合物,无机分子,有机分子等,单独或组合使用。使用蛋白质阵列鉴别抗体结合的蛋白质在实施方案中,本文描述的蛋白质治疗可用于筛选和鉴别抗体结合的蛋白质。由于抗体的特异性,其广泛用于诊断和治疗目的。由于现有测定方法的限制,与这些抗体相互作用的抗原还未完全已知。当抗体针对抗原而产生时,所得抗体通常根据其特异于所述抗原而鉴定。在蛋白质抗原的情况中,所述蛋白质典型包含各个抗体特异性结合的一或多个表位。蛋白质中的 表位不仅可以由蛋白质的连续部分组成,也可以由蛋白质的不连续部分组成,其折叠成接近于所述蛋白质的三维构象。抗体的结合特异性-如与蛋白质的结合特异性-可以并发与含有相同或相似表位的其它蛋白质的交叉反应。当抗体用于分析和治疗目的时,交叉反应性是个显著问题。有时因为定义表位的氨基酸序列在不同蛋白质中存在而产生这种交叉反应。其可以在相同的初级转录体的差异剪接的变体中存在,或者只是因为所述序列单独存在与两个蛋白质中而发生。交叉反应蛋白可以存在于相同细胞和组织类型中,及存在于不同类型中,如当存在组织特异性方式剪接变体时而存在。通常地,重要的是了解抗体用于检测测定如诊断测定或者在治疗中的特异性。对于许多目的而言,重要的是鉴定抗体与其特异性靶的相互作用及其交叉反应性。使用现有技术还未能容易地获得对抗体交叉反应性的总体了解,因为还没有任何方式以确定抗体与完整蛋白质组的相互作用。对于结合蛋白质配体的其它蛋白质(及非蛋白质试剂)的相互作用也如此。在本文所述实施方案中,蛋白质阵列可用于筛选与除了初级抗原之外的蛋白质交叉反应的抗体,特别是获得对与在指定基因组中编码的蛋白质的大部分的相互作用的了解。在这方面的实施方案中,本文描述的基因组范围阵列(genome wide array)特别有益。对于结合蛋白质的其它类型试剂也如此。使用蛋白质阵列鉴别疾病的生物标志在某些在实施方案中,本文描述的蛋白质阵列可用于检测由自身免疫疾病或者其它疾病如癌症产生的抗体。在自身免疫疾病中,对象产生针对自身抗原的免疫应答,这些抗体通常是疾病诊断和预后的有效标记。有时未知这些自身抗体的关连抗原,在这种情况的实施方案中,蛋白质阵列可用于确定这种结合蛋白质的自身抗体结合的蛋白质。在其它情况中,至少部分已知关连抗原,本文所述蛋白质阵列可用于确定、鉴定和/或测量所述自身抗体。在实施方案中,对于结合已知或未知蛋白质的抗体而言,本文所述蛋白质阵列可用于确定这种自身抗体的存在与否和/或其量。例如,在这点上,根据本发明的某些实施方案,来自如处于患有自身免疫疾病风险中或者实际患病的对象的抗血清、血液成分、体液和/或细胞(仅举几个例子)用于本文所述蛋白质阵列中,以确定其结合的靶抗原(蛋白质),和/或确定所述样品中结合所述阵列中特定蛋白质的自身抗体的存在与否和/或其量,以鉴定所述样品中的自身免疫抗体,及因此诊断所述对象是健康的、处于患病风险中或者实际疾病等。 相似地,在这点上,根据本发明的实施方案,可以将来自如处于患病风险或者实际患病的对象(所述疾病使得在不存在所述疾病的对象中通常未发现的抗体产生)的抗血清、血液成分、体液和/或细胞(仅举几个例子)用于本文所述蛋白质阵列中,以确定其结合的靶抗原(蛋白质),和/或确定所述样品中结合所述阵列中特定蛋白质的自身抗体的存在与否和/或其量,以鉴定所述样品中的所述抗体,及因此诊断所述对象是健康的、处于患病风险中或者实际疾病等。前文的描述和下文的实施例举例说明了本文揭示的本发明的一些实施方案。应意识到本领域技术人员通过本文教导将显而易见本发明的许多其它方面、特征和实施方案,这些均在本发明的范围内。 V如下实施例举例描述了本发明各个方面的蛋白质微阵列的实施方案及其少数应用。这些实施例不以任何方式限制本发明。实施例I:具有大约50%范围的人蛋白质基因的蛋白质微阵列本发明实施方案提供了具有基因组中所有蛋白质编码基因的大部分的阵列。国际人类基因组测序联合体(The International Human Genome Sequencing Consortium)估计在人基因组中有大约20,000-25, 000个蛋白质编码基因(Stein,2004),如下实施例例证了具有大约10,000-20, 000个斑点的蛋白质阵列的产生和应用,其来自大约3,500-10, 000个个体人类基因。如下所述,所述阵列使用OriGene公司的克隆进哺乳动物表达载体pCMV6-entry中的证实的人cDNA的文库产生。实施例2 :表达人蛋白质的pCMV-entry载体所述阵列的蛋白质是通过pCMV-entry表达载体表达的,如图3示出。所述载体具有一些特征,使其特别有效地在哺乳动物宿主细胞中过表达哺乳动物蛋白质,以产生蛋白质阵列。其包含有效实现在真核细胞中附加型复制的复制起点(SV40 Ori),及在细菌中的复制起点。其包含便于克隆及在哺乳动物细胞中有效表达的表达盒,包含CMV启动子、多克隆区域及聚腺苷酸化信号。所述表达盒还包含就在所述聚腺苷酸化信号上游的myc和DDK表位,以表达C末端myc-DDK标签蛋白。所述标签是检测和纯化重组表达的蛋白质的有效及便利组分。所述在包含位于多克隆区域上游的T7启动子,以在细菌宿主中(及在体外)有效转录。其包含另一种表达盒,以表达药物抗性标志以在哺乳动物和细菌宿主细胞中选择(分别卡那霉素和新霉素抗性基因)。其在标签的融合蛋白的CMV表达的3’区域中包含C末端myc和DDK标签序列。其也包含在细菌细胞中增殖的复制起源(FLAG是DDK的专有商品名)。实施例3 :过表汰裂解物使用克隆进pCMV-entry载体中的人cDNA以及在HEK293T细胞中的过表达已经产生了超过12,000个过表达的裂解物,它们已经通过抗-Flag免疫印迹分析证实。表达谱分析也示出在这个表达系统中存在合适的翻译后修饰。检测所有裂解物的表达谱并单独评注。图2示出8个随机选择的裂解物的表达谱。大多数重组蛋白质的表达水平比其内源counter-partner高至少100倍,如图2例证。这种过表达水平提供了相对于来自宿主细胞自身的背景极高的信号-噪音比。抗-Flag免疫印迹的总体成功比率是大约95%。实施例4 :将过表达裂解物印刷在硝化纤维玻片上将过表达的裂解物印刷在硝化纤维玻片上。图I示出总体布局和子阵列说明。如图所示,每个玻片均分成子阵列,典型为每个玻片40个子阵列。该图中的放大区域示出每个子阵列的布局。如图所示,每个子阵列含有如下对照物和标记纯化的BSA-cy3和BSA-cy5方向标记,纯化的小鼠和兔IgG (阳性对照),用空白pCMV-entry载体DNA转染的HEK293T细胞的裂解物(阴性对照物),纯化的GST-myc-Flag融合蛋白的参考稀释系列(以建立量化子阵列裂解物中外源重组蛋白质表达的参考浓度曲线)。来自GST-myc-FLAG浓度 系列的信号用于建立信号强度对应浓度的标准曲线,以确定mys-FLAG标签的蛋白质表达。在硝化纤维标准微阵列玻片上产生阵列,使用针式点样仪(pin spotter),特别是 Aushon 2470 array spotter。将 9· 000 个斑点(特征),2OO-3OO 皮升使用 110 μ m 针(pin)印刷于标准玻片上的21mmx51mm硝化纤维垫上。用85 μ m针(pin)印刷16,000个斑点。将如22,000个的150-200皮升的斑点使用85μπι针(pin)印刷于玻片上,略大于硝化纤维垫(21_X60mm)。与环境分析物理论一致,检测敏感性随着斑点大小降低而增加(Ekins,1989)。85 μ m斑点的信号一致性高于110 μ m斑点,而信号强度大致相同。关于阵列组建的详细信息在下文示出。玻片类型Schott NC玻片Aushon arrayer pin size 85um玻片NC 垫尺寸2 Imm X 60mm总子阵列:48 (4行X 12列)子阵列大小4200μ m X 4400 μ m 子阵列规格21行(水平)X 22列(垂直)斑点平均直径广150 μ m斑点中心至中心间距200 μ m子阵列之间距离200 μ m每个样品重复数2根据这些说明制成的玻片可包含22,176个特征(斑点),如一式两份的10,464个独特蛋白质斑点(如裂解物)及1,248个对照特征。将在含有1%ΝΡ-40的RIPA缓冲液中的裂解物使用固体针式点样仪点印于硝化纤维玻片上。可使用其它溶液用于印刷,如含有其它洗涤剂或者离液剂的那些溶液,如Chanet al. , 2004 and Nishizuka et al.,2003中所述那些溶液。从来源平板中直接点印裂解物,所有点印均在控制的环境中在70%相对湿度下进行,以使得蒸发对于样品浓度影响最小化。这样印刷大约9,000个斑点的阵列工作良好。对于较大的阵列,组建时间可以通过从几个来源平板代替一个、一系列或者平行点印而保持相同。为了进一步使早阵列组建期间蒸发对于浓度的影响最小化,可以将所述裂解物分布于一些来源平板中并平行点印,以便无一样品长时间暴露而产生不利影响。或者或另外可以在点印缓冲液中加入4%甘油(或者其它稳定剂和抗蒸发剂)。实施例5 :芯片质量评估蛋白质阵列的质量评估通过用胶体金染色评估总蛋白质及通过抗免疫染色评估重组蛋白质而进行。胶体金染色示出在阵列中全部蛋白质的斑点形态的高度均匀性,如图3A所示。用抗-FLAG抗体进行免疫染色示出FLAG-myc融合蛋白在所述阵列中的结合,如图3B和5A所示。抗-FLAG结合的量的变化反映出宿主细胞中融合蛋白表达的差异及因此在裂解物中浓度的差异。纯化的融合蛋白直接施加于所述阵列,作为参考标准以确定裂解物中融合蛋白的浓度。系列稀释在图I中所述阵列的放大区域中图示,所述系列稀释的均匀性在图4C的上右侧图中可见。实施例6 :使用裂解物阵列鉴别抗体特异性抗体特异性通常是分子生物学研究和治疗性抗体开发的关键,以及是抗体的诊断 和治疗性应用的关键特征。交叉反应性可导致生物学研究的假阳性结果及治疗性抗体治疗的副作用,如Tabrizi et al.,(2009)所述。本文揭示的本发明实施方案包括使用过表达裂解物微阵列以鉴别和确认抗体特异性,包括鉴别和/或鉴定抗体的最初特异性和交叉反应性。所述阵列进一步可用于研究、鉴别和确认其它蛋白质以及其它类型分子的结合特异性和交叉反应性。关于这方面举例说明,对先前鉴定的p53的多克隆抗体针对裂解物阵列进行筛选,所述裂解物阵列包含3700个以上过表达裂解物,包含3700个独特的myc-FLAG人融合蛋白。所述P53抗体与p53表达裂解物及HEK293T宿主细胞的内源p53均反应。来自过表达裂解物的信号高于来自背景HEK293T表达的信号。此外,所述抗体以明显高于背景的水平结合一些其它裂解物,但是低于与p53裂解物的结合。进一步检验示出在一些这样的裂解物中较高的P53信号是由于通过外源蛋白质表达而不是外源蛋白质与抗-P53抗体的交叉反应性的刺激p53表达所致。使用小鼠单克隆抗-P53抗体获得相似结果。在图4中例证的结果示出过表达裂解物阵列可用于研究蛋白质相互作用特异性和交叉反应性,及确定过表达大数目蛋白质(单独和/或彼此配合)对于其它蛋白质特别如内源蛋白质表达的影响。实施例7 :解码通过全细胞免疫方法产牛的单克降抗体全细胞免疫方法可用于产生单克隆抗体,如高特异性单克隆抗体以进行生物标志测定和癌症治疗。然而,全细胞免疫方法的更广阔的用途受到难以确定最初获得的单克隆抗体的靶的限制。通常这项工作非常昂贵及需要花费几年的时间。在实施方案中,过表达裂解物微阵列可用于快速确定蛋白质结合剂的蛋白质结合靶,如通过全细胞免疫技术产生的单克隆抗体的细胞蛋白质结合特异性。确定结合特异性或者结合配体如抗体的特异性在本文被称作解码。关于这方面的实施方案通过鉴别可商购的抗-E-钙粘着蛋白抗体的靶而例证,其最初通过用MCF-7乳腺癌细胞免疫小鼠而获得(Shimoyama et al.,1989)。免疫染色数据示出所述靶在3700个不同基因中格外突出(图5A)。该结论通过western印迹分析得以进一步支持(图5B)。
实施例8 :肿瘤牛物标志福示许多蛋白质作为疾病指示剂和替代物终点(indicator and surrogate endpoint)以开发治疗剂。由癌症患者针对肿瘤产生的自身抗体代表一类蛋白质,其可以检验有价值的疾病诊断和预后指示剂。这种蛋白质代表的可能性还未证实,部分是因为在人血清中鉴定自身抗体的难度所致。已经开发了多种方法以希望克服这个困难,如SEREX方法(通过重组表达克隆血清学鉴别抗原)和SERPA方法(血清学蛋白质组分析)(Gunawardana andDiamandis,2007),但是这些方法均具有明显缺点。SEREX可提供广泛覆盖每个克隆的清晰注释,但是其基于原核cDNA表达文库筛选。结果,用于筛选的重组蛋白质不具有任何翻译后修饰。此外,这种技术使得难以在发现阶段研究大量患者血清样品。SERPA通过免疫印迹和MS鉴别自身抗体靶。实际上,含有自身抗体的血清用作探针以检测进行2-D IEF/SDS PAGE的人组织裂解物中的关连抗原。然后通过质谱分析法鉴 别凝胶中结合所述血清中自身抗体的蛋白质抗原。这种技术将蛋白质置于严格变性条件,及具有检测不敏感性和不可再现性的限制。此外,这种方法难以从有限的数据中鉴别抗原,这种技术提供的IEP、大小和质谱典型地受参与进行western印迹和检测步骤的其它蛋白质的污染。本文的实施方案描述了克服了如SEREX和SERPA等方法在鉴别和鉴定自身抗体的蛋白质抗原中的限制。在实施方案中,所述蛋白质阵列具有对每个基因的清晰注释,由此获知在阵列中的每个位置的蛋白质。此外,在实施方案中,所述阵列中的蛋白质在HEK293T表达系统中产生及被充分翻译后加工。这些实施方案通过在乳腺癌患者中鉴别自身抗体而例证。将微阵列玻片与来自乳腺癌患者的血清或者与来自年龄相近的健康对象的血清一起保温,然后进行免疫染色以观测在患者血清中自身抗体结合微阵列中蛋白质。该结果表明不同人血清的独特的自身抗体免疫反应模式,如图6例证。实施例9 :纯化的蛋白质阵列-一步免疫纯化先前的研究已经示出抗-Flag免疫亲和性纯化技术可用于在自然条件下从过表达裂解物中分离Flag-标签的多亚基蛋白质复合物(Chiang et al. , 1993;Gloeckner etal.,2009)。我们应用这种方法使用pCMV6-entry载体分离在HEK2093T细胞中表达的FLAG-myc标签的蛋白质。该一般方法在表2和3中描述,10个随机选择的裂解物的结果在图7中示出。所述方法可与任何表位标签一起使用,所述标签包括但不限于His、myc、FLAG、V5、GST、T7、HSV, VSV_g、Glu-Glu、HA、E-标签等。实施例10 :在芯片上(On Chip)纯化在芯片上纯化可用于产生微阵列,如本文所述。使用在芯片上纯化产生蛋白质阵列的一般方案在表3和图8中描述。这个实施例描述了具有10,464个纯化的人重组蛋白质的蛋白质阵列的产生,使用DDK表位和抗-DDK抗体纯化(FLAG表位和抗-FLAG抗体)。Flag是一种高度免疫原性肽。Flag表位标签与抗-Flag抗体之间的相互作用是特别强力及特异性的(Chiang andRoeder, 1993)。在不同物种中已经产生了高质量抗-Flag抗体,所述物种包括小鼠、兔、山羊,及甚至鸡。这种抗体可商购,如购自OriGene公司,其提供高质量抗-Flag小鼠单克隆抗体及兔多克隆抗体,通常用于免疫沉淀分析。在芯片上纯化的效力在图9中示出。将包含FLAG-myc标签的在HEK293T细胞中通过pCMV6-entry载体表达的蛋白质的HEK293T细胞裂解物或者空白pCMV6-entry载体转化的细胞的裂解物(阴性对照物)点印在未包被的硝化纤维玻片(阴性对照物)及用抗-FLAG抗体包被的硝化纤维玻片上。然后用抗-myc抗体探查玻片,以观测固定的FLAG-myc标签的蛋白质,或者用抗β_肌动蛋白抗体探查,以观测代表未标签的细胞蛋白质的肌动蛋白。如图9所示,抗-myc抗体结合表明myc-FLAG标签的蛋白质在紧密、相对均一的及浓密染色的斑点中结合抗-FLAG包被的硝化纤维玻片,而在较宽广、更扩散和较低密度斑点中结合未包被的玻片。在任一类型玻片上均无抗-myc抗体对阴性对照物染色。在抗-FLAG包被的玻片上没有抗_β肌动蛋白免疫染色的斑点,示出所述阻断步骤有效阻止非特异性结合,及大部分细胞蛋白质在将裂解物点印至玻片上之后被有效洗去。结合未包被的玻片的抗myc抗体示出结合具有黑色环面的弥漫斑点(diffuse spot)中的大部分细胞蛋白质。 在芯片上一步(on-chip one step)免疫亲和性纯化可与任何标签的蛋白质一起使用,因此可以广泛用于通过使用表达标签的融合蛋白的载体由外源DNA产生的蛋白质。为此许多标签可以与DDK(FLAG)相同方式使用。VII如下参考文献及在本文别处弓I用的那些文献以其全部内容并入本文作参考,特别是对于其在本文中所涉及的具体对象。可用于进行本发明实施方案的关于多核苷酸、外源基因的表达、表达载体、在转化的细胞中蛋白质产生的信息为本领域熟知,且普遍用于所述实施方案相关技术中。这种信息可见于例如如下参考文献。Hames et al.,Polynucleotide Hybridization, IRL Press,1985. Davis etal.,Basic Methods in Molecular Biology,Elsevir Sciences Publishing, Inc. , NewYork, 1986.Sambrook et al. , Molecular Cloning, 3rd Ed. CSH Press, 2001.Howe, Gene Cloning and Manipulation, Cambridge University Press,1995.Ausubel et al. , Current Protocols in Molecular Biology, John Wiley &Sons,Inc., 1994 to the present在本文中引用的其它信息可见于如下参考文献。Barbulovic-Nadj I.,Lucentej M.,Sunj Y.,Zhang, M.,Wheeler, A. R.,andBussmannj Μ. (2006). Bio-microarray fabrication techniques—a review.Crit RevBiotechnol 26,237-259.Chan, S. M.,Ermannj J.,Suj L.,Fathmanj C. G.,and Utzj P. J. (2004) · Proteinmicroarrays for multiplex analysis of signal transduction pathways. Nat Med10, 1390-1396.Cheadlej C.,Vawterj M. P.,Freed, W. J.,and Becker, K. G. (2003) · Analysis ofmicroarray data using Z score transformation. J Mol Diagn 5,73-81.
Chiang, C. Μ.,Ge,H.,Wangj Ζ·,Hoffmann, A.,and Roede r, R. G. (1993).Unique TATA—binding protein-containing complexes and cofactors involved intranscription by RNA polymerases II and III. Embo J 12,2749-2762.Chiang, C. M. , and Roeder,R. G. (1993). Expression and purification ofgeneral transcription factors by FLAG epitope-tagging and peptide elution. PeptRes 6,62—64.Ekins,R. P. (1989). Multi-analyte immunoassay. J Pharm Biomed Anal7,155-168.Gloecknerj C. J.,Boldt,K.,Schumacher, A.,and Ueffingj M. (2009) · TandemAffinity Purification of Protein Complexes from Mammalian Cells by the Strep/FLAG(SF) -TAP Tag. Methods Mol Biol 564,359-372.Goshimaj N.,Kawamuraj Y.,Fukumotoj A.,Miuraj A.,Honmaj R.,Satohj R.,Wakamatsu,A.,Yamamoto, J.,Kimuraj K.,Nishikawaj T.,et al. (2008). Human protein factoryfor converting the transcriptome into an in vitro-expressed proteome. NatMethods 5,1011-1017.Guilleaumej B.,Bunessj A.,Schmidt, C.,Klimekj F.,Moldenhauerj G.,Huber, W.,Arltj D.,Korf,U.,Wiemannj S.,and Poustkaj A. (2005). Systematic comparison ofsurface coatings for protein microarrays. Proteomics 5,4705—4712.Gunawardana, C. G. , and Diamandisj E. P. (2007). High throughput proteomicstrategies for identifying tumour-associated antigens. Cancer Lett 249,110—119.Haab,B. B. (2006) · Applications of antibody array platforms. Curr OpinBiotechnol 17,415-421.He,M.,Stoevesandtj 0.,Palmer, E. A.,Khan, F.,Ericsson, 0.,and Taussig, M.J. (2008). Printing protein arrays from DNA arrays. Nat Methods 5,175-177.Hultschigj C.,Kreutzbergerj J.,Seitz, H.,Konthurj Z.,Bussow, K.,andLehrachj H. (2006). Recent advances of protein microarrays. Curr Opin Chem Biol10,4-10.Husij H. , and Grant, S. G. (2001) · Isolation of 2000-kDa complexesofN-methyl-D-aspartate receptor and postsynaptic density 95 from mouse brain. JNeurochem 77,281-291.Ikuraj T.,Ogryzko, V. V.,Grigoriev, M.,Groismanj R.,Wang, J.,HorikoshijM.,Scully, R.,Qinj J.,and Nakatanij Y. (2000) · Involvement of the TIP60histoneacetylase complex in DNA repair and apoptosis. Cell 102,463—473.LaBaerj J. , and Ramachandranj N. (2005). Protein microarrays as tools forfunctional proteomics. Curr Opin Chem Biol 9,14-19.Li, A. G.,Pilusoj L G.,Caij X.,Gaddj B. J.,Ladurnerj A. G.,and Liuj X. (2007) ·An acetylation switch in p53 mediates holo—TFIID recruitment. Mol Cell28,408-421.MacBeathj G. , and Schreiberj S. L. (2000). Printing proteins as microarraysfor high-throughput function determination. Science 289,1760-1763.Monneretj C. (2005). Histone deacetylase inhibitors. Eur J Med Chem40,1-13.Nabholtzj J. M.,Reese, D. M.,Lindsay, M. A.,and Rivaj A. (2002) · HER2-positivebreast cancer:update on Breast Cancer International Research Group trials. ClinBreast Cancer 3 Suppl 2,S75-79.Nishizukaj S.,Charboneauj L.,Young, L.,Major, S.,Reinholdj W. C.,Waltham,M.,Kouros-Mehrj H.,Bussey, K. J.,Lee, J. K.,Espinaj V.,et al. (2003). Proteomicprofiling of the NCI-60 cancer cell lines using new high-density reverse-phaselysate microarrays. Proc Natl Acad Sci USA 100,14229-14234.Oldfield, C. J.,Mengj J.,Yang, J. Y.,Yang, M. Q.,Uversky, V. N.,and Dunkerj A.K. (2008). Flexible nets: disorder and induced fit in the associations of p53 and 14-3-3 with their partners. BMC Genomics 9 Suppl 1,SI.Payne, M. E.,Fong, Y. L.,Onoj T.,Colbranj R. J.,Kemp, B. E.,Soderlingj T.R., and Means,A.R. (1988). Calcium/calmodulin-dependent protein kinaseII. Characterization of distinct calmodulin binding and inhibitory domains. JBiol Chem 263,7190-7195.Pelham,H.R. (1990). The retention signal for soluble proteins of theendoplasmic reticulum. Trends Biochem Sci 15,483-486.Ramachandranj N.,Raphael, J. V.,Hainsworthj E.,Demirkanj G.,Fuentes,M.G., Rolfs,A.,HujY.,and LaBaerjJ. (2008).Next-generation high-densityself-assembling functional protein arrays. Nat Methods 5,535—538.Schnackj C. , Hengererj B. , and Gillardonj F. (2008). Identification ofnovelsubstrates for Cdk5 and new targets for Cdk5 inhibitors using high-densityprotein microarrays. Proteomics 8,1980-1986.Shengj Y.,Saridakisj V.,Sarkarij F.,Duanj S.,Wuj T.,Arrowsmithj C. H.,andFrappierj L. (2006). Molecular recognition of p53 and MDM2 by USP7/HAUSP. NatStruct Mol Biol 13,285-291.Shimoyama, Y.,Hirohashij S.,Hiranoj S.,Noguchi, M.,Shimosatoj Y.,Takeichi,M. , and AbejO. (1989). Cadherin cell-adhesion molecules in human epithelialtissues and carcinomas. Cancer Res 49,2128-2133.Spurrier,B.,Honkanenj P.,HoIway, A.,Kumamoto, K.,Terashimaj M.,Takenoshita, S. , Wakabayashij G. , Austin, J. , and Nishizukaj S. (2008). Protein and lysate arraytechnologies in cancer research. Biotechnol Adv 26,361—369.Spurrier, B.,Washburn, F. L.,Asinj S.,Ramalingamj S.,and Nishizukaj S.(2007). Antibody screening database for protein kinetic modeling. Proteomics7,3259-3263.Stein,L D. (2004) · Human genome: end of the beginning. Nature 431,915-916.Stornaiuolo,M .,Lotti,L . V .,Borgese,N .,Torrisi,M .R.,Mottola,G.,Martire,G.,and Bonattij S. (2003). KDEL and KKXX retrieval signalsappended to the same reporter protein determine different trafficking betweenendoplasmic reticulum, intermediate compartment, and Golgi complex. Mol Biol Cell14,889-902.Tabrizij M. A.,Bornsteinj G. G.,Klakampj S. L.,Drake, A.,Knight, R.,andRoskosj L. (2009). Translational strategies for development of monoclonalantibodies from discovery to the clinic. Drug Discov Today 14,298-305.VanMeterj A.,Signore, M.,Pierobonj M.,Espinaj V.,Liottaj L. A.,andPetricoinj E.F. , 3rd(2007). Reverse-phase protein microarrays:application tobiomarker discovery and translational medicine. Expert Rev Mol Diagn 7,625—633.Zhuj H.,Bilginj M.,Banghamj R.,Hall, D.,Casamayorj A.,Bertonej P.,Lanj N.,Jansen, R. , Bidlingmaier, S. , Houfekj T. , et al. (2001). Global analysis of protein activities using proteome chips.Science 293,2101-2105.
权利要求
1.一种制作蛋白质阵列的方法,包括将包含蛋白质P1至Pn的裂解物L1至Ln施加于支持物上的位置S1至Sn, 其中每种裂解物Lx是细胞Cx的裂解物,其包含通过外源DNADx在其中表达的蛋白质Px,并且其被施加于位置Sx, 其中 P1至Pn彼此均不相同, S1至Sn彼此均不相同, n是大于I的整数,且 X是从I至n的整数。
2.制作蛋白质阵列的方法,包括将蛋白质P1至Pn施加于支持物上的S1至Sn位置, 其中每种蛋白质Px在细胞Cx中通过外源DNA Dx表达,并被施加于Sx位置, 其中 P1至Pn彼此均不相同, S1至Sn彼此均不相同, n是大于I的整数,且 X是I至n之间的整数。
3.权利要求I或2的方法,其中所述蛋白质包含生物体的至少1,OOO个不同的基因座。
4.权利要求1-3任一项的方法,其中所述蛋白质全体包含至少20%的由生物体基因组所编码的蛋白质。
5.权利要求1-4任一项的方法,其中所述基因组是人基因组。
6.权利要求1-5任一项的方法,其中对于至少50%的所述裂解物而言,施加于所述阵列中每个位置的裂解物蛋白质的量是裂解物的至少100个细胞中的总蛋白质的量。
7.权利要求1-6任一项的方法,其中将所述蛋白质或裂解物施加于载玻片上的硝化纤维。
8.权利要求1-7任一项的方法,其中用特异于亲和性标签的捕获试剂包被所述支持物,且所述蛋白质包含所述标签并通过结合至所述捕获试剂而被纯化。
9.蛋白质阵列,其在支持物上的位置S1至Sn包含裂解物L1至Ln,所述裂解物包含蛋白质P1至Pn, 其中每种裂解物Lx是细胞Cx的裂解物,其包含在细胞中通过外源DNADx表达的蛋白质Px,并且其被施加于Sx位置, 其中 P1至Pn彼此均不相同, S1至Sn彼此均不相同, n是大于I的整数,且 X是I至n的整数。
10.蛋白质阵列,其在支持物上的位置S1至Sn包含蛋白质P1至Pn, 其中每种蛋白质Px均在细胞Cx中通过外源DNA Dx表达,并被施加于位置Sx, 其中 P1至Pn彼此均不相同,S1至Sn彼此均不相同, n是大于I的整数,且 X是I至n的整数。
11.权利要求9或10的蛋白质阵列,其中所述蛋白质包含生物体的至少1,000个不同的基因座。
12.权利要求9-11任一项的蛋白质阵列,其中所述蛋白质全体包含至少20%的由生物体基因组所编码的蛋白质。
13.权利要求9-12任一项的蛋白质阵列,其中所述基因组是人基因组。
14.权利要求9-13任一项的蛋白质阵列,其中对于至少50%的所述裂解物而言,施加于所述阵列中每个位置的裂解物蛋白质的量是所述裂解物的至少100个细胞中的总蛋白质的量。
15.权利要求9-14任一项的蛋白质阵列,其中将所述蛋白质或者裂解物施加于载玻片上的硝化纤维。
16.权利要求9-15任一项的蛋白质阵列,其中所述蛋白质包含亲和性标签并通过特异于亲和性标签的捕获试剂结合至所述支持物,其中所述捕获试剂固定于所述支持物。
17.确定抗体或抗体制备物的结合特异性的方法,包括确定所述抗体或抗体制备物与权利要求9-16任一项的蛋白质阵列的结合,并根据该确定来鉴别所述抗体或抗体制备物对于所述阵列中蛋白质的结合特异性。
18.确定疾病的蛋白质生物标志的方法,包括确定来自一或多个健康个体及来自一或多个患有疾病的患病个体的样品与权利要求9-16任一项的蛋白质阵列的结合,并根据来自健康和患病个体的样品的结合中的不同而确定所述疾病的蛋白生物标志。
19.确定自身免疫疾病的生物标志的方法,包括确定来自一或多个健康对象的及来自患有自身免疫疾病的一或多个对象的含有抗体的样品与权利要求9-16任一项的蛋白质阵列的结合,并根据来自健康对象与来自患有自身免疫疾病的对象的样品中抗体结合的不同而确定所述自身免疫疾病的蛋白生物标志。
20.确定特征在于存在在健康个体中不存在的抗体的疾病的生物标志的方法,包括确定来自一或多个健康对象及来自一或多个患有特征在于存在在健康个体中不存在的抗体的疾病的对象的样品与权利要求9-16任一项的蛋白质阵列的结合,并根据来自健康对象及来自患有所述疾病的对象的样品中抗体结合的不同而确定所述疾病的蛋白生物标志。
21.用于诊断特征在于存在在健康个体中不存在的抗体的疾病的方法,包括确定来自可能患有所述疾病的对象的含有抗体的样品与权利要求9-16任一项的蛋白质阵列的结合,并根据所述样品中抗体与所述阵列的结合而确定所述疾病的存在与否。
22.用于监测信号转导途径的方法,包括确定含有信号转导途径蛋白质的样品与权利要求9-16任一项的蛋白质阵列的结合,其中与所述阵列中蛋白质的结合表明所述蛋白质不存在、存在和/或所述蛋白质的量。
23.用于确定小分子与蛋白质之间相互作用的方法,包括确定含有所述小分子的样品与权利要求9-16任一项的蛋白质阵列的结合。
全文摘要
本发明举例的实施方案涉及蛋白质阵列,产生所述阵列的方法以及其使用方法等。在一些实施方案中,代表人基因组中至少50%基因座的已知蛋白质在支持物上的已知位置排成阵列。在一些实施方案中,阵列是由通过与支持物亲和性结合而纯化自细胞裂解物的蛋白质制成。在一些实施方案中,蛋白质阵列用于解码抗体的结合特异性。在一些实施方案中,蛋白质阵列用于诊断自身免疫疾病。本发明还公开了许多其它实施方案和一般特征。
文档编号G01N33/68GK102803969SQ201080053516
公开日2012年11月28日 申请日期2010年9月23日 优先权日2009年9月25日
发明者W-W·何, D·马, Y·舒, Z·孙 申请人:傲锐东源生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1