用于选择长期生产性细胞的方法

文档序号:3514777阅读:356来源:国知局
专利名称:用于选择长期生产性细胞的方法
技术领域
本申请报道的方法属于细胞选择和多肽表达领域。更具体地,本文报道了用于选择长期表达或分泌多肽的细胞的方法,所述方法基于检测与编码该多肽的结构基因有效连接的启动子的核酸的甲基化。
背景技术
胞嘧啶碱基在碳5处的酶促甲基化导致5-甲基胞嘧啶,其是在原核生物和真核生 物中发现的DNA甲基化。在真核细胞中,DNA甲基化被熟知为导致基因沉默的基本外遗传机制。甲基化特定地在常出现于启动子区域内的CpG 二核苷酸上发生。在启动子以外,CpG位点稀少。甲基化的启动子是沉默的,即转录不活跃的,由此基因是不表达的。甲基化的DNA募集甲基DNA结合蛋白,形成可以修饰和浓缩染色质的HDACs等其它因子的平台。通过启动子甲基化的基因沉默已不仅针对自体基因而且针对重组基因构建体被报道(Escher, G.,等,J. Lipid Res. 46 (2005) 356-365; Brooks, A. R.,等,J. Gen.Med. 6 (2004) 395-404)。以亚硫酸氢盐处理DNA是适于区分甲基化和非甲基化CpG位点的方法。在所使用的条件下,胞嘧啶而非5-甲基胞嘧啶在C4处脱氨基并由此转变为尿嘧啶。由此,互补的DNA链转变为两条链,即A和B,它们不再是互补的。Barnes, L. M.,等(Biotechnol. Bioeng. 96 (2006) 337-348)报道,LC/HCmRNA水平是NSO细胞的长期稳定性的标记。Chusainow, J.,等(Biotechnol.Bioeng. 102(2009) 1182-1196) ;Jiang, Z.,等(Biotechnol. Prog. 22 (2006) 313-318)报道,MTX处理的细胞具有较高的LC/HC mRNA水平。Lee, C. J.,等(Biotechnol.Bioeng. 102(2008) 1107-1118)报道了基于 HCmRNA 水平来筛选细胞。Escher等(见上)报道了在瞬时感染的巨噬细胞中CMV启动子的沉默。使用腺病毒的CMV启动子的体内沉默被Brooks等(见上)报道。Dickson, J.,等(PLoS Genetics 6 (2001) el000804)报道了 VEZFl 元件可以介导对DNA甲基化的阻止。Mielke, C.,等(Gene 254(2000) 1-8)报道了从三顺反子mRNA稳定地、长期表达异ニ聚体蛋白。Everett, R. S.,等(J. Virol. 325 (2004) 96-105)报道了,通过使用持久性腺病毒载体,证实了鼠肝脏中CMV增强子活性的株系特异性关闭率。Proesch, S.,等(Biol. Chem. Hoppe-Seyler 377(1996) 195-201)报道了在体外由 DNACPG甲基化导致的非常强HCMV立即早期启动子的失活。Kristensen,L. S.和Hansen, L.L. (Clin. Chem. 55(2009) 1471-1483)报道了在癌症诊断、预后和治疗反应中用于检测单基因座DNA甲基化生物标记的基于PCR的方法。Recillas-Targa, F.,等(Proc. Natl. Acad.Sci. USA 99(2002)6883-6888)报道了由鸡P珠蛋白绝缘子介导的位置效应保护和增强子阻断是可分开的活性。
发明概要现已发现,在用于生产多肽的细胞或细胞系中,确定与编码该多肽的结构基因有效连接的启动子核酸中特定CpG位点的甲基化程度,可以用来预测在长期培养期间生产カ的降低。本文一方面报道了用于选择细胞的方法,所述方法包括以下步骤a)以包括以下步骤的方法鉴定启动子核酸中的CpG位点I)从细胞的培养物的至少10个细胞中分别分离DNA,其中所述细胞在缺乏选择试剂时培养30代时间后,其多肽生产速率小于该细胞在第I代培养后的生产速率的90%,2)通过亚硫酸氢盐处理,修饰所分离DNA的胞嘧啶,3)基于在步骤2)中获得的DNA,鉴定与编码多肽的结构基因有效连接的启动子核酸内甲基化频率为至少0. 2的CpG位点,从而鉴定出CpG位点,
b)提供至少ー个细胞,所述细胞包含核酸,其中所述核酸含有与步骤a)相同的启动子核酸有效连接的编码多肽的结构基因,c)针对步骤b)的至少ー个细胞的每ー个,基于获自其培养物的至少10个拷贝的该启动子核酸或10个细胞,确定步骤a)中鉴定的CpG位点的甲基化频率,d)选择在步骤c)中确定的甲基化频率低于通过測定非CpG位点的胞嘧啶甲基化而得到的平均值的2倍的细胞,或选择在步骤c)中确定的甲基化频率低于5%的细胞。本文所报道的另ー个方面是用于选择细胞的方法,所述方法包括以下步骤a)针对包含核酸的至少ー个细胞的每ー个,其中所述核酸含有与具有SEQ IDN0:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞的培养物获得的至少10个拷贝的该启动子核酸或者至少10个细胞所确定的甲基化,确定在选自SEQ ID NO:01的第80、96、425、437、563和591位的位置的CpG位点的甲基化频率,b)选择所确定的甲基化频率低于5%的细胞。在一个实施方案中,所述确定包括以下步骤I)从每个细胞中分离DNA,2)对每个分离的DNA分别进行甲基化特异性聚合酶链式反应,3)根据在步骤2)中得到的结果,确定CpG位点的甲基化频率。在另ー个实施方案中,步骤2)是以下步骤2)以甲基化特异性引物和通用引物,对每个分离的DNA分别进行聚合酶链式反应。在另ー个实施方案中,步骤2)是以下步骤2)分离的DNA分别以限制性酶消化,并以甲基化特异性引物和通用引物,对每个消化的DNA进行聚合酶链式反应。在一个实施方案中,启动子核酸具有SEQ ID N0:01的序列或包含其片段或其变体,CpG 位点选自 SEQ ID NO:01 的第 80、96、425、437、563 和 591 位、或 SEQ ID NO:01 的片段或变体中对应的位置。在另ー个实施方案中,引物相互独立地选自SEQ ID N0:06至20。在另ー个实施方案中,引物选自SEQ ID N0:ll、14和15 ;通用引物具有SEQ ID NO: 09的序列,甲基化特异性引物选自SEQ ID N0:17、18和19。在另ー个实施方案中,通用引物具有SEQ ID NO:09和11的序列,甲基化特异性引物具有SEQ ID NO: 11和18的序列。本文报道的再ー个方面是用于生产多肽的方法,所述方法包括以下步骤a)以本文所报道的方法选择细胞,
b)培养所选择的细胞,和c)从培养基和/或细胞中回收多肽,从而生产多肽。在一个实施方案中,方法在步骤a)之前包括以下步骤a-3)提供细胞,a-2)以包含与启动子核酸有效连接的编码多肽的结构基因的核酸转染所提供的 细胞,a-l)i)任选地,在存在选择试剂时培养和繁殖所转染的细胞,ii)对这些细胞进行单存放(single depositing),和iii)在存在选择试剂时培养该单存放的转染细胞。本文报道的另ー个方面是试剂盒,其包含a)用于修饰CpG位点中的非甲基化胞嘧啶的试剂,和b)选自 SEQ ID NO: 13、16、17、18、19 和 20 的引物。在本文所报道的这些方面的一个实施方案中,细胞是细胞克隆。发明详述用于重组蛋白生产的哺乳动物细胞系需要在长期的培养时间中維持生产力。长期稳定性研究虽然耗费时间和资源,但仍被广泛地开展以鉴定和消除在细胞系开发期间的不稳定候选因素。制造的细胞系的生产不稳定性可能与异源启动子的甲基化和沉默有夫。本文鉴定了人巨细胞病毒主要立即早期启动子/增强子(hCMV-MIE)中的如下CpG 二核苷酸,所述CpG 二核苷酸在不稳定的生产抗体的中国仓鼠卵巣(CHO)细胞系中频繁地被甲基化。建立了甲基化特异性实时qPCR,从而允许在多个细胞系中快速灵敏地测定hCMV-MIE甲基化,并提供可以将hCMV-MIE甲基化和转基因拷贝数用作预测重组CHO细胞系的生产稳定性的早期标记的证据。这些标记将提供在细胞系开发早期富集稳定生产细胞的机会。因此,本文报道了用于选择细胞的方法以及用于生产多肽的方法。所选择的细胞和用于生产多肽的细胞是长期生产性细胞。可以如本文中所报道的,基干与编码多肽的结构基因有效连接的启动子的甲基化来选择这样的细胞。术语“近乎”表示该表述后的数值是具有一定变化性的中心值。在一个实施方案中,变化性是数值的±20%,在另ー个实施方案中,变化性是±10%,在另ー个实施方案中,变化性是±5%。因此,表述“近乎”常数是指,在一个实施方案中,数值在80%至120%范围内,在另ー个实施方案中,在90%至110%范围内,在另ー个实施方案中,在95%至105%范围内。术语“抗体”表示包含至少两个所谓轻链多肽(轻链)和两个所谓重链多肽(重链)的分子。每个重链和轻链多肽包含可变结构域(可变区)(其通常在多肽链的氨基端部分),所述可变区包含能够与抗原相互作用的结合区。每个重链和轻链多肽也包含恒定区(其通常在多肽链的羧基端部分)。重链的恒定区介导抗体结合到i)携帯Fe Y受体(Fe y R)的细胞,例如吞噬细胞,或ii)携带新生儿Fe受体(FcRn)(也被称为Brambell受体)的细胞。它也介导与ー些因子的结合,所述因子包括经典补体系统的因子,例如组分Clq。根据重链恒定区的氨基酸序列,将抗体分为不同类别IgA类、IgD类、IgE类、IgG类和IgM类。这些类别中的一些被进一歩分为亚类(同种型),即IgG分为IgGl、IgG2、IgG3和IgG4,或IgA分为IgAl和IgA2。根据抗体所属类别,重链恒定区分别被称为a (IgA)、6 (IgD)、e (IgE), y (IgG)和u (IgM)。在一个实施方案中,抗体是IgG类的抗体。在另ー个实施方案中,抗体具有人恒定区或来自人源的恒定区。在另ー个实施方案中,抗体是IgG4亚类或IgGl、IgG2或IgG3亚类的抗体,所述抗体经过改造而检测不到与Fe y受体(例如FcyRIIIa)的结合和/或与Clq的结合。在一个实施方案中,抗体是人IgG4亚类或突变的人IgGl亚类的抗体。在一个实施方案中,抗体是具有L234A和L235A突变的人IgGl亚类的抗体。在另ー个实施 方案中,抗体是就IgG4亚类或IgGl或IgG2亚类的Fe y受体结合,具有在L234、L235和/或D265上的突变,和/或包含PVA236突变。在另ー个实施方案中,抗体具有选自 S228P、L234A、L235A、L235E、SPLE(S228P 和 L235E)和/或 PVA236 (PVA236表示来自IgGl的第233至236位氨基酸的氨基酸序列ELLG (按单字母氨基酸代码给出)或IgG4的EFLG被PVA取代)的突变。在一个实施方案中,抗体是IgG4亚类的抗体,其具有IgG4的S228P突变,或抗体是IgGl亚类的抗体,其具有L234A和L235A突变。免疫球蛋白的轻链或重链的可变区依次包含不同的片段,即4个构架区(FR)和3个超变区(CDR)。术语“亚硫酸氢盐处理”是指,在存在亚硫酸氢根离子时,将核酸中的胞嘧啶碱基转换为尿卩密唳碱基而5-甲基胞卩密唳碱基不显著被转换的反应。Frommer等(Frommer, M.,等,Proc. Natl. Acad. Sci. USA 89(1992) 1827-1831)和 Grigg 与 Clark (Grigg, G. W.和Clark, S. ,Bioessays 16 (1994) 431-436; Grigg, G. ff. , DNA Seq. 6(1996) 189-198)详细描述了用于检测甲基化胞嘧啶的该反应。亚硫酸氢盐反应包括脱氨基步骤和脱磺酸基步骤,所述步骤可以分开或同时进行。关于5-甲基胞嘧啶碱基不显著被转换的表述,应该仅考虑这样的情況尽管旨在唯一且排他地转化(非甲基化的)胞嘧啶碱基,但不能排除小比例的5-甲基胞嘧啶碱基被转换为尿嘧啶。术语“细胞”表示核酸(例如编码多肽,可选地异源多肽)可以被或已经被引入/转化到其中的细胞。术语“细胞”包括原核细胞(其可以用于繁殖质粒),也包括真核细胞(其用于表达核酸)。在一个实施方案中,细胞是真核细胞,在另ー个实施方案中,真核细胞是哺乳动物细胞。在另ー个实施方案中,哺乳动物细胞选自包括CHO细胞(例如CHO KUCHODG44)、BHK 细胞、NSO 细胞、SP2/0 细胞、HEK 293 细胞、HEK 293EBNA 细胞、PER.C6 细胞、和COS细胞的哺乳动物细胞组。如本文中使用的,表达“细胞”包括受试细胞及其后代。因此,术语“细胞”表示最初的受试细胞和从其来源的培养物而不管传代的次数。还应理解的是,由于有意或无意的突变,所有的后代在所包含的DNA上可以是不完全相同的。本发明包括这样的变体后代,其具有在最初转化的细胞上所筛选的相同的功能或生物学活性。术语“CpG位点”表示核酸中能够被细胞的甲基化酶识别的二核苷酸CG,其中胞嘧啶能够被转化为5-甲基胞嘧啶。在一个实施方案中,CpG位点在启动子核酸中。术语“表达盒”表示,包含对于在细胞中表达至少该所含核酸所必需的调控元件,例如启动子和多聚腺苷酸化位点,的构建体。术语“表达质粒”指核酸,该核酸提供为了在细胞中表达所包含的结构基因(ー个或多个)所必需的所有元件。典型地,表达质粒包含原核质粒繁殖単元(例如对大肠杆菌而言,包含复制原点)和选择标记、真核选择标记以及ー个或多个用于表达目的结构基因(一个或多个)的表达盒,每个表达盒包含启动子核酸、结构基因、和包含多聚腺苷酸化信号的转录终止子。基因表达通常处于启动子核酸的控制下,这样的结构基因被称作“有效连接”启动子核酸。类似地,如果调控元件可以调节核心启动子核酸的活性,则该调控元件和核心启动子核酸是有效连接的。术语“世代时间”表示细胞所需要以分裂和产生子代细胞的时间。因此,已分裂一次的细胞具有一世代的年龄。术语“代”表示细胞的细胞分裂次数。术语“高频率”表示,基于对统计学意义的数量的单细胞或DNA克隆进行的甲基化分析,胞嘧啶在所述甲基化位点比在其它甲基化位点更经常地被甲基化。所述统计学意义的数量,在一个实施方案中是至少10个单细胞或DNA克隆,在另ー个实施方案中是至少15个单细胞或DNA克隆,在另ー个实施方案中是至少20个单细胞或DNA克隆。在一个实施方案中,分析最多400个细胞或DNA克隆。术语“长期生产性细胞”表示生产多肽(在一个实施方案中是异源多肽)的细胞,其中该细胞的比生产速率在至少30代是几乎恒定的。在一个实施方案中,长期生产性细胞具有的比生产速率在至少30代是几乎恒定的,在另ー个实施方案中在至少45代是几乎恒 定的,在另ー个实施方案中,在至少60代是几乎恒定的。在一个实施方案中,长期生产性细胞具有的比生产速率在多达60代是几乎恒定的,在另ー个实施方案中,在多达75代是几乎恒定的恒定,在另ー个实施方案中,在多达90代是几乎恒定的。术语“甲基化”表示细胞中的过程,所述细胞已转染了包含与启动子有效连接的编码多肽的结构基因的核酸,在该过程中该启动子核酸的胞嘧啶被转化为5-甲基胞嘧啶。其中至少ー个胞嘧啶被转化为5-甲基胞嘧啶的启动子核酸被称为“甲基化的”核酸。术语“有效连接”表示两个或更多个组件并置,其中所述组件处于允许它们以其预期的方式起作用的关系中。例如,如果启动子和/或增强子以顺式方式起作用以控制或调节所连接的编码序列的转录,则该启动子和/或增强子被有效连接到编码序列。通常但非必需地,“有效连接的”DNA序列是相邻的,并在需要连接两个蛋白质编码区域例如分泌引导序列和多肽时,是相邻的和在阅读框内的。然而,尽管有效连接的启动子通常位于编码序列的上游,但它不必与其相邻。增强子不必是相邻的。如果增强子増加编码序列的转录,则增强子被有效连接到编码序列。有效连接的增强子可以位于编码序列的上游、内部或下游,和位于距启动子相当长的距离。如果多聚腺苷酸化位点位于编码序列末端的下游以致转录前进通过编码序列而进入多聚腺苷酸化序列,则多聚腺苷酸化位点被有效连接到编码序列。如果翻译終止密码子位于编码序列末端(3’末端)的下游以致翻译前进通过编码序列到达终止密码子并在那里终止,则翻译終止密码子被有效连接到外显子核酸序列。连接可以通过本领域已知的重组方法来进行,例如使用PCR方法和/或通过在合适的限制性位点进行的连接。如果不存在合适的限制性位点,则可以根据常规实践,使用合成的寡核苷酸接头或衔接子。术语“多肽”表示由通过肽键连接的氨基酸组成的聚合物,无论其是天然产生的或是合成的。少于约20个氨基酸残基的多肽可以被称为“肽”,而由两个或更多个多肽组成的或包含多于100个氨基酸残基的一个多肽的分子可以被称为“蛋白质”。多肽也可以包含非氨基酸组分,所述组分例如碳水化合物基团、金属离子或羧酸酷。非氨基酸组分可以通过表达多肽的细胞添加,并可以随细胞的类型而变化。在本文中,多肽按其氨基酸骨架结构或编码其的核酸进行定义。添加例如碳水化合物基团通常不是规定的,但是可以存在。术语启动子核酸的“变体”表示在启动子核酸内,一个或多个核苷酸被改变而不干扰启动子核酸的功能。这样的改变可以用于消除或引入限制性位点。术语“生产”表示在细胞中表达插入到表达盒中的结构基因。该术语包括核酸转录和翻译过程。生产在合适的原核或真核细胞中进行,可以从裂解后的细胞中或从培养物上清中回收所表达的(即生产的)多肽。术语“启动子核酸”表示控制与其有效连接的基因/结构基因或核酸序列转录的多核苷酸序列。启动子核酸包括用于RNA聚合酶结合和转录起始的信号。所使用的启动子核酸将在考虑于其中表达所选择的结构基因的细胞中发挥功能。大量的启动子核酸,包括来自多种不同来源的组成型、诱导型和阻遏型启动子在本领域公知(并在例如GenBank等数据库中标识),其可以作为克隆的多核苷酸或在克隆的多核苷酸中获得(从例如ATCC等保藏机构以及其它商业或个人来源获得)。“启动子核酸”表示指导或促进有效连接的结构基因转录的核苷酸序列。典型地,启动子核酸位于基因的5’非编码或非翻译区,接近结构基因的转录起始位点。启动子核 酸中起转录起始作用的序列元件通常具有共有核苷酸序列的特点。这些元件包括RNA聚合酶结合位点、TATA序列、CAAT序列、分化特异性元件(DSEs)、环AMP响应元件(CREs)、血清应答元件(SREs)、糖皮质激素应答元件(GREs)以及其它转录因子例如CRE/ATF、AP2、SP1、cAMP响应元件结合蛋白(CREB)和八聚体因子的结合位点。如果启动子核酸是诱导型启动子核酸,则转录速率将响应于诱导试剂而增加,例如其后接着两个tet操纵子位点的CMV启动子核酸、金属硫蛋白和热激启动子核酸。如果启动子核酸是组成型活性的启动子核酸,则转录的速率不受诱导试剂的调节。已经被鉴定为用于表达的强启动子核酸的真核启动子核酸有SV40早期启动子核酸、腺病毒主要晩期启动子核酸、小鼠金属硫蛋白-I启动子核酸、劳氏肉瘤病毒长末端重复、中国仓鼠延长因子la (CHEF-I)、人EF-I a、泛素以及人巨细胞病毒立即早期启动子核酸(CMV IE)。术语“选择标记”表示,在存在相应的选择试剂时允许特异地选择或淘汰携帯其的细胞的核酸。典型地,选择标记赋予对药物的抗性或补偿引入它的细胞中的新陈代谢或分解代谢的缺陷。选择标记可以是正向、负向或双功能的。有用的正向选择标记是抗生素抗性基因,其允许在存在相应的选择试剂例如抗生素吋,选择转化了该抗性基因的细胞。在选择条件下,即存在选择试剂时,非转化的细胞不能生长或存活。负向选择标记允许选择性消除携帯该标记的细胞。用于真核细胞的选择标记包括例如编码氨基糖苷磷酸转移酶(APH)的结构基因,例如潮霉素(hyg)、新霉素(neo)和G418选择标记,ニ氢叶酸还原酶(DHFR)、胸苷激酶(tk)、谷氨酰胺合成酶(GS)、天冬酰胺合成酶、色氨酸合成酶(选择试剂为吲哚)、组氨醇脱氢酶(选择试剂为组氨醇D),以及赋予对嘌呤霉素、博来霉素、腐草霉素、氯霉素、Zeocin和霉酹酸抗性的核酸。术语“短期生产速率”表示一天内由单个细胞生产的多肽的量,根据在给定时期内所生产的多肽的量和活细胞密度来确定,其中该时期是短的。在一个实施方案中,短期培养是从2至20天,在另ー个实施方案中是从4至15天,在另ー个实施方案中是从10至14天。术语“比生产速率”或“生产速率”表示一天内由单个细胞生产的多肽的量,根据在给定时期内所生产的多肽的量和活细胞密度来确定。可以使用以下公式来计算比生产速率(SPR)SPR=P2-P1/ ((D2-D1) /2* A t) (公式 2)
其中SPR[pg/细胞/d]:比生产速率,P1 [ u g/ml]:在该时期开始时的多肽浓度,P2[ii g/ml]:在该时期结束时的多肽浓度,D1 [细胞/ml]:在该时期开始时的细胞密度,
D2 [细胞/ml]:在该时期结束时的细胞密度,A t [d]:该时期的持续时间。术语“结构基因”表示无信号序列的基因区域,即编码区域。可以将生产多肽的细胞(即转化了包含表达盒的核酸的细胞,所述表达盒包含编码异源多肽的结构基因)分为不同类别在第一类细胞中,比生产速率在多代内是几乎恒定的,然而在第二类细胞中,比生产速率在多代内是递减的,特别是单调递减的。生产多肽的细胞或细胞系的递减的生产カ由与编码多肽的结构基因有效连接的启动子核酸的稳定増加的甲基化和随之而来的沉默、或由结构基因拷贝的丢失引起。现已发现,与编码多肽的结构基因有效连接的启动子核酸中可检测的甲基化的存在,可以提供关于细胞或细胞系的长期生产カ的信息。如果启动子核酸没有被保护性元件防护,每个用于表达结构基因的启动子核酸都包含易于被其所引入的细胞的酶甲基化的位点。易于甲基化的位点称为CpG位点,包含ニ核苷酸CG或由其组成。但不是所有的CpG位点都以相同的相对频率被甲基化——ー些CpG位点比其它位点更经常被甲基化。现已发现,某些位点,例如在人CMV启动子中,以不同的频率被甲基化,从而对启动子沉默具有不同的影响。以下方法可被用于鉴定核酸序列中的CpG位点。其包括以下步骤I)提供细胞,其中在缺乏选择试剂时,所述细胞在30代培养时间后的多肽生产速率小于在第I代培养后该细胞的生产速率的90%,2)从I)的细胞的培养物的至少10个细胞中分别分离DNA,3)通过亚硫酸氢盐处理,修饰所分离DNA的胞嘧啶,4)基于在步骤3)中获得的DNA,鉴定与编码多肽的结构基因有效连接的启动子核酸内甲基化频率至少为0. 2的CpG位点,从而鉴定出CpG位点。在一个实施方案中,细胞在30代的培养时间后的生产速率是在第一代培养后该细胞的生产速率的60%或更低。在另ー个实施方案中,甲基化频率是至少0.4。在另ー个实施方案中,从至少20个细胞中分离DNA。在一个实施方案中,启动子核酸具有SEQ ID NO:01的序列或包含其片段或其变体。在一个实施方案中,通过亚硫酸氢盐处理对分离的DNA的胞嘧啶进行的修饰包含以下步骤3-a)在存在亚硫酸根离子下孵育分离的DNA,借此使DNA脱氨基,和3-b)在碱性条件下孵育脱氨基的DNA,借此使脱氨基的DNA脱磺酸基。用于获得生产多肽的细胞的方法是包含至少ー个转染步骤和至少ー个选择步骤的方法,所述选择步骤包括在转染后直接进行或在存在选择试剂下生长后进行成功转染的细胞的单细胞存放(single cell depositing)。在选择步骤中,基于细胞的短期的比生产速率,即基于在短期培养后上清液中多肽浓度来鉴定细胞。在所选择的细胞中,ー些具有在多代内几乎恒定的比生产速率,其它则具有在多代内单调递减的比生产速率。因此,采用通常应用的选择标准,不能实现对具有稳定的长期生产カ的细胞(ー个或多个)进行特异性选择。因此,本文报道了用于选择生产多肽的细胞的方法,其包括以下步骤a)针对至少ー个含有如下核酸的细胞,其中所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,确定在该启动子核酸中具有高甲基化频率的CpG位点的甲基化,和b)选择生产多肽的细胞,其中在步骤a)中确定的甲基化低于阈值。在如本文报道的该方法中,可以分析通过以表达质粒转染得到的任何细胞,其中所述表达质粒包含表达盒,所述表达盒包含与编码待通过转染的细胞生产的目的多肽的结构基因有效连接的启动子核酸。表达质粒通常还包含选择标记。因此,在一个实施方案中,于转染步骤后和选择步骤前,在存在选择试剂下培养细胞。在另ー个实施方案中,方法包 含不进行之前的单细胞存放或有限稀释,以混合库(pool)的形式,在存在选择试剂下培养细胞。在另ー个实施方案中,方法包括在单细胞存放或有限稀释之后培养细胞。在一个实施方案中,确定包括I)从每个所提供的细胞中分别分离DNA,2)进行甲基化特异性PCR,3)根据在步骤2)中得到的结果,计算在启动子核酸中具有高甲基化频率的CpG位点的甲基化。在另ー个实施方案中,步骤2)是I)以甲基化特异性引物和通用引物进行PCR,或2)以限制性酶消化DNA,并以经消化的DNA和甲基化特异性引物与通用引物进行PCR。在混合库培养/选择后,必须进行单细胞存放。如果在混合库培养步骤后进行单细胞存放,则在单细胞存放后再培养细胞。为了鉴定在多代内具有几乎稳定的比生产速率的细胞或细胞系,需要在经过多代的长期培养中在规定的培养时间确定上清液中多肽浓度和活细胞密度。可以通过,例如在pH 5,以亚硫酸氢盐处理单链DNA和随后的碱脱磺化,鉴定具有高甲基化频率的CpG位点。在本文中,可以区分甲基化和非甲基化的CpG位点。在该特定处理条件下,胞嘧啶而不是5-甲基胞嘧啶在N-杂环的第4位上被脱氨基和转化为尿嘧啶。互补的DNA链被转化为2条链,即A链和B链,它们不再互补。确定可以基于这两链中的任何链。对于启动子核酸或启动子核酸和细胞系的组合,需进行仅一次该长期培养。如果第二次使用相同的启动子核酸或组合,则可以基于已经收集的数据进行选择。许多技术可用于掲示在经亚硫酸氢盐处理后甲基化和非甲基化等位基因之间的序列差异。在一个实施方案中,可以通过在非甲基化特异性条件下,即以对甲基化位点不敏感的引物进行PCR,扩增目的序列(A链或B链),随后通过例如DNA测序(进行或不进行克隆)、高分辨率熔点分析或微阵列分析等方法来进行分析。在另ー个实施方案中,可以以甲基化敏感或甲基化特异性引物或探针进行定量PCR(qPCR)。在可选实施方案中,以5-甲基胞嘧啶特异性抗体沉淀甲基化DNA,随后进行定量聚合酶链式反应。
也可以使用甲基化特异性PCR (MSP)来直接确定经亚硫酸氢盐处理的DNA的序列,而不进行此前对目的区域的PCR扩增。用于MSP的引物将包含ー个或多个CpG位点。它们与未转化的5-甲基胞嘧啶互补以检测甲基化的DNA,或与从胞嘧啶转化来的尿嘧啶互补以检测非甲基化的DNA。确定多个细胞的所鉴定的CpG位点的甲基化。在一个实施方案中,细胞的数量是至少10个,在另ー个实施方案中是至少15个,在另ー个实施方案中是至少20个。然后,计算每个CpG位点的甲基化频率,即对于每个CpG位点,计算该CpG位点被甲基化的细胞的数量除以所分析的细胞的总数。针对在长期培养期间在比生产速率上表现出最大程度降低的细胞或多个细胞,确定甲基化频率。在一个实施方案中,具有高甲基化频率的CpG位点是具有至少0.2的甲基化频率的CpG位点,在另ー个实施方案中为至少0. 25,在另ー个实施方案中为至少0. 4,在另ー个实施方案中为至少0. 5。在确定具有高甲基化频率的CpG位点后,在已经显示出在长期培养期间比生产速·率发生最低或几乎没有降低的多个细胞中,确定相应CpG位点的甲基化。适用于本文中所报道方法的具有高甲基化频率的CpG位点是这样的CpG位点,其具有基于在长期培养期间比生产速率显示出降低的多个细胞而确定的高甲基化频率,和具有基于在长期培养期间比生产速率显示最低降低或几乎没有降低的多个细胞而确定的、低于预定阈值的甲基化频率。在一个实施方案中,预定阈值是非CpG位点胞嘧啶的表观甲基化的平均值的5倍。术语“表观”表示尽管不存在甲基化,但是可以确定甲基化的频率。因此,该值相应于背景噪音。在另ー个实施方案中,阈值是平均值的3倍。在另ー个实施方案中,阈值是平均值的2倍。在如本文所报道的方法的选择步骤中可以使用相同的阈值。本文所报道的另ー个方面是用于生产多肽的方法,其包括以下步骤a)根据本文所报道的方面,选择生产多肽的细胞,b)培养所选择的细胞,和c)从培养基和/或细胞中回收多肽,由此生产多肽。在一个实施方案中还包括进ー步步骤d)纯化所回收的多肽。在另ー个实施方案中,方法在步骤a)之前包括以下步骤a_3)提供细胞,a-2)以包含与启动子核酸有效连接的编码多肽的结构基因的核酸转染所提供的细胞,a-l)i)任选地,在存在选择试剂下培养转染的细胞,ii)对所转染的细胞进行单细胞存放,和iii)在存在选择试剂下培养该单存放的转染细胞。在一个实施方案中,步骤a)包括i)提供至少ー个包含核酸的细胞,所述核酸包含与启动子核酸有效连接的编码多肽的结构基因,ii)确定启动子核酸中具有高甲基化频率的CpG位点的甲基化,和iii)选择生产多肽的细胞,其中在步骤b)中确定的甲基化低于阈值。现已发现,在用于生产多肽的细胞或细胞系中,即使低水平甲基化的启动子核酸(即高于预定的阈值)也可以用来预测长期培养期间生产カ的降低。因此,本文所报道的ー个方面是用于确定与编码多肽(“可选异源”)的核酸有效连接的启动子核酸的甲基化和由此确定细胞的长期生产カ的方法。另ー个方面是用于通过确定与编码多肽的结构基因有效连接的启动子核酸的甲基化来选择生产多肽的细胞的方法。更详细地,在一个实施方案中,所述方法包括以下步骤a)提供具有稳定的长期生产カ的细胞和具有不稳定的长期生产カ的细胞,b)通过克隆来自具有不稳定的长期生产カ的细胞系的经亚硫酸氢盐处理的启动子核酸,使用来自具有稳定长期生产カ的细胞系的启动子核酸作为參考,鉴定甲基化CpG位点,c)可选地进行高分辨率熔点分析,d)提供针对在步骤b)中鉴定的甲基化CpG位点的甲基化敏感性PCR引物或探针, e)可选地,通过提供另外的具有稳定和不稳定的长期生产カ的细胞系,验证所鉴定的甲基化CpG位点的预计值。在一个实施方案中,使用至少10个不同的细胞或细胞系进行步骤e),所述细胞或细胞系来自相同的亲本细胞系并包含相同的表达盒,所述表达盒用于表达与相同的启动子核酸有效连接的目的多肽。在一个实施方案中,DNA在亚硫酸氢盐处理之前被消化。在一个实施方案中,细胞是真核细胞。在另ー个实施方案中,细胞是哺乳动物细胞。在另ー个实施方案中,细胞选自CHO细胞、BHK细胞、HEK细胞和Sp2/0细胞。在另ー个实施方案中,细胞是CHO细胞。在另ー个实施方案中,细胞是CHO Kl细胞。图I显示了获自不同细胞的相同启动子核酸的甲基化CpG位点的数目。以下以人巨细胞病毒立即早期启动子(CMV IE启动子)对本文所报道的方法进行举例说明,所述启动子在本发明进行时,在我们的实验室可以获得充足的量。呈现该数据以对本文所报道的方法进行举例说明而非作为限定。本发明的范围在权利要求中陈述。人CMV IE启动子具有如下所述核酸序列(CpG位点以加下划线表示)ATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTAGCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCCGTTTAGTGAACG(SEQID NO :01).在SEQ ID N0:01中存在33个CpG位点,这些CpG位点是核酸甲基化的潜在位点。以上述方法,可以鉴定人CMV启动子中被主要地甲基化的胞嘧啶残基。保存了所有CpG位点的A链具有核苷酸序列ATGTTGATATTGATTATTGATTAGTTATTAATAGTAATTAATTACGGGGTTATTAGTTTATAGTTTATATATGGAGTTTCGCGTTATATAATTTACGGTAAATGGTTCGTTTGGTTGATCGTTTAACGATTTTCGTTTATTGACGTTAATAATGACGTATGTTTTTATAGTAACGTTAATAGGGATTTTTTATTGACGTTAATGGGTGGAGTATTTACGGTAAATTGTTTATTTGGTAGTATATTAAGTGTATTATATGTTAAGTACGTTTTTTATTGACGTTAATGACGGTAAATGGTTCGTTTGGTATTATGTTTAGTATATGATTTTATGGGATTTTTTTATTTGGTAGTATATTTACGTATTAGTTATCGTTATTAGTATGGTGATGCGGTTTTGGTAGTATATTAATGGGCGTGGATAGCGGTTTGATTTACGGGGATTTTTAAGTTTTTATTTTATTGACGTTAATGGGAGTTTGTTTTGGTATTAAAATTAACGGGATTTTTTAAAATGTCGTAATAATTTCGTTTTATTGACGTAAATGGGCGGTAGGCGTGTACGGTGGGAGGTTTATATAAGTAGAGTTTCGTTTAGTGAACG(SEQID NO :02),完全脱氨基的A链具有核苷酸序列 ATGTTGATATTGATTATTGATTAGTTATTAATAGTAATTAATTATGGGGTTATTAGTTTATAGTTTATATATGGAGTTTTGTGTTATATAATTTATGGTAAATGGTTTGTTTGGTTGATTGTTTAATGATTTTTGTTTATTGATGTTAATAATGATGTATGTTTTTATAGTAATGTTAATAGGGATTTTTTATTGATGTTAATGGGTGGAGTATTTATGGTAAATTGTTTATTTGGTAGTATATTAAGTGTATTATATGTTAAGTATGTTTTTTATTGATGTTAATGATGGTAAATGGTTTGTTTGGTATTATGTTTAGTATATGATTTTATGGGATTTTTTTATTTGGTAGTATATTTATGTATTAGTTATTGTTA TTAGTATGGTGATGTGGTTTTGGTAGTATATTAATGGGTGTGGATAGTGGTTTGATTTATGGGGATTTTTAAGTTTTTATTTTATTGATGTTAATGGGAGTTTGTTTTGGTATTAAAATTAA1GGGATTTTTTAAAATGTTGTAATAATTT1GTTTTATTGATGTAAATGGGTGGTAGG1GTGTA1GGTGGGAGGTTTATATAAGTAGAGTTT1GTTTAGTGAATG(SEQID NO:03)。所有CpG位点均保存的B链具有核苷酸序列CGTTTATTAAACGGAGTTTTGTTTATATAGATTTTTTATCGTATACGTTTATCGTTTATTTGCGTTAATGGGGCGGAGTTGTTACGATATTTTGGAAAGTTTCGTTGATTTTGGTGTTAAAATAAATTTTTATTGACGTTAATGGGGTGGAGATTTGGAAATTTTCGTGAGTTAAATCGTTATTTACGTTTATTGATGTATTGTTAAAATCGTATTATTATGTTAATAGCGATGATTAATACGTAGATGTATTGTTAAGTAGGAAAGTTTTATAAGGTTATGTATTGGGTATAATGTTAGGCGGGTTATTTATCGTTATTGACGTTAATAGGGGGCGTATTTGGTATATGATATATTTGATGTATTGTTAAGTGGGTAGTTTATCGTAAATATTTTATTTATTGACGTTAATGGAAAGTTTTTATTGGCGTTATTATGGGAATATACGTTATTATTGACGTTAATGGGCGGGGGTCGTTGGGCGGTTAGTTAGGCGGGTTATTTATCGTAAGTTATGTAACGCGGAATTTTATATATGGGTTATGAATTAATGATTTCGTAATTGATTATTATTAATAATTAGTTAATAATTAATGTTAATAT(SEQID NO: 04),完全脱氨基的B链具有核苷酸序列TGTTTATTAAATGGAGTTTTGTTTATATAGATTTTTTATTGTATATGTTTATTGTTTATTTGTGTTAATGGGGTGGAGTTGTTATGATATTTTGGAAAGTTTTGTTGATTTTGGTGTTAAAATAAATTTTTATTGATGTTAATGGGGTGGAGATTTGGAAATTTTTGTGAGTTAAATTGTTATTTATGTTTATTGATGTATTGTTAAAATTGTATTATTATGTTAATAGTGATGATTAATATGTAGATGTATTGTTAAGTAGGAAAGTTTTATAAGGTTATGTATTGGGTATAATGTTAGGTGGGTTATTTATTGTTATTGATGTTAATAGGGGGTGTATTTGGTATATGATATATTTGATGTATTGTTAAGTGGGTAGTTTATTGTAAATATTTTATTTATTGATGTTAATGGAAAGTTTTTATTGGTGTTATTATGGGAATATATGTTATTATTGATGTTAATGGGTGGGGGTTGTTGGGTGGTTAGTTAGGTGGGTTATTTATTGTAAGTTATGTAATGTGGAATTTTATATATGGGTTATGAATTAATGATTTTGTAATTGATTATTATTAATAATTAGTTAATAATTAATGTTAATAT(SEQIDNO:05)。图4显示了各CpG位点在不同细胞系中的甲基化频率。数目通过分析从转染了包含用于表达多肽的表达盒的质粒的不同CHO亲本细胞系获得的19至22个不同克隆来确定。针对每个细胞系,显示各单条DNA的甲基化模式(底部)和各单个CpG位点的甲基化频率(顶部)。细胞系K18. I是高度甲基化的(图4A)。不同CpG位点的甲基化频率不相等,但看起来集中在3个簇中,即在5’末端、3’末端和第400位(或核苷酸)周围。22个测序的插入序列中的14个在第425位具有胞嘧啶。细胞系43-16A10中启动子核酸的甲基化示于图4E中。甲基化的分布类似于在细胞系K18. I中所观察到的分布。与K18. I 一祥,第425位最经常地被甲基化测序的20个插入序列中5个在该位点包含胞嘧啶。在其它3个所分析的细胞系中,零星检测到胞嘧啶,即在不同的CpG位点作为单个事件存在(图4B、4C和4D)。对于具有低的总体甲基化的细胞系,为了获得统计显著性,需要对数百个插入序列进行测序。此外,单个事件也可能是由于胞嘧啶脱氨基不完全而非实际的启动子甲基化造成的假阳性事件。为了可靠确定CpG位置特异性甲基化,发展了甲基化特异性PCR方法。为了进行甲基化特异性PCR,可以使用以下表中所示的引物。这些弓丨物单独或组合也是本文所报道的方面。表可用于甲基化特异性PCR的引物
引物曱基化核苷酸序列SEQ ID
编号特异性MO
(方向)____
2飞7 否 ATGTTG AT ATTGATT ATT GATTAG
(正向)
228否 TATGGGATTTTTTTATTTGGTAGT07
(正向)
权利要求
1.用于选择细胞克隆的方法,其包括以下步骤 a)以包括以下步骤的方法鉴定启动子核酸中的CpG位点 1)从细胞的培养物的至少10个细胞中分别分离DNA,其中所述细胞在缺乏选择试剂时培养30代时间后,其多肽生产速率小于该细胞在第I代培养后的生产速率的90%, 2)通过亚硫酸氢盐处理改变所分离DNA的胞嘧啶, 3)基于在步骤2)中获得的DNA,鉴定与编码多肽的结构基因有效连接的启动子核酸内甲基化频率为至少0. 2的CpG位点,从而鉴定出CpG位点, b)针对包含核酸的细胞克隆,基于获自其培养物的至少10个拷贝的该核酸或10个细胞,确定步骤a)中鉴定的CpG位点的甲基化频率,其中所述核酸含有与步骤a)相同的启动子核酸有效连接的编码多肽的结构基因, c)选择在步骤b)中确定的甲基化频率低于通过測定非CpG位点的胞嘧啶甲基化而得到的平均值的2倍的细胞克隆,或 选择在步骤c)中确定的甲基化频率低于5%的细胞克隆。
2.用于选择细胞克隆的方法,其包括以下步骤 a)针对包含核酸的至少ー个细胞克隆的每ー个,其中所述核酸含有与具有SEQIDN0:01的核酸序列的启动子核酸有效连接的编码多肽的结构基因,基于从每个细胞克隆的培养物获得的至少10个拷贝的该核酸或者至少10个细胞所确定的甲基化,确定在选自SEQID NO:01的第80、96、425、437、563和591位的位置的CpG位点的甲基化频率, b)选择所确定的甲基化频率低于5%的细胞克隆。
3.根据前述权利要求之任一的方法,其特征在于所述确定包括以下步骤 1)从每个细胞克隆中分离DNA, 2)对每个分离的DNA分别进行甲基化特异性聚合酶链式反应, 3)根据步骤c-2)中得到的结果,确定CpG位点的甲基化频率。
4.根据权利要求3的方法,其特征在于步骤2)是 2)对每个分离的DNA分别以甲基化特异性引物和通用引物进行聚合酶链式反应。
5.根据权利要求3或4之任一的方法,其特征在于步骤2)是 2)以限制性内切酶分别消化所分离的DNA,对每个经消化的DNA以甲基化特异性引物和通用引物进行聚合酶链式反应。
6.根据权利要求I和3至5之任一的方法,其特征在于启动子核酸具有SEQID NOiOl的序列或包含其片段或其变体,且CpG位点选自SEQ ID N0:01的第80、96、425、437、563和591位、或SEQ ID N0:01的片段或变体中的对应位置。
7.根据权利要求3至6之任一的方法,其特征在于引物相互独立地选自SEQID NO:06至 SEQ ID NO:20。
8.根据权利要求3至7之任一的方法,其特征在于引物选自SEQIDN0:11、14和15,通用引物具有SEQ ID NO:09的序列,甲基化特异性引物选自SEQ ID NO: 17,18 19。
9.根据权利要求3至8之任一的方法,其特征在于通用引物具有SEQID N0:09和11的序列,甲基化特异性引物具有SEQ ID NO: 11和18的序列。
10.根据前述权利要求之任一的方法,其特征在于细胞克隆是CHO细胞克隆。
11.用于生产多肽的方法,其包括以下步骤a)以根据权利要求I至10之任一的方法选择细胞克隆, b)培养所选择的细胞克隆,和 c)从培养基和/或细胞克隆中回收多肽,和由此生产多肽。
12.根据权利要求11的方法,其特征在于在步骤a)之前包括以下步骤 a-3)提供非人的哺乳动物细胞, a-2)以包含与启动子核酸有效连接的编码多肽的结构基因的核酸转染所提供的细胞,a-l)i)可选地在存在选择试剂下培养所转染的细胞克隆,ii)将所转染的细胞进行单存放,和iii)在存在选择试剂下培养该单存放的转染细胞。
13.试剂盒,其包含 a)用于改变CpG位点中非甲基化胞嘧啶的试剂,和 b)选自SEQ ID NO:13、16、17、18、19 和 20 的引物。
全文摘要
本发明公开用于确定与编码多肽的核酸有效连接的启动子核酸的甲基化和由此确定细胞的长期生产力的方法。再一方面是通过确定与编码多肽的结构基因有效连接的启动子核酸的甲基化而用于选择生产多肽的细胞的方法。
文档编号C07K16/00GK102859001SQ201180018734
公开日2013年1月2日 申请日期2011年4月13日 优先权日2010年4月14日
发明者U·格普费特, A·奥斯特勒纳尔, S·斯梅斯 申请人:弗·哈夫曼-拉罗切有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1