基于使用表达增强性基因座来制备抗体的组合物和方法与流程

文档序号:16594330发布日期:2019-01-14 19:26阅读:443来源:国知局
基于使用表达增强性基因座来制备抗体的组合物和方法与流程

本申请要求2016年4月20日提交的美国临时申请no.62/325,400的优先权权益,其全部内容以引用方式并入本文。

发明领域

本公开涉及重组蛋白在真核细胞中的位点特异性整合和表达。具体地讲,本公开涉及通过采用表达增强性基因座来改善真核细胞、尤其是中国仓鼠(灰仓鼠(cricetulusgriseus))细胞系中的抗原结合蛋白(包括单特异性抗体和双特异性抗体)表达的组合物和方法。



背景技术:

细胞表达系统旨在提供用于制备给定蛋白(不论用于研究或治疗用途)的可靠且高效的来源。由于例如哺乳动物表达系统对重组蛋白进行适当的翻译后修饰的能力,哺乳动物细胞中的重组蛋白表达是用于制备治疗性蛋白的优选方法。

尽管可获得许多系统,但是仍存在用于表达重组蛋白的整合基因的高效基因转移和稳定性的挑战。对于目标转基因的长期表达,一个考虑因素是对细胞基因的破坏程度最小以避免细胞系表型的变化。

对稳定细胞系进行工程化以容纳用于表达的多个基因(例如多特异性抗体中的多条抗体链)是特别具有挑战性的。可能存在整合基因表达水平的大幅变化。整合额外基因可能由于局部遗传环境(即,位置效应)而引起表达的较大变化和不稳定性。用于产生多特异性抗原结合蛋白的表达系统通常需要旨在作为特异性多聚体形式配对的两个或更多个不同免疫球蛋白链的表达,并且可通常倾向于同型二聚体的产生,而非所需的异型二聚体或多聚体组合。因此,本领域中需要经改善的哺乳动物表达系统。



技术实现要素:

在一个方面,本公开提供了一种细胞,所述细胞含有位点特异性地整合在两个表达增强性基因座中的多个外源核酸,其中所述多个外源核酸共同编码抗原结合蛋白。所述抗原结合蛋白可为双特异性抗原结合蛋白或常规的单特异性抗原结合蛋白。

在一些实施方案中,提供了一种细胞,所述细胞含有整合在第一表达增强的基因座中的第一外源核酸,以及整合在第二表达增强的基因座中的第二外源核酸;其中所述第一外源核酸和所述第二外源核酸共同编码抗原结合蛋白。

在一些实施方案中,第一外源核酸含有编码第一重链片段(hcf)的核苷酸序列,并且第二外源核酸含有编码第一轻链片段(lcf)的核苷酸序列。

在一些实施方案中,第二外源核酸还包括编码第二hcf(也为hcf*)的核苷酸序列。在双特异性抗原结合蛋白中的第一hcf和第二hcf可为相同的或不同的。每个hcf-或lcf-编码核苷酸序列可编码来自恒定区的氨基酸。在一些实施方案中,编码第一hcf的核苷酸序列编码第一ch3结构域,并且编码第二hcf(hcf*)的核苷酸序列编码第二ch3结构域。在一些实施方案中,第一ch3结构域和第二ch3结构域的差异可在于至少一个氨基酸位置,例如导致不同蛋白a结合特性的位置。在其他实施方案中,编码第一ch结构域和第二ch结构域的核苷酸序列彼此的差异在于所述核苷酸序列之一已经经过密码子修饰。

在一些实施方案中,第一外源核酸(含有第一hcf-编码核苷酸序列)还包含编码第二lcf的核苷酸序列。第二lcf可与第二外源核酸中的第一lcf相同或不同。

在本案提供的细胞的许多实施方案中,编码hcf或lcf的核苷酸序列中的每一者独立地可操作地连接至启动子,使得每个hcf或lcf编码序列的转录被单独地调控。

在一些实施方案中,第一rrs和第二rrs相对于第一外源核酸分别位于5'和3',并且第三rrs和第四rrs相对于第二外源核酸分别位于5'和3',其中所述第一rrs和所述第二rrs不同,并且所述第三rrs和所述第四rrs不同。通常,侧接外源核酸的一对rrs内的rrs不同,以避免所述外源核酸的非预期重组和去除。在一些实施方案中,第一rrs、第二rrs、第三rrs和第四rrs彼此均不同。

在第一基因座中的第一外源核酸包括第一hcf-编码核苷酸序列且第二基因座中的第二外源核酸包括第一lcf-编码序列和第二hcf-编码序列两者的实施方案中,第一附加rrs可存在于编码第一lcf的核苷酸序列与编码第二hcf的核苷酸序列之间。所述附加rrs可不同于第一rrs、第二rrs、第三rrs和第四rrs中的每一者。在一些实施方案中,第一附加rrs被包括在所述可选标志基因可操作地连接的启动子与可选标志基因之间,或附加rrs可被包括在可选标志基因中、或在可选标志基因的内含子内,所述内含子存在于第一lcf-编码序列与hcf-编码序列之间、或在第一hcf-编码序列与第二hcf-编码序列之间。

在第一基因座中的第一外源核酸包括第一hcf-编码核苷酸序列和第二hcf-编码核苷酸序列且第二基因座中的第二外源核酸包括第一lcf-编码序列和第二hcf-编码序列两者的实施方案中,第一rrs和第二rrs相对于第一外源核酸可分别存在于5'和3',并且第三rrs和第四rrs相对于第二外源核酸可分别存在于5'和3',其中所述第一rrs和所述第二rrs不同,并且所述第三rrs和所述第四rrs不同。在一些实施方案中,第一hcf和第二hcf相同,并且第一lcf和第二lcf相同,在所述实例中,所述rrs可被工程化,使得第一rrs和第三rrs相同,并且第二rrs和第四rrs相同。在一些实施方案中,第一hcf和第二hcf不同,并且第一lcf和第二lcf相同,在所述实例中,所述rrs可被工程化,使得第一rrs、第二rrs、第三rrs和第四rrs彼此均不同。无论两个hcf是相同还是不同,附加rrs可存在于第一lcf-编码序列与第二hcf-编码序列之间,和/或存在于第二lcf编码序列与第一hcf-编码序列之间。所述附加(中间)rrs不同于第一rrs、第二rrs、第三rrs和第四rrs中的每一者。所述附加rrs可被包括在可选标志基因内、或在可选标志基因的内含子内,被放置在两个hcf/lcf编码序列之间。

在另一个方面,提供了含有整合在两个表达增强性基因座内的成对rrs的细胞,所述成对rrs可用于通过rmce来整合编码抗原结合蛋白的核酸。

在某些实施方案中,提供了含有整合在两个表达增强性基因座内的成对rrs的细胞,所述成对rrs可用于在重组酶的存在下通过rmce来同时整合编码抗原结合蛋白的核酸。

在一些实施方案中,提供了一种细胞,所述细胞含有从5'至3'整合在第一表达增强的基因座内的:第一rrs、第一外源核酸和第二rrs;从5'至3'整合在第二表达增强的基因座内的:第三rrs、第二外源核酸和第四rrs;其中所述第一rrs和所述第二rrs不同,并且所述第三rrs和所述第四rrs不同。

在一些实施方案中,第一外源核酸包括第一可选标志基因,并且第二外源核酸包括第二可选标志基因,其中所述第一可选标志基因和所述第二可选标志基因不同。

在一些实施方案中,第一外源核酸和第二外源核酸中的一者或两者可包括附加rrs,即介于第一基因座的第一rrs与第二rrs之间的附加rrs、和/或介于第三rrs与第四rrs之间的附加rrs。所述附加的中间rrs与5'和3'处的rrs不同。当附加rrs被包括在5'rrs与3'rrs之间(例如介于第一rrs与第二rrs之间)时,一个可选标志基因可被包括在所述5'rrs与附加(中间)rrs之间,并且另一个不同的可选标志基因可被包括在所述附加rrs与3'rrs之间。

在另一个实施方案中,所述细胞提供第一外源核酸,所述第一外源核酸包括第三rrs,即介于第一基因座中的第一rrs与第二rrs之间的附加rrs,其中所述第一rrs和所述第二rrs在表达盒的5'和3'端侧接两个选择标志物。在其他实施方案中,第二外源核酸也可包括相同的第三rrs,即介于第二基因座中的第一rrs与第二rrs之间的附加rrs,其中所述第一rrs和所述第二rrs在表达盒的5'和3'端侧接两个选择标志物。包括在第一rrs、第三rrs和第二rrs之间的四个可选标志基因彼此不同。

在另一个实施方案中,所述细胞提供第一外源核酸,所述第一外源核酸包括第三rrs,即介于第一基因座中的第一rrs与第二rrs之间的附加rrs,其中所述第一rrs和所述第二rrs在表达盒的5'和3'端侧接两个选择标志物。在其他实施方案中,第二外源核酸可包括第六rrs,即介于第二基因座中的第四rrs与第五rrs之间的附加rrs,其中所述第四rrs和第五rrs在表达盒的5'和3'端侧接两个选择标志物。包括在rrs之间的四个可选标志基因彼此不同。

在许多实施方案中,本案提供的细胞为cho细胞系的细胞。

在多个实施方案中,所利用的两个表达增强性基因座选自由下列各项所组成的组:含有与seqidno:1至少90%相同的核苷酸序列的基因座、含有与seqidno:2至少90%相同的核苷酸序列的基因座、以及含有与seqidno:3至少90%相同的核苷酸序列的基因座。

在又一个方面,载体组提供用于在细胞中整合和表达双特异性抗原结合蛋白。

在一些实施方案中,所述载体组包括:第一载体,其从5'至3'含有第一rrs、含有编码第一hcf的核苷酸序列的第一核酸、和第二rrs;第二载体,其从5'至3'含有第三rrs、含有编码第二hcf的核苷酸序列的第二核酸、第四rrs;以及编码第一lcf的核苷酸序列,所述核苷酸序列在第一载体中的第一核酸内、或在与第一载体和第二载体不同的第三载体中;其中所述第一rrs、所述第二rrs、所述第三rrs和所述第四rrs不同;其中所述双特异性抗原结合蛋白含有第一hcf、第二hcf和第一lcf,其中所述第一hcf和所述第二hcf不同。

在一些实施方案中,编码第一lcf的核苷酸序列在第一载体中的第一核酸内。在一些实施方案中,第一核酸还包括第一可选标志基因。

在一些实施方案中,编码第一lcf的核苷酸序列在第三载体内提供并侧接5'rrs和3'rrs,其中(i)所述3'rrs与第一rrs相同,并且所述5'rrs与第一rrs和第二rrs不同,或(ii)所述5'rrs与第二rrs相同,并且所述3'rrs与第一rrs和第二rrs不同。在一些实施方案中,所述载体可被设计成使得第一载体和第三载体所共用的共同rrs以断裂的可选标志基因形式(或断裂-内含子形式)提供,例如放置在位于第一载体和第三载体之一上的可选标志基因的5'部分的3'端,并且放置在位于另一载体上的可选标志基因的其余3'部分的5'端。

在一些实施方案中,所述载体组还包括编码第二lcf的核苷酸序列,所述核苷酸序列在第二载体中的第二核酸内、或在有别于第一载体、第二载体和第三载体的第四载体中提供。

在一些实施方案中,第一lcf和第二lcf相同。

在一些实施方案中,编码第一lcf的核苷酸序列被包括在第一载体中的第一核酸内,并且编码第二vl的核苷酸序列在第四载体上提供。在一些实施方案中,在第四载体上的编码第二lcf的核苷酸序列侧接5'rrs和3'rrs,其中(i)所述3'rrs与第三rrs相同,并且所述5'rrs与第三rrs和第四rrs不同,或(ii)所述5'rrs与第四rrs相同,并且所述3'rrs与第三rrs和第四rrs不同。在某些实施方案中,所述载体被设计成使得第二载体和第四载体所共用的共同rrs在断裂标志物(例如经由内含子)形式中提供,例如放置在位于第二载体和第四载体之一上的可选标志基因的5'部分的3'端,并且放置在位于另一载体中的可选标志基因的其余3'部分的5'端。

在一些实施方案中,编码第一lcf的核苷酸序列在第一载体中的第一核酸内,并且编码第二vl的核苷酸序列在第二载体上的第二核酸内。

在一些实施方案中,编码第一lcf的核苷酸序列在第三载体上,并且编码第二vl的核苷酸序列在第四载体上。在一些实施方案中,在第三载体上的编码第一lcf的核苷酸序列侧接5'rrs和3'rrs,其中(i)在第三载体上的3'rrs与第一rrs相同,并且在第三载体上的5'rrs与第一rrs和第二rrs不同,或(ii)在第三载体上的5'rrs与第二rrs相同,并且在第三载体上的3'rrs与第一rrs和第二rrs不同;其中在所述第四载体上的编码第二lcf的核苷酸序列侧接5'rrs和3'rrs,其中(i)在第四载体上的3'rrs与第三rrs相同,并且在第四载体上的5'rrs与第三rrs和第四rrs不同,或(ii)在第四载体上的5'rrs与第四rrs相同,并且在第四载体上的3'rrs与第三rrs和第四rrs不同。

在本文提供的载体组的许多实施方案中,编码第一hcf的核苷酸序列可编码第一ch3结构域,并且编码第二hcf的核苷酸序列可编码第二ch3结构域。在一些实施方案中,第一ch3结构域和第二ch3结构域的差异在于至少一个氨基酸。在一些实施方案中,编码第一ch3结构域和第二ch3结构域的核苷酸序列的差异在于所述核苷酸序列之一已经经过密码子修饰。

在本文提供的载体组的许多实施方案中,编码hcf或lcf的核苷酸序列中的每一者独立地连接启动子。

在一些实施方案中,载体组还可包括核苷酸序列,所述核苷酸序列编码识别所述rrs中的一个或多个的一种或多种重组酶,所述核苷酸序列可包括在lcf-或hcf-编码载体之一中或在单独的载体中提供。

在其他实施方案中,提供载体组,其包括:第一载体,所述第一载体含有第一核酸,所述第一核酸侧接5'同源臂和3'同源臂以整合到细胞的第一表达增强性基因座中;以及第二载体,所述第二载体含有第二核酸,所述第二核酸侧接5'同源臂和3'同源臂以整合到细胞的第二表达增强性基因座中;其中所述第一核酸和所述第二核酸共同编码抗原结合蛋白。

在又一个方面,本公开提供了系统,所述系统包括细胞(例如cho细胞)和一个或多个载体的组合并可用于制备将外源核酸整合在两个表达增强性基因座内的细胞,所述外源核酸共同编码作为单特异性蛋白或双特异性蛋白的抗原结合蛋白。例如,所述系统可以试剂盒的形式提供。

在某些实施方案中,提供了一种系统,所述系统包含细胞和载体组,其中所述细胞含有整合到其基因组的两个单独的表达增强的基因座的一组rrs,所述一组rrs彼此不同且分隔在一个或多个外源核酸(例如选择标志物)之间,用于与载体组中的目标基因重组交换;并且其中所述载体组中的rrs包含与所述细胞中的rrs的排列相同的排列。

在一些实施方案中,提供了一种系统,所述系统包含细胞和载体组,其中所述细胞含有从5'至3'整合在第一表达增强的基因座内的:第一rrs、第一外源核酸和第二rrs,以及从5'至3'整合在第二表达增强的基因座内的:第三rrs、第二外源核酸和第四rrs;其中所述第一rrs和所述第二rrs不同,并且第三rrs和第四rrs不同;其中所述第一表达增强的基因座和所述第二表达增强的基因座不同;其中所述载体组包括(i)第一载体,其从5'至3'含有:第一载体5'rrs、第一核酸和第一载体3'rrs,其中所述第一载体5'和3'rrs不同;(ii)第二载体,其从5'至3'含有:第二载体5'rrs、第二核酸和第二载体3'rrs,其中所述第二载体5'和3'rrs不同;以及(iii)编码第一hcf的核苷酸序列和编码第一lcf的核苷酸序列,其中所述两条重链-编码核苷酸序列之一在第一核酸中且另一核苷酸序列在第二核酸中;其中所述第一hcf和所述第一lcf为抗原结合蛋白的区;并且其中在将所述载体引入所述细胞时,所述载体内的第一核酸和第二核酸通过所述rrs介导的重组而分别整合到第一表达增强的基因座和第二表达增强的基因座中。

在一些实施方案中,所述抗原结合蛋白为单特异性抗原结合蛋白。

在一些实施方案中,第一rrs和第三rrs相同,并且第二rrs和第四rrs相同。在某些实施方案中,第一附加rrs存在于第一基因座中的第一rrs与第二rrs之间。在一些实施方案中,第一载体5'rrs与第一rrs和第三rrs相同;并且第一载体3'rrs、第二载体5'rrs和第一附加rrs相同;并且第二载体3'rrs与第二rrs和第四rrs相同。在一些实施方案中,lcf-编码核苷酸序列在第一载体中,并且hcf-编码核苷酸序列在第二载体中。在一些实施方案中,第一载体3'rrs放置在可选标志基因的5'部分的3'端,并且第二载体5'rrs放置在所述可选标志基因的其余可选标志基因3'部分的5'端。在其他实施方案中,第一载体5'rrs与第一rrs相同,第一载体3'rrs与第二rrs相同;并且其中第二载体5'rrs与第三rrs相同,第二载体3'rrs与第四rrs相同。

在多个实施方案中,所述抗原结合蛋白为双特异性抗原结合蛋白。

在一些实施方案中,所述系统中的载体组还包括编码第二hcf的核苷酸序列,所述第二hcf与第一hcf不同。

在一些实施方案中,编码第一lcf的核苷酸序列和编码第二hcf的核苷酸序列均包括在第一载体中的第一核酸中,并且编码第一hcf的核苷酸序列在第二载体中。在一些实施方案中,第一载体5'rrs与第一rrs相同,第一载体3'rrs与第二rrs相同,第二载体5'rrs与第三rrs相同,并且第二载体3'rrs与第四rrs相同。

在一些实施方案中,编码第二hcf的核苷酸序列在第三单独载体上,侧接第三载体5'rrs和第三载体3'rrs。在一些实施方案中,编码第一lc的核苷酸序列在第一载体中,编码第一hcf的核苷酸序列在第二载体中,第一载体5'rrs与第一rrs相同,第一载体3'rrs与第二载体5'rrs相同并且与第一附加rrs相同,并且第二载体3'rrs与第二rrs相同,第三载体5'rrs与第三rrs相同,第三载体3'rrs与第四rrs相同,其中所述第一附加rrs被包括在第一基因座中、介于第一rrs与第二rrs之间。在一些实施方案中,所述载体系被设计成以断裂标志物形式提供共同rrs,例如第一载体3'rrs放置在包括于第一载体中的可选标志基因的5'部分的3'端,并且第二载体5'rrs放置在包括于第二载体中的其余可选标志基因的5'端。

在一些实施方案中,所述系统中的载体组还包括编码第二lcf的核苷酸序列,所述第二lcf可与第一lcf相同或不同。

在一些实施方案中,编码第二lcf的核苷酸序列在第二载体的第二核酸中,其中第一载体5'rrs与第一rrs相同,第一载体3'rrs与第二rrs相同,第二载体5'rrs与第三rrs相同,并且第二载体3'rrs与第四rrs相同。

在一些实施方案中,编码第二lcf的核苷酸序列在第三单独载体中,侧接第三载体5'rrs和第三载体3'rrs。在一些实施方案中,第一载体5'和3'rrs分别与第一基因座中的第一rrs和第二rrs相同;第三载体5'rrs与第三rrs相同,第三载体3'rrs与第二载体'5rrs相同并且与在第二基因座中介于第三rrs和第四rrs之间的附加rrs相同,并且第二载体3'rrs与第四rrs相同。在一些实施方案中,所述共同rrs被设计成断裂标志物形式,例如第三载体3'rrs放置在包括于第三载体中的可选标志基因的5'部分的3'端,并且第二载体'5rrs放置在包括于第二载体中的可选标志基因的其余3'部分的5'端。

在本文提供的系统的许多实施方案中,编码hcf或lcf的核苷酸序列可编码来自恒定区的氨基酸。在一些实施方案中,编码第一hcf的核苷酸序列可编码第一ch3结构域,并且编码第二hcf的核苷酸序列可编码第二ch3结构域。在一些实施方案中,第一ch3结构域和第二ch3结构域的差异在于至少一个氨基酸。在一些实施方案中,编码第一ch3结构域和第二ch3结构域的核苷酸序列的差异在于所述核苷酸序列之一已经经过密码子修饰。

在本文提供的系统的许多实施方案中,编码hcf或lcf的核苷酸序列中的每一者独立地连接至启动子。

在一些实施方案中,系统的载体组还可包括核苷酸序列,所述核苷酸序列编码识别所述rrs中的一个或多个的一种或多种重组酶,所述核苷酸序列可包括在hcf-或lcf-编码载体之一中或在单独的载体中提供。

在多个实施方案中,本文所提供的系统中的细胞为cho细胞。

在多个实施方案中,所述两个表达增强的基因座选自由下列各项所组成的组:包含seqidno:1的核苷酸序列的基因座、包含seqidno:2的核苷酸序列的基因座、和包含seqidno:3的核苷酸序列的基因座。

在另一个方面,本公开还提供制备双特异性抗原结合蛋白的方法。在一个实施方案中,所述方法利用本文公开的系统并通过转染将所述系统的载体引入所述系统的细胞中。可筛选并鉴定经转染的细胞,其中外源核酸已通过rmce适当地整合到所述细胞的两个表达增强性基因座中。含hcf的多肽和含lcf的多肽可从所述整合的核酸表达,并且目标抗原结合蛋白可从鉴定的经转染的细胞获得,并使用已知的方法进行纯化。

在另一个实施方案中,所述方法简单地利用上述细胞,所述细胞含有共同编码抗原结合蛋白的整合于两个表达增强的基因座处的外源核酸,并从所述细胞表达所述抗原结合蛋白。

附图说明

图1对于常规的单特异性抗体,用于整合在一个表达增强性基因座相较于多个表达增强性基因座中的示例性抗体克隆策略。将两种载体转染到宿主细胞中,第一载体携带编码抗体链1(abc1)例如轻链的核酸,第二载体携带编码抗体链2(abc2)例如重链的核酸,以及与整合在宿主细胞的靶向基因座中的标志物不同的选择标志物。从5'到3':载体构建体的rrs1、中间rrs3和rrs2位点匹配宿主细胞的基因座中侧接选择标志物的rrs位点。转染到宿主细胞中的附加载体编码重组酶。当第二载体的选择标志物是抗生素抗性基因时,由于两种载体被工程化以合并允许表达标志物,因此选择阳性重组克隆以在抗生素中生长。或者,荧光标志物使得能通过荧光激活细胞分选(facs)分析来进行阳性克隆选择。相同的载体可用于在单个基因座,例如基因座(基因座1)处的位点特异性整合。

图2使用双载体克隆策略整合在一个表达增强性基因座内相对于整合在两个基因座内,将抗体a和抗体b克隆到如图1所描绘的基因座中。细胞被分离并经受12天加料分批培养,随后收获,并使用蛋白a传感器进行octet滴度测定。也观察到细胞是等基因型的和稳定的。观察到利用双位点整合方法的整体滴度增加0.5至0.9倍。

图3对于三条抗体链所编码的双特异性抗体,用于整合在一个表达增强性基因座中相较于整合在两个单独的表达增强性基因座中的示例性抗体克隆策略。三种载体用于此双特异性策略:第一载体,其携带核酸,所述核酸编码抗体链1(abc1)例如共同轻链,侧接rrs1和rrs3,以整合到(seqidno:1;基因座1)中;第二载体,其携带抗体链2(abc2)例如重链,具有上游选择标志物,侧接rrs4和rrs6,以整合到seqidno:2基因座中;以及另外的第三载体,其携带核酸,所述核酸编码第二拷贝abc1(所述第二拷贝abc1连接至与第二载体中的选择标志物不同的选择标志物,并且连接至抗体链3(abc3)例如第二(不同)重链),载体盒中的5’侧接rrs4且3'侧接rrs5(5'和3'rrs与宿主细胞中位于包含seqidno:2的基因座处的rrs位点匹配)。所示的双载体系统可用于单个基因座,例如基因座(包含seqidno:1;基因座1)处的位点特异性整合。分析来自各个生产细胞系的滴度,参见图5。

图4对于三条或四条抗体链所编码的双特异性抗体,用于整合在一个表达增强性基因座中相较于整合在两个单独的表达增强性基因座中的示例性抗体克隆策略。四种载体用于此双特异性策略:第一载体,其携带核酸,所述核酸编码抗体链1(abc1)例如第一轻链,侧接rrs1和rrs3,以整合到(seqidno:1;基因座1)中;第二载体,其携带抗体链2(abc2)例如重链,5′侧接rrs3且3′侧接rrs2,以同样整合到(seqidno:1;基因座1)中;第三载体,其携带核酸,所述核酸编码与第二载体中的选择标志物不同的选择标志物并且连接至抗体链3(abc3)例如第二(不同)重链),载体盒中的5’侧接rrs6且3'侧接rrs5(5'和3'rrs与宿主细胞中位于包含seqidno:2的基因座处的rrs位点匹配);以及另外的第四载体,其携带核酸,所述核酸编码第二轻链,例如抗体链1(abc1)的核酸(然而,可与第一轻链相同或不同)。所示的四载体系统可用于两个基因座,例如基因座(包含seqidno:1;基因座1)和包含seqidno:2或3的基因座处的位点特异性整合。将一个基因座(基因座;基因座1)处的四载体系统系整合与双载体系统整合进行比较。

图5使用双载体克隆策略整合在一个表达增强性基因座内相对于整合在两个基因座内,克隆双特异性抗体c和双特异性抗体d,细胞被分离并经受12天加料分批培养,随后收获并使用固定化抗-fc、和第二抗-fc*(经修饰的fc检测抗体,参见us2014-0134719a1,2014年5月15日公开)进行octet滴度测定。也观察到细胞是等基因型的和稳定的。相较于双特异性抗体(异型二聚体)在一个整合位点中的表达,利用双位点整合方法,观察到总双特异性滴度(异型二聚体形成)增加1.75至2倍。

图6a和6b.将双特异性抗体e(abe)、双特异性抗体f(abf)、双特异性抗体g(abg)、和双特异性抗体h(abh)克隆至rsx或rsx2bp中。表达每个双特异性抗体的细胞包含在一个表达增强性基因座(rsx)或两个表达增强的基因座(rsx2bp)中的(共同)轻链核苷酸、重链核苷酸(野生型fc)和经修饰的重链核苷酸(fc*)。细胞被分离并经受13天加料分批培养、随后收获并进行hplc洗脱方法,以测定整体抗体和双特异性抗体滴度(图6a)。将每个总抗体滴度的双特异性抗体物质滴度(从同型二聚体物质纯化出来)的比率确定为总ab的百分比(图6b)。

图7.单特异性抗体j和k(分别为abj和abk)被克隆到rsx或rsx2中。细胞被分离并经受13天加料分批培养、随后收获并进行hplc方法,以测定整体igg滴度。

具体实施方式

定义

如本文所用,术语“抗体”包括包含通过二硫键相互连接的四条多肽链(两条重链(h)和两条轻链(l))的免疫球蛋白分子。每条重链可以包含重链可变区(本文中缩写为hcvr或vh)和重链恒定区。重链恒定区包含三个结构域:ch1、ch2、ch3和铰链。每条轻链包含轻链可变区(本文中缩写为lcvr或vl)和轻链恒定区。轻链恒定区包含一个结构域cl。vh和vl区还可细分成称为互补决定区(cdr)的高变区,其间插有称为构架区(fr)的更保守的区。每个vh和vl由从氨基末端到羧基末端按照下述次序排列的三个cdr和四个fr组成:fr1、cdr1、fr2、cdr2、fr3、cdr3、fr4(重链cdr可缩写为hcdr1、hcdr2和hcdr3;轻链cdr可缩写为lcdr1、lcdr2和lcdr3。

短语"抗原结合蛋白"包括具有至少一个cdr并且能够选择性地识别抗原,即能够结合带有至少在微摩尔的范围内的kd的抗原的蛋白。治疗性抗原结合蛋白(例如治疗性抗体)经常需要在纳摩尔或皮摩尔的范围内的kd。通常,抗原结合蛋白包括两个或更多个cdr,例如2、3、4、5、或6个cdr。抗原结合蛋白的例子包括抗体、抗体的抗原结合片段,例如含有抗体的重链和轻链的可变区的多肽(例如fab片段、f(ab')2片段)、以及含有抗体的重链和轻链的可变区并含有来自重和/或轻链的恒定区(例如一个或多个恒定结构域,即cl、ch1、铰链、ch2、和ch3结构域中的一个或多个)的附加氨基酸的蛋白。

短语"双特异性抗原结合蛋白"包括能够选择性地结合两个或更多个表位或与所述两个或更多个表位具有不同特异性的抗原结合蛋白-在两个不同分子(例如抗原)上或在同一分子上(例如在同一抗原上)。此类蛋白的抗原结合部分或片段抗原结合(fab)部分对特定抗原具有特异性,并且通常由免疫球蛋白的重链可变区和轻链可变区构成。在一些情况下,重链可变区和轻链可变区可能不是同源对,换句话说,具有不同的结合特异性。

双特异性抗原结合蛋白的例子是”双特异性抗体”,其包括能够选择性地结合两个或更多个表位的抗体。双特异性抗体一般包含两条不同的重链,其中每条重链特异性结合不同表位—在两个不同分子(例如抗原)上或在同一分子上(例如在同一抗原上)。如果双特异性抗原结合蛋白能够选择性地结合两个不同的表位(第一表位和第二表位),则第一重链可变区对第一表位的亲和力一般将比第一重链可变区对第二表位的亲和力低至少一个至两个或三个或四个数量级,反之也然。双特异性抗原结合蛋白,例如双特异性抗体可包括识别相同抗原的不同表位的重链可变区。典型的双特异性抗体具有两条重链以及免疫球蛋白轻链,所述两条重链各自具有三个重链cdr,随后为(n末端至c末端)ch1结构结构域、铰链、ch2结构结构域和ch3结构结构域,所述免疫球蛋白轻链不赋予抗原结合特异性,但可与每条重链结合,或者可与每条重链结合并且可结合由重链抗原结合区结合的一个或多个表位,或者可与每条重链结合并且使得重链之一或两者能够与一个或两个表位结合。在一个实施方案中,fc结构域包括至少ch2和ch3。fc结构域可包括铰链、ch2结构域和ch3结构域。

一种具体化的双特异性形式包括第一重链(hc)、具有经修饰ch3(hc*)的第二重链、和共同轻链(lc)(同一轻链的两个拷贝)。另一个实施方案包括第一重链(hc)、共同lc和hc-scfv融合多肽(其中所述第二hc融合至scfv的n末端)。另一个实施方案包括第一hc、同源lc、hc-scfv融合多肽(其中所述第二hc融合至scfv的n末端)。另一个实施方案包括第一重链(hc)、lc和fc结构域。另一个实施方案包括第一hc、lc、scfv-fc融合多肽(其中所述fc融合至scfv的c末端)。另一个实施方案包括第一hc、共同lc、和fc-scfv融合多肽(其中所述fc融合至scfv的n末端)。另一个实施方案包括第一hc、lc和scfv-hc(其中所述第二hc融合至scfv的c末端)。

在某些实施方案中,一条重链(hc)可为天然的或"野生型"序列且第二重链可在fc结构域中被修饰。在其他实施方案中,一条重链(hc)可为天然的或”野生型”序列且第二重链的密码子可以是经过密码子修饰的。

术语"细胞"包括适于表达重组核酸序列,并且具有允许外源核酸的稳定整合和增强表达的基因座的任何细胞。细胞包括哺乳动物细胞,诸如非人类动物细胞、人类细胞或细胞融合物,例如杂交瘤或四源杂交瘤。在一些实施方案中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施方案中,细胞为选自下列细胞的哺乳动物细胞:cho(例如chok1、dxb-11cho、veggie-cho)、cos(例如cos-7)、视网膜细胞、vero、cv1、肾(例如hek293、293ebna、msr293、mdck、hak、bhk)、hela、hepg2、wi38、mrc5、colo205、hb8065、hl-60、(例如bhk21)、jurkat、daudi、a431(表皮的)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt060562、sertoli细胞、brl3a细胞、ht1080细胞、骨髓瘤细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如per.c6tm细胞)。

"细胞密度"是指单位样品体积中细胞的数量,例如总(活的和死的)细胞数/毫升。可以手动或自动(例如用流式细胞仪)对细胞的数量进行计数。已对自动细胞计数仪进行调适来使用例如标准台盼蓝摄取技术对活细胞的数量或死细胞的数量或活/死两种细胞的数量进行计数。短语"活细胞密度"或"活细胞浓度"是指每样品体积中活细胞的数量(也被称为"活细胞计数")。任意数量的众所周知的手册或自动技术可以用于确定细胞密度。可以测量培养物的在线生物质的量,其中电容或光密度与每体积中细胞的数量相关。细胞培养物例如生产培养物中最终细胞密度根据起始细胞系而变化,例如在约1.0至10×106个细胞/ml的范围内。在一些实施方案中,在从生产细胞培养物收获目标蛋白之前,最终细胞密度达到1.0至10×106个细胞/ml。在其他实施方案中,最终细胞密度达到大于5.0×106个细胞/ml,大于6×106个细胞/ml,大于7×106个细胞/ml,大于8×106个细胞/ml,大于9×106个细胞/ml,或大于10×106个细胞/ml。

术语"经过密码子修饰"意指编码蛋白的核苷酸序列已在一个或多个核苷酸(即一个或多个密码子)被修饰,而不改变所述密码子所编码的氨基酸,从而产生所述核苷酸序列的经过密码子修饰的形式。核苷酸序列的密码子修饰可为在基于核酸的测定(例如尤其是基于杂交的测定、pcr)中用于区分核苷酸序列与其经过密码子修饰的形式的便利基础。在一些情况下,通过采用本领域熟知的密码子优化技术使核苷酸序列经过密码子修饰,以提供所编码蛋白在宿主细胞中的改善或优化表达(gustafsson,c.等人,2004,trendsinbiotechnology,22:346–353;chung,b.k.-s.等人,2013,journalofbiotechnology,167:326–333;gustafsson,c.等人,2012,proteinexprpurif,83(1):37–46)。使用此类技术的序列设计软件工具在本领域中也是众所周知的,包括但不限于密码子优化器(fuglsanga.2003,proteinexprpurif,31:247–249),genedesigner(villalobosa等人,2006,bmcbioinforma,7:285),andoptimizer(puigbòp等人2007,nucleicacidsresearch,35:w126-w131)等等。

短语“互补决定区”或术语“cdr”包括由生物的免疫球蛋白基因的核酸序列编码的氨基酸序列,其通常(即在野生型动物中)出现在免疫球蛋白分子(例如抗体或t细胞受体)的轻链或重链的可变区中的两个构架区之间。cdr可由例如种系序列或者重排或未重排序列,以及例如天然或成熟的b细胞或t细胞编码。在一些情况下(例如对于cdr3),cdr可由两个或更多个序列(例如,种系序列)编码,所述两个或更多个序列是不邻接的(例如,未重排的核酸序列中),但在b细胞核酸序列中是邻接的,例如由于剪接或连接序列(例如,v-d-j重组以形成重链cdr3)。

术语”表达增强性基因座”是指细胞基因组中的基因座,所述基因座含有一序列或多个序列,当合适的基因或构建体是外源性地添加(即整合)至所述一个或多个序列中或接近所述一个或多个序列、或”可操作地连接”至所述一个或多个序列时,所述基因座表现出与所述基因组中的其他区或序列相比更高水平的表达。

术语“增强”在用于描述增强的表达时包括例如与相同表达构建体的单一拷贝的随机整合体池相比,超过通常通过将外源性序列随机整合到基因组中或通过整合在不同基因座所观察到的至少约1.5倍增强到至少约3倍增强的表达。采用本发明的序列所观察到的加倍表达增强是与在基本上相同的条件下、在本发明的序列不存在的情况下所测量的相同基因的表达水平相比,例如与整合到相同物种基因组中的另一基因座相比。增强的重组效率包括基因座重组能力的增强(例如,采用重组酶识别位点("rrs"))。增强是指超过随机重组(例如,不采用重组酶识别位点等)的重组效率,其通常是0.1%。优选增强的重组效率超过随机约10倍,或是约1%。除非规定,否则要求保护的发明不限于特定的重组效率。增强的表达基因座通常由宿主细胞支持目标蛋白的高生产率。因此,增强的表达包括每个细胞的目标蛋白的高产量(以蛋白克数计的升高滴度),而非简单地通过培养物中的细胞的高拷贝数得到高滴度。比生产率qp(pg/细胞/日,即pcd)被视为可持续生产力的量度。表现出大于5pcd、或大于10pcd、或大于15pcd、或大于20pcd、或大于25pcd、或甚至大于30pcd之qp的重组宿主细胞是合乎需要的。目标基因插入表达增强性基因座、或"热点"的宿主细胞表现出高的比生产率。

在关于目标基因座采用短语“外源性地添加的基因”或“外源性地添加的核酸”或简称为”外源核酸”的情况下,所述短语是指作为自然界中所发现的基因座目标在基因座内不存在的任何dna序列或基因。例如,cho基因座(例如包含seqidno:1或seqidno:2序列的基因座)内“外源核酸”可以是自然界中特定cho基因座内未发现的仓鼠基因(即,仓鼠基因来自仓鼠基因组的另一基因座)、来自任何其他物种的基因(例如人类基因)、嵌合基因(例如人类/小鼠)或自然界中未发现的任何其他基因存在于目标cho基因座内。

短语“重链”或“免疫球蛋白重链”包括来自任何生物的免疫球蛋白重链恒定区序列,并且除非另有说明,否则包括重链可变结构域。除非另有说明,否则重链可变结构域包括三个重链cdr和四个fr区。通常的重链在可变结构域之后具有(从n末端到c末端)ch1结构域、铰链、ch2结构域和ch3结构域。术语“重链的片段"包括重链的至少10、20、30、40、50、60、70、80、90、100或更多个氨基酸的肽,并且可包括一个或多个cdr、结合有一个或多个fr的一个或多个cdr、ch1、铰链、ch2或ch3中的一者或多者、可变区、恒定区、恒定区的片段(例如ch1、ch2ch3)、或它们的组合。hcf的例子包括vh,以及fc区的全部或部分。短语"编码hcf的核苷酸序列"包括编码由hcf组成的多肽的核苷酸序列和编码含有hcf的多肽的核苷酸序列,例如可含有除了指定hcf以外的附加氨基酸的多肽。例如,编码hcf的核苷酸序列包括编码由vh组成、由连接到ch3的vh组成、由完整重链组成的多肽等的核苷酸序列。

在核酸序列的情况下,“同源序列”是指基本上与参考核酸序列同源的序列。在一些实施例中,如果两个序列的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的相应核苷酸在相关的残基序列段上是相同的,那么这两个序列被认为是基本上同源的。在一些实施例中,相关序列段是完全序列。

短语“轻链”包括来自任何生物的免疫球蛋白轻链恒定区序列,并且除非另有说明,否则包括人κ和λ轻链。除非另有说明,否则轻链可变(vl)结构域通常包括三个轻链cdr和四个构架(fr)区。一般地,全长轻链从氨基末端到羧基末端包括包含fr1-cdr1-fr2-cdr2-fr3-cdr3-fr4的vl结构域和轻链恒定结构域。可用于本发明的轻链包括例如不选择性结合由双特异性抗体选择性结合的第一表位或第二表位的那些。合适的轻链还包括可结合或有助于结合抗体的抗原结合区所结合的表位中的一个或两个。术语"轻链的片段"或"轻链片段"(或"lcf")包括轻链的至少10、20、30、40、50、60、70、80、90、100或更多个氨基酸的肽,并且可包括一个或多个cdr、结合有一个或多个fr的一个或多个cdr、可变区、恒定区、恒定区的片段、或它们的组合。lcf的例子包括vl和轻链恒定区(“cl”)的全部或部分。短语"编码lcf的核苷酸序列"包括编码由lcf组成的多肽的核苷酸序列和编码含有lcf的多肽的核苷酸序列,例如可含有除了指定lcf以外的附加氨基酸的多肽。例如,编码lcf的核苷酸序列包括编码尤其由vl组成、或由完整轻链组成的多肽的核苷酸序列。

短语"可操作地连接"是指核酸或蛋白以所连接的分子如同预期般发挥作用的方式连接。dna区当在功能上彼此相关时是可操作地连接的。例如,如果启动子能够参与编码序列的转录,那么所述启动子被可操作地连接到所述序列;如果核糖体结合位点经定位以便允许翻译,那么所述核糖体结合位点被可操作地连接到编码序列。一般来说,可操作地连接可以包括但并不要求邻接。就如分泌性前导序列的序列来说,邻接并且适当放置在阅读框中是典型的特征。在目标基因座的表达增强性序列在功能上与目标基因(goi)相关的情况下,例如在其存在使得goi的表达增强的情况下,其被可操作地连接到goi。

当描述目标基因座,例如seqidno:1或seqidno:2或其片段时,“同一性百分比”意味着包括沿着邻接的同源区表现出所列举同一性的同源序列,但在相比较的序列中不具有同源性的间隙、缺失或插入的存在不纳入同一性百分比的计算中。

如本文所用,在例如seqidno:1或其片段与物种同源物之间的“同一性百分比”测定将不包括在比对中物种同源物无同源序列比较(即,seqidno:1或其片段在那一点处具有插入,或物种同系物具有间隙或缺失,视具体情况而定)的序列比较。因此,“同一性百分比”不包括间隙、缺失和插入的罚分。

“识别位点”或“识别序列”是由核酸酶或其他酶识别以结合并且引导dna主链的位点特异性裂解的特定dna序列。核酸内切酶在dna分子内裂解dna。识别位点在本领域中也被称为识别靶位点。

“重组酶识别位点”(或"rrs")是由重组酶,如cre重组酶(cre)或翻转酶(flp)识别的特定dna序列。位点特异性重组酶在其一个或多个目标识别序列被战略性置于生物体基因组中时,可以进行dna重排,包括缺失、倒位和易位。在一个实例中,cre在其dna目标识别位点loxp处特异性介导重组事件,所述识别位点是由通过8-bp间隔子分隔开的两个13-bp反向重复序列构成。可以采用不止一个重组酶识别位点,例如以有助于重组介导的dna交换。也可以采用重组酶识别位点(例如lox位点)的变异体或突变体(araki,n.等人,2002,nucleicacidsresearch,30:19,e103)。

“重组酶介导的盒式交换”或"rmce”涉及一种用供体盒精确替换基因组目标盒的方法。通常为了进行此方法所提供的分子组合物包括1)5'和3’侧接对特定重组酶具有特异性的识别靶位点的基因组目标盒、2)侧接匹配的识别靶位点的供体盒和3)位点特异性重组酶。重组酶蛋白在本领域中是众所周知的(turan,s.和bodej.,2011,fasebj.,25,第4088-4107页)并且能够精确裂解特定识别靶位点内的dna(dna的序列)而不增加或丢失核苷酸。常见重组酶/位点组合包括(但不限于)cre/lox和flp/frt。市售的试剂盒也提供含有r4-attp位点的载体和编码phic31整合酶的载体,以用于rmce。(也参见,例如美国公开申请no.us20130004946.)

"位点特异性整合"或"靶向插入"是指用于引导基因或核酸序列插入或整合到基因组中的特定位置,即,引导dna到相连聚核苷酸链中两个核苷酸之间的特异性位点的基因靶向方法。位点特异性整合或靶向插入也可针对包括多个表达单元或盒的核定特酸,例如多个基因,各自具有其本身的调控元件(例如启动子、增强子和/或转录终止序列)。“插入”和“整合”可互换使用。应理解,基因或核酸序列(例如包含表达盒的核酸序列)的插入可能导致(或可能经工程化以使得)一个或多个核酸的替代或缺失,这取决于所采用的基因编辑技术。

"稳定整合"意指整合到宿主细胞基因组中的外源核酸在细胞培养物中维持整合持续一段时间,例如,至少7天、至少10天、至少15天、至少20天、至少25天、至少30天、至少35天、至少40天、至少45天、至少50天、至少55天、至少60天或更长。应当理解的是,大规模制造和纯化双特异性抗原结合蛋白是一项具有挑战性的任务。稳定性和克隆性对任何生物分子的再现性至关重要,尤其是治疗上使用的生物分子。通过本公开的方法所制备的表达双特异性抗体的稳定克隆提供了产生治疗性生物分子的相同且可再现的方式。

一般说明

本公开提供了通过在宿主细胞中采用多个(例如两个)表达增强性基因座来改善宿主细胞、尤其是中国仓鼠(灰仓鼠(cricetulusgriseus))中的多个多肽表达的组合物和方法。更具体地,本公开提供了被设计成以位点特异性方式使共同编码抗原结合蛋白的多个外源核酸整合到宿主细胞例如cho细胞中的多个表达增强性基因座中的组合物和方法。具体地讲,本公开提供了含有整合到多个表达增强性基因座中的多个外源核酸的细胞,其中所述多个外源核酸共同编码抗原结合蛋白。本公开还提供被设计成将多个外源核酸位点特异性地整合到多个表达增强性基因座的核酸载体。本公开另外提供了系统,所述系统包括在多个表达增强性基因座中的每一者处含有多个重组酶识别位点(rrs)的宿主细胞,以及含有匹配的rrs和多个外源核酸的载体组,以供来自所述载体的多个外源核酸位点特异性地整合到多个表达增强性基因座中。另外,本公开提供了使用本文所公开的细胞、载体和系统制备抗原结合蛋白的方法。

具有位点特异性地整合到多个表达增强性基因座中的多个外源核酸的细胞

在一个方面,本公开提供了一种细胞,所述细胞含有位点特异性地整合在两个表达增强性基因座中的多个外源核酸,其中所述多个外源核酸共同编码抗原结合蛋白。所述抗原结合蛋白可为双特异性抗原结合蛋白或常规的(即单特异性)抗原结合蛋白。

本文提供的细胞能够产生具有高滴度和/或高比生产率(pg/细胞/日)的所需抗原结合蛋白。在一些实施方案中,细胞产生至少1g/l、1.5g/l、2.0g/l、2.5g/l、3.0g/l、3.5g/l、4.0g/l、4.5g/l、5.0g/l、10g/l或更大滴度的抗原结合蛋白。在一些实施方案中,产生抗原结合蛋白的细胞具有至少5、6、7、8、9、10、11、12、13、14、15皮克/细胞/日或更高的比生产率,所述比生产率是基于每日每个细胞产生的总抗原结合蛋白(以pg计)来测定。

包含共同编码抗原结合蛋白并整合在两个增强的表达基因座内的外源核酸的宿主细胞在生产培养物中表现出高细胞密度,例如,1至10×106个细胞/ml。在其他实施方案中,编码抗原结合蛋白的宿主细胞达到的最终细胞密度为至少5×106个细胞/ml、6×106个细胞/ml、7×106个细胞/ml、8×106个细胞/ml、9×106个细胞/ml或10×106个细胞/ml(在生产培养物中)。

在一些实施方案中,提供了一种细胞,其能够以双特异性抗原结合蛋白滴度相对于总抗原结合蛋白滴度为至少5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高的比率来产生双特异性抗原结合蛋白。在一些实施方案中,提供了一种细胞,其能够产生双特异性抗原结合蛋白,其中所述双特异性抗原结合蛋白滴度的比率为所述细胞所产生的总抗原结合蛋白滴度的至少50%。

在其他实施方案中,提供了一种细胞,其能够产生抗原结合蛋白,其中所述由两个基因座中的表达所产生的总抗原结合蛋白滴度相较于由一个基因座中的表达所产生的总抗原结合蛋白滴度为至少5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高。在某些实施方案中,提供了一种细胞,其能够产生抗原结合蛋白,其中所述由两个基因座中的表达所产生的总抗原结合蛋白滴度相较于由一个基因座中的表达所产生的总抗原结合蛋白滴度为至少0.5倍、0.75倍、1倍、1.5倍、1.75倍、2倍或更高。

在一些实施方案中,所述细胞含有第一外源核酸,其整合在第一表达增强的基因座内的特异性位点处;和第二外源核酸,其整合在第二表达增强的基因座内的特异性位点处;其中所述第一外源核酸和所述第二外源核酸共同编码抗原结合蛋白。第一外源核酸和第二外源核酸一起包括编码抗原结合蛋白的hcf或lcf(例如可变区)的多个核苷酸序列。例如,就单特异性抗体而言,对于单特异性抗原结合蛋白,可存在编码hcf(例如vh)的一个核苷酸序列和编码lcf(例如vl)的一个核苷酸序列、或每一者的多个拷贝(例如两个拷贝)。就双特异性抗体而言,可存在各自编码hcf(通常两个hcf彼此不同)的两个核苷酸序列、编码lcf的核苷酸序列的一个或两个拷贝、或编码两个不同lcf的两个核苷酸序列。取决于抗原结合蛋白是单特异性还是双特异性,编码hcf或lcf(例如可变区)的核苷酸序列可以不同变型或组合整合在两个表达增强的基因座中。例如,就单特异性抗原结合蛋白而言,在一个实例中,编码hcf的核苷酸序列和编码lcf的核苷酸序列可单独地整合在两个基因座中,一个核苷酸序列在每个基因座处;而在另一个实例中,编码hcf和lcf的核酸系整合在一个基因座处,并且编码相同hcf和相同lcf的单独核酸整合在另一基因座处。就双特异性抗原结合蛋白而言,在一个实例中,编码第一hcf和lcf的核苷酸序列可整合到第一基因座中,并且编码第二hcf的核苷酸序列整合到第二基因座中,其中所述两个hcf不同,所述lcf为双特异性抗原结合蛋白的共同lcf;而在另一个实例中,编码第一hcf和lcf的核苷酸序列整合到第一基因座中,并且编码第二hcf与相同lcf的核苷酸序列整合到第二基因座中。

在一些实施方案中,编码hcf或lcf的核苷酸序列可编码来自恒定区的氨基酸。例如,编码hcf或lcf的核苷酸序列可编码cl、ch1、ch2、ch3中的一个或多个、或ch1、ch2或ch3的组合、或可编码整个恒定区。在一些实施方案中,编码hcf的核苷酸序列编码ch3结构域。在特定实施方案中,编码hhcf的核苷酸序列编码重链。在一些实施方案中,编码lcf的核苷酸序列编码轻链。

在涉及两个hcf的实施方案中,编码第一hcf的核苷酸序列可编码来自第一恒定区的氨基酸,并且编码第二hcf的核苷酸序列可编码来自第二恒定区的氨基酸,其中来自所述两个恒定区的氨基酸可在至少一个位置相同或不同(例如产生不同的蛋白a结合特性的位置、或下文就各种双特异性抗原结合蛋白说明的其他位置)。与氨基酸的差异无关,编码来自两个恒定区的氨基酸的两个核苷酸序列可通过修饰一个核苷酸序列的一个或多个密码子来区分,这提供了在基于核酸的测定中区分所述两个核苷酸序列的便利基础。

在一些实施方案中,每个hcf-或lcf-编码核苷酸序列独立地并且可操作地连接至含有启动子的转录调控序列。所谓"独立地"是指每个编码序列可操作地连接至单独的转录调控序列,例如启动子,使得所述编码序列的转录处于单独的调控和控制之下。在一些实施方案中,引导所述两个含hcf多肽的转录的启动子相同。在一些实施方案中,引导所述两个含hcf多肽的转录的启动子,以及引导含vl多肽的转录的启动子均相同,例如cmv启动子。在一些实施方案中,每个hcf-或lcf-编码核苷酸序列独立地并且可操作地连接至诱导型或阻抑型启动子。诱导型和阻抑型启动子容许生产仅在生产期(加料分批培养)而不在生长期(种子培养)期间发生;或精确地以差异化方式控制在不同基因座中的抗体组分(hcf与lcf)的表达。每个基因产物的产生(表达)的精细控制可通过不同的启动子来实现。

在一个此类实例中,细胞首先被工程化以表达四环素阻遏蛋白(tetr),并且将每个hcf-和lcf-编码核苷酸序列置于活性受tetr调控的启动子的转录控制之下。两个串联的tetr操纵子(teto)置于紧邻cmv启动子的下游。在一些实施方案中,每个hcf-和/或lcf-编码核苷酸序列独立地并且可操作地连接至至少一个tetr操纵子(teto)或arc操纵子(arco)上游的启动子。在其他实施方案中,每个hcf-和/或lcf-编码核苷酸序列独立地并且可操作地连接至cmv/teto或cmv/arco杂合启动子。另外的合适的启动子在下文中描述。

在一些实施方案中,整合在两个基因座处的多个外源核酸侧接rrs。例如,第一rrs和第二rrs分别位于相对于整合在第一基因座处的第一外源核酸的5'和3',并且第三rrs和第四rrs分别位于相对于整合在第二基因座处的第二外源核酸的5'和3',其中所述第一rrs和所述第二rrs不同,并且第三rrs和第四rrs不同。在一些实施方案中,第一rrs、第二rrs、第三rrs和第四rrs彼此均不同。在其他实施方案中,第一rrs和第三rrs相同,并且第二rrs和第四rrs'相同,其中所述第一外源核酸编码hcf和lcf,并且所述第二外源核酸编码相同的hcf和lcf。

在一些实施方案中,当整合在基因座处的外源核酸包括两个hcf或lcf-编码核苷酸序列时,附加rrs可被包括在所述两个核苷酸序列之间。此类附加rrs应与侧接外源核酸的两个rrs不同。在一些实施方案中,附加rrs插入包括在整合的外源核酸中并位于两个hcf或lcf-编码核苷酸序列之间的可选标志基因的内含子中。在转录与转录后处理之后,所述内含子将被切除,从而生成编码所述可选标志物的mrna。在整合在第一基因座处的外源核酸和整合在第二基因座处的外源核酸均包括两个hcf或lcf-编码序列(例如lcf-hcf1和lcf-hcf2)的实施方案中,附加rrs可被包括在每个基因座处的两个hcf或lcf-编码序列之间的第一外源核酸和第二外源核酸中的仅一者、或两者内。第一基因座的附加rrs可与第二基因座的附加rrs相同或不同。每个附加rrs应与侧接在整合在所述基因座处的外源核酸的两个rrs不同。每个附加rrs可任择地插入可选标志基因的内含子,并且在所述两个基因座中具有内含子的可选标志基因可不同。

在多个hcf或lcf-编码序列被包括在整合在基因座处的外源核酸的情况下,所述多个编码序列在所述基因座中的相对位置可变化。例如,在整合的外源核酸包括lcf-编码核苷酸序列和hcf-编码核苷酸序列的实施方案中,所述lcf-编码核苷酸序列可位于相对于所述hcf-编码核苷酸序列的上游或下游。在特定实施方案中,所述lcf-编码核苷酸序列位于相对于所述hcf-编码核苷酸序列的上游。在两个基因座包括lcf-编码核苷酸序列和hcf-编码核苷酸序列的情况下,在特定实施方案中,在两个基因座中,所述lcf-编码核苷酸序列均位于所述hcf-编码核苷酸序列的上游。

在另外的实施方案中,提供含有整合在第一表达增强的基因座内的第一对rrs和整合在第二表达增强的基因座内的第二对rrs的细胞,其中每对内的两个rrs不同。此类细胞可用于接收共同编码抗原结合蛋白的待被整合的多个外源核酸。

在一些实施方案中,第一外源核酸存在于第一基因座处的两个rrs之间,并且第二外源核酸存在于第二基因座处的两个rrs之间。第一外源核酸和第二外源核酸可各自编码一个或多个可选标志基因。可选标志基因可彼此不同。

在一些实施方案中,附加rrs存在于基因座处的所述对中的两个rrs(即5'rrs与3'rrs)之间,其中所述附加rrs与所述基因座处的5'rrs和3'rrs两者不同。在一些实施方案中,附加rrs存在于所述两个基因座之一处的5'rrs与3'rrs之间;在其他实施方案中,附加rrs存在于所述两个基因座中的每一个处的5'rrs与3'rrs之间。在附加rrs存在于5'rrs与3'rrs之间的情况下,可选标志基因可被包括在所述5'rrs和所述附加rrs之间,并且另一可选标志基因可被包括在所述附加rrs和所述3'rrs之间,并且所述两个可选标志物不同。

在所述许多实施方案中,所述细胞为cho细胞,其中两个表达增强的基因座之一选自由下列各项所组成的组:与seqidno:1至少90%相同的核苷酸序列、与seqidno:2至少90%相同的核苷酸序列、以及与seqidno:3至少90%相同的核苷酸序列。

双特异性抗原结合蛋白

适于在本公开中所述的细胞、载体和系统中克隆和生产的双特异性抗原结合蛋白例如双特异性抗体并不限于双特异性抗原结合蛋白的任何特定形式。

在多个实施方案中,双特异性抗原结合蛋白包括各自含有抗原结合部分(例如hc)和ch3结构域的两个多肽,其中所述两个多肽的抗原结合部分具有不同抗原特异性,并且其中所述两个ch3结构域相对于彼此是异型二聚体,因为所述ch3结构域之一已在至少一个氨基酸位置处经过修饰,以生成所述两个多肽之间的区分性蛋白a结合特性。参见,例如美国专利8,586,713中所述的双特异性抗体。以此方式,可采用区分性蛋白a分离方案来容易地从异型二聚体中分离异型二聚体的双特异性抗原结合蛋白。

在一些实施方案中,双特异性抗原结合蛋白包括两条重链,所述两条重链具有不同抗原特异性并且差异在于ch3结构域中的至少一个氨基酸位置,以产生所述两条重链之间的区分性蛋白a结合特性。

在一些实施方案中,所述两个多肽含有人igg的ch3结构域,其中所述两个多肽之一含有选自igg1、igg2和igg4的人igg的ch3结构域,所述两个多肽的另一个含有选自igg1、igg2和igg4的人igg的经修饰的ch3结构域,其中所述修饰减少或消除了经修饰的ch3区与蛋白a的结合。在特定实施方案中,所述两个多肽之一含有人igg1的ch3结构域,所述两个多肽的另一个含有人igg1的经修饰的ch3结构域,其中所述修饰选自由imgt外显子编号系统中的(i)95r和(ii)95r和96f所组成的组。在其他特定实施方案中,经修饰的ch3结构域包含选自由imgt外显子编号系统中的16e、18m、44s、52n、57m和82i所组成的组的一至五个附加修饰。

在其他各种实施方案中,所述两个多肽含有小鼠igg的ch3结构域,其中所述两个多肽之一含有未修饰小鼠igg的ch3结构域,并且所述两个多肽的另一个含有小鼠igg的经修饰的ch3结构域,其中所述修饰减少或消除了经修饰的ch3区与蛋白a的结合。在多个实施方案中,小鼠igg的ch3区经过修饰,以在特定位置处包含特定氨基酸(eu编号),其选自由下列各项组成的组:252t、254t、和256t;252t、254t、256t、和258k;247p、252t、254t、256t和258k;435r和436f;252t、254t、256t、435r和436f;252t、254t、256t、258k、435r和436f;24tp、252t、254t、256t、258k、435r和436f;以及435r。在特定实施方案中,进行特定的一组修饰,其选自由下列各项组成的组:m252t、s254t、s256t;m252t、s254t、s256t、i258k;i247p、m252t、s254t、s256t、i258k;h435r、h436f;m252t、s254t、s256t、h435r、h436f;m252t、s254t、s256t、i258k、h435r、h436f;i247p、m252t、s254t、s256t、i258k、h435r、h436f;以及h435r。

在多个实施方案中,双特异性抗原结合蛋白是小鼠和大鼠单克隆抗体或抗原结合蛋白的杂交体,例如小鼠igg2a和大鼠igg2b的杂交体。根据这些实施方案,双特异性抗体由两个抗体的异型二聚体构成,其包含各自通过fc部分结合的一个重/轻链对。所需的异型二聚体可轻易地从两个亲本抗体同型二聚体和双特异性异型二聚体的混合物纯化,因为双特异性抗体和蛋白a的结合特性与亲代抗体和蛋白a的结合特性不同:大鼠igg2b不会结合至蛋白a,而小鼠igg2a会。因此,小鼠-大鼠异型二聚体结合至蛋白a,但以比小鼠igg2a同型二聚体更高ph洗脱,并且这使得双特异性异型二聚体的选择性纯化成为可能。

在其他各式实施方案中,双特异性抗原结合蛋白具有本领域中称为"杵-进入-臼(knobs-into-holes)"的形式(参见,例如美国专利no.7,183,076)。在这些实施方案中,两个抗体的fc部分被工程化,以产生一个突出的"杵",另一者为互补的"臼"。当在同一细胞中生产时,通过将工程化的"杵"与工程化的"臼"相连,据说重链优先形成异型二聚体,而非同型二聚体。

在另一个实施方案中,第一重链和第二重链包含在ch3结构域中的一个或多个氨基酸修饰,以实现两个重链之间的相互作用。ch3-ch3界面氨基酸残基可用带电荷的氨基酸置换,以提供不利静电的同型二聚体形成。(参见例如pct公开号wo2009089004;和欧洲专利公开no.ep1870459。)

在其他实施方案中,第一重链包含同型iga的ch3结构域,第二重链包含igg的ch3结构域(或反之也然),以促进异型二聚体的优先形成。(参见例如.pct公开号wo2007110205。)

在其他实施方案中,可通过工程化方法将各种形式并入免疫球蛋白链中,以促进异型二聚体的形成,例如fab-臂交换(pct公开号pct公开号wo2008119353;pct公开号wo2011131746)、卷曲螺旋结构域相互作用(pct公开号wo2011034605)或亮氨酸拉链肽(kostelny等人j.immunol.1992,148(5):1547-1553)。

可用于生成双特异性抗原结合蛋白的免疫球蛋白重链片段(例如可变区)可使用本领域已知的任何方法生成。例如,第一重链包含由已用第一抗原免疫的第一动物的成熟b细胞的基因组所衍生的核酸编码的可变区,第一重链特异性识别第一抗原;并且第二重链包含由已用第二抗原免疫的第二动物的成熟b细胞的基因组所衍生的核酸编码的可变区,第二重链特异性识别第二抗原。免疫球蛋白重链可变区序列也可通过本领域已知的任何其他方法获得,例如通过噬菌体展示获得。在其他实例中,编码重链可变区的核酸包括这些在本领域已经描述或以其他方式可获得的抗体的核酸。在一些实施方案中,所述两个重链编码序列之一已经经过密码子修饰,以提供在基于核酸的测定中区分所述两个编码序列的便利基础。

包含识别两个不同表位(或两个不同抗原)的两条重链的双特异性抗体更易于分离,其中它们可与相同的轻链(即具有相同的可变和恒定结构域的轻链)配对。本领域已知多种方法用于生成可与两条不同特异性的重链配对的轻链,同时不干扰或实质上不干扰重链可变结构域与其靶抗原的选择性和/或亲和力,如描述于例如美国专利8,586,713和其中所述公开的技术。

所述双特异性抗原结合蛋白可具有多种双重抗原特异性和相关的有用应用。

在一些实例中,可制备包含针对肿瘤抗原和t细胞抗原的结合特异性的双特异性抗原结合蛋白,其靶向细胞上的抗原,例如cd20,也靶向t细胞上的抗原细胞,例如t细胞受体,例如cd3。以此方式,双特异性抗原结合蛋白靶向患者的目标细胞(例如,淋巴瘤患者的b细胞,经由cd20结合)以及患者的t细胞。在多个实施方案中,双特异性抗原结合蛋白被设计成在结合cd3时活化t细胞,从而将t细胞活化耦联至特定的选定肿瘤细胞。

就双特异性抗原结合蛋白而言,其中所述一个部分结合至t细胞受体,例如结合至cd3,并且另一部分结合至靶抗原,靶抗原可为肿瘤相关抗原。特定肿瘤相关抗原的非限制例子包括,例如例如afp、alk、bage蛋白、birc5(存活素)、birc7、β-连环蛋白、brc-abl、brca1、bcma、boris、ca9、碳酸酐酶ix、半胱天冬酶-8、calr、ccr5、cd19、cd20(ms4a1)、cd22、cd30、cd40、cdk4、cea、clec-12、ctla4、cyclin-b1、cyp1b1、egfr、egfrviii、erbb2/her2、erbb3、erbb4、etv6-aml、epcam、epha2、fra-1、folr1、gage蛋白(例如,gage-1、-2)、gd2、gd3、globoh、磷脂酰肌醇蛋白聚糖-3、gm3、gp100、her2、hla/b-raf、hla/k-ras、hla/mage-a3、htert、lmp2、mage蛋白(例如,mage-1、-2、-3、-4、-6、and-12)、mart-1、间皮素、ml-iap、muc1、muc2、muc3、muc4、muc5、muc16(ca-125)、mum1、na17、ny-br1、ny-br62、ny-br85、ny-eso1、ox40、p15、p53、pap、pax3、pax5、pcta-1、plac1、prlr、prame、psma(folh1)、rage蛋白、ras、rgs5、rho、sart-1、sart-3、steap-1、steap-2、tag-72、tgf-β、tmprss2、thompson-nouvelle抗原(tn)、trp-1、trp-2、酪氨酸酶、和尿路上皮分化特异糖蛋白-3。在一些实施方案中,双特异性抗原结合蛋白包含结合cd3的一个部分。例示的抗-cd3抗体部分描述于美国专利申请公开号us2014/0088295a1和us20150266966a1,以及在2017年3月30日公开的国际专利公开号wo2017/053856中,所有这些专利均以引用的方式并入本文)。在其他实施方案中,双特异性抗原结合蛋白包含结合至cd3的一个部分和结合至bcma、cd19、cd20、cd28、clec-12、her2、hla蛋白、mage蛋白、muc16、psma或steap-2的一个部分。在其他实施方案中,双特异性抗原结合蛋白选自由下列各项组成的组:抗-cd3x抗-cd20双特异性抗体(如美国专利申请公开号us2014/0088295a1和us20150266966a1中所述,以引用方式并入本文),抗-cd3x抗粘蛋白16双特异性抗体(例如抗-cd3x抗-muc16双特异性抗体)和抗-cd3x抗前列腺特异性膜抗原双特异性抗体(例如抗-cd3x抗-psma双特异性抗体)。

就双特异性抗原结合蛋白而言,其中所述一个部分结合至t细胞受体,例如结合至cd3,并且另一部分结合至靶抗原,靶抗原可为传染病相关抗原。传染病相关抗原的非限制例子包括,例如在病毒颗粒的表面上表达或优先在已感染病毒的细胞上表达的抗原,其中所述病毒选自由下列各项组成的组:hiv、肝炎(a、b或c)、疱疹病毒(例如hsv-1、hsv-2、cmv、hav-6、vzv、eb病毒)、腺病毒、流感病毒、黄热病毒、埃可病毒、鼻病毒、柯萨奇病毒、冠状病毒、呼吸道融合病毒、腮腺炎病毒、轮状病毒、麻疹病毒、风疹病毒、细小病毒、牛痘病毒、htlv、登革热病毒、乳头瘤病毒、软疣病毒、脊髓灰质炎病毒、狂犬病病毒、jc病毒和芳香病毒性脑炎病毒。或者,靶抗原可为在细菌表面上表达或优先在已感染细菌的细胞上表达的抗原,其中所述细菌选自由下列各项组成的组:衣原体、立克次体(rickettsia)、分枝杆菌、葡萄球菌、链球菌、肺炎球菌、脑膜炎球菌、淋球菌、克雷伯氏菌、变形杆菌、沙雷氏菌、假单胞菌、军团杆菌、白喉病菌、沙门氏菌、杆菌、霍乱杆菌、破伤风杆菌、肉毒杆菌、炭疽杆菌、鼠疫杆菌、钩端螺旋体和莱姆病菌。在某些实施方案中,靶抗原是在真菌表面上表达或优先在已感染真菌的细胞上表达的抗原,其中所述真菌选自由下列各项组成的组:念珠菌(白色念珠菌、克鲁斯氏(krusei,)念珠菌、光滑念珠菌、热带念珠菌等等)、新生隐球菌(crytococcusneoformans)、曲霉(烟曲霉、黑曲霉等等)、毛霉菌目(毛霉属、犁头霉属、根霉属等等)、丝状芽孢杆菌(sporothrixschenkii)、皮肤癣菌(blastomycesdermatitidis)、巴西隐孢子菌(paracoccidioidesbrasiliensis)、球孢子虫(coccidioidesimmitis)和组织胞浆菌(histoplasmacapsulatum)。在某些实施方案中,靶抗原是在寄生虫的表面上表达或优先在已感染寄生虫的细胞上表达的抗原,其中所述寄生虫选自由下列各项组成的组:痢疾阿米巴原虫(entamoebahistolytica)、大肠纤毛虫(balantidiumcoli)、福氏耐格里变形虫(naegleriafowleri)、棘阿米巴属(acanthamoebasp.)、梨形鞭毛虫(giardialambia)、隐胞子虫属(cryptosporidiumsp.)、肺囊虫(pneumocystiscarinii)、间日疟原虫(plasmodiumvivax)、巴贝西虫(babesiamicroti)、布氏锥虫(trypanosomabrucei)、克氏锥虫(trypanosomacruzi)、杜氏利什曼原虫(leishmaniadonovani)、弓形虫(toxoplasmagondii)、巴西日圆线虫(nippostrongylusbrasiliensis)、肥头带绦虫(taeniacrassiceps)和马来丝虫(brugiamalayi)。特异性病原体相关抗原的非限制例子包括例如hivgp120、hivcd4、乙型肝炎肝糖蛋白l、乙型肝炎糖蛋白m、乙型肝炎肝糖蛋白s、丙型肝炎e1、丙型肝炎e2、肝细胞特异性蛋白、单纯疱疹病毒gb、巨细胞病毒gb、和htlv包膜蛋白。

也可制备包含两个结合部分的双特异性结合蛋白,这些结合部分各自指向同一细胞表面上的结合伴侣(即各自指向不同靶)。这种设计尤其适用于靶向在同一细胞表面上表达两种靶的特定细胞或细胞类型。尽管靶可能单独出现在其他细胞上,但是这些结合蛋白的结合部分被选择成使得每个结合部分以相对低的亲和力结合至其靶(例如,低的微摩尔或高的纳摩尔-例如超过一百纳摩尔kd,例如500、600、700、800纳摩尔)。以此方式,在两个靶在同一细胞上邻近的情况下,长期的靶结合是有利的。

可制备包含结合至相同靶的两个结合部分的双特异性结合蛋白,这些结合部分各自在同一靶的不同表位。这种设计尤其适用于将结合蛋白成功阻断靶的机率最大化。多个细胞外循环,例如跨膜通道或细胞表面受体可被同一双特异性结合分子靶向。

可制备包含两个结合部分的双特异性结合蛋白,这些结合部分簇集并激活免疫信号传导的负调控物,以产生免疫阻抑。当靶在同一细胞上时,可实现顺向阻抑;当靶在不同的细胞上时,可实现反向阻抑。顺向阻抑可用具有抗-iggriib结合部分和抗-feld1结合部分的双特异性结合蛋白来实现,使得iggriib仅在feld1的存在下簇集,以向下调控对feld1的免疫反应。反向阻抑,例如可通过具有抗-btla结合部分和特异性结合目标组织特异性抗原的结合部分的双特异性结合蛋白来实现,使得抑制性btla分子的簇集仅发生在选定的靶组织中,这有可能解决自身免疫疾病。

可制备活化多组分受体的双特异性结合蛋白。在这种设计中,指向受体两个组分的两个结合部分结合、交联所述受体并活化所述受体的信号传导。这可例如使用具有结合ifnar1的结合部分和结合ifnar2的结合部分的双特异性结合蛋白来实现,其中所述结合使所述受体交联。此类双特异性结合蛋白可提供干扰素治疗的替代方案。

可制备跨越半渗透屏障,例如血脑屏障运送结合部分的双特异性结合蛋白。在这种设计中,一个结合部分结合能够运送特定选择性屏障的靶;另一个结合部分靶向具有治疗活性的分子,其中所述具有治疗活性的靶分子无法正常穿过屏障。这种双特异性结合蛋白可用于将治疗剂引入所述治疗剂不能到达的组织。一些例子包括靶向pigr受体以将治疗剂运送到肠或肺中,或靶向转铁蛋白受体以跨越血脑屏障运送治疗剂。

可制备将结合部分运送到特定细胞或细胞类型的双特异性结合蛋白。在这种设计中,一个结合部分靶向容易内化到细胞中的细胞表面蛋白(例如受体)。另一个结合部分靶向细胞内蛋白,其中所述细胞内蛋白的结合产生治疗效果。

结合吞噬免疫细胞的表面受体和传染性病原体(例如酵母或细菌)的表面分子的双特异性结合蛋白将传染性病原体带往吞噬免疫细胞附近,从而促进病原体被吞噬。此类设计的例子是靶向cd64或cd89分子以及病原体的双特异性抗体。

双特异性结合蛋白具有作为一个结合部分的抗体可变区和作为第二结合部分的非ig部分。抗体可变区实现了靶向,而非ig部分是连接至fc的效应子或毒素。以此方式,配体(例如效应子或毒素)被递送至由抗体可变区结合的靶。

双特异性结合蛋白具有各自结合至ig区的两个部分(例如,含有ch2和ch3区的ig序列),使得任何两个蛋白部分可相对于fc邻近彼此。这种设计的例子包括圈套(trap),例如同-或异型二聚体圈套分子。

表达增强性基因座

适用于本发明的表达增强性基因座包括,例如,包含与seqidno:1具有实质同源性的核苷酸序列的基因座,如美国专利8,389,239所述(本文也称为"基因座”或"基因座1")、包含与seqidno:2或seqidno:3具有实质同源性的核苷酸序列的基因座,如美国申请序列号14/919,300(本文也称为"yars基因座"或"基因座2"),以及本领域中记载的其他表达增强性基因座和序列(例如us20150167020a1和美国专利6,800,457)。

在一些实施方案中,用于本发明的两个表达增强的基因座选自由下列各项所组成的组:包含与seqidno:1具有实质同源性的核苷酸序列的基因座、包含与seqidno:2具有实质同源性的核苷酸序列的基因座、以及包含与seqidno:3具有实质同源性的核苷酸序列的基因座。这些基因座含有不仅提供可操作地连接至序列(即在所述序列内或紧邻所述序列)所整合的基因的增强表达的序列,相较于基因组中的其他序列,也表现出更高的重组效率和改善的整合稳定性。

已经从cho细胞鉴定了seqidno:1、seqidno:2和seqidno:3。发现其他哺乳动物物种(如人类或小鼠)对所鉴别的表达增强区具有有限的同源性,然而可以在来源于灰仓鼠的其他组织类型或其他同源物种的细胞系中发现同源序列,并且可以通过本领域中众所周知的技术分离出来。例如,有人可以通过交叉物种杂交或基于pcr的技术鉴别其他同源序列。此外,可通过本领域熟知的定位诱变或随机诱变技术来在seqidno:1、seqidno:2或seqidno:3所示的核苷酸序列中进行改变。随后可测试所得序列变体的表达增强活性。具有表达增强活性、与seqidno:1、seqidno:2或seqidno:3在核酸同一性方面至少约90%相同的dna可通过惯用的实验进行分离,并且预期表现出表达增强活性。

插入一个或多个外源核酸的整合位点、位点或核苷酸位置可在表达增强序列(例如seqidno:1、seqidno:2,seqidno:3)的任一者内或相邻的任何位置。在目标基因座中或相邻的特定染色体位置是否支持整合外源基因的稳定整合和有效转录可根据本领域熟知的标准程序来确定,例如如美国专利8,389,239和美国申请序列号14,919,300中所述。

本文所考虑的整合位点位于表达增强序列内、或紧邻所述序列,例如小于约1kb、500个碱基对(bp)、250bp、100bp、50bp、25bp、10bbp、或小于约5bp,其在相对于染色体dna上的表达增强序列位置的上游(5')或下游(3')。在又一些其他实施例中,所采用的整合位点位在相对于染色体dna上的表达增强序列位置的上游(5')或下游(3')的约1000、2500、5000或更多个碱基对处。

在本领域中应理解,为了高效复制和转录染色体dna,采用大基因组区,如支架/基质附着区。支架/基质附着区(s/mar),也称为支架附着区(sar)或基质相关或基质附着区(mar),是核基质附着的真核基因组dna区。在不受任何一个理论束缚的情况下,s/mar通常定位到非编码区,使给定转录区(例如染色质结构域)与其相邻者分开,并且还提供用于机器加工和/或结合实现转录的因子(如dna酶或聚合酶的识别位点)的平台。一些s/mar已表征为约14-20kb长(klar等人,2005,gene364:79-89)。因此,整合在表达增强性基因座(例如在seqidno:1、或seqidno:2、或seqidno:3内或邻近)的基因被预期赋予增强的表达。在一些实施方案中,包含外源核酸序列的宿主细胞表现出高的比生产率,所述外源核酸序列编码整合在表达增强的基因座中的特异性位点处的双特异性抗原结合蛋白。在其他实施方案中,编码双特异性抗原结合蛋白的宿主细胞具有至少5、6、7、8、9、10、11、12、13、14、15、20、25、或30皮克/细胞/日(pcd)的比生产率。

在一些实施方案中,外源核酸整合在包含seqidno:1的核苷酸序列的基因座内的位点处。在特定实施方案中,所述整合位点在seqidno:1的核苷酸序列内或紧邻seqidno:1的核苷酸序列。在具体实施方案中,所述整合位点在seqidno:1内的位置,其选自跨越以下编号的位置的核苷酸:10-13,515;20-12,020;1,020-11,020;2,020-10,020;3,020-9,020;4,020-8,020;5,020-7,020;6,020-6,920;6,120-6,820;6,220-6,720;6,320-6,620;6,420-6,520;6,460-6,500;6,470-6,490;和6,475-6,485。在其他实施方案中,所述整合位点位于选自由下列各项组成的组的序列中:seqidno:1的核苷酸5,000-7,400、5,000-6,500、6,400-7,400;和seqidno:1的核苷酸6,400-6,500。在特定实施方案中,所述整合位点在seqidno:1的核苷酸6471至6473的"act"三联体之前、之后或内部。

在一些实施方案中,外源核酸整合在包含seqidno:2或seqidno:3的核苷酸序列的基因座内的位点处。在特定实施方案中,所述整合位点在seqidno:2的核苷酸序列内或紧邻seqidno:2的核苷酸序列。在具体实施方案中,所述整合位点在seqidno:3的核苷酸序列内或紧邻seqidno:3的核苷酸序列。在一些实施方案中,所述整合位点在seqidno:3的核苷酸1990-1991、1991-1992、1992-1993、1993-1994、1995-1996、1996-1997、1997-1998、1999-2000、2001-2002、2002-2003、2003-2004、2004-2005、2005-2006、2006-2007、2007-2008、2008-2009、2009-2010、2010-2011、2011-2012、2012-2013、2013-2014、2014-2015、2015-2016、2016-2017、2017-2018、2018-2019、2019-2020、2020-2021或2021-2022内。在特定实施方案中,所述整合在seqidno:3的核苷酸2001-2022处或在seqidno:3的核苷酸2001-2022内。在一些实施例中,外源核酸插入在seqidno:3的核苷酸2001-2002或核苷酸2021-2022处或所述核苷酸内,并且seqidno:3的核苷酸2002-2021由于插入而缺失。

位点特异性整合到表达增强性基因座中

将一个或多个外源核酸以位点特异性方式整合到表达增强性基因座中,即如本文所公开般整合到表达增强性基因座内的一个特异性位点可以若干种方式实现,包括,例如通过同源重组、和重组酶介导的盒式交换,如本领域所述(参见例如美国专利8,389,239和本文所述公开的技术)。

在一些实施方案中,提供了在表达增强性基因座内包含至少两个,即两个或更多个不同重组酶识别序列(rrs)的细胞,所述重组酶识别序列便于整合含有一个或多个目标外源核酸或基因的核酸序列。此类细胞可通过各种方式,包括同源重组,例如下文和本领域所述,例如美国专利8,389,239和其中所述公开的技术,将含有两个或更多个rrs的外源核酸序列引入所需的基因座而获得。

在特定实施方案中,提供了在表达增强性基因座中含有超过两个不同重组酶识别序列(rrs)的细胞,所述重组酶识别序列便于整合多个外源核酸。在具体实施方案中,提供了在表达增强性基因座内含有三个不同重组酶识别序列(rrs)的细胞,所述重组酶识别序列可介导两个单独外源核酸的整合,例如,其中所述基因组中的5'rrs和中间rrs匹配侧接待整合的第一外源核酸的5'rrs和3'rrs,并且基因组中的中间rrs和3'rrs匹配侧接待整合的第二外源核酸的5'rrs和3'rrs。

合适的rrs可选自包含下列各项的组:loxp、lox511、lox5171、lox2272、lox2372、loxm2、lox-fas、lox71、lox66及其突变体,其中所述位点特异性重组酶是cre重组酶或其衍生物用于实现重组酶介导的盒式交换(rmce)。在其他实例中,合适的rrs可选自包含下列各项的组:frt、f3、f5、frt突变体-10、frt突变体+10及其突变体,在此情形下,位点特异性重组酶flp重组酶或其衍生物用于实现rmce。在另一个实例中,rrs可选自包含下列各项的组:attb、attp及其突变体,在此情况下,位点特异性重组酶phic31整合酶或其衍生物用于实现rmce。

在其他实施方案中,天然细胞通过同源重组技术修饰,以将含有一个或多个外源核酸的核酸序列整合到表达增强性基因座中的特异性位点中。

对于同源重组,同源聚核苷酸分子(即,同源臂)排列并交换它们的一段序列。如果转基因侧接同源基因组序列,那么可以在此交换期间引入转基因。在一个实例中,重组酶识别位点可经由同源重组引入宿主细胞基因组的整合位点处。在其他实例中,含有一个或多个目标外源核酸的核酸序列,例如各自编码hcf或lcf(例如可变区)的一个或多个核酸插入宿主基因组中,其中所述核酸序列侧接与靶基因座的序列同源的序列("同源臂")。

可以通过在染色体dna中的整合位点处引入断裂来促进真核细胞中的同源重组。这可以通过将某些核酸酶靶向特定整合位点而实现。在目标基因座识别dna序列的dna结合蛋白是本领域中已知的。基因靶向载体也用于促进同源重组。

用以实现同源重组的基因靶向载体构建和核酸酶选择在本发明所属领域的技术人员的技术范围内。在一些实例中,具有模块化结构并含有单独锌指结构域的锌指核酸酶(zfn)识别目标序列中的特定3-核苷酸序列(例如靶向整合的位点)。一些实施方案可利用具有靶向多个靶序列的单独锌指域的组合的zfn。转录活化因子样(tal)效应子核酸酶(talen)也可以用于位点特异性基因组编辑。tal效应子蛋白dna结合域通常与限制性核酸酶诸如foki的非特异性裂解域组合使用。在一些实施方案中,将包含tal效应子蛋白dna结合域和限制性核酸酶裂解域的融合蛋白用于识别和裂解本发明基因座内的靶序列处的dna(bochj等人,2009science326:1509-1512)。rna指导的核酸内切酶(rgen)是从细菌适应性免疫机制开发的可编程的基因组工程化工具。在该系统(成簇规律间隔短回文重复序列(crispr)/crispr相关性(cas)免疫反应)中,蛋白cas9当与两个rna(其中一个引导靶选择)复合时形成序列特异性核酸内切酶。rgen由组分(cas9和tracrrna)以及靶特异性crisprrna(crrna)组成。dna靶裂解的效率以及裂解位点的位置均基于前间区序列邻近基序(pam)的位置而变化,所述基序是针对靶识别的额外要求(chen,h.等人,j.biol.chem.2014年3月14作为手稿m113.539726在线发表)。专门用于特异性靶向基因座(例如seqidno:1、seqidno:2、或seqidno:3)的序列可通过将这些序列中的许多序列与cho基因组对齐来鉴定,其可以16-17个碱基对匹配来反映潜在的脱靶位点。

在一些实施方案中,携带目标核酸(例如,含有侧接一个或多个可选标志基因的一个或多个rrs的核酸、或含有一个或多个外源核酸的核酸,所述核酸各自编码hcf或lcf(例如可变区),侧接5'和3'同源臂)的靶向载体通过一个或多个附加载体或mrna而引入细胞中。在一个实施方案中,所述一个或多个额外载体或mrna含有编码位点特异性核酸酶的核苷酸序列,所述位点特异性核酸酶包括(但不限于)锌指核酸酶(zfn)、zfn二聚体、转录活化因子样效应子核酸酶(talen)、tal效应子结构域融合蛋白和rna指导的dna核酸内切酶。在某些实施方案中,所述一个或多个载体或mrna含有包括指导rna、tracrrna和编码cas酶的核苷酸序列的第一载体,以及包含供体(外源)核苷酸序列的第二载体。此类供体序列含有编码目标基因的核苷酸序列,或识别序列,或包含旨在用于靶向插入的这些外源元件中的任一个的基因盒。在使用mrna的情况下,mrna可以借助于本领域的技术人员已知的常见转染方法转染到细胞中并且可以编码酶,例如转座酶或核酸内切酶。虽然引入到细胞中的mrna可以是瞬时的并且未整合到基因组中,但是所述mrna可以携载对于进行整合来说所必需或有益的外源性核酸。在一些情况下,如果仅需要短期表达来实现核酸的所需整合,那么选择mrna是为了消除辅助性聚核苷酸副作用持久的任何风险。

用于位点特异性整合的载体

本文提供了用于经由位点特异性整合将外源核酸引入两个表达增强的基因座中的核酸载体。合适的载体包括:被设计成含有外源核酸序列的载体,所述外源核酸序列侧接rrs以经由rmce进行整合;以及被设计成含有目标外源核酸序列的载体,所述目标外源核酸序列侧接同源臂以经由同源重组进行整合。

在多个实施方案中,提供了经由rmce实现位点特异性整合的载体。在一些实施方案中,载体被设计成实现多个核酸同时整合到两个靶基因座中。与依序整合相比,同时整合允许高效且快速地分离所需克隆,这些克隆产生抗原结合蛋白、或其他目标多聚体蛋白,适用于大规模生产(制造)。

在一些实施方案中,提供了用于在细胞中表达双特异性抗原结合蛋白的载体组。

在一些实施方案中,载体组可包括两个"hcf载体",其各自含有侧接5'rrs与3'rrs的核酸,其中所述核酸包括编码hcf的核苷酸序列,并且其中所述两个hcf不同。所述两个hcf载体中的rrs彼此不同,并被设计成将hcf-编码核苷酸序列整合到两个表达增强性基因座。所述载体组还包括编码lcf的核苷酸序列,其可被包括在hcf载体之一中,或被包括在两个hcf载体中(由此提供相同lcf的两个拷贝),或者,在单独的"lcf载体"提供并侧接5'rrs与3'rrs。

在一些实施方案中,lcf-编码核苷酸序列被包括在hcf载体之一中并位于所述hcf载体上的5'rrs与3'rrs之间。所述lcf-编码序列可位于所述hcf-编码序列的上游或下游。

在一些实施方案中,所述lcf-编码核苷酸序列被包括在两个hcf载体并位于每个hcf载体上的5'rrs与3'rrs之间。类似地,所述lcf-编码序列可放置在每个载体中的hcf-编码序列的上游或下游。

在一些实施方案中,lcf-编码核苷酸序列在单独的载体-"lcf"载体中提供,并侧接5'rrs和3'rrs,其中两个rrs彼此不同。所述载体组的rrs可被设计成使得在与同样含有共同rrs的靶基因座的rmce期间,lcf-编码序列可通过所述共同rrs而与所述hcf-编码序列之一"接合"。例如,lcf载体的3'rrs可与hcf载体之一的5'rrs相同,从而经由rmce整合到靶基因座处之后产生lcf-hcf排列。在另一个实实例中,hcf载体的3'rrs可与lcf载体的5'rrs相同,从而经由rmce整合到靶基因座处之后产生hcf-lcf排列。在一些实施方案中,所述共同rrs被设计成断裂可选标志物形式-也就是说,其被包括在一个载体中所包括的可选标志基因的5'部分的3'端,也被包括在另一载体中所包括的同一可选标志基因的其余3'部分的5'端,使得在"接合"并整合到靶基因座中时,适当地整合的核酸包括完整的可选标志基因以允许方便地鉴定转染子。在一些实施方案中,所述共同rrs被设计成断裂基因形式,即,被包括在此类断裂基因内的基因或内含子的5'部分的3'端,作为在一个载体中的所述基因的5'部分的一部分,并包括在此类断裂基因内的基因或内含子的其余部分的5'端,作为所述断裂基因的其余3'部分的一部分。在其他实施方案中,第一载体中的第三rrs或中间rrs被设计成介于其所操作地连接的启动子与可选标志基因之间(但在另一载体上,其被隔开);第一载体的第三rrs或中间rrs被设计成启动子的3';第二载体的第三rrs或中间rrs被设计成可选标志基因的5'。

在一些实施方案中,载体组可包括编码lcf的附加核苷酸序列。也就是说,载体组可包括两个hcf载体和两个lcf-编码核苷酸序列。所述两个lcf-编码序列可编码相同或不同的lcf。在一些实施方案中,所述两个lcf-编码序列可各自包括在hcf载体中,从而产生两种载体,其各自含有hcf-编码序列和lcf-编码序列。所述两种载体可被设计成具有适用于将所述两个载体序列靶向到两个基因座中的rrs。在其他实施方案中,所述两个lcf-编码序列之一被包括在hcf载体中并位于所述hcf载体上的5'rrs与3'rrs之间,并且另一个lcf-编码序列在单独的载体上提供-即,一个载体具有lcf和hc两者(呈lcf-hcf或hcf-lcf排列,或简称为"lcf/hcf载体"),一个hcf载体和一个lcf载体。在这些其他实施方案的一些中,载体rrs可被设计成允许hcf载体上的hcf-编码序列和lcf载体上的lcf-编码序列经由rmce在靶基因座处接合。例如,lcf载体的3'rrs可与hcf载体的5'rrs相同,并且共同rrs可被设计成断裂可选标志物或断裂内含子形式,以促进转染子的选择与鉴定。在其他实施方案中,当所述两个lcf不同时,所述两个lcf-编码核苷酸序列可各自在单独的载体上提供-也就是说,所述载体组包括两个hcf载体和两个lcf载体。rrs可被设计成允许一个lcf-编码序列与一个hcf-编码序列在一个靶基因座处适当"接合",并且另一个lcf-编码序列与另一个hcf-编码序列在第二靶基因座处适当"接合"。图1、图3和图4说明不同载体形和与rrs/基因座组合,而非意味着限制。每个给定载体系统提供了在重组酶的存在下同时整合每个核苷酸序列的方式,以用于快速和方便地选择阳性整合体(所需克隆)。

编码hcf或lcf的核苷酸序列可编码来自恒定区的氨基酸或(多个)结构域,或编码整个恒定区。在特定实施方案中,编码hcf或lcf的核苷酸序列可编码一个或多个恒定结构域,例如cl、ch1、铰链、ch2、ch3或它们的组合。在某些实施方案中,编码hcf结构域的核苷酸序列可编码ch3结构域。例如,编码第一hcf的核苷酸序列可编码第一ch3结构域,并且编码第二hcf的核苷酸序列可编码第二ch3结构域。第一ch3结构域和第二ch3结构域可相同,或差异在于至少一个氨基酸。ch3结构域或恒定区中的差异可采用本文所述的双特异性抗原结合蛋白的任何形式,例如导致不同蛋白a结合特性、或导致"杵-进入-臼"形式的差异。与任何氨基酸序列差异无关,所述两个hcf-编码核苷酸序列的差异也可在于所述两个核苷酸序列之一已经经过密码子修饰。

在一些实施方案中,每个hcf或lcf-编码的核苷酸序列独立地并且可操作地连接至包括例如启动子的转录调控序列。在一些实施方案中,引导所述两个含hcf多肽的转录的启动子相同。在一些实施方案中,引导所述两个含hcf多肽的转录的启动子,以及引导含lcf之多肽转录的启动子均相同(例如cmv启动子,或本文所述的任何其他合适的启动子)。在一些实施方案中,每个hcf-或lcf-编码核苷酸序列独立地并且可操作地连接至诱导型或阻抑型启动子。诱导型或阻抑型启动子允许生产,例如,仅在生产期(加料分批培养)而不在生长期(种子培养)期间发生。诱导型或阻抑型启动子也允许一个或多个目标基因的差异化表达。在一些实施方案中,每个hcf-和/或lcf-编码核苷酸序列独立地并且可操作地连接至至少一个tetr操纵子(teto)或arc操纵子(arco)上游的启动子。在其他实施方案中,每个hcf-和/或lcf-编码核苷酸序列独立地并且可操作地连接至cmv/teto或cmv/arco杂合启动子。杂合启动子(也称作调控融合蛋白)的例子可在2003年12月11日公开的国际专利公开号wo03101189a1中找到(以引用方式并入本文)。

在一些实施方案中,所述载体组包括编码识别一个或多个rrs的重组酶的核苷酸序列,所述核苷酸序列可包含在hcf或lcf-编码载体之一中或在单独的载体中提供。

在多个其他实施方案中,提供载体以经由同源重组实现位点特异性整合。

在一些实施方案中,提供了一种载体组,其包括两个载体,其各自含有外源核酸,所述外源核酸侧接5'同源臂和3'同源臂,以用于位点特异性地整合到细胞中的两个表达增强性基因座中,其中来自所述两个载体的外源核酸共同编码抗原结合蛋白。因此,一个载体中的同源臂被设计成用于整合到两个基因座之一中,另一载体中的同源臂被设计成用于整合到另一个基因座中。在这些实施方案中,抗原结合蛋白可为单特异性或双特异性。

选择与表达增强性基因座内的序列同源的序列并且包括选定的序列作为靶向载体中的同源臂完全在技术人员的技术范围内。在一些实施方案中,载体或构建体包含第一同源臂和第二同源臂,其中所述合并的第一同源臂和第二同源臂包含置换所述基因座内的内源性序列的靶向序列。在其他实施例中,第一同源臂和第二同源臂包含整合或插入在所述基因座内的内源性序列内的靶向序列。在一些实施方案中,所述同源臂含有与存在于seqidno:1、seqidno:2或seqidno:3中的核苷酸序列同源的核苷酸序列在特定实施方案中,所述载体含有:5'同源臂,其具有对应于seqidno:3的核苷酸1001-2001的核苷酸序列;和3'同源臂,其具有对应于seqidno:3的核苷酸2022-3022的核苷酸序列。同源臂,例如第一同源臂(也称为5'同源臂)和第二同源臂(也称为3’同源臂),与基因座内的靶向序列同源。5'到3’的同源臂可以扩增基因座内包含至少1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb的区或靶向序列。在其他实施例中,选择用于第一和第二同源臂的靶向序列的核苷酸总数包含至少1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb。在一些情况下,5'同源臂与3’同源臂(与靶向序列同源)之间的距离包含至少5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、或至少1kb、或至少约2kb、或至少约3kb、或至少约4kb、或至少5kb、或至少约10kb。在seqidno:3的核苷酸1001-2001和2022-3022被选择作为5'和3'同源臂的情况下,所述两同源臂之间的距离可为20个核苷酸(对应于seqidno:3的核苷酸2002-2021);此类同源臂可介导外源核酸序列整合到包含seqidno:3的基因座中,例如在seqidno:3的核苷酸1990-2021或2002-2021内,并同时缺失seqidno:3的核苷酸2002-2021。

本文公开的用于以位点特异性地整合到表达增强性基因座中来引入外源核酸的载体可包括附加的基因和序列,以用于引导目标外源核酸和所编码多肽的表达,并且用于选择和鉴定目标外源核酸已成功整合进入的细胞。此类附加的序列包括,例如,转录和翻译调控序列、可选标志基因等等,下文也会说明。

调控序列

本文所公开的用于将外源核酸以位点特异性方式引入表达增强性基因座中的载体,和由于位点特异性整合而获得的细胞,可包括用于引导目标外源核酸和经编码的多肽的表达的调控序列。调控元件包括转录启动子、增强子、编码合适的mrna核糖体结合位点的序列以及控制转录和翻译终止的序列。转录和翻译的控制序列可通过病毒来源提供。例如,常用的启动子和增强子源自多瘤病毒、腺病毒2、类人猿病毒40(sv40)、小鼠或人类巨细胞病毒(cmv)、cmv立即早期(cmv-ie)或cmv主要ie(cmv-mie)启动子,以及rsv、sv40晚期启动子、sl3-3、mmtv、泛素(ubi)、泛素c(ubc)、和hivltr启动子。病毒基因组启动子、控制和/或信号序列可用于驱动表达,所提供的这类控制序列与所选择的宿主细胞相容。还可以使用非病毒细胞启动子(例如β-球蛋白和ef-1α启动子),取决于其中将表达目标蛋白的细胞类型。来源于sv40病毒基因组的dna序列,例如sv40起点、早期和晚期启动子、增强子、剪接和聚腺苷酸化位点可用于提供对外源dna序列的表达有用的其他基因元件。早期和晚期启动子是特别有用的,因为二者可容易地从sv40病毒作为还包含sv40病毒复制起点的片段得到(fiers等人,nature273:113,1978)。也可使用较小或较大的sv40片段。通常,包括从位于sv40复制起点中的hindiii位点向bgli位点延伸的大约250bp序列。可使用诱导型(例如,通过化合物、辅因子、调控蛋白诱导)和/或阻抑型(例如,通过化学化合物、辅因子、调控蛋白阻抑)启动子,并且尤其可用于允许产生抗原结合蛋白仅在生产期(加料分批培养)而不在生长期(种子培养)期间发生,或者精确地以差异化方式控制不同基因座中的抗体组分的表达。诱导型启动子的例子包括醇脱氢酶i基因启动子、四环素响应启动子系统、糖皮质激素受体启动子、雌激素受体启动子、蜕皮激素受体启动子、基于金属硫蛋白的启动子和基于t7-聚合酶的启动子。阻抑型启动子的例子包括杂合启动子(也称为调控融合蛋白),其包含可操作地连接至至少一个tetr操纵子(teto)或arc操纵子(arco)的cmv或其他启动子,并且在2003年12月11日公开的国际专利公开号wo03101189a1中有描述(以引用方式并入本文)。先前已经说明了适用于通过双顺反子载体表达多个转录体的序列(kims.k.和woldb.j.,cell42:129,1985),并可用于本发明。用于以多顺反子表达蛋白的合适的策略的例子包括使用2a肽(szymczak等人,expertopinbiolther5:627–638(2005))和使用内核糖体进入位点("ires"),两者都是本领域熟知的。其他类型的表达载体也将是有用的,例如,这些描述于美国专利no.4,634,665(axel等人)和美国专利no.4,656,134(ringold等人)。

可选标志物

本文所公开的用于将外源核酸以位点特异性方式引入表达增强性基因座中的载体,和由于位点特异性整合而获得的细胞,可包括一个或多个可选标志基因。

在一些实施方案中,可选标志基因赋予抗药性,例如描述于kaufman,r.j.(1988)meth.enzymology185:537的表1中的那些,并且包括dhfr-mtx抗性、p-糖蛋白和多重抗药性(mdr)-各种亲脂性细胞毒性剂(例如阿霉素(adriamycin)、秋水仙碱、长春新碱)、和腺苷脱氨酶(ada)-xyl-a或腺苷和2'-脱氧柯福霉素(2'-deoxycoformycin)。其他显性可选标志物包括来源于微生物的抗生素抗性基因,例如新霉素、卡那霉素或潮霉素抗性。哺乳动物宿主存在数种合适的选择系统(sambrook同上,第16.9-16.15页)。也已描述采用两个显性可选标志物的共转染方案(okayamaandberg,mol.cellbiol5:1136,1985)。

在其他实施方案中,可选标志基因编码提供或能够生成用于识别已经或尚未成功插入和/或置换的基因盒的可检测信号的多肽,视情况而定。合适的例子包括荧光标志物或蛋白、催化生成可检测信号的化学反应的酶等等。荧光标记的实例是本领域中众所周知的,包括(但不限于)discosoma珊瑚(dsred)、绿色荧光蛋白(gfp)、增强型绿色荧光蛋白(egfp)、蓝绿色荧光蛋白(cfp)、增强型蓝绿色荧光蛋白(ecfp)、黄色荧光蛋白(yfp)、增强型黄色荧光蛋白(eyfp)和远红外荧光蛋白(例如mkate、mkate2、mplum、mraspberry或e2-crimson。还参见例如nagai,t.等人,2002naturebiotechnology20:87-90;heim,r.等人1995年2月23日nature373:663-664;和strack,r.l.等人2009biochemistry48:8279-81。

用于制备抗原结合蛋白的系统

在又一个方面,本公开提供了系统,所述系统包括细胞(例如cho细胞)和一个或多个载体的组合并可用于制备将外源核酸整合在两个表达增强性基因座内的细胞,所述外源核酸共同编码作为单特异性蛋白或双特异性蛋白的抗原结合蛋白。例如,所述系统可以试剂盒的形式提供。

在一些实施方案中,系统被设计成允许高效的载体构建和经由rmce将多个外源核酸同时整合到两个表达增强的基因座内的特异性位点。同时整合允许快速分离所需的克隆,并且使用两个表达增强的基因座对于产生适用于生产蛋白的稳定细胞系(例如商业化的细胞系)也是重要的。

本文提供的系统包括细胞和载体组。所述细胞含有一对rrs(5'rrs与3'rrs),其整合在两个表达增强的基因座的每一个内。在一些实施方案中,外源核酸存在于每个基因座的5'rrs与3'rrs之间,并可包括例如一个或多个可选标志基因。所述载体组包括至少两个载体,每个载体含有侧接编码hcf或lcf的核苷酸序列的一对rrs(5'rrs与3'rrs),并且所述两个载体之一上的核苷酸序列编码hcf(hcf载体),所述两个载体之另一者上的核苷酸序列编码lcf(lcf载体),其中所述hcf和所述lcf是抗原结合蛋白的区。每对rrs内的5'rrs和3'rrs是不同的,并且所述系统中的rrs被设计成使得将载体引入细胞时,载体中的hcf或lcf-编码核苷酸序列通过rrs所介导的rmce而整合到所述两个表达增强的基因座中,以表达抗原结合蛋白。取决于抗原结合蛋白,载体数量、hcf或lcf-编码序列的放置、以及rrs之间的关联性可以不同方式设计。

在一些实施方案中,所述系统被设计成用于整合到两个表达增强性基因座中并表达单特异性抗原结合蛋白。在一些实施方案中,在所述两个载体(即hcf载体和lcf载体)之一上的5'rrs和3'rrs分别与所述两个基因座之一的5'rrs和3'rrs相同,在另一载体上的5'rrs和3'rrs分别与另一个基因座的5'rrs和3'rrs相同,从而将hcf和lcf核酸基本上上单独地靶向到所述两个基因座,其中一个核酸到每个基因座。在其他实施方案中,在单独载体上的hcf编码序列和lcf编码序列被设计成联合地整合到所述两个基因座中的每一者中。根据这些实施方案,第一基因座中的5'rrs和3'rrs分别与第二基因座中的5'rrs和3'rrs相同;每个基因座也含有介于5'和3'rrs("中间rrs")之间的附加rrs。此外,前两个载体上的5'rrs与第一因座和第二基因座中的5'rrs相同,所述第一载体中的3'rrs与第二载体中的5'rrs相同并与第一因座和第二基因座中的中间rrs相同,并且第二载体中的3'rrs与两个基因座中的3'rrs相同。所述载体可被设计成具有断裂启动子和选择标志物形式(启动子在一个载体上,并且启动子可操作地连接的选择标志物在另一载体上)。所述载体可被设计成具有断裂可选标志物形式、或断裂内含子形式,如上所述,以促进以适当的整合选择转染子。另外,所述系统可被设计成允许lcf-编码序列和hcf-编码序列在整合后在不同的相对位置。在一些实施方案中,所述系统被设计成具有整合在hcf-编码序列上游的lcf-编码序列。在其他实施方案中,所述系统被设计成具有整合在hcf-编码序列上游的lcf-编码序列。

在一些实施方案中,所述系统被设计成用于整合到两个表达增强性基因座中并表达双特异性抗原结合蛋白。

在一些实施方案中,除了hcf载体(编码第一hcf)和lcf载体(编码第一lcf)以外,所述系统也包括编码第二hcf的核苷酸序列,所述第二hcf与第一hcf不同。编码第二hcf的核苷酸序列可被包括,例如,在lcf载体中、或在单独的载体,即第二hcf载体中。在一些实施方案中,第二hcf-编码序列被包括在所述lcf载体中、介于所述lcf载体上的5'rrs与3'rrs之间,在所述情况中,所述系统包括hcf载体和lcf/hcf载体。所述系统-尤其是rrs-可被设计成将所述hcf-编码序列整合到所述两个基因座之一中,并且将编码hcf和lcf两者的序列整合到另一基因座中。在其他实施方案中,编码第二hcf的核苷酸序列在单独的载体上、侧接5'rrs和3'rrs,在所述情况中,所述系统包括两个hcf载体和一个lcf载体。在这些其他实施方案中,所述系统中的rrs可被设计成使得所述lcf-编码序列可经由rmce通过也存在于所述两个基因座之一中、在所述基因座的5'rrs与3'rrs之间的共同rrs而与所述hcf-编码序列之一"接合",并且另一个hcf-编码序列将整合到所述两个基因座中的另一个中。例如,lcf载体的3'rrs可与hcf载体之一的5'rrs相同并且也与所述两个基因座之一上的中间rrs相同-这种设计将产生在整合到所述基因座中之后具有中间rrs的lcf-hcf排列。在另一个实例中,hcf载体的3'rrs可与lcf载体的5'rrs相同并且与所述两个基因座之一上的中间rrs相同,从而产生在整合到所述基因座中之后具有中间rrs的hcf-lcf排列。在一些实施方案中,所述共同rrs被设计成断裂可选标志物形式或断裂内含子形式,如上文所述。

在一些实施方案中,所述系统也包括编码第二lcf的核苷酸序列,除了hcf载体(编码第一hcf)和lcf载体(编码第一lcf)以外,以及编码第二hcf的核苷酸序列,所述第二hcf与第一hcf不同。也就是说,所述系统包括四个单独的编码序列,两个编码hcf且两个编码lcf。所述两个lcf可相同或不同。所述四个编码序列可以不同设计放置在载体中。在一些实施方案中,所述四个序列放置在两个载体中:lcf/hcf、和lcf/hcf,其中lcf在任一载体中在hcf的上游或下游。所述系统(rrs)可被设计成使得一个载体序列整合到一个基因座中,并且另一载体序列整合到另一个基因座中。在一些实施方案中,所述四个序列放置在三个载体中:lcf、hcf和lcf/hcf(其中lcf在hcf的上游或下游)。所述系统中的rrs可被设计成使得所述lcf/hcf载体的序列整合到一个基因座中,在lcf载体中的lcf编码序列和在hcf载体中的hcf编码序列通过利用lcf载体、hcf载体和此另一个基因座共用的共同rrs而整合到另一个基因座中。类似地,所述共同rrs可被设计成断裂标志物或断裂内含子形式。在一些实施方案中,所述四个序列放置在四个载体中:lcf、hcf、lcf和hcf。所述系统中的rrs可被设计成使得在所述lcf载体之一中的lcf编码序列和在所述hcf载体之一中的hcf编码序列通过利用共同rrs而联合地整合到个基因座中,并且在所述lcf载体的另一个中的lcf编码序列和在所述hcf载体的另一个中的hcf编码序列通过利用共同rrs而联合地整合到一个基因座中。

在本文提供的系统的多个实施方案中,编码hcf或lcf的核苷酸序列可编码氨基酸,例如来自恒定区的氨基酸或(多个)结构域,或编码整个恒定区。在特定实施方案中,编码hcf或lcf的核苷酸序列可编码一个或多个恒定结构域,例如cl、ch1、ch2、ch3或它们的组合。在某些实施方案中,编码hcf结构域的核苷酸序列可编码ch3结构域。例如,编码第一hcf的核苷酸序列可编码第一ch3结构域,并且编码第二hcf的核苷酸序列可编码第二ch3结构域。第一ch3结构域和第二ch3结构域可相同,或差异在于至少一个氨基酸。ch3结构域或恒定区中的差异可采用本文所述的双特异性抗原结合蛋白的任何形式,例如导致不同蛋白a结合特性、或导致"杵-进入-臼"形式的差异。与任何氨基酸序列差异无关,所述两个hcf-编码核苷酸序列的差异也可在于所述两个核苷酸序列之一已经经过密码子修饰。

在本文提供的系统的多个实施方案中,每个hcf或lcf-编码的核苷酸序列独立地并且可操作地连接至包括例如启动子的转录调控序列。在一些实施方案中,引导所述两个含hcf多肽的转录的启动子相同。在一些实施方案中,引导所述两个含hcf多肽的转录的启动子,以及引导含lcf之多肽转录的启动子均相同(例如cmv启动子、诱导型启动子、阻抑型启动子、或本文所述的任何其他合适的启动子)。

在一些实施方案中,本系统还包括编码识别一个或多个rrs的重组酶的核苷酸序列,所述核苷酸序列可被包括在可变区-编码载体之一中或在单独的载体中提供。

本文公开的系统被设计成允许高效构建载体并快速分离所需的克隆,并且使用两个表达增强的基因座对于产生稳定的细胞系也是重要的。在一些实施方案中,系统被设计成利用负向选择来鉴定具有预期的位点特异性整合的转化体(例如在rmce之后去除宿主基因组中的一个或多个荧光标志基因而导致荧光缺乏)。一轮的负向选择可能仅需两周;然而,分离带有预期重组的克隆的效率可能是有限的(约1%)。如果负向选择结合基于(多个)整合核酸所提供的新选择标志物的正向选择(例如新颖荧光标志物、或对药物或抗生素的抗性、断裂形式,例如),则分离带有预期重组的克隆的效率可得到显著改善(至约40%至高达约80%)。所述系统可包括附加的组分、试剂或信息,例如,通过转染将系统中的(多个)载体引入系统中的细胞的方案。非限制性转染方法包括基于化学的转染方法,包括使用脂质体;纳米颗粒;磷酸钙(graham等人(1973).virology52(2):456-67,bacchetti等人(1977)procnatlacadsciusa74(4):1590-4和kriegler,m(1991).transferandexpression:alaboratorymanual.newyork:w.h.freemanandcompany.第96-97页);树枝状聚合物;或阳离子聚合物,如deae-葡聚糖或聚乙烯亚胺。非化学法包括电穿孔;声穿孔;和光学转染。基于粒子的转染包括使用基因枪、磁体辅助转染(bertram,j.(2006)currentpharmaceuticalbiotechnology7,277-28)。还可以使用病毒方法进行转染。mrna递送包括使用transmessengertm的方法(bire等人bmcbiotechnology2013,13:75)。将异源dna引入到细胞中的一种常用方法是磷酸钙沉淀,如wigler等人(proc.natl.acad.sci.usa77:3567,1980)所述。聚乙烯诱导的细菌原生质体与哺乳动物细胞的融合(schaffner等人,(1980)proc.natl.acad.sci.usa77:2163)是另一种适用于引入异源dna的方法。还可以使用电穿孔将dna直接引入到宿主细胞的细胞质中,如potter等人(proc.natl.acad.sci.usa81:7161,1988)或shigekawa等人(biotechniques6:742,1988)所述。已描述适用于将异源dna引入到哺乳动物细胞中的其他试剂,如lipofectintm试剂和lipofectaminetm试剂(gibcobrl,gaithersburg,md.)。这两种可商购的试剂均用于形成脂质-核酸复合物(或脂质体),当应用于培养的细胞时,有利于核酸摄入细胞中。

用于制备抗原结合蛋白的方法

本公开还提供了制备双特异性抗原结合蛋白的方法。通过利用本文公开的方法,所需的抗原结合蛋白可以高滴度和/或高比生产率(pg/细胞/日)产生。在一些实施方案中,抗原结合蛋白以至少1g/l、1.5g/l、2.0g/l、2.5g/l、3.0g/l、3.5g/l、4.0g/l、4.5g/l、5.0g/l、10g/l或更大的滴度产生。在一些实施方案中,抗原结合蛋白以至少5、6、7、8、9、10、11、12、13、14、15皮克/细胞/日(pcd)或更高的比生产率产生,所述比生产率是基于每日每个细胞产生的总抗原结合蛋白(以pg计)来测定。在一些实施方案中,双特异性抗原结合蛋白以双特异性抗原结合蛋白滴度相对于总抗原结合蛋白滴度的比率为至少5%、10%、15%、20%、25%、30%、35%、40%、50%、60%或更高来产生。

在一个实施方案中,所述方法利用本文公开的系统并通过转染将系统中的载体引入系统中的细胞。可筛选并鉴定经转染的细胞,其中外源核酸已通过rmce适当地整合到所述细胞的两个表达增强性基因座中。在一些实施方案中,经转染的细胞的鉴定通过针对转染之前存在于宿主细胞中的一个或多个选择标志物的负向选择来实现。在其他实施方案中,经转染的细胞的鉴定通过针对转染之前存在于宿主细胞中的一个或多个选择标志物的负向选择,结合基于载体中被设计成待整合的核酸所提供的一个或多个选择标志物的正向选择来实现。含hcf的多肽和含lcf的多肽可从所述整合的核酸表达,并且目标抗原结合蛋白可从鉴定的经转染的细胞获得,并使用已知的方法进行纯化。

在另一个实施方案中,所述方法简单地利用上述细胞,所述细胞含有共同编码抗原结合蛋白的整合于两个表达增强的基因座处的外源核酸,并从所述细胞表达所述抗原结合蛋白。每个克隆的(多个)表达盒在每个特异性整合位点内是连续的。

通过以下实施例进一步说明本说明书,所述实施例不应解释为以任何方式具有限制性。所有引用文献(包括贯穿本申请所引用的参考文献、发布的专利和公布的专利申请)的内容特此以引用的方式明确并入。

实施例

实施例1:在两个特异性表达增强性基因座中表达单特异性抗体(abs)(经由位点特异性整合)

将ab链(abc1、abc2)克隆到载体中,其中所述rss位点侧接ab表达盒和用于可选标志物的表达盒,如图1所描绘。两条ab链可克隆到单独载体中或合并至一个载体中,其中2个表达盒以任可能的顺序串联排列:abc1、abc2和可选标志物,例如,abc1等同于常规的lc并且abc2等同于常规的重链。

简言之,编码vh和vl结构域的dna可通过pcr从单一抗原阳性b细胞直接分离。将重链和轻链pcr产物分别克隆到含有igg重链恒定区和κ轻链恒定区的sapi线性化抗体载体中。重链质粒(abc2)具有侧接重链表达盒的rrs3和rrs2位点。此外,在重链质粒中,紧邻rrs3下游有断裂选择标志物基因(例如us7582298)。轻链质粒具有侧接轻链表达盒的rrs1和rrs3位点。此外,轻链质粒具有紧邻rrs3处的atg之前的强启动子,使得在整合到宿主细胞基因座中时,来自轻链质粒的rrs3-近端启动子与起始atg即被带至邻近于适当阅读框中的重链质粒的选择标志物基因,以允许所选择基因的转录和翻译。具有重链可变区序列的纯化重组质粒和具有来自相同b细胞的轻链可变区序列的质粒随后被合并且与表达重组酶的质粒共同转染到经修饰的cho宿主细胞系中,所述细胞系在seqidno:1(eesyr?;基因座1)和seqidno:2基因座处具有适当的rss和选择标志物。所述经修饰的cho宿主细胞在两个转录活性基因座处含有4个不同的选择标志物。因此,当选择标志物是不同的荧光标志物时,cho细胞生产可通过流式细胞术分离代表所需细胞重组的正向-负向组合。当表达重链和轻链基因的重组质粒与表达重组酶的质粒共同转染时,由所述重组酶介导的位点特异性重组导致抗体质粒整合在含有rrs的每个染色体基因座处并置换。因此,将表达单特异性抗体的重组细胞分离,并经受12天的加料分批生产、之后收获并使用固定化蛋白a进行octet滴度测定。观察到所述细胞是等基因型的和稳定的。当利用双位点整合方法时,观察到小摇瓶中的单特异性抗体表达的整体滴度增加,其中抗体b导致显著增加,接近使滴度翻倍(图2)。

实施例2:在两个特异性表达增强性基因座中表达双特异性抗体(bsab)(经由位点特异性整合)

就双特异性抗体的表达而言,将三条抗体链和两个可选标志物克隆到类似于实施例1的质粒中,使得abc1、abc2、和可选标志物1侧接与第一基因座兼容的rrs位点、或整合位点(seqidno:1;基因座1),并且abc1、abc3、可选标志物2与第二基因座或整合位点(seqidno:2)相容。在我们的观察中,作为常规lc的abc1并不需要两个基因拷贝来充分表达。对于每个位点,制备了1个或2个质粒,其中所述3个表达盒串联排列或排列到2个质粒中,其中所述2个表达盒被克隆到一个载体中,其余表达盒被克隆到第二载体中。参见图3。

当表达重链和轻链基因的重组质粒与表达重组酶的质粒共同转染时,由所述重组酶介导的位点特异性重组导致抗体质粒整合在含有rrs的每个染色体基因座处并置换。因此,将表达双特异性抗体的重组细胞分离,并经受12天的加料分批生产,之后收获并使用固定的抗-fc和第二抗fc*(经修饰的fc检测抗体,参见us2014-0134719a1,公开于2014年5月15日)进行octet滴度测定。观察到细胞是等基因型的和稳定的。利用双位点整合方法,观察到小摇瓶中的整体滴度从1.75显著增加至超过2倍(图5)。

实施例3:在特异性整合后大规模生产双特异性和单特异性抗体

宿主细胞(cho-k1)如上文类似于实施例1所述产生(也参见图3的双特异性抗体和图1的单特异性抗体)。将能够将基因盒rmce到基因座(基因座1)和seqidno:2(基因座2)中的宿主细胞与能够将基因盒rmce到仅一个整合位点(基因座1/)的宿主细胞进行比较。将携带抗体轻链和重链(abc1、abc2、abc3)和必需rrs和选择标志核酸(参见图3)的载体重组到生产细胞系(rsx2bp)中,以产生表达abe、abf、abg、和abh的宿主细胞。因此,每个双特异性抗体宿主细胞表达一个共同轻链,以及结合不同抗原的两个重链,其中所述一个重链在其ch3结构域被工程化,以差异化地结合蛋白a(如美国专利no.8,586,713所述,以引用方式并入本文)。

就单特异性抗体而言,将抗体轻链和重链(abc1、abc2)克隆到载体中,其中所述rss位点侧接ab表达盒(表达盒也提供可选标志基因),如图1所描绘。进行重组,以产生表达abj和abk的宿主细胞(rsx2)。

2l、15l、或50l生物反应器被接种来源于cho-k1的抗体生产细胞系rsx2的种子培养物。使接种的细胞在36.5℃下生长13天,并根据需要饲喂葡萄糖和其他补充营养物。使细胞生长在化学成分确定(无水解产物且无血清)的基质培养基中。将全部抗体收获并将其纯化。

总igg抗体(滴度)在蛋白a/蛋白g层析之后测定。就双特异性抗体而言,总igg抗体以及包括双特异性(杂二聚体fc/fc*)、带有野生型重链的同型二聚体(fc/fc)和带有经修饰重链的同型二聚体(fc*/fc*)的三种抗体物质中的每一者被测量,以测定所需双特异性抗体物质的比率。总滴度通过使用美国专利no.8,586,713所述的洗脱技术,利用蛋白a/蛋白g柱的hplc方法测定。简言之,所述三个生物反应器物质在样品加载期间结合至柱,在离子性改性剂的存在下,采用ph阶梯式梯度,蛋白a柱最先洗脱出双特异性物质(fc/fc*)。双特异性物质在第一洗脱步骤期间收集,接着洗脱出两个同型二聚体物质。

表1显示,通过利用经由两个整合位点表达抗体的宿主细胞,在先导大规模生产培养中的整体(总)igg滴度和双特异性抗体滴度(图6a)得到高度改善。

表1:总igg和双特异性igg滴度测量

双特异性滴度如上文所述进行测定。如表2中所见,由细胞产生的双特异性抗体的滴度与总igg滴度的比率在具有两个整合位点构建的宿主细胞的生产培养物中显著更高。参见图6b。事实上,不可预期的是,一致地实现了50%或更高的双特异性比率。

表2:每次总igg生产的双特异性抗体的比率

单特异性抗体使用双整合位点方法表达,以测定整体igg滴度的改善。表3说明观察到大生物反应器规模的总滴度从0.6倍显著增加到1.3倍。也参见图7。对于用于制造的生产生物反应器来说,尤其是培养体积为500l至高达10,000l的生物反应器,通过使用这些改善的细胞系所观察到的滴度增加等同于每批次产物产量的显著增加。

表3:总igg(单特异性)滴度测量

尽管已经通过图示和实施例对前述发明进行了详细说明,但对于本领域的技术人员显而易见的是,可在不脱离所附权利要求中定义的本发明精神或范围的情况下对其进行各种改动和修改。

序列表

<110>瑞泽恩制药公司

<120>基于使用表达增强性基因座来制备抗体的组合物和方法

<130>33444pct(10341wo01)

<150>62/325,400

<151>2016-04-20

<160>3

<170>patentin3.5版

<210>1

<211>13515

<212>dna

<213>中国仓鼠

<400>1

tctagaaacaaaaccaaaaatattaagtcaggcttggcttcaggtgctggggtggagtgc60

tgacaaaaatacacaaattcctggctttctaaggctttttcggggattcaggtattgggt120

gatggtagaataaaaatctgaaacataggtgatgtatctgccatactgcatgggtgtgta180

tgtgtgtgtatgtgtgtctgtgtgtgtgcccagacagaaataccatgaaggaaaaaaaca240

cttcaaagacaggagagaagagtgacctgggaaggactccccaatgagatgagaactgag300

cacatgccagaggaggtgaggactgaaccattcaacacaagtggtgaatagtcctgcaga360

cacagagagggccagaagcactcagaactccagggggtcaggagtggttctctggaggct420

tctgcccttggaggttcctgaggaggaggcttccatattgaaaatgtagttagtggccgt480

ttccattagtacagtgactagagagagctgagggaccactggactgaggcctagatgctc540

agtcagatggccatgaaagcctagacaagcacttccgggtggaaaggaaacagcaggtgt600

gaggggtcaggggcaagttagtgggagaggtcttccagatgaagtagcaggaacggagac660

gcactggatggccccacttgtcaaccagcaaaagcttggatcttgttctaagaggccagg720

gacatgacaagggtgatctcggtttttaaaaggctttgtgttacctaatcacttctatta780

gtcagatactttgtaacacaaatgagtacttggcctgtattttagaaacttctgggatcc840

tgaaaaaacacaatgacattctggctgcaacacctggagactcccagccaggccctggac900

ccgggtccattcatgcaaatactcagggacagattcttcactaggtactgatgagctgtc960

ttggatgcaaatgtggcctcttcattttactacaagtcaccatgagtcaggaggtgctgt1020

ttgcacagtgtgactaagtgatggagtgttgactgcagccattcccggccccagcttgtg1080

agagagatccttttaaattgaaagtaagctcaaagttaccacgaagccacacatgtataa1140

actgtgtgaataatctgtgcacatacacaaaccatgtgaataatctgtgtacatgtataa1200

actgtgtgaataatctgtgtgcagcctttccttacctactaccttccagtgatcaggttt1260

ggactgcctgtgtgctactggaccctgaatgtccccaccgctgtcccctgtcttttacga1320

ttctgacatttttaataaattcagcggcttcccctctgctctgtgcctagctataccttg1380

gtactctgcattttggtttctgtgacatttctctgtgactctgctacattctcagatgac1440

atgtgacacagaaggtgttccctctggagacatgtgatgtccctgtcattagtggaatca1500

gatgcccccaaactgttgtccagtgtttgggaaagtgacacgtgaaggaggatcaggaaa1560

agaggggtggaaatcaagatgtgtctgagtatctcatgtccctgagtggtccaggctgct1620

gacttcactcccccaagtgagggaggccatggtgagtacacacacctcacacatactata1680

tccaacacacacacacacacacacacacacacgcacgcacgcacgcacgcacgcacacat1740

gcacacacacgaactacatttcacaaaccacatacgcatattacaccccaaacgtatcac1800

ctatacataccacacatacacacccctccacacatcacacacataccacacccacacaca1860

gcacacacatacataggcacacattcacacaccacacatatacatttgtgtatgcataca1920

tgcatacacacacaggcacacagacaccacacacatgcattgtgtacgcacacatgcata1980

cacacacataggcacacattgagcacacacatacatttgtgtacgcacactacatagaca2040

tatatgcatttgtatatgcacacatgcatgcacacatacataggcacacatagagcacac2100

acatacatttgtgtatgcacacatgcacacaccaatcacatgggaagactcaggttcttc2160

actaaggttcacatgaacttagcagttcctggttatctcgtgaaacttggaagattgctg2220

tggagaagaggaagcgttggcttgagccctggcagcaattaaccccgcccagaagaagta2280

ggtttaaaaatgagagggtctcaatgtggaacccgcagggcgccagttcagagaagagac2340

ctacccaagccaactgagagcaaaggcagagggatgaacctgggatgtagtttgaacctc2400

tgtaccagctgggcttcatgctattttgttatatctttattaaatattcttttagtttta2460

tgtgcgtgaataccttgcttgcataaatgtatgggcactgtatgtgttcttggtgccggt2520

ggaggccaggagagggcatggatcctccggagctggcgtttgagacagttgtgacccaca2580

gtgtggggtctgggaactgggtcttagtgttccgcaagtgcagctggggctcttaacctc2640

tgagccatccctccagcttcaagaaacttattttcttaggacatgggggaagggatccag2700

ggctttaggcttgtttgttcagcaaatactcttttcgtgtattttgaattttattttatt2760

ttacttttttgggatagaatcacattctgcagctcaggctgggcctgaactcatcaaaat2820

cctcctgtctcagtctaccaggtgataagattactgatgtgagcctggctttgacaagca2880

ctttagagtccccagcccttctggacacttgttccaagtataatatatatatatatatat2940

atatatatatatatatatatatatattgtgtgtgtgtgtttgtgtgtgtatgagacactt3000

gctctaagggtatcatatatatccttgatttgcttttaatttattttttaattaaaaatg3060

attagctacatgtcacctgtatgcgtctgtatcatctatatatccttccttccttctctc3120

tctttctctcttcttcttctcacccccaagcatctattttcaaatccttgtgccgaggag3180

atgccaagagtctcgttgggggagatggtgagggggcgatacaggggaagagcaggagga3240

aagggggacagactggtgtgggtctttggagagctcaggagaatagcagcgatcttccct3300

gtccctggtgtcacctcttacagccaacaccattttgtggcctggcagaagagttgtcaa3360

gctggtcgcaggtctgccacacaaccccaatctggccccaagaaaaggcacctgtgtgtg3420

actctggggttaaaggcgctgcctggtcgtctccagctggacttgaaactcccgtttaat3480

aaagagttctgcaaaataatacccgcagagtcacagtgccaggttcccgtgctttcctga3540

agcgccaggcacgggttccctaggaaatggggccttgcttgccaagctcccacggcttgc3600

cctgcaaacggcctgaatgatctggcactctgcgttgccactgggatgaaatggaaaaaa3660

gaaaaagaagaagtgtctctggaagcgggcgcgctcacacaaacccgcaacgattgtgta3720

aacactctccattgagaatctggagtgcggttgccctctactggggagctgaagacagct3780

agtgggggcggggggaggaccgtgctagcatccttccacggtgctcgctggctgtggtgc3840

atgccgggaaccgaaacgcggaactaaagtcaagtcttgctttggtggaactgacaatca3900

acgaaatcacttcgattgttttcctctttttactggaattcttggatttgatagatgggg3960

gaggatcagagggggaggggaggggcggggagacggagggaggaggggaggaggggagga4020

ggggaggaggggaggaggggaagggatggaggaaaatactaacttttctaattcaacatg4080

acaaagattcggagaaagtgcaccgctagtgaccgggaggaggaatgccctattgggcat4140

tatattccctgtcgtctaatggaatcaaactcttggttccagcaccaaggattctgagcc4200

tatcctattcaagacagtaactacagcccacacggaagaggctatacaactgaagaaata4260

aaattttcactttatttcatttctgtgactgcatgttcacatgtagagagccacctgtgt4320

ctaggggctgatgtgctgggcagtagagttctgagcccgttaactggaacaacccagaac4380

tcccaccacagttagagcttgctgagagagggaggcccttggtgagatttctttgtgtat4440

ttatttagagacagggtctcatactgtagtccaagctagcctccagctcacagaaattct4500

cctgttccggtttccaaagtactggagttatgagtgtgtgttaattgaacgctaagaatt4560

tgctgattgaagaaaacctcaagtgggtttggctaatccccacgaccccagaggctgagg4620

caggaggaatgagagaattcaaggtttgccagagccacagggtgagctcaatgtggagac4680

tgtgagggtgagctcaatgtggagactgtgagggtgagctcaatgtggagactgtgaggg4740

tgagctcaatgtggagactgtgagggtgagctcaatgtggagactgtgagggtgagctca4800

atgtggagacctgtatcaagataataatagtagtagtaacaatgcaggcgagggtgtggt4860

tgagtggtagagcagttagttgatttgacatgcttgaggtctcccggtccatctgtggcc4920

ctgcaacaggaagggagggaggaagggggggaacgagagagaggaaagagagacagaagc4980

taagatagggaatgagagaggaaggaagaaacgggaagaaattcagactccttcctgagt5040

tccgccaacgcctagtgacatcctgtgcacaccctaaggtggcctttgtgtggcactggc5100

ttgggtggtcgggaaaggcattttcagcttgttgcagaactgccacagtagcatgctggg5160

tccgtgaaagtttctgcccgttaacaagaagtctctactacttgtgacctcaccagtgaa5220

aatttctttaattgtctcctggtgttctgggttttgcatttttgtttctaaggatacatt5280

cctgggtgatgtcatgaagtccccaaagacacagtggggctgtgttggattgggaaagat5340

gatttatctggggtgtcaaaaggaaaagaagggaaacaggcacttgggaaaatgtcctcc5400

cgcccacccgaattttggcttggcaaccgtggtggaggagcaagaaacacgtggacgttt5460

gaggaggcatggggtcctaggaggacaggaagcagaaggagagagctgggctgacagcct5520

gcaggcattgcacagtttcagaaggagattacagcatgactgagtttttagggatccaac5580

agggacctgggtagagattctgtgggctctgaggcaacttgacctcagccagatggtatt5640

tgaataacctgctcttagagggaaaacagacatagcaaacagagccacgtttagtgatga5700

aactctcactttgcctgagtcatgtgcggccatgcccaggggtcaggctgacactcaact5760

caaaaacaagtgagaaattgaagacaatccgtggtggcagctactggaagggccaccaca5820

tccccagaaagagtggagctgctaaaaagccatttgtgataggcacagttatcttgaatg5880

catggagcagagattacggaaaaatcgagaatgttaatgaggcaacattcgagttgagtc5940

attcagtgtgggaaacccagacgcttccatcccctaaaaggaacatcttgctctcagtca6000

aaatggaaataaaaattggggcttgaatttggcaaatgattcagaactctgtgtaggtat6060

tttcacacgcacagtggataattttcatgttggagtttatttgtgctaaaaggcagaaaa6120

gggtaaaaagcacatcttaagagttatgaggttctacgaataaaaataatgttacttaca6180

gctattccttaattagtacccccttccacctgtggtaatttcctgagatagtcagtgggg6240

aaaagatctctccttctcttctttctccccctcccctcctctccctccctccctccctcc6300

ctccctcctctccctccctccccctttccttctttctttgctccttctcctctgcctcct6360

tctccctttcttcttcatttattctaagtagcttttaacagcacaccaattacctgtgta6420

taacgggaaaacacaggctcaagcagcttagagaagattgatctgtgttcactagcgtgc6480

aattcagaggtgggtgaagataaaaggcaaacatttgaggccatttccttatttggcacg6540

gcacttaggaagtggaacatgcctaatctactggtttgtaccacctttccctataatgga6600

ctgtttgggaagctcctgggcaaccgattctggcatctcattggtcagaggcctgttaaa6660

tggtactcttatttgcaaagaaggctgtaacttgtagctttaaaagcctctcctcaagaa6720

agaagggagaaaggatatggctagacatatctaatagacttaaccactgtgaaaagcctt6780

agtatgaatcagatagaacctatttttaactcagttttgaaaaaaataatctttatattt6840

atttgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgaaccacatg6900

tagcaggtgctggaggaggccagaagagggcaccagatctcctggaactgacaccacaca6960

tggttatgagctgcctgatgtgggtgctgggaactgaactctcgtgttctgcaagagcag7020

caactgttctcttaactgatgagccatctctccagccccccccataattttaattgttca7080

ttttagtaaattttattcataatcaattatcacagtataaaacaatgattttatatatat7140

catatacatatcaaggatgacagtgagggggatatgtgtgtgtgtgtgtgtgtgtgtgtg7200

tgtgtgtgtgtgtgttatttgtgtgtgtgctttttaagaaggtgccatagtcactgcatt7260

tctctgaaggatttcaaaggaatgagacatgtctgtctgccaggaaccctatcttcctct7320

ttgggaatctgacccaaatgaggtattctgaggaactgaatgaagagctcaagtagcagt7380

gtcttaaacccaaatgtgctgtctagagaaagtcaacgtcatcagtgagctgaggagaga7440

tttactgagcggaagacaagcgctctttgatttaagtggctcgaacagtcacggctgtgg7500

agtggagcctgtgctcaggtctgaggcagtctttgctagccagctgtgatgagcagtgaa7560

gaaagggtggagatggaggcagggtgggagcagggctatggttcagactaggtatcgtga7620

gcacaccagctggttgacttgtggtctgtgggtcaggcgttgtaaacgccctcagggtca7680

ggcagtcacattgcttgaagctgaatgggtgaggcaacacagagagtgcaaagaaggcaa7740

agtaccacctcttccccgacccaggtcacttctgggttatagctgagactccggacagca7800

tgcaaccagctggttagagcttcagggaaaacttgatgtctgcatgttgctatgaaatgt7860

gattcggtacatctggagaaaatttataatgctggctcagtcaagcactgaacaaaggta7920

ccttggctttgggagctacatgacattgacttgtaggcagacttttttttttctgcccgc7980

caattcccagataaccaatatggaggctcaatattaattataaatgctcggctgatagct8040

caggcttgttactagctaactcttccaacttaaatgaacccatttctattatctacattc8100

tgccacgtgactttaccttgtacttcctgtttcctctccttgtctgactctgcccttctg8160

cttcccagagtccttagtctggttctcctgcctaaccttatcctgcccagctgctgacca8220

agcatttataattaatattaagtctcccagtgagactctcatccagggaggacttgggtg8280

ctcccccctcctcattgccatccgtgtcttcctcttccctcgcttccccctcctcttcct8340

gctcttcctcctccacccctcctttcatagtattgatggcaagggtgttctagaatggag8400

gagtgcccataggcatgcaaagaaaccagttaggatgctctgtgaggggttgtaatcata8460

agcgatggacacaattcaagccacagagtgaagacggaaggatgcactgtgctctagagc8520

aacttctggggcagaatcacagggtgagtttctgacttgagggcgaagaggccacgagga8580

agggagtgagtttgtctgagctagaagctacggcccacctcttggtagcagacctgccca8640

caagcatgctttgttaatcatgtgggatctgattttcctctaaatctatgttcaactctt8700

aagaaaatgtgaattctcacattaaaatttagatatacgtcttttggtggggggggtgta8760

aaaaatcctcaagaatatggatttctgggggccggagagatggctcagaggttaagagaa8820

ctggttgctcttctagacattctgagttcaattcccagcaaccacatggtggctcacaac8880

catctgtaatgcgacctggtgccatcttctgacatgcatggatacatgcaggcagaaagc8940

tgtatacatagtaaattgataaatctttttttaaaaagagtatggattctgccgggtgtt9000

ggtggcgcacgcctttaatcccagcactctggaggcagaggcaggtggatctctgtgagt9060

tcgagaccagcctggtctataagagctagttccaggacagcctccaaagccacagagaaa9120

ccctgtctcgaaaaaccaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaagagtatggattc9180

taagaaagccgtaacagctggagctgtgtacggagttcagcgtggtactagaagaacaga9240

cattcatgatgaaacaccccaggatttttacttagtatctagtttccattgttgttttga9300

gaccggctcttatgctctccaggctggcctcaaactgctgatcttcccgcctctacctct9360

caagtcctgggactacttggctcataaaacagtttttgtcgggctccctgaagttatggt9420

tgtacaaaccgtgggggtcaatatactcacttgggcagagagagaaggtctgaatcccag9480

acaatgactgcatctcaggacagttgggaagaggacaatggcagaaggacttagaaaaga9540

tagactggagggtggaaaagcagcaggaacagagaaacaaaacaggaagcttgctatcca9600

gggccactctggagtcctgtggcaagatggaagcgggctaggggaatacatttgtgctac9660

tgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgatcaatgcctatcaatgttgaa9720

ggggaaatatgtataccacattgattctgggagcaattctcagtatctggcctagagaaa9780

ggaatggcccctgcagaatagacagagtgaatggtgccctttatcatttgctaaagtgaa9840

ggagaaataaacatccttccatagagtttcaggtaaatgaaccccacagttcatctgtgc9900

cgtggtggaggcctggccaacagttaaaaagattagacacggacaaagtctgaaggaaac9960

acctcgaataggaagaggagagccacctcattctgtaactttcctcaaggggaagatgtt10020

ccaagagtgggaataaatggtcaaaggggggatttttaattaggaaaacgatttcctgta10080

tcacttgtgaaactggaggttgatttggggcataggacaatagatttgatgctttgcaaa10140

aagctgtttcaaagcagagaaatggaatagagacaattatgtagcgaggagggagggtgg10200

ggcgaagatggagacagagaagtggaagctgactttagggaagaggaacatagaccacag10260

gggcggggcggggggcaggggcggggggcggggctcaaaggaggcagtgggaacgttgct10320

agtgttcgcagcgtaagcgtgaatgtgcaagcgtctttgtggtgtgtgaccaggagtagc10380

gtggctggcttgtgtgctgcttgtaatcccagtctttgaggtttccacactgttccacag10440

tgggtgtgattttccctcggagagcatgagggctctgctttccccacatcctccccagcg10500

ttcgttggtatttgtttccaagatgttagtgggtgagacaaagcctctctgttgatttgc10560

ctttaacaggtgacaaaaaaagctcaaccaggagacatttttgccttcttggaaggtaat10620

gctcccatgtagagcaatgggacccatctctaaggtgaggctactcttgcagtttgcacc10680

cagctcttctgatgcaggaaggaagttggtgggcaagcaagactgtttgcttcttgcgat10740

ggacacattctgcacacaaaggctcaggaggggagaaggctgtttgatgtttagcactca10800

ggaaggcccctgatgcatctgtgattagctgtctccatctgtggagcagacacggactaa10860

ctaaaaaccagtgtttttaaattgtcaagcctttaaggtgaggaaattgacttattgtgc10920

tgggccatacgtagagcaagtgctctgcattgggccaacccccggctctggtttctaggc10980

accagaatggcctagaactaactcacaatcctcccattccaggtctcaggtgctagaatg11040

aaccactataccagcctgcctgcctgcctacctgccttcctaaattttaaatcatgggga11100

gtaggggagaatacacttatcttagttagggtttctattgctgtgaagagacaccatgag11160

catggcaactcttataaaggaaaacatttagttgggtggcagtttcagaggttttagtac11220

attgtcatcatggctgggaacatgatggcatgcagacagacatggtgctggagaaaggga11280

tgagagtcctacatcttgcaggcaacaggacctcagctgagacactggctggtaccctga11340

gcataggaaacctcacagcccaccctcacagtgacatatttccttcaacaaagccatacc11400

tcctaatagtgccactccctatgagatgacagggccaattacattcaaactgctataaca11460

ctttaaagtattttatttttattattgtaaattatgtatgtagctgggtggtggcagccg11520

aggtgcacgcctttaatcccagcacttgggaggcagaggcagatggatctctgtgagttc11580

aagaccagcctggtctataagagctagttgcaaggaaggatatacaaagaacagttctag11640

gatagccttcaaagccacagagaagtgctgtcttgaaaaccaaaaattgtgctgggacct11700

gtctctgctttggttgcttcccactcccccagagctggactcttggtcaacactgaatca11760

gctgcaaaataaactcctggattcctctcttgtaacaggagcccgaagtcaggcgcccac11820

ttgtcttctcgcaggattgccatagactttttctgtgtgcccaccattccagactgaagt11880

agagatggcagtggcagagactgggaaggctgcaacgaaaacaggaagttattgcaccct11940

gggaatagtctggaaatgaagcttcaaaacttgcttcatgttcagttgtacacagactca12000

ctcccaggttgactcacacgtgtaaatattcctgactatgtctgcactgcttttatctga12060

tgcttccttcccaaaatgccaagtgtacaaggtgagggaatcacccttggattcagagcc12120

cagggtcgtcctccttaacctggacttgtctttctccggcagcctctgacacccctcccc12180

ccattttctctatcagaaggtctgagcagagttggggcacgctcatgtcctgatacactc12240

cttgtcttcctgaagatctaacttctgacccagaaagatggctaaggtggtgaagtgttt12300

gacatgaagacttggtcttaagaactggagcaggggaaaaaagtcggatgtggcagcatg12360

tacccgaaatcccagaactggggaggtagagacggatgagtgcccggggctagctggctg12420

ctcagccagcctagctgaattgccaaattccaactcctattgaaaaacctttaccaaaca12480

aacaaacaaacaaataataacaacaacaacaacaacaaactaccccatacaaggtgggcg12540

gctcttggctcttgaggaatgactcacccaaacccaaagcttgccacagctgttctctgg12600

cctaaatggggtgggggtggggcagagacagagacagagagagacatgacttcctgggct12660

gggctgtgtgctctaggccaccaggaactttcctgtcttgctctctgtctggcacagcca12720

gagcaccagcacccagcaggtgcacacacctccctccgtgcttcttgagcaaacacaggt12780

gccttggtctgtctattgaaccggagtaagttcttgcagatgtatgcatggaaacaacat12840

tgtcctggttttatttctactgttgtgataaaaaccggggaactccaggaagcagctgag12900

gcagaggcaaatgcaaggaatgctgcctcctagcttgctccccatggcttgccgggcctg12960

ctttctgcaagcccttctctccccattggcatgcctgacatgaacagcgtttgaaatgct13020

ctcaaatgtcactttcaaagaaggcttctctgatcttgctaactaaatcagaccatgttt13080

caccgtgcattatctttctgctgtctgtctgtctgtctgtctgtctatctgtctatcatc13140

tatcaatcatctatctatctatcttctatttatctacctatcattcaatcatctatcttc13200

taactagttatcatttatttatttgtttacttactttttttatttgagacagtatttctc13260

tgagtgacagccttggctgtcctggaacccattctgtaaccaggctgtcctcaaactcac13320

agagatccaactgcctctgcctctctggtgctggggttaaagacgtgcaccaccaacgcc13380

ccgctctatcatctatttatgtacttattattcagtcattatctatcctctaactatcca13440

tcatctgtctatccatcatctatctatctatctatctatctatctatctatctatcatcc13500

atctataatcaattg13515

<210>2

<211>14931

<212>dna

<213>中国仓鼠

<220>

<221>misc_feature

<222>(2716)..(2239)

<223>n为a、c、g、t或核苷酸缺失

<400>2

catgtacacttatgcaagtatgatatggcccaacacagtattttacaccaatttttatct60

ataaaatatacatgtacatcaaaatatattattaataataacatcattattctttctttc120

caagtaataaacacatacactgaaattttggttcttgtggataattttaatgaaacagga180

aatgcaaatttatcttagcatgtttacttcactttctttgcatagataaccagtaatcac240

attgatggatcatgtagtgaaatgtatttttaggtatctaaggaattttggcttcgtttt300

gtgcttgttgacactgaattctattcctaacaacagtgtgtaaggattctgtctgatttc360

ttttaccagtatttgtccatttgcattttctttattattcatggctgctgttctagaaag420

tggaaggtagtgtgtcaagtctgtttaacatgtttccctgatgatcagtgtcttaacacc480

tctctgagtacatgttggccaatgtcgtttctagacccatctattcttgcttgacttatc540

ctggtacatgcctgccaagaaatttctcctcatcctttctgtctcttcactgatttactt600

gatgtgtggatttcacattgatcatatggaaatagaagatacaattttctttattcacag660

tttggaagactttcaatctcatagatcatcattattttttgctactgttccctatgctat720

ggtgaaatttccatttgaataattgcttaaacaattaacaagaaagaatctatttttact780

tgcaataacttccatttcagaacatttactacactgttactatatccaaaaactagtttt840

atatatcatgtgagaaatgactaattcataatttggccatgacatttttttcagaaacag900

aaaaagtgaccaatacatacacaatgctataaatattaagacttcagcaaattaaatatt960

tattcatgatatcacataaaattcatttattatgttttatttaaatgtgtttttaaaaca1020

gtggtatcactaaatattaagttagatgtgtttatgtgcttaatgaatttatattttaga1080

atgttataagttgtatatagtcaaatatgtaataaattttattttttaggtctttctcat1140

taaggtattttaattttgggtcccttttccagagtgactctagctcatgatgagttgaca1200

taaaaactaaacagtacaaaatgtacattgcattcagtattgcacttgatctttgcactg1260

aagtttgagtcagttcatacatttagtacttgggaagtacattaagctaactttcattgc1320

tctggcaaaatgctcgataagataagagtctattgtggaaagccatggcagcaggaaagt1380

aagactgctgatgatgtttaatccatagtcaagacgcagaaggagatgaatgctggtatc1440

caacattttttgctgttcattttctctagaaccctagtccataaagatgtatgacttgca1500

ttcaaaatgcgtccccttcagttgttcaacttttctgtaaatatcctttcaggcatgtct1560

agaagattgtttcgcaaatacttctcaatccattcaagttgatagtgcagattaatcact1620

gcagaataaaagcctgtaacttggctcacgtgccaaggaatatgcacactcctgacacat1680

caataagtaaatcaaagtgtagcttttgcctttaacattgccagacttatgtaatgttct1740

gcacgttcttcctccatcactttttattctaatggtgtttccttgacattgaatcacgct1800

gtggaagctgcttagaattaacattgaaatctactgatatatttatgatgcagcaattta1860

gatttactattttacttagaattttttataattgagagaatataatattttcacagttat1920

ctatctgctgtaaatagaggattttaaaaaaaatctctataacttttttttacaacacac1980

agtaaaattaagttaaaatttaataaagtcactatgttgatttcaaagtgtgctacgccc2040

acggtggtcacgcaggtgtagcagaagatgccactaaggtgggctaaggccgatgggttg2100

gggtctgcgctccctggagatgagccccaggcggttccctggcaatcagctgcgatcatg2160

atgcccgatgagccannnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn2220

nnnnnnnnnnnnnnnnnnnctgggtgactttatggaaagaatttgatagatttcatgatg2280

tagaagaattttattaggcttattttacaggagactaagaccctgggacctaaagatatc2340

tgggtcctgagaatcaggaaatgggtagagacgtggttgatggtatgagacagattttag2400

agaactcttagatcatgggcaatgaccgcaatctgatgcttagaatagatcatctataaa2460

caattatgctgttctttttctttctgttgtatgatctgatgatgtagcccccttgccaag2520

ttccctgatcccccttgccaagttccctgattgtaacagtatataagcattgcttgagag2580

catattcaactacattgagtgtgtctgtctgtcatttcctcgccgattcctgatttctcc2640

ttgagccttttcccttgttctccctcggtcggtggtctccacgagaggcggtccgtggca2700

aaagtgtataaatgttctaaaacatttgaactctaaaacatgcaaaatgaaaaattaaaa2760

taaataaacatgaaaattaaaatatattagctgctaaaagttaaacaatactatataata2820

ttttgttattagaattcaaaatcacattagttggatttaatttgaacattgcattctttc2880

aataataatttcaataaaaaaagtttccccatgatagtagaaaataataacatatgtatc2940

tatctatttatttaactacacatatatagcatttgtttcaactaaaataaatgaatgagc3000

aaagcacctaagtaattggtgtctattatatttatgaagccaatagtttcaaataaatta3060

tcatgcataaggaggtattgcaaatgttaaaccttttttgaaacagatattcccagttac3120

agaaattataatttctaatctttcctataagtagaatgatgataattaatataggccatt3180

tgtaaataatgttcagattaaaatattctctatttcactagagaagaatgatattaaatg3240

tattatattttatttcccattttgtttgcaccactattctatatccctcagcagtttaaa3300

tttgtttcaccatatgtgtgtgtgtttgtatcttaaatatggcactaaaattagaataat3360

ttaatataaatctttaggagaaaagatattgaattattttatgttgataggaaaatatct3420

tttaattgtccaagaatactttttcttctattttaggactgatcagacccaggactaata3480

ttttatatgtactaattctatgtaccaaaatatgttattatctcatgaattctgtctcaa3540

tattgaggtaataaaaatagtccatcatgaactttaaaattaaaataatgattaattaat3600

ttttattcatattttgtttgtatgaatggttatacatcacatgtgtgcctggtgactgtg3660

aatgtcaggagaaggtatgaaagccactggaattggaataagagataatatttgagatgt3720

tatgtgggtgctgagaattagacgcaagccatcttcaagaatagccagcatactatacca3780

ctgagtaatccattcatccctcaataattatctttgtagacagtaaatatatttctaaac3840

tataaatgaccagaaaaattaatgtattattaatgaagacattcatctcatgtgacacac3900

ttcacctgtctaaatcagtaacactctctccactaattaagattttctaagtgcatgaca3960

cttactatttctaaagctgtccaatgggggccagtccccagtcagcacccagtgagataa4020

tccatgaatgcatttatatcttaggaaaaattcttatctatgtagtatttagaacatttt4080

catgtgaggggataaacaaggaagcacagatgctttctgatagaaactttctctttaatt4140

catctagaaaaaaaaaacctctcaggaaaatctctcttgctctcctcccaatgctctatt4200

cagcatcttctccctacttaattctagatctttttctctatgcctccttgctgctgccct4260

gctggctctgctctatgcctccccatgtcacttttctttgctatctcaccgttaccttct4320

ctgcctcactctctgccttcttctctgcttctcacatggccaggctctggacaattatag4380

ttatatgttacattctcataacacatgatatgtcacatagtttctctcaggctagggata4440

tcacaatgactggccaatgagcaagtggccttgcatgtagctctaagttggtgatggttc4500

ccagacagtaagtagccatttggttgaaatttgaggttgggtagtacatgaagactgaat4560

tttcttcaaactctggccttgaaatagtaaaacaacacctatgaaaatgacgacctgtat4620

ttgtctttagaggcaaccacatattgtctgcagggcctgctttgaatttgctctgaagtt4680

agcttgtttgtgtaaaaggaagaatcctatatcagcctgagaaatgtaaaatatcctagc4740

atttcaagtcatcaaaattatatggagagtataaatcatccttctgactattcatagtca4800

tatttgtgtccaccaagtataaaacacactaccaaagggctgtggaaaaaatcgccataa4860

ctgttcttattagggaggcatagcagtggtacctgaggaagttacagcaacaaccagtca4920

tccagtcaataaccccatggctttgccacttggaggtacccaataatgtttggctttgcc4980

gagtaggactccaacaaattcagagggtcaatttttaaatgctggttgtcactgctgaac5040

agtcccattgccctctgcataattccacaatggaaagctttttacactgattgccaatca5100

ttaaacagcctactcagcataaacaggtatgatattattctgcattttgttacattacta5160

gatgaattcctatttcttcctacaatagtggaactgaaaaaagatacacaatcatactac5220

ccctctactaatcttatgacttatatcatttcaattttcagaccataatgcaaactattg5280

accaaaacatgtgaagatgaaaaatagaaatgtagaataatattacatataaaaagaaaa5340

ggcggacttattttgttttatttcttagcatgcatagcaatacatgatttgaggtttata5400

taataaagggacaataaatcttcaagaaacttacccctactgaattaaaatattaaagaa5460

ggtcacacatttactcaaatatattagactactgggcaaatagacatgaaaagtagagtt5520

aatattgaggtaggccttctgtgaaatgtctaaggaaattatgtttcatacagtgtgtaa5580

ccaagtgggaatcatatcagaaagcagtcaaaagcttatattacaagtaacagatgcttg5640

gttatatgacctcccagagcttgactgtctatacacaaaaagtggtgttaataaaactgt5700

aatttgggctatgtttttttaaatggcttcaccaacatgaaaggaagggaatgagcatgt5760

catggatgcttagagattatgcttccagcaagaagaattgagctttggctcttattacag5820

aaacatgacaaggtgtgagttttatttattagaaattatataatattttaagctggggac5880

taaaaattttattgaaacaaacaggcaagggataggcatgtactagaagcaaaaatagga5940

tgtcaatgctgtaatgttattttttggaccaaaatagtatttcctatagaaatgacaatg6000

atcttaggttattattcttcataaagatgacaagttcacaagatatcctagttcattaaa6060

atcgttttagtcatttaatagagtgctgtgatagattacacaaaggaaagcacttacgat6120

gagaaataatgatatccacaattattttcttaattcttagaaacattctattgttatatc6180

tcaatctcagaagccacttattgctttattattgaaacatatgaaattgtaagttatata6240

ttgtctatggtgacatttcaaagaacatgtgacgtacagtgtagcacagataaagaacat6300

aactgcagctgaatcagtaactaaacttacatacattaaatctgccatgttggcaacagt6360

gtgtgcactaccaaaggatgtactaatgctcacgacactcccctatgtcaccctttgttc6420

atcattacatcataggtctattttgtttgcttttgaaatctagaccaagtcttttgtgtc6480

tttccaagcacagagctcattaatttacctcatagacttgttaaacttcttctggttcat6540

caattgaatagaaatactcactactaattatgtgagaccctgccagtaccatagcacatg6600

gataatttttacataaaacatgcatacaagtaagattattcagactgaacatgaatttta6660

gagaaatcaggaaggagtatatgggagtggttggagtgagactagagaaatgtaattaaa6720

ctataatctcaatacaaagatctactaagcaaaaaacatgaaacattgtcattcaagtga6780

aacatcagtcttcaaattggaaagatatttttactaggaaaatgtctggtagatggttat6840

tatctagaaaacacaaaaattagaaaacggtaaactttaataaaaagaataatacaatga6900

gactacatgaaaagttcttaactaatgaaacaaatatcttgaaacttttttcttaaaagt6960

ttaatatcaataaccatcatggaaattcaaattaaaactatttacatattacccctgaaa7020

taataactaatacccaataaaaataatataaacaaaaaatggcaatgcatgccatcatgg7080

atttgggagagagaatgttcattgcagttctgaatggatactggtgccaccacggtgaaa7140

atctctgtataggtccttccaaaagctgaaaatagacatatcacaagacctgccacacat7200

ttttcaagcaaatacccaaaggactctacctgactgcagagacactttctcataaaatat7260

tattgttgatctattcataatatctggaaaatagaaacagccaagatgcccatcaactga7320

ttaatagatgataaaattattgtacatttcagtgtaatattattcagtttttaagaaaaa7380

tgaaattatgtaataagcatgtaaatggatatatcttgaaacaaccattccccattatat7440

tacctaaacattgaaagtccaaaatcatatgatctttttagtggatctactaatcttttg7500

ctatatgtattttattgaactacccatggatgtgagataattggtaacaacagcacatgg7560

gagagcatgggatcattcaaggaagattagagagaatgcattttttaggagataatggag7620

gagcaatagaaaggattaaatgaggttactgatgaaagtgatggttagagaaggcaatat7680

gaggagggataactagcacttagggccttttgaaaaagacatagagaaaatactattgta7740

gaaacttcctataattggtgtatagttatatacaccaaagagctcagatggagttaccct7800

ataatggaaatattaactactttttatcactgtgataaaacatcctgaacagagcaacat7860

agattgggaagcatttactttggcttacagttctaacgggataaaaattcatgatgaaag7920

aatgaatatgtcagcaaacagcagtagcaatggcctgagaagcaggtgagagctcacatc7980

ttgaagtgtaagaatgtagcagagagaacaaactgcaaatgaccagaaaatgcttttgga8040

tcagagcccatacccctctgactgacttctccagaaattctgaacaaataaaactcccca8100

aacagagccataactgaaggtccagtgtctgagactactaggggtatttcttattcaaac8160

cactacaatggggtggggggagcaatcctccaagtaggcactacacacagacaaataaaa8220

actctagtaactggaatggattgacttatttgaattacttgccagtggagctacatagag8280

cacaattattgtatttaaattaccctttatgatcttacaaaacttgacagtaagatcata8340

ttgctaaagaaaccacatatttgaatcagggaacatggtgatatctagttgttcttcaac8400

tggaaacttcatgctttctgcccagcattcatgttgctggaaagagcaatgtacactacc8460

agtgtagaaattaaatcatcaatcttatcaagatgtggatcctataagttacaataaaaa8520

ttagcctgataagatatccccaccagaagaatattcacataaatgctatgggagcaacaa8580

gctattttctaaattagctttaatcctattctacaagagagaatccatatctagaatagt8640

tatagggatcaagaacccatggcttgattggtcataggcccaatgggagatcctaatatt8700

attgttctacaaaatgaaaataactcctaatgacttgttgctgcagtaataagttagtat8760

gttgctcaactctcacaagagaagttttgtcttacaataaatggcaattaaagcagcccc8820

acaagatttatatcataccgatctcctcatggcctatgcatctagaagctaggaaacaaa8880

gaggaccctaagagagacatacatggtccccctggagaaggggaagggggcaagacctcc8940

aaagctaattgggagcatgggggaggggagagggagttagaagaaagagaaggggataaa9000

aggagggagaggaggacaagagagagaaggaagatctagtcaagagaagatagaggagag9060

caagaaaagagataccatagtagagggagccttgtatgtttaaatagaaaactggcacta9120

gggaattgtccaaagatccacaaggtccaactaataatctaagcaatagtcgagaggcta9180

ccttaaaagcctttctctgataatgagattgatgactaccttatataccatcctagagcc9240

ttcatccagtagctgatggaagcagaagcagacatctacagctaaacactgagctagttg9300

cagacagggaggagtgatgagcaaagtcaagaccaggctggagaaacacacagaaacagc9360

agacctgaaaaaaatgttgcacatggaccccagactgatagctgggagtccagcatagga9420

cttttctagaaaccctgaatgaggatatcagtttggaggtctggttaatctatggggaca9480

ctggtagtggatcaatatttatccctagttcatgactggaatttgggtacccattccaca9540

tggaggaattctctgtcagcctagacacatgggggaggttctaggtcctgctccaaataa9600

tgtgttagactttgaagaactcccttgagaagactcaccctccctggggagcagaaaggg9660

gatgggatgagggttggtgagggacaggagaggaggggagggtgagggaactgggattga9720

caagtaaatgatgcttgtttctaatttaaatgaataaaggaaaagtaaaagaagaaaaga9780

aaacaggccaaaagattataaaagacagaggtggtgggtgactataaagaaacactatta9840

tctaaataaaaatatgtcagaagcacacatgaacttatagtgtttatgaaagtatgtata9900

ataactacataatctcaagccaagaaaaaaatatcatctttcagtgatgaaggtgatttt9960

atttctcccagaattaaagccaaagacctaatgaaagtaattatcttcaaaaggttgaaa10020

atacatactttgcaatacacagatctgcctagaaatctcatgttcacaatacacatgatg10080

ctcaattgaattccattcaatgttacagtttagataaacagtttgtagataaactcacaa10140

tgtatcatttctttttattttttgaccaaacagcttctcatctgttattcagaataattc10200

ctcgatggcaggatatccatcccaattgggggaaggggagaatttgaagaaaacctagac10260

cacatacatatttgccattgggaaacaaagtctaaaatgatgttgttcacatcttctcta10320

ctagtcctctccccgtcccaaagaaccttggtatatgtgcctcattttacagagagagga10380

aagcaggaactgagcatcccttacttgccatcctcaacccaaaatttgcatcattgctca10440

gctctgcccttctcatatgacagttacaagtcaaggcttccaaagtccctctgtcatgtt10500

tggtgtcaatagtttatacagatgacttcatgtcttcatatctaatgtcttatatagatt10560

aatattaaacaatgttatttctctaaccacattttaaattaatttaaaaatccattaatt10620

gtgtctataaaatgcagacagagtgctgagacacaatataagcctgatgatctgaatttg10680

aaactcacacccaccacatggagaatcaacttccaaaaattttcctattacttccacact10740

tacaccattgtacaaacacaataataatgaacaaaatgaaatgaaataaaaaattaagtc10800

tctgtaggtaatgctactgtgcagcaaaagtaaaaatggcagcttaagcttgctttatgg10860

ttacactttaccatcttccattaattataaggacttcaatcatggcagaactatgctgtt10920

attgtctcagtgtaacctaaccaggtgttccagatgttcttaatgtggacacctaaacta10980

tttgatatttgggttaagatctttccctctttcagaagaaacctcaggacagagggaatc11040

ttgtcttttaattttgagtctgtagactttttccatttcaaatatacatgaaacaagtga11100

tgaagaaaattaatcaaaaggtgggaattgcaatgatattaggttcaatattaagcttca11160

atattatcatggaatcgcctgttatacactgagtgtttggcaataagggatttttagaag11220

aaggagtttttattctcaacaggttccttaagtttagctcaaataaatctaagcaatcca11280

ctctagaattaaatagtttcctaagggcacagctatgaatagagctcaatttacatataa11340

aattttgttcaccatttatgtcattccagttttcattagtacaaggaaaatacaaaatat11400

ttagatgtcaatatcaagtgaatagttcatctccttttttaatatatatcacctaaatca11460

ccattttctcagaaaaatctggcctgaagttctgtctggaacttcaacatgaaaaatatg11520

cacagcttgctattataaatcctagttgatttttaagattcatgtctggtgtctgactca11580

gaggggccagaggctagacaaatattttttgaatcttcattgtgaagatttttaatgatt11640

attttaatataaataacaaagatgatggataatgtaactttgtacagttcatagacgctg11700

aactactttgtgcttaaaatgttagttccctatcataaatgataggtgataagtgtatgt11760

ttaatactttccctctgagctatattcatgtactagagaattattttaaacatgaaaaga11820

ctgtgtttatagtctcagctcctgagaactggtccaaccttaggcaggtgaatgccagga11880

gcaacgtttttcttctacagaggatgctttgctgccaagcaacctggttgtgtggaaatg11940

ttccttttttaatcaagtttaaagggtcttcatcatgctgttgctccacatattttcagg12000

ttagagcttggtccttggagtattatcttttaccagaaaattcatagtattctttcaata12060

actaacaactaaacttttcgataaaaaagaattggaatttcaattttaaagcctgagtaa12120

aattcttgtgaatcaggatattttattttaagtcttatcttttaaaaagttattttattt12180

tttaaaaaattataatatactttcataatttccctccttcacttttctttacaaacactt12240

ctatagatcaccatgtgtttttttttttacatttatggcctctttctgttcattgttatt12300

acatacaaatagtcttgcctatagaagaacaccacaatttgttacctgataacaaattat12360

caacccttaaaacctacaaactattgatattactgaaaagactatacttatagatgtaaa12420

gatatatgtgtgtgcacatatatagatacacatatatgtaggatttttaattttagattt12480

tagacatcaaaattatttatatgactgagaaactagacactataaatgagcattcagtat12540

tcaacaccgtgattttagatattgtcacaatgacagaaaattttcttatagaaaatttta12600

agttttgtgattgctctgtgcacttagtgaagtctcacagaaaaagaatcatagtatttt12660

tagtttataataaaaagtacatataattaaaatggttggcacaaaacaacatttgagcat12720

ttttcctatttactatcaagtagtatcattttgaaataataatttgactagtttcaaaaa12780

tgaaaacaaaatttaaactaaatgcctaatctagcctgataacatttttatgaatgaaat12840

tattcaatagtgttatcaattaggggcccaaaacttttcctaaaataaaacttttaattt12900

ttttccatttttatttaaattagaaacaaaattgttttacatgtaaatcagagtttcctc12960

accctccccttctccctgtccctcactaacaccctacttgtcccataccatttctgctcc13020

ccagggagggtgaggccttccatggggaaacttcagagtctgtctatcctttcggatagg13080

gcctaggccctcacccatttgtctaggctaaggctcacaaagtttactcctatgctagtg13140

ataagtactgatctactacaagagacaccatagatttcctaggcttcctcactgacaccc13200

atgttcatggggtctggaacaatcatatgctagtttcctaggtatcagtctggggaccat13260

gagctcccccttgttcaggtcaactgtttctgtgggtttcaccaccctggtcttgactgc13320

tttgctcatcactcctccctttctgtaactgggttccagtacaattccgtgtttagctgt13380

gggtgtctacttctactttcatcagcttctgggatggagcctctaggatagcatacaatt13440

agtcatcatctcattatcagggaagggcatttaaagtagcctctccattgttgcttggat13500

tgttagttggtgtcatctttgtagatctctggacatttccctagtgccagatatctcttt13560

aaacctacaagactacctctattatggtatctcttttcttgctctcgtctattcttccag13620

acaaaatcttcctgctcccttatattttcctctcccctcctcttctccccttctcattct13680

cctagatccatcttcccttcccccatgctcccaagagagatgttgctcaggagatcttgt13740

tccttaacccttttcttggggatctgtctctcttagggttgtccttgtttcctagcttct13800

ctggaagtgtggattgtaagctggtaatcatttgctccatgtctaaaatccatatatgag13860

tgatgtttgtctttttgtgactgggttacctcactcaaaatggtttcttccatatgtctg13920

tggatttcaatagcacaaacaacatacagtatcttggggcaacactaaccaaacaagtga13980

aagaccagtatagcaagaactttgagtttaaagaaagaaattaaagaagataccagaaaa14040

tggaaagatctcccatgctctttgataggcagaatcaacatagtaaaaatggcaatcttg14100

ccaaaatccatctacagactcaatgcaatccccattaaataccagcacacttcttcacag14160

acctgaaagaataatacttaactttatatggagaaacaaaagacccaggataggccaaac14220

aaccctgtacaatgaaggcacttccagaggcatccccatccctgacttcaagctctatta14280

tagagtaataatcctgaaaacagcttggtaatggcacaaaaatagacaggtagaccaatg14340

gaattgagttgaaaaccctgatattaacccacatatctatgaacacctgactttgacaaa14400

gaagctaaggttatacaatgtaagaaagaaagcatcttcaacaaatcgtgctggcataac14460

tggatgctggcatgtagaagactgcagatagatccatgtctaatgccatgcacaaaactt14520

aagtccaaatggatcaaaaacctcaacataaatccagccacactgaacctcatagaagag14580

aaagtgggaagtatccttgaataaattggtacaggagaccacatcttgaacttaacacca14640

gtagcacagacaatcagatcaataatcaataaatgggacctcctgaaactgagaagcttc14700

tgtaaggcaatggataagtcaacaggacaaaatggcagcccacggaatgggaaaagatat14760

tcaccaatcctatatctgacagagggctgctctctatttgcaaagaacacaataagctag14820

tttttaaaacaccaattaatccgattataaagttgggtagagaactaaataaagaattgt14880

taacagagcaatctaacttggcagaaagacacataagaaagtgctcaccat14931

<210>3

<211>4001

<212>dna

<213>中国仓鼠

<400>3

ccaagatgcccatcaactgattaatagatgataaaattattgtacatttcagtgtaatat60

tattcagtttttaagaaaaatgaaattatgtaataagcatgtaaatggatatatcttgaa120

acaaccattccccattatattacctaaacattgaaagtccaaaatcatatgatcttttta180

gtggatctactaatcttttgctatatgtattttattgaactacccatggatgtgagataa240

ttggtaacaacagcacatgggagagcatgggatcattcaaggaagattagagagaatgca300

ttttttaggagataatggaggagcaatagaaaggattaaatgaggttactgatgaaagtg360

atggttagagaaggcaatatgaggagggataactagcacttagggccttttgaaaaagac420

atagagaaaatactattgtagaaacttcctataattggtgtatagttatatacaccaaag480

agctcagatggagttaccctataatggaaatattaactactttttatcactgtgataaaa540

catcctgaacagagcaacatagattgggaagcatttactttggcttacagttctaacggg600

ataaaaattcatgatgaaagaatgaatatgtcagcaaacagcagtagcaatggcctgaga660

agcaggtgagagctcacatcttgaagtgtaagaatgtagcagagagaacaaactgcaaat720

gaccagaaaatgcttttggatcagagcccatacccctctgactgacttctccagaaattc780

tgaacaaataaaactccccaaacagagccataactgaaggtccagtgtctgagactacta840

ggggtatttcttattcaaaccactacaatggggtggggggagcaatcctccaagtaggca900

ctacacacagacaaataaaaactctagtaactggaatggattgacttatttgaattactt960

gccagtggagctacatagagcacaattattgtatttaaattaccctttatgatcttacaa1020

aacttgacagtaagatcatattgctaaagaaaccacatatttgaatcagggaacatggtg1080

atatctagttgttcttcaactggaaacttcatgctttctgcccagcattcatgttgctgg1140

aaagagcaatgtacactaccagtgtagaaattaaatcatcaatcttatcaagatgtggat1200

cctataagttacaataaaaattagcctgataagatatccccaccagaagaatattcacat1260

aaatgctatgggagcaacaagctattttctaaattagctttaatcctattctacaagaga1320

gaatccatatctagaatagttatagggatcaagaacccatggcttgattggtcataggcc1380

caatgggagatcctaatattattgttctacaaaatgaaaataactcctaatgacttgttg1440

ctgcagtaataagttagtatgttgctcaactctcacaagagaagttttgtcttacaataa1500

atggcaattaaagcagccccacaagatttatatcataccgatctcctcatggcctatgca1560

tctagaagctaggaaacaaagaggaccctaagagagacatacatggtccccctggagaag1620

gggaagggggcaagacctccaaagctaattgggagcatgggggaggggagagggagttag1680

aagaaagagaaggggataaaaggagggagaggaggacaagagagagaaggaagatctagt1740

caagagaagatagaggagagcaagaaaagagataccatagtagagggagccttgtatgtt1800

taaatagaaaactggcactagggaattgtccaaagatccacaaggtccaactaataatct1860

aagcaatagtcgagaggctaccttaaaagcctttctctgataatgagattgatgactacc1920

ttatataccatcctagagccttcatccagtagctgatggaagcagaagcagacatctaca1980

gctaaacactgagctagttgcagacagggaggagtgatgagcaaagtcaagaccaggctg2040

gagaaacacacagaaacagcagacctgaaaaaaatgttgcacatggaccccagactgata2100

gctgggagtccagcataggacttttctagaaaccctgaatgaggatatcagtttggaggt2160

ctggttaatctatggggacactggtagtggatcaatatttatccctagttcatgactgga2220

atttgggtacccattccacatggaggaattctctgtcagcctagacacatgggggaggtt2280

ctaggtcctgctccaaataatgtgttagactttgaagaactcccttgagaagactcaccc2340

tccctggggagcagaaaggggatgggatgagggttggtgagggacaggagaggaggggag2400

ggtgagggaactgggattgacaagtaaatgatgcttgtttctaatttaaatgaataaagg2460

aaaagtaaaagaagaaaagaaaacaggccaaaagattataaaagacagaggtggtgggtg2520

actataaagaaacactattatctaaataaaaacatgtcagaagcacacatgaacttatag2580

tgtttatgaaagtatgtataataactacataatctcaagccaagaaaaaaatatcatctt2640

tcagtgatgaaggtgattttatttctcccagaattaaagccaaagacctaatgaaagtaa2700

ttatcttcaaaaggttgaaaatacatactttgcaatacacagatctgcctagaaatctca2760

tgttcacaatacacatgatgctcaattgaattccattcaatgttacagtttagataaaca2820

gtttgtagataaactcacaatgtatcatttctttttattttttgaccaaacagcttctca2880

tctgttattcagaataattcctcgatggcaggatatccatcccaattgggggaaggggag2940

aatttgaagaaaacctagaccacatacatatttgccattgggaaacaaagtctaaaatga3000

tgttgttcacatcttctctactagtcctctccccgtcccaaagaaccttggtatatgtgc3060

ctcattttacagagagaggaaagcaggaactgagcatcccttacttgccatcctcaaccc3120

aaaatttgcatcattgctcagctctgcccttctcatatgacagttacaagtcaaggcttc3180

caaagtccctctgtcatgtttggtgtcaatagtttatacagatgacttcatgtcttcata3240

tctaatgtcttatatagattaatattaaacaatgttatttctctaaccacattttaaatt3300

aatttaaaaatccattaattgtgtctataaaatgcagacagagtgctgagacacaatata3360

agcctgatgatctgaatttgaaactcacacccaccacatggagaatcaacttccaaaaat3420

tttcctattacttccacacttacaccattgtacaaacacaataataatgaacaaaatgaa3480

atgaaataaaaaattaagtctctgtaggtaatgctactgtgcagcaaaagtaaaaatggc3540

agcttaagcttgctttatggttacactttaccatcttccattaattataaggacttcaat3600

catggcagaactatgctgttattgtctcagtgtaacctaaccaggtgttccagatgttct3660

taatgtggacacctaaactatttgatatttgggttaagatctttccctctttcagaagaa3720

acctcaggacagagggaatcttgtcttttaattttgagtctgtagactttttccatttca3780

aatatacatgaaacaagtgatgaagaaaattaatcaaaaggtgggaattgcaatgatatt3840

aggttcaatattaagcttcaatattatcatggaatcgcctgttatacactgagtgtttgg3900

caataagggatttttagaagaaggagtttttattctcaacaggttccttaagtttagctc3960

aaataaatctaagcaatccactctagaattaaatagtttcc4001

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1