衍生自人基因的启动子的制作方法

文档序号:511831阅读:754来源:国知局
衍生自人基因的启动子的制作方法
【专利摘要】本发明涉及转染的哺乳动物宿主细胞(其分泌外源蛋白的能力已通过使用具有衍生自人基因的启动子的外源基因表达载体得到增强),以及利用所述细胞生产外源蛋白的方法。提供了用于增强充当蛋白药物的外源蛋白在培养的哺乳动物细胞或其它宿主细胞中的生产的方法。提供了衍生自人基因的启动子,所述人基因在培养的哺乳动物细胞或其它宿主中具有比巨细胞病毒(CMV)启动子更强的启动子活性。
【专利说明】衍生自人基因的启动子

【技术领域】
[0001] 本发明涉及转染的哺乳动物宿主细胞(其外源蛋白转录活性已通过使用具有衍生 自人基因的启动子的外源基因表达载体得到增强),以及利用所述宿主细胞生产外源蛋白 的方法。

【背景技术】
[0002] 由于遗传重组技术的发展,蛋白药物产品,例如治疗性蛋白和抗体药物的市场已 快速扩增。尤其是,抗体药物当施用到人体时可以具有高特异性,而不导致不良免疫反应, 并且因此其开发已被积极推进。
[0003] 作为通过其产生以抗体药物为代表的药物蛋白产品的宿主,可以使用微生物、酵 母、昆虫、动物或植物细胞、转基因动物或植物细胞等。为了使药物蛋白产品具有生物学活 性或免疫原性,翻译后修饰例如折叠或糖基化是必需的。因此,微生物(使用其无法进行复 杂的翻译后修饰),或植物(具有不同聚糖结构),不适合作为宿主。考虑到这种细胞具有聚 糖结构类似于人的聚糖结构并且安全,并且使用这种细胞可以进行翻译后修饰,使用培养 的哺乳动物细胞例如CH0 (中国仓鼠卵巢)细胞,其来自于与人密切相关的物种,是目前的 标准。
[0004] 在培养的哺乳动物细胞用作宿主的情况下,问题在于相比使用微生物或类似物生 长速率较低,生产效率低,成本高等(NPL 1)。另外,为了临床使用药物蛋白产品,必须施用 大量的产品。因此,其生产能力的缺乏是另一个世界性的问题。当在培养的哺乳动物细胞表 达系统中生产药物蛋白产品时,相比低分子量合成药物产品生产成本较高。已经进行相应 的尝试以通过改善相应生产步骤来减少生产成本。在培养的哺乳动物细胞表达系统中生产 量的改善是减少生产成本的有效方法(NPL 2和NPL 3)。因此,为了改善外源基因在培养的 哺乳动物细胞中的生产效率,已经研究了基于启动子、增强子、抗生素选择标志物、基因扩 增、培养工程改造技术等的各种方法。当其中CH0细胞用作宿主细胞表达外源基因(S卩,生 产药物蛋白产品)的情况下,通常使用病毒衍生的、人巨细胞病毒主要立即早期启动子(下 文称作"CMV启动子")(NPL4、NPL 5和NPL 6)。另外,已知可以使用人核糖体蛋白基因例如 RPL32或RPS11的转录起始位点上游多核苷酸作为DNA元件,用于在CH0细胞中的蛋白表 达,组合另一种异源启动子(NPL7和PLT 1)。
[0005] 引用列表 专利文献 PTL :; MO 2 00 6/12 309.7 非专利文献 NPL 1: Flarian M. Wurm, , ?-lat? Biotechool a 22(11): 1393-1398, 2004 I^IPL 2 : Farid SS.# J Chromatogr B Analyt Technol Biomed Life Sci. S4S⑴:8-18r 2007 K?L 3: Werner RG. Economic aspects of coTOercial manufacture of faiopharmaceuticaIs * J Biotechnoi. 113 {1-3): 171-腿# 2004 NPL 4: Durocher Y et al.r Curr Opin Biotechnoi - 20(6): 700-707, 2009 Wh 5: Eoshart M et al e r Cell* 41(2) : 521?530# 1985 NPL 6: Foecking MK et al ·, Gene. 45(1) : 101-105, 1 986 NPL 7: Hoeksema et al, r Biotechnology Research Internationalr Volume 2011# Article ID 4928?5# 11 pages。
[0006] 发明概述 技术问题 本发明的一个目标是提供用于增加要用在药物蛋白产品中的外源蛋白生产的方法,所 述方法使用对增强宿主细胞例如培养的哺乳动物细胞中外源基因的表达具有高活性的启 动子。通过鉴定在CH0细胞等中具有等于或高于CMV启动子的启动子活性的启动子,提供了 在哺乳动物细胞中稳定地实现高的外源基因表达的方法,并且可以提供有利于改善生产水 平(换句话说,减少药物蛋白产品在培养的哺乳动物细胞表达系统中的生产成本)的方法。
[0007] 问题解决方案 本发明人为了解决上述问题进行了深入研究,并发现从位于转录起始位点上游约2kbp 的核苷酸开始,并在紧接对应于人核糖体蛋白基因起始密码子的核苷酸序列上游的核苷酸 终止的多核苷酸具有高的启动子活性。他们发现所述启动子活性可以显著改善在培养的哺 乳动物细胞中表达的外源蛋白的生产,并且从而完成本发明。本发明包括下列方面。
[0008] (1)包含由序列表中SEQ ID NO: 1所不的核苷酸序列的多核苷酸。
[0009] (2)包含由序列表中SEQ ID N0: 2所不的核苷酸序列的多核苷酸。
[0010] (3)包含由序列表中SEQ ID N0: 3所不的核苷酸序列的多核苷酸。
[0011] (4)包含与根据上述(1)至(3)任一项的多核苷酸的核苷酸序列具有95%或更高 同一'I"生的核苷酸序列并具有启动子活性的多核苷酸。
[0012] (5)包含与根据上述(1)至(3)任一项的多核苷酸的核苷酸序列具有99%或更高 同一'I"生的核苷酸序列并具有启动子活性的多核苷酸。
[0013] (6)在严格条件下与包含与根据上述(1)至(3)任一项的多核苷酸的核苷酸序列 互补的核苷酸序列的多核苷酸杂交并具有启动子活性的多核苷酸。
[0014] (7)包含根据上述(1)至(6)任一项的多核苷酸的外源基因表达单元。
[0015] (8)根据上述(7)的外源基因表达单元,其中所述外源基因是编码多聚体蛋白的基 因。
[0016] (9)根据上述(7)的外源基因表达单元,其中所述外源基因是编码异源多聚体蛋白 的基因。
[0017] (10)根据上述(7)的外源基因表达单元,其中所述外源基因是编码抗体或其功能 片段的基因。
[0018] (11)包含根据上述(7 )至(10 )任一项的外源基因表达单元的外源基因表达载体。
[0019] (12)包含根据上述(7)至(10)任一项的外源基因表达单元和一种或多种选自下 列组A中(a)至(i)所述的多核苷酸的外源基因表达载体: 组A (a) 包含由序列表中SEQ ID NO: 10所示的核苷酸序列的多核苷酸; (b) 包含由序列表中SEQ ID N0: 11所示的核苷酸序列的多核苷酸; (c) 包含由序列表中SEQ ID N0: 12所示的核苷酸序列的多核苷酸; (d) 包含由序列表中SEQ ID N0: 13所示的核苷酸序列的多核苷酸; (e) 包含由序列表中SEQ ID N0: 14所示的核苷酸序列的多核苷酸; (f) 包含由序列表中SEQ ID N0: 10至14任一所表示的核苷酸序列的至少3000个连续 核苷酸的多核苷酸; (g) 包含由序列表中SEQ ID N0: 10至14任一所表示的核苷酸序列的至少2000个连续 核苷酸的多核苷酸; (h) 包含与根据上述(a)至(g)任一项的多核苷酸的核苷酸序列具有95%或更高同一 性的多核苷酸序列并具有增强外源基因表达的活性的多核苷酸;和 (i) 包含与根据上述(a)至(g)任一项的多核苷酸的核苷酸序列具有99%或更高同一 性的核苷酸序列并具有增强外源基因表达的活性的多核苷酸。
[0020] (13)已经导入根据上述(11)或(12)的外源基因表达载体的转化的细胞。
[0021] (14)已经导入根据上述(11)或(12)的外源基因表达载体和元件载体(element vector)的转化的细胞。
[0022] (15)根据上述(13)或(14)的转化细胞,其中所述细胞是衍生自哺乳动物的培养 的细胞。
[0023] (16)根据所述(15)的转化细胞,其中所述衍生自哺乳动物的培养的细胞是C0S-1 细胞、293细胞或CH0细胞。
[0024] (17)生产蛋白的方法,其特征在于包括培养根据上述(13)至(16)任一项的转化 细胞并从所得的培养产物中获得衍生自外源基因的蛋白。
[0025] (18)根据上述(1)至(6)任一项的多核苷酸用于在转化细胞中表达外源基因的用 途。
[0026] (19)根据上述(11)至(12)的外源基因表达载体用于在转化细胞中表达外源基因 的用途。
[0027] 本发明的有益效果 通过将使用本发明的衍生自人基因的启动子的外源基因表达载体导入哺乳动物宿主 细胞,可以显著增强治疗性蛋白、抗体等的外源基因的表达。并且,通过组合DNA元件使用 本发明的启动子,可以进一步增强治疗性蛋白、抗体等的外源基因的表达。
[0028] 附图简述
[图1]图1显示通过使用SEAP活性作为指标在转染的CH0-K1多克隆细胞中评价启动 子活性的图。该图显示每个启动子的SEAP活性,并且CMV启动子的值归一化为1。显示了 两个独立实验的结果(η = 3,平均值土 SD)。
[0029] [图2]图2显示通过使用SEAP活性作为指标在转染的CH0-K1多克隆细胞中评 价截短启动子活性的图。该图显示每个启动子的活性,并且CMV启动子的值归一化为1 (η = 3,平均值土 SD)。
[0030] [图3]图3显示其中通过扩增GAPDH区域证实进行芯片上ChIP (ChIP-on-chip) 的样品特异性地与抗乙酰化组蛋白H3抗体染色质免疫沉淀的图。
[0031] [图4]图4显示其中插入DNA元件的SEAP表达载体的示意图。
[0032] [图5]图5显示其中通过使用在转染的CH0细胞系中CMV启动子表达的SEAP的 活性作为指标证实的DNA元件A2、A7、A18、B5和C14的增强表达效果的图。
[0033] [图6]图6显示其中通过使用在转染的CH0细胞系中EF-1 α或SV40启动子表达 的SEAP的活性作为指标证实的DNA元件Α2和Α7的增强表达效果的图。
[0034] [图7]图7显示其中插入DNA元件的抗体表达(抗体基因 X重链和轻链共表达) 载体的示意图。
[0035] [图8]图8显示其中通过在转染的CH0细胞系中使用CMV或EF-1 α启动子表达 的抗体的生产水平(通过ELISA法测量)作为指标证实的DNA元件Α7的增强表达效果的图。
[0036] [图9]图9是显不DNA兀件A2和相关序列的序列长度的表。
[0037] [图10]图10显示其中通过在转染的CH0细胞系中使用SEAP的活性作为指标证 实的DNA元件A2和相关序列的增强表达效果的图。
[0038] [图11]图11是显示DNA元件A7和相关序列的序列长度的表。
[0039] [图12]图12显示其中通过在转染的CH0细胞系中使用SEAP的活性作为指标证 实的DNA元件A7和相关序列的增强表达效果的图。
[0040] [图13]图13是显示DNA元件A18和相关序列的序列长度的表。
[0041] [图14]图14显示其中通过在转染的CH0细胞系中使用SEAP的活性作为指标证 实的DNA元件A18和相关序列的增强表达效果的图。
[0042] [图15]图15是显不DNA兀件B5和相关序列的序列长度的表。
[0043] [图16]图16显示其中通过在转染的CH0细胞系中使用SEAP的活性作为指标证 实的DNA元件B5和相关序列的表达增强效果的图。
[0044] [图17]图17是显不DNA兀件C14和相关序列的序列长度的表。
[0045] [图18]图18显示其中通过在转染的CH0细胞系中使用SEAP的活性作为指标证 实的DNA元件C14和相关序列的表达增强效果的图。
[0046] [图19]图19显示其中通过在转染的HEK293细胞系中使用SEAP的活性作为指标 证实的DNA元件A2、A7、A18、B5和C14的表达增强效果的图。
[0047] [图20]图20是显示在DNA元件A2、A7或A18的全长序列的基础上在起始和终 止点的核苷酸的表。
[0048][图21]图21是显示在DNA元件B5或C14的全长序列的基础上在起始和终止点 的核苷酸的表。
[0049] 实施方案说明 在下文中,将对本发明进行具体的说明。
[0050] 如本文所用,术语"基因"是指被转录成mRNA和随后翻译成蛋白质的区段,并且不 仅包括DNA,还包括其mRNA、其cDNA和其RNA。
[0051 ] 如本文所用,术语"多核苷酸"以与核酸相同的意义使用,并且还包括DNA、RNA、探 针、寡核苷酸和引物。
[0052] 如本文所用,术语"多肽"和"蛋白"的使用没有区别。
[0053] 如本文所用术语"基因表达"指其中mRNA从基因转录的现象和/或其中蛋白从 mRNA翻译的现象。
[0054] 如本文所用术语"外源基因"指人工导入宿主细胞的基因。
[0055] 如本文所用术语"外源蛋白"指由外源基因编码的蛋白。
[0056] 如本文所用术语"基因表达单元"指在转录阅读框的方向上具有至少启动子区域、 外源基因和转录终止区域(多聚(A)附加信号)的多核苷酸。
[0057] 如本文所用术语"增强外源基因表达的活性"指通过产生有利于在包含外源基因 的基因表达单元周围的任何DNA中转录的环境和显著改善转录效率,增强外源蛋白在宿主 细胞中的产生的活性。
[0058] 如本文所用术语"启动子"指在从DNA到RNA的转录起始中涉及的转录因子可以 结合的区域,并且在本说明书中有时称作"启动子区域"。启动子的实例包括从位于转录起 始位点上游约2kbp的核苷酸开始并在紧接对应起始密码子的核苷酸序列的上游核苷酸结 束的多核苷酸,并且启动子可以包含5' -UTR和内含子。
[0059] 如本文所用术语"启动子活性"指其中转录因子结合启动子并起始转录以产生基 因编码的蛋白的活性。其可以通过使用由报告基因编码的蛋白(例如分泌型碱性磷酸酶 (SEAP))的活性作为指标进行测定。
[0060] 如本文所用短语"具有启动子活性"指如下文所述(实施例3)在相同条件下具有 等于或高于CMV启动子的活性的表达SEAP的活性,以通过使用SEAP的表达水平作为指标 评价启动子活性。
[0061] 如本文所用术语"DNA元件"指在多聚核苷酸位于基因表达单元的附近或在含有基 因表达单元的外源基因表达载体中的情况下,具有增强外源基因表达的活性的多核苷酸。 [0062] 如本文所用术语"抗体的功能片段",指具有抗原结合活性的抗体的部分片段,并 且包括Fab、F (ab')2等。但是,该术语不限于这些分子,只要片段对抗原具有结合亲和性。 [0063] 如本文所用术语"同一性"指两个或更多个核苷酸序列或氨基酸序列的序列之间 的关系,通过比较这些序列确定,如本领域已知。在本领域中,术语"同一性"还可以指核酸 分子间或多肽之间序列相关性的程度,如通过两个或更多个核苷酸序列或两个或更多个氨 基酸序列的串之间的匹配所确定。可以通过计算在具有缺口比对(如果有的话)的两个或更 多个序列的最小者之间相同匹配的百分比评价"同一性",所述比对通过特定数学模型或计 算机程序(即"算法")进行。具体而言,可以通过使用软件例如欧洲分子生物学实验室-欧 洲生物信息研究所(EMBL-EBI)提供的ClustalW2评价同一性,但是软件不限于其,并且可 以使用任何软件,只要其是本领域技术人员所使用的。
[0064] 如本文所用短语"在严格条件下杂交"指在形成所谓的特异性杂交但是不形成非 特异性杂交的条件下的杂交。条件的实例包括这样的条件,其中包含与另一个核酸具有80% 或更多,优选90%或更多,更优选95%或更多,最优选99%或更多的同一性的核苷酸序列的 核酸的互补链杂交,但是包含具有更低同一性的核苷酸序列的核酸的互补链不杂交。更具 体地,其意味着在68°C,在可商购获得的杂交液ExpressHyb杂交溶液(由Clontech, Inc. 制造)中实现杂交或在如下的条件下实现杂交:所述条件使得杂交在68°C,在0. 7至1. 0M NaCl的存在下进行,使用具有DNA固定于其上的滤器,然后在68°C使用0. 1至2 X SSC溶液 (lxSSC溶液由150mM NaCl和15mM柠檬酸钠组成)洗涤,或在其等效条件下实现杂交。 [0065] 1.用于增强外源基因表达的启动子 作为本发明的衍生自人基因的启动子(下文有时也称作"本发明的启动子"),优选从位 于转录起始位点上游约2kbp的核苷酸开始并在紧接对应人核糖体蛋白基因的起始密码子 的核苷酸序列的上游核苷酸结束的多核苷酸。衍生自人基因的启动子可以是从位于转录起 始位点上游约lkbp或约0. 5kbp的核苷酸开始并在紧接对应人核糖体蛋白基因的起始密码 子序列的核苷酸序列的上游核苷酸结束的多核苷酸。
[0066] 人核糖体蛋白基因优选为人核糖体蛋白S7基因(下文称为"RPS7")、人核糖体蛋 白L32基因(下文称为"RPL32")或人核糖体蛋白L34基因(下文称为"RPL34")。
[0067] 本发明的启动子优选是RPS7、RPL32或RPL34的启动子,更优选是由序列表中任 意SEQ ID N0: 1-9所表示的多核苷酸,并且特别优选由任意SEQ ID N0: 1-3所表示的多核苷 酸。
[0068] SEQ ID N0: 1、2和3的核苷酸序列是分别从位于转录起始位点上游约2kbp的核苷 酸开始并在紧接RPS7、RPL32和RPL34对应起始密码子的核苷酸序列的上游核苷酸结束的 多核苷酸。SEQ ID N0: 4、6和8的核苷酸序列是分别从位于转录起始位点上游约lkbp的核 苷酸开始并在紧接RPS7、RPL32和RPL34对应起始密码子的核苷酸序列的上游核苷酸结束 的多核苷酸。SEQ ID N0: 5、7和9的核苷酸序列是分别从位于转录起始位点上游约0. 5kbp 的核苷酸开始并在紧接RPS7、RPL32和RPL34对应起始密码子的核苷酸序列的上游核苷酸 结束的多核苷酸。
[0069] 此外,本发明的启动子可以是包含与SEQ ID N0: 1-9表示的任一核苷酸序列具有 80%或更多,优选90%或更多,更优选95%或更多,最优选99%或更多同一性的核苷酸序列的 多核苷酸,并且具有启动子活性。
[0070] 本发明的启动子可以是这样的多核苷酸,其在严格条件下杂交到包括与包含选自 由SEQ ID N0: 1-9表示的核苷酸序列的任一核苷酸序列的多核苷酸互补的核苷酸序列的多 核苷酸,并具有启动子活性。
[0071] 本发明的启动子可以是这样的多核苷酸,其是包含其中一个或多个,优选1至 300,更优选1至30个核苷酸已被缺失、取代和/或添加的核苷酸的突变的多核苷酸,并具 有启动子活性,所述突变在选自由SEQ ID N0: 1-9表示的核苷酸序列的任一核苷酸序列中。
[0072] 将突变(缺失、取代和/或添加)导入上述核苷酸序列可以通过本领域已知的方法, 例如Kunkel法或缺口双链体法或等效的方法进行。例如,可以使用利用定点诱变法的突变 导入试剂盒,例如突变-K(TaKaRaBio, Inc.制造)或突变-G(TaKaRaBio, Inc.制造 ),LA PCR体外诱变系列试剂盒(TaKaRaBio, Inc.制造)。这样的突变的多核苷酸也可以用作本 发明的启动子。
[0073] 增强外源基因表达的本发明的启动子的活性可以通过使用由报告基因所编码的 蛋白如SEAP的活性作为指标来测定。在下列情况下,其中当使用本发明的启动子时报告 蛋白的活性等于或高于使用CMV启动子时,优选地,活性增加1. 2倍或更高,更优选1. 5倍 或更高,所述启动子可以判断为具有增强外源基因表达的活性。即使在其中活性增加约1. 2 倍或更高的情况下,预期这将减少细胞培养规模、细胞培养时间和纯化步骤,使其可能增加 产量并减少细胞培养成本。如果产量增加,则可能稳定地提供用作药物产品的外源蛋白。另 夕卜,如果细胞培养成本减少,用作药物产品的外源蛋白的成本也减少。
[0074] 并且,本发明的启动子还可以通过使用本领域技术人员熟知的方法将启动子导入 宿主细胞,用于增强宿主细胞的内源基因的表达。
[0075] 2.外源基因表达单元 本发明的外源基因表达单元(以下有时也称为"本发明的基因表达单元")在转录阅读 框的方向上,至少具有在上述项目"1"中所述的本发明的启动子、外源基因和转录终止区 (多聚(A)附加信号)。
[0076] 另外,多聚(A)附加信号可以是对从启动子的转录具有导致转录终止活性的序列, 并且可以是来自与所述启动子的基因相同或不同的基因的序列。
[0077] 3.用于增强外源基因表达的DNA元件 通过使用在上面的项目"2"中所述本发明的基因表达单元并组合DNA元件,可以进一 步增强外源基因的表达。如实施例6所述,可以通过使用乙酰化组蛋白H3和元件之间的相 互作用作为指标获得组合使用的DNA元件。通常,据说组蛋白(H3和H4)的乙酰化与转录 激活相关,并且有两大理论已被提倡。一个理论是,组蛋白的乙酰化与核小体构象的变化 相关,所述变化方式使得组蛋白尾部被乙酰化以便被电中和,减弱DNA-组蛋白的相互作用 (Mellor J. (2006) Dynamic nucleosomes and gene transcription. Trends Genet. 22(6): 320-329)。另一个理论是组蛋白的乙酰化与多种转录因子的募集有关(Nakatani Y. (2001) Histone acetylases-versatile players. Genes Cells. 6 (2) : 79-86)。根据任一理论,非 常可能的是组蛋白的乙酰化与转录激活有关,并且通过使用抗乙酰化组蛋白H3抗体进行 染色质免疫沉淀(ChIP),可以浓缩与乙酰化的组蛋白H3相互作用的DNA元件。
[0078] A2是与本发明的启动子组合使用以增强外源基因表达的DNA元件的实例。A2位 于人染色体15的80966429至80974878的区域,并且是具有62. 2%的AT含量的8450bp多 核苷酸。A2的核苷酸序列由序列表中SEQ ID N0: 10表示。
[0079] A7、A18、B5和C14是类似DNA元件的实例。A7位于人染色体11的88992123至 89000542的区域,并且是具有64. 52%的AT含量的8420bp多核苷酸。A7的核苷酸序列由 序列表中SEQ ID N0: 11表不。
[0080] A18位于人染色体4的111275976至111284450的区域,并且是具有62. 54%的AT 含量的8475bp多核苷酸。A18的核苷酸序列由序列表中SEQ ID NO: 12表示。
[0081] B5位于人染色体1的143034684至143043084的区域,并且是具有66. 37%的AT 含量的8401bp多核苷酸。B5的核苷酸序列由序列表中SEQ ID NO: 13表示。
[0082] 最后,C14位于人染色体11的46089056至46097482的区域,并且是具有63. 81% 的AT含量的8427bp多核苷酸。C14的核苷酸序列由序列表中SEQ ID N0: 14表示。
[0083] 与本发明启动子组合使用的DNA元件的增强外源基因表达的活性可以通过使用 由报告基因所编码的蛋白如SEAP的活性作为指标来测定。
[0084] 在其中DNA元件与本发明的启动子组合使用的情况下,可以单独使用任一上述 DNA元件,或者可以使用DNA元件的一种类型的两个或更多个拷贝。或者,可以组合使用两 种或更多种不同类型的上述DNA元件。
[0085] A2、A7、A18、B5和C14是与本发明的启动子组合使用的DNA元件的优选的实例。
[0086] 本发明中使用的DNA元件可以是包含与SEQ ID N0: 10-14表示的任意核苷酸序列 具有80%或更多,优选90%或更多,更优选95%或更多,最优选99%或更多同一性的核苷酸 序列的核苷酸序列,并且具有增强外源基因表达的活性。可以相对例如日本的DNA数据库 等,使用程序例如FASTA或BLAST进行核苷酸序列同源性检索。
[0087] 与本发明的启动子组合使用的DNA元件可以是这样的DNA元件,其在严格条件下 杂交到包括与包含选自由SEQ ID N0: 10-14表示的核苷酸序列的核苷酸序列的多核苷酸互 补的核苷酸序列的多核苷酸,并具有增强外源基因表达的活性。
[0088] 参考 Molecular Cloning (Sambrook, J.等,Molecular Cloning: a Laboratory Manual 2nd ed. , Cold Spring Harbor Laboratory Press, 10 Skyline Drive Plainview, N.Y. (1989))等,本领域技术人员可以容易地获得这样的同源基因。并且,可以通过以相同 的方式进行FASTA检索或BLAST检索确定上述核苷酸序列的同一性。
[0089] 将突变(缺失、取代和/或添加)导入上述多核苷酸可以通过本领域已知的方法,例 如Kunkel法或缺口双链体法或等效的方法进行。例如,可以使用利用定点诱变法的突变导 入试剂盒,例如突变-K (TaKaRaBio,Inc.制造)、突变-G (TaKaRaBio,Inc.制造)或LA PCR体外诱变系列试剂盒(TaKaRaBio, Inc.制造)等。这样的突变的多核苷酸也可以用作 本发明的DNA元件。
[0090] 作为与本发明的启动子组合使用的DNA元件,可以使用包含序列表中SEQ ID N0: 10-14任一表示的核苷酸序列的至少3000或至少2000个连续核苷酸的部分片段。这样的 部分片段的实例包括:A2-1至A2-17,其是A2的部分片段;A7-1至A7-18,其是A7的部分 片段;A18-1至A18-4,其是A18的部分片段;B5-1至B5-6,其是B5的部分片段;以及C14-1 至C14-14,其是C14的部分片段。但是,所述DNA元件不限于这些部分片段,只要其具有增 强外源基因表达的活性。
[0091] 在本发明中,可以单独使用任一上述部分片段,并且也可以使用所述部分片段的 一种类型的两个或更多个拷贝。或者,可以组合使用两种或更多种不同类型的部分片段。此 夕卜,可以组合使用全长序列和任意上述DNA元件的部分片段。在上述组合中,所述全长序列 和部分片段可以衍生自相同的DNA元件或衍生自不同的DNA元件。
[0092] 对于A2的相应片段的多核苷酸序列,A2-1对应序列表中SEQ ID N0: 10的核苷酸1 至3000的多核苷酸序列;A2-2对应序列表中SEQ ID N0: 10的核苷酸2801至5800的多核 苷酸序列;A2-3对应序列表中SEQ ID N0: 10的核苷酸5401至8450的多核苷酸序列;A2-4 对应序列表中SEQ ID N0: 10的核苷酸701至2700的多核苷酸序列;A2-5对应序列表中SEQ ID N0: 10的核苷酸701至2200的多核苷酸序列;A2-6对应序列表中SEQ ID N0: 10的核苷 酸701至3700的多核苷酸序列;A2-7对应序列表中SEQ ID NO: 10的核苷酸2001至5000 的多核苷酸序列;A2-8对应序列表中SEQ ID NO: 10的核苷酸4001至7000的多核苷酸序 列;A2-9对应序列表中SEQ ID NO: 10的核苷酸1至3700的多核苷酸序列;A2-10对应序 列表中SEQ ID NO: 10的核苷酸2001至5800的多核苷酸序列;A2-11对应序列表中SEQ ID NO: 10的核苷酸2801至7000的多核苷酸序列;A2-12对应序列表中SEQ ID NO: 10的核苷 酸701至5800的多核苷酸序列;A2-13对应序列表中SEQ ID NO: 10的核苷酸2001至7000 的多核苷酸序列;A2-14对应序列表中SEQ ID NO: 10的核苷酸2801至8450的多核苷酸序 列;A2-15对应序列表中SEQ ID NO: 10的核苷酸1至5800的多核苷酸序列;A2-16对应序 列表中SEQ ID NO: 10的核苷酸701至7000的多核苷酸序列;A2-17对应序列表中SEQ ID NO: 10的核苷酸2001至8450的多核苷酸序列。
[0093] 对于A7的相应片段的多核苷酸序列,A7-1对应序列表中SEQ ID N0: 11的核苷酸 601至3600的多核苷酸序列;A7-2对应序列表中SEQ ID N0: 11的核苷酸3601至8420的 多核苷酸序列;A7-3对应序列表中SEQ ID N0: 11的核苷酸5401至8420的多核苷酸序列; A7-4对应序列表中SEQ ID N0: 11的核苷酸3401至6400的多核苷酸序列;A7-5对应序列表 中SEQ ID N0: 11的核苷酸1501至4500的多核苷酸序列;A7-6对应序列表中SEQ ID N0: 11 的核苷酸4401至7400的多核苷酸序列;A7-7对应序列表中SEQ ID NO: 11的核苷酸2401 至5400的多核苷酸序列;A7-8对应序列表中SEQ ID NO: 11的核苷酸1至3600的多核苷 酸序列;A7-9对应序列表中SEQ ID N0: 11的核苷酸1501至5400的多核苷酸序列;A7-10 对应序列表中SEQ ID N0: 11的核苷酸2401至6400的多核苷酸序列;A7-11对应序列表中 SEQ ID N0: 11的核苷酸3401至7400的多核苷酸序列;A7-12对应序列表中SEQ ID N0: 11 的核苷酸4401至8420的多核苷酸序列;A7-13对应序列表中SEQ ID NO: 11的核苷酸1至 5400的多核苷酸序列;A7-14对应序列表中SEQ ID N0: 11的核苷酸1501至6400的多核苷 酸序列;A7-15对应序列表中SEQ ID N0: 11的核苷酸2401至7400的多核苷酸序列;A7-16 对应序列表中SEQ ID N0: 11的核苷酸3401至8420的多核苷酸序列;A7-17对应序列表中 SEQ ID N0: 11的核苷酸1至6400的多核苷酸序列;A7-18对应序列表中SEQ ID N0: 11的 核苷酸1501至7400的多核苷酸序列。
[0094] 对于A18的相应片段的多核苷酸序列,A18-1对应序列表中SEQ ID N0: 12的核苷 酸1至5040的多核苷酸序列;A18-2对应序列表中SEQ ID NO: 12的核苷酸1001至6002的 多核苷酸序列;A18-3对应序列表中SEQ ID N0: 12的核苷酸2001至7000的多核苷酸序列; A18-4对应序列表中SEQ ID N0: 12的核苷酸3000至7000的多核苷酸序列。
[0095] 对于B5的相应片段的多核苷酸序列,B5-1对应序列表中SEQ ID N0: 13的核苷酸 1至4001的多核苷酸序列;B5-2对应序列表中SEQ ID N0: 13的核苷酸1至3200的多核苷 酸序列;B5-3对应序列表中SEQ ID N0: 13的核苷酸2491至5601的多核苷酸序列;B5-4对 应序列表中SEQ ID N0: 13的核苷酸5373至8401的多核苷酸序列;B5-5对应序列表中SEQ ID N0: 13的核苷酸901至4001的多核苷酸序列;B5-6对应序列表中SEQ ID N0: 13的核苷 酸4001至7000的多核苷酸序列。
[0096] 对于C14的相应片段的多核苷酸序列,C14-1对应序列表中SEQ ID N0: 14的核苷 酸960至4015的多核苷酸序列;C14-2对应序列表中SEQ ID NO: 14的核苷酸1987至5014 的多核苷酸序列;C14-3对应序列表中SEQ ID N0: 14的核苷酸4020至7119的多核苷酸序 列;C14-4对应序列表中SEQ ID NO: 14的核苷酸960至8141的多核苷酸序列;C14-5对应 序列表中SEQ ID NO: 14的核苷酸960至6011的多核苷酸序列;C14-6对应序列表中SEQ ID NO: 14的核苷酸4939至8141的多核苷酸序列;C14-7对应序列表中SEQ ID NO: 14的核苷 酸960至5014的多核苷酸序列;C14-8对应序列表中SEQ ID NO: 14的核苷酸2994至7119 的多核苷酸序列;C14-9对应序列表中SEQ ID NO: 14的核苷酸4020至8141的多核苷酸序 列;C14-10对应序列表中SEQ ID NO: 14的核苷酸1至5014的多核苷酸序列;C14-11对应 序列表中SEQ ID NO: 14的核苷酸1987至7119的多核苷酸序列;C14-12对应序列表中SEQ ID NO: 14的核苷酸2994至8141的多核苷酸序列;C14-13对应序列表中SEQ ID NO: 14的 核苷酸960至7119的多核苷酸序列;C14-14对应序列表中SEQ ID NO: 14的核苷酸1987至 8141的多核苷酸序列。
[0097] 4.多核苷酸的获得 在本发明中,可通过下述普通方法获得包含编码外源蛋白(其产量待增加,这将在稍后 描述)的外源基因的多核苷酸。例如,可以通过使用从外源基因片段合成的DNA探针筛选衍 生自表达外源蛋白的细胞或组织的cDNA文库分离这样的多核苷酸。因此可以通过本领域 常规使用的方法制备mRNA。例如,用胍试剂、酚试剂等处理细胞或组织,由此获得总RNA,并 且从而通过亲和柱法使用寡(dT)纤维素柱或包含琼脂糖2B等的聚U-琼脂糖柱作为载体, 或通过分批法获得聚(A) + RNA (mRNA)。并且,多聚(A)+RNA可以通过蔗糖密度梯度离心等 进一步分级。然后,使用这样获得的mRNA作为模板、寡dT引物和反转录酶合成单链cDNA。 从这样获得的单链cDNA,使用DNA聚合酶I、DNA连接酶、RNA酶Η等合成双链cDNA。使用 T4 DNA聚合酶钝化这样合成的双链cDNA,随后连接到适体(例如EcoRI适体),磷酸化等,并 且所得的DNA掺入λ噬菌体例如Agtll以实现体内包装,由此制备cDNA文库。还可以使 用质粒载体代替λ噬菌体制备cDNA文库。此后,可以从cDNA文库选择包含目标DNA的克 隆(阳性克隆)。
[0098] 在其中上述的启动子,含有终止子区域的多核苷酸,上述的DNA元件,或包含用于 生产蛋白的外源基因的多核苷酸从基因组DNA中分离的情况下,根据常规方法(Molecular Cloning (1989),Methods in Enzymology 194 (1991)),基因组 DNA 从要用作收集来源 的生物体的细胞系中提取,并且选择和分离所述多核苷酸。可以根据例如Cryer等的方 法(Methods in Cell Biology, 12,39-44 (1975))或 P. Philippsen 等的方法(Methods Enzymol·,194,169-182 (1991))进行基因组 DNA 的提取。
[0099] 也可以通过例如 PCR 法(PCR Technology. Henry A. Erlich, Atockton press (1989))获得目标启动子、DNA元件或包含外源基因的多核苷酸。在使用PCR法的多核苷酸 的扩增中,使用20至30聚体的合成单链DNA作为引物并使用基因组DNA作为模板。在证 实基因的多核苷酸序列后,使用扩增的基因。作为PCR的模板,可以使用基因组DNA文库, 例如细菌人工染色体(BAC)-文库。
[0100] 另一方面,可以通过(a)根据常规方法制备基因文库,和(b)从制备的基因文库选 择所希望的多核苷酸并扩增所述多核苷酸来获得包含未知序列的多核苷酸。可以通过如 下获得基因文库:部分消化通过常规方法从用作收集来源的生物体的细胞系获得的染色体 DNA,使用适当的限制性酶来使染色体DNA片段化,将所获得的片段连接到适当的载体上, 并将载体导入适当的宿主。还可以通过从细胞提取mRNA,从mRNA合成cDNA,将cDNA连接 到适当的载体并将载体导入适当的宿主来制备基因文库。作为用于该制备的载体,可以使 用通常已知作为用于基因文库制备的载体的质粒,并且也可以使用噬菌体载体、粘粒等。作 为要转化或转染的宿主,可以使用适合用于上述载体类型的宿主。通过菌落杂交法、噬菌斑 杂交法等使用包含对外源基因特异性的序列的标记探针从上述基因文库选择包含外源基 因的多核苷酸。
[0101] 此外,还可以通过总化学合成生产包含外源基因的多核苷酸。例如,可以通过下列 方法合成基因:其中制备并退火两对互补寡核苷酸的方法,其中通过DNA连接酶连接几个 退火的DNA链的方法,其中制备几个部分互补的寡核苷酸并通过PCR填平缺口的方法,等 等。
[0102] 可以通过常规技术,例如双脱氧法(Sanger等,Proc. Natl. Acad. Sci.,USA, 74, 5463-5467 (1977))等进行多核苷酸序列的确定。还可以使用可商购获得的测序试剂 盒等容易地进行多核苷酸序列的上述确定。
[0103] 5.外源基因表达载体、元件载体 作为本发明的外源基因表达载体,提供了包含在上述项目"2"中所述的外源基因表达 单元的载体,所述外源基因表达单元包含上述项目"1"中所述本发明的启动子。本发明的 外源基因表达载体可以包含一种类型的上述项目"3"中所述的DNA元件,上述DNA元件的 一种类型的两个或更多个拷贝,或组合的上述DNA元件的两种或更多种不同类型。当使用 上述外源基因表达载体在宿主细胞中表达外源基因时,DNA元件可以位于所述基因表达单 元的紧接的上游或下游,或可以位于远离所述基因表达单元的位置。此外,可以使用包含多 个这样的DNA元件的一个外源基因表达载体。顺便提及,所述DNA元件可以关于所述基因 表达单元的正向或反向插入。
[0104] 此外,作为本发明中使用的载体,还包括这样的载体,其包含一种类型的上述DNA 元件、上述DNA元件的一种类型的两个或更多个拷贝或组合的两种或更多种类型的上述 DNA元件,且不包含基因表达单元(下文也称为"元件载体")。这样的元件载体可以组合包 含所述DNA元件的上述外源基因表达载体,或不包含DNA元件并仅包含外源基因表达单元 的外源基因表达载体使用。通过允许所述元件载体与所述外源基因表达载体共存,相比其 中单独使用外源基因表达载体的情况,外源基因的表达得到增强,并且因此,上述载体的组 合也包括在本发明的外源基因表达载体内。
[0105] 外源基因没有特别限制,但其实例包括报告基因,如分泌型碱性磷酸酶(SEAP)、绿 色荧光蛋白(GFP)和荧光素酶的基因;各种酶的基因,如α-淀粉酶基因和α-半乳糖苷酶 基因;各种干扰素的基因,其是药学上有用的和生理活性的蛋白,如干扰素 α和干扰素 Υ ; 各种白细胞介素的基因,如IL-1和IL-2 ;各种细胞因子基因,如促红细胞生成素(ΕΡ0)基因 和粒细胞集落刺激因子(G-CSF)基因;生长因子基因;和编码多聚体蛋白的基因如编码抗 体或其功能片段异源多聚体的基因。这些基因可以通过任何方法获得。
[0106] "抗体的功能片段"指具有抗原结合活性的抗体的部分片段,并包括Fab、F(ab')2、 Fv、scFv、双抗体、线性抗体、抗体片段形成的多特异性抗体等等。抗体的功能片段还包括 Fab',其是通过在还原条件下处理F(ab')2获得的抗体的可变区的单价片段。但是,所述功 能片段不限于这些分子,只要所述片段对抗原具有结合亲和性。此外,这些功能片段不仅包 括通过用适当的酶处理抗体蛋白的全长分子获得的片段,还包括使用遗传修饰的抗体基因 在适当的宿主细胞中产生的蛋白。
[0107] 此外,本发明的外源基因表达载体和元件载体可以各自包含选择标志物用于选择 转化子。例如,通过使用抗生素抗性标志物(其赋予对抗生素如浅蓝菌素、短梗霉素、博来霉 素、刀豆氨酸、环己酰亚胺、潮霉素、嘌呤霉素、杀稻瘟菌素、四环素、卡那霉素、氨苄青霉素 或新霉素的抗性),可以选择转化体。此外,当使用赋予对溶剂如乙醇的抗性,对甘油、盐等 的渗透压的抗性,对金属离子如铜离子等的抗性的基因作为标志物时,也可以选择转化子。
[0108] 本发明的外源基因表达载体和元件载体可以各自是不掺入染色体DNA的载体。通 常,外源基因表达载体转染进入宿主细胞,并此后随机掺入染色体。但是,通过使用衍生自 哺乳动物病毒例如猿猴病毒40 (SV40)、乳头瘤病毒(BPV,HPV)或EBV的组成型组分,载体 可以用作附加体载体,其在转染的宿主细胞中自我复制。例如,广泛使用含有SV40衍生的 复制原点和编码SV40大T抗原的序列(其是反式作用因子)的载体,含有EBV衍生的oriP 的载体和编码EBNA-1的序列的载体等。DNA元件可以有效地展示增强外源基因表达的活 性,无论载体的类型如何或其是否整合入染色体。
[0109] 6.转化的细胞 本发明的转化的细胞是上述项目"5"中所述外源基因表达载体已导入其中的转化细 胞。作为外源基因表达载体,(A)可以仅导入不包含DNA元件的外源基因表达载体,或(B) 可以组合导入不包含DNA元件的外源基因表达载体和元件载体。可选地,(C)可以导入包 含DNA元件的外源基因表达载体,或(D)可以组合导入包含DNA元件的外源基因表达载体 和元件载体。
[0110] 在宿主细胞中可以通过上述(B)或(D)中所述的组合进行外源基因的表达,根据 例如 Girod 等的方法(Biotechnology and Bioengineering, 91,2-11 (2005))和 Otte 等的 方法(Biotechnol. Prog·, 2007, 23, 801-807 (2007))。
[0111] 转化的宿主细胞的实例可以包括真核细胞,其优选的实例包括哺乳动物细胞,并 且更优选的实例包括衍生自人、小鼠、大鼠、仓鼠、猴或牛的细胞。这样的哺乳动物细胞的实 例包括C0S-1细胞、293细胞和CH0细胞(CH0-K1、DG44、CH0 dhfr-、CH0-S),但是宿主细胞 不限于其。
[0112] 在本发明中,可以使用任何方法将表达载体导入宿主细胞,只要该方法允许导入 的基因稳定地存在于所述宿主细胞中,并在其中充分表达。通常使用的方法的实例包括 憐酸?丐法(Ito 等,(1984) Agric. Biol. Chem·,48,341)、电穿孔法(Becker, D. M.等, 1990; Methods. Enzymol·,194,182-187)、原生质体法(Creggh 等,Mol. Cell. Biol·, 5, 3376 (1985))、醋酸锂法(Ito, Η· (1983) J. Bacteriol. 153,163-168)和脂质体转染法。
[0113] 7.产生外源蛋白的方法 在本发明中,可以通过下列产生外源蛋白:通过已知方法培养上述项目"6"中所述转 化的细胞(其中已导入编码外源蛋白的基因),从所得培养产物中收集蛋白,随后纯化蛋白。 如本文所用术语"培养产物"除了培养上清液之外还指培养的细胞或细胞匀浆。顺便提及, 作为可使用上述项目"6"中所述转化细胞产生的外源蛋白,不仅可以选择单体蛋白,还可以 选择多聚体蛋白。在其中产生多个不同的亚基形成的异源多聚体蛋白的情况下,有必要分 别向上述项目"6"所述宿主细胞中导入多个编码这些亚基的基因。
[0114] 培养转化细胞的方法可以根据用于培养宿主细胞的常规方法进行。
[0115] 在其中转化细胞是哺乳动物细胞的情况下,所述细胞在下列条件下培养,例如 37°C和5%或8% C02,进行约24至1000小时的培养时间。可以通过分批培养、补料分批培 养、连续培养等在静置、摇动、搅拌或通气条件下进行培养。
[0116] 编码来自上述培养产物(培养溶液)的外源蛋白的基因的表达产物的确认可以通 过SDS-PAGE、West ern分析、ELISA等进行。为了分离并纯化所产生的蛋白,可以使用常规蛋 白分离和纯化方法。完成培养后,在其中目标蛋白在细胞内产生的情况下,使用超声波匀浆 器、弗氏细胞压碎器、Manton-Gaulin匀浆器、DYN0-MILL等使细胞匀浆,从而获得靶蛋白。 另外,在其中目标蛋白在细胞外产生的情况下,同样地使用培养溶液,或者通过离心等去除 细胞。此后,通过提取等,使用有机溶剂收集目标蛋白,并且然后可以通过使用下列技术分 离并纯化收集的目标蛋白,例如各种层析技术(疏水层析、反相层析、亲和层析、离子交换层 析等),使用分子筛的凝胶过滤,或使用聚丙烯酰胺凝胶的电泳等,根据需要单独或者组合。
[0117] 上述培养方法和纯化方法仅为实例,并且所述方法不限于其。可以通过已知的氨 基酸分析技术例如使用Edman降解方法的自动氨基酸测序确认纯化的基因产物的氨基酸 序列。
[0118] 8.产生抗体蛋白的方法 作为使用上述项目"7"中所述的生产方法产生的异源多聚体蛋白,抗体蛋白可以作为 示例。抗体蛋白是四聚体蛋白,其包含两个重链多肽分子和两个轻链多肽分子。因此,为了 获得以维持抗原结合亲和性状态的这样的抗体蛋白,有必要将重链和轻链基因导入上述项 目"6"中所述的转化细胞。在这种情况下,所述重链和轻链基因表达单元可以存在于相同 的表达载体或不同的表达载体上。
[0119] 作为在本发明中产生的抗体,通过用所希望的抗原免疫实验动物例如兔子、小鼠 或大鼠制备的抗体可以作为示例。并且,通过使用上述抗体作为起始材料获得的嵌合抗体 和人源化抗体也可以作为本发明产生的抗体的示例。并且,使用遗传修饰的动物或噬菌体 展示方法获得的人抗体也包括在本发明产生的抗体中。
[0120] 产生抗体所使用的抗体基因不限于具有特定多核苷酸序列的抗体基因,只要从所 述抗体基因转录和翻译的重链多肽和轻链多肽的组合具有结合给定抗原蛋白的活性。
[0121] 并且,不一定所述抗体基因编码所述抗体的全长分子,并且可以使用编码所述抗 体的功能片段的基因。这样的编码其功能片段的基因可以通过遗传修饰编码所述抗体蛋白 的全长分子的基因来获得。
[0122] 9.用于其它外源蛋白的生产方法 除了上述抗体之外,使用本发明的生产方法产生的外源蛋白的实例还包括,各种衍生 自人或非人的蛋白、其功能片段和其修饰的产物。这样的蛋白等的实例包括肽类激素,如 心房利钠肽(ANP)、脑钠肽(BNP)、C-型钠尿肽(CNP)、加压素、促生长素抑制素、生长激素 (GH)、胰岛素、催产素、生长素释放肽、瘦素、脂联素、肾素、降血钙素、骨保护素和胰岛素样 生长因子(IGF);细胞因子,如白细胞介素、趋化因子、干扰素、肿瘤坏死因子(如TNF-α、 TNF-β和TNF超家族)、神经生长因子(例如NGF)、细胞生长因子(如EGF、FGF、H)GF、HGF和 TGF)、造血生长因子(如CSF、G-CSF和促红细胞生成素)和脂肪细胞因子;受体如TNF受体; 酶,如溶菌酶、蛋白酶、蛋白水解酶和肽酶;其功能片段(具有部分或全部的原始蛋白的生物 活性的片段)和包括任何这些蛋白的融合蛋白。但是,所述蛋白不限于其。 实施例
[0123] 10.实施例 在下文中,本发明将具体参照实施例进行描述。但是,这些实施例不限制本发明的技术 范围。用于本发明的实施例的质粒、限制性酶、DNA修饰酶等是可商购获得的产品并且可以 根据常规方法使用。此外,用于DNA克隆、多核苷酸测序、宿主细胞转化、转化的宿主细胞的 培养、从所得培养产物的蛋白收集、蛋白纯化等的方法也可以是本领域技术人员熟知的并 可以见于文献。
[0124] (实施例1)用于评价启动子活性的载体CMV/pSeapIRESpuro的构建 通过使用SEAP的表达作为指标进行启动子活性的评价,并且构建用于评价的载体。
[0125] 1-1)通过PCR的SEAP的cDNA的扩增和限制性酶位点的添加 通过PCR扩增SEAP的cDNA,使用其中在紧接起始密码子上游添加 Nhel位点并在紧接 终止密码子下游添加 Bglll位点的引物和KOD-Plus-(TOYOBO)。作为模板,使用pSEAP2-对 照(Clontech)。所获得的片段用Nhel和Bglll消化并然后使用MinElute反应试剂盒 (Qiagen)纯化。
[0126] 所使用的引物: SEAPF: AAAGCTAGCA7GCTGCTGCTGCTGCTGCTGCTGGGCC SEAPR: AAAAGATCTTCATGTCTGCTCGAAGCGGCCG6CCGC
[0127] 1-2) CMV/pSeapIRESpuro 的构建 pIRESpuro3 (Clontech)载体用Nhel和BamHI消化后,通过连接反应将1-1)中制备的 SEAP片段整合在其中。所获得的质粒命名为"CMV/pSeapIRESpuro"。
[0128] (实施例2) RPS7、RPL32和RPL34的启动子区域的克隆 作为认为包含具有高转录活性的启动子的人基因,通过使用mRNA水平作为指标选择 EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHAE、ARPC2 和SERBP1,并且进行每个基因的启动子区域的克隆。所获得的质粒用于实施例3中启动子 活性的评价。
[0129] 2-1) RPS7的启动子区域的克隆 作为RPS7的启动子区域,关于GenBank中登录号NM_001011. 3下登记的mRNA序列,使 用从位于RPS7的转录起始位点的上游约2kbp的核苷酸起始,并在紧接对应RPS7的起始密 码子序列的核苷酸序列的上游的核苷酸结束的序列。
[0130] 通过PCR使用大肠杆菌人工染色体克隆RP11-644P19 (GenoTechs)作为模板扩增 RPS7的启动子区域,并且还使用下列引物组和K0D -Plus- (Τ0Υ0Β0),并然后使用MinElute 反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV启动 子后,使用 In-Fusion Advantage PCR 克隆试剂盒(Clontech)在 Spel-Nhel 位点整合 RPS7 的启动子区域,由此构建RPS7/pSeapIRESpur〇。所克隆的RPS7的启动子区域的核苷酸序列 由序列表中SEQ ID NO: 1表不。
[0131] RPS7的引物组: RPS7-F: TTGATTATTGACTA£3TATTTATGTATATTAi.CAGCACATT.AACAGC RPS7-R; GCAGCAGCATGCTAGCGGCTTTCTCCTGC-GAGASCTGMGGCB.CAGCGG
[0132] 2_2)RPL32的启动子区域的克隆 作为RPL32的启动子区域,关于GenBank中登录号NM_000994. 3下登记的mRNA序列, 使用从位于RPL32的转录起始位点的上游约2kbp的核苷酸起始,并在紧接对应RPL32的起 始密码子序列的核苷酸序列的上游的核苷酸结束的序列。
[0133] 使用大肠杆菌人工染色体克隆RP11-767C1 (GenoTechs)作为模板扩增RPL32的启 动子区域,并且还使用下列引物组和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反应试剂 盒(Qiagen)纯化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV启动子后,使用 In-Fusion Advantage PCR 克隆试剂盒(Clontech)在 Spel-Nhel 位点整合 RPL32 的启动子 区域,由此构建RPL32/pSeapIRESpur〇。所克隆的RPL32的启动子区域的核苷酸序列由序列 表中SEQ ID N0: 2表示。
[0134] RPL32的引物组: RPL32-F: TTGATTATTGACTAGTCTAAAGTGATTCCTAAAGAATTCTTCCC P.PL32-H: GCAGCAGCATGCTAGCGATGCCTTTTGGGGAAGAAGCGGCCCC
[0135] 2-3) RPL34的启动子区域的克隆 作为RPL34的启动子区域,关于GenBank中登录号NM_033625. 2下登记的mRNA序列, 使用从位于RPL34的转录起始位点的上游约2kbp的核苷酸起始,并在紧接对应RPL34的起 始密码子序列的核苷酸序列的上游的核苷酸结束的序列。
[0136] 通过PCR使用大肠杆菌人工染色体克隆RP11-462C24 (GenoTechs)作为模板扩增 RPL34的启动子区域,并且还使用下列引物组和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute 反应试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV启动 子后,使用 In-Fusion Advantage PCR 克隆试剂盒(Clontech)在 Spel-Nhel 位点整合 RPL34 的启动子区域,由此构建RPL34/pSeapIRESpur〇。所克隆的RPL34的启动子区域的核苷酸序 列由序列表中SEQ ID N0: 3表不。
[0137] RPL34的引物组: R PL3 4 -F: TTGATTATTGACTAGTATGGTGGCACAATCATGGTTCACTGCAGGC RPL34-R: GCAGCAGCATGCTAGCTCTGAGTGCCTAAATT?AGAATAGAGTAACATC
[0138] 2-4)其它人基因的启动子区域的克隆 根据上述 2-1)中所述方法进行 EEF2、YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、 RPS7、RPS24、TMSB4X、UBC、YWHA、ARPC2和SERBP1的各自启动子区域的克隆,由此构建包含 克隆的多核苷酸的pSeapIRESpuro。
[0139] (实施例3)使用转染的CH0-K1多克隆细胞中SEAP的表达水平作为指标评价启动 子活性 3-1)转染 CH0-K1细胞(ATCC)在5%C02中在37°C下亚培养,使用包含10%超低IgGFBS (GIBC0) 的F-12营养混合物培养基(GIBC0)。
[0140] 以5 x 105细胞/孔将CH0-K1细胞接种到6孔培养板(IWAKI)上。在后一天,使 用 Lipofectamine 2000 (Invitrogen)转染实施例 1)和 2)中构建的 CMV/pSeapIRESpuro、 RPSVpSeapIRESpuro、RPL32/pSeapIRESpuro、RPLiM/pSeapIRESpuro 等各 2 μ g。
[0141] 3-2)使用嘌呤霉素的抗生素选择 转染2天后,通过胰蛋白酶处理从6孔板收集细胞,所收集的细胞的总量接种到6cm皿 (Nunc),并且以8 μ g/ml的最终浓度向培养基中添加噪呤霉素(Clontech)。
[0142] 3-3)使用转染的多克隆细胞系的评价 从开始抗生素选择开始,经过11天,用胰蛋白酶收集转染的多克隆细胞系,并且进行 细胞计数。然后,以1 X 1〇5细胞/孔将细胞接种到24孔培养板(IWAKI)上。经过24小时,收 集培养物上清液,并且使用SensoLyte? pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC) 测量培养物上清液中SEAP的活性。在RPS7、RPL32和RPL34的各个启动子区域的控制下 SEAP的活性高于充当对照的CMV启动子(CMV/pSeapIRESpuro)的控制下,并且SEAP的活性 分别比对照的活性高1. 7倍或更多,2. 0倍或更多,和2. 5倍或更多(图1)。同时,在EEF2、 YBX1、PPIA、PSAP、RAN、PRL32、PRL34、RPLP1、RPS7、RPS24、TMSB4X、UBC、YWHA、ARPC2 和 SERBP1的各个启动子区域控制下的SEAP的活性低于CMV启动子控制下的活性。
[0143] (实施例4)截短的启动子的克隆 通过用作RPS7、RPL32、RPL34的截短的启动子,从位于转录起始位点上游约lkb的核 苷酸开始并在紧接对应于各个基因的起始密码子的核苷酸序列的上游结束的核苷酸序列 (T1),和从位于转录起始位点上游约0. 5kb的核苷酸开始并在紧接对应于各个基因的起始 密码子的核苷酸序列的上游结束的核苷酸序列(T2),进行截短的启动子的克隆。
[0144] 4-1) RPS7T1 和 RPS7T2 的克隆 使用在2-1)中构建的RPS7/pSeapIRESpuro作为模板通过PCR扩增RPS7T1和RPS7T2, 并且还使用下列引物组和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反应试剂盒(Qiagen) 纯化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV启动子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在Spel-Nhel位点整合RPS7T1和RPS7T2各自的启 动子区域,由此构建 RPS7Tl/pSeapIRESpuro 和 RPS7T2/pSeapIRESpuro。所克隆的 RPS7T1 和RPS7T2的启动子区域的核苷酸序列分别由序列表中SEQ ID N0: 4和5表示。
[0145] RPS7T1 的引物组: RPS7-T1: TTGATTATTGACTAGTCCTAGTGTGGCTTCTGCATTTTTCACAGTGC RPS7 -R; GCAGCAGCATGCTAGCGGCTTTCTCCTGtjGAGAACTGAAGGCACAGCGG RPS7T2的引物组: SPS7-T2; TTGATTATTGACTftGTCCTCGGCTCHCGGCAGCCTCGACCTTTCGGC RPS7-R; GCAGCAGCATGCTAGCGG€TTTCTCCTGGGAGA.3.CTGftAGGCACAGCGG
[0146] 4-2) RPL32T1 和 RPL32T2 的克隆 使用在2-2)中构建的RPL32/pSeapIRESpuro作为模板通过PCR扩增RPL32T1和 RPL32T2,并且还使用下列引物组和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反应 试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV启动 子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在Spel-Nhel位点整合 RPL32T1 和 RPL32T2 各自的启动子区域,由此构建 RPL32Tl/pSeapIRESpuro 和 RPL32T2/ pSeapIRESpuro。所克隆的RPL32T1和RPL32T2的启动子区域的核苷酸序列分别由序列表 中SEQ ID NO: 6和7表示。
[0147] RPL32T1 的引物组: RPL32T1: TTGATTATTGACTAGTCCTCTCGftGTAACTGGGACTACAGGCATGC RPL32-R: GCAGCAGCATGCTftGCGATGCCTTTTCGGQAAGAAGCGGCCCC RPL32T2的引物组: RPL32T2: TTGATTATTGACTAGTGCAGTTTCGCCCAGTGGTTAGAAGCGTGG RPL32-R: GCAGCftGCftTGCTAGCGATGCCTTTTGGGGAAGAAGCGGCCCG
[0148] 4-3 ) RPL34T1 和 RPL34T2 的克隆 使用在2-3)中构建的RPL34/pSeapIRESpuro作为模板通过PCR扩增RPL34T1和 RPL34T2,并且还使用下列引物组和KOD-Plus- (Τ0Υ0Β0),并然后使用MinElute反应 试剂盒(Qiagen)纯化。在CMV/pSeapIRESpuro用Spel和Nhel消化并去除CMV启动 子后,使用In-Fusion Advantage PCR克隆试剂盒(Clontech)在Spel-Nhel位点整合 RPL34T1 和 RPL34T2 各自的启动子区域,由此构建 RPL34Tl/pSeapIRESpuro 和 RPL34T2/ pSeapIRESpuro。所克隆的RPL34T1和RPL34T2的启动子区域的核苷酸序列分别由序列表 中SEQ ID N0: 8和9表示。
[0149] RPL34T1 的引物组: RPL34T1: TTGATTATTGACTAGTGCTTCCTGGAGGTGCM'TCTSAGAGCGCTCCCC RFL34-R: GChGCmCKTQCmCCrCTGAGTGCCTP^hTTMiGARThGhGThAChTC RPL34T2的引物组: RPL34T2: TTGATTATTGACTAGTGTAAAGCrTGTGCTCTGAATAAATGACAAGG RPL34-S; GCAGCAGCATGCTAGCTCTGAGTGCCTiyyiTTAAGAAmGAGTAACATC
[0150] (实施例5)使用转染的CH0-K1多克隆细胞中SEAP的表达水平作为指标评价截短 的启动子活性 5-1)转染 CH0-K1细胞(ATCC)在5%C02中在37°C下亚培养,使用包含10%超低IgGFBS (GIBC0) 的F-12营养混合物培养基(GIBC0)。
[0151] 以2x 105细胞/孔将CH0-K1细胞接种到6孔培养板(IWAKI)上。在后一 天,使用 Fugene 6 (Roche Applied Science)转染实施例 1)、2)和 4)中构建的 CMV/ pSeapIRESpuro> RPS7/pSeapIRESpuro> RPS7Tl/pSeapIRESpuro> RPS7T2/pSeapIRESpuro> RPL32/pSeapIRESpuro、RPL32Tl/pSeapIRESpuro、RPL32T2/pSeapIRESpuro、RPL34/ pSeapIRESpuro、RPL34Tl/pSeapIRESpuro 和 RPL34T2/pSeapIRESpuro 各 2 μ g。
[0152] 5-2)使用嘌呤霉素的抗生素选择 转染2天后,通过胰蛋白酶处理从6孔板收集细胞,并且所收集的细胞的总量接种到 6cm皿(Nunc),并且以8 μ g/ml的最终浓度向培养基中添加噪呤霉素(Clontech)以开始抗 生素选择。
[0153] 5-3)使用转染的多克隆细胞系的评价 从开始抗生素选择开始,经过11天,用胰蛋白酶收集每个转染的多克隆细胞系,并且 进行细胞计数。然后,以1 X 1〇5细胞/孔将细胞接种到24孔培养板(IWAKI)上。经过24 小时,收集培养物上清液,并且使用SensoLyte (注册商标)pNPP分泌型碱性磷酸酶报告基 因测定法(ANASPEC)测量培养物上清液中SEAP的活性。测量结果显示在图2中。在每种 截短的启动子的控制下SEAP的活性高于在充当对照的CMV启动子(CMV/pSeapIRESpuro)的 控制下,并且从而,其显示这些启动子具有高于CMV启动子的启动子活性。
[0154] (实施例6) DNA元件的提取 (6-1)使用抗乙酰化的组蛋白H3抗体的染色质免疫沉淀 根据下列方法使用EZ ChIP (Upstate)进行使用抗乙酰化组蛋白抗体的ChIP。顺便提 及,除非另有说明,Upstate的产品在下列方法中用作抗体、缓冲液等。
[0155] 首先,使用 GIBC0 (注册商标)Freestyle? 293 培养基(Invitrogen)在 37°C和 8%C02的条件下培养293F细胞(Invitrogen),随后离心(1000rpm,5分钟,室温),由此收集 生长阶段的细胞。在2 X 107个细胞在包含1%甲醛的培养基中搅拌10分钟后,向其中添加 l〇x甘氨酸,随后在室温搅拌5分钟。离心(3000rpm,5分钟,4°C )后,去除上清,并且向细胞 沉淀中添加 PBS以悬浮细胞。然后,再次离心细胞悬浮液以去除PBS,并且此后向细胞沉淀 添加 SDS裂解缓冲液以悬浮和裂解细胞。通过细胞裂解获得的每种样品使用超声波匀浆器 (BRANSON)进行DNA片段化,同时用冰水冷却样品,并向其中添加包含蛋白酶抑制剂混合物 的稀释缓冲液和固定有蛋白G的琼脂糖。所得混合物在4°C搅拌1小时,随后离心,并然后 收集上清液。随后,向其中添加10 μ g正常兔IgG或α -乙酰组蛋白H3抗体,随后在4°C 搅拌过夜。向所得溶液中添加固定有蛋白G的琼脂糖,并且所得混合物在4°C搅拌1小时, 随后离心,并然后收集沉淀。这样获得的沉淀用低盐免疫复合物清洗缓冲液清洗两次,用高 盐免疫复合物清洗缓冲液清洗两次,用LiCl免疫复合物清洗缓冲液清洗两次,并最后用TE 缓冲液清洗4次。然后向其中添加洗脱缓冲液(包含20 μ 1 1 Μ碳酸氢钠、10 μ 1 SDS和170 μ 1无菌水)。经过30分钟后,离心混合物,并且收集上清液。
[0156] 随后,向上清液中添加5Μ氯化钠,并且所得混合物在65°C加热过夜。然后向其中 添加 RNA酶,并且所得混合物在37°C孵育30分钟。然后向其中添加0. 5M EDTA、1M Tris-HCl 和蛋白酶K,并且所得混合物在45°C孵育2小时。
[0157] 最后,以比通过用蛋白酶K处理获得的溶液高5倍的量向其中添加试剂A、B和C, 随后使用旋转过滤器离心(l〇〇〇〇rpm,30秒,室温),由此纯化染色质免疫沉淀的DNA。
[0158] (6-2)微阵列分析 通过使用GenomePlex完整全基因组扩增(WGA)试剂盒(Sigma),扩增(6-1)中获得的 每种ChIP样品。方法根据伴随试剂盒的Sigma的方案。
[0159] 为了证实ChIP,通过使用320ng通过WGA扩增的每种DNA作为模板,并还使用下列 引物和 SYBR (注册商标)Premix Ex Taq? (Perfect Real Time) (TAKARA),通过 PCR 法(95°C 进行5秒和60°C进行20秒x 45个循环)内部扩增磷酸甘油醛脱氢酶(GAPDH)基因。顺便 提及,GAPDH是用作阳性对照的持家基因,以证实DNA元件是否通过ChIP富集,并且PCR方 法使用EZ ChIP (Upstate)所附的引物进行。 5#-TACTAGCGGTTTXACGGGCG-3# 5r-TCGAACAGGAGGAGCAGAGAGCGA-3f
[0160] 结果证实在用抗乙酰化组蛋白H3抗体进行免疫沉淀的样品中GAPDH被特异性扩 增(图3)。通过WGA扩增的每种DNA样品进行微阵列分析(NimbleGen)以进行芯片上染色 质免疫沉淀(芯片上ChIP)。"芯片上ChIP"是用于通过使在(6-1)中富集的DNA进行微阵 列分析鉴定每种DNA元件的技术。
[0161] (6_3)DNA元件的提取 基于(6-2)中获得的芯片上ChIP分析的结果,提取了具有62%或更多的AT含量的5个 序列。
[0162] A2:染色体 I5 (8〇966429 至 8〇974878) A7:染色体 11 (88992123 至 89〇0〇542) A18:染色体 4 (111275976 至 111284450) B5:染色体 1 (143034684 至 143043084) C14:染色体 11 (46〇89〇56 至 46〇97482)。
[0163] (实施例7) 使用分泌型碱性磷酸酶(SEAP)的表达作为指标的DNA元件的效果 (7-l)SEAP表达载体的构建 通过使用PSEAP-对照(Clontech)作为模板,通过PCR法((94°C持续30秒,和68°C持 续2分钟X 40个循环)使用下列引物和KOD -Plus- (Τ0Υ0Β0)扩增SEAP基因。 5r-AAAGCTAGCftTGCTGCTGCTGCTGCTGCTGCTGGGCC- 5r -M.?LB.GftTCTTCATGTCTGCTCGAAGCGGCCGGCCGC- 3f
[0164] 随后,通过琼脂糖凝胶电泳分离扩增的SEAP片段,并从凝胶上切下,然后使用 QIAquick凝胶提取试剂盒(Qiagen)纯化。这样获得的DNA片段用作插入片段。用限制 性酶Nhel和Bglll消化插入片段,并且用限制性酶Nhel和BamHI消化载体pIRES hyg3 (Clontech)。所获得的DNA片段进行琼脂糖凝胶电泳以分别分离目标片段,并且将目标片 段从凝胶上切下,然后纯化。然后,进行连接反应和转化。使用LigaFastRapidDNA连接系 统(Promega)进行连接反应。如下进行转化。首先融化冷冻的细胞JM109 (TAKARA),将连 接反应后获得的10 μ 1溶液添加到融化细胞的溶液中,并将所得混合物在冰上放置30分 钟。随后,对混合物应用热休克(42°C,45秒)并将混合物在冰上冷却5分钟。向此细胞悬 浮液中添加 lml LB培养基,并将所得混合物在37°C摇动1小时。然后将混合物铺板在包含 0. 1 mg/ml氨苄青霉素的LB平板上,并将板在37°C孵育14至16小时。此后,通过碱裂解, 从LB平板上培养的克隆收集目标质粒。最后,确定通过碱裂解获得的质粒中SEAP的多核 苷酸序列,由此构建pCMV/SEAP ires Hygro。
[0165] (7-2 ) DNA元件的克隆 随后,使用BAC SUBCLONING试剂盒(Gene Bridges)从包含对应插入到(7-1)中获得的 SEAP表达载体的DNA元件的多核苷酸序列的细菌人工染色体(BAC)克隆实施例6中提取的 各个DNA元件。
[0166] 首先,用限制性酶Spel消化(7-1冲获得的pCMV/SEAP ires Hygro几个小时,随后 进行乙醇沉淀,并且将沉淀物溶解在无菌水中。通过使用用Spel消化的载体作为模板,使 用下列引物和KOD -Plus- (Τ0Υ0Β0)进行PCR法(94°C持续15秒,55°C持续30秒,和68°C 持续10分钟X 30个循环)。 A2D: 5f-GGAAATTGAGAAGTATCATTCACAACAGTACCACAAACATGAAATAAATGTGGAT C€T a TTAAT AGTAATCMTTACG- 3# A2R: 5# -CTCATT€TGTGGGTTGTCATTTCACTTCCTTG?,TGCTATCCTTTCrtAGCMAATC CT AGTCAATZmTCMTGTC AACG- 3# A7D: 5f -CT.TATTTTCTiy\GTAGTAmGACTraATTGTGAGAACAAAATAJyyy\CT?GGATC CTATimTAGTAATCAATTACG- 3f A7R: 5# -CTCTTCCCATTCTCMTTG酿TCTACTTOWmGGTTTACCAmCTAAGACCTAG TCAATAATCAATGTCAACG-3* M8D: 5f -CGCCTGTAATCCCAGCACTTTGGG'AGGCTGAGGCGGGTGGATCACCTCtAGGTCGA TCCTATTAATAGTAATCAATTACG-3f A18R: 5#-CATACAGAAGCCAGTTTGAACTGAGACCTCACTCCATTTCTTACAAGTTATGCCC TAGTCAATAATCAATGTCAACG- 3r BSD: 5r-ACCGTTTTATftTTGTTTAAGCATTTCCTAGACATATTTGGCTACAAATCTAGATC CT ATTAATAGT AATCAATTIICG- 3r B5R: 5r -GMCTTAGGGGGGCTGATTAmT?AAACAATAGMATQTAGTCTTASATG.2yyiCC TAGTCAATAATCAATGTCAACG-3" C14D: 5#-CaCAAftGTTCACTGTCAAGGCCAGGTGATGAGGCCCACACATGCCCGGSCCTTGA TCCTATTiiATAGTMTCAATTACG - 3 # C14R: 5# -CAAAACCTCATCTCTACTGAAAAT/iGAAAAT'i'AGCTGGGCGTGGTGGCAGGTGCC CTAGTCAATAATCAATGTCAACG-3"
[0167] 使用部分反应溶液通过琼脂糖凝胶电泳证实扩增之后,将剩余的反应溶液进行乙 醇沉淀。沉淀溶解在无菌水中并使用所得溶液作为用于转化的DNA。
[0168] 随后,进行用于转化的大肠杆菌的制备。
[0169] 对应在实施例6中提取的5个序列的BAC克隆如下。
[0170] [表 1] 1 提取的仔列 相应的BAC*SI I-~猫撕謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝謝瞧mmmm顯- ................................................................................................................................ _ ................................................................ I A2 BP11-152F13 A7 RP11-643G5 | A18 ^ RP11-115A14 35 RPH-64 0M9 : ? C14 RP11-702F3 1
[0171] 已融化的10 μ 1上述BAC克隆(Advanced GenoTechs Co.)接种到1ml培养基(包 含15 μ g/ml终浓度的氯霉素)并在37°C孵育过夜。将30 μ 1培养溶液转移到1. 4ml培养 基(包含15 μ g/ml终浓度的氯霉素)并在37°C孵育2小时。重复两次离心和无菌水洗涤, 并将细胞悬浮到20 μ 1无菌水中。向冷却的比色杯(0. 1 cm)中添加1 μ 1 pRED/ET (Gene Bridges)和大肠杆菌,然后进行电穿孔(1350 V,10 μ F)。然后向其中添加 lml的S0C培养 基,并且所得混合物在30°C孵育70分钟。将100 μ 1培养溶液铺板到LB平板上(包含终浓 度分别为3 μ g/ml和15 μ g/ml的四环素和氯霉素),并且在30°C孵育过夜。在第二天,这 样获得的每个克隆接种到lml培养基(包含终浓度分别为3 μ g/ml和15 μ g/ml的四环素 和氯霉素),并且在30°C孵育过夜。将30 μ 1培养溶液转移到1. 4ml培养基(包含终浓度分 别为3 μ g/ml和15 μ g/ml的四环素和氯霉素),并且在30°C孵育2小时。然后向其它添加 50 μ 1 10%的L-阿拉伯糖,并进一步在37°C进行孵育1小时。此后,用无菌水洗涤重复两 次,并且向冷却的比色杯(〇. lcm)中添加悬浮在30 μ 1无菌水中的大肠杆菌和1 μ 1用于 转染的DNA,然后进行电穿孔(1350 V,10 μ F)。然后向其中添加 lml的S0C培养基,并且所 得混合物在37°C孵育90分钟。培养物溶液的总量铺板到LB平板(包含100 μ g/ml氨苄青 霉素)上,并孵育该平板。此后通过碱裂解获得目标质粒。最后,证实所获得的质粒的序列 和其限制性酶位点,由此构建目标质粒(图4)。
[0172] (7-3)使用SEAP表达作为指标的评价 使用宿主细胞 CH0-K1 (ATCC)和转染试剂 Lipofectamine 2000(Invitrogen)评价 (7-2)中构建的各个质粒。
[0173] 在转染后2天开始用800 μ g/ml的潮霉素进行抗生素选择进行约2周,由此建立 稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定 数目的细胞接种到24孔板(IWAKI)上。在细胞铺板24小时后,收集培养物上清液,并且测 量SEAP的活性。使用SensoLyte? pNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测 量培养物上清液中SEAP的活性。
[0174] 测量结果显示在图5中。当将不具有元件的对照中SEAP的活性归一化为1时,具 有DNA元件A2、A7、A18、B5或C14的稳定表达的CH0细胞系的培养物上清液中SEAP的活 性显示比对照的值高5倍或更多的数值。基于该结果,证实了所有5个类型的DNA元件显 著增强SEAP表达。顺便提及,上述5个类型的DNA元件的多核苷酸分别由序列表中SEQ ID NO: 10至14表示。
[0175] (实施例8)组合使用的启动子的一般性 在实施例7中DNA元件的评价中使用的载体的启动子是CMV启动子,并且从而研究了 与其它一般启动子组合的DNA元件的使用。
[0176] (8-1)使用EF-1 α和SV40启动子的SEAP表达载体的构建 通过使用PSEAP2-对照(Clontech)作为模板,通过PCR法((94°C持续30秒和68°C持 续2分钟X 40个循环)使用(7-1)中所述引物和KOD -Plus-扩增SEAP基因。与(7-1)中 相同的方式制备扩增的SEAP基因作为插入片段。用限制性酶Nhel和Bglll消化插入片段 并且用限制性酶Nhil和BamHI消化pIRESpuro3载体(Clontech),并且如(7-1)中相同的 方式构建 pCMV/SEAP ires Puro。
[0177] 随后,通过使用pEFl/V5-His A (Invitrogen)作为模板,通过PCR法(94°C持续15 秒,60°C持续30秒和68°C持续2分钟X 30个循环)使用下列引物和KOD -Plus-扩增EF-1 α 启动子。 5f-AAAACTAGTCAGAGAGGAATCTTTGCAGCTAATGGACC-3f 51 -AAAGftTATCCCTAGCCUGCTTGGGTGGTACCAAGC-3"
[0178] 通过使用上面构建的pCMV/SEAP ires Puro作为载体,对载体和启动子用限制性酶 Spel和EcoRV进行消化,并且根据(7-1)中所述的方法构建pEF/SEAP ires Puro。
[0179] 类似地,通过使用pcDNA3. 1+ (Invitrogen)作为模板,通过PCR法(94°C持续15 秒,60°C持续30秒和68°C持续1分钟X 30个循环)使用下列引物和KOD -Plus-扩增SV40 启动子。 5r - AAAACTAG7CTGTGG?aTGTGTGTCAC;TTAGGGTG-3r 5? -A^AGM'MCAGCTTTTTGCSJyyiGCCTAGGCCT.C-Sf
[0180] 通过使用上面构建的pCMV/SEAP ires Puro作为载体,对载体和启动子用限制性酶 Spel和EcoRV进行消化,并且根据(7-1)中所述的方法构建pSV40/SEAP ires Puro。
[0181] (8-2) DNA元件A2或A7的克隆 随后,使用在(8-1)中构建的pEF/SEAP ires Puro和pSV40/SEAP ires Puro作为基本 结构进行DNA元件A2或A7的克隆。
[0182] 首先,用限制性酶 Spel 消化 pEF/SEAP ires Puro 和 pSV40/SEAP ires Puro 几个小 时,随后进行乙醇沉淀,并且将沉淀物溶解在无菌水中。通过使用用Spel消化的相应载体 作为模板,通过PCR法(94°C持续15秒,55°C持续30秒,和68°C持续10分钟X 30个循环) 使用下列引物和KOD -Plus-制备用于转染的DNA。 A2 (EF/D); 5# -GGAAATTGACMGmTCATTCACiACAGTACCACAAACATGAAATAAATGTGCTa GTCAGAGAGGAATCTTTGCftGC-3f ?2 {SV40/D): 5f"GGAAATTGAGAAGTATCATTCACAACAGTACCaCAAACftTGAAATAAATGTGCTa GTCTGTGGABJGTGTGTCAGTTAG-3J A2 (SF 顧 SV40/R): 5#-CTCATTCTGTGGGTTGTCATTTCACTTCCTTGATGCTATCCTTTCAAGCMyiATT TTAAAACTTTATCCATCTTTGCA-3r hi (EF/D): 5# -CTT?iTTTTCTAAGTAGTATAGACTTAATTGTGAGAi\CAAAATAAAAACTTGCTAG TCHGftGAGGAJiTCTTTGCAGC- 3" A7 {SV40/D): 5# -CTTivTT?TCT?ftAGmGTATAGACTTMTTGTGAGAACAAAATMJ4MiCTTGCTAG TCTGTGGMTGTGTGTCAGTTJIG- 3# (EF m SV40/R); 5f-CTCTTCCCATTCTCA7TTGMTCTACTTCAAAAGGTTTACCATACTAAGAACTAG TTTTAAAACTTTATCCATCTTTGCA-3r
[0183] 通过使用这样制备的用于转染的DNA和用pRed/ET转染的BAC,将DNA元件A2或 A7克隆到(8-1)中所述的载体中。顺便提及,根据(7-2)中所述的方法进行该方法。
[0184] (8-3)使用SEAP表达作为指标的评价 使用宿主细胞 CH0-K1 (ATCC)和转染试剂 Lipofectamine 2000(Invitrogen)评价 (8-2)中构建的各个质粒。
[0185] 在转染后2天开始用8 μ g/ml的嘌呤霉素进行抗生素选择进行约2周,由此建立 稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定 数目的细胞接种到24孔板上。在细胞铺板24小时后,收集培养物上清液,并且测量SEAP 的活性。使用SenS〇LyteTMpNPP分泌型碱性磷酸酶报告基因测定法(ANASPEC)测量培养物 上清液中SEAP的活性。
[0186] 测量结果显示在图6中。当在无元件的对照中SEAP的活性归一化为1时,DNA元 件A2或A7展示增强表达的效果使得SEAP的活性比对照的活性在使用EF-1 α启动子的情 况下高两倍或更多,在使用SV40启动子的情况下高4倍或更多。基于这些结果,证实当与 一般启动子组合使用时,这些DNA元件展示增强外源基因表达的效果。
[0187] (实施例9)使用抗体表达作为指标的评价 (9-1)人轻链表达载体pEF6KCL的构建 通过使用质粒pEF6/V5-HisB (Invitrogen)作为模板,通过PCR使用下列引物和K0D -Plus-获得位置2174 (紧接BGHpA的下游)和位置2958 (Smal)之间的DNA片段(包含fl 复制起始和SV40启动子和复制起始的DNA片段,下文称为"片段A",片段A的多核苷酸序 列由序列表中SEQ ID N0: 15表不)。 5,-CCACGCGCCCTGTAGCGGCGCATTAAGC-3J 5r-AAACCCGGGAGCTTTTTGCftAAftGCCTAGG-3f
[0188] 通过重叠 PCR连接所获得的片段A和包含编码人κ链分泌信号、人K链恒定区 和人多聚(Α)附加信号的DNA序列的DNA片段(下文称为"片段Β")。这样获得的其中连接 了片段Α或片段Β的DNA片段用限制性酶ΚρηΙ和Smal消化,并且将所获得的片段连接到 质粒pEF6/V5-HisB (Invitrogen),其用限制性酶ΚρηΙ和Smal消化,由此构建在EF-1 α启 动子下游具有信号序列、克隆位点、人κ链恒定区和人多聚(Α)附加信号序列的人轻链表 达载体PEF6KCL。
[0189] 将通过用限制性酶ΚρηΙ和Smal消化上述方法制备的pEF6KCL获得的DNA片段连 接到pEFl/myc-HisB (Invitrogen)(其用ΚρηΙ和Smal消化),然后转化,碱裂解和测序,由 此构建质粒pEFIKCL。
[0190] (9-2)人重链表达载体pEFlFCCU的构建 包含编码人IgGl信号序列和恒定区氨基酸序列的DNA序列的DNA片段(此DNA片段的 多核苷酸序列由序列表中SEQ ID N0: 16表示)用限制性酶Nhel和Pmel消化,并且将所得 片段连接到用Nhel和Pmel消化的质粒pEFIKCL,由此构建在EF-1 α启动子的下游具有信 号序列、克隆位点、人重链恒定区和人多聚(Α)附加信号序列的人重链表达载体pEFlFCXU。
[0191] (9-3)单人源化抗体基因 X表达载体(人源化的抗体基因 X/pEF_LHN#)的构建 通过连接(9-1)或(9-2)中构建的L链或Η链表达载体,构建单抗体表达载体(pEF_LHN (缺少可变区))。
[0192] 通过PCR法向基因表达单元的两端添加限制性酶Sail位点:一个在启动子的上 游,并且另一个在PEF1KCL的多聚(A)的下游。然后进行琼脂糖凝胶电泳,从凝胶切出所需 的DNA片段,并且纯化DNA片段,由此制备插入片段。通过用限制性酶Sail消化(9-2)中 构建的载体PEF1FCCU,在位于所述基因表达单元上游的Sail位点线性化该载体。然后,将 线性化的载体连接到上述插入片段,然后转化,碱裂解和测序,由此构建单人源化抗体表达 载体(pEF_LHN (缺少可变区))。
[0193] 随后,将下列寡核苷酸导入载体pEF_LHN (缺少可变区)的Aatll位点。 5f-CGCGGCCGCACTAGTG1CGT-3? 5f-CACTftGTGCGGCCGCGACGT-3#
[0194] 将相应的寡核苷酸稀释到5 pmol,并通过使用T4多核苷酸激酶(TAKARA),使得反 应在37°C进行1小时。然后向其添加10x Η缓冲液(TAKARA),并且通过在96°C反应1分钟 和然后在室温反应30分钟进行退火。连接这些寡核苷酸和用限制性酶Aatll消化的载体 pEF_LHN,然后转化,碱裂解和测序,由此构建pEF_LHN# (缺少可变区)。
[0195] 通过将人源化抗体基因 X的可变区整合到上面构建的通用载体(pEF_LHN# (缺少 可变区)),完成单人源化抗体基因 X表达载体(人源化抗体基因 X/pEF_LHN#)的构建。
[0196] 首先,通过使用下列引物和KOD -Plus-,通过PCR法(94°C持续15秒,55°C持续30 秒和68°C持续1分钟X 30个循环)扩增人源化抗体基因 X的L链可变区。
[0197] L链可变区: 5#-AAACATATGGCGACATCCAGATGAC-31 5 r -AJ\ACGTACGCTTGATCTCCftCCTTGG -3#
[0198] 扩增的L链可变区片段和通用载体(pEF_LHN# (缺少可变区))用限制性酶Ndel和 BsiWI消化,随后进行琼脂糖凝胶电泳,将所需片段从凝胶上切出,纯化,连接反应,转化,碱 裂解和测序,由此将所述L链可变区整合到载体中。以相同的方式,通过使用下列引物和 KOD -Plus-,通过PCR法(94°C持续15秒,55°C持续30秒和68°C持续1分钟X 30个循环) 扩增人源化抗体基因 X的Η链可变区。
[0199] Η链可变区: 5#-AAAGCXGAGCCAGGTGCAGCTGCAGG-3f 5r -JiAAGCTGiiGCTCA€GGTCflCCAGGGTTC-3#
[0200] 扩增的Η链可变区片段和其中插入L链可变区的载体用限制性酶BlpI消化,随后 进行琼脂糖凝胶电泳,将所需片段从凝胶上切出,纯化,连接反应,转化,碱裂解和测序,由 此将所述Η链可变区整合到载体中,并且构建单人源化抗体基因 X表达载体(人源化抗体基 因 X/pEF_LHN#)。
[0201] (9-4)单人源化抗体基因 X表达载体(人源化的抗体基因 X/pCMV_LHN#)的构建 通过使用(9-3)中构建的单人源化抗体基因 X表达载体(人源化的抗体基因 X/pEF_ LHN#)作为基本载体结构,通过根据下列方法替换启动子构建另一个单人源化抗体基因 X 表达载体(人源化的抗体基因 X/pCMV_LHN#)。
[0202] 通过使用pIRES puro3作为模板,通过PCR法(94°C持续30秒,和68°C持续3分钟 X 40个循环)使用下列引物和KOD -Plus-扩增CMV启动子片段。
[0203] Η链的上游: 5 * -CTTTTGCAiUlAAGCrrCGCGl'TACATAACTTiiCGGTAAATGGCC- 3^ 5#-TTCATGGTGGCGCTAGCCCGCAGATATCGATCCGAGCTCGGTA-L链的上游: 5# -TGACGTCGACAAGCT7CGCGTTftCATiy\CTTACGGTAiyW'6€CC-3# 5f -CTGGATGTCGCCATrtTGCGCCGGAGATCCACAGCAGCJiGGGAGATGAACftCCTGG GTCTGCAGCA€CATGGTGGCGCmGCCCGCAGATATCGA?CCGAGCTCGGTA-3r
[0204] 向PCR反应溶液中添加限制性酶Dpnl,并使得反应在37°C进行1小时,随后使用 MinElute reaction Cleanup试剂盒(Qiagen)纯化,由此制备用于在In-Fusion中使用的样 品。同时,用限制性酶HindIII、NheI、NdeI和Fsel消化人源化抗体基因 X/pEF_LHN#,随后 进行琼脂糖凝胶电泳,由此在所得的片段中分离两个大片段。将每个片段从凝胶上切出,并 从凝胶提取DNA,由此制备用于在In-Fusion中使用的样品。将所有用于In-Fusion的样 品合并,并且使用In-Fusion? Advantage PCR Cloning试剂盒(TAKARA)进行克隆,随后进 行转化,碱裂解和测序,由此构建单人源化抗体基因 X表达载体(人源化抗体基因 X/pCMV_ LHN#)。
[0205] (9-5 ) DNA 元件 A7 的克隆 从已证实具有增强SEAP表达效果的5种类型的DNA元件中选择A7,并克隆到抗体表达 载体中。
[0206] 如(7-2)中相同的方式,通过使用用限制性酶Notl消化的每种单人源化抗体基因 X表达载体(人源化抗体基因 X/pEF_LHN#和人源化抗体基因 X/pCMV_LHN#)作为模板,通过 PCR法(94°C持续15秒,55°C持续30秒和68°C持续11分钟X 30个循环)使用下列引物和 K0D -Plus-制备用于转染的DNA。 人源化抗体基因 X/pEF_LHN# D: 5f -CTCTTCCCMTCTCAT+TTGMTCTACTTCAAAAGGTTTMXAmCTAAGACTCGA GGCACTAGTGACGTCAGGTGGCACT-3, 人源化抗体基因 X/pEF_LHN# R: 5# -CTCT?CCCOTTCTCATTTGAATCTACTTO*AASGGTTTACCATACTAHGftGCACT AGTGACGTCAGGTGGCACTTTTCGG-3 * 人源化抗体基因 X/pCMV_LHN# D: 使用人源化抗体基因 X/pEF_LHN# D。 人源化抗体基因 X/pCMV_LHN# R: 使用人源化抗体基因 X/pEF_LHN# R。
[0207] 通过使用上面制备的用于转染的DNA和用pRed/ET转染的BAC,将DNA元件A7克 隆到(9-3)和(9-4)中所述的单人源化抗体基因 X表达载体中。图7中显示了载体构建的 示意图。顺便提及,根据(7-2)中所述的方法进行该方法。
[0208] (9-6)使用抗体表达作为指标的评价 使用宿主细胞 CH0-K1 (ATCC)和转染试剂 Lipofectamine 2000(Invitrogen)评价 (9-5)中构建的各个质粒。
[0209] 在转染后2天开始用800 μ g/ml的遗传霉素(Roche)进行抗生素选择进行约2 周,由此建立稳定表达的多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换, 并且将给定数目的细胞接种到24孔板上。细胞铺板24小时后,收集培养上清液,通过ELISA 法测量培养物上清液中抗体表达水平。顺便提及,如下进行ELISA。在包被50 ng/孔的抗 κ轻链的96孔板中,将100 μ 1无细胞培养物上清液加入到各孔中,并将板在37°C孵育1 小时。顺便提及,去除样品(培养物上清液),并且每孔用200 ylPBS-吐温(0.05%)洗涤。 然后,向每孔中添加100 μ 1 HRP-标记的抗人IgG (Fc),并且将板在37°C孵育另外1小时。 此后,去除HRP标记的抗人IgG(Fc),并且每孔用用PBS-吐温(0. 05%)洗涤。然后使用POD 底物ABTS试剂盒(Nacalai)显色,并且测量在405nm的测量波长的吸收。对于抗κ轻链、 所述抗人IgG (Fc)和样品的稀释,使用PBS-吐温(0.05%)。通过使用系列稀释到12ng、 6ng、3ng、l. 5ng、0. 75ng、0. 375ng和0· 1875ng的人IgG作为标准品,计算样品的浓度。
[0210] 结果显示在图8中。证实了当在抗体表达载体中使用EF-la启动子或CMV启动 子时,具有DNA元件A7的样品相比无元件的对照具有更好的增强抗体产生的效果。
[0211] (实施例10)展示增强外源基因表达活性的序列的长度 (10-1)具有不同序列长度的DNA元件的克隆 基于实施例7中使用的序列的长度,构建包含每种DNA元件但具有不同序列长度的载 体。
[0212] 基于0嫩元件4237318、85和(:14各自全长设计的具有不同序列长度的0嫩元 件的细节分别显示在图9、11、13、15和17中。首先,用限制性酶Spel消化(7-1)中所述 pCMV/SEAP ires Hygro几个小时,随后进行乙醇沉淀,并且将沉淀物溶解在无菌水中。通过 使用用Spel消化的载体作为模板,通过PCR法((94°C持续15秒,55°C持续30秒,和68°C 持续10分钟X 30个循环)使用下列引物和KOD -Plus-制备用于转染的DNA。通过使用这 样制备的用于转染的DNA和相应的用pRed/ET转染的BAC,将具有不同序列长度的每种DNA 元件克隆到(7-1)中所述的pCMV/SEAP ires Hygro中。顺便提及,根据(7-2)中所述的方 法进行该方法。 A2-1D: 5f ~CATGCACAGATTAGCCMTTAGTACTTACTAAATCAA.%CTCAA?TTCTGA.%GTCT AGTTATmATAGTMTCAATTACG- 31 A2-1R: 51 -CTCATTCTGTGGGTTGTCATTTCACTTCCTTGftTGCTATCCTTTCilAGCAAAATT CftATAATCAATGTCAACGCGTATAT-3r A2-2D: 5#-ACACTGGTCAAAGGGACAGGTCATTGTTATGCTGGCAATGCAGGCTGCTGAAAAC TAGTTATTAATftGTjmTCAATTACG-3# A2-2R: 5r-ACTGTAGCTTCTTATTTTTTACCTGCAGTGCATTCCTGTAAAAGTAGTGTGGAGT CAATAATCAATGTCAACGCGTATAT-3f A2-3D; -CTGGAAATTGIiGAAGTATCATTCACAACIIGTACCACAAACATGAAATiyyiTGTGC TAGTTATTAAT AGT/SATCMiTTACG - 3# A2-3R; 5"-CCAAGCTTGTCCAACCGCGGCCTGCAGGCTGCATGCAGCCTGTGAAGGCTTTGftT CAATAATCAATGTCAACGCGTATAT-3# A2-4D: 5# -TCA/sXCATTTATCMTTTTATCTTCAAAGTCCCTCACTTCAGGGaGATGATATAC TAGTTATTAATAGTAATCAATTACG-3" A2-4R: 5r-ATATATAAAAGTTCATSTATATATAAAATCATGCAATACACGSCCTTTTGTGACT CWTAATCAATGTCAACGCGTATAT-3f A2-5D: 5,-CGCATAAAAG.SAAAAGCATCCTimjmTAAAOW:CATCAATGGCTCCTCGGTGGC mGTTATTAftTAGTAATCIlATTACG" 3f A2-5R; 使 A2-6D: 5?-GGGSGGCTACAGCTTGCCTCTCTftACCACTAAMGGCATGACCCTCCTCAAAGCT AGTTATTAATAGTAATCAATTACG-3 * A2-6R: 使用,《41 A2-7D: 5 ^ -TCTGGCTTCCCTGGGCCACGCTGGAAGAAGAATTGTTCT'TGCGCCACACATAAAAC TAGTTATTAATAGTAATCAATTACG-3, A2-7R; -AGCTGATTTTTACGTTAAATGTAACATGTAAAG.aJATATATGTGTGTTTTTAGAT CAATAATCAATGTCAACGCGTATAT-3, A2-8D: 5# -GTGAAGAGGAGGAGiYiGTCMAATTa%AAGTCTTAimTGATGTfiGTTTTAAGTAC TAGT7ATTAATA6TAATCAATTACG-3r A2-8R: -ATGACACTTC-ftTATTGTTGTTTATATTGCTGGTTAGTATGTGCCTTCATTTACCT CAATAaTCAATCTCAACGCGTATAT^- 3f A2-5D; 使 HJA2-6P? A2-9R: ttlljAlR. A2 -10 D: A2-10R; 使 WA2-71 A2-11D: 使IHA2-WL· A2-21R: 使·Α2-21 A2-12D: 使用 Λ2-2Ι), A2-12R; 使 111 .42-411- A2-13D: 使用Α2-Μ-- A2-13R; ftW.42-m- A2-KD; 使用A2D? A2-I4R; 使用A2-2H A2-15D; 使用A2-21 A2-15R: 使用A2K, A2-16D: 使用.42-βΙ A2-16R: tf 用 A2-41 A2-17D: 使謂A21 A2-17R: 使 WA2H AT-ID: 5, -AAAAACAAAACTGGAGTA/^CAAGATGA.ATTGTTTTAATAGAGGCACTGTATTAC TAGTTATTAATAGTAATCAATTACG-3 * A7-1R: 5#-ftTACAATGTTCCATGTATTCTGTGCCTGAACCTATGCAGCTGftTGTAGCTGAAGT CAATAATCAATGTCAACGCGTATAT-3f Λ7-20.· 5# -GATCTTftTTTTCTAAGTAGTATAGACTTilATTGTGAGAACAAAATAAAAACTTGC TAGTTATTAftTAGTAATCAATTACG-3 # i\7-2 R: 5r -TGTTGTTTTCAGCCACTAAGTTTGAGGTGATTTGTTCTGGCAGTCCTJIGGAAACT CAATAATC#y\TGTCAACGCGTATAT- 3# A?-3D: 使 l+f|A?-2IL· A7-3R: 5#-AGCCTACACTACCCTTTGCAGCCTTTGGTAACTATCCTTCTGCTGTCTACCTCCT CAATAATCAATGTCAACGCGTATAT-3# Α1-Α?: 5f-AGGAGCTCCTGAATGAAGGACATCACTCAGCTGTGTTAAGTATCTGGAACAATAC TAGTTATTAATAGTMTCAATTftCG-3# A7-4R: 5f -GACATJyyUiTGTAAGATATGAmTGCTfiTGTAAGAT ATGATACCTGCCTTAAAAT CAATAATCAATGTCAACGCGTATAT-3# A7-5D: 5f-CACTGCTTGATACTTACTGTGGACTTTGAAAATTATGimTGTGTGTGTGTGTGTC TAGTTATTAATAGTAATCAATTACG-3# A7-5R: 5r -CAATTACATTCCAGTG^TCTGCTACTTAGAATGCATGACTGailCTCCTGGGTGGT CAMmTCAATGTCAACGCGTATAT-3# A7-6D: 5f"TTATTTTGAAGAGAAACTCCTGGTTCCCACTTAAAATCCTTTCTTGTTTCCAAGC TAGTTAT TAATaGTAATCAATTACG-3r A7-6B: 5f"AAGCAGTGTGTGTTTaCCTGCM'GTGTATGTG/mTTAACTCTGTTCCTGAGGCftT €ftATAATCI?TGTCAACGCGTATAT-3# A7-7D; 5; -ATTGCATGTTCTCATTTMTTGTGGGATGl'JlAAAftTCAMACAATAGAACGTATC TAGTTftTTAATAGTaATCAATTACG-3# A7-7R: -TTGGGAGGCCGCAGCTGGTAGATCACTTGAGGCCACGAATTTGACACCAGCAGGT C?AT AATCJy^TGTCAACGCGTATftT - 3# A7-8D: A7-8R: 使 fi+Um A7-90; 使用A7-7D. A7-9R: 使用.47---? &7-10D; 使 f+UM-ll?, A7-10R: 使謂.47-7R, A7-11D: 使姻A7-6Da A7-I1R: 使用A7-4R? H7-12D; 使用A7-2IK A7-12R: 使 ll.lA7-iKt> A7-13D: 使用 i\7-13R; 使用A7R? A7-14D; 使|_屬" A7-14R: 使fflA7-5l A7-15D: 使用A7-6IK A7-15R: ttIljA7-7R, A7-16D: 使用A7-2D? A7-16R: 使 IIIA7-II A7-17D: 使用A7-4IK ---nR: mm Am, A1-18D: 使用Λ7-6ΙΚ A7-18R 使爾A7-51 A18-1: 5# -ATCCCCTGCTCTGCTAAmjaAGAATGGATGTTGACTCTCAGGCCCTAGtTCTTGA TCCTATTAATAGTAATCRATTACG-3 * M8-1R: MS-2D: S^-CTAAAGTGCTGGGATTACAGGCATAAGCCACCGTGCCCGGCTGGSGCATTGGGAT CCTATTAATAGTAATC AAT'T ACG- 3f JU8-2R: 5# -HCTSCTTACACATTTCGaGTTTTRimTAilGGCGTTCAATATAGAGTGaACaCCTA GTCAATAATCAATGTCftACG-31 A18-3D: -CAGGCATAAGCCACCGCACCCGGCCACCCCTTACTAATTTTTIiGTAACGTCGATC CTATTAATAGTAATCAATTACG-3f A18-3R: 卜 CTGM'TCmCTTTGMXTCTGCTTTCXAACTTI'GCCCCAAAGJmAGTmGTCACC? AGTCAATAATCAATGTCAACG-3f A18-4D: 使用 AJ8-3_h A18-4R: 5#-TTCA?4TG?AACIAGCTCTG'TGAGGCTCATTTGTACCCATTTTGTTCAGTACTGCC TilGTCASTAATCMTGTCAACG- 3r B5-1D; 5l -ACATACCCAGAGACACTGAGAGAGACAGACAGACAGTAAACAGAGGIiGCACGATC CTATTAftTAGTAATCAATTJiCG - 3r B5-1R: 使用B5R. B5-2D: -GCTCMTTGTATCTTATGAAAACAATTTTTCMiAATAiWiCAAGAGATATGATCC TSTTJ\ATftGTMTCMTTACG-3# B5-2R: 使用B5R* 35-3D: -CCTGTGCTGftATACCGfCTGCATMGTATAGGAAAGGGTTAACTCAGCAGGGAfC CTATTAATAGTAATCAATTACG-3f B5-3E: 51 -T&TGTGAATGGJyyirAimATAATCAAGCTTGTTAGAATTGTGTTCaTAATGACCC TAGTCft ATA^.TCAATGTCAACG- 3< B5-4D: ttlfjBSD, B5-4R: f/ -GA.%AGTCTACAATTTTTTCAGTTT?ViiiATGGTj%TTTATT?GTIlHCaT6Ti\CCCTA GTCAATAATCAATGTCAftCG-3r B5-5D; 使用B5-11K B5-5R: 5#-CAAAGATGAAGGATGAGAGTGACTTCTGCCTTCATTATGTTATGTGTTCATATCC mGTCAATAATCAATGTCAACG- 3, B5-6D: 5r - CftGTGAATTAT.TCACTTTGTCTTAGTTAAGTAl.AA.JiTAAAATCTGftCTGTGATCC TATTAATAGTAATCAATTACG-3r B5-6R: 5#-GAACAGACAGGTGRATGAGCACAGAGGTCATTTGTAAftCCGTTTGTGGTTAGCCT AGTCAATAATCAATC-TCAACG-3J C14-1D; 5# - CTTTTTGGCTTCTGTGTTTHAGTTATTTTTCCCCTAGGCCCA€A,%ACAGftGTCGa TCCTATTAATAGTMTCAATTACG- 3f C14-IR; 5 *-AACCTTGGAAAAATTCTGTTGTGTTTAGIAGCATGTACCAATCTATCACTCCTAG TCAATAATCAATGTCAACG-3? C14-2D: -CTATTCACTGTCTGTAGGATGAiymAGTTAATAACACCCTGftGAGGTTTCGATCC TATTAATAGTAATCaATTACG-3r C14-2R: 5,-CCTTAGATTAGTTTATTGTATTTTTTATCAGCTACTATAAGGTTTACACACCCTA GTCAATAATCAATGTCAACG-3# C14-3D; 5f -CAAGACCCTCAV4ATTCAAAAATTTCCTTTATCTTGCTGTAGCSCCTCCTGCG.HT CCTATTAATAGTAATCAATTACG-3f C14-3R; 5*-GGAGGGGHTAGGAAGGGGATGAGGCCTAACAGGTTGATGftTCTAGGCTTTACCTA GTCMTMTCMTGTC?iaCG_ 3, C14-4D: -CTCiyyyyiGGAGAT^ATTCCAGCCCCTCGCCTTAAAGAATCCCmTCftAGTGftTG CTATTAATAGTAATCAATTACG-3f C14-4R: 使朋04-11 C14-5D: 5#-CGCTTGAACCTGGGAGGCAGAGGTTGCAGTGAGCCGAGATCACGCCGTTGGATCC TATTAATAGTAATCAATTACG-3r C14-5R: 使 nicm C14-6D: 使 JUC:14-#h C14-6R; 5#-TTAACTTTTTCATCCTACAGACAGTGAATftGTAAAGCTTTCTSTGAAGACATACC CTAGTCAATAATCAATSTCAACG-3# C14-7U: 使用 C:I4-2I>,-. C14-1R: 使用Cl 4-11 C14-8D: 使爾 04-3?,. C14-8R: -AAATTATTTCCTGGTGGGCAATATTAGAiiTATGGGGAATGTTTGCTTCTGAGCCT AGTCAMAATCAATGTCAACG-3, C14-9D; C14-5R; 使用 使 WCM-3R, C14-I0D; 使用 Ι?4-2?, C14-10R: 使 IfJCMl C14-11D: 使 IOC: 1131). C14-11R: 使师0'21 C14-12D: 使用 C_4*41J? C14-12R: 使用04-il C14-13D; 使 I.HC14-3IK C14-13R: 使用 C'l'lR?v C14-14D: 使用 C'14-4l C14-14R; 便用Cl 4-21
[0213] 对于A2的相应片段的多核苷酸序列,A2-1对应序列表中SEQ ID NO: 10的核苷酸1 至3000的多核苷酸序列;A2-2对应序列表中SEQ ID NO: 10的核苷酸2801至5800的多核 苷酸序列;A2-3对应序列表中SEQ ID N0: 10的核苷酸5401至8450的多核苷酸序列;A2-4 对应序列表中SEQ ID N0: 10的核苷酸701至2700的多核苷酸序列;A2-5对应序列表中SEQ ID N0: 10的核苷酸701至2200的多核苷酸序列;A2-6对应序列表中SEQ ID N0: 10的核苷 酸701至3700的多核苷酸序列;A2-7对应序列表中SEQ ID NO: 10的核苷酸2001至5000 的多核苷酸序列;A2-8对应序列表中SEQ ID N0: 10的核苷酸4001至7000的多核苷酸序 列;A2-9对应序列表中SEQ ID N0: 10的核苷酸1至3700的多核苷酸序列;A2-10对应序 列表中SEQ ID N0: 10的核苷酸2001至5800的多核苷酸序列;A2-11对应序列表中SEQ ID NO: 10的核苷酸2801至7000的多核苷酸序列;A2-12对应序列表中SEQ ID NO: 10的核苷 酸701至5800的多核苷酸序列;A2-13对应序列表中SEQ ID NO: 10的核苷酸2001至7000 的多核苷酸序列;A2-14对应序列表中SEQ ID N0: 10的核苷酸2801至8450的多核苷酸序 列;A2-15对应序列表中SEQ ID N0: 10的核苷酸1至5800的多核苷酸序列;A2-16对应序 列表中SEQ ID N0: 10的核苷酸701至7000的多核苷酸序列;A2-17对应序列表中SEQ ID NO: 10的核苷酸2001至8450的多核苷酸序列。
[0214] 对于A7的相应片段的多核苷酸序列,A7-1对应序列表中SEQ ID N0: 11的核苷酸 601至3600的多核苷酸序列;A7-2对应序列表中SEQ ID N0: 11的核苷酸3601至8420的 多核苷酸序列;A7-3对应序列表中SEQ ID N0: 11的核苷酸5401至8420的多核苷酸序列; A7-4对应序列表中SEQ ID N0: 11的核苷酸3401至6400的多核苷酸序列;A7-5对应序列表 中SEQ ID N0: 11的核苷酸1501至4500的多核苷酸序列;A7-6对应序列表中SEQ ID N0: 11 的核苷酸4401至7400的多核苷酸序列;A7-7对应序列表中SEQ ID NO: 11的核苷酸2401 至5400的多核苷酸序列;A7-8对应序列表中SEQ ID NO: 11的核苷酸1至3600的多核苷 酸序列;A7-9对应序列表中SEQ ID N0: 11的核苷酸1501至5400的多核苷酸序列;A7-10 对应序列表中SEQ ID N0: 11的核苷酸2401至6400的多核苷酸序列;A7-11对应序列表中 SEQ ID N0: 11的核苷酸3401至7400的多核苷酸序列;A7-12对应序列表中SEQ ID N0: 11 的核苷酸4401至8420的多核苷酸序列;A7-13对应序列表中SEQ ID NO: 11的核苷酸1至 5400的多核苷酸序列;A7-14对应序列表中SEQ ID N0: 11的核苷酸1501至6400的多核苷 酸序列;A7-15对应序列表中SEQ ID N0: 11的核苷酸2401至7400的多核苷酸序列;A7-16 对应序列表中SEQ ID N0: 11的核苷酸3401至8420的多核苷酸序列;A7-17对应序列表中 SEQ ID N0: 11的核苷酸1至6400的多核苷酸序列;A7-18对应序列表中SEQ ID N0: 11的 核苷酸1501至7400的多核苷酸序列。
[0215] 对于A18的相应片段的多核苷酸序列,A18-1对应序列表中SEQ ID N0: 12的核苷 酸1至5040的多核苷酸序列;A18-2对应序列表中SEQ ID NO: 12的核苷酸1001至6002的 多核苷酸序列;A18-3对应序列表中SEQ ID N0: 12的核苷酸2001至7000的多核苷酸序列; A18-4对应序列表中SEQ ID N0: 12的核苷酸3000至7000的多核苷酸序列。
[0216] 对于B5的相应片段的多核苷酸序列,B5-1对应序列表中SEQ ID NO: 13的核苷酸 1至4001的多核苷酸序列;B5-2对应序列表中SEQ ID NO: 13的核苷酸1至3200的多核苷 酸序列;B5-3对应序列表中SEQ ID N0: 13的核苷酸2491至5601的多核苷酸序列;B5-4对 应序列表中SEQ ID N0: 13的核苷酸5373至8401的多核苷酸序列;B5-5对应序列表中SEQ ID N0: 13的核苷酸901至4001的多核苷酸序列;B5-6对应序列表中SEQ ID N0: 13的核苷 酸4001至7000的多核苷酸序列。
[0217] 对于C14的相应片段的多核苷酸序列,C14-1对应序列表中SEQ ID N0: 14的核苷 酸960至4015的多核苷酸序列;C14-2对应序列表中SEQ ID NO: 14的核苷酸1987至5014 的多核苷酸序列;C14-3对应序列表中SEQ ID N0: 14的核苷酸4020至7119的多核苷酸序 列;C14-4对应序列表中SEQ ID N0: 14的核苷酸960至8141的多核苷酸序列;C14-5对应 序列表中SEQ ID N0: 14的核苷酸960至6011的多核苷酸序列;C14-6对应序列表中SEQ ID NO: 14的核苷酸4939至8141的多核苷酸序列;C14-7对应序列表中SEQ ID NO: 14的核苷 酸960至5014的多核苷酸序列;C14-8对应序列表中SEQ ID NO: 14的核苷酸2994至7119 的多核苷酸序列;C14-9对应序列表中SEQ ID N0: 14的核苷酸4020至8141的多核苷酸序 列;C14-10对应序列表中SEQ ID N0: 14的核苷酸1至5014的多核苷酸序列;C14-11对应 序列表中SEQ ID N0: 14的核苷酸1987至7119的多核苷酸序列;C14-12对应序列表中SEQ ID N0: 14的核苷酸2994至8141的多核苷酸序列;C14-13对应序列表中SEQ ID N0: 14的 核苷酸960至7119的多核苷酸序列;C14-14对应序列表中SEQ ID NO: 14的核苷酸1987至 8141的多核苷酸序列。
[0218] 全长序列上的相应片段的起始和终止点也显不在图20和21中。
[0219] (10-2)具有不同序列长度的DNA元件的评价 使用宿主细胞CH0-K1 (ATCC)和转染试剂Lipofectamine 2000评价(10-1)中构建的 各个质粒。
[0220] 以与(7-3)相同的方式,在转染后用潮霉素进行抗生素选择,由此建立稳定表达的 多克隆细胞系。这样建立的细胞系在测量前一天进行培养基替换,并且将给定数目的细胞 接种到24孔板上。在细胞铺板24小时后,收集培养物上清液,并且测量SEAP的活性。
[0221] 测量结果显示在图10、12、14、16和18中。其证实不仅全长DNA元件,还有具有比 全长更短的序列长度的克隆都具有增强表达的效果。基于结果,证实DNA元件A2、A7、A18、 B5和C14具有增强外源基因表达的活性,即使在其中它们具有比全长更短的序列长度的情 况下。但是,当序列长度是全长时它们展示最高的效果。
[0222] (实施例11)使用CH0细胞系之外的宿主细胞的效果 使用CH0细胞系作为实施例7至10评价中的细胞系。但是在实施例11中,选择HEK293 细胞系作为CH0细胞系之外的细胞系。在37°C存在5%C02的情况下将HEK293细胞系进行 静态培养,使用包含10%FCS的DMEM培养基(Invitrogen),并且在转染前一天将给定数目的 细胞接种到6孔板上。为了评价包含(8-2)中构建的每种DNA元件的SEAP表达载体,使用 每种质粒和转染试剂Lipofectamine 2000 (Invitrogen)进行转染。在转染后2天开始用 潮霉素进行抗生素选择进行约2周,由此建立稳定表达的多克隆细胞系。这样建立的细胞 系在测量前一天进行培养基替换,并且将给定数目的细胞接种到24孔板上。在细胞铺板24 小时后,收集培养物上清液,并且测量SEAP的活性。使用SensoLyte? pNPP分泌型碱性磷 酸酶报告基因测定法(ANASPEC)测量培养物上清液中SEAP的活性。
[0223] 测量结果显示在图19中。以与实施例3中相同的方式,证实了每种DNA元件在 HEK293细胞系中也高度有效增强外源基因(SEAP)的表达。
[0224] 工业应用性 通过使用根据本发明的启动子或根据本发明的外源基因表达载体,将外源基因表达单 元导入哺乳动物宿主细胞,可能改善治疗性蛋白、抗体等的外源基因的产生。 序列表 <110> DAIICHI SANKYO COMPANY, LIMITED 〈120>衍生自人基因的启动子 <130> DSPCT-FP1232 <160> 16 〈170> Patentln 版本 3. 4 <210> 1 <211> 2348 <212> DNA 〈213>智人 <400> 1 atttatgtat attaacagca cattaacagc taaaaagaaa aactcacata atcatattag 60 ttcatagaaa caatgcattt gacatactcc aacatccatt catgatttta ttttattttg 120 tatttatata ttttttttga gatggagtct cgctgtcacc caggctggag tgcaatggct 180 cgatctcggc tcactgcagg ctccgccccc ggcggttcac gccattctcc tgcctcagcc 240 tcccgagtag ctgggactac aggcgcccgc cacctcgccc agctaatttt ttgtattttt 300 agtagagacg gggtttcacc gtgttagcca ggatggtctc gatctcctga cctcgtgatc 360 cacccgcctc ggcctcccaa agtgctggga ttacaggcgt gagccaccgt gcccggccca 420 tgattttaaa aaaacctctc agaaatagaa acagagggaa cttcctgaat ttgattaaaa 480 atacctgcaa aatcctagag ctaatattat acttaatggt gaaagactga atggttttcc 540 cctaagatgg agaacaaggc acggatgtcc ttgctcacca ctcctattca acaaaggact 600 ggaaaccaga aataacttta attttttttt ttctcaagtg ataggttcac agagaaaaag 660 ctttactgga tgaactttta gattactact tttatagagc agcagagata aaagccaggt 720 cgaaaagtgc atgtggagta aggaaatgga cctagttcga caaaagggct cagaacgact 780 gcccagatga gattgtagac gcagctgtag tttactttct atctggaaga aacttcaagt 840 tatccttaat tttccaagga gacagtcact taccttttaa aaaacattat tagagaagca 900 ccgggcggga gcatatctag cattaaaaat gtgggatgaa taccatctct gcttggtaaa 960 ggtggttggg aatcctgaga gagggcacct agtgtggctt ctgcattttt cacagtgcct 1020 ggaccacggc tgaaagtaac tcttgcatga catttgacag aagaggaaac cgaagctcag 1080 attaaattcc ctgtccacag cgggatcatt cggcacgagt tcctccctgt ctggaatgct 1140 cttccccagc aatagatcct gcggctcttc cgtgtctcag tctaatgtca ttccgttcca 1200 ggattcccga cttcttaaag cataaataat ccctccccac cctctcattg tactgttatg 1260 taacttatta caatatgtca ttatatattt agtcatactg ctttaggtaa tgtcttctcc 1320 actgaactgt aagctccatg agggcaagag ttcagtcggt tttacttaat aattagcacc 1380 tagtacagta ctagcataga atgaaggcct cgcaattttt tttaaattta tttttagaca 1440 gggtcttgcg ctgtcgccca ggctggagtg cagtggtgca acctcggctc acggcagcct 1500 cgacctttcg gctccagcga tcctcccgcg tcggcctccg gggtagctgg gactgcaggc 1560 gcgcaccacc atgactggct aatttttttt tttttttttt tgtagacatg gggtctcgcc 1620 atgttgccca ggctggttcc tgagctcaag tgatcctcct gcctcggcct cccaaagtgc 1680 tgggattaca ggcgtgagcc tcagcgccca gccaagttag ccttttttaa acgtcctgtc 1740 tccggaggtt gccgaagttg gttttcttcg gcctccttct ctctcccagg cccagggctg 1800 ggacgaggcc ggttcccgcc tgcaacctgc actgaagacg ggaaccttgg gagccggtac 1860 cggaacgctc ggaaacggca ccaaagtacg aatcctaggg cggaaaagcg ttaccaagac 1920 actcgtcccc agagccgctt cctgggactc tctagcctcc taccgcttct cagtgatgtt 1980 ccggtttccg ccctcctcct cgcgctgttt ccgcctcttg ccttcggacg ccggattttg 2040 acgtgctctc gcgagatttg ggtctcttcc taagccggcg ctcggcaagg taggttggcg 2100 gcctgctctc cgacagaact tttcttcttg ggttgaggaa aacgcctttt ggagtcaggc 2160 cctggagggg cgagccttgc tcacagggtg gggatacagc cgattacccg ccctgtgctt 2220 tccgatggct tctgcggggc gagcggggcc tggccggggg gtgcgggcgg gagggcgagc 2280 cagcggcgcc tgcagcccgg gccgcgtaac gctgaccgct gtgccttcag ttctcccagg 2340 agaaagcc 2348 〈210〉 2 〈211〉 3345 〈212〉 DNA 〈213〉智人 〈400〉 2 ctaaagtgat tcctaaagaa ttcttccctt ttatcacttc cagtaggcct ctgtgaaacc 60 aaatctacct ccgcttacaa gaaagatgct gggctggcct tctctcaaag tctttccaaa 120 cttttcttgg cattgactta gacaccctag gaatctaact tgagaaaatg ttttcattaa 180 aaaaaatctc aggaagtaaa acctcctgaa tgattactga gttgacataa atcttatgtg 240 tatattctta tcagaaaaaa agtatcttca ttttgtggga caccaattca tgtattatta 300 ttattttgag acaaagtttc gctcttgttg cccaggctgg agtgcaatgg cgcgatctcc 360 acttactgca acctccacct cctgagttca agtgattctc gtgcctcagc ctccctagta 420 gctggaacta caggcatgtg ccaccacacc cagctaattt tttgtaactt tagtagagat 480 ggggtttcac catgttggcc aggatggact cgaactcctg accacaggtg atctgcccac 540 ctcagcttcc caaagtgctg ggattacagg catgagccac cgcgcccagt cgctgggtct 600 tacagtaact ttatgtttaa cattttgagg aaatgctatt cttttccaaa gtgactgcac 660 catttcatat ttgcactagc actgtacgga cattcccatt tctctgtcct agtgagtgtg 720 aaatggtatc tcactgcagt tccagtttgt atttccctga tggctaatga tgtggatcat 780 ttcatgtgtt cattggccac agagaaatgt ctatttggat tctttaccca tttttcaatt 840 gggttatttg tctttatagg tttgttgttg ttgagacaga gtcttgctct gtcactcagg 900 ctggagtgca gtggcattat cacagctaac tgcagtctag aactgctggg ctcacgtgat 960 catcccagct cagcctctcg agtaactggg actacaggca tgcgccacca gccccagcta 1020 attattttat tttttgtaga gacagggtct tactatgttg cctaggccgg tcttgaactc 1080 ctgggctcaa gcaaatctcc cacctcagac tcccaaagta ttggaattat aggtgtgaac 1140 catagtgctc agccaatttg cacaataatc ttaaatacaa aagctaagca aaacaaatca 1200 agagcatctt taaaaactag gcagtctggg aggcaggggc tgccgtgagc cgtgagatgg 1260 cacctttgca ttccagccta ggtgacagag ggaggccctg tctaaaaaaa accaaaaacc 1320 aaaaaacaaa acaaaacaaa aaacatctag gcagtagctc gtgcccgtaa tcccagctac 1380 tcaggaggct gaggcgagag aatcgtttga gcccaggagt tcaagaccag cctgggcaac 1440 agagtgagac cccatttcta aaaaatgaac aaagaaaaac taggcagttt cgcccagtgg 1500 ttagaagcgt ggagtttgga gtcaagtctc caaatttcat cttccacata tgcaaaatgg 1560 agacaataat aggggtacgt tatagaattg tggtaggcat agtgaactcc atcgcatgtt 1620 agctgttttc gttactattt actgtctaaa ttcggtgatg aaattattag gaagtctctg 1680 tcttgttctc ttctgaccac taagaggcgc acttcggagt agaagaaacg cgggcggaaa 1740 tagcccaaaa gcggattggc ttcgacttct ggcggaagta aattcctccc tccaccaggt 1800 cttattagct cagaaagaat tccaaatttc tacgtagtcc caaggatagg tagaatacat 1860 ttctcagtcc tattcctagt tattattgtc tattaaaaca tgtatactca gaatttttgc 1920 ggcattattt tttgacgtgt ctttatttta tttaaaagag ccggagccgg aagtgcttgc 1980 ctttttccct gctaggaccc aggggttacg acccatcagc ccttgcgcgc caccgtccct 2040 tctctcttcc tcggcgctgc ctacggaggt ggcagccatc tccttctcgg taagtgttaa 2100 tccgtggcaa tccgcattcc tgcgggattc atctggcccc gtcgcccagt ggtgcggagg 2160 cctccccttc agcgcggtag tgtctgtggg tattgttatt gtcagcttac tggagcgtgt 2220 acaggaacag aacgaagccg ccgagttgat agggctttgc gtcccagagc ctcctgccct 2280 ccgcctgtat tcagagctgc gggctgcttg tttgttcctt ggcggtggag ggtgctagtt 2340 gaggccagac ttcggggtct cctgggggcc gtgggacgac caggggtggc ccagcttgac 2400 agctttcagc tgggatctgt ggatcccagc gctcaccaat gtcggcccac gtgtattcgt 2460 tcatgccatg gccggcttct tccgctgcag tctctggccc gagggctgct gctgcgggac 2520 cgccaaggaa agacgagctg taggtcggct ggtccagctg caggcagaaa ttctggtagt 2580 atctctggga atatgaagat gcaactgccc ccaccttgcc ttcgaggata tcatgggcca 2640 gaaggcagag tcgttttgaa tacgtggttc attgagtacc cactctgggc cagttgatgg 2700 ctgcgaagag agcagaaggg gtgctgctgt aggaaatcaa tggctcggaa gaccacactg 2760 aggaaggtgt gagttgatac tggaagatct ccaggtttga ggcatcttca gaggtatatg 2820 gtggttttgt gtgtgttgag ggtgtggtag cgcagcagct ccctagggaa ttagaaggtt 2880 ttattgaaca tttaccctgt gacaggcact gcaggcattc agcgcgcagt gtcatcttca 2940 ttttacaggt gaggaaaaga ctcaggttca agtagatggt caaggccagt actaccggaa 3000 ggaccatctg ggggttcgga cactggtggg gtgggatttg ctgccccttg caaattgaga 3060 gtgtcttggg gtcagttttg atttgctcag ctgttggcat tctttgggct ctgagtgggt 3120 gaggtgaccc ttgacctcct gggatcgcat ctggagagtg cctagtattc tgccagcttc 3180 ggaaagggag ggaaagcaag cctggcagag gcacccattc cattcccagc ttgctccgta 3240 gctggcgatt ggaagacact ctgcgacagt gttcagtccc tgggcaggaa agcctccttc 3300 caggattctt cctcacctgg ggccgcttct tccccaaaag gcatc 3345 〈210〉 3 〈211〉 3337 〈212〉 DNA 〈213〉智人 〈400〉 3 atggtggcac aatcatggtt cactgcagcc tcaaacttct aggctcaagt gatcctccag 60 cctcagcctc ctgagtaggt gggactaaag gtgtgtgcta caacacctgg ctaattaaaa 120 aaaaaaaatt tgtagagatg ggcgtctcgc tatgttgccc aggctgatct ttaactacag 180 gtctcagtga tctttctgta tcagcctccc gaagtgctag gattaacagg catgggccac 240 tgtacctggc tgtctttgaa gtttttaata agattgccat atctctctca agactgatca 300 agaaaaaatg caaatacaaa tttaaagaga gggaaaaata gtattatgga actgggttaa 360 gtaccttaag ggaaaactac aacaatgaga ccactattct tatctacttg ggtgggggaa 420 ggcacggaca gagacgtaaa caacagcata gtgtgccaag ggctcccatc tcctgttctc 480 ttctgctctg caaagtctct cttaaaatat agagaacata ttgcaagtaa atacattcat 540 tagtgcattt attcaaaaac cacatttgtc tctctatgca agcttccatc tcaatgcctg 600 gcacagagac gaaaaggatt tcagaggaca aaaatcaaag gactggaaag gagggaagta 660 gctgatgaca aggtcggggg agaagcagct atttgagagt gagcagaggg aaggatataa 720 ccagagcctt ccatctggtg ttgtgacaaa gatggcagtg atgtgaggct tgatagaatc 780 aataggcctc acagttcaag acagactaca tgccctcagt cacttgcctg ctttcttggt 840 ttgctagatg gattagaaat actagaagga aagttgagtg ggtactggga tatcctatcc 900 aaatcctctc ttctggggca atgcagctgc ctcacagcaa ccacgttgtg gatcacctga 960 ccccgccttt ctcagcttcc tggaggtgca ttctaagagc gctccccata agccaacact 1020 caagtctctt cgaggtgtgt ttccagggag cctgatctaa gattaaaaac ttaaaggccc 1080 cttttagaat tgtcttttac agcccaggca aagagttctt tactttttta gaggtcatga 1140 atccctttga caaggtgatg aaagccaggg accctcttct cagaaaaata cacacgtgcg 1200 cttaatgtaa aattttacat actgttttaa aggttaaact ttaccaccca tgaaaagcct 1260 caagtagttc tttgtacata atcataagat tagcaaccat ttactgagca cttcctctct 1320 ataagaccct gtgctaagtg ctttaacttc ataatgcctt tgatcatgac ataacatggc 1380 acggtagttc ctaatatctt ccttttagag atttaagggc ttgctcaaag taacatagct 1440 aataattagc agacactgga ttaaaatccc aatttgtttg taaagcttgt gctctgaata 1500 aatgacaagg aaagagaagg gaaggttgaa gaagggaagg ttcttgaagg tccctggtcc 1560 ttgaaggtcc cttaaccata aatgtcaaga gttgggattt aaacccaggt ctaacgccag 1620 agctggcgcc ctttagatta aaagtgcagt gtccatgaca acgaaagaag ttgattttgt 1680 cccacctttg ctctttgcgg cttttcattt gcgtttgttt ccacagcgat ttccaataga 1740 tttctgcgtg gccttgacac agacagctag tgtgaatccc cgcccacaga ggggcggcac 1800 gttggttgcc gtacaacgtg gtggttccct gcatctctgc ccacgtcgga gaggtgcgtc 1860 ggcttccgta caacacggat actctctctc tgacgcaact tcctgtcctg cgcaattcta 1920 tttgaccttt gaactggcaa aggctttttt cttcctcttc cggggacgtt gtctgcaggt 1980 atggatgttg ttctcttttc cctgtcttta tttccttacc aatcggctgc catccgagga 2040 gctgaggaag cctagagctc tcagaagcag tcctttgagc tggtgtaggg gtaaggggca 2100 caacagggag gttggtggtg aggaagttcc ttactttgat ctttggaaat cccttgttcc 2160 tggtggcacc tccaaagccg tgagtagcca cagctcacca cccgggactt tgctgcattc 2220 caagtgtagc gtttggagac taacgagttg tggtttggcg gtttgagtct ggaaaatcgc 2280 caaacgtttt catattttac acccacgttt tcacagcacg cctgtacgtg tccttagtct 2340 ttgggagggc agggtccggc gagttcgggt ggtttcgcta tttggcttct gcgtccaagg 2400 cccatgtcaa ggaagagaaa aatgtgttag aagtttctgt cttgcttttg gagatgcaaa 2460 cagaataatg gcttcataaa tcactcgcac tggttttacg tgtcaagttt tggtgtctgg 2520 taattctgtt ttagtttaat tttagtgaga ggcttgtgac aacaaatgag gtggttacaa 2580 ggggtggaat gggaagatta aattagttca agtattgatt atgttttacg ttgggtagtt 2640 cccttaacga agttgctcgt atgcatatct gtataaccga tttgctaaat aacatcacga 2700 tgtttccaga agtgggaaga aagcaggtgc cataacccaa agaaacttgt gtaatatcaa 2760 aattagtatt aaagggtatg cctttacgca ggtggtgctt tagggcaaga cattgaaccc 2820 tgatatgtgc caggcattgt gttgggacgg atagcccacg tcgtttaatc ctaatgacag 2880 ctgtataaag tagacagaat tcccatgtta gagataagga ggctagctcc ttgcccttta 2940 tattcccagt aaatggcata gctaaggatt cgacttcaga gctcactttt tgtgctcttt 3000 gtttaaagcg gtgtttctcc aactgggctc gtggcacttt tctggacacc actccaaaca 3060 aaattagact ctgagtaagg agcctggtca tcagaacgtt aaggaagtgc cacgtttgat 3120 taccatcagg aaagctaaca ttcttggcct cttgtttatc agtcaccttt aaatacaagt 3180 agttttaaaa tgtggaataa tacatcttaa tttaagggtg ttacatacaa ggatatgtat 3240 gtgaatgaaa tagaccacat gatactgttt tgagatttta tttactttta caatggaaag 3300 atttgatgtt actctattct taatttaggc actcaga 3337 〈210〉 4 〈211〉 1361 〈212〉 DNA 〈213〉智人 〈400〉 4 cctagtgtgg cttctgcatt tttcacagtg cctggaccac ggctgaaagt aactcttgca 60 tgacatttga cagaagagga aaccgaagct cagattaaat tccctgtcca cagcgggatc 120 attcggcacg agttcctccc tgtctggaat gctcttcccc agcaatagat cctgcggctc 180 ttccgtgtct cagtctaatg tcattccgtt ccaggattcc cgacttctta aagcataaat 240 aatccctccc caccctctca ttgtactgtt atgtaactta ttacaatatg tcattatata 300 tttagtcata ctgctttagg taatgtcttc tccactgaac tgtaagctcc atgagggcaa 360 gagttcagtc ggttttactt aataattagc acctagtaca gtactagcat agaatgaagg 420 cctcgcaatt ttttttaaat ttatttttag acagggtctt gcgctgtcgc ccaggctgga 480 gtgcagtggt gcaacctcgg ctcacggcag cctcgacctt tcggctccag cgatcctccc 540 gcgtcggcct ccggggtagc tgggactgca ggcgcgcacc accatgactg gctaattttt 600 tttttttttt ttttgtagac atggggtctc gccatgttgc ccaggctggt tcctgagctc 660 aagtgatcct cctgcctcgg cctcccaaag tgctgggatt acaggcgtga gcctcagcgc 720 ccagccaagt tagccttttt taaacgtcct gtctccggag gttgccgaag ttggttttct 780 tcggcctcct tctctctccc aggcccaggg ctgggacgag gccggttccc gcctgcaacc 840 tgcactgaag acgggaacct tgggagccgg taccggaacg ctcggaaacg gcaccaaagt 900 acgaatccta gggcggaaaa gcgttaccaa gacactcgtc cccagagccg cttcctggga 960 ctctctagcc tcctaccgct tctcagtgat gttccggttt ccgccctcct cctcgcgctg 1020 tttccgcctc ttgccttcgg acgccggatt ttgacgtgct ctcgcgagat ttgggtctct 1080 tcctaagccg gcgctcggca aggtaggttg gcggcctgct ctccgacaga acttttcttc 1140 ttgggttgag gaaaacgcct tttggagtca ggccctggag gggcgagcct tgctcacagg 1200 gtggggatac agccgattac ccgccctgtg ctttccgatg gcttctgcgg ggcgagcggg 1260 gcctggccgg ggggtgcggg cgggagggcg agccagcggc gcctgcagcc cgggccgcgt 1320 aacgctgacc gctgtgcctt cagttctccc aggagaaagc c 1361 <210> 5 〈211> 867 <212> DNA 〈213>智人 〈400> 5 cctcggctca cggcagcctc gacctttcgg ctccagcgat cctcccgcgt cggcctccgg 60 ggtagctggg actgcaggcg cgcaccacca tgactggcta attttttttt tttttttttt 120 gtagacatgg ggtctcgcca tgttgcccag gctggttcct gagctcaagt gatcctcctg 180 cctcggcctc ccaaagtgct gggattacag gcgtgagcct cagcgcccag ccaagttagc 240 cttttttaaa cgtcctgtct ccggaggttg ccgaagttgg ttttcttcgg cctccttctc 300 tctcccaggc ccagggctgg gacgaggccg gttcccgcct gcaacctgca ctgaagacgg 360 gaaccttggg agccggtacc ggaacgctcg gaaacggcac caaagtacga atcctagggc 420 ggaaaagcgt taccaagaca ctcgtcccca gagccgcttc ctgggactct ctagcctcct 480 accgcttctc agtgatgttc cggtttccgc cctcctcctc gcgctgtttc cgcctcttgc 540 cttcggacgc cggattttga cgtgctctcg cgagatttgg gtctcttcct aagccggcgc 600 tcggcaaggt aggttggcgg cctgctctcc gacagaactt ttcttcttgg gttgaggaaa 660 acgccttttg gagtcaggcc ctggaggggc gagccttgct cacagggtgg ggatacagcc 720 gattacccgc cctgtgcttt ccgatggctt ctgcggggcg agcggggcct ggccgggggg 780 tgcgggcggg agggcgagcc agcggcgcct gcagcccggg ccgcgtaacg ctgaccgctg 840 tgccttcagt tctcccagga gaaagcc 867 〈210〉 6 <211> 2372 〈212> DNA 〈213>智人 〈400> 6 cctctcgagt aactgggact acaggcatgc gccaccagcc ccagctaatt attttatttt 60 ttgtagagac agggtcttac tatgttgcct aggccggtct tgaactcctg ggctcaagca 120 aatctcccac ctcagactcc caaagtattg gaattatagg tgtgaaccat agtgctcagc 180 caatttgcac aataatctta aatacaaaag ctaagcaaaa caaatcaaga gcatctttaa 240 aaactaggca gtctgggagg caggggctgc cgtgagccgt gagatggcac ctttgcattc 300 cagcctaggt gacagaggga ggccctgtct aaaaaaaacc aaaaaccaaa aaacaaaaca 360 aaacaaaaaa catctaggca gtagctcgtg cccgtaatcc cagctactca ggaggctgag 420 gcgagagaat cgtttgagcc caggagttca agaccagcct gggcaacaga gtgagacccc 480 atttctaaaa aatgaacaaa gaaaaactag gcagtttcgc ccagtggtta gaagcgtgga 540 gtttggagtc aagtctccaa atttcatctt ccacatatgc aaaatggaga caataatagg 600 ggtacgttat agaattgtgg taggcatagt gaactccatc gcatgttagc tgttttcgtt 660 actatttact gtctaaattc ggtgatgaaa ttattaggaa gtctctgtct tgttctcttc 720 tgaccactaa gaggcgcact tcggagtaga agaaacgcgg gcggaaatag cccaaaagcg 780 gattggcttc gacttctggc ggaagtaaat tcctccctcc accaggtctt attagctcag 840 aaagaattcc aaatttctac gtagtcccaa ggataggtag aatacatttc tcagtcctat 900 tcctagttat tattgtctat taaaacatgt atactcagaa tttttgcggc attatttttt 960 gacgtgtctt tattttattt aaaagagccg gagccggaag tgcttgcctt tttccctgct 1020 aggacccagg ggttacgacc catcagccct tgcgcgccac cgtcccttct ctcttcctcg 1080 gcgctgccta cggaggtggc agccatctcc ttctcggtaa gtgttaatcc gtggcaatcc 1140 gcattcctgc gggatteatc tggccccgtc gcccagtggt gcggaggcct ccccttcage 1200 gcggtagtgt ctgtgggtat tgttattgtc agcttactgg agcgtgtaca ggaacagaac 1260 gaagccgccg agttgatagg gctttgcgtc ccagagcctc ctgccctccg cctgtattca 1320 gagctgcggg ctgcttgttt gttccttggc ggtggagggt getagttgag gccagacttc 1380 ggggtctcct gggggccgtg ggacgaccag gggtggccca gcttgacagc tttcagctgg 1440 gatctgtgga tcccagcgct caccaatgtc ggcccacgtg tattegttea tgccatggcc 1500 ggcttcttcc getgeagtet ctggcccgag ggctgctgct gcgggaccgc caaggaaaga 1560 cgagctgtag gtcggctggt ccagctgcag gcagaaattc tggtagtatc tctgggaata 1620 tgaagatgea actgccccca ccttgccttc gaggatatca tgggccagaa ggeagagteg 1680 ttttgaatac gtggttcatt gagtacccac tctgggccag ttgatggctg egaagagage 1740 agaaggggtg ctgctgtagg aaatcaatgg ctcggaagac cacactgagg aaggtgtgag 1800 ttgatactgg aagatctcca ggtttgaggc atcttcagag gtatatggtg gttttgtgtg 1860 tgttgagggt gtggtagcgc agcagctccc tagggaatta gaaggtttta ttgaacattt 1920 accctgtgac aggcactgca ggcattcagc gcgcagtgtc atcttcattt tacaggtgag 1980 gaaaagactc aggttcaagt agatggtcaa ggccagtact accggaagga ccatctgggg 2040 gttcggacac tggtggggtg ggatttgctg ccccttgcaa attgagagtg tcttggggtc 2100 agttttgatt tgctcagctg ttggcattct ttgggctctg agtgggtgag gtgacccttg 2160 acctcctggg atcgcatctg gagagtgcct agtattctgc cagcttcgga aagggaggga 2220 aagcaagcct ggcagaggca cccattccat tcccagcttg ctccgtagct ggcgattgga 2280 agacactctg cgacagtgtt cagtccctgg gcaggaaagc ctccttccag gattcttcct 2340 cacctggggc cgcttcttcc ccaaaaggca tc 2372 〈210〉 7 〈211〉 1862 〈212〉 DNA 〈213〉智人 〈400〉 7 gcagtttcgc ccagtggtta gaagcgtgga gtttggagtc aagtctccaa atttcatctt 60 ccacatatgc aaaatggaga caataatagg ggtacgttat agaattgtgg taggcatagt 120 gaactccatc gcatgttagc tgttttcgtt actatttact gtctaaattc ggtgatgaaa 180 ttattaggaa gtctctgtct tgttctcttc tgaccactaa gaggcgcact tcggagtaga 240 agaaacgcgg gcggaaatag cccaaaagcg gattggcttc gacttctggc ggaagtaaat 300 tcctccctcc accaggtctt attagctcag aaagaattcc aaatttctac gtagtcccaa 360 ggataggtag aatacatttc tcagtcctat tcctagttat tattgtctat taaaacatgt 420 atactcagaa tttttgcggc attatttttt gacgtgtctt tattttattt aaaagagccg 480 gagccggaag tgcttgcctt tttccctgct aggacccagg ggttacgacc catcagccct 540 tgcgcgccac cgtcccttct ctcttcctcg gcgctgccta cggaggtggc agccatctcc 600 ttctcggtaa gtgttaatcc gtggcaatcc gcattcctgc gggattcatc tggccccgtc 660 gcccagtggt gcggaggcct ccccttcage gcggtagtgt ctgtgggtat tgttattgtc 720 agcttactgg agcgtgtaca ggaacagaac gaagccgccg agttgatagg gctttgcgtc 780 ccagagcctc ctgccctccg cctgtattca gagctgcggg ctgcttgttt gttccttggc 840 ggtggagggt gctagttgag gccagacttc ggggtctcct gggggccgtg ggacgaccag 900 gggtggccca gcttgacagc tttcagctgg gatctgtgga tcccagcgct caccaatgtc 960 ggcccacgtg tattcgttca tgccatggcc ggcttcttcc gctgcagtct ctggcccgag 1020 ggctgctgct gcgggaccgc caaggaaaga cgagctgtag gtcggctggt ccagctgcag 1080 gcagaaattc tggtagtatc tctgggaata tgaagatgca actgccccca ccttgccttc 1140 gaggatatca tgggccagaa ggcagagtcg ttttgaatac gtggttcatt gagtacccac 1200 tctgggccag ttgatggctg cgaagagagc agaaggggtg ctgctgtagg aaatcaatgg 1260 ctcggaagac cacactgagg aaggtgtgag ttgatactgg aagatctcca ggtttgaggc 1320 atcttcagag gtatatggtg gttttgtgtg tgttgagggt gtggtagcgc agcagctccc 1380 tagggaatta gaaggtttta ttgaacattt accctgtgac aggcactgca ggcattcagc 1440 gcgcagtgtc atcttcattt tacaggtgag gaaaagactc aggttcaagt agatggtcaa 1500 ggccagtact accggaagga ccatctgggg gttcggacac tggtggggtg ggatttgctg 1560 ccccttgcaa attgagagtg tcttggggtc agttttgatt tgctcagctg ttggcattct 1620 ttgggctctg agtgggtgag gtgacccttg acctcctggg atcgcatctg gagagtgcct 1680 agtattctgc cagcttcgga aagggaggga aagcaagcct ggcagaggca cccattccat 1740 tcccagcttg ctccgtagct ggcgattgga agacactctg cgacagtgtt cagtccctgg 1800 gcaggaaagc ctccttccag gattcttcct cacctggggc cgcttcttcc ccaaaaggca 1860 tc 1862 <210> 8 <211> 2363 <212> DNA 〈213>智人 〈400> 8 gcttcctgga ggtgcattct aagagcgctc cccataagcc aacactcaag tctcttcgag 60 gtgtgtttcc agggagcctg atctaagatt aaaaacttaa aggccccttt tagaattgtc 120 ttttacagcc caggcaaaga gttctttact tttttagagg tcatgaatcc ctttgacaag 180 gtgatgaaag ccagggaccc tcttctcaga aaaatacaca cgtgcgctta atgtaaaatt 240 ttacatactg ttttaaaggt taaactttac cacccatgaa aagcctcaag tagttctttg 300 tacataatca taagattagc aaccatttac tgagcacttc ctctctataa gaccctgtgc 360 taagtgcttt aacttcataa tgcctttgat catgacataa catggcacgg tagttcctaa 420 tatcttcctt ttagagattt aagggcttgc tcaaagtaac atagctaata attagcagac 480 actggattaa aatcccaatt tgtttgtaaa gcttgtgctc tgaataaatg acaaggaaag 540 agaagggaag gttgaagaag ggaaggttct tgaaggtccc tggtccttga aggtccctta 600 accataaatg tcaagagttg ggatttaaac ccaggtctaa cgccagagct ggcgcccttt 660 agattaaaag tgcagtgtcc atgacaacga aagaagttga ttttgtccca cctttgctct 720 ttgcggcttt tcatttgcgt ttgtttccac agcgatttcc aatagatttc tgcgtggcct 780 tgacacagac agctagtgtg aatccccgcc cacagagggg cggcacgttg gttgccgtac 840 aacgtggtgg ttccctgcat ctctgcccac gtcggagagg tgcgtcggct tccgtacaac 900 acggatactc tctctctgac gcaacttcct gtcctgcgca attctatttg acctttgaac 960 tggcaaaggc ttttttcttc ctcttccggg gacgttgtct gcaggtatgg atgttgttct 1020 cttttccctg tctttatttc cttaccaatc ggctgccatc cgaggagctg aggaagccta 1080 gagctctcag aagcagtcct ttgagctggt gtaggggtaa ggggcacaac agggaggttg 1140 gtggtgagga agttccttac tttgatcttt ggaaatccct tgttcctggt ggcacctcca 1200 aagccgtgag tagccacagc tcaccacccg ggactttgct gcattccaag tgtagcgttt 1260 ggagactaac gagttgtggt ttggcggttt gagtctggaa aatcgccaaa cgttttcata 1320 ttttacaccc acgttttcac agcacgcctg tacgtgtcct tagtctttgg gagggcaggg 1380 tccggcgagt tcgggtggtt tcgctatttg gcttctgcgt ccaaggccca tgtcaaggaa 1440 gagaaaaatg tgttagaagt ttctgtcttg cttttggaga tgcaaacaga ataatggctt 1500 cataaatcac tcgcactggt tttacgtgtc aagttttggt gtctggtaat tctgttttag 1560 tttaatttta gtgagaggct tgtgacaaca aatgaggtgg ttacaagggg tggaatggga 1620 agattaaatt agttcaagta ttgattatgt tttacgttgg gtagttccct taacgaagtt 1680 gctcgtatgc atatctgtat aaccgatttg ctaaataaca tcacgatgtt tccagaagtg 1740 ggaagaaagc aggtgccata acccaaagaa acttgtgtaa tatcaaaatt agtattaaag 1800 ggtatgcctt tacgcaggtg gtgctttagg gcaagacatt gaaccctgat atgtgccagg 1860 cattgtgttg ggacggatag cccacgtcgt ttaatcctaa tgacagctgt ataaagtaga 1920 cagaattccc atgttagaga taaggaggct agctccttgc cctttatatt cccagtaaat 1980 ggcatagcta aggattcgac ttcagagctc actttttgtg ctctttgttt aaagcggtgt 2040 ttctccaact gggctcgtgg cacttttctg gacaccactc caaacaaaat tagactctga 2100 gtaaggagcc tggtcatcag aacgttaagg aagtgccacg tttgattacc atcaggaaag 2160 ctaacattct tggcctcttg tttatcagtc acctttaaat acaagtagtt ttaaaatgtg 2220 gaataataca tcttaattta agggtgttac atacaaggat atgtatgtga atgaaataga 2280 ccacatgata ctgttttgag attttattta cttttacaat ggaaagattt gatgttactc 2340 tattcttaat ttaggcactc aga 2363 〈210〉 9 〈211〉 1858 〈212〉 DNA 〈213〉智人 〈400〉 9 gtaaagcttg tgctctgaat aaatgacaag gaaagagaag ggaaggttga agaagggaag 60 gttcttgaag gtccctggtc cttgaaggtc ccttaaccat aaatgtcaag agttgggatt 120 taaacccagg tctaacgcca gagctggcgc cctttagatt aaaagtgcag tgtccatgac 180 aacgaaagaa gttgattttg tcccaccttt gctctttgcg gcttttcatt tgcgtttgtt 240 tccacagcga tttccaatag atttctgcgt ggccttgaca cagacagcta gtgtgaatcc 300 ccgcccacag aggggcggca cgttggttgc cgtacaacgt ggtggttccc tgcatctctg 360 cccacgtcgg agaggtgcgt cggcttccgt acaacacgga tactctctct ctgacgcaac 420 ttcctgtcct gcgcaattct atttgacctt tgaactggca aaggcttttt tcttcctctt 480 ccggggacgt tgtctgcagg tatggatgtt gttctctttt ccctgtcttt atttccttac 540 caatcggctg ccatccgagg agctgaggaa gcctagagct ctcagaagca gtcctttgag 600 ctggtgtagg ggtaaggggc acaacaggga ggttggtggt gaggaagttc cttactttga 660 tctttggaaa tcccttgttc ctggtggcac ctccaaagcc gtgagtagcc acagctcacc 720 acccgggact ttgctgcatt ccaagtgtag cgtttggaga ctaacgagtt gtggtttggc 780 ggtttgagtc tggaaaatcg ccaaacgttt tcatatttta cacccacgtt ttcacagcac 840 gcctgtacgt gtccttagtc tttgggaggg cagggtccgg cgagttcggg tggtttcgct 900 atttggcttc tgcgtccaag gcccatgtca aggaagagaa aaatgtgtta gaagtttctg 960 tcttgctttt ggagatgcaa acagaataat ggcttcataa atcactcgca ctggttttac 1020 gtgtcaagtt ttggtgtctg gtaattctgt tttagtttaa ttttagtgag aggcttgtga 1080 caacaaatga ggtggttaca aggggtggaa tgggaagatt aaattagttc aagtattgat 1140 tatgttttac gttgggtagt tcccttaacg aagttgctcg tatgcatatc tgtataaccg 1200 atttgctaaa taacatcacg atgtttccag aagtgggaag aaagcaggtg ccataaccca 1260 aagaaacttg tgtaatatca aaattagtat taaagggtat gcctttacgc aggtggtgct 1320 ttagggcaag acattgaacc ctgatatgtg ccaggcattg tgttgggacg gatagcccac 1380 gtcgtttaat cctaatgaca gctgtataaa gtagacagaa ttcccatgtt agagataagg 1440 aggctagctc cttgcccttt atattcccag taaatggcat agctaaggat tcgacttcag 1500 agctcacttt ttgtgctctt tgtttaaagc ggtgtttctc caactgggct cgtggcactt 1560 ttctggacac cactccaaac aaaattagac tctgagtaag gagcctggtc atcagaacgt 1620 taaggaagtg ccacgtttga ttaccatcag gaaagctaac attcttggcc tcttgtttat 1680 cagtcacctt taaatacaag tagttttaaa atgtggaata atacatctta atttaagggt 1740 gttacataca aggatatgta tgtgaatgaa atagaccaca tgatactgtt ttgagatttt 1800 atttactttt acaatggaaa gatttgatgt tactctattc ttaatttagg cactcaga 1858 <210> 10 <211> 8450 <212> DNA 〈213>智人 <400> 10 attttgcttg aaaggatagc atcaaggaag tgaaatgaca acccacagaa tgagagataa 60 tttttgcaaa tcatgtatct gataagggac ctgtagtcag aatatgcaaa gaacccttac 120 aattcaataa gacaacccaa tttaaaaaca ggcaaaggat gtgaataggc atttctccaa 180 agatacggaa aaacggccaa taagcacata aaaagatgct caaaatcatt tgccatttgg 240 gaaatgcaat caaaaccaca atgaggtatc acttcacgcc cattagggtg gctatagatc 300 agaaagtcag ataacatgtg ttggcaagca catggaaaca ctgaagtcct tacacactgc 360 tggtaggaat gtaaaatggt gcagccactg tggaaaacag ttttccaatt tctcaaaatg 420 ttaaacacag ttatcataca cccaagcaat tctactctta ggtatatacc caagagaaat 480 gaaaacatat gtcttcacca gaacttgctg ttcacagcag cattatgcat aatagaccaa 540 aagtggaaac aactcaactg cccatcaact ggtgaatgga taagtaaaat gtgatgtaac 600 cagtcattgg actgtcattc attaataaaa agaacaaggt actgattcat gttctaacat 660 gagtgaatct tgaaaacact atgctaaatt aaagaagcca gtcacaaaag gccgtgtatt 720 gcatgatttt atatatacat gaacttttat atatatataa ttatatatat tatatataat 780 tttatatata taaatttcta tatataaata tataaaatca tatatatgat atatattttt 840 tcatatacat catatatatt tacaaaaatt atatatcata tatcatatga tatatgagat 900 atatatcatg atatatatga tatatgatat atatcatatg agatatatga tatcatgaga 960 tatatgatat catatgatat atatgatata gatatcatat gatatatata taatatatat 1020 atgatagata tattatatat gatagatatg atagatatca tattatatat gatagatatg 1080 atagatatca tattatatat gatagatata gatatcatat tatatatgat agatatgata 1140 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1200 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1260 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1320 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1380 gatatcatat tatatatgat agatatgata gatatcatat tatatatgat agatatgata 1440 gatatcatat tatatatgat atcatatata taccacatac atcatatata catcatatat 1500 acatcatata tatcatacat atatatgaac tttccagaat aggtatatca ataaagacag 1560 gaagtataca agtggttgcc acagcctgag aggagcaggg aatggtgagt gactgctaat 1620 ggatatggca ctttttttgg ggggtgatga aaatgttctg gtcagacaat ggcaattaca 1680 aaactgtata cacacgaaaa accaaagaat cacacacttt aaaagggagg atttagctcg 1740 gcatggtggc atgcgcctgt actcccagtt actcgggagg ctgaagcagg actgcttaga 1800 gcccaggact tcaaggctgc agcgagctat gatcgctcca ctgcactcca acaaggatga 1860 cagtgcgaga cccgttttct aaataataat aataataata ataataaata acccaaggta 1920 cccagttcac atgcaaaacc actggtaaac ataaattatc tccaagtaat ctagaaagaa 1980 aatgagcaca taagacgtct tctaaaaaca cacatatatt tctttacatg ttacatttaa 2040 cgtaaaaatc agctatgcag aagttacatg aacattttat gttggaaagg taaatgacta 2100 ttattaatac agaatggtta agtacattta tgtttttatg tacaaacgca taaaaggaaa 2160 agcatcctta aaataaacac catcaatggc tcctcggtgg tcacaaaaca aaatcctcac 2220 acctttgtct tccttcacaa ttgagcttta tccacctttt caggcttatc tcccattatt 2280 acctgacaca aacttgggtg ggccagagtt tccactgacc atcccccgac tattcatcca 2340 acactatgtt cactgcctcc cattcctgac catttgcctt ttgtcttcaa ctaattctgg 2400 ggacgttttg tccaaataaa tgatccatat tcttgaaggc tggaatcaag tcctattaca 2460 aatatatttt ctcaccctct ccagagcata gcaacccagc atctactggc ctctcacagc 2520 tctaaccatc cacaacccta agctggcttc tcatcaaacg ggtacttttc accacccaaa 2580 ttcaattaat tcactcttac aataatgaag aatagtcgcc tacagcctac cttttccagc 2640 cttgattcaa tcatttatca attttatctt caaagtccct cacttcaggg agatgatata 2700 tcagctttca cccagagtcc taaagaaaac agcactcttg ccaatgacat agtgccacct 2760 agtggcaaca taaggtaaat cacagtggca gtagaaggat ctccacacta cttttacagg 2820 aatgcactgc aggtaaaaaa taagaagcta cagtactgtt tggcaggaca atttgtttca 2880 tacgtgcata ctatcgccct gactaaatta actcgcaagt cttacaggta ttatttgttt 2940 tcagttccat gcacagatta gccatttagt acttactaaa tcaaactcaa tttctgaagt 3000 gtcttacacc aatatattca tgcacatatg gttaaaattt tccttgagga tctatcatgt 3060 gagagtgtgg cttattataa caagtaaaca gaacaaataa atacaaaatg aaaagaaatc 3120 gtatgattta ctcgcatata agggagcttg ttgtggatta agtttcatga cccaggacac 3180 tgaaacagaa atggaataaa tgagaataaa attaaaagtt gtcatcaaaa atatagaagc 3240 catctaaaga cctaggtgtc aagcatagct ctatgagtac aatcccgtgc ctgagattac 3300 catatgccca gctgtatgct atacactaag agatttagga aggaagcggg gtcagggatt 3360 gaccccagac tccatctttt caagtgggga agaaagatct tccgattgaa aaataaaggc 3420 aaaaaaggct tcaccgtcac agaagtttca acaaccaaca ggatatttaa aacagttatc 3480 aaagcaaaac cattgtatgt tcacttacat ttttacatag tccctcaaac tcacaaaatg 3540 ctgtttactc agggacttct tccggtctta ctagggagcc tggaaagtga cgggaggatt 3600 gcaagggacc actagaaccc tcttcctcaa ttccccttct ctgagaaggg aggctacagc 3660 ttgcctctct aaccactaaa aggcatgacc ctcctcaaag ttaatagccg gattccctga 3720 tagatatttt cactaaatga attctcataa aactctcact aagatttaga gaaggcttcc 3780 agggttgaat tcctgaacat taagaacagc atgtttttta aaagtttaac ttggtgattg 3840 gaccaggact tcatctaggc tatgaatgct cagaatggta ggtcctttac caaacagctt 3900 gagtttgtgt ataaagtgat ctcatcctct taagagtcag agaaacagaa ccaagcgact 3960 tcactataat ttgatctgag gaagtttctt actcacaata ggtaaatgaa ggcacatact 4020 aaccagcaat ataaacaaca atatcaagtg tcattcacac atgcaaaaaa cagacaaaat 4080 cccaaactct gtgttctaac aaatcgcaaa aacctcacta acaataaatt gaaatgacca 4140 aatgtttgga ctgaaaagca atgccttggt agcctagcca tgcctaactc aaataacaga 4200 accatctcga tgttaaaatc ctcacagatc aagctgtgta tgtctcgggt caagacttcg 4260 ccaaaaagca gtgagcacac acttaagagg gaaaaaatct acctcagcct cctaaatgca 4320 atcatctcta cacgagttgc aggccccaag cttcaacgtg ttctgctgga caacgcagta 4380 gaaagctgac aagcaggtgg ccttcccaca ctgactgaac cacctccatg cccatgtcca 4440 ttcattttct tgcccacccc atgtgctata acagacctcc tggctcaggg cactctttcc 4500 ttcctgactg ccttcactta atgactttgt acttttaggt gcaaaaatta tctgcagaaa 4560 tccacactga aaaccaagct tgagaaaggc agcaataacc aacattttta caagaagaac 4620 aaggtcaata tcaagcccat cagattcaaa tagcaagcat ggatgaaaat gaaagattga 4680 aaggcttgag tgccttctta atgtattaaa tatccattta atttacaatt aagctcactg 4740 tgctcactgg ccttttaatc agctttccag gtcctgctca gacttgccta ggacatggga 4800 atgaaagaac ctatacattt atggaccaat ctaccttaac taacttgtca agtgttcctg 4860 catcaagcag aagaaacatc agtgaaactg atacaggaat taaccccttg ttaatccata 4920 aaacttaaag gagcgggatc caatcttctg gcttccctgg gccacgctgg aagaagaatt 4980 gtcttgcgcc acacataaaa tacacgaaca ctaataatag ctgctaagct ttaaaaaaat 5040 tgcaaaaaag gaaaatctca taattttttg tttgttgtga ggtggagcct cactctgtca 5100 cccaggccgg agtgcagtgg caccatcttg gctcactgca acctctgcct cctgggttca 5160 agccattctc ctgcctcagc ctcccgagta gctgggatga taggcgtgtg ccaccatgcc 5220 cagctaattt tcgtattttt agtagagacg gggtttcacc atgttggcca ggctggtctc 5280 aaactcctga cctcaggtga tccacccacc tcggcctccc aaagtgctgg gattacaggt 5340 gtgagccacc gtgcccggcc aatgttttaa gaacgtttac gaatttgtat tgggccacat 5400 tcaaagcctt cacaggctgc atgcagcctg caggccgcgg ttggacaagc ttggattaga 5460 gaaatctaca gagacaaact agtgacttag tagccctctg atagctcatg atttgcaaga 5520 aacttaggat gactatgtgt aaagaccaca aacatcaatt taactgaatg gttcccgcca 5580 cactggaatg aggaagctga gcaaactcag aggactctaa gaaagggctg atgtcatctg 5640 aactgttcgg aattataaac tcctctaaac atgtttcaaa gccagaactt gtaggagttg 5700 ttctgataca cggattaaaa gagggatgac aaagtgtctg tcccccacac tggtcaaagg 5760 gacaggtcat tgttatgctg gcaatgcagg ctgctgaaaa gaatgtatct gtcaaaagta 5820 atcaaagtaa tgaccccaga aggctccaga aacagactgg taaattcagg ttgctttcag 5880 acttccacaa tgctggcaca caaggggaaa gacaaaacta acatttacag agcattatat 5940 ttgatattac atttaatccc cattaaaaag atactatttc ccgtttcact agtgaaaaag 6000 ttgatctttc aaaggttaaa ttatttaaca ccaaggtcaa agggtaagtt ggagagacca 6060 gattcaaacc cagtctgaca ttaaaacatg tgttttcccc ccacatcgtc tcctgctaat 6120 aacctcaaat ctaaaaactg acttgcccta caccttgagc cccatcctac aaactctccc 6180 tgacgttatt aattcagctg tcactgtgca cctacaacgt gccagacacc atactcctca 6240 acactctgta ggcacagaag gaacagataa aaatccctac cttcatagat attattctag 6300 gggtaacaca ggtaaataaa acattaaaat agttttcaca tagtagcaaa ttccatatag 6360 caaaataaaa cagaagaagg aatagcaaat gagggagatg ccctcttaaa catggtgctg 6420 agggaaggcc tccctgagaa agatatcatt taccccaaaa ataaaaaagc aagtaataga 6480 aaaaacaggt aaaaggtgtt ctagacactt aaacctgcca cattgagaac tcagggttct 6540 gatgcaaaac ctcgctgcat agaatgcatt aacttatttt tatacattta aacaaacaaa 6600 ctctacttaa gaactgtgtt ctaaaggaag gagcatatta caggaaggca atttttggtc 6660 agagtagaca cacttaaaaa ctaaacctat tgaaagacca agaacaactg aaagtctttg 6720 ctttgtcaga tttttgacca aaaggaaaat taaagaaaca caccgtgccc atccaatgat 6780 ttcaccaagg aattttaaga gagaaaatcc tacttcttcc tcacccagta gccagtgaaa 6840 tgactgagca aattcacaag ttcactgggg ctgctttcat gtaacacagg gacaacacat 6900 gacagacaca gtggaaccct acaggttgcc tagtatttga aagactgtga agaggaggag 6960 atgtcaaaat tcaaagtctt aaatgatgta gttttaagta tgttcagcaa tttcaccact 7020 cagtagtaaa gccagctaca gttgaaagca atcagaaatt tgaggggtgt gaaataagca 7080 gaagcacaga agttaaggat ttgtattctt cccacatttt ccactttatt ttatactgct 7140 gagaaaaaac aaatttaata gttttctgct gtataagaga gacacattca ctttatgtca 7200 cagtaagagt cactcaattt taatacaact atctcaatgt ataaattaac attctccccc 7260 ctgcccacac atagtaagtc tcttatgatg ttgctgatta gagaagcaaa agttgccgct 7320 acaattctct tcctgcattt taatataaac aatcatcagt cttttcttca tagagtgcag 7380 tgtgggcact atcatcagaa tgtaccagca ctgggtgtgc aaagtttaca aagattagca 7440 agagcaaaag tgttgagatt tttgaaattc atgctgctgc aaagaagtat gtaaaaactc 7500 actcaccata gaggaccaca cagaaactca ggcatgaagt tatatggctg tgtgagtggt 7560 ttgggagaag gaacggaaag cacttccacc aacctatatg cctgagcaaa ttaatgcaaa 7620 acctcagaag ctacaaaaaa gtttatctac ctaaattaaa attggtgtcc acagcagtag 7680 ccagcaaaat gcctgcgaag cgcaaagtgg taaatatttt agggtctgta ggtcatatgg 7740 tctctgttaa acaatatgta aatgaatggg tgtggctgtg ttccaataaa acttcattta 7800 taaaaagagg cagcatggta catccagtca gcaagctata atgtaccaac ccccggtcta 7860 acactaacca aatacctctt aataagccaa agaaactgtg tcctcttagg ccggaagcgg 7920 tggctcacac ctataatccc agcattttgg gaggccgagg cggggagatc acctgaggtc 7980 aggagtttga gaccatcctg gccaacatgg tgaaacccta tttctactaa aaatacaaaa 8040 attagccagg cgtgctggcg ggcgcctgta atgccaacta ctggggaggc tgaagcacga 8100 gaatcgcttg aacccaggag gcagaggttg cagcgagcct agatcacgcc attgcactcc 8160 agcctgggca acaagagaga aactccgtct caaaaaaaaa aaaggaaata aaagtataca 8220 aagtgaaaac aaagaaatta aactgccctt atttgccagt gacattactg tctatgcaca 8280 aaattccaaa aatctacaaa aaagcttcta gtactaaaaa tgagtttagc aaggttgtag 8340 aatccaaggt cagcatataa cataaaatca ccttcctata tactagcaat caccaactgg 8400 aaattgagaa gtatcattca caacagtacc acaaacatga aataaatgtg 8450 〈210〉 11 〈211〉 8420 〈212〉 DNA 〈213〉智人 〈400〉 11 tcttagtatg gtaaaccttt tgaagtagat tcaaatgaga atgggaagag agaaaaggga 60 gagaagcaac ataagaaatc tcttttaagg aattttatat agagagaaac agaggaatca 120 gttgatagtt ggaaattatt ttaaagaaaa tgggttattt taaagaaaaa aggtattaca 180 acatgtttgc actattgtgg gaataatcaa gttgagacag aaaattattt tttaaggaag 240 agtctaattg ctgaagtgaa agagaatgaa tgagaccctg tgcataagtg tgatcagata 300 ggagcatgta cagctcaagt aagaacagga agaaagagac aataaacatg tacagatagg 360 atgggctggt cgatgtggtg gtgaaaagac atgcgagtta ttactgatta cttctatttc 420 cccagtgaaa taggaagcca ggttcataaa ccaaaatgaa gaggagcgag gcagtattgg 480 aagttcagga aaagtaatag gtgtaaaaat atgtaaagta gaattaccag ggagtatgaa 540 gatacatttc caattaagga tgaagaattt aaagtgaggc cagccaatac ccctgctttg 600 cttcagctac atcagctgca taggttcagg cacagaatac atggaacatt gtatttaaat 660 agggcctgga ttttacaaaa gtaacacaat gaagaagaga gatgcaaggc tatttgaggg 720 tgtttgtggg agagattgta aaatattagc taagtaagaa ggggactgca aattttagtg 780 gtataaagga atgaggaaaa gtgtaaatac agtggggtca aagaatgttt ggagccaagg 840 cactagaggc aattagctga aaatgtaggt gattattggt gagtgacatg gtttaaatga 900 aaagtataga agggtacaat tatccatcat gaaaagttct agggtacaac taagatctga 960 gtagctgaag tagaatgaaa gtagaatgga cctttccata tccagccagg ttcagtgaca 1020 gaaggttagg aaacaaatta taaaccactt gagagaacat atcccctaag ttgtttttgc 1080 tatttttctt tcagcatata tttgttggaa tgccaactat gttcagttca attaatatgg 1140 gcttcttaaa taagggctcc agcactggat aatcctgcca tttattttga tacattccat 1200 cctgctgctc agatctattg gcatctacag gatgtctttt gagaagatgg gcattcacat 1260 ccctatgtcc tagcaaattt ccaactcaga aaaccacatt aggcttctct atatatcttc 1320 caactatttc aatggaaaat acaattctct gatttcttcc tatgatattt atcaaagaga 1380 atggtgcctg ccagttctag ggtgggggaa ctcaatacaa atcaccaacc tttagatgac 1440 accctgtctt caaagtgctt tcaaagtctg gcagaaaaaa agtacccagt ggctataaga 1500 ccacccagga gttcagtcat gcattctaag tagcagatca ctggaatgta attggctagt 1560 gagttcattt tactcttctc ttcttggtca catgttaccg cccttgtacc ctgcacgttc 1620 tctttcccag acttacaaag catgttctct tgaattcgtt ctctttttaa attcacacag 1680 tcttaatgat tcttctttca caagagtctt tcactcttac aattcagttc aagtcatcca 1740 catgcttatt atgagcaagg gtctgggact taggggaaaa gggaataaaa agatgaatga 1800 aatgtgatcc ctgcagtcca agagcttgct gtgaaaaagg aagtttggct tacattgcct 1860 ccctaatccc ttggctaggc cagaacagaa tattgtctaa aacctcctca cgtcagcagt 1920 cctctggggt ggtgactgga agtagaattt aaacaaaaat ataattgaca cataataatt 1980 gtgcatactt atagggtaca atctgatgtt tcgatatgtg tttaaatggg tgcattgtgt 2040 aatgatcaaa ttgaggtaat ttatccacca ccttgaagag agatttttca atattctcat 2100 tgcgaagaag caggaatttt tagcagacaa ctgagatgct tcttgttcac actaagtcat 2160 tctgacgatg gatttacata acttgttgtt ttttttgtgt gtgtgttttt gagacagagt 2220 cttactttgt cgactaggct gaagtgcagt ggcacaatct cggctcactg caacctccac 2280 ctcccgggtt caaacgattc tcctgcctca gcctcctgag tagctgggat tacaggtgca 2340 tgcaactagg cctggctaat ttttatattt ttaatacaga tgggatttca ccatgttggc 2400 cctgctggtg tcaaattcgt ggcctcaagt gatctaccag ctgcggcctc ccaaagtgca 2460 gggattacag gtgtgagaca ccaagcctgg tacatttaca tttcttatct ggatctttcc 2520 tttagtaagt gctaaggaat cctacttccc ccaatatttt ttcctatttc aatgttttag 2580 catgtatcat gttactactt tgcagacatt tgattttccc ctttgtttac tgtaaagtat 2640 atttttatag cctttgtaat agaagtattc taaaatctgc ctgcaaccta tctttctgac 2700 tctgcatttt agggaataat tctctgttgt ggaatgaaaa aaaaaacaga gcctgtggag 2760 tcagagatct catttcaaat tatagttatc cctaggaata aatctgagtg acaggtagta 2820 tagtataata ataagtataa agctatggtt aaggaaaact caacaacctt atctgtaaat 2880 tgggatgaca acagcctacg tcaaaaaaat gtgaaggtaa atgagataat gtaaggctga 2940 tacttagtaa gcaatttaaa aacacccaaa aaactattgc catgattact ctacttactc 3000 tatttctcta tgctccaggc aaatgaacta ctaatgaccc aggggtcctt ccccattctc 3060 ttcttcacaa ggaaatattc tctctctgtg tgctgtttat taaaatctac tgcccctttt 3120 agaagccttt ccagatcatc ccatggccaa gaacgatcgc tgcttcctct tctttacata 3180 cagatgtttt tctcctgctt gacaattatt tttgtgcaat tattttcctt ttgattgtgt 3240 ttttaatgtc ccccccaccc cacaattttc cagactgttt gctccacgag agaggagacc 3300 atcatctctg tgctcaccgt tgtatgacca gtatcctgag gagtggctgt tacataatta 3360 catcaggcac tcaataaaaa tttgatgaat aaacactgga ttttaaggca ggtatcatat 3420 cttacatagc atatcatatc ttacatttta tgtccctcac ataaatacca cagagtgaag 3480 tatatgacag ataaggtcat ttctcttgat aagtacatag tccagtctga aacagatatg 3540 ccaaaaaaaa acaaaactgg agtaaacaag atgaattgtt ttaatagagg cactgtatta 3600 gtttcctagg actgccagaa caaatcacct caaacttagt ggctgaaaac aacaaaaatt 3660 tattgtctca cagttataga tgttagaagt ataaaattaa ggtgtcagtg ggattggttc 3720 cttctggggg ctgtggaaga gaatctgtcc caagccttca cactgtaaag tacagtactg 3780 gagggatagg acttcaactt gctctatctc agatagagag gagccatttg ttgtgaattg 3840 agaagagggg tatgttgaat ccataataag cacataaaaa cttggctggt tcataggaga 3900 agtaacatgt ttccagctct agtaaaaaac aaattgaagt ggcctataaa aaggtacaga 3960 gtacgacaga atgaaaaata aatgaacaag aatacagaga ggatgtggta aattatcatg 4020 tttccctaat atgttattgg acactaaatg gtattagaat tatttatcaa taataattct 4080 aaactgttgc aattgaaaga atatattaag tggtgttata tgagaagtgc cagggcattc 4140 tcatttctgt ccaatgggag aaacattttc gtttgagacc tccgtgaata atacagtctt 4200 ttagttagga gagctgcatt ttgagtggtg caggcagaat ggcgatctct cacccacaca 4260 aacactaaga tagagagaga cagagacaga gacagagaca gcagagagag acagagaaag 4320 gaagtacagg tactcagata gagataagcc atttcttgac attaagaaat aaagtagaat 4380 ccattggagg gaaataaaac tgcctcagga acagagttaa ttcacataca catgcaggta 4440 aacacacact gcttgatact tactgtggac tttgaaaatt atgaatgtgt gtgtgtgtgt 4500 gtgtgtacat tcagccctcc atatccatgg attttgcatt cacagattca accaaccatg 4560 aattaaaaac atttggaaat aacaaacatt aaaatataac aatacaacaa taaaaataat 4620 acaaataaaa aatatagtgt aacaactgtt tacatagcat gtatgttgta ttaagtagta 4680 taaatctaga gattacttaa tgtataccag aggatgcata ggctatatgc aaatactatg 4740 ccactttaaa ctgataagaa cagatactaa acttcatctt agccaaaagt cagagaaaca 4800 atataactat gccattttac ataagggact tgagctgagc atcctcagat ttcagtatct 4860 ttggagttcc tggaaacaat tccttgtttt atatatatat atgtgtgtgt atatatatat 4920 atatatatac acacatatat atatatatat atatatgata gctactgagt gacaggtgat 4980 attataccat accacttgtc actcagtagc tgtatatgca tatgtatata tatacatata 5040 catatatgtg tgtatgtgta tgtgtgtgtg tgtgtgtgtg tgtgtgtatg ctgtctttcc 5100 tcggtatcac agggaattgg agatatatat attcttttca gtacaaaaaa aattgaacac 5160 agatgggtat ggtaccagaa cagaaggtaa agacacatga aaaaaatttg caacaacatg 5220 aatggaactg gagatcatta tttgaggaga aataatccag gcacagaaaa acaagcattt 5280 tattatttta ggtgaaagac aaacatttta ttttaggtga aataatccag gcacagaaag 5340 acaaacattg catgttctca tttatttgtg ggatgtaaaa atcaaaacaa tagaacgtat 5400 ggaggtagac agcagaagga tagttaccaa aggctgcaaa gggtagtgta ggctttgagg 5460 gtgaggtggg gatggttatt gggtacaaaa aatagttaga aagaataaat aatatctagt 5520 atttaatagc acaacaggtt gactatagtc aaaataacat aattgtacaa tttaaatatg 5580 aaattaaata tatatacaag actagaacac caagttgaat gactccagct tgcgaaaccc 5640 acattgatca ccatgcttgc cccaagggaa gctgtacaat gtctggctcg tccagaaccc 5700 catcatttat cactagcaat ctattgtcca taatcatgtt taaattaata gcattttaaa 5760 ggtacaaata ttttttaaaa aacaaataat tatttaattc gccttttaaa agctttttaa 5820 aaacgttttt aaaaactttt ttaaagtcct gaggactatt ttctttaaag tgctcagtta 5880 cagagctcca tatattgggc tatgatagcc ttacctgatt cttgccaaga atctagtgcc 5940 cagaaaatgc aaatacaaag taagcaactg aaaaataaac aaataagttg gaggtatgct 6000 acctgttgaa atatgaccta gcgcaaacac ctatgccact tgcttatgaa atcatatagg 6060 ttttcggtgt gcagttttga ctgaatgagg gagtttacgc tggaccacaa gggggcccct 6120 ctgtcaataa cgtactccat ttgtgtatta agtcaaaaat gaaatggaag agaaaagaaa 6180 catcgatgac cccaagtctc tttaattgaa tggaggtaaa agggaaacaa cgaatgagaa 6240 aagtactctg cccttttaag aatcttgcat tcacattcct gatgaagtta tttttcctcc 6300 tctcactgat tcccatttca ctctattaca tagcaccgtg ttccccagga gctcctgaat 6360 gaaggacatc actcagctgt gttaagtatc tggaacaata aatatactag tttcaatgtc 6420 taggctatgg gtattccttt ttactgaagg tatgacatat agctgcccag gcctgactaa 6480 attaatagta ataataatta ataatggcaa atttttattc tattaagtta cttggcttga 6540 cttgtagaaa tagcaacatt catctgaaat gccccctcct acacttatgt ctaaggacaa 6600 atcccacata caccacagat aacttcattt tacatgtttt attctgttac caaactaaat 6660 ttttatcata tagtctgttg ctcactgaac tcttcagtaa ttctcaacat accatgtaaa 6720 gcattaagca cagttccaac acagagcaaa tgagcaataa ctgttagtta ttataacatt 6780 attatgtgtt ttcagtgcat taaaccactg gtctgatacc tagcccaaca ttctattaaa 6840 ccacataatc cagttgaata atatatgata atataataaa atggcgataa gtgctaaata 6900 tccagataga aacacagatg gaatcagaca gctttcccaa gaaatagaga aaatagtaga 6960 taggcgatct aggcctaagc actctaagca gaagctaagt tatcacagga tatcttggca 7020 atctgtggca cgtgaaccct tttcttctgg agtctggaac tatgttgcaa ctctcacttt 7080 ctccctatct agagactcag tttgttccct tgtgattatc agcagttgag aaatccttag 7140 accttctgaa aggactactt tttaaattta tatatataat atttaaaata catatcttta 7200 tatataatat atatttaaat atataatatt taaattaata tatatttaaa tatataatat 7260 ttaaattaat atatatttaa ataaataaat ttatatttaa atatataata attaaaatat 7320 atttttaatg aacagagagt aaaggattat tttgaagaga aactcctggt tcccacttaa 7380 aatcctttct tgtttccaag tttttcaaat ggagccctct ttaccagctt gccccctcag 7440 agataagctg ttcccctact tattcagatc tgagatctga aaacattcct tttcctgtga 7500 gttcagctag gacaaagatg gagctttttg ataaaatttg gcaaacacat tttttaaaga 7560 tgaaaatttt taaaaattga aaaaaaaaca tttatagaaa gagacttcta atccaaattt 7620 aacttctcaa actatgtttt gaccggctag cataatgttt cagtctttct ggagaatgcc 7680 ccttgaaact gttttcttct acacaacttc ctcctttcct ttgactttcc tgctctggaa 7740 gggaagaaca ggaagaggac agatcaaatt actcaagagg aaggacaaga aataaggaac 7800 caaattatca acaattggag aaagaaagct gatgtcagta tcatttcata tatgattatg 7860 tcagagtcag gtggataagc caatcctgtt gaatagcata cttttcctgc tactcctgaa 7920 gggtaaagag gtctttctct tacaaagccg tcctagctag taatcttaca ggtgcaaaaa 7980 gcttgttttc atgttatttc ttagtaactc aaaatacctc taaagttata catattatga 8040 aagtactaca gtcacagtgc tgagaaaagg agtaaataag acaatgtata taaaaacact 8100 tggctcagcc cctggctctg tggttgataa atattaagtt agtattcatt attattataa 8160 tttccaaaga gtccattaaa agatatagaa gaagggaggc agcaataaca ctaagagaaa 8220 attccattat ctccaactat ttatcctcta gcccaaaata attgccatta gaaagagcaa 8280 ctttaacaaa aattttaagt tgcaatagat gttcaacttt aaatccatcc cagaaaaatt 8340 tctaaccaaa ggagcataga agatttgatc ttattttcta agtagtatag acttaattgt 8400 gagaacaaaa taaaaacttg 8420 <210> 12 〈211〉 8475 〈212〉 DNA 〈213〉智人 〈400〉 12 gcataacttg taagaaatgg agtgaggtct cagttcaaac tggcttctgt atgacttcaa 60 agccaaagtc agcaacttag aaggcaaaaa ttataattta gttggcaaat acgagaaaag 120 gtcagaaaca catgaaatga agctcaatag gaacacttac agggtagcag ggtagtagcc 180 tagggaaaaa agtcagacac taaaattgtt taaataggta agttcaaggg acaggtaaag 240 accttagtgg gtaagaagcc aatcagcaga cgaactgcaa gcaagcactg tctctctttc 300 ccttctgtct cctcttgtag taactgacca caattaaggc tgcctagggg aataatgaag 360 taatcctcct attatcagca atggtctgat ccagtgccag gcaccacaga caacttggtg 420 ttcagagaag atccttcaag atgaacaaag ggtcaaaata aaaaattcta gaagagagaa 480 gactgatcac aatttaatgt aaggcttgga aggaactgat ctctaccttc cttaacatct 540 caagaacttc ctcagattca ttggatgttg agtgtgtgtg agtctagtag aaaaatgaat 600 ttttgtttct taacttggat atgtgattag gatgttaata attaagtctg ggctaatatt 660 gaaggtatct tatgatgggc ttcttaaagc attgatcaca aagactgcat gttcataaac 720 tgagctgcac ttgttaggat tctagatgtt tgaaatttct tgtgttattt tggtctcaga 780 tttctagaca aattttctca aattcctatt tcactttttg acatatcatg agtgactcaa 840 atgtttgccc ttgagtcgga aaacacccag cattaggaat aggcacataa acataatact 900 tcaagcttca gatttaagct caattataaa gtgtttaaag gctgtgctga tagttcttct 960 gagtagaatt cctacaacta tgggtttgtc tataataaaa tgttcactct atattgaacg 1020 ccttatttaa aactcgaaat gtgtaagtag taataaagaa aatatgtcct cctgtaacca 1080 aagctaggac cgattacatg ttcacttgac tgacagatac aatcacctat attaggagca 1140 atcagcactt ccttacaaac taacaacttg agatgtagtg ttcccattgg ctatgaagat 1200 tttctttatt tactcagaat agtctgtagg atctgccagc tgcccctgat tataccagct 1260 gcacccaatg atcacagtga acattatttt acattctaaa taactggtgc aaggtgagcc 1320 atggttttct gagtttccta tcacctttgt gtttcaggtc ctcaaatgtt aatttgtaaa 1380 gctgctgttt caggcaaaac taacaaaatt agcatctaat caataaccat actatgtcca 1440 cccatatcct ataacacaga agtaggggaa gagtgagaaa ggtggaagtg gagaaataga 1500 ggcccaaaaa gaaagtttta tcacaggaat atctagatgt cttctgggat tgtctgttaa 1560 agagctgtga cactcatata aatgcagaat tactctcttt cttccttgtt ggttagaagg 1620 ccaagggtgc catggtaata ctaccaaaca tatatcaaag cttggcagga aaaatggtac 1680 cttcagaaat tttataatct gatatcaaat aggtcaagaa atataataaa actagtttct 1740 ttggtttcct tagaaacctg gaaaacttta aattagaaac ttagaaagct ttaaatcaga 1800 ctttgtagtt aaaaaaggaa attttagttc cttccagcat tagaattccg tgattctctg 1860 actctgagcc tggattaaat ctagcccagc tgagtggaaa cttaagtaac tagctggttg 1920 cctttagtga tcttccactt tatggctgct tccgcctaag aagttcatca tcgtgactta 1980 ctttctttgg ggcaaagtcg tgactaactt tctttggggc aaagttggaa agcagaggtc 2040 aaagtcaatc agaaatggga caaactcact tcctactgcc tggtgaaggg gccattttca 2100 gtagcccctt ttcaagatta gtttcattca agatttgata agctgttttg actttactat 2160 agatcttatt atccatgtca gttaagttta tgcttccact aaatctatct gaattcaaaa 2220 ggtaaaaagc taatgctcag tcttatcaga tttatcttat ttattaatag aatgtggatt 2280 tttttaagca tataacaata atagtaatga taggaccata aatgtggatg gctctttaca 2340 agtcactaac attacataaa ttcctcaaca acacactctg aggccataac aaacttttag 2400 aaataacaca attggctacg gaactccagc catctagctt catgggctcc cactttaatt 2460 tcaaaacaac agaactgtgc acattcattt acatgattag ggcagagctt aactgtatct 2520 catgtagcac ctacatcatt cttcagacaa acttattgcc ttttacagac aagaaaactg 2580 gggctcaaaa aaggacttgc ttataactgg ctaataaaga ggaactctgg gttcaaagtg 2640 agtccaattc tttcttccac ccacagcttc tgctaaagtc attacagaaa tgcatagagc 2700 agttcttcca cgttattgct taggtttcta aagagcagtg acctaataca acatgctcta 2760 taatttatta ctgatttaac tatttcacta aggattcact tttaactttt aacttgtaaa 2820 tatgtctaat aaacaccact gaaatagcaa cctctttctt catggccttg tggttgtaaa 2880 gcaagctagt aatatatgtc tgtggatttg tgctaataaa gttctataca cctcattaat 2940 tccacaaatc ctactgggta tttcttatct gccagatcct acgctaggta ctggatacac 3000 agtactgaac aaaatgggta caaatgagcc tcacagagct tgtttcattg aaaagcagag 3060 agatacacac taatcaacaa attaatagta acacactacg atgtgttttg aaggaaaatt 3120 agagcatcaa agagacggtg ttagcaggtg gaggggagct cttttagatg gagaatgaga 3180 atgcctccct aaagacatgg gaataaattg agatcacaaa aaatgagaaa tagccagcct 3240 tgagaagagc agaaggaaga acattcaaag gaaaagaaag tgcatactgg aaagcctgaa 3300 cactagagtt tggtgtatgt aaggagctga gcaatggtca cttgtgtgat aagatgtgtg 3360 gatgtggggt ggggggcagg ggtgagtccc acgcagctct taagtgtgtc ctcagactcc 3420 tgtggtttcc atcagccaca acctgaataa ctgtgtggta atccaaaaat gattacagat 3480 taaacatata aaaatatcat tacacccata gtacctaagc caaggacaca gtattctatc 3540 ttttcaatga agatctgcat gaagtaaaat tattatatat aattttaggt attgatatag 3600 atacatcagt ggatagatat agatatgtgt ctctggtata gaaaaaagtt ttaaagggat 3660 attaaaagtt cttatcttgc agggttgaag attgtggcaa ctttcatttc tttttaattt 3720 taagaaaaaa gtggtattat gggggattag catgtttgtg ggtatatgta tatttttaat 3780 taaaaaataa acaacaaaat gaaaacgttt ttcttctatg aaagcctaat aagaagaaat 3840 ttcagctgtt ttaacttagg gagctaaaaa catcaaatcc aagaatgttc tctggaactg 3900 agctcaatac atttttattt gagtaagaat tggatacatt tccatcccct tggggctcca 3960 gtctgtcaat attttacttt tcagcgataa aaagacacat gtagataatc acagtgacct 4020 cagtaacttt ccttctctta tttaagttta ttttatttct atcgtagttt tccctgttaa 4080 agattttttc tttttgctta catatataat tttagagaat aacaatgcac acacaaaaaa 4140 ttcctcttgt tctgctagac ctggactttt tctctaatat atatctccat tttttgtctt 4200 ttttcagacg tattttggaa gcaaaggaga gaattgctat atagctgact tcctcttctc 4260 atcaacagtg ttttaacagt ttttaagcaa aagtcagctt tgtttatcta agattttttt 4320 tgctggcatt taacctaccc ctgcctcccc tttcccaagt ccacttcagc caacctctca 4380 ttcgacaggt accaccctct aacataactg aaataatgtc taccattact ggatcttgct 4440 agcaaagaat ctcaaatttt cccacttggt tgtaaattat tttgtaatct ctagtgttta 4500 aggtgcgctt gtcctatcta atcccctccc tggcaggaca ccttacagaa cctacccctt 4560 acactagtca ttaagcacca tcagggacgg atggctgtgt cactggtctg tttggtattc 4620 cctactgatc ctaccatgtg gtgattatct atgacttccc taatccctgg ctgccttagc 4680 tgggactggc tgacatgctt ctcaggttgc cgctggcttt acagtccttt actgcccatg 4740 ccactttgga gataggcagg gctagtactt ttctatataa gcccccaaac ttgactttgt 4800 gtttcacagt aggtgaaaaa gttgggtctc ttttctttta cttttctttc cacaagatga 4860 taaagctagg ggaagcctgt ggacatggtt tatttctgca actgcaatga ttgattggtg 4920 cttcctgctg cttacttcct aaactttgtg ctcagtgtca gatccctagc agtttctatc 4980 ccctgctctg ctaaaaaaga atggatgttg actctcaggc cctagttctt tttaattaaa 5040 ttgtattttt gttatcatta ttattattat tattttgaga tggggtctta ctctgtcgcc 5100 caggctgaag tgcagtggtg caatcacagc tcactgtttt agcctcctga gtagctggga 5160 ctacaagcgt catgccacca tgcttctttt taatttttta aaatggtttt ctgccttcaa 5220 ttctaagcac ttctcaattg taaccaagag ataatacttt ttatgaattc ttaaagttat 5280 caacagatac tcaaagtttt agcaaagtct aaatgatatt aagcttgtcc ttattgccca 5340 agtgacttca atgactattt gttaattgca accaagggtc attttttaaa tgaatatata 5400 ttattattat atatataata ttaaggtcct caaataccta aaagtttagc aaaatctaaa 5460 taatattgtg catattcttt tattactgta ttagtccgtt ttcatgttgc tgataaagac 5520 atacccaaga ctgggcaatt tacaaaagaa agaggttcac tggactcaca gttccacgtg 5580 gctggggagg cctcacaatc acggcagctt acgggattgt tgagaaatga cacttctcaa 5640 gctggggcta aactatctct gtggtagttg ttctgattca agtattgaat tggttttttt 5700 tgtttttttt gagatggagt ttcgttcttg ttgcccaggc tggagtgcaa tggcacgatc 5760 tcagctcacc gcaacctctg cctcccgggt tcaagtgatt ctcctgcttc agcctcccaa 5820 gtagctggga ctacaggcat gagccaccac acccagctaa ttttgtattt ttagtagaga 5880 catggtttct ccatgttggt caggctggtc tcaaactccc aacctcaggt gatccacctg 5940 ccttggcctc ctaaagtgct gggattacag gcataagcca ccgtgcccgg ctggagcatt 6000 ggtatataaa agctgcctag gtaactctaa cctttggccc catacatctg aaggatacct 6060 acaatgcacc tgaaaaatgc aactgaaaca gtagttccct gggaccacac actcagaaag 6120 ggggtgtatc aggagatcta gggaccagga gggtggaaga cctaaggcag cactacagat 6180 gatggagaaa aacccactgg ggaggggcga tcctaacctt gagaatcact gagatcatgc 6240 agaagtattt gatcctacag cattaatatt gtattgtatt gtattagtat atatatatag 6300 tgtatatata tagtattagt atatatattg tattgtatta gcatatatat actaattgta 6360 ttgtattgta tttatatata tagtattgta ttagtatata tatacagtat atatgtatat 6420 atactaatac aatgtactaa tacaatacaa taccatatat atatacacta acacaataca 6480 attagtatat atatatatat atatactaat acaatacaat actatatata tactaataca 6540 atatatacat atatactcac caagacatat tagtggtctg atgtctggct gccacactca 6600 tcttctacct tcagctctgc tctaccaaat atcatttgtt tctgggatct ttgcagtcca 6660 aggaacttca tccttgatat cccacccctt actaactttt tttttttttt ttttttttga 6720 gacggagtct cgctgtgtca cccaggctgg agtgcagtgg tgtgatctcg gctcactgca 6780 agctccacct cctgggatca caccattctc ctgcctcagc ctcccaagta gctgggacta 6840 caggtgcccg ccaccacacc aggctaatgt tttaccgtgt tagcaaggat ggtctcgatc 6900 tcctgacctc atgatccatc cgccttggcc tcctaaagtg ctgggattac aggcataagc 6960 caccgcaccc ggccacccct tactaatttt tagtaacgtc caaggattaa aggaaatttg 7020 ccttacctat ttaacaggaa tcaacagggt taatctcact ccctttctaa aaataattta 7080 taaacattgc agacaatctc atctatccct gtctaaactg tgtggaatta ctgccattta 7140 atgtaatcag tctactcatt tagtttgcct aaggaatttt tgaaaaaaca gttaaatgaa 7200 tgacttaatg gaataaccag gaagttgaag tctccaatag taagaatgaa ctcttgctct 7260 ctggataatc aaatgggtcc ttcctccttc aggtagatca tgccatttcc tcacttacac 7320 tgaacaggta aacaacataa ttactgactt caacttctag ttaattcctt cttttatcac 7380 tgagtatcct ttggctggga gttttgttgg ctatgctgcc attttttcta gttatcacag 7440 tcctataaca taccaatcct tcaatataac tcatctttaa attgtggttt taccttctca 7500 agaagttatt aattatgcca gtgctaaatc ttctaaaatg attgttgact tgttgattag 7560 cccccatgca attcccctct cccgtccctc agcacgtaag gaatggccct ttgcttactt 7620 ccacagatcc ttaaatctac cagttagaag ctaatagcct acctctctac caggaaggaa 7680 ctgtgggctg gaacataata catgttgact tataatttct tagaaaattg tgtgagaaac 7740 atcaaactcc tgattccagg atatgccaaa gacacatcat taaaaagcaa aacaaaacaa 7800 aacaaacctc atttgacgtt gctagtagtg gcatatttca tcaagatcag ctcaaataaa 7860 tagaagtgag attttcacac aaattagact gtagtgcttt tttttttaac ttatctttac 7920 catatgattt ttaacggtaa aaaaaatcgt ttgagatatt agatgtataa tatttatcat 7980 ccaattactt cattagttca atcttttttc aatggcgctc ctgcatctga gaataaggtc 8040 agaaaatttc atgttctgat ttcatgctga ttttcagaag aaaaatgtta gttttgtata 8100 gaataaccca tcctaagaaa tacatttctt attatatttc ttatcttata tttcttagga 8160 caatgagcta ttcaaagggt gatgataacc agcaccatca gtcagcatta tctaagaata 8220 agaatctgtg tttctacata cagacctcct aaaaaggaac ctacacttaa caggattccc 8280 caggcaattt ggatgcacat taaagcttga gcaacactgc attagaaagt tagttttcca 8340 tcacaaaaac agtaacaaaa ggaatataaa gtaagttact ttaataatat aagaagaggg 8400 gcaggccggg cgcagtggct cacgcctgta atcccagcac tttgggaggc tgaggcgggt 8460 ggatcacctg aggtc 8475 <210> 13 〈211〉 8401 〈212〉 DNA 〈213〉智人 〈400〉 13 tttcatctaa gactacattt ctattgtttt atataatcag cccccctaag atcaacatgt 60 ccacattttt tggcaaagac aaagcctact gatttcagga tcattatttt cctttttcaa 120 aagcacaaac ccaaactgag aaataaatca agagaaattc tccttttttc tatgctaatt 180 tagaagtaga gtctttattt cttttcaaac ccaaagagaa tcagacatac aatatgaatt 240 tatctacttt cgcttgctca gactgagagg aaagattaat attttcaggc tgttagtcaa 300 aactgttcat tcaaatatta tttaataaaa tccaagaacc agctaaaaag tcgcttaagc 360 taagaaacct tcaccagcct catgggaaat tgtgtacagt tttccactag aatagcctat 420 aaatgcttac tgaaaatgtc taagttcata tcttggtaac taacatttta attcaatctg 480 cagaataata tatgcttctt tagtgctaag atatgaatat tagaggcatt ctttcttaaa 540 atttctattt agttatactt tcacaaataa ctatataata ttaaaattct gcatgtggca 600 taaaacatat tttaatggag aaggtaatgt gtagggagtt tatttctgtt tgctattaga 660 acttgtgttt attcttggtt aaaaaaactg cagattacaa catagaaaaa aacaaaagta 720 tgttgtatat ctcttacagt agaagataaa gagtagttct aaatttagaa aggaaaaata 780 aatatacaca gtgaaaatat gtgtcagtga gatgttaatc aaagatcaac tattgctgag 840 accagcaata ttaaatccct gcacaattac tcatattata atgagaattt taaaaagaaa 900 atatgaacac ataacataat gaaggcagaa gtcactctca tccttcatct ttgtattccc 960 aattcaggaa gctggtatag tatcttcatt ataattacta ttcaacaaac atttgtaaaa 1020 tgaatgaata aggaatgaat gatgagaaaa atgataaaca tctccctctg tctcctggga 1080 gttaactgca ctactttctt ttaaatttaa ttaatcctca atgtccttgt aaaatagcca 1140 aagggaaaat gtatttacat tactctaaat attgatgcaa tctacaaaaa gtgttaaaca 1200 acttcctcaa agtaaataaa atgttcacaa tccagctagg ataaaaggat ttaaatcatt 1260 tcctaggtag agggctttca attagagccc ctgctgcatt aaccatggga actcatctca 1320 ctctcttcat gatggagccc tgagtgttgc tgctaatctg tactctacca ttctaatgct 1380 tttaaggttc cttttcagcc cttcctcctc gtaatccaca aatactgaga ccaaggcatt 1440 ttttgggtca gtcctaattt caagcattct atcctgccct ccccaaatga actcacactt 1500 attagaccat atgttcctat attagttcag gaagggggaa aaaatgttaa tcacacttgt 1560 atataagaga tcatagaaaa acagtttact aacctgtgaa aataccattc attctctgtt 1620 tacctctggt ccacagctaa gcaatcagca ggatataaat gtaccctatg ttcactattc 1680 agtattcata agtatactac ttatgaattg gaaatctgac acaacattta catgacctaa 1740 ttttgaaaat ttaaaatagt gtaaggcccc taggcttaat tttacagggg aaagattaaa 1800 gggacacaag caaacatata ttctctctct gtgctgtggg acactggtaa ttttttgact 1860 taaaatattt gatacttaaa atgccaaact tctacatttc tgcagtaaca aggcagttat 1920 catattgaat accatttctt tctctccagt aagtagagtt aatattagca catgaactga 1980 aaatattaag tgattataaa aacgtccaaa taaattcatt aaaatttagc ttggcaaaat 2040 gttagtttca tgttcttggt agaagtcctt ttatatttat attcaaatga aatgaacaat 2100 ttacaagcaa aggaaatggc atcaaatatt tcacaccctg cctcccaagg tgtattgatt 2160 catgcttttt gctcagatct aggtttctcc actcaggaaa agaggagaat gtacccatac 2220 ttgggaaaac aagtttccga tggcacagct ttgatcaaac agcaaaattc tatccatcta 2280 tgtattgcca tctgacagta tgacaaatgg tcccatgtgc gatattcaca ctgcattgca 2340 gtcaaacctg taagtcaaag gatatgaaat aatagtaact atacattaag cacagaagaa 2400 aatgaaacaa acaaaaaggt tttaaaccaa ccaaaaatat gtcttatttt ggatgttcta 2460 tatgttctta cattctctca ggtcttttgt gtcattatga acacaattct aacaagcttg 2520 attattttat ttccattcac atattacagg caacaagctg aaaaagtaga acggggtgta 2580 gagagacagg acaaagtaca gattagggct tgaagtgccc ctgaccagtc gacagcaacc 2640 acatggaata atgactcatg tgcattaatg atcacactaa atgatatttg tttttttacc 2700 tagtccttca actgacagct taaagaactt caggttgttc tgattcttga gcctcctcta 2760 cagcttcaga gaggactttc attttatttt ggatcaaatg ctccacaact agttgaaact 2820 ggaattaaat tttatatgaa gttcctagat gatttaaagc tgtaagaaga agaataatga 2880 atcataagaa aacttgctgc tacagatatc aaaaaggaat gttaccatcc ctcatgctaa 2940 tccttttcat tttaaataaa caggatctaa aaaaaataat gctgggaagt cctaaccaca 3000 tcaagaatgc ctcagatcag tgacccaggg aaccttccag aatggatgaa atagacccaa 3060 agctgaattc acctaatttt agggccaaaa acccaaaaaa caaaacaaga ccaaaaaaat 3120 cttcagatac tgggagaaca aatctcaatt gctcaattgt atcttatgaa aacaattttt 3180 caaaataaaa caagagatat ttaagattca ttaagttctt gtcatttcaa attttaagaa 3240 aaatattttc taatggaatt acatatattt atatgattct tctagttata tccatggtaa 3300 taaatactct tttcagttgg aaataaaacc catttgtgct atattattag ggaaaatatc 3360 tacataaatt agtttttaat ttaactaaag tctatctttt gaattcataa gcataaaatt 3420 ttaaccactt gcaaaattta taacacactt aaggtagtca gatgccttgt caagtagttt 3480 aacaaaagtg attttcacct gtttgtttta ataacagtgc atcgatttta tgaaaatcag 3540 gcatgccctc gggtcctaac aaagtatacg aagctgaatg gatctatgcc aaatatgcca 3600 gattttactt tctgagtctg attttatact tctgtcctct ttcttaccac atggcttcca 3660 gtatcactta cagactaacc cttcaaaagg agaaggctaa gttactaaca tttggaaggc 3720 ttatgaaagt gaagcatagt tatgagccag caatgttttt atttagggaa tgtgtgcaaa 3780 ccatacactt aagcaagctc tggggaatga gagttggggg gaatcaactc ttttatttgc 3840 taattggtat ttcctttaaa agatagagtt cttccagatt ttaactgtgt taatagttac 3900 tctagaaaaa ttggagattt gtgtgcatat attttatgtt gtaaacagac acatacccag 3960 agacactgag agagacagac agacagtaaa cagaggagca ctaaccacaa acggtttaca 4020 aatgacctct gtgctcattc acctgtctgt tccccacctt gccttttata gcaactatag 4080 caacagccat gagagtcatt gtggaaagaa ataaaataaa attaaaaaat cctggaagct 4140 tgtaaagaat gtgagcaaag gggaggaagt tgtgaaaaaa atgaataaag ggcaccgatc 4200 cagagtattg aagaaggcag agtggagagc ctagtaatga gtatctggta ccccagtatc 4260 ctctcccaca gaatctgtac agctctccgt ttatgacagt ttaaacttaa tttaaattat 4320 caaacagaca ctttcctcaa acatataaat gatgaggcag ttcattcagg ctgtatgtat 4380 aaagttgttc cagccacctt tttctaatgg cttctctata tcttttacat ggagacaatg 4440 agagatttgc ttaggacaat ttgactgtaa tttagaagta ggaaatggga agtatttgta 4500 tcttctttgc ctaactcaca ttagttactc aagtaagcat ttcttccgtt attgcatttt 4560 cctgattaca agttttatgt tttctctaaa acacatatca aaagaaatgt cctaagcact 4620 atgcaggggg aagccatgac atttatccac cactgtcagc aaaaacatga acttagccct 4680 caacagaata tttcacttca ttctagtgtc acctctgcgt cacctgcact ggagtcacca 4740 cttgcctgtt gggtaagacc aggatgcacc gctgaaataa aaaggggtca gacaatacaa 4800 gaaaagccag tagaaattgc caaatgtatc agaatacaca caggctttct aaggatatgg 4860 cccaagagga aggctctaga gcccaccctg aaacaggatt tttgacttca cagataaatt 4920 atttaatttt caataacaca attcaattaa agaaagggaa atacaaggct aaacaaataa 4980 gaaatgaaga caaaaaccca acctttcaaa tctaaagaaa ataatctgtt ttaaagacac 5040 agatgaagat caggaaccca aaacagaaga aaggaaaggc aattaacgct ggcatctgat 5100 aacaacgaaa agtatggagt ctggagaatc gctagactct aaaaattata aaggtttaga 5160 cttggacttt gtacactgaa gaaaagaaaa ctgcatgcat ttatactgac caatgtacac 5220 tattgctgct ttttaacttt tgtgtatatg tagggtagat ttttttttaa gtgaaagcaa 5280 gcttattaag aaagtaaaag aataaaaagg tggcttctcc ataggcagaa aactagcgta 5340 gtttttttat tagaaattgt tattcaataa tagtacatgt tacaaataaa taccatttta 5400 aactgaaaaa attgtagact ttcaaatcag ttagggtggt caccctaaaa aagggcattt 5460 tttcccctta gtctccttgt tcatgttgct cacaacaaga aatgggctaa tgctatgaat 5520 aataataaca aacactgcct tctgtcaggc cctgtgctga ataccgtctg catatgtata 5580 ggaaagggtt aactcagcag gtcttgtttg cccagactct gtacatttcc aagaaaggtc 5640 tgcctttagg actggtcctt ggccagctcc tggagaatga gctctcagct tttagaaaat 5700 tctatctgct aagaatagtt ttgcatgtct caggtcttgg gccacaaaat atcagtttaa 5760 tcagatggtt tatgttaaca agtatgattt atggcaaaca tagatctcta atctccattt 5820 ctctctcata tatctatatt tatctatcca tatatatgta cctatatata tcaaatatga 5880 agatatgttt atagcaattg catataaata gagagatagt atgtagtagg aagagagaca 5940 tagatattat tcttcatttt agaatgttat cttggtatgt ttaaaaggaa aaacttaaga 6000 tgtgttgcaa ttgcagtatg agtttcaggt atgtacatgt tatgtgtgtg tgtgagagac 6060 acacacaaac acatttcaaa catgttttat gtttaagctc aatattcaaa cacagaaata 6120 taacatctat tcttaatatg ttttatgtaa gtacagcagc agcattatta aatactgtat 6180 ttctatggtg attgaaaatt agtaggcaga gaatttttgt aatggttctt aataattttt 6240 gtaatagtaa atgattactt tttgtttagt atagttttat aatctataca tgaataaagt 6300 ggatatttct attcatatag aaatgtgatt tactctcatg tacttatcta catgctaaaa 6360 ccataagtta tcaattttag ttctgtgcca aggcactttt actgaataaa aataatcagc 6420 taattttata ttttcctgat tcaaatttat atgcccgtgt aatgttccgg ggtttttttt 6480 tttaatttct gtaaatcaga atattcagat gttgaaaaag tctttgcctt cagatttaaa 6540 agataccttt gaaatgtagc atatcccaaa atgcaaccca gaggctggca atgtcaacat 6600 ttttctgttt taaaaaacct cttatgaaaa ctattgccat actaaatttt ttacttgctg 6660 atgacttaca gctggaaagg attctgtaca tataagacat caaatattga ggatactgga 6720 acttttaaat taatggcaaa gaaagtcaac aaaggaagtt catatgaaat caaactagta 6780 atatgattac aaaaaaaaaa gtttaaaatt tttcttggcc ccagtcttat catttctgag 6840 ccaaatacaa ttctatcgaa atcacctgaa actgaaatca ccattctagg ctggttttcc 6900 cataaagatg gactgctcca aaaagaggaa tcaagaaaga atttggctca cagtgaatta 6960 ttcactttgt cttagttaag taaaaataaa atctgactgt taactacaga aatcatttca 7020 aattctgtgg tgataataaa gtaatgacca cttttcagct ggagggacta acttcttttt 7080 tttttttgct gcatatatag ctgtggtaca ttttaatgtg aaatgatgac tgcatcagct 7140 tatatccatg gagcagattt tagcattcag cttgggtctc ccagtcaata tctacgagtc 7200 tcttcttaag gagatcgatg acacagatac atacagacta acaaatgtga taccaataat 7260 caagaattca ctcagttaag attttgccca ctgatttcca cacaagaaac ctagaattta 7320 ctagattctt gtgcctgtga ggctccactc atttccctga atcacaaaag ctacagagta 7380 tttagataga aatataccta ctcttaacat gaaccatttt aaatatatgt attactgtgt 7440 ccacaggagt acactttaaa gcagggactt cactcttcaa tctctccaat cacgtgttac 7500 ctaaagtggc atgtggttcc ctaaagctta ataactgaca ttgccttaaa aaaggggttt 7560 gcttcccgac taatgtggaa aaagtctgaa aaatgatttt aaatctttca ctaaatttct 7620 catttggtca cgtggaggaa aatgatttca ccaaatagat actctcatta attttttaat 7680 gtaatttatc aaagaaatga aatatttaga taaattccag atttccccca ccatgagctt 7740 ctccgaaagt atactccatc acagactgct cactaagaag ctctactgca gtcaaagtga 7800 ccgaatttaa ggggacataa tgactacttc tgctacacag aaacattatc catctctaac 7860 acttccctat gagatggaag acggacttct aatcaggtac cagagagggc tctgccaact 7920 tcagggcttt gatgaataag aatggttgag agcgctcatc ataaatgaat tcagtataac 7980 tgagtgagaa agtgagagaa ccagagaaat aaatcctcat gtagaaaatt taggggtatg 8040 aaatgccaaa tgccagttaa ccaaagcttt ctttgtcata aagcaacttc tataaaaatt 8100 gctgaaaata aattcttcat ggctcaatgt gaatcagtaa tttccatctc tattacactg 8160 ttgtttaccc aaaaactatt tttaatgact aagactcaga gtttgccaga gtgttttcca 8220 caaaacaact gttttgagat actccagatc tgtaatcaag taagtctgaa aaaccccaaa 8280 tacctcactc acctcttgga tatgcataaa gcacactaat atataacgtt ctaaaaagcc 8340 aatcattaaa accgttttat attgtttaag catttcctag acatatttgg ctacaaatct 8400 a 8401 〈210〉 14 〈211〉 8427 〈212〉 DNA 〈213〉智人 〈400〉 14 gcacctgcca ccacgcccag ctaattttct attttcagta gagatgaggt tttgccatgt 60 tggccaggct ggtctcgaac tcttgacctc aggtgatcca cccgcctcag cctaccaaag 120 agctgggatt acaggcgtga gccaccgcgc ctggccatat taacaaattt taaatcacaa 180 ctatgtgggg ggggaggcta gtattattac agcagattgg tttgctatat aaacaagtac 240 tttaaaaaat atttcttggg ccaggcgtgg tggctcacgc ctgtaatccc agcactttgg 300 gaggccgagg tgggcagatc acttgaggcc aagagttaag agaccagcct ggccaacatg 360 gtgaaacccc atctctacta aaaatataac aattagccag gcatggaggt gcatgcctgt 420 aattccagct gctcgagagg ctgaggcatg agaactgctg gatcctggga ggcagaggtt 480 gcagtgagct gatattgcgc cactgcactc catatccagc ctgggcaaca tggcaagact 540 ccgtctcaaa taaataaata aataaataaa taaaactaaa ggcagagttt tcttaaataa 600 acatggtagc cctcagcaac aatattgtaa gaactcctcg caagagaaaa agctggaata 660 agatactggc taagcaagta agaaaggcac tgccctgctt ctgcatacat tcaaactaag 720 acatatacat tgcagcttac acttacattt tccaatatcc ccaggcatcc ctttcccttc 780 tcaaacagcc aaaaggaacc agccatgcaa ataaaaatac aagttcaaga gcctaaaaga 840 agtcagtgtc ctaaaagaga aaattaatgt aaagaattaa gattttttga aactacactt 900 tctttctggg gctgtttact ggcctccaat acatcaatcc tgtaacactg tgaactacag 960 tgatagattg gtacatgctt ctaaacacaa cagaattttt ccaaggttac atacactgta 1020 acaaaagggg cattttgcag catcttattt tccttaatca actagtttgg atattctaac 1080 agtgcaaaca ttgtaaacaa taaattttca ttaccttttg aactttctga agtcaaccaa 1140 aggcttgtgg tatggatgca atgagtacta gacaggcaga gctgaatact agtcaaaata 1200 ttcagttact ggtgtgatag tccttttggg ggcatacatc acttagggag aaactgaggt 1260 gcaaggacat tttacacaca gcaaaaacat tctcaggaat ttgtcacatc attaccataa 1320 gccaaaaatc tcaaggtctt agaacagcct gagcttctga tcaaattata ttgtaaaaag 1380 agaggaaaaa aatgtgaagc gtgctatttt ttaaaataac agtaactact actactgctg 1440 ctgctgctaa ttctaaacgt ttactgagcc cttattatgt gccaagcacc gtgctaggta 1500 cggtcataga ttttaacaat taatccctgt aacaaccctc tgatattagt taataaaatt 1560 aaagtagaat cctcaccaaa aaaatttaaa ctttccaaat aaaaatataa ataaattatt 1620 aaagacattt cacctctttc tctgcctcag actacatttt caagtattaa atttacacta 1680 aaaccacatt tattttcagg aattccagtt aaagcgtaca gatattcaag atgttgacaa 1740 ttattacaga agaatcacag aactctgaaa ttaaatactg gcacagaaaa ccttccatcc 1800 aaccttacgg aacaactatc cccattttaa aaaaaaagga acagcatata tatcaggctt 1860 gataataaga ggcttctcat gcccacacta gcaatgaatg atgccataat tataaagaga 1920 cctgtatcgc cacatgcata aaaataattt acatctgcta agtcaagttt tcaatatatt 1980 attttgtgtg taaaccttat agtagctgat aaaaaataca ataaactaat ctaaggtaaa 2040 ctaaaacact aggttgtttc tgaagactca ctttagaatt tgagcagcat aataatcata 2100 atattagtaa tcaaactact tagcagaaag ttcttagagg gctgggaagc tgtgtataat 2160 aaaatggagc agacaagaag gaagggtttt ccgtactgtt taaatcaact acaggtccca 2220 gcatgcagtg ctctaatctg aagttaagca aaaactgcaa tgcatactgg gacttgtagt 2280 aagtaaacca cgttatcaca gcaagtttca agaaagtctg aactatctag cacaatttga 2340 ctatatctta ttatcagagt ctaatcaaat ttaaatcaaa tttgtatgtt ctctgatgtg 2400 gcacacagtt tctctagcac ataccggaaa aagtatcaat atttagacca acattttcac 2460 attagaaaaa tcttacgtag gagaagcaca gaaaaaaatg ctgaaaaagc aaaaaaactt 2520 gatgaataaa aaatataatt tttgaaatag ttttttaaag tttgaatgga tccatttcaa 2580 cattctctaa tcctccccca caaaaagttt aattgttttg gccgggcgcg gtggctcacg 2640 cctgtaatcc caacacttta ggaggctgag gcgggtgaat tacgagatca agagatcgag 2700 accatcctgg ccaacatggt gaaaccatct ctactaaaaa tacaaaaatt agttgggcgt 2760 ggtggcgcac gcctgtagtc ccagctactc aggaggctga gacaggagaa ttgcttgaac 2820 ctgggaggtg gaggctgcag tgagctaata tcgcaccact gcactccagc ctggtgacag 2880 tgtgagattc attctcaaaa aaaaaaaaaa aaaaagttta attgttttaa caggttgctt 2940 tttaacaatt attcaagatg tattttataa ataatttttc ttgaagaaaa ttctcagaag 3000 caaacattcc ccatattcta atattgccca ccaggaaata atttttttag taatacgcac 3060 acaccccatc acaaaaacaa acaaaaaaca ctgaagttct gcttttgtca agtccttact 3120 caatatttat gccctccatt cctcacctct aattccctac acacacacac acacacgcac 3180 acatccccac acacacacgc ttctacaaag aacacttaga aaaacagtat tccaactaca 3240 agcccacttc tctcatccac tgacctcttc tgaaaacaca aaagattttt taagctatca 3300 gtaacacgtc caaacacaag ctgataagtt tgagctagaa tttacatata tacagttgct 3360 acacaccctc ctattttctg caagtctgtg gaaggaggct gggaaagaac taagtgcaat 3420 ctgcatcagg aggcctaaca caggtggtgg gttattttca ggcaacagca ccttcacaaa 3480 catgttttgg aatatagtcc aagaaattcc taacaaggaa agataagctg gcacacaaat 3540 ttaacgcaat ccagctaaaa atcatctgca acacatgcta ctacatttca ccataaaagt 3600 gacgggctac tataaaggat ttgaagcttc gtcaatacaa catactgtcc ataaggccag 3660 agatagcagt tgccatggtt actataccca cttttatcag gaaattactg tcattacccc 3720 aaagttttgg gtacttattt aaaatttaaa aaaaacacac acaatttagg gttctgactg 3780 ttaattgagt gaaataatca actactgttt gatttgtaag tatgtcgctt tggagatgca 3840 catggttaac aatacttgga tctgcagcag aaaaaaaatc aattcctttc tgctgctcct 3900 tctcctcaag tactgacagt ttgtattctc aatgcagcca aaacaataaa acaaaaccca 3960 tctttttggc ttctgtgttt aagttatttt tcccctaggc ccacaaacag agtcaaaata 4020 aagcctagat catcaacctg ttaggcctca tccccttcct atcccctcca tactggttca 4080 ctttcttgac tacttagaaa aggcagaaaa catttctgta actgattcca aagtatagaa 4140 aagaatagtt gccttcaact gagatatttt caccaaagtc ttttttattt actttttttt 4200 taaggcaggg agaggggaga gacttgcagg gtactgaaag ggagaagtgg aggagtattc 4260 aaattgccac acaagtctag tgtaagaaag ttgctttaga agagtccaaa ggatggctga 4320 acctcacata taatttctaa aagctttgga agagttcacc ataattttaa gactgaattg 4380 agggacaagt aatagaaaag ttattcataa agtctacttc aacattttta caaaagataa 4440 ctattcaaaa atttaacaca catataagaa ttatacgaaa gcctacaaaa tagtatggcc 4500 acatatacac acaaacatac aaagtagaaa acataagcta tttaagaaat aattatctac 4560 aataaattca atgcaatgtt aacatattat ctctttttta aaaaatcgca aagcagcaaa 4620 aacatacacc tgagaaaatt aatgtgatca aaacgttaaa gaattcttag gcctataaaa 4680 aaagcccatg tacaaaagct cctgagaagt caacataaat cattaatatt tcccagcaca 4740 aaataatatg aaaattcaaa catgtttcaa gaaatcagtt ctagatatag atataaaaga 4800 attccattaa aggtcagaga cctaaaactt taattccttc ccttctctgt ttgaatagta 4860 attaaataca aaagccttca gcaataaaat actaaggata caaaatttaa aagcacatta 4920 atataagctt aacttcagta tgtcttcaca gaaagcttta ctattcactg tctgtaggat 4980 gaaaaagtta ataacaccct gagaggtttc atttttatct aaacagttaa gtgtttttct 5040 caccgttcac agaagcaagt ttctatattt actttctaaa gggggcaatt tcaaaagaat 5100 agtcacttct aaaatttaag atactatacc ttttgatagg ctcataaaca cagggttcct 5160 aattatctat attttacttt aaaatgtttc tattccaaat ttgtgagcag agtttataag 5220 aaagctgaaa ctcaaggctt taaacttttg ggttattttt acacaaaaat atttcagtgc 5280 actcctctag atttgagtag tcatttcctt gtgcatcctt ctaaaataga aaaacaaaaa 5340 tgatatatcc atatatacct aatactaaca catacagata tacatctttt tcactgtgaa 5400 acaagcttga aagctttagg cagtaagaat ttttcagaaa gttagcagag tcagtcaaaa 5460 cattcaaaac ttgaaccatg acatctgtta ctctgtcaat aagagtctat agaagaatca 5520 gggaacttac atactcacta aaatcaacta ctatcacatc acatcaatgg agaaatgaag 5580 aaaaactgta ataggggaca tacaattcac aggatcttca aaagggaaaa tgatcttttt 5640 ttttttttta aattatgaga aactgactag gcagcatttt ttcaaaagca gcttcaaaac 5700 tataacaaag acatttttgg taaccacagc agtatttaaa aaacaaaaat ttaggccggg 5760 cgtggtggct cacgcctata atcccagcac tttgggaggc caaggcaggt ggatcacctg 5820 agtcaggagt tcaagaccag cctgaccaac atggtgatac cccgtctcta ctcaaaatac 5880 aaaacttagc cgggcgtagt ggcggacacc tctataatca cagctactca ggaggctgag 5940 aggcaggaga atcgcttgaa cctgggaggc agaggttgca gtgagccgag atcacgccgt 6000 tgcactccag cctgggaaac agagcgagac tccgtctcaa aaaataaaaa aataaaaaaa 6060 ctatagtgtc cagggtgcac tttaaatgta ttactttctc aactgatatg gaaaaagtta 6120 gcatttaaag acagaagctt ctgtccatgt attaattagt tacctatctc aacaacttaa 6180 tatctgcatg ctttcttacc atttatgaag aacttttata tgtattatct catttggtct 6240 tactgagaaa acagtatttt gcctacaaaa tagacaaaat tcaaagcaga tttatcaaac 6300 tttctagcat ccccaaattt ttaaaacttc gacacaaaac tttacaagca accacagtgg 6360 catgatattt tcagtgataa tcaattcacc taacactaac agagtttcaa aggaccatgt 6420 gctataaatg ctatgaaact gttaaagtag ctatattcat ctttatgcag ttactgttac 6480 atcaacaatg acctaccact gatacaactt gacttacagt tcaagaatct cagtctttgc 6540 aggctaactt aagtacatca accatatgta tttataaagc cgagtgccta aaaattgatc 6600 tatattagaa tcatagtctg taaatccgag gggaaaaaac tacaagaagt ctaaaatttt 6660 ttcaacacac tatacccctt tccaaaatct caactactct atatcctatt tgtattaata 6720 ttatagggat gataacaagg cttaaagccc taaatcatac caactacttt tgtttataac 6780 aattacaaat aattttttaa aatacatgct caacatccca ctcatcaaca caagactaat 6840 tccccttcca aataaaataa ttctaaacag tgctctgtac caagggccag aatccttata 6900 ctatccgcaa tcgcacatct actttgtaca gtcaaagact tcactttcaa gtagcaaaca 6960 ttatttatga atggaatttt taaatggact tactcaaaat ctttctggaa ctttaaggtg 7020 ttaatcctgt tgcttagctg aagctaagca gagctgtaat aagtagcaag accctcaaaa 7080 ttcaaaaatt tcctttatct tgctgtagca cctcctgctg gatagcattt agagatcttc 7140 atgtaagcag aagaagagta tttcagaggc agctccttcc agaagactga ataggaaaaa 7200 ggatggaccc ttcaaagcta aaagaaatag gccccatcca tcacttatac cttctaaaaa 7260 tacaatttag cccaggtagg tgtctttttc atctattact actccagttc cacaaagact 7320 tgcctcagtc caaaatacaa catgcttaaa taaagcctgc aaaattgtct aaaaactaag 7380 ttaaaaagca ttcaatagca cccaagcaaa acactttatt atgggcagcc aagcaatgtc 7440 agtcaaactg taaatactat tatgttacca aaagcaaaag tctgatgtta aaaaaaaaaa 7500 aaaaaaagcc cctggaatat tcgtaacatg ttagccagat gtttgtgttt tgagaacttt 7560 gtgcactatt actatgctct tcacttaagg atagttgtac atctacaaac gttttaagta 7620 cagaaatttt tttataaaca ttagcataac tgtacacaaa atttcctctt tgccatgaaa 7680 agataggtcc tgggatttga aaatgtattt ttcagacatt tttaatgacc ccctaaaata 7740 aactagtttt aagcccacaa caccgattcc ataaacaagt aaagacagaa gaagagaata 7800 agaaggaact taccaaaatt aaaatgaata atagtatttc cagtaaaaat gtagtaacag 7860 tttccaacaa tgctgtaaac caaataaatt gtgaaactta aaaaaggaag gagggggcca 7920 gtcttcaaag accaaaagca aagctgacct atttatttct attgcttaga gtgaacacca 7980 gatgtaaaca aatatcataa acactgaaaa gtacgcttac atggtttagc ctcaatttca 8040 gtacccttac caggccctca ataaagctac agatgttggt gagaactcgc tcaaaaagga 8100 gataattcca gcccctcgcc ttaaagaatc cctatcaagt gaacctgtga aaagacttcc 8160 ttcccagagt gcacaactgc tttaaaaaaa aaaaactttc atcagcccaa attaatctga 8220 ttctaatatt caactatcca ttatttatat ataaatgttc ttccctctct aactttccca 8280 gctcgagcat ctacattcct gacaccgact attagcaaaa atgcacaact ccttccccag 8340 ctatggggca aatctttgaa atctgaaaca cagccacaaa gttcactgtc aaggccaggt 8400 gatgaggccc acacatgccc ggacctt 8427 〈210〉 15 〈211〉 1704 〈212〉 DNA 〈213〉人工序列 <220> 〈223>片段A 〈400〉 15 ggtaccaccc aagctggcta ggtaagcttg ctagcgccac catggtgctg cagacccagg 60 tgttcatctc cctgctgctg tggatctccg gcgcatatgg cgatatcgtg atgattaaac 120 gtacggtggc cgccccctcc gtgttcatct tccccccctc cgacgagcag ctgaagtccg 180 gcaccgcctc cgtggtgtgc ctgctgaata acttctaccc cagagaggcc aaggtgcagt 240 ggaaggtgga caacgccctg cagtccggga actcccagga gagcgtgacc gagcaggaca 300 gcaaggacag cacctacagc ctgagcagca ccctgaccct gagcaaagcc gactacgaga 360 agcacaaggt gtacgcctgc gaggtgaccc accagggcct gagctccccc gtcaccaaga 420 gcttcaacag gggggagtgt taggggcccg tttaaacggg tggcatccct gtgacccctc 480 cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 540 aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 600 gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 660 ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 720 ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac 780 caggctcacc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 840 ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 900 acaggcgtga accactgctc cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 960 tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 1020 tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 1080 tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 1140 gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 1200 agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 1260 cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 1320 agctgattta acaaaaattt aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg 1380 tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 1440 agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 1500 tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 1560 gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 1620 cgaggccgcc tctgcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 1680 aggcttttgc aaaaagctcc cggg 1704 <210> 16 〈211〉 1120 〈212〉 DNA 〈213〉人工序列 <220> 〈223>人IgGl信号+人IgGl恒定区 <400> 16 tgctagcgcc accatgaaac acctgtggtt cttcctcctg ctggtggcag ctcccagatg 60 ggtgctgagc caggtgcaat tgtgcaggcg gttagctcag cctccaccaa gggcccaagc 120 gtcttccccc tggcaccctc ctccaagagc acctctggcg gcacagccgc cctgggctgc 180 ctggtcaagg actacttccc cgaacccgtg accgtgagct ggaactcagg cgccctgacc 240 agcggcgtgc acaccttccc cgctgtcctg cagtcctcag gactctactc cctcagcagc 300 gtggtgaccg tgccctccag cagcttgggc acccagacct acatctgcaa cgtgaatcac 360 aagcccagca acaccaaggt ggacaagaga gttgagccca aatcttgtga caaaactcac 420 acatgcccac cctgcccagc acctgaactc ctggggggac cctcagtctt cctcttcccc 480 ccaaaaccca aggacaccct catgatctcc cggacccctg aggtcacatg cgtggtggtg 540 gacgtgagcc acgaagaccc tgaggtcaag ttcaactggt acgtggacgg cgtggaggtg 600 cataatgcca agacaaagcc ccgggaggag cagtacaaca gcacgtaccg ggtggtcagc 660 gtcctcaccg tcctgcacca ggactggctg aatggcaagg agtacaagtg caaggtctcc 720 aacaaagccc tcccagcccc catcgagaaa accatctcca aagccaaagg ccagccccgg 780 gaaccacagg tgtacaccct gcccccatcc cgggaggaga tgaccaagaa ccaggtcagc 840 ctgacctgcc tggtcaaagg cttctatccc agcgacatcg ccgtggagtg ggagagcaat 900 ggccagcccg agaacaacta caagaccacc cctcccgtgc tggactccga cggctccttc 960 ttcctctaca gcaagctcac cgtggacaag agcaggtggc agcagggcaa cgtcttctca 1020 tgctccgtga tgcatgaggc tctgcacaac cactacaccc agaagagcct ctccctgtct 1080
【权利要求】
1. 多核苷酸,其包含由序列表中SEQ ID NO: 1所示的核苷酸序列。
2. 多核苷酸,其包含由序列表中SEQ ID NO: 2所示的核苷酸序列。
3. 多核苷酸,其包含由序列表中SEQ ID NO: 3所示的核苷酸序列。
4. 多核苷酸,其包含与根据权利要求1至3任一项的多核苷酸的核苷酸序列具有95% 或更高同一性的核苷酸序列并具有启动子活性。
5. 多核苷酸,其包含与根据权利要求1至3任一项的多核苷酸的核苷酸序列具有99% 或更高同一性的核苷酸序列并具有启动子活性。
6. 多核苷酸,其在严格条件下与包含与根据权利要求1至3任一项的多核苷酸的核苷 酸序列互补的核苷酸序列的多核苷酸杂交,并具有启动子活性。
7. 外源基因表达单元,其包含根据权利要求1至6任一项的多核苷酸。
8. 根据权利要求7的外源基因表达单元,其中所述外源基因是编码多聚体蛋白的基 因。
9. 根据权利要求7的外源基因表达单元,其中所述外源基因是编码异源多聚体蛋白的 基因。
10. 根据权利要求7的外源基因表达单元,其中所述外源基因是编码抗体或其功能片 段的基因。
11. 外源基因表达载体,其包含根据权利要求7至10任一项的外源基因表达单元。
12. 外源基因表达载体,其包含根据权利要求7至10任一项的外源基因表达单元和一 种或多种选自下列组A中(1)至(9)所述的多核苷酸: 组A (1) 包含由序列表中SEQ ID NO: 10所示的核苷酸序列的多核苷酸; (2) 包含由序列表中SEQ ID NO: 11所示的核苷酸序列的多核苷酸; (3) 包含由序列表中SEQ ID NO: 12所示的核苷酸序列的多核苷酸; (4) 包含由序列表中SEQ ID NO: 13所示的核苷酸序列的多核苷酸; (5) 包含由序列表中SEQ ID NO: 14所不的核苷酸序列的多核苷酸; (6) 包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少3000个连续 核苷酸的多核苷酸; (7) 包含由序列表中SEQ ID NO: 10至14任一所表示的核苷酸序列的至少2000个连续 核苷酸的多核苷酸; (8) 包含与根据上述(1)至(7)任一项的多核苷酸的核苷酸序列具有95%或更高同一 性的多核苷酸序列并具有增强外源基因表达的活性的多核苷酸;和 (9) 包含与根据上述(1)至(7)任一项的多核苷酸的核苷酸序列具有99%或更高同一 性的核苷酸序列并具有增强外源基因表达的活性的多核苷酸。
13. 转化的细胞,其已经导入根据权利要求11或12的外源基因表达载体。
14. 转化的细胞,其已经导入根据权利要求11或12的外源基因表达载体和元件载体。
15. 根据权利要求13或14的转化的细胞,其中所述细胞是衍生自哺乳动物的培养的细 胞。
16. 根据权利要求15的转化的细胞,其中所述衍生自哺乳动物的培养的细胞是C0S-1 细胞、293细胞或CH0细胞。
17. 生产蛋白的方法,其特征在于包括培养根据权利要求13至16任一项的转化的细胞 并从所得的培养产物中获得衍生自外源基因的蛋白。
18. 根据权利要求1至6任一项的多核苷酸用于在转化细胞中表达外源基因的用途。
19. 根据权利要求11至12的外源基因表达载体用于在转化的细胞中表达外源基因的 用途。
【文档编号】C12N15/09GK104066839SQ201280068236
【公开日】2014年9月24日 申请日期:2012年11月27日 优先权日:2011年11月28日
【发明者】村上贤二 申请人:第一三共株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1