用于将需要的性状迅速赋予生物的方法和系统的制作方法

文档序号:426242阅读:343来源:国知局
专利名称:用于将需要的性状迅速赋予生物的方法和系统的制作方法
技术领域
本发明涉及迅速改变生物的遗传性状的方法,和通过该方法得到的生物和产物。
背景技术
有史以来,人类一直在尝试改变生物的遗传性状。在出现所谓的遗传工程之前,已经尝试用杂交育种等来得到具有需要的性状的生物,或者,已经由辐射随机地造成突变,和已经分离出具有改变的遗传性状的突变生物。
新发展起来的遗传工程更大程度地促进了获取具有改变的遗传性状的生物。遗传工程已经广泛地用于生产遗传地修饰的生物,其中外源基因被导入生物中。但是,仅仅向其中导入了外源基因的生物并不总能获得需要的遗传性状。与自然进化过程不同的操作可能导致意外的结果。因此,政府当局对源自遗传地修饰的生物(GMO)的食物的管理比常规食物更严格。
因此,本领域日益需要符合自然进化地将需要的遗传性状赋予生物的方法和生产这样的生物的方法。
迄今为止,已经出现了下面的已知的诱变方法。
(1)自然突变生物在通常的环境下正常生长时发生的突变称作自然突变。认为自然突变的主要原因是DNA复制的错误和内源诱变物(核苷酸类似物)(Maki,“Shizenheni To Shufukukiko[NaturalMutation And Repair Mechanism]”,Saibo Kogaku[CellEngineering],Vol.13,No.8,pp.663-672,1994)。
(2)用辐射、诱变物等处理通过辐射处理,例如紫外光、X-射线等,或用人工诱变物处理,例如烷化剂等,会损害DNA。这样的损害可能在DNA复制的过程中作为突变固定下来。
(3)使用PCR(聚合酶链反应)在PCR中,由于DNA是进行体外扩增,所以PCR系统缺少一部分胞内突变抑制机制。因此,可以高频率地诱导突变。如果将DNA改组(shuffling)(Stemmer,Nature,Vol.370,pp.389-391,Aug.1994)与PCR结合,则可以避免有害突变的积累,且可以在基因中积累许多有益的突变。
(4)使用突变因子(或增变株)在几乎所有的生物中,通过突变抑制机制来将自然突变的频率维持在相当低的速度。突变抑制机制包括许多涉及10个或更多个基因的阶段。突变在其中破坏了一个或多个基因的生物中高频率地发生。这些生物称作增变株。这些基因称作增变基因(Maki,同上,和Horst等,Trends in Microbiology,Vol.7,No.1,pp.29-36,Jan.1999)。
使用增变株的方法是不一致的方法(Furusawa M.和Doi H.,J.Theor.Biol.157,pp.127-133,1992和Furusawa M.和Doi H.,Genetica 103,pp.333-347,1998;日本专利公开8-163986;日本专利公开8-163987;日本专利公开9-23882;WO00/28015)。在该不一致的方法中,尚未阐明实际上生成的生物(更具体地,高等生物(例如,真核生物)是否能表现出正常的生长曲线。另外,尚未证实该不一致的方法能加速自然进化。
在模仿“高等生物”(例如,真核生物),例如具有二倍体或更多套含有多个复制位点的染色体的真核生物的不平衡突变模型时,可能发生致死的突变。尚不清楚该不一致的方法是否可以用于实际的情形中。
在模仿不平衡突变模型时,将突变随机地导入例如具有较低复制精确度的不连续链中。尚不清楚这样的突变是否有助于进化。
在尝试使用具有导入的增变基因的大肠杆菌(E.coli)突变株的抗药性实验中,已经得到了抗药的菌株。但是,仍没有提示可以任意地改变或控制进化速度的系统。
尚无实验能通过可提供进化速度测量的基因组水平的分析,来确定是否以不均衡的方式实际上插入了突变。考虑到可以容易地实现测序技术本身,可以认为还没有报道鉴别出了突变位点的实例。

发明内容
本发明的发明人已经解决了上述问题,他们发现生物的进化速度不是时间的函数,且可以通过调节生物的倾向于错误的频率来调节,并证实了具有改变的进化速度的真实生物能以与自然进化的生物基本上相同的速度增殖。根据本发明,可以证实错误阈值不会显著影响生物的进化。
在本发明的另一方面,发明人研究了具有不同复制精确度的准种(quasispecies)的错误阈值。发明人证实了无错误的和倾向于错误的聚合酶的共存会增加错误阈值,而不破坏性地遗失遗传信息。发明人还指出复制子(replicores)(复制剂)会影响错误阈值。结果,发明人发现,具有不同复制精确度的准种会降低参与生成各种突变体的选择性进化的遗传成本。
适当的进化需要遗传多样性和有利突变体的稳定繁殖。基因组的精确复制能保证稳定的繁殖,尽管在复制过程中的错误会生成遗传多样性。因此,进化的一个关键是复制精确度所固有的。复制精确度依赖于核苷酸聚合酶。认为胞内聚合酶具有相似的复制精确度。进化模型的大多数研究还已经以相似的复制精确度为基础。但是,已经证实无错误的和倾向于错误的聚合酶在自然产生的生物中共存。本发明因此能与自然相容。
本发明提供了下述内容。
1.调节细胞的遗传性状的转化率的方法,包括下述步骤(a)调节细胞的基因复制的倾向于错误的频率。
2.根据项目1的方法,其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。
3.根据项目2的方法,其中至少约30%的倾向于错误的频率的试剂具有更少的倾向于错误的频率。
4.根据项目1的方法,其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。
5.根据项目1的方法,其中具有更少的倾向于错误的频率的试剂基本上是无错误的。
6.根据项目2的方法,其中该倾向于错误的频率彼此存在至少101的不同。
7.根据项目2的方法,其中该倾向于错误的频率彼此存在至少102的不同。
8.根据项目2的方法,其中该倾向于错误的频率彼此存在至少103的不同。
9.根据项目1的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂,该试剂存在于细胞中。
10.根据项目1的方法,其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。
11.根据项目1的方法,其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。
12.根据项目11的方法,其中该DNA聚合酶具有校对功能。
13.根据项目11的方法,其中该DNA聚合酶包含至少一种选自下述的聚合酶真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
14.根据项目1的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
15.根据项目1的方法,其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。
16.根据项目1的方法,其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。
17.根据项目16的方法,其中通过选自同源重组和使用基因导入或质粒的转化的方法,将DNA聚合酶变体导入细胞中。
18.根据项目1的方法,其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。
19.根据项目18的方法,其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含缺失了其校对活性的突变。
20.根据项目1的方法,其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。
21.根据项目12的方法,其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。
22.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。
23.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。
24.根据项目12的方法,其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。
25.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-6。
26.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-3。
27.根据项目12的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-2。
28.根据项目1的方法,其中该细胞是革兰氏阳性的或真核的细胞。
29.根据项目1的方法,其中该细胞是真核细胞。
30.根据项目1的方法,其中该细胞是单细胞的或多细胞的生物。
31.根据项目1的方法,其中该细胞是动物、植物、真菌或酵母细胞。
32.根据项目1的方法,其中该细胞是哺乳动物细胞。
33.根据项目1的方法,其中在遗传性状转化后,该细胞基本上具有与野生型细胞相同的生长。
34.根据项目1的方法,其中该细胞天然地具有至少2种聚合酶。
35.根据项目1的方法,其中该细胞天然地具有至少2种聚合酶,这至少2种聚合酶具有不同的倾向于错误的频率。
36.根据项目1的方法,其中该细胞具有至少2种聚合酶,这至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
37.根据项目1的方法,其中该细胞具有对环境的抗性,且转化之前的细胞不具有该抗性。
38.根据项目37的方法,其中作为参数的环境包含至少一种选自下述的因素温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
39.根据项目1的方法,其中该细胞包括癌细胞。
40.根据项目1的方法,其中该细胞构成组织。
41.根据项目1的方法,其中该细胞构成生物。
42.根据项目1的方法,还包括在转化细胞的遗传性状后,使细胞分化成组织或生物。
43.根据项目1的方法,其中在预定条件下调节倾向于错误的频率。
44.根据项目43的方法,其中通过调节至少一种选自下述的因素来调节倾向于错误的频率温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
45.生产具有受调节的遗传性状的细胞的方法,包括下述步骤(a)调节细胞的基因复制的倾向于错误的频率;和(b)繁殖得到的细胞。
46.根据项目45的方法,还包括筛选具有需要的性状的繁殖细胞。
47.根据项目45的方法,其中存在至少2种在基因复制中起作用的倾向于错误的频率的试剂。
48.根据项目45的方法,其中至少约30%的倾向于错误的频率的试剂具有更少的倾向于错误的频率。
49.根据项目45的方法,其中在基因复制中起作用的试剂具有不同的倾向于错误的频率。
50.根据项目45的方法,其中具有更低的倾向于错误的频率的试剂基本上是无错误的。
51.根据项目45的方法,其中该倾向于错误的频率彼此存在至少101的不同。
52.根据项目45的方法,其中该倾向于错误的频率彼此存在至少102的不同。
53.根据项目45的方法,其中该倾向于错误的频率彼此存在至少103的不同。
54.根据项目45的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的试剂的倾向于错误的频率能去除异常碱基的修复试剂和能修复错配的碱基对的修复试剂,该试剂存在于细胞中。
55.根据项目45的方法,其中调节倾向于错误的频率的步骤包含提供细胞中的双链基因组DNA的一条链和另一条链之间的错误数目的差异。
56.根据项目45的方法,其中调节倾向于错误的频率的步骤包含调节细胞的DNA聚合酶的倾向于错误的频率。
57.根据项目56的方法,其中该DNA聚合酶具有校对功能。
58.根据项目56的方法,其中该DNA聚合酶包含至少一种选自下述的聚合酶真核细胞的DNA聚合酶α、DNA聚合酶β、DNA聚合酶γ、DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
59.根据项目45的方法,其中调节倾向于错误的频率的步骤包含调节至少一种选自下述的聚合酶的校对活性真核细胞的DNA聚合酶δ和DNA聚合酶ε和与其对应的DNA聚合酶。
60.根据项目45的方法,其中调节倾向于错误的频率包含调节原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的校对活性。
61.根据项目45的方法,其中调节倾向于错误的频率包含将DNA聚合酶变体导入细胞中。
62.根据项目61的方法,其中通过选自同源重组和使用基因导入或质粒的转化的方法,将DNA聚合酶变体导入细胞中。
63.根据项目45的方法,其中调节倾向于错误的频率包含导入原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体。
64.根据项目63的方法,其中该原核细胞的DNA聚合酶δ或与其对应的DNA聚合酶的变体包含仅仅缺失了其校对活性的突变。
65.根据项45的方法,其中调节倾向于错误的频率的步骤包含将倾向于错误的频率提高到高于野生型细胞的频率。
66.根据项目57的方法,其中该DNA聚合酶的校对功能低于野生型DNA聚合酶。
67.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,至少1个错配的碱基的数目比野生型DNA聚合酶至少大1。
68.根据项57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基。
69.根据项目57的方法,其中该DNA聚合酶的校对功能能提供至少2个错配的碱基。
70.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-6。
71.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-3。
72.根据项目57的方法,其中该DNA聚合酶的校对功能能在碱基序列中提供至少1个错配的碱基,其比率为10-2。
73.根据项目45的方法,其中该细胞是革兰氏阳性的或真核的细胞。
74.根据项目45的方法,其中该细胞是真核细胞。
75.根据项目45的方法,其中该细胞是单细胞的或多细胞的生物。
76.根据项目45的方法,其中该细胞是动物、植物、真菌或酵母细胞。
77.根据项目45的方法,其中该细胞是哺乳动物细胞。
78.根据项目45的方法,其中在遗传性状转化后,该细胞基本上具有与野生型细胞相同的生长。
79.根据项目45的方法,其中该细胞天然地具有至少2种聚合酶。
80.根据项目45的方法,其中该细胞天然地具有至少2种聚合酶,这至少2种聚合酶具有不同的倾向于错误的频率。
81.根据项目45的方法,其中该细胞具有至少2种聚合酶,这至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
82.根据项目45的方法,其中该细胞具有对环境的抗性,且转化之前的细胞不具有该抗性。
83.根据项目82的方法,其中作为参数的环境包含至少一种选自下述的因素温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
84.根据项目45的方法,其中该细胞包括癌细胞。
85.根据项目45的方法,其中该细胞构成组织。
86.根据项目45的方法,其中该细胞构成生物。
87.根据项目45的方法,还包括在转化细胞的遗传性状后,使细胞分化成组织或生物。
88.根据项目45的方法,其中在预定条件下调节倾向于错误的频率。
89.根据项目88的方法,其中通过调节至少一种选自下述的因素来调节倾向于错误的频率温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,该细胞以外的细胞,化学试剂,抗生素,天然物质,心理应激和机体应激,或其组合。
90.生产具有受调节的遗传性状的生物的方法,包括下述步骤(a)调节生物的基因复制的倾向于错误的频率;和(b)繁殖得到的生物。
91.通过根据项目90的方法生产的具有受调节的遗传性状的细胞。
92.根据项目91的细胞,其中该细胞基本上具有与野生型细胞相同的生长。
93.通过根据项目90的方法生产的具有受调节的遗传性状的生物。
94.根据项目93的生物,其中该生物基本上具有与野生型生物相同的生长。
95.生产能编码具有受调节的遗传性状的基因的核酸分子的方法,包括下述步骤(a)改变生物的基因复制的倾向于错误的频率;(b)繁殖得到的生物;(c)鉴别生物中的突变;和(d)生产能编码具有鉴别出的突变的基因的核酸分子。
96.通过根据项目95的方法生产出的核酸分子。
97.生产由具有受调节的遗传性状的基因编码的多肽的方法,包括下述步骤(a)改变生物的基因复制的倾向于错误的频率;(b)繁殖得到的生物;(c)鉴别生物中的突变;和(d)生产由具有鉴别出的突变的基因编码的多肽。
98.通过根据项目97的方法生产出的多肽。
99.生产具有受调节的遗传性状的生物的代谢物的方法,包括下述步骤(a)改变生物的基因复制的倾向于错误的频率;(b)繁殖得到的生物;(c)鉴别生物中的突变;和(d)生产具有鉴别出的突变的代谢物。
100.通过根据项目99的方法生产出的代谢物。
101.用于调节生物的遗传性状的核酸分子,包含能编码具有受调节的倾向于错误的频率的DNA聚合酶的核酸序列。
102.根据项目101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε,或革兰氏阳性的细菌的与其对应的DNA聚合酶。
103.根据项目101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ或ε,或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体,该变体包含仅仅缺失了其校对活性的突变。
104.根据项目101的核酸分子,其中该DNA聚合酶是真核生物的DNA聚合酶δ,或革兰氏阳性的细菌的与其对应的DNA聚合酶的变体,该变体包含仅仅缺失了其校对活性的突变。
105.载体,其包含根据项目101的核酸分子。
106.细胞,其包含根据项目101的核酸分子。
107.根据项目106的细胞,其中该细胞是真核细胞。
108.根据项目107的细胞,其中该真核细胞选自植物、动物和酵母。
109.根据项目106的细胞,其中该细胞是革兰氏阳性的细菌细胞。
110.根据项目106的细胞,其中该细胞用于调节遗传性状的转化率。
111.生物,其包含根据项目101的核酸分子。
112.通过根据项目106的细胞或其一部分生产的产物物质。
113.核酸分子,其包含在根据项目106的细胞或其一部分中。
114.根据项目113的核酸分子,其能编码涉及受调节的遗传性状的基因。
115.测试药物的方法,包括下述步骤使用根据项目106的细胞作为疾病模型,测试药物的效果;使用野生型细胞作为对照,测试药物的效果;和对比疾病模型和对照。
116.测试药物的方法,包括下述步骤使用根据项目111的生物作为疾病模型,测试药物的效果;使用野生型生物作为对照,测试药物的效果;和对比疾病模型和对照。
117.用于调节生物的遗传性状的转化率的至少2种聚合酶的组,其中该聚合酶具有不同的倾向于错误的频率。
118.根据项目117的组,其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
119.根据项目117的组,其中该聚合酶的组源自相同的物种。
120.用于生产具有受调节的遗传性状的生物的至少2种聚合酶的组,其中该聚合酶具有不同的倾向于错误的频率。
121.根据项目120的组,其中至少2种聚合酶中的一种参与后随链的倾向于错误的频率,且至少2种聚合酶中的另一种参与前导链的倾向于错误的频率。
122.根据项目121的组,其中该聚合酶的组源自相同的生物物种。
123.至少2种聚合酶在调节生物的遗传性状的转化率中的用途,其中该聚合酶具有不同的倾向于错误的频率。
124.至少2种聚合酶在生产具有受调节的遗传性状的生物中的用途,其中聚合酶具有不同的倾向于错误的频率。
因而,本文所述的发明使得提供符合自然进化地将需要的遗传性状赋予生物的方法的优点成为可能。
在阅读和理解了下面参考附图的详细描述后,本领域的技术人员能明白本发明的这些和其它的优点。
附图简述

图1表明,本发明实施例1的突变体和其野生型具有基本上相同的生长曲线。
图2显示了被赋予了高温抗性的本发明的实施例1。
图3A显示了被赋予了高温抗性的本发明的实施例1的照片。从po13突变株(缺少外切核酸酶的DNA聚合酶δ)分离出了能在高温生长的突变株。标记*指示亲本株(AMY128-1),且7个其它的菌落是高温抗性株。
图3B显示了被赋予了高温抗性的本发明的实施例1的另一张照片。从po12突变株(缺少外切核酸酶的DNA聚合酶ε)分离出了能在高温生长的突变株。标记*指示亲本株(AMY2-6),且7个其它的菌落是高温抗性株。
图4A显示了被赋予了高温抗性的本发明的实施例1的照片。箭标指示死亡的、且具有泡的细胞。对高温抗性株1和2进行单独的实验。在亲本株中,没有细胞能在41℃存活。通过本发明的方法得到的高温抗性株可以在41℃存活。
图4B显示了被赋予了高温抗性的本发明的实施例1的另一张照片。从啤酒糖酵母(S.cerevisiae)的po12突变株(缺少外切核酸酶活性的DNA聚合酶ε)中,分离出了能在被认为酵母不能存活的41℃高温生长的突变株。顶部显示了亲本株(AMY2-6),且其它的7个菌落是高温抗性的突变株。
图5显示了具有类似的复制精确度和不同的复制精确度的准种的实例。
图6显示了错误的突然大变动(catastrophe)。
图7显示了在各种数目的复制剂时,作为无错误的聚合酶的相对浓度的函数的错误阈值。
图8显示了基于大肠杆菌的参数的可允许的错误率的实例。
图9示意性地显示了要导入转基因小鼠中的载体。
图10显示了用于确认外源基因的PCR方法。从左依次是有mPGK2Tg,无mPGK2Tg,有Fthl17Tg,mPGK2Tg载体,和仅仅pBluescript(对照)(对于每个,都是转基因小鼠#1),和无#2小鼠Tg,有#2小鼠Tg,#2Tg载体,和pBluescript(对于每个,都是转基因小鼠#2)。标记显示在右端。
图11显示了Cre重组酶在小鼠睾丸中的表达。a显示了mPGK2,b显示了Fthl17,且c显示了对照。线条代表50μm。
图12显示了mPGK2启动子的表达区。
图13显示了Fthl17启动子的表达区。
图14示意性地显示了靶向载体。
图15示意性地显示了组织特异性的重组反应。
图16示意性地显示了使用愈伤组织的筛选方法。
图17示意性地显示了在实施例8的ES细胞的实验中使用的载体。
图18示意性地显示了使用Cre重组酶的重组(靶向)载体。
(序列的描述)SEQ ID NO.1酵母DNA聚合酶δ核酸序列SEQ ID NO.2酵母DNA聚合酶δ氨基酸序列SEQ ID NO.3酵母DNA聚合酶ε核酸序列SEQ ID NO.4酵母DNA聚合酶ε氨基酸序列SEQ ID NO.5DnaQ部分序列(大肠杆菌)SEQ ID NO.6DnaQ部分序列(流感嗜血菌(Haemophilusinfluenzae))SEQ ID NO.7DnaQ部分序列(鼠伤寒沙门氏菌(Salmonellatyphimurium))SEQ ID NO.8DnaQ部分序列(霍乱弧菌(Vibrio cholerae))SEQ ID NO.9DnaQ部分序列(铜绿假单胞菌(Pseudomonasaeruginosa))SEQ ID NO.10DnaQ部分序列(脑膜炎奈瑟氏球菌(Neisseriameningitides))SEQ ID NO.11DnaQ部分序列(砂眼衣原体(Chlamydiatrachomatis))SEQ ID NO.12DnaQ部分序列(天蓝色链霉菌(streptomycescoelicolor))SEQ ID NO.13DnaQ部分序列(弗氏志贺氏菌(Shigellaflexneri)2a菌株301)SEQ ID NO.14PolC部分序列(金黄色葡萄球菌(Staphylococcusaureus))SEQ ID NO.15PolC部分序列(枯草芽孢杆菌(Bacillussubtilis))SEQ ID NO.16PolC部分序列(肺枝原体(Mycoplasmapulmonis))SEQ ID NO.17PolC部分序列(生殖道枝原体(Mycoplasmagenitalium))SEQ ID NO.18PolC部分序列(肺炎枝原体(Mycoplasmapneumoniae))SEQ ID NO.19Pol III部分序列(啤酒糖酵母)SEQ ID NO.20Pol II部分序列(啤酒糖酵母)SEQ ID NO.21Polδ部分序列(小鼠)SEQ ID NO.22Polε部分序列(小鼠)SEQ ID NO.23Polδ部分序列(人)SEQ ID NO.24Polε部分序列(人)SEQ ID NO.25Polδ部分序列(稻)SEQ ID NO.26Polδ部分序列(拟南芥(Arabidopsis thaliana))SEQ ID NO.27Polε部分序列(拟南芥)SEQ ID NO.28Polδ部分序列(大鼠)SEQ ID NO.29Polδ部分序列(牛)SEQ ID NO.30Polδ部分序列(大豆)SEQ ID NO.31Polδ部分序列(果蝇)SEQ ID NO.32Polε部分序列(果蝇)SEQ ID NO.33Polδ酵母改变的核酸序列SEQ ID NO.34Polδ酵母改变的氨基酸序列SEQ ID NO.35Polε酵母改变的核酸序列SEQ ID NO.36Polε酵母改变的氨基酸序列SEQ ID NO.37Polδ正向引物
SEQ ID NO.38Polδ反向引物SEQ ID NO.39Polε正向引物SEQ ID NO.40Polε反向引物SEQ ID NO.41大肠杆菌DnaQ核酸序列SEQ ID NO.42大肠杆菌DnaQ氨基酸序列SEQ ID NO.43枯草芽孢杆菌PolC核酸序列SEQ ID NO.44枯草芽孢杆菌PolC氨基酸序列SEQ ID NO.45拟南芥Polδ氨基酸序列SEQ ID NO.46拟南芥Polε氨基酸序列SEQ ID NO.47稻Polδ核酸序列SEQ ID NO.48稻Polδ氨基酸序列SEQ ID NO.49大豆Polδ核酸序列SEQ ID NO.50大豆Polδ氨基酸序列SEQ ID NO.51人Polδ核酸序列SEQ ID NO.52人Polδ氨基酸序列SEQ ID NO.53人Polε核酸序列SEQ ID NO.54人Polε氨基酸序列SEQ ID NO.55小鼠Polδ核酸序列SEQ ID NO.56小鼠Polδ氨基酸序列SEQ ID NO.57小鼠Polε核酸序列SEQ ID NO.58小鼠Polε氨基酸序列SEQ ID NO.59大鼠Polδ核酸序列SEQ ID NO.60大鼠Polδ氨基酸序列SEQ ID NO.61牛Polδ核酸序列SEQ ID NO.62牛Polδ氨基酸序列SEQ ID NO.63果蝇Polδ核酸序列SEQ ID NO.64果蝇Polδ氨基酸序列SEQ ID NO.65果蝇Polε核酸序列SEQ ID NO.66果蝇Polε氨基酸序列SEQ ID NO.67Pold1基因的5′末端引物SpeI-5′Pold1SEQ ID NO.68Pold1基因的3′末端引物EcoRI-3′Pold1SEQ ID NO.69用于将突变导入Pold1基因的引物序列(实施例4)
SEQ ID NO.70Pold1基因的突变的cDNA序列(实施例4)SEQ ID NO.71mPGK2的5′mPGK2-sacII引物SEQ ID NO.72mPGK2的3′mPGK2-SpeI引物SEQ ID NO.73Fthl17的5′Fthl17-sacII引物SEQ ID NO.74Fthl17的3′Fthl17-SpeI引物SEQ ID NO.75转基因小鼠#1的Cre-F引物SEQ ID NO.76转基因小鼠#1的Cre-R引物SEQ ID NO.77转基因小鼠#2的Neo-F引物SEQ ID NO.78转基因小鼠#2的Neo-R引物SEQ ID NO.79用于在实施例4中确认mRNA的表达的Neo-F引物SEQ ID NO.80用于在实施例4中确认mRNA的表达的Neo--R引物SEQ ID NO.81Fthl17k游的约5.7kbp序列SEQ ID NO.82用于扩增源自拟南芥的Polδ的Xba1-42120-FSEQ ID NO.83用于扩增源自拟南芥的Polδ的2g42120-Sacl-RSEQ ID NO.84用于扩增突变体polδ基因Polδ(D316A)的2g42120-D316A-FSEQ ID NO.85用于扩增突变体polδ基因Polδ(D316A)的2g42120RSEQ ID NO.86含有源自小鼠睾丸的Kozak序列的Pold1基因(核酸序列)SEQ ID NO.87含有源自小鼠睾丸的Kozak序列的Pold1基因(氨基酸序列)SEQ ID NO.88小鼠Polδ基因突变体(D400A)的核酸序列SEQ ID NO.89小鼠Polδ基因突变体(D400A)的氨基酸序列SEQ ID NO.90Polδ(Atlg42120)的核酸序列SEQ ID NO.91Polδ(Atlg42120)的氨基酸序列SEQ ID NO.92突变体polδ基因Polδ(D316A)(核酸序列)SEQ ID NO.93突变体polδ基因Polδ(D316A)(氨基酸序列)SEQ ID NO.94455-bp mPGK2启动子片段SEQ ID NO.95Fthl17基因上游的5725-bp DNA片段实施本发明的最佳模式(发明详述)在下文中,将参考附图,以解释性的实例描述本发明。
应当理解,在本说明书中,单数形式的“一个(a)”、“一种(an)”和“该(the)”包括复数的指示物,除非上下文另有清楚的说明。还应当理解,如本文所用的术语具有本领域一般使用的定义,除非另有说明。
(术语)在本说明书和下面的权利要求书中,将提及许多术语,它们应当定义为具有下述的含义术语“生物”在这里使用其在本领域最广泛的含义,指能实现生命过程的机体,其具有各种性质,例如,代表性地,细胞结构,增殖(自我繁殖),生长,调节,代谢,修复能力,等。一般地,生物具有基本性质,例如由核酸控制的遗传和其中涉及蛋白控制的代谢的增殖。生物包括病毒,原核生物,真核生物(例如,单细胞生物(例如,酵母,等)和多细胞生物(例如,植物,动物,等)),等。应当明白,本发明的方法可以应用于任何生物,包括高等生物,例如革兰氏阳性的细菌,真核生物,等。
术语“真核生物”在这里使用其普通含义,指具有带有核膜的明显核结构的生物。真核生物的实例包括但不限于单细胞生物(例如,酵母,等),植物(例如,稻,小麦,玉米,大豆,等),动物(例如,小鼠,大鼠,牛,马,猪,猴,等),昆虫(例如,蝇,蚕,等),等。酵母、线虫、果蝇、蚕、稻、小麦、大豆、玉米、拟南芥、人、小鼠、大鼠、牛、马、猪、蛙、鱼(例如,斑马鱼,等)可以在这里用作模型,但是用途不限于此。
如本文所使用的,术语“原核生物”在这里使用其普通含义,指由不具有明显的核结构的细胞构成的生物。原核生物的实例包括革兰氏阴性的细菌(例如,大肠杆菌,沙门氏菌属(Salmonella),等),革兰氏阳性的细菌(例如,枯草芽孢杆菌,放线菌,葡萄球菌属(Staphylococcus),等),蓝细菌,氢细菌,等。代表性地,除了大肠杆菌以外,革兰氏阳性的细菌可以用在这里,但是用途不限于此。
术语“单细胞生物”在这里使用其普通含义,指由单个细胞组成的生物。单细胞生物包括真核生物和原核生物。单细胞生物的实例包括但不限于细菌(例如,大肠杆菌,枯草芽孢杆菌,等),酵母,蓝细菌,等。
如本文所使用的,术语“多细胞生物”指由多个细胞(一般地,多个不同类型的细胞)组成的单个生物。由于多细胞生物是由不同类型的细胞组成的,所以维持该生物的生命需要高水平的与单细胞生物不同的稳态机制。大多数真核生物是多细胞生物。多细胞生物包括动物,植物,昆虫,等。应当指出,本发明可以令人惊奇地应用于多细胞生物。
术语“动物”在这里使用其最广泛的含义,指脊椎动物和无脊椎动物(例如,节肢动物)。动物的实例包括但不限于任何哺乳纲(Mammalia),鸟纲(Aves),爬行纲(Reptilia),两栖纲(Amphibia),鱼纲(Pisces),昆虫纲(Insecta),蠕虫纲(Vermes),等。优选地,动物可以是但不限于脊椎动物(例如,盲鳗目(Myxiniformes),七鳃鳗目(Petronyzoniformes),软骨鱼纲(Chondrichthyes),硬骨鱼纲(Osteichthyes),两栖动物,爬行动物,鸟类,哺乳动物,等)。在特定的实施方案中,动物可以是但不限于哺乳动物(例如,单孔目(monotremata),有袋目(marsupialia),无齿类动物(edentate),皮翼目(dermoptera),翼手目(chiroptera),食肉动物,食虫动物,长鼻目(proboscidae),奇蹄目(perissodactyla),偶蹄目(artiodactyla),管齿目(tubulidentata),鳞甲目(pholidota),海牛目(sirenia),鲸类动物,灵长目(primates),啮齿目(rodentia),兔形目(lagomorpha),等)。更优选地,动物可以是但不限于灵长目(例如,黑猩猩,日本猴,人)或任何可以用作模型动物的物种(例如,奇蹄目,偶蹄目,啮齿目(小鼠,等),兔形目,等)。本发明首次证实了本发明的方法可以应用于任何生物。应当明白,任何生物都可以用于本发明。
如本文所使用的,术语“植物”指属于植物界(Plantae)的特征如下的任何生物叶绿素,硬细胞壁,存在丰富的永久的未成熟组织,和没有移动能力。代表性地,术语“植物”指能形成细胞壁和通过叶绿素进行同化的开花植物。术语“植物”指任何单子叶植物和双子叶植物。优选的植物包括但不限于有用的植物,例如稻科的单子叶植物(例如,小麦,玉米,稻,大麦,高粱,等)。优选的植物的实例包括烟草,青椒,茄子,瓜,番茄,甘薯,卷心菜,韭菜,椰菜,胡萝卜,黄瓜,柑桔,大白菜,莴苣,桃子,马铃薯,和苹果。优选的植物不限于农作物,还包括开花植物,树,草坪,野草,等。除非另有说明,术语“植物”指任意的植物体,植物器官,植物组织,植物细胞和种子。植物器官的实例包括根、叶、茎、花等。植物细胞的实例包括愈伤组织、悬浮培养的细胞等。本发明首次证实了本发明的方法可以应用于任何生物。应当明白,任何生物都可以用于本发明。
在特定的实施方案中,可以用于本发明中的植物种类的实例包括但不限于下述科的植物茄科(Solanaceae),禾本科(Poaceae),十字花科(Brassicaceae),蔷薇科(Rosaceae),豆科(Leguminosae),葫芦科(Cucurbitaceae),唇形科(Lamiaceae),百合科(Liliaceae),藜科(Chenopodiaceae)和伞形科(Umbelliferae)。
如本文所使用的,术语“遗传性状”也称作基因型,指基因控制的生物的形态要素。遗传性状的实例包括但不限于对环境参数的抗性,所述参数例如,温度,湿度,pH,盐浓度,营养物,金属,气体,有机溶剂,压力,大气压力,粘度,流速,光强度,光波长,电磁波,辐射,重力,张力,声波,其它生物,化学试剂,抗生素,天然物质,心理应激,机体应激,等。
如本文所使用的,术语“基因”指具有预定长度的序列的细胞中存在的核酸。基因可以定义或不定义遗传性状。如本文所使用的,术语“基因”一般指存在于基因组中的序列,且可以指染色体外的序列、线粒体中的序列等。基因一般排列在染色体上的特定序列中。能定义蛋白的初级结构的基因称作结构基因。能调节结构基因的表达的基因称作调节基因(例如,启动子)。除非另有说明,本文中的基因包括结构基因和调节基因。因此,例如,术语“DNA聚合酶基因”一般指DNA聚合酶的结构基因和它的转录和/或翻译调节序列(例如,启动子)。在本发明中,应当明白,转录和/或翻译的调节序列以及结构基因可以用作本发明靶向的基因。如本文所使用的,“基因”可以指“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”和/或“蛋白”、“多肽”、“寡肽”和“肽”。如本文所使用的,“基因产物”包括“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”和/或由基因表达的“蛋白”、“多肽”、“寡肽”和“肽”。本领域的技术人员根据上下文能够明白基因产物是什么。
如本文所使用的,与基因有关的术语“复制”是指遗传材料、DNA或RNA再生它自身的拷贝,其中亲本核酸链(DNA或RNA)用作形成新的具有与亲本核酸相同的结构和功能的核酸分子(分别是DNA或RNA)的模板。在真核细胞中,会形成包含复制酶(DNA聚合酶α)的复制起始复合物,以在双链DNA分子的许多复制起点处启动复制,且复制反应从复制起点向相反的反向进行。根据细胞周期控制复制的起始。在酵母中,将自主复制序列视作复制起点。在原核细胞(例如大肠杆菌等)中,复制起点(ori)存在于基因组的双链环状DNA分子上。复制起始复合物在ori形成,且反应从ori向相反的反向进行。复制起始复合物具有包含10个或更多个蛋白元件(包括复制酶(DNA聚合酶III))的复杂结构。在复制反应中,部分地重绕双链DNA的螺旋结构;合成短的DNA引物;从引物的3′-OH基延伸新的DNA链;在互补链模板上合成冈崎片段;连接冈崎片段;进行校对,以比较新复制的链和模板链;等。因而,通过许多反应步骤进行复制反应。
储存着生物的遗传信息的基因组DNA的复制机制详细地描述在例如Kornberg A.和Baker T.,“DNA Replication”,New York,Freeman,1992中。一般地,将能使用DNA的一条链作为模板合成互补链、形成双链DNA的酶称作DNA聚合酶(DNA复制酶)。DNA复制需要至少2种DNA聚合酶。这是因为,一般地,同时合成前导链和后随链。从DNA上的称作复制起点(ori)的预定位置处开始DNA复制。例如,细菌在它们的环状基因组DNA上具有至少一个双向复制起点。因而,一般地,在其复制过程中,需要4种DNA聚合酶同时作用于一个基因组DNA上。在本发明中,优选地,可以仅仅在前导链和后随链中的一条上有利地调节复制错误,或者,这2条链之间的复制错误的频率可以有利地存在差异。
如本文所使用的,术语“复制错误”指在基因(DNA,等)复制过程中导入错误的核苷酸。一般地,复制错误的频率低至108至1012配对中出现一个。复制错误频率较低的原因是,复制过程中的核苷酸添加是由模板DNA和导入的核苷酸之间的互补碱基配对决定的;酶(例如DNA聚合酶δ、ε等)的3′→5′外切核酸酶活性(校对功能)能识别和去除错配的与模板不互补的核苷酸;等。因此,在本发明中,通过破坏特定的碱基对的形成、校对功能等,可以调节复制中的倾向于错误的频率。
如本文所使用的,与遗传性状有关的术语“转化率”指在原始生物繁殖或分裂后,原始生物和其祖先之间的遗传性状之间发生差异的比率。这样的转化率可以例如由在每次分裂或每代中具有遗传性状变化的生物的数目代表。这样的遗传性状的转化在本文中可替换地称作“进化”。
如本文所使用的,与遗传性状的转化率有关的术语“调节”是指,通过人工操作,而不是通过自然产生的因素,改变遗传性状的转化率。因此,调节遗传性状的转化率包括减慢和加速遗传性状的转化率。通过减慢生物的遗传性状的转化率,该生物基本上不改变遗传性状。换言之,通过减慢该生物的遗传性状的转化率,使该生物的进化速度变慢。相反地,通过加速生物的遗传性状的转化率,该生物比正常水平更频繁地改变遗传性状。换言之,通过加速生物的遗传性状的转化率,使该生物的进化速度变快。
如本文所使用的,术语“无错误的”指在基因(DNA,等)的复制中存在较少的或基本上没有错误的性质。校对酶(例如,DNA聚合酶δ和ε,等)的校对功能的精确度会影响无错误的水平。
如本文所使用的,术语“倾向于错误的”指在基因(DNA,等)的复制中可能发生错误的性质(即,可能发生复制错误)。校对酶(例如,DNA聚合酶δ和ε,等)的校对功能的精确度会影响倾向于错误的水平。
倾向于错误的状态和无错误的状态可以绝对地分开(即,可以用倾向于错误的频率的水平等决定),或者,可以相对地分开(即,当在基因复制中起作用的2个或更多个试剂是分开的时,将具有更高的倾向于错误的频率的试剂归类为倾向于错误的基因,而将具有更低的倾向于错误的频率的试剂归类为无错误的试剂)。
如本文所使用的,术语“倾向于错误的频率”指倾向于错误的性质的水平。倾向于错误的频率可以由例如基因序列中的突变的绝对数目(突变本身的数目)或基因序列中的突变的相对数目(突变的数目与全长的比率)来表示。或者,当提及特定的生物或酶时,倾向于错误的频率可以由每次繁殖或分裂时基因序列中的突变的绝对或相对数目来表示。除非另有说明,倾向于错误的频率是由一次复制过程中基因序列中的错误数目来表示的。倾向于错误的频率在本文中可以称作“精确度”,作为相反的量度。一致的倾向于错误的频率是指,当提及在许多基因的复制中起作用的试剂(聚合酶,等)时,它们的倾向于错误的频率基本上彼此相等。相反地,不同的倾向于错误的频率是指,在许多基因的复制中起作用的许多试剂(聚合酶,等)中存在显著的倾向于错误的频率的差异。
如本文所使用的,与倾向于错误的频率有关的术语“调节”是指,改变倾向于错误的频率。这样调节倾向于错误的频率包括增加和减少倾向于错误的频率。调节倾向于错误的频率的方法的实例包括但不限于修饰具有校对功能的DNA聚合酶,插入能抑制或阻抑复制过程中的聚合或延伸反应的试剂,抑制或阻抑能促进这些反应的因素,缺失一个或多个碱基,缺失双链体DNA修复酶,修饰能去除异常碱基的修复试剂,修饰能修复错配的碱基对的修复试剂,降低复制本身的精确度,等。可以在双链DNA的2条链或1条链上调节倾向于错误的频率。优选地,可以有利地在1条链上调节倾向于错误的频率。这是因为,会减少不利的突变发生。
如本文所使用的,术语“DNA聚合酶”或“Po1”指能从4个脱氧核糖核苷5′-三磷酸释放出焦磷酸、从而聚合DNA的酶。DNA聚合酶反应需要模板DNA、引物分子、Mg2+等。将互补的核苷酸依次添加到引物的3′-OH末端,以延伸分子链。
已知大肠杆菌具有至少3种DNA聚合酶I、II和III。DNA聚合酶I参与修复受损的DNA、基因重组和DNA复制。认为DNA聚合酶II和III具有辅助功能。这些酶的每种都具有包含几个蛋白的亚基结构,且根据结构分成核心酶或全酶。核心酶由α、ε和θ亚基组成。全酶除了α、ε和θ亚基以外,包含τ、γ、δ和β组分。已知真核细胞具有许多DNA聚合酶。在高等生物中,存在许多DNA聚合酶α、β、γ、δ、ε等。在动物中,存在已知的聚合酶DNA聚合酶α,它参与核DNA的复制,并在细胞生长期的DNA复制中起作用;DNA聚合酶β,它参与核中的DNA修复,并在生长期和静止期的受损DNA的修复中起作用,等;DNA聚合酶γ,它参与复制和修复线粒体DNA,且具有外切核酸酶活性);DNA聚合酶δ,它参与DNA延长,且具有外切核酸酶活性;DNA聚合酶ε,它参与复制后随链之间的缺口,且具有外切核酸酶活性;等。
在革兰氏阳性的细菌、革兰氏阴性的细菌、真核生物等中具有校对功能的DNA聚合酶中,认为具有ExoI基序的氨基酸序列在3′→5′外切核酸酶活性中心起作用,且会影响校对功能的精确度。
SEQ ID NO.5DnaQ8-QIVLDTETTGMN-19(大肠杆菌);SEQ ID NO.6DnaQ7-QIVLDTETTGMN-18(流感嗜血菌);SEQ ID NO.7DnaQ8-QIVLDTETTGMN-19(鼠伤寒沙门氏菌);SEQ ID NO.8DnaQ12-IVVLDTETTGMN-23(霍乱弧菌);SEQ ID NO.9DnaQ3-SVVLDTETTGMP-14(铜绿假单胞菌);SEQ ID NO.10DnaQ5-QI ILDTETTGLY-16(脑膜炎奈瑟氏球菌);SEQ ID NO.11DnaQ9-FVCLDCETTGLD-20(砂眼衣原体);SEQ ID NO.12DnaQ9-LAAFDTETTGVD-20(天蓝色链霉菌);SEQ ID NO.13dnaQ11-QIVLDTETTGMN-22(弗氏志贺氏菌2a菌株301);SEQ ID NO.14PolC420-YVVFDVETTGLS-431(金黄色葡萄球菌)SEQ ID NO.15PolC421-YVVFDVETTGLS-432(枯草芽孢杆菌);SEQ ID NO.16PolC404-YVVYDIETTGLS-415(肺枝原体);SEQ ID NO.17PolC416-FVIFDIETTGLH-427(生殖道枝原体);SEQ ID NO.18PolC408-FVIFDIETTGLH-419(肺炎枝原体);SEQ ID NO.19PolIII317-IMSFDIECAGRI-328(啤酒糖酵母);SEQ ID NO.20PolII286-VMAFDIETTKPP-297(啤酒糖酵母);SEQ ID NO.21Polδ310-VLSFDIECAGRK-321(小鼠);SEQ ID NO.22Polε271-VLAFDIETTKLP-282(小鼠);SEQ ID NO.23Polδ312-VLSFDIECAGRK-323(人);SEQ ID NO.24Polε271-VLAFDIETTKLP-282(人);SEQ ID NO.25Polδ316-ILSFDIECAGRK-327(稻);SEQ ID NO.26Polδ306-VLSFDIECAGRK-317(拟南芥);SEQ ID NO.27Polε235-VCAFDIETVKLP-246(拟南芥);
SEQ ID NO.28Polδ308-VLSFDIECAGRK-319(大鼠);SEQ ID NO.29Polδ311-VLSFDIECAGRK-322(牛);SEQ ID NO.30Polδ273-ILSFDIECAGRK-284(大豆);SEQ ID NO.31Polδ296-ILSFDIECAGRK-307(果蝇);和SEQ ID NO.32Polε269-VLAFDIETTKLP-280(果蝇)。
显然,具有校对功能的DNA聚合酶具有相当保守的天冬氨酸(例如,在人DNA聚合酶δ的位置316)和谷氨酸(例如,在人DNA聚合酶δ的位置318)。含有这样的天冬氨酸和谷氨酸的区域在本文中可以视作校对功能的活性部位。
在革兰氏阴性细菌(例如大肠杆菌)中,存在2种DNA聚合酶蛋白,即具有外切核酸酶活性的分子和具有DNA合成活性的分子。因此,通过调节外切核酸酶活性,可以调节校对功能。
但是,在革兰氏阳性细菌(例如,枯草芽孢杆菌,等)和真核生物(例如,酵母,动物,植物,等)中,一种DNA聚合酶具有DNA合成活性和外切核酸酶活性。因此,需要能在调节外切核酸酶活性的同时保留正常的DNA合成活性的分子来调节校对功能。本发明提供了各种真核生物和革兰氏阳性细菌的DNA聚合酶,其能在调节外切核酸酶活性的同时保留正常的DNA合成活性,且其可以用于生物的进化中。由此,得到了与大肠杆菌不同的且意外的效果。因此,可以认为,通过发现上述的校对功能的活性部位在真核生物和革兰氏阳性细菌、特别是在真核生物中被出乎意料地确定,本发明部分地得以实现。而且,本发明的重大作用是获得遗传性状,其在下面的实例中予以出乎意料地显示。
已经在细菌等以及人中发现了许多倾向于错误的DNA聚合酶。许多复制的DNA聚合酶一般具有校对功能,即,通过3′→5′外切核酸酶活性去除错误,以进行无错误的复制。但是,倾向于错误的DNA聚合酶不具有校对功能,且不能绕过DNA损害,从而导致突变。倾向于错误的DNA聚合酶的存在会参与癌症的发作、进化、抗体进化等。许多DNA聚合酶具有变成倾向于错误的可能性。通过破坏它们的校对功能,可以使这些DNA聚合酶倾向于错误。因此,通过修饰上述的校对功能的活性部位,可以调节复制的精确度。通过使用该模型,一旦得到了新的性质,就可以有利地无畸形地进化。在这方面,与原始的不一致模型相比,本发明可以得到意外的不利和效果。
在准种理论中,Eigen提出了一个进化模型,其中仅仅考虑了倾向于错误的复制(M.Eigen,Naturwissenschaften 58,465(1971),等)。该准种理论使用各种修饰。可以将准种定义为最适序列的稳定的系统,且其突变体有选择地分布在序列空间中的最适序列周围。自然选择不是发生在单一序列中,而是在整个准种分布中。如下发生准种的进化具有比主序列更高的适合度的突变体出现在准种中,该突变体有选择地替换旧的主序列,然后新的准种分布围绕着突变体组织。
准种理论认为和总结出,存在维持遗传信息的错误阈值。因此,常规地,认为准种仅仅可以在该阈值之下进化(M.Eigen等,Adv.Chem.Phys.75,149(1989))。这意味着,进化速度的上限受到错误阈值的上限的限制。准种理论在RNA病毒的研究中似乎得到了证实,其以接近错误阈值的高速度进化。但是,认为在突变试剂的表型中具有增加的错误率的试剂在该过程中起重要作用。
尽管细菌的基因组具有单一的复制起点,但真核生物的基因组具有许多复制起点。这意味着,基因组的序列含有许多复制单元(复制剂,复制子)。因此,许多聚合酶同时参与基因组的复制。在本发明中,可以考虑许多复制剂对错误阈值的影响。
在一个优选的实施方案中,通过将能破坏3′→5′外切核酸酶活性的突变导入到能编码DNA聚合酶的基因(DNA聚合酶基因)中,可以提供能编码具有降低的校对功能(即,更高的倾向于错误的频率)的DNA聚合酶的核酸分子和多肽。注意到在单一的DNA聚合酶基因(PolC,POL2,CDC2,等)中,3′→5′外切核酸酶活性(校对功能)是包含在具有DNA聚合活性的分子中的(例如,真核生物,革兰氏阳性细菌,等),或者是由与能编码DNA聚合活性的基因(例如,dnaE)不同的基因(例如,dnaQ)编码的(例如,革兰氏阴性细菌,等)(Kornberg A.和Baker T.,“DNA Replication”,New York,Freeman,1992)。基于对上述性质的理解,本领域的技术人员可以根据本发明调节倾向于错误的频率。例如,在真核生物中,优选地将能改变校对功能而基本上不改变DNA聚合活性的突变导入DNA聚合酶中。在该情况中,改变了2个与上述的校对功能有关的酸性氨基酸(优选地,不保守的取代(例如,丙氨酸、缬氨酸等的取代))(Derbyshire等,EMBO J.10,pp.17-24,Jan.1991;Fijalkowska和Schaaper,“Mutants in theExo I motif of Escherichia coli dnaQDefective proofreadingand inviability due to error catastrophe”,Proc.Natl.Acad.Sci.USA,Vol.93,pp.2856-2861,Apr.1996)。本发明不限于此。
如本文所使用的,术语“校对功能”指检测和修复细胞DNA中的损伤和/或错误的功能。通过在脱嘌呤位点或脱嘧啶位点插入碱基,或者,用脱嘌呤-脱嘧啶(A-P)内切核酸酶切割一条链,然后用5′→3′外切核酸酶去除该位点,可以实现这样的功能。在去除的部分,用DNA聚合酶合成和补充DNA,并通过DNA连接酶将合成的DNA与正常的DNA相连接。该反应称作切除修复。对于由烷化剂、异常的碱基、辐射、紫外光等的化学修饰造成的受损DNA,通过上述的反应,在修复之前用DNA糖苷酶去除受损的部分(期外DNA合成)。具有这样的校对功能的DNA聚合酶的实例包括但不限于真核生物等的DNA聚合酶δ、DNA聚合酶ε等。如本文所使用的,术语“保真性”也可以用于代表校对功能的水平。术语“保真性”指DNA复制精确度。普通的DNA聚合酶一般具有高水平的保真性。由于修饰具有降低的校对功能的DNA聚合酶可能具有低水平的保真性。
DNA聚合酶的上述校对功能描述在,例如,Kunkel,T.A.J.Biol.Chem.,260,12866-12874(1985);Kunkel,T.A.,Sabotino,R.D.& Bambara,R.A.Proc.Natl.Acad.Sci.USA,84,4865-4869(1987);Wu,C.I.& Maeda,N.Nature,327,167-170(1987);Roberts,J.D.& Kunkel,T.A.Proc.Natl.Acad.Sci.USA,85,7064-7068(1988);Thomas,D.C.,Fitzgerald,M.P.& Kunkel,T.A.Basic Life Sciences,52,287-297(1990);Trinh,T.Q.& Siden,R.R.,Nature,352,544-547(1991);Weston-Hafer,K.& Berg,D.E.,Genetics,127,649-655(1991);Veaute,X.& Fuchs,R.P.P.Science,261,598-600(1993);Roberts,J.D.,Izuta,S.,Thomas,D.C.& Kunkel,T.A.J.Biol.Chem.,269,1711-1717(1994);Roche,W.A.,Trinh,T.Q.& Siden,R.R.,J.Bacteriol.,177,4385-4391(1995);Kang,S.,Jaworski,A.,Ohshirna,K.& Wells,Nat.Genet.,10,213-218(1995);Fijalkowska,I.J.,Jonczyk,P.,Maliszewska-Tkaczyk,M.,Bialoskorska,M.& Schaaper,R.M.,Proc.Natl.Acad.Sci.USA.,95,10020-10025(1998);Maliszewska-Tkaczyk,M.,Jonezyk,P.,Bialoskorska,M.,Schaaper,M.& Fijalkowska,I.Proc.Natl.Acad.Sci.USA,97,12678-12683(2000);Gwel,D.,Jonezyk,P.,Bialoskorska,M.,Schaaper,R.M.& Fijalkowska,I.J.Mutation Research,501,129-136(2002);Roberts,J.D.,Thomas,D.C.& Kunkel,T.A.Proc.Natl.Acad.Sci.USA,88,3465-3469(1991);Roberts,J.D.,Nguyen,D.&Kunkel,T.A.Biochemistry,32,4083-4089(1993);Francino,M.P.,Chac,L.,Riley,M.A.& Ochman,H.Science,272,107-109(1996);A.Boulet,M.Simon,G.Faye,G.A.Bauer &P.M.Burgers,EMBO J.,8,1849-1854,(1989);Morrison A.,ArakiH.,Clark A.B.,Hamatake R.K.,& Sugino A.,Cell,62(6),1143-1151(1990),等。
如本文所使用的,术语真核生物的“DNA聚合酶δ”指参与DNA延长的酶,认为其具有产生校对功能的外切核酸酶活性。代表性的DNA聚合酶δ具有如SEQ ID NO.1和2所述的序列(分别是核酸序列和氨基酸序列;PolδX61920 gi/171411/gb/M61710.1/YSCDPB2[171411])。通过修饰如SEQ ID NO.2所述的氨基酸序列的位置322处的氨基酸,可以调节该DNA聚合酶δ的校对功能。DNA聚合酶δ描述在Simon,M.等,EMBO J.,10,2163-2170,1991中,其内容在这里引作参考。DNA聚合酶δ的实例包括但不限于下述的拟南芥(SEQID NO.45),稻(SEQ ID NO.47和48),大豆(SEQ ID NO.49和50),人(SEQ ID NO.51和52),小鼠(SEQ ID NO.55和56),大鼠(SEQ IDNO.59和60),牛(SEQ ID NO.61和62),果蝇(SEQ ID NO.63和64),等。
如本文所使用的,术语真核生物的“DNA聚合酶ε”指参与复制后随链之间的缺口的酶,认为其具有产生校对功能的外切核酸酶活性。代表性的DNA聚合酶ε具有如SEQ ID NO.3和4所述的序列(分别是核酸序列和氨基酸序列;PolεM60416gi/171408/gb/M60416.1/YSCDNA POL[171408])。通过修饰如SEQ IDNO.4所述的氨基酸序列的位置391处的氨基酸,可以调节该DNA聚合酶ε的校对功能。DNA聚合酶ε描述在,例如,Morrison,A.等,MGG.242,289-296,1994;Araki H.,等.Nucleic Acids Res.19,4857-4872,1991;和Ohya T.,等,Nucleic Acids Res.28,3846-3852,2000,其内容在这里引作参考。DNA聚合酶ε的实例包括但不限于下述的拟南芥(SEQ ID NO.46),人(SEQ ID NO.53和54),小鼠(SEQID NO.57和58),果蝇(SEQ ID NO.65和66),等。
根据HUGO分类,将DNA聚合酶δ和ε分别称作POLD1/POL3和POLE/POL2。在本文中可以使用两种命名。
其它的DNA聚合酶描述在,例如,Lawrence C.W.等,J.Mol.Biol.,122,1-21,1978;Lawrence C.W.等,Genetics 92,397-408;Lawrence C.W.等,MGG,195,487-490,1984;Lawrence G.W.等,MGG.200,86-91,1985(DNA聚合酶β和DNA聚合酶ζ);Maher V.M.等,Nature 261,593-595,1976;McGregor,W.G.等,Mol.Cell.Biol.19,147-154,1999(DNA聚合酶η);Strand M.等,Nature 365,275-276,1993;Prolla T.A.等,Mol.Cell.Biol.15,407-415,1994;Kat A.等,Proc.Natl.Acad.Sci.USA 90,6424-6428;Bhattacharyya N.P.等,Proc.Natl.Acad.Sci.USA 91,6319-6323,1994;Faber F.A.等,Hum.Mol.Genet.3,253-256,1994;Eshleman,J.R.等,Oncogene 10,33-37,1995;Morrison A.等,Proc.Natl.Acad.Sci.USA 88,9473-9477,1991;Morrison A.等,EMBO J.12,1467-1473,1993;Foury F.等,EMBO J.11,2717-2726,1992(DNA聚合酶λ,DNA聚合酶μ,等);等,其内容在这里引作参考。
如本文所使用的,与能编码DNA聚合酶等的基因和生物(例如,酵母,等)有关的术语“野生型”以其最广泛的含义指,具有自然产生的能编码DNA聚合酶等的基因和生物(例如,酵母,等)所来源的物种的大多数成员的特征的类型。因此,一般地,可以认为在某些物种中首先鉴别出的能编码DNA聚合酶等的基因和生物(例如,酵母,等)的类型是野生型。野生型也称作“自然的标准型”。野生型DNA聚合酶δ具有如SEQ ID NO.1和2所述的序列。野生型DNA聚合酶ε具有如SEQ ID NO.3和44所述的序列。具有如SEQ ID NO.41-66所述的序列的DNA聚合酶也是野生型。野生型生物可能具有正常的酶活性、正常的性状、正常的行为、正常的生理学、正常的繁殖和正常的基因组。
如本文所使用的,与酶的校对功能等有关的术语“低于野生型”是指,该酶的校对功能低于野生型酶的校对功能(即,在该酶校对加工后保留的突变的数目大于野生型酶的)。通过相对的或绝对的表达,可以进行与野生型的对比。使用倾向于错误的频率等,可以进行这样的对比。
如本文所使用的,与基因有关的术语“突变”是指改变了该基因的序列,或者指改变的该基因的核酸或氨基酸序列的状态。例如,术语“突变”在本文中指会导致校对功能的改变的基因的序列中的改变。除非另有定义,术语“突变”和“变异”在本说明书中具有相同的含义。
为了生产它们的有用的突变体,最常见地对生物进行诱变。术语“突变”一般指能编码基因的碱基序列中的变化,包含DNA序列中的变化。根据其对具有突变的个体的影响,将突变大致分成下面的3组A)中性的突变(大多数突变都归入这组中,且基本上对生物的生长和代谢没有影响);B)有害的突变(它的频率低于中性的突变的。这类突变会抑制生物的生长和代谢。有害的突变包括会破坏对于生长必须的基因的致死的突变。在微生物的情况中,有害的突变的比例一般是总突变的约1/10至1/100,尽管因物种而异);和C)有益的突变(该突变对于生物的育种是有益的。其发生频率明显低于中性的突变。因此,需要大量的生物和较长的时间段来得到具有有益的突变的个别生物。通过单一突变难以得到足以对生物进行育种的效果,且经常需要积累许多有益的突变)。
如本文所使用的,与某种生物有关的术语“生长”指个体生物的量上的增加。通过测量值(例如身体大小(身高)、体重等)的量上的增加,可以识别出生物的生长。个体的量上的增加依赖于每个细胞的增大和细胞数目的增加。
如本文所使用的,与生物有关的术语“基本上相同的生长”是指,该生物的生长速度与参考生物(例如,转化前的生物)相比基本上没有变化。认为不是显著改变的生长速度的示例性的范围包括但不限于一般生长的统计分布中的1个偏差的范围。在本发明的生物中,术语“基本上相同的生长”是指,例如,(1)祖先的数目没有显著变化;(2)尽管形态学有所变化,但基本上没有产生与一般的人工突变不同的紊乱。尽管有相当高的突变率,但认为外观是“漂亮的”(尽管该特征与生长无直接关系,但该特征是通过本发明的方法建立的突变体特有的);和(3)一旦获得就不会退化的性状、基因型或表型。
如本文所使用的,术语“抗药性”是指对药物(包括生理活性物质,例如噬菌体,细菌素,等)的耐受性或抗性。当改变了它的药物受体时,或者改变了许多参与药物作用的过程中的一个或多个时,敏感的宿主就会获得抗药性。或者,当敏感的宿主获得使抗生素本身失活的能力时,就可以获得抗药性。在抗药的生物中,染色体DNA中的突变可能改变药物发生作用的酶和/或核糖体蛋白,从而使得通常浓度的药物不再有效。或者,生物可能获得来自其它生物的抗药的质粒(例如,R质粒),从而获得使药物失活的酶活性。或者,可能降低药物的膜渗透性,以得到对药物的抗性。本发明不限于此。
如本文所使用的,术语“癌细胞”具有与术语“恶性肿瘤细胞”(包括肉瘤)相同的含义,指具有永久增殖能力的且不灭的细胞。癌细胞会获得永久增殖能力,且以以下方式变得不灭。正常的细胞会在基因水平上发生某些不可逆的变化。结果,正常的细胞转化成了异常的细胞,即癌细胞。
如本文所使用的,与生物有关的术语“生产”是指生成了个体生物。
如本文所使用的,与生物有关的术语“繁殖”是指,从亲本个体生成了下一代的新个体。繁殖包括但不限于自然倍增,增殖,等;通过人工技术进行的人工倍增,增殖,等,例如克隆技术(核移植,等)。繁殖技术的实例包括但不限于在植物的情况下,单个细胞的培养;插条的嫁接;插条的生根;等。繁殖的生物一般具有源自它们的亲本的遗传性状。有性繁殖的生物一般具有源自两性的遗传性状。一般地,这些遗传性状以基本上相等的比例源自两性。无性繁殖的生物具有源自它们的亲本的遗传性状。
术语“细胞”在本文中使用其在本领域最广泛的含义,指多细胞生物的组织的结构单元,其能自我复制,具有遗传信息和表达它的机制,且被膜结构围绕,该膜结构将活体与外界分离开。这里使用的细胞可以是自然产生的细胞或人工修饰的细胞(例如,融合细胞,遗传修饰的细胞,等)。细胞来源的实例包括但不限于正常生长的转基因动物的单细胞培养物、胚胎、血液或身体组织,细胞混合物,例如来自正常生长的细胞系的细胞,等。
用于本发明的细胞可以源自任意的生物(例如,任意的单细胞生物(例如,细菌,酵母,等)或任意的多细胞生物(例如,动物(例如,脊椎动物,无脊椎动物),植物(例如,单子叶植物,双子叶植物,等),等))。例如,使用源自脊椎动物(例如,盲鳗目,七鳃鳗目,软骨鱼纲,硬骨鱼纲,两栖动物,爬行动物,鸟类,哺乳动物,等)的细胞。更具体地,使用源自哺乳动物(例如,单孔目,有袋目,无齿类动物,皮翼目,翼手目,食肉动物,食虫动物,长鼻目,奇蹄目,偶蹄目,管齿目,鳞甲目,海牛目,鲸类动物,灵长目,啮齿目,兔形目,等)的细胞。在一个实施方案中,可以使用源自灵长目(例如,黑猩猩,日本猴,人,等),特别是人的细胞。本发明不限于此。用于本发明的细胞可以是干细胞或体细胞。上述的细胞可以用于移植目的。可以使用源自开花植物(单子叶植物或双子叶植物)的细胞。优选地,使用双子叶植物细胞。更优选地,使用源自禾本科(Gramineae)、茄科、葫芦科、十字花科(Cruciferae)、伞形科、蔷薇科、豆科和紫草科(Boraginaceae)的细胞。优选地,使用源自小麦、玉米、稻、大麦、高粱、烟草、青椒、茄子、瓜、番茄、草莓、甘薯、芸苔属(Brassica)、卷心菜、韭菜、椰菜、大豆、苜蓿、亚麻、胡萝卜、黄瓜、柑桔、大白菜、莴苣、桃子、马铃薯、紫草(Lithospermumeythrohizon)、黄连根茎(Coptis Rhizom)、白杨和苹果的细胞。植物细胞可以是一部分植物体、器官、组织、培养细胞等。转化细胞、组织、器官或个体的技术是本领域众所周知的。这些技术详细地描述在本文引用的文献等中。可以将核酸分子短暂地或稳定地导入生物细胞中。用于短暂地或稳定地导入基因的技术是本领域众所周知的。用于分化用于本发明的细胞、从而生成转化的植物的技术也是本领域众所周知的。应当明白,这些技术详细地描述在本文引用的文献等中。用于从转化的植物得到种子的技术也是本领域众所周知的。这些技术描述在本文提及的文献中。
如本文所使用的,术语“干细胞”指能自我复制和具有多能性的细胞。一般地,干细胞可以再生受伤的组织。这里使用的干细胞可以是但不限于胚胎干(ES)细胞或组织干细胞(也称作组织性干细胞,组织特异性的干细胞,或体干细胞)。干细胞可以是人工生产的细胞,只要它能具有上述的能力。术语“胚胎干细胞”指源自早期胚胎的多能干细胞。与胚胎干细胞不同,组织干细胞的分化方向受到限制。胚胎干细胞位于组织中的特定位置,且具有未分化的胞内结构。因此,组织干细胞具有低水平的多能性。在组织干细胞中,核/胞质比率较高,且有很少的胞内细胞器。组织干细胞一般具有多能性,细胞周期较长,且可以维持超过个体寿命的增殖能力。这里使用的干细胞可以是胚胎干细胞或组织干细胞,只要它们能调节基因复制的倾向于错误的频率。
可以将组织干细胞分类为细胞来源的位点的种类,例如皮系统、消化系统、骨髓系统、神经系统等。皮系统中的组织干细胞包括表皮干细胞,毛囊干细胞,等。消化系统中的组织干细胞包括胰腺(普通的)干细胞,肝干细胞,等。骨髓系统中的组织干细胞包括造血干细胞,间充质干细胞,等。神经系统中的组织干细胞包括神经干细胞,视网膜干细胞,等。
如本文所使用的,术语“体细胞”指生殖细胞(例如卵细胞,精子等)以外的任意细胞,其不能将其DNA转移到下一代中。一般地,体细胞具有有限的或没有多能性。这里使用的体细胞可以是自然产生的或遗传修饰的,只要它们能调节基因复制的倾向于错误的频率。
将干细胞的来源分成外胚层、内胚层或中胚层。外胚层来源的干细胞大多存在于脑中,包括神经干细胞。内胚层来源的干细胞大多存在于骨髓中,包括血管干细胞,造血干细胞,间充质干细胞,等。中胚层来源的干细胞大多存在于器官中,包括肝干细胞,胰腺干细胞,等。如本文所使用的体细胞可以源自任意的胚层,只要它们能调节基因复制的倾向于错误的频率。
如本文所使用的,术语“分离的”表示减少了、优选地基本上排除了至少一种一般环境中的天然伴随物。因此,术语“分离的细胞”指基本上不含有一般环境中的天然伴随物(例如,其它细胞,蛋白,核酸,等)的细胞。与核酸或多肽有关的术语“分离的”指核酸或多肽,例如,当通过重组DNA技术生产时,其基本上不含有细胞物质或培养基,或者当化学合成时,其基本上不含有前体化学物质或其它化学物质。优选地,分离的核酸不含有天然地在生物中的核酸侧翼的序列(核酸的5′或3′末端)。
如本文所使用的,与细胞有关的术语“建立”指其中维持了细胞的特定性质(多能性),且该细胞在培养条件下会经历稳定的增殖的细胞状态。因此,建立的干细胞会维持多能性。
如本文所使用的,术语“分化的细胞”指具有专门功能和形式的细胞(例如,肌肉细胞,神经元,等)。与干细胞不同,分化的细胞没有或具有很少的多能性。分化的细胞的实例包括表皮细胞,胰腺实质细胞,胰管细胞,肝细胞,血细胞,心肌细胞,骨骼肌细胞,成骨细胞,骨骼成肌细胞,神经元,血管内皮细胞,色素细胞,平滑肌细胞,脂肪细胞,骨细胞,软骨细胞,等。这里使用的细胞可以是任意的上述细胞,只要它们能调节基因复制的倾向于错误的频率。如本文所使用的,术语“分化”或“细胞分化”指,在源自单个细胞分裂的子代细胞群体中发生在形态和/或功能上具有定性差异的2种或更多种细胞的现象。因此,“分化”包括这样的过程,其中一群(家族树)原始地不具有特定的可检测的特征的细胞获得了特征,例如生成特定的蛋白,等。
如本文所使用的,与细胞、生物等有关的术语“状态”指细胞、生物等的参数(例如,细胞周期、对外源试剂的反应、信号转导、基因表达、基因转录等)的状况或模式。这样的状态的实例包括但不限于分化的状态,未分化的状态,细胞对外源试剂的反应,细胞周期,增殖状态,等。在这里可以使用目标生物对下述参数(特征是生物的环境)的反应性或抗性作为生物状态的量度温度,湿度(例如,绝对湿度,相对湿度,等),pH,盐浓度(例如,所有盐或特定盐的浓度),营养物(例如,碳水化合物的量,等),金属(例如,所有金属或特定金属(例如,重金属,等)的量或浓度),气体(例如,所有气体或特定气体的量),有机溶剂(例如,所有有机溶剂或特定有机溶剂(例如,乙醇,等)的量),压力(例如,局部的或总的压力,等),大气压力,粘度,流速(例如,存在生物的介质的流速,等),光强度(例如,特定波长的光的量,等),光波长(例如,可见光,紫外光,红外光,等),电磁波,辐射,重力,张力,声波,目标生物以外的其它生物(例如,寄生物,病原性细菌,等),化学试剂(例如,药物,等),抗生素,自然产生的物质,心理应激,机体应激,等。
如本文所使用的,与实体有关的术语“环境”(或德语中的“Umgebung”)指围绕着该实体的环境。在环境中,识别出了多种组分和一定量的状态,它们称作环境因素。环境因素的实例包括上述的参数。环境因素一般大致分成非生物的环境因素和生物的环境因素。非生物的环境因素(无机环境因素)可以分成物理因素和化学因素,或者,气候因素和土壤因素。各种环境因素不总是独立地作用于生物,而是可以与另一种相关联。因此,在这里可以逐个地或作为整体地(各种参数的整体)观察环境因素。
如本文所使用的,术语“组织”指多细胞生物中的具有基本上相同的功能和/或形式的细胞的聚集体。“组织”一般是相同来源的细胞的聚集体,但是可以是不同来源的细胞的聚集体,只要这些细胞具有相同的功能和/或形式。因此,当本发明的干细胞用于再生组织时,该组织可以由2种或更多种不同来源的细胞的聚集体组成。一般地,组织构成器官的一部分。在形态的、功能的或发育的基础上,可以将动物组织分成表皮组织,结缔组织,肌肉组织,神经组织,等。根据构成组织的细胞的发育状态,可以将植物组织大致分成分生组织和永久组织。或者,根据构成组织的细胞的类型,可以将组织分成单一组织和复合组织。因而,可以将组织分成各种类别。这里可以使用任意的组织,只要其中能调节基因复制的倾向于错误的频率。
任意的器官或其一部分都可以用于本发明。要在本发明中注射的组织或细胞可以源自任意的器官。如本文所使用的,术语“器官”指位于发挥特定功能的个体生物的特定部分中的形态上独立的结构。在多细胞生物(例如,动物,植物)中,器官由空间上以特定方式排列的几种组织组成,每种组织由许多细胞组成。这样的器官的实例包括与血管系统有关的器官。在一个实施方案中,本发明靶向的器官包括但不限于皮肤,血管,角膜,肾,心,肝,脐带,肠,神经,肺,胎盘,胰腺,脑,外周肢(peripheral limb),视网膜,等。任意的器官或其一部分都可以用于本发明,只要其中能调节基因复制的倾向于错误的频率。
如本文所使用的,术语“产物物质”指目标生物或其一部分生成的物质。这样的产物物质的实例包括但不限于基因的表达产物、代谢物、粪便等。根据本发明,通过调节遗传性状的转化率,可以使目标生物改变产物物质的类型和/或量。应当明白,本发明包括这样改变的产物物质。优选地,产物物质可以是但不限于代谢物。
如本文所使用的,与生物有关的术语“疾病模型”指可以在其中重建对生物特异性的疾病、症状、紊乱、状况等的生物模型。通过本发明的方法,可以生成这样的疾病模型。这样的疾病模型的实例包括但不限于癌症的动物模型,心脏病(例如,心肌梗塞,等)的动物模型,心血管病(例如,动脉硬化,等)的动物模型,中枢神经病(例如,痴呆,脑梗塞,等)的动物模型,等。
(普通生物化学和分子生物学)(一般技术)如本文所使用的分子生物学技术、生物化学技术、微生物学技术和细胞生物学技术是本领域众所周知的和常用的,且描述在,例如,Sambrook J.等(1989),Molecular CloningA Laboratory Manual,Cold Spring Harbor和其第3版.(20D1);Ausubel,F.M.(1987),Current Protocols in Molecular Biology,Greene Pub.Associatesand Wiley-Interscience;Ausubel,F.M.(1989),Short Protocolsin Molecular BiologyA Compendium of Methods from CurrentProtocols in Molecular Biology,Greene Pub.Associates andWiley-Interscience;Innis,M.A.(1990),PCR ProtocolsA Guideto Methods and Applications,Academic Press;Ausubel,F.M.(1992),Short Protocols in Molecular BiologyA Compendiumof Methods from Current Protocols in Molecular Biology,GreenePub.Associates;Ausubel,F.M.(1995),Short Protocols inMolecular BiologyA Compendium of Methods from CurrentProtocols in Molecular Biology,Greene Pub.Associates;Innis,M.A.等(1995),PCR Strategies,Academic Press;Ausubel,F.M.(1999),Short Protocols in Molecular BiologyACompendium of Methods from Current Protocols in MolecularBiology,Wiley,and annual updates;Sninsky,J.J.等(1999),PCR ApplicationsProtocols for Functional Genomics,AcademicPress;Special issue,Jikken Igaku[Experimental Medicine]“Idenshi Donyu & Hatsugen Kaiseki Jikkenho[ExperimentalMethods for Gene Introduction & Expression Analysis]”,Yodo-sha,1997,等。这些出版物中的每一篇的相关部分(或可能是整体)均在这里引作参考。
用于制备人工合成的基因的DNA合成技术和核酸化学描述在,例如,Gait,M.J.(1985),Oligonucleotide SynthesisA PracticalApproach,IRL Press;Gait,M.J.(1990),OligonucleotideSynthesisA Practical Approach,IRL Press;Eckstein,F.(1991),Oligonucleotides and AnaloguesA Practical Approac,IRL Press;Adams,R.L.等(1992),The Biochemistry of the Nucleic Acids,Chapman & Hall;Shabarova,Z.等(1994),Advanced OrganicChemistry of Nucleic Acids,Weinheim;Blackburn,G.M.等(1996),Nucleic Acids in Chemistry and Biology,Oxford UniversityPress;Hermanson,G.T.(1996),Bioconjugate Techniques,Academic Press;等,其相关部分在这里引作参考。
如本文所使用的术语“蛋白”、“多肽”、“寡肽”和“肽”具有相同的含义,是指具有任意长度的氨基酸聚合物。该聚合物可以是直链、分支或环状链。氨基酸可以是自然产生的或非自然产生的氨基酸,或变体氨基酸。该术语可以包括组装进许多多肽链的复合物中的那些。该术语还包括自然产生的或人工改变的氨基酸聚合物。这样的修饰包括,例如,二硫键形成,糖基化,脂化(lipidation),乙酰化,磷酸化,或任意的其它操作或修饰(例如,与标记部分缀合)。该定义包括例如含有至少一种氨基酸类似物(例如,非自然产生的氨基酸,等)的多肽、肽样化合物(例如,类肽)和本领域已知的其它变体。本发明的基因产物一般是多肽形式。多肽形式的本发明的产物物质可以用作药物组合物等。
如本文所使用的术语“多核苷酸”、“寡核苷酸”和“核酸”具有相同的含义,是指具有任意长度的核苷酸聚合物。该术语还包括“寡核苷酸衍生物”或“多核苷酸衍生物”。“寡核苷酸衍生物”或“多核苷酸衍生物”包括核苷酸衍生物,或指具有与一般连接不同的核苷酸间连接的寡核苷酸或多核苷酸,它们可互换地使用。这样的寡核苷酸的实例具体地包括2′-O-甲基-核糖核苷酸,其中的寡核苷酸的磷酸二酯键被转化成硫代磷酸酯键的寡核苷酸衍生物,其中的寡核苷酸的磷酸二酯键被转化成N3′-P5′氨基磷酸酯键的寡核苷酸衍生物,其中的寡核苷酸的核糖和磷酸二酯键被转化成肽-核酸键的寡核苷酸衍生物,其中的寡核苷酸的尿嘧啶被取代为C-5丙炔基尿嘧啶的寡核苷酸衍生物,其中的寡核苷酸的尿嘧啶被取代为C-5噻唑尿嘧啶的寡核苷酸衍生物,其中的寡核苷酸的胞嘧啶被取代为C-5丙炔基胞嘧啶的寡核苷酸衍生物,其中的寡核苷酸的胞嘧啶被取代为吩噁嗪修饰的胞嘧啶的寡核苷酸衍生物,其中的DNA的核糖被取代为2′-O-丙基核糖的寡核苷酸衍生物,和其中的寡核苷酸的核糖被取代为2′-甲氧基乙氧基核糖的寡核苷酸衍生物。除非另有说明,特定的核酸序列还隐含地包括其保守地修饰的变体(例如简并的密码子取代)和互补的序列以及明确指出的序列。具体地,通过生成其中的一个或多个选定的(或全部)密码子的第3位取代为混合碱基和/或去氧肌苷残基的序列,可以生成简并的密码子取代(Batzer等,Nucleic Acid Res.195081(1991);Ohtsuka等,J.Biel.Chem.2602605-2608(1985);Rossolini等,Mol.Cell.Probes 891-98(1994))。本发明的基因一般是多核苷酸形式。多核苷酸形式的本发明的基因或基因产物可以用于本发明的方法。
如本文所使用的,术语“核酸分子”还与术语“核酸”、“寡核苷酸”和“多核苷酸”可互换地使用,包括cDNA、mRNA、基因组DNA等。如本文所使用的,核酸和核酸分子可以包含在术语“基因”的概念中。能编码给定基因的序列的核酸分子包括“剪接突变体(变体)”。类似地,由核酸编码的特定蛋白包括由该核酸的剪接变体编码的任意蛋白。如其名字所暗示的,“剪接突变体”是基因的可变剪接的产物。转录后,可以剪接初始的核酸转录物,从而使得不同的(可变的)核酸剪接产物能编码不同的多肽。生成剪接变体的机制可以有变化,但是包括外显子的可变剪接。该定义还包括通过连读转录源自相同核酸的可变多肽。该定义包括剪接反应的任意产物,包括剪接产物的重组形式。因此,本发明的基因可以包括这里的剪接突变体。
如本文所使用的,基因(例如,核酸序列,氨基酸序列,等)的“同源性”指2个或更多个基因序列之间的同一性的比例。如本文所使用的,序列(核酸序列,氨基酸序列,等)的同一性指2个或更多个可比较的序列之间的相同序列(单个的核酸,氨基酸,等)的比例。因此,2个特定的基因之间的同源性越大,它们的序列之间的同一性或相似性越大。通过直接比较它们的序列,或者通过在严格条件下的杂交方法,可以确定2个基因是否具有同源性。当将2个基因序列直接彼此对比时,如果基因的DNA序列代表性地彼此具有至少50%的同一性,优选地至少70%的同一性,更优选地至少80%,90%,95%,96%,97%,98%或99%的同一性,则这些基因具有同源性。如本文所使用的,当保守取代在上述的同源性中视作正的(相同的)时,基因(例如,核酸序列,氨基酸序列,等)的“相似性”指2个或更多个序列之间的同一性的比例。因此,同源性和相似性在存在保守取代时彼此不同。如果不存在保守取代,则同源性和相似性具有相同的值。
这里使用默认参数的PSI-BLAST(序列分析工具),对比氨基酸序列和碱基序列的相似性、同一性和同源性。另外,可以使用FASTA(使用默认参数)代替PSI-BLAST。
如本文所使用的,术语“氨基酸”可以指自然产生的或非自然产生的氨基酸,只要它能满足本发明的目的。术语“氨基酸衍生物”或“氨基酸类似物”指与自然产生的氨基酸不同的氨基酸,且其具有与原始氨基酸类似的功能。这样的氨基酸衍生物和氨基酸类似物是本领域众所周知的。
术语“自然产生的氨基酸”指自然产生的氨基酸的L-异构体。自然产生的氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸,异亮氨酸,丝氨酸,甲硫氨酸,苏氨酸,苯丙氨酸,酪氨酸,色氨酸,半胱氨酸,脯氨酸,组氨酸,天冬氨酸,天冬酰胺,谷氨酸,谷氨酰胺,γ-羧基谷氨酸,精氨酸,鸟氨酸和赖氨酸。除非另有说明,如本文所使用的所有氨基酸是L-异构体,尽管使用D-氨基酸的实施方案也在本发明的范围内。术语“非自然产生的氨基酸”指通常在自然界不会发现的氨基酸。非自然产生的氨基酸的实例包括正亮氨酸,对硝基苯丙氨酸,高苯丙氨酸(homophenylalanine),对氟苯丙氨酸,3-氨基-2-苯偶酰丙酸,D-或L-高精氨酸和D-苯丙氨酸。术语“氨基酸类似物”指具有与氨基酸类似的物理性质和/或功能的非氨基酸的分子。氨基酸类似物的实例包括,例如,乙硫氨酸,刀豆氨酸,2-甲基谷氨酰胺等。氨基酸模仿物指具有与氨基酸的一般化学结构不同的结构、但是以与自然产生的氨基酸类似的方式起作用的化合物。
如本文所使用的,术语“核苷酸”可以是自然产生的或非自然产生的。术语“核苷酸衍生物”或“核苷酸类似物”指与自然产生的核苷酸不同、且具有与原始核苷酸类似的功能的核苷酸。这样的核苷酸衍生物和核苷酸类似物是本领域众所周知的。这样的核苷酸衍生物和核苷酸类似物的实例包括但不限于硫代磷酸酯,氨基磷酸酯,甲基膦酸酯,手性的-甲基膦酸酯,2-O-甲基核糖核苷酸,和肽-核酸(PNA)。
在本文中可以用它们的普遍知道的三字母符号或IUPAC-IUB生物化学命名委员会(Biochemical Nomenclature Commission)推荐的单字母符号来指示氨基酸。同样地,可以用它们的普遍接受的单字母编码来指示核苷酸。
如本文所使用的,术语“对应的”氨基酸或核酸指特定的多肽或多核苷酸分子中的氨基酸或核苷酸,其具有或预期其具有与作为对比参考的多肽或多核苷酸中的预定的氨基酸或核苷酸类似的功能。具体地,在酶分子的情况下,该术语指存在于活性部位(例如,提供DNA聚合酶的校对功能的范围)的相似位置的氨基酸,且类似地提供催化活性。例如,在反义分子的情况下,该术语指与反义分子的特定部分相对应的直向同源体(ortholog)中的相似部分。使用本领域已知的比对技术,可以鉴别出对应的氨基酸和核酸。这样的比对技术描述在,例如,Needleman,S.B.和Wunsch,C.D.,J.Mol.Biol.48,443-453,1970中。
如本文所使用的,术语“对应的”基因(例如,多肽或多核苷酸分子)指给定物种中的基因(例如,多肽或多核苷酸分子),其具有或预期其具有与作为对比参考的物种中的预定的基因类似的功能。当存在许多具有这样的功能的基因时,该术语指具有相同的进化起源的基因。因此,与特定的基因相对应的基因可以是特定的基因的直向同源体。因此,可以在其它的动物(人,大鼠,猪,牛,等)中发现与小鼠DNA聚合酶基因等相对应的基因。通过本领域熟知的技术,可以鉴别出这样对应的基因。因此,例如,使用参考基因(例如,小鼠DNA聚合酶基因等)的序列作为查询序列,通过搜索动物(例如,人,大鼠)的序列数据库,可以发现特定的动物中的对应的基因。
如本文所使用的,术语“核苷酸”可以是自然产生的或非自然产生的。术语“核苷酸衍生物”或“核苷酸类似物”指与自然产生的核苷酸不同、且具有与原始核苷酸相似的功能的核苷酸。这样的核苷酸衍生物和核苷酸类似物是本领域众所周知的。这样的核苷酸衍生物和核苷酸类似物的实例包括但不限于硫代磷酸酯,氨基磷酸酯,甲基膦酸酯,手性的-甲基膦酸酯,2-O-甲基核糖核苷酸和肽-核酸(PNA)。
如本文所使用的,术语“片段”指相对于参考多肽或多核苷酸的全长(长度n)具有1至n-1的序列长度的多肽或多核苷酸。片段的长度可以根据目的相应地改变。例如,在多肽的情况中,片段长度的下限包括3,4,5,6,7,8,9,10,15,20,25,30,40,50或更多的核苷酸。这里没有指出的整数(例如,11等)代表的长度可以是适当的下限。例如,在多核苷酸的情况下,片段长度的下限包括5,6,7,8,9,10,15,20,25,30,40,50,75,100或更多的核苷酸。这里没有指出的整数(例如,11等)代表的长度可以是适当的下限。如本文所使用的,多肽或多核苷酸的长度可以分别由氨基酸或核酸的数目表示。但是,上述的数字不是绝对的。上述的作为上限或下限的数字意在包括一些更大的或更小的数字(例如,±10%),只要能维持相同的功能即可。为了该目的,可以在数字前加上“约”。但是,应当明白,数字的解释不受本说明书中是否存在“约”的影响。根据是否维持了作为片段参考的全长蛋白的功能中的至少一种功能(例如,与其它分子的特异性相互作用,等),可以决定有用片段的长度。
如本文所使用的,术语能与生物试剂(例如多核苷酸、多肽等)“特异性地相互作用的试剂”指具有对生物试剂(例如多核苷酸、多肽等)的亲和力的试剂,其代表性地比对其它不相关的生物试剂(例如多核苷酸、多肽等)(更具体地,具有低于30%的同一性的那些)的亲和力更高或相等,优选地显著(例如,统计上显著地)更高。使用例如杂交实验、结合实验等,可以检测这样的亲和力。如本文所使用的,“试剂”可以是任意的物质或其它因素(例如,能量,例如光,辐射,热,电,等),只要可以实现想要的目的即可。这样的物质的实例包括但不限于蛋白,多肽,寡肽,肽,多核苷酸,寡核苷酸,核苷酸,核酸(例如,DNA,例如cDNA,基因组DNA,等;和RNA,例如mRNA),多糖,寡糖,脂类,小分子量的有机分子(例如,激素,配体,信息传递物质,通过组合化学合成的分子,小分子量的分子(例如,药学上可接受的小分子量的配体等),等),和这些分子的组合。对多核苷酸特异性的试剂的实例包括但不限于代表性地,与具有预定的序列同源性(例如,70%或更高的序列同一性)的多核苷酸的序列具有互补性的多核苷酸,多肽,例如能结合启动子区的转录试剂,等。对多肽特异性的试剂的实例包括但不限于代表性地,特异性地针对多肽或其衍生物或类似物的抗体(例如,单链抗体);当该多肽是受体或配体时,特异性的配体或受体;当多肽是酶时的底物等。这些试剂在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,术语“小分子量的有机分子”指具有相对较小的分子量的有机分子;通常,小分子量的有机分子指约1,000或更小的分子量,或可以指大于1,000的分子量。通过本领域已知的方法或其组合,可以一般地合成小分子量的有机分子。生物可以生成这些小分子量的有机分子。小分子量的有机分子的实例包括但不限于激素,配体,信息传递物质,通过组合化学合成的分子,药学上可接受的小分子量的分子(例如,小分子量的配体等),等。这些试剂在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,术语“抗体”包括多克隆抗体,单克隆抗体,人抗体,人源化的抗体,多功能抗体,嵌合抗体,和抗独特型抗体,和其片段(例如,F(ab′)2和Fab片段),和其它重组缀合物。这些抗体可以通过共价键或通过重组与酶(例如,碱性磷酸酶,辣根过氧化物酶,α-半乳糖酶,等)融合。
如本文所使用的,术语“抗原”指抗体分子可以特异性地结合的任意底物。如本文所使用的,术语“免疫原”指能启动淋巴细胞的抗原-特异性的免疫反应的活化的抗原。
如本文所使用的,术语“单链抗体”指通过肽交联剂连接Fv区的重链片段和轻链片段形成的单链多肽。
如本文所使用的,术语“复合分子”指这样的分子,其中许多分子,例如多肽、多核苷酸、脂类、糖、小分子量的分子等连接在一起。这样的复合分子的实例包括但不限于糖脂,糖肽,等。这些分子在这里可以用作基因或其产物(例如,DNA聚合酶,等)或本发明的试剂,只要该分子具有与该基因或其基因产物(例如,DNA聚合酶,等)或本发明的试剂基本上相同的功能。
如本文所使用的,术语“分离的”生物试剂(例如,核酸,蛋白,等)指基本上与自然产生的生物的细胞中的其它生物试剂(例如,在核酸的情况下,核酸以外的试剂和具有与目标核酸不同的核酸序列的核酸;和在蛋白的情况下,蛋白以外的试剂和具有与目标蛋白不同的氨基酸序列的蛋白)分离或纯化的生物试剂。“分离的”核酸和蛋白包括通过标准纯化方法纯化出的核酸和蛋白。分离的核酸和蛋白还包括化学合成的核酸和蛋白。
如本文所使用的,术语“纯化的”生物试剂(例如,核酸,蛋白,等)指从中去除了至少一部分天然伴随的试剂的试剂。因此,通常,纯化的生物试剂的纯度高于正常状态的生物试剂(即,浓缩的)。
如本文所使用的,术语“纯化的”和“分离的”是指,存在优选地至少75重量%、更优选地至少85重量%、甚至更优选地至少95重量%和最优选地至少98重量%的相同类型的生物试剂。
如本文所使用的,术语基因产物(例如基因,多核苷酸,多肽,等)的“表达”是指,该基因等受到预定的体内作用的影响以改变成其它形式。优选地,术语“表达”是指,将基因、多核苷酸等转录和翻译成多肽。在本发明的一个实施方案中,基因可以转录成mRNA。更优选地,这些多肽可以具有翻译后的加工修饰。
如本文所使用的,术语基因、多核苷酸、多肽等的“表达的减少”是指,在存在本发明的试剂的作用时,表达水平比没有该试剂的作用时显著降低。优选地,表达的减少包括多肽(例如,DNA聚合酶等)的表达量的减少。如本文所使用的,术语基因、多核苷酸、多肽等的“表达的增加”是指,在存在本发明的试剂的作用时,表达水平比没有该试剂的作用时显著增加。优选地,表达的增加包括多肽(例如,DNA聚合酶等)的表达量的增加。如本文所使用的,术语基因的“表达的诱导”是指,通过将特定的试剂应用到特定的细胞,增加基因的表达量。因此,表达的诱导包括当不能观察到基因的表达时,使基因表达,和当能观察到基因的表达时,增加基因的表达量。这些基因或基因产物(多肽或多核苷酸)的增加或减少可以用于调节例如,在本发明中复制中倾向于错误的频率。
如本文所使用的,在基因的情况下的术语“特异性地表达”是指,基因在特定位点表达或表达特定的时间段,其水平与在其它位点或时间段的不同(优选地更高)。术语“特异性地表达”是指,基因可以仅仅在给定的位点(特定位点)表达或可以在其它位点表达。优选地,术语“特异性地表达”是指,基因仅仅在给定的位点表达。因此,根据本发明的一个实施方案,DNA聚合酶可以特异性地或局部地在需要的部分表达。
如本文所使用的,术语“生物活性”是指生物内的试剂(例如,多核苷酸,蛋白,等)所具有的活性,包括表现出各种功能的活性(例如,转录促进活性)。例如,当2种试剂彼此相互作用时(例如,DNA聚合酶结合特异性的序列),生物活性包括DNA聚合酶和特异性的序列之间的连接,连接造成的生物变化(例如,特异性的核苷酸聚合反应;发生复制错误;去除核苷酸的能力;识别错配的碱基对;等)。例如,当特定的试剂是酶时,其生物活性包括其酶促活性。在其它的实例中,当特定的试剂是配体时,其生物活性包括该试剂与该配体的受体的结合。使用本领域众所周知的技术,可以测量这样的生物活性。
如本文所使用的,术语“反义(活性)”是指允许特异性地阻抑或减少靶基因的表达的活性。通常,使用与靶基因(例如,DNA聚合酶等)的核酸序列互补的、具有至少8个邻接核苷酸的长度的核酸序列来实现该反义活性。这样的核酸序列优选地具有至少9个邻接核苷酸的长度,更优选地至少10个邻接核苷酸的长度,且甚至更优选地至少11个邻接核苷酸的长度,至少12个邻接核苷酸的长度,至少13个邻接核苷酸的长度,至少14个邻接核苷酸的长度,至少15个邻接核苷酸的长度,至少20个邻接核苷酸的长度,至少30个邻接核苷酸的长度,至少40个邻接核苷酸的长度,和至少50个邻接核苷酸的长度。这些核酸序列包括与其具有至少70%、更优选地至少80%、甚至更优选地至少90%、且再更优选地至少95%同源性的核酸序列。反义活性优选地与靶基因的核酸序列的5′末端序列互补。这样的反义核酸序列包括具有一个或几个、或至少一个核苷酸取代、添加和/或缺失的上述序列。具有这样的反义活性的分子在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,术语“RNAi”是RNA干扰的缩写,是指下述现象将用于造成RNAi的试剂、例如双链RNA(也称作dsRNA)导入细胞中,并特异性地降低与其同源的mRNA,从而抑制基因产物的合成,和使用该现象的技术。如本文所使用的,RNAi可以具有与能造成RNAi的试剂相同的含义。
如本文所使用的,术语“能造成RNAi的试剂”指能造成RNAi的任意试剂。如本文所使用的,“能造成基因的RNA i的试剂”是指试剂能造成与该基因有关的RNAi和达到RNAi的效果(例如,抑制该基因的表达,等)。这样的能造成RNAi试剂的实例包括但不限于与靶基因的核酸序列具有至少约70%同源性的序列或可在严格条件下杂交的序列,含有具有至少10个核苷酸长度的双链部分的RNA或其变体。在这里,该试剂可以优选地是含有3′突出端的DNA,且更优选地该3′突出端具有2个或更多个核苷酸的长度(例如,2-4个核苷酸的长度)。RNAi在这里可以用于调节生物的倾向于错误的频率。
如本文所使用的,“在严格条件下杂交的多核苷酸”指常用的且本领域众所周知的条件。通过使用从本发明的多核苷酸中选择出的多核苷酸,通过进行菌落杂交、噬菌斑杂交、DNA印迹杂交等,可以得到这样的多核苷酸。具体地,在有0.7-1.0M NaCl存在的情况下,使用在其上面固定了源自菌落或噬菌斑的DNA的滤器在65℃进行杂交。此后,在65℃,使用0.1-2倍浓度的SSC(盐水-柠檬酸钠)溶液(1-倍浓度的SSC溶液由150mM氯化钠和15mM柠檬酸钠组成)洗涤滤器。将通过该方法鉴别出的多核苷酸称作“在严格条件下杂交的多核苷酸”。可以根据描述在下述文献中的方法进行杂交,例如,Molecular Cloning第2版,Current Protocols in MolecularBiology,Supplement 1-38,DNA Cloning 1Core Techniques,APractical Approach,第2版,0xford University Press(1995)等。在这里,在严格条件下杂交的序列优选地排除仅仅含有A(腺嘌呤)或T(胸腺嘧啶)的序列。“可杂交的多核苷酸”是指可以在上述的杂交条件下与其它多核苷酸杂交的多核苷酸。具体地,可杂交的多核苷酸至少包括与能编码具有本文具体公开的氨基酸序列的多肽的DNA的碱基序列具有至少60%同源性的多核苷酸,优选具有至少80%同源性的多核苷酸,且更优选具有至少95%同源性的多核苷酸。
术语“高度严格的条件”指用于使序列高度互补的DNA链进行杂交、且能排除明显错配的DNA的杂交的条件。杂交严格性主要由温度、离子强度、变性剂(例如甲酰胺)的浓度决定。用于杂交和洗涤的“高度严格的条件”的实例是0.0015M氯化钠,0.0015M柠檬酸钠,在65-68℃,或0.015M氯化钠,0.0015M柠檬酸钠,和50%甲酰胺,在42℃。见Sambrook,Fritsch & Maniatis,Molecular CloningA Laboratory Manual(第2版,Cold Spring Harbor Laboratory,N.Y.,1989);Anderson等,Nucleic Acid HybridizationAPractical Approach Ch.4(IRL Press Limited)(Oxford Express)。可以任选地使用更严格的条件(例如更高的温度,更低的离子强度,更高的甲酰胺或其它变性剂)。为了减少非特异性的和/或背景杂交的目的,在杂交和洗涤缓冲液中可以包含其它试剂。实例是0.1%牛血清清蛋白,0.1%聚乙烯吡咯烷酮,0.1%焦磷酸钠,0.1%十二烷基硫酸钠(NaDodSO4或SDS),Ficoll,Denhardt氏溶液,超声波处理的鲑精DNA(或另一种非互补的DNA)和葡聚糖硫酸酯,尽管还可以使用其它合适的试剂。可以改变这些添加剂的浓度和类型,而基本上不影响杂交条件的严格性。杂交实验通常在pH6.8-7.4进行;但是,在一般的离子强度条件下,杂交速度几乎与pH无关。见Anderson等,Nucleic Acid HybridizationA Practical Approach Ch.4(IRLPress Limited,Oxford,英国)。
能影响DNA双链体的稳定性的因素包括碱基组成、长度和碱基对错配的程度。本领域的技术人员可以调节杂交条件,以使这些变量适应,并使不同序列相关性的DNA形成杂交物。通过下面的方程,可以估计出较好地配对的DNA双链体的解链温度Tm(℃)=81.5+16.6(log[Na+])+0.41(%G+C)-600/N-0.72(%甲酰胺)其中N是形成的双链体的长度,[Na+]是杂交或洗涤溶液中的钠离子的摩尔浓度,%G+C是杂交物中的(鸟嘌呤+胞嘧啶)碱基百分比。对于较不好地配对的杂交物,每1%的错配,解链温度会降低约1℃。
术语“中等严格的条件”指能形成具有比“高度严格的条件”下发生的碱基对错配更大的程度的DNA双链体的条件。一般的“中等严格的条件”的实例是0.015M氯化钠,0.0015M柠檬酸钠,在50-65℃,或0.015M氯化钠,0.0015M柠檬酸钠,和20%甲酰胺,在37-50℃。作为实例,在0.015M钠离子中、50℃的“中等严格的条件”允许约21%错配。
本领域的技术人员能够明白,“高度严格的条件”和“中等严格的条件”之间没有绝对的区别。例如,在0.015M钠离子(无甲酰胺)时,较好地配对的长DNA的解链温度是约71℃。在65℃(在相同的离子强度)洗涤时,会允许约6%错配。为了捕获相关性更差的序列,本领域的技术人员可以简单地降低温度或升高离子强度。
通过下式可以较好地估计最高达约20个核苷酸的寡核苷酸探针在1M NaCl中的解链温度Tm=(2℃/A-T碱基对)+(4℃/G-C碱基对)。
应当注意6X盐柠檬酸钠(SSC)中的钠离子浓度是1M。见Suggs等,Developmental Biology Using Purified Genes 683(Brown和Fox,编,1981)。
从具有PCR引物和杂交探针(其含有例如SEQ ID NO.1,3,41,43,47,49,51,53,55,57,59,61,63,65,等所示的核酸序列的一部分)的cDNA文库中,容易地分离出了能编码DNA聚合酶蛋白的自然产生的核酸。在基本上含有1%牛血清清蛋白(BSA)、500mM磷酸钠(NaPO4)、1mM EDTA和7%SDS、在42℃的杂交缓冲液和基本上含有2xSSC(600mM NaCl;60mM柠檬酸钠)和0.1%SDS、在50℃的洗涤缓冲液定义的低严格条件下;更优选地在基本上含有1%牛血清清蛋白(BSA)、500mM磷酸钠(NaPO4)、15%甲酰胺、1mM EDTA和7%SDS、在50℃的杂交缓冲液和基本上含有1xSSC(300mM NaCl;30mM柠檬酸钠)和1%SDS、在50℃的洗涤缓冲液定义的低严格条件下;最优选地在基本上含有1%牛血清清蛋白(BSA)、200mM磷酸钠(NaPO4)、15%甲酰胺、1mM EDTA和7%SDS、在50℃的杂交缓冲液和基本上含有0.5xSSC(150mM NaCl;15mM柠檬酸钠)和0.1%SDS、在65℃的洗涤缓冲液定义的低严格条件下,优选的能编码DNA聚合酶的核酸或其变体或片段等可与如SEQ ID NO.1,3,41,43,47,49,51,53,55,57,59,61,63,65,等所述序列中的全部或部分杂交。
如本文所使用的,术语“探针”指在生物实验中用于搜索的物质,例如体外和/或体内筛选等,包括但不限于,例如,具有特定的碱基序列的核酸分子或含有特定的氨基酸序列的肽。
作为普通探针的核酸分子的实例包括具有至少8个邻接的核苷酸的长度的核酸序列的、且与目标基因的核酸序列同源或互补的核酸分子。这样的核酸序列可以优选地是具有至少9个邻接的核苷酸的长度、更优选地至少10个邻接的核苷酸的长度、且更优选地至少11个邻接的核苷酸的长度、至少12个邻接的核苷酸的长度、至少13个邻接的核苷酸的长度、至少14个邻接的核苷酸的长度、至少15个邻接的核苷酸的长度、至少20个邻接的核苷酸的长度、至少25个邻接的核苷酸的长度、至少30个邻接的核苷酸的长度、至少40个邻接的核苷酸的长度或至少50个邻接的核苷酸的长度的核酸序列。用作探针的核酸序列包括与上述序列具有至少70%、更优选地至少80%、且更优选地至少90%或至少95%同源性的核酸序列。
如本文所使用的,术语“搜索”是指,使用特定的核酸序列来电子地或生物地,或使用其它的方法发现具有特定的功能和/或性质的其它核酸碱基序列。电子搜索的实例包括但不限于BLAST(Altschul等,J.Mol.Biol.215403-410(1990)),FASTA(Pearson & Lipman,Proc.Natl.Acad.Sci.,USA 852444-2448(1988)),Smith和Waterman方法(Smith和Waterman,J.Mol.Biol.147195-197(1981)),和Needleman和Wunsch方法(Needleman和Wunsch,J.Mol.Biol.48443-453(1970)),等。生物搜索的实例包括但不限于其中使基因组DNA附着到尼龙膜等上的微阵列,或其中在严格杂交、PCR和原位杂交中使基因组DNA附着到玻璃板上的微阵列(微测定),等。这里意味着,在本发明中使用的DNA聚合酶等包括通过这样的电子的或生物的搜索鉴定出的对应基因。
如本文所使用的,通过在对比窗口中对比2个最佳比对的序列,可以确定“(氨基酸,核苷酸,等)序列同一性、同源性或相似性的百分比”,其中,在与用于2个序列的最佳比对的参考序列(其不包含添加或缺失(如果其它序列包含添加,则可能产生缺口))相比时,对比窗口中的部分多核苷酸或多肽序列可以包含添加或缺失(即缺口)。通过测定2个序列中出现相同核酸碱基或氨基酸残基的位置的数目,以得到匹配位置的数目,用匹配位置的数目除以参考序列中的位置的总数(即窗口大小),将结果乘以100,得到序列同一性的百分比,可以计算出百分比。当在搜索中使用时,通过选自本领域众所周知的各种序列对比算法和程序的合适技术,可以评价同源性。这样的算法和程序的实例包括但不限于TBLASTN,BLASTP,FASTA,TFASTA和CLUSTALW(Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85(8)2444-2448,Altschul等,1990,J.Mol.Biol.215(3)403-410,Thompson等,1994,Nucleic acid Res.22(2)4673-4680,Higgins等,1996,Methods Enzymol.266383-402,Altschul等,1990,J.Mol.Biol.215(3)403-410,Altschul等,1993,Nature Genetics 3266-272)。在一个特别优选的实施方案中,使用本领域众所周知的基础的局部比对搜索工具(BasicLocal Alignment Search Tool)(BLAST),评价了蛋白或核酸序列的同源性(例如,见Karlin和Altschul,1990,Proc.Natl.Acad.Sci.USA 872267-2268,Altschul等,1990,J.Mol.Biol.215403-410,Altschul等,1993,Nature Genetics 3266-272,Altschul等,1997,Nuc.Acids Res.253389-3402)。具体地,5个特化的-BLAST程序可以用于执行下述的任务,以实现对比或搜索(1)使用BLASTP和BLAST3,对比氨基酸查询序列和蛋白序列数据库;(2)使用BLASTN,对比核苷酸查询序列和核苷酸序列数据库;(3)使用BLASTX,对比概念地翻译的产物(其中核苷酸查询序列(两条链)被转变(convert)了超过6个阅读框)和蛋白序列数据库;(4)使用TBLASTN,对比所有被转变了超过6个阅读框的蛋白查询序列(两条链)和核苷酸序列数据库;和(5)使用TBLASTX,对比被转变了超过6个阅读框的核苷酸查询序列和核苷酸序列数据库。
通过指定氨基酸查询序列或核酸查询序列和优选地从蛋白序列数据库或核酸序列数据库得到的实验序列之间的称作“高分片段对”的类似的片段,BLAST程序能鉴定出同源序列。使用本领域众所周知的评分矩阵,可以优选地鉴定(比对)大量的高分片段对。优选地,评分矩阵是BLOSUM62矩阵(Gonnet等,1992,Science 2561443-1445,Henikoff和Henikoff,1993,Proteins 1749-61)。可以使用PAM或PAM250矩阵,尽管它们不是象BLOSUM62矩阵一样优选的(例如,见,Schwartz和Dayhoff,编,1978,Matrices for DetectingDistance RelationshipsAtlas of Protein Sequence andStructure,WashingtonNational Biomedical ResearchFoundation)。BLAST程序能评价所有鉴定出的高分片段对的统计显著性,并优选地选择能满足使用者独立地定义的显著性阈值水平的片段,例如,使用者设定的同源性。优选地,使用Karlin公式评价高分片段对的统计显著性(见Karlin和Altschul,1990,Proc.Natl.Acad.Sci.USA 872267-2268)。
如本文所使用的,术语“引物”指能在大分子合成酶促反应中起始要合成的大分子化合物的反应所需的物质。在合成核酸分子的反应中,可以使用与要合成的大分子化合物的一部分互补的核酸分子(例如,DNA,RNA,等)。
经常用作引物的核酸分子包括具有至少8个邻接的核苷酸的长度的核酸序列、且与目标基因的核酸序列互补的核酸分子。这样的核酸序列优选地具有至少9个邻接的核苷酸的长度,更优选地至少10个邻接的核苷酸的长度,甚至更优选地至少11个邻接的核苷酸的长度,至少12个邻接的核苷酸的长度,至少13个邻接的核苷酸的长度,至少14个邻接的核苷酸的长度,至少15个邻接的核苷酸的长度,至少16个邻接的核苷酸的长度,至少17个邻接的核苷酸的长度,至少18个邻接的核苷酸的长度,至少19个邻接的核苷酸的长度,至少20个邻接的核苷酸的长度,至少25个邻接的核苷酸的长度,至少30个邻接的核苷酸的长度,至少40个邻接的核苷酸的长度,和至少50个邻接的核苷酸的长度。用作引物的核酸序列包括与上述序列具有至少70%、更优选地至少80%、甚至更优选地至少90%和最优选地至少95%同源性的核酸序列。作为引物的合适序列可以根据要合成(扩增)的序列的性质而变化。本领域的技术人员可以根据目标序列设计出合适的引物。这样的引物设计是本领域众所周知的,且可以手工地或使用计算机程序(例如,LASERGENE,Primer Select,DNAStar)进行。
如本文所使用的,术语“表位”指其详细结构尚未被必要地定义的抗原决定簇,只要它能引起抗原-抗体反应即可。因此,术语“表位”包括一组氨基酸残基,其能参与特定免疫球蛋白的识别,或者在T细胞的情形中,这些残基是T细胞受体蛋白和/或主要组织相容性复合体(MHC)受体的识别所必需的。该术语也与“抗原决定簇”或“抗原决定簇位点”可互换地使用。在免疫学领域,体内地或体外地,表位是分子的特征(例如,初级、二级和三级肽结构和电荷),其形成能被免疫球蛋白、T细胞受体或HLA分子识别的位点。包括肽的表位包含3个或更多个氨基酸,其空间构象是该表位所独有的。通常,表位由至少5个这样的氨基酸组成,更常见地,由至少6,7,8,9或10个这样的氨基酸组成。表位的长度越大,表位与原始肽的相似性越大,即,更长的表位一般是优选的。当考虑构象时,情况未必是这样的。确定氨基酸的空间构象的方法是本领域已知的,且包括,例如,X-射线结晶学和二维核磁共振光谱学。而且,使用本领域众所周知的技术,可以容易地鉴定出特定蛋白中的表位。还参见,Geysen等,Proc.Natl.Acad.Sci.USA(1984)813998(general method forrapidly synthesizing peptides to determine the location ofimmunogenic epitopes in a given antigen);美国专利号4,708,871(procedures for identifying and chemically synthesizingepitopes of antigens);和Geysen等,Molecular Immunology(1986)23709(technique for identifying peptides with high affinityfor a given antibody)。在简单的免疫测定中,可以鉴别出能识别相同表位的抗体。因而,测定包含肽的表位的方法是本领域众所周知的。如果提供了表位的初级核酸或氨基酸序列,则使用本领域的技术人员众所周知的常见技术,可以测定出这样的表位。
因此,包含肽的表位需要具有至少3个氨基酸、优选地至少4个氨基酸、更优选地至少5个氨基酸、至少6个氨基酸、至少7个氨基酸、至少8个氨基酸、至少9个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸和至少25个氨基酸的长度的序列。表位可以是线性的或构象的。
(基因的修饰)在特定的蛋白分子(例如,DNA聚合酶,等)中,包含在序列中的特定的氨基酸可以被蛋白结构中的另一个氨基酸取代,例如阳离子区或底物分子结合位点,而不显著减少或损失相互作用的结合能力。蛋白的相互作用能力或其它性质决定了蛋白的特定的生物功能。因此,可以在氨基酸序列中或在DNA编码序列水平进行特定氨基酸取代,以在取代后生成能维持原始性质的蛋白。因此,可以对如本文所公开的肽和能编码这种肽的DNA进行各种修饰,而不显著损失生物有效性。或者,可以修饰能编码DNA聚合酶的核酸序列,从而修饰DNA聚合酶的校对功能。
当设计上述的修饰时,可以考虑氨基酸的疏水性指数。疏水氨基酸指数在为蛋白提供相互作用的生物功能中起重要作用,这是本领域普遍公认的(Kyte.J和Doolittle,R.F.,J.Mol.Biol.157(1)105-132,1982)。氨基酸的疏水性质有助于蛋白的二级结构,从而调节蛋白和其它分子(例如,酶,底物,受体,DNA,抗体,抗原,等)之间的相互作用。基于其疏水性和电荷性质,为每种氨基酸指定如下的疏水性指数异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。
众所周知,如果特定的氨基酸被具有相似的疏水性指数的另一种氨基酸取代,得到的蛋白仍然可能具有与原始蛋白相似的生物功能(例如,具有等价酶活性的蛋白)。对于这样的氨基酸取代,疏水性指数优选地在±2内,更优选地在±1内,且甚至更优选地在±0.5内。本领域认为,这样的基于疏水性的氨基酸取代是有效的。
在修饰本发明的基因时,可以考虑亲水性指数。如美国专利号4,554,101所述,为氨基酸残基指定下面的亲水性指数精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5)和色氨酸(-3.4)。应当明白,氨基酸可以被具有相似亲水性指数的另一种氨基酸取代,且仍然可以提供生物等价物。对于这样的氨基酸取代,亲水性指数优选地在±2内,更优选地±1,且甚至更优选地±0.5。
如本文所使用的术语“保守取代”指氨基酸取代,其中被取代的氨基酸和取代氨基酸具有相似的亲水性指数或/和疏水性指数。例如,在亲水性或疏水性指数在±2内、优选地在±1内,且更优选地在±0.5内的氨基酸之间进行保守取代。保守取代的实例包括但不限于在每种下述的残基对内的取代精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;和缬氨酸、亮氨酸和异亮氨酸,这是本领域的技术人员众所周知的。
如本文所使用的,术语“变体”指部分地与原始物质不同的物质,例如多肽、多核苷酸等。这样的变体的实例包括取代变体、添加变体、缺失变体、截短的变体、等位基因的变体,等。这样的变体的实例包括但不限于相对于参考核酸分子或多肽具有一个或几个取代、添加和/或缺失的核苷酸或多肽,或具有至少一个取代、添加和/或缺失的核苷酸或多肽。变体可以具有或不具有参考分子(例如,野生型分子,等)的生物活性。根据目的,可以给变体赋予其它的生物活性,或者缺失部分生物活性。使用本领域众所周知的技术,可以进行这样的设计。或者,通过从生物中分离,以生产变体,可以得到已知其性质的变体,且可以扩增该变体的核酸序列,以得到序列信息。因此,对于宿主细胞,将源自异源物种的对应基因或其产物视作“变体”。
如本文所使用的,术语“等位基因”指位于与对应的基因等同的基因座处的遗传变体,这2个基因在这里彼此区别开。因此,本文所使用的术语“等位基因变体”指与特定的基因具有等位基因关系的变体。这样的等位基因变体通常具有与对应的等位基因相同或非常相似的序列,或者通常具有几乎相同的生物活性,尽管它很少具有不同的生物活性。如本文所使用的术语“物种同系物”或“同系物”指与特定物种的特定基因具有氨基酸或核苷酸同源性的物质(优选地至少60%同源性,更优选地至少80%、至少85%、至少90%和至少95%同源性)。从本说明书的描述中,可以清楚地明白得到这样的物种同系物的方法。术语“直向同源体”(也称作直向同源基因)指源自共同祖先的不同物种中的基因(由于物种形成)。例如,在具有多基因结构的血红蛋白基因家族的情况下,人和小鼠α-血红蛋白基因是直向同源体,而人α-血红蛋白基因和人β-血红蛋白基因是共生同源体(paralog)(由基因复制生成的基因)。直向同源体可以用于估计分子进化系统树。通常,在不同物种中的直向同源体可以具有与原始物种相似的功能。因此,本发明的直向同源体可以用于本发明。
如本文所使用的,术语“保守的(或保守地修饰的)变体”应用于氨基酸和核酸序列。关于特定的核酸序列,保守地修饰的变体指那些能编码相同的或基本上相同的氨基酸序列的核酸。因为遗传密码的简并性,大量的功能上相同的核酸可以编码任意的特定蛋白。例如,密码子GCA、GCC、GCG和GCU都能氨基酸丙氨酸。因而,在用密码子限定丙氨酸的每个位点,可以将密码子改成所述的对应密码予中的任一个,而不改变编码的多肽。这样的核酸变异是“沉默变异”,其代表着保守地修饰的变异的一个种类。能编码多肽的每个核酸序列在这里也描述了该核酸的每个可能的沉默变异。本领域的技术人员能够认识到,可以修饰核酸中的每个密码子(AUG除外,它通常是甲硫氨酸的唯一密码子;TGG除外,它通常是色氨酸的唯一密码子),以生成功能上相同的分子。因此,在每个所述的序列中,都暗示着能编码多肽的核酸的每个沉默变异。优选地,可以进行这样的修饰,同时避免取代半胱氨酸,后者是能极大地影响多肽的高级结构的氨基酸。这样修饰碱基序列的方法的实例包括使用限制酶切割等;通过使用DNA聚合酶、克列诺(Klenow)片段、DNA连接酶等处理进行连接等;和使用合成的寡核苷酸进行位点特异性的碱基取代的方法(特异性的定位诱变;Mark Zoller和Michael Smith,Methods in Enzymology,100,468-500(1983))。使用分子生物学领域常用的方法,可以进行修饰。
为了制备功能上等同的多肽,除了氨基酸取代以外,可以进行氨基酸添加、缺失和/或修饰。氨基酸取代指将原始肽链的至少一个氨基酸替换为不同的氨基酸,例如用不同的氨基酸替换1-10个氨基酸,优选地1-5个氨基酸,更优选地1-3个氨基酸。氨基酸添加指向原始肽链添加至少一个氨基酸,例如向原始肽链添加1-10个氨基酸,优选地1-5个氨基酸,和更优选地1-3个氨基酸。氨基酸缺失指缺失至少一个氨基酸,例如缺失1-10个氨基酸,优选地1-5个氨基酸,和更优选地1-3个氨基酸。氨基酸修饰包括但不限于酰胺化,羧基化,硫酸化,卤化,烷化,糖基化,磷酸化,羟基化,酰化(例如,乙酰化),等。要取代的或添加的氨基酸可以是自然产生的或非自然产生的氨基酸或氨基酸类似物。自然产生的氨基酸是优选的。
如本文所使用的,术语“肽类似物”或“肽衍生物”指与肽不同、但是具有至少一种与该肽等同的化学或生物功能的化合物。因此,肽类似物包括相对于原始肽具有至少一种氨基酸类似物或氨基酸衍生物添加或取代的那些。肽类似物具有上述的添加或取代,从而使其功能基本上与原始肽的功能相同(例如,相似的pKa值,相似的官能团,相似的与其它分子的结合方式,相似的水溶性,等)。使用本领域众所周知的技术,可以制备出这样的肽类似物。因此,肽类似物可以是含有氨基酸类似物的聚合物。
类似地,如本文所使用的,术语“多核苷酸类似物”或“核酸类似物”指与多核苷酸或核酸不同、但是具有至少一种与多核苷酸或核酸等同的化学或生物功能的化合物。因此,多核苷酸或核酸类似物包括相对于原始多核苷酸或核酸具有至少一种核苷酸类似物或核苷酸衍生物添加或取代的那些。
如本文所使用的核酸分子包括这样的核酸分子,其中缺失了该核酸的一部分序列,或者被其它碱基取代,或者插入了其它的核酸序列,只要该核酸表达的多肽基本上具有与如上所述的自然产生的多肽相同的活性即可。或者,可以将其它核酸连接到该核酸的5′末端和/或3′末端。核酸分子可以包括可在严格的条件下与能编码多肽的基因杂交、且能编码具有基本上相同功能的多肽的那些。这样的基因是本领域已知的,且可以用于本发明。
通过众所周知的PCR方法(即,化学合成),可以得到上述的核酸。该方法可以与例如定位诱变、杂交等组合。
如本文所使用的,关于多肽或多核苷酸的术语“取代”、“添加”或“缺失”指氨基酸或其取代基或核苷酸或其取代基分别相对于原始多肽或多核苷酸的取代、添加或缺失。这可以通过本领域众所周知的技术来实现,包括定位诱变技术等。多肽或多核苷酸可以具有任意数目(>0)的取代、添加或缺失。该数目可以与具有这样数目的取代、添加或缺失的变体一样大,所述变体维持目的功能(例如激素和细胞因子的信息传递功能,等)。例如,这样的数目可以是1个或几个,优选地在全长的20%或10%内,或不超过100,不超过50,不超过25,等。
(遗传工程)通过遗传工程技术,可以生产出如本文所使用的蛋白(例如DNA聚合酶和其片段和变体等),并导入细胞中。
当在本文中提及基因时,术语“载体”或“重组载体”指能将目标多核苷酸序列转移到靶细胞中的载体。这样的载体能自我复制或整合进宿主细胞(例如,原核细胞,酵母,动物细胞,植物细胞,昆虫细胞,个体动物,和个体植物,等)的染色体中,且含有位于适合转录本发明的多核苷酸的位点处的启动子。将适用于克隆的载体称作“克隆载体”。这样的克隆载体通常含有包含许多限制位点的多克隆位点。限制位点和多克隆位点是本领域众所周知的,且可以根据目的适当地或任选地使用。该技术描述在如这里所述的文献中(例如,Sambrook等(同上))。这样的载体包括例如质粒。
如本文所使用的,术语“质粒”指存在于染色体外、且能自主复制的遗传因子。当特别提出时,将包含在细胞核的线粒体、叶绿体等中的DNA一般地称作细胞器DNA,且不同于质粒,即不包括在质粒中。
质粒的实例包括但不限于大肠杆菌pET(TAKARA),pUC(TOYOBO),pBR322(TOYOBO),pBluescriptII(TOYOBO);酵母pAUR(TAKARA),pESP(TOYOBO),pESC(TOYOBO);枯草芽孢杆菌pHY300PLK(TAKARA);真菌病pPRTI(TAKARA),pAUR316(TAKARA);动物细胞pCMV(TOYOBO),pBK-CMV(TOYOBO);等。
如本文所使用的,术语“表达载体”指包含结构基因和用于调节其表达的启动予以及各种调节元件的核酸序列,所述调节元件的状态允许它们在宿主细胞中运行。调节元件可以优选地包括终止子,选择性标记例如抗药性基因,和沉默予和/或增强子。本领域的技术人员熟知,生物(例如,植物)表达载体的类型和调节元件的类型可以依赖于宿主细胞而异。通过将特定的启动子导入细胞,可以在特定条件下调节细胞的倾向于错误的频率。
如本文所使用的,用于原核细胞的“重组载体”包括,例如,pcDNA3(+),pBluescript-SK(+/-),pGEM-T,pEF-BOS,pEGFP,pHAT,pUC18,pFT-DESTTM,42GATEWAY(Invitrogen),等。
如本文所使用的,用于动物细胞的“重组载体”包括,例如,pcDNAI/Amp,pcDNA I,pCDM8(都商业上购自Funakoshi,Tokyo,日本),pAGE107[日本
发明者古泽满 申请人:古泽满, 株式会社尼奥·摩根研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1