具有二级酰胺酶活性的酶及其应用方法

文档序号:447533阅读:1167来源:国知局
专利名称:具有二级酰胺酶活性的酶及其应用方法
技术领域
本发明一般地涉及分子和细胞生物学和生物化学。本发明提供了 酰胺酶、编码该酰胺酶的多聚核苷酸、这些多聚核苷酸和多肽的应用,
并且, 一方面,本发明提供了具有二级酰胺酶(secondary amidase)活 性例如具有酰胺水解活性的酶,包括具有肽酶、蛋白酶和/或乙内酰脲 酶活性的酶。在别的方面,本发明的酶可以用于加工食品,例如,增 强食品风味(例如,酶催熟奶酪)、促进杀灭细菌和真菌、精细化学 中间物的修饰和去保护、合成肽键、进行手性拆分、水解头孢菌素C。 本发明的酶可以用于产生7-氨基头孢烷酸(7-ACA)和半合成的头孢 菌素抗生素,包括头孢噻吩、头孢噻啶和头孢呋辛。本发明的酶可以 用作抗微生物试剂,例如,细胞壁水解剂。
背景技术
二级酰胺酶包括许多有用的酶,包括肽酶、蛋白酶和乙内酰脲酶。 此类酶可以用于一定范围的商业应用。例如,二级酰胺酶可以用于1) 增强食品风味,特别是奶酪(称之为酶催熟奶酪);2)促进杀灭细菌 和真菌;3)精细化学中间物的修饰和去保护;4)合成肽键;5)进行 手性拆分。特别地,在本领域内需要一种能够水解头孢菌素C的酶。 头孢菌素C是头孢菌素生物合成途径的发酵产物,虽然作为抗生素本 身,头孢菌素C表现出一些抗革兰氏阴性微生物的活性,但是头孢菌 素C的主要商业用途是作为别的类似于头孢菌素的抗生素的构建基 础。例如,可以除去D-a-氨基己二酰侧链,产生7-氨基头孢烷酸
(7-ACA), 7-ACA是多种半合成的头孢菌素抗生素,包括头孢噻吩、 头孢噻啶和头孢呋辛,的前体。
半合成的头孢菌素属于最广泛使用的抗生素。这些抗生素从7-氨 基头孢烷酸(7-ACA)开始合成,7-氨基头孢烷酸是通过头孢菌素C
(Ceph C)脱酰基作用获得的一种化合物。传统上是使用化学工艺进 行脱酰基作用。然而,化学工艺涉及使用许多有毒化合物,产生许多代价大的化学废物。因此,从Ceph C产生7-ACA的酶促途径是非常 吸引人的。目前,从CephC酶促产生7-ACA是应用一种双酶工艺(图 7)完成的。第一种酶,D-氨基酸氧化酶,用于把Ceph C氧化为酮酸 中间产物,然后该酮酸中间产物被过氧化氢脱羧,产生戊二酰-7-ACA。 然后戊二酰-7-ACA通过第二种酶,戊二酰-7-ACA酰基转移酶的作用 脱酰基形成7-ACA。虽然一些戊二酰-7-ACA酰基转移酶可以直接把 Ceph C转化为7-ACA,但是它们效率很低。虽然如此,对Ceph C具 有可测量出的活性的戊二酰-7-ACA酰基转移酶可以归类为头孢菌素C 酰基转移酶。
对二级酰胺酶的寻找由于缺少适于高通量筛选的底物/分析组合而 受到限制。以前的研究努力所使用的底物或分析存在着低通量、缺乏 灵敏度和/或缺少特异性的不足。
在此被讨论的出版物仅仅是提供了它们的公开内容,这些公开是 在本申请的申请日之前。在此并不承认,本发明一定不具相对于在先 发明的公开内容占先的资格。
发明概述
本发明提供具有酰胺酶活性的多肽,例如具有肽酶、蛋白酶和/或 乙内酰脲酶活性的酶,这里的酰胺酶活性包括二级酰胺酶活性,例如 催化酰胺的水解。在可供选择的方面,本发明的酶可以用于加工食品, 例如,增强食品风味(例如,酶促熟奶酪)、促进杀灭细菌和真菌、 精细化学中间物的修饰和去保护、合成肽键、进行手性拆分、水解头 孢菌素C。本发明的酶可以用于产生7-氨基头孢烷酸(7-ACA)和半 合成的头孢菌素抗生素,包括头孢噻啶、头孢噻啶和头孢呋辛。本发 明的酶可以用作抗微生物试剂,例如,作为细胞壁水解剂。
本发明提供分离的或重组的核酸,其包含的核酸序列在至少大约 100个残基的范围内,与SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQID NO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:31, SEQIDNO:33, SEQIDNO:39, SEQ IDNO:41, SEQIDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ IDNO:49, SEQIDNO:51, SEQ IDNO:53, SEQ IDNO:59, SEQ IDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQ IDNO:71, SEQIDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQ IDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ IDNO:lll具有至少50%序列一致性(identity),与SEQIDNO:35, SEQIDNO:73, SEQIDNO:89, SEQ IDNO:113具有至少55%序列一 致性,与SEQIDNO:27, SEQIDNO:29, SEQ ID NO:57具有至少60 %序列一致性,与SEQ ID NO:99具有至少65 %序列一致性,与SEQ ID NO:55具有至少90%序列一致性,与SEQ ID NO:37具有至少99%序 列一致性,其中该核酸编码至少一种具有酰胺酶活性的多肽,所述的 序列一致性通过应用序列比较算法的分析或通过观察验证(visual inspection)确定。
一方面,所述分离的或重组的核酸包括在至少大约100个残基范 围内,与SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:B, SEQIDNO:15, SEQID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:39, SEQID NO:41 , SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:59, SEQIDNO:61, SEQ IDNO:63, SEQIDNO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71 , SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQ IDNO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQIDNO:101, SEQIDNO:103, SEQIDNO:105, SEQ ID NO:107, SEQIDNO:109, SEQIDNO:lll, SEQ ID NO:113具有至少 55 %序列一致性的核酸序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ IDNO: 19, SEQ ID NO:21 , SEQ ID NO:23 , SEQ ID NO:25, SEQ ID NO:27, SEQ丽0:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO: 43, SEQ ID NO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:57, SEQ ID NO:59, SEQIDNO:61, SEQIDNO:63, SEQ IDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQ IDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQ ID NO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:101, SEQIDNO:103, SEQ IDNO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll , SEQ IDNO:113具有至少60%序列一致性的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQ IDNO:15, SEQIDNO:17, SEQIDNO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO: 105, SEQIDNO:107, SEQID NO:脂,SEQIDNO:lll, SEQ ID NO: 113具有至少65%序列一致性 的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31 , SEQIDNO:33, SEQIDNO:35, SEQIDNO:39, SEQIDNO:41' SEQIDNO:43, SEQIDNO:45, SEQ ID NO:47, SEQIDNO:49, SEQ IDNO:51, SEQIDNO:53, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO: 103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQ ID NO: 111, SEQ ID NO:113具有至少70%序列一致性 的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQ ID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ ID NO: 11 , SEQ ID NO: 13 , SEQ ID NO: 15 , SEQ ID NO: 17 , SEQ ID NO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51 , SEQ ID NO:53, SEQ ID NO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQ IDNO:93, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO:113具有至少75%序列一致性 的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQ ID NO: 43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQ IDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO:113具有至少80%序列一致性 的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQ IDNO:47, SEQ ID NO:49, SEQIDNO:51, SEQ ID NO:53, SEQ ID NO:57, SEQ IDNO:59, SEQIDNO:61, SEQ IDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQ IDNO:85, SEQIDNO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQ IDNO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQ IDNO:109, SEQIDNO:lll, SEQ IDNO: 113具有至少85%序列一致 性的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ IDNO:29, SEQ ID NO:31, SEQ IDNO:33, SEQIDNO:35, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQ IDNO:47, SEQ ID NO:49, SEQIDNO:51, SEQ ID NO:53, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61 , SEQ ID NO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQ IDNO:73, SEQIDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQ IDNO:99, SEQIDNO:101, SEQ ID NO: 103, SEQIDNO:105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO:113具有至少 90%序列一致性的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQ ID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQ IDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQ IDNO:65, SEQIDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQ IDNO:91, SEQIDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQIDNO:101, SEQIDNO:103, SEQIDNO:105, SEQ ID NO:107, SEQIDNO:109, SEQIDNO:lll, SEQ ID NO:113具有至少 95%序列一致性的序列。
一方面,所述核酸包括在至少大约100个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQ ID NO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQ ID NO:27, SEQ IDNO:29, SEQ IDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ IDNO:45, SEQIDNO:47, SEQ ID NO:49, SEQIDNO:51, SEQ ID NO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQ IDNO:61,SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQ IDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQ IDNO:97, SEQIDNO:99, SEQIDNO:101, SEQIDNO:103, SEQ ID NO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll, SEQ ID NO:113具有至少99%序列一致性的序列。
一方面,所述核酸序列包括在SEQIDNO:l, SEQIDNO:3, SEQ IDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQIDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQIDNO:47, SEQ IDNO:49, SEQIDNO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61 , SEQ ID NO:63, SEQ ID NO:65, SEQIDNO:67, SEQIDNO:69, SEQE)NO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQE)NO:97, SEQIDNO:99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ IDNO:109, SEQ ID NO: 111, SEQIDNO:113中阐明的序列。
本发明提供编码包括在SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQIDNO:8, SEQ ID NO: 10, SEQIDNO:12, SEQIDNO:14, SEQIDNO:16, SEQIDNO:18, SEQIDNO:20, SEQIDNO:22, SEQ IDNO:24, SEQ ID NO:26, SEQIDNO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQIDNO:42, SEQIDNO:44, SEQIDNO:46, SEQIDNO:48, SEQ ID NO.50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQIDNO:60, SEQIDNO:62, SEQIDNO:64, SEQIDNO:66, SEQ IDNO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84,SEQIDNO:86, SEQIDNO:88, SEQIDNO:90, SEQIDNO:92, SEQ IDNO:94, SEQIDNO:96, SEQIDNO:98, SEQIDNO:100, SEQ ID NO:102, SEQIDNO:104, SEQIDNO:106, SEQIDNO:108, SEQ ID NO:llO, SEQIDNO:113, SEQ ID NO:114中所列序列的多肽的分离的 或重组的核酸。
一方面,所述序列比较运算是BLAST版本2.2.2运算,其中过滤 设置设为blastall-p blastp-d "nr pataa"-F F,其它所有选项都设为默认值。
一方面,所述核酸包括在至少大约200, 300, 400, 500, 550, 600, 或650个残基范围内,与SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQID NO:15, SEQ IDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQ IDNO:33, SEQIDNO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41. SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ IDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQ IDNO:77, SEQ ID NO:79, SEQIDNO:81, SEQIDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQ ID NO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQ ID NO: 103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:109, SEQ ID NO: 111, SEQIDNO:113具有至少50X序列一致性的序列。
一方面,所述核酸包括在至少大约700个残基范围内,与SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO: 19, SEQIDNO:21, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ ID NO:47, SEQ ID NO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQEDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQ ID NO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQ IDNO:93, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQID NO:101, SEQIDNO:103, SEQ ID NO: 105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO: 113具有至少50%序列一致性 的序列。
一方面,所述核酸包括在至少大约800个残基范围内,与SEQ ID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQ IDNO:21, SEQIDNO:25, SEQ ID NO:27, SEQIDNO:31, SEQ ID NO:33, SEQIDNQ:35, SEQIDNO:39, SEQIDNO:41, SEQIDNO: 43, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQIDNO:79, SEQ IDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQ IDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQ ID NO:103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:lll, SEQID NO:113具有至少50%序列一致性的序列。
一方面,所述核酸包括在至少大约900个残基范围内,与SEQID NO:3, SEQIDNO:5, SEQIDNO:9, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:31, SEQ IDNO:35, SEQ ID NO:39, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:53, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:73, SEQIDNO:75, SEQIDNO:81, SEQIDNO:83, SEQIDNO:87, SEQ IDNO:89, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQ ID NO: 111 , SEQ ID NO: 113具有至少50 %序列一致性的序列。
一方面,所述核酸包括在至少大约900个残基范围内,与SEQ ID NO:3, SEQIDNO:5, SEQIDNO:9, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:31, SEQIDNO:35, SEQ ID NO:39, SEQ ID NO :47, SEQ ID NO :49, SEQID NO:53, SEQ IDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:73, SEQIDNO:75, SEQIDNO:81, SEQIDNO:83, SEQIDNO:87, SEQ IDNO:89, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO: 111 , SEQ ID NO: 113具有至少50%序列一致性的序列。
一方面,所述核酸包括在至少大约1000个残基范围内,与SEQID NO:15, SEQ IDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:31, SEQIDNO:35, SEQIDNO:47, SEQIDNO:49, SEQIDNO:53, SEQ IDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQIDNO:73, SEQ ID NO:75, SEQIDNO:81, SEQIDNO:87, SEQIDNO:89, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101 , SEQ ID NO: 103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:lll, SEQ ID NO: 113 具有至少50%序列一致性的序列。
一方面,所述核酸包括在至少大约1200个残基范围内,与SEQID NO:31, SEQIDNO:35, SEQIDNO:47, SEQIDNO:49, SEQIDNO:53, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:81, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:97, SEQIDNO:99, SEQ ID NO:101, SEQ ID NO: 105, SEQID NO:107, SEQIDNO:lll具有至少50%序列一致性的序列。
本发明提供分离的或重组的核酸,其中所述核酸包括在严紧条件 下与包括在SEQ IDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQID NO:17, SEQIDNO:19, SEQ IDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41 , SEQ ID NO: 43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQ IDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQIDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ IDNO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQ IDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQIDNO:103, SEQ IDNO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll, SEQID NO:113中所列序列的核酸杂交的序列,其中所述核酸编码具有酰胺酶 活性的多肽。
一方面,所述核酸的长度为至少大约50, 100, 150, 200, 300, 400或500个残基。 一方面,所述核酸的长度为至少大约600, 700, 800, 900, 1000, 1100或1200个残基或者基因或转录物的全长。
一方面,所述严紧条件包括洗涤步骤,该洗涤步骤包括在大约65°C 的温度,在0.2xSSC中洗涤大约15分钟。
一方面,所述酰胺酶活性包括水解酰胺键。所述酰胺酶活性可以 包括二级酰胺酶活性。 一方面,所述酰胺酶活性包括内酰胺酶活性。 一方面,所述酰胺酶活性包括C-端酰胺酶活性。所述酰胺酶活性可以 包括N-端酰胺酶活性。所述酰胺酶活性可以包括水解蛋白中的函胺键。 所述酰胺酶活性可以包括水解在药物或药物组合物中的酰胺键,所述 药物例如头孢菌素,如头孢菌素C。 一方面,所述酰胺酶活性包括水 解在头孢菌素C中的酰胺键产生7-氨基头孢垸酸(7-ACA)。
一方面,所述酰胺酶活性具有对映选择性。所述酰胺酶可以从消 旋混合物中产生对映结构纯的L-氨基酸。所述酰胺酶可以通过氨基酸 垸基酯或N-保护的肽烷基酯的酶促转化产生肽。
一方面,所述酰胺酶在包括温度在约37t到约95"C的条件下保持 活性。所述酰胺酶在包括温度在约55'C到约85"C的条件下可以保持活 性。
一方面,所述酰胺酶活性是耐热性的。在暴露于大于37""C到大约 95"C的温度后,所述酰胺酶可以是耐热性的。
本发明提供核酸探针,所述核酸探针用于确定编码具有酰胺酶活 性的多肽的核酸,其中所述探针包括本发明的一种核酸序列的至少10 个连续碱基。本发明提供核酸探针,所述核酸探针用于确定编码具有 酰胺酶活性的多肽的核酸,其中所述探针包括含有与本发明的核酸序 列具有至少50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90 %, 95%, 98%, 99%或更高序列一致性的核酸序列的核酸,其中所述序列一致性通过应用序列比较运算的分析或通过观察验证确定。一 方面,所述探针可以包括含有一种核酸序列的至少大约10到50,大约
20到60,大约30到70,大约40到80,或大约60到100,或大约70 到150个连续碱基的寡聚核苷酸。
本发明提供扩增引物序列对,所述扩增引物序列对用于扩增编码 本发明的多肽,例如具有酰胺酶活性的多肽的核酸,其中所述引物对 可以扩增本发明的核酸序列。所述扩增引物序列对的一个或者每个构 件都包括可以含有序列的至少大约10到50个连续碱基的寡聚核苷酸。 本发明提供扩增编码具有酰胺酶活性的多肽的核酸的方法,包括用能 够扩增本发明的核酸序列的扩增弓I物序列对扩增模板核酸。
本发明提供包括本发明的核酸的表达序列盒。 一方面,所述核酸 可以有效连接(operably linked to)于动物或植物启动子。 一方面,所 述表达序列盒可以进一步包括植物表达载体。所述植物表达载体可以 包括植物病毒。 一方面,所述植物启动子可以包括马铃薯,水稻,玉 米,小麦或大麦启动子。 一方面,所述启动子可以包括来源于根癌农 杆菌(v4gra^cten'wm fwme/adews)的T-DNA的启动子。 一方面,所述 启动子可以是组成型启动子。所述组成型启动子可以是CaMV35S。另 一方面,所述启动子可以是诱导型启动子。 一方面,所述启动子可以 是具有组织特异性的启动子。所述的组织特异的启动子可以是种子特 异的,叶特异的,根特异的,茎特异的或脱落诱导的(abscission-induced) 启动子。
本发明提供包括本发明的核酸的载体。本发明提供包括本发明的 载体或本发明的核酸的克隆媒介物(vehicle)。 一方面,所述克隆媒介 物可以包括病毒载体,质粒,噬菌体,噬粒(phagemid),粘粒(cosmid), fos-质粒(fosmid),细菌噬菌体或人工染色体。 一方面,所述病毒载体 可以包括腺病毒载体,逆转录病毒载体或腺相关病毒载体。另一方面, 所述克隆媒介物可以包括细菌人工染色体(BAC),质粒,细菌噬菌 体P1衍生的载体(PAC),酵母人工染色体(YAC)或哺乳动物人工 染色体(MAC)。
本发明提供包含本发明的载体、本发明的核酸或本发明的克隆媒 介物的转化细胞。 一方面,所述细胞可以是细菌细胞,哺乳动物细胞,真菌细胞,酵母细胞,昆虫细胞或植物细胞。 一方面,所述植物细胞 可以是马铃薯,水稻,玉米,小麦,烟草或大麦细胞。
本发明提供包含本发明的载体、本发明的核酸或本发明的克隆媒 介物的转基因非人动物。
一方面,所述动物可以是鼠。
本发明提供包含本发明的载体、本发明的核酸或本发明的克隆媒 介物的转基因植物。
一方面,所述植物可以是玉米植物,高梁植物, 马铃薯植物,西红柿植物,小麦植物,油籽植物,油菜籽植物,大豆 植物,水稻植物,大麦植物,草或烟草植物。
本发明提供包含本发明的载体、本发明的核酸或本发明的克隆媒 介物的转基因种子。
一方面,所述种子可以是玉米种,小麦种,油籽, 油菜籽,大豆种,棕榈仁,向日葵籽,芝麻籽,水稻,大麦,花生, 或烟草植物的种子。
本发明提供包括本发明的核酸序列或其子序列(subsequence)的 反义寡聚核苷酸。 一方面,所述反义寡聚核苷酸的长度可以是大约10 个碱基到50个碱基,大约20碱基到60个碱基,大约30个碱基到70 个碱基,大约40个碱基到80个碱基,或大约60个碱基到100个碱基。
本发明提供抑制酰胺酶信息(message)在细胞内的翻译的方法, 包括往所述细胞内注入或在所述细胞内表达反义寡聚核苷酸,所述反 义寡聚核苷酸包括在严紧条件下与本发明的核酸互补或能够杂交的核 酸序列。
本发明提供分离的或重组的多肽,所述多肽包括(a)在至少大约 100个残基的范围内,与SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQIDNO:8, SEQIDNO:10, SEQIDNO:12, SEQIDNO:14, SEQID NO:16, SEQ IDNO:18, SEQIDNO:20, SEQIDNO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:32, SEQIDNO:34, SEQIDNO:40, SEQ IDNO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:60, SEQ ID NO:62, SEQIDNO:64, SEQIDNO:66, SEQIDNO:68, SEQIDNO:70, SEQ IDNO:72, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:92, SEQIDNO:94, SEQIDNO:96, SEQIDNO:98, SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQIDNO:108, SEQIDNO:llO, SEQ ID NO:112具有至少50%序列一致性,与SEQ ID NO:36, SEQ ID NO:74, SEQ ID NO:90, SEQ ID NO:114具有至少55%序列一致性, 与SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:58具有至少60%序列 一致性,与SEQ ID NO:100具有至少65X序列一致性,与SEQ ID NO:56 具有至少90%序列一致性,与SEQ ID NO:38具有至少99%序列一致 性的序列;或者(b)由本发明的核酸编码的多肽。 一方面,所述多肽可以具有酰胺酶活性。
一方面,所述多肽包括在至少大约150, 200, 250, 300, 350, 400, 450或500个残基的序列区域具有至少50%—致性的氨基酸序列。一 方面,所述多肽包括在至少大约100个残基的区域具有至少55%, 60 %, 65%, 70%, 75%, 80%, 85%, 90%, 95%或99%—致性的氨 基酸序列。
一方面,所述分离的或重组的多肽可以包括在SEQIDNO:2, SEQ IDN0:4, SEQIDNO:6, SEQ IDNO:8, SEQIDNO:10, SEQIDNO:12, SEQIDNO:14, SEQIDN0:16, SEQIDNO:18, SEQIDNO:20, SEQ IDNO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ IDNO:32, SEQIDNO:34, SEQIDNO:36, SEQIDNO:38, SEQIDNO:40, SEQIDNO:42, SEQIDNO:44, SEQIDNO:46, SEQ IDNO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQIDNO:66, SEQIDNO:68, SEQIDNO:70, SEQIDNO:72, SEQ IDNO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQIDNO:92, SEQIDNO:94, SEQIDNO:96, SEQIDNO:98, SEQ IDNO:100, SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQ IDNO:108, SEQIDNO:110, SEQIDNO:113, SEQ ID NO:114中所 列的氨基酸序列。
一方面,所述酰胺酶活性包括水解酰胺键。所述酰胺酶活性可以 包括二级酰胺酶活性。 一方面,所述酰胺酶活性包括内酰胺酶活性。 一方面,所述酰胺酶活性包括C-端酰胺酶活性。所述酰胺酶活性可以包括N-端酰胺酶活性。所述酰胺酶活性可以包括水解蛋白中的酰胺键。 所述酰胺酶活性可以包括水解在药物或药物组合物中的酰胺键,所述 药物例如头孢菌素,如头孢菌素C。
一方面,所述酰胺酶活性包括水
解在头孢菌素C中的酰胺键产生7-氨基头孢烷酸(7-ACA)。
一方面,所述酰胺酶活性具有对映选择性。所述酰胺酶可以从消
旋混合物中产生对映结构纯的L-氨基酸。所述酰胺酶可以通过氨基酸 烷基酯或N-保护的肽烷基酯的酶促转化产生肽。
一方面,本发明提供分离的或重组的多肽,其中所述酰胺酶活性 是热稳定的。 一方面,所述多肽在包括温度在大约37X:到大约95'C的 条件下可以保持酰胺酶活性。另一方面,所述多肽可以在包括大约55°C 到大约85t:的温度范围,大约7(TC到大约95'C的温度范围,或者大约 90'C到大约95t:的温度范围的条件下保持酰胺酶活性。
另一方面,本发明提供分离的或重组的多肽,其中所述酰胺酶活 是耐热的。 一方面,所述多肽在暴露于大于37X:到大约95-C的温度范 围,大于55'C到大约85t:的温度范围,大于9(TC到大约95'C的温度 范围后保持酰胺酶活性。
本发明提供包含本发明的多肽并缺少信号序列的分离的或重组的 多肽。
一方面,本发明提供本发明的分离的或重组的多肽,其中所述酰 胺酶活性包括在大约37°C,大约100到大约1000单位(units)每毫克 蛋白的范围内的比活。 一方面,所述酰胺酶活性可以包括在大约37。C, 大约500到大约750单位每毫克蛋白的范围内,大约500到大约1200 单位每毫克蛋白的范围内,或者大约750到大约1000单位每毫克蛋白 的范围内的比活。 一方面,所述耐热性可以包括被加热到一个提高的 温度后,仍保留该酰胺酶在37。C时的比活的至少一半。另一方面,所 述耐热性可以包括被加热到一个提高的温度后,仍保留在37。C时大约 500到大约1200单位每毫克蛋白的范围内的比活。
一方面,本发明的分离的或重组的多肽可以包括至少一个糖基化 位点。 一方面,糖基化可以是N-连接的糖基化。 一方面,本发明的多 肽可以在毕赤酵母(尸.pa^on》)或裂变酵母(5*. ; om&)中被表达之 后进行糖基化。本发明提供本发明的分离的或重组的多肽,其中所述多肽在包括
大约pH4.5或pH5或更小pH的条件下保持酰胺酶活性。 一方面,所 述多肽在包括大约pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10或pH 10.5
或更大pH的条件下保持酰胺酶活性。
本发明提供包含本发明的多肽的蛋白制备物,其中所述蛋白制备 物包含液体,固体或凝胶。
一方面,本发明提供包括本发明的多肽和第二结构域的异源二聚 体。 一方面,所述第二结构域可以是一个多肽,所述异源二聚体是融 合蛋白。另一方面,所述第二结构域可以是抗原决定部位(epitope) 或标记(tag)。本发明提供包括本发明的多肽的同型二聚体。
本发明提供具有酰胺酶活性的固定化多肽,其中所述多肽包括本 发明的多肽或含有本发明的多肽的异源二聚体。 一方面,所述多肽可 以固定在细胞,金属,树脂,聚合物,陶瓷,玻璃,微电极,石墨颗 粒,珠子,凝胶,平板,阵列或毛细管上。本发明提供包括本发明的 固定化多肽的阵列。 一方面,阵列可以包含本发明的固定化核酸。
本发明提供分离的或重组的抗体,所述抗体特异地与本发明的多 肽结合,或者与由本发明的核酸编码的多肽结合。 一方面,所述抗体 可以是单克隆抗体或多克隆抗体。本发明提供包括本发明的抗体的杂 交瘤细胞。
本发明提供包含本发明的多肽的动物食品添加剂。本发明提供包 含本发明的多肽的可食用的酶释放基质(enzyme delivery matrices)。
本发明提供分离或鉴定具有酰胺酶活性的多肽的方法,包括步骤 (a)提供本发明的抗体;(b)提供包含多肽的样品;(c)把步骤(b) 的样品与步骤(a)的抗体在所述抗体可以特异地与多肽结合的条件下 接触,由此分离或鉴定具有酰胺酶活性的多肽。
本发明提供制备抗酰胺酶抗体的方法,包括对非人动物按足以导 致体液免疫应答的量施用本发明的核酸,本发明的多肽,或由本发明 的核酸编码的多肽,由此制备抗酰胺酶抗体。
本发明提供产生重组多肽的方法,包括步骤(a)提供与启动子 有效连接的核酸,其中所述核酸包括本发明的核酸;(b)在允许多肽 表达的条件下表达步骤(a)的所述核酸,由此产生重组多肽。 一方面,该方法可以进一步包括用步骤(a)的所述核酸转化宿主细胞,然后再 表达步骤(a)的所述核酸,从而在被转化的细胞中产生重组多肽。 本发明提供鉴定具有酰胺酶活性的多肽的方法,包括以下步骤-
(a) 提供本发明的多肽;(b)提供酰胺酶底物;(c)将多肽与步骤
(b) 的底物接触,检测底物的量的减少或者反应产物的量的增加,其 中所述底物的量的减少或所述反应产物的量的增加表示检测到具有酰 胺酶活性的多肽。 一方面,所述底物可以是蛋白质或酰胺。 一方面, 所述底物可以是头孢菌素C。
本发明提供鉴定酰胺酶底物的方法,包括以下步骤(a)提供本 发明的多肽;(b)提供受测底物;(c)将步骤(a)的多肽与步骤(b) 的受测底物接触,受测底物的量的减少或者反应产物的量的增加,其 中所述底物的量的减少或所述反应产物的量的增加确定所述受测底物 是酰胺酶底物。
本发明提供确定受测化合物是否与多肽特异性结合的方法,包括 以下步骤(a)在允许核酸翻译为多肽的条件下,表达核酸或包含核
酸的载体,其中所述核酸包括本发明的核酸,或者,提供本发明的多
肽;(b)提供受测化合物;(c)将所述多肽与所述受测化合物接触; (d)确定步骤(b)的受测化合物是否特异性地与所述多肽结合。 本发明提供鉴定酰胺酶活性的调节物的方法,包括以下步骤(a) 提供本发明的多肽或由本发明的核酸编码的多肽;(b)提供受测化合 物;(c)将步骤(a)的多肽与步骤(b)的受测化合物接触,并测定 .酰胺酶活性,其中在受测化合物存在的情况下测定的酰胺酶活性与无 受测化合物的情况下测定的酰胺酶活性的变化确定所述受测化合物调 节了酰胺酶活性。 一方面,所述酰胺酶活性可以通过提供酰胺酶底物, 并检测所述底物的量的减少或反应产物的量的增加,或者所述底物的 量的增加或反应产物的量减少来测定。 一方面,与没有受测化合物时 底物或反应产物的量相比较,在有所述受测化合物时所述底物的量的 减少或所述反应产物的量的增加确定所述受测化合物是酰胺酶活性的 激活剂。另一方面,与没有受测化合物时底物或反应产物的量相比较, 在有所述受测化合物时所述底物的量的增加或所述反应产物的量的减 少确定所述受测化合物是酰胺酶活性的抑制剂。本发明提供包括处理器和数据储存设备的计算机系统,其中所述 数据储存设备储存有本发明的多肽,或由本发明的核酸编码的多肽。 一方面,所述计算机系统可以进一步包括序列比较运算和储存有至少 一个参考序列的数据储存设备。所述序列比较运算可以包括说明多态 性的计算机程序。另一方面,所述计算机系统可以进一步包括识别所
述序列的一个或多个特征的识别器(identifier)。
本发明提供储存有多肽序列或核酸序列的计算机可读介质,其中 所述多肽序列包括本发明的多肽或由本发明的核酸编码的多肽。'
本发明提供识别在序列中的特征的方法,包括步骤(a)应用识 别序列中一个或多个特征的计算机程序读出序列,其中所述序列包括 多肽序列或核酸序列,其中所述多肽序列包括本发明的多肽或由本发 明的核酸编码的多肽;(b)用计算机程序识别所述序列中的一个或多 个特征。
本发明提供比较第一序列和第二序列的方法,包括步骤(a)通 过应用比较序列的计算机程序读出第一序列和第二序列,其中所述第 一序列包括多肽序列或核酸序列,其中所述多肽序列包括本发明的多 肽或由本发明的核酸编码的多肽;(b)用计算机程序确定所述第一序 列和所述第二序列之间的不同。 一方面,确定第一序列和第二序列之 间的不同的步骤可以进一步包括识别多态性的步骤。 一方面,所述方 法可以进一步包括识别序列中一个或多个特征的识别器。另一方面, 所述方法可以包括应用计算机程序读出第一序列,并识别该序列中的 一个或多个特征。
本发明提供从环境样品中分离或回收编码具有酰胺酶活性的多肽 的核酸的方法,包括步骤(a)提供用于扩增编码具有酰胺酶活性的
多肽的核酸的扩增引物序列对,其中所述引物对能够扩增本发明的核
酸或其子序列;(b)从所述环境样品中分离核酸或者处理所述环境样 品,以便所述样品中的核酸可以与所述扩增引物对杂交;(c)把步骤 (b)的核酸与步骤(a)的扩增引物对组合,扩增从所述环境样品中 得到的核酸,由此从环境样品中分离或回收编码具有酰胺酶活性的多 肽的核酸。 一方面,所述扩增引物序列对的一个或各个构件可以包括 含有本发明的序列或其子序列的至少大约10到50个连续碱基的寡聚核苷酸。
本发明提供从环境样品中分离或回收编码具有酰胺酶活性的多肽 的核酸的方法,包括步骤(a)提供包含本发明的核酸的多核苷酸探 针;(b)从所述环境样品中分离核酸或者处理所述环境样品,以便所
述样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)把步骤(b) 的所述分离的核酸或所述被处理的环境样品与步骤(a)的多核苷酸探 针组合;(d)分离与步骤(a)的多核苷酸探针特异杂交的核酸,由此 从环境样品中分离或回收编码具有酰胺酶活性的多肽的核酸。 一方面, 所述环境样品可以包括水样品,液体样品,土壤样品,气体样品或生 物样品。 一方面,所述生物样品可以来源于细菌细胞,原生动物细胞, 昆虫细胞,酵母细胞,植物细胞,真菌细胞或哺乳动物细胞。
本发明提供产生编码具有酰胺酶活性的多肽的核酸的变异体的方 法,包括步骤(a)提供包括本发明的核酸的模板核酸;(b)在所述
模板序列中修改、删除或添加一个或多个核苷酸,或者它们的组合, 产生所述模板核酸的变异体。 一方面,该方法可以进一步包括表达所 述的变异核酸,产生变异的酰胺酶多肽。 一方面,所述修改、添加或
删除可以通过包括易错PCR、重排、寡聚核苷酸诱导的定点突变、装 配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数 整体诱变、位点专一性诱变、基因重装配、基因位点饱和诱变(GSSM)、 合成连接重装配(SLR)和它们的组合的方法引入。另一方面,所述修 改、添加或删除可以通过包括重组、递归序列重组、硫代磷酸酯修饰 的DNA诱变、含有尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱 变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制 选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚 体生成和它们的组合的方法引入。
一方面,所述方法可以迭代重复,直到与所述模板核酸编码的多 肽相比具有改变的或不同的活性或者具有改变的或不同的稳定性的酰 胺酶产生。 一方面,所述变异的酰胺酶多肽可以是耐热性的,在暴露 于提高的温度后仍保持一些活性。另一方面,所述变异的酰胺酶多肽 与模板核酸编码的酰胺酶相比具有更高的糖基化。 一方面,所述变异 的酰胺酶多肽在高温下可以有酰胺酶活性,其中由所述模板核酸编码的酰胺酶在高温下没有活性。
一方面,所述方法可以迭代重复,直到
与所述模板核酸相比具有改变的密码子使用"odon usage)的酰胺酶 编码序列产生。另一方面,所述方法可以迭代重复,直到与所述模板 核酸相比具有更高或更低水平的信息表达或稳定性的酰胺酶基因产 生。
本发明提供修饰编码具有酰胺酶活性的多肽的核酸中的密码子以 增加其在宿主细胞中的表达的方法,包括以下步骤(a)提供编码具 有酰胺酶活性的多肽的核酸,包括本发明的核酸;(b)确定步骤(a) 的核酸中的非优选的或较不优选的密码子,把它替换为编码相同氨基 酸的优选的或中性使用的密码子,其中优选的密码子是在宿主细胞基 因的编码序列中偏爱的密码子,非优选或较不优选的密码子是在宿主 细胞基因的编码序列中偏废的密码子,由此修饰所述核酸,从而提高 它在宿主细胞中的表达。
本发明提供修饰编码酰胺酶多肽的核酸中的密码子的方法,所述 方法包括以下步骤(a)提供编码具有酰胺酶活性的多肽的核酸,包 括本发明的核酸;(b)确定步骤(a)的核酸中的密码子,把它用编码 相同氨基酸的不同密码子取代,由此修饰编码酰胺酶的核酸中的密码 子。 '
本发明提供修饰编码酰胺酶多肽的核酸中的密码子以增加其在宿 主细胞中的表达的方法,所述方法包括以下步骤(a)提供编码酰胺 酶多肽的核酸,包括本发明的核酸;(b)确定步骤(a)的核酸中非优 选的或较不优选的密码子,把它用编码相同氨基酸的优选的或中性使 用的密码子替换,其中优选的密码子是在宿主细胞基因的编码序列中 偏爱的密码子,非优选或较不优选的密码子是在宿主细胞基因的编码 序列中偏废的密码子,由此修饰所述核酸,从而提高它在宿主细胞中 的表达。
本发明提供修饰编码具有酰胺酶活性的多肽的核酸中的密码子以 降低其在宿主细胞中的表达的方法,所述方法包括以下步骤(a)提 供本发明的核酸;(b)确定步骤(a)的核酸中至少一个优选的密码子, 把它用编码相同氨基酸的非优选的或较不优选的密码子替换,其中优 选的密码子是在宿主细胞基因的编码序列中偏爱的密码子,非优选或较不优选的密码子是在宿主细胞基因的编码序列中偏废的密码子,由 此修饰所述核酸,从而降低它在宿主细胞中的表达。 一方面,所述宿 主细胞可以是细菌细胞,真菌细胞,昆虫细胞,酵母细胞,植物细胞 或哺乳动物细胞。
本发明提供用于产生编码多个修饰的酰胺酶活性位点或底物结合 位点的核酸文库的方法,其中所述修饰的活性位点或底物结合位点衍 生于第一核酸,所述第一核酸包括编码第一活性位点或第一底物结合 位点的序列,所述方法包括以下步骤(a)提供编码第一活性位点或 第一底物结合位点的第一核酸,其中所述第一核酸序列包括在严紧条 件下与本发明的序列或其子序列杂交的序列,并且所述核酸编码酰胺 酶活性位点或酰胺酶底物结合位点;(b)提供一套诱变的寡核苷酸, 其编码在第一核酸的多个靶密码子处的天然氨基酸变体;(C)应用这 套诱变的寡核苷酸来产生一套编码活性位点或编码底物结合位点的变 异核酸,所述变异核酸在被诱变的每个氨基酸密码子处编码一定范围 的氨基酸变体,从而产生编码多个修饰的酰胺酶活性位点或底物结合 位点的核酸文库。 一方面,所述方法可以进一步包括诱变步骤(a)的 第一核酸,进行诱变的方法包括优化的定向进化系统、易错PCR、重 排、寡聚核苷酸诱导的定向突变、重装配PCR、有性PCR诱变、体内 诱变、盒式诱变、递归整体诱变、指数整体诱变、位点专一性诱变、 基因重装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR) 以及它们的组合。另一方面,所述方法可以进一步包括诱变步骤(a) 的第一核酸或变异体,进行诱变的方法包括重组、递归序列重组、硫 代磷酸酯修饰的DNA诱变、含有尿嘧瞎的模板诱变、缺口二重诱变、 点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺 失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、 嵌合核酸多聚体生成和它们的组合。
本发明提供制造小分子的方法,包括以下步骤(a)提供能够合 成或修饰小分子的多种生物合成酶,其中这些酶中的一种包括由包括 本发明的核酸的核酸编码的酰胺酶;(b)提供步骤(a)的至少一种酶 的底物;(c)步骤(b)的底物与所述酶在有利于多个生物催化反应进 行的条件下反应,通过一系列生物催化反应产生小分子。本发明提供修饰小分子的方法,包括以下步骤(a)提供酰胺酶, 其中所述酶包括本发明的多肽或由本发明的核酸编码的多肽;(b)提
供小分子;(c)步骤(a)的酶与步骤(b)的小分子在有利于由所述 酰胺酶催化的酶促反应进行的条件下反应,由此通过酰胺酶酶促反应 修饰小分子。 一方面,所述方法可以包括步骤(a)的酶的多个小分子 底物,由此通过至少一种由所述酰胺酶催化的酶促反应产生修饰的小 分子库。另一方面,所述方法可以包括多个额外的酶,在有利于所述 酶的多个生物催化反应进行的条件下,通过多个酶促反应形成多个修 饰的小分子。作为选择,所述方法可以进一步包括检验所述文库的步 骤,以确定表现有所要活性的特定修饰的小分子是否出现在该文库中。 检验所述文库的步骤可以进一步包括系统地消去除一个以外的所有生 物催化反应,以产生所述文库内多个修饰的小分子的一部分,检测所 述的这一部分内是否存在具有所要活性的特定修饰的小分子,并确定 产生具有所要活性的特定修饰的小分子的至少一个特定的生物催化反 应。
本发明提供确定酰胺酶的功能片断的方法,包括步骤(a)提供 酰胺酶,其中该酶包括本发明的多肽或由本发明的核酸编码的多肽; (b)从步骤(a)的序列中删除多个氨基酸残基,检验剩余的子序列 是否具有酰胺酶活性,从而确定酰胺酶的功能片断。 一方面,所述酰 胺酶活性可以通过提供酰胺酶底物,并检测所述底物的量的减少或反 应产物的量的增加来测定。
通过应用实时代谢流分析(real-time metabolic flux analysis),本 发明提供用于新的或修饰的表型的全细胞工程的方法,所述方法包括 以下步骤(a)通过修饰所述细胞的遗传组成,产生修饰的细胞,其 中所述遗传组成通过往所述细胞中添加包括本发明的核酸的核酸而被 修饰;(b)培养所述修饰的细胞,产生多个修饰的细胞;(C)通过 以实时方式监控步骤(b)的细胞培养物,测量所述细胞的至少一种代 谢参数;(d)分析步骤(c)的数据,确定测量到的参数是否与在相 似条件下的未修饰细胞有所不同,从而应用实时代谢流分析确定所述 细胞中工程化的表型。 一方面,所述细胞的遗传组成可以通过包括删 除细胞中的序列或修饰细胞中的序列,或者敲除基因的表达的方法而被修饰。 一方面,所述方法可以进一步包括选择含有新的工程化表型 的细胞。另一方面,所述方法可以进一步包括培养被选择的细胞,由 此产生含有新的工程化表型的细胞株。
本发明提供水解酰胺键的方法,包括以下步骤(a)提供具有酰 胺酶活性的多肽,其中所述多肽包括本发明的多肽或由本发明的核酸 编码的多肽;(b)提供包括酰胺键的化合物;(c)将步骤(a)的多肽 与步骤(b)的化合物在所述多肽水解所述酰胺键的条件下接触。 一方
面,所述化合物可以包括内酰胺键。另一方面,所述化合物可以包括c
端酰胺键或N端酰胺键。
本发明提供从组合物中溶解或除去含有酰胺键的化合物的方法, 包括以下步骤(a)提供具有酰胺酶活性的多肽,其中所述多肽包括 本发明的多肽或由本发明的核酸编码的多肽;(b)提供包含含有酰胺 键的化合物的组合物;(c)将步骤(a)的多肽与步骤(b)的组合物 在所述多肽除去或溶解含有酰胺键的化合物的条件下接触。
本发明提供增加酰胺酶多肽的耐热性或热稳定性的方法,所述方 法包括糖基化酰胺酶多肽,其中所述多肽包括本发明的多肽或者由本 发明的核酸编码的多肽的至少30个相邻氨基酸,由此增加所述酰胺酶 多肽的耐热性或热稳定性。 一方面,所述酰胺酶的特异活性可以在大 于37'C到大约95'C的范围内是热稳定或耐热的。
本发明提供用于在细胞中过量表达重组酰胺酶多肽的方法,包括 表达含有本发明的核酸的表达载体,其中过量表达通过应用高活性的 启动子、双顺反子的载体或者通过载体的基因扩增来完成。
本发明提供包括本发明的多肽或由本发明的核酸编码的多肽的去 垢剂组合物,其中所述多肽包含酰胺酶活性。 一方面,所述酰胺酶可 以是非表面活性的酰胺酶。另一方面,所述酰胺酶可以是表面活性的 酰胺酶。
本发明提供用于洗涤物体的方法,包括以下步骤(a)提供包含
具有酰胺酶活性的多肽的组合物,其中所述多肽包括本发明的多肽或
由本发明的核酸编码的多肽;(b)提供一个物体;(c)将步骤(a)的 多肽与步骤(b)的物体在所述组合物可以洗涤所述物体的条件下接触。 本发明提供在动物消耗词料或食物之前水解饲料或食物中的蛋白质或酰胺的方法,包括以下步骤(a)获得包括蛋白质的词料材料, 其中所述蛋白质可以被具有酰胺酶活性的多肽水解,其中所述多肽包
括本发明的多肽或由本发明的核酸编码的多肽;(b)把足量的步骤(a)
的多肽添加到所述饲料或食物材料中,经过以致于可以水解所述蛋白 质和形成经过处理的食品或饲料的足够长的时间,由此在动物消耗所 述饲料或食物之前水解饲料或食品中的蛋白质。 一方面,所述食品或 饲料包括水稻,玉米,大麦,小麦,豆类或马铃薯。
本发明提供拆分光学活性化合物的外消旋混合物的方法,包括以
下步骤(a)提供包括本发明的多肽或由本发明的核酸编码的多肽的
多肽,其中所述多肽对于光学活性化合物的一种对映异构体是具有选
择性的;(b)提供光学活性化合物的外消旋混合物;(c)将步骤(a) 的多肽与步骤(b)的混合物在所述多肽可以选择性地转化光学活性化 合物的仅仅一种对映异构体的条件下接触,由此导致外消旋混合物的 拆分。 一方面,所述多肽可以对于L-对映异构体是选择性的。另一方 面,所述多肽可以对R-对映异构体是选择性的。 一方面,所述多肽是 立体专一性的。
本发明提供合成含有酰胺键的化合物的方法,包括以下步骤(a) 提供包括本发明的多肽或由本发明的核酸编码的多肽的多肽,其中所 述多肽包含酰胺酶活性;(b)提供前体;(c)把步骤(a)的多肽与 步骤(b)的前体在所述多肽可以催化酰胺键合成的条件下接触。 一方 面,所述多肽可以是立体选择的或立体专一的,包含酰胺键的化合物 可以是手性的。 一方面,所述前体可以具有弱的水溶性。另一方面, 所述前体可以是非手性的,包含酰胺键的化合物是手性的。 一方面, 包含酰胺键的化合物可以是氨基酸或氨基酰胺。 一方面,所述化合物 可以是甲基多巴。
本发明提供水解青霉素的方法,包括以下步骤(a)提供包括本 发明的多肽或由本发明的核酸编码的多肽的多肽;(b)提供包括青霉 素的组合物;(c)将步骤(a)的多肽与步骤(b)的组合物在所述多 肽可以水解青霉素的条件下组合。
本发明提供水解头孢菌素的方法,包括以下步骤(a)提供包括 本发明的多肽或由本发明的核酸编码的多肽的多肽;(b)提供包括头孢菌素的组合物;(c)将步骤(a)的多肽与步骤(b)的组合物在所 述多肽可以水解头孢菌素的条件下组合。 一方面,所述头孢菌素可以 是头孢菌素C。
本发明提供合成7-氨基头孢垸酸(7-ACA)的方法,包括以下步 骤(a)提供包括本发明的多肽或由本发明的核酸编码的多肽的多肽; (b)提供包括头孢菌素C的组合物;(c)将步骤(a)的多肽与步骤 (b)的组合物在所述多肽可以把头孢菌素C转化为7-氨基头孢烷酸 (7-ACA)的条件下组合。
本发明提供水解细胞壁的方法,包括以下步骤(a)提供包括本 发明的多肽或由本发明的核酸编码的多肽的多肽;(b)提供包括细胞 壁的组合物;(c)把步骤(a)的多肽与步骤(b)的组合物接触,其 中所述多肽可以水解所述细胞壁。
本发明提供影响食品加工中的发酵的方法,包括以下步骤(a) 提供包括本发明的多肽或由本发明的核酸编码的多肽的多肽;(b)提 供包括在食品加工中使用的细菌的组合物;(c)把步骤(a)的多肽 与步骤(b)的组合物在所述多肽可以改变所述细菌的发酵特性的条件 下接触。 一方面,所述细菌的发酵特征可以包括生长速度,酸的产生 或存活。
本发明提供催熟乳酪和形成风味的方法,包括以下步骤(a)提 供包括本发明的多肽或由本发明的核酸编码的多肽的多肽;(b)提供 包括乳酪的组合物;(c)把步骤(a)的多肽与步骤(b)的组合物在 所述多肽水解牛奶酪蛋白的条件下接触,由此促进奶酪成熟和奶酪风 味的形成。
本发明提供制造转基因植物的方法,包括以下步骤(a)把异源 核酸序列导入到细胞中,其中所述异源核酸序列包括本发明的核酸, 由此产生转化的植物细胞;(b)由所述转化细胞获得转基因植物。一 方面,步骤(a)可以进一步包括通过电穿孔或植物细胞原生质体的微 注射,导入所述异源核酸序列。另一方面,步骤(a)可以进一步包括 通过DNA颗粒轰击(DNA particle bombardment)把所述异源核酸序 列直接导入植物组织中。可替代的,步骤(a)可以进一步包括应用根 癌农杆菌宿主把所述异源核酸序列导入所述植物细胞DNA。本发明提供在细胞中,例如在动物或植物细胞中表达异源核酸序 列的方法,包括以下步骤(a)用与启动子有效连接的异源核酸序列 转化所述细胞,其中所述异源核酸序列包括本发明的核酸;(b)在所
述异源核酸序列被所述细胞表达的条件下培养所述细胞。
本发明提供促进细菌或真菌杀死的方法,包括(a)提供包括本 发明的多肽或由本发明的核酸编码的多肽的多肽;(b)将步骤(a)的 多肽与组合物接触,由此促进细菌或真菌杀死。本发明提供包括本发 明的多肽或由本发明的核酸编码的多肽的抗微生物组合物。所述抗微 生物组合物可以是杀菌剂或杀真菌剂。
本发明提供包含本发明的多肽或由本发明的核酸编码的多肽的食 品。本发明提供包含本发明的多肽或由本发明的核酸编码的多肽的奶 酪。本发明提供包含本发明的多肽或由本发明的核酸编码的多肽的乳 制品。
本发明提供包含本发明的多肽或由本发明的核酸编码的多肽的药 物组合物。
本发明提供包含本发明的多肽或由本发明的核酸编码的多肽的消 费品和食品,包括可食用的产品,化妆品,清洗织物、硬表面和人的 皮肤等的产品,面包和面包添加剂,黄油,人造黄油,黄油的低热量 替代品,乳酪,调味品,类似蛋黄酱的产品,肉类产品,含有肽的食 物添加剂,香波,例如为了处理人的皮肤的乳脂或洗液,肥皂和肥皂 替代品,洗衣粉或洗衣液,和/或用于清洗食物生产设备和厨房用器皿 的产品。
本发明提供具有在SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQID NO:15, SEQ IDNO:17, SEQIDNO:19, SEQ ID NO:21 , SEQ ID NO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQ IDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41 , SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQ IDNO:59, SEQIDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ IDNO:69, SEQIDNO:71, SEQ IDNO:73, SEQIDNO:75,SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQ IDNO:85, SEQ ID NO:87, SEQ ID NO:89, SEQIDNO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO:113中所列序列的分离的核酸, 以及其变异体。所述变异体与本发明的序列具有至少50%序列一致性, 并编码具有酰胺酶活性的多肽,所述酰胺酶活性包括二级酰胺酶活性, 例如催化酰胺的水解,所述具有酰胺酶活性的多肽包括具有肽酶、蛋 白酶和/或乙内酰脲酶活性的酶。
本发明的一方面是具有在SEQ ID NO:l, SEQ ID NO: 3, SEQID NO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ IDNO:33, SEQ IDNO:35, SEQIDNO:37, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQIDNO:47, SEQ IDNO:49, SEQIDNO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61 , SEQ ID NO:63, SEQ ID NO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQ IDNO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQ IDNO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQ IDNO:109, SEQIDNO:lll, SEQ ID NO:113中所列序列的分离的核 酸,与其大体上相同(substantiallyidentical)的序列,以及与其互补的 序列。
本发明的另一方面是包括在SEQIDNO:l, SEQIDNO:3, SEQID NO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQIDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQ ID NO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQ ID NO :51, SEQ ID NO:53, SEQ ID NO:55, SEQID NO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ IDNO:109, SEQIDNO:lll, SEQ ID NO:113中所列序列的至少10个 连续碱基的分离的核酸,与其大体上相同的序列,以及与其互补的序 列。
另一方面,本发明提供编码具有在SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQIDNO:8, SEQ ID NO: 10, SEQIDNO:12, SEQID NO:14, SEQ ID NO:16, SEQ IDNO:18, SEQIDNO:20, SEQIDNO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:28, SEQIDNO:30, SEQ IDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQIDNO:50, SEQIDNO:52, SEQIDNO:54, SEQIDNO:56, SEQ IDNO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQIDNO:76, SEQIDNO:78, SEQIDNO:80, SEQIDNO:82, SEQ IDNO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:画,SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQID NO:108, SEQIDNO:110, SEQIDNO:113, SEQID NO:114中所列序 列的多肽的分离的核酸,以及其变异体,所述变异体编码具有酰胺酶 活性的多肽,并与这样的序列具有至少50%序列一致性,所述酰胺酶 活性包括二级酰胺酶活性。 一方面,所述酰胺酶活性包括水解酰胺, 例如具有肽酶、蛋白酶和/或乙内酰脲酶活性的酶。
本发明的另一方面是编码本发明的多肽的分离的核酸,以及与其 大体上相同的序列。
本发明的另一方面是编码本发明的多肽以及与其大体上相同的序列的分离的核酸。
另一方面,本发明提供具有在SEQIDN0:2, SEQIDN0:4, SEQ ID NO:6, SEQ ID N0:8, SEQ ID NO: 10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO: 16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:28, SEQIDNO:30, SEQ IDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQID NO:40, SEQ ID NO:42, SEQ ID NO: 44, SEQ ID NO:46, SEQ ID NO:48, SEQIDNO:50, SEQIDNO:52, SEQIDNO:54, SEQIDNO:56, SEQ IDNO:58, SEQ ID NO :60, SEQ ID NO :62, SEQ ID NO: 64, SEQID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQIDNO:76, SEQIDNO:78, SEQIDNO:80, SEQIDNO:82, SEQ IDNO:84, SEQ ID NO: 86, SEQ ID NO:88, SEQ ID NO :90, SEQID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:IOO, SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQID NO駕,SEQIDNO:110, SEQIDNO:113, SEQ IDNO:114中所列序 列的纯化的多肽,以及与其大体上相同的序列。 一方面,所述多肽具 有酰胺酶活性,包括二级酰胺酶活性,包括例如酰胺的水解,所述多 肽包括具有肽酶、蛋白酶和/或乙内酰脲酶活性的酶。
本发明的另一方面是特异地与本发明的多肽结合的分离的或纯化 的抗体,以及与其大体上相同的序列。
本发明的另一方面是特异性结合本发明的多肽的分离的或纯化的 抗体或它的结合片断,以及与其大体上相同的序列。
本发明的另一方面是制备本发明的多肽以及与其大体上相同的序 列的方法。所述方法包括把编码所述多肽的核酸导入宿主细胞,其中 所述核酸与启动子有效连接,并在允许所述核酸表达的条件下培养所 述宿主细胞。
本发明的另一方面是制备具有本发明的多肽的至少10个氨基酸的 多肽以及与其大体上相同的序列的方法。所述方法包括把编码所述多 肽的核酸导入宿主细胞,其中所述核酸与启动子有效连接,并在允许 所述核酸表达的条件下培养所述宿主细胞,由此产生所述多肽。
本发明的另一方面是产生变异体的方法,包括获得本发明的核酸,例如具有在SEQ ID NO:l , SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQID NO: 17, SEQ ID NO:19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQ IDNO:35, SEQ ID NO:37, SEQ ID NO:39, SEQIDNO:41, SEQID NO:43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQ IDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQ IDNO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:109, SEQID NO:lll, SEQ ID NO:113中所列序列的多聚核苷酸,与其大体上相同 的序列,与本发明的序列互补的序列,包含前述序列的至少30个连续 核苷酸的片断,然后将所述序列中的一个或多个核苷酸替换为另外的 核苷酸,删去所述序列中的一个或多个核苷酸,或者往所述序列中添 加一个或多个核苷酸。
本发明的另一方面是储存有本发明的核酸以及与其大体上相同的 序列,或本发明的多肽以及与其大体上相同的序列的计算机可读介质。 本发明的另一方面是包括处理器和数据储存设备的计算机系统,其中 所述数据储存设备储存有本发明的核酸以及与其大体上相同的序列, 或本发明的多肽以及与其大体上相同的序列。本发明的另一方面是用 于比较第一序列和参考序列的方法,其中所述第一序列是本发明的核 酸,与其大体上相同的序列,或本发明的多肽,与其大体上相同的序 列。所述方法包括通过应用比较序列的计算机程序读出第一序列和参 考序列;应用计算机程序确定所述第一序列和所述参考序列之间的不 同。本发明的另一方面是确定本发明的核酸和与其大体上相同的序列, 或本发明的多肽和与其大体上相同的序列中的特征的方法,包括通过 应用识别序列特征的计算机程序读出序列;应用计算机程序识别所述 序列中的特征。本发明的另一方面是用于确定本发明的多肽和与之大体上相同的 序列的片断或变异体的分析方法,所述片断或变异体保留有本发明的 多肽和与之大体上相同的序列的酶功能。所述分析包括将本发明的多 肽和与之大体上相同的序列,或多肽片断或变异体与底物分子在可以 使所述多肽片断或变异体发挥功能的条件下接触,并检测底物水平的 降低或者在所述多肽和底物间的反应的特定反应产物的水平的增加, 由此确定这些序列的片断或变异体。
表l是本发明的序列的表格。
本发明提供荧光性酰胺酶底物,例如7-(e-D-2-氨基己二酰胺)-4-甲基香豆素,所述酰胺酶例如二级酰胺酶。本发明提供包含7-(e-D-2-氨基己二酰胺)-4-甲基香豆素的组合物。 一方面,例如为了发现酰胺酶 活性,本发明的7-(e-D-2-氨基己二酰胺)-4-甲基香豆素被用于高通量 (HT)的基于活性的全细胞筛选。一方面,本发明的7-(e-D-2-氨基己 二酰胺)-4-甲基香豆素被用于环境文库的高通量筛选。 一方面,为了发 现头孢菌素C酰胺酶,7-(e-D-2-氨基己二酰胺)-4-甲基香豆素被用作底 物。本发明提供应用7-(e-D-2-氨基己二酰胺)-4-甲基香豆素来发现头孢 菌素C酰胺酶的方法。
本发明的一个或多个具体实施方式
的细节在以下附图和描述中阐 明。本发明的其它特征、目标和优点将在本说明书和附图,以及权利 要求中清楚表明。
在此引用的所有的出版物、专禾U、专利申请、GenBank序列和ATCC
保藏物都出于各种目的而特意地一并引入以供参考。


下面的附图是为了举例说明本发明的具体实施方式
,并不意味着 对权利要求所包含的发明范围的限制。 图l是计算机系统的框图。
图2是说明用于将新的核苷酸或蛋白序列与序列数据库作比较以 确定新序列与数据库序列之间的同源性水平的处理程序的一个方面的 流程图。
图3是说明在计算机中用于确定两个序列是否同源的处理程序的一个方面的流程图。
图4是说明用于检测序列中某个特征的存在的识别处理器300的 一个方面的流程图。
图5是本发明的一种典型方法的说明,如实施例3中例示,采用 两步合成程序来合成荧光性酰胺酶底物7-(^D-2-氨基己二酰胺)-4-甲
基香豆素。
图6是说明在实施例3中发现的二级酰胺酶的氨基酸序列相关性 的图表,它们都能够切割产荧光的底物7-(e-D-2-氨基己二酰酌-4-甲基
香豆素。
图7是头孢菌素C的双酶脱酰基作用的说明。
图8是存在DTT和L-半胱氨酸时SEQ ID NO:9和SEQ ID NO:IO
的活性的图解。
图9是在实施例5中使用的各种荧光底物的结构说明,包括被合 成的7-(e-D-2-氨基己二酰胺)-4-甲基香豆素。
图IO显示了己经被确认的三个新克隆,为了进行酶的表征和用于 基于序列的筛选,它们被亚克隆。
图11是实施例5的典型方法的说明。
图12说明应用高效液相色谱(HPLC)分析的反应样品,如下面 实施例8所描述的。
各幅附图中同样的参考标记表示同样的元素。
发明详述
本发明提供酰胺酶、编码所述酶的多聚核苷酸、制造和应用这些 多聚核苷酸和多肽的方法。本发明是关于具有酰胺酶活性的新的多肽, 编码它们的核酸,以及与它们结合的抗体。本发明的多肽可以在各种 诊断、治疗和工业范围内被应用。本发明的酰胺酶可以具有二级酰胺 酶活性,例如具有水解酰胺的活性,包括具有肽酶、蛋白酶和/或乙内 酰脲酶活性的酶。在可供选择的方面,本发明的酶可以用于加工食物, 例如,增加食物中的风味(如,酶催熟奶酪),促使细菌和真菌杀死, 修饰和去保护精细化学中间产物,合成肽键,进行手性拆分,水解抗 生素,例如,头孢菌素C。本发明的酰胺酶可以在高温和/或低温,或者在广泛的温度范围内
具有活性。例如,它们可以在20。C到90°C, 30。C到8(TC,或者40°C 到7(TC的温度范围有活性。本发明也提供在碱性pH或酸性pH,例如 在低的水酸度,有活性的酰胺酶。在可供选择的方面,本发明的酰胺 酶可以在酸性pH低到pH5.0, pH4.5, pH4.0和pH3.5时有活性。在 可供选择的方面,本发明的酰胺酶可以在碱性pH高到pH9.5, pH10, pH10.5和pH11时有活性。 一方面,本发明的酰胺酶在低水活性(低 的水含量)的条件下,在大约4(TC到大约7(TC的温度范围内有活性。 本发明也提供用于进一步修饰本发明的典型酰胺酶以产生具有所 要特性的蛋白质的方法。例如,利用本发明的方法产生的酰胺酶可以 具有改变的酶活性,热稳定性,pH/活性特征,pH/稳定性特征(例如 在低的pH,例如pIK6或pIK5,或高的pH,例如pH〉9时稳定性增 强),对氧化作用的稳定性,(^2+依赖性,比活,等等。利用本发明可 以改变任何感兴趣的性质。例如,所述改变可以导致变异体,所述变 异体与亲本酶相比,具有改变的酶活性,或pH或温度活性特征。
定义
术语"酰胺酶(amidase)"包括具有酰胺酶活性的所有多肽,例如, 具有催化水解酰胺的活性的酶。例如,术语酰胺酶包括具有二级酰胺 酶(secondary amidase)活性,例如具有水解酰胺活性的多肽。该术语 包括具有肽酶、蛋白水解酶和/或乙内酰脲酶活性的酶。该术语包括可 以用于增加食品(例如酶促熟奶酪)中的风味、促使细菌和真菌杀死、 修饰和去保护精细化学中间产物、合成肽键、进行手性拆分的酶。该 术语包括可以水解酰胺抗生素,例如头孢菌素C的酶。"酰胺酶变异 体"包括衍生于"前体酰胺酶"的氨基酸序列的氨基酸序列。该前体 酰胺酶可以包括天然发生的酰胺酶和重组的酰胺酶。酰胺酶变异体的 氨基酸序列可以通过对前体氨基酸序列迸行一个或多个氨基酸的替 代、删除或插入而于前体酰胺酶的氨基酸序列"衍生"出来。这样的 修饰可以是针对编码前体酰胺酶的氨基酸序列的"前体DNA序列", 而不是操作前体酰胺酶本身。操作该前体DNA序列的合适的方法包括 在此公开的方法,和本领域技术人员已知的方法。本发明的酰胺酶也可以有如美国专利号6,500,659; 6,465,204; 6,429,004中描述的活性。 除了在此描述的筛选方法外,还可参见美国专利号6,333,176的常规检 验多肽是否具有酰胺酶活性的可替代方法。
术语"抗体"包括来源于(derived from)、制作于(modeled after) 或大体上编码于(substantially encoded by) —个免疫球蛋白基因或多 个免疫球蛋白基因的肽或多肽或者其片断,它们能特异地结合于抗原 或抗原决定部位,见例如,Fundamental Immunology,第三版,W. E. Paul, ed., Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25:85-97。 术语抗体包括结合抗原的部分,即,具有与抗原结合的能力的"抗原 结合位点"(例如,片断、序列、互补性决定区(CDRs)),包括(i) Fab片断,由VL、 VH、 CL和CHI结构域组成的单价片断;(ii) F
(ab') 2片断,包括在铰链区由二硫键连接的两个Fab片断的二价片 断;(iii)由VH和CH1结构域组成的Fd片断;(iv)由抗体单臂的 VL和VH结构域组成的Fv片断;(v)由VH结构域组成的dAb片断
(^Ward等,(1989) Nature 341:544-546),和(vi)分离的互补性决定区
(CDR)。单链抗体也被包括在术语"抗体"中。
在此使用的术语"片断"包括多肽,例如天然发生的蛋白质,的 部分,可以存在至少两种不同的构象。片断可以具有与多肽相同的或 大体上相同的氨基酸序列,这里的多肽例如天然发生的蛋白质。"大体 上相同"意味着氨基酸序列大体上但并不是完全相同,但是保留有与 之相关的序列的至少一个功能活性。 一方面,氨基酸序列可以是"大 体上相同"或"大体上同源"的,假如它们至少有大约50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%或99%或 更多相同的话。也包括与天然发生的蛋白质有着不同三维结构的片断。 一个这样的例子是"原形式(pro-form)"分子,例如低活性的原蛋白, 它可以通过切除被改变而产生具有显著更高活性的成熟酶。
在此使用的术语"阵列"或"微阵列"或"生物芯片"或"芯片" 是多个靶元素,每个靶元素包括固定在衬底表面的确定区域上的确定 量的一种或多种多肽(包括抗体)或核酸,以下进一步详细描述。 正如在此使用的,术语"计算机"、"计算机程序"和"处理器"使用的是它们最广泛的一般内容,并可与所有设备结合,细节在以下详细 描述。特定的多肽或蛋白质的"编码序列"或"序列编码"是指当置 于合适的调控序列的控制下时,转录和翻译成为多肽或蛋白质的核酸 序列。
在此所用的术语"表达序列盒"指的是可以影响结构基因(即, 蛋白编码序列,例如本发明的酰胺酶编码序列)在与这些序列相容的 宿主中表达的核酸序列。表达序列盒包括与多肽编码序列有效连接的 启动子;可选择地,也可以与例如转录终止信号的其它序列有效连接。
必须的或有助于影响表达的其它要素也可以被使用,例如,增强子。 所以,表达序列盒也包括质粒、表达载体、重组病毒、任何形式的重
组"裸DNA"载体,等等。
在此使用的"有效连接(operably linked)"是指两个或多个核酸(例 如,DNA)之间的相互关系。典型的,它是指转录调控序列与被转录 序列的功能关系。例如,启动子有效连接到编码序列,例如本发明的 核酸,假如它刺激或调控该编码序列在合适的宿主细胞或别的表达系 统中的转录的话。 一般地,与被转录序列有效连接的启动子转录调控 序列与该被转录序列是物理上邻接的,即,它们是顺式作用。然而, 一些转录调控序列,例如增强子,并不需要物理邻接于或位置上靠近 于转录被其增强的编码序列。
"载体"包括能够感染细胞、转染细胞、短期或永久地转导细胞 的核酸。可以认识到的是,载体可以是裸露的核酸或与蛋白或脂构成 复合物的核酸。载体可选择地包括病毒的或细菌的核酸和/或蛋白质, 和/或膜(例如,细胞膜、病毒脂质被膜等等)。载体包括,但不局限 于复制子(例如,RNA复制子、噬菌体),DNA可以与复制子相连, 而变得可以复制。载体包括,但不局限于RNA,自动地自我复制的环 状或线状DNA或RNA (例如,质粒、病毒,等等,见,例如美国专 利号5,217,879),并且包括表达质粒和非表达质粒。当重组微生物或细 胞培养物被描述作为"表达载体"的宿主时,这包括染色体外的环状 和线状DNA,以及整入到宿主染色体的DNA。当载体被宿主细胞保持 时,载体或者可以在细胞有丝分裂期间作为自主结构稳定复制,或者 整入到宿主基因组中。如在此使用的,术语"启动子"包括所有可以驱动细胞例如植物 细胞中的编码序列转录的序列。所以,本发明的构建物中使用的启动 子包括顺式作用转录控制元件和调控序列,它们涉及调控或调节基因 转录的时间和/或速率。例如,启动子可以是顺式作用转录控制元件, 包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5' 和3'不翻译区,或涉及转录调控的内含子序列。这些顺式作用序列一 般与蛋白质或别的生物分子相互作用(启动/关闭,调节,调控,等等) 进行转录。"组成型"的启动子是在多数环境条件和发育或细胞分化 状态下持续驱动表达的启动子。"诱导型"或"调控型"启动子在环 境条件或发育条件的影响下指导本发明的核酸的表达。可以影响诱导 型启动子进行转录的环境条件的例子包括厌氧条件、提高的温度、干 旱或有光。
"组织特异性"启动子是只在特定细胞或组织或器官,例如植物 或动物中,有活性的转录控制元件。组织特异性调控可以通过某些内 在因子实现,内在因子可以确保编码某种组织特异性蛋白的基因的表 达。已知这样的因子存在于哺乳动物和植物中,以使特异性组织发育。
术语"植物"包括整个植物、植物的部分(例如,叶,茎,花, 根,等等)、植物原生质体、种子和植物细胞和其后代。 一般地,可以 在本发明的方法中使用的植物种类宽泛至可适于转化技术的高等植 物,包括被子植物(单子叶植物和双子叶植物),还有裸子植物。它 包括多种倍体型的植物,包括多倍体,二倍体,单倍体和半合子。如 在此使用的,术语"转基因植物"包括这样的植物或植物细胞,其中 插入有异源核酸序列,例如本发明的核酸和各种重组构建物(例如, 表达序列盒)。
"质粒"可以从商业上获得、在自由基础上从公众获得、或者根 据公开的程序由可获得的质粒构建。在此描述的等效质粒在技术上是 已知的,并且对本领域技术人员来说是很显然的。
术语"基因"包括一段核酸序列,它含有DNA片断,其涉及产生 转录产物(例如信息),转录产物又被翻译产生多肽链、或者调控基因 转录、复制或稳定性。基因可以包括编码区域之前或之后的区域,例 如前导物和尾部、启动子和增强子,可适用的话,还包括在各个编码片断(外显子)之间的插入序列(内含子)。
短语"核酸"或"核酸序列"包括寡核苷酸、核苷酸、多核苷酸, 它们的片断,可以是单链的或双链的、可以代表正义链或反义链的、
基因组的或合成的DNA或RNA (例如mRNA, rRNA, tRNA),肽 核酸(PNA),或天然的或合成的任何DNA类似的或RNA类似的物质, 包括,例如iRNA,核糖核蛋白(例如,iRNPs)。该术语包含例如寡核 苷酸的核酸,其含有天然核苷酸的己知类似物。该术语也包含具有合 成骨架的核酸类似结构,见,例如Mata(1997)Toxicol.App1. Pharmacol. 144:189-197; Stmuss-Soukup( 1997)Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156。
"氨基酸"或"氨基酸序列"包括寡肽、肽、多肽或蛋白序列, 或这些的片断、部分或亚基,天然发生的或合成的分子。术语"多肽" 和"蛋白"包括通过肽键或修饰的肽键彼此连接的氨基酸,后者即肽 等配物,并且可以包含不同于编码基因的20个氨基酸的修饰的氨基酸。 术语"多肽"也包括肽和多肽片断、模体等等。该术语也包括糖基化 的多肽。本发明的肽和多肽也包括所有的"模拟物"和"肽模拟物" 形式,如在以下进一步描述的。
术语"分离的"包括从最初环境例如天然环境中取出的材料,如 果它是天然发生的话。例如,存在于活的动物中的天然发生的多核苷 酸或多肽就不是分离的,但是从天然系统中的一些或全部共存材料分 离到的同样的多核苷酸或多肽就是分离的。这些多核苷酸可以成为载 体的一部分,和/或这些多核苷酸或多肽可以成为组合物的一部分,而 它们仍然是分离的,因为这些载体或组合物不是天然环境的一部分。 如在此使用的,分离的材料或组合物也可以是"被纯化的"成分,艮P, 它并不要求绝对的纯化,相反,它是一个相对的定义。从文库中获得 的单种核酸可以照惯例提纯到电泳同质。在可替代的方面,本发明提 供可以从基因组DNA或文库中或别的环境中的别的序列中提纯的核 酸,其纯度提高至少一、二、三、四、五或更多的数量级。
如在此使用的,术语"重组子"可以包括与"骨架"核酸相邻的 核酸,而在天然环境中它并不与骨架核酸相邻。 一方面,核酸具有5 %或更多的核酸"骨架分子"中的核酸插入物数目。根据本发明的"骨架分子"包括核酸,例如表达载体、自我复制核酸、病毒、整合的核 酸、和用于保持或操作感兴趣的核酸插入物的别的载体或核酸。 一方 面,富集的核酸代表着,在重组骨架分子中核酸插入物数目占10%,
15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%或更多。"重组"多肽或蛋白是指由重组DNA技术产生的多肽或 蛋白;例如,由编码所要的多肽或蛋白的外源DNA构建物转化的细胞 所产生的多肽或蛋白。"合成的"多肽或蛋白质是通过化学合成制备的 多肽或蛋白,如以下详细描述。
启动子序列可以"有效连接到"编码序列,这样,在启动子处启 动转录的RNA聚合酶将把该编码序列转录成mRNA,如以下进一步讨 论。
"寡核苷酸"包括可以用化学合成的或者单链的多脱氧核苷酸或 者双矮的互补多脱氧核苷酸。这样合成的寡核苷酸没有5'磷酸,所以 在没有激酶利用ATP增加磷酸基团的情况下,它不会与另外的寡核苷 酸连接。合成的寡核苷酸可以与没有脱磷酸化的片断连接。
两个核酸或多肽"大体上相同",可以指当两个或多个序列被比较 和联配(aligned)以确定最大一致性(maxium correspondence)时,它 们具有例如至少大约50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%或99%或更高的核苷酸或氨基酸残基(序列) 一致性,所述的最大一致性可以通过使用任何已知的序列比较算法进 行测量,如以下进一步讨论,或者通过观察检验得出。在可替代的方 面,本发明提供与本发明的示例性序列SEQIDN0:1, SEQIDNO:3, SEQ ID N0:5 , SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO: 11 , SEQ ID NO: 13, SEQIDNO:15, SEQ.IDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQ IDNO:31, SEQIDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41 , SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQ IDNO:57, SEQ ID NO:59, SEQIDNO:61, SEQ ID NO:63, SEQ ID NO:65, SEQIDNO:67, SEQIDNO:69, SEQ IDNO:71, SEQ IDNO:73, SEQIDNO:75, SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQIDNO:101, SEQ ID NO:103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll, SEQIDNO:113;和SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQIDNO:8, SEQIDNO:IO, SEQ ID NO:12, SEQ IDNO:14, SEQIDNO:16, SEQ IDNO:18, SEQ ID NO:20, SEQIDNO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:28, SEQ IDNO:30, SEQIDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQIDNO:48, SEQIDNO:50, SEQIDNO:52, SEQIDNO:54, SEQ IDNO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQIDNO:74, SEQIDNO:76, SEQIDNO:78, SEQIDNO:80, SEQ IDNO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQIDNO:100, SEQIDNO:102, SEQIDNO: 104, SEQIDNO:106, SEQIDNO:108, SEQIDNO:llO, SEQIDNO:113, SEQIDNO:114 分别在至少大约10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000或者更多个残基的范围内,或者在从大约50个残基到该核酸或多 肽的全长的范围内具有大体上一致性的核酸和多肽序列。本发明的核 酸序列可以在多肽编码区域的全长范围内大体上相同。
"大体上相同"的氨基酸序列也可以包括通过一个或多个保守的 或不保守的氨基酸替代、缺失或插入而与对照序列有所不同的序列, 特别是当替代发生的位点不是分子的活性位点时,并且认为该多肽本 质上保有它的功能特性。保守的氨基酸替代是,例如,把一个氨基酸 用另一个相同类型的氨基酸替代(例如,疏水的氨基酸,例如异亮氨 酸、缬氨酸、亮氨酸或甲硫氨酸,用另外的氨基酸替代,或者极性氨 基酸用另外的氨基酸替代,例如精氨酸用赖氨酸替代,谷氨酸用天冬 氨酸,或谷氨酰胺用天冬酰胺替代)。例如,可以从酰胺酶中去掉一 个或多个氨基酸,得到修饰结构的多肽,而其生物活性没有大的改变。例如,对于酰胺酶活性并不需要的氨基端或羧基端氨基酸可以去除。
"杂交"包括核酸链与互补链通过碱基配对联结的过程。杂交反 应可以是灵敏的和选择性的,感兴趣的特定序列甚至可以在以非常低 的浓度存在于样品中时仍可被识别出来。严紧的条件可以通过例如预 杂交和杂交溶液中盐或甲酰胺的浓度,或者通过杂交温度被限定,这
是在本领域广为人知的。例如,严紧性(stringency)可以通过降低盐 浓度、增加甲酰胺的浓度、或者提高杂交温度、改变杂交时间而增加, 如以下详细描述的。在可替代的方面,本发明的核酸可以根据它们在 不同严紧条件(例如,高、中、低)下杂交的能力而进行定义,如在 此阐明的。
"变异体"包括在一个或多个碱基对、密码子、内含子、外显子 或氨基酸残基处(分别地)发生修饰,但是仍保持本发明的酰胺酶生 物活性的本发明的多肽。变异体可以通过任何手段产生,包括,例如, 易错PCR,重排(shuffling),寡核苷酸诱导的定点突变,装配PCR (assemblyPCR),有性PCR诱变,体内诱变,盒式诱变,递归整体诱 变(recursive ensemble mutagenesis ), 指数整体诱变(exponential ensemble mutagenesis ), 位点专一性诱变,基因重装配(gene reassembly),基因位点饱禾口突变(gene site saturated mutagenesis, GSSM) 和这些方法的组合。用于产生例如在某一 pH或温度具有不同于野生型 酰胺酶的活性的变体酰胺酶的技术包括在内。
术语"饱和诱变"或"GSSM"包括使用简并寡核苷酸引物在多核 苷酸中导入点突变的方法,以下详细描述。
术语"优化的定向进化系统"或"优化的定向进化"包括用于重 新装配相关核酸序列例如相关基因的片断的方法,以下详细描述。
术语"合成的连接重装配(synthetic ligation reassembly)"或者 "SLR"包括以非随机方式连接寡核苷酸片断的方法,以下详细描述。
核酸的产生和操作
本发明提供了核酸,其包括编码本发明的酰胺酶多肽的表达序列 盒,例如表达载体。本发明也包括使用本发明的核酸来发现新的酰胺 酶序列的方法。本发明也包括使用本发明的核酸来抑制酰胺酶基因、转录物和多肽的表达的方法。也提供了通过例如合成的连接重装配、 优化的定向进化系统和/或饱和诱变来修饰本发明的核酸的方法。本发
明的核酸可以通过例如克隆和表达cDNA文库、用PCR扩增信息或基 因组DNA等等来制作、分离和/或操作。在实践本发明的方法时,可 以通过操作模板核酸来修饰同源基因,如在此描述的。本发明可以与 科学和专利文献中描述的本领域已知的任何方法或方案或设备相结合 来实施。
赏微术
实施本发明时所使用的核酸,不管是RNA、 iRNA、反义核酸、 cDNA、基因组DNA、载体、病毒或它们的杂交,都可以通过遗传工 程、扩增、和/或重组表达/产生从许多来源中分离出来。由这些核酸产 生的重组多肽可以逐一被分离或克隆,并对所期望的活性进行检验。 可以使用任何表达系统,包括细菌、哺乳动物、酵母,昆虫或植物细 胞表达系统。
可替代地,这些核酸可以通过已知的化学合成技术体外合成,如 在此描述的,例如,Adams (1983) J.Am. Chem. Soc, 105:661; Belousov (1997)Nucleic Acids Res. 25:3440-3444; Frenkel( 1995)Free Radic. Biol. Med. 19:373-380; Blo腿ere (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68: 109; Beaucage (1981) Tetra. Lett 22:1859;美国专利号4,458,066。
核酸操作技术,例如亚克隆、标记探针(例如,使用Klenow聚合 酶、切口平移、扩增来进行随机引物标记)、测序、杂交等等已经在 科学和专利文献中详细描述过,见,例如Sambrook等,MOLECULAR
CLONING: A LABORATORY MANUAL (第二版),1-3巻,Cold Spring Harbor Laboratory, (1989) ; CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel等.John Wiley & Sons Inc., New York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES,第I部分.Theory and Nucleic Acid Preparation, lessen等. Elsevier, N.Y. (1993)。另一种用于实践本发明的方法的有用的获得核酸和操作核酸的方 法是从基因组样品中进行克隆,并且假如需要的话,筛选和再克隆从
例如基因组克隆或cDNA克隆中分离或扩增的插入物。在本发明的方 法中使用的核酸来源包括基因组文库或cDNA文库,其被包含在例如 哺乳动物的人工染色体(MACs)中,见,例如,美国专利号5,721,118; 6,025,155;人类人工染色体中,见,例如Rosenfeld (1997) Nat. Genet. 15:333-335;酵母人工染色体(YAC)中;细菌人工染色体(BAC)中; Pl人工染色体中,见,例如Woon (1998) Genomics 50: 306-316; Pl-衍生的载体(PACs )中,见,例如,Kern (1997 ) Biotechniques 23:120-124; 粘粒、重组病毒、噬菌体或质粒中。
一方面,编码本发明的多肽的核酸在合适的阶段与前导序列组合, 该前导序列能够弓I导翻译出的多肽或其片断进行分泌。
本发明提供融合蛋白和编码该融合蛋白的核酸。本发明的多肽可 以与异源的肽或多肽融合,例如与N端识别肽融合,该N端识别肽赋 予所期望的特性,例如增加稳定性或使提纯简单化。为了例如产生更 高免疫原性的肽、更容易地分离重组合成的肽、确定和分离抗体和表 达抗体的B细胞,等等,本发明的肽和多肽也可以合成和表达为融合 蛋白,其具有一个或多个与之连接的额外的结构域。有利于检测和提 纯的结构域包括,例如,金属螯合肽,例如使得在固定的金属上进行 提纯成为可能的多组氨酸单元和组氨酸-色氨酸模式单元,使得在固定 的免疫球蛋白上进行提纯成为可能的蛋白A结构域,和在FLAGS延 展/亲和纯化系统中使用的结构域(ImmunexCorp, Seattle WA)。为了 有利于纯化,可以在纯化结构域和包含上述模体的肽或多肽之间引入 可切割的连接序列,例如因子Xa或肠激酶(Inivitrogen, San Diego CA)。 例如,表达载体可以包括与六个组氨酸残基连接的编码抗原决定部位 的核酸序列,并连接有硫氧还蛋白和肠激酶切割位点(见,例如, Williams (1995) Biochemistry 34: 1787-1797; Dobeli (1998) Protein Expr. Purifl2:404-414)。组氨酸残基有利于检测和纯化,而肠激酶切割位点 提供了将抗原决定部位从融合蛋白的剩余部分中纯化出来的方法。关 于编码融合蛋白的载体的技术和融合蛋白的应用在科学和专利文献中 有很好的描述,见,例如,Kroll (1993) DNACell. Biol., 12:441-53。録微體叙颜
本发明提供了与表达(例如,转录或翻译)控制序列有效连接的
本发明的核酸(例如,DNA)序列,以指导或调控RNA合成/表达, 这里的表达控制序列例如启动子或增强子。表达控制序列可以在表达 载体中。典型的细菌启动子包括lacl, lacZ, T3, T7, gpt,入PR, PL 和trp。典型的真核启动子包括CMV即时早期启动子,HSV胸苷激酶 启动子,早期和晚期SV40启动子,反转录病毒的LTRs,鼠金属硫蛋 白-I启动子。
合适于在细菌中表达多肽的启动子包括五.co// lac或trp启动子, lacl启动子,lacZ启动子,T3启动子,T7启动子,gpt启动子,XPR 启动子,入PL启动子,编码糖酵解酶例如3-磷酸甘油酸激酶(PGK) 的操纵子的启动子和酸性磷酸酶启动子。真核启动子包括CMV即时早 期启动子,HSV胸苷激酶启动子,热休克启动子,早期和晚期SV40 启动子,反转录病毒的LTRs,鼠金属硫蛋白-I启动子。已知的用来控 制基因在原核和真核细胞或它们的病毒中的表达的别的启动子也可以 使用。
淑錄雜潜総动f
本发明提供了可以以组织特异性方式表达的表达序列盒,例如, 可以以组织特异性方式表达本发明的酰胺酶。本发明也提供了以组织 特异性方式表达本发明的酰胺酶的植物或种子。所述的组织特异性可 以是种子特异性,茎特异性,叶特异性,根特异性,果实特异性,等等。
一方面,组成型启动子例如CaMV 35S启动子可以用于在植物或 种子的特异部分或整个植物内的表达。例如,为了过度表达,植物启 动子片断可以用于指导核酸在植物例如再生植物的一些或所有组织中 表达。这样的启动子在此称为"组成型"启动子,它可以在大多数环 境条件和发育状态或细胞分化情况下具有活性。组成型启动子的例子 包括花椰菜花叶病毒(CaMV) 35S转录起始区域,衍生于根癌农杆菌 的T-DNA的l'-或2'-启动子,以及本领域技术人员己知的来自不同植物基因的别的转录起始区域。这些基因包括,例如,拟南芥Ura&Vfoiw&) 的JC77/ (Huang (1996)尸/""f Mo/,历o/. 33:125-139);拟南芥的Cfld (GenBank号U43147, Zhong (1996)嵐G饥G騰/. 251:196-203); 甘蓝型油菜(5ra^^am^M)的编码硬脂酰-酰基载体蛋白去饱和酶的 基因(Genbank号X74782, Solocombe ( 1994 )尸/a"f尸A"w/. 104:1167-1176),玉米的G户c/ (GenBank号X15596; Martinez (1989) 乂 Mo/.历o/208:551-565);玉米的Q cXGenBank号U45855, Manjunath (1997)尸/朋,Mo/.編.3397-112);美国专利号4,962,028; 5,633,440 中描述的植物启动子。
本发明使用的组织特异性或组成型启动子可以衍生于病毒,包括, 例如,烟草花叶病毒亚基因组启动子(Kumagai (1995) Proc. Natl. Acad. Sci. USA 92:1679-1683);只能在受感染的水稻植物的韧皮部细胞中复 制的水稻东格鲁杆状病毒(RTBV),其启动子驱动韧皮部特异的报告 基因的表达;在导管、叶中轴细胞、根尖中具有最高活性的木薯脉带 花叶病毒(cassava vein mosaic virus, CVMV)启动子(Verdaguer (1996) Plant Mol. Biol. 31:1129-1139)。
可替代地,植物启动子可以指导表达酰胺酶的核酸表达于特定组 织、器官或细胞类型中(即,组织特异启动子),或者在更加精确的环 境或发育控制下或在可诱导启动子的控制下指导表达酰胺酶的核酸的 表达。可以影响转录的环境条件的例子包括厌氧条件、提高温度、有 光、或喷撒化学试剂/激素。例如,本发明包括玉米的干旱诱导型启动 子(Busk(1997)supra),马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch (1997) Plant Mol. Biol. 33:897 909)。
组织特异性启动子只在该组织的发育阶段的某个时间段内促进转 录,见,例如描述拟南芥LEAFY基因启动子的Blazquez (1998) Plant Cell 10:791-800。也见,描述转录因子SPL3的Cardon (1997) 12:367-77, SPL3识别拟南芥".^z/^"a)的调节植物分生组织形成的 基因(meristemidentity gene) API的启动子区域的保守序列模体;和 描述分生组织启动子elF4的Mandel (1995) Plant Molecular Biology, 29 巻,995-1004页。可以使用在特定组织的整个生命周期都具有活性的组 织特异性启动子。 一方面,本发明的核酸与主要在棉花纤维细胞中有活性的启动子有效连接。
一方面,本发明的核酸与主要在棉花纤维细
胞伸长的阶段具有活性的启动子有效连接,例如,Rinehart( 1996) supra 所描述的。核酸可以与Fbl2A基因启动子有效连接,这样它将偏好在 棉花纤维细胞(Ibid)中表达。也见John (1997) Proc. Natl. Acad. Sci. USA 89: 5769-5773; John等,美国专利号5,608,148和5,602,321,描述
了用于构建转基因棉花植物的棉花纤维特异性启动子和方法。也可以 使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包 括乙醇脱氢酶基因中的启动子(DeLisle ( 1990) Int. Rey. Cytol. 123:39-60)。也可以使用别的启动子来表达本发明的核酸,包括,例如, 胚珠特异的,胚芽特异的,胚乳特异的,珠柄特异的,种皮特异的启 动子或它们的组合;叶特异的启动子(见,例如,Busk (1997) Plant J. 11:1285 1295,描述玉米的叶特异的启动子);^gra6a"m'w附 A&o^wm的ORF13启动子(ORF13启动子在根部表现出高活性,见, 例如Hansen (1997) supra);玉米花粉特异性启动子(见,例如Guerrero
(1990) Mol. Gen. Genet. 224: 161 168);番茄启动子,其在果实成熟、 变老、从叶上脱落的过程中有活性,在花中具有低一些的活性(见, 例如,Blume (1997) Plant J. 12:731 746);马铃薯SK2基因的雌蕊特 异性启动子(见,例如Ficker (1997) Plant Mol. Biol. 35:425 431);豌 豆的Blec4基因,Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶 中具有活性,这使它成为使外源基因靶向表达于活跃地生长的芽或纤 维的表皮层的有用工具;胚珠特异的BELl基因(见,例如,Reiser(1995) Cell 83:735-742, GenBank号U39944);和/或Klee,美国专利号 5,589,583中的启动子,描述了一种植物启动子区域,其可导致在分生 组织和/或快速分裂细胞中的高水平转录。
可替代地,经由对植物激素例如植物生长素的暴露便能被诱导的 植物启动子用于表达本发明的核酸。例如,本发明可以使用大豆
(6^a'"em^c丄.)中的植物生长素响应元件El启动子片断(AuxREs)
(Liu (1997) Plant Physiol. 115:397-407);植物生长素响应的拟南芥 GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen (1996) Plant J. 10:955-966);烟草的植物生长素诱导的parC启动子(Sakai (1996) 37:906-913);植物生物素响应元件(Streit (1997) Mol. Plant MicrobeInteract. 10:933-937);和对应激激素脱落酸产生响应的启动子(Sheen (1996) Science 274: 1900-1902)。
本发明的核酸也可以与植物启动子有效连接,所述植物启动子暴 露于施用于植物的化学试剂例如除草剂或抗生素,便能够被诱导。例 如,可以使用由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder (1997) Plant Cell Physiol. 38:568-577);不同的除草剂安全剂 的应用诱导不同的基因表达模式,包括在根中、排水器中和芽尖分生 组织中表达。编码序列可以处于例如四环素诱导的启动子的控制下, 例如,被描述的含有Jmw^^a丄.(oat)精氨酸脱羧酶基因的转基因 烟草植物(Masgrau (1997) Plant J. 11:465-473);或者处于水杨酸响应 元件的控制之下(Stange (1997) Plant J. 11:1315-1324)。使用化学(例 如,激素或杀虫剂)诱导的启动子,即,对施用于田间的转基因植物 的化学剂发生响应的启动子,本发明的多肽的表达可以在植物发育的 特定阶段被诱导。所以,本发明也提供含有可诱导基因的转基因植物, 所述可诱导基因编码本发明的多肽,宿主范围局限于靶向植物种类, 例如玉米,水稻,大麦,小麦,马铃薯或别的作物,并且所述可诱导 基因在作物发育的任何阶段都可被诱导。
本领域技术人员会认识到,组织特异性的植物启动子可以驱动有 效连接的序列在不是靶向组织的组织中表达。所以,组织特异性启动 子是驱动在靶向组织或细胞类型中产生优势表达的启动子,但是也可 以导致在别的组织中的一些表达。
本发明的核酸也可以与化学试剂诱导的植物启动子有效连接。这 些试剂包括例如,除草剂、合成的植物生长激素或抗生素,它们可以 通过例如喷雾而施用于转基因植物。本发明的产生酰胺酶的核酸的可 诱导表达将允许对具有所期望的酰胺酶合成或活性的植物进行选择。 植物局部的发育也可以因此被控制。这样,本发明提供了促进植物和 植物的部分的收获的方法。例如,在许多实施方式中,玉米的由苯磺 酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder (1997) Plant Cell Physiol. 38 : 568-577)。应用不同的除草剂安全剂诱导出不同 的基因表达模式,包括在根中、排水器中、芽尖分生组织中的表达。 本发明的编码序列也可以处于四环素诱导的启动子的控制之下,例如,对含有燕麦Uve加^"vaZ.) (oat)精氨酸脱羧酶基因的转基因烟草植 物的描述(Masgrau (1997) Plant J. 11:465-473);或者,可以由水杨酸 响应元件控制(Stange (1997) Plant J. 11:1315-1324)。
假如适当的多肽表达是被期望的话,该编码区域的3'端的多聚腺 苷酸化区域也可以被包括。多聚腺苷酸化区域可以出自天然基因、各 种别的植物基因、或者根癌农杆菌T-DNA中的基因。
教载柳遊微激
本发明提供包括本发明的核酸例如编码本发明的酰胺酶和抗体的 序列的表达载体和克隆媒介物。本发明的表达载体和克隆媒介物可以 包括病毒颗粒,杆状病毒,噬菌体,噬菌粒,粘粒,fos-质粒(fosmids), 细菌人工染色体,病毒DNA (例如,疫苗,腺病毒,禽痘病毒,伪狂 犬病病毒和SV40的衍生物),基于P1的人工染色体,酵母质粒,酵 母人工染色体,和任何别的对感兴趣的特定宿主有特异性的载体(例 如,杆状菌,曲霉和酵母)。本发明的载体可以包括染色体、非染色 体和合成的DNA序列。大多数合适的载体对于本领域技术人员都是已 知的,并且可以商业获得。典型的载体包括细菌pQE载体(Qiagen), pBluescript质粒,PNH载体,A-ZAP载体(Stratagene); ptrc99a, PKK223-3, pDR540, pRIT2T (Pharmacia);真核细胞的PXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia)。然 而,也可以使用任何别的质粒或别的载体,只要它们可以在宿主中复 制和维持下去。可以在本发明中使用低拷贝数或高拷贝数的载体。
表达载体可以包括启动子、翻译起始和转录终止的核糖体结合位 点。载体可以包括用于扩增表达的合适序列。哺乳动物表达载体可以 包括复制起始点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪 接供体和受体位点、转录终止序列、5'边的非转录序列。 一方面,衍生 于SV40剪接位点和聚腺苷酸化位点的DNA序列可以用于提供需要的 非转录的基因元素。 一方面,表达载体含有一个或多个选择性标记基 因,使得可以对含有该载体的宿主细胞进行选择。这些选择性标记包 括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性 的基因、使得E. coli具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae) TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载 体或具有选择标记的别的载体,从任何期望的基因中选择出来。用于在真核细胞中表达多肽或其片断的载体也可以含有增强子, 以增加表达水平。增强子是DNA的顺式作用元件, 一般长度为大约 10到大约300bp,作用于启动子,增强其转录。例子包括在SV40复制 起点下游侧100bp到270bp的增强子,巨细胞病毒早期启动子增强子, 在复制起点下游侧的多瘤增强子,和腺病毒增强子。核酸序列可以通过各种程序插入载体中。 一般的,把插入物和载 体用合适的限制性内切酶消化后,序列可以在载体中的所需位置连接。 可替代的,插入物和载体的平末端可以被连接。在本领域已知多种克 隆技术,例如,Ausubel和Sambrook中描述的。这些程序和别的程序 被认为在本领域技术人员已知的范围内。.载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色 体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、 噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组 合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒。 在原核和真核宿主中使用的各种克隆和表达载体由例如Sambrook描 述。可以使用的特定的细菌载体包括商业可获得的质粒,包括以下已 知的克隆载体的遗传元素pBR322 (ATCC 37017), pKK223-3(Pharmacia Fine Chemicals,Uppsala, Sweden), GEMl(Promega Biotec, Madison, WI, USA), pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescriptIIKS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK223-3, DR540, pRIT5 (Pharmacia), pKK232誦8 和pCM7。特定的真核载体包括pSV2CAT, pOG44, pXTl, pSG(Stratagene) pSVK3, pBPV, pMSG禾口 pSVL (Pharmacia)。然而, 可以使用任何别的载体,只要它可以在宿主细胞中复制和维持。本发明的核酸可以在表达序列盒、载体或病毒中表达,在植物细 胞和种子中短暂的或稳定的表达。 一个典型的短暂表达系统应用了附 加体表达系统,例如,在核中通过含有超螺旋DNA的附加小染色体的 转录而产生的花椰菜花叶病毒(CaMV)RNA,见,例如,Covey(1990)Proc. Natl. Acad. Sci. USA 87: 1633-1637。可替代地,编码序列,即本 发明的序列的全部或亚片断,可以插入到植物宿主细胞基因组中,而 成为该宿主染色体DNA的整合的一部分。正义和反义转录产物可以以 这种方式被表达。包含本发明的核酸的序列(例如,启动子或编码区 域)的载体可以包括用于在植物细胞或种子中选择表型的标记基因。 例如,所述标记可以编码生物杀灭剂抗性,特别是抗生素抗性,例如 对卡那霉素、G41S、博来霉素、潮霉素或除草剂的抗性,例如对氯磺 隆或Basta的抗性。可以在植物中表达核酸和蛋白质的表达载体在本领域中已知,可 以包括,例如,根癌农杆菌的载体,马铃薯病毒X (见,例如,Angell (1997) EMBO J. 16:3675-3684),烟草花叶病病毒(见,例如,Casper (1996) Gene 173:69-73),番茄丛矮病毒(见,例如,Hillman (1989) Virology 169:42-50),烟草蚀纹病毒(见,例如,Dolja (1997) Virology 234:243-252),菜豆金色花叶病毒(见,例如,Morinaga(1993) Microbiol inimunol. 37:471-476),花椰菜花叶病毒(见,例如,Cecchini (1997) Mol. Plant Microbe Interact. 10: 1094-1101),玉米Ac/Ds转座元件(见, 例如,Rubin (1997) Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Inimunol. 204:161-194),和玉米抑制基因-突变基因 (Spm)转座元件(见,例如Schlappi( 1996)Plant Mol. Biol. 32:717-725); 和它们的衍生物。一方面,蛋白载体可以有两套复制系统,使其可以在两种生物中 保持,例如在哺乳动物或昆虫细胞中表达,在原核宿主中克隆和扩增。 进一步,对于整合表达载体,该表达载体可以包括至少一个与宿主细 胞基因组同源的序列。它可以在表达构建物的两侧包含两个同源序列。 通过选择包含入载体的合适的同源序列,可以将该整合载体定位到宿 主细胞的特定位置。整合载体的构建在本领域已知。本发明的表达载体也可以包括选择性的标记基因,以便对已经转 化的细菌株进行选择,例如,使细胞对药物,例如氨苄青霉素、氯霉 素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的 标记也可以包括生物合成基因,例如在组氨酸、色氨酸和亮氨酸生物 合成途径中的基因。凉主鄉辦/德應
本发明也提供包含本发明的核酸序列例如编码本发明的酰胺酶或 抗体的序列或者本发明的载体的转化细胞。宿主细胞可以是本领域技 术人员熟悉的任何宿主细胞,包括原核细胞,真核细胞,例如,细菌 细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。 典型的细菌细胞包括大肠杆菌、链霉菌、枯草芽孢杆菌、鼠伤寒沙门
氏菌(&z/附o"e〃a^^/;m^M附)和假单胞菌属、链霉菌属和葡萄球菌属 中的许多种类。典型的昆虫细胞包括果蝇S2和草地夜蛾(S/7(^叩tera) S/P。典型的动物细胞包括CHO, COS或黑色素瘤细胞或任何鼠或人 的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化 各种高等植物种类的技术是已知的,在技术和科学文献中有描述,见, 例如,Weising ( 1988) Am. Rey. Genet. 22:421-477,美国专利号 5,750,870。
载体可以使用各种技术导入宿主细胞中,包括转化,转染,转导, 病毒感染,基因枪,或者Ti介导的基因转移。具体的方法包括磷酸钙 转染,DEAE-Dextran介导的转染,脂转染法(lipofection),或电穿孔
(Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology,
(1986))。
一方面,本发明的核酸或载体导入细胞是为了筛选,所以,所述 核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体 上由靶细胞类型决定。典型的方法包括CaP04沉淀法,脂质体融合法, 脂转染法(例如,LIPOFECTIN ),电穿?L法,病毒感染法,等等。 候选的核酸可以稳定地整合到宿主细胞基因组中(例如,用反转录病 毒导入)或者可以短暂的或稳定的存在于细胞质中(即,通过使用传 统的质粒,利用标准的调控序列,选择标记,等等)。因为许多药学 上重要的筛选要求人或模型哺乳动物靶细胞,可以转染这些靶细胞的 反转录病毒载体是优选的。
适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述 营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基 因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法诱导被选择的启动子(例如,温度变化或化学诱导),细 胞再培养一段时期,使得它们产生所需的多肽或其片断。细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的 粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用 任何常规方法破碎,包括冷冻-融解循环,超声波裂解法,机械破碎法, 或使用细胞溶解试剂。这些方法为本领域技术人员所熟悉。表达的多 肽或其片断可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸 提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、 亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假 如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。也可以应用各种哺乳动物细胞培养系统来表达重组蛋白。哺乳动物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系和别的能够由 相容性载体表达蛋白质的细胞系,例如C127、 3T3、 CHO、 HeLa和 BHK细胞系。可以以常规方式应用宿主细胞中的构建物以产生由重组序列编码 的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体 的该宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的。本 发明的多肽可以包括或者不包括起始的甲硫氨酸残基。也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译 系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包 括与编码所述多肽或其片断的核酸有效连接的启动子。 一些方面,该 DNA构建物在进行体外转录反应之前可以是线性的。转录得到的 mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育, 产生所需的多肽或其片断。表达载体可以含有一个或多个选择性标记基因,为选择转化宿主 细胞提供表型性状,例如真核细胞培养物的二氢叶酸还原酶或新霉素 抗性,或者Ecoli的例如四环素或氨苄青霉素的抗性。繊,澇在实践本发明时,可以通过扩增复制本发明的核酸和编码本发明的多肽的核酸,或本发明的经修饰的核酸。扩增也可以用于克隆或修 饰本发明的核酸。所以,本发明提供用于扩增本发明的核酸的扩增引 物序列对。在可替代的方面,引物对可以扩增本发明的核酸序列,或 者它的子序列。本领域技术人员能够针对这些序列的任何部分或全长 设计出扩增引物序列对;例如典型的SEQ IDNO:l是 atgaactcaaccttagcctacttcacggaacagggacccatgtctgacccgggaacctatcgttcgcttt ttgaagatcttcccacatccatcccagatctggtgaagcttgtgcagggagtcaccctacatatcttttggacg gagcgatatggactcaaagttcccccgcaacgaatggaggaactgcagctccgttcgatggagaaa cggctggcgcgcacgctcgaattagatccgcgtccacttgttgagccgcgtccgctagagaacaagttgct cggcaattgtcgggatcattctctattgcttaccgcgctgctgcgtcatcagggagttccggctcgcgc ccgctgtgggtttggtgcctacttcctgccagaccattttgaggaccactgggtcgttgagtactggaatcag gagcaatcccgctgggtacttgtggacgcacagttggatgcctcacagcgcgaggtgttgaagatcg actttgacactttggatgtcccccgtgatcaattcatcgtcggcggcaaagcctggcaaatgtgccgttc tggcgagcaagaccctggcaaattcggcattttcgatatgaatggattgggcttcgtgcggggggatctt gtacgtgatgtcgcctcgctcaataaaatggaattgctgccctgggattgctggggtgttattctcgttgagaa actcgatg3cccggctgacctttccgtgcttgatcgagtcgcttcgctcaccgcgagagatgtccccgatttt gaagtgctgcgcgcctgttatgagtctgatccgcgactgcgtgtgaacgactcattgctgagctacgtcaac gggaacatggtggaagtccagatcgcttaa所以,典型的扩增引物序列对是SEQ ID NO: 1的残基1到21和 SEQ ID NO: 1的最后21个残基的互补链。典型的SEQ IDNO:3是 gtgccgagcctcgacgagtacgcgacccacagcgccttcaccgaccccggccggcaccgggacctgct cggcgcgaccgggacgtcgcccgacgacctgcaccgtgcggcgacaggcgtcgtcctgcactaccgc ggccagcgcgaccggctcacggacgagcagctgcccgacgtcgacctgcgctggttctccgcccagct cgaggtcgttcggcaccgcgcggcgctcccgctcggcgcgcaccggacggacgcgcagcacctcgcg gggtgctgccgcgaccac3cgctgctcgccgtcgccgtcctgcgcgagcacggcatccccgcgcgc3g ccgcgtcggcttcgccgactacttcgagcccgacttccaccacgaccacgtcgtcgtcgagcggtgggac ggcgcgcggtgggtgcgcttcgactcggcgctggacccggcggaccacctgttcgacgtggacgacat gccggcgggggagggcatgccgttcgagacggccgccgaggtctggctcgccgcgcgggcgggccg cgtcgacccccggcggtacggcgtgg3C3aggcgatgccgc3cctgatcggcatcccgttcctgctcgg cgaggtcttcctcgagctcgcgcaccggcagcgcgacgagatcctgctgtgggacgtgtggggcgtcgg catcccgccgttcgcgcggccggacggcctggcacccgtgaccatgtcggacgacgagatggcggagc tcgccgacgaggtggcgcggctcgtcgtcgcggcggacgacggcgacgacgcggctgacgcggcgctcgacgcccgctacgccgccgatccccgcctgcggccgacggccaacccgctcgtggcgctctcgccgc tcgaacgcatcggggacgtcgacctgacggcgcggacgacgacctgg cggtga
所以,典型的扩增引物序列对是SEQ ID NO: 3的残基1到21和 SEQ ID NO: 3的最后21个残基的互补链。
典型的SEQ IDNO:5是 atgaccaatcagccggagcgcagcaccgcacggtcatactacgccgccccggcggcgatgaccgactt gagcgcgcatcgcgcgcgcttgcgcgacctgccgaccgatctggccgggctctgccgcgtcattcaggg actgctggtgcatccctttctcgcgcacctctacggcctgccgtcgagcgcgctgcgcctcggcgagttgg agttgcgccgcgcctcggcgatgctcgatcacgcgttgaccctcgacgcgcgcccgctcgtcgaggcgc gcccgccggagcgacgcctggtgggcaactgccgccacttttcggtgctgttctgcgccttactgcgcgcc cagggcgttccggcgcgcgcccgctgcggattcggcgcctacttcaatccggcgcgtttcg鄉atcact gggtcggcgaagtctgggactcgacgcgcggcgcctggcgcctcgtcgacgcacagctcgatgccgag cagcgccaggcgctgcgc3tctcgttcgatccgctcgacgtgccgcgcagcgagttcgtggtagccggc gaggcgtggcgacggtgccggagcggcgcggccgctcccgaactgttcggcatcc tcgatctgcgcggtctctggttcgtgcgcggcaacgtggtgcgcgacctcgccgcgttcagcaagcgcga actgctgccgtgggacggctggggtctgatggcgacgcgcgaggacagcagtcctgccgagctggcgc tactcgaccacgtcgccgagctgactctggccggcgacgagcgccacgacgagcgcctgcatctgcag gatgccgaacccggcctgcgcgtgcctcgcgtcgttctcagcttcaacctgaacggcgccgaggtcgatc tcggccccggcgttgcgaactga
所以,典型的扩增引物序列对是SEQ ID NO: 5的残基1到21和
SEQ ID NO: 5的最后21个残基的互补链。
典型的SEQIDNO:7是 atgcgcagcgacctcgcattctatcaaacacaggggatcatcaccgatcccggccaacatcacgacctgct gaccggcctgccgggcgacctgcccggcctggtcaaagtcgtccagggcctggtggtgcacgtcttctg gctggagcgctacggcttgaagctgaaggagacgcgcaaggccgaggtgcagttgcgctgggctgaaa agcagctcgagcgcatccgcgcgctcgacccgcgcccgctggccgaagcccggcccctggagaagcg cctggtgggcaactgccgggatttcaccgtcctgctggtatgcctgctgcgcgcccggggcatcccggcc cgcgcgcgctgcggtttcgccaagtacttcgaggcggggcggcacatggatcactgggtggccgaggttt ggaacgccgagctgcaacgctggactttggtcgacgcacaactcgacgacctgcagcgcaaggcgctc gcgataccgttcaacccgctggacgtgccgcgcgtgcagttcctgaccggcggcgaagcctggctgcgc tgccgcaaggggc郷ccgaccccgagaccttcggcatcttcgacctga鄉ggttgtggttcgtgcgc ggggacttcgtgcgcgacgtggccgcgctcaacaaggttgagctgctgccctgggatgcatggggcatc gccgatgtgcaggaaaaggatatctccggggaagacctggttttcctggacgaggtggccgagctctcac atggcgacgtggagcgcttcgagcaggtgaaggggctgtatgaaaccgacccccggctgcacgtgccggaggtgatcaacagttacacacaggcaggggtgctgcgcgtcgatctccaagcacattcgtag所以,典型的扩增引物序列对是SEQ ID NO: 7的残基1到21和 SEQ ID NO: 7的最后21个残基的互补链。典型SEQ IDNO:9是 atgaccgatcgtgcgccgtacgccgcccagagtcccatctccgatccgggcgatatgtccaggtggcttac tggcttgccagcagatttcgcggccctgcgggcgctggccaggccgctggtcgcacactaccgggccga tgacctggcggcgttcggcattcccgaggagcgcgtggaggagatcgacacgcggtttgcggagcggat gctggcgcggctgcacgagatggagagcggtccgctc3cgccgg3gcgcacgccggccaaccgcctc gtgggctgctgccgggscttcaccctgctctacctgaccatgctgcgccacgccggcatcccggcacggt cacgcgtgggctttgccggctactttgccgctggctggttcatcgaccacgtggtggctgaggtctgggac gaggccaacgggcgctggcgcctggtcgatccccagttggcggatgtgcgcactgaccccaacgacgg cttccccatcgatecgctcgatatcccgcgcgaccgtttcctggttgcgggcatggcgtggcaggcttgcc ggagtgaggaactgcagccagagcagttcgtggttgacccagatctcgatatcccggtgacgcgcggctg gctgcaactgcggcacaacctggtgcaggacctcgccgcactgacgaagc.gggagatgatcctctggga tacgtggggcatcctgggtgacgagccggtggcggaggatacgctgcccttgctggacagcatcgcggc tgtcaccgccgatcccgatgtcacgtacgcggacgccctcaatctctacgagcgggagccgggggtgca ggtgccgccagaggtgatgagcttcaacatgctggcgaacgagccaaggatggtggcgtcgggggtgtag所以,典型的扩增引物序列对是SEQ ID NO: 9的残基1到21和 SEQ ID NO: 9的最后21个残基的互补链。典型SEQ ID NO: 11是 atgcttgcagccggggtaccaggacgacttgtaggccttcaccggattgttgaactcgatctcgagcgtg aaacgctcgggcagctgcagcaggcacttcttcaggtcgccctgcagtgcctgcctgacgccctcgcgga tctgcgcgcaggcggccttgggcgcgaggctgacggtcgacggcccgatgccctcgctgaccgcgacg gcggtgatgttggggttggtctccttgatgtcggtgcagagctgccagtcgccggagacgaacaccaccg ggacgccgaccatggcggcggcataggcgtgcagcaggaattccgaagtcgccacgccgttgatgcgc atgcgcatgacctcacccgtcagcgtgtgcgccaagggattggtctcgtcgccggccttcgagtgatagcc gatgaacatcgcggcatcgaagctcttgtccagctcctgcaccatgctcatcggatggccgctccagccgc ggatcaggcgcacattctccggcaggtcggcctgcaggatgttgcgcccggtcgcgtgtgcgtccttgatc agg加tccttggcccccgccgcgttggcgccgtcgcacgccgcc绍cacttcgcgcgtcatctgctcgc gatgctcgggatagtcggcgtgcggcttgcgcgcctcgtcccagttggtgatgccggcggtgccctcgat gtcggcgctgatgaagatcttcatgccactcctctttgcaaacgcgcgccactctag所以,典型的扩增引物序列对是SEQ ID NO: 11的残基1到21和 SEQ ID NO: 11的最后21个残基的互补链。典型的SEQ IDNO:13是 ttgccgcaaggcgtgtgcgccgcttcactgcgtcggtatcggcaacgaaaggaacagtacctcatgacga tecacc3ac3gattctcgacttctetacgcgccctgccgggatgacgtccgccggcc3attcgcgcccttat tcgacgcgctgccgagcgacgtgggcgaactcgtccgcatcatccagggccttggggtgtatgaccttgt ggcgtccggcttctecggcttcacg3tcccggacgagcgccagggcgagatccacctccgccccgtaga gaaaatgctgggccgcctcctcgccctcgacgaccggccgctccgtgtcgcccggccggtcgacaggc gtctggtcggccgctgccgtcacttcgtgctgctactcgtcgccatgttgcgggccaagggtgttccggcg cgggcgcgctgcgggttcggctcctactttagacgcgggttctttgaggaccactgggtgtgcgagtactg gaacgccgccgaagcccgctgggtgcttgtcgatccacagttcgacgaggtttggcggg agacactacagatagatcacgacattcttgatgtgccgcgcgaccgtttcctggtagcgggcgacgcctgg gcgcaatgccgcgcgggtgcggccgacccggcgaagttcgaaatcgttttcgccgacctgagcggactg tggttcatcgccgggaacctggtgcgcgacgtggcggcgctcaacaagacggagatgctgccgtgggac gtctggggcgcccagccccgcccgcacgaagcgctcgacgacgaccaactgaccttcttcgacaaactc gccgcgctcacgcgcgagcctgacgcgtcgttcgcggaactgcgcaccctctacgaaggagatgatcgc ctgcgtgtgccggcgaccgtcttcaacgcgatgcgcaacgcgcccgaaacgatcgcgggctga
所以,典型的扩增引物序列对是SEQ ID NO: 13的残基1到21和 SEQIDNO: 13的最后21个残基的互补链。
典型的SEQIDNO: 15是 gtggaccaaaccggagcaaatgacgcactggtggggcatggccggcggcccgcgtccgccggtcgcc gagaccgacctgcgcgtcggcggccgcttcaaggtgcagttctgggatcccaagaacgagcatcacagc gtcagcggcatctacaaggaggtcgtgcccaaccggaagctcgccttctcgtgggcctggcagagcacg cccgagcgcgaatcgctggtgacgatcgagctcaacccggtcaccgagggcaccatgctgacgctgacc cacgagcagttcttcgacgagaaggcgcgcgacgaccacggccgcggctggaacgtcgccctcgaccg cctggagagcttcctcacatg3cccccggccaggccgtggaccgggcgttcgccggcttgccgggcgat cccgcgtcgctggccggcgtcgtgcagggccttttgatgcacgagcatatcgcgccggc ctacggcctcaccctgagcgaggcccagcacgcggaggcgcacacccggccggtcgaggagatcgtg cgcc3gatcgtggcgcacg3tcctcgtccgctcgccgagccgcgcgcgcccggcg犯cgccaggtcg gcaattgccggcacttcaccctgctgcacgtcacgatgctgcgccgcgccggcgtgcgggcgcgcgccc gctgcggcttcggcggctacttcgagccgggcaagttcctcgaccactgggtcaccgaatactggaacga gcggcgccaggcgtgggttctggtcgatgcccagctcgatgcccgccagcgcgagctcttcaagatcgc cttcgaccccctcgacgtgccgcgcgacaagttcctggtcgcgggcgacgcctggcagcgctgccgcgc Cggc3ccgccgatccg3acgcgttcggc3tcctcg3c难cacgggctgtggttcgtcgccggc2atttg atccgcgacgtcgccgcgctcaacgaccacgtgatgctgccgtgggacgtgtggggcgcgatgaccca g3acgacgcgg3gctcgacc肌ccgttcctcgac犯gctggccgcgctg3ccgtcg3gcccgaccgccatttcggcgagctgcgcgccgtctaccaggatccgcgcgtgaaagtgccggcgaccgtgttcaacgccat ccgcsaccgccccgaaaccctttg3所以,典型的扩增引物序列对是SEQ ID NO: 15的残基1到21和 SEQ ID NO: 15的最后21个残基的互补链。扩增反应也可以用于定量样品中的核酸的量(例如,细胞样品中 的信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸或 定量样品中的特定核酸的量。在本发明的一方面,从细胞或cDNA文 库中分离出的信息被扩增。熟练的技术人员能够选择和设计适合的寡核苷酸扩增引物。扩增 方法在本领域是已知的,包括,例如聚合酶链式反应,PCR (见,例 如PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. I皿is, Academic Press, N,Y. (1990)和PCR STRATEGLES (1995) , ed. Innis, Academic Press, Inc., N.Y.,连接酶链反应(LCR)(见,例如Wu(1989) Genomics 4:560; Landegren( 1988)Science 241:1077; Barringer(1990) Gene 89:117);转录扩增(见,例如Kwoh (1989) Proc. Natl. Acad. Sci. USA86: 1173);和自主序列复制(见,例如Guatelli (1990) Proc.Natl. Acad. Sci. USA 87:1874); Q Beta复制酶扩增(见,例如Smith(1997) J. Clin. Microbiol. 35:1477-1491),自动Q-beta复制酶扩增分 析(见,例如Burg (1996) Mol. Cell. Probes 10:257-271)和别的RNA 聚合酶介导的技术(例如,NASBA,Cangene,Mississauga, Ontario);也 见Berger (1987) Metbods Enzymol. 152:307-316; Sambrook; Ausubel; 美国专利号4,683,195和4,683,202; Sooknanan (1995) Biotechnology 13:563-564。确定序列一致性程度本发明提供与SEQ ID NO:l , SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQIDNO:9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQIDNO:21, SEQIDNO:23, SEQ IDNO:25, SEQ ID NO:27, SEQ ID NO:29, SEQIDNO:31, SEQ ID NO:33, SEQ IDNO:35, SEQ ID NO:37, SEQIDNO:39, SEQIDNO:41, SEQ ID NO: 43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQIDNO:61, SEQ IDNO:63, SEQIDNO:65, SEQIDNO:67, SEQ ID NO:69, SEQ ID NO:71 , SEQ ID NO:73, SEQ ID NO:.75, SEQID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQ IDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQID NO:lll, SEQ ID NO: 113,以及SEQIDNO:2, SEQIDNO:4, SEQID NO:6, SEQIDNO:8, SEQ ID NO: 10, SEQ ID NO: 12, SEQIDNO:14, SEQ ID NO: 16, SEQ ID NO: 18, SEQIDNO:20, SEQIDNO:22, SEQ IDNO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQIDNO:42, SEQ ID NO: 44, SEQIDNO:46, SEQIDNO:48, SEQ IDNO:50, SEQIDNO:52, SEQ ID NO :54, SEQ ID NO:56, SEQID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQIDNO:68, SEQIDNO:70, SEQIDNO:72, SEQIDNO:74, SEQ IDNO:76, SEQ ID NO:78, SEQ ID NO :80, SEQ ID NO:82, SEQID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQIDNO:94, SEQIDNO:96, SEQIDNO:98, SEQ ID NO: 100, SEQ IDNO:102, SEQIDNO:104, SEQIDNO:106, SEQIDNO:108, SEQ IDNO:110, SEQIDNO:113, SEQ ID NO:114具有至少50%序列一致 性的核酸和多肽。 一方面,本发明提供与本发明的序列有至少99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%或50%序列一致性(同源性)的核酸和多肽。 一方面,本 发明提供具有在本发明的序列中阐明的序列的核酸和多肽。在可替代 的方面,所述序列一致性是在至少大约5, 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000或更多个连续残基,或者全长的核酸 或多肽的范围内。序列一致性(同源性)的程度可以使用任何计算机 程序和相关参数确定,包括在此描述的,例如具有默认参数的BLAST 2.2.2.或者FASTA版本3 .0t78。同源序列也可以包括RNA序列,RNA序列中的尿嘧啶替代了核 酸序列中的胸腺嘧啶。同源序列可以使用任何在此描述的程序或者可 以由测序错误的校正获得。可以知道的是,在此阐明的核酸序列可以 用传统的单字母格式表示(见,例如,Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman k Co., New York)或者用任何别的记录序列中核酸的一致 性的格式表示。
在此确定的各种序列比较程序被用于本发明的这一方面。蛋白和/ 或核酸序列的一致性(同源性)可以应用本领域己知的各种序列比较 算法和程序来评估。这样的算法和程序包括,但不限于,TBLASTN, BLASTP, FASTA, TFASTA和CLUSTALW (Pearson和Lipman, Proc. Natl. Acad. Sci. USA 85 (8) :2444-2448, 1988; Altschul等,J. Mol. Biol. 215 (3) : 403-410, 1990; Thompson等,Nucleic Acids Res. 22 (2): 4673-4680, 1994; Higgins等,Methods Enzymol. 266: 383-402, 1996; Altschul等,J. Mol. Biol. 215 (3) : 403-410, 1990; Altschul等,Nature Genetics 3:266-272, 1993)。
同源性或者一致性可以应用序列分析软件来测定(如威斯康星大 学生物技术中心遗传学计算机组(Genetics Computer Group)的序列分 析软件包,1710 University Avenue, Madison, WI 53705)。这样的软件 通过对各种缺失、替代和其它的修饰赋予表示同源性的数值来匹配相 似的序列。联系两个或者多个核酸或者多肽序列的术语"同源性"和 "一致性",是指当两个或更多个序列或子序列在某一比较窗口 (comparison window)或者指定区域内被比较和联配以确定最大一致 性时,这些序列是相同的,或者具有特定比例的相同氨基酸残基或核 苷酸,最大一致性可以应用各种序列比较算法或者通过人工联配和观 察检验来测定。对于序列比较, 一段序列可以作为参考序列(本发明 的序列),受测序列与之进行比较。当使用序列比较算法时,将受测 序列和参考序列输入到计算机中,指定子序列坐标,如果必要,指定 序列算法程序参数。可以使用默认的程序参数,或者可以指定替换的 参数。以程序参数为基础,然后通过序列比较算法计算出受测序列相 对于参照序列的百分序列一致性。
正如在此所用,"比较窗口"包括参考任一数目的连续残基的片段。例如,在本发明可选择的方面,本发明的示例性多肽或者核酸序 列的从20到全长的任何范围的连续残基与具有同样数目的连续位置的 参考序列在被优化联配后进行比较。如果该参照序列具有与本发明的 示例性多肽或者核酸序列所需要的序列一致性,如,与本发明的序列具有50%, 55%, 60%, 65%, 70%, 75%, 80%, 90%或者95%, 98%, 99%或者更高的序列一致性,那么这一序列在本发明的范围内。 在可供选择的实施方式中,范围在从大约20到600、大约50到200 和大约100到150的子序列与具有相同数目的连续位置的参考序列在 优化联配之后,进行比较。用于进行比较的序列联配方法在本领域已 知。用于比较的序列的优化联配可以通过例如以下的手段实现Smith 和Waterman, Adv. Appl. Math. 2: 482, 1981的局部同源性算法, Needleman和Wunsch, J. Mol. Biol. 48:443, 1970的同源性联配算法, person和Lipman, Proc. Nat'l. Acad. Sci. USA 85: 2444, 1988的査找相似 的方法,这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、 BESTFIT、 FASTA和TFASTA, Genetics Computer Group, 575 Science Dr., Madison, WI),手工联配和观察检验。除了 BLAST程序(生物信息国家中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))夕卜,用于确定同源性或者一致性的其它的算法 包括,例如,ALIGN, AMAS (多重联配序列分析(Analysis of Multiply Aligned Sequences)), AMPS (蛋白多重序列联配(Protein Multiple Sequence Alignment)), ASSET (联配片段统计评估工具(Aligned Segment Statistical Evaluation Tool)), BANDS, BESTSCOR, BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node)), BUMPS (BLocks證謂ed Searcher), FASTA, Intervals & Points , BMB , CLUSTAL V , CLUSTAL W , CONSENSUS , LCONSENSUS, WCONSENSUS, Smith-Waterman算法,DARWIN, Las Vegas算法,FNAT (强迫核苷酸联配工具(Forced Nucleotide Alignment Tool)), Framealign, Framesearch, DYNAMIC, FILTER, FASP(Fristensky序列分析软件包),GAP (全局联配程序(Global Alignment Program)), GENAL, GIBBS, GenQuest, ISSC (灵敏的序列比较(Sensitive Sequence Comparison)), LALIGN (局部序列联配(LocalSequence Alignment)), LCP (局部内容程序(Local Content Program)), MACAW(多重联配构建和分析工作台(Multiple Alignment Construction & Analysis Workbench)), MAP (多重联配程序(Multiple Alignment Program)), MBLKP, MBLKN, PIMA (模式诱导的多重序列联配
(Pattern-Induced Multi-sequence Alignment)), SAGA (通过遗传算法 的序列联配(Sequence Alignment by Genetic Algorithm))和WHAT隱IF。 这样的联配程序也可以用于筛查基因组数据库,确定具有大体上相同 的序列的多聚核苷酸序列。大量的基因组数据库是可利用的,例如, 作为人类基因组测序工程的构成部分的人类基因组的实质部分可以被 利用(Gibbs, 1995)。几个基因组序列已经测定,如,生殖器支原体
(A/: gem'to/z'wm) (Fraser等,1995),甲烷球菌(M./a""a"/n'/) (Bult 等,1996),流行性感冒杆菌z.咖画6) (Fleischma皿等,1995), 大肠杆菌(£. co/!') (Blattoer等,1997),和酵母(<S. cwev!'s!'ae) (Mewes 等,1997),和黑腹果蝇(D. 7we/fl"0gayfer) (Adams等,2000)。在模式 生物的基因组序列的测序上已经取得了很大的进展,如鼠,线虫(C. e/eg朋s)和拟南芥(^ra6^/o/m;s平)。含有基因组信息并且注释有一 些功能性信息的数据库由不同组织维护,可以通过互联网登录。
BLAST、 BLAST 2.0和BLAST 2.2.2算法也用于实践本发明。它 们在例如Altschul (1977)Nuc. Acids Res. 25:3389-3402; Altschul (1990) J. Mol. Biol. 215:403-410中描述。用于实施BLAST分析的软件可以通 过美国国家生物技术信息中心公开获得。这一算法包括首先通过鉴别 待询序列(query sequence)中长度为W的短的字串来确定高分序列对
(high scoring sequence pairs, HSPs),所述高分序列对在与数据库序列 中同样长度的字串联配时,匹配或者满足某个正值的阈值T。 T是指作 为邻近字串(neighborhood word)的分数阈值(Altschul (1990) supra)。 这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的 HSPs。所述字串沿着每一个序列向两个方向延伸,只要累积的联配分 数在增加。对于核苷酸序列,使用参数M (—对匹配的残基的奖励分 数;总是大于0)来计算累积分数;对于氨基酸序列,使用记分矩阵来 计算累计分数。
出现下面情况时,字串在各个方向上的延伸便停止累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残 基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、 T和X决定了联配的灵敏度和速率。 BLASTN程序(对于核苷酸序列)默认的是字串长度(W)为11,期 望值(E)为10, M=5, N=-4,对两条链进行比较。对于氨基酸序列, BLASTP程序默认字串长度为3,期望值(E)为10, BLOSUM62 记分矩阵(参见Henikoff和Henikoff (1989) Proc. Natl. Acad. Sci. USA 89: 10915)联配(B)为50,期望值(E)为10, M=5, N=-4,对两 条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分 析(参见,例如,Karlin和Altschul (1993) Proc. Natl. Acad. Sci. USA 90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率 (smallest sum probability, P(N)),其表示两个核苷酸或者氨基酸序列 间的匹配将偶然发生的概率。例如,在受测核酸和参考核酸的比较中, 如果最小合计概率小于大约0.2,更优选的是小于O.Ol,最优选的是小 于大约0.001,就认为该核酸与参考序列相似。 一方面,应用基本局域 联配搜索工具("BLAST")来评价蛋白和核酸序列同源性。例如,五 个特定的BLAST程序可以用来进行以下的任务(1) BLASTP和 BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较;(2) BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较;(3) BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻 译产物与蛋白序列数据库进行比较;(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比 较;(5) TBLASTN把核苷酸待询序列的六个框架的翻译结果与核苷酸 序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相 似片段来确定同源性序列,所述相似片段在此是指在待査询的氨基酸 或核酸序列与受测序列之间的"高分片段对(high-scoring segment pairs)",该受测序列优选从蛋白或者核酸序列数据库得到。高分片段 对优选利用记分矩阵来确定(即,联配),很多的记分矩阵在本领域是 已知的。优选地,应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science 256: 1443-1445, 1992; Henikoff和Henikoff, Proteins 17:49-61, 1993)。较不优选地,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和 Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of protein Sequence and Structure, Washingion: National Biomedical Research Foundation)。
在本发明的一方面,为了确定核酸是否具有在本发明范围内必需 的序列一致性,应用NCBI BLAST 2.2.2程序,默认选项为blastp。在 BLAST 2.2.2程序中有大约38个设定选项。在本发明的这个示范性的 方面,除了默认的过滤设置外,使用所有的默认值(即,除了过滤参 数,所有的参数设定为默认值。过滤设定为OFF);在该位置上应用"-F F"设定,使过滤失效。应用默认的过滤设定常会由于序列的短长度, 导致Karlin-Altschul干扰。
在本发明的这个示范性的方面中使用的默认值包括
"低复杂性的滤器(Filter for low complexity):开(ON) 字串大小(Word Size): 3 矩阵(Matrix): Blosum62 空位罚分(Gap Costs):存在(Existence): 11 延伸(Extension): 1"
其它的默认设定可以是低复杂性的滤器关,对于蛋白,字串
大小为3, BLOSUM62矩阵,空位罚分为-11,空位延伸罚分为-1。典型 的NCBI BLAST 2.2.2程序设置默认"-W"选项为0。这是指,如果没 有设置,字串大小对蛋白的默认值为3,对核苷酸为ll。
计算机系统和计算机程序产品
为了确定和鉴定序列一致性、结构同源性、模体等等,本发明的 序列可以在能够由计算机阅读和访问的任何介质上存储、记录和操作。 因此,本发明提供记录或存储有本发明的核酸和多肽序列的计算机、 计算机系统、计算机可读介质、计算机程序产品等等。正如在此所用, 词语"记录"和"存储"是指将信息存储到计算机介质中的过程。技 术人员很容易地采用任何已知的方法将信息记录到计算机可读介质 上,从而产生包括发明的一个或者多个核酸和/或多肽序列的产品。 本发明的另一个方面是已经记录有本发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读 介质、电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存储器 (RAM),或者只读存储器(ROM),同时还有本领域技术人员所知的 其它类型的其它介质。本发明的方面包括存储和操作在此描述的序列以及序列信息的系 统(如,基于因特网的系统),特别是计算机系统。计算机系统100的 一个例子在图1的结构图中说明。正如在此所使用的,"计算机系统" 是指其硬件部分、软件部分以及用于分析本发明的核苷酸或者多肽序 列的数据存储部分。计算机系统100可以包括用于处理、访问和操作 序列数据的处理器。该处理器105可以是任何已知类型的中央处理单 元,例如Intel公司的奔腾III,或者来自Sun、 Motorola、 Compaq、 AMD 或者IBM的类似处理器。计算机系统100是一般用途的系统,包括处 理器105和一个或者多个用于存储数据的内部数据存储部分110,以及 一个或者多个用于检索存储在数据存储部分中的数据的数据检索装 置。技术人员可以很容易地意识到目前可用的计算机系统的任何一个 都是合适的。一方面,计算机系统100包括处理器105,处理器105连接于数据 传送总线,该总线连接于一个主存储器115(优选地,按RAM来实施), 计算机系统100还包括一个或者多个内部数据存储装置110,如硬盘驱 动器和/或具有数据记录作用的其它的计算机可读介质。计算机系统100可以进一步包括一个或者多个用于读取内部数据存储装置110上储 存的数据的数据检索装置118。数据检索装置118可以是例如,软盘驱 动器、光盘驱动器、磁带驱动器或者可以(如,通过因特网)连接至 远端的数据存储系统的调制解调器等。在一些实施方式中,内部数据 存储装置110是可移动的计算机可读介质,例如含有控制逻辑和/或在 其中记录有数据的软盘、光盘、磁带等。有利的是,计算机系统100 可以包括或运行适当的软件程序,从插入到数据检索装置中的数据存 储部分读取控制逻辑和/或数据。计算机系统100包括用于给计算机使 用者显示输出结果的显示器120。应当注意到,计算机系统100可以在 网络中或者宽域网中与其它的计算机系统125a-c相联,提供集中化的计算机系统100访问。用于访问和处理本发明的核苷酸或者氨基酸序 列的软件可以在执行中驻留在主存储器115。在一些方面,计算机系统 100可以进一步包括用于比较本发明的核酸序列的序列比较算法。算法 和序列可以存储在计算机可读介质中。"序列比较算法"是指一个或者多个程序,其在计算机系统100上(本地或远程)执行来比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或混合物。例如,所述的序列比较算法可以把存储在计算机可读介质中的本发明的核苷 酸序列与存储在计算机可读介质中的参考序列加以比较,确定同源性或者结构模体。以上算法所用的参数取决于序列长度和所研究的同源性的程度。 在一些方面,在没有来自用户的指示时,所述参数可以是所述算法所应用的默认参数。图2是说明了处理过程200的一个方面的流程图, 为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或 者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存 储于计算机系统100的私人数据库,或者公共的数据库,如通过因特 网可以访问到的GENBANK。过程200开始于起始状态201,然后移 至状态202,其中待比较的新序列存储在计算机系统100的存储器上。 如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储 设备。过程200然后移至状态204,其中序列数据库被打开以用于分析 和比较。然后,过程200移至状态206,其中存储在数据库的第一个序 列读取到计算机的存储器中。然后在状态210中进行比较,确定第一 序列是否与第二序列相同。重要的是,注意到这一步骤并不限于在所 述新序列和数据库中的第一序列间进行准确的比较。本领域技术人员 熟知比较两个核苷酸或者蛋白序列的方法,尽管它们并不完全相同。 例如,为了提高两个待测序列间的同源性水平,可以在一个序列中引 入空位。在比较过程中控制是否往序列中弓I入空位或者其它特征的参 数一般由计算机系统的使用者输入。 一旦在状态210下进行两个序列 的比较,在决定状态210下作出两个序列是否相同的决定。当然,术 语"相同"并不限于绝对相同的序列。在过程200中,在使用者输入 的同源性参数范围内的序列将标记为"相同"。如果决定了两个序列相 同,过程200移至状态214,其中给使用者显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名称的序列满足输 入的同源性限制。 一旦被存储的序列的名称显示给使用者,过程200 移至决定状态218,其中确定在数据库中是否存在更多的序列。如果在
数据库中没有更多的序列存在,那么过程200终止于结束状态220。然 而,如果在数据库中存在更多的序列,那么过程200移至状态224,其 中指示器移至数据库的下一个序列以便可以与所述的新序列比较。以 这种方式,所述的新序列与数据库中的每一个序列进行联配和比较。 应当注意到,如果已经在决定状态212确定了序列并不具有同源性, 那么为了确定在数据库中是否有其它的可用于比较的序列,过程200 将立即移至决定状态218。因此,本发明的一个方面是包括处理器、存 储有本发明的核酸序列的数据存储设备、以及用于进行比较的序列比 较器的计算机系统。该序列比较器可以指出待比较序列之间的同源性 水平或者鉴定结构模体,或者它可以鉴定与这些核酸编码和多肽编码 相比较的序列中的结构模体。图3是说明在计算机中确定两个序列是 否具有同源性的过程250的一个具体实施方式
的流程图。过程250开 始于起始状态252,然后移至状态254,其中待比较的第一序列被存储 于存储器中。待比较的第二序列然后在状态256被存储于存储器中。 过程250然后移至状态260,其中读取第一序列的第一个字符,然后到 状态262,其中读取第二序列的第一个字符。应当理解,如果序列是核 苷酸序列,那么所述字符一般将是A、 T、 C、 G或者U。如果序列是 蛋白质序列,那么可以是单字母的氨基酸代码,以便第一序列和第二 序列可以很容易地进行比较。然后在决定状态264作出是否两个字符 是否相同的决定。如果它们是相同的,那么过程250移至状态268,其 中读取第一序列和第二序列的下一个字符。然后确定所述的下一字符 是否相同。如果相同,那么过程250继续这一循环直到两个字符是不 同的。如果确定了接下来的两个字符并不相同,过程250移至决定状 态274,确定在两个序列中是否有任何更多的字符要读取。如果没有任 何更多的字符被读取,那么过程250移至状态276,其中第一序列和第 二序列的同源性水平显示给使用者。通过计算序列间相同字符占第一 序列中字符总数的比例来确定同源性水平。这样,如果第一个100核 苷酸序列的每一个字符都与第二序列的每一个字符联配,那么同源性水平将是100%。作为选择,计算机程序可以比较参考序列与本发明的序列,确定 序列是否在一个或者更多的位置上有不同。程序可以记录关于参考序 列或本发明的序列的插入、缺失或者替代的核苷酸或者氨基酸残基的 长度和一致性。计算机程序可以确定参照序列是否含有关于本发明序列的单核苷酸多态性(SNP),或者,本发明的序列是否含有已知序列 的SNP。因此,在一些方面,所述计算机程序是识别单核苷酸多态性 的程序。该方法可以通过如上描述的计算机系统和在图3中说明的方 法来完成。该方法的实施可以是通过使用所述的计算机程序读取本发 明的序列和参考序列,并用所述计算机程序来识别不同。另一方面,以计算机为基础的系统包括用于识别本发明的核酸和 多肽中的特征的识别器。"识别器"涉及识别核酸序列中特定的特征的 一个或者多个程序。例如,识别器可以包括识别核酸序列中的开放阅 读框架(ORF)的程序。图4是说明用于检测在序列中某个特征的存 在的识别器处理过程300的一方面的流程图。过程300开始于起始状 态302,随后移至状态304,其中待检测特征的第一序列被存储于计算 机系统100的存储器115中。过程300然后移至状态306,其中序列特 征的数据库被打开。这样的数据库将包括各个特征的属性及其名称的 列表。例如,特征的名称可以是"起始密码子",该特征属性将会是 "ATG"。另一个例子是特征名称"TAATAA盒",该特征的属性将是 "TAATAA"。这样的数据库的例子由威斯康星大学遗传学计算机组制 作。可选择地,所述特征可以是结构性多肽模体,如a螺旋、0折叠, 或者功能性多肽模体,如酶的活性位点、螺旋-转角-螺旋模体,或者本 领域技术人员所知的其它模体。 一旦特征的数据库在状态306下打开, 过程300移至状态308,其中从数据库读取第一特征。然后在状态310 进行第一特征的属性和第一序列的比较。然后在决定状态316中作出 决定是否在第一序列中发现所述特征的属性。如果发现有该属性,那 么过程300移至状态318,其中所发现的特征的名称被显示给使用者。 过程300然后移至决定状态320,其中决定是否在数据库中存在更多的 特征。如果不存在更多的特征,那么过程300终止于结束状态324。然 而,如果在数据库中存在更多的特征,那么过程300在状态326中读取下一个序列特征,并且回至状态310,在其中进行所述下一个特征的
属性与第一序列比较。如果在决定状态316中所述特征的属性没有在
所述第一序列中发现,那么为了决定在数据库中是否存在更多特征,
过程300直接移至决定状态320。因此,在一方面,本发明提供了识别 开放阅读框架(ORFs)的计算机程序。
本发明的多肽或者核酸序列可以以不同的格式用不同的数据处理 器程序加以存储和操作。例如,序列可以以文本形式存储于字处理文 件,如MicrosoftWORD或者WORDPERFECT或者ASCII文件,它们 在本领域技术人员所熟悉的各种数据库程序中,如DB2, SYBASE或 者ORACLE。此外,可以应用很多的计算机程序和数据库来作为序列 比较算法、识别器、或者将与本发明的核酸序列进行比较的参考核苷 酸序列或者多肽序列的数据来源。用于实践本发明的程序和数据库包 括,但不限于MacPattern ( EMBL ) , DiscoveryBase ( Molecular Applications Group), GeneMine (Molecular Applications Group), Look
(Molecular Applications Group), MacLook (Molecular Applications Group), BLAST和BLAST2 (NCBI), BLASTN和BLASTX (Altschul 等,J. Mol. Biol. 215: 403,1990), FASTA (Pearson和Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988), FASTDB (Brutlag等,Comp. App. Biosci. 6: 237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE ( Molecular Simulations Inc. ) , Cerius2.DBAccess
(Molecular Simulations Inc.) , HypoGen ( Molecular Simulations Inc.), Insight II (Molecular Simulations Inc.), Discover (Molecular Simulations Inc. ) , CHARMm ( Molecular Simulations Inc. ) , Felix ( Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM,
(Molecular Simulations Inc.) , Homology (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design ( Molecular Simulations Inc.) , WebLab ( Molecular Simulations Inc.) , WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), MDL可用化学制品目录数据库(Available Chemicals Directory database) , MDL药品数据报告数据库(Drug Data Report database), 综合医药化学数据库(Comprehensive Medicinal Chemistry database),德文特的世界药物索引数据库(World Drug Index database), BioByteMasterFile数据库,Genbank数据库和Genseqn数据库。在本公 开内容的技术领域内的技术人员是熟悉很多其它的程序和数据库的。 应用以上的程序可能检测到的模体包括编码亮氨酸拉链的序列、 螺旋-转角-螺旋模体、糖基化作用位点、泛素化位点、a螺旋、)3折叠、 编码引导被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序 列如同源框、酸性伸展(acidic stretches)、酶的活性位点、底物结合 位点以及酶切割位点。
核酸的杂交
本发明提供了在严紧条件下与本发明的示范序列或者编码本发明 多肽的核酸杂交的分离的或者重组的核酸。所述严紧条件可以是高的 严紧条件,中等严紧条件,低的严紧条件,包括在此描述的高的和降 低的严紧条件。在一方面,正是洗脱条件的严紧性提出了确定一段核 酸是否在本发明范围内的条件,如下所述。
在可供选择的实施方式中,本发明的核酸根据它们在严紧条件下 杂交的能力来定义,它们可以在大约5个残基到本发明的核酸全长之 间;例如它们的长度可以是至少5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,卯0, 950, 1000, 或者更多的残基。也包括比全长核酸短的核酸。这些核酸可以作为如, 杂交探针、标记探针、PCR寡聚核苷酸探针、iRNA、编码抗体结合肽 (抗原决定部位)的序列或反义序列、模体、活性位点等等。
一方面,本发明的核酸由它们在高的严紧条件下杂交的能力来定 义,高严紧条件包括在37'C到42'C大约50X的甲酰胺。 一方面,本发 明的核酸由它们在降低的严紧条件下杂交的能力来定义,低严紧条件 包括在3(TC到35'C大约35%到25%的甲酰胺。
作为选择,本发明的核酸由它们在高的严紧条件下杂交的能力定 义,高严紧条件包括42。C, 50%的甲酰胺,5x SSPE, 0.3Q%SDS,和 重复序列封闭核酸,如cot-l或者鲑鱼精DNA (如,200n/毫升剪切的和变性的鲑鱼精DNA)。 一方面,本发明的核酸由它们在降低的严紧 条件下杂交的能力定义,该低严紧条件包括在降低的温度35'C, 35% 的甲酰胺。
杂交以后,用6xSSC, 0.5%SDS在5CTC洗涤滤膜。甲酰胺在25 %以上时这些条件被认为是"中等"条件,甲酰胺低于25%时这些条 件被认为是"低的"条件。"中等"杂交条件的一个具体例子是当以 上的杂交是在30%的甲酰胺中进行。"低严紧"杂交条件的一个具体 例子是当以上的杂交是在10%的甲酰胺中进行。
与特定水平的严紧度相对应的温度范围可以通过计算感兴趣的核 酸中嘌呤与嘧咬的比率并相应地调整温度而进一步变窄。本发明的核 酸也可以通过它们在高的、中度的、降低的严紧条件下杂交的能力来 定义,如Ansubel和Sambrook所述。以上范围和条件的变化为本领域 内所知。以下进一步讨论杂交条件。
以上过程可以被变化以确定与探针序列同源性水平降低的核酸。 例如,为了得到与可探测探针的同源性降低的核酸,可以应用较低严 谨度的条件。例如,在Na+浓度大约lM的杂交缓冲液中,杂交温度可 以以5"的幅度从68"C降低到42"。杂交后,滤膜可以用2xSSC, 0.5 XSDS在杂交温度下洗涤。认为大于5(TC的条件为"中等"条件,低 于5(TC为"低的"条件。"中等"杂交条件的一个具体例子是当以上的 杂交在55'C进行。"低严紧"杂交条件的一个具体例子是当以上的杂交 在45"C进行。
作为选择,杂交可以在缓冲液中进行,例如于42'C在含有甲酰胺 的6xSSC中进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以 5 %的幅度从50%降低到0% ,以确定与探针的同源性水平降低的克隆。 在杂交后,滤膜可以在5(TC,用6x SSC, 0.5XSDS洗涤。认为超过 25%的甲酰胺的条件为"中等"条件,低于25%的甲酰胺为"低的" 条件。"中等"杂交条件的一个具体例子是当以上的杂交在30%甲酰胺 时进行。"低严紧"杂交条件的一个具体例子是当以上的杂交在10%甲 酰胺时进行。
然而,杂交形式的选择并不是关键的—洗脱条件的严紧度提出了 确定一段核酸是否属于本发明范围的条件。用于鉴定核酸是否属于本发明范围的洗脱条件包括,例如在pH7的大约0.02摩尔的盐浓度,温 度至少是大约5(TC或者大约55'C到大约60°C;或者在72'C ,大约0.15M NaCl的盐浓度,大约15分钟;或者大约0.2xSSC的盐浓度,温度至 少为大约5(TC或者大约55'C到大约60°C,进行大约15到20分钟;或 者,杂交复合物在含有0.1%SDS的大约2xSSC的盐溶液中室、温15分 钟洗脱两次,然后用含有0.1XSDS的0.1xSSC在68'C、 15分钟洗脱 两次;或者等效条件,参见Sambrook, Tijssen和Ausubel所说明的SSC 缓冲液和等效条件。
这些方法可以用于分离本发明的核酸。
寡聚核苷酸探针及其应用方法
技术领域
本发明也提供了核酸探针,其可以被用来例如确定编码具有酰胺 酶活性的多肽或其片段的核酸或者用于确定酰胺酶基因。 一方面,所 述探针包括本发明的核酸的至少10个连续的碱基。作为选择,本发明 的探针可以是本发明的核酸阐明的序列的至少大约5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150或者大约10到50,大约20到60,大约30到70个连 续的碱基。所述探针通过结合和/或杂交确定核酸。所述探针可以用于 本发明的阵列,参见以下的讨论,包括,例如毛细管阵列。本发明的 探针也可以用于分离其它的核酸或者多肽。
本发明的探针可以用来确定生物样品例如土壤样品中是否含有具 有本发明的核酸序列的生物或者可以获得所述核酸的生物。在这样的 程序中,很有可能包藏有可以分离出所述核酸的生物体的生物样品被 获得,并从所述样品中得到核酸。在允许探针特异地与所述样品中存 在的任何互补序列杂交的条件下,让所述核酸与所述探针接触。在必 要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以 让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与 不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐 浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行被变化以 确定允许所述探针特异地与互补的核酸杂交的条件(参见关于特异杂 交条件的讨论)。如果样品含有可以从其中分离出所述核酸的生物体,那么探针的 特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探 针来检测,所述的可检测试剂例如放射性同位素,荧光染料或者能够 催化形成可检测产物的酶。使用标记探针来检测在样品中存在的互补
核酸的很多方法对于本领域技术人员是熟悉的。这些方法包括Southern 印迹,Northern印迹,菌落杂交方法,以及点杂交。每一个这样的程序 的实验方案在Ausubel和Sambrook中都有说明。
作为选择,可以在一个扩增反应中使用多于一种探针(其中的至 少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样 品中是否含有包括本发明的核酸序列的生物体(如,从中分离出所述 核酸的生物体)。 一方面,所述探针包括寡聚核苷酸。 一方面,所述 扩增反应可以包括PCR反应。PCR的方案在Ausubel和Sambrook (参 见关于扩增反应的讨论)中有描述。在这些程序中,所述样品中的核 酸与所述探针相接触,进行所述扩增反应,检测得到的扩增产物。扩 增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染 胶来进行检测。可选择地, 一种或者多种探针可以用放射性同位素标 记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的 存在。
源于本发明的核酸序列的5'或者3'末端附近的序列的探针也可以 在染色体移步程序中被应用,以确定含有另外的序列如基因组序列的 克隆。这样的方法允许从宿主生物体中分离出编码别的感兴趣的蛋白 的基因。
一方面,本发明的核酸序列被用作探针以确定和分离相关的核酸。 在一些方面,这样确定的相关的核酸可以是来自某些生物体的cDNA 或者基因组DNA,但是这些生物体可以不是本发明的核酸起初被分离
出来的那些生物体。在这样的程序中,核酸样品与所述探针在允许探 针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体
的核酸的杂交采用以上描述的任何方法来检测。
在核酸杂交的反应中,用于达到一定水平的严紧度的条件可以变 化,这取决于待杂交的核酸的性质。例如,在选择杂交条件时,可以 考虑所述核酸的长度、互补程度、核苷酸序列组成(如GC对AT的含量),和核酸的杂交区域的核酸类型(如,RNA, DNA)。另外一个考 虑是核酸之一是否被固定在例如滤膜上。杂交可以在低严紧、中等严 紧、高严紧条件下进行。作为核酸杂交的一个例子,含有固定的变性 核酸的聚合物膜首先在45"C下在含有0.9MNaCl, 50mMNaH2PO4, pH 7.0, 5.0mMNa2EDTA, 0.5%SDS, 10xDenhardt's试剂和0.5毫克/毫升 的寡聚核糖腺苷酸的溶液中预杂交30分钟。然后向该溶液中加入到大 约2xl07 cpm (放射性比度4-9x108 cpm/ug)的"P末端标记的寡聚核 苷酸探针。在温育12-16个小时以后,该膜在室温下(RT)在含有0.5 %SDS的lxSET (150 mM NaCl, 20rnM Tris盐酸,pH 7.8, lmM Na2EDTA)溶液中洗涤30分钟,随后,用新鲜的lxSET在寡聚核苷 酸探针的Tm-l(TC洗涤30分钟。该膜随后暴露于放射自显影的胶片以 检测杂交信号。
通过变化被用来鉴定核酸例如与可检测探针杂交的cDNA或者基 因组DNA的杂交条件的严紧度,可以鉴定和分离与探针具有不同水平 的同源性的核酸。通过在低于探针的解链温度下改变温度进行杂交而 使严紧度变化。解链温度,Tm,是指(在定义的离子强度和pH下) 50%的靶序列与精确互补的探针杂交的温度。非常严紧的条件被选择 为与特定的探针的Tm值相等或比其低大约5 °C。探针的解链温度可 以通过应用以下的经验公式计算。对于在14到70个核苷酸长度的探 针应用此公式计算解链温度Tm = 81.5+16.6(log [Na+])+0.41(G+C分 数)-(600/N),其中的N是探针的长度。如果该杂交在含有甲酰胺的溶 液中进行,解链温度可以通过应用以下的公式来计算Tm = 81.5+16.6(log [Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的N 是探针的长度。预杂交可以在6xSSC, 5xDenhardt's试剂,0.5%SDS, lOOjwg变性的鲑鱼精DNA片段或者6xSSC, 5x Denhardt's试剂,0.5 %SDS,, 100/ig变性的鲑鱼精DNA片段,50%甲酰胺中进行。对于SSC 和Denhardt's和其它溶液的配方列于如Sambrook中。
通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂 交。其中所述探针包括双链DNA,其在加入到杂交缓冲液前被变性。 滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者 其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交的过程可以是在低于Tm温度15-25t:进行。对于较短 的探针,如寡聚核苷酸探针,杂交的过程可以是在低于Tm温度5-10°C 下进行。 一方面,在6xSSC溶液中的杂交过程在大约68'C进行。 一方 面,在含有50X甲酰胺的溶液中的杂交的过程在大约42'C进行。认为 所有前述的杂交过程在高严紧的条件下进行。
杂交后,洗涤滤膜以去除任何非特异结合的可检测探针。用于洗 涤滤膜的严紧度也可以依据杂交的核酸的性质、杂交核酸的长度、互 补的程度、核苷酸序列的组成(如GC和AT含量)以及核酸类型(如, RNA, DNA)而变化。越来越高的严紧条件洗涤的例子如下2xSSC, 0.1XSDS在室温下进行15分钟(低严紧度);O.lxSSC, 0.5XSDS在 室温下进行30分钟到1个小时(中等严紧度);O.lxSSC, 0.5%SDS在 杂交温度到68'C之间进行15到30分钟(高严紧度),以及0.15M的 NaCl在72'C进行15分钟(很高的严紧度)。最后的低严紧度洗涤可以 在O.lxSSC在室温进行。以上的例子仅仅是列出一系列可以用于洗膜 的条件。本领域技术人员知道,对于不同严紧度的洗涤有各种配方。
已经与所述探针杂交的核酸可以通过放射自显影或者其它传统的 技术鉴定。以上的程序可以被变化,以鉴定与所述探针序列的同源性 水平降低的核酸。例如,为了得到与可检测探针的同源性降低的核酸, 可以应用较低严紧度的条件。例如,在含有大约lM的Na+浓度的杂交 缓冲液中杂交温度可以以5"C的幅度从68'C降到42'C。杂交以后,滤 膜可以用2xSSC, 0.5XSDS在杂交温度下洗涤。认为这些条件中超过 5(TC是"中等"条件,而低于5(TC的条件是"低的"的条件。"中等" 杂交条件的例子是当以上的杂交在55'C进行。"低严紧"杂交条件的例 子是当以上的杂交在45'C进行。
作为选择,杂交可以在缓冲液中进行,如在含有甲酰胺的6xSSC 中在42'C的温度进行。在这种情况下,在杂交缓冲液中的甲酰胺的浓 度可以以5%的幅度从50%到0%,以鉴定与探针的同源性水平降低的 克隆。杂交后,滤膜可以用6xSSC, 0.5XSDS在5(TC洗涤。认为这些 条件中超过25%的甲酰胺是"中等"条件,而低于25%的甲酰胺的条 件是"低的"条件。"中等"杂交条件的一个具体例子是当以上的杂交 在甲酰胺为30%时进行。"低严紧"杂交条件的一个具体例子是当以上的杂交在甲酰胺为10%时进行。
本发明的这些探针和方法可以用于分离核酸,其具有的序列与本
发明的包括至少大约10、 15、 20、 25、 30、 35、 40、 50、 75、 100、 150、 200、 250、 300、 350、 400、 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000或者更多个连续碱基的核酸序列有至少99%、 98%、 97%、至少90%、至少85%、至少80%、至少75%、至少70 。%、至少65%、至少60%、至少55%或者至少50%的同源性,序列 彼此互补。如在此所讨论的,同源性可以用联配算法测定。例如,所 述同源性的多聚核苷酸可以含有在此描述的编码序列之一的天然发生 的等位基因变异体。这样的等位基因变异体与本发明的核酸相比可以 具有一个或者多个核苷酸的取代、缺失或者增加。
此外,本发明的这些探针和方法可以用于分离核酸,其编码的多 肽与本发明的包括至少5、 10、 15、 20、 25、 30、 35、 40、 50、 75、 100、 或者150个连续氨基酸的多肽有至少99%、至少95%、至少90%、至 少85%、至少80%、至少75%、至少70%、至少65%、至少60%、 至少55%或者至少50%的一致性(同源性),这是应用序列联配算法 (如,使用了默认参数的FASTA版本3.0t78的算法,或者使用了在此 提出的典型设置的BLAST 2.2.2程序)测定的。
抑制本发明的酰胺酶的表达
本发明提供本发明的核酸序列的互补核酸(如反义序列)。反义序 列可以抑制酰胺酶编码基因的转运、剪接或者转录。所述抑制可以通 过靶向基因组DNA或者信使RNA来发生作用。靶核酸的转录或者功 能可以被抑制,例如,通过杂交和/或切割。本发明提供的一套特定的 有用的抑制剂包括可以与酰胺酶基因或其信息结合的寡聚核苷酸,在 任一情况下都能阻止或者抑制酰胺酶的产生或者功能。这种关联可以 通过序列特异性的杂交建立。另 一类有用的抑制剂包括可以弓I起酰胺 酶信息失活或者切割的寡聚核苷酸。所述寡聚核苷酸可以具有引起这 样的切割的酶活性,如核酶(ribozyme)。所述寡聚核苷酸可以被化学 修饰或者与能够切割互补的核酸的酶或者组合物接合。可以对由很多 不同的寡聚核苷酸组成的库进行筛选,以寻找到那些具有所需活性的寡聚核苷酸。本发明提供了能够结合酰胺酶信息的反义寡聚核苷酸,它能够通过靶向mRNA来抑制蛋白水解活性。设计反义寡聚核苷酸的策略在科学和专利文献中有很好的说明,而且技术人员可以应用本发明的新型 的试剂设计出这样的酰胺酶寡聚核苷酸。例如,用于筛选有效的反义寡聚核苷酸的基因移步(gene walking) 7RNA作图(RNAmapping)实 验方案在本领域是已知的,参见,如,Ho(2000)MethodsEnzymol. 314: 168-183,其说明了 RNA作图分析,它是基于标准的分子技术,可以 为有效的反义序列的选择提供容易的和可靠的方法。也参见Smith (2000) Eur. J. Ph滅Sci. 11: 191-198。天然发生的核酸可以作为反义寡聚核苷酸。所述反义寡聚核苷酸 可以是任何长度;例如,在可供选择的方面,所述反义寡聚核苷酸是 在大约5到100之间,大约10到80之间,大约15到60之间,大约 18到40之间。通过常规的筛选来确定最佳的长度。所述反义寡聚核苷 酸可以以任何浓度存在。通过常规的筛选来确定最佳的浓度。己知有 许多合成的、非天然发生的核苷酸和核酸类似物可以针对这样的潜在 的问题。例如,可以应用含有非离子骨架如N-(2-氨乙基)甘氨酸单位的 肽核酸(PNAs)。也可以应用具有硫代磷酸酯连接的反义寡聚核苷酸, 如在WO 97/03211; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal( Humana Press, Totowa, N丄,1996)所说明的。本发明提供的具有合成的DNA骨架类似物的反 义寡聚核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、垸 基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亚甲基(甲基亚氨)、3'-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸,正如以上所说明的。也可以应用组合化学方法来产生大量数目的寡聚核苷酸,可以对 它们进行快速筛选,找出对某些目标例如本发明的正义和反义酰胺酶 序列有合适的结合亲和性和特异性的特异的寡聚核苷酸(参见,如, Gold (1995) J.ofBiol.Chem. 270: 13581-13584)。鄉微艨本发明提供可以结合酰胺酶信息的核酶。这些核酶可以通过,例如靶向mRNA来抑制酰胺酶活性。设计核酶和选择用于靶向的酰胺酶特异的反义序列的策略在科学和专利文献中有很好的说明,而且技术 人员可以应用本发明的新型的试剂设计出这样的核酶。核酶通过核酶的靶RNA结合部分结合于靶RNA而起作用,核酶的RNA结合部分非 常靠近切割靶RNA的RNA酶活部分。这样,通过互补的碱基配对, 核酶识别和结合靶RNA,而且一旦结合于正确的位置,便以酶的活性 作用来切割靶RNA和使其失活。如果切割发生在编码序列中,以这样 的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合 和切割其RNA耙之后,它可以从结合的RNA上释放出来并且重复切 割新的耙子。在一些情况下,核酶的酶性质会优于其它的技术,如反义技术(其 中核酸分子结合于核酸靶来阻止其转录、翻译或者与其它分子的联 系),因为实现治疗效果所必要的核酶有效浓度可能低于反义寡聚核苷 酸的浓度。这一潜在的优点反映出核酶可以以酶的方式进行作用的能 力。因此,单个核酶分子可以切割靶RNA的多个分子。此外,核酶是 一种典型的高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱 基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机 制。即,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA 的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素, 这种切割机制还依赖于另外的因素。这样,核酶作用的特异性比结合 于同样的RNA位点的反义寡聚核苷酸强。本发明的核酵,例如,具有酶活的核酶RNA分子可以形成锤头状 基体、发夹基件,如肝炎6病毒基体、I类内含子基体和减与RNA引 导序列相联系的RNaseP类似的RNA。锤头状基体的例子在如,Rossi (1992 ) Aids Research and Human Retroviruses 8: 183中有说明;发夹 基体在Hampel( 1989)Biochemistry 28: 4929和Hampel( 1990)Nuc. Acids Res. 18:299中有说明;肝炎S病毒基体在Perrotta (1992) Biochemistry 31: 16中有说明;RNaseP基体在Guetrier-Takada (1983) Cell 35: 849 中有说明;I类内含子在Cech美国专利号4,987,071中有说明。这些特定模体的引述并不是限制性的。本领域技术人员将认识到本发明的核 酶,如,本发明的有酶活的RNA分子,可以有与一个或者多个靶基因的RNA区域互补的特异的底物结合位点。本发明的核酶可以在底物结 合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。核酸的修饰本发明提供了产生本发明的核酸的变异体的方法,所述的本发明 核酸例如那些编码本发明的酰胺酶或者本发明的抗体的核酸。这些方 法可以被重复或者以各种组合方式来应用,以产生与模板核酸编码的 酰胺酶相比具有改变的或不同的活性,或者改变的或不同的稳定性的 酰胺酶。这些方法也可以被重复或者以各种组合方式来应用,以例如 使基因/信息表达、信息翻译或者信息稳定性产生变化。另一方面,细 胞的遗传学组成可以被改变,通过例如在体外进行同源基因的修饰, 然后重新插入到细胞。本发明的核酸可以用任何方法进行变化。例如,无定向或随机方 法、或者非随机、或者"定向进化"的方法,参见如,美国专利号 6,361,974。基因的随机突变方法在本领域是已知的,参见如,美国专 利号5,830,696。例如,可以应用突变剂来对基因进行随机突变。突变 剂包括,如,紫外线或者Y辐射,或者化学诱变剂,如,丝裂霉素, 亚硝酸,光活化的补骨脂内酯,它们单独使用或者组合使用来诱导DNA 的断裂,其可以通过重组被修复。另外的化学诱变剂包括,如,亚硫 酸氢钠,亚硝酸,羟胺,肼或者甲酸。其它的诱变剂是核苷酸前体的 类似物,如,亚硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶。这些试 剂可以加入到PCR反应中替换核苷酸前体,从而突变该序列。也可以 应用嵌入试剂如普罗黄素,吖啶黄,奎纳克林和类似物。可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如, Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471;或者组合式多重 盒式诱变,参见如,Crameri (1995) Biotechinques 18:194-196。可选择 地,核酸,如基因,可以在随机片段化后重新装配,参见,如,美国 专利号6,291,242; 6,287,862; 6,287,861; 5,955,358; 5,830,721; 5,824,514, 5,811,238; 5,605,793.。在可选择的方面,修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因重装配、基因位点饱和诱变(GSSM)、合成连接重装 酉己(SLR)、重纟且、递归序歹!j重纟且(recursive sequence recombination)、 硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口二重诱变(gapped duplex mutagenesis)、点错配修复i秀变(point mismatch repair mutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失 诱变、限制选择诱变(restriction-selection mutagenesis)、限制纯化诱 变(restriction-purification mutagenesis)、人工基因合成、整体i秀变、 嵌合核酸多聚体生成、和/或者这些方法和其它方法的组合产生。以下的出版物描述了各种递归重组程序和/或可以整入到本发明的 方法中的方法Stemmer (1999) "Molecular breeding of viruses for targeting and other clinical properties "Tumor Targeting 4:1-4; Ness( 1999) Nature Biotechnology 17:893-896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull(1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri ( 1997) "Molecular evolution of an arsenate detoxification pathway by DNA shuffling" Nature Biotechnology 15: 436-438; Zhang (1997)"Directed-evolution of an effective fUcosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten等(1997) "Applications of DNA Shuffling to Pharmaceuticals and Vaccines " Current Opinion in Biotechnology 8:724-733 ; Crameri等(1996 ) " Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Gates等(1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer'" Journal of Molecular Biology 255:373-386; Stemmer ( 1996) "Sexual PCR andAssembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York. 447-457页;Crameri and Stemmer ( 1995)"Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmer 等(1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides " Gene, 164:49-53; Stemmer (1995 )"The Evolution of Molecular Computation" Science 270:1510; Stemmer(1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370: 389-391; Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution" Proc, Natl. Acad. Sci. USA 91: 10747-10751 。产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997)"Approaches to DNA mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale等(1996 ) " Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith( 1985)" In vitro mutagenesis "Am. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter( 1986)"Site誦directed mutagenesis ^Biochem. J. 237: 1-7; Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis "在Nucleic Acids & Molecular Biology( Eckstein, R禾口 Lilley, D. M. J. eds., Springer Verlag, Berlin));使用含有尿嘧啶的模板的诱变(Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82: 488-492; Kunkel等.(1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection "Methods in Enzymol. 154, 367-382;和Bass等.(1988)" Mutant Trp repressors with new DNA-binding specificities " Science 242: 240-245);寡核苷酸诱导的定点诱变(Methods in Enzymol. 100: 468-500(1983); Methods in Enzymol. 154: 329-350 (1987); Zoller & Smith(1982)"Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations inany DNA fragment" Nucleic Acids Res. 10: 6487-6500; Zoller & Smith(1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500和Zoller & Smith(1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template " Methods in Enzymol. 154: 329-350);硫代磷酸酯修饰的DNA诱变(Taylor等.(1985) "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764 ; Taylor 等 (1985 ) " The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA " Nucl. Acids Res. 13:8765-8787(1985); Nakamaye (1986) " Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sayers 等 (1988 ) " Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Asids Res. 16:791-802禾口 Sayers等(1988 )" Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814);使用缺口双倍DNA的诱变(Kramer等.(1984 ) "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456 ; Kramer & Fritz ( 1987 ) Methods in Enzymol."Oligonucleotide-directed construction of mutations via gapped duplex DNA" 154: 350-367; Kramer等(1988) "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16:7207禾口 Fritz等(1988)"Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999)。可以用于实践本发明的另外的方案包括点错配修复(Kramer(1984) "Point Mismatch Repair" Cell 38: 879-887),应用修复缺陷型宿主株的诱变(Carter等(1985) "Improved oligonucleotide site-directed mutagenesis using Ml 3 vectors "Nucl. Acids Res. 13: 4431-4443禾口 Carter(1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods inEnzymol. 154: 382-403),缺失诱变(Eghtedarzadeh(1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14:5115),限帝i卜选择和限制-纯化(Wells等(1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317: 415-423),通过全基因合成的诱变(Nambiar等(1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301; Sakamar禾卩Khorana(1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)"Nucl. Acids Res. 14: 6361-6372; Wells等(1985) "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites " Gene 34:315-323 和 Grundstrom等 (1985 )"Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316), 双链断裂修复(Mandecki(1986 ) , Arnold (1993 ) " Protein engineering for unusual environments " Current Opinion in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis" Proc. Natl. Acad. Sci. USA, 83: 7177-7181 )。很 多以上的方法的另外的细节在Methods in Enzymology的54巻中有说 明,其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。在例如下列的文件中描述了可以用于实践本发明的方案,如 Stemmer的美国专利号5,605,793 (1997.2.25), "Methods for In Vitro Recombination"; Stemmer等的美国专利号5,811,238 (1998. 9. 22)"Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Stemmer等的美国专禾(J号 5,830,721 (1998.11.3), "DNA Mutagenesis by Random Fragmentation and Reassembly"; Stemmer等的美国专利号5,834,252 (1998.11.10),"End-Complementary Polymerase Reaction "; Minshull等的美国专利号5,837,458 (1998. 11. 17) "Methods and Compositions for Cellular and Metabolic Engineering " ; WO 95/22625 , Stemmer禾口 Crameri , "Mutagenesis by Random Fragmentation and Reassembly " ; WO 96/33207, Stemmer禾卩Lipschutz, "End Complementary Polymerase Chain Reaction"; WO 97/20078, Ste醒er和Crameri的"Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; WO 97/35966, Minshull和Stemmer, "Methods and Compositions for Cellular and Metabolic Engineerin"; WO 99/41402, P腿onen等,"Targeting of Genetic Vaccine Vectors"; WO 99/41383, Punnonen等,"Antigen Library Immunization"; WO 99/41369, Punnonen 等,"Genetic Vaccine Vector Engineering"; WO 99/41368, Punnonen等,752008 , Stemmer 禾卩 Crameri , " DNA Mutagenesis by Random Fragmentation and Reassembly" ; EP 0932670, Stemmer, "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; WO 99/23107, Stemmer等,"Modification of Virus Tropism and Host Range by Viral Genome Shuffling"; WO 99/21979, Apt等,"Human Papillomavirus Vectors "; WO 98/31837 , del Cardayre等,"Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; WO 98/27230 , Patten和 Stemmer , " Methods and Compositions for Polypeptide Engineering"; WO 98/27230, Stemmer等,"Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection"; WO 00/00632, "Methods for Generating Highly Diverse Libraries"; WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences"; WO 98/42832, Arnold等,"Polynucleotide Sequences Using Random or Defined Primers "; WO 99/29902, Arnold等,"Method for Creating Polynucleotide and Polypeptide Sequences"; WO 98/41653, Vind, "An in Vitro Method for Construction of a DNA Library"; WO 98/41622, Borchert等, "Method for Constructing a Library Using DNA Shuffling";以及WO 98/42727, Pati禾卩Zarling, "Sequence Alterations using HomologousRecombination "。在例如下列的文件中描述了可以用于实践本发明的方案(提供了 关于产生不同多样性的方法的细节),如美国专利申请系列号(USSN) 09/407,800, Patten等的"SHUFFLING OF CODON ALTERED GENES", 于1999年9月28日归档;del Cardayre等的"EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION ", 美国专利号6,379,964 ; Crameri等的" OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION",美国专利号6,319,714; 6,368,861; 6,376,246; 6,423,542; 6,426,224和PCT/US00/01203; Welch等的"USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING",美国专利号6,436,675; Selifonov等的"METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS", 2000年1月18日归档,(PCT/US00/01202) 和,如Selifonov等的"METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS", 2000年7月18日归档,(美国系列 号09/618,579); Sdifonov和Ste讓er的"METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS",2000年1月18日归档(PCT/US00/01138),和Affholter 的"SINGLE-STRANDED NUCLEIC ACID TEMPLATE- MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION", 2000年9月6日归档(美国系列号09/656,549),和美国专利号 6,177,263; 6,153,410。非随机的或者"定向进化"的方法包括例如,饱和诱变(GSSM)、 合成的连接重装配(SLR),或者它们的组合,它们被用来修饰本发明 的核酸,以产生具有新的或者改变的性质的酰胺酶(如,在强酸性或 者强碱性条件、高温等条件下的活性)。由改变了的核酸编码的多肽可 以在测定蛋白水解或者其它活性之前对活性进行筛选。可以应用任何 测试形式或者方案,如,用毛细管阵列平台。参见,如,美国专利号6,361,974; 6,280,926; 5,939,250。
娜赦,或者osw
一方面,应用含有简并的N,N,G/T序列的密码子引物将点突变引 入到多聚核苷酸,如,本发明的酰胺酶或者抗体,以便产生一套子代 多肽,其中,在每个氨基酸位置都可以出现完整范围的单个氨基酸替 换,例如,替换的位置可以在将要被改变的酶活性位点或者配基结合 位点内的氨基酸残基。这些寡聚核苷酸可以包括邻近的第一同源序列、 简并的N,N,G/T序列和可选择的第二同源序列。由这样的寡聚核苷酸 的应用获得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点 的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并包括了所有 20个氨基酸的密码子。 一方面, 一个这样的简并寡聚核苷酸(例如, 包括一个简并的N,N,G/T盒)被应用,以使亲代多聚核苷酸模板中各 个原先的密码子发生完整范围的密码子替换。另一方面,应用至少两 个简并序列盒——或者是在同一个寡聚核苷酸中或者不是,以使亲代 多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密码子替 代。例如,在一个寡聚核苷酸中可以含有多于一个的N,N,G/T序列, 这样,在多于一个的位点导入氨基酸突变。这样的多个N,N,G/T序列 可以是直接邻近的,或者被一个或者多个另外的核苷酸序列隔开。另 一方面,可用于引入增加和缺失的寡聚核苷酸可以单独应用或者与含 有N,N,G/T序列的密码子组合应用,以引入氨基酸增加、缺失和/或取 代的任何组合或者排列。
一方面,应用含有邻接的N,N,G/T三联体,即简并的(N,N,G/T) n序列的寡聚核苷酸,可以在两个或者多个邻近的氨基酸位置同时进行 诱变。另一方面,可以应用简并度比N,N,G/T序列小的简并盒。例如, 在一些例子中,(如,在一个寡聚核苷酸中)应用包括仅仅一个N的简 并三联体序列是理想的,其中所述的N可以是在三联体的第一,第二 或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的 任何其它的碱基。作为选择,在一些例子中,(如,在一个寡聚核苷酸 中)使用简并的N,N,N三联体序列是理想的。
一方面,应用简并的三联体(如N,N,G/T三联体),可以系统地和容易地在多肽的所有氨基酸位置中的每一个位置获得完整范围的可能 的天然氨基酸(对应于所有20个氨基酸)(在可供选择的方面,所述 方法也包括在每一个氨基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如,对于100个氨基酸的多肽,可以产生2000个 不同的种类(g卩,每个位置可能的20种氨基酸xi00个氨基酸位置)。 通过应用含有简并N,N,G/T三联体的一段寡聚核苷酸或者一套寡聚核 苷酸,32个不同的序列可以编码所有20种可能的天然氨基酸。因此, 在使用至少一种这样的寡聚核苷酸进行亲本多聚核苷酸序列饱和诱变 的反应容器中,产生了 32种不同的子代寡聚核苷酸,它们编码20种 不同的多肽。相反地,在定点突变中,应用非简并的寡聚核苷酸导致 在每个反应容器中仅仅有一种子代多肽产物。非简并的寡聚核苷酸可 以选择性地与公开的简并引物组合使用;例如,在工作多肽中,可以 应用非简并的寡聚核苷酸来产生特异的点突变。这就提供了一种手段 来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引 起终止密码子产生和多肽片段相应的表达终止的点突变。一方面,每一个饱和诱变反应容器中含有编码至少20种子代多肽 (如,酰胺酶)分子的多聚核苷酸,因此所有的20种天然氨基酸都会 出现在对应于亲本多聚核苷酸中的被诱变的密码子位置上的特定的氨 基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱 和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使 用例如表达载体克隆至合适的宿主,如E.coli宿主),然后进行表达的 筛选。当通过筛选确定显示出有利的性质变化(例如与亲本多肽比较, 在碱性、酸性条件下蛋白水解活性增强)的单个子代多肽时,就可以 用测序来确定其中所含有的相应的有利的氨基酸取代。一方面,如在此所公开的,应用饱和诱变对亲本多肽的各个和所 有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一 个的氨基酸位置。可以产生含有所有或者部分这些有利的氨基酸替代 的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基 酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现 的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化, 和两个有利变化中的每一个)和3个位置。这样,就有3x3x3或者种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个 位置的每一个有2个)和在任何位置中都没有变化的l种。
另一方面,位点饱和诱变可以和其它的随机或者非随机方法一起 应用来改变序列,如,合成的连接重装配(见下),重排,嵌合,重组 以及其它的诱变程序和诱变剂。本发明提供了以反复的方式来应用任 何的诱变程序,包括饱和诱变。
合成離體就飾J
本发明提供了一种非随机的基因改—,统,命名为"合成的连接 重装配"或者简称为"SLR",这是一种"定向进化方法",可以产生具 有新的或者改变的性质的多肽,如,本发明的酰胺酶或抗体。SLR是 一种非随机地连接寡聚核苷酸片段的方法。这一方法与随机的寡聚核 苷酸重排不同,因为核酸构建模块(building blocks)并不进行重排、 连连接、或者随机嵌合,而是进行非随机的装配。参见,如,美国专 利申请系列号(USSN)09/332,835,名称为"Synthetic Ligation Ressembly in Directed Evolution",在1999年6月14日归档("USSN 09/332,835")。 一方面,SLR包括以下的步骤(a)提供模板多聚核苷酸,其中该模 板多聚核苷酸包括编码同源基因的序列;(b)提供多个构建模块多聚 核苷酸,其中所述的构建模块多聚核苷酸被设计为与模板多聚核苷酸 在预定的序列处横跨装配(cross-overreassemble),而且所述的构建模 块多聚核苷酸包括所述同源基因的变异体序列以及在变异序列两侧与 模板多聚核苷酸同源的序列;(c)将模板多聚核苷酸与构建模块多聚 核苷酸结合,以便抅建模块多聚核苷酸与模板多聚核苷酸横跨装配, 产生包含同源基因序列变异体的多聚核苷酸。
SLR并不依赖于在待重新组装的多聚核苷酸之间存在高水平的同 源性。这样,这一方法可以用于非随机地产生包括超过10100个不同 嵌合体的子代分子的文库。SLR可以用于产生包括超过101000个不同 子代嵌合体的文库。这样,本发明包括用于产生一套最终的具有按设 计选择的整个装配顺序的嵌合核酸分子的非随机方法。这一方法包括 按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有 可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类 型的顺序装配被认为是"适用的",如果它们使得构建模块以预先制定 的顺序联接的话。因此,核酸构建模块被偶联的总体装配顺序是通过 可连接末端的设计来特异化的。如果不止一个装配步骤将要被应用, 那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序
来特异化。 一方面,退火的构建模块用酶处理,如用连接酶(如,T4 DNA 连接酶)处理,以完成构建模块的共价键连接。
一方面,寡聚核苷酸构建模块的设计通过分析一套祖先核酸序列 模板来得到,该模板作为产生子代一套最终的嵌合多聚核苷酸的基础。 这些亲本寡聚核苷酸模板作为序列信息源,辅助待诱变例如待嵌合化
或者重排的核酸构建模块的设计。在这一方法的一个方面,为了选择 一个或者多个分界点,对多个亲本核酸模板的序列进行联配。所述分 界点可以位于同源的区域,并且可以包括一个或者多个核苷酸。这些 分界点优选由至少两个祖先模板中共有。所述分界点可以因此用于描 绘将要产生的寡聚核苷酸构建模块的边界,以便重新排列亲本寡聚核 苷酸。在祖先分子中确定和选择的分界点用作装配最终的嵌合子代分 子的潜在的嵌合位点。分界点可以是至少两个亲本多聚核苷酸序列共 同的同源区域(包括至少一个同源核苷酸碱基)。可选择地,分界点 可以是由至少半数的亲本多聚核苷酸序列共同拥有的同源区域,或者, 是由至少三分之二的亲本多聚核苷酸序列共同拥有的同源区域。更加 优选地,可应用的分界点是至少四分之三的亲本多聚核苷酸序列共同 拥有的同源区域,或者,是几乎所有的亲本多聚核苷酸序列共同拥有 的同源区域。 一方面,分界点是由所有的亲本多聚核苷酸序列共同拥 有的同源区域。
一方面,为了产生一个彻底的子代嵌合多聚核苷酸文库,连接重 装配过程被尽可能充分地实施。换句话说,核酸构建模块的所有可能 顺序的组合存在于一套最终的嵌合核酸分子中。同时,另一方面,每 个组合中的装配顺序(即,各个构建模块的装配顺序,按各个最终的 嵌合核酸序列的5'到3'的方向)是按照以上所述设计的(或者是非随 机的)。由于本发明的非随机性质,不需要的副产物的可能性大大降低。
另一方面,系统地实施连接重装配的方法。例如,实施本方法来 产生系统区分化的子代分子文库,划分开的文库可以系统地进行筛选, 例如逐个的筛选。换句话说,通过选择性的和审慎的应用特定的核酸 构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应, 本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出 各自特定的一系列子代产物。这就允许进行系统的检査和筛选步骤。 因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行 系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌合 化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,所以 这些方法可以产生包括很大数目的子代分子的文库(或者一套分子)。 由于该快速连接重装配发明的非随机性,产生的子代分子优选地包括 具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。饱和 诱变和优化的定向进化方法也可以用于产生不同的子代分子种类。可 以理解,本发明在分界点的选择、核酸构建模块的大小和数目以及偶 联的大小和设计方面提供了选择和控制的自由度。更进一步理解的是, 分子间同源性的要求对于本发明的操作性被大大降低了。实际上,甚 至可以在有较少分子间同源性或者没有分子间同源性的区域选择区别 点。例如,由于密码子的摆动性,BP,密码子的简并,核苷酸的替代 可以被引入到核酸构建模块中而并不改变在相应的祖先模板中起初编 码的氨基酸。可选择地, 一个密码子可以被改变以至于起初氨基酸的 编码被改变。本发明提供了这样的替换,它们能够被引入到核酸构建 模块中,由此增加分子间同源的分界点的发生率,这样就允许在构建 模块之间实现更多数目的偶联,这又使得更多数目的子代嵌合分子产 生。
另一个方面,产生构建模块的步骤的合成性质允许设计和引入核 苷酸(如, 一个或者多个核苷酸,其可以是,例如,密码子或者内含 子或者调控序列),所述核苷酸后来可以选择性地在体外过程(例如, 通过诱变)或者在体内过程(如,通过利用宿主生物体的基因剪接能 力)中去除。可以理解,在很多情况中,除了产生适用的分界点的潜 在好处以外,由于很多其它的原因也需要引入这些核苷酸。一方面,核酸构建模块被用于引入一个内含子。因此,功能性的 内含子引入到按照在此说明的方法而产生的人造基因中。人工引入的 内含子在宿主细胞的基因剪接中具有功能性,在很大程度上是与天然 发生的内含子在基因剪接上所具有的功能性相同。
汰众游定厨遂众系统
发明提供了一种非随机的基因变化系统,命名为"优化的定向进 化系统",其可以用来生产具有新的或者改变的性质的多肽,如本发明
的酰胺酶或者抗体。优化的定向进化目的是应用还原性重配(reductive reassortment)、重组和选择的重复循环,通过重组实现核酸的定向分子 进化。优化的定向进化允许产生大量的进化的嵌合序列,其中产生的 群体显著地富集了具有预定数目遗传交换事件的序列。
遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变 异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个 亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许 计算寡聚核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了 所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传 交换事件的嵌合突变体的更多控制。
此外,这一方法与其他系统相比,提供了一种用于探究大数量的 可能蛋白变异体的方便手段。以前,例如,如果在反应中产生了 1013 个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。 此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得 到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法,嵌 合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。 因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于 进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事 件。因为得到的子代群体可以(在统计学上)偏斜到具有预定数目的 遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算 出来自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时, 这时便提供了更加可控制的变量。
产生嵌合子代多聚核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸。每一个寡聚核苷酸优选地包括 重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序 装配的寡聚核苷酸片段的新的变异体。也可以发现另外的一些信息,
如,在USSN 09/332,835;美国专利号6,361,974中。对应于每一个亲 本变异体产生的寡聚核苷酸数目与在最终产生的嵌合分子中得到的遗 传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温 下有更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来 进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分 可以产生一套50个寡聚核苷酸序列。相应的,在连接装配过程中,在 每一个嵌合序列中有可能有超过50个交换事件。每一个产生的嵌合多 聚核苷酸都以交替的顺序含有来自各个亲本变异体的寡聚核苷酸的可 能性很低。如果每一个寡聚核苷酸片段以同样的摩尔量存在于连接反 应中,有可能在一些位置中来自同一亲本多聚核苷酸的寡聚核苷酸将 相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连 接步骤中,来自每一个亲本的每一个寡聚核苷酸的浓度保持不变,那 么将会有三分之一的机会(假定3个亲本)来自同一个亲本变异体的 寡聚核苷酸连接于嵌合序列内而不产生遗传交换。
相应的,可以确定概率密度函数(PDF),预测在一个连接反应的 每一步中可能发生的遗传交换事件的总数,其中给定了亲本变异体的 套数、对应于每种变体的寡聚核苷酸数目、以及在连接反应中的每个 步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在 下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而 且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件 的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然 后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种 亲本寡聚核苷酸的起始量,从而得到以遗传交换事件的预先确定的数 目为中心的概率密度函数。这些方法是应用还原性重配、重组和选择 的重复循环,通过重组实现编码多肽的核酸的定向分子进化。该系统 允许产生大量的进化的嵌合序列,其中产生的群体显著地富集了具有 预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个 点,在这里,从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形成单个序列 的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序 列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对 选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这一方法与其他系统相比,提供了一种用于探究大数量的 可能蛋白变异体的方便手段。通过应用在这里描述的方法,嵌合分子 的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此, 尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一 步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。 因为得到的子代群体可以(在统计学上)偏斜到具有预定数目的遗传 交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来 自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,这时 便提供了更加可控制的变量。
一方面,该方法通过产生对应于每一个亲本序列的片段或者部分 的寡聚核苷酸,产生嵌合子代多聚核苷酸序列。每一个寡聚核苷酸优 选地包括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以
正确顺序装配的寡聚核苷酸片段的新的变异体。也可参见USSN 09/332,835。
对应于每一个亲本变异体产生的寡聚核苷酸数目与在最终产生的 嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为 了发现具有如在高温下有更高活性的嵌合变异体,可以提供三个亲本 核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲 本变异体的每一部分可以产生一套50个的寡聚核苷酸序列。相应的, 在连接装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。 每一个产生的嵌合多聚核苷酸都以交替的顺序含有来自各个亲本变异 体的寡聚核苷酸的可能性很低。如果每一种寡聚核苷酸片段以同样的 摩尔量存在于连接反应中,有可能在一些位置中来自同一亲本多聚核 苷酸的寡聚核苷酸将相互一个个连接,而不导致遗传交换事件。如果 在这一例子的任何连接步骤中,来自每一个亲本的每一种寡聚核苷酸 的浓度保持不变,那么将会有三分之一的机会(假定3个亲本)来自 同一个亲本变异体的寡聚核苷酸连接于嵌合序列内而不产生遗传交换。
相应的,可以确定概率密度函数(PDF),预测在一个连接反应的 每一步中可能发生的遗传交换事件的总数,其中给定了亲本变异体的 套数、对应于每种变体的寡聚核苷酸数目、以及在连接反应中的每个 步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在 下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而 且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件 的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然 后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种 亲本寡聚核苷酸的起始量,从而得到以遗传交换事件的预先确定的数 目为中心的概率密度函数。
嫁定遗/统鮮,
本发明包括系统和软件,它们以所需的遗传交换的概率密度函数
(PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为 输入量。该程序输出"片段PDF",它可以用于确定用于获得重新装配 的基因和那些基因的估计的遗传交换PDF的具体方法。在此说明的过 程优选地在MATLABa中进行(The Mathworks, Natick, Massachusetts), MATLAB&是一种用于技术计算的程序语言和开发环境。
靴継
在实践本发明时,这些过程可以迭代反复。例如,鉴定出改变的 或者新的酰胺酶表型的核酸,再分离,再修饰,再测试活性。这一过 程可以重复直到得到所需的表型。例如,完整的生物化学合成代谢的 或者分解代谢的途径可以在细胞中设计,包括,如,酰胺水解活性, 7-氨基头孢烷酸(7-ACA)的生成,半合成的头孢菌素抗生素例如头孢 噻吩、头孢噻啶和头孢呋辛的合成。
类似地,如果确定了特定的寡聚核苷酸对于所有所需的性质(如, 一种新的酰胺酶表型)没有影响,那么就可以合成包括这段序列在内 的更大的亲本寡聚核苷酸,从而将作为变量的这段序列去除。由于将 这段序列合并到更大的序列中,可以避免任何遗传交换事件,所以在子代多聚核苷酸中,这一序列不再有任何变异。确定哪些寡聚核苷酸 与所需的性质最有关系,以及哪些与所需的性质无关的重复实践可以 更有效地探寻所有可能的具有特定性质或者活性的蛋白变异体。
#膽谬
分子的体内重排在本发明的提供本发明的多肽如抗体、酰胺酶等 的变异体的方法中使用。体内重排利用细胞的天然特性进行多聚体重 组。体内重组提供了实现分子多样性的主要的天然途径,而遗传重组
仍然是一种相对复杂的过程,其涉及1)同源性识别;2)链切割,链 侵入,和导致产生重组交叉的代谢步骤;和最后3)交叉消除至分离的 重组分子。交叉的形成需要同源序列的识别。
一方面,本发明提供了由至少第一多聚核苷酸(如,本发明的酰 胺酶)和第二多聚核苷酸(如,酶,如本发明的酰胺酶或者任何其它 的酰胺酶,或者,标记或者抗原决定部位)产生杂合的多聚核苷酸的 方法。本发明可以通过引入至少第一多聚核苷酸和第二多聚核苷酸到 适合的宿主细胞中产生杂合的多聚核苷酸,第一多聚核苷酸和第二多 聚核苷酸至少一个区域的部分序列有同源性。部分序列同源的区域促 进了导致序列重组产生杂合多聚核苷酸的过程。正如在此所用,术语 "杂合多聚核苷酸"是由本发明的方法产生的任何核苷酸序列,并且 含有来自至少两个起初的多聚核苷酸序列的序列。这样的杂合多聚核 苷酸可以源于分子间重组事件,分子间重组事件促进了 DNA分子间的 序列整合。此外,这样的杂合多聚核苷酸可以源自分子内还原性重配 过程,分子内还原性重配过程利用重复序列来改变DNA分子中的核苷 酸序列。
沐力就
本发明提供了应用本发明核酸的体内重配。这些方法包括"分子 间"加工过程,可以统称为"重组",在细菌中一般视作"依赖于RecA" 的现象。本发明的方法可以利用宿主细胞的重组过程来重组和重配序 列,或者利用细胞介导还原过程的能力,通过缺失来降低准重复序列 的复杂性。"还原性重配"的过程可以通过"分子内"的RecA依赖性的过程发生。
在本发明的另一个方面,新型的多聚核苷酸可以通过还原性重配 过程产生。本方法包括产生含有连续序列(最初的编码序列)的构建 物,将它们插入到合适的载体中,随后将它们引入到合适的宿主细胞 中。各个分子本体的重配通过具有同源性区域的构建物中的连续序列 之间,或准重复单元之间的组合过程发生。重配过程重组和/或降低了 重复序列的复杂性和范围,并且导致产生新的蛋白种类。可以应用不
同的处理来提高重配率。这些可以包括用紫外线或者DNA损伤化学剂
处理,和/或使用表现出高水平"遗传不稳定性"的宿主细胞系。因此, 重配过程可以包括同源重组或者准重复序列的天然性质来弓1导它们自 身的进化。
重复或者"准重复(quasi-repeated)"序列在基因的不稳定性中起 作用。在本发明中,"准重复"是并不限于它们起初的单元结构的重复。 准重复单元可以在构建物中以序列的排列出现;相似序列的连续单元。 一旦连接,在连续序列之间的连接处变得本质上无形,并且得到的构 建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间 进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一 个实际上没有限制的模板内容,在模板上可以发生滑移事件。因此, 含有准重复的构建物有效地提供了足够的分子弹性,缺失(和潜在的 插入)事件实际上可以在准重复单元内的任何地方发生。
当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然, 细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。 相反地,当例如,所述单元以头对头存在,而不是头对尾,相邻单元 的头尾倒置,这样缺失的形成将有利于不连续单元的失去。因此,本 发明的方法优选的是序列是处于相同的方向。准重复序列的随机定向 将会导致重配效率的损失,而序列的一致定向将会提^^最高的效率。 然而,虽然具有较少的相同定向的连续序列会降低效率,但是仍然可 以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效 率的准重复序列制备构建物。
应用各种方法中的任何一种,可以将序列装配成头对尾的定向, 包括以下a) 可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括 poly-A头和poly-T尾的引物将提供定向。这通过由RNA制备引物的 头几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。
b) 可以应用包括唯一的限制酶切割位点的引物。将需要多重位点、一 组唯一的序列、和重复的合成和连接步骤。
c) 引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具 有尾巴的分子。
重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的 确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表 达。具有降低的RI的克隆载体的回收可以被完成,通过
1) 应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。
2) 通过物理程序对縮短的载体进行物理回收。在这一情况下,克隆载 体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的 琼脂糖凝胶或者柱子上利用标准程序进行大小分离。
3) 插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。
4) 应用表达载体以及适当的选择,使用定向选择技术。
相关的生物体的编码序列(例如,基因)可以表现出高度的同源 性,并且编码相当多样化的蛋白产物。这些类型的序列可以在本发明 中用作准重复序列。以下的实施例说明了几乎相同的原始编码序列(准 重复)的重配,然而,这一过程并不限于这种几乎相同的重复。
以下的例子表明了本发明的典型方法。描述了来源于三(3)种独 特物种的编码核酸序列(准重复)。每一个序列编码的每一种蛋白都具 有不同的一套性质。这些序列中的每一个在序列的独特位置处的单个 或者几个碱基对上有差别。准重复序列分别地或者共同地被扩增,并 且被连接到随机装配物中,这样所有可能的排列和组合都可以在连接 分子的群体中获得。准重复单元的数目可以通过装配条件控制。准重 复单元在构建物中的平均数目被定义为重复指数(RI)。
一旦构建物形成,可以按照已出版的实验方案通过琼脂糖凝胶根 据大小进行分离,也可以不分离,将构建物插入到一个克隆载体中, 并转染至适当的宿主细胞。然后细胞繁殖并且实现"还原性重配"。 还原性重配过程的速率可以通过引入DNA损伤来进行刺激,如果需要的话。RI的降低是通过一种"分子内"的机制在重复序列间形成缺失 来介导,还是通过"分子间"的机制由重组类似的事件来介导是不重 要的。最终的结果是分子被重配,得到所有可能的组合。
可选择地,本方法包括一个额外的步骤,即对重排的文库成员进 行筛选,以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病 毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作 用,或者催化一个特定的反应(如,酶的催化结构域)的能力的个别 的重排文库成员。
从这样的文库确定出的多肽可以用于治疗,诊断,研究和相关目 的(如,催化剂,用于增加水溶液的同渗容摩的溶质,等等),和/或 可以用于进行一轮或者多轮附加的重排和/或选择循环。
另一方面,可以预见,在重组或重配之前,或者在重组或重配的 过程中,通过本发明的方法产生的多聚核苷酸可以用试剂处理或进行 加工,这些处理或加工促进突变引入到原始的多聚核苷酸中。引入这 样的突变将会增加得到的杂合多聚核苷酸及其编码的多肽的多样性。
促进诱变的试剂和过程可以包括,但不限于(+) -CC-1065,或者如 (+ ) -CC-1065- (N3-腺嘌呤的合成的类似物(参见S皿和Hurley, (1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4,-氟-4-氨 基联苯加合物(见,例如,van de Poll等(1992)),或者能够抑制DNA 合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(见,van de Poll 等(1992) , pp.751-758);三价铬,三价铬的盐,可以抑制DNA复制 的多环芳香烃(PAH) DNA加合物,如7-溴甲基-苯[a]蒽("BMA"), 三(2,3-二溴丙基)磷酸盐("Tris-BP"), 1,2-二溴-3-氯丙烷("DBCP"), 2-溴丙烯醛(2BA),苯并[a]芘-7,8-二氢二醇-9-10-环氧化物("BPDE"), 铀(II)卣素盐,N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉("N-羟基-IQ"), 和N-羟基-2-氨基-l-甲基-6-苯基咪唑[4,5-f]-吡啶("ON-羟基-PhIP")。 用于减慢或者停止PCR扩增的特别优选的方法包括紫外线(+ ) -CC-1065和(+) -CC-1065- (N3-腺嘌呤)。特别包含的方法是DNA加 合物或者来自多聚核苷酸或者多聚核苷酸库的含有DNA加合物的多 聚核苷酸,在进一步的处理前,其可以通过包括加热含有所述多聚核 苷酸的溶液的过程进行释放或者去除。序列变异体的产生。
本发明也提供了制备本发明的核酸(如,酰胺酶)序列的序列变 异体的另外的方法。本发明也提供了应用本发明的核酸和多肽分离酰 胺酶的另外的方法。
一方面,本发明提供了本发明的酰胺酶编码序列
(如,基因,cDNA或者信息)的变异体,其可以通过任何方法被改变,
包括,例如,随机的方法,或者非随机的方法,或者"定向进化"的 方法,如上所述。
被分离的突变体可以是天然发生的。变异体也可以在体外产生。 变异体也可以应用基因工程技术来产生,如定点诱变、随机的化学诱
变、核酸外切酶ni缺失方法和标准的克隆技术。可选择地,可以应用
化学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生
物。本领域技术人员也熟悉制备变异体的其它方法。这些方法包括这 样的程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编 码具有某些特征的多肽的核酸,所述的特征使这些多肽在企业或者实 验室应用中具有更高的价值。在这样的程序中,大量的变异体序列被 获得和表征,这些变异体序列与从天然分离物中得到的序列相比,有 一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然 分离得到的核酸序列编码的多肽的氨基酸变化。
例如,变异体可以通过易错PCR产生。在易错PCR中,PCR在 DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产 物中得到较高的点突变率。易错PCR在例如,在Leung, D.W.,等, Technique, 1:11 15, 1989)和Caldwell, R. C.和Joyce G. F" PCR Methods Applic., 2: 28-33, 1992中描述。简要地说,在这一程序中,待突变的核 酸与PCR引物、反应缓冲液、MgCl2、 MnCl2、 Taq聚合酶以及适合浓 度的dNTPs混合,在全长的PCR产物中得到高的点突变率。例如,反 应可以使用20fmol待诱变的核酸进行,每种PCR引物30pmo1,反应 缓冲液包括50mMKCl, lOmMTrisHCl (pH8.3)和0.01%明胶,7mM 的MgCl2, 0.5mM MnCl2, 5 units的Taq聚合酶,0.2mM dGTP, 0.2raM dATP, lmMdCTP,和lmMdTTP。 PCR可以进行30个循环,每个循 环为94°C 1分钟;45°C 1分钟;和72°C 1分钟。然而,这些参数可以适当地变化。诱变的核酸克隆到一个适当的载体,并评价由诱变核酸 编码的多肽的活性。
变异体也可以用寡聚核苷酸诱导的定向突变产生,在任何感兴趣
的克隆DNA中产生位点特异性的突变。寡聚核苷酸诱变在,例如, Reidhaar-01son (1988) Science 241:53-57中描述。简要地说,在这一 程序中,合成多个具有一个或者多个突变的双链寡聚核苷酸,这些寡 聚核苷酸所含有的突变将要被导入被克隆的DNA中,将这些寡聚核苷 酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆,并评估 它们编码的多肽的活性。
另一个产生变异体的方法是装配PCR。装配PCR涉及由小的DNA 片段的混合物装配出PCR产物。在同一个容器中平行进行很多不同的 PCR反应,其中, 一个反应产物用作另外一个反应的引物。装配PCR 在例如美国专利号5,965,408有说明。
另一个产生变异体的方法是有性PCR诱变。在有性PCR诱变中, 由于基于序列同源性的DNA分子的随机片段化,在不同的但是高度相 关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通 过PCR反应的引物延伸,遗传交换得到固定。有性PCR诱变在,例如, Ste纖er (1994) Proc. Natl. Asad. Sci. USA 91: 10747-10751中描述。 简要地说,在这一程序中,多个待重组的核酸用DNase消化,产生具 有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的 片段,重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR 反应。例如,PCR可以这样进行将纯化的片段重悬于含有0.2mM的 各禾中dNTP, 2.2mMMgCl2, 50mMKCl, 10mM的Tris-HCl, pH9.0, 以及0.1%的Triton X-100的溶液中,其浓度为10-30ng/:l,以100: 1 的比例在反应混合物中加入2.5Uiiits的Taq聚合酶,用以下的条件进 行PCR: 94°C 60秒,94°C 30秒,50國55。C 30秒,72。C 30秒(30-45 次),然后72'C进行5分钟。然而,这些参数可以进行适当的变化。在 一些方面,寡聚核苷酸可以包括在该PCR反应中。在其它的一些方面, DNA聚合酶I的幻enow片段可以用于第一轮PCR反应,而Taq聚合 酶可以用于后续的PCR反应。重组序列经过分离并评估它们编码的多 肽的活性。变异体也可以通过体内诱变产生。在一些方面,感兴趣的序列中 的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌
菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。
这种"突变"菌株具有比野生型亲本更高的随机突变率。在一种这样
的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体 内诱变中应用的突变菌株在,例如,PCT
发明者D·P·维纳, E·沃特斯, K·昌, N·R·巴顿, S·卢, W·格林伯格 申请人:戴弗萨公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1