具有脱卤素酶活性的酶及其使用方法

文档序号：389603阅读：1101来源：国知局

专利名称：具有脱卤素酶活性的酶及其使用方法
技术领域：
本发明总的来说涉及酶、编码这些酶的多核苷酸、这种多核苷酸和多肽的应用，更特别地涉及具有卤烷脱卤素酶活性的酶。
背景技术：
环境污染物由大量和多样的化学物质组成，这些物质中的许多是有毒的、危害环境的，在1979年被美国环保机构指定为重点的污染物。微生物和酶的生物降解作用是清除这些污染物的一种方法。因此，已经计划通过微生物和相关的酶方法来处理商业废物以及生物补救被污染的环境。
不幸地，许多化学污染物抵抗微生物降解，或者当以高浓度和某种组合存在时对潜在的微生物降解剂具有毒性。
卤烷脱卤素酶属于α/β水解酶折叠家族，其中所有的酶具有相似的拓扑结构、反应机制和催化三联体组残基(Krooshof等人，Biochemistry36(31)9571-9580，1997)。酶通过水解作用裂解卤烷和卤羧酸中的碳-卤素键，从而将它们转化为其相应的醇类。此反应对于涉及卤烷的解毒作用是重要的，如氯乙烷、氯甲烷和1，2-二氯乙烷，环保机构认为它们是重点污染物(Rozeboom，H.，Kingma，J.，Janssen，D.，Dijkstra，B.Crystallization of Haloalkane Dehalogenase from Xanthobacterautotrophicus(自养黄色杆菌GJ10中卤烷脱卤素酶的结晶化).J Mol Biol200(3)，611-612(1988)。
卤烷脱卤素酶是由能够完全地在氯化脂肪族化合物上生长的微生物产生的。活性不需要金属或氧水是唯一的底物。
自养黄色杆菌(Xanthobacter autotrophicus)GJ10是利用1，2-二氯乙烷和少数其它卤烷和卤羧酸生长的固氮细菌(Rozeboom等人，J MolBiol 2003611-612，1988；Keuning等人，J Bacteriol163(2)635-639，1985)。它是研究得最好的脱卤素酶，这是因为它的催化反应机制、活性机制和晶体结构是已知的(Schanstra等人，J Biol Chem271(25)14747-14753，1996)。
生物体产生两种不同的脱卤素酶。一个脱卤素酶用于卤化烷类，另一个用于卤化羧酸类。大多数有害卤化化合物是工业产生的，用作清洁剂、杀虫剂和溶剂。自养黄色杆菌的天然底物是1，2-二氯乙烷。此卤烷经常被用在乙烯生产中。
酶是高度选择性的催化剂。它们的特点是能够以传统合成化学中空前灵敏的立体、区域和化学选择性催化反应。而且，酶有非常多方面的能力。它们可以被修改以在有机溶剂中起作用，在极端pH和温度下工作，以及催化结构上与其天然的生理学底物无关的化合物的反应。
酶对大范围的天然和非天然底物起作用，因此实际上使任何有机的前导化合物能够被修饰。而且，与传统的化学催化剂不同，酶是高度对映选择和区域选择的。酶所具有的高度功能基团特异性使人们能够明了产生新活性化合物的合成序列中的每一个反应。酶还能够催化许多与其天然生理学功能无关的不同反应。例如，过氧化物酶催化过氧化氢对苯酚的氧化作用。过氧化物酶也可以催化与其天然酶功能无关的羟基化反应。其它的例子是催化多肽分解的蛋白酶类。在有机溶液中，一些蛋白酶类也可以酰化糖类，此作用与这些酶的天然功能无关。
本发明开发了酶的独特催化特性。尽管在化学转化作用中使用生物催化剂(即纯化酶或粗酶，非活细胞或活细胞)通常需要确定与特定的起始化合物相互作用的特定生物催化剂，但本发明使用了对许多起始化合物中存在的功能基团特异的选择的生物催化剂和反应条件。
每个生物催化剂对一个或数个相关的功能基团特异，并能够与许多含此功能基团的起始化合物相互作用。
生物催化反应从单一的起始化合物产生一群衍生物。这些衍生物可以接受另一轮生物催化反应以产生第二群衍生物化合物。生物催化的衍生作用的每一次重复可以产生原始化合物的数千变异体。
酶在起始化合物的特异位置起作用而不影响分子的其余部分，这一过程采用传统的化学方法是很难达到的。这种高度的生物催化特异性提供了在文库中鉴定单一活性化合物的方法。文库的特征在于用来产生它的生物催化反应系列，即所谓的“生物合成历史记录”。筛选文库的生物学活性和追踪生物合成历史确定了产生活性化合物的特异性反应序列。反应序列是重复的，并确定了合成的化合物的结构。这个鉴定模式与其它合成和筛选方法不同，不需要固定化技术，化合物可以游离在溶液中采用实际上任何类型的筛选试验而被合成和检测。重要的是要注意，酶对功能基团反应的高度特异性可以“追踪”特异性酶反应，特异性酶反应形成生物催化产生的文库。
采用机械自动操作进行许多程序性步骤，该自动操作能够每天完成数千的生物催化反应和筛选试验，并保证高水平的精确性和再现性。其结果是，衍生化合物文库可以在大约数周内产生，而采用当前的化学方法会需要数年。(对分子修饰的进一步教导，包括小分子，见PCT/US94/09174，在此整体加入作为参考文献)。
这里讨论的公开文献仅为本申请归档日期前的公布。在此绝不解释为这些公布承认本发明相对于现有发明没有资格居于这些公布之前。
发明概述本发明提供了一种具有一个如SEQ ID NO.3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45，47中所阐述序列的分离核酸，及其变异体，所述变异体与SEQ ID NO.3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45或47具有至少50％序列同一性并编码具有脱卤素酶活性的多肽。
本发明的一个方面是一种分离核酸，其具有如SEQ ID NO3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45，47(此后被称作“A组核酸序列”)中所阐述的序列，基本上与它们一致的序列和与它们互补的序列。
本发明的另一个方面是一种分离核酸，其包括A组核酸序列，基本上与它们一致的序列和与它们互补的序列中所列序列的至少10个连续碱基。
也在另一个方面，本发明提供了编码多肽的分离核酸及其变异体，其中多肽具有SEQ ID NO.4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48中列出的序列及其变异体，其中变异体编码具有脱卤素酶活性的多肽并与上述序列具有至少50％的序列同一性。
本发明的另一个方面是编码多肽或其功能片段的分离核酸，其中多肽或其功能片段具有SEQ ID NO4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48中所列的序列(此后被称作“B组氨基酸序列”)，以及基本上与它们一致的序列。
本发明的另一个方面是编码多肽的分离核酸，其中多肽具有B组氨基酸序列中所列序列以及基本上与它们一致的序列的至少10个连续氨基酸。
又在另一个方面，本发明提供了纯化的多肽，它具有B组氨基酸序列中所列的序列，以及基本上与它们一致的序列。
本发明的另一个方面是与多肽特异性结合的分离或纯化的抗体，其中多肽具有B组氨基酸序列中所列的序列，以及基本上与它们一致的序列。
本发明的另一个方面是与多肽特异性结合的分离或纯化抗体或其结合片段，其中多肽具有B组氨基酸序列多肽中之一个多肽的至少10个连续氨基酸，以及基本上与它们一致的序列。
本发明的另一个方面是制备多肽的方法，其中多肽具有B组氨基酸序列中所列的序列，以及基本上与它们一致的序列。该方法包括引导编码多肽的核酸进入宿主细胞，其中的核酸可操作地连接到启动子上，并在允许核酸表达的条件下培养宿主细胞。
本发明的另一个方面是制备多肽的方法，其中多肽具有B组氨基酸序列中所列序列，以及基本上与它们一致的序列的至少10个连续的氨基酸。该方法包括引导编码多肽的核酸进入宿主细胞，其中核酸可操作地连接到启动子上，并在允许核酸表达的条件下培养宿主细胞，从而产生多肽。
本发明的另一个方面是产生变异体的方法，所述方法包括获取具有如下序列的核酸A组核酸序列中所列的序列，基本上与它们一致的序列，与A组核酸序列互补的序列，由上述序列的至少30个连续核苷酸组成的片段；并将序列中的一个或多个核苷酸改变为另一个核苷酸；删除序列中的一个或多个核苷酸；或添加一个或多个核苷酸到序列中。
本发明的另一个方面是其上已经存储了以下序列的计算机可读介质A组核酸序列中列出的序列和基本上与它们一致的序列，或B组氨基酸序列中列出的序列和基本上与它们一致的序列。
本发明的另一个方面是包括处理器和数据存储装置的计算机系统，其中所述的数据存储装置上储存了以下序列A组核酸序列中列出的序列和基本上与它们一致的序列，或具有B组氨基酸序列中列出序列和基本上与它们一致序列的多肽。
本发明的另一个方面是比较第一条序列和参考序列的方法，其中所述的第一条序列是核酸，其具有A组核酸序列中列出序列和基本上与它们一致的序列的，或B组氨基酸序列中列出的多肽密码和基本上与它们一致序列的序列。该方法包括通过使用比较序列的计算机程序读取第一条序列和参考序列；并用计算机程序确定第一条序列和参考序列间的差异。
本发明的另一个方面是识别以下序列特征的方法A组核酸序列中列出的序列和基本上与它们一致的序列，或具有B组氨基酸序列中列出序列和基本上与它们一致序列的多肽，包括通过使用识别序列特征的计算机程序读取序列；并用计算机程序鉴定序列特征。
本发明的另一个方面是识别B组氨基酸序列和基本上与其一致序列的片段或变异体的试验，它们保留了B组氨基酸序列和基本上与其一致序列的多肽的酶功能。该试验包括将B组氨基酸序列和基本上与其一致序列的多肽、或多肽片段或变异体在允许多肽片段或变异体起作用的条件下与底物分子接触，并检测底物水平的下降或多肽和底物间反应的特异性反应产物的水平增加，从而鉴定这种序列的片段或变异体。
又在另一个方面，本发明提供了合成甘油的方法。该方法包括，将三氯丙烷或二氯丙醇与多肽在合成甘油的条件下接触，其中多肽与选自B组氨基酸序列和基本上与其一致序列的序列具有至少70％的同源性，并具有脱卤素酶活性。
又在另一个方面，本发明提供了产生旋光卤代乳酸的方法。该方法包括将二卤代丙酸与多肽在产生旋光卤代乳酸的条件下接触，其中多肽与选自B组氨基酸序列和基本上与其一致序列的序列具有至少70％的同源性，并具有脱卤素酶活性。
又在另一个方面，本发明提供了通过接触环境样本与多肽的生物补救方法，其中多肽与选自B组氨基酸序列和基本上与其一致序列的序列具有至少70％的同源性，并具有脱卤素酶活性。
在另一个方面，本发明提供了消除卤化污染物或样本中卤化杂质的方法。该方法包括将样本与多肽接触，其中多肽与选自B组氨基酸序列和基本上与其一致序列的序列具有至少70％的同源性，并具有脱卤素酶活性。
又在另一个方面，本发明提供了通过将二卤代丙烷或单卤代丙醇在二醇合成的条件下与多肽接触合成二醇的方法，其中多肽与选自B组氨基酸序列和基本上与其一致的序列的序列具有至少70％的同源性，并具有脱卤素酶活性。
又在另一个方面，本发明提供了卤素取代的环烃基的脱卤素方法。该方法包括将卤素取代的环烃基在卤素取代的环烃基脱卤素的条件下与多肽接触，其中多肽与选自B组氨基酸序列和基本上与其一致序列的序列具有至少70％的同源性，并具有脱卤素酶活性。
附图简述下面的附图举例说明本发明的实施例，并不意味着限制本发明的范围，本发明的范围是如权利要求所包括的范围。

图1是计算机系统的结构图。
图2是流程图，举例说明方法的一个实施方案，将新的核苷酸或蛋白序列与数据库序列比较以确定新序列与数据库序列之间的同源性水平。
图3是举例说明计算机中方法的一个实施方案的流程图，以鉴定两个序列是否是同源的。
图4是举例说明识别器程序300的一个实施方案的流程图，以检测序列中存在的特征。
图5显示本发明多肽序列的排列。A＝SEQ ID NO4；B＝SEQ IDNO2；C＝SEQ ID NO6；rhod2＝SEQ ID NO40；myco4＝SEQ ID NO42。
图6显示本发明序列(SEQ ID No9-38和43-48)。
图7显示用本发明的脱卤素酶形成甘油的实例，以及用本发明的脱卤素酶形成1，2-丙二醇或1，3-丙二醇的实例。
图8显示用本发明的脱卤素酶对卤素取代的环烃基的脱卤素作用的实例。
发明详述本发明涉及卤烷脱卤素酶多肽和编码它们的多核苷酸，以及应用这些多核苷酸和多肽的方法。如这里所使用的，术语“卤烷脱卤素酶”包括具有水解酶活性的酶，例如能够经烷基酶中间体催化卤烷水解的酶。
本发明的多核苷酸已被确定编码具有脱卤素酶活性的多肽，在特定的实施例中编码具有卤烷脱卤素酶活性的多肽。
本发明的脱卤素酶和编码脱卤素酶的多核苷酸被用于许多工艺、方法和组合物中。例如，如上所讨论的，脱卤素酶可以被用来补救脂族有机氯污染的环境，降解除草剂茅草枯，降解卤化有机酸以及土壤和水的补救，并通过降解作用处理土壤和水中的有机酸。而且，本发明的脱卤素酶可以被用来在工业加工、环境和药物中去除杂质。例如，脱卤素酶可以被用来分解各种样本中的卤代链烷酸杂质，包括例如表面活性剂、羧甲基纤维素或巯基乙酸盐。又在另一个方面，本发明的脱卤素酶可通过特异的1，2-二醇或外消旋卤醇的氧化脱卤素作用被用于制造药物、农用化学品和铁电液体。例如，通过用脱卤素酶处理α，β-二卤丙酸(如二氯丙酸)，脱卤素酶可被用于合成旋光缩水甘油酸和乳酸(如β卤代乳酸)。本发明的脱卤素酶也可被用于从1，3-二卤代-2-丙醇中产生活性(S)-(+)-3-卤代-1，2-丙二醇或(R)-(-)-3卤代-1，2丙二醇。(S)-(+)-3-卤代-1，2-丙二醇被用作生理和医学治疗和药物的原料。例如，本发明的脱卤素酶可以与三氯丙二醇(TCP)或二氯丙二醇(DCP)在足以进行氧化脱卤素作用的条件和时间下接触，以形成例如甘油(如DCP或TCP到甘油)(例如参见图7)。用本发明的方法和酶可以产生各种二醇。此外，本发明的方法和合成物可被用于卤化的芳香化合物。例如，本发明的组合物可被用来对卤素取代的环烃基脱卤素，如图8所描绘的。环烃基化合物的实例包括环烷基，环烯基，环二烯烃基，环三烯烃基，环炔基，环链二炔，芳香化合物类，螺环烃，其中螺环烃中的两个环由一个两环唯一的共同原子连接(如螺[3，4]辛烷基等)，双环烃，其中两个环连接着并至少有两个共同的原子(如双环[3.2.1]辛烷、双环[2.2.1]七-2-烯等)，环的集合，其中两个或多个环系统(即单环或融合的系统)直接通过一个或两个键相互连接且这种环连接的数量少于涉及的环系统的数量(如联苯基、联苯烯、游离基或p-三联苯、环己苄基，等)，多环类，或类似物。
卤烷脱卤素酶整体结构来自自养黄色杆菌的卤烷脱卤素酶由310个氨基酸组成，并包括分子量36,000的单一多肽链。单体的酶是球形的并由两个部分组成。主结构域是具有8股顺序12435678的混合β层的α/β水解酶折叠结构；第2股与其它部分是反平行的。第二个结构域是位于主结构域顶端的α-螺旋帽(Keuning等人，J Bacteriol163(2)635-639，1985)。如这里进一步详细描述的，进行了诱变以修饰酶的活性，例如，通过帽状部分特定残基的突变(Krooshof等人，Biochemistry36(31)9571-9580，1997)。
自养黄色杆菌中酶的活性部位包括3个催化残基(Asp124，His289和Asp260)，介于内部疏水空穴中的两个结构域之间。分别位于第5和第8β股后的亲核Asp124和普通碱性His289在α/β水解酶家族中是完全保守的，而Asp260则不是。活性部位是线状的并具有10个疏水残基4个苯基丙氨酸，2个色氨酸，2个亮氨酸，1个缬氨酸和1个脯氨酸。(Schanstra等人，J Biol Chem271(25)14747-14753，1996)。
在底物的酶水解过程中，卤烷脱卤素酶形成了共价中间体，是通过Asp124的亲核取代形成的，它通过水分子水解，通过His289活化。(Verschueren等人，Nature363(6431)693-698，1993)。作为脱卤素酶类常见的催化三联体的第三个成员，Asp260的作用通过定点诱变得以研究。Asp260突变为天冬氨酸得到无催化活性的D260N突变体，这表明在野生型酶中三联体酸Asp260对于脱卤素酶活性是必需的。此外，Asp260具有重要的结构作用，这是因为D260N酶主要在表达过程中的内含体中聚积，底物或产物均不能结合进活性部位的空穴中。通过用天冬氨酸或谷氨酸置换Asn148，D260N对溴化底物的活性恢复。与野生型酶相比，双重突变体D260N+N148D和D260N+N148E对于1，2-二溴乙烷均减少10倍kcat和增高40倍Km值。D260N+N148E双重突变体的前稳态动力学分析显示，kcat的下降主要是由于碳-溴键裂解的速度减少220倍，且烃基酶中间体的水解速度下降10倍。另一方面，同野生型酶相比，溴释放加快12倍并经过不同的途径。突变体的分子建模显示，Glu148确实能够承担与His289的相互作用，并在连接活性部位和溶剂的通道区域有电荷分布的改变(Krooshof等人，Biochemistry36(31)9571-9580，1997)。
降解有害卤化化合物的第一步应用了卤烷脱卤素酶。脱卤素酶的催化作用作为涉及酯中间体的第二步机制发生。水解性脱卤素酶不需要能量；因此，因丢失产生毒性的卤素而解毒有机物质是简单的方式。催化三联体(Asp-His-Asp)以及天冬氨酸羧酸酯(Asp124)是反应的焦点。底物结合到活性部位空穴中，且Cl-α复合体与Trp172和Trp175的侧链NH基团反应。作为第一步骤，来自底物的卤素被亲核天冬氨酸代替，得到中间体共价酯。然后His289激活水解酯的水分子。其结果是醇和卤化物被从活性部位代替。涉及亲核Asp124和酯中间体水解的两步机制与其它α/β水解折叠酶是一致的。
卤烷脱卤素酶断裂脂肪族化合物的碳-卤素键。结果显示，对C-Cl键的酶反应慢于对其它C-卤化物键，如C-Br键。离去基团的能力是其差异的解释。1，2-二氯乙烷和1，2-二溴乙烷的限速步骤不是碳-卤素键的裂解，而是离子从活性部位的释放。
生物补救本发明提供了许多用于生物补救的具有改善的酶特性的脱卤素酶。本发明的多核苷酸和多核苷酸产物被用于例如，涉及含本发明多核苷酸或多肽的转化宿主细胞(如细菌自养黄色杆菌)和卤烷1，2-二氯乙烷的地下水处理，以及从土壤沉淀物中去除多氯化联苯(PCB)。
本发明的卤烷脱卤素酶被用于减少碳-卤化物的努力中。本发明的酶启动卤烷的降解。可选择地，含本发明脱卤素酶多核苷酸或多肽的宿主细胞可以在卤烷上培养，并产生解毒酶。
定义如这里所用的，短语“核酸”或“核酸序列”指寡核苷酸、核苷酸、多核苷酸，或指它们中任一的片段，指基因组或合成来源的DNA或RNA，它们可以是单链的或双链的，可以表现为有义或反义链，指肽核酸(PNA)或指任何天然或合成来源的DNA样或RNA样物质。在一个实施例中，本发明的“核酸序列”包括，例如，编码B组氨基酸序列中所列多肽及其变异体的序列。在另一个实施例中，本发明的“核酸序列”包括，例如，A组核酸序列中所列的序列，与其互补的序列，上述序列的片段及其变异体。
特定多肽或蛋白的“编码序列”或“编码特定多肽或蛋白的核苷酸序列”是当置于适当调节序列控制下时被转录和翻译成多肽或蛋白的核酸序列。
术语“基因”是指涉及产生多肽链的DNA片段；它包括密码区之前和之后的区域(前导区和非转录尾区)，以及在可适用时，包括单个编码片段(外显子)之间的间插序列(内含子)。
如这里所用，“氨基酸”或“氨基酸序列”指寡肽、肽、多肽或蛋白序列，或指它们中任一的片段、部分或亚单位，并指天然存在或合成的分子。在一个实施例中，本发明的“氨基酸序列”或“多肽序列”包括例如，B组氨基酸序列中所列的序列，上述序列的片段及其变异体。在另一个实施例中，本发明的“氨基酸序列”包括例如，由具有B组核酸序列中所列序列的多核苷酸编码的序列，与它们互补的序列，前述序列的片段及其变异体。
如这里所用的，术语“多肽”指相互被肽键或修饰的肽键连接起来的氨基酸，即肽等排体，可含有除20个基因编码的氨基酸以外的修饰的氨基酸。这些多肽可以被任意一种自然过程修饰，如翻译后处理，或通过本领域熟知的化学修饰技术。修饰可以发生在多肽的任何地方，包括肽骨架、氨基酸侧链和氨基或羧基末端。应当理解到，同一类型的修饰可以在给定多肽的数个部位表现为相同或不同的程度。而且给定的多肽可有许多类型的修饰。修饰包括乙酰化作用，酰化作用，ADP-核糖基化作用，酰胺化作用，核黄素共价附着，血红素部分共价附着，核苷酸或核苷酸衍生物共价附着，脂质或脂质衍生物共价附着，磷脂酰肌醇(phosphytidylinositol)共价附着，交联环化作用，二硫键形成，脱甲基作用，形成共价交联，形成半胱氨酸、形成焦谷氨酸酯，甲酰化作用，γ-羧化作用，糖基化作用，糖基磷脂酰肌醇(GPI)固着物形成，羟基化作用，碘化作用，甲基化作用，肉豆蔻化作用，氧化作用，pergylation，蛋白水解过程，磷酸化作用，异戊二烯化作用，外消旋作用，硒化作用，硫酸化作用，和转运-RNA介导的氨基酸加入蛋白如精氨酰化作用。(见Creighton，T.E.，蛋白-结构和分子特性(Proteins-Structure and Molecular Properties)第二版，W.H.Freeman andCompany，New York(1993)；蛋白的翻译后共价修饰(PosttranslationalCovalent Modification of Proteins)，B.C.Johnson编著，Academic Press，New York，1-12页(1983))。
如这里所用的，术语“分离的”是指物质从其来源环境(如，假如是天然存在的，则是自然环境)中被移除。例如，在活体动物中天然存在的多核苷酸或多肽不是分离的，但从天然系统的某些或全部共存物质中分离的同样的多核苷酸或多肽则是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或多肽可以是组合物的一部分，它仍然是分离的，这是因为这样的载体或组合物不是自然环境的一部分。
如这里所用的，术语“纯化的”不需要绝对的纯度；而是要作为相对的定义。从文库中获得的单个核酸已经被常规地纯化为电泳均一性。从这些克隆中获得的序列不能直接从文库或总人DNA中获得。本发明的纯化核酸已经从生物体基因组DNA的剩余物中纯化至少104-106倍。但是，术语“纯化的”还包括已经从基因组DNA的剩余物中，或从文库的其它序列或其它环境中，以至少一个数量级的大小，典型地二或三个数量级，更典型地四或五个数量级大小，纯化的核酸。
如这里所用的，术语“重组”是指邻近“骨架”核酸的核酸，在天然环境下，它不与其相邻。此外，将被“富集”的核酸会表现为在核酸骨架分子群中插入5％或以上数目的核酸。按照本发明的骨架分子包括，如表达载体、自我复制核酸、病毒、整合型核酸，和其它载体或用于保持或操作目的核酸插入物的核酸。典型地，被富集的核酸表现为在重组骨架分子群中插入15％或以上数目的核酸。更典型地，被富集的核酸表现为在重组骨架分子群中插入50％或以上数目的核酸。在一个实施例中，被富集的核酸表现为在重组骨架分子群中插入90％或以上数目的核酸。
“重组”多肽或蛋白指通过重组DNA技术产生的多肽或蛋白；即由编码所需多肽或蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或蛋白是通过化学合成制备的。固相化学肽合成法也可以用来合成本发明的多肽或片段。这种方法自从20世纪60年代早期就已经为本领域所知(Merrifield，R.B.，J.Am.Chem.Soc.，852149-2154，1963)(又见Stewart，J.M.和Young，J.D.，固相肽合成(Solid PhasePeptide Synthesis)，第二版，Pierce Chemical Co.，Rockford，Ill.，11-12页))，且最近已被用于市售实验室肽设计和合成试剂盒中(CambridgeResearch Biochemicals)。这种市售实验室试剂盒已一般地采用H.M.Geysen等人，Proc.Natl.Acad.Sci.，USA，813998(1984)的教导，供在多个“杆”或“插脚”的尖端上合成肽，所有“杆”或“插脚”与一个平板相连。当使用这种系统时，倒转一盘杆或插脚并将其插入到第二个盘相应孔或池中，后者含有溶液以便将适合的氨基酸到杆或插脚附着或锚着到杆或插脚的尖端上。通过重复这种工序，即将杆或插脚的尖端倒转和插入到适合的溶液中，氨基酸被构建成所需的肽。此外，可以得到数种可用的FMOC肽合成系统。例如，用Applied Biosystems，Inc.431A型自动肽合成仪可以在固体支持物上进行多肽或片段的装配。这种设备通过直接合成或通过合成一系列可用其它已知技术连接的片段，提供了获得本发明肽的现成通路。
当在启动子上启动转录的RNA聚合酶将编码序列转录成mRNA时，启动子序列被“可操作地连接到”编码序列上。
“质粒”以一个小写字母“p”在前和/或后接大写字母和/或数字方式命名。这里的起始质粒可以从商业渠道购买，在非受限基础上公开获取，或可以按照公开的方法从可利用的质粒中构建。此外，与这里所述相当的那些质粒为本领域已知，对普通专业技术人员是很显然的。
DNA的“消化”指用仅在DNA中某些序列上起作用的限制性酶催化裂解DNA。这里所用的各种限制性酶是从商业渠道获得的，其反应条件、辅因子和其它要求通常会为普通专业技术人员所知。为了分析目的，典型地1μg质粒或DNA片段与大约2个单位的酶在大约20μl缓冲溶液中一起使用。为分离DNA片段以构建质粒，典型地5至50μgDNA用20至250单位的酶在较大容积内消化。对特定限制性酶合适的缓冲液和底物的量由制造商详细说明。通常使用37℃大约1小时的孵育时间，但可以按照供应商说明书而变化。消化后，可以进行凝胶电泳来分离所需的片段。
“寡核苷酸”指单链聚脱氧核苷酸或两个互补的聚脱氧核苷酸链，它们可以是化学合成的。这样合成的寡核苷酸没有5’磷酸盐，因此在有激酶存在的情况下，不添加带ATP的磷酸盐，不会与另一个寡核苷酸连接。合成的寡核苷酸将与没有脱磷酸化的片段连接。
在提到两个核酸或多肽时，短语“基本上相同的”指当比较和排列最大对应时，两个或多个序列具有至少50％、55％、60％、65％、70％、75％、80％、85％和在某些方面90-95％的核苷酸或氨基酸残基同一性，正如用已知的序列比较算法之一或通过目测而确定的。典型地，基本上同一性存在于至少大约100个残基区域内，最常见地，序列在至少大约150-200个残基区域内基本上相同。在某些实施例中，序列在编码区的全长区域内基本上相同。
另外，“基本上相同”的氨基酸序列是通过一个或多个保守的或非保守的氨基酸取代、删除或插入而不同于参考序列的序列，特别是当这种取代发生在不是分子活性部位的部位，并假设多肽基本上保留其功能特性时。保守的氨基酸取代，例如，用一个氨基酸取代另一个同类的氨基酸(如，用一个疏水的氨基酸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸取代另一个，或用一个极性氨基酸来取代另一个，如用精氨酸取代赖氨酸，用谷氨酸取代天冬氨酸或谷氨酰胺取代天冬酰胺)。一个或多个氨基酸可以被删除，例如从脱卤素酶多肽中删除，引起多肽结构的修饰而不显著改变其生物学活性。例如，可以去除对脱卤素酶生物活性不需要的氨基或羧基末端氨基酸。可以用许多方法检测本发明的修饰的多肽序列的脱卤素酶生物活性，包括将修饰的多肽序列与脱卤素酶底物接触，并测定修饰的多肽是否降低试验中特异底物的量，或增加功能性脱卤素酶多肽与底物进行酶反应的生物产物。
这里所用的“片段”是天然存在蛋白的一部分，它可以以至少两种不同的构象存在。这些片段可以与天然存在的蛋白具有相同或基本上相同的氨基酸序列。“基本上相同”是指氨基酸序列很大程度上，但不是完全地相同，但保留了它所涉及的序列的至少一个功能活性。一般而言，如果两个氨基酸序列至少大约85％相同，则它们是“基本上相同”或“基本上同源”的。与天然存在的蛋白具有不同三维结构的片段也包括在内。对此的一个例子是“原-形”分子，如低活性的原蛋白，它可以通过裂解被修饰，以产生具有显著高活性的成熟酶。
“杂交”指核酸链与互补链通过碱基对结合的过程。杂交反应可以是敏感的和选择性的，这样即使在以低浓度存在的样本中，特定的目的序列也可以被识别。适合的严格条件可以通过以下因素确定，例如，在预杂交和杂交溶液中盐或甲酰胺的浓度，或杂交温度，这些是本领域熟知的。特别是，通过降低盐浓度、增加甲酰胺浓度、或升高杂交温度可以提高严格性。
例如，在大约50％甲酰胺中，大约37℃至42℃可以发生高度严格条件下的杂交。在大约35％至25％的甲酰胺中，大约30℃至35℃可以发生降低严格条件下的杂交。特别地，在42℃ 50％甲酰胺、5X SSPE、0.3％ SDS和200n/ml剪切和变性的鲑精DNA中，杂交可能在高度严格条件下发生。如上所述，杂交可能在降低的严格条件下发生，但是在35％甲酰胺，降低的35℃温度下。对应于特定严格水平的温度范围可以通过计算目的核酸的嘌呤对嘧啶的比率而进一步缩小，并依此调节温度。上述范围和条件的变化是本领域熟知的。
术语“变异体”指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基上(分别地)被修饰但仍保留本发明脱卤素酶生物活性的本发明的多核苷酸或多肽。本发明的多核苷酸或多肽也可以通过导入修饰的碱基如次黄嘌呤核苷而被修饰。另外，这些修饰可以任选地被重复一或多次。这些变异体可以通过许多方法产生，例如，包括易错聚合酶链式反应(易错PCR)、改组(Shuffling)、寡核苷酸定位诱变(oligonucleotide-directed mutagenesis)、装配PCR、有性PCR诱变、体内诱变、盒式诱变、循环系综诱变、指数系综诱变、位点特异性诱变、基因再装配、基因位点饱和诱变(GSSM)或它们的任何组合、排列或反复步骤。
酶是高度选择性的催化剂。它们的特点是能够以传统合成化学无法比拟的空前灵敏的立体、区域和化学选择性催化反应。而且，酶有非常多方面的能力。它们可以被修改以在有机溶剂中起作用，在极端pH(例如，高pH和低pH)、极端温度(例如，高温度和低温度)和极端盐水平(例如，高盐度和低盐度)下工作，并催化结构上与其天然的生理学底物无关的化合物的反应。
酶对大范围的天然和非天然底物起作用，因此实际上使任何有机的前导化合物能够被修饰。而且，与传统的化学催化剂不同，酶是高度对抗选择和区域选择的。酶所具有的高度功能基团特异性使人们能够明了产生新活性化合物的合成序列中的每一个反应。酶还能够催化许多与其天然生理学功能无关的不同反应。例如，过氧化物酶催化过氧化氢对苯酚的氧化作用。过氧化物酶也可以催化与其天然酶功能无关的羟基化反应。其它的例子是催化多肽分解的蛋白酶类。在有机溶液中，一些蛋白酶类还可以酰化糖类，此作用与这些酶的天然功能无关。
本发明开发了酶的独特催化特性。尽管在化学转化作用中使用生物催化剂(即纯化酶或粗制酶，非活细胞或活细胞)通常需要确定与特定的起始化合物相互作用的特定生物催化剂，但本发明使用了对许多起始化合物中存在的功能基团特异的选择的生物催化剂和反应条件。
每个生物催化剂对一个或数个相关的功能基团特异，并能够与许多含此功能基团的起始化合物相互作用。
生物催化反应从单一的起始化合物产生一群衍生物。这些衍生物可以接受另一轮生物催化反应以产生第二群衍生物化合物。生物催化的衍生作用的每一次重复可以产生起始化合物的数千个变异体。
酶在起始化合物的特异位置起作用而不影响其余的分子，这一过程采用传统的化学方法是很难达到的。这种高度的生物催化特异性提供了在文库中鉴定单一活性化合物的方法。该文库的特征是用来产生它的生物催化反应系列，即所谓的“生物合成历史记录”。筛选文库的生物活性和追踪生物合成历史确定了产生活性化合物的特异性反应序列。重复反应序列，并确定合成的化合物的结构。这个鉴定模式与其它合成和筛选方法不同，不需要固定技术，而且化合物可以游离在溶液中采用实际上任何类型的筛选试验而被合成和检测。重要的是要注意，酶对功能基团反应的高度特异性可以“追踪”特异性酶反应，它可制备生物催化产生的文库。
采用机械自动操作进行许多程序性步骤，该自动操作能够每天完成数千的生物催化反应和筛选试验，并保证高水平的精确性和再现性。其结果是，衍生化合物文库可以在大约数周内产生，而采用通用的化学方法会需要数年。(对进一步分子的修饰，包括小分子的教导，见PCT/US94/09174，在此整体加入作为参考)。
在一个方面，本发明提供了称为合成基因再装配的非随机方法，它与随机的改组有些相关，只是核酸构建模块不随机地改组或链接或嵌合，而是非随机地装配。
合成基因再装配法不依赖于要改组的多核苷酸间存在高水平的同源性。本发明可被用于非随机地产生包括超过10100的不同嵌合体的后代分子文库(或集合)。可以想到的，合成基因再装配甚至可以被用于产生包括超过101000的不同后代嵌合体的文库。
因此，在一个方面，本发明提供了产生一批终定核酸分子的非随机方法，这些分子具有由设计选定的整体装配顺序，该方法包括以下步骤通过设计产生众多具有有用的相互兼容可连接末端的特异核酸构建模块，并装配这些核酸构建模块，这样获得了设计的整体装配顺序。
如果能够使构建模块以预定的顺序连接，要装配的核酸构建模块的相互兼容可连接末端被认为对于此型有序装配是“有用的”。因此，在一个方面，通过设计可连接末端，可以连接核酸构建模块的整体装配顺序是特异的，如果需要使用超过一个的装配步骤，那么通过装配步骤的连续顺序，可以连接构建模块的整体装配顺序也是特异的。在本发明的一个实施方案中，用酶如连接酶(如T4 DNA连接酶)处理退火的构件以获得构件的共价结合。
在另一个实施方案中，根据一批原始核酸模板的序列分析获得了核酸构建模块的设计，该模板作为产生终定嵌合核酸分子的子集的分子基础。因而，这些原始核酸模板作为序列信息的来源，帮助设计要诱变的，即嵌合的或滑动的核酸构建模块。
在一个范例中，本发明提供相关基因家族及其相关产物编码家族的嵌合作用。在特别范例中，编码的产物是酶。本发明的脱卤素酶可以按照这里描述的方法诱变。
因此，按照本发明的一个方面，众多原始核酸模板(如A组核酸序列的多核苷酸)被排列以选择一个或多个分界点，该分界点可以位于同源区域。分界点可被用于描绘要产生的核酸构建模块的边界。这样，在原始分子中识别和选择的分界点作为后代分子装配中潜在的嵌合作用点。
典型地，有用的分界点是由至少两个原始模板共享的同源区域(包括至少一个同源的核苷酸碱基)，但分界点可以是由原始模板的至少一半、原始模板的至少三分之二、原始模板的至少四分之三共享的同源区，优选地几乎所有原始模板共享。还更优选地，有用分界点是由所有原始模板共享的同源区。
在一个实施方案中，为产生详尽的文库，彻底地进行了基因再装配过程。换言之，所有可能排列的核酸构建模块组合都描绘在终定嵌合核酸分子的集合中。同时，每个组合的装配顺序(即，以每个终定嵌合核酸的5’至3’序列上的每一构建模块的装配顺序)是有意设计的(或非随机的)。由于本方法的非随机性质，不需要的副产物的可能性大大减低。
在另一个实施方案中，本方法提供了系统地进行的基因装配步骤，例如，以系统地产生区室化文库，具有能够被系统地如一个接一个地筛选的区室。换言之，本发明提供了以下的方法，即经过选择性和明智的使用特异的核酸构建模块，加上选择性和明智的使用顺序步骤的装配反应，可以获得在每个单独的反应容器中制造特异的子产物集合的实验设计。这使得系统性检测和筛选过程得以进行。因此，它使潜在的非常大量的后代分子能够以较小的批组被系统地检测。
因其以高度灵活但彻底而且系统的方式运行，特别是当原始分子间同源性水平低时，本发明提供了用于产生由大量后代分子组成的文库(或集合)。由于本基因再装配发明的非随机性质，产生的后代分子优选地包括终定嵌合核酸分子文库，后者具有由设计选定的整体装配顺序。在特殊实施例中，这种产生的文库包括超过103至超过101000的不同后代分子种类。
在一个方面，如所述产生的终定嵌合核酸分子集合包括编码多肽的多核苷酸。根据一个实施方案，此多核苷酸可能是一个人造的基因。根据另一个实施方案，此多核苷酸可能是人造的基因通路。本发明提供了以下的方法，即由本发明产生的一个或多个人造基因可能并入人造基因通路中，如可在真核生物(包括植物)中操作的通路。
在另一个范例中，产生构建模块的步骤的合成性质可以设计和导入核苷酸(如可能是例如密码子或内含子或调节序列的一个或多个核苷酸)，它们可以随后被任选地移到体外过程(如通过诱变)或体内过程(如通过应用宿主生物体的基因剪接能力)中。应当理解，在许多情况下，除产生有用分界点的潜在益处外，导入这些核苷酸也可是由于许多其它的原因所需要的。
因此，根据另一个实施方案，本发明提供了以下方法，即核酸构建模块可被用于引入外显子。这样，本发明提供了以下方法，即功能性内含子可被导入本发明的人造基因中。本发明还提供了以下方法，即功能性内含子可以被导入本发明的人造基因通路中。因此，本发明供产生嵌合多核苷酸使用，即含一个(或多个)人工导入的内含子的人造基因。
因此，本发明还供产生嵌合多核苷酸使用，即含一个(或多个)人工导入的内含子的人造基因通路。优选地，人工导入的内含子在一个或多个宿主细胞中，以天然存在的内含子在基因剪接中起作用的方式对基因剪接起更大的作用。本发明提供了产生人造的含内含子的多核苷酸的方法，该多核苷酸将被导入宿主生物体以重组和/或剪接。
用本发明产生的人造基因还可以作为与另一个核酸重组的底物。同样地，用本发明产生的人造基因通路也可以作为与另一个核酸重组的底物。在优选的实例中，重组是由人造的含内含子的基因与作为重组伙伴的核酸之间的同源区所促进，或发生在该区域上。在一个特别优选的实例中，重组伙伴也可以是本发明产生的核酸，包括人造基因或人造基因通路。重组可以由存在于人造基因中的一个(或多个)人工导入的内含子上的同源区所促进，或可发生在该区上。
本发明的合成基因装配方法应用众多核酸构建模块，每一个优选地具有两个可连接的末端。每个核酸构建模块上的两个可连接末端可能是两个钝末端(即每个末端上没有突出的核苷酸)，或优选地一个钝末端和一个突出端，或更优选地仍是两个突出端。
为此目的有用的突出端可以是3’突出或5’突出。因此，核酸构建模块可具有一个3’突出端或可选择地一个5’突出端，或可选择地两个3’突出端或可选择地两个5’突出端。装配核酸构建模块以形成终定嵌合核酸分子的整体顺序，是通过有目的的实验设计而确定的，不是随机的。
根据一个优选的实施方案，核酸构建模块是如下产生的化学合成两个单链核酸(也称作单链寡聚体)，并将它们接触使其退火以形成双链的核酸构建模块。
双链核酸构建模块可以是不固定大小的。这些构建模块的尺寸可以是小的或大的。优选的构建模块大小范围从1个碱基对(不包括任何突出端)至100,000个碱基对(不包括任何突出端)。也提供了其它优选的大小范围，它具有从1bp至10,000bp的下限(包括其间的每一个整数值)，和从2bp至100,000bp的上限(包括其间的每一个整数值)。
存在许多对本发明有用的、可以产生双链核酸构建模块的方法；这些方法为本领域已知并可以由熟练的专业技术人员容易地进行。
根据一个实施方案，双链核酸构建模块是通过首先产生两个单链核酸，并令其退火以形成双链核酸构建模块而产生的。除任何形成突出端者以外，双链核酸构建模块的两条链可以在每个核苷酸上互补，因此除任何突出端以外不含错配。根据另一个实施方案，除任何形成突出端者以外，双链核酸构建模块两条链不足以在每一个核苷酸上互补。因此，根据此实施方案，双链核酸构建模块可被用于引导密码子简并。优选地，密码子简并用这里描述的位点饱和诱变引导，采用一个或多个N，N，G/T盒或可选择地采用一个或多个N，N，N盒。
本发明的体内重组方法可以在特定多核苷酸或序列的未知杂交物或等位基因池上盲目地进行。但不必知道特定多核苷酸的实际DNA或RNA序列。
在混合的基因群内应用重组的方法可用于产生任何有用的蛋白，例如，白介素I、抗体、tPA和生长激素。此方法可用于产生特异性或活性改变的蛋白。该方法也可用于产生杂交核酸序列，例如，启动子区、内含子、外显子、增强子序列、基因的3’非翻译区或5’非翻译区。因此，此方法可用于产生表达率升高的基因。此方法还可用于重复性DNA序列研究。最后，此方法可用于突变核糖酶或相似法则。
在一个方面，这里描述的发明专注于使用简化重排、重组和选择的重复循环，它可使高度复杂的线性序列定向地分子进化，如DNA、RNA或蛋白彻底重组。
分子的体内滑动用于提供变异体，并可以应用细胞的天然特性进行以重组多聚体。虽然体内重组提供了分子多样性的主要天然途径，基因重组依然是相对复杂的过程，涉及1)识别同源性；2)链裂解，链侵入和导致产生重组交叉的代谢步骤；和最后3)将交叉转变成分离的重组分子。交叉的形成需要识别同源序列。
在另一个实施方案中，本发明包括从至少第一个多核苷酸和第二个多核苷酸产生杂交多核苷酸的方法。本发明可被用于通过引导至少第一个多核苷酸和第二个多核苷酸进入适合的宿主细胞产生杂交多核苷酸，两个多核苷酸共享部分序列的至少一个区域同源(如3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45，47，及其组合)。部分序列的区域同源可促进这个过程，即导致产生杂交的多核苷酸的序列重组。如这里所用，术语“杂交的多核苷酸”是从本发明方法得到的任何核苷酸序列，包含来自至少两个原始多核苷酸序列的序列。这样的杂交的多核苷酸可以来自于分子之间的重组事件，它促进DNA分子间的序列整合。此外，这样的杂交的多核苷酸可以来自于分子内简化重配(reductive reassortment)过程，它应用重复的序列来改变DNA分子内的核苷酸序列。
本发明提供了产生杂交多核苷酸的方法，该杂交多核苷酸可编码生物学活性的杂交多肽(如杂交的卤烷脱卤素酶)。在一个方面，原始的多核苷酸编码生物学活性的多肽。本发明的方法通过应用细胞方法产生新的杂交多肽，该细胞方法整合了原始多核苷酸的序列，以便所得到的杂交多核苷酸编码多肽，其中多肽显示来自于原始生物学活性多肽的活性。例如，原始的多核苷酸可从不同的微生物编码特定的酶。由来自一个生物体的第一个多核苷酸或变异体编码的酶，例如，可在特定的环境条件，如高盐度下有效地起作用。由来自不同生物体的第二个多核苷酸或变异体编码的酶，可在不同的环境条件，如超高温下有效地起作用。杂交的多核苷酸含有来自第一和第二个原始多核苷酸的序列，可编码具有两个酶特性的酶，这两个酶是由原始多核苷酸编码的。因此，由杂交多核苷酸编码的酶可在第一和第二个多核苷酸编码的每个酶所具有的环境条件下，如高盐度和超高温下，有效地起作用。
由本发明多核苷酸编码的酶包括但不限于水解酶，脱卤素酶和卤烷脱卤素酶。来自于本发明方法的杂交多肽可具有原始酶不显示的特殊酶活性。例如，在编码水解酶活性的多核苷酸重组和/或简化重配后，所得到的由杂交多核苷酸编码的杂交多肽被筛选来自每一个原始酶的特殊水解酶活性，即水解酶作用的键的类型和水解酶起作用的温度。因此，例如，可筛选水解酶以确定区别杂交水解酶与原始水解酶的化学功能性，如(a)氨基化合物(肽键)，即蛋白酶；(b)酯键，即酯酶和脂肪酶；(c)乙缩醛即糖苷酶，和例如杂交多肽发挥作用的温度、pH或盐浓度。
原始多核苷酸的来源可以分离自单个的生物体(“分离”)、在限定的培养基中生长的生物体集合(“富集培养”)、或未培养的生物体(“环境样本”)。使用不依赖培养的方法从环境样本中得到编码新生物活性的多核苷酸是最优选的，这是因为它使人们可以得到未使用的生物多样性来源。
“环境文库”是从环境样本中产生的，并代表在克隆载体中获得的天然存在生物体的基因组集合，克隆载体可以在适合的原核宿主中繁殖的。由于克隆的DNA最初是直接从环境样本中提取的，所以文库并不限于可以在纯系培养中生长的小部分原核细胞。此外，这些样本中存在的环境DNA的标准化，能使原始样本中存在的所有种属的DNA更平等地表示。这可以显著地提高从样本的较小组分中发现目的基因的效率，同优势种属相比，这些较小组分的表现幅度可以低数个量级。
例如，筛选从一个或多个未培养的微生物中产生的基因文库的目的活性。编码目的生物活性分子的潜在通路首先在原核细胞中以基因表达文库的形式被捕获。编码目的活性的多核苷酸从这种文库中分离并导入宿主细胞中。宿主细胞在促进重组和/或潜在地产生活性生物分子的简化重配条件下生长，该生物分子具有新的或增高的活性。
可以从中制备多核苷酸的微生物包括，原核微生物如真细菌和古细菌，低等真核微生物如霉菌，某些藻类和原生动物。多核苷酸可以从环境样本中分离，在此情况下，核酸可以不培养生物体而回收，或从一个或多个培养的生物体中分离。在一个方面，这种微生物可以是嗜极端环境的微生物(extremophiles)如嗜超高温生物、嗜寒生物、嗜冷生物、嗜盐生物、嗜压微生物和嗜酸生物。从嗜极性微生物中分离的编码酶的多核苷酸是特别优选的。这种酶可在以下条件下工作超过100℃温度的陆地温泉和深海热火山口中，低于0℃温度的北极水中，在死海的饱和盐环境中，pH值为0左右的煤沉积层和地热富硫磺泉水中，或pH值超过11的污水淤泥中。例如，从嗜极性微生物中克隆和表达的几种酯酶和脂肪酶在宽范围温度和pH中显示了高活性。
如以上所描述选择和分离的多核苷酸被导入适合的宿主细胞中。适合的宿主细胞是能够促进重组和/或简化重配的任何细胞。所选择的多核苷酸优选已经存在于包含适当控制序列的载体中。宿主细胞可以是高等真核细胞如哺乳动物细胞，或低等真核细胞如酵母细胞，或优选地，宿主细胞可以是原核细胞如细菌细胞。将构建物导入宿主细胞可以通过磷酸钙转染、DEAE-葡聚糖介导的转染、或电穿孔法实现(Davis等人，1986)。
作为合适宿主的代表性实例，可能提及细菌细胞如大肠杆菌、链霉菌、鼠伤寒沙门氏菌；真菌细胞如酵母；昆虫细胞如果蝇S2和草地夜蛾Sf9；动物细胞如中国仓鼠卵巢细胞(CHO)、被含有缺陷性病毒复制起点的猴肾病毒SV40 DNA所转化的猴细胞(COS)或Bowes恶性黑素瘤；腺病毒类；和植物细胞。从这里的教导，相信合适宿主的选择在本领域专业技术人员的知识范围内。
特别是根据能够用于表达重组蛋白的各种哺乳动物细胞培养系统，哺乳动物表达系统的实例包括，猴肾成纤维细胞的COS-7系，描述于“SV40-转化的猿细胞支持早期SV40突变体的复制”(Gluzman，1981)；和能够表达兼容载体的细胞系，例如C127、3T3、CHO、HeLa和叙利亚幼年仓鼠肾细胞系(BHK细胞系)。哺乳动物表达载体包括复制起点、适合的启动子和增强子，还包括任何必要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、和5′侧翼非转录序列。来自SV40剪接的DNA序列和聚腺苷酸化位点可用于提供所需的非转录基因元件。
含目的多核苷酸的宿主细胞可以在为适于激活启动子、选择转化体或扩增基因被修饰的传统营养培养基中培养。培养条件，如温度、pH等，是以前选做表达的宿主细胞所用的条件，并对普通专业技术人员是显而易见的。然后，可以对被确定具有特异酶活性的克隆测序，以确定编码活性增强的酶的多核苷酸序列。
在另一个方面，可以预想到本发明的方法可被用于，从一个或多个操纵子或基因簇或其部分产生新的编码生物化学通路的多核苷酸。例如，细菌和许多真核细胞对于调节基因具有同等的机制，基因产物涉及相关的过程。基因是成簇的，在结构上称作一个单一染色体上的“基因簇”，并在一个单一调节序列的控制下一起转录，调节序列包括启动整个基因簇转录的单个启动子。因此，基因簇是一组相邻的基因，其功能通常是相同或相关的。由基因簇编码的生物化学通路的实例是聚酮化合物。聚酮化合物是极富生物活性来源的分子，包括抗生素类(如四环素和红霉素)、抗癌剂(道诺霉素)、免疫抑制剂(FK506和雷帕霉素)，和兽医产品(莫能菌素)。许多聚酮化合物(由聚酮合成酶产生)是有价值的治疗药物。聚酮合成酶是多功能的酶，催化大量的长度、功能型和环化作用不同的多种碳链的生物合成。聚酮合成酶基因属于基因簇，且至少一个聚酮合成酶的类型(命名为I型)具有大尺寸的基因和酶，使这些基因/蛋白的基因操控和体外研究变得复杂化。
基因簇DNA可以从不同的生物体分离并被连接进载体，特别是含表达调节序列的载体，表达调节序列可以控制和调节可检测蛋白的产生或来自连接的基因簇的蛋白相关排列活性。可进行外源DNA引导的能力异常大的载体特别适合于这种基因簇，并在这里通过实例的方式进行描述，包括大肠杆菌的f-因子(或致育因子)。此大肠杆菌的f-因子是质粒，它在结合过程中影响其自身的高频转运，对于完成和稳定地繁殖大的DNA片段，如来自混合微生物样本的基因簇，是理想的。特别优选的实施方案使用克隆载体，称作含F因子嗜菌粒(“fosmids”)或细菌人工染色体(BAC)载体。衍生自大肠杆菌的f-因子的载体能够稳定地整合基因组DNA的大片段。当与来自混合的未培养环境样本的DNA整合时，可能以稳定的“环境DNA文库”的形式获得大基因组片段。另一类型用于本发明的载体是粘粒载体。粘粒载体最初是设计来克隆和繁殖基因组DNA的大片段。克隆进粘粒载体详细描述于Sambrook等人，分子克隆实验室指南，第二版，Cold Spring HarborLaboratory Press(1989)。一旦连接进合适的载体，两个或多个含不同聚酮合成酶基因簇的载体可以被导入适合的宿主细胞。基因簇共有的部分序列同源区域会促进引起序列重组的过程，导致产生杂交基因簇。然后，新的杂交基因簇被筛选在原始基因群中没有发现的增强活性。
因此，在一个实施方案中，本发明涉及一种方法，用于产生一种生物学活性的杂交多肽，并通过以下步骤筛选具有增强活性的这种多肽1)将在可操作连接中的至少第一个多核苷酸和可操作连接中的第二个多核苷酸引入至合适的宿主细胞中，所述的至少第一个多核苷酸和第二个多核苷酸共享至少一个部分序列同源性的区域。
2)在促进序列重组的条件下培养宿主细胞，产生可操作连接中的杂交多核苷酸；3)表达由杂交的多核苷酸编码的杂交多肽；4)在促进鉴定增强的生物学活性的条件下筛选杂交多肽；和5)分离编码杂交多肽的多核苷酸。
筛选各种酶活性的方法为本领域的专业技术人员已知，并通过本说明书进行讨论。当分离本发明的多肽和多核苷酸时，可应用这些方法。
作为可使用的表达载体的代表性实例，可能提到病毒颗粒，杆状病毒，噬菌体，质粒，噬菌粒，粘粒，含F因子嗜菌粒(fosmids)，细菌人工染色体，病毒DNA(如牛痘，腺病毒，禽痘病毒，假狂犬病和SV40的衍生体)，P1-为基础的人工染色体，酵母质粒，酵母人工染色体，和对特殊目标宿主特异的任何其他载体(如杆菌，曲霉菌和酵母)。因此，例如，DNA可包含在表达多肽的各种表达载体中的任何一种中。这样的载体包括染色体的，非染色体的和合成的DNA序列。大量的合适载体是本领域专业技术人员已知的，并可从商业渠道获得。下面提供了载体的实例；细菌的pQE载体(Qiagen)，pBluescript质粒，pNH载体，(λ-ZAP载体(Stratagene)；ptrc99a，pKK223-3，pDR540，pRIT2T(Pharmacia)；真核的pXT1，pSG5(Stratagene)，pSVK3，pBPV，pMSG，pSVLSV40(Pharmacia)。但是，可以使用任何其他的质粒或其他的载体，只要它们在宿主中是可复制的和有活力的。低拷贝数或高拷贝数的载体可在本发明中应用。
表达载体中的DNA序列可操作地与合适的表达控制序列(启动子)连接以引导RNA合成。特殊命名的细菌启动子包括lacI，lacZ，T3，T7，gpt，λPR，PL和trp。真核细胞启动子包括CMV立即早期，HSV胸苷激酶，早期和晚期SV40，来自逆转录酶病毒的LTRs，和小鼠金属硫蛋白-I。合适载体和启动子的选择很容易地包含在本领域普通专业技术人员水平之内。表达载体也含有一个翻译起始的核糖体结合位点和一个转录终止子。载体也可包含扩增表达的合适序列。启动子区可采用氯霉素转移酶(CAT)载体或其他含有选择性标记物的载体从任何所需的基因中选择出来。另外，表达载体优选含有一个或多个选择性标记物基因以便为选择转化宿主细胞提供显型特征，如为真核细胞培养使用的二氢叶酸还原酶或新霉素抗性，或如在大肠杆菌中使用的四环素或氨苄青霉素抗性。
体内重配集中在总称为“重组”的“分子间”过程，在细菌中一般被认为是“RecA依赖”的现象。本发明可以依靠宿主细胞的重组过程来重组和重配序列，或是依靠细胞介导简化过程的能力来通过删除作用减少细胞中类似重复序列的复杂性。“简化重配”过程可通过“分子内的”RecA不依赖过程而发生。
因此，在本发明的另一个方面，通过简化重配的过程可以产生新的多核苷酸。该法涉及产生含有连续序列(原始编码序列)的构建物，将它们插入至一个合适的载体中，随后引导它们进入一个合适的宿主细胞中。单个分子同一性的重配通过具有同源区的构建物中的连续序列之间，或类似重复单位之间的组合过程而发生。重配过程重组和/或减少了重复序列的复杂性和程度，导致产生新的分子种类。可采用各种处理方法来增强重配的速度。这些方法可包括用紫外光，或破坏DNA的化学物质处理，和/或使用显示“基因不稳定性”水平增强的宿主细胞系。因此重配过程可涉及同源性重组或类似重复序列的天然特性以控制其自身的进化。
重复的或“准重复的”序列在基因不稳定性中具有作用。在本发明中，“准重复”是不限于其原始单位结构的重复。准重复单位可以表现为构建物中的序列阵列；相似序列的连续单位。一旦交连后，连续序列之间的连接基本上消失了，得到的构建物的类似重复特性在分子水平上现在是连续的。细胞为减少所得构建物的复杂性而进行的删除过程在准重复序列之间进行。准重复单位提供了实际上无限的模板集合，在其上可发生滑动现象。含有准重复区的构建物因此可有效地提供足够的分子灵活性，使删除作用(和潜在的插入作用)可实际上地发生在准重复单位内的任何地方。
当准重复序列都以同一方向交连时，例如从头至尾，或反之，细胞不能区分单个的单位。因此，简化过程可发生在序列全程中。相反，例如当单位以头至头而不是头至尾的形式出现时，倒位可描绘出邻近单位的终点，使得缺失的形成将倾向于丢失不连续单位。因此，本方法优选序列处于同一方向。准重复序列的随机方向将导致丧失重排效率，而序列方向一致将提供最高的效率。但是，当在同一方向中含有较少的邻近序列而降低效率时，对新分子的有效回收仍可提供足够的灵活性。可在同一方向上用准重复序列制备构建物以获得更高的效率。
序列可以头至尾的方向采用任何方法来进行装配，包括下列方法a)当制备的单链可提供方向时，可使用包括聚腺苷酸头部和聚胸腺嘧啶核苷酸尾部的引物。这是通过具有从RNA制备的引物的前几个碱基而实现，因此可很容易的去除RNAseH。
b)可使用含有独特限制性切割位点的引物。将需要多个位点，一组独特序列，和重复的合成和连接步骤。
c)引物的内部几个碱基可以是硫醇盐的和用来产生正确带尾分子的核酸外切酶。
重配序列的回收依赖于用简化重复指数(RI)鉴定克隆载体。然后重排编码序列可通过扩增来回收。产物被再克隆和表达。用简化RI回收克隆载体可受以下因素影响1)仅在构建物复杂性降低时可稳定地维持载体的使用。
2)通过物理步骤物理性回收缩短的载体。在此情况下，采用标准的质粒分离步骤，和在琼脂糖凝胶或采用标准步骤切去低分子量的柱上进行大小分馏，将会回收克隆载体。
3)含有中断基因的载体的回收，其中的基因在插入大小减少时被选择。
4)采用使用表达载体以及适当的选择的直接选择技术。
来自相关生物体的编码序列(例如，基因)可显示高度的同源性，并编码十分不同的蛋白产物。这些类型的序列在本发明中特别地用作准重复序列。但是，当下面所描述的实例证实几乎相同的原始编码序列(准重复)的重配时，这个过程并不限于这样的几乎相同的重复序列。
下面的实例说明了本发明的一种方法。描述了来自三个独特种属的编码核酸序列(准重复序列)。每个序列编码一个具有不同特性组的蛋白。每个序列在序列的独特位点上有单个或几个碱基对不同。准重复序列被单独或共同扩增，并连接进任意的装配物中，这样在连接的分子群中具有所有可能的排列组合。准重复序列的数目可通过装配的条件控制。在一个构建物中准重复单位的平均数目被定义为重复指数(RI)。
一旦形成，构建物可以在琼脂糖凝胶上根据公开的协议进行或不进行大小分馏，插入进一个克隆载体，并转染进一个合适的宿主细胞中。然后细胞被繁殖，“简化重配”起作用了。如果需要，简化重配过程的速度可通过引入DNA损害来加速。RI的减少是通过在重复序列之间的缺失形成以“分子内”机制介导的，还是以“分子间”机制通过重组样事件来介导的并不重要。最终的结果是分子的重配进入所有可能的组合中。
任选地，这种方法包括筛选改组池的文库成员的其他步骤以便鉴定单个的改组文库成员，该成员具有与预先确定的大分子结合或相反与之相互作用，或催化与其的特殊反应(例如，如酶的催化结构域)的能力，所述的大分子例如蛋白质受体，寡糖，病毒颗粒(viron)，或其他预先确定的化合物或结构。
从这种文库中鉴定的多肽可用于治疗，诊断，研究和相关的目的(如催化剂，增加一种水溶液摩尔渗透压浓度的溶质，和类似物)，和/或可以进行一个或多个循环的改组和/或选择。
在另一个方面，可以想象到，重组或重配之前或期间，由本发明方法产生的多核苷酸可接触促进突变体导入原始多核苷酸中的试剂或过程。这种突变体的导入将增加所产生的杂交多核苷酸和编码它的多肽的多样性。促进诱变的试剂或过程包括但不限于(+)-CC-1065，或一个合成类似物如(+)-CC-1065-(N3-腺嘌呤(见Sun和Hurley，(1992)；能够抑制DNA合成的N-乙酰化或去乙酰化4′-氟-4-氨基联苯加合物(例如参见van de Poll等人(1992))；或能够抑制DNA合成的N-乙酰化或去乙酰化4-氨基联苯加合物(也见，van de Poll等人(1992)，751-758页)；三价铬，三价铬盐，能够抑制DNA复制的多环芳香烃(PAH)DNA加合物，如7-溴甲基-苯[a]蒽(“BMA”)，三(2，3-二溴丙基)磷酸盐(“Tris-BP”)，1，2-二溴-3-氯丙烷(“DBCP”)，2-溴丙稀醛(2BA)，苯[a]芘-7，8-二氢二酚-9-10-环氧化物(“BPDE”)，铂(II)卤素盐，N-羟基-2-氨基-3-甲基咪唑[4，5-f]-喹啉(“N-羟基-IQ”)，和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4，5-f]-吡啶(“N-羟基-PhIP”)。延缓或中止PCR扩增的特别优选的手段包括紫外光(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)。特殊包含的手段是DNA加合物或含有来自多核苷酸或多核苷酸池中的DNA加合物的多核苷酸，它们可通过包括在进一步处理前加热含有多核苷酸的溶液的过程而被释放或去除。
在另一个方面，本发明涉及一种方法，用于在根据本发明为产生杂交或重配多核苷酸所提供的条件下，通过处理一个含有编码野生型蛋白的双链模板多核苷酸而产生具有生物活性的重组蛋白。
本发明也提供了使用专利密码子引物(含有一个简并的N，N，N序列)在多核苷酸中导入点突变，以便产生一组后代多肽，其中在每个氨基酸位点上都表现有全范围的单氨基酸替代(基因位点饱和诱变(GSSM))。所使用的寡链包含有连续的首个同源序列，一个简并的N，N，N序列和优选但不是必须的第二条同源序列。使用这样的寡链得到的下游后代翻译产物包括所有可能的沿多肽的每个氨基酸位点上的氨基酸改变，这是因为N，N，N序列的简并性包括所有20个氨基酸的密码子。
在一个方面，一个这样的简并寡链(包括一个简并的N，N，N盒)用来将每个亲代多核苷酸模板中的初始密码子进行全长的密码子替代。在另一个方面，使用至少两个简并的N，N，N盒-在同一个寡链中，或不再同一个寡链中，将亲代多核苷酸模板中的至少两个初始密码子进行全长的密码子替代。因此，一个以上的N，N，N序列可包含在一个寡链中以便在一个以上的位点上引入氨基酸突变。这种多个N，N，N序列可以是直接连续的，或通过一个或多个其他的核苷酸序列分离的。在另一个方面，适用于引入加入和删除的寡链可单独使用或与含有N，N，N序列的密码子联合使用，以便引入任何排列或组合的氨基酸加入，删除和/或替代。
在一个特殊的范例中，可能同时采用一个寡链来诱变两个或更多的邻近的氨基酸位点，该寡链含有相连的N，N，N三联体，即简并的(N，N，N)n序列。
在另一个方面，本发明提供了使用具有比N，N，N序列的简并性更小的简并盒。例如，需要在一些情况下使用(如在一个寡链中)一个仅含有一个N的简并三联体序列，其中所述的N可位于三联体的第一个，第二个或第三个位点上。任何其他包含任何排列组合的碱基可用在三联体的剩余两个位点上。可以选择的是，在有些情况下可使用(如在一个寡链中)一个简并的N，N，N三联体序列，N，N，G/T，或一个N，N，G/C三联体序列。
但可以理解的是，在本发明中公开的简并三联体(如N，N，G/T或N，N，G/C三联体序列)的使用由于数个原因是有益的。在一个方面，本发明提供了一种手段来系统地和相当容易地在一个多肽中的每个和任意一个氨基酸位点中产生可能的氨基酸的全长替代(总共为20个氨基酸)。因此，对于100个氨基酸的多肽，本发明提供了一种方法，可系统地和相当容易地产生2000个不同的种类(即，每个位点20个可能的氨基酸乘100个氨基酸位点)。可以理解的是通过使用含有简并N，N，G/T或N，N，G/C三联体序列的寡链，提供了32个单独的序列，可编码20个可能的氨基酸。因此，在一个反应容器内，其中亲代多核苷酸序列采用一个这样的寡链进行饱和诱变，产生了32个不同的编码20个不同多肽的后代多核苷酸。相比，在定点诱变中使用非简并寡链仅可导致在每个反应容器中产生一个后代多肽产物。
本发明也提供了非简并寡链的使用，可以任选地与公开的简并引物联合使用。可以理解的是在一些情况下，使用非简并寡链来在一个工作多核苷酸中产生特异的点突变是有益的。这提供了一种方法，来产生特异的沉默点突变，可引起相应氨基酸改变的点突变，和引起产生终止密码子和相应多肽片段表达的点突变。
因此，在本发明的一个优选实施方案中，每个饱和诱变反应容器中含有编码至少20个后代多肽分子的多核苷酸，因此所有20个氨基酸都可表现在与亲代多核苷酸中诱变的密码子位置对应的一个特异氨基酸位点上。从每个饱和诱变反应容器中产生的32倍简并后代多肽可进行克隆扩增(如采用一个表达载体克隆进一个合适的大肠杆菌宿主中)，并进行表达筛选。当一个单独的后代多肽通过筛选被鉴定，显示在属性上发生有益的改变时(当与亲代多肽比较时)，它可被测序以鉴定包含在其中的相应有益的氨基酸替代。
可以理解的是在诱变过程中，如在此所公开的，在亲代多肽中采用饱和诱变的每一个和任一个氨基酸位点，有益的氨基酸改变均可在一个以上的氨基酸位点上被鉴定。可产生一个或更多的新的后代分子，含有所有或部分这些有益的氨基酸替代的组合。例如，如果2个特殊的有益的氨基酸改变在一个多肽中的3个氨基酸位点的每一个中都被鉴定出来，则在每个位点(与原始的氨基酸无变化，两种有益的改变各一个)和3个位点上的排列包括3种可能性。因此，有3×3×3或总共27种可能性，包括7种以前检测过的-6个单一的点突变(即，在3个位点的每一个上有两个)和在任何位点上没有改变。
仍然在另一个方面，位点饱和诱变可与改组，嵌合，重组和其他诱变过程连同筛选一起应用。本发明提供了以重复的方式应用任何诱变过程，包括饱和诱变。在一个范例中，任何诱变过程可与筛选一起组合来反复应用。
因此，在一个非限制性的范例中，本发明提供了与其他诱变过程组合的饱和诱变的应用，如这样的过程，即其中两个或多个相关的多核苷酸被导入进一个合适的宿主中，以便可通过重组和简化重配产生杂交多核苷酸。
为了沿整个基因序列进行诱变，本发明提供了诱变可用来替代多核苷酸序列中的许多碱基中每一个碱基，其中要诱变的碱基数目优选是从15至100,000的每一个个整数。因此可对每一个或不同数目的碱基(优选亚群总数从15至100,000)进行诱变，而不是沿着一个分子诱变每一个位点。优选地，一个单独的核苷酸用来诱变每个位点或沿多核苷酸序列的每组位点诱变。要诱变的一组3个位点可以是一个密码子。突变可优选采用诱变引物来引入，含有一个异源性盒，也被称为是一个诱变盒。优选的盒具有1至500个碱基。在这样的异源性盒中每个核苷酸位点可以是N，A，C，G，T，A/C，A/G，A/G，C/G，C/T，G/T，C/G/T，A/G/T，A/C/T，A/C/G，或E，其中E是任何碱基，不是A，C，G或T(E可被作为一个设计寡链)。
通常来说，饱和诱变包括在要被突变的特定多核苷酸序列中(其中要被突变的序列优选长度为大约15至100,000个碱基)诱变一整组诱变盒(其中每个盒优选大约1-500碱基长度)。因此，一组突变(范围是从1至100个突变)可被引入至要被突变的盒中。在应用一轮饱和诱变的过程中，要被引入至一个盒中的一组突变可以是与要被引入至第二个盒中的第二组突变不同或相同的。这种定组的实例是删除，加入，特殊密码子的定组，和特殊核苷酸盒的定组。
要突变的特定序列包括一整条基因，通路，cDNA，一整个开放可读框(ORF)，和整个启动子，增强子，阻遏物/超激活物，复制起点，内含子，操纵子，或任何多核苷酸功能基团。通常，为此目的而“确定的序列”可以是任何多核苷酸，它是一个15个碱基的多核苷酸序列，和长度为15个碱基和15,000个碱基之间的多核苷酸序列(本发明特别地命名两者之间的每一个整数)。选择密码子分组时的考虑包括由简并诱变盒编码的氨基酸类型。
在一个特别优选的范例中，可被引入至一个诱变盒中的一组突变中，本发明特别提供了编码每个位点上2，3，4，5，6，7，8，9，10，11，12，13，14，15，16，17，18，19，和20个氨基酸的简并密码子替代(采用简并寡链)，和一个被它们编码的多肽文库。
本发明的一个方面是一个分离的核酸，它包含了A组核酸序列和基本上与它们一致的序列中的一个序列，与其互补的序列，或含有A组核酸序列(或其互补序列)其中之一的至少10，15，20，25，30，35，40，50，75，100，150，200，300，400，或500个连续碱基的片段。分离的核酸可包含DNA，包括cDNA，基因组DNA，和合成DNA。DNA可以是双链或单链，如果是单链，可以是编码链或非编码(反义)链。可选择地，分离的核酸可包含RNA。
如在下面更详细讨论的，A组核酸序列之一的分离核酸，和基本上与它们一致的序列，可被用来制备B组氨基酸序列和基本上与它们一致的序列的多肽的其中之一，或含有B组氨基酸序列的其中一个多肽的至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段，和基本上与它们一致的序列。
因此，本发明的另一个方面是一个分离的核酸，它编码B组氨基酸序列和基本上与它们一致的序列的其中一个多肽，或含有B组氨基酸序列的其中一个多肽的至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段。作为基因编码冗余或简并的结果，这些核酸的编码序列与A组核酸序列的其中一个核酸的编码序列之一，或其片段相同，或可能是不同的编码序列，它们编码B组氨基酸序列和基本上与它们一致的序列的其中一个多肽，和含有B组氨基酸序列的其中一个多肽的至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段。基因的编码可被本领域的专业技术人员所熟知，并获得，例如在B.Lewin，Genes VI第214页，牛津大学出版社，1997，其公开的内容在此加入作为参考。
编码B组氨基酸序列的其中一个多肽，和基本上与它们一致的序列的分离核酸，可包括但不限于仅A组核酸序列之一的编码序列，和基本上与它们一致的序列，和其他的编码序列，如前导序列或蛋白原序列，和非编码序列如内含子或编码序列的5’和/或3’端非编码序列。因此，如在此所使用的，术语“编码多肽的多核苷酸”包括仅含有多肽编码序列的多核苷酸，以及包含其他编码和/或非编码序列的多核苷酸。
可选择地，A组核酸序列的核酸序列，和基本上与它们一致的序列，可采用常规的技术进行诱变，如定点诱变，或其他对本领域专业技术人员所熟悉的技术，将沉默性变化引入至A组核酸序列和基本上与它们一致的序列中的多核苷酸中。如在此所使用的，“沉默性变化”包括，例如，不改变由多核苷酸编码的氨基酸序列的变化。需要这样的变化以便通过引入在宿主生物体内经常发生的密码子或密码子对，来增加宿主细胞产生的多肽水平，该宿主细胞中含有编码多肽的载体。
本发明也涉及了含有核苷酸变化的多核苷酸，这种变化在B组氨基酸序列和基本上与它们一致的序列的多肽中产生了氨基酸替代，删除，融合和截断。这样的核苷酸变化可采用常规的技术来引入，如定点诱变，随机化学诱变，核酸外切酶III删除，和其他重组DNA技术。可选择地，这样的核苷酸变化可以是天然存在的等位基因变异，可在此所提供的高度、中度和低度严格性下，通过鉴别与探针特异性杂交的核酸而分离出来，该探针含有A组核酸序列的其中一个序列的至少10，15，20，25，30，35，40，50，75，100，150，200，300，400，或500个连续碱基，和基本上与它们一致的序列(或其互补序列)。
A组核酸序列的分离核酸，和基本上与它们一致的序列，其互补序列，或含有A组核酸序列的其中一个序列的至少10，15，20，25，30，35，40，50，75，100，150，200，300，400，或500个连续碱基的片段，和基本上与它们一致的序列，或其互补序列也可用作探针来确定一个生物样品，如一个土样，是否含有具有本发明的核酸序列的生物体，或获取核酸的生物体。在这样的方法中，获取可能潜藏了生物体的生物样品，从该生物体中可分离核酸，并从样品中获得核酸。核酸可在允许探针与存在其中的任何互补序列特异性杂交的条件下与探针接触。
当需要时，允许探针与互补序列特异性杂交的条件，可通过将探针与从已知含有互补序列的样品中的互补序列，以及不含有互补序列的对照序列接触而确定。杂交条件，如杂交缓冲液的盐浓度，杂交缓冲液的甲酰胺浓度，可进行变化以确定允许探针与互补核酸特异性杂交的条件。
如果样品含有可分离出核酸的生物体，就接着检测探针的特异杂交。通过使用可检测的试剂如放射性同位素，荧光染料或能够催化形成可检测产物的酶标记探针，可对杂交作用进行检测。
采用标记的探针检测样品中互补核酸存在的许多方法是本领域专业技术人员所熟悉的。这些方法包括Southern印迹，Northern印迹，菌落杂交法，和点印迹。每一种这些方法的步骤在Ausubel等人，分子生物学现代方法，John Wiley 503 Sons公司(1997)和Sambrook等人，分子克隆实验室手册，第二版，Cold Spring Harbor Laboratory Press(1989)中被提供，这些文献的整个公开内容在此引用作为参考。
可选择地，一个以上的探针(其中至少一个能够特异地与存在于核酸样品中的任何互补序列杂交)，可在扩增反应中使用，以确定样品中是否含有生物体，该生物体含有本发明的核酸序列(如，可分离出核酸的生物体)。典型地，探针含有寡核苷酸。在一个实施方案中，扩增反应包含PCR反应。PCR法描述在前面Ausubel和Sambrook的文献中。可选择地，扩增可包含连接酶链式反应，3SR，或链置换反应。(见Barany，F.，“PCR世界中的连接酶链式反应”，PCR Methods and Applications15-16，1991；E.Fahy等人，“自身不变的序列复制(3SR)可替代PCR的等温转录为基础的扩增”，PCR Methods and Applications125-33，1991；和Walker G.T.等人，“链置换扩增-一种等温的体外DNA扩增技术”，Nucleic Acid Research201691-1696，1992，其中公开的内容在此全部引用作为参考)。在这些方法中，样品中的核酸与探针接触，进行扩增反应，并检测任何得到的扩增产物。扩增产物的检测可通过在反应产物上进行凝胶电泳，并用interculator如嗅乙啡啶对凝胶染色。可选择地，一个或多个探针可用放射线同位素标记，放射性扩增产物的存在可通过凝胶电泳后的放射自显影检测到。
来自A组核酸序列末端附近的序列和基本上与它们一致的序列的探针也可用在染色体步移法中，以鉴定含有基因组序列的克隆，该序列的位置邻近A组核酸序列和基本上与它们一致的序列附近。这种方法可分离编码来自宿主机体的其他蛋白质的基因。
A组核酸序列的分离核酸，和基本上与它们一致的序列，其互补序列，或含有A组核酸序列的其中一个序列的至少10，15，20，25，30，35，40，50，75，100，150，200，300，400，或500个连续碱基的片段，和基本上与它们一致的序列，或其互补序列可用作探针来鉴定和分离相关的核酸。在一些实施方案中，相关的核酸可以是来自生物体的cDNA或基因组DNA而不是来自分离出核酸的生物体。例如，其他的生物体可以是相关的生物体。在这些方法中，核酸样品与探针在可允许探针与相关序列特异杂交的条件下接触。然后采用上述的任何一种方法来检测探针与来自相关生物体的核酸的杂交。
在核酸杂交反应中，根据被杂交的核酸的特性，用来达到特殊严格性水平的条件可发生变化。例如，可在选择杂交条件时考虑核酸杂交区的长度，互补程度，核酸序列成分(如GC相对AT的含量)，和核酸的类型(如RNA对DNA)。其他的考虑是一种核酸是否被固定，例如，固定在滤膜上。
杂交可在低度严格性，中度严格性或高度严格性下进行。如核酸杂交的一个实例，含有固定变性核酸的聚合膜首先在含有0.9M NaCl，50mM NaH2PO4，pH7.0，5.0mM Na2EDTA，0.5％ SDS，10X Denhardt’s，和0.5mg/ml聚核糖腺苷酸的溶液中在45℃下预杂交30分钟。然后向该溶液中加入大约2×107cpm(比活性为4-9×108cpm/μg)的32P末端标记的寡核苷酸探针。孵育12-16小时后，膜在室温下在含有0.5％ SDS的1X SET(150mM NaCl，20mM Tris氢氯化物，pH7.8，1mM Na2EDTA)中冲洗30分钟，然后在新鲜的1X SET中在Tm-10℃下冲洗30分钟去掉寡核苷酸探针。然后将膜暴露在放射自显影胶片上检测杂交信号。
通过改变用来鉴定与可检测的探针杂交的核酸如cDNA或基因组DNA的杂交条件的严格性，可以鉴定并分离与探针具有不同水平同源性的核酸。通过在探针解链温度以下的温度变化进行杂交可改变严格性。解链温度，Tm是50％靶序列完全与互补的探针杂交时的温度(在已确定的离子强度和pH下)。对于特殊的探针可选择与Tm相同或比Tm低大约5℃的非常严格条件。探针的解链温度可采用下列的公式计算
对于长度在14到70个核苷酸的探针，解链温度(Tm)可采用下列的公式计算Tm＝81.5+16.6(log[Na+])+0.41(G部分+C)-(600/N)，其中N是探针的长度。
如果杂交是在含有甲酰胺的溶液中进行的，解链温度可采用如下方程来计算Tm＝81.5+16.6(log[Na+])+0.41(G部分+C)-(0.63％甲酰胺)-(600/N)，其中N是探针的长度。
预杂交可在6X SSC，5K Denhardt′s试剂，0.5％ SDS，100μg变性的片段鲑精DNA或6X SSC，5X Denhardt′s试剂，0.5％ SDS，100μg变性的片段鲑精DNA，50％甲酰胺中进行。SSC和Denhardt’s溶液的公式列在前面Sambrook等人的文献中。
通过向上面所列的预杂交溶液中加入可检测的探针进行杂交。当探针含有双链DNA时，它在加入至杂交溶液前被变性。滤膜与杂交溶液接触足够的时间以便让探针与含有与其互补的或同源的序列的cDNA或基因组DNA杂交。对于长度在200个以上核苷酸的探针，杂交在Tm下15-25℃进行。对于更短的探针，如寡核苷酸探针，杂交可在Tm下5-10℃进行。典型地，为了在6X SS中杂交，杂交作用在大约68℃下进行。通常，为在含有50％甲酰胺的溶液中进行杂交，杂交作用在大约42℃进行。
所有前面的杂交作用将可考虑在高度严格性的条件下。
在杂交后，冲洗滤膜取出任何非特异性结合的可检测探针。用来冲洗滤膜的严格性也可根据被杂交的核酸特性，杂交核酸的长度，互补的程度，核酸序列的成分(如，GC相对AT的含量)，和核酸类型(如RNA对DNA)来变化。逐渐增高的更高严格性冲洗条件的实例如下2X SSC，0.1％ SDS室温下15分钟(低度严格性)；0.1X SSC，0.5％ SDS室温下30分钟至1小时(中度严格性)；0.1X SSC，0.5％ SDS在杂交温度和68℃之间15至30分钟(高度严格性)；和0.15M NaCl在72℃下15分钟(非常高的严格性)。最终的低度严格性冲洗可在0.1X SSC中在室温下进行。上述的实例仅是对一组用来冲洗滤膜的条件进行的例证性描述。本领域的专业技术人员可了解，对于不同严格性的冲洗有大量的方案。一些其他的实例如下。
与探针已经杂交的核酸通过放射自显影或其他常规的技术进行鉴定。
上述方法可被修饰以鉴定与探针序列的同源性水平降低的核酸。例如，为获得与可检测的探针同源性降低的核酸，可使用严格性较低的条件。例如，杂交温度可在含有大约为1M Na+浓度的杂交缓冲液中从68℃至42℃以5℃的增量被降低。在杂交后，滤膜在杂交温度下用2X SSC，0.5％ SDS冲洗。这些条件可被认为50℃以上为“中度”条件，50℃以下为“低度”条件。“中度”杂交条件的特殊实例是当上述的杂交在55℃进行时。“低度严格性”杂交条件的特殊实例是当上述杂交在45℃进行时。
可选择地，杂交在缓冲液中，如6X SSC，含有甲酰胺，在42℃进行。在这种情况下，在杂交缓冲液中的甲酰胺浓度可从50％至0％以5％的增量被减少，以鉴定含有与探针同源性水平降低的克隆。在杂交后，滤膜用6X SSC，0.5％ SDS在50℃下冲洗。这些条件被认为是25％甲酰胺以上为“中度”条件，25％甲酰胺以下为“低度”条件。“中度”杂交条件的特殊实例是当上述杂交在30％甲酰胺中进行时。“低度严格性的”杂交条件的一个特殊实例是上述杂交在10％甲酰胺中进行时。
例如，前面的方法用来分离含有与选自下列组别的核酸序列具有至少大约97％，至少95％，至少90％，至少85％，至少80％，至少75％，至少70％，至少65％，至少60％，至少55％或至少50％同源性的序列的核酸，上述的组别包括A组核酸序列和基本上与它们一致的序列的其中一个序列，或含有其至少大约10，15，20，25，30，35，40，50，75，100，150，200，300，400，或500个连续碱基的片段，和与其互补的序列。同源性可采用对准算法来测定。例如，同源的多核苷酸含有一个编码序列，它是在此所述的编码序列之一的天然存在的等位基因变异体。当与A组核酸序列的核酸或与其互补的序列比较时，这种等位基因变异体具有一个或多个核苷酸的替代，删除或添加。
可选择地，上述方法可用来分离编码多肽的核酸，该多肽经序列对比算法(如FASTA 3.0t78版算法采用缺省参数)确定含有与一种多肽具有至少大约99％，95％，至少90％，至少85％，至少80％，至少75％，至少70％，至少65％，至少60％，至少55％或至少50％的同源性，后者多肽含有B组氨基酸序列和基本上与它们一致的序列其中之一的序列，或包含其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段。
本发明的另一个方面是一个分离的或纯化的多肽，其含有A组核酸序列和基本上与它们一致的序列的其中一个序列，或含有其中至少大约5，10，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段。如上所述，这种多肽可通过将编码多肽的核酸插入到一个载体中而获得，因此编码序列可操作性地与能驱动编码多肽在一个合适的宿主细胞中表达的序列连接。例如，表达载体可包含一个启动子，一个翻译起始的核糖体结合位点，和一个转录终止子。载体也可包括扩增表达的合适序列。
适合在细菌中表达多肽或其片段的启动子包括大肠杆菌lac或trp启动子，lacI启动子，lacZ启动子，T3启动子，T7启动子，gpt启动子，λPR启动子，λPL启动子，来自编码糖酵解酶如3-磷酸甘油酸激酶(PGK)的操纵子的启动子，和酸性磷酸酶启动子。真菌启动子包括因子启动子。真核启动子包括CMV立即早期启动子，HSV胸苷激酶启动子，热休克启动子，早期和晚期SV40启动子，来自逆转录病毒的LTRs和小鼠金属硫蛋白-I启动子。也可使用其他已知可在原核或真核细胞中控制基因表达的启动子或其病毒。
哺乳动物表达载体也包含复制起点，任何需要的核糖体结合位点，聚腺苷酸化位点，剪接的供体和受体位点，转录终止序列，和5’侧翼非转录序列。在一些实施方案中，来自SV40剪接和聚腺苷酸化位点的DNA序列可用来提供所需的非转录基因元件。
在真核细胞中表达多肽或其片段的载体也含有增加表达水平的增强子。增强子是DNA的顺式作用元件，一般长度为大约10至大约300bp，可作用于启动子以增强其转录。实例包括在复制起点后侧100至270bp的SV40增强子，巨细胞病毒早期启动子增强子，在复制起点后侧上的多形瘤增强子，以及腺病毒增强子。
另外，表达载体一般含有一个或多个选择性标记物基因以便可以筛选含有载体的宿主细胞。这样的选择性标记物包括编码二氢叶酸还原酶的基因或被在真核细胞培养中赋予了新霉素抗性的基因，在大肠肝菌中赋予了四环素或氨苄青霉素抗性的基因，和酿酒酵母TRP1基因。
表达文库已经产生后，可以在通过细胞分选之前包括另一个“生物淘选”的步骤。“生物淘选”步骤是指一个通过在克隆的文库中筛选序列同源性来鉴定含有特定生物学活性的克隆的过程，该克隆文库是如下制备的(i)选择性从来自至少一个微生物体的DNA中通过使用至少一个探针DNA分离靶DNA，该探针DNA含有编码一个具有特定生物活性的生物学蛋白的DNA序列的至少一部分；和(ii)任选地使用已分离的靶DNA转化宿主产生用来筛选特定生物活性的克隆文库。
用来选择性的从来自至少一个微生物的DNA中分离目标靶DNA的探针可以是一个已知活性酶DNA的全长编码区序列或部分编码区序列。原始的DNA文库可优选使用探针混合物来探测，该混合物中含有至少一部分编码具有特定酶活性的酶的DNA序列。这些探针或探针文库优选是单链，且被探测的微生物DNA优选地已经被转换成为单链形式。特别合适的探针来自编码具有与被筛选的特定酶活性相似或相同活性的酶的DNA。
探针DNA应该是至少大约10个碱基，并优选至少15个碱基。在一个实施方案中，全部编码区可用作探针。杂交条件可设计为可提供至少大约50％序列同一性的杂交严格性，更特别地是为至少大约70％序列同一性提供严格性，在该条件中，靶DNA选择性的通过使用至少一个DNA探针来分离。
在核酸杂交反应中，用来达到特殊严格性水平的条件将依靠被杂交的核酸特性而变化。例如，核酸杂交区的长度，互补程度，核酸序列成分(如，GC相对AT的含量)，核酸类型(如RNA对DNA)可在选择杂交条件时被考虑。其他的考虑是，例如其中一个核酸是否被固定在滤膜上。
逐渐增加的更高的严格条件的实例如下在大约室温下2xSSC/0.1％ SDS(杂交条件)；在大约室温下0.2x SSC/0.1％ SDS(低度严格条件)；在大约42℃下0.2x SSC/0.1％ SDS(中度严格条件)；和在大约68℃下0.1x SSC(高度严格条件)。仅采用这些条件中的一种进行冲洗，如高度严格条件，或可采用每一种条件，如以上述所列的顺序每一个进行10-15分钟，重复任一个或所有的所列步骤。但是，如上所述，最佳的条件将根据涉及的特定杂交反应而变化，并可通过经验来确定。
探测微生物DNA文库以分离潜在的目的靶DNA的杂交技术在本领域中是为人熟知的，在文献中所描述的任何一个均适合在此使用，特别是那些采用固相结合的，直接或间接结合的，便于从微生物DNA剩余物中分离的探针DNA。
优选地探针DNA用特异结合对(即配体)的一个伴侣“标记”，结合对的另一个伴侣则结合在固体基质上以便从其来源中很方便的分离靶标。配体和特异的结合伴侣可以任何一个方面，选自以下(1)抗原或半抗原和与其结合的抗体或特异结合片段，(2)生物素或亚氨生物素和亲和素或抗生蛋白链菌素；(3)糖和其特异的凝集素；(4)酶和其抑制剂；(5)脱辅基酶和辅因子，(6)互补的同聚寡核苷酸；和(7)激素和其受体。固相优选地选自(1)玻璃或聚合物表面；(2)聚合珠的包裹柱；和(3)磁性和顺磁颗粒。
此外，任选地但期望的是，对已经分离的靶DNA进行扩增。在本实施方案中靶DNA是在分离后从探针DNA中分离的。然后在被用来转化宿主前被扩增。选择包含有预先确定的DNA序列至少一部分的双链DNA可被变为单链，进行扩增，并重新退火以提供已扩增数目的选择双链DNA。大量的扩增方法学在本领域中现在是为人熟知的。
选择的DNA然后通过转化合适的生物体来制备筛选的文库。宿主，特别是那些在此特别地被鉴定的宿主是优选的，在益于进行这种转化的条件下通过接种人为地引入含有靶DNA的载体而被转化。
得到的转化克隆的文库然后被筛选以寻找显示有目的酶活性的克隆。
已经制备了选择性地从一个生物体中分离的DNA中的多种克隆，这些克隆被筛选特异的酶活性，并鉴定具有特异酶特性的克隆。
酶活性的筛选可作用在单个表达克隆上，或最初作用在表达克隆的混合物上以确定混合物是否具有一个或多种特异的酶活性。如果混合物具有特异的酶活性，则单个克隆被使用FACS仪器再次筛选这种酶活性或更多的特异活性。可选择地，包裹技术如凝胶微滴，可用来将多个克隆定位在一个位置上，以便在FACS仪器上在一组克隆中被筛选阳性表达克隆，该组克隆可被分为单个克隆以便再次在FACS仪器上被筛选以鉴定阳性的单个克隆。因此，例如如果克隆混合物具有水解酶活性，则单个克隆被回收，并采用FACS仪器筛选来确定那一个克隆具有水解酶活性。如在此所使用的，“小插入文库”的含义是一个包含具有高达大约5000个碱基对的随机小尺寸核酸插入物的克隆的基因文库。如在此所使用的，“大插入文库”是指包含具有大约5000至几十万个碱基对或更多碱基对的随机大尺寸核酸插入物的克隆的基因文库。
就上述方面之一所描述的，本发明提供了酶活性筛选含有已选择的微生物DNA的克隆的过程，该过程包括筛选文库中特异的酶活性，所述的文库包括大多数克隆，所述的克隆通过从所选择DNA的微生物的基因组DNA中回收而制备，其中DNA通过与至少一个DNA序列杂交而被选择，该DNA序列是编码特异活性酶的DNA序列的所有或一部分；和用所选择的DNA转化宿主以产生被筛选特异酶活性的克隆。
在一个实施方案中，来自微生物的DNA文库进行选择步骤以从中选择与一个或多个探针DNA序列杂交的DNA，该探针DNA序列是编码特异活性酶的DNA序列的所有或一部分，通过(a)使双链基因组DNA群体变成单链DNA群体；(b)将(a)的单链DNA群体与结合于一个配体的DNA探针在允许杂交的条件下接触，以便产生探针和与其杂交的基因组DNA群体成员的双链复合体；(c)将(b)的双链复合体与一个所述配体的固相特异结合伴侣接触以便产生一个固相复合体；(d)将固相复合体从(b)的单链DNA群体中分离出来；(e)从探针中释放与固相结合探针结合的基因组群体的成员；(f)从(e)的基因组群体的成员中形成双链DNA；(g)将(f)的双链DNA引入至合适的宿主中以形成包括大多数克隆的文库，该克隆含有所选择的DNA；和(h)在文库中筛选特异的酶活性。
在另一个方面，该过程包括预先选择以回收含有信号或分泌序列的DNA。以这种方式，可能如上述从基因组DNA群体中通过杂交仅选择出含有信号或分泌序列的DNA。下面段落描述了本发明的这个实施例的步骤，一般分泌信号序列的特性和功能，和将这种序列应用于一个测定实验或选择过程中的特殊实例。
这个方面的特殊实施方案进一步在上述的(a)之后但在(b)之前包括如下步骤(ai)将(a)的单链DNA群体与一个配体结合的寡核苷酸探针在允许杂交形成双链复合体的条件下接触，该探针与指定类型蛋白质的分泌信号序列互补；(aii)将(ai)中的双链复合体与一个所述配体的固相特异结合伴侣接触以便产生固相复合体；(aiii)将固相复合体从(a)的单链DNA群体中分离出来；(aiv)将已经与所述的固相结合探针的基因组群体的成员释放出来；和(av)将已经与基因组群体成员结合的固相结合探针分离出来。
然后将已经被选择和分离含有信号序列的DNA进行上述的选择步骤以选择和分离其中的DNA，该DNA与来自编码特异酶活性的酶的DNA的一个或多个探针DNA序列结合。
该步骤被描述并例证在于1996年8月2日提出申请的美国序列号08/692,002中，，在此引用作为参考。
体内的生物淘选可应用FACS为基础的仪器执行。复合体基因文库用含有可稳定所转录RNA的元件的载体构建。例如，包含可形成二级结构如发夹结构的序列可有助于增强其稳定性，该二级结构可设计为侧向RNA的被转录区，因此增加了其在细胞中的半衰期。用于生物淘选过程的探针分子包括用报道分子标记的寡核苷酸，该报道分子仅在探针与靶分子结合中发出荧光。这些探针从文库中采用几种转化方法的一种被引入至重组细胞中。探针分子与所转录的可产生DNA/RNA异源双链分子的靶mRNA结合。探针与靶标的结合将产生荧光信号，可被FACS仪器在淘选的过程中检测和分选到。
在一些实施方案中，编码B组氨基酸序列和基本上与它们一致的序列的多肽之一的核酸，或含有其至少大约5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段以合适的状态与一个能够引导所翻译的多肽或其片段分泌的前导序列组合在一起。可任选地，核酸可编码一个融合多肽，其中B组氨基酸序列和基本上与它们一致的序列的多肽之一，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段与异源的肽或多肽融合，其中这些肽如N-末端识别肽类，它们可获得所需的特性，如增加的稳定性或简化的纯化过程。
合适的DNA序列可通过许多步骤被插入至载体中。通常，DNA序列在用合适的限制性内切酶消化插入物和载体后，被连接到载体中的所需位置。可选择地，在插入物和载体的钝端可被连接。许多克隆技术公开在Ausubel等人，分子生物学现代方法，John Wiley 503Sons，Inc.1997和Sambrook等人，分子克隆实验室手册第二版，ColdSpring Harbor Laboratory Press(1989)，在此将其公开内容完整引用于此作为参考。这些或其他步骤被认为包括在本领域专业技术人员的范围之内。
载体可以是例如，质粒，病毒颗粒或噬菌体的形式。其他载体包括染色体，非染色体和合成DNA序列，SV40的衍生体；细菌质粒，噬菌体DNA，杆状病毒，酵母质粒，来自质粒和噬菌体DNA组合的载体，病毒DNA如疫苗，腺病毒，禽痘病毒，和假狂犬病。用于原核和真核宿主的多种克隆和表达载体的描述见Sambrook等人，分子克隆实验室手册第二版，Cold Spring Harbor，N.Y.，(1989)，将其公开内容引用在此作为参考。
可使用的特殊细菌载体包括商业渠道可获得的质粒，包括熟知的克隆载体pBR322(ATCC 37017)，pKK223-3(Pharmacia Fine Chemicals，Uppsala，Sweden)，GEMl(Promega Biotec，Madison，WI，USA)pQE70，pQE60，pQE-9(Qiagen)，pD10，psiX174 pBluescript II KS，pNH8A，pNH16a，pNH18A，pNH46A(Stratagene)，ptrc99a，pKK223-3，pKK233-3，pDR540，pRIT5(Pharmacia)，pKK232-8 and pCM7的基因元件。特殊的真核载体包括pSV2CAT，pOG44，pXT1，pSG(Stratagene)pSVK3，pBPV，pMSG，和pSVL(Pharmacia)。但是，任何其他的载体只要在宿主细胞中是可复制的和有活力的就可使用。
宿主细胞可以是为本领域专业技术人员所熟悉的任何宿主细胞，包括原核细胞，真核细胞，哺乳动物细胞，昆虫细胞或植物细胞。作为合适宿主的代表性实例，可以提到细菌细胞，如大肠杆菌，链霉菌，枯草芽孢杆菌，鼠伤寒杆菌和在假单胞菌属中的许多种属，链霉菌属，和葡萄球菌属，真菌细胞如酵母，昆虫细胞如果蝇属S2和草地夜蛾Sf9，动物细胞如CHO，COS或Bowes黑色素瘤，和腺病毒。合适宿主的选择包括在本领域专业技术人员的能力范围内。
载体可使用多种技术被导如到宿主细胞中，包括转化，转染，转导，病毒感染，基因枪，或Ti介导的基因转移。特殊的方法包括磷酸钙转染，DEAE-葡聚糖介导的转染，脂质转染，或电穿孔(Davis，L.，Dibner，M.，Battey，I，分子生物学基本方法，(1986))。
当合适时，基因工程改造的宿主细胞可在常规的限制营养培养基中培养，该培养基可适合激活启动子，选择转化体或扩增本发明的基因。在将合适的宿主株转化和宿主株生长至合适的细胞密度后，所选择的启动子可通过合适的方法诱导(如，温度转变或化学诱导)，且细胞另外培养一段时间以使其产生所需的多肽或其片段。
细胞典型地用离心来收获，用物理或化学的方法来破碎，得到的粗提取物被保留以进行进一步纯化。用于蛋白表达的微生物细胞可用常规的方法破碎，包括冷冻-融化循环，超声，机械破坏，或使用细胞溶解剂。这些方法对于本领域专业技术人员是熟知的。表达的多肽或其片段可从重组细胞培养物中回收或纯化，其方法包括硫酸铵或乙醇沉淀，酸提取，阴离子或阳离子交换色谱，磷酸纤维素色谱，疏水作用色谱，亲合色谱，羟磷灰石色谱和凝集素色谱。如果需要可使用蛋白质重构步骤用于完成多肽的构型。如果需要，可在最后的纯化步骤中使用高效液相色谱(HPLC)。
也可采用多种哺乳动物细胞培养系统来表达重组蛋白。哺乳动物表达系统的实例包括猴肾成纤维细胞的COS-7系(描述在Gluzman，Cell，23175，1981)，和其他能够从相容的载体中表达蛋白的细胞系，如C127，3T3，CHO，HeLa和BHK细胞系。
在宿主细胞中的构建物可以常规的方式用来产生由重组序列编码的基因产物。依靠在重组生产步骤中使用的宿主，含有载体的宿主细胞产生的多肽可以是糖基化的，或非糖基化的。本发明的多肽也可或不包括起始的甲硫氨酸氨基酸残基。
可选择地，B组氨基酸序列，和基本上与它们一致的序列的多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段可通过常规的肽合成仪来合成。在另一个实施方案中，可使用多肽的片段或部分以通过肽合成产生相应的全长多肽；因此，可使用这些片段作为中间体产生全长的多肽。
无细胞翻译系统也可用于产生B组氨基酸序列，和基本上与它们一致的序列的多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段，采用从含有与编码多肽或其片段的核酸可操作连接的启动子的DNA构建物转录的mRNA。在一些实施方案中，DNA构建物可在进行体外转录反应前被线性化，转录的mRNA然后与合适的无细胞翻译提取物如兔网织红细胞提取物孵育，产生所需的多肽或其片段。
本发明也涉及B组氨基酸序列，和基本上与它们一致的序列的多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段的变异体。术语“变异体”包括这些多肽的衍生体或类似物。特别的是，通过替代，添加，删除，融合和截断中的一个或多个，也可以是它们的组合，这些变异体在氨基酸序列上可与B组氨基酸序列，和基本上与它们一致的序列的多肽有所差别。
变异体可以是天然产生的或在体外建立的。特别的是，这些变异体可采用基因工程技术如定点诱变，随机化学诱变，核酸外切酶III删除法，和标准的克隆技术来建立。可选择的是，这些变异体，片段，类似物，或衍生体可采用化学合成或修饰的方法来建立。
制备变异体的其他方法对本领域的专业技术人员也是熟悉的。这些方法包括被修饰以产生编码多肽的核酸的方法，其中多肽具有在工业或实验室应用中可增加其价值的特性，核酸序列从天然的分离物中获得。在这些方法中，就从天然分离物中获取的序列而言，可产生并表征大量具有一个或多个核苷酸差异的变异体序列。典型地，就来自天然分离物的核酸编码的多肽而言，这些核苷酸差异可导致氨基酸变化。
例如，可采用易错PCR(error prone PCR)建立变异体。在易错PCR中，执行PCR的条件中，DNA聚合酶的拷贝精度很低，这样在沿PCR产物的全长中可获得很高的点突变率。易错PCR的描述见Leung，D.W.等人，Technique，111-15，1989)和Caldwell，R.C.& JoyceG.F.，PCR Methods Applic.，228-33，1992，其公开内容在此整体引用作为参考。简言之，在这些方法中，要诱变的核酸与PCR引物，反应缓冲液，MgCl2，MnCl2，Taq聚合酶和合适浓度的dNTP混合以便产生沿PCR产物全长的高点突变率。例如，反应可采用20fmole要诱变的核酸，30pmole每种PCR引物，含有50mM KCl，10mM Tris HCI(pH8.3)和0.01％明胶，7mM MgCI2，0.5mM MnCl2，5单位Taq聚合酶，0.2mMdGTP，0.2mM dATP，1mM dCTP和1mM dTTP的反应缓冲液进行。PCR的执行可在94℃1分钟，45℃1分钟和72℃1分钟进行30个循环。但是可以理解的是，这些参数可适当变化。诱变的核酸可被克隆仅合适的载体中，并评价由诱变的核酸编码的多肽的活性。
变异体也可采用寡核苷酸定向诱变(oligonucleotide directedmutagenesis)来建立以在任何已克隆的目的DNA中产生位点特异性突变。寡核苷酸诱变的描述见Reidhaar-Olson，J.F.& Sauer，R.T.等人，Science，24153-57，1988，其公开内容在此整体引用作为参考。简言之，在这种方法中，合成了大量要被导入至已克隆DNA中的含有一个或多个突变的双链寡核苷酸，并将其插入至要被诱变的已克隆DNA中。含有诱变DNA的克隆被回收，并评价它们所编码的多肽的活性。
产生变异体的另一种方法是装配PCR(assembly PCR)。装配PCR涉及装配来自小DNA片段混合物中的PCR产物。大多数不同的PCR反应在同一个瓶中并行发生，一个反应的产物触发另一个反应的产物。装配PCR的描述见于1996年7月9日提出申请的美国专利5,965,408，题为“通过中断合成进行的DNA再组装法”，其公开内容在此整体引用作为参考。
产生变异体的还有另一个方法是有性PCR诱变(sexual PCRmutagenesis)。在有性PCR诱变中，在体外不同但高度相关的DNA序列的DNA分子之间发生强制的同源重组，它是根据序列同源性的DNA分子随机断裂的结果，然后通过在PCR反应中的引物延伸固定交换体。有性PCR诱变的描述见Stemmer，W.P.，PNAS，USA，9110747-10751，1994，其公开内容在此引用作为参考。简言之，在这种方法中，大多数要被重组的核酸被DNAse消化产生含有平均大小为50-200个核苷酸的片段。所需平均大小的片段被纯化，并在PCR混合物中再悬浮。在可促进核酸片段之间重组的条件下进行PCR。例如，可通过在10-30ng/:l的浓度下在含有0.2mM每种dNTP，2.2mM MgCl2，50mM KCL，10mMTris HCl，pH9.0，和0.1％ Triton X-100的溶液中再悬浮纯化片段来进行PCR。每100∶1的反应混合物中加入2.5单位Taq聚合酶，并按照如下的方案进行PCR94℃60秒，94℃30秒，50-55℃30秒，72℃30秒(30-45次)和72℃5分钟。但可以理解的是，这些参数可适当变化。在一些实施方案中，寡核苷酸可包含在PCR反应中。在另一些实施方案中，可在第一组PCR反应中使用DNA聚合酶I的Klenow片段，在随后的一组PCR反应中可使用Taq聚合酶。分离重组的序列，并评价它们编码的多肽的活性。
也可通过体内诱变来产生变异体。在一些实施方案中，在目的序列上的随机突变的产生可通过将目的序列传递至细菌菌株，如大肠杆菌菌株中，后者在一个或多个DNA修复通路中携带突变。这些“突变基因”较野生型的亲代有更高的随机突变率。在这些菌株之一中传递DNA最终将在DNA中产生随机的突变。适合用于体内诱变的突变基因菌株的描述见PCT出版物WO 91/16427，1991年10月31日出版，题为“从多个基因群中建立显型的方法”，其公开内容在此整体引用作为参考。
也可采用盒式诱变(cassette mutagenesis)产生变异体。在盒诱变中，双链DNA分子的一个小区域被合成的不同于天然序列的寡核苷酸“盒”替代。寡核苷酸通常含有全部和/或部分随机化的天然序列。
也可使用循环系综诱变(recursive ensemble mutagenesis)来产生变异体。循环系综诱变是蛋白质工程(蛋白质诱变)的一种算法，开发用来产生基因型相关的在氨基酸序列上有差异的突变体的多种群体。这种方法采用反馈机制来控制组合的盒式诱变的连续次数。循环系综诱变的描述见Arkin，A.P.和Youvan，D.C.，PNAS，USA，897811-7815，1992，其公开内容在此整体引用作为参考。
在一些实施方案中，可采用指数系综诱变(exponential ensemblemutagenesis)来建立变异体。指数系综诱变是一个产生具有高比例独特和功能性突变体的组合文库的方法，其中残基的小基团被平行随机化以在每个改变的位置上鉴定可产生功能性蛋白的氨基酸。指数系综诱变的描述见Delegrave，S.和Youvan，D.C.，Biotechnology Research，111548-1552，1993，其公开的内容在此整体引用作为参考文献。随机和定点诱变的描述见Arnold，F.H.，Current Opinion in Biotechnology，4450-455，1993，其公开内容在此整体引用作为参考文献。
在一些实施方案中，采用改组(shaffling)的方法来建立变异体，其中大多数编码不同多肽的核酸的一部分被融合在一起以建立编码嵌合多肽的嵌合核酸序列，其描述见于1996年7月9日提出申请的美国专利5,965,408，，题为“通过中断合成进行的DNA再组装法”，和于1996年5月22日提出申请的美国专利第5,939,250，题为“通过诱变产生具有所需活性的酶”，两者均在此引用作为参考。
B组氨基酸序列的多肽变异体是可以一些变异体，其中B组氨基酸序列多肽的一个或多个氨基酸残基被替代为保守的或非保守的氨基酸残基(优选保守的氨基酸残基)，这种被替代的氨基酸残基是或不是由遗传密码编码的。
保守的替代作用是在一个多肽内一个特定的氨基酸被另一个类似特性的氨基酸替代。典型可见到的保守替代作用是下列的取代用另一个脂肪族氨基酸取代脂肪族氨基酸如丙氨酸，缬氨酸，亮氨酸和异亮氨酸；用苏氨酸取代丝氨酸或反之；用另一个酸性残基取代酸性残基如天冬氨酸和谷氨酸；用另一个含有酰胺基团的残基取代含有酰胺基团的残基，如天冬酰胺和谷氨酰胺；用另一个碱性残基交换一个碱性残基如赖氨酸和精氨酸；用另一个芳香族残基取代芳香族残基如苯丙氨酸，酪氨酸。
其他的变异体是其中B组氨基酸序列的多肽的一个或多个氨基酸残基中含有取代基团的变异体。
还有其他的变异体是其中多肽与另一个化合物，如增加多肽半衰期的化合物(例如，聚乙二醇)结合的变异体。
其他的变异体是，其中其他的氨基酸与多肽融合，如前导序列，分泌序列，蛋白原序列或可促进多肽的纯化，富集或稳定的序列。
在一些实施方案中，片段，衍生物和类似物保留了与B组氨基酸序列和基本上与它们一致的序列的多肽相同的生物学功能或活性。在其他的实施方案中，片段，衍生体或类似物包括原蛋白，这样片段，衍生物或类似物可通过切断原蛋白部分而被激活，产生一个活性多肽。
本发明的另一个方面是一些多肽或其片段，它们与B组氨基酸序列和基本上与它们一致的序列的多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段具有至少大约50％，至少大约55％，至少大约60％，至少大约65％，至少大约70％，至少大约75％，至少大约80％，至少大约85％，至少大约90％，至少大约95％，或超过大约95％的同源性。可采用上述的任何一种程序确定同源性，该程序可排列要比较的多肽或片段，并确定在它们之间的氨基酸同一性或相似性的程度。可以理解的是氨基酸“同源性”包括连续的氨基酸替代作用如上述的那些替代。
与B组氨基酸序列和基本上与它们一致的序列的多肽之一，或含有其至少大约5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段有同源性的多肽或片段可通过采用上述的技术分离编码它们的核酸而获得。
可选择地，同源的多肽或片段可通过生物化学富集或纯化步骤来获得。潜在同源的多肽或片段的序列可通过蛋白水解消化，凝胶电泳和/或微序列测定而确定。预期同源的多肽或片段的序列可采用上述的任何一个程序与B组氨基酸序列和基本上与它们一致的序列的多肽，或含有其至少大约5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段进行比较。
本发明的另一个方面是鉴定B组氨基酸序列和基本上与它们一致的序列的片段或变异体的测定法，该片段或变异体保留了B组氨基酸序列和基本上与它们一致的序列的酶功能。例如，所述多肽的片段或变异体可被用来催化生化反应，这表明该片段或变异体保留了B组氨基酸序列中多肽的酶活性。
确定变异体的片段是否保留B组氨基酸序列和基本上与它们一致的序列的多肽的酶活性的测定实验包括以下步骤将多肽片段或变异体与一个底物分子在允许多肽片段或变异体发挥作用的条件下进行接触，并检测底物水平是否降低或在多肽和底物之间反应的特异反应产物水平是否增加。
B组氨基酸序列和基本上与它们一致的序列的多肽或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段可用在多种应用中。例如，其多肽或片段可用于催化生化反应。根据本发明的一个方面，提供了利用B组氨基酸序列和基本上与它们一致的序列或编码这些多肽的多核苷酸进行水解糖苷键的方法。在这种方法中，含有糖苷键的物质(如淀粉)与B组氨基酸序列，或基本上与它们一致的序列的其中一个多肽在可促进糖苷键水解的条件下接触。
B组氨基酸序列和基本上与它们一致的序列的多肽或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸序列的片段，也可用于产生与多肽或片段特异结合的抗体。得到的抗体可用于免疫亲合色谱法以分离或纯化多肽或确定多肽是否存在于生物样品中。在这样的方法中，蛋白质制剂如提取物，或生物样品与能特异结合B组氨基酸序列和基本上与它们一致的序列的其中一个多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段的抗体接触。
在免疫亲合法中，抗体吸附在一个固体支持物上，如珠子或其他的柱基质。蛋白制剂被置入，在抗体可特异结合B组氨基酸序列和基本上与它们一致的序列的其中一个多肽，或其片段的条件下与抗体接触。冲洗去除非特异结合蛋白后，洗脱特异结合的多肽。
生物样品中蛋白质结合抗体的能力可采用本领域专业技术人员所熟悉的多种方法的任何一种来测定。例如，可通过用可检测到的标记物如荧光剂，酶标记，或放射线同位素来标记抗体以测定结合。可选择地，抗体与样品的结合可采用具有这些可检测标记物的二级抗体来检测。特殊的测定包括ELISA测定，夹心测定，放射免疫测定和Western印迹。
产生的针对B组氨基酸序列和基本上与它们一致的序列或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段的多克隆抗体可通过将多肽直接注射到动物体内或将多肽给予动物，如非人的动物而获得。这样获得的抗体然后与多肽本身结合。以这种方式，即使仅编码多肽的一个片段的序列也可用于产生可与整个天然多肽结合的抗体。然后这样的抗体可用于从表达这种多肽的细胞中分离多肽。
为了制备单克隆抗体，可以使用任何可提供抗体的技术，所述抗体由连续细胞系培养产生。实例包括杂交瘤技术(Kohler和Milstein，Nature，256495-497，1975，其公开内容在此引用作为参考)，三系杂交瘤(trioma)技术，人B-细胞杂交瘤技术(Kozbor等人，Immunology Today472，1983，其公开内容在此引用作为参考)，和EBV-杂交瘤技术(Cole等人，1985，单克隆抗体和癌症治疗，Alan R.Liss，Inc.，77-96页，其公开内容在此引用作为参考)。
描述用来产生单链抗体(美国专利第4,946,778，其公开内容在此引用作为参考)的技术适合产生B组氨基酸序列，和基本上与它们一致的序列的多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段的单链抗体。可选择地，转基因鼠可用来表达这些多肽或其片段的人源化抗体。
针对B组氨基酸序列和基本上与它们一致的序列的多肽，或含有其至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的片段产生的抗体可用于筛选其他生物体和样品中的相似多肽。在这些技术中，生物体的多肽与抗体接触，与抗体特异结合的多肽被检测。上述的任何一种方法可用来检测抗体结合。一种这样的筛选实验描述在“测定纤维素酶活性的方法”中，Methods in Enzymology，160卷，87-116页，在此整体引用作为参考。
如在此所使用的，术语“在SEQ ID NO3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45和47中列出的核酸序列”包括A组核酸序列，和基本上与它们一致的序列的核苷酸序列，以及与A组核酸序列和其片段同源的序列和所有前述序列的互补序列。片段包括SEQ ID NO3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45和47的部分，含有A组核酸序列和基本上与它们一致的序列中至少10，15，20，25，30，35，40，50，75，100，150，200，300，400，或500个连续核苷酸。同源序列和A组核酸序列和基本上与它们一致的序列的片段，是指具有与这些序列有至少99％，98％，97％，96％，95％，90％，85％，80％，75％，70％，65％，60％，55％或50％同源性的序列。同源性可采用任何一种计算机程序和在此所描述的参数来测定，包括以缺省参数的FASTA 3.0t78版。同源序列也包括RNA序列，其中在A组核酸序列中列出的核酸序列中尿嘧啶代替了胸腺嘧啶。同源序列可采用任何一个在此描述的方法获得或通过矫正测序错误而得到。将可以理解的是如在A组核酸序列和基本上与它们一致的序列中所列出的核酸序列可以以传统的单字符格式来代表(见Stryer，Lubert.生物化学，第三版，W.HFreeman & Co.，New York.的内部背面)或以任何其他可记录核苷酸在序列中同一性的格式。
如在此所使用的术语“在SEQ ID NO4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48中列出的多肽序列”包括B组氨基酸序列和基本上与它们一致的序列的多肽序列，其中它们由SEQ ID NO3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45和47中列出的序列，与B组氨基酸序列和基本上与它们一致的序列同源的多肽序列，或任何前述序列的片段编码。同源多肽序列是指具有与B组氨基酸序列的其中一个多肽序列至少有99％，98％，97％，96％，95％，90％，85％，80％，75％，70％，65％，60％，55％或50％同源性的多肽序列。同源性可采用在此描述的任何一个计算机程序和参数，包括缺省参数或任何修改的参数的FASTA 3.0t78版来测定。同源序列可采用在此所描述的任何一种方法获得或通过矫正测序错误而得到。含有B组氨基酸序列和基本上与它们一致的序列的多肽中至少5，10，15，20，25，30，35，40，50，75，100，或150个连续氨基酸的多肽片段可用传统的单字符格式或三字母格式来表示(见Stryer，Lubert.生物化学，第三版，W.H Freeman & Co.，New York.的内部背面)或以任何其他涉及序列中多肽同一性的格式。
本领域专业技术人员可以理解的是在SEQ ID NO3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，43，45和47中列出的核酸序列，和在SEQ ID NO4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48中列出的多肽序列可被储存，记录，在任何可被计算机读取和存取的介质中处理。如在此所使用的，词语“记录”和“储存”是指在计算机介质中储存信息的过程。专业技术人员可很容易的采用任何一种现在已知的方法，在计算机可读介质上记录信息以产生一些制品，它们含有A组核酸序列和基本上与它们一致的序列中列出的一个或多个核酸序列，B组氨基酸序列和基本上与它们一致的序列中列出的一个或多个多肽序列。本发明的另一个方面是已经记录了A组核酸序列和基本上与它们一致的序列中列出的至少2，5，10，15，或20个核酸序列的一个计算机可读介质。
本发明的另一个方面是已经记录了A组核酸序列和基本上与它们一致的序列中的一个或多个核酸序列的一个计算机可读介质。本发明的另一个方面是已经记录了B组氨基酸序列和基本上与它们一致的序列中的一个或多个多肽序列的一个计算机可读介质。本发明的另一个方面是已经记录了上述列出的序列中至少2，5，10，15或20个序列的一个计算机可读介质。
计算机可读介质包括磁性可读介质，光学可读介质，电子可读介质和磁性/光学介质。例如，计算机可读介质可以是硬盘，软盘，磁带，CD-ROM，数据通用磁盘(DVD)，随机存取存储器(RAM)，或只读存储器(ROM)以及其他本领域专业技术人员了解的其他类型的其他介质。
本发明的实施方案包括系统(如基于因特网的系统)，特殊的是可储存和处理在此所描述的序列信息的计算机系统。在图1中以结构图的形式说明了计算机系统100的一个实例。如在此所使用的，“计算机系统”是指硬件部分，软件部分，和用来分析A组核酸序列和基本上与它们一致的序列中列出的核酸序列的核苷酸序列，或B组氨基酸序列中列出的多肽序列的数据储存部件。计算机系统100典型地包括加工，存取和处理序列数据的处理器。处理器105可以是熟知的任何类型的中央处理器，如英特尔公司的奔腾III，或太阳，摩托罗拉，康柏，AMD或国际商业机器公司的相似处理器。
典型地计算机系统100是一个普通用途的系统，包括处理器105和用来储存数据的一个或多个内部数据储存部件110，和用来获取储存在数据储存部件中的数据的一个或多个数据获取装置。专业技术人员可很容易的理解，任何一个目前可获得的计算机系统均是合适的。
在一个特殊的实施例中，计算机系统100包括与总线连接的处理器105，其中总线是与主存储器115(优选以RAM实现)相连的，和一个或多个内部数据储存装置110，如硬磁盘机和/或其他已经记录数据的计算机可读介质。在一些实施方案中，计算机系统100进一步包括一个或多个从内部数据储存装置110上读取数据的数据获取装置。
数据获取装置118可代表，例如软盘驱动器，光盘驱动器，磁带驱动器，或能够连接远程数据储存系统(如，经互联网)的调制解调器等。在一些实施方案中，内部数据储存装置110是一个可移动的计算机可读介质，如软盘，光盘，磁带等，含有控制逻辑和/或记录在上面的数据。一旦插入至数据获取装置中，计算机系统100可方便地包括或通过合适的软件编程以读取控制逻辑和/或从数据储存部件中读取数据。
计算机系统100包括显示器120，后者可用来对计算机用户进行显示输出。也应该注意的是计算机系统100可与网络或广域网中的其他计算机系统125a-c相连接，以便提供对计算机系统100的集中存取。
存取和处理A组核酸序列和基本上与它们一致的序列中列出的核酸序列的核苷酸序列，或B组氨基酸序列和基本上与它们一致的序列的多肽序列的软件(如搜索工具，比较工具，和构型工具等)可在执行过程中驻留在主存储器115中。
在一些实施方案中，计算机系统100可进一步包括序列比较算法，用于对储存在计算机可读介质上的A组核酸序列和基本上与它们一致的序列中列出的核酸序列，或B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列与储存在计算机可读介质上的参考核苷酸或多肽序列进行比较。“序列比较算法”是指一个或多个可在计算机系统100中执行(本地或远程)以对储存在一个数据储存装置中的核苷酸序列和其他核苷酸序列和/或化合物进行比较。例如，序列比较算法可对储存在一个计算机可读介质上的A组核酸序列和基本上与它们一致的序列中列出的核酸序列的核苷酸序列，或B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列，与储存在一个计算机可读介质上的参考序列进行比较，以鉴定同源性或结构基序。在此专利说明书中在其他地方鉴定的多种序列比较程序可特殊地被考虑用于本发明的这个方面。蛋白质和/或核酸序列同源性可采用本领域已知的任何一种序列比较算法和程序来评价。这种算法和程序包括但不限于，TBLASTN，BLASTP，FASTA，TFASTA，和CLUSTALW(Pearson Lipman，Proc.Natl.Acad.Sci.USA 85(8)2444-2448，1988；Altschul等人，J.Mol.Biol.215(3)403-410，1990；Thompson等人，Nucleic Acids Res.22(2)4673-4680，1994；Higgins等人，Methods Enzymol.266383-402，1996；Altschul等人，J.MoL Biol.215(3)403-410，1990；Altschul等人，NatureGenetics 3266-272，1993)。
同源性或同一性经常采用序列分析软件来进行测定(如，GeneticsComputer Group的序列分析软件包，威斯康星大学生物技术中心，1710University Avenue，Madison，W153705)。该软件可通过指定同源性的程度来对多个删除，替代和其他修饰来匹配相似序列。术语“同源性”和“同一性”在两个或多个核酸或多肽序列的情况下，是指当在对比窗或指定区域被比较和排列时，两个或多个相同的或特定比例氨基酸残基或核苷酸是相同的序列或子序列，其测定可采用任何数量的序列比较算法或通过人工排列和目测。
为了序列比较，典型地一个序列可作为参考序列，检测序列可与之比较。当使用序列比较算法时，检测和参考序列输入至计算机中，顺序坐标被指定，如果需要，序列算法程序参数可被指定。可使用缺省的程序参数，或可指定可选择的参数。然后序列比较算法基于程序参数，计算检测序列相对参考序列的序列同一性百分比。
如在此所使用的，“比较窗”，包括任何数目连续位点片段的坐标，该位点包括从20至600，通常大约50至大约200，更普遍的大约100至大约150，其中序列可在两个序列最佳对准后，与相同数目连续位点的参考序列相比较。为比较进行序列对准的方法在本领域中是为人熟知的。可通过如下算法进行为比较进行的最佳序列对准，例如Smith &Waterman的局部同源性算法，Adv.Appl.Math.2482，1981，Needleman& Wunsch的同源性对准算法，J.Mol.Biol 48443，1970，person &Lipman的相似性检索法，Proc.Nat’l.Acad.Sci.USA 852444，1988，这些算法的计算机化工具(Wisconsin Genetics Software Package中的GAP，BESTFIT，FASTA，和TFASTA，Genetics Computer Group，575 ScienceDr.，Madison，WI)，或人工排列和目测。其他确定同源性或同一性的算法，包括，例如，除BLAST程序外(国家生物学信息中心的碱基局部对准搜索工具)，ALIGN，AMAS(多重对准序列分析)，AMPS(蛋白质多重序列对准)，ASSET(对准片段统计评价工具)，BANDS，BESTSCOR，BIOSCAN(生物学序列比较分析节点)，BLIMPS(BLocks IMProvedSearcher)，FASTA，Intervals & Points，BMB，CLUSTAL V，CLUSTAL W，CONSENSUS，LCONSENSUS，WCONSENSUS，Smith-Waterman算法，DARWIN，Las Vegas算法，FNAT(强制核苷酸对准工具)，Framealign，Framesearch，DYNAMIC，FILTER，FSAP(Fristensky序列分析包)，GAP(通用对准程序)，GENAL，GIBBS，GenQuest，ISSC(敏感性序列比较)，LALIGN(局部序列对准)，LCP(局部容量程序)，MACAW(多重对准构建和分析工作台)，MAP(多重对准程序)，MBLKP，MBLKN，PIMA(模式感应的多重序列对准)，SAGA(遗传算法的序列对准)和WHAT-IF。这样的对准程序也用于筛选基因组数据库以鉴定含有基本上相同序列的多核苷酸。许多基因组数据库是可以获得的，例如，人类基因组的重要部分可作为人类基因组测序项目的一部分而获得(J.Roach，http∥weber.u.Washington.edu/～roach/human_genome_progress 2.html)(Gibbs，1995)。至少21个其他的基因组已经被测序，例如包括，生殖器支原体(M.genitalium)(Fraser等人，1995)，甲烷球菌(M.jannaschii)(Bult等人，1996)，流行性感冒嗜血杆菌(H.influenzae)(Fleischmann等人，1995)，大肠杆菌(Blattner等人，1997)，和酵母(酿酒酵母)(Mewes等人，1997)，和果蝇(D.melanogaster)(Adams等人，2000)。在生物体模型基因组的测序上已经获得了显著的进展，如小鼠，线虫(C.elegans)，和拟南芥(Arabadopsis sp)。含有基因组信息和一些功能性信息的几个数据库可通过不同的组织获得，可经互联网获得，例如http∥wwwtigr.org/tdb；http∥www.genetics.wisc.edu；http//genome-www.stanford.edu/～ball；http∥hiv-web.lanl.gov；http∥www.ncbi.nlm.nih.gov；http∥www.ebi.ac.uk；http∥Pasteur.fr/other/biology；和http∥www.genome.wi.mit.edu。
有用的算法的实例是BLAST和BLAST 2.0算法，它们的描述分别分别见Altschul等人，Nuc.Acids Res.253389-3402，1977，和Altschul等人，J.Mol.Biol.215403-410，1990。执行BLAST分析的软件可通过国家生物学信息中心(http∥www.ncbi.nlm.Nih.gov/)公开获得。这种算法涉及首先通过在查询序列中鉴定长度为W的短字节而鉴定高积分片段配对(HSPs)，当与数据库序列中相同长度的字节对准时，可匹配或满足一些阳性意义的临界值分值T。T是指邻近的字节分数临界值(Altschul等人，见上文)。这些初始的邻近字节采样可作为启动寻找含有它们的更长HSPs的搜索的种子。字节采样沿着每个序列的两个方向延伸直至累计的对准分值增加。核苷酸序列累计的分值采用参数M(对一对匹配残基的回馈分值；一般＞0)来计算。对于氨基酸序列，评分矩阵用来计算累计分值。在每个方向字节采样的延伸当以下情况时中止累计对准分值从最大值降低数量X；由于积累了一个或多个阴性分值的残基对准，累计分值到达0或以下；或到达每条序列的终点。BLAST算法参数W，T和X确定了对准的敏感性和速度。BLASTN程序(对于核苷酸序列)使用的缺省字节长度(W)为11，期望值(E)为10，M＝5，N＝-4，并比较两条链。对于氨基酸，BLASTP程序使用的缺省字节长度为3，和期望值(E)为10，BLOSUM62评分矩阵(见Henikoff & Henikoff，Proc.Natl.Acad.Sci.USA 8910915，1989)对准(B)为50，期望值(E)为10，M＝5，N＝-4，并比较两条链。
BLAST算法也在两个序列之间进行相似性的统计学分析(见，如Karlin & Altschul，Proc.Natl.Acad.Sci.USA 905873，1993)。BLAST算法提供的相似性测定是最小的总和概率(P(N))，它提供了两个核酸或氨基酸序列间的匹配偶然发生的可能性的指征。例如，如果在检测核酸与参考核酸比较的最小总和概率小于大约0.2，更优选的小于大约0.01，和最优选的小于大约0.001，核酸被认为与参考序列相似。
在一个实施方案中，蛋白和核酸序列同源性可采用碱基局部对准搜索工具(“BLAST”)来评价。特别的是，5个特殊的BLAST程序可用来进行下面的工作(1)BLASTP和BLASTP3比较一个氨基酸查询序列和蛋白质序列数据库；(2)BLASTN比较一个核苷酸查询序列和一个核苷酸序列数据库；(3)BLASTX比较查询核苷酸序列(两股)的6框概念翻译产物和蛋白质序列数据库；(4)TBLASTN比较一个查询蛋白质序列和一个在所有6种可读框架内(两股)翻译的核苷酸序列数据库；和(5)TBLASTX比较一个核苷酸查询序列的6框翻译和一个核苷酸序列数据库的6框翻译。
BLAST程序可通过鉴别相似的片段而鉴定同源性序列，相似片段在此是指在查询氨基酸或核酸序列和优选从蛋白质或核酸序列数据库中获得的检测序列之间的“高积分片段配对”。高积分片段配对优选通过评分矩阵的方法来鉴定(即对准)，其中许多方法在本领域中是已知的。优选地，可使用的评分矩阵是BLOSUM62矩阵(Gonnet等人，Science2561443-1445，1992；Henikoff和Henikoff，Proteins1749-61，1993)。不太优选地，也可使用PAM或PAM250矩阵(见，如，Schwartz和Dayhoff主编，1978，检测距离关系的矩阵蛋白质序列和结构图集，华盛顿国家生物医学研究基金会)。BLAST程序可通过美国国家医学图书馆获得，如在www.ncbi.nlm.nih.gov。
用在上述算法中的参数可根据要研究的序列长度和同源性的程度而改变。在一些实施方案中，在缺少用户的说明时可使用算法的缺省参数。
图2是描述为确定新序列和数据库中的序列之间的同源性，将新核苷酸或蛋白质序列与序列数据库比较的程序200的一个实施方案的流程图。序列的数据库可是在计算机系统100中储存的一个私人数据库，或是公共数据库如通过互联网可获得的GENBANK。
程序200在起始状态201开始，然后进展至状态202，其中要被比较的新序列被储存在计算机系统100中的存储器中。如上所述，存储器可以是任何类型的存储器，包括RAM或内部存储装置。
程序200然后进展至状态204，其中序列的数据库为分析和比较而开放。程序200然后进展至状态206，其中在数据库中储存的第一条序列被读入计算机的存储器中。然后在状态210进行比较以确定第一条序列是否与第二条序列相同。重要的是要注意这个步骤不限于在新序列和数据库中的第一条序列进行精确的比较。比较两个核苷酸或蛋白质序列的方法是本领域专业技术人员熟知的，即使它们不完全相同。例如，空位可被引入到一个序列中以便提高两个检测序列之间的同源性水平。控制是否在比较的过程中向一个序列中引入空位或其他特征的参数一般可由计算机系统的用户输入。
一旦两个序列的比较在状态210已经被执行，则在判定状态210获得判定值，两个序列是否是相同的。当然，术语“相同”并不限于序列完全相同。在由用户输入的同源性参数内的序列将在程序200中被标记为“相同的”。
如果获得了两个序列是相同的判定值，程序200则进展至状态214，其中来自数据库的序列名称显示给用户。该状态通知用户显示名称的序列满足所输入的同源性限制。一旦储存的序列名称显示给用户，程序200进展至判定状态218，其中可获得判定值，是否更多的序列存在于数据库中。如果在数据库中不存在更多的序列，程序200则在终止状态220中止。但如果有更多的序列存在于数据库中，程序200则进展至状态224，其中指示器移动至数据库中的下一个序列，以便与新的序列比较。以这种方式，新的序列被与数据库中的每一个序列进行对准和比较。
应该注意的是如果在判定状态212已经获得序列不同源的判定值，，程序200则将立即进展至判定状态218以确定数据库中是否有任何其他的序列要比较。
因此，本发明的一个方面是一个计算机系统，该系统包括一个处理器；一个数据存储装置，其上已经储存了A组核酸序列和基本上与它们一致的序列中列出的核酸序列，或在B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列；一个数据存储装置，其上已经储存了可获取的要与A组核酸序列和基本上与它们一致的序列中列出的核酸序列，或B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列进行比较的参考核苷酸序列或多肽序列；和一个进行比较的序列比较仪。序列比较仪可指示比较的序列之间的同源性水平，或者在上述A组核酸序列和基本上与它们一致的序列的核酸密码或B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列中鉴定结构基序，或者可在与这些核酸密码和多肽密码比较的序列中鉴定结构基序。在一些实施方案中，数据储存装置可在其中储存A组核酸序列和基本上与它们一致的序列中列出的核酸序列中，或B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列中的至少2，5，10，15，20，25，30，或40个序列。
本发明的另一个方面是在A组核酸序列和基本上与它们一致的序列中列出的核酸序列或在B组氨基酸序列和基本上与它们一致的序列中列出的多肽序列，和参考核苷酸序列之间确定同源性水平的一种方法。该方法包括通过使用可确定同源性水平的计算机程序读取核酸密码或多肽密码和参考核苷酸或多肽序列，并在核酸密码或多肽密码和参考核苷酸或多肽序列之间用计算机程序来确定同源性。计算机程序可以是任何一个可确定同源性水平的计算机程序，包括那些在此特别列举的程序(如，BLAST2N，使用缺省参数或使用任何修改的参数)。该方法可采用上述的计算机系统来实现。该方法也可如下进行，即通过使用计算机程序读取A组核酸序列中列出的上述核酸序列中，或B组氨基酸序列中列出的多肽序列中的至少2，5，10，15，20，25，30，或40或更多的序列，并在核酸密码或多肽密码和参考核苷酸序列或多肽序列之间确定同源性。
图3是描述在一个计算机中为确定两条序列是否同源的程序250的一个实施方案的流程图。程序250从起始状态252开始，然后进展至状态254，其中第一条要比较的序列存储在存储器中。要比较的第二条序列然后在状态256时被储存在存储器中。然后程序250进展至状态260，其中在第一条序列中的第一个字符被读取，然后进展至状态262，其中第二条序列的第一个字符被读取。应该理解的是，如果序列是核苷酸序列，正常情况下参数将是A，T，C，G或U中的一个。如果序列是蛋白质序列，则优选单一字母的氨基酸编码，以便第一条和第二条序列可被很容易的比较。
然后在判定状态264判定两个字符是否相同。如果它们是相同的，程序250则进展至状态268，其中第一条和第二条序列中的下一个字符被读取。然后判定下一个字符是否相同。如果相同，程序250则继续此循环直至两个字符不相同为止。如果判定下两个字符不相同，程序250则进展至判定状态274以确定每条序列的其他任何字符是否要读取。
如果没有其他任何字符要读取，程序250则进展至状态276，其中第一条和第二条序列间同源性的水平显示给用户。通过计算相同序列间的字符与第一条序列中序列总数的比例可确定同源性水平。因此，如果第一条100个核苷酸序列的每个字符与第二条序列中的每一个字符对准时，同源性水平将为100％。
可选择的是，计算机程序可以是这样一个计算机程序，即将在本发明中产生的核酸序列的核苷酸序列与一条或多条参考核苷酸序列比较，以便确定A组核酸序列和基本上与它们一致的序列的核酸编码是否与在一个或多个位置上不同于参考核酸序列。可任选的，这样一个程序可记录关于在A组核酸序列中列出的参考多核苷酸或核酸序列，及基本上与它们一致的序列的插入，删除或替代核苷酸。在一个实施方案中，计算机程序可以是这样一个计算机程序，即可确定在A组核酸序列中列出的核酸序列和基本上与它们一致的序列是否含有关于参考核苷酸序列的单核苷酸多态性(SNP)。
因此，本发明的另一个方面是一种方法，用于确定在A组核酸序列中列出的核酸序列，和基本上与它们一致的序列在一个多个核苷酸上是否与参考核苷酸序列不同，所述方法的步骤包括使用可鉴别核酸序列间差异的计算机程序来读取核酸编码和参考核苷酸序列，并采用计算机程序鉴别核酸编码和参考核苷酸序列之间的差异。在一些实施方案中，计算机程序是一个可鉴别单核苷酸多态性的程序。该方法可通过上述的计算机程序来实现，该法在图3中图解说明。该方法的执行也可通过使用计算机程序在A组核酸序列中列出的核酸序列和基本上与它们一致的序列，以及参考核苷酸序列中读取至少2，5，10，15，20，25，30或40或更多的序列，并采用计算机程序鉴别核酸编码和参考核苷酸序列之间的差异。
在其他的实施方案中，计算机化的系统可进一步包括在A组核酸序列中列出的核酸序列或在B组氨基酸序列中列出的多肽序列，及基本上与它们一致的序列中鉴别特征的标识符。
“标识符”是指一个或多个可在A组核酸序列中列出的核酸序列和基本上与它们一致的序列，或在B组氨基酸序列中列出的多肽序列，和基本上与它们一致的序列中鉴别某种特征的程序。在一个实施方案中，标识符可包含一个可在A组核酸序列中列出的核酸序列，和基本上与它们一致的序列中鉴别一个开放阅读框的程序。
图5是一个描述在一个序列中检测一种特征存在的标识符程序300的一个实施例的流程图。程序300在起始状态302开始，然后进展至状态304，其中要被检查特征的第一条序列被储存在计算机系统100中的存储器115中。程序300然后进展至状态306，其中序列特征数据库是开放的。这样一个数据库将包括一个与特征名称并列的每个特征属性的列表。例如，一个特征名称可能是“初始密码子”，属性将是“ATG”。另一个实例是特征名称为“TAATAA盒”，特征属性为“TAATAA”。这样一个数据库的实例是由Wisconsin Genetics ComputerGroup(www.gcg.com)大学所开发的。可选择地，特征可以是结构性多肽基序如α螺旋，β片层或功能性的多肽基序如酶活性位点，螺旋-转角-螺旋基序或其他本领域专业技术人员已知的基序。
一旦特征数据库在状态306开放，程序300则进展至状态308，其中第一个特征从数据库中读取。然后在状态310进行第一个特征属性与第一个序列的比较。在判定状态316获得判定结果是否在第一条序列中能发现特征的属性。如果发现了属性，程序300则转移至状态318，其中所发现特征的名称显示给用户。
程序300然后进展至判定状态320，其中得出结果是否更多的特征仍然存在于数据库中。如果不存在更多的特征，程序300将在终止状态324处结束。但是，如果更多的特征存在于数据库中，程序300将在状态326读取下一个序列特征，并循环回到状态310，其中下一个特征的属性与第一条序列相比较。
应该注意的是，如果特征属性在判定状态316处的第一条序列中没有被发现，程序300会直接进展到判定状态320以便确定是否有更多的特征存在于数据库中。
相应地，本发明的另一方面是一种方法，用于在如在A组核酸序列中列出的核酸序列，和基本上与它们一致的序列内，或如在B组氨基酸序列内列出的多肽序列和基本上与它们一致的序列内鉴别一种特征，所述方法包括通过使用一种计算机程序读取核酸编码或多肽编码，并采用计算机程序在核酸编码中鉴别这些特征，其中所述的计算机程序可在其中鉴别特征。在一个实施方案中，计算机程序包含鉴别开放阅读框的计算机程序。该方法的执行是通过使用计算机程序读取一个单一序列或如在A组核酸序列中列出的核酸序列，和基本上与它们一致的序列，或如在B组氨基酸序列中列出的多肽序列和基本上与它们一致的序列内至少2，5，10，15，20，25，30，或40个序列，并用计算机程序鉴定核酸编码或多肽编码中的特征。
如在A组核酸序列中列出的核酸序列和基本上与它们一致的序列或如在B组氨基酸序列中列出的多肽序列，和基本上与它们一致的序列可被储存，并以多种格式在多个数据处理器程序中进行处理。例如，如在A组核酸序列中列出的核酸序列，和基本上与它们一致的核酸序列，或如在B组氨基酸序列中列出的多肽序列，和基本上与它们一致的序列，可作为文本在一个文字处理文件，如微软的WORD或WORDPERFECT中被储存起来，或以本领域专业技术人员所熟悉的多种数据库程序如DB2，SYBASE，或ORACLE中的ASCII文件被储存。另外，可使用许多计算机程序和数据库作为序列比较算法，标识符或与如在A组核酸序列中列出的核酸序列，和基本上与它们一致的序列，或如在B组氨基酸序列中列出的多肽序列，和基本上与它们一致的序列进行比较的参考核酸序列或多肽序列的来源。下面的列表并不打算限制本发明，而是提供程序和数据库的指南，它们可用于如在A组核酸序列中列出的核酸序列，和基本上与它们一致的序列，或如在B组氨基酸序列中列出的多肽序列，和基本上与它们一致的序列。
可使用的程序和数据库包括但不限于MacPattern(EMBL)，DiscoveryBase(Molecular Applications Group)，GeneMine(MolecularApplications Group)，Look(Molecular Applications Group)，MacLook(Molecular Applications Group)，BLAST和BLAST2(NCBI)，BLASTN和BLASTX(Altschul等人，J.Mol.Biol.215403，1990)，FASTA(Pearson和Lipman，Proc.Natl.Acad.Sci.USA 852444，1988)，FASTDB(Brutlag等人，Comp.App.Biosci.6237-245，1990)，Catalyst(Molecular Simulations Inc.)，Catalyst/SHAPE(Molecular Simulations Inc.)，Cerius2.DBAccess(Molecular Simulation Inc.)，HypoGen(Molecular Simulations Inc.)，Insight II，(Molecular Simulations Inc.)，Discover(Molecular SimulationsInc.)，CHARMm(Molecular Simulations Inc.)，Felix(MolecularSimulations Inc.)，DelPhi，(Molecular Simulations Inc.)，QuanteMM，(Molecular Simulations，Inc.)，Homology(Molecular Simulations，Inc.)，Modeler(Molecular Simulations，Inc.)，ISIS(Molecular Simulations，Inc.)，Quanta/Protein Design(Molecular Simulations，Inc.)，WebLab(MolecularSimulations Inc.)，WebLab Diversity Explorer(Molecular Simulations Inc.)，Gene Explorer(Molecular Simulations，Inc.)，SeqFold(MolecularSimulations，Inc.)，MDL通用化学药品目录数据库(MDL AvailableChemicals Directory database)，MDL药物数据报告数据库(MDL DrugData Report data base)，综合医学化学数据库(Compreshensive MedicinalChemistry database)，Derwent’s世界药物索引数据库(Derwent’s WorldDrug Index database)，BioByteMasterFile数据库，Genbank数据库，和Genseqn数据库。许多其他的程序和数据库对在本公开书中特定领域中的专业技术人员是很明显的。
采用上述程序可检测的基序包括编码亮氨酸拉链，螺旋-转角-螺旋基序，糖基化位点，泛素化位点，α-螺旋，β-片层的序列，编码可引导编码蛋白分泌的信号肽的信号序列，涉及转录调节中的序列如同源框，酸性分支，酶活性位点，底物结合位点和酶切割位点。
本发明开发了酶的独特催化特性。鉴于在化学转化反应中使用生物催化剂(即，纯化或天然酶，非活或活细胞)一般需要鉴别与特殊起始化合物反应的特殊生物催化剂，本发明采用了选择性的生物催化剂和在许多起始化合物，如小分子中存在的功能基团特异的反应条件。每个生物催化剂对一个功能基团或几个相关的功能基团是特异的，可与含有这种功能基团的许多起始化合物反应。
生物催化反应可从一个单一的起始化合物产生一组衍生物。这些衍生物可进行另一轮生物催化反应，产生第二组衍生化合物。原始小分子或化合物的上千种变异可在生物催化衍生作用的每次重复中产生。
酶在起始化合物的特异位点上反应，而不影响其他分子，该过程采用传统的化学方法很难达到。这种高度的生物催化的特异性提供了在文库内鉴别一个单一的活性化合物的手段。该文库的特征在于用来产生其的系列生物催化反应，称为“生物合成过程”。为生物学活性筛选文库并追踪生物合成过程可鉴别产生活性化合物的特异反应序列。重复反应序列，确定合成化合物的结构。这种鉴定模式，不象其他的合成和筛选方式，并不需要固定技术，可采用实际上任何类型的筛选实验来合成和检测游离在溶液中的化合物。重要的是要注意在功能基团上的酶反应的高度特异性可允许追踪特异酶反应，该反应可制造生物催化产生的文库。
许多程序化的步骤可采用机械自动化来进行，每天可执行上千种催化反应和筛选实验，并确保高水平的准确度和可重复性。结果，衍生化合物的文库可在大概几周内产生，采用常规的化学方法则需要几年的时间来产生。
在一个特殊的实施方案中，本发明提供了一种修饰小分子的方法，所述方法包括将由在此描述的多核苷酸编码或其酶学活性片断与小分子接触，产生一个修饰的小分子。修饰小分子的文库可被检测以确定修饰的小分子是否存在于显示有所需活性的文库中。可产生具有所需活性的修饰小分子的特异生物催化反应的鉴别可通过系统性的去除每一个用来产生部分文库的生物催化反应，然后检测在部分文库中产生的小分子中是否存在具有所需活性的修饰小分子。可产生具有所需活性的修饰小分子的特异生物催化反应可随意地被重复。生物催化反应可采用一组可与在小分子结构中发现的不同结构部分反应的生物催化剂来进行，每种生物催化剂对一个结构部分或一组相关的结构部分是特异的；每种生物催化剂可与含有不同结构部分的许多不同的小分子反应。
本发明将参考以下的实例进一步描述；但是，可以理解的是本发明并不限于这些实例。
实施例实例1位点-饱和诱变为了达到位点饱和诱变，由SEQ ID NO1编码的脱卤素酶(SEQ IDNO2)的每一个残基(317)均通过定点诱变采用32倍变性的寡核苷酸引物转变成所有20个氨基酸，如下脱卤素酶表达构建物的培养物进行培养生长，并制备质粒制剂。
制备引物以随机化每个密码子-它们具有普遍的结构X20NN(G/T)X20，其中X20代表要改变的密码子侧向的SEQ ID NO1核酸序列的20个核苷酸。
制备含有～50ng质粒模板，125ng每种引物，1X原始Pfu缓冲液，200μM每种dNTP和2.5U原始Pfu DNA多聚酶的25μl反应混合物。
如下在Robo96梯度循环仪中循环进行反应在95℃初始变性1分钟；95℃45秒，53℃1分钟，72℃11分钟进行20循环，72℃10分钟进行最后的延伸步骤。
反应混合物用10U DpnI在37℃消化1小时以消化甲基化的模板DNA。
2μl反应混合物用来转化50μl XL1-蓝MRF’细胞，将全部转化的混合物接种在可产生200-1000个集落的大LB-Amp-Met培养板上。
单个集落被挑入含有LB-Amp-IPTG的384孔微量滴定板中生长过夜。
第二天测定这些培养板中的克隆。
实施例2脱卤素酶热稳定性本发明提供的是，通过定向进化而产生的所需特性可以有限的方式进行例证，即在接受改变的环境后分子残余活性(如酶活性，免疫反应性，抗生素活性等)的改良，包括可考虑在苛刻的环境中存在特定时间的活性。这样一种苛刻的环境可包括下列情况的任何组合(重复或不重复，以任何顺序或排列)升高的温度(包括可导致工作酶变性的温度)，降低的温度，升高的盐度，降低的盐度，升高的pH，降低的pH，升高的压力，降低的压力，暴露在放射源(包括紫外放射线，可见光，以及整个电磁光谱)的改变。
下面的实例显示了应用定向进化使在暴露于升高的温度中，酶的能力进化重新获得或保留活性。
如上所述，脱卤素酶的每个残基(317)通过定点诱变采用32倍变性的寡核苷酸引物转变为所有20个氨基酸。筛选的步骤如下384孔培养板中的过夜培养物离心，去除培养基。每个孔加入0.06mL 1mM Tris/SO42-pH7.8。
自动机械手可从每个含有0.02mL细胞悬液的亲代生长培养板中制备2个测定板。
一个测定板放置于室温下，其他则在升高的温度中(初始的筛网采用55℃)一段时间(最初30分钟)。
经过指定的时间后，向每孔中加入0.08mL室温底物(TCP饱和的1mM Tris/SO42-pH7.8和1.5mM NaN3和0.1mM溴麝香草酚蓝)。TCP＝三氯丙烷。
在不同时间点获得在620nm的测定值以产生每孔的进程曲线。
分析数据，比较加热细胞和未加热细胞的动力学。每个板中含有1-2排(24孔)的未突变的20F12对照。
显示具有改良的稳定性的孔被重新培养，在同样的条件下检测。
根据这种步骤，在酶上被赋予热稳定性增加的突变克隆被测序以确定在每个位置上的准确氨基酸改变，这些位置对这些改良是特异的。分别鉴定具有在SED ID NO5和7中列出的核酸序列和在SEQ IDNO6和8中列出的多肽序列的突变体。在G182V(SEQ ID NO6)位置上的热突变也可是一个谷氨酸盐(Q)，具有相似的增加的热稳定性。同样地，P302A突变可改变为亮氨酸(L)，丝氨酸(S)，赖氨酸(K)或精氨酸(R)。这些变异体(以及下面的那些)包括在本发明中。
根据这些步骤，出现了9个单一位点突变，被赋予了增加的热稳定性。序列分析显示下列的变化是有益的D89G；F91S；T159L；G182Q，G182V；I220L；N238T；W251Y；P302A，P302L，P302S，P302K；P302R/S306R。仅有两个位点(189和302)超过一个替代。在列表中前5个合并(采用G189Q)成一个单一基因。
通过将酶在升高的温度下(55℃和80℃)孵育一段时间，测定热稳定性，并在30℃进行活性测定。在更高的温度下对初始率与时间进行作图。在50mM Tris/SO4pH7.8中的酶进行孵育并测定。通过标准的方法采用Fe(NO3)3和HgSCN对产物(CL-)进行检测。SEQ ID NO2的脱卤素酶被用作为实际的野生型。通过将数据拟合为指数衰减函数来计算表观半衰期(T1/2)。
尽管本发明已经关于某些优选的实施方案进行了详细的描述，但应该理解的是任何修饰和变化都是在所描述的和要求的精神和范围内的。
序列表<110>戴弗萨公司<120>具有脱卤素酶活性的酶及其使用方法<130>09010-118WO1<140>PCT/US01/45337<141>2001-11-30<150>US 60/250,897<151>2000-12-01<160>49<170>FastSEQ for Windows Version 4.0<210>1<211>954<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(951)<400>1atg ggg ggt tct cat cat cat cat cat cat ggt atg tct gaa ata ggt 48Met Gly Gly Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15acc ggt ttt ccc ttc gac cct cat tat gtg gaa gtc ctg ggc gag cgt 96Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30atg cac tac gtc gat gtt gga ccg cgg gat ggc acg cct gtg ctg ttc144Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45ctg cac ggt aac ccg acc tcg tcc tac ctg tgg cgc aac atc atc ccg192
Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60cat gta gca ccg agt cat cgg tgc att gct cca gac ctg atc ggg atg240His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80gga aaa tcg gac aaa cca gac ctc gat tat ttc ttc gac gac cac gtc288Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe Phe Asp Asp His Val85 90 95cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt ttg gaa gag gtc gtc336Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110ctg gtc atc cac gac tgg ggc tca gct ctc gga ttc cac tgg gcc aag384Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125cgc aat ccg gaa cgg gtc aaa ggt att gca tgt atg gaa ttc atc cgg432Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140cct atc ccg acg tgg gac gaa tgg ccg gaa ttc gcc cgt gag acc ttc480Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe145 150 155 160cag gcc ttc cgg acc gcc gac gtc ggc cga gag ttg atc atc gat cag528Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175aac gct ttc atc gag ggt gtg ctc ccg aaa tgc gtc gtc cgt ccg ctt576Asn Ala Phe Ile Glu Gly Val Leu Pro Lys Cys Val Val Arg Pro Leu180 185 190acg gag gtc gag atg gac cac tat cgc gag ccc ttc ctc aag cct gtt624Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205gac cga gag cca ctg tgg cga ttc ccc aac gag atc ccc atc gcc ggt672Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Ile Pro Ile Ala Gly210 215 220gag ccc gcg aac atc gtc gcg ctc gtc gag gca tac atg aac tgg ctg720
Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Asn Trp Leu225 230 235 240cac cag tca cct gtc ccg aag ttg ttg ttc tgg ggc aca ccc ggc gta768His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val245 250 255ctg atc ccc ccg gcc gaa gcc gcg aga ctt gcc gaa agc ctc ccc aac816Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn260 265 270tgc aag aca gtg gac atc ggc ccg gga ttg cac tac ctc cag gaa gac864Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285aac ccg gac ctt atc ggc agt gag atc gcg cgc tgg ctc ccc gga ctc912Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Pro Gly Leu290 295 300gct agc ggc cta ggt gac tac aag gac gat gat gac aaa taa954Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>2<211>317<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>2Met Gly Gly Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe Phe Asp Asp His Val
85 90 95Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe145 150 155 160Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175Asn Ala Phe Ile Glu Gly Val Leu Pro Lys Cys Val Val Arg Pro Leu180 185 190Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Ile Pro Ile Ala Gly210 215 220Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Asn Trp Leu225 230 235 240His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val245 250 255Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn260 265 270Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Pro Gly Leu290 295 300Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>3<211>954<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(951)<400>3atg ggg gat tct cat cat cat cat cat cat ggt atg tct gaa ata ggt 48Met Gly Asp Ser His His His His His His Gly Met Ser Glu Ile Gly
1 5 10 15acc ggt ttt ccc ttc gac cct cat tat gtg gaa gtc ctg ggc gag cgt 96Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30atg cac tac gtc gat gtt gga ccg cgg gat ggc acg cct gtg ctg ttc144Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45ctg cac ggt aac ccg acc tcg tcc tac ctg tgg cgc aac atc atc ccg192Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60cat gta gca ccg agt cat cgg tgc att gct cca gac ctg atc ggg atg240His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80gga aaa tcg gac aaa cca gac ctc gat tat ttc ttc gac gac cac gtc288Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe Phe Asp Asp His Val85 90 95cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt ttg gaa gag gtc gtc336Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110ctg gtc atc cac gac tgg ggc tca gct ctc gga ttc cac tgg gcc aag384Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125cgc aat ccg gaa cgg gtc aaa ggt att gca tgt atg gaa ttc atc cgg432Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140cct atc ccg acg tgg gac gaa tgg ccg gaa ttc gcc cgt gag acc ttc480Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe145 150 155 160cag gcc ttc cgg acc gcc gac gtc ggc cga gag ttg atc atc gat cag528Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175aac gct ttc atc gag ggt gtg ctc ccg aaa ttc gtc gtc cgt ccg ctt576Asn Ala Phe Ile Glu Gly Val Leu Pro Lys Phe Val Val Arg Pro Leu
180 185 190acg gag gtc gag atg gac cac tat cgc gag ccc ttc ctc aag cct gtt624Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205gac cga gag cca ctg tgg cga ttc ccc aac gag atc ccc atc gcc ggt672Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Ile Pro Ile Ala Gly210 215 220gag ccc gcg aac atc gtc gcg ctc gtc gag gca tac atg aac tgg ctg720Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Asn Trp Leu225 230 235 240cac cag tca cct gtc ccg aag ttg ttg ttc tgg ggc aca ccc ggc gta768His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val245 250 255ctg atc ccc ccg gcc gaa gcc gcg aga ctt gcc gaa agc ctc ccc aac816Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn260 265 270tgc aag aca gtg gac atc ggc ccg gga ttg cac tac ctc cag gaa gac864Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285aac ccg gac ctt atc ggc agt gag atc gcg cgc tgg ctc ccc gga ctc912Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Pro Gly Leu290 295 300gct agc ggc cta ggt gac tac aag gac gat gat gac aaa taa954Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>4<211>317<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>4
Met Gly Asp Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe Phe Asp Asp His Val85 90 95Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe145 150 155 160Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175Asn Ala Phe Ile Glu Gly Val Leu Pro Lys Phe Val Val Arg Pro Leu180 185 190Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Ile Pro Ile Ala Gly210 215 220Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Asn Trp Leu225 230 235 240His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly Thr Pro Gly Val245 250 255Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn260 265 270Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Pro Gly Leu290 295 300Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>5<211>954<212>DNA
<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)…(951)<400>5atg ggg gat tct cat cat cat cat cat cat ggt atg tct gaa ata ggt 48Met Gly Asp Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15acc ggt ttt ccc ttc gac cct cat tat gtg gaa gtc ctg ggc gag cgt 96Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30atg cac tac gtc gat gtt gga ccg cgg gat ggc acg cct gtg ctg ttc144Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45ctg cac ggt aac ccg acc tcg tcc tac ctg tgg cgc aac atc atc ccg192Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60cat gta gca ccg agt cat cgg tgc att gct cca gac ctg atc ggg atg240His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80gga aaa tcg gac aaa cca gac ctc ggt tat tcc ttc gac gac cac gtc288Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Ser Phe Asp Asp His Val85 90 95cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt ttg gaa gag gtc gtc336Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110ctg gtc atc cac gac tgg ggc tca gct ctc gga ttc cac tgg gcc aag384Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125cgc aat ccg gaa cgg gtc aaa ggt att gca tgt atg gaa ttc atc cgg432Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140
cct atc ccg acg tgg gac gaa tgg ccg gaa ttc gcc cgt gag ctc ttc480Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Leu Phe145 150 155 160cag gcc ttc cgg acc gcc gac gtc ggc cga gag ttg atc atc gat cag528Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175aac gct ttc atc gag cag gtg ctc ccg aaa ttc gtc gtc cgt ccg ctt576Asn Ala Phe Ile Glu Gln Val Leu Pro Lys Phe Val Val Arg Pro Leu180 185 190acg gag gtc gag atg gac cac tat cgc gag ccc ttc ctc aag cct gtt624Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205gac cga gag cca ctg tgg cga ttc ccc aac gag ctc ccc atc gcc ggt672Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly210 215 220gag ccc gcg aac atc gtc gcg ctc gtc gag gca tac atg acc tgg ctg720Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Thr Trp Leu225 230 235 240cac cag tca cct gtc ccg aag ttg ttg ttc tat ggc aca ccc ggc gta768His Gln Ser Pro Val Pro Lys Leu Leu Phe Tyr Gly Thr Pro Gly Val245 250 255ctg atc ccc ccg gcc gaa gcc gcg aga ctt gcc gaa agc ctc ccc aac816Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn260 265 270tgc aag aca gtg gac atc ggc ccg gga ttg cac tac ctc cag gaa gac864Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285aac ccg gac ctt atc ggc agt gag atc gcg cgc tgg ctc gcc gga ctc912Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Ala Gly Leu290 295 300gct agc ggc cta ggt gac tac aag gac gat gat gac aaa taa954Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315
<210>6<211>317<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>6Met Gly Asp Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Ser Phe Asp Asp His Val85 90 95Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Leu Phe145 150 155 160Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175Ash Ala Phe Ile Glu Gln Val Leu Pro Lys Phe Val Val Arg Pro Leu180 185 190Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly210 215 220Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Thr Trp Leu225 230 235 240His Gln Ser Pro Val Pro Lys Leu Leu Phe Tyr Gly Thr Pro Gly Val245 250 255Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn
260265 270Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp Leu Ala Gly Leu290 295 300Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>7<211>954<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)…(951)<400>7atg ggg gat tct cat cat cat cat cat cat ggt atg tct gaa ata ggt 48Met Gly Asp Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15acc ggt ttt ccc ttc gac cct cat tat gtg gaa gtc ctg ggc gag cgt 96Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30atg cac tac gtc gat gtt gga ccg cgg gat ggc acg cct gtg ctg ttc144Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45ctg cac ggt aac ccg acc tcg tcc tac ctg tgg cgc aac atc atc ccg192Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60cat gta gca ccg agt cat cgg tgc att gct cca gac ctg atc ggg atg240His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80gga aaa tcg gac aaa cca gac ctc ggt tat tcc ttc gac gac cac gtc288Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Ser Phe Asp Asp His Val85 90 95
cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt ttg gaa gag gtc gtc336Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110ctg gtc atc cac gac tgg ggc tca gct ctc gga ttc cac tgg gcc aag384Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125cgc aat ccg gaa cgg gtc aaa ggt att gca tgt atg gaa ttc atc cgg432Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140agt atc ccg acg tgg gac gaa tgg ccg gaa ttc gcc cgt gag acc ttc480Ser Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe145 150 155 160cag ctt ttc cgg acc gcc gac gtc ggc cga gag ttg atc atc gat cag528Gln Leu Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175aac gct ttc atc gag cag gtg ctc ccg aaa ttc gtc gtc cgt ccg ctt576Asn Ala Phe Ile Glu Gln Val Leu Pro Lys Phe Val Val Arg Pro Leu180 185 190acg gag gtc gag atg gac cac tat cgc gag ccc ttc ctc aag cct gtt624Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205gac cga gag cca ctg tgg cga ttc ccc aac gag ctc ccc atc gcc ggt672Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly210 215 220gag ccc gcg aac atc gtc gcg ctc gtc gag gca tac atg acc tgg ctg720Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Thr Trp Leu225 230 235 240cac cag tca cct gtc ccg aag ttg ttg ttc tat ggc aca ccc ggc gta768His Gln Ser Pro Val Pro Lys Leu Leu Phe Tyr Gly Thr Pro Gly Val245 250 255ctg atc ccc ccg gcc gaa gcc tcg aga ctt gcc gaa agc ctc ccc aac816Leu Ile Pro Pro Ala Glu Ala Ser Arg Leu Ala Glu Ser Leu Pro Asn260 265 270
tgc aag aca gtg gac atc ggc ccg gga ttg cac tac ctc cag gaa gac864Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285aac ccg gac ctt atc ggc agt gag atc gcg ctg tgg ctc gcc gga ctc912Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Leu Trp Leu Ala Gly Leu290 295 300gct agc ggc cta ggt gac tac aag gac gat gat gac aaa taa954Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>8<211>317<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>8Met Gly Asp Ser His His His His His His Gly Met Ser Glu Ile Gly1 5 10 15Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val Leu Gly Glu Arg20 25 30Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr Pro Val Leu Phe35 40 45Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Ile Pro50 55 60His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp Leu Ile Gly Met65 70 75 80Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Ser Phe Asp Asp His Val85 90 95Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu Glu Val Val100 105 110Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His Trp Ala Lys115 120 125Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu Phe Ile Arg130 135 140Ser Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg Glu Thr Phe145 150 155 160Gln Leu Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile Asp Gln165 170 175
Asn Ala Phe Ile Glu Gln Val Leu Pro Lys Phe Val Val Arg Pro Leu180 185 190Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val195 200 205Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu Pro Ile Ala Gly210 215 220Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Thr Trp Leu225 230 235 240His Gln Ser Pro Val Pro Lys Leu Leu Phe Tyr Gly Thr Pro Gly Val245 250 255Leu Ile Pro Pro Ala Glu Ala Ser Arg Leu Ala Glu Ser Leu Pro Asn260 265 270Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His Tyr Leu Gln Glu Asp275 280 285Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Leu Trp Leu Ala Gly Leu290 295 300Ala Ser Gly Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys305 310 315<210>9<211>870<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(867)<400>9atg aac gca acg gaa cac gac aag cgc tac atc gag gtg ctg ggt aag 48Met Asn Ala Thr Glu His Asp Lys Arg Tyr Ile Glu Val Leu Gly Lys1 5 10 15cga atg gcc tat gtc gag atg ggc gag ggt gat ccc atc att ttc caa 96Arg Met Ala Tyr Val Glu Met Gly Glu Gly Asp Pro Ile Ile Phe Gln20 25 30cac ggc aat ccg acc tca tcg tac ctg tgg cgc aac atc atg ccc cat144His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Met Pro His35 40 45gtg caa cag ctc ggt cgc tgc ata gcg ctc gac ctg atc ggc atg ggc192
Val Gln Gln Leu Gly Arg Cys Ile Ala Leu Asp Leu Ile Gly Met Gly50 55 60gat tca gaa aaa ctc gag gac tcc gga ccc gag cgc tac acg ttc gtc240Asp Ser Glu Lys Leu Glu Asp Ser Gly Pro Glu Arg Tyr Thr Phe Val65 70 75 80gag cac agc cgg tat ttt gat gcc gcg ctc gaa gcc ctg ggt gtg acg288Glu His Ser Arg Tyr Phe Asp Ala Ala Leu Glu Ala Leu Gly Val Thr85 90 95agc aac gtg acg ctg gtg atc cac gat tgg ggt tca gcg ctg ggc ttc336Ser Asn Val Thr Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe100 105 110cac tgg gct aac cgc tat cgt gat gac gta aaa ggt atc tgc tac atg384His Trp Ala Asn Arg Tyr Arg Asp Asp Val Lys Gly Ile Cys Tyr Met115 120 125gaa gcc atc gtg tcg ccg ctg acc tgg gat acg ttt ccg gaa ggt gcg432Glu Ala Ile Val Ser Pro Leu Thr Trp Asp Thr Phe Pro Glu Gly Ala130 135 140cgt ggt gtt ttc cag ggg ttt cgt tca ccg gct ggc gaa gca atg gtg480Arg Gly Val Phe Gln Gly Phe Arg Ser Pro Ala Gly Glu Ala Met Val145 150 155 160ctt gag aac aat gtg ttc gtc gaa aac gta ctt ccc ggg tcg ata ctc528Leu Glu Asn Asn Val Phe Val Glu Asn Val Leu Pro Gly Ser Ile Leu165 170 175aga gac ctc agc gag gaa gaa atg aac gtc tac cgg cgc cct ttc acg576Arg Asp Leu Ser Glu Glu Glu Met Asn Val Tyr Arg Arg Pro Phe Thr180 185 190gag cct ggc gaa ggt cgg cgt ccg acg ctc acc tgg cca cgg cag att624Glu Pro Gly Glu Gly Arg Arg Pro Thr Leu Thr Trp Pro Arg Gln Ile195 200 205ccg atc gat ggc gaa cct gca gac gtc gtc gcc ctg gta gcc gag tac672Pro Ile Asp Gly Glu Pro Ala Asp Val Val Ala Leu Val Ala Glu Tyr210 215 220gcc gcc tgg ttg cag agt gcg gaa gta ccg aag ttg ttt gtg aat gct720
Ala Ala Trp Leu Gln Ser Ala Glu Val Pro Lys Leu Phe Val Asn Ala225 230 235 240gaa cca ggg gcg ttg ctc acg gga ccg cag cgc gag ttc tgc cgg agt768Glu Pro Gly Ala Leu Leu Thr Gly Pro Gln Arg Glu Phe Cys Arg Ser245 250 255tgg acc aat cag agc gag gtc acc gtg tca ggt agc cac ttc atc cag816Trp Thr Asn Gln Ser Glu Val Thr Val Ser Gly Ser His Phe Ile Gln260 265 270gaa gat tca ccg gat gag atc ggt gaa gca ttg aaa gtg tgg atg act864Glu Asp Ser Pro Asp Glu Ile Gly Glu Ala Leu Lys Val Trp Met Thr275 280 285gga tag870Gly<210>10<211>289<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>10Met Asn Ala Thr Glu His Asp Lys Arg Tyr Ile Glu Val Leu Gly Lys1 5 10 15Arg Met Ala Tyr Val Glu Met Gly Glu Gly Asp Pro Ile Ile Phe Gln20 25 30His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Ile Met Pro His35 40 45Val Gln Gln Leu Gly Arg Cys Ile Ala Leu Asp Leu Ile Gly Met Gly50 55 60Asp Ser Glu Lys Leu Glu Asp Ser Gly Pro Glu Arg Tyr Thr Phe Val65 70 75 80Glu His Ser Arg Tyr Phe Asp Ala Ala Leu Glu Ala Leu Gly Val Thr85 90 95Ser Asn Val Thr Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe100 105 110His Trp Ala Asn Arg Tyr Arg Asp Asp Val Lys Gly Ile Cys Tyr Met
115 120 125Glu Ala Ile Val Ser Pro Leu Thr Trp Asp Thr Phe Pro Glu Gly Ala130 135 140Arg Gly Val Phe Gln Gly Phe Arg Ser Pro Ala Gly Glu Ala Met Val145 150 155 160Leu Glu Asn Asn Val Phe Val Glu Asn Val Leu Pro Gly Ser Ile Leu165 170 175Arg Asp Leu Ser Glu Glu Glu Met Asn Val Tyr Arg Arg Pro Phe Thr180 185 190Glu Pro Gly Glu Gly Arg Arg Pro Thr Leu Thr Trp Pro Arg Gln Ile195 200 205Pro Ile Asp Gly Glu Pro Ala Asp Val Val Ala Leu Val Ala Glu Tyr210 215 220Ala Ala Trp Leu Gln Ser Ala Glu Val Pro Lys Leu Phe Val Asn Ala225 230 235 240Glu Pro Gly Ala Leu Leu Thr Gly Pro Gln Arg Glu Phe Cys Arg Ser245 250 255Trp Thr Asn Gln Ser Glu Val Thr Val Ser Gly Ser His Phe Ile Gln260 265 270Glu Asp Ser Pro Asp Glu Ile Gly Glu Ala Leu Lys Val Trp Met Thr275 280 285Gly<210>11<211>882<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(879)<400>11atg cag gtg ggg atc gcc gct acg ctc gcc gaa atg gac aag aaa cgt 48Met Gln Val Gly Ile Ala Ala Thr Leu Ala Glu Met Asp Lys Lys Arg1 5 10 15gtc cgt gtg tac aac gcg gag atg gcc tat gtc gac acg ggc cag ggt96Val Arg Val Tyr Asn Ala Glu Met Ala Tyr Val Asp Thr Gly Gln Gly20 25 30
gat tcc gtt ctg ttt ctt cac ggc aac ccg acg tcg tcg tat ctg tgg144Asp Ser Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45agg ggc gta atg cct ttt gtg acg gac gtc gcc cga tgt gtg gct ccg192Arg Gly Val Met Pro Phe Val Thr Asp Val Ala Arg Cys Val Ala Pro50 55 60gac ctg atc ggt atg ggc gat tcc gac aag ctc gag tcg tcg atg tac240Asp Leu Ile Gly Met Gly Asp Ser Asp Lys Leu Glu Ser Ser Met Tyr65 70 75 80cgc ttc gag gat cac cgg cgg tac ctg gat ggt ttc ctc gat gcg gtg288Arg Phe Glu Asp His Arg Arg Tyr Leu Asp Gly Phe Leu Asp Ala Val85 90 95gac atc gga gac gat gtg acg gtt gtg gtg cac gac tgg ggc tct gca336Asp Ile Gly Asp Asp Val Thr Val Val Val His Asp Trp Gly Ser Ala100 105 110ctc ggc ttc gac tgg gcg aac cgg cac cgc gac cgg gtc aaa gga atc384Leu Gly Phe Asp Trp Ala Asn Arg His Arg Asp Arg Val Lys Gly Ile115 120 125gca tac atg gaa gcg atc gtt cgt cca ttg agc tgg gag gag tgg ccg432Ala Tyr Met Glu Ala Ile Val Arg Pro Leu Ser Trp Glu Glu Trp Pro130 135 140gac gca tct cgc cgc ctg ttc gag gca atg cgc tca gac gcg ggg gag480Asp Ala Ser Arg Arg Leu Phe Glu Ala Met Arg Ser Asp Ala Gly Glu145 150 155 160gag atc gtt ctc gaa aag aat gtc ttc gtc gag cgg att ctg ctc ggc528Glu Ile Val Leu Glu Lys Asn Val Phe Val Glu Arg Ile Leu Leu Gly165 170 175tcg gtc ctt tgt gat ctg acc gag gag gaa atg gcg gag tac cgg cgc576Ser Val Leu Cys Asp Leu Thr Glu Glu Glu Met Ala Glu Tyr Arg Arg180 185 190ccg tac ctc gag ccg ggt gag tca cgg cgc ccg atg ctg aca tgg cca624Pro Tyr Leu Glu Pro Gly Glu Ser Arg Arg Pro Met Leu Thr Trp Pro195 200 205
cgc gag atc ccg atc gac ggc cac ccc gcc gac gtt gcg aag atc gtc672Arg Glu Ile Pro Ile Asp Gly His Pro Ala Asp Val Ala Lys Ile Val210 215 220gcg gag tac tcg tcg tgg ctc tcc ggg tcg gag gtg ccg aag ctc ttc720Ala Glu Tyr Ser Ser Trp Leu Ser Gly Ser Glu Val Pro Lys Leu Phe225 230 235 240gtc gat gcc gac ccg ggc gcc atc ctg aca ggt ccg aag cga gac ttc768Val Asp Ala Asp Pro Gly Ala Ile Leu Thr Gly Pro Lys Arg Asp Phe245 250 255tgc agg gcg tgg ccg aac cag gtc gag acg acc gtg gca gga atc cac816Cys Arg Ala Trp Pro Asn Gln Val Glu Thr Thr Val Ala Gly Ile His260 265 270ttc ata cag gag gat tcc tcc gcc gag atc gga gcc gcg atc agg acc864Phe Ile Gln Glu Asp Ser Ser Ala Glu Ile Gly Ala Ala Ile Arg Thr275 280 285tgg tac ctg gga ctc tga882Trp Tyr Leu Gly Leu290<210>12<211>293<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>12Met Gln Val Gly Ile Ala Ala Thr Leu Ala Glu Met Asp Lys Lys Arg1 5 10 15Val Arg Val Tyr Asn Ala Glu Met Ala Tyr Val Asp Thr Gly Gln Gly20 25 30Asp Ser Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Gly Val Met Pro Phe Val Thr Asp Val Ala Arg Cys Val Ala Pro50 55 60Asp Leu Ile Gly Met Gly Asp Ser Asp Lys Leu Glu Ser Ser Met Tyr65 70 75 80
Arg Phe Glu Asp His Arg Arg Tyr Leu Asp Gly Phe Leu Asp Ala Val85 90 95Asp Ile Gly Asp Asp Val Thr Val Val Val His Asp Trp Gly Ser Ala100 105 110Leu Gly Phe Asp Trp Ala Asn Arg His Arg Asp Arg Val Lys Gly Ile115 120 125Ala Tyr Met Glu Ala Ile Val Arg Pro Leu Ser Trp Glu Glu Trp Pro130 135 140Asp Ala Ser Arg Arg Leu Phe Glu Ala Met Arg Ser Asp Ala Gly Glu145 150 155 160Glu Ile Val Leu Glu Lys Asn Val Phe Val Glu Arg Ile Leu Leu Gly165 170 175Ser Val Leu Cys Asp Leu Thr Glu Glu Glu Met Ala Glu Tyr Arg Arg180 185 190Pro Tyr Leu Glu Pro Gly Glu Ser Arg Arg Pro Met Leu Thr Trp Pro195 200 205Arg Glu Ile Pro Ile Asp Gly His Pro Ala Asp Val Ala Lys Ile Val210 215 220Ala Glu Tyr Ser Ser Trp Leu Ser Gly Ser Glu Val Pro Lys Leu Phe225 230 235 240Val Asp Ala Asp Pro Gly Ala Ile Leu Thr Gly Pro Lys Arg Asp Phe245 250 255Cys Arg Ala Trp Pro Asn Gln Val Glu Thr Thr Val Ala Gly Ile His260 265 270Phe Ile Gln Glu Asp Ser Ser Ala Glu Ile Gly Ala Ala Ile Arg Thr275 280 285Trp Tyr Leu Gly Leu290<210>13<211>849<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(846)<400>13atg gag aaa cac cgc gta gaa gtt ctc ggt tcg gag atg gcc tac atc 48Met Glu Lys His Arg Val Glu Val Leu Gly Ser Glu Met Ala Tyr Ile1 5 10 15
gac gtg gga gag ggc gac ccg atc gtg ttc ctc cac gga aat ccc acg 96Asp Val Gly Glu Gly Asp Pro Ile Val Phe Leu His Gly Asn Pro Thr20 25 30tcg tcg tac ctg tgg cgg aac gtg att ccc cac gtt gcc ggc ttg gga144Ser Ser Tyr Leu Trp Arg Asn Val Ile Pro His Val Ala Gly Leu Gly35 40 45cgc tgc atc gcc ccg gat ctg atc ggc atg gga gac tcg gat aag gtc192Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Asp Lys Val50 55 60cat ggt ctc gag tac cgc ttc gtt gat cac cgc cgg tac ctc gac gcc240His Gly Leu Glu Tyr Arg Phe Val Asp His Arg Arg Tyr Leu Asp Ala65 70 75 80ttc ctt gaa gcg gtc ggc gtt gag gat gct gtg aca ttc atc gta cac288Phe Leu Glu Ala Val Gly Val Glu Asp Ala Val Thr Phe Ile Val His85 90 95gac tgg ggc tcg gct ctc gga ttc gac tgg gcg aac cgt cac cgt gaa336Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn Arg His Arg Glu100 105 110gcg gtc gaa ggc atc gca tac atg gag gcg atc gtg cac ccg gtt gct384Ala Val Glu Gly Ile Ala Tyr Met Glu Ala Ile Val His Pro Val Ala115 120 125tgg aac gac tgg ccg gag ctc tct cga ccg ata ttt cag gcg atg agg432Trp Asn Asp Trp Pro Glu Leu Ser Arg Pro Ile Phe Gln Ala Met Arg130 135 140tcc tcg tcc ggt gag aag atc gtg ctt gag aag aac gtg ttc gtg gag480Ser Ser Ser Gly Glu Lys Ile Val Leu Glu Lys Asn Val Phe Val Glu145 150 155 160cga atc ctg ccc gct tcc gtg atg cgc gat ctg agc gac gac gag atg528Arg Ile Leu Pro Ala Ser Val Met Arg Asp Leu Ser Asp Asp Glu Met165 170 175gat gag tac cgt cga ccg ttc cag aac ccg gga gag gat cga aga ccc576Asp Glu Tyr Arg Arg Pro Phe Gln Asn Pro Gly Glu Asp Arg Arg Pro180 185 190
acg ctg acg tgg cca cgg gag atc ccg atc gat gga gaa ccg ggg gac624Thr Leu Thr Trp Pro Arg Glu Ile Pro Ile Asp Gly Glu Pro Gly Asp195 200 205gtc gcc gcc atc gtc gat gac tac ggg cga tgg ctc tcg gag agc gat672Val Ala Ala Ile Val Asp Asp Tyr Gly Arg Trp Leu Ser Glu Ser Asp210 215 220gtc cca aag ctc ttc atc gac gcg gat ccg gga gcg atc ctc gtg ggt720Val Pro Lys Leu Phe Ile Asp Ala Asp Pro Gly Ala Ile Leu Val Gly225 230 235 240cca gcg cgt ggg ttc tgc cgc ggc tgg cgg aac cag acc gaa gtg agc768Pro Ala Arg Gly Phe Cys Arg Gly Trp Arg Asn Gln Thr Glu Val Ser245 250 255gtc aca gga acc cac ttc atc cag gaa gac tct ccc gac gag atc ggc816Val Thr Gly Thr His Phe Ile Gln Glu Asp Ser Pro Asp Glu Ile Gly260 265 270gct gcg ctg gct cga tgg atc gag aac cgg taa849Ala Ala Leu Ala Arg Trp Ile Glu Asn Arg275 280<210>14<211>282<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>14Met Glu Lys His Arg Val Glu Val Leu Gly Ser Glu Met Ala Tyr Ile1 5 10 15Asp Val Gly Glu Gly Asp Pro Ile Val Phe Leu His Gly Asn Pro Thr20 25 30Ser Ser Tyr Leu Trp Arg Asn Val Ile Pro His Val Ala Gly Leu Gly35 40 45Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Asp Lys Val50 55 60His Gly Leu Glu Tyr Arg Phe Val Asp His Arg Arg Tyr Leu Asp Ala
65 70 75 80Phe Leu Glu Ala Val Gly Val Glu Asp Ala Val Thr Phe Ile Val His85 90 95Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn Arg His Arg Glu100 105 110Ala Val Glu Gly Ile Ala Tyr Met Glu Ala Ile Val His Pro Val Ala115 120 125Trp Asn Asp Trp Pro Glu Leu Ser Arg Pro Ile Phe Gln Ala Met Arg130 135 140Ser Ser Ser Gly Glu Lys Ile Val Leu Glu Lys Asn Val Phe Val Glu145 150 155 160Arg Ile Leu Pro Ala Ser Val Met Arg Asp Leu Ser Asp Asp Glu Met165 170 175Asp Glu Tyr Arg Arg Pro Phe Gln Asn Pro Gly Glu Asp Arg Arg Pro180 185 190Thr Leu Thr Trp Pro Arg Glu Ile Pro Ile Asp Gly Glu Pro Gly Asp195 200 205Val Ala Ala Ile Val Asp Asp Tyr Gly Arg Trp Leu Ser Glu Ser Asp210 215 220Val Pro Lys Leu Phe Ile Asp Ala Asp Pro Gly Ala Ile Leu Val Gly225 230 235 240Pro Ala Arg Gly Phe Cys Arg Gly Trp Arg Asn Gln Thr Glu Val Ser245 250 255Val Thr Gly Thr His Phe Ile Gln Glu Asp Ser Pro Asp Glu Ile Gly260 265 270Ala Ala Leu Ala Arg Trp Ile Glu Asn Arg275 280<210>15<211>876<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(873)<400>15atg gct agc gcg cct atc gac ccg acc gac ccg cat ccg aga aag cgg 48Met Ala Ser Ala Pro Ile Asp Pro Thr Asp Pro His Pro Arg Lys Arg1 5 10 15
atc gcc gtg ctc gat tcg gag atg agc tac gtc gat acc ggc gag gga 96Ile Ala Val Leu Asp Ser Glu Met Ser Tyr Val Asp Thr Gly Glu Gly20 25 30gcg ccg atc gtg ttc ctt cac ggc aac ccg act tcc tcc tat ctt tgg144Ala Pro Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45cgc aac atc atc ccc tat ctc gcg gat cac ggc aga tgc ctc gca ccg192Arg Asn Ile Ile Pro Tyr Leu Ala Asp His Gly Arg Cys Leu Ala Pro50 55 60gat ctg gtc ggg atg ggc cgc tcc gga aaa tcg ccg acc cgg tcc tat240Asp Leu Val Gly Met Gly Arg Ser Gly Lys Ser Pro Thr Arg Ser Tyr65 70 75 80ggc ttt acc gat cac gcg cgc tat ttg gac gca tgg ttc gac gcc ctg288Gly Phe Thr Asp His Ala Arg Tyr Leu Asp Ala Trp Phe Asp Ala Leu85 90 95gac ctg acc cgc gac gtg acc ctg gtg att cat gac tgg gga tcg gcg336Asp Leu Thr Arg Asp Val Thr Leu Val Ile His Asp Trp Gly Ser Ala100 105 110ctg ggc ttc cac cgt gcc ttt cgc ttc ccc gaa cag atc aag gcg atc384Leu Gly Phe His Arg Ala Phe Arg Phe Pro Glu Gln Ile Lys Ala Ile115 120 125gcc tat atg gag gcc atc gtc cgg ccg ctc gtc tgg gcc gac atc gcc432Ala Tyr Met Glu Ala Ile Val Arg Pro Leu Val Trp Ala Asp Ile Ala130 135 140ggc gcc gag cag gcg ttt cgc gcg atc cga tcc gag gcc ggc gaa cac480Gly Ala Glu Gln Ala Phe Arg Ala Ile Arg Ser Glu Ala Gly Glu His145 150 155 160atg att ctg gac gag aac ttt ttc gtc gaa gtg ctc ctt ccg gcg agc528Met Ile Leu Asp Glu Asn Phe Phe Val Glu Val Leu Leu Pro Ala Ser165 170 175atc ctg cgc aga ttg agc gat ctg gag atg gcc gcc tac cgc gca ccg576Ile Leu Arg Arg Leu Ser Asp Leu Glu Met Ala Ala Tyr Arg Ala Pro180 185 190
ttc ctc gac cgg gag tcg cga tgg ccg acc ctg cgc tgg ccg cgc gag624Phe Leu Asp Arg Glu Ser Arg Trp Pro Thr Leu Arg Trp Pro Arg Glu195 200 205gtt ccg atc gag ggg gag ccg gcc gac gtg acc gcc atc gtc gag gcc672Val Pro Ile Glu Gly Glu Pro Ala Asp Val Thr Ala Ile Val Glu Ala210 215 220tac gga cga tgg atg gcc gag aac acg ctg ccg aag ctg ctg gtc ttg720Tyr Gly Arg Trp Met Ala Glu Asn Thr Leu Pro Lys Leu Leu Val Leu225 230 235 240ggt gat ccg gga gtg atc gct acc ggc cgc acg cgc gac ttc tgt cga768Gly Asp Pro Gly Val Ile Ala Thr Gly Arg Thr Arg Asp Phe Cys Arg245 250 255agc tgg aag aat cag cgg gag gtc acc gta tcc ggc agc cac ttc ctt816Ser Trp Lys Asn Gln Arg Glu Val Thr Val Ser Gly Ser His Phe Leu260 265 270cag gaa gac tcg ccg cac gag atc ggc ctc gcg ctc cgg gat ttc gtg864Gln Glu Asp Ser Pro His Glu Ile Gly Leu Ala Leu Arg Asp Phe Val275 280 285cgg tcg gcg taa876Arg Ser Ala290<210>16<211>291<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>16Met Ala Ser Ala Pro Ile Asp Pro Thr Asp Pro His Pro Arg Lys Arg1 5 10 15Ile Ala Val Leu Asp Ser Glu Met Ser Tyr Val Asp Thr Gly Glu Gly20 25 30Ala Pro Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45
Arg Asn Ile Ile Pro Tyr Leu Ala Asp His Gly Arg Cys Leu Ala Pro50 55 60Asp Leu Val Gly Met Gly Arg Ser Gly Lys Ser Pro Thr Arg Ser Tyr65 70 75 80Gly Phe Thr Asp His Ala Arg Tyr Leu Asp Ala Trp Phe Asp Ala Leu85 90 95Asp Leu Thr Arg Asp Val Thr Leu Val Ile His Asp Trp Gly Ser Ala100 105 110Leu Gly Phe His Arg Ala Phe Arg Phe Pro Glu Gln Ile Lys Ala Ile115 120 125Ala Tyr Met Glu Ala Ile Val Arg Pro Leu Val Trp Ala Asp Ile Ala130 135 140Gly Ala Glu Gln Ala Phe Arg Ala Ile Arg Ser Glu Ala Gly Glu His145 150 155 160Met Ile Leu Asp Glu Asn Phe Phe Val Glu Val Leu Leu Pro Ala Ser165 170 175Ile Leu Arg Arg Leu Ser Asp Leu Glu Met Ala Ala Tyr Arg Ala Pro180 185 190Phe Leu Asp Arg Glu Ser Arg Trp Pro Thr Leu Arg Trp Pro Arg Glu195 200 205Val Pro Ile Glu Gly Glu Pro Ala Asp Val Thr Ala Ile Val Glu Ala210 215 220Tyr Gly Arg Trp Met Ala Glu Asn Thr Leu Pro Lys Leu Leu Val Leu225 230 235 240Gly Asp Pro Gly Val Ile Ala Thr Gly Arg Thr Arg Asp Phe Cys Arg245 250 255Ser Trp Lys Asn Gln Arg Glu Val Thr Val Ser Gly Ser His Phe Leu260 265 270Gln Glu Asp Ser Pro His Glu Ile Gly Leu Ala Leu Arg Asp Phe Val275 280 285Arg Ser Ala290<210>17<211>918<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(915)
<400>17atg caa tta acg aat gaa aca gaa gcc aac gcg atc tct gcg aca agt 48Met Gln Leu Thr Asn Glu Thr Glu Ala Asn Ala Ile Ser Ala Thr Ser1 5 10 15ccc tac cca aaa ttt cgg cgg tcg gtc ttc ggc cgc gag atg gcg tac 96Pro Tyr Pro Lys Phe Arg Arg Ser Val Phe Gly Arg Glu Met Ala Tyr20 25 30gtg gaa gtg gga cgg ggc gac ccc atc gta ctc ttg cac ggc aac ccc144Val Glu Val Gly Arg Gly Asp Pro Ile Val Leu Leu His Gly Asn Pro35 40 45acc tcg tcg tac ctc tgg cgc aac gtg ttg ccg cac ctg gcg ccg tta192Thr Ser Ser Tyr Leu Trp Arg Asn Val Leu Pro His Leu Ala Pro Leu50 55 60ggc cgc tgt atc gct cca gac ctg att ggt atg gga gac tca gac aaa240Gly Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Asp Lys65 70 75 80ctg cgt gac agt ggg ccg ggc tca tat cgc ttc gtc gag cag cgc cgt288Leu Arg Asp Ser Gly Pro Gly Ser Tyr Arg Phe Val Glu Gln Arg Arg85 90 95tac ctc gac gcc ctg ctc gag gct ctg gac gtg cac gag cga gtc acg336Tyr Leu Asp Ala Leu Leu Glu Ala Leu Asp Val His Glu Arg Val Thr100 105 110ttt gtc atc cat gac tgg ggc tcg gcc ctc gga ttt gat tgg gcc aac384Phe Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn115 120 125cgc cac cgc gaa gca atg agg ggt atc gcg tac atg gag gcg att gtg432Arg His Arg Glu Ala Met Arg Gly Ile Ala Tyr Met Glu Ala Ile Val130 135 140cgg ccg cag ggc ggg gac cac tgg gac aac atc aac atg cgt cca ccc480Arg Pro Gln Gly Gly Asp His Trp Asp Asn Ile Asn Met Arg Pro Pro145 150 155 160ttg cag gcg ctg cgt tca tgg gcc ggc gag gtg atg gtc ctg caa gac528Leu Gln Ala Leu Arg Ser Trp Ala Gly Glu Val Met Val Leu Gln Asp165 170 175
aac ttc ttt atc gag aag atg ctg cca ggg ggc atc ctg cgc gcc ctc576Asn Phe Phe Ile Glu Lys Met Leu Pro Gly Gly Ile Leu Arg Ala Leu180 185 190tcc gca ggg gag atg gca gaa tac cgg cgg ccg ttt gcc gag ccc ggc624Ser Ala Gly Glu Met Ala Glu Tyr Arg Arg Pro Phe Ala Glu Pro Gly195 200 205gag ggg cga cga ccg acg ctg aca tgg ccc cgg gaa ctc ccc ata gaa672Glu Gly Arg Arg Pro Thr Leu Thr Trp Pro Arg Glu Leu Pro Ile Glu210 215 220ggc gac ccc gcc gaa gtg gct gcg atc gtg gcc gcc tac gcg gac tgg720Gly Asp Pro Ala Glu Val Ala Ala Ile Val Ala Ala Tyr Ala Asp Trp225 230 235 240tta gcg aca agt gat gtg ccc aag ctt ttc ctg aag gcc gag ccc ggg768Leu Ala Thr Ser Asp Val Pro Lys Leu Phe Leu Lys Ala Glu Pro Gly245 250 255gcg ctc atc gcc ggc gga gcg aat ctc gag acc gtc cgc aaa tgg ccg816Ala Leu Ile Ala Gly Gly Ala Asn Leu Glu Thr Val Arg Lys Trp Pro260 265 270gcg cag acc gag gta acg gtc gcg ggg atc cat ttc atc cag gaa gat864Ala Gln Thr Glu Val Thr Val Ala Gly Ile His Phe Ile Gln Glu Asp275 280 285tcg ccg gac gag atc ggc cgg gcg atc gcc gat tgg atg agg gcg ttg912Ser Pro Asp Glu Ile Gly Arg Ala Ile Ala Asp Trp Met Arg Ala Leu290 295 300agc tga918Ser305<210>18<211>305<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>18Met Gln Leu Thr Asn Glu Thr Glu Ala Asn Ala Ile Ser Ala Thr Ser1 5 10 15Pro Tyr Pro Lys Phe Arg Arg Ser Val Phe Gly Arg Glu Met Ala Tyr20 25 30Val Glu Val Gly Arg Gly Asp Pro Ile Val Leu Leu His Gly Asn Pro35 40 45Thr Ser Ser Tyr Leu Trp Arg Asn Val Leu Pro His Leu Ala Pro Leu50 55 60Gly Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Asp Lys65 70 75 80Leu Arg Asp Ser Gly Pro Gly Ser Tyr Arg Phe Val Glu Gln Arg Arg85 90 95Tyr Leu Asp Ala Leu Leu Glu Ala Leu Asp Val His Glu Arg Val Thr100 105 110Phe Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn115 120 125Arg His Arg Glu Ala Met Arg Gly Ile Ala Tyr Met Glu Ala Ile Val130 135 140Arg Pro Gln Gly Gly Asp His Trp Asp Asn Ile Asn Met Arg Pro Pro145 150 155 160Leu Gln Ala Leu Arg Ser Trp Ala Gly Glu Val Met Val Leu Gln Asp165 170 175Asn Phe Phe Ile Glu Lys Met Leu Pro Gly Gly Ile Leu Arg Ala Leu180 185 190Ser Ala Gly Glu Met Ala Glu Tyr Arg Arg Pro Phe Ala Glu Pro Gly195 200 205Glu Gly Arg Arg Pro Thr Leu Thr Trp Pro Arg Glu Leu Pro Ile Glu210 215 220Gly Asp Pro Ala Glu Val Ala Ala Ile Val Ala Ala Tyr Ala Asp Trp225 230 235 240Leu Ala Thr Ser Asp Val Pro Lys Leu Phe Leu Lys Ala Glu Pro Gly245 250 255Ala Leu Ile Ala Gly Gly Ala Asn Leu Glu Thr Val Arg Lys Trp Pro260 265 270Ala Gln Thr Glu Val Thr Val Ala Gly Ile His Phe Ile Gln Glu Asp275 280 285Ser Pro Asp Glu Ile Gly Arg Ala Ile Ala Asp Trp Met Arg Ala Leu290 295 300Ser305
<210>19<211>912<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(909)<400>19atg ctc gtt gcg cag aca agg aag cat cca atg act gaa acg ccg ctg 48Met Leu Val Ala Gln Thr Arg Lys His Pro Met Thr Glu Thr Pro Leu1 5 10 15aca aaa aac acc gtc gat gtg ctg ggc acg tcg atg gcc tat cac gcg 96Thr Lys Asn Thr Val Asp Val Leu Gly Thr Ser Met Ala Tyr His Ala20 25 30cgc ggc gag ggt gcg cca ata ttg ttt ctg cac ggc aac ccg acc tcg144Arg Gly Glu Gly Ala Pro Ile Leu Phe Leu His Gly Asn Pro Thr Ser35 40 45tcc tat ctg tgg cgc gac gtc att ccc gaa ctg gag gga cgc ggc cgg192Ser Tyr Leu Trp Arg Asp Val Ile Pro Glu Leu Glu Gly Arg Gly Arg50 55 60ctg atc gcg ccg gat ctg atc ggg atg ggc gat tcc gcc aaa ttg cca240Leu Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Ala Lys Leu Pro65 70 75 80gat ccc ggt gcg gac acc tat cgc ttc acg act cat cgc aaa tat ctc288Asp Pro Gly Ala Asp Thr Tyr Arg Phe Thr Thr His Arg Lys Tyr Leu85 90 95gat gcc ttc gtc gat gcg gtg atc ggc ccg gcg caa tcc atc gtg atg336Asp Ala Phe Val Asp Ala Val Ile Gly Pro Ala Gln Ser Ile Val Met100 105 110gtg gtg cac gac tgg ggc tcg gcg ctc ggt ttc gac tgg gcc aac cgt384Val Val His Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn Arg115 120 125
cac cgc aac cgt atc cgt ggt atc gcc tat atg gag ggg atc gtg cgc432His Arg Asn Arg Ile Arg Gly Ile Ala Tyr Met Glu Gly Ile Val Arg130 135 140ccg atc gcc tcc tgg gat gaa tgg agc gcg tcg gcc acg ccg atc ttc480Pro Ile Ala Ser Trp Asp Glu Trp Ser Ala Ser Ala Thr Pro Ile Phe145 150 155 160cag gga ttt cgc tcc gac aag ggc gag acc atg atc ctg gag cgc aac528Gln Gly Phe Arg Ser Asp Lys Gly Glu Thr Met Ile Leu Glu Arg Asn165 170 175atg ttc gtc gag cgg gtg ctg ccg ggg tcg gtg ttg cgg aaa ctg acc576Met Phe Val Glu Arg Val Leu Pro Gly Ser Val Leu Arg Lys Leu Thr180 185 190gag gcc gag atg gcg gaa tac cgc cgg ccc tat ccg aaa gcc gag gac624Glu Ala Glu Met Ala Glu Tyr Arg Arg Pro Tyr Pro Lys Ala Glu Asp195 200 205cgc tgg ccg acg ctg acc tgg ccg cgc cag atc ccg atc gcc ggc gaa672Arg Trp Pro Thr Leu Thr Trp Pro Arg Gln Ile Pro Ile Ala Gly Glu210 215 220ccc gcc gat gtg gtg cag atc gcg gcg gag tat tca cga tgg atg gcg720Pro Ala Asp Val Val Gln Ile Ala Ala Glu Tyr Ser Arg Trp Met Ala225 230 235 240gag aac gac atc cca aaa ctg ttc gtc aac gcc gag ccc ggt gcg atc768Glu Asn Asp Ile Pro Lys Leu Phe Val Asn Ala Glu Pro Gly Ala Ile245 250 255ctg acc ggc gcg ccc cgg gat ttc tgc cga agc tgg aaa agc cag acc816Leu Thr Gly Ala Pro Arg Asp Phe Cys Arg Ser Trp Lys Ser Gln Thr260 265 270gaa gtc acc gtc gcg ggc tcg cat ttc atc cag gaa gac tcc gga ccg864Glu Val Thr Val Ala Gly Ser His Phe Ile Gln Glu Asp Ser Gly Pro275 280 285gcg atc ggc cgg gcg gta gcc gcc tgg atg acg gcg aat ggg cta909Ala Ile Gly Arg Ala Val Ala Ala Trp Met Thr Ala Asn Gly Leu290 295 300
tag912<210>20<211>303<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>20Met Leu Val Ala Gln Thr Arg Lys His Pro Met Thr Glu Thr Pro Leu1 5 10 15Thr Lys Asn Thr Val Asp Val Leu Gly Thr Ser Met Ala Tyr His Ala20 25 30Arg Gly Glu Gly Ala Pro Ile Leu Phe Leu His Gly Asn Pro Thr Ser35 40 45Ser Tyr Leu Trp Arg Asp Val Ile Pro Glu Leu Glu Gly Arg Gly Arg50 55 60Leu Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Ala Lys Leu Pro65 70 75 80Asp Pro Gly Ala Asp Thr Tyr Arg Phe Thr Thr His Arg Lys Tyr Leu85 90 95Asp Ala Phe Val Asp Ala Val Ile Gly Pro Ala Gln Ser Ile Val Met100 105 110Val Val His Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn Arg115 120 125His Arg Asn Arg Ile Arg Gly Ile Ala Tyr Met Glu Gly Ile Val Arg130 135 140Pro Ile Ala Ser Trp Asp Glu Trp Ser Ala Ser Ala Thr Pro Ile Phe145 150 155 160Gln Gly Phe Arg Ser Asp Lys Gly Glu Thr Met Ile Leu Glu Arg Asn165 170 175Met Phe Val Glu Arg Val Leu Pro Gly Ser Val Leu Arg Lys Leu Thr180 185 190Glu Ala Glu Met Ala Glu Tyr Arg Arg Pro Tyr Pro Lys Ala Glu Asp195 200 205Arg Trp Pro Thr Leu Thr Trp Pro Arg Gln Ile Pro Ile Ala Gly Glu210 215 220Pro Ala Asp Val Val Gln Ile Ala Ala Glu Tyr Ser Arg Trp Met Ala225 230 235 240Glu Asn Asp Ile Pro Lys Leu Phe Val Asn Ala Glu Pro Gly Ala Ile245 250 255Leu Thr Gly Ala Pro Arg Asp Phe Cys Arg Ser Trp Lys Ser Gln Thr
260 265 270Glu Val Thr Val Ala Gly Ser His Phe Ile Gln Glu Asp Ser Gly Pro275 280 285Ala Ile Gly Arg Ala Val Ala Ala Trp Met Thr Ala Asn Gly Leu290 295 300<210>21<211>894<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(891)<400>21atg gct agc atg acc cag gtt tcc atc tcg acc gag gac gct tcc tac 48Met Ala Ser Met Thr Gln Val Ser Ile Ser Thr Glu Asp Ala Ser Tyr1 5 10 15cgg aag cgg gtc cgc gtg ctc gat acc gac atg gcc tat gtc gac gtg 96Arg Lys Arg Val Arg Val Leu Asp Thr Asp Met Ala Tyr Val Asp Val20 25 30ggc gaa ggc gat ccg atc gtg ttc ctg cac ggc aac ccg acg ccg tcg144Gly Glu Gly Asp Pro Ile Val Phe Leu His Gly Asn Pro Thr Pro Ser35 40 45ttc ctg tgg cgc aac atc atc ccc tac gcc ctg ccc ttc ggc cgc tgc192Phe Leu Trp Arg Asn Ile Ile Pro Tyr Ala Leu Pro Phe Gly Arg Cys50 55 60ctc gcg ccc gac tac gtg ggg atg ggc aat tcc ggg ccg gcg ccg ggc240Leu Ala Pro Asp Tyr Val Gly Met Gly Asn Ser Gly Pro Ala Pro Gly65 70 75 80ggg tcg tat cga ttc gtc gat cac cgg cgc tat ctc gac gcc tgg ttc288Gly Ser Tyr Arg Phe Val Asp His Arg Arg Tyr Leu Asp Ala Trp Phe85 90 95gag gcc atg ggc ctg acg gag aac gtc atc ctc gtg gtg cac gac tgg336Glu Ala Met Gly Leu Thr Glu Asn Val Ile Leu Val Val His Asp Trp
100 105 110ggc tcg gcg ctc ggc ttc gac tgg gcg cgg cgt cac ccc gat cgg gtc384Gly Ser Ala Leu Gly Phe Asp Trp Ala Arg Arg His Pro Asp Arg Val115 120 125aag gcc atc gtc tat atg gaa ggg atc gtc cgg ccg ttc ctg tcc tgg432Lys Ala Ile Val Tyr Met Glu Gly Ile Val Arg Pro Phe Leu Ser Trp130 135 140gac gaa tgg ccg gcc gtc acg cgc gcc ttc ttc cag ggc cag cgc acg480Asp Glu Trp Pro Ala Val Thr Arg Ala Phe Phe Gln Gly Gln Arg Thr145 150 155 160gcg gcg ggc gag gac ctg att ctc cag aag aac ctg ttc atc gag tat528Ala Ala Gly Glu Asp Leu Ile Leu Gln Lys Asn Leu Phe Ile Glu Tyr165 170 175ctc ctg ccg ctg cgc ggc atc ccc aag gag gcg atc gag gtc tac cgc576Leu Leu Pro Leu Arg Gly Ile Pro Lys Glu Ala Ile Glu Val Tyr Arg180 185 190cgt ccc ttc cgg aac ccc ggt gcc tcg cgc cag ccg atg ctg acc tgg624Arg Pro Phe Arg Asn Pro Gly Ala Ser Arg Gln Pro Met Leu Thr Trp195 200 205acc cgc gaa ctg ccg atc gcc ggc gag ccc gcc gac gtc gtg gcc atc672Thr Arg Glu Leu Pro Ile Ala Gly Glu Pro Ala Asp Val Val Ala Ile210 215 220gtc gag gac tac gcc cgc ttc ctc tcc acc agc ccg atc ccc aag ctg720Val Glu Asp Tyr Ala Arg Phe Leu Ser Thr Ser Pro Ile Pro Lys Leu225 230 235 240ttc atc gac gcc gag ccc ggc ggc ttc ctg atc ggc gcc cag cgc gaa768Phe Ile Asp Ala Glu Pro Gly Gly Phe Leu Ile Gly Ala Gln Arg Glu245 250 255ttc tgc cgc gcc tgg ccc aac cag acc gag gtg acg gtc cca ggc gtc816Phe Cys Arg Ala Trp Pro Asn Gln Thr Glu Val Thr Val Pro Gly Val260 265 270cat ttc gtc cag gag gac agt ccg agg gcg atc ggc gag gca gtg tcc864His Phe Val Gln Glu Asp Ser Pro Arg Ala Ile Gly Glu Ala Val Ser
275 280 285gcc ttc gtt gtt tcg ttg cgg ggc gcg tag 894Ala Phe Val Val Ser Leu Arg Gly Ala290 295<210>22<211>297<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>22Met Ala Ser Met Thr Gln Val Ser Ile Ser Thr Glu Asp Ala Ser Tyr1 5 10 15Arg Lys Arg Val Arg Val Leu Asp Thr Asp Met Ala Tyr Val Asp Val20 25 30Gly Glu Gly Asp Pro Ile Val Phe Leu His Gly Asn Pro Thr Pro Ser35 40 45Phe Leu Trp Arg Asn Ile Ile Pro Tyr Ala Leu Pro Phe Gly Arg Cys50 55 60Leu Ala Pro Asp Tyr Val Gly Met Gly Asn Ser Gly Pro Ala Pro Gly65 70 75 80Gly Ser Tyr Arg Phe Val Asp His Arg Arg Tyr Leu Asp Ala Trp Phe85 90 95Glu Ala Met Gly Leu Thr Glu Asn Val Ile Leu Val Val His Asp Trp100 105 110Gly Ser Ala Leu Gly Phe Asp Trp Ala Arg Arg His Pro Asp Arg Val115 120 125Lys Ala Ile Val Tyr Met Glu Gly Ile Val Arg Pro Phe Leu Ser Trp130 135 140Asp Glu Trp Pro Ala Val Thr Arg Ala Phe Phe Gln Gly Gln Arg Thr145 150 155 160Ala Ala Gly Glu Asp Leu Ile Leu Gln Lys Asn Leu Phe Ile Glu Tyr165 170 175Leu Leu Pro Leu Arg Gly Ile Pro Lys Glu Ala Ile Glu Val Tyr Arg180 185 190Arg Pro Phe Arg Asn Pro Gly Ala Ser Arg Gln Pro Met Leu Thr Trp195 200 205Thr Arg Glu Leu Pro Ile Ala Gly Glu Pro Ala Asp Val Val Ala Ile210 215 220
Val Glu Asp Tyr Ala Arg Phe Leu Ser Thr Ser Pro Ile Pro Lys Leu225 230 235240Phe Ile Asp Ala Glu Pro Gly Gly Phe Leu Ile Gly Ala Gln Arg Glu245 250 255Phe Cys Arg Ala Trp Pro Asn Gln Thr Glu Val Thr Val Pro Gly Val260 265 270His Phe Val Gln Glu Asp Ser Pro Arg Ala Ile Gly Glu Ala Val Ser275 280 285Ala Phe Val Val Ser Leu Arg Gly Ala290 295<210>23<211>915<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(912)<400>23atg aat gtg gcg cga ggc gac acg gtc gtc acc gcc gcg gag cct gat 48Met Asn Val Ala Arg Gly Asp Thr Val Val Thr Ala Ala Glu Pro Asp1 5 10 15ggc ccg gac cac ctg cct cgg cgt cgc gtg aag gtg atg gat acc gaa 96Gly Pro Asp His Leu Pro Arg Arg Arg Val Lys Val Met Asp Thr Glu20 25 30atc agc tat gtc gat gtc ggt gaa ggt gag ccc gtc gtc ttt ctg cac144Ile Ser Tyr Val Asp Val Gly Glu Gly Glu Pro Val Val Phe Leu His35 40 45ggc aat ccc acg tgg tcc tat caa tgg cgc aat atc att cct tac atc192Gly Asn Pro Thr Trp Ser Tyr Gln Trp Arg Asn Ile Ile Pro Tyr Ile50 55 60agc ccc gtt cgc cgc tgt ctc gcg ccc gat ctt gtc ggc atg ggt tgg240Ser Pro Val Arg Arg Cys Leu Ala Pro Asp Leu Val Gly Met Gly Trp65 70 75 80tcc ggc aag tcg ccg ggc aaa gcc tat cgt ttc gtc gat cag gcc cgc288
Ser Gly Lys Ser Pro Gly Lys Ala Tyr Arg Phe Val Asp Gln Ala Arg85 90 95tac atg gat gcc tgg ttc gag gcg ttg cag ctg acc cgg aac gtt acg336Tyr Met Asp Ala Trp Phe Glu Ala Leu Gln Leu Thr Arg Asn Val Thr100 105 110ttg gtg ttg cac gac tgg ggc gcg gcc atc ggc ttc tat cgc gcc cgg384Leu Val Leu His Asp Trp Gly Ala Ala Ile Gly Phe Tyr Arg Ala Arg115 120 125cgc cat cct gag cag ata aag gcg att gcc tat tat gaa gct gtc gct432Arg His Pro Glu Gln Ile Lys Ala Ile Ala Tyr Tyr Glu Ala Val Ala130 135 140cac tcg cgc cga tgg gac gac ttc tct ggc ggc cgc gac cgc caa ttc480His Ser Arg Arg Trp Asp Asp Phe Ser Gly Gly Arg Asp Arg Gln Phe145 150 155 160cgc cta tta cgc tcg ccc gac gga gaa cgc ctc gtc ctc gac gag aac528Arg Leu Leu Arg Ser Pro Asp Gly Glu Arg Leu Val Leu Asp Glu Asn165 170 175atg ttc gtg gaa gtc gtc ctg ccg cgc ggc att ttg cgc aag cta acc576Met Phe Val Glu Val Val Leu Pro Arg Gly Ile Leu Arg Lys Leu Thr180 185 190gat gac gag atg gaa gcc tac cga gct cct tat cgc gat cgc gag cgg624Asp Asp Glu Met Glu Ala Tyr Arg Ala Pro Tyr Arg Asp Arg Glu Arg195 200 205cgc ctg ccg acc ctg att tgg ccg cgc gag gtg ccg atc gaa gga gag672Arg Leu Pro Thr Leu Ile Trp Pro Arg Glu Val Pro Ile Glu Gly Glu210 215 220ccc gcg gac gtc gtg gcc att gtc gat gag aat gcg cga tgg ctt gcg720Pro Ala Asp Val Val Ala Ile Val Asp Glu Asn Ala Arg Trp Leu Ala225 230 235 240gcc agc gat cgg ctg ccg aag ctg ttc atc aag ggc gat ccc gga gca768Ala Ser Asp Arg Leu Pro Lys Leu Phe Ile Lys Gly Asp Pro Gly Ala245 250 255atc cat acc gga cgc ttg ctc gat ctg gtt cgc gcg ttt ccc aat cag816
Ile His Thr Gly Arg Leu Leu Asp Leu Val Arg Ala Phe Pro Asn Gln260 265 270cgc gag gtg acc gtc aag ggg ctg cac cac ctg cag gac gat tcg cca864Arg Glu Val Thr Val Lys Gly Leu His His Leu Gln Asp Asp Ser Pro275 280 285gac gaa atc ggc gct gcg ctg cgg gca ttc gtg ctc cgc aaa ggg att912Asp Glu Ile Gly Ala Ala Leu Arg Ala Phe Val Leu Arg Lys Gly Ile290 295 300tga915<210>24<211>304<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>24Met Asn Val Ala Arg Gly Asp Thr Val Val Thr Ala Ala Glu Pro Asp1 5 10 15Gly Pro Asp His Leu Pro Arg Arg Arg Val Lys Val Met Asp Thr Glu20 25 30Ile Ser Tyr Val Asp Val Gly Glu Gly Glu Pro Val Val Phe Leu His35 40 45Gly Asn Pro Thr Trp Ser Tyr Gln Trp Arg Asn Ile Ile Pro Tyr Ile50 55 60Ser Pro Val Arg Arg Cys Leu Ala Pro Asp Leu Val Gly Met Gly Trp65 70 75 80Ser Gly Lys Ser Pro Gly Lys Ala Tyr Arg Phe Val Asp Gln Ala Arg85 90 95Tyr Met Asp Ala Trp Phe Glu Ala Leu Gln Leu Thr Arg Asn Val Thr100 105 110Leu Val Leu His Asp Trp Gly Ala Ala Ile Gly Phe Tyr Arg Ala Arg115 120 125Arg His Pro Glu Gln Ile Lys Ala Ile Ala Tyr Tyr Glu Ala Val Ala130 135 140His Ser Arg Arg Trp Asp Asp Phe Ser Gly Gly Arg Asp Arg Gln Phe145 150 155 160Arg Leu Leu Arg Ser Pro Asp Gly Glu Arg Leu Val Leu Asp Glu Asn165 170 175
Met Phe Val Glu Val Val Leu Pro Arg Gly Ile Leu Arg Lys Leu Thr180 185 190Asp Asp Glu Met Glu Ala Tyr Arg Ala Pro Tyr Arg Asp Arg Glu Arg195 200 205Arg Leu Pro Thr Leu Ile Trp Pro Arg Glu Val Pro Ile Glu Gly Glu210 215 220Pro Ala Asp Val Val Ala Ile Val Asp Glu Asn Ala Arg Trp Leu Ala225 230 235 240Ala Ser Asp Arg Leu Pro Lys Leu Phe Ile Lys Gly Asp Pro Gly Ala245 250 255Ile His Thr Gly Arg Leu Leu Asp Leu Val Arg Ala Phe Pro Asn Gln260 265 270Arg Glu Val Thr Val Lys Gly Leu His His Leu Gln Asp Asp Ser Pro275 280 285Asp Glu Ile Gly Ala Ala Leu Arg Ala Phe Val Leu Arg Lys Gly Ile290 295 300<210>25<211>900<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(897)<400>25atg ctg gac agg att tct gcc aaa ggc aat ctt act cgt agc tgc gta 48Met Leu Asp Arg Ile Ser Ala Lys Gly Asn Leu Thr Arg Ser Cys Val1 5 10 15agc gtc ctt gac agc gag atg agt tac gtc gcg act ggt cgg ggg cac 96Ser Val Leu Asp Ser Glu Met Ser Tyr Val Ala Thr Gly Arg Gly His20 25 30cca atc gtt ttc ctg cac ggg aac ccg acc tca tct tat ctt tgg cgt144Pro Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg35 40 45aac gtc atc ccc cac gtc agc aac ctt ggc cgg tgc ctc gcg ccg gac192Asn Val Ile Pro His Val Ser Asn Leu Gly Arg Cys Leu Ala Pro Asp50 55 60
ctc gtt ggt atg ggc cag ccg gcc gcc tct cca cgg ggc gcc tat cgc240Leu Val Gly Met Gly Gln Pro Ala Ala Ser Pro Arg Gly Ala Tyr Arg65 70 75 80ttt gtg gac cat tca cgt tat ctc gac gca tgg ttt gag gcc ctg gac288Phe Val Asp His Ser Arg Tyr Leu Asp Ala Trp Phe Glu Ala Leu Asp85 90 95ttg cgt aga aac gtt acc ctg gtg gtg cac gat tgg gga tcg gcg ctc336Leu Arg Arg Asn Val Thr Leu Val Val His Asp Trp Gly Ser Ala Leu100 105 110ggc ttt cat tgg gct tcc agg cat ccc gag cgg gtg cgg gcc atc gct384Gly Phe His Trp Ala Ser Arg His Pro Glu Arg Val Arg Ala Ile Ala115 120 125tac atg gag tcg atc gtt cag ccg cgc gac tgg gaa gac ctc ccc cca432Tyr Met Glu Ser Ile Val Gln Pro Arg Asp Trp Glu Asp Leu Pro Pro130 135 140agt cgg gcg ccg atc ttt cgc gac ctg cgg tcc aat aaa ggt gag cgc480Ser Arg Ala Pro Ile Phe Arg Asp Leu Arg Ser Asn Lys Gly Glu Arg145 150 155 160atg atc ctc gac gaa aat gcc ttc att gag att ctc ttg ccg aag ctc528Met Ile Leu Asp Glu Asn Ala Phe Ile Glu Ile Leu Leu Pro Lys Leu165 170 175gtc atc cgg act ctg acc agc gct gag atg gat gca tat cgt cgt cca576Val Ile Arg Thr Leu Thr Ser Ala Glu Met Asp Ala Tyr Arg Arg Pro180 185 190ttt att gaa ccg aac tcg cgc tgg cct aca ctt atc tgg ccg cgc gag624Phe Ile Glu Pro Asn Ser Arg Trp Pro Thr Leu Ile Trp Pro Arg Glu195 200 205cta ccg atc ggt ggc gaa cct gcc gac gtg gtg aaa att gtc gaa gat672Leu Pro Ile Gly Gly Glu Pro Ala Asp Val Val Lys Ile Val Glu Asp210 215 220tac ggg caa tgg ctt ctc aag acc ccg ttg ccg aag ttg ttt atc aac720Tyr Gly Gln Trp Leu Leu Lys Thr Pro Leu Pro Lys Leu Phe Ile Asn225 230 235 240
gcc gag cca ggg tcg ctg ttg atc gga cgg gca cgt gaa ttc tgc cgc768Ala Glu Pro Gly Ser Leu Leu Ile Gly Arg Ala Arg Glu Phe Cys Arg245 250 255tcc tgg cca aat caa gag gaa gtg acg gtt cgg ggt atc cat ttt att816Ser Trp Pro Asn Gln Glu Glu Val Thr Val Arg Gly Ile His Phe Ile260 265 270cag gaa gac agt ccc gat gag att ggc gct gcg ctt acg cgc ttc atg864Gln Glu Asp Ser Pro Asp Glu Ile Gly Ala Ala Leu Thr Arg Phe Met275 280 285agg caa ata agt cca gat tcc gtg atc cga aac taa900Arg Gln Ile Ser Pro Asp Ser Val Ile Arg Asn290 295<210>26<211>299<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>26Met Leu Asp Arg Ile Ser Ala Lys Gly Asn Leu Thr Arg Ser Cys Val1 5 10 15Ser Val Leu Asp Ser Glu Met Ser Tyr Val Ala Thr Gly Arg Gly His20 25 30Pro Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg35 40 45Asn Val Ile Pro His Val Ser Asn Leu Gly Arg Cys Leu Ala Pro Asp50 55 60Leu Val Gly Met Gly Gln Pro Ala Ala Ser Pro Arg Gly Ala Tyr Arg65 70 75 80Phe Val Asp His Ser Arg Tyr Leu Asp Ala Trp Phe Glu Ala Leu Asp85 90 95Leu Arg Arg Asn Val Thr Leu Val Val His Asp Trp Gly Ser Ala Leu100 105 110Gly Phe His Trp Ala Ser Arg His Pro Glu Arg Val Arg Ala Ile Ala115 120 125Tyr Met Glu Ser Ile Val Gln Pro Arg Asp Trp Glu Asp Leu Pro Pro
130 135 140Ser Arg Ala Pro Ile Phe Arg Asp Leu Arg Ser Asn Lys Gly Glu Arg145 150 155 160Met Ile Leu Asp Glu Asn Ala Phe Ile Glu Ile Leu Leu Pro Lys Leu165 170 175Val Ile Arg Thr Leu Thr Ser Ala Glu Met Asp Ala Tyr Arg Arg Pro180 185 190Phe Ile Glu Pro Asn Ser Arg Trp Pro Thr Leu Ile Trp Pro Arg Glu195 200 205Leu Pro Ile Gly Gly Glu Pro Ala Asp Val Val Lys Ile Val Glu Asp210 215 220Tyr Gly Gln Trp Leu Leu Lys Thr Pro Leu Pro Lys Leu Phe Ile Asn225 230 235 240Ala Glu Pro Gly Ser Leu Leu Ile Gly Arg Ala Arg Glu Phe Cys Arg245 250 255Ser Trp Pro Asn Gln Glu Glu Val Thr Val Arg Gly Ile His Phe Ile260 265 270Gln Glu Asp Ser Pro Asp Glu Ile Gly Ala Ala Leu Thr Arg Phe Met275 280 285Arg Gln Ile Ser Pro Asp Ser Val Ile Arg Asn290 295<210>27<211>888<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(885)<400>27atg atc tct gca gca ttt ccg tac caa aag aag cgg cgg cag gtc ctc 48Met Ile Ser Ala Ala Phe Pro Tyr Gln Lys Lys Arg Arg Gln Val Leu1 5 10 15ggc agc gag atg gca tac gtc gag gta gga gag ggc gac ccc atc gtg 96Gly Ser Glu Met Ala Tyr Val Glu Val Gly Glu Gly Asp Pro Ile Val20 25 30tcg ctg cac ggt aat ccc acc tcg tcc tac ctc tgg cgc aac aca ttg144Ser Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Thr Leu
35 40 45ccc tac ctg cag cca cta ggc cgc tgc atc gcc ccc gac ctg atc ggc192Pro Tyr Leu Gln Pro Leu Gly Arg Cys Ile Ala Pro Asp Leu Ile Gly50 55 60atg ggc gac tcc gcc aag ctg cct aac agt ggc ccc ggc tcg tat cga240Met Gly Asp Ser Ala Lys Leu Pro Asn Ser Gly Pro Gly Ser Tyr Arg65 70 75 80ttc gtc gag cac cgc cgc tac ctc gac acc ctg ctc gag gcc tta aat288Phe Val Glu His Arg Arg Tyr Leu Asp Thr Leu Leu Glu Ala Leu Asn85 90 95atg cgc gag cgg gtc acc ttc gtc gcc cat gac tgg ggc tcg gcc ctc336Met Arg Glu Arg Val Thr Phe Val Ala His Asp Trp Gly Ser Ala Leu100 105 110gcc ttc gat tgg gcc aat cgc cac cgc gag gca gtg aag ggt atc gcg384Ala Phe Asp Trp Ala Asn Arg His Arg Glu Ala Val Lys Gly Ile Ala115 120 125cac atg gag gcg atc gtg cgg ccg cag gac tgg acc cac tgg gac acg432His Met Glu Ala Ile Val Arg Pro Gln Asp Trp Thr His Trp Asp Thr130 135 140atg ggg gcg cgt cca atc ttg cag cag ttg cgt tcc gag gct ggc gag480Met Gly Ala Arg Pro Ile Leu Gln Gln Leu Arg Ser Glu Ala Gly Glu145 150 155 160aag ttg atg ctg caa gaa aac ctc ttc atc gag acg ttc ctg cct aag528Lys Leu Met Leu Gln Glu Asn Leu Phe Ile Glu Thr Phe Leu Pro Lys165 170 175gcc atc aag cga acc ctc tcc gcc gag gag aag gcg gag tat aga cgg576Ala Ile Lys Arg Thr Leu Ser Ala Glu Glu Lys Ala Glu Tyr Arg Arg180 185 190ccg ttc gcc gag ccg ggc gag ggg cga cgg ccg acg ctg acg tgg gtc624Pro Phe Ala Glu Pro Gly Glu Gly Arg Arg Pro Thr Leu Thr Trp Val195 200 205cgg cag atc ccc atc gac ggc gag ccc gcc gac gtg act tcg atc gta672Arg Gln Ile Pro Ile Asp Gly Glu Pro Ala Asp Val Thr Ser Ile Val
210 215 220tcc gcc tat ggg gag tgg ctg gcg aaa agc aat gtg ccc aag ctg ttc720Ser Ala Tyr Gly Glu Trp Leu Ala Lys Ser Asn Val Pro Lys Leu Phe225 230 235 240gtg aag gct gag ccg ggc gtc ctc gtt gct ggt ggc gcg aac ctt gac768Val Lys Ala Glu Pro Gly Val Leu Val Ala Gly Gly Ala Asn Leu Asp245 250 255gcc gtc cgc tca tgg cca gca cag acc gag gtg acg gtc ccg gga atc815Ala Val Arg Ser Trp Pro Ala Gln Thr Glu Val Thr Val Pro Gly Ile260 265 270cat ttc atc cag gaa gat tcg ccg gac gag att ggg cgg gcc atc gcc864His Phe Ile Gln Glu Asp Ser Pro Asp Glu Ile Gly Arg Ala Ile Ala275 280 285ggc tgg att aag acg ttg ggc taa888Gly Trp Ile Lys Thr Leu Gly290 295<210>28<211>295<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>28Met Ile Ser Ala Ala Phe Pro Tyr Gln Lys Lys Arg Arg Gln Val Leu1 5 10 15Gly Ser Glu Met Ala Tyr Val Glu Val Gly Glu Gly Asp Pro Ile Val20 25 30Ser Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn Thr Leu35 40 45Pro Tyr Leu Gln Pro Leu Gly Arg Cys Ile Ala Pro Asp Leu Ile Gly50 55 60Met Gly Asp Ser Ala Lys Leu Pro Asn Ser Gly Pro Gly Ser Tyr Arg65 70 75 80Phe Val Glu His Arg Arg Tyr Leu Asp Thr Leu Leu Glu Ala Leu Asn85 90 95Met Arg Glu Arg Val Thr Phe Val Ala His Asp Trp Gly Ser Ala Leu100 105 110Ala Phe Asp Trp Ala Asn Arg His Arg Glu Ala Val Lys Gly Ile Ala115 120 125His Met Glu Ala Ile Val Arg Pro Gln Asp Trp Thr His Trp Asp Thr130 135 140Met Gly Ala Arg Pro Ile Leu Gln Gln Leu Arg Ser Glu Ala Gly Glu145 150 155 160Lys Leu Met Leu Gln Glu Asn Leu Phe Ile Glu Thr Phe Leu Pro Lys165 170 175Ala Ile Lys Arg Thr Leu Ser Ala Glu Glu Lys Ala Glu Tyr Arg Arg180 185 190Pro Phe Ala Glu Pro Gly Glu Gly Arg Arg Pro Thr Leu Thr Trp Val195 200 205Arg Gln Ile Pro Ile Asp Gly Glu Pro Ala Asp Val Thr Ser Ile Val210 215 220Ser Ala Tyr Gly Glu Trp Leu Ala Lys Ser Asn Val Pro Lys Leu Phe225 230 235 240Val Lys Ala Glu Pro Gly Val Leu Val Ala Gly Gly Ala Asn Leu Asp245 250 255Ala Val Arg Ser Trp Pro Ala Gln Thr Glu Val Thr Val Pro Gly Ile260 265 270His Phe Ile Gln Glu Asp Ser Pro Asp Glu Ile Gly Arg Ala Ile Ala275 280 285Gly Trp Ile Lys Thr Leu Gly290 295<210>29<211>882<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(879)<400>29atg acg gag cag gag ata tca gcg gcg ttt ccc ttc gag tcg aag ttc 48Met Thr Glu Gln Glu Ile Ser Ala Ala Phe Pro Phe Glu Ser Lys Phe1 5 10 15gtg gat gtg caa ggc tcc cgc atg cac tac gtg gag gag ggc tcg ggc 96
Val Asp Val Gln Gly Ser Arg Met His Tyr Val Glu Glu Gly Ser Gly20 25 30gac ccg gtg gtg ttc ctc cac ggc aac ccg acc tcg tcc tac ctg tgg144Asp Pro Val Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45cgg aac gtc atc cct cac gtg tcc ccg ctt gcg agg tgc atc gcg ccg192Arg Asn Val Ile Pro His Val Ser Pro Leu Ala Arg Cys Ile Ala Pro50 55 60gac ctc atc ggc atg ggg aag tcg gac aaa ccg gat atc gag tac cgc240Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Ile Glu Tyr Arg65 70 75 80ttc ttc gac cac gcc ggg tac gtt gac ggg ttc atc gag gca ctg gga288Phe Phe Asp His Ala Gly Tyr Val Asp Gly Phe Ile Glu Ala Leu Gly85 90 95ctg cgg aac atc acc ttc gtc gcc tac gac tgg ggc tcc gcg ctg gcg336Leu Arg Asn Ile Thr Phe Val Ala Tyr Asp Trp Gly Ser Ala Leu Ala100 105 110ttc cac tac gcg cga cgg cac gag gat aac gta aag ggg ttg gcg ttc384Phe His Tyr Ala Arg Arg His Glu Asp Asn Val Lys Gly Leu Ala Phe115 120 125atg gag gcc atc gtg cga ccg ctc acc tgg gac gag tgg ccg gag cag432Met Glu Ala Ile Val Arg Pro Leu Thr Trp Asp Glu Trp Pro Glu Gln130 135 140gca agg cag atg ttc cag gcg ttc cgg acg ccg ggc gtc ggg gag aag480Ala Arg Gln Met Phe Gln Ala Phe Arg Thr Pro Gly Val Gly Glu Lys145 150 155 160atg atc ctg gag gaa aac gcc ttc gtg gag cag gtg ttg ccg gga gcg528Met Ile Leu Glu Glu Asn Ala Phe Val Glu Gln Val Leu Pro Gly Ala165 170 175atc ctc cgc aag ctg tcc gac gag gag atg gac cgc tac cgg gag ccg576Ile Leu Arg Lys Leu Ser Asp Glu Glu Met Asp Arg Tyr Arg Glu Pro180 185 190ttc ccc gac ccc acc agc cgg agg ccg acg tgg cgc tgg ccc aac gag624
Phe Pro Asp Pro Thr Ser Arg Arg Pro Thr Trp Arg Trp Pro Asn Glu195 200 205ata cct gtc gag ggg aag ccg ccg gac gtg gtt gag gca gtg cag gcc672Ile Pro Val Glu Gly Lys Pro Pro Asp Val Val Glu Ala Val Gln Ala210 215 220tac gcc gat tgg atg ggc gag tcg gat gtg ccc aag ctc ctc ctg tac720Tyr Ala Asp Trp Met Gly Glu Ser Asp Val Pro Lys Leu Leu Leu Tyr225 230 235 240gct cac cca ggc gcg atc ctc cga gag ccg ctg ctg gag tgg tgc cgc768Ala His Pro Gly Ala Ile Leu Arg Glu Pro Leu Leu Glu Trp Cys Arg245 250 255aac aac atg cgc aac ctg aag acg gtc gac atc ggg ccc ggg gtg cac816Asn Asn Met Arg Asn Leu Lys Thr Val Asp Ile Gly Pro Gly Val His260 265 270ttc gtg ccg gag gac cgc ccc cac gag atc ggg gag gcc atc gcg gag864Phe Val Pro Glu Asp Arg Pro His Glu Ile Gly Glu Ala Ile Ala Glu275 280 285tgg tac cag cgg ctg tag882Trp Tyr Gln Arg Leu290<210>30<211>293<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>30Met Thr Glu Gln Glu Ile Ser Ala Ala Phe Pro Phe Glu Ser Lys Phe1 5 10 15Val Asp Val Gln Gly Ser Arg Met His Tyr Val Glu Glu Gly Ser Gly20 25 30Asp Pro Val Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Val Ile Pro His Val Ser Pro Leu Ala Arg Cys Ile Ala Pro
50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Ile Glu Tyr Arg65 70 75 80Phe Phe Asp His Ala Gly Tyr Val Asp Gly Phe Ile Glu Ala Leu Gly85 90 95Leu Arg Asn Ile Thr Phe Val Ala Tyr Asp Trp Gly Ser Ala Leu Ala100 105 110Phe His Tyr Ala Arg Arg His Glu Asp Asn Val Lys Gly Leu Ala Phe115 120 125Met Glu Ala Ile Val Arg Pro Leu Thr Trp Asp Glu Trp Pro Glu Gln130 135 140Ala Arg Gln Met Phe Gln Ala Phe Arg Thr Pro Gly Val Gly Glu Lys145 150 155 160Met Ile Leu Glu Glu Asn Ala Phe Val Glu Gln Val Leu Pro Gly Ala165 170 175Ile Leu Arg Lys Leu Ser Asp Glu Glu Met Asp Arg Tyr Arg Glu Pro180 185 190Phe Pro Asp Pro Thr Ser Arg Arg Pro Thr Trp Arg Trp Pro Asn Glu195 200 205Ile Pro Val Glu Gly Lys Pro Pro Asp Val Val Glu Ala Val Gln Ala210 215 220Tyr Ala Asp Trp Met Gly Glu Ser Asp Val Pro Lys Leu Leu Leu Tyr225 230 235 240Ala His Pro Gly Ala Ile Leu Arg Glu Pro Leu Leu Glu Trp Cys Arg245 250 255Asn Asn Met Arg Asn Leu Lys Thr Val Asp Ile Gly Pro Gly Val His260 265 270Phe Val Pro Glu Asp Arg Pro His Glu Ile Gly Glu Ala Ile Ala Glu275 280 285Trp Tyr Gln Arg Leu290<210>31<211>885<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(882)<400>31
gtg agc gag atc tcc ccg aaa gag ccc atg gac aag aag cac atc ccc 48Val Ser Glu Ile Ser Pro Lys Glu Pro Met Asp Lys Lys His Ile Pro1 5 10 15gta ctc gga aaa tcg atg gcg tac cgg gac gta ggt gag gga gac ccg 96Val Leu Gly Lys Ser Met Ala Tyr Arg Asp Val Gly Glu Gly Asp Pro20 25 30atc gtc ttc ctg cac ggc aac ccc acc tcg tcg tat ctc tgg cgc aac144Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn35 40 45atc atc ccc cac ctc gag ccg cat gca cgc tgc atc gcg ccg gat ctc192Ile Ile Pro His Leu Glu Pro His Ala Arg Cys Ile Ala Pro Asp Leu50 55 60atc gga atg gga gat tcg gag aag ctc gag ccg agc gga ccg gac cgc240Ile Gly Met Gly Asp Ser Glu Lys Leu Glu Pro Ser Gly Pro Asp Arg65 70 75 80tat cgc ttc atc gaa cat cgc gaa tat ctc gat ggt ttc ttc gag gct288Tyr Arg Phe Ile Glu His Arg Glu Tyr Leu Asp Gly Phe Phe Glu Ala85 90 95ctg gcc ctg caa cag aac gtc acc ctc gtc gtc cac gac tgg ggc tcc336Leu Ala Leu Gln Gln Asn Val Thr Leu Val Val His Asp Trp Gly Ser100 105 110ggg ctg ggc ttc gat tgg gcc aac cgg aat cgg gag cgc atc aag ggg384Gly Leu Gly Phe Asp Trp Ala Asn Arg Asn Arg Glu Arg Ile Lys Gly115 120 125atc gct tat atg gag gcc atc gtt cgc ccg ctc agc tgg caa gac tgg432Ile Ala Tyr Met Glu Ala Ile Val Arg Pro Leu Ser Trp Gln Asp Trp130 135 140ccc gac gac gcc cgc gcg gtc ttt cag ggt ttt cgc tcc gaa gca gga480Pro Asp Asp Ala Arg Ala Val Phe Gln Gly Phe Arg Ser Glu Ala Gly145 150 155 160gag tcg atg gtg atc gag aag aac gtc ttc gtc gaa cgg gtc ctg ccc528Glu Ser Met Val Ile Glu Lys Asn Val Phe Val Glu Arg Val Leu Pro165 170 175
agc tcg gtc ctg cgg acg ctc cgt gac gag gag atg gag gtc tat cgc576Ser Ser Val Leu Arg Thr Leu Arg Asp Glu Glu Met Glu Val Tyr Arg180 185 190aga ccg ttt caa gac gcc gga gaa tca agg cgc ccg acc ctc acc tgg624Arg Pro Phe Gln Asp Ala Gly Glu Ser Arg Arg Pro Thr Leu Thr Trp195 200 205ccc cgc cag atc ccg atc gag ggg gag ccg gag gat gtg acc gag atc672Pro Arg Gln Ile Pro Ile Glu Gly Glu Pro Glu Asp Val Thr Glu Ile210 215 220gcg agc gcg tac agc gcg tgg atg gcc gag aac gat ctc ccc aag ctc720Ala Ser Ala Tyr Ser Ala Trp Met Ala Glu Asn Asp Leu Pro Lys Leu225 230 235 240ttc gtt aac gcc gag ccg ggc gcg atc ctg atc ggt ccg cag cgc gag768Phe Val Asn Ala Glu Pro Gly Ala Ile Leu Ile Gly Pro Gln Arg Glu245 250 255ttc tgc cgc acg tgg aag aat caa cgc gaa gtc acg gta agc ggt agc816Phe Cys Arg Thr Trp Lys Asn Gln Arg Glu Val Thr Val Ser Gly Ser260 265 270cac ttc atc cag gag gac tct ccg cac gaa atc ggc gac gcg att gca864His Phe Ile Gln Glu Asp Ser Pro His Glu Ile Gly Asp Ala Ile Ala275 280 285ggc tgg tac gcg gat ctc tag885Gly Trp Tyr Ala Asp Leu290<210>32<211>294<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>32Val Ser Glu Ile Ser Pro Lys Glu Pro Met Asp Lys Lys His Ile Pro1 5 10 15
Val Leu Gly Lys Ser Met Ala Tyr Arg Asp Val Gly Glu Gly Asp Pro20 25 30Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn35 40 45Ile Ile Pro His Leu Glu Pro His Ala Arg Cys Ile Ala Pro Asp Leu50 55 60Ile Gly Met Gly Asp Ser Glu Lys Leu Glu Pro Ser Gly Pro Asp Arg65 70 75 80Tyr Arg Phe Ile Glu His Arg Glu Tyr Leu Asp Gly Phe Phe Glu Ala85 90 95Leu Ala Leu Gln Gln Asn Val Thr Leu Val Val His Asp Trp Gly Ser100 105 110Gly Leu Gly Phe Asp Trp Ala Asn Arg Asn Arg Glu Arg Ile Lys Gly115 120 125Ile Ala Tyr Met Glu Ala Ile Val Arg Pro Leu Ser Trp Gln Asp Trp130 135 140Pro Asp Asp Ala Arg Ala Val Phe Gln Gly Phe Arg Ser Glu Ala Gly145 150 155 160Glu Ser Met Val Ile Glu Lys Asn Val Phe Val Glu Arg Val Leu Pro165 170 175Ser Ser Val Leu Arg Thr Leu Arg Asp Glu Glu Met Glu Val Tyr Arg180 185 190Arg Pro Phe Gln Asp Ala Gly Glu Ser Arg Arg Pro Thr Leu Thr Trp195 200 205Pro Arg Gln Ile Pro Ile Glu Gly Glu Pro Glu Asp Val Thr Glu Ile210 215 220Ala Ser Ala Tyr Ser Ala Trp Met Ala Glu Asn Asp Leu Pro Lys Leu225 230 235 240Phe Val Asn Ala Glu Pro Gly Ala Ile Leu Ile Gly Pro Gln Arg Glu245 250 255Phe Cys Arg Thr Trp Lys Asn Gln Arg Glu Val Thr Val Ser Gly Ser260 265 270His Phe Ile Gln Glu Asp Ser Pro His Glu Ile Gly Asp Ala Ile Ala275 280 285Gly Trp Tyr Ala Asp Leu290<210>33<211>888<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶
<221>CDS<222>(1)...(885)<400>33atg acc acc gaa atc tcg gca gcc gac ccc ttc gag cgg cac cgg gtc 48Met Thr Thr Glu Ile Ser Ala Ala Asp Pro Phe Glu Arg His Arg Val1 5 10 15acc gtg ctc gac tca gag atg tcg tac atc gac acc ggc ccc ggc gcc 96Thr Val Leu Asp Ser Glu Met Ser Tyr Ile Asp Thr Gly Pro Gly Ala20 25 30gca ggc agt gag ccg atc gtg ttt ctc cac ggg aac cca acc tcg tcc144Ala Gly Ser Glu Pro Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser35 40 45tac ctc tgg cgc aac atc att ccc cac gtc cag cac ctc ggg cgc tgc192Tyr Leu Trp Arg Asn Ile Ile Pro His Val Gln His Leu Gly Arg Cys50 55 60ctc gca ccg gat ctg atc ggg atg ggc aac tcg gac cct tcc cct aac240Leu Ala Pro Asp Leu Ile Gly Met Gly Asn Ser Asp Pro Ser Pro Asn65 70 75 80ggc agc tac cgc ttc gtc gac cac gtg aag tac ctc gac gcc tgg ttg288Gly Ser Tyr Arg Phe Val Asp His Val Lys Tyr Leu Asp Ala Trp Leu85 90 95gac gcc gtc ggc gtg acc gac cag gtg acg ttc gtg gtg cat gac tgg336Asp Ala Val Gly Val Thr Asp Gln Val Thr Phe Val Val His Asp Trp100 105 110gga tcg gcg ctc ggc ttc cac tgg gca gac cgc cat cgc gac gcc atc384Gly Ser Ala Leu Gly Phe His Trp Ala Asp Arg His Arg Asp Ala Ile115 120 125cga ggc ttc gcc tac atg gag gcg atc gtg cgc ccc gtc gag tgg gag432Arg Gly Phe Ala Tyr Met Glu Ala Ile Val Arg Pro Val Glu Trp Glu130 135 140gac tgg ccg cct gcg gac gtc ttc cga cgg atg cga tcc gag gag ggc480Asp Trp Pro Pro Ala Asp Val Phe Arg Arg Met Arg Ser Glu Glu Gly145 150 155 160
gac gag atg atg ctc gag ggc aac ttc ttc gtc gag gtg atc ctg ccc528Asp Glu Met Met Leu Glu Gly Asn Phe Phe Val Glu Val Ile Leu Pro165 170 175cgc agc gtc ctc cgc ggg ctc act gac gaa gag atg gag gta tac cgg576Arg Ser Val Leu Arg Gly Leu Thr Asp Glu Glu Met Glu Val Tyr Arg180 185 190cga ccc tac ctc gag cgc ggc gag tcg cgg cgt ccg acg ctg acc tgg624Arg Pro Tyr Leu Glu Arg Gly Glu Ser Arg Arg Pro Thr Leu Thr Trp195 200 205ccg cgg gag atc ccg ctg tca ggc gag ccg gcg gat gtc gtc gag atc672Pro Arg Glu Ile Pro Leu Ser Gly Glu Pro Ala Asp Val Val Glu Ile210 215 220gtc agc gcc tac agc aaa tgg ctg tcc gag acg acc gtg ccg aag ctc720Val Ser Ala Tyr Ser Lys Trp Leu Ser Glu Thr Thr Val Pro Lys Leu225 230 235 240ctc gtc act gcc gag ccg ggt gcg atc ctg aac ggg ccg cag ctg gag768Leu Val Thr Ala Glu Pro Gly Ala Ile Leu Asn Gly Pro Gln Leu Glu245 250 255ttc gct cgc ggg ttt gcc aac cag acc gag gtc cga gtc gcc ggc tcg816Phe Ala Arg Gly Phe Ala Asn Gln Thr Glu Val Arg Val Ala Gly Ser260 265 270cac ttc atc cag gag gac tcg cca cac gag atc ggc gcc gcc ctc gcc864His Phe Ile Gln Glu Asp Ser Pro His Glu Ile Gly Ala Ala Leu Ala275 280 285gag tgg tac ccg acg acg acc tga888Glu Trp Tyr Pro Thr Thr Thr290 295<210>34<211>295<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>34Met Thr Thr Glu Ile Ser Ala Ala Asp Pro Phe Glu Arg His Arg Val1 5 10 15Thr Val Leu Asp Ser Glu Met Ser Tyr Ile Asp Thr Gly Pro Gly Ala20 25 30Ala Gly Ser Glu Pro Ile Val Phe Leu His Gly Asn Pro Thr Ser Ser35 40 45Tyr Leu Trp Arg Asn Ile Ile Pro His Val Gln His Leu Gly Arg Cys50 55 60Leu Ala Pro Asp Leu Ile Gly Met Gly Asn Ser Asp Pro Ser Pro Asn65 70 75 80Gly Ser Tyr Arg Phe Val Asp His Val Lys Tyr Leu Asp Ala Trp Leu85 90 95Asp Ala Val Gly Val Thr Asp Gln Val Thr Phe Val Val His Asp Trp100 105 110Gly Ser Ala Leu Gly Phe His Trp Ala Asp Arg His Arg Asp Ala Ile115 120 125Arg Gly Phe Ala Tyr Met Glu Ala Ile Val Arg Pro Val Glu Trp Glu130 135 140Asp Trp Pro Pro Ala Asp Val Phe Arg Arg Met Arg Ser Glu Glu Gly145 150 155 160Asp Glu Met Met Leu Glu Gly Asn Phe Phe Val Glu Val Ile Leu Pro165 170 175Arg Ser Val Leu Arg Gly Leu Thr Asp Glu Glu Met Glu Val Tyr Arg180 185 190Arg Pro Tyr Leu Glu Arg Gly Glu Ser Arg Arg Pro Thr Leu Thr Trp195 200 205Pro Arg Glu Ile Pro Leu Ser Gly Glu Pro Ala Asp Val Val Glu Ile210 215 220Val Ser Ala Tyr Ser Lys Trp Leu Ser Glu Thr Thr Val Pro Lys Leu225 230 235 240Leu Val Thr Ala Glu Pro Gly Ala Ile Leu Asn Gly Pro Gln Leu Glu245 250 255Phe Ala Arg Gly Phe Ala Asn Gln Thr Glu Val Arg Val Ala Gly Ser260 265 270His Phe Ile Gln Glu Asp Ser Pro His Glu Ile Gly Ala Ala Leu Ala275 280 285Glu Trp Tyr Pro Thr Thr Thr290 295<210>35<211>861
<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(858)<400>35atg tac gag aaa cgg ttc gta tct gtc ctc ggt cac cgg atg gca tac 48Met Tyr Glu Lys Arg Phe Val Ser Val Leu Gly His Arg Met Ala Tyr1 5 10 15gtc gag caa gga gcc ggg gac ccg atc gtg ttc cta cat ggc aac ccc 96Val Glu Gln Gly Ala Gly Asp Pro Ile Val Phe Leu His Gly Asn Pro20 25 30acc tcg tcc tac ctg tgg cgg aag gtc atc ccc gcg cta acg gag cag144Thr Ser Ser Tyr Leu Trp Arg Lys Val Ile Pro Ala Leu Thr Glu Gln35 40 45gga cga tgc atc gct ccc gac ttg atc ggc atg ggc gac tcc gag aag192Gly Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Glu Lys50 55 60ctg gct gac agc ggc ccc ggt agc tac cgc ttc gtg gaa cat cgg cgt240Leu Ala Asp Ser Gly Pro Gly Ser Tyr Arg Phe Val Glu His Arg Arg65 70 75 80ttc ctc gat gcc ttc ctc gaa agg gtt ggg atc agc gag tcg gtg gtc288Phe Leu Asp Ala Phe Leu Glu Arg Val Gly Ile Ser Glu Ser Val Val85 90 95ctg gtg atc cac gac tgg ggt tcg gcc ctc ggc ttc gac tgg gcc tac336Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Tyr100 105 110cgc cac caa aac gcc gtc aag ggg atc gca tat atg gaa gcg ctg gtc384Arg His Gln Asn Ala Val Lys Gly Ile Ala Tyr Met Glu Ala Leu Val115 120 125ggg cct gta ggt tgg agc gac tgg ccg gag tcg gcc cgg tcc atc ttc432Gly Pro Val Gly Trp Ser Asp Trp Pro Glu Ser Ala Arg Ser Ile Phe
130 135 140cag gct ttc cgc tcc gaa gcc ggg gac agc ctc atc ctc gag aag aac480Gln Ala Phe Arg Ser Glu Ala Gly Asp Ser Leu Ile Leu Glu Lys Asn145 150 155 160ttc ttc gtc gag cgg gtg ctg ccc gca tcg gtg ctc gat ccc ctg cca528Phe Phe Val Glu Arg Val Leu Pro Ala Ser Val Leu Asp Pro Leu Pro165 170 175gaa gaa gtg ctc gac gag tat cga cag ccg ttt ctc gaa ccg ggc gag576Glu Glu Val Leu Asp Glu Tyr Arg Gln Pro Phe Leu Glu Pro Gly Glu180 185 190tct cgc cga ccc acc ctc acc tgg cct agg gag atc ccc atc gac ggt624Ser Arg Arg Pro Thr Leu Thr Trp Pro Arg Glu Ile Pro Ile Asp Gly195 200 205gag ccg gcc gac gtc cac gag atc gtg tcc gcg tac aac cgc tgg att672Glu Pro Ala Asp Val His Glu Ile Val Ser Ala Tyr Asn Arg Trp Ile210 215 220gga tcc tct ccg gtg ccc aag ctg tac gtc aac gcc gat ccc ggc ttc720Gly Ser Ser Pro Val Pro Lys Leu Tyr Val Asn Ala Asp Pro Gly Phe225 230 235 240ttc agc cct ggc atc gtc gag gcc acg gcc gcc tgg ccc aac cag gaa768Phe Ser Pro Gly Ile Val Glu Ala Thr Ala Ala Trp Pro Asn Gln Glu245 250 255aca gtc acg gtc cgt ggc cac cat ttc ttg cag gaa gac tct ggt gaa816Thr Val Thr Val Arg Gly His His Phe Leu Gln Glu Asp Ser Gly Glu260 265 270gcg atc ggt gat gcc atc gcc gac tgg tac cgg cgt gtc tcg858Ala Ile Gly Asp Ala Ile Ala Asp Trp Tyr Arg Arg Val Ser275 280 285tga861<210>36<211>286<212>PRT<213>人工序列
<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>36Met Tyr Glu Lys Arg Phe Val Ser Val Leu Gly His Arg Met Ala Tyr1 5 10 15Val Glu Gln Gly Ala Gly Asp Pro Ile Val Phe Leu His Gly Asn Pro20 25 30Thr Ser Ser Tyr Leu Trp Arg Lys Val Ile Pro Ala Leu Thr Glu Gln35 40 45Gly Arg Cys Ile Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Glu Lys50 55 60Leu Ala Asp Ser Gly Pro Gly Ser Tyr Arg Phe Val Glu His Arg Arg65 70 75 80Phe Leu Asp Ala Phe Leu Glu Arg Val Gly Ile Ser Glu Ser Val Val85 90 95Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Tyr100 105 110Arg His Gln Asn Ala Val Lys Gly Ile Ala Tyr Met Glu Ala Leu Val115 120 125Gly Pro Val Gly Trp Ser Asp Trp Pro Glu Ser Ala Arg Ser Ile Phe130 135 140Gln Ala Phe Arg Ser Glu Ala Gly Asp Ser Leu Ile Leu Glu Lys Asn145 150 155 160Phe Phe Val Glu Arg Val Leu Pro Ala Ser Val Leu Asp Pro Leu Pro165 170 175Glu Glu Val Leu Asp Glu Tyr Arg Gln Pro Phe Leu Glu Pro Gly Glu180 185 190Ser Arg Arg Pro Thr Leu Thr Trp Pro Arg Glu Ile Pro Ile Asp Gly195 200 205Glu Pro Ala Asp Val His Glu Ile Val Ser Ala Tyr Asn Arg Trp Ile210 215 220Gly Ser Ser Pro Val Pro Lys Leu Tyr Val Asn Ala Asp Pro Gly Phe225 230 235 240Phe Ser Pro Gly Ile Val Glu Ala Thr Ala Ala Trp Pro Asn Gln Glu245 250 255Thr Val Thr Val Arg Gly His His Phe Leu Gln Glu Asp Ser Gly Glu260 265 270Ala Ile Gly Asp Ala Ile Ala Asp Trp Tyr Arg Arg Val Ser275 280 285<210>37<211>891
<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(888)<400>37atg aat gca atc gcc agt gag ccc tat ggg caa ctg agg ttc caa gag 48Met Asn Ala Ile Ala Ser Glu Pro Tyr Gly Gln Leu Arg Phe Gln Glu1 5 10 15atc gcc ggc aag caa atg gcg tac atc gac gag ggc gtc ggt gat gcc 96Ile Ala Gly Lys Gln Met Ala Tyr Ile Asp Glu Gly Val Gly Asp Ala20 25 30atc gtt ttc cag cac ggc aac ccc acg tcg tcc tac ctg tgg cgc aac144Ile Val Phe Gln His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn35 40 45gtt atg ccg cac ctg gaa ggg ctg ggc cgg ctg gtg gcg tgc gat ctg192Val Met Pro His Leu Glu Gly Leu Gly Arg Leu Val Ala Cys Asp Leu50 55 60atc ggg atg ggg gcg tcg gag aag ctc agc cca tcg ggc ccc gac cgc240Ile Gly Met Gly Ala Ser Glu Lys Leu Ser Pro Ser Gly Pro Asp Arg65 70 75 80tat aac tat gcc gag cag cgc gac tat ctg ttc gcg ctc tgg gat gcg288Tyr Asn Tyr Ala Glu Gln Arg Asp Tyr Leu Phe Ala Leu Trp Asp Ala85 90 95ctc gac ctt ggc gat cac gtg gtg ctg gtg ctg cat gac tgg ggc tca336Leu Asp Leu Gly Asp His Val Val Leu Val Leu His Asp Trp Gly Ser100 105 110gca ttg ggc ttc gac tgg gcc aac cag cat cgc gac cga gtg cag ggc384Ala Leu Gly Phe Asp Trp Ala Asn Gln His Arg Asp Arg Val Gln Gly115 120 125atc gca ttc atg gag gcg atc gtc agc ccg atc aca tgg gcc gac ttc432Ile Ala Phe Met Glu Ala Ile Val Ser Pro Ile Thr Trp Ala Asp Phe
130 135 140cat ccc agc gtg cga ggc gtg ttc cag ggg ttc cgg tcg ccc gag ggt480His Pro Ser Val Arg Gly Val Phe Gln Gly Phe Arg Ser Pro Glu Gly145 150 155 160gag cgg atg gtg ttg gag cag aac atc ttt gtc gaa ggg gta ctg ccc528Glu Arg Met Val Leu Glu Gln Asn Ile Phe Val Glu Gly Val Leu Pro165 170 175ggg gcg atc cag cgc cga ctg tct gac gag gag atg ggc cat tac cgg576Gly Ala Ile Gln Arg Arg Leu Ser Asp Glu Glu Met Gly His Tyr Arg180 185 190cag cca ttc gtc gaa ccc ggc gag gac cgg cga ccg acc ttg tcg tgg624Gln Pro Phe Val Glu Pro Gly Glu Asp Arg Arg Pro Thr Leu Ser Trp195 200 205cca cgg aac atc ccc atc gac ggc gag ccg gcc gag gtc gtc gcg gtc672Pro Arg Asn Ile Pro Ile Asp Gly Glu Pro Ala Glu Val Val Ala Val210 215 220gtc gac gag tac cgt agc tgg ctc gag aag agc gac att cca aag ctg720Val Asp Glu Tyr Arg Ser Trp Leu Glu Lys Ser Asp Ile Pro Lys Leu225 230 235 240ttc gtg aac gcc gag ccg ggc gcg atc gtc acc ggc cgc atc cgc gac768Phe Val Asn Ala Glu Pro Gly Ala Ile Val Thr Gly Arg Ile Arg Asp245 250 255tat atc cgg acg tgg gcg aac ctc agc gaa atc acg gtt ccc gga gtg816Tyr Ile Arg Thr Trp Ala Asn Leu Ser Glu Ile Thr Val Pro Gly Val260 265 270cat ttc atc caa gaa gac agc cca gac gga atc ggc tcg gcc gtg gca864His Phe Ile Gln Glu Asp Ser Pro Asp Gly Ile Gly Ser Ala Val Ala275 280 285cag ttc ctg cag cag cta cgc gcc taa891Gln Phe Leu Gln Gln Leu Arg Ala290 295<210>38
<211>296<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>38Met Asn Ala Ile Ala Ser Glu Pro Tyr Gly Gln Leu Arg Phe Gln Glu1 5 10 15Ile Ala Gly Lys Gln Met Ala Tyr Ile Asp Glu Gly Val Gly Asp Ala20 25 30Ile Val Phe Gln His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg Asn35 40 45Val Met Pro His Leu Glu Gly Leu Gly Arg Leu Val Ala Cys Asp Leu50 55 60Ile Gly Met Gly Ala Ser Glu Lys Leu Ser Pro Ser Gly Pro Asp Arg65 70 75 80Tyr Asn Tyr Ala Glu Gln Arg Asp Tyr Leu Phe Ala Leu Trp Asp Ala85 90 95Leu Asp Leu Gly Asp His Val Val Leu Val Leu His Asp Trp Gly Ser100 105 110Ala Leu Gly Phe Asp Trp Ala Asn Gln His Arg Asp Arg Val Gln Gly115 120 125Ile Ala Phe Met Glu Ala Ile Val Ser Pro Ile Thr Trp Ala Asp Phe130 135 140His Pro Ser Val Arg Gly Val Phe Gln Gly Phe Arg Ser Pro Glu Gly145 150 155 160Glu Arg Met Val Leu Glu Gln Asn Ile Phe Val Glu Gly Val Leu Pro165 170 175Gly Ala Ile Gln Arg Arg Leu Ser Asp Glu Glu Met Gly His Tyr Arg180 185 190Gln Pro Phe Val Glu Pro Gly Glu Asp Arg Arg Pro Thr Leu Ser Trp195 200 205Pro Arg Asn Ile Pro Ile Asp Gly Glu Pro Ala Glu Val Val Ala Val210 215 220Val Asp Glu Tyr Arg Ser Trp Leu Glu Lys Ser Asp Ile Pro Lys Leu225 230 235 240Phe Val Asn Ala Glu Pro Gly Ala Ile Val Thr Gly Arg Ile Arg Asp245 250 255Tyr Ile Arg Thr Trp Ala Asn Leu Ser Glu Ile Thr Val Pro Gly Val260 265 270His Phe Ile Gln Glu Asp Ser Pro Asp Gly Ile Gly Ser Ala Val Ala275 280 285
Gln Phe Leu Gln Gln Leu Arg Ala290 295<210>39<211>882<212>DNA<213>玫瑰色红球菌<220>
<221>CDS<222>(1)...(879)<400>39atg tca gaa atc ggt aca ggc ttc ccc ttc gac ccc cat tat gtg gaa 48Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15gtc ctg ggc gag cgt atg cac tac gtc gat gtt gga ccg cgg gat ggc 96Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30acg cct gtg ctg ttc ctg cac ggt aac ccg acc tcg tcc tac ctg tgg144Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45cgc aac atc atc ccg cat gta gca ccg agt cat cgg tgc att gct cca192Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60gac ctg atc ggg atg gga aaa tcg gac aaa cca gac ctc gat tat ttc240Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80ttc gac gac cac gtc cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt288Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95ttg gaa gag gtc gtc ctg gtc atc cac gac tgg ggc tca gct ctc gga336Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110ttc cac tgg gcc aag cgc aat ccg gaa cgg gtc aaa ggt att gca tgt384Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125
atg gaa ttc atc cgg cct atc ccg acg tgg gac gaa tgg ccg gaa ttc432Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140gcc cgt gag acc ttc cag gcc ttc cgg acc gcc gac gtc ggc cga gag480Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160ttg atc atc gat cag aac gct ttc atc gag ggt gcg ctc ccg aaa tgc528Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Lys Cys165 170 175gtc gtc cgt ccg ctt acg gag gtc gag atg gac cac tat cgc gag ccc576Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190ttc ctc aag cct gtt gac cga gag cca ctg tgg cga ttc ccc aac gag624Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205ctg ccc atc gcc ggt gag ccc gcg aac atc gtc gcg ctc gtc gag gca672Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220tac atg aac tgg ctg cac cag tca cct gtc ccg aag ttg ttg ttc tgg720Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240ggc aca ccc ggc gta ctg atc ccc ccg gcc gaa gcc gcg aga ctt gcc768Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala245 250 255gaa agc ctc ccc aac tgc aag aca gtg gac atc ggc ccg gga ttg cac816Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270tac ctc cag gaa gac aac ccg gac ctt atc ggc agt gag atc gcg cgc864Tyr Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285tgg ctc ccc gca ctc tag882Trp Leu Pro Ala Leu290
<210>40<211>293<212>PRT<213>玫瑰色红球菌<400>40Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Lys Cys165 170 175Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala245 250 255Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270Tyr Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285
Trp Leu Pro Ala Leu290<210>41<211>924<212>DNA<213>分枝杆菌属<220>
<221>CDS<222>(1)...(921)<400>41atg tca gaa atc ggt aca ggc ttc ccc ttc gac ccc cat tat gtg gaa 48Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15gtc ctg ggc gag cgt atg cac tac gtc gat gtt gga ccg cgg gat ggc 96Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30acg cct gtg ctg ttc ctg cac ggt aac ccg acc tcg tcc tac ctg tgg144Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45cgc aac atc atc ccg cat gta gca ccg agt cat cgg tgc att gct cca192Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60gac ctg atc ggg atg gga aaa tcg gac aaa cca gac ctc gat tat ttc240Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80ttc gac gac cac gtc cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt288Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95ttg gaa gag gtc gtc ctg gtc atc cac gac tgg ggc tca gct ctc gga336Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110ttc cac tgg gcc aag cgc aat ccg gaa cgg gtc aaa ggt att gca tgt384Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125
atg gaa ttc atc cgg cct atc ccg acg tgg gac gaa tgg ccg gaa ttc432Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140gcc cgt gag acc ttc cag gcc ttc cgg acc gcc gac gtc ggc cga gag480Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160ttg atc atc gat cag aac gct ttc atc gag ggt gcg ctc ccg aaa ttc528Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Lys Phe165 170 175gtc gtc cgt ccg ctt acg gag gtc gag atg gac cac tat cgc gag ccc576Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190ttc ctc aag cct gtt gac cga gag cca ctg tgg cga ttc ccc aac gag624Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205ctg ccc atc gcc ggt gag ccc gcg aac atc gtc gcg ctc gtc gag gca672Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220tac atg aac tgg ctg cac cag tca cct gtc ccg aag ttg ttg ttc tgg720Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240ggc aca ccc ggc gta ctg atc tcc ccg gcc gaa gcc gcg aga ctt gcc768Gly Thr Pro Gly Val Leu Ile Ser Pro Ala Glu Ala Ala Arg Leu Ala245 250 255gaa agc ctc ccc aac tgc aag aca gtg gac atc ggc ccg gga ttg cac816Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270ttc ctc cag gaa gac aac ccg gac ctt atc ggc agt gag atc gcg cgc864Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285tgg ctc ccc gca ctc atc gtc ggc aag tcg atc gag ttc gac ggc ggc912Trp Leu Pro Ala Leu Ile Val Gly Lys Ser Ile Glu Phe Asp Gly Gly290 295 300
tgg gcc acc tga924Trp Ala Thr305<210>42<211>307<212>PRT<213>分枝杆菌属<400>42Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Lys Phe165 170 175Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240Gly Thr Pro Gly Val Leu Ile Ser Pro Ala Glu Ala Ala Arg Leu Ala245 250 255
Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285Trp Leu Pro Ala Leu Ile Val Gly Lys Ser Ile Glu Phe Asp Gly Gly290 295 300Trp Ala Thr305<210>43<211>921<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(918)<400>43atg tca gaa atc ggt aca ggc ttc ccc ttc gac ccc cat tat gtg gaa 48Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15gtc ctg ggc gag cgt atg cac tac gtc gat gtt gga ccg cgg gat ggc 96Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30acg cct gtg ctg ttc ctg cac ggt aac ccg acc tcg tcc tac ctg tgg144Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45cgc aac atc atc ccg cat gta gca ccg agt cat cgg tgc att gct cca192Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60gac ctg atc ggg atg gga aaa tcg gac aaa cca gac ctc ggt tat ttc240Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe65 70 75 80ttc gac gac cac gtc cgc tac ctc gat gcc ttc atc gaa gcc ttg ggt288Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95
ttg gaa gag gtc gtc ttg gtc atc cac gac tgg ggc tca gct ctc gga336Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110ttc cac tgg gcc aag cgc aat ccg gaa cgg gtc aaa ggt att gca tgt384Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys115 120 125atg gaa ttc atc cgg tct atc ccg acg tgg gac gaa tgg ccg gaa ttc432Met Glu Phe Ile Arg Ser Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140gcc cgt gag acc ttc cag gcc ttc cgg acc gcc gac gtc ggc cga gag480Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160ttg atc atc gat cag aac gct ttc atc gag cat gtg ctc ccg aaa tac528Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu His Val Leu Pro Lys Tyr165 170 175gtc gtc cgt ccg ctt acg gag gtc gag atg gac cac tat cgc gag ccc576Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190ttc ctc aag cct gct gac cga gag cca ctg tgg cga ttc ccc aac gag624Phe Leu Lys Pro Ala Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205ctc ccc atc gcc ggt gag ccc gcg aac atc gtc gcg ctc gtc gag gca672Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220tac atg aac tgg ctg cac cag tca cct gtc ccg aag ttg ttg ttc tgg720Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240ggc aca ccc ggc cta ctg atc ccc ccg gcc gaa gcc tcg aga ctt gcc768Gly Thr Pro Gly Leu Leu Ile Pro Pro Ala Glu Ala Ser Arg Leu Ala245 250 255gaa agc ctc ccc aac tgc aag aca gtg gac atc ggc ccg gga ctg cac816Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270
ttc ctc cag gaa gac aac ccg gac ctt atc ggc agt gag atc gcg cgc864Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285tgg ctc gcc gga ctc gcg agc ggc ctc ggc gac tac cat cat cat cat912Trp Leu Ala Gly Leu Ala Ser Gly Leu Gly Asp Tyr His His His His290 295 300cat cat taa921His His305<210>44<211>306<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>44Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe65 70 75 80Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly85 90 95Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly100 105 110Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly lle Ala Cys115 120 125Met Glu Phe Ile Arg Ser Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe130 135 140Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu145 150 155 160Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu His Val Leu Pro Lys Tyr
165 170 175Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro180 185 190Phe Leu Lys Pro Ala Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu195 200 205Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala210 215 220Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp225 230 235 240Gly Thr Pro Gly Leu Leu Ile Pro Pro Ala Glu Ala Ser Arg Leu Ala245 250 255Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His260 265 270Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg275 280 285Trp Leu Ala Gly Leu Ala Ser Gly Leu Gly Asp Tyr His His His His290 295 300His His305<210>45<211>882<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(879)<400>45atg agc gaa gaa gcg atc tcg gcc ctc gac ccg cat cca cgc aag aaa 48Met Ser Glu Glu Ala Ile Ser Ala Leu Asp Pro His Pro Arg Lys Lys1 5 10 15cag gaa ctg ctc ggc acc tcg atg tct tat gtc gat acc ggg act ggc 96Gln Glu Leu Leu Gly Thr Ser Met Ser Tyr Val Asp Thr Gly Thr Gly20 25 30gag ccg gtg gtg ttc ctg cac ggc aat cca acc tcc tcg tac ttg tgg144Glu Pro Val Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45
cgg aac gtg att cca cat gtc gcg ccg gtc gcc agg tgc atc gct ccc192Arg Asn Val Ile Pro His Val Ala Pro Val Ala Arg Cys Ile Ala Pro50 55 60gac ctg atc ggg atg gga gcg tca ggg cct tcc tct agc ggc aac tac240Asp Leu Ile Gly Met Gly Ala Ser Gly Pro Ser Ser Ser Gly Asn Tyr65 70 75 80acg ttc gcc gat cat gcg cga cat ctc gat gcg ctc ctc gac gcg att288Thr Phe Ala Asp His Ala Arg His Leu Asp Ala Leu Leu Asp Ala Ile85 90 95ttg cca aag ggc cag ctc agc ttg gtg gtg cac gac tgg gga tcg gcg336Leu Pro Lys Gly Gln Leu Ser Leu Val Val His Asp Trp Gly Ser Ala100 105 110ctg ggc ttc cac tgg gcc aat cgc aat egg gat cgg gta agg gga atc384Leu Gly Phe His Trp Ala Asn Arg Asn Arg Asp Arg Val Arg Gly Ile115 120 125gcc tac atg gaa gcg att gtg cga ccg gtg ctg tgg tcg gag tgg ccc432Ala Tyr Met Glu Ala Ile Val Arg Pro Val Leu Trp Ser Glu Trp Pro130 135 140gaa cgt gcc cga gac att ttc aag acg ctg cga act ccg gcc ggc gaa480Glu Arg Ala Arg Asp Ile Phe Lys Thr Leu Arg Thr Pro Ala Gly Glu145 150 155 160gag atg att ctc aaa aac aac gta ttc gtg gag cgg atc ctg ccc ggc528Glu Met Ile Leu Lys Asn Asn Val Phe Val Glu Arg Ile Leu Pro Gly165 170 175agc gtc ttg cgc aaa ttg agc tcc gaa gaa atg gac aat tat cgc cgg576Ser Val Leu Arg Lys Leu Ser Ser Glu Glu Met Asp Asn Tyr Arg Arg180 185 190ccc ttt cgc gac gca gga gaa tcg cgg cgg cca aca ctc acg tgg ccg624Pro Phe Arg Asp Ala Gly Glu Ser Arg Arg Pro Thr Leu Thr Trp Pro195 200 205cgt cag att ccg atc gag ggt gag ccg gcc gac gtg gtg gaa atc gtg672Arg Gln Ile Pro Ile Glu Gly Glu Pro Ala Asp Val Val Glu Ile Val210 215 220
cag aaa tat tcc gag tgg ctg gca cag agc gcg gtg ccc aaa ctg ctc720Gln Lys Tyr Ser Glu Trp Leu Ala Gln Ser Ala Val Pro Lys Leu Leu225 230 235 240gtg aat gcg gag ccg gga gcg att ttg ata ggc gcg cag cgc gag ttt768Val Asn Ala Glu Pro Gly Ala Ile Leu Ile Gly Ala Gln Arg Glu Phe245 250 255tgc cac caa tgg ccg aat cag cgc gaa gtc acg gtc aag ggc gta cac816Cys His Gln Trp Pro Asn Gln Arg Glu Val Thr Val Lys Gly Val His260 265 270ttc atc cag gaa gat tcc ccg cac gag atc ggg cga gcg atc gca gac864Phe Ile Gln Glu Asp Ser Pro His Glu Ile Gly Arg Ala Ile Ala Asp275 280 285tgg tac cga gga atc tga882Trp Tyr Arg Gly Ile290<210>46<211>293<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>46Met Ser Glu Glu Ala Ile Ser Ala Leu Asp Pro His Pro Arg Lys Lys1 5 10 15Gln Glu Leu Leu Gly Thr Ser Met Ser Tyr Val Asp Thr Gly Thr Gly20 25 30Glu Pro Val Val Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Val Ile Pro His Val Ala Pro Val Ala Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Ala Ser Gly Pro Ser Ser Ser Gly Asn Tyr65 70 75 80Thr Phe Ala Asp His Ala Arg His Leu Asp Ala Leu Leu Asp Ala Ile85 90 95Leu Pro Lys Gly Gln Leu Ser Leu Val Val His Asp Trp Gly Ser Ala100 105 110
Leu Gly Phe His Trp Ala Asn Arg Asn Arg Asp Arg Val Arg Gly Ile115 120 125Ala Tyr Met Glu Ala Ile Val Arg Pro Val Leu Trp Ser Glu Trp Pro130 135 140Glu Arg Ala Arg Asp Ile Phe Lys Thr Leu Arg Thr Pro Ala Gly Glu145 150 155 160Glu Met Ile Leu Lys Asn Asn Val Phe Val Glu Arg Ile Leu Pro Gly165 170 175Ser Val Leu Arg Lys Leu Ser Ser Glu Glu Met Asp Asn Tyr Arg Arg180 185 190Pro Phe Arg Asp Ala Gly Glu Ser Arg Arg Pro Thr Leu Thr Trp Pro195 200 205Arg Gln Ile Pro Ile Glu Gly Glu Pro Ala Asp Val Val Glu Ile Val210 215 220Gln Lys Tyr Ser Glu Trp Leu Ala Gln Ser Ala Val Pro Lys Leu Leu225 230 235 240Val Asn Ala Glu Pro Gly Ala Ile Leu Ile Gly Ala Gln Arg Glu Phe245 250 255Cys His Gln Trp Pro Asn Gln Arg Glu Val Thr Val Lys Gly Val His260 265 270Phe Ile Gln Glu Asp Ser Pro His Glu Ile Gly Arg Ala Ile Ala Asp275 280 285Trp Tyr Arg Gly Ile290<210>47<211>1032<212>DNA<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<221>CDS<222>(1)...(1029)<400>47atg gct act act gga gaa gcg ata tct tct gca ttt ccg tac gag aag 48Met Ala Thr Thr Gly Glu Ala Ile Ser Ser Ala Phe Pro Tyr Glu Lys1 5 10 15cag cgc cgg cgg gtt ctg ggg aga gag atg gcc tat gtg gaa gtg ggg 96Gln Arg Arg Arg Val Leu Gly Arg Glu Met Ala Tyr Val Glu Val Gly20 25 30
gcc ggc gac ccg atc gtg ctg ctg cac ggc aat ccg acc tca tcc tac144Ala Gly Asp Pro Ile Val Leu Leu His Gly Asn Pro Thr Ser Ser Tyr35 40 45ctc tgg cgc aat gtc ctg ccg cat ctc caa cta cga ggc cga tgc atc192Leu Trp Arg Asn Val Leu Pro His Leu Gln Leu Arg Gly Arg Cys Ile50 55 60gcg ccc gac ctg att ggc atg ggc gac tcc gat aag cta cct gac agc240Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Asp Lys Leu Pro Asp Ser65 70 75 80ggc ccg agc tcg tat cgc ttc gta gat cag cgc cgc tac ctc gat gcg288Gly Pro Ser Ser Tyr Arg Phe Val Asp Gln Arg Arg Tyr Leu Asp Ala85 90 95ctg ctg gag gca ttg gac gta cgt gag cgt gtg acg ctc gtc att cat336Leu Leu Glu Ala Leu Asp Val Arg Glu Arg Val Thr Leu Val Ile His100 105 110gac tgg ggc tcg gga ctt ggc ttt gac tgg gcc aac cga cac cgc gac384Asp Trp Gly Ser Gly Leu Gly Phe Asp Trp Ala Asn Arg His Arg Asp115 120 125gcc gta aag ggc atc gca tac atg gag gcg atc gtg cgc ccg cag gga432Ala Val Lys Gly Ile Ala Tyr Met Glu Ala Ile Val Arg Pro Gln Gly130 135 140tgg gac cac tgg gac gta atg aat atg cgt cca ttc cta gag gcg ctg480Trp Asp His Trp Asp Val Met Asn Met Arg Pro Phe Leu Glu Ala Leu145 150 155 160cgt tcc gag gcc ggc gag aag atg gtc ctt gaa gac aac ttt ttc atc528Arg Ser Glu Ala Gly Glu Lys Met Val Leu Glu Asp Asn Phe Phe Ile165 170 175gag aag att tta cca ggc gct gtt ctc cgc aag ctc acc gcg gat gaa576Glu Lys Ile Leu Pro Gly Ala Val Leu Arg Lys Leu Thr Ala Asp Glu180 185 190atg gcg gag tat cgt cgg ccg ttc gct gaa ccc ggc gag gcg cga cga624Met Ala Glu Tyr Arg Arg Pro Phe Ala Glu Pro Gly Glu Ala Arg Arg195 200 205
ccg act ctg act tgg cca cgg gag att cct atc gat ggc aaa ccc gcc672Pro Thr Leu Thr Trp Pro Arg Glu Ile Pro Ile Asp Gly Lys Pro Ala210 215 220gac gtg aat acg att gtg gcg gcc tat tcg gag tgg ctt gcg acg agc720Asp Val Asn Thr Ile Val Ala Ala Tyr Ser Glu Trp Leu Ala Thr Ser225 230 235 240gat gtg ccc aag cta ttc ata aaa gcc gag ccc ggc gca ctc ctt ggc768Asp Val Pro Lys Leu Phe Ile Lys Ala Glu Pro Gly Ala Leu Leu Gly245 250 255agc ggg att aac ctt gaa acc gct cgc tcc tgg cct gcg cag acg gaa816Ser Gly Ile Asn Leu Glu Thr Ala Arg Ser Trp Pro Ala Gln Thr Glu260 265 270gta acc gtg gcc gga gtt cat ttt gtg caa gag gat tcg cca gat gag864Val Thr Val Ala Gly Val His Phe Val Gln Glu Asp Ser Pro Asp Glu275 280 285att ggg cgc tcg gat tct ggc gac cct tgg ccc gct ggc gga cga aat912Ile Gly Arg Ser Asp Ser Gly Asp Pro Trp Pro Ala Gly Gly Arg Asn290 295 300cgc cgt cta ctc gcc ccg tct ggc gca gca tct cga tca cta cag tcc960Arg Arg Leu Leu Ala Pro Ser Gly Ala Ala Ser Arg Ser Leu Gln Ser305 310 315 320gtt cgc gct cag ctt cgc act gcc ctg caa tac ccc cgg cct gcg gtt 1008Val Arg Ala Gln Leu Arg Thr Ala Leu Gln Tyr Pro Arg Pro Ala Val325 330 335cct gtg ccg cga cag ctt cga tga 1032Pro Val Pro Arg Gln Leu Arg340<210>48<211>343<212>PRT<213>人工序列<220>
<223>人工序列的描述人工修饰(突变)的脱卤素酶<400>48Met Ala Thr Thr Gly Glu Ala Ile Ser Ser Ala Phe Pro Tyr Glu Lys1 5 10 15Gln Arg Arg Arg Val Leu Gly Arg Glu Met Ala Tyr Val Glu Val Gly20 25 30Ala Gly Asp Pro Ile Val Leu Leu His Gly Asn Pro Thr Ser Ser Tyr35 40 45Leu Trp Arg Asn Val Leu Pro His Leu Gln Leu Arg Gly Arg Cys Ile50 55 60Ala Pro Asp Leu Ile Gly Met Gly Asp Ser Asp Lys Leu Pro Asp Ser65 70 75 80Gly Pro Ser Ser Tyr Arg Phe Val Asp Gln Arg Arg Tyr Leu Asp Ala85 90 95Leu Leu Glu Ala Leu Asp Val Arg Glu Arg Val Thr Leu Val Ile His100 105 110Asp Trp Gly Ser Gly Leu Gly Phe Asp Trp Ala Asn Arg His Arg Asp115 120 125Ala Val Lys Gly Ile Ala Tyr Met Glu Ala Ile Val Arg Pro Gln Gly130 135 140Trp Asp His Trp Asp Val Met Asn Met Arg Pro Phe Leu Glu Ala Leu145 150 155 160Arg Ser Glu Ala Gly Glu Lys Met Val Leu Glu Asp Asn Phe Phe Ile165 170 175Glu Lys Ile Leu Pro Gly Ala Val Leu Arg Lys Leu Thr Ala Asp Glu180 185 190Met Ala Glu Tyr Arg Arg Pro Phe Ala Glu Pro Gly Glu Ala Arg Arg195 200 205Pro Thr Leu Thr Trp Pro Arg Glu lle Pro Ile Asp Gly Lys Pro Ala210 215 220Asp Val Asn Thr Ile Val Ala Ala Tyr Ser Glu Trp Leu Ala Thr Ser225 230 235 240Asp Val Pro Lys Leu Phe Ile Lys Ala Glu Pro Gly Ala Leu Leu Gly245 250 255Ser Gly Ile Asn Leu Glu Thr Ala Arg Ser Trp Pro Ala Gln Thr Glu260 265 270Val Thr Val Ala Gly Val His Phe Val Gln Glu Asp Ser Pro Asp Glu275 280 285Ile Gly Arg Ser Asp Ser Gly Asp Pro Trp Pro Ala Gly Gly Arg Asn290 295 300Arg Arg Leu Leu Ala Pro Ser Gly Ala Ala Ser Arg Ser Leu Gln Ser305 310 315 320Val Arg Ala Gln Leu Arg Thr Ala Leu Gln Tyr Pro Arg Pro Ala Val
325 330 335Pro Val Pro Arg Gln Leu Arg340<210>49<211>280<212>PRT<213>人工序列<220>
<223>Consensus sequence<400>49Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu1 5 10 15Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly20 25 30Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp35 40 45Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro50 55 60Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Tyr Phe Asp65 70 75 80Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu Glu85 90 95Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe His100 105 110Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met Glu115 120 125Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala Arg130 135 140Glu Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu Ile Ile145 150 155 160Asp Gln Asn Ala Phe Ile Glu Leu Pro Lys Val Val Arg Pro Leu Thr165 170 175Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe Leu Lys Pro Val Asp180 185 190Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Pro Ile Ala Gly Glu Pro195 200 205Ala Asn Ile Val Ala Leu Val Glu Ala Tyr Met Trp Leu His Gln Ser210 215 220Pro Val Pro Lys Leu Leu Phe Gly Thr Pro Gly Val Leu Ile Pro Ala225 230 235 240Glu Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn Cys Lys Thr Val Asp
245 250 255Ile Gly Pro Gly Leu His Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly260 265 270Ser Glu Ile Ala Arg Trp Leu Leu275 280
权利要求
1.含具有脱卤素酶活性的多肽的编码序列的分离核酸，其中所述的序列选自SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
2.根据权利要求1所述的分离核酸，其中所述的分离核酸包括在高度严格条件下与选自下列的序列杂交的互补序列SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47，以及在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的。
3.根据权利要求1所述的分离核酸，其中所述的分离核酸包括在中度严格条件下与选自下列的序列杂交的互补序列SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47，以及在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的。
4.根据权利要求1所述的分离核酸，其中所述的分离核酸包括在低度严格条件下与选自下列的序列杂交的互补序列SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47，以及在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的。
5.根据权利要求1所述的分离核酸，其中所述的变异体在至少大约200个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％的同源性，如通过序列比较算法分析确定的。
6.根据权利要求1所述的分离核酸，其中所述的变异体在整个序列区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％的同源性。
7.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约55％的同源性。
8.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约60％的同源性。
9.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约65％的同源性。
10.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约70％的同源性。
11.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约75％的同源性。
12.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约80％的同源性。
13.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约85％的同源性。
14.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约90％的同源性。
15.根据权利要求1，2，3，4，5或6所述的分离核酸，其中所述的变异体与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约95％的同源性。
16.根据权利要求1所述的分离核酸，其中所述的序列比较算法分析是具有缺省参数的3.0t78版FASTA。
17.分离核酸，其含有选自下列序列的序列的至少10个连续碱基SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
18.根据权利要求17所述的分离核酸，其中所述的序列在至少大约200个残基的区域内与选自以下的序列具有至少大约50％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
19.根据权利要求17所述的分离核酸，其中所述的序列在整个序列区域内与选自以下的序列具有至少大约50％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
20.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约55％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
21.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约60％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
22.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约65％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
23.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约70％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
24.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约75％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
25.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下序列具有至少大约80％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
26.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约85％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
27.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约90％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
28.根据权利要求17，18或19所述的分离核酸，其中所述的序列与选自以下的序列具有至少大约95％的同源性SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47。
29.分离核酸，其编码选自以下的多肽具有选自以下的氨基酸序列的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；和具有选自以下的多肽序列的至少10个连续氨基酸的多肽SEQ IDNOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
30.包括选自如下的纯化多肽具有选自以下的氨基酸序列的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；和具有选自以下的多肽序列的至少10个连续氨基酸的多肽SEQ IDNOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
31.根据权利要求30所述的纯化多肽，其中所述的氨基酸序列在至少大约200个残基的区域内与选自以下的序列具有至少大约50％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
32.根据权利要求30所述的纯化多肽，其中所述的氨基酸序列在整个序列区域内与选自以下的序列具有至少大约50％的同源性SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
33.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约55％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
34.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约60％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
35.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约65％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
36.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约70％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
37.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约75％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
38.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约80％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
39.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约85％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
40.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约90％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
41.根据权利要求30，31或32所述的纯化多肽，其中所述的氨基酸序列与选自以下的序列具有至少大约95％的同源性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
42.根据权利要求30所述的纯化多肽，具有选自以下的氨基酸序列SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；和在整个序列中与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的序列。
43.与选自以下的多肽特异结合的纯化抗体包括选自以下的氨基酸序列的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；和具有选自以下的多肽序列的至少10个连续氨基酸的多肽SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
44.根据权利要求43所述的纯化抗体，所述纯化抗体与具有选自以下的多肽序列的至少10个连续氨基酸的多肽特异地结合SEQ IDNOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48。
45.根据权利要求43所述的抗体，其中所述的抗体是多克隆的。
46.根据权利要求43所述的抗体，其中所述的抗体是单克隆的。
47.用于产生选自以下的多肽的方法具有选自以下的氨基酸序列的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；和具有以下多肽序列的至少10个连续氨基酸的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；包括以下步骤将编码多肽的核酸在允许多肽表达的条件下导入宿主细胞，和回收多肽。
48.用于产生含选自以下的序列的至少10个氨基酸的多肽的方法SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48，所述方法包括以下步骤将可操作地连接到启动子上的编码多肽的核酸在允许多肽表达的条件下导入宿主细胞中，并回收多肽。
49.用于产生包括如下的变异体的方法获取包括详细以下的多核苷酸的核酸SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；和含任何前述序列的至少30个连续核苷酸的片段；和在所述多核苷酸中修饰一个或多个核苷酸成为另一个核苷酸，在所述的多核苷酸中删除一个或多个核苷酸，或在所述的多核苷酸上添加一个或多个核苷酸。
50.根据权利要求49所述的方法，其中所述的修饰是通过以下方法进行的易错PCR、改组、寡核苷酸定向的诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、循环系综诱变、指数系综诱变、位点特异性诱变、基因再装配、基因位点饱和诱变或它们的任何组合、排列或反复步骤。
51.根据权利要求50所述的方法，其中所述的修饰是通过易错PCR导入的。
52.根据权利要求50所述的方法，其中所述的修饰是通过改组导入的。
53.根据权利要求50所述的方法，其中所述的修饰是通过寡核苷酸定向诱变导入的。
54.根据权利要求50所述的方法，其中所述的修饰是通过装配PCR导入的。
55.根据权利要求50所述的方法，其中所述的修饰是通过有性PCR诱变导入的。
56.根据权利要求50所述的方法，其中所述的修饰是通过体内诱变导入的。
57.根据权利要求50所述的方法，其中所述的修饰是通过盒式诱变导入的。
58.根据权利要求50所述的方法，其中所述的修饰是通过循环系综诱变导入的。
59.根据权利要求50所述的方法，其中所述的修饰是通过指数系综诱变导入的。
60.根据权利要求50所述的方法，其中所述的修饰是通过位点特异性诱变导入的。
61.根据权利要求50所述的方法，其中所述的修饰是通过基因再装配导入的。
62.根据权利要求50所述的方法，其中所述的修饰是通过基因位点饱和诱变导入的。
63.其上已经存储了选自以下的序列的计算机可读介质SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的核酸序列；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的核酸序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；与核酸序列变异体互补的核酸序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽序列；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的多肽序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的多肽序列；和与多肽序列变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
64.包括处理器和数据存储装置的计算机系统，其中所述的数据存储装置上储存了选自以下的序列SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的核酸序列；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的核酸序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；与核酸序列变异体互补的核酸序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽序列；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的多肽序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的多肽序列；和与多肽序列变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
65.根据权利要求64所述的计算机系统，其进一步包括序列比较算法和一个其上储存了至少一个参考序列的数据存储装置。
66.根据权利要求65所述的计算机系统，其中所述的序列比较算法包括说明多态性的计算机程序。
67.根据权利要求64所述的计算机系统，其进一步包括识别所述序列中一个或多个特征的识别器。
68.用于将第一条序列与第二条序列进行比较的方法，所述方法包括以下步骤通过使用比较序列的计算机程序读取第一条序列和第二条序列；和用计算机程序检测第一条序列和第二条序列间的差异，其中所述的第一条序列是选自以下的序列SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的核酸序列；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的核酸序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；与核酸序列变异体互补的核酸序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽序列；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的多肽序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的多肽序列；和与多肽序列变异体互补的多肽序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
69.根据权利要求68所述的方法，其中所述的检测第一条序列和第二条序列间差异的步骤进一步包括识别多态性的步骤。
70.用于在序列中识别特征的方法，所述方法包括以下步骤采用在序列中识别一个或多个特征的计算机程序读取序列；和用计算机程序识别序列中的一个或多个特征，其中所述的序列选自以下序列SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的核酸序列；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的核酸序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；与核酸序列变异体互补的核酸序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的；SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽序列；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的多肽序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的多肽序列；和与多肽序列变异体互补的多肽序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
71.水解碳-卤键的方法，所述方法包括将含碳-卤键的物质与选自以下的多肽在加速碳-卤键水解的条件下接触SEQ ID NO，4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48和基本上与它们一致的序列。
72.催化卤烷或卤羧酸分解的方法，所述方法包括将含卤烷或卤羧酸的样本在加速卤烷或卤羧酸分解的条件下与多肽接触的步骤，所述的多肽具有选自以下的序列SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽序列；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的多肽序列变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的多肽序列；和与多肽序列变异体互补的多肽序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
73.识别功能多肽片段或变异体的测定方法，该功能多肽片段或变异体是由以下序列的片段编码的SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47，以及在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％同源性的序列，如通过序列比较算法分析或通过目测而确定的，它们保留了以下多肽的至少一个特性SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽，以及在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％同源性的序列，如通过序列比较算法分析或通过目测而确定的，所述测定方法包括以下步骤将SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的多肽，和在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％同源性的序列，如通过序列比较算法分析或通过目测而确定的，由以下序列编码的多肽片段或变异体SEQID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47以及在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％同源性的序列，如通过序列比较算法分析或通过目测而确定的，以及与上述任何序列互补的序列，与底物分子在允许特定多肽发挥作用的条件下接触；和检测底物量的下降或来自所述多肽和所述底物反应的反应产物量的增加；其中所述的底物量下降或反应产物量的增加预示功能性多肽的存在。
74.核酸探针，其含有大约10至50个核苷酸长的寡核苷酸，并具有与核酸序列的核酸靶区域至少50％互补的至少10个连续核苷酸片段，所述的核酸序列选自SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；与核酸靶区域在中度至高度严格的条件下杂交以形成可探测的目标探针双联体。
75.根据权利要求74所述的探针，其中所述的寡核苷酸是DNA。
76.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少55％互补的至少10个连续的核苷酸片段。
77.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少60％互补的至少10个连续的核苷酸片段。
78.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少65％互补的至少10个连续的核苷酸片段。
79.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少70％互补的至少10个连续的核苷酸片段。
80.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少75％互补的至少10个连续的核苷酸片段。
81.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少80％互补的至少10个连续的核苷酸片段。
82.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少85％互补的至少10个连续的核苷酸片段。
83.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少90％互补的至少10个连续的核苷酸片段。
84.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少95％互补的至少10个连续的核苷酸片段。
85.根据权利要求74所述的探针，其中所述的寡核苷酸具有与核酸靶区域完全互补的至少10个连续的核苷酸片段。
86.根据权利要求74所述的探针，其中所述的寡核苷酸长度是15-50个碱基。
87.根据权利要求74所述的探针，其中所述的探针进一步含有可探测的同位素标记。
88.根据权利要求74所述的探针，其中所述的探针进一步含有可探测的非同位素标记，选自荧光分子、化学发光分子、酶、辅因子、酶底物和半抗原。
89.根据权利要求86所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少90％互补的至少15个连续核苷酸的片段，它与核酸靶区域在中度至高度严格的条件下杂交以形成可探测的目标探针双联体。
90.根据权利要求86所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少95％互补的至少15个连续核苷酸的片段，它与核酸靶区域在中度至高度严格的条件下杂交以形成可探测的目标探针双联体。
91.根据权利要求86所述的探针，其中所述的寡核苷酸具有与核酸靶区域至少97％互补的至少15个连续核苷酸的片段，它与核酸靶区域在中度至高度严格的条件下杂交以形成可探测的目标探针双联体。
92.分离或识别脱卤素酶基因的多核苷酸探针，其至少具有与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47之一的片段相同或完全互补的序列。
93.蛋白制剂，其包括具有选自以下的氨基酸序列的多肽具有选自以下的氨基酸序列的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的序列；和具有选自以下的多肽序列的至少10个连续氨基酸的多肽SEQ IDNOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；和其中所述的蛋白制剂是液体的。
94.包括选自以下的多肽的蛋白制剂多肽具有选自如下的氨基酸序列SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48互补的序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的序列；和具有以下多肽序列的至少10个连续氨基酸的多肽SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46和48；和其中所述的多肽是固体的。
95.修饰小分子的方法，所述方法包括将由选自以下的多核苷酸编码的至少一个多肽与至少一个小分子混合的步骤SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的，以及任何前述多肽的片段；以经过至少一个生物催化反应产生至少一个修饰的小分子，其中所述的至少一个多肽具有脱卤素酶活性。
96.根据权利要求95所述的方法，其中所述的至少一个多肽包括大量多肽，至少一个小分子包括大量小分子，由此经过大量的生物催化反应产生了大量修饰的小分子，以形成修饰小分子的文库。
97.根据权利要求96所述的方法，所述方法进一步包括检测文库的步骤，以确定具有所需活性的特定修饰小分子是否存在于该文库中。
98.根据权利要求97所述的方法，其中所述的检测文库的步骤进一步包括以下步骤通过检测存在或不存在具有所需活性的特定修饰小分子的修饰小分子部分，有系统地去除所有生物催化反应，除用于产生文库中大量小分子的一部分的反应之外，并鉴定产生所需活性的特定修饰小分子的特定生物催化反应。
99.根据权利要求98所述的方法，其中所述的产生所需活性的修饰小分子的特定生物催化反应是重复的。
100.根据权利要求93所述的方法，其中所述的生物催化反应用一组生物催化剂进行，生物催化剂与在至少一个小分子中发现的独特结构部分起反应；每个生物催化剂对于特定的结构部分或一组相关结构部分是特异的；和每个生物催化剂与大量小分子起反应，后者含有对特定生物催化剂特异的特定结构部分。
101.含有具脱卤素酶活性的多肽的编码序列的克隆载体，所述的序列选自于SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
102.含有具脱卤素酶活性的多肽的编码序列的宿主细胞，所述的序列选自于SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47；在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的；与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47互补的核酸序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的。
103.能够在宿主细胞中复制的表达载体，其含有选自以下序列的多核苷酸SEQ ID NOS1，3，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47和9，在至少大约100个残基的区域内与SEQ ID NOS1，3，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47和9的至少之一具有至少大约50％同源性的变异体，如通过序列比较算法分析或通过目测而确定的，与SEQ IDNOS1，3，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47和9互补的核酸序列；和与变异体互补的序列，该变异体在至少大约100个残基的区域内与SEQ ID NOS1，3，3，5，7，9，11，13，15，17，19，21，23，25，27，29，31，33，35，37，39，43，45和47和9具有至少大约50％的同源性，如通过序列比较算法分析或通过目测而确定的，以及与具有上述任何序列的核酸在低、中和高度严格条件下杂交的分离核酸。
104.根据权利要求101或103所述的载体，其中所述的载体包括病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒、含F因子嗜菌粒、细菌噬菌体、人工染色体、腺病毒、逆转录酶病毒载体和腺相关病毒载体。
105.含有根据权利要求103所述的表达载体的宿主细胞。
106.根据权利要求47、102、103或105所述的宿主细胞，其中所述的宿主选自原核生物、真核生物、真菌、酵母、植物和代谢旺盛的宿主。
107.根据权利要求1所述的分离核酸，其中所述的变异体是通过选自以下的方法产生的易错PCR、改组、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、循环系综诱变、指数系综诱变、位点特异性诱变、基因再装配、基因位点饱和诱变或它们的任何组合、排列或反复步骤。
108.根据权利要求49-62中任一个所述的方法，其中所述的一个或多个核苷酸的修饰任选地重复1至多次。
109.根据权利要求49所述的方法，其中所述的修饰是导入修饰的碱基。
110.根据权利要求64所述的方法，其中所述的修饰碱基是次黄嘌呤核苷。
111.产生(R)-(±)-3-卤代-1，2-丙二醇的方法包括，所述方法将1，3-二卤代-2-丙醇与多肽在产生(R)-(±)-3-卤代-1，2-丙二醇的条件下接触，所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
112.根据权利要求111所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
113.根据权利要求111所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
114.根据权利要求111所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
115.根据权利要求111所述的方法，其中所述的多肽具有SEQ IDNOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48中列出的序列，及其经保守取代、删除或插入的序列。
116.合成甘油的方法，所述方法包括将三氯丙烷或二氯丙醇与多肽在合成甘油的条件下接触，所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
117.根据权利要求116所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
118.根据权利要求116所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
119.根据权利要求116所述的方法，其中所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
120.根据权利要求116所述的方法，其中所述的多肽具有SEQID NOs4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48中的序列，及其经保守取代、删除或插入的序列。
121.产生旋光卤代乳酸的方法，所述方法包括将二卤代丙酸与多肽在产生旋光卤代乳酸的条件下接触，所述多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
122.根据权利要求121所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
123.根据权利要求121所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
124.根据权利要求121所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
125.根据权利要求121所述的方法，其中所述的多肽具有选自SEQ ID NOs4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列，及其经保守取代、删除或插入的序列。
126.生物补救的方法，所述方法包括将环境样本与多肽接触，所述多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
127.根据权利要求126所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
128.根据权利要求126所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
129.根据权利要求126所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
130.根据权利要求126所述的方法，其中所述的多肽具有选自SEQ ID NOs4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列，及其经保守取代、删除或插入的序列。
131.消除样本中卤化污染物或卤化杂质的方法，所述方法包括将样本与多肽接触，所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
132.根据权利要求131所述的方法，其中所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
133.根据权利要求131所述的方法，其中所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
134.根据权利要求131所述的方法，其中所述的多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
135.根据权利要求131所述的方法，其中所述的多肽具有选自SEQ ID NOs4，6，8，10，12，14，16，1，8，20，22，24，26，28，30，32，34，36，38，44，46，48的序列，及其经保守取代、删除或插入的序列。
136.合成二醇的方法包括，所述方法包括将二卤代丙烷或单卤代丙醇在二醇合成的条件下与多肽接触，多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
137.根据权利要求136所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
138.根据权利要求136所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
139.根据权利要求136所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
140.根据权利要求136所述的方法，其中所述的多肽具有选自SEQ ID NOs4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列，及其经保守取代、删除或插入的序列。
141.卤素取代的环烃基的脱卤素方法，所述方法包括将卤素取代的环烃基在卤素取代的环烃基脱卤素的条件下与多肽接触，所述多肽与选自SEQ ID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少70％的同源性，并具有脱卤素酶活性。
142.根据权利要求141所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少80％的同源性。
143.根据权利要求141所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少90％的同源性。
144.根据权利要求141所述的方法，其中所述的多肽与选自SEQID NOS4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列和基本上与它们一致的序列具有至少95％的同源性。
145.根据权利要求141所述的方法，其中所述的多肽具有选自SEQ ID NOs4，6，8，10，12，14，16，18，20，22，24，26，28，30，32，34，36，38，44，46，48的序列，及其经保守取代、删除或插入的序列。
全文摘要
本发明涉及卤烷脱卤素酶和编码卤烷脱卤素酶的多核苷酸。此外还提供了设计新脱卤素酶的方法及其使用方法。脱卤素酶在pH和温度升高的情况下活性和稳定性增加。
文档编号C12N15/09GK1610754SQ01822258
公开日2005年4月27日申请日期2001年11月30日优先权日2000年12月1日
发明者J·M·肖特, E·J·马瑟, T·理查森, D·罗伯逊, K·格雷申请人:戴弗萨公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.M.肖特;E.J.马瑟;T.理查森;D.罗伯逊;K.格雷
技术所有人：戴弗萨公司
我是此专利的发明人

上一篇：编码乙酰乳酸合酶基因的基因的制作方法
上一篇：诱导植物开花的hd3a基因及其应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。