假单胞菌荧光假单胞菌脂肪酶蛋白编码序列的制作方法

文档序号:589416阅读:568来源:国知局

专利名称::假单胞菌荧光假单胞菌脂肪酶蛋白编码序列的制作方法
技术领域
:本发明涉及的是一种蛋白编码序列,特别是一种假单胞菌尸sewflbMwaswW几IPASE1蛋白编码序列,属于基因工程领域。技术背景近年来,生产生物柴油的方法主要有化学法和生物(酶)法两种。化学法是在强碱高温高压条件下,利用甲醇或者乙醇等替换油脂中的甘油来生产生物柴油。但由于生产过程中甲醇大大过量,后续处理比较繁杂,同时废酸臧容易造成二次污染。生物(酶)法则是在常温常压下利用脂酶(脂肪嗨)作为催化剂来合成生物柴油,具有条件温和、甲醇用量少和能耗低、环保性能好等优点,成为国内外研究的热点。已经开发出一系列商业用脂酶和固定化技术,例如日本用酶法利用废食用油生产生物柴油,同时采用固定化工艺和甲醇分段添加技术来提高转化率.目前生物(酶)法存在儿个需要解决的问题一是商品嗨价格偏高,如性能较好的novozyme脂肪酶435的价格为1万元人民币/公斤;二是酶在甲醇或乙醇等中容易失活,并且甘油也会在-定程度上影响酶活性。因此开发催化活性高、成本低并且对醇和甘油具有较好耐受力的稳定的脂瞎是解决上述问题的关键所在。假单胞菌户se"A/BW7as矽W几IPASE1编码的蛋白就是这样一种脂酶。在对现有技术文献的分析中,但至今尚未发现与本发明主题有密切联系文献的报道。
发明内容本发明的目的在于克服现有技术中的不足,提供一种假单胞菌尸S^/0bHO/2aSspW几IPASEl蛋白编码序列。本发明公开r假单胞菌尸sewc/o加/7asspW几IPASE!蛋白序列及其核酸序列,及其在利用转基因技术改良应用。本发明是通过以F技术与案实现的在本发明的一个方面,提供了一种分离出的DNA分子,该分子包括编码具有W几IPASE1蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列有至少7096的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQIDNO.3所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列。在本发明的另一方面,提供了一种分离出的W几IPASE1相关蛋白质多肽,它包括具有SEQIDNO.3氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQIDNO.3序列的多肽。在本发明还提供了一种载体,它包含上述的DNA分子。一种核酸分子,它包含所述的DNA分子中8-100个连续核苷酸。在本发明还提供了一种用上述载体转化的宿主细胞,它是原核或真核细胞。在实例中该宿主细胞是大肠杆菌。在本发明中,"分离的"、"纯化的"DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段己经与天然状态下伴随核酸的组分分开,而且己经与在细胞中伴随其的蛋白质分开。在本发明中,术语"W几IPASE1蛋白(或多肽)编码序列"指编码具有W几IPASEl蛋白活性的多肽的核苷酸序列,如SEQIDNO.3中第133-1980位核苷酸序列及其简并序列。该简并序列是指,位于SEQIDNO.3序列的编码框第133-1980位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQIDNO.3中第133-1980位核苷酸序列同源性低至约70%的简并序列也能编码出SEQIDNO.3所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。该术语还包括能编码具有与天然的假单胞菌i^"&挑o"flS脂肪酶相同功能的蛋白的SEQIDNO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为l"90个,较佳地1"60个,更佳地1-20个,最佳地l-10个)核苷酸的缺失、插入和/或取代,以及在5,和/或3,端添加数个(通常为60个以内,较佳地为30个以内,更;佳地为IO个以内,最佳地为5个以内)核苷酸。在本发明中,术语"假单胞菌A'fo/iwas印W几IPASE1蛋白或多肽"指具有W几IPASE1蛋白活性的SEQIDNO.3序列的多肽。该术语还包括具有与天然假单胞菌i^"ifo加湖05^脂肪酶相关相同功能的、SEQIDN0.4序列的变异形式。这些变异形式包括(但并不限于)若千个(通常为卜50个,较佳地1-30个,更佳地l-20个,最佳地卜10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为IO个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括假单胞菌尸w"(to/iw"flss/;脂肪酶相关蛋白的活性片段和活性衍生物。本发明的假单胞菌fte"Aww/wsvWJLIPASE1多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与假单胞杆菌脂肪酶相关DNA杂交的DNA所编码的蛋白、以及利用抗假单胞菌Pse"rfo/iuwms印W几IPASE1多肽的抗血清获得的多肽或蛋白。在本发明中,"假单胞菌fte"(fo附朋os印W几IPASEl保守性变异多肽"指与SEQIDNO.3的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。表1<table>tableseeoriginaldocumentpage5</column></row><table><table>tableseeoriginaldocumentpage6</column></row><table>AEVLGKYDSEGNLTG538ateggcattgcttttcgcggcaccagcggcccgcgcgaatetctgIGIAFRGTSGPRESL7583atcaccgataccatcggcgatttggtcaatgacctgctggccggtITDTIGDLVNDLLAG628ttcggcccgaatggctatgccgataactacagtctgaaagccttcFGPNGYADNYSLKAF673ggcaccctgctgg鄉atgtggccaaattcgcccaggcgcacgggGTLLEDVAKFAQAHG718ctgagcggggatgacattaccatcagtggccatagcctcggcggcLSGDDITISGHSLGG763ctggccgtgaacagtatggcggcgcteagcgacggcaattgggggLAVNSMAALSDGNWG808ggcttctatgcgcagtccaactatgtcgcctttgcttctcctaccGFYAC!SNYVAFASPT853caatacgaaaccggcggcaaagtgattaacgtcggttacgaaaatQYETGGKVINVGYEN898gacccggtattccgcgcgttggacggtaccaacgcgcacctctgcDPVFRALDGTNAHLC943a3cgctgggcgtcatg3Cgcaccgcaag3ctccgcc3cc33C33cNAGRHDAP(JDSATNN988atcgttaatttcaacgaccactatgcctccgccgcctggaatattIVNFNDHYASAAWNI1033ctgcccttctegatcctcaatattccaacctggttatctcacctgLPFSILNIPTWLSHL1078ccgttcctttatcaggacgggttgatgcgggtattgaattcagagPFLY(^DGLMRVLNSE1123ttctactogctgaccagcaaagactcgacggtgatcgtttccaacFYSLTSKDSTVIVSN1168ctttctgacgtcacccgcggcaatacctgggtggaagacctcaacLSDVTRGNTWVEDLN1213cgcaacgccgagcaacacagcggcccaacctttattgtcggcagcRNAEQHSGPTFIVGS1258gacggcaatgaccttatcaagggcggcactggaaatgattatetcDGNDLIKGGTGNDYL1303gagggccgtgccggcaatgacacattccgtgacgatggcggttttEGRAGNDTFRDDGGF1348aatattatttccggcggtgaaggccataacaccctggatttgcagNIISGGEGHNTLDLQ1393catgcattgaaaaacaccgaggtcgcgtacgacggcaatacgctoHALKNTEVAYDGNTL1438tatttgcgcgatgctgacggtggcatcaccctggctaactcgatcYLRDADGGITLANSI1483ggcacgctgaaaagcaaagagtcgtcactgttga加caccaaaGTLKSKESSLLIFTK1528g鄉ttgatcaccaggtgaccgacaacggcttgctttccaccaagEVDHQVTDNGLLSTK'1573鹏ctgaccgcctatgccagttcggcaaacggcaccgcggccgatGLTAYASSANGTAAD1618gacgttctgactgctaaagagtccggetectggctettcggtttgDVLTAKESGSWLFGL1663gagggaaatgaccagctgtttggcggcaaaggcaatgacgtgttcEGNDQLFGGKGNDVF1708gtcggcggcgcgggtaacgacgttatgcacagccagggtggcagcVGGAGNDVMHSQGGS1753aataccttcctgttcagtggcgacttcggtcaggatotgatttacNTFLFSGDFGQDLIY1798ggttatoaggcgcaggataagctggtgtttatcggtaccgaaggcGYQAQDKLVFIGTEG1843agcagctegggcggtaattatcgcgattttgtttccgaggtgaacSSSGGNYRDFVSEVN1888gacaacctggtgtttaactttggcggcagtacggtcactttagtcDNLVFNFGGSTVTLV1933gggatcggattcgatagcctgtcggatggccaggtggtgctggcgGIGFDSLSDGQVVLA1978taa1980i981tcgacaateactagtgaattcgcggccgcctgcaggtcgaccatatgggagagctcccaa2041cgcgttggatgcatagcttgagtattctatagtgtcacctaaatagcttggcgtaatcat2101ggtcatagctgtttcctgtgtgaaattgtattcg表2为本发明的假单胞杆菌(尸w"rtoimw肪s/;)胞外分泌脂肪酶基因的核苷酸和氨基酸序列。表3Identities=474/616(7696),Positives=520/616(84%),Gaps=4/616,Query1MGDFLLSGPDEAKSKTLFTDAMAISTYAYHNIDNGFDEGYHSSGFGLGLPFTLVTALIGS60MGFDESKLF+M+AISTYAYHNIDNGFDEGYH+GFGLGLPTL+TALIGSSbjct1MGIFSYKDLDENASKALFSDALAISTYAYHNIDNGFDEGYHQTCFGLGLPLTLITALIGS60Query61TQSQGGLPGIPWNPDSEQAALMVNNAGWSLISADQLGYQGKTDARXXXXXXXXXXXXAQ120TQSQGGLPG+PWNPDSEQAAAVNNAGWS+ISA^GYGKTOARGTYYGETGYTTAQSbjct61TQSQGGLPGLPWNPDSEQAAQEAVNNAGWSVISATQLGYAO(TDARGTYYGETAGYTTAQ120Query121AEVLGKTOSEGNLTGIGIAFRGTSGPRESLITDTIGDLVNDLLAGFGPNGYADNYSLKAF180AEVLGKYDSEGNLTIGI+FRGTSGPRESLIDTIGD++NDLLAGFGPGYADY+LKAFSbjct121AEVLGKYDSEGNLTAIGISraGTSGPRESLIGDTIODVINDLLAffGPKGYADGYTLKAF180Query181GTLLEDVAKFAQAHGLSGDDITISGHSLGGLAVNSMAALSDGNWGGFYAQSNYVAFASPT240GLLDVAKFAQAHGLSG+D++SGHSLGGLAVNSMAASDNffGGFYAQSNYVAFASPTSbjct181GNLLGDVAKFAQAHGLSGEDVWSGHSLGGLAVNSMAAQSDANWGGFYAQSNYVAFASPT240Query241QYETGGKVINVGYENDPVFRALDGTNAHLCNAGRHDAPQDSATNNIVNFNDHYASAAWNI300QYEGGKVIN+GYENDPYFRALDGT+L+GHDAPSATNNIVNFNDHYASAWN+Sbjct241QYEAGGKVINIGYENDPVFRALDGTSLTLPSLG卿APHTSATNNIVNFNDHYASDAWNL300Query301LPFSILNIPTWLSHLPFLYQDGLMRVLNSEFYSLTSKDSTVIVSNLSDVTRGNTWVEDLN360LPFSILNIPTWLSHLPFYQDGLMRVLNSEFYSLTKDST+IVSNLS+VTRGNTWVEDLNSbjct301LPFSILNIPTWLSHLPFFYQDGLMRVLNSEFYSLTDKDSTIIVSNLSNVTRGNTWVEDLN360Query361RNAEQHSGPTFIVGSDGNDLIKGGTGNDYLEGRAGNDTFRDDGGFNIISGGEGHNTLDLQ420RNABHSGPTFI+GSDGNDLIKGGGNDYLEGRG+DFRDGG+N+I+GG+GHNDQSbjct361RNAETHSGPTFIIGSDGNDLIKGGKGNDYLEGRDGDDIFRDAGGYNLIAGGKGHNIFDTQ420Query421HALKNTEVAYDGNTLYLRDADGGITLANSIGTLKSKESSLLIFTKEVDHQVTDNGLLSTKALKNTEVAYDGNTLYLRDAGGITLA+ITL+SKE+SLIFKEVDHQVTGLSSbjct421QALKNTEVATOGNTLYLRDAKGGITLADDISTLRSKETSWLIFNKEVDHQVTMGLKSDS480480Query481GLTAYASSANGTAADDVLTAKESGSWLFGLEGNDQLFG-GKGNDVFVGGAGNDVMHSQGG539GLAYA+AGDDVLA++ffLFGGNDLGGNFVGC+G+D++GSbjct481GLKAYA-MTGGDGDDVLQARSHDAWLFGNAGNDTLIGHAGGNLTFVGGSGDDILKGVGN539Query540SNTFLFSGDFGQDLIYGYQAQDKLVFIGTEGSSSGGNYRDFVSEVNDNLVFNFGGSTVTL599NTFLFSGDFG+D+YG+ADKLVFIGTEG+SGNRD+++ND+LVFGSVTLSbjct540GNTFLFSGDFGRDQLYGFNASDKLVFIGTEGAS—GNIRDYATQQNDDLVLAFGHSQVTL597Query600VGIGFDSLSDGQWLA615+G+D+SQWLASbjct598IGVSLDHISTDQWLA613Query:本发明的假单胞杆菌ff几IPASEl的氨基酸序列Sbjct:Serratiamarcescens的extracellularlipase氨基酸序列(AAA81002)表3为本发明的本发明的假单胞杆菌W几IPASEl与5"e/r"/a鹏rc^cCTs的extracellularlipase的氨基酸序列的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。发明还包括假单胞杆菌W几IPASE1蛋白或多肽的类似物。这些类似物与天然抗假单胞杆菌脂肪酶相关多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的—残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如e、y-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的f肽。在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的假单胞杆菌W几IPASE1多肽时,可以将假单胞杆菌W几IPASE1编码序列可操作地连于表达调控序列,从而形成假单胞杆菌W儿1PASE1蛋白表达载体。如本发明所用,可操作地连于"指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,"可操作地连于"意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。在本发明中,术语"宿主细胞"为原核或真核细胞。常用的原核或真核宿主细胞包括大肠杆菌、酵母细胞、烟草细胞和其它植物细胞。还可用Northern印迹法技术分析沐几IPASE1基因产物的表达,即分析WJLIPASE1蛋白的RNA转录物在细胞中的存在与否和数量。此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有W几IPASE1蛋白核苷酸编码序列的8-10个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码W几IPASE1蛋白相关的核酸分子。本发明还提供了检测样品中是否存在W几IPASE1蛋白相关核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于WJLIPASE1蛋白相关核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。此外,根据本发明的W几IPASE1蛋白核舎酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选WJLiPASEl蛋白相关同源基因或同源蛋白。为了得到与W几IPASE1蛋白相关基因相关的假单胞菌cDNAs的点阵,可以用DNA探针筛选假单胞菌cDNA文库,这些探针是在低严紧条件下,用32P对假单胞菌脂肪酶相关的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自假单胞菌的文库。构建来自感兴趣的细胞或者组织的ci)NA文库的方法是分子生物学领域众所周知的。另外,许多这样的cl)NA文库也可以购买到,例如购自Clontech,Stratagene,PaloAlto,Cal.。这种筛选方法可以识别与假单胞菌脂肪酶相关相关的基因家族的核苷酸序列。本发明的W几IPASE1蛋白相关核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员己知的常规方法所制备的d)NA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可通过化学合成将突变引入本发明蛋白序列中。除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-PhaseP印tideSynthesis,冊FreemanCo"SanFrancisco;MerrifieldJ.(1963)J.AmChem-Soc85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用AppliedBiosyste迈s的431A型肽合成仪(FosterCity,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。利用本发明的W几IPASE1蛋白,通过各种常规筛选方法,可筛选出与脂肪酸代谢相关发生相互作用的物质,或者受体、抑制剂或拮抗剂等。本发明具有实质性特点和显著进步,本发明在脂肪酸代谢中具有明显的作用,因此,本发明具有很大的应用价值。具体实施方式下面结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。实施例1W几IPASE1基因的克隆1.组织分离(isolation)假单胞杆菌(i^e"rfww做fls印)25T培养,准备抽取DNA或RNA。2.RNA的分离(RNAisolation)抽提总RNA,用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。3.基因的全长克隆(CloningofFull-lengthcDNA)根据Serratialiquefaciens脂肪酶基因的氨基酸保守序列,利用同源性基因克隆原理,采用MCE方法(GibcoBRL试剂盒)进行cDNA全长克隆,分三个阶段进行-(1)RT-PCRPCR[BP001(SEQIDNO.1)+WJ002(SEQIDNO.2)]得到2002WJ(i845bp),回收,连接到pGEMT-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer:USA)上进行测序。测序结果用GCG软件包(Wisconsingro叩,USA)中的BLAST和FASTA软件搜索己有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知Serratialiquefaciens脂肪酶基因的同源性很高,故初步认为它是一个脂肪酶基因。(2)3,-RACEPCR[AP+WJ003(5,—GCTGGTGTTTATCGGTACCGAAGGC-3,)]得到2002WJ3,(332bp),回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(BiG-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(WisconsinGroup,USA)中的BLAST和FASTA软件搜索己有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知5ferra"ah'g^/a"e/^脂肪酶基因的同源性很高,故初步认为它是一个与脂肪代谢相关基因。(3).5,-RACE第一轮PCR[AAP+WJ004(5-AGAGCTTTTGACTGAAGATTCAGG—3)]第二轮PCR[(AUAP+WJR005(5-CGGAGMGCTGTAGAGCTT-3,))得到2001WJ5,(约500bp)(过程同(l))^将测序结果的重叠区拼接,发现过程(1)得到的片段既是该基因的完整编码区。BLAST的结果证明从假单胞杆菌(Pseudomonassp)中新得到的基因确为一个与脂肪代谢相关的基因。通过组合使用上述3种方法,获得了候选的假单胞杆菌(Pseudomonassp)W几IPASE1蛋白的全长编码序列(SEQIDNO.4)。实施例2假单胞杆菌(/^iKfomo/ias印)W几IPASE1基因的序列信息与同源性分析本发明新的假单胞杆菌(fte"&附朋fls印)W几IPASE1全长cDNA的长度为2135bp,详细序列见SEQIDNO.3,其中开放读框位于133-1980位核苷酸(1845个核苷酸)。根据全长cDNA推导出假单胞杆菌(fte"rfoWo/mss/;)W几IPASE1的氨基酸序列,共615个氨基酸残基,详细序列见SEQIDNO.3。将假单胞杆菌(Pseudoraonassp)W几IPASE1的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundantGenBank+EMBL+DDBJ+PDB和Non-redundantGenBankCDStranslations+PDB+SwissProt+S叩erdate+PIR数据库中进行核苷酸和蛋白质同源性检索,氨基酸序列中含有esterase/1ipase/thioesterase蛋白结构域(PS50187)、IMPdehydroGenase/GMPreductase蛋白结构域(PF00478.12)、Hemolysin-typecalcium—bindinGreGion结构域(P腦313,PR00353.8)、lipase(class3)结构域(PF0176412)、Serralysin-likemetalloprotease的C-端结构域(SSF51120)。由此推断,编码蛋白属于GXSXG家族脂肪酶,具有包括脂肪酶活性在内的多种催化活性。本发明涉及的序列及记号分列如下-(1)SEQIDNO.1的信息(i)序列特征(A)长度30bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQIDNO.1ATGGGMTCTTTMTTATCAAGGTCTCGAT(2)SEQIDNO.2的信息(i)序列特征-(A)长度29bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQIDNO.2TCAGGCCAGTACCACTTGGCCGTCCGACASEQIDNO.3的信息1cagggccttccagtcacgacgttgtaaaacgacggccagtgaattgtaatacgactcact613tagggcg33ttgggcccgac沐gcatgctcccggccgccatggcggccgcggg33ttc121gattggatccac133atgggtgattttttattatcagggcctgatgaagcgaaatccaaa178acgttatttaccgacgccatggcgatttccacctacgcctatcac223aatattgataatggttttgacgagggctatcacagctccggtttt268ggcctgggcttgcccttcacgctggtgaccgcgctgataggcagc313acgcaatctcagggtggcctacccggtattccctggaatcccgac358tcggaacaagcggcgctggcagcggttaataacgccggctggtca403ttgataagcgcagaccaactaggctatcagggcaaaacggatgcc448cgcggcacctattacggtgaaacgttcggctacaccacggcacag493gctgaagtgctgggaaaatacgacagcgagggtaatctcaccggc538atcggcattgcttttcgcggcaccagcggcccgcgcgaatctctg583atcaccgataccatcggcgatttggtcaatgacctgctggccggt628ttcggcccgaatggctatgccgataactacagtctga血agccttc673ggcaccctgctggaggatgtggccaaattcgcccaggcgcacggg718ctgagcggggatgacattaccatcagtggccatagcctcggcggc763ctggccgtgaacagtatggcggcgctcagcgacggcaattggggg808ggcttctatgcgcagtccaactatgtcgcctttgcttctcctacc853caatacgaaaccggcggcaaagtgattaacgtcggttacg咖at898gacccggtattccgcgcgttggacggtaccaacgcgcacctctgc943aacgctgggcgtcatgacgcaccgcaagactccgccaccaacaac988atcgttaatttcaacgaccactatgcctccgccgcctggaatatt1033ctgcccttctcgatcctcaatattccaacctggttatctcacctg1078ccgttcctttatcaggacgggttgatgcgggtattgaattcagag123ttctactcgctgaccagcaaagactcgacggtgatcgtttccaaci168ctttctgacgtcacccgcggc幼tocctgggtgg3ag3cctC33C1213cgcaacgccgagcaacacagcggcccaacctttattgtcggcagc1258gacggcaatgaccttatoaagggcggcactggaaatgattatctc1303gagggccgtgccggcaatgacacattccgtgacgatggcggtttt1348aatattatttccggcggtgaaggccataacaccctggatttgcag1393catgcattgaaaaacaccgaggtcgcgtacgacggcaatacgctc1438tatttgcgcgatgctgacggtggcatcaccctggctaactcgatc1483ggcacgctgaaaagcaaagagtcgtcactgttgattttcaccaaa1528gaggttgatcaccaggtgaccgacaacggcttgctttccaccaag1573gggctgaccgcctatgccagttcggcaaacggcaccgcggccgat1618gacgttctgactgct咖gagtccggctcctggctcttcggtttg1663gagggaaatgaccagctgtttggcggcaaaggcaatgacgtgttc1708gtcggcggcgcgggtaacgacgttatgcacagccagggtggcagc1753aataccttcctgttcagtggcgacttcggtcaggatctgatttac1798ggttatcaggcgcaggataagctggtgtttatcggtaccgaaggc1843agcagctcgggcggtaattatcgcgattttgtttccgaggtgaac1888gacaacctggtgtttaactttggcggcagtacggtcactttagtci933gggacggattcgatagcctgtcggatggccaggtggtgctggcg1978taa1981tcgacaatcactagtgaattcgcggccgcctgcaggtcgaccatatgggagagctcccaa2041cgcgttggatgcatagcttgagtattctatagtgtcacctaaatagcttggcgtaatcat2101ggtcatagctgtttcctgtgtgaaattgtattcgSEQIDNO.4的信息MGDFLLSGPDEAKSKTLFTDAMAISTYAYHNIDNGFDEGYHSSGFGLGLPFTLVTALIGSTQSQGGLPGIPWNPDSEQAALAAVNNAGWSLISADQLGYQGKTDARGTYYGETFGYTTAQAEVLGKYDSEGNLTGIGIAFRGTSGPRESLITDTIGDLVNDLLAGFGPNGYADNYSLKAFGTLLEDVAKFAQAHGLSGDDITISGHSLGGLAVNSMMLSDGNWGGFYAQSNYVAFASPTQYETGGKVINVGYENDPVFRALDGTNAHLCNAGRHDAPQDSATNNIVNFNDHYASMWNILPFSILNlPrWLSHLPFLYQDGLMRVLNSEFYSLTSKDSTVIVSNLSDVTRGNTWVEDLNRNAEQHSGPTFIVGSDGNDLIKGGTGNDYLEGRAGNDTFRDDGGFNnSGGEGHNTLDLQHALKNTEVAYDGNTLYLRMDGGITLANSIGTLKSKESSLLIFTKEVDHQVTDNGLLSTKGLTAYASSANGTMDDVLTAKESGSWLFGLEGNDQLFGGKGNDVFVGGAGNDVMHSQGGSNTFLFSGDFGQDLIYGYQAQDKLVFIGTEGSSSGGNYRDFVSEVNDNLVFNFGGSTVTLVGIGFDSLSDGQWLA权利要求1、一种假单胞菌PseudomonasspWJLIPASE1蛋白编码序列,其特征在于,包括编码具有假单胞菌PseudomonasspWJLIPASE1蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列杂交。2、根据权利要求1所述的假单胞菌fte"Aww"osspWJLIPASEl蛋白编码序列,其特征是,所述的序列编码具有SEQIDNO.4所示的氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。3、根据权利要求1或2所述的假单胞菌/^"必ww"os印W几IPASE1蛋白编码序列,其特征是,该序列具有SEQIDNO.3中从核苷酸第133-1980位的核苷酸序列。4、根据权利要求1所述的假单胞菌fte"(fomwi05s/;W几IPASEl蛋白编码序列,其特征是,包含DNA分子中8-100个连续核苷酸。5、根据权利要求4所述的假单胞菌朽e"^to自/wss/;W几IPASE13蛋白编码序列,其特征是,DNA分子转化的宿主细胞,它是原核或真核细胞。全文摘要本发明涉及的是一种蛋白编码序列,特别是一种假单胞菌PseudomonasspWJLIPASE1蛋白编序列,属于基因工程领域。这种假单胞菌PseudomonasspWJLIPASE1蛋白编码序列,具有脂肪酶活性,在脂肪酸代谢中具有明显的催化作用。它在甲醇、乙醇和甘油存在的情况下不影响酶的活性,与目前生物(酶)法生产生物柴油所使用的酶相比较,存在巨大的价格优势。文档编号C12N15/31GK101157928SQ200610020218公开日2008年4月9日申请日期2006年1月24日优先权日2006年1月24日发明者杜世章,劲王,苏智先申请人:劲王
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1