改良的表达蛋白质的菌株的制作方法

文档序号:15234669发布日期:2018-08-21 20:18阅读:312来源:国知局
本申请要求2015年12月22日提交的美国临时专利申请第62/270762号、和2016年1月14日提交的美国临时专利申请第62/278728号的提交日的权益。本申请还要求2016年1月27日提交的欧洲专利申请第16152977.1号的提交日的权益。以上参考的申请中的每个的全部内容都并入本文以供参考。对序列表的引用本申请包含纸质和计算机可读形式的序列表。纸质和计算机可读形式的序列表是说明书的一部分或另外并入本文以供参考。发明领域本发明主要涉及一种以基本上高于亲本菌株的水平表达蛋白质的真菌菌株的开发。
背景技术
:大约30年来,期望的异源蛋白质已经在微生物中制备。尽管已经引入必要的编码序列并获得了表达,然而为了优化商业生产的过程还有很多工作要做。一个感兴趣的领域涉及菌株改良,即寻找或制造宿主微生物的菌株,例如其允许以更高的产量或更好的纯度制备蛋白质。为了增加产量,一旦已设计了良好的表达系统,可能设想增加编码序列的拷贝数,或者增加mrna的数量或稳定性,或者改善蛋白质的折叠和/或分泌,或者降低蛋白质的降解。然而,只有当以限制因子为靶标时才能看到期望的表达增加的效果。因此,需要的是允许期望的蛋白质如异源蛋白质的产量增加的宿主菌株。本发明人已经令人惊讶地鉴定了not4(也称为mot2)的突变导致这样的产量增加。not4是一种泛素连接酶,并且是ccr4-not复合物的一部分。ccr4-not复合物在真核细胞中是保守的,并且在酵母中复合物由9个核心亚基组成:ccr4、caf1、caf40、caf130、not1、not2、not3、not4和not5(collart,2003,globalcontrolofgeneexpressioninyeastbytheccr4–notcomplex.gene313:1-16;bai等,1999,theccr4andcaf1proteinsoftheccr4–notcomplexarephysicallyandfunctionallyseparatedfromnot2,not4,andnot5.mol.cell.biol.,19:6642-6651)。已提议将该复合物作为中央交换机,其可以解释来自环境的信号并协调所有基因的表达水平以经济地响应信号(collart,2012,theccr4-notcomplex.gene492(1):42-53)。据认为not4蛋白质(not1、not2、not3、not4)是装配rna聚合酶ii复合物所必需的,这表明其在转录调节中具有全局性的作用(collart,1994,not1(cdc39),not2(cdc36),not3,andnot4encodeaglobal-negativeregulatoroftranscriptionthatdifferentiallyaffectstata-elementutilization.genes&development8(5):525-537;collart,2012,如上引用)。最近,共晶体结构表明not4的c-末端区域如何环绕not1(ccr4-not复合物中的支架蛋白)的heat-重复区域(bhaskar,2015,architectureoftheubiquitylationmoduleoftheyeastccr4-notcomplex.structure23(5):921-8)。技术实现要素:本发明提供一种真菌宿主细胞,其具有:a.修饰的not4蛋白质或其同系物,或者b.修饰的not4蛋白质或其同系物的活性水平,或者c.修饰的not4基因或其同系物,或者d.修饰的not4基因或其同系物的表达水平。本发明还提供一种真菌宿主细胞的培养物,该真菌宿主细胞包含编码期望的蛋白质如异源蛋白质的多核苷酸序列,其特征在于该真菌宿主细胞具有降低的not4蛋白质或其同系物的活性水平。本发明进一步提供一种用于从真菌宿主细胞制备期望的蛋白质如异源蛋白质的方法。本发明提供一种用于改变来自真菌宿主细胞的期望的蛋白质的产量的方法。本发明还提供一种期望的蛋白质,如异源蛋白质。白蛋白或其变体、片段、和/或融合物是优选的期望的蛋白质。本发明进一步提供一种组合物,如药物组合物,其包含期望的蛋白质。本发明还提供一种治疗患者的方法,其包括向患者施用有效量的组合物。本发明进一步提供一种制备真菌宿主细胞的方法。本发明还提供not4蛋白质或其同系物,其包含与seqidno:2至少70%的同一性以及在对应于选自seqidno:2的一个或多个以下位置的位置处的突变:426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469或470。本发明进一步提供编码本发明的not4变体的多核苷酸。本文所述的任何实施方式(包括仅在实施例和/或优选的实施方式部分中描述的那些)意在能够与任何其它实施方式组合,除非明确否认或组合不合适。附图说明图1是示出20个氨基酸的分类及其之间的关系的文氏图。图2示出质粒pdb5438的构建体。图3示出质粒pdb2244的构建体,“rha”意指重组人白蛋白,“fl”是前导序列。图4示出质粒pdb2305的构建体,“mfl”是前导序列。图5示出质粒pdb3029的构建体,“inv”是前导序列。图6示出质粒pdb5912的构建体,“mfl”是前导序列。图7示出质粒pdb3936的构建体,“mfl”是前导序列。定义白蛋白:术语“白蛋白”是指与人血清白蛋白(hsa)或hsa结构域具有相同和/或非常相似的三级结构并具有与hsa或相关结构域相似的性质的蛋白质。类似的三级结构例如是来自在亲本白蛋白下提及的种类的白蛋白的结构。白蛋白的一些主要性质是:i)调节血浆容量的能力(肿胀活性oncoticactivity),ii)约19天±5天的长血浆半衰期,iii)与gp60(也称为清蛋白激活蛋白(albondin))结合,iv)与fcrn结合,v)配体结合,例如内源性分子如酸性、亲脂性化合物(包括胆红素、脂肪酸、氯化血红素和甲状腺素)的结合(也参见kragh-hansen等,2002,biol.pharm.bull.25,695的表1,在此并入本文以供参考),vi)具有酸性或电负性特征的小有机化合物的结合,例如药物如华法林、地西泮、布洛芬和紫杉醇(也参见kragh-hansen等,2002,biol.pharm.bull.25,695的表1,在此并入本文以供参考)。并非所有这些性质都需要满足,以表征蛋白质或片段为白蛋白。例如,如果片段不包含负责结合某些配体或有机化合物的结构域,则预计这种片段的变体也不具有这些性质。等位基因变体:术语“等位基因变体”是指占据相同染色体位点的基因的两种或多种替代形式中的任何一种。等位基因变体通过突变自然产生,并可能导致种群内的多态性。基因突变可以是沉默的(编码的多肽中没有变化)或者可以编码具有修饰的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。cdna:术语“cdna”是指可以通过从获自真核或原核细胞的成熟的、剪接的mrna分子逆转录而制备的dna分子。cdna缺乏可能存在于相应基因组dna中的内含子序列。最初的初级rna转录物是通过一系列包括剪接的步骤加工的mrna的前体,然后作为成熟的剪接mrna出现。编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框决定,开放阅读框以起始密码子如atg、gtg或ttg开始,并以终止密码子如taa、tag或tga结束。编码序列可以是基因组dna、cdna、合成dna、或其组合。控制序列:术语“控制序列”是指表达编码本发明多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码多肽的多核苷酸可以是本源的(native)(即来自相同的基因)或外来的(即来自不同的基因)或对于彼此是本源的或外来的。这种控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。为了引入特定的限制性位点,控制序列可以提供有接头,有助于将控制序列与编码多肽的多核苷酸的编码区连接。表达:术语“表达”包括多肽制备中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达盒:术语“表达盒”是指编码多肽的多核苷酸和提供其表达的上游和下游控制序列。表达宿主:术语“表达宿主”是指表达期望的蛋白质、特别是异源蛋白质的任何宿主细胞。表达载体:术语“表达载体”是指包含编码多肽的多核苷酸并与提供其表达的控制序列可操作连接的线性或环状dna分子。片段:术语“片段”是指从成熟多肽的氨基和/或羧基末端和/或成熟多肽的内部区域缺失一个或多个(几个)氨基酸的多肽。片段可以由衍生自多肽的一个不间断序列组成,或者可包含衍生自多肽不同部分的两个或多个序列。关于白蛋白,片段大小可多于约20个氨基酸残基,优选多于30个氨基酸残基,更优选多于40个氨基酸残基,更优选多于50个氨基酸残基,更优选多于75个氨基酸残基,更优选多于100个氨基酸残基,更优选多于200个氨基酸残基,更优选多于300个氨基酸残基,甚至更优选多于400个氨基酸残基,并且最优选多于500个氨基酸残基。在一个优选的实施方式中,片段对应于一个或多个白蛋白结构域。本发明优选的白蛋白结构域是与hsa结构域i具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%同一性的结构域,由seqidno:6的氨基酸残基1至194±1-15个氨基酸组成;与hsa结构域ii具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%同一性的结构域,由seqidno:6的氨基酸残基192至387±1-15个氨基酸组成;以及与hsa结构域iii具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或100%同一性的结构域,由seqidno:6的氨基酸残基381至585±1-15个氨基酸组成,或者一个或多个(几个)这些结构域的组合,例如,结构域i和ii,结构域ii和iii或者结构域i和iii融合在一起。对于白蛋白结构域的确切边界而言,不存在一般公认的惯例,并且这一事实通过以下反映:上述范围内的重叠以及在结构域n-末端和/或c-末端处从氨基酸(优选1至15个氨基酸,更优选1至10个氨基酸,最优选1至5个氨基酸)起可变长度的限量为正或负1、2、3、4、5、6、7、8、9、10、11、12、13、14或15,对于每个结构域而言允许长度的总变化至多30个氨基酸,优选至多20个氨基酸,更优选至多10个氨基酸;并且对于属于一个或另一个结构域的结构域之间的边界中的氨基酸残基可能存在一些不同意见。出于同样的原因,可能找到与上述数字不同的白蛋白结构域的氨基酸残基的对照,然而,技术人员将会理解如何基于文献中的教导和上述教导来鉴定白蛋白结构域。非人白蛋白的相应结构域可以通过用如emboss包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等人,2000,trendsgenet.16:276-277)中的needle程序中执行的needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)与hsa比对来鉴定,优选3.0.0或更高版本,更优选5.0.0或更高版本。使用的可选参数是空位开放罚分10,空位延伸罚分0.5和eblosum62(blosum62的emboss版本)取代矩阵。也可以使用替代的比对工具,例如本文所述的muscle。结构域也可以根据dockal或kjeldsen定义:dockal等人(thejournalofbiologicalchemistry,1999,vol.274(41):29303-29310)将hsa的结构域定义为:结构域i:氨基酸1至197,结构域ii:seqidno:6的氨基酸189至385,结构域iii:seqidno:6的氨基酸381至585。kjeldsen等(proteinexpressionandpurification,1998,vol13:163-169)将结构域定义为:结构域i:氨基酸1至192,结构域ii:氨基酸193至382,结构域iii:氨基酸383至585。每个结构域本身由两个同源亚结构域构成,即1-105、120-194、195-291、316-387、388-491和512-585,具有包含残基lys106至glu119、glu292至val1315和glu492至ala511的柔性的子结构域间链接区域。因此,在本发明中,以下的结构域定义是优选的。氨基酸数字对应于seqidno:6(hsa)的那些。然而,使用这些数字,技术人员可以鉴定其它白蛋白序列中的相应结构域。结构域i可以起始或可以不起始于氨基酸1处,并且可以终止于或可以不终止于氨基酸192、193、194、195、196或197中的任一处,优选氨基酸192、194或197中的任一处。结构域ii可以起始于或可以不起始于氨基酸189、190、191、192或193处,优选氨基酸189、192或193中的任一处,并且可以终止于或可以不终止于氨基酸382、383、384、385、386或387处,优选氨基酸382、285或387中任一处。结构域iii可以起始于或可以不起始于氨基酸381、382或383处,优选氨基酸381或383处,并且可以终止于或不终止于于氨基酸585处。非人白蛋白中的结构域可以具有与hsa相同或不同的氨基酸长度和/或残基数量。例如,可以使用hsa和一种或多种(几种)其它白蛋白、片段、衍生物、变体和/或融合物来准备多重比对或成对比对以鉴定对应于hsa结构域1、2和/或3的结构域。融合配偶体(partner):在整个说明书中,融合配偶体是可以基因融合至白蛋白或其变体和/或片段的非白蛋白部分。异源蛋白质:异源蛋白质是不由宿主细胞天然产生的蛋白质,并且优选不包括如选择标志物(例如抗生素抗性标志物,营养缺陷型选择标志物)、分子伴侣、flp、rep1或rep2的蛋白质。宿主细胞:术语“宿主细胞”是指用本发明的包含多核苷酸的核酸构建体或表达载体易于转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。成熟多肽:术语“成熟多肽”是指在翻译和任何翻译后修饰如n-末端加工、c-末端截短、糖基化、磷酸化等后的最终形式的多肽。人白蛋白的成熟序列提供于seqidno:6中,而未成熟形式的实例提供于seqidno:8中。成熟多肽编码序列:术语“成熟多肽编码序列”是指编码成熟多肽的多核苷酸。seqidno:5提供了人白蛋白的成熟多肽编码序列的实例,而seqidno:7提供了未成熟形式人白蛋白的编码序列的实例。突变体:术语“突变体”是指编码变体的多核苷酸。核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离,或者以天然不存在或者是合成的方式修饰以包含核酸片段,其包含一种或多个控制序列。可操作地连接:术语“可操作地连接”是指以下结构:其中控制序列置于相对于多核苷酸的编码序列适当的位置,使得控制序列指导编码序列的表达。亲本或亲本白蛋白:术语“亲本”或“亲本白蛋白”是指对其进行改变以产生本发明的白蛋白变体的白蛋白。亲本可以是天然存在的(野生型)多肽或其等位基因或其变体。在一优选的实施方式中,亲本白蛋白是野生型白蛋白,更优选来自智人的野生型白蛋白,如seqidno:8(uniprot:p02768.2)或其成熟序列(seqidno:6)中公开的。替代的野生型白蛋白可以选自表1中所示的非穷举列表。表1:来自不同种的野生型白蛋白*如本文所述,使用如eblosum62(emboss程序套件,版本6.1.0)的needle程序中实施的needleman-wunsch算法,使用空位开放罚分为10、空位延伸罚分为0.5计算序列同一性。亲本白蛋白优选是成熟的白蛋白。在另一个实施方式中,亲本白蛋白与seqidno:6至少70%、更优选75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或至少99.8%的同一性,并且维持白蛋白至少一个主要特性或与白蛋白(如has)相似的三级结构。白蛋白的主要特性总结于sleep,2015,“albuminanditsapplicationindrugdelivery”,expertopinionondrugdelivery12(5):793-812。序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列同一性”描述。为了本发明的目的,两个氨基酸序列之间的序列同一性使用如emboss包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等人,2000,trendsgenet.16:276-277)的needle程序中实施的needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)进行测定,优选版本5.0.0或更高版本。使用的参数是空位开放罚分10,空位延伸罚分0.5和eblosum62(blosum62的emboss版本)取代矩阵。将标记为“最长同一性”的needle输出(使用-nobrief选项获得)用作同一性百分比,计算方法如下:(相同残基x100)/(比对长度-比对中空位总数)为了本发明的目的,两个脱氧核糖核苷酸序列之间的序列同一性使用emboss包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等人,2000,同上)的needle程序中实施的needleman-wunsch算法(needleman和wunsch,1970,同上)进行测定,优选版本5.0.0或更高版本。使用的参数是空位开放罚分10,空位延伸罚分0.5和ednafull(ncbinuc4.4的emboss版本)取代矩阵。将标记为“最长同一性”的needle输出(使用-nobrief选项获得)用作同一性百分比,计算方法如下:(相同的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)变体:术语“变体”是指衍生自亲本多肽的多肽,例如包含一个或多个(几个)位置处的改变,即取代、插入和/或缺失的白蛋白。取代是指用不同的氨基酸替换占据一个位置的氨基酸;缺失是指除去占据一个位置的氨基酸;插入是指在占据一个位置的氨基酸附近添加1-3个氨基酸。修饰的多肽(变体)可以通过人类干预通过修饰编码亲本多肽(例如,白蛋白)的多核苷酸序列获得。变体白蛋白优选与seqidno:6具有至少70%、优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或至少99.8%的同一性,并且可以或可以不保持亲本白蛋白的至少一种主要特性或者相似的三级结构(如hsa)。通常,hsa的变体或片段将具有至少10%(优选至少50%、60%、70%、80%、90%或95%)的hsa配体结合活性(例如胆红素结合),并且至少50%(优选至少70%、80%、90%或95%)的hsa的肿胀活性,重量对重量。可以通过hoefs,j.c.(1992)hepatology16:396-403所述的方法测定白蛋白、白蛋白变体或白蛋白片段的肿胀活性(也称为胶体渗透压)。胆红素结合可以通过在527nm处相对于hsa的荧光增强来测量。将胆红素(1.0mg)溶于50μl1mnaoh中并用去离子水稀释至1.0ml。将胆红素原液在100mmtris-hcl(ph8.5)、1mmedta中稀释,在荧光计比色皿中得到0.6nmol胆红素/ml。通过在hsa:胆红素比率为0-5mol:mol的范围内用hsa滴定期间,通过448nm处的激发和527nm处的发射(10nm狭缝宽度)测量荧光。与亲本白蛋白相比,该变体可具有对于fcrn的改变的结合亲和力和/或改变的血浆半衰期。就变体not4蛋白而言,适用相同的原则,除了活性是not4活性而不是白蛋白活性。变体多肽序列优选是非天然存在的序列。载体:术语“载体”是指包含编码多肽的多核苷酸并且与提供其表达的控制序列可操作连接的线性或环状dna分子。载体包括质粒。载体包括表达载体。野生型:术语“野生型”(wt)白蛋白是指具有与在动物或人类中天然存在的白蛋白相同的氨基酸序列的白蛋白。seqidno:6是来自智人(homosapiens)的野生型白蛋白的实例。genbank登录号aaa98797.1(minghetti等人,“molecularstructureofthehumanalbumingeneisrevealedbynucleotidesequencewithinq11-22ofchromosome4”,j.biol.chem.261(15),6747-6757(1986))给出“野生型”(wt)人白蛋白(hsa)序列。表1(上文)提供了野生型白蛋白的实例。用于氨基酸位置命名的惯例为了本发明的目的,使用seqidno:2中公开的多肽来确定not4蛋白质的同系物中对应的氨基酸残基。将not4蛋白质的同系物的氨基酸序列与seqidno:2中公开的多肽进行比对,并且基于比对,使用如emboss包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等人,2000,trendsgenet.16:276-277)的needle程序中实施的needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)、优选版本5.0.0或更高版本,测定对应于seqidno:2中公开的多肽中的任何氨基酸残基的氨基酸位置编号。使用的参数是空位开放罚分10,空位延伸罚分0.5和eblosum62(blosum62的emboss版本)取代矩阵。not4蛋白同系物中对应氨基酸残基的鉴定可以通过使用几个计算机程序比对多个多肽序列来测定,所述计算机程序包括但不限于muscle(基于对数期望的多序列比较(multiplesequencecomparisonbylog-expectation);版本3.5或更高版本;edgar,2004,nucleicacidsresearch32:1792-1797),mafft(版本6.857或更高版本;katoh和kuma,2002,nucleicacidsresearch30:3059-3066;katoh等,2005,nucleicacidsresearch33:511-518;katoh和toh,2007,bioinformatics23:372-374;katoh等,2009,methodsinmolecularbiology537:39-64;katoh和toh,2010,bioinformatics26:1899-1900),和采用clustalw的embossemma(1.83或更高版本;thompson等,1994,nucleicacidsresearch22:4673-4680),使用它们各自的默认参数。在描述本发明的多肽时,采用下述命名法以便于参考。采用公认的iupac单字母或三字母氨基酸缩写。取代.对于氨基酸取代,使用以下命名法:原始氨基酸,位置,取代的氨基酸。因此,用丙氨酸取代位置226处的苏氨酸命名为“thr226ala”或“t226a”。多个突变用加号(“+”)分开,例如“gly205arg+ser411phe”或“g205r+s411f”表示在位置205和411处的甘氨酸(g)和丝氨酸(s)分别被精氨酸(r)和苯丙氨酸(f)取代。缺失.对于氨基酸缺失,使用以下命名法:原始氨基酸,位置,*。因此,位置195处甘氨酸的缺失命名为“gly195*”或“g195*”。多个缺失用加号(“+”)分开,例如“gly195*+ser411*”或“g195*+s411*”。插入.如上所公开的,插入可以是占据一个位置(‘命名(或原始)氨基酸’,‘x’)氨基酸的n-侧(‘上游’,‘x-1’)或c-侧(‘下游’,‘x+1’)。对于原始氨基酸(‘x’)的c-侧(‘下游’,‘x+1’)的氨基酸插入,使用以下命名法:原始氨基酸,位置,原始氨基酸,插入的氨基酸。因此,位置195处的甘氨酸后插入赖氨酸命名为“gly195glylys”或“g195gk”。插入多个氨基酸命名为[原始氨基酸,位置,原始氨基酸,插入的氨基酸#1,插入的氨基酸#2;等等]。例如,位置195处的甘氨酸后插入赖氨酸和丙氨酸表示为“gly195glylysala”或“g195gka”。在这种情况下,通过向插入的氨基酸残基前面的氨基酸残基的位置号添加小写字母来对插入的氨基酸残基进行编号。因此,在上面的实例中,序列将是:亲本:变体:195195195a195bgg-k-a对于原始氨基酸(x)的n-侧(‘上游’,‘x-1’)的氨基酸插入,使用以下命名法:原始氨基酸,位置,插入的氨基酸,原始氨基酸。因此,在位置195处的甘氨酸(g)之前插入赖氨酸(k)命名为“gly195lysgly”或“g195kg”。插入多个氨基酸命名为[原始氨基酸,位置,插入的氨基酸#1,插入的氨基酸#2;等等,原始氨基酸]。例如,在位置195处甘氨酸之前插入赖氨酸(k)和丙氨酸(a)表示为“gly195lysalagly”或“g195kag”。在这种情况下,插入的氨基酸残基通过向插入的氨基酸残基之后的氨基酸残基的位置编号处添加具有单引号的小写字母来编号。因此,在上面的实例中,序列将是:亲本:变体:195195a’195b’195gk-a-g多个改变.包含多个改变的多肽通过加号(“+”)分开,例如“arg170tyr+gly195glu”或“r170y+g195e”分别表示170和195位的精氨酸和甘氨酸用酪氨酸和谷氨酸取代。不同的改变.当在一个位置可以引入不同的改变时,不同的改变用逗号分开,例如“arg170tyr,glu”代表170位的精氨酸用酪氨酸或谷氨酸取代。因此,“tyr167gly,ala+arg170gly,ala”表示以下变体:“tyr167gly+arg170gly”,“tyr167gly+arg170ala”,“tyr167ala+arg170gly”和“tyr167ala+arg170ala”。具体实施方式本发明的第一方面提供了一种真菌宿主细胞,其具有:a.修饰的not4蛋白质或其同系物,或者b.修饰的not4蛋白质或其同系物的活性水平,或者c.修饰的not4基因或其同系物,或者d.修饰的not4基因或其同系物的表达水平。not4也称为mot2。修饰的not4蛋白质可以相对于参照not4蛋白质如野生型not4蛋白例如seqidno:2进行修饰。优选地,修饰的not4蛋白质或其同系物与seqidno:2具有至少70%的同一性,更优选与seqidno:2具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或至少99.9%的同一性。更优选地,修饰的not4蛋白质包含seqidno:4或由其组成。优选修饰的not4蛋白质或其同系物水平是not4蛋白质或其同系物的表达水平降低或not4蛋白质或其同系物的活性水平降低。优选地,降低的水平相对于参照真菌宿主细胞(如not4蛋白质包含seqidno:2或由seqidno:2组成的真菌宿主细胞)的水平。参照真菌宿主的not4蛋白质可以是野生型not4序列,如seqidno:2。合适的参照真菌宿主细胞是酿酒酵母(s.cerevisiae)s288c或酿酒酵母dxy1。s288c具有基因型matαsuc2gal2mal2melflo1flo8-1hap1hobio1bio6。dxy1具有基因型leu2-3,leu2-122,can1,pra1,ubc4,ura3:yap3(kerry-williams等(1998)yeast14:161-169)。其它合适的参照真菌宿主细胞包括除了not4基因或not4蛋白质或其同系物之外与宿主细胞相同的细胞。例如,参照的not4基因可以是野生型(例如seqidno:1),或者参照的not4基因可以编码野生型not4蛋白质(例如seqidno:2)或者参照编码的not4蛋白质可以是野生型的(例如seqidno:2)。优选地,本发明的宿主细胞除not4基因或not4蛋白质或其同系物之外与亲本菌株相同。参照的真菌宿主也可以称为“对应的”真菌宿主。参照的真菌宿主可能是亲本真菌宿主。not4蛋白质水平或者not4蛋白质活性水平的降低可通过以下方式实现,例如:通过使not4基因突变或缺失从而得到突变的not4蛋白质或其同系物或者使not4蛋白质或其同系物完全不存在;通过使not4基因的控制序列如启动子序列和/或终止子序列突变或改变,而除去或改变基因的开放阅读框;例如通过引入合适的干扰rna如反义mrna,通过引入、控制或修饰合适的转录激活因子基因或者通过引入阻断not4蛋白质或其同系物的活性水平的试剂,而阻断或减少not4基因的转录。测量蛋白质水平和蛋白质活性的方法是本领域公知的。not4蛋白质或其同系物的修饰的活性水平可以降低,因此得到亲本或参照真菌宿主细胞(例如野生型真菌宿主细胞)的not4蛋白质或其同系物的活性水平的0%、10%、20%、30%、40%、50%、60%、70%、80或90至10%、20%、30%、40%、50%、60%、70%、80%、90%或95%。not4蛋白质或其同系物在真菌宿主细胞中降低的活性水平可以相对于上述参照真菌宿主细胞如亲本真菌宿主细胞或野生型真菌宿主细胞的not4蛋白质或其同系物的活性水平。因此,not4蛋白质或其同系物在宿主细胞中的活性水平为参照真菌宿主细胞中not4蛋白质或其同系物的活性水平的至多95%,例如为参照真菌宿主细胞中的not4蛋白质或其同系物的活性水平的至多90%、80%、70%、60%、50%、40%、30%、20%、或至多10%。not4蛋白质或其同系物的活性水平可降至零或基本上为零。not4蛋白质或其同系物的修饰的表达水平(量)可以降低,因此得到参照真菌宿主细胞(例如野生型真菌宿主细胞)的not4蛋白或其同系物的表达水平的0%、10%、20%、30%、40%、50%、60%、70%、80或90至10%、20%、30%、40%、50%、60%、70%、80%、90%或95%。not4蛋白质或其同系物在真菌宿主细胞中表达水平的降低可以相对于上述参照真菌宿主细胞如亲本真菌宿主细胞或野生型真菌宿主细胞的not4蛋白质或其同系物的表达水平。因此,not4蛋白质或其同系物在宿主细胞中的表达水平至多为参照真菌宿主细胞中not4蛋白质或其同系物的表达水平的95%,例如至多为参照真菌宿主细胞中的表达水平的90%、80%、70%、60%、50%、40%、30%、20%、或至多10%。not4蛋白质或其同系物的表达水平可降至零或基本上为零。真菌宿主细胞可能缺乏功能性not4基因或其同系物或not4蛋白质或其同系物。例如,真菌宿主细胞可含有修饰的not4基因,其可导致not4蛋白质或其同系物的表达水平降低,或not4蛋白质或其同系物的活性水平降低。例如,由于缺失,真菌宿主细胞可能缺乏not4基因或其同系物,和/或可能缺乏not4蛋白质或其同系物。可以对修饰的not4蛋白质或其同系物进行突变,从而其与not1蛋白质或其同系物的相互作用改变。例如,not4蛋白或其同系物的n-末端区域可以突变,如含有对应于seqidno:2的位置426至439处的氨基酸的α-螺旋。因此,本发明还提供一种具有not4蛋白质或其同系物的真菌宿主细胞,与野生型not4蛋白质(例如seqidno:2)和野生型not1蛋白质(例如seqidno:9)之间的相互作用相比,所述not4蛋白质或其同系物与野生型not1蛋白质之间的相互作用(例如疏水相互作用)较弱。真菌宿主细胞可具有修饰的not4蛋白质或其同系物,所述修饰的not4蛋白质或其同系物在对应于选自seqidno:2的以下位置的位置处包含突变:426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469或470,优选选自以下位置:对应于seqidno:2的位置426、427、428、429、430、431、432、433、434、435、436、437、438或439,优选429、430、434或437,最优选位置429;对应于seqidno:2的位置460、461、462、463、464、465、466、467、468、469或470,优选463、464或466;或者对应于seqidno:2的位置438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455或456,优选442、445、447或452。该突变可以是一个或多个(例如几个)位置处的取代、插入和/或缺失。优选取代。真菌宿主细胞可包含编码修饰的not4蛋白质或其同系物的多核苷酸序列,例如seqidno:3。由于遗传密码的简并性,其它多核苷酸序列也可以编码合适的修饰的not4蛋白质或其同系物。真菌宿主细胞可包含修饰的not4蛋白质或其同系物,其中相对于seqidno:2,突变是取代为选自a、c、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v、w和y的氨基酸,优选为非保守氨基酸。氨基酸分为各种众所周知的类别。因此,一些氨基酸比其它氨基酸更密切相关。如本文所用,“保守氨基酸取代”是指在同一组内进行的取代,并且其通常基本上不影响蛋白质功能。“保守取代”倾向于在如图1所示的那些组内,其是一个文氏图,它提供了一个系统,通过这个系统可以看到保守水平。一般而言,低保守性的取代是起始氨基酸与所得取代之间存在许多边界(线)的那些取代。“保守氨基酸取代”包括在同一组内进行的取代,如在以下组内:芳香族氨基酸:f,h,w,y;脂肪族氨基酸:i,l,v;疏水性氨基酸:a,c,f,h,i,k,l,m,t,v,w,y;带电荷氨基酸:d,e,h,k,r,例如:带正电氨基酸:h,k,r;或者带负电氨基酸:d,e;极性氨基酸:c,d,e,h,k,n,q,r,s,t,w,y;小氨基酸:a,c,d,g,n,p,s,t,v,例如:微小氨基酸:a,c,g,s。或者,“保守取代”可以在以下组内:具有脂肪族侧链的氨基酸:g,a,v,l,i;具有芳香族侧链的氨基酸:f,y,w;具有含硫侧链的氨基酸:c,m;具有脂肪族羟基侧链的氨基酸:s,t;具有碱性侧链的氨基酸:k,r,h;氨基酸及其酰胺衍生物:d,e,n,q。取代基可通过本领域已知的技术得到,如通过美国专利第4,302,386号公开的定点诱变(并入本文以供参考)。非保守氨基取代可指从一组到另一组的取代,例如从具有芳香族侧链的组到具有脂肪族侧链的组的取代。在对应于seqidno:2的位置429的位置处的突变可以是从天然氨基酸如f取代为非天然氨基酸如a、c、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v、w或y,优选为g、a、v、l或i、更优选为v、l或i,最优选为i。可以取代为非保守氨基酸。可以取代为脂肪族氨基酸。特别优选的取代是从f到i。在对应于seqidno:2的位置430的位置处的突变可以是从天然氨基酸例如l取代为任何非天然氨基酸例如a、c、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v、w或y。可以取代为非保守氨基酸。对应于位置434的位置处的突变可以是从天然氨基酸例如l取代为任何非天然氨基酸例如a、c、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v、w或y。可以取代为非保守氨基酸。在对应于seqidno:2的位置437的位置处的突变可以是从天然氨基酸例如l取代为任何非天然氨基酸例如a、c、d、e、f、g、h、i、k、l、m、n、p、q、r、s、t、v、w或y。可以取代为非保守氨基酸。优选的修饰的not4蛋白质在对应于seqidno:2的f429的位置处包括突变。优选的修饰的not4蛋白质包含seqidno:4或由其组成,即包含突变f429l。或者,可以增加修饰的水平。not4蛋白质或其同系物的水平增加或活性增加可能会降低期望的蛋白质(如异源性蛋白质)的产量。例如,当期望的蛋白质不利于宿主细胞的生存力时,这种降低的产量可能是期望的。增加的水平可以是参照宿主如亲本宿主中的水平的至少105%、110%、120%、130%、140%、150%、175%或200%。真菌宿主细胞可以是重组真菌宿主细胞。真菌宿主细胞可以是酵母或丝状真菌。如本文所用的“真菌”包括子囊菌门(phylaascomycota),担子菌门(basidiomycota),壶菌门(chytridiomycota)和接合菌门(zygomycota)(如hawksworth等,in,ainsworthandbisby'sdictionaryofthefungi,8thedition,1995,cabinternational,universitypress,cambridge,uk所定义)以及卵菌门(oomycota)(如hawksworth等,1995,同上,第171页中所述)和所有的有丝分裂真菌(hawksworth等,1995,同上)。在优选的方面,真菌宿主细胞是酵母细胞。如本文所用,“酵母”包括产子囊酵母(内孢霉目(endomycetale)),产担子酵母(basidiosporogenousyeast)和属于半知菌类(芽生菌纲blastomycetes)的酵母。由于酵母的分类可能在未来发生变化,因此为了本发明的目的,酵母应如biologyandactivitiesofyeast(skinner,f.a.,passmore,s.m.,anddavenport,r.r.,eds,soc.app.bacteriol.symposiumseriesno:9,1980)所定义。在更优选的方面,酵母宿主细胞是念珠菌(candida),汉逊酵母(hansenula),克鲁维酵母(kluyveromyces),毕赤酵母(pichia),酵母属(saccharomyces),裂殖酵母(schizosaccharomyces)或亚罗酵母(yarrowia)细胞。在更优选的方面,酵母宿主细胞是卡尔伯氏酵母(saccharomycescarlsbergensis),酿酒酵母(saccharomycescerevisiae),糖化酵母(saccharomycesdiastaticus),道格拉氏酵母(saccharomycesdouglasii),克鲁维酵母(saccharomyceskluyveri),诺地酵母(saccharomycesnorbensis),卵形酵母(saccharomycesoviformis),乳酸克鲁维酵母(kluyveromyceslactis)或解脂亚罗酵母(yarrowialipolytica)细胞。酿酒酵母宿主是特别优选的。酿酒酵母宿主可包含或不包含以下基因型特征中的一种或多种:leu2-3,leu2-122,can1,pra1,ubc4,ura3,yap3::ura3,lys2,hsp150::lys2,pmt1::ura3(如在wo2014/138371中所定义,并入本文以供参考),例如酿酒酵母bxp10。酿酒酵母优选包含mata。酿酒酵母宿主可包含或不包含以下基因型中的一种或多种:mata,leu2-3,leu2-112,ubc4,ura3,yap3::ura3,lys2,hsp150::lys2;与在pdi1基因座处整合的pdi1、ura3和yiplac211(finnis等2010,microbialcellfactories9:87),例如酿酒酵母dp9。酿酒酵母宿主可包含或不包含以下基因型中的一种或多种:matα,leu2,pep4-3,例如finnis等,1993,eur.j.biochem,212:201-210所述的酿酒酵母mt302/28b。酿酒酵母宿主可包含或不包含以下基因型:matα,suc2,gal2,mal2,mel,flo1,flo8-1,hap1,ho,bio1,bio6(mortimer和johnston(1986)genetics113:35-43),例如酿酒酵母s288c。优选的酿酒酵母宿主菌株包含mata,leu2-3,leu2-122,can1,pra1,ubc4,ura3,yap3::ura3,lys2,hsp150::lys2和pmt1::ura3,或者由其全部组成。另一优选的酿酒酵母宿主包含:matα,leu2-3,leu2-112,ubc4,ura3,yap3::ura3,lys2,hsp150::lys2,与在pdi1基因座处整合的pdi1,ura3和yiplac211,或者由其全部组成。另一优选的酿酒酵母宿主包含:matα,suc2,gal2,mal2,mel,flo1,flo8-1,hap1,ho,bio1,bio6,或者由其全部组成。另一优选的酿酒酵母宿主包含matα,leu2,pep4-3,或者由其全部组成。宿主可以是多倍体,二倍体或单倍体。优选单倍体或二倍体酵母宿主,优选单倍体。宿主交配型可以是例如mata或matα(mat-α)。优选酿酒酵母宿主含有编码人白蛋白或其变体、片段和/或融合物的质粒。“丝状真菌”包括真菌门和卵菌门的亚门的所有丝状体形式(如由hawksworth等,1995,同上,所定义)。丝状真菌的特征在于由几丁质,纤维素,葡聚糖,壳聚糖,甘露聚糖和其它复合多糖组成的菌丝体壁。营养生长是通过菌丝延长并且碳分解代谢是专性好氧的。相比之下,酵母例如酿酒酵母的营养生长是通过单细胞菌体的出芽生殖并且碳分解代谢可以是发酵性的。优选的丝状真菌宿主细胞可以包括枝顶孢属(acremonium),曲霉(aspergillus),短梗霉(aureobasidium),烟管霉属(bjerkandera),拟蜡菌属(ceriporiopsis),金孢子菌(chrysosporium),鬼伞属(coprinus),采绒革盖菌(coriolus),隐球菌(cryptococcus),线黑粉酵母属(filibasidium),镰孢属(fusarium),腐质霉属(humicola),稻瘟病菌(magnaporthe),毛霉菌(mucor),毁丝霉属(myceliophthora),新丽鞭毛属(neocallimastix),脉孢菌(neurospora),拟青霉(paecilomyces),青霉(penicillium),毛平革菌(phanerochaete),射脉菌(phlebia),瘤胃壶菌属(piromyces),侧耳属(pleurotus),裂褶菌(schizophyllum),踝节菌属(talaromyces),热子囊菌属(thermoascus),梭孢壳属(thielavia),弯颈霉属(tolypocladium),栓菌属(trametes)或木霉属(trichoderma)。真菌宿主细胞可包含编码期望蛋白质的核苷酸序列。优选地,期望的蛋白质是异源蛋白质。异源蛋白质不是由宿主细胞天然产生的蛋白质,并且优选不包括蛋白质例如选择性标志物,例如抗生素抗性标志物或营养缺陷型标志物,分子伴侣,flp或frt。真菌宿主细胞可以是表达宿主。真菌宿主细胞可包含表达盒,例如编码期望的蛋白质如异源蛋白质。表达盒可以在例如载体如质粒内。真菌宿主细胞可包含表达载体。期望的蛋白质可以是或不是植物或动物蛋白质或其变体。期望的蛋白质可包含或不包含白蛋白序列,单克隆抗体,依托泊苷,血清蛋白(如凝血因子),安替斯塔辛(antistasin),壁虱抗凝肽,转铁蛋白,乳铁蛋白,内皮抑素(endostatin),血管抑制素(angiostatin),胶原,免疫球蛋白或基于免疫球蛋白的分子或片段之一(例如,smallmodularimmunopharmaceuticaltm(“smip”)或dab、fab’片段、f(ab’)2、scab、scfv或scfv片段),kunitz结构域蛋白(如在wo03/066824中所述的那些,具有或不具有白蛋白融合物),干扰素,白细胞介素,il-10,il-11,il-2,干扰素α(αlpha)种和亚种,干扰素β(beta)种和亚种,干扰素γ(gamma)种和亚种,瘦素,cntf,cntfax15,il-1-受体拮抗剂,红细胞生成素(epo)和epo模拟物,血小板生成素(tpo)和tpo模拟物,prosaptide,蓝藻抗病毒蛋白-n,五螺旋蛋白(5-helix),t20肽,t1249肽,hivgp41,hivgp120,尿激酶,尿激酶原,tpa,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽(exendin-4)、glp-1或glp-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β(beta),肿瘤坏死因子,g-csf,gm-csf,m-csf,fgf,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白原、凝血酶、凝血酶前体(pre-thrombin)、凝血酶原(pro-thrombin)、血管假性血友病因子(vonwillebrand’sfactor)、α1-抗胰蛋白酶、纤溶酶原激活剂、因子vii、因子viii、因子ix、因子x和因子xiii),神经生长因子,laci,血小板衍生内皮细胞生长因子(pd-ecgf),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白,间-α胰蛋白酶抑制剂,抗凝血酶iii,载脂蛋白种,蛋白c(proteinc),蛋白s(proteins),代谢物,抗生素,或上述任一项的变体或片段。优选地,该变体与上述一种或多种蛋白质具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。优选的期望的蛋白质可以是或不是血清蛋白,如白蛋白或其变体,片段和/或融合物。优选地,白蛋白与seqidno:6具有60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、98.2%、98.4%、98.6%、98.8%、99%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、或99.9%至70%、75%、80%、85%、90%、95%、96%、97%、98%、98.2%、98.4%、98.6%、98.8%、99%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、或100%的序列同一性。最优选地,白蛋白包含seqidno:6或由seqidno:6组成。白蛋白变体、其片段和/或融合物在对应于seqidno:6的位置k573的位置处可包含或可不包含a、c、d、e、f、g、h、i、l、m、n、p、q、r、s、t、v、w或y,更优选在对应于seqidno:6的位置k573的位置处可包含或可不包含p,h,w或y。特别优选的白蛋白变体与seqidno:6具有至少95%的同一性(更优选至少96%、97%、98%或99%的同一性)并且在对应于seqidno:6的573位置处包含p。其它优选的白蛋白变体,其片段和/或融合物包括那些在wo2011/051489、wo2011/124718、wo2012/059486、wo2012/150319、wo2014/072481、wo2013/135896、wo2015/036579、wo2010/092135、wo2013/075066、wo2014/179657、wo2009/126920、wo2010/059315、wo2011/103076、wo2012/112188和wo2015/063611中公开的,或者其融合物的片段(每一个并入本文以供参考)。白蛋白可以是或可以不是白蛋白或其变体的片段。白蛋白变体、其片段和/或融合物可以与fcrn具有结合亲和力,该亲和力比亲本白蛋白、其片段和/或融合物的更强或更弱(优选更强)。白蛋白变体、其片段和/或融合物与fcrn(例如,shfcrn)的kd可以比hsa或其缀合物与之对应的kd低。优选地,白蛋白变体、其片段和/或融合物的kd小于hsa与fcrn的0.9xkd,优选小于hsa对fcrn的0.5xkd,更优选小于hsa对fcrn的0.1xkd,甚至更优选小于hsa与fcrn的0.05xkd,甚至更优选小于hsa与fcrn的0.02xkd,甚至更优选小于hsa与fcrn的0.01xkd倍,最优选小于hsa与fcrn的0.001xkd(其中x表示‘倍’)。较低的kd对应于较强的结合亲和力。白蛋白变体、其片段和/或融合物与fcrn的kd可以高于hsa或其缀合物与fcrn的相应kd。优选地,白蛋白变体、其片段和/或融合物的kd大于hsa与fcrn的2xkd,更优选大于hsa与fcrn的5xkd,更优选大于hsa与fcrn的10xkd,甚至更优选大于hsa与fcrn的25xkd,最优选大于hsa与fcrn的50xkd。白蛋白变体、其片段和/或融合物可以是对于fcrn无效的结合剂。较高的kd对应于较弱的结合亲和力。当确定和/或比较kd时,可以使用一种或多种(例如几种)(且优选全部)以下参数:仪器:biacore3000仪器(gehealthcare)流动池(flowcell):cm5传感器芯片fcrn:人fcrn,优选可溶性人fcrn,其任选地偶联至标签(tag)如谷胱甘肽s转移酶(gst)或组氨酸(his),最优选his、如在β2-微球蛋白的c-末端处的6个组氨酸残基。fcrn定量:1200-2500ru偶联化学:胺偶联化学(例如通过仪器的制造商提供的科学实验报告中所述)。偶联方法:偶联可以通过在10mm乙酸钠ph5.0(gehealthcare)中注射20μg/ml蛋白质来进行。可使用ph5.5的磷酸盐缓冲液(67mm磷酸盐缓冲液,0.15mnacl,0.005%吐温20)作为运行缓冲液和稀释缓冲液。表面的再生可以使用ph7.4的hbs-ep缓冲液(0.01mhepes,0.15mnacl,3mmedta,0.005%表面活性剂p20)(biacoreab)进行。测试分子(例如hsa或变体)注射的定量20-0.032μm。注射流速:恒定,例如30μl/ml。注射温度:25℃。数据评估软件:biaevaluation4.1软件(biacoreab)。白蛋白变体、其片段和/或融合物可以具有比亲本白蛋白、其片段和/或融合物更长或更短,优选更长的血浆半衰期。血浆半衰期理想地在合适的个体体内确定。然而,由于耗时且昂贵且不可避免地存在与在动物或人体中进行实验相关的伦理问题,因此期望使用体外测定法来确定血浆半衰期是否延长或减少。已知白蛋白与其受体(fcrn)的结合对于血浆半衰期是重要的,并且受体结合与血浆半衰期之间的相关性是白蛋白与其受体亲和力越高导致越长的血浆半衰期。因此,对于本发明,白蛋白与fcrn更高的亲和力被认为是血浆半衰期增加的指示,白蛋白与其受体更低的亲和力被认为是血浆半衰期减少的指示。白蛋白与其受体fcrn的结合可使用术语亲和力和表述“更强”或“更弱”来描述。因此,应当理解的是,与hsa相比与fcrn具有更高亲和力的分子被认为比hsa更强地与fcrn结合,与hsa相比与fcrn具有更低亲和力的分子被认为比hsa更弱地与fcrn结合。术语“结合系数”可以用来代替术语“结合亲和力”。术语“更长的血浆半衰期”或“更短的血浆半衰期”以及类似的表述应理解为与相应的亲本或参照或相应的白蛋白分子有关。因此,就本发明的变体白蛋白而言,较长的血浆半衰期意指与除了本文所述的变化之外具有相同序列的相应白蛋白相比,该变体具有更长的血浆半衰期。白蛋白或变体和/或其片段可以或可以不与融合配偶体基因融合。优选地,融合配偶体是非白蛋白蛋白质。融合配偶体可以在白蛋白的n’或c’末端融合。在白蛋白部分和配偶体部分之间可能存在或不存在一个或多个间隔氨基酸。融合配偶体可以插入白蛋白序列内。融合配偶体可以为至少5个氨基酸长,例如至少5、10、15、20、25、30、35、40、50、60、70、80、90或至少100个氨基酸长。融合配偶体可以具有或可以不具有35、30、40、50、60、70、80、90、100、125、150、175、200、300、400、500、600、700、800、900或1000个氨基酸长的最大长度。融合蛋白可包含一个或多个融合配偶体,例如融合在白蛋白的n’或c’末端或插入白蛋白序列内。融合蛋白可包含相同融合配偶体的一个或多个(例如几个,例如2、3、4或5个)拷贝或两个或多个不同的配偶体。如上所述,融合配偶体可以选自期望的或异源的蛋白质。优选的融合蛋白可包含具有glp-1活性的多肽,如描述于wo2014/138371中的那些(并入本文以供参考,具体参考第13、14、26、34-37页)。例如,优选的融合蛋白可包含hsa(seqidno:6),或者与glp类似物(例如seqidno:10)或hsa(seqidno:6)的一个拷贝串联基因融合的hsa的变体和/或片段,或者与glp类似物(例如seqidno:11)的串联重复串联基因融合的hsa的变体和/或片段。例如,融合蛋白可包含seqidno:12(阿必鲁泰albiglutide)或者由其组成。对于白蛋白,其变体、片段和/或融合物的生产特别合适的真菌宿主细胞包括但不限于曲霉属(wo06/066595),克鲁维酵母属(fleer,1991,bio/technology9:968-975),毕赤酵母属(kobayashi,1998,therapeuticapheresis2:257-262)和酵母属(sleep,1990,bio/technology8:42-46),每个并入本文以供参考。期望的蛋白质(例如异源蛋白质)可以是或可以不是分泌蛋白。因此,由宿主细胞编码的蛋白质可包含或可以不包含信号肽(在一些文献中也可能称为“前导序列”)。通常,信号肽序列在从宿主细胞分泌期间从蛋白质切割,因此所得(成熟)蛋白质不包含信号肽序列。以下提供合适的信号肽序列的实例。信号肽可包含或不包含前体肽。或者,期望的蛋白质可以是或可以不是细胞内的。期望的蛋白质可以或可以不由质粒编码。期望的蛋白质可以或可以不由染色体核酸编码。合适的质粒包括2微米族质粒,例如wo2006/067511(并入本文以供参考,特别强调其章节题目“the2μm-familyplasmids:”46-61页)。这样的质粒,共同命名为“2μm族质粒”,其包括来自鲁氏酵母(zygosaccharomycesrouxii)(之前被分类为双胞酵母zygosaccharomycesbisporus)的psr1、psb3和psb4,来自拜氏接合酵母(zygosaccharomycesbailii)的质粒psb1和psb2,来自发酵型结合酵母(zygosaccharomycesfermentati)的质粒psm1,来自kluyveromycesdrosphilarum的质粒pkd1,一种来自膜醭毕赤酵母(pichiamembranaefaciens)(“ppm1”)的未命名质粒,和来自酿酒酵母的2μm质粒(如wo2006/067511图1所示)以及变体(如scp1、scp2和scp3)(volkert等,1989,microbiologicalreviews53:299;murray等,1988,j.mol.biol.200:601;painting等,1984,j.appliedbacteriology56:331)。2μm族质粒通常包含至少三个开放阅读框(“orf”),每个开放阅读框编码一个蛋白质,该蛋白质在稳定维持作为多拷贝质粒的2μm族质粒中起作用。由三个orf编码的蛋白质可指定为flp、rep1和rep2。当2μm族质粒不包含全部3个编码flp、rep1和rep2的orf时,编码缺失蛋白的orf应以另一种质粒或通过染色体整合反式(trans)提供。优选的质粒是来自酿酒酵母的2μm质粒,优选编码期望的蛋白质如异源蛋白质。not4蛋白质和/或期望的例如异源蛋白质可以由与一个或多个控制序列可操作地连接的核苷酸序列编码,所述控制序列指导编码序列在适合的宿主细胞中在与控制序列相容的条件下表达。可以多种方式操作多核苷酸以用多种方式提供多肽的表达。取决于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。利用重组dna方法修饰多核苷酸的技术是本领域已知的。控制序列可以是启动子,即为了表达多核苷酸而被宿主细胞识别的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变体,截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例为从以下者的基因中获得的启动子:构巢曲酶乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaa)、米曲霉taka淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰刀霉类胰蛋白酶(wo96/00787)、镰孢霉(fusariumvenenatum)淀粉葡糖苷酶(wo00/56900)镰孢霉daria(wo00/56900)、镰孢霉quinn(wo00/56900)、米赫根毛霉酯酶、米赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡萄糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶iv、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉β-木糖苷酶、以及na2-tpi启动子(一种来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中未翻译的前导序列(leader)已经被来自曲霉属磷酸丙糖异构酶基因的未翻译的前导序列所替代;非限制性的实例包括来自黑曲霉中性α-淀粉酶基因的启动子,其中未翻译的前导序列(leader)已经被来自构巢曲霉或米曲霉磷酸丙糖异构酶基因的未翻译前导序列所替代);及其突变体、截短的和杂合启动子。在酵母细胞中,有用的启动子从以下者的基因获得:酿酒酵母烯醇酶(eno1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh1、adh2/gap)、酿酒酵母磷酸丙糖异构酶(tpi)、酿酒酵母金属硫蛋白(cup1)和酿酒酵母3-磷酸甘油酸酯激酶。其它对酵母宿主细胞有用的启动子在上文的romanos等,1992中有述。控制序列还可以是转录终止子,其被宿主细胞识别以终止转录。终止子序列与编码多肽的多核苷酸的3’-末端可操作地连接。可以使用任何在宿主细胞中起作用的终止子。对丝状真菌宿主细胞优选的终止子从以下者的基因中获得:构巢曲霉邻氨基苯甲酸酯合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡萄糖苷酶、米曲霉taka淀粉酶和尖孢镰刀霉类胰蛋白酶。对酵母宿主细胞优选的终止子是从以下者的基因中获得的:酿酒酵母烯醇酶、酿酒酵母细胞色素c(cyc1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。其它对酵母宿主细胞有用的终止子在上文的romanos等,1992中有述。控制序列还可以是启动子下游和基因编码序列下游的mrna控制物(stabilizer)区域,其增加基因的表达。控制序列还可以是前导序列,即对通过宿主细胞的翻译非常重要的mrna的未翻译区域。前导序列与编码多肽的多核苷酸的5’-末端可操作地连接。可以使用任何在宿主细胞中起作用的前导序列。对丝状真菌细胞优选的前导序列从米曲霉taka淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得。对酵母宿主细胞合适的前导序列从以下者的基因获得:酿酒酵母烯醇酶(eno-1)、酿酒酵母3-磷酸甘油酸酯激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)。控制序列还可以是聚腺苷酸化序列,即与编码序列的多肽的3’-末端可操作连接的序列,并且当转录时,被宿主细胞识别为将聚腺苷酸残基添加到转录的mrna的信号。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。对丝状真菌宿主细胞优选的聚腺苷酸化序列从以下者的基因获得:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡萄糖甘酶、米曲霉taka淀粉酶和尖孢镰刀霉类胰蛋白酶。对酵母宿主细胞合适的聚腺苷酸化序列在guoandsherman,1995,mol.cellularbiol.15:5983-5990中有述。控制序列还可以是信号肽编码区,其编码与多肽的n末端连接的信号肽并指导多肽进入细胞的分泌路径。多核苷酸的编码序列的5’-末端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段天然连接的信号肽编码序列。或者,编码序列的5’-末端可以含有对编码序列而言是外源的信号肽编码序列。当编码序列天然不含信号肽编码序列时,可能需要外源信号肽编码序列。或者,外源信号肽编码序列可以简单地替换天然信号肽编码序列以增强多肽的分泌。然而,可以使用指导表达的多肽进入宿主细胞的分泌路径的任何信号肽编码序列。对丝状真菌宿主细胞有效的信号肽编码序列是从以下者的基因中获得的信号肽编码序列:黑曲霉天然淀粉酶、黑曲霉葡糖淀粉酶、米曲霉taka淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶v、柔毛腐质霉酯酶、和米赫根毛酶天门氨酸蛋白酶。对酵母宿主细胞、例如用于生产白蛋白的酵母宿主细胞而言优选的信号肽,或其变体、片段和/或融合物包括:从酿酒酵母α-因子的基因获得的信号肽,从酿酒酵母转化酶的基因获得的信号肽,从酿酒酵母kex2的基因获得的信号肽,例如,包含seqidno:13或者由其组成,或者修饰的kex2信号肽,例如包含seqidno:14或者由其组成。特别优选的信号肽包括:包含交配因子α信号肽序列和人白蛋白信号肽序列的融合物的信号肽,如wo90/01063(并入本文以供参考)中所教导的,这种信号肽序列的实例提供于seqidno:15;包含seqidno:16的五肽基序的信号肽,其中五肽基序位于信号肽序列的疏水结构域中,例如位于未成熟蛋白质的-10至-25位,其中位置-1是指紧邻成熟序列的第一个氨基酸的n末端的信号肽序列的氨基酸;或者位于包含前肽位置-1的信号肽序列,前肽位置-1是指紧邻前肽第一个氨基酸的n末端的信号肽序列的氨基酸,这种信号肽序列的实例公开于wo2004/009819(并入本文以供参考)中;被修饰以包含seqidno:16的五肽基序的白蛋白信号肽,该五肽基序可以位于信号肽序列的疏水结构域中,这种修饰的信号肽序列的实例提供于seqidno:17。可将五肽基序插入转化酶信号肽中以产生修饰的转化酶信号肽,修饰的转化酶信号肽的实例提供于seqidno:35和seqidno:36中;或者白蛋白信号肽,其经修饰以包含seqidno:16的五肽基序并且在信号肽序列的c’末端包含前肽,五肽基序可位于信号肽序列的疏水结构域中,这种修饰的信号肽序列的实例提供于seqidno:18,seqidno:19和seqidno:20中。特别优选包含seqidno:15,seqidno:20和seqidno:36或者由其组成的信号肽,例如用于白蛋白或其变体、片段和/或融合物的表达。其它有用的信号肽编码序列在上文的romanos等,1992中有述。控制序列也可以是编码位于多肽n末端的前肽的前肽编码序列。所得多肽已知为酶原或多肽原(在某些情况下为酶原)。多肽原通常是无活性的并且可以通过多肽的催化或自催化裂解从多肽原转化为活性多肽。前肽编码序列可以从酿酒酵母α-因子的基因获得。当存在信号肽和前肽序列时,前肽序列紧邻于多肽的n末端且信号肽紧邻于前肽序列的n末端。加入调节相对于宿主细胞生长的多肽表达的调节序列也可能是期望的。调节体系的实例是引起响应于化学或物理刺激(包括调控化合物的存在)的基因表达的开启或关闭的那些体系。在酵母中,可以使用adh2体系或gal1体系。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子,米曲霉takaα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的实例。在真核体系中,这些调节序列包括在甲氨喋呤存在下扩增的二氢叶酸还原酶基因,和用重金属扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。宿主菌株可以或可以不表达、或者过表达一种或多种分子伴侣蛋白质,如在wo2005/061718、wo2006/067511、wo2006/136831或wo2014/138371所述的那些(均通过引入并入本文)。例如,宿主菌株可以或可以不表达、或者过表达一种或多种:aha1、cct2、cct3、cct4、cct5、cct6、cct7、cct8、cns1、cpr3、cpr6、ero1、eug1、fmo1、hch1、hsp10、hsp12、hsp104、hsp26、hsp30、hsp42、hsp60、hsp78、hsp82、jem1、mdj1、mdj2、mpd1、mpd2、pdi1、pfd1、abc1、apj1、atp11、atp12、btt1、cdc37、cpr7、hsc82、kar2、lhs1、mge1、mrs11、nob1、ecm10、ssa1、ssa2、ssa3、ssa4、ssc1、sse2、sil1、sls1、orm1、orm2、per1、ptc2、pse1、ubi4和hac1或者切割的无内含子的hac1(valkonen等人,2003,appliedenviron.micro.,69:2065),以及tim9、pam18(也称为tim14)和tcp1(也称为cct1)或其变体。优选pdi1(seqidno:21)或其变体或片段和/或ero1(seqidno:22)或其变体或片段的过表达。相对于分子蛋白在宿主细胞中的天然表达水平,过表达包括使分子伴侣的表达增加至少25%、50%、75%、100%、200%、300%、400%、500%。过表达可以对应于分子伴侣量的增加,或者分子伴侣活性的增加。过表达可以通过增加编码分子伴侣的基因的拷贝数增加而实现,例如通过提供包含基因的2、3、4、5、6、7、8、9、10或更多个拷贝的宿主细胞。优选地,变体分子伴侣与分子伴侣具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列一致性。优选地,变体保持了分子伴侣的功能活性。宿主细胞可包含或不包含至少一种编码蛋白酶或其片段和/或变体的异源核酸。宿主细胞可包含或不包含至少一种编码蛋白酶的核酸,例如钙依赖性丝氨酸蛋白酶,例如杀伤表达蛋白酶(kex2p)或其片段和/或变体。优选蛋白酶变体或片段是功能性的,例如具有在识别序列arg-arg/x或lys-arg/x的羧基末端切割多肽的能力。kex2核苷酸序列可包含seqidno:23或由其组成,kex2p蛋白可包含seqidno:24或由其组成。kex2和kex2p的变体可以分别与seqidno:23和seqidno:24具有至少70、75、80、85、90、95、96、97、98或99%的同一性。kex2可能会或可能不会过表达。优选的宿主细胞,最优选酿酒酵母,过表达pdi1和/或ero1,包含至少一个编码kex2p的核酸。编码not4蛋白质或其同系物和期望的蛋白质的核苷酸序列可以使用本领域已知的任何诱变方法来制备,如定点诱变,合成基因构建,半合成基因构建,随机诱变,改组等等来制备。定点诱变是一种技术,其中在编码亲本的多核苷酸中一个或多个限定位点处引入一个或多个(例如几个)突变。定点诱变可以通过pcr体外完成,包括使用含有所需突变的寡核苷酸引物。定点诱变还可以通过盒式诱变在体外进行,包括在包含编码亲本的多核苷酸的质粒中的位点处通过限制酶切割并随后连接在多核苷酸中含有突变的寡核苷酸。通常消化质粒和寡核苷酸的限制酶是相同的,允许质粒和插入物的粘性末端彼此连接。参见,例如scherer和davis,1979,proc.natl.acad.sci.usa76:4949-4955;和barton等,1990,nucleicacidsres.18:7349-4966。定点诱变还可以通过本领域已知的方法体外完成。参见,例如美国专利申请公开第2004/0171154号;storici等,2001,naturebiotechnol.19:773-776;kren等,1998,nat.med.4:285-290;以及calissano和macino,1996,fungalgenet.newslett.43:15-16。任何定点诱变过程可被用于本发明。有许多可用于制备多肽的商业试剂盒。合成基因构建需要体外合成设计的多核苷酸分子以编码感兴趣的多肽。基因合成可以利用多种技术进行,例如tian等人描述的基于多重微芯片的技术(multiplexmicrochip-basedtechnology)(2004,nature432:1050-1054)以及其中寡核苷酸在光可编程微流控芯片(photo-programmablemicrofluidicchips)上合成和组装的类似技术。可以使用已知的诱变、重组和/或改组方法进行单个或多个氨基酸取代、缺失和/或插入并进行测试,然后进行相关的筛选程序,如在以下公开的那些:reidhaar-olson和sauer,1988,science241:53-57;bowie和sauer,1989,proc.natl.acad.sci.usa86:2152-2156;wo95/17413或wo95/22625。其它可用的方法包括易错pr,噬菌体展示(例如,lowman等,1991,biochemistry30:10832-10837;u.s专利第5,223,409号;wo92/06204)和区域定向诱变(derbyshire等,1986,gene46:145;ner等,1988,dna7:127)。可以将诱变/改组方法与高通量自动筛选方法结合以检测由宿主细胞表达的克隆的诱变多肽的活性(ness等,1999,naturebiotechnology17:893-896)。编码活性多肽的诱变dna分子可以从宿主细胞中回收并使用本领域的标准方法快速测序。这些方法可以快速确定多肽中单个氨基酸残基的重要性。通过将合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的方面结合来实现半合成基因构建。半合成构建通常是通过利用合成的多核苷酸片段与pcr技术相结合的方法。因此可以从头合成限定的基因区域,而其它区域可以使用位点特异性诱变引物扩增,而其它区域可以进行易错pcr或非易错pcr扩增。然后可以改组多核苷酸子序列。本发明的第二方面提供一种含有编码期望的蛋白质如异源蛋白质的多核苷酸序列的真菌宿主细胞培养物,其特征在于真菌宿主细胞具有修饰的(如降低的)not4蛋白质或同系物的活性水平,或者修饰的(如降低的)not4蛋白或其同系物的表达水平。根据本发明第二方面的真菌宿主细胞如本发明第一方面所述。或者,本发明的第二方面提供一种含有编码所需蛋白质如异源蛋白质的多核苷酸序列的真菌宿主细胞培养物,其特征在于所述真菌宿主细胞具有提高的not4蛋白或其同系物的活性水平,或者增加的not4蛋白或其同系物的表达水平。根据本发明的该替代性第二方面的真菌宿主细胞如本发明第一方面所述。这对于产生对宿主生存力有害的期望的蛋白质可能是有用的。本发明的第三方面提供一种用于从真菌宿主细胞产生期望的蛋白质如异源蛋白质的方法,该方法包括提供根据本发明第一方面的真菌宿主细胞或根据第二方面的培养物,并且培养真菌宿主细胞或培养物以产生期望的蛋白质。该方法可用于改变来自真菌宿主细胞的期望多肽的产量。在某些情况下,可能需要增加某些蛋白质的产量。在其它情况下,可能需要降低某些蛋白质的产量,例如可能对宿主细胞有毒性的蛋白质。期望的蛋白质可以从或可以不从宿主细胞分泌,优选分泌的蛋白质。可以使用本领域已知的方法在适于产生期望的蛋白质的营养培养基中培养宿主细胞。例如,细胞可以通过摇瓶培养,或通过在实验室或工业发酵罐中小规模或大规模发酵(包括连续、间歇、分批补料或固态发酵)进行培养,在合适的培养基和允许多肽表达和/或分离的条件下进行。培养可以使用本领域已知的过程在包含碳源和氮源以及无机盐的合适的营养培养基中进行。合适的培养基可从商业供应商获得,或者可根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。优选的培养基包括如实施例2中所述的mw11d。如果期望的蛋白质分泌到营养培养基中,则可以从培养基中直接回收期望的蛋白质。如果所需蛋白质不分泌,则可从细胞裂解物中回收。培养可以是小规模或大规模的,例如微量滴定板规模(例如10-500微升培养物体积的培养基),摇瓶规模(例如5-1000毫升(ml)培养基体积),或者发酵罐或同等系统规模(例如至少5ml培养物体积,更优选至少1、2、3、4或5升(l),更优选至少10、50、100l,例如至少500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000l培养物体积)。培养可以处于适合于宿主细胞的ph。对酿酒酵母,优选的ph为5-7,例如从5、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、6、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8或6.9至5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、6、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9或7。优选的ph范围是约6.0至约6.4。可以使用本领域已知的对期望的蛋白质特异性的方法检测期望的蛋白质。这些检测方法包括但不限于使用特异性抗体或高效液相色谱(hplc)。优选的hplc是凝胶渗透hplc(gp-hplc)。合适的设备包括在shimadzuvp7.3客户服务软件控制下的装配有uv探测的lc2010hplc系统(shimadzu)。用6.0mmidx40mm长度的tsksw保护柱(tosohbioscience),在7.8mmidx300mm长度的tskg3000swxl柱上(tosohbioscience)进行75μl的注射。样品可以在25mm磷酸钠、100mm硫酸钠、0.05%(w/v)叠氮化钠中进行色谱分析,在1ml.min-1ph为7.0,运行时间20分钟。样品可以通过在280nm处的紫外探测通过相对于已知浓度(例如10mg/ml)的重组人白蛋白标准品的峰面积进行定量,并校正其相对消光系数。任选地,该方法包括回收期望的蛋白质,例如从宿主细胞或宿主细胞培养物、例如细胞培养基或细胞裂解物中分离期望的蛋白质。期望的蛋白质可以使用本领域已知的方法回收。例如,可通过常规程序从营养培养基中回收期望的蛋白质,所述常规程序包括但不限于收集,离心,过滤,提取,喷雾干燥,蒸发或沉淀。任选地,该方法包括纯化期望的蛋白质。所需蛋白质可通过本领域已知的多种方法纯化以获得基本纯的期望的蛋白质,包括但不限于色谱法(例如离子交换,亲和力,疏水,色谱聚焦和尺寸排除),电泳程序(例如制备性等电聚焦),差示溶解度(例如硫酸铵沉淀),sds-page,或提取(参见例如proteinpurification,janson和ryden,editors,vchpublishers,newyork,1989)。在另一方面,不回收期望的蛋白质,而是将表达期望的蛋白质的本发明的宿主细胞用作期望的蛋白质的来源。从培养的宿主细胞或培养基中纯化期望的蛋白质(例如期望的异源蛋白质)的步骤任选地包括细胞固定,细胞分离和/或细胞破碎,但总是包含至少一个与细胞固定、分离和/或破裂步骤不同的纯化步骤。细胞固定技术如使用藻酸钙珠包裹细胞,是本领域已知的。类似地,细胞分离技术例如离心、过滤(例如错流过滤)、膨胀床层析等是本领域已知的。同样,细胞破碎的方法,包括珠磨、超声处理、酶促暴露等在本领域中是已知的。该至少一个其它纯化步骤可以是本领域已知适用于蛋白质纯化的任何其它步骤。例如,用于回收重组表达的白蛋白的纯化技术已经在以下公开:wo2010/128142,使用白蛋白特异性配体如2-氯-4,6-二(2’-磺基苯胺基)-s-三嗪的亲和力纯化,wo92/04367,基质衍生的染料的去除;ep464590,酵母衍生的着色剂的去除;ep319067,碱性沉淀和随后将白蛋白应用于亲脂相;以及wo96/37515、us5728553和wo00/44772,其描述了完整的纯化过程;其全部并入本文以供参考。通过已发现可用于纯化这些蛋白质的任何技术可以从培养基中纯化除白蛋白以外的期望蛋白质。合适的方法包括硫酸铵或乙醇沉淀,酸或溶剂提取,阴离子或阳离子交换色谱,磷酸纤维素色谱,疏水相互作用色谱,亲和力色谱,羟基磷灰石色谱,凝集素色谱,浓缩,稀释,ph调节,渗滤,超滤,高效液相色谱法(“hplc”),反相hplc,电导率调整等。任选地,该方法可以包括将分离的蛋白质纯化至商业或工业上可接受水平的纯度。按商业或工业上可接受的纯度水平,我们包括提供以下浓度的蛋白质:至少0.01g.l-1、0.02g.l-1、0.03g.l-1、0.04g.l-1、0.05g.l-1、0.06g.l-1、0.07g.l-1、0.08g.l-1、0.09g.l-1、0.1g.l-1、0.2g.l-1、0.3g.l-1、0.4g.l-1、0.5g.l-1、0.6g.l-1、0.7g.l-1、0.8g.l-1、0.9g.l-1、1g.l-1、2g.l-1、3g.l-1、4g.l-1、5g.l-1、6g.l-1、7g.l-1、8g.l-1、9g.l-1、10g.l-1、15g.l-1、20g.l-1、25g.l-1、30g.l-1、40g.l-1、50g.l-1、60g.l-1、70g.l-1、80g.l-1、90g.l-1、100g.l-1、150g.l-1、200g.l-1、250g.l-1、300g.l-1、350g.l-1、400g.l-1、500g.l-1、600g.l-1、700g.l-1、800g.l-1、900g.l-1、1000g.l-1或更多。按商业或工业上可接受的纯度水平,我们包括提供其中其它物质(例如,一种或多种(例如数种)污染物)以以下水平存在的分离的蛋白质:小于50%、40%、30%、20%、10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%、0.0001%、0.00001%、或0.000001%且最优选在0%的水平。该蛋白质可以以下浓度提供:至少0.01g.l-1、0.02g.l-1、0.03g.l-1、0.04g.l-1、0.05g.l-1,0.06g.l-1,0.07g.l-1、0.08g.l-1、0.09g.l-1、0.1g.l-1、0.2g.l-1、0.3g.l-1、0.4g.l-1、0.5g.l-1、0.6g.l-1、0.7g.l-1、0.8g.l-1、0.9g.l-1、1g.l-1、2g.l-1、3g.l-1、4g.l-1、5g.l-1、6g.l-1、7g.l-1、8g.l-1、9g.l-1、10g.l-1、15g.l-1、20g.l-1、25g.l-1、30g.l-1、40g.l-1、50g.l-1、60g.l-1、70g.l-1、80g.l-1、90g.l-1、100g.l-1、150g.l-1、200g.l-1、250g.l-1、300g.l-1、350g.l-1、400g.l-1、500g.l-1、600g.l-1、700g.l-1、800g.l-1、900g.l-1、1000g.l-1或更高。优选将所需蛋白纯化以达到药学上可接受的纯度水平。如果蛋白质基本上不含热原并且可以以药学有效量施用而不引起与蛋白质活性无关的医学效应,则该蛋白质具有药学上可接受的纯度水平。任选地,该方法进一步包括用治疗上可接受的载体或稀释剂配制期望的蛋白质,从而产生适合施用于人或动物的治疗产品。所得到的期望的蛋白质可以或可以不用于其任何已知用途,在白蛋白的情况下其包括向患者静脉内(i.v.)施用以治疗严重烧伤、休克和失血,补充培养基,并作为其它蛋白质制剂中的赋形剂。尽管通过本发明的方法获得的治疗上、诊断上、工业上、家庭上或营养上有用的期望的蛋白质可以单独出现或单独给药,但优选其与一种或多种可接受的载体或稀释剂作为制剂(例如药物制剂,特别是治疗上和/或诊断上有用的蛋白质的情况)。载体或稀释剂在与期望的蛋白质相容的意义上必须是“可接受的”,并且如果制剂旨在给予接受者,则对接受者无害。通常,载体或稀释剂将是无菌且无热原的水或盐水。任选地,如此配制的蛋白质将以单位剂量形式存在,例如以片剂、胶囊、注射溶液等形式存在。任选地,该方法进一步包括提供单位剂量形式的期望的蛋白质。本发明的第四方面提供一种用于提高期望的蛋白质(如异源蛋白质)的产量的方法,其包含根据本发明第二方面的方法。本发明的第四方面还提供根据本发明第一方面的宿主细胞或根据本发明第二方面的培养物用于增加期望的蛋白质(如异源蛋白质)的产量的用途。产量是指溶液(例如培养液或细胞溶解混合物)中产品(例如期望的蛋白质)的量。产量可以用相对术语表示,例如,对照宿主菌株的产量为100%。当比较宿主菌株时,优选在定义的一组条件下测量产量。绝对产量可表示为纳克每微升(ng/μl)或克每升(g/l)。优选地,期望的蛋白质的产量比参照真菌宿主细胞,如具有野生型not4蛋白质如seqidno:2的真菌宿主细胞的产量高至少2%,更优选高至少3、4、5、6、7、8、9、10、12.5、15、17.5、20、22.5、25、27.5、30、35、40、45或至少50%或更高。优选的参照真菌宿主细胞具有seqidno:2的not4蛋白质。期望的蛋白质可以如本发明第一方面所述,特别是白蛋白或其变体,片段和/或融合物。本发明的第五方面提供通过根据本发明的第二、第三或第四方面的方法产生的期望的蛋白质(例如异源蛋白质)。本发明还提供包含本发明第四方面的期望的蛋白质的组合物,如药物组合物。药物组合物可包含一种或多种药学上可接受的载体,如由管理机构(如美国食品和药物管理局或欧洲药品管理局)批准的那些。本发明进一步提供了治疗患者的方法,包括向患者施用有效量的药物组合物。本发明的第六方面提供一种制备根据本发明第一方面的真菌宿主细胞或根据本发明第二方面的培养物的方法。该方法包括遗传修饰(亲本)真菌宿主细胞以修饰所得not4蛋白或其同系物,以修饰,例如降低not4蛋白或其同系物的活性水平,修饰not4基因或其同系物或其控制序列,或修饰not4基因或其同系物的表达水平。活性和/或表达水平的变异、缺失和修饰可以如本发明的第一、第二和第三方面所述。用于基因改造宿主细胞的方法在本领域中是已知的。本发明的第七方面提供一种not4蛋白质或其同系物,其包含与seqidno:2至少70%的同一性和在对应于选自seqidno:2以下一个或多个位置的位置处的突变:426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469或470,优选选自以下位置:(a)429、430、434、或437;(b)463、464或466;或者(c)442、445、447或452。特别优选在对应于seqidno:2位置429的位置处的突变。根据本发明的第七方面的not4蛋白质可以如关于本发明的第一方面所述。优选地,not4蛋白质包含seqidno:4或由其组成。本发明第七方面的not4蛋白质可以是或不是分离的蛋白质。本发明的第八方面提供一种编码本发明的not4变体的多核苷酸,如seqidno:2的变体,该变体相比于编码野生型not4蛋白质如seqidno:2或其同系物的宿主细胞,导致更低水平的not4蛋白质或其同系物的表达、或导致更低活性水平的not4蛋白质或其同系物。在本发明的第一至第六方面中描述了这种not4蛋白质。优选的多核苷酸编码具有突变f429i(seqidno:4)的not4蛋白,这种多核苷酸序列的实例由seqidno:3提供。例如,本发明还涉及包含编码本发明的not4变体的多核苷酸的核酸构建体,该多核苷酸可操作地连接至一个或多个控制序列,该控制序列指导编码序列在合适的宿主细胞中在与对照序列相容的条件下的表达。在本发明的第一至第六方面中描述了合适的控制序列。多核苷酸可以位于载体上或宿主细胞的基因组中。因此,本发明还涉及包含编码本发明的not4变体的多核苷酸,启动子以及转录和翻译终止信号的重组载体。本发明还涉及包含编码not4和一个或多个(例如几个)控制序列的多核苷酸的载体,该控制序列引起not4或not4活性水平被修饰,例如被减少。可将各种核苷酸和控制序列连接在一起以产生重组载体,其可包含一个或多个方便的限制性位点以允许在这些位点插入或取代编码变体的多核苷酸。或者,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的合适载体来表达多核苷酸。在创建载体时,编码序列位于载体中,使得编码序列与适当的用于表达的控制序列可操作地连接。重组载体可以是可以方便地进行重组dna操作并可以引起多核苷酸表达的任何载体(例如质粒或病毒)。载体的选择通常取决于载体与待导入载体的宿主细胞的相容性。载体可以是线性或闭环质粒。载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外因子、微染色体或人工染色体。载体可包含任何用于确保自我复制的手段。或者,载体可以是当被引入宿主细胞时整合到基因组中并与其中已整合的染色体一起复制的载体。此外,可以使用单个载体或质粒或两种或更多种载体或质粒,其共同含有待引入宿主细胞基因组中的总dna或转位子。载体优选含有一个或多个选择性标志物,其允许选择转化的、转染的、转导等的细胞。选择性标志物是基因,其产物提供杀生物剂或病毒抗性,对重金属的抗性,对营养缺陷型的原养型等。载体优选含有允许载体整合到宿主细胞基因组中的元件或者载体在细胞中独立于基因组的自主复制。为了整合到宿主细胞基因组中,载体可以依赖于编码变体的多核苷酸序列或为了通过同源或非同源重组整合到基因组中的载体的任何其它元件。或者,载体可含有用于指导通过同源重组在染色体中精确位置处整合到宿主细胞基因组中的额外多核苷酸。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,例如100至10,000个碱基对,400至10,000个碱基对和800至10,000个碱基对,其与相应的靶序列具有高度的序列同一性以增强同源重组的可能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码多核苷酸。另一方面,可以通过非同源重组将载体整合到宿主细胞的基因组中。对于自主复制,载体可以进一步包含使得载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是任何在细胞中起作用的介导自主复制的质粒复制子。术语“复制起点”或“质粒复制子”是指使质粒或载体能够在体内复制的多核苷酸。用于酵母宿主细胞的复制起点的例子是2微米复制起点,ars1,ars4,ars1和cen3的组合,以及ars4和cen6的组合。可用于丝状真菌细胞的复制起点的实例为ama1和ans1(gems等,1991,gene98:61-67;cullen等,1987,nucleicacidsres.15:9163-9175;wo00/24883)。ama1基因和含有该基因的质粒构建体或载体的分离可以根据wo00/24883中所述的方法完成。可以将多于一个本发明的多核苷酸拷贝插入宿主细胞中以增加期望的蛋白质的产量。多核苷酸的拷贝数的增加可以通过以下方法获得:将至少一个额外的序列拷贝整合到宿主细胞基因组中,或通过包括具有多核苷酸的可扩增选择性标志物基因,其中细胞包含选择性标记基因的扩增拷贝,从而可以通过在合适的选择性试剂存在下培养细胞来选择多核苷酸的额外拷贝。用于连接上述元件的以构建本发明的重组载体的过程对本领域技术而言而言是已知的(参见,例如sambrook等,1989,molecularcloning,alaboratorymanual,2dedition,coldspringharbor,newyork)。优选的实施方式1.一种真菌宿主细胞,其具有:a.修饰的not4蛋白质或其同系物,或者b.修饰的not4蛋白质或其同系物的活性水平或表达水平,或者c.修饰的not4基因或其同系物,或者d.修饰的not4基因或其同系物的表达水平。2.实施方式1的真菌宿主细胞,其中修饰的水平是降低的水平。3.实施方式1的真菌宿主细胞,其中修饰的水平是增加的水平。4.前述任一项实施方式的真菌宿主细胞,其中修饰的水平是相对于参照真菌宿主细胞的水平,参照真菌宿主细胞如:a.not4蛋白质或其同系物是野生型not4蛋白质或其同系物的真菌宿主细胞,b.not4蛋白质包含seqidno:2或由seqidno:2组成的真菌宿主细胞,c.酿酒酵母s288c或者d.酿酒酵母dxy1。5.根据前述任一项实施方式的真菌宿主细胞,其包含编码期望的蛋白质如异源蛋白质的核苷酸序列。6.根据实施方式5的真菌宿主细胞,其中期望的蛋白质选自白蛋白,单克隆抗体,依托泊苷,血清蛋白(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白,乳铁蛋白,内皮抑素,血管抑制素,胶原,免疫球蛋白或基于免疫球蛋白的分子或片段之一(例如,smallmodularimmunopharmaceuticaltm(“smip”)或dab、fab’片段、f(ab’)2、scab、scfv或scfv片段),kunitz结构域蛋白(如在wo03/066824中所述的那些,具有或不具有白蛋白融合物),干扰素,白细胞介素,il-10,il-11,il-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,cntf,cntfax15,il-1-受体拮抗剂,红细胞生成素(epo)和epo模拟物,血小板生成素(tpo)和tpo模拟物,prosaptide,蓝藻抗病毒蛋白-n,五螺旋蛋白,t20肽,t1249肽,hivgp41,hivgp120,尿激酶,尿激酶原,tpa,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、glp-1或glp-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,g-csf,gm-csf,m-csf,fgf,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白酶、纤溶酶原激活剂、因子vii、因子viii、因子ix、因子x和因子xiii),神经生长因子,laci,血小板衍生内皮细胞生长因子(pd-ecgf),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白,间-α胰蛋白酶抑制剂,抗凝血酶iii,载脂蛋白种,蛋白c,蛋白s,代谢物,抗生素,或上述任一项的变体或片段。7.根据实施方式5或6的真菌宿主细胞,其中期望的蛋白质包含白蛋白、其变体、片段和/或融合物,或者由白蛋白、其变体、片段和/或融合物组成。8.根据实施方式7的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少70%的同一性。9.根据实施方式7的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少75%、80%、85%、90%、91%、92%、93%、95%、96%、97%、98%或99%的同一性。10.根据实施方式9的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少70%的同一性,优选与seqidno:6具有至少75%、80%、85%、90%、91%、92%、93%、95%、96%、97%、98%或99%的同一性,并且在对应于seqidno:6的k573位置处包含a、c、d、e、f、g、h、i、l、m、n、p、q、r、s、t、v、w或y。11.根据实施方式10的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物在对应于seqidno:6的k573位置处包含p、h、w或y。12.根据实施方式11的真菌宿主细胞,其中白蛋白、其变体、片段和/或融合物与seqidno:6具有至少98%的同一性,并且在对应于seqidno:6的k573位置处包含p。13.根据实施方式5-12中任一项的真菌宿主细胞,其中融合物包含融合配偶体,该融合配偶体不是白蛋白或者其变体或片段或融合物。14.根据实施方式7-13中任一项的真菌宿主细胞,其中融合物包含选自以下的融合配偶体:单克隆抗体,依托泊苷,血清蛋白(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白,乳铁蛋白,内皮抑素,血管抑制素,胶原,免疫球蛋白或基于免疫球蛋白的分子或片段之一(例如,smallmodularimmunopharmaceuticaltm(“smip”)或dab、fab’片段、f(ab’)2、scab、scfv或scfv片段),kunitz结构域蛋白(如在wo03/066824中所述的那些),干扰素,白细胞介素,il-10,il-11,il-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,cntf,cntfax15,il-1-受体拮抗剂,红细胞生成素(epo)和epo模拟物,血小板生成素(tpo)和tpo模拟物,prosaptide,蓝藻抗病毒蛋白-n,五螺旋蛋白,t20肽,t1249肽,hivgp41,hivgp120,尿激酶,尿激酶原,tpa,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、glp-1或glp-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,g-csf,gm-csf,m-csf,fgf,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白酶、纤溶酶原激活剂、因子vii、因子viii、因子ix、因子x和因子xiii),神经生长因子,laci,血小板衍生内皮细胞生长因子(pd-ecgf),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白,间-α胰蛋白酶抑制剂,抗凝血酶iii,载脂蛋白种,蛋白c,蛋白s,代谢物,抗生素,或上述任一项的变体或片段。15.根据实施方式13或14的真菌宿主细胞,其中融合配偶体包含胰高血糖素样蛋白或其类似物,或者由胰高血糖素样蛋白或其类似物组成。16.根据实施方式15的真菌宿主细胞,其中融合配偶体包含seqidno:10或seqidno:11,或者由seqidno:10或seqidno:11组成。17.根据实施方式5-16中任一项的真菌宿主细胞,其中期望的蛋白包含seqidno:12,或者由其组成。18.根据实施方式2-17中任一项的真菌宿主细胞,其中修饰的not4蛋白质或其同系物的活性水平或表达水平是相对于亲本真菌宿主细胞(如野生型真菌宿主细胞)的not4蛋白质或其同系物的活性水平或表达水平。19.根据实施方式18的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的90%。20.根据实施方式19的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的80%。21.根据实施方式20的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的70%。22.根据实施方式21的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的60%。23.根据实施方式22的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的50%。24.根据实施方式23的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的40%。25.根据实施方式24的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的30%。26.根据实施方式25的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至不高于亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的20%。27.根据实施方式26的真菌宿主细胞,其中not4蛋白质或其同系物的活性水平减少至亲本真菌宿主细胞的not4蛋白质或其同系物的活性水平的基本上0%。28.根据前述任一项实施方式的真菌宿主细胞,其中该宿主细胞缺乏功能性not4基因或其同系物或者功能性not4蛋白质或其同系物。29.根据前述任一项实施方式的真菌宿主细胞,其中该宿主细胞缺乏not4基因或其同系物或者not4蛋白质或其同系物。30.根据前述任一项实施方式的真菌宿主细胞,其中将not4基因或其同系物或者not4蛋白质或其同系物突变以改变not4蛋白质或其同系物与not1蛋白质或其同系物的相互作用。31.根据前述任一项实施方式的真菌宿主细胞,其中not4蛋白质或其同系物在对应于选自seqidno:2以下位置的位置处包含突变:426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469或470。32.根据前述任一项实施方式的真菌宿主细胞,其中该位置选自对应于seqidno:2的429、430、434、或437的位置。33.根据前述任一项实施方式的真菌宿主细胞,其中该位置选自对应于seqidno:2的463、464或466的位置。34.根据前述任一项实施方式的真菌宿主细胞,其中该位置选自对应于seqidno:2的442、445、447或452的位置。35.根据实施方式32-34中任一项的真菌宿主细胞,其中突变是取代,优选取代为非保守氨基酸。36.根据实施方式31、32或35的真菌宿主细胞,其中在对应于seqidno:2的位置429的位置处的突变是取代为a、c、d、e、g、h、i、k、l、m、n、p、q、r、s、t、v、w或y,优选为g、a、v、l或i,更优选为i、l或v,最优选为i。37.根据实施方式31、32或35的真菌宿主细胞,其中在对应于seqidno:2的位置429的位置处的突变是从芳香族氨基酸取代为脂肪族氨基酸。38.根据实施方式36或37的真菌宿主细胞,其中not4蛋白质包含seqidno:4,或者由seqidno:4组成。39.根据前述任一项实施方式的真菌宿主细胞,其包含修饰的not4基因,例如编码seqidno:4的多核苷酸。40.根据前述任一项实施方式的真菌宿主细胞,其中宿主细胞缺乏not4基因或其同系物或者not4蛋白质或其同系物。41.根据前述任一项实施方式的真菌宿主细胞,其中过表达以下一种或多种分子伴侣:aha1、cct2、cct3、cct4、cct5、cct6、cct7、cct8、cns1、cpr3、cpr6、ero1、eug1、fmo1、hch1、hsp10、hsp12、hsp104、hsp26、hsp30、hsp42、hsp60、hsp78、hsp82、jem1、mdj1、mdj2、mpd1、mpd2、pdi1、pfd1、abc1、apj1、atp11、atp12、btt1、cdc37、cpr7、hsc82、kar2、lhs1、mge1、mrs11、nob1、ecm10、ssa1、ssa2、ssa3、ssa4、ssc1、sse2、sil1、sls1、orm1、orm2、per1、ptc2、pse1、ubi4和hac1或者截短的无内含子的hac1、tim9、pam18、tcp1或其变体。42.根据前述任一项实施方式的真菌宿主细胞,其中kex2或其变体或片段表达或过表达。43.根据实施方式41或42的真菌宿主细胞,其中pdi1或其变体过表达,或者ero1或其变体过表达。44.根据实施方式41或42的真菌宿主细胞,其中pdi1或其变体过表达,并且ero1或其变体过表达。45.根据实施方式41或42的真菌宿主细胞,其中pdi1或其变体过表达,并且kex2或其变体表达或过表达。46.根据实施方式41或42的真菌宿主细胞,其中ero1或其变体过表达,并且kex2或其变体表达或过表达。47.根据实施方式41-46中任一项的真菌宿主细胞,其中pdi1或其变体过表达,并且ero1或其变体过表达,并且kex2或其变体表达或过表达。48.根据前述任一项实施方式的真菌宿主细胞,其中真菌宿主是酵母或丝状真菌。49.根据前述任一项实施方式的真菌宿主细胞,其中宿主细胞是酵母菌、念珠菌、汉逊酵母、克鲁维酵母、毕赤酵母、酵母菌、裂殖酵母或亚罗酵母。50.根据实施方式49的真菌宿主细胞,其中酵母菌是卡尔伯氏酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁维酵母,诺地酵母或卵形酵母,优选酿酒酵母。51.一种真菌宿主细胞培养物,真菌宿主细胞包含编码期望的蛋白质如异源蛋白质的多核苷酸序列,其特征在于真菌宿主细胞具有降低的not4蛋白质或其同系物的活性水平。52.根据实施方式51的真菌宿主细胞培养物,其中宿主细胞如实施方式1-50中任一项所定义。53.一种用于从真菌宿主细胞制备期望的蛋白质如异源蛋白质的方法,其包括:(i)提供根据实施方式1-50中任一项的真菌宿主细胞或者根据实施方式51或52的培养物,(ii)培养真菌宿主细胞或培养物以产生期望的蛋白质,(iii)任选地回收期望的蛋白质,(iv)任选地纯化期望的蛋白质,(v)任选地将期望的蛋白质与治疗上可接受的载体或稀释剂进行配制以制备适合施用于人或动物的治疗产品,和(vi)任选地提供单位剂量形式的期望的蛋白质。54.一种用于增加期望的蛋白质(如异源蛋白质)产量的方法,其包括:(i)提供真菌宿主细胞(如酵母或丝状真菌),其具有:a.修饰的not4蛋白质或其同系物,或者b.修饰的not4蛋白质或其同系物的活性水平(优选降低),或者c.修饰的not4基因或其同系物,或者d.修饰的not4基因或其同系物的表达水平(优选降低)。(ii)培养宿主细胞以产生期望的蛋白质,和(iii)任选地回收期望的蛋白质,(iv)任选地纯化期望的蛋白质,(v)任选地将期望的蛋白质与治疗上可接受的载体或稀释剂进行配制以制备适合施用于人或动物的治疗产品,和(vi)任选地提供单位剂量形式的期望的蛋白质。55.根据实施方式53或54的方法,其中,期望的蛋白质的产量比来自参照真菌宿主细胞如具有野生型not4蛋白质(如seqidno:2)的真菌宿主细胞的产量高至少2%。56.根据实施方式55的方法,其中产量比来自参照真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、40%、45%或者至少50%。57.根据实施方式55或56的方法,其中期望的蛋白质的产量比来自参照真菌宿主细胞如具有seqidno:2的not4蛋白质的真菌宿主细胞的产量高至少2%。58.根据实施方式57的方法,其中产量比来自参照真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、40%、45%或者至少50%。59.根据实施方式53-58任一项的方法,其中期望的蛋白质选自白蛋白,单克隆抗体,依托泊苷,血清蛋白(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白,乳铁蛋白,内皮抑素,血管抑制素,胶原,免疫球蛋白或基于免疫球蛋白的分子或片段之一(例如,smallmodularimmunopharmaceuticaltm(“smip”)或dab、fab’片段、f(ab’)2、scab、scfv或scfv片段),kunitz结构域蛋白(如在wo03/066824中所述的那些,具有或不具有白蛋白融合物),干扰素,白细胞介素,il-10,il-11,il-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,cntf,cntfax15,il-1-受体拮抗剂,红细胞生成素(epo)和epo模拟物,血小板生成素(tpo)和tpo模拟物,prosaptide,蓝藻抗病毒蛋白-n,五螺旋蛋白,t20肽,t1249肽,hivgp41,hivgp120,尿激酶,尿激酶原,tpa,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、glp-1或glp-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,g-csf,gm-csf,m-csf,fgf,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白酶、纤溶酶原激活剂、因子vii、因子viii、因子ix、因子x和因子xiii),神经生长因子,laci,血小板衍生内皮细胞生长因子(pd-ecgf),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白,间-α胰蛋白酶抑制剂,抗凝血酶iii,载脂蛋白种,蛋白c,蛋白s,代谢物,抗生素,或上述任一项的变体或片段。60.根据实施方式53-59任一项的方法,其中期望的蛋白质包含白蛋白或其变体、片段和/或融合物,或者由白蛋白或其变体、片段和/或融合物组成。61.根据实施方式60的方法,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少70%的同一性。62.根据实施方式61的方法,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少75%、80%、85%、90%、91%、92%、93%、95%、96%、97%、98%或99%的同一性。63.根据实施方式62的方法,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少70%的同一性,优选与seqidno:6具有至少75%、80%、85%、90%、91%、92%、93%、95%、96%、97%、98%或99%的同一性,并且在对应于seqidno:6的k573位置处包含a、c、d、e、f、g、h、i、l、m、n、p、q、r、s、t、v、w或y。64.根据实施方式63的方法,其中白蛋白或其变体、片段和/或融合物在对应于seqidno:6的k573位置处包含p、h、w或y。65.根据实施方式64的方法,其中白蛋白或其变体、片段和/或融合物与seqidno:6具有至少98%的同一性,并且在对应于seqidno:6的k573位置处包含p。66.根据实施方式53-65中任一项的方法,其中融合物包含融合配偶体,其不是白蛋白或其变体、片段和/或融合物。67.根据实施方式53-66中任一项的方法,其中融合物包含选自以下的融合配偶体:单克隆抗体,依托泊苷,血清蛋白(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白,乳铁蛋白,内皮抑素,血管抑制素,胶原,免疫球蛋白或基于免疫球蛋白的分子或片段之一(例如,smallmodularimmunopharmaceuticaltm(“smip”)或dab、fab’片段、f(ab’)2、scab、scfv或scfv片段),kunitz结构域蛋白(如在wo03/066824中所述的那些),干扰素,白细胞介素,il-10,il-11,il-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,cntf,cntfax15,il-1-受体拮抗剂,红细胞生成素(epo)和epo模拟物,血小板生成素(tpo)和tpo模拟物,prosaptide,蓝藻抗病毒蛋白-n,五螺旋蛋白,t20肽,t1249肽,hivgp41,hivgp120,尿激酶,尿激酶原,tpa,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、glp-1或glp-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,g-csf,gm-csf,m-csf,fgf,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白酶、纤溶酶原激活剂、因子vii、因子viii、因子ix、因子x和因子xiii),神经生长因子,laci,血小板衍生内皮细胞生长因子(pd-ecgf),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白,间-α胰蛋白酶抑制剂,抗凝血酶iii,载脂蛋白种,蛋白c,蛋白s,代谢物,抗生素,或上述任一项的变体或片段。68.根据实施方式67的方法,其中融合配偶体包含胰高血糖素样蛋白或其类似物,或者由胰高血糖素样蛋白或其类似物组成。69.根据实施方式68的方法,其中融合配偶体包含seqidno:10或seqidno:11,或者由seqidno:10或seqidno:11组成。70.根据实施方式53-69中任一项的方法,其中期望的蛋白质包含seqidno:12,或者由其组成。71.根据实施方式53-70中任一项的方法,其中宿主细胞在至少1l的规模下培养。72.根据实施方式71的方法,其中宿主细胞在至少2l的规模下培养。73.根据实施方式72的方法,其中宿主细胞在至少5l的规模下培养。74.根据实施方式73的方法,其中宿主细胞在至少10l的规模下培养。75.根据实施方式74的方法,其中宿主细胞在至少1000l的规模下培养。76.根据实施方式75的方法,其中宿主细胞在至少5000l的规模下培养。77.根据实施方式53-76中任一项的方法,其中期望的蛋白质从真菌宿主细胞分泌。78.根据实施方式77的方法,其中期望的蛋白质得自包含信号肽的未成熟蛋白质。79.根据实施方式78的方法,其中信号肽包含或由以下组成:seqidno:13、seqidno:14、seqidno:15、seqidno:17、seqidno:18、seqidno:19、seqidno:20、seqidno:35或seqidno:36,或者信号肽包含seqidno:16的五肽基序。80.根据实施方式79的方法,其中信号肽包含seqidno:15或者由其组成。81.根据实施方式79的方法,其中信号肽包含seqidno:20或者由其组成。82.根据实施方式79的方法,其中信号肽包含seqidno:36或者由其组成。83.根据实施方式53-77中任一项的方法,其中期望的蛋白质是细胞内的。84.根据实施方式53-83中任一项的方法制备的期望的蛋白质(如异源蛋白质)。85.根据实施方式84的期望的蛋白质,其用于预防、治疗或诊断。86.一种组合物,如药物组合物,其包含根据实施方式84或85的期望的蛋白质和药学上可接受的载体。87.一种治疗方法,其包括将实施方式84或85的期望的蛋白质或实施方式86的组合物施用至患者。88.一种制备根据实施方式1-50中任一项的真菌宿主细胞或者根据实施方式51或52的培养物的方法,该方法包括基因修饰(亲本)真菌宿主细胞以降低not4蛋白质或其同系物的活性水平。89.降低真菌宿主细胞中not4蛋白质或其同系物活性水平以增加来自真菌宿主细胞的期望的蛋白质(如异源蛋白质)的产量的手段的用途,例如:该手段通过使not4基因突变或缺失从而得到突变的not4蛋白质或其同系物或者使not4蛋白质或其同系物完全不存在;通过使not4基因的控制序列如启动子序列和/或终止子序列突变或改变,而除去或改变基因的开放阅读框;例如通过引入合适的干扰rna如反义mrna,通过引入、控制或修饰合适的转录激活因子基因或者通过引入阻断not4蛋白质或其同系物的活性水平的试剂,而阻断或减少not4基因的转录。90.not4蛋白质或其同系物,其包含与seqidno:2至少70%的同一性以及在对应于选自seqidno:2的一个或多个以下位置的位置处的突变:426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469或470。91.根据实施方式90的not4蛋白质或其同系物,其中位置选自对应于seqidno:2的429、430、434或437位置。92.根据实施方式90的not4蛋白质或其同系物,其中位置选自对应于seqidno:2的463、464或466位置。93.根据实施方式90的not4蛋白质或其同系物,其中位置选自对应于seqidno:2的442、445、447或452位置。94.根据实施方式90-93中任一项的not4蛋白质或其同系物,其中突变是取代,优选取代为非保守氨基酸。95.根据实施方式90或91的not4蛋白质或其同系物,其中在对应于seqidno:2位置429的位置处的突变是取代为a、c、d、e、g、h、i、k、l、m、n、p、q、r、s、t、v、w或y,优选为g、a、v、l或i,更优选为i、l或v,最优选为i。96.根据实施方式90或91的not4蛋白质或其同系物,其中在对应于seqidno:2位置429的位置处的突变是从芳香族氨基酸取代为脂肪族氨基酸。97.根据实施方式90、91、95或96中任一项的not4蛋白质或其同系物,其包含seqidno:4或者由其组成。实施例实施例1:酿酒酵母not4基因的突变酿酒酵母dp9具有整合至pdi1基因座的pdi1,ura3和yiplac211的基因型cir0mata,leu2-3,leu2-112ubc4ura3yap3::ura3lys2hsp150:lys2(finnis等,2010,microbialcellfactories9:87)。本发明人观察到酿酒酵母dp9(当用编码白蛋白的质粒转化时)能够以比先前的菌株例如酿酒酵母db1更高的产量产生重组人白蛋白。酿酒酵母dp9的表征揭示了not4基因中的单个多核苷酸多态性(snp)。为了鉴定此snp是否有助于提高酿酒酵母dp9的蛋白质产量,将snp(t1285a,seqidno:3)恢复到野生型(即1285位的t,seqidno:1),如下所述。因此,突变not4蛋白(i429,seqidno:4)也恢复到野生型(f429,seqidno:2)。酿酒酵母not4基因位于染色体v上。通过将片段整合到not4基因座中、将碱基1285a变为t的过程将突变not4基因中的snp(t1285a)恢复到野生型,从而将突变not4蛋白(位置429处的i,seqidno:4)恢复至野生型not4蛋白(位置429处的f,seqidno:2)。这通过用pcr首先扩增合适的选择性标志物(kanmx)来实现,该选择性标志物(kanmx)具有修饰kanmx基因的5’和3’末端的诱变单链dna引物,以包括与not4开放阅读框下游区域相同的dna序列seqidno:25)。pcr引物是引物a和引物b,kanmx赋予对遗传霉素(g418)的抗性。引物a:5’-ccgtttataacgaaatgcaagaaaaaaaaatctcacccatttttttaaacctttgacgtggaaaggtatctgggaaaggtatctggctaatgaataatgccgtacgctgcaggtcg-3’(seqidno:26)引物b:5’-atatatcatgatgattattttctatgaattagtcattcttgcagcgctgacgctttcatacgttgtaacgagtaaatagactatactggtatatgctatgatcgatgaattcgagctcg-3’(seqidno:27)进行pcr反应以扩增来自质粒pdb5438的kanmx基因(图1.条件如下:100ng质粒pdb5438,0.5μm各引物,98℃初始变性30秒,然后在98℃、10秒循环35次,在30℃下退火10秒,在63℃下退火30秒,在72℃下延伸1.5分钟,然后在72℃下最终延伸4分钟,并冷却至4℃,使用appliedbiosystems2720热循环仪和nebq5热启动高保真dna聚合酶pcr试剂盒(m0493s),总反应体积50μl,根据制造商的说明。通过凝胶电泳分析产物5'-not43’utr-kanmx-not43’utr-3',发现其具有约1.6kb的预期大小。根据制造商的说明使用qiagenqiaquickpcr纯化试剂盒纯化扩增的pcr产物。纯化产物用于转化野生型not4(即seqidno:1)的酿酒酵母菌株。除了在将转化混合物离心的步骤之后,将小球重新悬浮在1mlyepd培养基中,然后转移到含有3mlyepd的30mlsterilin管中之外,使用sigma酵母转化试剂盒根据制造商的说明书进行转化。yepd(g/l):10克bactotm酵母提取物技术,20克bactotm蛋白胨,20克葡萄糖。将管在30℃下振荡(200rpm)孵育16小时。将sterilin试管以3,000rpm离心5分钟,倾析出上清液。然后将小球重悬于500μl1m山梨糖醇中。然后将约150μl接种到新鲜制备的g418琼脂平板(300μg/mlg418终浓度)上并在30℃下面朝下孵育5天。如下制备g418琼脂平板:0.17g酵母氮源(不含(nh4)2so4),0.1g谷氨酸(单钠盐,sigmag-1626),0.069gcsm-leu粉末,100mlh2o(用于冲洗的无菌水-无热原,低渗)和1gbacto琼脂加入到200ml高压灭菌的玻璃瓶中并混合。将瓶子在蒸锅中加热1小时,然后在水浴中冷却至55℃。加入0.6ml50mg/ml遗传霉素(g418)和4ml无菌50%右旋糖(w/v)并混合。将等份的混合物倒入培养皿中固化。从g418抗性转化体提取基因组dna并在第二次pcr中用作模板,使用引物mbp260和mbp266扩增含有not4基因3’部分、not43’utr、kanmx基因和下游序列的5'-not4-not43’utr-kanmx-not43’utr-3'片段(seqidno:28)。引物mbp260:5’-tgcaagatgtatagctcagg-3’(seqidno:29)引物mbp266:5’-tgcaaatcctgctatggtgg-3’(seqidno:30)pcr材料,方法和条件如上所述。通过凝胶电泳分析产物5'-not4-not43’utr-kanmx-not43’utr-3',发现其具有约3.3kb的预期大小。根据制造商的说明使用qiagenqiaquickpcr纯化试剂盒纯化扩增的pcr产物。使用上述转化方法将纯化的产物用于转化dp9[pdb2305]。酿酒酵母dp9是含有not4snp(t1285a,f429i)的菌株)。pdb2305是编码人白蛋白的质粒(图3)。g418琼脂平板上的生长和选择如上所述。从抗性菌落中提取基因组dna,使用引物mbp269和mbp287使用pcr扩增约4.5kb片段。使用相同的pcr试剂盒和条件,除了循环步骤变为98℃10秒,在62℃退火20秒并在72℃延伸2.5分钟之外。引物mbp269:5’-ataaaatcacctggcattacg-3’(seqidno:31)引物mbp287:5’-caacagttggatcacagtgg-3’(seqidno:32)如上所述清洁产品。使用lifetechnologiesbigdyeterminatorv3.1循环测序试剂盒按照制造商的说明书对产物进行测序,使用50μl总反应体积,50ng清洁的产物作为模板和4μl1μm引物(mbp274和mbp282。条件分别为:初始变性96℃1min。然后循环25次:变性96℃10秒,退火50℃5秒,延伸60℃4分钟,然后冷却至4℃。将测序反应物沉淀出来,并重新悬浮于hidi(appliedbiosystems)中并在appliedbiosystems3130xl遗传分析仪上分析。引物mbp274:5’-ctctgggccatcatactacc-3’(seqidno:33)引物mbp282:5’-gttgctgctgaataggaacc-3’(seqidno:34)测序分析显示三个转化体在1285位具有野生型t(f429),该菌株命名为prm5。两个转化体在位置1285处仍具有a(i429),该菌株被命名为psm7。将三种prm5转化体和两种psm7转化体在48孔微量滴定板(mtp)中培养,每孔含有0.5mlbmmd(0.17%(w/v)无氨基酸和硫酸铵(difco)的酵母氮基,37.8mm硫酸铵,36mm柠檬酸,126mm正磷酸氢二钠、ph6.5,2%(w/v)葡萄糖,用naoh调节至ph6.5)(每种转化体复制6次)。将mtp在30℃的潮湿箱中在振荡(200rpm)下孵育48小时。然后将来自每个孔的50μl细胞培养物转移到新的48孔mtp中,每个孔中含有0.45mlbmmd。新的mtp在30℃下在湿度室中在振荡(200rpm)下孵育96小时。通过离心分离上清液,并使用配备shimadzuvp7.3客户端服务器软件控制下的uv探测的lc2010hplc系统(shimadzu)通过gp-hplc分析测定重组白蛋白生产力。在7.8mmid×300mm长度的tskg3000swxl柱(tosohbioscience)上进行75μl的注射,具有6.0mmid×40mm长度的tsksw保护柱(tosohbioscience)。样品在25mm磷酸钠,100mm硫酸钠,0.05%(w/v)叠氮化钠,ph7.0中以1ml.min-1进行色谱分离,运行时间为20分钟。通过在280nm处的uv探测,通过相对于已知浓度的重组人白蛋白标准品(10mg/ml)的峰面积,对样品进行定量并校正其相对消光系数。如表2所示,snp的存在导致平均白蛋白产量增加18%。表2:白蛋白在prm5[pdb2305]和psm7[pdb2305]中的生产力prm5[pdb2305]psm7[pdb2305]白蛋白(相对产量)100%±8.3118%±10.1p值(t-检验):8.06e-07该工作在另外的酿酒酵母菌株中重复。简而言之,在酿酒酵母bxp10中将相同的snp恢复到野生型,并且将来自bxp10(含有snp,即bsm6[pdb2244])的白蛋白产量与来自bxp10菌株(其中snp转化为野生型(brm4[pdb2244]))的白蛋白产量进行比较。bxp10具有基因型mata,leu2-3,leu2-122,can1,pra1,ubc4,ura3,yap3::ura3,lys2,hsp150::lys2和pmt1::ura3。如表3所示,snp的存在导致白蛋白产量增加8%(每种菌株复制6次)。表3:白蛋白在brm4[pdb2244]和bsm6[pdb2244]中的生产力brm4[pdb2244]bsm6[pdb2244]白蛋白(相对产量)100%±8.9108%±8.1p值(t-检验):0.0348实施例2:酿酒酵母not4基因的突变增强了10l规模的重组蛋白质的产生通过在10l发酵罐(wigley等(2007)geneticengineeringnews.27(2):40-42)中的生长评估酿酒酵母prm5[pdb2305]和psm7[pdb2305]的生产力。使用mw11d培养基如wo97/33973的实施例1中所述进行发酵,除了使用wonderware监督控制和数据采集软件代替mfcs软件,在使用之前发酵容器还经历柠檬酸洗涤,痕量元素原料包含na2moo4.2h2o而不是na2moo4.5h2o,用氨溶液(比重0.901)将初始ph调节至ph6.0至6.4,初始将约1.0vvm(即1.0升)的无菌空气引入容器中而不是0.5vvm,在发酵过程中气流在一步中增加而不是两步以维持约1.0vvm的气流,比生长速率约为0.06h-1,指数常数(k)保持在0.06。通过gp.hplc针对重组白蛋白标准物测定重组白蛋白生产力。在这些条件下计算psm7[pdb2305]的重组白蛋白生产力比在相同条件下测量的prm5[pdb2305]的生产力高约13%(表4)。表4:白蛋白在10l规模的prm7[pdb2305]和psm7[pdb2305]中的生产力prm5[pdb2305]psm7[pdb2305]白蛋白(相对产量)100%±6113%±7p值(t-检验):0.009。n=4在10l规模的酿酒酵母bxp10中重复该工作,并将来自bxp10(含有snp,即bsm6[pdb2305])的白蛋白产量与来自bxp10菌株(其中snp转化为野生型(brm4[pdb2305]))的白蛋白产量进行比较。如表5所示,snp的存在导致白蛋白产量增加15%(每个菌株复制2次)。表5:白蛋白在10l规模的brm4[pdb2244]和bsm6[pdb2244]中的生产力brm4[pdb2244]bsm6[pdb2244]白蛋白(相对产量)100%±6115%±5p值(t-检验):0.038实施例3:酿酒酵母not4基因的缺失增强了重组蛋白的产生在酿酒酵母mt302/28bcir0(matα,leu2,pep4-3,finnis等1993,eur.j.biochem,212:201-210)中含有编码人血清白蛋白的质粒pdb2244的not4基因缺失。缺失通过用标记kanmx取代not4基因来实现。因此,所得菌株(mt302/2bδnot4)不能产生任何not4蛋白。然后培养菌株mt302/28b和菌株mt302/2bδnot4(每个菌株复制8次),并如实施例1所述测定白蛋白生产力。如表6所示,not4缺失导致白蛋白产量增加61%。表6:白蛋白在菌株mt302/28b[pdb2244]和菌株mt302/28bδnot4[pdb2244]中的生产力mt302/28b[pdb2244]mt302/28bδnot4[pdb2244]白蛋白(相对产量)100%±0.9161%±5.6p值(t-检验):5.9e-09实施例4:酿酒酵母not4基因的突变增强了白蛋白融合蛋白(白蛋白-il-1rα)和scfv(vhvl)-flag的表达在本实施例中表达的蛋白质是(a)与人血清白蛋白(seqidno:38)的c端基因融合的il-1ra和(b)scfv,在其c-末端处具有flag标签(dykddddk)的fitc8(seqidno:40)(evans等2010,proteinexpressionandpurification73:113-124,包括参考16和17,所有并入本文以供参考)。在准备表达白蛋白-il-1ra时,用限制酶acc65i和bamhi切割质粒pdb3936(图7),并用酶nsii和pvui切割质粒pdb5912(含有白蛋白-il-1ra表达盒)。图6中提供了pdb5912的质粒图谱,编码il-1rα的dna序列示于seqidno:37中。限制酶和缓冲液来自newenglandbiolabs。遵循制造商的说明,使用qiagenpcr纯化试剂盒纯化两种质粒消化物。将4株prm5[pdb2305],psm7[pdb2305],brm4[pdb2244]和bsm6[pdb2244]在摇瓶中在yepd培养基中培养并传代培养3次以固化其质粒(pdb2305或pdb2244)。将最终培养物的稀释物平铺到yepd上,然后将来自这些平板的单菌落贴到yepd上。将yepd贴片转移至bmmd平板并在30℃孵育;缺乏bmmd增长鉴定了已经质粒已固化的细胞。使用sigma酵母转化试剂盒根据制造商的说明书使用质粒pdb3029(用于表达scfv(vhvl)-flag(pdb3029的质粒图谱在图5中提供,编码scfv-flag的dna序列示于seqidno:39中)或用纯化的pdb3936和pdb5912限制性消化物(用于从间隙修复的质粒pdb3936:gr:pdb5912表达白蛋白-il-1ra)将固化的酵母菌株分别。细胞平铺在bmmd上并在30℃孵育5天。每种中的六个转化子在每孔含有0.5mlbmmd的48孔mtp中培养。平板在30℃和200rpm湿度箱中培养48小时。然后通过将50μl的每种培养物转移到新的平板中的450μlbmmd中进行传代培养。将该平板孵育96小时。通过离心分离上清液,并如实施例1中那样通过gp-hplc测定重组蛋白生产力(白蛋白-il-1ra或scfv)。如表7和表8所示,snp(f429i)的存在导致白蛋白-il-1ra的产量增加。与具有野生型not4(prm5)的菌株相比,在dp9衍生的菌株中,在not4(psm7)中含有snp的菌株的产量高8%(表7)。与具有野生型not4(brm4)菌株相比,在bxp10衍生的菌株中,在not4(bsm6)中含有snp的菌株中产量高24%(表8)。表7:白蛋白-il-1ra在prm5[pdb3936:gr:pdb5912]和psm7[pdb3936:gr:pdb5912]中的生产力p值(t-检验):p=0.008表8:白蛋白-il-1ra在brm4[pdb3936:gr:pdb5912]和bsm6[pdb3936:gr:pdb5912]中的生产力p值(t-检验):0.002如表9和表10所示,snp(f429i)的存在导致scfv-flag的产量增加。与具有野生型not4(prm5)的菌株相比,在dp9衍生的菌株中,在not4(psm7)中含有snp的菌株的产量高14%(表9)。与具有野生型not4(brm4)的菌株相比,在bxp10衍生的菌株中,在not4(bsm6)中含有snp的菌株的产量高19%(表10)。表9:scfv(vhvl)-flag在prm5[pdb3029]和psm7[pdb3029]中的生产力prm5[pdb3029]psm7[pdb3029]scfv(相对产量)100%+/-10114%+/-10p值(t-检验):p=0.004表10:scfv(vhvl)-flag在brm4[pdb3029]和bsm6[pdb3029]中的生产力brm4[pdb3029]bsm6[pdb3029]scfv(相对产量)100%+/-5119%+/-4p值(t-检验):p=1.65e-05序列表<110>诺维信生物制药丹麦公司(novozymesbiopharmadka/s)诺维信公司(novozymesa/s)p·拉迈亚(ramaiya,preethi)<120>改良的表达蛋白质的菌株(improvedproteinexpressionstrains)<130>127042-01520<150>us62/270,762<151>2015-12-22<150>us62/278,728<151>2016-01-14<150>ep16152977.1<151>2016-01-27<160>40<170>patentin版本3.5<210>1<211>1764<212>dna<213>酿酒酵母<400>1atgatgaatccacacgttcaagaaaatttgcaagcaatccacaacgccttaagcaatttt60gatacgtcatttttatcggaggatgaagaagattattgccctctttgtattgaaccaatg120gatattactgataaaaatttttttccttgtccctgtggttatcaaatttgtcaattttgc180tacaataatatcagacaaaatccagaattaaatggccgttgcccagcatgtcgtcgtaaa240tatgatgacgagaacgtcagatacgtcacattatctccggaggagttaaaaatggagaga300gccaagctcgctaggaaggagaaagaaagaaagcatagagaaaaagaacgtaaagagaat360gaatatacgaataggaaacatttatctggtaccagagttatccaaaagaatttagtgtac420gttgttggcatcaatcctcctgttccatacgaggaagttgcgcccactctgaaatctgaa480aaatattttggccaatatggtaagataaataagattgtggttaatagaaaaacaccccat540tctaacaacacaaccagcgagcattatcaccatcattcaccaggatatggcgtttacata600accttcggatccaaggacgatgctgcaagatgtatagctcaggtagacgggacgtatatg660gatggccgcctgatcaaagctgcctacggtactactaaatactgttcttcttatttaaga720ggattgccatgcccaaatcccaactgtatgtttttgcatgaacctggtgaagaagctgat780tcttttaataaaagagaactccacaataaacaacaagcgcaacagcaaagtggcggaact840gcattcactagatctggaatacacaacaatatatctaccagtaccgctggttcaaatacc900aatttactaagtgaaaatttcacaggcacaccttcaccggcggcgatgagggctcagtta960catcatgacagccatacaaacgctggaacaccggtattaacacctgctccggtccctgca1020gggtcaaatccttggggagttactcaatcagcaacacctgtaacctctatcaatctctct1080aaaaacagcagctccataaacttgccaacattaaatgattctctgggccatcatactacc1140cccacaacagagaataccatcacaagtacgacaactactaccaataccaatgctacaagt1200cactcccatggtagcaagaagaagcaatctcttgctgcagaggaatacaaagatccttat1260gacgcactagggaatgctgttgactttttggatgcaagactacattctctatcaaattat1320cagaagcgccctatatctatcaaatccaatattattgacgaagaaacttataaaaagtat1380ccgtctttgttttcttgggacaagattgaggcctcaaagaaaagtgacaatacattagcc1440aacaaacttgtggagatcctggctataaagccaatagactacactgcttctgtcgttcaa1500ttcttgcagagtgtcaatgttggtgtaaatgacaatattacaatcacagataatacgaaa1560actcccacccaaccaataagactgcaaaccgtctcacagcaaatccaaccaccattaaac1620gtcagtacccctccaccgggtatctttggtccacaacataaggttcctattcagcagcaa1680caaatgggtgatacaagctcaagaaattcctctgatttactaaatcaactaatcaacgga1740aggaaaattatcgccggtaattaa1764<210>2<211>587<212>prt<213>酿酒酵母<400>2metmetasnprohisvalglngluasnleuglnalailehisasnala151015leuserasnpheaspthrserpheleusergluaspglugluasptyr202530cysproleucysilegluprometaspilethrasplysasnphephe354045procysprocysglytyrglnilecysglnphecystyrasnasnile505560argglnasnprogluleuasnglyargcysproalacysargarglys65707580tyraspaspgluasnvalargtyrvalthrleuserproglugluleu859095lysmetgluargalalysleualaarglysglulysgluarglyshis100105110argglulysgluarglysgluasnglutyrthrasnarglyshisleu115120125serglythrargvalileglnlysasnleuvaltyrvalvalglyile130135140asnproprovalprotyrglugluvalalaprothrleulysserglu145150155160lystyrpheglyglntyrglylysileasnlysilevalvalasnarg165170175lysthrprohisserasnasnthrthrsergluhistyrhishishis180185190serproglytyrglyvaltyrilethrpheglyserlysaspaspala195200205alaargcysilealaglnvalaspglythrtyrmetaspglyargleu210215220ilelysalaalatyrglythrthrlystyrcyssersertyrleuarg225230235240glyleuprocysproasnproasncysmetpheleuhisgluprogly245250255gluglualaaspserpheasnlysarggluleuhisasnlysglngln260265270alaglnglnglnserglyglythralaphethrargserglyilehis275280285asnasnileserthrserthralaglyserasnthrasnleuleuser290295300gluasnphethrglythrproserproalaalametargalaglnleu305310315320hishisaspserhisthrasnalaglythrprovalleuthrproala325330335provalproalaglyserasnprotrpglyvalthrglnseralathr340345350provalthrserileasnleuserlysasnserserserileasnleu355360365prothrleuasnaspserleuglyhishisthrthrprothrthrglu370375380asnthrilethrserthrthrthrthrthrasnthrasnalathrser385390395400hisserhisglyserlyslyslysglnserleualaalagluglutyr405410415lysaspprotyraspalaleuglyasnalavalasppheleuaspala420425430argleuhisserleuserasntyrglnlysargproileserilelys435440445serasnileileaspglugluthrtyrlyslystyrproserleuphe450455460sertrpasplysileglualaserlyslysseraspasnthrleuala465470475480asnlysleuvalgluileleualailelysproileasptyrthrala485490495servalvalglnpheleuglnservalasnvalglyvalasnaspasn500505510ilethrilethraspasnthrlysthrprothrglnproileargleu515520525glnthrvalserglnglnileglnproproleuasnvalserthrpro530535540proproglyilepheglyproglnhislysvalproileglnglngln545550555560glnmetglyaspthrserserargasnserseraspleuleuasngln565570575leuileasnglyarglysileilealaglyasn580585<210>3<211>1764<212>dna<213>人工序列<220><223>具有t1285a突变的not4<400>3atgatgaatccacacgttcaagaaaatttgcaagcaatccacaacgccttaagcaatttt60gatacgtcatttttatcggaggatgaagaagattattgccctctttgtattgaaccaatg120gatattactgataaaaatttttttccttgtccctgtggttatcaaatttgtcaattttgc180tacaataatatcagacaaaatccagaattaaatggccgttgcccagcatgtcgtcgtaaa240tatgatgacgagaacgtcagatacgtcacattatctccggaggagttaaaaatggagaga300gccaagctcgctaggaaggagaaagaaagaaagcatagagaaaaagaacgtaaagagaat360gaatatacgaataggaaacatttatctggtaccagagttatccaaaagaatttagtgtac420gttgttggcatcaatcctcctgttccatacgaggaagttgcgcccactctgaaatctgaa480aaatattttggccaatatggtaagataaataagattgtggttaatagaaaaacaccccat540tctaacaacacaaccagcgagcattatcaccatcattcaccaggatatggcgtttacata600accttcggatccaaggacgatgctgcaagatgtatagctcaggtagacgggacgtatatg660gatggccgcctgatcaaagctgcctacggtactactaaatactgttcttcttatttaaga720ggattgccatgcccaaatcccaactgtatgtttttgcatgaacctggtgaagaagctgat780tcttttaataaaagagaactccacaataaacaacaagcgcaacagcaaagtggcggaact840gcattcactagatctggaatacacaacaatatatctaccagtaccgctggttcaaatacc900aatttactaagtgaaaatttcacaggcacaccttcaccggcggcgatgagggctcagtta960catcatgacagccatacaaacgctggaacaccggtattaacacctgctccggtccctgca1020gggtcaaatccttggggagttactcaatcagcaacacctgtaacctctatcaatctctct1080aaaaacagcagctccataaacttgccaacattaaatgattctctgggccatcatactacc1140cccacaacagagaataccatcacaagtacgacaactactaccaataccaatgctacaagt1200cactcccatggtagcaagaagaagcaatctcttgctgcagaggaatacaaagatccttat1260gacgcactagggaatgctgttgacattttggatgcaagactacattctctatcaaattat1320cagaagcgccctatatctatcaaatccaatattattgacgaagaaacttataaaaagtat1380ccgtctttgttttcttgggacaagattgaggcctcaaagaaaagtgacaatacattagcc1440aacaaacttgtggagatcctggctataaagccaatagactacactgcttctgtcgttcaa1500ttcttgcagagtgtcaatgttggtgtaaatgacaatattacaatcacagataatacgaaa1560actcccacccaaccaataagactgcaaaccgtctcacagcaaatccaaccaccattaaac1620gtcagtacccctccaccgggtatctttggtccacaacataaggttcctattcagcagcaa1680caaatgggtgatacaagctcaagaaattcctctgatttactaaatcaactaatcaacgga1740aggaaaattatcgccggtaattaa1764<210>4<211>587<212>prt<213>人工序列<220><223>具有phe429ile突变的not4<400>4metmetasnprohisvalglngluasnleuglnalailehisasnala151015leuserasnpheaspthrserpheleusergluaspglugluasptyr202530cysproleucysilegluprometaspilethrasplysasnphephe354045procysprocysglytyrglnilecysglnphecystyrasnasnile505560argglnasnprogluleuasnglyargcysproalacysargarglys65707580tyraspaspgluasnvalargtyrvalthrleuserproglugluleu859095lysmetgluargalalysleualaarglysglulysgluarglyshis100105110argglulysgluarglysgluasnglutyrthrasnarglyshisleu115120125serglythrargvalileglnlysasnleuvaltyrvalvalglyile130135140asnproprovalprotyrglugluvalalaprothrleulysserglu145150155160lystyrpheglyglntyrglylysileasnlysilevalvalasnarg165170175lysthrprohisserasnasnthrthrsergluhistyrhishishis180185190serproglytyrglyvaltyrilethrpheglyserlysaspaspala195200205alaargcysilealaglnvalaspglythrtyrmetaspglyargleu210215220ilelysalaalatyrglythrthrlystyrcyssersertyrleuarg225230235240glyleuprocysproasnproasncysmetpheleuhisgluprogly245250255gluglualaaspserpheasnlysarggluleuhisasnlysglngln260265270alaglnglnglnserglyglythralaphethrargserglyilehis275280285asnasnileserthrserthralaglyserasnthrasnleuleuser290295300gluasnphethrglythrproserproalaalametargalaglnleu305310315320hishisaspserhisthrasnalaglythrprovalleuthrproala325330335provalproalaglyserasnprotrpglyvalthrglnseralathr340345350provalthrserileasnleuserlysasnserserserileasnleu355360365prothrleuasnaspserleuglyhishisthrthrprothrthrglu370375380asnthrilethrserthrthrthrthrthrasnthrasnalathrser385390395400hisserhisglyserlyslyslysglnserleualaalagluglutyr405410415lysaspprotyraspalaleuglyasnalavalaspileleuaspala420425430argleuhisserleuserasntyrglnlysargproileserilelys435440445serasnileileaspglugluthrtyrlyslystyrproserleuphe450455460sertrpasplysileglualaserlyslysseraspasnthrleuala465470475480asnlysleuvalgluileleualailelysproileasptyrthrala485490495servalvalglnpheleuglnservalasnvalglyvalasnaspasn500505510ilethrilethraspasnthrlysthrprothrglnproileargleu515520525glnthrvalserglnglnileglnproproleuasnvalserthrpro530535540proproglyilepheglyproglnhislysvalproileglnglngln545550555560glnmetglyaspthrserserargasnserseraspleuleuasngln565570575leuileasnglyarglysileilealaglyasn580585<210>5<211>1755<212>dna<213>智人<400>5gatgcacacaagagtgaggttgctcatcggtttaaagatttgggagaagaaaatttcaaa60gccttggtgttgattgcctttgctcagtatcttcagcagtgtccatttgaagatcatgta120aaattagtgaatgaagtaactgaatttgcaaaaacatgtgttgctgatgagtcagctgaa180aattgtgacaaatcacttcataccctttttggagacaaattatgcacagttgcaactctt240cgtgaaacctatggtgaaatggctgactgctgtgcaaaacaagaacctgagagaaatgaa300tgcttcttgcaacacaaagatgacaacccaaacctcccccgattggtgagaccagaggtt360gatgtgatgtgcactgcttttcatgacaatgaagagacatttttgaaaaaatacttatat420gaaattgccagaagacatccttacttttatgccccggaactccttttctttgctaaaagg480tataaagctgcttttacagaatgttgccaagctgctgataaagctgcctgcctgttgcca540aagctcgatgaacttcgggatgaagggaaggcttcgtctgccaaacagagactcaagtgt600gccagtctccaaaaatttggagaaagagctttcaaagcatgggcagtagctcgcctgagc660cagagatttcccaaagctgagtttgcagaagtttccaagttagtgacagatcttaccaaa720gtccacacggaatgctgccatggagatctgcttgaatgtgctgatgacagggcggacctt780gccaagtatatctgtgaaaatcaagattcgatctccagtaaactgaaggaatgctgtgaa840aaacctctgttggaaaaatcccactgcattgccgaagtggaaaatgatgagatgcctgct900gacttgccttcattagctgctgattttgttgaaagtaaggatgtttgcaaaaactatgct960gaggcaaaggatgtcttcctgggcatgtttttgtatgaatatgcaagaaggcatcctgat1020tactctgtcgtgctgctgctgagacttgccaagacatatgaaaccactctagagaagtgc1080tgtgccgctgcagatcctcatgaatgctatgccaaagtgttcgatgaatttaaacctctt1140gtggaagagcctcagaatttaatcaaacaaaattgtgagctttttgagcagcttggagag1200tacaaattccagaatgcgctattagttcgttacaccaagaaagtaccccaagtgtcaact1260ccaactcttgtagaggtctcaagaaacctaggaaaagtgggcagcaaatgttgtaaacat1320cctgaagcaaaaagaatgccctgtgcagaagactatctatccgtggtcctgaaccagtta1380tgtgtgttgcatgagaaaacgccagtaagtgacagagtcaccaaatgctgcacagaatcc1440ttggtgaacaggcgaccatgcttttcagctctggaagtcgatgaaacatacgttcccaaa1500gagtttaatgctgaaacattcaccttccatgcagatatatgcacactttctgagaaggag1560agacaaatcaagaaacaaactgcacttgttgagctcgtgaaacacaagcccaaggcaaca1620aaagagcaactgaaagctgttatggatgatttcgcagcttttgtagagaagtgctgcaag1680gctgacgataaggagacctgctttgccgaggagggtaaaaaacttgttgctgcaagtcaa1740gctgccttaggctta1755<210>6<211>585<212>prt<213>智人<400>6aspalahislyssergluvalalahisargphelysaspleuglyglu151015gluasnphelysalaleuvalleuilealaphealaglntyrleugln202530glncysprophegluasphisvallysleuvalasngluvalthrglu354045phealalysthrcysvalalaaspgluseralagluasncysasplys505560serleuhisthrleupheglyasplysleucysthrvalalathrleu65707580arggluthrtyrglyglumetalaaspcyscysalalysglnglupro859095gluargasnglucyspheleuglnhislysaspaspasnproasnleu100105110proargleuvalargprogluvalaspvalmetcysthralaphehis115120125aspasnglugluthrpheleulyslystyrleutyrgluilealaarg130135140arghisprotyrphetyralaprogluleuleuphephealalysarg145150155160tyrlysalaalaphethrglucyscysglnalaalaasplysalaala165170175cysleuleuprolysleuaspgluleuargaspgluglylysalaser180185190seralalysglnargleulyscysalaserleuglnlyspheglyglu195200205argalaphelysalatrpalavalalaargleuserglnargphepro210215220lysalagluphealagluvalserlysleuvalthraspleuthrlys225230235240valhisthrglucyscyshisglyaspleuleuglucysalaaspasp245250255argalaaspleualalystyrilecysgluasnglnaspserileser260265270serlysleulysglucyscysglulysproleuleuglulysserhis275280285cysilealagluvalgluasnaspglumetproalaaspleuproser290295300leualaalaaspphevalgluserlysaspvalcyslysasntyrala305310315320glualalysaspvalpheleuglymetpheleutyrglutyralaarg325330335arghisproasptyrservalvalleuleuleuargleualalysthr340345350tyrgluthrthrleuglulyscyscysalaalaalaaspprohisglu355360365cystyralalysvalpheaspgluphelysproleuvalgluglupro370375380glnasnleuilelysglnasncysgluleuphegluglnleuglyglu385390395400tyrlyspheglnasnalaleuleuvalargtyrthrlyslysvalpro405410415glnvalserthrprothrleuvalgluvalserargasnleuglylys420425430valglyserlyscyscyslyshisproglualalysargmetprocys435440445alagluasptyrleuservalvalleuasnglnleucysvalleuhis450455460glulysthrprovalseraspargvalthrlyscyscysthrgluser465470475480leuvalasnargargprocyspheseralaleugluvalaspgluthr485490495tyrvalprolysglupheasnalagluthrphethrphehisalaasp500505510ilecysthrleuserglulysgluargglnilelyslysglnthrala515520525leuvalgluleuvallyshislysprolysalathrlysgluglnleu530535540lysalavalmetaspaspphealaalaphevalglulyscyscyslys545550555560alaaspasplysgluthrcysphealaglugluglylyslysleuval565570575alaalaserglnalaalaleuglyleu580585<210>7<211>1827<212>dna<213>智人<400>7atgaagtgggtaagctttatttcccttctttttctctttagctcggcttattccaggagc60ttggataaaagagatgcacacaagagtgaggttgctcatcggtttaaagatttgggagaa120gaaaatttcaaagccttggtgttgattgcctttgctcagtatcttcagcagtgtccattt180gaagatcatgtaaaattagtgaatgaagtaactgaatttgcaaaaacatgtgttgctgat240gagtcagctgaaaattgtgacaaatcacttcataccctttttggagacaaattatgcaca300gttgcaactcttcgtgaaacctatggtgaaatggctgactgctgtgcaaaacaagaacct360gagagaaatgaatgcttcttgcaacacaaagatgacaacccaaacctcccccgattggtg420agaccagaggttgatgtgatgtgcactgcttttcatgacaatgaagagacatttttgaaa480aaatacttatatgaaattgccagaagacatccttacttttatgccccggaactccttttc540tttgctaaaaggtataaagctgcttttacagaatgttgccaagctgctgataaagctgcc600tgcctgttgccaaagctcgatgaacttcgggatgaagggaaggcttcgtctgccaaacag660agactcaagtgtgccagtctccaaaaatttggagaaagagctttcaaagcatgggcagta720gctcgcctgagccagagatttcccaaagctgagtttgcagaagtttccaagttagtgaca780gatcttaccaaagtccacacggaatgctgccatggagatctgcttgaatgtgctgatgac840agggcggaccttgccaagtatatctgtgaaaatcaagattcgatctccagtaaactgaag900gaatgctgtgaaaaacctctgttggaaaaatcccactgcattgccgaagtggaaaatgat960gagatgcctgctgacttgccttcattagctgctgattttgttgaaagtaaggatgtttgc1020aaaaactatgctgaggcaaaggatgtcttcctgggcatgtttttgtatgaatatgcaaga1080aggcatcctgattactctgtcgtgctgctgctgagacttgccaagacatatgaaaccact1140ctagagaagtgctgtgccgctgcagatcctcatgaatgctatgccaaagtgttcgatgaa1200tttaaacctcttgtggaagagcctcagaatttaatcaaacaaaattgtgagctttttgag1260cagcttggagagtacaaattccagaatgcgctattagttcgttacaccaagaaagtaccc1320caagtgtcaactccaactcttgtagaggtctcaagaaacctaggaaaagtgggcagcaaa1380tgttgtaaacatcctgaagcaaaaagaatgccctgtgcagaagactatctatccgtggtc1440ctgaaccagttatgtgtgttgcatgagaaaacgccagtaagtgacagagtcaccaaatgc1500tgcacagaatccttggtgaacaggcgaccatgcttttcagctctggaagtcgatgaaaca1560tacgttcccaaagagtttaatgctgaaacattcaccttccatgcagatatatgcacactt1620tctgagaaggagagacaaatcaagaaacaaactgcacttgttgagctcgtgaaacacaag1680cccaaggcaacaaaagagcaactgaaagctgttatggatgatttcgcagcttttgtagag1740aagtgctgcaaggctgacgataaggagacctgctttgccgaggagggtaaaaaacttgtt1800gctgcaagtcaagctgccttaggctta1827<210>8<211>609<212>prt<213>智人<220><221>信号<222>(1)..(18)<220><221>前肽<222>(19)..(24)<400>8metlystrpvalthrpheileserleuleupheleupheserserala151015tyrserargglyvalpheargargaspalahislyssergluvalala202530hisargphelysaspleuglyglugluasnphelysalaleuvalleu354045ilealaphealaglntyrleuglnglncysprophegluasphisval505560lysleuvalasngluvalthrgluphealalysthrcysvalalaasp65707580gluseralagluasncysasplysserleuhisthrleupheglyasp859095lysleucysthrvalalathrleuarggluthrtyrglyglumetala100105110aspcyscysalalysglngluprogluargasnglucyspheleugln115120125hislysaspaspasnproasnleuproargleuvalargprogluval130135140aspvalmetcysthralaphehisaspasnglugluthrpheleulys145150155160lystyrleutyrgluilealaargarghisprotyrphetyralapro165170175gluleuleuphephealalysargtyrlysalaalaphethrglucys180185190cysglnalaalaasplysalaalacysleuleuprolysleuaspglu195200205leuargaspgluglylysalaserseralalysglnargleulyscys210215220alaserleuglnlyspheglygluargalaphelysalatrpalaval225230235240alaargleuserglnargpheprolysalagluphealagluvalser245250255lysleuvalthraspleuthrlysvalhisthrglucyscyshisgly260265270aspleuleuglucysalaaspaspargalaaspleualalystyrile275280285cysgluasnglnaspserileserserlysleulysglucyscysglu290295300lysproleuleuglulysserhiscysilealagluvalgluasnasp305310315320glumetproalaaspleuproserleualaalaaspphevalgluser325330335lysaspvalcyslysasntyralaglualalysaspvalpheleugly340345350metpheleutyrglutyralaargarghisproasptyrservalval355360365leuleuleuargleualalysthrtyrgluthrthrleuglulyscys370375380cysalaalaalaaspprohisglucystyralalysvalpheaspglu385390395400phelysproleuvalglugluproglnasnleuilelysglnasncys405410415gluleuphegluglnleuglyglutyrlyspheglnasnalaleuleu420425430valargtyrthrlyslysvalproglnvalserthrprothrleuval435440445gluvalserargasnleuglylysvalglyserlyscyscyslyshis450455460proglualalysargmetprocysalagluasptyrleuservalval465470475480leuasnglnleucysvalleuhisglulysthrprovalserasparg485490495valthrlyscyscysthrgluserleuvalasnargargprocysphe500505510seralaleugluvalaspgluthrtyrvalprolysglupheasnala515520525gluthrphethrphehisalaaspilecysthrleuserglulysglu530535540argglnilelyslysglnthralaleuvalgluleuvallyshislys545550555560prolysalathrlysgluglnleulysalavalmetaspasppheala565570575alaphevalglulyscyscyslysalaaspasplysgluthrcysphe580585590alaglugluglylyslysleuvalalaalaserglnalaalaleugly595600605leu<210>9<211>2108<212>prt<213>酿酒酵母<400>9metleuseralathrtyrargaspleuasnthralaserasnleuglu151015thrserlysglulysglnalaalaglnilevalilealaglnileser202530leuleuphethrthrleuasnasnaspasnphegluservalgluarg354045gluilearghisileleuaspargserservalaspiletyrilelys505560valtrpgluargleuleuthrleuserserargaspileleuglnala65707580glylyspheleuleuglngluasnleuleuhisargleuleuleuglu859095phealalysaspleuprolyslysserthraspleuilegluleuleu100105110lysgluargthrpheasnasnglnglupheglnlysglnthrglyile115120125thrleuserleupheileaspleupheasplysseralaasnlysasp130135140ileilegluserleuaspargserserglnileasnaspphelysthr145150155160ilelysmetasnhisthrasntyrleuargasnphepheleuglnthr165170175thrprogluthrleugluserasnleuargaspleuleuhisserleu180185190gluglygluserleuasnaspleuleualaleuleuleusergluile195200205leuserproglyserglnasnleuglnasnaspprothrargsertrp210215220leuthrproprometvalleuaspalathrasnargglyasnvalile225230235240alaargserileserserleuglnalaasnglnileasntrpasnarg245250255valpheasnleumetserthrlystyrpheleuseralaproleumet260265270prothrthralaserleusercysleuphealaalaleuhisaspgly275280285provalileaspgluphephesercysasptrplysvalilephelys290295300leuaspleualaileglnleuhislystrpservalglnasnglycys305310315320pheaspleuleuasnalagluglythrarglysvalsergluthrile325330335proasnthrlysglnserleuleutyrleuleuserilealaserleu340345350asnleugluleupheleuglnargglugluleuseraspglypromet355360365leualatyrpheglnglucysphephegluasppheasntyralapro370375380glutyrleuileleualaleuvallysglumetlysargphevalleu385390395400leuilegluasnargthrvalileaspgluileleuilethrleuleu405410415ileglnvalhisasnlysserproserserphelysaspvalileser420425430thrilethraspaspserlysilevalaspalaalalysileileile435440445asnseraspaspalaproilealaasnpheleulysserleuleuasp450455460thrglyargleuaspthrvalileasnlysleupropheasngluala465470475480phelysileleuprocysalaargglnileglytrpgluglypheasp485490495thrpheleulysthrlysvalserproserasnvalaspvalvalleu500505510gluserleugluvalglnthrlysmetthraspthrasnthrprophe515520525argserleulysthrpheaspleuphealaphehisserleuileglu530535540valleuasnlyscysproleuaspvalleuglnleuglnargpheglu545550555560serleuglupheserleuleuilealapheproargleuileasnphe565570575glypheglyhisaspglualaileleualaasnglyaspilealagly580585590ileasnasnaspileglulysglumetglnasntyrleuglnlysmet595600605tyrserglygluleualailelysaspvalilegluleuleuargarg610615620leuargaspseraspleuproargaspglngluvalphethrcysile625630635640thrhisalavalilealagluserthrphepheglnasptyrproleu645650655aspalaleualathrthrservalleupheglysermetileleuphe660665670glnleuleuargglyphevalleuaspvalalapheargileilemet675680685argphealalysgluproprogluserlysmetphelysphealaval690695700glnalailetyralapheargileargleualaglutyrproglntyr705710715720cyslysaspleuleuargaspvalproalaleulysserglnalagln725730735valtyrglnserilevalglualaalathrleualaasnalaprolys740745750gluargserargprovalglnglumetileproleulysphepheala755760765valaspgluvalsercysglnileasnglngluglyalaprolysasp770775780valvalglulysvalleuphevalleuasnasnvalthrleualaasn785790795800leuasnasnlysvalaspgluleulyslysserleuthrproasntyr805810815phesertrppheserthrtyrleuvalthrglnargalalysthrglu820825830proasntyrhisaspleutyrserlysvalilevalalametglyser835840845glyleuleuhisglnphemetvalasnvalthrleuargglnleuphe850855860valleuleuserthrlysaspgluglnalaileasplyslyshisleu865870875880lysasnleualasertrpleuglycysilethrleualaleuasnlys885890895proilelyshislysasnilealapheargglumetleuilegluala900905910tyrlysgluasnargleugluilevalvalprophevalthrlysile915920925leuglnargalasergluserlysilephelysproproasnprotrp930935940thrvalglyileleulysleuleuilegluleuasnglulysalaasn945950955960trplysleuserleuthrphegluvalgluvalleuleulysserphe965970975asnleuthrthrlysserleulysproserasnpheileasnthrpro980985990gluvalilegluthrleuserglyalaleuglyserilethrleuglu99510001005glnglnglnthrgluglnglnargglnileileleumetglngln101010151020hisglnglnglnmetleuiletyrglnglnargglnglnglngln102510301035glnglnargglnglnglnglnglnhishisileseralaasnthr104010451050ilealaaspglnglnalaalapheglyglygluglyserileser105510601065hisaspasnpropheasnasnleuleuglyserthrilepheval107010751080thrhisproaspleulysargvalpheglnmetalaleualalys108510901095servalarggluileleuleugluvalvalglulyssersergly110011051110ilealavalvalthrthrthrlysileileleulysasppheala111511201125thrgluvalaspgluserlysleulysthralaalaileilemet113011351140valarghisleualaglnserleualaargalathrserileglu114511501155proleulysgluglyileargserthrmetglnserleualapro116011651170asnleumetserleuserserserproalaglugluleuaspthr117511801185alaileasngluasnileglyilealaleuvalleuileglulys119011951200alasermetasplysserthrglnaspleualaaspglnleumet120512101215glnalailealaileargargtyrhislysgluargargalaasp122012251230glnpropheilethrglnasnthrasnprotyrserleuserleu123512401245progluproleuglyleulysasnthrglyvalthrproglngln125012551260pheargvaltyrgluglupheglylysasnileproasnleuasp126512701275valileprophealaglyleuproalahisalaproprometthr128012851290glnasnvalglyleuthrglnproglnglnglnglnalaglnmet129513001305prothrglnileleuthrsergluglnileargalaglnglngln131013151320glnglnglnleuglnlysserargleuasnglnproserglnser132513301335alaglnproproglyvalasnvalproasnproglnglyglyile134013451350alaalavalglnseraspleugluglnasnglnargvalleuval135513601365hisleumetaspileleuvalserglnilelysgluasnalathr137013751380lysasnasnleualagluleuglyaspglnasnglnilelysthr138513901395ileilepheglnileleuthrpheilealalysseralaglnlys140014051410aspglnleualaleulysvalserglnalavalvalasnserleu141514201425phealathrsergluserproleucysarggluvalleuserleu143014351440leuleuglulysleucysserleuserleuvalalaarglysasp144514501455valvaltrptrpleuvaltyralaleuaspserarglyspheasn146014651470valprovalileargserleuleugluvalasnleuileaspala147514801485thrgluleuaspasnvalleuvalthralametlysasnlysmet149014951500gluasnserthrgluphealametlysleuileglnasnthrval150515101515leuseraspaspproileleumetargmetasppheilelysthr152015251530leugluhisleualasersergluaspgluasnvallyslysphe153515401545ilelysgluphegluaspthrlysilemetprovalarglysgly155015551560thrlysthrthrargthrglulysleutyrleuvalphethrglu156515701575trpvallysleuleuglnargvalgluasnasnaspvalilethr158015851590thrvalpheilelysglnleuvalglulysglyvalileserasp159516001605thraspasnleuleuthrphevallysserserleugluleuser161016151620valserserphelysgluseraspprothraspgluvalpheile162516301635alaileaspalaleuglyserleuileilelysleuleuileleu164016451650glnglyphelysaspaspthrargargasptyrileasnalaile165516601665pheservalilevalleuvalphealalysasphisserglnglu167016751680glythrthrpheasngluargprotyrpheargleupheserasn168516901695ileleutyrglutrpalathrileargthrhisasnphevalarg170017051710ileseraspserserthrargglngluleuileglupheaspser171517201725valphetyrasnthrpheserglytyrleuhisalaleuglnpro173017351740phealapheproglypheserphealatrpvalthrleuleuser174517501755hisargmetleuleuproilemetleuargleuproasnlysile176017651770glytrpglulysleumetleuleuileileaspleuphelysphe177517801785leuaspglntyrthrserlyshisalavalseraspalavalser179017951800valvaltyrlysglythrleuargvalileleuglyileserasn180518101815aspmetproserpheleuilegluasnhistyrgluleumetasn182018251830asnleuproprothrtyrpheglnleulysasnvalileleuser183518401845alaileprolysasnmetthrvalproasnprotyraspvalasp185018551860leuasnmetgluaspileproalacyslysgluleuprogluval186518701875phepheaspprovalileaspleuhisserleulyslysproval188018851890aspasntyrleuargileproserasnserleuleuargthrile189519001905leuseralailetyrlysaspthrtyraspilelyslysglyval191019151920glytyrasppheleuservalaspserlysleuileargalaile192519301935valleuhisvalglyileglualaglyileglutyrlysargthr194019451950serserasnalavalpheasnthrlyssersertyrtyrthrleu195519601965leupheasnleuileglnasnglyserileglumetlystyrgln197019751980ileileleuserilevalgluglnleuargtyrproasnilehis198519901995thrtyrtrppheserphevalleumetasnmetphelysserasp200020052010glutrpasnaspglnlysleugluvalglngluileileleuarg201520202025asnpheleulysargileilevalasnlysprohisthrtrpgly203020352040valservalphephethrglnleuileasnasnasnaspileasn204520502055leuleuaspleuprophevalglnservalprogluilelysleu206020652070ileleuglnglnleuvallystyrserlyslystyrthrthrser207520802085gluglnaspaspglnseralathrileasnargargglnthrpro209020952100leuglnserasnala2105<210>10<211>31<212>prt<213>人工序列<220><223>glp-1片段<220><221>misc<222>(31)..(31)<223>xaa=gly或-nh2<400>10hisalagluglythrphethrseraspvalsersertyrleuglugly151015glnalaalalysglupheilealatrpleuvallysglyargxaa202530<210>11<211>61<212>prt<213>人工序列<220><223>glp-1片段的串联重复<220><221>misc_特征<222>(61)..(61)<223>xaa=gly或-nh2<400>11hisglygluglythrphethrseraspvalsersertyrleuglugly151015glnalaalalysglupheilealatrpleuvallysglyarghisgly202530gluglythrphethrseraspvalsersertyrleugluglyglnala354045alalysglupheilealatrpleuvallysglyargxaa505560<210>12<211>645<212>prt<213>人工序列<220><223>阿必鲁肽(融合到人血清白蛋白n-末端的glp-1串联重复)<400>12hisglygluglythrphethrseraspvalsersertyrleuglugly151015glnalaalalysglupheilealatrpleuvallysglyarghisgly202530gluglythrphethrseraspvalsersertyrleugluglyglnala354045alalysglupheilealatrpleuvallysglyargaspalahislys505560sergluvalalahisargphelysaspleuglyglugluasnphelys65707580alaleuvalleuilealaphealaglntyrleuglnglncysprophe859095gluasphisvallysleuvalasngluvalthrgluphealalysthr100105110cysvalalaaspgluseralagluasncysasplysserleuhisthr115120125leupheglyasplysleucysthrvalalathrleuarggluthrtyr130135140glyglumetalaaspcyscysalalysglngluprogluargasnglu145150155160cyspheleuglnhislysaspaspasnproasnleuproargleuval165170175argprogluvalaspvalmetcysthralaphehisaspasngluglu180185190thrpheleulyslystyrleutyrgluilealaargarghisprotyr195200205phetyralaprogluleuleuphephealalysargtyrlysalaala210215220phethrglucyscysglnalaalaasplysalaalacysleuleupro225230235240lysleuaspgluleuargaspgluglylysalaserseralalysgln245250255argleulyscysalaserleuglnlyspheglygluargalaphelys260265270alatrpalavalalaargleuserglnargpheprolysalagluphe275280285alagluvalserlysleuvalthraspleuthrlysvalhisthrglu290295300cyscyshisglyaspleuleuglucysalaaspaspargalaaspleu305310315320alalystyrilecysgluasnglnaspserileserserlysleulys325330335glucyscysglulysproleuleuglulysserhiscysilealaglu340345350valgluasnaspglumetproalaaspleuproserleualaalaasp355360365phevalgluserlysaspvalcyslysasntyralaglualalysasp370375380valpheleuglymetpheleutyrglutyralaargarghisproasp385390395400tyrservalvalleuleuleuargleualalysthrtyrgluthrthr405410415leuglulyscyscysalaalaalaaspprohisglucystyralalys420425430valpheaspgluphelysproleuvalglugluproglnasnleuile435440445lysglnasncysgluleuphegluglnleuglyglutyrlysphegln450455460asnalaleuleuvalargtyrthrlyslysvalproglnvalserthr465470475480prothrleuvalgluvalserargasnleuglylysvalglyserlys485490495cyscyslyshisproglualalysargmetprocysalagluasptyr500505510leuservalvalleuasnglnleucysvalleuhisglulysthrpro515520525valseraspargvalthrlyscyscysthrgluserleuvalasnarg530535540argprocyspheseralaleugluvalaspgluthrtyrvalprolys545550555560glupheasnalagluthrphethrphehisalaaspilecysthrleu565570575serglulysgluargglnilelyslysglnthralaleuvalgluleu580585590vallyshislysprolysalathrlysgluglnleulysalavalmet595600605aspaspphealaalaphevalglulyscyscyslysalaaspasplys610615620gluthrcysphealaglugluglylyslysleuvalalaalasergln625630635640alaalaleuglyleu645<210>13<211>24<212>prt<213>人工序列<220><223>kex前导序列<400>13metlystrpvalserpheileserleuleupheleupheserserala151015tyrserargserleuasplysarg20<210>14<211>24<212>prt<213>人工序列<220><223>修饰的kex前导序列<400>14metlystrpvalserpheileserleuleupheleupheserserala151015tyrserglyserleuasplysarg20<210>15<211>27<212>prt<213>人工序列<220><223>交配因子α-人血清白蛋白融合前导序列<400>15metlystrpvalserpheileserleuleupheleupheserserala151015tyrserargserleuasplysargaspalahis2025<210>16<211>5<212>prt<213>人工序列<220><223>五肽基序<220><221>misc_特征<222>(1)..(1)<223>xaa=phe,trp或tyr<220><221>misc_特征<222>(2)..(2)<223>xaa=ile,leu,val,ala或met<220><221>misc_特征<222>(3)..(3)<223>xaa=leu,val,ala或met<220><221>misc_特征<222>(4)..(4)<223>xaa=ser或thr<220><221>misc_特征<222>(5)..(5)<223>xaa=ile,val,ala或met<400>16xaaxaaxaaxaaxaa15<210>17<211>19<212>prt<213>人工序列<220><223>前导序列<220><221>misc_特征<222>(5)..(5)<223>xaa=phe,trp或tyr<220><221>misc_特征<222>(6)..(6)<223>xaa=ile,leu,val,ala或met<220><221>misc_特征<222>(7)..(7)<223>xaa=leu,val,ala或met<220><221>misc_特征<222>(8)..(8)<223>xaa=ser或thr<220><221>misc_特征<222>(9)..(9)<223>xaa=ile,val,ala或met<400>17metlystrpvalxaaxaaxaaxaaxaaleupheleupheserserala151015tyrserarg<210>18<211>24<212>prt<213>人工序列<220><223>前导序列<220><221>misc_特征<222>(5)..(5)<223>xaa=phe,trp或tyr<220><221>misc_特征<222>(6)..(6)<223>xaa=ile,leu,val,ala或met<220><221>misc_特征<222>(7)..(7)<223>xaa=leu,val,ala或met<220><221>misc_特征<222>(8)..(8)<223>xaa=ser或thr<220><221>misc_特征<222>(9)..(9)<223>xaa=ile,val,ala或met<220><221>前肽<222>(20)..(24)<220><221>misc_特征<222>(20)..(20)<223>xaa=gly或ser<220><221>misc_特征<222>(21)..(21)<223>xaa=val或leu<220><221>misc_特征<222>(22)..(22)<223>xaa=phe或asp<220><221>misc_特征<222>(23)..(23)<223>xaa=arg或lys<220><221>misc_特征<222>(24)..(24)<223>xaa=arg或lys<400>18metlystrpvalxaaxaaxaaxaaxaaleupheleupheserserala151015tyrserargxaaxaaxaaxaaxaa20<210>19<211>24<212>prt<213>人工序列<220><223>前导序列<220><221>信号<222>(1)..(19)<223>前序列<220><221>前肽<222>(20)..(24)<220><221>misc_特征<222>(20)..(20)<223>xaa=gly或ser<220><221>misc_特征<222>(21)..(21)<223>xaa=val或leu<220><221>misc_特征<222>(22)..(22)<223>xaa=phe或asp<220><221>misc_特征<222>(23)..(23)<223>xaa=arg或lys<220><221>misc_特征<222>(24)..(24)<223>xaa=arg或lys<400>19metlystrpvalpheilevalserileleupheleupheserserala151015tyrserargxaaxaaxaaxaaxaa20<210>20<211>24<212>prt<213>人工序列<220><223>前导序列<400>20metlystrpvalpheilevalserileleupheleupheserserala151015tyrserargserleuasplysarg20<210>21<211>522<212>prt<213>酿酒酵母<400>21metlyspheseralaglyalavalleusertrpserserleuleuleu151015alaserservalphealaglnglnglualavalalaprogluaspser202530alavalvallysleualathraspserpheasnglutyrileglnser354045hisaspleuvalleualagluphephealaprotrpcysglyhiscys505560lysasnmetalaproglutyrvallysalaalagluthrleuvalglu65707580lysasnilethrleualaglnileaspcysthrgluasnglnaspleu859095cysmetgluhisasnileproglypheproserleulysilephelys100105110asnseraspvalasnasnserileasptyrgluglyproargthrala115120125glualailevalglnphemetilelysglnserglnproalavalala130135140valvalalaaspleuproalatyrleualaasngluthrphevalthr145150155160provalilevalglnserglylysileaspalaasppheasnalathr165170175phetyrsermetalaasnlyshispheasnasptyraspphevalser180185190alagluasnalaaspaspaspphelysleuseriletyrleuproser195200205alametaspgluprovalvaltyrasnglylyslysalaaspileala210215220aspalaaspvalpheglulystrpleuglnvalglualaleuprotyr225230235240pheglygluileaspglyservalphealaglntyrvalglusergly245250255leuproleuglytyrleuphetyrasnaspgluglugluleugluglu260265270tyrlysproleuphethrgluleualalyslysasnargglyleumet275280285asnphevalserileaspalaarglyspheglyarghisalaglyasn290295300leuasnmetlysgluglnpheproleuphealailehisaspmetthr305310315320gluaspleulystyrglyleuproglnleusergluglualapheasp325330335gluleuserasplysilevalleugluserlysalailegluserleu340345350vallysasppheleulysglyaspalaserproilevallyssergln355360365gluilephegluasnglnaspserservalpheglnleuvalglylys370375380asnhisaspgluilevalasnaspprolyslysaspvalleuvalleu385390395400tyrtyralaprotrpcysglyhiscyslysargleualaprothrtyr405410415glngluleualaaspthrtyralaasnalathrseraspvalleuile420425430alalysleuasphisthrgluasnaspvalargglyvalvalileglu435440445glytyrprothrilevalleutyrproglyglylyslyssergluser450455460valvaltyrglnglyserargserleuaspserleupheasppheile465470475480lysgluasnglyhispheaspvalaspglylysalaleutyrgluglu485490495alaglnglulysalaalagluglualaaspalaaspalagluleuala500505510aspglugluaspalailehisaspgluleu515520<210>22<211>563<212>prt<213>酿酒酵母<400>22metargleuargthralailealathrleucysleuthralaphethr151015seralathrserasnasnsertyrilealathraspglnthrglnasn202530alapheasnaspthrhisphecyslysvalaspargasnasphisval354045serprosercysasnvalthrpheasngluleuasnalaileasnglu505560asnileargaspaspleuseralaleuleulysseraspphephelys65707580tyrpheargleuaspleutyrlysglncysserphetrpaspalaasn859095aspglyleucysleuasnargalacysservalaspvalvalgluasp100105110trpaspthrleuproglutyrtrpglnprogluileleuglyserphe115120125asnasnaspthrmetlysglualaaspaspseraspaspglucyslys130135140pheleuaspglnleucysglnthrserlyslysprovalaspileglu145150155160aspthrileasntyrcysaspvalasnasppheasnglylysasnala165170175valleuileaspleuthralaasnprogluargphethrglytyrgly180185190glylysglnalaglyglniletrpserthriletyrglnaspasncys195200205phethrileglygluthrglygluserleualalysaspalaphetyr210215220argleuvalserglyphehisalaserileglythrhisleuserlys225230235240glutyrleuasnthrlysthrglylystrpgluproasnleuaspleu245250255phemetalaargileglyasnpheproaspargvalthrasnmettyr260265270pheasntyralavalvalalalysalaleutrplysileglnprotyr275280285leuproglupheserphecysaspleuvalasnlysgluilelysasn290295300lysmetaspasnvalileserglnleuaspthrlysilepheasnglu305310315320aspleuvalphealaasnaspleuserleuthrleulysaspgluphe325330335argserargphelysasnvalthrlysilemetaspcysvalglncys340345350aspargcysargleutrpglylysileglnthrthrglytyralathr355360365alaleulysileleuphegluileasnaspalaaspgluphethrlys370375380glnhisilevalglylysleuthrlystyrgluleuilealaleuleu385390395400glnthrpheglyargleusergluserilegluservalasnmetphe405410415glulysmettyrglylysargleuasnglysergluasnargleuser420425430serphepheglnasnasnphepheasnileleulysglualaglylys435440445serileargtyrthrilegluasnileasnserthrlysgluglylys450455460lyslysthrasnasnserglnserhisvalpheaspaspleulysmet465470475480prolysalagluilevalproargproserasnglythrvalasnlys485490495trplyslysalatrpasnthrgluvalasnasnvalleuglualaphe500505510argpheiletyrargsertyrleuaspleuproargasniletrpglu515520525leuserleumetlysvaltyrlysphetrpasnlyspheileglyval530535540alaasptyrvalserglugluthrarggluproilesertyrlysleu545550555560aspilegln<210>23<211>2445<212>dna<213>酿酒酵母<400>23atgaaagtgaggaaatatattactttatgcttttggtgggccttttcaacatccgctctt60gtatcatcacaacaaattccattgaaggaccatacgtcacgacagtattttgctgtagaa120agcaatgaaacattatcccgcttggaggaaatgcatccaaattggaaatatgaacatgat180gttcgagggctaccaaaccattatgttttttcaaaagagttgctaaaattgggcaaaaga240tcatcattagaagagttacagggggataacaacgaccacatattatctgtccatgattta300ttcccgcgtaacgacctatttaagagactaccggtgcctgctccaccaatggactcaagc360ttgttaccggtaaaagaagctgaggataaactcagcataaatgatccgctttttgagagg420cagtggcacttggtcaatccaagttttcctggcagtgatataaatgttcttgatctgtgg480tacaataatattacaggcgcaggggtcgtggctgccattgttgatgatggccttgactac540gaaaatgaagacttgaaggataatttttgcgctgaaggttcttgggatttcaacgacaat600accaatttacctaaaccaagattatctgatgactaccatggtacgagatgtgcaggtgaa660atagctgccaaaaaaggtaacaatttttgcggtgtcggggtaggttacaacgctaaaatc720tcaggcataagaatcttatccggtgatatcactacggaagatgaagctgcgtccttgatt780tatggtctagacgtaaacgatatatattcatgctcatggggtcccgctgatgacggaaga840catttacaaggccctagtgacctggtgaaaaaggctttagtaaaaggtgttactgaggga900agagattccaaaggagcgatttacgtttttgccagtggaaatggtggaactcgtggtgat960aattgcaattacgacggctatactaattccatatattctattactattggggctattgat1020cacaaagatctacatcctccttattccgaaggttgttccgccgtcatggcagtcacgtat1080tcttcaggttcaggcgaatatattcattcgagtgatatcaacggcagatgcagtaatagc1140cacggtggaacgtctgcggctgctccattagctgccggtgtttacactttgttactagaa1200gccaacccaaacctaacttggagagacgtacagtatttatcaatcttgtctgcggtaggg1260ttagaaaagaacgctgacggagattggagagatagcgccatggggaagaaatactctcat1320cgctatggctttggtaaaatcgatgcccataagttaattgaaatgtccaagacctgggag1380aatgttaacgcacaaacctggttttacctgccaacattgtatgtttcccagtccacaaac1440tccacggaagagacattagaatccgtcataaccatatcagaaaaaagtcttcaagatgct1500aacttcaagagaattgagcacgtcacggtaactgtagatattgatacagaaattagggga1560actacgactgtcgatttaatatcaccagcggggataatttcaaaccttggcgttgtaaga1620ccaagagatgtttcatcagagggattcaaagactggacattcatgtctgtagcacattgg1680ggtgagaacggcgtaggtgattggaaaatcaaggttaagacaacagaaaatggacacagg1740attgacttccacagttggaggctgaagctctttggggaatccattgattcatctaaaaca1800gaaactttcgtctttggaaacgataaagaggaggttgaaccagctgctacagaaagtacc1860gtatcacaatattctgccagttcaacttctatttccatcagcgctacttctacatcttct1920atctcaattggtgtggaaacgtcggccattccccaaacgactactgcgagtaccgatcct1980gattctgatccaaacactcctaaaaaactttcctctcctaggcaagccatgcattatttt2040ttaacaatatttttgattggcgccacatttttggtgttatacttcatgttttttatgaaa2100tcaaggagaaggatcagaaggtcaagagcggaaacgtatgaattcgatatcattgataca2160gactctgagtacgattctactttggacaatggaacttccggaattactgagcccgaagag2220gttgaggacttcgattttgatttgtccgatgaagaccatcttgcaagtttgtcttcatca2280gaaaacggtgatgctgaacatacaattgatagtgtactaacaaacgaaaatccatttagt2340gaccctataaagcaaaagttcccaaatgacgccaacgcagaatctgcttccaataaatta2400caagaattacagcctgatgttcctccatcttccggacgatcgtga2445<210>24<211>814<212>prt<213>酿酒酵母<400>24metlysvalarglystyrilethrleucysphetrptrpalapheser151015thrseralaleuvalserserglnglnileproleulysasphisthr202530serargglntyrphealavalgluserasngluthrleuserargleu354045gluglumethisproasntrplystyrgluhisaspvalargglyleu505560proasnhistyrvalpheserlysgluleuleulysleuglylysarg65707580serserleuglugluleuglnglyaspasnasnasphisileleuser859095valhisaspleupheproargasnaspleuphelysargleuproval100105110proalaproprometaspserserleuleuprovallysglualaglu115120125asplysleuserileasnaspproleuphegluargglntrphisleu130135140valasnproserpheproglyseraspileasnvalleuaspleutrp145150155160tyrasnasnilethrglyalaglyvalvalalaalailevalaspasp165170175glyleuasptyrgluasngluaspleulysaspasnphecysalaglu180185190glysertrpasppheasnaspasnthrasnleuprolysproargleu195200205seraspasptyrhisglythrargcysalaglygluilealaalalys210215220lysglyasnasnphecysglyvalglyvalglytyrasnalalysile225230235240serglyileargileleuserglyaspilethrthrgluaspgluala245250255alaserleuiletyrglyleuaspvalasnaspiletyrsercysser260265270trpglyproalaaspaspglyarghisleuglnglyproseraspleu275280285vallyslysalaleuvallysglyvalthrgluglyargaspserlys290295300glyalailetyrvalphealaserglyasnglyglythrargglyasp305310315320asncysasntyraspglytyrthrasnseriletyrserilethrile325330335glyalaileasphislysaspleuhisproprotyrsergluglycys340345350seralavalmetalavalthrtyrserserglyserglyglutyrile355360365hisserseraspileasnglyargcysserasnserhisglyglythr370375380seralaalaalaproleualaalaglyvaltyrthrleuleuleuglu385390395400alaasnproasnleuthrtrpargaspvalglntyrleuserileleu405410415seralavalglyleuglulysasnalaaspglyasptrpargaspser420425430alametglylyslystyrserhisargtyrglypheglylysileasp435440445alahislysleuileglumetserlysthrtrpgluasnvalasnala450455460glnthrtrpphetyrleuprothrleutyrvalserglnserthrasn465470475480serthrglugluthrleugluservalilethrileserglulysser485490495leuglnaspalaasnphelysargilegluhisvalthrvalthrval500505510aspileaspthrgluileargglythrthrthrvalaspleuileser515520525proalaglyileileserasnleuglyvalvalargproargaspval530535540sersergluglyphelysasptrpthrphemetservalalahistrp545550555560glygluasnglyvalglyasptrplysilelysvallysthrthrglu565570575asnglyhisargileaspphehissertrpargleulysleuphegly580585590gluserileaspserserlysthrgluthrphevalpheglyasnasp595600605lysglugluvalgluproalaalathrgluserthrvalserglntyr610615620seralaserserthrserileserileseralathrserthrserser625630635640ileserileglyvalgluthrseralaileproglnthrthrthrala645650655serthraspproaspseraspproasnthrprolyslysleuserser660665670proargglnalamethistyrpheleuthrilepheleuileglyala675680685thrpheleuvalleutyrphemetphephemetlysserargargarg690695700ileargargserargalagluthrtyrglupheaspileileaspthr705710715720aspserglutyraspserthrleuaspasnglythrserglyilethr725730735gluproglugluvalgluasppheasppheaspleuseraspgluasp740745750hisleualaserleusersersergluasnglyaspalagluhisthr755760765ileaspservalleuthrasngluasnpropheseraspproilelys770775780glnlyspheproasnaspalaasnalagluseralaserasnlysleu785790795800glngluleuglnproaspvalproproserserglyargser805810<210>25<211>1506<212>dna<213>人工序列<220><223>kanmxopenreadingframewithpromoterandterminator<400>25cgtacgctgcaggtcgacggatccccgggttaattaaggcgcgccagatctgtttagctt60gcctcgtccccgccgggtcacccggccagcgacatggaggcccagaataccctccttgac120agtcttgacgtgcgcagctcaggggcatgatgtgactgtcgcccgtacatttagcccata180catccccatgtataatcatttgcatccatacattttgatggccgcacggcgcgaagcaaa240aattacggctcctcgctgcagacctgcgagcagggaaacgctcccctcacagacgcgttg300aattgtccccacgccgcgcccctgtagagaaatataaaaggttaggatttgccactgagg360ttcttctttcatatacttccttttaaaatcttgctaggatacagttctcacatcacatcc420gaacataaacaaccatgggtaaggaaaagactcacgtttcgaggccgcgattaaattcca480acatggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtg540cgacaatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggca600aaggtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaat660ttatgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactca720ccactgcgatccccggcaaaacagcattccaggtattagaagaatatcctgattcaggtg780aaaatattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgta840attgtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaata900acggtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaag960tctggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtg1020atttctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttg1080gacgagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtg1140agttttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgata1200tgaataaattgcagtttcatttgatgctcgatgagtttttctaatcagtactgacaataa1260aaagattcttgttttcaagaacttgtcatttgtatagtttttttatattgtagttgttct1320attttaatcaaatgttagcgtgatttatattttttttcgcctcgacatcatctgcccaga1380tgcgaagttaagtgcgcagaaagtaatatcatgcgtcaatcgtatgtgaatgctggtcgc1440tatactgctgtcgattcgatactaacgccgccatccagtgtcgaaaacgagctcgaattc1500atcgat1506<210>26<211>116<212>dna<213>人工序列<220><223>引物a<400>26ccgtttataacgaaatgcaagaaaaaaaaatctcacccatttttttaaacctttgacgtg60gaaaggtatctgggaaaggtatctggctaatgaataatgccgtacgctgcaggtcg116<210>27<211>119<212>dna<213>人工序列<220><223>引物b<400>27atatatcatgatgattattttctatgaattagtcattcttgcagcgctgacgctttcata60cgttgtaacgagtaaatagactatactggtatatgctatgatcgatgaattcgagctcg119<210>28<211>3345<212>dna<213>人工序列<220><223>5'-not4-not43'utr-kanmx-not43'utr-3':<400>28tgcaagatgtatagctcaggtagacgggacgtatatggatggccgcctgatcaaagctgc60ctacggtactactaaatactgttcttcttatttaagaggattgccatgcccaaatcccaa120ctgtatgtttttgcatgaacctggtgaagaagctgattcttttaataaaagagaactcca180caataaacaacaagcgcaacagcaaagtggcggaactgcattcactagatctggaataca240caacaatatatctaccagtaccgctggttcaaataccaatttactaagtgaaaatttcac300aggcacaccttcaccggcggcgatgagggctcagttacatcatgacagccatacaaacgc360tggaacaccggtattaacacctgctccggtccctgcagggtcaaatccttggggagttac420tcaatcagcaacacctgtaacctctatcaatctctctaaaaacagcagctccataaactt480gccaacattaaatgattctctgggccatcatactacccccacaacagagaataccatcac540aagtacgacaactactaccaataccaatgctacaagtcactcccatggtagcaagaagaa600gcaatctcttgctgcagaggaatacaaagatccttatgacgcactagggaatgctgttga660ctttttggatgcaagactacattctctatcaaattatcagaagcgccctatatctatcaa720atccaatattattgacgaagaaacttataaaaagtatccgtctttgttttcttgggacaa780gattgaggcctcaaagaaaagtgacaatacattagccaacaaacttgtggagatcctggc840tataaagccaatagactacactgcttctgtcgttcaattcttgcagagtgtcaatgttgg900tgtaaatgacaatattacaatcacagataatacgaaaactcccacccaaccaataagact960gcaaaccgtctcacagcaaatccaaccaccattaaacgtcagtacccctccaccgggtat1020ctttggtccacaacataaggttcctattcagcagcaacaaatgggtgatacaagctcaag1080aaattcctctgatttactaaatcaactaatcaacggaaggaaaattatcgccggtaatta1140atccgactctaaatatttttcttgtttgcattaaccataattttatctatttttatttct1200catgaatatataatctctccgtttataacgaaatgcaagaaaaaaaaatctcacccattt1260ttttaaacctttgacgtggaaaggtatctgggaaaggtatctggctaatgaataatgccg1320tacgctgcaggtcgacggatccccgggttaattaaggcgcgccagatctgtttagcttgc1380ctcgtccccgccgggtcacccggccagcgacatggaggcccagaataccctccttgacag1440tcttgacgtgcgcagctcaggggcatgatgtgactgtcgcccgtacatttagcccataca1500tccccatgtataatcatttgcatccatacattttgatggccgcacggcgcgaagcaaaaa1560ttacggctcctcgctgcagacctgcgagcagggaaacgctcccctcacagacgcgttgaa1620ttgtccccacgccgcgcccctgtagagaaatataaaaggttaggatttgccactgaggtt1680cttctttcatatacttccttttaaaatcttgctaggatacagttctcacatcacatccga1740acataaacaaccatgggtaaggaaaagactcacgtttcgaggccgcgattaaattccaac1800atggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtgcg1860acaatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggcaaa1920ggtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaattt1980atgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactcacc2040actgcgatccccggcaaaacagcattccaggtattagaagaatatcctgattcaggtgaa2100aatattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgtaat2160tgtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataac2220ggtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaagtc2280tggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtgat2340ttctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttgga2400cgagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtgag2460ttttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgatatg2520aataaattgcagtttcatttgatgctcgatgagtttttctaatcagtactgacaataaaa2580agattcttgttttcaagaacttgtcatttgtatagtttttttatattgtagttgttctat2640tttaatcaaatgttagcgtgatttatattttttttcgcctcgacatcatctgcccagatg2700cgaagttaagtgcgcagaaagtaatatcatgcgtcaatcgtatgtgaatgctggtcgcta2760tactgctgtcgattcgatactaacgccgccatccagtgtcgaaaacgagctcgaattcat2820cgatcatagcatataccagtatagtctatttactcgttacaacgtatgaaagcgtcagcg2880ctgcaagaatgactaattcatagaaaataatcatcatgatatatatcataatgcacggaa2940cctgcttcgctaattttttcacttaaatcacattttttcaacgaaatctcttgcgcagtt3000ggttggaattcttatccgaatgactcagtctacatcaaaaaactgtggccgaatggtggt3060aattgatgactcttctatttttttttttcatataaagagcttgcgcgcgtgttgttgttc3120gctatccatttccattaggaacatttttggatattatttttcagacccgtaatatactta3180acacatataccactaaaggcaaaagaaagagagatctgaagtgagaaataagtctgcatc3240attatgccatctgctagcttactcgtctcgacaaagagacttaacgcttccaaattccaa3300aaatttgtgtcttcattaaacaaatccaccatagcaggatttgca3345<210>29<211>20<212>dna<213>人工序列<220><223>引物mbp260<400>29tgcaagatgtatagctcagg20<210>30<211>20<212>dna<213>人工序列<220><223>引物mbp266<400>30tgcaaatcctgctatggtgg20<210>31<211>21<212>dna<213>人工序列<220><223>引物mbp269<400>31ataaaatcacctggcattacg21<210>32<211>20<212>dna<213>人工序列<220><223>引物mbp287<400>32caacagttggatcacagtgg20<210>33<211>20<212>dna<213>人工序列<220><223>mbp274<400>33ctctgggccatcatactacc20<210>34<211>20<212>dna<213>人工序列<220><223>mbp282<400>34gttgctgctgaataggaacc20<210>35<211>19<212>prt<213>人工序列<220><223>修饰的转化酶信号肽<220><221>misc<222>(7)..(7)<223>xaa=phe,trp或tyr<220><221>misc<222>(8)..(8)<223>xaa=ile,leu,val,ala或met<220><221>misc<222>(9)..(9)<223>xaa=leu,val,ala或met<220><221>misc<222>(10)..(10)<223>xaa=ser或thr<220><221>misc<222>(11)..(11)<223>xaa=ile,val,ala或met<400>35metleuleuglnalaphexaaxaaxaaxaaxaaglyphealaalalys151015ileserala<210>36<211>19<212>prt<213>人工序列<220><223>修饰的转化酶信号肽<400>36metleuleuglnalaphepheilevalserileglyphealaalalys151015ileserala<210>37<211>2253<212>dna<213>人工序列<220><223>融合至hsa的c-末端的il-1ra<400>37gacgctcacaagtccgaagtcgctcacagattcaaggacttgggtgaagaaaacttcaag60gctttggtcttgatcgctttcgctcaatacttgcaacaatgtccattcgaagatcacgtc120aagttggtcaacgaagttaccgaattcgctaagacttgtgttgctgacgaatccgcggaa180aactgtgacaagtccttgcacaccttgttcggtgataagttgtgtactgttgctaccttg240agagaaacctacggtgaaatggctgactgttgtgctaagcaagaaccagaaagaaacgaa300tgtttcttgcaacacaaggacgacaacccaaacttgccaagattggttagaccagaagtt360gacgtcatgtgtactgctttccacgacaacgaagaaaccttcttgaagaagtacttgtac420gaaattgctagaagacacccatacttctacgctccagaattgttgttcttcgctaagaga480tacaaggctgctttcaccgaatgttgtcaagctgctgataaggctgcttgtttgttgcca540aagttggatgaattgagagacgaaggtaaggcttcttccgctaagcaaagattgaagtgt600gcttccttgcaaaagttcggtgaaagagctttcaaggcttgggctgtcgctagattgtct660caaagattcccaaaggctgaattcgctgaagtttctaagttggttactgacttgactaag720gttcacactgaatgttgtcacggtgacttgttggaatgtgctgatgacagagctgacttg780gctaagtacatctgtgaaaaccaagactctatctcttccaagttgaaggaatgttgtgaa840aagccattgttggaaaagtctcactgtattgctgaagttgaaaacgatgaaatgccagct900gacttgccatctttggctgctgacttcgttgaatctaaggacgtttgtaagaactacgct960gaagctaaggacgtcttcttgggtatgttcttgtacgaatacgctagaagacacccagac1020tactccgttgtcttgttgttgagattggctaagacctacgaaactaccctcgagaagtgt1080tgtgctgctgctgacccacacgaatgttacgctaaggttttcgatgaattcaagccattg1140gtcgaagaaccacaaaacttgatcaagcaaaactgtgaattgttcgaacaattgggtgaa1200tacaagttccaaaacgctttgttggttagatacactaagaaggtcccacaagtctccacc1260ccaactttggttgaagtctctagaaacttgggtaaggtcggttctaagtgttgtaagcac1320ccagaagctaagagaatgccatgtgctgaagattacttgtccgtcgttttgaaccaattg1380tgtgttttgcacgaaaagaccccagtctctgatagagtcaccaagtgttgtactgaatct1440ttggttaacagaagaccatgtttctctgctttggaagtcgacgaaacttacgttccaaag1500gaattcaacgctgaaactttcaccttccacgctgatatctgtaccttgtccgaaaaggaa1560agacaaattaagaagcaaactgctttggttgaattggtcaagcacaagccaaaggctact1620aaggaacaattgaaggctgtcatggatgatttcgctgctttcgttgaaaagtgttgtaag1680gctgatgataaggaaacttgtttcgctgaagaaggtaagaagttggtcgctgcttcccaa1740gctgccttaggtttgggtggttctggtggttccggtggttctggtggatccggtggtcga1800ccctctgggagaaaatccagcaagatgcaagccttcagaatctgggatgttaaccagaag1860accttctatctgaggaacaaccaactagttgctggatacttgcaaggaccaaatgtcaat1920ttagaagaaaagatagatgtggtacccattgagcctcatgctctgttcttgggaatccat1980ggagggaagatgtgcctgtcctgtgtcaagtctggtgatgagaccagactccagctggag2040gcagttcaaatcactgacctgagcgagaacagaaagcaggacaagcgcttcgccttcatc2100cgctcagacagcggccccaccaccagttttgagtctgccgcctgccccggttggttcctc2160tgcacagcgatggaagctgaccagcccgtcagcctcaccaatatgcctgacgaaggcgtc2220atggtcaccaaattctacttccaggaggacgag2253<210>38<211>751<212>prt<213>人工序列<220><223>融合至hsa的c-末端的il-1ra<400>38aspalahislyssergluvalalahisargphelysaspleuglyglu151015gluasnphelysalaleuvalleuilealaphealaglntyrleugln202530glncysprophegluasphisvallysleuvalasngluvalthrglu354045phealalysthrcysvalalaaspgluseralagluasncysasplys505560serleuhisthrleupheglyasplysleucysthrvalalathrleu65707580arggluthrtyrglyglumetalaaspcyscysalalysglnglupro859095gluargasnglucyspheleuglnhislysaspaspasnproasnleu100105110proargleuvalargprogluvalaspvalmetcysthralaphehis115120125aspasnglugluthrpheleulyslystyrleutyrgluilealaarg130135140arghisprotyrphetyralaprogluleuleuphephealalysarg145150155160tyrlysalaalaphethrglucyscysglnalaalaasplysalaala165170175cysleuleuprolysleuaspgluleuargaspgluglylysalaser180185190seralalysglnargleulyscysalaserleuglnlyspheglyglu195200205argalaphelysalatrpalavalalaargleuserglnargphepro210215220lysalagluphealagluvalserlysleuvalthraspleuthrlys225230235240valhisthrglucyscyshisglyaspleuleuglucysalaaspasp245250255argalaaspleualalystyrilecysgluasnglnaspserileser260265270serlysleulysglucyscysglulysproleuleuglulysserhis275280285cysilealagluvalgluasnaspglumetproalaaspleuproser290295300leualaalaaspphevalgluserlysaspvalcyslysasntyrala305310315320glualalysaspvalpheleuglymetpheleutyrglutyralaarg325330335arghisproasptyrservalvalleuleuleuargleualalysthr340345350tyrgluthrthrleuglulyscyscysalaalaalaaspprohisglu355360365cystyralalysvalpheaspgluphelysproleuvalgluglupro370375380glnasnleuilelysglnasncysgluleuphegluglnleuglyglu385390395400tyrlyspheglnasnalaleuleuvalargtyrthrlyslysvalpro405410415glnvalserthrprothrleuvalgluvalserargasnleuglylys420425430valglyserlyscyscyslyshisproglualalysargmetprocys435440445alagluasptyrleuservalvalleuasnglnleucysvalleuhis450455460glulysthrprovalseraspargvalthrlyscyscysthrgluser465470475480leuvalasnargargprocyspheseralaleugluvalaspgluthr485490495tyrvalprolysglupheasnalagluthrphethrphehisalaasp500505510ilecysthrleuserglulysgluargglnilelyslysglnthrala515520525leuvalgluleuvallyshislysprolysalathrlysgluglnleu530535540lysalavalmetaspaspphealaalaphevalglulyscyscyslys545550555560alaaspasplysgluthrcysphealaglugluglylyslysleuval565570575alaalaserglnalaalaleuglyleuglyglyserglyglysergly580585590glyserglyglyserglyglyargproserglyarglysserserlys595600605metglnalapheargiletrpaspvalasnglnlysthrphetyrleu610615620argasnasnglnleuvalalaglytyrleuglnglyproasnvalasn625630635640leugluglulysileaspvalvalproilegluprohisalaleuphe645650655leuglyilehisglyglylysmetcysleusercysvallyssergly660665670aspgluthrargleuglnleuglualavalglnilethraspleuser675680685gluasnarglysglnasplysargphealapheileargseraspser690695700glyprothrthrserphegluseralaalacysproglytrppheleu705710715720cysthralametglualaaspglnprovalserleuthrasnmetpro725730735aspgluglyvalmetvalthrlysphetyrpheglngluaspglu740745750<210>39<211>756<212>dna<213>人工序列<220><223>融合至scfv的c-末端的flag<400>39gaagttcaattgttggaatctggtggtggtttggttcaacctggtggttctttgagattg60tcttgtgctgcttctggttttactttttctaattattggatgtcttgggttagacaagct120ccaggtaaaggtttggaatgggtttccggtatttcaggtaatggtggttatacttatttt180gctgattcagttaaagatagatttactatttctagagataattctaaaaataccttatat240ttgcaaatgaactctttgagagcagaagatactgctgtttattactgtgcaggtggtgac300ggttctggttggagtttttggggtcaaggtactctagttaccgtttcttcaggtggtggt360ggttctggtggaggtggatcaggtggtggaggatctcaatcagttttgactcaaccacca420tctgcttcaggtactccaggtcaaagagttaccatttcttgtactggttcttcttctaat480attggtgcaggttacgatgttcattggtatcaacaattgccaggtactgctccaaaattg540ttgatttatggtaacaacaatagaccatctggtgtcccagatagattttctggttctaaa600tctggtacttctgcttctttggctatttctggtttaagatcagaagatgaagctgattac660tactgtgctgcttgggatgactctttgtctggtagagttttcggtggtggtactaaattg720accgttttgggtgattataaagatgatgacgataaa756<210>40<211>252<212>prt<213>人工序列<220><223>融合至scfv的c-末端的flag<400>40gluvalglnleuleugluserglyglyglyleuvalglnproglygly151015serleuargleusercysalaalaserglyphethrpheserasntyr202530trpmetsertrpvalargglnalaproglylysglyleuglutrpval354045serglyileserglyasnglyglytyrthrtyrphealaaspserval505560lysaspargphethrileserargaspasnserlysasnthrleutyr65707580leuglnmetasnserleuargalagluaspthralavaltyrtyrcys859095alaglyglyaspglyserglytrpserphetrpglyglnglythrleu100105110valthrvalserserglyglyglyglyserglyglyglyglysergly115120125glyglyglyserglnservalleuthrglnproproseralasergly130135140thrproglyglnargvalthrilesercysthrglyserserserasn145150155160ileglyalaglytyraspvalhistrptyrglnglnleuproglythr165170175alaprolysleuleuiletyrglyasnasnasnargproserglyval180185190proaspargpheserglyserlysserglythrseralaserleuala195200205ileserglyleuargsergluaspglualaasptyrtyrcysalaala210215220trpaspaspserleuserglyargvalpheglyglyglythrlysleu225230235240thrvalleuglyasptyrlysaspaspaspasplys245250当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1