本发明涉及蛋白质的制造方法。
背景技术:
作为蛋白质的制造方法,报告了使用了棒状细菌、芽孢杆菌属细菌、酵母、丝状菌等的各种微生物的方法。
例如,非专利文献1公开了,使用了丝状菌talaromycescellulolyticus(旧名:acremoniumcellulolyticus)的宿主由来的纤维素酶的生产。此外,专利文献1中公开了,使用了丝状菌的抗体的生产。此外,专利文献2公开了,使用了talaromycescellulolyticus等的丝状菌并且具有内腔的多聚体蛋白质的生产。
此外,专利文献3~4中公开了,使用了内源性蛋白酶的活性弱化了的丝状菌的异源蛋白的生产。此外,专利文献5中公开了,使用了内源性碱蛋白酶的活性弱化了的丝状菌的异源蛋白的生产。
此外,专利文献6中公开了,使用了缺乏羧肽酶yscα活性的酵母的异源蛋白的生产。该文献中指出,该酵母还可以缺乏选自ysca、yscb、yscy和yscs中的肽酶活性。
然而,尚不知talaromycescellulolyticus中的yscb蛋白质与蛋白质生产的关系。
现有技术文献
专利文献
专利文献1:日本特表2006-512891
专利文献2:日本特开2016-158599
专利文献3:日本特表2015-512611
专利文献4:日本特表2016-523552
专利文献5:日本特表2000-507106
专利文献6:日本特开1990-104279
非专利文献
非专利文献1:inoueh,etal.,constructionofastarch-induciblehomologousexpressionsystemtoproducecellulolyticenzymesfromacremoniumcellulolyticus.jindmicrobiolbiotechnol.2013aug;40(8):823-30.
技术实现要素:
发明所解决的技术问题
本发明的目的是提供蛋白质的制造方法。
解决问题的技术手段
本发明人等为了解决所述问题而进行了深入研究,结果发现,以使yscb蛋白质的活性降低的方式对talaromycescellulolyticus进行修饰,从而能够提高talaromycescellulolyticus的蛋白质生产能力,完成了本发明。
即,本发明可以举例如下。
1、一种靶蛋白的制造方法,其包含下述工序:
通过培养基培养具有生产靶蛋白的能力的talaromycescellulolyticus,其中,
所述talaromycescellulolyticus经过了修饰,以使得与非修饰菌株相比yscb蛋白质的活性降低。
2、所述方法,其中,
通过降低yscb基因的表达或破坏yscb基因,而使所述yscb蛋白质的活性降低。
3、所述方法,其中,
通过yscb基因的缺失而使所述yscb蛋白质的活性降低。
4、所述方法,其中,
所述yscb蛋白质为下述(a)、(b)或(c)所述的蛋白质:
(a)包含seqidno.43表示的氨基酸序列的蛋白质;
(b)包含在seqidno.43表示的氨基酸序列中含有1~10个的氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列,并且具有蛋白酶活性的蛋白质;
(c)包含相对于seqidno.43表示的氨基酸序列具有90%以上的同源性的氨基酸序列,并且具有蛋白酶活性的蛋白质。
5、所述方法,其中,
所述talaromycescellulolyticus经过了修饰,以使得与非修饰菌株相比crea蛋白质的活性降低。
6、所述方法,其中,
通过降低crea基因的表达或破坏crea基因,而使所述crea蛋白质的活性降低。
7、所述方法,其中,
通过crea基因的缺失,而使所述crea蛋白质的活性降低。
8、所述方法,其中,
所述talaromycescellulolyticus为源自talaromycescellulolyticuss6-25菌株(nitebp-01685)的修饰菌株。
9、所述方法,其还包含下述工序:
回收靶蛋白。
10、所述方法,其中,
通过所述培养而使靶蛋白积蓄于所述培养基中。
11、所述方法,其中,
靶蛋白作为与在talaromycescellulolyticus中发挥功能的信号肽形成的融合蛋白而进行表达。
12、所述方法,其中,
靶蛋白为异源蛋白。
13、所述方法,其中,
靶蛋白为源自人的蛋白质。
14、所述方法,其中,
靶蛋白为人血清白蛋白。
15、所述方法,其中,
靶蛋白为抗体相关分子。
16、所述方法,其中,
靶蛋白为生长因子。
附图说明
[图1]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的人血清白蛋白(hsa)生产的结果的图(照片)。
[图2]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的曲妥珠单抗生产的结果的图(照片)。
[图3]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)生产的结果的图(照片)。
[图4]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)生产的结果的图(照片)。
[图5]表示t.cellulolyticusf09菌株的培养上清液的蛋白酶活性的评价结果的图(照片)。
[图6]表示t.cellulolyticusf09菌株及其蛋白酶缺陷菌株的培养上清液的蛋白酶活性的评价结果的图(照片)。
具体实施方式
以下,对本发明详细地进行说明。
本发明的方法是利用了talaromycescellulolyticus的靶蛋白的制造方法。也将该方法中利用的talaromycescellulolyticus称为“本发明的微生物”。
<1>本发明的微生物
本发明的微生物是,以使yscb蛋白质的活性降低的方式进行了修饰的、具有靶蛋白生产能力的talaromycescellulolyticus。需要说明的是,在本发明的微生物的说明中,有时将本发明的微生物或用于构建它们的talaromycescellulolyticus称为“宿主”。
<1-1>talaromycescellulolyticus
本发明的微生物为talaromycescellulolyticus。talaromycescellulolyticus的旧名为acremoniumcellulolyticus。即,acremoniumcellulolyticus通过系统分类的修订而被再分类为talaromycescellulolyticus(femsmicrobiol.lett.,2014,351:32-41)。作为talaromycescellulolyticus,具体而言,可举出:c1菌株(日本特开2003-135052)、cf-2612菌株(日本特开2008-271927)、tn菌株(fermbp-685)、s6-25菌株(nitebp-01685)、y-94菌株(fermbp-5826、cbs136886)和它们的衍生菌株。需要说明的是,“talaromycescellulolyticus”总称为:在本申请的申请前、申请时和申请后的至少任一时间点被分类在talaromycescellulolyticus中的真菌。即,例如,所述例举的菌株等的被分类在talaromycescellulolyticus中的菌株,即使在将来改变系统分类的情况下,也被视为属于talaromycescellulolyticus。
s6-25菌株原本于2013年8月8日被保藏在nite国际专利微生物保藏中心(日本千叶县木更津市上总镰足2-5-8122号室,邮编292-0818),并于2013年11月15日基于布达佩斯条约而被移交至国际保藏中心,并被赋予保藏编号nitebp-01685。该菌株为由tn菌株(fermbp-685)而得到的菌株,具有较高的纤维素酶生产能力。y-94菌株原本于1983年1月12日被保藏在通商产业省工业技术院生命工学工业技术研究所(现为nite国际专利微生物保藏中心,邮编292-0818,地址:日本千叶县木更津市上总镰足2-5-8120号室),并于1997年2月19日基于布达佩斯条约而被移交至国际保藏中心,并被赋予保藏编号fermbp-5826。
例如,这些菌株可以从各菌株所保藏的保藏机关入手。
本发明的微生物,可以通过对所述例举的菌株等的talaromycescellulolyticus进行修饰而取得。即,例如,本发明的微生物可以为源自所述例举的菌株的修饰菌株。具体而言,例如,本发明的微生物可以为源自s6-25菌株或y-94菌株的修饰菌株。更具体而言,例如,本发明的微生物可以为源自s6-25菌株的修饰菌株。用于构建本发明的微生物的修饰的实施顺序没有特别限制。
<1-2>靶蛋白生产能力
本发明的微生物具有靶蛋白生产能力。“具有靶蛋白生产能力的微生物”是指具有生产靶蛋白的能力的微生物。“具有靶蛋白生产能力的微生物”具体而言可以指,在通过培养基而进行培养时,具有表达靶蛋白并在培养物中使靶蛋白积蓄至能够回收的程度的能力的微生物。具体而言,“在培养物中的积蓄”可以指在培养基中、菌体表层、菌体内或它们的组合中的积蓄。需要说明的是,将靶蛋白积蓄在菌体外(例如,培养基中、细胞表层)的情况称为靶蛋白的“分泌”或“分泌生产”。即,本发明的微生物可以具有靶蛋白的分泌生产能力(分泌生产靶蛋白的能力)。靶蛋白特别是可以积蓄在培养基中。就靶蛋白的积蓄量而言,例如,作为培养物中的积蓄量,可以为10μg/l以上、1mg/l以上、100mg/l以上或1g/l以上。本发明的微生物可以具有1种靶蛋白的生产能力,也可以具有2种或以上的靶蛋白的生产能力。
本发明的微生物可以是本来就具有靶蛋白生产能力的物质,也可以是以具有靶蛋白生产能力的方式进行了修饰的物质。典型性地,本发明的微生物可以是本来就具有纤维素酶生产能力(生产纤维素酶的能力)的物质。此外,本发明的微生物可以是以使本来所具有的靶蛋白生产能力增强的方式进行了修饰的物质。就具有靶蛋白生产能力的微生物而言,例如,可以通过如上所述地赋予talaromycescellulolyticus以靶蛋白生产能力,或,通过如上所述地增强talaromycescellulolyticus的靶蛋白生产能力而取得。就靶蛋白生产能力而言,例如,可以通过靶蛋白的表达用的基因构建体的导入、其它提高靶蛋白生产能力的修饰的导入或它们的组合而进行赋予或增强。
本发明的微生物依靠具有至少靶蛋白的表达用的基因构建体而具有靶蛋白生产能力。具体而言,本发明的微生物可以通过具有靶蛋白的表达用的基因构建体,或通过具有靶蛋白的表达用的基因构建体和其他性质的组合,而具有靶蛋白生产能力。即,本发明的微生物具有靶蛋白的表达用的基因构建体。本发明的微生物可以具有1拷贝的靶蛋白的表达用的基因构建体,也可以具有2拷贝或以上的靶蛋白的表达用的基因构建体。本发明的微生物可以具有1种靶蛋白的表达用的基因构建体,也可以具有2种或以上的靶蛋白的表达用的基因构建体。靶蛋白的表达用的基因构建体的拷贝数和种类数可以分别称为靶蛋白基因的拷贝数和种类数。
本发明的微生物中,靶蛋白的表达用的基因构建体可以存在于质粒这样的在染色体外进行自主复制的载体上,也可以整合在染色体上。即,就本发明的微生物而言,例如,可以在载体上具有靶蛋白的表达用的基因构建体,换而言之,可以具有包含靶蛋白的表达用的基因构建体的载体。此外,就本发明的微生物而言,例如,可以在染色体上具有靶蛋白的表达用的基因构建体。在本发明的微生物具有2个或以上的靶蛋白的表达用的基因构建体的情况下,这些基因构建体只要以能够制造靶蛋白的方式保持在本发明的微生物中即可。例如,这些基因构建体可以全部保持在单个的表达载体上,也可以全部保持在染色体上。此外,这些基因构建体可以分别保持在多个表达载体上,也可以分别保持在单个或多个表达载体上和染色体上。
本发明的微生物可以是本来就具有靶蛋白的表达用的基因构建体的物质,也可以是以具有靶蛋白的表达用的基因构建体的方式进行了修饰的物质。典型性地,本发明的微生物可以是本来就具有纤维素酶的表达用的基因构建体的物质。此外,本发明的微生物可以是代替本来就具有的靶蛋白的表达用的基因构建体而导入了靶蛋白的表达用的基因构建体的物质、或进一步导入了靶蛋白的表达用的基因构建体的物质。具有靶蛋白的表达用的基因构建体的微生物,可以通过如上所述在talaromycescellulolyticus中导入靶蛋白的表达用的基因构建体而取得。
“靶蛋白的表达用的基因构建体”是指,以能够表达靶蛋白的方式构成的基因表达系统。也将靶蛋白的表达用的基因构建体称为“靶蛋白的表达系统”、“靶蛋白的表达单元”或“靶蛋白的表达盒”。靶蛋白的表达用的基因构建体在5’至3’方向上包含启动子序列和编码靶蛋白的碱基序列。也将启动子序列简称为“启动子”。也将编码氨基酸序列的碱基序列称为“基因”。例如,也将编码靶蛋白编码的碱基序列称为“编码靶蛋白的基因”或“靶蛋白基因”。靶蛋白基因只要连接在启动子的下游以受到基于同启动子的控制并表达靶蛋白即可。此外,靶蛋白的表达用的基因构建体可以在适当的位置上具有用于表达靶蛋白的有效的控制序列(操纵子、终止子等)以使它们发挥功能。需要说明的是,本发明中,除非特别说明,否则“靶蛋白基因的表达”、“靶蛋白的表达”、“靶蛋白的生成”、“靶蛋白的生产”可以相互同义地使用。靶蛋白的表达用的基因构建体可以根据靶蛋白的种类等的各种条件而进行适宜设计。
启动子只要在talaromycescellulolyticus中发挥功能,就没有特别限制。“在talaromycescellulolyticus中发挥功能的启动子”是指在talaromycescellulolyticus中具有启动子活性,即基因的转录活性的启动子。
启动子可以是源自宿主的启动子,也可以是源自异源的启动子。启动子可以是靶蛋白基因的固有的启动子,也可以是其他基因的启动子。此外,启动子可以是诱导性的启动子,也可以是组成性(constitutive)的启动子。作为启动子,可举出微生物的纤维素酶基因的启动子。作为启动子,具体而言,可举出talaromycescellulolyticus的纤维素酶基因的启动子。作为纤维素酶基因,可举出cbhi基因(也称为cbh1基因)、cbhii基因(也称为cbh2基因)。即,作为启动子,可举出cbhi基因的启动子、cbhii基因的启动子。也可以将cbhi基因的启动子称为“cbhi启动子”或“cbh1启动子”。也可以将cbhii基因的启动子称为“cbhii启动子”或“cbh2启动子”。将talaromycescellulolyticus的cbhi启动子和cbhii启动子的碱基序列分别表示为seqidno.41和33。即,就启动子而言,例如,可以是具有所述例举的启动子的碱基序列(例如seqidno.41或33的碱基序列)的启动子。此外,启动子可以是所述例举的启动子(例如具有seqidno.41或33的碱基序列的启动子)的保守性变体。即,例如,所述例举的启动子可以原样使用或进行适宜修饰后使用。“cbhi启动子”和“cbhii启动子”这样的术语除了所述例举的cbhi启动子和cbhii启动子之外,还包含它们的保守性变体。对于启动子的保守性变体,可以适用涉及后述的yscb基因的保守性变体的记载。例如,启动子如果保持原本的功能,则可以是具有相对于seqidno.41或33的碱基序列具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的碱基序列的dna。需要说明的是,启动子的“原本的功能”是指,表达(例如,诱导性或组成性地表达)连接在下游的基因的功能。就启动子的功能而言,例如,可以通过确认基因的表达而进行确认。就基因的表达而言,例如,可以使用报告基因进行确认。
靶蛋白没有特别限制。靶蛋白可以是源自宿主的蛋白质,也可以是源自异源的蛋白质(异源蛋白质)。本发明中,“异源蛋白质”(heterologousprotein)是指,对于生产该蛋白质的talaromycescellulolyticus而言是外来性(exogenous)的蛋白质。就靶蛋白而言,例如,可以是源自微生物的蛋白质,可以是源自植物的蛋白质,可以是源自动物的蛋白质,可以是源自病毒的蛋白质,可以是具有人工设计的氨基酸序列的蛋白质。特别是,靶蛋白可以是人源性蛋白质。靶蛋白可以是单体蛋白质,也可以是多聚体蛋白质。多聚体蛋白质是指,作为包含2或以上的亚基的多聚体而存在的蛋白质。多聚体中,各亚基可以通过二硫键等的共价键而进行连接,可以通过氢键、疏水性相互作用等的非共价键而进行连接,也可以通过它们的组合而进行连接。优选在多聚体中包含1个或以上的分子间二硫键。多聚体可以是包含单一的种类的亚基的同源多聚体,也可以是包含2或以上的种类的亚基的异源多聚体。需要说明的是,“靶蛋白是异源蛋白质”是指,在靶蛋白是异源多聚体蛋白质的情况下,只要构成多聚体的亚基的中至少1个的亚基是异源蛋白质即可。即,可以所有亚基都源自异源,也可以仅一部分亚基源自异源。靶蛋白可以是分泌性蛋白,也可以是非分泌性蛋白。分泌性蛋白可以是天然分泌性的蛋白质,也可以是天然非分泌性的蛋白质,优选为天然分泌性的蛋白质。需要说明的是,“蛋白质”中还包含寡肽、多肽等的称为肽的物质。
作为靶蛋白,例如可举出:酶、生物活性蛋白、受体蛋白、作为疫苗使用的抗原蛋白、其它任意的蛋白质。
作为酶,例如可举出:纤维素酶、谷胺酰转氨酶、蛋白质谷氨酰胺酶(proteinglutaminase)、异麦芽糖葡聚糖酶(isomaltodextranase)、蛋白酶、内肽酶、外肽酶、氨基肽酶、羧基肽酶、胶原酶和几丁质酶等。
本发明中,“纤维素酶”是催化使纤维素中包含的糖苷键水解的反应的酶的总称。作为纤维素酶,可举出:内切型纤维素酶(内切葡聚糖酶;ec3.2.1.4)、外切型纤维素酶(纤维二糖水解酶;ec3.2.1.91)、纤维二糖酶(β-葡萄糖苷酶;ec3.2.1.21)。此外,根据活性测定中使用的基质,纤维素酶称为微晶纤维酶(avicelase)、滤纸纤维素酶(fpase)、羧甲基纤维素酶(cmcase)等。作为纤维素酶,例如,可举出:里氏木霉(trichodermareesei)、talaromycescellulolyticus等的真菌、热纤梭菌(clostridiumthermocellum)等的细菌的纤维素酶。
作为谷胺酰转氨酶,例如,可举出:streptoverticilliummobaraenseifo13819(wo01/23591)、streptoverticilliumcinnamoneumifo12852、streptoverticilliumgriseocarneumifo12776、streptomyceslydicus(wo9606931)等的放线菌、oomycetes(wo9622366)等的丝状菌的分泌型的谷胺酰转氨酶。作为蛋白质谷氨酰胺酶,例如可举出chryseobacteriumproteolyticum的蛋白质谷氨酰胺酶(wo2005/103278)。作为异麦芽糖葡聚糖酶,例如可举出arthrobacterglobiformis的异麦芽糖葡聚糖酶(wo2005/103278)。
作为生物活性蛋白,例如可举出:生长因子(growthfactor),激素,细胞因子,抗体相关分子。
作为生长因子(growthfactor),具体而言,例如可举出:表皮生长因子(epidermalgrowthfactor;egf)、胰岛素样生长因子-1(insulin-likegrowthfactor-1;igf-1)、转化生长因子(transforminggrowthfactor;tgf)、神经生长因子(nervegrowthfactor;ngf)、脑源性神经营养因子(brain-derivedneurotrophicfactor;bdnf)、血管内皮生长因子(vascularendothelialgrowthfactor;vegf)、粒细胞集落刺激因子(granulocyte-colonystimulatingfactor;g-csf)、粒细胞巨噬细胞集落刺激因子(granulocyte-macrophage-colonystimulatingfactor;gm-csf)、血小板衍生生长因子(platelet-derivedgrowthfactor;pdgf)、促红细胞生成素(erythropoietin;epo)、血小板生成素(thrombopoietin;tpo)、酸性成纤维细胞生长因子(acidicfibroblastgrowthfactor;afgf或fgf1)、碱基性成纤维细胞生长因子(basicfibroblastgrowthfactor;bfgf或fgf2)、角质细胞生长因子(keratinocytegrowthfactor;kgf-1或fgf7、kgf-2或fgf10)、肝细胞生长因子(hepatocytegrowthfactor;hgf)。
作为激素,具体而言,例如可举出:胰岛素、胰高血糖素、生长抑素(somatostatin)、人类生长激素(humangrowthhormone;hgh)、甲状旁腺激素(parathyroidhormone;pth)、降钙素(calcitonin)、艾塞那肽(exenatide)。
作为细胞因子,具体而言,例如可举出:白细胞介素、干扰素、肿瘤坏死因子(tumornecrosisfactor;tnf)。
需要说明的是,生长因子(growthfactor)、激素和细胞因子可以不用相互严格区别。例如,生物活性蛋白可以属于选自生长因子(growthfactor)、激素和细胞因子中的任一组,也可以属于选自这些中的多个组。
此外,生物活性蛋白可以是蛋白质整体,也可以是其一部分。作为蛋白质的一部分,例如可举出具有生理活性的部分。作为具有生理活性的部分,具体而言,例如可举出包含甲状旁腺激素(parathyroidhormone;pth)的成熟体的n末端34氨基酸残基的生理活性肽特立帕肽(teriparatide)。
“抗体相关分子”是指,包含由选自构成完整抗体的结构域的单个结构域或2或者2以上结构域的组合组成的分子种的蛋白质。作为构成完整抗体的结构域,可举出:作为重链的结构域的vh、ch1、ch2和ch3、以及作为轻链的结构域的vl和cl。抗体相关分子只要包含所述分子种即可,可以是单体蛋白质,也可以是多聚体蛋白质。需要说明的是,在抗体相关分子为多聚体蛋白质的情况下,可以是包含单一种类的亚基的同源多聚体,也可以是包含2或2个以上种类的亚基的异源多聚体。作为抗体相关分子,具体而言,例如可举出:完整抗体、fab、f(ab’)、f(ab’)2、fc、包含重链(h链)与轻链(l链)的二聚体、fc融合蛋白、重链(h链)、轻链(l链)、单链fv(scfv)、sc(fv)2、二硫键fv(sdfv)、双链抗体(diabody)、vhh片段(nanobody(注册商标))。作为抗体相关分子,更具体而言,例如可举出曲妥珠单抗、纳武单抗。
受体蛋白没有特别限制,例如,可以是对于生物活性蛋白、其它生理活性物质的受体蛋白。作为其它生理活性物质,例如可举出多巴胺等的神经递质。此外,受体蛋白也可以是对应的配体未知的孤儿受体。
作为疫苗使用的抗原蛋白,只要能够引起免疫应答,就没有特别限制,根据假定的免疫应答的对象而适宜选择即可。
此外,作为其它蛋白质,可举出:肝型脂肪酸结合蛋白liver-typefattyacid-bindingprotein(lfabp)、荧光蛋白、免疫球蛋白结合蛋白、白蛋白、细胞外蛋白。作为荧光蛋白,可举出绿色荧光蛋白greenfluorescentprotein(gfp)。作为免疫球蛋白结合蛋白,可举出proteina、proteing、proteinl。作为白蛋白,可举出人血清白蛋白。
作为细胞外蛋白,可举出:纤连蛋白、玻连蛋白、胶原蛋白、骨桥蛋白、层粘连蛋白、它们的部分序列。层粘连蛋白是具有包含α链、β链和γ链的异三聚体结构的蛋白质。作为层粘连蛋白,可举出哺乳动物的层粘连蛋白。作为哺乳动物,可举出:人、猴子、黑猩猩等的灵长类、小鼠、大鼠、仓鼠、豚鼠等的啮齿类、兔子、马、牛、绵羊、山羊、猪、狗、猫等的其它各种哺乳动物。作为哺乳动物,特别是可举出人。层粘连蛋白的亚基链(即,α链、β链和γ链),可举出:5种α链(α1~α5)、3种β链(β1~β3)、3种γ链(γ1~γ3)。层粘连蛋白通过这些亚基链的组合而构成各种的同工型。作为层粘连蛋白,具体而言,例如可举出:层粘连蛋白111、层粘连蛋白121、层粘连蛋白211、层粘连蛋白213、层粘连蛋白221、层粘连蛋白311、层粘连蛋白321、层粘连蛋白332、层粘连蛋白411、层粘连蛋白421、层粘连蛋白423、层粘连蛋白511、层粘连蛋白521、层粘连蛋白523。作为层粘连蛋白的部分序列,可举出作为层粘连蛋白的e8片段的层粘连蛋白e8。具体而言,层粘连蛋白e8,是具有包含α链的e8片段(α链e8)、β链的e8片段(β链e8)和γ链的e8片段(γ链e8)的异三聚体结构的蛋白质。层粘连蛋白e8的亚基链(即,α链e8、β链e8和γ链e8)也总称为“e8亚基链”。作为e8亚基链,可举出所述例举的层粘连蛋白亚基链的e8片段。层粘连蛋白e8通过这些e8亚基链的组合而构成各种同工型。作为层粘连蛋白e8,具体而言,例如可举出:层粘连蛋白111e8、层粘连蛋白121e8、层粘连蛋白211e8、层粘连蛋白221e8、层粘连蛋白332e8、层粘连蛋白421e8、层粘连蛋白411e8、层粘连蛋白511e8、层粘连蛋白521e8。
靶蛋白基因可以原样利用或适宜修饰后利用。靶蛋白基因,例如,为了得到期望的活性而可以进行修饰。对于靶蛋白基因和靶蛋白的变体,可以援用对后述的yscb基因和yscb蛋白质的保守性变体的记载。例如,靶蛋白基因可以以使得在编码的靶蛋白的氨基酸序列中包含1个或几个氨基酸的取代、缺失、插入和/或添加的方式而进行修饰。需要说明的是,源自生物种的特定的蛋白质不限于在该生物种中发现的蛋白质本身,还包含具有在该生物种中发现的蛋白质的氨基酸序列的蛋白质和它们的变体。这些变体可以在该生物种中发现,也可以没有发现。即,例如,“人源蛋白质”是指,不限于在人体中发现的蛋白质本身,还包含具有在人体中发现的蛋白质的氨基酸序列的蛋白质和它们的变体。此外,靶蛋白基因可以将任意的密码子用与其等价的密码子取代。例如,就靶蛋白基因而言,可以根据使用的宿主的密码子使用频率而进行修饰,以使得具有最适的密码子。
就靶蛋白而言,除了所述例举的靶蛋白的氨基酸序列之外,还可以包含其他氨基酸序列。即,靶蛋白可以是与其他氨基酸序列形成的融合蛋白。“其他氨基酸序列”只要能得到期望的性质的靶蛋白,就没有特别限制。“其他氨基酸序列”可以根据其利用目的等的各种条件而适宜选择。作为“其他氨基酸序列”,例如可举出:信号肽(也称为信号序列)、肽标签、蛋白酶的识别序列。“其他氨基酸序列”,例如,可以与靶蛋白的n末端或者c末端、或两者连接。作为“其他氨基酸序列”,可以使用1种氨基酸序列,也可以组合使用2种或2种以上的氨基酸序列。
信号肽,例如,可以在靶蛋白的分泌生产中利用。信号肽可以与靶蛋白的n末端连接。即,在一个方式中,靶蛋白的表达用的基因构建体在从5’至3’方向上可以包含启动子序列、编码信号肽的碱基序列和编码靶蛋白的碱基序列。在这种情况下,可以将编码靶蛋白的核酸序列连接至编码信号肽的核酸序列的下游,以使得靶蛋白作为与同信号肽形成的融合蛋白而进行表达。需要说明的是,在这样的融合蛋白中,信号肽和靶蛋白可以相邻,也可以不相邻。即,“靶蛋白作为与信号肽形成的融合蛋白而进行表达”不限于靶蛋白与信号肽相邻并作为与同信号肽形成的融合蛋白而进行表达的情况,还包含靶蛋白借助其他氨基酸序列而作为与信号肽形成的融合蛋白而进行表达的情况。在利用信号肽而分泌生产靶蛋白的情况下,通常,在分泌时剪切信号肽,可以将没有信号肽的靶蛋白分泌在菌体外。即,“靶蛋白作为与信号肽形成的融合蛋白而进行表达”或“靶蛋白包含信号肽”是指,只要靶蛋白在表达时构成与信号肽形成的融合蛋白即可,不需要最终得到的靶蛋白构成与信号肽形成的融合蛋白。
信号肽只要是在talaromycescellulolyticus中发挥功能物质就没有特别限制。“在talaromycescellulolyticus中发挥功能的信号肽”是指,当与靶蛋白的n末端连接时,在talaromycescellulolyticus中带来靶蛋白的分泌的肽。
信号肽可以是源自宿主的信号肽,也可以是源自异源的信号肽。信号肽可以是靶蛋白的固有的信号肽,也可以是其他蛋白质的信号肽。作为信号肽,可举出微生物的分泌性纤维素酶的信号肽。作为信号肽,具体而言,可举出talaromycescellulolyticus的分泌性纤维素酶的信号肽。作为分泌性纤维素酶,可举出:cbhi基因编码的cbhi蛋白质(也称为cbh1蛋白质)、cbhii基因编码的cbhii蛋白质(也称为cbh2蛋白质)。即,作为信号肽,可举出:cbhi蛋白质的信号肽、cbhii蛋白质的信号肽。也将cbhi蛋白质的信号肽称为“cbhi信号肽”或“cbh1信号肽”。也将cbhii蛋白质的信号肽称为“cbhii信号肽”或“cbh2信号肽”。将talaromycescellulolyticus的cbhi信号肽的氨基酸序列示于seqidno.42中。即,信号肽,例如,可以是具有所述例举的信号肽的氨基酸序列(例如seqidno.42的氨基酸序列)的信号肽。此外,信号肽可以是所述例举的信号肽(例如具有seqidno.42的氨基酸序列的信号肽)的保守性变体。即,例如,所述例举的信号肽可以原样使用或适宜修饰后使用。“cbhi信号肽”和“cbhii信号肽”这样的术语,除了所述例举的cbhi信号肽和cbhii信号肽之外,还包含它们的保守性变体。对于信号肽的保守性变体,可以援用涉及后述的yscb蛋白质的保守性变体的记载。例如,信号肽如果保持原本的功能,则可以是具有在seqidno.42的氨基酸序列中,1或者几个位置的1个或几个氨基酸被取代、缺失、插入和/或添加的氨基酸序列的肽。需要说明的是,信号肽的变体中的所述“1个或几个”是指,具体而言,优选为1~7个,更优选为1~5个,近一些优选为1~3个,特别优选为1~2个。此外,例如,信号肽如果保持原本的功能,则可以是具有相对于seqidno.42的氨基酸序列,具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的氨基酸序列的肽。需要说明的是,对于信号肽的“原本的功能”,是可以在与靶蛋白的n末端连接时带来靶蛋白的分泌的功能。信号肽的功能,例如,可以通过对向蛋白质的n末端的连接引起的该蛋白质的分泌进行确认来确认。
作为肽标签,具体而言,可举出:his标签、flag标签、gst标签、myc标签、mbp(maltosebindingprotein)、cbp(cellulosebindingprotein)、trx(thioredoxin)、gfp(greenfluorescentprotein)、hrp(horseradishperoxidase)、alp(alkalinephosphatase)、抗体的fc区域。肽标签,例如,可以在表达而得的靶蛋白的检测、纯化中利用。
作为蛋白酶的识别序列,具体而言,可举出:hrv3c蛋白酶识别序列、factorxa蛋白酶识别序列、protev蛋白酶识别序列。蛋白酶的识别序列,例如,可以在表达而得的靶蛋白的剪切中利用。具体而言,例如,在使靶蛋白作为与肽标签形成的融合蛋白而进行表达的情况下,通过将蛋白酶的识别序列导入靶蛋白与肽标签的连接部,而能够利用蛋白酶从表达而得的靶蛋白剪切肽标签,得到没有肽标签的靶蛋白。
最终得到的靶蛋白的n末端区域可以与天然的蛋白质相同,也可以与天然的蛋白质不相同。例如,与天然的蛋白质比较,最终得到的靶蛋白的n末端区域可以额外添加或缺失1个或几个氨基酸。需要说明的是,所述“1个或几个”是指,根据目的靶蛋白的全长、结构等而不同,具体而言,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。
此外,靶蛋白可以作为添加有前体结构部的蛋白质(前体蛋白质)而进行表达。在靶蛋白作为前体蛋白质而进行表达的情况下,最终得到的靶蛋白可以是前体蛋白质,也可以不是。即,前体蛋白质可以剪切前体结构部而成为成熟蛋白质。就剪切而言,例如,可以通过蛋白酶而进行。在使用蛋白酶的情况下,从最终得到的蛋白质的活性这样的观点出发,前体蛋白质通常优选在与天然的蛋白质大致相同位置剪切,更优选在与天然的蛋白质完全相同位置剪切而得到与天然的蛋白质相同的成熟蛋白质。因此,通常,最优选在产生天然产生的成熟蛋白质相同的蛋白质的位置剪切前体蛋白质的特异性蛋白酶。然而,如上所述,最终得到的靶蛋白的n末端区域可以与天然的蛋白质不相同。例如,根据要生产的靶蛋白的种类、使用目的等,n末端比天然的蛋白质长或短1~几个氨基酸的蛋白质可能具有更适当的活性。可以在本发明中使用的蛋白酶除了dispase(boehringermannheim公司制)这样的可商购之外,还包含微生物的培养液,例如从放线菌的培养液等得到的蛋白酶。这样的蛋白酶可以在未纯化状态下使用,也可以根据需要纯化至适当的纯度后使用。
靶蛋白基因,例如,可以通过克隆而取得。克隆,例如,可以利用包含靶蛋白基因的基因组dna、cdna等的核酸。此外,就靶蛋白基因而言,例如,也可以通过基于其碱基序列而进行全合成来取得(gene,60(1),115-127(1987))。取得的靶蛋白基因可以原样利用或适宜修饰后利用。即,通过对靶蛋白基因进行修饰,而能够取得其变体。基因的修饰可以通过公知的手法而进行。例如,可以通过位点特异性突变法而在dna的目的位点导入目的变异。作为位点特异性突变法,可举出:使用pcr的方法(higuchi,r.,61,inpcrtechnology,erlich,h.a.eds.,stocktonpress(1989);carter,p.,meth.inenzymol.,154,382(1987))、使用噬菌体的方法(kramer,w.andfrits,h.j.,meth.inenzymol.,154,350(1987);kunkel,t.a.etal.,meth.inenzymol.,154,367(1987))。或者,可以全合成靶蛋白基因的变体。此外,可以对取得的靶蛋白基因适宜进行启动子序列的导入等的修饰,取得靶蛋白的表达用的基因构建体。需要说明的是,靶蛋白的表达用的基因构建体的其他构成要素(例如,启动子序列)、靶蛋白的表达用的基因构建体也可以通过与靶蛋白基因同样的方式取得。
基因的修饰可以通过公知的手法而进行。例如,可以通过位点特异性突变法而在dna的目的位点导入目的变异。作为位点特异性突变法,可举出:使用pcr的方法(higuchi,r.,61,inpcrtechnology,erlich,h.a.eds.,stocktonpress(1989);carter,p.,meth.inenzymol.,154,382(1987))、使用噬菌体的方法(kramer,w.andfrits,h.j.,meth.inenzymol.,154,350(1987);kunkel,t.a.etal.,meth.inenzymol.,154,367(1987))。
将靶蛋白的表达用的基因构建体导入talaromycescellulolyticus的手法没有特别限制。“靶蛋白的表达用的基因构建体的导入”是指只要将靶蛋白的表达用的基因构建体保持在宿主中即可,具体而言,是将靶蛋白基因以使其可以表达的方式导入宿主。“靶蛋白的表达用的基因构建体的导入”,只要没有特别说明,则不限于将预先构建的靶蛋白的表达用的基因构建体一并导入宿主的情况,还包含将靶蛋白的表达用的基因构建体的一部分导入宿主,并且在宿主内构建靶蛋白的表达用的基因构建体的情况。例如,可以通过将靶蛋白基因导入宿主本来就具有的启动子的下游,而在染色体上构建靶蛋白的表达用的基因构建体。
就靶蛋白的表达用的基因构建体而言,例如,可以使用包含靶蛋白的表达用的基因构建体的载体而导入宿主。也将包含靶蛋白的表达用的基因构建体的载体称为“靶蛋白的表达载体”。就靶蛋白的表达载体而言,例如,可以通过将靶蛋白的表达用的基因构建体与载体进行连接而进行构建。此外,例如,在载体具备启动子的情况下,靶蛋白的表达载体可以通过将靶蛋白基因连接至该启动子的下游而进行构建。用靶蛋白的表达载体而转化宿主,从而得到导入了同载体的转化体,即,可以将靶蛋白的表达用的基因构建体导入宿主。就载体而言,只要可以在宿主的细胞内中自主复制就没有特别限制。载体可以是1拷贝载体,可以是低拷贝载体,也可以是多拷贝载体。载体可以具备用于选择转化体的标记基因。载体也可以具备用于表达靶蛋白基因的启动子、终止子。
此外,靶蛋白的表达用的基因构建体可以导入宿主的染色体中。向染色体的基因的导入,可以利用同源重组而进行。具体而言,用包含靶蛋白的表达用的基因构建体的重组dna而转化宿主,与宿主的染色体上的目的位点发生同源重组,从而能够将靶蛋白的表达用的基因构建体导入宿主的染色体上。在同源重组中使用的重组dna的结构只要以期望的方式发生同源重组则没有特别限制。例如,可以是包含靶蛋白的表达用的基因构建体的线状dna,用在靶蛋白的表达用的基因构建体的两端分别具备染色体上的取代对象位点的上游和下游的序列的线状dna转化宿主,在取代对象位点的上游和下游分别发生同源重组,从而能够将取代对象位点用靶蛋白的表达用的基因构建体取代。同源重组中使用的重组dna可以具备用于选择转化体的标记基因。需要说明的是,靶蛋白基因、启动子等,向靶蛋白的表达用的基因构建体的一部分的染色体的导入也可以以与向靶蛋白的表达用的基因构建体整体的染色体的导入同样的方式进行。
标记基因可以根据宿主的营养缺陷型等的性状而适宜选择。例如,在宿主通过pyrf基因或pyrg基因的变异而表现出尿嘧啶(uracil)缺陷型的情况下,将pyrf基因或pyrg基因作为标记基因而使用,从而能够将尿嘧啶(uracil)缺陷型的互补(即非尿嘧啶(uracil)缺陷型)作为指标,选拔导入了目的修饰的菌株。此外,作为标记基因,可以使用潮霉素抗性基因等的药剂抗性基因。
就转化而言,例如,可以通过通常在霉菌、酵母等的真核微生物的转化中使用的手法而进行。作为这样的手法,可举出原生质体法。
<1-3>yscb蛋白质的活性降低
本发明的微生物经过了修饰,以使yscb蛋白质的活性降低。具体而言,本发明的微生物经过了修饰,以使得与非修饰菌株相比yscb蛋白质的活性降低。更具体而言,例如,本发明的微生物经过了修饰,可以以使yscb基因的表达降低,也可以以使yscb基因被破坏。通过以使yscb蛋白质的活性降低的方式对talaromycescellulolyticus进行修饰,而能够提高该微生物的靶蛋白生产能力,即,能够使基于该微生物的靶蛋白的生产增大。
以下,对yscb蛋白质及编码其的yscb基因进行说明。
yscb蛋白质为蛋白酶。“蛋白酶”是指,具有对使蛋白质水解的反应进行催化的活性的蛋白质。此外,也将该活性称为“蛋白酶活性”。
分别将talaromycescellulolyticuss6-25菌株的yscb基因(包含内含子)的碱基序列和该基因编码的yscb蛋白质的氨基酸序列示于分别seqidno.32和43中。即,yscb基因,例如,可以是具有seqidno.32所示的碱基序列的基因。此外,yscb蛋白质,例如,可以是具有seqidno.43所示的氨基酸序列的蛋白质。需要说明的是,“具有(氨基酸或碱基)序列”这样的表达包含该“包含(氨基酸或碱基)序列”情况和该“由(氨基酸或碱基)序列组成”情况。
yscb基因只要保持原本的功能,则可以是所述例举的yscb基因(例如,具有seqidno.32所示的碱基序列的基因)的变体。同样,yscb蛋白质只要保持原本的功能,则可以是所述例举的yscb蛋白质(例如,具有seqidno.43所示的氨基酸序列的蛋白质)的变体。有时也将这样的保持原本的功能的变体称为“保守性变体”。在本发明中,“yscb基因”这样的术语不限于所述例举的yscb基因,还包含其保守性变体。同样,“yscb蛋白质”这样的术语不限于所述例举的yscb蛋白质,还包含其保守性变体。作为保守性变体,例如可举出:所述例举的yscb基因、yscb蛋白质的同系物、人为性的修饰体。
“保持原本的功能”是指,基因或蛋白质的变体具有与原本的基因或蛋白质的功能(活性、性质)对应的功能(活性、性质)。即,“保持原本的功能”是指,在yscb基因的情况下,基因的变体编码保持原本的功能的蛋白质。此外,“保持原本的功能”是指,在yscb蛋白质的情况下,蛋白质的变体具有蛋白酶活性。
蛋白酶活性可以通过将酶与基质(蛋白质)进行培养(incubate),测定酶依赖性的基质的分解而进行测定。此外,蛋白酶活性可以使用市售的蛋白酶活性测定试剂盒而进行测定。
以下,将举例表示保守性变体。
就yscb基因的同系物或yscb蛋白质的同系物而言,例如,可以通过使用所述例举的yscb基因的碱基序列或所述例举的yscb蛋白质的氨基酸序列作为查询序列的blast检索、fasta检索而从公开数据库容易地取得。此外,就yscb基因的同系物而言,例如,可以以talaromycescellulolyticus的染色体为模板,通过使用基于这些公知的yscb基因的碱基序列而制备的寡核苷酸作为引物的pcr而取得。
yscb基因只要保持原本的功能,则可以是编码具有在所述例举的yscb蛋白质的氨基酸序列(例如,seqidno.43所示的氨基酸序列)中,1或者几个的位置上的1个或几个氨基酸被取代、缺失、插入和/或添加的氨基酸序列的蛋白质的基因。需要说明的是,所述“1个或几个”,根据氨基酸残基的蛋白质的立体结构中的位置、氨基酸残基的种类而不同,具体而言,例如为1~50个、1~40个、1~30个,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。
所述的1或者几个的氨基酸的取代、缺失、插入和/或添加是正常保持蛋白质的功能的保守性变异。代表性的保守性变异是保守性取代。保守性取代是指,在取代位点为芳香族氨基酸的情况下,是在phe、trp、tyr间相互取代的变异,在取代位点为疏水性氨基酸的情况下,是在leu、ile、val间相互取代的变异,在为极性氨基酸的情况下,是在gln、asn间相互取代的变异,在为碱基性氨基酸的情况下,是在lys、arg、his间相互取代的变异,在为酸性氨基酸的情况下,是在asp、glu间相互取代的变异,在为具有羟基的氨基酸的情况下,是在ser、thr间相互取代的变异。作为被认为是保守性取代的取代,具体而言,可举出:从ala向ser或thr的取代,从arg向gln、his或lys的取代、从asn向glu、gln、lys、his或asp的取代、从asp向asn、glu或gln的取代、从cys向ser或ala的取代、从gln向asn、glu、lys、his、asp或arg的取代、从glu向gly、asn、gln、lys或asp的取代、从gly向pro的取代、从his向asn、lys、gln、arg或tyr的取代、从ile向leu、met、val或phe的取代、从leu向ile、met、val或phe的取代、从lys向asn、glu、gln、his或arg的取代、从met向ile、leu、val或phe的取代、从phe向trp、tyr、met、ile或leu的取代、从ser向thr或ala的取代、从thr向ser或ala的取代、从trp向phe或tyr的取代、从tyr向his、phe或trp的取代和从val向met、ile或leu的取代。此外,所述的这样的氨基酸的取代、缺失、插入或添加,包含因基于源自基因的生物的个体差、物种的差异的情况等的天然产生的变异(mutant或variant)而产生的情况。
此外,yscb基因只要保持原本的功能,则可以是编码具有下述氨基酸序列的蛋白质的基因,所述氨基酸序列对整个所述例举的yscb蛋白质的氨基酸序列(例如,seqidno.43所示的氨基酸序列)具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的。需要说明的是,在本说明书中,“同源性”(homology)意味着“同一性”(identity)。
此外,yscb基因只要保持原本的功能,则可以是在严格条件下与所述例举的yscb基因的碱基序列(例如,seqidno.32所示的碱基序列)的互补序列或可以从同互补序列制备的探针进行杂交的dna。“严格条件”是指,形成所谓的特异性的杂交,不形成非特异性的杂交的条件。如果显示一个实例,可举出:同源性较高的dna彼此杂交,例如,具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的dna彼此杂交,并且同源性较低的dna彼此不杂交的条件,或者与作为通常的southern杂交的洗涤的条件的60℃,1×ssc,0.1%sds,优选为60℃,0.1×ssc,0.1%sds,更优选为68℃,0.1×ssc,0.1%sds相当的盐浓度和温度下,进行1次,优选为2~3次清洗的条件。
所述探针,例如,可以是基因的互补序列的一部分。这样的探针可以通过将基于公知的基因的碱基序列而制备的寡核苷酸作为引物,将包含这些碱基序列的dna片段设为模板的pcr而进行制备。作为探针,例如,可以使用300bp左右的长度的dna片段。在这样的情况下,作为杂交的洗涤的条件,可举出:50℃,2×ssc,0.1%sds。
此外,yscb基因可以是将任意的密码子用与其等价的密码子取代而得到基因。即,yscb基因可以是基于密码子的简并的所述例举的yscb基因的变体。
2个序列间的序列同源性的百分比,例如,可以使用数学性算法来确定。作为这样的数学性算法的非限定的实例,可举出:myersandmiller(1988)cabios4:11-17的算法,smithetal(1981)adv.appl.math.2:482的局部相同算法、needlemanandwunsch(1970)j.mol.biol.48:443-453的相同比对算法、检索pearsonandlipman(1988)proc.natl.acad.sci.85:2444-2448的类似性的方法、karlinandaltschul(1993)proc.natl.acad.sci.usa90:5873-5877中记载的那样的改良的karlinandaltschul(1990)proc.natl.acad.sci.usa87:2264的算法。
可以利用基于这些数学性算法的程序,进行用于确定序列同源性的序列比较(校准)。程序可以适宜通过计算机实行。作为这样的程序,没有特别限定,可举出:pc/gene程序的clustal(可从intelligenetics,mountainview,calif.入手)、align程序(version2.0)以及wisconsingeneticssoftwarepackage,version8(可从geneticscomputergroup(gcg),575sciencedrive,madison,wis.,usa入手)的gap、bestfit、blast、fasta和tfasta。使用了这些程序的校准,例如,可以使用初期参数而进行。对于clustal程序,良好地记载在higginsetal.(1988)gene73:237-244、higginsetal.(1989)cabios5:151-153、corpetetal.(1988)nucleicacidsres.16:10881-90、huangetal.(1992)cabios8:155-65和pearsonetal.(1994)meth.mol.biol.24:307-331中。
为了得到与编码对象的蛋白质的核苷酸序列具有同源性的核苷酸序列,具体而言,例如,可以通过blastn程序,在分数=100,字长=12下进行blast核苷酸检索。为了得到与对象的蛋白质具有同源性的氨基酸序列,具体而言,例如,可以通过blastx程序,在分数=50,字长=3下进行blast蛋白质检索。对于blast核苷酸检索、blast蛋白质检索,参照http://www.ncbi.nlm.nih.gov。此外,为了得到为了比较而添加了间隙的校准,可以利用gappedblast(blast2.0)。此外,可以利用psi-blast(blast2.0)检测序列间的离间关系并进行反复检索。对于gappedblast和psi-blast,参照altschuletal.(1997)nucleicacidsres.25:3389。在利用blast、gappedblast或psi-blast的情况下,例如,可以使用各程序(例如,针对核苷酸序列的blastn,针对氨基酸序列的blastx)的初期参数。校准可以手动执行。
2个序列间的序列同源性作为当将2个序列以变成最大一致的方式进行排列时2个序列间一致的残基的比例而算出。需要说明的是,氨基酸序列间的“同源性”,具体而言,只要没有特别说明,则是指使用通过blastp而默认设定的scoringparameters(matrix:blosum62;gapcosts:existence=11,extension=1;compositionaladjustments:conditionalcompositionalscorematrixadjustment)算出的氨基酸序列间的同源性。此外,碱基序列间的“同源性”,具体而言,只要没有特别说明,则是指使用通过blastn而默认设定的scoringparameters(match/mismatchscores=1,-2;gapcosts=linear)而算出的碱基序列间的同源性。
需要说明的是,与所述的基因、蛋白质的变体有关的记载也可以援用在靶蛋白等的任意的蛋白质和编码它们的基因中。
<1-4>其它性质
本发明的微生物只要不损害靶蛋白生产能力,就可以具有其它期望的性质(例如修饰)。作为修饰,可举出提高talaromycescellulolyticus的靶蛋白生产能力的修饰。作为修饰,具体而言,可举出降低crea蛋白质的活性的修饰。这些性质、修饰可以单独或适宜组合利用。
即,例如,可以对本发明的微生物进行修饰,使得crea蛋白的活性降低。具体而言,可以对本发明的微生物进行修饰,使其与非修饰菌株比较crea蛋白的活性降低。更具体而言,例如,可以对本发明的微生物进行修饰,使得crea基因的表达降低,或使得crea基因被破坏。crea基因是编码参与分解代谢物阻遏的转录因子的基因。已知crea基因在丝状菌中参与纤维素酶的表达(molgengenet.1996jun24;251(4):451-60,bioscibiotechnolbiochem.1998dec;62(12):2364-70)。
将talaromycescellulolyticuss6-25菌株的crea基因的碱基序列示于seqidno.44中。即,例如,crea基因可以是具有seqidno.44所示的碱基序列的基因。此外,例如,crea蛋白可以是具有通过seqidno.44所示的碱基序列而编码的氨基酸序列的蛋白质。crea基因和crea蛋白可以分别是所述例举的crea基因和crea蛋白的保守性变体。对于crea基因和crea蛋白的保守性变体可以援用对yscb基因和yscb蛋白质的保守性变体的记载。需要说明的是,“保持原本的功能”是指,在crea蛋白的情况下,蛋白质的变体具有作为参与分解代谢物阻遏的转录因子的功能。
<1-5>使蛋白质的活性降低的手法
以下,对使yscb蛋白质、crea蛋白质等的蛋白质的活性降低的手法进行说明。
“蛋白质的活性降低”是指,与非修饰菌株相比该蛋白质的活性降低。具体而言,“蛋白质的活性降低”是指,与非修饰菌株相比该蛋白质在每个细胞中的活性降低。此处所说的“非修饰菌株”是指,未以使得靶蛋白的活性降低的方式而修饰的对照菌株。作为非修饰菌株,可举出野生菌株、亲本菌株。作为非修饰菌株,具体而言,可举出talaromycescellulolyticus的说明中例举的菌株。即,在一个方式中,与talaromycescellulolyticuss6-25菌株相比蛋白质的活性可以降低。需要说明的是,“蛋白质的活性降低”也包含该蛋白质的活性完全消失的情况。更具体而言,“蛋白质的活性降低”可以是指,与非修饰菌株相比,该蛋白质在每个细胞中的分子数降低,和/或,该蛋白质的每个分子的功能降低。即,“蛋白质的活性降低”这样的情况的“活性”,不限于蛋白质的催化剂活性,可以是指编码蛋白质的基因的转录量(mrna量)或翻译量(蛋白质的量)。需要说明的是,“蛋白质在每个细胞中的分子数降低”也包含该蛋白质完全不存在的情况。此外,“蛋白质的每个分子的功能降低”也包含该蛋白质的每个分子的功能完全消失的情况。蛋白质的活性的降低的程度,如果与非修饰菌株相比蛋白质的活性降低,则没有特别限制。蛋白质的活性,例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。
这样的使蛋白质的活性降低的修饰,例如,可以通过使编码该蛋白质的基因的表达降低而达成。“基因的表达降低”是指,与非修饰菌株相比该基因的表达降低。“基因的表达降低”是指,具体而言,与非修饰菌株相比该基因在每个细胞中的表达量降低。“基因的表达降低”可以是指,更具体而言,基因的转录量(mrna量)降低,和/或,基因的翻译量(蛋白质的量)降低。“基因的表达降低”包含该基因完全不表达的情况。需要说明的是,也将“基因的表达降低”称为“基因的表达弱化”。基因的表达,例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。
基因的表达的降低,例如,可以基于转录效率的降低,可以基于翻译效率的降低,也可以基于它们的组合。基因的表达的降低,例如,可以通过对基因的表达调控序列进行修饰而达成。“表达调控序列”是影响启动子等的基因的表达的位点的总称。表达调控序列,例如,可以使用启动子检索载体、genetyx等的基因分析软件而进行确定。在对表达调控序列进行修饰的情况下,表达调控序列优选1碱基以上,更优选2碱基以上,特别优选3碱基以上被修饰。基因的转录效率的降低,例如,可以通过用更弱的启动子取代染色体上的基因的启动子而达成。“更弱的启动子”是指,基因的转录比原本存在的野生型的启动子弱的启动子。作为更弱的启动子,例如可举出诱导型的启动子。即,诱导型的启动子可以在非诱导条件下(例如,不存在诱导物质下)作为更弱的启动子而发挥功能。此外,可以使表达调控序列的一部分或全部的区域缺失(缺陷)。此外,基因的表达的降低,例如,可以通过操纵与表达控制有关的因子而达成。作为与表达控制有关的因子,可举出:与转录、翻译控制有关的低分子(诱导物质、阻碍物质等)、蛋白质(转录因子等)、核酸(sirna等)等。此外,基因的表达的降低,例如,也可以通过在基因的编码区域中导入使基因的表达降低这样的变异而达成。例如,将基因的编码区域的密码子替换为在宿主中以更低频率利用的同义密码子,因此能够使基因的表达降低。此外,例如,通过后述这样的基因的破坏而可以使基因的表达本身降低。
此外,这样的使蛋白质的活性降低的修饰,例如,可以通过对编码该蛋白质的基因进行破坏而达成。“使基因破坏”是指,对该基因进行修饰,使得不产生正常发挥功能的蛋白质。“不产生正常发挥功能的蛋白质”包含从该基因完全不产生蛋白质的情况、从该基因产生每个分子的功能(活性、性质)降低或消失的蛋白质的情况。
基因的破坏,例如,可以通过使染色体上的基因缺失(缺陷)而达成。“基因的缺失”是指,基因的编码区域的一部分或全部的区域的缺失。进一步,也可以使包含染色体上的基因的编码区域的前后的序列的整个基因缺失。基因的编码区域的前后的序列,例如,可以包含基因的表达调控序列。只要能够达成蛋白质的活性的降低,则缺失的区域可以是n末端区域(编码蛋白质的n末端侧的区域)、内部区域、c末端区域(编码蛋白质的c末端侧的区域)等的任一区域。通常,缺失的区域长的情况能够确实地使基因不活化。缺失的区域,例如,可以是基因的编码区域全长的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上或95%以上的长度的区域。此外,优选缺失的区域的前后的序列的阅读框不一致。可以通过阅读框的不一致而在缺失的区域的下游发生移码。在crea基因的情况下,具体而言,例如,通过使与seqidno.44的3262~4509位相当的部分缺失,而能够破坏该基因。
此外,基因的破坏,例如,可以通过在染色体上的基因的编码区域中导入氨基酸取代(错义突变)、导入终止密码子(无义突变)或导入1~2碱基的添加或缺失(移码变异)等而达成(journalofbiologicalchemistry272:8611-8617(1997),proceedingsofthenationalacademyofsciences,usa955511-5515(1998),journalofbiologicalchemistry26116,20833-20839(1991))。
此外,基因的破坏,例如,可以通过在染色体上的基因的编码区域中插入其他碱基序列而达成。插入位点可以是基因的任一区域,插入的碱基序列长的情况能够确实得使基因不活化。此外,优选插入位点的前后的序列的阅读框不一致。通过阅读框的不一致而可以在插入位点的下游发生移码。作为其他碱基序列,如果使编码的蛋白质的活性降低或消失则没有特别限制,例如,可举出在标记基因、靶蛋白生产中有用的基因。
特别是,可以实施基因的破坏,使得编码的蛋白质的氨基酸序列缺失(缺陷)。换而言之,这样的使蛋白质的活性降低的修饰,例如,可以通过使蛋白质的氨基酸序列缺失而达成,具体而言,可以通过以使其编码氨基酸序列缺失的蛋白质的方式对基因进行修饰而达成。需要说明的是,“蛋白质的氨基酸序列的缺失”是指,蛋白质的氨基酸序列的一部分或全部的区域的缺失。此外,“蛋白质的氨基酸序列的缺失”是指在蛋白质中原本的氨基酸序列变为不存在,也包含原本的氨基酸序列变为别的氨基酸序列的情况。即,例如,通过移码而变为别的氨基酸序列的区域可以被认为是缺失的区域。通过蛋白质的氨基酸序列的缺失,典型性地使蛋白质的全长短缩,但也可能存在蛋白质的全长不变化,或延长的情况。例如,通过使基因的编码区域的一部分或全部的区域的缺失,而能够在编码的蛋白质的氨基酸序列中,使该缺失的区域所编码的区域缺失。此外,例如,通过向基因的编码区域的终止密码子的导入,而能够在编码的蛋白质的氨基酸序列中,使在该导入位点的下游的区域所编码的区域缺失。此外,例如,通过基因的编码区域中的移码,而能够使该移码位点所编码的区域缺失。对于氨基酸序列的缺失中的缺失的区域的位置和长度,可以援用基因的缺失中的缺失的区域的位置和长度的说明。
在对染色体上的基因进行如上所述的修饰的情况下,例如可以通过下述方式达成:制备经过修饰的破坏型基因,使其不产生正常发挥功能的蛋白质,用包含该破坏型基因的重组dna转化宿主,通过破坏型基因和染色体上的野生型基因而发生同源重组,从而用破坏型基因取代染色体上的野生型基因。此时,重组dna如果根据宿主的营养缺陷型等的性状而包含标记基因,则容易操纵。作为破坏型基因,可举出:缺失了基因的编码区域的一部分或全部的区域的基因、导入了错义突变的基因、导入了无义突变的基因、导入了移码变异的基因、导入了转座子、标记基因等的插入序列的基因。由破坏型基因而编码的蛋白质,即使生成,也具有与野生型蛋白质不同的立体结构,功能降低或消失。
同源重组中使用的重组dna的结构,只要以期望的方式发生同源重组,则没有特别限制。例如为包含任意的序列的线状dna,用在该任意的序列的两端分别具备染色体上的取代对象位点的上游和下游的序列的线状dna转化宿主,分别使取代对象位点的上游和下游发生同源重组,从而能够在1步骤中用该任意的序列取代要取代对象位点。作为该任意的序列,例如可以使用包含标记基因的序列。
标记基因可以根据宿主的营养缺陷型等的性状而适宜选择。例如,在宿主通过pyrf基因或pyrg基因的变异而表现出尿嘧啶(uracil)缺陷型的情况下,通过将pyrf基因或pyrg基因作为标记基因使用,而能够将尿嘧啶(uracil)缺陷型的互补(即非尿嘧啶(uracil)缺陷型)作为指标,选拔导入有目的修饰的菌株。此外,例如,在通过sc基因(sulfatepermiase基因)的变异而表现出蛋氨酸缺陷型的情况下,通过将sc基因作为标记基因使用,而能够将蛋氨酸缺陷型的互补(即蛋氨酸非缺陷型)作为指标,选拔导入有目的修饰的菌株。此外,作为标记基因,可以使用潮霉素抗性基因等的药剂抗性基因。
此外,这样的使蛋白质的活性降低的修饰,例如,可以通过突变处理而进行。作为突变处理,可举出:x射线的照射、紫外线的照射、以及基于n-甲基-n'-硝基-n-亚硝基胍(mnng)、甲磺酸乙酯(ems)和甲基磺酸甲酯(mms)等的变异剂的处理。
可以通过对该蛋白质的活性进行测定来确认蛋白质的活性降低。yscb蛋白质的活性例如可以通过如上所述的方式进行测定。例如,crea蛋白的活性可以通过对分解代谢物阻遏的程度进行测定而测定。例如,分解代谢物阻遏的程度可以通过对包含葡萄糖作为碳源的培养条件下的纤维素酶生产进行测定而测定。即,具体而言,例如,可以通过将包含葡萄糖作为碳源的培养条件下的纤维素酶生产的提高作为指标来确认crea蛋白的活性降低。
也可以通过对编码该蛋白质的基因的表达降低进行确认来确认蛋白质的活性降低。基因的表达降低也可以通过下述方式确定:通过对该基因的转录量降低进行确认或通过对从该基因表达的蛋白质的量降低进行确认。
基因的转录量降低的确认可以通过将从该基因转录的mrna的量与非修饰菌株进行比较而进行。作为评价mrna的量的方法,可举出:northern杂交、rt-pcr等(molecularcloning(coldspringharborlaboratorypress,coldspringharbor(usa),2001))。mrna的量(例如,每细胞中的分子数),例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。。
蛋白质的量降低的确认可以使用抗体通过蛋白质印迹法而进行(molecularcloning(coldspringharborlaboratorypress,coldspringharbor(usa),2001))。蛋白质的量(例如,每细胞中的分子数),例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。
基因破坏可以通过下述方式确认:根据破坏中使用的手段,对该基因的一部分或全部的碱基序列、制限酶图谱或全长等进行确定。
就转化而言,例如,可以通过霉菌、酵母等的真核微生物的转化中通常使用的手法而进行。作为这样的手法,可举出原生质体法。
<2>本发明的方法
可以利用本发明的微生物,制造靶蛋白。具体而言,可以通过培养本发明的微生物,而制造靶蛋白。即,具体而言,本发明的方法可以是包含用培养基对本发明的微生物进行培养的、靶蛋白的制造方法。
使用的培养基,只要使得本发明的微生物能够增殖,生产靶蛋白,则没有特别限制。作为培养基,例如,可以使用根据需要而含有选自碳源、氮源、磷酸源、硫源、其它各种有机成分、无机成分的成分的培养基。本领域技术人员可以适宜设定培养基成分的种类、浓度。对于具体的培养基组成,例如,可以参照与talaromycescellulolyticus有关的报告(日本特开2003-135052、日本特开2008-271826、日本特开2008-271927等)中所述的培养基组成、里氏木霉等的其它各种纤维素酶生产微生物用的培养基组成。
就碳源而言,只要能够使本发明的微生物同化并生成靶蛋白,则没有特别限制。作为碳源,例如可举出:糖类、纤维素类基质。作为糖类,具体而言,例如可举出:葡萄糖、果糖、半乳糖、木糖、阿拉伯糖、蔗糖、乳糖、纤维二糖、糖蜜、淀粉水解物、生物质水解物。作为纤维素类基质,具体而言,例如可举出:微晶纤维素(avicel)、滤纸、废纸、纸浆、木材、稻草(ricestraw)、麦秆(straw)、稻壳、米糠、麦麸、甘蔗渣、咖啡渣、茶渣。纤维素类基质可以在进行水热分解处理、酸处理、碱处理、蒸煮、破碎、粉碎等的预处理之后用作碳源。作为市售的适宜的纤维素类基质,可举出solkafloc(internationalfibercorp,northtonawanda,ny,u.s.a)。作为碳源,可以使用1种碳源,也可以组合使用2种或2种以上的碳源。
作为氮源,具体而言,例如可举出:硫酸铵、氯化铵、磷酸铵等的铵盐、蛋白胨、酵母提取物、肉提取物、玉米浆、大豆蛋白分解物等的有机氮源、氨、尿素。作为氮源,可以使用1种氮源,也可以组合使用2种或2种以上的氮源。
作为磷酸源,具体而言,例如可举出:磷酸二氢钾、磷酸氢二钾等的磷酸盐、焦磷酸等的磷酸聚合物。作为磷酸源,可以使用1种磷酸源,也可以组合使用2种或2种以上的磷酸源。
作为硫源,具体而言,例如可举出:硫酸盐、硫代硫酸盐、亚硫酸盐等的无机硫化合物、半胱氨酸、胱氨酸、谷胱甘肽等的含硫氨基酸。作为硫源,可以使用1种硫源,也可以组合使用2种或2种以上的硫源。
作为其它各种有机成分、无机成分,具体而言,例如可举出:氯化钠、氯化钾等的无机盐类;铁、锰、镁、钙等的微量金属类;维生素b1、维生素b2、维生素b6、烟酸、烟酸酰胺、维生素b12等的维生素类;氨基酸类;核酸类;包含这些的蛋白胨、酪蛋白氨基酸、酵母提取物、大豆蛋白分解物等的有机成分。作为其它各种有机成分、无机成分,可以使用1种成分,也可以组合使用2种或2种以上的成分。
就培养条件而言,只要本发明的微生物能够增殖,生产靶蛋白,则没有特别限制。就培养而言,例如,可以在丝状菌等的微生物的培养中使用的通常的条件而进行。对于具体的培养条件,例如,可以参照与talaromycescellulolyticus有关的报告(日本特开2003-135052、日本特开2008-271826、日本特开2008-271927等)所述的培养条件、里氏木霉等的其它各种纤维素酶生产微生物用的培养条件。
就培养而言,例如,可以使用液体培养基,在好氧条件下进行。在好氧条件下的培养,具体而言,可以通过通气培养、振荡培养、搅拌培养或它们的组合而进行。就培养温度而言,例如,可以为15~43℃,特别可以为约30℃。就培养期间而言,例如,可以为2小时~20日。培养可以通过分批培养(batchculture)、流加培养(fed-batchculture)、连续培养(continuousculture)或它们的组合而实施。需要说明的是,也将培养开始时的培养基称为“初始培养基”。此外,也将流加培养或连续培养中供给至培养体系(发酵槽)中的培养基称为“流加培养基”。此外,也将在流加培养或连续培养中向培养体系中供给流加培养基称为“流加”。此外,培养可以分为预培养和主培养而实施。例如,可以在琼脂培养基等的固体培养基中进行预培养,可以在液体培养基中进行主培养。可以继续培养,例如,直至培养基中的碳源被消耗或直至本发明的微生物的活性丧失为止。
在本发明中,各培养基成分可以含有在初始培养基、流加培养基或这两者中。初始培养基中含有的成分的种类可以与流加培养基中含有的成分的种类相同,也可以不同。此外,初始培养基中含有的各成分的浓度可以与流加培养基中含有的各成分的浓度相同,也可以不同。此外,可以使用含有的成分的种类和/或浓度的不同的2种或2种以上的流加培养基。例如,在间歇性地进行多次流加的情况下,各回的流加培养基中含有的成分的种类和/或浓度可以相同,也可以不同。
各种成分的浓度可以通过气相色谱法(hashimoto,k.etal.1996.biosci.biotechnol.biochem.70:22-30)、hplc(lin,j.t.etal.1998.j.chromatogr.a.808:43-49)而进行测定
通过如上所述对本发明的微生物进行培养,而表达靶蛋白,得到包含靶蛋白的培养物。具体而言,靶蛋白可以向培养基中、菌体表层、菌体内或它们的组合积蓄。靶蛋白特别是可以积蓄在培养基中。
靶蛋白的生产可以通过蛋白质的检测或鉴定中使用的公知的方法而进行确认。作为这样的方法,例如可举出:sds-page、蛋白质印迹法(westernblotting)、质谱法、n末氨基酸序列分析、酶活性测定。这些方法可以单独使用1种,也可以组合使用2种或2种以上。
生成的靶蛋白可以适宜回收。即,本发明的靶蛋白的制造方法可以包含回收生成的靶蛋白。具体而言,就靶蛋白而言,可以作为包含靶蛋白的适当的部分而进行回收。作为这样的部分,例如可举出:培养物、培养上清液、菌体、菌体处理物(破碎物、溶解物、萃取物(无细胞萃取液))。就菌体而言,例如,可以以用丙烯酸酰胺、卡拉胶等的载体进行了固定化的固定化菌体的方式提供。
此外,可以将靶蛋白分离纯化至期望的程度。靶蛋白可以以游离的状态下而提供,也可以以进行了在树脂等的固相中的固定化的固定化酶的状态下而提供。
在将靶蛋白积蓄在培养基中的情况下,就靶蛋白而言,例如,可以在通过离心分离等从培养物中除去菌体等的固体成分后,从上清液中分离纯化。
在靶蛋白在菌体内的情况下,就靶蛋白而言,例如,可以在对菌体进行破碎、溶解或萃取等的处理后,从处理物中分离纯化。菌体可以通过离心分离等而从培养物中回收。细胞的破碎、溶解或萃取等的处理可以通过公知的方法而进行。作为这样的方法,例如可举出:超声波破碎法、dyno-mill法、珠粒破碎、法式压制破碎(frenchpresscrushing)、溶菌酶处理。这些方法可以单独使用1种,也可以组合使用2种或2种以上。
在靶蛋白积蓄在菌体表层的情况下,就靶蛋白而言,例如,可以在进行可溶化后,从可溶化物中分离纯化。可溶化可以通过公知的方法而进行。作为这样的方法,例如可举出:盐浓度的上升、表面活性剂的使用。这些方法可以单独使用1种,也可以组合使用2种或2种以上。
靶蛋白的纯化(例如,从如上所述的上清液、处理物或可溶化物中的纯化)可以通过蛋白质的纯化中使用的公知的方法而进行。作为这样的方法,例如可举出:硫酸铵分级分离、离子交换色谱法、疏水色谱法、亲和色谱法、凝胶过滤色谱法、等电点沉淀。这些方法可以单独使用1种,也可以组合使用2种或2种以上。
需要说明的是,培养物中,与靶蛋白同时,还可以生成积蓄其他酶,例如,纤维素酶、木聚糖酶、木糖苷酶(β-木糖苷酶)、阿拉伯呋喃糖苷酶(arabinofuranosidase)等的半纤维素酶。靶蛋白可以作为与这些其他酶形成的混合物而回收,也可以与这些其他酶分离而回收。
回收的靶蛋白可以适宜制剂化。剂形没有特别限制,可以根据靶蛋白的使用用途等的各种条件而适宜设定。作为剂形,例如可举出:液剂、悬浮剂、散剂、片剂、丸剂、胶囊剂。在制剂化中,例如可以使用:赋形剂、粘合剂、崩解剂、润滑剂、稳定剂、矫味剂、矫臭剂、香料、稀释剂、表面活性剂等的药理学上容许的添加剂。
实施例
以下,通过非限定性的实施例而进一步对本发明具体性地进行说明。
(1)talaromycescellulolyticus的yscb基因缺陷菌株f09δyscb的构建
将talaromycescellulolyticusf09菌株(日本特开2016-131533)作为亲本菌株,通过以下步骤而破坏yscb基因(seqidno.32),构建t.cellulolyticusf09δyscb菌株。f09菌株是将t.cellulolyticuss6-25菌株(nitebp-01685)作为亲本菌株而得到的在pyrf基因中具有变异(单碱基取代)的菌株。f09菌株通过pyrf基因的变异而表现出尿嘧啶(uracil)缺陷型。
首先,根据以下步骤而制成具有按照t.cellulolyticus的yscb基因上游区域、潮霉素抗性基因、t.cellulolyticus的yscb基因下游区域的顺序连接的碱基序列的yscb基因破坏用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.1和2)的pcr而使yscb基因的上游区域扩增,通过使用了引物(seqidno.3和4)的pcr而使yscb基因的下游区域扩增。此外,将搭载有潮霉素抗性基因的pcdna3.1/hygro(+)(lifetechnologies)作为模板,通过使用了引物(seqidno.5和6)的pcr而使潮霉素抗性基因(包含启动子和终止子)扩增。使用wizardsvgelandpcrclean-upsystem(promega)使pcr产物纯化。通过in-fusionhdcloningkit(takarabio)而将纯化的pcr产物导入并与试剂盒随附的puc质粒连接。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了yscb基因破坏用dna片段的puc-yscb::hyg质粒。将puc-yscb::hyg质粒作为模板,通过使用了引物(seqidno.1和4)的pcr而使yscb基因破坏用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。
接下来,将f09菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在琼脂培养基上形成的菌落的末端附近打孔而得到的1个琼脂盘接种至包含24g/lpotatodextrosebroth的培养基中,在30℃、220rpm的条件下进行2天旋转培养。通过离心分离(5000rpm,5分钟)而回收菌体,添加包含10g/lyatalase(takarabio)、10mmkh2po4、0.8mnacl的水溶液(ph6.0)30ml,在振荡的同时使其在30℃下进行2小时反应,消化细胞壁而进行原生质体化。通过玻璃过滤器而除去残渣后,通过离心分离(2000rpm,10分钟)而回收原生质体,通过包含1.2m山梨糖醇、10mmcacl2的tris-hcl缓冲液(ph7.5)而悬浮成1ml,制备原生质体溶液。在200μl的原生质体溶液中,添加10μg纯化的yscb破坏用dna片段和50μl包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5),在冰上放置30分钟。然后进一步添加1ml的包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5)并进行混合,在室温下放置15分钟而进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖、1g/l尿嘧啶(uracil)、1g/l尿苷的最小必需培养基(10g/l葡萄糖、10mmnh4cl、10mmkh2po4、7mmkcl、2mmmgso4、0.06mg/lh3bo3、0.26mg/l(nh4)6mo7o24·4h2o、1mg/lfecl3·6h2o、0.4mg/lcuso4·5h2o、0.08mg/lmncl2、2mg/lzncl2、20g/lbactoagar)中,在30℃下培养1天后,覆盖包含0.5g/lhygromycinb、24g/lpotatodextrosebroth、7g/lbactoagar的培养基,进一步在30℃下培养3天,从而选拔潮霉素抗性菌株。将出现的菌落接种至包含0.5g/lhygromycinb的最小必需培养基中,在30℃下培养4天后,确认yscb基因被hygromycin抗性基因取代,得到源自f09的yscb破坏菌株(f09δyscb菌株)。
(2)人血清白蛋白(hsa)表达菌株的构建和培养评价
将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建人血清白蛋白(hsa)表达菌株。
首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、hsa基因(seqidno.35)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的hsa表达用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和12)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.15和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.17和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.19和20)的pcr而使hsa基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了hsa表达用dna片段的puc-crea::pcbh2-hsa-pyrf质粒。将puc-crea::pcbh2-hsa-pyrf质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使hsa表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与hsa表达序列的两端连接,可以不是在基因组上的随机的位置,而是针对crea基因区域而插入hsa表达序列。
接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的hsa表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被hsa表达序列取代,得到源自f09菌株和f09δyscb菌株的hsa表达菌株。
将源自f09菌株和f09δyscb菌株的hsa表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。
为了确认hsa的分泌生产,而将得到的培养液上清液提供至sds-page后,进行基于抗hsa抗体(sigma,a6684)的蛋白质印迹(westernblotting)。结果示于图1。在f09菌株的情况下,虽然可以确认hsa的带,但是非常薄,并且,在低分子量侧观察到被认为是分解物的带。另一方面,在f09δyscb菌株的情况下,可以确认浓的hsa的带,在低分子量侧几乎未观察到带。这暗示,在f09菌株的情况下,hsa分解,而在f09δyscb菌株的情况下,hsa的分解得到抑制,从而使得hsa的分泌生产量增加。因此,进行基于使用albuminelisaquantitationkit,human(bethyllaboratories公司)的elisa的hsa的定量。结果示于表1。确认了,与f09菌株相比,在f09δyscb菌株情况下hsa分泌生产量增加,因此,显示通过yscb基因缺陷而提高hsa的分泌生产量。
表1
(3)曲妥珠单抗表达菌株的构建和培养评价
将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建曲妥珠单抗表达菌株。
首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、曲妥珠单抗重链基因(seqidno.38)、t.cellulolyticus的cbh1基因下游区域(cbh1终止子;seqidno.39)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、曲妥珠单抗轻链基因(seqidno.40)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的曲妥珠单抗表达用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和21)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.22和23)的pcr而使cbh1基因的下游区域扩增,通过使用了引物(seqidno.24和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.25和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和26)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.27和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.28和29)的pcr而使曲妥珠单抗重链基因扩增,通过使用了引物(seqidno.30和31)的pcr而使曲妥珠单抗轻链基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了曲妥珠单抗表达用dna片段的puc-crea::pcbh2-her_h-pyrf-pcbh2-her_l质粒。将puc-crea::pcbh2-her_h-pyrf-pcbh2-her_l质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使曲妥珠单抗表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与曲妥珠单抗表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入曲妥珠单抗表达序列。
接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的曲妥珠单抗表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被曲妥珠单抗表达序列取代,得到源自f09菌株和f09δyscb菌株的曲妥珠单抗表达菌株。
将源自f09菌株和f09δyscb菌株的曲妥珠单抗表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。
为了确认曲妥珠单抗的分泌生产,而使用proteusproteinaantibodypurificationmidikit(bio-rad)将得到的培养液上清液提供至基于proteina的抗体纯化。将从同量的培养液上清液中得到的溶出液提供至sds-page。结果示于图2。同时,将进行了电泳的曲妥珠单抗标准品(chugaipharmaceutical)的阶段稀释液作为对照,通过图像分析而计算样品中的曲妥珠单抗浓度。轻链的带的结果示于表2。对于重链的带,确认也与具有表2同样的倾向。确认与f09菌株相比,在f09δyscb菌株的情况下,曲妥珠单抗分泌生产量增加,因此,显示通过yscb基因缺陷而使曲妥珠单抗的分泌生产量提高。
表2
(4)纳武单抗表达菌株的构建和培养评价
将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建纳武单抗表达菌株。
首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、纳武单抗重链基因(seqidno.45)、t.cellulolyticus的cbh1基因下游区域(cbh1终止子;seqidno.39)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、纳武单抗轻链基因(seqidno.46)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的纳武单抗表达用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和21)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.22和23)的pcr而使cbh1基因的下游区域扩增,通过使用了引物(seqidno.24和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.25和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和26)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.27和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.47和48)的pcr而使纳武单抗重链基因扩增,通过使用了引物(seqidno.49和50)的pcr而使纳武单抗轻链基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了纳武单抗表达用dna片段的puc-crea::pcbh2-opd_h-pyrf-pcbh2-opd_l质粒。将puc-crea::pcbh2-opd_h-pyrf-pcbh2-opd_l质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使纳武单抗表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与纳武单抗表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入纳武单抗表达序列。
接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的纳武单抗表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被纳武单抗表达序列取代,得到源自f09菌株和f09δyscb菌株的纳武单抗表达菌株。
将源自f09菌株和f09δyscb菌株的纳武单抗表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。
就纳武单抗的分泌生产量而言,通过humaniggelisaquantitationkit(bethyllaboratories公司)而测定为培养液上清液中的人igg量。结果示于表3。确认与f09菌株相比,在f09δyscb菌株的情况下,纳武单抗分泌生产量增加,因此,显示通过yscb基因缺陷而使纳武单抗的分泌生产量提高。
表3
(5)角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)表达菌株的构建和培养评价
将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)表达菌株。
首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、编码添加有his6标签的kgf-1的基因(seqidno.51)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的kgf-1表达用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和12)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.15和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.17和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.52和53)的pcr而使编码添加有his6标签的kgf-1的基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了kgf-1表达用dna片段的puc-crea::pcbh2-kgf1-pyrf质粒。将puc-crea::pcbh2-kgf1-pyrf质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使kgf-1表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与kgf-1表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入kgf-1表达序列。
接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的kgf-1表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被kgf-1表达序列取代,得到源自f09菌株和f09δyscb菌株的kgf-1表达菌株。
将源自f09菌株和f09δyscb菌株的kgf-1表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中、在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。
为了确认kgf-1的分泌生产,而将得到的培养液上清液提供至基于ni-ntaagarose(qiagen)的his标签纯化,将纯化物提供至sds-page。具体而言,将ni-ntaagarose(qiagen)添加至将ph调整至8.0的培养上清液中并进行1小时混和后,用50mm磷酸缓冲液(ph8.0)清洗,添加sds-page的样品缓冲液并在95℃下加热5分钟,将上清液提供至sds-page。结果示于图3。确认与f09菌株相比,在f09δyscb菌株的情况下,kgf-1分泌生产量增加,因此,显示通过yscb基因缺陷而使kgf-1的分泌生产量提高。
(6)血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)表达菌株的构建和培养评价
将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)表达菌株。
首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、编码添加有his6标签的vegf的基因(seqidno.54)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的vegf表达用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和12)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.15和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.17和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.55和56)的pcr而使编码添加有his6标签的vegf的基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了vegf表达用dna片段的puc-crea::pcbh2-vegf-pyrf质粒。将puc-crea::pcbh2-vegf-pyrf质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使vegf表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与vegf表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入vegf表达序列。
接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的vegf表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被vegf表达序列取代,得到源自f09菌株和f09δyscb菌株的vegf表达菌株。
将源自f09菌株和f09δyscb菌株的vegf表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。
为了确认vegf的分泌生产,而将得到的培养液上清液提供至基于ni-ntaagarose(qiagen)的his标签纯化,将纯化物提供至sds-page。具体而言,将ni-ntaagarose(qiagen)添加至将ph调整至8.0的培养上清液中并进行1小时混和后,用50mm磷酸缓冲液(ph8.0)清洗,添加sds-page的样品缓冲液并在95℃下加热5分钟,将上清液提供至sds-page。结果示于图4。确认与f09菌株相比,在f09δyscb菌株的情况下,vegf分泌生产量增加,因此,显示通过yscb基因缺陷而使vegf的分泌生产量提高。
(7)与异源蛋白分解有关的蛋白酶的分析
(7-1)与异源蛋白分解有关的蛋白酶的定位分析
如上所述,(2)中将talaromycescellulolyticusf09菌株(日本特开2016-131533)作为宿主而分泌生产作为异源蛋白的hsa,其结果,观察到hsa的分解(图1)。因此,为了调查与异源蛋白分解有关的蛋白酶的定位,而以如下所述的方式制备f09菌株的培养液上清液。首先,将f09菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o、1g/l尿嘧啶、1g/l尿苷的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器而除去菌体,得到培养液上清液。将培养液上清液与纯化hsa(abcam,ab201876)混合,在30℃下静置3天。接着,将混合液提供至sds-page,进行基于抗hsa抗体(sigma,a6684)的蛋白质印迹(westernblotting)。结果示于图5。分子量比has小的位置处观察到分解物的多个带,由此出发,观察到hsa的分解。该结果暗示,f09菌株的培养液上清液中包含与异源蛋白分解有关的蛋白酶。
(7-2)与异源蛋白分解有关的蛋白酶候补基因的提取
为了提取与异源蛋白分解有关的蛋白酶候补基因,而通过离心分离(5000rpm,5分钟)从(7-1)中得到的培养液中回收f09菌株的菌体,使用rneasyplantminikit(qiagen)而进行totalrna的提取。通过truseqstrandedmrnasampleprepkit(illumina)而从得到的totalrna进行文库制备,通过新一代测序仪miseq使用miseqreagentkitv2500cycle(illumina)而实施表达分析。提取蛋白酶和注释了的基因,按表达量(映射的读取数)顺序排序的结果示于表4。需要说明的是,由于具有最高表达量的cbh1基因为140000读数,第2高表达量的cbh2基因为80000读数,因此,排除800读数以下的。提取表4所示的5个基因作为蛋白酶候补基因。虽然暗示(7-1)中培养液上清液包含蛋白酶,但考虑基于溶菌的蛋白酶的溶出、注释的差异等,因此不考虑注释上的定位,将全部这5个基因作为候补而实施之后的研究。
[表4]
(7-3)提取的蛋白酶候补基因缺陷菌株的构建
将talaromycescellulolyticusf09菌株(日本特开2016-131533)作为亲本菌株,通过以下步骤而破坏蛋白酶候补基因(胃蛋白酶(pepsin)1:seqidno.57,yscb:seqidno.32,cpy:seqidno.58,胃蛋白酶(pepsin)2:seqidno.59,嗜热菌蛋白酶(thermolysin):seqidno.60),构建源自t.cellulolyticusf09的蛋白酶候补基因缺陷菌株。f09菌株是将t.cellulolyticuss6-25菌株(nitebp-01685)作为亲本菌株而得到的在pyrf基因中具有变异(单碱基取代)的菌株。f09菌株通过pyrf基因的变异而表现出尿嘧啶(uracil)缺陷型。
首先,根据以下步骤而制成具有按照t.cellulolyticus的蛋白酶候补基因上游区域、pyrf基因、t.cellulolyticus的蛋白酶候补基因下游区域的顺序连接的碱基序列的蛋白酶候补基因破坏用dna片段。
将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.61和62)的pcr而使胃蛋白酶(pepsin)1基因的上游区域扩增,通过使用了引物(seqidno.62和63)的pcr而使胃蛋白酶(pepsin)1基因的下游区域扩增,通过使用了引物(seqidno.1和65)的pcr而使yscb基因的上游区域扩增,通过使用了引物(seqidno.66和4)的pcr而使yscb基因的下游区域扩增,通过使用了引物(seqidno.67和68)的pcr而使cpy基因的上游区域扩增,通过使用了引物(seqidno.69和70)的pcr而使cpy基因的下游区域扩增,通过使用了引物(seqidno.71和72)的pcr而使胃蛋白酶(pepsin)2基因的上游区域扩增,通过使用了引物(seqidno.73和74)的pcr而使胃蛋白酶(pepsin)2基因的下游区域扩增,通过使用了引物(seqidno.75和76)的pcr而使嗜热菌蛋白酶(thermolysin)基因的上游区域扩增,通过使用了引物(seqidno.77和78)的pcr而使嗜热菌蛋白酶(thermolysin)基因的下游区域扩增。此外,将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.79和80)的pcr而使pyrf基因(包含启动子和终止子)扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。通过in-fusionhdcloningkit(takarabio)而将纯化的上游区域、下游区域和pyrf基因的pcr产物导入并与试剂盒随附的puc质粒连接。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了蛋白酶候补基因破坏用dna片段的质粒。将这些质粒作为模板,通过使用了引物(胃蛋白酶(pepsin)1:seqidno.61和64,yscb:seqidno.1和4,cpy:seqidno.67和70,胃蛋白酶(pepsin)2:seqidno.71和74,嗜热菌蛋白酶(thermolysin):seqidno.75和78)的pcr而使蛋白酶候补基因破坏用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。
接下来,将f09菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至包含24g/lpotatodextrosebroth的培养基中,在30℃,220rpm的条件下进行2天旋转培养。通过离心分离(5000rpm,5分钟)而回收菌体,添加包含10g/lyatalase(takarabio)、10mmkh2po4、0.8mnacl的水溶液(ph6.0)30ml,在振荡的同时使其在30℃下进行2小时反应,消化细胞壁而进行原生质体化。通过玻璃过滤器而除去残渣后,通过离心分离(2000rpm,10分钟)而回收原生质体,通过包含1.2m山梨糖醇、10mmcacl2的tris-hcl缓冲液(ph7.5)而悬浮成1ml,制备原生质体溶液。在200μl的原生质体溶液中,添加10μg纯化的各蛋白酶候补破坏用dna片段和50μl包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5),在冰上放置30分钟。然后进一步添加1ml的包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5)并进行混合,在室温下放置15分钟而进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基(10g/l葡萄糖、10mmnh4cl、10mmkh2po4、7mmkcl、2mmmgso4、0.06mg/lh3bo3、0.26mg/l(nh4)6mo7o24·4h2o、1mg/lfecl3·6h2o、0.4mg/lcuso4·5h2o、0.08mg/lmncl2、2mg/lzncl2、20g/lbactoagar)中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认各蛋白酶候补基因区域被pyrf基因取代,得到源自f09菌株的蛋白酶候补基因缺陷菌株。
(7-4)蛋白酶候补基因缺陷菌株的培养液上清液的蛋白酶活性的评价
将各蛋白酶候补基因缺陷菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。以与(7-1)同样的方式而将培养液上清液与纯化hsa混合而对蛋白酶活性进行评价。结果示于图6。在胃蛋白酶(pepsin)1、cpy、胃蛋白酶(pepsin)2、嗜热菌蛋白酶(thermolysin)缺陷菌株的情况下与f09菌株同样,在分子量比hsa小的位置观察到分解物的多个带,由此出发,观察到hsa的分解。另一方面,在yscb缺陷菌株中,分解物的带消失。该结果表明,yscb是承担f09菌株中培养上清液中的异源蛋白分解的蛋白酶。
工业实用性
通过本发明而能够高效地制造蛋白质。
<序列表的说明>
seqidno.1~31:引物
seqidno.32:talaromycescellulolyticuss6-25菌株的yscb基因的碱基序列
seqidno.33:talaromycescellulolyticus的cbh2启动子的碱基序列
seqidno.34:talaromycescellulolyticus的编码cbh1信号肽的碱基序列
seqidno.35:人血清白蛋白(hsa)基因的碱基序列
seqidno.36:cbh2终止子的碱基序列
seqidno.37:talaromycescellulolyticus的pyrf基因标记的碱基序列
seqidno.38:曲妥珠单抗重链基因的碱基序列
seqidno.39:cbh1终止子的碱基序列
seqidno.40:曲妥珠单抗轻链基因的碱基序列
seqidno.41:talaromycescellulolyticus的cbh1启动子的碱基序列
seqidno.42:talaromycescellulolyticus的cbh1信号肽的氨基酸序列
seqidno.43:talaromycescellulolyticuss6-25菌株的yscb蛋白质的氨基酸序列
seqidno.44:talaromycescellulolyticuss6-25菌株的crea基因的碱基序列
seqidno.45:纳武单抗重链基因的碱基序列
seqidno.46:纳武单抗轻链基因的碱基序列
seqidno.47~50:引物
seqidno.51:角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)基因的碱基序列
seqidno.52~53:引物
seqidno.54:血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)基因的碱基序列
seqidno.55~56:引物
seqidno.57:胃蛋白酶(pepsin)1基因的碱基序列
seqidno.58:cpy基因的碱基序列
seqidno.59:胃蛋白酶(pepsin)2基因的碱基序列
seqidno.60:嗜热菌蛋白酶(thermolysin)基因的碱基序列
seqidno.61~80:引物
序列表
<110>ajinomotoco.,inc.
<120>蛋白质的制造方法
<130>e047-18419
<150>jp2017-196538
<151>2017-10-10
<160>80
<170>patentinversion3.5
<210>1
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>1
cggtacccggggatcttggggcacagagacaacagggtca40
<210>2
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>2
agatagggttgagtgagatagcgtgagcacactgagcagg40
<210>3
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>3
aaagtgtaaagcctgcaacacgctacctcttccacagtag40
<210>4
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>4
cgactctagaggatcgagctgattgagcatgctaacgcag40
<210>5
<211>21
<212>dna
<213>人工序列
<220>
<223>引物
<400>5
cactcaaccctatctcggtct21
<210>6
<211>24
<212>dna
<213>人工序列
<220>
<223>引物
<400>6
caggctttacactttatgcttccg24
<210>7
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>7
cggtacccggggatcagcgcagaccaatgccagaggagaa40
<210>8
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>8
gcgcgagttgcgcgatgaaatttat25
<210>9
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>9
tcgcgcaactcgcgctgctatgcagttgatgctactgtgt40
<210>10
<211>30
<212>dna
<213>人工序列
<220>
<223>引物
<400>10
agttgctaaatgatcaagaagcttcacttt30
<210>11
<211>45
<212>dna
<213>人工序列
<220>
<223>引物
<400>11
acagctggtgctcagaagtgggtcaccttcatctctctcctcttc45
<210>12
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>12
ctgagcaccagctgttgccagcaag25
<210>13
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>13
tagatcagctttgagtgcagcaaaa25
<210>14
<211>27
<212>dna
<213>人工序列
<220>
<223>引物
<400>14
gcttgtttgagaatacatgaggttgcc27
<210>15
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>15
tattctcaaacaagcgtcaattcagatcggctgccgcctg40
<210>16
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>16
ataagtgaacgccgagtcagtacta25
<210>17
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>17
tcggcgttcacttatcctctttctcgccctttcttctcaa40
<210>18
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>18
cgactctagaggatcaaccgtcgatcagaaggagcgcaat40
<210>19
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>19
acagctggtgctcagaagtgggtcaccttcatctctctcc40
<210>20
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>20
ctcaaagctgatctacaaaccaagagcagcttgactagcg40
<210>21
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>21
gacgagctggacttcctgagcaccagctgttgccagcaag40
<210>22
<211>30
<212>dna
<213>人工序列
<220>
<223>引物
<400>22
taaattttcacttctttcttcgcctattga30
<210>23
<211>45
<212>dna
<213>人工序列
<220>
<223>引物
<400>23
ccgatctgaattgacccgaaaacggtaaggcgtagttatagaaat45
<210>24
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>24
gtcaattcagatcggctgccgcctg25
<210>25
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>25
tcggcgttcacttattgctatgcagttgatgctactgtgt40
<210>26
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>26
tgtcatctggatgtcctgagcaccagctgttgccagcaag40
<210>27
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>27
tattctcaaacaagccctctttctcgccctttcttctcaa40
<210>28
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>28
gaagtccagctcgtcgagtctggtg25
<210>29
<211>37
<212>dna
<213>人工序列
<220>
<223>引物
<400>29
agaagtgaaaatttatttaccaggagacaaggacaga37
<210>30
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>30
gacatccagatgacacagtcccctt25
<210>31
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>31
ctcaaagctgatctaacactcaccacggttgaaggactta40
<210>32
<211>1589
<212>dna
<213>talaromycescellulolyticus
<400>32
atgaagggcgtcctcagcctttcgctgctgccgttgttgacggttgcgtcaccggtgatg60
ccgcgcaccatccacaacgacgctgctcccattctctcttcgtccaacgccgttgaggtc120
ccagattcatatatcattgtctttaaagaccatgtagattctgcttctgccgcagcccat180
cataactgggtgcaagacattcacagccaacacaccgagctccgaaagcggtctcaattc240
ccattcgctgacaatgcctttgccggtctcaaacacacttttgacattgccggcagcttc300
cttggttactcaggacacttcgaagagaatgtcattgaggccattcgccgacaccccgat360
gtgagttatccgcacgtgccctactcctaaggcaatgactaatacgcatctccacctata420
ggttgattacatcgagaaggattctcttgtccacaccatggaagatcccgcccttgagaa480
gaacgccccatggggtttggctcgtatttcgcaccgtgagagcttgagcttcggaagctt540
caacaagtacttgtacgctgccgacggcggtgaaggtgttgacgtttatgtcattgacac600
tggtaccaacatcgaccacgtcgacttcgagggtcgtgcttcctggggcaagaccatccc660
cactgacgatgaggatgttgatggcaatggtcacggtactcactgctccggaactattgc720
gggcaagaagtacggtgttgccaagaaggccaatgtctacgctgtcaaggtcttgaagtc780
taacggttctggaaccatgtccgatgtcgttcagggtgtcgaatgggctgctactcagca840
catcaagaaggtcaaggacgccaaggccggaaaagccaagggcttcaagggtagcgctgc900
gaacatgagtctcggtggtggcaagtccgtcactcttgacaaggctgtcaatgctgctgt960
tgatgctggtatccacttcgctgtcgctgctggcaacgacaacgccgactcctgcaacta1020
ctcccctgccgccgctgagaaggccgtcaccgtcggagcctcgaccttggccgatgagcg1080
tgcttacttctccaactacggcaagtgcaacgacatctttgctcctggtctgaacattct1140
ctctacctggatcggcagcaagtacgccgtcaacaccatctccggtacctccatggcttc1200
tcctcacattgctggtcttttggcctacttcctctctctccagcctgccagtgactccgc1260
cttcgctgttgccgagattactcccaagaagttgaaggagaacctcattgctattggtac1320
ccagggcgctcttactgatgttccctctgacaccactaacgtaagttgactctgttagtc1380
tttcaatgcattatcaactaacaactgtgtcatagattctcgcctggaacggtggtggct1440
cagccaactacaccgacatcattgcccaaggtggttacaagaccaagacactcagcaacg1500
aagttgacgaattgatcaacaagttggaggtcgtgaacgaggaactcggtgccatctaca1560
gccacatcaaggatgccattgccgcataa1589
<210>33
<211>1100
<212>dna
<213>talaromycescellulolyticus
<400>33
tgctatgcagttgatgctactgtgttctaaaataattgatagggttagggtcgggtataa60
ggcgatgcaatgtatcaattatcacgagaaataatgcagaaaaacacaattccccgtatc120
tgttgattcttaaacaatctgatcaccaatttgtagaaagaaacgattataaggtgccat180
ggtaatgctggagtttacacaggatactacttgttctgttcattacaatgaaccgtaatt240
gcattctgttttgaccactcaacaaatcctacacaaaagtaagtggacttcagtgctcgc300
tctacgcaagtaaatacttggcatatatggcctcgtatattcttacaatgaggtaaattc360
cgatagattactgcccaactagtcaatcttaaatccttaagagatacagggggaggcgga420
agtacctgaaaccacgtaataagacgttcagggtcatgtgaatgtatgtagtatccatgt480
ccaatacaattgataatagtatccagtattatatctcattcaggtaagcgccacgcgatt540
cttcagatctacttaactgccgactcgccaaacgaaacaacgtttattcgtgaccccaga600
aaatcaccgcggagttgcggaggaccagtttgtacaatgcaccgaaccaagcgttggtca660
tttttctggaaatgggccaaacgttagaagtgattggtcagagctacatctgaaggtgaa720
gcaatttccggtatgcatacatgacagcaagcttacctaccaagaccaagttattcccca780
gcatttgccccatacttggctttaatattgtgggatagcaaacaatatccacaacactga840
tgataactaaactacaaatctgacgttacttcagactactcacgtgtcaaaagcagttag900
cgaggatcaagtcttttagtctggtcattaacaaacgcaatttcgcaacccgataatccg960
cgatgataatatagcgactccaaggtcgtatttatattcaatcaattccccccaatttgg1020
aatggatttttggaatcatcgcatgccaggacaatcagtgaaacagtgacaaagtgaagc1080
ttcttgatcatttagcaact1100
<210>34
<211>78
<212>dna
<213>talaromycescellulolyticus
<400>34
atgtctgccttgaactctttcaatatgtacaagagcgccctcatcttgggctccttgctg60
gcaacagctggtgctcag78
<210>35
<211>1827
<212>dna
<213>智人
<400>35
aagtgggtcaccttcatctctctcctcttcttgttctccagcgcctacagccgtggtgtt60
ttccgtcgtgacgcacacaagtccgaagtggcccatcgcttcaaagacctcggtgaggaa120
aacttcaaggctctcgtcttgattgccttcgctcagtacttgcaacagtgccctttcgag180
gaccacgtgaagctggtcaacgaagttaccgaattcgccaaaacctgcgttgctgacgag240
tctgccgaaaactgcgataagtctctgcataccttgttcggcgacaagctctgtactgtc300
gctaccctccgtgagacctacggagaaatggccgattgttgcgccaagcaggagcctgag360
cgtaatgagtgctttctgcagcacaaggacgacaaccccaatttgcctcggcttgttcgt420
cctgaggttgacgtcatgtgtaccgccttccacgataacgaggaaaccttcctcaagaag480
tacctctacgagatcgcaagacgccatccctacttctacgctcctgaattgctgttcttt540
gccaagcgttacaaggcagcattcactgagtgttgtcaagccgctgacaaggccgcctgc600
ttgctccccaagttggatgaactccgcgatgagggtaaggcctctagcgccaaacagcgc660
cttaagtgcgcctctttgcagaagttcggtgagagagccttcaaagcctgggctgttgct720
cgtctatcccaacgtttccctaaagccgagtttgctgaagtttccaaactcgtcactgac780
ctgacaaaggtccatactgagtgctgccacggtgacttgttggagtgtgctgatgatcgt840
gccgatttggcaaagtacatctgcgagaaccaggacagcatctcctccaagttgaaggag900
tgctgcgaaaagcccttgctcgagaagtcccactgcattgcggaggtcgagaacgacgaa960
atgcctgccgacttgccttctttggctgctgacttcgtcgaaagcaaggatgtctgcaag1020
aactacgctgaagccaaagacgtgttcttgggcatgttcttgtacgagtatgctcgtcgc1080
caccctgactactccgtggttcttctcctccgtctcgccaagacatacgagacgactttg1140
gagaagtgctgtgccgctgccgaccctcacgagtgctatgccaaggtcttcgacgaattc1200
aagcccttagtcgaagaacctcagaacttaatcaagcagaattgtgagctattcgagcaa1260
ctcggtgagtacaagttccagaacgcgttactggtccggtacaccaagaaggttccccaa1320
gtctccactcctaccttggttgaggtctctcgtaacttgggtaaggttggaagcaagtgc1380
tgtaagcaccccgaagccaagcgtatgccttgcgctgaagactacctgtcggtcgtcttg1440
aaccaattgtgcgtcttgcacgagaagactcccgttagcgatcgtgttaccaagtgttgt1500
accgaaagcttggttaaccgtcgtccctgcttctccgctttggaagtcgatgagacttac1560
gttcctaaggagttcaacgccgaaaccttcacctttcacgctgatatctgcactctgtca1620
gagaaagagcgtcagatcaagaagcaaaccgcactcgttgagcttgtcaagcacaaaccc1680
aaagccaccaaggaacagctcaaagccgtcatggacgatttcgctgccttcgtcgagaaa1740
tgctgcaaagccgacgacaaggagacgtgcttcgcggaagagggcaagaagttggtcgcc1800
gctagtcaagctgctcttggtttgtag1827
<210>36
<211>497
<212>dna
<213>talaromycescellulolyticus
<400>36
atcagctttgagtgcagcaaaaatgcttccgactgtcttcttatattgatatcatatttt60
tcaattcactttgtctcaagtttcaatatatcgagaaaatagtatcaaagatgaactgta120
ataattccgatatacctatacaggtttatagtaaattactctatttcataatgcgtccat180
ccgagaagtctggcggccttatcagtagtccaaaacgcctggtttttagacatgtcacct240
ctaatctccgcttgaggaaaatgcgtccgagcaagttctttcgacggggtgtcttgggtc300
gtagttggagatatgatatttattacttcgaatcctttgatattctcactcttttcaacc360
gccaaaaggcaagctcttgccactgcgcgaggattaacccatccccagagttgtcgaacc420
ccagattcataccatttatcgtggtgtctttttctaacatctctcaatggggcaacctca480
tgtattctcaaacaagc497
<210>37
<211>2858
<212>dna
<213>talaromycescellulolyticus
<400>37
gtcaattcagatcggctgccgcctgcgccccaggtgacgtcgatgaaagctgggcctagg60
tcgtgcatgcggtccatacggtcgtataagttctggacaccttgggcggtctttgggggg120
aagtattcgaaggaaattccaggtcggccggtggccgcctgttcttggagcttttgcccg180
acatgcatgttgataggtcggtcaattgtctgctttttcaatatcttctcggtatgatgt240
agcttgcagaacccaagttatgtagttcaattgcaaaatcaagtctgatcaagaccgaaa300
ctcaatcccggagcactgaggttcgcactaattgatcaagggtacaagaatgaggggcac360
aatgaaagcagtcttgaaaatgacaggcagagaaattgaaagaaaggagaagagaggacc420
tccgggacaggagaaatgaaagcaacaaaaccccgaacaagctggagagaagttaaaggg480
agcagcttggtcaccggcaatggatgctcatcataaaaaaggaccctaaacccgttatcg540
gagtccggagaaatgacgctaattcggatttggaagtccccgccaatcgtgggaaattct600
cgaagcagacaatttgctcgtgacaatcagccagcaatgagagggagactgaaaaatatg660
tatttacactcaaagaatccgatactgctattaggatcagtgtttttcttataagcaaat720
gagcgttggacgtggaaaatgaggaatcctcagtccctatactcggtcagcgacggaggg780
gtgcgtgatcggccaatcacagcctattattttatcaacatctgattggctacttccgat840
aagagcgaaatatgcccctccttgcaatttttaccatcaacgctaacagcaacactcaac900
aaaccattcaatcttgatactcgctcccattagtcaccacgcaggacaacacaacacgac960
atcgcatctcagctttgaccattcccgccgcaagcgattcgctgtcacaaacgccagata1020
ccccaacatggctgcccctccctccgccgatcaggactacaagaccaatctgttgtcttt1080
gctgatagccaacgatgcgctcgcatttggcacgttcacattgaaatctggtcgccagtc1140
gccgtattttttgacctcgagtcgtctttatactgcgcctctgctgcgccaggtgtcggc1200
cgcgttcgcgaataccatctcgtccccgccttttgtgaatatagctgcagatggcagcat1260
taccccgaactttgacattgtttttgggtatgttaccctattattcgtgcgcctgatatg1320
cgtgtactgatttacttcaaatagccccgcctacaaaggaatccccgaatgcgtcggtgt1380
tgtcaacgagctcgctacccgggatgcgctcgccggtaccaagacatgggacaacatcag1440
ctactccttcaaccgcaaagaagccaaagaccacggcgaagggggtaacatcgtcggtgc1500
gcctctcaagggaaaacgtgttttgatcgttgacgacgtcatcaccgctggtaccgcgct1560
gcgtgaagctgtcggcattattcaaaaggaaggcggaaccgttgccggtgttgtgttgct1620
gttcgatcgtcaggaacgggtcagtgatacggagcagaagagtgccattggagccgcgga1680
gagggaccttggaggcgatattcctatccgtgcggtgttggtattccaggatttgattga1740
taagcttggagataagattggtcaggaggaggtgcgcaggttggaagagtaccggaacac1800
gtacaaggctcaataaatggctgctgtgggatgaaatgggtatattaacgatttatgcta1860
aaaatggctgggtggaatactgcgaaataaatataaatcagcttgaaggatgtattttta1920
gcgcaaagtgatagaattttctatgtaaatagtttgtacaataggattactactttatat1980
gcgttatgcgtatacatttctaaagtgtaaccagtttagctgggagtacaattttaacac2040
tcttccatcaatcaggttccagatcagttttctatctacaatcatgactccccagtctct2100
actcctttcaagaatgacgcgttatgttccaagctcccctggttgatggcggtaacccga2160
tatattctagccaggtcaggtcctagtgtgaggactaacacaggcacgtccagtatcgta2220
gcaaatagaatatcagcatatataagtcccctttcccggaccttgctcgagtcagtgact2280
agcaggtacgtacgtacccatcagactatctactatctactatgtacggagtatatagtc2340
ggtacttgacgcaaggcgagtctgatagagggacaatatgcagttctgtagccaatcaat2400
cgcggatggcagaccctcgatcgtcattgtggatctttagcttccttatgggcggggcgg2460
tggttatttcagagccatttagccaatcatacatcgtagtccgaaagtctaggattatat2520
aggctagaccaatctactgtcaaccggtaaagcgggtctctagtctttatcccgacctcc2580
tctctttctctttctccgattcgaatgtgacacatacatctgatcaattgataagaatac2640
ggattgccgtgtacgtgggctgacagagctgagataaaatatcctggatgtgatatgtgg2700
cgcatccagtaccgacactgtgacaggatccgtgtactacaattcattcatcgatcgttg2760
gctaggcaaaaagtaggcaaggtttgcagatcgatatcccggtacctggctaaaatcgag2820
acccatctacatatagtactgactcggcgttcacttat2858
<210>38
<211>1356
<212>dna
<213>智人
<400>38
gaagtccagctcgtcgagtctggtggtggcttggtccaacccggtggatccttacgtctc60
tcttgtgcagctagcggtttcaacatcaaggacacctacatccattgggttcgtcaagct120
cctggcaaaggtttggaatgggttgcgcgtatctaccctacgaacggttacacccgttat180
gccgacagcgttaagggccgtttcaccatttctgccgacacttccaagaacaccgcctac240
ttgcagatgaactccttgagagccgaggatactgccgtctactactgcagccgttgggga300
ggtgatgggttctacgccatggactactggggtcaaggcacccttgttaccgttagctcc360
gccagcacaaagggtccctccgtcttccctttggctccctcctccaagtctacttccggt420
ggtaccgctgcactgggttgcttggtcaaggactacttccctgagcccgtcactgtcagc480
tggaattctggcgcattgacttctggtgtccacacttttcccgctgttctccaatcttcc540
ggcttgtacagcctaagcagcgttgtcactgtgccctcttcctccttgggcactcagacc600
tacatctgcaacgtcaaccacaagccctccaacacgaaggttgacaagaaggtggaacct660
cccaagtcctgcgataagacccacacctgtcctccctgtcctgctcctgaactgttgggt720
ggaccctcagtgttcttgttccctcccaagcccaaggacactctcatgatcagccgtact780
cctgaggttacatgcgtcgtcgtcgatgtctcccatgaggatcctgaggtcaagttcaac840
tggtacgtcgacggtgtcgaggtccacaatgccaagaccaagcctcgtgaagaacagtac900
aactccacctaccgcgttgtttcagtcttgaccgtgttgcaccaggattggctgaacggc960
aaggagtacaagtgcaaggtctccaacaaggccctgcctgctcccatcgagaaaaccatc1020
agtaaggccaaaggtcaacctcgcgaaccccaggtttacaccctccctccttctcgggac1080
gaactcaccaagaaccaggtctcgttgacttgccttgttaagggattctaccctagcgat1140
attgccgttgagtgggagtccaatggtcagcccgagaacaactacaagactacccctcct1200
gttctcgactctgacggatctttcttcctctacagcaagttgaccgtcgacaaaagccgt1260
tggcagcaaggcaacgttttctcctgctctgtcatgcacgaggctctccacaaccactac1320
acacagaagtctctgtccttgtctcctggtaaataa1356
<210>39
<211>1680
<212>dna
<213>talaromycescellulolyticus
<400>39
attttcacttctttcttcgcctattgattgggctatgacaaaattaggagagataggttg60
gacgttgtcaagtcaaaatgtaccgaacacgatgcgttgatatgctgcacatgtgcctag120
tatccattcgttcctatttatattaaattgaaattttcttatccaattactgagctaaaa180
catacttcagcactgtaagcgccagcctaagttatgctatgttagactgtccggattcgg240
ctggcactggcttttgtgatccccagtatcatgtaaaggtatccgcctgtttgttagggg300
gtcttaaatgttgtataaagtttcttgctaggctgtttatgcttgatagagaatatatat360
atatatctagctgctattaatatccttgtttcaatgtcttagacttccaaggttacctac420
ccgcgtgcgtggactaatacaaacaatctcactcaagacaatcttatacaaactcggatt480
ctggtcaatccgttccttggttatattgctaaaaaaactaggtagcccaaaattccatct540
caagccgtataagaactttcaaattcaccatggtactctcacgggcgaagcatctccgtc600
ttccatctgccaaaatccattaccaaaatcggaagtacccgaatgtagcaaatgaacaat660
aactttcgcaccatctagcggatcctttgtgccacgatagttgttgaacgcagttttgca720
atacccaggactaactgcttggatgataacactctcattcgccgggtctttcccatattc780
gaccgtgagcatgttaagggccgtctttgaggcgcagtacgcgatagtaacagttggagg840
cagcttgccagatgatgataggcccaaagaaccccgtgtggatgatacgtttattatgtg900
gcctcgaggcgactgacgcaaaagtggtaggaatagatctatggtcattgcgaccgatgt960
gacattcacatcaaaagttcggttgtaagtagaccgcatttcggaaaatgaagtctgggt1020
gaaggcaacggcagcattgtttatcagaactagacatctgttagagaatttctaaagccc1080
gctcactcgagaatgaaataggcttaccatccagtctaccatatgttgtctcgaccgcct1140
tagcaaaagcaatgaggctatcgtcgcgagtcacatcaacctccataacgtcgatcttgg1200
attgaacagcgagctctctcaaccgcttaagtgcctgatttccgtcttccttattccggc1260
atcctaagatgaagtgatcggatggactatgcagacttaaagcctggagggtaccaaacc1320
cgatgcctgacaattattagtgatcatatagaatgagtatcatggccatcgcaaatctac1380
ctctgtttgctccagttataagaattagccttgatgacatcttgtgagagaagtaaaaga1440
taatagcagatgaatttcgatcgtatactggttgtattggcaatcttgacgagaatggtt1500
tcattgtcagaccatcagttccctttatatacctgccattctctcctttataaataatta1560
ttcggttttaacacggagatactcggatttcatcacacaaattgcatttcttccgatagt1620
tgttgaagatcggaagtccttcgaatgatcatttctataactacgccttaccgttttcgg1680
<210>40
<211>645
<212>dna
<213>智人
<400>40
gacatccagatgacacagtccccttctagcctttctgcctctgttggagatcgtgtcacc60
atcacttgtcgtgcttctcaagacgtcaacacagccgttgcctggtatcagcagaaaccc120
ggcaaagctcccaagttgctgatctacagcgctagcttcctgtacagcggtgtcccttct180
cgcttctcaggttcccgttctggtaccgacttcaccttgaccatttccagcttgcaaccc240
gaggatttcgccacgtactactgccagcaacactacaccactcctcccacctttggccaa300
ggtaccaaggtcgagatcaagcggactgttgccgcaccttccgtcttcatcttccctccc360
tcggatgagcagctcaagtctggaactgcgtctgtcgtttgcttgctcaacaacttctac420
cctcgtgaagccaaggtccagtggaaggtcgacaacgctttgcagtccggcaatagccaa480
gagtccgttaccgaacaggacagcaaggactccacttactccttgagttccactctcacc540
ttgtccaaggccgattacgagaagcacaaggtctacgcttgcgaagtgacccatcaaggt600
ctctctagccctgttactaagtccttcaaccgtggtgagtgttag645
<210>41
<211>1354
<212>dna
<213>talaromycescellulolyticus
<400>41
ctcgtgaaagctgccctcacaatgatcgtcaagatgacgtagtttgactgggtcgttcct60
ggataagggttagggtaaatagggctcaaagtaccacgtgagtgtggaaagataagccct120
aaccctaaggtcgtgtcggacaaaaattatcacttgaccaaaattggagatccccttaat180
ggagctttttggtaatggtttgtatagggttatgtgacgtccgtatcacatgatttttat240
cccaacaggtcgatccccctcttatagttaatggacaacatataagtacgtagcatctta300
gatagttcgtcagcgtcaactgaccaaagtccccgtgtttcattttaatttgtcagactg360
caagagtctcgaaacataaaaagatcgaaagttttgccttattaggctatgagcatgaat420
gtcggaacaatgccgttgaggctattcccaatttcggaaatatgtatcttcattgctgtc480
gacttgacgacagtcgataaaaggctcatccggatagataagccagatcactcattatgc540
caatttctccggtgtctgaaaacgtatactacatacgtaactgatcttcgtggttgaaag600
agtgtttcttctcattctcatctgccgatgccgagccaattggaacaaaccccgcatatg660
gtcctgaatatcaatcgcggagatgcggagagtgagggagcaacacaattttaaattagt720
cagttttctcatgttctccgcaatcttgcaggcttgggtctggtaggtttatctctctct780
tttcacaacaaggttgggccattgtcagcttagcaagcgcgcagcaaagggtgtcggtca840
atgttcatgtcctccgcggtcactacaaaacagcacgtggggaatgttgctttccctgtt900
gatgttcatgtgttgtcattcccggcaaatcgactccaattaatatggtaggctcctgca960
taatgcaagtccttgagatgcagcttccggcagatggacgtatagatcagggactttgag1020
gggctaaaacacttacccgagctaaaacataccataatttcgtttaatgactttcgtctg1080
gatggcagaggctgaaggtcgattatgagtgaaattggtatgaagccacatacgccgata1140
ctgtaacgctgtgccttcatccgccttctatcgcgccccgacattccgcggtaccgcgat1200
tatgaagaaaaacactcgtaatgatgaggagatagttcttagctcttattatttttgtct1260
agctatggaatgcaagtttagcactatataatggtggtgtttcccttgaagaattaggca1320
ctatcaaccgcaacagtcagaagcaatcgacaca1354
<210>42
<211>26
<212>prt
<213>talaromycescellulolyticus
<400>42
metseralaleuasnserpheasnmettyrlysseralaleuileleu
151015
glyserleuleualathralaglyalagln
2025
<210>43
<211>490
<212>prt
<213>talaromycescellulolyticus
<400>43
metlysglyvalleuserleuserleuleuproleuleuthrvalala
151015
serprovalmetproargthrilehisasnaspalaalaproileleu
202530
serserserasnalavalgluvalproaspsertyrileilevalphe
354045
lysasphisvalaspseralaseralaalaalahishisasntrpval
505560
glnaspilehisserglnhisthrgluleuarglysargserglnphe
65707580
prophealaaspasnalaphealaglyleulyshisthrpheaspile
859095
alaglyserpheleuglytyrserglyhispheglugluasnvalile
100105110
glualaileargarghisproaspvalasptyrileglulysaspser
115120125
leuvalhisthrmetgluaspproalaleuglulysasnalaprotrp
130135140
glyleualaargileserhisarggluserleuserpheglyserphe
145150155160
asnlystyrleutyralaalaaspglyglygluglyvalaspvaltyr
165170175
valileaspthrglythrasnileasphisvalaspphegluglyarg
180185190
alasertrpglylysthrileprothraspaspgluaspvalaspgly
195200205
asnglyhisglythrhiscysserglythrilealaglylyslystyr
210215220
glyvalalalyslysalaasnvaltyralavallysvalleulysser
225230235240
asnglyserglythrmetseraspvalvalglnglyvalglutrpala
245250255
alathrglnhisilelyslysvallysaspalalysalaglylysala
260265270
lysglyphelysglyseralaalaasnmetserleuglyglyglylys
275280285
servalthrleuasplysalavalasnalaalavalaspalaglyile
290295300
hisphealavalalaalaglyasnaspasnalaaspsercysasntyr
305310315320
serproalaalaalaglulysalavalthrvalglyalaserthrleu
325330335
alaaspgluargalatyrpheserasntyrglylyscysasnaspile
340345350
phealaproglyleuasnileleuserthrtrpileglyserlystyr
355360365
alavalasnthrileserglythrsermetalaserprohisileala
370375380
glyleuleualatyrpheleuserleuglnproalaseraspserala
385390395400
phealavalalagluilethrprolyslysleulysgluasnleuile
405410415
alaileglythrglnglyalaleuthraspvalproseraspthrthr
420425430
asnileleualatrpasnglyglyglyseralaasntyrthraspile
435440445
ilealaglnglyglytyrlysthrlysthrleuserasngluvalasp
450455460
gluleuileasnlysleugluvalvalasnglugluleuglyalaile
465470475480
tyrserhisilelysaspalailealaala
485490
<210>44
<211>4509
<212>dna
<213>talaromycescellulolyticus
<400>44
atgtcgagaagaatacggaaccctgattccgcaggctcgagtcaaaccctaagtaattca60
ccggtaccaatagccgccgaatccggcacggaacctgtgtacctaggtccgtatcgaata120
gcgaagttttccgtctattcttcgaattttgtatacatgcttaccttggctcaaaggtac180
tcacaaagtccgaagaataaattatagaaccgatgtgaaacggggacagtttggcaaccc240
cttgtactatgtacattgtatggatctcgtctcgactctcgagacgagggtttcgtacca300
accaaagactcaaaacttggggtaactaagcgatcggctgcgtagtactccatactccat360
aaataccccggtgaattcgcctcttgcccatggaatgagcgagaatttacccttggagtc420
atcgcggtaaatgactcacatatcatgtctgccttcactctcctcaacctttgaaattcc480
ggttaatgttaaggcgaggtgtcctctacggaatggctttgtagatttgagataagacta540
cgccgtaacttaagggatccacatactccatattgatagtctcaggaccgagatagtctg600
gagtaaccccgtacccaatcaacgtcctcagactcgccacctggttacaatatttcggtg660
cttgtgccgatatacctccgttgcgtgagccttgatagccaacaagaaatgattcaaaat720
taagatttgagaaaatccggagtacgcagtgcctgcagtgtaaaaaataatgtatttacc780
taatgccaatatgtcgatgccaaagtactactagcaaagacactagatatgcagcaaact840
cgatgtttaggtacatgtaaccatatcctggggtcaggtacgaacgccatcaattaatct900
cgtaaactagctgtcacacgacagtatcatttgatagttccaatgttccatgctccccct960
caaatgtcactggatgatacgaatttggctgtgacttgaacagatagacggaaaacagtc1020
cgatcattatccggagtacgcatgtacgagatagtctggggatcctcggctgccccgatt1080
ggggttagtgcgggtttccttatcttgatacgccgtctggaggcgcaggtgattgttacg1140
gtgtgttccgtgatagataagttagacatccgataataacctatcttctagatagacggc1200
aggtacgtatgtagatagatagatgacacagtcataagacagttttatttaccatacata1260
gtatagtcatttgacaaacacttgatgactatgagcagtaagtccagacaagagcataga1320
ctagaaatgatgtgatcatcaataggtacggagtcgtaccacccccggattatcttggct1380
ggcttagtcacgcccaaacagacggtgacggatgagacacaagcaaagagcgacattccg1440
aagaattctcgtgacggaaacgagaatgccgccggcgctgatagggggaaattttatctt1500
ttccctttctgacattcagtgtttacaatacaatacggaattacggaaccccggttttcg1560
caaccggtggaattacctaatgggtgacctgaatttattagataacgatgaacaatttgt1620
tggatcttccgtagatcgatttggacttgataggtgcttccaaggttgttgctgctcaca1680
tggtcgcttgcgttatctgcctacagaatgaggaagatgtattccgcacgtactccggtc1740
gcgacagatatgcgacgattgcaatatgtactacatagttagtacatacaactctagact1800
agactctatattatgtagagtgtaagagaaaaagaaagaagataacggcagggtctattt1860
gattgcgctataatatgcgccgctgtatggttccccagatctgcgtgagatatcacctca1920
tcctatcatcattccaggtcaaagtctcgtcatcatgaattggtattattacccagtacg1980
taaaccacgtatcgaggcgtatcggtgtattaaagatagagctactgcattggctctagt2040
cctatctttgccccggaatccggcccgtggatgacgatatgatgctgtttgtccttcagc2100
taaacacggacgatctcttacagggtgcggttaattattaaggatataattctaatcaac2160
gactctggctgtgctatattaacaatgtcttctaagtggtcatgatgtgtacgtacttcg2220
tacacatgctacatgcaatcgagtacgtaactccagatctgcgccgtacccgcgataccc2280
gggccatcatgcaaatgtaaccgcttggaacacgcactgcagtgcataaaagccacagcc2340
tcgcttcccaatccggtttagacgcgttttgtcttgctgttttgggagcagccagacccc2400
acattccactaacccactctttttcagcgcttattctcgtaagattcgtacgaaaaatac2460
atctgcccacactatccaccagctcggccactcttcggtgagaacgctgccatgagaaaa2520
aaatctgcgactctgcaacagagtgaggcacggctgaaccgagctgattgtcaccctttg2580
cccaatgcccagacagcccagacagcccagacagcccagacagcccagacagcccagaca2640
gcccagacagccagtgcttggttaatttttactaagggtaaaaacctaaaaaaaagaaac2700
gaaaaaaaaaaaaaaaaacttttcttttttgccccccaatcacttggccgacagtcaaag2760
ggttcccccacacggtactccgtacttgctacgtacactaactaaagaaaaaatctcctg2820
attgagtctgtgtctgtctgtcgctgctaaactcggataaccccccgttcccgatcaccc2880
gtcgaaaagagcagcagccatttaacatttttcccctccattcctccttcttggaacttt2940
ccctccctccctcatccttacatctccctgcgtgcgcgcctgcctgcctacttacactgc3000
cactccccagattttctttctcttgtttcttctccagactttctttcctcctccacctcg3060
cctcaccacaccaccaccaccactcaccacgccaacaacaccgcactaccactactgctt3120
caaagatcgatcaggccattatcaaggaggatcgacgtcttattccatcgaccaccctgt3180
tgatcacctcggctggagcgctcgactccctggcttccttccccagcttatttaaacccg3240
tcacccgccaggtctcttcacatgtcaccgtcatcttcgtcagtgggtttttccaatctg3300
ctgaacccacagtcagactctgtcgagcctacggataacacatcttcacctgctaccacc3360
actaccaccggcacagactccaactcagacaaggaaatggcgtcctctgtcagtctgctc3420
ccaccactcatgaagggtgcccgccccgccgcggaggaagtgcgacaggacctccctcgt3480
ccatacaagtgtcctctttgcgatcgtgctttccatcgtctagagcaccaaactcgtcac3540
attcgtactcacaccggcgagaaaccccatgcctgccagtttccaggctgcacgaaacgg3600
ttcagtcgttcagatgaattgactcgtcactcgcgcattcacaacaaccccaactcgaga3660
agaagtaacaaagctcagcatattgctgcggctgcggcggccggtcaggattcgggtatg3720
cttaacgctgctgcctcgatgatgcctcctccaagcaaacccattactcgctcggctcca3780
gtgtctcaggtcggatctccggatgtgtctcctccgcactcttacaccaactacacctcg3840
catttgcgggcgggtctgggtccttattcacgcaacagcgaccgtgcttcatctggtatg3900
gatattaatttgctcgcgactgctgcttcacaagtcgagcgcgatcactacggaggctcg3960
tctcgtcattaccctttcagctctcgatactcgggtactcctggacgtctaccgtcgctt4020
tccgcctatgccatttctcagagcatgagccggtcgcattctcacgaggatgaggacaac4080
tacggacatcaccgggttaagcgctctcgtcctaactcaccaaactcgactgcgccatcc4140
tcgcctacattctctcacgattcattgtcgcctacccccgatcacactcctcttgcaacc4200
ccagcacactcgcctcgtttgcgtccttatggagccgcagatttgcaattaccttccatc4260
cgtcatttgtcgttacaccacactcccgcactcgcaccaatggagcctcaagccgaggga4320
cctaatgtttacaaccccggtcagcaccacggtggacccagcatcacggacatcatgagc4380
aggcccgacggcacccagcgtaagcttcctgttccgcaagtacccaaaatcccggtgcag4440
gacatgttggcaccgaacggatattcctccaacactccgtccgtcaacggttccgtgatg4500
gagttataa4509
<210>45
<211>1323
<212>dna
<213>智人
<400>45
caggttcagctcgttgaaagcggtggtggtgtcgttcaacccggtcgttccttgcgtctg60
gactgcaaggctagcggtatcaccttctctaactctggtatgcattgggtccgtcaagcc120
cctggtaagggccttgagtgggttgccgtcatttggtacgatggctccaaacgctactat180
gccgatagcgttaaaggtcgtttcactatcagccgtgacaactctaagaacaccctcttc240
ctccagatgaactctttgcgtgccgaggatactgcagtctactactgcgccactaacgac300
gactactggggtcagggtacactcgttacggtcagctctgccagtacgaagggtccctcc360
gtctttcccttggctccctgttcccgctcaacctccgagagcactgcggctttgggttgc420
ttggtgaaggactactttcccgaacctgtgaccgtttcctggaattccggtgctttgacc480
tctggtgtccacactttccctgctgttttgcagtctagcggactctacagcttgtccagc540
gtcgtcaccgttccttcctctagcttggggaccaagacctacacctgcaacgtcgaccac600
aagccttccaacacaaaggttgacaaacgtgtcgagtccaagtacggacctccttgtccc660
ccttgtcccgcacctgagttcttgggaggtccttctgtgttcctcttccctcctaagccc720
aaagacaccttgatgatctctcggactcctgaggttacttgcgtcgtcgttgacgtctct780
caggaagatcctgaggtccagttcaattggtacgttgatggcgtcgaggttcacaacgcc840
aagactaaaccccgtgaagagcagttcaactccacctaccgtgtcgtctcagtcctcacc900
gtcttgcaccaagactggttgaacggcaaggagtacaagtgcaaggtcagcaacaagggc960
ttgccttcttccatcgaaaagaccatcagcaaggctaagggccaacctcgtgagccccag1020
gtgtacactttacctccctctcaagaagagatgaccaagaaccaggtttccttgacctgc1080
ctcgtcaagggattctacccctctgatattgccgtcgaatgggagtccaatggccaaccc1140
gagaacaactacaagacaactccccctgttctggactccgatggtagcttcttcctctac1200
tcgagactgaccgtcgacaagtcccgttggcaggaaggcaacgttttctcctgctccgtc1260
atgcacgaagccctgcataaccactacacccaaaagagcctatccttgtctcttggtaag1320
taa1323
<210>46
<211>645
<212>dna
<213>智人
<400>46
gaaatcgtcctcactcagtcccctgcaacccttagcttgtctcccggagaacgtgccact60
ctcagctgtcgtgccagtcaatccgtttccagctacttggcttggtaccagcagaaacct120
ggtcaagcacctcgtttgctcatctacgatgcctccaatcgtgctacaggtattcccgct180
cgtttctctggctcaggtagcggtaccgacttcaccttgaccatcagctccttagagcct240
gaggactttgccgtctactactgccaacagtcctctaactggcctcgcactttcggtcaa300
ggcacgaaggtcgagatcaagcggactgttgctgctccttccgtcttcatcttccccccc360
tctgatgagcagctgaagtccggaactgcgtctgtcgtctgtctgctcaacaacttctat420
ccccgtgaagccaaggttcagtggaaggtcgacaacgccttgcagtctggtaactctcag480
gagagcgttaccgagcaagactccaaggatagcacctactctttgtcctccactttgacc540
ctcagcaaagccgactacgagaagcacaaggtctacgcttgcgaagttacccaccaaggc600
ttgtcttcccctgtgaccaagtcgttcaaccgtggtgaatgctag645
<210>47
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>47
caggttcagctcgttgaaagcggtg25
<210>48
<211>37
<212>dna
<213>人工序列
<220>
<223>引物
<400>48
agaagtgaaaatttacttaccaagagacaaggatagg37
<210>49
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>49
gaaatcgtcctcactcagtcccctg25
<210>50
<211>37
<212>dna
<213>人工序列
<220>
<223>引物
<400>50
ctcaaagctgatctagcattcaccacggttgaacgac37
<210>51
<211>507
<212>dna
<213>智人
<400>51
tgcaacgacatgacccctgagcaaatggctacgaatgtcaactgttcctctcctgaacgt60
catacccgttcctacgactacatggaaggtggagatatccgtgtgagacgtctgttctgt120
cgcactcaatggtacttgcgcatcgataagcgtggcaaagtcaagggtacacaggagatg180
aagaacaactacaacatcatggaaatccggactgttgcagtcggaatcgttgccatcaag240
ggtgtcgaaagcgagttctacttggccatgaacaaggaaggcaagttgtacgccaagaaa300
gagtgcaacgaagactgcaacttcaaggagctcatcctcgagaaccactacaacacctat360
gcttctgcgaaatggacccacaatggtggtgagatgtttgtcgccttgaaccagaagggt420
attcccgttcgtggcaagaagaccaagaaggagcagaagactgctcacttccttcccatg480
gccattacccaccaccatcaccatcac507
<210>52
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>52
acagctggtgctcagtgcaacgacatgacccctgagcaaa40
<210>53
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>53
ctcaaagctgatctagtgatggtgatggtggtgggtaatg40
<210>54
<211>513
<212>dna
<213>智人
<400>54
gcccctatggcagaaggaggtggtcagaatcaccacgaagtggtcaagttcatggacgtc60
taccaacgctcctactgccatcccattgagacactcgtcgacatcttccaggagtacccc120
gatgagatcgagtacatcttcaagcctagctgcgttcccttgatgcgttgtggtggctgt180
tgcaacgacgaaggcttggagtgcgttcctactgaggagtccaacatcaccatgcagatc240
atgcggattaagcctcatcagggtcaacacatcggcgaaatgagctttctccagcacaac300
aagtgcgaatgtcgtcccaagaaggacagagctcgtcaagagaacccttgcggtccttgc360
tctgaacgccgtaagcacctgttcgtccaagatccccagacctgcaagtgttcctgcaag420
aacaccgattctcgctgtaaagcccgtcagttggagcttaacgagcgtacttgccgttgc480
gacaaacctcgtcgtcaccaccatcaccatcac513
<210>55
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>55
acagctggtgctcaggcccctatggcagaaggaggtggtc40
<210>56
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>56
ctcaaagctgatctagtgatggtgatggtggtgacgacga40
<210>57
<211>1587
<212>dna
<213>talaromycescellulolyticus
<400>57
atgcgtatgtcagcttcgttaccgctcatcgtcttgtcgatggtgtcggccagcaatgcg60
ctctctcttcatagacgtgatgagccagcagttctagcagcaccgttacaacgcagacat120
gtggatgggattttgggcaaaagagatacgtcgccagttgatgtatcgatcttcaatcac180
gtacgtacgaggatttcgaatgcaatatttcctgggacctaacgactgcatagcaaaata240
caagctactggctgaacttgactctgggatcacctgcgcagaatttcacactcgccttgg300
acacgggcagcagcgatctatgggttattgagggatcgaaaaaggcagctaatgtttacg360
tctcggatgattcgtcctctttcaaatctctggatcttccatacaacgcaacatacgcgg420
atggcaccacggctctcggtgtctacgcgactgacatattgagcttgggaggtgcaactg480
tcaaggactttgagtttattgttgtgaaccaaacttcatctgatggtgagatctgacctt540
atgaaaatatcattgtatcttctgcaaactttagtggcgtgtgcattcattctaattcat600
gattgattgtatacagtgggcattgccggtgtcggctacaacatctcaacatatgcatct660
tcaggcctgaacaaaacatacaacaacctaccttatgccttggctgccagcggcgtcacc720
aaatctgctgcttacagcctgtggatggacgatgccgcagcaacttcaggcacgattatg780
tttggtggtgtcaacaaggcaaagtacatcggtgaactccaaactctcccagtcgtgcca840
gtctataacaggtattactcacttgcactcgccttgaccgaagtcactgtgcaaactggg900
gactccaagagtactacgacgaaccttccgctcgcagtttctctggatacgggctcaact960
tccactttgctgccccaagacctttttaatgacattctcggcgctctgaatggaacctac1020
gacgagaagagcggcttcgcctatgtgagctgcgacctcatagaaaccgattacaatgtg1080
acattcagtttctctggagctaagatcgacgtgggtcttagtcaactggtatttttcggg1140
gccgtggctgggtggcccaagaacagctgtgttattgatcttactcccagcgaacctgga1200
gtgaacatccttggagacagtttcctgcgcagtgcgtacgtcgtctatgaccttgagaac1260
aatgaaatttcccttgccaacaccaacttcaaccccggtaaggacgacattctggaaatc1320
ggtaccggcgccgatggggtgccaggtgccactcttgttccctcggctgtctctactgct1380
acaggaaacggcgttcagacagcgactaccggtgtggtgggtgctaccggggtcactgtc1440
accgctggtactactgctaccggcagcgcaagcaccggcggttctgcaaaatctactggc1500
acatcttctggcatggcagcgttgcccaccggcaatgccaaacttctttctggtctggca1560
ggcgctggtcttctccttatgatctaa1587
<210>58
<211>2025
<212>dna
<213>talaromycescellulolyticus
<400>58
atggaactgtccccgccgggcttagcgccgaacaggtatcgcatcaccatcggaccaagg60
taactcccagtcgtgtggccatccacccatctgccccaacttcatctcttcatcttcatc120
ttcatctcattccggattcccccagagaggtgtactgtatctgggatacactgttcaagg180
ctttgtgtgcatcagacacaacaattatcttgtaagttggttcgtctctgactctccagc240
tatcgttgagtcaccactgatactgataacgacgtcatctccagattcgactgctcgagc300
catcaacatgaaaggtttggctaccacgctcctcgtaggggctgcggctgctttttctcc360
tgctcagcaggtgcttaaagccccagaggacgttgttgagaacacccacaaggcctcctc420
tccctctctagccgagacgctcgcccagcctctccatgagctcaatgaagagctcaagtc480
gttcactcacgaagccgaggaggtctgggaacaagtctcaaacatgttcccaggtgctct540
agataacatccctttcttctcctcacccaagaagcacactcgtcgccctgactcacactg600
ggaccacatcgttcgtggtgccgacgtccagaacatctgggttgagaacgccaatggcga660
gaaggaacgtgaagtcggtggtaggctcgaggcctttgaccttcgtgtcaagtctgttga720
ccccagctcgcttggaatcgatcccgatgtcaagcagtacagtgggtaccttgacgacaa780
cgagaatgataagcatttgttttactgtatgtgcacacttctatctatcgaaagtatcac840
tgataactaacaattatagggttctttgagtcccgaaatgaccccaagactgaccctgtc900
gtcctctggttgaacggtggaccaggatgctcgtccttgaccggtcttttcttcgagctc960
ggacccagctctatcggcaagaacatcaagcccatctacaacccctactcctggaactcc1020
aacgcctctgttatcttccttgaccagcccgtcaatgtcggtttctcctacagcggtaac1080
tccgtcagtgagacgagcgctgctgcaaaggatgtctatgctcttcttactcttttcttc1140
aagcaattccccgaatatgccactcaggatttccacattgcaggtgaatcctacgccggc1200
cactacattccttcatttgcctctgagatcctttctcacaagaagcgcaacatcaacctg1260
aagtctgttttgatcggaaacggtcttactgatggtctcactcagtacgaatactaccgc1320
cccatggcttgcggtgatggtggttatcctgctgttctcgatgagagcacttgccgctcc1380
atggacaacgctctcggtcgctgccagtccatgattcaatcctgctacgacagtgaaagt1440
gcttggacctgtgttcctgcttctatctactgcaacaacgcccttttgggtccctaccag1500
cgcactggccagaatgtatatgatgtccgcaagccttgcgagggcggcaacctctgctac1560
actgatctcgaatacatcagcacctatctcaaccaggctgaggtcttgaaggctgtcgga1620
gccgaagttgacaacttcgactcttgcaactttgacattaaccgcaacttccttttcaag1680
ggtgactggatgaaaccattccacaagcttgtccctggaatccttgaggaaatccctgtt1740
ctcatctacgctggtgacgccgacttcatctgcaactggctgggcaacaaggcctggtct1800
gatgctcttgagtggagcggccacgaagaatacgccgctactgagcttgaagatctcgag1860
atcgttgacaacaagcacaagggcaagaagattggtcaggtcaagtcctctggtaatctc1920
accttcatgcgcctatttggcggtggccacatggttccctatgaccagcccgaggccagt1980
ctcgagttcttcaaccgctggatcggtggtgagtggactcagtaa2025
<210>59
<211>1657
<212>dna
<213>talaromycescellulolyticus
<400>59
atgtcgctacgcagctgcgccctgctgggtctagctgccagcgcccttgccgctgagccc60
aaggtgctgcacatgccaatggcccgcaacccaaatgccaaccctctcgccaaacgagac120
tctgcctccgtcaccgtcacaaatgccctgagcgagggtatctactttgtgaacgctaca180
gttggaacacccggtcagctggtgcagttggtcttggatactggaagcagtgatgtgtgg240
ttcttcggtccgaattcgtgcgacgcgaaaacctctgattgtctgggtggaacatgtatg300
ttttctccttattctccttacattccgatgccatgtggttggcacgtggatgtgcaaatc360
gtttctgtactaatagttgataatagatgacccctcccaatcttcgagcgtcttaatctc420
ccaacctaaaggccaatttttcattcaatacggcacacccggctcgaatgtcactggtaa480
ctacatcaaagacgctttcagcgttggcgaagccaaagtcacaaacctcaccatggctta540
tgctacctacgcggcatacgttcctaccggtgtgatgggtattggattcgacaccaacga600
ggccatcacagcatatggtggcaagccctacccgaatttcgtcgatgttctcaagtcgga660
gaacgtcattagcaccaaggcatacagtctgtggttgaacgatctcgagtcaagcaccgg720
aagctgtttgtttggtggatacgataccaagaaattctccggcaacctcttggctgtgcc780
cattcaacccgacgagtcgtctggtgaattgaccagtatgactgtcgcatggactgcgct840
tggtattacgacccaatctggatcgcaaacaatcacttcctcgtccttcaagtcgcctgc900
gttgctcgactccggtaccacattgagtatcatacctgatgatatctatgaatcattagt960
cacgttcttcgatgccacactagaccaagcaggtgatgcaattgtcaaatgcaacctact1020
cgatgactcgggcactcttgactttacatttggcggatccgacggtccagttatcaaggt1080
tcctttctcggagtttgcgctacctgcaactaccaccaacggccagcaggccaccttcaa1140
cgatggctcgttggcttgttatcttggtcttcaaggaacaggctcggacccgacatcaca1200
ggtccccgtcattctcggcgacactttccttcgctctgcctatgttgtgtacgatctcga1260
caacaagcaaatctctctcgcgcaaaccgtcttcaacgcgacagacagcaacgtcgttga1320
aattacgtctgccagccctgttgccagtgtcgtgagtggcgtcacagtcacccagactgc1380
ctctggcaaccccaacgagctcggtgggcctactgctactgccgacccgaccggttcagg1440
cagctcgatcggttcaggcagttcaggcggttctgatctttccggcagcagcctcaccgt1500
ctctcttacccctgccacggcaaccggctctgcatcgtcatcaacttcttctcacaaatc1560
gtcggctaaccccgctcctgggccagactttatgagcactgcccttattgctggagcgtc1620
tatgttgctgggaggtgttttcttcgtccttcattag1657
<210>60
<211>1053
<212>dna
<213>talaromycescellulolyticus
<400>60
atgtgtcaattcatttcccattatatacttcaaaaagttgctgagtcacctgaagtgtct60
cagcatgcacgagaatcagcagcgaggacgctgagtatcgacacagaggtacgaaataga120
aggcccgatctgcatgctgcaatcgttcagaatcccaacctcggcaacttgcagtcagtg180
actgcaagctcgggccgcgaacaaccaagtatctcagtgtacgactgtagaaacagctcc240
aaacttccaggagtccgggtccgaagcgatgaccagagagtcagagatcgagtcgtcaat300
aatgcatttgacggcttacagattgcagacaagttttatagcgatgttttcgcatacaaa360
gtccctgatggttcatggaatgctcttactggctcagttcattttcgcgagaactacaac420
aatgctatgtgggatggacagcagatgatttttggtgacggagacggagaaattttcgat480
tactttgctgattcactagacgtaatcgtccacgaaattacccatggagttacccaatac540
acagcaaatctgcagtacgaaggccaaagcggagcgttgaatgaatctatatcagatgtt600
tttgcatgtatggccgagcaatggtatcttgaccagacagctgaggatggggattggttg660
ttaggccaaaatctgttccctgttgcacgaaagggatccgcgctgcgttcactaaagaag720
cccggcacagcttacaacaatgacaaaatcctcggcaaagatccccaacctggccatatg780
cgtgattataacaacacacgtgacgacaacggtggtgtacatctcaattccggcatccca840
aatcatgcattttatctcgttgccactactcttggagggcgttcgtgggatcaagccggt900
catatatggttcaaaactttgaccgactcccggctcaggcctacagctactttcagtgcc960
tttgctggattgactgtggataatgcacagagactttacggtaacaatgtgggtcaagca1020
gtaaagaaagcgtgggaaggggttggtgtctga1053
<210>61
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>61
cggtacccggggatcagcaaccccaccgtaatctcaaggt40
<210>62
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>62
ccgatctgaattgacattcggatggactttttgaaggcca40
<210>63
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>63
tcggcgttcacttatgaggttgacttgatagtcgatcgct40
<210>64
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>64
cgactctagaggatcgttattgctgttgctgttgtggttg40
<210>65
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>65
ccgatctgaattgacagatagcgtgagcacactgagcagg40
<210>66
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>66
tcggcgttcacttatcaacacgctacctcttccacagtag40
<210>67
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>67
cggtacccggggatccgtctgtcaaggttgggttaatcgt40
<210>68
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>68
ccgatctgaattgaccgaggcagccaaccataagaactgc40
<210>69
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>69
tcggcgttcacttatgcgagccgtacttggtttgactact40
<210>70
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>70
cgactctagaggatcaattgcatttcttccccatcgtcga40
<210>71
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>71
cggtacccggggatccatagcctcatgaccaatgaccggt40
<210>72
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>72
ccgatctgaattgacgtcgatgaagtcgtcgggggtatgt40
<210>73
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>73
tcggcgttcacttatcggctcaatatgcaataggtgttcc40
<210>74
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>74
cgactctagaggatctagggctaaccagcagggtaccgcc40
<210>75
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>75
cggtacccggggatcccacattcacagaaggcactataca40
<210>76
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>76
ccgatctgaattgaccatcaacatctacaatccgacggtg40
<210>77
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>77
tcggcgttcacttatgttgttggccagaagaaagcataca40
<210>78
<211>40
<212>dna
<213>人工序列
<220>
<223>引物
<400>78
cgactctagaggatcctctcccgaggcacaacccaaagtg40
<210>79
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>79
gtcaattcagatcggctgccgcctg25
<210>80
<211>25
<212>dna
<213>人工序列
<220>
<223>引物
<400>80
ataagtgaacgccgagtcagtacta25