蛋白质的制造方法与流程

文档序号:21849011发布日期:2020-08-14 17:21阅读:1385来源:国知局
蛋白质的制造方法与流程

本发明涉及蛋白质的制造方法。



背景技术:

作为蛋白质的制造方法,报告了使用了棒状细菌、芽孢杆菌属细菌、酵母、丝状菌等的各种微生物的方法。

例如,非专利文献1公开了,使用了丝状菌talaromycescellulolyticus(旧名:acremoniumcellulolyticus)的宿主由来的纤维素酶的生产。此外,专利文献1中公开了,使用了丝状菌的抗体的生产。此外,专利文献2公开了,使用了talaromycescellulolyticus等的丝状菌并且具有内腔的多聚体蛋白质的生产。

此外,专利文献3~4中公开了,使用了内源性蛋白酶的活性弱化了的丝状菌的异源蛋白的生产。此外,专利文献5中公开了,使用了内源性碱蛋白酶的活性弱化了的丝状菌的异源蛋白的生产。

此外,专利文献6中公开了,使用了缺乏羧肽酶yscα活性的酵母的异源蛋白的生产。该文献中指出,该酵母还可以缺乏选自ysca、yscb、yscy和yscs中的肽酶活性。

然而,尚不知talaromycescellulolyticus中的yscb蛋白质与蛋白质生产的关系。

现有技术文献

专利文献

专利文献1:日本特表2006-512891

专利文献2:日本特开2016-158599

专利文献3:日本特表2015-512611

专利文献4:日本特表2016-523552

专利文献5:日本特表2000-507106

专利文献6:日本特开1990-104279

非专利文献

非专利文献1:inoueh,etal.,constructionofastarch-induciblehomologousexpressionsystemtoproducecellulolyticenzymesfromacremoniumcellulolyticus.jindmicrobiolbiotechnol.2013aug;40(8):823-30.



技术实现要素:

发明所解决的技术问题

本发明的目的是提供蛋白质的制造方法。

解决问题的技术手段

本发明人等为了解决所述问题而进行了深入研究,结果发现,以使yscb蛋白质的活性降低的方式对talaromycescellulolyticus进行修饰,从而能够提高talaromycescellulolyticus的蛋白质生产能力,完成了本发明。

即,本发明可以举例如下。

1、一种靶蛋白的制造方法,其包含下述工序:

通过培养基培养具有生产靶蛋白的能力的talaromycescellulolyticus,其中,

所述talaromycescellulolyticus经过了修饰,以使得与非修饰菌株相比yscb蛋白质的活性降低。

2、所述方法,其中,

通过降低yscb基因的表达或破坏yscb基因,而使所述yscb蛋白质的活性降低。

3、所述方法,其中,

通过yscb基因的缺失而使所述yscb蛋白质的活性降低。

4、所述方法,其中,

所述yscb蛋白质为下述(a)、(b)或(c)所述的蛋白质:

(a)包含seqidno.43表示的氨基酸序列的蛋白质;

(b)包含在seqidno.43表示的氨基酸序列中含有1~10个的氨基酸残基的取代、缺失、插入和/或添加的氨基酸序列,并且具有蛋白酶活性的蛋白质;

(c)包含相对于seqidno.43表示的氨基酸序列具有90%以上的同源性的氨基酸序列,并且具有蛋白酶活性的蛋白质。

5、所述方法,其中,

所述talaromycescellulolyticus经过了修饰,以使得与非修饰菌株相比crea蛋白质的活性降低。

6、所述方法,其中,

通过降低crea基因的表达或破坏crea基因,而使所述crea蛋白质的活性降低。

7、所述方法,其中,

通过crea基因的缺失,而使所述crea蛋白质的活性降低。

8、所述方法,其中,

所述talaromycescellulolyticus为源自talaromycescellulolyticuss6-25菌株(nitebp-01685)的修饰菌株。

9、所述方法,其还包含下述工序:

回收靶蛋白。

10、所述方法,其中,

通过所述培养而使靶蛋白积蓄于所述培养基中。

11、所述方法,其中,

靶蛋白作为与在talaromycescellulolyticus中发挥功能的信号肽形成的融合蛋白而进行表达。

12、所述方法,其中,

靶蛋白为异源蛋白。

13、所述方法,其中,

靶蛋白为源自人的蛋白质。

14、所述方法,其中,

靶蛋白为人血清白蛋白。

15、所述方法,其中,

靶蛋白为抗体相关分子。

16、所述方法,其中,

靶蛋白为生长因子。

附图说明

[图1]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的人血清白蛋白(hsa)生产的结果的图(照片)。

[图2]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的曲妥珠单抗生产的结果的图(照片)。

[图3]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)生产的结果的图(照片)。

[图4]表示基于t.cellulolyticusf09菌株和f09δyscb菌株的血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)生产的结果的图(照片)。

[图5]表示t.cellulolyticusf09菌株的培养上清液的蛋白酶活性的评价结果的图(照片)。

[图6]表示t.cellulolyticusf09菌株及其蛋白酶缺陷菌株的培养上清液的蛋白酶活性的评价结果的图(照片)。

具体实施方式

以下,对本发明详细地进行说明。

本发明的方法是利用了talaromycescellulolyticus的靶蛋白的制造方法。也将该方法中利用的talaromycescellulolyticus称为“本发明的微生物”。

<1>本发明的微生物

本发明的微生物是,以使yscb蛋白质的活性降低的方式进行了修饰的、具有靶蛋白生产能力的talaromycescellulolyticus。需要说明的是,在本发明的微生物的说明中,有时将本发明的微生物或用于构建它们的talaromycescellulolyticus称为“宿主”。

<1-1>talaromycescellulolyticus

本发明的微生物为talaromycescellulolyticus。talaromycescellulolyticus的旧名为acremoniumcellulolyticus。即,acremoniumcellulolyticus通过系统分类的修订而被再分类为talaromycescellulolyticus(femsmicrobiol.lett.,2014,351:32-41)。作为talaromycescellulolyticus,具体而言,可举出:c1菌株(日本特开2003-135052)、cf-2612菌株(日本特开2008-271927)、tn菌株(fermbp-685)、s6-25菌株(nitebp-01685)、y-94菌株(fermbp-5826、cbs136886)和它们的衍生菌株。需要说明的是,“talaromycescellulolyticus”总称为:在本申请的申请前、申请时和申请后的至少任一时间点被分类在talaromycescellulolyticus中的真菌。即,例如,所述例举的菌株等的被分类在talaromycescellulolyticus中的菌株,即使在将来改变系统分类的情况下,也被视为属于talaromycescellulolyticus。

s6-25菌株原本于2013年8月8日被保藏在nite国际专利微生物保藏中心(日本千叶县木更津市上总镰足2-5-8122号室,邮编292-0818),并于2013年11月15日基于布达佩斯条约而被移交至国际保藏中心,并被赋予保藏编号nitebp-01685。该菌株为由tn菌株(fermbp-685)而得到的菌株,具有较高的纤维素酶生产能力。y-94菌株原本于1983年1月12日被保藏在通商产业省工业技术院生命工学工业技术研究所(现为nite国际专利微生物保藏中心,邮编292-0818,地址:日本千叶县木更津市上总镰足2-5-8120号室),并于1997年2月19日基于布达佩斯条约而被移交至国际保藏中心,并被赋予保藏编号fermbp-5826。

例如,这些菌株可以从各菌株所保藏的保藏机关入手。

本发明的微生物,可以通过对所述例举的菌株等的talaromycescellulolyticus进行修饰而取得。即,例如,本发明的微生物可以为源自所述例举的菌株的修饰菌株。具体而言,例如,本发明的微生物可以为源自s6-25菌株或y-94菌株的修饰菌株。更具体而言,例如,本发明的微生物可以为源自s6-25菌株的修饰菌株。用于构建本发明的微生物的修饰的实施顺序没有特别限制。

<1-2>靶蛋白生产能力

本发明的微生物具有靶蛋白生产能力。“具有靶蛋白生产能力的微生物”是指具有生产靶蛋白的能力的微生物。“具有靶蛋白生产能力的微生物”具体而言可以指,在通过培养基而进行培养时,具有表达靶蛋白并在培养物中使靶蛋白积蓄至能够回收的程度的能力的微生物。具体而言,“在培养物中的积蓄”可以指在培养基中、菌体表层、菌体内或它们的组合中的积蓄。需要说明的是,将靶蛋白积蓄在菌体外(例如,培养基中、细胞表层)的情况称为靶蛋白的“分泌”或“分泌生产”。即,本发明的微生物可以具有靶蛋白的分泌生产能力(分泌生产靶蛋白的能力)。靶蛋白特别是可以积蓄在培养基中。就靶蛋白的积蓄量而言,例如,作为培养物中的积蓄量,可以为10μg/l以上、1mg/l以上、100mg/l以上或1g/l以上。本发明的微生物可以具有1种靶蛋白的生产能力,也可以具有2种或以上的靶蛋白的生产能力。

本发明的微生物可以是本来就具有靶蛋白生产能力的物质,也可以是以具有靶蛋白生产能力的方式进行了修饰的物质。典型性地,本发明的微生物可以是本来就具有纤维素酶生产能力(生产纤维素酶的能力)的物质。此外,本发明的微生物可以是以使本来所具有的靶蛋白生产能力增强的方式进行了修饰的物质。就具有靶蛋白生产能力的微生物而言,例如,可以通过如上所述地赋予talaromycescellulolyticus以靶蛋白生产能力,或,通过如上所述地增强talaromycescellulolyticus的靶蛋白生产能力而取得。就靶蛋白生产能力而言,例如,可以通过靶蛋白的表达用的基因构建体的导入、其它提高靶蛋白生产能力的修饰的导入或它们的组合而进行赋予或增强。

本发明的微生物依靠具有至少靶蛋白的表达用的基因构建体而具有靶蛋白生产能力。具体而言,本发明的微生物可以通过具有靶蛋白的表达用的基因构建体,或通过具有靶蛋白的表达用的基因构建体和其他性质的组合,而具有靶蛋白生产能力。即,本发明的微生物具有靶蛋白的表达用的基因构建体。本发明的微生物可以具有1拷贝的靶蛋白的表达用的基因构建体,也可以具有2拷贝或以上的靶蛋白的表达用的基因构建体。本发明的微生物可以具有1种靶蛋白的表达用的基因构建体,也可以具有2种或以上的靶蛋白的表达用的基因构建体。靶蛋白的表达用的基因构建体的拷贝数和种类数可以分别称为靶蛋白基因的拷贝数和种类数。

本发明的微生物中,靶蛋白的表达用的基因构建体可以存在于质粒这样的在染色体外进行自主复制的载体上,也可以整合在染色体上。即,就本发明的微生物而言,例如,可以在载体上具有靶蛋白的表达用的基因构建体,换而言之,可以具有包含靶蛋白的表达用的基因构建体的载体。此外,就本发明的微生物而言,例如,可以在染色体上具有靶蛋白的表达用的基因构建体。在本发明的微生物具有2个或以上的靶蛋白的表达用的基因构建体的情况下,这些基因构建体只要以能够制造靶蛋白的方式保持在本发明的微生物中即可。例如,这些基因构建体可以全部保持在单个的表达载体上,也可以全部保持在染色体上。此外,这些基因构建体可以分别保持在多个表达载体上,也可以分别保持在单个或多个表达载体上和染色体上。

本发明的微生物可以是本来就具有靶蛋白的表达用的基因构建体的物质,也可以是以具有靶蛋白的表达用的基因构建体的方式进行了修饰的物质。典型性地,本发明的微生物可以是本来就具有纤维素酶的表达用的基因构建体的物质。此外,本发明的微生物可以是代替本来就具有的靶蛋白的表达用的基因构建体而导入了靶蛋白的表达用的基因构建体的物质、或进一步导入了靶蛋白的表达用的基因构建体的物质。具有靶蛋白的表达用的基因构建体的微生物,可以通过如上所述在talaromycescellulolyticus中导入靶蛋白的表达用的基因构建体而取得。

“靶蛋白的表达用的基因构建体”是指,以能够表达靶蛋白的方式构成的基因表达系统。也将靶蛋白的表达用的基因构建体称为“靶蛋白的表达系统”、“靶蛋白的表达单元”或“靶蛋白的表达盒”。靶蛋白的表达用的基因构建体在5’至3’方向上包含启动子序列和编码靶蛋白的碱基序列。也将启动子序列简称为“启动子”。也将编码氨基酸序列的碱基序列称为“基因”。例如,也将编码靶蛋白编码的碱基序列称为“编码靶蛋白的基因”或“靶蛋白基因”。靶蛋白基因只要连接在启动子的下游以受到基于同启动子的控制并表达靶蛋白即可。此外,靶蛋白的表达用的基因构建体可以在适当的位置上具有用于表达靶蛋白的有效的控制序列(操纵子、终止子等)以使它们发挥功能。需要说明的是,本发明中,除非特别说明,否则“靶蛋白基因的表达”、“靶蛋白的表达”、“靶蛋白的生成”、“靶蛋白的生产”可以相互同义地使用。靶蛋白的表达用的基因构建体可以根据靶蛋白的种类等的各种条件而进行适宜设计。

启动子只要在talaromycescellulolyticus中发挥功能,就没有特别限制。“在talaromycescellulolyticus中发挥功能的启动子”是指在talaromycescellulolyticus中具有启动子活性,即基因的转录活性的启动子。

启动子可以是源自宿主的启动子,也可以是源自异源的启动子。启动子可以是靶蛋白基因的固有的启动子,也可以是其他基因的启动子。此外,启动子可以是诱导性的启动子,也可以是组成性(constitutive)的启动子。作为启动子,可举出微生物的纤维素酶基因的启动子。作为启动子,具体而言,可举出talaromycescellulolyticus的纤维素酶基因的启动子。作为纤维素酶基因,可举出cbhi基因(也称为cbh1基因)、cbhii基因(也称为cbh2基因)。即,作为启动子,可举出cbhi基因的启动子、cbhii基因的启动子。也可以将cbhi基因的启动子称为“cbhi启动子”或“cbh1启动子”。也可以将cbhii基因的启动子称为“cbhii启动子”或“cbh2启动子”。将talaromycescellulolyticus的cbhi启动子和cbhii启动子的碱基序列分别表示为seqidno.41和33。即,就启动子而言,例如,可以是具有所述例举的启动子的碱基序列(例如seqidno.41或33的碱基序列)的启动子。此外,启动子可以是所述例举的启动子(例如具有seqidno.41或33的碱基序列的启动子)的保守性变体。即,例如,所述例举的启动子可以原样使用或进行适宜修饰后使用。“cbhi启动子”和“cbhii启动子”这样的术语除了所述例举的cbhi启动子和cbhii启动子之外,还包含它们的保守性变体。对于启动子的保守性变体,可以适用涉及后述的yscb基因的保守性变体的记载。例如,启动子如果保持原本的功能,则可以是具有相对于seqidno.41或33的碱基序列具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的碱基序列的dna。需要说明的是,启动子的“原本的功能”是指,表达(例如,诱导性或组成性地表达)连接在下游的基因的功能。就启动子的功能而言,例如,可以通过确认基因的表达而进行确认。就基因的表达而言,例如,可以使用报告基因进行确认。

靶蛋白没有特别限制。靶蛋白可以是源自宿主的蛋白质,也可以是源自异源的蛋白质(异源蛋白质)。本发明中,“异源蛋白质”(heterologousprotein)是指,对于生产该蛋白质的talaromycescellulolyticus而言是外来性(exogenous)的蛋白质。就靶蛋白而言,例如,可以是源自微生物的蛋白质,可以是源自植物的蛋白质,可以是源自动物的蛋白质,可以是源自病毒的蛋白质,可以是具有人工设计的氨基酸序列的蛋白质。特别是,靶蛋白可以是人源性蛋白质。靶蛋白可以是单体蛋白质,也可以是多聚体蛋白质。多聚体蛋白质是指,作为包含2或以上的亚基的多聚体而存在的蛋白质。多聚体中,各亚基可以通过二硫键等的共价键而进行连接,可以通过氢键、疏水性相互作用等的非共价键而进行连接,也可以通过它们的组合而进行连接。优选在多聚体中包含1个或以上的分子间二硫键。多聚体可以是包含单一的种类的亚基的同源多聚体,也可以是包含2或以上的种类的亚基的异源多聚体。需要说明的是,“靶蛋白是异源蛋白质”是指,在靶蛋白是异源多聚体蛋白质的情况下,只要构成多聚体的亚基的中至少1个的亚基是异源蛋白质即可。即,可以所有亚基都源自异源,也可以仅一部分亚基源自异源。靶蛋白可以是分泌性蛋白,也可以是非分泌性蛋白。分泌性蛋白可以是天然分泌性的蛋白质,也可以是天然非分泌性的蛋白质,优选为天然分泌性的蛋白质。需要说明的是,“蛋白质”中还包含寡肽、多肽等的称为肽的物质。

作为靶蛋白,例如可举出:酶、生物活性蛋白、受体蛋白、作为疫苗使用的抗原蛋白、其它任意的蛋白质。

作为酶,例如可举出:纤维素酶、谷胺酰转氨酶、蛋白质谷氨酰胺酶(proteinglutaminase)、异麦芽糖葡聚糖酶(isomaltodextranase)、蛋白酶、内肽酶、外肽酶、氨基肽酶、羧基肽酶、胶原酶和几丁质酶等。

本发明中,“纤维素酶”是催化使纤维素中包含的糖苷键水解的反应的酶的总称。作为纤维素酶,可举出:内切型纤维素酶(内切葡聚糖酶;ec3.2.1.4)、外切型纤维素酶(纤维二糖水解酶;ec3.2.1.91)、纤维二糖酶(β-葡萄糖苷酶;ec3.2.1.21)。此外,根据活性测定中使用的基质,纤维素酶称为微晶纤维酶(avicelase)、滤纸纤维素酶(fpase)、羧甲基纤维素酶(cmcase)等。作为纤维素酶,例如,可举出:里氏木霉(trichodermareesei)、talaromycescellulolyticus等的真菌、热纤梭菌(clostridiumthermocellum)等的细菌的纤维素酶。

作为谷胺酰转氨酶,例如,可举出:streptoverticilliummobaraenseifo13819(wo01/23591)、streptoverticilliumcinnamoneumifo12852、streptoverticilliumgriseocarneumifo12776、streptomyceslydicus(wo9606931)等的放线菌、oomycetes(wo9622366)等的丝状菌的分泌型的谷胺酰转氨酶。作为蛋白质谷氨酰胺酶,例如可举出chryseobacteriumproteolyticum的蛋白质谷氨酰胺酶(wo2005/103278)。作为异麦芽糖葡聚糖酶,例如可举出arthrobacterglobiformis的异麦芽糖葡聚糖酶(wo2005/103278)。

作为生物活性蛋白,例如可举出:生长因子(growthfactor),激素,细胞因子,抗体相关分子。

作为生长因子(growthfactor),具体而言,例如可举出:表皮生长因子(epidermalgrowthfactor;egf)、胰岛素样生长因子-1(insulin-likegrowthfactor-1;igf-1)、转化生长因子(transforminggrowthfactor;tgf)、神经生长因子(nervegrowthfactor;ngf)、脑源性神经营养因子(brain-derivedneurotrophicfactor;bdnf)、血管内皮生长因子(vascularendothelialgrowthfactor;vegf)、粒细胞集落刺激因子(granulocyte-colonystimulatingfactor;g-csf)、粒细胞巨噬细胞集落刺激因子(granulocyte-macrophage-colonystimulatingfactor;gm-csf)、血小板衍生生长因子(platelet-derivedgrowthfactor;pdgf)、促红细胞生成素(erythropoietin;epo)、血小板生成素(thrombopoietin;tpo)、酸性成纤维细胞生长因子(acidicfibroblastgrowthfactor;afgf或fgf1)、碱基性成纤维细胞生长因子(basicfibroblastgrowthfactor;bfgf或fgf2)、角质细胞生长因子(keratinocytegrowthfactor;kgf-1或fgf7、kgf-2或fgf10)、肝细胞生长因子(hepatocytegrowthfactor;hgf)。

作为激素,具体而言,例如可举出:胰岛素、胰高血糖素、生长抑素(somatostatin)、人类生长激素(humangrowthhormone;hgh)、甲状旁腺激素(parathyroidhormone;pth)、降钙素(calcitonin)、艾塞那肽(exenatide)。

作为细胞因子,具体而言,例如可举出:白细胞介素、干扰素、肿瘤坏死因子(tumornecrosisfactor;tnf)。

需要说明的是,生长因子(growthfactor)、激素和细胞因子可以不用相互严格区别。例如,生物活性蛋白可以属于选自生长因子(growthfactor)、激素和细胞因子中的任一组,也可以属于选自这些中的多个组。

此外,生物活性蛋白可以是蛋白质整体,也可以是其一部分。作为蛋白质的一部分,例如可举出具有生理活性的部分。作为具有生理活性的部分,具体而言,例如可举出包含甲状旁腺激素(parathyroidhormone;pth)的成熟体的n末端34氨基酸残基的生理活性肽特立帕肽(teriparatide)。

“抗体相关分子”是指,包含由选自构成完整抗体的结构域的单个结构域或2或者2以上结构域的组合组成的分子种的蛋白质。作为构成完整抗体的结构域,可举出:作为重链的结构域的vh、ch1、ch2和ch3、以及作为轻链的结构域的vl和cl。抗体相关分子只要包含所述分子种即可,可以是单体蛋白质,也可以是多聚体蛋白质。需要说明的是,在抗体相关分子为多聚体蛋白质的情况下,可以是包含单一种类的亚基的同源多聚体,也可以是包含2或2个以上种类的亚基的异源多聚体。作为抗体相关分子,具体而言,例如可举出:完整抗体、fab、f(ab’)、f(ab’)2、fc、包含重链(h链)与轻链(l链)的二聚体、fc融合蛋白、重链(h链)、轻链(l链)、单链fv(scfv)、sc(fv)2、二硫键fv(sdfv)、双链抗体(diabody)、vhh片段(nanobody(注册商标))。作为抗体相关分子,更具体而言,例如可举出曲妥珠单抗、纳武单抗。

受体蛋白没有特别限制,例如,可以是对于生物活性蛋白、其它生理活性物质的受体蛋白。作为其它生理活性物质,例如可举出多巴胺等的神经递质。此外,受体蛋白也可以是对应的配体未知的孤儿受体。

作为疫苗使用的抗原蛋白,只要能够引起免疫应答,就没有特别限制,根据假定的免疫应答的对象而适宜选择即可。

此外,作为其它蛋白质,可举出:肝型脂肪酸结合蛋白liver-typefattyacid-bindingprotein(lfabp)、荧光蛋白、免疫球蛋白结合蛋白、白蛋白、细胞外蛋白。作为荧光蛋白,可举出绿色荧光蛋白greenfluorescentprotein(gfp)。作为免疫球蛋白结合蛋白,可举出proteina、proteing、proteinl。作为白蛋白,可举出人血清白蛋白。

作为细胞外蛋白,可举出:纤连蛋白、玻连蛋白、胶原蛋白、骨桥蛋白、层粘连蛋白、它们的部分序列。层粘连蛋白是具有包含α链、β链和γ链的异三聚体结构的蛋白质。作为层粘连蛋白,可举出哺乳动物的层粘连蛋白。作为哺乳动物,可举出:人、猴子、黑猩猩等的灵长类、小鼠、大鼠、仓鼠、豚鼠等的啮齿类、兔子、马、牛、绵羊、山羊、猪、狗、猫等的其它各种哺乳动物。作为哺乳动物,特别是可举出人。层粘连蛋白的亚基链(即,α链、β链和γ链),可举出:5种α链(α1~α5)、3种β链(β1~β3)、3种γ链(γ1~γ3)。层粘连蛋白通过这些亚基链的组合而构成各种的同工型。作为层粘连蛋白,具体而言,例如可举出:层粘连蛋白111、层粘连蛋白121、层粘连蛋白211、层粘连蛋白213、层粘连蛋白221、层粘连蛋白311、层粘连蛋白321、层粘连蛋白332、层粘连蛋白411、层粘连蛋白421、层粘连蛋白423、层粘连蛋白511、层粘连蛋白521、层粘连蛋白523。作为层粘连蛋白的部分序列,可举出作为层粘连蛋白的e8片段的层粘连蛋白e8。具体而言,层粘连蛋白e8,是具有包含α链的e8片段(α链e8)、β链的e8片段(β链e8)和γ链的e8片段(γ链e8)的异三聚体结构的蛋白质。层粘连蛋白e8的亚基链(即,α链e8、β链e8和γ链e8)也总称为“e8亚基链”。作为e8亚基链,可举出所述例举的层粘连蛋白亚基链的e8片段。层粘连蛋白e8通过这些e8亚基链的组合而构成各种同工型。作为层粘连蛋白e8,具体而言,例如可举出:层粘连蛋白111e8、层粘连蛋白121e8、层粘连蛋白211e8、层粘连蛋白221e8、层粘连蛋白332e8、层粘连蛋白421e8、层粘连蛋白411e8、层粘连蛋白511e8、层粘连蛋白521e8。

靶蛋白基因可以原样利用或适宜修饰后利用。靶蛋白基因,例如,为了得到期望的活性而可以进行修饰。对于靶蛋白基因和靶蛋白的变体,可以援用对后述的yscb基因和yscb蛋白质的保守性变体的记载。例如,靶蛋白基因可以以使得在编码的靶蛋白的氨基酸序列中包含1个或几个氨基酸的取代、缺失、插入和/或添加的方式而进行修饰。需要说明的是,源自生物种的特定的蛋白质不限于在该生物种中发现的蛋白质本身,还包含具有在该生物种中发现的蛋白质的氨基酸序列的蛋白质和它们的变体。这些变体可以在该生物种中发现,也可以没有发现。即,例如,“人源蛋白质”是指,不限于在人体中发现的蛋白质本身,还包含具有在人体中发现的蛋白质的氨基酸序列的蛋白质和它们的变体。此外,靶蛋白基因可以将任意的密码子用与其等价的密码子取代。例如,就靶蛋白基因而言,可以根据使用的宿主的密码子使用频率而进行修饰,以使得具有最适的密码子。

就靶蛋白而言,除了所述例举的靶蛋白的氨基酸序列之外,还可以包含其他氨基酸序列。即,靶蛋白可以是与其他氨基酸序列形成的融合蛋白。“其他氨基酸序列”只要能得到期望的性质的靶蛋白,就没有特别限制。“其他氨基酸序列”可以根据其利用目的等的各种条件而适宜选择。作为“其他氨基酸序列”,例如可举出:信号肽(也称为信号序列)、肽标签、蛋白酶的识别序列。“其他氨基酸序列”,例如,可以与靶蛋白的n末端或者c末端、或两者连接。作为“其他氨基酸序列”,可以使用1种氨基酸序列,也可以组合使用2种或2种以上的氨基酸序列。

信号肽,例如,可以在靶蛋白的分泌生产中利用。信号肽可以与靶蛋白的n末端连接。即,在一个方式中,靶蛋白的表达用的基因构建体在从5’至3’方向上可以包含启动子序列、编码信号肽的碱基序列和编码靶蛋白的碱基序列。在这种情况下,可以将编码靶蛋白的核酸序列连接至编码信号肽的核酸序列的下游,以使得靶蛋白作为与同信号肽形成的融合蛋白而进行表达。需要说明的是,在这样的融合蛋白中,信号肽和靶蛋白可以相邻,也可以不相邻。即,“靶蛋白作为与信号肽形成的融合蛋白而进行表达”不限于靶蛋白与信号肽相邻并作为与同信号肽形成的融合蛋白而进行表达的情况,还包含靶蛋白借助其他氨基酸序列而作为与信号肽形成的融合蛋白而进行表达的情况。在利用信号肽而分泌生产靶蛋白的情况下,通常,在分泌时剪切信号肽,可以将没有信号肽的靶蛋白分泌在菌体外。即,“靶蛋白作为与信号肽形成的融合蛋白而进行表达”或“靶蛋白包含信号肽”是指,只要靶蛋白在表达时构成与信号肽形成的融合蛋白即可,不需要最终得到的靶蛋白构成与信号肽形成的融合蛋白。

信号肽只要是在talaromycescellulolyticus中发挥功能物质就没有特别限制。“在talaromycescellulolyticus中发挥功能的信号肽”是指,当与靶蛋白的n末端连接时,在talaromycescellulolyticus中带来靶蛋白的分泌的肽。

信号肽可以是源自宿主的信号肽,也可以是源自异源的信号肽。信号肽可以是靶蛋白的固有的信号肽,也可以是其他蛋白质的信号肽。作为信号肽,可举出微生物的分泌性纤维素酶的信号肽。作为信号肽,具体而言,可举出talaromycescellulolyticus的分泌性纤维素酶的信号肽。作为分泌性纤维素酶,可举出:cbhi基因编码的cbhi蛋白质(也称为cbh1蛋白质)、cbhii基因编码的cbhii蛋白质(也称为cbh2蛋白质)。即,作为信号肽,可举出:cbhi蛋白质的信号肽、cbhii蛋白质的信号肽。也将cbhi蛋白质的信号肽称为“cbhi信号肽”或“cbh1信号肽”。也将cbhii蛋白质的信号肽称为“cbhii信号肽”或“cbh2信号肽”。将talaromycescellulolyticus的cbhi信号肽的氨基酸序列示于seqidno.42中。即,信号肽,例如,可以是具有所述例举的信号肽的氨基酸序列(例如seqidno.42的氨基酸序列)的信号肽。此外,信号肽可以是所述例举的信号肽(例如具有seqidno.42的氨基酸序列的信号肽)的保守性变体。即,例如,所述例举的信号肽可以原样使用或适宜修饰后使用。“cbhi信号肽”和“cbhii信号肽”这样的术语,除了所述例举的cbhi信号肽和cbhii信号肽之外,还包含它们的保守性变体。对于信号肽的保守性变体,可以援用涉及后述的yscb蛋白质的保守性变体的记载。例如,信号肽如果保持原本的功能,则可以是具有在seqidno.42的氨基酸序列中,1或者几个位置的1个或几个氨基酸被取代、缺失、插入和/或添加的氨基酸序列的肽。需要说明的是,信号肽的变体中的所述“1个或几个”是指,具体而言,优选为1~7个,更优选为1~5个,近一些优选为1~3个,特别优选为1~2个。此外,例如,信号肽如果保持原本的功能,则可以是具有相对于seqidno.42的氨基酸序列,具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的氨基酸序列的肽。需要说明的是,对于信号肽的“原本的功能”,是可以在与靶蛋白的n末端连接时带来靶蛋白的分泌的功能。信号肽的功能,例如,可以通过对向蛋白质的n末端的连接引起的该蛋白质的分泌进行确认来确认。

作为肽标签,具体而言,可举出:his标签、flag标签、gst标签、myc标签、mbp(maltosebindingprotein)、cbp(cellulosebindingprotein)、trx(thioredoxin)、gfp(greenfluorescentprotein)、hrp(horseradishperoxidase)、alp(alkalinephosphatase)、抗体的fc区域。肽标签,例如,可以在表达而得的靶蛋白的检测、纯化中利用。

作为蛋白酶的识别序列,具体而言,可举出:hrv3c蛋白酶识别序列、factorxa蛋白酶识别序列、protev蛋白酶识别序列。蛋白酶的识别序列,例如,可以在表达而得的靶蛋白的剪切中利用。具体而言,例如,在使靶蛋白作为与肽标签形成的融合蛋白而进行表达的情况下,通过将蛋白酶的识别序列导入靶蛋白与肽标签的连接部,而能够利用蛋白酶从表达而得的靶蛋白剪切肽标签,得到没有肽标签的靶蛋白。

最终得到的靶蛋白的n末端区域可以与天然的蛋白质相同,也可以与天然的蛋白质不相同。例如,与天然的蛋白质比较,最终得到的靶蛋白的n末端区域可以额外添加或缺失1个或几个氨基酸。需要说明的是,所述“1个或几个”是指,根据目的靶蛋白的全长、结构等而不同,具体而言,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。

此外,靶蛋白可以作为添加有前体结构部的蛋白质(前体蛋白质)而进行表达。在靶蛋白作为前体蛋白质而进行表达的情况下,最终得到的靶蛋白可以是前体蛋白质,也可以不是。即,前体蛋白质可以剪切前体结构部而成为成熟蛋白质。就剪切而言,例如,可以通过蛋白酶而进行。在使用蛋白酶的情况下,从最终得到的蛋白质的活性这样的观点出发,前体蛋白质通常优选在与天然的蛋白质大致相同位置剪切,更优选在与天然的蛋白质完全相同位置剪切而得到与天然的蛋白质相同的成熟蛋白质。因此,通常,最优选在产生天然产生的成熟蛋白质相同的蛋白质的位置剪切前体蛋白质的特异性蛋白酶。然而,如上所述,最终得到的靶蛋白的n末端区域可以与天然的蛋白质不相同。例如,根据要生产的靶蛋白的种类、使用目的等,n末端比天然的蛋白质长或短1~几个氨基酸的蛋白质可能具有更适当的活性。可以在本发明中使用的蛋白酶除了dispase(boehringermannheim公司制)这样的可商购之外,还包含微生物的培养液,例如从放线菌的培养液等得到的蛋白酶。这样的蛋白酶可以在未纯化状态下使用,也可以根据需要纯化至适当的纯度后使用。

靶蛋白基因,例如,可以通过克隆而取得。克隆,例如,可以利用包含靶蛋白基因的基因组dna、cdna等的核酸。此外,就靶蛋白基因而言,例如,也可以通过基于其碱基序列而进行全合成来取得(gene,60(1),115-127(1987))。取得的靶蛋白基因可以原样利用或适宜修饰后利用。即,通过对靶蛋白基因进行修饰,而能够取得其变体。基因的修饰可以通过公知的手法而进行。例如,可以通过位点特异性突变法而在dna的目的位点导入目的变异。作为位点特异性突变法,可举出:使用pcr的方法(higuchi,r.,61,inpcrtechnology,erlich,h.a.eds.,stocktonpress(1989);carter,p.,meth.inenzymol.,154,382(1987))、使用噬菌体的方法(kramer,w.andfrits,h.j.,meth.inenzymol.,154,350(1987);kunkel,t.a.etal.,meth.inenzymol.,154,367(1987))。或者,可以全合成靶蛋白基因的变体。此外,可以对取得的靶蛋白基因适宜进行启动子序列的导入等的修饰,取得靶蛋白的表达用的基因构建体。需要说明的是,靶蛋白的表达用的基因构建体的其他构成要素(例如,启动子序列)、靶蛋白的表达用的基因构建体也可以通过与靶蛋白基因同样的方式取得。

基因的修饰可以通过公知的手法而进行。例如,可以通过位点特异性突变法而在dna的目的位点导入目的变异。作为位点特异性突变法,可举出:使用pcr的方法(higuchi,r.,61,inpcrtechnology,erlich,h.a.eds.,stocktonpress(1989);carter,p.,meth.inenzymol.,154,382(1987))、使用噬菌体的方法(kramer,w.andfrits,h.j.,meth.inenzymol.,154,350(1987);kunkel,t.a.etal.,meth.inenzymol.,154,367(1987))。

将靶蛋白的表达用的基因构建体导入talaromycescellulolyticus的手法没有特别限制。“靶蛋白的表达用的基因构建体的导入”是指只要将靶蛋白的表达用的基因构建体保持在宿主中即可,具体而言,是将靶蛋白基因以使其可以表达的方式导入宿主。“靶蛋白的表达用的基因构建体的导入”,只要没有特别说明,则不限于将预先构建的靶蛋白的表达用的基因构建体一并导入宿主的情况,还包含将靶蛋白的表达用的基因构建体的一部分导入宿主,并且在宿主内构建靶蛋白的表达用的基因构建体的情况。例如,可以通过将靶蛋白基因导入宿主本来就具有的启动子的下游,而在染色体上构建靶蛋白的表达用的基因构建体。

就靶蛋白的表达用的基因构建体而言,例如,可以使用包含靶蛋白的表达用的基因构建体的载体而导入宿主。也将包含靶蛋白的表达用的基因构建体的载体称为“靶蛋白的表达载体”。就靶蛋白的表达载体而言,例如,可以通过将靶蛋白的表达用的基因构建体与载体进行连接而进行构建。此外,例如,在载体具备启动子的情况下,靶蛋白的表达载体可以通过将靶蛋白基因连接至该启动子的下游而进行构建。用靶蛋白的表达载体而转化宿主,从而得到导入了同载体的转化体,即,可以将靶蛋白的表达用的基因构建体导入宿主。就载体而言,只要可以在宿主的细胞内中自主复制就没有特别限制。载体可以是1拷贝载体,可以是低拷贝载体,也可以是多拷贝载体。载体可以具备用于选择转化体的标记基因。载体也可以具备用于表达靶蛋白基因的启动子、终止子。

此外,靶蛋白的表达用的基因构建体可以导入宿主的染色体中。向染色体的基因的导入,可以利用同源重组而进行。具体而言,用包含靶蛋白的表达用的基因构建体的重组dna而转化宿主,与宿主的染色体上的目的位点发生同源重组,从而能够将靶蛋白的表达用的基因构建体导入宿主的染色体上。在同源重组中使用的重组dna的结构只要以期望的方式发生同源重组则没有特别限制。例如,可以是包含靶蛋白的表达用的基因构建体的线状dna,用在靶蛋白的表达用的基因构建体的两端分别具备染色体上的取代对象位点的上游和下游的序列的线状dna转化宿主,在取代对象位点的上游和下游分别发生同源重组,从而能够将取代对象位点用靶蛋白的表达用的基因构建体取代。同源重组中使用的重组dna可以具备用于选择转化体的标记基因。需要说明的是,靶蛋白基因、启动子等,向靶蛋白的表达用的基因构建体的一部分的染色体的导入也可以以与向靶蛋白的表达用的基因构建体整体的染色体的导入同样的方式进行。

标记基因可以根据宿主的营养缺陷型等的性状而适宜选择。例如,在宿主通过pyrf基因或pyrg基因的变异而表现出尿嘧啶(uracil)缺陷型的情况下,将pyrf基因或pyrg基因作为标记基因而使用,从而能够将尿嘧啶(uracil)缺陷型的互补(即非尿嘧啶(uracil)缺陷型)作为指标,选拔导入了目的修饰的菌株。此外,作为标记基因,可以使用潮霉素抗性基因等的药剂抗性基因。

就转化而言,例如,可以通过通常在霉菌、酵母等的真核微生物的转化中使用的手法而进行。作为这样的手法,可举出原生质体法。

<1-3>yscb蛋白质的活性降低

本发明的微生物经过了修饰,以使yscb蛋白质的活性降低。具体而言,本发明的微生物经过了修饰,以使得与非修饰菌株相比yscb蛋白质的活性降低。更具体而言,例如,本发明的微生物经过了修饰,可以以使yscb基因的表达降低,也可以以使yscb基因被破坏。通过以使yscb蛋白质的活性降低的方式对talaromycescellulolyticus进行修饰,而能够提高该微生物的靶蛋白生产能力,即,能够使基于该微生物的靶蛋白的生产增大。

以下,对yscb蛋白质及编码其的yscb基因进行说明。

yscb蛋白质为蛋白酶。“蛋白酶”是指,具有对使蛋白质水解的反应进行催化的活性的蛋白质。此外,也将该活性称为“蛋白酶活性”。

分别将talaromycescellulolyticuss6-25菌株的yscb基因(包含内含子)的碱基序列和该基因编码的yscb蛋白质的氨基酸序列示于分别seqidno.32和43中。即,yscb基因,例如,可以是具有seqidno.32所示的碱基序列的基因。此外,yscb蛋白质,例如,可以是具有seqidno.43所示的氨基酸序列的蛋白质。需要说明的是,“具有(氨基酸或碱基)序列”这样的表达包含该“包含(氨基酸或碱基)序列”情况和该“由(氨基酸或碱基)序列组成”情况。

yscb基因只要保持原本的功能,则可以是所述例举的yscb基因(例如,具有seqidno.32所示的碱基序列的基因)的变体。同样,yscb蛋白质只要保持原本的功能,则可以是所述例举的yscb蛋白质(例如,具有seqidno.43所示的氨基酸序列的蛋白质)的变体。有时也将这样的保持原本的功能的变体称为“保守性变体”。在本发明中,“yscb基因”这样的术语不限于所述例举的yscb基因,还包含其保守性变体。同样,“yscb蛋白质”这样的术语不限于所述例举的yscb蛋白质,还包含其保守性变体。作为保守性变体,例如可举出:所述例举的yscb基因、yscb蛋白质的同系物、人为性的修饰体。

“保持原本的功能”是指,基因或蛋白质的变体具有与原本的基因或蛋白质的功能(活性、性质)对应的功能(活性、性质)。即,“保持原本的功能”是指,在yscb基因的情况下,基因的变体编码保持原本的功能的蛋白质。此外,“保持原本的功能”是指,在yscb蛋白质的情况下,蛋白质的变体具有蛋白酶活性。

蛋白酶活性可以通过将酶与基质(蛋白质)进行培养(incubate),测定酶依赖性的基质的分解而进行测定。此外,蛋白酶活性可以使用市售的蛋白酶活性测定试剂盒而进行测定。

以下,将举例表示保守性变体。

就yscb基因的同系物或yscb蛋白质的同系物而言,例如,可以通过使用所述例举的yscb基因的碱基序列或所述例举的yscb蛋白质的氨基酸序列作为查询序列的blast检索、fasta检索而从公开数据库容易地取得。此外,就yscb基因的同系物而言,例如,可以以talaromycescellulolyticus的染色体为模板,通过使用基于这些公知的yscb基因的碱基序列而制备的寡核苷酸作为引物的pcr而取得。

yscb基因只要保持原本的功能,则可以是编码具有在所述例举的yscb蛋白质的氨基酸序列(例如,seqidno.43所示的氨基酸序列)中,1或者几个的位置上的1个或几个氨基酸被取代、缺失、插入和/或添加的氨基酸序列的蛋白质的基因。需要说明的是,所述“1个或几个”,根据氨基酸残基的蛋白质的立体结构中的位置、氨基酸残基的种类而不同,具体而言,例如为1~50个、1~40个、1~30个,优选为1~20个,更优选为1~10个,进一步优选为1~5个,特别优选为1~3个。

所述的1或者几个的氨基酸的取代、缺失、插入和/或添加是正常保持蛋白质的功能的保守性变异。代表性的保守性变异是保守性取代。保守性取代是指,在取代位点为芳香族氨基酸的情况下,是在phe、trp、tyr间相互取代的变异,在取代位点为疏水性氨基酸的情况下,是在leu、ile、val间相互取代的变异,在为极性氨基酸的情况下,是在gln、asn间相互取代的变异,在为碱基性氨基酸的情况下,是在lys、arg、his间相互取代的变异,在为酸性氨基酸的情况下,是在asp、glu间相互取代的变异,在为具有羟基的氨基酸的情况下,是在ser、thr间相互取代的变异。作为被认为是保守性取代的取代,具体而言,可举出:从ala向ser或thr的取代,从arg向gln、his或lys的取代、从asn向glu、gln、lys、his或asp的取代、从asp向asn、glu或gln的取代、从cys向ser或ala的取代、从gln向asn、glu、lys、his、asp或arg的取代、从glu向gly、asn、gln、lys或asp的取代、从gly向pro的取代、从his向asn、lys、gln、arg或tyr的取代、从ile向leu、met、val或phe的取代、从leu向ile、met、val或phe的取代、从lys向asn、glu、gln、his或arg的取代、从met向ile、leu、val或phe的取代、从phe向trp、tyr、met、ile或leu的取代、从ser向thr或ala的取代、从thr向ser或ala的取代、从trp向phe或tyr的取代、从tyr向his、phe或trp的取代和从val向met、ile或leu的取代。此外,所述的这样的氨基酸的取代、缺失、插入或添加,包含因基于源自基因的生物的个体差、物种的差异的情况等的天然产生的变异(mutant或variant)而产生的情况。

此外,yscb基因只要保持原本的功能,则可以是编码具有下述氨基酸序列的蛋白质的基因,所述氨基酸序列对整个所述例举的yscb蛋白质的氨基酸序列(例如,seqidno.43所示的氨基酸序列)具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的。需要说明的是,在本说明书中,“同源性”(homology)意味着“同一性”(identity)。

此外,yscb基因只要保持原本的功能,则可以是在严格条件下与所述例举的yscb基因的碱基序列(例如,seqidno.32所示的碱基序列)的互补序列或可以从同互补序列制备的探针进行杂交的dna。“严格条件”是指,形成所谓的特异性的杂交,不形成非特异性的杂交的条件。如果显示一个实例,可举出:同源性较高的dna彼此杂交,例如,具有80%以上,优选为90%以上,更优选为95%以上,进一步优选为97%以上,特别优选为99%以上的同源性的dna彼此杂交,并且同源性较低的dna彼此不杂交的条件,或者与作为通常的southern杂交的洗涤的条件的60℃,1×ssc,0.1%sds,优选为60℃,0.1×ssc,0.1%sds,更优选为68℃,0.1×ssc,0.1%sds相当的盐浓度和温度下,进行1次,优选为2~3次清洗的条件。

所述探针,例如,可以是基因的互补序列的一部分。这样的探针可以通过将基于公知的基因的碱基序列而制备的寡核苷酸作为引物,将包含这些碱基序列的dna片段设为模板的pcr而进行制备。作为探针,例如,可以使用300bp左右的长度的dna片段。在这样的情况下,作为杂交的洗涤的条件,可举出:50℃,2×ssc,0.1%sds。

此外,yscb基因可以是将任意的密码子用与其等价的密码子取代而得到基因。即,yscb基因可以是基于密码子的简并的所述例举的yscb基因的变体。

2个序列间的序列同源性的百分比,例如,可以使用数学性算法来确定。作为这样的数学性算法的非限定的实例,可举出:myersandmiller(1988)cabios4:11-17的算法,smithetal(1981)adv.appl.math.2:482的局部相同算法、needlemanandwunsch(1970)j.mol.biol.48:443-453的相同比对算法、检索pearsonandlipman(1988)proc.natl.acad.sci.85:2444-2448的类似性的方法、karlinandaltschul(1993)proc.natl.acad.sci.usa90:5873-5877中记载的那样的改良的karlinandaltschul(1990)proc.natl.acad.sci.usa87:2264的算法。

可以利用基于这些数学性算法的程序,进行用于确定序列同源性的序列比较(校准)。程序可以适宜通过计算机实行。作为这样的程序,没有特别限定,可举出:pc/gene程序的clustal(可从intelligenetics,mountainview,calif.入手)、align程序(version2.0)以及wisconsingeneticssoftwarepackage,version8(可从geneticscomputergroup(gcg),575sciencedrive,madison,wis.,usa入手)的gap、bestfit、blast、fasta和tfasta。使用了这些程序的校准,例如,可以使用初期参数而进行。对于clustal程序,良好地记载在higginsetal.(1988)gene73:237-244、higginsetal.(1989)cabios5:151-153、corpetetal.(1988)nucleicacidsres.16:10881-90、huangetal.(1992)cabios8:155-65和pearsonetal.(1994)meth.mol.biol.24:307-331中。

为了得到与编码对象的蛋白质的核苷酸序列具有同源性的核苷酸序列,具体而言,例如,可以通过blastn程序,在分数=100,字长=12下进行blast核苷酸检索。为了得到与对象的蛋白质具有同源性的氨基酸序列,具体而言,例如,可以通过blastx程序,在分数=50,字长=3下进行blast蛋白质检索。对于blast核苷酸检索、blast蛋白质检索,参照http://www.ncbi.nlm.nih.gov。此外,为了得到为了比较而添加了间隙的校准,可以利用gappedblast(blast2.0)。此外,可以利用psi-blast(blast2.0)检测序列间的离间关系并进行反复检索。对于gappedblast和psi-blast,参照altschuletal.(1997)nucleicacidsres.25:3389。在利用blast、gappedblast或psi-blast的情况下,例如,可以使用各程序(例如,针对核苷酸序列的blastn,针对氨基酸序列的blastx)的初期参数。校准可以手动执行。

2个序列间的序列同源性作为当将2个序列以变成最大一致的方式进行排列时2个序列间一致的残基的比例而算出。需要说明的是,氨基酸序列间的“同源性”,具体而言,只要没有特别说明,则是指使用通过blastp而默认设定的scoringparameters(matrix:blosum62;gapcosts:existence=11,extension=1;compositionaladjustments:conditionalcompositionalscorematrixadjustment)算出的氨基酸序列间的同源性。此外,碱基序列间的“同源性”,具体而言,只要没有特别说明,则是指使用通过blastn而默认设定的scoringparameters(match/mismatchscores=1,-2;gapcosts=linear)而算出的碱基序列间的同源性。

需要说明的是,与所述的基因、蛋白质的变体有关的记载也可以援用在靶蛋白等的任意的蛋白质和编码它们的基因中。

<1-4>其它性质

本发明的微生物只要不损害靶蛋白生产能力,就可以具有其它期望的性质(例如修饰)。作为修饰,可举出提高talaromycescellulolyticus的靶蛋白生产能力的修饰。作为修饰,具体而言,可举出降低crea蛋白质的活性的修饰。这些性质、修饰可以单独或适宜组合利用。

即,例如,可以对本发明的微生物进行修饰,使得crea蛋白的活性降低。具体而言,可以对本发明的微生物进行修饰,使其与非修饰菌株比较crea蛋白的活性降低。更具体而言,例如,可以对本发明的微生物进行修饰,使得crea基因的表达降低,或使得crea基因被破坏。crea基因是编码参与分解代谢物阻遏的转录因子的基因。已知crea基因在丝状菌中参与纤维素酶的表达(molgengenet.1996jun24;251(4):451-60,bioscibiotechnolbiochem.1998dec;62(12):2364-70)。

将talaromycescellulolyticuss6-25菌株的crea基因的碱基序列示于seqidno.44中。即,例如,crea基因可以是具有seqidno.44所示的碱基序列的基因。此外,例如,crea蛋白可以是具有通过seqidno.44所示的碱基序列而编码的氨基酸序列的蛋白质。crea基因和crea蛋白可以分别是所述例举的crea基因和crea蛋白的保守性变体。对于crea基因和crea蛋白的保守性变体可以援用对yscb基因和yscb蛋白质的保守性变体的记载。需要说明的是,“保持原本的功能”是指,在crea蛋白的情况下,蛋白质的变体具有作为参与分解代谢物阻遏的转录因子的功能。

<1-5>使蛋白质的活性降低的手法

以下,对使yscb蛋白质、crea蛋白质等的蛋白质的活性降低的手法进行说明。

“蛋白质的活性降低”是指,与非修饰菌株相比该蛋白质的活性降低。具体而言,“蛋白质的活性降低”是指,与非修饰菌株相比该蛋白质在每个细胞中的活性降低。此处所说的“非修饰菌株”是指,未以使得靶蛋白的活性降低的方式而修饰的对照菌株。作为非修饰菌株,可举出野生菌株、亲本菌株。作为非修饰菌株,具体而言,可举出talaromycescellulolyticus的说明中例举的菌株。即,在一个方式中,与talaromycescellulolyticuss6-25菌株相比蛋白质的活性可以降低。需要说明的是,“蛋白质的活性降低”也包含该蛋白质的活性完全消失的情况。更具体而言,“蛋白质的活性降低”可以是指,与非修饰菌株相比,该蛋白质在每个细胞中的分子数降低,和/或,该蛋白质的每个分子的功能降低。即,“蛋白质的活性降低”这样的情况的“活性”,不限于蛋白质的催化剂活性,可以是指编码蛋白质的基因的转录量(mrna量)或翻译量(蛋白质的量)。需要说明的是,“蛋白质在每个细胞中的分子数降低”也包含该蛋白质完全不存在的情况。此外,“蛋白质的每个分子的功能降低”也包含该蛋白质的每个分子的功能完全消失的情况。蛋白质的活性的降低的程度,如果与非修饰菌株相比蛋白质的活性降低,则没有特别限制。蛋白质的活性,例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。

这样的使蛋白质的活性降低的修饰,例如,可以通过使编码该蛋白质的基因的表达降低而达成。“基因的表达降低”是指,与非修饰菌株相比该基因的表达降低。“基因的表达降低”是指,具体而言,与非修饰菌株相比该基因在每个细胞中的表达量降低。“基因的表达降低”可以是指,更具体而言,基因的转录量(mrna量)降低,和/或,基因的翻译量(蛋白质的量)降低。“基因的表达降低”包含该基因完全不表达的情况。需要说明的是,也将“基因的表达降低”称为“基因的表达弱化”。基因的表达,例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。

基因的表达的降低,例如,可以基于转录效率的降低,可以基于翻译效率的降低,也可以基于它们的组合。基因的表达的降低,例如,可以通过对基因的表达调控序列进行修饰而达成。“表达调控序列”是影响启动子等的基因的表达的位点的总称。表达调控序列,例如,可以使用启动子检索载体、genetyx等的基因分析软件而进行确定。在对表达调控序列进行修饰的情况下,表达调控序列优选1碱基以上,更优选2碱基以上,特别优选3碱基以上被修饰。基因的转录效率的降低,例如,可以通过用更弱的启动子取代染色体上的基因的启动子而达成。“更弱的启动子”是指,基因的转录比原本存在的野生型的启动子弱的启动子。作为更弱的启动子,例如可举出诱导型的启动子。即,诱导型的启动子可以在非诱导条件下(例如,不存在诱导物质下)作为更弱的启动子而发挥功能。此外,可以使表达调控序列的一部分或全部的区域缺失(缺陷)。此外,基因的表达的降低,例如,可以通过操纵与表达控制有关的因子而达成。作为与表达控制有关的因子,可举出:与转录、翻译控制有关的低分子(诱导物质、阻碍物质等)、蛋白质(转录因子等)、核酸(sirna等)等。此外,基因的表达的降低,例如,也可以通过在基因的编码区域中导入使基因的表达降低这样的变异而达成。例如,将基因的编码区域的密码子替换为在宿主中以更低频率利用的同义密码子,因此能够使基因的表达降低。此外,例如,通过后述这样的基因的破坏而可以使基因的表达本身降低。

此外,这样的使蛋白质的活性降低的修饰,例如,可以通过对编码该蛋白质的基因进行破坏而达成。“使基因破坏”是指,对该基因进行修饰,使得不产生正常发挥功能的蛋白质。“不产生正常发挥功能的蛋白质”包含从该基因完全不产生蛋白质的情况、从该基因产生每个分子的功能(活性、性质)降低或消失的蛋白质的情况。

基因的破坏,例如,可以通过使染色体上的基因缺失(缺陷)而达成。“基因的缺失”是指,基因的编码区域的一部分或全部的区域的缺失。进一步,也可以使包含染色体上的基因的编码区域的前后的序列的整个基因缺失。基因的编码区域的前后的序列,例如,可以包含基因的表达调控序列。只要能够达成蛋白质的活性的降低,则缺失的区域可以是n末端区域(编码蛋白质的n末端侧的区域)、内部区域、c末端区域(编码蛋白质的c末端侧的区域)等的任一区域。通常,缺失的区域长的情况能够确实地使基因不活化。缺失的区域,例如,可以是基因的编码区域全长的10%以上、20%以上、30%以上、40%以上、50%以上、60%以上、70%以上、80%以上、90%以上或95%以上的长度的区域。此外,优选缺失的区域的前后的序列的阅读框不一致。可以通过阅读框的不一致而在缺失的区域的下游发生移码。在crea基因的情况下,具体而言,例如,通过使与seqidno.44的3262~4509位相当的部分缺失,而能够破坏该基因。

此外,基因的破坏,例如,可以通过在染色体上的基因的编码区域中导入氨基酸取代(错义突变)、导入终止密码子(无义突变)或导入1~2碱基的添加或缺失(移码变异)等而达成(journalofbiologicalchemistry272:8611-8617(1997),proceedingsofthenationalacademyofsciences,usa955511-5515(1998),journalofbiologicalchemistry26116,20833-20839(1991))。

此外,基因的破坏,例如,可以通过在染色体上的基因的编码区域中插入其他碱基序列而达成。插入位点可以是基因的任一区域,插入的碱基序列长的情况能够确实得使基因不活化。此外,优选插入位点的前后的序列的阅读框不一致。通过阅读框的不一致而可以在插入位点的下游发生移码。作为其他碱基序列,如果使编码的蛋白质的活性降低或消失则没有特别限制,例如,可举出在标记基因、靶蛋白生产中有用的基因。

特别是,可以实施基因的破坏,使得编码的蛋白质的氨基酸序列缺失(缺陷)。换而言之,这样的使蛋白质的活性降低的修饰,例如,可以通过使蛋白质的氨基酸序列缺失而达成,具体而言,可以通过以使其编码氨基酸序列缺失的蛋白质的方式对基因进行修饰而达成。需要说明的是,“蛋白质的氨基酸序列的缺失”是指,蛋白质的氨基酸序列的一部分或全部的区域的缺失。此外,“蛋白质的氨基酸序列的缺失”是指在蛋白质中原本的氨基酸序列变为不存在,也包含原本的氨基酸序列变为别的氨基酸序列的情况。即,例如,通过移码而变为别的氨基酸序列的区域可以被认为是缺失的区域。通过蛋白质的氨基酸序列的缺失,典型性地使蛋白质的全长短缩,但也可能存在蛋白质的全长不变化,或延长的情况。例如,通过使基因的编码区域的一部分或全部的区域的缺失,而能够在编码的蛋白质的氨基酸序列中,使该缺失的区域所编码的区域缺失。此外,例如,通过向基因的编码区域的终止密码子的导入,而能够在编码的蛋白质的氨基酸序列中,使在该导入位点的下游的区域所编码的区域缺失。此外,例如,通过基因的编码区域中的移码,而能够使该移码位点所编码的区域缺失。对于氨基酸序列的缺失中的缺失的区域的位置和长度,可以援用基因的缺失中的缺失的区域的位置和长度的说明。

在对染色体上的基因进行如上所述的修饰的情况下,例如可以通过下述方式达成:制备经过修饰的破坏型基因,使其不产生正常发挥功能的蛋白质,用包含该破坏型基因的重组dna转化宿主,通过破坏型基因和染色体上的野生型基因而发生同源重组,从而用破坏型基因取代染色体上的野生型基因。此时,重组dna如果根据宿主的营养缺陷型等的性状而包含标记基因,则容易操纵。作为破坏型基因,可举出:缺失了基因的编码区域的一部分或全部的区域的基因、导入了错义突变的基因、导入了无义突变的基因、导入了移码变异的基因、导入了转座子、标记基因等的插入序列的基因。由破坏型基因而编码的蛋白质,即使生成,也具有与野生型蛋白质不同的立体结构,功能降低或消失。

同源重组中使用的重组dna的结构,只要以期望的方式发生同源重组,则没有特别限制。例如为包含任意的序列的线状dna,用在该任意的序列的两端分别具备染色体上的取代对象位点的上游和下游的序列的线状dna转化宿主,分别使取代对象位点的上游和下游发生同源重组,从而能够在1步骤中用该任意的序列取代要取代对象位点。作为该任意的序列,例如可以使用包含标记基因的序列。

标记基因可以根据宿主的营养缺陷型等的性状而适宜选择。例如,在宿主通过pyrf基因或pyrg基因的变异而表现出尿嘧啶(uracil)缺陷型的情况下,通过将pyrf基因或pyrg基因作为标记基因使用,而能够将尿嘧啶(uracil)缺陷型的互补(即非尿嘧啶(uracil)缺陷型)作为指标,选拔导入有目的修饰的菌株。此外,例如,在通过sc基因(sulfatepermiase基因)的变异而表现出蛋氨酸缺陷型的情况下,通过将sc基因作为标记基因使用,而能够将蛋氨酸缺陷型的互补(即蛋氨酸非缺陷型)作为指标,选拔导入有目的修饰的菌株。此外,作为标记基因,可以使用潮霉素抗性基因等的药剂抗性基因。

此外,这样的使蛋白质的活性降低的修饰,例如,可以通过突变处理而进行。作为突变处理,可举出:x射线的照射、紫外线的照射、以及基于n-甲基-n'-硝基-n-亚硝基胍(mnng)、甲磺酸乙酯(ems)和甲基磺酸甲酯(mms)等的变异剂的处理。

可以通过对该蛋白质的活性进行测定来确认蛋白质的活性降低。yscb蛋白质的活性例如可以通过如上所述的方式进行测定。例如,crea蛋白的活性可以通过对分解代谢物阻遏的程度进行测定而测定。例如,分解代谢物阻遏的程度可以通过对包含葡萄糖作为碳源的培养条件下的纤维素酶生产进行测定而测定。即,具体而言,例如,可以通过将包含葡萄糖作为碳源的培养条件下的纤维素酶生产的提高作为指标来确认crea蛋白的活性降低。

也可以通过对编码该蛋白质的基因的表达降低进行确认来确认蛋白质的活性降低。基因的表达降低也可以通过下述方式确定:通过对该基因的转录量降低进行确认或通过对从该基因表达的蛋白质的量降低进行确认。

基因的转录量降低的确认可以通过将从该基因转录的mrna的量与非修饰菌株进行比较而进行。作为评价mrna的量的方法,可举出:northern杂交、rt-pcr等(molecularcloning(coldspringharborlaboratorypress,coldspringharbor(usa),2001))。mrna的量(例如,每细胞中的分子数),例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。。

蛋白质的量降低的确认可以使用抗体通过蛋白质印迹法而进行(molecularcloning(coldspringharborlaboratorypress,coldspringharbor(usa),2001))。蛋白质的量(例如,每细胞中的分子数),例如,可以降低至非修饰菌株的50%以下、20%以下、10%以下、5%以下或0%。

基因破坏可以通过下述方式确认:根据破坏中使用的手段,对该基因的一部分或全部的碱基序列、制限酶图谱或全长等进行确定。

就转化而言,例如,可以通过霉菌、酵母等的真核微生物的转化中通常使用的手法而进行。作为这样的手法,可举出原生质体法。

<2>本发明的方法

可以利用本发明的微生物,制造靶蛋白。具体而言,可以通过培养本发明的微生物,而制造靶蛋白。即,具体而言,本发明的方法可以是包含用培养基对本发明的微生物进行培养的、靶蛋白的制造方法。

使用的培养基,只要使得本发明的微生物能够增殖,生产靶蛋白,则没有特别限制。作为培养基,例如,可以使用根据需要而含有选自碳源、氮源、磷酸源、硫源、其它各种有机成分、无机成分的成分的培养基。本领域技术人员可以适宜设定培养基成分的种类、浓度。对于具体的培养基组成,例如,可以参照与talaromycescellulolyticus有关的报告(日本特开2003-135052、日本特开2008-271826、日本特开2008-271927等)中所述的培养基组成、里氏木霉等的其它各种纤维素酶生产微生物用的培养基组成。

就碳源而言,只要能够使本发明的微生物同化并生成靶蛋白,则没有特别限制。作为碳源,例如可举出:糖类、纤维素类基质。作为糖类,具体而言,例如可举出:葡萄糖、果糖、半乳糖、木糖、阿拉伯糖、蔗糖、乳糖、纤维二糖、糖蜜、淀粉水解物、生物质水解物。作为纤维素类基质,具体而言,例如可举出:微晶纤维素(avicel)、滤纸、废纸、纸浆、木材、稻草(ricestraw)、麦秆(straw)、稻壳、米糠、麦麸、甘蔗渣、咖啡渣、茶渣。纤维素类基质可以在进行水热分解处理、酸处理、碱处理、蒸煮、破碎、粉碎等的预处理之后用作碳源。作为市售的适宜的纤维素类基质,可举出solkafloc(internationalfibercorp,northtonawanda,ny,u.s.a)。作为碳源,可以使用1种碳源,也可以组合使用2种或2种以上的碳源。

作为氮源,具体而言,例如可举出:硫酸铵、氯化铵、磷酸铵等的铵盐、蛋白胨、酵母提取物、肉提取物、玉米浆、大豆蛋白分解物等的有机氮源、氨、尿素。作为氮源,可以使用1种氮源,也可以组合使用2种或2种以上的氮源。

作为磷酸源,具体而言,例如可举出:磷酸二氢钾、磷酸氢二钾等的磷酸盐、焦磷酸等的磷酸聚合物。作为磷酸源,可以使用1种磷酸源,也可以组合使用2种或2种以上的磷酸源。

作为硫源,具体而言,例如可举出:硫酸盐、硫代硫酸盐、亚硫酸盐等的无机硫化合物、半胱氨酸、胱氨酸、谷胱甘肽等的含硫氨基酸。作为硫源,可以使用1种硫源,也可以组合使用2种或2种以上的硫源。

作为其它各种有机成分、无机成分,具体而言,例如可举出:氯化钠、氯化钾等的无机盐类;铁、锰、镁、钙等的微量金属类;维生素b1、维生素b2、维生素b6、烟酸、烟酸酰胺、维生素b12等的维生素类;氨基酸类;核酸类;包含这些的蛋白胨、酪蛋白氨基酸、酵母提取物、大豆蛋白分解物等的有机成分。作为其它各种有机成分、无机成分,可以使用1种成分,也可以组合使用2种或2种以上的成分。

就培养条件而言,只要本发明的微生物能够增殖,生产靶蛋白,则没有特别限制。就培养而言,例如,可以在丝状菌等的微生物的培养中使用的通常的条件而进行。对于具体的培养条件,例如,可以参照与talaromycescellulolyticus有关的报告(日本特开2003-135052、日本特开2008-271826、日本特开2008-271927等)所述的培养条件、里氏木霉等的其它各种纤维素酶生产微生物用的培养条件。

就培养而言,例如,可以使用液体培养基,在好氧条件下进行。在好氧条件下的培养,具体而言,可以通过通气培养、振荡培养、搅拌培养或它们的组合而进行。就培养温度而言,例如,可以为15~43℃,特别可以为约30℃。就培养期间而言,例如,可以为2小时~20日。培养可以通过分批培养(batchculture)、流加培养(fed-batchculture)、连续培养(continuousculture)或它们的组合而实施。需要说明的是,也将培养开始时的培养基称为“初始培养基”。此外,也将流加培养或连续培养中供给至培养体系(发酵槽)中的培养基称为“流加培养基”。此外,也将在流加培养或连续培养中向培养体系中供给流加培养基称为“流加”。此外,培养可以分为预培养和主培养而实施。例如,可以在琼脂培养基等的固体培养基中进行预培养,可以在液体培养基中进行主培养。可以继续培养,例如,直至培养基中的碳源被消耗或直至本发明的微生物的活性丧失为止。

在本发明中,各培养基成分可以含有在初始培养基、流加培养基或这两者中。初始培养基中含有的成分的种类可以与流加培养基中含有的成分的种类相同,也可以不同。此外,初始培养基中含有的各成分的浓度可以与流加培养基中含有的各成分的浓度相同,也可以不同。此外,可以使用含有的成分的种类和/或浓度的不同的2种或2种以上的流加培养基。例如,在间歇性地进行多次流加的情况下,各回的流加培养基中含有的成分的种类和/或浓度可以相同,也可以不同。

各种成分的浓度可以通过气相色谱法(hashimoto,k.etal.1996.biosci.biotechnol.biochem.70:22-30)、hplc(lin,j.t.etal.1998.j.chromatogr.a.808:43-49)而进行测定

通过如上所述对本发明的微生物进行培养,而表达靶蛋白,得到包含靶蛋白的培养物。具体而言,靶蛋白可以向培养基中、菌体表层、菌体内或它们的组合积蓄。靶蛋白特别是可以积蓄在培养基中。

靶蛋白的生产可以通过蛋白质的检测或鉴定中使用的公知的方法而进行确认。作为这样的方法,例如可举出:sds-page、蛋白质印迹法(westernblotting)、质谱法、n末氨基酸序列分析、酶活性测定。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

生成的靶蛋白可以适宜回收。即,本发明的靶蛋白的制造方法可以包含回收生成的靶蛋白。具体而言,就靶蛋白而言,可以作为包含靶蛋白的适当的部分而进行回收。作为这样的部分,例如可举出:培养物、培养上清液、菌体、菌体处理物(破碎物、溶解物、萃取物(无细胞萃取液))。就菌体而言,例如,可以以用丙烯酸酰胺、卡拉胶等的载体进行了固定化的固定化菌体的方式提供。

此外,可以将靶蛋白分离纯化至期望的程度。靶蛋白可以以游离的状态下而提供,也可以以进行了在树脂等的固相中的固定化的固定化酶的状态下而提供。

在将靶蛋白积蓄在培养基中的情况下,就靶蛋白而言,例如,可以在通过离心分离等从培养物中除去菌体等的固体成分后,从上清液中分离纯化。

在靶蛋白在菌体内的情况下,就靶蛋白而言,例如,可以在对菌体进行破碎、溶解或萃取等的处理后,从处理物中分离纯化。菌体可以通过离心分离等而从培养物中回收。细胞的破碎、溶解或萃取等的处理可以通过公知的方法而进行。作为这样的方法,例如可举出:超声波破碎法、dyno-mill法、珠粒破碎、法式压制破碎(frenchpresscrushing)、溶菌酶处理。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

在靶蛋白积蓄在菌体表层的情况下,就靶蛋白而言,例如,可以在进行可溶化后,从可溶化物中分离纯化。可溶化可以通过公知的方法而进行。作为这样的方法,例如可举出:盐浓度的上升、表面活性剂的使用。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

靶蛋白的纯化(例如,从如上所述的上清液、处理物或可溶化物中的纯化)可以通过蛋白质的纯化中使用的公知的方法而进行。作为这样的方法,例如可举出:硫酸铵分级分离、离子交换色谱法、疏水色谱法、亲和色谱法、凝胶过滤色谱法、等电点沉淀。这些方法可以单独使用1种,也可以组合使用2种或2种以上。

需要说明的是,培养物中,与靶蛋白同时,还可以生成积蓄其他酶,例如,纤维素酶、木聚糖酶、木糖苷酶(β-木糖苷酶)、阿拉伯呋喃糖苷酶(arabinofuranosidase)等的半纤维素酶。靶蛋白可以作为与这些其他酶形成的混合物而回收,也可以与这些其他酶分离而回收。

回收的靶蛋白可以适宜制剂化。剂形没有特别限制,可以根据靶蛋白的使用用途等的各种条件而适宜设定。作为剂形,例如可举出:液剂、悬浮剂、散剂、片剂、丸剂、胶囊剂。在制剂化中,例如可以使用:赋形剂、粘合剂、崩解剂、润滑剂、稳定剂、矫味剂、矫臭剂、香料、稀释剂、表面活性剂等的药理学上容许的添加剂。

实施例

以下,通过非限定性的实施例而进一步对本发明具体性地进行说明。

(1)talaromycescellulolyticus的yscb基因缺陷菌株f09δyscb的构建

将talaromycescellulolyticusf09菌株(日本特开2016-131533)作为亲本菌株,通过以下步骤而破坏yscb基因(seqidno.32),构建t.cellulolyticusf09δyscb菌株。f09菌株是将t.cellulolyticuss6-25菌株(nitebp-01685)作为亲本菌株而得到的在pyrf基因中具有变异(单碱基取代)的菌株。f09菌株通过pyrf基因的变异而表现出尿嘧啶(uracil)缺陷型。

首先,根据以下步骤而制成具有按照t.cellulolyticus的yscb基因上游区域、潮霉素抗性基因、t.cellulolyticus的yscb基因下游区域的顺序连接的碱基序列的yscb基因破坏用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.1和2)的pcr而使yscb基因的上游区域扩增,通过使用了引物(seqidno.3和4)的pcr而使yscb基因的下游区域扩增。此外,将搭载有潮霉素抗性基因的pcdna3.1/hygro(+)(lifetechnologies)作为模板,通过使用了引物(seqidno.5和6)的pcr而使潮霉素抗性基因(包含启动子和终止子)扩增。使用wizardsvgelandpcrclean-upsystem(promega)使pcr产物纯化。通过in-fusionhdcloningkit(takarabio)而将纯化的pcr产物导入并与试剂盒随附的puc质粒连接。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了yscb基因破坏用dna片段的puc-yscb::hyg质粒。将puc-yscb::hyg质粒作为模板,通过使用了引物(seqidno.1和4)的pcr而使yscb基因破坏用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。

接下来,将f09菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在琼脂培养基上形成的菌落的末端附近打孔而得到的1个琼脂盘接种至包含24g/lpotatodextrosebroth的培养基中,在30℃、220rpm的条件下进行2天旋转培养。通过离心分离(5000rpm,5分钟)而回收菌体,添加包含10g/lyatalase(takarabio)、10mmkh2po4、0.8mnacl的水溶液(ph6.0)30ml,在振荡的同时使其在30℃下进行2小时反应,消化细胞壁而进行原生质体化。通过玻璃过滤器而除去残渣后,通过离心分离(2000rpm,10分钟)而回收原生质体,通过包含1.2m山梨糖醇、10mmcacl2的tris-hcl缓冲液(ph7.5)而悬浮成1ml,制备原生质体溶液。在200μl的原生质体溶液中,添加10μg纯化的yscb破坏用dna片段和50μl包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5),在冰上放置30分钟。然后进一步添加1ml的包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5)并进行混合,在室温下放置15分钟而进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖、1g/l尿嘧啶(uracil)、1g/l尿苷的最小必需培养基(10g/l葡萄糖、10mmnh4cl、10mmkh2po4、7mmkcl、2mmmgso4、0.06mg/lh3bo3、0.26mg/l(nh4)6mo7o24·4h2o、1mg/lfecl3·6h2o、0.4mg/lcuso4·5h2o、0.08mg/lmncl2、2mg/lzncl2、20g/lbactoagar)中,在30℃下培养1天后,覆盖包含0.5g/lhygromycinb、24g/lpotatodextrosebroth、7g/lbactoagar的培养基,进一步在30℃下培养3天,从而选拔潮霉素抗性菌株。将出现的菌落接种至包含0.5g/lhygromycinb的最小必需培养基中,在30℃下培养4天后,确认yscb基因被hygromycin抗性基因取代,得到源自f09的yscb破坏菌株(f09δyscb菌株)。

(2)人血清白蛋白(hsa)表达菌株的构建和培养评价

将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建人血清白蛋白(hsa)表达菌株。

首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、hsa基因(seqidno.35)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的hsa表达用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和12)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.15和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.17和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.19和20)的pcr而使hsa基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了hsa表达用dna片段的puc-crea::pcbh2-hsa-pyrf质粒。将puc-crea::pcbh2-hsa-pyrf质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使hsa表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与hsa表达序列的两端连接,可以不是在基因组上的随机的位置,而是针对crea基因区域而插入hsa表达序列。

接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的hsa表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被hsa表达序列取代,得到源自f09菌株和f09δyscb菌株的hsa表达菌株。

将源自f09菌株和f09δyscb菌株的hsa表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认hsa的分泌生产,而将得到的培养液上清液提供至sds-page后,进行基于抗hsa抗体(sigma,a6684)的蛋白质印迹(westernblotting)。结果示于图1。在f09菌株的情况下,虽然可以确认hsa的带,但是非常薄,并且,在低分子量侧观察到被认为是分解物的带。另一方面,在f09δyscb菌株的情况下,可以确认浓的hsa的带,在低分子量侧几乎未观察到带。这暗示,在f09菌株的情况下,hsa分解,而在f09δyscb菌株的情况下,hsa的分解得到抑制,从而使得hsa的分泌生产量增加。因此,进行基于使用albuminelisaquantitationkit,human(bethyllaboratories公司)的elisa的hsa的定量。结果示于表1。确认了,与f09菌株相比,在f09δyscb菌株情况下hsa分泌生产量增加,因此,显示通过yscb基因缺陷而提高hsa的分泌生产量。

表1

(3)曲妥珠单抗表达菌株的构建和培养评价

将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建曲妥珠单抗表达菌株。

首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、曲妥珠单抗重链基因(seqidno.38)、t.cellulolyticus的cbh1基因下游区域(cbh1终止子;seqidno.39)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、曲妥珠单抗轻链基因(seqidno.40)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的曲妥珠单抗表达用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和21)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.22和23)的pcr而使cbh1基因的下游区域扩增,通过使用了引物(seqidno.24和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.25和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和26)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.27和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.28和29)的pcr而使曲妥珠单抗重链基因扩增,通过使用了引物(seqidno.30和31)的pcr而使曲妥珠单抗轻链基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了曲妥珠单抗表达用dna片段的puc-crea::pcbh2-her_h-pyrf-pcbh2-her_l质粒。将puc-crea::pcbh2-her_h-pyrf-pcbh2-her_l质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使曲妥珠单抗表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与曲妥珠单抗表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入曲妥珠单抗表达序列。

接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的曲妥珠单抗表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被曲妥珠单抗表达序列取代,得到源自f09菌株和f09δyscb菌株的曲妥珠单抗表达菌株。

将源自f09菌株和f09δyscb菌株的曲妥珠单抗表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认曲妥珠单抗的分泌生产,而使用proteusproteinaantibodypurificationmidikit(bio-rad)将得到的培养液上清液提供至基于proteina的抗体纯化。将从同量的培养液上清液中得到的溶出液提供至sds-page。结果示于图2。同时,将进行了电泳的曲妥珠单抗标准品(chugaipharmaceutical)的阶段稀释液作为对照,通过图像分析而计算样品中的曲妥珠单抗浓度。轻链的带的结果示于表2。对于重链的带,确认也与具有表2同样的倾向。确认与f09菌株相比,在f09δyscb菌株的情况下,曲妥珠单抗分泌生产量增加,因此,显示通过yscb基因缺陷而使曲妥珠单抗的分泌生产量提高。

表2

(4)纳武单抗表达菌株的构建和培养评价

将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建纳武单抗表达菌株。

首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、纳武单抗重链基因(seqidno.45)、t.cellulolyticus的cbh1基因下游区域(cbh1终止子;seqidno.39)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、纳武单抗轻链基因(seqidno.46)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的纳武单抗表达用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和21)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.22和23)的pcr而使cbh1基因的下游区域扩增,通过使用了引物(seqidno.24和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.25和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和26)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.27和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.47和48)的pcr而使纳武单抗重链基因扩增,通过使用了引物(seqidno.49和50)的pcr而使纳武单抗轻链基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了纳武单抗表达用dna片段的puc-crea::pcbh2-opd_h-pyrf-pcbh2-opd_l质粒。将puc-crea::pcbh2-opd_h-pyrf-pcbh2-opd_l质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使纳武单抗表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与纳武单抗表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入纳武单抗表达序列。

接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的纳武单抗表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被纳武单抗表达序列取代,得到源自f09菌株和f09δyscb菌株的纳武单抗表达菌株。

将源自f09菌株和f09δyscb菌株的纳武单抗表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

就纳武单抗的分泌生产量而言,通过humaniggelisaquantitationkit(bethyllaboratories公司)而测定为培养液上清液中的人igg量。结果示于表3。确认与f09菌株相比,在f09δyscb菌株的情况下,纳武单抗分泌生产量增加,因此,显示通过yscb基因缺陷而使纳武单抗的分泌生产量提高。

表3

(5)角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)表达菌株的构建和培养评价

将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)表达菌株。

首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、编码添加有his6标签的kgf-1的基因(seqidno.51)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的kgf-1表达用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和12)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.15和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.17和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.52和53)的pcr而使编码添加有his6标签的kgf-1的基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了kgf-1表达用dna片段的puc-crea::pcbh2-kgf1-pyrf质粒。将puc-crea::pcbh2-kgf1-pyrf质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使kgf-1表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与kgf-1表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入kgf-1表达序列。

接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的kgf-1表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被kgf-1表达序列取代,得到源自f09菌株和f09δyscb菌株的kgf-1表达菌株。

将源自f09菌株和f09δyscb菌株的kgf-1表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中、在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认kgf-1的分泌生产,而将得到的培养液上清液提供至基于ni-ntaagarose(qiagen)的his标签纯化,将纯化物提供至sds-page。具体而言,将ni-ntaagarose(qiagen)添加至将ph调整至8.0的培养上清液中并进行1小时混和后,用50mm磷酸缓冲液(ph8.0)清洗,添加sds-page的样品缓冲液并在95℃下加热5分钟,将上清液提供至sds-page。结果示于图3。确认与f09菌株相比,在f09δyscb菌株的情况下,kgf-1分泌生产量增加,因此,显示通过yscb基因缺陷而使kgf-1的分泌生产量提高。

(6)血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)表达菌株的构建和培养评价

将t.cellulolyticusf09菌株和f09δyscb菌株作为亲本菌株,通过以下步骤而构建血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)表达菌株。

首先,根据以下步骤而制成具有按照t.cellulolyticus的crea基因上游区域、t.cellulolyticus的cbh2基因上游区域(cbh2启动子;seqidno.33)、t.cellulolyticus的cbh1分泌信号编码序列(seqidno.34)、编码添加有his6标签的vegf的基因(seqidno.54)、t.cellulolyticus的cbh2基因下游区域(cbh2终止子;seqidno.36)、t.cellulolyticus的pyrf基因标记(seqidno.37)、t.cellulolyticus的crea基因下游区域的顺序连接的碱基序列的vegf表达用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.7和8)的pcr而使crea基因的上游区域扩增,通过使用了引物(seqidno.9和10)的pcr而使cbh2基因的上游区域扩增,通过使用了引物(seqidno.11和12)的pcr而使cbh1分泌信号编码序列扩增,通过使用了引物(seqidno.13和14)的pcr而使cbh2基因的下游区域扩增,通过使用了引物(seqidno.15和16)的pcr而使pyrf基因标记扩增,通过使用了引物(seqidno.17和18)的pcr而使crea基因下游区域扩增。此外,将从eurofins株式会社购入的全合成基因作为模板,通过使用了引物(seqidno.55和56)的pcr而使编码添加有his6标签的vegf的基因扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。将混合2种纯化的pcr产物而得到的混合物作为模板,再次进行pcr并连接,重复进行后,通过in-fusionhdcloningkit(takarabio)而导入试剂盒随附的puc质粒中。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了vegf表达用dna片段的puc-crea::pcbh2-vegf-pyrf质粒。将puc-crea::pcbh2-vegf-pyrf质粒作为模板,通过使用了引物(seqidno.7和18)的pcr而使vegf表达用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。需要说明的是,通过使crea基因的上游和下游序列与vegf表达序列的两端连接,而可以不是在基因组上的随机的位置,而是针对crea基因区域而插入vegf表达序列。

接下来,以与(1)同样的手法培养f09菌株和f09δyscb菌株,进行原生质体化,以与(1)同样的方式用纯化的vegf表达用dna片段进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认crea基因区域被vegf表达序列取代,得到源自f09菌株和f09δyscb菌株的vegf表达菌株。

将源自f09菌株和f09δyscb菌株的vegf表达菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。

为了确认vegf的分泌生产,而将得到的培养液上清液提供至基于ni-ntaagarose(qiagen)的his标签纯化,将纯化物提供至sds-page。具体而言,将ni-ntaagarose(qiagen)添加至将ph调整至8.0的培养上清液中并进行1小时混和后,用50mm磷酸缓冲液(ph8.0)清洗,添加sds-page的样品缓冲液并在95℃下加热5分钟,将上清液提供至sds-page。结果示于图4。确认与f09菌株相比,在f09δyscb菌株的情况下,vegf分泌生产量增加,因此,显示通过yscb基因缺陷而使vegf的分泌生产量提高。

(7)与异源蛋白分解有关的蛋白酶的分析

(7-1)与异源蛋白分解有关的蛋白酶的定位分析

如上所述,(2)中将talaromycescellulolyticusf09菌株(日本特开2016-131533)作为宿主而分泌生产作为异源蛋白的hsa,其结果,观察到hsa的分解(图1)。因此,为了调查与异源蛋白分解有关的蛋白酶的定位,而以如下所述的方式制备f09菌株的培养液上清液。首先,将f09菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o、1g/l尿嘧啶、1g/l尿苷的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器而除去菌体,得到培养液上清液。将培养液上清液与纯化hsa(abcam,ab201876)混合,在30℃下静置3天。接着,将混合液提供至sds-page,进行基于抗hsa抗体(sigma,a6684)的蛋白质印迹(westernblotting)。结果示于图5。分子量比has小的位置处观察到分解物的多个带,由此出发,观察到hsa的分解。该结果暗示,f09菌株的培养液上清液中包含与异源蛋白分解有关的蛋白酶。

(7-2)与异源蛋白分解有关的蛋白酶候补基因的提取

为了提取与异源蛋白分解有关的蛋白酶候补基因,而通过离心分离(5000rpm,5分钟)从(7-1)中得到的培养液中回收f09菌株的菌体,使用rneasyplantminikit(qiagen)而进行totalrna的提取。通过truseqstrandedmrnasampleprepkit(illumina)而从得到的totalrna进行文库制备,通过新一代测序仪miseq使用miseqreagentkitv2500cycle(illumina)而实施表达分析。提取蛋白酶和注释了的基因,按表达量(映射的读取数)顺序排序的结果示于表4。需要说明的是,由于具有最高表达量的cbh1基因为140000读数,第2高表达量的cbh2基因为80000读数,因此,排除800读数以下的。提取表4所示的5个基因作为蛋白酶候补基因。虽然暗示(7-1)中培养液上清液包含蛋白酶,但考虑基于溶菌的蛋白酶的溶出、注释的差异等,因此不考虑注释上的定位,将全部这5个基因作为候补而实施之后的研究。

[表4]

(7-3)提取的蛋白酶候补基因缺陷菌株的构建

将talaromycescellulolyticusf09菌株(日本特开2016-131533)作为亲本菌株,通过以下步骤而破坏蛋白酶候补基因(胃蛋白酶(pepsin)1:seqidno.57,yscb:seqidno.32,cpy:seqidno.58,胃蛋白酶(pepsin)2:seqidno.59,嗜热菌蛋白酶(thermolysin):seqidno.60),构建源自t.cellulolyticusf09的蛋白酶候补基因缺陷菌株。f09菌株是将t.cellulolyticuss6-25菌株(nitebp-01685)作为亲本菌株而得到的在pyrf基因中具有变异(单碱基取代)的菌株。f09菌株通过pyrf基因的变异而表现出尿嘧啶(uracil)缺陷型。

首先,根据以下步骤而制成具有按照t.cellulolyticus的蛋白酶候补基因上游区域、pyrf基因、t.cellulolyticus的蛋白酶候补基因下游区域的顺序连接的碱基序列的蛋白酶候补基因破坏用dna片段。

将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.61和62)的pcr而使胃蛋白酶(pepsin)1基因的上游区域扩增,通过使用了引物(seqidno.62和63)的pcr而使胃蛋白酶(pepsin)1基因的下游区域扩增,通过使用了引物(seqidno.1和65)的pcr而使yscb基因的上游区域扩增,通过使用了引物(seqidno.66和4)的pcr而使yscb基因的下游区域扩增,通过使用了引物(seqidno.67和68)的pcr而使cpy基因的上游区域扩增,通过使用了引物(seqidno.69和70)的pcr而使cpy基因的下游区域扩增,通过使用了引物(seqidno.71和72)的pcr而使胃蛋白酶(pepsin)2基因的上游区域扩增,通过使用了引物(seqidno.73和74)的pcr而使胃蛋白酶(pepsin)2基因的下游区域扩增,通过使用了引物(seqidno.75和76)的pcr而使嗜热菌蛋白酶(thermolysin)基因的上游区域扩增,通过使用了引物(seqidno.77和78)的pcr而使嗜热菌蛋白酶(thermolysin)基因的下游区域扩增。此外,将t.cellulolyticusy-94菌株(fermbp-5826)的基因组dna作为模板,通过使用了引物(seqidno.79和80)的pcr而使pyrf基因(包含启动子和终止子)扩增。使用wizardsvgelandpcrclean-upsystem(promega)而使pcr产物纯化。通过in-fusionhdcloningkit(takarabio)而将纯化的上游区域、下游区域和pyrf基因的pcr产物导入并与试剂盒随附的puc质粒连接。用反应物转化大肠杆菌(e.coli)jm109,在lb琼脂培养基(包含100mg/l氨苄青霉素)中在37℃下培养一晚,从而形成菌落。使用wizardplusminiprepsystem(promega),由得到的转化体得到导入了蛋白酶候补基因破坏用dna片段的质粒。将这些质粒作为模板,通过使用了引物(胃蛋白酶(pepsin)1:seqidno.61和64,yscb:seqidno.1和4,cpy:seqidno.67和70,胃蛋白酶(pepsin)2:seqidno.71和74,嗜热菌蛋白酶(thermolysin):seqidno.75和78)的pcr而使蛋白酶候补基因破坏用dna片段扩增,通过乙醇沉淀而进行浓缩和纯化。

接下来,将f09菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至包含24g/lpotatodextrosebroth的培养基中,在30℃,220rpm的条件下进行2天旋转培养。通过离心分离(5000rpm,5分钟)而回收菌体,添加包含10g/lyatalase(takarabio)、10mmkh2po4、0.8mnacl的水溶液(ph6.0)30ml,在振荡的同时使其在30℃下进行2小时反应,消化细胞壁而进行原生质体化。通过玻璃过滤器而除去残渣后,通过离心分离(2000rpm,10分钟)而回收原生质体,通过包含1.2m山梨糖醇、10mmcacl2的tris-hcl缓冲液(ph7.5)而悬浮成1ml,制备原生质体溶液。在200μl的原生质体溶液中,添加10μg纯化的各蛋白酶候补破坏用dna片段和50μl包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5),在冰上放置30分钟。然后进一步添加1ml的包含400g/lpeg4000、10mmcacl2的tris-hcl缓冲液(ph7.5)并进行混合,在室温下放置15分钟而进行转化。将通过离心分离(2000rpm,10分钟)而回收的原生质体播种至包含1m蔗糖的最小必需培养基(10g/l葡萄糖、10mmnh4cl、10mmkh2po4、7mmkcl、2mmmgso4、0.06mg/lh3bo3、0.26mg/l(nh4)6mo7o24·4h2o、1mg/lfecl3·6h2o、0.4mg/lcuso4·5h2o、0.08mg/lmncl2、2mg/lzncl2、20g/lbactoagar)中,在30℃下培养7天,从而选拔互补了尿嘧啶(uracil)缺陷型的菌株。将出现的菌落接种至最小必需培养基中,在30℃下培养4天后,确认各蛋白酶候补基因区域被pyrf基因取代,得到源自f09菌株的蛋白酶候补基因缺陷菌株。

(7-4)蛋白酶候补基因缺陷菌株的培养液上清液的蛋白酶活性的评价

将各蛋白酶候补基因缺陷菌株接种至包含12g/lpotatodextrosebroth(difco)、20g/lbactoagar(difco)的培养基中,在30℃下进行培养。将用吸管在形成于琼脂培养基上的菌落的末端附近打孔而得到的1个琼脂盘接种至20ml的包含50g/lsolkafloc、24g/lkh2po4、5g/l(nh4)2so4、3g/l尿素、1g/ltween80、1.2g/lmgso4·7h2o、0.01g/lznso4·7h2o、0.01g/lmnso4·5h2o、0.01g/lcuso4·5h2o的液体培养基中,在30℃、220rpm的条件下进行7天培养。使得到的培养液通过0.22μm的过滤器,得到培养液上清液。以与(7-1)同样的方式而将培养液上清液与纯化hsa混合而对蛋白酶活性进行评价。结果示于图6。在胃蛋白酶(pepsin)1、cpy、胃蛋白酶(pepsin)2、嗜热菌蛋白酶(thermolysin)缺陷菌株的情况下与f09菌株同样,在分子量比hsa小的位置观察到分解物的多个带,由此出发,观察到hsa的分解。另一方面,在yscb缺陷菌株中,分解物的带消失。该结果表明,yscb是承担f09菌株中培养上清液中的异源蛋白分解的蛋白酶。

工业实用性

通过本发明而能够高效地制造蛋白质。

<序列表的说明>

seqidno.1~31:引物

seqidno.32:talaromycescellulolyticuss6-25菌株的yscb基因的碱基序列

seqidno.33:talaromycescellulolyticus的cbh2启动子的碱基序列

seqidno.34:talaromycescellulolyticus的编码cbh1信号肽的碱基序列

seqidno.35:人血清白蛋白(hsa)基因的碱基序列

seqidno.36:cbh2终止子的碱基序列

seqidno.37:talaromycescellulolyticus的pyrf基因标记的碱基序列

seqidno.38:曲妥珠单抗重链基因的碱基序列

seqidno.39:cbh1终止子的碱基序列

seqidno.40:曲妥珠单抗轻链基因的碱基序列

seqidno.41:talaromycescellulolyticus的cbh1启动子的碱基序列

seqidno.42:talaromycescellulolyticus的cbh1信号肽的氨基酸序列

seqidno.43:talaromycescellulolyticuss6-25菌株的yscb蛋白质的氨基酸序列

seqidno.44:talaromycescellulolyticuss6-25菌株的crea基因的碱基序列

seqidno.45:纳武单抗重链基因的碱基序列

seqidno.46:纳武单抗轻链基因的碱基序列

seqidno.47~50:引物

seqidno.51:角质细胞生长因子(keratinocytegrowthfactor)1(kgf-1)基因的碱基序列

seqidno.52~53:引物

seqidno.54:血管内皮生长因子(vascularendothelialgrowthfactor)(vegf)基因的碱基序列

seqidno.55~56:引物

seqidno.57:胃蛋白酶(pepsin)1基因的碱基序列

seqidno.58:cpy基因的碱基序列

seqidno.59:胃蛋白酶(pepsin)2基因的碱基序列

seqidno.60:嗜热菌蛋白酶(thermolysin)基因的碱基序列

seqidno.61~80:引物

序列表

<110>ajinomotoco.,inc.

<120>蛋白质的制造方法

<130>e047-18419

<150>jp2017-196538

<151>2017-10-10

<160>80

<170>patentinversion3.5

<210>1

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>1

cggtacccggggatcttggggcacagagacaacagggtca40

<210>2

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>2

agatagggttgagtgagatagcgtgagcacactgagcagg40

<210>3

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>3

aaagtgtaaagcctgcaacacgctacctcttccacagtag40

<210>4

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>4

cgactctagaggatcgagctgattgagcatgctaacgcag40

<210>5

<211>21

<212>dna

<213>人工序列

<220>

<223>引物

<400>5

cactcaaccctatctcggtct21

<210>6

<211>24

<212>dna

<213>人工序列

<220>

<223>引物

<400>6

caggctttacactttatgcttccg24

<210>7

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>7

cggtacccggggatcagcgcagaccaatgccagaggagaa40

<210>8

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>8

gcgcgagttgcgcgatgaaatttat25

<210>9

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>9

tcgcgcaactcgcgctgctatgcagttgatgctactgtgt40

<210>10

<211>30

<212>dna

<213>人工序列

<220>

<223>引物

<400>10

agttgctaaatgatcaagaagcttcacttt30

<210>11

<211>45

<212>dna

<213>人工序列

<220>

<223>引物

<400>11

acagctggtgctcagaagtgggtcaccttcatctctctcctcttc45

<210>12

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>12

ctgagcaccagctgttgccagcaag25

<210>13

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>13

tagatcagctttgagtgcagcaaaa25

<210>14

<211>27

<212>dna

<213>人工序列

<220>

<223>引物

<400>14

gcttgtttgagaatacatgaggttgcc27

<210>15

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>15

tattctcaaacaagcgtcaattcagatcggctgccgcctg40

<210>16

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>16

ataagtgaacgccgagtcagtacta25

<210>17

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>17

tcggcgttcacttatcctctttctcgccctttcttctcaa40

<210>18

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>18

cgactctagaggatcaaccgtcgatcagaaggagcgcaat40

<210>19

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>19

acagctggtgctcagaagtgggtcaccttcatctctctcc40

<210>20

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>20

ctcaaagctgatctacaaaccaagagcagcttgactagcg40

<210>21

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>21

gacgagctggacttcctgagcaccagctgttgccagcaag40

<210>22

<211>30

<212>dna

<213>人工序列

<220>

<223>引物

<400>22

taaattttcacttctttcttcgcctattga30

<210>23

<211>45

<212>dna

<213>人工序列

<220>

<223>引物

<400>23

ccgatctgaattgacccgaaaacggtaaggcgtagttatagaaat45

<210>24

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>24

gtcaattcagatcggctgccgcctg25

<210>25

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>25

tcggcgttcacttattgctatgcagttgatgctactgtgt40

<210>26

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>26

tgtcatctggatgtcctgagcaccagctgttgccagcaag40

<210>27

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>27

tattctcaaacaagccctctttctcgccctttcttctcaa40

<210>28

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>28

gaagtccagctcgtcgagtctggtg25

<210>29

<211>37

<212>dna

<213>人工序列

<220>

<223>引物

<400>29

agaagtgaaaatttatttaccaggagacaaggacaga37

<210>30

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>30

gacatccagatgacacagtcccctt25

<210>31

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>31

ctcaaagctgatctaacactcaccacggttgaaggactta40

<210>32

<211>1589

<212>dna

<213>talaromycescellulolyticus

<400>32

atgaagggcgtcctcagcctttcgctgctgccgttgttgacggttgcgtcaccggtgatg60

ccgcgcaccatccacaacgacgctgctcccattctctcttcgtccaacgccgttgaggtc120

ccagattcatatatcattgtctttaaagaccatgtagattctgcttctgccgcagcccat180

cataactgggtgcaagacattcacagccaacacaccgagctccgaaagcggtctcaattc240

ccattcgctgacaatgcctttgccggtctcaaacacacttttgacattgccggcagcttc300

cttggttactcaggacacttcgaagagaatgtcattgaggccattcgccgacaccccgat360

gtgagttatccgcacgtgccctactcctaaggcaatgactaatacgcatctccacctata420

ggttgattacatcgagaaggattctcttgtccacaccatggaagatcccgcccttgagaa480

gaacgccccatggggtttggctcgtatttcgcaccgtgagagcttgagcttcggaagctt540

caacaagtacttgtacgctgccgacggcggtgaaggtgttgacgtttatgtcattgacac600

tggtaccaacatcgaccacgtcgacttcgagggtcgtgcttcctggggcaagaccatccc660

cactgacgatgaggatgttgatggcaatggtcacggtactcactgctccggaactattgc720

gggcaagaagtacggtgttgccaagaaggccaatgtctacgctgtcaaggtcttgaagtc780

taacggttctggaaccatgtccgatgtcgttcagggtgtcgaatgggctgctactcagca840

catcaagaaggtcaaggacgccaaggccggaaaagccaagggcttcaagggtagcgctgc900

gaacatgagtctcggtggtggcaagtccgtcactcttgacaaggctgtcaatgctgctgt960

tgatgctggtatccacttcgctgtcgctgctggcaacgacaacgccgactcctgcaacta1020

ctcccctgccgccgctgagaaggccgtcaccgtcggagcctcgaccttggccgatgagcg1080

tgcttacttctccaactacggcaagtgcaacgacatctttgctcctggtctgaacattct1140

ctctacctggatcggcagcaagtacgccgtcaacaccatctccggtacctccatggcttc1200

tcctcacattgctggtcttttggcctacttcctctctctccagcctgccagtgactccgc1260

cttcgctgttgccgagattactcccaagaagttgaaggagaacctcattgctattggtac1320

ccagggcgctcttactgatgttccctctgacaccactaacgtaagttgactctgttagtc1380

tttcaatgcattatcaactaacaactgtgtcatagattctcgcctggaacggtggtggct1440

cagccaactacaccgacatcattgcccaaggtggttacaagaccaagacactcagcaacg1500

aagttgacgaattgatcaacaagttggaggtcgtgaacgaggaactcggtgccatctaca1560

gccacatcaaggatgccattgccgcataa1589

<210>33

<211>1100

<212>dna

<213>talaromycescellulolyticus

<400>33

tgctatgcagttgatgctactgtgttctaaaataattgatagggttagggtcgggtataa60

ggcgatgcaatgtatcaattatcacgagaaataatgcagaaaaacacaattccccgtatc120

tgttgattcttaaacaatctgatcaccaatttgtagaaagaaacgattataaggtgccat180

ggtaatgctggagtttacacaggatactacttgttctgttcattacaatgaaccgtaatt240

gcattctgttttgaccactcaacaaatcctacacaaaagtaagtggacttcagtgctcgc300

tctacgcaagtaaatacttggcatatatggcctcgtatattcttacaatgaggtaaattc360

cgatagattactgcccaactagtcaatcttaaatccttaagagatacagggggaggcgga420

agtacctgaaaccacgtaataagacgttcagggtcatgtgaatgtatgtagtatccatgt480

ccaatacaattgataatagtatccagtattatatctcattcaggtaagcgccacgcgatt540

cttcagatctacttaactgccgactcgccaaacgaaacaacgtttattcgtgaccccaga600

aaatcaccgcggagttgcggaggaccagtttgtacaatgcaccgaaccaagcgttggtca660

tttttctggaaatgggccaaacgttagaagtgattggtcagagctacatctgaaggtgaa720

gcaatttccggtatgcatacatgacagcaagcttacctaccaagaccaagttattcccca780

gcatttgccccatacttggctttaatattgtgggatagcaaacaatatccacaacactga840

tgataactaaactacaaatctgacgttacttcagactactcacgtgtcaaaagcagttag900

cgaggatcaagtcttttagtctggtcattaacaaacgcaatttcgcaacccgataatccg960

cgatgataatatagcgactccaaggtcgtatttatattcaatcaattccccccaatttgg1020

aatggatttttggaatcatcgcatgccaggacaatcagtgaaacagtgacaaagtgaagc1080

ttcttgatcatttagcaact1100

<210>34

<211>78

<212>dna

<213>talaromycescellulolyticus

<400>34

atgtctgccttgaactctttcaatatgtacaagagcgccctcatcttgggctccttgctg60

gcaacagctggtgctcag78

<210>35

<211>1827

<212>dna

<213>智人

<400>35

aagtgggtcaccttcatctctctcctcttcttgttctccagcgcctacagccgtggtgtt60

ttccgtcgtgacgcacacaagtccgaagtggcccatcgcttcaaagacctcggtgaggaa120

aacttcaaggctctcgtcttgattgccttcgctcagtacttgcaacagtgccctttcgag180

gaccacgtgaagctggtcaacgaagttaccgaattcgccaaaacctgcgttgctgacgag240

tctgccgaaaactgcgataagtctctgcataccttgttcggcgacaagctctgtactgtc300

gctaccctccgtgagacctacggagaaatggccgattgttgcgccaagcaggagcctgag360

cgtaatgagtgctttctgcagcacaaggacgacaaccccaatttgcctcggcttgttcgt420

cctgaggttgacgtcatgtgtaccgccttccacgataacgaggaaaccttcctcaagaag480

tacctctacgagatcgcaagacgccatccctacttctacgctcctgaattgctgttcttt540

gccaagcgttacaaggcagcattcactgagtgttgtcaagccgctgacaaggccgcctgc600

ttgctccccaagttggatgaactccgcgatgagggtaaggcctctagcgccaaacagcgc660

cttaagtgcgcctctttgcagaagttcggtgagagagccttcaaagcctgggctgttgct720

cgtctatcccaacgtttccctaaagccgagtttgctgaagtttccaaactcgtcactgac780

ctgacaaaggtccatactgagtgctgccacggtgacttgttggagtgtgctgatgatcgt840

gccgatttggcaaagtacatctgcgagaaccaggacagcatctcctccaagttgaaggag900

tgctgcgaaaagcccttgctcgagaagtcccactgcattgcggaggtcgagaacgacgaa960

atgcctgccgacttgccttctttggctgctgacttcgtcgaaagcaaggatgtctgcaag1020

aactacgctgaagccaaagacgtgttcttgggcatgttcttgtacgagtatgctcgtcgc1080

caccctgactactccgtggttcttctcctccgtctcgccaagacatacgagacgactttg1140

gagaagtgctgtgccgctgccgaccctcacgagtgctatgccaaggtcttcgacgaattc1200

aagcccttagtcgaagaacctcagaacttaatcaagcagaattgtgagctattcgagcaa1260

ctcggtgagtacaagttccagaacgcgttactggtccggtacaccaagaaggttccccaa1320

gtctccactcctaccttggttgaggtctctcgtaacttgggtaaggttggaagcaagtgc1380

tgtaagcaccccgaagccaagcgtatgccttgcgctgaagactacctgtcggtcgtcttg1440

aaccaattgtgcgtcttgcacgagaagactcccgttagcgatcgtgttaccaagtgttgt1500

accgaaagcttggttaaccgtcgtccctgcttctccgctttggaagtcgatgagacttac1560

gttcctaaggagttcaacgccgaaaccttcacctttcacgctgatatctgcactctgtca1620

gagaaagagcgtcagatcaagaagcaaaccgcactcgttgagcttgtcaagcacaaaccc1680

aaagccaccaaggaacagctcaaagccgtcatggacgatttcgctgccttcgtcgagaaa1740

tgctgcaaagccgacgacaaggagacgtgcttcgcggaagagggcaagaagttggtcgcc1800

gctagtcaagctgctcttggtttgtag1827

<210>36

<211>497

<212>dna

<213>talaromycescellulolyticus

<400>36

atcagctttgagtgcagcaaaaatgcttccgactgtcttcttatattgatatcatatttt60

tcaattcactttgtctcaagtttcaatatatcgagaaaatagtatcaaagatgaactgta120

ataattccgatatacctatacaggtttatagtaaattactctatttcataatgcgtccat180

ccgagaagtctggcggccttatcagtagtccaaaacgcctggtttttagacatgtcacct240

ctaatctccgcttgaggaaaatgcgtccgagcaagttctttcgacggggtgtcttgggtc300

gtagttggagatatgatatttattacttcgaatcctttgatattctcactcttttcaacc360

gccaaaaggcaagctcttgccactgcgcgaggattaacccatccccagagttgtcgaacc420

ccagattcataccatttatcgtggtgtctttttctaacatctctcaatggggcaacctca480

tgtattctcaaacaagc497

<210>37

<211>2858

<212>dna

<213>talaromycescellulolyticus

<400>37

gtcaattcagatcggctgccgcctgcgccccaggtgacgtcgatgaaagctgggcctagg60

tcgtgcatgcggtccatacggtcgtataagttctggacaccttgggcggtctttgggggg120

aagtattcgaaggaaattccaggtcggccggtggccgcctgttcttggagcttttgcccg180

acatgcatgttgataggtcggtcaattgtctgctttttcaatatcttctcggtatgatgt240

agcttgcagaacccaagttatgtagttcaattgcaaaatcaagtctgatcaagaccgaaa300

ctcaatcccggagcactgaggttcgcactaattgatcaagggtacaagaatgaggggcac360

aatgaaagcagtcttgaaaatgacaggcagagaaattgaaagaaaggagaagagaggacc420

tccgggacaggagaaatgaaagcaacaaaaccccgaacaagctggagagaagttaaaggg480

agcagcttggtcaccggcaatggatgctcatcataaaaaaggaccctaaacccgttatcg540

gagtccggagaaatgacgctaattcggatttggaagtccccgccaatcgtgggaaattct600

cgaagcagacaatttgctcgtgacaatcagccagcaatgagagggagactgaaaaatatg660

tatttacactcaaagaatccgatactgctattaggatcagtgtttttcttataagcaaat720

gagcgttggacgtggaaaatgaggaatcctcagtccctatactcggtcagcgacggaggg780

gtgcgtgatcggccaatcacagcctattattttatcaacatctgattggctacttccgat840

aagagcgaaatatgcccctccttgcaatttttaccatcaacgctaacagcaacactcaac900

aaaccattcaatcttgatactcgctcccattagtcaccacgcaggacaacacaacacgac960

atcgcatctcagctttgaccattcccgccgcaagcgattcgctgtcacaaacgccagata1020

ccccaacatggctgcccctccctccgccgatcaggactacaagaccaatctgttgtcttt1080

gctgatagccaacgatgcgctcgcatttggcacgttcacattgaaatctggtcgccagtc1140

gccgtattttttgacctcgagtcgtctttatactgcgcctctgctgcgccaggtgtcggc1200

cgcgttcgcgaataccatctcgtccccgccttttgtgaatatagctgcagatggcagcat1260

taccccgaactttgacattgtttttgggtatgttaccctattattcgtgcgcctgatatg1320

cgtgtactgatttacttcaaatagccccgcctacaaaggaatccccgaatgcgtcggtgt1380

tgtcaacgagctcgctacccgggatgcgctcgccggtaccaagacatgggacaacatcag1440

ctactccttcaaccgcaaagaagccaaagaccacggcgaagggggtaacatcgtcggtgc1500

gcctctcaagggaaaacgtgttttgatcgttgacgacgtcatcaccgctggtaccgcgct1560

gcgtgaagctgtcggcattattcaaaaggaaggcggaaccgttgccggtgttgtgttgct1620

gttcgatcgtcaggaacgggtcagtgatacggagcagaagagtgccattggagccgcgga1680

gagggaccttggaggcgatattcctatccgtgcggtgttggtattccaggatttgattga1740

taagcttggagataagattggtcaggaggaggtgcgcaggttggaagagtaccggaacac1800

gtacaaggctcaataaatggctgctgtgggatgaaatgggtatattaacgatttatgcta1860

aaaatggctgggtggaatactgcgaaataaatataaatcagcttgaaggatgtattttta1920

gcgcaaagtgatagaattttctatgtaaatagtttgtacaataggattactactttatat1980

gcgttatgcgtatacatttctaaagtgtaaccagtttagctgggagtacaattttaacac2040

tcttccatcaatcaggttccagatcagttttctatctacaatcatgactccccagtctct2100

actcctttcaagaatgacgcgttatgttccaagctcccctggttgatggcggtaacccga2160

tatattctagccaggtcaggtcctagtgtgaggactaacacaggcacgtccagtatcgta2220

gcaaatagaatatcagcatatataagtcccctttcccggaccttgctcgagtcagtgact2280

agcaggtacgtacgtacccatcagactatctactatctactatgtacggagtatatagtc2340

ggtacttgacgcaaggcgagtctgatagagggacaatatgcagttctgtagccaatcaat2400

cgcggatggcagaccctcgatcgtcattgtggatctttagcttccttatgggcggggcgg2460

tggttatttcagagccatttagccaatcatacatcgtagtccgaaagtctaggattatat2520

aggctagaccaatctactgtcaaccggtaaagcgggtctctagtctttatcccgacctcc2580

tctctttctctttctccgattcgaatgtgacacatacatctgatcaattgataagaatac2640

ggattgccgtgtacgtgggctgacagagctgagataaaatatcctggatgtgatatgtgg2700

cgcatccagtaccgacactgtgacaggatccgtgtactacaattcattcatcgatcgttg2760

gctaggcaaaaagtaggcaaggtttgcagatcgatatcccggtacctggctaaaatcgag2820

acccatctacatatagtactgactcggcgttcacttat2858

<210>38

<211>1356

<212>dna

<213>智人

<400>38

gaagtccagctcgtcgagtctggtggtggcttggtccaacccggtggatccttacgtctc60

tcttgtgcagctagcggtttcaacatcaaggacacctacatccattgggttcgtcaagct120

cctggcaaaggtttggaatgggttgcgcgtatctaccctacgaacggttacacccgttat180

gccgacagcgttaagggccgtttcaccatttctgccgacacttccaagaacaccgcctac240

ttgcagatgaactccttgagagccgaggatactgccgtctactactgcagccgttgggga300

ggtgatgggttctacgccatggactactggggtcaaggcacccttgttaccgttagctcc360

gccagcacaaagggtccctccgtcttccctttggctccctcctccaagtctacttccggt420

ggtaccgctgcactgggttgcttggtcaaggactacttccctgagcccgtcactgtcagc480

tggaattctggcgcattgacttctggtgtccacacttttcccgctgttctccaatcttcc540

ggcttgtacagcctaagcagcgttgtcactgtgccctcttcctccttgggcactcagacc600

tacatctgcaacgtcaaccacaagccctccaacacgaaggttgacaagaaggtggaacct660

cccaagtcctgcgataagacccacacctgtcctccctgtcctgctcctgaactgttgggt720

ggaccctcagtgttcttgttccctcccaagcccaaggacactctcatgatcagccgtact780

cctgaggttacatgcgtcgtcgtcgatgtctcccatgaggatcctgaggtcaagttcaac840

tggtacgtcgacggtgtcgaggtccacaatgccaagaccaagcctcgtgaagaacagtac900

aactccacctaccgcgttgtttcagtcttgaccgtgttgcaccaggattggctgaacggc960

aaggagtacaagtgcaaggtctccaacaaggccctgcctgctcccatcgagaaaaccatc1020

agtaaggccaaaggtcaacctcgcgaaccccaggtttacaccctccctccttctcgggac1080

gaactcaccaagaaccaggtctcgttgacttgccttgttaagggattctaccctagcgat1140

attgccgttgagtgggagtccaatggtcagcccgagaacaactacaagactacccctcct1200

gttctcgactctgacggatctttcttcctctacagcaagttgaccgtcgacaaaagccgt1260

tggcagcaaggcaacgttttctcctgctctgtcatgcacgaggctctccacaaccactac1320

acacagaagtctctgtccttgtctcctggtaaataa1356

<210>39

<211>1680

<212>dna

<213>talaromycescellulolyticus

<400>39

attttcacttctttcttcgcctattgattgggctatgacaaaattaggagagataggttg60

gacgttgtcaagtcaaaatgtaccgaacacgatgcgttgatatgctgcacatgtgcctag120

tatccattcgttcctatttatattaaattgaaattttcttatccaattactgagctaaaa180

catacttcagcactgtaagcgccagcctaagttatgctatgttagactgtccggattcgg240

ctggcactggcttttgtgatccccagtatcatgtaaaggtatccgcctgtttgttagggg300

gtcttaaatgttgtataaagtttcttgctaggctgtttatgcttgatagagaatatatat360

atatatctagctgctattaatatccttgtttcaatgtcttagacttccaaggttacctac420

ccgcgtgcgtggactaatacaaacaatctcactcaagacaatcttatacaaactcggatt480

ctggtcaatccgttccttggttatattgctaaaaaaactaggtagcccaaaattccatct540

caagccgtataagaactttcaaattcaccatggtactctcacgggcgaagcatctccgtc600

ttccatctgccaaaatccattaccaaaatcggaagtacccgaatgtagcaaatgaacaat660

aactttcgcaccatctagcggatcctttgtgccacgatagttgttgaacgcagttttgca720

atacccaggactaactgcttggatgataacactctcattcgccgggtctttcccatattc780

gaccgtgagcatgttaagggccgtctttgaggcgcagtacgcgatagtaacagttggagg840

cagcttgccagatgatgataggcccaaagaaccccgtgtggatgatacgtttattatgtg900

gcctcgaggcgactgacgcaaaagtggtaggaatagatctatggtcattgcgaccgatgt960

gacattcacatcaaaagttcggttgtaagtagaccgcatttcggaaaatgaagtctgggt1020

gaaggcaacggcagcattgtttatcagaactagacatctgttagagaatttctaaagccc1080

gctcactcgagaatgaaataggcttaccatccagtctaccatatgttgtctcgaccgcct1140

tagcaaaagcaatgaggctatcgtcgcgagtcacatcaacctccataacgtcgatcttgg1200

attgaacagcgagctctctcaaccgcttaagtgcctgatttccgtcttccttattccggc1260

atcctaagatgaagtgatcggatggactatgcagacttaaagcctggagggtaccaaacc1320

cgatgcctgacaattattagtgatcatatagaatgagtatcatggccatcgcaaatctac1380

ctctgtttgctccagttataagaattagccttgatgacatcttgtgagagaagtaaaaga1440

taatagcagatgaatttcgatcgtatactggttgtattggcaatcttgacgagaatggtt1500

tcattgtcagaccatcagttccctttatatacctgccattctctcctttataaataatta1560

ttcggttttaacacggagatactcggatttcatcacacaaattgcatttcttccgatagt1620

tgttgaagatcggaagtccttcgaatgatcatttctataactacgccttaccgttttcgg1680

<210>40

<211>645

<212>dna

<213>智人

<400>40

gacatccagatgacacagtccccttctagcctttctgcctctgttggagatcgtgtcacc60

atcacttgtcgtgcttctcaagacgtcaacacagccgttgcctggtatcagcagaaaccc120

ggcaaagctcccaagttgctgatctacagcgctagcttcctgtacagcggtgtcccttct180

cgcttctcaggttcccgttctggtaccgacttcaccttgaccatttccagcttgcaaccc240

gaggatttcgccacgtactactgccagcaacactacaccactcctcccacctttggccaa300

ggtaccaaggtcgagatcaagcggactgttgccgcaccttccgtcttcatcttccctccc360

tcggatgagcagctcaagtctggaactgcgtctgtcgtttgcttgctcaacaacttctac420

cctcgtgaagccaaggtccagtggaaggtcgacaacgctttgcagtccggcaatagccaa480

gagtccgttaccgaacaggacagcaaggactccacttactccttgagttccactctcacc540

ttgtccaaggccgattacgagaagcacaaggtctacgcttgcgaagtgacccatcaaggt600

ctctctagccctgttactaagtccttcaaccgtggtgagtgttag645

<210>41

<211>1354

<212>dna

<213>talaromycescellulolyticus

<400>41

ctcgtgaaagctgccctcacaatgatcgtcaagatgacgtagtttgactgggtcgttcct60

ggataagggttagggtaaatagggctcaaagtaccacgtgagtgtggaaagataagccct120

aaccctaaggtcgtgtcggacaaaaattatcacttgaccaaaattggagatccccttaat180

ggagctttttggtaatggtttgtatagggttatgtgacgtccgtatcacatgatttttat240

cccaacaggtcgatccccctcttatagttaatggacaacatataagtacgtagcatctta300

gatagttcgtcagcgtcaactgaccaaagtccccgtgtttcattttaatttgtcagactg360

caagagtctcgaaacataaaaagatcgaaagttttgccttattaggctatgagcatgaat420

gtcggaacaatgccgttgaggctattcccaatttcggaaatatgtatcttcattgctgtc480

gacttgacgacagtcgataaaaggctcatccggatagataagccagatcactcattatgc540

caatttctccggtgtctgaaaacgtatactacatacgtaactgatcttcgtggttgaaag600

agtgtttcttctcattctcatctgccgatgccgagccaattggaacaaaccccgcatatg660

gtcctgaatatcaatcgcggagatgcggagagtgagggagcaacacaattttaaattagt720

cagttttctcatgttctccgcaatcttgcaggcttgggtctggtaggtttatctctctct780

tttcacaacaaggttgggccattgtcagcttagcaagcgcgcagcaaagggtgtcggtca840

atgttcatgtcctccgcggtcactacaaaacagcacgtggggaatgttgctttccctgtt900

gatgttcatgtgttgtcattcccggcaaatcgactccaattaatatggtaggctcctgca960

taatgcaagtccttgagatgcagcttccggcagatggacgtatagatcagggactttgag1020

gggctaaaacacttacccgagctaaaacataccataatttcgtttaatgactttcgtctg1080

gatggcagaggctgaaggtcgattatgagtgaaattggtatgaagccacatacgccgata1140

ctgtaacgctgtgccttcatccgccttctatcgcgccccgacattccgcggtaccgcgat1200

tatgaagaaaaacactcgtaatgatgaggagatagttcttagctcttattatttttgtct1260

agctatggaatgcaagtttagcactatataatggtggtgtttcccttgaagaattaggca1320

ctatcaaccgcaacagtcagaagcaatcgacaca1354

<210>42

<211>26

<212>prt

<213>talaromycescellulolyticus

<400>42

metseralaleuasnserpheasnmettyrlysseralaleuileleu

151015

glyserleuleualathralaglyalagln

2025

<210>43

<211>490

<212>prt

<213>talaromycescellulolyticus

<400>43

metlysglyvalleuserleuserleuleuproleuleuthrvalala

151015

serprovalmetproargthrilehisasnaspalaalaproileleu

202530

serserserasnalavalgluvalproaspsertyrileilevalphe

354045

lysasphisvalaspseralaseralaalaalahishisasntrpval

505560

glnaspilehisserglnhisthrgluleuarglysargserglnphe

65707580

prophealaaspasnalaphealaglyleulyshisthrpheaspile

859095

alaglyserpheleuglytyrserglyhispheglugluasnvalile

100105110

glualaileargarghisproaspvalasptyrileglulysaspser

115120125

leuvalhisthrmetgluaspproalaleuglulysasnalaprotrp

130135140

glyleualaargileserhisarggluserleuserpheglyserphe

145150155160

asnlystyrleutyralaalaaspglyglygluglyvalaspvaltyr

165170175

valileaspthrglythrasnileasphisvalaspphegluglyarg

180185190

alasertrpglylysthrileprothraspaspgluaspvalaspgly

195200205

asnglyhisglythrhiscysserglythrilealaglylyslystyr

210215220

glyvalalalyslysalaasnvaltyralavallysvalleulysser

225230235240

asnglyserglythrmetseraspvalvalglnglyvalglutrpala

245250255

alathrglnhisilelyslysvallysaspalalysalaglylysala

260265270

lysglyphelysglyseralaalaasnmetserleuglyglyglylys

275280285

servalthrleuasplysalavalasnalaalavalaspalaglyile

290295300

hisphealavalalaalaglyasnaspasnalaaspsercysasntyr

305310315320

serproalaalaalaglulysalavalthrvalglyalaserthrleu

325330335

alaaspgluargalatyrpheserasntyrglylyscysasnaspile

340345350

phealaproglyleuasnileleuserthrtrpileglyserlystyr

355360365

alavalasnthrileserglythrsermetalaserprohisileala

370375380

glyleuleualatyrpheleuserleuglnproalaseraspserala

385390395400

phealavalalagluilethrprolyslysleulysgluasnleuile

405410415

alaileglythrglnglyalaleuthraspvalproseraspthrthr

420425430

asnileleualatrpasnglyglyglyseralaasntyrthraspile

435440445

ilealaglnglyglytyrlysthrlysthrleuserasngluvalasp

450455460

gluleuileasnlysleugluvalvalasnglugluleuglyalaile

465470475480

tyrserhisilelysaspalailealaala

485490

<210>44

<211>4509

<212>dna

<213>talaromycescellulolyticus

<400>44

atgtcgagaagaatacggaaccctgattccgcaggctcgagtcaaaccctaagtaattca60

ccggtaccaatagccgccgaatccggcacggaacctgtgtacctaggtccgtatcgaata120

gcgaagttttccgtctattcttcgaattttgtatacatgcttaccttggctcaaaggtac180

tcacaaagtccgaagaataaattatagaaccgatgtgaaacggggacagtttggcaaccc240

cttgtactatgtacattgtatggatctcgtctcgactctcgagacgagggtttcgtacca300

accaaagactcaaaacttggggtaactaagcgatcggctgcgtagtactccatactccat360

aaataccccggtgaattcgcctcttgcccatggaatgagcgagaatttacccttggagtc420

atcgcggtaaatgactcacatatcatgtctgccttcactctcctcaacctttgaaattcc480

ggttaatgttaaggcgaggtgtcctctacggaatggctttgtagatttgagataagacta540

cgccgtaacttaagggatccacatactccatattgatagtctcaggaccgagatagtctg600

gagtaaccccgtacccaatcaacgtcctcagactcgccacctggttacaatatttcggtg660

cttgtgccgatatacctccgttgcgtgagccttgatagccaacaagaaatgattcaaaat720

taagatttgagaaaatccggagtacgcagtgcctgcagtgtaaaaaataatgtatttacc780

taatgccaatatgtcgatgccaaagtactactagcaaagacactagatatgcagcaaact840

cgatgtttaggtacatgtaaccatatcctggggtcaggtacgaacgccatcaattaatct900

cgtaaactagctgtcacacgacagtatcatttgatagttccaatgttccatgctccccct960

caaatgtcactggatgatacgaatttggctgtgacttgaacagatagacggaaaacagtc1020

cgatcattatccggagtacgcatgtacgagatagtctggggatcctcggctgccccgatt1080

ggggttagtgcgggtttccttatcttgatacgccgtctggaggcgcaggtgattgttacg1140

gtgtgttccgtgatagataagttagacatccgataataacctatcttctagatagacggc1200

aggtacgtatgtagatagatagatgacacagtcataagacagttttatttaccatacata1260

gtatagtcatttgacaaacacttgatgactatgagcagtaagtccagacaagagcataga1320

ctagaaatgatgtgatcatcaataggtacggagtcgtaccacccccggattatcttggct1380

ggcttagtcacgcccaaacagacggtgacggatgagacacaagcaaagagcgacattccg1440

aagaattctcgtgacggaaacgagaatgccgccggcgctgatagggggaaattttatctt1500

ttccctttctgacattcagtgtttacaatacaatacggaattacggaaccccggttttcg1560

caaccggtggaattacctaatgggtgacctgaatttattagataacgatgaacaatttgt1620

tggatcttccgtagatcgatttggacttgataggtgcttccaaggttgttgctgctcaca1680

tggtcgcttgcgttatctgcctacagaatgaggaagatgtattccgcacgtactccggtc1740

gcgacagatatgcgacgattgcaatatgtactacatagttagtacatacaactctagact1800

agactctatattatgtagagtgtaagagaaaaagaaagaagataacggcagggtctattt1860

gattgcgctataatatgcgccgctgtatggttccccagatctgcgtgagatatcacctca1920

tcctatcatcattccaggtcaaagtctcgtcatcatgaattggtattattacccagtacg1980

taaaccacgtatcgaggcgtatcggtgtattaaagatagagctactgcattggctctagt2040

cctatctttgccccggaatccggcccgtggatgacgatatgatgctgtttgtccttcagc2100

taaacacggacgatctcttacagggtgcggttaattattaaggatataattctaatcaac2160

gactctggctgtgctatattaacaatgtcttctaagtggtcatgatgtgtacgtacttcg2220

tacacatgctacatgcaatcgagtacgtaactccagatctgcgccgtacccgcgataccc2280

gggccatcatgcaaatgtaaccgcttggaacacgcactgcagtgcataaaagccacagcc2340

tcgcttcccaatccggtttagacgcgttttgtcttgctgttttgggagcagccagacccc2400

acattccactaacccactctttttcagcgcttattctcgtaagattcgtacgaaaaatac2460

atctgcccacactatccaccagctcggccactcttcggtgagaacgctgccatgagaaaa2520

aaatctgcgactctgcaacagagtgaggcacggctgaaccgagctgattgtcaccctttg2580

cccaatgcccagacagcccagacagcccagacagcccagacagcccagacagcccagaca2640

gcccagacagccagtgcttggttaatttttactaagggtaaaaacctaaaaaaaagaaac2700

gaaaaaaaaaaaaaaaaacttttcttttttgccccccaatcacttggccgacagtcaaag2760

ggttcccccacacggtactccgtacttgctacgtacactaactaaagaaaaaatctcctg2820

attgagtctgtgtctgtctgtcgctgctaaactcggataaccccccgttcccgatcaccc2880

gtcgaaaagagcagcagccatttaacatttttcccctccattcctccttcttggaacttt2940

ccctccctccctcatccttacatctccctgcgtgcgcgcctgcctgcctacttacactgc3000

cactccccagattttctttctcttgtttcttctccagactttctttcctcctccacctcg3060

cctcaccacaccaccaccaccactcaccacgccaacaacaccgcactaccactactgctt3120

caaagatcgatcaggccattatcaaggaggatcgacgtcttattccatcgaccaccctgt3180

tgatcacctcggctggagcgctcgactccctggcttccttccccagcttatttaaacccg3240

tcacccgccaggtctcttcacatgtcaccgtcatcttcgtcagtgggtttttccaatctg3300

ctgaacccacagtcagactctgtcgagcctacggataacacatcttcacctgctaccacc3360

actaccaccggcacagactccaactcagacaaggaaatggcgtcctctgtcagtctgctc3420

ccaccactcatgaagggtgcccgccccgccgcggaggaagtgcgacaggacctccctcgt3480

ccatacaagtgtcctctttgcgatcgtgctttccatcgtctagagcaccaaactcgtcac3540

attcgtactcacaccggcgagaaaccccatgcctgccagtttccaggctgcacgaaacgg3600

ttcagtcgttcagatgaattgactcgtcactcgcgcattcacaacaaccccaactcgaga3660

agaagtaacaaagctcagcatattgctgcggctgcggcggccggtcaggattcgggtatg3720

cttaacgctgctgcctcgatgatgcctcctccaagcaaacccattactcgctcggctcca3780

gtgtctcaggtcggatctccggatgtgtctcctccgcactcttacaccaactacacctcg3840

catttgcgggcgggtctgggtccttattcacgcaacagcgaccgtgcttcatctggtatg3900

gatattaatttgctcgcgactgctgcttcacaagtcgagcgcgatcactacggaggctcg3960

tctcgtcattaccctttcagctctcgatactcgggtactcctggacgtctaccgtcgctt4020

tccgcctatgccatttctcagagcatgagccggtcgcattctcacgaggatgaggacaac4080

tacggacatcaccgggttaagcgctctcgtcctaactcaccaaactcgactgcgccatcc4140

tcgcctacattctctcacgattcattgtcgcctacccccgatcacactcctcttgcaacc4200

ccagcacactcgcctcgtttgcgtccttatggagccgcagatttgcaattaccttccatc4260

cgtcatttgtcgttacaccacactcccgcactcgcaccaatggagcctcaagccgaggga4320

cctaatgtttacaaccccggtcagcaccacggtggacccagcatcacggacatcatgagc4380

aggcccgacggcacccagcgtaagcttcctgttccgcaagtacccaaaatcccggtgcag4440

gacatgttggcaccgaacggatattcctccaacactccgtccgtcaacggttccgtgatg4500

gagttataa4509

<210>45

<211>1323

<212>dna

<213>智人

<400>45

caggttcagctcgttgaaagcggtggtggtgtcgttcaacccggtcgttccttgcgtctg60

gactgcaaggctagcggtatcaccttctctaactctggtatgcattgggtccgtcaagcc120

cctggtaagggccttgagtgggttgccgtcatttggtacgatggctccaaacgctactat180

gccgatagcgttaaaggtcgtttcactatcagccgtgacaactctaagaacaccctcttc240

ctccagatgaactctttgcgtgccgaggatactgcagtctactactgcgccactaacgac300

gactactggggtcagggtacactcgttacggtcagctctgccagtacgaagggtccctcc360

gtctttcccttggctccctgttcccgctcaacctccgagagcactgcggctttgggttgc420

ttggtgaaggactactttcccgaacctgtgaccgtttcctggaattccggtgctttgacc480

tctggtgtccacactttccctgctgttttgcagtctagcggactctacagcttgtccagc540

gtcgtcaccgttccttcctctagcttggggaccaagacctacacctgcaacgtcgaccac600

aagccttccaacacaaaggttgacaaacgtgtcgagtccaagtacggacctccttgtccc660

ccttgtcccgcacctgagttcttgggaggtccttctgtgttcctcttccctcctaagccc720

aaagacaccttgatgatctctcggactcctgaggttacttgcgtcgtcgttgacgtctct780

caggaagatcctgaggtccagttcaattggtacgttgatggcgtcgaggttcacaacgcc840

aagactaaaccccgtgaagagcagttcaactccacctaccgtgtcgtctcagtcctcacc900

gtcttgcaccaagactggttgaacggcaaggagtacaagtgcaaggtcagcaacaagggc960

ttgccttcttccatcgaaaagaccatcagcaaggctaagggccaacctcgtgagccccag1020

gtgtacactttacctccctctcaagaagagatgaccaagaaccaggtttccttgacctgc1080

ctcgtcaagggattctacccctctgatattgccgtcgaatgggagtccaatggccaaccc1140

gagaacaactacaagacaactccccctgttctggactccgatggtagcttcttcctctac1200

tcgagactgaccgtcgacaagtcccgttggcaggaaggcaacgttttctcctgctccgtc1260

atgcacgaagccctgcataaccactacacccaaaagagcctatccttgtctcttggtaag1320

taa1323

<210>46

<211>645

<212>dna

<213>智人

<400>46

gaaatcgtcctcactcagtcccctgcaacccttagcttgtctcccggagaacgtgccact60

ctcagctgtcgtgccagtcaatccgtttccagctacttggcttggtaccagcagaaacct120

ggtcaagcacctcgtttgctcatctacgatgcctccaatcgtgctacaggtattcccgct180

cgtttctctggctcaggtagcggtaccgacttcaccttgaccatcagctccttagagcct240

gaggactttgccgtctactactgccaacagtcctctaactggcctcgcactttcggtcaa300

ggcacgaaggtcgagatcaagcggactgttgctgctccttccgtcttcatcttccccccc360

tctgatgagcagctgaagtccggaactgcgtctgtcgtctgtctgctcaacaacttctat420

ccccgtgaagccaaggttcagtggaaggtcgacaacgccttgcagtctggtaactctcag480

gagagcgttaccgagcaagactccaaggatagcacctactctttgtcctccactttgacc540

ctcagcaaagccgactacgagaagcacaaggtctacgcttgcgaagttacccaccaaggc600

ttgtcttcccctgtgaccaagtcgttcaaccgtggtgaatgctag645

<210>47

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>47

caggttcagctcgttgaaagcggtg25

<210>48

<211>37

<212>dna

<213>人工序列

<220>

<223>引物

<400>48

agaagtgaaaatttacttaccaagagacaaggatagg37

<210>49

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>49

gaaatcgtcctcactcagtcccctg25

<210>50

<211>37

<212>dna

<213>人工序列

<220>

<223>引物

<400>50

ctcaaagctgatctagcattcaccacggttgaacgac37

<210>51

<211>507

<212>dna

<213>智人

<400>51

tgcaacgacatgacccctgagcaaatggctacgaatgtcaactgttcctctcctgaacgt60

catacccgttcctacgactacatggaaggtggagatatccgtgtgagacgtctgttctgt120

cgcactcaatggtacttgcgcatcgataagcgtggcaaagtcaagggtacacaggagatg180

aagaacaactacaacatcatggaaatccggactgttgcagtcggaatcgttgccatcaag240

ggtgtcgaaagcgagttctacttggccatgaacaaggaaggcaagttgtacgccaagaaa300

gagtgcaacgaagactgcaacttcaaggagctcatcctcgagaaccactacaacacctat360

gcttctgcgaaatggacccacaatggtggtgagatgtttgtcgccttgaaccagaagggt420

attcccgttcgtggcaagaagaccaagaaggagcagaagactgctcacttccttcccatg480

gccattacccaccaccatcaccatcac507

<210>52

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>52

acagctggtgctcagtgcaacgacatgacccctgagcaaa40

<210>53

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>53

ctcaaagctgatctagtgatggtgatggtggtgggtaatg40

<210>54

<211>513

<212>dna

<213>智人

<400>54

gcccctatggcagaaggaggtggtcagaatcaccacgaagtggtcaagttcatggacgtc60

taccaacgctcctactgccatcccattgagacactcgtcgacatcttccaggagtacccc120

gatgagatcgagtacatcttcaagcctagctgcgttcccttgatgcgttgtggtggctgt180

tgcaacgacgaaggcttggagtgcgttcctactgaggagtccaacatcaccatgcagatc240

atgcggattaagcctcatcagggtcaacacatcggcgaaatgagctttctccagcacaac300

aagtgcgaatgtcgtcccaagaaggacagagctcgtcaagagaacccttgcggtccttgc360

tctgaacgccgtaagcacctgttcgtccaagatccccagacctgcaagtgttcctgcaag420

aacaccgattctcgctgtaaagcccgtcagttggagcttaacgagcgtacttgccgttgc480

gacaaacctcgtcgtcaccaccatcaccatcac513

<210>55

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>55

acagctggtgctcaggcccctatggcagaaggaggtggtc40

<210>56

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>56

ctcaaagctgatctagtgatggtgatggtggtgacgacga40

<210>57

<211>1587

<212>dna

<213>talaromycescellulolyticus

<400>57

atgcgtatgtcagcttcgttaccgctcatcgtcttgtcgatggtgtcggccagcaatgcg60

ctctctcttcatagacgtgatgagccagcagttctagcagcaccgttacaacgcagacat120

gtggatgggattttgggcaaaagagatacgtcgccagttgatgtatcgatcttcaatcac180

gtacgtacgaggatttcgaatgcaatatttcctgggacctaacgactgcatagcaaaata240

caagctactggctgaacttgactctgggatcacctgcgcagaatttcacactcgccttgg300

acacgggcagcagcgatctatgggttattgagggatcgaaaaaggcagctaatgtttacg360

tctcggatgattcgtcctctttcaaatctctggatcttccatacaacgcaacatacgcgg420

atggcaccacggctctcggtgtctacgcgactgacatattgagcttgggaggtgcaactg480

tcaaggactttgagtttattgttgtgaaccaaacttcatctgatggtgagatctgacctt540

atgaaaatatcattgtatcttctgcaaactttagtggcgtgtgcattcattctaattcat600

gattgattgtatacagtgggcattgccggtgtcggctacaacatctcaacatatgcatct660

tcaggcctgaacaaaacatacaacaacctaccttatgccttggctgccagcggcgtcacc720

aaatctgctgcttacagcctgtggatggacgatgccgcagcaacttcaggcacgattatg780

tttggtggtgtcaacaaggcaaagtacatcggtgaactccaaactctcccagtcgtgcca840

gtctataacaggtattactcacttgcactcgccttgaccgaagtcactgtgcaaactggg900

gactccaagagtactacgacgaaccttccgctcgcagtttctctggatacgggctcaact960

tccactttgctgccccaagacctttttaatgacattctcggcgctctgaatggaacctac1020

gacgagaagagcggcttcgcctatgtgagctgcgacctcatagaaaccgattacaatgtg1080

acattcagtttctctggagctaagatcgacgtgggtcttagtcaactggtatttttcggg1140

gccgtggctgggtggcccaagaacagctgtgttattgatcttactcccagcgaacctgga1200

gtgaacatccttggagacagtttcctgcgcagtgcgtacgtcgtctatgaccttgagaac1260

aatgaaatttcccttgccaacaccaacttcaaccccggtaaggacgacattctggaaatc1320

ggtaccggcgccgatggggtgccaggtgccactcttgttccctcggctgtctctactgct1380

acaggaaacggcgttcagacagcgactaccggtgtggtgggtgctaccggggtcactgtc1440

accgctggtactactgctaccggcagcgcaagcaccggcggttctgcaaaatctactggc1500

acatcttctggcatggcagcgttgcccaccggcaatgccaaacttctttctggtctggca1560

ggcgctggtcttctccttatgatctaa1587

<210>58

<211>2025

<212>dna

<213>talaromycescellulolyticus

<400>58

atggaactgtccccgccgggcttagcgccgaacaggtatcgcatcaccatcggaccaagg60

taactcccagtcgtgtggccatccacccatctgccccaacttcatctcttcatcttcatc120

ttcatctcattccggattcccccagagaggtgtactgtatctgggatacactgttcaagg180

ctttgtgtgcatcagacacaacaattatcttgtaagttggttcgtctctgactctccagc240

tatcgttgagtcaccactgatactgataacgacgtcatctccagattcgactgctcgagc300

catcaacatgaaaggtttggctaccacgctcctcgtaggggctgcggctgctttttctcc360

tgctcagcaggtgcttaaagccccagaggacgttgttgagaacacccacaaggcctcctc420

tccctctctagccgagacgctcgcccagcctctccatgagctcaatgaagagctcaagtc480

gttcactcacgaagccgaggaggtctgggaacaagtctcaaacatgttcccaggtgctct540

agataacatccctttcttctcctcacccaagaagcacactcgtcgccctgactcacactg600

ggaccacatcgttcgtggtgccgacgtccagaacatctgggttgagaacgccaatggcga660

gaaggaacgtgaagtcggtggtaggctcgaggcctttgaccttcgtgtcaagtctgttga720

ccccagctcgcttggaatcgatcccgatgtcaagcagtacagtgggtaccttgacgacaa780

cgagaatgataagcatttgttttactgtatgtgcacacttctatctatcgaaagtatcac840

tgataactaacaattatagggttctttgagtcccgaaatgaccccaagactgaccctgtc900

gtcctctggttgaacggtggaccaggatgctcgtccttgaccggtcttttcttcgagctc960

ggacccagctctatcggcaagaacatcaagcccatctacaacccctactcctggaactcc1020

aacgcctctgttatcttccttgaccagcccgtcaatgtcggtttctcctacagcggtaac1080

tccgtcagtgagacgagcgctgctgcaaaggatgtctatgctcttcttactcttttcttc1140

aagcaattccccgaatatgccactcaggatttccacattgcaggtgaatcctacgccggc1200

cactacattccttcatttgcctctgagatcctttctcacaagaagcgcaacatcaacctg1260

aagtctgttttgatcggaaacggtcttactgatggtctcactcagtacgaatactaccgc1320

cccatggcttgcggtgatggtggttatcctgctgttctcgatgagagcacttgccgctcc1380

atggacaacgctctcggtcgctgccagtccatgattcaatcctgctacgacagtgaaagt1440

gcttggacctgtgttcctgcttctatctactgcaacaacgcccttttgggtccctaccag1500

cgcactggccagaatgtatatgatgtccgcaagccttgcgagggcggcaacctctgctac1560

actgatctcgaatacatcagcacctatctcaaccaggctgaggtcttgaaggctgtcgga1620

gccgaagttgacaacttcgactcttgcaactttgacattaaccgcaacttccttttcaag1680

ggtgactggatgaaaccattccacaagcttgtccctggaatccttgaggaaatccctgtt1740

ctcatctacgctggtgacgccgacttcatctgcaactggctgggcaacaaggcctggtct1800

gatgctcttgagtggagcggccacgaagaatacgccgctactgagcttgaagatctcgag1860

atcgttgacaacaagcacaagggcaagaagattggtcaggtcaagtcctctggtaatctc1920

accttcatgcgcctatttggcggtggccacatggttccctatgaccagcccgaggccagt1980

ctcgagttcttcaaccgctggatcggtggtgagtggactcagtaa2025

<210>59

<211>1657

<212>dna

<213>talaromycescellulolyticus

<400>59

atgtcgctacgcagctgcgccctgctgggtctagctgccagcgcccttgccgctgagccc60

aaggtgctgcacatgccaatggcccgcaacccaaatgccaaccctctcgccaaacgagac120

tctgcctccgtcaccgtcacaaatgccctgagcgagggtatctactttgtgaacgctaca180

gttggaacacccggtcagctggtgcagttggtcttggatactggaagcagtgatgtgtgg240

ttcttcggtccgaattcgtgcgacgcgaaaacctctgattgtctgggtggaacatgtatg300

ttttctccttattctccttacattccgatgccatgtggttggcacgtggatgtgcaaatc360

gtttctgtactaatagttgataatagatgacccctcccaatcttcgagcgtcttaatctc420

ccaacctaaaggccaatttttcattcaatacggcacacccggctcgaatgtcactggtaa480

ctacatcaaagacgctttcagcgttggcgaagccaaagtcacaaacctcaccatggctta540

tgctacctacgcggcatacgttcctaccggtgtgatgggtattggattcgacaccaacga600

ggccatcacagcatatggtggcaagccctacccgaatttcgtcgatgttctcaagtcgga660

gaacgtcattagcaccaaggcatacagtctgtggttgaacgatctcgagtcaagcaccgg720

aagctgtttgtttggtggatacgataccaagaaattctccggcaacctcttggctgtgcc780

cattcaacccgacgagtcgtctggtgaattgaccagtatgactgtcgcatggactgcgct840

tggtattacgacccaatctggatcgcaaacaatcacttcctcgtccttcaagtcgcctgc900

gttgctcgactccggtaccacattgagtatcatacctgatgatatctatgaatcattagt960

cacgttcttcgatgccacactagaccaagcaggtgatgcaattgtcaaatgcaacctact1020

cgatgactcgggcactcttgactttacatttggcggatccgacggtccagttatcaaggt1080

tcctttctcggagtttgcgctacctgcaactaccaccaacggccagcaggccaccttcaa1140

cgatggctcgttggcttgttatcttggtcttcaaggaacaggctcggacccgacatcaca1200

ggtccccgtcattctcggcgacactttccttcgctctgcctatgttgtgtacgatctcga1260

caacaagcaaatctctctcgcgcaaaccgtcttcaacgcgacagacagcaacgtcgttga1320

aattacgtctgccagccctgttgccagtgtcgtgagtggcgtcacagtcacccagactgc1380

ctctggcaaccccaacgagctcggtgggcctactgctactgccgacccgaccggttcagg1440

cagctcgatcggttcaggcagttcaggcggttctgatctttccggcagcagcctcaccgt1500

ctctcttacccctgccacggcaaccggctctgcatcgtcatcaacttcttctcacaaatc1560

gtcggctaaccccgctcctgggccagactttatgagcactgcccttattgctggagcgtc1620

tatgttgctgggaggtgttttcttcgtccttcattag1657

<210>60

<211>1053

<212>dna

<213>talaromycescellulolyticus

<400>60

atgtgtcaattcatttcccattatatacttcaaaaagttgctgagtcacctgaagtgtct60

cagcatgcacgagaatcagcagcgaggacgctgagtatcgacacagaggtacgaaataga120

aggcccgatctgcatgctgcaatcgttcagaatcccaacctcggcaacttgcagtcagtg180

actgcaagctcgggccgcgaacaaccaagtatctcagtgtacgactgtagaaacagctcc240

aaacttccaggagtccgggtccgaagcgatgaccagagagtcagagatcgagtcgtcaat300

aatgcatttgacggcttacagattgcagacaagttttatagcgatgttttcgcatacaaa360

gtccctgatggttcatggaatgctcttactggctcagttcattttcgcgagaactacaac420

aatgctatgtgggatggacagcagatgatttttggtgacggagacggagaaattttcgat480

tactttgctgattcactagacgtaatcgtccacgaaattacccatggagttacccaatac540

acagcaaatctgcagtacgaaggccaaagcggagcgttgaatgaatctatatcagatgtt600

tttgcatgtatggccgagcaatggtatcttgaccagacagctgaggatggggattggttg660

ttaggccaaaatctgttccctgttgcacgaaagggatccgcgctgcgttcactaaagaag720

cccggcacagcttacaacaatgacaaaatcctcggcaaagatccccaacctggccatatg780

cgtgattataacaacacacgtgacgacaacggtggtgtacatctcaattccggcatccca840

aatcatgcattttatctcgttgccactactcttggagggcgttcgtgggatcaagccggt900

catatatggttcaaaactttgaccgactcccggctcaggcctacagctactttcagtgcc960

tttgctggattgactgtggataatgcacagagactttacggtaacaatgtgggtcaagca1020

gtaaagaaagcgtgggaaggggttggtgtctga1053

<210>61

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>61

cggtacccggggatcagcaaccccaccgtaatctcaaggt40

<210>62

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>62

ccgatctgaattgacattcggatggactttttgaaggcca40

<210>63

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>63

tcggcgttcacttatgaggttgacttgatagtcgatcgct40

<210>64

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>64

cgactctagaggatcgttattgctgttgctgttgtggttg40

<210>65

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>65

ccgatctgaattgacagatagcgtgagcacactgagcagg40

<210>66

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>66

tcggcgttcacttatcaacacgctacctcttccacagtag40

<210>67

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>67

cggtacccggggatccgtctgtcaaggttgggttaatcgt40

<210>68

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>68

ccgatctgaattgaccgaggcagccaaccataagaactgc40

<210>69

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>69

tcggcgttcacttatgcgagccgtacttggtttgactact40

<210>70

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>70

cgactctagaggatcaattgcatttcttccccatcgtcga40

<210>71

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>71

cggtacccggggatccatagcctcatgaccaatgaccggt40

<210>72

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>72

ccgatctgaattgacgtcgatgaagtcgtcgggggtatgt40

<210>73

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>73

tcggcgttcacttatcggctcaatatgcaataggtgttcc40

<210>74

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>74

cgactctagaggatctagggctaaccagcagggtaccgcc40

<210>75

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>75

cggtacccggggatcccacattcacagaaggcactataca40

<210>76

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>76

ccgatctgaattgaccatcaacatctacaatccgacggtg40

<210>77

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>77

tcggcgttcacttatgttgttggccagaagaaagcataca40

<210>78

<211>40

<212>dna

<213>人工序列

<220>

<223>引物

<400>78

cgactctagaggatcctctcccgaggcacaacccaaagtg40

<210>79

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>79

gtcaattcagatcggctgccgcctg25

<210>80

<211>25

<212>dna

<213>人工序列

<220>

<223>引物

<400>80

ataagtgaacgccgagtcagtacta25

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1