一种适用于嗜热微生物遗传改造的基因元件及其载体和应用的制作方法

文档序号:474442阅读:305来源:国知局
一种适用于嗜热微生物遗传改造的基因元件及其载体和应用的制作方法
【专利摘要】本发明涉及分子生物学,具体的说是一种适用于嗜热微生物遗传改造的基因元件及其载体和应用。元件为嗜热II型内含子元件TeI3c-4c,其由序列表SEQ ID NO.1和2中核酸序列所示。利用所述嗜热微生物遗传改造的基因元件打靶载体应用于嗜热微生物中,进而使嗜热微生物基因靶向失活。本发明利用Thermotargetron应用于嗜热微生物的基于II型内含子的靶向基因失活工具。具有基因失活效率高、可轻松改变靶位点(打靶载体构建周期短)、宿主范围广(可用于革兰氏阳性、阴性细菌中)、无需营养缺陷筛选标记、对转化效率要求低、可对较短基因序列进行失活(100-200bp)低等优点。
【专利说明】一种适用于嗜热微生物遗传改造的基因元件及其载体和应 用

【技术领域】
[0001] 本发明涉及分子生物学,具体的说是一种适用于嗜热微生物遗传改造的基因元件 及其载体和应用。

【背景技术】
[0002] 基于targetron系统的基因敲除方法具有操作简单、周期短、效率高、无需抗性筛 选、对转化效率要求低等优点,能够弥补同源重组方法的缺点,已广泛的应用于基础研究和 工程菌株的改造。
[0003] II型内含子基因失活的原理是RNA "归巢(retrohoming)",以LI. LtrB内含子为 例,II型内含子的基因失活分两阶段进行(参见图1):1) LI. LtrB内含子(核酶)自我切割 形成"套索"结构;2)自我剪切形成"套索"结构的II型内含子与具有反转录酶活性的IEP (intron-encoded protein)蛋白结合,形成RNP复合体。RNP复合体识别特定的DNA序列, 并将内含子RNA序列插入识别位点的DNA正义链。IEP部分消化反义链,并以内含子RNA为 模板,剩余反义链DNA为引物,逆转录出与内含子RNA互补的cDNA序列。随后内含子RNA 被胞内RNA酶消化,最后DNA正义链缺口被胞内DNA修复系统修复,完成内含子的基因失活 过程[1]。
[0004] 目前嗜中温targetron技术已广泛应用与多种微生物的基因祀向失活,但目前使 用的targetron系统,都是建立在嗜中温(37°C -42°C) II型内含子元件的基础上,这种中 温II型内含子元件,在高温条件下(48°C -65°C)不能工作,因此不能应用嗜热微生物(如 C.thermocellum)中[2, 3]。


【发明内容】

[0005] 本发明目的在于提供一种适用于嗜热微生物遗传改造的基因元件及其载体和应 用。
[0006] 为实现上述目的,本发明采用技术方案为:
[0007] -种适用于嗜热微生物遗传改造的基因元件,元件为嗜热II型内含子元件 TeI3c-4c,其由序列表SEQ ID NO. 1和2中核酸序列所示。
[0008] -种适用于嗜热微生物遗传改造的载体,载体为具有嗜热微生物遗传改造的基因 元件打靶载体,其含有复制起始位点、耐热复制蛋白、多克隆位点、嗜热II型内含子元件 TeI3c_4c和启动子元件。
[0009] 所述嗜热II型内含子元件TeI3c_4c为序列表SEQ ID NO. 1和2中核酸序列所示; 启动子源于嗜热微生物启动子。
[0010] 进一步的说,嗜热微生物遗传改造的基因元件打靶载体以PHK质粒为骨架,含有 嗜热II型内含子元件TeI3c-4c和groEL启动子。
[0011] 所述PHK质粒为以pNW33N (BGSC)质粒为骨架,含有多克隆位点、ColEl复制起点 (Rep Origin)、repB耐热(50°C?55°C)复制蛋白和氯霉素抗性的氯霉素转乙酰基酶(CAT) 基因,能够在大肠杆菌-热纤梭菌中穿梭复制。
[0012] 所述含有多克隆位点为 PstI, NarI, SmaI, BamHI, XhoI, EcoRI, XbaI, HindIII, KpnI ,NdeI 和 NheI。
[0013] 一种嗜热微生物遗传改造的应用,利用所述嗜热微生物遗传改造的基因元件打靶 载体应用于嗜热微生物中,进而使嗜热微生物基因靶向失活。
[0014] 由所述嗜热微生物遗传改造的基因元件打靶载体中基因元件与嗜热微生物的识 别位点结合,进而使嗜热微生物基因靶向失活。
[0015] 所述识别位点为1)革E DNA识别位点17个碱基具有WAAnnnnnnnnnnnnnn( W=A或T, N=A,T,G,C)特征,确保能够被TeI3c-4c正确识别;2) TeI3C-4cII型内含子元件EBS1,2, 3 与靶序列IBS1,2, 3 (DNA)满足Watson-Crick碱基互补配对原则,确保能被RNA正确识别。
[0016] 所述识别位点为WAAnnnnnnnnnnnnnA/T/G/C,W代表A或T碱基,η代表任意碱基, A/T/G/C表示EBS3序列可以为任意一种碱基。
[0017] 本发明所具有的优点:
[0018] 本发明利用Thermotargetron应用于嗜热微生物的基于II型内含子的祀向基因 失活工具。具有基因失活效率高、可轻松改变靶位点(打靶载体构建周期短)、宿主范围广 (可用于革兰氏阳性、阴性细菌中)、无需营养缺陷筛选标记、对转化效率要求低、可对较短 基因序列进行失活(100_200bp)低等优点。

【专利附图】

【附图说明】
[0019] 图1为Targetron工作原理图,其中,左图显示II型内含子通过两次转酯化反应 自我拼接成RNA "套索"结构;右图显示内含子RNA "套索"与IEP蛋白形成RNP蛋白复合 体,RNP复合体通过反向拼接、反义链消化、cDNA合成、DNA修复四步完成内含子的归巢。
[0020] 图2为本发明实施例提供的pHK质粒的构建图谱,由pNW33N (BGSC)质粒改造而 来,在删除了 CAT基因和ColEl之间的一段760-bp的冗余序列的同时加入多克隆位点。其 中,Rep Origin质粒复制起点;CAT氯霉素抗性基因;r印B为复制蛋白;MCS为多克隆位点: PstI, NarI, SmaI, BamHI, XhoI, EcoRI, XbaI, HindIII, KpnI, NdeI 和 NheI。
[0021 ] 图3为本发明实施例提供的用于热纤梭菌基因打祀thermotargetron质粒 pHK-TTIA;其中,TeI3c II型内含子及TeI4c RT酶使用热纤梭菌来源的groEL启动子启动 表达。
[0022] 图4为本发明实施例提供的嗜热II型内含子在大肠杆菌中不同温度下"归巢" 效率测定原理图;在大肠杆菌宿主细胞E. coli HMS174DE3中借助TeI3c-4c供体质粒 (pA⑶2X-TeI3C-4c),受体质粒(pBRR-3c (具有氨苄抗性,ampK))系统我们测定了温度对 TeI3C-4cII型内含子在大肠杆菌中的归巢效率的影响。我们在TeI3c内含子DIV区插入 一段?启动子(acgcgtaatacgactcactataggg)(图6),并克隆进入质粒pAO)2X中获得 TeI3c-4c II 型内含子供体质粒pACD2X-TeI3c-4c ;受体质粒pBRR-3c(ampR)含有TeI3c-4c II型内含子"E1-E2"识别序列且紧接一段无启动子的四环素抗性(tet K)基因。一旦TeI3c 内含子"归巢"至受体质粒"E1-E2"位点,tetR基因即启动表达使得菌落具有 性(图4)。因此不同温度下ampK与tet K双抗性菌落数量与ampK抗性菌落数量的比值即是 TeI3c-4c的"归巢"效率即归巢效率=(TetK+AmpK) /AmpK。
[0023] 图5为本发明实施例提供的Thermotargetron重新编码图,其中Thermotargetron 重新编码分为三步。第一步,在祀基因序列中寻找thermotargetron识别位点 WAAnnnnnnnnnnnnnA (W表示A/T,η表示任意碱基),确定打祀位点;第二步,根据祀位点设 计TeI3c-4c内含子IBS1,2, EBS1,2(RNA)突变引物(图6,图8);第三步,通过重叠 (overlap PCR)获得)获得IBS1,2 (RNA),EBS1,2突变的PCR扩增片段(两端具有Spel,BsiwI酶切位 点);第四步,PCR扩增片段SpeI-BsiWI双酶切后替换pHK-TTIA对应片段,即获得特异靶 DNA 位点 thermotargetron 打祀载体。
[0024] 图6为本发明实施例提供的基因元件TeI3c_4c结构图,包括Thermotargetron的 组成元件TeI3c II型内含子和TeI4c RT酶。(A)TeI3c II型内含子的二级结构,同时展 示了为完成"归巢"试验和构建thermotargetron所做的一些突变。小写字母表示不同于 野生型TeI3c II型内含子序列;IBS1/2/3外显子碱基用带边框的字母表示,且标明不同 的类型;质粒构建过程中使用的酶切位点使用粗体表示;在内含子DIV区插入的T7启动子 (acgcgtaatacgactcactataggg)用斜体表示;希腊字母对应的碱基参与内含子形成三级结 构的形成;在DIVa区的两个颈环结构(阴影方框)可能形成如图所示的假结(pseudoknot)。 (B)TeMc RT的一级结构,该酶帮助前体TeI3c RNA完成自我拼接和"归巢"。RT酶结构域具 有很高的保守型,黑框标示的RT1-7编码RT酶"finger and palm"结构域,其中RT-0, RT-2a (斜阴影)相对non-LTR-retroelement RTs具有保守性[4-6] ;X/Thumb与D结构域参与DNA 结合;。RT与X/Thumb结构域可以特异的与内含子RNA结合,具有逆转录酶的活性,并且在 RNA拼接过程中稳定RNA核酶活性与结构,帮助II型内含子归巢至特异DNA靶点;D结构域 主要承担DNA靶位点识别的功能;En结构域为DNA内切酶切割靶DNA反义链,形成II型内 含子RNA逆转录引物。
[0025] 图7为本发明实施例提供的温度对TeI3c-4c归巢效率的影响图,其中,温度对 TeI3c_4c归巢效率的影响。用于归巢试验的供体质粒为pACD2X-TeI3c-4c (Targetel为 野生型祀位点,Targete2为IacZ基因祀位点)。供体质粒和受体质粒转化进入E. coli HMS174(DE3)宿主细胞后,在不同温度使用500 μ M IPTG诱导1小时后,使用归巢试验方法 计算归巢效率。TeI3C-4cII型内含子,对于两个打靶位点在42°C以下其归巢效率都为0,当 温度超过45°C时归巢效率急剧升高,48°C达到100m。以上结果表明来源于嗜热蓝聚藻来源 的TeI3c-4c II型内含子归巢活性具有高温依赖性。
[0026] 图8为本发明实施例提供的TeI3c-4c碱基识别规律图,其中,TeI3c-4c II型内 含子的靶DNA识别规律。(A)野生型TeI3c II型内含子的DNA识别位点,-13-+1位点 之间的碱基序列为表示RNA识别区域,-14, -15位碱基为IEP蛋白识别区域。IBS1,2, 3 表示内含子结合位点1,2,3 (intron-binding sitesl,2,3),EBSl,2,3表示外显子结合 位点1,2,3 (Exon-binding sitesl, 2, 3),箭头表示内含子在祀DNA序列中的插入位点 (intron-insertion SiteX(B)TeMc RT在DNA祀序列中的识别位点。在大肠杆菌(E. coli HMS174DE3)宿主中,使用TeI3c-4c II型内含子供体质粒pADC2X-TeI3c-4c对随机受体质 粒库(pBRR-3c,靶位点-35--13/+2- 20为随机碱基,+1--12为野生型IBS1,IBS2)进行 基因打靶。IPTG诱导完成后,涂布氨苄青霉素/四环素抗性平板,获得的阳性克隆测序鉴 定,统计TeI3c RT识别靶DNA序列的偏好性。105个发生归巢事件的靶序列在不同位点的 碱基出现频率使用WebLogo表示(100未筛选的打靶序列作为矫正对照)[7]。该结果表明 IEP蛋白识别位点具有明显的AA碱基对识别偏好性[8]。( C)IBS3 (DNA)与EBS3不同的碱 基配对类型对TeI3c-4c II型内含子归巢效率的影响。将供体质粒pACD-TTIA,pACD-TTIC, pACD-TTIG,or pACD-TTIT 与受体质粒pBRR-3cA(WT, IBS3A),pBRR-3cC, pBRR-3cG, pBRR-3cT 共同转化E. coli HMS174 (DE3)(表I ),采用归巢试验相同方法,计算不同IBS3与EBS3碱基 配对类型对归巢效率的影响。EBS3与IBS3 (DNA)不同配对方式对归巢效率的影响如矩阵图 所示,野生型的A-U配对用粗体字表示,浅阴影方格内为对应碱基互补配对是的归巢效率, 白色方格表示碱基之间不形成互补配时的归巢效率。该结果显示,EBS3与IBS3(DNA)形成 碱基互补配对是保证高"归巢"效率(22%-106%)的必要条件。
[0027] 图9为本发明实施例提供的IacZ基因不同的thermotargetro识别位点 (60a,369a,2586a),其中the;rmotarget;ronLacZ60a,lacZ369a,lacZ2586aTeI3cEBS与 IacZ基因 IBS(DNA)靶序列的相互作用。野生型TeI3c与靶DNA的识别在最上方展示;灰 色阴影表示与野生型对应位点碱基相同;IacZ基因使用方框表示,箭头(IS)及数字表示 TeI3c II型内含子在IacZ基因中的插入位点,用于Southernblot检测的Apal,EcoRI酶切 位点位于基因两侧。
[0028] 图10为本发明实施例提供的TeI3c-4c II型内含子"归巢"效率与诱导时间的关 系图,其中 thermotargetron LacZ60a, lacZ369a, lacZ2586a转化进入E. coli HMS174(DE3) 细胞后使用500mM IPTG于48°C诱导不同的时间。归巢效率为白斑与总菌落数的比值;表 中的比值表示II型内含子单插入突变株数量/总插入突变株数量。
[0029] 图11为本发明实施例提供的IacZ突变株PCR鉴定图,其中,PCR检测8个克隆(2 个篮斑(B)和6个白斑(W))并使用野生型E. coli HMS174(DE3)菌株作为对照。使用外侧 引物与TeI3c内部检测引物检测时(lacZ60a使用LacZ30s和Te680rc引物检测;lacZ369a 使用 LacZ30s 和 Te680rc 引物检测;lacZ2586a 使用 lacZ3060a 和 TeI3c608rc 引物检测, 表2),在TeI3c内含子插入后可观察到PCR条带(白斑有检测条带),野生型和蓝斑无检 测条带;使用插入位点两端引物检测时(lacZ60a使用LacZ30s和LacZ1850as引物检测; lacZ369a 使用 LacZ30s_LacZ1850as 引物检测;lacZ2586a 使用 LacZ1850s_LacZ3060as 引 物检测,表2),白斑由于外源DNA的插入PCR条带增大,且增大的数值正好为II型内含子 RNA的长度。
[0030] 图12为本发明实施例提供的Southernblot检测效果图,其中,Southerblot检测 8个克隆(2个篮斑(B)和6个白斑(W))并使用野生型E. coli HMS174(DE3)菌株作为对照。 分别检测48°C诱导15-30分钟的LacZ60a, lacZ369a转化子或诱导1小时的lacZ2586a转 化子。使用32P标记的DNA探针杂交Apal,EcoRI双酶切的基因组DNA并显影(IacZ基因 探针:30nt_185nt或TeI3c intron探针:lnt_342nt);当使用IacZ基因探针时,白斑(含 TeI3c)杂交条带理论大小为4. 5-kb,蓝斑(不含TeI3c)杂交条带理论大小为3. 7kb。使用 TeI3c探针时,理论杂交条带大小为4. 5kb ;出现多条杂交条带提示有TeI3c脱靶。
[0031] 图13为本发明实施例提供的Thermotargetron基因打祀(失活)原理图,其中, Thermotargetron质粒TeI3c II型内含子和TeI4c RT由热纤梭菌组成型启动子PgroEL 启动表达。TeI3c基因转录出具有核酶活性的II型内含子RNA ;RT酶基因转录出RT酶。 TeI3c RNA与RT酶结合形成核糖核蛋白复合体(RNP) ;RNP可以特异的识别靶DNA5',3'外 显子(ΕχοηΓ,Exon2' ),插入DNA正义链并部分消化反义链。RT酶以剩余反义链为引物,内 含子RNA为模板逆转录出RNA的cDNA序列;最后通过宿主DNA修复机制完成"归巢";由于 II型内含子DNA内部有许多终止密码子(TAA)所以能够在蛋白水平上终止目的基因的表 达,该过程称为thermotargetron基因打祀或thermotargetron基因失活。
[0032] 图14为本发明实施例提供的在热纤梭菌中成功打祀的thermotargetron识别序 列及打祀效率图,其中,图示7个不同基因的thermotargetron识别位点、EBS/IBS相互作 用和"归巢"效率。7个不同基因及其编码产物分别为:(^?4((:1 〇1313_0627),(^11111〇8〇1^ scaffoldin protein;hfat (Clol313_2343), hypothetical formate acetyltransferas e; hyd (C1〇1313_0554),hydrogenase;Idh(Clo1313_1160),lactate dehydrogenase;pta( Clol313_1185), phosphotransacetyIase;pyrF(Clol313_1266), orotidine5' -phosphate decarboxylase。野生型TeI3c的识别序列在图片顶端展示;灰色阴影的碱基表示与野生型 TeI3c II型内含子识别序列相同;箭头表示thermotargetron插入位点;归巢效率等于发 生特异设计位点基因失活的转化子占 PCR检测转化子的比例,标示在图片的右侧。
[0033] 图15为本发明实施例提供的热纤梭菌基因被thermotargetron失活示意图,其 中,(A) 7个热纤梭菌基因被thermotargetron失活示意图。基因组DNA使用平行的线条 表不,基因的5端,3端标不在基因的两端;基因 ORF使用带箭头的空心方框表不,箭头方 向表示基因的转录方向。使用实心黑色方框表示插入基因组中的II型内含子基因,与ORF 空心方框交界处用黑色箭头(短)标示出II型内含子基因的插入位点。外侧检测引物(黑 色箭头)横跨插入位点且任意一条引物与插入位点的距离至少是200bp。内侧的检测引物 (Te680rc)与II型内含子基因正义链互补(658nt675nt)。外侧引物检测野生型或突变株的 PCR产物大小如图右侧所示。(B)使用菌落PCR方法检测7个基因突变株。泳道1,外侧引 物检测野生型热纤梭菌DSM1313菌株;泳道2,外侧引物检测突变株(如检测CipA基因失 活的外侧引物对为CipA1827s-F与CipA1827s-R,表2);泳道3,以外侧正向引物与Te680rc 引物检测突变株(如检测CipA基因失活的外侧-内侧引物对为CipA1827s-F与Te680rc, 表2) ;M,DNA分子质量标准。
[0034] 图16为本发明实施例提供的Southerblot检测TeI3c DNA在不同热纤梭菌 DSMl 313突变株中的拷贝数,其中,Southerb lot检测Te 13c对特异靶位点失活过程中是 否存在"脱靶"现象。提取thermotargetron突变株基因组DNA并使用BamHI,EcoRI双 酶切后在0. 8%琼脂糖凝胶上电泳分离,分离的DNA片段转印至尼龙膜上(Hybond-NX,GE Healthcare)与地高辛标记的TeI3c DNA特异探针(539nt_710nt)杂交过夜并显色 (DIG-High Prime DNA Labeling and Detection Starter Kit I, RocheXM, DNA分子量标 准。Southernblot结果表明,在热纤梭菌中thermotargetron的"脱祀"率为50%左右(单 插入菌株/单插入菌株+多插入菌株)

【具体实施方式】
[0035] 下述实施例所涉及的质粒与引物具体参见表1和表2。同时所涉及的大肠杆菌 菌株 E.coli HMS174(DE3) (Novagen)用于"归巢(retrohoming assays),'试验,DH5Ct (Life Technologies)用于基因克隆。E.coli细胞置于Luria-Bertani (LB)培养基中培养 (37°C,200rpm)。用于质粒筛选的抗生素浓度为:氨节青霉素(ampicillin,amp),100yg/ ml ;氣霉素(chloramphenicol, chi),25-50 μ g/ml,四环素(tetracycline, tet) 25 μ g/ml 〇
[0036] 热纤梭菌(Clostridium thermocellum DSM1313)菌株在改进的 GS-2 培 养[9]中培养,IL GS-2 培养基的配方为:KH2P041. 5g,K2HP04 · 3H202. lg,Urea2. lg, MgC12 · 6H201. 0g,CaC12 · 2H20150mg,FeS04 · 6H201. 25mg,Cysteine-HCllg,MOPS-NalOg, Yeast extract6. 0g,Trisodiumcitrate · 2H203. 0g,ResazurinO. lmg,5. 〇-10g/l 纤维二糖 (GS-2-CB)或微晶纤维素(GS-2-AV)作为主要碳源,pH7.4。热纤梭菌采用半固体包埋法涂布 平皿[10, 11],半固体琼脂浓度为0. 8%(w/v)(GS-2-CB-SS)。质粒筛选时高温条件下,使用 更稳定的甲砜氯霉素(thiamphenicol)代替氯霉素(chloramphenicol),作为筛选抗生素, 其浓度为3-6 μ g/ml。培养基配制完成后,分装至200ml厌氧瓶中,并使用高纯氮(99. 999%) 爆气5min,除去培养基中的溶氧,迅速盖上橡胶塞,115°C灭菌高压蒸汽灭菌20min备用。
[0037] 实施例1
[0038] 全基因合成嗜热II型内含子元件TeI3c-4c :
[0039] 嗜热蓝聚藻 BP-1 菌株(Thermosynechococcus elongates BP-1)含有 28 种 IIB 型内含子。他们亲缘关系很近,被认为是由同一祖先进化而来,横向转移进入该微生物的 基因组中[8,12,13]。其在全序列合成了了613〇11型内含子基因(873拉,5'端5?61,3' 端PstI)的同时将其20, 319, 321,337, 339位A,T,A,T,A序列分别突变为T,A,G,C,T形成 SpeI-BsiwI 酶切位点(序列)。SpeI-BsiwI 酶切片段长 357bp,覆盖 IBS1-IBS2, EBSl, EBS2, 可以通过酶切连接快速的替换成靶DNA识别序列。另外,野生型TeI3c本身不编码RT酶, TeI4c编码的RT酶可以促进TeI3c的"归巢(retrohoming)"。因此全序列合成了编码TeI4c 的RT酶的基因(1701nt,5'端PstI, 3'端Xhol,序列)并连接至TeI3c下游,形成TeI3c-4c 内含子(Tel3c的intron,Tel4c的RT酶,图6),用于构建嗜热targetron。
[0040] SEQ ID NO. 1 所示为 TeI3c DNA,5'SpeI_3'PstI 的核酸序列:
[0041] actagtaacacccctatcagggtgcgacgcgaaagctagccagatgattgtcccactagcccaacaagc tagaacgggaccggttgttcccccaaccgtagcctaaggaggcatgcgtgactggtaacggtcaggtatgaagccct cccgacaatgaagcccgaaccggaaggttggagccgaatccgtgaggaggaagcaacttcaccagcgtcaggtgata gggagctaggcttgagggtatggtgaacgcaagtgaagtgacgctagaagcctcgttagggtgagcaggccaaagat gctgataggcctgagccaaaatggcaaagcggattggatacgctgctcctgattcagcgtacggggacagcaactcc gccggggtatagtcaccacctaacccctcgtgtcatctggttggaacgcggtaagcccgtatcttcgccttgaacat tcaaggcaggcaaaccgtaaggaatgctgatgggggtgcgggtagaggaggtgggaaaaagcgaatgctagcctgta atgggctagatagggattgagaatgctggcaggacattcaacatcatcccactcgaaagagggcagacttcccgccg gtccccccttacgagaaagtctatagaaccttcctaatggtgacaatgcaaatggcggtgatcttgagtcactggtg cggtcaccaacctgctcaaaaggtagagaggctgtagatgagtatcgtaaaggttgcatgcacaaccggttcctctt aaatgaggggtcctggggggctcgagccggatgcggggaaacttgcacgtccggttcctagggggctagggggcagc gatgcccccctgctacccgacaatgacgctgcag
[0042] (a)序列特征:
[0043] ?长度:873
[0044] 籲类型:核酸序列
[0045] ?链型:单链
[0046] ?拓扑结构:线性
[0047] (b)分子类型:DNA
[0048] (c)假设:否
[0049] (d)反义:否
[0050] (e)最初来源:嗜热蓝聚藻
[0051] SEQ ID NO. 2 所示为 TeI4c RT DNA, 5'PstI-3'XhoI 的核酸序列:
[0052] ctgcaggaaggagatatacatatgacggtggaccaaaccactggtgcggtcaccaaccaaacggaaaca agetggcacagcataaactggaccaaagccaaccgtgaggtaaagaggctgcaagtgcgtatcgcaaaggctgtgaa ggaaggacgctggggcaaagtgaaagctttgcaatggctcctgacccactcgttctacggcaaagccctcgccgtga aacgggtaactgacaactcaggcagtagaacacctggtgtggacgggataacctggtccacacaagagcagaaaacc caagccataaagtccctcaggagaagaggctataaaccccaacccctgaggcgggtatacatcccgaaagcaaacgg caaacagcgcccgctaggaatcccgacaatgaaggacagggcaatgcaggcactatatgccctagccctagaaccag tcgcggaaaccacagcggaccggaactcctatgggttccgccgagggcgatgtacggcagatgcggcaggacaatgc ttccttgctctggcaaaagccaagtcggctgaacacgtccttgacgctgacatatccggatgctttgataacatcag ccatgagtggctactagccaacactccactggacaaagggatcttacggaaatggcttaaatctgggttcgtctgga aacagcaactcttccccacccatgctgggacacctcagggaggggtaatctccccagttcttgccaatataacccta gatgggatggaagaactgttggccaaacacctcagaggtcaaaaagtcaacctcatccgatatgctgacgattttgt cgtgacgggaaaagatgaggaaaccctggagaaagccagaaacctaatccaggagttcctaaaagaacggggcttga ccctgtcccccgagaagacaaaaatcgtccatattgaggaaggcttcgactttctcggatggaacattcgcaagtac aacggggttcttctcatcaaacccgcgaagaagaacgtgaaagcgttcctcaagaaaatccgagacactctaaggga acttaggacagcaacccaggaaatcgtgatagacacactcaacccaatcattagaggttgggccaactatcacaaag gacaagtctctaaggaaaccttcaaccgagtggacttcgccacctggcacaaattgtggcgatgggcaaggcgccgg cacccaaacaaacctgcccaatgggtgaaggacaaatacttcatcaaaaacggaagcagagactgggtattcggtat ggtgatgaaagacaagaacggggaactgaggaccaaacgcctaatcaaaacctctgacacccgaatccaacgccacg tcaaaatcaaggcagacgccaatccgtttctcccagagtgggcagaatactttgagaaacgcaagaaactcaaaaaa gcccctgctcaatatcggcgcatccgccgagaactatggaagaaacagggtggtatctgtccagtatgcgggggtga aattgagcaagacatgctcactgacatccaccacatattgcccaaacacaagggtggttctgacgacctggataatc ttgtcttaatccacgccaactgccacaaacaggtgcacagccgagatggtcagcacagccggtccctcttgaaagag gggctttgactcgag
[0053] (a)序列特征:
[0054] ?长度:1701
[0055] 籲类型:核酸序列
[0056] 籲链型:单链
[0057] #拓扑结构:线性
[0058] (b)分子类型:DNA
[0059] (C)假设:否
[0060] (d)反义:否
[0061] (e)最初来源:嗜热蓝聚藻
[0062] 实施例2
[0063] 基于TeI3c_4c的高温微生物基因打靶载体pHK-TTIA的构建一即 Thermotargetron
[0064] 构建thermotargetron质粒pHK-TTlA质粒过程分三步:
[0065] 第一步,将 C. thermcellum 分子伴侣蛋白 CpnlO (C1〇1313_0432)启动子 PgroEL, 克隆至TeI3c intron/TeI4RT元件上游。具体过程为使用Ct_PgroEL5-BamHI, Ct_ PgroEL3-SpeI-XhoI-EcoRI引物(表2)从质粒热纤梭菌DSM1313基因组中扩增groEL启动 子,PCR产物BamHI, EcoRI酶切后连接入pIKMl质粒[14]获得pIKMIPgroEL质粒;
[0066] 第二步,将实例 1 合成的 897nt TeI3c 内含子 DNA 序列(Spel/PstI),SpeI, PstI 双酶切后克隆进入PlKMlPgroEL质粒对应位点,获得PIKMlPgr〇EL-TeI3 C质粒;将实 例1合成的1710nt TeI4c RT酶基因序列(PstI/XhoI),PstI,XhoI双酶切后连接进入 PIKMlPgroEL-TeI3c质粒对应位点,获得pIKMI-TTIA质粒。
[0067] 第三步:EcoRI 和 BamHI 酶切 pIKMI-TTIA 质粒,克隆 2. 8-kbPgroEL-TeI3c/TeI4c 元件至pHK对应位点,即获得thermotargetron质粒pHK-TTIA (参见图3)。
[0068] 其中,基于TeI3c-4c的大肠杆菌打靶质粒pAC2-TTlA,C,G,T的构建分为两步:
[0069] 第一步,pIKMI-TTIA质粒Spel,PstI双酶切片段(含Spel/BsiWI突变位点的 TeI3c)替换 pADC2X-TeI3c-4c 质粒中[15]野生型 TeI3c 片段,获得 pACD2X-TTlA 质粒;
[0070] 第二步,构建 pACD2X-TTlC,G,T 质粒。C,G,T 表示 IBS3 碱基。以 pACD2X-TeI3c-4c 作为模板,使用TeI3cEBS3mutA,C,G,T/TeI3cIBS3mutT,G,C,A作为引物,突变TeI3c内含 子IBS3 (RNA)和EBS3序列。PCR产物使用BsiWI和PstI酶切后,插入pAC2-TTlA质粒中, 获得 PACD2-TTI A, C,G,T 质粒(表 1,表 2 )。
[0071] 实施例3
[0072] 以大肠杆菌为宿主测试嗜热II型内含子元件TeI3c_4c的功能:
[0073] 1)温度对TeI3c_4c II型内含子在大肠杆菌中的"归巢"效率的影响 (TeI3c_4c "归巢"试验):
[0074] TeI3c_4c "归巢"试验原理为:DIV区携带含有T7启动子 (acgcgtaatacgactcactataggg)的 TeI3c_4c 内含子供体质粒 pACD2X_TeI3c_4c[15](参见 图4)可以识别并插入具有氨苄抗性的内含子受体质粒pBRR-3C El,E2(exon)位点(表1)。 PBRR-3C质粒El,E2位点后携带一段没有启动子的四环素抗性基因。当供体质粒的TeI3c 内含子"归巢"至受体质粒El,E2位点后,其DIV区携带的T7启动子启动四环素抗性基因 的表达,使得发生内含子"归巢"的大肠杆菌菌株获得四环素抗性,因此"归巢"效率=四环 素+氨苄双抗性菌落数/氨苄抗性菌落数[8]。
[0075] 具体过程为:
[0076] 将供体质粒 pACD2X-TeI3c-4c (ChlK)和受体质粒 pBRR-3c (AmpK)共同转化 E. Coli HMS174(DE3)细胞[15]。转化子培养物在5ml液体氨苄青霉素和氯霉素抗性(AmpK+Chl K) LB培养基37°C,200rpm震荡培养过夜。取5 μ 1过夜培养液转接至相同培养条件培养Ih 后加入500 μ M终浓度的IPTG,置于37°C -48°C培养。培养结束后稀释至合适浓度涂布于氨 苄(AmpK)或氨苄-四环素(AmpK+Tet K)抗性平皿中,37°C培养过夜。供体质粒内含子"归巢" 至受体质粒E1,E2位点后,T7启动子随TeI3c RNA "归巢"至四环素抗性(tetK)基因上游, 即启动该基因的表达,从而使得发生RNA "归巢"的菌株获得四环素抗性,通过检测群落中 四环素抗性转化子的数量即可计算出嗜热targetron在不同温度下的归巢效率。"归巢"效 率=(AmpK+TetK)/AmpK。为了排除自发突变对实验结果的影响,E.Coli HMS174(DE3)对数 期细胞以50%接种量接种于含IPTG的抗性培养基中(AmpK+TetK,500 μ M IPTG)作为对照, 置于上述实验相同温度下培养。
[0077] 使用上述方法测定了 TeI3c-4c在不同的诱导温度下的"归巢"效率(参见图7)。 与1^1.1^池11型内含子"归巢"效率在371:以上迅速的降低不同[8],1^13(3-4(311型内含子 在高温时归巢效率逐渐提高。TeI3 C-4cII型内含子在37°C时基本上没有活性,但当温度提 高至>42°C其归巢效率迅速提高至100% (参见图7)
[0078] 2) Tel3c/4c内含子靶位点识别规律及重新编码:
[0079] ① Tel3c/4c内含子随机打靶实验
[0080] 将上述II型内含子受体质粒PBRR-3C靶位点-35--13/+2-20替换为随机碱基, +1--12为野生型IBS1,IBS2位点替换成随机序列(合成随机序列)。进行TeI3c-4c"归巢" 试验(48°C)。具体过程为:将供体质粒pACD2X-TeI3c-4c (ChlR)和受体质粒pBRR-3c (随 机,AmpK)共同转化E. Coli HMS174(DE3)细胞。转化子培养物在5ml液体氨苄青霉素和氯 霉素抗性(AmpK+Chl K) LB培养基37°C,200rpm震荡培养过夜。取5 μ 1过夜培养液转接至 相同培养条件培养Ih后加入500 μ M终浓度的IPTG,置于48°C培养。培养结束后稀释至合 适浓度涂布于氨苄(AmpK)或氨苄-四环素(Amp K+TetK)抗性平皿中,37°C培养过夜。挑取四 环素/氨苄抗性的菌落进行测序,分析TeI3c-4c II型内含子高温条件下(48°C )插入位点 的碱基偏好性。
[0081] TeI3c-4c对靶DNA位点的识别由TeI3c RNA(图6)和RT酶共同决定(如图8所示)。 TeI3c RNA可以识别靶DNA位点任意的IBS1,IBS2, IBS3序列但必须与TeI3c RNA EBS1, EBS2,EBS3满足Watson-Crick碱基互补配对原则(图8A)。如图8-A所示TeI3c EBSl, 2位 点分别由6个和5个碱基组成且EBS2与EBSl间隔两个随机碱基,EBS3仅由1个碱基组成, 因此DNA祀位点IBS1,2, 3应由14个随机碱基组成(即ηηηηηηηηηηηηηη,η代表随机碱基, 图8-Α)。另外,随机打靶实验表明TeI4c RT酶对IBS2上游-14, -15, -16位的WAA(W=A/ T)碱基具有偏好性(如图8-B),因此由TeI3c RNA(图6)和RT酶共同决定的识别序列为 WAAnnnnnnnnnnnnnn(W=A/T, n=A/T/G/C)〇
[0082] 仔细观察TeI3c II型内含子的二级结构我们发现(图6),RNA内部IBS3序列距离 IBS1,2 (RNA),EBS1,2, 3序列较远,不能通过一次突变PCR重新编码。又因为针对A,G,C,T 四种不同IBS3(DNA)的打靶质粒pACD2-TTlA,G,C,T归巢效率为22%-106% (图8-C),且 EBS3-IBS3为U-A配对时归巢效率为100%。因此,为了方便嗜热II型内含子打靶载体的重 新编码,进而规定IBS3(DNA)为A,即TeI3c_4c识别序列为:WAAnnnnnnnnnnnnnA。
[0083] ②Thermotargetron载体重新编码
[0084] 嗜热II型内含子打靶载体重新编码是指:根据特异DNA靶 点(WAAnnnnnnnnnnnnnA) 突变TeI3c_4c II型内含子革巴DNA识别序列 (EBS1,2, 3-IBS1,2, 3(RNA)),获得特异DNA靶位点打靶载体的过程,通常分为三步:1)在靶 基因内部寻找WAAnnnnnnnnnnnnnA识别位点;2)根据识别位点IBS2, I (DNA),使用PCR方 法突变 TeI3c RNA 中的 EBS2, 1-IBS2, I (RNA) ;3) SpeI-BsiWI 双酶切 PCR 片段(? 400-bp) 替换打靶载体的对应区域(参见图5)。
[0085] ③Tel3c/4c内含子失活大肠杆菌中IacZ基因
[0086] 根据TeI3c_4c II型内含子的祀DNA序列识别规律(WAAnnnnnnnnnnnnnA)构建了 基于实施例2中pA⑶2X-TT1A质粒的3个大肠杆菌β -半乳糖苷酶基因(IacZ)失活载体: lacZ60a,lacZ369a和lacZ2586a (图9,表I) (a, s分别表示识别序列在反、正义链;阿拉伯 数字表示TeI3c插入位点p ;令基因起始密码子第一位至IBS3 (包括A)的碱基数为n,当 插入s链时p=n-l,插入a链时p=n)。IacZ基因打祀载体构建仅需简单三步:1)在IacZ基 因序列中寻找WAAnnnnnnnnnnnnnA内含子识别祀位点(图8) ;2)根据祀位点IBSl, 2 (DNA) 序列,设计重叠 PCR(overlapPCR)引物,突变TeI3c内部EBSl,2;IBSl,2(RNA)序列(表2, 如用于构建 lacZ60a 的引物为 LacZ60aIBS12-TeI3cUNI,LacZ60aEBS2_LacZ60aEBSla,其中 TeI3cUNI为重编码通用引物);3)将重叠 PCR扩增产物SpeI-BsiWI酶切后置换打靶载体中 对应区段,即完成特异基因打靶载体的构建(表1)。
[0087] IacZ基因打靶载体构建完成后,转化E. coli HMS174(DE3)细胞,转化子过夜培养 物转接至LB培养基中48°C培养1小时后使用IPTG诱导15min-lh,获得的培养物稀释涂布 在含有IPTG/X-gal的平皿上。由于IacZ基因可以将无色化合物X-gal(5-溴-4-氯-3-吲 哚-β -D-半乳糖苷)切割成半乳糖和深蓝色的物质5-溴-4-靛蓝,使整个培养菌落变 蓝,该基因失活后在IPTG/X-gal平板上形成的菌落为白色,因此白色菌落与总菌落数的 比值即为IacZ基因的失活效率(图10)。进一步使用lacZ30s/lacZ1850a, lacZ1850s/ lacZ3060a, lacZ3060a/TeI3c608rc,lacZ30s/TeI3c608rc,lacZ1850s/TeI3c420s (表 2)五 对引物检测蓝色或白色克隆(IacZ基因失活后失去将X-gal转化成蓝色显色物质的能力) (图11)。连续传代丢失IacZ突变株thermotargetron质粒,使用southerblot检测是否存 在内含子"脱靶"现象(图12)。
[0088] 通过以上实验测定了 500μΜ IPTG浓度下,不同诱导时间(15min-60min)对TeI3c 对IacZ基因的失活效率的影响。随着IPTG量的增加和诱导时间的延长,白色菌落的数量逐 渐增加(诱导15分钟,IacZ失活率0%-2%,诱导1小时,IacZ失活率14%-51%)(图10)。检 测PCR和测序结果显示,所有白色克隆IacZ基因都被TeI3c-4c intron精确失活(图11)。 另外,southern blot结果显示,lacZ2586a在IPTG不同的诱导阶段,对所有突变株中都为 单插入(图12)。但是当IPTG诱导时间超过30min后lacZ60a,lacZ369a出现了多插入的 情况(即存在TeI3c脱祀现象)。同样的脱祀现象在LL LtrB和EcI5intron中是很少见的 [2, 3]。
[0089] 实施例4
[0090] 使用thermotargetron失活6个热纤梭菌基因:
[0091] pHK-TTIA由大肠杆菌-热纤梭菌穿梭质粒pHK和嗜热II型内含子元件 (TeI3c-4c)组成,其靶向基因失活的原理与LI. LtrB II型内含子相似(图13)。
[0092] 选择了热纤梭菌中6个具有代表性的基因作为thermotargetron失活的革巴 基因,分别为纤维小体脚架蛋白基因 cipA (Cl〇1313_1827),假定的甲酸脱氢酶的基因 hfat (Clol313_2343),假定的氢酶的基因 hyd (C1〇1313_0554),乳酸脱氢酶的基因 Idh (C1〇1313_1160),磷酸乙酰基转移酶的基因 pta (Clol313_1185)和乳清酸核苷-5'磷酸脱 羧酶 PyrF (Clol313_1266)(图 14)。
[0093] 参照基因打祀载体重新编码的步骤构建了 7个termotargetron基因打革巴载 体(图14,表1,表2),分别为:pHK-TTlA-CipA1827s (举例,参照载体重编码步骤,使用 CipA1827sIBS12-TeI3cUNI,CipA1827sEBS2-CipA1827sEBSla 引物构建),pHK-TTlA-Hfatl6 5s,pHK-TTlA-Hydl525a,pHK-TTlA-Ldh309s,pHK-TTlA-Ldh508s,pHK-TTlA-Pta318a,pHK-T TlA_PyrF281s(表1,表2)。将7个thermotargetron打祀载体,分别转化热纤梭菌DSM1313 菌株。转化子使用PCR检测(图15,表2),并进一步Southerblot验证(图16)。测序突变 株培养液转接至4ml无抗性GS-2培养基中,连续传代至质粒丢失。质粒丢失后使用TeI3c 特异探针(TeI3c539_710nt,172bp,probel72_F/R 表 2) Southerblot (DIG-High Prime DNALabeling Detection Starter Kit I,Roche)检测 TeI3c 在突变株基因组中的拷贝数。
[0094] Thermotargetron质粒转化热纤梭菌的效率通常为50-200CFU/ μ g DNA。转化子 使用插入位点两侧或内侧引物直接检测TeI3c II型内含子在靶位点的插入情况(图15,表 2)。PCR结果表明thennotargetiOn对靶基因进行的正确的失活且效率为67%-100%(图14) (打靶效率等于基因失活克隆数与检测克隆数的比值)。对突变株的Southemblot结果表 明 Cipal827s,Pta318a,Ldh508s,Hfatl65s 为单插入突变株;Ldh309s,Pyrf281s,Hydl525a 为多插入突变株。单插入率为57% (图16)。
[0095] 参考文献
[0096] I. Lambowitzj A. M. and S. Zimmerlyj Group II Introns:Mobile Ribozymes that Invade DNA. Cold Spring Harbor Perspectives in Biology,2011. 3 (8).
[0097] 2. Heap, J. T. , et al. , The ClosTron: a universal gene knock-out system for the genus Clostridium. J Microbiol Methods, 2007. 70(3):p. 452-64.
[0098] 3. Heap, J. T. , et al. , The ClosTroniMutagenesis in Clostridium refined and streamlined. J Microbiol Methods, 2010. 80 (I) :p. 49-55.
[0099] 4. Lambowitzj A. M. and S. Zimmerlyj Group II introns:mobile ribozymes that invade DNA. Cold Spring Harbor perspectives in biology, 2011. 3(8):p. a003616.
[0100] 5. Malik, H. S. , W. D. Burke, and T. H. Eickbushj The age and evolution of non-LTR retrotransposable elements.Molecular biology and evolution,1999. 16(6) :p. 793-805.
[0101] 6. BLOCKER, F. J. , et al. , Domain structure and three-dimensional model of a group II intron-encoded reverse transcriptase. RNAj 2005. 11 (I):p. 14-28.
[0102] 7. Crooks, G. E. , et al. , WebLogo: a sequence logo generator. Genome research ,2004. 14(6) :p. 1188-1190.
[0103] 8. Mohr, G. , E. Ghanemj and A. M. Lambowitzj Mechanisms used for genomic proliferation by thermophilic group II introns. PLoS biology, 2010.8 (6):p. el000391.
[0104] 9. Johnson,E. A.,A. Madia,and A. L Demain,Chemically Defined Minimal Medium for Growth of the Anaerobic Cellulolytic Thermophile Clostridium thermocellum. Appl Environ Microbiol, 1981. 41 (4) :p. 1060-2.
[0105] 10. Tyurinj Μ. V. , L. R. Lyndj and J. Wi e ge I, I 3Gene Transfer Systems for Obligately Anaerobic Thermophilic Bacteria. Methods in Microbiology, 2006. 35:p. 309-330.
[0106] 11. Olson, D. G. and L. R. Lyndj Transformation of Clostridium thermocellum by electroporation. Methods in enzymology, 2012:p. 317-330.
[0107] 12. Nakamura, Y. , et al·,Complete genome structure of the thermophilic cyanobacterium Thermosynechococcus elongatus BP-1.DNA Research,2002. 9(4) :p. 123-130.
[0108] 13. Zhuangj F. L. , et al.,EcI5,a group IIB intron with high retrohoming frequency:DNA target site recognition and use in gene targeting.Rna~a Publication of the Rna Society,2009.15 (3):p. 432-449.
[0109] 14. Maij V. , W. W. Lorenz, and J. Wiegelj Transformation of Thermoanaerobacterium sp.strain JW/SL-YS485with plasmid pIKMlconferring kanamycin resistance. Fems Microbiology Letters, 1997. 148(2):p. 163-167.
[0110] 15. Adams, J. J. , et al. , Mechanism of bacterial cell-surface attachment revealed by the structure of cellulosomal type II cohesin-dockerin complex. Proceedings of the National Academy of Sciences of the United States of America, 2006. 103 (2) :p. 305-310.
[0111] 16. Fontesj C. M. and H. J. Gilbert, Cel lulosome s : hi ghly efficient nanomachines designed to deconstruct plant cell wall complex carbohydrates. Annual review of biochemistry, 2010. 79:p. 655-681.
[0112] 17. Guoj H. , et al. , Group 11 introns designed to insert into therapeutically relevant DNA target sites in human cells. Science, 2000. 289(5478 ):p. 452-457.
[0113] 表I质粒列表

【权利要求】
1. 一种适用于嗜热微生物遗传改造的基因元件,其特征在于:元件为嗜热II型内含子 元件TeI3c-4c,其由序列表SEQ ID NO. 1和2中核酸序列所示。
2. -种适用于嗜热微生物遗传改造的载体,其特征在于:载体为具有嗜热微生物遗传 改造的基因元件打靶载体,其含有复制起始位点、耐热复制蛋白、多克隆位点、嗜热II型内 含子元件TeI3c_4c和启动子元件。
3. 按权利要求2所述的适用于嗜热微生物遗传改造的载体,其特征在:所述嗜热II型 内含子元件TeI3c-4c为序列表SEQ ID NO. 1和2中核酸序列所示;启动子源于嗜热微生物 启动子。
4. 一种嗜热微生物遗传改造的应用,其特征在于:利用所述嗜热微生物遗传改造的基 因元件打靶载体应用于嗜热微生物中,进而使嗜热微生物基因靶向失活。
5. 按权利要求4所述的嗜热微生物遗传改造的应用,其特征在于:由所述嗜热微生物 遗传改造的基因元件打靶载体中基因元件与嗜热微生物的识别位点结合,进而使嗜热微生 物基因靶向失活。
6. 按权利要求5所述的嗜热微生物遗传改造的应用,其特征在于:所述识别位点为1) 革巴DNA识别位点17个碱基具有WAAnnnnnnnnnnnnnn (W=A或Τ,N=A, T, G, C)特征,确保能够 被TeI3c-4c正确识别;2) TeI3c-4c II型内含子元件EBS1,2, 3与靶序列IBS1,2, 3(DNA) 满足Watson-Crick碱基互补配对原则,确保能被RNA正确识别。
7. 按权利要求6所述的嗜热微生物遗传改造的应用,其特征在于:所述识别位点为 WAAnnnnnnnnnnnnnA/T/G/C,W代表A或T碱基,η代表任意碱基,A/T/G/C表示EBS3序列可 以为任意一种碱基。
【文档编号】C12N15/63GK104293777SQ201410155715
【公开日】2015年1月21日 申请日期:2014年4月17日 优先权日:2013年4月17日
【发明者】崔球, 洪伟, 乔治·莫尔, 艾伦·莱伯维兹, 刘亚君, 冯银刚 申请人:中国科学院青岛生物能源与过程研究所, 德克萨斯大学体系董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1