利用CRISPR/Cas9对线粒体基因组进行靶向编辑的方法与流程

文档序号:12097550阅读:12054来源:国知局
利用CRISPR/Cas9对线粒体基因组进行靶向编辑的方法与流程

本发明属于生物技术领域,具体涉及一种利用CRISPR/Cas9技术对线粒体基因组进行靶向编辑的方法。



背景技术:

线粒体是真核细胞的重要细胞器,能产生绝大多数细胞所需的能量。除了提供能量,线粒体也参与了多种细胞功能作用,包括细胞周期和生长的控制、信号传递、细胞分化、细胞死亡等的调控作用。线粒体基因组为双链环状基因组,即mtDNA,其突变会累及多种组织和器官,最终导致各种疾病。在大部分情况下,突变型mtDNA与野生型mtDNA共同存在,称为mtDNA异质性。当突变型的基因组比例超过80%即可表现出某些线粒体疾病的临床症状。常见的线粒体病包括线粒体肌病、线粒体脑病和线粒体脑肌病等。比较典型的疾病如Leber遗传性视神经病(LHON),这种疾病的主要症状为视神经退行性病变,是一种急性或者亚急性发作的母系遗传病,在男性中较多见。目前在线粒体中发现大约有700多种突变,已知有200多种疾病由线粒体DNA突变引起,受这些突变影响的主要是需要大量能量的器官,包括心脏、骨骼肌和大脑,综合征通常也首先表现在这些部位上。调查数据显示,全球每200名婴儿中,就有一人会受到母亲线粒体基因影响,每6500名婴儿中便有一名会因线粒体基因缺陷患上严重疾病。线粒体功能受到核基因组和线粒体基因组共同作用,因此,mtDNA异质性的形成到引起相应的表型是一个复杂的过程。这使得线粒体遗传疾病的治疗变得异常困难。

目前在分子水平上已经发展出两种消除线粒体位点突变的方法,即:限制性内切酶选择性靶向突变的线粒体DNA和利用ZFN /TALEN技术编辑线粒体基因组。

如果某些mtDNA部位突变成限制性内切酶位点,则可以运用限制性内切酶选择性靶向突变的线粒体DNA的方法,选择性地降解突变mtDNA。例如人源线粒体ATPase6基因T8993G位点突变会产生新的唯一的SmaI位点。2002年,TANAKA M等在限制性内切酶SmaI基因中添加线粒体定位信号,在细胞的核基因表达体系中表达后可被转运入线粒体,导入内切酶SmaI使突变的线粒体DNA显著减少。因此,在特定的突变位点将特定的内切酶基因输送给相应患者有望降低突变mtDNA的比例。使用该基因编辑方法的前提是线粒体基因突变后必需产生新的特定的内切酶位点。然而在线粒体基因组约16.5kb的序列中很难找出单一的突变酶切位点,这也使实际可操作的mtDNA突变很有限。

2006年Aaron Klug研究组首次利用ZFN(Zinc-Finger Nuclease)技术对线粒体基因组进行敲除。研究组针对线粒体ATPase6基因T8993G位点进行敲除,成功拯救ATPase6基因的部分活性。2008年Aaron Klug研究组利用这一技术对ATPase6基因T8993G位点进行敲除,进一步直接观测到ATPase6基因T8993G突变位点的线粒体拷贝数显著降低。

2013年,迈阿密大学米勒医学院的Carlos T. Moraes博士首次将TALENs技术用于线粒体基因编辑。他们的研究表明:一旦mitoTALENs与特定靶点的DNA结合并切割,突变的mtDNA就被降解。总mtDNA的下降会刺激细胞通过复制未受影响的线粒体基因组来增加其mtDNA。两周之后,mtDNA水平恢复正常。由于突变的mtDNA被剔除,正常的mtDNA得以保留并扩增,因此,细胞中线粒体大部分带有正常的mtDNA。

CRISPR/Cas9技术是近年来发展起来的一种新的基因编辑技术。在打靶过程中,CRISPR/Cas9系统通过sgRNA-Cas9体系使间区序列邻近基序(Protospacer Adjacent Motif,PAM)3′端前与sgRNA互补的目标DNA产生双链断裂(Double-Strand Breaks,DSB),之后细胞通过非同源末端连接(Non- Homologous End Joining,NHEJ) 或者同源介导的双链DNA修复(Homology-Directed Repair,HDR)对DNA进行修复,以实现对基因组的改造。相较于ZFN /TALEN技术, CRISPR/Cas9技术具有更大的优势,它更易于操作,也具有更强的扩展性,被广泛应用于各种研究对象。对于转染效率较低的细胞,CRISPR/Cas9系统也能够通过慢病毒侵染的方式将相应的载体导入细胞。而TALENs技术出于可能发生重组突变的顾虑,而不适用于通过慢病毒载体侵染进行细胞感染。CRISPR/Cas9系统也很好地解决了TALENs系统载体过大的问题。

2010年,Michael A. Teitell教授发现一种称为多核苷酸磷酸化酶(PNPASE)的蛋白在调节RNA进入线粒体时发挥重要作用。降低PNPASE的表达会影响RNA进入线粒体的水平,从而影响维持电子传递连所需蛋白的合成。同时,未经加工的线粒体RNA会积聚起来,蛋白翻译会受抑制,能量的产生受到阻碍,这将导致细胞生长的停滞。在此基础上,2012年,Michael A. Teitell等首次通过靶向定位RNA纠正了人类线粒体突变缺陷,这将有助于线粒体相关疾病的治疗。研究人员首先选择稳定的修复RNA,使之从细胞核中出来,定位在线粒体外膜上,然后设计一段输出序列,帮助RNA进入线粒体。一旦RNAs出现在线粒体表面的运送器附近,那么就用第二段输送序列(RP序列)引导RNA进入线粒体。有了这两段序列,就能靶向广谱RNAs,引导其进入线粒体。研究证明这种方法能高效的引导外源RNA进入线粒体。

本发明介绍了一种对线粒体基因进行敲除的全新方法。在以上工作基础上,我们对CRISPR/Cas9技术进行了改造,即改造Cas9和sgRNA,使改造后的CRISPR/Cas9系统具备进入线粒体的能力,从而对线粒体基因组上的特异基因或位点进行打靶,实现对线粒体特定基因、其突变基因或位点的敲除及修饰。因此,应用我们所开发的对线粒体基因进行编辑的CRISPR/Cas9技术,有可能更方便地清除线粒体内突变DNA,从而有望治疗多种线粒体病。



技术实现要素:

本发明的目的在于提供一种简单方便的线粒体基因组上特异基因或位点进行靶向编辑的方法。该方法利用改造的CRISPR/Cas9系统精确打靶线粒体基因组上特异基因或位点,避免了其他方法中构建载体的繁琐流程,大大降低构建载体的时间,极大地提高了基因敲除或修饰改造的效率。

本发明采用如下技术方案:

利用CRISPR/Cas9对线粒体基因组进行靶向编辑的方法,包括如下步骤:

(1)构建MitoCRISPR载体;

(2)将特异基因的sgRNA插入到MitoCRISPR载体上构建线粒体基因编辑载体;基因编辑包括了基因敲除和基因修饰改造;

(3)将上述线粒体基因编辑载体导入人或动物细胞如293T细胞,进行线粒体基因组敲除或修饰, 达到敲除或修饰目标基因的目的;

所述构建MitoCRISPR载体的方法为,在骨架质粒载体PX459上做如下改造,骨架质粒载体包含CRISPR系统的基本元件,即Cas9蛋白基因和U6启动子;在U6启动子后添加促进外源RNA进入线粒体的信号序列,即3’UTR序列;3’UTR序列帮助稳定RNA,使之能从细胞核中出来,定位在线粒体外膜上;然后,加入RP序列,以帮助RNA进入线粒体;接着,去掉Cas9基因前的核定位信号,添加促进外源蛋白进入线粒体的信号序列,即MLS序列;最终得到了11个可用于进行线粒体基因组特异基因编辑的MitoCRISPR质粒载体。

步骤(2)具体方法为:选取步骤(1)其中一种MitoCRISPR质粒为骨架,在限制性内切酶BbsI位点上插入目标基因或位点的sgRNA序列,构建线粒体基因敲除或编辑载体。

步骤(3)具体方法为:将步骤(2)获得的质粒敲除载体导入人或动物细胞,3天后提取细胞全基因组,利用实时荧光定量PCR检测线粒体基因组拷贝数变化,以评估MitoCRISPR系统针对线粒体基因组的敲除效率;或者经DNA测序确定基因编辑的效果。

其中,构建MitoCRISPR载体pMitoCRISPR-1载体方法为:在U6启动子后加上线粒体定位信号MRPS12基因的3’UTR序列,以增强转录出sgRNA的稳定性,构建了pMito-U6- BbsI-3’UTR的质粒;接着,去掉Cas9基因前的核定位信号,加上线粒体定位信号,Cox8A基因的线粒体定位信号,以帮助Cas9蛋白进入线粒体,构建出pMito-U6-RP-BbsI-3’UTR -CBh-MLS-Cas9质粒;然后在Cas9后加上EGFP,以便于观察转染效率。同时在Cas9表达框后加上线粒体定位信号MRPS12基因的3’UTR序列,以稳定整个结构。得到了从5’-3’端带有如下组件U6-RP-BbsI-3’UTR-CBh-MLS-Cas9 -2A-GFP-3’UTR的pMitoCRISPR1质粒载体。MitoCRISPR质粒上包含CRISPR系统的基本元件,即Cas9基因和U6启动子启动的引导RNA组件;载体上的3’UTR序列帮助稳定RNA,使之能从细胞核中出来,定位在线粒体外膜上,然后RNA5’端的输入序列-RP序列,帮助RNA进入线粒体;一旦3’UTR序列帮助RNAs出现在线粒体表面,那么就用RP序列引导RNA进入靶向线粒体。

所获得的MitoCRISPR质粒载体按5’端→3’端顺序,包含如下基因表达及调控元件:U6启动子,用于控制sgRNA的表达;BbsI,限制性内切酶位点,可用于插入目标基因的sgRNA序列;3’UTR, 用于增强sgRNA在线粒体外膜上的稳定性; CBh,为鸡β-actin基因启动子元件,用于控制Cas9蛋白的表达; Cas9,为Cas9核酸酶,用于sgRNA引导的基因切割、修饰与整合;UTR2,用于稳定Cas9的mRNA; 2A,为自剪切肽;GFP,绿色荧光蛋白基因。

所获得的MitoCRISPR质粒载体还包含RP序列,用于引导sgRNA进入线粒体,RP序列可以位于sgRNA前、sgRNA与3’UTR之间、或者3’UTR之后。

在骨架质粒载体上添加的基因表达及调控元件包括: 3’UTR序列、RP序列、MLS线粒体定位信号和2A序列,如下所列。

Cox8A-3’UTR:AGGGGTCCGTTCTGTCCCTCACACTGTGACCTGACCAGCCCCACCGGCCCATCCTGGTCATGTTACTGCATTTGTGGCCGGCCTCCCCTGGATCATGTCATTCAATTCCAGTCACCTCTTCTGCAATCATGACCTCTTGATGTCTCCATGGTGACCTCCTTGGGGGTCACTGACCCTGCTTGGTGGGGTCCCCCTTGTAACAATAAAATCTATTTAAACTTT。

SOD2-3’UTR:

ACCACGATCGTTATGCTGATCATACCCTAATGATCCCAGCAAGATAATGTCCTGTCTTCTAAGATGTGCATCAAGCCTGGTACATACTGAAAACCCTATAAGGTCCTGGATAATTTTTGTTTGATTATTCATTGAAGAAACATTTATTTTCCAATTGTGTGAAGTTTTTGACTGTTAATAAAAGAATCTGTCAACCATCAA。

MRPS12-3’UTR:

CAGAAGAAGTGACGGCTGGGGGCACAGTGGGCTGGGCGCCCCTGCAGAACATGAACCTTCCGCTCCTGGCTGCCACAGGGTCCTCCGATGCTGGCCTTTGCGCCTCTAGAGGCAGCCACTCATGGATTCAAGTCCTGGCTCCGCCTCTTCCATCAGGACCAC。

ATP5B-3’UTR:

GGGGTCTTTGTCCTCTGTACTGTCTCTCTCCTTGCCCCTAACCCAAAAAGCTTCATTTTTCTGTGTAGGCTGCACAAGAGCCTTGATTGAAGATATATTCTTTCTGAACAGTATTTAAGGTTTCCAATAAAATGTACACCCCTCAG。

ATP5B-MLS:ATGTTGGGGTTTGTGGGTCGGGTGGCCGCTGCTCCGGCCTCCGGGGCCTTGCGGAGACTCACCCCTTCAGCGTCGCTGCCCCCAGCTCAGCTCTTACTGCGGGCCGCTCCGACGGCGGTCCATCCTGTCAGGGACTATGCG。

Cox8A-MLS:ATGTCCGTCCTGACGCCGCTGCTGCTGCGGGGCTTGACAGGCTCGGCCCGGCGGCTCCCAGTGCCGCGCGCCAAGATCCATTCGTTG。

RP:TCTCCCTGAGCTTCAGGGAG。

2A:GGCAGTGGAGAGGGCAGAGGAAGTCTGCTAACATGCGGTGACGTCGAGGAGAATCCTGGCCCA。

以上不同组合与所列元件将构建得11个MitoCRISPR质粒载体,即pMitoCRISPR1到pMitoCRISPR11(图1)。sgRNA,即单链引导RNA,单链引导RNA序列为用于线粒体基因敲除及修饰的目标序列。

所述的构建MitoCRISPR载体pMitoCRISPR1-pMitoCRISPR11方法为:在Cas9基因N端引入了两个AgeI的限制性酶切位点,接着,我们在AgeI酶切位点上置换两种不同的MLS:Cox8A-MLS和ATP5B-MLS;在MitoCRISPR质粒载体的SpeI限制性内切酶位点上可以置换四种不同的3’UTR:MRPS12-3’UTR, Cox8A-3’UTR, SOD2-3’UTR和ATP5B-3’UTR。在U6启动子后面的不同位置添加RP序列: RP -sgRNA, RP -3’UTR, 3’UTR-RP(+)和3’UTR-RP(-)。共获得11种不同的MitoCRISPR载体,其中pMitoCRISPR1-pMitoCRISPR4带有Cox8A-MLS序列;pMitoCRISPR5-pMitoCRISPR8带有ATP5B-MLS-MLS序列;pMitoCRISPR1和pMitoCRISPR5带有MRPS12-3’UTR序列;pMitoCRISPR2和pMitoCRISPR6带有Cox8A-3’UTR序列;pMitoCRISPR3和pMitoCRISPR7带有SOD2-3-3’UTR序列;pMitoCRISPR4和pMitoCRISPR8带有ATP5B-3’UTR序列;pMitoCRISPR9的RP序列在sgRNA和3’UTR中间;pMitoCRISPR10的RP序列为正向在3’UTR后面;pMitoCRISPR11的RP序列为反向在3’UTR后面。所构建的pMitoCRISPR1到pMitoCRISPR11质粒部分结构简示在图1中。pMitoCRISPR1载体全序列如SEQ ID No.1所示。

构建线粒体基因组目的基因敲除载体方法为:选取上述其中一种MitoCRISPR质粒为骨架,在限制性内切酶BbsI位点上插入目标基因或位点的sgRNA序列,构建线粒体基因敲除重组载体。以pMitoCRISPR1质粒载体为例,具体为pMitoCRISPR1质粒载体经BbsI限制性内切酶酶切,然后用乙醇沉淀纯化出酶切载体;接着将含有RP序列的sgRNA目标基因序列经退火后与酶切的pMitoCRISPR1质粒载体进行连接。连接后的载体经转化,挑菌,鉴定得到重组载体。如本发明针对人线粒体基因组的12sr RNA和Cytb基因各设计一个sgRNA,构建了pMitoCRISPR1-KO-12sr RNA和pMitoCRISPR1-KO-Cytb的质粒。

在人或动物细胞如293T细胞中编辑线粒体基因组具体方法为:利用脂质体转染技术将上述pMitoCRISPR1-KO-12sr RNA和pMitoCRISPR1-KO-Cytb质粒分别转染293T细胞,3天后提取细胞全基因组,利用实时荧光定量PCR检测线粒体基因组拷贝数变化,以评估MitoCRISPR系统针对线粒体基因组的敲除效率。上述实时荧光定量PCR检测所用的引物如下:H-12sr RNA-qpcr-F: 5’-CTCACCACCTCTTGCTCAG-3’,H-12sr RNA-qpcr-R: 5’-GGCTACACCTTGACCTAACG-3’;β-actin用作内参对照。

本发明的优点在于:

1、所建立的MitoCRISPR质粒载体系统具有各种调控组件,包括U6- RP-BbsI-3’UTR-CBh- MLS -Cas9-2A-GFP- 3’UTR,可以满足需要插入的目标sgRNA序列及用于基因切割的Cas9在线粒体内的稳定表达及作用;在MitoCRISPR质粒载体所建立的含目标sgRNA序列的线粒体基因敲除载体,同时拥有sgRNA表达元件和Cas9基因表达元件,比二者分离的双质粒转染系统转染效率高。

2、MitoCRISPR质粒载体上拥有多个限制性内切酶切割位点,各个调控元件可以轻松替换。3、MitoCRISPR质粒载体选取了一个特殊的限制性内切酶位点即Bbs I酶切位点,可以插入目标sgRNA序列,以防止载体自连。合成的寡核苷酸退火后直接与酶切载体连接。采用此方法做克隆,sgRNA的连接效率高达90%以上。4、载体上带有用于筛选的EGFP基因,可以对转染的细胞进行筛选或者观察转染效率。且GFP和Cas9蛋白之间靠自剪切多肽T2A连接,可以使GFP蛋白与Cas9蛋白表达分离;一方面能控制载体大小,另一方面不影响Cas9蛋白的活性。5、该载体上拥有MLS序列,即Mitochondrial Localization Sequence,以引导Cas9蛋白进入线粒体。6、该载体系统上拥有有两个特殊的元件:RP序列和3’UTR序列。首先载体上的3’UTR序列帮助稳定的RNA,使之能从细胞核中出来,定位在线粒体外膜上,然后RNA5’端的一段输入序列-RP序列,帮助RNA进入线粒体。一旦3’UTR序列帮助RNAs出现在线粒体表面,那么就用RP序列,即运输序列就可以引导RNA进入靶向线粒体。有了这两段序列,就能靶向sgRNA,引导其进入线粒体,编辑线粒体基因组。7、该系统优化了不同的MLS序列以及3’UTR序列。我们在该系统中使用了Cox8A-MLS和ATP5B-MLS;使用了MRPS12-3’UTR,ATP5B-3’UTR,Cox8A-3’UTR,以及SOD2-3’UTR 。构建了整套的MitoCRISPR质粒载体系列,用于插入整合不同的sgRNA,可以测试不同MitoCRISPR质粒载体所构建的含目标sgRNA序列的线粒体基因敲除或基因修饰载体的基因敲除或修饰效率,从而选定较优的载体用于进一步的研究或实际应用。8、该系统优化了RP序列在MitoCRISPR系统中的位置,以排除其对系统中蛋白功能表达的影响。我们测试了RP序列分别放在了sgRNA序列前、3’UTR序列前以及3’UTR后面,观察了RP序列所在位置对MitoCRISPR功能的影响,确定了RP序列在3’UTR序列后面,其基因敲除或修饰的效果最好。

附图说明

图1 pMitoCRISP1载体质粒图谱。图a为pMitoCRISPR1载体,包含Cas9和sgRNA表达元件,Amp抗性基因以及pBR322和F1复制起点;图b为不同MLS以及3’UTR元件组合所获得的11个pMitoCRISPR载体,即pMitoCRISPR1到pMitoCRISPR11图,其中A:MRPS12-3’UTR,B:ATP5B-3’UTR,C:COX8A-3’UTR,D:SOD2-3’UTR,E:COX8A-MLS,F:ATP5B-MLS,U6:U6启动子,RP:RP序列,Bbsl:限制性内切酶酶切位点,3‘UTR:3‘端非编码区,CBH:CBH启动子,MLS:MLS序列,Cas9:Cas9蛋白基因,EGFP:绿色荧光蛋白基因。

图2 MitoCRISPR载体中Cas9表达元件功能验证,Non为空白对照;MitoCRISPR为线粒体基因敲除的空载体;MitoCRISPR-KO-12sr RNA和MitoCRISPR-KO-Cytb的质粒为针对人线粒体的12sr RNA和Cytb基因的敲除载体。为了验证MitoCRISPR质粒是否有效,我们针对293T细胞线粒体的12sr RNA和Cytb基因各设计一个sgRNA,构建了MitoCRISPR-KO-12sr RNA和MitoCRISPR-KO-Cytb的质粒。将上述两个质粒分别导入细胞之后检测EGFP蛋白的表达情况。

图3 Cas9蛋白线粒体定位。其中对照为Mitotrack染料对线粒体染色的对照;NLS-Cas9为核定位的Cas9蛋白定位对照;MitoCRISPR为对线粒体定位的Cas9蛋白定位。

图4 sgRNA和Cas9表达验证。图a表示293T细胞分别转染pMitoCRISPR1和pMitoCRISPR1-KO-12sr RNA质粒后,RT-PCR检测sgRNA在线粒体内表达;图b表示分别转染pMitoCRISPR1-KO-RP,pMitoCRISPR1, pMitoCRISPR1-KO-12sr RNA和pMitoCRISPR1-KO-Cytb质粒后,Western Blot检测Cas9在该细胞中的表达情况。

图5 针对线粒体12sr RNA基因位点的敲除,qPCR分析细胞内线粒体基因组的拷贝数变化。其中Mock为对照组,EG为实验组;MitoCRISPR为未加sgRNA对照,KO-12Sr RNA和KO1-12Sr RNA为组间对照。

图6 针对线粒体Cytb基因位点的敲除,qPCR分析细胞内线粒体基因组的拷贝数变化。其中Mock为对照组,EG为实验组;MitoCRISPR为未加sgRNA对照,KO-cytb和KO1-cytb为组间对照。

图7 MitoCRISPR系统中不同基因的MLS元件对线粒体基因敲除的影响。其中Mock为对照组;MitoCRISPR为未加sgRNA对照,pMitoCRISPR1-Cox8A-MLS-KO-12sr RNA和pMitoCRISPR5-ATP5B-MLS-KO-12sr RNA为不同的MLS元件对照。

图8 MitoCRISPR系统中RP序列的位置对线粒体基因敲除的影响。其中Mock为对照组;MitoCRISPR为未加sgRNA对照,pMitoCRISPR1-RP-sgRNA-KO-12sr RNA,pMitoCRISPR1- RP-3’UTR -KO-12sr RNA,p MitoCRISPR1 -3’UTR- RP(+)-sgRNA-KO-12sr RNA和pMitoCRISPR1 -3’UTR- RP(-)-KO-12sr RNA为RP序列不同位置的实验组。

图9 MitoCRISPR系统中不同基因的3’UTR元件对线粒体基因敲除的影响。其中Mock为对照组;MitoCRISPR为未加sgRNA对照,pMitoCRISPR2-Cox8A-3’UTR-KO-12sr RNA, pMitoCRISPR3-SOD2-3’UTR-KO-12sr RNA, pMitoCRISPR1-MRPS12-3’UTR-KO-12sr RNA和pMitoCRISPR4-ATP5B-3’UTR-KO-12sr RNA为不同的3’UTR元件实验组。

具体实施方式

实施例1 MitoCRISPR质粒载体的构建

首先我们在U6启动子后加上线粒体定位信号MRPS12基因的3’UTR信号。构建Mito-U6-RP-BbsI-3’UTR的质粒。接着去掉Cas9基因前的核定位信号,加上Cox8A的线粒体定位信号,即MLS序列,构建Mito-U6-RP-BbsI-3’UTR -CBh-MLS-Cas9的质粒。然后在Cas9后加上EGFP基因,以便于观察转染效率。同时在Cas9表达框后加上MRPS12的3’UTR信号,以稳定所表达的Cas9 mRNA整个结构。最终得到了Mito-U6-RP-BbsI-3’UTR-CBh-MLS-Cas9 -2A-GFP-3’UTR(MitoCRISPR)质粒载体,即p MitoCRISPR1(图1a)。

具体为:

(1)用于控制sgRNA表达的元件的导入:在PX459载体的U6启动子后加上RNA的线粒体定位信号RP序列和起稳定作用的MRPS12的 3’UTR信号序列,成功构建了Mito-U6-RP-gRNA-3’UTR载体。

具体方法为:首先合成gRNA骨架和MRPS12的3’UTR信号。同时在MRPS12的3’ UTR信号两端加上酶切位点,以便更换不同的3’ UTR信号。gRNA-3’UTR如下:

5’-AGGACGAAAcaccggGTCTTCgaGAAGACctgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcCAGAAGAAGTGACGGCTGGGGGCACAGTGGGCTGGGCGCCCCTGCAGAACATGAACCTTCCGCTCCTGGCTGCCACAGGGTCCTCCGATGCTGGCCTTTGCGCCTCTAGAGGCAGCCACTCATGGATTCAAGTCCTGGCTCCGCCTCTTCCATCAGGACCACACTAGTTTTTTTagcgcgtgcgccaattctgcagacaaatggctctagaggtacccg-3’。其中粗体为BbsI酶切位点,用于sgRNA和RP序列的插入,BbsI的酶切位点;斜体为MRPS12的3’UTR信号。

接着扩增gRNA-3’UTR片段,以便连接到PX459载体骨架上。所用引物如下:

INFUSION-F:5’-atcttGTGGAAAGGACGAAACACCGGGTCTTCGAGAAGA-3’,

INFUSION-R:5’-GTAAGTTATGTAACGGGTACCTCTAGAGCCATTTGTCTGCAG-3’

用TaKaRa的PCR反应试剂盒进行PCR扩增,条件如下:反应体系设置为20 μl:模板 1μl、Pfu聚合酶 0.1μl,10×Pfu 缓冲液 2μl,dNTP 1.6μl,引物INFUSION-F与INFUSION-R各0.4 μl,ddH2O 15.5μL,反应温度梯度为94℃,5 min;94℃,30 s;55℃,30 s;72℃,30 s;72℃,5 min;然后以PX459载体为骨架,用BbsI和kpnI双酶切使之线性化。此外,为保留BbsI酶切位点,sgRNA表达框的序列需用IN-fusion的方法连入载体。利用BbsI和KpnI限制性内切酶把载体上的序列切除,然后用IN-Fusion的方法把合成的序列无缝连接到PX459载体上。IN-Fusion反应体系如下:分别向PCR管加入线性化的载体 2μL、插入sgRNA-3’UTR片段 5μL、ddH2O 3μL,共10μL,轻轻混匀后离心。50℃反应15min。接着转化,挑取单克隆菌株、提取质粒DNA,通过测序鉴定获得的重组质粒pMito-U6-RP-gRNA-3’UTR。

(2)用于控制Cas9表达元件的导入:接着,在上述pMito--U6-RP-gRNA-3’UTR去掉Cas9基因前的核定位信号,替换成Cox8A的线粒体定位信号。构建pMito--U6-RP-BbsI-3’UTR-CBh-MLS-flag-Cas9载体。具体方法为,首先合成Age I- MLS-Flag- Cas9(part)Bgl II的结构。合成的序列如下:5’-accggtgccaccATGTCCGTCCTGACGCCGCTGCTGCTGCGGGGCTTGACAGGCTCGGCCCGGCGGCTCCCAGTGCCGCGCGCCAAGATCCATTCGTTGATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCT-3’。

粗体为Age I限制性内切酶位点,斜体色为Bgl II限制性内切酶位点,下划线为Cox8A的线粒体定位信号。接着利用Age I的酶和Bgl II限制性内切酶把Mito-U6-RP-gRNA-3’UTR载体上的序列切掉,然后用同样的酶切割AgeI- MLS-Flag- Cas9- Bgl II的结构序列,将二者连接,接着转化,挑取单克隆细菌株、提取质粒DNA,通过测序鉴定获得的重组质粒pMito-U6-RP-BbsI-3’UTR-CBh-MLS-flag-Cas9。

(3)筛选标签EGFP的构建:最后,在pMito-U6-RP-BbsI-3’UTR-CBh-MLS-flag-Cas9质粒载体的Cas9基因序列后加上EGFP,把嘌呤霉素基因去掉,以便于观察转染效率。同时在Cas9表达框后加上MRPS12的3’UTR信号,以稳定表达的Cas9mRNA结构。具体方法为:首先合成EcoRI-T2A-EGFP-3’UTR–EcoRI的结构,接着利用EcoRI的酶把载体上的序列切掉,然后用同样的酶切割EcorI-T2A-EGFP- 3’UTR–EcorI的序列,连接到Mito-U6-RP-gRNA-3’UTR-CBh-MLS-flag-Cas9. 接着转化,挑取细菌单克隆测序。用Bioedit软件对测序结果进行分析,结果表明成功构建了MitoCRISPR(Mito-U6-RP-gRNA-3’UTR-CBh- MLS-Cas9-2A-GFP- 3’UTR)载体。

实施例2 针对线粒体12sr RNA基因位点的基因敲除

构建针对线粒体12srRNA基因位点的线粒体基因敲除载体具体方法如下:

选取pMitoCRISPR1质粒为骨架构建线粒体基因敲除重组质粒载体,pMitoCRISPR1质粒上包含CRISPR系统的基本元件,即Cas9蛋白基因和控制sgRNA在线粒体中表达的元件,包括U6启动子、RP序列及3’UTR序列。U6启动子用于启动sgRNA的表达, 3’UTR序列帮助稳定表达的sgRNA,使之能从细胞核中出来,定位在线粒体外膜上; RNA5’端的输入序列-RP序列,帮助RNA进入线粒体。一旦3’UTR序列帮助RNAs出现在线粒体表面,那么就用第二段运输序列(RP序列)就可以引导RNA进入靶向线粒体。有了这两段序列,就能靶向sgRNA,引导其进入线粒体,编辑线粒体基因组。该载体选取了一个特殊的BbsI酶切位点可用于插入特异的sgRNA,以防止载体自连。并且该载体上带有EGFP基因,可以对转染的细胞进行筛选或者观察转染效率。

本实例选取线粒体基因组上12sr RNA基因,对其进行敲除,具体步骤如下:

sgRNA退火: 加入10×PCR 缓冲液2μL、Mito-KO-H-12sr RNA-F 1μL、Mito-KO-H-12sr RNA-R 1μL、ddH2O 16μL,共20μL,处理条件为95℃ 5 min,2.5℃/s降至85℃;0.25℃/s从 85℃降至25℃,然后25℃ 5 min。

12sr RNA基因的sgRNA目标序列如下:12sr RNA: 5’-TAAGGGCTATCGTAGTTTTC-3’;RP序列为: 5’-TCTCCCTGAGCTTCAGGGAG-3’。

用于插入到pMitoCRISPR1质粒Bbs I酶切位点的12s rRNA基因的sgRNA引物序列如下:Mito-KO-H-12sr RNA-F: 5’-CACCGTCTCCCTGAGCTTCAGGGAGTAAGGGCTATCGTAGTTTTC-3’

Mito-KO-H-12sr RNA-R: 5’-AAACGAAAACTACGATAGCCCTTACTCCCTGAAGCTCAGGGAGAC-3’。

线粒体12srRNA基因敲除载体的构建:pMitoCRISPR1质粒DNA 17μL、 10×Fast Digest buffer 5μL、 Bbs I限制性内切酶5μL、 ddH2O 23μL,共50 μL, 反应1小时,95℃ 5 min。在1.5 mLEP中,加入2μL该反应液、1.84μL上述sgRNA退火反应液2.5μL、10×T4 DNA连接酶缓冲液、T4 DNA连接酶 1μL,室温连接10-30 min.在带有200μL感受态细胞的1.5 mL EP管中,温和地加入上述1μL DNA连接反应液,混匀,后冰浴30 min,37℃水浴6 min,冰上置放3 min;加入800μL LB细菌培养液,37℃水浴,1h; 取上清50μL,在LB固体平板上混匀涂板,37℃倒置培养过夜。挑选具抗性的单克隆菌落,用康维世纪无内毒素质粒小提试剂盒提取质粒DNA,送上海铂尚生物技术有限公司进行测序,以确定重组质粒pMitoCRISPR1-KO-12sr RNA,即带有12s rRNA基因sgRNA的线粒体基因敲除质粒的构建成功。

和sgRNA线粒体定位实验的具体方法如下:

为了验证Cas9和sgRNA是否定位线粒体,我们将NLS-Cas9,pMitoCRISPR1载体分别转染细胞,两天后用共聚焦显微镜观察Cas9蛋白在线粒体上的定位;将pMitoCRISPR1和pMitoCRISPR1-KO-12sr RNA质粒转染细胞,两天后RT-PCR分析sgRNA在线粒体的表达情况。其中,用缺乏RP序列的pMitoCRISPR1载体做对照质粒。

其中Cas9蛋白步骤如下:将转染72h的细胞接种于多聚赖氨酸处理过的玻片上,冰PBS洗三遍,每次5分钟。用4%的多聚甲醛固定爬片15分钟,PBS浸洗3次;0.5% TritonX-100(PBS配制)室温通透1小时,PBS浸洗3次;封闭液室温封闭30min;吸水纸吸掉封闭液,每个玻片滴加足够量的稀释好的flag一抗并放入湿盒,4℃孵育过夜;PBS浸洗爬片3次,每次3min,吸水纸吸干爬片上多余液体后滴加稀释好的荧光二抗,湿盒中37℃避光孵育1h,PBS浸洗细胞3次,每次3min;滴加DAPI避光孵育2min,对细胞进行染核,PBS洗4次;用吸水纸吸干爬片上的液体,用含抗荧光淬灭剂的封片液封片,然后在共聚焦显微镜下观察采集图像。

其中提取线粒体步骤如下:首先把细胞从培养皿中消化下来,用低渗溶液裂解细胞5-10min,然后用Dounce匀浆器配套的研杵B在冰上快速的研磨细胞,研磨时研杵B应上下垂直运动以增加与匀浆液的接触面积,通常在匀浆10次左右观察匀浆效果。接着利用差速离心的方法得到粗提的线粒体。将粗提的线粒体加入12%的percoll溶液中,混合液小心置于19% percoll和40% percoll梯度上,50000g离心25分钟。小心吸取位于浅黄色界面层的样品,重悬于分离缓冲液,17000g离心10分钟即得到纯的线粒体。提取线粒体RNA,反转录后,利用RT-PCR检测sgRNA。

编辑293T细胞线粒体基因组的具体方法如下:

为了验证MitoCRISPR质粒是否有效,我们针对人线粒体基因组的12sr RNA基因位点设计一个sgRNA,构建了如上所述pMitoCRISPR1-KO-12sr RNA质粒。将该质粒转染293T细胞,3天后检测线粒体基因组拷贝数变化,以评估MitoCRISPR系统的效率。具体方法如下:用70μl opti-MEM(Gibco,货号:31985-070)+ 3μl PEI (polysciences,货号:670587) (1μg/μl)试剂充分混匀,然后加入1μl DNA (1μg/μl),室温孵育5 min,将混合液滴加入细胞中,37℃孵育细胞过夜。细胞转染质粒3天后,使用全基因组提取试剂盒对细胞基因组进行提取,之后利用微量分光光度计测量样品的浓度,将样品浓度统一稀释到50 ng/μl。提取细胞基因组后,用高通量实时荧光定量PCR仪(QuantStudio 6 Flex)对12sr RNA和β-actin进行扩增。扩增结束后,实时荧光定量PCR仪能够自动给出荧光曲线,计算该反应的CT值。CT值是指实时荧光定量PCR仪收集到的荧光信号达到给定值时反应经过的循环数,其中C指的是Cycle,T指的是阈值。我们根据CT值用△△Ct法计算各样本之间的相对表达量。

qPCR扩增条件如下:在MicroAmp® Fast 8-Tube Strip, 0.1 ml 快速反应8联管中配制反应混合液,反应体系设置为20ul:模板,3ul、SYBR GREEN I Mix,10ul、上游引物F,0.4 ul、下游引物R,0.4 ul、ddH2O,6.2μL,PCR反应温度梯度为95℃,20S;95℃,3S;56℃,30s;72℃,30s;72℃,5min;溶解曲线扩增阶段为95℃,15s 、60℃,60s、95℃,15s。结果分析:将上述pMitoCRISPR1-KO-12s rRNA质粒导入293T细胞后,可以发现细胞有EGFP表达(如图2)。为了验证Cas9是否有进入线粒体,pMitoCRISPR1质粒转染后两天,我们通过特异抗体进行荧光染色,用共聚焦显微镜确定了Cas9在线粒体上的定位(如图3)。同时提取了细胞蛋白,进行Western Blot分析,结果进一步表明了Cas9的表达(图4b)。为了验证表达的12s rRNA sgRNA是否有进入线粒体,我们提取了线粒体,分析线粒体里面sgRNA的含量,结果表明sgRNA有进入线粒体(图4a)。

接着我们提取293T细胞全基因组,针对12sr RNA基因位点的敲除,利用线粒体基因组12sr RNA以及核基因组β-actin引物,分析了细胞内线粒体基因组的拷贝数变化。qPCR结果显示:线粒体基因组12sr RNA以及核基因组β-actin引物的扩增效率几乎一致分别为99.548%和97.271%。转染MitoCRISPR-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约30%(如图5)。这些结果表明我们成功地构建了线粒体基因敲除质粒pMitoCRISPR1-KO-12s rRNA载体,这一质粒载体导入293T细胞后,成功地敲除了线粒体基因组。

实施例3 针对线粒体cytb基因位点的线粒体基因敲除

本实例选取线粒体基因组上cytb基因,对其进行敲除,具体步骤如下:用实例2所述方法进行退火反应。

Cytb的sgRNA目标序列为:ATCCCGTTTCGTGCAAGAAT;RP序列为: TCTCCCTGAGCTTCAGGGAG;用于插入到pMitoCRISPR1质粒Bbs I酶切位点的Cytb基因sgRNA引物序列如下::Mito-KO-H-Cytb-F: CACCGTCTCCCTGAGCTTCAGGGAGATCCCGTTTCGTGCAAGAAT;

Mito-KO-H-Cytb-R:AAACATTCTTGCACGAAACGGGATCTCCCTGAAGCTCAGGGAGAC;

用实例2所述方法构建线粒体Cytb基因敲除载体pMitoCRISPR1-KO-Cytb,并通过测序进行验证。接着将该质粒载体用实例2所述的方法转染293T细胞,3天后,用实例2所述的方法检测该质粒载体对线粒体基因组敲除的效率。 将上述pMitoCRISPR1-KO-Cytb质粒导入293T细胞后,可以发现细胞有EGFP表达(如图2)。同时,提取上述细胞的蛋白,进行Western Blot分析,结果表明了Cas9的表达(图4b)。接着我们提取上述细胞全基因组,针对Cytb基因位点的敲除,利用线粒体基因组12sr RNA以及核基因组β-actin引物,分析了细胞内线粒体基因组的拷贝数变化。qPCR结果显示:线粒体基因组12sr RNA以及核基因组β-actin引物的扩增效率几乎一致分别为99.548%和97.271%。转染MitoCRISPR-KO-Cytb敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约30%(如图6)。这些结果表明我们成功地构建了线粒体基因敲除质粒pMitoCRISPR1-KO-Cytb载体,这一质粒载体导入293T细胞后,成功地敲除了线粒体基因组。

实施例4 MitoCRISPR载体上不同MLS元件对线粒体基因敲除的影响

线粒体中存在上千种蛋白质或者RNA,其中绝大部分是由核基因编码的。这些蛋白必需进入线粒体起作用,而引导这些蛋白质进入线粒体的信号肽序列被称为MLS序列。本实施例使用了两种不同基因的MLS元件,并比较了二者对线粒体基因敲除效率的影响。具体方法如下:首先在Cas9蛋白N端引入了两个Age I限制性酶切位点;接着,在Age I酶切位点上置换两种不同的MLS:Cox8A-MLS和ATP5B-MLS,分别构建了MitoCRISPR载体。本实例将线粒体基因组上的12sr RNA 的sgRNA目标序列插入到上述分别带有Cox8A-MLS和ATP5B-MLS序列的MitoCRISPR载体上,分别构建了线粒体基因敲除质粒,pMitoCRISPR1-Cox8A-MLS-KO-12sr RNA和pMitoCRISPR5-ATP5B-MLS-KO-12sr RNA。将上述质粒导入293T细胞3天后,提取细胞全基因组,用实例2中所述的qPCR方法,利用线粒体基因组12sr RNA以及核基因组β-actin引物,分析了细胞内线粒体基因组的拷贝数变化,进而验证线粒体基因组的敲除效率,以确定Cox8A-MLS和ATP5B-MLS元件对线粒体基因敲除的影响。

结果显示:转染pMitoCRISPR5-ATP5B-MLS-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约30%(如图7),转染pMitoCRISPR1-Cox8A-MLS-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约22%(如图7)。这些结果表明带有ATP5B-MLS序列的线粒体基因敲除载体要比带有Cox8A-MLS序列的线粒体基因敲除载体的敲除效率高。

实施例5 MitoCRISPR载体上RP序列的位置对线粒体基因敲除的影响

线粒体中存在上千种蛋白质或者RNA,其中绝大部分是由核基因编码的。研究表明将外源RNA引导进入线粒体,RP序列在其中起了至关重要的作用,本实施例优化了RP序列在MitoCRISPR系统中的位置,以排除其对系统中蛋白功能的影响。试验中,我们将RP序列分别放在了sgRNA序列前,3’UTR序列前以及3’UTR后面,分别构建了MitoCRISPR-RP-sgRNA,MitoCRISPR- RP-3’UTR,MitoCRISPR -3’UTR- RP(+)和MitoCRISPR -3’UTR- RP(-)等pMitoCRISPR1及pMitoCRISPR9到 pMitoCRISPR11质粒载体,以便观察其位置对MitoCRISP系统中的影响。接着针对线粒体基因组上的12sr RNA基因,分别构建了带有12sr RNA基因sgRNA序列及在上述不同位置放置的RP序列的线粒体基因敲除质粒载体pMitoCRISPR1-RP-sgRNA-KO-12sr RNA, pMitoCRISPR9-RP-3’UTR-KO-12sr RNA, pMitoCRISPR10 -3’UTR- RP(+)-sgRNA-KO-12sr RNA和pMitoCRISPR11-3’UTR-RP(-)-KO-12sr RNA质粒。将这些质粒转染293T细胞对线粒体基因组进行如上所述的靶向敲除,转染3天后,用上述qPCR方法检测线粒体基因组拷贝数变化,以评估MitoCRISPR系统的效率。结果显示(图8):转染pMitoCRISPR1-RP-sgRNA-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约22%,转染pMitoCRISPR9-RP-3’UTR-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约22%, 转染pMitoCRISPR10-3’UTR- RP(+)-sgRNA-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约42%, 转染pMitoCRISPR11-3’UTR- RP(-)-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约5%。这些结果表明RP序列加在3’UTR后面的敲除效率是最高的(图8)。

实施例6 MitoCRISPR载体上不同3’UTR元件对线粒体基因敲除的影响

线粒体中存在上千种蛋白质或者RNA,其中绝大部分是由核基因编码的。研究表明将外源RNA引导进入线粒体,RP序列和3’UTR元件在其中起了至关重要的作用,本实施例中我们除了RP序列之外,使用了四种不同基因的3’UTR元件,并比较了它们对线粒体基因敲除效率的影响。具体方法如下:我们在MitoCRISPR载体的Spe I酶切位点上置换四种不同的3’UTR:Cox8A-3’UTR,MRPS12-3’UTR,SOD2-3’UTR和ATP5B-3’UTR,构建了带有上述四种3’UTR序列的MitoCRISPR2-Cox8A-3’UTR, MitoCRISPR3-SOD2-3’UTR, MitoCRISPR1-MRPS12-3’UTR和MitoCRISPR4-ATP5B-3’UTR质粒载体。接着本实例针对线粒体基因组上的12sr RNA基因,在上述四种带有不同3’UTR序列的载体上,插入12sr RNA基因的sgRNA序列,构建了pMitoCRISPR2-Cox8A-3’UTR-KO-12sr RNA, pMitoCRISPR3-SOD2-3’UTR-KO-12sr RNA, pMitoCRISPR1-MRPS12-3’UTR-KO-12sr RNA和pMitoCRISPR4-ATP5B-3’UTR-KO-12sr RNA质粒。将这些质粒载体导入293T细胞后,用上述方法分析了细胞内线粒体基因组的拷贝数变化。结果显示(图9):转染MitoCRISPR2-Cox8A-3’UTR-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约43%,转染MitoCRISPR3-SOD2-3’UTR-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约13%,转染MitoCRISPR1-MRPS12-3’UTR-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约22%,转染MitoCRISPR4-ATP5B-3’UTR-KO-12sr RNA敲除质粒后,293T细胞内的线粒体基因组拷贝数下降了大约34%。带有Cox8A-3’UTR序列的线粒体基因敲除质粒的敲除效率是最高的(图9)。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

SEQUENCE LISTING

<110> 福建师范大学

<120> 利用CRISPR/Cas9对线粒体基因组进行靶向编辑的方法

<130> 22

<160> 22

<170> PatentIn version 3.3

<210> 1

<211> 9645

<212> DNA

<213> pMitoCRISPR1

<400> 1

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

cgaaacaccg ggtcttcgag aagacctgtt ttagagctag aaatagcaag ttaaaataag 300

gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgccagaaga agtgacggct 360

gggggcacag tgggctgggc gcccctgcag aacatgaacc ttccgctcct ggctgccaca 420

gggtcctccg atgctggcct ttgcgcctct agaggcagcc actcatggat tcaagtcctg 480

gctccgcctc ttccatcagg accacttttt ttagcgcgtg cgccaattct gcagacaaat 540

ggctctagag gtacccgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 600

cgacccccgc ccattgacgt caatagtaac gccaataggg actttccatt gacgtcaatg 660

ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag 720

tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattgtg cccagtacat 780

gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat 840

ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc 900

aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg 960

ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg 1020

tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg 1080

gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc 1140

ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg 1200

cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagctga 1260

gcaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt aattacctgg 1320

agcacctgcc tgaaatcact ttttttcagg ttggaccggt gccaccatgt ccgtcctgac 1380

gccgctgctg ctgcggggct tgacaggctc ggcccggcgg ctcccagtgc cgcgcgccaa 1440

gatccattcg ttgatggact ataaggacca cgacggagac tacaaggatc atgatattga 1500

ttacaaagac gatgacgata agatggccgg tatccacgga gtcccagcag ccgacaagaa 1560

gtacagcatc ggcctggaca tcggcaccaa ctctgtgggc tgggccgtga tcaccgacga 1620

gtacaaggtg cccagcaaga aattcaaggt gctgggcaac accgaccggc acagcatcaa 1680

gaagaacctg atcggagccc tgctgttcga cagcggcgaa acagccgagg ccacccggct 1740

gaagagaacc gccagaagaa gatacaccag acggaagaac cggatctgct atctgcaaga 1800

gatcttcagc aacgagatgg ccaaggtgga cgacagcttc ttccacagac tggaagagtc 1860

cttcctggtg gaagaggata agaagcacga gcggcacccc atcttcggca acatcgtgga 1920

cgaggtggcc taccacgaga agtaccccac catctaccac ctgagaaaga aactggtgga 1980

cagcaccgac aaggccgacc tgcggctgat ctatctggcc ctggcccaca tgatcaagtt 2040

ccggggccac ttcctgatcg agggcgacct gaaccccgac aacagcgacg tggacaagct 2100

gttcatccag ctggtgcaga cctacaacca gctgttcgag gaaaacccca tcaacgccag 2160

cggcgtggac gccaaggcca tcctgtctgc cagactgagc aagagcagac ggctggaaaa 2220

tctgatcgcc cagctgcccg gcgagaagaa gaatggcctg ttcggaaacc tgattgccct 2280

gagcctgggc ctgaccccca acttcaagag caacttcgac ctggccgagg atgccaaact 2340

gcagctgagc aaggacacct acgacgacga cctggacaac ctgctggccc agatcggcga 2400

ccagtacgcc gacctgtttc tggccgccaa gaacctgtcc gacgccatcc tgctgagcga 2460

catcctgaga gtgaacaccg agatcaccaa ggcccccctg agcgcctcta tgatcaagag 2520

atacgacgag caccaccagg acctgaccct gctgaaagct ctcgtgcggc agcagctgcc 2580

tgagaagtac aaagagattt tcttcgacca gagcaagaac ggctacgccg gctacattga 2640

cggcggagcc agccaggaag agttctacaa gttcatcaag cccatcctgg aaaagatgga 2700

cggcaccgag gaactgctcg tgaagctgaa cagagaggac ctgctgcgga agcagcggac 2760

cttcgacaac ggcagcatcc cccaccagat ccacctggga gagctgcacg ccattctgcg 2820

gcggcaggaa gatttttacc cattcctgaa ggacaaccgg gaaaagatcg agaagatcct 2880

gaccttccgc atcccctact acgtgggccc tctggccagg ggaaacagca gattcgcctg 2940

gatgaccaga aagagcgagg aaaccatcac cccctggaac ttcgaggaag tggtggacaa 3000

gggcgcttcc gcccagagct tcatcgagcg gatgaccaac ttcgataaga acctgcccaa 3060

cgagaaggtg ctgcccaagc acagcctgct gtacgagtac ttcaccgtgt ataacgagct 3120

gaccaaagtg aaatacgtga ccgagggaat gagaaagccc gccttcctga gcggcgagca 3180

gaaaaaggcc atcgtggacc tgctgttcaa gaccaaccgg aaagtgaccg tgaagcagct 3240

gaaagaggac tacttcaaga aaatcgagtg cttcgactcc gtggaaatct ccggcgtgga 3300

agatcggttc aacgcctccc tgggcacata ccacgatctg ctgaaaatta tcaaggacaa 3360

ggacttcctg gacaatgagg aaaacgagga cattctggaa gatatcgtgc tgaccctgac 3420

actgtttgag gacagagaga tgatcgagga acggctgaaa acctatgccc acctgttcga 3480

cgacaaagtg atgaagcagc tgaagcggcg gagatacacc ggctggggca ggctgagccg 3540

gaagctgatc aacggcatcc gggacaagca gtccggcaag acaatcctgg atttcctgaa 3600

gtccgacggc ttcgccaaca gaaacttcat gcagctgatc cacgacgaca gcctgacctt 3660

taaagaggac atccagaaag cccaggtgtc cggccagggc gatagcctgc acgagcacat 3720

tgccaatctg gccggcagcc ccgccattaa gaagggcatc ctgcagacag tgaaggtggt 3780

ggacgagctc gtgaaagtga tgggccggca caagcccgag aacatcgtga tcgaaatggc 3840

cagagagaac cagaccaccc agaagggaca gaagaacagc cgcgagagaa tgaagcggat 3900

cgaagagggc atcaaagagc tgggcagcca gatcctgaaa gaacaccccg tggaaaacac 3960

ccagctgcag aacgagaagc tgtacctgta ctacctgcag aatgggcggg atatgtacgt 4020

ggaccaggaa ctggacatca accggctgtc cgactacgat gtggaccata tcgtgcctca 4080

gagctttctg aaggacgact ccatcgacaa caaggtgctg accagaagcg acaagaaccg 4140

gggcaagagc gacaacgtgc cctccgaaga ggtcgtgaag aagatgaaga actactggcg 4200

gcagctgctg aacgccaagc tgattaccca gagaaagttc gacaatctga ccaaggccga 4260

gagaggcggc ctgagcgaac tggataaggc cggcttcatc aagagacagc tggtggaaac 4320

ccggcagatc acaaagcacg tggcacagat cctggactcc cggatgaaca ctaagtacga 4380

cgagaatgac aagctgatcc gggaagtgaa agtgatcacc ctgaagtcca agctggtgtc 4440

cgatttccgg aaggatttcc agttttacaa agtgcgcgag atcaacaact accaccacgc 4500

ccacgacgcc tacctgaacg ccgtcgtggg aaccgccctg atcaaaaagt accctaagct 4560

ggaaagcgag ttcgtgtacg gcgactacaa ggtgtacgac gtgcggaaga tgatcgccaa 4620

gagcgagcag gaaatcggca aggctaccgc caagtacttc ttctacagca acatcatgaa 4680

ctttttcaag accgagatta ccctggccaa cggcgagatc cggaagcggc ctctgatcga 4740

gacaaacggc gaaaccgggg agatcgtgtg ggataagggc cgggattttg ccaccgtgcg 4800

gaaagtgctg agcatgcccc aagtgaatat cgtgaaaaag accgaggtgc agacaggcgg 4860

cttcagcaaa gagtctatcc tgcccaagag gaacagcgat aagctgatcg ccagaaagaa 4920

ggactgggac cctaagaagt acggcggctt cgacagcccc accgtggcct attctgtgct 4980

ggtggtggcc aaagtggaaa agggcaagtc caagaaactg aagagtgtga aagagctgct 5040

ggggatcacc atcatggaaa gaagcagctt cgagaagaat cccatcgact ttctggaagc 5100

caagggctac aaagaagtga aaaaggacct gatcatcaag ctgcctaagt actccctgtt 5160

cgagctggaa aacggccgga agagaatgct ggcctctgcc ggcgaactgc agaagggaaa 5220

cgaactggcc ctgccctcca aatatgtgaa cttcctgtac ctggccagcc actatgagaa 5280

gctgaagggc tcccccgagg ataatgagca gaaacagctg tttgtggaac agcacaagca 5340

ctacctggac gagatcatcg agcagatcag cgagttctcc aagagagtga tcctggccga 5400

cgctaatctg gacaaagtgc tgtccgccta caacaagcac cgggataagc ccatcagaga 5460

gcaggccgag aatatcatcc acctgtttac cctgaccaat ctgggagccc ctgccgcctt 5520

caagtacttt gacaccacca tcgaccggaa gaggtacacc agcaccaaag aggtgctgga 5580

cgccaccctg atccaccaga gcatcaccgg cctgtacgag acacggatcg acctgtctca 5640

gctgggaggc gacaaaaggc cggcggccac gaaaaaggcc ggccaggcaa aaaagaaaaa 5700

ggaattcggc agtggagagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa 5760

tcctggccca atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt 5820

cgagctggac ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga 5880

tgccacctac ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc 5940

ctggcccacc ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga 6000

ccacatgaag cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg 6060

caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg 6120

cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat 6180

cctggggcac aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa 6240

gcagaagaac ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt 6300

gcagctcgcc gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc 6360

cgacaaccac tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga 6420

tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct 6480

gtacaagtaa ctcgagcaga agaagtgacg gctgggggca cagtgggctg ggcgcccctg 6540

cagaacatga accttccgct cctggctgcc acagggtcct ccgatgctgg cctttgcgcc 6600

tctagaggca gccactcatg gattcaagtc ctggctccgc ctcttccatc aggaccacga 6660

attctaacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 6720

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 6780

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 6840

ggggtggggc aggacagcaa gggggaggat tgggaagaga atagcaggca tgctggggag 6900

cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 6960

actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg 7020

agcgagcgag cgcgcagctg cctgcagggg cgcctgatgc ggtattttct ccttacgcat 7080

ctgtgcggta tttcacaccg catacgtcaa agcaaccata gtacgcgccc tgtagcggcg 7140

cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc 7200

tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc 7260

gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg 7320

accccaaaaa acttgatttg ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg 7380

tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg 7440

gaacaacact caaccctatc tcgggctatt cttttgattt ataagggatt ttgccgattt 7500

cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa 7560

tattaacgtt tacaatttta tggtgcactc tcagtacaat ctgctctgat gccgcatagt 7620

taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 7680

cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 7740

caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg 7800

ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc 7860

gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 7920

aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt 7980

tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag 8040

aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg 8100

aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa 8160

tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc 8220

aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag 8280

tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa 8340

ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc 8400

taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg 8460

agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa 8520

caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa 8580

tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg 8640

gctggtttat tgctgataaa tctggagccg gtgagcgtgg aagccgcggt atcattgcag 8700

cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg 8760

caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt 8820

ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt 8880

aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac 8940

gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 9000

atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 9060

tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 9120

gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 9180

actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 9240

gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 9300

agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 9360

ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 9420

aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 9480

cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 9540

gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 9600

cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 9645

<210> 2

<211> 222

<212> DNA

<213> Cox8A-3'UTR

<400> 2

aggggtccgt tctgtccctc acactgtgac ctgaccagcc ccaccggccc atcctggtca 60

tgttactgca tttgtggccg gcctcccctg gatcatgtca ttcaattcca gtcacctctt 120

ctgcaatcat gacctcttga tgtctccatg gtgacctcct tgggggtcac tgaccctgct 180

tggtggggtc ccccttgtaa caataaaatc tatttaaact tt 222

<210> 3

<211> 201

<212> DNA

<213> SOD2-3'UTR

<400> 3

accacgatcg ttatgctgat cataccctaa tgatcccagc aagataatgt cctgtcttct 60

aagatgtgca tcaagcctgg tacatactga aaaccctata aggtcctgga taatttttgt 120

ttgattattc attgaagaaa catttatttt ccaattgtgt gaagtttttg actgttaata 180

aaagaatctg tcaaccatca a 201

<210> 4

<211> 162

<212> DNA

<213> MRPS12-3'UTR

<400> 4

cagaagaagt gacggctggg ggcacagtgg gctgggcgcc cctgcagaac atgaaccttc 60

cgctcctggc tgccacaggg tcctccgatg ctggcctttg cgcctctaga ggcagccact 120

catggattca agtcctggct ccgcctcttc catcaggacc ac 162

<210> 5

<211> 146

<212> DNA

<213> ATP5B-3'UTR

<400> 5

ggggtctttg tcctctgtac tgtctctctc cttgccccta acccaaaaag cttcattttt 60

ctgtgtaggc tgcacaagag ccttgattga agatatattc tttctgaaca gtatttaagg 120

tttccaataa aatgtacacc cctcag 146

<210> 6

<211> 141

<212> DNA

<213> ATP5B-MLS

<400> 6

atgttggggt ttgtgggtcg ggtggccgct gctccggcct ccggggcctt gcggagactc 60

accccttcag cgtcgctgcc cccagctcag ctcttactgc gggccgctcc gacggcggtc 120

catcctgtca gggactatgc g 141

<210> 7

<211> 87

<212> DNA

<213> Cox8A-MLS

<400> 7

atgtccgtcc tgacgccgct gctgctgcgg ggcttgacag gctcggcccg gcggctccca 60

gtgccgcgcg ccaagatcca ttcgttg 87

<210> 8

<211> 20

<212> DNA

<213> RP

<400> 8

tctccctgag cttcagggag 20

<210> 9

<211> 63

<212> DNA

<213> 2A

<400> 9

ggcagtggag agggcagagg aagtctgcta acatgcggtg acgtcgagga gaatcctggc 60

cca 63

<210> 10

<211> 19

<212> DNA

<213> 人工序列

<400> 10

ctcaccacct cttgctcag 19

<210> 11

<211> 20

<212> DNA

<213> 人工序列

<400> 11

ggctacacct tgacctaacg 20

<210> 12

<211> 326

<212> DNA

<213> 人工序列

<400> 12

aggacgaaac accgggtctt cgagaagacc tgttttagag ctagaaatag caagttaaaa 60

taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgccag aagaagtgac 120

ggctgggggc acagtgggct gggcgcccct gcagaacatg aaccttccgc tcctggctgc 180

cacagggtcc tccgatgctg gcctttgcgc ctctagaggc agccactcat ggattcaagt 240

cctggctccg cctcttccat caggaccaca ctagtttttt tagcgcgtgc gccaattctg 300

cagacaaatg gctctagagg tacccg 326

<210> 13

<211> 39

<212> DNA

<213> 人工序列

<400> 13

atcttgtgga aaggacgaaa caccgggtct tcgagaaga 39

<210> 14

<211> 42

<212> DNA

<213> 人工序列

<400> 14

gtaagttatg taacgggtac ctctagagcc atttgtctgc ag 42

<210> 15

<211> 451

<212> DNA

<213> 人工序列

<400> 15

accggtgcca ccatgtccgt cctgacgccg ctgctgctgc ggggcttgac aggctcggcc 60

cggcggctcc cagtgccgcg cgccaagatc cattcgttga tggactataa ggaccacgac 120

ggagactaca aggatcatga tattgattac aaagacgatg acgataagat ggccggtatc 180

cacggagtcc cagcagccga caagaagtac agcatcggcc tggacatcgg caccaactct 240

gtgggctggg ccgtgatcac cgacgagtac aaggtgccca gcaagaaatt caaggtgctg 300

ggcaacaccg accggcacag catcaagaag aacctgatcg gagccctgct gttcgacagc 360

ggcgaaacag ccgaggccac ccggctgaag agaaccgcca gaagaagata caccagacgg 420

aagaaccgga tctgctatct gcaagagatc t 451

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<400> 16

taagggctat cgtagttttc 20

<210> 17

<211> 45

<212> DNA

<213> 人工序列

<400> 17

caccgtctcc ctgagcttca gggagtaagg gctatcgtag ttttc 45

<210> 18

<211> 45

<212> DNA

<213> 人工序列

<400> 18

aaacgaaaac tacgatagcc cttactccct gaagctcagg gagac 45

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<400> 19

atcccgtttc gtgcaagaat 20

<210> 20

<211> 20

<212> DNA

<213> 人工序列

<400> 20

tctccctgag cttcagggag 20

<210> 21

<211> 45

<212> DNA

<213> 人工序列

<400> 21

caccgtctcc ctgagcttca gggagatccc gtttcgtgca agaat 45

<210> 22

<211> 45

<212> DNA

<213> 人工序列

<400> 22

aaacattctt gcacgaaacg ggatctccct gaagctcagg gagac 45

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1