用于特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体与流程

文档序号:14915509发布日期:2018-07-11 00:36阅读:592来源:国知局

本发明涉及基因组序列的修饰方法、及其使用的核酸序列识别模块与核酸碱基转变酶的复合体,该基因组序列的修饰方法能够不伴随DNA的双链切割,也不进行外来DNA片段的插入而进行基因组的特定区域内的核酸碱基的修饰。



背景技术:

近年来,作为在各种生物种类中修饰靶基因、基因组区域的技术,基因组编辑受到关注。目前,作为基因组编辑的方法,提出了利用具有序列非依赖的DNA切割能力的分子与具有序列识别能力的分子组合而成的人工核酸酶的方法(非专利文献1)。

已有报告例如:使用由锌指DNA结合结构域与非特异性DNA切割结构域连接而成的锌指核酸酶(ZFN),在作为宿主的植物细胞或昆虫细胞中,进行DNA中的靶基因座的重组的方法(专利文献1);使用由作为植物病原菌黄单胞菌属具有的DNA结合模块的转录激活子样(TAL)效应子,与DNA核酸内切酶连接而成的TALEN,在特定的核苷酸序列内或其相邻位点进行切割、修饰靶基因的方法(专利文献2);或者,利用由在真细菌和古细菌具有的获得性免疫系统中起作用的DNA序列CRISPR(Clustered Regularly interspaced short palindromic repeats),和与CRISPR一起具有重要的作用的核酸酶Cas(CRISPR-相关的)蛋白家族组合而成的CRISPR-Cas9系统的方法(专利文献3)。进一步,也报告了使用PPR蛋白质与核酸酶连接而成的人工核酸酶,在该特定序列的附近切割靶基因的方法(专利文献4),其中,PPR蛋白质为利用包括35个氨基酸的并识别1个核酸碱基的PPR基序的连续,来识别特定的核苷酸序列的方式构建而成。

迄今为止提出的基因组编辑技术,基本上是以DNA双链切割(double-DNA breaks:DSB)为前体的,但由于会伴随意想不到的基因组修饰,因此存在强细胞毒性、染色体重排等副作用,存在诸如以下共通问题:在基因治疗中的可靠性受损、核苷酸修饰导致的细胞存活数极少、在灵长类卵细胞、单细胞微生物中基因修饰本身难以进行。

作为不伴随DSB的基因组编辑技术,虽然有提出将具有锌指(ZF)基序等序列识别能力的分子与将核酸碱基的氨基转变为羰基的脱氨酶组合而成的人工酶方案(专利文献5)但完全没有实验的证据,更不用说突变导入效率,连究竟是否可能进行基因修饰都不明确。实际上,现状为:作为同样不伴随基因组切割的体系,在使用催化DNA链上的脱碱基反应的DNA糖基化酶的方法中,连在使用DNA修复机制被削弱的突变酵母用于宿主的情况中,突变导入效率都极低(非专利文献2),远远达不到向基因治疗、有用生物的分子育种等进行实用化的程度。

现有技术文献

专利文献

专利文献1:日本专利第4968498号公报

专利文献2:日本特表2013-513389号公报

专利文献3:日本特表2010-519929号公报

专利文献4:日本特开2013-128413号公报

专利文献5:美国专利申请公开第2011/0104787号说明书

非专利文献

非专利文献1:Kelvin M Esvelt,Harris H Wang(2013)Genome-scale engineering for systems and synthetic biology,Molecular Systems Biology 9:641

非专利文献2:Prashant Mali,Kevin M Esvelt,George M Church(2013)Nucleic Acids Res.41:e99



技术实现要素:

发明要解决的问题

因此,本发明的目的在于提供一种不伴随DSB或外来DNA片段的插入而修饰基因的特定序列的核酸碱基的新型基因组编辑的方法、及用于其的核酸序列识别模块及核酸碱基转变酶的复合体。

解决问题的方法

本发明人已经成功地通过使用具有双链DNA一条或二条链的切割能力已失活的突变Cas9的II型CRISPR-Cas系统作为核酸序列识别模块,使用脱氨酶作为核酸碱基转变酶,从而不伴随DSB而在包含特定的DNA序列的区域中有效地修饰基因组序列(WO2015/133554)。但是,Cas蛋白质识别并与称为protospacer adjacent motif(PAM)的DNA链上的序列结合,因此突变导入位点受到是否存在PAM的限制。目前,在基因组编辑中频繁使用的源自II型CRISPR-Cas系统的化脓性链球菌(Streptococcus pyogenes)的Cas9(SpCas9),NGG(N为任意碱基)作为PAM识别。另外,根据本发明人等的研究已经明确:在II型CRISPR中,所靶向的核苷酸序列(即,与指导RNA互补的DNA链上的核苷酸序列)为PAM的5’上游的18~25个核苷酸的长度,无论其长度如何,在从靶核苷酸序列的5’端的2~5个核苷酸的位置中发生碱基转变的频率最高。

另一方面,在大肠杆菌等具有的I-E型CRISPR-Cas系统中,已知将与32~33个核苷酸长的靶核苷酸序列的5’侧相邻的ATG、AAG、AGG或GAG作为PAM序列进行识别(参考图1;在图1D及E中,例示了PAM序列为AAG的情况),其它I型CRISPR-Cas系统也分别特异性识别2或3个碱基的PAM序列。因此,如果可以将I型CRISPR-Cas系统用作核酸序列识别模块,则使在利用Cas9时受到PAM序列、突变导入位置的限制而突变导入困难的位点的碱基转变成为可能。

然而,在II型CRISPR-Cas系统中,可以仅由与靶核苷酸序列互补的crRNA和用于募集Cas9的反式作用crRNA(tracrRNA)的嵌合RNA、和Cas9构成核酸序列识别模块,但例如在大肠杆菌具有的I-E型CRISPR-Cas系统中,靶核苷酸序列和PAM序列的识别,由称为CRISPR-associated complex for antiviral defence(Cascade)的包含提呈crRNA的5个种类的Cas蛋白质(CasA、CasB、CasC、CasD及CasE)的复杂核蛋白复合体承担,除此之外还有具有核酸酶及解旋酶活性的Cas3,与II型CRISPR-Cas系统中的Cas9发挥相同的DNA识别、切割功能(参考图1)。由于这样的复杂构成,I型CRISPR-Cas系统在作为人工核酸酶的基因组编辑技术中也还几乎未被利用。

本发明人制备了编码基因组特异性的CRISPR-RNA(crRNA)的DNA,其中在与作为大肠杆菌的必要基因的rpoB基因的靶核苷酸序列的目标链互补的序列的两端连接了正确提呈Cascade所必须的5’把手(handle)及3’把手。另一方面,从大肠杆菌的Cas操纵子分离了在Cascade的构成中必要的casA~casE基因组,制备了将其与脱氨酶基因连接而成的DNA,并将这些DNA导入包含待修饰基因的宿主大肠杆菌。结果成功地在靶基因的靶核苷酸序列及其附近,不伴随基因组DNA的切割而导入了突变。另外,可知与使用Cas9的情况不同,如果将靶核苷酸序列的长度设为32个核苷酸,则主要编辑的是从PAM序列32~44个碱基下游的胞嘧啶。

本发明人等基于这些见解进一步反复研究,结果完成了本发明。

即,本发明如下所述。

[1]一种修饰宿主细胞内的双链DNA的靶向位点的方法,其包括通过将为

(a)编码包含与选择的双链DNA中的靶核苷酸序列的目标链互补的序列的crRNA的DNA、和

(b)编码构成Cascade的蛋白质组合和核酸碱基转变酶的DNA,且被构成该核酸碱基转变酶可与该蛋白质组合中的任一种蛋白质形成复合体的形态的DNA

导入该宿主细胞,在该靶向位点中不切割该双链DNA链,而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的步骤。

[2]上述[1]所述的方法,其中,上述构成Cascade的蛋白质组合为CasA、CasB、CasC、CasD及CasE。

[3]上述[2]所述的方法,其中,上述Cascade源自大肠杆菌。

[4]上述[2]或[3]所述的方法,其中,上述与核酸碱基转变酶形成复合体的蛋白质为CasE。

[5]上述[1]~[4]中任一项所述的方法,其中,上述核酸碱基转变酶为脱氨酶。

[6]上述[5]所述的方法,其中,上述脱氨酶为胞苷脱氨酶。

[7]上述[1]~[6]中任一项所述的方法,其中,上述宿主细胞为原核生物细胞。

[8]上述[1]~[7]中任一项所述的方法,其包括:将以能够控制表达时期的形式包含有上述(a)及(b)的DNA的表达载体导入上述宿主细胞,以及为了固定双链DNA的靶位点的修饰所必须的时期,诱导该DNA的表达的步骤。

[9]上述[8]所述的方法,其中,双链DNA中的靶核苷酸序列位于对于宿主细胞所必须的基因内。

[10]核酸修饰酶复合体,其为用于修饰宿主细胞内的双链DNA的靶向位点的核酸修饰酶复合体,其含有:

(a)包含与选择的双链DNA中的靶核苷酸序列的目标链互补的序列的crRNA、和

(b)构成Cascade的蛋白质组合、和与该蛋白质组合中的任一种蛋白质形成复合体的核酸碱基转变酶。

[11]编码上述[10]所述的核酸修饰酶复合体的DNA。

发明效果

根据本发明的基因组编辑技术,由于不伴随外来DNA的插入或双链DNA切割,因此安全性方面优异,并且很有可能解决在常规方法中存在的基因重组的生物或法律争议的方案。另外,通过作为核酸序列识别模块而使用Cascade,可以利用与Cas9不同的PAM序列,高频率的导入突变的位置也不同,因此靶基因内的可导入突变位点的选择扩大了。

附图说明

[图1]示出将大肠杆菌基因组上的cas操纵子及CRISPR基因座(A)、crRNA的结构(B)、Cascade的结构(C)、Cascade识别并结合靶核苷酸序列时产生的R-loop结构(D)、以及Cas9和Cascade的靶核苷酸序列和PAM序列的比较(E)的模式图。

[图2]示出I型CRISPR-Cas系统的各亚型(I-A~I-F)的cas基因组的构成的图。

[图3]示出本发明中使用的代表性的载体的主要部分的结构(上)、以及基于由该载体产生的本发明的核酸修饰酶复合体进行的基因修饰的情形(下)的模式图。

[图4]关于实施例中使用的载体的物理的地图和关于具体的序列信息的图。

[图5-1]示出根据使用Cascade-脱氨酶复合体的rpoB基因的修饰所得到的利福平抗性菌落中的靶核苷酸序列及其附近的测序结果的图。示出了使用靶3r及靶5r的情况。

[图5-2]示出根据使用Cascade-脱氨酶复合体的rpoB基因的修饰所得到的利福平抗性菌落中的靶核苷酸序列及其附近的测序结果的图。示出了使用靶4r的情况。

具体实施方式

本发明提供不切割宿主细胞内的待修饰双链DNA链,而通过将该双链DNA中的靶核苷酸序列及其附近的核苷酸转变为其它核苷酸等来修饰该双链DNA的该靶向位点的方法(以下也称为“本发明的方法”)。该方法为包括:通过使由核酸碱基转变酶、和可与该双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块结合而成的复合体,在宿主细胞内与该双链DNA接触,而使该靶向位点,即靶核苷酸序列及其附近的核苷酸转变为其它核苷酸的步骤。

在本发明中,对双链DNA的“修饰”是指使DNA链上具有的核苷酸(例如:dC)缺失或转变为其它核苷酸(例如:dT、dA或dG)、或者向DNA链上具有的核苷酸之间插入核苷酸或者核苷酸序列。这里,对待修饰的双链DNA而言,只要是存在于宿主細胞内的双链DNA即可,没有特别限制,优选为基因组DNA。另外,双链DNA的“靶向位点”是指,核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分,或指其和该靶核苷酸序列的附近(5’上游及3’下游的任意一种或两种)。

在本发明中,“核酸序列识别模块”是指,具有对DNA链上的特定的核苷酸序列(即,靶核苷酸序列)进行特异性识别并结合的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合,使与该模块连接的核酸碱基转变酶在双链DNA的靶向位点发挥特异性的作用。

在本发明中,“核酸碱基转变酶”是指,可以通过催化DNA碱基的嘌呤或嘧啶环上的取代基转变为其它基团或原子的反应,不切割DNA链,将靶核苷酸转变为其它核苷酸的酶。

在本发明中,“核酸修饰酶复合体”是指,包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体,赋予了特定的核苷酸序列识别能力的具有核酸碱基转变酶活性的分子复合体。在此,“复合体”不仅包括由多个分子构成的形式,也包括像融合蛋白那样的,在单个分子内具有核酸序列识别模块和核酸碱基转变酶的形式。

就用于本发明的核酸碱基转变酶而言,只要可以催化上述反应即可,没有特别限制,可列举例如:催化氨基转变为羰基的脱氨基反应的,属于核酸/核苷酸脱氨酶超家族的脱氨酶。可列举优选:可以将胞嘧啶或5-甲基胞嘧啶分别转变为尿嘧啶或胸腺嘧啶的胞苷脱氨酶,可以将腺嘌呤转变为次黄嘌呤的腺苷脱氨酶,可以将鸟嘌呤转变为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,更优选可列举,作为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶的活化诱导的胞苷脱氨酶(以下,也称为AID)等。

对核酸碱基转变酶的来源没有特别限制,可以使用例如:源自七腮鳗的PmCDA1(Petromyzon marinus cytosine deaminase 1)、源自脊椎动物(例如:人、猪、牛、犬、黑猩猩等哺乳动物,鸡等鸟类,非洲爪蟾(Xenopus laevis)等两栖类,斑马鱼、香鱼、布氏鲶鱼等鱼类)的AID(Activation-induced cytidine deaminase;AICDA)。PmCDA1的CDS的碱基序列及氨基酸序列示于序列号1及2。

作为本发明的核酸修饰酶复合体的核酸序列识别模块,具体而言可以使用I型CRISPR-Cas系统。

作为具有核酸序列识别能力的分子,已知锌指(ZF)基序、TAL效应子、PPR基序等,由于ZF基序为与靶核苷酸序列特异性结合的ZF的制备效率不高,另外,结合特异性高的ZF的筛选较为复杂,因此,实际制备发挥功能的多个ZF基序并不容易。另一方面,就TAL效应子、PPR基序而言,比ZF的靶核酸序列识别的自由度高,但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质,因此在效率方面存在问题。与此相对,作为广泛分布于真细菌、古细菌的获得免疫机制的CRISPR-Cas系统是通过通过相对于与靶核苷酸序列互补的CRISPR-RNA(crRNA)来识别目的的双链DNA的序列,因此可以通过仅合成可与靶核苷酸序列形成特异性的杂合的寡DNA,以任意序列为靶标。

另外,在本说明书中“靶核苷酸序列”是指与核酸序列识别模块(具体而言为I型CRISPR-Cas)结合的双链DNA序列,将与crRNA形成杂合的链称为“目标链(targeted strand)”,将其的相反链而通过与目标链和crRNA杂交而成为一条链状的链称为“非目标链(non-targeted strand)”。另外,由于核酸碱基转变反应通常大多情况发生在已成为一条链状的非目标链上,所以在将靶核苷酸序列以一条链的形式表现时(例如在标记PAM序列时,表示靶核苷酸序列与PAM的位置关系时等),用非目标链的序列进行代表。

CRISPR-Cas系统大致分为3个类型,目前在基因组编辑中频繁使用的是以Cas9来承担DNA序列识别能力和核酸酶活性这两者的II型CRISPR-Cas系统。另一方面,在I型CRISPR-Cas系统中,功能分担于提呈包含与靶核苷酸序列互补的序列的crRNA而识别靶核苷酸序列的Cas蛋白质复合体Cascade、和具有核酸酶及解旋酶活性的Cas3。因此,即使不使用Cas9那样的已失活双链DNA的至少一条链的切割能力的突变体,也可以通过仅仅从Cas3除去Cas操纵子来避免细胞毒性强的DSB。即,通过将(a)编码在与靶核苷酸序列的目标链互补的序列(靶向序列)与crRNA的5’把手及3’把手连接而成的嵌合crRNA的DNA和、(b)编码构成Cascade复合体的蛋白质组合和核酸碱基转变酶的DNA导入具有待修饰双链DNA的宿主细胞并使其表达,可以在该宿主细胞内形成由包含靶向序列的crRNA和该蛋白质组合和Cascade形成的复合体,使其识别双链DNA上的靶核苷酸序列。在此,核酸碱基转变酶被以可与构成Cascade的蛋白质组合中的任一种蛋白质形成复合体的形态表达的方式,将编码该核酸碱基转变酶的DNA配置于上述(b)的DNA中。通过这样操作,该核酸碱基转变酶可以将Cascade复合体识别并结合的靶核苷酸序列及其附近的核酸碱基转变为其它碱基。

在I型CRISPR-Cas系统中,已知有A~F的6个亚型,任意亚型的Cascade都可以作为本发明的核酸序列识别模块使用。图2示出了I-A~I-F亚型的Cas操纵子的模式图。在各亚型的操纵子中,除了作为核酸酶/解旋酶的Cas3,在免疫获得时的参与外来基因切割的Cas1、Cas2及Cas4以外的蛋白质组合构成Cascade复合体。I-E亚型中的Cse1、Cse2、Cas7、Cas5及Cas6e也分别称为CasA、CasB、CasC、CasD及CasE(参考图1;本说明书中使用后者的命名)。在I-E亚型中,相对于1分子的crRNA,CasA、CasB、CasC、CasD及CasE分别以1:2:6:1:1分子而形成Cascade复合体(参考图1)。在I-E亚型中,认为CasA在PAM序列(ATG、AAG、AGG或GAG)的识别中承担重要的功能。

I-A、I-B及I-D亚型相对而言多分布于古细菌,I-C、I-E及I-相对而言多分布于真细菌,I-A亚型在S.solfataricus,T.tenax等,I-B亚型在Haloferax volcanii等,I-C亚型在B.halodurans等,I-E亚型在大肠杆菌等,I-F亚型在P.aeruginosa、大肠杆菌、P.atospeticum等中进行了分析。

因此,编码构成Cascade复合体的蛋白质组合的DNA,可以例如通过以源自上述菌种的基因组DNA为模板,通过基因组PCR从cas操纵子分别进行以下分离而获得:为I-A亚型则从csa5分离包含cas5的ORF的区域,为I-B亚型则从cas6分离包含cas5的ORF的区域,为I-C亚型则从cas5分离包含cas7的ORF的区域,为I-E亚型则从casA分离包含casE的ORF的区域,为I-F亚型则从csy1分离包含cas6f的ORF的区域。优选为构成Cascade复合体的蛋白质组合,为构成I-E亚型的Cascade复合体的CasA、CasB、CasC、CasD及CasE,更优选为源自大肠杆菌的CasA、CasB、CasC、CasD及CasE。源自大肠杆菌的casA、casB、casC、casD及casE的ORF序列分别为序列号4示出的核苷酸序列的第5933-7441位、第5458-5940位、第4341-5432位、第3664-4338位及第3081-3677位(均为相反链)的序列。

或者,对编码构成Cascade复合体的蛋白质组合的DNA而言,可以化学合成DNA链,或者也可以通过将合成的部分重叠的寡DNA短链利用PCR法、Gibson Assembly法进行连接,从而构建编码其全长的DNA。利用组合化学合成或PCR法或者Gibson Assembly法来构建全长DNA的优点在于,可以在整个CDS全长上设计与待导入该DNA的宿主配合的使用密码子。通过在表达异种DNA时,将该DNA序列转变为在宿主生物中使用频率高的密码子,可以期待使蛋白质表达量增大。就使用的宿主中的密码子使用频率的数据而言,可以使用例如在(公财)Kazusa DNA研究所的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html),还可以参照记载在各宿主中密码子的使用频率的文献。只要参照取得的数据和待导入的DNA序列,将该DNA序列中使用的密码子中在宿主中使用频率低的密码子,转变为编码同一氨基酸且使用频率高的密码子即可。

编码核酸碱基转变酶的DNA也可以同样地从产生该酶的细胞克隆。例如,就编码七腮鳗的PmCDA1的DNA而言,可以基于NCBI数据库登记的cDNA序列(accession No.EF094822),针对CDS的上游及下游设计适当的引物,通过RT-PCR法从源自七腮鳗的mRNA进行克隆。另外,就编码人AID的DNA而言,可以基于NCBI数据库登记的cDNA序列(accession No.AB040431),针对CDS的上游及下游设计适当的引物,例如通过RT-PCR法从源自人淋巴结的mRNA进行克隆。其它源自脊椎动物的AID同源也可以基于公知的cDNA序列信息(例如:猪(accession No.CU582981)、牛(accession No.NM_110138682)、犬(accession No.NM_001003380)、黑猩猩(accession No.NM_001071809)、鸡(accession No.NM_001243222)、非洲爪蟾(accession No.NM_001095712)、斑马鱼(accession No.AAI62573)、香鱼(accession No.AB619797)、布氏鲶鱼(accession No.NM_001200185)等),与上述同样地进行而克隆。

或者,与上述同样,也可以利用与化学合成或PCR法或者Gibson Assembly法进行组合,构建成具有适于使用的宿主细胞的表达的密码子使用的DNA形式。

经克隆的DNA可以直接或根据需要利用限制酶进行消化,或在加入适当的接头及/或核跃迁信号(在目的的双链DNA为线粒体、或叶绿体DNA的情况下,为各细胞器定位信号)之后,与编码选自构成Cascade复合体的蛋白质组合中的1个以上的蛋白质的DNA进行连接,来制备编码融合蛋白的DNA。使用的接头没有特别限定,可列举例如Flag-tag、GS接头、Strep-tag等,也包括它们的串联重复序列。

或者,也可以通过使编码Cascade复合体的构成蛋白质的DNA和编码核酸碱基转变酶的DNA,分别与编码结合结构域(例如:SH3结构域、PDZ结构域、GK结构域、GB结构域等)或者其结合配偶体的DNA进行融合,或使两种DNA与编码分离内含肽的DNA进行融合,使得构成Cascade的蛋白质和核酸碱基转变酶在宿主细胞内翻译后可以形成复合体。进一步,核酸碱基转变酶和构成Cascade的蛋白质也可以利用与作为RN适体的MS2F6、PP7等和由它们的结合蛋白质构成的RNA支架进行结合。在这些情况下,也可以根据需要在一方或双方DNA的适当的位置,连接接头及/或核跃迁信号。

对与核酸碱基转变酶形成复合体的构成Cascade的蛋白质没有特别限制,当以融合蛋白形式表达时,连接于操纵子的末端(为I-E亚型的情况下,为C末端侧的CasE的下游(参考图3)、N末端侧的CasA的上游)是在基因操作上简单的。但是,只要Cas蛋白质-核酸碱基转变酶复合体正确形成Cascade复合体(使得crRNA以可以与靶核苷酸序列的目标链形成杂合,可提呈crRNA的方式与Cas蛋白质组合会合)即可,也可以在操纵子内部插入编码核酸碱基转变酶的DNA,与编码任意Cas蛋白质(如果为I-E亚型,则为CasB、CasC或CasD)的DNA连接。例如,在I-E亚型的情况下,以相对于1分子的crRNA CasB为2分子、CasC为6分子的方式形成Cascade复合体,因此,在核酸碱基转变酶之间在不产生立体障碍的范围内,可导入多个分子的核酸碱基转变酶,存在带来突变导入效率的改善的可能性。

在使用结合结构域等来形成核酸碱基转变酶和构成Cascade的蛋白质的复合体的情况下,也同样可以通过在操纵子的末端或者内部连接编码结合结构域或者其结合配偶体的DNA,使编码核酸碱基转变酶的DNA与结合配偶体或者结合结构域进行连接而进行。

另一方面,编码在与靶核苷酸序列的目标链互补的序列(靶向序列)上连接crRNA的5’把手及3’把手而成的嵌合crRNA的DNA,在在靶向序列的5’上游及3’下游分别连接已知的5’把手及3’把手(例如:作为Cascade复合体使用源自大肠杆菌的I-E亚型的情况下,可以设计作为5’把手连接了ataaaccg、作为3’把手连接了gagttccccgcgccagcgggg(序列号3)而成的寡DNA序列,使用DNA/RNA合成仪进行化学合成。使用以下亚型时,可以分别使用记载于下述文献的5’把手及3’把手:使用源自S.solfataricus的I-A亚型时:J.Biol.Chem.286(24):21643-21656(2011),使用源自H.volcanii的I-B亚型时:J.Biol.Chem.287(40):33351-33365(2012),使用源自B.halodurans的I-C亚型时:Structure 20:1574-1584(2012),使用源自P.aeruginosa的I-F亚型时:PNAS 108(25):10092-10097(2011)。

对靶向序列的长度而言,只要是正确提呈Cascade复合体,可对于靶核苷酸序列的目标链特异性结合即可,没有特别限制,可列举例如30~45个核苷酸,在为I-C、I-E及I-F亚型时,优选为32~33个核苷酸,在为I-A及I-B亚型时,优选为34-44个核苷酸。

I型CRISPR-Cas系统中的靶核苷酸序列受到基于亚型所固有的PAM序列的限制。在为I-E亚型的情况下,需要在靶核苷酸序列的非目标链的5’上游侧,以5’→3’的方向邻接AAG、ATG、AGG、GAG中的任一个。例如,在I-E亚型中,在将32个核苷酸长的靶向序列与脱氨酶组合并使用的情况下,如后述的实施例所示,利用PAM序列的下游32~44个碱基中存在的胞嘧啶来发生碱基转变,突变被导入的频率较高。

由于与I型CRISPR-Cas系统和核酸碱基转变酶组合而成的本发明的核酸修饰酶复合体不伴随DNA双链切割(DSB),因此,能够进行毒性较低的基因组编辑,本发明的基因修饰方法可以适用于范围较广的生物材料。因此,就待导入(a)编码靶向序列与crRNA的5’把手及3’把手连接而成的嵌合crRNA的DNA和、(b)编码构成Cascade复合体的蛋白质组合和核酸碱基转变酶的DNA的细胞而言,从作为原核生物的大肠杆菌等细菌、作为低等真核生物的酵母等微生物的细胞,到包括人等哺乳动物的脊椎动物、昆虫、植物等高等真核生物的细胞,可以包括所有生物种类的细胞。

包含上述(a)及(b)的DNA的表达载体,例如可以通过将该DNA连接于适当的表达载体中的启动子的下游来制造。(a)及(b)的DNA可以装配入相同载体上,也可以装配入不同的载体上。

作为表达载体,可以使用源自大肠杆菌的质粒(例如,pBR322、pBR325、pUC12、pUC13);源自枯草杆菌的质粒(例如,pUB110、pTP5、pC194);源自酵母的质粒(例如,pSH19、pSH15);昆虫细胞表达质粒(例如:pFast-Bac);动物细胞表达质粒(例如:pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo);λ噬菌体等噬菌体;杆状病毒等昆虫pFast载体(例如:BmNPV、AcNPV);逆转录病毒、痘苗病毒、腺病毒等动物病毒载体等。

作为启动子,只要是对应于基因表达的宿主的适当的启动子即可。由于伴随DSB的常规法的毒性的缘故,有时宿主细胞的存活率显著降低,因此期望通过使用诱导启动子增加诱导开始为止的细胞数量,但由于表达本发明的核酸修饰酶复合体也可得到充分的细胞增殖,因此可以无限制地使用构成启动子。

当宿主是大肠杆菌的情况下,优选trp启动子、lac启动子、recA启动子、λpL启动子、λpR启动子、lpp启动子、T7启动子等。

当宿主是芽孢杆菌属的情况下,优选SPO1启动子、SPO2启动子、penP启动子等。

当宿主是酵母的情况下,优选Gal1/10启动子、PHO5启动子、PGK启动子、GAP启动子、ADH启动子等。

当宿主是昆虫细胞的情况下,优选多角体蛋白启动子、P10启动子等。

例如:宿主为动物细胞的情况下,可以使用SRα启动子、SV40启动子、LTR启动子、CMV(巨细胞病毒)启动子、RSV(劳斯肉瘤病毒)启动子、MoMuLV(Moloney小鼠白血病病毒)LTR、HSV-TK(单纯疱疹病毒胸苷激酶)启动子等。其中,优选CMV启动子、SRα启动子等。

当宿主是植物细胞的情况下,优选CaMV35S启动子、CaMV19S启动子、NOS启动子等。

另外,对编码嵌合crRNA的DNA而言,作为启动子,也可以使用pol III类的启动子(例如,SNR6、SNR52、SCR1、RPR1、U6、H1启动子等)及终止子(例如,T6序列)。

当将原核细胞、酵母等低等真核细胞作为宿主时,编码构成Cascade的蛋白质组合的DNA,可以作为操纵子表达于多顺反子(参考图3),当将动物细胞等高等真核细胞作为宿主时,可以向编码各Cas蛋白质的DNA之间插入能够表达多顺反子的插入序列(例如:IRES序列,源自口蹄疫病毒的2A序列等)。或者,也可以在各DNA的5’上游插入启动子,使其表达于单顺反子。

编码嵌合crRNA的DNA也可以串联地插入至1个启动子的下游(参考图3)。在该情况下,搭载于各嵌合crRNA的靶向序列可以为相同序列也可以为不同的序列。在为不同序列的情况下,这些序列可以以相同基因内的不同区域为靶核苷酸序列,也可以以不同的基因的区域为靶核苷酸序列。由于各嵌合crRNA单元间的连接位点为3’把手-5’把手的crRNA的重复部分的序列,得到特征的发夹结构的局部的二次结构,因此可认为被宿主细胞的内在的非特异性RNase所切割,即使在不具有内在的I型CRISPR-Cas系统的宿主细胞中,也可以在细胞内切割各嵌合crRNA单元。当然,也可以向各嵌合crRNA的上游插入启动子而逐个进行表达。

作为表达载体,除了上述以外,可以根据需要使用含有增强子、剪接信号、终止子、polyA添加信号、选择标记如药物抗性基因、营养缺陷型互补基因等、复制起点等的载体。

可以通过将包含(a)编码嵌合crRNA的DNA和、(b)编码构成Cascade的蛋白质组合和核酸碱基转变酶的DNA的表达载体导入宿主细胞,通过培养该宿主细胞,在细胞内表达本发明的核酸修饰酶复合体。

作为宿主,可以使用例如:埃希氏菌属、芽孢杆菌属、酵母、昆虫细胞、昆虫、动物细胞等。

作为埃希氏杆菌属,可以使用例如:大肠杆菌(Escherichia coli)K12?DH1[Proc.Natl.Acad.Sci.USA,60,160(1968)]、大肠杆菌JM103[Nucleic Acids Research,9,309(1981)]、大肠杆菌JA221[Journal of Molecular Biology,120,517(1978)]、大肠杆菌HB101[Journal of Molecular Biology,41,459(1969)]、大肠杆菌C600[Genetics,39,440(1954)]等。

作为芽孢杆菌属,可以使用例如:枯草芽孢杆菌(Bacillus subtilis)MI114[Gene,24,255(1983)]、枯草芽孢杆菌207-21[Journal of Biochemistry,95,87(1984)]等。

另外,对于具有内在性的I型CRISPR-Cas系统的细菌,优选使用已缺陷了内在性的Cas3的突变株。

作为酵母,可以使用例如:酿酒酵母(Saccharomyces cerevisiae)AH22、AH22R-、NA87-11A、DKD-5D、20B-12、粟酒裂殖酵母(Schizosaccharomyces pombe)NCYC1913、NCYC2036、巴斯德毕赤酵母(Pichia pastoris)KM71等。

作为昆虫细胞,可以使用例如:在病毒为AcNPV的情况下,源自甘蓝夜蛾的幼虫来源的株系细胞(Spodoptera frugiperda cell;Sf细胞)、源自Trichoplusia ni的中肠MG1细胞、源自Trichoplusia ni的卵的High FiveTM细胞、源自Mamestra brassicae的细胞、源自Estigmena acrea的细胞等。在病毒为BmNPV的情况下,作为昆虫细胞,可以使用源自蚕的株系细胞(Bombyx mori N细胞;BmN细胞)等。作为该Sf细胞,可以使用例如:Sf9细胞(ATCC CRL1711)、Sf21细胞[以上,In Vivo,13,213-217(1977)]等。

作为昆虫,可以使用例如:蚕的幼虫、果蝇、蟋蟀等[Nature,315,592(1985)]。

作为动物细胞,可以使用例如:猴COS-7细胞、猴Vero细胞、中国仓鼠卵巢(CHO)细胞、dhfr基因缺陷CHO细胞、小鼠L细胞、小鼠AtT-20细胞、小鼠骨髓瘤细胞、大鼠GH3细胞、人FL细胞等细胞株、人及其它哺乳动物的iPS细胞、ES细胞等多功能性干细胞、由各种组织制备的初代培养细胞。进一步,也可以使用斑马鱼胚胎、非洲爪蟾卵母细胞等。

作为植物细胞,可以使用从各种植物(例如:水稻、小麦、玉米等谷物,番茄、黄瓜、茄子等商品作物,康乃馨、洋桔梗等园艺植物,烟草、拟南芥等实验植物等)制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片等。

上述任意宿主细胞可以为单倍体(一倍体)、多倍体(例如,二倍体、三倍体、四倍体等)。常规的突变导入方法中,作为原则仅向同源染色体的一条中导入突变而形成杂合基因型,因此,如果不是优势突变,就不会表达需要的特性,而纯合化耗时耗力,大多情况不方便。与此相对,根据本发明,由于可以对基因组内的同源染色体上的等位基因全部导入突变,因此即使为劣势突变,也可以存在在该代表达期望的特质的可能性,可克服常规法的症结。

对表达载体的导入而言,可以根据宿主的种类,按照公知的方法(例如:溶菌酶法、感受态法、PEG法、CaCl2共沉淀法、电穿孔法、显微注射法、粒子枪法、脂质转化法、农杆菌法等)进行实施。

对于大肠杆菌可以根据例如:Proc.Natl.Acad.Sci.USA,69,2110(1972)、Gene,17,107(1982)等中记载的方法进行转化。

对于芽孢杆菌属,可以按照例如:Molecular&General Genetics,168,111(1979)等中记载的方法进行载体导入。

对于酵母,可以按照例如:Methods in Enzymology,194,182-187(1991),Proc.Natl.Acad.Sci.USA,75,1929(1978)等中记载的方法进行载体导入。

对于昆虫细胞及昆虫,可以按照例如:Bio/Technology,6,47-55(1988)等中记载的方法进行载体导入。

对于动物细胞,可以按照例如:细胞工程学增刊8新细胞工程学实验方案,263-267(1995)(秀润公司发行),Virology,52,456(1973)中记载的方法进行载体导入。

对于已导入载体的细胞的培养,可以根据宿主的种类,按照公知的方法实施。

例如,在培养大肠杆菌或芽孢杆菌的情况下,作为用于培养的培养基优选液体培养基。另外,培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。这里,作为碳源,可以举出例如:葡萄糖、糊精、可溶性淀粉、蔗糖等;作为氮源,可以举出例如:铵盐类、硝酸盐类、玉米浆、蛋白胨、酪蛋白、肉浸膏、大豆饼、马铃薯提取液等无机或有机物质;作为无机物,可以举出例如:氯化钙、磷酸二氢钠、氯化镁等。另外,也可以向培养基添加酵母提取物、维生素类、生长促进因子等。培养基的pH优选为约5~约8。

作为培养大肠杆菌时的培养基,例如,优选包含葡萄糖、酪蛋白氨基酸的M9培养基[Journal of Experiments in Molecular Genetics,431-433,Cold Spring Harbor Laboratory,New York 1972]。根据需要,为了使启动子有效地工作,例如也可以向培养基添加3β-吲哚基丙烯酸的那样的试剂。大肠杆菌的培养通常在约15~约43℃进行。根据需要,可以进行通气、搅拌。

芽孢杆菌的培养通常在约30~约40℃进行。根据需要,可以进行通气、搅拌。

作为培养酵母时的培养基,可列举例如:Burkholder最小培养基[Proc.Natl.Acad.Sci.USA,77,4505(1980)]、0.5%含酪蛋白氨基酸的SD培养基[Proc.Natl.Acad.Sci.USA,81,5330(1984)]等。培养基的pH优选为约5~约8。培养通常在约20℃~约35℃进行。可以根据需要进行通气、搅拌。

作为培养昆虫细胞或昆虫时的培养基,可以使用例如向Grace's Insect Medium[Nature,195,788(1962)]中适当添加了灭活的10%牛血清等添加物的培养基等。培养基的pH优选为约6.2~约6.4。培养通常在约27℃进行。可以根据需要进行通气、搅拌。

作为培养动物细胞时的培养基,可以使用例如:包含约5~约20%的胎牛血清的最小必要培养基(MEM)[Science,122,501(1952)]、Dulbecco改良的Eagle培养基(DMEM)[Virology,8,396(1959)]、RPMI 1640培养基[The Journal of the American Medical Association,199,519(1967)]、199培养基[Proceeding of the Society for the Biological Medicine,73,1(1950)]等。培养基的pH优选为约6~约8。培养通常在约30℃~约40℃进行。可以根据需要进行通气、搅拌。

作为培养植物细胞的培养基,可以使用MS培养基、LS培养基、B5培养基等。培养基的pH优选为约5~约8。培养通常在约20℃~约30℃进行。可以根据需要进行通气、搅拌。

如上所述操作,可以在细胞内表达核酸序列识别模块(Type I CRISPR-Cas)和核酸碱基转变酶的复合体,即核酸修饰酶复合体。

如果由已导入细胞内的表达载体表达(a)嵌合crRNA和、(b)构成Cascade的蛋白质组合和核酸碱基转变酶与的复合体,则该蛋白质组合形成Cascade复合体而提呈该嵌合crRNA。如果Cascade复合体特异性识别并结合目标的双链DNA(例如,基因组DNA)内的靶核苷酸序列,则通过与构成Cascade的蛋白质组合连接的核酸碱基转变酶的作用,靶向位点(在靶核苷酸序列的全部或者一部分或它们的附近的个基)的有义链或者反义链发生碱基转变,在双链DNA内产生错配(例如:将PmCDA1、AID等胞苷脱氨酶作为核酸碱基转变酶使用的情况下,靶向位点的有义链或者反义链上的胞嘧啶被转变为尿嘧啶,产生U:G或者G:U错配)。通过以下导入各种突变:该错配未被正确修复,或修复使得相反链的碱基与已转变的链的碱基成对(上述例子中,为T-A或者A-T),修复时进一步取代为其它核苷酸(例如:U→A、G),或者发生1个~数十个碱基的缺失或者插入。

常规型的人工核酸酶中,由于伴随DNA双链切割(DSB),因此,对基因组内的序列进行靶向时,发生染色体的无序的切割(脱靶切割)导致的增殖障碍和细胞死亡。该影响在众多的微生物、原核生物中是特别致命的,阻碍了适用性。在本发明中,由于通过不切割DNA的对DNA碱基上的取代基的转变反应(特别是脱氨基反应)进行突变导入,因此,可以实现毒性的大幅降低。

另外,在本发明的双链DNA的修饰中,除了靶向位点以外,不会妨碍该双链DNA的切割的产生。然而,本发明的最大的一个优点是避免了由脱靶(off-target)切割导致的毒性,考虑到原则上可以适用于任何生物种中,则在优选的一种实施形态中,本发明的双链DNA的修饰,不仅在选择的双链DNA的靶向位点,在其以外的位点中也不伴随DNA链的切割。

本发明人发现了:在使用Type II CRIPR-Cas系统核酸序列作为识别模块、且使用核酸碱基转变酶作为AID的情况下,优选设计靶核苷酸序列,使得希望导入突变的C(或者其相反链的G)在离靶核苷酸序列的5’端2~5个核苷酸的位置。在为II型CRISPR-Cas系统的情况下,靶向序列的长度可以在15~30核苷酸、优选为18~25个核苷酸之间适当设定。由于靶向序列为与靶核苷酸序列的目标链互补的序列,因此通过改变靶向序列长度,导致靶核苷酸序列长度也发生变化,但无论核苷酸长度如何,都保持对存在于离5’端2~5个核苷酸的位置的C或G易于导入突变的规律性。因此,通过适当选择靶核苷酸序列(作为其互补链的靶向序列)的长度,可以移动能够导入突变的碱基的部位。由此,虽然可以部分解除基于PAM(在为SpCas9的情况下,为NGG)的限制,但并不完全。

另一方面,在作为核酸序列识别模块使用I-E型CRISPR-Cas系统(靶向序列32个核苷酸),作为核酸碱基转变酶使用AID的情况,主要在PAM(在为源自大肠杆菌的I-E亚型的情况下,为AAG、ATG、AGG、GAG)的下游32~44个碱基的范围内导入突变。如上所述,PAM序列根据I型亚型而不同,但均在2~3个核苷酸(例如,在I-A亚型中为CCN,在I-F亚型中为CC)中自由度较高。另外,对可见的以高频率突变导入的范围而言,也比使用II型CRISPR-Cas系统的情况更宽。虽然对于靶向序列的长度的允许性仍存在研究的余地,但如果使用I-A或I-B亚型,则可以设定更长的靶核苷酸序列。

像这样,通过将I型CRISPR-Cas系统作为核酸序列识别模块来利用,使得在II型CRISPR-Cas系统中难以导入突变的位点也能够进行突变导入,所以可以相互补充地利用。

如图3所示,可以将包含多个靶向序列的嵌合crRNA导入宿主细胞。本发明人发现,在使用II型CRISPR-Cas系统的情况下,与以单独的核苷酸序列为靶相比,通过制备对于接近的多个靶核苷酸序列的序列识别模块并同时使用,突变导入效率大幅升高。对其效果而言,由使得两个靶核苷酸序列的一部分发生重复的情况可知,即使在两者分开600bp左右的情况下,也实现相同的突变诱导。另外,在靶核苷酸序列存在于相同方向(目标链存在于相同链上)的情况、以及在对向(目标链存在于双链DNA的各自链上)的情况中的任一种情况,均可以发生突变导入。

因此,在使用I型CRISPR-Cas系统的本发明中,也通过以多个核苷酸序列为靶,可以期待突变衍生效率的进一步改善。

为了使本发明的核酸修饰酶复合体在宿主细胞内表达,因此如上所述将包含编码该核酸修饰酶复合体的DNA的表达载体导入宿主细胞,但为了有效地导入突变,因此优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发,确保在宿主细胞内导入能够自主复制的表达载体(质粒等),但由于该质粒等为外来DNA,因此,优选在顺利实现了导入突变后,迅速地将其除去。因此,虽然是根据宿主细胞的种类等不同而改变的,但优选例如:从导入表达载体到经过6小时~2天后,使用在本技术领域周知的各种质粒除去法,从宿主细胞除去已导入的质粒。

或者,只要可得到足以进行突变导入的核酸修饰酶复合体的表达,也优选使用在宿主细胞内不具有自主复制能力的表达载体(例如:缺乏在宿主细胞中发挥功能的复制起点及/或编码对复制必需的蛋白质的基因的载体等),通过一过性地表达向目的的双链DNA导入突变。

由于在使本发明的核酸修饰酶复合体在宿主细胞内进行表达,并进行核酸碱基转变反应期间,靶基因的表达被抑制,因此迄今为止难以将对宿主细胞的生存所必需的基因作为靶基因直接进行编辑(产生宿主的生长障碍、突变导入效率不稳定、对与靶标不同的位点的突变等副作用)。在本发明中,通过为了在期望的时期发生核酸碱基转变反应、固定靶向位点的修饰,而仅在必须的期间一过性地使本发明的核酸修饰酶复合体在宿主细胞内表达,成功实现了必需基因的直接编辑。对发生核酸碱基转变反应、固定靶向位点的修饰的必需的期间而言,虽然根据宿主细胞的种类、培养条件等不同,但认为通常需要2~20代。例如,在宿主细胞为酵母、细菌(例如,大肠杆菌)的情况下,需要在5~10代之间,诱导核酸修饰酶复合体的表达。本领域技术人员可以基于使用的培养条件下的宿主细胞的倍增时间,适当确定适宜的表达诱导期。就本发明的编码核酸修饰酶复合体的核酸的表达诱导期而言,在对宿主细胞不产生副作用的范围,也可以超出上述“固定靶向位点的修饰的必需的时期”并延长。

作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法,可列举制备以能够控制表达期的形态,包含编码该核酸修饰酶复合体的DNA的构建体(表达载体),并导入宿主细胞内的方法。“作为能够控制表达期的形态”,具体而言,可列举将编码本发明的核酸修饰酶复合体的DNA,置于诱导性的调节区的操纵下的形态。对“诱导性的调节区域”没有特别限制,例如,在细菌(例如,大肠杆菌)、酵母等微生物细胞中,可列举温度敏感性(ts)突变阻遏物和操纵其的操纵基因的操纵子(operon)(参考图4)。作为ts突变阻遏物,可列举例如源自λ噬菌体的cI阻遏物的ts突变体,但不限于这些。在为λ噬菌体cI阻遏物(ts)的情况下,在30℃以下(例如,28℃)与操纵基因结合而抑制下游的基因表达,但在37℃以上(例如,42℃)的高温从操纵基因解离,因此可诱导基因表达。因此,通过将已导入编码核酸修饰酶复合体的DNA的宿主细胞,通常在30℃以下培养,在适当的时期将温度升高至37℃以上并培养一定时期,使其进行核酸碱基转变反应,并在向靶基因导入突变后迅速降回30℃以下,从而可以使得抑制靶基因表达的时期最短,即使在对宿主细胞所必需的基因进行靶向的情况下,也可以压抑副作用并有效地进行编辑。

在利用温度敏感性突变的情况下,可以通过例如,将对载体的自主复制所必需的蛋白质的温度敏感性突变体,搭载于包含编码本发明的核酸修饰酶复合体的DNA载体,从而在该核酸修饰酶复合体表达之后,该载体不能迅速地自主复制,随着细胞分裂自然脱落。作为这样的温度敏感性突变蛋白质,可列举pSC101ori的复制所必须的Rep101ori的温度敏感性突变体(参考图4),但不限于这些。对Rep101ori(ts)而言,虽然在30℃以下(例如,28℃)能够作用于pSC101ori并进行质粒的自主复制,但处于37℃以上(例如,42℃)时失去功能,质粒不能自主复制。因此,通过与上述λ噬菌体的cI阻遏物(ts)组合使用,可以同时进行本发明的核酸修饰酶复合体的一过性地表达和质粒除去。

另一方面,在将动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞的情况下,将编码本发明的核酸修饰酶复合体的DNA,在诱导启动子(例如,金属硫蛋白启动子(利用重金属离子诱导)、热休克蛋白质启动子(利用热休克诱导)、Tet-ON/Tet-OFF类启动子(利用添加或除去四环素或其衍生物进行诱导)、类固醇响应启动子(利用类固醇激素或其衍生物进行诱导)等)的控制下导入宿主细胞内,在适当的时期向培养基添加诱导物质(或从培养基除去)来诱导该核酸修饰酶复合体的表达,培养一定时期而进行核酸碱基转变反应,向靶基因导入突变后,除去(或再添加)诱导物质,从而可以实现核酸修饰酶复合体的一过性地表达。

需要说明的是,在大肠杆菌等原核细胞中也可以利用诱导启动子。作为这样的诱导启动子,可列举例如:lac启动子(利用IPTG诱导)、cspA启动子(利用冷休克诱导)、araBAD启动子(利用阿拉伯糖诱导)等,但不限于这些。

或者,上述诱导启动子也可以用作将动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞时的载体除去方法。即,通过使载体搭载在宿主细胞发挥功能的复制起点、编码对其复制所必需的蛋白质的核酸(例如,如果是动物细胞,则为SV40ori和大T抗原、oriP和EBNA-1等),利用上述诱导启动子来操纵编码该蛋白质的核酸的表达,虽然在诱导物质的存在下,载体能够进行自主复制,但如果除去诱导物质则不能进行自主复制,随着细胞分裂,载体将自然脱落(在Tet-OFF类载体中,相反地,通过添加四环素、多西环素导致不能进行自主复制)。

以下,根据实施例对本发明进行说明。但是,本发明并不限于这些实施例。

实施例

(1)CRISPR/Cascade-PmCDA1表达载体的制备

在源自大肠杆菌DL21(DE3)株基因组的Cascade区域中,通过PCR分离了包含从CasA到CasE的ORF的操纵子,将在CasE的下游以3xFlag标签作为接头而与PmCDA1基因融合而成的复合基因片段,导入温度诱导型载体的pR启动子下游。作为crRNA区域,导入了作为启动子使用pL并在其下游在5’把手序列及3’把手序列之间装配有32bp的靶向序列(参考图5)的那些。将得到的表达载体的全长DNA序列示于序列号4,将该载体的模式图和序列信息示于图4。向序列号4中n32的部分插入靶向序列。

(2)使用CRISPR/Cascade-PmCDA1的rpoB基因的修饰

在基因组编辑试验中,使用了核酸酶cas3缺陷大肠杆菌株(JW2731)。通过常规方法制备了大肠杆菌感受态细胞,利用上述(1)中制备成的表达载体进行转化。在基于SOC培养基(500μl)的恢复培养(约2.5小时)之后,利用药品选择培养基(LB+10μg/ml氯霉素(Cm))2.5ml进行稀释,在非诱导温度的28℃中培养大约一夜。之后,利用相同的培养基稀释20倍,于37℃振荡培养约4小时而进行表达诱导。制备该培养液的10倍稀释系列,通过含有或不含Cm的突变选择板培养基(LB+25μg/ml利福平(Rif))进行选择,获得了Rif抗性菌落。

将得到的菌落通过PCR而扩增了rpoB基因内的靶区域,通过桑格测序而鉴定突变。结果示于图5-1及5-2。在将靶核苷酸序列设定于32个核苷酸时,主要使存在于从PAM序列到32~44个碱基下游的胞嘧啶发生转变。

包含在此提到的专利及专利申请说明书的全部出版物中记载的内容,通过在此引用,将其整体与已写明的程度相同地并入本说明书。

工业实用性

根据本发明,可以不伴随外来DNA的插入也不伴随DNA双链的切割,安全地向任意生物种类导入部位特异性的突变,所以在向有用微生物的分子育种、基因治疗的应用中有用。

本申请以在日本申请的专利申请日本特愿2015-178023(申请日:2015年9月9日)为基础,并将其所有内容并入本说明书。

序列表

<110> 国立大学法人神户大学(NATIONAL UNIVERSITY CORPORATION KOBE UNIVERSITY)

<120> 用于特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体

<130> 092522

<150> JP 2015-178023

<151> 2015-09-09

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 624

<212> DNA

<213> 七鳃鳗(Petromyzon marinus)

<220>

<221> CDS

<222> (1)..(624)

<400> 1

atg acc gac gct gag tac gtg aga atc cat gag aag ttg gac atc tac 48

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

acg ttt aag aaa cag ttt ttc aac aac aaa aaa tcc gtg tcg cat aga 96

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

tgc tac gtt ctc ttt gaa tta aaa cga cgg ggt gaa cgt aga gcg tgt 144

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

ttt tgg ggc tat gct gtg aat aaa cca cag agc ggg aca gaa cgt ggc 192

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

att cac gcc gaa atc ttt agc att aga aaa gtc gaa gaa tac ctg cgc 240

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

gac aac ccc gga caa ttc acg ata aat tgg tac tca tcc tgg agt cct 288

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

tgt gca gat tgc gct gaa aag atc tta gaa tgg tat aac cag gag ctg 336

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

cgg ggg aac ggc cac act ttg aaa atc tgg gct tgc aaa ctc tat tac 384

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

gag aaa aat gcg agg aat caa att ggg ctg tgg aac ctc aga gat aac 432

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

ggg gtt ggg ttg aat gta atg gta agt gaa cac tac caa tgt tgc agg 480

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

aaa ata ttc atc caa tcg tcg cac aat caa ttg aat gag aat aga tgg 528

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

ctt gag aag act ttg aag cga gct gaa aaa cga cgg agc gag ttg tcc 576

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser

180 185 190

att atg att cag gta aaa ata ctc cac acc act aag agt cct gct gtt 624

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210> 2

<211> 208

<212> PRT

<213> 七鳃鳗

<400> 2

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser

180 185 190

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210> 3

<211> 21

<212> DNA

<213> 大肠杆菌(Escherichia coli)

<400> 3

gagttccccg cgccagcggg g 21

<210> 4

<211> 10821

<212> DNA

<213> Artificial Sequence

<220>

<223> 携带嵌合crRNA和Cascade-PmCDA1的表达载体(Expression vector carrying chimeric crRNA and Cascade-PmCDA1)

<220>

<221> misc_feature

<222> (8490)..(8521)

<223> n为a、c、g或t

<400> 4

gtcaatgccg agcgaaagcg agccgaaggg tagcatttac gttagataac cccctgatat 60

gctccgacgc tttatataga aaagaagatt caactaggta aaatcttaat ataggttgag 120

atgataaggt ttataaggaa tttgtttgtt ctaatttttc actcattttg ttctaatttc 180

ttttaacaaa tgttcttttt tttttagaac agttatgata tagttagaat agtttaaaat 240

aaggagtgag aaaaagatga aagaaagata tggaacagtc tataaaggct ctcagaggct 300

catagacgaa gaaagtggag aagtcataga ggtagacaag ttataccgta aacaaacgtc 360

tggtaacttc gtaaaggcat atatagtgca attaataagt atgttagata tgattggcgg 420

aaaaaaactt aaaatcgtta actatatcct agataatgtc cacttaagta acaatacaat 480

gatagctaca acaagagaaa tagcaaaagc tacaggaaca agtctacaaa cagtaataac 540

aacacttaaa atcttagaag aaggaaatat tataaaaaga aaaactggag tattaatgtt 600

aaaccctgaa ctactaatga gaggcgacga ccaaaaacaa aaatacctct tactcgaatt 660

tgggaacttt gagcaagagg caaatgaaat agattgacct cccaataaca ccacgtagtt 720

attgggaggt caatctatga aatgcgatta agctttttct aattcacata agcgtgcagg 780

tttaaagtac ataaaaaata taatgaaaaa aagcatcatt atactaacgt tataccaaca 840

ttatactctc attatactaa ttgcttattc caatttccta ttggttggaa ccaacaggcg 900

ttagtgtgtt gttgagttgg tactttcatg ggattaatcc catgaaaccc ccaaccaact 960

cgccaaagct ttggctaaca cacacgccat tccaaccaat agttttctcg gcataaagcc 1020

atgctctgac gcttaaatgc actaatgcct taaaaaaaca ttaaagtcta acacactaga 1080

cttatttact tcgtaattaa gtcgttaaac cgtgtgctct acgaccaaaa gtataaaacc 1140

tttaagaact ttcttttttc ttgtaaaaaa agaaactaga taaatctctc atatctttta 1200

ttcaataatc gcatcagatt gcagtataaa tttaacgatc actcatcatg ttcatattta 1260

tcagagctcg tgctataatt atactaattt tataaggagg aaaaaataaa gagggttata 1320

atgaacgaga aaaatataaa acacagtcaa aactttatta cttcaaaaca taatatagat 1380

aaaataatga caaatataag attaaatgaa catgataata tctttgaaat cggctcagga 1440

aaagggcatt ttacccttga attagtacag aggtgtaatt tcgtaactgc cattgaaata 1500

gaccataaat tatgcaaaac tacagaaaat aaacttgttg atcacgataa tttccaagtt 1560

ttaaacaagg atatattgca gtttaaattt cctaaaaacc aatcctataa aatatttggt 1620

aatatacctt ataacataag tacggatata atacgcaaaa ttgtttttga tagtatagct 1680

gatgagattt atttaatcgt ggaatacggg tttgctaaaa gattattaaa tacaaaacgc 1740

tcattggcat tatttttaat ggcagaagtt gatatttcta tattaagtat ggttccaaga 1800

gaatattttc atcctaaacc taaagtgaat agctcactta tcagattaaa tagaaaaaaa 1860

tcaagaatat cacacaaaga taaacagaag tataattatt tcgttatgaa atgggttaac 1920

aaagaataca agaaaatatt tacaaaaaat caatttaaca attccttaaa acatgcagga 1980

attgacgatt taaacaatat tagctttgaa caattcttat ctcttttcaa tagctataaa 2040

ttatttaata agtaagttaa gggatgcata aactgcatcc cttaacttgt ttttcgtgta 2100

cctatttttt gtgaatcgcc attcgccatt caggctgcgc aactgttggg aagggcgatc 2160

ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt 2220

aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt 2280

cgagctcggt acccggccgc aaacaacaga taaaacgaaa ggcccagtct ttcgactgag 2340

cctttcgttt tatttgatgc ctgtcaagta acagcaggac tcttagtggt gtggagtatt 2400

tttacctgaa tcataatgga caactcgctc cgtcgttttt cagctcgctt caaagtcttc 2460

tcaagccatc tattctcatt caattgattg tgcgacgatt ggatgaatat tttcctgcaa 2520

cattggtagt gttcacttac cattacattc aacccaaccc cgttatctct gaggttccac 2580

agcccaattt gattcctcgc atttttctcg taatagagtt tgcaagccca gattttcaaa 2640

gtgtggccgt tcccccgcag ctcctggtta taccattcta agatcttttc agcgcaatct 2700

gcacaaggac tccaggatga gtaccaattt atcgtgaatt gtccggggtt gtcgcgcagg 2760

tattcttcga cttttctaat gctaaagatt tcggcgtgaa tgccacgttc tgtcccgctc 2820

tgtggtttat tcacagcata gccccaaaaa cacgctctac gttcaccccg tcgttttaat 2880

tcaaagagaa cgtagcatct atgcgacacg gattttttgt tgttgaaaaa ctgtttctta 2940

aacgtgtaga tgtccaactt ctcatggatt ctcacgtact cagcgtcggt catcctagac 3000

ttatcgtcat cgtctttgta atcaatatca tgatccttgt agtctccgtc gtggtcctta 3060

tagtctccgg actcgagtcc cagtggagcc aaagatagca agccacatcc catcgattta 3120

gctggcccaa taccttgctg tacaagatct attaacgctg gcgcgtcgtt gatggtgagc 3180

acaccttcaa agcaaaccgt ttggatcttt ccacttttac catcaccaga aaaatactgt 3240

ggccgttccg atatgggatg cacatcttca acgcgcgccg cattgcccaa tttacgttgc 3300

aaccacgcga tttgttctgc ttcttttatt aacggaaccc gacagcgttt aatattccct 3360

ttactgtcca ggcgcttttg attgtcgaga atagttttga tcggatttgc ccgaagccga 3420

aaatagagtg gaacaccaac ctgaagttga aattcaacct gtttagtttt aatgactgtc 3480

gcaacggcag ttgaaacagg catttgcgct gactgcaata aaacatgaca gccttctggt 3540

gtgtttcgct tctcaacatg aaaaagaaaa tcacgagcag catccggtct gtttggaaat 3600

aaatgccata atccctggtg aagttggtaa agatccctgc tccaggccct ggcaatgatg 3660

actttactga gatacatcca tacctccttt aatcacatac cattctcggg aagcaaattg 3720

tcgaggcaag gtgatcatcg gttcgtcgcg cgccgtaaat tttaaatgat gccctgtaac 3780

tgattcctca ctatatatat cgccgccaac gggctcataa tttaatagcg ccttctgagg 3840

atccgatgcc tgacatgtcc ccaaaaaaag cgggtgtgtt agtgggcaac ttctccgccc 3900

caggtaaggt gtataccgag gctttaatac tgctttttca agttctgaga taaccatcgt 3960

tgcatggggt gttaaccaga gagcgacggt aaaggaggca tcacataaat attcgcgcca 4020

tgtttgaatc gtttcatgac ttttcaaacc acggtaatct tctcgcgctc caaggactgt 4080

atggtaatca cgcaaccccg ttacagacac acgacgatcg tcaagaatga gttcatcgca 4140

gcgcactgca aattgcacac tctctgataa cgcctgtaat gaagaagtat catcacgttg 4200

gatcccaaga caagccccga gtagccctaa taacccgctt cgggtcggaa atcttccggt 4260

aggtcgcgtt ccttcaaagg tcggctgccc ccaggcttgc attggcccag caagccgcaa 4320

gatcaaataa gatctcatgt tcacgcctcg ccattattac gaacccagga ttttaactgt 4380

tctaaagtag gcatttgttt aacttgagca gtaattgggt ctacatcaga taagctgaat 4440

tgcgcagcag ctccgttcag accatatcca ttggcaacgc gatcccaata ttgattaaac 4500

gcctgtatag acggttgcaa aaagccatct ttcgctttaa ccgctttttc aaaagcattt 4560

gccatagaaa gtggcatatc ggagaaatta accattacca tatccgcagg gttaaaagcg 4620

gcataagtac gctgttttgc tccagggacc tctgttgcca gcatatgaac aacatgggtt 4680

gcaatttcca gagcctgctc cctggaggca ccacctaaat tttcctgaag ttgagcgagg 4740

ttaatgttgg cataacgata aaaaacaccc gatgaaaatt cctgagttcc cagatgtgca 4800

gaaccttgtt cctgtaaatc atctacagcg gtgaaccagt caatatcaga atcaacctga 4860

tgagtagtga tcgcatgcgc aatggacatt gcaccatcaa cttttcccaa ctcagtcatc 4920

atgccgctgg ttgccattct tccactaagc gcaatatcaa caccctgctg taaattcaca 4980

cgtatggcgg caatatcttc cttaagaact ttgagcagct ttttatcatc cagattatca 5040

gcctctgctt ttgcaacctg ctcacagaac caggctattt ctcccacaac ccagggagta 5100

accgcatcgg cagaaatctt ttcggcttca tcaactgatt taccggagag cagcgctaat 5160

gtcttatcga tgattttttg gtcaaaacgt tcaccaagtt tttgccgaag aacatcacgt 5220

aattgtgcaa gatgaatggt tctgagactg gattcaccaa tattttgtgc gtaataacca 5280

cttttacgca tcgcacgttt aaggctttga cttgaaattc ttactcgtct tttgccgccg 5340

aaaatagcgt ctttctgcat gttcatatcg tcgcggttca gacatgaagg gctgtgagag 5400

atcagaacat gaatattgat aaagttagac atagaaaggt ttcctcctag aactaggtta 5460

cgcatttttg tttgtggtca atacaaaatc ttccagaagt tgctggcgtt cgcgctttcc 5520

ccaccaggtc aacatcctgg ccattaatgg ccagtcaagt acgggttcgg cgtgagtaag 5580

taatcgacgt aactggacca tatcggctgt tctgtcagcc cgaattaatt gaaagatacg 5640

gcgctcgtta attcttccac tattggctaa agctctgccc aacgagatac ctgttgtttg 5700

ctccgatttt ttgtcctgat gtcggatgac attctttcct gcgctcaggc aaaacaccat 5760

gcgcaaaaga gcctgctggt gacgtgggtt ttcccaacca aaaggttgca ccagcctata 5820

aaacgcaggg atatcgcgta attcatcagg ttctgaaaca cgtctaattt gcgcacatga 5880

tccattatcc agttgttgcc aggctcgata taaagccatt gcatcaattt catcagccat 5940

ttgatggccc tccttgcggt tttaactccc gtaaatgttt gtatagcgtg gcgcgggcaa 6000

gcgctaatgt gcttattaat ttaggatgat gtgcataggg agctacagat tgattaaata 6060

gcatttcaca caattgatga agtttgtctc gtaaatcagc tattacctca tcagcctggg 6120

aaaaattaac attcgccagt acatcgggaa ttaataattc actctgtcga tagaaatgcc 6180

tttctgcagt ctcatgaaca gagactccgg cccctttgaa gtctttattt ttaaaccctt 6240

ctgcaaaggt atataacgcc ttgcgtaagg ctgttttata tcccaaacca acagtcacta 6300

tttcgtttat cacattgccg tattgttgcc acccctgatt aaacatcaac acatcatgac 6360

gccgttcaag aatagatgct tgattattac gatatccccc cataatcaat tcaagaggac 6420

tttgcggcgc aatatttctg aattgattca caaccgccgc cacgcgattt ccattttcat 6480

tttgaataat cttatctacc acaactcggc tgatttgtgt ccatgatggt gcggaggtgg 6540

tgaaagcaag aaatttttcc tcaacctccc ctttcttgac tgttaccaga caaggggaat 6600

gcggatgggg ccatagccca ttaactgtaa aggtaaattt ttccttaaga aaaccggtat 6660

aacgcaaatt gctttcctgt ccacagcaag aacatttacc aatcccaatg ggatcgcata 6720

attcaatatg cgctggttgc cagaatagac cacggacaaa cccaattgac gaagcaggta 6780

tagactcatt ggacttgata ggtttaatcc aggtaggttg gttttccgta tgtgattcat 6840

taggaaattg tttttgaaga cgaggtaatg tgaggacatt gagtaacacc gttgaacgaa 6900

gatcgatccc acgtacgaac gttgttacag gtgttcctcc acgtaaaccg cttttaaaac 6960

caccaccaaa acctggtgcc tgattcgcct ggttgaataa cgcaatcgca gtgcatccac 7020

cacataatgc ttcaccctgc cccggttgat tgacaaatgc acaattcgtc gcgccgctta 7080

ccccagccaa cagtttttcc attggagtca catcatttgc tttgacacct ttggtctgca 7140

taaagggatg ttctgcgtga ttaaggtaga acatatctat ccacggcgcg atgagttgtt 7200

gaaactcatc ttcagtgagc ggattcatta tgcgatgtcg aaattcaacg tcatcttttg 7260

ccggggcgat aatttgccca atgcaaacca gcagtgctaa agcggccagt tccatatcgt 7320

cacggggcaa acttaatcgc cactgatctc tactgcagta tagcgattgc agatttatga 7380

tttggacttt ccccccgttt cgcgggcgta cagggatcca gttatcaata agcaaattca 7440

tttgttctcc ttcatatggg ccctgcaacc attatcaccg ccagaggtaa aatagtcaac 7500

acgcacggtg ttagatattt atcccttgcg gtgatagatt taacgttaag gaggtatgta 7560

tgagcacaaa aaagaaacca ttaacacaag agcagcttga ggacgcacgt cgccttaaag 7620

caatttatga aaaaaagaaa aatgaacttg gcttatccca ggaatctgtc gcagacaaga 7680

tggggatggg gcagtcaggc gttggtgctt tatttaatgg catcaatgca ttaaatgctt 7740

ataacgccgc attgcttaca aaaattctca aagttagcgt tgaagaattt agcccttcaa 7800

tcgccagaga aatctacgag atgtatgaag cggttagtat gcagccgtca cttagaagtg 7860

agtatgagta ccctgttttt tctcatgttc aggcagggat gttctcacct aagcttagaa 7920

cctttaccaa aggtgatgcg gagagatggg taagcacaac caaaaaagcc agtgattctg 7980

cattctggct tgaggttgaa ggtaattcca tgaccgcacc aacaggctcc aagccaagct 8040

ttcctgacgg aatgttaatt ctcgttgacc ctgagcaggc tgttgagcca ggtgatttct 8100

gcatagccag acttgggggt gatgagttta ccttcaagaa actgatcagg gatagcggtc 8160

aggtgttttt acaaccacta aacccacagt acccaatgat cccatgcaat gagagttgtt 8220

ccgttgtggg gaaagttatc gctagtcagt ggcctgaaga gacgtttggc tgatcggcaa 8280

ggtgttctgg tcggcgcata gctgataaca attgagcaag aatcttcatc gataaccatc 8340

tgcggtgata aattatctct ggcggtgttg acataaatac cactggcggt gataattctg 8400

cagtagagag ctagcgagtt ccccgcgcca gcggggataa accgtgagac catggtctca 8460

gagttccccg cgccagcggg gataaaccgn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 8520

ngagttcccc gcgccagcgg ggataaaccg tctagaaaaa accccctcaa gacccgttta 8580

gaggccccaa ggggttatgc tactagaccg caaaaatcag cgcgcaaata cgcatactgt 8640

tatctggctt ttagtaagcc ggatccacgc gtttacgccc cgccctgcca ctcatcgcag 8700

tactgttgta attcattaag cattctgccg acatggaagc catcacagac ggcatgatga 8760

acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatggtg 8820

aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc 8880

acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc 8940

aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg 9000

tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa 9060

caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat acggaattcc 9120

ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta 9180

tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta 9240

cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca 9300

acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc 9360

gccggatcct aactcaaaat ccacacatta tacgagccgg aagcataaag tgtaaagcct 9420

ggggtgccta atgcggcccc tctagctacc ggttttggtc atgagattat ctctgtgcat 9480

atggacagtt ttccctttga tatgtaacgg tgaacagttg ttctactttt gtttgttagt 9540

cttgatgctt cactgataga tacaagagcc ataagaacct cagatccttc cgtatttagc 9600

cagtatgttc tctagtgtgg ttcgttgttt ttgcgtgagc catgagaacg aaccattgag 9660

atcatgctta ctttgcatgt cactcaaaaa ttttgcctca aaactggtga gctgaatttt 9720

tgcagttaaa gcatcgtgta gtgtttttct tagtccgtta tgtaggtagg aatctgatgt 9780

aatggttgtt ggtattttgt caccattcat ttttatctgg ttgttctcaa gttcggttac 9840

gagatccatt tgtctatcta gttcaacttg gaaaatcaac gtatcagtcg ggcggcctcg 9900

cttatcaacc accaatttca tattgctgta agtgtttaaa tctttactta ttggtttcaa 9960

aacccattgg ttaagccttt taaactcatg gtagttattt tcaagcatta acatgaactt 10020

aaattcatca aggctaatct ctatatttgc cttgtgagtt ttcttttgtg ttagttcttt 10080

taataaccac tcataaatcc tcatagagta tttgttttca aaagacttaa catgttccag 10140

attatatttt atgaattttt ttaactggaa aagataaggc aatatctctt cactaaaaac 10200

taattctaat ttttcgcttg agaacttggc atagtttgtc cactggaaaa tctcaaagcc 10260

tttaaccaaa ggattcctga tttccacagt tctcgtcatc agctctctgg ttgctttagc 10320

taatacacca taagcatttt ccctactgat gttcatcatc tgaacgtatt ggttataagt 10380

gaacgatacc gtccgttctt tcattgtagg gttttcaatc gtggggttga gtagtgccac 10440

acagcataaa attagcttgg tttcatgctc cgttaagtca tagcgactaa tcgctagttc 10500

atttgctttg aaaacaacta attcagacat acatctcaat tggtctaggt gattttaatc 10560

actataccaa ttgagatggg ctagtcaatg ataattacta gtccttttcc tttgagttgt 10620

gggtatctgt aaattctgct agacctttgc tggaaaactt gtaaattctg ctagaccctc 10680

tgtaaattcc gctagacctt tgtgtgtttt ttttgtttat attcaagtgg ttataattta 10740

tagaataaag aaagaataaa aaaagataaa aagaatagat cccagccctg tgtataactc 10800

actactttag tcagttccga c 10821

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1