用于束缚供体DNA的修饰的核酸编辑系统的制作方法

文档序号:23475845发布日期:2020-12-29 13:32阅读:180来源:国知局
用于束缚供体DNA的修饰的核酸编辑系统的制作方法
本技术涉及用于将供体dna束缚至核酸酶的组合物,这些组合物在提高体内基因编辑效率中的用途。相关申请本申请要求2018年3月25日提交的澳大利亚临时专利申请第2018900990号的优先权,其整体援引加入本文。
背景技术
:已知许多基因组编辑技术,包括转录激活物样效应子核酸酶(talen)、crispr-cas9系统(聚集的、规则间隔的、短回文重复和crispr相关蛋白9)以及锌指核酸酶(zfn)。talen、crispr-cas9蛋白和zfn使用核酸内切酶在基因组dna中的几乎任何靶序列处引发双链断裂(dsb),并且可以用于基因敲除、基因敲入、基因标记和遗传缺陷的纠正。ii型细菌聚集的、规则间隔的、短回文重复(crispr)相关蛋白9(cas9)系统是用于将突变靶向引入细胞dna的工具。精心设计的单向导(sg)rna在细胞dna中的期望靶位点诱导cas9介导的双链断裂(dsb),同时最小化对其他位置的影响。双链断裂通过至少两种不同的机制非同源末端连接(nhej)和同源性定向修复(hdr)刺激dna修复。通过nhej的cas9介导的细胞dna修饰可以达到20–60%的效率,但是由于nhej是错误倾向的,并且引入不可预测的插入和缺失模式,因此其仅适用于引入小的随机突变。将crispr-cas9和与细胞dna上的切割位点侧翼的序列同源的单链或双链dna模板共同应用,使得能够通过hdr介导的外源或供体dna片段的引入进行精确的基因组编辑。但是,hdr的频率本身很低,并且利用这种策略插入供体dna的效率仅为0.5–20%。talen是转录激活物样(tal)蛋白和foki核酸酶的融合物。tal蛋白通常由具有两个可变位置的33-34个氨基酸重复基序组成,其对特定核苷酸序列具有很强的识别力。通过组装tal的阵列并将它们融合至foki核酸酶,可以实现基因组的特异性切割。当两个talen结合并相遇时,foki结构域诱导双链断裂,所述双链断裂可以使基因失活,或者可以用来插入所关注的dna。talen能够以高达约33%的效率修饰染色体。zfn是一类工程化的dna结合蛋白,其通过在dna中于期望位置产生双链断裂而允许基因组的靶向性基因组编辑。zfn由两个功能结构域组成,dna结合结构域包含锌指模块链,每个锌指模块识别独特的dna六聚体。可以组装多个锌指以形成对24个碱基或更多碱基的序列具有特异性的zfn。第二功能结构域是foki的核酸酶结构域。使用zfn可以导致单或双等位基因编辑,以克隆群体的1–20%的效率发生。本发明人已开发组合物和方法,其利用基因编辑系统如crispr-cas9、talen和zfn的靶标特异性将供体dna束缚至期望的靶dna序列。技术实现要素:在第一方面,提供一种组合物,其包含用于将供体dna束缚至核酸酶的组合物,所述组合物包含核酸,所述核酸包含供体dna和dna结合结构域的共有序列;以及以下至少的一种:融合蛋白,其包含偶联至用于结合所述共有序列的dna结合结构域的核酸酶;以及编码所述融合蛋白的核酸。所述核酸酶可以是cas、转录激活物样效应子核酸酶(talen)、大范围核酸酶(meganuclease)或锌指。在一实施方案中,所述核酸酶是cas蛋白,例如cas9。所述融合蛋白可以进一步包含核定位序列。所述组合物可以进一步包含与所述cas蛋白和靶dna序列相互作用的向导rna。所述共有序列可以包含lac操纵子(seqidno:66)、trp操纵子(seqidno:68)、tet操纵子(seqidno:67)、gal-4结合位点(seqidno:1)或ihf结合位点(seqidno2)。所述共有序列可以包含与lac操纵子、trp操纵子、tet操纵子、gal-4结合位点或ihf结合位点具有至少80%、85%、90%、95%或至少99%相同性的序列。所述dna结合结构域可以包含lac阻遏物、tet阻遏物、trp-阻遏物、gal-4或ihf,或者其足以结合所述共有序列的部分。所述dna结合结构域是lac阻遏物,优选seqidno9的第43-403位氨基酸。可以将所述核酸酶通过接头偶联至所述dna结合结构域。所述接头可以包含选自seqidno:3-7、ggs接头或seqidno9的第404-419位氨基酸中任一个的序列。在一实施方案中,所述融合蛋白包含lac阻遏物和cas9。所述组合物可以包含载体,其中所述载体包含以下之一或两者:a.包含供体dna和dna结合结构域的共有序列的核酸;以及b.编码所述融合蛋白的核酸。所述载体可以进一步包含编码向导rna的核酸序列,所述向导rna与cas9和靶dna序列相互作用。在一些实施方案中,所述融合蛋白是核酸酶缺陷的。在第二方面,提供分离的宿主细胞,其包含第一方面的组合物。在第三方面,提供一种用于在细胞中编辑dna的方法,所述方法包括:在适合所述融合蛋白与靶dna序列相互作用的条件下使所述细胞与第一方面的组合物接触。在第三方面,提供一种用于在细胞中编辑dna的方法,所述方法包括a)在适合所述融合蛋白与第一靶dna序列相互作用的条件下使所述细胞与权利要求15的组合物接触;以及b)在适合核酸编辑的条件下,使所述细胞与适应于在第二靶dna序列上编辑基因组dna的核酸编辑系统接触。靶dna序列可以选自基因组dna、线粒体dna、病毒dna或外源dna。在一实施方案中,编辑的效率是至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。所述细胞可以在受试者中,优选人类受试者。在第四方面,提供一种试剂盒,其包含:核酸,其包含供体dna和dna结合结构域的共有序列;以及以下的至少一种:融合蛋白,其包含偶联至用于结合所述共有序列的dna结合结构域的核酸酶;以及编码所述融合蛋白的核酸。在一实施方案中,所述试剂盒中的融合蛋白包含cas蛋白、转录激活物样效应子核酸酶(talen)、大范围核酸酶、锌指或madzyme。在一实施方案中,所述cas是cas9。在整个说明书中,除非上下文另有要求,词语“包含(comprise)”或者变化形式如“包含(comprises)”或“包含(comprising)”会理解为表示包括所声明的元素、整数或步骤,或者元素、整数或步骤的组,但是不排除任何其他元素、整数或步骤,或者元素、整数或步骤的组。本说明书中已包括的文件、条例、材料、装置、文章等的任何讨论仅为了提供本发明的上下文的目的。不应视作承认任何或所有这些事项因为其在本申请各项权利要求的优先权日之前已存在而构成了现有技术基础的一部分或是本领域中与本发明相关的公知常识。为了更清楚地理解本发明,将参考以下附图和实施例描述优选的实施方案。附图说明图1是本文公开的包含修饰的核酸编辑系统的两个实施方案的图示。图2是质粒载体的图谱,所述质粒载体包含活性cas9基因序列及其向导rna,所述向导rna能够引导crispr/cas9复合物结合至基因组靶dna序列,可以用于修复crispr/cas9诱导的双链断裂的供体dna序列。图3和4是用于二元系统的质粒图谱,其中包含lac阻遏物融合物和向导rna的crispr/cas9基因序列存在于束缚表达载体上,而供体dna序列存在于第二束缚基因靶向载体上。图5和6是用于产生体外系统的质粒图谱,其中在转染入细胞之前,纯化的crispr/cas9会用来结合基因靶向载体。图7是构建体内束缚基因靶向质粒的工作流程图,其中a代表包含ug启动子的u6表达盒的合成,所述ug启动子具有中心sspi识别序列和侧翼sspi相容性悬突(overhang),其不重建质粒sspi识别序列。b代表包含中心noti克隆位点和eco109i相容性悬突的cmv启动子-sv40-polya盒的合成。c代表具有noti相容性悬突的编码cas9-lac阻遏物融合蛋白的基因的合成。d代表具有sspi相容性悬突的编码与基因组靶dna序列互补的rna的基因的合成。e代表供体dna序列的pcr扩增,所述供体dna序列具有包含侧翼sali限制性核酸内切酶识别序列并用sali消化的寡核苷酸。图8是构建pgt1的工作流程图。a.具有失活的bbsi限制性核酸内切酶位点的乳糖阻遏基因的构建。b.制备包含flag/sv40nls、laci和cas9的三个重叠dna片段,并且将这些片段克隆至pspcas9bb-2a-gfp(px458),(c)中以产生pgt1。pgt1的载体图谱在d中示出。图9是pgt9构建中使用的ptet阻遏物质粒的载体图谱。图10是构建pgt9的工作流程图。a:将tet阻遏物盒克隆至puc57中以产生ptet阻遏物。b:产生三个聚合酶链反应产物flag/sv40nls、laci和cas9,并且将这些产物克隆至pspcas9bb-2a-gfp(px458),(c)中以产生pgt9。pgt9的载体图谱在d中示出。图11是供体片段的概况,示出具有delf508突变以及laco或teto识别序列的500个碱基对供体片段。图12是本文描述的组合物在通过基因组cftr靶标cas9诱导的双链断裂和供体片段之间的同源重组以催化delf508dna序列转移至基因组靶标的同源性定向修复中的用途的概述。图13说明pgt1载体(乳糖阻遏物-cas9融合物)与130117向导(基因组靶标正向链)和供体dna3′端的乳糖操纵子的组合(图13,泳道7)证实与具有未修饰的cas9和相同供体dna片段的px458载体相比更高的基因编辑效率。图14说明用pgt9四环素阻遏物-cas9融合载体、向导序列和供体片段进行的基因编辑未产生比对照px458载体明显更好的基因编辑频率。具体实施方式本公开提供用于使用修饰的核酸编辑系统将供体dna束缚至dna靶序列的组合物、方法和试剂盒。本公开提供使用修饰的核酸编辑系统如crispr-cas9,提高了体内细胞dna修饰(如基因编辑)的效率。图1说明了这个过程的一个实施方案。修饰的基因编辑系统适应于结合包含供体dna的核酸并将该核酸束缚至细胞dna上的特异性位点,所述特异性位点在待编辑的核苷酸序列处或附近。修饰的核酸编辑系统(核酸酶-dna结合结构域融合物)本文描述的组合物和方法可以包括能够位点特异性结合的任何核酸编辑系统的核酸酶。例如,可用的核酸酶包括cas核酸酶、talen、大范围核酸酶、zfn和madzyme。通过将核酸酶与dna结合结构域组合来修饰核酸酶。核酸酶和dna结合结构域可以通过接头连接。合适的接头包括例如包含序列(gly-gly-gly-gly-ser)n、(gly)n、或(gly)ns、(eaaak)n、(ap)n、(xp)n、或a(eaaak)n的接头,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20中的任一个,并且x是任何氨基酸。其他合适的接头包含序列kesgsvsseqlaqfrsld、egkssgsgseskst、gsagsaagsgef、kesgsvsseqlaqfrsle或ggsaggsgsgssggssgasgtgtaggtgsgsgtgsg。cas系统分为3种主要类型(i型、ii型和iii型)和12种亚型,这是基于它们的遗传含量和结构差异。但是,所有crispr-cas系统的核心定义特征是cas基因和它们的蛋白:cas1和cas2在类型和亚型之间通用,而cas3、cas9和cas10分别是i型、ii型和iii型的标签(signature)基因。可以使用任何cas。例如,cas核酸酶可以是cas1、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10。在一些实施方案中,所述cas是cas9。cas9(crispr相关蛋白9)是rna向导的dna核酸酶,其用来诱导dna中位点定向的双链断裂,以分别用于基因失活或者通过非同源末端连接和同源重组引入异源基因。用于表达cas9的系统和核酸序列可商购。可以针对人或其他哺乳动物系统对cas9进行密码子优化。cas9蛋白可以在c-末端包含核定位信号。可以将编码cas9的rna加帽和多聚腺苷酸化以支持在哺乳动物细胞中表达,并且可以包含修饰以减少免疫刺激。可以用于所述组合物和方法的cas9以及功能衍生物和同系物的氨基酸序列和编码核酸序列是本领域已知的。cas9可以与向导rna(grna)结合递送,所述向导rna将编辑系统引导至grna识别的核苷酸序列。通常,可以将grna设计为靶向任何核苷酸序列。grna结构公开于例如ranfa,genomeeditingusingthecrispr-cas9system.pnas8(11):2281-308(2013);和pyzochaetal.,rna-guidedgenomeeditingofmammaliancells.methodsmol.biol.1114:269-77(2014),它们整体援引加入本文。通常对于cas9,grna将cas9引导至具有下游ngg原间隔序列临近基序基序(protospacer-adjacentmotif)(pam)的互补的20个核苷酸序列。包括向导序列的构建的crispr-cas9系统在us8,697,359中进一步公开,其整体援引加入本文。代替crispr-cas9系统,可以使用替代核酸编辑系统。例如,合适的系统包括任何crispr/cas系统(例如,任何cascade样crispr/cas、i型crisprcas、ii型crispr/cas和iii型crispr/cas)、锌指核酸酶(zfn)、转录激活物样效应子核酸酶(talen)、大范围核酸酶、归巢核酸内切酶和madzyme(例如分别由seqidno:69和70编码的人或大肠杆菌(e.coli)madzyme。修饰的核酸编辑系统的dna结合结构域组分可以是任何序列特异性的高亲和力dna结合结构域。如本文所用的术语“dna结合结构域”是指可以结合dna的任何完整蛋白或其片段。因此,术语“dna结合结构域”包括完整蛋白如lac阻遏物以及保留dna结合的蛋白片段。在一些实施方案中,dna结合结构域不是哺乳动物的,以便减少脱靶效用。例如,dna结合结构域可以来自细菌或酵母。可用于本文描述的组合物和方法的dna结合结构域可以选自lac阻遏物、tet阻遏物、trp-阻遏物、gal-4或ihf。这些中的每个结合本领域已知的特异性共有序列。所述共有序列可以是lac操纵子(例如seqidno:66)、trp操纵子(例如seqidno:68)、tet操纵子(例如seqidno:67)、gal-4结合位点(5′-cgg-n11-ccg-3′)或ihf结合位点(5'–watcaannnnttr-3')。w是a或t,r是a或g,并且n是任何核苷酸。核酸编辑系统可以以纯化的蛋白形式或编码核酸编辑系统的核酸形式存在于本文公开的组合物中。所述核酸可以是载体,例如质粒载体,其包含编码可操作地连接至组成型或诱导型启动子的核酸编辑系统的序列。术语“载体”包括能够转运与其连接的另一核酸的核酸分子。如本文所述用来将核酸递送至细胞的载体包括本领域技术人员已知并用于这类目的的载体。某些示例性载体可以是质粒、慢病毒或腺相关病毒。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如环状)的核酸分子;包含dna、rna或两种的核酸分子;以及本领域已知的多核苷酸的其他变体。载体的一种类型是“质粒”,其是指环状双链dna环,例如通过标准分子克隆技术,可以将其他dna片段插入其中。载体的另一类型是病毒载体,其中病毒来源的dna或rna序列存在于载体中,用于包装病毒(例如逆转录病毒、慢病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)。病毒载体还包括病毒携带的多核苷酸,用于转染至宿主细胞中。某些载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其他载体(例如,非游离型哺乳动物载体)在引入宿主细胞时整合入宿主细胞的基因组,从而与宿主基因组一起复制。此外,某些载体是表达载体,其能够指导与其可操作地连接的基因的表达。在重组dna技术中有用的常见表达载体通常是质粒的形式。重组表达载体可以包含一种或多种核酸,其以适合在细胞中表达核酸的形式编码修饰的核酸编辑系统,这意味着重组表达载体包括一个或多个调节元件,其可以基于用于表达的宿主细胞进行选择。即将调节元件可操作地连接至待表达的核酸序列。“可操作地连接”表示将所关注的核苷酸序列以允许核苷酸序列表达的方式(例如在体外转录/翻译系统中或者当将载体引入宿主细胞时在宿主细胞中)连接至调节元件。“调节元件”包括启动子、增强子、内部核糖体进入位点(ires)和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和poly-u序列)。调节元件是本领域已知的。调节元件包括在许多类型的宿主细胞中指导核苷酸序列的组成型表达的那些以及仅在某些宿主细胞中指导核苷酸序列表达的那些(例如,组织特异性调节序列)。组织特异性启动子可以主要在所关注的期望组织中指导表达,如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如肝、胰)或特定细胞类型(例如淋巴细胞)。调节元件还可以以时间依赖性方式指导表达,如以细胞周期依赖性或发育阶段依赖性方式,其还可以是组织特异性或细胞类型特异性的,或者可以不是。在一些实施方案中,载体可以包含一个或多个poliii启动子(例如1、2、3、4、5或更多个poliii启动子),一个或多个polii启动子(例如1、2、3、4、5或更多个polii启动子),一个或多个poli启动子(例如1、2、3、4、5或更多个poli启动子)或者其组合。poliii启动子的实例包括但不限于u6和hi启动子。polii启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(rsv)ltr启动子(任选地具有rsv增强子)、巨细胞病毒(cmv)启动子(任选地具有cmv增强子)、sv40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(pgk)启动子以及efla启动子和本文描述的polii启动子。术语“调节元件”还涵盖增强子元件,如wpre;cmv增强子;htlv-i的ltr中的r-u5'片段;sv40增强子;以及兔β-珠蛋白的外显子2和3之间的内含子序列。本领域技术人员会理解表达载体的设计可以取决于这类因素如待转化的宿主细胞的选择、期望的表达水平等。可以将载体引入宿主细胞,从而产生转录物(例如向导rna)、蛋白或肽,包括融合蛋白(如修饰的核酸编辑系统)或肽。载体可以包括一个或多个终止子序列。终止子序列包括在转录期间标记编码序列末端的核酸序列部分。载体可以包括一个或多个编码表位标签或报告基因序列的序列。表位标签的非限制性实例包括组氨酸(his)标签、v5标签、flag标签、流感血凝素(ha)标签、myc标签、vsv-g标签和硫氧还蛋白(trx)标签。报告基因的实例包括但不限于谷胱甘肽-s-转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰转移酶(cat)β-半乳糖苷酶、β-葡糖醛酸酶、萤光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青色荧光蛋白(cfp)、黄色荧光蛋白(yfp)以及包括蓝色荧光蛋白(bfp)在内的自发荧光蛋白。表位标签、报告基因或两者可以作为与修饰的核酸编辑系统的融合物(核酸酶-dna结合结构域融合物)表达自载体。替代地或额外地,所述组合物可以包含编码所述融合蛋白的mrna。可以修饰所述mrna,并且所述修饰选自磷酸骨架的修饰(例如,硫代磷酸酯键或硼烷磷酸键(boranophosphate)、核糖环修饰如2'-0-甲基和/或2'-氟和/或4'-硫代修饰中的一种或多种,以及锁(locked)核酸或非锁(unlocked)核酸。其他修饰可以包括假尿苷、2-硫尿苷、4-硫尿苷、5-氮尿苷、5-羟基尿苷、5-氨基尿苷、5-甲基尿苷、2-硫假尿苷、4-硫假尿苷、5-羟基假尿苷、5-甲基假尿苷、5-氨基假尿苷、假异胞苷、5-甲基胞苷、n4-甲基胞苷、2-硫胞苷、5-氮胞苷、5-羟基胞苷、5-氨基胞苷、n4-甲基假异胞苷、2-硫假异胞苷、5-羟基假异胞苷、5-氨基假异胞苷、5-甲基假异胞苷、n6-甲基腺苷、7-脱氮腺苷、6-硫鸟苷、7-脱氮鸟苷、8-氮鸟苷、6-硫代-7-脱氮鸟苷、6-硫代-8-氮鸟苷、7-脱氮-8-氮鸟苷以及6-硫代-7-脱氮-8-氮鸟苷。在一些实施方案中,针对以下一种或多种选择修饰:减少免疫刺激、rna稳定、提高编码蛋白的表达。例如,rna可以具有2-硫尿苷和5-甲基-胞苷的组合以减少通过模式识别受体如tlr3、tlr7和tlr8的免疫刺激。在一些实施方案中,mrna可以具有一个或多个假尿苷以稳定mrna抗切割,并且提高表达率。修饰的核酸编辑系统还包含dna结合结构域。dna结合结构域促进修饰的核酸编辑系统定位至细胞dna。本文公开的载体的构建是通过本领域已知的标准方法,如将合成的核酸或通过例如pcr产生的核酸连接至已被一种或多种位点特异性核酸酶切割的质粒中。有用于产生本文公开的载体的替代策略。在一种方法中,利用可商购的服务,例如通过专门从事大dna分子合成的公司,从头合成整个载体。或者,将经典克隆技术与合成生物学结合以修饰标准实验室质粒如puc19。在这种方法中,会从头合成编码cas9-lac操纵子融合基因、向导rna和供体dna序列的基因盒,并且利用t4dna连接酶将其分别克隆至载体骨架中存在的独特限制性核酸内切酶位点中。通过聚合酶链反应扩增供体dna序列以产生克隆至载体骨架中的产物。可以通过重组pcr然后连接至载体骨架中的限制性核酸内切酶位点进行cas9-lac阻遏物融合蛋白的修饰,以添加其他dna结合结构域或表位用于修饰的cas9蛋白的亲和纯化。用于制备本文公开的质粒载体的这种方法的工作流程在图7中示出。核酸酶缺陷在一些实施方案中,核酸编辑系统是核酸酶缺陷的。在这些实施方案中,核酸酶缺陷的核酸编辑系统用来将供体dna束缚在靶核酸序列附近,从而供体dna可供额外的核酸编辑系统使用。例如,核酸酶缺陷的基因编辑系统具有减少或消除的核酸酶活性,或者在检测水平内不存在或基本上不存在核酸酶活性。在一些实施方案中,利用已知测定可能无法检测基因编辑系统的核酸酶活性,即低于已知测定的检测水平。本领域技术人员可以利用标准分子生物学技术制备核酸酶缺陷的基因编辑系统。通常,这包括缺失或改变对核酸酶活性至关重要的一个或多个氨基酸,以基本上消除或消除核酸酶活性。在一些实施方案中,cas9是核酸酶缺陷的cas9。核酸酶缺陷的cas9可以是其中改变或去除cas9中的一个或多个氨基酸的一种。例如,可以通过去除或突变氨基酸d10、h840、d839和n863中的一个或多个产生核酸酶缺陷的cas9(参见jinkeetal.,science337,816-821(2012))。例如,可以缺失或者用丙氨酸或甘氨酸取代这些氨基酸中的一个或多个以基本上消除或消除核酸酶活性。供体dna术语“供体dna”包括待插入细胞dna(如基因组dna、线粒体dna或病毒dna)中的核酸序列。供体核酸序列可以通过细胞表达。供体核酸可以是外源的,对于细胞是外来的或在细胞内是非天然存在的。供体dna与可以被dna结合结构域结合的序列相关。例如,供体dna可以与dna结合结构域的共有序列相邻,或者可以与共有序列存在于相同载体上,或者可以与共有序列存在于相同多核苷酸上。靶核酸序列靶核酸序列包括任何核酸序列,如基因组核酸序列或核酸编辑系统的核酸酶可以与其共定位的基因。靶核酸包括能够表达为蛋白的核酸序列。根据一方面,靶核酸是基因组dna、线粒体dna、质粒dna病毒dna或外源dna。本领域技术人员能够容易地鉴定或设计与靶核酸序列共定位的向导rna、talen、zfn、大范围核酸酶和归巢核酸内切酶。方法本文描述的组合物或载体可以用于编辑细胞中的dna。所述方法包括在适合修饰的核酸编辑系统与靶dna序列相互作用的条件下,使细胞与包含修饰的基因编辑系统或编码修饰的基因编辑系统的载体的组合物接触。所述方法还包括使用与第一靶dna序列相互作用的核酸酶缺陷的修饰的核酸编辑系统和常规核酸编辑系统以在第二靶dna序列上编辑dna。为了提高dna编辑的效率,将供体dna置于靠近靶dna序列的位置,从而使其很容易用于核酸编辑。在使用核酸酶缺陷的修饰的核酸编辑系统的实施方案中,这是通过间隔第一和第二靶序列实现的,从而使供体dna当与其靶序列共定位时靠近常规核酸编辑系统。例如,第一和第二靶序列相距约75-150个碱基对,相距约150-250、250-350、450-550、550-650、650-750、750-850、850-950、950-1050个碱基对或相距约1-1.5kb。所述方法需要将组合物或载体递送至细胞。核酸载体、rna或蛋白的非病毒递送的方法包括脂质体转染、显微注射、基因枪(biolistic)、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸dna、人工病毒粒子、试剂增强的dna吸收、纳米颗粒和电穿孔/核转染。脂质体转染试剂可商购(例如transfectamtm和lipofectintm)。适合多核苷酸的高效受体-识别脂质体转染的阳离子和中性脂质是已知的。可以递送至细胞(例如体外或离体给药)或靶组织(例如体内给药)。术语天然的包括蛋白、酶、rna或向导rna种类本身以及编码其相应核酸。递送媒介物本文提供的本文公开的组合物和载体的递送媒介物可以是病毒载体或非病毒载体。在一些实施方案中,在病毒载体或非病毒载体中提供修饰的核酸编辑系统。在其他实施方案中,在病毒载体中提供向导rna,并且在非病毒载体中提供修饰的核酸编辑系统。在其他实施方案中,在非病毒载体中提供向导rna,并且在病毒载体中提供修饰的核酸编辑系统。在一些实施方案中,病毒载体选自腺相关病毒(aav)、腺病毒、逆转录病毒和慢病毒载体。虽然病毒载体可以递送本文描述的系统的任何组分,只要其提供组织存在或表达的期望特征谱,但是在一些实施方案中,病毒载体提供一种或多种修饰的核酸编辑系统、向导rna的表达,并且任选地递送供体dna。在一些实施方案中,病毒递送系统是腺相关病毒(aav)2/8。然而,在各种实施方案中,使用其他aav血清型,如aav1、aav2、aav4、aav5、aav6和aav8。在一些实施方案中,当靶向气道上皮细胞时使用aav6,当靶向骨骼肌细胞时使用aav7(对于aav1和aav5类似),并且aav8用于肝细胞。在一些实施方案中,aav1和5可以用于递送至血管内皮细胞。此外,大多数aav血清型显示神经元嗜性,而aav5还转导星形胶质细胞。在一些实施方案,采用混合aav载体。在一些实施方案中,每种血清型仅给药一次以避免免疫原性。因此,随后的给药采用不同的aav血清型。在一些实施方案中,递送系统包含非病毒递送媒介物。在一些方面,所述非病毒递送媒介物是基于脂质的。在其他方面,所述非病毒递送媒介物是聚合物。在一些实施方案中,所述非病毒递送媒介物是可生物降解的。在实施方案中,所述非病毒递送媒介物是脂质包裹系统和/或聚合物颗粒。在某些实施方案中,递送系统包含脂质颗粒。在一些实施方案中,基于脂质的载体是脂质纳米颗粒,其是大小在约1至约100纳米之间的脂质颗粒。在一些实施方案中,基于脂质的载体是脂质或脂质体。脂质体是包含脂质双层的人工球形囊泡(vesicle)。基于脂质的载体可以是小核酸-脂质颗粒(snalp)。snalp包含包裹核酸的小的(直径小于200nm)基于脂质的纳米颗粒。在一些实施方案中,snalp可用于rna分子的递送。在一些实施方案中,snalp制剂将核酸递送至受试者中的特定组织,如肝。在一些实施方案中,向导rna、修饰的核酸编辑系统(或编码其的rna)是通过聚合载体递送的。在一些实施方案中,聚合载体是聚合物或聚合物囊泡(polymerosome)。聚合物涵盖单体的任何长重复链,包括例如线性聚合物、支化聚合物、树状聚合物和多糖。线性聚合物包括单线单体,而支化聚合物包括单体的侧链。树状聚合物也是支化的分子,其围绕分子核心对称排列。多糖是聚合的碳水化合物分子,并且由连接在一起的长单糖单元组成。聚合物囊泡是由合成的两亲共聚物组成的人工囊泡,所述两亲共聚物形成囊泡膜,并且在囊泡膜内可以具有中空或水性的核心。各种基于聚合物的系统可以用于给药编码修饰的核酸编辑系统的rna。示例性聚合材料包括聚(d,l-乳酸-共-乙醇酸)(plga)、聚(己内酯)(pcl)、乙烯醋酸乙烯酯聚合物(eva)、聚(乳酸)(pla)、聚(l-乳酸)(plla)、聚(乙醇酸)(pga)、聚(l-乳酸-共-乙醇酸)(pllga)、聚(d,l-丙交酯)(pdla)、聚(l-丙交酯)(plla)、plga-b-聚(乙二醇)-plga(plga-bpeg-plga)、plla-bpeg-plla、plga-peg-马来酰亚胺(plga-peg-mal)、聚(d,l-丙交酯-共-己内酯)、聚(d,l-丙交酯-共-己内酯-共-乙交酯)、聚(d,l-丙交酯-共-peo-共-d,l-丙交酯)、聚(d,l-丙交酯-共-ppo-共-d,l-丙交酯)、聚氰基丙烯酸烷基酯、聚氨基甲酸酯、聚-l-赖氨酸(pll)、甲基丙烯酸羟丙酯(hpma)、聚乙二醇、聚-l-谷氨酸、聚(羟基酸)、聚酐、聚原酸酯、聚(酯酰胺)、聚酰胺、聚(酯醚)、聚碳酸酯、聚亚烷基如聚乙烯和聚丙烯、聚亚烷基二醇如聚(乙二醇)(peg)、聚亚烷基氧化物(peo)、聚亚烷基对苯二甲酸酯如聚(对苯二甲酸亚乙酯)、聚乙烯醇(pva)、聚乙烯醚、聚乙烯酯如聚(醋酸乙烯酯)、聚乙烯卤化物如聚(氯乙烯)(pvc)、聚乙烯吡咯烷酮、聚硅氧烷、聚苯乙烯(ps)、聚氨基甲酸酯、衍生的纤维素如烷基纤维素、羟基烷基纤维素、纤维素醚、纤维素酯、硝基纤维素、羟丙基纤维素、羧甲基纤维素、丙烯酸的聚合物如聚(甲基(甲基)丙烯酸酯)(pmma)、聚(乙基(甲基)丙烯酸酯)、聚(丁基(甲基)丙烯酸酯)、聚(异丁基(甲基)丙烯酸酯)、聚(己基(甲基)丙烯酸酯)、聚(异癸基(甲基)丙烯酸酯)、聚(月桂基(甲基)丙烯酸酯)、聚(苯基(甲基)丙烯酸酯)、聚(丙烯酸甲酯)、聚(丙烯酸异丙酯)、聚(丙烯酸异丁酯)、聚(丙烯酸十八烷基酯)(聚丙烯酸)及其共聚物和混合物、聚二氧六环酮及其共聚物、聚羟基烷酸酯、聚富马酸丙烯酯)、聚甲醛、泊洛沙姆、聚(原)酯、聚(丁酸)、聚(戊酸)、聚(丙交酯-共-己内酯)、三亚甲基碳酸酯、聚乙烯吡咯烷酮、聚原酸酯、聚磷腈、聚([β]-氨基酯(pbae)和聚磷酸酯,以及两种或更多种这类聚合物的共混物和/或嵌段共聚物。基于聚合物的系统还可以包括基于环糊精聚合物(cdp)的纳米颗粒,例如,cdp-金刚烷(admantane)(ad)-peg缀合物和cdp-ad-peg-转铁蛋白缀合物。在一实施方案中,如kormannetal.expressionoftherapeuticproteinsafterdeliveryofchemicallymodifiedmrnainmice.nat.biotechnol.29:154-157(2011)中公开的,用化学修饰以减少tlr反应的cas9mrna配制纳米颗粒。在进一步的实施方案中,例如chenetal.rapiddiscoveryofpotentsirna-containinglipidnanoparticlesenabledbycontrolledmicrofluidicformulation.j.amer.chem.soc.134:6948-6951(2012)中公开的,利用受控的微流体混合系统配制纳米颗粒。在一些实施方案中,基于脂质的递送系统包含脂质包裹系统。脂质包裹系统可以设计为驱动期望的组织分布和细胞进入特性,以及提供所需的循环时间和生物降解特征。脂质包裹可以包括反胶束和/或进一步包含聚合基质。在一些实施方案中,颗粒包括亲脂性递送化合物以增强颗粒向组织的递送,包括以优选方式。这类化合物一般可以包括亲脂性基团以及缀合的氨基酸或肽,包括线性或环状肽,并且包括其异构体。脂质或聚合颗粒的大小(例如,平均大小)可以为约50nm-约5μm。在一些实施方案中,颗粒为约10nm-约100μm、或约20nm-约50μm、或约50nm-约5μm、或约70nm-约500nm、或约70nm-约200nm、或约50nm-约100nm。可以选择颗粒以避免被免疫系统快速清除。颗粒可以是球形或非球形的。在一些实施方案中,非病毒递送媒介物可以是肽,如细胞穿透肽或细胞内化序列。细胞穿透肽是能够跨质膜易位的小肽。示例性细胞穿透肽包括但不限于触角足蛋白(antennapedia)序列、tat、hiv-tat、penetratin、antp-3a(antp突变体)、buforinii、transportan、map(模型两亲性肽)、k-fgf、ku70、prion、pvec、pep-1、synbl、pep-7、i-in-1、bgsc(双-胍-亚精胺-胆固醇和bgtc(双-胍-tren-胆固醇)。在一些实施方案中,在5'端或3'端修饰向导rna或编码修饰的核酸编辑系统的rna。在一优选实施方案中,在rna的3'端进行修饰。可以通过缀合至胆固醇、其他亲脂性分子、聚合物、肽、抗体、适配体和/或小分子来修饰rna。在一些实施方案中,将rna缀合至n-乙酰半乳糖胺(galnac)。galnac结合肝细胞上的脱唾液酸糖蛋白受体(asgpr),因此可以用来将rna靶向肝脏。在一些实施方案中,将rna缀合至三价靶向配体,例如,三天线(triantennary)galnac。这类缀合物包含在3'末端缀合至3个galnac分子的rna。可以通过本领域已知的任何方法给药递送媒介物(例如缀合物、病毒或非病毒载体或者其任何组合),包括注射,任选地通过直接注射至靶组织。在一些实施方案中,向导rna、修饰的核酸编辑系统和任选存在的供体dna在相同或不同的递送媒介物中同时给药。在其他实施方案中,向导rna和修饰的核酸编辑系统以及任选存在的供体dna通过相同或分开的递送媒介物顺序给药。在一些实施方案中,在给药修饰的核酸编辑系统之前1、3、5、7、10、14或30天给药向导rna和/或供体dna,从而在给药修饰的核酸编辑系统之前,向导rna和/或供体dna在靶细胞或组织中积累。在一些实施方案中,向导rna、供体dna和/或核酸编辑系统以许多剂量给药,如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个剂量。在各种实施方案中,在一天一周至约一个月的时间段中给药grna、供体dna和/或核酸编辑系统。在一实施方案中,在aav载体中提供向导rna和供体dna中的一种或两种,在给药修饰的核酸编辑系统之前将其给药至组织或细胞。在进一步的实施方案中,在给药纳米颗粒修饰的核酸编辑系统之前1、2、3、4、5、6、7、8、9或10天给药包含grna的aav载体,以允许从aav载体表达向导rna。在更进一步的实施方案中,将修饰的核酸编辑系统多次给药,例如,每1、2、3、4、5、6、7、8、9、10、11、12、13、14或15天一次。在另一实施方案中,通过aav载体递送供体dna,并且在给药修饰的核酸编辑系统和向导rna中的任一种或两种之前1、2、3、4、5、6、7、8、9或10天注射。在特定实施方案中,在首先给药的aav载体中提供向导rna和供体dna中的任一种或两种,随后在基于脂质的递送媒介物中以一个或多个剂量给药修饰的核酸编辑系统。在另一实施方案中,本文描述的组合物的每种组分(例如,修饰的核酸编辑系统、向导rna和供体dna)各自使用不同的媒介物递送,或者一种或多种组分可以与相同的递送媒介物一起使用。在进一步的实施方案中,在多个时间点给药修饰的核酸编辑系统、向导rna和供体dna,例如,每1、2、3、4、5、6、7、8、9、10、11、12、13、14或15天。在另一实施方案中,在不同时间点给药修饰的核酸编辑系统、向导rna和供体dna。在一些实施方案中,修饰的核酸编辑系统的表达是瞬时的。在一些实施方案中,修饰的核酸编辑系统的这种瞬时表达使脱靶效应最小化。例如,通过选择递送媒介物和/或启动子来控制修饰的核酸编辑系统的表达。在一些实施方案中,本公开提供允许提高常规核酸编辑系统的安全性和/或效力的组合物和方法。有利地,本文公开的方法提供用常规和修饰的核酸编辑系统的重复剂量给药,从而基因编辑的效率随每次剂量提高。例如,在一些实施方案中,当与本文公开的修饰的核酸编辑系统结合使用时,本文公开的方法导致常规核酸编辑系统的基因编辑效率提高。例如基因编辑的效率提高约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%、约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%或更多。在另一实施方案中,将向导rna、修饰的核酸编辑系统和供体dna中的至少一个同时给药至组织或细胞,如在同一递送媒介物上,并且一种或多种组分(即,修饰的核酸编辑系统和向导rna)在诱导型启动子的控制之下。作为实例,在一实施方案中,诱导型启动子可以是例如小分子诱导的启动子,如四环素诱导型启动子。可以通过本领域已知的任何方法给药递送媒介物(无论病毒载体或非病毒载体或rna缀合物材料),包括注射,任选地通过直接注射至靶组织或细胞。核酸修饰可以随着时间监测,例如,通过定期的活组织检查,利用从基因组dnapcr扩增和/或测序靶区域,或者通过rt-pcr和/或测序表达的转录本。或者,可以通过检测报告基因或报告序列来监测核酸修饰。或者,可以通过修饰的基因产物的表达或活性或者在细胞或组织中或者在受试者中的治疗效果来监测核酸修饰。在一些实施方案中,所述细胞或组织在受试者中。例如受试者可以是人,特别是需要治疗或预防干预的人。或者,受试者是动物,包括家畜、家禽、家养动物或实验室动物。在各种实施方案中,受试者是哺乳动物,如人、马、牛、狗、猫、啮齿动物或猪。在一些实施方案中,本文提供的方法从受试者获得细胞或细胞群并离体修饰细胞中的靶多核苷酸,使用本文公开的递送系统、组分、方法和/或试剂盒。在进一步的实施方案中,离体修饰之后,可以将离体修饰的细胞重新引入受试者。因此,本公开提供治疗受试者的疾病或病症的方法,所述方法包括从受试者获得一个或多个细胞,利用本文描述的常规和修饰的核酸编辑系统离体修饰细胞中的一个或多个靶核苷酸序列,并且将具有修饰的靶核苷酸序列的细胞重新引入患有疾病或病症的受试者中。在一些实施方案中,将其中已经发生核苷酸序列修饰的细胞体外扩增,然后重新引入患有疾病或病症的受试者中。在其他实施方案中,将修饰的核酸编辑系统、向导rna和供体dna中的至少一种体外给药至细胞。在一些实施方案中,至少一种组分(例如,向导rna、供体、修饰的核酸编辑系统或核酸载体)积累在细胞或组织中,所述细胞或组织可以是例如肝、心脏、肺(包括气道上皮细胞)、骨骼肌、cns(例如,神经细胞)、内皮细胞、血细胞、骨髓细胞、血细胞前体细胞、干细胞、脂肪细胞或免疫细胞。组织靶向或分布可以通过选择和设计病毒递送媒介物来控制,或者在一些实施方案中,通过脂质或聚合物递送媒介物的选择和设计来实现。在一些实施方案中,使用本文公开的方法的靶序列修饰(编辑)的效率百分比为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。在一些实施方案中,与进行相同修饰(编辑)而不束缚供体dna的方法相比,使用本文公开的方法和组合物的靶序列修饰(编辑)的效率提供2-倍、3-倍、4-倍、5-倍、6-倍、7-倍的增加或更多。在一些实施方案中,靶序列修饰的效率小于100%,或者其中对少于100%细胞的效应具有治疗效果。例如,当核酸修饰的效率为约0.01%-约100%、约0.01%-约50%、约0.05%-约40%、约0.1%-约30%、约0.5%-约25%、约1%-约20%、约1%-约15%、约1%-约10%或约1%-约5%时可以达到治疗效果。因此,即使核苷酸序列修饰的效率相对较低(例如,小于50%、或小于40%、或小于30%、或小于20%、或小于10%、或小于5%、或小于1%、或小于0.5%、或小于0.1%),引入或修正或修饰的基因产物的适度表达可以导致对疾病或病症的治疗效果。在一些实施方案中,配制本文公开的递送系统和组合物,从而优化组分的比例用于一致地递送至靶序列。在一实施方案中,优化向导rna和修饰的核酸编辑系统的比例用于一致地递送至靶序列。在另一实施方案中,优化供体dna比向导rna和/或比修饰的核酸编辑系统的比例用于一致地递送至靶序列。例如,在一实施方案中,修饰的cas9:向导rna:供体的比例是约1:1:1至约1:1:100。在进一步的实施方案中,该比例是约1:1:2至约1:1:90、约1:1:5至约1:1:75或约1:1:10至约1:1:50。在其他实施方案中,该比例是约1:1:1或更低,如约1:1:0.01至约1:1:1、约1:1:0.02至约1:1:0.75、或约1:1:0.05至约1:1:0.5、或约1:1:0.1至约1:1:0.5。在其他实施方案中,其中所述组合物不包括向导rna,修饰的核酸编辑系统:供体dna的比例是约1:100至约100:1、或约1:50至约50:1、或约1:25至约25:1、或约1:10至约10:1、或约1:5-约5:1、或约1:2-约2:1、或约1:1。试剂盒在一方面,提供包含上述方法、组合物和递送系统中公开的任何一种或多种组分的试剂盒。试剂盒组分可以单独或组合提供,并且可以提供在任何合适的容器中,如小瓶、瓶子或试管。在一些实施方案中,本文公开的试剂盒包含一种或多种用于本文公开的实施方案的试剂。例如,试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以以在特定方法中可用的形式提供,或者以在使用之前需要添加一种或多种其他组分的形式(例如浓缩物或冻干形式)提供。合适的缓冲液包括但不限于磷酸盐缓冲盐水、碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、tris缓冲液、mops缓冲液、hepes缓冲液及其组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液具有约7-约10的ph。例如,试剂盒可以包含:供体dna和修饰的核酸编辑系统。试剂盒可以进一步包含向导rna。试剂盒可以提供表达系统,其提供修饰的核酸编辑系统和向导rna中的一个或两个在靶细胞中的表达。试剂盒可以提供一个或多个剂量的rna递送系统,每个剂量提供修饰的核酸编辑系统在靶细胞或组织中的表达。试剂盒可以是定制的,用于用户定义的靶序列。本领域技术人员会理解,如具体实施方案所示,可以对本发明进行许多变化和/或修改而不背离广泛描述的本发明的精神或范围。因此在各方面均认为本发明的实施方案是说明性而不是限制性的。实施例实施例1:将crispr/cas9复合物束缚至基因组靶dna序列的质粒图2是包含活性cas9基因序列及其向导rna的质粒载体的图谱。cas9的编码序列与lac阻遏物dna结合结构域相邻。将这个融合物可操作地连接至cmv启动子。当表达时,lac阻遏物dna结合结构域结合质粒骨架序列中的lac操纵子序列。将与基因组靶dna序列互补的供体dna也克隆至载体中,并且为靶dna序列中crispr/cas9产生的双链断裂之间的同源重组提供模板。在一实施方案中,修饰供体dna序列以防止crispr/cas9核酸酶结合至质粒序列,并且包含选择标记以辅助鉴定重组细胞系。考虑供体dna序列可以包含突变的dna序列以改变靶染色体基因的功能,或者其可以包含“野生型”序列以校正突变的靶dna序列。实施例2:二元束缚系统的质粒图3和4是用于二元系统的质粒的图谱,其中包含lac阻遏物融合物和向导rna的crispr/cas9基因序列存在于束缚表达载体上(图3),而供体dna序列存在于第二束缚基因靶向载体上(图4)。两个载体的共转染对于靶标特异性的crispr/cas9/lac阻遏物核酸酶的表达是必需的,其结合束缚的靶向质粒上的lac操纵子序列(图4),因此使基因靶向质粒定位至靶dna。用于将乳糖操纵子序列或四环素抗性操纵子序列克隆至hindiii/sali限制性核酸内切酶消化的puc19中的互补寡核苷酸的序列。正确的方向允许随后将laco和teto双链体克隆至puc19中,以产生具有一个或多个顺序操纵子的质粒,所述质粒可以用来克隆供体dna分子以通过哺乳动物细胞中的同源定向重组进行基因编辑。表1.laco和teto寡核苷酸。实施例3:用于体外束缚系统的质粒图5和6是用于体外束缚系统的载体的质粒图谱,其中在转染入细胞之前,纯化的crispr/cas9用来结合基因靶向载体。从图5所示的质粒表达his标记的crispr/cas9-lac阻遏物融合物,然后通过固定化的金属亲和色谱纯化融合物。图5显示lac阻遏蛋白操纵子结合结构域融合在cas9的c末端。但是,如seqidno:8和9所示,优选排列是优选利用接头如xten将lac阻遏物融合至cas9的n–末端。在任何情况下,将纯化的融合蛋白与基因靶向载体(即图4)混合。将纯化的融合蛋白和基因靶向载体的复合物转染至具有向导rna表达质粒(图6)的细胞中。实施例4.通过基因束缚的供体dna片段对囊性纤维化跨膜转导调节因子(cftr)基因进行基因编辑囊性纤维化在高加索人群中发现的最流行的遗传疾病之一,多达1/27个体携带cftr基因突变。在cf患者中发现的最常见的突变是delf508或f508del,突变是外显子11中框内3个碱基对缺失的结果,导致蛋白中残基508的苯丙氨酸丢失。已经从cf患者产生几个永生化的人细胞系,包括对于delf508突变纯合的cfbe41o-细胞系。但是,hek293细胞中的cftr基因序列是正常或野生型的cftr基因序列。在这个实施例中,通过工程化乳糖阻遏蛋白或四环素阻遏蛋白修饰px458cas9载体,将其与cas9蛋白序列框内融合产生“基因束缚(genetether)”。这种基因束缚修饰使得用于基因编辑的供体dna分子能够结合至功能性cas9蛋白,并且将供体dna分子定位在cas9产生的双链断裂处以增强同源性定向修复,减少靶点突变(on-targetmutation)并减少诱导p53dna修复系统。将这些修饰的cas9蛋白与包含乳糖操纵子或四环素操纵子dna序列的供体dna分子转染至细胞中,以测量将delf508突变引入正常hek293cftr基因的基因编辑效率。lac和tet束缚修饰的cas9的构建乳糖和四环素阻遏蛋白以高特异性和亲和力结合明确定义的操纵子序列。genetether是与cas9(和其他cas蛋白)、talens或znf融合的乳糖或四环素阻遏蛋白,其会结合至包含各自操纵子序列的dna分子。genetether修饰的cas蛋白、talen或znf与其基因组靶标的结合会由此将结合至阻遏蛋白融合物的任何dna分子物理定位至相同基因组位点(图1)。与基因组dna靶序列同源的dna分子的定位通过同源定向重组dna修复途径提高基因编辑的效率,并且使dna突变最小化。乳糖阻遏物修饰的cas9的构建根据供应商的说明书使用laciprimer2f/primer2r(表2)和q5高保真热稳定聚合酶(newenglandbiolabs)通过聚合酶链反应从大肠杆菌dh5α扩增乳糖阻遏物基因。将1083个碱基对产物进行凝胶纯化(monarchdna凝胶提取试剂盒,newenglandbiolabs)并用于进一步修饰。利用聚合酶链反应扩增用诱变引物lacibbs2f、lacibbs2r、lacibbs3f和lacibbs3r使乳糖阻遏物基因序列中的两个bbsi限制性核酸内切酶位点失活,以在密码子164和277中产生a到g的转变,保留谷氨酸密码子(图lacibbsassembled)。使用引物对laciprimer1f/lacibbsprimer2r、lacibbsprimer2f/lacibbsprimer3r和lacibbsprimer3f/laciprimer1r(表2)的3个凝胶纯化的q5高保真聚合酶的聚合酶链反应产物用来重新构建全长1083个碱基对的bbsi失活的乳糖阻遏蛋白基因(nebuilderhifiassembly,newenglandbiolabs)。表2.pcr引物dna序列。如图8中概述地进行乳糖阻遏物-cas9融合物的构建。利用nebuilder系统(newenglandbiolabs)将用q5高保真聚合酶通过聚合酶链反应扩增的3个重叠dna片段克隆至agei/bglii消化的pspcas9bb-2a-gfp(px458)(genescript,inc)中以产生genetether乳糖阻遏物-cas9融合质粒pgt1(图8d,seqidno63)。利用px458载体的聚合酶链反应引物primer1fage/primer1r和primer3f/primer3r产生用于这个组装的3个聚合酶链反应产物,并且利用primer2f/primer2r扩增bbsi失活的乳糖阻遏基因(表2)。通过菌落聚合酶链反应筛选所得的质粒pgt1,并且通过dna测序(quintarabiosciences)、限制性核酸内切酶作图和诊断性聚合酶链反应扩增证实乳糖阻遏物-cas9融合基因序列。四环素阻遏物修饰的cas9的构建订购具有人密码子偏好性的编码b类tn10四环素阻遏物的基因作为克隆至puc57载体中的合成dna分子(genescript,inc)(图9和seqidno:65)。与pgt1乳糖阻遏物-cas9融合物相似地进行四环素-阻遏物-cas9融合物的构建(图10)。利用px458载体的聚合酶链反应引物primer1fage/primer1r和primer3f/primer3r产生用于这个组装的3个聚合酶链反应产物,并且利用引物nls接头primer1f/tet接头cas9primer1r扩增四环素阻遏物基因。通过菌落聚合酶链反应筛选所得的质粒pgt9(seqidno:63),并且通过dna测序(quintarabiosciences)、限制性核酸内切酶作图和诊断性聚合酶链反应扩增证实四环素阻遏物-cas9融合基因序列。向导rna克隆。向导rna的序列设计为结合野生型cftr基因的外显子11基因序列和cftrdel-f508突变基因序列(表3)。将向导dna寡核苷酸退火以产生具有bbs1相容性悬突的双链分子,随后将其连接至凝胶纯化的bbsi限制性核酸内切酶消化的px458、pgt1和pgt9。表3.向导序列。示出用于克隆至pgt1、pgt9和px458cas9载体中的bbsi位点的dna寡核苷酸。名称序列seqidnocfwt130117fwcaccgattaaagaaaatatcatctt49cfwt130117fcaaacaagatgatattttctttaatc50cfwt130121rwcaccgaaagatgatattttctttaa51cfwt130121rcaaacttaaagaaaatatcatctttc52delf130127fwcaccgaccattaaagaaaatatcat53delf130127fcaaacatgatattttctttaatggtc54delf130138rwcaccgaccaatgatattttctttaa55delf130138rcaaacttaaagaaaatatcattggtc56acftr供体dna产生。利用q5高保真dna聚合酶以及引物cf96310f和cf101310r通过聚合酶链反应产生大约以cftr基因外显子11为中心的5千碱基对cftrdna片段。利用来自delf508突变纯合的cfbe41o-细胞系的基因组dna产生包含cftrdelf508突变的供体dna片段。利用来自hek293细胞的基因组dna产生包含野生型(非突变)cftr基因序列的供体dna片段。在片段的5′或3′端修饰用于基因编辑的供体dna片段以包含乳糖操纵子序列(aattgtgagcgctcacaatt,seqidno:57)或四环素操纵子序列(cactccctatcagtgatagagaaaseqidno:58)。为了产生500个碱基对供体dna分子,利用q5高保真热稳定的dna聚合酶用引物对lacosymcf1f/cf5r进行聚合酶链反应扩增以将乳糖操纵子序列添加至供体dna的5′端,或者用引物对cf1f/lacosymcf5r以将乳糖操纵子添加至供体dna片段的3′端(图供体dna分子)。利用引物对tetocf1f/cf5r和cf1f/tetocf5r产生具有四环素操纵子序列的供体dna分子。在用于细胞转染以进行基因编辑之前凝胶纯化供体dna片段。用px458、pgt1、pgt9cas9载体和500个碱基对dna片段进行细胞转染在12-孔板中利用lipofectamine3000(invitrogen,inc)用500ng质粒dna和500ng凝胶纯化的供体dna片段转染hek293细胞。px458、pgt1和pgt9质粒包含在转染细胞中表达的绿色荧光蛋白报告基因,并且允许监测转染效率。在转染后约48小时,绿色荧光蛋白表达通过荧光显微镜可见。在转染后48-72小时,将转染细胞的12-孔板用磷酸缓冲盐水洗涤一次并储存在-80℃下,直至收获dna用于基因编辑效率的分析。通过等位基因特异性聚合酶链反应分析来分析delf508突变可以利用聚合酶链反应用taq聚合酶和引物对cf1bf/cf8cr检测cftr野生型细胞群体中delf508突变的存在。因为cf1bf引物位于供体dna片段的5′或外部,所以从“由内而外”方法产生388个碱基对产物,并且特异性诊断基因编辑事件且不会扩增随机整合或未整合的供体dna分子。直接从12-孔板的每个孔制备基因组dna(genejet基因组纯化试剂盒,thermofisher,inc),并且通过紫外光谱法确定dna浓度。在100ng基因组dna和500μm引物、1.5mmmgcl2、hotstarttaq聚合酶(newenglandbiolabs)上进行等位基因特异性聚合酶链反应。delf508突变dna序列的半定量扩增的热循环程序是95℃,2分钟;35个95℃,30秒,50℃,30秒,72℃,1分钟的循环;然后是72℃,8分钟。在用gelred(biotium,inc)染色的1.5%琼脂糖凝胶上用紫外光使388个碱基对的聚合酶链反应产物可见。对于pcr产物的半定量,与实验dna样品平行扩增具有不同比例的野生型和delf508突变dna的标准基因组dna样品。细胞转染两种不同的束缚(tether)(乳糖-阻遏物-cas9融合物或四环素阻遏物-cas9融合物)与包含5′乳糖或四环素操纵子序列或者3′乳糖或四环素操纵子序列(图11和12)并包含delf508缺失序列的供体dna分子结合使用。通过基因组cftr靶标cas9诱导的双链断裂和供体片段之间的同源重组的同源性指导的修复会催化delf508dna序列向基因组靶标的转移(图12)。选择与非突变的野生型cftr外显子11dna序列互补但不与delf508dna序列互补的cas9向导,以允许识别基因组dna靶标并防止cas9酶识别和切割delf508供体dna片段。在转染之前24小时,将约5x105个hek293细胞/孔接种至corning12-孔组织培养板中,从而在转染时孔50-80%汇合。转染之前更换细胞上的培养基。对于转染,将500ng的px458、pgt1或pgt9与500ng的供体dna片段在50μl的dmem培养基中混合。然后将2μl的p3000试剂添加至dna/dmem溶液,充分混合,并且允许在室温下孵育5分钟。通过将1.5μl未稀释的lipofectamine3000添加至50μl的dmem来制备lipofectamine3000的溶液,将等体积的dna/dmem溶液和lipofectamine/dmem溶液混合并在室温下孵育12-15分钟。然后在corning12-孔板的每孔添加100μl的dna/p3000/lipofectamine溶液。转染之后两天,用荧光显微镜检查细胞以评价成功转染的程度。基因束缚提高基因编辑效率测试了genetether修饰的cas9载体对基因编辑效率的影响的几个变量:乳糖阻遏物-cas9融合蛋白、四环素阻遏物-cas9融合蛋白、与基因组靶标的上链或下链互补的cas9向导以及在供体dna片段的5′或3′端具有乳糖操纵子序列的包含delf508缺失的500bp供体dna分子。pgt1载体(乳糖阻遏物-cas9融合物)与130117向导(基因组靶标正向链)和供体dna3′端的乳糖操纵子的组合(图13,泳道7)证实与具有未修饰的cas9和相同供体dna片段的px458载体相比更高的基因编辑效率(比较388个碱基对产物泳道3和泳道7,图13)。利用imagej软件(https://imagej.nih.gov)对条带强度的测量表明与px458未修饰的cas9相比,束缚的供体dna复合物具有大约高7倍的基因编辑效率。实际上,泳道7条带强度与wt:delf508dna的重构混合物(泳道14-19)的比较表明delf508突变存在于约10%的基因组dna中。因为这些实验的转染效率为10%或更低,所以多达100%的用pgt1/130117向导/3′乳糖操纵子序列的组合转染的细胞进行了成功的基因编辑。pgt1/向导/供体dna的其他组合在基因编辑方面的表现等于或略好于未修饰的cas9(图13;泳道9vs泳道5),证实cas9蛋白活性不受乳糖阻遏物融合物的影响。乳糖操纵子序列的位置可能略微偏爱3′位置(图13;泳道7和9vs泳道3和5)。用不含向导序列的px458转染的供体dna显示低水平的基因编辑(图13;泳道10和11)。在泳道10、12和13中明显有一些微弱的388bp产物,这可能是由于用于等位基因特异性pcr的pcr引物的人为的低水平错误引发(misspriming)。用pgt9四环素阻遏物-cas9融合载体、向导序列和供体片段进行的基因编辑未产生比对照px458载体明显更好的基因编辑频率(图14,泳道2-5vs泳道6-9)。与乳糖操纵子序列的位置相似,四环素在供体dna片段的3′端的位置看来导致略好的基因编辑效率(图14泳道2、4、6、8vs泳道3、5、7)。这些结果证实与px458载体中发现的未修饰的cas9相比,pgt1编码的genetether乳糖阻遏物-cas9融合蛋白可以显著提高基因编辑效率。实际上,可能pgt1/130117向导/delf508laco500的组合在几乎100%的转染细胞中成功地将wt基因编辑为delf508。序列表<110>基因系链公司<120>用于束缚供体dna的修饰的核酸编辑系统<130>120838598<150>2018900990<151>2018-03-25<160>70<170>patentinversion3.5<210>1<211>17<212>dna<213>synthetic<220><221>misc_feature<222>(4)..(14)<223>n=a,c,g或t<400>1cggnnnnnnnnnnnccg17<210>2<211>13<212>dna<213>synthetic<220><221>misc_feature<222>(1)..(1)<223>w=a或t<220><221>misc_feature<222>(7)..(10)<223>n=a,t,g或c<220><221>misc_feature<222>(13)..(13)<223>r=a或g<220><221>misc_feature<222>(13)..(13)<223>r=a或g<400>2watcaannnnttr13<210>3<211>13<212>prt<213>synthetic<400>3trpalathrcysalaalaasnasnasnasnthrthrarg1510<210>4<211>14<212>prt<213>synthetic<400>4gluglylysserserglyserglysergluserlysserthr1510<210>5<211>12<212>prt<213>synthetic<400>5glyseralaglyseralaalaglyserglygluphe1510<210>6<211>18<212>prt<213>synthetic<400>6lysgluserglyservalsersergluglnleualaglnpheargser151015leuglu<210>7<211>36<212>prt<213>synthetic<400>7glyglyseralaglyglyserglyserglyserserglyglyserser151015glyalaserglythrglythralaglyglythrglyserglysergly202530thrglysergly35<210>8<211>5411<212>dna<213>synthetic<220><221>定位编码序列<222>(1)..(117)<220><221>ggs接头编码序列<222>(118)..(126)<220><221>laci结构域编码序列<222>(127)..(1209)<220><221>xten接头编码序列<222>(1210)..(1257)<220><221>cas9野生型蛋白编码序列<222>(1258)..(5361)<400>8atggactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgac60gatgacaagatggcccccaagaagaagaggaaggtgggcattcaccgcggggtacctgga120ggttctatgatgaagcccgtgaccctgtacgacgtggccgagtacgccggcgtgagctac180cagaccgtgagccgcgtggtgaaccaggccagccacgtgagcgccaagacccgcgagaag240gtggaggccgccatggccgagctgaactacatccccaaccgcgtggcccagcagctggcc300ggcaagcagagcctgctgatcggcgtggccaccagcagcctggccctgcacgcccccagc360cagatcgtggccgccatcaagagccgcgccgaccagctgggcgccagcgtggtggtgagc420atggtggagcgcagcggcgtggaggcctgcaaggccgccgtgcacaacctgctggcccag480cgcgtgagcggcctgatcatcaactaccccctggacgaccaggacgccatcgccgtggag540gccgcctgcaccaacgtgcccgccctgttcctggacgtgagcgaccagacccccatcaac600agcatcatcttcagccacgaggacggcacccgcctgggcgtggagcacctggtggccctg660ggccaccagcagatcgccctgctggccggccccctgagcagcgtgagcgcccgcctgcgc720ctggccggctggcacaagtacctgacccgcaaccagatccagcccatcgccgagcgcgag780ggcgactggagcgccatgagcggcttccagcagaccatgcagatgctgaacgagggcatc840gtgcccaccgccatgctggtggccaacgaccagatggccctgggcgccatgcgcgccatc900accgagagcggcctgcgcgtgggcgccgacatcagcgtggtgggctacgacgacaccgag960gacagcagctgctacatcccccccctgaccaccatcaagcaggacttccgcctgctgggc1020cagaccagcgtggaccgcctgctgcagctgagccagggccaggccgtgaagggcaaccag1080ctgctgcccgtgagcctggtgaagcgcaagaccaccctggcccccaacacccagaccgcc1140agcccccgcgccctggccgacagcctgatgcagctggcccgccaggtgagccgcctggag1200agcggccagagcggcagcgagactcccgggacctcagagtccgccacacccgaaagtatg1260gataaaaagtattctattggtttagctatcggcactaattccgttggatgggctgtcata1320accgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcat1380tcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcg1440actcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttac1500ttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttg1560gaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaac1620atagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaag1680ctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatg1740ataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtc1800gacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctata1860aatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacgg1920ctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaacctt1980atagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagat2040gccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaa2100attggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctc2160ctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatg2220atcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcag2280caactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggt2340tatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagag2400aagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaag2460cagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgct2520atacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgag2580aaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcgg2640ttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagtt2700gtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaat2760ttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtac2820aatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagc2880ggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagtt2940aagcaattgatcatctagacaataagttctggttggcgtttcactgtcaattcgttaact3000aagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaag3060atcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataagg3120acttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccc3180tctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacg3240ataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcgga3300aacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaaga3360gcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttca3420aagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattg3480cgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtgg3540atgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcac3600gcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatag3660aagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaataccc3720aattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttg3780atcaggaactggacataaaccgtttatctgattacgacgtcgatgccattgtaccccaat3840cctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgag3900ggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggc3960agctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgaga4020ggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaaccc4080gccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacg4140agaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcgg4200acttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgc4260acgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctag4320aaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaa4380gcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatt4440tctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaa4500ccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaa4560aagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggt4620tttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaagg4680actgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctag4740tagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattgg4800ggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcga4860aaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttg4920agttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacg4980aactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagt5040tgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacatt5100atctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatg5160ccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagc5220aggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattca5280agtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacg5340cgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagc5400ttgggggtgac5411<210>9<211>1650<212>prt<213>synthetic<220><221>核定位序列<222>(1)..(39)<220><221>ggs接头<222>(40)..(42)<220><221>laci结构域<222>(43)..(403)<220><221>xten接头<222>(404)..(419)<220><221>cas9野生型<222>(420)..(1650)<400>9metasptyrlysasphisaspglyasptyrlysasphisaspileasp151015tyrlysaspaspaspasplysmetalaprolyslyslysarglysval202530glyilehisargglyvalproglyglysermetmetlysprovalthr354045leutyraspvalalaglutyralaglyvalsertyrglnthrvalser505560argvalvalasnglnalaserhisvalseralalysthrargglulys65707580valglualaalametalagluleuasntyrileproasnargvalala859095glnglnleualaglylysglnserleuleuileglyvalalathrser100105110serleualaleuhisalaproserglnilevalalaalailelysser115120125argalaaspglnleuglyalaservalvalvalsermetvalgluarg130135140serglyvalglualacyslysalaalavalhisasnleuleualagln145150155160argvalserglyleuileileasntyrproleuaspaspglnaspala165170175ilealavalglualaalacysthrasnvalproalaleupheleuasp180185190valseraspglnthrproileasnserileilepheserhisgluasp195200205glythrargleuglyvalgluhisleuvalalaleuglyhisglngln210215220ilealaleuleualaglyproleuserservalseralaargleuarg225230235240leualaglytrphislystyrleuthrargasnglnileglnproile245250255alagluarggluglyasptrpseralametserglypheglnglnthr260265270metglnmetleuasngluglyilevalprothralametleuvalala275280285asnaspglnmetalaleuglyalametargalailethrglusergly290295300leuargvalglyalaaspileservalvalglytyraspaspthrglu305310315320aspsersercystyrileproproleuthrthrilelysglnaspphe325330335argleuleuglyglnthrservalaspargleuleuglnleusergln340345350glyglnalavallysglyasnglnleuleuprovalserleuvallys355360365arglysthrthrleualaproasnthrglnthralaserproargala370375380leualaaspserleumetglnleualaargglnvalserargleuglu385390395400serglyglnserglysergluthrproglythrsergluseralathr405410415proglusermetasplyslystyrserileglyleualaileglythr420425430asnservalglytrpalavalilethraspglutyrlysvalproser435440445lyslysphelysvalleuglyasnthrasparghisserilelyslys450455460asnleuileglyalaleuleupheaspserglygluthralagluala465470475480thrargleulysargthralaargargargtyrthrargarglysasn485490495argilecystyrleuglngluilepheserasnglumetalalysval500505510aspaspserphephehisargleuglugluserpheleuvalgluglu515520525asplyslyshisgluarghisproilepheglyasnilevalaspglu530535540valalatyrhisglulystyrprothriletyrhisleuarglyslys545550555560leuvalaspserthrasplysalaaspleuargleuiletyrleuala565570575leualahismetilelyspheargglyhispheleuilegluglyasp580585590leuasnproaspasnseraspvalasplysleupheileglnleuval595600605glnthrtyrasnglnleupheglugluasnproileasnalasergly610615620valaspalalysalaileleuseralaargleuserlysserargarg625630635640leugluasnleuilealaglnleuproglyglulyslysasnglyleu645650655pheglyasnleuilealaleuserleuglyleuthrproasnphelys660665670serasnpheaspleualagluaspalalysleuglnleuserlysasp675680685thrtyraspaspaspleuaspasnleuleualaglnileglyaspgln690695700tyralaaspleupheleualaalalysasnleuseraspalaileleu705710715720leuseraspileleuargvalasnthrgluilethrlysalaproleu725730735seralasermetilelysargtyraspgluhishisglnaspleuthr740745750leuleulysalaleuvalargglnglnleuproglulystyrlysglu755760765ilephepheaspglnserlysasnglytyralaglytyrileaspgly770775780glyalaserglnglugluphetyrlyspheilelysproileleuglu785790795800lysmetaspglythrglugluleuleuvallysleuasnarggluasp805810815leuleuarglysglnargthrpheaspasnglyserileprohisgln820825830ilehisleuglygluleuhisalaileleuargargglngluaspphe835840845tyrpropheleulysaspasnargglulysileglulysileleuthr850855860pheargileprotyrtyrvalglyproleualaargglyasnserarg865870875880phealatrpmetthrarglysserglugluthrilethrprotrpasn885890895pheglugluvalvalasplysglyalaseralaglnserpheileglu900905910argmetthrasnpheasplysasnleuproasnglulysvalleupro915920925lyshisserleuleutyrglutyrphethrvaltyrasngluleuthr930935940lysvallystyrvalthrgluglymetarglysproalapheleuser945950955960glygluglnlyslysalailevalaspleuleuphelysthrasnarg965970975lysvalthrvallysglnleulysgluasptyrphelyslysileglu980985990cyspheaspservalgluileserglyvalgluaspargpheasnala99510001005serleuglythrtyrhisaspleuleulysileilelysasplys101010151020asppheleuaspasnglugluasngluaspileleugluaspile102510301035valleuthrleuthrleuphegluaspargglumetilegluglu104010451050argleulysthrtyralahisleupheaspasplysvalmetlys105510601065glnleulysargargargtyrthrglytrpglyargleuserarg107010751080lysleuileasnglyileargasplysglnserglylysthrile108510901095leuasppheleulysseraspglyphealaasnargasnphemet110011051110glnleuilehisaspaspserleuthrphelysgluaspilegln111511201125lysalaglnvalserglyglnglyaspserleuhisgluhisile113011351140alaasnleualaglyserproalailelyslysglyileleugln114511501155thrvallysvalvalaspgluleuvallysvalmetglyarghis116011651170lysprogluasnilevalileglumetalaarggluasnglnthr117511801185thrglnlysglyglnlysasnserarggluargmetlysargile119011951200glugluglyilelysgluleuglyserglnileleulysgluhis120512101215provalgluasnthrglnleuglnasnglulysleutyrleutyr122012251230tyrleuglnasnglyargaspmettyrvalaspglngluleuasp123512401245ileasnargleuserasptyraspvalaspalailevalprogln125012551260serpheleulysaspaspserileaspasnlysvalleuthrarg126512701275serasplysasnargglylysseraspasnvalprosergluglu128012851290valvallyslysmetlysasntyrtrpargglnleuleuasnala129513001305lysleuilethrglnarglyspheaspasnleuthrlysalaglu131013151320argglyglyleusergluleuasplysalaglypheilelysarg132513301335glnleuvalgluthrargglnilethrlyshisvalalaglnile134013451350leuaspserargmetasnthrlystyraspgluasnasplysleu135513601365ilearggluvallysvalilethrleulysserlysleuvalser137013751380aspphearglysasppheglnphetyrlysvalarggluileasn138513901395asntyrhishisalahisaspalatyrleuasnalavalvalgly140014051410thralaleuilelyslystyrprolysleugluserglupheval141514201425tyrglyasptyrlysvaltyraspvalarglysmetilealalys143014351440sergluglngluileglylysalathralalystyrphephetyr144514501455serasnilemetasnphephelysthrgluilethrleualaasn146014651470glygluilearglysargproleuilegluthrasnglygluthr147514801485glygluilevaltrpasplysglyargaspphealathrvalarg149014951500lysvalleusermetproglnvalasnilevallyslysthrglu150515101515valglnthrglyglypheserlysgluserileleuprolysarg152015251530asnserasplysleuilealaarglyslysasptrpaspprolys153515401545lystyrglyglypheaspserprothrvalalatyrservalleu155015551560valvalalalysvalglulysglylysserlyslysleulysser156515701575vallysgluleuleuglyilethrilemetgluargserserphe158015851590glulysasnproileasppheleuglualalysglytyrlysglu159516001605vallyslysaspleuileilelysleuprolystyrserleuphe161016151620gluleugluasnglyarglysargmetleualaseralaglyglu162516301635leuglnlysglyasngluleualaleuproserlys164016451650<210>10<211>22<212>dna<213>synthetic<400>10ccttctctgtgaacctctatca22<210>11<211>20<212>dna<213>synthetic<400>11gcagagtacctgaaacagga20<210>12<211>20<212>dna<213>synthetic<400>12cattcacagtagcttaccca20<210>13<211>20<212>dna<213>synthetic<400>13ataggaaacaccaaagatga20<210>14<211>20<212>dna<213>synthetic<400>14ataggaaacaccaatgatat20<210>15<211>40<212>dna<213>synthetic<400>15ataggaaacaccaatgatattttctttaatggtgccaggc40<210>16<211>41<212>dna<213>synthetic<400>16gaaaatatcattggtgtttcctatgatgaatatagatacag41<210>17<211>19<212>dna<213>synthetic<400>17tgagttagatgtttgacgc19<210>18<211>31<212>dna<213>synthetic<400>18gctgtgcattttcctctgggtaatactttag31<210>19<211>24<212>dna<213>synthetic<400>19gtctctattacttaatctgtacct24<210>20<211>36<212>dna<213>synthetic<400>20ctgtgaagattaaataaattaatatagttaaagcac36<210>21<211>28<212>dna<213>synthetic<400>21atgctcattccattaggctatagtatta28<210>22<211>26<212>dna<213>synthetic<400>22ctaattctctgctggcagatcaatgc26<210>23<211>34<212>dna<213>synthetic<400>23caagacgttgtgttaggtacattacatgtacatc34<210>24<211>28<212>dna<213>synthetic<400>24ctcccatgaggacggtacgcgactgggc28<210>25<211>28<212>dna<213>synthetic<400>25gcccagtcgcgtaccgtcctcatgggag28<210>26<211>39<212>dna<213>synthetic<400>26gtgggatacgacgataccgaggacagctcatgttatatc39<210>27<211>39<212>dna<213>synthetic<400>27gatataacatgagctgtcctcggtatcgtcgtatcccac39<210>28<211>29<212>dna<213>synthetic<400>28atgaaaccagtaacgttatacgatgtcgc29<210>29<211>18<212>dna<213>synthetic<400>29tcactgcccgctttccag18<210>30<211>43<212>dna<213>synthetic<400>30ggtatccacggagtcccagcagccatgaaaccagtaacgttat43<210>31<211>23<212>dna<213>synthetic<400>31ctggagcacctgcctgaaatcac23<210>32<211>27<212>dna<213>synthetic<400>32cgcgtgcgccaattctgcagacaaatg27<210>33<211>34<212>dna<213>synthetic<400>33tgctgggactccgtggataccgaccttccgcttc34<210>34<211>43<212>dna<213>synthetic<400>34ggtatccacggagtcccagcagccgtgaaaccagtaacgttat43<210>35<211>51<212>dna<213>synthetic<400>35ggcggactctgaggtcccgggagtctcgctgccgctctgcccgctttccag51<210>36<211>49<212>dna<213>synthetic<400>36cgggacctcagagtccgccacacccgaaagtgacaagaagtacagcatc49<210>37<211>26<212>dna<213>synthetic<400>37cgtccaccttggccatctcgttgctg26<210>38<211>58<212>dna<213>synthetic<400>38gttcggaatataaattgtgagcgctcacaattaagcttgcagagtacctgaaacagga58<210>39<211>58<212>dna<213>synthetic<400>39gttcggaatataaattgtgagcgctcacaattaagcttcattcacagtagcttaccca58<210>40<211>59<212>dna<213>synthetic<400>40gttcggaatataaattgtgagcgctcacaattaagcttgctgtgcattttcctctgggt59<210>41<211>69<212>dna<213>synthetic<400>41gttcggaatataaattgtgagcgctcacaattaagcttcaagacgttgtgttaggtacat60tacatgtac69<210>42<211>58<212>dna<213>synthetic<400>42gaattcgagctcggtacccggggatcccaagacgttgtgttaggtacattacatgtac58<210>43<211>47<212>dna<213>synthetic<400>43gaattcgagctcggtacccggggatcccattcacagtagcttaccca47<210>44<211>50<212>dna<213>synthetic<400>44cactccctatcagtgatagagaaaagaaagctgtgcattttcctctgggt50<210>45<211>58<212>dna<213>synthetic<400>45cactccctatcagtgatagagaaacaagacgttgtgttaggtacattacatgtacatc58<210>46<211>46<212>dna<213>synthetic<400>46cactccctatcagtgatagagaaaaggcagagtacctgaaacagga46<210>47<211>46<212>dna<213>synthetic<400>47cactccctatcagtgatagagaaaagcattcacagtagcttaccca46<210>48<211>24<212>dna<213>synthetic<400>48cggagcctatggaaaaacgccagc24<210>49<211>25<212>dna<213>synthetic<400>49caccgattaaagaaaatatcatctt25<210>50<211>25<212>dna<213>synthetic<400>50aaacaagatgatattttctttaatc25<210>51<211>25<212>dna<213>synthetic<400>51caccgaaagatgatattttctttaa25<210>52<211>25<212>dna<213>向导<400>52aaacttaaagaaaatatcatctttc25<210>53<211>25<212>dna<213>synthetic<400>53caccgaccattaaagaaaatatcat25<210>54<211>25<212>dna<213>synthetic<400>54aaacatgatattttctttaatggtc25<210>55<211>25<212>dna<213>synthetic<400>55caccgaccaatgatattttctttaa25<210>56<211>25<212>dna<213>synthetic<400>56aaacttaaagaaaatatcattggtc25<210>57<211>20<212>dna<213>synthetic<400>57aattgtgagcgctcacaatt20<210>58<211>24<212>dna<213>synthetic<400>58cactccctatcagtgatagagaaa24<210>59<211>42<212>dna<213>synthetic<400>59tcgagtttaccactccctatcagtgatagagaaaagtgaaag42<210>60<211>42<212>dna<213>synthetic<400>60tcgactttcacttttctctatcactgatagggagtggtaaac42<210>61<211>44<212>dna<213>synthetic<400>61tcgagtttagtggaattgtgagcggataacaatttcactgaaag44<210>62<211>44<212>dna<213>synthetic<400>62tcgactttcagtgaaattgttatccgctcacaattccactaaac44<210>63<211>10417<212>dna<213>synthetic<400>63gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagag60ataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga120aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcat180atgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaagga240cgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataag300gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgttttagagct360agaaatagcaagttaaaataaggctagtccgtttttagcgcgtgcgccaattctgcagac420aaatggctctagaggtacccgttacataacttacggtaaatggcccgcctggctgaccgc480ccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtc540aatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc600caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagt660acatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctatta720ccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccac780ccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcgggggggg840ggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcgga900gaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggc960ggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgacgc1020tgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactg1080accgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattag1140ctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattac1200ctggagcacctgcctgaaatcactttttttcaggttggaccggtgccaccatggactata1260aggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataaga1320tggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtgaaaccag1380taacgttatacgatgtcgcagagtatgccggtgtctcttatcagaccgtttcccgcgtgg1440tgaaccaggccagccacgtttctgcgaaaacgcgggaaaaagtggaagcggcgatggcgg1500agctgaattacattcccaaccgcgtggcacaacaactggcgggcaaacagtcgttgctga1560ttggcgttgccacctccagtctggccctgcacgcgccgtcgcaaattgtcgcggcgatta1620aatctcgcgccgatcaactgggtgccagcgtggtggtgtcgatggtagaacgaagcggcg1680tcgaagcctgtaaagcggcggtgcacaatcttctcgcgcaacgcgtcagtgggctgatca1740ttaactatccgctggatgaccaggatgccattgctgtggaagctgcctgcactaatgttc1800cggcgttatttcttgatgtctctgaccagacacccatcaacagtattattttctcccatg1860aggacggtacgcgactgggcgtggagcatctggtcgcattgggtcaccagcaaatcgcgc1920tgttagcgggcccattaagttctgtctcggcgcgtctgcgtctggctggctggcataaat1980atctcactcgcaatcaaattcagccgatagcggaacgggaaggcgactggagtgccatgt2040ccggttttcaacaaaccatgcaaatgctgaatgagggcatcgttcccactgcgatgctgg2100ttgccaacgatcagatggcgctgggcgcaatgcgcgccattaccgagtccgggctgcgcg2160ttggtgcggatatctcggtagtgggatacgacgataccgaggacagctcatgttatatcc2220cgccgttaaccaccatcaaacaggattttcgcctgctggggcaaaccagcgtggaccgct2280tgctgcaactctctcagggccaggcggtgaagggcaatcagctgttgcccgtctcactgg2340tgaaaagaaaaaccaccctggcgcccaatacgcaaaccgcctctccccgcgcgttggccg2400attcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagagcggcagcg2460agactcccgggacctcagagtccgccacacccgaaagtgacaagaagtacagcatcggcc2520tggacatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgccca2580gcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcg2640gagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgcca2700gaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacg2760agatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaag2820aggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctacc2880acgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaagg2940ccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcc3000tgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctgg3060tgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgcca3120aggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagc3180tgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctga3240cccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaagg3300acacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacc3360tgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtga3420acaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcacc3480accaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaag3540agattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagcc3600aggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaac3660tgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggca3720gcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatt3780tttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcc3840cctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaaga3900gcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgccc3960agagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgc4020ccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaat4080acgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcg4140tggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactact4200tcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacg4260cctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggaca4320atgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggaca4380gagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatga4440agcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacg4500gcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcg4560ccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatcc4620agaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccg4680gcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtga4740aagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccaga4800ccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatca4860aagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacg4920agaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactgg4980acatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaagg5040acgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgaca5100acgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacg5160ccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctga5220gcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaa5280agcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagc5340tgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaagg5400atttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacc5460tgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcg5520tgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaa5580tcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccg5640agattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaa5700ccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagca5760tgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagt5820ctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggacccta5880agaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaag5940tggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatca6000tggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaag6060aagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacg6120gccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgc6180cctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctccc6240ccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgaga6300tcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggaca6360aagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaata6420tcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgaca6480ccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatcc6540accagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggcgaca6600aaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaaggaattcggcagtg6660gagagggcagaggaagtctgctaacatgcggtgacgtcgaggagaatcctggcccagtga6720gcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacg6780taaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagc6840tgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtga6900ccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacg6960acttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaagg7020acgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaacc7080gcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctgg7140agtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatca7200aggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccact7260accagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctga7320gcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctgg7380agttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaaggaattctaac7440tagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgccc7500ctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaa7560tgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggg7620gcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggagcggccgca7680ggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggc7740cgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcg7800agcgcgcagctgcctgcaggggcgcctgatgcggtattttctccttacgcatctgtgcgg7860tatttcacaccgcatacgtcaaagcaaccatagtacgcgccctgtagcggcgcattaagc7920gcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgccc7980gctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagct8040ctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaa8100aaacttgatttgggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgc8160cctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaaca8220ctcaaccctatctcgggctattcttttgatttataagggattttgccgatttcggcctat8280tggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacg8340tttacaattttatggtgcactctcagtacaatctgctctgatgccgcatagttaagccag8400ccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatcc8460gcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtca8520tcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtc8580atgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacc8640cctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccc8700tgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtc8760gcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctg8820gtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggat8880ctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagc8940acttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaa9000ctcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaa9060aagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagt9120gataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgct9180tttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaat9240gaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttg9300cgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactgg9360atggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggttt9420attgctgataaatctggagccggtgagcgtggaagccgcggtatcattgcagcactgggg9480ccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatg9540gatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactg9600tcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaa9660aggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttt9720tcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttt9780tttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgt9840ttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcag9900ataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgta9960gcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgat10020aagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcg10080ggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactg10140agatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggac10200aggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggga10260aacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgattt10320ttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggccttttta10380cggttcctggccttttgctggccttttgctcacatgt10417<210>64<211>9958<212>dna<213>synthetic<400>64gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagag60ataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga120aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcat180atgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaagga240cgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataag300gctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgttttagagct360agaaatagcaagttaaaataaggctagtccgtttttagcgcgtgcgccaattctgcagac420aaatggctctagaggtacccgttacataacttacggtaaatggcccgcctggctgaccgc480ccaacgacccccgcccattgacgtcaatagtaacgccaatagggactttccattgacgtc540aatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc600caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattgtgcccagt660acatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctatta720ccatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccac780ccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcgggggggg840ggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcgga900gaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggc960ggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgacgc1020tgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgactg1080accgcgttactcccacaggtgagcgggcgggacggcccttctcctccgggctgtaattag1140ctgagcaagaggtaagggtttaagggatggttggttggtggggtattaatgtttaattac1200ctggagcacctgcctgaaatcactttttttcaggttggaccggtgccaccatggactata1260aggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataaga1320tggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccatgtctagac1380tggataaaagtaaagtgattaacagcgcactggagctgcttaatgaggtcggaatcgaag1440gtctgacaaccagaaaactcgcccagaagctgggtgtagagcagcctacattgtattggc1500atgtaaaaaataagcgggctttgctcgacgccctggccattgagatgctggataggcacc1560atactcacttttgccctctggaaggggaaagctggcaagattttctgagaaataacgcta1620aaagttttagatgtgctctgctgagtcatcgcgatggagcaaaagtacatctgggtacac1680ggcctacagaaaaacagtatgaaactctcgaaaatcaactggcctttctgtgccaacaag1740gtttttcactggagaatgcactgtatgcactcagcgctgtggggcattttactctgggtt1800gcgtattggaagatcaagagcatcaagtcgctaaagaagaaagggaaacacctactactg1860atagtatgccgccactgctgcgacaagctatcgaactgtttgatcaccaaggtgcagagc1920cagccttcctgttcggccttgaattgatcatatgcggactggaaaaacaacttaaatgtg1980aaagtgggtctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagtg2040acaagaagtacagcatcggcctggacatcggcaccaactctgtgggctgggccgtgatca2100ccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcaca2160gcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggcca2220cccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatc2280tgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactgg2340aagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaaca2400tcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaac2460tggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatga2520tcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtgg2580acaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatca2640acgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggc2700tggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctga2760ttgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatg2820ccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccaga2880tcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgc2940tgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatga3000tcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagc3060agctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggct3120acattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaa3180agatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagc3240agcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgcca3300ttctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgaga3360agatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagat3420tcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtgg3480tggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacc3540tgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtata3600acgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcg3660gcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtga3720agcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccg3780gcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatca3840aggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctga3900ccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacc3960tgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggc4020tgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatt4080tcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcc4140tgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacg4200agcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtga4260aggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcg4320aaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatga4380agcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtgg4440aaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggata4500tgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcg4560tgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgaca4620agaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaact4680actggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgacca4740aggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctgg4800tggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacacta4860agtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagc4920tggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactacc4980accacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtacc5040ctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatga5100tcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaaca5160tcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctc5220tgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgcca5280ccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcaga5340caggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgcca5400gaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctatt5460ctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaag5520agctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttc5580tggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtact5640ccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcaga5700agggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccact5760atgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagc5820acaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcc5880tggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagccca5940tcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctg6000ccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagagg6060tgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacc6120tgtctcagctgggaggcgacaaaaggccggcggccacgaaaaaggccggccaggcaaaaa6180agaaaaaggaattcggcagtggagagggcagaggaagtctgctaacatgcggtgacgtcg6240aggagaatcctggcccagtgagcaagggcgaggagctgttcaccggggtggtgcccatcc6300tggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagg6360gcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccg6420tgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctacc6480ccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccagg6540agcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcg6600agggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggca6660acatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccg6720acaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggca6780gcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgc6840tgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagc6900gcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacg6960agctgtacaaggaattctaactagagctcgctgatcagcctcgactgtgccttctagttg7020ccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcc7080cactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattc7140tattctggggggtggggtggggcaggacagcaagggggaggattgggaagagaatagcag7200gcatgctggggagcggccgcaggaacccctagtgatggagttggccactccctctctgcg7260cgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccg7320ggcggcctcagtgagcgagcgagcgcgcagctgcctgcaggggcgcctgatgcggtattt7380tctccttacgcatctgtgcggtatttcacaccgcatacgtcaaagcaaccatagtacgcg7440ccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctaca7500cttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttc7560gccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgct7620ttacggcacctcgaccccaaaaaacttgatttgggtgatggttcacgtagtgggccatcg7680ccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactc7740ttgttccaaactggaacaacactcaaccctatctcgggctattcttttgatttataaggg7800attttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcg7860aattttaacaaaatattaacgtttacaattttatggtgcactctcagtacaatctgctct7920gatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgg7980gcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatg8040tgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgc8100ctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcactttt8160cggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtat8220ccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatg8280agtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtt8340tttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacga8400gtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaa8460gaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgt8520attgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggtt8580gagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgc8640agtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcgga8700ggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgat8760cgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcct8820gtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcc8880cggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcg8940gcccttccggctggctggtttattgctgataaatctggagccggtgagcgtggaagccgc9000ggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacg9060acggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctca9120ctgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgattta9180aaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgacc9240aaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaa9300ggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaacca9360ccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta9420actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggc9480caccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttacca9540gtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagtta9600ccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggag9660cgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgctt9720cccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgc9780acgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccac9840ctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaac9900gccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgt9958<210>65<211>3465<212>dna<213>synthetic<400>65tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtca60cagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtg120ttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgc180accatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgcc240attcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctat300tacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggt360tttcccagtcacgacgttgtaaaacgacggccagtgaattcgagctcggtaccactttcg420ggtgtggcggactctgaggtcccgggagtctcgctgccgctagacccactttcacattta480agttgtttttccagtccgcatatgatcaattcaaggccgaacaggaaggctggctctgca540ccttggtgatcaaacagttcgatagcttgtcgcagcagtggcggcatactatcagtagta600ggtgtttccctttcttctttagcgacttgatgctcttgatcttccaatacgcaacccaga660gtaaaatgccccacagcgctgagtgcatacagtgcattctccagtgaaaaaccttgttgg720cacagaaaggccagttgattttcgagagtttcatactgtttttctgtaggccgtgtaccc780agatgtacttttgctccatcgcgatgactcagcagagcacatctaaaacttttagcgtta840tttctcagaaaatcttgccagctttccccttccagagggcaaaagtgagtatggtgccta900tccagcatctcaatggccagggcgtcgagcaaagcccgcttattttttacatgccaatac960aatgtaggctgctctacacccagcttctgggcgagttttctggttgtcagaccttcgatt1020ccgacctcattaagcagctccagtgcgctgttaatcactttacttttatccagtctagac1080atggctgctgggactccgtggataccgaccttccgcttcttctttggggccatcttatcg1140tcatcgtctttgtaatcaatatcatgatccttgtagtctccgtcgtggtccttatagtcc1200atgtcgactgcagaggcctgcatgcaagcttggcgtaatcatggtcatagctgtttcctg1260tgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgta1320aagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccg1380ctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcgggga1440gaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcgg1500tcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacag1560aatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaacc1620gtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcaca1680aaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgt1740ttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacc1800tgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatc1860tcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagc1920ccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgact1980tatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtg2040ctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggta2100tctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggca2160aacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaa2220aaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacg2280aaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatcc2340ttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctg2400acagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcat2460ccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctg2520gccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaa2580taaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctcca2640tccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgc2700gcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggctt2760cattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaa2820aagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttat2880cactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgct2940tttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccga3000gttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaag3060tgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttga3120gatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttca3180ccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataaggg3240cgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatc3300agggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaatag3360gggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatca3420tgacattaacctataaaaataggcgtatcacgaggccctttcgtc3465<210>66<211>29<212>dna<213>synthetic<400>66gtggaattgtgagcggataacaatttcac29<210>67<211>19<212>dna<213>synthetic<400>67tccctatcagtgatagaga19<210>68<211>33<212>dna<213>syntehtic<400>68aaactatcgtactagttaactagtacgatagtt33<210>69<211>3792<212>dna<213>智人(homosapiens)<400>69atgaataacggaactaataacttccaaaacttcatcgggatcagttccttgcagaaaact60ctccggaatgctctcatcccaactgagactactcagcagttcattgttaagaatggaatc120ataaaagaggacgagcttaggggggaaaataggcaaatcctcaaggatatcatggatgac180tattataggggctttatatccgagacactgagcagcattgatgatatagactggacctct240cttttcgaaaagatggaaatacaacttaaaaatggagataacaaggacaccctgataaag300gaacagaccgaatataggaaggcaattcataaaaagtttgctaacgatgataggtttaaa360aacatgttctcagcaaaactcatttcagatatactgcccgaattcgttatccacaacaac420aactactccgctagcgaaaaagaggaaaagacccaagtcataaagctgttctctcgattc480gcgacgagttttaaagattatttcaagaatcgcgcaaactgtttctcagctgatgatatc540agcagctcatcctgtcatcggatcgttaacgataatgctgaaatcttcttctccaatgca600cttgtttataggcgcattgttaaatctctctcaaacgatgatatcaataagatttccggc660gatatgaaggacagtcttaaggagatgagcctcgaagagatatactcatacgagaaatat720ggcgaatttatcacccaggaagggatttccttctataatgacatttgcggcaaagtcaat780tccttcatgaacctgtattgccaaaaaaataaagaaaacaagaacctctataagctgcaa840aagttgcataagcaaatactttgtatcgcggatacaagctatgaagttccctacaagttc900gagagtgatgaggaggtgtatcaatctgtcaatggtttccttgataatatttcttctaag960catattgttgaacgactccgaaagataggagacaactataatggatacaatttggataaa1020atctacatcgtgtctaaattttacgagagtgtgtcacaaaaaacatatagagactgggag1080acaattaataccgccctggagatacattacaacaatatacttcccgggaacgggaagtct1140aaggcagacaaggtgaagaaagccgtgaagaacgacttgcaaaagtcaattaccgaaatc1200aatgagcttgtttcaaactataaactttgttcagatgacaatattaaagccgaaacctat1260attcatgaaatctctcatattctgaataactttgaggcgcaagaactgaaatataaccca1320gaaatacacctcgttgagtccgaactgaaagcaagcgaactgaaaaatgttttggacgtg1380ataatgaacgcttttcattggtgctcagtctttatgacagaggagcttgttgacaaggat1440aacaatttctatgcggaactggaagagatttacgacgaaatctatccggtcatatccctg1500tataacctggttcgcaactatgtcacgcaaaaaccatacagcacgaagaagattaaactg1560aactttggtattccgacgctggccgatggatggtcaaaatctaaggaatactcaaacaat1620gccataatcctgatgcgagataacctctactaccttggaatctttaatgctaaaaataaa1680cccgataaaaaaattatcgaagggaacacgagtgaaaacaaaggtgattataaaaaaatg1740atatataatctgcttccaggaccaaataagatgatacccaaagttttcctttcttcaaag1800accggcgtcgagacatataaaccatccgcgtacatacttgaaggctacaaacaaaataaa1860catatcaaatcatctaaggattttgacattacgttctgtcatgatttgattgactatttc1920aaaaattgcatagccattcatccagagtggaaaaactttgggtttgacttctctgatacc1980agtacatatgaagacataagtggattttaccgagaagtagagctccaaggttataaaata2040gactggacctatatatctgaaaaggatatagaccttttgcaagagaagggacagctttat2100cttttccaaatctacaacaaagacttcagtaagaaaagtaccgggaatgacaatcttcat2160accatgtatctgaagaacctgttctccgaagaaaatctgaaggacatagtcctgaagctt2220aatggcgaagcggaaatttttttccgaaagagctctattaagaaccccataatacataag2280aagggaagcattctcgttaatcgaacgtatgaggccgaagagaaagatcaatttgggaat2340atccaaatcgttcgaaagaacataccagaaaatatttaccaagaattgtacaaatatttt2400aacgataaaagcgacaaagaactgtctgatgaagctgctaagctgaaaaacgtcgtcggc2460catcatgaggccgcgacgaatatagtcaaggattaccgatatacatacgataagtatttc2520ctgcatatgcccatcactatcaactttaaggcaaataagactggattcattaatgacaga2580atactgcaatacatagctaaagaaaaagatttgcatgttattggcattgacaggggtgag2640cgcaatcttatctatgtaagcgtcattgatacttgcgggaatatcgtagagcagaagtca2700tttaatattgtaaatgggtacgattaccaaatcaagttgaagcagcaagagggagcacga2760cagattgcccgcaaggagtggaaagagatcggaaagataaaggagatcaaggaggggtat2820ttgtcccttgttatacacgaaatttccaagatggtaatcaagtacaacgctataattgct2880atggaggatctctcctatggatttaaaaagggaagatttaaagtcgagcggcaggtatat2940cagaaatttgaaacaatgcttattaataaacttaattatctcgttttcaaagacattagt3000atcaccgaaaacggtgggctgttgaagggctatcaacttacgtacataccagataagctt3060aagaatgtgggtcaccaatgcggatgcatattctacgtgcccgcagcttatacaagcaaa3120atcgacccaacaacgggtttcgtaaacatatttaagttcaaggatctcaccgtggatgcc3180aagcgagagttcataaaaaaatttgactcaatcagatatgactcagaaaagaatcttttt3240tgttttaccttcgactacaataatttcattacacaaaatacggttatgagcaagtcatcc3300tggtccgtatatacgtatggagtgcgcataaagcggagattcgttaacgggcgattttct3360aatgagtccgatacaatcgatataacaaaggatatggaaaaaactctggaaatgactgat3420ataaattggagggacggtcatgacctcaggcaagacattatcgattatgagatcgtgcaa3480catatttttgagatctttcggttgactgtccaaatgaggaactctctgtctgaattggaa3540gatagggactacgatcgcctgataagccccgtgttgaacgagaataacatattctacgat3600tccgcgaaagccggggatgcgctccctaaggacgccgatgcaaatggggcctattgtatt3660gctttgaaagggctgtacgaaatcaaacagatcaccgaaaactggaaagaagacgggaag3720tttagtcgggataaactgaagatatccaacaaggactggtttgactttatccaaaataag3780cgatatttgtaa3792<210>70<211>3792<212>dna<213>大肠杆菌(e.coli)<400>70atgaacaacggcacaaataattttcagaacttcatcgggatctcaagtttgcagaaaacg60ctgcgcaatgctctgatccccacggaaaccacgcaacagttcatcgtcaagaacggaata120attaaagaagatgagttacgtggcgagaaccgccagattctgaaagatatcatggatgac180tactaccgcggattcatctctgagactctgagttctattgatgacatagattggactagc240ctgttcgaaaaaatggaaattcagctgaaaaatggtgataataaagataccttaattaag300gaacagacagagtatcggaaagcaatccataaaaaatttgcgaacgacgatcggtttaag360aacatgtttagcgccaaactgattagtgacatattacctgaatttgtcatccacaacaat420aattattcggcatcagagaaagaggaaaaaacccaggtgataaaattgttttcgcgcttt480gcgactagctttaaagattacttcaagaaccgtgcaaattgcttttcagcggacgatatt540tcatcaagcagctgccatcgcatcgtcaacgacaatgcagagatattcttttcaaatgcg600ctggtctaccgccggatcgtaaaatcgctgagcaatgacgatatcaacaaaatttcgggc660gatatgaaagattcattaaaagaaatgagtctggaagaaatatattcttacgagaagtat720ggggaatttattacccaggaaggcattagcttctataatgatatctgtgggaaagtgaat780tcttttatgaacctgtattgtcagaaaaataaagaaaacaaaaatttatacaaacttcag840aaacttcacaaacagattctatgcattgcggacactagctatgaggtcccgtataaattt900gaaagtgacgaggaagtgtaccaatcagttaacggcttccttgataacattagcagcaaa960catatagtcgaaagattacgcaaaatcggcgataactataacggctacaacctggataaa1020atttatatcgtgtccaaattttacgagagcgttagccaaaaaacctaccgcgactgggaa1080acaattaataccgccctcgaaattcattacaataatatcttgccgggtaacggtaaaagt1140aaagccgacaaagtaaaaaaagcggttaagaatgatttacagaaatccatcaccgaaata1200aatgaactagtgtcaaactataagctgtgcagtgacgacaacatcaaagcggagacttat1260atacatgagattagccatatcttgaataactttgaagcacaggaattgaaatacaatccg1320gaaattcacctagttgaatccgagctcaaagcgagtgagcttaaaaacgtgctggacgtg1380atcatgaatgcgtttcattggtgttcggtttttatgactgaggaacttgttgataaagac1440aacaatttttatgcggaactggaggagatttacgatgaaatttatccagtaattagtctg1500tacaacctggttcgtaactacgttacccagaaaccgtacagcacgaaaaagattaaattg1560aactttggaataccgacgttagcagacggttggtcaaagtccaaagagtattctaataac1620gctatcatactgatgcgcgacaatctgtattatctgggcatctttaatgcgaagaataaa1680ccggacaagaagattatcgagggtaatacgtcagaaaataagggtgactacaaaaagatg1740atttataatttgctcccgggtcccaacaaaatgatcccgaaagttttcttgagcagcaag1800acgggggtggaaacgtataaaccgagcgcctatatcctagaggggtataaacagaataaa1860catatcaagtcttcaaaagactttgatatcactttctgtcatgatctgatcgactacttc1920aaaaactgtattgcaattcatcccgagtggaaaaacttcggttttgattttagcgacacc1980agtacttatgaagacatttccgggttttatcgtgaggtagagttacaaggttacaagatt2040gattggacatacattagcgaaaaagacattgatctgctgcaggaaaaaggtcaactgtat2100ctgttccagatatataacaaagatttttcgaaaaaatcaaccgggaatgacaaccttcac2160accatgtacctgaaaaatcttttctcagaagaaaatcttaaggatatcgtcctgaaactt2220aacggcgaagcggaaatcttcttcaggaagagcagcataaagaacccaatcattcataaa2280aaaggctcgattttagtcaaccgtacctacgaagcagaagaaaaagaccagtttggcaac2340attcaaattgtgcgtaaaaatattccggaaaacatttatcaggagctgtacaaatacttc2400aacgataaaagcgacaaagagctgtctgatgaagcagccaaactgaagaatgtagtggga2460caccacgaggcagcgacgaatatagtcaaggactatcgctacacgtatgataaatacttc2520cttcatatgcctattacgatcaatttcaaagccaataaaacgggttttattaatgatagg2580atcttacagtatatcgctaaagaaaaagacttacatgtgatcggcattgatcggggcgag2640cgtaacctgatctacgtgtccgtgattgatacttgtggtaatatagttgaacagaaaagc2700tttaacattgtaaacggctacgactatcagataaaactgaaacaacaggagggcgctaga2760cagattgcgcggaaagaatggaaagaaattggtaaaattaaagagatcaaagagggctac2820ctgagcttagtaatccacgagatctctaaaatggtaatcaaatacaatgcaattatagcg2880atggaggatttgtcttatggttttaaaaaagggcgctttaaggtcgaacggcaagtttac2940cagaaatttgaaaccatgctcatcaataaactcaactatctggtatttaaagatatttcg3000attaccgagaatggcggtctcctgaaaggttatcagctgacatacattcctgataaactt3060aaaaacgtgggtcatcagtgcggctgcattttttatgtgcctgctgcatacacgagcaaa3120attgatccgaccaccggctttgtgaatatctttaaatttaaagacctgacagtggacgca3180aaacgtgaattcattaaaaaatttgactcaattcgttatgacagtgaaaaaaatctgttc3240tgctttacatttgactacaataactttattacgcaaaacacggtcatgagcaaatcatcg3300tggagtgtgtatacatacggcgtgcgcatcaaacgtcgctttgtgaacggccgcttctca3360aacgaaagtgataccattgacataaccaaagatatggagaaaacgttggaaatgacggac3420attaactggcgcgatggccacgatcttcgtcaagacattatagattatgaaattgttcag3480cacatattcgaaattttccgtttaacagtgcaaatgcgtaactccttgtctgaactggag3540gaccgtgattacgatcgtctcatttcacctgtactgaacgaaaataacattttttatgac3600agcgcgaaagcgggggatgcacttcctaaggatgccgatgcaaatggtgcgtattgtatt3660gcattaaaagggttatatgaaattaaacaaattaccgaaaattggaaagaagatggtaaa3720ttttcgcgcgataaactcaaaatcagcaataaagattggttcgactttatccagaataag3780cgctatctctaa3792当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1