核酸分子及其用途的制作方法

文档序号:21007193发布日期:2020-06-05 23:13阅读:197来源:国知局
核酸分子及其用途的制作方法
电子提交的序列表的引用以ascii文本文件电子提交的的序列表的内容(名称:4159_493pc01_st25;大小:434,561字节;和创建日期:2018年8月9日)通过提述以其整体并入本文。发明背景基因疗法提供了一种持久治疗多种疾病的方式。在过去,基因疗法通常依赖于病毒的使用。出于此目的可选择许多病毒药剂,每种病毒药剂具有将使其或多或少地适合于基因疗法的独特性质。zhou等,advdrugdelivrev.106(pta):3-26,2016。然而,一些病毒载体的非期望的性质(包括其免疫原性或引起癌症的倾向)已经导致临床安全性担忧,并且直到最近,它们当前在临床上的应用限于某些应用,例如疫苗和溶瘤策略。cotter等,frontbiosci.10:1098-105(2005)。腺相关病毒(aav)是研究最常见的基因疗法载体之一。aav是围绕并保护约4.8千碱基(kb)的小的单链dna基因组的蛋白质壳。naso等,biodrugs,31(4):317-334,2017。aav属于细小病毒科,并且依赖于与其它病毒(主要是腺病毒)共同感染,以便复制。同上引用。它的单链基因组含有三个基因:rep(复制)、cap(衣壳)和aap(组装)。同上引用。这些编码序列的侧翼是基因组复制和包装所需的反向末端重复(itr)。同上引用。两个顺式作用aavitr的长度为大约145个核苷酸,其由回文序列中断,这些回文序列可折叠成t形发夹结构,所述发夹结构在dna复制起始过程中充当引物。然而,使用常规的aav作为基因递送载体已经导致一些缺点。主要缺点之一与aav的约4.5kb的异源dna的有限病毒包装能力有关。(dong等,humgenether.7(17):2101-12,1996)。此外,aav载体的施用可诱导人类中的免疫应答。尽管已显示aav的免疫原性低于一些其它病毒(即腺病毒),但衣壳蛋白可以触发人类免疫系统的多种组分。参见naso等,2017。aav是人类群体中的常见病毒,且大多数人已经被暴露于aav,因此,大多数人已经针对他们先前被暴露的特定变体产生了免疫应答。这种预先存在的适应性应答可包括nab和t细胞,所述nab和t细胞可降低随后再次感染aav和/或消除已被转导的细胞的临床效果,这使原先存在抗aav免疫力的患者对基于avv的基因疗法治疗不适格。无论是局部施用还是全身性施用,该病毒都将被视为一种外来蛋白质,因此,适应性免疫系统将试图消除它。此外,当第一次aav治疗未能达到治疗性功效水平时,由aav治疗诱导的抗aav中和抗体阻碍aav的重复治疗。此外,证据表明,aavitr的t形发夹环容易受到结合aavitr的t形发夹结构的宿主细胞蛋白质/蛋白质复合物的抑制。参见,例如,zhou等,scientificreports7:5432(2017年7月14日)。因此,本领域中需要在体外和体内环境中有效且持续表达靶序列,例如,治疗性蛋白质和/或mirna,同时避免现有aav载体技术的一些意外后果和局限性。发明概述本公开的一方面涉及一种核酸分子,其包含第一反向末端重复(itr)、第二itr和编码治疗性蛋白质的基因盒;其中所述第一itr和/或所述第二itr是非腺相关病毒(非aav)的itr,其中所述基因盒位于所述第一itr和所述第二itr之间,且其中所述治疗性蛋白质包含凝血因子。在一些实施方案中,所述非aav选自病毒科细小病毒科的成员及其任何组合。在一些实施方案中,所述第一itr是非aav的itr且所述第二itr是腺相关病毒(aav)的itr,或其中所述第一itr是aav的itr且所述第二itr是非aav的itr。在其它实施方案中,所述第一itr和所述第二itr是非aav的itr。在一些实施方案中,所述第一itr和所述第二itr是相同的。在一些实施方案中,所述第一itr和/或所述第二itr包含回文序列,该回文序列是不间断的。在其它实施方案中,所述第一itr和/或所述第二itr包含回文序列,该回文序列是间断的。在一些实施方案中,所述核酸分子中的非aav是病毒科细小病毒科的成员。在一些实施方案中,所述病毒科细小病毒科的成员选自下组:博卡病毒属(bocavirus)、依赖病毒属(dependovirus)、红病毒属(erythrovirus)、貂阿留申病毒属(amdovirus)、细小病毒属(parvovirus)、浓核病毒属(densovirus)、重复病毒属(iteravirus)、康特拉病毒属(contravirus)、aveparvovirus、copiparvovirus、原细小病毒属(protoparvovirus)、四细小病毒属(tetraparvovirus)、双义浓核病毒属(ambidensovirus)、短小浓核病毒属(brevidensovirus)、肝胰浓核病毒属(hepandensovirus)、对虾浓核病毒属(penstyldensovirus)及其任何组合。在一些实施方案中,所述病毒科细小病毒科的成员是红病毒属细小病毒b19(人类病毒)。在一些实施方案中,所述病毒科细小病毒科的成员是番鸭细小病毒(muscovyduckparvovirus,(mdpv))株。在一些实施方案中,所述mdpv株是减毒的fz91-30。在一些实施方案中,所述mdpv株是致病性yy。在又一些实施方案中,依赖细小病毒(dependoparvovirus)是依赖病毒属鹅细小病毒(gpv)株。在一些实施方案中,所述gpv株是减毒的82-0321v。在一些实施方案中,所述gpv株是致病性b。在一些实施方案中,所述病毒科细小病毒科的成员选自下组:猪细小病毒(u44978)、小鼠微小病毒(u34256)、犬细小病毒(m19296)、水貂肠炎病毒(d00765)及其任何组合。在一些实施方案中,所述核酸分子进一步包含启动子。在一些实施方案中,所述启动子是组织特异性启动子。在一些实施方案中,所述启动子驱动所述治疗性蛋白质在肝细胞、内皮细胞、肌肉细胞、窦状细胞或其任何组合中的表达。在一些实施方案中,所述启动子位于编码所述凝血因子的核酸序列的5'。在一些实施方案中,所述启动子选自下组:小鼠甲状腺素启动子(mttr)、内源性人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、tristetraprolin(ttp)启动子、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、α1-抗胰蛋白酶(aat)、肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)、肌间线蛋白(des)、spc5-12、2r5sc5-12、dmck、tmck、磷酸甘油酸激酶(pgk)启动子及其任何组合。在一些实施方案中,所述启动子包含ttp启动子。在一些实施方案中,所述核酸分子还包含内含子序列。在一些实施方案中,所述内含子序列位于编码所述凝血因子的核酸序列的5'。在一些实施方案中,所述内含子序列位于所述启动子的3'。在一些实施方案中,其中所述内含子序列包含合成的内含子序列。在一些实施方案中,所述内含子序列包含seqidno:115。在一些实施方案中,所述核酸分子包含转录后调控元件。在一些实施方案中,所述转录后调控元件位于编码所述凝血因子的核酸序列的3'。在一些实施方案中,所述转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(wpre)、微小rna结合位点、dna核靶向序列,或其任何组合。在一些实施方案中,所述微小rna结合位点包含对mir142-3p的结合位点。在一些实施方案中,所述核酸分子包含3'utr聚(a)尾序列。在一些实施方案中,所述3'utr聚(a)尾序列选自下组:bgh聚(a)、肌动蛋白聚(a)、血红蛋白聚(a)及其任何组合。在一些实施方案中,所述3'utr聚(a)尾序列包含bgh聚(a)。在一些实施方案中,所述核酸分子包含增强子序列。在一些实施方案中,所述增强子序列位于所述第一itr和所述第二itr之间。在一些实施方案中,所述核酸分子按此顺序包含:第一itr、基因盒和第二itr;其中所述基因盒包含组织特异性启动子序列、内含子序列、编码治疗性蛋白质(例如,凝血因子)或mirna的核酸序列、转录后调控元件和3'utr聚(a)尾序列。在一些实施方案中,所述核酸分子按此顺序包含:组织特异性启动子序列、内含子序列、编码fviii多肽的核酸序列、转录后调控元件和3'utr聚(a)尾序列。在一个实施方案中,所述核酸分子包含:(a)第一itr,其是细小病毒科的非aav家族成员的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码治疗性蛋白质(例如,凝血因子)或mirna的核苷酸序列;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;和(g)第二itr,其是细小病毒科的非aav家族成员的itr。在一些实施方案中,所述核酸分子包含单链的核酸。在一些实施方案中,所述基因盒包含双链的核酸。在一些实施方案中,所述核酸分子包含编码治疗性蛋白质(例如,凝血因子)的基因,其中所述凝血因子是由肝细胞、内皮细胞、肌肉细胞、窦状细胞、或其任何组合表达的。在一些实施方案中,所述凝血因子包含因子i(fi)、因子ii(fii)、因子v(fv)、因子vii(fvii)、因子viii(fviii)、因子ix(fix)、因子x(fx)、因子xi(fxi)、因子xii(fxii)、因子xiii(fviii)、血管性血友病因子(vwf)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白质z相关的蛋白酶抑制剂(zpi)、血纤维蛋白溶酶原、α2-抗纤维蛋白溶酶、组织血纤维蛋白溶酶原激活物(tpa)、尿激酶、血纤维蛋白溶酶原激活物抑制剂-1(pai-1)、血纤维蛋白溶酶原激活物抑制剂-2(pai2)或其任何组合。在一些实施方案中,所述凝血因子是fviii。在一些实施方案中,所述fviii包含全长成熟fviii。在一些实施方案中,所述fviii包含与seqidno:106的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的氨基酸序列。在一些实施方案中,所述fviii包含a1域、a2域、a3域、c1域、c2域和部分b域或不包含b域。在一些实施方案中,所述fviii包含与seqidno:109的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的氨基酸序列。在一些实施方案中,所述凝血因子包含异源部分。在一些实施方案中,所述异源部分选自下组:白蛋白或其片段、免疫球蛋白fc区、人绒毛膜促性腺激素的β亚基的c端肽(ctp)、pas序列、hap序列、转铁蛋白或其片段、白蛋白结合部分,其衍生物,及其任何组合。在一些实施方案中,所述异源部分与fviii的n端或c端连接或被插入在所述fviii中的两个氨基酸之间。在一些实施方案中,所述异源部分被插入在选自表5中所列的插入位点的一个或多个插入位点处的两个氨基酸之间。在一些实施方案中,所述fviii还包含a1域、a2域、c1域、c2域、任选的b域和异源部分,其中所述异源部分被插入在紧邻对应于成熟fviii(seqidno:106)的氨基酸745的下游。在一些实施方案中,所述fviii进一步包含fcrn结合配偶体。在一些实施方案中,所述fcrn结合配偶体包含免疫球蛋白恒定域的fc区。在一些实施方案中,编码所述fviii的核酸序列是密码子优化的。在一些实施方案中,编码所述fviii的核酸序列经密码子优化用于在人中表达。在一些实施方案中,编码所述fviii的核酸序列包含与seqidno:107的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一的核苷酸序列。在一些实施方案中,编码所述fviii的核酸序列包含与seqidno:71的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一的核苷酸序列。在一些实施方案中,所述核酸分子与递送剂一起配制。在一些实施方案中,所述递送剂包含一种或多种脂质纳米颗粒。在一些实施方案中,所述递送剂选自下组:脂质体、非脂质聚合物分子、内体及其任何组合。在一些实施方案中,所述核酸分子经配制用于静脉内、经皮、皮内、皮下、肺部或口服递送或其任何组合。在一些实施方案中,所述核酸分子经配制用于静脉内递送。在一些实施方案中,本文提供了一种载体,其包含如遍及本公开所述的核酸分子。在一些实施方案中,本文提供了一种多肽,其由如遍及本公开所述的核酸分子编码。在一些实施方案中,提供了一种宿主细胞,其包含如遍及本公开所述的核酸分子。在一些实施方案中,本文提供了一种药物组合物,其包含(a)如本文所述的核酸,包含如遍及本公开所述的核酸分子的载体,由如遍及本公开所述的核酸分子编码的多肽,或包含如遍及本公开所述的核酸分子的宿主细胞;(b)lnp;和(c)药学上可接受的赋形剂。在一些实施方案中,本文提供了一种试剂盒,其包含如遍及本公开所述的核酸分子和用于向有需要的受试者施用所述核酸分子的说明书。在一些实施方案中,本文提供了一种杆状病毒系统,其用于产生本文所述的核酸分子。在一些实施方案中,本文提供了一种杆状病毒,其中本文公开的核酸分子在昆虫细胞中产生。在一些实施方案中,本文提供了一种用于表达构建体的纳米颗粒递送系统,其中所述表达构建体包含本文所述的核酸分子。本文还公开了一种产生具有凝血活性的多肽的方法,其包括:在适合的条件下培养本文公开的宿主细胞并回收所述具有凝血活性的多肽。在一些实施方案中,本文公开了一种在有需要的受试者中表达凝血因子的方法,其包括向所述受试者施用本文公开的核酸分子、本文公开的载体、本文公开的多肽或本文公开的药物组合物。在一些实施方案中,本文公开了一种治疗患有凝血因子缺乏症的受试者的方法,其包括向所述受试者施用本文公开的核酸分子、本文公开的载体、本文公开的多肽或本文公开的药物组合物。在一些实施方案中,所述核酸分子是静脉内、经皮、皮内、皮下、口服、肺部或其任何组合施用的。在一些实施方案中,所述核酸分子是静脉内施用的。在一些实施方案中,所述方法进一步包括向所述受试者施用第二药剂。在一些实施方案中,所述受试者是哺乳动物。在一些实施方案中,所述受试者是人。在一些实施方案中,向所述受试者施用所述核酸分子导致相对于在所述施用之前所述受试者中的fviii活性增加的fviii活性,其中所述fviii活性增加为至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。在一些实施方案中,所述受试者患有出血性病症。在一些实施方案中,所述出血性病症是血友病。在一些实施方案中,所述出血性病症是血友病a。附图简述图1a是单链凝血因子(例如,fviii)表达盒的示意图。显示了来自非aav的5'itr(在ssdna结构的末端具有发夹环)、来自非aav的3'itr(具有发夹环)、启动子序列(例如,ttpp)和转基因序列(例如,具有在b域内插入的xten144的fviiico6xten序列)的位置。示例性表达盒还显示了额外的可能元件,例如,内含子序列,wpremut序列和bghpa序列。图1b-1d是用于制备单链凝血因子表达盒(如图1a中所示的盒)的质粒的示意图,其中盒的itr衍生自aav2(图1b)、b19(图1c)或gpv(图1d)。包含如所示的ssfviii表达盒的质粒构建体用pvuii(在pvuii位点)消化(图1b)或用lgui(在lgui位点)(图1c和1d)消化以释放病毒基因组。双链dna经加热至95℃以生成ssdna,然后在4℃温育以允许itr结构形成。图2a是说明多种细小病毒家族成员之间的关系的系统进化树。b19、aav-2和gpv用空心框标记。图2b是各种盒(包括发夹结构)的示意图。图3a和3b是b19、gpv和aav2的itr(图3a)以及b19和gpv的itr(图3b)的比对。灰色阴影显示同源性。图4a-4c显示在hema小鼠中经由流体动力学注射(hdi)的单链的fviii-aav裸dna(ssaav-fviii;图2a)、ssdna-b19fviii(图2b)或ssdna-gpvfviii(图2c)施用后的fviii血浆活性。在以50μg/小鼠(图2c)、20μg/小鼠(图2a和2b)、10μg/小鼠(图2a和2c)或5μg/小鼠(图2a)用ssdna的单次hdi处理的小鼠中的24小时、3天、2周、3周、1个月、2个月、3个月和4个月时的血浆样品中测量fviii活性(作为对照的百分比)。给予5μg/小鼠的质粒dna的hdi作为对照(图2a-2c)。发明详述本公开描述了质粒样核酸分子,其包含第一反向末端重复(itr)、第二itr和基因盒(例如,编码治疗性蛋白质或mirna的基因盒),其中第一itr和/或第二itr是非腺相关病毒的itr(例如,第一itr和/或第二itr来自非aav)。在一些实施方案中,基因盒编码治疗性蛋白质。在一些实施方案中,治疗性蛋白质包括选自凝血因子、生长因子、激素、细胞因子、抗体、其片段或其组合的蛋白质。在一些实施方案中,基因盒编码肌萎缩蛋白x连锁型、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环化水解酶、smn1、fxn(共济蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)、或其任何组合。在一些实施方案中,治疗性蛋白质包含凝血因子。在一个特定的实施方案中,治疗性蛋白质包含fviii或fix蛋白质。在一些实施方案中,基因盒编码mirna。在某些实施方案中,mirna下调选自sod1、htt、rho或其任何组合的靶基因的表达。在某些实施方案中,非aav选自病毒科细小病毒的成员及其任何组合。本公开还涉及在有需要的受试者中表达治疗性蛋白质(例如,凝血因子,例如,fviii)的方法,其包括向所述受试者施用核酸分子,该核酸分子包含第一反向末端重复(itr)、第二itr和基因盒(例如,编码治疗性蛋白质或mirna的基因盒),其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在某些实施方案中,本公开描述了包含核苷酸序列的分离的核酸分子,其与选自seqidno:113和120的核苷酸序列具有序列同源性。在附图和序列表中示出了本公开的示例性构建体。为了提供对说明书和权利要求的清楚理解,下面提供以下定义。i.定义应当注意,术语“一(a、an)”实体是指该实体的一个或多个:例如,“核苷酸序列”应理解为代表一个或多个核苷酸序列。类似地,“治疗性蛋白质”和“mirna”应理解为分别代表一个或多个治疗性蛋白质和一个或多个mirna。同样地,术语“一(a、an)”、“一个或多个”和“至少一个”在本文中可以互换使用。术语“约”在本文中用来表示大约(approximately)、大致(roughly)、近似(around)或在其区域中。当术语“约”与数值范围结合使用时,它通过扩展所示数值的上下边界来修改该范围。通常,术语“约”在本文中用于以高于或低于(更高或更低)10%的变异幅度来修改高于或低于指定值的数值。同样如本文中所使用的,“和/或”是指并涵盖一个或多个相关的列出的物品的任何和所有可能的组合,以及当以替代方式(“或”)解释时组合的缺少。“核酸”、“核酸分子”、“核苷酸”、“核苷酸序列”和“多核苷酸”可互换使用,且是指核糖核苷(腺苷、鸟苷、尿苷或胞苷;“rna分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“dna分子”)的磷酸酯聚合形式,或其任何磷酸酯类似物,如单链形式或双链螺旋形式的硫代磷酸酯和硫酯。单链的核酸序列是指单链的dna(ssdna)或单链的rna(ssrna)。双链的dna-dna、dna-rna和rna-rna螺旋是可能的。术语核酸分子,特别是dna或rna分子,仅指分子的一级和二级结构,并且不限于任何特定的三级形式。因此,此术语包括尤其在线性或环状dna分子(例如,限制性片段)、质粒、超螺旋dna和染色体中发现的双链dna。在讨论特定的双链dna分子的结构时,可根据沿dna的非转录链(即具有与mrna同源的序列的链)仅给出5’至3’方向的序列的常规惯例在本文中描述序列。“重组dna分子”是已经经历分子生物学操作的dna分子。dna包括,但不限于,cdna、基因组dna、质粒dna、合成的dna和半合成的dna。本公开的“核酸组合物”包含一个或多个如本文所述的核酸。如本文所用的,“反向末端重复”(或“itr”)是指位于单链核酸序列的5'或3'端的核酸亚序列,其包含一组核苷酸(初始序列),其下游是反向互补,即回文序列。初始序列和反向互补之间的核苷酸间插序列可以是任何长度,包括零。在一个实施方案中,可用于本公开的itr包含一个或多个“回文序列”。itr可具有许多功能。在一些实施方案中,本文所述的itr形成发夹结构。在一些实施方案中,itr形成t形发夹结构。在一些实施方案中,itr形成非t形发夹结构,例如,u形发夹结构。在一些实施方案中,itr促进核酸分子在细胞核中的长期存活。在一些实施方案中,itr促进核酸分子在细胞的核中的永久存活(例如,在细胞的整个寿命中)。在一些实施方案中,itr促进核酸分子在细胞核中的稳定性。在一些实施方案中,促进核酸分子在细胞核中的保留。在一些实施方案中,itr促进核酸分子在细胞核中的存留。在一些实施方案中,itr抑制或防止核酸分子在细胞核中的降解。在一个实施方案中,初始序列和/或反向互补物包含约2-600个核苷酸、约2-550个核苷酸、约2-500个核苷酸、约2-450个核苷酸、约2-400个核苷酸、约2-350个核苷酸、约2-300个核苷酸或约2-250个核苷酸。在一些实施方案中,初始序列和/或反向互补物包含约5-600个核苷酸、约10-600个核苷酸、约15-600个核苷酸、约20-600个核苷酸、约25-600个核苷酸、约30-600个核苷酸、约35-600个核苷酸、约40-600个核苷酸、约45-600个核苷酸、约50-600个核苷酸、约60-600个核苷酸、约70-600个核苷酸、约80-600个核苷酸、约90-600个核苷酸、约100-600个核苷酸、约150-600个核苷酸、约200-600个核苷酸、约300-600个核苷酸、约350-600个核苷酸、约400-600个核苷酸、约450-600个核苷酸、约500-600个核苷酸或约550-600个核苷酸。在一些实施方案中,初始序列和/或反向互补物包含约5-550个核苷酸、约5至500个核苷酸、约5-450个核苷酸、约5至400个核苷酸、约5-350个核苷酸、约5至300个核苷酸或约5-250个核苷酸。在一些实施方案中,初始序列和/或反向互补物包含约10-550个核苷酸、约15-500个核苷酸、约20-450个核苷酸、约25-400个核苷酸、约30-350个核苷酸、约35-300个核苷酸或约40-250个核苷酸。在某些实施方案中,初始序列和/或反向互补物包含约225个核苷酸、约250个核苷酸、约275个核苷酸、约300个核苷酸、约325个核苷酸、约350个核苷酸、约375个核苷酸、约400个核苷酸、约425个核苷酸、约450个核苷酸、约475个核苷酸、约500个核苷酸、约525个核苷酸、约550个核苷酸、约575个核苷酸或约600个核苷酸。在特定的实施方案中,初始序列和/或反向互补物包含约400个核苷酸。在其它实施方案中,初始序列和/或反向互补物包含约2-200个核苷酸、约5-200个核苷酸、约10-200个核苷酸、约20-200个核苷酸、约30-200个核苷酸、约40-200个核苷酸、约50-200个核苷酸、约60-200个核苷酸、约70-200个核苷酸、约80-200个核苷酸、约90-200个核苷酸、约100-200个核苷酸、约125-200个核苷酸、约150-200个核苷酸或约175-200个核苷酸。在其它实施方案中,初始序列和/或反向互补物包含约2-150个核苷酸、约5-150个核苷酸、约10-150个核苷酸、约20-150个核苷酸、约30-150个核苷酸、约40-150个核苷酸、约50-150个核苷酸、约75-150个核苷酸、约100-150个核苷酸或约125-150个核苷酸。在其它实施方案中,初始序列和/或反向互补物包含约2-100个核苷酸、约5-100个核苷酸、约10-100个核苷酸、约20-100个核苷酸、约30-100个核苷酸、约40-100个核苷酸、约50-100个核苷酸或约75-100个核苷酸。在其它实施方案中,初始序列和/或反向互补物包含约2-50个核苷酸、约10-50个核苷酸、约20-50个核苷酸、约30-50个核苷酸、约40-50个核苷酸、约3-30个核苷酸、约4-20个核苷酸或约5-10个核苷酸。在另一实施方案中,初始序列和/或反向互补物由两个核苷酸、三个核苷酸、四个核苷酸、五个核苷酸、六个核苷酸、七个核苷酸、八个核苷酸、九个核苷酸、十个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸组成。在其它实施方案中,初始序列和反向互补物之间的间插核苷酸为(例如,由以下组成)0个核苷酸、1个核苷酸、两个核苷酸、三个核苷酸、四个核苷酸、五个核苷酸、六个核苷酸、七个核苷酸、八个核苷酸、九个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸。因此,如本文所用的“itr”可自身折叠并形成双链区段。例如,序列gatcxxxxgatc在折叠以形成双螺旋时包含gatc的初始序列和其互补物(3'ctag5')。在一些实施方案中,itr在初始序列和反向互补物之间包含连续的回文序列(例如,gatcgatc)。在一些实施方案中,itr在初始序列和反向互补之间包含间断的回文序列(例如,gatcxxxxgatc)。在一些实施方案中,连续或间断的回文序列的互补部分彼此相互作用以形成“发夹环”结构。如本文所用的,当在单链核苷酸分子碱基对上的至少两个互补序列形成双链部分时,“发夹环”结构产生。在一些实施方案中,仅部分itr形成发夹环。在其它实施方案中,整个itr形成发夹环。在本公开中,至少一个itr是非腺病毒相关病毒(非aav)的itr。在某些实施方案中,itr是病毒科细小病毒科的非aav成员的itr。在一些实施方案中,itr是依赖病毒属或红病毒属的非aav成员的itr。在特定的实施方案中,itr是鹅细小病毒(gpv)、番鸭细小病毒(mdpv)或红病毒属细小病毒b19(也称作细小病毒b19,灵长类红细小病毒1、b19病毒,和红病毒属)的itr。在某些实施方案中,两个itr中的一个itr是aav的itr。在其它实施方案中,构建体中的两个itr中的一个itr是选自血清型1、2、3、4、5、6、7、8、9、10、11及其任何组合的aav血清型的itr。在一个特定的实施方案中,itr衍生自aav血清型2,例如,aav血清型2的itr。在本公开的某些方面中,核酸分子包含两个itr,5'itr和3'itr,其中5'itr位于核酸分子的5'端,且3'itr位于核酸分子的3'端。5'itr和3'itr可衍生自相同病毒或不同病毒。在某些实施方案中,5'itr衍生自aav且3'itr不衍生自aav病毒(例如,非aav)。在一些实施方案中,3'itr衍生自aav且5'itr不衍生自aav病毒(例如,非aav)。在其它实施方案中,5'itr不衍生自aav病毒(例如,非aav),且3'itr衍生自相同或不同的非aav病毒。如本文所用的术语“细小病毒”涵盖细小病毒科,包括但不限于自主复制的细小病毒属和依赖病毒属。自主性细小病毒包括,例如,博卡病毒属(bocavirus)、依赖病毒属(dependovirus)、红病毒属(erythrovirus)、貂阿留申病毒属(amdovirus)、细小病毒属(parvovirus)、浓核病毒属(densovirus)、重复病毒属(iteravirus)、康特拉病毒属(contravirus)、aveparvovirus、copiparvovirus、原细小病毒属(protoparvovirus)、四细小病毒属(tetraparvovirus)、双义浓核病毒属(ambidensovirus)、短小浓核病毒属(brevidensovirus)、肝胰浓核病毒属(hepandensovirus)、对虾浓核病毒属(penstyldensovirus)的成员。示例性自主性细小病毒包括,但不限于,猪细小病毒、小鼠细小病毒、犬细小病毒、貂肠病毒、牛细小病毒、鸡细小病毒、猫泛白细胞减少症病毒(felinepanleukopeniavirus)、猫细小病毒、鹅细小病毒、h1细小病毒、番鸭细小病毒、蛇细小病毒和b19病毒。其它自主性细小病毒是本领域技术人员已知的。参见,例如,virology,第2卷,第69章(第4版,lippincott-raven出版社)。如本文所用的术语“非aav”涵盖来自除细小病毒科的任何腺相关病毒(aav)外的细小病毒科的核酸、蛋白质和病毒。“非aav”包括但不限于博卡病毒属、依赖病毒属、红病毒属、貂阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、aveparvovirus、copiparvovirus、原细小病毒属、四细小病毒属、双义浓核病毒属、短小浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属的自主复制成员。如本文所用的,术语“腺相关病毒”(aav),包括但不限于,aav1型、aav2型、aav3型(包括3a和3b型)、aav4型、aav5型、aav6型、aav7型、aav8型、aav9型、aav10型、aav11型、aav12型、aav13型、蛇aav、鸟aav、牛aav、犬aav、马aav、绵羊aav、山羊aav、虾aav(这些aav血清型和分化枝由gao等(j.virol.78:6381(2004))和moris等(virol.33:375(2004))公开)以及现在已知或后来发现的任何其它aav。参见,例如,fields等virology,第2卷,第69章(第4版,lippincott-raven出版社)。如本文所用的,术语“衍生自”是指从指定的分子或生物体分离或使用指定的分子或生物体,或来自指定的分子或生物体的信息(例如氨基酸或核酸序列)制得的组分。例如,衍生自第二核酸序列(例如,itr)的核酸序列(例如,itr)可包括与第二核酸序列的核苷酸序列同一或基本相似的核苷酸序列。在核苷酸或多肽的情况下,可通过例如天然存在的诱变、人工定向诱变或人工随机诱变获得衍生物种。用于衍生核苷酸或多肽的诱变可以是有意定向的或有意随机的,或者是每种情况的混合。诱变核苷酸或多肽以产生源自第一核苷酸或多肽的不同核苷酸或多肽可以是随机事件(例如,由聚合酶无保真性引起的),且衍生的核苷酸或多肽的鉴定可以通过适当的筛选方法进行,例如,如本文所述的方法。多肽的诱变通常需要操纵编码该多肽的多核苷酸。在一些实施方案中,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其它实施方案中,衍生自非aav(或aav)的itr分别与非aavitr(或aavitr)至少90%同一,其中非aav(或aav)itr分别保留非aavitr(或aavitr)的功能特性。在一些实施方案中,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)至少80%同一,其中非aav(或aav)itr分别保留非aavitr(或aavitr)的功能特性。在一些实施方案中,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)至少70%同一,其中非aav(或aav)itr分别保留非aavitr(或aavitr)的功能特性。在一些实施方案中,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)至少60%同一,其中非aav(或aav)itr分别保留非aavitr(或aavitr)的功能特性。在一些实施方案中,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)至少50%同一,其中非aav(或aav)itr分别保留非aavitr(或aavitr)的功能特性。在某些实施方案中,衍生自非aav(或aav)itr的itr包含非aav(或aav)的itr的片段或由其组成。在一些实施方案中,衍生自非aav(或aav)itr的itr包含非aav(或aav)的itr的片段或由其组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中衍生自非aav(或aav)itr的itr分别保留非aavitr(或aavitr)的功能特性。在某些实施方案中,衍生自非aav(或aav)itr的itr包含非aav(或aav)的itr的片段或由其组成,其中所述片段包含至少约129个核苷酸,且其中衍生自非aav(或aav)itr的itr分别保留非aavitr(或aavitr)的功能特性。在某些实施方案中,衍生自非aav(或aav)itr的itr包含非aav(或aav)的itr的片段或由其组成,其中所述片段包含至少约102个核苷酸,且其中衍生自非aav(或aav)itr的itr分别保留非aavitr(或aavitr)的功能特性。在一些实施方案中,衍生自非aav(或aav)itr的itr包含非aav(或aav)的itr的片段或由其组成,其中所述片段包含非aav(或aav)的itr的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在某些实施方案中,在正确对齐时,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其它实施方案中,在正确对齐时,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)的同源部分至少90%同一,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施方案中,在正确对齐时,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)的同源部分至少80%同一,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施方案中,在正确对齐时,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)的同源部分至少70%同一,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施方案中,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)的同源部分至少60%同一,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施方案中,衍生自非aav(或aav)itr的itr分别与非aavitr(或aavitr)的同源部分至少50%同一,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。“无衣壳(capsid-free)”或“没有衣壳(capsid-less)”的载体或核酸分子是指无衣壳的载体构建体。在一些实施方案中,没有衣壳的载体或核酸分子部含有编码例如aavrep蛋白质的序列。如本文所用的,“编码区”或“编码序列”是由翻译成氨基酸的密码子组成的多核苷酸的一部分。尽管“终止密码子”(tag、tga或taa)通常不翻译成氨基酸,但可以将其视为编码区的一部分,但任何侧翼序列(例如,启动子、核糖体结合位点、转录终止子、内含子等)都不是编码区的一部分。编码区的边界通常由编码所得多肽的氨基端的5’端的起始密码子和编码所得多肽的羧基端的3’端的翻译终止密码子确定。两个或多个编码区可存在于单个多核苷酸构建体中,例如,在单个载体上,或存在于分开的多核苷酸构建体中,例如,在分开的(不同的)载体上。因此,单个载体可仅包含单个编码区,或包含两个或多个编码区。由哺乳动物细胞分泌的某些蛋白质与分泌性信号肽相关,一旦开始通过粗糙的内质网输出生长的蛋白质链,该分泌性信号肽即从成熟蛋白质上切割下来。本领域普通技术人员知道,信号肽通常与多肽的n端融合,并从完整的或“全长”的多肽上切割下来,以产生分泌的或“成熟”形式的多肽。在某些实施方案中,天然信号肽或保留指导多肽分泌的能力的序列的功能性衍生物可操作地与其缔合。可替换地,可使用异源哺乳动物信号肽(例如,人组织血纤维蛋白溶酶原激活物(tpa)或小鼠β-葡糖醛酸糖苷酶信号肽)或其功能性衍生物。术语“下游”是指位于参考核苷酸序列的3’的核苷酸序列。在某些实施方案中,下游核苷酸序列涉及转录起点之后的序列。例如,基因的翻译起始密码子位于转录的起始位点的下游。术语“上游”是指位于参考核苷酸序列的5’的核苷酸序列。在某些实施方案中,上游核苷酸序列涉及位于编码区或转录起点的5’侧的序列。例如,大多数启动子位于转录起始位点的上游。如本文所用的,术语“基因调控区”或“调控区”是指位于编码区上游(5'非编码序列),在编码区之内或编码区下游(3'非编码序列)且影响缔合的编码区的转录、rna加工、稳定性、翻译的核苷酸序列。调控区可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、rna加工位点、效应子结合位点或茎环结构。如果编码区意欲在真核细胞中表达,则多腺苷酸化信号和转录终止序列通常将位于编码序列的3’。编码产物(例如,mirna或基因产物(例如,多肽如治疗性蛋白质))的多核苷酸可包括启动子和/或与一个或多个编码区可操作地缔合的其它表达(例如,转录或翻译)控制元件。在可操作的缔合中,基因产物(例如多肽)的编码区与一个或多个调控区缔合,以使基因产物的表达处于调控区的影响或控制之下。例如,如果启动子功能的诱导导致编码由该编码区编码的基因产物的mrna的转录,并且如果启动子与编码区之间的连接的性质不干扰启动子指导基因产物的表达或干扰待dna模板转录的能力,则编码区和启动子是“可操作缔合的”。除启动子外,其它表达控制元件,例如增强子、操纵子、阻遏子和转录终止信号,也可与编码区可操纵地缔合以指导基因产物表达。“转录控制序列”是指提供编码序列在宿主细胞中表达的dna调控序列,如启动子、增强子、终止子等。多种转录控制区是本领域技术人员已知的。这些转录控制区包括,不限于,在脊椎动物细胞中起作用的转录控制区,如,但不限于,来自巨细胞病毒(立即早期启动子,与内含子a结合)、猿猴病毒40(早期启动子)和逆转录病毒(如劳斯肉瘤病毒)的启动子和增强子区段。其它转录控制区包括源自脊椎动物基因(如肌动蛋白、热休克蛋白、牛生长激素和兔β-珠蛋白)以及能够控制真核细胞中基因表达的其他序列的转录控制区。另外合适的转录控制区包括组织特异性启动子和增强子以及淋巴因子可诱导的启动子(例如,可由干扰素或白介素诱导的启动子)。类似地,多种翻译控制元件是本领域普通技术人员已知的。这些翻译控制元件包括,但不限于核糖体结合位点、翻译起始和终止密码子以及衍生自细小核糖核酸病毒的元件(特别是内部核糖体进入位点或ires,也称为cite序列)。如本文所用的术语“表达”是指多核苷酸产生基因产物(例如rna或多肽)的过程。它包括但不限于将多核苷酸转录成信使rna(mrna)、转运rna(trna)、小发夹rna(shrna)。小干扰rna(sirna)或任何其它rna产物,以及将mrna翻译成多肽。表达产生“基因产物”。如本文所用的,基因产物可以是核酸,例如通过基因的转录产生的信使rna,或可以是从转录物翻译而来的多肽。本文所述的基因产物还包括具有转录后修饰(例如,聚腺苷酸化或剪接)的核酸,或具有翻译后修饰(例如,甲基化、糖基化、添加脂质、与其他蛋白质亚基缔合或蛋白水解切割)的多肽。如本文所用,术语“产量”是指通过基因的表达产生的多肽的量。“载体”是指用于将核酸克隆和/或转移到宿主细胞中的任何载体。载体可以是复制子,其中另一个核酸区段可以与该复制子附着,从而引起附着片段的复制。“复制子”是指其在体内作为自主复制单位起作用,即能够在其自身的控制下复制的任何基因元件(例如质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括用于将核酸体外、离体或体内引入细胞中的媒介物。大量载体是本领域已知并使用的,其包括,例如质粒、经修饰的真核病毒或经修饰的细菌病毒。通过将合适的多核苷酸片段连接到具有互补的粘性末端的选择的载体中,可实现将多核苷酸插入到合适的载体中。载体可经工程化以编码选择标记或报道分子,以提供选择或鉴定已并入载体的细胞。选择标记或报道分子的表达允许鉴定和/或选择并入并表达载体上含有的其它编码区的宿主细胞。本领域中已知且使用的选择标记基因的实例包括:提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花青素调节基因、异戊基转移酶基因等。本领域中已知且使用的报道分子的实例包括:萤光素酶(luc)、绿色荧光蛋白(gfp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶(lacz)、β-葡糖醛酸糖苷酶(gus)等。选择标记也可被认为是报道分子。本文所用的术语“宿主细胞”是指例如微生物、酵母细胞、昆虫细胞和哺乳动物细胞,它们可以或已经用作ssdna或载体的接受者。该术语包括已被转导的原始细胞的后代。因此,本文所用的“宿主细胞”通常是指已用外源dna序列转导的细胞。应当理解,由于自然的、偶然的或故意的突变,单个亲本细胞的后代在形态或基因组或总dna互补上不一定与原始亲本完全相同。在一些实施方案中,宿主细胞可以是体外宿主细胞。术语“选择标记”是指能够基于标记基因的作用(即,对抗生素的抗性,对除草剂的抗性、比色标记、酶、荧光标记等)而选择的鉴定因子,通常是抗生素或化学抗性基因,其中所述作用用于追踪感兴趣的核酸的遗传和/或用于鉴定已经遗传了感兴趣的核酸的细胞或生物体。本领域中已知并使用的选择标记基因的实例包括:提供对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙氨磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花青素调节基因、异戊基转移酶基因等。术语“报道基因”是指编码能够基于报道基因的作用进行鉴定的鉴定因子的核酸,其中所述作用用于追踪感兴趣的核酸的遗传,用于鉴定已经遗传了感兴趣的核酸的细胞或生物体,和/或用于测量基因表达诱导或转录。本领域中已知并使用的报告基因的实例包括:萤光素酶(luc)、绿色荧光蛋白(gfp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶(lacz)、β-葡糖醛酸糖苷酶(gus)等。选择标记基因也可被视为报告基因。“启动子”和“启动子序列”可互换使用,且是指能够控制编码序列或功能性rna表达的dna序列。通常,编码序列位于启动子序列的3'。启动子可以整体地衍生自天然基因,或由衍生自自然界中发现的不同启动子的不同元件组成,或者甚至包含合成的dna区段。本领域技术人员应理解,不同的启动子可指导基因在不同的组织或细胞类型中,或在不同的发育阶段的表达,或响应于不同的环境或生理条件而表达。导致基因在大多数时间在大多数细胞类型中表达的启动子通常称为“组成型启动子”。导致基因在具体的细胞类型中表达的启动子通常称为“细胞特异性启动子”或“组织特异性启动子”。导致基因在发育或细胞分化的具体阶段表达的启动子通常被称为“发育特异性启动子”或“细胞分化特异性启动子”。在使细胞暴露于诱导启动子的药剂、生物分子、化学物质、配体、光等或用其处理细胞后,诱导并导致基因表达的启动子通常称为“诱导型启动子”或“可调控的启动子”。进一步认识到,由于在大多数情况下调控序列的确切边界尚未完全确定,因此不同长度的dna片段可具有相同的启动子活性。启动子序列通常在其3’端由转录起始位点界定,并向上游延伸(5’方向)以包括以高于背景的可检测的水平启始转录所需的最小碱基或元件。在启动子序列中将发现转录起始位点(例如,通过核酸酶s1作图方便地定义),以及负责结合rna聚合酶的蛋白质结合域(共有序列)。在一些实施方案中,核酸分子包含组织特异性启动子。在某些实施方案中,组织特异性启动子驱动治疗性蛋白质(例如,凝血因子)在肝脏中(例如,在肝细胞和/或内皮细胞中)的表达。在特定的实施方案中,启动子选自小鼠甲状腺素启动子(mttr)、内源性人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、tristetraprolin(ttp)启动子、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、磷酸甘油酸激酶(pgk)启动子及其任何组合。在一些实施方案中,启动子选自肝特异性启动子(例如,α1-抗胰蛋白酶(aat))、肌肉特异性启动子(例如,肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)和肌间线蛋白(des))、合成的启动子(例如,spc5-12、2r5sc5-12、dmck和tmck)及其任何组合。在一个特定的实施方案中,启动子包含ttp启动子。术语“限制性核酸内切酶”和“限制酶”可互换地使用且是指在双链dna内的特定核苷酸序列内结合和切割的酶。术语“质粒”是指通常携带不属于细胞中心代谢的基因的染色体外元件,并且通常呈环状双链dna分子的形式。此类元件可以是衍生自任何来源的单链或双链dna或rna的线性、环状或超螺旋的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已经连接或重组为独特的构建体,该构建体能够将所选基因产物的启动子片段和dna序列连同适当的3'非翻译序列引入细胞中。可使用的真核病毒载体包括,但不限于,腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒(例如,牛痘病毒)载体、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电脂质(cytofectin)、dna-蛋白质复合物和生物聚合物。“克隆载体”是指“复制子”,其是顺序复制的核酸的单位长度,并且其包含复制起点,如质粒、噬菌体或粘粒,可以在其上连接另一个核酸区段,以便实现附着的区段的复制。某些克隆载体能够在一个细胞类型中(例如,细菌)复制并在另一细胞类型中表达(例如,真核细胞)。克隆载体通常包含一个或多个可用于选择包含该载体的细胞的序列和/或一个或多个用于插入感兴趣的核酸序列的多个克隆位点。术语“表达载体”是指被设计成在插入宿主细胞后能够表达插入的核酸序列的媒介物。将插入的核酸序列与如上所述的调控区可操作地缔合。通过本领域众所周知的方法将载体引入宿主细胞,例如通过转染、电穿孔、显微注射、转导、细胞融合、deae葡聚糖、磷酸钙沉淀、脂质转染(溶酶体融合)、使用基因枪或dna载体转运体。如本文所用,“培养”、“待培养”和“正在培养”意指在允许细胞生长或分裂或维持细胞处于存活状态的体外条件下温育细胞。如本文所用,“培养的细胞”意指在体外繁殖的细胞。如本文所用的,术语“多肽”意欲涵盖单数“多肽”以及复数“多肽”,并且是指由通过酰胺键(也称作肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或多个氨基酸的任何一条或多条链,并不指产物的特定长度。因此,“多肽”的定义中包括肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指代两个或更多个氨基酸的一条链或多条链的任何其它术语。术语“多肽”可代替任何这些术语使用,或与任何这些术语可互换地使用。术语“多肽”还意欲指多肽的表达后修饰的产物,其包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/封闭基团衍生化、蛋白水解切割或被非天然存在的氨基酸修饰。多肽可衍生自天然生物来源或是重组技术产生的,但不一定从指定的核酸序列翻译而来。它可以任何方式生成,包括通过化学合成。术语“氨基酸”包括丙氨酸(ala或a);精氨酸(arg或r);天冬酰胺(asn或n);天冬氨酸(asp或d);半胱氨酸(cys或c);谷氨酰胺(gln或q);谷氨酸(glu或e);甘氨酸(gly或g);组氨酸(his或h);异亮氨酸(ile或i);亮氨酸(leu或l);赖氨酸(lys或k);甲硫氨酸(met或m);苯丙氨酸(phe或f);脯氨酸(pro或p);丝氨酸(ser或s);苏氨酸(thr或t);色氨酸(trp或w);酪氨酸(tyr或y);和缬氨酸(val或v)。非传统氨基酸也在本公开的范围内且包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其它氨基酸残基类似物,如ellman等meth.enzym.202:301-336(1991)中描述的那些。为了生成此类非天然存在的氨基酸残基,可使用以上noren等science244:182(1989)和ellman等的程序。简言之,这些程序涉及用非天然存在的氨基酸残基化学激活抑制子trna,然后在体外转录和翻译rna。非传统氨基酸的引入也可使用本领域已知的肽化学来实现。如本文所用的,术语“极性氨基酸”包括具有净零电荷但在其侧链的不同部分具有非零部分电荷的氨基酸(例如,m、f、w、s、y、n、q、c)。这些氨基酸可参与疏水性相互作用和静电相互作用。如本文所用的,术语“带电荷的氨基酸”包括在其侧链上可具有非零净电荷的氨基酸(例如,r、k、h、e、d)。这些氨基酸可参与疏水性相互作用和静电相互作用。本公开中还包括多肽的片段或变体,及其任何组合。当提及本公开的多肽结合域或结合分子时,术语“片段”或“变体”包括保留参考多肽的至少一些性质(例如,对fcrn结合域或fc变体的fcrn结合亲和力,fviii变体的凝血活性,或vwf片段的fviii结合活性)。除了本文别处讨论的特异性抗体片段以外,多肽的片段还包括蛋白水解片段以及缺失片段,但不包括天然存在的全长多肽(或成熟多肽)。本公开的多肽结合域或结合分子的变体包括如上所述的片段,以及由于氨基酸取代、缺失或插入而具有改变的氨基酸序列的多肽。变体可为天然的或非天然的。非天然存在的变体可使用本领域已知的诱变技术来产生。变体多肽可包含保守或非保守氨基酸取代、缺失或添加。“保守氨基酸取代”是其中氨基酸残基被具有相似侧链的氨基酸残基取代的氨基酸。具有相似侧链的氨基酸残基的家族已经在本领域中定义,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果多肽中的氨基酸被来自同一侧链家族的另一氨基酸取代,则该替代被认为是保守的。在另一实施方案中,氨基酸的字符串可以用侧链家族成员的顺序和/或组成不同的结构相似的字符串保守地替代。如本领域已知的,术语“百分比同一性”是两个或更多个多肽序列或两个或更多个多核苷酸序列之间的关系,如通过比较序列确定的。在本领域中,“同一性”还指多肽或多核苷酸序列之间序列关联性程度,视情况而定,如此类序列的字符串之间的匹配确定的。“同一性”可容易地通过已知方法计算,所述方法包括但不限于下列中所述的方法:computationalmolecularbiology(lesk,a.m.编)oxforduniversity出版社,纽约(1988);biocomputing:informaticsandgenomeprojects(smith,d.w.编)academic出版社,纽约(1993);computeranalysisofsequencedata,parti(griffin,a.m.和griffin,h.g.编)humana出版社,newjersey(1994);sequenceanalysisinmolecularbiology(vonheinje,g.编)academic出版社(1987);和sequenceanalysisprimer(gribskov,m.anddevereux,j.编)stockton出版社,newyork(1991)。确定同一性的优选的方法被设计为在测试的序列之间给出最佳匹配。确定同一性的方法已编入公众可用的计算机程序中。可使用序列分析软件进行序列比对和百分比同一性计算,所述分析软件如lasergene生物信息学计算套件的megalign程序(dnastar公司,madison,wi)、gcg程序套件(wisconsinpackage版本9.0,geneticscomputergroup(gcg),madison,wi)、blastp、blastn、blastx(altschul等,j.mol.biol.215:403(1990))和dnastar(dnastar公司,1228s.parkst.madison,wi53715usa)。在本申请的上下文中,将理解的是,在使用序列分析软件用于分析的情况下,除非另有说明,否则分析的结果将基于所引用程序的“默认值”。如本文中所使用的,“默认值”是指在首次初始化时最初随软件加载的任何一组值或参数。出于确定本公开的治疗性蛋白质(例如,凝血因子)序列和参考序列之间的百分比同一性的目的,仅对应于本公开的治疗性蛋白质(例如,凝血因子)中的核苷酸的参考序列中的核苷酸用于计算百分比同一性。例如,当含有b域的全长fviii核苷酸序列与本公开的优化的b域缺失的(bdd)fviii核苷酸序列比较时,包括a1、a2、a3、c1和c2域的部分比对将用于计算百分比同一性。编码b域的全长fviii序列的部分中的核苷酸(其将导致比对中的大“缺口”)将不计为错配。此外,在确定本公开的优化的bddfviii序列或其指定部分(例如,seqidno:3的核苷酸58-2277和2320-4374)与参考序列之间的百分比同一性时,将通过将匹配的核苷酸的数目除以优化的bdd-fviii序列的完整序列或其指定部分中的核苷酸总数计算百分比同一性,如本文所述。如本文所用的,通过比对本发明的序列以最大化与参考序列的同一性来鉴定与本发明的特定序列中的核苷酸相对应的核苷酸。用于鉴定参考序列中的等效氨基酸的数字基于用于鉴定本公开序列中的对应氨基酸的数字。“融合”或“嵌合”蛋白包含与第二氨基酸序列连接的第一氨基酸序列,其中该第二氨基酸序列本质上不是天然与之连接的。可以将通常存在于单独蛋白质中的氨基酸序列与融合多肽放在一起,或者将通常存在于同一蛋白质中的氨基酸序列置于融合多肽中的新排列中,例如本发明的因子viii域与igfc域的融合。融合蛋白例如通过化学合成或通过产生和翻译以期望的关系编码肽区的多核苷酸来产生。嵌合蛋白质可进一步包含通过共价、非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。如本文所用的,术语“插入位点”是指多肽或其片段、变体或衍生物中的位置,该位置紧邻可插入异源部分的位置的上游。将“插入位点”指定为数字,该数字是参考序列中氨基酸的数目。例如,fviii中的“插入位点”是指插入位点对应的成熟天然fviii(seqidno:15)中的氨基酸序列的数字,其紧邻插入位置的n端。例如,短语“a3在对应于seqidno:15的氨基酸1656的插入位点处包含异源部分”表示该异源部分位于对应于seqidno:15的氨基酸1656和氨基酸1657的两个氨基酸之间。本文所用的短语“紧邻氨基酸的下游”是指紧邻氨基酸的末端羧基的位置。类似地,短语“紧邻氨基酸的上游”是指紧邻氨基酸的末端氨基的位置。如本文所用的术语“插入的(inserted)”、“被插入(isinserted)”、“插入至……中”或语法相关术语是指相对于亲本多肽中类似位置,异源部分在多肽(例如凝血因子)中的位置。例如,在某些实施方案中,“插入的”等是指相对于天然成熟人fviii中类似位置,异源部分在重组fviii多肽中的位置。如本文所用的,该术语是指多肽的特征,并且不指示、暗示或推断制备该多肽的任何方法或过程。如本文所用的,术语“半衰期”是指特定多肽在体内的生物学半衰期。半衰期可以由从动物中的循环和/或其它组织清除至向受试者施用的一半量所需的时间表示。当将给定多肽的清除率曲线构建为时间的函数时,该曲线通常是两相的,其为快速的α相和较长的β相。α相通常代表所施用的fc多肽在血管内和血管外空间之间的平衡,并且部分地由多肽的大小决定。β相通常代表多肽在血管内空间中的代谢。在一些实施方案中,治疗性蛋白质(例如,凝血因子,例如,fviii)和包含该蛋白质的嵌合蛋白质是单相的,且因此不具有α相,而仅具有单一β相。因此,在某些实施方案中,如本文所用的术语半衰期是指多肽在β相中的半衰期。如本文所用的术语“连接”是指分别与第二氨基酸序列或核苷酸序列共价或非共价连接的第一氨基酸序列或核苷酸序列。第一氨基酸或核苷酸序列可直接连接或并列于第二氨基酸或核苷酸序列,或可替换地,间插序列可将第一序列与第二序列共价连接。术语“连接的”不仅意指在c端或n端将第一氨基酸序列与第二氨基酸序列融合,而且包括分别将全部第一氨基酸序列(或第二氨基酸序列)插入到第二氨基酸序列(或第一氨基酸序列)中的两个氨基酸中。在一个实施方案中,第一氨基酸序列可通过肽键或接头与第二氨基酸序列连接。第一核苷酸序列可通过磷酸二酯键或接头与第二核苷酸序列连接。接头可为肽或多肽(对于多肽链而言)或者核苷酸或核苷酸链(对于核苷酸链而言)或任何化学部分(对于多肽和多核苷酸链二者而言)。术语“连接”也用连字符(-)指示。止血,如本文所用的,意指停止或减慢流血(bleeding)或出血(hemorrhage);或阻止或减慢通过血管或身体部位的血流。止血病症,如本文所用的,意指基因遗传或获得性病况,其特征在于由于形成血纤蛋白凝块的能力受损或不能形成血纤蛋白凝块而自发或由于外伤导致出血的倾向。此类病症的实例包括血友病。三种主要形式是血友病a(因子viii缺乏症)、血友病b(因子ix缺乏症或“克雷司马斯疾病(christmasdisease)”)和血友病c(因子xi缺乏症,轻度出血倾向)。其它止血病症包括,例如,血管性血友病疾病、因子xi缺乏症(pta缺乏症)、因子xii缺乏症、纤维蛋白原、凝血酶原、因子v、因子vii、因子x或因子xiii的缺乏或结构异常、伯纳德-苏里耶综合征(bernard-souliersyndrome),其是gpib的缺陷或缺乏。gpib,vwf的受体,可能有缺陷,并导致缺乏原发性血凝块形成(原发止血)和增加的出血倾向),以及glanzman和naegeli的血小板机能不全(glanzmann血小板机能不全)。在肝功能衰竭(急性和慢性形式)中,肝脏产生的凝血因子不足;这会增加出血的风险。可预防性地使用分离的核酸分子、分离的多肽或包含本公开的分离的核酸分子的载体。如本文所用的术语“预防性治疗”是指在出血发作之前施用分子。在一个实施方案中,需要一般止血剂的受试者正在接受或即将接受手术。本公开的多核苷酸、多肽或载体可在手术之前或之后施用作为预防性药物。本公开的多核苷酸、多肽或载体可在手术期间或之后施用以控制急性出血发作。手术可包括,但不限于,肝移植、肝切除术、牙科手术或干细胞移植。本公开的分离的核酸分子、分离的多肽或载体也用于按需治疗。术语“按需治疗”是指响应于出血发作的症状或在可引起出血的活动之前施用分离的核酸分子、分离的多肽或载体。在一个方面中,当出血开始时,如在受伤之后,或者当预期出血时,如在手术之前,可对受试者给予按需治疗。在另一方面中,可在增加出血风险的活动(如接触运动)之前给予按需治疗。如本文所用的术语“急性出血”是指出血发作,无论其根本原因如何。例如,受试者可患有创伤、尿毒症、遗传性出血性病症(例如,vii因子缺乏症)、血小板病症或由于针对凝血因子产生抗体所致的抗性。治疗(treat、treatment、treating),如本文所用的,是指,例如,疾病或病况的严重性的降低;病程的持续时间的减少;与疾病或病况有关的一种或多种症状的改善;在不必治愈疾病或病况或预防与疾病或病况有关的一种或多种症状的情况下向患有疾病或病况的受试者提供有益的作用。在一个实施方案中,术语“治疗”意指通过施用本公开的分离的核酸分子、分离的多肽或载体来维持受试者中,例如,fviii低谷水平至少约1iu/dl、2iu/dl、3iu/dl、4iu/dl、5iu/dl、6iu/dl、7iu/dl、8iu/dl、9iu/dl、10iu/dl、11iu/dl、12iu/dl、13iu/dl、14iu/dl、15iu/dl、16iu/dl、17iu/dl、18iu/dl、19iu/dl、20iu/dl、25iu/dl、30iu/dl、35iu/dl、40iu/dl、45iu/dl、50iu/dl、55iu/dl、60iu/dl、65iu/dl、70iu/dl、75iu/dl、80iu/dl、85iu/dl、90iu/dl、95iu/dl、100iu/dl、105iu/dl、110iu/dl、115iu/dl、120iu/dl、125iu/dl、130iu/dl、135iu/dl、140iu/dl、145iu/dl或150iu/dl。在另一实施方案中,治疗意指将fviii低谷水平维持在约1-约150iu/dl、约1-约125iu/dl、约1-约100iu/dl、约1-约90iu/dl、约1-约85iu/dl、约1-约80iu/dl、约1-约75iu/dl、约1-约70iu/dl、约1-约65iu/dl、约1-约60iu/dl、约1-约55iu/dl、约1-约50iu/dl、约1-约45iu/dl、约1-约40iu/dl、约1-约35iu/dl、约1-约30iu/dl、约1-约25iu/dl、约25-约125iu/dl、约50-约100iu/dl、约50-约75iu/dl、约75-约100iu/dl、约1-约20iu/dl、约2-约20iu/dl、约3-约20iu/dl、约4-约20iu/dl、约5-约20iu/dl、约6-约20iu/dl、约7-约20iu/dl、约8-约20iu/dl、约9-约20iu/dl或约10-约20iu/dl。疾病或病况的治疗还可包括将受试者中的fviii活性维持在与非血友病受试者中的fviii活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%相当的水平。治疗所需的最低谷水平可通过一种或多种已知方法来测量,且可针对每个人进行调整(增加或减少)。如本文所用的,“施用”意指经由药学上可接受的途径向受试者给予药学上可接受的核酸分子、由其表达的多肽或包含本公开的核酸分子的载体。施用途径可为静脉内的,例如,静脉内注射和静脉内输注。额外的施用途径包括,例如,皮下、肌肉内、口服、鼻和肺部施用。核酸分子、多肽和载体可作为包含至少一种赋形剂的药物组合物的一部分施用。如本文所用的术语“药学上可接受的”是指生理上可耐受并且当向人施用时,通常不产生毒性或过敏性或类似的不良反应(如胃不适、头昏眼花等)的分子实体和组合物。任选地,如本文所用的,术语“药学上可接受的”是指由联邦或州政府的监管机构批准或在美国药典或其它普遍认可的用于动物,更尤其是人类的药典中列出的。如本文所用的,短语“有需要的受试者”包括将会受益于本公开的核酸分子、多肽或载体的施用的受试者,如哺乳动物受试者,例如,来改善止血。在一个实施方案中,受试者包括,但不限于,患有血友病的个体。在另一实施方案中,受试者包括,但不限于,已经产生了对治疗性蛋白质(例如,凝血因子,例如,fviii)的抑制因子且因此需要旁路疗法的个体。受试者可为成人或未成年人(例如,12岁以下)。如本文所用的,术语“治疗性蛋白质”是指向受试者施用的本领域中已知的任何多肽。在一些实施方案中,治疗性蛋白质包含选自凝血因子、生长因子、抗体、其功能性片段或其组合的蛋白质。如本文所用的,术语“凝血因子”是指天然存在或重组产生的分子或其类似物,其预防或减少受试者中出血发作的持续时间。换句话说,它意指具有促凝活性的分子,即负责将纤维蛋白原转化为不溶性纤维蛋白的网状物,从而导致血液凝固(coagulate)或凝结(clot)。如本文所用的“凝结因子”包括激活的凝结因子、其酶原或可激活的凝结因子。“可激活的凝血因子”是能够被转化为激活型的非激活形式(例如,其酶原形式)的凝血因子。术语“凝血因子”包括但不限于因子i(fi)、因子ii(fii)、因子v(fv)、fvii、fviii、fix、因子x(fx)、因子xi(fxi)、因子xii(fxii)、因子xiii(fxiii)、血管性血友病因子(vwf)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白z相关的蛋白酶抑制剂(zpi)、血纤维蛋白溶酶原、α2-抗纤维蛋白溶酶、组织血纤维蛋白溶酶原激活物(tpa)、尿激酶、血纤维蛋白溶酶原激活物抑制剂-1(pai-1)、血纤维蛋白溶酶原激活物抑制剂-2(pai2)、其酶原、其激活型或其任何组合。如本文所用的,凝血活性意指参与生化反应的级联的能力,该级联使血纤蛋白凝块的形成和/或降低出血或出血发作的严重性、持续时间或频率达到顶峰。如本文所用的“生长因子”包括本领域中已知的任何生长因子,其包括生长因子和激素。在一些实施方案中,生长因子选自肾上腺髓质素(am)、血管生成素(ang)、自分泌运动因子、骨形态生成蛋白(bmp)(例如bmp2、bmp4、bmp5、bmp7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(cntf)、白血病抑制因子(lif)、白介素-6(il-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-csf)、粒细胞集落刺激因子(g-csf)、粒细胞巨噬细胞集落刺激因子(gm-csf))、表皮生长因子(egf)、肝配蛋白(例如,肝配蛋白a1、肝配蛋白a2、肝配蛋白a3、肝配蛋白a4、肝配蛋白a5、肝配蛋白b1、肝配蛋白b2、肝配蛋白b3)、促红细胞生成素(epo)、成纤维细胞生长因子(fgf)(例如,fgf1、fgf2、fgf3、fgf4、fgf5、fgf6、fgf7、fgf8、fgf9、fgf10、fgf11、fgf12、fgf13、fgf14、fgf15、fgf16、fgf17、fgf18、fgf19、fgf20、fgf21、fgf22、fgf23)、胎牛促生长激素(foetalbovinesomatotrophin(fbs))、gdnf家族成员(例如,胶质细胞系衍生的神经营养因子(gdnf)、神经秩蛋白(neurturin)、persephin、artemin)、生长分化因子-9(gdf9)、肝细胞生长因子(hgf)、肝细胞瘤衍生的生长因子(hdgf)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(igf-1)或igf-2、白介素(il)(例如,il-1、il-2、il-3、il-4、il-5、il-6、il-7)、角化细胞生长因子(kgf)、迁移刺激因子(msf)、巨噬细胞-刺激蛋白(msp或肝细胞生长因子样蛋白质(hgflp))、肌生成抑制蛋白(gdf-8)、神经调节蛋白(例如,神经调节蛋白1(nrg1)、nrg2、nrg3、nrg4)、神经营养因子(例如,脑源性神经营养因子(bdnf)、神经生长因子(ngf)、神经营养因子-3(nt-3)、nt-4、胎盘生长因子(pgf)、血小板衍生的生长因子(pdgf)、肾酶(rnls)、t细胞生长因子(tcgf)、促血小板生成素(tpo)、转化生长因子(例如,转化生长因子α(tgf-α)、tgf-β、肿瘤坏死因子-α(tnf-α)和血管内皮生长因子(vegf)。在一些实施方案中,治疗性蛋白质由选自以下的基因编码:抗肌萎缩蛋白x-连锁、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环化水解酶、smn1、fxn(共济蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶),或其任何组合。如本文所用的术语“异源的”或“外源的”是指在给定的背景中,例如在细胞或多肽中通常未发现的一类分子。例如,可将外源或异源分子引入细胞中,并且仅在操作细胞(例如通过转染或其他形式的基因工程)后,才存在外源或异源分子,或者异源氨基酸序列可存在于非天然发现的蛋白质中。如本文所用的,术语“异源核苷酸序列”是指在给定的多核苷酸序列中不是天然存在的核苷酸序列。在一个实施方案中,异源核苷酸序列编码能够延长治疗性蛋白质(例如,凝血因子,例如,fviii)的半衰期的多肽。在另一实施方案中,异源核苷酸序列编码增加治疗性蛋白质(例如,凝血因子,例如,fviii)的流体动力学半径的多肽。在其它实施方案中,异源核苷酸序列编码改善治疗性蛋白质的一种或多种药代动力学特性,而不会显著影响其生物学活性或功能(例如,促凝血活性)的多肽。在一些实施方案中,治疗性蛋白质通过接头与由异源核苷酸序列编码的多肽连接(link)或连结(connect)。由异源核苷酸序列编码的多肽部分的非限制性实例包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白、美国专利申请号20100292130的pas多肽、hap序列、转铁蛋白或其片段、人绒毛膜促性腺激素的β亚基的c端肽(ctp)、白蛋白结合小分子、xten序列、fcrn结合部分(例如,结合fcrn的完整fc区或其部分)、单链fc区(scfc区,例如,如us2008/0260738、wo2008/012543或wo2008/1439545中所述的)、聚甘氨酸接头、聚丝氨酸接头、选自甘氨酸(g),丙氨酸(a),丝氨酸(s),苏氨酸(t),谷氨酸(e)和脯氨酸(p)的两种类型的氨基酸中的6-40个氨基酸的肽和短多肽(其二级结构的变化程度少于50%至大于50%)等等,或其两种或更多种组合。在一些实施方案中,由异源核苷酸序列编码的多肽与非多肽部分连接。非多肽部分的非限制性实例包括聚乙二醇(peg)、白蛋白结合小分子、多唾液酸、羟乙基淀粉(hes),其衍生物,或其任何组合。如本文所用的,术语“fc区”定义为对应于天然ig的fc区的多肽部分,即由其两条重链的各自fc域的二聚化缔合形成的部分。天然fc区与另一fc区形成同源二聚体。相反地,如本文所用的术语“基因融合的fc区”或“单链fc区”(scfc区)是指由在单个多肽链(即,在单个连续基因序列中编码的多肽链)内基因连接的fc域组成的合成的二聚fc区。在一个实施方案中,“fc区”是指是指单个ig重链的部分,其开始于紧邻木瓜蛋白酶切割位点(即,igg中的残基216,将重链恒定区的第一个残基设为114)的上游的铰链区,并终止于抗体的c端。因此,完整fc域至少包含铰链域、ch2域和ch3域。取决于ig同种型,ig恒定区的fc区可包括ch2、ch3和ch4结构域,以及铰链区。包含ig的fc区的嵌合蛋白赋予嵌合蛋白几种期望的特性,其包括增加的稳定性、延长的血清半衰期(参见capon等,1989,nature337:525)以及与fc受体(例如新生fc受体(fcrn))的结合(美国专利号6,086,875、6,485,726、6,030,613;wo03/077834;us2003-0235536a1),其通过提述以其整体并入本文。当在本文中用作与本公开的的核苷酸序列的比较时,“参考核苷酸序列”是与本公开的核苷酸序列基本相同的多核苷酸序列,除了该序列未被优化外。例如,由seqidno:1的密码子优化的bddfviii和编码单链fc区的与seqidno:1在其3'端连接的异源核苷酸序列组成的核酸分子的参考核苷酸序列是由seqidno:16的原始(或“亲本”)bddfviii和编码单链fc区的与seqidno:16在其3'端连接的相同异源核苷酸序列组成的核酸分子。如本文所用的,关于核苷酸序列,术语“优化的”是指编码多肽的多核苷酸序列,其中多核苷酸序列已经经突变以增强多核苷酸序列的性质。在一些实施方案中,进行优化以增加转录水平、增加翻译水平、增加稳态mrna水平、增加或减少调节蛋白(如一般转录因子)的结合、增加或减少剪接,或增加由多核苷酸序列产生的多肽的产量。可以对多核苷酸序列进行优化以使其改变的实例包括密码子优化、g/c含量优化、去除重复序列、去除富含at的元件、去除隐蔽的剪接位点、去除抑制转录或翻译的顺式作用元件、添加或去除聚t或聚a序列,在转录起始位点周围添加增强转录的序列(如kozak共有序列)、去除可形成茎环结构的序列、去除去稳定序列,及其两种或更多种组合。ii.核酸分子本公开涉及编码治疗蛋白的质粒样、无衣壳的核酸分子或可调节靶蛋白表达的基因。衣壳(病毒的蛋白质壳)包围着病毒的遗传物质。已知衣壳通过保护病毒基因组,将基因组递送至宿主并与宿主相互作用来辅助病毒体的功能。尽管如此,病毒衣壳可能是限制载体的包装能力和/或诱导免疫应答的因素,尤其是当其用于基因疗法时。aav载体已经成为基因疗法载体的较常见类型之一。然而,衣壳的存在限制了aav载体在基因疗法中的实用性。特别地,衣壳本身可以将包含在载体中的转基因的大小限制为低至小于4.5kb。甚至在添加调节元件之前,可用于基因疗法的各种治疗性蛋白质可容易超过此大小。此外,构成衣壳的蛋白质可作为可被受试者的免疫系统靶向的抗原。aav在普通人群中非常普遍,大多数人在其生命中已暴露于aav。因此,大多数潜在的基因疗法接受者可能已经对aav产生了免疫应答,因此更有可能拒绝该疗法。本公开的某些方面意欲克服aav载体的这些缺陷。特别地,本公开的某些方面涉及一种核酸分子,其包含第一itr、第二itr和基因盒,例如,其编码治疗性蛋白质和/或mirna。在一些实施方案中,核酸分子不包含编码衣壳蛋白、复制蛋白和/或组装蛋白的基因。在一些实施方案中,基因盒编码治疗性蛋白质。在一些实施方案中,治疗性蛋白质包含凝血因子。在一些实施方案中,基因盒编码mirna。在某些实施方案中,基因盒位于第一itr和第二itr之间。在一些实施方案中,核酸分子还包含一个或多个非编码区。在某些实施方案中,一个或多个非编码区包含启动子序列、内含子、转录后调控元件、3'utr聚(a)序列,或其任何组合。在一个实施方案中,基因盒是单链的核酸。在另一实施方案中,基因盒是双链的核酸。在一个实施方案中,核酸分子包含:(a)第一itr,其是细小病毒科的非aav家族成员的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码mirna或治疗性蛋白质(例如,凝血因子)的核苷酸;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;(g)第二itr,其是细小病毒科的非aav家族成员的itr。在一个实施方案中,核酸分子包含:(a)第一itr,其是细小病毒科的非aav家族成员的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码mirna的核苷酸,其中mirna下调选自sod1、htt、rho及其任何组合的靶基因的表达;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;(g)第二itr,其是细小病毒科的非aav家族成员的itr。在一个实施方案中,核酸分子包含:(a)第一itr,其是细小病毒科的非aav家族成员的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)核苷酸编码肌萎缩蛋白x连锁、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环化水解酶、smn1、fxn(共济蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶),或其任何组合;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;(g)第二itr,其是细小病毒科的非aav家族成员的itr。在一个实施方案中,核酸分子包含:(a)第一itr,其是aav(例如,aav血清型2基因组)的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码fviii的核苷酸;其中核苷酸与选自seqidno:1-14或seqidno:71的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性,其中由核苷酸编码的fviii保留fviii活性;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;和(g)第二itr,其是aav(例如,aav血清型2基因组)的itr。在一个实施方案中,核酸分子包含:(a)第一itr,其是aav(例如,aav血清型2基因组)的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码mirna的核苷酸,其中mirna下调靶基因(例如,sod1、htt、rho及其任何组合)的表达;(f)3'utr聚(a)尾序列,例如,bghpa;和(g)第二itr,其是aav(例如,aav血清型2基因组)的itr。在一个实施方案中,核酸分子包含:(a)第一itr,其是aav(例如,aav血清型2基因组)的itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码肌萎缩蛋白x连锁型、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环化水解酶、smn1、fxn(共济蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)或其任何组合的核苷酸;(f)3'utr聚(a)尾序列,例如,bghpa;和(g)第二itr,其是aav(例如,aav血清型2基因组)的itr。在另一实施方案中,核酸分子包含:(a)第一itr;(b)组织特异性启动子序列,例如,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码mirna或治疗性蛋白质(例如,凝血因子)的核苷酸;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;和(g)第二itr,其中第一itr或第二itr中的一个是细小病毒科的非aav家族成员的itr,且其它itr是aav(例如,aav血清型2基因组)的itr。在另一实施方案中,核酸分子包含:(a)第一itr;(b)组织特异性启动子序列,ttp启动子;(c)内含子,例如,合成的内含子;(d)编码mirna或治疗性蛋白质(例如,凝血因子)的核苷酸;(e)转录后调控元件,例如,wpre;(f)3'utr聚(a)尾序列,例如,bghpa;和(g)第二itr,其中第一itr是合成的itr,第二itr是合成的itr,或者第一itr和第二itr二者均是合成的itr。a.反向末端重复本公开的某些方面涉及一种核酸分子,其包含第一itr,例如,5'itr,和第二itr,例如,3'itr。通常,itr参与细小病毒(例如,aav)dna复制以及从原核质粒中拯救或切除(samulski等,1983,1987;senapathy等,1984;gottlieb和muzyczka,1988)。此外,itr似乎是aav前病毒整合以及将aavdna包装到病毒粒子中所需的最小序列(mclaughlin等,1988;samulski等,1989)。这些元件对于细小病毒基因组的有效扩增是必不可少的。假设itr功能不可缺少的最小定义元件是rep结合位点(例如,rbs;aav2的gcgcgctcgctcgctc(seqidno:104))和末端解离位点(例如,trs;aav2的agttgg(seqidno:105)),加上允许形成发夹的可变的回文序列。回文核苷酸区域通常以顺式一起发挥作为dna复制的起点和病毒的包装信号的作用。在dna复制过程中,itr中的互补序列折叠成发夹结构。在其它实施方案中,itr折叠成非t形发夹结构,例如,折叠成u形发夹结构。数据表明aavitr的t形发夹结构可抑制itr侧翼的转基因的表达。参见,例如,zhou等,scientificreports7:5432(2017年7月4日)。通过利用不形成t形发夹结构的itr,可以避免此抑制形式。因此,在某些方面,与包含形成t形发夹的aavitr的多核苷酸相比,包含非aavitr的多核苷酸具有改善的转基因表达。在一些实施方案中,itr包含天然存在的itr,例如itr包含细小病毒itr的全部部分。在一些实施方案中,itr包含合成的序列。在一个实施方案中,第一itr或第二itr包含合成的序列。在另一实施方案中,第一itr和第二itr中的每个包含合成的序列。在一些实施方案中,第一itr或第二itr包含天然存在的序列。在另一实施方案中,第一itr和第二itr中的每个包含天然存在的序列。在一些实施方案中,itr包含天然存在的itr的一部分(例如,截短的itr)或由其组成。在一些实施方案中,itr包含天然存在的itr的片段或由其组成,其中该片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中itr保留天然存在的itr的功能特性the。在某些实施方案中,itr包含天然存在的itr的片段或由其组成,其中该片段包含至少约129个核苷酸;其中itr保留天然存在的itr的功能特性。在某些实施方案中,itr包含天然存在的itr的片段或由其组成,其中该片段包含至少约102个核苷酸;其中该itr保留天然存在的itr的功能特性。在一些实施方案中,itr包含天然存在的itr的一部分或由其组成,其中该片段包含天然存在的itr的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%;其中该片段保留天然存在的itr的功能特性。在某些实施方案中,当正确对齐时,itr包含与天然存在的itr的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%,至少61%,至少62%,至少63%,至少64%,至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列或由其组成;其中itr保留天然存在的itr的功能特性。在其它实施方案中,当正确对齐时,itr包含与天然存在的itr的同源部分具有至少90%序列同一性的序列或由其组成;其中itr保留天然存在的itr的功能特性。在一些实施方案中,当正确对齐时,itr包含与天然存在的itr具有至少80%序列同一性的序列或由其组成;其中itr保留天然存在的itr的功能特性。在一些实施方案中,当正确对齐时,itr包含与天然存在的itr的同源部分具有至少70%序列同一性的序列或由其组成;其中itr保留天然存在的itr的功能特性。在一些实施方案中,当正确对齐时,itr包含与天然存在的itr的同源部分具有至少60%序列同一性的序列或由其组成;其中itr保留天然存在的itr的功能特性。在一些实施方案中,当正确对齐时,itr包含与天然存在的itr的同源部分具有至少50%序列同一性的序列或由其组成;其中itr保留天然存在的itr的功能特性。在一些实施方案中,itr包含来自aav基因组的itr。在一些实施方案中,itr是选自aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10、aav11及其任何组合的aav基因组的itr。在特定的实施方案中,itr是aav2基因组的itr。在另一实施方案中,itr是经遗传工程化以在在5′和3′端包括衍生自一种或多种aav基因组的itr的合成的序列。在一些实施方案中,itr不衍生自aav基因组。在一些实施方案中,itr是非aav的itr。在一些实施方案中,itr是来自病毒科细小病毒科的非aav基因组的itr,所述病毒科细小病毒科选自,但不限于,博卡病毒属(bocavirus)、依赖病毒属(dependovirus)、红病毒属(erythrovirus)、貂阿留申病毒属(amdovirus)、细小病毒属(parvovirus)、浓核病毒属(densovirus)、重复病毒属(iteravirus)、康特拉病毒属(contravirus)、aveparvovirus、copiparvovirus、原细小病毒属(protoparvovirus)、四细小病毒属(tetraparvovirus)、双义浓核病毒属(ambidensovirus)、短小浓核病毒属(brevidensovirus)、肝胰浓核病毒属(hepandensovirus)、对虾浓核病毒属(penstyldensovirus)及其任何组合。在某些实施方案中,itr衍生自红病毒属细小病毒b19(人类病毒)。在另一实施方案中,itr衍生自番鸭细小病毒(mdpv)株。在某些实施方案中,mdpv株是减毒的,例如,mdpv株fz91-30。在其它实施方案中,mdpv株是致病性的,例如,mdpv株yy。在一些实施方案中,itr衍生自猪细小病毒,例如,猪细小病毒u44978。在一些实施方案中,itr衍生自小鼠微小病毒,例如,小鼠微小病毒u34256。在一些实施方案中,itr衍生自犬细小病毒,例如,犬细小病毒m19296。在一些实施方案中,itr衍生自貂肠炎病毒,例如,貂肠炎病毒d00765。在一些实施方案中,itr衍生自依赖细小病毒。在一个实施方案中,依赖细小病毒是依赖病毒属鹅细小病毒(gpv)株。在具体的实施方案中,gpv株是减毒的,例如,gpv株82-0321v。在另一具体的实施方案中,gpv株是致病性的,例如,gpv株b。核酸分子的第一itr和第二itr可衍生自相同基因组(例如,衍生自相同病毒的基因组),或衍生自不同基因组,例如,衍生自两种或更多种不同病毒基因组的基因组。在某些实施方案中,第一itr和第二itr衍生自相同aav基因组。在具体的实施方案中,本发明的核酸分子中存在两个itr是相同的,且可特别是aav2itr。在其它实施方案中,第一itr衍生自aav基因组且第二itr不衍生自aav基因组(例如,非aav基因组)。在其它实施方案中,第一itr不衍生自aav基因组(例如,非aav基因组)且第二itr衍生自aav基因组。在又一其它实施方案中,第一itr和第二itr二者不衍生自aav基因组(例如,非aav基因组)。在一个特定的实施方案中,第一itr和第二itr是相同的。在一些实施方案中,第一itr衍生自aav基因组,且第二itr衍生自选自博卡病毒属、依赖病毒属、红病毒属、貂阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、aveparvovirus、copiparvovirus、原细小病毒属、四细小病毒属、双义浓核病毒属、短小浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合的基因组。在其它实施方案中,第二itr衍生自aav基因组,且第一itr衍生自选自博卡病毒属、依赖病毒属、红病毒属、貂阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、aveparvovirus、copiparvovirus、原细小病毒属、四细小病毒属、双义浓核病毒属、短小浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合的的基因组。在其它实施方案中,第一itr和第二itr衍生自选自博卡病毒属、依赖病毒属、红病毒属、貂阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、aveparvovirus、copiparvovirus、原细小病毒属、四细小病毒属、双义浓核病毒属、短小浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合的基因组,其中第一itr和第二itr衍生自相同基因组。在其它实施方案中,第一itr和第二itr衍生自选自博卡病毒属、依赖病毒属、红病毒属、貂阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、aveparvovirus、copiparvovirus、原细小病毒属、四细小病毒属、双义浓核病毒属、短小浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合的基因组,其中第一itr和第二itr衍生自不同基因组。在一些实施方案中,第一itr衍生自aav基因组,且第二itr衍生自红病毒属细小病毒b19(人类病毒)。在其它实施方案中,第二itr衍生自aav基因组,且第一itr衍生自红病毒属细小病毒b19(人类病毒)。在某些实施方案中,第一itr和/或t第二itr包含衍生自b19的itr的全部或一部分或由其组成。在一些实施方案中,第一itr和/或第二itr包含与选自seqidno:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核苷酸序列或由其组成,其中第一itr和/或第二itr保留其衍生自的b19itr的功能性质。在一些实施方案中,第一itr和/或第二itr包含与选自seqidno:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核苷酸序列或由其组成,其中第一itr和/或第二itr能够形成发夹结构。在某些实施方案中,发夹结构不包含t形发夹。在一些实施方案中,第一itr和/或第二itr包含选自seqidno:167、168、169、170和171的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:167中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:168中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:169中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:170中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:171中所示的核苷酸序列或由其组成。表1.样品细小病毒itr序列。在某些实施方案中,第一itr和/或第二itr包含核苷酸序列,其中核苷酸序列包含seqidno:169中所示的最小核苷酸序列,且其中核苷酸序列与seqidno:167中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%,或100%同一,保留b19itr的功能特性,该核苷酸序列衍生自b19itr。在一些实施方案中,第一itr和/或第二itr包含核苷酸序列,其中核苷酸序列包含seqidno:169中所示的最小核苷酸序列,且其中核苷酸序列与seqidno:167中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一,其中第一itr和/或第二itr能够形成发夹结构。在某些实施方案中,发夹结构不包含t形发夹。在一些实施方案中,第一itr衍生自aav基因组,且第二itr衍生自gpv。在其它实施方案中,第二itr衍生自aav基因组,且第一itr衍生自gpv。在某些实施方案中,第一itr和/或第二itr包含衍生自gpv的itr的全部或部分,或由其组成。在一些实施方案中,第一itr和/或第二itr包含与选自seqidno:172、173、174、175和176中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核苷酸序列或由其组成,其中第一itr和/或第二itr保留gpvitr的功能特性,该第一itr和/或第二itr衍生自gpvitr。在一些实施方案中,第一itr和/或第二itr包含衍生自gpv的itr的全部或部分,或由其组成。在一些实施方案中,第一itr和/或第二itr包含与选自seqidno:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核苷酸序列或由其组成,其中第一itr和/或第二itr能够形成发夹结构。在某些实施方案中,发夹结构不包含t形发夹。在一些实施方案中,第一itr和/或第二itr包含选自seqidno:172、173、174、175和176的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:172中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:173中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:174中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:175中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:176中所示的核苷酸序列或由其组成。在某些实施方案中,第一itr和/或第二itr包含核苷酸序列,其中核苷酸序列包含seqidno:174中所示的最小核苷酸序列,且其中核苷酸序列与seqidno:172中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一,其中第一itr和/或第二itr保留gpvitr的功能特性,该第一itr和/或第二itr衍生自gpvitr。在一些实施方案中,第一itr和/或第二itr包含核苷酸序列,其中核苷酸序列包含seqidno:174中所示的最小核苷酸序列,且其中核苷酸序列与seqidno:172中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一,其中第一itr和/或第二itr能够形成发夹结构。在某些实施方案中,发夹结构不包含t形发夹。在某些实施方案中,第一itr和/或第二itr包含核苷酸序列,其中核苷酸序列包含seqidno:176中所示的最小核苷酸序列,且其中核苷酸序列与seqidno:172中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一,其中第一itr和/或第二itr保留gpvitr的功能特性,该第一itr和/或第二it衍生自gpvitr。在一些实施方案中,第一itr和/或第二itr包含核苷酸序列,其中核苷酸序列包含seqidno:176中所示的最小核苷酸序列,且其中核苷酸序列与seqidno:172中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一,其中第一itr和/或第二itr能够形成发夹结构。在某些实施方案中,发夹结构不包含t形发夹。在某些实施方案中,第一itr或第二itr中的一个包含衍生自aav2的itr的全部或部分,或由其组成。在一些实施方案中,第一itr或第二itr包含与seqidno:177或178中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核苷酸序列或由其组成,其中第一itr和/或第二itr保留aav2itr的功能特性,该第一itr和/或第二itr衍生自aav2itr。在一些实施方案中,第一itr或第二itr包含与seqidno:177或178中所示的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的核苷酸序列或由其组成,其中第一itr和/或第二itr能够形成发夹结构。在某些实施方案中,发夹结构不包含t形发夹。在一些实施方案中,第一itr和/或第二itr包含seqidno:177或178中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:177中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr和/或第二itr包含seqidno:178中所示的核苷酸序列或由其组成。在一些实施方案中,第一itr衍生自aav基因组,且第二itr衍生自番鸭细小病毒(mdpv)株。在其它实施方案中,第二itr衍生自aav基因组,且第一itr衍生自番鸭细小病毒(mdpv)株。在某些实施方案中,mdpv株是减毒的,例如,mdpv株fz91-30。在其它实施方案中,mdpv株是致病性的,例如,mdpv株yy。在一些实施方案中,第一itr衍生自aav基因组,且第二itr衍生自依赖细小病毒属。在一些实施方案中,第二itr衍生自aav基因组,且第一itr衍生自依赖细小病毒属。在其它实施方案中,第一itr衍生自aav基因组,且第二itr衍生自依赖病毒属(dependovirus)鹅细小病毒(gpv)株。在其它实施方案中,第二itr衍生自aav基因组,且第一itr衍生自依赖病毒属gpv株。在某些实施方案中,gpv株是减毒的,例如,gpv株82-0321v。在其它实施方案中,gpv株是致病性的,例如,gpv株b。在某些实施方案中,第一itr衍生自aav基因组,且第二itr衍生自选自猪细小病毒,例如,猪细小病毒株u44978;小鼠微小病毒,例如,小鼠微小病毒株u34256;犬细小病毒,例如,犬细小病毒株m19296;貂肠炎病毒,例如,貂肠炎病毒株d00765;及其任何组合的基因组。在其它实施方案中,第二itr衍生自aav基因组,且第一itr衍生自选自猪细小病毒,例如,猪细小病毒株u44978;小鼠微小病毒,例如,小鼠微小病毒株u34256;犬细小病毒,例如,犬细小病毒株m19296;貂肠炎病毒,例如,貂肠炎病毒株d00765;及其任何组合的基因组。在另一特定的实施方案中,itr是经遗传工程化以在其5′和3′端包括非衍生自aav基因组的itr的合成的序列。在另一特定的实施方案中,itr是经遗传工程化以在其5′和3′端包括衍生自一个或多个非aav基因组的itr的合成的序列。在本发明的核酸分子中存在的两个itr可以是相同的或不同的非aav基因组。特别地,itr可衍生自相同非aav基因组。在具体的实施方案中,在本发明的核酸分子中存在的两个itr是相同的,且可特别是aav2itr。在一些实施方案中,itr序列包含一种或多种回文序列。本文公开的itr的回文序列包括,但不限于,天然回文序列(即,自然中发现的序列)、合成的序列(即,自然中未发现的序列),如伪回文序列,及其组合或修饰的形式。“伪回文序列”是回文dna序列,包括不完善的回文序列,其与形成二级结构的天然aav或非aav回文序列中的序列享有少于80%,包括少于70%、60%、50%、40%、30%、20%、10%或5%,或无核酸序列同一性。天然回文序列可获自或衍生自本文公开的任何基因组。合成的回文序列可基于本文公开的任何基因组。回文序列可以是连续的或间断的。在一些实施方案中,回文序列是间断的,其中回文序列包含第二序列的插入。在一些实施方案中,第二序列包含启动子、增强子、整合酶的整合位点(例如,cre或flp重组酶的位点)、基因产物的开放阅读框,或其组合。在一些实施方案中,itr形成发夹环结构。在一个实施方案中,第一itr形成发夹结构。在另一实施方案中,第二itr形成发夹结构。仍在另一实施方案中,第一itr和第二itr二者均形成发夹结构。在一些实施方案中,第一itr和/或第二itr不形成t形发夹结构。在某些实施方案中,第一itr和/或第二itr形成非t形发夹结构。在一些实施方案中,非t形发夹结构包含u形发夹结构。在一些实施方案中,本文所述的核酸分子的itr可以是转录激活的itr。转录激活的itr可包含野生型itr的全部或部分,所述野生型itr已经通过包括至少一种转录活性元件而被转录激活。多种类型的转录活性元件都适用于此上下文中。在一些实施方案中,转录活性元件是组成型转录活性元件。组成型转录活性元件提供持续水平的基因转录,且当需要在持续基础上表达转基因时,组成型转录活性元件是优选的。在其它实施方案中,转录激活元件是诱导型转录激活元件。诱导型转录激活元件通常在缺少诱导物(或诱导条件)的情况下表现出低活性,且在存在诱导物(或切换为诱导条件)的情况下被上调。当仅在某些时间或某些位置需要表达时,或当需要使用诱导剂滴定表达水平时,诱导型转录活性元件可以是优选的。转录激活元件也可以是组织特异性;即,它们仅在某些组织或细胞类型中表现出活性。转录激活元件可以以多种方式并入itr中。在一些实施方案中,转录激活元件并入至itr的任何部分的5′或itr的任何部分的3′。在其它实施方案中,转录激活的itr的转录激活元件位于两个itr序列之间。如果转录激活元件包含两个或多个必须间隔开的元件,则这些元件可以与itr的一部分相间。在一些实施方案中,删除itr的发夹结构,并用转录元件的反向重复替换。后一种排列将产生模仿结构中的缺失部分的发夹。多个串联的转录活性元件也可以存在于转录激活的itr中,且它们可以是相邻或间隔开的。此外,蛋白质结合位点(例如,rep结合位点)可以被引入至转录激活的itr的转录激活元件中。转录激活元件可包含能够通过rna聚合酶控制dna的转录以形成rna的任何序列,且可包含例如如下定义的转录活性元件。转录激活的itr以相对有限的核苷酸序列长度为核酸分子提供转录激活和itr功能,这有效地最大化了可从核酸分子携带并表达的转基因的长度。将转录活性元件并入itr中可以以多种方式完成。itr序列的比较和转录激活元件的序列要求可提供对在itr内编码该元件的方式的理解。例如,可通过在复制转录激活元件的功能元件的itr序列中引入具体变化,将转录活性添加到itr中。本领域中存在在特定位点处有效地添加、缺失和/或改变特定核苷酸序列的许多技术(参见,例如,deng和nickoloff(1992)anal.biochem.200:81-88)。创建转录激活的itr的另一种方式涉及在itr中期望位置处引入限制位点。此外,可使用本领域已知的方法将多个转录激活元件并入转录激活的itr。b.治疗性蛋白质本公开的某些方面涉及一种核酸分子,其包含第一itr、第二itr和编码治疗性蛋白质的基因盒。在一些实施方案中,基因盒编码一种治疗性蛋白质。在一些实施方案中,基因盒编码一种以上治疗性蛋白质。在一些实施方案中,基因盒编码两个或多个拷贝的相同治疗性蛋白质。在一些实施方案中,基因盒编码相同治疗性蛋白质的两种或多种变体。在一些实施方案中,基因盒编码两种或多种不同的治疗性蛋白质。本公开的某些实施方案涉及一种核酸分子,其包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含凝血因子。在一些实施方案中,凝血因子选自下组:fi、fii、fiii、fiv、fv、fvi、fvii、fviii、fix、fx、fxi、fxii、fxiii)、vwf、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白质z相关的蛋白酶抑制剂(zpi)、血纤维蛋白溶酶原、α2-抗纤维蛋白溶酶、组织血纤维蛋白溶酶原激活物(tpa)、尿激酶、血纤维蛋白溶酶原激活物抑制剂-1(pai-1)、血纤维蛋白溶酶原激活物抑制剂-2(pai2)、其任何酶原、其任何激活形式,及其任何组合。在一个实施方案中,凝血因子包含fviii或其变体或片段。在另一实施方案中,凝血因子包含fix或其变体或片段。在另一实施方案中,凝血因子包含fvii或其变体或片段。在另一实施方案中,凝血因子包含vwf或其变体或片段。1.凝血因子在一些实施方案中,核酸分子包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含因子viii多肽。除非另有说明,否则如本文所用的在本申请全文中缩写为“fviii”的“因子viii”意指在凝血中正常作用的功能性fviii多肽。因此,术语fviii包括有功能的变体多肽。“fviii蛋白”与fviii多肽(或蛋白质)或fviii可互换地使用。fviii功能的实例包括,但不限于,激活凝血的能力,充当因子ix的辅因子的能力,或在ca2+和磷脂的存在下与因子ix形成tenase复合物的能力,然后tenase复合物将因子x转化为激活形式的xa。fviii蛋白质可为人、猪、犬、大鼠或小鼠fviii蛋白。此外,来自人类和其他物种的fviii之间的比较已确定了可能需要功能的保守残基(cameron等,thromb.haemost.79:317-22(1998);us6,251,632)。全长多肽和多核苷酸序列是已知的,以及许多功能性片段、突变体和修饰的变体也是已知的。多种fviii氨基酸和核苷酸序列公开在,例如,美国公开号2015/0158929a1、2014/0308280a1和2014/0370035a1以及国际公开号wo2015/106052a1。fviii多肽包括,例如,全长fviii、在n端减去met的全长fviii、成熟fviii(减去信号序列)、在n端具有额外met的成熟fviii和/或b域全部或部分缺失的fviii。fviii变体包括b域缺失,无论是部分缺失还是全部缺失。a.fviii和编码fviii蛋白的多核苷酸序列在一些实施方案中,核酸分子包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含因子viii多肽。除非另有说明,否则如本文所用的在本申请全文中缩写为“fviii”的“因子viii”意指在凝血中正常作用的功能性fviii多肽。因此,术语fviii包括有功能的变体多肽。“fviii蛋白”与fviii多肽(或蛋白质)或fviii可互换地使用。fviii功能的实例包括,但不限于,激活凝血的能力,充当因子ix的辅因子的能力,或在ca2+和磷脂的存在下与因子ix形成tenase复合物的能力,然后tenase复合物将因子x转化为激活形式的xa。fviii蛋白质可以是人、猪、犬、大鼠或小鼠fviii蛋白。此外,来自人类和其他物种的fviii之间的比较已确定了可能需要功能的保守残基(cameron等,thromb.haemost.79:317-22(1998);us6,251,632)。全长多肽和多核苷酸序列是已知的,以及许多功能性片段、突变体和修饰的变体也是已知的。多种fviii氨基酸和核苷酸序列公开在,例如,美国公开号2015/0158929a1、2014/0308280a1和2014/0370035a1和国际公开号wo2015/106052a1。fviii多肽包括,例如,全长fviii、在n端减去met的全长fviii、成熟fviii(减去信号序列)、在n端具有额外met的成熟fviii和/或b域全部或部分缺失的fviii。fviii变体包括b域缺失,无论是部分缺失还是全部缺失。本文所用的嵌合蛋白中的fviii部分具有fviii活性。fviii活性可通过本领域中任何已知的方法来测量。许多种测试可用于评定凝血系统的功能:激活部分的促凝血酶原激酶时间(aptt)测试、生色测定、rotem测定、凝血酶原时间(pt)测试(也用于确定inr)、纤维蛋白原测试(通常通过clauss方法)、血小板计数、血小板功能测试(通常通过pfa-100)、tct、出血时间、混合测试(如果患者的血浆与正常血浆混合是否可以纠正异常)、凝血因子测定、抗磷脂抗体、d-二聚体、基因测试(例如,因子vleiden、凝血酶原突变g20210a)、稀释罗素的蝰蛇毒时间(drvvt)、其他血小板功能测试、血栓弹力描记术(teg或sonoclot)、血栓弹力测定法(例如,)或优球蛋白溶解时间(elt)。aptt测试是一种测量“内在”(也称为接触激活途径)和常见凝血途径的功效的性能指标。此测试通常用于测量可商购的重组凝血因子(例如,fviii)的凝血活性。它与凝血酶原时间(pt)结合使用,所述凝血酶原时间(pt)测量外源途径。rotem分析提供止血的整体动力学信息:凝结时间、凝块形成、凝块稳定性和裂解。血栓弹力测定法中的不同参数取决于血浆凝结系统的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的许多因素。此测定可提供继发性止血的完整视图。生色测定机制是基于凝血级联的原理,其中激活的fviii在激活的因子ix、磷脂和钙离子存在下,加速因子x向因子xa的转化。通过水解对因子xa特异的对硝基苯胺(pna)底物来评定因子xa活性。在405nm下测量的对硝基苯胺的初始释放速率与xa因子活性成正比,且因此与样品中的fviii活性成正比。生色测定法是由国际血栓形成和止血协会(scientificandstandardizationcommittee,isth)的科学和标准化委员会(ssc)的fviii和ix因子小组委员会推荐的。自1994年以来,生色测定法一直是对fviii浓缩物效力的欧洲药典针的参考方法。因此,在一个实施方案中,包含fviii的嵌合多肽具有与与包含成熟fviii或bddfviii的嵌合多肽(例如,或)相当的fviii活性。在另一实施方案中,本公开的包含fviii的嵌合蛋白质具有与包含成熟fviii或bddfviii的嵌合蛋白相当的因子xa生成速率(例如,或)。为了使因子x激活为因子xa,激活的因子ix(因子ixa)在ca2+、膜磷脂和fviii辅因子的存在下,水解因子x中的一个精氨酸-异亮氨酸键以形成因子xa。因此,fviii与因子ix的相互作用在凝血途径中至关重要。在某些实施方案中,包含fviii的嵌合多肽可以以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的速率与因子ixa相互作用。此外,fviii与血管性血友病因子(vwf)结合,但在循环中是非活性的。当不与vwf结合时,fviii迅速降解,并通过凝血酶的作用从vwf释放出来。在一些实施方案中,包含fviii的嵌合多肽以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的速率与血管性血友病因子结合。fviii可在钙和磷脂的存在下,被激活的蛋白c灭活。激活的蛋白质c在a1域中的精氨酸336之后切割fviii重链,这破坏因子x底物相互作用位点,以及在a2域中的精氨酸562之后切割,这增强a2结构域的解离以及破坏与ixa因子的相互作用位点。这种切割还使a2域(43kda)一分为二,并生成a2-n(18kda)和a2-c(25kda)域。因此,激活的蛋白质c可催化重链中的多个切割位点。在一个实施方案中,包含fviii的嵌合多肽通过激活的蛋白质c以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的水平灭活。在其它实施方案中,包含fviii的嵌合蛋白质具有与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的fviii体内活性。在特定的实施方案中,在hema小鼠尾静脉横断模型中,包含fviii的嵌合多肽能够以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的水平保护hema小鼠。如本文所用的,fviii的“b域”与本领域已知的b域相同,该b域由内部氨基酸序列同一性和凝血酶的蛋白水解切割位点定义,例如成熟人fviii的残基ser741-arg1648。其它人fviii域由下列氨基酸残基定义,相对于成熟人fviii:成熟fviii的a1,残基ala1-arg372;a2,残基ser373-arg740;a3,残基ser1690-ile2032;c1,残基arg2033-asn2172;c2,残基ser2173-tyr2332。除非另有说明,否则本文中使用的序列残基编号而不提及任何seqid编号对应于没有信号肽序列的fviii序列(19个氨基酸)。a3-c1-c2序列,也称作fviii重链,包括残基ser1690-tyr2332。其余序列,残基glu1649-arg1689,通常称为fviii轻链激活肽。猪、小鼠和犬fviii的所有域(包括b域)的边界位置也是本领域已知的。在一个实施方案中,fviii的b域是缺失的(“b域缺失的fviii”或“bddfviii”)。bddfviii的实例是(重组bddfviii)。在一个特定的实施方案中,b域缺失的fviii变体包含成熟fviii的氨基酸残基746至1648的缺失。“b域缺失的fviii”可具有美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563以及国际专利号wo2015106052a1(pct/us2015/010738)中公开的全部或部分缺失。在一些实施方案中,本公开的方法中使用的b域缺失的fviii序列包含美国专利号6,316,226的第4栏第4行至第5栏第28行和实施例1-5中公开的任一种缺失(也在us6,346,513中公开)。在另一实施方案中,b域缺失的因子viii是s743/q1638b域缺失的因子viii(sqbddfviii)(例如,具有从氨基酸744至氨基酸1637缺失的因子viii,例如,具有成熟fviii的氨基酸1-743和氨基酸1638-2332的因子viii)。在一些实施方案中,本公开的方法中使用的b域缺失的fviii具有美国专利号5,789,203的第2栏第26-52行和实施例5-8中中公开的缺失(也在us6,060,447、us5,595,886和us6,228,620中公开)。在一些实施方案中,b域缺失的因子viii具有美国专利号5,972,885的第1栏第25行至第2栏第40行;美国专利号6,048,720的第6栏第1-22行和实施例1;美国专利号5,543,502的第2栏第17-46行;美国专利号5,171,844的第4抗第22行至第5栏第36行;美国专利号5,112,950的第2栏第55-68行、图2和实施例1;美国专利号4,868,112的第2栏第2行至第19栏第21行和表2;美国专利号7,041,635的第2栏第1行至至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行和第11栏第5行至第13栏第39行;或美国专利号6,458,563的第4栏第25-53行中公开的缺失。在一些实施方案中,b域缺失的fviii具有大部分b域的缺失,但仍含有b域的氨基末端序列,这对于将一级翻译产物体内蛋白水解加工成两条多肽链至关重要,如wo91/09122中公开的。在一些实施方案中,b域缺失的fviii构建有氨基酸747-1638的缺失,即,实际上是b域的完全缺失。hoebenr.c.,等j.biol.chem.265(13):7318-7323(1990)。b域缺失的因子viii也可含有fviii的氨基酸771–1666或氨基酸868-1562的缺失。meulienp.,等proteineng.2(4):301-6(1988)。作为本发明一部分的另外的b域缺失包括:氨基酸982至1562或760至1639的缺失(toole等,proc.natl.acad.sci.u.s.a.(1986)83,5939-5942))、797至1562的缺失(eaton,等biochemistry(1986)25:8343-8347))、741至1646的缺失(kaufman(pct国际公开号wo87/04187))、747-1560的缺失(sarver,等,dna(1987)6:553-564))、741至1648的缺失(pasek(pct申请号88/00831))或816至1598的缺失或741至1648的缺失(lagner(behringinst.mitt.(1988)no82:16-25,ep295597))。在一个特定的实施方案中,b域缺失的fviii包含成熟fviii的氨基酸残基746至1648的缺失。在另一实施方案中,b域缺失的fviii包含成熟fviii的氨基酸残基745至1648的缺失。在一些实施方案中,bddfviii包含单链fviii,该单链fviii含有对应于成熟全长fviii的氨基酸765至1652的缺失(也称作rviii单链和)。参见美国专利号7,041,635。在其它实施方案中,bddfviii包括含有b域的片段的fviii多肽,该b域保留一个或多个n-连接的糖基化位点,例如,残基757、784、828、900、963或任选是943,其对应于全长fviii序列的氨基酸序列。b域片段的实例包括miao,h.z.,等,blood103(a):3412-3419(2004),kasuda,a,等,j.thromb.haemost.6:1352-1359(2008),和pipe,s.w.,等,j.thromb.haemost.9:2235-2242(2011)中公开的b域的226个氨基酸或163个氨基酸(即,保留b域的前226个氨基酸或163个氨基酸)。在另外的其它实施方案中,bddfviii进一步包含残基309处的点突变(phe突变为ser)以改善bddfviii蛋白质的表达。参见miao,h.z.,等,blood103(a):3412-3419(2004)。在另外的其它实施方案中,bddfviii包括fviii多肽,该fviii多肽含有部分b域,但不含有一个或多个弗林蛋白酶切割位点(例如,arg1313和arg1648)。参见pipe,s.w.,等,j.thromb.haemost.9:2235-2242(2011)。在一些实施方案中,bddfviii包含单链fviii,该单链fviii含有对应于成熟全长fviii的氨基酸765至1652的缺失(也称作rviii单链和)。参见美国专利号7,041,635。前述缺失中的每一个可在任何fviii序列中进行。如上文和下文所讨论的,已知许多功能性fviii变体。此外,在血友病患者中已鉴定出数百种fviii的非功能性突变,且已确定这些突变对fviii功能的影响更多是由于它们位于fviii的3维结构内而不是替代的性质(cutler等,hum.mutat.19:274-8(2002)),通过提述以其整体并入本文。此外,来自人类和其他物种的fviii之间的比较已确定了可能需要功能的保守残基(cameron等,thromb.haemost.79:317-22(1998);us6,251,632),通过提述以其整体并入本文。在一些实施方案中,fviii多肽包含fviii变体或其片段,其中fviii变体或其片段片段具有fviii活性。在一些实施方案中,基因盒编码全长fviii多肽。在其它实施方案中,基因盒编码b域缺失的(bdd)fviii多肽,其中fviii的b域的全部或部分是缺失的。在一个特定的实施方案中,基因盒编码包含与seqidno:106、107、109、110、111或112具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽。在一些实施方案中,基因盒编码具有seqidno:17的氨基酸序列或其片段的多肽。在一些实施方案中,基因盒编码具有seqidno:106的氨基酸序列或其片段的多肽。在一些实施方案中,基因盒包含与seqidno:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施方案中,基因盒编码具有seqidno:109的氨基酸序列或其片段的多肽。在一些实施方案中,基因盒包含与seqidno:16具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施方案中,基因盒包含与seqidno:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施方案中,本公开的基因盒编码包含信号肽或其片段的fviii多肽。在其它实施方案中,基因盒编码缺少信号肽的fviii多肽。在一些实施方案中,信号肽包含seqidno:17的氨基酸1-19。在一些实施方案中,基因盒包含编码fviii多肽的核苷酸序列,其中核苷酸序列是密码子优化的。在某些实施方案中,基因盒包含国际申请号pct/us2017/015879的核苷酸序列,其通过提述以其整体并入本文。在一些实施方案中,基因盒包含编码fviii多肽的核苷酸序列,其中核苷酸序列是密码子优化的。在某些实施方案中,基因盒包含与选自seqidno:1-14的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施方案中,基因盒包含与seqidno:71具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施方案中,基因盒包含与seqidno:19具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。i.编码fviii多肽的密码子优化的核苷酸序列在一些实施方案中,本公开的核酸分子包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中第一itr和第二itr衍生自aav基因组,且其中基因盒包含编码fviii多肽的密码子优化的核苷酸序列。在一些实施方案中,密码子优化的核苷酸序列编码全长fviii多肽。在其它实施方案中,密码子优化的核苷酸序列编码b域缺失的(bdd)fviii多肽,其中fviii的b域的全部或部分是缺失的。在一个特定的实施方案中,密码子优化的核苷酸序列编码多肽包含与seqidno:17具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列或其片段。在一个实施方案中,密码子优化的核苷酸序列编码具有seqidno:17的氨基酸序列或其片段的多肽。在一些实施方案中,密码子优化的核苷酸序列编码包含信号肽或其片段的fviii多肽。在其它实施方案中,密码子优化的序列编码缺少信号肽的fviii多肽。在一些实施方案中,信号肽包含seqidno:17的氨基酸1-19。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791或(ii)seqidno:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分一起具有fviii多肽活性。在一个特定的实施方案中,第一核酸序列与seqidno:3的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在另一实施方案中,第一核酸序列与seqidno:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,第一核苷酸序列包含seqidno:3的核苷酸58-1791或seqidno:4的核苷酸58-1791。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸1-1791或(ii)seqidno:4的核苷酸1-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在一个实施方案中,第一核苷酸序列包含seqidno:3的核苷酸1-1791或seqidno:4的核苷酸1-1791。在另一实施方案中,第二核苷酸序列与seqidno:3的核苷酸1792-4374或seqidno:4的1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定的实施方案中,第二核苷酸序列包含seqidno:3的核苷酸1792-4374或seqidno:4的1792-4374。在又另一实施方案中,第二核苷酸序列与seqidno:3的核苷酸1792-2277和2320-4374或seqidno:4的1792-2277和2320-4374(即,seqidno:3的核苷酸1792-4374或seqidno:4的1792-4374,其没有编码b域或b域片段的核苷酸)具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定的实施方案中,第二核苷酸序列包含seqidno:3的核苷酸1792-2277和2320-4374或seqidno:4的1792-2277和2320-4374(即,seqidno:3的核苷酸1792-4374或seqidno:4的1792-4374,其没有编码b域或b域片段的核苷酸)。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374或(ii)seqidno:6的1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在某些实施方案中,第二核酸序列与seqidno:5的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,第二核酸序列与seqidno:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定的实施方案中,第二核酸序列包含seqidno:5的核苷酸1792-4374或seqidno:6的1792-4374。在一些实施方案中,与上列的第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸58-1791或seqidno:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,与上列的第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸1-1791或seqidno:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)或(ii)seqidno:6的1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在某些实施方案中,第二核酸序列与seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,第二核酸序列与seqidno:6的核苷酸1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定的实施方案中,第二核酸序列包含seqidno:5的核苷酸1792-2277和seqidno:6的2320-4374或1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374或seqidno:6的1792-4374,其没有编码b域或b域片段的核苷酸)。在一些实施方案中,与上列的第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸58-1791或seqidno:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,与上列的第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸1-1791或seqidno:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、少98%或至少99%序列同一性。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第一核酸序列与(i)seqidno:1的核苷酸58-1791,(ii)seqidno:2的核苷酸58-1791,(iii)seqidno:70的核苷酸58-1791,或(iv)seqidno:71的核苷酸58-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在其它实施方案中,第一核苷酸序列包含seqidno:1的核苷酸58-1791、seqidno:2的核苷酸58-1791、(iii)seqidno:70的核苷酸58-1791,或(iv)seqidno:71的核苷酸58-1791。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第一核酸序列与(i)seqidno:1的核苷酸1-1791、(ii)seqidno:2的核苷酸1-1791、(iii)seqidno:70的核苷酸1-1791,或(iv)seqidno:71的核苷酸1-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在一个实施方案中,第一核苷酸序列包含seqidno:1的核苷酸1-1791、seqidno:2的核苷酸1-1791、(iii)seqidno:70的核苷酸1-1791,或(iv)seqidno:71的核苷酸1-1791。在另一实施方案中,与第一核苷酸序列连接的第二核苷酸序列与seqidno:1的核苷酸1792-4374、seqidno:2的1792-4374、(iii)seqidno:70的核苷酸1792-4374或(iv)seqidno:71的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定的实施方案中,与第一核苷酸序列连接的第二核苷酸序列包含(i)seqidno:1的核苷酸1792-4374、(ii)seqidno:2的核苷酸1792-4374,(iii)seqidno:70的核苷酸1792-4374或(iv)seqidno:71的核苷酸1792-4374。在其它实施方案中,与第一核苷酸序列连接的第二核苷酸序列与(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374或(iv)seqidno:71的核苷酸1792-2277和2320-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个实施方案中,第二核苷酸序列包含(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374,或(iv)seqidno:71的核苷酸1792-2277和2320-4374。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第二核酸序列与(i)seqidno:1的核苷酸1792-4374、(ii)seqidno:2的核苷酸1792-4374、(iii)seqidno:70的核苷酸1792-4374,或(iv)seqidno:71的核苷酸1792-4374具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在一个特定的实施方案中,第二核酸序列包含(i)seqidno:1的核苷酸1792-4374、(ii)seqidno:2的核苷酸1792-4374、(iii)seqidno:70的核苷酸1792-4374,或(iv)seqidno:71的核苷酸1792-4374。在一些实施方案中,编码fviii多肽的密码子优化的序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第二核酸序列与(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374,或(iv)seqidno:71的核苷酸1792-2277和2320-4374(即,seqidno:1的核苷酸1792-4374、seqidno:2的核苷酸1792-4374、seqidno:70的核苷酸1792-4374或seqidno:71的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;且其中n端部分和c端部分同时具有fviii多肽活性。在一个实施方案中,第二核酸序列包含(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374或(iv)seqidno:71的核苷酸1792-2277和2320-4374(即,seqidno:1的核苷酸1792-4374、seqidno:2的核苷酸1792-4374、seqidno:70的核苷酸1792-4374或seqidno:71的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:1的核苷酸58至4374具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:1的核苷酸58-2277和2320-4374(即,seqidno:1的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核酸序列与seqidno:1具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,核苷酸序列包含seqidno:1的核苷酸58-2277和2320-4374(即,seqidno:1的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:1的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:1的核苷酸1-2277和2320-4374(即,seqidno:1的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:1的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:2的核苷酸58至4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:2的核苷酸58-2277和2320-4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核酸序列与seqidno:2具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,核苷酸序列包含seqidno:2的核苷酸58-2277和2320-4374(即,seqidno:2的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:2的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:2的核苷酸1-2277和2320-4374(即,seqidno:2的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:2的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:70的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:70的核苷酸58-2277和2320-4374(即,seqidno:70的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核酸序列与seqidno:70具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,核苷酸序列包含seqidno:70的核苷酸58-2277和2320-4374(即,seqidno:70的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:70的核苷酸58至4374。在另外其它的实施方案中,核苷酸序列包含seqidno:70的核苷酸1-2277和2320-4374(即,seqidno:70的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:70的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:71的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:71的核苷酸58-2277和2320-4374(即,seqidno:71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核酸序列与seqidno:71具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,核苷酸序列包含seqidno:71的核苷酸58-2277和2320-4374(即,seqidno:71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:71的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:71的核苷酸1-2277和2320-4374(即,seqidno:71的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:71的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:3的核苷酸58至4374具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:3的核苷酸58-2277和2320-4374(即,seqidno:3的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施方案中,核酸序列与seqidno:3具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施方案中,核苷酸序列包含seqidno:3的核苷酸58-2277和2320-4374(即,seqidno:3的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:3的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:3的核苷酸58-2277和2320-4374(即,seqidno:3的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:3的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:4的核苷酸58至4374具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:4的核苷酸58-2277和2320-4374(即,seqidno:4的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核酸序列与seqidno:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其它实施方案中,核苷酸序列包含seqidno:4的核苷酸58-2277和2320-4374(即,seqidno:4的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:4的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:4的核苷酸1-2277和2320-4374(即,seqidno:4的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:4的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:5的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:5的核苷酸58-2277和2320-4374(即,seqidno:5的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施方案中,核酸序列与seqidno:5具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施方案中,核苷酸序列包含seqidno:5的核苷酸58-2277和2320-4374(即,seqidno:5的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:5的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:5的核苷酸1-2277和2320-4374(即,seqidno:5的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:5的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与seqidno:6的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其它实施方案中,核苷酸序列包含与seqidno:6的核苷酸58-2277和2320-4374(即,seqidno:6的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施方案中,核酸序列与seqidno:6具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施方案中,核苷酸序列包含seqidno:6的核苷酸58-2277和2320-4374(即,seqidno:6的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)或seqidno:6的核苷酸58至4374。在另外其它实施方案中,核苷酸序列包含seqidno:6的核苷酸1-2277和2320-4374(即,seqidno:6的核苷酸1-4374,其没有编码b域或b域片段的核苷酸)或seqidno:6的核苷酸1至4374。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码信号肽的核酸序列。在某些实施方案中,信号肽是fviii信号肽。在一些实施方案中,编码信号肽的核酸序列是密码子优化的。在一个特定的实施方案中,编码信号肽的核酸序列与(i)seqidno:1的核苷酸1至57;(ii)seqidno:2的核苷酸1至57;(iii)seqidno:3的核苷酸1至57;(iv)seqidno:4的核苷酸1至57;(v)seqidno:5的核苷酸1至57;(vi)seqidno:6的核苷酸1至57;(vii)seqidno:70的核苷酸1至57;(viii)seqidno:71的核苷酸1至57;或(ix)seqidno:68的核苷酸1至57具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。seqidno:1-6、70和71是seqidno:16优化的版本,其是起始或“亲本”或“野生型”fviii核苷酸序列。seqidno:16编码b域缺失的人fviii。尽管seqidno:1-6、70和71衍生自fviii(seqidno:16)的特异性b域缺失的形式,但是应当理解,本公开还包括编码其它版本的fviii的核酸的优化版本。例如,其它版本的fviii可包括全长fviii、其它b域缺失的fviii(本文所述的)或fviii的保留fviii活性的其它片段。在一个实施方案中,基因盒包含fviii构建体,其包括表2a-2c中所列的多核苷酸序列(6526个核苷酸)。在一个实施方案中,基因盒包含fviii构建体,其包括表2b中所列的多核苷酸序列(6526个核苷酸)。在某些实施方案中,分离的核酸分子包含与seqidno:179或182的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列,其中分离的核酸分子保留表达功能性fviii蛋白质的能力。表2a:实例fviii构建体(核苷酸1-6526;seqidno:110)表2b:实例b19-fviii构建体(核苷酸1-6762;seqidno:179)表2c:实例gpv-fviii构建体(核苷酸1-6830;seqidno:182)a.密码子适应指数在一个实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列的人密码子适应指数相对于seqidno:16增加。例如,密码子优化的核苷酸序列可具有人密码子适应指数,其为至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、至少约0.91(91%)、至少约0.92(92%)、至少约0.93(93%)、至少约0.94(94%)、至少约0.95(95%)、至少约0.96(96%)、至少约0.97(97%)、至少约0.98(98%)或至少约0.99(99%)的。在一些实施方案中,密码子优化的核苷酸序列具有的人密码子适应指数为至少约.88(88%)。在其它实施方案中,密码子优化的核苷酸序列具有的人密码子适应指数为至少约.91(91%)。在其它实施方案中,密码子优化的核苷酸序列具有的人密码子适应指数为至少约.91(97%)。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中核苷酸序列的人密码子适应指数相对于seqidno:16增加。在一些实施方案中,核苷酸序列具有的人密码子适应指数为至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)或至少约.91(91%)。在一个特定的实施方案中,核苷酸序列具有的人密码子适应指数为至少约.88(88%)。在另一实施方案中,核苷酸序列具有的人密码子适应指数为至少约.91(91%)。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列的核苷酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-2277和2320-4374或(ii)seqidno:6的1792-2277和2320-4374具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中核苷酸序列的人密码子适应指数相对于seqidno:16增加。在一些实施方案中,核苷酸序列具有的人密码子适应指数为至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定的实施方案中,核苷酸序列具有的人密码子适应指数为至少约.83(83%)。在另一实施方案中,核苷酸序列具有的人密码子适应指数为至少约.88(88%)。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中核苷酸序列包含与选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中核苷酸序列的人密码子适应指数相对于seqidno:16增加。在一些实施方案中,核苷酸序列具有的人密码子适应指数为至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定的实施方案中,核苷酸序列具有的人密码子适应指数为至少约.75(75%)。在另一实施方案中,核苷酸序列具有的人密码子适应指数为至少约.83(83%)。在另一实施方案中,核苷酸序列具有的人密码子适应指数为至少约.88(88%)。在另一实施方案中,核苷酸序列具有的人密码子适应指数为至少约.91(91%)。在另一实施方案中,核苷酸序列具有的人密码子适应指数为至少约.97(97%)。在一些实施方案中,编码本公开的fviii多肽的密码子优化的核苷酸序列相对于seqidno:16具有增加的最佳密码子频率(fop)。在某些实施方案中,编码fviii多肽的密码子优化的核苷酸序列的fop为至少约40、至少约45、至少约50、至少约55、至少约60、至少约64、至少约65、至少约70、至少约75、至少约79、至少约80、至少约85或至少约90。在其它实施方案中,编码本公开的fviii多肽的密码子优化的核苷酸序列相对于seqidno:16具有增加的同义密码子相对使用度(rcsu)。在一些实施方案中,分离的核酸分子的rcsu大于1.5。在其它实施方案中,分离的核酸分子的rcsu大于2.0。在某些实施方案中,分离的核酸分子的rcsu为至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2.0、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6或至少约2.7。在另外其它实施方案中,编码本公开的fviii多肽的密码子优化的核苷酸序列相对于seqidno:16具有降低的有效密码子数目。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的有效密码子数目少于约50、少于约45、少于约40、少于约35、少于约30或少于约25。在一个特定的实施方案中,分离的核酸分子具有的有效密码子数目为约40、约35、约30、约25或约20。b.g/c含量最佳化在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相较于seqidno:16中g/c核苷酸的百分比含有较高百分比的g/c核苷酸。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%或至少约60%。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中核苷酸序列相较于seqidno:16中的g/c核苷酸的百分比含有更高百分比的g/c核苷酸。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%或至少约58%。在一个特定的实施方案中,编码具有fviii活性的多肽的核苷酸序列具有的g/c含量为至少约58%。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸),或(iv)seqidno:6的1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列相较于seqidno:16中的g/c核苷酸的百分比含有更高百分比的g/c核苷酸。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%或至少约57%。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约52%。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约55%。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约57%。在其它实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与选自seqidno:1、2、3、4、5、6、70或71的氨基酸序列的(i)核苷酸58-4374或(ii)核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中核苷酸序列相较于seqidno:16中的g/c核苷酸的百分比含有更高百分比的g/c核苷酸。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约45%。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约52%。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约55%。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约57%。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列具有的g/c含量为至少约58%。在另外其它实施方案中,编码fviii多肽的n个密码子优化的核苷酸序列具有的g/c含量为至少约60%。“g/c含量”(或鸟嘌呤-胞嘧啶含量),或“g/c核苷酸的百分比”是指dna分子中含氮碱基(即鸟嘌呤或胞嘧啶)的百分比。可使用下列公式来计算g/c含量:人基因的g/c含量高度异质,一些基因的g/c含量低至20%,且其它基因的g/c含量高达95%。通常,富含g/c的基因表达更高。实际上,已证明增加基因的g/c含量可导致基因表达增加,这主要是由于转录增加和较高的稳态mrna水平所致。参见kudla等,plosbiol.,4(6):e180(2006)。c.矩阵附着区样序列在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于seqidno:16含有较少的mars/ars序列。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多6、最多5、最多4、最多3或最多2个mars/ars序列。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多1个mars/ars序列。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有mars/ars序列。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的mars/ars序列。在其它实施方案中,编码具有fviii活性的多肽的核苷酸序列含有最多6、最多5、最多4、最多3或最多2个mars/ars序列。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多1个mars/ars序列。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有mars/ars序列。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中核苷酸序列相对于seqidno:16含有较少的mars/ars序列。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多6、最多5、最多4、最多3或最多2个mars/ars序列。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多1个mars/ars序列。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有mars/ars序列。在其它实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,或(ii)seqidno:1、2、3、4、5、6、70或71的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的mars/ars序列。在其它实施方案中,编码fviii的密码子优化的核苷酸序列多肽含有最多6、最多5、最多4、最多3或最多2个mars/ars序列。在其它实施方案中,编码fviii的密码子优化的核苷酸序列含有最多1个mars/ars序列。在又一其它实施方案中,编码fviii的密码子优化的核苷酸序列不含有mars/ars序列。已经确定了人fviii核苷酸序列中与酿酒酵母自主复制序列(ars)和核基质附着区(mar)享有序列相似性的富含at的元件。(fallux等,mol.cell.biol.16:4264-4272(1996)。这些元件之一已被证明可以在体外结合核因子并抑制氯霉素乙酰转移酶(cat)报告基因的表达。(fallux等,mol.cell.biol.16:4264-4272(1996)。已经假设这些序列可促进人fviii基因的转录抑制。因此,在一个实施方案中,在编码本公开的fviii多肽的密码子优化的核苷酸序列中,所有mar/ars序列都被废除了。在亲本fviii序列(seqidno:16)中存在4种mar/arsatattt序列(seqidno:21)和3种mar/arsaaatat序列(seqidno:22)。所有的这些位点经突变以破坏优化的fviii序列(seqidno:1-6)中的mar/ars序列。这些元件中每个元件的位置,以及优化的序列中相应核苷酸的序列显示在下表3中。表3:抑制性元件变化的总结d.去稳定序列在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于seqidno:16含有较少的去稳定元件。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个去稳定元件。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个去稳定元件。在另外的其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有去稳定元件。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的去稳定元件。在其它实施方案中,编码具有fviii活性的多肽的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个去稳定元件。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个去稳定元件。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有去稳定元件。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的去稳定元件。在其它实施方案中,编码具有fviii活性的多肽的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个去稳定元件。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个去稳定元件。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列部含有去稳定元件。在其它实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70和71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的去稳定元件。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个去稳定元件。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个去稳定元件。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有去稳定元件。在亲本fviii序列(seqidno:16)中有10个去稳定元件:6个attta序列(seqidno:23)和4个taaat序列(seqidno:24)。在一个实施方案中,这些位点的序列经突变以破坏优化的fviiiseqidno:1-6、70和71中的去稳定元件。这些元件中每个元件的位置,以及优化的序列中相应核苷酸的序列显示在表3中。e.潜在启动子结合位点在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中核苷酸序列相对于seqidno:16含有较少的潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个潜在启动子结合位点。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有潜在启动子结合位点。在一个特定的实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个潜在启动子结合位点。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有潜在启动子结合位点。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽c端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个潜在启动子结合位点。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有潜在启动子结合位点。在其它实施方案中,编码fviii多肽的基因盒包含密码子优化的核苷酸序列,其中核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374,或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,选自seqidno:1、2、3、4、5、6、70和71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列相对于seqidno:16含有较少的潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多9个、最多8个、最多7个、最多6个或最多5个潜在启动子结合位点。在其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列含有最多4个、最多3个、最多2个或最多1个潜在启动子结合位点。在又一其它实施方案中,编码fviii多肽的密码子优化的核苷酸序列不含有潜在启动子结合位点。tata盒是通常在真核细胞的启动子区中发现的调节序列。它们充当tata结合蛋白(tbp)(一种一般的转录因子)的结合位点。tata盒通常包含序列tataa(seqidno:28)或紧密变体。然而,编码序列内的tata盒可抑制全长蛋白质的翻译。野生型bddfviii序列(seqidno:16)中存在10个潜在启动子结合序列:5个tataa序列(seqidno:28)和5个ttata序列(seqidno:29)。在一些实施方案中,在本公开的fviii基因中废除了启动子结合位点中的至少1个、至少2个、至少3个或至少4个。在一些实施方案中,在本公开的fviii基因中废除了启动子结合位点中的至少5个。在其它实施方案中,在本公开的fviii基因中废除了启动子结合位点中的至少6个、至少7个或至少8个。在一个实施方案中,在本公开的fviii基因中废除了启动子结合位点中的至少9个。在一个特定的实施方案中,在本公开的fviii基因中废除了所有启动子结合位点。每个潜在启动子结合位点的位置和优化的序列中相应核苷酸的序列显示在表3中。f.其它顺式作用负调控元件除了上述的mar/ars序列、去稳定元件和潜在启动子位点外,在野生型bddfviii序列(seqidno:16)中还可鉴定出几种其他的潜在抑制性序列。可在非优化的bddfviii序列中鉴定出两种富含au的序列元件(are)(attttatt(seqidno:30);和atttttaa(seqidno:31),连同聚a位点(aaaaaaa;seqidno:26)、聚t位点(tttttt;seqidno:25)和剪接位点(ggtgat;seqidno:27)。这些元件中的一个或多个可从优化的fviii序列中删除。这些位点中的每个的位置以及优化序列中相应核苷酸的序列显示在表3中。在某些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列不含有一个或多个顺式作用负调控元件,例如,剪接位点、聚t序列、聚a序列、are序列或其任何组合。在另一实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,seqidno:5的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,seqidno:6的核苷酸1792-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列不含有一个或多个顺式作用负调控元件,例如,剪接位点、聚t序列、聚a序列、are序列或其任何组合。在其它实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列不含有一个或多个顺式作用负调控元件,例如,剪接位点、聚t序列、聚a序列、are序列或其任何组合。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列不含有剪接位点ggtgat(seqidno:27)。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791;其中n端部分和c端部分同时具有fviii多肽活性具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;且其中密码子优化的核苷酸序列不含有聚t序列(seqidno:25)。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n端部分和c端部分同时具有fviii多肽活性;且其中密码子优化的核苷酸序列不含有聚a序列(seqidno:26)。在一些实施方案中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n端部分的第一核酸序列和编码fviii多肽的c端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;且其中密码子优化的核苷酸序列不含有are元件(seqidno:30或seqidno:31)。在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列不含有剪接位点ggtgat(seqidno:27)。在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列不有聚t序列(seqidno:25)。在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列不含有聚a序列(seqidno:26)。在一些实施方案中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374,其没有编码b域或b域片段的核苷酸)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;且其中密码子优化的核苷酸序列不含有are元件(seqidno:30或seqidno:31)。在其它实施方案中,本公开的优化的fviii序列不包含抗病毒基序、茎环结构和重复序列中的一个或多个。在另外其它实施方案中,转录起始位点周围的核苷酸变为kozak共有序列(gccgccaccatgc(seqidno:32),其中加下划线的核苷酸是起始密码子)。在其它实施方案中,可添加或去除限制位点以促进克隆过程。b.fix和编码fix蛋白质的多核苷酸序列在一些实施方案中,核酸分子包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含fix多肽。在一些实施方案中,fix多肽包含fix或其变体或片段,其中fix或其变体或片段具有fix活性。人fix是一种丝氨酸蛋白酶,是凝血级联内在途径的重要组成部分。如本文所用的,“因子ix”或“fix”是指凝血因子蛋白及其种类和序列变体,且包括,但不限于,人fix前体多肽的461个单链氨基酸序列(“prepro”)、成熟人fix的415个单链氨基酸序列(seqidno:125)和r338lfix(padua)变体(seqidno:126)。fix包括具有凝血fix典型特征的任何形式的fix分子。如本文所用的“因子ix”和“fix”意欲涵盖包含域gla(含有γ羧基谷氨酸残基的区域)、egf1和egf2(含有与人表皮生长因子同源的序列的区域)、激活肽(“ap”,其由成熟fix的残基r136-r180形成)和c端蛋白酶域(“pro”)的多肽,或本领域已知的这些域的同义词,或者可以是保留天然蛋白质的至少一部分生物活性的截短的片段或序列变体。已克隆fix或序列变体,如美国专利号4,770,999和7,700,734中所述的,且编码人fix的cdna已经被分离、表征并克隆至表达载体中(参见,例如,choo等,nature299:178-180(1982);fair等,blood64:194-204(1984);和kurachi等,proc.natl.acad.sci.,u.s.a.79:6461-6464(1982))。fix的一个特定变体、r338lfix(padua)变体(seqidno:2)(其由表征simioni等,2009)包含功能获得性突变,其与padua变体相对于天然fix的活性增加近8倍相关(表4)。fix变体还可包括具有一个或多个保守氨基酸取代的任何fix多肽,其不影响fix多肽的fix活性。在一些实施方案中,fix变体包含由可切割的接头融合的rfix-白蛋白,例如,参见us7,939,632,其通过提述以其整体并入本文。表4:实例fix序列*灰色阴影=信号肽;下划线=xten序列;粗体=fc。**美国专利号9,856,468中的seqidno:67,该专利通过提述以其整体并入本文。fix多肽为55kda,其合成为由以下三个区组成的多肽前肽链(prepropolypetidechain)(seqidno:125):28个氨基酸的信号肽(seqidno:127的氨基酸1至28)、18个氨基酸的前肽(氨基酸29至46),其需要谷氨酸残基的γ羧化作用,以及415个氨基酸的成熟因子ix(seqidno:125或126)。前肽是在γ-羧基谷氨酸结构域的n端的18个氨基酸残基序列。该前肽结合维生素k依赖性γ羧化酶,然后通过内源蛋白酶(最可能是pace(成对的碱性氨基酸切割酶),也称为弗林蛋白酶或pcsk3)从fix的前体多肽被切割。在无γ羧化作用的情况下,gla域不能结合钙,无法呈现将蛋白质锚定在带负电荷的磷脂表面上所必需的正确构象,从而使ix因子无功能。即使gla域被羧化,其也依赖于前肽的切割来实现适当的功能,因为保留的前肽干扰与钙和磷脂最佳结合所必需的gla域的构象变化。在人类中,所得的成熟因子ix由肝细胞以无活性酶原的形式分泌到血流中,该无活性酶原是415个氨基酸残基的单链蛋白,其按重量计含有大约17%的碳水化合物(schmidt,a.e.,等(2003)trendscardiovascmed,13:39)。成熟的fix由n端到c端构型中的几个域组成:gla域、egf1域、egf2域、激活肽(ap)域和蛋白酶域(或催化域)。短接头使egf2域与ap域连结。fix含有分别由r145-a146和r180-v181形成的两个激活肽。激活后,单链fix变成2个链的分子,其中两条链通过二硫键连接。可通过替换其激活肽使凝血因子工程化,从而产生改变的激活特异性。在哺乳动物中,成熟的fix必须由激活的因子xi激活以产生因子ixa。在使fix激活为fixa后,蛋白酶域提供fix的催化活性。激活的因子viii(fviiia)是fixa活性的完全表达的特异性辅因子。在某些实施方案中,fix多肽包含血浆衍生的fix的thr148等位基因形式,并具有类似于内源性fix的结构和功能性特征。许多功能性fix变体是本领域中已知的。国际公开号wo02/040544a3在第4页第9-30行和第15页第6-31行公开了表现出对肝素的抑制作用增强的抗性的突变体。国际公开号wo03/020764a2在表2和3(第14-24页)和第12页第1-27行中公开了具有降低的t细胞免疫原性的fix突变体。国际公开号wo2007/149406a2在第4页第1行至第19页第11行公开了表现出增加的蛋白质稳定性,增加的体内和体外半衰期以及增加的对蛋白酶的抗性的功能性突变体fix分子。wo2007/149406a2在第19页第12行至第20页第9行还公开了嵌合和其它变体fix分子。国际公开号wo08/118507a2在第5页第14行至第6页第5行公开了表现出增加的凝血活性的fix突变体。国际公开号wo09/051717a2在第9页第11行至第20页第2行公开了具有数目增加的n-连接的和/或o-连接的糖基化位点(其导致了增加的半衰期和/或回收)的fix突变体。国际公开号wo09/137254a2在第2页第[006]段至第5页第[011]段和第16页第[044]段至第24页第[057]段还公开了具有增加数目的糖基化位点的因子ix突变体。国际公开号wo09/130198a2在第4页第26行至第12页第6行公开了具有增加数目的糖基化位点(其导致增加的半衰期)的功能性突变体fix分子。国际公开号wo09/140015a2在第11页第[0043]段至第13页第[0053]段公开了cys残基(其可用于聚合酶(例如,peg)缀合)的数目增加的功能性fix突变体。在2011年7月11日提交并于2012年1月12日以wo2012/006624公开的国际申请号pct/us2011/043569中描述的fix多肽也通过提述以其整体并入本文。在一些实施方案中,fix多肽包含与白蛋白融合的fix多肽,例如,fix-白蛋白。在某些实施方案中,fix多肽是或rix-fp。此外,在血友病受试者中已经鉴定出fix中的数百种非功能性突变,其中许多种公开于国际公开号wo09/137254a2的第11-14页的表6中。此类非功能性突变不包括在本发明中,但是提供了关于哪些突变或多或少有可能导致功能性fix多肽的额外指导。在一个实施方案中,fi多肽(或融合多肽的因子ix部分)包含与seqidno:1或2中所示的序列(seqidno:125或126的氨基酸1至415),或可替换地,与具有前肽序列,或具有前肽和信号序列(全长fix)的序列至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一的氨基酸序列。在另一实施方案中,fix多肽包与seqidno:2中所示的序列含至少70%,至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一的氨基酸序列。fix促凝剂活性以国际单位(iu)表示。1iu的fix活性大约对应于一毫升正常人血浆中的fix量。几种测定法可用于测量fix活性,包括一阶段凝血测定法(激活的部分凝血活酶时间;aptt)、凝血酶生成时间(tga)和旋转血栓弹力法本发明预期与fix序列具有同源性的序列,天然的序列片段(如来自人类、非人的灵长类动物、哺乳动物(包括家畜))以及非天然序列变体的序列,所述非天然序列变体保留了fix的至少一部分生物学活性或生物学功能和/或可用于预防、治疗、介导或改善与凝血因子有关的疾病、缺陷、病症或病况(例如与创伤、手术、凝血因子缺陷有关的出血发作)。与人fix具有同源性的序列可通过标准同源性搜索技术(如ncbiblast)找到。在某些实施方案中,fix序列是密码子优化的。密码子优化的fix序列的实例包括,但不限于,国际公开号wo2016/004113a1中的seqidno:1和54-58,所述国际公开号wo2016/004113a1通过提述以其整体并入本文。c.fvii和编码fvii蛋白的多核苷酸序列在一些实施方案中,核酸分子包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含因子vii多肽。在一些实施方案中,fvii多肽包含fvii或其变体或片段,其中其变体或片段具有fvii活性。“因子vii”(“fvii”或“f7”;也称作因子7、凝血因子vii、血清因子vii、血清凝血酶原转化促进子、spca、前转化素和依他凝血素(eptacog)α)是一种丝氨酸蛋白酶,其是凝血级联的一部分。在一个实施方案中,本文所述的核酸中的凝血因子是fvii。重组激活的因子vii(“fvii”)已经开始广泛用于治疗大出血,如患有血友病a或b、凝血因子xi、fvii缺陷、血小板功能缺陷、血小板减少症或血管性血友病的患者中出现的大出血。重组激活的fvii(rfviia;)用于治疗下列患者中的出血发作:(i)具有抗fviii或fix的中和抗体(抑制因子)的血友病患者,(ii)具有fvii缺陷的患者,或(iii)正在接受手术治疗的具有抑制因子的血友病a或b的患者。然而,显示出的疗效差。由于对激活的血小板的低亲和力、半衰期短以及在缺乏组织因子的情况下酶活性差,所以通常需要高浓度的重复剂量的fviia以控制出血。因此,对于具有fviii和fix抑制因子和/或具有fvii缺陷的血友病患者,需要更好的治疗和预防选择的医学需求尚未得到满足。在一个实施方案中,基因盒编码成熟形式的fvii或其变体。fvii包括gla域、两个egf域(egf-1和egf-2)和丝氨酸蛋白酶域(或肽酶s1域),丝氨酸蛋白酶域在丝氨酸蛋白酶(如例如胰凝乳蛋白酶)的肽酶s1家族的所有成员中是高度保守的。fvii以单链酶原(即,可激活的fvii)和完全激活的两条链形式出现。c.生长因子在一些实施方案中,核酸分子包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含生长因子。生长因子可选自本领域中已知的任何生长因子。在一些实施方案中,生长因子是激素。在其它实施方案中,生长因子是细胞因子。在一些实施方案中,生长因子是趋化因子。在一些实施方案中,生长因子是肾上腺髓质素(am)。在一些实施方案中,生长因子是血管生成素(ang)。在一些实施方案中,生长因子是自分泌运动因子。在一些实施方案中,生长因子是骨形态发生蛋白(bmp)。在一些实施方案中,bmp选自bmp2、bmp4、bmp5和bmp7。在一些实施方案中,生长因子是睫状神经营养因子家族成员。在一些实施方案中,睫状神经营养因子家族成员选自睫状神经营养因子(cntf)、白血病抑制性因子(lif)、白介素-6(il-6)。在一些实施方案中,生长因子是集落刺激因子。在一些实施方案中,集落刺激因子选自巨噬细胞集落刺激因子(m-csf)、粒细胞集落刺激因子(g-csf)和粒细胞巨噬细胞集落刺激因子(gm-csf)。在一些实施方案中,生长因子是表皮生长因子(egf)。在一些实施方案中,生长因子是肝配蛋白。在一些实施方案中,肝配蛋白选自肝配蛋白a1、肝配蛋白a2、肝配蛋白a3、肝配蛋白a4、肝配蛋白a5、肝配蛋白b1、肝配蛋白b2和肝配蛋白b3。在一些实施方案中,生长因子是促红细胞生成素(epo)。在一些实施方案中,生长因子成纤维细胞生长因子(fgf)。在一些实施方案中,fgf选自fgf1、fgf2、fgf3、fgf4、fgf5、fgf6、fgf7、fgf8、fgf9、fgf10、fgf11、fgf12、fgf13、fgf14、fgf15、fgf16、fgf17、fgf18、fgf19、fgf20、fgf21、fgf22和fgf23。在一些实施方案中,生长因子胎牛生长激素(fbs)。在一些实施方案中,生长因子是gdnf家族成员。在一些实施方案中,gdnf家族成员选自神经胶质细胞系衍生的神经营养因子(gdnf)、neurturin、persephin和artemin。在一些实施方案中,生长因子是生长分化因子-9(gdf9)。在一些实施方案中,生长因子是肝细胞生长因子(hgf)。在一些实施方案中,生长因子是肝细胞瘤衍生的生长因子(hdgf)。在一些实施方案中,生长因子是胰岛素。在一些实施方案中,生长因子是胰岛素样生长因子。在一些实施方案中,胰岛素样生长因子是胰岛素样生长因子-1(igf-1)或igf-2。在一些实施方案中,生长因子是白介素(il)。在一些实施方案中,il选自il-1、il-2、il-3、il-4、il-5、il-6和il-7。在一些实施方案中,生长因子是角化细胞生长因子(kgf)。在一些实施方案中,生长因子是迁移刺激因子(msf)。在一些实施方案中,生长因子是巨噬细胞刺激蛋白质(msp或肝细胞生长因子样蛋白(hgflp))。在一些实施方案中,生长因子是肌生成抑制蛋白(gdf-8)。在一些实施方案中,生长因子是神经调节蛋白。在一些实施方案中,神经调节蛋白选自神经调节蛋白1(nrg1)、nrg2、nrg3和nrg4。在一些实施方案中,生长因子是神经营养因子。在一些实施方案中,生长因子脑衍生的神经营养因子(bdnf)。在一些实施方案中,生长因子是神经生长因子(ngf)。在一些实施方案中,ngf是神经营养因子3(nt-3)或nt-4。在一些实施方案中,生长因子是胎盘生长因子(pgf)。在一些实施方案中,生长因子是血小板衍生的生长因子(pdgf)。在一些实施方案中,生长因子是renalase(rnls)。在一些实施方案中,生长因子是t细胞生长因子(tcgf)。在一些实施方案中,生长因子使促血小板生成素(tpo)。在一些实施方案中,生长因子是转化生长因子。在一些实施方案中,转化生长因子是转化生长因子α(tgf-α)或tgf-β。在一些实施方案中,生长因子是肿瘤坏死因子-α(tnf-α)。在一些实施方案中,生长因子是血管内皮生长因子(vegf)。d.微小rna(mirna)微小rna(mirna)是小非编码rna分子(约18-22个核苷酸),其通过抑制翻译或诱导信使rna(mrna)降解来负调控基因表达。自其发现以来,mirna参与了多种细胞过程,包括凋亡、分化和细胞增殖,并且它们已经显示出在致癌作用中发挥了关键作用。mirna调控基因表达的能力使mirna的体内表达成为基因疗法中有价值的工具。本公开的某些方面涉及包含第一itr、第二itr和编码mirna的基因盒的质粒样核酸分子,其中第一itr和/或第二itr是非腺相关病毒的itr(例如,第一itr和/或第二itr来自非aav)。mirna可以是本领域中已知的任何mirna。在一些实施方案中,mirna下调靶基因的表达。在某些实施方案中,靶基因选自sod1、htt、rho或其任何组合。在一些实施方案中,基因盒编码一种mirna。在一些实施方案中,基因盒编码一种以上mirna。在一些实施方案中,基因盒编码两种或更多种不同mirna。在一些实施方案中,基因盒编码两个或更多个拷贝的相同mirna。在一些实施方案中,基因盒编码相同治疗性蛋白质的两种或更多种变体。在某些实施方案中,基因盒编码一种或多种mirna以及一种或多种治疗性蛋白质。在一些实施方案中,mirna是天然存在的mirna。在一些实施方案中,mirna是工程化mirna。在一些实施方案中,mirna是人工mirna。在某些实施方案中,mirna包含由evers等,moleculartherapy26(9):1-15(2018年6月epub提前印刷)公开的mihtt工程化mirna。在某些实施方案中,mirna包含由dirren等,annalsofclinicalandtranslationalneurology2(2):167-84(2015年2月)公开的mirsod1人工mirna。在某些实施方案中,mirna包含mir-708,其靶向rho(参见behrman等,jcb192(6):919-27(2011)。在一些实施方案中,mirna通过下调基因的抑制子的表达来上调该基因的表达。在一些实施方案中,抑制子是天然的,例如,野生型、抑制剂。在一些实施方案中,抑制子是由突变的、异源的和/或错误表达的基因产生的。e.异源部分在一些实施方案中,核酸分包含第一itr、第二itr和编码治疗性蛋白质的基因盒,其中治疗性蛋白质包含至少一个异源部分。在一些实施方案中,异源部分与治疗性蛋白质的n端或c端融合。在其它实施方案中,异源部分被插入在治疗性蛋白质内的两个氨基酸之间。在一些实施方案中,治疗性蛋白质包含fviii多肽和异源部分,该异源部分被插入在fviii多肽内的两个氨基酸之间。在一些实施方案中,异源部分在选自表5的一个或多个插入位点处被插入在fviii多肽内。在一些实施方案中,异源氨基酸序列可在国际公开号wo2013/123457a1、wo2015/106052a1或美国公开号2015/0158929a1中公开的任何位点处被插入在本公开的核酸分子编码的凝血因子多肽内。在一个特定的实施方案中,治疗性蛋白质包含fviii和异源部分,其中异源部分在紧邻相对于成熟fviii的氨基酸745的下游被插入在fviii内。在一个特定的实施方案中,治疗性蛋白质包含fviii和xten,其中xten在紧邻相对于成熟fviii的氨基酸745的下游被插入在fviii内。在一个特定的实施方案中,fviii包含氨基酸746-1646(对应于成熟人fviii(seqidno:15))的缺失,且异源部分在紧邻氨基酸745(对应于成熟人fviii(seqidno:15))的下游被插入。表5:fviii异源部分插入位点插入位点域插入位点域插入位点域3a1375a21749a318a1378a21796a322a1399a21802a326a1403a21827a340a1409a21861a360a1416a21896a365a1442a21900a381a1487a21904a3116a1490a21905a3119a1494a21910a3130a1500a21937a3188a1518a22019a3211a1599a22068c1216a1603a22111c1220a1713a22120c1224a1745b2171c2230a11656a3区2188c2333a11711a32227c2336a11720a32332ct339a11725a3在一些实施方案中,治疗性蛋白质包含fix多肽和异源部分,该异源部分被插入在fix多肽内的两个氨基酸之间。在一些实施方案中,异源部分在选自表5一个或多个插入位点处被插入在fix多肽内。在一些实施方案中,异源氨基酸序列可在国际申请号pct/us2017/015879中公开的任何位点处被插入在本公开的核酸分子编码的凝血因子多肽内,该专利通过提述以其整体并入本文。在一个特定的实施方案中,治疗性蛋白质包含fix多肽和异源部分,其中异源部分在紧邻相对于成熟fix的氨基酸166的下游被插入在fix多肽内。在一个特定的实施方案中,治疗性蛋白质包含fix多肽和xten,其中xten在紧邻相对于成熟fviii的氨基酸166的下游被插入在fix内。表6:fix异源部分插入位点插入位点域插入位点域插入位点域52egf1149ap257催化性59egf1162ap265催化性66egf1166ap277催化性80egf1174ap283催化性85egf2188催化性292催化性89egf2202催化性316催化性103egf2224催化性341催化性105egf2226催化性354催化性113egf2228催化性392催化性129接头230催化性403催化性142接头240催化性413催化性在其它实施方案中,本公开的治疗性蛋白质进一步包含2个、3个、4个、5个、6个、7个或8个异源核苷酸序列。在一些实施方案中,所有异源部分是相同的。在一些实施方案中,至少一个异源部分不同于其它异源部分。在一些实施方案中,本公开可以以串联形式包含2个、3个、4个、5个、6个或7个以上异源部分。在一些实施方案中,异源部分增加治疗性蛋白质的半衰期(其是“半衰期延长子”)。在一些实施方案中,异源部分是当并入本公开的蛋白质中时具有与体内半衰期延长相关的非结构化或结构化特征的肽或多肽。非限制性实例包括白蛋白、白蛋白片段、免疫球蛋白的fc片段、人绒毛膜促性腺激素的β亚基的c端肽(ctp)、hap序列、xten序列、转铁蛋白或其片段、pas多肽、聚甘氨酸接头、聚丝氨酸接头、白蛋白结合部分,或这些多肽的任何片段、衍生物、变体或组合。在一个特定的实施方案中,异源氨基酸序列是免疫球蛋白恒定区或其部分、转铁蛋白、白蛋白或pas序列。在一些方面中,异源部分包括血管性血友病因子或其片段。在其它相关方面中,异源部分可包括非多肽部分(如聚乙二醇(peg)、羟乙基淀粉(hes)、多唾液酸,或这些元件的衍生物、变体或组合)的附着位点(例如,半胱氨酸氨基酸)。在一些方面中,异源部分包含半胱氨酸氨基酸,其充当非多肽部分(如聚乙二醇(peg)、羟乙基淀粉(hes)、多唾液酸,或这些元件的衍生物、变体或组合)的附着点。在一个具体的实施方案中,第一异源部分是半衰期延长分子,其是本领域中已知的,且第二异源部分是半衰期延长分子,其是本领域中已知的。在某些实施方案中,第一异源部分(例如,第一fc部分)和第二异源部分(例如,第二fc部分)彼此缔合以形成二聚体。在一个实施方案中,第二异源部分是第二fc部分,其中第二fc部分与第一异源部分(例如,第一fc部分)连接或缔合。例如,第二异源部分(例如,第二fc部分)通过接头与第一异源部分(例如,第一fc部分)连接,或通过非共价键与第一异源部分缔合。在一些实施方案中,异源部分是包含至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2500个、至少约3000个或至少约4000个氨基酸或基本由其组成或由其组成的多肽。在其它实施方案中,异源部分是包含约100个至约200个氨基酸、约200个至约300个氨基酸、约300个至约400个氨基酸、约400个至约500个氨基酸、约500个至约600个氨基酸、约600个至约700个氨基酸、约700个至约800个氨基酸、约800个至约900个氨基酸或约900个至约1000个氨基酸或基本由其组成或由其组成的多肽。在某些实施方案中,异源部分改善治疗性蛋白质的一种或多种药代动力学性质,而不显著影响其生物学活性或功能。在某些实施方案中,异源部分增加本公开的治疗性蛋白质的体内和/或体外半衰期。在其它实施方案中,异源部分促进本公开的治疗性蛋白质或其片段(例如,包含蛋白水解切割fviii蛋白后的异源部分的片段)的可视化或定位。本公开的治疗性蛋白质或其片段的可视化和/或定位可以在体内、体外、离体或其组合。在其它实施方案中,异源部分增加本公开的治疗性蛋白质或其片段(例如,包含蛋白水解切割治疗性蛋白质(例如,凝血因子)后的异源部分的片段)的稳定性。如本文所用的,术语“稳定性”是指响应于环境条件(例如,提高的或降低的温度)而维持治疗性蛋白质的一种或多种物理性质的本领域公认的测量。在某些方面,物理性质可以是治疗性蛋白质的共价结构的维持(例如,不存在蛋白水解切割、不需要的氧化或脱酰胺作用)。在其他方面,物理性质也可以是处于正确折叠状态的治疗性蛋白质的存在(例如,不存在可溶或不可溶的聚集体或沉淀物)。在一个方面中,通过测定治疗性蛋白质的生物物理性质,例如热稳定性、ph展开曲线、糖基化的稳定去除、溶解度、生化功能(例如,与蛋白质、受体或配体结合的能力)等,和/或其组合,来测量治疗性蛋白质的稳定性。在另一方面中,通过相互作用的结合亲和力证明了生化功能。在一个方面中,蛋白质稳定性的量度是热稳定性,即,对热挑战的抵抗力。可使用本领域已知的方法(如,hplc(高效液相色谱)、sec(尺寸排阻色谱)、dls(动态光散射)等)来测量稳定性。测量热稳定性的方法包括,但不限于差示扫描量热法(dsc)、差示扫描荧光法(dsf)、圆二色性(cd)和热挑战测定法。在某些方面中,本公开的核酸分子编码的治疗性蛋白质包含至少一个半衰期延长子,即,相对于缺少此类异源部分的相应治疗性蛋白质的体内半衰期,增加治疗性蛋白质的体内半衰期的异源部分。可通过本领域技术人员已知的任何方法确定治疗性蛋白质的体内半衰期,例如,活性测定法(例如,生色测定或一级凝血aptt测定,其中治疗性蛋白质包含fviii多肽)、elisa、等。在一些实施方案中,与缺乏此类一个或多个半衰期延长子的相应蛋白质的半衰期相比,一个或多个半衰期延长子的存在导致治疗性蛋白质的半衰期增加。包含半衰期延长子的治疗性蛋白质的半衰期是缺少此类半衰期延长子的相应治疗性蛋白质的体内半衰期的至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍长。在一个实施方案中,包含半衰期延长子的治疗性蛋白质的半衰期是缺少此类半衰期延长子的相应蛋白质的体内半衰期的约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍约约10倍长。在另一实施方案中,包含半衰期延长子的治疗性蛋白质的半衰期相较于缺少此类半衰期延长子的相应蛋白质的体内半衰期延长为约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。在其它实施方案中,包含半衰期延长子的治疗性蛋白质的半衰期为至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。在另外的其它实施方案中,包含半衰期延长子的治疗性蛋白质的半衰期为约15小时至约两周、约16小时至约一周、约17小时至约一周、约18小时至约一周、约19小时至约一周、约20小时至约一周、约21小时至约一周、约22小时至约一周、约23小时至约一周、约24小时至约一周、约36小时至约一周、约48小时至约一周、约60小时至约一周、约24小时至约6天、约24小时至约五天、约24小时至约四天、约24小时至约三天或约24小时至约两天。在一些实施方案中,包含半衰期延长子的治疗性蛋白质的的每位受试者的平均半衰期为约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约六天、约七天(一周)、约八天、约九天、约10天、约11天、约12天、约13天或约14天。一个或多个半衰期延长子可与治疗性蛋白质的c端或n端融合,或被插入在治疗性蛋白质内。1.免疫球蛋白恒定区或其部分在另一方面中,异源部分包含一个或多个免疫球蛋白恒定区或其部分(例如,fc区)。在一个实施方案中,本公开的分离的核酸分子进一步包含编码免疫球蛋白恒定区或其部分的异源核酸序列。在一些实施方案中,免疫球蛋白恒定区或其部分是fc区。免疫球蛋白恒定区由表示为ch(恒定重)域(ch1、ch2等)的域组成。根据同种型,(即,igg、igm、igaigd或ige),恒定区可由三个或四个ch域组成。一些同种型(例如igg)恒定区还含有铰链区。参见janeway等2001,immunobiology,garlandpublishing,n.y.,n.y.。本公开的免疫球蛋白恒定区或其部分可从许多不同的来源获得。在一个实施方案中,免疫球蛋白恒定区或其部分衍生自人免疫球蛋白。然而,应理解的是,免疫球蛋白恒定区或其一部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述另一哺乳动物物种包括例如,啮齿动物(例如,小鼠、大鼠、兔、豚鼠)或非人类灵长类动物(例如黑猩猩、猕猴)物种。此外,免疫球蛋白恒定区或其部分可以衍生自任何免疫球蛋白类别,包括igm、igg、igd、iga和ige,以及任何免疫球蛋白同种型,包括igg1、igg2、igg3和igg4。在一个实施方案中,使用人同种型igg1。多种免疫球蛋白恒定区基因序列(例如,人恒定区基因序列)可以公众可获得的存储形式获得。可选择具有特定效应子功能(或缺乏特定效应子功能)或具有降低免疫原性的特定修饰的恒定区结构域序列。已经公开了许多抗体和抗体编码基因的序列,并且可使用本领域公认的技术从这些序列衍生出合适的ig恒定区的序列(例如,铰链、ch2和/或ch3序列或其部分)。然后可以改变或合成使用任何前述方法获得的遗传材料以获得本公开的多肽。将进一步认识到,本公开的范围涵盖恒定区dna序列的等位基因、变体和突变。免疫球蛋白恒定区或其部分的序列可例如使用聚合酶链式反应和选择来扩增感兴趣的域的引物来克隆。为了从抗体克隆免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾脏或淋巴细胞中分离出mrna,反转录成dna,然后通过pcr扩增抗体基因。pcr扩增方法描述于美国专利号4,683,195;4,683,202;4,800,159;4,965,188;以及,例如,“pcrprotocols:aguidetomethodsandapplications”innis等编,academicpress,sandiego,ca(1990);ho等1989.gene77:51;horton等1993.methodsenzymol.217:270)。可通过共有恒定区引物或通过基于已公开的重链和轻链dna和氨基酸序列的更特异性引物来起始pcr。pcr也可用于分离编码抗体轻链和重链的dna克隆。在这种情况下,可通过共有引物或更大的同源探针(如,小鼠恒定区探针)筛选文库。适用于扩增抗体基因的许多引物组是本领域已知的(例如,基于纯化的抗体的n端序列的5’引物(benhar和pastan.1994.proteinengineering7:1509);cdna末端的快速扩增(ruberti,f.等1994.j.immunol.methods173:33);抗体前导序列(larrick等1989biochem.biophys.res.commun.160:1250)。抗体序列的克隆进一步描述于1995年1月25日提交的newman等,美国专利号5,658,570,其通过提述并入本文。本文中使用的免疫球蛋白恒定区可包括所有域和铰链区或其部分。在一个实施方案中,免疫球蛋白恒定区或其部分包含ch2域、ch3域和铰链区,即,fc区或fcrn结合配偶体。如本文所用的,术语“fc区”被定义为对应于天然ig的fc区的多肽部分,即由其两条重链的各个fc域的二聚体缔合形成的部分。天然fc区与另一fc区形成同源二聚体。相反地,术语“基因融合的fc区”或“单链fc区”(scfc区)是指由在单个多肽链(即,以单个连续的基因序列编码的)内基因连接的fc域组成的合成的二聚fc区。参见国际公开号wo2012/006635,通过提述以其整体并入本文。在一个实施方案中,“fc区”是指单个ig重链的部分,其开始于紧邻木瓜蛋白酶切割位点(即,igg中的残基216,重链恒定区的第一个残基为114)的上游的铰链区,并止于抗体的c端。因此,完整的fc区至少包含铰链域、ch2域和ch3域。免疫球蛋白恒定区或其部分可为fcrn结合配偶体。fcrn在成人上皮组织中有活性,并在肠腔、肺气道、鼻表面、阴道表面、结肠和直肠表面表达(美国专利号6,485,726)。fcrn结合配偶体是免疫球蛋白的部分,其结合fcrn。fcrn受体已从几种哺乳动物物种(包括人类)中分离出来。人fcrn、猴fcrn、大鼠fcrn和小鼠fcrn的序列是已知的(story等1994,j.exp.med.180:2377)。fcrn受体以相对低的ph值结合igg(但不结合其它免疫球蛋白类别,如iga、igm、igd和ige),在腔内向浆膜方向主动地跨细胞转运igg,然后以在组织液中发现的相对较高的ph值下释放igg。它表达于成人上皮组织(美国专利号6,485,726、6,030,613、6,086,875;wo03/077834;us2003-0235536a1),包括肺和肠上皮(israel等1997,immunology92:69)肾近端肾小管上皮(kobayashi等2002,am.j.physiol.renalphysiol.282:f358)以及鼻上皮、阴道表面和胆道树表面。可用于本公开的fcrn结合配偶体涵盖可被fcrn受体特异性结合的分子,所述fcrn受体包括完整的igg、igg的fc片段以及包括fcrn受体的完整结合区的其他片段。已经基于x射线晶体学描述了结合fcrn受体的igg的fc部分的区域(burmeister等1994,nature372:379)。fc与fcrn的主要接触面在ch2和ch3域的接合处附近。fc-fcrn接触全部在单个ig重链内。fcrn结合配偶体包括完整的igg、igg的fc片段以及包括fcrn的完整结合区的igg的其它片段。主要接触位点包括ch2域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314,以及ch3域的氨基酸残基385-387、428和433-436。对免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号的引用全部基于kabat等1991,sequencesofproteinsofimmunologicalinterest,u.s.departmentofpublichealth,bethesda,md。可通过fcrn有效地将与fcrn结合的fc区或fcrn结合配偶体穿过上皮屏障,从而提供了一种非侵入性方式来全身性施用所期望的治疗性分子。此外,包含fc区或fcrn结合配偶体的融合蛋白被表达fcrn的细胞内吞。但是这些融合蛋白没有被标记为降解,而是再次回收到循环中,从而增加这些蛋白的体内半衰期。在某些实施方案中,免疫球蛋白恒定区的部分是fc区或fcrn结合配偶体,其通常经由二硫键或其它非特异性相互作用与另一fc区或另一fcrn结合配偶体缔合以形成二聚体或更高阶的多聚体。两个fcrn受体可结合单个fc分子。晶体学数据表明每个fcrn分子结合fc同源二聚体的单个多肽。在一个实施方案中,将fcrn结合配偶体(例如,igg的fc片段)连接至生物活性分子提供了口服地、经颊地、舌下地、直肠地、阴道地、作为经鼻或经肺途径施用的气溶胶或经由眼睛途径递送生物活性分子的方式。在另一实施方案中,凝血因子蛋白质可侵入性地施用,例如皮下、静脉内施用。fcrn结合配偶体区是可由fcrn受体特异性结合并因此被fc区的fcrn受体主动转运的分子或其部分。特异性结合是指形成在生理条件下相对稳定的复合物的两个分子。特异性结合的特征在于高亲和力和低至中等能力,其区别于通常具有低亲和力和中度至高能力的非特异性结合。通常,当亲和力常熟ka高于106m-1或高于108m-1时,则将结合视为是特异性的。如果需要,可以通过改变结合条件来减少非特异性结合,而基本上不影响特异性结合。合适的结合条件如分子的浓度、溶液的离子强度、结合允许的温度、时间、封闭剂(例如,血清白蛋白、牛奶酪蛋白)的浓度等,可以由熟练的技术人员使用常规技术来优化。在某些实施方案中,本公开的核酸分子编码的治疗性蛋白质包含一个或多个截短的fc区,其仍然足以赋予fc受体(fcr)对fc区的结合特性。例如,结合fcrn的fc区的部分(即,fcrn结合部分)包含来自igg1的约氨基酸282-438(eu编号)(主要接触位点为ch2域的氨基酸248、250-257、272、285、288、290-291、308-311和314和ch3域的氨基酸残基385-387、428和433-436)。因此,本公开的fc区可包含fcrn结合部分或由其组成。fcrn结合部分可衍生自任何同种型(包括igg1、igg2、igg3和igg4)的重链。在一个实施方案中,使用来自人同种型igg1的抗体的fcrn结合部分。在另一实施方案中,使用来自人同种型igg4的抗体的fcrn结合部分。fc区可以从许多不同的来源获得。在一个实施方案中,多肽的fc区衍生自人免疫球蛋白。然而,应理解,fc部分可衍生自另一哺乳动物物种的免疫球蛋白,包括例如啮齿动物(例如,小鼠、大鼠、兔子、豚鼠)或非人类灵长类动物(例如,黑猩猩、猕猴)物种。而且,fc域或其部分的多肽可衍生自任何免疫球蛋白类别(包括igm、igg、igd、iga和ige)以及免疫球蛋白同种型(包括igg1、igg2、igg3和igg4)。在另一实施方案中,使用人同种型igg1。在某些实施方案中,fc变体赋予包含所述野生型fc结构域的fc部分所给予的至少一种效应子功能的改变(例如,提高或降低fc区结合fc受体(例如fcγri、fcγrii或fcγriii)或补体蛋白(例如,c1q),或触发抗体依赖性细胞毒性(adcc)、吞噬作用或补体依赖性细胞毒性(cdcc)的能力)。在其它实施方案中,fc变体提供工程化半胱氨酸残基。本公开的fc区可使用本领域公认的fc变体,其已知会引起效应子功能和/或fcr或fcrn结合的改变(例如,增强或降低)。具体而言,本公开的fc区可包括,例如,下列公开的一个或多个氨基酸位置上的改变(例如,取代):国际pct公开wo88/07089a1、wo96/14339a1、wo98/05787a1、wo98/23289a1、wo99/51642a1、wo99/58572a1、wo00/09560a2、wo00/32767a1、wo00/42072a2、wo02/44215a2、wo02/060919a2、wo03/074569a2、wo04/016750a2、wo04/029207a2、wo04/035752a2、wo04/063351a2、wo04/074455a2、wo04/099249a2、wo05/040217a2、wo04/044859、wo05/070963a1、wo05/077981a2、wo05/092925a2、wo05/123780a2、wo06/019447a1、wo06/047350a2和wo06/085967a2;美国专利公开号us2007/0231329、us2007/0231329、us2007/0237765、us2007/0237766、us2007/0237767、us2007/0243188、us20070248603、us20070286859、us20080057056;或美国专利5,648,260;5,739,277;5,834,250;5,869,046;6,096,871;6,121,022;6,194,551;6,242,195;6,277,375;6,528,624;6,538,124;6,737,056;6,821,505;6,998,253;7,083,784;7,404,956和7,317,091,其中每个通过提述并入本文。在一个实施方案中,可在所公开的一个或多个氨基酸位置处进行具体的改变(例如,本领域公开的一个或多个氨基酸的具体取代)。在另一实施方案中,可在一个或多个公开的氨基酸位置处进行不同的改变(例如,本领域公开的一个或多个氨基酸位置的不同取代)。可根据公认的程序如定点诱变等,修饰igg的fc区或fcrn结合配偶体,以产生修饰的igg或fc片段或其将被fcrn结合的部分。此类修饰包括远离fcrn接触位点的修饰以及保持或甚至增强与fcrn结合的接触位点内的修饰。例如,可取代人igg1fc(fcγ1)中的以下单个氨基酸残基,而不会显著降低fc对fcrn的结合亲和力:p238a、s239a、k246a、k248a、d249a、m252a、t256a、e258a、t260a、d265a、s267a、h268a、e269a、d270a、e272a、l274a、n276a、y278a、d280a、v282a、e283a、h285a、n286a、t289a、k290a、r292a、e293a、e294a、q295a、y296f、n297a、s298a、y300f、r301a、v303a、v305a、t307a、l309a、q311a、d312a、n315a、k317a、e318a、k320a、k322a、s324a、k326a、a327q、p329a、a330q、p331a、e333a、k334a、t335a、s337a、k338a、k340a、q342a、r344a、e345a、q347a、r355a、e356a、m358a、t359a、k360a、n361a、q362a、y373a、s375a、d376a、a378q、e380a、e382a、s383a、n384a、q386a、e388a、n389a、n390a、y391f、k392a、l398a、s400a、d401a、d413a、k414a、r416a、q418a、q419a、n421a、v422a、s424a、e430a、n434a、t437a、q438a、k439a、s440a、s444a和k447a,其中例如p238a代表在位置编号238被丙氨酸取代的野生型脯氨酸。例如,一个特定的实施方案并入n297a突变,去除了高度保守的n-糖基化位点。除丙氨酸外,其它氨基酸也可在上述指定位置处替代野生型氨基酸。可将突变逐一地引入fc中,从而产生与天然fc不同的多于一百个fc区。此外,可将两个、三个或更多个这些单个突变的组合一起引入,从而产生数百个更多的fc区。上述某些突变可对fc区或fcrn结合配偶体赋予新功能。例如,一个实施方案并入n297a,去除了高度保守的n-糖基化位点。此突变的作用是降低免疫原性,从而增强fc区的循环半衰期,并使fc区无法结合fcγri、fcγriia、fcγriib和fcγriiia,而不会损害对fcrn的亲和力(routledge等1995,transplantation60:847;friend等1999,transplantation68:1632;shields等1995,j.biol.chem.276:6591)。作为由上述突变产生的新功能的又一实例,在一些情况下,可增加对fcrn的亲和力以超过野生型的亲和力。此增加的亲和力可反映出增加的“打开”速率、减少的“关闭”速率或增加的“打开”速率和减小的“关闭”速率二者。认为赋予了对fcrn增加的亲和力的突变的实例包括,但不限于,t256a、t307a、e380a和dn434a(shields等2001,j.biol.chem.276:6591)。此外,至少三个人fcγ受体似乎识别较下铰链区中的igg上的结合位点,通常是氨基酸234-237。因此,新功能和潜在降低的免疫原性的另一实例可由此区域的突变产生,例如通过将人igg1“ellg”的氨基酸233-236(seqidno:45)替换为igg2“pva”的相应序列(具有一个氨基酸缺失)。已经显示,当已经引入此类突变时,介导多种效应子功能的fcγri、fcγrii和fcγriii将不结合igg1。ward和ghetie1995,therapeuticimmunology2:77和armour等1999,eur.j.immunol.29:2613。在另一实施方案中,免疫球蛋白恒定区或其部分包含铰链区或其部分中的氨基酸序列,其与第二免疫球蛋白恒定区或其部分形成一个或多个二硫键。第二免疫球蛋白恒定区或其部分可与第二多肽连接,这将治疗性蛋白质和第二多肽结合在一起。在一些实施方案中,第二多肽是增强子部分。如本文所用的,术语“增强子部分”是指能够增强治疗性蛋白质的活性的分子、其片段或多肽的组成。增强子部分可为辅因子,如,其中治疗性蛋白质是凝血因子、可溶性组织因子(stf)或促血凝肽。因此,在激活凝血因子后,增强子部分可用来增强凝血因子活性。在某些实施方案中,由本公开的核酸分子编码的治疗性蛋白质包含对免疫球蛋白恒定区或其部分(例如,fc变体)的氨基酸取代,其改变了ig恒定区的抗原非依赖性效应子功能,特别是蛋白质的循环半衰期。2.scfc区在另一方面中,异源部分包含scfc(单链fc)区。在一个实施方案中,本公开的分离的核酸分子进一步包含编码scfc区的异源核酸序列。scfc区在同一线性多肽链内包含至少两个免疫球蛋白恒定区或其部分(例如,fc部分或域(例如,2、3、4、5、6或更多个fc部分或域)),其能够折叠(例如,分子内或分子间折叠)以形成一个功能性scfc区,该功能性scfc区通过fc肽接头连接。例如,在一个实施方案中,本公开的多肽能够经由其scfc与至少一个fc受体(例如,fcrn、fcγr受体(例如,fcγriii)或补体蛋白(例如,c1q))结合,以便改善或触发免疫效应功能(例如,抗体依赖性细胞毒性(adcc)、吞噬作用或补体依赖性细胞毒性(cdcc)和/或改善可制造性)。3.ctp在另一方面中,异源部分包含人绒毛膜促性腺激素的β亚基的一个c端肽(ctp),或其片段、变体或衍生物。抑制插入至重组蛋白质中的一个或多个ctp肽增加此蛋白质的体内半衰期。参见,例如,美国专利号5,712,122,其通过提述以其整体并入本文。示例性ctp肽包括dprfqdsssskapppslpspsrlpgpsdtpil(seqidno:33)或sssskapppslpspsrlpgpsdtpilpq(seqidno:34)。参见,例如,美国申请公开号us2009/0087411a1,其通过提述并入。4.xten序列在一些实施方案中,异源部分包含一个或多个xten序列、其片段、变体或衍生物。如在此使用的“xten序列”是指具有非天然存在的、基本上非重复的序列(其主要由小的亲水性氨基酸组成)的延长长度的多肽,该序列在生理条件下具有低级或无二级或三级结构。作为异源部分,xten可用作半衰期延长部分。此外,xten可提供期望的性质,包括但不限于增强的药代动力学参数和溶解度特征。将包含xten序列的异源部分并入本公开的蛋白质中可赋予该蛋白质以下有利性质中的一种或多种:构象柔性、增强的水溶性、高度的蛋白酶抗性、低的免疫原性、与哺乳动物受体的低结合性或增加的流体动力学(或斯托克斯(stokes))半径。在某些方面,xten序列可增加药代动力学性质如较长的体内半衰期或增加的曲线下面积(auc),使得相较于相同但不具有xten异源部分的蛋白质,本发明的蛋白质在体内停留并具有促凝血活性的时段增长。在一些实施方案中,可用于本公开的xten序列是具有大于约20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、1200个、1400个、1600个、1800个或2000个氨基酸残基的肽或多肽。在某些实施方案中,xten是具有大于约20个至约3000个氨基酸残基、大于30个至约2500个残基、大于40个至约2000个残基、大于50个至约1500个残基、大于60个至约1000个残基、大于70个至约900个残基、大于80个至约800个残基、大于90个至约700个残基、大于100个至约600个残基、大于110个至约500个残基或大于120个至约400个残基的肽或多肽。在一个特定的实施方案中,xten包含长度长于42个氨基酸且短于144个氨基酸的氨基酸序列。本公开的xten序列可包含一个或多个序列基序,其为5至14个(例如,9至14个)氨基酸残基或与该序列基序至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列,其中基序包含4至6种类型的氨基酸(例如,5种氨基酸)、基本由其组成或由其组成,所述氨基酸选自甘氨酸(g)、丙氨酸(a)、丝氨酸(s)、苏氨酸(t)、谷氨酸(e)和脯氨酸(p)。参见us2010-0239554a1。在一些实施方案中,xten包含非重叠性序列基序,其中约80%或至少约85%或至少约90%或约91%或约92%或约93%或约94%或约95%或约96%或约97%或约98%或约99%或约100%的该序列由选自选自表7的单个基序家族的多个单元的非重叠性序列组成,从而产生家族序列。如本文所用的,“家族”意指xten具有仅选自来自表7的单个基序分类的基序;即,ad、ae、af、ag、am、aq、bc或bdxten,且意指选择xten中不是来自家族基序的xten中的任何其它氨基酸以实现所需的性质,例如允许编码核苷酸并入限制位点,并入切割序列或实现与治疗性蛋白质的更好连接。在xten家族的一些实施方案中,xten序列包含ad基序家族、或ae基序家族、或af基序家族、或ag基序家族、或am基序家族、或aq基序家族、或bc家族、或bd家族的多个单元的非重叠性序列基序,所得的xten表现出以上所述的同源性范围。在其它实施方案中,xten包含来自表7中两个或多个基序家族的基序序列的多个单元。可选择这些序列以实现所需的物理/化学特性,包括如由基序的氨基酸组成赋予的净电荷、亲水性、二级结构的缺乏或重复性的缺乏等性质,这将在下面更全面地描述。在此段落的上文所述的实施方案中,可使用本文所述的方法选择并组装并入xten中的基序,以获得约36至约3000个氨基酸残基的xten。表7.12个氨基酸的xten序列基序和基序家族*表示各个基序序列,这些基序序列在各种排列中一起使用时,会产生“家族序列”可用作本公开的治疗性蛋白质中的异源部分的xten序列的实例公开开,例如,美国专利公开号2010/0239554a1、2010/0323956a1、2011/0046060a1、2011/0046061a1、2011/0077199a1或2011/0172146a1或国际专利公开号wo2010091122a1、wo2010144502a2、wo2010144508a1、wo2011028228a1、wo2011028229a1或wo2011028344a2,其中每一个均通过提述以其整体并入本文。xten可具有不同的长度,用于插入治疗性蛋白质或与治疗性蛋白质连接。在一个实施方案中,基于融合蛋白中要实现的性质或功能选择xten序列的长度。根据预期的性质或功能,xten可为短或中等长度序列,也可为可用作载体的较长序列。在某些实施方案中,xten包括约6至约99个氨基酸残基的短区段,约100至约399个氨基酸残基的中间长度,和约400至约1000个氨基酸残基且最多约3000个氨基酸残基的较长长度。因此,插入治疗性蛋白质中或与治疗性蛋白质连接的xten可具有约6、约12、约36、约40、约42、约72、约96、约144、约288、约400、约500、约576、约600、约700、约800、约864、约900、约1000、约1500、约2000、约2500或最多约3000个氨基酸残基的长度。在其它实施方案中,xten序列的长度为约6至约50个、约50至约100个、约100至150个、约150至250个、约250至400个、约400至约500个、约500至约900个、约900至1500个、约1500至2000个或约2000至约3000个氨基酸残基。插入治疗性蛋白质中或与治疗性蛋白质连接的xten的精确长度可变化,而不会不利地影响治疗性蛋白质的活性。在一个实施方案中,本文中所用的一个或多个xten可具有的长度为42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸或864个氨基酸,且可选自一个或多个xten家族序列;即,ad、ae、af、ag、am、aq、bc或bd。在一些实施方案中,治疗性蛋白质包含fviii多肽和xten,其中xten包含288个氨基酸。在一个实施方案中,治疗性蛋白质包含fviii多肽和xten,其中xten包含288个氨基酸,且xten被插入在fviii多肽的b域内。在一个特定的实施方案中,治疗性蛋白质包含fviii多肽和包含seqidno:109的xten,且xten被插入在fviii多肽的b域内。在一个特定的实施方案中,治疗性蛋白质包含fviii多肽和包含seqidno:109的xten,且xten在紧邻成熟fviii的氨基酸745的下游被插入在fviii多肽内。在一些实施方案中,治疗性蛋白质包含fix多肽和xten,其中xten包含72个氨基酸。在一个实施方案中,治疗性蛋白质包含fix多肽和xten,其中xten包含72个氨基酸,且xten在紧邻成熟fix的氨基酸166的下游被插入在fix多肽内。在一些实施方案中,本公开中所用的xten序列与选自ae42、ag42、ae48、am48、ae72、ag72、ae108、ag108、ae144、af144、ag144、ae180、ag180、ae216、ag216、ae252、ag252、ae288、ag288、ae324、ag324、ae360、ag360、ae396、ag396、ae432、ag432、ae468、ag468、ae504、ag504、af504、ae540、ag540、af540、ad576、ae576、af576、ag576、ae612、ag612、ae624、ae648、ag648、ag684、ae720、ag720、ae756、ag756、ae792、ag792、ae828、ag828、ad836、ae864、af864、ag864、am875、ae912、am923、am1318、bc864、bd864、ae948、ae1044、ae1140、ae1236、ae1332、ae1428、ae1524、ae1620、ae1716、ae1812、ae1908、ae2004a、ag948、ag1044、ag1140、ag1236、ag1332、ag1428、ag1524、ag1620、ag1716、ag1812、ag1908、ag2004及其任何组合的序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一。参见us2010-0239554a1。在一个特定的实施方案中,xten包含ae42、ae72、ae144、ae288、ae576、ae864、ag42、ag72、ag144、ag288、ag576、ag864或其任何组合。可用作本公开的治疗性蛋白质中的异源部分的示例性xten序列包括xtenae42-4(seqidno:46,其由seqidno:47编码)、xtenae144-2a(seqidno:48,其由seqidno:49编码)、xtenae144-3b(seqidno:50,其由seqidno:51编码)、xtenae144-4a(seqidno:52,其由seqidno:53编码)、xtenae144-5a(seqidno:54,其由seqidno:55编码)、xtenae144-6b(seqidno:56,其由seqidno:57编码)、xtenag144-1(seqidno:58,其由seqidno:59编码)、xtenag144-a(seqidno:60,其由seqidno:61编码)、xtenag144-b(seqidno:62,其由seqidno:63编码)、xtenag144-c(seqidno:64,其由seqidno:65编码)和xtenag144-f(seqidno:66,其由seqidno:67编码)。在一个特定的实施方案中,xten由seqidno:18编码。在另一实施方案中,xten序列选自ae36(seqidno:130)、ae42(seqidno:131)、ae72(seqidno:132)、ae78(seqidno:133)、ae144(seqidno:134)、ae144_2a(seqidno:48)、ae144_3b(seqidno:50)、ae144_4a(seqidno:52)、ae144_5a(seqidno:54),ae144_6b(seqidno:135)、ag144(seqidno:136)、ag144_a(seqidno:137)、ag144_b(seqidno:62)、ag144_c(seqidno:64)、ag144_f(seqidno:66)、ae288(seqidno:138)、ae288_2(seqidno:139)、ag288(seqidno:140)、ae576(seqidno:141)、ag576(seqidno:142)、ae864(seqidno:143)、ag864(seqidno:144)、xten_ae72_2a_1(seqidno:145)、xten_ae72_2a_2(seqidno:146)、xten_ae72_3b_1(seqidno:147)、xten_ae72_3b_2(seqidno:148)、xten_ae72_4a_2(seqidno:149)、xten_ae72_5a_2(seqidno:150)、xten_ae72_6b_1(seqidno:151)、xten_ae72_6b_2(seqidno:152)、xten_ae72_1a_1(seqidno:153)、xten_ae72_1a_2(seqidno:154)、xten_ae144_1a(seqidno:155)、ae150(seqidno:156)、ag150(seqidno:157)、ae294(seqidno:158)、ag294(seqidno:159)及其任何组合。在具体的实施方案中,xten序列选自下组:ae72、ae144和ae288。本发明的某些xten序列的氨基酸序列显示在表8中。表8.xten序列在一些实施方案中,xten中少于100%的氨基酸选自甘氨酸(g)、丙氨酸(a)、丝氨酸(s)、苏氨酸(t)、谷氨酸(e)和脯氨酸(p),或少于100%的序列由来自表7的序列基序或本文提供的xten序列组成。在此类实施方案中,xten的其余氨基酸残基选自其它14种天然l-氨基酸,但可以优先选自亲水性氨基酸,使得xten序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%的亲水性氨基酸。在缀合构建体中利用的xten中的疏水性氨基酸的含量可以是小于5%,或小于2%,或小于1%的疏水性氨基酸含量。在xten的构建中较不受欢迎的疏水性残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。此外,xten序列可含有小于5%或小于4%或小于3%或小于2%或小于1%或无以下氨基酸:甲硫氨酸(例如,以避免氧化)或天冬酰胺和谷氨酰胺(以避免脱酰胺)。一个或多个xten序列可被插入在治疗性蛋白质的c端或n端或插入在治疗性蛋白质的氨基酸序列中的两个氨基酸之间。例如,在治疗性蛋白质包含fviii多肽时,xten可被插入在选自表5的一个或多个插入位点处的两个氨基酸之间。在治疗性蛋白质包含fix多肽时,xten可被插入在选自表5的一个或多个插入位点处的两个氨基酸之间。可根据本发明使用的xten序列的额外实例公开于美国专利公开号2010/0239554a1、2010/0323956a1、2011/0046060a1、2011/0046061a1、2011/0077199a1或2011/0172146a1,或国际专利公开号wo2010091122a1、wo2010144502a2、wo2010144508a1、wo2011028228a1、wo2011028229a1、wo2011028344a2、wo2014/011819a2或wo2015/023891。5.白蛋白或其片段、衍生物或变体在一些实施方案中,异源部分包含白蛋白或其功能性片段。人血清白蛋白(hsa或ha),一种全长形式为609个氨基酸的蛋白质,负责相当大比例的血清渗透压,并且还充当内源性和外源性配体的载体。如本文所用的术语“白蛋白”包括全长白蛋白或其功能性片段、变体、衍生物或类似物。白蛋白或其片段或变体的实例公开于美国专利公开号2008/0194481a1、2008/0004206a1、2008/0161243a1、2008/0261877a1或2008/0153751a1或pct申请公开号2008/033413a2、2009/058322a1或2007/021494a2,其通过提述以其整体并入本文。在一个实施方案中,本公开的治疗性蛋白质包含白蛋白、其片段或变体,其进一步与选自免疫球蛋白恒定区或其部分(例如,fc区)、pas序列、hes、peg及其任何组合的第二异源部分连接。6.白蛋白结合部分在某些实施方案中,异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合域、白蛋白结合抗体片段或其任何组合。例如,白蛋白结合蛋白质可以是细菌白蛋白结合蛋白质、抗体或包括域抗体的抗体片段(参见美国专利号6,696,245)。白蛋白结合蛋白质,例如,可以是细菌白蛋白结合域,如链球菌蛋白质g之一(konig,t.和skerra,a.(1998)j.immunol.methods218,73-83)。可用作缀合配偶体的白蛋白结合肽的其他实例是,例如,具有cys-xaa1-xaa2-xaa3-xaa4-cys共有序列的白蛋白结合肽,其中xaa1是asp、asn、ser、thr或trp;xaa2是asn、gln,his、ile、leu或lys;xaa3是ala、asp、phe、trp或tyr;且xaa4是asp、gly、leu、phe、ser或thr,如美国专利申请2003/0069395或dennis等(dennis等(2002)j.biol.chem.277,35035-35043)中描述的。来自链球菌蛋白质g的域3,如通过kraulis等,febslett.378:190-194(1996)和linhult等,proteinsci.11:206-213(2002)公开的,是细菌白蛋白结合域的实例。白蛋白结合肽的实例包括一系列具有核心序列diclprwgclw(seqidno:35)的肽。参见,例如,dennis等,j.biol.chem.2002,277:35035-35043(2002)。白蛋白结合抗体片段的实例公开于muller和kontermann,curr.opin.mol.ther.9:319-326(2007);roovers等,cancerimmunol.immunother.56:303-317(2007)和holt等,prot.eng.designsci.,21:283-288(2008),其通过提述以其整体并入本文。此类白蛋白结合部分的实例是2-(3-马来酰亚胺基丙酰胺基)-6-(4-(4-碘苯基)丁酰胺基)己酸盐(“albu”标签),如通过trussel等,bioconjugatechem.20:2286-2292(2009)公开的。脂肪酸,特别是长链脂肪酸(lcfa)和长链脂肪酸样白蛋白结合化合物可用于延长本公开的凝血因子蛋白的体内半衰期。lcfa样白蛋白结合化合物的实例是16-(l-(3-(9-(((2,5-二氧代吡咯烷-l-基氧基)羰基氧基)-甲基)-7-磺基-9h-芴-2-基氨基)-3-氧代丙基)-2,5-二氧代吡咯烷-3-基硫基)十六烷酸(参见,例如,wo2010/140148)。7.pas序列在其它实施方案中,异源部分是pas序列。如本文所用的,pas序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,该氨基酸序列在生理条件下形成无规卷曲构象。因此,pas序列是可用作嵌合蛋白中的异源部分的一部分的构成单元、氨基酸聚合物或包含丙氨酸、丝氨酸和脯氨酸、基本上由其组成或由其组成的序列盒。然而,技术人员知道,当添加除丙氨酸、丝氨酸和脯氨酸以外的残基作为pas序列中的次要组分时,氨基酸聚合物也可形成无规卷曲构象。如本文所用的术语“次要组分”意指可在pas序列中一定程度地添加除丙氨酸、丝氨酸和脯氨酸以外的氨基酸,例如,最多约12%,即,pas序列的100个氨基酸中约12个,最多约10%,即pas序列的100个氨基酸中约10个,最多约9%,即,100个氨基酸中约9个,最多约8%,即,100个氨基酸中约8个,约6%,即,100个氨基酸中约6个,约5%,即,100个氨基酸中约5个,约4%,即,100个氨基酸中约4个,约3%,即,100个氨基酸中约3个,约2%,即,100个氨基酸中约2个,约1%,即,100个氨基酸中约1个。不同于丙氨酸、丝氨酸和脯氨酸的氨基酸可选自arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、thr、trp、tyr和val。在生理条件下,pas序列伸展形成无规则卷曲构象,从而可介导凝血因子蛋白在体内和/或体外的增加的稳定性。由于无规则卷曲域本身不采用稳定的结构或功能,因此基本上保留了由凝血因子蛋白介导的生物学活性。在其它实施方案中,形成无规则卷曲域的pas序列具有生物学惰性,特别是在血浆中的蛋白水解、免疫原性、等电点/静电行为、与细胞表面受体的结合或内化作用方面,但仍可生物降解,这提供了比合成的聚合物(如peg)明显的优势。形成无规则卷曲构像的pas序列的非限制性实例包含选自下组:aspaapapaspaapapsapa(seqidno:36)、aapaspapaapsapapaaps(seqidno:37)、apsspspsapsspspaspss(seqidno:38)、apsspspsapsspspasps(seqidno:39)、sspsapspsspaspspsspa(seqidno:40)、aaspaapsappaaaspaapsappa(seqidno:41)、asaaapaaasaaasapsaaa(seqidno:42)及其任何组合的氨基酸序列。从例如美国专利公开号2010/0292130a1和pct申请公开号wo2008/155134a1已知pas序列的额外实例。8.hap序列在某些实施方案中,异源部分是富含甘氨酸的均氨基酸聚合物(hap)。hap序列可包含甘氨酸的重复序列,其长度为至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸。在一个实施方案中,hap序列能够延长与hap序列融合或连接的部分的半衰期。hap序列的非限制性实例包括,但不限于(gly)n、(gly4ser)n或s(gly4ser)n,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一个实施方案中,n是20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39或40。在另一实施方案中,n是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200。9.转铁蛋白或其片段在某些实施方案中,异源部分是转铁蛋白或其片段。任何转铁蛋白可用于制备本公开的凝血因子蛋白质。例如,野生型人tf(tf)是679个氨基酸蛋白质,近似75kda(不计糖基化),具有两个主要域,n(约330个氨基酸)和c(约340个氨基酸),其似乎起源于基因复制。参见genbank登录号nm001063、xm002793、m12530、xm039845、xm039847和s95936(www.ncbi.nlm.nih.gov/),其中全部通过提述以其整体并入本文。转铁蛋白包含两个域,n域和c域。n域包含两个亚域,n1域和n2域,且c域包含两个亚域,c1域和c2域。在一个实施方案中,转铁蛋白异源部分包括转铁蛋白剪接变体。在一个实例中,转铁蛋白剪接变体可为人转铁蛋白的剪接变体,例如,genbank登录号aaa61140。在另一实施方案中,嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个域,例如,n域、c域、n1域、n2域、c1域,c2域或其任何组合。10.清除受体在某些实施方案中,异源部分是清除受体、其片段、变体或衍生物。lrp1是600kda的整合膜蛋白,其与多种蛋白质(如因子x)的受体介导的清除有关。参见,例如,narita等,blood91:555-560(1998)。11.血管性血友病因子或其片段在某些实施方案中,异源部分是血管性血友病因子(vwf)或其一个或多个片段。vwf(也称作f8vwf)是存在于血浆中的大的多聚糖蛋白,并在内皮(在weibel-palade体)、巨核细胞(血小板的α颗粒)和内皮下结缔组织中组成性地产生。基本的vwf单体是2813个氨基酸的蛋白质。每个单体都含有许多具有特定功能的特定域,d'和d3域(其一起结合因子viii)、a1域(其结合血小板gpib受体、肝素和/或可能结合胶原蛋白)、a3域(其结合胶原蛋白)、c1域(当被激活后其中rgd域结合血小板整合素αiibβ3)和蛋白质c端处的“半胱氨酸结”域(其vwf享有血小板衍生的生长因子(pdgf)、转化生长因子-β(tgfβ)和β-人绒毛膜促性腺激素(βhcg))。人vwf的2813个单体氨基酸序列在genbank中报道为登录号np000543.2。编码人vwf的核苷酸序列在genbank中报道为登录号nm000552.3。seqidno:129是由seqidno:128编码的氨基酸序列。d’域包括seqidno:129的氨基酸764至866。d3域包括seqidno:44的氨基酸867至1240。在血浆中,95-98%的fviii在具有全长vwf的紧密非共价复合物中循环。此复合物的形成对于维持体内合适的血浆fviiii水平重要。lenting等,blood.92(11):3983-96(1998);lenting等,j.thromb.haemost.5(7):1353-60(2007)。当由于在重链中的位置372和740处以及在轻链中的位置1689处的蛋白水解作用而使fviii被活化时,与fviii结合的vwf从激活的fviii中被去除。在某些实施方案中,异源部分是全长血管性血友病因子。在其它实施方案中,异源部分是血管性血友病因子片段。如本文所用的,本文所用的术语“vwf片段”或“vwf片段”意指与fviii相互作用并保留至少一种或多种通常由全长vwf提供给fviii的性质(例如,防止过早激活fviiia、防止过早蛋白水解、防止与可能导致过早清除的磷脂膜缔合、防止与可结合裸fviii但不结合vwf结合的fviii的fviii清除受体结合和/或稳定fviii重链和轻链相互作用)的任何vwf片段。在具体的实施方案中,异源部分是包含vwf的d’域和d3域的(vwf)片段。包含d’域和d3域的vwf片段可进一步包含选自a1域、a2域、a3域、d1域、d2域、d4域、b1域、b2域、b3域、c1域、c2域、ck域,其一个或多个片段,及其任何组合的vwf域。与vwf片段融合的具有fviii活性的多肽的额外实例公开于2012年7月3日提交的美国临时专利申请号61/667,901和美国公开号2015/0023959a1,二者均通过提述以其整体并入本文。12.接头部分在某些实施方案中,异源部分是肽接头。如本文所用的,术语“肽接头”或“接头部分”是指连接多肽链的线性氨基酸序列中的两个域的肽或多肽序列(例如,合成的肽或多肽序列)。在一些实施方案中,肽接头可被插入在本公开的治疗性蛋白质和上文所述的异源部分(如白蛋白)之间。肽接头可为嵌合多肽分子提供柔性。接头通常不被切割,然而此类切割可为合意的。在一个实施方案中,在加工过程中不去除这些接头。可存在于本公开的嵌合蛋白中的一种接头类型是蛋白酶可切割的接头,其包含裂解位点(即,蛋白酶切割位点底物,例如,因子xia、xa或凝血酶切割位点)且其可在c末或n端或切割位点的侧翼包括额外的接头。这些可切割的接头当被并入本公开的构建体中时产生具有异源切割位点的嵌合分子。在一个实施方案中,由本公开的核酸分子编码的治疗性蛋白质包含两个或更多个fc域或部分,其通过cscfc接头连接以形成包含在单个多肽链中的fc区。cscfc接头的侧翼为至少一个细胞内加工位点,即,由细胞内酶切割的位点。在至少一个细胞内加工位点处多肽的切割产生包含至少两条多肽链的多肽。其它肽接头可任选地用于本公开的构建体中,例如,以使凝血因子蛋白连接至fc区。可以与本公开结合使用的一些示例性接头包括,例如,包含下文更详细描述的glyser氨基酸的多肽。在一个实施方案中,肽接头是合成的,即,非天然存在的。在一个实施方案中,肽接头包括肽(或多肽)(其可以或可以不天然存在),所述肽(或多肽)包含将氨基酸的第一线性序列和天然与其不天然连接的或基因融合的氨基酸的第二线性序列连接或基因融合的氨基酸序列。例如,在一个实施方案中,肽接头可包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变,如添加、取代或缺失)。在另一实施方案中,肽接头可包含非天然存在的氨基酸。在另一实施方案中,肽接头可包含天然存在的氨基酸,其以自然界中不存在的线性序列存在。在另外的其它实施方案中,肽接头可包含天然存在的多肽序列。例如,在某些实施方案中,肽接头可用于融合相同的fc部分,由此形成同源二聚体scfc区。在其它实施方案中,肽接头可用于融合不同fc部分(例如,野生型fc部分和fc部分变体),由此形成异源二聚体scfc区。在另一实施方案中,肽接头包含gly-ser接头或由其组成。在一个实施方案中,scfc或cscfc接头包含至少免疫球蛋白铰链的一部分和gly-ser接头。如本文所用的,术语“gly-ser接头”是指由甘氨酸和丝氨酸残基组成的肽。在某些实施方案中,所述gly-ser接头可被插入在肽接头的两个其它序列之间。在其它实施方案中,gly-ser接头附着在肽接头的另一序列的一端或两端。在又一其它实施方案中,两个或更多个gly-ser接头连续地被插入肽接头中。在一个实施方案中,本公开的肽接头包含上铰链区的至少一部分(例如,衍生自igg1、igg2、igg3或igg4分子)、中间铰链区的至少一部分(例如,衍生自igg1、igg2、igg3或igg4分子)和一系列gly/ser氨基酸残基。本公开的肽接头的长度为至少一个氨基酸,并且可具有不同的长度。在一个实施方案中,本公开的肽接头的长度为约1至约50个氨基酸。如此上下文中所用的,术语“约”指示+/-两个氨基酸残基。由于接头长度必须是正整数,所以约1至约50个氨基酸的长度意指长度为1-3至48-52个氨基酸。在另一实施方案中,本公开的肽接头的长度为约10至约20个氨基酸。在另一实施方案中,本公开的肽接头的长度为约15至约50个氨基酸。在另一实施方案中,本公开的肽接头的长度为约20至约45个氨基酸。在另一实施方案中,本公开的肽接头的长度为约15至约35个或约20至约30个氨基酸。在另一实施方案中,本公开的肽接头的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、500、1000或2000个氨基酸。在一个实施方案中,本公开的肽接头的长度为20或30个氨基酸。在一些实施方案中,肽接头可包含至少两个、至少三个、至少四个、至少五个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个氨基酸。在其它实施方案中,肽接头可包含至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1,000个氨基酸。在一些实施方案中,肽接头可包含至少约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、1100个、1200个、1300个、1400个、1500个、1600个、1700个、1800个、1900个或2000个氨基酸。肽接头可包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸或900-1000个氨基酸。可使用本领域中已知的技术将肽接头引入多肽序列。可通过dna序列分析证实修饰。质粒dna可用于转化宿主细胞以稳定产生所产生的多肽。13.单体-二聚体杂合体在一些实施方案中,本公开的治疗性蛋白质包含包含凝血因子的单体-二聚体杂合分子。本文使用的术语“单体-二聚体杂合体”是指包含第一多肽链和第二多肽链的嵌合蛋白,所述第一多肽链和第二多肽链通过二硫键彼此结合,其中第一链包含凝血因子(例如,fviii)和第一fc区且第二链包含无凝血因子的第二fc区或基本由其组成或由其组成。因此,单体-二聚体杂合体构建体是包含仅具有一个凝血因子的单体方面和具有两个fc区的二聚体方面的杂合体。14.表达控制序列在一些实施方案中,本公开的核酸分子进一步包含至少一个表达控制序列。如本文所用的,表达控制序列是任何调控核苷酸序列,如启动子序列或启动子-增强子组合,其促进与其可操作地连接的编码核酸的有效转录和翻译。例如,本公开的核酸分子可操作得与至少一个转录控制序列连接。基因表达控制序列可为,例如,哺乳动物或病毒启动子,如组成型或诱导型启动子。组成型哺乳动物启动子包括,但不限于,针对以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(hprt)、腺苷脱氨酶、丙酮酸激酶,β-肌动蛋白启动子和其他组成型启动子。在真核细胞中组成性起作用的示例性病毒启动子包括,例如,巨细胞病毒(cmv)、猿猴病毒(例如,sv40)、乳头瘤病毒、腺病毒、人类免疫缺陷病毒(hiv)、劳斯肉瘤病毒、巨细胞病毒、莫洛尼白血病病毒的长末端重复(ltr)和其它逆转录病毒的启动子,和单纯疱疹病毒的胸苷激酶启动子。其它组成型启动子是本领域普通技术人员已知的。用作本公开的基因表达序列的启动子还包括诱导型启动子。诱导型启动子在诱导剂的存在下表达。例如,在某些金属离子的存在下,诱导金属硫蛋白启动子以促进转录和翻译。其它诱导型启动子是本领域普通技术人员已知的。在一个实施方案中,本公开包括在组织特异性启动子和/或增强子的控制下表达转基因。在另一实施方案中,启动子或其它表达控制序列选择性增强转基因在肝细胞中的表达。在某些实施方案中,启动子或其它表达控制序列选择性增强转基因在肝细胞、窦状细胞和/或内皮细胞中的表达。在一个特定的实施方案中,启动子或其它表达控制序列选择性增强转基因在内皮细胞中的表达。在某些实施方案中,启动子或其它表达控制序列选择性增强表达转基因在肌肉细胞、中枢神经系统、眼睛、肝、心脏或其任何组合中的表达。肝特异性启动子的实例包括,但不限于,小鼠甲状腺素启动子(mttr)、内源性人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子和小鼠白蛋白启动子。在特定的实施方案中,启动子包含mttr启动子。mttr启动子描述于r.h.costa等,1986,mol.cell.biol.6:4697。f8启动子描述于figueiredo和brownlee,1995,j.biol.chem.270:11828-11838。在一些实施方案中,启动子选自肝特异性启动子(例如,α1-抗胰蛋白酶(aat))、肌肉特异性启动子(例如,肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)和肌间线蛋白(des))、合成的启动子(例如,spc5-12、2r5sc5-12、dmck和tmck),及其任何组合。在一个实施方案中,启动子选自小鼠甲状腺启动子(mttr)、内源性人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、ttpp、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、α1-抗胰蛋白酶(aat)、肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)、肌间线蛋白(des)、spc5-12、2r5sc5-12、dmck和tmck、磷酸甘油酸激酶(pgk)启动子及其任何组合。可使用一个或多个增强子进一步增强表达水平以实现治疗功效。可单独或与一个或多个启动子元件一起提供一个或多个增强子。通常,表达控制序列包含多个增强子元件和组织特异性启动子。在一个实施方案中,增强子包含一个或多个拷贝的微球蛋白/尿抑胰酶素(bikunin)增强子(rouet等,1992,j.biol.chem.267:20765-20773;rouet等,1995,nucleicacidsres.23:395-404;rouet等,1998,biochem.j.334:577-584;ill等,1997,bloodcoagulationfibrinolysis8:s23-s30)。在另一实施方案中,增强子衍生自肝特异性转录因子结合位点,如ebp、dbp、hnf1、hnf3、hnf4、hnf6,对于enh1,其包含hnf1、(有义)-hnf3、(有义)-hnf4、(反义)-hnf1、(反义)-hnf6、(有义)-ebp、(反义)-hnf4(反义)。在特定的实施方案中,可用于本公开的启动子包含seqidno:69(即,et启动子),其也称作genbank号ay661265。还参见vigna等,moleculartherapy11(5):763(2005)。其它适合的载体和基因调控元件的实例描述于wo02/092134、ep1395293或美国专利号6,808,905、7,745,179或7,179,903,其通过提述以其整体并入本文。在一个实施方案中,本公开的核酸分子进一步包含内含子序列。在一些实施方案中,内含子序列位于编码fviii多肽的核酸序列的5'。在一些实施方案中,内含子序列是天然存在的内含子序列。在一些实施方案中,内含子序列是合成的序列。在一些实施方案中,内含子序列衍生自天然存在的内含子序列。在某些实施方案中,内含子序列包含sv40小t内含子。在一个实施方案中,内含子序列包含seqidno:115。在一些实施方案中,核酸分子进一步包含转录后调控元件。在某些实施方案中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(wpre)。在一个特定的实施方案中,转录后调控元件包含seqidno:120。在一些实施方案中,核酸分子包含微小rna(mirna)结合位点。在一个实施方案中,mirna结合位点是mir-142-3p的mirna结合位点。在其它实施方案中,mirna结合位点选自由rennie等,rnabiol.13(6):554-560(2016)和starmirdb(可在http://sfold.wadsworth.org/starmirdb.php获得)公开的mirna结合位点,二者通过提述以其整体并入本文。在一些实施方案中,核酸分子包含一个或多个dna核靶向序列(dts)。dts促进含有此类序列的dna分子易位至核中。在某些实施方案中,dts包含sv40增强子序列。在某些实施方案中,dts包含c-myc增强子序列。在一些实施方案中,dts在第一itr和第二itr之间。在一些实施方案中,dts在第一itr的3'和治疗性蛋白质的5'。在其它实施方案中,dts在治疗性蛋白质的3'和第二itr的5'。在一些实施方案中,核酸分子进一步包含3'utr聚(a)尾序列。在一个实施方案中,3'utr聚(a)尾序列包含bgh聚(a)。在一个实施方案中,3'utr聚(a)尾包含肌动蛋白聚(a)位点。在一个实施方案中,3'utr聚(a)尾包含血红蛋白聚(a)位点。在一个特定的实施方案中,3'utr聚(a)尾序列包含seqidno:122。iii.组织特异性表达在某些实施方案中,在载体中包括一个或多个mirna靶序列将是有用的,所述靶序列例如可操作地连接至凝血因子转基因。因此,本公开还提供了至少一个可操作地连接至凝血因子核苷酸序列或以其他方式插入载体内的mirna序列靶标。载体中包括的一个以上拷贝的mirna靶序列可以提高系统的有效性。还包括不同的mirna靶序列。例如,表达一个以上转基因的载体可使转基因在一个以上mirna靶序列的控制下,所述mirna靶序列可为相同或不同的。mirna靶序列可串联,但也包括其他排列。含有mirna靶序列的转基因表达盒也可以反义方向插入载体。反义方向可用于病毒颗粒的产生,以避免表达可另外地对生产细胞有毒的基因产物。在其它实施方案中,载体包含1、2、3、4、5、6、7或8拷贝的相同或不同的mirna靶序列。然而,在某些其它实施方案中,载体将不包括任何mirna靶序列。选择是否包括mirna靶序列(以及多少)将由已知参数(如意欲的组织靶标、所需的表达水平等)指导。在一个实施方案中,靶序列是已经被报道最有效地阻断髓样定型祖细胞中和至少部分有效地阻断更原始hspc中的表达的mir-223靶标。mir-223靶标可阻断分化的髓样细胞中的表达,所述分化的髓样细胞包括粒细胞、单核细胞、巨噬细胞、髓样树突细胞。mir-223靶标也适用于基因疗法应用,这依赖于淋巴或红系谱系中强效的转基因表达。mir-223靶标也可非常有效地阻断人hsc中的表达。在另一实施方案中,靶序列是mir142靶标(tccataaagtaggaaacactaca(seqidno:43))。在一个实施方案中,载体包含4个拷贝的mir-142靶序列。在某些实施方案中,将造血特异性微小rna(如mir-142(142t))的互补序列并入至载体(例如,逆转录病毒载体(lv))的3'未翻译区,这使转基因编码的转录本易受mirna介导的下调。通过此方法,可防止造血谱系抗原呈递细胞(apc)中的转基因表达,同时保持转基因在非造血细胞中(brown等,natmed2006)。此策略可对转基因表达强加严格的转录后控制,因此使转基因稳定递送和长期表达。在一些实施方案中,mir-142调控可防止免疫介导的转导的细胞清除和/或诱导抗原特异性调节性t细胞(treg),并介导对转基因编码抗原的稳固的免疫耐受性。在一些实施方案中,靶序列是mir181靶标。chenc-z和lodishh,seminarsinimmunology(2005)17(2):155-165公开了mir-181,一种在小鼠骨髓内的b细胞中特异性表达的mirna(chen和lodish,2005)。它还公开了一些人mirna与白血病关联。靶序列可与mirna完全或部分互补。术语“完全互补”一指靶序列具有与识别它的mirna的序列100%互补的核酸序列。术语“部分互补”意指靶序列仅与识别它的mirna的序列部分互补,由此部分互补的序列仍被mirna识别。换句话说,在本公开内容的上下文中,部分互补的靶序列可有效识别相应的mirna并实现预防或减少表达该mirna的细胞中的转基因表达。mirna靶序列的实例描述于wo2007/000668、wo2004/094642、wo2010/055413或wo2010/125471,其通过提述以其整体并入本文。在一些实施方案中,转基因表达靶向肝。在某些实施方案中,转基因表达靶向肝细胞。在其它实施方案中,转基因表达靶向内皮细胞。在一个特定的实施方案中,转基因表达靶向天然表达内源性fviii的任何组织。在一些实施方案中,转基因表达靶向中枢神经系统。在某些实施方案中,转基因表达靶向神经元。在一些实施方案中,转基因表达靶向传入神经元。在一些实施方案中,转基因表达靶向传出神经元。在一些实施方案中,转基因表达靶向中间神经元。在一些实施方案中,转基因表达靶向胶质细胞。在一些实施方案中,转基因表达靶向星形胶质细胞。在一些实施方案中,转基因表达靶向少突细胞。在一些实施方案中,转基因表达靶向小神经胶质细胞。在一些实施方案中,转基因表达靶向室管膜细胞。在一些实施方案中,转基因表达靶向许旺细胞。在一些实施方案中,转基因表达靶向卫星细胞。在一些实施方案中,转基因表达靶向肌肉组织。在一些实施方案中,转基因表达靶向平滑肌。在一些实施方案中,转基因表达靶向心肌。在一些实施方案中,转基因表达靶向骨骼肌。在一些实施方案中,转基因表达靶向眼睛。在一些实施方案中,转基因表达靶向感光细胞。在一些实施方案中,转基因表达靶向视网膜神经节细胞。iv.宿主细胞本公开还提供包含本公开的核酸分子或载体的宿主细胞。如本文所用的,术语“转化”应在广义上用于指将dna引入受体宿主细胞中,该受体宿主细胞改变基因型并因此导致受体细胞的改变。“宿主细胞”是指已经用使用重组dna技术构建的载体转化并编码至少一个异源基因的细胞。本公开的宿主细胞优选是哺乳动物来源的;最优选是人或小鼠来源。本领域技术人员被认为具有优先确定最适合其目的的特定宿主细胞系的能力。示例性宿主细胞系包括,但不限于,cho、dg44和duxb11(中国仓鼠卵巢系,dhfr-)、hela(人宫颈癌)、cvi(猴肾系)、cos(cvi与sv40t抗原的衍生物)、r1610(中国仓鼠成纤维细胞)balbc/3t3(小鼠成纤维细胞)、hak(仓鼠肾细胞系)、sp2/o(小鼠骨髓瘤)、p3×63-ag3.653(小鼠骨髓瘤)、bfa-1c1bpt(牛内皮细胞)、raji(人淋巴细胞)、ns0、cap、bhk21和hek293(人肾)。在一个特定的实施方案中,宿主细胞选自下组:cho细胞、hek293细胞、bhk21细胞、细胞、ns0细胞、cap细胞及其任何组合。在一些实施方案中,本公开的宿主细胞是昆虫来源的。在一个特定的实施方案中,宿主细胞是sf9细胞。宿主细胞系通常可从商业服务、美国组织培养物保藏中心(americantissueculturecollection)或已发表的文献中获得。将本公开的核酸分子或载体引入宿主细胞可通过本领域技术人员已知的多种技术来完成。这些技术包括,但不限于,转染(包括电泳和电穿孔)、原生质体融合、磷酸钙沉淀、与包膜dna的细胞融合、显微注射和完整病毒的感染。参见,ridgway,a.a.g."mammalianexpressionvectors"24.2章节,第470-472页vectors,rodriguez和denhardt,编(butterworths,boston,mass.1988)。最优选地,将质粒引入宿主中经由电穿孔。使转化的细胞在适于产生轻链和重链的条件下生长,并测定重链和/或轻链蛋白质的合成。示例性测定技术包括酶联免疫吸附测定(elisa)、放射免疫测定(ria)或荧光激活的细胞分选分析(facs)、免疫组织化学等。包含本公开的分离的核酸分子或载体的宿主细胞在适合的生长培养基中生长。如本文所用的,术语“适合的生长培养基”是指含有细胞生长所需营养物的培养基。细胞生长所需的营养物可包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。任选地,培养基可含有一个或多个选择因子。可选地,培养基可含有小牛血清或胎牛血清(fcs)。在一实施方案中,培养基基本上不包含igg。生长培养基通常将通过例如药物选择或必需营养物的缺陷来选择含有dna构建体的细胞,所述必需营养物由dna构建体上的选择标记补充或与dna构建体共转染。培养的哺乳动物细胞通常在市售的含血清或无血清培养基(例如,mem、dmem、dmem/f12)中生长。在一个实施方案中,培养基是cdopticho(invitrogen,carlsbad,ca.)。在另一实施方案中,培养基是cd17(invitrogen,carlsbad,ca.)。适合于所用的特定细胞系的培养基的选择在本领域普通技术人员的水平内。v.多肽的制备本公开还提供由本公开的核酸分子编码的多肽。在其它实施方案中,本公开的多肽由包含本公开的核酸分子的载体编码。在又一其它实施方案中,本公开的多肽由包含本公开的核酸分子的宿主细胞产生。在其它实施方案中,本公开还提供产生具有凝血因子(例如,fviii)活性的多肽的方法,其包括在产生具有凝血因子(例如,fviii)活性的多肽的条件下培养本公开的宿主细胞,并回收具有凝血因子(例如,fviii)活性的多肽。在一些实施方案中,具有凝血因子(例如,fviii)活性的多肽的表达相对于在相同条件下培养的但包含参考核苷酸序列(例如,seqidno:16,亲本fviii基因序列)的宿主细胞是增加的。在其它实施方案中,本公开提供增加具有凝血因子(例如,fviii)活性的多肽的表达的方法,其包括在通过核酸分子表达具有凝血因子(例如,fviii)活性的多肽的条件下培养本公开的宿主细胞,其中具有凝血因子(例如,fviii)活性的多肽的表达相对于在相同条件下培养的但包含参考核酸分子(例如,seqidno:16,亲本fviii基因序列)的宿主细胞是增加的。在其它实施方案中,本公开提供改善具有凝血因子(例如,fviii)活性的多肽的产量的方法,其包含在通过本文公开的核酸分子产生具有凝血因子(例如,fviii)活性的多肽的条件下培养宿主细胞,其中具有凝血因子(例如,fviii)活性的多肽的产量相对于在相同条件下培养的包含参考核酸序列(例如,seqidno:16,亲本fviii基因序列)的宿主细胞是增加的。本公开的治疗性蛋白质(例如凝血因子)可在转基因动物(如啮齿类动物、山羊、绵羊、猪或牛)中合成。术语“转基因动物”是指已将外源基因并入其基因组的非人类动物。因为此基因存在于生殖系组织中,因此它从亲本传递给后代。外源基因被引入单细胞胚胎(brinster等1985,proc.natl.acad.sci.usa82:4438)。产生转基因动物的方法是本领域已知的,包括产生免疫球蛋白分子的转基因学(wagner等1981,proc.natl.acad.sci.usa78:6376;mcknight等1983,cell34:335;brinster等1983,nature306:332;ritchie等1984,nature312:517;baldassarre等2003,theriogenology59:831;robl等2003,theriogenology59:107;malassagne等2003,xenotransplantation10(3):267)。vii.药物组合物含有本文公开的核酸分子、由该核酸分子编码的多肽、载体或宿主细胞的组合物可含有适合的药学上可接受的载剂。例如,它们可含有促进将活性化合物加工成意欲递送至作用位点的制剂的赋形剂和/或辅料。在一个实施方案中,本公开涉及一种药物组合物,其包含本文公开的(a)核酸分子、载体、多肽或宿主细胞;和(b)药学上可接受的赋形剂。在一些实施方案中,药物组合物进一步包含递送剂。在某些实施方案中,递送剂包含脂质纳米颗粒(lnp)。在其它实施方案中,药物组合物进一步包含脂质体、其它聚合分子和外来体。药物组合物可被配制成通过推注注射用于肠胃外施用(即,静脉内、皮下或肌内)。用于注射的配制剂可以单位剂型存在,例如,在安瓿中或在添加了防腐剂的多剂量容器中。所述组合物可采取如悬浮液、溶液或在油性或水性媒介物中的乳液的形式,且含有配制剂,如悬浮剂、稳定剂和/或分散剂。可替换地,活性成分可为粉末形式,以与合适的媒介物(例如,无热原水)一起构成。用于肠胃外施用的合适的配制剂还包括水溶性形式的活性化合物的水溶液,例如,水溶性盐。此外,可施用活性化合物的悬浮液作为适当的油性注射悬浮液。合适的亲脂性溶剂或媒介物包括脂肪油(例如,芝麻油)或合成的脂肪酸酯(例如,油酸乙酯或甘油三酸酯)。水性注射悬浮液可含有增加悬浮液的黏度的物质,包括例如羧甲基纤维素钠、山梨糖醇和葡聚糖。任选地,悬浮液也可包含稳定剂。脂质体也可用于使本发明的分子形成胶囊以递送至细胞或间隙中。示例性药学上可接受的载剂是生理上相容的溶剂、分散介质、包衣、抗菌和抗真菌剂、等渗和吸收延迟剂、水、盐水、磷酸盐缓冲的盐水、右旋糖、甘油、乙醇等。在一些实施方案中,组合物包含等渗剂,例如,糖、多元醇如甘露醇、山梨糖醇或氯化钠。在其它实施方案中,组合物包含药学上可接受的物质如润湿剂或少量辅助物质,如润湿剂或乳化剂、防腐剂或缓冲剂,其可延长活性成分的保质期或有效性。本公开的组合物可为多种形式,包括,例如液体(例如,可注射和可输注的溶液)、分散液、悬浮液、半固体和固体剂型。优选的形式取决于施用的方式和治疗应用。组合物可以配制成溶液、微乳剂、分散液、脂质体或其他适合于高药物浓度的有序结构。无菌可注射溶液可通过将所需量的活性成分根据需要与上述列举的成分中的一种或组合并入适当的溶剂中,然后过滤灭菌来制备。通常,通过将活性成分并入到无菌媒介物中来制备分散液,所述无菌媒介物包含基本分散介质和所需的其他上文列举的成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥,其从先前的无菌过滤溶液中产生活性成分加上任何额外的所需成分的粉末。溶液的适当流动性可以,例如通过使用包衣(如卵磷脂),在分散液的情况下通过维持所需的粒径以及通过使用表面活性剂来维持。通过在组合物中包括延迟吸收的试剂(例如单硬脂酸盐和明胶)可以实现可注射组合物的延长吸收。活性成分可与控制释放的配制剂或装置一起配制。此类配制剂和装置的实例包括植入物、透皮贴剂和微囊递送系统。可使用生物可降解的、生物相容的聚合物,例如,乙烯乙酸乙烯酯、聚酸酐、聚乙醇酸、胶原蛋白、聚原酸酯和聚乳酸。制备此类配制剂和装置的方法是本领域已知的。参见,例如,sustainedandcontrolledreleasedrugdeliverysystems,j.r.robinson编,marceldekker,inc.,newyork,1978。可以通过在可生物降解的聚合物(如聚丙交酯-聚乙交酯)中形成药物的微囊化基质来制备可注射的贮库配制剂。根据药物与聚合物的比率以及所利用的聚合物的性质,可以控制药物的释放速率。其它示例性的可生物降解的聚合物是聚原酸酯和聚酸酐。也可通过将药物包埋在脂质体或微乳液中来制备贮库可注射的配制剂。可以将补充活性化合物并入组合物中。在一个实施方案中,本公开的核酸分子与凝血因子或其变体、片段、类似物或衍生物一起配制。例如,凝血因子包括,但不限于,因子v、因子vii、因子viii、因子ix、因子x、因子xi、因子xii、因子xiii、凝血酶原、纤维蛋白原、血管性血友病因子或重组可溶组织因子(rstf)或任何前述的激活形式。止血剂的凝血因子还可包括抗纤维蛋白溶解药物,例如ε-氨基-己酸、氨甲环酸。可调整剂量方案以提供最佳的期望的反应。例如,可施用单次推注,可随时间施用几个分开的剂量,或者可按比例减少或增加剂量,如通过治疗情况的紧急状态指示的。以剂量单位形式配制肠胃外组合物是有利的,以易于施用和剂量均匀性。参见,例如,remington'spharmaceuticalsciences(mackpub.co.,easton,pa.1980)。除活性化合物外,液体剂型还可包含惰性成分,如水、乙醇、碳酸乙酯、乙酸乙酯、苄醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和脱水山梨糖醇的脂肪酸酯。合适的药物载剂的非限制性实例还描述于e.w.martin的remington'spharmaceuticalsciences。赋形剂的一些实例包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、大米、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙烯、乙二醇、水、乙醇等。组合物还可含有ph缓冲剂和润湿剂或乳化剂。对于口服施用,药物组合物可采取通过常规方式制备的片剂或胶囊的形式。组合物也可制备成液体,例如糖浆或悬浮液。液体可包括悬浮剂(例如山梨糖醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性载体(例如,杏仁油、油性酯、乙醇或分馏的植物油),和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可包括调味剂、着色剂和甜味剂。可替换地,组合物可以以干燥产物的形式存在,以与水或另一合适的媒介物一起构成。对于颊部施用,组合物可采取根据常规方案的片剂或锭剂的形式。对于通过吸入施用,根据本公开使用的化合物方便地以具有或不具有赋形剂的雾化气雾剂形式或来自加压包装或喷雾器的雾化气雾剂的形式递送,所述雾化气雾剂任选地带有推进剂,例如,二氯二氟甲烷,三氯氟甲烷,二氯四氟甲烷,二氧化碳或其他合适的气体。在加压的气雾剂的情况下,剂量单位可通过提供阀门以递送计量的量来确定。可配制用于吸入器或吹药器的例如明胶的胶囊和药筒,所述胶囊和药筒含有化合物和合适的粉末基质(如乳糖或淀粉)的粉末混合物。药物组合物也可配制成栓剂或保留灌肠剂用于直肠施用,例如,含有常规的栓剂基质(如可可油或其他甘油酯)。在一些实施方案中,通过选自局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服施用的途径施用组合物。肠胃外施用可以是静脉内或皮下施用。viii.治疗的方法在一些实施方案中,核酸分子包含第一itr、第二itr环绕基因盒,其中基因盒包含凝血因子,且其中核酸分子用于治疗有需要的受试者中的出血性疾病或病况。出血性疾病或病况选自出血性止血病症、关节出血症、肌肉出血、口腔出血(oralbleed)、出血、肌肉内出血、口腔出血(oralhemorrhage)、创伤、创伤性头炎(traumacapitis)、胃肠道出血、颅内出血、腹腔内出血、胸腔内出血、骨骨折、中枢神经系统出血、咽后腔出血,腹膜后腔出血,纤毛鞘出血及其任何组合。在另一其它实施方案中,受试者被安排经受手术。在又一其它实施方案中,治疗是预防性的或按需的。本公开提供一种治疗出血性病症的方法,其包括向有需要的受试者施用本公开的核酸分子、载体或多肽。在一些实施方案中,出血病症的表征在于凝血因子(例如,fviii)的缺陷。在一些实施方案中,出血病症是血友病。在一些实施方案中,出血病症是血友病a。在治疗出血病症的方法的一些实施方案中,施用后24个小时凝血因子(例如,fviii)的血浆活性相对于施用参考核酸分子(例如,seqidno:16,亲本fviii基因序列)、包含参考核酸分子的载体或由参考核酸分子编码的多肽的受试者是增加的。本公开还涉及治疗、减轻或预防受试者中的止血病症的方法,该方法包括施用治疗有效量的本公开的分离的核酸分子或具有凝血因子(例如,fviii)活性的由本公开的核酸分子编码的多肽。分离的核酸分子或编码的多肽的治疗、减轻和预防可为旁路疗法。接收该旁路疗法的受试者可已经产生了对凝血因子(例如,fviii)的抑制因子,或倾向于产生凝血因子抑制因子。本公开的核酸分子、载体或多肽通过促进血纤蛋白凝块的形成来治疗或预防止血病症。具有凝血因子(例如,fviii)活性的由本公开的核酸分子编码的多肽可激活凝血级联的成员。凝血因子可为外来性途径,内在途径或两者中的参与者。本公开的核酸分子、载体或多肽可用于治疗已知可用凝血因子治疗的止血病症。可使用本公开的方法治疗的止血病症包括,但不限于,血友病a、血友病b、血管性血友病、因子xi缺乏症(pta缺乏症)、因子xii缺乏症,以及纤维蛋白原、凝血酶原、因子v、因子vii、因子x或因子xiii的缺陷或结构异常,关节出血症、肌肉出血、口腔出血、出血、肌肉内出血、口腔出血(oralhemorrhage)、创伤、创伤性头炎(traumacapitis)、胃肠道出血、颅内出血、腹腔内出血、胸腔内出血、骨骨折、中枢神经系统出血、咽后腔出血,腹膜后腔出血,纤毛鞘出血。在一些实施方案中,止血病症是遗传性病症。在一个实施方案中,受试者患有血友病a。在其它实施方案中,止血病症是凝血因子的缺陷的结果。在其它实施方案中,止血病症是fviii的缺陷的结果。在其它实施方案中,止血病症可以是缺陷性fviii凝血因子的结果。在另一实施方案中,止血病症可为获得性病症。获得性病症可由潜在的继发性疾病或病况引起。无关的病况可为,例如,但不限于,癌症、自身免疫性疾病或妊娠。获得性病症可由年老或治疗潜在的继发性病症(例如,癌症化疗)的药物引起。本公开还涉及不具有导致止血病症的获得的止血病症或继发性疾病或病况的受试者的方法。因此,本公开涉及治疗需要一般止血剂的受试者的方法治疗,该方法包括施用治疗有效量的本公开的分离的核酸分子、载体或多肽。例如,在一个实施方案中,需要一般止血剂的受试者正在经受或即将经受手术。本公开的分离的核酸分子、载体或多肽可在手术之前或之后作为预防剂施用。本公开的分离的核酸分子、载体或多肽可在手术期间或之后施用以控制急性出血发作。手术可包括,但不限于,肝移植、肝切除术或干细胞移植。在另一实施方案中,本公开的分离的核酸分子、载体或多肽可用于治疗未患有止血病症的患有急性出血发作的受试者。急性出血发作可由急性创伤(例如,手术、机动车事故、伤口、割伤、枪伤或其他任何导致不受控制的出血的创伤事件)引起。分离的核酸分子、载体或蛋白质可用于预防性治疗具有止血病症的受试者。分离的核酸分子、载体或蛋白质可用于治疗具有止血病症的受试者的急性出血发作。在另一实施方案中,通过施用本公开的分离的核酸分子或载体表达凝血因子蛋白不在受试者中诱导免疫应答。在一些实施方案中,免疫应答包含针对凝血因子的抗体的产生。在一个实施方案中,免疫应答包含针对fviii的抗体的产生。在一些实施方案中,免疫应答包含细胞因子分泌。在一些实施方案中,免疫应答包含激活b细胞、t细胞或b细胞和t细胞二者。在一些实施方案中,免疫应答是抑制性免疫应答,其中相对于尚未产生免疫应答的受试者,所述受试者中的免疫应答降低凝血因子蛋白的活性。在某些实施方案中,通过施用本公开的分离的核酸分子或载体表达凝血因子蛋白可防止针对从分离的核酸分子或载体表达的凝血因子蛋白或凝血因子蛋白的抑制性免疫应答。在一些实施方案中,本公开的分离的核酸分子、载体或蛋白质组合物与至少一种促进凝血的其它药剂组合施用。所述其它药剂在具有证明的凝血活性的治疗剂中促进凝血。作为实例而非限制,止血剂可包括fv、fvii、fix、fx、fxi、fxii、fxiii、凝血酶原或纤维蛋白原或任何前述的激活形式。凝血因子或止血剂还可包括抗纤维蛋白溶解药物,例如ε-氨基-己酸、氨甲环酸。在本公开的一个实施方案中,组合物(例如,分离的核酸分子、载体或多肽)是其中当向所述受试者施用时凝血因子以可激活形式存在的组合物。此类可激活分子可在向受试者施用后在凝血位点体内激活。分离的核酸分子、载体或多肽可以静脉内、皮下、肌肉内或经由任何粘膜表面施用,例如,口服、舌下、颊部、舌下、鼻、直肠、阴道或经由肺部途径施用。凝血因子蛋白可植入使嵌合蛋白缓慢释放至所期望的位点的生物聚合物固体支持物中或与其连接。对于口服施用,药物组合物可采取通过常规方式制备的片剂或胶囊形式。该组合物也可制备成液体,例如糖浆或悬浮液。液体可包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化的可食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒介物(例如,杏仁油、油性酯、乙醇或分馏的植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可包括调味剂、着色剂和甜味剂。可替换地,组合物可以干燥产品的形式存在,以与水或另一合适的媒介物一起构成。对于部和舌下施用,根据常规方案,组合物可采取片剂、锭剂或快速溶解膜的形式。对于通过吸入施用,根据本公开使用的具有凝血因子活性的多肽方便地以来自加压包装或喷雾器(例如在pbs中)的雾化气雾剂的形式递送,所述雾化气雾剂带有合适的推进剂,例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他合适的气体。在加压的气雾剂的情况下,剂量单位可通过提供阀门以递送计量的量来确定。可配制用于吸入器或吹药器的例如明胶的胶囊和药筒,所述胶囊和药筒含有化合物和合适的粉末基质(如乳糖或淀粉)的粉末混合物。在一个实施方案中,分离的核酸分子、载体或多肽的施用途径是肠胃外的。如本文所用的术语肠胃外包括静脉内、动脉内、腹膜内、肌肉内、皮下、直肠或阴道施用。肠胃外施用的静脉内形式是优选的。尽管所有这些施用形式都明确地预期在本公开的范围内,但是施用形式将是用于注射的溶液,特别是用于静脉内或动脉内注射或滴注的溶液。通常,合适的用于注射的药物组合物可包含缓冲剂(例如,乙酸盐、磷酸盐或柠檬酸盐缓冲剂)、表面活性剂(例如聚山梨酸酯),任选地稳定剂(例如人白蛋白)等。然而,在与本文的教导相容的其它方法中,分离的核酸分子、载体或多肽可直接递送至不良细胞群体的位点,由此增加患病组织对治疗剂的暴露。用于肠胃外施用的制剂包括无菌水溶液或非水溶液、悬浮液和乳液。非水性溶剂的实例是丙二醇、聚乙二醇、植物油(如橄榄油)和可注射的有机酯(如油酸乙酯)。水性载体包括水、醇/水溶液、乳液或悬浮液,包括盐水和缓冲的介质。在本主题公开中,药学上可接受的载剂包括但不限于0.01-0.1m,优选0.05m磷酸盐缓冲液或0.8%盐水。其它常见的肠胃外媒介物包括磷酸钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏液或固定油。静脉内媒介物包括液体和营养补充剂、电解质补充剂,如基于林格氏右旋糖的那些,等等。也可存在防腐剂和其它添加剂,如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。更特别地,适合于可注射用途的药物组合物包括无菌水溶液(在水溶性的情况下)或分散液以及用于临时制备无菌可注射溶液或分散液的无菌粉末。在这种情况下,组合物必须是无菌的,且应该以容易可注射的程度流动。它在制造和储存条件下应该是稳定的,且优选地被保存以抵抗微生物(如细菌和真菌)的污染作用。载剂可为含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)及其合适的混合物的溶剂或分散介质。可例如通过使用包衣(如卵磷脂),在分散液的情况下通过维持所需的粒径以及通过使用表面活性剂来维持适当的流动性。药物组合物也可配制成栓剂或保留灌肠剂用于直肠施用,例如含有常规的栓剂基质如可可油或其他甘油酯。用于治疗病况的本公开的组合物的有效剂量取决于许多不同因素而变化,所述因素包括施用方式、靶位点、患者的生理状态,无论患者是人还是动物,施用的其它药物,以及无论治疗是预防性还是治疗性的。通常,患者是人类,但是也可治疗非人类哺乳动物,包括转基因哺乳动物。可使用本领域技术人员已知的常规方法来滴定治疗剂量以优化安全性和功效。本公开的核酸分子、载体或多肽可任选地与可有效治疗需要治疗的病症或病况的其它药剂(例如,预防性或治疗性药剂)组合施用。如本文所用的,本公开的分离的核酸分子、载体或多肽与辅助疗法连同或组合的施用意指该疗法和所公开的多肽的顺序、同时、共延、并存、伴随或同时期施用或应用。本领域技术人员将理解,可定时施用或应用组合的治疗方案的各种组分以增强治疗的整体效果。基于所选择的辅助疗法和本说明书的教导,技术人员(例如,医师)将能够容易地辨别有效的组合的治疗方案,而无过度的实验。将进一步理解,本公开的分离的核酸分子、载体或多肽可与一种或多种药剂连同或组合使用(例如,以提供组合的治疗方案)。可具有本公开的多肽或多核苷酸的示例性药剂包括代表当前正在治疗的特定病症的护理标准的药剂。此类药剂本质上可为化学药品或生物制剂。术语“生物制剂”或“生物药剂”是指由活生物体和/或其产品制成的意欲用作治疗剂的任何药物活性剂。与本公开的多核苷酸或多肽组合使用的药剂的量可因受试者而异或可根据本领域已知的方法施用。参见,例如,bruceachabner等,antineoplasticagents,ingoodman&gilman'sthepharmacologicalbasisoftherapeutics1233-1287((joelg.hardman等,编,第9版1996年)。在另一实施方案中,施用符合护理标准的一定量的此类药剂。在一个实施方案中,本文还公开了试剂盒,该试剂盒包含本文公开的核酸分子和用于向有需要的受试者施用该核酸分子的说明书。在另一实施方案中,本文公开了用于产生本文提供的核酸分子的杆状病毒系统。该核酸分子在昆虫细胞中产生。在另一实施方案中,提供了用于表达构建体的纳米颗粒递送系统。表达构建体包含本文公开的核酸分子。ix.基因疗法本公开的某些方面提供一种在受试者中表达基因构建体的方法,其包括向有需要的受试者施用本公开的分离的核酸分子。在一些方面中,本公开提供一种增加多肽在受试者中的表达的方法,其包括向有需要的受试者施用本公开的分离的核酸分子。在其它方面,本公开提供一种调节多肽在有需要的受试者中的表达的方法,其包括向该受试者施用本公开的分离的核酸分子,例如包含mirna的核酸序列。在一些方面中,本公开提供一种下调靶基因在有需要的受试者中的表达的方法,该方法包括向该受试者施用本公开的分离的核酸分子,例如,包含mirna的核酸序列。已经探索了体细胞基因疗法作为多种病况(包括但不限于血友病a)的可能疗法。基因疗法是一种对血友病特别有吸引力的治疗方法,因为它具有在单次施用载体后通过连续内源性产生凝血因子(例如,fviii)治愈疾病的潜力。血友病a非常适合于基因替换方法,因为其临床表现完全归因于在血浆中以微量(200ng/ml)循环的单一基因产物(例如,fviii)的缺少。可在动物(例如,人类患者)中在体内产生本公开的凝血因子蛋白,使用基因疗法以治疗选自下组的出血性疾病或病症在治疗上将是有益的:出血性止血病症、关节出血症、肌肉出血、口腔出血、出血、肌肉内出血、口腔出血(oralhemorrhage)、创伤、创伤性头炎(traumacapitis)、胃肠道出血、颅内出血、腹腔内出血、胸腔内出血、骨骨折、中枢神经系统出血、咽后腔出血,腹膜后腔出血,纤毛鞘出血。在一个实施方案中,出血性疾病或病症是血友病。在另一实施方案中,出血性疾病或病症是血友病a。其它条件也适用于使用本文公开的核酸分子的治疗。在某些实施方案中,本文所述的方法用于治疗影响选自肌肉、中枢神经系统(cns)、眼、肝、心脏、肾脏、胰腺、肺、皮肤、膀胱、尿道或其任何组合的靶器官的疾病或病症。在某些实施方案中,本文所述的方法用于治疗选自dmd(杜氏肌营养不良症)、xlmtm(x连锁性肌管肌病)、帕金森、sma(脊髓性肌萎缩症)、弗里德里希共济失调(friedreich’sataxia)、gucy2d-lca(莱伯氏先天性黑朦)、xlrs(x连锁性视网膜分裂症)、amd(年龄相关性黄斑变性)、achm(全色盲)、rpf65介导的ird的疾病或病况(表9)。表9.可由本文公开的方法治疗的疾病和病症。1:sod1基因的突变占遗传性als病例的20%。野生型sod1在神经培养物中已证明抗凋亡性质,而已观察到突变型sod1可促进脊髓线粒体的凋亡,但不会促进肝线粒体的凋亡,尽管两者中均表达相同。下调突变的sod1表达可抑制als中的运动神经元变性。2:hd是由基因的重复部分的长度超过正常范围引起的几种三核苷酸重复病症之一。htt含有三个dna碱基—胞嘧啶-腺嘌呤-鸟嘌呤(cag)—重复多次(即…cagcagcag...)的序列,称作三核苷酸重复。cag是氨基酸谷氨酰胺的3个字母的遗传密码(密码子),因此其一系列导致称为聚谷氨酰胺束(或聚yq束)的谷氨酰胺链的产生,以及该基因的重复部分,聚q区。通常,人们在聚q区中重复的谷氨酰胺少于36个,这导致细胞质蛋白亨廷顿蛋白的产生。然而,36个或更多的谷氨酰胺序列导致具有不同特征的蛋白质的产生。这种改变的形式(称为突变型亨廷顿蛋白(mhtt))增加某些类型神经元的衰变率。通常,cag重复的数目与此过程受多大影响有关,且占症状发作年龄变化的约60%。其余的变化归因于环境和改变hd的机制的其它基因。36-39个重复导致疾病的外显率降低,伴有发作更晚和症状进展更慢。在某些情况下,发作可能太晚,以至于症状从未被注意到。在很大的重复计数的情况下,hd具有完全外显率,并且可以在20岁以下出现,于是被称为青少年hd、少动强直(akinetic-rigid)或westphal变体hd。这占hd携带者的约7%。3:导致色素性视网膜炎的大多数rho基因突变改变视紫红质蛋白的折叠或转运。一些突变引起视紫红质被组成性激活,而不是响应光而被激活。研究表明,视紫红质的改变版本干扰基本细胞功能,引起视杆细胞自毁(经历凋亡)。由于视杆细胞对于弱光条件下的视力是必需的,因此这些细胞的丢失造成色素性视网膜炎患者进行性夜盲症。在一些实施方案中,本文所述的方法用于治疗溶酶体贮积症。在一些实施方案中,溶酶体贮积症选自mld(异染性脑白质营养不良)、mps(粘多糖症)、pku(苯丙酮尿症)、ii型庞贝氏糖原贮积病或其任何组合。在一些实施方案中,本文所述的方法用于微小rna(mirna)疗法。在一些实施方案中,mirna治疗由基因或蛋白质的过表达引起的病况。在一些实施方案中,mirna治疗由蛋白质积累引起的病况。在一些实施方案中,mirna治疗由基因或蛋白质的错误表达引起的病况。在一些实施方案中,mirna治疗由突变基因的表达引起的病况。在一些实施方案中,mirna治疗由异源基因的表达引起的病况。在某些实施方案中,mirna疗法治疗选自als(肌萎缩性侧索硬化症)、亨廷顿氏病、adrp(常染色体显性色素性视网膜炎)及其任何组合的病况。在某些实施方案中,本公开的方法包括通过施用本文公开的核酸分子靶向治疗als,其中所述核酸分子包含编码mirna的基因盒,其中所述mirna靶向sod1的表达。在某些实施方案中,mirna包含由dirren等,annalsofclinicalandtranslationalneurology2(2):167-84(2015年2月)公开的mirsod1人工mirna。sod1基因的突变占遗传性als病例的20%。野生型sod1在神经培养物中已证明抗凋亡性质,而已观察到突变型sod1可促进脊髓线粒体的凋亡,但不会促进肝线粒体的凋亡,尽管两者均表达相同。下调突变的sod1表达可能抑制als中的运动神经元变性。在某些实施方案中,本公开的方法包括通过施用本文公开的核酸分子靶向治疗亨廷顿氏病,其中所述核酸分子包含编码mirna的基因盒,其中所述mirna靶向htt的表达。在某些实施方案中,mirna包含由evers等,moleculartherapy26(9):1-15(2018年6月epub提前印刷)公开的mihtt工程化mirna。亨廷顿氏病是由基因的重复部分的长度超出正常范围引起的几种三核苷酸重复病症之一。htt含有三个dna碱基—胞嘧啶-腺嘌呤-鸟嘌呤(cag)—重复多次(即…cagcagcag...)的序列,称作三核苷酸重复。cag是氨基酸谷氨酰胺的3个字母的遗传密码(密码子),因此其一系列导致称为聚谷氨酰胺束(或聚q束)的谷氨酰胺链的产生,以及该基因的重复部分,聚q区。通常,人们在聚q区中重复的谷氨酰胺少于36个,这导致细胞质蛋白亨廷顿蛋白的产生。然而,36个或更多的谷氨酰胺序列导致具有不同特征的蛋白质的产生。这种改变的形式(称为突变型亨廷顿蛋白(mhtt))增加某些类型神经元的衰变率。通常,cag重复的数目与此过程受多大影响有关,且占症状发作年龄变化的约60%。其余的变化归因于环境和改变hd的机制的其它基因。36-39个重复导致疾病的外显率降低,伴有发作更晚和症状进展更慢。在某些情况下,发作可能太晚,以至于症状从未被注意到。在很大的重复计数的情况下,亨廷顿氏病具有完全外显率,并且可在20岁以下出现,于是被称为青少年亨廷顿氏病、少动强直(akinetic-rigid)或westphal变体亨廷顿氏病。这占亨廷顿氏病携带者的约7%。在某些实施方案中,本公开的方法包括通过施用本文公开的核酸分子靶向治疗常染色体显性色素性视网膜炎(adrp),其中所述核酸分子包含编码mirna的基因盒,其中所述mirna靶向rho(视紫红质)的表达。在某些实施方案中,mirna包含mir-708(参见behrman等,jcb192(6):919-27(2011)。导致色素性视网膜炎的大多数rho基因突变改变视紫红质蛋白的折叠或转运。一些突变引起视紫红质被组成性激活,而不是响应光而被激活。研究表明,视紫红质的改变版本干扰基本细胞功能,引起视杆细胞自毁(经历凋亡)。由于视杆细胞对于弱光条件下的视力是必需的,因此这些细胞的丢失造成色素性视网膜炎人中的进行性夜盲症。本文描述的所有各个方面、实施方案和选择可以任何和所有变化进行组合。本说明书中提及的所有出版物、专利和专利申请均以相同的程度通过提述并入本文,就好像每个单独的出版物、专利或专利申请被明确地并单独地指出通过提述并入一样。已经一般性地描述了本公开,可通过参考本文提供的实施例来获得进一步的理解。这些实施例仅出于说明的目的,并不意欲限制。实施例实施例1.带有aav和非aav细小病毒itr的fviii表达构建体的生成。实施例1a.将密码子优化的fviii基因和来自aav的反向末端重复(itr)区克隆到基因盒中。基于aav血清型2的基因组生成fviii基因盒。然而,源自任何血清型(包括合成的)的itr区域均可用于此方法(图1a)。设计了用于体外和体内表达的编码密码子优化的fviii编码序列的表达质粒aav2-fviiico6xten,其在侧翼为来自aav(aav-fviii)的反向末端重复(itr)区的肝特异性启动子(ttpp,图1a和1b)的调控下,如图1b中所示。基因盒还含有wpre和bghpa元件用于转基因的最佳表达(图1a和1b)。将侧翼为itr的密码子优化的fviii序列克隆至质粒骨架中,该质粒骨架包含cole1复制起点和赋予氨苄青霉素抗性的β-内酰胺酶的表达盒(图1b)。对表达盒侧翼的限制性核酸内切酶pvuii的识别位点进行工程化,以允许在pvuii消化时精确切除aav-fviii构建体(图1b)。实施例1b.将密码子优化的fviii基因和来自非aav细小病毒的反向末端重复(itr)区克隆至基因盒中。基于aav所属的病毒科细小病毒科成员之间的系统发育关系(图2a),假设依赖病毒属的其它非aav成员和红病毒属的成员(可能是所述病毒科的所有/许多其它成员)利用相似的细胞机制来维持病毒的生命周期,最重要的是,建立持续的潜伏性感染。因此,源自这些病毒基因组的itr区可被利用以开发aav样(而非基于aav的)基因表达盒。测试了以下细小病毒的其itr区对于开发用于基因疗法应用的基因构建体的适合性:依赖病毒属鹅细小病毒(gpv)株b和红病毒属b19细小病毒(图2a)。质粒载体在细菌细胞中的繁殖期间,细小病毒itr区的不稳定性是基因构建体的生成和操作的众所周知的病症。尽管包括我们在内的几个小组已成功生成了包含全长aav2itr(145nt)的基因构建体,但这些构建体非常不稳定,且大多数基于aav2itr的质粒含有itr区的截短的130nt版本(如表1中例示的)。类似地,所生成的带有b19和gpvitr的全长序列的质粒构建体在细菌宿主中表现出高度的不稳定性(数据未显示),这显著限制了这些itr在开发用于基因疗法应用的遗传载体的效用。以前,已开发出带有截短版本的itr的用于挽救重组b19病毒的反向遗传系统(manaresi等,2017,virology,doi:10.1016/j.virol.2017.05.006)(表2b,itrid:b19d135)。因此,我们利用b19d135itr以生成遗传稳定的fviii表达质粒b19-fviiico6xten(图1c)。为了进一步利用此方法来合成基于gpvitr的构建体,我们比较了b19、gpv和aav2itr的全长野生型序列(图3a)。基于分别与b19和avv2itr序列的前135个和15个核苷酸的同源性(这对于itr功能是非必要的),我们假设gpvitr的前162个核苷酸可被去除,以合成具有完整功能的itr(图3a,灰色阴影的序列)的稳定的基因构建体。因此,类似于带有截短版本的相应itr的构建体aav2-fviiico6xten和b19-fviiico6xten,我们使用gpvd162(表2c)生成稳定的fviii表达质粒构建体gpv-fviiico6xten(图1d)。值得注意的是,全长b19和gpvitr均比全长aav2itr(表1)长得多,且没有形成aavitr的独特的t形发夹结构(图2b)。如实施例1a中所述,生成含有侧翼为非aav细小病毒itr的fviii表达盒(b19d135-fviii和gpvd162-fviii)的质粒b19-fviiico6xten(图1c;表2b)和gpv-fviiico6xten(图1d;表2c)。限制性核酸内切酶lgui的识别位点用于位于fviii表达盒的侧翼(图1c和1d)。实施例1c.含有侧翼为aav和非aav细小病毒itr的fviii表达盒的单链的dna片段的制备。假设在fviii表达盒侧翼的itr区内发夹结构的形成会驱动靶细胞的持续转导。为了概念验证研究,分别用pvuii和lgui消化了基于aavitr的质粒aav2-fviiico6xten和基于非aavitr的质粒b19-fviiico6xten和gpv-fviiico6xten。通过在95℃使pvuii或lgui消化的双链dna片段产物(fviii表达盒和质粒骨架)变性来生成具有形成的发夹itr结构的单链的(ss)aav-fviii、b19-fviii或gpv-fviii片段,然后在4℃冷却以允许回文itr序列折叠(图1a)。在hema(血友病a)小鼠模型中测试了所得的ssaav-fviii、ssb19-fviii或ssgpv-fviii的建立持续的肝细胞转导的能力。实施例1d.使用杆状病毒表达系统来生成fviii表达构建体利用描述于li等,plosone8(8):e69879(2013)中的用于在昆虫细胞中产生封闭端dna(cedna)分子形式的aav-fviii、b19-fviii和gpv-fviii构建体的杆状病毒表达系统。已证明cedna表达盒的全身性递送建立了肝细胞的持续转导并在肝脏中驱动稳定的长期转基因表达。实施例2.全身性注射包含侧翼为aav和非aav细小病毒itr的fviii表达盒的基因构建体导致hema小鼠中长期的fviii表达。实施例2a.ssaav-fviii介导的fviii表达的体内评价为了验证带有aavitr区的ssaav-fviii介导体内持续的转基因表达的能力,在5-12周龄的hema小鼠(4只动物/组)中经由流体动力学注射(hdi)5μg、10μg或20μg的ssdna基因表达盒(ssaav-fviii)来全身性递送基因表达盒(图4a)。hdi导致将注射的材料初次递送到实验动物的肝脏中。以5ug/小鼠注射亲本表达质粒的对照动物在施用后不久显示出高水平的fviii血浆活性。然而,注射后(p.i.)15天,循环fviii的水平迅速下降并变得无法检测。在单次流体动力学注射ssaav-fviii后18小时、3天、2周、3周、1个月、2个月、3个月和4个月时,从实验动物中收集血浆样品。通过生色fviii活性测定法分析血液中的fviii血浆活性。以5、10和20ug/小鼠注射ssaav-fviii的实验动物产生转基因的长期表达,而循环fviii的稳定水平分别约为正常fviii水平的8%、16%和32%(图4a)。应该强调的是,我们观察到了表明注射剂量和治疗结果之间存在高度相关性的强剂量反应。实施例2b.ssb19-fviii-和ssgpv-fviii-介导的fviii表达的体内评价为了评价体内分别带有非aav细小病毒itr区b19d135和gpvd162的ssb19-fviii和ssgpv-fviii的fviii的体内表达,在5-12周龄血友病a(hema)小鼠中经由hdi全身性递送10或20μg/小鼠的ssb19-fviii,以及10或50μg/小鼠的ssgpv-fviii基因表达盒。在p.i.的第1、3、7、14、21和28天时收集血液样品,并通过生色fviii活性测定法分析血液中的fviii血浆活性。如先前在aav-fviii构建体的实验中观察到的,以5μg/小鼠注射亲本fviii表达质粒的对照动物在p.i.的24小时显示高水平的fviii血浆活性,在p.i.的14天后fviii血浆活性迅速下降并在变得无法检测。注射ssb19-fviii的实验动物在p.i.24小时显示出峰值fviii血浆活性,然后在21天的时间内逐渐下降,并在p.i.28天左右稳定下来(图4b)。另一方面,注射ssgpv-fviii的hema小鼠在第7天左右迅速产生稳定水平的fviii血浆活性,在整个28天的观察期内均保持此水平(图4c)。值得注意的是,以10μg/小鼠注射ssaav-fviii(图4a)或ssgpv-fviii(图4c)的动物产生高度相似的稳定水平的fviii血浆活性,这表明aav2和gpvitr区均包含有效建立靶细胞的持续转导所需的遗传因子。实施例3.带有b19d135和gpvd162非aav细小病毒itr衍生物的fviii表达构建体的生成和体内评价。实施例3a.b19和gpvitr的最小基本序列的确定基于依赖病毒属aav2和gpv与红病毒属b19的itr序列(genebank登录号分别为nc_001401.2、u25749.1和ky940273.1)之间的比较,我们已经设计了gpv和b19细小病毒itr的最小序列,在具有或不具有额外序列(间隔子、插入、倒位、添加和/或与其它细小病毒itr的野生型序列重组)的情况下,需要gpv和b19细小病毒itr的最小序列来用带有此类itr生物遗传构建体持续转导真核细胞(图3a和3b)。因此,aav2、gpv和b19itr的序列比对揭示了所有3种病毒物种之间的保守区域b19v1和gpvv1,其在表2a-2c中显示为没有可变序列的间隔区的连续序列。同样,基于b19和gpvitr之间的序列比较,设计了最小的基本序列变体b19v3和gpvv3。由于带有gpvd162itr的fviii表达构建体在体内实验中的表现优于带有b19d135itr的遗传构建体,因此我们假设gpvitr序列中存在持续转导所需的所有遗传因子;然而,b19itr序列缺少这些遗传因子中的一些。因此,b19v3序列包含在b19和gpvitr序列之间保守的最小b19itr序列区,且gpvv3序列包含存在于gpvitr序列中且不存在于b19itr序列中的最小gpvitr序列区域(表2b和2c)。分别通过排除b19和gpvitr序列的itr回文区中的前135和162个核苷酸以及相应的互补的135和162个核苷酸来生成序列b19v2和gpvv2(表2b和2c)。实施例3b.b19和gpvitr及其衍生物的回文区在功能性基因构建体上的取向。细小病毒itr的一部分由一个自互补回文区组成。先前已针对重组感染性b19细小病毒进行了证明,在以正向和反向方向带有回文区的补救病毒表现出相似的生长性能(manaresi等,2017,virology,doi:10.1016/j.virol.2017.05.006)。因此,我们提出携带b19和gpvitr及其衍生物的基因表达构建体会保持功能性,而无论此类itr的回文区相对于基因表达而言是正向、反向还是5'和3'itr组合的任何可能组合。实施例3c.在hema小鼠中全身性注射带有b19d135和gpvd162非aav细小病毒itr衍生物的基因构建体。为了评价带有b19d135和gpvd162非aav细小病毒itr衍生物的ssdna构建体的fviii的体内表达,在5-12周龄hema小鼠中经由hdi全身性递送5、10、20或50μg/小鼠的每个ssdna遗传表达盒。在p.i.1、3、7、14、21和28天时收集血液样品,然后每月一次,持续4个月的时间。通过生色fviii活性测定法来分析血液中的fviii活性。实施例4.昆虫细胞中带有b19d135和gpvd162非aav细小病毒itr的衍生物的cedna表达构建体的产生和体内评价实施例4a.使用杆状病毒表达系统以生成带有b19d135和gpvd162itr衍生物的cedna表达构建体类似于实施例1d中所述的aav-fviii、b19-fviii和gpv-fviii构建体,我们使用杆状病毒表达系统用于带有b19d135和gpvd162非aav细小病毒itr衍生物的cedna形式的基因构建体在昆虫细胞中产生fviii表达。实施例4b.在hema小鼠中全身性注射带有b19d135和gpvd162非aav细小病毒itr的衍生物的cedna表达构建体。为了评价带有b19d135和gpvd162非aav细小病毒itr的衍生物的cedna构建体的fviii的体内表达,在5-12周龄hema小鼠中经由hdi全身性递送5、10、20或50μg/小鼠的每个cedna遗传表达盒。在p.i.1、3、7、14、21和28天时收集血液样品,然后每月一次,持续4个月的时间。通过生色fviii活性测定法来分析血液中的fviii活性。实施例5.ssdna和cednafviii表达构建体的脂质纳米颗粒配制剂的生成如实施例1和4所述的,产生每个ssdna或cedna后,通过微流体混合使用适当的脂质组合物(lnp-ssdna和lnp-cedna)将每个遗传构建体配制成脂质纳米颗粒(lnp)。编码侧翼为aav或非aav细小病毒itr的fviii表达盒的亲本质粒(其被配制成lnp)用作转导效率的对照。实施例6.lnp-ssdna和lnp-cedna的体外和体内评价实施例6a.经培养的肝细胞中的ssdna-和cedna-介导的fviii表达的体外评价ssdna或cednafviii表达基因构建体和相应的亲本对照质粒被配制成lnp,如实施例5中所述,用于靶向的基因递送。将huh7或hek293t(非肝细胞对照)细胞以7x104个细胞/孔接种到24孔组织培养板中,并温育过夜。第二天,以1000、500、250、125和62.5ng/孔将lnp-ssdna或lnp-cedna配制剂添加到细胞上。转导后24和48小时收获培养基和细胞。通过生色fviii活性测定法测量培养基中的fviii活性。还通过western印迹分析细胞中fviii的表达。此外,在文献中已表明,细胞组蛋白沿着raav附加体有规律地定位,产生类似于细胞染色体dna核小体模式的染色质样结构。因此,还通过southern印迹评定这些构建体的建立靶细胞持续转导所需的染色质样核小体结构的能力。实施例6b.静脉内施用后hema小鼠中lnp配制的ssdna和cedna介导的长期fviii表达的评价。以5、10、20、40、100μg/小鼠经由iv注射向5-12周龄hema小鼠施用lnp-ssdna、lnp-cedna或lnp-pdna(质粒对照),n=4/组。从注射后48小时开始,在选定的时间点收集血液样本,持续长达6个月,通过生色fviii活性测定法分析血液中的fviii活性。对于实施例1和4中所述的每个遗传构建体,用lnp-ssdna或lnp-cedna处理的小鼠中的fviii表达谱与用lnp-pdna处理的小鼠中的fviii表达谱进行比较。实施例6c.加强注射后ssdna-或cedna-介导的fviii表达的体内评价。在初始注射后2个月,以相同的剂量对实施例6b中用lnp-ssdna或lnp-cedna处理的小鼠子集给予相应的lnp的额外iv注射加强。从加强注射后48小时开始,在选定的时间点收集血液样本,持续长达6个月。通过生色fviii活性测定法分析血液中的fviii活性。用lnp-ssdna或lnp-cedna处理的小鼠中的fviii表达谱与用相应lnp-pdna处理的小鼠中的fviii表达谱进行比较。实施例7.带有b19或gpv起源的itr的基因表达构建体通常用于基因疗法的效用。实施例7a.带有b19或gpv起源的itr的报告基因基因构建体的生成。为了证明基于非aavitr的基因表达系统作为通常用于基因疗法应用的平台的效用,基于实施例1b中所述的构建体,生成包含侧翼为b19d135或gpvd162itr的绿色荧光蛋白(gfp)或荧光素酶(luc)的表达盒的报告基因构建体。因此,通过常规分子克隆技术,将b19-fviiico6xten(图1c)和gpv-fviiico6xten(图1d)中fviii的开放阅读框(orf)替换为gfp或luc的orf。还生成侧翼为b19d135或gpvd162itr的苯丙氨酸羟化酶(pah)的表达盒,该表达盒用于评价相关小鼠模型中的pah表达。实施例7b.带有b19或gpv起源的itr的ssdna报告基因基因构建体的制备。ssdna报告基因/pah构建体如实施例1c中所述制备。简略地,用lgui消化质粒。通过在95℃使lgui消化的双链dna片段产物(报告基因表达盒和质粒骨架)变性来生成具有形成的发夹itr结构的ssdna片段,然后在4℃冷却以允许回文itr序列折叠(图1a)。在小鼠模型中测试所得的ssdna构建体的建立肝脏、肌肉组织、眼睛中的光受体和中枢神经系统(cns)的持续转导的能力。实施例7c.ssdna介导的报告基因表达的体内评价。为了验证实施例7b中所述的ssdna报告基因构建体介导体内持续转基因表达的能力,以5、10或20μg/小鼠的报告基因ssdna全身性注射5-12周大的小鼠(4只动物/组)以靶向肌肉组织和cns细胞,或视网膜下注射5-12周大的小鼠(4只动物/组)以靶向感光细胞。为了评价来自b19和基于gpvitr的表达构建体的pah的表达,使用相关的疾病小鼠模型。通过hdi全身性地递送这些基因构建体以靶向肝脏。实施方案e1.一种核酸分子,其包含第一反向末端重复(itr)、第二itr和编码治疗性蛋白质的基因盒;其中所述第一itr和/或所述第二itr是非腺相关病毒(非aav)的itr,其中所述基因盒位于所述第一itr和所述第二itr之间,且其中所述治疗性蛋白质包含凝血因子。e2.根据e1所述的核酸分子,其中所述非aav选自病毒科细小病毒科的成员。e3.根据e1或e2所述的核酸分子,其中所述第一itr是非aav的itr且所述第二itr是腺相关病毒(aav)的itr或其中所述第一itr是aav的itr且所述第二itr是非aav的itr。e4.根据e1或e2所述的核酸分子,其中所述第一itr和所述第二itr是非aav的itr。e5.根据e1、e2和e4任一项所述的核酸分子,其中所述第一itr和所述第二itr是相同的。e6.根据e1至e5任一项所述的核酸分子,其中所述第一itr和/或所述第二itr包含不间断的回文序列。e7.根据e1至e5任一项所述的核酸分子,其中所述第一itr和/或所述第二itr包含间断的回文序列。e8.根据e1至e7任一项所述的核酸分子,其中所述非aav是病毒科细小病毒科的成员。e9.根据e8所述的核酸分子,其中所述病毒科细小病毒科的成员选自下组:博卡病毒属(bocavirus)、依赖病毒属(dependovirus)、红病毒属(erythrovirus)、貂阿留申病毒属(amdovirus)、细小病毒属(parvovirus)、浓核病毒属(densovirus)、重复病毒属(iteravirus)、康特拉病毒属(contravirus)、aveparvovirus、copiparvovirus、原细小病毒属(protoparvovirus)、四细小病毒属(tetraparvovirus)、双义浓核病毒属(ambidensovirus)、短小浓核病毒属(brevidensovirus)、肝胰浓核病毒属(hepandensovirus)、对虾浓核病毒属(penstyldensovirus)。e10.根据e8所述的核酸分子,其中所述病毒科细小病毒科的成员是红病毒属细小病毒b19(人类病毒)。e11.根据e8所述的核酸分子,其中所述病毒科细小病毒科的成员是番鸭细小病毒(mdpv)株。e12.根据e11所述的核酸分子,其中所述mdpv株是减毒的fz91-30。e13.根据e11所述的核酸分子,其中所述mdpv株是致病性yy。e14.根据e8所述的核酸分子,其中所述依赖细小病毒是依赖病毒属鹅细小病毒(gpv)株。e15.根据e14所述的核酸分子,其中所述gpv株是减毒的82-0321v。e16.根据e14所述的核酸分子,其中所述gpv株是致病性b。e17.根据e8所述的核酸分子,其中所述病毒科细小病毒科的成员选自下组:猪细小病毒(porcineparvovirus)(u44978)、小鼠微小病毒(miceminutevirus)(u34256)、犬细小病毒(canineparvovirus)(m19296)和水貂肠炎病毒(minkenteritisvirus)(d00765)。e18.根据e1至e17任一项所述的核酸分子,其进一步包含启动子。e19.根据e18所述的核酸分子,其中所述启动子是组织特异性启动子。e20.根据e18或e19所述的核酸分子,其中所述启动子驱动所述治疗性蛋白质在肝细胞、内皮细胞、肌肉细胞、窦状细胞或其任何组合中的表达。e21.根据e18或e19所述的核酸分子,其中所述启动子驱动所述治疗性蛋白质在肝细胞中的表达。e22.根据e18至e21任一项所述的核酸分子,其中所述启动子位于编码所述凝血因子的核酸序列的5'。e23.根据e18至e22任一项所述的核酸分子,其中所述启动子选自下组:甲状腺素启动子(mttr)、内源性人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、tristetraprolin(ttp)启动子、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、α1-抗胰蛋白酶(aat)、肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)、肌间线蛋白(des)、spc5-12、2r5sc5-12、dmck、tmck和磷酸甘油酸激酶(pgk)启动子。e24.根据e18至e23任一项所述的核酸分子,其中所述启动子包含ttp启动子。e25.根据e1至e24任一项所述的核酸分子,其中所述核苷酸序列进一步包含内含子序列。e26.根据e25所述的核酸分子,其中所述内含子序列位于编码所述凝血因子的核酸序列的5'。e27.根据e25或e26所述的核酸分子,其中所述内含子序列位于所述启动子的3'。e28.根据e25至e27任一项所述的核酸分子,其中所述内含子序列包含合成的内含子序列。e29.根据e25至e28任一项所述的核酸分子,其中所述内含子序列包含seqidno:115。e30.根据e1至e29任一项所述的核酸分子,其中所述基因盒进一步包含转录后调控元件。e31.根据e30所述的核酸分子,其中所述转录后调控元件位于编码所述凝血因子的核酸序列的3'。e32.根据e30或e31所述的核酸分子,其中所述转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(wpre)、微小rna结合位点、dna核靶向序列,或其任何组合。e33.根据e32所述的核酸分子,其中所述微小rna结合位点包含对mir142-3p的结合位点。e34.根据e1至e33任一项所述的核酸分子,其中所述基因盒进一步包含3'utr聚(a)尾序列。e35.根据e34所述的核酸分子,其中所述3'utr聚(a)尾序列选自下组:bgh聚(a)、肌动蛋白聚(a)、血红蛋白聚(a)及其任何组合。e36.根据e34或e35所述的核酸分子,其中所述3'utr聚(a)尾序列包含bgh聚(a)。e37.根据e1至e36任一项所述的核酸分子,其中所述基因盒进一步包含增强子序列。e38.根据e37所述的核酸分子,其中所述增强子序列位于所述第一itr和所述第二itr之间。e39.根据e1至e38任一项所述的核酸分子,其中所述核酸分子按此顺序包含:所述第一itr,所述基因盒和所述第二itr;其中所述基因盒包含组织特异性启动子序列、内含子序列、编码所述凝血因子的核酸序列、转录后调控元件和3'utr聚(a)尾序列。e40.根据e39所述的核酸分子,其中所述基因盒按此顺序包含:组织特异性启动子序列、内含子序列、编码所述fviii多肽的核酸序列、转录后调控元件和3'utr聚(a)尾序列。e41.根据e38或e39所述的核酸分子,其中:(a)所述第一itr是细小病毒科的非aav家族成员的itr;(b)所述组织特异性启动子序列包含ttp启动子;(c)所述内含子是合成的内含子;(d)所述核苷酸序列编码凝血因子;(e)所述转录后调控元件包含wpre;(f)所述3'utr聚(a)尾序列包含bghpa;和(g)所述第二itr是细小病毒科的非aav家族成员的itr。e42.根据e1至e41任一项所述的核酸分子,其中所述基因盒包含单链的核酸。e43.根据e1至e41任一项所述的核酸分子,其中所述基因盒包含双链的核酸。e44.根据e1至e43任一项所述的核酸分子,其中所述凝血因子是由肝细胞、内皮细胞、肌肉细胞、窦状细胞或其任何组合表达的。e45.根据e1至e44任一项所述的核酸分子,其中所述凝血因子包含因子i(fi)、因子ii(fii)、因子v(fv)、因子vii(fvii)、因子viii(fviii)、因子ix(fix)、因子x(fx)、因子xi(fxi)、因子xii(fxii)、因子xiii(fviii)、血管性血友病因子(vwf)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白z相关的蛋白酶抑制剂(zpi)、血纤维蛋白溶酶原、α2-抗纤维蛋白溶酶、组织血纤维蛋白溶酶原激活物(tpa)、尿激酶、血纤维蛋白溶酶原激活物抑制剂-1(pai-1)、血纤维蛋白溶酶原激活物抑制剂-2(pai2),或其任何组合。e46.根据e1至e45任一项所述的核酸分子,其中所述凝血因子是fviii。e47.根据e46所述的核酸分子,其中所述fviii包含全长成熟fviii。e48.根据e47所述的核酸分子,其中所述fviii包含与具有seqidno:106的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的氨基酸序列。e49.根据e46所述的核酸分子,其中所述fviii包含a1域、a2域、a3域、c1域、c2域和部分b域或无b域。e50.根据e49所述的核酸分子,其中fviii包含与seqidno:109的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的氨基酸序列。e51.根据e1至e50任一项所述的核酸分子,其中所述凝血因子包含异源部分。e52.根据e51所述的核酸分子,其中所述异源部分选自下组:白蛋白或其片段、免疫球蛋白fc区、人绒毛膜促性腺激素的β亚基的c端肽(ctp)、pas序列、hap序列、转铁蛋白或其片段、白蛋白结合部分、其衍生物,或其任何组合。e53.根据e51或e52所述的核酸分子,其中所述异源部分与所述fviii的n端或c端连接,或被插入在所述fviii中的两个氨基酸之间。e54.根据e53所述的核酸分子,其中所述异源部分被插入在选自表5中所列的插入位点的一个或多个插入位点处的两个氨基酸之间。e55.根据e45至e54任一项所述的核酸分子,其中所述fviii进一步包含a1域、a2域、c1域、c2域、任选的b域和异源部分,其中所述异源部分被插入在紧邻对应于成熟fviii(seqidno:106)的氨基酸745的下游。e56.根据e53至55任一项所述的核酸分子,其中所述fviii进一步包含fcrn结合配偶体。e57.根据e56所述的核酸分子,其中所述fcrn结合配偶体包含免疫球蛋白恒定域的fc区。e58.根据e45至e57任一项所述的核酸分子,其中编码所述fviii的核酸序列是密码子优化的。e59.根据e45至e58任一项所述的核酸分子,其中编码所述fviii的核酸序列经密码子优化以在人中表达。e60.根据e59所述的核酸分子,其中编码所述fviii的核酸序列包含与seqidno:107的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一的核苷酸序列。e61.根据e59所述的核酸分子,其中编码所述fviii的核酸序列包含与seqidno:71的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%同一的核苷酸序列。e62.根据e1至e61任一项所述的核酸分子,其中所述核酸分子与递送剂一起配制。e63.根据e62所述的核酸分子,其中所述递送剂包含脂质纳米颗粒。e64.根据e63所述的核酸分子,其中所述递送剂选自下组:脂质体、非脂质聚合物分子、内体及其任何组合。e65.根据e1至e64任一项所述的核酸分子,其中所述核酸分子经配制用于静脉内、经皮、皮内、皮下、肺或口服递送,或其任何组合。e66.根据e65所述的核酸分子,其中所述核酸分子经配制用于静脉内递送。e67.一种载体,其包含e1至e66任一项所述的核酸分子。e68.一种多肽,其由e1至e66任一项所述的核酸分子编码。e69.一种宿主细胞,其包含e1至e66任一项所述的核酸分子。e70.一种药物组合物,其包含(a)e1至e66任一项所述的核酸,e67所述的载体,e68所述的多肽,或e69所述的宿主细胞;(b)lnp;和(c)药学上可接受的赋形剂。e71.一种试剂盒,其包含e1至e66任一项所述的核酸分子和用于向有需要的受试者施用所述核酸分子的说明书。e72.一种杆状病毒系统,其用于产生e1至e66任一项所述的核酸分子。e73.根据e72所述的杆状系统,其中e1至e66任一项所述的核酸分子在昆虫细胞中产生。e74.一种用于表达构建体的纳米颗粒递送系统,其中所述表达构建体包含e1至e66任一项所述的核酸分子。e75.一种产生具有凝血活性的多肽的方法,其包括:在合适的条件下培养e69所述的宿主细胞并回收所述具有凝血活性的多肽。e76.一种在有需要的受试者中表达凝血因子的方法,其包括向所述受试者施用e1至e66任一项所述的核酸分子,e67所述的载体,e68所述的多肽,或e70所述的药物组合物。e77.一种治疗患有凝血因子缺乏症的受试者的方法,其包括向所述受试者施用e1至e66任一项所述的核酸分子、e67所述的载体、e68所述的多肽或e70所述的药物组合物。e78.根据e76或e77所述的方法,其中所述核酸分子是静脉内、经皮、皮内、皮下、口服、肺部或其任何组合施用的。e79.根据e78所述的方法,其中所述核酸分子是静脉内施用的。e80.根据e76至e79任一项所述的方法,其进一步包括向所述受试者施用第二药剂。e81.根据e76至e80任一项所述的方法,其中所述受试者是哺乳动物。e82.根据e76至e81任一项所述的方法,其中所述受试者是人。e83.根据e76至e82任一项所述的方法,其中向所述受试者施用所述核酸分子导致相对于在所述施用之前所述受试者中的fviii活性增加的fviii活性,其中所述fviii活性增加为至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。e84.根据e76至e83任一项所述的方法,其中所述受试者具有出血性病症。e85.根据e84所述的方法,其中所述出血性病症是血友病。e86.根据e84或e85所述的方法,其中所述出血性病症是血友病a。e83.根据e76至e82、e85和e86任一项所述的方法,其中向所述受试者施用所述核酸分子导致相对于在所述施用之前所述受试者中的fviii活性增加的fviii活性,其中相对于正常fviii活性,所述fviii活性增加至少约2%、至少约3%、至少约4%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、至少约10%、至少约11%、至少约12%、至少约13%、至少约14%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约100%、至少约110%、至少约120%、至少约130%、至少约140%、至少约150%。本申请要求于2017年8月9日提交的美国临时申请号62/543,297的权益,所述申请通过提述以其整体并入本文。序列表<110>比奥维拉迪维治疗股份有限公司(bioverativtherapeuticsinc.)<120>核酸分子及其用途<130>4159.493pc01/c-k/bmd<150>us62/543,297<151>2017-08-09<160>184<170>patentin版本3.5<210>1<211>4374<212>dna<213>人工序列<220><223>cofviii-5<400>1atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgactgaaaacatccagcggttcctccccaaccccgcgggcgtg1860cagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaacggctacgtg1920ttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtacatcctgtcc1980attggtgcccagactgacttcctgtccgtgtttttctccggctacacgttcaagcacaag2040atggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtgtttatgagc2100atggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgtaacagagga2160atgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactattatgaggac2220tcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaacctcggagc2280ttcagccagaacccacccgtgcttaagagacatcaacgggagatcactaggaccaccctg2340cagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatgaagaaggag2400gactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaaaagaaaacc2460cgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcgtcctcgccg2520cacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaaggtcgtgttc2580caggagttcactgacgggagcttcactcagcctttgtaccggggagaactcaatgaacat2640ctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatggtcactttc2700cgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttacgaagaggac2760cagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaaccaagacctac2820ttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgcaaagcctgg2880gcctacttctccgatgtggacttggagaaggacgtccactccggcctcatcggtcccctg2940ctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcaccgtgcaggag3000ttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcaccgagaacatg3060gagaggaactgcagagccccctgtaacatccagatggaggacccgacgttcaaggaaaac3120taccggttccacgccattaacggatacatcatggatacgctgccgggtcttgtgatggcc3180caggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaacatccactct3240attcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaagatggccctg3300tacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaaggccggcatt3360tggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaaccctgttcctg3420gtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacattagggatttc3480cagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgcctgcattac3540tccggatccattaacgcctggtcaaccaaggagccattctcctggatcaaggtggacctt3600ctggcccccatgattatccacggaattaagacccagggggcccggcagaagttctcctca3660ctgtacatcagccagttcataatcatgtactccctggacggaaagaagtggcaaacctac3720agggggaacagcaccggcacactgatggtctttttcggaaatgtggactcctccgggatt3780aagcataacatcttcaaccctccgattatcgctcggtacattagacttcaccctacccac3840tacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaactcgtgcagc3900atgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcctcgtcctac3960tttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctccagggaaga4020tccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtggacttccag4080aaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctgacttctatg4140tacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggaccctgttcttc4200caaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccggtggtgaac4260tcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcctgggtgcac4320cagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtactga4374<210>2<211>4374<212>dna<213>人工序列<220><223>cofviii-4<400>2atgcagatcgagctgagcacgtgcttcttcctgtgcctgctgaggttctgcttcagcgcc60accaggaggtactacctgggcgccgtggagctgagctgggactacatgcagagcgacctg120ggcgagctgcccgtggacgccaggttcccccccagggtgcccaagagcttccccttcaac180acgagcgtggtgtacaagaagaccctgttcgtggagttcaccgaccatctgttcaatatc240gccaagcccaggcccccctggatggggctgctggggcccacgatccaggccgaggtgtac300gacaccgtggtcatcaccctgaagaacatggccagccaccccgtgagcctgcacgccgtg360ggcgtgagctactggaaggccagcgagggcgccgagtacgacgaccagaccagccagagg420gagaaggaggacgacaaggtgttccccggcggcagccacacctacgtgtggcaggtgctg480aaggagaatgggcccatggccagcgaccccctgtgcctgacctactcttacctgagccac540gtggatctggtgaaggacctgaacagcggcctgatcggcgccctgctggtgtgcagggag600ggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgccgtg660ttcgacgagggcaagagctggcacagcgagaccaagaacagcctgatgcaggatagggac720gccgccagcgccagggcctggcccaagatgcacaccgtgaacggctacgtgaacaggtct780ctgcccggcctgatcggctgccacaggaagagcgtgtactggcacgtgatcggcatgggg840accacccccgaggtgcacagcatcttcctggagggccacacgttcctggtgaggaatcac900aggcaggccagcctggagatcagcccgatcaccttcctgaccgcccagaccctgctgatg960gacctggggcagttcctgctgttctgccatatcagctctcaccagcacgacggcatggag1020gcctacgtgaaggtggatagctgccccgaggagccccagctgaggatgaagaacaacgag1080gaggccgaggactacgacgacgacctgaccgacagcgagatggacgtggtgaggttcgac1140gacgacaatagcccgagcttcatccagatcaggagcgtggccaagaagcaccccaagacc1200tgggtgcattacatcgccgccgaggaggaggattgggactacgcccccctggtgctggcc1260cccgacgacaggtcttacaagagccagtacctgaacaacgggccccagaggatcggcagg1320aagtacaagaaggtgaggttcatggcctacaccgacgagaccttcaagaccagggaggcg1380atccagcacgagagcgggatcctggggcccctgctgtacggcgaggtgggcgacacgctg1440ctgatcatcttcaagaaccaggccagcaggccgtacaatatctacccccacgggatcacc1500gacgtgaggcccctgtactctaggaggctgcccaagggcgtgaagcacctgaaggacttc1560cccatcctgcccggcgagatcttcaagtacaagtggaccgtgaccgtggaggacgggccc1620acgaagagcgaccccaggtgcctgaccaggtactacagctctttcgtgaacatggagagg1680gacctggccagcggcctgatcgggcccctgctgatctgctacaaggagagcgtggatcag1740aggggcaaccagatcatgagcgacaagaggaacgtgatcctgttcagcgtgttcgacgag1800aataggtcttggtacctgaccgagaatatccagaggttcctgcccaaccccgccggcgtg1860cagctggaggatcccgagttccaggccagcaacatcatgcacagcatcaacggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttcagcggctacaccttcaagcacaag2040atggtgtacgaggataccctgaccctgttccccttcagcggcgagaccgtgttcatgagc2100atggagaaccccggcctgtggatcctgggctgccataactccgacttcaggaataggggc2160atgaccgccctgctgaaggtgagctcttgcgacaagaacaccggcgactactacgaggat2220agctacgaggatatcagcgcctacctgctgagcaagaacaacgccatcgagcccaggtct2280ttcagccagaacccccccgtgctgaagaggcaccagagggagatcaccaggacgaccctg2340cagagcgaccaggaggagatcgactacgacgacacgatcagcgtggagatgaagaaggag2400gatttcgacatctacgacgaggacgagaatcagagccccaggtctttccagaagaagacc2460aggcattacttcatcgccgccgtggagaggctgtgggactacggcatgagcagctctccc2520cacgtgctgaggaatagggcccagagcggcagcgtgccccagttcaagaaggtggtgttc2580caggagttcaccgacggcagcttcacccagcccctgtacaggggcgagctgaacgagcac2640ctgggcctgctggggccctacatcagggccgaggtggaggataacatcatggtgaccttc2700aggaatcaggccagcaggccctatagcttctatagctctctgatcagctacgaggaggat2760cagaggcagggcgccgagcccaggaagaacttcgtgaagcccaacgagaccaagacctac2820ttctggaaggtgcagcaccacatggcccccacgaaggacgagttcgactgcaaggcctgg2880gcctacttcagcgacgtggatctggagaaggacgtgcacagcggcctgatcgggcccctg2940ctggtgtgccacaccaacaccctgaaccccgcccacggcaggcaggtgaccgtgcaggag3000ttcgccctgttcttcaccatcttcgacgagaccaagagctggtacttcaccgagaatatg3060gagaggaattgcagggccccctgcaatatccagatggaggacccgaccttcaaggagaat3120tacaggttccacgccatcaacggctacatcatggacacgctgcccggcctggtcatggcc3180caggatcagaggatcaggtggtatctgctgagcatggggagcaacgagaatatccacagc3240atccacttcagcggccacgtgttcaccgtgaggaagaaggaggagtacaagatggccctg3300tacaatctgtaccccggcgtgttcgagaccgtggagatgctgcccagcaaggccgggatc3360tggagggtggagtgcctgatcggcgagcacctgcacgccggcatgagcacgctgttcctg3420gtgtactctaacaagtgccagacccccctggggatggccagcggccacatcagggacttc3480cagatcaccgccagcggccagtacggccagtgggcccccaagctggccaggctgcactat3540tccggaagcatcaacgcctggagcacgaaggagcccttcagctggatcaaggtggatctg3600ctggcccccatgatcatccacgggatcaagacccagggcgccaggcagaagttcagctct3660ctgtatatcagccagttcatcatcatgtactctctggacggcaagaagtggcagacctac3720aggggcaacagcaccggcacgctgatggtgttcttcggcaacgtggactctagcgggatc3780aagcacaatatcttcaacccccccatcatcgccaggtacatcaggctgcaccccacccat3840tactctatcaggtctaccctgaggatggagctgatgggctgcgacctgaacagctgcagc3900atgcccctggggatggagagcaaggccatcagcgacgcccagatcaccgccagctcttac3960ttcaccaacatgttcgccacctggagcccgagcaaggccaggctgcacctgcagggcagg4020tctaacgcctggaggccccaggtgaacaaccccaaggagtggctgcaggtggatttccag4080aagaccatgaaggtgaccggcgtgaccacgcagggcgtgaagagcctgctgaccagcatg4140tacgtgaaggagttcctgatcagctctagccaggacggccaccagtggaccctgttcttc4200cagaacggcaaggtgaaggtgttccagggcaaccaggatagcttcacccccgtggtgaac4260agcctggacccccccctgctgaccaggtatctgaggatccacccccagagctgggtgcac4320cagatcgccctgaggatggaggtgctgggctgcgaggcccaggatctgtattga4374<210>3<211>4374<212>dna<213>人工序列<220><223>cofviii-52<400>3atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgaccgagaacatccagaggttcctgcccaaccctgctggggtg1860cagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaatggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttcaagcacaag2040atggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtcttcatgagc2100atggagaaccctggcctgtggatcctgggctgccacaacagcgacttcaggaacaggggc2160atgactgccctgctgaaagtctccagctgtgacaagaacaccggggactactacgaggac2220agctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgagcccaggagc2280ttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccaggaccaccctg2340cagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatgaagaaggag2400gacttcgacatctacgacgaggacgagaaccagagccccaggagcttccagaagaagacc2460aggcactacttcattgctgctgtggagaggctgtgggactatggcatgtccagcagcccc2520catgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaagtcgtgttc2580caggagttcaccgacggcagcttcacccagcccctgtacagaggggagctgaacgagcac2640ctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatggtgaccttc2700aggaaccaggccagcaggccctacagcttctacagcagcctgatcagctacgaggaggac2760cagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaaccaagacctac2820ttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgcaaggcctgg2880gcctacttctctgacgtggacctggagaaggacgtgcactctggcctgattggccccctg2940ctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgactgtgcaggag3000ttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcactgagaacatg3060gagaggaactgcagggccccctgcaacatccagatggaggaccccaccttcaaggagaac3120tacaggttccatgccatcaatggctacatcatggacaccctgcctggcctggtcatggcc3180caggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaacatccacagc3240atccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaagatggccctg3300tacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaaggccggcatc3360tggagggtggagtgcctgattggggagcacctgcacgccggcatgagcaccctgttcctg3420gtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatcagggacttc3480cagatcactgcctctggccagtacggccagtgggcccccaagctggccaggctgcactac3540tccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaagtggacctg3600ctggcccccatgatcatccacggcatcaagacccagggggccaggcagaagttctccagc3660ctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtggcagacctac3720aggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagcagcggcatc3780aagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcaccccacccac3840tacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaacagctgcagc3900atgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcctccagctac3960ttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctgcagggcagg4020agcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtggacttccag4080aagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctgaccagcatg4140tacgtgaaggagttcctgatctccagcagccaggacggccaccagtggaccctgttcttc4200cagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccctgtggtcaac4260agcctggacccccccctgctgaccagatacctgaggatccacccccagagctgggtgcac4320cagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtactga4374<210>4<211>4374<212>dna<213>人工序列<220><223>cofviii-62<400>4atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctgaccgagaacatccagaggttcctgcccaaccctgctggggtg1860cagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaatggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttcaagcacaag2040atggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtcttcatgagc2100atggagaaccctggcctgtggatcctgggctgccacaacagcgacttcaggaacaggggc2160atgactgccctgctgaaagtctccagctgtgacaagaacaccggggactactacgaggac2220agctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgagcccaggagc2280ttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccaggaccaccctg2340cagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatgaagaaggag2400gacttcgacatctacgacgaggacgagaaccagagccccaggagcttccagaagaagacc2460aggcactacttcattgctgctgtggagaggctgtgggactatggcatgtccagcagcccc2520catgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaagtcgtgttc2580caggagttcaccgacggcagcttcacccagcccctgtacagaggggagctgaacgagcac2640ctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatggtgaccttc2700aggaaccaggccagcaggccctacagcttctacagcagcctgatcagctacgaggaggac2760cagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaaccaagacctac2820ttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgcaaggcctgg2880gcctacttctctgacgtggacctggagaaggacgtgcactctggcctgattggccccctg2940ctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgactgtgcaggag3000ttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcactgagaacatg3060gagaggaactgcagggccccctgcaacatccagatggaggaccccaccttcaaggagaac3120tacaggttccatgccatcaatggctacatcatggacaccctgcctggcctggtcatggcc3180caggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaacatccacagc3240atccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaagatggccctg3300tacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaaggccggcatc3360tggagggtggagtgcctgattggggagcacctgcacgccggcatgagcaccctgttcctg3420gtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatcagggacttc3480cagatcactgcctctggccagtacggccagtgggcccccaagctggccaggctgcactac3540tccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaagtggacctg3600ctggcccccatgatcatccacggcatcaagacccagggggccaggcagaagttctccagc3660ctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtggcagacctac3720aggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagcagcggcatc3780aagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcaccccacccac3840tacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaacagctgcagc3900atgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcctccagctac3960ttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctgcagggcagg4020agcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtggacttccag4080aagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctgaccagcatg4140tacgtgaaggagttcctgatctccagcagccaggacggccaccagtggaccctgttcttc4200cagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccctgtggtcaac4260agcctggacccccccctgctgaccagatacctgaggatccacccccagagctgggtgcac4320cagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtactga4374<210>5<211>4374<212>dna<213>人工序列<220><223>cofviii-25<400>5atgcagattgagctgagcacctgcttcttcctgtgcctgctgaggttctgcttctctgcc60accaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgacctg120ggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttcaac180accagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaacatc240gccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtgtac300gacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgccgtg360ggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccagagg420gagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtcctg480aaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagccac540gtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagggag600ggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgccgtg660ttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagggac720gccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacaggagc780ctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatgggc840accacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaaccac900aggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctgatg960gacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatggag1020gcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaacgag1080gaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttcgac1140gacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaagacc1200tgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctggcc1260cctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggcagg1320aagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggaggcc1380atccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacaccctg1440ctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatcacc1500gacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagacttc1560cccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggcccc1620accaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggagagg1680gacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggaccag1740aggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtcttcgacgag1800aacaggagctggtacctgactgaaaacatccagcggttcctccccaaccccgcgggcgtg1860cagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaacggctacgtg1920ttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtacatcctgtcc1980attggtgcccagactgacttcctgtccgtgtttttctccggctacacgttcaagcacaag2040atggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtgtttatgagc2100atggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgtaacagagga2160atgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactattatgaggac2220tcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaacctcggagc2280ttcagccagaacccacccgtgcttaagagacatcaacgggagatcactaggaccaccctg2340cagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatgaagaaggag2400gactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaaaagaaaacc2460cgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcgtcctcgccg2520cacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaaggtcgtgttc2580caggagttcactgacgggagcttcactcagcctttgtaccggggagaactcaatgaacat2640ctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatggtcactttc2700cgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttacgaagaggac2760cagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaaccaagacctac2820ttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgcaaagcctgg2880gcctacttctccgatgtggacttggagaaggacgtccactccggcctcatcggtcccctg2940ctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcaccgtgcaggag3000ttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcaccgagaacatg3060gagaggaactgcagagccccctgtaacatccagatggaggacccgacgttcaaggaaaac3120taccggttccacgccattaacggatacatcatggatacgctgccgggtcttgtgatggcc3180caggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaacatccactct3240attcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaagatggccctg3300tacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaaggccggcatt3360tggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaaccctgttcctg3420gtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacattagggatttc3480cagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgcctgcattac3540tccggatccattaacgcctggtcaaccaaggagccattctcctggatcaaggtggacctt3600ctggcccccatgattatccacggaattaagacccagggggcccggcagaagttctcctca3660ctgtacatcagccagttcataatcatgtactccctggacggaaagaagtggcaaacctac3720agggggaacagcaccggcacactgatggtctttttcggaaatgtggactcctccgggatt3780aagcataacatcttcaaccctccgattatcgctcggtacattagacttcaccctacccac3840tacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaactcgtgcagc3900atgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcctcgtcctac3960tttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctccagggaaga4020tccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtggacttccag4080aaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctgacttctatg4140tacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggaccctgttcttc4200caaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccggtggtgaac4260tcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcctgggtgcac4320cagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtactga4374<210>6<211>4374<212>dna<213>人工序列<220><223>cofviii-26<400>6atgcagattgagctgagcacctgcttcttcctgtgcctgctgaggttctgcttctctgcc60accaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgacctg120ggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttcaac180accagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaacatc240gccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtgtac300gacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgccgtg360ggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccagagg420gagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtcctg480aaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagccac540gtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagggag600ggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgccgtg660ttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagggac720gccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacaggagc780ctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatgggc840accacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaaccac900aggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctgatg960gacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatggag1020gcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaacgag1080gaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttcgac1140gacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaagacc1200tgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctggcc1260cctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggcagg1320aagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggaggcc1380atccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacaccctg1440ctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatcacc1500gacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagacttc1560cccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggcccc1620accaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggagagg1680gacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggaccag1740aggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtcttcgacgag1800aacaggagctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctc2340caatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaa2400gatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaact2460agacactactttatcgccgcggtggaaagactgtgggactatggaatgtcatccagccct2520cacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttc2580caggagttcaccgacggcagcttcacccagccgctgtaccggggagaactgaacgaacac2640ctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatggtgaccttc2700cgtaaccaagcatccagaccttactccttctattcctccctgatctcatacgaggaggac2760cagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacctac2820ttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgcaaggcctgg2880gcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatcgggccgctg2940ctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcaccgtccaggag3000tttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatg3060gagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttcaaggagaac3120tatagattccacgccatcaacgggtacatcatggatactctgccggggctggtcatggcc3180caggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcactcc3240attcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctg3300tacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatc3360tggagagtggagtgcctgatcggagagcacctccacgcggggatgtccaccctcttcctg3420gtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatcagagacttc3480cagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgcttgcactac3540tccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctc3600ctggcccctatgattatccacggaattaagacccagggcgccaggcagaagttctcctcc3660ctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtggcagacttac3720aggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcctccggcatt3780aagcacaacatcttcaacccaccgatcatagccagatatattaggctccaccccactcac3840tactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaactcctgctcc3900atgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcctac3960ttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttgcagggacgg4020tcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaa4080aagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatg4140tatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggaccctgttcttc4200caaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaac4260tccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcctgggtccat4320cagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtactga4374<210>7<211>1734<212>dna<213>人工序列<220><223>cofviii-52-nt58<400>7gcgacccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgac60cttggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttc120aacacctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaat180atcgccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtg240tacgacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgcc300gtgggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcag360agagaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtg420ttgaaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcc480cacgtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagg540gaaggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgct600gtgttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagataga660gatgccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgc720tccctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatg780gggaccacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaac840caccggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctg900atggacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatg960gaggcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaat1020gaggaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttc1080gatgacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaag1140acctgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctc1200gctcctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggt1260agaaagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagag1320gccatccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacacc1380cttctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatc1440actgacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggat1500tttccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggc1560ccaactaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggag1620cgcgacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggac1680caacggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtg1734<210>8<211>2583<212>dna<213>人工序列<220><223>cofviii-52-ct<400>8tttgacgaaaaccggtcgtggtacctgaccgagaacatccagaggttcctgcccaaccct60gctggggtgcagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaat120ggctacgtgttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtac180atcctgagcatcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttc240aagcacaagatggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtc300ttcatgagcatggagaaccctggcctgtggatcctgggctgccacaacagcgacttcagg360aacaggggcatgactgccctgctgaaagtctccagctgtgacaagaacaccggggactac420tacgaggacagctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgag480cccaggagcttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccagg540accaccctgcagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatg600aagaaggaggacttcgacatctacgacgaggacgagaaccagagccccaggagcttccag660aagaagaccaggcactacttcattgctgctgtggagaggctgtgggactatggcatgtcc720agcagcccccatgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaa780gtcgtgttccaggagttcaccgacggcagcttcacccagcccctgtacagaggggagctg840aacgagcacctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatg900gtgaccttcaggaaccaggccagcaggccctacagcttctacagcagcctgatcagctac960gaggaggaccagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaacc1020aagacctacttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgc1080aaggcctgggcctacttctctgacgtggacctggagaaggacgtgcactctggcctgatt1140ggccccctgctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgact1200gtgcaggagttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcact1260gagaacatggagaggaactgcagggccccctgcaacatccagatggaggaccccaccttc1320aaggagaactacaggttccatgccatcaatggctacatcatggacaccctgcctggcctg1380gtcatggcccaggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaac1440atccacagcatccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaag1500atggccctgtacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaag1560gccggcatctggagggtggagtgcctgattggggagcacctgcacgccggcatgagcacc1620ctgttcctggtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatc1680agggacttccagatcactgcctctggccagtacggccagtgggcccccaagctggccagg1740ctgcactactccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaa1800gtggacctgctggcccccatgatcatccacggcatcaagacccagggggccaggcagaag1860ttctccagcctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtgg1920cagacctacaggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagc1980agcggcatcaagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcac2040cccacccactacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaac2100agctgcagcatgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcc2160tccagctacttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctg2220cagggcaggagcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtg2280gacttccagaagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctg2340accagcatgtacgtgaaggagttcctgatctccagcagccaggacggccaccagtggacc2400ctgttcttccagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccct2460gtggtcaacagcctggacccccccctgctgaccagatacctgaggatccacccccagagc2520tgggtgcaccagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtac2580tga2583<210>9<211>1734<212>dna<213>人工序列<220><223>cofviii-62-nt58<400>9gccactcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgac60ctgggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttccccttt120aacacctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaac180atcgccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtg240tacgacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcg300gtcggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccag360cgggaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtc420ctgaaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcc480catgtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgc540gaaggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgct600gtgttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgg660gatgccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcgg720tcactgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatg780ggcactacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaac840caccgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctc900atggacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatg960gaggcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaac1020gaggaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttc1080gatgacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaa1140acctgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctg1200gcacccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggc1260agaaagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggag1320gccattcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgatacc1380ctgctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatc1440accgacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagac1500ttccctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacggg1560cccaccaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaa1620cgggacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggat1680caacgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtg1734<210>10<211>2583<212>dna<213>人工序列<220><223>cofviii-62-ct<400>10tttgatgaaaacagatcctggtacctgaccgagaacatccagaggttcctgcccaaccct60gctggggtgcagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaat120ggctacgtgttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtac180atcctgagcatcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttc240aagcacaagatggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtc300ttcatgagcatggagaaccctggcctgtggatcctgggctgccacaacagcgacttcagg360aacaggggcatgactgccctgctgaaagtctccagctgtgacaagaacaccggggactac420tacgaggacagctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgag480cccaggagcttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccagg540accaccctgcagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatg600aagaaggaggacttcgacatctacgacgaggacgagaaccagagccccaggagcttccag660aagaagaccaggcactacttcattgctgctgtggagaggctgtgggactatggcatgtcc720agcagcccccatgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaa780gtcgtgttccaggagttcaccgacggcagcttcacccagcccctgtacagaggggagctg840aacgagcacctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatg900gtgaccttcaggaaccaggccagcaggccctacagcttctacagcagcctgatcagctac960gaggaggaccagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaacc1020aagacctacttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgc1080aaggcctgggcctacttctctgacgtggacctggagaaggacgtgcactctggcctgatt1140ggccccctgctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgact1200gtgcaggagttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcact1260gagaacatggagaggaactgcagggccccctgcaacatccagatggaggaccccaccttc1320aaggagaactacaggttccatgccatcaatggctacatcatggacaccctgcctggcctg1380gtcatggcccaggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaac1440atccacagcatccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaag1500atggccctgtacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaag1560gccggcatctggagggtggagtgcctgattggggagcacctgcacgccggcatgagcacc1620ctgttcctggtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatc1680agggacttccagatcactgcctctggccagtacggccagtgggcccccaagctggccagg1740ctgcactactccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaa1800gtggacctgctggcccccatgatcatccacggcatcaagacccagggggccaggcagaag1860ttctccagcctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtgg1920cagacctacaggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagc1980agcggcatcaagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcac2040cccacccactacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaac2100agctgcagcatgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcc2160tccagctacttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctg2220cagggcaggagcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtg2280gacttccagaagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctg2340accagcatgtacgtgaaggagttcctgatctccagcagccaggacggccaccagtggacc2400ctgttcttccagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccct2460gtggtcaacagcctggacccccccctgctgaccagatacctgaggatccacccccagagc2520tgggtgcaccagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtac2580tga2583<210>11<211>1734<212>dna<213>人工序列<220><223>cofviii-25-nt58<400>11gccaccaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgac60ctgggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttc120aacaccagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaac180atcgccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtg240tacgacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgcc300gtgggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccag360agggagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtc420ctgaaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagc480cacgtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagg540gagggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgcc600gtgttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagg660gacgccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacagg720agcctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatg780ggcaccacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaac840cacaggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctg900atggacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatg960gaggcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaac1020gaggaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttc1080gacgacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaag1140acctgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctg1200gcccctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggc1260aggaagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggag1320gccatccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacacc1380ctgctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatc1440accgacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagac1500ttccccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggc1560cccaccaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggag1620agggacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggac1680cagaggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtc1734<210>12<211>2583<212>dna<213>人工序列<220><223>cofviii-25-ct<400>12ttcgacgagaacaggagctggtacctgactgaaaacatccagcggttcctccccaacccc60gcgggcgtgcagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaac120ggctacgtgttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtac180atcctgtccattggtgcccagactgacttcctgtccgtgtttttctccggctacacgttc240aagcacaagatggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtg300tttatgagcatggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgt360aacagaggaatgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactat420tatgaggactcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaa480cctcggagcttcagccagaacccacccgtgcttaagagacatcaacgggagatcactagg540accaccctgcagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatg600aagaaggaggactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaa660aagaaaacccgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcg720tcctcgccgcacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaag780gtcgtgttccaggagttcactgacgggagcttcactcagcctttgtaccggggagaactc840aatgaacatctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatg900gtcactttccgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttac960gaagaggaccagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaacc1020aagacctacttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgc1080aaagcctgggcctacttctccgatgtggacttggagaaggacgtccactccggcctcatc1140ggtcccctgctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcacc1200gtgcaggagttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcacc1260gagaacatggagaggaactgcagagccccctgtaacatccagatggaggacccgacgttc1320aaggaaaactaccggttccacgccattaacggatacatcatggatacgctgccgggtctt1380gtgatggcccaggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaac1440atccactctattcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaag1500atggccctgtacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaag1560gccggcatttggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaacc1620ctgttcctggtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacatt1680agggatttccagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgc1740ctgcattactccggatccattaacgcctggtcaaccaaggagccattctcctggatcaag1800gtggaccttctggcccccatgattatccacggaattaagacccagggggcccggcagaag1860ttctcctcactgtacatcagccagttcataatcatgtactccctggacggaaagaagtgg1920caaacctacagggggaacagcaccggcacactgatggtctttttcggaaatgtggactcc1980tccgggattaagcataacatcttcaaccctccgattatcgctcggtacattagacttcac2040cctacccactacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaac2100tcgtgcagcatgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcc2160tcgtcctactttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctc2220cagggaagatccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtg2280gacttccagaaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctg2340acttctatgtacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggacc2400ctgttcttccaaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccg2460gtggtgaactcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcc2520tgggtgcaccagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtac2580tga2583<210>13<211>1734<212>dna<213>人工序列<220><223>cofviii-26-nt58<400>13gccaccaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgac60ctgggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttc120aacaccagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaac180atcgccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtg240tacgacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgcc300gtgggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccag360agggagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtc420ctgaaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagc480cacgtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagg540gagggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgcc600gtgttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagg660gacgccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacagg720agcctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatg780ggcaccacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaac840cacaggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctg900atggacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatg960gaggcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaac1020gaggaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttc1080gacgacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaag1140acctgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctg1200gcccctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggc1260aggaagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggag1320gccatccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacacc1380ctgctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatc1440accgacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagac1500ttccccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggc1560cccaccaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggag1620agggacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggac1680cagaggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtc1734<210>14<211>2583<212>dna<213>人工序列<220><223>cofviii-26-ct<400>14ttcgacgagaacaggagctggtacctcactgaaaacatccagaggttcctcccaaacccc60gcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaac120ggttacgtgttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtac180attctgtccatcggcgcccagactgacttcctgagcgtgttcttttccggttacaccttt240aagcacaagatggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtg300ttcatgtcgatggagaacccgggtctgtggattctgggatgccacaacagcgactttcgg360aaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactac420tacgaggactcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgag480ccgcgcagcttcagccagaacccgcctgtgctgaagaggcaccagcgagaaattacccgg540accaccctccaatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatg600aagaaggaagatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaa660aagaaaactagacactactttatcgccgcggtggaaagactgtgggactatggaatgtca720tccagccctcacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaa780gtggtgttccaggagttcaccgacggcagcttcacccagccgctgtaccggggagaactg840aacgaacacctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatg900gtgaccttccgtaaccaagcatccagaccttactccttctattcctccctgatctcatac960gaggaggaccagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagact1020aagacctacttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgc1080aaggcctgggcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatc1140gggccgctgctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcacc1200gtccaggagtttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcacc1260gagaatatggagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttc1320aaggagaactatagattccacgccatcaacgggtacatcatggatactctgccggggctg1380gtcatggcccaggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaac1440attcactccattcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaag1500atggcgctgtacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaag1560gccggcatctggagagtggagtgcctgatcggagagcacctccacgcggggatgtccacc1620ctcttcctggtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatc1680agagacttccagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgc1740ttgcactactccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaag1800gtggacctcctggcccctatgattatccacggaattaagacccagggcgccaggcagaag1860ttctcctccctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtgg1920cagacttacaggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcc1980tccggcattaagcacaacatcttcaacccaccgatcatagccagatatattaggctccac2040cccactcactactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaac2100tcctgctccatgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcg2160agctcctacttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttg2220cagggacggtcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtg2280gatttccaaaagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctg2340acctcgatgtatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggacc2400ctgttcttccaaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacaccc2460gtggtgaactccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcc2520tgggtccatcagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtac2580tga2583<210>15<211>2332<212>prt<213>人(homosapiens)<400>15alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargproleutyrserargargleuprolysglyvallys485490495hisleulysasppheproileleuproglygluilephelystyrlys500505510trpthrvalthrvalgluaspglyprothrlysseraspproargcys515520525leuthrargtyrtyrserserphevalasnmetgluargaspleuala530535540serglyleuileglyproleuleuilecystyrlysgluservalasp545550555560glnargglyasnglnilemetserasplysargasnvalileleuphe565570575servalpheaspgluasnargsertrptyrleuthrgluasnilegln580585590argpheleuproasnproalaglyvalglnleugluaspprogluphe595600605glnalaserasnilemethisserileasnglytyrvalpheaspser610615620leuglnleuservalcysleuhisgluvalalatyrtrptyrileleu625630635640serileglyalaglnthrasppheleuservalphepheserglytyr645650655thrphelyshislysmetvaltyrgluaspthrleuthrleuphepro660665670pheserglygluthrvalphemetsermetgluasnproglyleutrp675680685ileleuglycyshisasnserasppheargasnargglymetthrala690695700leuleulysvalsersercysasplysasnthrglyasptyrtyrglu705710715720aspsertyrgluaspileseralatyrleuleuserlysasnasnala725730735ilegluproargserpheserglnasnserarghisproserthrarg740745750glnlysglnpheasnalathrthrileprogluasnaspileglulys755760765thraspprotrpphealahisargthrprometprolysileglnasn770775780valserserseraspleuleumetleuleuargglnserprothrpro785790795800hisglyleuserleuseraspleuglnglualalystyrgluthrphe805810815seraspaspproserproglyalaileaspserasnasnserleuser820825830glumetthrhispheargproglnleuhishisserglyaspmetval835840845phethrprogluserglyleuglnleuargleuasnglulysleugly850855860thrthralaalathrgluleulyslysleuaspphelysvalserser865870875880thrserasnasnleuileserthrileproseraspasnleualaala885890895glythraspasnthrserserleuglyproprosermetprovalhis900905910tyraspserglnleuaspthrthrleupheglylyslysserserpro915920925leuthrgluserglyglyproleuserleuserglugluasnasnasp930935940serlysleuleugluserglyleumetasnserglnglusersertrp945950955960glylysasnvalserserthrgluserglyargleuphelysglylys965970975argalahisglyproalaleuleuthrlysaspasnalaleuphelys980985990valserileserleuleulysthrasnlysthrserasnasnserala99510001005thrasnarglysthrhisileaspglyproserleuleuileglu101010151020asnserproservaltrpglnasnileleugluseraspthrglu102510301035phelyslysvalthrproleuilehisaspargmetleumetasp104010451050lysasnalathralaleuargleuasnhismetserasnlysthr105510601065thrserserlysasnmetglumetvalglnglnlyslysglugly107010751080proileproproaspalaglnasnproaspmetserphephelys108510901095metleupheleuprogluseralaargtrpileglnargthrhis110011051110glylysasnserleuasnserglyglnglyproserprolysgln111511201125leuvalserleuglyproglulysservalgluglyglnasnphe113011351140leuserglulysasnlysvalvalvalglylysglygluphethr114511501155lysaspvalglyleulysglumetvalpheproserserargasn116011651170leupheleuthrasnleuaspasnleuhisgluasnasnthrhis117511801185asnglnglulyslysileglnglugluileglulyslysgluthr119011951200leuileglngluasnvalvalleuproglnilehisthrvalthr120512101215glythrlysasnphemetlysasnleupheleuleuserthrarg122012251230glnasnvalgluglysertyraspglyalatyralaprovalleu123512401245glnasppheargserleuasnaspserthrasnargthrlyslys125012551260histhralahispheserlyslysglygluglugluasnleuglu126512701275glyleuglyasnglnthrlysglnilevalglulystyralacys128012851290thrthrargileserproasnthrserglnglnasnphevalthr129513001305glnargserlysargalaleulysglnpheargleuproleuglu131013151320gluthrgluleuglulysargileilevalaspaspthrserthr132513301335glntrpserlysasnmetlyshisleuthrproserthrleuthr134013451350glnileasptyrasnglulysglulysglyalailethrglnser135513601365proleuseraspcysleuthrargserhisserileproglnala137013751380asnargserproleuproilealalysvalserserpheproser138513901395ileargproiletyrleuthrargvalleupheglnaspasnser140014051410serhisleuproalaalasertyrarglyslysaspserglyval141514201425glngluserserhispheleuglnglyalalyslysasnasnleu143014351440serleualaileleuthrleuglumetthrglyaspglnargglu144514501455valglyserleuglythrseralathrasnservalthrtyrlys146014651470lysvalgluasnthrvalleuprolysproaspleuprolysthr147514801485serglylysvalgluleuleuprolysvalhisiletyrglnlys149014951500aspleupheprothrgluthrserasnglyserproglyhisleu150515101515aspleuvalgluglyserleuleuglnglythrgluglyalaile152015251530lystrpasnglualaasnargproglylysvalpropheleuarg153515401545valalathrgluserseralalysthrproserlysleuleuasp155015551560proleualatrpaspasnhistyrglythrglnileprolysglu156515701575glutrplysserglnglulysserproglulysthralaphelys158015851590lyslysaspthrileleuserleuasnalacysgluserasnhis159516001605alailealaalaileasngluglyglnasnlysprogluileglu161016151620valthrtrpalalysglnglyargthrgluargleucyssergln162516301635asnproprovalleulysarghisglnarggluilethrargthr164016451650thrleuglnseraspglnglugluileasptyraspaspthrile165516601665servalglumetlyslysgluasppheaspiletyraspgluasp167016751680gluasnglnserproargserpheglnlyslysthrarghistyr168516901695pheilealaalavalgluargleutrpasptyrglymetserser170017051710serprohisvalleuargasnargalaglnserglyservalpro171517201725glnphelyslysvalvalpheglngluphethraspglyserphe173017351740thrglnproleutyrargglygluleuasngluhisleuglyleu174517501755leuglyprotyrileargalagluvalgluaspasnilemetval176017651770thrpheargasnglnalaserargprotyrserphetyrserser177517801785leuilesertyrglugluaspglnargglnglyalagluproarg179017951800lysasnphevallysproasngluthrlysthrtyrphetrplys180518101815valglnhishismetalaprothrlysaspglupheaspcyslys182018251830alatrpalatyrpheseraspvalaspleuglulysaspvalhis183518401845serglyleuileglyproleuleuvalcyshisthrasnthrleu185018551860asnproalahisglyargglnvalthrvalglngluphealaleu186518701875phephethrilepheaspgluthrlyssertrptyrphethrglu188018851890asnmetgluargasncysargalaprocysasnileglnmetglu189519001905aspprothrphelysgluasntyrargphehisalaileasngly191019151920tyrilemetaspthrleuproglyleuvalmetalaglnaspgln192519301935argileargtrptyrleuleusermetglyserasngluasnile194019451950hisserilehispheserglyhisvalphethrvalarglyslys195519601965gluglutyrlysmetalaleutyrasnleutyrproglyvalphe197019751980gluthrvalglumetleuproserlysalaglyiletrpargval198519901995glucysleuileglygluhisleuhisalaglymetserthrleu200020052010pheleuvaltyrserasnlyscysglnthrproleuglymetala201520202025serglyhisileargasppheglnilethralaserglyglntyr203020352040glyglntrpalaprolysleualaargleuhistyrserglyser204520502055ileasnalatrpserthrlysgluprophesertrpilelysval206020652070aspleuleualaprometileilehisglyilelysthrglngly207520802085alaargglnlyspheserserleutyrileserglnpheileile209020952100mettyrserleuaspglylyslystrpglnthrtyrargglyasn210521102115serthrglythrleumetvalphepheglyasnvalaspserser212021252130glyilelyshisasnilepheasnproproileilealaargtyr213521402145ileargleuhisprothrhistyrserileargserthrleuarg215021552160metgluleumetglycysaspleuasnsercyssermetproleu216521702175glymetgluserlysalaileseraspalaglnilethralaser218021852190sertyrphethrasnmetphealathrtrpserproserlysala219522002205argleuhisleuglnglyargserasnalatrpargproglnval221022152220asnasnprolysglutrpleuglnvalasppheglnlysthrmet222522302235lysvalthrglyvalthrthrglnglyvallysserleuleuthr224022452250sermettyrvallysglupheleuileserserserglnaspgly225522602265hisglntrpthrleuphepheglnasnglylysvallysvalphe227022752280glnglyasnglnaspserphethrprovalvalasnserleuasp228522902295proproleuleuthrargtyrleuargilehisproglnsertrp230023052310valhisglnilealaleuargmetgluvalleuglycysgluala231523202325glnaspleutyr2330<210>16<211>4371<212>dna<213>人工序列<220><223>bdd-fviii(未优化的;"亲本的"),核苷酸序列<400>16atgcaaatagagctctccacctgcttctttctgtgccttttgcgattctgctttagtgcc60accagaagatactacctgggtgcagtggaactgtcatgggactatatgcaaagtgatctc120ggtgagctgcctgtggacgcaagatttcctcctagagtgccaaaatcttttccattcaac180acctcagtcgtgtacaaaaagactctgtttgtagaattcacggatcaccttttcaacatc240gctaagccaaggccaccctggatgggtctgctaggtcctaccatccaggctgaggtttat300gatacagtggtcattacacttaagaacatggcttcccatcctgtcagtcttcatgctgtt360ggtgtatcctactggaaagcttctgagggagctgaatatgatgatcagaccagtcaaagg420gagaaagaagatgataaagtcttccctggtggaagccatacatatgtctggcaggtcctg480aaagagaatggtccaatggcctctgacccactgtgccttacctactcatatctttctcat540gtggacctggtaaaagacttgaattcaggcctcattggagccctactagtatgtagagaa600gggagtctggccaaggaaaagacacagaccttgcacaaatttatactactttttgctgta660tttgatgaagggaaaagttggcactcagaaacaaagaactccttgatgcaggatagggat720gctgcatctgctcgggcctggcctaaaatgcacacagtcaatggttatgtaaacaggtct780ctgccaggtctgattggatgccacaggaaatcagtctattggcatgtgattggaatgggc840accactcctgaagtgcactcaatattcctcgaaggtcacacatttcttgtgaggaaccat900cgccaggcgtccttggaaatctcgccaataactttccttactgctcaaacactcttgatg960gaccttggacagtttctactgttttgtcatatctcttcccaccaacatgatggcatggaa1020gcttatgtcaaagtagacagctgtccagaggaaccccaactacgaatgaaaaataatgaa1080gaagcggaagactatgatgatgatcttactgattctgaaatggatgtggtcaggtttgat1140gatgacaactctccttcctttatccaaattcgctcagttgccaagaagcatcctaaaact1200tgggtacattacattgctgctgaagaggaggactgggactatgctcccttagtcctcgcc1260cccgatgacagaagttataaaagtcaatatttgaacaatggccctcagcggattggtagg1320aagtacaaaaaagtccgatttatggcatacacagatgaaacctttaagactcgtgaagct1380attcagcatgaatcaggaatcttgggacctttactttatggggaagttggagacacactg1440ttgattatatttaagaatcaagcaagcagaccatataacatctaccctcacggaatcact1500gatgtccgtcctttgtattcaaggagattaccaaaaggtgtaaaacatttgaaggatttt1560ccaattctgccaggagaaatattcaaatataaatggacagtgactgtagaagatgggcca1620actaaatcagatcctcggtgcctgacccgctattactctagtttcgttaatatggagaga1680gatctagcttcaggactcattggccctctcctcatctgctacaaagaatctgtagatcaa1740agaggaaaccagataatgtcagacaagaggaatgtcatcctgttttctgtatttgatgag1800aaccgaagctggtacctcacagagaatatacaacgctttctccccaatccagctggagtg1860cagcttgaggatccagagttccaagcctccaacatcatgcacagcatcaatggctatgtt1920tttgatagtttgcagttgtcagtttgtttgcatgaggtggcatactggtacattctaagc1980attggagcacagactgacttcctttctgtcttcttctctggatataccttcaaacacaaa2040atggtctatgaagacacactcaccctattcccattctcaggagaaactgtcttcatgtcg2100atggaaaacccaggtctatggattctggggtgccacaactcagactttcggaacagaggc2160atgaccgccttactgaaggtttctagttgtgacaagaacactggtgattattacgaggac2220agttatgaagatatttcagcatacttgctgagtaaaaacaatgccattgaaccaagaagc2280ttctctcaaaacccaccagtcttgaaacgccatcaacgggaaataactcgtactactctt2340cagtcagatcaagaggaaattgactatgatgataccatatcagttgaaatgaagaaggaa2400gattttgacatttatgatgaggatgaaaatcagagcccccgcagctttcaaaagaaaaca2460cgacactattttattgctgcagtggagaggctctgggattatgggatgagtagctcccca2520catgttctaagaaacagggctcagagtggcagtgtccctcagttcaagaaagttgttttc2580caggaatttactgatggctcctttactcagcccttataccgtggagaactaaatgaacat2640ttgggactcctggggccatatataagagcagaagttgaagataatatcatggtaactttc2700agaaatcaggcctctcgtccctattccttctattctagccttatttcttatgaggaagat2760cagaggcaaggagcagaacctagaaaaaactttgtcaagcctaatgaaaccaaaacttac2820ttttggaaagtgcaacatcatatggcacccactaaagatgagtttgactgcaaagcctgg2880gcttatttctctgatgttgacctggaaaaagatgtgcactcaggcctgattggacccctt2940ctggtctgccacactaacacactgaaccctgctcatgggagacaagtgacagtacaggaa3000tttgctctgtttttcaccatctttgatgagaccaaaagctggtacttcactgaaaatatg3060gaaagaaactgcagggctccctgcaatatccagatggaagatcccacttttaaagagaat3120tatcgcttccatgcaatcaatggctacataatggatacactacctggcttagtaatggct3180caggatcaaaggattcgatggtatctgctcagcatgggcagcaatgaaaacatccattct3240attcatttcagtggacatgtgttcactgtacgaaaaaaagaggagtataaaatggcactg3300tacaatctctatccaggtgtttttgagacagtggaaatgttaccatccaaagctggaatt3360tggcgggtggaatgccttattggcgagcatctacatgctgggatgagcacactttttctg3420gtgtacagcaataagtgtcagactcccctgggaatggcttctggacacattagagatttt3480cagattacagcttcaggacaatatggacagtgggccccaaagctggccagacttcattat3540tccggatcaatcaatgcctggagcaccaaggagcccttttcttggatcaaggtggatctg3600ttggcaccaatgattattcacggcatcaagacccagggtgcccgtcagaagttctccagc3660ctctacatctctcagtttatcatcatgtatagtcttgatgggaagaagtggcagacttat3720cgaggaaattccactggaaccttaatggtcttctttggcaatgtggattcatctgggata3780aaacacaatatttttaaccctccaattattgctcgatacatccgtttgcacccaactcat3840tatagcattcgcagcactcttcgcatggagttgatgggctgtgatttaaatagttgcagc3900atgccattgggaatggagagtaaagcaatatcagatgcacagattactgcttcatcctac3960tttaccaatatgtttgccacctggtctccttcaaaagctcgacttcacctccaagggagg4020agtaatgcctggagacctcaggtgaataatccaaaagagtggctgcaagtggacttccag4080aagacaatgaaagtcacaggagtaactactcagggagtaaaatctctgcttaccagcatg4140tatgtgaaggagttcctcatctccagcagtcaagatggccatcagtggactctctttttt4200cagaatggcaaagtaaaggtttttcagggaaatcaagactccttcacacctgtggtgaac4260tctctagacccaccgttactgactcgctaccttcgaattcacccccagagttgggtgcac4320cagattgccctgaggatggaggttctgggctgcgaggcacaggacctctac4371<210>17<211>1438<212>prt<213>人工序列<220><223>bdd-fviii(未优化的;"亲本的"),氨基酸序列<400>17alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargproleutyrserargargleuprolysglyvallys485490495hisleulysasppheproileleuproglygluilephelystyrlys500505510trpthrvalthrvalgluaspglyprothrlysseraspproargcys515520525leuthrargtyrtyrserserphevalasnmetgluargaspleuala530535540serglyleuileglyproleuleuilecystyrlysgluservalasp545550555560glnargglyasnglnilemetserasplysargasnvalileleuphe565570575servalpheaspgluasnargsertrptyrleuthrgluasnilegln580585590argpheleuproasnproalaglyvalglnleugluaspprogluphe595600605glnalaserasnilemethisserileasnglytyrvalpheaspser610615620leuglnleuservalcysleuhisgluvalalatyrtrptyrileleu625630635640serileglyalaglnthrasppheleuservalphepheserglytyr645650655thrphelyshislysmetvaltyrgluaspthrleuthrleuphepro660665670pheserglygluthrvalphemetsermetgluasnproglyleutrp675680685ileleuglycyshisasnserasppheargasnargglymetthrala690695700leuleulysvalsersercysasplysasnthrglyasptyrtyrglu705710715720aspsertyrgluaspileseralatyrleuleuserlysasnasnala725730735ilegluproargserpheserglnasnproprovalleulysarghis740745750glnarggluilethrargthrthrleuglnseraspglnglugluile755760765asptyraspaspthrileservalglumetlyslysgluasppheasp770775780iletyraspgluaspgluasnglnserproargserpheglnlyslys785790795800thrarghistyrpheilealaalavalgluargleutrpasptyrgly805810815metserserserprohisvalleuargasnargalaglnserglyser820825830valproglnphelyslysvalvalpheglngluphethraspglyser835840845phethrglnproleutyrargglygluleuasngluhisleuglyleu850855860leuglyprotyrileargalagluvalgluaspasnilemetvalthr865870875880pheargasnglnalaserargprotyrserphetyrserserleuile885890895sertyrglugluaspglnargglnglyalagluproarglysasnphe900905910vallysproasngluthrlysthrtyrphetrplysvalglnhishis915920925metalaprothrlysaspglupheaspcyslysalatrpalatyrphe930935940seraspvalaspleuglulysaspvalhisserglyleuileglypro945950955960leuleuvalcyshisthrasnthrleuasnproalahisglyarggln965970975valthrvalglngluphealaleuphephethrilepheaspgluthr980985990lyssertrptyrphethrgluasnmetgluargasncysargalapro99510001005cysasnileglnmetgluaspprothrphelysgluasntyrarg101010151020phehisalaileasnglytyrilemetaspthrleuproglyleu102510301035valmetalaglnaspglnargileargtrptyrleuleusermet104010451050glyserasngluasnilehisserilehispheserglyhisval105510601065phethrvalarglyslysgluglutyrlysmetalaleutyrasn107010751080leutyrproglyvalphegluthrvalglumetleuproserlys108510901095alaglyiletrpargvalglucysleuileglygluhisleuhis110011051110alaglymetserthrleupheleuvaltyrserasnlyscysgln111511201125thrproleuglymetalaserglyhisileargasppheglnile113011351140thralaserglyglntyrglyglntrpalaprolysleualaarg114511501155leuhistyrserglyserileasnalatrpserthrlysglupro116011651170phesertrpilelysvalaspleuleualaprometileilehis117511801185glyilelysthrglnglyalaargglnlyspheserserleutyr119011951200ileserglnpheileilemettyrserleuaspglylyslystrp120512101215glnthrtyrargglyasnserthrglythrleumetvalphephe122012251230glyasnvalaspserserglyilelyshisasnilepheasnpro123512401245proileilealaargtyrileargleuhisprothrhistyrser125012551260ileargserthrleuargmetgluleumetglycysaspleuasn126512701275sercyssermetproleuglymetgluserlysalaileserasp128012851290alaglnilethralasersertyrphethrasnmetphealathr129513001305trpserproserlysalaargleuhisleuglnglyargserasn131013151320alatrpargproglnvalasnasnprolysglutrpleuglnval132513301335asppheglnlysthrmetlysvalthrglyvalthrthrglngly134013451350vallysserleuleuthrsermettyrvallysglupheleuile135513601365serserserglnaspglyhisglntrpthrleuphepheglnasn137013751380glylysvallysvalpheglnglyasnglnaspserphethrpro138513901395valvalasnserleuaspproproleuleuthrargtyrleuarg140014051410ilehisproglnsertrpvalhisglnilealaleuargmetglu141514201425valleuglycysglualaglnaspleutyr14301435<210>18<211>450<212>dna<213>人工序列<220><223>xten核苷酸序列<400>18ggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagccaca60tctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctggctcc120gagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccagaaagc180ggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccggctct240cctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccaggatct300gaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccggagagt360gggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcgggctcg420cccaccagcactgaagaaggtgcctcgagc450<210>19<211>4824<212>dna<213>人工序列<220><223>cofviii-52-xten<400>19atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgaccgagaacatccagaggttcctgcccaaccctgctggggtg1860cagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaatggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttcaagcacaag2040atggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtcttcatgagc2100atggagaaccctggcctgtggatcctgggctgccacaacagcgacttcaggaacaggggc2160atgactgccctgctgaaagtctccagctgtgacaagaacaccggggactactacgaggac2220agctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgagcccaggagc2280ttctctcagaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagccccccagtgctgaagagg2760caccagagggagatcaccaggaccaccctgcagtctgaccaggaggagatcgactatgat2820gacaccatcagcgtggagatgaagaaggaggacttcgacatctacgacgaggacgagaac2880cagagccccaggagcttccagaagaagaccaggcactacttcattgctgctgtggagagg2940ctgtgggactatggcatgtccagcagcccccatgtgctgaggaacagggcccagtctggc3000agcgtgccccagttcaagaaagtcgtgttccaggagttcaccgacggcagcttcacccag3060cccctgtacagaggggagctgaacgagcacctgggcctgctgggcccctacatcagggcc3120gaggtggaggacaacatcatggtgaccttcaggaaccaggccagcaggccctacagcttc3180tacagcagcctgatcagctacgaggaggaccagaggcagggggctgagcccaggaagaac3240tttgtgaagcccaatgaaaccaagacctacttctggaaggtgcagcaccacatggccccc3300accaaggacgagttcgactgcaaggcctgggcctacttctctgacgtggacctggagaag3360gacgtgcactctggcctgattggccccctgctggtgtgccacaccaacaccctgaaccct3420gcccatggcaggcaggtgactgtgcaggagttcgccctgttcttcaccatcttcgatgaa3480accaagagctggtacttcactgagaacatggagaggaactgcagggccccctgcaacatc3540cagatggaggaccccaccttcaaggagaactacaggttccatgccatcaatggctacatc3600atggacaccctgcctggcctggtcatggcccaggaccagaggatcaggtggtatctgctg3660agcatgggcagcaacgagaacatccacagcatccacttctctggccacgtgttcactgtg3720aggaagaaggaggagtacaagatggccctgtacaacctgtaccctggggtgttcgaaacc3780gtggagatgctgcccagcaaggccggcatctggagggtggagtgcctgattggggagcac3840ctgcacgccggcatgagcaccctgttcctggtgtacagcaacaagtgccagacccccctg3900ggcatggcctctggccacatcagggacttccagatcactgcctctggccagtacggccag3960tgggcccccaagctggccaggctgcactactccggaagcatcaatgcctggagcaccaag4020gagcccttcagctggatcaaagtggacctgctggcccccatgatcatccacggcatcaag4080acccagggggccaggcagaagttctccagcctgtacatcagccagttcatcatcatgtac4140agcctggacggcaagaagtggcagacctacaggggcaacagcaccggcaccctgatggtg4200ttcttcggcaacgtggacagcagcggcatcaagcacaacatcttcaacccccccatcatc4260gccagatacatcaggctgcaccccacccactacagcatcaggagcaccctgaggatggag4320ctgatgggctgtgacctgaacagctgcagcatgcccctgggcatggagagcaaggccatc4380tctgacgcccagatcactgcctccagctacttcaccaacatgtttgccacctggagcccc4440agcaaggccaggctgcacctgcagggcaggagcaatgcctggaggccccaggtcaacaac4500cccaaggagtggctgcaggtggacttccagaagaccatgaaggtgactggggtgaccacc4560cagggggtgaagagcctgctgaccagcatgtacgtgaaggagttcctgatctccagcagc4620caggacggccaccagtggaccctgttcttccagaatggcaaggtgaaggtgttccagggc4680aaccaggacagcttcacccctgtggtcaacagcctggacccccccctgctgaccagatac4740ctgaggatccacccccagagctgggtgcaccagatcgccctgaggatggaggtgctgggc4800tgtgaggcccaggacctgtactga4824<210>20<211>4824<212>dna<213>人工序列<220><223>cofviii-1-xten<400>20atgcagattgagctgtctacttgctttttcctgtgcctgctgaggttttgcttttccgct60acacgaaggtattatctgggggctgtggaactgtcttgggattacatgcagagtgacctg120ggagagctgccagtggacgcaaggtttccccctagagtccctaagtcattccccttcaac180actagcgtggtctacaagaaaacactgttcgtggagtttactgatcacctgttcaacatc240gcaaagcctaggccaccctggatgggactgctggggccaacaatccaggccgaggtgtac300gacaccgtggtcattacacttaagaacatggcctcacaccccgtgagcctgcatgctgtg360ggcgtcagctactggaaggcttccgaaggagcagagtatgacgatcagacttcccagaga420gaaaaagaggacgataaggtgtttcctggcggatctcatacctacgtgtggcaggtcctg480aaagagaatggccctatggcctccgaccctctgtgcctgacctactcttatctgagtcac540gtggacctggtcaaggatctgaacagcggcctgatcggagccctgctggtgtgcagggaa600ggaagcctggctaaggagaaaacccagacactgcataagttcattctgctgttcgccgtg660tttgacgaagggaaatcatggcacagcgagacaaagaatagtctgatgcaggacagggat720gccgcttcagccagagcttggcccaaaatgcacactgtgaacggctacgtcaatcgctca780ctgcctgggctgatcggctgccaccgaaagagcgtgtattggcatgtcatcgggatgggc840accacacctgaagtgcactccattttcctggagggacatacctttctggtccgcaaccac900cgacaggcttccctggagatctctccaattaccttcctgacagcacagactctgctgatg960gacctggggcagttcctgctgttttgccacatcagctcccaccagcatgatggcatggag1020gcttacgtgaaagtggactcttgtcccgaggaacctcagctgcggatgaagaacaatgag1080gaagcagaagactatgacgatgacctgaccgactccgagatggatgtggtccgattcgat1140gacgataacagcccctcctttatccagattagatctgtggccaagaaacaccctaagaca1200tgggtccattacatcgcagccgaggaagaggactgggattatgcaccactggtgctggca1260ccagacgatcgctcctacaaatctcagtatctgaacaatgggccacagaggattggcaga1320aagtacaagaaagtgcggttcatggcatataccgatgagaccttcaagactcgcgaagcc1380atccagcacgagagcggcatcctgggaccactgctgtacggagaagtgggagacaccctg1440ctgatcattttcaagaaccaggccagccggccttacaatatctatccacatgggattaca1500gatgtgcgccctctgtacagcaggagactgccaaagggcgtcaaacacctgaaggacttc1560ccaatcctgcccggagaaatcttcaagtacaagtggactgtcaccgtcgaggatggcccc1620actaagagcgaccctcggtgcctgacccgctactattctagtttcgtgaatatggaaaga1680gatctggcaagcggactgatcggaccactgctgatttgttacaaagagagcgtggatcag1740agaggcaaccagatcatgtccgacaagcggaatgtgattctgttcagtgtctttgacgaa1800aacaggtcatggtacctgaccgagaacatccagagattcctgcctaatccagctggggtg1860cagctggaagatcctgagtttcaggcatctaacatcatgcatagtattaatggctacgtg1920ttcgacagtttgcagctgagcgtgtgcctgcacgaggtcgcttactggtatatcctgagc1980attggggcacagacagatttcctgagcgtgttcttttccggctacacttttaagcataaa2040atggtctatgaggacacactgactctgttccccttcagcggcgaaaccgtgtttatgagc2100atggagaatcccggactgtggattctggggtgccacaacagcgatttcagaaatcgcgga2160atgactgccctgctgaaagtgtcaagctgtgacaagaacaccggggactactatgaagat2220tcatacgaggacatcagcgcatatctgctgtccaaaaacaatgccattgaaccccggtct2280tttagtcagaatggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagccctccagtgctgaagcgg2760caccagcgcgagatcacccgcactaccctgcagagtgatcaggaagagatcgactacgac2820gatacaatttctgtggaaatgaagaaagaggacttcgatatctatgacgaagatgagaac2880cagagtcctcgatcattccagaagaaaaccaggcattactttattgccgcagtggagcgg2940ctgtgggattatggcatgtcctctagtcctcacgtgctgcgaaatagggcccagtcagga3000agcgtcccacagttcaagaaagtggtcttccaggagtttacagacgggtcctttactcag3060ccactgtacaggggcgaactgaacgagcacctgggactgctggggccctatatcagagca3120gaagtggaggataacattatggtcaccttcagaaatcaggcctctcggccttacagtttt3180tattcaagcctgatctcttacgaagaggaccagcgacagggagctgaaccacgaaaaaac3240ttcgtgaagcctaatgagaccaaaacatacttttggaaggtgcagcaccatatggcccca3300acaaaagacgagttcgattgcaaggcatgggcctatttttctgacgtggatctggagaag3360gacgtgcacagtggcctgattggcccactgctggtgtgccatactaacaccctgaatcca3420gcccacggccggcaggtcactgtccaggagttcgctctgttctttaccatctttgatgag3480acaaagagctggtacttcaccgaaaacatggagcgaaattgcagggctccatgtaacatt3540cagatggaagaccccacattcaaggagaactaccgctttcatgctatcaatggatacatc3600atggatactctgcccgggctggtcatggcacaggaccagagaatccggtggtatctgctg3660agcatgggcagcaacgagaatatccactcaattcatttcagcgggcacgtgtttactgtc3720aggaagaaagaagagtacaagatggccctgtacaacctgtatcccggcgtgttcgaaacc3780gtcgagatgctgcctagcaaggccggaatctggagagtggaatgcctgattggagagcac3840ctgcatgctgggatgtctaccctgtttctggtgtacagtaataagtgtcagacacccctg3900ggaatggcatccgggcatatcagggatttccagattaccgcatctggacagtacggacag3960tgggcacctaagctggctagactgcactattccggatctatcaacgcttggtccacaaaa4020gagcctttctcttggattaaggtggacctgctggccccaatgatcattcatggcatcaaa4080actcagggagctcggcagaagttctcctctctgtacatctcacagtttatcatcatgtac4140agcctggatgggaagaaatggcagacataccgcggcaatagcacaggaactctgatggtg4200ttctttggcaacgtggacagcagcggaatcaagcacaacattttcaatccccctatcatt4260gctagatacatccggctgcacccaacccattattctattcgaagtacactgaggatggaa4320ctgatgggatgcgatctgaacagttgttcaatgcccctggggatggagtccaaggcaatc4380tctgacgcccagattaccgccagctcctacttcactaatatgtttgctacctggagccct4440tccaaagcaagactgcacctgcaaggccgcagcaacgcatggcgaccacaggtgaacaat4500cccaaggagtggttgcaggtcgattttcagaaaactatgaaggtgaccggggtcacaact4560cagggcgtgaaaagtctgctgacctcaatgtacgtcaaggagttcctgatctctagttca4620caggacggacatcagtggacactgttctttcagaacgggaaggtgaaagtcttccagggc4680aatcaggattcctttacacctgtggtcaacagtctagaccctccactgctgaccagatac4740ctgagaatccaccctcagtcctgggtgcaccagattgccctgagaatggaagtgctggga4800tgcgaggcccaggatctgtactga4824<210>21<211>6<212>dna<213>人工序列<220><223>mar/ars<400>21atattt6<210>22<211>6<212>dna<213>人工序列<220><223>mar/ars<400>22aaatat6<210>23<211>5<212>dna<213>人工序列<220><223>去稳定元件<400>23attta5<210>24<211>5<212>dna<213>人工序列<220><223>去稳定元件<400>24taaat5<210>25<211>6<212>dna<213>人工序列<220><223>聚t位点<400>25tttttt6<210>26<211>7<212>dna<213>人工序列<220><223>聚a位点<400>26aaaaaaa7<210>27<211>6<212>dna<213>人工序列<220><223>剪接位点<400>27ggtgat6<210>28<211>5<212>dna<213>人工序列<220><223>tata盒<400>28tataa5<210>29<211>5<212>dna<213>人工序列<220><223>tata盒<400>29ttata5<210>30<211>8<212>dna<213>人工序列<220><223>富含au的序列元件<400>30attttatt8<210>31<211>8<212>dna<213>人工序列<220><223>富含au的序列元件<400>31atttttaa8<210>32<211>13<212>dna<213>人工序列<220><223>kozak共有序列<400>32gccgccaccatgc13<210>33<211>32<212>prt<213>人工序列<220><223>ctp肽<400>33aspproargpheglnaspserserserserlysalaproproproser151015leuproserproserargleuproglyproseraspthrproileleu202530<210>34<211>28<212>prt<213>人工序列<220><223>ctp肽<400>34serserserserlysalaproproproserleuproserproserarg151015leuproglyproseraspthrproileleuprogln2025<210>35<211>11<212>prt<213>人工序列<220><223>白蛋白结合的肽核心序列<400>35aspilecysleuproargtrpglycysleutrp1510<210>36<211>20<212>prt<213>人工序列<220><223>pas序列<400>36alaserproalaalaproalaproalaserproalaalaproalapro151015seralaproala20<210>37<211>20<212>prt<213>人工序列<220><223>pas序列<400>37alaalaproalaserproalaproalaalaproseralaproalapro151015alaalaproser20<210>38<211>20<212>prt<213>人工序列<220><223>pas序列<400>38alaproserserproserproseralaproserserproserproala151015serproserser20<210>39<211>19<212>prt<213>人工序列<220><223>pas序列<400>39alaproserserproserproseralaproserserproserproala151015serproser<210>40<211>20<212>prt<213>人工序列<220><223>pas序列<400>40serserproseralaproserproserserproalaserproserpro151015serserproala20<210>41<211>24<212>prt<213>人工序列<220><223>pas序列<400>41alaalaserproalaalaproseralaproproalaalaalaserpro151015alaalaproseralaproproala20<210>42<211>20<212>prt<213>人工序列<220><223>pas序列<400>42alaseralaalaalaproalaalaalaseralaalaalaseralapro151015seralaalaala20<210>43<211>23<212>dna<213>人工序列<220><223>mir142靶标<400>43tccataaagtaggaaacactaca23<210>44<211>2332<212>prt<213>人(homosapiens)<400>44alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargproleutyrserargargleuprolysglyvallys485490495hisleulysasppheproileleuproglygluilephelystyrlys500505510trpthrvalthrvalgluaspglyprothrlysseraspproargcys515520525leuthrargtyrtyrserserphevalasnmetgluargaspleuala530535540serglyleuileglyproleuleuilecystyrlysgluservalasp545550555560glnargglyasnglnilemetserasplysargasnvalileleuphe565570575servalpheaspgluasnargsertrptyrleuthrgluasnilegln580585590argpheleuproasnproalaglyvalglnleugluaspprogluphe595600605glnalaserasnilemethisserileasnglytyrvalpheaspser610615620leuglnleuservalcysleuhisgluvalalatyrtrptyrileleu625630635640serileglyalaglnthrasppheleuservalphepheserglytyr645650655thrphelyshislysmetvaltyrgluaspthrleuthrleuphepro660665670pheserglygluthrvalphemetsermetgluasnproglyleutrp675680685ileleuglycyshisasnserasppheargasnargglymetthrala690695700leuleulysvalsersercysasplysasnthrglyasptyrtyrglu705710715720aspsertyrgluaspileseralatyrleuleuserlysasnasnala725730735ilegluproargserpheserglnasnserarghisproserthrarg740745750glnlysglnpheasnalathrthrileprogluasnaspileglulys755760765thraspprotrpphealahisargthrprometprolysileglnasn770775780valserserseraspleuleumetleuleuargglnserprothrpro785790795800hisglyleuserleuseraspleuglnglualalystyrgluthrphe805810815seraspaspproserproglyalaileaspserasnasnserleuser820825830glumetthrhispheargproglnleuhishisserglyaspmetval835840845phethrprogluserglyleuglnleuargleuasnglulysleugly850855860thrthralaalathrgluleulyslysleuaspphelysvalserser865870875880thrserasnasnleuileserthrileproseraspasnleualaala885890895glythraspasnthrserserleuglyproprosermetprovalhis900905910tyraspserglnleuaspthrthrleupheglylyslysserserpro915920925leuthrgluserglyglyproleuserleuserglugluasnasnasp930935940serlysleuleugluserglyleumetasnserglnglusersertrp945950955960glylysasnvalserserthrgluserglyargleuphelysglylys965970975argalahisglyproalaleuleuthrlysaspasnalaleuphelys980985990valserileserleuleulysthrasnlysthrserasnasnserala99510001005thrasnarglysthrhisileaspglyproserleuleuileglu101010151020asnserproservaltrpglnasnileleugluseraspthrglu102510301035phelyslysvalthrproleuilehisaspargmetleumetasp104010451050lysasnalathralaleuargleuasnhismetserasnlysthr105510601065thrserserlysasnmetglumetvalglnglnlyslysglugly107010751080proileproproaspalaglnasnproaspmetserphephelys108510901095metleupheleuprogluseralaargtrpileglnargthrhis110011051110glylysasnserleuasnserglyglnglyproserprolysgln111511201125leuvalserleuglyproglulysservalgluglyglnasnphe113011351140leuserglulysasnlysvalvalvalglylysglygluphethr114511501155lysaspvalglyleulysglumetvalpheproserserargasn116011651170leupheleuthrasnleuaspasnleuhisgluasnasnthrhis117511801185asnglnglulyslysileglnglugluileglulyslysgluthr119011951200leuileglngluasnvalvalleuproglnilehisthrvalthr120512101215glythrlysasnphemetlysasnleupheleuleuserthrarg122012251230glnasnvalgluglysertyraspglyalatyralaprovalleu123512401245glnasppheargserleuasnaspserthrasnargthrlyslys125012551260histhralahispheserlyslysglygluglugluasnleuglu126512701275glyleuglyasnglnthrlysglnilevalglulystyralacys128012851290thrthrargileserproasnthrserglnglnasnphevalthr129513001305glnargserlysargalaleulysglnpheargleuproleuglu131013151320gluthrgluleuglulysargileilevalaspaspthrserthr132513301335glntrpserlysasnmetlyshisleuthrproserthrleuthr134013451350glnileasptyrasnglulysglulysglyalailethrglnser135513601365proleuseraspcysleuthrargserhisserileproglnala137013751380asnargserproleuproilealalysvalserserpheproser138513901395ileargproiletyrleuthrargvalleupheglnaspasnser140014051410serhisleuproalaalasertyrarglyslysaspserglyval141514201425glngluserserhispheleuglnglyalalyslysasnasnleu143014351440serleualaileleuthrleuglumetthrglyaspglnargglu144514501455valglyserleuglythrseralathrasnservalthrtyrlys146014651470lysvalgluasnthrvalleuprolysproaspleuprolysthr147514801485serglylysvalgluleuleuprolysvalhisiletyrglnlys149014951500aspleupheprothrgluthrserasnglyserproglyhisleu150515101515aspleuvalgluglyserleuleuglnglythrgluglyalaile152015251530lystrpasnglualaasnargproglylysvalpropheleuarg153515401545valalathrgluserseralalysthrproserlysleuleuasp155015551560proleualatrpaspasnhistyrglythrglnileprolysglu156515701575glutrplysserglnglulysserproglulysthralaphelys158015851590lyslysaspthrileleuserleuasnalacysgluserasnhis159516001605alailealaalaileasngluglyglnasnlysprogluileglu161016151620valthrtrpalalysglnglyargthrgluargleucyssergln162516301635asnproprovalleulysarghisglnarggluilethrargthr164016451650thrleuglnseraspglnglugluileasptyraspaspthrile165516601665servalglumetlyslysgluasppheaspiletyraspgluasp167016751680gluasnglnserproargserpheglnlyslysthrarghistyr168516901695pheilealaalavalgluargleutrpasptyrglymetserser170017051710serprohisvalleuargasnargalaglnserglyservalpro171517201725glnphelyslysvalvalpheglngluphethraspglyserphe173017351740thrglnproleutyrargglygluleuasngluhisleuglyleu174517501755leuglyprotyrileargalagluvalgluaspasnilemetval176017651770thrpheargasnglnalaserargprotyrserphetyrserser177517801785leuilesertyrglugluaspglnargglnglyalagluproarg179017951800lysasnphevallysproasngluthrlysthrtyrphetrplys180518101815valglnhishismetalaprothrlysaspglupheaspcyslys182018251830alatrpalatyrpheseraspvalaspleuglulysaspvalhis183518401845serglyleuileglyproleuleuvalcyshisthrasnthrleu185018551860asnproalahisglyargglnvalthrvalglngluphealaleu186518701875phephethrilepheaspgluthrlyssertrptyrphethrglu188018851890asnmetgluargasncysargalaprocysasnileglnmetglu189519001905aspprothrphelysgluasntyrargphehisalaileasngly191019151920tyrilemetaspthrleuproglyleuvalmetalaglnaspgln192519301935argileargtrptyrleuleusermetglyserasngluasnile194019451950hisserilehispheserglyhisvalphethrvalarglyslys195519601965gluglutyrlysmetalaleutyrasnleutyrproglyvalphe197019751980gluthrvalglumetleuproserlysalaglyiletrpargval198519901995glucysleuileglygluhisleuhisalaglymetserthrleu200020052010pheleuvaltyrserasnlyscysglnthrproleuglymetala201520202025serglyhisileargasppheglnilethralaserglyglntyr203020352040glyglntrpalaprolysleualaargleuhistyrserglyser204520502055ileasnalatrpserthrlysgluprophesertrpilelysval206020652070aspleuleualaprometileilehisglyilelysthrglngly207520802085alaargglnlyspheserserleutyrileserglnpheileile209020952100mettyrserleuaspglylyslystrpglnthrtyrargglyasn210521102115serthrglythrleumetvalphepheglyasnvalaspserser212021252130glyilelyshisasnilepheasnproproileilealaargtyr213521402145ileargleuhisprothrhistyrserileargserthrleuarg215021552160metgluleumetglycysaspleuasnsercyssermetproleu216521702175glymetgluserlysalaileseraspalaglnilethralaser218021852190sertyrphethrasnmetphealathrtrpserproserlysala219522002205argleuhisleuglnglyargserasnalatrpargproglnval221022152220asnasnprolysglutrpleuglnvalasppheglnlysthrmet222522302235lysvalthrglyvalthrthrglnglyvallysserleuleuthr224022452250sermettyrvallysglupheleuileserserserglnaspgly225522602265hisglntrpthrleuphepheglnasnglylysvallysvalphe227022752280glnglyasnglnaspserphethrprovalvalasnserleuasp228522902295proproleuleuthrargtyrleuargilehisproglnsertrp230023052310valhisglnilealaleuargmetgluvalleuglycysgluala231523202325glnaspleutyr2330<210>45<211>4<212>prt<213>人工序列<220><223>人igg1的氨基酸233-236<400>45gluleuleugly1<210>46<211>42<212>prt<213>人工序列<220><223>xtenae42-4,蛋白质序列<400>46glyalaproglyserproalaglyserprothrserthrgluglugly151015thrsergluseralathrprogluserglyproglysergluproala202530thrserglysergluthrproalaserser3540<210>47<211>126<212>dna<213>人工序列<220><223>xtenae42-4,dna序列<400>47ggcgcgccaggttctcctgctggctcccccacctcaacagaagaggggacaagcgaaagc60gctacgcctgagagtggccctggctctgagccagccacctccggctctgaaacccctgcc120tcgagc126<210>48<211>144<212>prt<213>人工序列<220><223>xtenae144-2a,蛋白质序列<400>48thrserthrgluprosergluglyseralaproglyserproalagly151015serprothrserthrglugluglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaproglythrsergluseralathrproglu65707580serglyproglysergluproalathrserglysergluthrprogly859095thrserthrgluprosergluglyseralaproglythrserthrglu100105110prosergluglyseralaproglythrsergluseralathrproglu115120125serglyproglythrsergluseralathrprogluserglyprogly130135140<210>49<211>450<212>dna<213>人工序列<220><223>xtenae144-2a,dna序列<400>49ggcgcgccaaccagtacggagccgtccgaggggagcgcaccaggaagcccggctgggagc60ccgacttctaccgaagagggtacatctaccgaaccaagtgaaggttcagcaccaggcacc120tcaacagaaccctctgagggctcggcgcctggtacaagtgagtccgccaccccagaatcc180gggcctgggacaagcacagaaccttcggaagggagtgcccctggaacatccgaatcggca240accccagaatcagggccaggatctgagcccgcgacttcgggctccgagacgcctgggaca300tccaccgagccctccgaaggatcagccccaggcaccagcacggagccctctgagggaagc360gcacctggtaccagcgaaagcgcaactcccgaatcaggtcccggtacgagcgagtcggcg420accccggagagcgggccaggtgcctcgagc450<210>50<211>144<212>prt<213>人工序列<220><223>xtenae144-3b,蛋白质序列<400>50serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglysergluproalathrserglyser202530gluthrproglythrsergluseralathrprogluserglyprogly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaproglythrserthrgluproserglugly65707580seralaproglythrserthrgluprosergluglyseralaprogly859095thrserthrgluprosergluglyseralaproglythrserthrglu100105110prosergluglyseralaproglyserproalaglyserprothrser115120125thrglugluglythrserthrgluprosergluglyseralaprogly130135140<210>51<211>450<212>dna<213>人工序列<220><223>xtenae144-3b,dna序列<400>51ggcgcgccaagtcccgctggaagcccaactagcaccgaagaggggacctcagagtccgcc60acccccgagtccggccctggctctgagcctgccactagcggctccgagactcctggcaca120tccgaaagcgctacacccgagagtggacccggcacctctaccgagcccagtgagggctcc180gcccctggaacaagcaccgagcccagcgaaggcagcgccccagggacctccacagagccc240agtgaaggcagtgctcctggcaccagcaccgaaccaagcgagggctctgcacccgggacc300tccaccgagccaagcgaaggctctgcccctggcacttccaccgagcccagcgaaggcagc360gcccctgggagccccgctggctctcccaccagcactgaggagggcacatctaccgaacca420agtgaaggctctgcaccaggtgcctcgagc450<210>52<211>144<212>prt<213>人工序列<220><223>xtenae144-4a,蛋白质序列<400>52thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglythrsergluseralathrproglu202530serglyproglysergluproalathrserglysergluthrprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaproglythrsergluseralathrproglu65707580serglyproglyserproalaglyserprothrserthrgluglugly859095serproalaglyserprothrserthrglugluglyserproalagly100105110serprothrserthrglugluglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>53<211>450<212>dna<213>人工序列<220><223>xtenae144-4a,dna序列<400>53ggcgcgccaacgtccgaaagtgctacccctgagtcaggccctggtagtgagcctgccaca60agcggaagcgaaactccggggacctcagagtctgccactcccgaatcggggccaggctct120gaaccggccacttcagggagcgaaacaccaggaacatcggagagcgctaccccggagagc180gggccaggaactagtactgagcctagcgagggaagtgcacctggtacaagcgagtccgcc240acacccgagtctggccctggctctccagcgggctcacccacgagcactgaagagggctct300cccgctggcagcccaacgtcgacagaagaaggatcaccagcaggctcccccacatcaaca360gaggagggtacatcagaatctgctactcccgagagtggacccggtacctccactgagccc420agcgaggggagtgcaccaggtgcctcgagc450<210>54<211>144<212>prt<213>人工序列<220><223>xtenae144-5a,蛋白质序列<400>54thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglythrsergluseralathrproglu202530serglyproglysergluproalathrserglysergluthrprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaproglyserproalaglyserprothrser65707580thrglugluglythrsergluseralathrprogluserglyprogly859095sergluproalathrserglysergluthrproglythrsergluser100105110alathrprogluserglyproglyserproalaglyserprothrser115120125thrglugluglyserproalaglyserprothrserthrgluglugly130135140<210>55<211>450<212>dna<213>人工序列<220><223>xtenae144-5a,dna序列<400>55ggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagccaca60tctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctggctcc120gagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccagaaagc180ggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccggctct240cctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccaggatct300gaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccggagagt360gggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcgggctcg420cccaccagcactgaagaaggtgcctcgagc450<210>56<211>144<212>prt<213>人工序列<220><223>xtenae144-6b,蛋白质序列<400>56thrserthrgluprosergluglyseralaproglythrsergluser151015alathrprogluserglyproglythrsergluseralathrproglu202530serglyproglythrsergluseralathrprogluserglyprogly354045sergluproalathrserglysergluthrproglysergluproala505560thrserglysergluthrproglyserproalaglyserprothrser65707580thrglugluglythrserthrgluprosergluglyseralaprogly859095thrserthrgluprosergluglyseralaproglysergluproala100105110thrserglysergluthrproglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>57<211>450<212>dna<213>人工序列<220><223>xtenae144-6b,dna序列<400>57ggcgcgccaacatctaccgagccttccgaaggctctgcccctgggacctcagaatctgca60acccctgaaagcggccctggaacctccgaaagtgccactcccgagagcggcccagggaca120agcgagtcagcaacccctgagtctggacccggcagcgagcctgcaacctctggctcagag180actcccggctcagaacccgctacctcaggctccgagacacccggctctcctgctgggagt240cccacttccaccgaggaaggaacatccactgagcctagtgagggctctgcccctggaacc300agcacagagccaagtgagggcagtgcaccaggatccgagccagcaaccagcgggtccgag360actcccgggacctctgagtctgccaccccagagagcggacccggcacttcaaccgagccc420tccgaaggatcagcaccaggtgcctcgagc450<210>58<211>144<212>prt<213>人工序列<220><223>xtenag144-1,蛋白质序列<400>58proglyserserproseralaserthrglythrglyproglyserser151015proseralaserthrglythrglyproglythrproglyserglythr202530alaserserserproglyserserthrproserglyalathrglyser354045proglyserserproseralaserthrglythrglyproglyalaser505560proglythrserserthrglyserproglythrproglyserglythr65707580alaserserserproglyserserthrproserglyalathrglyser859095proglythrproglyserglythralaserserserproglyalaser100105110proglythrserserthrglyserproglyalaserproglythrser115120125serthrglyserproglythrproglyserglythralaserserser130135140<210>59<211>450<212>dna<213>人工序列<220><223>xtenag144-1,dna序列<400>59ggcgcgccacccgggtcgtccccgtcggcgtccaccggaacagggccagggtcatccccg60tcagcgtcgactgggacgggacccgggacacccggttcggggactgcatcctcctcgcct120ggttcgtccaccccgtcaggagccacgggttcgccgggaagcagcccaagcgcatccact180ggtacagggcctggggcttcaccgggtacttcatccacggggtcaccgggaacgcccgga240tcggggacggcttcctcatcaccaggatcgtcaacaccctcgggcgcaacgggcagcccc300ggaacccctggttcgggtacggcgtcgtcgagccccggtgcgagcccgggaacaagctcg360acaggatcgcctggggcgtcacccggcacgtcgagcacaggcagccccggaacccctgga420tcgggaaccgcgtcgtcaagcgcctcgagc450<210>60<211>144<212>prt<213>人工序列<220><223>xtenag144-a,蛋白质序列<400>60glyalaserproglythrserserthrglyserproglyserserpro151015seralaserthrglythrglyproglyserserproseralaserthr202530glythrglyproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglythrproglyserglythralaserserserpro859095glyserserthrproserglyalathrglyserproglythrprogly100105110serglythralaserserserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>61<211>450<212>dna<213>人工序列<220><223>xtenag144-a,dna序列<400>61ggcgcgccaggtgcctcgccgggaacatcatcaactggttcacccgggtcatccccctcg60gcctcaaccgggacgggtcccggctcatcccccagcgccagcactggaacaggtcctggc120actcctggttccggtacggcatcgtcatccccgggaagctcaacaccgtccggagcgaca180ggatcacctggctcgtcaccttcggcgtcaactggaacggggccaggggcctcacccgga240acgtcctcgactgggtcgcctggtacgccgggatcaggaacggcctcatcctcgcctggg300tcctcaacgccctcgggtgcgactggttcgccgggaactcctggctcggggacggcctcg360tcgtcgcctggggcatcaccggggacgagctccacggggtcccctggagcgtcaccgggg420acctcctcgacaggtagcccggcctcgagc450<210>62<211>144<212>prt<213>人工序列<220><223>xtenag144-b,蛋白质序列<400>62glythrproglyserglythralaserserserproglyserserthr151015proserglyalathrglyserproglyalaserproglythrserser202530thrglyserproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyserserproseralaserthr65707580glythrglyproglyserserthrproserglyalathrglyserpro859095glyserserthrproserglyalathrglyserproglyalaserpro100105110glythrserserthrglyserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>63<211>450<212>dna<213>人工序列<220><223>xtenag144-b,dna序列<400>63ggcgcgccaggtacaccgggcagcggcacggcttcgtcgtcacccggctcgtccacaccg60tcgggagctacgggaagcccaggagcgtcaccgggaacgtcgtcaacggggtcaccgggt120acgccaggtagcggcacggccagcagctcgccaggttcatcgaccccgtcgggagcgact180gggtcgcccggatcaagcccgtcagcttccactggaacaggacccgggtcgtcgccgtca240gcctcaacggggacaggacctggttcatcgacgccgtcaggggcgacaggctcgcccgga300tcgtcaacaccctcgggggcaacggggagccctggtgcgtcgcctggaacctcatccacc360ggaagcccgggggcctcgccgggtacgagctccacgggatcgcccggagcgtcccccgga420acttcaagcacagggagccctgcctcgagc450<210>64<211>144<212>prt<213>人工序列<220><223>xtenag144-c,蛋白质序列<400>64glythrproglyserglythralaserserserproglyalaserpro151015glythrserserthrglyserproglyalaserproglythrserser202530thrglyserproglyalaserproglythrserserthrglyserpro354045glyserserproseralaserthrglythrglyproglythrprogly505560serglythralaserserserproglyalaserproglythrserser65707580thrglyserproglyalaserproglythrserserthrglyserpro859095glyalaserproglythrserserthrglyserproglyserserthr100105110proserglyalathrglyserproglyserserthrproserglyala115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>65<211>450<212>dna<213>人工序列<220><223>xtenag144-c,dna序列<400>65ggcgcgccaggtacacccggatcgggtacagcgtcatcgagccccggtgcgtcacctggt60acgtcgagcacggggtcgccaggggcgtcccctgggacgtcctcaacaggctcgcccggt120gcgtcacccggcacgtcgtccacgggttcacctggtagctccccttccgcgtccactggc180accgggcctggaactccggggagcggcacagcgagctcgtcgccgggagcatcgcctggg240acatcgagcaccgggtcgccaggagcatcgcccggaacatccagcacaggaagccccggc300gcgtcgcccgggacatcaagcacaggttccccgggatcgagcacgccgtccggagccact360ggatcaccagggagctcgacaccttccggcgcaacgggatcgcccggagccagcccgggt420acgtcaagcactggctcccctgcctcgagc450<210>66<211>144<212>prt<213>人工序列<220><223>xtenag144-f,蛋白质序列<400>66glyserserproseralaserthrglythrglyproglyserserpro151015seralaserthrglythrglyproglyalaserproglythrserser202530thrglyserproglyalaserproglythrserserthrglyserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglyserserproseralaserthrglythrglypro859095glythrproglyserglythralaserserserproglyserserthr100105110proserglyalathrglyserproglyserserthrproserglyala115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>67<211>450<212>dna<213>人工序列<220><223>xtenag144-f,dna序列<400>67ggcgcgccaggctccagcccctccgcgagcacgggaaccggaccaggttcgtcaccctca60gcatcaacggggacgggaccgggggcgtcaccaggaacgtcctccaccggctcgccgggt120gcatcacccggaacgtcatcgaccggatcgccagggagctcgacgccatcaggcgcaaca180ggatcacctggctcaagccctagcgcgtcaaccggcacgggtccgggtgcctcccctggc240acgtccagcaccggatcacccggatcgagcccatccgcctcaaccggaaccggacccggt300acaccagggtcgggaacagcctcctcgtcaccaggctcctcaaccccctcgggagccacg360ggttcgcccggttcgtcaacgccttccggagcaactggtagccccggagcatcgccagga420acttcgagcacggggtcgcccgcctcgagc450<210>68<211>4374<212>dna<213>人工序列<220><223>cofviii-1dna序列<400>68atgcagattgagctgtctacttgctttttcctgtgcctgctgaggttttgcttttccgct60acacgaaggtattatctgggggctgtggaactgtcttgggattacatgcagagtgacctg120ggagagctgccagtggacgcaaggtttccccctagagtccctaagtcattccccttcaac180actagcgtggtctacaagaaaacactgttcgtggagtttactgatcacctgttcaacatc240gcaaagcctaggccaccctggatgggactgctggggccaacaatccaggccgaggtgtac300gacaccgtggtcattacacttaagaacatggcctcacaccccgtgagcctgcatgctgtg360ggcgtcagctactggaaggcttccgaaggagcagagtatgacgatcagacttcccagaga420gaaaaagaggacgataaggtgtttcctggcggatctcatacctacgtgtggcaggtcctg480aaagagaatggccctatggcctccgaccctctgtgcctgacctactcttatctgagtcac540gtggacctggtcaaggatctgaacagcggcctgatcggagccctgctggtgtgcagggaa600ggaagcctggctaaggagaaaacccagacactgcataagttcattctgctgttcgccgtg660tttgacgaagggaaatcatggcacagcgagacaaagaatagtctgatgcaggacagggat720gccgcttcagccagagcttggcccaaaatgcacactgtgaacggctacgtcaatcgctca780ctgcctgggctgatcggctgccaccgaaagagcgtgtattggcatgtcatcgggatgggc840accacacctgaagtgcactccattttcctggagggacatacctttctggtccgcaaccac900cgacaggcttccctggagatctctccaattaccttcctgacagcacagactctgctgatg960gacctggggcagttcctgctgttttgccacatcagctcccaccagcatgatggcatggag1020gcttacgtgaaagtggactcttgtcccgaggaacctcagctgcggatgaagaacaatgag1080gaagcagaagactatgacgatgacctgaccgactccgagatggatgtggtccgattcgat1140gacgataacagcccctcctttatccagattagatctgtggccaagaaacaccctaagaca1200tgggtccattacatcgcagccgaggaagaggactgggattatgcaccactggtgctggca1260ccagacgatcgctcctacaaatctcagtatctgaacaatgggccacagaggattggcaga1320aagtacaagaaagtgcggttcatggcatataccgatgagaccttcaagactcgcgaagcc1380atccagcacgagagcggcatcctgggaccactgctgtacggagaagtgggagacaccctg1440ctgatcattttcaagaaccaggccagccggccttacaatatctatccacatgggattaca1500gatgtgcgccctctgtacagcaggagactgccaaagggcgtcaaacacctgaaggacttc1560ccaatcctgcccggagaaatcttcaagtacaagtggactgtcaccgtcgaggatggcccc1620actaagagcgaccctcggtgcctgacccgctactattctagtttcgtgaatatggaaaga1680gatctggcaagcggactgatcggaccactgctgatttgttacaaagagagcgtggatcag1740agaggcaaccagatcatgtccgacaagcggaatgtgattctgttcagtgtctttgacgaa1800aacaggtcatggtacctgaccgagaacatccagagattcctgcctaatccagctggggtg1860cagctggaagatcctgagtttcaggcatctaacatcatgcatagtattaatggctacgtg1920ttcgacagtttgcagctgagcgtgtgcctgcacgaggtcgcttactggtatatcctgagc1980attggggcacagacagatttcctgagcgtgttcttttccggctacacttttaagcataaa2040atggtctatgaggacacactgactctgttccccttcagcggcgaaaccgtgtttatgagc2100atggagaatcccggactgtggattctggggtgccacaacagcgatttcagaaatcgcgga2160atgactgccctgctgaaagtgtcaagctgtgacaagaacaccggggactactatgaagat2220tcatacgaggacatcagcgcatatctgctgtccaaaaacaatgccattgaaccccggtct2280tttagtcagaatcctccagtgctgaagaggcaccagagggagatcacccgcactaccctg2340cagagtgatcaggaagagatcgactacgacgatacaatttctgtggaaatgaagaaagag2400gacttcgatatctatgacgaagatgagaaccagagtcctcgatcattccagaagaaaacc2460aggcattactttattgccgcagtggagcggctgtgggattatggcatgtcctctagtcct2520cacgtgctgcgaaatagggcccagtcaggaagcgtcccacagttcaagaaagtggtcttc2580caggagtttacagacgggtcctttactcagccactgtacaggggcgaactgaacgagcac2640ctgggactgctggggccctatatcagagcagaagtggaggataacattatggtcaccttc2700agaaatcaggcctctcggccttacagtttttattcaagcctgatctcttacgaagaggac2760cagcgacagggagctgaaccacgaaaaaacttcgtgaagcctaatgagaccaaaacatac2820ttttggaaggtgcagcaccatatggccccaacaaaagacgagttcgattgcaaggcatgg2880gcctatttttctgacgtggatctggagaaggacgtgcacagtggcctgattggcccactg2940ctggtgtgccatactaacaccctgaatccagcccacggccggcaggtcactgtccaggag3000ttcgctctgttctttaccatctttgatgagacaaagagctggtacttcaccgaaaacatg3060gagcgaaattgcagggctccatgtaacattcagatggaagaccccacattcaaggagaac3120taccgctttcatgctatcaatggatacatcatggatactctgcccgggctggtcatggca3180caggaccagagaatccggtggtatctgctgagcatgggcagcaacgagaatatccactca3240attcatttcagcgggcacgtgtttactgtcaggaagaaagaagagtacaagatggccctg3300tacaacctgtatcccggcgtgttcgaaaccgtcgagatgctgcctagcaaggccggaatc3360tggagagtggaatgcctgattggagagcacctgcatgctgggatgtctaccctgtttctg3420gtgtacagtaataagtgtcagacacccctgggaatggcatccgggcatatcagggatttc3480cagattaccgcatctggacagtacggacagtgggcacctaagctggctagactgcactat3540tccggatctatcaacgcttggtccacaaaagagcctttctcttggattaaggtggacctg3600ctggccccaatgatcattcatggcatcaaaactcagggagctcggcagaagttctcctct3660ctgtacatctcacagtttatcatcatgtacagcctggatgggaagaaatggcagacatac3720cgcggcaatagcacaggaactctgatggtgttctttggcaacgtggacagcagcggaatc3780aagcacaacattttcaatccccctatcattgctagatacatccggctgcacccaacccat3840tattctattcgaagtacactgaggatggaactgatgggatgcgatctgaacagttgttca3900atgcccctggggatggagtccaaggcaatctctgacgcccagattaccgccagctcctac3960ttcactaatatgtttgctacctggagcccttccaaagcaagactgcacctgcaaggccgc4020agcaacgcatggcgaccacaggtgaacaatcccaaggagtggttgcaggtcgattttcag4080aaaactatgaaggtgaccggggtcacaactcagggcgtgaaaagtctgctgacctcaatg4140tacgtcaaggagttcctgatctctagttcacaggacggacatcagtggacactgttcttt4200cagaacgggaaggtgaaagtcttccagggcaatcaggattcctttacacctgtggtcaac4260agtctagaccctccactgctgaccagatacctgagaatccaccctcagtcctgggtgcac4320cagattgccctgagaatggaagtgctgggatgcgaggcccaggatctgtactga4374<210>69<211>577<212>dna<213>人工序列<220><223>et启动子,dna序列<400>69ctcgaggtcaattcacgcgagttaataattaccagcgcgggccaaataaataatccgcga60ggggcaggtgacgtttgcccagcgcgcgctggtaattattaacctcgcgaatattgattc120gaggccgcgattgccgcaatcgcgaggggcaggtgacctttgcccagcgcgcgttcgccc180cgccccggacggtatcgataagcttaggagcttgggctgcaggtcgagggcactgggagg240atgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgt300ttgaacaggggccgggcgatcagcaggtagctctagaggatccccgtctgtctgcacatt360tcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggt420tacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagct480tggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggaga540agccgtcacacagatccacaagctcctgccaccatgg577<210>70<211>4374<212>dna<213>人工序列<220><223>cofviii-5<400>70atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgactgaaaacatccagcggttcctccccaaccccgcgggcgtg1860cagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaacggctacgtg1920ttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtacatcctgtcc1980attggtgcccagactgacttcctgtccgtgtttttctccggctacacgttcaagcacaag2040atggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtgtttatgagc2100atggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgtaacagagga2160atgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactattatgaggac2220tcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaacctcggagc2280ttcagccagaacccacccgtgcttaagagacatcaacgggagatcactaggaccaccctg2340cagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatgaagaaggag2400gactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaaaagaaaacc2460cgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcgtcctcgccg2520cacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaaggtcgtgttc2580caggagttcactgacgggagcttcactcagcctttgtaccggggagaactcaatgaacat2640ctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatggtcactttc2700cgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttacgaagaggac2760cagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaaccaagacctac2820ttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgcaaagcctgg2880gcctacttctccgatgtggacttggagaaggacgtccactccggcctcatcggtcccctg2940ctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcaccgtgcaggag3000ttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcaccgagaacatg3060gagaggaactgcagagccccctgtaacatccagatggaggacccgacgttcaaggaaaac3120taccggttccacgccattaacggatacatcatggatacgctgccgggtcttgtgatggcc3180caggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaacatccactct3240attcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaagatggccctg3300tacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaaggccggcatt3360tggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaaccctgttcctg3420gtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacattagggatttc3480cagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgcctgcattac3540tccggatccattaacgcctggtcaaccaaggagccattctcctggatcaaggtggacctt3600ctggcccccatgattatccacggaattaagacccagggggcccggcagaagttctcctca3660ctgtacatcagccagttcataatcatgtactccctggacggaaagaagtggcaaacctac3720agggggaacagcaccggcacactgatggtctttttcggaaatgtggactcctccgggatt3780aagcataacatcttcaaccctccgattatcgctcggtacattagacttcaccctacccac3840tacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaactcgtgcagc3900atgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcctcgtcctac3960tttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctccagggaaga4020tccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtggacttccag4080aaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctgacttctatg4140tacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggaccctgttcttc4200caaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccggtggtgaac4260tcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcctgggtgcac4320cagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtactga4374<210>71<211>4374<212>dna<213>人工序列<220><223>cofviii-6<400>71atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctc2340caatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaa2400gatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaact2460agacactactttatcgccgcggtggaaagactgtgggactatggaatgtcatccagccct2520cacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttc2580caggagttcaccgacggcagcttcacccagccgctgtaccggggagaactgaacgaacac2640ctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatggtgaccttc2700cgtaaccaagcatccagaccttactccttctattcctccctgatctcatacgaggaggac2760cagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacctac2820ttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgcaaggcctgg2880gcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatcgggccgctg2940ctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcaccgtccaggag3000tttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatg3060gagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttcaaggagaac3120tatagattccacgccatcaacgggtacatcatggatactctgccggggctggtcatggcc3180caggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcactcc3240attcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctg3300tacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatc3360tggagagtggagtgcctgatcggagagcacctccacgcggggatgtccaccctcttcctg3420gtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatcagagacttc3480cagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgcttgcactac3540tccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctc3600ctggcccctatgattatccacggaattaagacccagggcgccaggcagaagttctcctcc3660ctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtggcagacttac3720aggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcctccggcatt3780aagcacaacatcttcaacccaccgatcatagccagatatattaggctccaccccactcac3840tactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaactcctgctcc3900atgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcctac3960ttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttgcagggacgg4020tcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaa4080aagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatg4140tatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggaccctgttcttc4200caaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaac4260tccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcctgggtccat4320cagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtactga4374<210>72<211>4824<212>dna<213>人工序列<220><223>cofviii-6-xten<400>72atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagcccgcctgtgctgaagagg2760caccagcgagaaattacccggaccaccctccaatcggatcaggaggaaatcgactacgac2820gacaccatctcggtggaaatgaagaaggaagatttcgatatctacgacgaggacgaaaat2880cagtcccctcgctcattccaaaagaaaactagacactactttatcgccgcggtggaaaga2940ctgtgggactatggaatgtcatccagccctcacgtccttcggaaccgggcccagagcgga3000tcggtgcctcagttcaagaaagtggtgttccaggagttcaccgacggcagcttcacccag3060ccgctgtaccggggagaactgaacgaacacctgggcctgctcggtccctacatccgcgcg3120gaagtggaggataacatcatggtgaccttccgtaaccaagcatccagaccttactccttc3180tattcctccctgatctcatacgaggaggaccagcgccaaggcgccgagccccgcaagaac3240ttcgtcaagcccaacgagactaagacctacttctggaaggtccaacaccatatggccccg3300accaaggatgagtttgactgcaaggcctgggcctacttctccgacgtggaccttgagaag3360gatgtccattccggcctgatcgggccgctgctcgtgtgtcacaccaacaccctgaaccca3420gcgcatggacgccaggtcaccgtccaggagtttgctctgttcttcaccatttttgacgaa3480actaagtcctggtacttcaccgagaatatggagcgaaactgtagagcgccctgcaatatc3540cagatggaagatccgactttcaaggagaactatagattccacgccatcaacgggtacatc3600atggatactctgccggggctggtcatggcccaggatcagaggattcggtggtacttgctg3660tcaatgggatcgaacgaaaacattcactccattcacttctccggtcacgtgttcactgtg3720cgcaagaaggaggagtacaagatggcgctgtacaatctgtaccccggggtgttcgaaact3780gtggagatgctgccgtccaaggccggcatctggagagtggagtgcctgatcggagagcac3840ctccacgcggggatgtccaccctcttcctggtgtactcgaataagtgccagaccccgctg3900ggcatggcctcgggccacatcagagacttccagatcacagcaagcggacaatacggccaa3960tgggcgccgaagctggcccgcttgcactactccggatcgatcaacgcatggtccaccaag4020gaaccgttctcgtggattaaggtggacctcctggcccctatgattatccacggaattaag4080acccagggcgccaggcagaagttctcctccctgtacatctcgcaattcatcatcatgtac4140agcctggacgggaagaagtggcagacttacaggggaaactccaccggcaccctgatggtc4200tttttcggcaacgtggattcctccggcattaagcacaacatcttcaacccaccgatcata4260gccagatatattaggctccaccccactcactactcaatccgctcaactcttcggatggaa4320ctcatggggtgcgacctgaactcctgctccatgccgttggggatggaatcaaaggctatt4380agcgacgcccagatcaccgcgagctcctacttcactaacatgttcgccacctggagcccc4440tccaaggccaggctgcacttgcagggacggtcaaatgcctggcggccgcaagtgaacaat4500ccgaaggaatggcttcaagtggatttccaaaagaccatgaaagtgaccggagtcaccacc4560cagggagtgaagtcccttctgacctcgatgtatgtgaaggagttcctgattagcagcagc4620caggacgggcaccagtggaccctgttcttccaaaacggaaaggtcaaggtgttccagggg4680aaccaggactcgttcacacccgtggtgaactccctggaccccccactgctgacgcggtac4740ttgaggattcatcctcagtcctgggtccatcagattgcattgcgaatggaagtcctgggc4800tgcgaggcccaggacctgtactga4824<210>73<211>12<212>prt<213>人工序列<220><223>ad基序<400>73glygluserproglyglyserserglysergluser1510<210>74<211>12<212>prt<213>人工序列<220><223>ad基序<400>74glysergluglyserserglyproglygluserser1510<210>75<211>12<212>prt<213>人工序列<220><223>ad基序<400>75glysersergluserglysersergluglyglypro1510<210>76<211>12<212>prt<213>人工序列<220><223>ad基序<400>76glyserglyglygluprosergluserglyserser1510<210>77<211>12<212>prt<213>人工序列<220><223>ae,am基序<400>77glyserproalaglyserprothrserthrgluglu1510<210>78<211>12<212>prt<213>人工序列<220><223>ae,am,aq基序<400>78glysergluproalathrserglysergluthrpro1510<210>79<211>12<212>prt<213>人工序列<220><223>ae,am,aq基序<400>79glythrsergluseralathrprogluserglypro1510<210>80<211>12<212>prt<213>人工序列<220><223>ae,am,aq基序<400>80glythrserthrgluprosergluglyseralapro1510<210>81<211>12<212>prt<213>人工序列<220><223>af,am基序<400>81glyserthrsergluserproserglythralapro1510<210>82<211>12<212>prt<213>人工序列<220><223>af,am基序<400>82glythrserthrprogluserglyseralaserpro1510<210>83<211>12<212>prt<213>人工序列<220><223>af,am基序<400>83glythrserproserglygluserserthralapro1510<210>84<211>12<212>prt<213>人工序列<220><223>af,am基序<400>84glyserthrserserthralagluserproglypro1510<210>85<211>12<212>prt<213>人工序列<220><223>ag,am基序<400>85glythrproglyserglythralaserserserpro1510<210>86<211>12<212>prt<213>人工序列<220><223>ag,am基序<400>86glyserserthrproserglyalathrglyserpro1510<210>87<211>12<212>prt<213>人工序列<220><223>ag,am基序<400>87glyserserproseralaserthrglythrglypro1510<210>88<211>12<212>prt<213>人工序列<220><223>ag,am基序<400>88glyalaserproglythrserserthrglyserpro1510<210>89<211>12<212>prt<213>人工序列<220><223>aq基序<400>89glygluproalaglyserprothrserthrserglu1510<210>90<211>12<212>prt<213>人工序列<220><223>aq基序<400>90glythrglygluproserserthrproalaserglu1510<210>91<211>12<212>prt<213>人工序列<220><223>aq基序<400>91glyserglyproserthrgluseralaprothrglu1510<210>92<211>12<212>prt<213>人工序列<220><223>aq基序<400>92glysergluthrproserglyprosergluthrala1510<210>93<211>12<212>prt<213>人工序列<220><223>aq基序<400>93glyprosergluthrserthrsergluproglyala1510<210>94<211>12<212>prt<213>人工序列<220><223>aq基序<400>94glyserprosergluprothrgluglythrserala1510<210>95<211>12<212>prt<213>人工序列<220><223>bc基序<400>95glyserglyalasergluprothrserthrglupro1510<210>96<211>12<212>prt<213>人工序列<220><223>bc基序<400>96glysergluproalathrserglythrgluproser1510<210>97<211>12<212>prt<213>人工序列<220><223>bc基序<400>97glythrsergluproserthrsergluproglyala1510<210>98<211>12<212>prt<213>人工序列<220><223>bc基序<400>98glythrserthrgluprosergluproglyserala1510<210>99<211>12<212>prt<213>人工序列<220><223>bd基序<400>99glyserthralaglysergluthrserthrgluala1510<210>100<211>12<212>prt<213>人工序列<220><223>bd基序<400>100glysergluthralathrserglysergluthrala1510<210>101<211>12<212>prt<213>人工序列<220><223>bd基序<400>101glythrsergluseralathrsergluserglyala1510<210>102<211>12<212>prt<213>人工序列<220><223>bd基序<400>102glythrserthrglualasergluglyseralaser1510<210>103<211>1607<212>prt<213>人工序列<220><223>cofviii-6-xten蛋白质序列<400>103metglnilegluleuserthrcysphepheleucysleuleuargphe151015cyspheseralathrargargtyrtyrleuglyalavalgluleuser202530trpasptyrmetglnseraspleuglygluleuprovalaspalaarg354045pheproproargvalprolysserphepropheasnthrservalval505560tyrlyslysthrleuphevalgluphethrasphisleupheasnile65707580alalysproargproprotrpmetglyleuleuglyprothrilegln859095alagluvaltyraspthrvalvalilethrleulysasnmetalaser100105110hisprovalserleuhisalavalglyvalsertyrtrplysalaser115120125gluglyalaglutyraspaspglnthrserglnargglulysgluasp130135140asplysvalpheproglyglyserhisthrtyrvaltrpglnvalleu145150155160lysgluasnglyprometalaseraspproleucysleuthrtyrser165170175tyrleuserhisvalaspleuvallysaspleuasnserglyleuile180185190glyalaleuleuvalcysarggluglyserleualalysglulysthr195200205glnthrleuhislyspheileleuleuphealavalpheaspglugly210215220lyssertrphissergluthrlysasnserleumetglnaspargasp225230235240alaalaseralaargalatrpprolysmethisthrvalasnglytyr245250255valasnargserleuproglyleuileglycyshisarglysserval260265270tyrtrphisvalileglymetglythrthrprogluvalhisserile275280285pheleugluglyhisthrpheleuvalargasnhisargglnalaser290295300leugluileserproilethrpheleuthralaglnthrleuleumet305310315320aspleuglyglnpheleuleuphecyshisileserserhisglnhis325330335aspglymetglualatyrvallysvalaspsercysprogluglupro340345350glnleuargmetlysasnasngluglualagluasptyraspaspasp355360365leuthraspserglumetaspvalvalargpheaspaspaspasnser370375380proserpheileglnileargservalalalyslyshisprolysthr385390395400trpvalhistyrilealaalagluglugluasptrpasptyralapro405410415leuvalleualaproaspaspargsertyrlysserglntyrleuasn420425430asnglyproglnargileglyarglystyrlyslysvalargphemet435440445alatyrthraspgluthrphelysthrargglualaileglnhisglu450455460serglyileleuglyproleuleutyrglygluvalglyaspthrleu465470475480leuileilephelysasnglnalaserargprotyrasniletyrpro485490495hisglyilethraspvalargproleutyrserargargleuprolys500505510glyvallyshisleulysasppheproileleuproglygluilephe515520525lystyrlystrpthrvalthrvalgluaspglyprothrlysserasp530535540proargcysleuthrargtyrtyrserserphevalasnmetgluarg545550555560aspleualaserglyleuileglyproleuleuilecystyrlysglu565570575servalaspglnargglyasnglnilemetserasplysargasnval580585590ileleupheservalpheaspgluasnargsertrptyrleuthrglu595600605asnileglnargpheleuproasnproalaglyvalglnleugluasp610615620proglupheglnalaserasnilemethisserileasnglytyrval625630635640pheaspserleuglnleuservalcysleuhisgluvalalatyrtrp645650655tyrileleuserileglyalaglnthrasppheleuservalphephe660665670serglytyrthrphelyshislysmetvaltyrgluaspthrleuthr675680685leuphepropheserglygluthrvalphemetsermetgluasnpro690695700glyleutrpileleuglycyshisasnserasppheargasnarggly705710715720metthralaleuleulysvalsersercysasplysasnthrglyasp725730735tyrtyrgluaspsertyrgluaspileseralatyrleuleuserlys740745750asnasnalailegluproargserpheserglnasnglyalaprothr755760765sergluseralathrprogluserglyproglysergluproalathr770775780serglysergluthrproglythrsergluseralathrprogluser785790795800glyproglysergluproalathrserglysergluthrproglythr805810815sergluseralathrprogluserglyproglythrserthrglupro820825830sergluglyseralaproglyserproalaglyserprothrserthr835840845glugluglythrsergluseralathrprogluserglyproglyser850855860gluproalathrserglysergluthrproglythrsergluserala865870875880thrprogluserglyproglyserproalaglyserprothrserthr885890895glugluglyserproalaglyserprothrserthrglugluglyala900905910serserproprovalleulysarghisglnarggluilethrargthr915920925thrleuglnseraspglnglugluileasptyraspaspthrileser930935940valglumetlyslysgluasppheaspiletyraspgluaspgluasn945950955960glnserproargserpheglnlyslysthrarghistyrpheileala965970975alavalgluargleutrpasptyrglymetserserserprohisval980985990leuargasnargalaglnserglyservalproglnphelyslysval99510001005valpheglngluphethraspglyserphethrglnproleutyr101010151020argglygluleuasngluhisleuglyleuleuglyprotyrile102510301035argalagluvalgluaspasnilemetvalthrpheargasngln104010451050alaserargprotyrserphetyrserserleuilesertyrglu105510601065gluaspglnargglnglyalagluproarglysasnphevallys107010751080proasngluthrlysthrtyrphetrplysvalglnhishismet108510901095alaprothrlysaspglupheaspcyslysalatrpalatyrphe110011051110seraspvalaspleuglulysaspvalhisserglyleuilegly111511201125proleuleuvalcyshisthrasnthrleuasnproalahisgly113011351140argglnvalthrvalglngluphealaleuphephethrilephe114511501155aspgluthrlyssertrptyrphethrgluasnmetgluargasn116011651170cysargalaprocysasnileglnmetgluaspprothrphelys117511801185gluasntyrargphehisalaileasnglytyrilemetaspthr119011951200leuproglyleuvalmetalaglnaspglnargileargtrptyr120512101215leuleusermetglyserasngluasnilehisserilehisphe122012251230serglyhisvalphethrvalarglyslysgluglutyrlysmet123512401245alaleutyrasnleutyrproglyvalphegluthrvalglumet125012551260leuproserlysalaglyiletrpargvalglucysleuilegly126512701275gluhisleuhisalaglymetserthrleupheleuvaltyrser128012851290asnlyscysglnthrproleuglymetalaserglyhisilearg129513001305asppheglnilethralaserglyglntyrglyglntrpalapro131013151320lysleualaargleuhistyrserglyserileasnalatrpser132513301335thrlysgluprophesertrpilelysvalaspleuleualapro134013451350metileilehisglyilelysthrglnglyalaargglnlysphe135513601365serserleutyrileserglnpheileilemettyrserleuasp137013751380glylyslystrpglnthrtyrargglyasnserthrglythrleu138513901395metvalphepheglyasnvalaspserserglyilelyshisasn140014051410ilepheasnproproileilealaargtyrileargleuhispro141514201425thrhistyrserileargserthrleuargmetgluleumetgly143014351440cysaspleuasnsercyssermetproleuglymetgluserlys144514501455alaileseraspalaglnilethralasersertyrphethrasn146014651470metphealathrtrpserproserlysalaargleuhisleugln147514801485glyargserasnalatrpargproglnvalasnasnprolysglu149014951500trpleuglnvalasppheglnlysthrmetlysvalthrglyval150515101515thrthrglnglyvallysserleuleuthrsermettyrvallys152015251530glupheleuileserserserglnaspglyhisglntrpthrleu153515401545phepheglnasnglylysvallysvalpheglnglyasnglnasp155015551560serphethrprovalvalasnserleuaspproproleuleuthr156515701575argtyrleuargilehisproglnsertrpvalhisglnileala158015851590leuargmetgluvalleuglycysglualaglnaspleutyr159516001605<210>104<211>16<212>dna<213>人工序列<220><223>aav2的rep结合位点(rbs)<400>104gcgcgctcgctcgctc16<210>105<211>6<212>dna<213>人工序列<220><223>aav2的末端解离位点(trs)<400>105agttgg6<210>106<211>2328<212>prt<213>人工序列<220><223>成熟全长fviii<400>106alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargprolysargargleuprolysglyvallyshisleu485490495lysasppheproileleuproglygluilephelystyrlystrpthr500505510valthrvalgluaspglyprothrlysseraspproargcysleuthr515520525argtyrtyrserserphevalasnmetgluargaspleualasergly530535540leuileglyproleuleuilecystyrlysgluservalaspglnarg545550555560glyasnglnilemetserasplysargasnvalileleupheserval565570575pheaspgluasnargsertrptyrleuthrgluasnileglnargphe580585590leuproasnproalaglyvalglnleugluaspproglupheglnala595600605serasnilemethisserileasnglytyrvalpheaspserleugln610615620leuservalcysleuhisgluvalalatyrtrptyrileleuserile625630635640glyalaglnthrasppheleuservalphepheserglytyrthrphe645650655lyshislysmetvaltyrgluaspthrleuthrleuphepropheser660665670glygluthrvalphemetsermetgluasnproglyleutrpileleu675680685glycyshisasnserasppheargasnargglymetthralaleuleu690695700lysvalsersercysasplysasnthrglyasptyrtyrgluaspser705710715720tyrgluaspileseralatyrleuleuserlysasnasnalaileglu725730735proargserpheserglnasnserarghisproserthrargglnlys740745750glnpheasnalathrthrileprogluasnaspileglulysthrasp755760765protrpphealahisargthrprometprolysileglnasnvalser770775780serseraspleuleumetleuleuargglnserprothrprohisgly785790795800leuserleuseraspleuglnglualalystyrgluthrpheserasp805810815aspproserproglyalaileaspserasnasnserleuserglumet820825830thrhispheargproglnleuhishisserglyaspmetvalphethr835840845progluserglyleuglnleuargleuasnglulysleuglythrthr850855860alaalathrgluleulyslysleuaspphelysvalserserthrser865870875880asnasnleuileserthrileproseraspasnleualaalaglythr885890895aspasnthrserserleuglyproprosermetprovalhistyrasp900905910serglnleuaspthrthrleupheglylyslysserserproleuthr915920925gluserglyglyproleuserleuserglugluasnasnaspserlys930935940leuleugluserglyleumetasnserglnglusersertrpglylys945950955960asnvalserserthrgluserglyargleuphelysglylysargala965970975hisglyproalaleuleuthrlysaspasnalaleuphelysvalser980985990ileserleuleulysthrasnlysthrserasnasnseralathrasn99510001005arglysthrhisileaspglyproserleuleuilegluasnser101010151020proservaltrpglnasnileseraspthrgluphelyslysval102510301035thrproleuilehisaspargmetleumetasplysasnalathr104010451050alaleuargleuasnhismetserasnlysthrthrserserlys105510601065asnmetglumetvalglnglnlyslysgluglyproilepropro107010751080aspalaglnasnproaspmetserphephelysmetleupheleu108510901095progluseralaargtrpileglnargthrhisglylysasnser110011051110leuasnserglyglnglyproserprolysglnleuvalserleu111511201125glyproglulysservalgluglyglnasnpheleuserglulys113011351140asnlysvalvalvalglylysglygluphethrlysaspvalgly114511501155leulysglumetvalpheproserserargasnleupheleuthr116011651170asnleuaspasnleuhisgluasnasnthrhisasnglnglulys117511801185lysileglnglugluileglulyslysgluthrleuileglnglu119011951200asnvalvalleuproglnilehisthrvalthrglythrlysasn120512101215phemetlysasnleupheleuleuserthrargglnasnvalglu122012251230glysertyraspglyalatyralaprovalleuglnaspphearg123512401245serleuasnaspserthrasnargthrlyslyshisthralahis125012551260pheserlyslysglygluglugluasnleugluglyleuglyasn126512701275glnthrlysglnilevalglulystyralacysthrthrargile128012851290serproasnthrserglnglnasnphevalthrglnargserlys129513001305argalaleulysglnpheargleuproleuglugluthrgluleu131013151320glulysargileilevalaspaspthrserthrglntrpserlys132513301335asnmetlyshisleuthrproserthrleuthrglnileasptyr134013451350asnglulysglulysglyalailethrglnserproleuserasp135513601365cysleuthrargserhisserileproglnalaasnargserpro137013751380leuproilealalysvalserserpheproserileargproile138513901395tyrleuthrargvalleupheglnaspasnserserhisleupro140014051410alaalasertyrarglyslysaspserglyvalglngluserser141514201425hispheleuglnglyalalyslysasnasnleuserleualaile143014351440leuthrleuglumetthrglyaspglnarggluvalglyserleu144514501455glythrseralathrasnservalthrtyrlyslysvalgluasn146014651470thrvalleuprolysproaspleuprolysthrserglylysval147514801485gluleuleuprolysvalhisiletyrglnlysaspleuphepro149014951500thrgluthrserasnglyserproglyhisleuaspleuvalglu150515101515glyserleuleuglnglythrgluglyalailelystrpasnglu152015251530alaasnargproglylysvalpropheleuargvalalathrglu153515401545serseralalysthrproserlysleuleuaspproleualatrp155015551560aspasnhistyrglythrglnileprolysgluglutrplysser156515701575glnglulysserproglulysthralaphelyslyslysaspthr158015851590ileleuserleuasnalacysgluserasnhisalailealaala159516001605ileasngluglyglnasnlysprogluilegluvalthrtrpala161016151620lysglnglyargthrgluargleucysserglnasnproproval162516301635leulysarghisglnarggluilethrargthrthrleuglnser164016451650aspglnglugluileasptyraspaspthrileservalglumet165516601665lyslysgluasppheaspiletyraspgluaspgluasnglnser167016751680proargserpheglnlyslysthrarghistyrpheilealaala168516901695valgluargleutrpasptyrglymetserserserprohisval170017051710leuargasnargalaglnserglyservalproglnphelyslys171517201725valvalpheglngluphethraspglyserphethrglnproleu173017351740tyrargglygluleuasngluhisleuglyleuleuglyprotyr174517501755ileargalagluvalgluaspasnilemetvalthrpheargasn176017651770glnalaserargprotyrserphetyrserserleuilesertyr177517801785glugluaspglnargglnglyalagluproarglysasnpheval179017951800lysproasngluthrlysthrtyrphetrplysvalglnhishis180518101815metalaprothrlysaspglupheaspcyslysalatrpalatyr182018251830pheseraspvalaspleuglulysaspvalhisserglyleuile183518401845glyproleuleuvalcyshisthrasnthrleuasnproalahis185018551860glyargglnvalthrvalglngluphealaleuphephethrile186518701875pheaspgluthrlyssertrptyrphethrgluasnmetgluarg188018851890asncysargalaprocysasnileglnmetgluaspprothrphe189519001905lysgluasntyrargphehisalaileasnglytyrilemetasp191019151920thrleuproglyleuvalmetalaglnaspglnargileargtrp192519301935tyrleuleusermetglyserasngluasnilehisserilehis194019451950pheserglyhisvalphethrvalarglyslysgluglutyrlys195519601965metalaleutyrasnleutyrproglyvalphegluthrvalglu197019751980metleuproserlysalaglyiletrpargvalglucysleuile198519901995glygluhisleuhisalaglymetserthrleupheleuvaltyr200020052010serasnlyscysglnthrproleuglymetalaserglyhisile201520202025argasppheglnilethralaserglyglntyrglyglntrpala203020352040prolysleualaargleuhistyrserglyserileasnalatrp204520502055serthrlysgluprophesertrpilelysvalaspleuleuala206020652070prometileilehisglyilelysthrglnglyalaargglnlys207520802085pheserserleutyrileserglnpheileilemettyrserleu209020952100aspglylyslystrpglnthrtyrargglyasnserthrglythr210521102115leumetvalphepheglyasnvalaspserserglyilelyshis212021252130asnilepheasnproproileilealaargtyrileargleuhis213521402145prothrhistyrserileargserthrleuargmetgluleumet215021552160glycysaspleuasnsercyssermetproleuglymetgluser216521702175lysalaileseraspalaglnilethralasersertyrphethr218021852190asnmetphealathrtrpserproserlysalaargleuhisleu219522002205glnglyargserasnalatrpargproglnvalasnasnprolys221022152220glutrpleuglnvalasppheglnlysthrmetlysvalthrgly222522302235valthrthrglnglyvallysserleuleuthrsermettyrval224022452250lysglupheleuileserserserglnaspglyhisglntrpthr225522602265leuphepheglnasnglylysvallysvalpheglnglyasngln227022752280aspserphethrprovalvalasnserleuaspproproleuleu228522902295thrargtyrleuargilehisproglnsertrpvalhisglnile230023052310alaleuargmetgluvalleuglycysglualaglnaspleutyr231523202325<210>107<211>7053<212>dna<213>人工序列<220><223>成熟全长fviii<400>107atgcaaatagagctctccacctgcttctttctgtgccttttgcgattctgctttagtgcc60accagaagatactacctgggtgcagtggaactgtcatgggactatatgcaaagtgatctc120ggtgagctgcctgtggacgcaagatttcctcctagagtgccaaaatcttttccattcaac180acctcagtcgtgtacaaaaagactctgtttgtagaattcacggatcaccttttcaacatc240gctaagccaaggccaccctggatgggtctgctaggtcctaccatccaggctgaggtttat300gatacagtggtcattacacttaagaacatggcttcccatcctgtcagtcttcatgctgtt360ggtgtatcctactggaaagcttctgagggagctgaatatgatgatcagaccagtcaaagg420gagaaagaagatgataaagtcttccctggtggaagccatacatatgtctggcaggtcctg480aaagagaatggtccaatggcctctgacccactgtgccttacctactcatatctttctcat540gtggacctggtaaaagacttgaattcaggcctcattggagccctactagtatgtagagaa600gggagtctggccaaggaaaagacacagaccttgcacaaatttatactactttttgctgta660tttgatgaagggaaaagttggcactcagaaacaaagaactccttgatgcaggatagggat720gctgcatctgctcgggcctggcctaaaatgcacacagtcaatggttatgtaaacaggtct780ctgccaggtctgattggatgccacaggaaatcagtctattggcatgtgattggaatgggc840accactcctgaagtgcactcaatattcctcgaaggtcacacatttcttgtgaggaaccat900cgccaggcgtccttggaaatctcgccaataactttccttactgctcaaacactcttgatg960gaccttggacagtttctactgttttgtcatatctcttcccaccaacatgatggcatggaa1020gcttatgtcaaagtagacagctgtccagaggaaccccaactacgaatgaaaaataatgaa1080gaagcggaagactatgatgatgatcttactgattctgaaatggatgtggtcaggtttgat1140gatgacaactctccttcctttatccaaattcgctcagttgccaagaagcatcctaaaact1200tgggtacattacattgctgctgaagaggaggactgggactatgctcccttagtcctcgcc1260cccgatgacagaagttataaaagtcaatatttgaacaatggccctcagcggattggtagg1320aagtacaaaaaagtccgatttatggcatacacagatgaaacctttaagactcgtgaagct1380attcagcatgaatcaggaatcttgggacctttactttatggggaagttggagacacactg1440ttgattatatttaagaatcaagcaagcagaccatataacatctaccctcacggaatcact1500gatgtccgtcctttgtattcaaggagattaccaaaaggtgtaaaacatttgaaggatttt1560ccaattctgccaggagaaatattcaaatataaatggacagtgactgtagaagatgggcca1620actaaatcagatcctcggtgcctgacccgctattactctagtttcgttaatatggagaga1680gatctagcttcaggactcattggccctctcctcatctgctacaaagaatctgtagatcaa1740agaggaaaccagataatgtcagacaagaggaatgtcatcctgttttctgtatttgatgag1800aaccgaagctggtacctcacagagaatatacaacgctttctccccaatccagctggagtg1860cagcttgaggatccagagttccaagcctccaacatcatgcacagcatcaatggctatgtt1920tttgatagtttgcagttgtcagtttgtttgcatgaggtggcatactggtacattctaagc1980attggagcacagactgacttcctttctgtcttcttctctggatataccttcaaacacaaa2040atggtctatgaagacacactcaccctattcccattctcaggagaaactgtcttcatgtcg2100atggaaaacccaggtctatggattctggggtgccacaactcagactttcggaacagaggc2160atgaccgccttactgaaggtttctagttgtgacaagaacactggtgattattacgaggac2220agttatgaagatatttcagcatacttgctgagtaaaaacaatgccattgaaccaagaagc2280ttctcccagaattcaagacaccctagcactaggcaaaagcaatttaatgccaccacaatt2340ccagaaaatgacatagagaagactgacccttggtttgcacacagaacacctatgcctaaa2400atacaaaatgtctcctctagtgatttgttgatgctcttgcgacagagtcctactccacat2460gggctatccttatctgatctccaagaagccaaatatgagactttttctgatgatccatca2520cctggagcaatagacagtaataacagcctgtctgaaatgacacacttcaggccacagctc2580catcacagtggggacatggtatttacccctgagtcaggcctccaattaagattaaatgag2640aaactggggacaactgcagcaacagagttgaagaaacttgatttcaaagtttctagtaca2700tcaaataatctgatttcaacaattccatcagacaatttggcagcaggtactgataataca2760agttccttaggacccccaagtatgccagttcattatgatagtcaattagataccactcta2820tttggcaaaaagtcatctccccttactgagtctggtggacctctgagcttgagtgaagaa2880aataatgattcaaagttgttagaatcaggtttaatgaatagccaagaaagttcatgggga2940aaaaatgtatcgtcaacagagagtggtaggttatttaaagggaaaagagctcatggacct3000gctttgttgactaaagataatgccttattcaaagttagcatctctttgttaaagacaaac3060aaaacttccaataattcagcaactaatagaaagactcacattgatggcccatcattatta3120attgagaatagtccatcagtctggcaaaatatattagaaagtgacactgagtttaaaaaa3180gtgacacctttgattcatgacagaatgcttatggacaaaaatgctacagctttgaggcta3240aatcatatgtcaaataaaactacttcatcaaaaaacatggaaatggtccaacagaaaaaa3300gagggccccattccaccagatgcacaaaatccagatatgtcgttctttaagatgctattc3360ttgccagaatcagcaaggtggatacaaaggactcatggaaagaactctctgaactctggg3420caaggccccagtccaaagcaattagtatccttaggaccagaaaaatctgtggaaggtcag3480aatttcttgtctgagaaaaacaaagtggtagtaggaaagggtgaatttacaaaggacgta3540ggactcaaagagatggtttttccaagcagcagaaacctatttcttactaacttggataat3600ttacatgaaaataatacacacaatcaagaaaaaaaaattcaggaagaaatagaaaagaag3660gaaacattaatccaagagaatgtagttttgcctcagatacatacagtgactggcactaag3720aatttcatgaagaaccttttcttactgagcactaggcaaaatgtagaaggttcatatgac3780ggggcatatgctccagtacttcaagattttaggtcattaaatgattcaacaaatagaaca3840aagaaacacacagctcatttctcaaaaaaaggggaggaagaaaacttggaaggcttggga3900aatcaaaccaagcaaattgtagagaaatatgcatgcaccacaaggatatctcctaataca3960agccagcagaattttgtcacgcaacgtagtaagagagctttgaaacaattcagactccca4020ctagaagaaacagaacttgaaaaaaggataattgtggatgacacctcaacccagtggtcc4080aaaaacatgaaacatttgaccccgagcaccctcacacagatagactacaatgagaaggag4140aaaggggccattactcagtctcccttatcagattgccttacgaggagtcatagcatccct4200caagcaaatagatctccattacccattgcaaaggtatcatcatttccatctattagacct4260atatatctgaccagggtcctattccaagacaactcttctcatcttccagcagcatcttat4320agaaagaaagattctggggtccaagaaagcagtcatttcttacaaggagccaaaaaaaat4380aacctttctttagccattctaaccttggagatgactggtgatcaaagagaggttggctcc4440ctggggacaagtgccacaaattcagtcacatacaagaaagttgagaacactgttctcccg4500aaaccagacttgcccaaaacatctggcaaagttgaattgcttccaaaagttcacatttat4560cagaaggacctattccctacggaaactagcaatgggtctcctggccatctggatctcgtg4620gaagggagccttcttcagggaacagagggagcgattaagtggaatgaagcaaacagacct4680ggaaaagttccctttctgagagtagcaacagaaagctctgcaaagactccctccaagcta4740ttggatcctcttgcttgggataaccactatggtactcagataccaaaagaagagtggaaa4800tcccaagagaagtcaccagaaaaaacagcttttaagaaaaaggataccattttgtccctg4860aacgcttgtgaaagcaatcatgcaatagcagcaataaatgagggacaaaataagcccgaa4920atagaagtcacctgggcaaagcaaggtaggactgaaaggctgtgctctcaaaacccacca4980gtcttgaaacgccatcaacgggaaataactcgtactactcttcagtcagatcaagaggaa5040attgactatgatgataccatatcagttgaaatgaagaaggaagattttgacatttatgat5100gaggatgaaaatcagagcccccgcagctttcaaaagaaaacacgacactattttattgct5160gcagtggagaggctctgggattatgggatgagtagctccccacatgttctaagaaacagg5220gctcagagtggcagtgtccctcagttcaagaaagttgttttccaggaatttactgatggc5280tcctttactcagcccttataccgtggagaactaaatgaacatttgggactcctggggcca5340tatataagagcagaagttgaagataatatcatggtaactttcagaaatcaggcctctcgt5400ccctattccttctattctagccttatttcttatgaggaagatcagaggcaaggagcagaa5460cctagaaaaaactttgtcaagcctaatgaaaccaaaacttacttttggaaagtgcaacat5520catatggcacccactaaagatgagtttgactgcaaagcctgggcttatttctctgatgtt5580gacctggaaaaagatgtgcactcaggcctgattggaccccttctggtctgccacactaac5640acactgaaccctgctcatgggagacaagtgacagtacaggaatttgctctgtttttcacc5700atctttgatgagaccaaaagctggtacttcactgaaaatatggaaagaaactgcagggct5760ccctgcaatatccagatggaagatcccacttttaaagagaattatcgcttccatgcaatc5820aatggctacataatggatacactacctggcttagtaatggctcaggatcaaaggattcga5880tggtatctgctcagcatgggcagcaatgaaaacatccattctattcatttcagtggacat5940gtgttcactgtacgaaaaaaagaggagtataaaatggcactgtacaatctctatccaggt6000gtttttgagacagtggaaatgttaccatccaaagctggaatttggcgggtggaatgcctt6060attggcgagcatctacatgctgggatgagcacactttttctggtgtacagcaataagtgt6120cagactcccctgggaatggcttctggacacattagagattttcagattacagcttcagga6180caatatggacagtgggccccaaagctggccagacttcattattccggatcaatcaatgcc6240tggagcaccaaggagcccttttcttggatcaaggtggatctgttggcaccaatgattatt6300cacggcatcaagacccagggtgcccgtcagaagttctccagcctctacatctctcagttt6360atcatcatgtatagtcttgatgggaagaagtggcagacttatcgaggaaattccactgga6420accttaatggtcttctttggcaatgtggattcatctgggataaaacacaatatttttaac6480cctccaattattgctcgatacatccgtttgcacccaactcattatagcattcgcagcact6540cttcgcatggagttgatgggctgtgatttaaatagttgcagcatgccattgggaatggag6600agtaaagcaatatcagatgcacagattactgcttcatcctactttaccaatatgtttgcc6660acctggtctccttcaaaagctcgacttcacctccaagggaggagtaatgcctggagacct6720caggtgaataatccaaaagagtggctgcaagtggacttccagaagacaatgaaagtcaca6780ggagtaactactcagggagtaaaatctctgcttaccagcatgtatgtgaaggagttcctc6840atctccagcagtcaagatggccatcagtggactctcttttttcagaatggcaaagtaaag6900gtttttcagggaaatcaagactccttcacacctgtggtgaactctctagacccaccgtta6960ctgactcgctaccttcgaattcacccccagagttgggtgcaccagattgccctgaggatg7020gaggttctgggctgcgaggcacaggacctctac7053<210>108<400>108000<210>109<211>1718<212>prt<213>人工序列<220><223>bivv001bdd-fviii(xten)序列(无fc)<400>109alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargprolysargargleuprolysglyvallyshisleu485490495lysasppheproileleuproglygluilephelystyrlystrpthr500505510valthrvalgluaspglyprothrlysseraspproargcysleuthr515520525argtyrtyrserserphevalasnmetgluargaspleualasergly530535540leuileglyproleuleuilecystyrlysgluservalaspglnarg545550555560glyasnglnilemetserasplysargasnvalileleupheserval565570575pheaspgluasnargsertrptyrleuthrgluasnileglnargphe580585590leuproasnproalaglyvalglnleugluaspproglupheglnala595600605serasnilemethisserileasnglytyrvalpheaspserleugln610615620leuservalcysleuhisgluvalalatyrtrptyrileleuserile625630635640glyalaglnthrasppheleuservalphepheserglytyrthrphe645650655lyshislysmetvaltyrgluaspthrleuthrleuphepropheser660665670glygluthrvalphemetsermetgluasnproglyleutrpileleu675680685glycyshisasnserasppheargasnargglymetthralaleuleu690695700lysvalsersercysasplysasnthrglyasptyrtyrgluaspser705710715720tyrgluaspileseralatyrleuleuserlysasnasnalaileglu725730735proargserpheserglnasnglythrsergluseralathrproglu740745750serglyproglysergluproalathrserglysergluthrprogly755760765thrsergluseralathrprogluserglyproglysergluproala770775780thrserglysergluthrproglythrsergluseralathrproglu785790795800serglyproglythrserthrgluprosergluglyseralaprogly805810815serproalaglyserprothrserthrglugluglythrsergluser820825830alathrprogluserglyproglysergluproalathrserglyser835840845gluthrproglythrsergluseralathrprogluserglyprogly850855860serproalaglyserprothrserthrglugluglyserproalagly865870875880serprothrserthrglugluglythrserthrgluproserglugly885890895seralaproglythrsergluseralathrprogluserglyprogly900905910thrsergluseralathrprogluserglyproglythrsergluser915920925alathrprogluserglyproglysergluproalathrserglyser930935940gluthrproglysergluproalathrserglysergluthrprogly945950955960serproalaglyserprothrserthrglugluglythrserthrglu965970975prosergluglyseralaproglythrserthrgluproserglugly980985990seralaproglysergluproalathrserglysergluthrprogly99510001005thrsergluseralathrprogluserglyproglythrserthr101010151020gluprosergluglyseralaproalasersergluilethrarg102510301035thrthrleuglnseraspglnglugluileasptyraspaspthr104010451050ileservalglumetlyslysgluasppheaspiletyraspglu105510601065aspgluasnglnserproargserpheglnlyslysthrarghis107010751080tyrpheilealaalavalgluargleutrpasptyrglymetser108510901095serserprohisvalleuargasnargalaglnserglyserval110011051110proglnphelyslysvalvalpheglngluphethraspglyser111511201125phethrglnproleutyrargglygluleuasngluhisleugly113011351140leuleuglyprotyrileargalagluvalgluaspasnilemet114511501155valthrpheargasnglnalaserargprotyrserphetyrser116011651170serleuilesertyrglugluaspglnargglnglyalaglupro117511801185arglysasnphevallysproasngluthrlysthrtyrphetrp119011951200lysvalglnhishismetalaprothrlysaspglupheaspcys120512101215lysalatrpalatyrpheseraspvalaspleuglulysaspval122012251230hisserglyleuileglyproleuleuvalcyshisthrasnthr123512401245leuasnproalahisglyargglnvalthrvalglnglupheala125012551260leuphephethrilepheaspgluthrlyssertrptyrphethr126512701275gluasnmetgluargasncysargalaprocysasnileglnmet128012851290gluaspprothrphelysgluasntyrargphehisalaileasn129513001305glytyrilemetaspthrleuproglyleuvalmetalaglnasp131013151320glnargileargtrptyrleuleusermetglyserasngluasn132513301335ilehisserilehispheserglyhisvalphethrvalarglys134013451350lysgluglutyrlysmetalaleutyrasnleutyrproglyval135513601365phegluthrvalglumetleuproserlysalaglyiletrparg137013751380valglucysleuileglygluhisleuhisalaglymetserthr138513901395leupheleuvaltyrserasnlyscysglnthrproleuglymet140014051410alaserglyhisileargasppheglnilethralaserglygln141514201425tyrglyglntrpalaprolysleualaargleuhistyrsergly143014351440serileasnalatrpserthrlysgluprophesertrpilelys144514501455valaspleuleualaprometileilehisglyilelysthrgln146014651470glyalaargglnlyspheserserleutyrileserglnpheile147514801485ilemettyrserleuaspglylyslystrpglnthrtyrarggly149014951500asnserthrglythrleumetvalphepheglyasnvalaspser150515101515serglyilelyshisasnilepheasnproproileilealaarg152015251530tyrileargleuhisprothrhistyrserileargserthrleu153515401545argmetgluleumetglycysaspleuasnsercyssermetpro155015551560leuglymetgluserlysalaileseraspalaglnilethrala156515701575sersertyrphethrasnmetphealathrtrpserproserlys158015851590alaargleuhisleuglnglyargserasnalatrpargprogln159516001605valasnasnprolysglutrpleuglnvalasppheglnlysthr161016151620metlysvalthrglyvalthrthrglnglyvallysserleuleu162516301635thrsermettyrvallysglupheleuileserserserglnasp164016451650glyhisglntrpthrleuphepheglnasnglylysvallysval165516601665pheglnglyasnglnaspserphethrprovalvalasnserleu167016751680aspproproleuleuthrargtyrleuargilehisproglnser168516901695trpvalhisglnilealaleuargmetgluvalleuglycysglu170017051710alaglnaspleutyr1715<210>110<211>6526<212>dna<213>人工序列<220><223>nb15.1v32构建体(aav-fviiico6xten-ssdna)<400>110ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcctgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaata180cgcgctctcttaaggtagccccgggacgcgtcaattgagatctggatccggtaccgaatt240cgcggccgcctcgacgactagcgtttaattaaacgcgtgtctgtctgcacatttcgtaga300gcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttat360tctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagg420gatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtc480acacagatccacaagctcctgaggtaagtgccgtgtgtggttcccgcgggcctggcctct540ttacgggttatggcccttgcgtgccttgaattactgacactgacatccactttttctttt600tctccacagctagcgccaccatgcagattgagctgtccacttgtttcttcctgtgcctcc660tgcgcttctgtttctccgccactcgccggtactaccttggagccgtggagctttcatggg720actacatgcagagcgacctgggcgaactccccgtggatgccagattccccccccgcgtgc780caaagtccttcccctttaacacctccgtggtgtacaagaaaaccctctttgtcgagttca840ctgaccacctgttcaacatcgccaagccgcgcccaccttggatgggcctcctgggaccga900ccattcaagctgaagtgtacgacaccgtggtgatcaccctgaagaacatggcgtcccacc960ccgtgtccctgcatgcggtcggagtgtcctactggaaggcctccgaaggagctgagtacg1020acgaccagactagccagcgggaaaaggaggacgataaagtgttcccgggcggctcgcata1080cttacgtgtggcaagtcctgaaggaaaacggacctatggcatccgatcctctgtgcctga1140cttactcctacctttcccatgtggacctcgtgaaggacctgaacagcgggctgattggtg1200cacttctcgtgtgccgcgaaggttcgctcgctaaggaaaagacccagaccctccataagt1260tcatccttttgttcgctgtgttcgatgaaggaaagtcatggcattccgaaactaagaact1320cgctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaaaatgcatacagtca1380acggatacgtgaatcggtcactgcccgggctcatcggttgtcacagaaagtccgtgtact1440ggcacgtcatcggcatgggcactacgcctgaagtgcactccatcttcctggaagggcaca1500ccttcctcgtgcgcaaccaccgccaggcctctctggaaatctccccgattacctttctga1560ccgcccagactctgctcatggacctggggcagttccttctcttctgccacatctccagcc1620atcagcacgacggaatggaggcctacgtgaaggtggactcatgcccggaagaacctcagt1680tgcggatgaagaacaacgaggaggccgaggactatgacgacgatttgactgactccgaga1740tggacgtcgtgcggttcgatgacgacaacagccccagcttcatccagattcgcagcgtgg1800ccaagaagcaccccaaaacctgggtgcactacatcgcggccgaggaagaagattgggact1860acgccccgttggtgctggcacccgatgaccggtcgtacaagtcccagtatctgaacaatg1920gtccgcagcggattggcagaaagtacaagaaagtgcggttcatggcgtacactgacgaaa1980cgtttaagacccgggaggccattcaacatgagagcggcattctgggaccactgctgtacg2040gagaggtcggcgataccctgctcatcatcttcaaaaaccaggcctcccggccttacaaca2100tctaccctcacggaatcaccgacgtgcggccactctactcgcggcgcctgccgaagggcg2160tcaagcacctgaaagacttccctatcctgccgggcgaaatcttcaagtataagtggaccg2220tcaccgtggaggacgggcccaccaagagcgatcctaggtgtctgactcggtactactcca2280gcttcgtgaacatggaacgggacctggcatcgggactcattggaccgctgctgatctgct2340acaaagagtcggtggatcaacgcggcaaccagatcatgtccgacaagcgcaacgtgatcc2400tgttctccgtgtttgatgaaaacagatcctggtacctcactgaaaacatccagaggttcc2460tcccaaaccccgcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgc2520actcgattaacggttacgtgttcgactcgctgcaactgagcgtgtgcctccatgaagtcg2580cttactggtacattctgtccatcggcgcccagactgacttcctgagcgtgttcttttccg2640gttacacctttaagcacaagatggtgtacgaagataccctgaccctgttccctttctccg2700gcgaaacggtgttcatgtcgatggagaacccgggtctgtggattctgggatgccacaaca2760gcgactttcggaaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaaca2820ccggagactactacgaggactcctacgaggatatctcagcctacctcctgtccaagaaca2880acgcgatcgagccgcgcagcttcagccagaacggcgcgccaacatcagagagcgccaccc2940ctgaaagtggtcccgggagcgagccagccacatctgggtcggaaacgccaggcacaagtg3000agtctgcaactcccgagtccggacctggctccgagcctgccactagcggctccgagactc3060cgggaacttccgagagcgctacaccagaaagcggacccggaaccagtaccgaacctagcg3120agggctctgctccgggcagcccagccggctctcctacatccacggaggagggcacttccg3180aatccgccaccccggagtcagggccaggatctgaacccgctacctcaggcagtgagacgc3240caggaacgagcgagtccgctacaccggagagtgggccagggagccctgctggatctccta3300cgtccactgaggaagggtcaccagcgggctcgcccaccagcactgaagaaggtgcctcga3360gcccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctccaatcggatc3420aggaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaagatttcgata3480tctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaactagacactact3540ttatcgccgcggtggaaagactgtgggactatggaatgtcatccagccctcacgtccttc3600ggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttccaggagttca3660ccgacggcagcttcacccagccgctgtaccggggagaactgaacgaacacctgggcctgc3720tcggtccctacatccgcgcggaagtggaggataacatcatggtgaccttccgtaaccaag3780catccagaccttactccttctattcctccctgatctcatacgaggaggaccagcgccaag3840gcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacctacttctggaagg3900tccaacaccatatggccccgaccaaggatgagtttgactgcaaggcctgggcctacttct3960ccgacgtggaccttgagaaggatgtccattccggcctgatcgggccgctgctcgtgtgtc4020acaccaacaccctgaacccagcgcatggacgccaggtcaccgtccaggagtttgctctgt4080tcttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatggagcgaaact4140gtagagcgccctgcaatatccagatggaagatccgactttcaaggagaactatagattcc4200acgccatcaacgggtacatcatggatactctgccggggctggtcatggcccaggatcaga4260ggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcactccattcacttct4320ccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctgtacaatctgt4380accccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatctggagagtgg4440agtgcctgatcggagagcacctccacgcggggatgtccaccctcttcctggtgtactcga4500ataagtgccagaccccgctgggcatggcctcgggccacatcagagacttccagatcacag4560caagcggacaatacggccaatgggcgccgaagctggcccgcttgcactactccggatcga4620tcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctcctggccccta4680tgattatccacggaattaagacccagggcgccaggcagaagttctcctccctgtacatct4740cgcaattcatcatcatgtacagcctggacgggaagaagtggcagacttacaggggaaact4800ccaccggcaccctgatggtctttttcggcaacgtggattcctccggcattaagcacaaca4860tcttcaacccaccgatcatagccagatatattaggctccaccccactcactactcaatcc4920gctcaactcttcggatggaactcatggggtgcgacctgaactcctgctccatgccgttgg4980ggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcctacttcactaaca5040tgttcgccacctggagcccctccaaggccaggctgcacttgcagggacggtcaaatgcct5100ggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaaaagaccatga5160aagtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatgtatgtgaagg5220agttcctgattagcagcagccaggacgggcaccagtggaccctgttcttccaaaacggaa5280aggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaactccctggacc5340ccccactgctgacgcggtacttgaggattcatcctcagtcctgggtccatcagattgcat5400tgcgaatggaagtcctgggctgcgaggcccaggacctgtactgaatcagcctgagctcgc5460tgatcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaacta5520tgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgc5580ttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatga5640ggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaac5700ccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccc5760cctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggc5820tcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttg5880gctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttc5940ggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttcc6000gcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctgat6060cagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgcctt6120ccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcat6180cgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagg6240gggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctg6300aggcggaaagaacgggctcgagaagcttctagatatcctctcttaaggtagcatcgagat6360ttaaattagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttgg6420ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgac6480gcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag6526<210>111<211>130<212>dna<213>人工序列<220><223>5'itr(5'-端aav2反向末端重复)<400>111ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcct130<210>112<211>142<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-1<400>112gcggcaattcagtcgataactataacggtcctaaggtagcgatttaaatacgcgctctct60taaggtagccccgggacgcgtcaattgagatctggatccggtaccgaattcgcggccgcc120tcgacgactagcgtttaattaa142<210>113<211>229<212>dna<213>人工序列<220><223>ttpp(肝特异性启动子)<400>113acgcgtgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggc60aaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaa120tcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtat180aaaagccccttcaccaggagaagccgtcacacagatccacaagctcctg229<210>114<211>2<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-2<400>114ag2<210>115<211>106<212>dna<213>人工序列<220><223>合成的内含子<400>115gtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtg60ccttgaattactgacactgacatccactttttctttttctccacag106<210>116<211>11<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-3<400>116ctagcgccacc11<210>117<211>4824<212>dna<213>人工序列<220><223>fviiico6xten(含有xten144的密码子优化的fviii版本6的开放阅读框)<400>117atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcaactgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagcccgcctgtgctgaagagg2760caccagcgagaaattacccggaccaccctccaatcggatcaggaggaaatcgactacgac2820gacaccatctcggtggaaatgaagaaggaagatttcgatatctacgacgaggacgaaaat2880cagtcccctcgctcattccaaaagaaaactagacactactttatcgccgcggtggaaaga2940ctgtgggactatggaatgtcatccagccctcacgtccttcggaaccgggcccagagcgga3000tcggtgcctcagttcaagaaagtggtgttccaggagttcaccgacggcagcttcacccag3060ccgctgtaccggggagaactgaacgaacacctgggcctgctcggtccctacatccgcgcg3120gaagtggaggataacatcatggtgaccttccgtaaccaagcatccagaccttactccttc3180tattcctccctgatctcatacgaggaggaccagcgccaaggcgccgagccccgcaagaac3240ttcgtcaagcccaacgagactaagacctacttctggaaggtccaacaccatatggccccg3300accaaggatgagtttgactgcaaggcctgggcctacttctccgacgtggaccttgagaag3360gatgtccattccggcctgatcgggccgctgctcgtgtgtcacaccaacaccctgaaccca3420gcgcatggacgccaggtcaccgtccaggagtttgctctgttcttcaccatttttgacgaa3480actaagtcctggtacttcaccgagaatatggagcgaaactgtagagcgccctgcaatatc3540cagatggaagatccgactttcaaggagaactatagattccacgccatcaacgggtacatc3600atggatactctgccggggctggtcatggcccaggatcagaggattcggtggtacttgctg3660tcaatgggatcgaacgaaaacattcactccattcacttctccggtcacgtgttcactgtg3720cgcaagaaggaggagtacaagatggcgctgtacaatctgtaccccggggtgttcgaaact3780gtggagatgctgccgtccaaggccggcatctggagagtggagtgcctgatcggagagcac3840ctccacgcggggatgtccaccctcttcctggtgtactcgaataagtgccagaccccgctg3900ggcatggcctcgggccacatcagagacttccagatcacagcaagcggacaatacggccaa3960tgggcgccgaagctggcccgcttgcactactccggatcgatcaacgcatggtccaccaag4020gaaccgttctcgtggattaaggtggacctcctggcccctatgattatccacggaattaag4080acccagggcgccaggcagaagttctcctccctgtacatctcgcaattcatcatcatgtac4140agcctggacgggaagaagtggcagacttacaggggaaactccaccggcaccctgatggtc4200tttttcggcaacgtggattcctccggcattaagcacaacatcttcaacccaccgatcata4260gccagatatattaggctccaccccactcactactcaatccgctcaactcttcggatggaa4320ctcatggggtgcgacctgaactcctgctccatgccgttggggatggaatcaaaggctatt4380agcgacgcccagatcaccgcgagctcctacttcactaacatgttcgccacctggagcccc4440tccaaggccaggctgcacttgcagggacggtcaaatgcctggcggccgcaagtgaacaat4500ccgaaggaatggcttcaagtggatttccaaaagaccatgaaagtgaccggagtcaccacc4560cagggagtgaagtcccttctgacctcgatgtatgtgaaggagttcctgattagcagcagc4620caggacgggcaccagtggaccctgttcttccaaaacggaaaggtcaaggtgttccagggg4680aaccaggactcgttcacacccgtggtgaactccctggaccccccactgctgacgcggtac4740ttgaggattcatcctcagtcctgggtccatcagattgcattgcgaatggaagtcctgggc4800tgcgaggcccaggacctgtactga4824<210>118<211>450<212>dna<213>人工序列<220><223>xten144<400>118ggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagccaca60tctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctggctcc120gagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccagaaagc180ggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccggctct240cctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccaggatct300gaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccggagagt360gggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcgggctcg420cccaccagcactgaagaaggtgcctcgagc450<210>119<211>19<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-4<400>119atcagcctgagctcgctga19<210>120<211>595<212>dna<213>人工序列<220><223>wpre(突变的土拨鼠肝炎病毒转录后调控元件)<400>120tcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgt60tgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttc120ccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagga180gttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccc240cactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccct300ccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcg360gctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggct420gctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggc480cctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcg540tcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctg595<210>121<211>8<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-5<400>121atcagcct8<210>122<211>211<212>dna<213>人工序列<220><223>bghpa(牛生长激素聚腺苷酸信号)<400>122cgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttga60ccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcatt120gtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggagg180attgggaagacaatagcaggcatgctgggga211<210>123<211>119<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-6<400>123tgcggtgggctctatggcttctgaggcggaaagaacgggctcgagaagcttctagatatc60ctctcttaaggtagcatcgagatttaaattagggataacagggtaatggcgcgggccgc119<210>124<211>130<212>dna<213>人工序列<220><223>3'itr(3'-端aav2反向末端重复)<400>124aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgagg60ccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc120gagcgcgcag130<210>125<211>415<212>prt<213>人工序列<220><223>成熟fix多肽<400>125tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthr405410415<210>126<211>415<212>prt<213>人工序列<220><223>成熟padua(r338l)fix多肽<400>126tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuleuserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthr405410415<210>127<211>46<212>prt<213>人工序列<220><223>fix信号多肽和前肽<400>127metglnargvalasnmetilemetalagluserproglyleuilethr151015ilecysleuleuglytyrleuleuseralaglucysthrvalpheleu202530asphisgluasnalaasnlysileleuasnargprolysarg354045<210>128<211>8442<212>dna<213>人工序列<220><223>人vwf<400>128atgattcctgccagatttgccggggtgctgcttgctctggccctcattttgccagggacc60ctttgtgcagaaggaactcgcggcaggtcatccacggcccgatgcagccttttcggaagt120gacttcgtcaacacctttgatgggagcatgtacagctttgcgggatactgcagttacctc180ctggcagggggctgccagaaacgctccttctcgattattggggacttccagaatggcaag240agagtgagcctctccgtgtatcttggggaattttttgacatccatttgtttgtcaatggt300accgtgacacagggggaccaaagagtctccatgccctatgcctccaaagggctgtatcta360gaaactgaggctgggtactacaagctgtccggtgaggcctatggctttgtggccaggatc420gatggcagcggcaactttcaagtcctgctgtcagacagatacttcaacaagacctgcggg480ctgtgtggcaactttaacatctttgctgaagatgactttatgacccaagaagggaccttg540acctcggacccttatgactttgccaactcatgggctctgagcagtggagaacagtggtgt600gaacgggcatctcctcccagcagctcatgcaacatctcctctggggaaatgcagaagggc660ctgtgggagcagtgccagcttctgaagagcacctcggtgtttgcccgctgccaccctctg720gtggaccccgagccttttgtggccctgtgtgagaagactttgtgtgagtgtgctgggggg780ctggagtgcgcctgccctgccctcctggagtacgcccggacctgtgcccaggagggaatg840gtgctgtacggctggaccgaccacagcgcgtgcagcccagtgtgccctgctggtatggag900tataggcagtgtgtgtccccttgcgccaggacctgccagagcctgcacatcaatgaaatg960tgtcaggagcgatgcgtggatggctgcagctgccctgagggacagctcctggatgaaggc1020ctctgcgtggagagcaccgagtgtccctgcgtgcattccggaaagcgctaccctcccggc1080acctccctctctcgagactgcaacacctgcatttgccgaaacagccagtggatctgcagc1140aatgaagaatgtccaggggagtgccttgtcactggtcaatcccacttcaagagctttgac1200aacagatacttcaccttcagtgggatctgccagtacctgctggcccgggattgccaggac1260cactccttctccattgtcattgagactgtccagtgtgctgatgaccgcgacgctgtgtgc1320acccgctccgtcaccgtccggctgcctggcctgcacaacagccttgtgaaactgaagcat1380ggggcaggagttgccatggatggccaggacatccagctccccctcctgaaaggtgacctc1440cgcatccagcatacagtgacggcctccgtgcgcctcagctacggggaggacctgcagatg1500gactgggatggccgcgggaggctgctggtgaagctgtcccccgtctatgccgggaagacc1560tgcggcctgtgtgggaattacaatggcaaccagggcgacgacttccttaccccctctggg1620ctggcrgagccccgggtggaggacttcgggaacgcctggaagctgcacggggactgccag1680gacctgcagaagcagcacagcgatccctgcgccctcaacccgcgcatgaccaggttctcc1740gaggaggcgtgcgcggtcctgacgtcccccacattcgaggcctgccatcgtgccgtcagc1800ccgctgccctacctgcggaactgccgctacgacgtgtgctcctgctcggacggccgcgag1860tgcctgtgcggcgccctggccagctatgccgcggcctgcgcggggagaggcgtgcgcgtc1920gcgtggcgcgagccaggccgctgtgagctgaactgcccgaaaggccaggtgtacctgcag1980tgcgggaccccctgcaacctgacctgccgctctctctcttacccggatgaggaatgcaat2040gaggcctgcctggagggctgcttctgccccccagggctctacatggatgagaggggggac2100tgcgtgcccaaggcccagtgcccctgttactatgacggtgagatcttccagccagaagac2160atcttctcagaccatcacaccatgtgctactgtgaggatggcttcatgcactgtaccatg2220agtggagtccccggaagcttgctgcctgacgctgtcctcagcagtcccctgtctcatcgc2280agcaaaaggagcctatcctgtcggccccccatggtcaagctggtgtgtcccgctgacaac2340ctgcgggctgaagggctcgagtgtaccaaaacgtgccagaactatgacctggagtgcatg2400agcatgggctgtgtctctggctgcctctgccccccgggcatggtccggcatgagaacaga2460tgtgtggccctggaaaggtgtccctgcttccatcagggcaaggagtatgcccctggagaa2520acagtgaagattggctgcaacacttgtgtctgtcgggaccggaagtggaactgcacagac2580catgtgtgtgatgccacgtgctccacgatcggcatggcccactacctcaccttcgacggg2640ctcaaatacctgttccccggggagtgccagtacgttctggtgcaggattactgcggcagt2700aaccctgggacctttcggatcctagtggggaataagggatgcagccacccctcagtgaaa2760tgcaagaaacgggtcaccatcctggtggagggaggagagattgagctgtttgacggggag2820gtgaatgtgaagaggcccatgaaggatgagactcactttgaggtggtggagtctggccgg2880tacatcattctgctgctgggcaaagccctctccgtggtctgggaccgccacctgagcatc2940tccgtggtcctgaagcagacataccaggagaaagtgtgtggcctgtgtgggaattttgat3000ggcatccagaacaatgacctcaccagcagcaacctccaagtggaggaagaccctgtggac3060tttgggaactcctggaaagtgagctcgcagtgtgctgacaccagaaaagtgcctctggac3120tcatcccctgccacctgccataacaacatcatgaagcagacgatggtggattcctcctgt3180agaatccttaccagtgacgtcttccaggactgcaacaagctggtggaccccgagccatat3240ctggatgtctgcatttacgacacctgctcctgtgagtccattggggactgcgcctgcttc3300tgcgacaccattgctgcctatgcccacgtgtgtgcccagcatggcaaggtggtgacctgg3360aggacggccacattgtgcccccagagctgcgaggagaggaatctccgggagaacgggtat3420gagtgtgagtggcgctataacagctgtgcacctgcctgtcaagtcacgtgtcagcaccct3480gagccactggcctgccctgtgcagtgtgtggagggctgccatgcccactgccctccaggg3540aaaatcctggatgagcttttgcagacctgcgttgaccctgaagactgtccagtgtgtgag3600gtggctggccggcgttttgcctcaggaaagaaagtcaccttgaatcccagtgaccctgag3660cactgccagatttgccactgtgatgttgtcaacctcacctgtgaagcctgccaggagccg3720ggaggcctggtggtgcctcccacagatgccccggtgagccccaccactctgtatgtggag3780gacatctcggaaccgccgttgcacgatttctactgcagcaggctactggacctggtcttc3840ctgctggatggctcctccaggctgtccgaggctgagtttgaagtgctgaaggcctttgtg3900gtggacatgatggagcggctgcgcatctcccagaagtgggtccgcgtggccgtggtggag3960taccacgacggctcccacgcctacatcgggctcaaggaccggaagcgaccgtcagagctg4020cggcgcattgccagccaggtgaagtatgcgggcagccaggtggcctccaccagcgaggtc4080ttgaaatacacactgttccaaatcttcagcaagatcgaccgccctgaagcctcccgcatc4140gccctgctcctgatggccagccaggagccccaacggatgtcccggaactttgtccgctac4200gtccagggcctgaagaagaagaaggtcattgtgatcccggtgggcattgggccccatgcc4260aacctcaagcagatccgcctcatcgagaagcaggcccctgagaacaaggccttcgtgctg4320agcagtgtggatgagctggagcagcaaagggacgagatcgttagctacctctgtgacctt4380gcccctgaagcccctcctcctactctgccccccgacatggcacaagtcactgtgggcccg4440gggctcttgggggtttcgaccctggggcccaagaggaactccatggttctggatgtggcg4500ttcgtcctggaaggatcggacaaaattggtgaagccgacttcaacaggagcaaggagttc4560atggaggaggtgattcagcggatggatgtgggccaggacagcatccacgtcacggtgctg4620cagtactcctacatggtgaccgtggagtaccccttcagcgaggcacagtccaaaggggac4680atcctgcagcgggtgcgagagatccgctaccagggcggcaacaggaccaacactgggctg4740gccctgcggtacctctctgaccacagcttcttggtcagccagggtgaccgggagcaggcg4800cccaacctggtctacatggtcaccggaaatcctgcctctgatgagatcaagaggctgcct4860ggagacatccaggtggtgcccattggagtgggccctaatgccaacgtgcaggagctggag4920aggattggctggcccaatgcccctatcctcatccaggactttgagacgctcccccgagag4980gctcctgacctggtgctgcagaggtgctgctccggagaggggctgcagatccccaccctc5040tcccctgcacctgactgcagccagcccctggacgtgatccttctcctggatggctcctcc5100agtttcccagcttcttattttgatgaaatgaagagtttcgccaaggctttcatttcaaaa5160gccaatatagggcctcgtctcactcaggtgtcagtgctgcagtatggaagcatcaccacc5220attgacgtgccatggaacgtggtcccggagaaagcccatttgctgagccttgtggacgtc5280atgcagcgggagggaggccccagccaaatcggggatgccttgggctttgctgtgcgatac5340ttgacttcagaaatgcatggtgccaggccgggagcctcaaaggcggtggtcatcctggtc5400acggacgtctctgtggattcagtggatgcagcagctgatgccgccaggtccaacagagtg5460acagtgttccctattggaattggagatcgctacgatgcagcccagctacggatcttggca5520ggcccagcaggcgactccaacgtggtgaagctccagcgaatcgaagacctccctaccatg5580gtcaccttgggcaattccttcctccacaaactgtgctctggatttgttaggatttgcatg5640gatgaggatgggaatgagaagaggcccggggacgtctggaccttgccagaccagtgccac5700accgtgacttgccagccagatggccagaccttgctgaagagtcatcgggtcaactgtgac5760cgggggctgaggccttcgtgccctaacagccagtcccctgttaaagtggaagagacctgt5820ggctgccgctggacctgcccctgygtgtgcacaggcagctccactcggcacatcgtgacc5880tttgatgggcagaatttcaagctgactggcagctgttcttatgtcctatttcaaaacaag5940gagcaggacctggaggtgattctccataatggtgcctgcagccctggagcaaggcagggc6000tgcatgaaatccatcgaggtgaagcacagtgccctctccgtcgagstgcacagtgacatg6060gaggtgacggtgaatgggagactggtctctgttccttacgtgggtgggaacatggaagtc6120aacgtttatggtgccatcatgcatgaggtcagattcaatcaccttggtcacatcttcaca6180ttcactccacaaaacaatgagttccaactgcagctcagccccaagacttttgcttcaaag6240acgtatggtctgtgtgggatctgtgatgagaacggagccaatgacttcatgctgagggat6300ggcacagtcaccacagactggaaaacacttgttcaggaatggactgtgcagcggccaggg6360cagacgtgccagcccatcctggaggagcagtgtcttgtccccgacagctcccactgccag6420gtcctcctcttaccactgtttgctgaatgccacaaggtcctggctccagccacattctat6480gccatctgccagcaggacagttgccaccaggagcaagtgtgtgaggtgatcgcctcttat6540gcccacctctgtcggaccaacggggtctgcgttgactggaggacacctgatttctgtgct6600atgtcatgcccaccatctctggtctacaaccactgtgagcatggctgtccccggcactgt6660gatggcaacgtgagctcctgtggggaccatccctccgaaggctgtttctgccctccagat6720aaagtcatgttggaaggcagctgtgtccctgaagaggcctgcactcagtgcattggtgag6780gatggagtccagcaccagttcctggaagcctgggtcccggaccaccagccctgtcagatc6840tgcacatgcctcagcgggcggaaggtcaactgcacaacgcagccctgccccacggccaaa6900gctcccacgtgtggcctgtgtgaagtagcccgcctccgccagaatgcagaccagtgctgc6960cccgagtatgagtgtgtgtgtgacccagtgagctgtgacctgcccccagtgcctcactgt7020gaacgtggcctccagcccacactgaccaaccctggcgagtgcagacccaacttcacctgc7080gcctgcaggaaggaggagtgcaaaagagtgtccccaccctcctgccccccgcaccgtttg7140cccacccttcggaagacccagtgctgtgatgagtatgagtgtgcctgcaactgtgtcaac7200tccacagtgagctgtccccttgggtacttggcctcaaccgccaccaatgactgtggctgt7260accacaaccacctgccttcccgacaaggtgtgtgtccaccgaagcaccatctaccctgtg7320ggccagttctgggaggagggctgcgatgtgtgcacctgcaccgacatggaggatgccgtg7380atgggcctccgcgtggcccagtgctcccagaagccctgtgaggacagctgtcggtcgggc7440ttcacttacgttctgcatgaaggcgagtgctgtggaaggtgcctgccatctgcctgtgag7500gtggtgactggctcaccgcggggggactcccagtcttcctggaagagtgtcggctcccag7560tgggcctccccggagaacccctgcctcatcaatgagtgtgtccgagtgaaggaggaggtc7620tttatacaacaaaggaacgtctcctgcccccagctggaggtccctgtctgcccctcgggc7680tttcagctgagctgtaagacctcagcgtgctgcccaagctgtcgctgtgagcgcatggag7740gcctgcatgctcaatggcactgtcattgggcccgggaagactgtgatgatcgatgtgtgc7800acgacctgccgctgcatggtgcaggtgggggtcatctctggattcaagctggagtgcagg7860aagaccacctgcaacccctgccccctgggttacaaggaagaaaataacacaggtgaatgt7920tgtgggagatgtttgcctacggcttgcaccattcagctaagaggaggacagatcatgaca7980ctgaagcgtgatgagacgctccaggatggctgtgatactcacttctgcaaggtcaatgag8040agaggagagtacttctgggagaagagggtcacaggctgcccaccctttgatgaacacaag8100tgtcttgctgagggaggtaaaattatgaaaattccaggcacctgctgtgacacatgtgag8160gagcctgagtgcaacgacatcactgccaggctgcagtatgtcaaggtgggaagctgtaag8220tctgaagtagaggtggatatccactactgccagggcaaatgtgccagcaaagccatgtac8280tccattgacatcaacgatgtgcaggaccagtgctcctgctgctctccgacacggacggag8340cccatgcaggtggccctgcactgcaccaatggctctgttgtgtaccatgaggttctcaat8400gccatggagtgcaaatgctcccccaggaagtgcagcaagtga8442<210>129<211>2809<212>prt<213>人工序列<220><223>人vwf<220><221>misc_特征<222>(540)..(540)<223>xaa可以是任何天然存在的氨基酸<220><221>misc_特征<222>(1944)..(1944)<223>xaa可以是任何天然存在的氨基酸<220><221>misc_特征<222>(2012)..(2012)<223>xaa可以是任何天然存在的氨基酸<400>129metileproalaargphealaglyvalleuleualaleualaleuile151015leuproglythrleucysalagluglythrargglyargserserthr202530alaargcysserleupheglyseraspphevalasnthrpheaspgly354045sermettyrserphealaglytyrcyssertyrleuleualaglygly505560cysglnlysargserpheserileileglyasppheglnasnglylys65707580argvalserleuservaltyrleuglygluphepheaspilehisleu859095phevalasnglythrvalthrglnglyaspglnargvalsermetpro100105110tyralaserlysglyleutyrleugluthrglualaglytyrtyrlys115120125leuserglyglualatyrglyphevalalaargileaspglysergly130135140asnpheglnvalleuleuseraspargtyrpheasnlysthrcysgly145150155160leucysglyasnpheasnilephealagluaspaspphemetthrgln165170175gluglythrleuthrseraspprotyraspphealaasnsertrpala180185190leuserserglygluglntrpcysgluargalaserproproserser195200205sercysasnileserserglyglumetglnlysglyleutrpglugln210215220cysglnleuleulysserthrservalphealaargcyshisproleu225230235240valaspprogluprophevalcysglulysthrleucysglucysala245250255glyglyleuglucysalacysproalaleuleuglutyralaargthr260265270cysalaglngluglymetvalleutyrglytrpthrasphisserala275280285cysserprovalcysproalaglymetglutyrargglncysvalser290295300procysalaargthrcysglnserleuhisileasnglumetcysgln305310315320gluargcysvalaspglycyssercysprogluglyglnleuleuasp325330335gluglyleucysvalgluserthrglucysprocysvalhissergly340345350lysargtyrproproglythrserleuserargaspcysasnthrcys355360365ilecysargasnserglntrpilecysserasngluglucysprogly370375380glucysleuvalthrglyglnserhisphelysserpheaspasnarg385390395400tyrphethrpheserglyilecysglntyrleuleualaargaspcys405410415glnasphisserpheserilevalilegluthrvalglncysalaasp420425430aspargaspalavalcysthrargservalthrvalargleuprogly435440445leuhisasnserleuvallysleulyshisglyalaglyvalalamet450455460aspglyglnaspileglnleuproleuleulysglyaspleuargile465470475480glnhisthrvalthralaservalargleusertyrglygluaspleu485490495glnmetasptrpaspglyargglyargleuleuvallysleuserpro500505510valtyralaglylysthrcysglyleucysglyasntyrasnglyasn515520525glnglyaspasppheleuthrproserglyleuxaagluproargval530535540gluasppheglyasnalatrplysleuhisglyaspcysglnaspleu545550555560glnlysglnhisseraspprocysalaleuasnproargmetthrarg565570575phesergluglualacysalavalleuthrserprothrphegluala580585590cyshisargalavalserproleuprotyrleuargasncysargtyr595600605aspvalcyssercysseraspglyargglucysleucysglyalaser610615620tyralaalaalacysalaglyargglyvalargvalalatrpargglu625630635640proglyargcysgluleuasncysprolysglyglnvaltyrleugln645650655cysglythrprocysasnleuthrcysargserleusertyrproasp660665670gluglucysasnglualacysleugluglycysphecysproprogly675680685leutyrmetaspgluargglyaspcysvalprolysalaglncyspro690695700cystyrtyraspglygluilepheglnprogluaspilepheserasp705710715720hishisthrmetcystyrcysgluaspglyphemethiscysthrmet725730735serglyvalproglyserleuleuproaspalavalleuserserpro740745750leuserhisargserlysargserleusercysargproprometval755760765lysleuvalcysproalaaspasnleuargalagluglyleuglucys770775780thrlysthrcysglnasntyraspleuglucysmetsermetglycys785790795800valserglycysleucysproproglymetvalarghisgluasnarg805810815cysvalalaleugluargcysprocysphehisglnglylysglutyr820825830alaproglygluthrvallysileglycysasnthrcysvalcysarg835840845asparglystrpasncysthrasphisvalcysaspalathrcysser850855860thrileglymetalahistyrleuthrpheaspglyleulystyrleu865870875880pheproglyglucysglntyrvalleuvalglnasptyrcysglyser885890895asnproglythrpheargileleuvalglyasnlysglycysserhis900905910proservallyscyslyslysargvalthrileleuvalgluglygly915920925gluilegluleupheaspglygluvalasnvallysargprometlys930935940aspgluthrhisphegluvalvalgluserglyargtyrileileleu945950955960leuleuglylysalaleuservalvaltrpasparghisleuserile965970975servalvalleulysglnthrtyrglnglulysvalcysglyleucys980985990glyasnpheaspglyileglnasnasnaspleuthrserserasnleu99510001005glnvalglugluaspprovalasppheglyasnsertrplysval101010151020serserglncysalaaspthrarglysvalproleuaspserser102510301035proalathrcyshisasnasnilemetlysglnthrmetvalasp104010451050sersercysargileleuthrseraspvalpheglnaspcysasn105510601065lysleuvalaspprogluprotyrleuaspvalcysiletyrasp107010751080thrcyssercysgluserileglyaspcysalacysphecysasp108510901095thrilealaalatyralahisvalcysalaglnhisglylysval110011051110valthrtrpargthralathrleucysproglnsercysgluglu111511201125argasnleuarggluasnglytyrglucysglutrpargtyrasn113011351140sercysalaproalacysglnvalthrcysglnhisproglupro114511501155leualacysprovalglncysvalgluglycyshisalahiscys116011651170proproglylysileleuaspgluleuleuglnthrcysvalasp117511801185progluaspcysprovalcysgluvalalaglyargargpheala119011951200serglylyslysvalthrleuasnproseraspprogluhiscys120512101215glnilecyshiscysaspvalvalasnleuthrcysglualacys122012251230glngluproglyglyleuvalvalproprothraspalaproval123512401245serprothrthrleutyrvalgluaspilesergluproproleu125012551260hisaspphetyrcysserargleuleuaspleuvalpheleuleu126512701275aspglyserserargleuserglualagluphegluvalleulys128012851290alaphevalvalaspmetmetgluargleuargileserglnlys129513001305trpvalargvalalavalvalglutyrhisaspglyserhisala131013151320tyrileglyleulysasparglysargprosergluleuargarg132513301335ilealaserglnvallystyralaglyserglnvalalaserthr134013451350sergluvalleulystyrthrleupheglnilepheserlysile135513601365aspargproglualaserargilealaleuleuleumetalaser137013751380glngluproglnargmetserargasnphevalargtyrvalgln138513901395glyleulyslyslyslysvalilevalileprovalglyilegly140014051410prohisalaasnleulysglnileargleuileglulysglnala141514201425progluasnlysalaphevalleuserservalaspgluleuglu143014351440glnglnargaspgluilevalsertyrleucysaspleualapro144514501455glualaproproprothrleuproproaspmetalaglnvalthr146014651470valglyproglyleuleuglyvalserthrleuglyprolysarg147514801485asnsermetvalleuaspvalalaphevalleugluglyserasp149014951500lysileglyglualaasppheasnargserlysgluphemetglu150515101515gluvalileglnargmetaspvalglyglnaspserilehisval152015251530thrvalleuglntyrsertyrmetvalthrvalglutyrprophe153515401545serglualaglnserlysglyaspileleuglnargvalargglu155015551560ileargtyrglnglyglyasnargthrasnthrglyleualaleu156515701575argtyrleuserasphisserpheleuvalserglnglyasparg158015851590gluglnalaproasnleuvaltyrmetvalthrglyasnproala159516001605seraspgluilelysargleuproglyaspileglnvalvalpro161016151620ileglyvalglyproasnalaasnvalglngluleugluargile162516301635glytrpproasnalaproileleuileglnaspphegluthrleu164016451650proargglualaproaspleuvalleuglnargcyscyssergly165516601665gluglyleuglnileprothrleuserproalaproaspcysser167016751680glnproleuaspvalileleuleuleuaspglyserserserphe168516901695proalasertyrpheaspglumetlysserphealalysalaphe170017051710ileserlysalaasnileglyproargleuthrglnvalserval171517201725leuglntyrglyserilethrthrileaspvalprotrpasnval173017351740valproglulysalahisleuleuserleuvalaspvalmetgln174517501755arggluglyglyproserglnileglyaspalaleuglypheala176017651770valargtyrleuthrserglumethisglyalaargproglyala177517801785serlysalavalvalileleuvalthraspvalservalaspser179017951800valaspalaalaalaaspalaalaargserasnargvalthrval180518101815pheproileglyileglyaspargtyraspalaalaglnleuarg182018251830ileleualaglyproalaglyaspserasnvalvallysleugln183518401845argilegluaspleuprothrmetvalthrleuglyasnserphe185018551860leuhislysleucysserglyphevalargilecysmetaspglu186518701875aspglyasnglulysargproglyaspvaltrpthrleuproasp188018851890glncyshisthrvalthrcysglnproaspglyglnthrleuleu189519001905lysserhisargvalasncysaspargglyleuargprosercys191019151920proasnserglnserprovallysvalglugluthrcysglycys192519301935argtrpthrcysproxaavalcysthrglyserserthrarghis194019451950ilevalthrpheaspglyglnasnphelysleuthrglysercys195519601965sertyrvalleupheglnasnlysgluglnaspleugluvalile197019751980leuhisasnglyalacysserproglyalaargglnglycysmet198519901995lysserilegluvallyshisseralaleuservalgluxaahis200020052010seraspmetgluvalthrvalasnglyargleuvalservalpro201520202025tyrvalglyglyasnmetgluvalasnvaltyrglyalailemet203020352040hisgluvalargpheasnhisleuglyhisilephethrphethr204520502055proglnasnasnglupheglnleuglnleuserprolysthrphe206020652070alaserlysthrtyrglyleucysglyilecysaspgluasngly207520802085alaasnaspphemetleuargaspglythrvalthrthrasptrp209020952100lysthrleuvalglnglutrpthrvalglnargproglyglnthr210521102115cysglnproileleuglugluglncysleuvalproaspserser212021252130hiscysglnvalleuleuleuproleuphealaglucyshislys213521402145valleualaproalathrphetyralailecysglnglnaspser215021552160cyshisglngluglnvalcysgluvalilealasertyralahis216521702175leucysargthrasnglyvalcysvalasptrpargthrproasp218021852190phecysalametsercysproproserleuvaltyrasnhiscys219522002205gluhisglycysproarghiscysaspglyasnvalsersercys221022152220glyasphisprosergluglycysphecysproproasplysval222522302235metleugluglysercysvalprogluglualacysthrglncys224022452250ileglygluaspglyvalglnhisglnpheleuglualatrpval225522602265proasphisglnprocysglnilecysthrcysleuserglyarg227022752280lysvalasncysthrthrglnprocysprothralalysalapro228522902295thrcysglyleucysgluvalalaargleuargglnasnalaasp230023052310glncyscysproglutyrglucysvalcysaspprovalsercys231523202325aspleuproprovalprohiscysgluargglyleuglnprothr233023352340leuthrasnproglyglucysargproasnphethrcysalacys234523502355arglysgluglucyslysargvalserproprosercyspropro236023652370hisargleuprothrleuarglysthrglncyscysaspglutyr237523802385glucysalacysasncysvalasnserthrvalsercysproleu239023952400glytyrleualaserthralathrasnaspcysglycysthrthr240524102415thrthrcysleuproasplysvalcysvalhisargserthrile242024252430tyrprovalglyglnphetrpglugluglycysaspvalcysthr243524402445cysthraspmetgluaspalavalmetglyleuargvalalagln245024552460cysserglnlysprocysgluaspsercysargserglyphethr246524702475tyrvalleuhisgluglyglucyscysglyargcysleuproser248024852490alacysgluvalvalthrglyserproargglyaspserglnser249525002505sertrplysservalglyserglntrpalaserprogluasnpro251025152520cysleuileasnglucysvalargvallysglugluvalpheile252525302535glnglnargasnvalsercysproglnleugluvalprovalcys254025452550proserglypheglnleusercyslysthrseralacyscyspro255525602565sercysargcysgluargmetglualacysmetleuasnglythr257025752580valileglyproglylysthrvalmetileaspvalcysthrthr258525902595cysargcysmetvalglnvalglyvalileserglyphelysleu260026052610glucysarglysthrthrcysasnprocysproleuglytyrlys261526202625glugluasnasnthrglyglucyscysglyargcysleuprothr263026352640alacysthrileglnleuargglyglyglnilemetthrleulys264526502655argaspgluthrleuglnaspglycysaspthrhisphecyslys266026652670valasngluargglyglutyrphetrpglulysargvalthrgly267526802685cyspropropheaspgluhislyscysleualagluglyglylys269026952700ilemetlysileproglythrcyscysaspthrcysgluglupro270527102715glucysasnaspilethralaargleuglntyrvallysvalgly272027252730sercyslyssergluvalgluvalaspilehistyrcysglngly273527402745lyscysalaserlysalamettyrserileaspileasnaspval275027552760glnaspglncyssercyscysserprothrargthrglupromet276527702775glnvalalaleuhiscysthrasnglyservalvaltyrhisglu278027852790valleuasnalametglucyslyscysserproarglyscysser279528002805lys<210>130<211>36<212>prt<213>人工序列<220><223>ae36<400>130glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglysergluproalathrsergly202530sergluthrpro35<210>131<211>42<212>prt<213>人工序列<220><223>ae42<400>131glyalaproglyserproalaglyserprothrserthrgluglugly151015thrsergluseralathrprogluserglyproglysergluproala202530thrserglysergluthrproalaserser3540<210>132<211>78<212>prt<213>人工序列<220><223>ae72<400>132glyalaprothrsergluseralathrprogluserglyproglyser151015gluproalathrserglysergluthrproglythrsergluserala202530thrprogluserglyproglysergluproalathrserglyserglu354045thrproglythrsergluseralathrprogluserglyproglythr505560serthrgluprosergluglyseralaproglyalaserser657075<210>133<211>78<212>prt<213>人工序列<220><223>ae78<400>133glyalaprothrsergluseralathrprogluserglyproglyser151015gluproalathrserglysergluthrproglythrsergluserala202530thrprogluserglyproglysergluproalathrserglyserglu354045thrproglythrsergluseralathrprogluserglyproglythr505560serthrgluprosergluglyseralaproglyalaserser657075<210>134<211>143<212>prt<213>人工序列<220><223>ae144<400>134glysergluproalathrserglysergluthrproglythrserglu151015seralathrprogluserglyproglysergluproalathrsergly202530sergluthrproglyserproalaglyserprothrserthrgluglu354045glythrserthrgluprosergluglyseralaproglyserglupro505560alathrserglysergluthrproglysergluproalathrsergly65707580sergluthrproglysergluproalathrserglysergluthrpro859095glythrserthrgluprosergluglyseralaproglythrserglu100105110seralaprogluserglyproglysergluproalathrserglyser115120125gluthrproglythrserthrgluprosergluglyseralapro130135140<210>135<211>144<212>prt<213>人工序列<220><223>ae144_6b<400>135thrserthrgluprosergluglyseralaproglythrsergluser151015alathrprogluserglyproglythrsergluseralathrproglu202530serglyproglythrsergluseralathrprogluserglyprogly354045sergluproalathrserglysergluthrproglysergluproala505560thrserglysergluthrproglyserproalaglyserprothrser65707580thrglugluglythrserthrgluprosergluglyseralaprogly859095thrserthrgluprosergluglyseralaproglysergluproala100105110thrserglysergluthrproglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>136<211>144<212>prt<213>人工序列<220><223>ag144<400>136glythrproglyserglythralaserserserproglyserserthr151015proserglyalathrglyserproglyserserproseralaserthr202530glythrglyproglyserserproseralaserthrglythrglypro354045glyalaserproglythrserserthrglyserproglyalaserpro505560glythrserserthrglyserproglyserserthrproserglyala65707580thrglyserproglyserserproseralaserthrglythrglypro859095glyalaserproglythrserserthrglyserproglyserserpro100105110seralaserthrglythrglyproglythrproglyserglythrala115120125serserserproglyserserthrproserglyalathrglyserpro130135140<210>137<211>144<212>prt<213>人工序列<220><223>ag144_a<400>137glyalaserproglythrserserthrglyserproglyserserpro151015seralaserthrglythrglyproglyserserproseralaserthr202530glythrglyproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglythrproglyserglythralaserserserpro859095glyserserthrproserglyalathrglyserproglythrprogly100105110serglythralaserserserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>138<211>288<212>prt<213>人工序列<220><223>ae288<400>138glythrsergluseralathrprogluserglyproglyserglupro151015alathrserglysergluthrproglythrsergluseralathrpro202530gluserglyproglysergluproalathrserglysergluthrpro354045glythrsergluseralathrprogluserglyproglythrserthr505560gluprosergluglyseralaproglyserproalaglyserprothr65707580serthrglugluglythrsergluseralathrprogluserglypro859095glysergluproalathrserglysergluthrproglythrserglu100105110seralathrprogluserglyproglyserproalaglyserprothr115120125serthrglugluglyserproalaglyserprothrserthrgluglu130135140glythrserthrgluprosergluglyseralaproglythrserglu145150155160seralathrprogluserglyproglythrsergluseralathrpro165170175gluserglyproglythrsergluseralathrprogluserglypro180185190glysergluproalathrserglysergluthrproglyserglupro195200205alathrserglysergluthrproglyserproalaglyserprothr210215220serthrglugluglythrserthrgluprosergluglyseralapro225230235240glythrserthrgluprosergluglyseralaproglyserglupro245250255alathrserglysergluthrproglythrsergluseralathrpro260265270gluserglyproglythrserthrgluprosergluglyseralapro275280285<210>139<211>288<212>prt<213>人工序列<220><223>ae288_2<400>139glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglysergluproalathrsergly202530sergluthrproglythrsergluseralathrprogluserglypro354045glythrserthrgluprosergluglyseralaproglythrserthr505560gluprosergluglyseralaproglythrserthrgluproserglu65707580glyseralaproglythrserthrgluprosergluglyseralapro859095glythrserthrgluprosergluglyseralaproglythrserthr100105110gluprosergluglyseralaproglyserproalaglyserprothr115120125serthrglugluglythrserthrgluprosergluglyseralapro130135140glythrsergluseralathrprogluserglyproglyserglupro145150155160alathrserglysergluthrproglythrsergluseralathrpro165170175gluserglyproglysergluproalathrserglysergluthrpro180185190glythrsergluseralathrprogluserglyproglythrserthr195200205gluprosergluglyseralaproglythrsergluseralathrpro210215220gluserglyproglyserproalaglyserprothrserthrgluglu225230235240glyserproalaglyserprothrserthrglugluglyserproala245250255glyserprothrserthrglugluglythrsergluseralathrpro260265270gluserglyproglythrserthrgluprosergluglyseralapro275280285<210>140<211>288<212>prt<213>人工序列<220><223>ag288<400>140proglyalaserproglythrserserthrglyserproglyalaser151015proglythrserserthrglyserproglythrproglyserglythr202530alaserserserproglyserserthrproserglyalathrglyser354045proglythrproglyserglythralaserserserproglyserser505560thrproserglyalathrglyserproglythrproglyserglythr65707580alaserserserproglyserserthrproserglyalathrglyser859095proglyserserthrproserglyalathrglyserproglyserser100105110proseralaserthrglythrglyproglyserserproseralaser115120125thrglythrglyproglyalaserproglythrserserthrglyser130135140proglythrproglyserglythralaserserserproglyserser145150155160thrproserglyalathrglyserproglyserserproseralaser165170175thrglythrglyproglyserserproseralaserthrglythrgly180185190proglyalaserproglythrserserthrglyserproglyalaser195200205proglythrserserthrglyserproglyserserthrprosergly210215220alathrglyserproglyserserproseralaserthrglythrgly225230235240proglyalaserproglythrserserthrglyserproglyserser245250255proseralaserthrglythrglyproglythrproglyserglythr260265270alaserserserproglyserserthrproserglyalathrglyser275280285<210>141<211>576<212>prt<213>人工序列<220><223>ae576<400>141glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglythrserthrgluproserglu202530glyseralaproglyserproalaglyserprothrserthrgluglu354045glythrserthrgluprosergluglyseralaproglythrserthr505560gluprosergluglyseralaproglythrsergluseralathrpro65707580gluserglyproglysergluproalathrserglysergluthrpro859095glysergluproalathrserglysergluthrproglyserproala100105110glyserprothrserthrglugluglythrsergluseralathrpro115120125gluserglyproglythrserthrgluprosergluglyseralapro130135140glythrserthrgluprosergluglyseralaproglyserproala145150155160glyserprothrserthrglugluglythrserthrgluproserglu165170175glyseralaproglythrserthrgluprosergluglyseralapro180185190glythrsergluseralathrprogluserglyproglythrserthr195200205gluprosergluglyseralaproglythrsergluseralathrpro210215220gluserglyproglysergluproalathrserglysergluthrpro225230235240glythrserthrgluprosergluglyseralaproglythrserthr245250255gluprosergluglyseralaproglythrsergluseralathrpro260265270gluserglyproglythrsergluseralathrprogluserglypro275280285glyserproalaglyserprothrserthrglugluglythrserglu290295300seralathrprogluserglyproglysergluproalathrsergly305310315320sergluthrproglythrsergluseralathrprogluserglypro325330335glythrserthrgluprosergluglyseralaproglythrserthr340345350gluprosergluglyseralaproglythrserthrgluproserglu355360365glyseralaproglythrserthrgluprosergluglyseralapro370375380glythrserthrgluprosergluglyseralaproglythrserthr385390395400gluprosergluglyseralaproglyserproalaglyserprothr405410415serthrglugluglythrserthrgluprosergluglyseralapro420425430glythrsergluseralathrprogluserglyproglyserglupro435440445alathrserglysergluthrproglythrsergluseralathrpro450455460gluserglyproglysergluproalathrserglysergluthrpro465470475480glythrsergluseralathrprogluserglyproglythrserthr485490495gluprosergluglyseralaproglythrsergluseralathrpro500505510gluserglyproglyserproalaglyserprothrserthrgluglu515520525glyserproalaglyserprothrserthrglugluglyserproala530535540glyserprothrserthrglugluglythrsergluseralathrpro545550555560gluserglyproglythrserthrgluprosergluglyseralapro565570575<210>142<211>576<212>prt<213>人工序列<220><223>ag576<400>142proglythrproglyserglythralaserserserproglyserser151015thrproserglyalathrglyserproglyserserproseralaser202530thrglythrglyproglyserserproseralaserthrglythrgly354045proglyserserthrproserglyalathrglyserproglyserser505560thrproserglyalathrglyserproglyalaserproglythrser65707580serthrglyserproglyalaserproglythrserserthrglyser859095proglyalaserproglythrserserthrglyserproglythrpro100105110glyserglythralaserserserproglyalaserproglythrser115120125serthrglyserproglyalaserproglythrserserthrglyser130135140proglyalaserproglythrserserthrglyserproglyserser145150155160proseralaserthrglythrglyproglythrproglyserglythr165170175alaserserserproglyalaserproglythrserserthrglyser180185190proglyalaserproglythrserserthrglyserproglyalaser195200205proglythrserserthrglyserproglyserserthrprosergly210215220alathrglyserproglyserserthrproserglyalathrglyser225230235240proglyalaserproglythrserserthrglyserproglythrpro245250255glyserglythralaserserserproglyserserthrprosergly260265270alathrglyserproglyserserthrproserglyalathrglyser275280285proglyserserthrproserglyalathrglyserproglyserser290295300proseralaserthrglythrglyproglyalaserproglythrser305310315320serthrglyserproglyalaserproglythrserserthrglyser325330335proglythrproglyserglythralaserserserproglyalaser340345350proglythrserserthrglyserproglyalaserproglythrser355360365serthrglyserproglyalaserproglythrserserthrglyser370375380proglyalaserproglythrserserthrglyserproglythrpro385390395400glyserglythralaserserserproglyserserthrprosergly405410415alathrglyserproglythrproglyserglythralaserserser420425430proglyserserthrproserglyalathrglyserproglythrpro435440445glyserglythralaserserserproglyserserthrprosergly450455460alathrglyserproglyserserthrproserglyalathrglyser465470475480proglyserserproseralaserthrglythrglyproglyserser485490495proseralaserthrglythrglyproglyalaserproglythrser500505510serthrglyserproglythrproglyserglythralaserserser515520525proglyserserthrproserglyalathrglyserproglyserser530535540proseralaserthrglythrglyproglyserserproseralaser545550555560thrglythrglyproglyalaserproglythrserserthrglyser565570575<210>143<211>864<212>prt<213>人工序列<220><223>ae864<400>143glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglythrserthrgluproserglu202530glyseralaproglyserproalaglyserprothrserthrgluglu354045glythrserthrgluprosergluglyseralaproglythrserthr505560gluprosergluglyseralaproglythrsergluseralathrpro65707580gluserglyproglysergluproalathrserglysergluthrpro859095glysergluproalathrserglysergluthrproglyserproala100105110glyserprothrserthrglugluglythrsergluseralathrpro115120125gluserglyproglythrserthrgluprosergluglyseralapro130135140glythrserthrgluprosergluglyseralaproglyserproala145150155160glyserprothrserthrglugluglythrserthrgluproserglu165170175glyseralaproglythrserthrgluprosergluglyseralapro180185190glythrsergluseralathrprogluserglyproglythrserthr195200205gluprosergluglyseralaproglythrsergluseralathrpro210215220gluserglyproglysergluproalathrserglysergluthrpro225230235240glythrserthrgluprosergluglyseralaproglythrserthr245250255gluprosergluglyseralaproglythrsergluseralathrpro260265270gluserglyproglythrsergluseralathrprogluserglypro275280285glyserproalaglyserprothrserthrglugluglythrserglu290295300seralathrprogluserglyproglysergluproalathrsergly305310315320sergluthrproglythrsergluseralathrprogluserglypro325330335glythrserthrgluprosergluglyseralaproglythrserthr340345350gluprosergluglyseralaproglythrserthrgluproserglu355360365glyseralaproglythrserthrgluprosergluglyseralapro370375380glythrserthrgluprosergluglyseralaproglythrserthr385390395400gluprosergluglyseralaproglyserproalaglyserprothr405410415serthrglugluglythrserthrgluprosergluglyseralapro420425430glythrsergluseralathrprogluserglyproglyserglupro435440445alathrserglysergluthrproglythrsergluseralathrpro450455460gluserglyproglysergluproalathrserglysergluthrpro465470475480glythrsergluseralathrprogluserglyproglythrserthr485490495gluprosergluglyseralaproglythrsergluseralathrpro500505510gluserglyproglyserproalaglyserprothrserthrgluglu515520525glyserproalaglyserprothrserthrglugluglyserproala530535540glyserprothrserthrglugluglythrsergluseralathrpro545550555560gluserglyproglythrserthrgluprosergluglyseralapro565570575glythrsergluseralathrprogluserglyproglyserglupro580585590alathrserglysergluthrproglythrsergluseralathrpro595600605gluserglyproglysergluproalathrserglysergluthrpro610615620glythrsergluseralathrprogluserglyproglythrserthr625630635640gluprosergluglyseralaproglyserproalaglyserprothr645650655serthrglugluglythrsergluseralathrprogluserglypro660665670glysergluproalathrserglysergluthrproglythrserglu675680685seralathrprogluserglyproglyserproalaglyserprothr690695700serthrglugluglyserproalaglyserprothrserthrgluglu705710715720glythrserthrgluprosergluglyseralaproglythrserglu725730735seralathrprogluserglyproglythrsergluseralathrpro740745750gluserglyproglythrsergluseralathrprogluserglypro755760765glysergluproalathrserglysergluthrproglyserglupro770775780alathrserglysergluthrproglyserproalaglyserprothr785790795800serthrglugluglythrserthrgluprosergluglyseralapro805810815glythrserthrgluprosergluglyseralaproglyserglupro820825830alathrserglysergluthrproglythrsergluseralathrpro835840845gluserglyproglythrserthrgluprosergluglyseralapro850855860<210>144<211>864<212>prt<213>人工序列<220><223>ag864<400>144glyalaserproglythrserserthrglyserproglyserserpro151015seralaserthrglythrglyproglyserserproseralaserthr202530glythrglyproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglythrproglyserglythralaserserserpro859095glyserserthrproserglyalathrglyserproglythrprogly100105110serglythralaserserserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140glythrproglyserglythralaserserserproglyserserthr145150155160proserglyalathrglyserproglyalaserproglythrserser165170175thrglyserproglythrproglyserglythralaserserserpro180185190glyserserthrproserglyalathrglyserproglyserserpro195200205seralaserthrglythrglyproglyserserproseralaserthr210215220glythrglyproglyserserthrproserglyalathrglyserpro225230235240glyserserthrproserglyalathrglyserproglyalaserpro245250255glythrserserthrglyserproglyalaserproglythrserser260265270thrglyserproglyalaserproglythrserserthrglyserpro275280285glythrproglyserglythralaserserserproglyalaserpro290295300glythrserserthrglyserproglyalaserproglythrserser305310315320thrglyserproglyalaserproglythrserserthrglyserpro325330335glyserserproseralaserthrglythrglyproglythrprogly340345350serglythralaserserserproglyalaserproglythrserser355360365thrglyserproglyalaserproglythrserserthrglyserpro370375380glyalaserproglythrserserthrglyserproglyserserthr385390395400proserglyalathrglyserproglyserserthrproserglyala405410415thrglyserproglyalaserproglythrserserthrglyserpro420425430glythrproglyserglythralaserserserproglyserserthr435440445proserglyalathrglyserproglyserserthrproserglyala450455460thrglyserproglyserserthrproserglyalathrglyserpro465470475480glyserserproseralaserthrglythrglyproglyalaserpro485490495glythrserserthrglyserproglyalaserproglythrserser500505510thrglyserproglythrproglyserglythralaserserserpro515520525glyalaserproglythrserserthrglyserproglyalaserpro530535540glythrserserthrglyserproglyalaserproglythrserser545550555560thrglyserproglyalaserproglythrserserthrglyserpro565570575glythrproglyserglythralaserserserproglyserserthr580585590proserglyalathrglyserproglythrproglyserglythrala595600605serserserproglyserserthrproserglyalathrglyserpro610615620glythrproglyserglythralaserserserproglyserserthr625630635640proserglyalathrglyserproglyserserthrproserglyala645650655thrglyserproglyserserproseralaserthrglythrglypro660665670glyserserproseralaserthrglythrglyproglyalaserpro675680685glythrserserthrglyserproglythrproglyserglythrala690695700serserserproglyserserthrproserglyalathrglyserpro705710715720glyserserproseralaserthrglythrglyproglyserserpro725730735seralaserthrglythrglyproglyalaserproglythrserser740745750thrglyserproglyalaserproglythrserserthrglyserpro755760765glyserserthrproserglyalathrglyserproglyserserpro770775780seralaserthrglythrglyproglyalaserproglythrserser785790795800thrglyserproglyserserproseralaserthrglythrglypro805810815glythrproglyserglythralaserserserproglyserserthr820825830proserglyalathrglyserproglyserserthrproserglyala835840845thrglyserproglyalaserproglythrserserthrglyserpro850855860<210>145<211>72<212>prt<213>人工序列<220><223>xten_ae72_2a_1<400>145thrserthrgluprosergluglyseralaproglyserproalagly151015serprothrserthrglugluglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>146<211>72<212>prt<213>人工序列<220><223>xten_ae72_2a_2<400>146thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045thrsergluseralathrprogluserglyproglythrsergluser505560alathrprogluserglyprogly6570<210>147<211>72<212>prt<213>人工序列<220><223>xten_ae72_3b_1<400>147serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglysergluproalathrserglyser202530gluthrproglythrsergluseralathrprogluserglyprogly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaprogly6570<210>148<211>72<212>prt<213>人工序列<220><223>xten_ae72_3b_2<400>148thrserthrgluprosergluglyseralaproglythrserthrglu151015prosergluglyseralaproglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045serproalaglyserprothrserthrglugluglythrserthrglu505560prosergluglyseralaprogly6570<210>149<211>72<212>prt<213>人工序列<220><223>xten_ae72_4a_2<400>149thrsergluseralathrprogluserglyproglyserproalagly151015serprothrserthrglugluglyserproalaglyserprothrser202530thrglugluglyserproalaglyserprothrserthrgluglugly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>150<211>72<212>prt<213>人工序列<220><223>xten_ae72_5a_2<400>150serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglysergluproalathrserglyser202530gluthrproglythrsergluseralathrprogluserglyprogly354045serproalaglyserprothrserthrglugluglyserproalagly505560serprothrserthrgluglugly6570<210>151<211>72<212>prt<213>人工序列<220><223>xten_ae72_6b_1<400>151thrserthrgluprosergluglyseralaproglythrsergluser151015alathrprogluserglyproglythrsergluseralathrproglu202530serglyproglythrsergluseralathrprogluserglyprogly354045sergluproalathrserglysergluthrproglysergluproala505560thrserglysergluthrprogly6570<210>152<211>72<212>prt<213>人工序列<220><223>xten_ae72_6b_2<400>152serproalaglyserprothrserthrglugluglythrserthrglu151015prosergluglyseralaproglythrserthrgluproserglugly202530seralaproglysergluproalathrserglysergluthrprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>153<211>72<212>prt<213>人工序列<220><223>xten_ae72_1a_1<400>153serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglythrserthrgluproserglugly202530seralaproglyserproalaglyserprothrserthrgluglugly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaprogly6570<210>154<211>72<212>prt<213>人工序列<220><223>xten_ae72_1a_2<400>154thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglysergluproalathrserglyser202530gluthrproglyserproalaglyserprothrserthrgluglugly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>155<211>144<212>prt<213>人工序列<220><223>xten_ae144_1a<400>155serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglythrserthrgluproserglugly202530seralaproglyserproalaglyserprothrserthrgluglugly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaproglythrsergluseralathrproglu65707580serglyproglysergluproalathrserglysergluthrprogly859095sergluproalathrserglysergluthrproglyserproalagly100105110serprothrserthrglugluglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>156<211>150<212>prt<213>人工序列<220><223>ae150<400>156glyalaproglysergluproalathrserglysergluthrprogly151015thrsergluseralathrprogluserglyproglysergluproala202530thrserglysergluthrproglyserproalaglyserprothrser354045thrglugluglythrserthrgluprosergluglyseralaprogly505560sergluproalathrserglysergluthrproglysergluproala65707580thrserglysergluthrproglysergluproalathrserglyser859095gluthrproglythrserthrgluprosergluglyseralaprogly100105110thrsergluseralathrprogluserglyproglysergluproala115120125thrserglysergluthrproglythrserthrgluproserglugly130135140seralaproalaserser145150<210>157<211>150<212>prt<213>人工序列<220><223>g150<400>157glyalaproglythrproglyserglythralaserserserprogly151015serserthrproserglyalathrglyserproglyserserproser202530alaserthrglythrglyproglyserserproseralaserthrgly354045thrglyproglyalaserproglythrserserthrglyserprogly505560alaserproglythrserserthrglyserproglyserserthrpro65707580serglyalathrglyserproglyserserproseralaserthrgly859095thrglyproglyalaserproglythrserserthrglyserprogly100105110serserproseralaserthrglythrglyproglythrproglyser115120125glythralaserserserproglyserserthrproserglyalathr130135140glyserproalaserser145150<210>158<211>294<212>prt<213>人工序列<220><223>ae294<400>158glyalaproglythrsergluseralathrprogluserglyprogly151015sergluproalathrserglysergluthrproglythrsergluser202530alathrprogluserglyproglysergluproalathrserglyser354045gluthrproglythrsergluseralathrprogluserglyprogly505560thrserthrgluprosergluglyseralaproglyserproalagly65707580serprothrserthrglugluglythrsergluseralathrproglu859095serglyproglysergluproalathrserglysergluthrprogly100105110thrsergluseralathrprogluserglyproglyserproalagly115120125serprothrserthrglugluglyserproalaglyserprothrser130135140thrglugluglythrserthrgluprosergluglyseralaprogly145150155160thrsergluseralathrprogluserglyproglythrsergluser165170175alathrprogluserglyproglythrsergluseralathrproglu180185190serglyproglysergluproalathrserglysergluthrprogly195200205sergluproalathrserglysergluthrproglyserproalagly210215220serprothrserthrglugluglythrserthrgluproserglugly225230235240seralaproglythrserthrgluprosergluglyseralaprogly245250255sergluproalathrserglysergluthrproglythrsergluser260265270alathrprogluserglyproglythrserthrgluproserglugly275280285seralaproalaserser290<210>159<211>294<212>prt<213>人工序列<220><223>ag294<400>159glyalaproproglyalaserproglythrserserthrglyserpro151015glyalaserproglythrserserthrglyserproglythrprogly202530serglythralaserserserproglyserserthrproserglyala354045thrglyserproglythrproglyserglythralaserserserpro505560glyserserthrproserglyalathrglyserproglythrprogly65707580serglythralaserserserproglyserserthrproserglyala859095thrglyserproglyserserthrproserglyalathrglyserpro100105110glyserserproseralaserthrglythrglyproglyserserpro115120125seralaserthrglythrglyproglyalaserproglythrserser130135140thrglyserproglythrproglyserglythralaserserserpro145150155160glyserserthrproserglyalathrglyserproglyserserpro165170175seralaserthrglythrglyproglyserserproseralaserthr180185190glythrglyproglyalaserproglythrserserthrglyserpro195200205glyalaserproglythrserserthrglyserproglyserserthr210215220proserglyalathrglyserproglyserserproseralaserthr225230235240glythrglyproglyalaserproglythrserserthrglyserpro245250255glyserserproseralaserthrglythrglyproglythrprogly260265270serglythralaserserserproglyserserthrproserglyala275280285thrglyseralaserser290<210>160<211>1016<212>prt<213>人工序列<220><223>fix-接头-白蛋白<400>160tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthrpro405410415valserglnthrserlysleuthrargalagluthrvalpheproasp420425430valaspalahislyssergluvalalahisargphelysaspleugly435440445glugluasnphelysalaleuvalleuilealaphealaglntyrleu450455460glnglncysprophegluasphisvallysleuvalasngluvalthr465470475480gluphealalysthrcysvalalaaspgluseralagluasncysasp485490495lysserleuhisthrleupheglyasplysleucysthrvalalathr500505510leuarggluthrtyrglyglumetalaaspcyscysalalysglnglu515520525progluargasnglucyspheleuglnhislysaspaspasnproasn530535540leuproargleuvalargprogluvalaspvalmetcysthralaphe545550555560hisaspasnglugluthrpheleulyslystyrleutyrgluileala565570575argarghisprotyrphetyralaprogluleuleuphephealalys580585590argtyrlysalaalaphethrglucyscysglnalaalaasplysala595600605alacysleuleuprolysleuaspgluleuargaspgluglylysala610615620serseralalysglnargleulyscysalaserleuglnlysphegly625630635640gluargalaphelysalatrpalavalalaargleuserglnargphe645650655prolysalagluphealagluvalserlysleuvalthraspleuthr660665670lysvalhisthrglucyscyshisglyaspleuleuglucysalaasp675680685aspargalaaspleualalystyrilecysgluasnglnaspserile690695700serserlysleulysglucyscysglulysproleuleuglulysser705710715720hiscysilealagluvalgluasnaspglumetproalaaspleupro725730735serleualaalaaspphevalgluserlysaspvalcyslysasntyr740745750alaglualalysaspvalpheleuglymetpheleutyrglutyrala755760765argarghisproasptyrservalvalleuleuleuargleualalys770775780thrtyrgluthrthrleuglulyscyscysalaalaalaaspphecys785790795800tyralalysvalpheaspgluphelysproleuvalglugluprogln805810815asnleuilelysglnasncysgluleuphegluglnleuglyglutyr820825830lyspheglnasnalaleuleuvalargtyrthrlyslysvalprogln835840845valserthrprothrleuvalgluvalserargasnleuglylysval850855860glyserlyscyscyslyshisproglualalysargmetprocysala865870875880gluasptyrleuservalvalleuasnglnleucysvalleuhisglu885890895lysthrprovalseraspargvalthrlyscyscysthrgluserleu900905910valasnargargprocyspheseralaleugluvalaspgluthrtyr915920925valprolysglupheasnalagluthrphethrphehisalaaspile930935940cysthrleuserglulysgluargglnilelyslysglnthralaleu945950955960valgluleuvallyshislysprolysalathrlysgluglnleulys965970975alavalmetaspaspphealaalaphevalglulyscyscyslysala980985990aspasplysgluthrcysphealaglugluglylyslysleuvalala99510001005alaserglnalaalaleuglyleu10101015<210>161<211>424<212>prt<213>人工序列<220><223>fix<400>161tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthrpro405410415valserglnthrserlysleuthr420<210>162<211>9<212>prt<213>人工序列<220><223>接头<400>162argalagluthrvalpheproaspval15<210>163<211>585<212>prt<213>人工序列<220><223>白蛋白<400>163aspalahislyssergluvalalahisargphelysaspleuglyglu151015gluasnphelysalaleuvalleuilealaphealaglntyrleugln202530glncysprophegluasphisvallysleuvalasngluvalthrglu354045phealalysthrcysvalalaaspgluseralagluasncysasplys505560serleuhisthrleupheglyasplysleucysthrvalalathrleu65707580arggluthrtyrglyglumetalaaspcyscysalalysglnglupro859095gluargasnglucyspheleuglnhislysaspaspasnproasnleu100105110proargleuvalargprogluvalaspvalmetcysthralaphehis115120125aspasnglugluthrpheleulyslystyrleutyrgluilealaarg130135140arghisprotyrphetyralaprogluleuleuphephealalysarg145150155160tyrlysalaalaphethrglucyscysglnalaalaasplysalaala165170175cysleuleuprolysleuaspgluleuargaspgluglylysalaser180185190seralalysglnargleulyscysalaserleuglnlyspheglyglu195200205argalaphelysalatrpalavalalaargleuserglnargphepro210215220lysalagluphealagluvalserlysleuvalthraspleuthrlys225230235240valhisthrglucyscyshisglyaspleuleuglucysalaaspasp245250255argalaaspleualalystyrilecysgluasnglnaspserileser260265270serlysleulysglucyscysglulysproleuleuglulysserhis275280285cysilealagluvalgluasnaspglumetproalaaspleuproser290295300leualaalaaspphevalgluserlysaspvalcyslysasntyrala305310315320glualalysaspvalpheleuglymetpheleutyrglutyralaarg325330335arghisproasptyrservalvalleuleuleuargleualalysthr340345350tyrgluthrthrleuglulyscyscysalaalaalaaspprohisglu355360365cystyralalysvalpheaspgluphelysproleuvalgluglupro370375380glnasnleuilelysglnasncysgluleuphegluglnleuglyglu385390395400tyrlyspheglnasnalaleuleuvalargtyrthrlyslysvalpro405410415glnvalserthrprothrleuvalgluvalserargasnleuglylys420425430valglyserlyscyscyslyshisproglualalysargmetprocys435440445alagluasptyrleuservalvalleuasnglnleucysvalleuhis450455460glulysthrprovalseraspargvalthrlyscyscysthrgluser465470475480leuvalasnargargprocyspheseralaleugluvalaspgluthr485490495tyrvalprolysglupheasnalagluthrphethrphehisalaasp500505510ilecysthrleuserglulysgluargglnilelyslysglnthrala515520525leuvalgluleuvallyshislysprolysalathrlysgluglnleu530535540lysalavalmetaspaspphealaalaphevalglulyscyscyslys545550555560alaaspasplysgluthrcysphealaglugluglylyslysleuval565570575alaalaserglnalaalaleuglyleu580585<210>164<211>763<212>prt<213>人工序列<220><223>fix(xten)-fc<400>164metglnargvalasnmetilemetalagluserproglyleuilethr151015ilecysleuleuglytyrleuleuseralaglucysthrvalpheleu202530asphisgluasnalaasnlysileleuasnargprolysargtyrasn354045serglylysleuglugluphevalglnglyasnleugluargglucys505560metgluglulyscysserphegluglualaarggluvalphegluasn65707580thrgluargthrthrgluphetrplysglntyrvalaspglyaspgln859095cysgluserasnprocysleuasnglyglysercyslysaspaspile100105110asnsertyrglucystrpcyspropheglyphegluglylysasncys115120125gluleuaspvalthrcysasnilelysasnglyargcysgluglnphe130135140cyslysasnseralaaspasnlysvalvalcyssercysthrglugly145150155160tyrargleualagluasnglnlyssercysgluproalavalprophe165170175procysglyargvalservalserglnthrserlysleuthrargala180185190gluthrvalpheproaspvalasptyrvalasnserthrglualaglu195200205thrileleuaspglyproserproglyserprothrserthrgluglu210215220glythrsergluseralathrprogluserglyproglyserglupro225230235240alathrserglysergluthrproglythrsergluseralathrpro245250255gluserglyproglythrserthrgluprosergluglyseralapro260265270glythrserthrgluprosergluglyseralaproglyalaserser275280285asnilethrglnserthrglnserpheasnaspphethrargvalval290295300glyglygluaspalalysproglyglnpheprotrpglnvalvalleu305310315320asnglylysvalaspalaphecysglyglyserilevalasnglulys325330335trpilevalthralaalahiscysvalgluthrglyvallysilethr340345350valvalalaglygluhisasnileglugluthrgluhisthrglugln355360365lysargasnvalileargileileprohishisasntyrasnalaala370375380ileasnlystyrasnhisaspilealaleuleugluleuaspglupro385390395400leuvalleuasnsertyrvalthrproilecysilealaasplysglu405410415tyrthrasnilepheleulyspheglyserglytyrvalserglytrp420425430glyargvalphehislysglyargseralaleuvalleuglntyrleu435440445argvalproleuvalaspargalathrcysleuleuserthrlysphe450455460thriletyrasnasnmetphecysalaglyphehisgluglyglyarg465470475480aspsercysglnglyaspserglyglyprohisvalthrgluvalglu485490495glythrserpheleuthrglyileilesertrpglygluglucysala500505510metlysglylystyrglyiletyrthrlysvalserargtyrvalasn515520525trpilelysglulysthrlysleuthrasplysthrhisthrcyspro530535540procysproalaprogluleuleuglyglyproservalpheleuphe545550555560proprolysprolysaspthrleumetileserargthrprogluval565570575thrcysvalvalvalaspvalserhisgluaspprogluvallysphe580585590asntrptyrvalaspglyvalgluvalhisasnalalysthrlyspro595600605argglugluglntyrasnserthrtyrargvalvalservalleuthr610615620valleuhisglnasptrpleuasnglylysglutyrlyscyslysval625630635640serasnlysalaleuproalaproileglulysthrileserlysala645650655lysglyglnproarggluproglnvaltyrthrleuproproserarg660665670aspgluleuthrlysasnglnvalserleuthrcysleuvallysgly675680685phetyrproseraspilealavalglutrpgluserasnglyglnpro690695700gluasnasntyrlysthrthrproprovalleuaspseraspglyser705710715720phepheleutyrserlysleuthrvalasplysserargtrpglngln725730735glyasnvalphesercysservalmethisglualaleuhisasnhis740745750tyrthrglnlysserleuserleuserprogly755760<210>165<211>712<212>prt<213>人工序列<220><223>fix-fxia-ae288<400>165tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthrgly405410415lysleuthrargalagluthrglyglythrsergluseralathrpro420425430gluserglyproglysergluproalathrserglysergluthrpro435440445glythrsergluseralathrprogluserglyproglyserglupro450455460alathrserglysergluthrproglythrsergluseralathrpro465470475480gluserglyproglythrserthrgluprosergluglyseralapro485490495glyserproalaglyserprothrserthrglugluglythrserglu500505510seralathrprogluserglyproglysergluproalathrsergly515520525sergluthrproglythrsergluseralathrprogluserglypro530535540glyserproalaglyserprothrserthrglugluglyserproala545550555560glyserprothrserthrglugluglythrserthrgluproserglu565570575glyseralaproglythrsergluseralathrprogluserglypro580585590glythrsergluseralathrprogluserglyproglythrserglu595600605seralathrprogluserglyproglysergluproalathrsergly610615620sergluthrproglysergluproalathrserglysergluthrpro625630635640glyserproalaglyserprothrserthrglugluglythrserthr645650655gluprosergluglyseralaproglythrserthrgluproserglu660665670glyseralaproglysergluproalathrserglysergluthrpro675680685glythrsergluseralathrprogluserglyproglythrserthr690695700gluprosergluglyseralapro705710<210>166<211>944<212>prt<213>人工序列<220><223>fix-fc-fc<400>166metglnargvalasnmetilemetalagluserproglyleuilethr151015ilecysleuleuglytyrleuleuseralaglucysthrvalpheleu202530asphisgluasnalaasnlysileleuasnargprolysargtyrasn354045serglylysleuglugluphevalglnglyasnleugluargglucys505560metgluglulyscysserphegluglualaarggluvalphegluasn65707580thrgluargthrthrgluphetrplysglntyrvalaspglyaspgln859095cysgluserasnprocysleuasnglyglysercyslysaspaspile100105110asnsertyrglucystrpcyspropheglyphegluglylysasncys115120125gluleuaspvalthrcysasnilelysasnglyargcysgluglnphe130135140cyslysasnseralaaspasnlysvalvalcyssercysthrglugly145150155160tyrargleualagluasnglnlyssercysgluproalavalprophe165170175procysglyargvalservalserglnthrserlysleuthrargala180185190gluthrvalpheproaspvalasptyrvalasnserthrglualaglu195200205thrileleuaspasnilethrglnserthrglnserpheasnaspphe210215220thrargvalvalglyglygluaspalalysproglyglnpheprotrp225230235240glnvalvalleuasnglylysvalaspalaphecysglyglyserile245250255valasnglulystrpilevalthralaalahiscysvalgluthrgly260265270vallysilethrvalvalalaglygluhisasnileglugluthrglu275280285histhrgluglnlysargasnvalileargileileprohishisasn290295300tyrasnalaalaileasnlystyrasnhisaspilealaleuleuglu305310315320leuaspgluproleuvalleuasnsertyrvalthrproilecysile325330335alaasplysglutyrthrasnilepheleulyspheglyserglytyr340345350valserglytrpglyargvalphehislysglyargseralaleuval355360365leuglntyrleuargvalproleuvalaspargalathrcysleuarg370375380serthrlysphethriletyrasnasnmetphecysalaglyphehis385390395400gluglyglyargaspsercysglnglyaspserglyglyprohisval405410415thrgluvalgluglythrserpheleuthrglyileilesertrpgly420425430gluglucysalametlysglylystyrglyiletyrthrlysvalser435440445argtyrvalasntrpilelysglulysthrlysleuthrasplysthr450455460histhrcysproprocysproalaprogluleuleuglyglyproser465470475480valpheleupheproprolysprolysaspthrleumetileserarg485490495thrprogluvalthrcysvalvalvalaspvalserhisgluasppro500505510gluvallyspheasntrptyrvalaspglyvalgluvalhisasnala515520525lysthrlysproargglugluglntyrasnserthrtyrargvalval530535540servalleuthrvalleuhisglnasptrpleuasnglylysglutyr545550555560lyscyslysvalserasnlysalaleuproalaproileglulysthr565570575ileserlysalalysglyglnproarggluproglnvaltyrthrleu580585590proproserargaspgluleuthrlysasnglnvalserleuthrcys595600605leuvallysglyphetyrproseraspilealavalglutrpgluser610615620asnglyglnprogluasnasntyrlysthrthrproprovalleuasp625630635640seraspglyserphepheleutyrserlysleuthrvalasplysser645650655argtrpglnglnglyasnvalphesercysservalmethisgluala660665670leuhisasnhistyrthrglnlysserleuserleuserproglylys675680685argargargargserglyglyglyglyserglyglyglyglysergly690695700glyglyglyserglyglyglyglyserargargargargasplysthr705710715720histhrcysproprocysproalaprogluleuleuglyglyproser725730735valpheleupheproprolysprolysaspthrleumetileserarg740745750thrprogluvalthrcysvalvalvalaspvalserhisgluasppro755760765gluvallyspheasntrptyrvalaspglyvalgluvalhisasnala770775780lysthrlysproargglugluglntyrasnserthrtyrargvalval785790795800servalleuthrvalleuhisglnasptrpleuasnglylysglutyr805810815lyscyslysvalserasnlysalaleuproalaproileglulysthr820825830ileserlysalalysglyglnproarggluproglnvaltyrthrleu835840845proproserargaspgluleuthrlysasnglnvalserleuthrcys850855860leuvallysglyphetyrproseraspilealavalglutrpgluser865870875880asnglyglnprogluasnasntyrlysthrthrproprovalleuasp885890895seraspglyserphepheleutyrserlysleuthrvalasplysser900905910argtrpglnglnglyasnvalphesercysservalmethisgluala915920925leuhisasnhistyrthrglnlysserleuserleuserproglylys930935940<210>167<211>383<212>dna<213>人工序列<220><223>细小病毒b19ky940273.1<400>167ccaaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggac60aattacgtcatttcctgtgacgtcatttcctgtgacgtcacttccggtgggcgggacttc120cggaattagggttggctctgggccagcttgcttggggttgccttgacactaagacaagcg180gcgcgccgcttgatcttagtggcacgtcaaccccaagcgctggcccagagccaaccctaa240ttccggaagtcccgcccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacg300taattgtccgccatcttgtaccggaagtcccgcctaccggcggcgaccggcggcatctga360tttggtgtcttcttttaaatttt383<210>168<211>248<212>dna<213>人工序列<220><223>细小病毒b19d135<400>168ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaatttt248<210>169<211>129<212>dna<213>人工序列<220><223>细小病毒v1aav2<400>169cggcgcgccgcttgatcttagtggcacgtcaaccagcgctggcccagagccaaccctaat60tccggaagtcctcagtccgccatcttgcccgcctaccggcggcgaccggcggcatcattt120ggtgttctt129<210>170<211>113<212>dna<213>人工序列<220><223>细小病毒v2<400>170ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagtgtcttcttttaaatttt113<210>171<211>340<212>dna<213>人工序列<220><223>细小病毒v3<400>171caaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggaca60attacgtcatttcctgtgacgtatttcctgtgacgtacttccggtggcgggacttccgga120attttggctctgggccagcttgcttggggttgccttgaccaagcgcgcgccgcttgatca180ccccaagcgctggcccagagccacctaaccggaagtccccccaccggaagtgacgtcaca240ggaaagacgtcacaggaagtaattgtccgccatcttgtaccggaagtcccgcaccggcgg300cgaccggcggcatctgatttggtgtcttcttttaaatttt340<210>172<211>444<212>dna<213>人工序列<220><223>细小病毒u25749.1<400>172ctcattggagggttcgttcgttcgaaccagccaatcaggggagggggaagtgacgcaagt60tccggtcacatgcttccggtgacgcacatccggtgacgtagttccggtcacgtgcttcct120gtcacgtgtttccggtcacgtgacttccggtcatgtgacttccggtgacgtgtttccggc180tgttaggttgaccacgcgcatgccgcgcggtcagcccaatagttaagccggaaacacgtc240accggaagtcacatgaccggaagtcacgtgaccggaaacacgtgacaggaagcacgtgac300cggaactacgtcaccggatgtgcgtcaccggaagcatgtgaccggaacttgcgtcacttc360cccctcccctgattggctggttcgaacgaacgaaccctccaatgagactcaaggacaaga420ggatattttgcgcgccaggaagtg444<210>173<211>282<212>dna<213>人工序列<220><223>细小病毒gpvaav2v1<400>173cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtg282<210>174<211>145<212>dna<213>人工序列<220><223>细小病毒gpvaav2v1<400>174ttgaccacgcgcatgccgcgcggtcagcccaatagttaagccgggtgaccacacgtgaca60ggaagcacgggatgtgcgtcaccggaagcagtgaccgggctggttcgaacgaacgaaccc120tccaactcaaggacaagaggatatt145<210>175<211>120<212>dna<213>人工序列<220><223>细小病毒gpvv2<400>175cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccgactcaaggacaagaggatattttgcgcgccaggaagtg120<210>176<211>102<212>dna<213>人工序列<220><223>细小病毒gpvv3<400>176gggaacaatcaggggaagtgaccggtgacgtcatgtaacttgcgtcacttcccgttcgaa60cgaacgaacgagactcaaggacaagaggcgcgccaggaagtg102<210>177<211>145<212>dna<213>人工序列<220><223>细小病毒aav2nc_001401.2<400>177ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120gccaactccatcactaggggttcct145<210>178<211>130<212>dna<213>人工序列<220><223>细小病毒gtx<400>178ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcct130<210>179<211>6762<212>dna<213>人工序列<220><223>b19-fviii构建体<400>179ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaattttgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaatacg300cgctctcttaaggtagccccgggacgcgtcaattgagatctggatccggtaccgaattcg360cggccgcctcgacgactagcgtttaattaaacgcgtgtctgtctgcacatttcgtagagc420gagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattc480tccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcaggga540tcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcac600acagatccacaagctcctgaggtaagtgccgtgtgtggttcccgcgggcctggcctcttt660acgggttatggcccttgcgtgccttgaattactgacactgacatccactttttctttttc720tccacagctagcgccaccatgcagattgagctgtccacttgtttcttcctgtgcctcctg780cgcttctgtttctccgccactcgccggtactaccttggagccgtggagctttcatgggac840tacatgcagagcgacctgggcgaactccccgtggatgccagattccccccccgcgtgcca900aagtccttcccctttaacacctccgtggtgtacaagaaaaccctctttgtcgagttcact960gaccacctgttcaacatcgccaagccgcgcccaccttggatgggcctcctgggaccgacc1020attcaagctgaagtgtacgacaccgtggtgatcaccctgaagaacatggcgtcccacccc1080gtgtccctgcatgcggtcggagtgtcctactggaaggcctccgaaggagctgagtacgac1140gaccagactagccagcgggaaaaggaggacgataaagtgttcccgggcggctcgcatact1200tacgtgtggcaagtcctgaaggaaaacggacctatggcatccgatcctctgtgcctgact1260tactcctacctttcccatgtggacctcgtgaaggacctgaacagcgggctgattggtgca1320cttctcgtgtgccgcgaaggttcgctcgctaaggaaaagacccagaccctccataagttc1380atccttttgttcgctgtgttcgatgaaggaaagtcatggcattccgaaactaagaactcg1440ctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaaaatgcatacagtcaac1500ggatacgtgaatcggtcactgcccgggctcatcggttgtcacagaaagtccgtgtactgg1560cacgtcatcggcatgggcactacgcctgaagtgcactccatcttcctggaagggcacacc1620ttcctcgtgcgcaaccaccgccaggcctctctggaaatctccccgattacctttctgacc1680gcccagactctgctcatggacctggggcagttccttctcttctgccacatctccagccat1740cagcacgacggaatggaggcctacgtgaaggtggactcatgcccggaagaacctcagttg1800cggatgaagaacaacgaggaggccgaggactatgacgacgatttgactgactccgagatg1860gacgtcgtgcggttcgatgacgacaacagccccagcttcatccagattcgcagcgtggcc1920aagaagcaccccaaaacctgggtgcactacatcgcggccgaggaagaagattgggactac1980gccccgttggtgctggcacccgatgaccggtcgtacaagtcccagtatctgaacaatggt2040ccgcagcggattggcagaaagtacaagaaagtgcggttcatggcgtacactgacgaaacg2100tttaagacccgggaggccattcaacatgagagcggcattctgggaccactgctgtacgga2160gaggtcggcgataccctgctcatcatcttcaaaaaccaggcctcccggccttacaacatc2220taccctcacggaatcaccgacgtgcggccactctactcgcggcgcctgccgaagggcgtc2280aagcacctgaaagacttccctatcctgccgggcgaaatcttcaagtataagtggaccgtc2340accgtggaggacgggcccaccaagagcgatcctaggtgtctgactcggtactactccagc2400ttcgtgaacatggaacgggacctggcatcgggactcattggaccgctgctgatctgctac2460aaagagtcggtggatcaacgcggcaaccagatcatgtccgacaagcgcaacgtgatcctg2520ttctccgtgtttgatgaaaacagatcctggtacctcactgaaaacatccagaggttcctc2580ccaaaccccgcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgcac2640tcgattaacggttacgtgttcgactcgctgcaactgagcgtgtgcctccatgaagtcgct2700tactggtacattctgtccatcggcgcccagactgacttcctgagcgtgttcttttccggt2760tacacctttaagcacaagatggtgtacgaagataccctgaccctgttccctttctccggc2820gaaacggtgttcatgtcgatggagaacccgggtctgtggattctgggatgccacaacagc2880gactttcggaaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaacacc2940ggagactactacgaggactcctacgaggatatctcagcctacctcctgtccaagaacaac3000gcgatcgagccgcgcagcttcagccagaacggcgcgccaacatcagagagcgccacccct3060gaaagtggtcccgggagcgagccagccacatctgggtcggaaacgccaggcacaagtgag3120tctgcaactcccgagtccggacctggctccgagcctgccactagcggctccgagactccg3180ggaacttccgagagcgctacaccagaaagcggacccggaaccagtaccgaacctagcgag3240ggctctgctccgggcagcccagccggctctcctacatccacggaggagggcacttccgaa3300tccgccaccccggagtcagggccaggatctgaacccgctacctcaggcagtgagacgcca3360ggaacgagcgagtccgctacaccggagagtgggccagggagccctgctggatctcctacg3420tccactgaggaagggtcaccagcgggctcgcccaccagcactgaagaaggtgcctcgagc3480ccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctccaatcggatcag3540gaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaagatttcgatatc3600tacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaactagacactacttt3660atcgccgcggtggaaagactgtgggactatggaatgtcatccagccctcacgtccttcgg3720aaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttccaggagttcacc3780gacggcagcttcacccagccgctgtaccggggagaactgaacgaacacctgggcctgctc3840ggtccctacatccgcgcggaagtggaggataacatcatggtgaccttccgtaaccaagca3900tccagaccttactccttctattcctccctgatctcatacgaggaggaccagcgccaaggc3960gccgagccccgcaagaacttcgtcaagcccaacgagactaagacctacttctggaaggtc4020caacaccatatggccccgaccaaggatgagtttgactgcaaggcctgggcctacttctcc4080gacgtggaccttgagaaggatgtccattccggcctgatcgggccgctgctcgtgtgtcac4140accaacaccctgaacccagcgcatggacgccaggtcaccgtccaggagtttgctctgttc4200ttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatggagcgaaactgt4260agagcgccctgcaatatccagatggaagatccgactttcaaggagaactatagattccac4320gccatcaacgggtacatcatggatactctgccggggctggtcatggcccaggatcagagg4380attcggtggtacttgctgtcaatgggatcgaacgaaaacattcactccattcacttctcc4440ggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctgtacaatctgtac4500cccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatctggagagtggag4560tgcctgatcggagagcacctccacgcggggatgtccaccctcttcctggtgtactcgaat4620aagtgccagaccccgctgggcatggcctcgggccacatcagagacttccagatcacagca4680agcggacaatacggccaatgggcgccgaagctggcccgcttgcactactccggatcgatc4740aacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctcctggcccctatg4800attatccacggaattaagacccagggcgccaggcagaagttctcctccctgtacatctcg4860caattcatcatcatgtacagcctggacgggaagaagtggcagacttacaggggaaactcc4920accggcaccctgatggtctttttcggcaacgtggattcctccggcattaagcacaacatc4980ttcaacccaccgatcatagccagatatattaggctccaccccactcactactcaatccgc5040tcaactcttcggatggaactcatggggtgcgacctgaactcctgctccatgccgttgggg5100atggaatcaaaggctattagcgacgcccagatcaccgcgagctcctacttcactaacatg5160ttcgccacctggagcccctccaaggccaggctgcacttgcagggacggtcaaatgcctgg5220cggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaaaagaccatgaaa5280gtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatgtatgtgaaggag5340ttcctgattagcagcagccaggacgggcaccagtggaccctgttcttccaaaacggaaag5400gtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaactccctggacccc5460ccactgctgacgcggtacttgaggattcatcctcagtcctgggtccatcagattgcattg5520cgaatggaagtcctgggctgcgaggcccaggacctgtactgaatcagcctgagctcgctg5580atcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatg5640ttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgctt5700cccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagg5760agttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaaccc5820ccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccc5880tccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctc5940ggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggc6000tgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcgg6060ccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgc6120gtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctgatca6180gcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttcc6240ttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcg6300cattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggg6360gaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgag6420gcggaaagaacgggctcgagaagcttctagatatcctctcttaaggtagcatcgagattt6480aaattagggataacagggtaatggcgcgggccgcaaaatttaaaagaagacaccaaatca6540gatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggacaattacgt6600catttcctgtgacgtcatttcctgtgacgtcacttccggtgggcgggacttccggaatta6660gggttggctctgggccagcgcttggggttgacgtgccactaagatcaagcggcgcgccgc6720ttgtcttagtgtcaaggcaaccccaagcaagctggcccagag6762<210>180<211>248<212>dna<213>人工序列<220><223>5'itr<400>180ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaatttt248<210>181<211>248<212>dna<213>人工序列<220><223>3'itr反向末端重复<400>181ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaatttt248<210>182<211>6830<212>dna<213>人工序列<220><223>gpv-fviii构建体<400>182cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtggcggcaattcagtcgata300actataacggtcctaaggtagcgatttaaatacgcgctctcttaaggtagccccgggacg360cgtcaattgagatctggatccggtaccgaattcgcggccgcctcgacgactagcgtttaa420ttaaacgcgtgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccct480aggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatc540agaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggg600gtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgaggtaag660tgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttg720aattactgacactgacatccactttttctttttctccacagctagcgccaccatgcagat780tgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgccactcgccg840gtactaccttggagccgtggagctttcatgggactacatgcagagcgacctgggcgaact900ccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaacacctccgt960ggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatcgccaagcc1020gcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtacgacaccgt1080ggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtcggagtgtc1140ctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgggaaaagga1200ggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctgaaggaaaa1260cggacctatggcatccgatcctctgtgcctgacttactcctacctttcccatgtggacct1320cgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaaggttcgct1380cgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtgttcgatga1440aggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggatgccgcctc1500agcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtcactgcccgg1560gctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggcactacgcc1620tgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccaccgccaggc1680ctctctggaaatctccccgattacctttctgaccgcccagactctgctcatggacctggg1740gcagttccttctcttctgccacatctccagccatcagcacgacggaatggaggcctacgt1800gaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgaggaggccga1860ggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgatgacgacaa1920cagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacctgggtgca1980ctacatcgcggccgaggaagaagattgggactacgccccgttggtgctggcacccgatga2040ccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcagaaagtacaa2100gaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggccattcaaca2160tgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctgctcatcat2220cttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcaccgacgtgcg2280gccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttccctatcct2340gccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggcccaccaagag2400cgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgggacctggc2460atcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaacgcggcaa2520ccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaaaacagatc2580ctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtgcaactgga2640ggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtgttcgactc2700gctgcaactgagcgtgtgcctccatgaagtcgcttactggtacattctgtccatcggcgc2760ccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaagatggtgta2820cgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcgatggagaa2880cccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcggaatgactgc2940cctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggactcctacga3000ggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagcttcagcca3060gaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagc3120cacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctgg3180ctccgagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccaga3240aagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccgg3300ctctcctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccagg3360atctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccgga3420gagtgggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcggg3480ctcgcccaccagcactgaagaaggtgcctcgagcccgcctgtgctgaagaggcaccagcg3540agaaattacccggaccaccctccaatcggatcaggaggaaatcgactacgacgacaccat3600ctcggtggaaatgaagaaggaagatttcgatatctacgacgaggacgaaaatcagtcccc3660tcgctcattccaaaagaaaactagacactactttatcgccgcggtggaaagactgtggga3720ctatggaatgtcatccagccctcacgtccttcggaaccgggcccagagcggatcggtgcc3780tcagttcaagaaagtggtgttccaggagttcaccgacggcagcttcacccagccgctgta3840ccggggagaactgaacgaacacctgggcctgctcggtccctacatccgcgcggaagtgga3900ggataacatcatggtgaccttccgtaaccaagcatccagaccttactccttctattcctc3960cctgatctcatacgaggaggaccagcgccaaggcgccgagccccgcaagaacttcgtcaa4020gcccaacgagactaagacctacttctggaaggtccaacaccatatggccccgaccaagga4080tgagtttgactgcaaggcctgggcctacttctccgacgtggaccttgagaaggatgtcca4140ttccggcctgatcgggccgctgctcgtgtgtcacaccaacaccctgaacccagcgcatgg4200acgccaggtcaccgtccaggagtttgctctgttcttcaccatttttgacgaaactaagtc4260ctggtacttcaccgagaatatggagcgaaactgtagagcgccctgcaatatccagatgga4320agatccgactttcaaggagaactatagattccacgccatcaacgggtacatcatggatac4380tctgccggggctggtcatggcccaggatcagaggattcggtggtacttgctgtcaatggg4440atcgaacgaaaacattcactccattcacttctccggtcacgtgttcactgtgcgcaagaa4500ggaggagtacaagatggcgctgtacaatctgtaccccggggtgttcgaaactgtggagat4560gctgccgtccaaggccggcatctggagagtggagtgcctgatcggagagcacctccacgc4620ggggatgtccaccctcttcctggtgtactcgaataagtgccagaccccgctgggcatggc4680ctcgggccacatcagagacttccagatcacagcaagcggacaatacggccaatgggcgcc4740gaagctggcccgcttgcactactccggatcgatcaacgcatggtccaccaaggaaccgtt4800ctcgtggattaaggtggacctcctggcccctatgattatccacggaattaagacccaggg4860cgccaggcagaagttctcctccctgtacatctcgcaattcatcatcatgtacagcctgga4920cgggaagaagtggcagacttacaggggaaactccaccggcaccctgatggtctttttcgg4980caacgtggattcctccggcattaagcacaacatcttcaacccaccgatcatagccagata5040tattaggctccaccccactcactactcaatccgctcaactcttcggatggaactcatggg5100gtgcgacctgaactcctgctccatgccgttggggatggaatcaaaggctattagcgacgc5160ccagatcaccgcgagctcctacttcactaacatgttcgccacctggagcccctccaaggc5220caggctgcacttgcagggacggtcaaatgcctggcggccgcaagtgaacaatccgaagga5280atggcttcaagtggatttccaaaagaccatgaaagtgaccggagtcaccacccagggagt5340gaagtcccttctgacctcgatgtatgtgaaggagttcctgattagcagcagccaggacgg5400gcaccagtggaccctgttcttccaaaacggaaaggtcaaggtgttccaggggaaccagga5460ctcgttcacacccgtggtgaactccctggaccccccactgctgacgcggtacttgaggat5520tcatcctcagtcctgggtccatcagattgcattgcgaatggaagtcctgggctgcgaggc5580ccaggacctgtactgaatcagcctgagctcgctgatcataatcaacctctggattacaaa5640atttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatac5700gctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctcc5760ttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgt5820ggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacc5880tgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatc5940gccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtg6000gtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggatt6060ctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcc6120cgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagt6180cggatctccctttgggccgcctccccgctgatcagcctcgactgtgccttctagttgcca6240gccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccac6300tgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctat6360tctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggca6420tgctggggatgcggtgggctctatggcttctgaggcggaaagaacgggctcgagaagctt6480ctagatatcctctcttaaggtagcatcgagatttaaattagggataacagggtaatggcg6540cgggccgccacttcctggcgcgcaaaatatcctcttgtccttgagtctcattggagggtt6600cgttcgttcgaaccagccaatcaggggagggggaagtgacgcaagttccggtcacatgct6660tccggtgacgcacatccggtgacgtagttccggtcacgtgcttcctgtcacgtgtttccg6720gtcacgtgacttccggtcatgtgacttccggtgacgtgtttccggcttaactattgggct6780gaccgcgcggcatgcgcgtggtcaacctaacagccggaaacacgtcaccg6830<210>183<211>282<212>dna<213>人工序列<220><223>5'itr<400>183cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtg282<210>184<211>282<212>dna<213>人工序列<220><223>3'itr反向末端重复<400>184cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtg282当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1