用于治疗血红蛋白病的球蛋白基因治疗的制作方法

文档序号:11285409阅读:268来源:国知局
相关申请的交叉引用本申请要求2014年9月4日提交的第62/045,997号美国临时申请的优先权,其全部内容引入本文以供参考。资助信息本发明是在美国国立心肺和血液研究所(nationalheart,lungandbloodinstitute)的基金号为hl053750的政府资助下进行的。政府对本发明享有一定的权利。本发明公开的主题提供表达盒和包含此类表达盒的载体(vector),所述表达盒表达球蛋白(globinprotein),例如人类β-球蛋白。本发明公开的主题还提供表达盒,其包含球蛋白基因或其功能部分可操作地连接到包含多个脱氧核糖核酸酶i超敏感位点的β-球蛋白基因座控制区(lcr)。本发明公开的主题的表达盒包含一个或多个抵消增强子元件的作用的绝缘子。本发明公开的绝缘子实质上没有不利地影响包含本发明公开的表达盒的载体的滴度。该表达盒和载体可以用于治疗血红蛋白病,例如,β-地中海贫血和镰状细胞性贫血。
背景技术
::β-地中海贫血和镰状细胞性贫血是由血红蛋白β链的产生缺陷造成的严重的先天性贫血。在β-地中海贫血中,β链欠缺导致过量的α-球蛋白链的细胞内沉淀,造成无效的红细胞生成和溶血性贫血(weatherall和clegg(1981)、stamatoyannopoulos等人(1994)、weatherall(2001)、steinberg(2001))。在纯合子或复合杂合子中发现的最严重的形式中,贫血在没有任何治疗的生命的最初几年内是致命的(cooley和lee(1925))。需要终身输血治疗来矫正贫血、阻止无效的红细胞生成和抑制胃肠道铁吸收(weatherall和clegg(1981)、stamatoyannopoulos等人(1994)、weatherall(2001)、steinberg(2001))。然而,输血治疗本身导致铁超负荷,如果未治疗,那么这是致命的。铁超负荷的预防和治疗是目前患者管理的主要目标(giardina(2001))。目前对于治愈(cure)β-地中海贫血唯一有疗效的治疗是通过同种异体骨髓移植(bmt)提供携带正常球蛋白基因的红细胞系前体(giardini和lucarelli(1994)、boulad等人(1998)、lucarelli等人(1999)、tisdale和sadelain(2001))。在镰状细胞性贫血中,血红蛋白β链在氨基酸位置6处突变(谷氨酸→缬氨酸),导致βs而不是正常βa链的合成(steinberg(2001)、pauling等人(1949))。所得的血红蛋白hbs造成加速的红血球(redcell)破坏、红细胞系增生和疼痛的血管闭塞性“危机”(steinberg(2001))。血管闭塞可损伤器官,最终造成长期残疾(例如,中风或骨坏死后),以及有时突然死亡。虽然是非常严重的病症,但镰状细胞病的病程通常是不可预测的(steinberg(2001))。通过增加胎儿血红蛋白的产生(swank和stamatoyannopoulos(1998))和阻止血细胞生成,羟基脲可以产生可量度的临床益处(platt等人(1984)、charache等人(1992)、atweh和loukopoulos(2001))。由于羟基脲是细胞毒素剂,所以非常需要替代的、毒性较小的药物来诱导γ-球蛋白基因表达(perrine等人(2005),stamatoyannopoulos(2005))。如对于β-地中海贫血一样,同种异体骨髓移植(bmt)目前是用于镰状细胞病的唯一有疗效的疗法(tisdale和sadelain(2001)、vermylen等人(1998),luzzatto和goodfellow(1989))。然而,由于对于大多数个体来说缺乏hla匹配的骨髓供体,所以bmt对大多数患有β-地中海贫血和镰状细胞病的患者来说不可作为治疗的选项。此外,尽管有潜在疗效,但同种异体bmt也有并发症。安全的移植需要确认组织相容性供体,以最小化移植排斥和移植物抗宿主病的风险(tisdale和sadelain(2001)、vermylen等人(1998)、luzzatto和goodfellow(1989))。由于与匹配无关或不匹配的移植相关联的风险更大,所以大多数患者必须勉强接受不矫正无效的红细胞生成并且加重全身铁累积的终生输血治疗。此外,尽管在过去的几十年中预期寿命有相当大的改善(borgna-pignatti等人(2004)、telfer等人(2009)、ladis等人(2011)),但长期以来仍然有由病毒感染、铁毒性和肝硬化引起的一些严重并发症的风险(mancuso等人(2006))。这些医疗风险,连同慢性β-地中海贫血的社会经济成本,强调了对安全、有效和有疗效的疗法的需要。治愈而不是治疗严重的β-地中海贫血的唯一手段是为患者提供健康的造血干细胞(hsc)。hsc通常产生所有血细胞类型,包括成人每天200亿个rbc。可以从具有野生型β-球蛋白基因的供体收获hsc以产生具有正常含量的血红蛋白的长寿命红细胞(rbc)。可选地,人们可以遗传矫正患者自身的hsc,这立即解决了对供体的搜索并消除了与同种异体bmt相关联的移植物抗宿主病和移植物排斥的风险(sadelain(1997)、sadelain等人(2007))。球蛋白基因转移意在恢复β-地中海贫血受试者自身的血液形成干细胞以产生具有足够的血红蛋白含量的rbc的能力(sadelain等人(2007)、persons和tisdale(2004)、sadelain(2006))。患有镰状细胞性贫血的患者的目标是防止镰状化(sickling),这可以通过用并入载体编码的球蛋白链的非镰状化hb稀释内源性hbs来实现。患者自身的hsc细胞必须进行遗传修饰以确保长期的治疗益处并实现有疗效的基于干细胞的疗法。用于治疗严重β-地中海贫血和镰状细胞性贫血的球蛋白基因转移的实施需要在hsc中有效引入调节型人类β-或β-样球蛋白基因。β-球蛋白基因(或β-样变体)必须以红细胞系特异性方式和高水平表达,特别是用于治疗输血依赖性β-0地中海贫血。迄今开发的球蛋白载体存在可限制或甚至妨碍它们在地中海贫血和镰状细胞患者中的安全使用的缺点。包含在载体中的一些β-球蛋白基因座控制区(lcr)组分,特别是脱氧核糖核酸酶i超敏感位点-2(hs2),可具有非红细胞系活性,使患者面临插入瘤形成的风险,如用非特异性表达载体所看到的。此外,使用大的lcr区段可能不利于产生高滴度载体和有效转导患者hsc。因此,需要新型球蛋白表达盒,其允许以红细胞系特异性和分化阶段特异性方式治疗性表达球蛋白基因(例如,人类β-球蛋白基因)且具有最小的插入瘤形成风险,并且能够进行高水平转导,从而在用于治疗地中海贫血和镰状细胞患者时改善其安全性。技术实现要素:本发明公开的主题通常提供增强子阻断绝缘子,并且某些绝缘子另外具有屏障绝缘子活性。本发明公开的主题还提供一种表达盒,其包含一个或多个绝缘子并且允许表达球蛋白基因(例如,人类β球蛋白基因)。还提供包含此类表达盒的载体、用此类表达盒或此类载体转导的细胞,以及此类表达盒用于治疗血红蛋白病(例如β-地中海贫血和镰状细胞性贫血)的用途。在某些非限制性实施方式中,本发明公开的主题提供包含seqidno:18所示的ctcf结合位点序列的绝缘子,例如但不限于包含seqidno:24或seqidno:25的绝缘子,比如具有seqidno:1(以及参见下文)所示的核苷酸序列的绝缘子。本发明公开的主题还提供表达盒,其包含至少一个包含seqidno:18所示的ctcf结合位点序列的绝缘子,例如但不限于包含seqidno:24或seqidno:25的绝缘子,比如具有seqidno:1所示的核苷酸序列的绝缘子。在非限制性实施方式中,表达盒包含至少一个包含seqidno:18所示的ctcf结合位点序列的绝缘子,例如但不限于包含seqidno:24或seqidno:25的绝缘子,比如具有seqidno:1所示的核苷酸序列的绝缘子,和球蛋白基因或其功能部分可操作地连接到β-球蛋白基因座控制区(lcr)。在某些实施方式中,β-球蛋白lcr不包含脱氧核糖核酸酶i超敏感位点-2(hs2)区。在某些实施方式中,β-球蛋白lcr区不包含hs2的核心序列。在一个非限制性实施方式中,hs2的核心序列具有seqidno:20所示的核苷酸序列。在一个非限制性实施方式中,hs2的核心序列具有seqidno:21所示的核苷酸序列。在某些实施方式中,β-球蛋白lcr不包含维持hs2的增强子活性的hs2区。在一个非限制性实施方式中,β-球蛋白lcr包含脱氧核糖核酸酶i超敏感位点-1(hs1)区、脱氧核糖核酸酶i超敏感位点-3(hs3)区和脱氧核糖核酸酶i超敏感位点-4(hs4)区。在某些实施方式中,hs3区位于hs1和hs4区之间。在某些实施方式中,hs1区的长度为约1.1kb。在一个非限制性实施方式中,hs1区的长度在约500bp和约1000bp之间。在一个非限制性实施方式中,hs1区具有seqidno:2所示的核苷酸序列。在某些实施方式中,hs1区的长度为约600bp。在一个非限制性实施方式中,hs1区的长度为602bp。在某些实施方式中,hs1区的长度在约500bp和约600bp之间。在一个非限制性实施方式中,hs1区具有seqidno:3所示的核苷酸序列。在某些实施方式中,hs1区的长度为约490bp。在一个非限制性实施方式中,hs1区的长度为489bp。在一个非限制性实施方式中,hs1区具有seqidno:4所示的核苷酸序列。在一个非限制性实施方式中,β-球蛋白lcr包含具有seqidno:2所示的核苷酸序列的hs1区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs2区。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:3所示的核苷酸序列的hs1区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:8所示的核苷酸序列的hs4区,并且β-球蛋白lcr不包含hs2区。在一个非限制性实施方式中,β-球蛋白lcr包含具有seqidno:4所示的核苷酸序列的hs1区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:8所示的核苷酸序列的hs4区,并且β-球蛋白lcr不包含hs2区。在某些实施方式中,β-球蛋白lcr区不包含hs1区并且/或者不包含hs2区,并且β-球蛋白lcr不包含hs2的核心序列。在某些实施方式中,β-球蛋白lcr不包含hs1的核心序列。在一个非限制性实施方式中,hs1的核心序列具有seqidno:22所示的核苷酸序列。在一个非限制性实施方式中,hs1的核心序列具有seqidno:23所示的核苷酸序列。在某些实施方式中,β-球蛋白lcr不包含维持hs1的功能的hs1区。在某些实施方式中,β-球蛋白lcr包含hs3区和hs4区,并且不包含hs1的核心序列。在某些实施方式中,hs3区位于球蛋白基因或其功能部分与hs4区之间。在某些实施方式中,hs3区的长度在约200bp和约1400bp之间,例如长度在约1300bp和约1400bp之间。在某些实施方式中,hs3区的长度为约1300bp。在一个非限制性实施方式中,hs3区的长度为1301bp。在一个非限制性实施方式中,hs3区具有seqidno:5所示的核苷酸序列。在某些实施方式中,hs4区的长度在约200bp和约1200bp之间,例如长度在约400bp和约1100bp之间。在某些实施方式中,hs4区的长度为约1.1kb。在一个非限制性实施方式中,hs4区的长度为1065bp。在一个非限制性实施方式中,hs4区具有seqidno:6所示的核苷酸序列。在一个非限制性实施方式中,hs4区具有seqidno:7所示的核苷酸序列。在某些实施方式中,hs4区的长度为约450bp。在某些实施方式中,hs4区的长度为446bp。在一个非限制性实施方式中,hs4区具有seqidno:8所示的核苷酸序列。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs1区或hs2区。可选地,β-球蛋白lcr区可包含hs2区、hs3区和hs4区。在某些实施方式中,hs2区的长度在约400bp和约1000bp之间,例如长度在约800bp和约900bp之间。在某些实施方式中,hs2区的长度为约860bp。在一个非限制性实施方式中,hs2区具有seqidno:9所示的核苷酸序列。在某些实施方式中,hs3区的长度为约1300bp。在一个非限制性实施方式中,hs3区的长度为1301bp。在一个非限制性实施方式中,hs3区具有seqidno:5所示的核苷酸序列。在某些实施方式中,hs4区的长度为约1.1kb。在一个非限制性实施方式中,hs4区的长度为1065bp。在一个非限制性实施方式中,hs4区具有seqidno:7所示的核苷酸序列。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:9所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:7所示的核苷酸序列的hs4区。另外,β-球蛋白lcr区还可包含hs1区。在某些实施方式中,球蛋白基因选自β-球蛋白基因、γ-球蛋白基因和δ-球蛋白基因。在一个非限制性实施方式中,球蛋白基因是人类β-球蛋白基因。在一个非限制性实施方式中,人类β-球蛋白基因选自野生型人类β-球蛋白基因、包含一个或多个内含子序列缺失的缺失人类β-球蛋白基因,和编码至少一个抗镰状化氨基酸残基的突变人类β-球蛋白基因。在一个非限制性实施方式中,人类β-球蛋白基因是在密码子87处编码苏氨酸至谷氨酰胺的突变的人类βa-球蛋白基因(βa-t87q)。在某些实施方式中,表达盒包含一个包含seqidno:18所示的ctcf结合位点序列的绝缘子,例如但不限于包含seqidno:24或seqidno:25的绝缘子,比如具有seqidno:1所示的核苷酸序列的绝缘子。在某些实施方式中,表达盒包含两个绝缘子,每个绝缘子包含seqidno:18所示的ctcf结合位点序列,例如但不限于,其中一个或两个绝缘子包含seqidno:24或seqidno:25并且/或者具有seqidno:1所示的核苷酸序列。在某些实施方式中,表达盒还包含β-球蛋白启动子。在某些实施方式中,β-球蛋白启动子位于球蛋白基因或其功能部分与β-球蛋白lcr区之间。在某些实施方式中,β-球蛋白启动子的长度在约200bp和约700bp之间。在一个非限制性实施方式中,β-球蛋白启动子是长度为约613bp的人类β-球蛋白启动子。在一个非限制性实施方式中,该人类β-球蛋白启动子具有seqidno:10所示的核苷酸序列。在另一个非限制性实施方式中,β-球蛋白启动子是长度为约265bp的人类β-球蛋白启动子。在一个非限制性实施方式中,该人类β-球蛋白启动子具有seqidno:11所示的核苷酸序列。在某些实施方式中,表达盒还包含人类β-球蛋白3’增强子。在某些实施方式中,人类β-球蛋白3’增强子位于球蛋白基因或其功能部分的上游。在某些实施方式中,β-球蛋白3’增强子的长度在约700bp和约900bp之间,例如长度在约800bp和约900bp之间。在一个非限制性实施方式中,人类β-球蛋白3’增强子的长度为约879bp。在一个非限制性实施方式中,人类β-球蛋白3’增强子具有seqidno:12所示的核苷酸序列。在某些实施方式中,表达盒还包含至少一个红细胞系特异性增强子。在某些实施方式中,至少一个红细胞系特异性增强子位于球蛋白基因或其功能部分与β-球蛋白lcr区之间。在某些实施方式中,至少一个红细胞系特异性增强子具有选自seqidno:13、seqidno:14、seqidno:15、seqidno:16和seqidno:17的核苷酸序列。在某些实施方式中,至少一个红细胞系特异性增强子的长度在约100bp和约200bp之间。在某些实施方式中,表达盒包含一个、两个或三个红细胞系特异性增强子。在某些实施方式中,表达盒允许球蛋白基因或其功能部分在哺乳动物中表达。在一个非限制性实施方式中,表达盒允许人类β-球蛋白基因表达。在某些实施方式中,球蛋白基因或其功能部分的表达限于红细胞系组织。本发明公开的主题还提供一种重组载体,其包含上述表达盒。在某些实施方式中,重组载体为逆转录病毒载体。在一个非限制性实施方式中,逆转录病毒载体为慢病毒载体。在某些实施方式中,包含在重组载体中的表达盒包含一个绝缘子。在某些实施方式中,重组载体在载体的3’长末端重复(ltr)中还包含土拨鼠肝炎后调节元件(woodchuckhepatitispost-regulatoryelement)(wpre)。在某些实施方式中,重组载体在载体的3’长末端重复(ltr)中还包含牛生长激素聚腺苷酸化信号。另外,本发明公开的主题提供一种非天然存在或工程化的核酸酶,其包含上述表达盒。在某些实施方式中,核酸酶选自非天然存在或工程化的锌指核酸酶(zfn)、非天然存在或工程化的大范围核酸酶和非天然存在或工程化的转录激活子样效应因子核酸酶(talen)。在某些实施方式中,核酸酶包含dna结合结构域和核酸酶切割结构域。在某些实施方式中,核酸酶结合到基因组安全港(safeharbor)位点。在某些实施方式中,核酸酶在基因组安全港位点处产生双链断裂(dsb)。在某些实施方式中,包含在核酸酶中的表达盒包含两个具有seqidno:1所示的核苷酸序列的绝缘子。在某些实施方式中,核酸酶允许靶向递送表达盒。本发明公开的主题还提供编码上述核酸酶的多核苷酸,以及包含多核苷酸的载体。在一个非限制性实施方式中,载体为慢病毒载体。此外,本发明公开的主题提供一种非天然存在或工程化的crispr-cas系统,其包含上述表达盒。在某些实施方式中,crispr-cas系统包含crispr-cas核酸酶和单导向rna。在某些实施方式中,crispr-cas系统结合到基因组安全港位点。在某些实施方式中,crispr-cas系统在基因组安全港位点处产生双链断裂(dsb)。在某些实施方式中,包含在crispr-cas系统中的表达盒包含两个具有seqidno:1所示的核苷酸序列的绝缘子。在某些实施方式中,crispr-cas系统允许靶向递送表达盒。本发明公开的主题还提供编码上述crispr-cas系统的多核苷酸,以及包含多核苷酸的载体。在一个非限制性实施方式中,载体为慢病毒载体。在一些实施方式中,基因组安全港位点是基因外基因组安全港位点。在某些实施方式中,基因组安全港位点位于染色体1上。在一些实施方式中,基因组安全港符合以下所有五个标准:(1)距任何基因的5’末端(例如,距基因的5’末端)至少50kb的距离,(ii)距任何癌症相关基因至少300kb的距离,(iii)在开放的/可接近的染色质结构内(通过用天然或工程化的核酸酶的dna切割来测量),(iv)位于基因转录单元之外,和(v)位于人类基因组的超保守区(ucr)、微小rna或长链非编码rna之外。另外,本发明公开的主题提供用上述表达盒转导的细胞、用上述重组载体转导的细胞、用上述核酸酶转导的细胞、用上述crispr-cas系统转导的细胞。另外,本发明公开的主题提供用上述载体转导的细胞。在某些实施方式中,细胞选自造血干细胞、胚胎干细胞、诱导的多能干细胞和生血内皮细胞。在一个非限制性实施方式中,造血干细胞为cd34+造血干细胞。在某些实施方式中,细胞离体(exvivo)转导。还提供一种药物组合物,其包含有效量的上述细胞和药学上可接受的载体。本发明公开的主题还提供一种用于治疗血红蛋白病的药物组合物,其包含有效量的上述细胞和药学上可接受的载体。此外,本发明公开的主题提供一种用于治疗血红蛋白病的试剂盒,其包含上述细胞。在某些实施方式中,试剂盒还包括用于使用细胞治疗患有血红蛋白病的受试者的书面说明书。另外,本发明公开的主题提供一种治疗受试者的血红蛋白病的方法,其包括向受试者施用有效量的上述细胞,从而恢复受试者产生含有正常血红蛋白的红细胞的能力。在某些实施方式中,在向受试者施用细胞后,在受试者中产生治疗相关水平的血红蛋白。在某些实施方式中,方法包括施用有效量的用上述重组载体转导的细胞。在一些实施方式中,在受试者中提供治疗相关水平的血红蛋白的细胞中的重组载体的载体拷贝数为每个细胞约0.5个至2个载体拷贝数。在某些实施方式中,方法矫正受试者中无效的红细胞生成。在某些实施方式中,方法对受试者不引起移植物抗宿主病的风险。在某些实施方式中,方法不包括施用免疫抑制剂。在某些实施方式中,细胞选自造血干细胞、胚胎干细胞、诱导的多能干细胞和生血内皮细胞。在一个非限制性实施方式中,受试者是人类。在某些实施方式中,细胞来自受试者。在一个非限制性实施方式中,细胞来自受试者的骨髓。根据本发明公开的主题,血红蛋白病选自血红蛋白c病、血红蛋白镰状细胞病(scd)、镰状细胞性贫血、遗传性贫血、地中海贫血、β-地中海贫血、重型地中海贫血、中间型地中海贫血、α-地中海贫血和血红蛋白h病。在一个非限制性实施方式中,血红蛋白病是β-地中海贫血。在另一个非限制性实施方式中,血红蛋白病是镰状细胞性贫血。附图说明通过示例给出但并不旨在将本发明限制为所描述的具体实施方式的以下详细描述可以结合附图来理解。图1描述根据本发明公开的主题的一个非限制性实施方式的包含表达盒的重组载体。图2描述根据本发明公开的主题的一个非限制性实施方式的包含表达盒的重组载体。图3描述根据本发明公开的主题的一个非限制性实施方式的包含表达盒的重组载体。图4描述根据本发明公开的主题的一个非限制性实施方式的包含表达盒的重组载体。图5a至图5c表示绝缘子a1的遗传毒性。(a)证明使用γ逆转录病毒载体遗传毒性测定。(b)注意到接受以绝缘的γ逆转录病毒载体转导的32d细胞的小鼠的存活增加。还注意到以chs4和以未绝缘的对照获得的结果。(c)示出绝缘子a1降低了遗传毒性的风险。图6表示治疗后8周和44周的地中海贫血hbbth3/+小鼠中的归一化β链表达。图7表示在非红细胞系k562细胞中增强子活性的评价。图8表示根据本发明公开的主题的某些实施方式的红细胞系特异性增强子。图9表示根据本发明公开的主题的某些实施方式的红细胞系特异性增强子。图10a至图10b描述包含本发明公开的表达盒的各种重组载体。图11表示包含本发明公开的表达盒的重组载体的滴度。图12表示包含本发明公开的表达盒的重组载体的滴度。具体实施方式本发明公开的主题通常提供一种表达盒,其允许表达球蛋白基因(例如,人类β-球蛋白基因)。在一个非限制性实例中,表达盒包含至少一个包含seqidno:18所示的ctcf结合位点序列的绝缘子,例如但不限于包含seqidno:24或seqidno:25的绝缘子,比如具有seqidno:1所示的核苷酸序列的绝缘子,和球蛋白基因或其功能部分可操作地连接到β-球蛋白基因座控制区(lcr)区。由本发明公开的表达盒诱导的球蛋白基因的表达是红细胞系特异性的、分化阶段特异性的、高水平的和持续的。本发明公开的主题还提供重组载体、非天然存在或工程化的核酸酶和包含此类表达盒的非天然存在或工程化的crispr-cas系统,以及用此类表达盒、重组载体、核酸酶和crispr-cas系统转导的细胞。本发明公开的表达盒和包含其的载体提供安全的基因转移疗法,因为用每个细胞的低载体拷贝数(例如0.5个至2个、1个至2个或甚至0.5个至1个)实现了治疗性转基因表达(例如产生了治疗相关水平的血红蛋白)。此外,本发明公开的主题提供使用此类转导的细胞用于治疗血红蛋白病(例如,β-地中海贫血和镰状细胞性贫血)的方法。i.定义除非另有定义,否则本文使用的所有技术和科学术语具有本领域的技术人员通常理解的含义。以下参考文献为本领域技术人员提供本发明中使用的许多术语的一般定义:singleton等人,微生物学和分子生物学词典(dictionaryofmicrobiologyandmolecularbiology)(第2版,1994);剑桥科学技术词典(thecambridgedictionaryofscienceandtechnology)(walker编,1988);遗传学词汇(theglossaryofgenetics),第5版,r.rieger等人(编),springerverlag(1991);和hale&marham,哈珀柯林斯生物学词典(theharpercollinsdictionaryofbiology)(1991)。如本文所用,以下术语具有下文对其所赋予的含义,除非另有说明。如本文所用,术语“表达盒”是指重组地或合成地产生的核酸构建体,其具有一系列容许特定核酸在靶细胞中的转录的指定核酸元件。表达盒可以并入到质粒、染色体、线粒体dna、质体dna、病毒或核酸区。表达盒部分可以包括待转录的基因和控制该基因的表达的元件(例如启动子)。如本文所用,术语“β-球蛋白基因座控制区(lcr)区”是指由一个或多个脱氧核糖核酸酶i超敏感位点(hs)区(包括hs1区、hs2区、hs3区和hs4区)组成的多核苷酸。已经公开了β-球蛋白基因的许多lcr的结构,例如人类(li等人,生物化学杂志(j.biol.chem.)(1985);260:14,901;li等人,美国国家科学院院刊(proc.natl.acad.sci.)(1990)87:8207);小鼠(shehee等人,分子生物学杂志(j.mol.biol.)(1989);205:41);兔(margot等人,分子生物学杂志(j.mol.biol.)(1989);205:15);和山羊(li,q.等人,基因组学(genomics)(1991);9:488),其各自并入本文以供参考。在某些实施方式中,β-球蛋白lcr区包含hs2区(例如,包含hs2区、hs3区和hs4区的β-球蛋白lcr区;以及包含hs1区、hs2区、hs3区和hs4区的β-球蛋白lcr区)。在某些实施方式中,β-球蛋白lcr区不包含hs2区(例如,包含hs1区、hs3区、hs4区的β-球蛋白lcr区)。在某些实施方式中,β-球蛋白lcr区不包含hs2区或hs1区(例如,包含hs3区和hs4区的β-球蛋白lcr区)。如本文所用,术语“重组”包括参照已经通过引入异源核酸而修饰的细胞或载体,或者参照从如此修饰的细胞中衍生的细胞。因此,例如,重组细胞表达在细胞的天然(非重组)形式中未以相同形式发现的基因,或者作为故意的人类干预的结果,表达以其他方式异常表达、低表达或完全不表达的天然基因,或者可以减少或消除天然基因的表达。如本文所用,术语“球蛋白”是指参与氧的结合和转运的含有血红素的蛋白家族。脊椎动物和无脊椎动物血红蛋白、脊椎动物和无脊椎动物肌红蛋白或其突变体的亚基包括在术语球蛋白中。如本文所用,术语“野生型”是指在自然界中发现的没有任何突变或修饰的正常基因、病毒或生物体。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是指任意长度的核苷酸——脱氧核糖核苷酸或核糖核苷酸或其类似物的聚合形式。多核苷酸可以具有任何三维结构,并且可以进行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因区的编码或非编码区、从连锁分析中定义的位点(基因座)、外显子、内含子、信使rna(mrna)、转移rna、核糖体rna、短干扰rna(sirna)、短发夹rna(shrna)、微小rna(mirna)、核酶、cdna、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针和引物。多核苷酸可以包含一个或多个修饰的核苷酸,比如甲基化的核苷酸和核苷酸类似物。在特定实施方式中,本发明公开的主题提供编码一种或多种球蛋白基因或其功能部分的多核苷酸。如果存在,可以在聚合物组装之前或之后赋予核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后进一步修饰,比如通过与标记组分缀合。。此类多核苷酸不需要与内源核酸序列100%相同,但通常将表现出实质上的同一性。与内源序列具有“实质上的同一性”的多核苷酸通常能够与双链核酸分子中的至少一条链杂交。所谓“杂交”是指在各种严格性条件下配对以在互补多核苷酸序列(例如,本文所述的基因)或其部分之间形成双链分子。(参见例如wahl,g.m.和s.l.berger(1987),酶学方法(methodsenzymol.),152:399;kimmel,a.r.,(1987),酶学方法(methodsenzymol.),152:507)。例如,严格性盐浓度通常小于约750mmnacl和75mm柠檬酸三钠,优选小于约500mmnacl和50mm柠檬酸三钠,并且更优选小于约250mmnacl和25mm柠檬酸三钠。低严格性杂交可以在不存在有机溶剂例如甲酰胺的情况下获得,而高严格性杂交可以在至少约35%甲酰胺、并且更优选至少约50%甲酰胺的存在下获得。严格性温度条件通常将包括至少约30℃、更优选至少约37℃、并且最优选至少约42℃的温度。可变附加参数,比如杂交时间、洗涤剂例如十二烷基硫酸钠(sds)的浓度、以及运载体dna的包含或排除,是本领域技术人员熟知的。根据需要通过组合这些各种条件来实现各种严格性水平。在优选的实施方式中,将在30℃下在750mmnacl、75mm柠檬酸三钠和1%sds中发生杂交。在更优选的实施方式中,将在37℃下在500mmnacl、50mm柠檬酸三钠、1%sds、35%甲酰胺和100μg/ml变性鲑鱼精dna(ssdna)中发生杂交。在最优选的实施方式中,将在42℃下在250mmnacl、25mm柠檬酸三钠、1%sds、50%甲酰胺和200μg/mlssdna中发生杂交。这些条件上的有用变化对于本领域技术人员将是显而易见的。对于大多数应用,杂交后的洗涤步骤也将在严格性上变化。洗涤严格性条件可以通过盐浓度和通过温度来定义。如上所述,可以通过降低盐浓度或通过升高温度来提高洗涤严格性。例如,洗涤步骤的严格性盐浓度将优选小于约30mmnacl和3mm柠檬酸三钠,并且最优选小于约15mmnacl和1.5mm柠檬酸三钠。洗涤步骤的严格性温度条件通常将包括至少约25℃、更优选至少约42℃、并且甚至更优选至少约68℃的温度。在优选的实施方式中,洗涤步骤将在25℃下在30mmnacl、3mm柠檬酸三钠和0.1%sds中发生。在更优选的实施方式中,洗涤步骤将在42℃下在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中发生。在更优选的实施方式中,洗涤步骤将在68℃下在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中发生。这些条件上的附加变化对于本领域技术人员将是显而易见的。杂交技术是本领域技术人员熟知的,并且描述于例如benton和davis(科学(science),196:180,1977);grunstein和rogness(美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),72:3961,1975);ausubel等人(《分子生物学现代方法》(currentprotocolsinmolecularbiology),威力出版公司,纽约(wileyinterscience,newyork),2001);berger和kimmel(《分子克隆技术指南》(guidetomolecularcloningtechniques),1987,学术出版社,纽约(academicpress,newyork));和sambrook等人,《分子克隆:实验室手册》(molecularcloning:alaboratorymanual),冷泉港实验室出版社,纽约(coldspringharborlaboratorypress,newyork)。如本文所用,术语“多肽”和“蛋白质”可互换使用,是指氨基酸残基的聚合物及其变体和合成类似物。因此,这些术语适用于氨基酸聚合物,其中一个或多个氨基酸残基是合成的非天然存在的氨基酸,比如对应的天然存在的氨基酸的化学类似物,以及适用于天然存在的氨基酸聚合物。本发明公开的主题的特定实施方式还包括多肽“变体”。多肽“变体”是指通过至少一个氨基酸残基的添加、缺失、截短和/或替换而区别于参考多肽并且保留生物活性的多肽。在某些实施方式中,多肽变体通过一个或多个替换而区别于参考多肽,该替换可以是保守的或非保守的,如本领域已知的。在某些实施方式中,变体多肽包括与参考多肽的对应序列的序列同一性或相似性为至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的氨基酸序列。在某些实施方式中,在参考多肽的c末端和/或n末端发生氨基酸添加或缺失。在某些实施方式中,氨基酸缺失包括约1个、约2个、约3个、约4个、约5个、约6个、约7个、约8个、约9个、约10个、约15个、约20个、约25个、约30个、约35个、约40个、约45个、50个、约55个、约60个、约65个、约70个、约75个、约80个、约85个、约90个、约95个、约100个、约105个、约110个、约115个、约120个、约125个、约130个、约135个、约140个、约145个、约150个、约155个、约160个、约165个、约170个或约175个或更多个氨基酸的c末端截短,包括所有氨基酸的中间数目,例如,25、26、27、29、30...100、101、102、103、104、105...170、171、172、173、174等。如上所述,本发明公开的主题的多肽可以以各种方式改变,包括氨基酸替换、缺失、截短和插入。用于此类操作的方法通常是本领域中已知的。例如,参考多肽的氨基酸序列变体可以通过dna中的突变来制备。诱变方法和核苷酸序列改变是本领域熟知的。参见例如kunkel(1985,美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),82:488-492);kunkel等人(1987,酶学方法(methodsinenzymol.),154:367-382);第4,873,192号美国专利;watson,j.d.等人,《基因分子生物学》(molecularbiologyofthegene),第四版,本杰明-卡明斯出版社(benjamin/cummings),加利福尼亚州门洛帕克(menlopark,calif),1987)和其中引用的参考文献。关于不影响目标蛋白质的生物活性的适当的氨基酸替换的导向可以在dayhoff等人的模型(1978),蛋白质序列和结构图谱(华盛顿的国家生物医学研究基金会)(atlasofproteinsequenceandstructure(natl.biomed.res.found.,washington,d.c.))中找到。如本文所用,术语“实质上相同”是指表现出与参考氨基酸序列(例如,本文所述的任一种氨基酸序列)或核酸序列(例如,本文所述的任一种核酸序列)至少50%同一性的多肽或多核苷酸。优选地,此类序列与用于比较的序列在氨基酸水平或核酸上的同一性为至少60%、更优选为80%或85%,并且更优选为90%、95%或甚至99%。序列同一性或同源性通常使用序列分析软件(例如,威斯康星大学生物技术中心,大学大街1710号,麦迪逊的遗传学计算机组的序列分析软件包(sequenceanalysissoftwarepackageofthegeneticscomputergroup,universityofwisconsinbiotechnologycenter,1710universityavenue,madison)wis.53705、blast、bestfit、gap或pileup/prettybox程序)来测量。此类软件通过指定与各种替换、缺失和/或其它修饰的同源性程度来匹配相同或相似的序列。在确定同一性或同源性程度的示例性方法中,可以使用blast程序,其中在e-3和e-100之间的概率得分指示密切相关的序列。两个序列之间的同一性百分比也可以用比如dnaman(lynnonbiosoft,3.2版本)的程序来测定。使用该程序,可以使用最佳比对算法(smith和waterman,1981)比对两个序列。在两个序列比对之后,可以通过将两个序列之间相同核苷酸的数目除以比对序列的长度减去所有间隙的长度来计算百分比同一性。描述多核苷酸取向的术语包括:5’(通常是具有游离磷酸基团的多核苷酸的端部)和3’(通常是具有游离羟基(oh)基团的多核苷酸的端部)。多核苷酸序列可以注释为5’至3’方向或3’至5’方向。如本文所用,“单导向rna”或“合成导向rna”是指包含导向序列、tracr序列和tracr配偶序列的多核苷酸序列。术语“导向序列”是指在导向rna内指定靶位点的约20bp序列,并且可以与术语“导向”或“间隔区”互换使用。术语“tracr配偶序列”也可以与术语“直接重复”互换使用。术语“非天然存在的”或“工程化的”可互换使用,并且指示人手的参与。当提及核酸分子或多肽时,该术语是指核酸分子或多肽至少实质上不含至少一种其它组分,在自然界核酸分子或多肽与该组分天然相关联并且如在自然界中所发现。如本文所用,术语“表达”是指通过其从dna模板转录多核苷酸(比如转录成mrna和其它rna转录物)的过程和/或通过其将转录的mrna随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸从基因组dna衍生,那么表达可包括mrna在真核细胞中的剪接。如本文所用,术语“治疗(treating或treatment)”是指尝试改变所治疗的个体或细胞的疾病过程的临床干预,并且可以用于预防而进行或在临床病理过程期间进行。治疗的治疗性效果包括但不限于预防疾病的发生或复发、缓解症状、消除疾病的任何直接或间接病理学后果、防止转移、降低疾病进展速率、改善或减轻疾情,以及消退或改善的预后。通过预防疾病或病症的进展,治疗可以防止由于受影响的或诊断的受试者或疑似患有该病症的受试者中的病症引起的恶化,而且治疗可以预防在有该病症或疑似患有该病症的风险的受试者中病症或病症的症状的发作。如本文所用,术语“受试者”是指任何动物(例如哺乳动物),包括但不限于人类、非人灵长类、啮齿动物等(例如,其将作为具体治疗的接受者,或从其中收获细胞)。如本文所用,术语“分离的细胞”是指与天然伴随细胞的分子和/或细胞组分分开的细胞。如本文所用,术语“分离的”是指不同程度地不含、实质上不含、或者基本上不含如在其天然状态下发现的通常与其伴随的组分的材料。“分离”表示与原始来源或环境的分开程度。如本文所用,术语“细胞群”是指至少两种表达相似或不同表型的细胞的组。在非限制性实例中,细胞群可以包括表达相似或不同表型的至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约103个细胞、至少约104个细胞、至少约105个细胞、至少约106个细胞、至少约107个细胞或至少约108个细胞。如本文所用,术语“切割”是指dna分子的共价骨架的断裂。切割可以通过多种方法引发,包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割都是可以的,并且双链切割可以作为两个截然不同的单链切割事件的结果发生。dna切割可导致产生平端或交错端部。在某些实施方式中,融合多肽用于靶向双链dna切割。如本文所用,术语“切割半结构域”是指与第二多肽(相同或不同)结合形成具有切割活性(优选双链切割活性)的复合物的多肽序列。术语“第一和第二切割半结构域”、“+和-切割半结构域”和“右侧和左侧切割半结构域”可互换使用,指二聚化的成对的切割半结构域。如本文所用,术语“染色体”是指包含细胞的所有或部分基因组的染色质复合物。细胞的基因组通常特征在于其染色体组型,其为包含细胞的基因组的所有染色体的集合。细胞的基因组可以包含一个或多个染色体。如本文所用,术语“基因”包括编码基因产物的dna区,以及调节基因产物的产生的所有dna区,无论此类调节序列是否与编码和/或转录序列相邻。因此,基因包括但不限于启动子序列、终止子、翻译调节序列比如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。术语“操作连接”和“可操作地连接”(或“可操作连接”)参考两种或多种组分(例如序列元件)的并置可互换使用,其中组分被排列成使得两种组分正常起作用并且允许组分中的至少一种可以介导发挥在其它组分中的至少一种上的功能的可能性。作为说明,如果转录调节序列响应于存在或不存在一个或多个转录调节因子而控制编码序列的转录水平,那么转录调节序列比如启动子可操作地连接到编码序列。转录调节序列通常可操作地与编码序列顺式连接,但不需要与其直接相邻。例如,增强子是可操作地连接到编码序列的转录调节序列,即使它们不连续。蛋白质、多肽或核酸的“功能区”或“功能部分”是其序列与全长蛋白质、多肽或核酸不相同,但保留与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能区可以具有与对应的天然分子更多、更少或相同数目的残基,并且/或者可以含有一个或多个氨基酸或核苷酸替换。用于测定核酸的功能(例如,编码功能、与另一种核酸杂交的能力)的方法在本领域中是公知的。类似地,用于测定蛋白质功能的方法是公知的。例如,多肽的dna结合功能可以例如通过过滤结合、电泳迁移率移位或免疫沉淀试验来测定。通过凝胶电泳可以测定dna切割。蛋白质与另一种蛋白质相互作用的能力可以通过例如遗传和生物化学的免疫共沉淀、双杂交试验或互补来测定。如本文所用,术语“启动子”是指rna聚合酶结合到的多核苷酸(dna或rna)的识别位点。术语“增强子”是指包含能够提供增强转录的序列的dna片段,并且在一些情况下可以相对于另一控制序列独立于其取向而起作用。增强子可以与启动子和/或其它增强子元件协同或附加地起作用。如本文所用,术语“载体”是指任何遗传元件,比如质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒粒子等,其当与适当的控制元件相关联时能够复制,并且其可以将基因序列转移到细胞中。因此,该术语包括克隆和表达载体,以及病毒载体和质粒载体。如本文所用,术语“调整”是指正或负变更。示例性调整包括约1%、约2%、约5%、约10%、约25%、约50%、约75%或约100%的改变。如本文所用,术语“增加”是指按至少约5%正变更,包括但不限于,按约5%、约10%、约25%、约30%、约50%、约75%或约100%正变更。如本文所用,术语“减少”是指按至少约5%负变更,包括但不限于,按约5%、约10%、约25%、约30%、约50%、约75%或约100%负变更。如本文所用,术语“约”或“大约”意指在如由本领域的普通技术人员测定的特定值的可接受的误差范围内,其将部分取决于如何测量或测定该值,即测量系统的局限性。例如,根据本领域的实践,“约”可以意指在3或多于3标准偏差之内。可选地,“约”可以意指给定值的至多20%,优选至多10%,更优选至多5%,并且还更优选至多1%的范围。可选地,特别是关于生物系统或过程,该术语可以意指在数值的数量级内,优选在5倍内,并且更优选在2倍内。ii.绝缘子在临床背景中已经报道了与载体编码的增强子激活细胞癌基因相关联的几种载体相关的恶性转化(baum等人(2006)、nienhuis等人(2006)、ramezani等人(2006)),并且已经进行或提出了各种载体修饰以减少载体遗传毒性(baum等人(2006)、nienhuis等人(2006),ramezani等人(2006))。已知为染色质绝缘子的一类dna元件已被认为是一种改善载体安全和性能的方法(emery(2011))。绝缘子是天然存在的dna元件,其有助于相邻染色质结构域之间的功能界限。绝缘子与修饰染色质并改变局部基因表达的蛋白质结合。绝缘子在本文所述的载体中的放置提供各种潜在的益处,包括但不限于:1)从由侧边染色体表达的位置效应杂色中屏蔽载体(即屏障活性,这可降低位置效应和载体沉默);和2)从由载体(增强子阻断)插入反式激活的内源基因表达中屏蔽侧边染色体。存在两种基本类型的染色质绝缘子:(a)屏障绝缘子,其阻断沉默异染色质侵入转录容许的开放染色质的相邻区域,和(b)增强子阻断绝缘子,其防止增强子介导的相邻区域的转录激活。介导这些活性的序列在物理上是分开的并且机制上是截然不同的(recillas-targa等人(2002))。染色质绝缘子自身不表现出固有的转录增强或抑制活性。因此,它们为减少基因转移载体和靶细胞基因组之间的相互作用制备了理想元件。绝缘子可以帮助保留嵌入在基因组或遗传背景中的基因或转录单元的独立功能,其中其表达可另外受基因组或遗传背景中调节信号的影响(参见例如burgess-beusse等人(2002),美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),99:16433;和zhan等人(2001),人类遗传学(hum.genet.)109:471)。通过病毒载体的插入诱变产生的问题是众所周知的(nienhuis(2013)、baum等人(2006),nienhuis等人(2006)),因为通过使用染色质绝缘子可以降低遗传毒性的风险(arumugam等人(2007)、emery(2011)、evans-galea等人(2007)、rivella等人(2000)、emery等人(2000)、emery等人(2002)、yannaki等人(2002)、hino等人(2004)、ramezani等人(2003)、ramezani等人(2008))。本发明公开的主题提供新型的绝缘子,其是强大的增强子阻断绝缘子,并且某些绝缘子另外具有屏障绝缘子活性。在脊椎动物中,增强子阻断绝缘子的功能是通过锌指dma结合因子ctcf介导的(gaszner和felsenfeld(2006)、wallace和felsenfeld(2007))。通常,认为这些元件通过物理环结构起作用,该物理环结构通过ctcf介导的相邻绝缘子元件之间的相互作用或通过ctcf介导的染色质纤维在细胞核内束连(tether)成结构元件而建立。首先表征的脊椎动物染色质绝缘子位于鸡β-球蛋白基因座控制区内。含有脱氧核糖核酸酶i超敏感位点-4(chs4)的该元件看起来构成了鸡β-球蛋白基因座的5’边界(prioleau等人(1999),欧洲分子生物学组织期刊(emboj.),18:4035-4048)。含有chs4元件的1.2-kb区域显示经典的绝缘子活性,包括阻断球蛋白基因启动子和增强子在细胞系中相互作用的能力(chung等人(1993),细胞(cell),74:505-514)和保护果蝇(同上)、转化的细胞系(pikaart等人(1998),基因开发(genesdev.),12:2852-2862),以及转基因哺乳动物(wang等人(1997),自然生物技术(nat.biotechnol.),15:239-243;taboit-dameron等人(1999),转基因研究(transgenicres.),8:223-235)中的表达盒免受位置效应的能力。大部分该活性包含在250-bp区域中。在该片段内是一个49-bp的chs4元件(chung等人(1997),美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),94:575-580),其与增强子阻断试验中密切相关的锌指dna结合蛋白ctcf相互作用(bell等人(1999),细胞(cell),98:387-396)。绝缘子(比如chs4)当放置在增强子和启动子之间时可以阻断增强子和启动子之间的相互作用(evans-galea等人(2007)、chung等人(1997)、bell等人(1999)、ryu等人(2007)、ryu等人(2008))。几项研究已经证明了chs4绝缘子减少γ逆转录病毒载体(evans-galea等人(2007)、rivella等人(2000)、emery等人(2000)、emery等人(2002)、yannaki等人(2002)、hino等人(2004)、ramezani等人(2006)、yao等人(2003)、nishino等人(2006)、aker等人(2007),li和emery(2008))和慢病毒载体(bank等人(2005)、arumugam等人(2007)、puthenveetil等人(2004)、evans-galea等人(2007)、ramezani等人(2003)、aker等人(2007)、ma等人(2003)、chang等人(2005)、pluta等人(2005))的位置效应沉默的能力。这些适当设计的研究证明,包含1.2kb型式的chs4绝缘子增加了至少一些背景中的载体转移基因表达的可能性和/或一致性(arumugam等人(2007)、emery(2011)、evans-galea等人(2007)、emery等人(2002)、yannaki等人(2002)、hino等人(2004)、ramezani等人(2006)、aker等人(2007)、li和emery(2008)、pluta等人(2005)、jakobsson等人(2004))。然而,由chs4绝缘子提供的保护程度远远没有完成。此外,包含1.2kb的chs4可不利地影响载体滴度,而最小的chs4核心已被证明无效(aker等人(2007)、jakobsson等人(2004))。相反,本发明公开的主题的绝缘子没有不利地影响病毒载体的滴度,并且比chs4绝缘子更强大和有效。本发明公开的绝缘子通过基因组方法来鉴定,例如,使用基因组方法来鉴定为人类基因组的强大的增强子阻断物的绝缘子以及屏障绝缘子。本发明公开的绝缘子增强了基因疗法的安全性(例如,干细胞基因疗法、球蛋白基因疗法)。对于血红蛋白病的基因疗法,需要强大的增强子以达到球蛋白基因表达的治疗性水平。因此,强大的绝缘子表示一种从整合型载体的强大的增强子中保护基因组环境的手段。本发明公开的绝缘子具有强大的增强子阻断活性。例如但不作为限制,本公开的绝缘子可以将增强子元件的活性降低至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在某些实施方式中,绝缘子除了增强子阻断活性之外还具有屏障活性。本发明公开的绝缘子充分降低了与病毒载体相关联的插入诱变和遗传毒性的风险。此外,当将本发明公开的绝缘子并入到载体中时,绝缘子没有不利地影响载体的载体滴度。在某些实施方式中,绝缘子(例如,绝缘子a1)增加球蛋白基因或其功能部分的体内表达。在某些实施方式中,绝缘子包含转录阻抑物ctcf结合位点,其具有在以下提供的seqidno:18所示的核苷酸序列:caccaggtggcgct[seqidno:18]。在一个非限制性实施方式中,绝缘子具有在以下提供的seqidno:1所示的核苷酸序列,或者与seqidno:1至少约95%同源或至少约98%相同(同源)的序列。具有seqidno:1所示的核苷酸序列的绝缘子称为绝缘子a1。tccttcctttctaaatgacgagagagacagaagaattcttcaaggttagtgtgtccagcatgcaacctttccttcctggatgagcatccctggagtaggagagccagcctgcctcctgcgctggcacagagcccggttccctagacaactgcctctccaaatctgatgtccagcgccacctggtgtccacatcaagcagacacaattaatagtcaacctgttcaggaaaactgtgagggggaaaaaaaagaaagaggatttatgaagggaaaagaaagtttagaggatatgccacgattggctag[seqidno:1]在某些实施方式中,绝缘子包含如seqidno:24所示的核苷酸序列,或者与seqidno:24至少约95%相同或至少约98%相同的序列。在某些实施方式中,绝缘子包含如seqidno:25(其是seqidno:1的反向互补)所示的核苷酸序列,或者与seqidno:25至少约95%相同或至少约98%相同的序列。ctagccaatcgtggcatatcctctaaactttcttttcccttcataaatcctctttcttttttttccccctcacagttttcctgaacaggttgactattaattgtgtctgcttgatgtggacaccaggtggcgctggacatcagatttggagaggcagttgtctagggaaccgggctctgtgccagcgcaggaggcaggctggctctcctactccagggatgctcatccaggaaggaaaggttgcatgctggacacactaaccttgaagaattcttctgtctctctcgtcatttagaaaggaagga[seqidno:25]在某些实施方式中,绝缘子包含如染色体1的hg18座标76229933至76230115所示的核苷酸序列。在某些实施方式中,绝缘子包含智人染色体1克隆rp11-550h2(基因库(genebank)登录号ac092813.2)的残基68041和68160之间,或残基与68041和68210之间,或残基68041和68280之间,或残基68005和68305之间的核苷酸序列,或者与其至少95%或98%相同的序列。iii.表达盒本发明公开的主题提供包含一个或多个以上公开的绝缘子(例如,绝缘子a1)的表达盒。在某些实施方式中,表达盒包含至少一个具有seqidno:1所示的核苷酸序列的绝缘子以及球蛋白基因或其功能部分与β-球蛋白lcr区可操作连接。β-球蛋白lcr区人类β-球蛋白基因簇由嵌入在许多嗅觉受体基因阵列中的一个内的五个基因组成(bulger等人,美国国家科学院院刊(pnas),(1999);96:5129-5134))。该簇在染色体11p15.4上跨越80kb,并且包括在个体发育期间指引其阶段特异性表达的五个表达的β-样基因和顺式作用调节元件(forget(2001),β地中海贫血的分子机制(molecularmechanismofbetathalassemia)。steinbergmh等人编,《血红蛋白的病症:遗传学、病理生理学和临床管理》(disordersofhemoglobin.genetics,pathophysiologyandclinicalmanagement),剑桥大学出版社,剑桥(cambridgeuniversitypress,cambridge))。基因以其发育表达的顺序5’-ε-gγ-aγ-ψη-δ-β-3’排列(stamatoyannopoulos等人(2001),血红蛋白转换(hemoglobinswitching)。在:stamatoyannopoulosg等人编,《血液病症的分子基础》(molecularbasisofblooddisorders)中,桑德斯出版社,宾夕法尼亚州费城(w.b.saunders,philadelphia,pa))。α-样球蛋白基因簇(5’-ξ2-ψξ1-ψα2-ψα1-α2-αl-θ-3’)位于非常接近染色体16的短臂的端粒,并且跨度约40kb。在这两个独立的簇中编码的基因的表达限于红细胞系细胞且平衡,使得β-球蛋白样链的输出匹配α链的输出。该微调平衡在转录、转录后和翻译后水平进行调节。发育阶段特异性表达由许多近端或远端的顺式作用元件和与它们结合的转录因子控制。在β-球蛋白基因(hbb)的情况下,近端调节元件包括β-球蛋白启动子和两个下游增强子,一个位于β-球蛋白的第二个内含子中,且另一个位于基因的下游大约800bp(antoniou等人,欧洲分子生物学组织期刊(emboj.),(1988),7:377-384;trudel等人,基因开发(genesdev.),(1987),1:954-961;trudel等人,分子细胞生物学(mol.cell.biol.)(1987),7:4024-4029)。最突出的远端调节元件是β-球蛋白lcr,其位于hbb上游50kb至60kb,并且由几个对红细胞系细胞中的脱氧核糖核酸酶i具有增高的敏感性的亚区组成(forget(2001);grosveld等人,细胞(cell)(1987),51:975-985;talbot等人,自然(nature)(1989),338:352)。lcr的最突出的性质是其强的转录增强活性。在染色体11上的人类β-球蛋白区的示例性核苷酸序列在以下提供的seqidno:19(基因库登录号ng_000007.3)中示出:ggatcctcacatgagttcagtatataattgtaacagaataaaaaatcaattatgtattcaagttgctagtgtcttaagaggttcacatttttatctaactgattatcacaaaaatacttcgagttacttttcattataattcctgactacacatgaagagactgacacgtaggtgccttacttaggtaggttaagtaatttatccaaaaccacacaatgtagaacctaagctgattcggccatagaaacacaatatgtggtataaatgagacagagggatttctctccttcctatgctgtcagatgaatactgagatagaatatttagttcatctatcacacattaaacgggactttacatttctgtctgttgaagatttgggtgtggggataactcaaggtatcatatccaagggatggatgaaggcaggtgactctaacagaaagggaaaggatgttggcaaggctatgttcatgaaagtatatgtaaaatccacattaagcttctttctgcatgcattggcaatgtttatgaataatgtgtatgtaaaagtgtgctgtatattcaaaagtgtttcatgtgcctaggggtgtcaaatactttgagtttgtaagtatatacttctctgtaatgtgtctgaatatctctatttacttgattctcaataagtaggtatcatagtgaacatctgacaaatgtttgaggaacaatttagtgtttacctattcaccaaaatttattaaatgcctaatctgtatcagatatacaattatctggcgaaatctgtaattcctaatttaaacagctgtgtagcctaattagggataaaggcatgcaaacccataatttgtgtaggttgaaatgagctatagaaaaatgcagtatatttatcagaagtctttagggtcatgaaaaggaatggtcaactgacactgccagggactcatatgtaagagataactaatgtgaagtgactttaaaggagaaattagcagaagttttctttccatgtctcctcatcatgttacaataacggaagagattaaaacaacaaatacatttagacagcaatgtttatcctggttagatgttttaatctaaatctatcttggagtgttaaaatgcatttgctcacctactttaaaatataaatgaaggtaggaacctgtagatacaaaaagttggagaaaaaaagacaataaagatgacaaaaatctattaatccttgatagaaaatgagaagagataaaacactggtttacataaagaaaataagatggatagatagcagatccttataaaagtgataatttgagaaaaaaaatactccatattctgagtttcttcacataaaataatacaaatctgctgtggtaagttacaaagagatagattttttatcattatataaaagatattttaaacagagttatacaacaaaggaacagactatgtcatatattctcacttatcactataaacatctcagaaaaatctgcaaaatcatttcatagcattttaaatagttaggaataatgtagaaaactgaaacagttctaagtttcccacaaacttagagtctcaaatgttgcattacctaacttacctgcaaatattttatacaaatttgcacatgctactctagtcaaaaatatatgtacattatgggtattttctgtgtgtaacttggttctagttgcttctttcagaaatagcctctatttttgatttacctgataaaatcacattcctctccaaagccttctaaatacttccagactaactactttttagtacatctaagaagaaaagagttttgtctcttatccacctctgagtcaaaaagcagcatgtccatcaattggtacatagttcccacagccccacttagctctggattggagttctacttggcattgtttgcaactacatggacgtaaaatgcatggattctcttgaaaaaatgtttctgccatgatgttctctgaaagagactaaccttccctcgctttgcagagaaagactcgtgtaatccttgacaatgtcatctcatctatttattcccatgtctacccatatgtgaccttcatgtctttgctctaagcccctacatcctcaatctacacactaggatagtataaaagtaatagtaataatagtagtaatagtaataacaatacaatgattatggcttatactatacacaagacactgttgatatattatttcatttagtattcacagtaactctgtgcctcaagtactattgtaataccctttaagaggaggaaactgaggcacagggccctaaagtaatattccaagatgaagtggctactaactgacagagggcataattcaactcatgatatttggctctagaatacatgctctgaatcattatacaataataattcatgaggaaacattttttaaagcctaagttatttgctctgaaataagacataatttggggtgagaaagcttagattccatgaagtattacagcatttggtagtctttttgcactccaggtcttatttttactgcttaaacataataaaacatatggttcagtatgcctttgattttacaataatattcctgttatttttggaagcacagggtgtgggataatgctaattactagtgattagtattgagaggtgacagcgtgctggcagtcctcacagccctcgctcgctcttggcgcctcctctgcctgggctcccacattggtggcacttgaggagcccttcagccggccgctgcactgtgggagcccttttctgggctggccaaggccagagccggctccctcagcttgccaggaggtgtggagggacagacgcgggcaggaaccgggctgtgcgccgtgcttgagggagttccgggtgggcatgggctccgaggaccccgcactcggagccgccagccggccccaccggccgcgggcagtgaggggcttagcacctgggccagcagctgctgtgctcaattcctcgccgggccttagctgccttcctgcggggcagggctcgggacctgcagcgcgccatgcctgagcctccccaccttcatgggctcctgtgcggcccgagcctcgccgacgagcgccgccccctgctccagggcacccagtcccatcgaccacccaagggctgaagagtgcgggcgcacggcaggggactggcaggcagctccccctgcagcccaggtgcgggatccactgggtgaagccggctaggctcctgagtttgctggggatgcgaagaacccttatgtctagataagggattgtaaatacaccaattggcactctgtatctagctcaaggtttgtaaacacaccaatcagcaccctgtgtctagctcagggtttgtgaatgcaccaatcaacactctatctagctactctggtggggccttggagaacctttatgtctagctcagggattgtaaatacaccaatcggcagtctgtatctagctcaaggtttgtaaacacaccaatcagcaccctgtgtctagctcagggtttgtgaatgcaccaatcaacactctgtatctagctactctggtggggacgtggagaacctttatgtctagctcagggattgtaaatacaccactcggcagtctgtatctagctcaaggtttgtaaacacaccaatcagcaccctgtgtctagctcagggtttgtgaatgcaccaatcaacactctgtatctagctactctggtggggacttggagaacctttgtgtggacactctgtatctagctaatctggtggggacgtggagaacctttgtgtctagctcatggattgtaaatgcaccaatcagtgccctgtcaaaacagaccactgggctctaccaatcagcaggatgtgggtggggccagataagagaataaaagcaggctgcccgagccagcagtggcaacccgctcgggtccccttccacactgtggaagctttgttctttcgctctttgcaataaatcttgctgctgctcactgtttgggtctacactgcctttatgagctgtaacgctcaccgcgaaggtctgcagcttcactcttgaagccagcgagaccacgaacccaccgggaggaacgaacaactccagaggcgccgccttaagagctggaacgttcactgtgaaggtctgcagcttcactcctgagccagcgagaccacgaacccatcagaaggaagaaactccgaacacatccaaacatcagaacgaacaaactccacacacgcagcctttaagaactgtaacactcaccacgagggtccccggcttcattcttgaagtcagtgaaaccaagaacccaccaattccggacacagtatgtcagaaacaatatgagtcactaaatcaatatacttctcaacaatttccaacagcccttgcaattaacttggccatgtgactggttgtgactaaaataatgtggagataataatgtgttactccctaaggcagagtgcccttctatcattctctttcccttcctctatgtggcagaaagtaaaagattctgaaatgataaagtcaatcacaggaaggcacctggactcctggcccactgcttggaggagagcactcaggaccatgaacatctgactgtgacgtagcaataaagaaacccacgtttcatatgaaactgcttaaaattaatggcacaagtcatgtttttgatgttgcacatttgtctttatttgtggcttgttttgcttccacatcaatccactcaaggcctacattctgctataatgcaatttcaagttctttacaggccgagaaaaatgaatctgaattcctgacctccaaaagtgatcaagatatttttagttcaggctccaaaattttctcattttcataggttttcctcgattgatcattattcatgatttgcaaggaatcattcaatgttttctaaatctattactgcatcctgacacatatgacattttaactatgttccagatttttgaatgaagagtgtaaattttaaatgttttcaccacaaaaaataagtatgtgaagtggtggatttgttaattagccttatttaaccatttaatattgtacacgtacaccaaagcatcatgttgtaccccatgaatacacacaattattatttgtcaatttaaaatgaaataataaaaaataacaaaggcattagcctctgcattgcctttaccggtcatcctcacggtgactaacgcaaaaaacgttctatttcatccttacaaacatccctatctttgatgcctctttgtctagatctctatcccctcctgttttctctacgttatttatatgggtatcatcaccatcctggacaacatcaggacagatatccctcaccaagccaatgttcctctctatgttggctcaaatgtccttgaactttcctttcaccaccctttccacagtcaaaaggatattgtagtttaatgcctcagagttcagcttttaagcttctgacaaattattcttcctctttaggttctcctttatggaatcttctgtactgatggccatgtcctttaactactatgtagatatctgctactacctgtattatgcctctacctttattagcagagttatctgtactgttggcatgacaatcatttgttaatatgacttgcctttcctttttctgctattcttgatcaaatggctcctctttcttgctcctctcatttctcctgccttcacttggacgtgcttcacgtagtctgtgcttatgactggattaaaaattgatatggacttatcctaatgttgttcgtcataatatgggttttatggtccattattatttcctatgcattgatctggagaaggcttcaatccttttactctttgtggaaaatatctgtaaaccttctggttcactctgctatagcaatttcagtttaggctagtaagcatgaggatgcctccttctctgatttttcccacagtctgttggtcacagaataacctgagtgattactgatgaaagagtgagaatgttattgatagtcacaatgacaaaaaacaaacaactacagtcaaaatgtttctctttttattagtggattatatttcctgacctatatctggcaggactctttagagaggtagctgaagctgctgttatgaccactagagggaagaagatacctgtggagctaatggtccaagatggtggagccccaagcaaggaagttgttaaggagcccttttgattgaaggtgggtgcccccaccttacagggacaggacatctggatactcctcccagtttctccagtttccctttttcctaatatatctcctgataaaatgtctatactcacttccccatttctaataataaagcaaaggctagttagtaagacatcaccttgcattttgaaaatgccatagactttcaaaattatttcatacatcggtctttctttatttcaagagtccagaaatggcaacattacctttgattcaatgtaatggaaagagctctttcaagagacagagaaaagaataatttaatttctttccccacacctccttccctgtctcttaccctatcttccttccttctaccctccccatttctctctctcatttctcagaagtatattttgaaaggattcatagcagacagctaaggctggttttttctaagtgaagaagtgatattgagaaggtagggttgcatgagccctttcagttttttagtttatatacatctgtattgttagaatgttttataatataaataaaattatttctcagttatatactagctatgtaacctgtggatatttccttaagtattacaagctatacttaactcacttggaaaactcaaataaatacctgcttcatagttattaataaggattaagtgagataatgcccataagattcctattaataacagataaatacatacacacacacacacattgaaaggattcttactttgtgctaggaactataataagttcattgatgcattatatcattaagttctaatttcaacactagaaggcaggtattatctaaatttcatactggatacctccaaactcataaagataattaaattgccttttgtcatatatttattcaaaagggtaaactcaaactatggcttgtctaattttatatatcaccctactgaacatgaccctattgtgatattttataaaattattctcaagttattatgaggatgttgaaagacagagaggatggggtgctatgccccaaatcagcctcacaattaagctaagcagctaagagtcttgcagggtagtgtagggaccacagggttaagggggcagtagaattatactcccactttagtttcatttcaaacaatccatacacacacagccctgagcacttacaaattatactacgctctatactttttgtttaaatgtataaataagtggatgaaagaatagatagatagatagacagatagatgatagatagaataaatgcttgccttcatagctgtctccctaccttgttcaaaatgttcctgtccagaccaaagtaccttgccttcacttaagtaatcaattcctaggttatattctgatgtcaaaggaagtcaaaagatgtgaaaaacaatttctgacccacaactcatgctttgtagatgactagatcaaaaaatttcagccatatcttaacagtgagtgaacaggaaatctcctcttttccctacatctgagatcccagcttctaagaccttcaattctcactcttgatgcaacagaccttggaagcatacaggagagctgaacttggtcaacaaaggagaaaagtttgttggcctccaaaggcacagctcaaacttttcaagccttctctaatcttaaaggtaaacaagggtctcatttctttgagaacttcagggaaaatagacaaggacttgcctggtgcttttggtaggggagcttgcactttccccctttctggaggaaatatttatccccaggtagttccctttttgcaccagtggttctttgaagagacttccacctgggaacagttaaacagcaactacagggccttgaactgcacactttcagtccggtcctcacagttgaaaagacctaagcttgtgcctgatttaagcctttttggtcataaaacattgaattctaatctccctctcaaccctacagtcacccatttggtatattaaagatgtgttgtctactgtctagtatccctcaagtagtgtcaggaattagtcatttaaatagtctgcaagccaggagtggtggctcatgtctgtaattccagcacttgagaggtagaagtgggaggactgcttgagctcaagagtttgatattatcctggacaacatagcaagacctcgtctctacttaaaaaaaaaaaaaaaattagccaggcatgtgatgtacacctgtagtcccagctactcaggaggccgaaatgggaggatcccttgagctcaggaggtcaaggctgcagtgagacatgatcttgccactgcactccagcctggacagcagagtgaaaccttgcctcacgaaacagaatacaaaaacaaacaaacaaaaaactgctccgcaatgcgcttccttgatgctctaccacataggtctgggtactttgtacacattatctcattgctgttcataattgttagattaattttgtaatattgatattattcctagaaagctgaggcctcaagatgataacttttattttctggacttgtaatagctttctcttgtattcaccatgttgtaactttcttagagtagtaacaatataaagttattgtgagtttttgcaaacacagcaaacacaacgacccatatagacattgatgtgaaattgtctattgtcaatttatgggaaaacaagtatgtactttttctactaagccattgaaacaggaataacagaacaagattgaaagaatacattttccgaaattacttgagtattatacaaagacaagcacgtggacctgggaggagggttattgtccatgactggtgtgtggagacaaatgcaggtttataatagatgggatggcatctagcgcaatgactttgccatcacttttagagagctcttggggaccccagtacacaagaggggacgcagggtatatgtagacatctcattctttttcttagtgtgagaataagaatagccatgacctgagtttatagacaatgagcccttttctctctcccactcagcagctatgagatggcttgccctgcctctctactaggctgactcactccaaggcccagcaatgggcagggctctgtcagggctttgatagcactatctgcagagccagggccgagaaggggtggactccagagactctccctcccattcccgagcagggtttgcttatttatgcatttaaatgatatatttattttaaaagaaataacaggagactgcccagccctggctgtgacatggaaactatgtagaatattttgggttccatttttttttccttctttcagttagaggaaaaggggctcactgcacatacactagacagaaagtcaggagctttgaatccaagcctgatcatttccatgtcatactgagaaagtccccacccttctctgagcctcagtttctctttttataagtaggagtctggagtaaatgatttccaatggctctcatttcaatacaaaatttccgtttattaaatgcatgagcttctgttactccaagactgagaaggaaattgaacctgagactcattgactggcaagatgtccccagaggctctcattcagcaataaaattctcaccttcacccaggcccactgagtgtcagatttgcatgcactagttcacgtgtgtaaaaaggaggatgcttctttcctttgtattctcacatacctttaggaaagaacttagcacccttcccacacagccatcccaataactcatttcagtgactcaacccttgactttataaaagtcttgggcagtatagagcagagattaagagtacagatgctggagccagaccacctgagtgattagtgactcagtttctcttagtagttgtatgactcagtttcttcatctgtaaaatggagggttttttaattagtttgtttttgagaaagggtctcactctgtcacccaaatgggagtgtagtggcaaaatctcggctcactgcaacttgcacttcccaggctcaagcggtcctcccacctcaacatcctgagtagctggaaccacaggtacacaccaccatacctcgctaattttttgtatttttggtagagatggggtttcacatgttacacaggatggtctcagactccggagctcaagcaatctgcccacctcagccttccaaagtgctgggattataagcatgattacaggagttttaacaggctcataagattgttctgcagcccgagtgagttaatacatgcaaagagtttaaagcagtgacttataaatgctaactactctagaaatgtttgctagtattttttgtttaactgcaatcattcttgctgcaggtgaaaactagtgttctgtactttatgcccattcatctttaactgtaataataaaaataactgacatttattgaaggctatcagagactgtaattagtgctttgcataattaatcatatttaatactcttggattctttcaggtagatactattattatccccattttactacagttaaaaaaactacctctcaacttgctcaagcatacactctcacacacacaaacataaactactagcaaatagtagaattgagatttggtcctaattatgtctttgctcactatccaataaatatttattgacatgtacttcttggcagtctgtatgctggatgctggggatacaaagatgtttaaatttaagctccagtctctgcttccaaaggcctcccaggccaagttatccattcagaaagcattttttactctttgcattccactgtttttcctaagtgactaaaaaattacactttattcgtctgtgtcctgctctgggatgatagtctgactttcctaacctgagcctaacatccctgacatcaggaaagactacaccatgtggagaaggggtggtggttttgattgctgctgtcttcagttagatggttaactttgtgaagttgaaaactgtggctctctggttgactgttagagttctggcacttgtcactatgcctattatttaacaaatgcatgaatgcttcagaatatgggaatattatcttctggaatagggaatcaagttatattatgtaacccaggattagaagattcttctgtgtgtaagaatttcataaacattaagctgtctagcaaaagcaagggcttggaaaatctgtgagctcctcaccatatagaaagcttttaacccatcattgaataaatccctataggggatttctaccctgagcaaaaggctggtcttgattaattcccaaactcatatagctctgagaaagtctatgctgttaacgttttcttgtctgctaccccatcatatgcacaacaataaatgcaggcctaggcatgactgaaggctctctcataattcttggttgcatgaatcagattatcaacagaaatgttgagacaaactatggggaagcagggtatgaaagagctctgaatgaaatggaaaccgcaatgcttcctgcccattcagggctccagcatgtagaaatctggggctttgtgaagactggcttaaaatcagaagccccattggataagagtagggaagaacctagagcctacgctgagcaggtttccttcatgtgacagggagcctcctgccccgaacttccagggatcctctcttaagtgtttcctgctggaatctcctcacttctatctggaaatggtttctccacagtccagcccctggctagttgaaagagttacccatgcagaggccctcctagcatccagagactagtgcttagattcctactttcagcgttggacaacctggatccacttgcccagtgttcttccttagttcctaccttcgaccttgatcctcctttatcttcctgaaccctgctgagatgatctatgtggggagaatggcttctttgagaaacatcttcttcgttagtggcctgcccctcattcccactttaatatccagaatcactataagaagaatataataagaggaataactcttattataggtaagggaaaattaagaggcatacgtgatgggatgagtaagagaggagagggaaggattaatggacgataaaatctactactatttgttgagaccttttatagtctaatcaattttgctattgttttccatcctcacgctaactccataaaaaaacactattattatctttattttgccatgacaagactgagctcagaagagtcaagcatttgcctaaggtcggacatgtcagaggcagtgccagacctatgtgagactctgcagctactgctcatgggccctgtgctgcactgatgaggaggatcagatggatggggcaatgaagcaaaggaatcattctgtggataaaggagacagccatgaagaagtctatgactgtaaatttgggagcaggagtctctaaggacttggatttcaaggaattttgactcagcaaacacaagaccctcacggtgactttgcgagctggtgtgccagatgtgtctatcagaggttccagggagggtggggtggggtcagggctggccaccagctatcagggcccagatgggttataggctggcaggctcagataggtggttaggtcaggttggtggtgctgggtggagtccatgactcccaggagccaggagagatagaccatgagtagagggcagacatgggaaaggtgggggaggcacagcatagcagcatttttcattctactactacatgggactgctcccctatacccccagctaggggcaagtgccttgactcctatgttttcaggatcatcatctataaagtaagagtaataattgtgtctatctcatagggttattatgaggatcaaaggagatgcacactctctggaccagtggcctaacagttcaggacagagctatgggcttcctatgtatgggtcagtggtctcaatgtagcaggcaagttccagaagatagcatcaaccactgttagagatatactgccagtctcagagcctgatgttaatttagcaatgggctgggaccctcctccagtagaaccttctaaccagctgctgcagtcaaagtcgaatgcagctggttagactttttttaatgaaagcttagctttcattaaagattaagctcctaagcagggcacagatgaaattgtctaacagcaactttgccatctaaaaaaatctgacttcactggaaacatggaagcccaaggttctgaacatgagaaatttttaggaatctgcacaggagttgagagggaaacaagatggtgaagggactagaaaccacatgagagacacgaggaaatagtgtagatttaggctggaggtaaatgaaagagaagtgggaattaatacttactgaaatctttctatatgtcaggtgccattttatgatatttaataatctcattacatatggtaattctgtgagatatgtattattgaacatactataattaatactaatgataagtaacacctcttgagtacttagtatatgctagaatcaaatttaagtttatcatatgaggccgggcacggtggctcatatatgggattacatgcctgtaatcccagcactttgggaggccaaggcaattggatcacctgaggtcaggagttccagaccagcctggccaacatggtgaaaccccttctctactaaaaaatacaaaaaatcagccaggtgtggtggcacgcgtctataatcccagctactcaggaggctgaggcaggagaatcacttgaacccaggaggtggaggttgcagtgagctaagattgcaccactgcactccagcctaggcgacagagtgagactccatctcaaaaaaaaaaaaagaagtttattatatgaattaacttagttttactcacaccaatactcagaagtagattattacctcatttattgatgaggagcccaatgtacttgtagtgtagatcaacttattgaaagcacaagctaataagtagacaattagtaattagaagtcagatggtctgagctctcctactgtctacattacatgagctcttattaactggggactcgaaaatcaaagacatgaaataatttgtccaagcttacagaaccaccaagtagtaaggctaggatgtagacccagttctgctacctctgaagacagtgttttttccacagcaaaacacaaactcagatattgtggatgcgagaaattagaagtagatattcctgccctgtggcccttgcttcttacttttacttcttgtcgattggaagttgtggtccaagccacagttgcagaccatacttcctcaaccataattgcatttcttcaggaaagtttgagggagaaaaaggtaaagaaaaatttagaaacaacttcagaataaagagattttctcttgggttacagagattgtcatatgacaaattataagcagacacttgagaaaactgaaggcccatgcctgcccaaattaccctttgaccccttggtcaagctgcaactttggttaaagggagtgtttatgtgttatagtgttcatttactcttctggtctaacccattggctccgtcttcatcctgcagtgacctcagtgcctcagaaacatacatatgtttgtctagtttaagtttgtgtgaaattctaactagcgtcaagaactgagggccctaaactatgctaggaatagtgctgtggtgctgtgataggtacacaagaaatgagaagaaactgcagattctctgcatctccctttgccgggtctgacaacaaagtttccccaaattttaccaatgcaagccatttctccatatgctaactactttaaaatcatttggggcttcacattgtctttctcatctgtaaaaagaatggaagaactcattcctacagaactccctatgtcttccctgatgggctagagttcctctttctcaaaaattagccattattgtatttccttctaagccaaagctcagaggtcttgtattgcccagtgacatgcacactggtcaaaagtaggctaagtagaagggtactttcacaggaacagagagcaaaagaggtgggtgaatgagagggtaagtgagaaaagacaaatgagaagttacaacatgatggcttgttgtctaaatatctcctagggaattattgtgagaggtctgaatagtgttgtaaaataagctgaatctgctgccaacattaacagtcaagaaatacctccgaataactgtacctccaattattctttaaggtagcatgcaactgtaatagttgcatgtatatatttatcataatactgtaacagaaaacacttactgaatatatactgtgtccctagttctttacacaataaactaatctcatcctcataattctattagctaatacatattatcatcctatatttcagagacttcaagaagttaagcaacttgctcaagatcatctaagaagtaggtggtatttctgggctcatttggcccctcctaatctctcatggcaacatggctgcctaaagtgttgattgccttaattcatcagggatgggctcatactcactgcagaccttaactggcatcctcttttcttatgtgatctgcctgaccctagtagacttatgaaatttctgatgagaaaggagagaggagaaaggcagagctgactgtgatgagtgatgaaggtgccttctcatctgggtaccagtggggcctctaagactaagtcactctgtctcactgtgtcttagccagttccttacagcttgccctgatgggagatagagaatgggtatcctccaacaaaaaaataaattttcatttctcaaggtccaacttatgttttcttaatttttaaaaaaatcttgaccattctccactctctaaaataatccacagtgagagaaacattcttttcccccatcccataaatacctctattaaatatggaaaatctgggcatggtgtctcacacctgtaatcccagcactttgggaggctgaggtgggtggactgcttggagctcaggagttcaagaccatcttggacaacatggtgataccctgcctctacaaaaagtacaaaaattagcctggcatggtggtgtgcacctgtaatcccagctattagggtggctgaggcaggagaattgcttgaacccgggaggcggaggttgcagtgagctgagatcgtgccactgcactccagcctgggggacagagcacattataattaactgttattttttacttggactcttgtggggaataagatacatgttttattcttatttatgattcaagcactgaaaatagtgtttagcatccagcaggtgcttcaaaaccatttgctgaatgattactatactttttacaagctcagctccctctatcccttccagcatcctcatctctgattaaataagcttcagtttttccttagttcctgttacatttctgtgtgtctccattagtgacctcccatagtccaagcatgagcagttctggccaggcccctgtcggggtcagtgccccacccccgccttctggttctgtgtaaccttctaagcaaaccttctggctcaagcacagcaatgctgagtcatgatgagtcatgctgaggcttagggtgtgtgcccagatgttctcagcctagagtgatgactcctatctgggtccccagcaggatgcttacagggcagatggcaaaaaaaaggagaagctgaccacctgactaaaactccacctcaaacggcatcataaagaaaatggatgcctgagacagaatgtgacatattctagaatatattatttcctgaatatatatatatatatacacatatacgtatatatatatatatatatatatttgttgttatcaattgccatagaatgattagttattgtgaatcaaatatttatcttgcaggtggcctctatacctagaagcggcagaatcaggctttattaatacatgtgtatagatttttaggatctatacacatgtattaatatgaaacaaggatatggaagaggaaggcatgaaaacaggaaaagaaaacaaaccttgtttgccattttaaggcacccctggacagctaggtggcaaaaggcctgtgctgttagaggacacatgctcacatacggggtcagatctgacttggggtgctactgggaagctctcatcttaaggatacatctcaggccagtcttggtgcattaggaagatgtaggcaactctgatcctgagaggaaagaaacattcctccaggagagctaaaagggttcacctgtgtgggtaactgtgaaggactacaagaggatgaaaaacaatgacagacagacataatgcttgtgggagaaaaaacaggaggtcaaggggatagagaaggcttccagaagaatggctttgaagctggcttctgtaggagttcacagtggcaaagatgtttcagaaatgtgacatgacttaaggaactatacaaaaaggaacaaatttaaggagaggcagataaattagttcaacagacatgcaaggaattttcagatgaatgttatgtctccactgagcttcttgaggttagcagctgtgagggttttgcaggcccaggacccattacaggacctcacgtatacttgacactgttttttgtattcatttgtgaatgaatgacctcttgtcagtctactcggtttcgctgtgaatgaatgatgtcttgtcagcctacttggtttcgctaagagcacagagagaagatttagtgatgctatgtaaaaacttcctttttggttcaagtgtatgtttgtgatagaaatgaagacaggctacatgatgcatatctaacataaacacaaacattaagaaaggaaatcaacctgaagagtatttatacagataacaaaatacagagagtgagttaaatgtgtaataactgtggcacaggctggaatatgagccatttaaatcacaaattaattagaaaaaaaacagtggggaaaaaattccatggatgggtctagaaagactagcattgttttaggttgagtggcagtgtttaaagggtgatatcagactaaacttgaaatatgtggctaaataactagaatactctttattttttcgtatcatgaatagcagatatagcttgatggccccatgcttggtttaacatccttgctgttcctgacatgaaatccttaatttttgacaaaggggctattcattttcattttatattgggcctagaaattatgtagatggtcctgaggaaaagtttatagcttgtctatttctctctctaacatagttgtcagcacaatgcctaggctataggaagtactcaaagcttgttaaattgaattctatccttcttattcaattctacacatggaggaaaaactcatcagggatggaggcacgcctctaaggaaggcaggtgtggctctgcagtgtgattgggtacttgcaggacgaagggtggggtgggagtggctaaccttccattcctagtgcagaggtcacagcctaaacatcaaattccttgaggtgcggtggctcactcctgtaatcacagcagtttgggacgccaaggtgggcagatcacttgaggtcaggagttggacaccagcccagccaacatagtgaaacctggtctctgcttaaaaatataaaaattagctggacgtggtgacgggagcctgtaatccaactacttgggaggctgaggcaggagaatcgcttgaaccggggaggtggagtttgcactgagcagagatcatgccattgcactccagcctccagagcgagactctgtctaaagaaaaacgaaaacaaacaaacaaacaaacaaacaaaacccatcaaattccctgaccgaacagaattctgtctgattgttctctgacttatctaccattttccctccttaaagaaactgtgaacttccttcagctagaggggcctggctcagaagcctctggtcagcatccaagaaatacttgatgtcactttggctaaaggtatgatgtgtagacaagctccagagatggtttctcatttccatatccacccacccagctttccaattttaaagccaattctgaggtagagactgtgatgaacaaacaccttgacaaaattcaacccaaagactcactttgcctagcttcaaaatccttactctgacatatactcacagccagaaattagcatgcactagagtgtgcatgagtgcaacacacacacacaccaattccatattctctgtcagaaaatcctgttggtttttcgtgaaaggatgttttcagaggctgaccccttgccttcacctccaatgctaccactctggtctaagtcactgtcaccaccacctaaattatagctgttgactcataacaatcttcctgcttctaccactgccccactacaatttcttcccaatatactatccaaattagtcttttcaaaatgtaagtcatatatggtcacctctttgttcaaagtcttctgatagtttcctatatcatttataataaaaccaaatccttacaattctctacaatagttgttcatgcatatattatgtttattacagatacatatatatagctctcatataaataaatatatatatttatgtgtatgtgtgtagagtgttttttcttacaactctatgatgtaggtattattagtgtcccaaattttataatttaggacttctatgatctcatcttttattctccccttcaccgaatctcatcctacattggccttattgatattccttgaaaattctaagcatcttacatctttagggtatttacatttgccattccctatgccctaaatatttaatcatagtttcatataaatgggttcctcatcatctatgggtactctctcaggtgttaactttatagtgaggactttcctgccatactacttaaagtagcgataccctttcaccctgtcctaatcacactctggccttcatttcagttttttttttttctccatagcacctaatctcattggtatataacatgtttcatttgcttatttaatgtcaagctctttccactatcaagtccatgaaaacaggaactttattcctctattctgtttttgtgctgtattcttagcaattttacaattttgaatgaatgaatgagcagtcaaacacatatacaactataattaaaaggatgtatgctgacacatccactgctatgcacacacaaagaaatcagtggagtagagctggaagtgctaagcctgcatagagctagttagccctccgcaggcagagccttgatgggattactgagttctagaattggactcatttgttttgtaggctgagatttgctcttgaaaacttgttctgaccaaaataaaaggctcaaaagatgaatatcgaaaccagggtgttttttacactggaatttataactagagcactcatgtttatgtaagcaattaattgtttcatcagtcaggtaaaagtaaagaaaaactgtgccaaggcaggtagcctaatgcaatatgccactaaagtaaacattatttcataggtgtcagatatggcttattcatccatcttcatgggaaggatggccttggcctggacatcagtgttatgtgaggttcaaaacacctctaggctataaggcaacagagctccttttttttttttctgtgctttcctggctgtccaaatctctaatgataagcatacttctattcaatgagaatattctgtaagattatagttaagaattgtgggagccattccgtctcttatagttaaatttgagcttcttttatgatcactgtttttttaatatgctttaagttctggggtacatgtgccatggtggtttgctgcacccatcaacccgtcatctacattaggtatttctcctaatgctatccttcccctagccccccacccccaacaggccccagtgtgtgatgttcccctccctgtgtccatggatcactggtttttttttgttttttttttttttttaaagtctcagttaaatttttggaatgtaatttattttcctggtatcctaggacttgcaagttatctggtcactttagccctcacgttttgatgataatcacatatttgtaaacacaacacacacacacacacacacacacatatatatatatataaaacatatatatacataaacacacataacatatttatcgggcatttctgagcaactaatcatgcaggactctcaaacactaacctatagccttttctatgtatctacttgtgtagaaaccaagcgtggggactgagaaggcaatagcaggagcattctgactctcactgcctttagctaggcccctccctcatcacagctcagcatagtcctgagctcttatctatatccacacacagtttctgacgctgcccagctatcaccatcccaagtctaaagaaaaaaataatgggtttgcccatctctgttgattagaaaacaaaacaaaataaaataagcccctaagctcccagaaaacatgactaaaccagcaagaagaagaaaatacaataggtatatgaggagactggtgacactagtgtctgaatgaggcttgagtacagaaaagaggctctagcagcatagtggtttagaggagatgtttctttccttcacagatgccttagcctcaataagcttgcggttgtggaagtttactttcagaacaaactcctgtggggctagaattattgatggctaaaagaagcccgggggagggaaaaatcattcagcatcctcacccttagtgacacaaaacagagggggcctggttttccatatttcctcatgatggatgatctcgttaatgaaggtggtctgacgagatcattgcttcttccatttaagccttgctcacttgccaatcctcagttttaaccttctccagagaaatacacattttttattcaggaaacatactatgttatagtttcaatactaaataatcaaagtactgaagatagcatgcataggcaagaaaaagtccttagctttatgttgctgttgtttcagaatttaaaaaagatcaccaagtcaaggacttctcagttctagcactagaggtggaatcttagcatataatcagaggtttttcaaaatttctagacataagattcaaagccctgcacttaaaatagtctcatttgaattaactctttatataaattgaaagcacattctgaactacttcagagtattgttttatttctatgttcttagttcataaatacattaggcaatgcaatttaattaaaaaaacccaagaatttcttagaattttaatcatgaaaataaatgaaggcatctttacttactcaaggtcccaaaaggtcaaagaaaccaggaaagtaaagctatatttcagcggaaaatgggatatttatgagttttctaagttgacagactcaagttttaaccttcagtgcccatcatgtaggaaagtgtggcataactggctgattctggctttctactcctttttcccattaaagatccctcctgcttaattaacattcacaagtaactctggttgtactttaggcacagtggctcccgaggtcagtcacacaataggatgtctgtgctccaagttgccagagagagagattactcttgagaatgagcctcagccctggctcaaactcacctgcaaacttcgtgagagatgaggcagaggtacactacgaaagcaacagttagaagctaaatgatgagaacacatggactcatagagggaaacaacgcatactggggcctatcagagggtggagggtgagagaaggagaggatcaggaaaaatcactaatggatgctaagcgtaatacctgagtgatgagatcatctatacaacaaacccccttgacattcatttatctatgtaacaaacctgcacatcctgtacatgtacccctgaacttaaaataaaagttgaaaacaagaaagcaacagtttgaacacttgttatggtctattctctcattctttacaattacactagaaaatagccacaggcttcctgcaaggcagccacagaatttatgacttgtgatatccaagtcattcctggataatgcaaaatctaacacaaaatctagtagaatcatttgcttacatctatttttgttctgagaatatagatttagatacataatggaagcagaataatttaaaatctggctaatttagaatcctaagcagctcttttcctatcagtggtttacaagccttgtttatatttttcctattttaaaaataaaaataaagtaagttatttgtggtaaagaatattcattaaagtatttatttcttagataataccatgaaaaacattcagtgaagtgaagggcctactttacttaacaagaatctaatttatataatttttcatactaatagcatctaagaacagtacaatatttgactcttcaggttaaacatatgtcataaattagccagaaagatttaagaaaatattggatgtttccttgtttaaattaggcatcttacagtttttagaatcctgcatagaacttaagaaattacaaatgctaaagcaaacccaaacaggcaggaattaatcttcatcgaatttgggtgtttctttctaaaagtcctttatacttaaatgtcttaagacatacatagattttattttactaattttaattatatagacaataaatgaatattcttactgattactttttctgactgtctaatctttctgatctatcctggatggccataacacttatctctctgaactttgggcttttaatataggaaagaaaagcaataatccatttttcatggtatctcatatgataaacaaataaaatgcttaaaaatgagcaggtgaagcaatttatcttgaaccaacaagcatcgaagcaataatgagactgcccgcagcctacctgacttctgagtcaggatttataagccttgttactgagacacaaacctgggcctttcaatgctataacctttcttgaagctcctccctaccacctttagccataaggaaacatggaatgggtcagatccctggatgcaagccaggtctggaaccataggcagtaaggagagaagaaaatgtgggctctgcaactggctccgagggagcaggagaggatcaaccccatactctgaatctaagagaagactggtgtccatactctgaatgggaagaatgatgggattacccatagggcttgttttagggagaaacctgttctccaaactcttggccttgagatacctggtccttattccttggactttggcaatgtctgaccctcacattcaagttctgaggaagggccactgccttcatactgtggatctgtagcaaattccccctgaaaacccagagctgtatcttaattggttaaaaaaaattatattatctcaacgactgttcttctctgagtagccaagctcagcttggttcaagctacaagcagctgagctgctttttgtctagtcattgttcttttatttcagtggatcaaatacgttctttccaaacctaggatcttgtcttcctaggctatatattttgtcccaggaagtcttaatctggggtccacagaacactagggggctggtgaagtttatagaaaaaaaatctgtatttttacttacatgtaactgaaatttagcattttcttctactttgaatgcaaaggacaaactagaatgacatcatcagtacctattgcatagttataaagagaaaccacagatattttcatactacaccataggtattgcagatctttttgtttttgtttttgtttgagatggagtttcgctcttattgcccaggctggagtgcagtggcatgatttcggctcactgcaacctccccttcctgcattcaagcaattctcctgccttggcctcctgagtagctggggattacaggcacctgccaccatgccagtctaatttttgtatttttagtagagatggggtttcgccatgttggccaggctggtcttgaactcctgacctcagatgatctgcccgccttggcctcctgaagtgctgggattataggtgtgagccaccacgcctggcccattgcagatatttttaattcacatttatctgcatcactacttggatcttaaggtagctgtagacccaatcctagatctaatgctttcataaagaagcaaatataataaatactataccacaaatgtaatgtttgatgtctgataatgatatttcagtgtaattaaacttagcactcctatgtatattatttgatgcaataaaaacatatttttttagcacttacagtctgccaaactggcctgtgacacaaaaaaagtttaggaattcctggttttgtctgtgttagccaatggttagaatatatgctcagaaagataccattggttaatagctaaaagaaaatggagtagaaattcagtggcctggaataataacaatttgggcagtcattaagtcaggtgaagacttctggaatcatgggagaaaagcaagggagacattcttacttgccacaagtgtttttttttttttttttttttatcacaaacataagaaaatataataaataacaaagtcaggttatagaagagagaaacgctcttagtaaacttggaatatggaatccccaaaggcacttgacttgggagacaggagccatactgctaagtgaaaaagacgaagaacctctagggcctgaacatacaggaaattgtaggaacagaaattcctagatctggtggggcaaggggagccataggagaaagaaatggtagaaatggatggagacggaggcagaggtgggcagatcatgaggtcaagagatcgagaccatcctggcaaacatggtgaaatcccgtctctactaaaaataaaaaaattagctgggcatggtggcatgcgcctgtagtcccagctgctcgggaggctgaggcaggagaatcgtttgaacccaggaggcgaaggttgcagtgagctgagatagtgccattgcactccagtctggcaacagagtgagactccgtctcaaaaaaaaaaaaaaaagaaagaaagaaaagaaaaagaaaaaagaaaaaataaatggatgtagaacaagccagaaggaggaactgggctggggcaatgagattatggtgatgtaagggacttttatagaattaacaatgctggaatttgtggaactctgcttctattattcccccaatcattacttctgtcacattgatagttaaataatttctgtgaatttattccttgattctaaaatatgaggataatgacaatggtattataagggcagattaagtgatatagcatgagcaatattcttcaggcacatggatcgaattgaatacactgtaaatcccaacttccagtttcagctctaccaagtaaagagctagcaagtcatcaaaatggggacatacagaaaaaaaaaaggacactagaggaataatataccctgactcctagcctgattaatatatcgattcacttttttctctgtttgatgacaaattctggctttaaataattttaggattttaggcttctcagctcccttcccagtgagaagtataagcaggacagacaggcaagcaagaagagagccccaggcaatactcacaaagtagccaatgtcccctgtggtcatagagaaatgaaaagagagaggattctctggaagcactggatgtaatcttttctgtctgtcctctctagggaatcaccccaaggtactgtactttgggattaaggctttagtcccactgtggactacttgctattctgttcagtttctagaaggaactatgtacggtttttgtctccctagagaaactaaggtacagaagttttgtttacaatgcactccttaagagagctagaactgggtgagattctgttttaacagctttattttcttttccttggccctgtttttgtcactgtcaccacctttaaggcaaatgttaaatgcgctttggctgaaactttttttcctattttgagatttgctcctttatatgaggctttcttggaaaaggagaatgggagagatggatatcattttggaagatgatgaagagggtaaaaaaggggacaaatggaaatttgtgttgcagatagatgaggagccaacaaaaaagagcctcaggatccagcacacattatcacaaacttagtgtccatccatcactgctgaccctctccggacctgactccacccctgagggacacaggtcagccttgaccaatgacttttaagtaccatggagaacagggggccagaacttcggcagtaaagaataaaaggccagacagagaggcagcagcacatatctgcttccgacacagctgcaatcactagcaagctctcaggcctggcatcatggtgcattttactgctgaggagaaggctgccgtcactagcctgtggagcaagatgaatgtggaagaggctggaggtgaagccttgggcaggtaagcattggttctcaatgcatgggaatgaagggtgaatattaccctagcaagttgattgggaaagtcctcaagattttttgcatctctaattttgtatctgatatggtgtcatttcatagactcctcgttgtttacccctggacccagagattttttgacagctttggaaacctgtcgtctccctctgccatcctgggcaaccccaaggtcaaggcccatggcaagaaggtgctgacttcctttggagatgctattaaaaacatggacaacctcaagcccgcctttgctaagctgagtgagctgcactgtgacaagctgcatgtggatcctgagaacttcaaggtgagttcaggtgctggtgatgtgattttttggctttatattttgacattaattgaagctcataatcttattggaaagaccaacaaagatctcagaaatcatgggtcgagcttgatgttagaacagcagacttctagtgagcataaccaaaacttacatgattcagaactagtgacagtaaaggactactaacagcctgaattggcttaacttttcaggaaatcttgccagaacttgatgtgtttatcccagagaattgtattatagaattgtagacttgtgaaagaagaatgaaatttggcttttggtagatgaaagtccatttcaaggaaatagaaatgccttattttatgtgggtcatgataattgaggtttagaaagagatttttgcaaaaaaaataaaagatttgctcaaagaaaaataagacacattttctaaaatatgttaaatttcccatcagtattgtgaccaagtgaaggcttgtttccgaatttgttggggattttaaactcccgctgagaactcttgcagcactcacattctacatttacaaaaattagacaattgcttaaagaaaaacagggagagagggaacccaataatactggtaaaatggggaagggggtgagggtgtaggtaggtagaatgttgaatgtagggctcatagaataaaattgaacctaagctcatctgaattttttgggtgggcacaaaccttggaacagtttgaggtcagggttgtctaggaatgtaggtataaagccgtttttgtttgtttgtttgttttttcatcaagttgttttcggaaacttctactcaacatgcctgtgtgttattttgtcttttgcctaacagctcctgggtaacgtgatggtgattattctggctactcactttggcaaggagttcacccctgaagtgcaggctgcctggcagaagctggtgtctgctgtcgccattgccctggcccataagtaccactgagttctcttccagtttgcaggtgttcctgtgaccctgacaccctccttctgcacatggggactgggcttggccttgagagaaagccttctgtttaataaagtacattttcttcagtaatcaaaaattgcaattttatcttctccatcttttactcttgtgttaaaaggaaaaagtgttcatgggctgagggatggagagaaacataggaagaaccaagagcttccttaagaaatgtatgggggcttgtaaaattaatgtggatgttatgggagaattccaggattccaaggaggatgatatgatggagaaaaatctttatcggggtgggaaaatggttaattaagtggacagagactcctaggcagtttttactgcaccggggaaagaaggagctgttagtggtacctgagaaagcagatttgtggtacatgtcacttttcattaaaaacaaaaacaaaacaaaacaaaacttcatagatatccaagatataggctagaattactattttaatttactcttatttacattttgaagtagctagcttgtcacatgttttatgaaattgatttggagataagatgagtgtgtatcaacaatagcctgctctttccatgaaggattccattatttcatgggttagctgaagctaagacacatgatatcattgtgcattatcttctgatagaatgtaacatgcactaaaataaagttagagttaggacctgagtgggaaagtttttggagagtgtgatgaagactttccgtgggagatagaatactaataaaggcttaaattctaaaaccagcaagctagggcttcgtgacttgcatgaaactggctctctggaagtagaagggagagtaagacatacgtagaggactaggaaagaccagatagtacagggcctggctacaaaaatacaagcttttactatgctattgcaatactaaacgataagcattaggatgttaagtgactcaggaaataagattttgggaaaaagtaatctgcttatgtgcacaaaatggattcaagtttgcagataaaataaaatatggatgatgattcaaggggacagatacaatggttcaaacccaagaggagcagtgagtctgtggaatttgaaggatggacaaaggtggggtgagaaagacatagtattcgactgactgtgggagatgagaaggaagaaggaggtgataaatgactgaaagctcccagactggtgaagataacaggaggaaaccatgcactgacctggtgactctcatgtgtgaagggtagagggatattaacagatttactttttaggaagtgctagattggtcagggagttttgaccttcaggtcttgtgtctttcatatcaaggaacctttgcattttccaagttagagtgccatattttggcaaatataactttattagtaattttatagtgctctcacattgatcagactttttcctgtgaattacttttgaatttggctgtatatatccagaatatgggagagagacaaataattattgtagttgcaggctatcaacaatactggtctctctgagccttataacctttcaatatgcccataaacagagtaaacagggattattcatggcactaaatattttcacctagtcagtcaacaaatgggagcaatgtgcattttttgatacatatttttatatatttatggggtacatgtgatacttacatgcctagaacatgtgatgattaagtctagatatttaggatatccattgctttgagcatttatcatttctatgtattgagaaaatttcaaatcctcatttctagccattttgaaatatataataaatagtaattaactatagtcaccctactcaaatatcaaacattatggcttaatccttctatccaactgtgtttgtacctattaaccaacatctcttaaatcccctcccatacacactcacactttttccagcctctgataactatcattctactctctaccaccatgagacccacttttttagctcccacagatgaataaaaacatgtgatatttgactttctgtatctggcttattttattatctatctctttggcataccaagagtttgtttttgttctgcttcagggctttcaattaacataatgacctctggttccatccatgttgctacaaatgacaagatttcattctttttcatggcaaaatagtactgtgcaaaaatacaattttttaatccgttcatctgttgatagacacttaggttgatcccaaaccttaactattgtgaatagtgcttcaataaacatgagtgtaatgtgtccattggatatactgatttcctttcttttggataaataaccactagtgagattgctggattgtatgatagttctgtttttagtttactgagaaatcttcatactgttttccataatggttgtactattttacattcccaccaacagtgtgtaagaaagagttcccttttctccatatcctcacaaggatctgttattttttgtcttttttgttaatagccgttttaactagagtaagtagatatctcattgtagttttgatttgcatttccctgatcattagtgatgttgagaattttttcatatgtttgttggtcatttgtatatctttttctgagaattgtctgttcatgtccttagcctactttttattgggattgtttgttattttcttgataatctatttgtgttcattttagagcctggatattattcttttgtcagatgtatagattgtgaagattttctcccactctgtgggttgtctgtttattctgcagactcttccttttgccatgcaaaagctctttagtttaatttagtcccagatattttctttgtttttatgtatttgcatttgtgttcttggtcatgaaatcctttcctaagccaatgtgtagaagggtttttccgatgttattttctagaattgttacagtttcagggcttagatttaagtccttgatccatcttgagttgatttttgtataaggtgagagatgaagatccagtttcattctcctacatgtagcttgccagctatccccgcaccatttgttgaatagggtgccctttccccactttatgtttttgtttgctttgtcaaagatcagttggatgtaagtatttgagtttatttctgggttctctattctgttccattggtcgatgtgcctatttgtacaccagcatcatgctgttttggtgactatggccttattgtatagtttgaaatgaggtaatgtaatgccttcagatttgttcttttttttagacttgcttgtttattgggctcttttttggttccataagaattttaggattgttttttctagttctgtgaagactaatggtggtattttgatgggaattgcaatgaatttgtaggttgcttctggcattatggccattttcacaatattgattctacccatctatgagaatggcatgtgtttccatttgtttgtgtcttatatgattactttcagccgtgttttgtagttttccttgtagatgtctttcacctccttggttaggtatatattcctaagtttttgttttgttttgttttgttttttgcagctattgtaaaaggggttgagttcttgattttattctcagcttggtcattgctggtatgtaagaaagcaactcattggtgtacgttaattttgtatccagaaactttgctgaattattttatcagttctagggggttttggaggagtctttagagttttctacatacacaatcatatcatcagcaaacagtgacagtttgactttctctttaacaatttggatgtgctttacttgtttctcttgtctgattgctcttgctaggacttccagtaatatgttaaagagaagtggtgagagtgggtatccttgtctcattccagttttcagacagaatgcttttaactttttcccattcaatataatgttggctgtgtgtttaccatagctggcttttattacattgaggtatgtcctttgtaaaccgattttgctgagttttagtcataaagtgatgttgaattttgttgaatgcagtttctgtggctattgagataatcacatgatttttgtttccaattctctttatgttgtgtatcacacttattgacttgcgtatgttaaaccatccgtgcatccctcgcatgaaacccacttgatcatgggttttgatatgctgtcggatgctattagctagtattttgtcaaggatgttggcatctatgttcatcagggatattgatctgtagtgttttttttttttggttatgttctttcccagttttggtattaaggtgatactggcttcatagaatgatttagggaggattctctctttctctatcttgtagaatactgtcaataggattggtatcaattcttctttgaatgtctggtagaattcagctgtgaatctatctggtcctggacttttttgttgttggtaaatttttattatcatttcagtcttgctgcttattactggtctgttcagggtatctaattcttcctgacttaagctagagccctgtatctttccaggaattcgaacgtctcctttaggttttctagtttatgcatgtaaaggtgttcatagtagccttgaataatcttttgtatttctgtggtatcagtaatagtatctcctgttttgtttctaattgagtttatttgcacttctctcctcttttcttggttaatcttgctaatggtctatcagttttatttatcttttcaaagaaccagctttttatttcatttagcttttgtatttttttgcagttgttttaatttcatttagttctcctcttatcttagttattccctttcttttgctgggttttggttctgtttgtttttgtttctctagtttcttgtggtgtgaccttatattgtctgtctgtcctctttcagactctttgacatcgacatttagggctgtgaactttccttttagcaccatctttgctgtatcctagaggttttgataggttgtgtcactattgtcggtcagttcaagtaattttgttgttcttattatactttaagttctgggatacatgtgcagaatgtgcaggtttgttacataggtatagatgtgccatggtggtttgctgcacccatcaacctgtcatctacattaggtatttcttttaatgttatccctctcctaaccccctcaccccccgacaggccctggtgtgtgatgttcccctccctgtgtccatgtgttctcattgttcaactcccacttatgagtgagaacgtgtggtgtttggtttctctgttcctgtgttagtttgctcagaatgatggtttccaccttcatccatgtccctgcaaagacatgaactcatcatttttatggctgcatagtattccatggtgtatatgtgccacattttctttatccattatatcgctgatggccatttgggttggttccaagtctttgctattgtgaatagtgccacaataaacatacgtgtgcacgtgtctttatagtagaatgatttctaattctttgggtatatacccagtaatgggattgctgggtcaaacagtatttctggttctagatccttgaggaatcgccacactgtcttccacaatggttgaactaatttacacacccatcaacagtgtaaaatttttcctattcttccacatcctctccagcaccttttgtttcctgactttttaataattgccattctaactggcatgagatggtatctcattgtggttttgatttgcatttctctaatgaccagtgatgatgagcttcttttcatgtgtttcttggccacataaatgacttctttagagaagcatctgttcatatcctttgtccactttttgatggggtcgttaggttttttcttgtaaatttgttgaagttctttgtagattttggatgttagccctttgtcagatggatagattgcaaaaattttctcccattctgtaggttgcctgttcactctgatgatagtcttttgctgtgcagaagctctttagtttaattagatcccatatgtcaattttggcctttgttgtcattgcttttgatgttttagtcgtgaatttttgcccatgcctatgtcctgaatggtattgcctaggttatcttctaggatttttatggttttaggttgcacatttaagtctttaatccaccttgagttaatttttgtataaggtgtaaggaaggggtacagtttcagttttatgcatattgctagccagtttttccagcaccatttattaaatagggaattctttctccattgcttttgtgatgtttgtcaaagatcagatggtcgtagatgtgtggcattatttctgaggcttctgttctgttccactggtctatatatctgttttggtaccagtaccatgctgtttttgttactgtagccttgtagtatagtttgaagtcaggtagcatcatgcctccagctttgttctttttgtttaggattgtcttggctatatgggctcttttttgattccatatgacatttaaagtagttttttctaattctttgaaaaaagtcagtggtagcttgatggggatagcattgaatctataaattactttgggcagtatggccattttaaagatattgattctttctatctatgagcatggaatgtttttccatttgtttgtgtcctctcttatttccttgagcagtgagtggtttgtagctctccttgaagaggttcttcacatcccttagaagttgtatttctaggtattttattttattctctttgcagcaattgtgaatgggagttcacccatgatttggctctctgcttgtctattattggtgtataggaacgcttgtgatttctgcacactgattttgtatcttgagactttgctgaagctgtttatcagcttaagattttgggctgagatgacagggtcttctaaatatacaatcatgtcatctgcaaacagagacaatttgacttcctctcttcctatttgaatatgctttatttctttctcttgcctgattgtcctggcgagaacttccaatactatgttgagtaagagtggcgagagggcatccttgtcttgtgccggttttcaaagcaaatgatttttaaatttccatcttgatttcattgttgacccaatgatcattcaggagcaggttatttaatttccctgtatttgcatggttttgaaggttccttttgtagttgatttccaattttattctactgtggtctgagagagtgcttgatataatttcaatttttaaaaatttattgaggcttgttttgtggcatatcatatggcctatcttggagaaagttccatgtgctgatgaatagaatgtgtattctgcagttgttgggtagaatgtcctgtaaatatctgttaagtccatttgttctttaaatccattgtttctttgtagactgtcttgatgacctgcctagtgcagtcagtggagtattgaagtcccccactattattatgttgctgtctagtctagtagtaattgttttataaatttgggatctccagtattagatgcatatatattaagaattgtaatattctcccattggacaagggcttttatcattatatgatgtccctctttgtcttttttaactgctgtttctttaaagtttgttttgtctgacataagaatagctgctttggctcgcttttggtgtccatttgtgtggaatgtcattttccacccctttaccttaagtttatgtgagtccttatgtgttaggtgagtctcctgaaggcggcagataactggttggtgaattcttattcattctgcaattctgtatcttttaagtggagcatttagtccatttacattcaacatcagtattgaggtgtgaggtactattccattcttcgtggtatttgttgcctgtgtatctttttatctgtatttttgttgtatatgtcctatgggatttatgctttaaagaggttctgttttgatgtgcttccagggtttatttcaagatttagagctccttttatcagttcttgtagtgttggcttggtagtgccgaattctctcagcatttgtttttctgaaaaacactgtgtattttcttcatttgtgaagcttagtttcactggatataaaattcttggctgataattgttttgtttaagaaggctgaagatagggccatattcacttctagcttttacggtttctgctgagaaatctgctgttaatctgataggttttctttcataggttacctggtagtttcacctcacagctcttaagattctctttgtctttagataactttggatactctgatgacaatgtacctaggcaatgatatttttgcaatgaatttcccaggtgtttattgagcttcttgtatttggatatctaggtctctagcaaggtgggggaagttttccttgattatttccctggataagttttccaaacttttagatttctcttctttctcaggaatgctgattattcttaggtttgattgtttaacataatcccagatttcttggaggctttgttcatattttcttattcttttttctttgtctttgttggattgggttaattcaaaaactttgtcttcaagctctgaatttcttctgcttggattctattgctgagactttctagagcattttgcatttctataagtgcatccattcatccattgtttcctgaagttttgaatgttttttatttatgctatctctttaactgaagatttctcccctcatttcttgtatcatatttttggtttttttaaaattggacttcaccttcctcggatgcctccttgattagcttaataactgaccttctgaattatttttcaggtaaatcagggatttcttcttggtttggatgcattgctggtgagctagtatgattttttggggggtgttaaagaaccttgtttttcatattaccagagttagttttctggttccttctcacttgggtaggctctgtcagagggaaagtctaggcctcaaggctgagacttttgtcccatgaggtgttcccttgatgtagcacagtcccccttttcctaggcgtggggcttcctgagagccgaactgtagtgattgttatctctcttctggatctagccacccatcaggtctaccagactccaggctggtactggggtttgtctgcacagagtcttgtgacgtgaaccatctgtgggtctctcagccatagatacaaccacctgctccaatggaggtggcagaggatgaaatggactctgtgagggtccttacttttggttgttcaatgcactatttttgtgctggttggcctcctgccaggaggtggcactttctagaaagcatcagcagaggcagtcaggtggtggtggctgggggggctggggcaccctagaactcccaagaatatatgccctttgtcttcagctaccagggtgagtaaggaaggaccatcaggtgggggcaggactagtcgtgtctgagctcagagtctccttgggcaggtctttctgtggctactgtgggaggatgggggtgtagtttccaggtcaatggatttatgttcctaggacaattatggctgcctctgctgtgtcatgcaggtcatcaggaaagtgggggaaagcaagcagtcacgtgacttgcccagctcccatgcaactcaaaaggttggtctcacttccagcgtgcaccctcccccgcaacagcaccgaatctgtttccatgcagtcagtgagcaaggctgagaacttgccccaggctaccagctgcgaaaccaagtagggctgtcctacttccctgccagtggagtctgcacaccaaattcatgtccccccaccaacccccccactgcccagcccctagatctggccaggtggagattttctttttcctgtcatcttttcccagttcctctggcagccctcccaaatgacccctgtgaggcaaggcagaaatggcttcctaggggacccagagagcccacagggcttttcccgctgcttcctctacccctgtattttgcttggccctctaaattgactcagctccaggtaaggtcagaatcttctcctgtggtctagatcttcaggttccccagtgaggatgtgtgtttgggggtagacggtcccccttttccacttccacagtttgggcactcacaatatttggggtgtttcccgggtcctgcaggagcaatctgcttctttcagagggtgtgtgcgttctctcagctttcttgatttatttctgcaggtggttctgcaaaaaaaattcctgatgggagacttcacatgctgctctgtgcatccgagtgggagctgcaatgtacttctgctgcctcccatctgccatcaccctctaatttgtcggtaatatgcatttttaatcaatctttttttctctctctctctttttcttctcccccaaaactatactgccctttgatatcaaggaatcaaggacgtgatgttgaggggtgggcagtggatacactctttaccccttagggagctatatctagatttagatattgccaattcaagataacttaattgaaagcaaattcataatgaatacacacacacacacacacatctgcatgacaagatttttaatagttgaaagaataactaataattgtccacaggcaataagggctttttaagcaaaacagttgtgataaacaggtcattcttagaatagtaatccagccaatagtacaggttgcttagagattatgtcattaccagagttaaaattctataatggcttctcactccctaccactgaggacaagtttatgtccttaggtttatgcttccctgaaacaataccacctgctattctccactttacatatcaacggcactggttctttatctaactctctggcacagcaggagtttgttttcttctgcttcagagctttgaatttactatttcagcttctaaactttatttggcaatgccttcccatggcagattccttctgtcattttgcctctgttcgaatactttctccttaatttcattcttagttaataatatctgaaattattttgttgtttaacttaattattaattttatgtatgttctacctagattataatcttcagaggaaagttttattctctgacttatttaacttaaatgcccactactttaaaaattatgacatttatttaacagatatttgctgaacaaatgtttgaaaatacatgggaaagaatgcttgaaaacacttgaaattgcttgtgtaaagaaacagttttatcagttaggatttaatcaatgtcagaagcaatgatataggaaaaatcgaggaataagacagttatggataaggagaaatcaacaaactcttaaaagatattgcctcaaaagcataagaggaaataagggtttatacatgacttttagaacactgccttggtttttggataaatggggaagttgtttgaaaacaggagggatcctagatattccttagtctgaggaggagcaattaagattcacttgtttagaggctgggagtggtggctcacgcctgtaatcccagaattttgggaggccaaggcaggcagatcacctgaggtcaagagttcaagaccaacctggccaacatggtgaaatcccatctctacaaaaatacaaaaattagacaggcatgatggcaagtgcctgtaatcccagctacttgggaggctgaggaaggagaattgcttgaacctggaaggcaggagttgcagtgagccgagatcataccactgcactccagcctgggtgacagaacaagactctgtctcaaaaaaaaaaaagagagattcaaaagattcacttgtttaggccttagcgggcttagacaccagtctctgacacattcttaaaggtcaggctctacaaatggaacccaaccagactctcagatatggccaaagatctatacacacccatctcacagatcccctatcttaaagagaccctaatttgggttcacctcagtctctataatctgtaccagcataccaataaaaatctttctcacccatccttagattgagagaagtcacttattattatgtgagtaactggaagatactgataagttgacaaatctttttctttcctttcttattcaacttttattttaacttccaaagaacaagtgcaatatgtgcagctttgttgcgcaggtcaacatgtatctttctggtcttttagccgcctaacactttgagcagatataagccttacacaggattatgaagtctgaaaggattccaccaatattattataattcctatcaacctgataggttaggggaaggtagagctctcctccaataagccagatttccagagtttctgacgtcataatctaccaaggtcatggatcgagttcagagaaaaaacaaaagcaaaaccaaacctaccaaaaaataaaaatcccaaagaaaaaataaagaaaaaaacagcatgaatacttcctgccatgttaagtggccaatatgtcagaaacagcactgagttacagataaagatgtctaaactacagtgacatcccagctgtcacagtgtgtggactattagtcaataaaacagtccctgcctcttaagagttgttttccatgcaaatacatgtcttatgtcttagaataagattccctaagaagtgaacctagcatttatacaagataattaattctaatccatagtatctggtaaagagcattctaccatcatctttaccgagcatagaagagctacaccaaaaccctgggtcatcagccagcacatacacttatccagtgataaatacacatcatcgggtgcctacatacatacctgaatataaaaaaaatacttttgctgagatgaaacaggcgtgatttatttcaaataggtacggataagtagatattgaagtaaggattcagtcttatattatattacataacattaatctattcctgcactgaaactgttgctttataggatttttcactacactaatgagaacttaagagataatggcctaaaaccacagagagtatattcaaagataagtatagcacttcttatttggaaaccaatgcttactaaatgagactaagacgtgtcccatcaaaaatcctggacctatgcctaaaacacatttcacaatccctgaacttttcaaaaattggtacatgctttaactttaaactacaggcctcactggagctacagacaagaaggtgaaaaacggctgacaaaagaagtcctggtatcttctatggtgggagaagaaaactagctaaagggaagaataaattagagaaaaattggaatgactgaatcggaacaaggcaaaggctataaaaaaaattaagcagcagtatcctcttgggggccccttccccacactatctcaatgcaaatatctgtctgaaacggtccctggctaaactccacccatgggttggccagccttgccttgaccaatagccttgacaaggcaaacttgaccaatagtcttagagtatccagtgaggccaggggccggcggctggctagggatgaagaataaaaggaagcacccttcagcagttccacacactcgcttctggaacgtctgaggttatcaataagctcctagtccagacgccatgggtcatttcacagaggaggacaaggctactatcacaagcctgtggggcaaggtgaatgtggaagatgctggaggagaaaccctgggaaggtaggctctggtgaccaggacaagggagggaaggaaggaccctgtgcctggcaaaagtccaggtcgcttctcaggatttgtggcaccttctgactgtcaaactgttcttgtcaatctcacaggctcctggttgtctacccatggacccagaggttctttgacagctttggcaacctgtcctctgcctctgccatcatgggcaaccccaaagtcaaggcacatggcaagaaggtgctgacttccttgggagatgccataaagcacctggatgatctcaagggcacctttgcccagctgagtgaactgcactgtgacaagctgcatgtggatcctgagaacttcaaggtgagtccaggagatgtttcagcactgttgcctttagtctcgaggcaacttagacaactgagtattgatctgagcacagcagggtgtgagctgtttgaagatactggggttgggagtgaagaaactgcagaggactaactgggctgagacccagtggcaatgttttagggcctaaggagtgcctctgaaaatctagatggacaactttgactttgagaaaagagaggtggaaatgaggaaaatgacttttctttattagatttcggtagaaagaactttcacctttcccctatttttgttattcgttttaaaacatctatctggaggcaggacaagtatggtcattaaaaagatgcaggcagaaggcatatattggctcagtcaaagtggggaactttggtggccaaacatacattgctaaggctattcctatatcagctggacacatataaaatgctgctaatgcttcattacaaacttatatcctttaattccagatgggggcaaagtatgtccaggggtgaggaacaattgaaacatttgggctggagtagattttgaaagtcagctctgtgtgtgtgtgtgtgtgtgtgcgcgcgtgtgtttgtgtgtgtgtgagagcgtgtgtttcttttaacgttttcagcctacagcatacagggttcatggtggcaagaagataacaagatttaaattatggccagtgactagtgctgcaagaagaacaactacctgcatttaatgggaaagcaaaatctcaggctttgagggaagttaacataggcttgattctgggtggaagcttggtgtgtagttatctggaggccaggctggagctctcagctcactatgggttcatctttattgtctcctttcatctcaacagctcctgggaaatgtgctggtgaccgttttggcaatccatttcggcaaagaattcacccctgaggtgcaggcttcctggcagaagatggtgactggagtggccagtgccctgtcctccagataccactgagctcactgcccatgatgcagagctttcaaggataggctttattctgcaagcaatcaaataataaatctattctgctaagagatcacacatggttgtcttcagttctttttttatgtctttttaaatatatgagccacaaagggttttatgttgagggatgtgtttatgtgtatttatacatggctatgtgtgtttgtgtcatgtgcacactccacacttttttgtttacgttagatgtgggttttgatgagcaaataaaagaactaggcaataaagaaacttgtacatgggagttctgcaagtgggagtaaaaggtgcaggagaaatctggttggaagaaagacctctataggacaggactcctcagaaacagatgttttggaagagatggggaaaggttcagtgaagggggctgaacccccttccctggattgcagcacagcagcgaggaaggggctcaacgaagaaaaagtgttccaagctttaggaagtcaaggtttaggcagggatagccattctattttattaggggcaatactatttccaacggcatctggcttttctcagcccttgtgaggctctacagggaggttgaggtgttagagatcagagcaggaaacaggtttttctttccacggtaactacaatgaagtgatccttactttactaaggaacttttcattttaagtgttgacgcatgcctaaagaggtgaaattaatcccatacccttaagtctacagactggtcacagcatttcaaggaggagacctcattgtaagcttctagggaggtggggacttaggtgaaggaaatgagccagcagaagctcacaagtcagcatcagcgtgtcatgtctcagcagcagaacagcacggtcagatgaaaatatagtgtgaagaatttgtataacattaattgagaaggcagattcactggagttcttatataattgaaagttaatgcacgttaataagcaagagtttagtttaatgtgatggtgttatgaacttaacgcttgtgtctccagaaaattcacatgctgaatccccaactcccaattggctccatttgtgggggaggctttggaaaagtaatcaggtttagaggagctcatgagagcagatccccatcatagaattattttcctcatcagaagcagagagattagccatttctcttccttctggtgaggacacagtgggaagtcagccacctgcaacccaggaagagagccctgaccaggaaccagcagaaaagtgagaaaaaatcctgttgttgaagtcacccagtctatgctattttgttatagcaccttgcactaagtaaggcagatgaagaaagagaaaaaaataagcttcggtgttcagtggattagaaaccatgtttatctcaggtttacaaatctccacttgtcctctgtgtttcagaataaaataccaactctactactctcatctgtaagatgcaaatagtaagcctgagcccttctgtctaactttgaattctattttttcttcaacgtactttaggcttgtaatgtgtttatatacagtgaaatgtcaagttctttctttatatttctttctttcttttttttcctcagcctcagagttttccacatgcccttcctactttcaggaacttctttctccaaacgtcttctgcctggctccatcaaatcataaaggacccacttcaaatgccatcactcactaccatttcacaattcgcactttctttctttgtcctttttttttttagtaaaacaagtttataaaaaattgaaggaataaatgaatggctacttcataggcagagtagacgcaagggctactggttgccgatttttattgttatttttcaatagtatgctaaacaaggggtagattatttatgctgcccatttttagaccataaaagataacttcctgatgttgccatggcatttttttccttttaattttatttcatttcattttaatttcgaaggtacatgtgcaggatgtgcaggcttgttacatgggtaaatgtgtgtctttctggccttttagccatctgtatcaatgagcagatataagctttacacaggatcatgaaggatgaaagaatttcaccaatattataataatttcaatcaacctgatagcttaggggataaactaatttgaagatacagcttgcctccgataagccagaattccagagcttctggcattataatctagcaaggttagagatcatggatcactttcagagaaaaacaaaaacaaactaaccaaaagcaaaacagaaccaaaaaaccaccataaatacttcctaccctgttaatggtccaatatgtcagaaacagcactgtgttagaaataaagctgtctaaagtacactaatattcgagttataatagtgtgtggactattagtcaataaaaacaacccttgcctctttagagttgttttccatgtacacgcacatcttatgtcttagagtaagattccctgagaagtgaacctagcatttatacaagataattaattctaatccacagtacctgccaaagaacattctaccatcatctttactgagcatagaagagctacgccaaaaccctgggtcatcagccagcacacacacttatccagtggtaaatacacatcatctggtgtatacatacatacctgaatatggaatcaaatatttttctaagatgaaacagtcatgatttatttcaaataggtacggataagtagatattgaggtaagcattaggtcttatattatgtaacactaatctattactgcgctgaaactgtggctttatagaaattgttttcactgcactattgagaaattaagagataatggcaaaagtcacaaagagtatattcaaaaagaagtatagcactttttccttagaaaccactgctaactgaaagagactaagatttgtcccgtcaaaaatcctggacctatgcctaaaacacatttcacaatccctgaacttttcaaaaattggtacatgctttagctttaaactacaggcctcactggagctagagacaagaaggtaaaaaacggctgacaaaagaagtcctggtatcctctatgatgggagaaggaaactagctaaagggaagaataaattagagaaaaactggaatgactgaatcggaacaaggcaaaggctataaaaaaaattagcagtatcctcttgggggccccttccccacactatctcaatgcaaatatctgtctgaaacggtccctggctaaactccacccatgggttggccagccttgccttgaccaatagccttgacaaggcaaacttgaccaatagtcttagagtatccagtgaggccaggggccggcggctggctagggatgaagaataaaaggaagcacccttcagcagttccacacactcgcttctggaacgtctgaggttatcaataagctcctagtccagacgccatgggtcatttcacagaggaggacaaggctactatcacaagcctgtggggcaaggtgaatgtggaagatgctggaggagaaaccctgggaaggtaggctctggtgaccaggacaagggagggaaggaaggaccctgtgcctggcaaaagtccaggtcgcttctcaggatttgtggcaccttctgactgtcaaactgttcttgtcaatctcacaggctcctggttgtctacccatggacccagaggttctttgacagctttggcaacctgtcctctgcctctgccatcatgggcaaccccaaagtcaaggcacatggcaagaaggtgctgacttccttgggagatgccacaaagcacctggatgatctcaagggcacctttgcccagctgagtgaactgcactgtgacaagctgcatgtggatcctgagaacttcaaggtgagtccaggagatgtttcagccctgttgcctttagtctcgaggcaacttagacaacggagtattgatctgagcacagcagggtgtgagctgtttgaagatactggggttgggggtgaagaaactgcagaggactaactgggctgagacccagtggtaatgttttagggcctaaggagtgcctctaaaaatctagatggacaattttgactttgagaaaagagaggtggaaatgaggaaaatgacttttctttattagattccagtagaaagaactttcatctttccctcatttttgttgttttaaaacatctatctggaggcaggacaagtatggtcgttaaaaagatgcaggcagaaggcatatattggctcagtcaaagtggggaactttggtggccaaacatacattgctaaggctattcctatatcagctggacacatataaaatgctgctaatgcttcattacaaacttatatcctttaattccagatgggggcaaagtatgtccaggggtgaggaacaattgaaacatttgggctggagtagattttgaaagtcagctctgtgtgtgtgtgtgtgtgtgcgcgcgcgcgtgtgtgtgtgtgtgtcagcgtgtgtttcttttaacgtcttcagcctacaacatacagggttcatggtggcaagaagatagcaagatttaaattatggccagtgactagtgcttgaaggggaacaactacctgcatttaatgggaaggcaaaatctcaggctttgagggaagttaacataggcttgattctgggtggaagcttggtgtgtagttatctggaggccaggctggagctctcagctcactatgggttcatctttattgtctcctttcatctcaacagctcctgggaaatgtgctggtgaccgttttggcaatccatttcggcaaagaattcacccctgaggtgcaggcttcctggcagaagatggtgactgcagtggccagtgccctgtcctccagataccactgagctcactgcccatgattcagagctttcaaggataggctttattctgcaagcaatacaaataataaatctattctgctgagagatcacacatgattttcttcagctcttttttttacatctttttaaatatatgagccacaaagggtttatattgagggaagtgtgtatgtgtatttctgcatgcctgtttgtgtttgtggtgtgtgcatgctcctcatttatttttatatgagatgtgcattttgatgagcaaataaaagcagtaaagacacttgtacacgggagttctgcaagtgggagtaaatggtgtaggagaaatccggtgggaagaaagacctctataggacaggacttctcagaaacagatgttttggaagagatgggaaaaggttcagtgaagacctgggggctggattgattgcagctgagtagcaaggatggttcttaaggaagggaaagtgttccaagctttaggaattcaaggtttagtcaggtgtagcaattctattttattaggaggaatactatttctaatggcacttagcttttcacagcccttgtggatgcctaagaaagtgaaattaatcccatgccctcaagtgtgcagattggtcacagcatttcaagggagagacctcattgtaagactctgggggaggtggggacttaggtgtaagaaatgaatcagcagaggctcacaagtcagcatgagcatgttatgtctgagaaacagaccagcactgtgagatcaaaatgtagtgggaagaatttgtacaacattaattggaaggcttacttaatggaatttttgtatagttggatgttagtgcatctctataagtaagagtttaatatgatggtgttacggacctaatgtttgtgtctcctcaaaattcacatgctgaatccccaactcccaactgaccttatctgtgggggaggcttttgaaaagtaattaggtttagatgagctcataagagcagatccccatcataaaattattttccttatcagaagcagagagacaagccatttctctttcctcccggtgaggacacagtgagaagtccgccatctgcaatccaggaagagaaccctgaccacgagtcagccttcagaaatgtgagaaaaaactctgttgttgaagccacccagtcttttgtattttgttatagcaccttgcactgagtaaggcagatgaagaaggagaaaaaaataagcttgggttttgagtggactacagaccatgtttatctcaggtttgcaaagctcccctcgtcccctatgtttcagtataaaatacctactctactactctcatctataagacccaaataataagcctgcgcccttctctctaactttgatttctcctatttttacttcaacatgctttactctagccttgtaatgtctttacatacagtgaaatgtaaagttctttattctttttttctttctttcttttttctcctcagcctcagaatttggcacatgcccttccttctttcaggaacttctccaacatctctgcctggctccatcatatcataaaggtcccacttcaaatgcagtcactaccgtttcagaatatgcactttctttcttttttgttttttgttttttttaagtcaaagcaaatttcttgagagagtaaagaaataaacgaatgactactgcataggcagagcagccccgagggccgctggttgttccttttatggttatttcttgatgatatgttaaacaagttttggattatttatgccttctctttttaggccatatagggtaactttctgacattgccatggcatttttcttttaatttaatttactgttaccttaaattcaggggtacacgtacaggatatgcaggtttgttttataggtaaaagtgtgccatggttttaatgggttttttttttcttgtaaagttgtttaagtttcttgtttactctggatattaggcctttgtcagaagaatagattggaaaatctttttcccattctgtagattgtctttcgctctgatggtagtttcttttgctgagcaggagctctttagtttaattagattccattggtcaatttttgcttttgctgcaattgcttttcacgctttcatcatgaaatctgtgcccgtgtttatatcatgaatagtattgccttgatttttttctaggctttttatagtttggggtttttcatttaagtctctaatccatctggagttaattttggataaggtataaggaaggagtccagtttcatttttcagcatatggctagccagttctcccccatcatttattaaattgaaaatcctttccccattgcttgcttttgtcaggtttctaaaagaccagatggttgtaggtacaatatgcagtttcttcaagtcatataataccatctgaaatctcttattaattcatttcttttagtatgtatgctggtctcctctgctcactatagtgagggcaccattagccagagaatctgtctgtctagttcatgtaagattctcagaattaagaaaaatggatggcatatgaatgaaacttcatggatgacatatggaatctaatatgtatttgttgaattaatgcataagatgcaacagagagaagttgacaactgcaatgataacctggtattgatgatataagagtctatagatcacagtagaagcaataatcatggaaaacaattggaaatggggaacagccacaaacaagaaagaatcaatacttccaggaaagtgactgcaggtcacttttcctggagcgggtgagagaaaagtggaagttagcagtaactgctgaattcctggttggctgatggaaagatggggcagctgttcactggtacgcagggttttagatgtatgtacctaaggatatgaggtatggcaatgaacagaaattcttttgggaatgagttttagggccattaaaggacatgacctgaagtttcctctgaggccagtccccacaactcaatataaatgtgtttcctgcatatagtcaaagttgccacttctttttcttcatatcatcgatctctgctcttaaagataatcttggttttgcctcaaactgtttgtcactacaaactttccccatgttcctaagtaaaacaggtaactgcctctcaactatatcaagtagactaaaatattgtgtctctaatatcagaaattcagctttaatatattgggtttaactctttgaaatttagagtctccttgaaatacacatgggggtgatttcctaaactttatttcttgtaaggatttatctcaggggtaacacacaaaccagcatcctgaacctctaagtatgaggacagtaagccttaagaatataaaataaactgttcttctctctgccggtggaagtgtgccctgtctattcctgaaattgcttgtttgagacgcatgagacgtgcagcacatgagacacgtgcagcagcctgtggaatattgtcagtgaagaatgtctttgcctgattagatataaagacaagttaaacacagcattagactatagatcaagcctgtgccagacacaaatgacctaatgcccagcacgggccacggaatctcctatcctcttgcttgaacagagcagcacacttctcccccaacactattagatgttctggcataattttgtagatatgtaggatttgacatggactattgttcaatgattcagaggaaatctcctttgttcagataagtacactgactactaaatggattaaaaaacacagtaataaaacccagttttccccttacttccctagtttgtttcttattctgctttcttccaagttgatgctggatagaggtgtttatttctattctaaaaagtgatgaaattggccgggcgcggtggctcacacctgtaatcccagcactttgggaggctgaggtgggcggatcacgaggtcaggagatcaagaccatcctggctaacatggtgaaaccccatctctactaaaaatacaaaaaattagccagagacagtggcgggtgcctgtagtcccagctactcgggaggctgaggcaggagaatggcgtgaacctgggaggcagagcttgcggtgagcagagatcgcgccactgcacactccagcctgggtgacaaagcgagactccatctcaaaaaaaaaaaaaaaaaaaagaaaaagaaagaaagaaagaaaaaaaaactgatgaaattgtgtattcaatgtagtctcaagagaattgaaaaccaagaaaggctgtggcttcttccacataaagcctggatgaataacaggataacacgttgttacattgtcacaactcctgatccaggaattgatggctaagatattcgtaattcttatccttttcagttgtaacttattcctatttgtcagcattcaggttattagcggctgctggcgaagtccttgagaaataaactgcacactggatggtgggggtagtgtaggaaaatggaggggaaggaagtaaagtttcaaattaagcctgaacagcaaagttcccctgagaaggccacctggattctatcagaaactcgaatgtccatcttgcaaaacttccttgcccaaaccccacccctggagtcacaacccacccttgaccaatagattcattttactgagggaggcaaagggctggtcaatagattcatttcactgggagaggcaaagggctgggggccagagaggagaagtaaaaagccacacatgaagcagcaatgcaggcatgcttctggctcatctgtgatcaccaggaaactcccagatctgacactgtagtgcatttcactgctgacaagaaggctgctgccaccagcctgtgaagcaaggttaaggtgagaaggctggaggtgagattctgggcaggtaggtactggaagccgggacaaggtgcagaaaggcagaaagtgtttctgaaagagggattagcccgttgtcttacatagtctgactttgcacctgctctgtgattatgactatcccacagtctcctggttgtctacccatggacctagaggtactttgaaagttttggatatctgggctctgactgtgcaataatgggcaaccccaaagtcaaggcacatggcaagaaggtgctgatctccttcggaaaagctgttatgctcacggatgacctcaaaggcacctttgctacactgagtgacctgcactgtaacaagctgcacgtggaccctgagaacttcctggtgagtagtaagtacactcacgctttcttctttacccttagatatttgcactatgggtacttttgaaagcagaggtggctttctcttgtgttatgagtcagctatgggatatgatatttcagcagtgggattttgagagttatgttgctgtaaataacataactaaaatttggtagagcaaggactatgaataatggaaggccacttaccatttgatagctctgaaaaacacatcttataaaaaattctggccaaaatcaaactgagtgtttttggatgagggaacagaagttgagatagagaaaataacatctttcctttggtcagcgaaattttctataaaaattaatagtcacttttctgcatagtcctggaggttagaaaaagatcaactgaacaaagtagtgggaagctgttaaaaagaggattgtttccctccgaatgatgatggtatacttttgtacgcatggtacaggattctttgttatgagtgtttgggaaaattgtatgtatgtatgtatgtatgtatgtgatgactggggacttatcctatccattactgttccttgaagtactattatcctactttttaaaaggacgaagtctctaaaaaaaaaatgaaacaatcacaatatgttggggtagtgagttggcatagcaagtaagagaaggataggacacaatgggaggtgcagggctgccagtcatattgaagctgatatctagcccataatggtgagagttgctcaaactctggtgaaaaaggatgtaagtgttatatctatttactgcaagtccagcttgaggccttctattcactatgtaccattttcttttttatcttcactccctccccagctcttaggcaacgtgatattgattgttttggcaacccacttcagcgaggattttaccctacagatacaggcttcttggcagtaactaacaaatgctgtggttaatgctgtagcccacaagaccactgagttccctgtccactatgtttgtacctatggtccactatgtttgtacctatgtcccaaaatctcatctcctttagatgggggaggttggggagaagagcagtatcctgcctgctgattcagttcctgcatgataaaaatagaataaagaaatatgctctctaagaaatatcattgtactctttttctgtctttatattttaccctgattcagccaaaaggacgcactatttctgatggaaatgagaatgttggagaatgggagtttaaggacagagaagatactttcttgcaatcctgcaagaaaagagagaactcgtgggtggatttagtggggtagttactcctaggaaggggaaatcgtctctagaataagacaatgtttttacagaaagggaggtcaatggaggtactctttggaggtgtaagaggattgttggtagtgtgtagaggtatgttaggactcaaattagaagttctgtataggctattatttgtatgaaactcaggatatagctcatttggtgactgcagttcacttctacttattttaaacaacatattttttattatttataatgaagtggggatggggcttcctagagaccaatcaagggccaaaccttgaactttctcttaacgtcttcaatggtattaatagagaattatctctaaggcatgtgaactggctgtcttggttttcatctgtacttcatctgctacctctgtgacctgaaacatatttataattccattaagctgtgcatatgatagatttatcatatgtattttccttaaaggatttttgtaagaactaattgaattgatacctgtaaagtctttatcacactacccaataaataataaatctctttgttcagctctctgtttctataaatatgtacaagttttattgtttttagtggtagtgattttattctctttctatatatatacacacacatgtgtgcattcataaatatatacaatttttatgaataaaaaattattagcaatcaatattgaaaaccactgatttttgtttatgtgagcaaacagcagattaaaaggctgagatttaggaaacagcacgttaagtcaagttgatagaggagaatatggacatttaaaagaggcaggatgatataaaattagggaaactggatgcagagaccagatgaagtaagaaaaatagctatcgttttgagcaaaaatcactgaagtttcttgcatatgagagtgacataataaatagggaaacgtagaaaattgattcacatgtatatatatatatagaactgattagacaaagtctaacttgggtatagtcagaggagcttgctgtaattatattgaggtgatggataaagaactgaagttgatggaaacaatgaagttaagaaaaaaaatcgagtaagagaccattgtggcagtgattgcacagaactggaaaacattgtgaaacagagagtcagagatgacagctaaaatccctgtctgtgaatgaaaagaaggaaatttattgacagaacagcaaatgcctacaagccccctgtttggatctggcaatgaacgtagccattctgtggcaatcacttcaaactcctgtacccaagacccttaggaagtatgtagcaccctcaaacctaaaacctcaaagaaagaggttttagaagatataataccctttcttctccagtttcattaatcccaaaacctctttctcaaagtatttcctctatgtgtccaccccaaagagctcacctcaccatatctcttgagtgggagcacatagataggcggtgctaccatctaacagcttctgaaattcctttgtcatatttttgagtccccactaataacccacaaagcagaataaataccagttgctcatgtacaataatcactcaactgctgtcttgtagcatacattaattaagcacattctttgaataattactgtgtccaaacaatcacactttaaaatctcacacttgtgctatcccttgcccttctgaatgtcactctgtattttaaatgaagagatgagggttgaatttcctgtgttacttattgttcatttctcgatgaggagttttcacattcacctttagtggaaaacacataagtacacatcttacaggaaaaatataccaaactgacatgtagcatgaatgcttgtgcatgtagtcatataaaatcttgtagcaatgtaaacattctctgatatacacatacagatgtgtctatatgtctacacaatttcttatgctccatgaacaaacattccatgcacacataagaacacacactgttacagatgcatacttgagtgcattgacaaaattaccccagtcaatctagagaatttggatttctgcatttgactctgttagctttgtacatgctgttcatttactctgggtgatgtctttccctcattttgccttgtctatcttgtactcatactttaagtcctaacttatatgttatctcaactaagaagctatttttttttaattttaactgggcttaaagccctgtctataaactctgctacaattatgggctctttcttataatatttagtgtttttcctactaatgtacttaatctgctcattgtatattcctaccactaaattttaacctcttttatggtagagacattgtcttgtaaactcttatttccctagtatttggagatgaaaaaaaagattaaattatccaaaattagatctctcttttctacattatgagtattacactatccatagagaagtttgtttgagacctaaactgaggaacctttggttctaaaatgactatgtgatatcttagtatttataggtcatgaggttccttcctctgcctctgctatagtttgattagtcaacaagcatgtgtcatgcatttattcacatcagaatttcatacactaataagacatagtatcagaagtcagtttattagttatatcagttagggtccatcaaggaaaggacaaaccattatcagttactcaacctagaattaaatacagctcttaatagttaattatccttgtattggaagagctaaaatatcaaataaaggacagtgcagaaatctagatgttagtaacatcagaaaacctcttccgccattaggcctagaagggcagaaggagaaaatgtttataccaccagagtccagaaccagagcccataaccagaggtccactggattcagtgagctagtgggtgctccttggagagagccagaactgtctaatgggggcatcaaagtatcagccataaaaaaccataaaaaagactgtctgctgtaggagatccgttcagagagagagagagaccagaaataatcttgcttatgctttccctcagccagtgtttaccattgcagaatgtacatgcgactgaaagggtgaggaaacctgggaaatgtcagttcctcaaatacagagaacactgagggaaggatgagaaataaatgtgaaagcagacatgaatggtaattgacagaaggaaactaggatgtgtccagtaaatgaataattacagtgtgcagtgattattgcaatgattaatgtattgataagataatatgaaaacacagaattcaaacagcagtgaactgagattagaattgtggagagcactggcatttaagaatgtcacacttagaatgtgtctctaggcattgttctgtgcatatatcatctcaatattcattatctgaaaattatgaattaggtacaaagctcaaataatttattttttcaggttagcaagaactttttttttttttttctgagatagagcattgctatggttgcccaggctggagtgcaatggcatgatccaggctcactgcaacatctgcctcccaggttcaagcgattctcctgcctcagcctcccaagtagctggcactacaggcatgtgccaccaccatgcctggctaattttctatttttagtagatagggggtttcaccatgttggtcaggctgatctcgaactcctaacatcaggtgatccaccctcctcggcctctgaaagtgctgggatcacaggcgtgagccaccacacccagccaagaatgtgaattttgtagaaggatataacccatatttctctgaccctagagtccttagtatacctcccataccatgtggctcatcctccttacatacatttcccatctttcaccctaccttttcctttttgtttcagcttttcactgtgtcaaaatctagaaccttatctcctacctgctctgaaaccaacagcaagttgacttccattctaacccacattggcattacactaattaaaatcgatactgagttctaaaatcatcggggattttggggactatgtcttacttcatacttccttgagatttcacattaaatgttggtgttcattaaaggtccttcatttaactttgtattcatcacactcttggattcacagttatatctaaactcttaaatacagcctgtataatcccaattcccaactctgatttctaacctctgacctccaacctcagtgccaaacccatatatcaaacaatgtactgggcttatttatatagatgtcctataggcacctcagactcagcatgggtatttcacttgttatactaaaactgtttctcttccagtgttttccattttagtcattagatagctacttgcccattcaccaaggtcacagattaaaatcatttccctacctctaatcaacagttcgattctgcttcaatttgtccctatctattaatcaccactcttactgcccagtcaggtcctcattgtttcctgaacaagagtagatgctattctttccacttttagaccttatcctggctggatgcggtggctcaggcttgtaaacccagcactttgggaggccaaggcaggcagatcacttgaggtcaggagttcaagaccagcctgaccaacatggtgaaaccccatctctactaaaaatacaaaatcagccgggcgtgtggtgcatgcctgcagtcccagctattcaggtggctgaggcaggagaattgcttgaacccaggaggcagaggttgcggtgagcctagattgcaccattgcactctagcttgggcaatagggatgaaactccatctcagaagagaaaagaaaaaaagaccttattctgttatacaaatcctctcaatgcaatccatatagaataaacatgtaaccagatctcccaatgtgtaaaatcatttcaggtagaacagaattaaagtgaaaagccaagtctttggaattaacagacaaagatcaaataacagtcctcatggccttaagaatttacctaacattttttttagaatcaattttcttatatatgaattggaaacataattcctccctcacaaacacattctaagattttaaggagatattgatgaagtacatcatctgtcatttttaacaggtagtggtagtgattcacacagcacattatgatctgttcttgtatgttctgttccattctgtattcttgacctggttgtattctttctgagctccagatccacatatctaagtacatctttttgcattttacaagagtgcatacaatacaatgtatccaagactgtatttctgattttatcgtaccactaaactcacaaatgtggccctattcttgtgttcacgactgacatcaccgtcatggtccaagtctgataatagaaatggcattgtcactttcttccctactgcaacagaagcccagctatttgtctcccattttctctacttctaaaatacatttcttcactaagtgagaataatcttttaaagacacaaatcaaaccatgccaccacctttcttgaattattcaatatctttcgttggcttccaggttacagaaaaataacttgtaacaaagtttaaaggtcattcatggctcctctctaccctattttataacatttccccttgtgatcagaatctcaggcacatcatccatctttctatatacaaataaagtcatatagtttgaactcacctctggttacttttaatcaaccaaatgctgtaaaatgcatttgtatcgctacgtgttaagcagtagttgattcttttcatttctgtgtaatattctattctttgactataccgtaatttatcaattctactgttggtaagcatttaagtggctaccggtttgaggtttttatgattattgctgtcataagcatttctatacatgtctttggatacacacatgcatgtgtttctgaatatctaaaaatgtaattgctaggtaatagacttatcaagcatccagcatttgtggatactattaaaggttttccaaaggggttatactattgtacagtgtcaccaacagagtttgagtttctattgatccatatcaccaccaaaatttgaactgtcagtcttatctcttctcttgtctcttttttcctcttttttttccttcccttcccctctcttcgtttcttttctctcctcttctcttctttcctctcttcccttccctttctctttctcttccctatcccttctcctctcctctcccctccttttttctcctctcctctccattatttatttttccttcttctcctccatcccttccatcctctctcttcccctcttccttccttcctttctccatttcttcctcctctttccttcaatccttccttttggatatgctcatgggtgtgtatttgtctgccattgtggcattatttgaattcagaaaagagtgaaaaactactgggatcttcattcctgggtctaattccacatttttttttaagaacacatctgtaaaaatgttctgtactagcatattcccaggaacttcgttaaatttaatctggctgaatatggtaaatctacttttcactttgcattctttctttagtcataccataattttaaacattcaaaatatttgtatataatatttgattttatctgtcattaaaatgttaaccttaaaattcatgtttccagaacctatttcaataactggtaaataaacactattcattttttaaatattcttttaatggatatttatttcaatataataaaaaattagagttttattataggaagaatttaccaaaagaaggaggaagcaagcaagtttaaactgcagcaatagatttgtccattccaacctctcaaaattcccttggagacaaaaatctctagaggcaaagaagaactttatattgagtcaacttgttaaaacatctgcttttagataagttttcttagtataaagtgacagaaacaaataagttaaactctaagatacattccactatattagcctaaaacacttctgcaaaaatgaaactaggaggatatttttagaaacaactgctgaaagagatgcggtggggagatatgtagaggagaacagggtttctgagtcaagacacacatgacagaacagccaatctcagggcaagttaagggaatagtggaatgaaggttcatttttcattctcacaaactaatgaaaccctgcttatcttaaaccaacctgctcactggagcagggaggacaggaccagcataaaaggcagggcagagtcgactgttgcttacactttcttctgacataacagtgttcactagcaacctcaaacagacaccatggtgcatctgactcctgaggagaagactgctgtcaatgccctgtggggcaaagtgaacgtggatgcagttggtggtgaggccctgggcaggttggtatcaaggttataagagaggctcaaggaggcaaatggaaactgggcatgtgtagacagagaagactcttgggtttctgataggcactgactctctgtcccttgggctgttttcctaccctcagattactggtggtctacccttggacccagaggttctttgagtcctttggggatctgtcctctcctgatgctgttatgggcaaccctaaggtgaaggctcatggcaagaaggtgctaggtgcctttagtgatggcctggctcacctggacaacctcaagggcactttttctcagctgagtgagctgcactgtgacaagctgcacgtggatcctgagaacttcagggtgagtccaggagatgcttcacttttctctttttactttctaatcttacattttggttcttttacctacctgctcttctcccacatttttgtcattttactatattttatcatttaatgcttctaaaattttgttaattttttatttaaatattctgcattttttccttcctcacaatcttgctattttaaattatttaatatcctgtctttctctcccaaccccctcccttcatttttccttctctaacaacaactcaaattatgcataccagctctcacctgctaattctgcacttagaataatccttttgtctctccacatgggtatgggagaggctccaactcaaagatgagaggcatagaatactgttttagaggctataaatcattttacaataaggaataattggaattttataaattctgtagtaaatggaatggaaaggaaagtgaatatttgattatgaaagactaggcagttacactggaggtggggcagaagtcgttgctaggagacagcccatcatcacactgattaatcaattaatttgtatctattaatctgtttatagtaattaatttgtatatgctatatacacatacaaaattaaaactaatttggaattaatttgtatatagtattatacagcatatatagcatatatgtacatatatagactacatgctagttaagtacatagaggatgtgtgtgtatagatatatgttatatgtatgcattcatatatgtacttatttatgctgatgggaataacctggggatcagttttgtctaagatttgggcagaaaaaaatgggtgttggctcagtttctcagaagccagtctttatttctctgttaaccatatgcatgtatctgcctacctcttctccgcagctcttgggcaatgtgctggtgtgtgtgctggcccgcaactttggcaaggaattcaccccacaaatgcaggctgcctatcagaaggtggtggctggtgtggctaatgccctggctcacaagtaccattgagatcctggactgtttcctgataaccataagaagaccctatttccctagattctattttctgaacttgggaacacaatgcctacttcaagggtatggcttctgcctaataaagaatgttcagctcaacttcctgattaatttcacttatttcatttttttgtccaggtgtgtaagaaggttcctgaggctctacagatagggagcacttgtttattttacaaagagtacatgggaaaagagaaaagcaagggaaccgtacaaggcattaatgggtgacacttctacctccaaagagcagaaattatcaagaactcttgatacaaagataatactggcactgcagaggttctagggaagacctcaaccctaagacatagcctcaagggtaatgctacgattaaactccaacaattactgagaaaataatgtgctcaattaaaggcataatgattactcaagacaatgttatgttgtctttcttcctccttcctttgcctgcacattgtagcccataatactataccccatcaagtgttcctgctccaagaaatagcttcctcctcttacttgccccagaacatctctgtaaagaatttcctcttatcttcccatatttcagtcaagattcattgctcacgtattacttgtgacctctcttgaccccagccacaataaacttctctatactacccaaaaaatctttccaaaccctcccccacaccattttttatatttttatatttttcttatttatttcatgcacacacacacactccgtgctttataagcaattctgcctattctctaccttcttacatgcctactgtgcctcatattaaattcatcaatgggcagaaagaaaatatttattcaagaaaacagtgaatgaatgaacgaatgagtaaatgagtaaatgaaggaatgattattccttgctttagaacttctggaattagaggacaatattaataataccatcgcacagtgtttctttgttgttaatgctacaacatacaaagaggaagcatgcagtaaacaaccgaacagttatttcctttctgatcataggagtaatatttttttccttgagcaccatttttgccataggtaaaattagaaggatttttagaactttctcagttgtatacatttttaaaaatctgtattatatgcatgttgattaattttaaacttacttgaatacctaaacagaatctgttgtttccttgtgtttgaaagtgctttcacagtaactctgtctgtactgccagaatatactgacaatgtgttatagttaactgttttgatcacaacattttgaattgactggcagcagaagctcttttatatccatgtgttttccttaagtcattatacatagtaggcactgagaactctttatatctgaataagatatttaggaaccactggtttacatatcagaagcagagctactcagggcattttggggaagatcactttcacattcctgagcatagggaagttctcataagagtaagatattaaaaggagatacttgtgtggtattcgaaagacagtaagagagattgtagaccttatgatcttgatagggaaaacaaactacattcctttctccaaaagtcaaaaaaaaagagcaaatatagcttactataccttctattcctacaccattagaagtagtcagtgagtctaggcaagatgttggccctaaaaatccaaataccagagaattcatgagaacatcacctggatgggacatgtgccgagcacacacaattactatatgctaggcattgctatcttcatattgaagatgaggaggtcaagagatgaaaaaagacttggcaccttgttgttatattaaaattatttgttagagtagagcttttgtaagagtctaggagtgtgggagctaaatgatgatacacatggacacaaaaaatagatcaacagacacccaggcctacttgagggttgagggtgggaagagggagacgatgaaaaagaacctattgggtattaagttcatcactgagtgatgaaataatctgtacatcaagacccagtgatatgcaatttacctatataacttgtacatgtacccccaaatttaaaatgaaagttaaaacaaagtataggaatggaattaattcctcaagatttggctttaattttatttgataatttatcaaatggttgtttttcttttctcactatggcgttgctttataaactatgttcagtatgtctgaatgaaagggtgtgtgtgtgtgtgaaagagagggagagaggaagggaagagaggacgtaataatgtgaatttgagttcatgaaaatttttcaataaaataatttaatgtcaggagaattaagcctaatagtctcctaaatcatccatctcttgagcttcagagcagtcctctgaattaatgcctacatgtttgtaaagggtgttcagactgaagccaagattctacctctaaagagatgcaatctcaaatttatctgaagactgtacctctgctctccataaattgacaccatggcccacttaatgaggttaaaaaaaagctaattctgaatgaaaatctgagcccagtggaggaaatattaatgaacaaggtgcagactgaaatataaatttttctgtaataattatgcatatactttagcaaagttctgtctatgttgactttattgctttttggtaagaaatacaactttttaaagtgaactaaactatcctatttccaaactattttgtgtgtgtgcggtttgtttctatgggttctggttttcttggagcatttttatttcattttaattaattaattctgagagctgctgagttgtgtttactgagagattgtgtatctgcgagagaagtctgtagcaagtagctagactgtgcttgacctaggaacatatacagtagattgctaaaatgtctcacttggggaattttagactaaacagtagagcatgtataaaaatactctagtcaagtgctgcttttgaaacaaatgataaaaccacactcccatagatgagtgtcatgattttcatggaggaagttaatattcatcctctaagtatacccagactagggccattctgatataaaacattaggacttaagaaagattaatagactggagtaaaggaaatggacctctgtctctctcgctgtctcttttttgaggacttgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtggtcagtggggctggaataaaagtagaatagacctgcacctgctgtggcatccattcacagagtagaagcaagctcacaatagtgaagatgtcagtaagcttgaatagtttttcaggaactttgaatgctgatttagatttgaaactgaggctctgaccataaccaaatttgcactatttattgcttcttgaaacttatttgcctggtatgcctgggcttttgatggtcttagtatagcttgcagccttgtccctgcagggtattatgggtaatagaaagaaaagtctgcgttacactctagtcacactaagtaactaccattggaaaagcaacccctgccttgaagccaggatgatggtatctgcagcagttgccaacacaagagaaggatccatagttcatcatttaaaaaagaaaacaaaatagaaaaaggaaaactatttctgagcataagaagttgtagggtaagtctttaagaaggtgacaatttctgccaatcaggatttcaaagctcttgctttgacaattttggtctttcagaatactataaatataacctatattataatttcataaagtctgtgcattttctttgacccaggatatttgcaaaagacatattcaaacttccgcagaacactttatttcacatatacatgcctcttatatcagggatgtgaaacagggtcttgaaaactgtctaaatctaaaacaatgctaatgcaggtttaaatttaataaaataaaatccaaaatctaacagccaagtcaaatctgcatgttttaacatttaaaatattttaaagacgtcttttcccaggattcaacatgtgaaatcttttctcagggatacacgtgtgcctagatcctcattgctttagttttttacagaggaatgaatataaaaagaaaatacttaaattttatccctcttacctctataatcatacataggcataattttttaacctaggctccagatagccatagaagaaccaaacactttctgcgtgtgtgagaataatcagagtgagattttttcacaagtacctgatgagggttgagacaggtagaaaaagtgagagatctctatttatttagcaataatagagaaagcatttaagagaataaagcaatggaaataagaaatttgtaaatttccttctgataactagaaatagaggatccagtttcttttggttaacctaaattttatttcattttattgttttattttattttattttattttattttgtgtaatcgtagtttcagagtgttagagctgaaaggaagaagtaggagaaacatgcaaagtaaaagtataacactttccttactaaaccgacatgggtttccaggtaggggcaggattcaggatgactgacagggcccttagggaacactgagaccctacgctgacctcataaatgcttgctacctttgctgttttaattacatcttttaatagcaggaagcagaactctgcacttcaaaagtttttcctcacctgaggagttaatttagtacaaggggaaaaagtacagggggatgggagaaaggcgatcacgttgggaagctatagagaaagaagagtaaattttagtaaaggaggtttaaacaaacaaaatataaagagaaataggaacttgaatcaaggaaatgattttaaaacgcagtattcttagtggactagaggaaaaaaataatctgagccaagtagaagaccttttcccctcctacccctactttctaagtcacagaggctttttgttcccccagacactcttgcagattagtccaggcagaaacagttagatgtccccagttaacctcctatttgacaccactgattaccccattgatagtcacactttgggttgtaagtgactttttatttatttgtatttttgactgcattaagaggtctctagttttttatctcttgtttcccaaaacctaataagtaactaatgcacagagcacattgatttgtatttattctatttttagacataatttattagcatgcatgagcaaattaagaaaaacaacaacaaatgaatgcatatatatgtatatgtatgtgtgtatatatacacacatatatatatatattttttcttttcttaccagaaggttttaatccaaataaggagaagatatgcttagaaccgaggtagagttttcatccattctgtcctgtaagtattttgcatattctggagacgcaggaagagatccatctacatatcccaaagctgaattatggtagacaaaactcttccacttttagtgcatcaacttcttatttgtgtaataagaaaattgggaaaacgatcttcaatatgcttaccaagctgtgattccaaatattacgtaaatacacttgcaaaggaggatgtttttagtagcaatttgtactgatggtatggggccaagagatatatcttagagggagggctgagggtttgaagtccaactcctaagccagtgccagaagagccaaggacaggtacggctgtcatcacttagacctcaccctgtggagccacaccctagggttggccaatctactcccaggagcagggagggcaggagccagggctgggcataaaagtcagggcagagccatctattgcttacatttgcttctgacacaactgtgttcactagcaacctcaaacagacaccatggtgcatctgactcctgaggagaagtctgccgttactgccctgtggggcaaggtgaacgtggatgaagttggtggtgaggccctgggcaggttggtatcaaggttacaagacaggtttaaggagaccaatagaaactgggcatgtggagacagagaagactcttgggtttctgataggcactgactctctctgcctattggtctattttcccacccttaggctgctggtggtctacccttggacccagaggttctttgagtcctttggggatctgtccactcctgatgctgttatgggcaaccctaaggtgaaggctcatggcaagaaagtgctcggtgcctttagtgatggcctggctcacctggacaacctcaagggcacctttgccacactgagtgagctgcactgtgacaagctgcacgtggatcctgagaacttcagggtgagtctatgggacgcttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggataagtaacagggtacagtttagaatgggaaacagacgaatgattgcatcagtgtggaagtctcaggatcgttttagtttcttttatttgctgttcataacaattgttttcttttgtttaattcttgctttctttttttttcttctccgcaatttttactattatacttaatgccttaacattgtgtataacaaaaggaaatatctctgagatacattaagtaacttaaaaaaaaactttacacagtctgcctagtacattactatttggaatatatgtgtgcttatttgcatattcataatctccctactttattttcttttatttttaattgatacataatcattatacatatttatgggttaaagtgtaatgttttaatatgtgtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatctctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattcaccccaccagtgcaggctgcctatcagaaagtggtggctggtgtggctaatgccctggcccacaagtatcactaagctcgctttcttgctgtccaatttctattaaaggttcctttgttccctaagtccaactactaaactgggggatattatgaagggccttgagcatctggattctgcctaataaaaaacatttattttcattgcaatgatgtatttaaattatttctgaatattttactaaaaagggaatgtgggaggtcagtgcatttaaaacataaagaaatgaagagctagttcaaaccttgggaaaatacactatatcttaaactccatgaaagaaggtgaggctgcaaacagctaatgcacattggcaacagcccctgatgcatatgccttattcatccctcagaaaaggattcaagtagaggcttgatttggaggttaaagttttgctatgctgtattttacattacttattgttttagctgtcctcatgaatgtcttttcactacccatttgcttatcctgcatctctcagccttgactccactcagttctcttgcttagagataccacctttcccctgaagtgttccttccatgttttacggcgagatggtttctcctcgcctggccactcagccttagttgtctctgttgtcttatagaggtctacttgaagaaggaaaaacaggggtcatggtttgactgtcctgtgagcccttcttccctgcctcccccactcacagtgacccggaatctgcagtgctagtctcccggaactatcactctttcacagtctgctttggaaggactgggcttagtatgaaaagttaggactgagaagaatttgaaaggcggctttttgtagcttgatattcactactgtcttattaccctgtcataggcccaccccaaatggaagtcccattcttcctcaggatgtttaagattagcattcaggaagagatcagaggtctgctggctcccttatcatgtcccttatggtgcttctggctctgcagttattagcatagtgttaccatcaaccaccttaacttcatttttcttattcaatacctaggtaggtagatgctagattctggaaataaaatatgagtctcaagtggtccttgtcctctctcccagtcaaattctgaatctagttggcaagattctgaaatcaaggcatataatcagtaataagtgatgatagaagggtatatagaagaattttattatatgagagggtgaaaccctcaaaatgaaatgaaatcagacccttgtcttacaccataaacaaaaataaatttgaatgggttaaagaattaaactaagacctaaaaccataaaaatttttaaagaaatcaaaagaagaaaattctaatattcacgttgcagccgttttttgaatttgatatgagaagcaaaggcaacaaaaggaaaaataaagaagtgaggctacatcaaactaaaaaatttccacacaaaaaacaaaacaatgaacaaatgaaaggtgaaccatgaaatggcatatttgcaaaccaaatatttcttaaatattttggttaatatccaaaatatataagaaacacagatgattcaataacaaacaaaaaattaaaaataggaaaataaaaaaattaaaaagaagaaaatcctgccatttatggcagaattgatgaacctggaggatgtaaaactaagaaaaataagcctgacacaaaaagacaaatactacacaaccttgctcatatgtgaaacataaaaaagtcactctcatggaaacagacagtagaggtatggtttccaggggttgggggtgggagaatcaggaaactattactcaaagggtataaaatttcagttatgtgggatgaataaattctagatatctaatgtacagcatcgtgactgtagttaattgtactgtaagtatatttaaaatttgcaaagagagtagatttttttttttttttagatggagttttgctcttgttgtccaggctggagtgcaatggcaagatcttggctcactgcaacctccgcctcctgggttcaagcaaatctcctgcctcagcctcccgagtagctgggattacaggcatgcgacaccatgcccagctaattttgtatttttagtagagacggggtttctccatgttggtcaggctgatccgcctgcctcggccacccaaagggctgggattacaggcgtgagccaccgggcctggccgagagtagatcttaaaagcatttaccacaagaaaaaggtaactatgtgagataatgggtatgttaattagcttgattgtggtaatcatttcacaaggtatacatatattaaaacatcatgttgtacaccttaaatatatacaatttttatttgtgaatgatacctcaataaagttgaagaataataaaaaagaatagacatcacatgaattaaaaaactaaaaaataaaaaaatgcatcttgatgattagaattgcattcttgatttttcagatacaaatatccatttgactgtttactcttttccaaaacaatacaataaattttagcactttatcttcattttccccttcccaatctataattatatatatatatattttagatattttgtatagttttactccctagattttctagtgttattattaaatagtgaagaaatgtttacacttatgtacaaaatgttttgcatgcttttcttcatttctaacattctctctaagtttattctatttttttctgattatccttaatattatctctttctgctggaaatacattgttacttttggtttatctaaaaatggcttcattttcttcattctaaaatcatgttaaattaataccactcatgtgtaagtaagatagtggaataaatagaaatccaaaaactaaatctcactaaaatataataatgtgatatataaaaatatagcttttaaatttagcttggaaataaaaaacaaacagtaattgaacaactatactttttgaaaagagtaaagtgaaatgcttaactgcatataccacaatcgattacacaattaggtgtgaaggtaaaattcagtcacgaaaaaactagaataaaaatatgggaagacatgtatataatcttagagataacactgttatttaattatcaacccaaagtagaaactatcaagggagaaataaattcagtcaacaataaaagcatttaagaagttattctaggctgggagcggtggctcacacctgcaattgcagcactttgggaggcctagacaggcggatcacgacgtcaggagttcaagatcagcctggccaacatagtgaaacctcatcgctactaaaaatataaaaacttagcctggcgtggtggcaggcatgtgtaatcccagcaatttgggaggctgaggcaggagaatcgcttgatcctgggaggcagaggttgcagtgagccaagattgtgccactgcattccagcccaggtgacagcatgagactccgtcacaaaaaaaaaagaaaaaaaaaaggggggggggagcggtggagccaagatgaccgaataggaacagctccagtctatagctcccatcgtgagtgacgcagaagacgggtgatttctgcatttccaactgaggtaccaggttcatctcacagggaagtgccaggcagtgggtgcaggacagtaggtgcagtgcactgtgcatgagccaaagcagggcgaggcatcacctcacccgggaagcacaaggggtcagggaattccctttcctagtcaaagaaaagggtgacagatggcacctggaaaatcgggtcactcccgccctaatactgcgctcttccaacaagcttaacaaatggcacaccaggagattatatcccatgcctggctcagagggtcctacgcccatggagcctcgctcattgctagcacagcagtctgaggtcaaactgcaaggtggcagtgaggctgggggaggggtgcccaccattgtccaggcttgagcaggtaaacaaagccgcctggaagctcgaactgggtggagcccaccacagctcaaggaggcctgcctgcctctgtaggctccacctctaggggcagggcacagacaaacaaaagacaacaagaacctctgcagacttaaatgtccctgtctgacagctttgaagagagtagtggttctcccagcacatagcttcagatctgagaacaggcagactgcctcctcaagtgggtccctgacccccgagtagcctaactgggaggcatcccccagtaggggcagactgacacctcacatggctggtactcctctaagacaaaacttccagaggaatgatcaggcagcagcatttgcggttcaccaatatccactgttctgcagccaccgctgttgatacccaggaaaacagcttctggagtggacctccagtaaactccaacagacctgcagctgagggtcctgactgttagaaggaaaactaacaaacagaaaggacatccacaccaaaaacccatctgtacatcgccatcatcaaagaccaaaggtagataaaaccataaagatggggaaaaagcagagcagaaaaactggacactctaaaaatgagagtgcctctcctcctccaaagtaacgcagctcctcaccagcaatggaacaaagctgggcagagaatgactttgacgagttgagagaggaaggcttcagaagatcaaactactccaagctaaaggaggaagttcgaacaaacggcaaagaagtaaaaaactttgaaaaaaaattagatgaatggataactagaataaccaatgcacagaagtccttaaaggacctgatggagctgaaaaccaaggcaggagaactacgtgacaaatacacaagcctcagtaaccgatgagatcaactggaagaaagggtatcaatgacgaaagatgaaatgaatgaaatgaagcatgaagagaagtttagagaaaaaagaataaaaagaaacgaacaaagcctccaagaaatatgggactatgtgaaaagaccaaatctacatctaattggtgtagctgaaagtgatggggagaatggaaccaagttggaaaacactctgcaggatattatccaggagaacttccccaatctagcaaggcaagcccaaattcacattcaggaaatacagagaacgccacaaagatactcctagagaaaagcaactccaagacacataactgtcagattcaccaaagttgaaatgaaggaaaaaatgttaagggcagccagagagaaaggtcgggttacccacaaagggaagcccatcagactaacagctgatctatcggcagaaactctacaagccagaagaaagtgggggccaatattcaacattgttaaagaaaagaattttcaacccagaatttcatatccagccaaactaagcttcataagtgaaggagaaataaaatcctttacagacaagcaaatgctgagagattttgtcaccaccaggcctgccctacaagagctcctgaaggaagcactaaacatggaaaggaacaactagtatcagccactgcaaaaacatgccaaattgtaaagaccatcaaggctaggaagaaactgcatcaacgagcaaaataaccagctaacatcataatgacaggatcaaattcatacataacaatactcaccttaaatgtaaataggctaaatgctccaattaaaagacacagactggcaaattggataaggagtcaagacccatctgtgttctgtattcaggaaacccatctcacgtgcagagacacacataggctcgaaataaaaggatggaggaatatctaccaagcaaatggaaaacaaaaaaaggcaggggttgcaatcctagtctctgataaaacagattttaaaccaacaaagatcaaaagagacaaagaaggccattacataatggcaaagggatctattcaagaagaagaactaactatactaaatatatatgcacccaatacaggagcacccagattcataaaacaagtcctgagtgacctacaaagagacttagatgcccacacaataataatgggagactttaacaccccactgtcaacattagacagatcaacgagacagaaagttaacaaggatatccaggaattggactcagctctgcaccaagcagacctaatagacatctacagaactctccaccccaaatcaacagaatatacattcttttcagcaccacaccacacctattccaaaactgaccacatagttggaagtaaagctctcctcagcaaatgtaaaagaacagaaactataacaaactgtctctcagaccacagtgcaatcaaactagaactcaggattaagaaactcactcaaaaccactcagctacatggaaactgaacagcctgctcctgaatgactactgggtacataacaaaatgaaggcagaaataaagatgttctttgaaaccaacgagaacaaagacacaacacaccagaatctctgagacacattcaaagcagtgtgtagagggaaatttatagcactaaatgcccacaagggaaagcaggaaagatctaaaattgacaccctaacatcacaattaaaaaactagagaagcaggagcaaacacattcaaaagctaacagaagacaagaaataactaagatcagagcagaagtgaaggacatagagacacaaaaaaacccttcaaaaaaatcaatgaatccagaagctgtttttttgaaaagatcaacaaaattgatagactgctagcaagactaataaagaagaaaagagagaagaatcaaatagacgcaataaaaaatgacacggggtatcaccactgatcccacagaaatacaaactaccgtcagagaatactataaacacctctacgcaaataaactagaaaatctagaagaaatggataaattcctcgacacatacactctgccaagactaaaccaggaagaagttgtatctctgaatagaccaataacaggctctgaaattgaggcaataattaatagcttatcaaccaaaaaaagtccgggaccagtaggattcatagccgaattctaccagaggtacaaggaggagctggtaccattccttctgaaactattccaatcaatagaaaaagagggaatcctccctaactcattttatgaggccagcatcatcctgataccaaagcctgacagagacacaacaaaaaaagagaatgttacaccaatatccttgatgaacattgatgcaaaaatcctcaataaaatactggcaaactgatccaccatgatcaagtgggcttcatccctgccatgcaaggctggttcaacatacgaaaatcaataaacataatccagcatataaacagaaccaaagacacaaaccatatgattatctcaatagatgcagaaaaggcctttgacaaaattcaacaacgcttcatgctaaaaactctcaataaattaggtattgatgggacatatctcaaaataataagagctatctatgacaaacccacagccaatatcatactgagtggacaaaaactggaagcattccctttgaaaactggcacaaggcagggatgccctctctcaccactcctattcaacatagtgttgtaagttctggccagggcaatcaggcaggagaaggaaataaagggcattcaattaggaaaagaggaagtgaaattgtccctgtttgcagatgacatgattgtatatctagaaaaccccattgtctcagcccaaaatctccttaagctgataagcaacttcagcaaagtctcaggatataaaatcagtgtgcaaaaatcacaagtattcctatgcaccaataacagacaaacagagagccaaatcatgagtgaactcccattcacaattgcttcaaagagaataaaatacctaggaatccaacttacaagggatgtgaaggacctcttcaaggagaactacaaaccactgctcaatgaaataaaagaggatacaaacaaatggaagaacattccatgctcatgggtaggaagaatcaatatcgtgaaaatggtcatactgcccaaggtaatttatagattcaatgccatccccatcaagctaccaatgactttcttcacagaactggaaaaaactactttaaagttcatatggaaccaaaaaagagcccacatcaccaaggcaatcctaagccaaaagaacaaagctggaggcatcacgctacctgacttcaaactatactacaatgctacggtaaccaaaacagcatggtactggtaccaaaacagagatctagaccaatggaacagaacagagccctcagaaataatgccgcatatctacaactatctgatctttgacaaacctgagagaaacaagcaatggggaaaggattccctatttaataaatggtgctgggaaaactggctagccatatgtagaaagctgaaactggatcccttccttacaccttatacaaaaattaattcaagatggattaaagacttacatgttagacctaaaaccataaaaaccctagaaaaaaacctaggcaataccattcaggacataggcatgggcaaggacttcatgtctaaaacaccaaaagcaatggcaacaaaagacaaaatggacaaacgggatctaattaaactaaagagcttctgcacagctaaagaaactaccatcagagtgaacaggcaacctacaaaatgggagaaaatttttgcaatctactcatctgacaaagggctaatatccagaatctacaatgaactcaaacaaatttacaagaaaaaacaaacaaccccatcaaaaagtgggcaaaggatatgaacagacacttcgcaaaagaagacatttatgtaatcaaaaaacacatgaaaaaatgctcatcatcactagccatcagagaaatgcaaatcaaaaccacaatgagataccatctcacaccagttagaatggcgatcattaaaaagtcaggaaacaacaggtgctggagaggatgtggagaaacaggaacaacttttacactgttggtgggactgtaaactagttcaaccattgcggaagtcagtgtggcaattcctcaggaatctagaactagaaataccatttgacccagccatcccattactgggtacatacccaaaggattataaatcatgctgctataaagacacatgcacacgtatgtttattgcagcactattcacaatagcaaagacttggaaccaacccaaatgtccaacaacgatagactggattaagaaaatgtggcacatatacaccatggaatactatgcagccataaaaaatgatgagttcatgtcctttgtagggacatggatgaagctggaaactatcattctcagcaaactatcacaaggagaataaaccaaacaccgcatgttctcactcataggtgggaattgaacaatgagaacacatggacacatgaagaggaacatcacactctggggactgttatggggtggggggcaggggcagggatagcactaggagatatacctaatgctaaatgacgagttaatgggtgcagcacaccaacatggcacatgtatacatatataacaaacctgcatgttgtgcacatgtaccctaaaacttgaagtataataataaaaaaaagttatcctattaaaactgatctcacacatccgtagagccattatcaagtctttctctttgaaatagacagaaatttagtgttttctcagtcagttaac[seqidno:19]#已经在人类β-球蛋白lcr中鉴定了五个5’超敏感位点(hs)位点(hs1-hs5)和一个3’hs位点(stamatoyannopoulos等人(2001))。5’hs1-hs4是脱氧核糖核酸酶i超敏感位点,hs2和hs3元件是lcr内最强大的单一元件(ellis等人,欧洲分子生物学组织期刊(emboj.)(1996),15:562-568;collis等人,欧洲分子生物学组织期刊(emboj.)(1990),9:233-240),如由许多团队所证实的。在转基因小鼠的βyac的背景中缺失hs2严重影响hs位点形成以及每个发育阶段中所有人类β-球蛋白基因的表达(bungert等人,分子细胞生物学(mol.cellbiol.)(1999),19:3062-3072)。据报道,缺失hs2最低限度地降低了卵黄囊衍生的红细胞中胚胎εy和βhi球蛋白基因的表达(ley等人,纽约科学学术年报(ann.n.y.acad.sci.)(1998),850:45-53;hug等人,分子细胞生物学(mol.cellbiol.)(1996),26:2906-2912)。hs2主要作为增强子起作用。在某些实施方式中,β-球蛋白lcr区包含hs2区。在非限制性实例中,β-球蛋白lcr区包含hs2区、hs3区和hs4区。在某些实施方式中,在β-球蛋白lcr区内的hs2区、hs3区和hs4区是连续的。在一个非限制性实施方式中,β-球蛋白lcr区基本上由hs2区、hs3区和hs4区组成。在另一个实施方式中,β-球蛋白lcr区在hs3区和hs4区之间的接合处包含两个引入的gata-1结合位点。hs3区可以位于hs2区和hs4区之间。hs2区的长度和序列可以变化。hs2区的长度可以为约400bp至约1000bp,例如约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp,或约900bp至约1000bp。在一个非限制性实施方式中,hs2区的长度为860bp,在一个非限制性实例中,hs2区具有在以下提供的seqidno:9所示的核苷酸序列:gtatatgtgtatatatatatatatatattcaggaaataatatattctagaatatgtcacattctgtctcaggcatccattttctttatgatgccgtttgaggtggagttttagtcaggtggtcagcttctccttttttttgccatctgccctgtaagcatcctgctggggacccagataggagtcatcactctaggctgagaacatctgggcacacaccctaagcctcagcatgactcatcatgactcagcattgctgtgcttgagccagaaggtttgcttagaaggttacacagaaccagaaggcgggggtggggcactgaccccgacaggggcctggccagaactgctcatgcttggactatgggaggtcactaatggagacacacagaaatgtaacaggaactaaggaaaaactgaagcttatttaatcagagatgagatgctggaagggatagagggagctgagcttgtaaaaagtatagtaatcattcagcaaatggttttgaagcacctgctggatgctaaacactattttcagtgcttgaatcataaataagaataaaacatgtatcttattccccacaagagtccaagtaaaaaataacagttaattataatgtgctctgtcccccaggctggagtgcagtggcacgatctcagctcactgcaacctccgcctcccgggttcaagcaattctcctgcctcagccaccctaatagctgggattacaggtgcacaccaccatgccaggctaatttttgtactttttgtagaggcagggtatcaccatgttgtccaagatggtcttgaactcctgagctccaagcagtccacccacctcagcctcccaaagtgct[seqidno:9]在某些实施方式中,hs2区的长度为约840bp。在某些实施方式中,hs2区的长度为约650bp(例如646bp)。在某些实施方式中,hs2区的长度为约420bp(例如423bp)。hs3区的长度和序列可以变化。hs3区的长度可以为约200bp至约1400bp,例如约200bp至约300bp、约300bp至约400bp、约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp、约900bp至约1000bp、约1000bp至约1100bp、约1100bp至约1200bp、约1200bp至约1300bp,或约1300bp至约1400bp。在某些实施方式中,hs3区的长度为约1300bp。在一个非限制性实施方式中,hs3区的长度为1308bp。在一个非限制性实施方式中,hs3区的长度为1301bp。在一个非限制性实例中,hs3区具有在以下提供的seqidno:5所示的核苷酸序列:aagctttcattaaaaaaagtctaaccagctgcattcgactttgactgcagcagctggttagaaggttctactggaggagggtcccagcccattgctaaattaacatcaggctctgagactggcagtatatctctaacagtggttgatgctatcttctggaacttgcctgctacattgagaccactgacccatacataggaagcccatagctctgtcctgaactgttaggccactggtccagagagtgtgcatctcctttgatcctcataataaccctatgagatagacacaattattactcttactttatagatgatgatcctgaaaacataggagtcaaggcacttgcccctagctgggggtataggggagcagtcccatgtagtagtagaatgaaaaatgctgctatgctgtgcctcccccacctttcccatgtctgccctctactcatggtctatctctcctggctcctgggagtcatggactccacccagcaccaccaacctgacctaaccacctatctgagcctgccagcctataacccatctgggccctgatagctggtggccagccctgaccccaccccaccctccctggaacctctgatagacacatctggcacaccagctcgcaaagtcaccgtgagggtcttgtgtttgctgagtcaaaattccttgaaatccaagtccttagagactcctgctcccaaatttacagtcatagacttcttcatggctgtctcctttatccacagaatgattcctttgcttcattgccccatccatctgatcctcctcatcagtgcagcacagggcccatgagcagtagctgcagagtctcacataggtctggcactgcctctgacatgtccgaccttaggcaaatgcttgactcttctgagctcagtcttgtcatggcaaaataaagataataatagtgtttttttatggagttagcgtgaggatggaaaacaatagcaaaattgattagactataaaaggtctcaacaaatagtagtagattttatcatccattaatccttccctctcctctcttactcatcccatcacgtatgcctcttaattttcccttacctataataagagttattcctcttattatattcttcttatagtgattctggatattaaagtgggaatgaggggcaggccactaacgaagaagatgtttctcaaagaagccattctccccacatagatcatctcagcagggttcaggaagataaaggaggatcaaggtcgaaggtaggaactaaggaagaacactgggcaagtggatcc[seqidno:5]在某些实施方式中,hs3区的长度为约850bp(例如845bp)。在某些实施方式中,hs3区的长度为约280bp至约290bp(例如280bp和287bp)。类似地,hs4区的长度和序列可以变化。hs4区的长度可以为约200bp至约1200bp,例如约200bp至约300bp、约300bp至约400bp、约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp、约900bp至约1000bp、约1000bp至约1100bp或约1100bp至约1200bp。在某些实施方式中,hs4区的长度为约1.0kb或更多。在某些实施方式中,hs4区的长度为约1.1kb。在某些实施方式中,hs4区的长度为约1150bp(例如,1153bp)。在一个非限制性实施方式中,hs4区的长度为1065bp。在一个非限制性实例中,hs4区具有在以下提供的seqidno:6所示的核苷酸序列:tgagccccttttcctctaactgaaagaaggaaaaaaaaaatggaacccaaaatattctacatagtttccatgtcacagccagggctgggcagtctcctgttatttcttttaaaataaatatatcatttaaatgcataaataagcaaaccctgctcgggaatgggagggagagtctctggagtccaccccttctcggccctggctctgcagatagtgctatcaaagccctgacagagccctgcccattgctgggccttggagtgagtcagcctagtagagaggcagggcaagccatctcatagctgctgagtgggagagagaaaagggctcattgtctataaactcaggtcatggctattcttattctcacactaagaaaaagaatgagatgtctacatataccctgcgtcccctcttgtgtactggggcccccaagagctctctaaaagtgatggcaaagtcattgcgctagatgccatcccatctattataaacctgcatttgtctccacacaccagtcatggacaataaccctcctcccaggtccacgtgcttgtctttgtataatactcaagtaatttcggaaaatgtattctttcaatcttgttctgttattcctgtttcaatggcttagtagaaaaagtacatacttgttttcccataaattgacaatagacaatttcacatcaatgtctatatgggtcgttgtgtttgctgtgtttgcaaaaactcacaataactttatattgttactactctaagaaagttacaacatggtgaatacaagagaaagctattacaagtccagaaaataaaagttatcatcttgaggcctcagctttctaggaataatatcaatattacaaaatttaatctaacaattatgaacagcaatgagataatatgtacaaagtacccagacctatgtggtagagcatcaaggaagcgcattgcggagcagttttttgtttgtttgtttttgtattctgtttcgtgaggcaaggtttcactctgctgtccaggctggagtgcagtggcaagatcatgtctcactgcagccttgac[seqidno:6]在一个非限制性实例中,hs4区具有在以下提供的seqidno:7所示的核苷酸序列:tgagccccttttcctctaactgaaagaaggaaaaaaaaaatggaacccaaaatattctacatagtttccatgtcacagccagggctgggcagtctcctgttatttcttttaaaataaatatatcattaaatgcataaataagcaaaccctgctcgggaatgggagggagagtctctggagtccaccccttctcggccctggctctgcagatagtgctatcaaagccctgacagagccctgcccattgctgggccttggagtgagtcagcctagtagagaggcagggcaagccatctcatagctgctgagtgggagagagaaaagggctcattgtctataaactcaggtcatggctattcttattctcacactaagaaaaagaatgagatgtctacatataccctgcgtcccctcttgtgtactggggcccccaagagctctctaaaagtgatggcaaagtcattgcgctagatgccatcccatctattataaacctgcatttgtctccacacaccagtcatggacaataaccctcctcccaggtccacgtgcttgtctttgtataatactcaagtaatttcggaaaatgtattctttcaatcttgttctgttattcctgtttcaatggcttagtagaaaaagtacatacttgttttcccataaattgacaatagacaatttcacatcaatgtctatatgggtcgttgtgtttgctgtgtttgcaaaaactcacaataactttatattgttactactctaagaaagttacaacatggtgaatacaagagaaagctattacaagtccagaaaataaaagttatcatcttgaggcctcagctttctaggaataatatcaatattacaaaattaatctaacaattatgaacagcaatgagataatatgtacaaagtacccagacctatgtggtagagcatcaaggaagcgcattgcggagcagttttttgtttgtttgtttttgtattctgtttcgtgaggcaaggtttcactctgctgtccaggctggagtgcagtggcaagatcatgtctcactgcagccttgacac[seqidno:7]在某些实施方式中,hs4区的长度小于约1.0kb,例如小于约900bp、小于约700bp、小于约600bp或小于约500bp。在某些实施方式中,hs4区的长度小于约500bp。在某些实施方式中,hs4区的长度小于约450bp。在一个非限制性实施方式中,hs4区的长度为约446bp。在一个非限制性实例中,hs4区具有在以下提供的seqidno:8所示的核苷酸序列:tggaacccaaaatattctacatagtttccatgtcacagccagggctgggcagtctcctgttatttcttttaaaataaatatatcatttaaatgcataaataagcaaaccctgctcgggaatgggagggagagtctctggagtccaccccttctcggccctggctctgcagatagtgctatcaaagccctgacagagccctgcccattgctgggccttggagtgagtcagcctagtagagaggcagggcaagccatctcatagctgctgagtgggagagagaaaagggctcattgtctataaactcaggtcatggctattcttattctcacactaagaaaaagaatgagatgtctacatataccctgcgtcccctcttgtgtactggggtccccaagagctctctaaaagtgatggcaaagtcattgcgctagatgccatcccatct[seqidno:8]在某些实施方式中,hs4区的长度为约280bp(例如283bp)。在某些实施方式中,hs4区的长度为约240bp(例如,243bp)。在某些非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:9、seqidno:20或seqidno:21所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6、seqidno:7或seqidno:8所示的核苷酸序列的hs4区。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:9所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:7所示的核苷酸序列的hs4区,如图1所示。在另一个非限制性实施方式中,β-球蛋白lcr区还包含hs1区,即β-球蛋白lcr区包含hs1区、hs2区、hs3区和hs4区。在某些实施方式中,在β-球蛋白lcr区内的hs1区、hs2区、hs3区和hs4区是连续的。在一个非限制性实施方式中,β-球蛋白lcr区基本上由hs1区、hs2区、hs3区和hs4区组成。在另一个实施方式中,β-球蛋白lcr区在hs3区和hs4区之间的接合处包含两个引入的gata-1结合位点。hs1区的长度和序列可以变化。在某些实施方式中,hs1区的长度为约300bp至约1500bp,例如长度为约300bp至约1100bp。在某些实施方式中,hs1区的长度为约1.0kb或更多,例如约1.1kb、约1.2kb、约1.3kb、约1.4kb或约1.5kb。在某些实施方式中,hs1区的长度为约1.1kb。在一个非限制性实例中,hs1区的长度为1074bp。在一个非限制性实例中,hs1区域具有在以下提供的seqidno:2所示的核苷酸序列:aagtaaacttccacaaccgcaagcttattgaggctaaggcatctgtgaaggaaagaaacatctcctctaaaccactatgctgctagagcctcttttctgtactcaagcctcattcagacactagtgtcaccagtctcctcatatacctattgtattttcttcttcttgctggtttagtcatgttttctgggagcttaggggcttattttattttgttttgttttctaatcaacagagatgggcaaacccattatttttttctttagacttgggatggtgatagctgggcagcgtcagaaactgtgtgtggatatagataagagctcggactatgctgagctgtgatgagggagggacctagccaaaggcagtgagagtcagaatgctcctgctattgccttctcagtccccacgcttggtttctacacaagtagatacatagaaaaggctataggttagtgtttgagagtcctgcatgagttagttgctcagaaatgcccgataaatatgttatgtgtgtttatgtatatatatgttttatatatatatatgtgtgtgtgtgtgtgtgtgtgtgttgtgtttacaaatatgtgattatcatcaaaacgtgagggctaaagtgaccagataacttgcaggtcctaggataccaggaaaataaattacattccaaaaatttaactgagactttaaaaaaaaaaaaaaaaaaaaaaaaaaaaccagtgatccatggacacagggaggggaacatcacacactggggcctgttgggggtggggggctaggggaaggatagcattaggagaaatacctaatgtagatgacgggttgatgggtgcagcaaaccaccatggcacatgtaccccagaacttaaagcatattaaaaaaacagtgatcataaaagaagctcaaatttaactataagagacggaatggctcccacaattcttaactataatcttacagaatattctcattgaatagaagtatgcttatcattagagatttggacagccaggaaagcacagaaaaaaaaaaaaggagctctgttgccttatagcctagaggtgttt[seqidno:2]在某些实施方式中,hs1区的长度小于约1.0kb,例如约400bp至约700bp、约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp,或约900bp至约1.0kb。在某些实施方式中,hs1区的长度小于约700bp。在某些实施方式中,hs1区的长度为约600bp。在一个非限制性实施方式中,hs1区的长度为602bp。在一个非限制性实例中,hs1区具有在以下提供的seqidno:3所示的核苷酸序列:ggcatctgtgaaggaaagaaacatctcctctaaaccactatgctgctagagcctcttttctgtactcaagcctcattcagacactagtgtcaccagtctcctcatatacctattgtattttcttcttcttgctggtttagtcatgttttctgggagcttaggggcttattttattttgttttgttttctaatcaacagagatgggcaaacccattatttttttctttagacttgggatggtgatagctgggcagcgtcagaaactgtgtgtggatatagataagagctcggactatgctgagctgtgatgagggagggacctagccaaaggcagtgagagtcagaatgctcctgctattgccttctcagtccccacgcttggtttctacacaagtagatacatagaaaaggctataggttagtgtttgagagtcctgcatgagttagttgctcagaaatgcccgataaatatgttatgtgtgtttatgtatatatatgttttatatatatatatgtgtgtgtgtgtgtgtgtgtgtgttgtgtttacaaatatgtgattatcatcaaaacgtgagggctaaagtgaccagataacttgcagg[seqidno:3]在某些实施方式中,hs1区的长度小于约500bp。在某些实施方式中,hs1区的长度为约490bp。在一个非限制性实施方式中,hs1区的长度为489bp。在一个非限制性实例中,hs1区具有在以下提供的seqidno:4所示的核苷酸序列:ggcatctgtgaaggaaagaaacatctcctctaaaccactatgctgctagagcctcttttctgtactcaagcctcattcagacactagtgtcaccagtctcctcatatacctattgtattttcttcttcttgctggtttagtcatgttttctgggagcttaggggcttattttattttgttttgttttctaatcaacagagatgggcaaacccattatttttttctttagacttgggatggtgatagctgggcagcgtcagaaactgtgtgtggatatagataagagctcggactatgctgagctgtgatgagggagggacctagccaaaggcagtgagagtcagaatgctcctgctattgccttctcagtccccacgcttggtttctacacaagtagatacatagaaaaggctataggttagtgtttgagagtcctgcatgagttagttgctcagaaatgcccgataaatatgttatgtgtgtttatgt[seqidno:4]最近的研究表明hs2不是红细胞系特异性的,而是在其它细胞系和谱系中表达(参见实施例3和图7),并且也存在于未分化的人类胚胎干细胞中(chang等人,干细胞综述(stemcellreviews)(2013),9:397-407)。由于hs2的非红细胞系活性,含有hs2的球蛋白载体可对于其在临床治疗中安全使用带来风险,例如用于治疗地中海贫血和镰状细胞患者。在某些实施方式中,β-球蛋白lcr区不包含hs2区。在某些实施方式中,β-球蛋白lcr区不包含hs2的核心序列。hs2的核心序列提供位置无关的高水平表达。另外,hs2的核心序列维持hs2的增强子活性。例如,hs2的核心序列增强了球蛋白基因(例如人类β-球蛋白基因)的转录。另外,hs2的核心序列包含一个或多个对于普遍存在的以及组织特异性的(例如红细胞系特异性的)蛋白质(例如转录因子)的结合位点或结合基序,其包括但不限于ap1蛋白家族(例如nf-e2)gata-1(也称为“nf-e1”或“nfe1”)、krüppel-样锌指蛋白(例如普遍存在的蛋白spl和yy1,和红细胞系限制因子红细胞系krüppel-样因子(erythroid-restrictedfactorerythroidkrüppel-likefactor)(eklf)),以及碱性螺旋-环-螺旋(bhlh)蛋白(e盒)(例如usf和tal1)的成员。需要ap1结合位点用于增强和诱导(moi和kan(1990);ney等人,(1990);talbot和grosveld(1991))。此外,nf-e2的结合可导致在hs2处体外重构建的染色质的破坏(armstrong和emerson(1996))。gata-1结合位点的突变可导致在转基因小鼠中的hs2的增强子活性降低(caterina等人,(1994))。尽管ap1(例如ap1/nf-e2)和gata1结合位点两者对于核心功能都是重要的,但缺乏这些因子的小鼠没有示出受损的球蛋白基因表达(weiss等人,1994)。在某些实施方式中,β-球蛋白lcr区不包含hs2的核心序列的全长。在某些实施方式中,hs2区的核心序列是人类hs2的核心序列。在一个非限制性实施方式中,人类hs2的核心序列包含对于ap1蛋白家族(例如nf-e2)的成员的一对串联的结合位点(称为“ap1/nf-e2”结合位点)(例如gctgagtca和gatgagtca)、一个对于kruppel-样锌指蛋白的结合位点(例如agggtgtgt)、一个gata-1结合位点(例如ctatct)和三个e盒(canntg,例如cagatg和cacctg)。在一个非限制性实施方式中,β-球蛋白lcr区不包含具有在以下提供的seqidno:20所示的核苷酸序列的人类hs2的388bp核心序列的全长:taagcttcagtttttccttagttcctgttacatttctgtgtgtctccattagtgacctcccatagtccaagcatgagcagttctggccaggcccctgtcggggtcagtgccccacccccgccttctggttctgtgtaaccttctaagcaaaccttctggctcaagcacagcaatgctgagtcatgatgagtcatgctgaggcttagggtgtgtgcccagatgttctcagcctagagtgatgactcctatctgggtccccagcaggatgcttacagggcagatggcaaaaaaaaggagaagctgaccacctgactaaaactccacctcaaacggcatcataaagaaaatggatgcctgagacagaatgtgacatattctagaatatatt[seqidno:20]seqidno:20所示的核苷酸序列对应于seqidno:19(基因库登录号ng_000007.3)的核苷酸16671位至17058位。在seqidno:20中,一个具有gctgagtca的核苷酸序列的ap1/nf-e2结合位点位于175位至183位,一个具有gatgagtca的核苷酸序列的ap1/nf-e2结合位点位于185位至193位,一个具有agggtgtgt的核苷酸序列的对于krüppel-样锌指蛋白的结合位点位于205位至213位,每个具有cagatg的核苷酸序列的两个e盒位于217位至222位与278位至283位,一个具有ctatct的核苷酸序列的gata-1结合位点位于246位至251位,一个具有cacctg的核苷酸序列的e盒位于306位至311位。在一个非限制性实施方式中,β-球蛋白lcr区不包含具有在以下提供的seqidno:21所示的核苷酸序列的人类hs2的387bp核心序列的全长:taagcttcagtttttccttagttcctgttacatttctgtgtgtctccattagtgacctcccatagtccaagcatgagcagttctggccaggcccctgtcggggtcagtgccccacccccgccttctggttctgtgtaaccttctaagcaaaccttctggctcaagcacagcaatgctgagtcatgatgagtcatgctgaggctagggtgtgtgcccagatgttctcagcctagagtgatgactcctatctgggtccccagcaggatgcttacagggcagatggcaaaaaaaaggagaagctgaccacctgactaaaactccacctcaaacggcatcataaagaaaatggatgcctgagacagaatgtgacatattctagaatatatt[seqidno:21]在seqidno:21中,一个具有gctgagtca的核苷酸序列的ap1/nf-e2结合位点位于175位至183位,一个具有gatgagtca的核苷酸序列的ap1/nf-e2结合位点位于185位至193位,一个具有agggtgtgt的核苷酸序列的对于krüppel-样锌指蛋白的结合位点位于204位至212位,每个具有cagatg的核苷酸序列的两个e盒位于216位至221位与277位至282位,一个具有ctatct的核苷酸序列的gata-1结合位点位于245位至250位,一个具有cacctg的核苷酸序列的e盒位于305位至310位。在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含hs2的核心序列。包含hs2的核心序列的hs2区可以在长度和序列上变化。在非限制性实例中,包含hs2的核心序列的hs2区的长度为约400bp至约1000bp,例如,约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp,或约900bp至约1000bp。在一个非限制性实施方式中,β-球蛋白lcr区不包含840bp的hs2区(例如,在us7,541,179中公开的球蛋白载体tns9中包含的hs2区)。在一个非限制性实施方式中,球蛋白lcr区不包含860bp的hs2区。在一个非限制性实施方式中,β-球蛋白lcr区不包含约650bp的hs2区。在一个非限制性实例中,β-球蛋白lcr区不包含646bp的hs2区(例如,在球蛋白载体lentiglobintm中包含的hs2区,也称为“β87”)。在一个非限制性实施方式中,β-球蛋白lcr区不包含约420bp的hs2区。在一个非限制性实例中,β-球蛋白lcr区不包含423bp的hs2区(例如,在sadelain等人,美国国家科学院院刊(美国)(proc.natl.acad.sci.(usa)),(1995),92:6728-6732中公开的球蛋白载体中包含的hs2区)。在某些实施方式中,β-球蛋白lcr区不包含维持hs2的增强子活性的hs2区。在某些实施方式中,β-球蛋白lcr区不包含能够增强球蛋白基因(例如,人类β-球蛋白基因)的转录的hs2区。在非限制性实例中,β-球蛋白lcr区不包含hs2区,与天然hs2区相比,该hs2区增强球蛋白基因(例如,人类β-球蛋白基因)的转录的能力不小于60%、不小于70%、不小于80%、不小于90%或不小于95%。在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含以下结合位点中的一个、两个、三个、四个、五个、六个或七个:两个(一对串联)ap1/nf-e2结合位点(例如gctgagtca和gatgagtca)、一个对于kruppel-样锌指蛋白的结合位点(例如agggtgtgt)、一个gata-1结合位点(例如ctatct)和三个e盒(canntg,例如cagatg和cacctg)。在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含六个上述的结合位点。例如,在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含两个ap1/nf-e2结合位点、一个对于kruppel-样锌指蛋白的结合位点、一个gata-1结合位点和两个而不是三个e盒。在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含一个而不是两个ap1/nf-e2结合位点、一个对于kruppel-样锌指蛋白的结合位点、一个gata-1结合位点和三个e盒。在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含两个ap1/nf-e2结合位点、一个gata-1结合位点和三个e盒并且不包含一个对于kruppel-样锌指蛋白的结合位点。在某些实施方式中,β-球蛋白lcr区不包含hs2区,该hs2区包含两个ap1/nf-e2结合位点、一个对于kruppel-样锌指蛋白的结合位点和三个e盒并且不包含一个gata-1结合位点。在某些实施方式中,β-球蛋白lcr区包含hs1区、hs3区和hs4区,并且不包含hs2区。在某些实施方式中,β-球蛋白lcr区内的hs1区、hs3区和hs4区是连续的。在一个非限制性实施方式中,β-球蛋白lcr区基本上由hs1区、hs3区和hs4区组成。在另一个实施方式中,β-球蛋白lcr区包含在hs3区和hs4区之间的接合处的两个引入的gata-1结合位点。hs3区可以位于hs1区和hs4区之间。在某些非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:2、seqidno:3、seqidno:4、seqidno:22或seqidno:23所示的核苷酸序列的hs1区,具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6、seqidno:7或seqidno:8所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs2区。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:2所示的核苷酸序列的hs1区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs2区,如图2所示。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:3所示的核苷酸序列的hs1区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:8所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs2区,如图3所示。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:4所示的核苷酸序列的hs1区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:8所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs2区。在某些实施方式中,β-球蛋白lcr区不包含hs1区或hs2区。在某些实施方式中,β-球蛋白lcr区不包含hs1的核心序列。hs1的核心序列维持hs1的活性,例如增强子活性,或作为促进剂或调节元件起作用以束连其它hs区(例如hs2-hs4)的增强子活性。此外,hs1的核心序列包含一个或多个对于普遍存在的以及组织特异性的(例如红细胞系特异性的)蛋白质(例如转录因子)的结合位点或结合基序,其包括但不限于gata-1和krüppel-样锌指蛋白(例如红细胞系限制因子eklf)。在某些实施方式中,β-球蛋白lcr区不包含hs1的核心序列的全长。在某些实施方式中,hs1区的核心序列是人类hs1的核心序列。在一个非限制性实施方式中,人类hs1的核心序列包含两个gata-1结合位点(例如,ttatct和ctatca),和一个对于eklf的结合位点(例如,ccacacaca)。在某些实施方式中,β-球蛋白lcr区不包含人类hs1的286bp核心序列的全长。在一个非限制性实施方式中,人类hs1的286bp核心序列具有在以下提供的seqidno:22所示的核苷酸序列:ctgagcaactaactcatgcaggactctcaaacactaacctatagccttttctatgtatctacttgtgtagaaaccaagcgtggggactgagaaggcaatagcaggagcattctgactctcactgcctttggctaggtccctccctcatcacagctcagcatagtccgagctcttatctatatccacacacagtttctgacgctgcccagctatcaccatcccaagtctaaagaaaaaaataatgggtttgcccatctctgttgattagaaaacaaaacaaaataaa[seqidno:22]在seqidno:22中,一个具有ttatct的核苷酸序列的gata-1结合位点位于173位至178位,一个具有ctatca的核苷酸序列的gata-1结合位点位于210位至215位,并且一个具有ccacacaca的对于eklf的结合位点位于183位至191位。在另一个非限制性实施方式中,人类hs1的286bp核心序列具有在以下提供的seqidno:23所示的核苷酸序列:ctgagcaactaatcatgcaggactctcaaacactaacctatagccttttctatgtatctacttgtgtagaaaccaagcgtggggactgagaaggcaatagcaggagcattctgactctcactgcctttagctaggcccctccctcatcacagctcagcatagtcctgagctcttatctatatccacacacagtttctgacgctgcccagctatcaccatcccaagtctaaagaaaaaaataatgggtttgcccatctctgttgattagaaaacaaaacaaaataaa[seqidno:23]seqidno:23所示的核苷酸序列对应于seqidno:19(基因库登录号ng_000007.3)的21481位至21766位的核苷酸。在seqidno:23中,一个具有ttatct的核苷酸序列的gata-1结合位点位于173位至178位、一个具有ctatca的核苷酸序列的gata-1结合位点位于210位至215位,并且一个具有ccacacaca的核苷酸序列的对于eklf的结合位点位于183位至191位。在某些实施方式中,β-球蛋白lcr区不包含hs1区,该hs1区包含hs1的核心序列。包含hs1的核心序列的hs1区可以在长度和序列上变化。在非限制性实例中,包含hs1的核心序列的hs1区的长度为约300bp至约1200bp,例如约300bp至约400bp、约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp、约900bp至约1000bp、约1000bp至约1100bp,或约1100bp至约1200bp。在一个非限制性实施方式中,β-球蛋白lcr区不包含约1.0kb的hs1区。在一个非限制性实施方式中,β-球蛋白lcr区不包含约1.1kb的hs1区。在某些实施方式中,β-球蛋白lcr区不包含hs1区,该hs1区维持hs1的活性,例如增强子活性,或作为促进剂或调节元件起作用以束连其它hs区(例如hs2-hs4)的增强子活性。在某些实施方式中,β-球蛋白lcr区不包含能够增强球蛋白基因(例如,人类β-球蛋白基因)的转录的hs1区。在非限制性实例中,β-球蛋白lcr区不包含hs1区,与天然hs1区相比,该hs1区增强球蛋白基因(例如,人类β-球蛋白基因)的转录的能力不小于60%、不小于70%、不小于80%、不小于90%,或不小于95%。在非限制性实例中,β-球蛋白lcr区不包含hs1区,与天然hs1区相比,该hs1区束连hs2-hs4中的一个或多个的增强子活性的能力不小于60%、不小于70%、不小于80%、不小于90%,或不小于95%。在某些实施方式中,β-球蛋白lcr区不包含hs1区,该hs1区包含以下结合位点中的一个、两个或三个:两个gata-1结合位点(例如,ttatct和ctatca)和一个对于eklf的结合位点(例如ccacacaca)。在某些实施方式中,β-球蛋白lcr区不包含hs1区,该hs1区包含两个上述的结合位点。例如,在某些实施方式中,β-球蛋白lcr区不包含hs1区,该hs1区包含两个gata-1结合位点并且不包含一个对于eklf的结合位点。在某些实施方式中,β-球蛋白lcr区不包含hs1区,该hs1区包含一个而不是两个ap1/nf-e2结合位点和一个对于eklr的结合位点。在某些实施方式中,β-球蛋白lcr区包含hs3区和hs4区,并且β-球蛋白lcr区不包含hs1区或hs2区。在某些实施方式中,在β-球蛋白lcr区内的hs3区和hs4区是连续的。在一个非限制性实施方式中,β-球蛋白lcr区基本上由hs3区和hs4区组成。在另一个实施方式中,β-球蛋白lcr区在hs3区和hs4区之间的接合处包含两个引入的gata-1结合位点。hs3区可以位于球蛋白基因或其功能部分与hs4区之间。在某些实施方式中,β-球蛋白lcr区包含具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6、seqidno:7或seqidno:8所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs1区或hs2区。在一个非限制性实施方式中,β-球蛋白lcr区包含具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6所示的核苷酸序列的hs4区,并且β-球蛋白lcr区不包含hs1区或hs2区,如图4所示。球蛋白基因根据本发明公开的主题,表达盒包含球蛋白基因或其功能部分。球蛋白基因可以是β-球蛋白基因、γ-球蛋白基因或δ-球蛋白基因。在某些实施方式中,表达盒包含人类β-球蛋白基因。根据本发明公开的主题,人类β-球蛋白基因可以是野生型人类β-球蛋白基因、包含一个或多个内含子序列缺失的缺失人类β-球蛋白基因,或编码至少一个抗镰状化氨基酸残基的突变的人类β-球蛋白基因。在一个非限制性实施方式中,本发明公开的表达盒包含野生型人类β-球蛋白基因。在另一个实施方式中,本发明公开的表达盒包含在密码子87处编码苏氨酸至谷氨酰胺的突变的人类βa-球蛋白基因(βa-t87q)。在γ-球蛋白链的87位处的谷氨酰胺残基增强了γ链相对于β链的抗镰状化活性,同时保留β链的成体氧结合的特性(nagel等人,美国国家科学院院刊(proc.natl.acad.sci.),美国(u.s.a.),(1979),76:670-672)。在某些实施方式中,球蛋白基因的功能部分具有与对应的野生型参照多核苷酸序列至少80%、至少90%、至少95%或至少99%的同一性。启动子和增强子根据本发明公开的主题,表达盒还可以包含β-球蛋白启动子。在某些实施方式中,β-球蛋白启动子位于球蛋白基因或其功能部分与β-球蛋白lcr区之间。β-球蛋白启动子的长度和序列可以变化。在某些实施方式中,β-球蛋白启动子的长度为约100bp至约1600bp,例如长度为约200bp至约700bp、约100bp至约200bp、约200bp至约300bp、约300bp至约400bp、约400bp至约500bp、约500bp至约600bp、约600bp至约700bp、约700bp至约800bp、约800bp至约900bp、约900bp至约1000bp、约1000bp至约1100bp、约1100bp至约1200bp、约1200bp至约1300bp、约1300bp至约1400bp、约1400bp至约1500bp,或约1500bp至约1600bp。在某些实施方式中,β-球蛋白启动子是长度为约130bp、约613bp、约265bp或约1555bp的人类β-球蛋白启动子。在一个实施方式中,β-球蛋白启动子是长度为约613bp的人类β-球蛋白启动子。在一个非限制性实例中,人类β-球蛋白启动子具有在以下提供的seqidno:10所示的核苷酸序列:aagcaatagatggctctgccctgacttttatgcccagccctggctcctgccctccctgctcctgggagtagattggccaaccctagggtgtggctccacagggtgaggtctaagtgatgacagccgtacctgtccttggctcttctggcactggcttaggagttggacttcaaaccctcagccctccctctaagatatatctcttggccccataccatcagtacaaattgctactaaaaacatcctcctttgcaagtgtatttacgtaatatttggaatcacagcttggtaagcatattgaagatcgttttcccaattttcttattacacaaataagaaattgatgcactaaaagtggaagagttttgtctaccataattcagctttgggatatgtagatggatctcttcctgcgtctccagaatatgcaaaatacttacaggacagaatggatgaaaactctacctcagttctaagcatatcttctccttatttggattaaaaccttctggtaagaaaagaaaaaaaatatatatatatatgtgtatatatacacacatacatatacatatatatgcattcatttgttgttgtttttcttaatttgctcatg[seqidno:10]在一个实施方式中,β-球蛋白启动子是长度为约265bp的人类β-球蛋白启动子。在一个非限制性实例中,人类β-球蛋白启动子具有seqidno:11所示的核苷酸序列:aagcaatagatggctctgccctgacttttatgcccagccctggctcctgccctccctgctcctgggagtagattggccaaccctagggtgtggctccacagggtgaggtctaagtgatgacagccgtacctgtccttggctcttctggcactggcttaggagttggacttcaaaccctcagccctccctctaagatatatctcttggccccataccatcagtacaaattgctactaaaaacatcctcctttgcaagtgtatttac[seqidno:11]另外或可选地,本发明公开的表达盒还可以包含人类β-球蛋白3’增强子。在某些实施方式中,人类β-球蛋白3’增强子位于球蛋白基因或其功能部分的上游。在某些实施方式中,β-球蛋白3’增强子的长度为约500bp至约1000bp,例如长度为约500bp至约600bp、约600bp至约700bp、约700bp至约800bp,或约800bp至约900bp。在一个实施方式中,人类β-球蛋白3’增强子的长度为约879bp。在一个实例中,人类β-球蛋白3’增强子具有seqidno:12所示的核苷酸序列。taggtattgaataagaaaaatgaagttaaggtggttgatggtaacactatgctaataactgcagagccagaagcaccataagggacatgataagggagccagcagacctctgatctcttcctgaatgctaatcttaaacatcctgaggaagaatgggacttccatttggggtgggcctatgatagggtaataagacagtagtgaatatcaagctacaaaaagccccctttcaaattcttctcagtcctaacttttcatactaagcccagtccttccaaagcagactgtgaaagagtgatagttccgggagactagcactgcagattccgggtcactgtgagtgggggaggcagggaagaagggctcacaggacagtcaaaccatgccccctgtttttccttcttcaagtagacctctataagacaacagagacaactaaggctgagtggccaggcgaggagaaaccatctcgccgtaaaacatggaaggaacacttcaggggaaaggtggtatctctaagcaagagaactgagtggagtcaaggctgagagatgcaggataagcaaatgggtagtgaaaagacattcatgaggacagctaaaacaataagtaatgtaaaatacagcatagcaaaactttaacctccaaatcaagcctctacttgaatccttttctgagggatgaataaggcataggcatcaggggctgttgccaatgtgcattagctgtttgcagcctcaccttctttcatggagtttaagatatagtgtattttcccaaggtttgaactagctcttcatttctttatgttttaaatgcactgacctcccacattccctttttagtaaaatattcagaaataatttaaatacatcattg[seqidno:12]此外,本发明公开的表达盒还可以包含至少一个红细胞系特异性增强子。本发明公开的表达盒允许以红细胞系特异性方式表达球蛋白基因(例如,人类β-球蛋白基因)。红细胞系特异性增强子可以以红细胞系特异性方式增强球蛋白基因的表达。例如,红细胞系特异性增强子在非红细胞系组织中缺乏增强子活性。特别地,对于缺乏主要作为表达增强子起作用的hs2区的β-球蛋白lcr区,添加一个或多个红细胞系特异性增强子可以补偿hs2区的增强活性。此外,本发明公开的红细胞系特异性增强子不降低或减少包含表达盒的载体的滴度。红细胞系特异性增强子的长度可以变化,例如约100bp至约200bp、约100bp至约120bp、约120bp至约140bp、约140bp至约200(例如,约140bp至约150bp、约150bp至约160bp、约160bp至约170bp、约170bp至约180bp、约180bp至约190bp,或约190bp至约200p)。在某些实施方式中,红细胞系特异性增强子的长度为约140bp至约200bp。在一个非限制性实施方式中,红细胞系特异性增强子的长度为152bp,其具有在以下提供的seqidno:13所示的核苷酸序列:tctcccacgccctggtctcagcttggggagtggtcagaccccaatggcgataaactctggcaactttatctgtgcactgcaggctcagccccaacagctttagctttcacaagcaggcaggggaagggaaacacatatctccagatatgagg[seqidno:13]在一个非限制性实施方式中,红细胞系特异性增强子的长度为157bp,其具有在以下提供的seqidno:14所示的核苷酸序列:ctaaacccctcccccaccctagccccaagcttcatcttagctccactcctgaccctatccagctaaaggtccccacccagctcctgcctatctagtcattgcatatggcaagacttgaaagtcctatctcaaagcagcagaattatcagctacgact[seqidno:14]在一个非限制性实施方式中,红细胞系特异性增强子的长度为141bp,其具有在以下提供的seqidno:15所示的核苷酸序列:ccatcccccagcactccctgcccccacagcccagacttgaccaactcccagctccgcctgggacttccagatatggggccccacccttgcaggccttggggacgctgaagatattgactatctgcgtgccggaaaagggtg[seqidno:15]在一个非限制性实施方式中,红细胞系特异性增强子的长度为171bp,其具有在以下提供的seqidno:16所示的核苷酸序列:aaaggctgggggtgggagtagcggatttgaagcacttgttggcctacagaggtgtggcaagcagagcacctcagaactcaggcgtactgcccgccgcccgagccctgcgagggccgatagcgagggtgtggcccttatctgcacccagcagagcgccggcggggtacggtc[seqidno:16]在一个非限制性实施方式中,红细胞系特异性增强子的长度为195bp,其具有在以下提供的seqidno:17所示的核苷酸序列:cagttgcctcagctgagtatgtcttctaaagataatgtcgattgtgtatggctgatgggattctaggaccaagcaagaggtttttttttttcccccacatacttaacgtttctatatttctatttgaattcgactggacagttccatttgaattatttctctctctctctctctctgacacattttatcttgcca[seqidno:17]可以通过本领域已知的任何合适的方法鉴定和确定红细胞系特异性增强子。红细胞系特异性增强子可以位于β-球蛋白lcr区的3’ltr(下游)或5’ltr(下游)处。在一个实施方式中,至少一个红细胞系特异性增强子位于β-球蛋白lcr区的5’ltr中,例如,hs3区的上游。表达盒可以包含一个、两个、三个、四个或五个红细胞系特异性增强子。在一个实施方式中,表达盒包含一个红细胞系特异性增强子。在另一个实施方式中,表达盒包含两个红细胞系特异性增强子。在又一个实施方式中,表达盒包含三个红细胞系特异性增强子。在某些实施方式中,表达盒包含四个红细胞系特异性增强子。在非限制性实施方式中,表达盒包含五个红细胞系特异性增强子。绝缘子根据本发明公开的主题,表达盒包含至少一个上述绝缘子。在某些实施方式中,本发明公开的表达盒包含至少一个包含seqidno:18所示的ctcf结合位点序列的绝缘子,例如但不限于包含seqidno:24或seqidno:25的绝缘子,比如具有seqidno:1所示的核苷酸序列的绝缘子(即,绝缘子a1)。在各种非限制性实施方式中,可以将绝缘子并入或插入到整合到细胞基因组中的本发明公开的表达盒的区域中的一个或两个ltr或其它地方中。在一个实施方式中,绝缘子位于表达盒的3’末端。在一个实施方式中,绝缘子位于表达盒的5’末端。在一个实施方式中,表达盒包含两个具有seqidno:1所示的核苷酸序列的绝缘子,其中一个绝缘子位于3’末端,且另一个绝缘子位于表达盒的5’末端。本发明公开的绝缘子具有强大的增强子阻断活性。在某些实施方式中,绝缘子除了增强子阻断活性之外还具有屏障活性。本发明公开的绝缘子充分降低了与病毒载体相关联的插入诱变和遗传毒性的风险。此外,当将本发明公开的绝缘子并入载体中时,绝缘子没有不利地影响载体的载体滴度。在某些实施方式中,绝缘子(例如,绝缘子a1)增加球蛋白基因或其功能部分的体内表达。出于说明而非限制的目的,图1至图4示出根据本发明公开的主题的某些实施方式的包含示例性表达盒的重组载体。图1示出包含本发明公开的包含人类βa-t87q球蛋白基因的表达盒的重组载体,该人类βa-t87q球蛋白基因可操作地连接到β-球蛋白lcr区,其包含860bp的hs2区(例如,具有seqidno:9所示的核苷酸序列的hs2区)、1301bp的hs3区(例如,具有seqidno:5所示的核苷酸序列的hs3区)和1065bp的hs4区(例如,具有seqidno:7所示的核苷酸序列的hs4区)。图2示出一个根据本发明公开的主题的一个实施方式的包含表达盒的示例性重组载体。图2示出包含本发明公开的包含人类βa-t87q球蛋白基因的表达盒的重组载体,该人类βa-t87q球蛋白基因可操作地连接到β-球蛋白lcr区,其包含1.1kb的hs1区(例如,具有seqidno:2所示的核苷酸序列的hs1区)、1301bp的hs3区(例如,具有seqidno:5所示的核苷酸序列的hs3区)和1065bp的hs4区(例如,具有seqidno:6所示的核苷酸序列的hs4区)。图3示出一个根据本发明公开的主题的一个实施方式的包含表达盒的示例性重组载体。图3示出包含本发明公开的包含人类βa-t87q球蛋白基因的表达盒的重组载体,该人类βa-t87q球蛋白基因可操作地连接到β-球蛋白lcr区,其包含602bp的hs1区(例如,具有seqidno:3所示的核苷酸序列的hs1区)、1301bp的hs3区(例如,具有seqidno:5所示的核苷酸序列的hs3区)和446bp的hs4区(例如,具有seqidno:8所示的核苷酸序列的hs4区)。图4示出一个根据本发明公开的主题的一个实施方式的包含表达盒的示例性重组载体。图4示出包含本发明公开的包含人类βa-t87q球蛋白基因的表达盒的重组载体,该人类βa-t87q球蛋白基因可操作地连接到β-球蛋白lcr区,其包含1301bp的hs3区(例如,具有seqidno:5所示的核苷酸序列的hs3区)和1065bp的hs4区(例如,具有seqidno:6所示的核苷酸序列的hs4区)。图4中示出的表达盒还包含以下五个红细胞系特异性增强子(在图4中示出为“ee5”):一个具有seqidno:13所示的核苷酸序列的红细胞系特异性增强子、一个具有seqidno:14所示的核苷酸序列的红细胞系特异性增强子、一个具有seqidno:15所示的核苷酸序列的红细胞系特异性增强子、一个具有seqidno:16所示的核苷酸序列的红细胞系特异性增强子,和一个具有seqidno:17所示的核苷酸序列的红细胞系特异性增强子。如图1至图4所示,每个表达盒包含具有seqidno:1所示的核苷酸序列的的绝缘子(即绝缘子a1)。此外,如图1至图4所示,每个表达盒包含位于人类β-球蛋白基因的上游的879bp的人类β-球蛋白3’增强子。此外,如图1至图4所示,每个重组载体在载体的3’长末端重复(ltr)(例如,3’ltr中的3’至r区)中包含土拨鼠肝炎后调节元件(wpre)和牛生长激素聚腺苷酸化信号。iii.载体、核酸酶和crispr-cas系统本发明公开的主题提供包含上述表达盒的载体和递送系统(例如,非天然存在的或工程化的核酸酶或crispr-cas系统)。载体和递送系统是用于稳定引入球蛋白基因(例如人类β-球蛋白))到广泛范围的靶细胞的基因组中以提高细胞中球蛋白(人类β-球蛋白)的表达的合适的递送载体。在某些实施方式中,载体是用于将上述表达盒引入或转导到宿主细胞(例如,造血干细胞、胚胎干细胞、诱导的多能干细胞或生血内皮细胞)的基因组中的逆转录病毒载体(例如,γ逆转录病毒或慢病毒)。在某些实施方式中,逆转录病毒载体包含表达盒,该表达盒包含一个上述绝缘子,例如绝缘子a1。绝缘子可以位于表达盒的3’或5’末端。在一个实施方式中,绝缘子位于表达盒的3’末端。在逆转录和载体整合期间,位于3’末端的绝缘子被拷贝到表达盒的5’末端。所得的拓扑结构放置绝缘子的拷贝在位于整合的病毒的5’ltr和3’ltr的基因组区之间,和来自5’ltr的增强子活性,以及内部封装启动子(internalpackagepromoter),但在3’ltr中不含有增强子。这种拓扑结构可以降低遗传毒性,从而导致减少肿瘤形成和增加动物存活。在某些实施方式中,重组载体在载体的3’长末端重复(ltr)(例如,载体的3’ltr中的3’至r区)中还包含土拨鼠肝炎后调节元件(wpre)。在某些实施方式中,重组载体在载体的3’长末端重复(ltr)(例如,载体的3’ltr中的3’至r区)中除了wpre之外,还包含牛生长激素聚腺苷酸化信号。治疗性球蛋白载体的基本特征是达到足以有效转导患者细胞的高滴度。由于它们的大负载,包含基因、启动子、增强子和/或lcr元件,球蛋白慢病毒载体固有地具有低滴度,使其制造复杂化并限制其临床用途。通过并入另外的基因组元件比如绝缘子而进一步增加了载体的大小,进一步加重该问题。wpre可以提高重组载体的滴度。向wpre添加牛生长激素聚腺苷酸化信号可进一步提高重组载体的滴度。在某些实施方式中,wpre和牛生长激素聚腺苷酸化信号不包含在表达盒内,并且因此,不转移到以重组载体转导的细胞中。用于增强球蛋白慢病毒载体产生的这些元件的并入对于产生更高的滴度以及因此用于本申请中描述的载体的临床有用性是必需的。在一个非限制性实例中,可以将本发明公开的表达盒克隆到逆转录病毒载体中,并且可以从其内源启动子、从逆转录病毒长末端重复或从替代的内部启动子驱动表达。逆转录病毒载体和适当的封装线的组合也是合适的,其中衣壳蛋白对于感染人类细胞将是有作用的。各种双嗜性产生病毒的细胞系是已知的,包括但不限于pa12(miller等人(1985),分子细胞生物学(mol.cell.biol.),5:431-437);pa317(miller等人(1986),分子细胞生物学(mol.cell.biol.),6:2895-2902);和crip(danos等人(1988),美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),85:6460-6464)。非双嗜性颗粒也是合适的,例如,用vsvg、rd114或galv包衣假型化的颗粒,以及本领域已知的任何其它颗粒。合适的转导方法还包括将细胞与生产细胞直接共培养,例如通过bregni等人(1992),血液(blood),80:1418-1422的方法,或者单独用病毒上清液培养,或者用含或不含适当的生长因子和聚阳离子的浓缩的载体原种培养,例如通过xu等人(1994),实验血液学(exp.hemat.),22:223-230;和hughes等人(1992),临床调查周刊(j.clin.invest.),89:1817的方法。转导病毒载体可以用于在宿主细胞(例如,造血干细胞、胚胎干细胞或诱导的多能干细胞)中表达球蛋白基因(例如,人类β-球蛋白基因)。优选地,所选择的载体表现出高的感染效率和稳定的整合和表达(参见例如cayouette等人,人类基因治疗(humangenetherapy)(1997),8:423-430;kido等人,现代眼科研究(currenteyeresearch)(1996),15:833-844;bloomer等人,病毒学杂志(journalofvirology)(1997),71:6641-6649;naldini等人,科学(science)(1996),272:263-267;和miyoshi等人,美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),94:10319,1997)。可以使用的其它病毒载体包括例如腺病毒、慢病毒和腺相关病毒载体、牛痘病毒、牛乳头状瘤病毒或疱疹病毒,比如eb病毒(epstein-barrvirus)(也参见例如,miller,人类基因治疗(humangenetherapy)(1990),15-14;friedman,科学(science)(1989),244:1275-1281;eglitis等人,生物技术(biotechniques),6:608-614,1988;tolstoshev等人,生物技术的最新观点(currentopinioninbiotechnology)(1990),1:55-61;sharp,柳叶刀(thelancet)(1991),337:1277-1278;cornetta等人,核酸研究和分子生物学(nucleicacidresearchandmolecularbiology)(1987),36:311-322;anderson,科学(science)(1984),226:401-409;moen,血细胞(bloodcells)(1991),17:407-416;miller等人,生物技术(biotechnology)(1989),7:980-990;legallasalle等人,科学(science)(1993),259:988-990;和johnson,美国胸科杂志(chest)(1995),107:77s-83s)的载体。逆转录病毒载体是特别有利开发的,并且已经在临床背景中使用(rosenberg等人,新英格兰医学杂志(n.engl.j.med.)(1990),323:370;anderson等人,第5,399,346号美国专利)。对于有效递送和整合的要求使得逆转录病毒载体适合于转导本发明公开的表达盒。逆转录病毒载体可以衍生自逆转录病毒科的三个属:γ-逆转录病毒(也称为c型鼠逆转录病毒或瘤逆转录病毒)、慢病毒和泡沫病毒(spumavirus)(也称为泡沫病毒(foamyvirus))。详细描述用于产生复制缺陷型逆转录病毒颗粒的分子方法的几个综述是可用的(cornetta等人(2005);cockrell&kafri(2007))。编码治疗性转移基因或cdna的载体本身保留了使得能够在封装细胞系中封装在病毒颗粒中、逆转录并整合所需的最小病毒序列。封装细胞表达对于组装含有载体序列的感染性重组颗粒所需的必需的结构蛋白和酶,以及其在转导的细胞中逆转录和整合所需的装置。虽然所有逆转录病毒载体类型的制造方面都遵循相同的通则,但是γ-逆转录病毒、慢病毒和泡沫病毒载体在其一些内在的生物学性质上是不同的。γ逆转录病毒,包括原型小鼠白血病病毒(mlv),有效地感染许多细胞类型,但不能在感染后不进入s期的细胞中整合。相比之下,慢病毒及其载体衍生物可以转导非分裂细胞(follenzi&naldini,2002;salmon&trono,2002),因为它们具有转移到细胞核并在不存在细胞分裂的情况下整合的能力(lewis&emerman,1994;goff,2001)。慢病毒载体的另一个基本属性是如球蛋白慢病毒载体(may等人,2000)所建立的其相对的基因组稳定性,这与基于mlv的球蛋白载体的基因组不稳定性相对照(leboulch等人,1994;sadelain等人,1995)。慢病毒和泡沫载体还提供更大的封装能力(kumar等人,2001;rethwilm,2007)。所有三种载体类型已经成功地用于细胞因子活化的hsc的转导(miyoshi等人,1999;josephson等人,2002;leurs等人,2003)。这三种载体系统的整合模式不同。逆转录病毒的整合模式是半随机的,并且在大约三分之二的所有整合事件中偏向基因及其附近(schroder等人,2002;wu等人,2003;mitchell等人,2004;depalma等人,2005;trobridge等人,2006)。然而,在它们的确切分布中存在微妙和可能的显著差异。γ逆转录病毒倾向于整合转录的基因的上游,而慢病毒和慢病毒载体靶向整个转录的基因序列。泡沫载体看起来不太易于基因内整合(trobridge等人,2006)。在一个实施方式中,包含表达盒的载体是慢病毒载体。载体可以衍生自人类免疫缺陷病毒-1(hiv-1)、人类免疫缺陷病毒-2(hiv-2)、猿猴免疫缺陷病毒(siv)、猫免疫缺陷病毒(fiv)、牛免疫缺陷病毒(biv)、jd病毒(jembranadiseasevirus)(jdv)、马传染性贫血病毒(eiav)、羊关节炎脑炎病毒(caev)等。在一个非限制性实施方式中,慢病毒载体是hiv载体。基于hiv的构建体在人类细胞转导中是最有效的。载体整合的半随机模式使患者在载体反式激活邻近原癌基因时暴露于插入瘤形成的风险。这可导致克隆扩增(ott等人,2006;cavazzana-calvo等人,2010)、脊髓发育不良(stein等人,2010)或白血病(hacein-bey-abina等人,2003、2008;howe等人,2008)。利用非天然存在或工程化的核酸酶(包括但不限于锌指核酸酶(znf)、大范围核酸酶、转录激活子样效应因子核酸酶(talen))或crispr-cas系统,靶向的基因递送策略可以减少或甚至消除使用逆转录病毒载体固有的插入瘤形成的担忧。真核细胞利用两个截然不同的dna修复机制来响应dna双链断裂(dsb):同源重组(hr)和非同源端部接合(nhej)。hr修复装置的激活取决于细胞周期状态,并且限于s期和g2期;相比之下,nhej途径在整个细胞周期中是有活性的。机制上,hr是无误差的dna修复机制,因为它需要同源模板来修复受损的dna链。另一方面,nhej是独立于模板的修复机制,由于在修复期间的dna端部处理导致dna断裂位点处的插入或缺失(moynahan&jasin,2010),该修复机制是不精确的。由于其基于同源性的机制,hr已被用作工具来位点特异性地工程化不同物种的基因组。从治疗性角度来看,hr已经成功地用于修复突变的基因,从而为单基因疾病的细胞介导的治疗提供有希望的方法(porteus等人,2006)。通过hr的基因靶向需要使用在目标转移基因/靶位点侧面的两个同源臂。通常,标准质粒dna已经用于递送连同转移基因的5kb~10kb的同源臂用于正和负选择。该方法通常用于在小鼠胚胎干(mes)细胞中敲除/敲入基因(capecchi,2005;图2b)。在人类细胞中,使用该方法允许基因靶向的效率在10-6的数量级,这低于mes细胞中,并且在治疗上不实用。通过使用特异性稀有切割核酸内切酶(rare-cuttingendonucleases),在靶位点处引入dna双链断裂(dsb),可以增加hr效率,导致正确的基因靶向增加超过1,000倍(jasin,1996)。该现象的发现促使开发在不同物种的基因组中产生位点特异性dsb的方法。在过去十年中已经为此目的设计了各种嵌合酶,即锌指核酸酶(zfn)、大范围核酸酶和转录激活子样效应因子核酸酶(talen)。zfn是含有基于zf的dna结合结构域(dbd)和foki核酸酶结构域的模块嵌合蛋白(porteus&carroll,2005)。dbd通常由三个zf结构域组成,每个具有3-碱基对特异性;foki核酸酶结构域提供dna切口活性,其通过两个侧边的zfn靶向。由于dbd的模块化性质,原则上可以靶向基因组中的任何位点。然而,由于单个zfn可以结合并使dna产生切口,所以存在大量脱靶效应的可能,导致nhej通路的激活,其可以引入插入/缺失,或以非特异性方式整合靶向载体。最近报道了专性foki结构域,仅在它们形成杂二聚体时,才可以使它们各自的dna链产生切口(doyon等,2011)。使用此类专性zfn可以减少该方法的遗传毒性效应。大范围核酸酶(mn)/归巢核酸内切酶(he)是识别和切割真核基因组中具有低切割频率的大dna位点(14bp-40bp)的dsdna核酸酶(paques&duchateau,2007)。尽管这限制了潜在的靶位点,但mn-dna结构已被用作一种指导,以特异性修饰dna相互作用的残基,以便改变mn特异性(marcaida等人,2010)。已经成功地工程化了i-crel,以产生靶向人类xpc和rag1基因的嵌合大范围核酸酶,并且i-crel已经显示出激发哺乳动物细胞中的hr活性,而没有明显的遗传毒性(redondo等人,2008;grizot等人,2009)。该方法的遗传毒性将需要与zfn和tale核酸酶的遗传毒性进行比较。talen是类似的zfn,除了dbd衍生自转录激活子样效应因子(tale),tale是由植物病原性细菌所使用的有害因子(herbers,1992)。taledbd是模块化的,并且它由34个残基重复组成,且其dna特异性由重复的数量和顺序确定(herbers,1992)。每个重复通过仅两个残基结合靶序列中的单个核苷酸(boch,2011)。zfn技术的优势是dbd的快速构建。许多研究已经使用这些嵌合酶,以激发hr用于其靶位点处的基因添加或基因修复(paques&duchateau,2007;urnov等人,2010)。porteus针对来自围绕镰状细胞突变核苷酸的人类hbb的半位点序列设计了zfn(porteus,2006)。当将该zfn与靶向zif268结合位点的zfn组合时,该zfn在嵌合dna靶标处靶向半位点序列并激发hr。在靶向脐带血cd34+细胞中的基因方面已有最新进展。在lombardo等人,2007中报道了使用非整合的慢病毒在这些细胞中递送zfn和供体dna,以靶向ccr5基因。lombardo等人,2007示出在该基因座处的基因添加,在80%的正选细胞中正确靶向。本发明公开的主题提供一种非天然存在或工程化的核酸酶,其包含本发明公开的表达盒,如上所述。合适的核酸酶包括但不限于zfn、大范围核酸酶和talen。本发明公开的核酸酶包含dna结合结构域和核酸酶切割结构域。可以将核酸酶的dna结合结构域工程化以结合到选择的序列,例如预定位点。与天然存在的核酸酶相比,工程化的dna结合结构域可以具有截然不同的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。可以将任何合适的切割结构域可操作地连接到dna-结合结构域以形成核酸酶。例如,可以将锌指蛋白(zfp)dna-结合结构域融合到核酸酶切割结构域以产生zfn-功能实体,其能够通过其工程化的zfpdna结合结构域识别其预期的核酸靶标,并经由核酸酶活性使得dna在zfp结合位点附近切开。参见例如kim等人,美国国家科学院院刊(procnat’lacadsci),美国(usa),(1996),93(3):1156-1160。同样,可以将taledna-结合结构域融合到核酸酶切割结构域以产生talen。参见例如美国公开号20110301073。切割结构域可以与dna结合结构域异源,例如大范围核酸酶dna结合结构域和来自不同核酸酶的切割结构域。异源切割结构域可以从任何核酸内切酶或核酸外切酶获得。从其中可以衍生切割结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见例如,2002-2003年目录(catalog),马萨诸塞州贝弗利的新英格兰生物实验室(newenglandbiolabs,beverly,mass.)和belfort等人(1997),核酸研究(nucleicacidsres.),25:3379-3388。已知另外的切割dna的酶(例如,s1核酸酶;绿豆核酸酶;胰腺脱氧核糖核酸酶i;微球菌核酸酶;酵母ho核酸内切酶;还参见linn等人(编),《核酸酶》(nucleases),冷泉港实验室出版社(coldspringharborlaboratorypress),1993)。这些酶(或其功能区)中的一种或多种可以用作切割结构域和切割半结构域的来源。类似地,切割半结构域可以衍生自对于切割活性需要二聚化的上述核酸酶。通常,如果融合蛋白包含切割半结构域,那么需要两个融合蛋白用于切割。可选地,可以使用包含两个切割半结构域的单一蛋白。两个切割半结构域可以衍生自相同的核酸内切酶(或其功能部分),或者每个切割半结构域可以衍生自不同的核酸内切酶(或其功能部分)。在某些实施方式中,核酸酶包含表达盒,该表达盒包含两个上述绝缘子,例如,两个具有seqidno:1所示的核苷酸序列的绝缘子。两个绝缘子中的一个位于表达盒的3’末端,且另一个绝缘子位于表达盒的5’末端。本发明公开的主题还提供一种非天然存在或工程化的crispr-cas系统,其包含上述表达盒。crispr(成簇的规律间隔短回文重复(clusteredregularlyinterspacedshortpalindromicrepeats))-cas(crispr相关联的)系统是基于可以用于基因组工程的细菌系统的工程化核酸酶系统。crispr-cas系统基于许多细菌和古细菌的获得性免疫应答的一部分。当病毒或质粒侵入细菌时,侵入者的dna片段通过“免疫”应答转化为crisprrna(crrna)。然后,crrna通过部分互补区与另一种类型的称为tracrrna的rna相关联,以将crispr-cas核酸酶引导到与被称为“原间隔区”的靶dna中的crrna同源的区域。crispr-cas核酸酶切割dna以在crrna转录物内包含的20个核苷酸导向序列指定的位点处的dsb处产生平端。crispr-cas核酸酶需要crrna和tracrrna两者用于位点特异性dna识别和切割。已经将该系统工程化,使得可以将crrna和tracrrna组合成一个分子(“单导向rna”);并且可以将单导向rna的crrna等同部分工程化以引导crispr-cas核酸酶靶向任何期望序列(参见jinek等人,科学(science)(2012),337:816-821)。因此,可以将crispr-cas系统工程化,以在基因组中期望的靶标处产生dsb。在某些实施方式中,crispr-cas系统包含crispr-cas核酸酶和单导向rna。crispr-cas核酸酶的合适的实例包括但不限于cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csyl、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csfl、csf2、csf3、csf4、其同源物,或其修饰型式。这些crispr-cas核酸酶是已知的;例如,化脓性链球菌(s.pyogenes)cas9蛋白的氨基酸序列可以在swissprot数据库中登录号q99zw2下找到。在一些实施方式中,crispr-cas核酸酶具有dna切割活性,例如,cas9。在某些实施方式中,crispr-cas核酸酶是cas9。crispr-cas核酸酶可以在靶序列的位置处(例如基因组安全港位点)引导一条或两条链的切割。另外,crispr-cas核酸酶可以在离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500、或更多碱基对内引导一条或两条链的切割。本发明公开的核酸酶和crispr-cas系统允许靶向递送表达盒。在某些实施方式中,本发明公开的crispr-cas系统或本发明公开的核酸酶的dna结合结构域结合到基因组安全港位点。核酸酶或crispr-cas系统在基因组安全港位点产生双链断裂。基因组安全港位点是人类基因组的基因内或基因外区,其能够适应新整合的dna的可预测表达,而对宿主细胞或生物体没有不利影响。有用的安全港必须容许足够的转移基因表达以产生期望水平的载体编码蛋白或非编码rna。基因组安全港位点也必须不使细胞易受恶性转化或改变细胞功能。用于鉴定基因组安全港位点的方法描述于sadelain等人在“用于在人类基因组中整合新dna的安全港(safeharborsfortheintegrationofnewdnainthehumangenome)”,自然评论(naturereviews)(2012),12:51-58;papapetrou等人,“基因组安全港容许在地中海贫血诱导的多能干细胞中高表达β-球蛋白转移基因(genomicsafeharborspermithighβ-globintransgeneexpressioninthalassemiainducedpluripotentstemcells)”,自然生物科技(natbiotechnol)(2011)1月;29(l):73-78中,其全部内容并入本文以供参考。本发明公开的基因组安全港位点符合以下五个标准中的一个或多个(一个、二个、三个、四个或五个):(1)距任何基因的5’末端(例如,距基因的5’末端)至少50kb的距离,(ii)距任何癌症相关基因至少300kb的距离,(iii)在开放的/可接近的染色质结构内(通过用天然或工程化的核酸酶的dna切割来测量),(iv)位于基因转录单元之外,和(v)位于人类基因组的超保守区(ucr)、微小rna或长链非编码rna之外。由于最常见的插入瘤形成事件是相邻肿瘤促进基因的反式激活,前两个标准排除位于基因(特别是癌症相关基因)启动子附近的人类基因组部分,癌症相关基因是人类癌症中功能性密切相关的基因或模型生物体中癌症的密切相关基因的人类同源物。接近mirna基因是一个排除标准,因为mirna在许多细胞过程的调节中时密切相关的,包括细胞增殖和分化。由于转录单元内的载体整合可以通过肿瘤抑制基因功能的丧失或异常剪接的基因产物的产生来破坏基因功能,所以第四(iv)标准排除所有位于转录的基因内部的位点。还排除ucr,其是在多个脊椎动物上高度保守的并且已知富集增强子和外显子以及长链非编码rna的区域。在某些实施方式中,基因组安全港位点是基因外基因组安全港位点。在某些实施方式中,基因组安全港位点位于染色体1上。本发明公开的主题还提供编码上述核酸酶的多核苷酸、包含编码上述核酸酶的多核苷酸的载体、编码上述crispr-cas系统的多核苷酸,以及包含编码上述crispr-cas系统的多核苷酸的载体。核酸酶和编码这些核酸酶的多核苷酸,以及crispr-cas系统和编码crispr-cas系统的多核苷酸可以通过任何合适的方式在体内或离体递送。例如,通过包含编码核酸酶或crispr-cas系统的多核苷酸的载体,可以向细胞(例如,造血干细胞、胚胎干细胞、诱导的多能干细胞或生血内皮细胞)递送本文所述的核酸酶和crispr-cas系统。可以使用任何载体,包括但不限于质粒载体、逆转录病毒载体(例如,γ-逆转录病毒载体、慢病毒载体和泡沫病毒载体)、腺病毒载体、痘病毒载体、疱疹病毒载体和腺相关病毒载体等。在一个实施方式中,包含编码上述核酸酶或上述crispr-cas系统的多核苷酸的载体是慢病毒载体。在一个特定实施方式中,慢病毒载体是非整合型慢病毒载体。非整合型慢病毒载体的实例描述于ory等人(1996),美国国家科学院院刊(proc.natl.acad.sci.),美国(usa),93:11382-11388;dull等人(1998),病毒杂志(j.viral.),72:8463-8471;zuffery等人(1998),病毒杂志(j.viral.),72:9873-9880;follenzi等人(2000),自然遗传学(naturegenetics),25:217-222;美国专利公开号2009/054985。另外,非病毒方法也可以用于细胞中球蛋白基因的表达。例如,可以通过在脂质转染(feigner等人,美国国家科学院院刊(proc.natl.acad.sci.),美国(u.s.a.),84:7413,1987;ono等人,神经科学通讯(neuroscienceletters),17:259,1990;brigham等人,美国医学科学杂志(am.j.med.sci.),298:278,1989;staubinger等人,酶学方法(methodsinenzymology),101:512,1983)、脱唾液酸血清类粘蛋白聚赖氨酸共轭物(wu等人,生物化学杂志(journalofbiologicalchemistry),263:14621,1988;wu等人,生物化学杂志(journalofbiologicalchemistry),264:16985,1989)的存在下施用核酸,或通过在手术条件下的微注射(wolff等人,科学(science),247:1465,1990),而将核酸分子引入细胞。用于基因转移的其它非病毒手段包括使用磷酸钙、deae葡聚糖、电穿孔和原生质体融合的体外转染。脂质体对于dna到细胞中的递送也可以是潜在有益的。将正常基因移植到受试者的受影响的组织中也可以通过将正常核酸转移到离体可培养的细胞类型(例如,自体或异源的原代细胞或其后代)中,之后将细胞(或其子代)注射到靶组织中或全身注射来完成。重组受体也可以使用转座酶衍生或获得。瞬时表达可以通过rna电穿孔获得。iv.细胞可以通过用重组dna或rna构建体(例如,包含上述表达盒的载体或递送系统)转导实质上同质的细胞组合物来完成细胞(例如造血干细胞、胚胎干细胞、诱导的多能干细胞和生血内皮细胞)的遗传修饰。本发明公开的主题提供用上述表达盒转导的细胞、用上述载体转导的细胞,和用上述核酸酶或包含编码核酸酶的多核苷酸的载体转导的细胞,以及用上述carispr-cas系统或包含编码carispr-cas系统的多核苷酸的载体转导的细胞,其被统称为“转导的细胞”。如上所述,载体、核酸酶和crispr-cas系统用于将表达盒转导至细胞以表达球蛋白基因(例如人类β-球蛋白基因)。在某些实施方式中,将转导的细胞施用于受试者以治疗和/或预防造血疾病、病症或病情。本发明公开的绝缘子可以增强表达盒向细胞转导的效率。合适的转导的细胞包括但不限于干细胞、祖细胞和分化细胞。如本文所用,术语“祖代”或“祖细胞”是指具有自我再生能力并分化成更成熟细胞的细胞。与多能干细胞(pluripotentstemcells)和多潜能干细胞(multipotentstemcells)相比,祖细胞的效能(potency)降低。许多祖细胞沿着单个谱系分化,但也可具有相当广泛的增殖能力。在某些实施方式中,转导的细胞是干细胞。当体内施用于特定生物学生态龛(niche)时,干细胞具有分化成适当细胞类型的能力。干细胞是未分化细胞,其能够(1)长期自我再生,或产生原始细胞的至少一个相同拷贝的能力,(2)在单细胞水平上分化为多个特殊细胞类型,并且在某些情况下仅一个特殊细胞类型,以及(3)组织的体内功能性再生。根据其发育潜能将干细胞分类为全能、多能、多潜能和寡/单潜能。如本文所用,术语“多能”是指细胞形成身体或体细胞(即,胚体)的所有谱系的能力。例如,胚胎干细胞是一种能够从三个胚层(外胚层、中胚层和内胚层)中的每一个形成细胞的多能干细胞。如本文所用,术语“多潜能”是指成体干细胞形成一个谱系的多种细胞类型的能力。例如,造血干细胞能够形成血细胞谱系的所有细胞,例如淋巴细胞和脊髓细胞。在某些实施方式中,转导的细胞是胚胎干细胞、骨髓干细胞、脐带干细胞、胎盘干细胞、间充质干细胞、神经干细胞、肝干细胞、胰干细胞、心脏干细胞、肾干细胞和/或造血干细胞。在一个实施方式中,转导的细胞是造血干细胞(hsc)。hsc产生定向造血祖细胞(hpc),其能够在生物体的寿命内产生成熟血细胞的整个谱系。术语“造血干细胞”或“hsc”是指产生生物体的所有血细胞类型的多潜能干细胞,包括脊髓谱系(例如,单核细胞和巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、巨核细胞/血小板、树突状细胞)和淋巴谱系(例如,t细胞、b细胞、nk细胞)。当移植到致命照射的动物或人类中时,造血干细胞和造血祖细胞可以重新增殖红细胞系、嗜中性粒细胞-巨噬细胞,巨核细胞和淋巴样造血细胞库。可以从骨髓、脐带血或外周血中分离或收集hsc。可以根据某些表型或基因型标志物鉴定hsc。例如,hsc可以通过它们的小尺寸、谱系(lin)标志物的缺乏、以活体染料比如罗丹明(rhodamine)123(罗丹明dull,也称为rholo)或赫斯特(hoechst)33342的低染色(侧群体),以及在其表面上各种抗原标志物的存在来鉴定,许多抗原标志物属于分化簇系(例如干细胞因子的受体cd34、cd38、cd90、cd133、cd105、cd45、terl19和c-kit)。在一个实施方式中,转导的细胞是cd34+hsc。在一个实施方式中,转导的细胞是胚胎干细胞。在另一个实施方式中,转导的细胞是诱导的多能干细胞。在又一个实施方式中,转导的细胞是生血内皮细胞。虽然hsc是恢复长期血细胞生成的天然载体,但它们的使用具有一些重要的局限性。第一是它们的相对稀缺性,这在收获的细胞产物过少时,可以最终妨碍自体hsc治疗。第二是进行生物安全性测试(比如整合位点分析)的困难,以及因此选择具有所选整合位点的细胞的困难,因为成体hsc不可体外复制。第三限制是使用现有技术的同源重组实际上是不可能的,从而危及基因矫正的出现。所有这些限制最终都是由于成体hsc不可以在不损失其干细胞效能的情况下进行体外扩增的事实造成的。这些限制解释了病毒载体比如γ-逆转录病毒和慢病毒载体的关键重要性,它们在实现稳定的基因转移方面非常快速和有效。在处理仅以有限量可用的hsc时,这是必要的。使用es和诱导的多能干(ips)细胞用于球蛋白基因治疗描述于moi等人,血液学(haematol),2008年3月1日,93(3):325-330中。胚胎干(es)细胞适于基因靶向和矫正,这需要在不损失多潜能性的情况下无限的体外细胞分裂。chang等人,美国国家科学院院刊(procnatlacadsci),美国(usa)2006,103:1036-1040提供在具有镰状细胞性贫血的小鼠中同源重组方法的可行性的原理证明。takahashi等人,细胞(cell)2006,126:663-676报道了成纤维细胞向胚胎干-样状态的成功的重新编程。通过该反向分化过程获得的细胞称为诱导的多能干(ips)细胞,其通过将胚胎的或幼体的成体本体成纤维细胞培养物暴露于编码4个转录因子的γ-逆转录病毒载体而产生,该转录因子在胚胎干细胞中是生理活性的,但是在分化进展时通常被关闭。培养的细胞形成与es细胞集落相似的集落。这些发现已经被其他人证实并扩展到小鼠和人类成纤维细胞(meissner等人,自然生物技术(natbiotechnol)2007,25:1177-1181;nakagawa等人,自然生物技术(natbiotechnol)2007,26:101-106;okita等人,自然(nature)2007,448:313-317;park等人,自然(nature)2007,451:141-146;takahashi等人,自然实验手册(natprotoc)2007,2:3081-3089;takahashik等人,细胞(cell)2007,131:861-872;wernig等人,自然(nature)2007,448:318-324;yuj等人,科学(science)2007,318:1917-1920)。rudolfjaenisch及其同事在es-样ips细胞中使用同源重组,在镰状细胞病小鼠模型中取得了成功的基因治疗(hanna等人,科学(science)2007,318:1920-1923)。该过程迄今主要应用于从皮肤活检收获的成纤维细胞,然后通过用编码四种干细胞转录因子的逆转录病毒载体转导而将成纤维细胞诱导以变成ips。ips适于通过标准同源重组技术矫正sc突变,并且然后可以将其体外分化成无限量的造血干细胞。整个过程结束于矫正的hsc自体移植到原始小鼠供体中,现在将治愈该小鼠供体的sc疾病。该技术不仅可用于同源重组,而且还可以通过提供一种进行详细的整合位点分析的手段以及在将细胞输注给接受者之前提供足够的体外细胞扩增来增强慢病毒介导的球蛋白基因转移。本发明公开的主题的细胞可以是自体的(“本身的”)或非自体的(“非本身的”,例如同种异体、同基因(syngeneic)或异种的(xenogeneic))。如本文所用,“自体”是指来自相同受试者的细胞。如本文所用,“同种异体”是指遗传上不同于相比细胞的相同物种的细胞。如本文所用,“同基因”是指遗传上相同于相比细胞的不同受试者的细胞。如本文所用,“异种”是指物种上不同于相比细胞的细胞。在某些实施方式中,细胞是自体的,例如,将用本发明公开的表达盒转导的细胞施用于从其收集细胞的受试者,例如,细胞从受试者的骨髓、脐带血、外周血和/或脂肪组织中收集。在某些实施方式中,从受试者的骨髓获得或收集细胞。在某些实施方式中,在用表达盒转导之前,在例如一种或多种细胞因子(例如il-3、il-1α、il-6、kit配体(也称为“干细胞因子(scf)”)和flt-3配体),和/或一个或多个糖蛋白(例如血小板生成素和纤连蛋白)的存在下,预激发细胞。在一个非限制性实例中,在flt-3配体、scf、血小板生成素、白细胞介素-3和纤连蛋白的存在下,预先激发细胞。细胞可以预激发约24小时或更长时间,例如约48小时或约36小时。随后,用本发明公开的表达盒或包含此类表达盒的载体或另一递送系统转导细胞。转导可以在新鲜细胞或冷冻细胞上进行。分离细胞的基因组dna以确定载体拷贝数并通过例如蛋白质印迹(southblot)分析和/或通过定量pcr分析整合位点或整合载体结构。为了定量球蛋白mrna(例如,人类β-球蛋白转基因分析),从细胞中提取总rna。定量引物延伸测定可用于定量球蛋白mrna。v.组合物和制剂本发明公开的主题提供一种药物组合物,其包含如上所述的本发明公开的转导的细胞和药学上可接受的载体。如本文所用,“药学上可接受的载体”包括任何和所有溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗剂和吸收延迟剂等,其是生理上相容的,包括药学上可接受的细胞培养基。药学上可接受的载体可以是适合于肠胃外(例如,静脉内、肌内、皮下或腹膜内)、脊柱或表皮施用(例如,通过注射、输注或植入)。根据施用路径,活性化合物,例如转导的细胞可以涂覆在材料中以保护化合物免受酸和可使化合物失活的其它天然条件的作用。药学上可接受的载体包括无菌水溶液或分散体和用于临时制备无菌可注射溶液或分散体的无菌粉末。使用此类介质和试剂用于药物活性物质是本领域熟知的。除了与转导的细胞不相容的任何常规介质或试剂情况外,其在本发明的药物组合物中的用途是预期的。本发明公开的主题的药物组合物还可以包含一种或多种多肽、多核苷酸、包含多核苷酸的载体、转导的细胞等,如本文所述,其配制在药学上可接受或生理上可接受的溶液中,用于或单独或与一种或多种其它治疗方式组合施用于细胞或动物。如果期望,那么本发明公开的主题的药物组合物可以与其它试剂组合施用,其它试剂包括但不限于细胞因子、生长因子、激素、小分子或各种药物活性剂。没有不利地影响组合物递送预期基因治疗能力的任何另外的试剂可以包括在组合物中。在本发明公开的主题的药物组合物中,药学上可接受的赋形剂和运载体溶液的制剂是本领域普通技术人员所熟知的,正如开发用于在各种治疗方案(包括例如口服、肠胃外、静脉内、鼻内和肌内施用和配制)中使用本文所述的特定组合物的合适的剂量和治疗方案是是本领域普通技术人员所熟知的。本发明公开的主题的药物组合物可以不经肠道(例如静脉内、肌肉内或腹膜内)递送,如描述于例如美国专利号5,543,158;美国专利号5,641,515和美国专利号5,399,363中。作为游离碱或药学上可接受的盐的活性化合物的溶液可以在与表面活性剂比如羟丙基纤维素适当混合的水中制备。分散体也可以在甘油、液态聚乙二醇及其混合物中和在油中制备。在通常的储存和使用条件下,这些制品含有防腐剂以防止微生物的生长。药学上可接受的载体包括无菌水溶液或分散体和用于临时制备无菌可注射溶液或分散体的无菌粉末。使用此类介质和试剂用于药物活性物质是本领域已知的。除了与活性化合物不相容的任何常规介质或试剂情况外,其在本发明的药物组合物中的用途是可预期的。补充的活性化合物也可以并入组合物中。治疗组合物通常在制造和储存条件下必须是无菌和稳定的。该组合物可以配制成适合高药品浓度的溶液、微乳液、脂质体或其它有序结构。药学上可接受的载体可以是含有例如水、乙醇、多元醇(例如甘油、丙二醇和液体聚乙二醇等)及其合适的混合物的溶剂或分散介质。可以保持适当的流动性,例如通过使用比如卵磷脂的涂层,通过在分散体的情况下维持所需的粒径和通过使用表面活性剂。在许多情况下,将优选的是包括等渗剂,例如,糖、多元醇比如在组合物中的甘露糖醇、山梨糖醇或氯化钠。可以通过在组合物中包含延迟吸收的试剂,例如单硬脂酸盐和明胶来实现可注射组合物的延长吸收。本发明公开的主题的药物组合物可以方便地提供为可以缓冲至选定的ph的无菌液体制品,例如等渗水溶液、悬浮液、乳液、分散体或粘稠组合物。液体制品通常比凝胶、其它粘稠组合物和固体组合物更容易制备。另外,特别是通过注射,施用液体组合物稍微更方便。另一方面,粘稠组合物可以配制在适当的粘度范围内,以为特定组织提供更长的接触时间。液体或粘稠组合物可以包含运载体,其可以是含有例如水、盐水、磷酸盐缓冲液、多元醇(例如甘油、丙二醇、液体聚乙二醇等)及其适合的混合物的溶剂或分散介质。无菌可注射溶液可以通过根据需要将本发明公开的主题的组合物并入所需量的适当溶剂与各种量的其它成分来制备。此类组合物可以与合适的运载体、稀释剂或赋形剂比如无菌水、生理盐水、葡萄糖、右旋糖(dextrose)等掺合。组合物也可以冻干。组合物可以含有辅助物质,比如润湿剂、分散剂或乳化剂(例如甲基纤维素)、ph缓冲剂、胶凝或粘度增强添加剂、防腐剂、调味剂、着色剂等,这取决于施用路径和期望的制品。可参考并入本文以供参考的标准文本比如“《瑞明顿的药物科学》(remington’spharmaceuticalscience)”,第17版,1985,以准备合适的制品,而无需过度的实验。可以加入增加组合物的稳定性和无菌性的各种添加剂,包括抗微生物防腐剂、抗氧化剂、螯合剂和缓冲剂。可以通过各种抗细菌和抗真菌剂,例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸等来确保防止微生物的作用。可以通过使用延迟吸收的试剂,例如单硬脂酸铝和明胶来实现可注射药物形式的延长吸收。组合物可以是等渗的,即,它们可以具有与血液和泪液相同的渗透压。本发明公开的主题的组合物的期望等渗性可以使用氯化钠或其它药学上可接受的试剂比如右旋糖、硼酸、酒石酸钠、丙二醇或其它无机或有机溶质来完成。氯化钠对于含有钠离子的缓冲液是特别优选的。对于以水溶液的肠胃外施用,例如,如果需要,那么溶液应适当缓冲,并且液体稀释剂首先用足够的盐水或葡萄糖等渗。可以通过将所需量的活性化合物在适当的溶剂中并入以上列举的成分的一种或组合,根据需要,随后进行无菌微过滤来制备无菌可注射溶液。通常,通过将活性化合物并入含有碱性分散介质的无菌载体和来自以上列举的那些中的所需的其它成分来制备分散体。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥(冻干),这从其预先无菌过滤的溶液中,产生活性成分加上任何另外期望的成分的粉末。在某些实施方式中,组合物可以通过鼻内喷雾剂、吸入和/或其它气溶胶递送载体递送。通过鼻腔气溶胶喷雾剂将基因、多核苷酸和肽组合物直接递送至肺的方法描述于例如美国专利号5,756,353和美国专利号5,804,212。使用溶血磷脂酰甘油化合物递送药品的方法描述于美国专利号5,725,871中。以聚四氟乙炔支撑基质形式的粘膜下药品递送描述于例如美国专利号5,780,045中。本发明公开的主题的组合物可以被配制为包封在脂质颗粒、脂质体、囊泡、纳米球、纳米颗粒等中来递送。此类递送载体的制剂和用途可以使用已知和常规技术进行。本发明公开的主题的制剂和组合物可以包含一种或多种阻抑物和/或激活子,其包含如本文所述的任何数量的多肽、多核苷酸和小分子的组合,其配制在药学上可接受的或生理上可接受的溶液中(例如培养基),用于或单独或与一种或多种其它治疗方式组合施用于细胞或动物。在某些方面,本发明公开的主题提供适于包括但不限于逆转录病毒(例如慢病毒)载体的递送病毒载体系统(即病毒介导的转导)的制剂或组合物。用于离体递送的示例性制剂还可以包括使用本领域已知的各种转染剂,比如磷酸钙、电穿孔、热休克和各种脂质体制剂(即,脂质介导的转染)。脂质体是捕获一部分水性流体的脂质双层。dna自发地相关联到阳离子脂质体的外表面(由于其电荷),并且这些脂质体将与细胞膜相互作用。本领域技术人员可以容易地确定组合物中细胞和任选的添加剂、载体、和/或运载体以及本发明公开主题的方法待施用的量。通常,在磷酸盐缓冲盐水中的溶液,任何添加剂(除了一种或多种转导的细胞和/或一种或多种试剂之外)以约0.001重量%至约50重量%的量存在),并且活性成分存在的数量级为微克至毫克,比如约0.0001wt%至约5wt%、约0.0001wt%至约1wt%、约0.0001wt%至约0.05wt%、约0.001wt%至约20wt%、约0.01wt%至约10wt%或约0.05wt%至约5wt%。对于待施用于动物或人的任何组合物,以及对于任何特定的施用方法,应当确定毒性,比如通过在合适的动物模型例如啮齿动物(比如鼠)中测定致死剂量(ld)和ld50;和引起适当应答的组合物的剂量,其中的组分浓度和施用组合物的时间。根据本领域技术人员的知识、本公开和本文引用的文献,此类测定不需要过度的实验。而且,可查明连续施用的时间,而无需过度的实验。vi.用途和方法包含本发明公开的表达盒的载体和其它递送系统(核酸酶和crispr-cas系统)提供改善的基因治疗方法。如本文所用,术语“基因治疗”是指将多核苷酸引入细胞的基因组中,其恢复、矫正或修饰基因和/或基因的表达。在各种非限制性实施方式中,本发明公开的载体或其它递送系统(例如,核酸酶或crispr-cas系统)包含含有球蛋白基因或其功能部分的表达盒,其编码球蛋白(例如,人类β球蛋白),其为被诊断患有或怀疑患有造血系统的疾病、病症或病情的受试者提供有疗效的、预防性或改进性益处。载体或其它递送系统(例如,核酸酶和crispr-cas系统)可以体内、离体或体外感染和转导细胞。在离体和体外实施方式中,然后可以将转导的细胞施用于需要治疗的受试者。本发明公开的主题考虑了本发明公开的的载体和其它递送系统(例如,核酸酶或crispr-cas系统)、病毒颗粒和转导的细胞被用于治疗、预防和/或改进受试者中造血系统的疾病、病症或病情,例如血红蛋白病。如本文所用,术语“血红蛋白病”或“血红蛋白病情”包括涉及血液中存在异常血红蛋白分子的任何病症。血红蛋白病的示例包括但不限于血红蛋白c病、血红蛋白镰状细胞病(scd)、镰状细胞性贫血和地中海贫血。还包括一种血红蛋白病,其中异常血红蛋白的组合存在于血液中(例如,镰状细胞/hb-c病)。如本文所用,“地中海贫血”是指特征在于血红蛋白产生缺陷的遗传性病症。地中海贫血的示例包括α-地中海贫血和β-地中海贫血。β-地中海贫血是由β球蛋白链中的突变引起的,并且可以主要或次要形式发生。在β-地中海贫血的主要形式中,儿童在出生时不发生,但在生命的第一年发生贫血。轻度形式的β-地中海贫血产生小红细胞,并且地中海贫血是由来自球蛋白链的一个或多个基因的缺失引起的。a-地中海贫血通常是由于涉及hba1和hba2基因的缺失。这两个基因都编码α球蛋白,其是血红蛋白的组分(亚基)。在每个细胞基因组中,存在两个拷贝的hba1基因和两个拷贝的hba2基因。其结果是存在产生α-球蛋白的四个等位基因。不同类型的地中海贫血是由于部分或全部这些等位基因的缺失而产生的。hbbart综合征是最严重的地中海贫血形式,其是由所有四种α-球蛋白等位基因的缺失引起的。hbh病是由四种α-球蛋白等位基因中的三种缺失引起的。在这两种情况下,α-球蛋白的短缺妨碍细胞产生正常血红蛋白。相反,细胞产生异常形式的称为血红蛋白bart(hbbart)或血红蛋白h(hbh)的血红蛋白。这些异常血红蛋白分子不可有效携带氧气到身体的组织。hbbart或hbh替代正常血红蛋白导致贫血和与地中海贫血相关联的其它严重的健康问题。如本文所用,术语“镰状细胞病”是指一组常染色体隐性遗传性血液病症,其由球蛋白基因的突变引起,并且其特征在于呈现异常的、刚性的镰刀形的红细胞。他们由编码β-球蛋白链变体的βs-基因的存在,其中谷氨酸被肽的氨基酸位置6处的缬氨酸取代,以及具有允许导致临床表型的hbs结晶的突变的第二β-基因来定义。如本文所用,术语“镰状细胞性贫血”是指对于引起hbs的突变是纯合子的患者的镰状细胞病的特异性形式。其它常见形式的镰状细胞病包括hbs/β-地中海贫血、hbs/hbc和hbs/hbd。在某些实施方式中,本发明公开的主题的基因治疗方法用于治疗、预防或改进选自血红蛋白c病、血红蛋白镰状细胞病(scd)、镰状细胞性贫血、遗传性贫血、地中海贫血、β-地中海贫血、重型地中海贫血、中间型地中海贫血、α-地中海贫血和血红蛋白h病的血红蛋白病。在一个非限制性实施方式中,血红蛋白病是β-地中海贫血。在另一个非限制性实施方式中,血红蛋白病是镰状细胞性贫血。在各种非限制性实施方式中,包含本发明公开的表达盒的载体或其它递送系统(例如,核酸酶或crispr-cas系统)通过直接注射给需要体内基因治疗的受试者的细胞、组织或器官来施用。在各种其它实施方式中,细胞使用本发明公开的主题的载体或其它递送系统(例如核酸酶或crispr-cas系统)体外或离体转导,并且任选地离体扩增。然后将转导的细胞施用于需要基因治疗的受试者,例如在本文公开的药物制剂内。本发明公开的主题提供向受试者提供转导的细胞的方法。在各种非限制性实施方式中,该方法包括向受试者施用(例如,不经肠道)用本发明公开的表达盒或载体或包括此类表达盒的另一递送系统(例如核酸酶或crispr-cas系统)转导的一种或多种细胞(细胞群)。本发明公开的主题提供治疗受试者的血红蛋白病的方法。在各种非限制性实施方式中,该方法包括向受试者施用有效量的本发明公开的转导的细胞或本发明公开的转导的细胞的群(例如,hsc、胚胎干细胞或ipsc)。对于治疗,施用的量是产生期望效果的有效的量。有效量可以以一次或一系列施用提供。有效量可以以大剂量或连续灌注提供。“有效量”(或“治疗有效量”)是足以在治疗时影响有益或期望的临床结果的量。有效量可以以一次或多次剂量施用于受试者。在治疗方面,有效量是足以缓和、改进、稳定、逆转或减缓疾病进展,或以其他方式减少疾病的病理后果的量。有效量通常由医师根据具体情况确定,并且在本领域技术人员的能力范围内。当确定适当的剂量以达到有效量时,通常考虑几个因素。这些因素包括受试者的年龄、性别和体重,所治疗的病情、病情的严重程度以及施用的无创细胞的形式和有效浓度。在一个非限制性实例中,在施用一种或多种本发明公开的转导的细胞后,收集受试者的外周血并测量血红蛋白水平。在施用一种或多种本发明公开的转导的细胞后,产生治疗相关水平的血红蛋白。治疗相关水平的血红蛋白是血红蛋白的水平,其足以(1)改善或矫正贫血、(2)恢复受试者产生含有正常血红蛋白的红细胞的能力、(3)矫正受试者中无效的红细胞生成、(4)矫正外髓血细胞生成(例如,脾和肝外髓血细胞生成),和/或(5)减少例如外周组织和器官中的铁积累。治疗相关水平的血红蛋白可以为至少约7g/dlhb、至少约7.5g/dlhb、至少约8g/dlhb、至少约8.5g/dlhb、至少约9g/dlhb、至少约9.5g/dlhb、至少约10g/dlhb、至少约10.5g/dlhb、至少约11g/dlhb、至少约11.5g/dlhb、至少约12g/dlhb、至少约12.5g/dlhb、至少约13g/dlhb、至少约13.5g/dlhb、至少约14g/dlhb、至少约14.5g/dlhb,或至少约15g/dlhb。另外或可选地,治疗相关水平的血红蛋白可以为约7g/dlhb至约7.5g/dlhb、从约7.5g/dlhb至约8g/dlhb、约8g/dlhb至约8.5g/dlhb、约8.5g/dlhb至约9g/dlhb、约9g/dlhb至约9.5g/dlhb、约9.5g/dlhb至约10g/dlhb、约10g/dlhb至约10.5g/dlhb、约10.5g/dlhb至约11g/dlhb、约11g/dlhb至约11.5g/dlhb、约11.5g/dlhb至约12g/dlhb、约12g/dlhb至约12.5g/dlhb、约12.5g/dlhb至约13g/dlhb、约13g/dlhb至约13.5g/dlhb、约13.5g/dlhb至约14g/dlhb、约14g/dlhb至约14.5g/dlhb、约14.5g/dlhb至约15g/dlhb、约7g/dlhb至约8g/dlhb、约8g/dlhb至约9g/dlhb、约9g/dlhb至约10g/dlhb、约10g/dlhb至约11g/dlhb、约11g/dlhb至约12g/dlhb、约12g/dlhb至约13g/dlhb、约13g/dlhb至约14g/dlhb、约14g/dlhb至约15g/dlhb、约7g/dlhb至约9g/dlhb、约9g/dlhb至约11g/dlhb、约11g/dlhb至约13g/dlhb,或约13g/dlhb至约15g/dlhb。在某些实施方式中,治疗相关水平的血红蛋白在受试者中维持至少约6个月、至少约12个月(或1年)、至少约24个月(或2年)。在某些实施方式中,治疗相关水平的血红蛋白在受试者中维持至多达约6个月、至多达约12个月(或1年)、至多达约24个月(或2年)。在某些实施方式中,治疗相关水平的血红蛋白在受试者中维持约6个月、约12个月(或1年)、约24个月(或2年)。在某些实施方式中,治疗相关水平的血红蛋白在受试者中维持约6个月至约12个月(例如,约6个月至约8个月、约8个月至约10个月、约10个月至约12个月)、约12个月至约18个月(例如,约12个月至约14个月、约14个月至约16个月,或约16个月至约18个月),或约18个月至约24个月(例如,约18个月至约20个月、约20个月至约22个月,或约22个月至约24个月)。在某些实施方式中,方法包括施用一种或多种用重组载体转导的细胞,该重组载体包含如上所述的本发明公开的表达盒。在受试者中提供治疗相关水平的血红蛋白(例如,9-10g/dl)的细胞中的重组载体的载体拷贝数为每个细胞约0.5个至约2个、约0.5个至约1个,或约1个至约2个载体拷贝数。在某些实施方式中,本发明公开的载体的载体拷贝数为每个细胞约0.5个、约0.6个、约0.7个、约0.8个、约0.9个、约1.0个、约1.1个、约1.2个、约1.3个、约1.4个、约1.5个、约1.6个、约1.7个、约1.8个、约1.9个或约2.0个载体拷贝数。在某些实施方式中,受试者缺乏人体白细胞抗原(hla)匹配的供体。在某些实施方式中,转导的细胞来自相同的受试者。在一个实施方式中,转导的细胞来自相同受试者的骨髓。因此,转导的细胞的施用对受试者不引起移植物抗宿主病的风险。该方法不需要免疫抑制来防止移植排斥,例如,该方法不包括向受试者施用免疫抑制剂。本发明公开的主题还提供与受试者中的白血细胞或白细胞相比增加红细胞或红细胞的比例的方法。在各种非限制性实施方式中,该方法包括向受试者施用有效量的本发明公开的转导的细胞或本发明公开的转导的细胞的群(例如,hsc、胚胎干细胞或ipsc),其中与受试者中的造血干细胞的白血细胞后代细胞相比,造血干细胞的红细胞后代细胞的比例增加。不希望受任何特定的理论约束,由本发明公开的受试者的表达盒、载体和其它递送系统(例如,核酸酶和crispr-cas系统)、组合物和方法提供的重要优点是与现有方法相比,其是可以通过施用包含较低百分比的转导细胞的细胞群来实现的高效的球蛋白基因治疗。这提供与转导的细胞中细胞基因的有害突变、转化或癌基因激活的机会减少相关联的重要的安全优点。转导的细胞可以作为骨髓或脐带血移植的一部分施用于已经或尚未进行骨髓消融治疗的个体中。关于用本文所述的表达盒转导的本发明公开的细胞的治疗用途的一个考虑因素(“转导的细胞”)是获得最佳效果所必需的细胞数量。对于要治疗的受试者的待施用的转导的细胞数量将变化。在一个实施方式中,将本发明公开的转导的细胞的约1×104个细胞/kg至约1×105个细胞/kg、约1×105个细胞/kg至约1×106个细胞/kg、约1×106个细胞/kg至约1×107个细胞/kg、1×107个细胞/kg至约1×108个细胞/kg、约1×108个细胞/kg至约1×109个细胞/kg,或约1×109个细胞/kg至约1×1010个细胞/kg施用于受试者。可以以甚至更小的数量施用更有效的细胞。在一些实施方式中,将本发明公开的转导的细胞的至少约1×108个细胞/kg、至少约2×108个细胞/kg、至少约3×108个细胞/kg、至少约4×108个细胞/kg、或至少约5×108个细胞/kg施用于受试者。将被认为是有效剂量的精确确定可以基于每个受试者个体的因素,包括其大小、年龄、性别、体重以及特定受试者的病情。根据本公开内容和本领域的知识,本领域技术人员可以容易地查明剂量。在各种实施方式中,本发明公开的主题的表达盒、载体和其它递送系统(核酸酶和crispr-cas系统)、组合物和方法提供使用离体基因治疗和自体移植的改善的基因治疗方法。用表达盒转导的细胞或到具有血红蛋白病的受试者中的移植导致疾病的长期矫正。一种或多种本发明公开的转导的细胞可以通过本领域已知的任何方法施用,包括但不限于肠胃外施用(例如肌内施用、静脉内施用、皮下施用或腹膜内施用)、脊柱施用和表皮施用。在一个非限制性实施方式中,将一种或多种转导的细胞静脉内递送给受试者。一种或多种本发明公开的转导的细胞可以通过注射、输注或植入施用。在一个非限制性实施方式中,一种或多种转导的细胞通过注射施用。在另一非限制性实施方式中,一种或多种转导的细胞通过静脉内注射施用。受试者可以患有晚期形式的疾病,在这种情况下,治疗目标可以包括减轻或逆转疾病进展,和/或改进副作用。受试者可以具有已经被治疗的病情的病史,在这种情况下,治疗目标通常将包括复发风险的减少或延迟。vii.试剂盒本发明公开的主题提供用于治疗或防止血红蛋白病的试剂盒。在一个实施方式中,试剂盒包含含有以单位剂型的有效量的以本发明公开的表达盒转导的细胞的治疗或预防组合物。在一个非限制性实施方式中,试剂盒包含本文公开的一种或多种表达盒。在某些实施方式中,试剂盒包含一种或多种包含本文公开的表达盒的载体。在一些实施方式中,试剂盒包括无菌容器,其可以是本领域已知的箱、安瓿、瓶、小瓶、管、包、袋、泡罩包装或其它合适的容器形式。此类容器可以由塑料、玻璃、层压纸、金属箔或其它适合于保持药剂的材料制成。如果期望,那么转导的细胞与用于将细胞施用于患有或处于发生血红蛋白病风险的受试者的说明书一起提供。说明书通常将包括关于组合物用于治疗或防止血红蛋白病的信息。在其它实施方式中,说明书包括以下中的至少一个:治疗剂的描述;用于治疗或防止血红蛋白病或其症状的剂量计划和施用;预防措施;警告;适应症;禁忌;过量信息;不良反应;动物药理学;临床研究;和/或参考。可选地或另外,试剂盒可以包括用于用一个或多个表达盒和/或包含此类表达盒的载体转导细胞的说明书。说明书可以直接打印在容器上(如果有的话),或作为应用于容器的标签,或作为容器内或用容器提供的单独的纸张、小册子、卡片或文件夹打印。实施例除非另有说明,否则本发明公开的主题的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些技术在本领域技术人员的视界范围内。此类技术在以下文献中完全解释,比如“《分子克隆:实验室规程》(molecularcloning:alaboratorymanual)”,第二版(sambrook,1989);“寡核苷酸合成(oligonucleotidesynthesis)”(gait,1984);“动物细胞培养(animalcellculture)”(freshney,1987);“酶学方法(methodsinenzymology)”“实验免疫学手册(handbookofexperimentalimmunology)”(weir,1996);“用于哺乳动物细胞的基因转移载体(genetransfervectorsformammaliancells)”(miller和calos,1987);“《分子生物学现代方法》(currentprotocolsinmolecularbiology)”(ausubel,1987);“pcr:聚合酶链式反应(pcr:thepolymerasechainreaction)”,(mullis,1994);“免疫学的现代方法(currentprotocolsinimmunology)”(coligan,1991)。这些技术适用于本发明公开的主题的多核苷酸和多肽的制备,并且因此可以考虑进行和实践本发明公开的主题。特定实施方式的特别有用的技术将在以下部分中讨论。提出以下实施例,以便为本领域普通技术人员提供如何制备和使用本发明公开的主题的表达盒、载体、递送系统和治疗方法的完整公开内容和描述,并且不意在限制本发明人认为是其发明的范围。实施例1:新型绝缘子的发现通过病毒载体的插入诱变产生的问题是众所周知的(nienhuis(2013)、baum等人(2006),nienhuis等人(2006)),因为通过使用染色质绝缘子可以降低遗传毒性的风险(arumugam等人(2007)、emery(2011)、evans-galea等人(2007)、rivella等人(2000)、emery等人(2000)、emery等人(2002)、yannaki等人(2002)、hino等人(2004)、ramezani等人(2003)、ramezani等人(2008))。已经开发出了允许在人类基因组中有效鉴定增强子阻断绝缘子的方法。这些新的绝缘子是短的,平均为150bp,并且它们不对病毒载体的滴度产生不利影响,并且它们比绝缘子chs4更强大几倍。使用基因组方法以发现人类基因组的最强大的增强子阻断物和屏障绝缘子。对于血红蛋白病的基因疗法,需要强大的增强子来达到球蛋白基因表达的治疗性水平。因此,强大的绝缘子可以提供一种从整合载体的强大增强子中保护基因组环境的手段。几项研究已经证明了chs4绝缘子减少γ逆转录病毒载体(evans-galea等人(2007)、rivella等人(2000)、emery等人(2000)、emery等人(2002)、yannaki等人(2002)、hino等人(2004)、ramezani等人(2006)、yao等人(2003)、nishino等人(2006)、aker等人(2007),li和emery(2008))和慢病毒载体(evans-galea等人(2007)、ramezani等人(2003)、puthenveetil等人(2004)、arumugam等人(2007)、bank等人(2005)、aker等人(2007)、ma等人(2003)、chang等人(2005)、pluta等人(2005))的位置效应沉默的能力。这些适当设计的研究证明,包含1.2kb型式的chs4绝缘子增加了至少一些背景中的载体转基因表达的可能性和/或一致性(arumugam等人(2007)、evans-galea等人(2007)、emery等人(2002)、yannaki等人(2002)、hino等人(2004)、ramezani等人(2006)、aker等人(2007)、li和emery(2008)、pluta等人(2005)、jakobsson等人(2004))。然而,由chs4绝缘子提供的保护程度远远没有完成。此外,包含1.2kb的chs4可不利地影响载体滴度,而最小的chs4核心已被证明无效(aker等人(2007)、jakobsson等人(2004))。使用基于小鼠中肿瘤形成的定量的体内测定来检测对遗传毒性的影响。与接受未绝缘的或chs4绝缘的对照的小鼠相比,由绝缘子a1绝缘的载体减少了造血嵌合体中由随机载体整合而诱导的肿瘤形成。为了评估对载体滴度的影响,将绝缘子a1从组成型封装启动子引入到表达gfp的第三代慢病毒载体的双拷贝区中,并测量病毒滴度和gfp表达。绝缘子a1没有不利地影响载体gfp表达。在体内遗传毒性测定中,用γ逆转录病毒载体转导的细胞系在小鼠中移植后产生肿瘤,并允许通过测量无肿瘤存活率来定量遗传毒性影响。绝缘子对遗传毒性的影响是通过小鼠中形成的肿瘤数量和无肿瘤存活率进行定量的。将绝缘子a1插入3’ltr的近端部分,在逆转录和载体整合期间从其中将绝缘子a1拷贝到5’ltr。所得的拓扑结构放置绝缘子的拷贝在位于整合的原病毒的5’和3’的基因组区之间,和来自病毒5’ltr的增强子活性,以及内部pgk启动子,但在3’ltr中不含有增强子。这可以降低遗传毒性,从而导致减少肿瘤形成并且增加动物的存活。使用侧边有绝缘子a1或对照区的γ逆转录病毒报告载体以转导生长因子依赖性细胞系32d,并将每个载体的10个独立亚库移植到同基因c3h/hej小鼠中。移植有模拟转导细胞的所有10只小鼠保持不含32d细胞衍生的肿瘤,而几乎所有移植有用不含插入物或790bp中性间隔区的载体转导的32d细胞的小鼠,在中值(median)16周内发生肿瘤(图5b)。使该载体侧边有chs4绝缘子延迟肿瘤形成的发作数周,并将发生肿瘤的动物的频率降低到10个中的6个。相反,用侧边有绝缘子a1的载体转导的32d细胞移植后,10只动物中仅有两只发生肿瘤(图5b)。患肿瘤的动物的频率和原始亚库中的载体转导事件的数量表明,使载体侧边有绝缘子a1降低总的肿瘤形成率12倍,从46.9个肿瘤/105个原病毒至3.9个肿瘤/105个原病毒(图5c)。相比之下,chs4绝缘子降低总的肿瘤形成率2.8倍(降至16.9个肿瘤/105个原病毒),而中性间隔区对肿瘤形成率没有统计学上的明显影响。这些结果表面,发现的增强子阻断绝缘子可以充分降低插入诱变和遗传毒性的风险。实施例2:包含至少一个绝缘子的球蛋白载体的表征产生本发明公开的表达盒(称为“表达盒1”,如图1所示),其包含绝缘子a1,和在密码子87处编码苏氨酸至谷氨酰胺的突变的人类βa-球蛋白基因(βa-t87q),可操作地连接到β-球蛋白lcr区,β-球蛋白lcr区包含具有seqidno:9所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:7所示的核苷酸序列的hs4区。使用变体β链(βa)的基本原理是促进载体编码的β-球蛋白基因的检测,将其与内源性或输入的β链区分开。在γ-球蛋白链中的87位处的谷氨酰胺(gln)残基增强了γ链相对于β链的抗镰状化活性,同时保持β链的成体氧结合的特性(nagel等人(1979))。在载体1中,改变密码子87的点突变(βa-t87q或β87)以谷氨酰胺替代正常的苏氨酸,并增强载体编码的β链的抗镰状化活性。该β87链已安全地用于患有hbe-地中海贫血的患者中(cavazzana-calvo等人(2010))。将表达盒1并入或引入慢病毒载体(称为“载体1”)。将载体1引入c57bl/6-hbbth3/+小鼠的骨髓细胞中,并如前所述移植到同基因致命照射的接受者(may等人(2000)、may等人(2002)、lisowski等人(2007))。v1的载体滴度与包含缺乏绝缘子a1的表达盒的慢病毒载体的载体滴度相当。将载体1的β-球蛋白表达与包含表达盒的慢病毒载体(称为“载体2”)的β-球蛋白表达进行比较,该表达盒缺乏绝缘子并且包含野生型人类β-球蛋白基因可操作地连接到β-球蛋白lcr区,β-球蛋白lcr区包含具有seqidno:9所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:6所示的核苷酸序列的hs4区。与载体2相比,归一化为载体拷贝的载体1的β-球蛋白表达等同或稍微增加,这表明由侧边屏障元件提供的体内表达的附加益处,如图6所示。实施例3:非红细胞系k562细胞中增强子活性的评价在非红细胞系k562细胞中评价hs2的增强子活性。如图7所示,用载体转导的k562细胞中的gfp表达由连接至无增强子的最小启动子驱动(“空白”、hs2、hs3-hs4、hs2-hs3-hs4或用作阳性对照的runx1增强子(“runx1”)。背景表达的数量级为0.01%(“空白”),但用hs2-hs3-hs4增加10倍以上(“lcr9”,0.17%)。该增强主要是由于hs2(0.15%),而不是hs3-hs4(0.05%)。所有细胞系同等地转导(平均载体拷贝数2.5)。结果支持hs2而不是hs3-hs4可在非红细胞系造血干细胞和祖细胞中引起致癌风险。实施例4:新型红细胞系特异性增强子如图8和图9所示,五种红细胞系特异性增强子替换hs2:alas内含子1、alas内含子8、blvrb、ppox和α血影蛋白(spectrin-alpha)。本发明人已经示出,所有这五种增强子都是强大的增强子,并且在非红细胞系组织中缺乏增强子活性,且不降低载体滴度。实施例5:通过3’ltr修饰增加球蛋白慢病毒载体产生治疗性球蛋白载体的基本特征是达到足以有效转导患者细胞的高滴度。由于它们的大负载,包含基因、启动子、增强子和/或lcr元件,球蛋白慢病毒载体固有地具有低滴度,使其制造复杂化并限制其临床用途。通过并入另外的基因组元件比如绝缘子而进一步增加了载体的大小,进一步加重该问题。本发明人研究球蛋白载体的3’长末端重复(ltr)的不同修饰,以增加球蛋白载体的滴度。评价超过62个变体,编号为1至62,其模型为包含人类β-球蛋白基因可操作地连接到β-球蛋白lcr区的慢病毒载体,β-球蛋白lcr区包含具有seqidno:9所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:7所示的核苷酸序列的hs4区。换句话说,载体#1至载体62中的所有都包含β-球蛋白lcr区,其包含具有seqidno:9所示的核苷酸序列的hs2区、具有seqidno:5所示的核苷酸序列的hs3区和具有seqidno:7所示的核苷酸序列的hs4区。作为基线的载体#18在3’ltr中包含标准u3缺失。包含全部(即野生型)ltr的载体#1(未描绘)不可在临床上使用。图10a和图10b中描绘对3’ltr的修饰,并且它们的滴度在图11和图12中示出(y轴示出在严格相同的条件下制造并测试的载体原种的载体拷贝数)。滴定以三份复制品进行测量,由两名操作者平行进行,并在多次实验中重复。如图11和图12所示,载体#55重复示出更高的滴度。该载体在3’ltr中的3’至r区包含土拨鼠肝炎后调节元件(wpre)和牛生长激素聚腺苷酸化信号。因此,wpre元件不转移到转导的细胞。用于增强球蛋白慢病毒载体产生的这些元件的并入对于产生更高的滴度以及因此用于本申请中描述的载体的临床有用性是必需的。参考文献1.weatherall,d.j.&clegg,j.b.thethalassemiasyndrome.blackwellscientificoxford(1981).2.stamatoyannopoulos,g.,nienhuis,a.w.,majerus,p.&varmus,h.themolecularbasisofblooddiseaes.wbsaunders,philadelfphia(1994).3.weatherall,d.j.phenotype-genotyperelationshipsinmonogenicdisease:lessonsfromthethalassaemias.natrevgenet2,245-255.(2001).4.steinberg,m.h.,forget,b.g.,higgs,d.r.&nagel,r.l.molecularmechanismofβthalassemia;bernardg.forget,(cambridgeuniversitypress,cambridge,uk,2001).5.cooley,t.b.&lee,p.aseriesofcasesofsplenomegalyinchildrenwithanemiaandpeculiarbonechanges.trans.am.pediatr.soc.37,29(1925).6.giardina,p.j.&grady,r.w.chelationtherapyinbeta-thalassemia:anoptimisticupdate.seminhematol38,360-366.(2001).7.giardini,c.&lucarelli,g.bonemarrowtransplantationinthetreatmentofthalassemia.currentopinioninhematology1,170-176.(1994).8.boulad,f.,giardina,p.,gillio,a.,kernan,n.,small,t.,brochstein,j.,vansyckle,k.,george,d.,szabolcs,p.&o'reilly,r.j.bonemarrowtransplantationforhomozygousbeta-thalassemia.thememorialsloan-ketteringcancercenterexperience.annnyacadsci850,498-502.(1998).9.lucarelli,g.,clift,r.a.,galimberti,m.,angelucci,e.,giardini,c.,baronciani,d.,polchi,p.,andreani,m.,gaziev,d.,erer,b.,ciaroni,a.,d'adamo,f.,albertini,f.&muretto,p.bonemarrowtransplantationinadultthalassemicpatients.blood93,1164-1167.(1999).10.tisdale,j.&sadelain,m.towardgenetherapyfordisordersofglobinsynthesis.seminhematol38,382-392(2001).11.pauling,l.,itano,h.a.,singer,s.j.&wells,i.c.sicklecellanemia,amoleculardisease.science110,543-546(1949).12.swank,r.a.&stamatoyannopoulos,g.fetalgenereactivation.curropingenetdev8,366-370(1998).13.platt,o.s.,orkin,s.h.,dover,g.,beardsley,g.p.,miller,b.&nathan,d.g.hydroxyureaenhancesfetalhemoglobinproductioninsicklecellanemia.jclininvest74,652-656.(1984).14.charache,s.,dover,g.j.,moore,r.d.,eckert,s.,ballas,s.k.,koshy,m.,milner,p.f.,orringer,e.p.,phillips,g.,jr.,platt,o.s.&etal.hydroxyurea:effectsonhemoglobinfproductioninpatientswithsicklecellanemia.blood79,2555-2565.(1992).15.atweh,g.f.&loukopoulos,d.pharmacologicalinductionoffetalhemoglobininsicklecelldiseaseandbeta-thalassemia.seminhematol38,367-373.(2001).16.perrine,s.p.,castaneda,s.a.,boosalis,m.s.,white,g.l.,jones,b.m.&bohacek,r.inductionoffetalglobininbeta-thalassemia:cellularobstaclesandmolecularprogress.annnyacadsci1054,257-265(2005).17.stamatoyannopoulos,g.prospectsfordevelopingamolecularcureforthalassemia.hematology10suppl1,255-257(2005).18.vermylen,c.,cornu,g.,ferster,a.,brichard,b.,ninane,j.,ferrant,a.,zenebergh,a.,maes,p.,dhooge,c.,benoit,y.,beguin,y.,dresse,m.f.&sariban,e.haematopoieticstemcelltransplantationforsicklecellanaemia:thefirst50patientstransplantedinbelgium.bonemarrowtransplant22,1-6(1998).19.luzzatto,l.&goodfellow,p.sicklecellanaemia.asimplediseasewithnocure.nature337,17-18(1989).20.sadelain,m.genetictreatmentofthehaemoglobinopathies:recombinationsandnewcombinations.brjhaematol98,247-253(1997).21.sadelain,m.,boulad,f.,galanello,r.,giardina,p.,locatelli,f.,maggio,a.,rivella,s.,riviere,i.&tisdale,j.therapeuticoptionsforpatientswithseverebeta-thalassemia:theneedforglobingenetherapy.humgenether18,1-9(2007).22.borgna-pignatti,c.,rugolotto,s.,destefano,p.,zhao,h.,cappellini,m.d.,delvecchio,g.c.,romeo,m.a.,forni,g.l.,gamberini,m.r.,ghilardi,r.,piga,a.&cnaan,a.survivalandcomplicationsinpatientswiththalassemiamajortreatedwithtransfusionanddeferoxamine.haematologica89,1187-1193(2004).23.telfer,p.t.,warburton,f.,christou,s.,hadjigavriel,m.,sitarou,m.,kolnagou,a.&angastiniotis,m.improvedsurvivalinthalassemiamajorpatientsonswitchingfromdesferrioxaminetocombinedchelationtherapywithdesferrioxamineanddeferiprone.haematologica94,1777-1778(2009).24.ladis,v.,chouliaras,g.,berdoukas,v.,chatziliami,a.,fragodimitri,c.,karabatsos,f.,youssef,j.,kattamis,a.&karagiorga-lagana,m.survivalinalargecohortofgreekpatientswithtransfusion-dependentbetathalassaemiaandmortalityratioscomparedtothegeneralpopulation.europeanjournalofhaematology86,332-338(2011).25.mancuso,a.,sciarrino,e.,renda,m.c.&maggio,a.aprospectivestudyofhepatocellularcarcinomaincidenceinthalassemia.hemoglobin30,119-124(2006).26.persons,d.a.&tisdale,j.f.genetherapyforthehemoglobindisorders.seminhematol41,279-286(2004).27.sadelain,m.recentadvancesinglobingenetransferforthetreatmentofbeta-thalassemiaandsicklecellanemia.currentopinioninhematology13,142-148(2006).28.may,c.,rivella,s.,callegari,j.,heller,g.,gaensler,k.m.,luzzatto,l.&sadelain,m.therapeutichaemoglobinsynthesisinbeta-thalassaemicmiceexpressinglentivirus-encodedhumanbeta-globin.nature406,82-86(2000).29.may,c.,rivella,s.,chadburn,a.&sadelain,m.successfultreatmentofmurinebeta-thalassemiaintermediabytransferofthehumanbeta-globingene.blood99,1902-1908(2002).30.rivella,s.,may,c.,chadburn,a.,riviere,i.&sadelain,m.anovelmurinemodelofcooleyanemiaanditsrescuebylentiviral-mediatedhumanbeta-globingenetransfer.blood101,2932-2939(2003).31.sadelain,m.,boulad,f.,lisowki,l.,moi,p.&riviere,i.stemcellengineeringforthetreatmentofseverehemoglobinopathies.currmolmed8,690-697(2008).32.bank,a.,dorazio,r.&leboulch,p.aphasei/iiclinicaltrialofbeta-globingenetherapyforbeta-thalassemia.annnyacadsci1054,308-316(2005).33.cavazzana-calvo,m.,payen,e.,negre,o.,wang,g.,hehir,k.,fusil,f.,down,j.,denaro,m.,brady,t.,westerman,k.,cavallesco,r.,gillet-legrand,b.,caccavelli,l.,sgarra,r.,maouche-chretien,l.,bernaudin,f.,girot,r.,dorazio,r.,mulder,g.j.,polack,a.,bank,a.,soulier,j.,larghero,j.,kabbara,n.,dalle,b.,gourmel,b.,socie,g.,chretien,s.,cartier,n.,aubourg,p.,fischer,a.,cornetta,k.,galacteros,f.,beuzard,y.,gluckman,e.,bushman,f.,hacein-bey-abina,s.&leboulch,p.transfusionindependenceandhmga2activationaftergenetherapyofhumanbeta-thalassaemia.nature467,318-322(2010).34.braun,c.j.,boztug,k.,paruzynski,a.,witzel,m.,schwarzer,a.,rothe,m.,modlich,u.,beier,r.,gohring,g.,steinemann,d.,fronza,r.,ball,c.r.,haemmerle,r.,naundorf,s.,kuhlcke,k.,rose,m.,fraser,c.,mathias,l.,ferrari,r.,abboud,m.r.,al-herz,w.,kondratenko,i.,marodi,l.,glimm,h.,schlegelberger,b.,schambach,a.,albert,m.h.,schmidt,m.,vonkalle,c.&klein,c.genetherapyforwiskott-aldrichsyndrome--long-termefficacyandgenotoxicity.scitranslmed6,227ra233(2014).35.chang,a.h.&sadelain,m.thegeneticengineeringofhematopoieticstemcells:theriseoflentiviralvectors,theconundrumoftheltr,andthepromiseoflineage-restrictedvectors.molther15,445-456(2007).36.pawliuk,r.,westerman,k.a.,fabry,m.e.,payen,e.,tighe,r.,bouhassira,e.e.,acharya,s.a.,ellis,j.,london,i.m.,eaves,c.j.,humphries,r.k.,beuzard,y.,nagel,r.l.&leboulch,p.correctionofsicklecelldiseaseintransgenicmousemodelsbygenetherapy.science294,2368-2371(2001).37.emery,d.w.,chen,h.,li,q.&stamatoyannopoulos,g.developmentofacondensedlocuscontrolregioncassetteandtestinginretrovirusvectorsforagamma-globin.bloodcellsmoldis24,322-339(1998).38.miccio,a.,cesari,r.,lotti,f.,rossi,c.,sanvito,f.,ponzoni,m.,routledge,s.j.,chow,c.m.,antoniou,m.n.&ferrari,g.invivoselectionofgeneticallymodifiederythroblasticprogenitorsleadstolong-termcorrectionofbeta-thalassemia.procnatlacadsciusa105,10547-10552(2008).39.sadelain,m.,wang,c.h.,antoniou,m.,grosveld,f.&mulligan,r.c.generationofahigh-titerretroviralvectorcapableofexpressinghighlevelsofthehumanbeta-globingene.procnatlacadsciusa92,6728-6732(1995).40.samakoglu,s.,lisowski,l.,budak-alpdogan,t.,usachenko,y.,acuto,s.,dimarzo,r.,maggio,a.,zhu,p.,tisdale,j.f.,riviere,i.&sadelain,m.ageneticstrategytotreatsicklecellanemiabycoregulatingglobintransgeneexpressionandrnainterference.natbiotechnol24,89-94(2006).41.pestina,t.i.,hargrove,p.w.,jay,d.,gray,j.t.,boyd,k.m.&persons,d.a.correctionofmurinesicklecelldiseaseusinggamma-globinlentiviralvectorstomediatehigh-levelexpressionoffetalhemoglobin.molther17,245-252(2009).42.hanawa,h.,yamamoto,m.,zhao,h.,shimada,t.&persons,d.a.optimizedlentiviralvectordesignimprovestiterandtransgeneexpressionofvectorscontainingthechickenbeta-globinlocushs4insulatorelement.molther17,667-674(2009).43.arumugam,p.i.,scholes,j.,perelman,n.,xia,p.,yee,j.k.&malik,p.improvedhumanbeta-globinexpressionfromself-inactivatinglentiviralvectorscarryingthechickenhypersensitivesite-4(chs4)insulatorelement.molther15,1863-1871(2007).44.fraser,p.,pruzina,s.,antoniou,m.&grosveld,f.eachhypersensitivesiteofthehumanbeta-globinlocuscontrolregionconfersadifferentdevelopmentalpatternofexpressionontheglobingenes.genes&development7,106-113(1993).45.navas,p.a.,peterson,k.r.,li,q.,skarpidi,e.,rohde,a.,shaw,s.e.,clegg,c.h.,asano,h.&stamatoyannopoulos,g.developmentalspecificityoftheinteractionbetweenthelocuscontrolregionandembryonicorfetalglobingenesintransgenicmicewithanhs3coredeletion.molecularandcellularbiology18,4188-4196(1998).46.li,q.&stamatoyannopoulos,g.hypersensitivesite5ofthehumanbetalocuscontrolregionfunctionsasachromatininsulator.blood84,1399-1401(1994).47.li,q.,zhang,m.,han,h.,rohde,a.&stamatoyannopoulos,g.evidencethatdnaseihypersensitivesite5ofthehumanbeta-globinlocuscontrolregionfunctionsasachromosomalinsulatorintransgenicmice.nucleicacidsres30,2484-2491(2002).48.puthenveetil,g.,scholes,j.,carbonell,d.,qureshi,n.,xia,p.,zeng,l.,li,s.,yu,y.,hiti,a.l.,yee,j.k.&malik,p.successfulcorrectionofthehumanbeta-thalassemiamajorphenotypeusingalentiviralvector.blood104,3445-3453(2004).49.wilber,a.,nienhuis,a.w.&persons,d.a.transcriptionalregulationoffetaltoadulthemoglobinswitching:newtherapeuticopportunities.blood117,3945-3953(2011).50.arumugam,p.i.,higashimoto,t.,urbinati,f.,modlich,u.,nestheide,s.,xia,p.,fox,c.,corsinotti,a.,baum,c.&malik,p.genotoxicpotentialoflineage-specificlentivirusvectorscarryingthebeta-globinlocuscontrolregion.molther17,1929-1937(2009).51.chang,k.h.,fang,x.,wang,h.,huang,a.,cao,h.,yang,y.,bonig,h.,stamatoyannopoulos,j.a.&papayannopoulou,t.epigeneticmodificationsandchromosomeconformationsofthebetaglobinlocusthroughoutdevelopment.stemcellreviews9,397-407(2013).52.papayannopoulou,t.,priestley,g.v.,rohde,a.,peterson,k.r.&nakamoto,b.hemopoieticlineagecommitmentdecisions:invivoevidencefromatransgenicmousemodelharboringmicrolcr-betapro-laczasatransgene.blood95,1274-1282(2000).53.nienhuis,a.w.developmentofgenetherapyforblooddisorders:anupdate.blood122,1556-1564(2013).54.baum,c.,kustikova,o.,modlich,u.,li,z.&fehse,b.mutagenesisandoncogenesisbychromosomalinsertionofgenetransfervectors.humgenether17,253-263(2006).55.nienhuis,a.w.,dunbar,c.e.&sorrentino,b.p.genotoxicityofretroviralintegrationinhematopoieticcells.molther13,1031-1049(2006).56.emery,d.w.theuseofchromatininsulatorstoimprovetheexpressionandsafetyofintegratinggenetransfervectors.humgenether22,761-774(2011).57.evans-galea,m.v.,wielgosz,m.m.,hanawa,h.,srivastava,d.k.&nienhuis,a.w.suppressionofclonaldominanceinculturedhumanlymphoidcellsbyadditionofthechs4insulatortoalentiviralvector.molther15,801-809(2007).58.rivella,s.,callegari,j.a.,may,c.,tan,c.w.&sadelain,m.thechs4insulatorincreasestheprobabilityofretroviralexpressionatrandomchromosomalintegrationsites.jvirol74,4679-4687(2000).59.emery,d.w.,yannaki,e.,tubb,j.&stamatoyannopoulos,g.achromatininsulatorprotectsretrovirusvectorsfromchromosomalpositioneffects.procnatlacadsciusa97,9150-9155(2000).60.emery,d.w.,yannaki,e.,tubb,j.,nishino,t.,li,q.&stamatoyannopoulos,g.developmentofvirusvectorsforgenetherapyofbetachainhemoglobinopathies:flankingwithachromatininsulatorreducesgamma-globingenesilencinginvivo.blood100,2012-2019(2002).61.yannaki,e.,tubb,j.,aker,m.,stamatoyannopoulos,g.&emery,d.w.topologicalconstraintsgoverningtheuseofthechickenhs4chromatininsulatorinoncoretrovirusvectors.molther5,589-598(2002).62.hino,s.,fan,j.,taguwa,s.,akasaka,k.&matsuoka,m.seaurchininsulatorprotectslentiviralvectorfromsilencingbymaintainingactivechromatinstructure.genether11,819-828(2004).63.ramezani,a.,hawley,t.s.&hawley,r.g.performance-andsafety-enhancedlentiviralvectorscontainingthehumaninterferon-betascaffoldattachmentregionandthechickenbeta-globininsulator.blood101,4717-4724(2003).64.ramezani,a.,hawley,t.s.&hawley,r.g.combinatorialincorporationofenhancer-blockingcomponentsofthechickenbeta-globin5'hs4andhumant-cellreceptoralpha/deltabead-1insulatorsinself-inactivatingretroviralvectorsreducestheirgenotoxicpotential.stemcells26,3257-3266(2008).65.yannaki,e.,emery,d.w.&stamatoyannopoulos,g.genetherapyforbeta-thalassaemia:thecontinuingchallenge.expertreviewsinmolecularmedicine12,e31(2010).66.persons,d.a.thechallengeofobtainingtherapeuticlevelsofgeneticallymodifiedhematopoieticstemcellsinbeta-thalassemiapatients.annnyacadsci1202,69-74(2010).67.perumbeti,a.&malik,p.therapyforbeta-globinopathies:abriefreviewanddeterminantsforsuccessfulandsafecorrection.annnyacadsci1202,36-44(2010).68.johnson,k.d.,grass,j.a.,park,c.,im,h.,choi,k.&bresnick,e.h.highlyrestrictedlocalizationofrnapolymeraseiiwithinalocuscontrolregionofatissue-specificchromatindomain.molecularandcellularbiology23,6484-6493(2003).69.vieira,k.f.,levings,p.p.,hill,m.a.,crusselle,v.j.,kang,s.h.,engel,j.d.&bungert,j.recruitmentoftranscriptioncomplexestothebeta-globingenelocusinvivoandinvitro.jbiolchem279,50350-50357(2004).70.levings,p.p.,zhou,z.,vieira,k.f.,crusselle-davis,v.j.&bungert,j.recruitmentoftranscriptioncomplexestothebeta-globinlocuscontrolregionandtranscriptionofhypersensitivesite3priortoerythroiddifferentiationofmurineembryonicstemcells.thefebsjournal273,746-755(2006).71.felsenfeld,g.&groudine,m.controllingthedoublehelix.nature421,448-453(2003).72.felsenfeld,g.chromatinasanessentialpartofthetranscriptionalmechanism.nature355,219-224(1992).73.brownell,j.e.&allis,c.d.specialhatsforspecialoccasions:linkinghistoneacetylationtochromatinassemblyandgeneactivation.curropingenetdev6,176-184(1996).74.kingston,r.e.&narlikar,g.j.atp-dependentremodelingandacetylationasregulatorsofchromatinfluidity.genes&development13,2339-2352(1999).75.tsukiyama,t.&wu,c.chromatinremodelingandtranscription.curropingenetdev7,182-191(1997).76.wolffe,a.p.,wong,j.&pruss,d.activatorsandrepressors:makinguseofchromatintoregulatetranscription.genestocells:devotedtomolecular&cellularmechanisms2,291-302(1997).77.kadonaga,j.t.eukaryotictranscription:aninterlacednetworkoftranscriptionfactorsandchromatin-modifyingmachines.cell92,307-313(1998).78.struhl,k.histoneacetylationandtranscriptionalregulatorymechanisms.genes&development12,599-606(1998).79.gross,d.s.&garrard,w.t.nucleasehypersensitivesitesinchromatin.annualreviewofbiochemistry57,159-197(1988).80.elgin,s.c.anatomyofhypersensitivesites.nature309,213-214(1984).81.wu,c.the5'endsofdrosophilaheatshockgenesinchromatinarehypersensitivetodnasei.nature286,854-860(1980).82.felsenfeld,g.,boyes,j.,chung,j.,clark,d.&studitsky,v.chromatinstructureandgeneexpression.procnatlacadsciusa93,9384-9388(1996).83.burgess-beusse,b.,farrell,c.,gaszner,m.,litt,m.,mutskov,v.,recillas-targa,f.,simpson,m.,west,a.&felsenfeld,g.theinsulationofgenesfromexternalenhancersandsilencingchromatin.procnatlacadsciusa99suppl4,16433-16437(2002).84.elgin,s.c.dnaasei-hypersensitivesitesofchromatin.cell27,413-415(1981).85.mcghee,j.d.,wood,w.i.,dolan,m.,engel,j.d.&felsenfeld,g.a200basepairregionatthe5'endofthechickenadultbeta-globingeneisaccessibletonucleasedigestion.cell27,45-55(1981).86.lowrey,c.h.,bodine,d.m.&nienhuis,a.w.mechanismofdnaseihypersensitivesiteformationwithinthehumanglobinlocuscontrolregion.procnatlacadsciusa89,1143-1147(1992).87.adams,c.c.&workman,j.l.bindingofdisparatetranscriptionalactivatorstonucleosomaldnaisinherentlycooperative.molecularandcellularbiology15,1405-1421(1995).88.mcarthur,m.,gerum,s.&stamatoyannopoulos,g.quantificationofdnasei-sensitivitybyreal-timepcr:quantitativeanalysisofdnasei-hypersensitivityofthemousebeta-globinlcr.jmolbiol313,27-34(2001).89.dorschner,m.o.,hawrylycz,m.,humbert,r.,wallace,j.c.,shafer,a.,kawamoto,j.,mack,j.,hall,r.,goldy,j.,sabo,p.j.,kohli,a.,li,q.,mcarthur,m.&stamatoyannopoulos,j.a.high-throughputlocalizationoffunctionalelementsbyquantitativechromatinprofiling.natmethods1,219-225(2004).90.sabo,p.j.,kuehn,m.s.,thurman,r.,johnson,b.e.,johnson,e.m.,cao,h.,yu,m.,rosenzweig,e.,goldy,j.,haydock,a.,weaver,m.,shafer,a.,lee,k.,neri,f.,humbert,r.,singer,m.a.,richmond,t.a.,dorschner,m.o.,mcarthur,m.,hawrylycz,m.,green,r.d.,navas,p.a.,noble,w.s.&stamatoyannopoulos,j.a.genome-scalemappingofdnaseisensitivityinvivousingtilingdnamicroarrays.natmethods3,511-518(2006).91.sabo,p.j.,hawrylycz,m.,wallace,j.c.,humbert,r.,yu,m.,shafer,a.,kawamoto,j.,hall,r.,mack,j.,dorschner,m.o.,mcarthur,m.&stamatoyannopoulos,j.a.discoveryoffunctionalnoncodingelementsbydigitalanalysisofchromatinstructure.procnatlacadsciusa101,16837-16842(2004).92.sabo,p.j.,humbert,r.,hawrylycz,m.,wallace,j.c.,dorschner,m.o.,mcarthur,m.&stamatoyannopoulos,j.a.genome-wideidentificationofdnaseihypersensitivesitesusingactivechromatinsequencelibraries.procnatlacadsciusa101,4537-4542(2004).93.thurman,r.e.,rynes,e.,humbert,r.,vierstra,j.,maurano,m.t.,haugen,e.,sheffield,n.c.,stergachis,a.b.,wang,h.,vernot,b.,garg,k.,john,s.,sandstrom,r.,bates,d.,boatman,l.,canfield,t.k.,diegel,m.,dunn,d.,ebersol,a.k.,frum,t.,giste,e.,johnson,a.k.,johnson,e.m.,kutyavin,t.,lajoie,b.,lee,b.k.,lee,k.,london,d.,lotakis,d.,neph,s.,neri,f.,nguyen,e.d.,qu,h.,reynolds,a.p.,roach,v.,safi,a.,sanchez,m.e.,sanyal,a.,shafer,a.,simon,j.m.,song,l.,vong,s.,weaver,m.,yan,y.,zhang,z.,zhang,z.,lenhard,b.,tewari,m.,dorschner,m.o.,hansen,r.s.,navas,p.a.,stamatoyannopoulos,g.,iyer,v.r.,lieb,j.d.,sunyaev,s.r.,akey,j.m.,sabo,p.j.,kaul,r.,furey,t.s.,dekker,j.,crawford,g.e.&stamatoyannopoulos,j.a.theaccessiblechromatinlandscapeofthehumangenome.nature489,75-82(2012).94.stergachis,a.b.,neph,s.,reynolds,a.,humbert,r.,miller,b.,paige,s.l.,vernot,b.,cheng,j.b.,thurman,r.e.,sandstrom,r.,haugen,e.,heimfeld,s.,murry,c.e.,akey,j.m.&stamatoyannopoulos,j.a.developmentalfateandcellularmaturityencodedinhumanregulatorydnalandscapes.cell154,888-903(2013).95.neph,s.,stergachis,a.b.,reynolds,a.,sandstrom,r.,borenstein,e.&stamatoyannopoulos,j.a.circuitryanddynamicsofhumantranscriptionfactorregulatorynetworks.cell150,1274-1286(2012).96.maurano,m.t.,humbert,r.,rynes,e.,thurman,r.e.,haugen,e.,wang,h.,reynolds,a.p.,sandstrom,r.,qu,h.,brody,j.,shafer,a.,neri,f.,lee,k.,kutyavin,t.,stehling-sun,s.,johnson,a.k.,canfield,t.k.,giste,e.,diegel,m.,bates,d.,hansen,r.s.,neph,s.,sabo,p.j.,heimfeld,s.,raubitschek,a.,ziegler,s.,cotsapas,c.,sotoodehnia,n.,glass,i.,sunyaev,s.r.,kaul,r.&stamatoyannopoulos,j.a.systematiclocalizationofcommondisease-associatedvariationinregulatorydna.science337,1190-1195(2012).97.stergachis,a.b.,haugen,e.,shafer,a.,fu,w.,vernot,b.,reynolds,a.,raubitschek,a.,ziegler,s.,leproust,e.m.,akey,j.m.&stamatoyannopoulos,j.a.exonictranscriptionfactorbindingdirectscodonchoiceandaffectsproteinevolution.science342,1367-1372(2013).98.neph,s.,vierstra,j.,stergachis,a.b.,reynolds,a.p.,haugen,e.,vernot,b.,thurman,r.e.,john,s.,sandstrom,r.,johnson,a.k.,maurano,m.t.,humbert,r.,rynes,e.,wang,h.,vong,s.,lee,k.,bates,d.,diegel,m.,roach,v.,dunn,d.,neri,j.,schafer,a.,hansen,r.s.,kutyavin,t.,giste,e.,weaver,m.,canfield,t.,sabo,p.,zhang,m.,balasundaram,g.,byron,r.,maccoss,m.j.,akey,j.m.,bender,m.a.,groudine,m.,kaul,r.&stamatoyannopoulos,j.a.anexpansivehumanregulatorylexiconencodedintranscriptionfactorfootprints.nature489,83-90(2012).99.ramezani,a.,hawley,t.s.&hawley,r.g.stablegammaretroviralvectorexpressionduringembryonicstemcell-derivedinvitrohematopoieticdevelopment.molther14,245-254(2006).100.recillas-targa,f.,pikaart,m.j.,burgess-beusse,b.,bell,a.c.,litt,m.d.,west,a.g.,gaszner,m.&felsenfeld,g.position-effectprotectionandenhancerblockingbythechickenbeta-globininsulatorareseparableactivities.procnatlacadsciusa99,6883-6888(2002).101.gaszner,m.&felsenfeld,g.insulators:exploitingtranscriptionalandepigeneticmechanisms.natrevgenet7,703-713(2006).102.wallace,j.a.&felsenfeld,g.wegathertogether:insulatorsandgenomeorganization.curropingenetdev17,400-407(2007).103.chung,j.h.,bell,a.c.&felsenfeld,g.characterizationofthechickenbeta-globininsulator.procnatlacadsciusa94,575-580(1997).104.bell,a.c.,west,a.g.&felsenfeld,g.theproteinctcfisrequiredfortheenhancerblockingactivityofvertebrateinsulators.cell98,387-396(1999).105.ryu,b.y.,persons,d.a.,evans-galea,m.v.,gray,j.t.&nienhuis,a.w.achromatininsulatorblocksinteractionsbetweenglobinregulatoryelementsandcellularpromotersinerythroidcells.bloodcellsmoldis39,221-228(2007).106.ryu,b.y.,evans-galea,m.v.,gray,j.t.,bodine,d.m.,persons,d.a.&nienhuis,a.w.anexperimentalsystemfortheevaluationofretroviralvectordesigntodiminishtheriskforproto-oncogeneactivation.blood111,1866-1875(2008).107.yao,s.,osborne,c.s.,bharadwaj,r.r.,pasceri,p.,sukonnik,t.,pannell,d.,recillas-targa,f.,west,a.g.&ellis,j.retrovirussilencerblockingbythechs4insulatorisctcfindependent.nucleicacidsres31,5317-5323(2003).108.nishino,t.,tubb,j.&emery,d.w.partialcorrectionofmurinebeta-thalassemiawithagammaretrovirusvectorforhumangamma-globin.bloodcellsmoldis37,1-7(2006).109.aker,m.,tubb,j.,groth,a.c.,bukovsky,a.a.,bell,a.c.,felsenfeld,g.,kiem,h.p.,stamatoyannopoulos,g.&emery,d.w.extendedcoresequencesfromthechs4insulatorarenecessaryforprotectingretroviralvectorsfromsilencingpositioneffects.humgenether18,333-343(2007).110.li,c.l.&emery,d.w.thechs4chromatininsulatorreducesgammaretroviralvectorsilencingbyepigeneticmodificationsofintegratedprovirus.genether15,49-53(2008).111.ma,y.,ramezani,a.,lewis,r.,hawley,r.g.&thomson,j.a.high-levelsustainedtransgeneexpressioninhumanembryonicstemcellsusinglentiviralvectors.stemcells21,111-117(2003).112.chang,l.j.,liu,x.&he,j.lentiviralsirnastargetingmultiplehighlyconservedrnasequencesofhumanimmunodeficiencyvirustype1.genether12,1133-1144(2005).113.pluta,k.,luce,m.j.,bao,l.,agha-mohammadi,s.&reiser,j.tightcontroloftransgeneexpressionbylentivirusvectorscontainingsecond-generationtetracycline-responsivepromoters.jgenemed7,803-817(2005).114.jakobsson,j.,rosenqvist,n.,thompson,l.,barraud,p.&lundberg,c.dynamicsoftransgeneexpressioninaneuralstemcelllinetransducedwithlentiviralvectorsincorporatingthechs4insulator.experimentalcellresearch298,611-623(2004).115.leboulch,p.,huang,g.m.,humphries,r.k.,oh,y.h.,eaves,c.j.,tuan,d.y.&london,i.m.mutagenesisofretroviralvectorstransducinghumanbeta-globingeneandbeta-globinlocuscontrolregionderivativesresultsinstabletransmissionofanactivetranscriptionalstructure.emboj13,3065-3076(1994).116.kim,t.h.,abdullaev,z.k.,smith,a.d.,ching,k.a.,loukinov,d.i.,green,r.d.,zhang,m.q.,lobanenkov,v.v.&ren,b.analysisofthevertebrateinsulatorproteinctcf-bindingsitesinthehumangenome.cell128,1231-1245(2007).117.yusufzai,t.m.&felsenfeld,g.the5'-hs4chickenbeta-globininsulatorisactcf-dependentnuclearmatrix-associatedelement.procnatlacadsciusa101,8620-8624(2004).118.phillips,j.e.&corces,v.g.ctcf:masterweaverofthegenome.cell137,1194-1211(2009).119.giles,k.e.,gowher,h.,ghirlando,r.,jin,c.&felsenfeld,g.chromatinboundaries,insulators,andlong-rangeinteractionsinthenucleus.coldspringharborsymposiaonquantitativebiology75,79-85(2010).120.barski,a.,cuddapah,s.,cui,k.,roh,t.y.,schones,d.e.,wang,z.,wei,g.,chepelev,i.&zhao,k.high-resolutionprofilingofhistonemethylationsinthehumangenome.cell129,823-837(2007).121.wang,h.,maurano,m.t.,qu,h.,varley,k.e.,gertz,j.,pauli,f.,lee,k.,canfield,t.,weaver,m.,sandstrom,r.,thurman,r.e.,kaul,r.,myers,r.m.&stamatoyannopoulos,j.a.widespreadplasticityinctcfoccupancylinkedtodnamethylation.genomeresearch22,1680-1688(2012).122.schmidt,d.,schwalie,p.c.,wilson,m.d.,ballester,b.,goncalves,a.,kutter,c.,brown,g.d.,marshall,a.,flicek,p.&odom,d.t.wavesofretrotransposonexpansionremodelgenomeorganizationandctcfbindinginmultiplemammalianlineages.cell148,335-348(2012).123.renda,m.,baglivo,i.,burgess-beusse,b.,esposito,s.,fattorusso,r.,felsenfeld,g.&pedone,p.v.criticaldnabindinginteractionsoftheinsulatorproteinctcf:asmallnumberofzincfingersmediatestrongbinding,andasinglefinger-dnainteractioncontrolsbindingatimprintedloci.jbiolchem282,33336-33345(2007).124.dickson,j.,gowher,h.,strogantsev,r.,gaszner,m.,hair,a.,felsenfeld,g.&west,a.g.vezf1elementsmediateprotectionfromdnamethylation.plosgenet6,e1000804(2010).125.li,c.l.,xiong,d.,stamatoyannopoulos,g.&emery,d.w.genomicandfunctionalassaysdemonstratereducedgammaretroviralvectorgenotoxicityassociatedwithuseofthechs4chromatininsulator.molther17,716-724(2009).126.lisowski,l.&sadelain,m.locuscontrolregionelementshs1andhs4enhancethetherapeuticefficacyofglobingenetransferinbeta-thalassemicmice.blood110,4175-4178(2007).127.nagel,r.l.,bookchin,r.m.,johnson,j.,labie,d.,wajcman,h.,isaac-sodeye,w.a.,honig,g.r.,schiliro,g.,crookston,j.h.&matsutomo,k.structuralbasesoftheinhibitoryeffectsofhemoglobinfandhemoglobina2onthepolymerizationofhemoglobins.procnatlacadsciusa76,670-672(1979).128.sadelainetal.,proc.nat’lacad.sci.(usa)(1995);92:6728-6732.129.armstrong,j.a.,emerson,b.m.,1996.nfe2disruptschromatinstructureathumanfl-globinlocuscontrolregionhypersensitivesite2invitro.mol.cell.biol.16,5634-5644.130.caterina,j.j.,ciavatta,d.j.,donze,d.,behringer,r.r.,townes,t.m.,1994.multipleelementsinhumanfl-globinlocuscontrolregion5'hs2areinvolvedinenhanceractivityandposition-independenttransgeneexpression.nucleicacidsres.22,10061011.131.moi,p.,kan,y.w.,1990.synergisticenhancementofglobingeneexpressionbyactivatorprotein-l-likeproteins.proc.natl.acad,sci.usa87,9000-9004.132.ney,p.,sorrentino,b.,mcdonagh,k.,nienhuis,a.,1990.tandemap-l-bindingsiteswithinthehuman/j-globindominantcontrolregionfunctionasaninducibleenhancerinerythroidcells.genesdev.4,9931006.133.shivdasani,r.a.,rosenblatt,m.f.,zucker-franklin,d.,jackson,c.w.,hunt,p.,saris,c.j.m.,orkin,s.h.,1995.transcriptionfactornf-e2isrequiredforplateletformationindependentoftheactionsofthrombopoietin/mgdfinmegakaryocytedevelopment.cell81,695-704.134.talbot,d.,grosveld,f.,1991.the5'hs2oftheglobinlocuscontrolregionenhancestranscriptionthroughtheinteractionofamultimericcomplexbindingattwofunctionallydistinctnf-e2bindingsites.emboj.10,1391-1398.135.hardisonetal.,gene(1997);205:73-94.136.elnitskietal.,thejournalofbiologicalchemistry(1997);272(1):369-378;horaketal.,pnas(2002);99(5):2924-2929.137.shimotsumaetal.,journalofbiologicalchemistry(2010);285(19):14495-14503.从前面的描述中,将显而易见的是,可以对本文所述的本发明公开的主题进行变化和修改以将其应用于各种用途和条件。此类实施方式也在权利要求的范围内。本说明书中提到的通过登录号或参考号提及的所有专利和出版物以及序列并入本文以供参考,这与如果每个独立的专利和出版物以及序列被具体地和单独地指示并入本文以供参考相同。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1