调控转基因表达的方法和组合物的制作方法

文档序号：511305阅读：369来源：国知局

调控转基因表达的方法和组合物的制作方法
【专利摘要】核酸酶和使用这些核酸酶在分泌组织、无性系和由此来源的动物中表达来自安全港基因座的转基因的方法。
【专利说明】调控转基因表达的方法和组合物
[0001]相关申请案的交叉引用
[0002]本申请要求2011年9月21日提交的美国临时申请案N0.61/537，349、2011年11月16日提交的美国临时申请案61/560，506和2012年7月11日提交的美国临时申请案61/670，490的利益，其公开内容据此通过引用整体并入。
【技术领域】
[0003]本发明属于基因组编辑领域。
[0004]发明背景
[0005]对于人类治疗的新纪元，基因疗法拥有巨大潜力。这些方法论将允许治疗标准医学实践尚不可解决的病状。基因疗法可包括基因组编辑技术的许多变型，例如破坏或修正基因座和插入可通过与转基因融合的特异性外源启动子或在插入基因组的位点发现的内源启动子控制的可表达转基因。
[0006]递送和插入转基因是对这种技术的任何真正实现必须解决的障碍的实例。例如，虽然有多种基因递送方法潜在可用于治疗使用，但是全部牵涉安全性、持久性和表达水平之间的大体权衡。提供转基因作为附加体(例如基本腺病毒、AAV和基于质粒的系统)的方法通常安全并且可产生高的初始表达水平，然而，这些方法缺乏稳健的附加体复制，这可能限制有丝分裂活跃组织中表达的持续时间。相反，导致所需转基因随机整合(例如整合慢病毒)的递送方法提供了更持久的表达，但是由于随机插入的非靶向特性，可能引起受体细胞生长不受调节，可能经由邻近随机整合的转基因盒的致癌基因活化导致恶性肿瘤。而且，虽然转基因整合避免了复制驱动的损失，但是未防止与转基因融合的外源启动子的最终沉默。随时间推移，对于大多数随机插入事件而言，此类沉默导致转基因表达减少。另外，转基因的整合很少在每个靶细胞中发生，这可使得难以达到目标转基因足够高的表示水平而不能达到所需疗效。
[0007]近年来，已经研发了新的转基因整合策略，其使用位点特异性核酸酶裂解以使插入偏向所选基因座(见，例如，共有美国专利7，888，121)。与经典整合方法相比，这种方法提供了提高转基因表达、增加安全性和表达持久性的前景，因为它允许精确的转基因定位，以使基因沉默或附近致癌基因活化的风险最小。
[0008]一种方法牵涉向其同源基因座插入转基因，例如向内源基因座插入野生型转基因以修正突变基因。可选地，转基因可插入因其有益性质而特别选择的非同源基因座中。见，例如，关于因子IX(FIX)转基因靶向插入的美国专利公布N0.20120128635。如果希望用转基因取代内源基因的表达，同时仍维持内源调控元件发挥的表达控制，则靶向同源基因座可能有用。可使用在内源基因座内或附近裂解的特异性核酸酶并且可通过同源介导的修复(HDR)或通过非同源末端连接(NHEJ)期间的末端捕获在裂解位点整合转基因。使用或不使用转基因供体中供体和内源基因座之间的同源区域确定整合过程。
[0009]可选地，可将转基因插入可利用在安全港基因座处发现的启动子或允许在插入之前与转基因融合的外源启动子表达调控转基因的基因组中的特异性“安全港”位置。已经描述了几个此类“安全港”基因座，包括人类细胞中的AAVSl和CCR5基因及鼠类细胞中的Rosa26(见，例如，共有美国专利申请 n0.20080299580、20080159996 和 201000218264)。如上所述，可利用对安全港有特异性的核酸酶，以便通过HDR或NHEJ驱动的过程插入转基因构建体。
[0010]基因疗法的一个特别吸引人的应用牵涉治疗由分泌基因产物不足引起的病症或可通过分泌治疗性蛋白质治疗的病症。通过向适量细胞递送治疗性转基因可潜在解决此类病症，条件是每个受体细胞表达高水平的治疗性基因产物。在这种情况下，减少向大量细胞递送基因的需要可使得能够成功研发对其它顽固指征的基因疗法。此类应用将需要永久、安全且极高水平的转基因表达。因此研发表现出这些性质的安全港将提供在基因疗法领域中的实质实用性。
[0011]大量病症由分泌基因产物不足引起或可通过分泌治疗性蛋白质治疗。例如，凝血障碍是相当常见的遗传病，其中凝血级联中的因子以某种方式异常，即缺乏突变蛋白质的表达或生成。大多数凝血障碍导致血友病，例如甲型血友病(因子VIII缺乏)、乙型血友病(因子IX缺乏)或丙型血友病(因子XI缺乏)。对这些病症的治疗往往与严重程度相关。对于中度血友病，治疗可牵涉设计用于增加低表达因子的表达的疗法，而对于更严重的血友病，疗法牵涉定期输注缺少的凝血因子(常常每周2-3次)以防流血事件。往往不鼓励有严重血友病的患者参加许多类型的运动并且必须采取额外预防措施以避免每天受伤。[0012]α -1抗胰蛋白酶(AlAT)缺乏症是α 1_抗胰蛋白酶生成缺陷引起的，导致血液和肺部中AlAT水平不足的常染色体隐性疾病。其可与慢性阻塞性肺病(COPD)和肝病相关。当前，与这种缺乏症相关的疾病的治疗可牵涉输注外源AlAT或肺或肝移植。
[0013]溶酶体贮积病(LSD)是一类罕见的代谢单基因疾病，其特征在于缺乏通常在废脂质、糖蛋白和粘多糖分解中所牵涉的个别功能溶酶体蛋白。这些疾病的特征在于这些化合物在细胞中累积，因为它由于特异性酶失效而不能加工这些化合物进行回收。常见实例包括高雪氏病(Gaucher’ s disease)(葡糖脑苷脂酶缺乏症-基因名称:GBA)、法布里病(Fabry’s disease) ( α半乳糖苷酶缺乏症-GLA)、亨特氏病(Hunter’s disease)(艾杜糖醒酸-2-硫酸酯酶缺乏症-1DS)、贺勒氏病(Hurler’s disease) ( a-L艾杜糖醒酸酶缺乏症-1DUA)和尼曼-匹克氏病(Niemann-Pick’ s disease)(神经鞘磷脂磷酸二脂酶I缺乏症-SMPD1)。当分组在一起时，LSD的人口发病率为7000个出生人数中约I个。这些疾病对患病人口有破坏性影响。这些疾病通常在可能具有特征面部和身体生长模式并且可能有中度到重度智力迟钝的婴儿中首次诊出。治疗选择包括酶替代疗法(ERT)，其中通常通过大剂量静脉注射给予患者缺少的酶。此类治疗仅仅治疗症状而不能治愈，因此在患者余生必须给予患者重复剂量的这些蛋白质，并且可能发展出注射蛋白质的中和抗体。往往这些蛋白质的血清半衰期短，所以患者还必须忍耐频繁输注蛋白质。例如，接受Cerezyme?产品(伊米苷酶)的高雪氏病患者必须每周输注3次。酶的生成和纯化也成问题，所以治疗非常昂贵(每位患者每年>$100, 000)。
[0014]I型糖尿病是免疫介导的胰岛β细胞破坏导致这些细胞的主要分泌产物胰岛素极度缺乏的病症。基线胰岛素水平的恢复提供从这种病症的许多更严重的并发症的实质性缓解,所述并发症可包括牵涉大血管的“大血管”并发症:缺血性心脏病(绞痛和心肌梗塞)、中风和周围性血管疾病，以及由于对小血管损伤引起的“小血管”并发症。小血管并发症可包括糖尿病性视网膜病，其影响眼睛视网膜中的血管形成，并且可导致可见症状、视力下降并且可能失明，和糖尿病肾病，其可牵涉肾组织中的疤痕变化、尿中少量或量越来越大的蛋白质损失和最终需要透析的慢性肾病。糖尿病神经病变可引起足部麻木、发麻和疼痛并且，连同腿部的血管疾病一起，促成可能难以治疗并且由于相关感染，有时需要切除的糖尿病相关足部问题(例如糖尿病足部溃疡)的风险。
[0015]抗体是已经开发其结合可塑性用于研发各种各样的疗法的分泌蛋白质产物。治疗性抗体可用于中和直接引起疾病的靶蛋白(例如黄斑变性中的VEGF)以及高度选择性杀伤其存留和复制危及管道的细胞(例如癌细胞以及自身免疫性疾病中的某些免疫细胞)。在此类应用中，治疗性抗体利用对其自身抗体的正常反应实现选择性杀伤、中和或清除靶蛋白或带有抗体靶抗原的细胞。因此抗体疗法已经广泛应用于许多人类病状，包括肿瘤学、风湿病学、移植和眼病。抗体治疗剂的实例包括治疗黄斑变性的Lucentis? (Genentech)、治疗非霍奇金淋巴瘤(Non-Hodgkin lymphoma)的Rituxan? (Biogen Idee)和治疗乳腺癌的Herceptin? (Genentech)。白蛋白是在肝脏中生成并分泌到血液中的蛋白质。在人
类中，血清白蛋白包含60%在血液中发现的蛋白质，并且其功能似乎是通过调节胶体渗透压调节血容量。其还用作低溶解性分子的载体，例如脂溶性激素、胆汁盐、游离脂肪酸、钙和转铁蛋白。另外，血清白蛋白携带治疗剂，包括华法令(warfarin)、phenobutazone、安妥明(clofibrate)和苯妥英(phenytoin)。在人类中，白蛋白基因座高度表达，导致每天生成约15g白蛋白。白蛋白没有自分泌功能，并且似乎没有与单等位基因敲除相关的任何表现型并且对双等位基因敲除而言仅发现轻微的表现型观测资料(见Watkins等(1994) Proc NatlAcad Sci USA91:9417)?
[0016]当与治疗试剂配合时，白蛋白已经用于增加治疗剂的血清半衰期。例如，Osborn等(J Pharm Exp Thera(2002) 303 (2): 540)公开了血清白蛋白干扰素α融合蛋白的药代动力学并且证明融合蛋白具有慢约140倍的清除率，以致融合半衰期比单独的干扰素α蛋白长18倍。最近正在研发的为白蛋白融合的治疗性蛋白质的其它实例包括Albulin-G?、Cardeva? 和 Albugranin?(Teva Pharmaceutical Industries,分别与膜岛素、b_ 型促
尿钠排泄药或GCSF融合)、Syncria? (GlaxoSmithKline,与胰高血糖素样肽-1融合)和与 IFN-α 融合的 Albuferon α-2Β (见 Current Opinion in Drug Discovery andDevelopment, (2009),第 12 卷，N0.2.第 288 页)。在这些情况下，Albulin-G?、Cardeva?
和Syncria?全部是在融合N端发现白蛋白的融合蛋白，而Albugranin11^P Albuferon a 2G是白蛋白在融合C端的融合蛋白。
[0017]因此，仍需要可用于在治疗相关水平表达所需转基因，同时避免任何相关毒性并且可限制转基因向所需组织类型的表达，例如以治疗遗传病如血友病、糖尿病、溶酶体贮积病和AlAT缺乏症的其他方法和组合物。另外，仍需要在治疗相关水平表达所需转基因，以治疗其它疾病例如癌症的其他方法和组合物。
[0018]发明概述
[0019]本文公开了在细胞基因组中产生安全港，以便转基因靶向插入和随后表达，例如从分泌组织(例如肝脏)表达转基因的方法和组合物。一方面，本文描述了与基因组中目标区域(例如，白蛋白基因)内的靶位点结合的非天然存在的锌指蛋白(ZFP)，其中ZFP包含一个或多个工程化锌指结合结构域。在一个实施方案中，ZFP是裂解目标靶基因组区域的锌指核酸酶(ZFN)，其中ZFN包含一个或多个工程化锌指结合结构域和核酸酶裂解结构域或裂解半结构域。例如，可由各种限制性内切核酸酶和/或归巢内切核酸酶获得裂解结构域和裂解半结构域。在一个实施方案中，裂解半结构域源自IIS型限制性内切核酸酶(例如，Fok I)。在某些实施方案中，锌指结构域识别白蛋白基因中的靶位点，例如具有表1、3、5或8的单行中有序示出的识别螺旋结构域的锌指蛋白。
[0020]另一方面，本文描述了与基因组中目标区域(例如，白蛋白基因)内的靶位点结合的转录激活因子样效应子(TALE)蛋白，其中TALE包含一个或多个工程化TALE结合结构域。在一个实施方案中，TALE是裂解目标靶基因组区域的核酸酶(TALEN)，其中TALEN包含一个或多个工程化TALE DNA结合结构域和核酸酶裂解结构域或裂解半结构域。例如，可由各种限制性内切核酸酶和/或归巢内切核酸酶获得裂解结构域和裂解半结构域。在一个实施方案中，裂解半结构域源自IIS型限制性内切核酸酶(例如，Fok I)。在某些实施方案中，TALE DNA结合结构域识别白蛋白基因中的靶位点，例如具有表12的单行中示出的靶序列的TALE DNA结合结构域。[0021]本文所述的ZFN和/或TALEN可结合和/或裂解所述基因内或邻近的编码或非编码区，例如前导序列、尾随序列或内含子，或编码区上游或下游的非转录区中的目标区域。在某些实施方案中，ZFN结合和/或裂解白蛋白基因。在其它实施方案中，ZFN和/或TALEN结合和/或裂解安全港基因，例如CCR5基因、PPP1R12C(也称为AAVS1)基因或Rosa基因。见，例如，美国专利公布N0.20080299580、20080159996和201000218264。另一方面，本文描述了包含本文所述的一种或多种锌指和/或TALE核酸酶的组合物。在某些实施方案中，所述组合物包含一种或多种锌指和/或TALE核酸酶连同药学上可接受的赋形剂。
[0022]另一方面，本文描述了编码本文所述一种或多种ZFN和/或TALEN的多核苷酸。多核苷酸可为，例如，mRNA。在一些方面，mRNA可经化学修饰(见例如Kormann等，(2011)Nature Biotechnology29(2):154-157)。
[0023]另一方面，本文描述了包含编码本文所述一种或多种ZFN和/或TALEN，与启动子可操作连接的多核苷酸的ZFN和/或TALEN表达载体。在一个实施方案中，表达载体为病毒载体。一方面，病毒载体表现出组织特异性向性。
[0024]另一方面，本文描述了包含一种或多种ZFN和/或TALEN表达载体的宿主细胞。宿主细胞可经一种或多种ZFP和/或TALEN表达载体稳定转化或瞬时转染或其组合。在一个实施方案中，宿主细胞为胚胎干细胞。在其它实施方案中，所述一种或多种ZFP和/或TALEN表达载体在宿主细胞中表达一种或多种ZFN和/或TALEN。在另一实施方案中，宿主细胞可进一步包含外源多核苷酸供体序列。适合宿主细胞的非限制性实例包括真核细胞或细胞系，例如分泌细胞(例如，肝细胞、粘膜细胞、唾液腺细胞、垂体细胞等)、血细胞(红细胞)、干细胞等。在本文所述任何实施方案中，宿主细胞可包括(例如)小鼠、大鼠、兔或其它哺乳动物细胞胚胎的胚胎细胞。
[0025]另一方面，本文描述了裂解细胞中的白蛋白基因的方法，所述方法包括:在以便表达ZFN或TALEN和裂解所述一种或多种白蛋白基因的条件下，向所述细胞中引入编码与所述一种或多种白蛋白基因中的靶位点结合的一种或多种ZFN和/或TALEN的一种或多种多核苷酸。
[0026]在其它实施方案中，例如使用本文所述的ZFN或TALEN(或编码所述ZFN或TALEN的载体)和在用ZFN和/或TALEN靶向裂解后插入基因内的“供体”序列(例如，转基因)置换任何靶基因中的基因组序列。供体序列可存在于ZFN或TALEN载体中，存在于单独载体(例如，Ad或LV载体)中或，可选地，可使用不同核酸递送机制引入细胞中。供体核苷酸序列这样插入靶基因座(例如，白蛋白基因、其它安全港基因等)导致供体携带的转基因在靶基因座(例如白蛋白)的遗传控制元件的控制下表达。在一些方面，例如向白蛋白基因中插入目标转基因导致完整外源蛋白质序列表达而缺乏所有白蛋白编码氨基酸。在其它方面，表达的外源蛋白是融合蛋白并且包含转基因和白蛋白基因(例如，来自内源靶基因座或可选地来自转基因上的白蛋白编码序列)编码的氨基酸。在一些情况下，白蛋白序列将存在于外源蛋白质的氨基(N)端部分，而在其它情况下，白蛋白序列将存在于外源蛋白质的羧基(C)端部分。在其它情况下，白蛋白序列将存在于外源蛋白质的N和C端部分。白蛋白序列可包括全长野生型或突变型白蛋白序列或，可选地，可包括部分白蛋白氨基酸序列。在某些实施方案中，白蛋白序列(全长或部分)用于增加与之融合的转基因表达的多肽的血清半衰期和/或用作载体。在一些实施方案中，白蛋白-转基因融合体位于细胞内的内源基因座，而在其它实施方案中，白蛋白-转基因编码序列插入基因组内的安全港中。在一些方面，安全港选自AAVSl、Rosa、HPRT或CCR5基因座(见共有美国专利公布N0.20080299580、20080159996 和 201000218264 及美国临时专利申请 N0.61/556，691)。
[0027]另一方面，本发明描述了可用于在体内白蛋白启动子(例如，内源或外源白蛋白启动子)的控制下表达转基因的方法和组合物。在一些方面，转基因可编码目标治疗性蛋白质。转基因可编码蛋白质，以致本发明的方法可用于生成缺乏或不足的蛋白质(例如，“蛋白质替代”)。在一些情况下，蛋白质可能是溶酶体贮积病涉及的治疗。可表达其它治疗性蛋白质，包括与大疱性表皮松解或AAT缺乏型肺气肿一样多种多样的病状的蛋白质治疗剂。在其它方面，转基因可包含序列(例如，工程化序列)，以致表达的蛋白质具有给予其新的和可取的特性(半衰期增加、血浆清除率特征变化等)的特征。工程化序列也可包括源自白蛋白序列的氨基酸。在一些方面，转基因编码治疗性蛋白质、治疗性激素、血浆蛋白、抗体等。在一些方面，转基因可编码血液疾病例如凝血障碍中牵涉的蛋白质。在一些方面，转基因编码结构核酸(shRNA、miRNA等)。
[0028]在一些实施方案中，本发明的方法可在体内用于转基因动物系统中。在一些方面，转基因动物可用于转基因编码人类基因的模型研发。在一些情况下，转基因动物可在相应内源基因座敲除，允许研发可独立研究人类蛋白质的体内系统。此类转基因模型可用于筛选目的，以鉴定小分子、大分子或可与目标人类蛋白质相互作用或对其进行修饰的其它实体。在其它方面，转基因动物可用于生产目的，例如，生成抗体或其它目标生物分子。在某些实施方案中，动物为小的哺乳动物，例如狗、兔或啮齿动物例如大鼠、小鼠或豚鼠。在其它实施方案中，动物为非人灵长类动物。在其它实施方案中，动物为家畜例如牛、山羊或猪。在一些方面，转基因整合到通过本文所述任何方法获得的干细胞(例如，胚胎干细胞、诱导多能干细胞、肝干细胞等)或动物胚胎中的选定基因座(例如，白蛋白或安全港)中，然后植入胚胎，以便产出活动物。然后将动物饲养至性成熟并使其产出子代，其中至少一些子代包含整合的转基因。[0029]又一方面，本文提供了向染色体的内源基因座(例如，白蛋白基因)，例如向胚胎的染色体中位点特异性整合核酸序列的方法。在某些实施方案中，所述方法包括:(a)为胚胎注射(i)至少一种DNA载体，其中所述DNA载体包含在要整合的核酸序列侧面的上游序列和下游序列，和(ii)编码识别靶基因座(例如，白蛋白基因座)中的整合位点的锌指和/或TALE核酸酶的至少一种RNA分子，并且(b)培养胚胎以允许锌指和/或TALE核酸酶表达，其中通过与DNA载体的同源重组修复通过锌指核酸酶或TALEN引入整合位点的双链断裂，以便将核酸序列整合到染色体中。
[0030]适合胚胎可源自几种不同的脊椎动物物种，包括哺乳动物、鸟类、爬行动物、两栖动物和鱼类。一般而言，适合胚胎是可收集、注射并培养以允许锌指或TALE核酸酶表达的胚胎。在一些实施方案中，适合胚胎可包括来自小型哺乳动物(例如，啮齿动物、兔等)、宠物、牲畜和灵长类动物的胚胎。啮齿动物的非限制性实例可包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。宠物的非限制性实例可包括猫、狗、兔、刺猬和雪貂。牲畜的非限制性实例可包括马、山羊、绵羊、猪、骆骑、羊骑和牛。灵长类动物的非限制性实例可包括卷尾猴、黑猩猩、狐猴、猕猴、狨猴、絹毛猴、蜘蛛猴、松鼠猴和长尾黑颚猴。在其它实施方案中，适合胚胎可包括来自鱼、爬行动物、两栖动物或鸟的胚胎。可选地，适合胚胎可能是昆虫胚胎，例如果蝇(Drosophila)胚胎或蚊子(mosquito)胚胎。
[0031]在本文所述的任何方法或组合物中，含工程化基因座(例如，白蛋白基因座)的细胞可为干细胞。可与本发明的方法和组合物一起使用的特定干细胞类型包括胚胎干细胞(ESC)、诱导多能干细胞(iPSC)、肝或肝脏干细胞。iPSC可源自患者样品和正常对照，其中患者来源的iPSC可在目标基因处突变为正常基因序列，或可在目标基因处将正常细胞改变为已知疾病等位基因。类似地，可从患者中分离肝干细胞。然后工程化这些细胞以表达目标转基因，扩展，然后再引入患者体内。
[0032]在本文所述的任何方法中，编码锌指核酸酶和/或TALEN的多核苷酸可包含DNA、RNA或其组合。在某些实施方案中，多核苷酸包含质粒。在其它实施方案中，编码核酸酶的多核苷酸包含mRNA。
[0033]还提供了包含至少一种DNA载体的胚胎，其中所述DNA载体包含在要整合的核酸序列侧面的上游序列和下游序列，和编码识别染色体整合位点的锌指核酸酶的至少一种RNA分子。还提供了源自本文所述任何胚胎(例如，使其发育至性成熟并产出后代的胚胎)的生物体。
[0034]另一方面，通过本发明的方法和组合物提供了在筛选用于治疗患有凝血因子病症的动物的药物库和/或其它治疗性组合物(即，抗体、结构RNA等)中细胞、细胞系和动物(例如，转基因动物)的用途。此类筛选可用操纵细胞系或原代细胞从细胞水平开始，并且可进展到整个动物(例如，人)的治疗水平。
[0035]还提供了包含本发明的ZFP和/或TALEN的试剂盒。试剂盒可包含编码ZFP或TALEN的核酸(例如，适合表达载体中所含的RNA分子或ZFP或TALEN编码基因)、供体分子、适合宿主细胞系、执行本发明方法的说明书等。
[0036]因此，本文的公开内容包括但不限于下列实施方案:
[0037]1.一种非天然存在的融合蛋白，其包含与内源白蛋白基因和裂解结构域结合的DNA结合蛋白，其中所述融合蛋白修饰了所述内源白蛋白基因。[0038]2.根据实施方案I所述的融合蛋白，其中所述DNA结合蛋白包括锌指蛋白。
[0039]3.根据实施方案2所述的融合蛋白，其中所述锌指蛋白包含4、5或6个包含识别螺旋区的锌指结构域，其中所述锌指蛋白包含在表1、表3、表5或表8的单行中示出的识别螺旋区。
[0040]4.根据实施方案I所述的融合蛋白，其中所述DNA结合蛋白包含TALE DNA结合结构域。
[0041]5.根据实施方案4所述的融合蛋白，其中所述TALE DNA结合结构域与表12的单行中示出的靶序列结合。
[0042]6.一种多核苷酸,其编码根据实施方案1-5所述的一种或多种融合蛋白。
[0043]7.一种分离细胞，其包含根据实施方案1-5所述的一种或多种融合蛋白或根据实施方案6所述的一种或多种多核苷酸。
[0044]8.根据实施方案7所述的细胞，其中所述细胞为干细胞或胚胎细胞。
[0045]9.根据实施方案8所述的细胞，其中所述干细胞选自胚胎干细胞(ESC)、诱导多能干细胞(iPSC)、肝干细胞和肝脏干细胞。 [0046]10.一种试剂盒，其包含根据实施方案1-5所述的融合蛋白或根据实施方案6所述的多核苷酸或根据实施方案7-9所述的细胞。
[0047]11.一种裂解细胞中的内源白蛋白基因的方法，所述方法包括:
[0048]在以便表达所述一种或多种融合蛋白和裂解所述白蛋白基因的条件下，向所述细胞中引入包含根据实施方案6所述的至少一种多核苷酸的一种或多种表达载体。
[0049]12.根据实施方案11所述的方法，其中所述多核苷酸包含AAV载体。
[0050]13.根据实施方案11所述的方法，其中所述细胞为肝细胞。
[0051]14.一种向内源白蛋白基因中引入转基因的方法，所述方法包括:
[0052]在包含转基因的外源多核苷酸存在下，根据实施方案15-17中任一项所述的方法裂解内源白蛋白基因，以致将转基因整合到内源白蛋白基因中。
[0053]15.根据实施方案14所述的方法，其中所述转基因表达治疗性蛋白质。
[0054]16.根据实施方案15所述的方法，其中所述治疗性蛋白质牵涉于治疗溶酶体贮积病、大疱性表皮松解、AAT缺乏型肺气肿或血液疾病例如凝血障碍。
[0055]17.根据实施方案15或16所述的方法，其中所述转基因的表达受内源白蛋白控制序列驱动。
[0056]18.根据实施方案15-17中任一项所述的方法，其中所述转基因进一步包含白蛋白序列。
[0057]19.根据实施方案18所述的方法，其中所述白蛋白序列存在于蛋白质的氨基(N)端和/或羧基(C)端部分。
[0058]20.一种增加由整合到内源白蛋白基因中的转基因表达的多肽的血清半衰期的方法，所述方法包括根据实施方案18或实施方案19所述的方法将所述转基因引入所述内源白蛋白基因中，其中所述转基因表达多肽和白蛋白序列，以致所述多肽的血清半衰期增加。
[0059]21.一种治疗患有多肽缺乏引起的疾病的受试者的方法，所述方法包括:
[0060]根据实施方案14-19所述的方法将编码所述多肽的转基因引入分离细胞中，以致所述转基因在分离细胞中表达；并且将所述分离细胞引入所述受试者中，从而治疗所述疾病。
[0061]22.根据实施方案21所述的方法，其中所述细胞为肝细胞或干细胞。
[0062]23.根据实施方案22所述的细胞，其中所述干细胞选自胚胎干细胞(ESC)、诱导多能干细胞(iPSC)、肝干细胞和肝脏干细胞。
[0063]总体上根据公开内容，这些和其它方面将对于技术人员显而易见。
[0064]附图简述
[0065]图1，小图A和B是凝胶，描绘了量化内源染色体靶标的ZFN裂解程度，接着是经由NHEJ进行的不完美修复，产生靶向基因座的小插入或缺失(“插入缺失”)的Cel-1错配测定(Surveyor?, Transgenomic)的结果。对所述测定的描述，见Horton等，Methods MolBiol.(2010)649:247-56。图1A示出了使用靶向转染至Neuro2A细胞中的小鼠白蛋白基因的ZFN表达构建体的结果，其中在转染后在37°C下处理细胞3天，然后通过Cel-1分析来分析经修饰靶位点的分数。图1B示出了除细胞在转染后3天生长期间经受体温过低休克(300C )外，与图1A相同的ZFN和细胞的结果。在条带底部示出的错配百分比或插入缺失％是对ZFN活性的测量并且证明在裂解Neur02A细胞中的内源染色体靶标后，小鼠白蛋白特异性ZFN能够诱导高达53%的插入缺失。[0066]图2，小图A和B是凝胶，描绘了在两种质粒DNA浓度20或40ng下，对经表达犬白蛋白特异性ZFN配对SBS33115/SBS34077的构建体转染的犬D17细胞进行的Cel-1错配测定。图2A描绘了 3天后的结果，而图2B描绘了 10天后的结果。这种ZFN配对能够在第3天诱导~25-30%祀位点序列的插入缺失。
[0067]图3，小图A和B示出了来自多个目标物种的白蛋白基因的比对。图3A示出了人(智人(H.sapiens), SEQ ID NO: 160)、恒河猴(称猴(M.mulatta), SEQ ID N0:73)、狨猴(普通狨猴(C.jacchus)，SEQ ID NO: 74)、狗(家犬(C.familiaris), SEQ ID NO: 75)、大鼠(褐家鼠(R.norvegicus), SEQ ID NO:75)和小鼠(小家鼠(M.musculus)，SEQ ID NO:76)的外显子I与内含子I的5’区域的比对。3B示出了内含子I剩余部分与外显子2小片段的比对。该区域包括人(SEQ ID NO: 161)、恒河猴(SEQ ID N0:77)、狨猴(SEQ ID N0:78)、狗(SEQ ID N0:79)、大鼠(SEQ ID NO:80)和小鼠(小家鼠，SEQ ID N0:81)的基因座I至基因座5，其是白蛋白基因内选择供ZFN靶向的基因座。描绘的序列示出了起始密码子ATG(图3A中的大框)及外显子I和内含子1(图3A)和内含子I和外显子2(图3B)的界限。
[0068]图4，小图A和B描绘了对来自从注射了由嗜肝性AAV8载体表达的白蛋白特异性ZFN的小鼠活体解剖的肝脏组织的基因组DNA进行的Cel-1错配测定的结果。结果来自通过尾静脉注射，静脉注射了两组ZFN配对(第I对:SBS30724和SBS30725和第2对:SBS30872和SBS30873)的10只野生型小鼠(编号273-282)。图4A是量化涵盖第I对位点的扩增子中存在的插入缺失的凝胶而图4B是量化涵盖第2对位点的扩增子中存在的插入缺失的另一凝胶。在条带底部标明了肝活组织检查中带有ZFN诱导的修饰的白蛋白基因的百分比，并且证明在体内递送核酸酶时，白蛋白ZFN配对能够修饰高达17%的靶标。
[0069]图5，小图A和B示出了对来自从注射了由不同嵌合AAV载体表达的白蛋白特异性ZFN的小鼠活体解剖的肝脏组织的基因组DNA进行的Cel-1错配测定的结果。实施例5中提供了实验详情。图5A证明，当通过AAV-介导的基因递送引入动物体内时，ZFN能够裂解体内肝脏中的白蛋白靶标。肝活组织检查中带有ZFN诱导的修饰的白蛋白基因的百分比范围高达16%。图5B示出了使用抗标记抗体或抗p65,肝组织的蛋白质印迹。编码ZFN的开放阅读框与编码多肽FLAG-标签的序列融合。因此，抗标记抗体检测出ZFN并且证明在接受ZFN的小鼠中ZFN表达。抗p65抗体在这些实验中用作负载对照并且表明在每条带上负载同等量的蛋白质。
[0070]图6示出了来自小鼠研究的结果，其中通过递送不同剂量的不同AAV血清型，用小鼠白蛋白特异性ZFN配对30724/30725处理各组小鼠，然后使用Cel-1测定评估基因修饰。该研究中测试的AAV血清型为AAV2/5、AAV2/6、AAV2/8.2和AAV2/8 (详情，见文本)。剂量水平范围从5el0到lel2病毒基因组，并且每组注射3只小鼠。还计算了每个二倍体细胞存在的病毒基因组并且在每个条带底部标明。在每个条带下方还标明了每次处理诱导的插入缺失百分比并且证明ZFN配对能够裂解白蛋白基因座。对照小鼠注射了磷酸盐缓冲盐水。图中还标明了非特异性条带。
[0071]图7是描绘了体内由插入小鼠白蛋白基因座的转基因表达人类因子IX(F.1X)的图表。经野生型小鼠内的小鼠白蛋白特异性ZFN裂解后，将人F.1X供体转基因插入小鼠白蛋白基因座的内含子I或内含子12处。图表示出了载体注射后8周内F.1X的表达水平。在该实验中使用靶向小鼠白蛋白内含子I或内含子12的ZFN配对，以及靶向人类基因的ZFN作为对照。供体F.1X基因设计为在插入内含子I中后使用，因此当插入内含子12时不会正确表达。人F.1X转基因在插入小鼠白蛋白内含子I基因座后，以稳健水平表达至少8周。
[0072]图8，小图A和B是描绘了在ZFN诱导的F.1X转基因插入后，血友病小鼠血浆中人F.1X基因的表达和功能性的图表。使用白蛋白内含子I特异性ZFN和人F.1X供体在血友病小鼠中重复图7中描述的实验。治疗2周后，分析血清中的表达水平(图8A)和凝血时间(图8B)。血友病小鼠中人F.1X转基因的表达能够使凝血时间恢复为正常小鼠的凝血时间。
[0073]图9 (SEQ ID NO:82)提供了涵盖外显子I和内含子I部分的人白蛋白基因序列的片段。序列上方的横线指示锌指核酸酶的靶位点。
[0074]图10示出了来自多个灵长类物种的内含子I中白蛋白基因片段的比对，包括人(智人)(SEQ ID NO: 154)、猕猴变异体(其中序列‘C’和‘S’源自两个不同的基因组序列来源):长尾猴(M.fascicularis)_c(SEQ ID NO: 155)和长尾猴_s(SEQ ID NO: 156)及恒河猴(猕猴)(SEQ ID NO: 157)。图描绘了白蛋白特异性TALEN的DNA靶标位置(在序列上方用横线标明)。
[0075]图11，小图A-C示出了对从用靶向人白蛋白的TALEN或ZFN处理的H印G2细胞分离的基因组DNA进行的Cel-1测定的结果(图1lA和B)及具有不同空位间距的TALEN的NHEJ活性(图11C)。通过瞬时质粒转染将核酸酶引入HepG2细胞中并且在3天后通过Cel-1测定量化靶标修饰。使用TALE DNA结合结构域的两种变型，其在C端截点位置、+17形式和+63形式方面不同(见文本)。表10中描述了使用的配对。另外，还试验了 3个ZFN配对并且在条带底部标明了通过Cell测定检测出的插入缺失％。图1lC是根据TALEN结合位点之间的空位间距(bp)描绘NHEJ活性的图表。
[0076]图12，小图A、B和C描绘了指向恒河猴白蛋白基因座的ZFN配对的结果。图12A示出了全部使用400ng的ZFN浓度进行的3次独立实验中，在RF/6A细胞中测试的35396/36806配对与35396/36797配对相比的NHEJ活性百分比。图12B描绘了从每种ZFN50ng到400ng，两对的剂量滴定，其中在转导后第3天分析样品。图12B的下半部分描绘了在第3天或第10天使用400ng的ZFN比较两对的另一实验。图12C描绘了对比较的3种ZFN的SELEX分析(在IOOmM盐浓度下进行)的结果，其中中线上方的柱的尺寸示出了预期位置的结果(即，线上方值为1.0的单个柱将意指SELEX分析中分析的所述位置上的每个碱基都是预期碱基)，而线下方的柱指示非预期碱基的存在。分开的柱指示其它碱基的相对贡献。
[0077]图13，小图A和B展示了 huGLa转基因供体(在患有法布里病的患者中缺乏)向小鼠内的白蛋白基因座的插入。图13A不出了对转基因编码的huGLa蛋白质的蛋白质印迹，其中箭头指示假定的蛋白质。比较来自接受了 ZFN和供体的小鼠的样品(样品1-1、1-2和1-3)与仅接受了 ZFN的样品(4-1、4-2、4-3)或仅接受了 huGLa供体(“hu法布里供体”)的样品5-1和5-2导致鉴定了与人肝脏溶解产物对照一致的条带。图13B描绘了使用huGLa特异性ELISA试剂盒的ELISA结果，其中在病毒诱导后14或30天从小鼠分析样品(详情，见文本)。误差线表示标准偏差(n=3)。结果证明，接受ZFN和供体的小鼠具有比仅接受ZFN或仅接受供体的小鼠更高量的huGLa信号。 [0078]发明详述
[0079]本文公开了修饰内源白蛋白基因，例如以在分泌组织中表达转基因的组合物和方法。在一些实施方案中，转基因插入内源白蛋白基因以允许极闻表达水平，而且该极闻表达水平局限于肝组织。转基因可编码任何蛋白质或肽，包括提供治疗利益的蛋白质或肽。
[0080]因此，本发明的方法和组合物可用于在分泌组织中(由转基因)由高度表达基因座表达治疗上有益的蛋白质。例如，转基因可编码血液病，例如凝血障碍和多种其它单基因疾病牵涉的蛋白质。在一些实施方案中，转基因可插入内源白蛋白基因座中，以便白蛋白表达控制元件控制转基因的表达，导致转基因编码的蛋白质在高浓度下的肝脏特异性表达。可表达的蛋白质可包括凝血因子，例如因子VI1、因子VII1、因子IX、因子X、因子X1、因子XII1、vWF等，抗体、溶酶体贮积相关的蛋白质、胰岛素、α 1-抗胰蛋白酶，和实际上这样表达时提供益处的任何肽或蛋白质。
[0081]另外，任何转基因均可引入患者来源的细胞，例如患者来源的诱导多能干细胞(iPSC)或其它类型的干细胞(作为非限制类别，胚胎、造血、神经或间叶细胞)，用于最终植入分泌组织中。转基因可引入这些细胞中的任何目标区域，包括但不限于白蛋白基因或安全港基因。这些改变的干细胞可分化为(例如)肝细胞并植入肝脏中。交替地，可通过使用靶向特定组织的病毒或其它递送系统使转基因指向所需分泌组织。例如，当特异性核酸酶与转基因一起递送时，使用嗜肝腺病毒相关病毒(AAV)载体AAV8作为递送媒介物可导致在所需基因座整合转基因。
[0082]概述
[0083]除非另外说明，否则本文公开的方法的实践以及组合物的制备和使用采用分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和同样属于本领域技术范围的相关领域的传统技术。文献中全面解释了这些技术。见，例如，Sambrook 等 MOLECULAR CLONING:A LABORATORY MANUAL,第 2 版，Cold Spring HarborLaboratory Press, 1989 和第 3 版，2001 ；Ausubel 等，CURRENT PROTOCOLS IN MOLECULARBIOLOGY, John ffiley&Sons, New York,1987 和定期更新；METHODS IN ENZYMOLOGY 系列，Academic Press, San Diego ；ffolffe, CHROMATIN STRUCTURE AND FUNCTION，第 3 版，Academic Press, San Diego, 1998 ；METH0DS IN ENZYMOLOGY，第 304 卷，“Chromatin”(P.M.Wassarman 和 A.P.Wolffe 编辑)，Academic Press, San Diego, 1999 ；和 METHODS INMOLECULAR BIOLOGY,第 119 卷，“Chromatin Protocols”(P.B.Becker 编辑)HumanaPress, Totowaj 1999。
[0084]定义
[0085]术语“核酸”、“多核苷酸”和“寡核苷酸”可交换使用并且指呈线性或环状构象和单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。为了本发明的目的，不得将这些术语理解为关于聚合物长度的限制。术语可涵盖天然核苷酸的已知类似物以及碱基、糖和/或磷酸部分(例如，硫代磷酸酯骨架)经修饰的核苷酸。一般而言，特定核苷酸的类似物具有相同的碱基配对特异性；即，A的类似物将与T碱基配对。
[0086]术语“多肽”、“肽”和“蛋白质”可交换用于指氨基酸残基的聚合物。术语也适用于其中一个或多个氨基酸为相应天然存在的氨基酸的化学类似物或经修饰衍生物的氨基酸聚合物。[0087]“结合”指大分子之间(例如，蛋白质和核酸之间)的序列特异性、非共价相互作用。并非结合相互作用的组分全部需要具序列特异性(例如，与DNA骨架中的磷酸残基接触)，只要总体相互作用具序列特异性。此类相互作用通常特征在于解离常数(Kd)为KT6M4或更低。“亲和力”指结合强度:结合亲和力增加与较低的Kd相关联。
[0088]“结合蛋白”是能够与另一分子非共价结合的蛋白质。结合蛋白可与(例如)DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结合。在蛋白质结合蛋白的情况下，可与自身结合(形成同型二聚体、同型三聚体等)和/或可与不同蛋白质的一个或多个分子结合。结合蛋白可具有一种以上类型的结合活性。例如，锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。
[0089]“锌指DNA结合蛋白”(或结合结构域)是通过一个或多个锌指以序列特异性方式结合DNA的蛋白质或较大蛋白质中的结构域，其是通过锌离子配位稳定结构的结合结构域中的氨基酸序列区域。术语锌指DNA结合蛋白常缩写为锌指蛋白或ZFP。
[0090]“TALE DNA结合结构域”或“TALE”是包含一个或多个TALE重复结构域/单元的多肽。重复结构域牵涉于TALE与其同源靶DNA序列的结合。单个“重复单元”(也称为“重复序列”)通常长度为33-35个氨基酸并且与天然存在的TALE蛋白质中的其它TALE重复序列表现出至少一定序列同源性。见，例如，通过引用整体并入本文的美国专利公布N0.20110301073。
[0091]例如，可通过工程化(改变一个或多个氨基酸)天然存在的锌指或TALE蛋白质的识别螺旋区，将锌指和TALE结合结构域“工程化”为与预定核苷酸序列结合。因此，工程化DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。工程化DNA结合蛋白的方法的非限制性实例是设计和选择。设计的DNA结合蛋白是在天然界中不存在的，其设计/组成主要由合理标准产生的蛋白质。设计的合理标准包括应用取代规则和计算机算法，处理储存现有ZFP和/或TALE设计的信息和结合数据的数据库中的信息。见，例如，美国专利6，140，081、6，453，242 和 6，534，261 ;还见 W098/53058、W098/53059、W098/53060、W002/016536 和W003/016496 及美国公布 N0.20110301073。
[0092]“所选”锌指蛋白或TALE是在自然界中发现的，其生成主要由经验过程例如噬菌体展示、相互作用陷阱或杂种选择产生的蛋白质。见例如US5，789，538 ；US5, 925, 523 ；US6, 007，988 ；US6, 013，453 ；US6, 200，759 ；W095/19431 ；W096/06166 ；W098/53057 ；W098/54311 ;W000/27878 ;W001/60970 ;W001/88197 ;W002/099084 和美国公布N0.20110301073。
[0093]“重组”指两个多核苷酸之间交换遗传信息的过程。为了本发明的目的，“同源重组(HR) ”指(例如)在通过同源介导的修复机制修复细胞中的双链断裂期间发生的此类交换的特化形式。这个过程需要核苷酸序列同源，将“供体”分子用于“靶”分子(即，经受双链断裂的分子)的模板修复，并且不同地称为“非交叉基因转换”或“短道基因转换”，因为它导致遗传信息从供体转移到靶标。不希望受任何特殊理论约束，此类转移可牵涉在断裂靶标和供体之间形成的异源双链DNA的错配修正，和/或其中供体用于再合成将成为靶标的一部分的遗传信息的“合成依赖链退火”，和/或相关过程。此类特化HR常常导致靶分子的序列改变，以致供体多核苷酸的一部分或全部序列并入靶多核苷酸中。
[0094]在本发明的方法中，如本文所述的一种或多种靶向核酸酶在靶序列(例如，细胞染色质)的预定位点产生双链断裂，并且与断裂区内的核苷酸序列有同源性的“供体”多核苷酸可引入细胞中。已经证实双链断裂的存在利于供体序列的整合。供体序列可物理整合或，可选地，供体多核苷酸用作模板经由同源重组修饰断裂，导致与在供体中一样，全部或部分核苷酸序列引入细胞染色质中。因此，可改变细胞染色质中的第一序列并且，在某些实施方案中，可转换为供体多核苷酸中存在的序列。因此，术语“置换”的使用可理解为表示一个核苷酸序列经另一个置换(即，在信息意义上序列的置换)，而不一定需要一个多核苷酸经另一个物理或化学置换。
[0095]在本文所述的任何方法中，附加的锌指或TALEN蛋白质配对可用于细胞中附加靶位点的附加双链裂解。
[0096]在靶向重组和/或置换和/或改变细胞染色质中目标区域的序列的方法的某些实施方案中，通过与外源“供体”核苷酸序列同源重组改变染色体序列。如果存在于断裂区同源的序列，则细胞染色质中双链断裂的存在刺激此类同源重组。
[0097]在本文所述的任何方法中，第一核苷酸序列(“供体序列”)可含有与目标区域内的基因组序列同源但不相同的序列，从而刺激同源重组以在目标区域内插入不同序列。因此，在某些实施方案中，与目标区域内的序列同源的供体序列部分表现出与置换的基因组序列约80-99%(或之间的任何值)序列同一性。在其它实施方案中，例如如果在超过101个连续碱基对的供体和基因组序列之间仅I个核苷酸不同，则供体和基因组序列之间的同源性高于99%。在某些情况下，供体序列的非同源部分可含有目标区域中不存在的序列，以便向目标区域中引入新序列。在这些情况下，非同源序列通常两侧是与目标区域中的序列同源或相同的50-1，000个碱基对(或之间的任何整数值)或大于1，000的任何数量的碱基对的序列。在其它实施方案中，供体序列与第一序列不同源，并且通过非同源重组机制插入基因组中。
[0098] 本文所述的任何方法均可用于通过靶向整合破坏目标基因表达的供体序列，部分或完全灭活细胞中的一个或多个靶序列。还提供了具有部分或完全灭活基因的细胞系。[0099]此外，如本文所述靶向整合的方法也可用于整合一个或多个外源序列。外源核酸序列可包含(例如)一个或多个基因或cDNA分子，或任何类型的编码或非编码序列以及一个或多个控制元件(例如，启动子)。另外，外源核酸序列可生成一种或多种RNA分子(例如，小发夹 RNA (shRNA)、抑制 RNA (RNAi)、微 RNA (miRNA)等。)
[0100]“裂解”指DNA分子共价骨架的破裂。裂解可通过多种方法引发，包括但不限于磷酸二酯键的酶或化学水解。单链裂解和双链裂解均有可能，并且双链裂解可作为两个不同单链裂解事件的结果而发生。DNA裂解可导致平端或交错末端生成。在某些实施方案中，融合多肽用于靶向双链DNA裂解。
[0101]“裂解半结构域”是连同第二条多肽(相同或不同)一起形成具有裂解活性(优选双链裂解活性)的复合物的多肽序列。术语“第一和第二裂解半结构域”、“+和-裂解半结构域”和“右侧和左侧裂解半结构域”可交换用于指二聚化的裂解半结构域配对。
[0102]“工程化裂解半结构域”是已经修饰以便与另一裂解半结构域(例如，另一工程化裂解半结构域)一起形成专性杂二聚体的裂解半结构域。同样，见美国专利公布N0.2005/0064474、20070218528、2008/0131962 和 2011/0201055,其通过引用整体并入本文。
[0103]术语“序列”指任何长度的核苷酸序列，可为DNA或RNA ;可为直链、环状或支链并且可为单链或双链。术语“供体序列”指插入基因组的核苷酸序列。供体序列可具任何长度，例如长度介于2和 10，000个核苷酸之间(或之间或以上的任何整数值)，优选长度介于约100和1，000个核苷酸之间(或之间或以上的任何整数值)，更优选长度介于约200和500个核苷酸之间。
[0104]“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要为DNA)和蛋白质，包括组蛋白和非组蛋白染色体蛋白。大部分真核细胞染色质呈核小体形式存在，其中核小体核心包含约150个碱基对的DNA，其与包含组蛋白H2A、H2B、H3和H4各两个的八聚物缔合；并且连接子DNA(可变长度取决于生物体)在核小体核心之间延伸。组蛋白Hl的分子通常与连接子DNA缔合。为了本发明的目的，术语“染色质”意在涵盖所有类型的原核和真核核蛋白。细胞染色质包括染色体和附加体染色质。
[0105]“染色体”是包含细胞的全部或部分基因组的染色质复合物。细胞基因组常常特征在于其核型，这是包含细胞基因组的所有染色体的集合。细胞基因组可包含一条或多条染色体。
[0106]“附加体”是复制核酸、核蛋白复合物或包含并非细胞染色体核型的一部分的核酸的其它结构。附加体的实例包括质粒和某些病毒基因组。
[0107]“靶位点”或“靶序列”是定义如果存在足够结合条件，将与结合分子结合的核酸部分的核酸序列。
[0108]“外源”分子是细胞中一般不存在，但是可通过一种或多种遗传、生物化学或其它方法引入细胞的分子。就细胞的特殊发育阶段和环境条件而言，确定“在细胞中正常存在”。因此，例如，仅在肌肉胚胎发育期存在的分子就成人肌肉分子而言是外源分子。类似地，热休克诱导的分子就非热休克细胞而言是外源分子。外源分子可包含(例如)功能障碍的内源分子的功能形式或功能正常的内源分子的功能障碍形式。
[0109]除了其它方面，外源分子可为小分子，如通过组合化学过程生成的小分子，或大分子例如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、以上分子的任何经修饰衍生物或包含以上一种或多种分子的任何复合物。核酸包括DNA和RNA，可为单链或双链；可为直链、支链或环状；并且可具任何长度。核酸包括能够形成双链体的核酸以及形成三链体的核酸。见，例如，美国专利5，176，996和5，422，251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质重塑因子、甲基化DNA结合蛋白、聚合酶、甲基酶、脱甲基酶、乙酰化酶、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解螺旋酶。
[0110]外源分子可为与内源分子相同类型的分子，例如外源蛋白或核酸。例如，外源核酸可包含感染病毒基因组、引入细胞的质粒或附加体或细胞中一般不存在的染色体。向细胞引入外源分子的方法为本领域技术人员已知并且包括但不限于脂质介导的转移(即，脂质体，包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可为与内源分子相同类型的分子，但是源自不同于细胞所来源的物种。例如，人核酸序列可引入最初源自小鼠或仓鼠的细胞系中。
[0111]相反，“内源”分子是在特定环境条件下，在特定发育阶段一般存在于特定细胞中的分子。例如，内源核酸可包含染色体、线粒体、叶绿体或其它细胞器的基因组或天然存在的附加体核酸。另外的内源分子可包括蛋白质，例如转录因子和酶。[0112]“融合”分子是其中两个或更多更亚基分子优选共价连接的分子。亚基分子可为相同化学类型的分子，或可为不同化学类型的分子。第一类融合分子的实例包括但不限于融合蛋白(例如，ZFP或TALEDNA结合结构域和一个或多个活化结构域之间的融合体)和融合核酸(例如，编码上述融合蛋白的核酸)。第二类融合分子的实例包括但不限于形成三链体的核酸和多肽之间的融合体及小沟结合物和核酸之间的融合体。
[0113]细胞中融合蛋白的表达可由融合蛋白向细胞的递送或编码融合蛋白的多核苷酸向细胞的递送引起，其中转录所述多核苷酸，并且翻译转录产物，以生成融合蛋白。在细胞中蛋白质的表达中还可牵涉反式剪接、多肽裂解和多肽连接。本发明其它地方提出了向细胞递送多核苷酸和多肽的方法。
[0114]为了本发明的目的，“基因”包括编码基因产物的DNA区域(见下文)以及调控基因产物生成的DNA区域，不论调控序列是否与编码和/或转录序列相邻。相应地，基因包括但不一定限于启动子序列、终止子、翻译调控序列(例如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。
[0115]“基因表达”指基因中所含的信息转换为基因产物。基因产物可为基因的直接转录产物(例如，mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其它类型的RNA)或通过mRNA翻译生成的蛋白质。基因产物还包括通过例如帽化、聚腺苷酸化、甲基化和编辑等过程修饰的RNA和通过例如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、豆蘧酰化和糖基化修饰的蛋白质。
[0116]基因表达的“调节”指基因活性的变化。表达调节可包括但不限于基因活化和基因阻遏。基因组编辑(例如，裂解、改变、灭活、随机突变)可用于调节表达。基因灭活指与不包括如本文所述的ZFP或TALEN的细胞相比，基因表达的任何减少。因此，基因灭活可为部分或完全。
[0117]“目标区域”是细胞染色质的任何区域，例如基因或基因内或相邻的非编码序列，其中宜结合外源分子。结合可能是为了靶向DNA裂解和/或靶向重组的目的。例如，目标区域可存在于染色体、附加体、细胞器基因组(例如，线粒体、叶绿体)或感染病毒基因组中。目标区域可在基因的编码区内、经转录的非编码区，例如前导序列、尾随序列或内含子内，或在编码区上游或下游的非转录区内。目标区域可小至单个核苷酸对或长度达2，OOO个核苷酸对，或任何整数值的核苷酸对。
[0118]“真核”细胞包括但不限于真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞(例如，T细胞)。
[0119]“分泌组织”是分泌产物的组织。位于胃肠道的分泌组织的实例包括肠、胰腺和胆囊内衬的细胞。其它分泌组织包括肝脏、与眼部相关的组织和粘膜例如唾液腺、乳腺、前列腺、脑垂体和内分泌系统的其它成员。另外，分泌组织包括能够分泌的组织类型的个体细胞。
[0120]关于两个或更多更组件(例如序列元件)的并置，“操作连接”和“操作性连接”(或“可操作地连接”)可交换使用，其中组件排列为以便两个组件正常起作用并且允许至少一个组件可介导对至少一个其它组件发挥的作用的可能性。举例来说，如果转录调控序列响应于一个或多个转录调控因子的存在或缺乏控制编码序列的转录水平，则转录调控序列，例如启动子，与编码序列操作性连接。转录调控序列通常与编码序列顺式操作性连接，但是不需要直接与之相邻。例如，即使它们不连续，增强子为与编码序列操作性连接的转录调控序列。
[0121]就融合多肽而论，术语“操作性连接”可指每个组件在与其它组件连接时，如同未如此连接时一样执行相同的功能。例如，就其中ZFP或TALE DNA-结合结构域与活化结构域融合的融合多肽而言，如果在融合多肽中，ZFP或TALE DNA-结合结构域部分能够结合其靶位点和/或其结合位点，而活化结构域能够上调基因表达，则ZFP或TALE DNA-结合结构域和活化结构域呈操作连接。当为ZFP或TALE DNA-结合结构域与裂解结构域融合的融合多肽时，如果在融合多肽中，ZFP或TALE DNA-结合结构域部分能够结合其靶位点和/或其结合位点，而裂解结构域能够裂解邻近靶位点的DNA，则ZFP或TALE DNA-结合结构域和裂解结构域呈操作连接。
[0122]蛋白质、多肽或核酸的“功能片段”是序列与全长蛋白质、多肽或核酸不同，然而保持了与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能片段可具有比相应天然分子更多、更少或相同数量的残基，和/或可含有一个或多个氨基酸或核苷酸取代。确定核酸功能(例如，编码功能、与另一核酸杂交的能力)的方法在本领域中众所周知。类似地，确定蛋白质功能的方法众所周知。例如，可通过滤膜结合、电泳迁移率变动或免疫沉淀测定法确定多肽的DNA结合功能。可通过凝胶电泳测定DNA裂解。见Ausubel等，同上。例如，可通过免疫共沉淀、双杂交测定或遗传和生物学的互补确定蛋白质与另一种蛋白质相互作用的能力。见,例如,Fields等(1989)Nature340:245-246 ;美国专利N0.5，585，245和PCT W098/44350。
[0123]“载体”能够将基因序列转移到靶细胞。通常，“载体构建体”、“表达载体”和“基因转移载体”意指能够指导目标基因的表达并且可将基因序列转移到靶细胞的任何核酸构建体。因此，术语包括克隆和表达媒介物以及整合载体。
[0124]“报告基因”或“报告序列”指虽然不一定但优选在常规测定中，生成易于测量的蛋白质产物的任何序列。适合的报告基因包括但不限于编码介导抗生素抗性(例如，氨苄青霉素(ampicillin)抗性、新霉素(neomycin)抗性、G418抗性、嘌呤霉素(puromycin)抗性)的蛋白质的序列、编码有色或荧光或发光蛋白(例如，绿色荧光蛋白、增强型绿色荧光蛋白、红色荧光蛋白、萤光素酶)和介导增强细胞生长和/或基因扩增的蛋白质(例如，二氢叶酸还原酶)的序列。表位标签包括，例如，一个或多个拷贝的FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列。“表达标签”包括编码可与所需基因序列可操作地连接以便监测目标基因的表达的报告子的序列。
[0125]核酸酶
[0126]本文描述了用于靶向基因以插入转基因的组合物，特别是核酸酶，例如对白蛋白有特异性的核酸酶。在某些实施方案中，核酸酶天然存在。在其它实施方案中，在DNA结合结构域和/或裂解结构域中，核酸酶非天然存在，即经工程化。例如，天然存在的核酸酶的DNA结合结构域可改变为与选定靶位点结合(例如，大范围核酸酶经工程化为与不同于同源结合位点的位点结合)。在其它实施方案中，核酸酶包含异源DNA结合和裂解结构域(例如，锌指核酸酶；TAL效应子核酸酶；具有异源裂解结构域的大范围核酸酶DNA结合结构域)。
[0127]A.DNA结合结构域
[0128]在某些实施方案中，核酸酶为大范围核酸酶(归巢内切核酸酶)。天然存在的大范围核酸酶识别15-40个碱基对的裂解位点并且通常分为4个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性归巢内切核酸酶包括I_Sce1、1-Ceu1、P1-Psp1、P1-Sce、Ι-SceIV、1-CsmI, 1-PanI, Ι-SceI1、1-PpoI, 1-SceII1、1-CreI,1-Tev1、1-TevII和1-TevII10其识别序列已知。同样见美国专利N0.5, 420, 032 ;美国专利 N0.6，833，252 ；Belfort等(1997)Nucleic Acids Res.25:3379 - 3388 ；Dujon等(1989)Gene82:115 - 118 ;Perler 等(1994)Nucleic Acids Res.22, 1125 - 1127 ；Jasin(1996)Trends Genet.12:224 - 228 ；Gimble 等(1996)J.Mol.Biol.263:163 - 180 ;Argast 等(1998) J.Mol.Biol.280:345 - 353 和 New England Biolabs 目录。
[0129]在某些实施方案中，核酸酶包含工程化(非天然存在的)归巢内切核酸酶(大范围核酸酶)。归巢内切核酸酶和大范围核酸酶的识别位点例如1-Scel、1-CeuI, P1-Psp1、P1-Sce、1-SceIV、1-CsmI, 1-PanI, Ι-SceI1、1-PpoI, Ι-SceII1、1-CreI, 1-TevI, 1-TevII和1-TevIII已知。同样见美国专利N0.5，420，032 ;美国专利N0.6，833，252 ；Belfort等(1997)NucleicAcids Res.25:3379 - 3388 ；Dujon 等(1989)Gene82:115 - 118 ；Perler 等(1994)Nucleic Acids Res.22, 1125 - 1127 Jasin(1996) Trends Genet.12:224 - 228 ；Gimble 等(1996)J.Mol.Biol.263:163 - 180 ；Argast 等(1998)J.Mol.Biol.280:345 -353和New England Biolabs目录。另外，归巢内切核酸酶和大范围核酸酶的DNA结合特异性可经工程化为结合非天然祀位点。见，例如，Chevalier等(2002)Molec.Celll0:895-905 ;Epinat等(2003)Nucleic Acids Res.31:2952-2962 ;Ashworth等(2006)Nature441:656-659 ；Paques 等(2007) Current Gene Therapy7:49-66 ;美国专利公布N0.20070117128。总体上在核酸酶的情况下，归巢内切核酸酶和大范围核酸酶的DNA结合结构域可改变(即，以致核酸酶诱导同源裂解结构域)或可与异源裂解结构域融合。
[0130]在其它实施方案中，DNA结合结构域包含天然存在或工程化(非天然存在)的TALEDNA结合结构域。见，例如，美国专利公布N0.2011/0301073，其通过引用整体并入本文。已知黄单孢菌属(Xanthomonas)的植物病原细菌在重要粮食作物中引起许多疾病。黄单孢菌属的病原性取决于向植物细胞中注入25种以上不同效应蛋白的保守III型分泌(T3S)系统。其中注入的蛋白质是模拟植物转录激活因子并且操纵植物转录组的转录激活因子样效应子(TALE)(见Kay等(2007) Science318:648-651)。这些蛋白质含有DNA结合结构域和转录活化结构域。表征最清楚的TALE之一是来自发泡田野黄单孢菌(Xanthomonascampestgris pv.Vesicatoria)的 AvrBs3 (见Bonas等(1989)Mol Gen Genet 218:127-136和TO2010079430) JALE含有串联重复序列的集中结构域，每个结构域含有约34个氨基酸，其是这些蛋白质的DNA结合特异性的关键。另外，它们含有核定位序列和酸性转录活化结构域(对于综述，见 Schornack S 等(2006) J Plant Physioll63 (3):256-272)。另外，在植物病原细菌爺科雷尔氏菌(Ralstonia solanacearum)中，已经发现在爺科雷尔氏菌生物变型I菌株GMI1000和生物变型4菌株RSlOOO中，指定为brgll和hpxl7的两个基因与黄单抱菌属家族的 AvrBs3 同源(见Heuer 等(2007)Appl and Envir Micro73 (13): 4379-4384)。这些基因在核苷酸序列上相互98.9%相同，但是不同之处在于hpxl7的重复结构域中缺失I, 575bp。然而,两种基因产物与黄单孢菌属的AvrBs3家族蛋白质的序列同一'I"生小于40%。
[0131]因此，在一些实施方案中，与靶基因座(例如，白蛋白或安全港)中的靶位点结合的DNA结合结构域是来自TALE的工程化结构域，类似于来自植物病原体黄单抱菌属(见 Boch 等，(2009)Science326:1509-1512 及 Moscou 和 Bogdanove, (2009)Science326:1501)和雷尔氏菌(见 Heuer 等(2007)Applied and EnvironmentalMicrobiology73(13):4379-4384 ;美国专利公布 N0.2011/0301073 和美国专利公布N0.20110145940)的结构域。
[0132] 在某些实施方案中，DNA结合结构域包含锌指蛋白(例如，与白蛋白或安全港基因中的靶位点结合的锌指蛋白)。优选地，锌指蛋白非天然存在，因为其经工程化为与选择的祀位点结合。见，例如，Beerli 等(2002)Nature Biotechnol.20:135-141 ;Pabo 等(2001)Ann.Rev.Biochem.70:313-340 ;Isalan 等(2001)Nature Biotechnol.19:656-660 ；Segal 等(2001)Curr.0pin.Biotechnol.12:632-637 ;Choo 等(2000)Curr.0pin.Struct.Biol.10:411-416 ;美国专利 N0.6，453，242 ；6, 534，261 ；6, 599，692 ；6, 503，717 ；6，689，558 ；7, 030，215 ；6, 794，136 ；7, 067，317 ；7, 262，054 ；7, 070，934 ；7, 361，635 ；7，253，273 ;和美国专利公布 N0.2005/0064474 ；2007/0218528 ;2005/0267061，全部通过引用整体并入本文。
[0133]与天然存在的锌指蛋白相比，工程化锌指结合或TALE结构域可具有新型结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括(例如)使用包含三联体(或四联体)核苷酸序列和单独锌指氨基酸序列的数据库，其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一个或多个氨基酸序列缔合。见，例如，共有美国专利6，453，242和6，534，261，其通过引用整体并入本文。
[0134]在美国专利5，789，538、5，925，523、6，007，988、6，013，453、6，410，248、
6,140, 466,6, 200, 759 和 6, 242, 568 以及 W098/37186、W098/53057、W000/27878、W001/88197和GB2，338，237中公开了示例性选择方法，包括噬菌体展示和双杂交系统。另外，例如在共有W002/077227中已经描述了锌指结合结构域的结合特异性增强。[0135]另外，如这些和其它参考文献中所公开那样，可使用任何适合的连接子序列，包括例如长度为5个或更多个氨基酸的连接子，将DNA结合结构域(例如，多指锌指蛋白或TALE结构域)连接在一起。长度为6个或更多个氨基酸的示例性连接子序列，同样见美国专利N0.6，479，626,6, 903，185和7，153，949。本文所述的DNA结合蛋白可包括蛋白质的单独锌指之间适合连接子的任何组合。另外，例如在共有W002/077227中已经描述了锌指结合结构域的结合特异性增强。
[0136]靶位点的选择、DNA结合结构域和设计并构建融合蛋白(和编码融合蛋白的多核苷酸)的方法为本领域技术人员已知并且在美国专利N0.6，140,0815,789, 538,6，453，242,6, 534，261,5, 925，523,6, 007，988,6,013，453,6,200，759、W095/19431、W096/06166、W098/53057、W098/54311、W000/27878, W001/60970, W001/88197、W002/099084、TO98/53058、TO98/53059、TO98/53060、TO02/016536 和 TO03/016496 及美国公布N0.20110301073中进行了详细描述。
[0137]另外，如这些和其它参考文献中所公开那样，可使用任何适合的连接子序列，包括例如长度为5个或更多个氨基酸的连接子，将DNA结合结构域(例如，多指锌指蛋白)连接在一起。长度为6个或更多个氨基酸的示例性连接子序列，同样见美国专利N0.6，479，626、6，903，185和7，153，949。本文所述的蛋白质可包括蛋白质的单独锌指之间适合连接子的任何组合。[0138]B.裂解结构域
[0139]任何适合的裂解结构域均可与DNA结合结构域操作性连接以形成核酸酶。例如，ZFP DNA结合结构域已经与核酸酶结构域融合以产生能够通过其工程化(ZFP)DNA结合结构域识别其预期核酸靶标并引起经由核酸酶活性在ZFP结合位点附近切断DNA的ZFN-功能实体。见，例如，Kim 等(1996)Proc Nat，I Acad Sci USA93 (3): 1156-1160。最近，ZFN已用于多种生物体的基因组修饰。见，例如，美国专利公布20030232410、20050208489、20050026157、20050064474、20060188987、20060063231 和国际公布 W007/014275。同样，TALE DNA结合结构域已经与核酸酶结构域融合以产生TALEN。见，例如，美国公布N0.20110301073。
[0140]正如上面所提到的，裂解结构域可与DNA结合结构域异源，例如来自核酸酶的锌指DNA结合结构域和裂解结构域或者TALEN DNA结合结构域和裂解结构域，或者来自不同核酸酶的大范围核酸酶DNA结合结构域和裂解结构域。异源裂解结构域可从任何内切核酸酶或外切核酸酶获得。裂解结构域可源自其中的示例性内切核酸酶包括但不限于限制性内切核酸酶和归巢内切核酸酶。见，例如，New England Biolabs，2002-2003目录，Beverly, MA ;和 Belfort 等(1997)Nucleic Acids Res.25:3379-3388。已知另外的裂解DNA的酶(例如，SI核酸酶；绿豆核酸酶；胰腺DNA酶I ;微球菌核酸酶；酵母HO内切核酸酶；同样见 Linn 等(编辑)Nuclease, Cold Spring Harbor Laboratory Press, 1993)。这些酶中的一种或多种(或其功能片段)可用作裂解结构域和裂解半结构域的来源。
[0141]类似地，裂解半结构域可源自如上所述的任何核酸酶或其部分，其需要二聚化才有裂解活性。一般而言，如果融合蛋白包含裂解半结构域，则裂解需要两个融合蛋白。可选地，可使用包含两个裂解半结构域的单个蛋白。所述两个裂解半结构域可源自相同内切核酸酶(或其功能片段)，或每个裂解半结构域可源自不同内切核酸酶(或其功能片段)。另外，两个融合蛋白的靶位点优选为相对彼此布置，以致两个融合蛋白与其各自靶位点的结合使裂解半结构域相互置于允许裂解半结构域(例如)通过二聚化形成功能裂解结构域的空间定向。因此，在某些实施方案中，靶位点的近边被5-8个核苷酸或15-18个核苷酸隔开。然而任何整数{我们为什么总使用限定词“整数的”和“整数” 一这些真的有必要？它们只是看起来有限制性并且它们的用途似乎是为我们打开解决方案}数量的核苷酸或核苷酸对可插入两个靶位点之间(例如，2-50个核苷酸对或更多)。一般而言，裂解位点位于靶位点之间。
[0142]限制性内切核酸酶(限制酶)存在于许多物种中并且能够与DNA(在识别位点)序列特异性结合和在结合位点处或附近裂解DNA。某些限制酶(例如，IIS型)在移出识别位点的位点处裂解DNA并且具有可分离的结合和裂解结构域。例如，IIS型酶Fok I催化DNA的双链裂解，在一条链上距其识别位点9个核苷酸而在另一条链上距其识别位点13个核苷酸。见，例如，美国专利5, 356,802,5,436, 150和5，487，994 ;以及Li等(1992) Proc.Natl.Acad.Sc1.USA89:4275-4279 ；Li 等(1993) Proc.Natl.Acad.Sc1.USA90:2764-2768 ;Kim 等(1994a)Proc.Natl.Acad.Sc1.USA91:883-887 ；Kim 等(1994b)J.Biol.Chem.269:31, 978-31，982。因此，在一个实施方案中，融合蛋白包含来自至少一个IIS型限制酶的裂解结构域(或裂解半结构域)和可能经或可能未经工程化的一个或多个锌指结合结构域。
[0143]裂解结构域可与结合结构域分开的示例性IIS型限制酶为Fok I。这种特殊的酶呈二聚体时有活性。Bitinaite 等(1998)Proc.Natl.Acad.Sc1.USA95:10，570-10，575。相应地，为了本发明的目的，将用于公开的融合蛋白中的Fok I酶部分视为裂解半结构域。因此，为了使用锌指-Fok I融合体进行细胞序列的靶向双链裂解和/或靶向置换，可使用各自包含Fok I裂解半结构域的两个融合蛋白重构有催化活性的裂解结构域。可选地，也可使用含有DNA结合结构域和两个Fok I裂解半结构域的单一多肽分子。
[0144]裂解结构域或裂解半结构域可为保持裂解活性，或保持多聚化(例如，二聚化)以形成功能裂解结构域的能力的任何蛋白质部分。
[0145]在整体并入本文的国际公布W007/014275中描述了示例性IIS型限制酶。另外的限制酶也含有可分开的结合和裂解结构域，并且这些为本发明预期到。见，例如，Roberts等(2003)Nucleic Acids Res.31:418-420。
[0146]在某些实施方案中，裂解结构域包含将同型二聚减到最少或防止同型二聚的一个或多个工程化裂解半结构域(也称为二聚化结构域突变体)，例如美国专利公布N0.20050064474,20060188987,20080131962 和 20110201055 中所述，其全部内容通过引用整体并入本文。Fok I 位置 446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538的氨基酸残基全部是影响Fok I裂解半结构域二聚化的靶标。
[0147]形成专性杂二聚体的Fok I的示例性工程化裂解半结构域包括其中第一裂解半结构域包括Fok I位置490和538的氨基酸残基处的突变和第二裂解半结构域包括氨基酸残基486和499处的突变的配对。
[0148]因此，在一个实施方案中，490处的突变用Lys(K)置换Glu(E) ;538处的突变用Lys (K)置换Iso(I) ;486处的突变用6111?)置换Gln(Q);并且位置499处的突变用Lys (K)置换Iso(I)。具体地，通过使一个裂解半结构域中的位置490 (E — K)和538(1 — K)突变以生成指定为“E490K:1538K”的工程化裂解半结构域并且通过使另一裂解半结构域中的位置486(Q —E)和499(1 — L)突变以生成指定为“Q486E:1499L”的工程化裂解半结构域，制备本文所述的工程化裂解半结构域。本文所述的工程化裂解半结构域是专性杂二聚体突变体，其中异常裂解减到最少或消除。见，例如，美国专利公布N0.2008/0131962，其公开内容通过引用整体并入用于所有目的。
[0149]在某些实施方案中，工程化裂解半结构域包含位置486、499和496的突变(相对于野生型FokI编号)，例如用Glu(E)残基置换位置486的野生型Gln (Q)残基，用Leu(L)残基置换位置499的野生型Iso(I)残基和用Asp (D)或Glu (E)残基置换位置496的野生型Asn (N)残基的突变(也分别称为“ELD”和“ELE”结构域)。在其它实施方案中，工程化裂解半结构域包含位置490、538和537的突变(相对于野生型FokI编号)，例如用Lys (K)残基置换位置490的野生型Glu (E)残基，用Lys(K)残基置换位置538的野生型Iso(I)残基和用Lys(K)残基或Arg (R)残基置换位置537的野生型His (H)残基的突变(也分别称为“KKK”和“KKR”结构域)。在其它实施方案中，工程化裂解半结构域包含位置490和537的突变(相对于野生型FokI编号)，例如用Lys(K)残基置换位置490的野生型Glu(E)残基和用Lys(K)残基或Arg(R)残基置换位置537的野生型His(H)残基的突变(也分别称为“KIK”和“KIR”结构域)。(见美国专利公布N0.20110201055)。本文所述的工程化裂解半结构域可使用任何适合方法制备，例如，通过如美国专利公布N0.20050064474,20080131962和20110201055中描述的野生型裂解半结构域(Fok I)定点诱变。
[0150]可选地，可使用称为“分解酶”的技术在体内核酸靶位点组装核酸酶(见例如美国专利公布N0.20090068164)。此类分解酶的组分可在单独表达构建体上表达，或可连接在一个开放阅读框中，其中单独组分被(例如)自我裂解2A肽或IRES序列分隔开。组分可为单独锌指结合结构域或大范围核酸酶核酸结合结构域。
[0151]如W02009/042163和20090068164中所述，在用于(例如)基于酵母的染色体系统之前，可筛选核酸酶的活性。使用本领域已知的方法可容易地设计核酸酶表达构建体。见，例如，美国专利公布 20030232410、20050208489、20050026157、20050064474、20060188987、20060063231和国际公布W007/014275。核酸酶的表达可受组成型启动子或诱导型启动子的控制，例如在棉子糖和/或半乳糖的存在下活化(去阻遏)而在葡萄糖的存在下受阻遏的半乳糖激酶启动子。
[0152]靶位点
[0153] 如上文所详细描述，DNA结构域可工程化为与基因座，例如白蛋白或安全港基因中选择的任何序列结合。与天然存在的DNA结合结构域相比，工程化DNA结合结构域可具有新型结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括(例如)使用包含三联体(或四联体)核苷酸序列和单独(例如，锌指)氨基酸序列的数据库，其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的DNA结合结构域的一个或多个氨基酸序列缔合。见，例如，共有美国专利6，453，242和6，534，261，其通过引用整体并入本文。也可进行TAL效应结构域的合理设计。见，例如，美国专利公布N0.20110301073。
[0154]在美国专利5，789，538、5，925，523、6，007，988、6，013，453、6，410，248、
6,140, 466,6, 200, 759 和 6, 242, 568 以及 W098/37186、W098/53057、W000/27878、W001/88197和GB2，338，237中公开了适用于DNA结合结构域的示例性选择方法，包括噬菌体展示和双杂交系统。
[0155]靶位点、核酸酶的选择和设计并构建融合蛋白(和编码融合蛋白的多核苷酸)的方法为本领域技术人员已知并且在通过引用整体并入本文的美国专利申请公布N0.20050064474 和 20060188987 中进行了详细描述。
[0156]另外，如这些和其它参考文献中所公开那样，可使用任何适合的连接子序列，包括例如长度为5个或更多个氨基酸的连接子，将DNA结合结构域(例如，多指锌指蛋白)连接在一起。长度为6个或更多个氨基酸的示例性连接子序列，见，例如美国专利N0.6，479，626,6, 903，185和7，153，949。本文所述的蛋白质可包括蛋白质的单独DNA结合结构域之间适合连接子的任何组合。同样，见美国公布N0.20110301073。
[0157]供体
[0158]正如上面所提到的，插入外源序列(也称为“供体序列”或“供体”)，例如以修正突变基因或增加野生型基因的表达。将显而易见的是，供体序列通常与其插入位置的基因组序列不同。供体序列可含有两侧为两个同源区域的非同源序列，以允许在目标位置的有效HDR。另外，供体序列可包含含有与细胞染色质内的目标区域不同源的序列的载体分子。供体分子可含有与细胞染色质有同源性的几个不连续区域。例如，为靶向插入在目标区域中一般不存在的序列，所述序列可存在于供体核酸分子中并且两侧是与目标区域内的序列有同源性的区域。
[0159]供体多核苷酸可为DNA或RNA、单链或双链并且可呈线性或环状形式引入细胞中。见，例如，美国专利公布N0.20100047805和20110207221。如果呈线性形式引入，可通过本领域技术人员已知的方法保护供体序列的末端(例如，免于外切核酸降解)。例如，一个或多个双脱氧核苷酸残基添加到线性分子的3’端和/或自我互补寡核苷酸连接到一个或两个末端。见，例如，Chang等(1987)Proc.Natl.Acad.Sc1.USA84:4959-4963 ;Nehls 等(1996)Science272:886-8890另外的保护外源多核苷酸免于降解的方法包括但不限于添加末端氨基和使用经修饰的核苷酸间连键，例如硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。
[0160]多核苷酸可作为具有附加序列，例如复制起点、启动子和编码抗生素抗性的基因的载体分子的一部分引入细胞中。而且，供体多核苷酸可作为裸核酸，作为与试剂例如脂质体或聚羟亚烃复合的核酸引入，或可通过病毒(例如，腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒和整合酶缺陷型慢病毒(IDLV))递送。
[0161]通常插入供体，以便通过在整合位点的内源启动子，即驱动白蛋白基因表达的启动子，驱动其表达。然而，将显而易见的是，供体可包含启动子和/或增强子，例如组成型启动子或诱导型或组织特异性启动子。
[0162]供体分子可插入内源基因中，以致全部、一些或没有内源基因表达。例如，如本文所述的转基因可插入白蛋白基因座，以致一些或没有内源白蛋白序列，例如作为与转基因的融合体表达。在其它实施方案中，转基因(例如，有或没有白蛋白编码序列)整合到任何内源基因座中，例如安全港基因座。见，例如，美国专利公布20080299580、20080159996和201000218264。
[0163]当白蛋白序列(内源或部分转基因)与转基因一起表达时，白蛋白序列可为全长序列(野生型或突变型)或部分序列。优选白蛋白序列具功能性。这些全长或部分白蛋白序列的功能的非限制性实例包括增加转基因(例如，治疗基因)表达的多肽的血清半衰期和/或起载体的作用。
[0164]此外，虽然不需要表达，但是外源序列也可包括转录或翻译调控序列，例如启动子、增强子、绝缘子、内部核糖体进入位点、编码2A肽的序列和/或聚腺苷酸化信号。
[0165]递送
[0166]核酸酶、编码这些核酸酶的多核苷酸、供体多核苷酸和包含本文所述蛋白质和/或多核苷酸的组合物可在体内或体外通过任何适合方式递送。
[0167]例如，在美国专利N0.6，453，242,6, 503，717,6, 534，261,6, 599，692,6, 607，882、6，689，558,6, 824，978,6, 933，113,6, 979，539,7, 013，219 和 7，163，824 中描述了递送如本文所述的核酸酶的方法，其全部公开内容通过引用整体并入本文。
[0168]也可使用含有编码一种或多种锌指或TALEN蛋白的序列的载体递送如本文所述的核酸酶和/或供体构建体。可使用任何载体系统，包括但不限于质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体、疱疫病毒载体和腺相关病毒载体等。同样，见，美国专利 N0.6，534，261,6, 607，882,6, 824，978,6, 933，113,6, 979，539,7, 013，219 和7，163，824，其通过引用整体并入本文。此外，将显而易见的是，这些载体中的任一种均可包含治疗所需的一个或多个序列。因此，当向细胞引入一种或多种核酸酶和供体构建体时，可在相同载体或不同载体上携带核酸酶和/或供体多核苷酸。当使用多种载体时，每种载体可包含编码一种或多种核酸酶和/或供体构建体的序列。
[0169]传统的基于病毒或不基于病毒的基因转移方法可用于在细胞(例如，哺乳动物细胞)和靶组织中引入编码核酸酶和供体构建体的核酸。非病毒载体递送系统包括DNA质粒、裸核酸和与递送媒介物例如脂质体或帕洛沙姆(poloxamer)复合的核酸。病毒载体递送系统包括DNA和RNA病毒，其在递送到细胞后具有附加体或整合基因组。对基因疗法程序的综述，见 Anderson, Science256:808-813 (1992) ；Nabel&Felgner, TIBTECH11:211-217(1993) ；Mitani&Caskey, TIBTECH11:162-166(1993) ；Dillon, TIBTECH11:167-175(1993)；Mi I Ier，Nature357:455-460 (1992) ；Van Brunt, Biotechnology6 (10): 1149-1154 (1988) ；Vigne, Restorative Neurology and Neuroscience8:35-36 (1995)；Kremer&Perricaudet,British Medical Bulletin51 (I):31-44 (1995) ；Haddada 等，Current Topics in Microbiology and Immunology, Doerfler 和BohlTl (编辑)(1995)；和 Yu 等，Gene Therapyl: 13-26 (1994)。
[0170]非病毒递送核酸的方法包括电穿孔、脂质转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸结合物、裸DNA、人工病毒粒子和经试剂增强的DNA摄取。使用(例如)Sonitron2000系统(Rich-Mar)的声孔效应也可用于递送核酸。
[0171]另外的示例性核酸递送系统包括Amaxa Biosystems (Cologne, Germany)、Maxcyte, Inc.(Rockville, Maryland)、BTX 分子递送系统(Holliston, MA)和 CopernicusTherapeutics Inc提供的核酸递送系统(见例如US6008336)。例如在美国专利N0.5，049，386，9,446, 787和4，897，355中描述了脂质转染并且脂质转染试剂在市场上有售(例如，Transfectam?和Lipofectin?)。适合多核苷酸的有效受体-识别脂质转染的阳离子和中性脂质包括Fe I gner、W091 /17424、W091 /16024的脂质。[0172]脂质:核酸复合物，包括靶向脂质体例如免疫脂质复合物的制备为本领域技术人员众所周知(见，例如，Crystal, Science270:404-410 (1995) ；Blaese 等，CancerGene Ther.2:291-297 (1995) ；Behr 等，Bioconjugate Chem.5:382-389 (1994) ；Remy 等，Bioconjugate Chem.5:647-654 (1994) ；Gao 等，Gene Therapy2:710-722 (1995) ；Ahmad等，Cancer Res.52:4817-4820(1992);美国专利 N0.4，186，183,4, 217，344,4, 235，871、4，261，975,4, 485，054,4, 501，728,4, 774，085,4, 837，028 和 4，946，787)。
[0173]另外的递送方法包括使用将待递送的核酸包装到EnGeneIC递送媒介物(EDV)中。使用双特异性抗体特别地将这些EDV递送到靶组织，其中抗体的一条臂对靶组织有特异性而另一条臂对EDV有特异性。抗体将EDV带到靶细胞表面，然后通过内吞作用将EDV带到细胞内。一旦进入细胞，就释放内含物(见MacDiarmid等(2009)NatureBiotechnology27(7):643)。
[0174]使用基于RNA或DNA病毒的系统递送编码工程化ZFP的核酸利用高度进化过程使病毒靶向体内的特定细胞并且将病毒有效负载运输到细胞核。病毒载体可直接施用给患者(体内)或可用于治疗体外细胞并且将经修饰的细胞施用给患者(体外)。传统的基于病毒的ZFP递送系统包括但不限于用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关、牛痘和单纯疱疹病毒。用逆转录病毒、慢病毒和腺相关病毒基因转移方法可能整合在宿主基因组中，往往导致插入的转基因长期表达。另外，已经在许多不同细胞类型和靶组织中观察到高转导效率。
[0175]可通过并入外源包膜蛋白，扩大靶细胞的潜在靶标群体改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并且通常产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体由包装容量高达6-10kb外源序列的顺式作用长末端重复序列构成。最小的顺式作用LTR足以复制和包装载体，然后载体用于将治疗基因整合到靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷性病毒(HIV)及其组合的载体(见，例如，Buchscher等，J.Virol.66:2731-2739(1992) Johann 等，J.Virol.66:1635-1640(1992) ；Sommerfelt等，Virol.176:58-59(1990) ；ffilson 等，J.Virol.63: 2374-2378 (1989) ；Miller 等，J.Virol.65:2220-2224(1991) ；PCT/US94/05700)。
[0176]在优选瞬时表达的应用中，可使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中非常高效地转导并且不需要细胞分裂。用此类载体，已经获得高滴度和高水平的表达。这种载体可在相对简单的系统中大量生成。腺相关病毒(“AAV”)载体也可用于用靶核酸转导细胞，例如在核酸和肽的体外生成中，并且用于体内和体外基因疗法程序(见，例如，West等，Virologyl60:38-47 (1987);美国专利N0.4, 797, 368 ；W093/24641 ；Kotin, Human Gene Therapy5:793-801(1994) ；Muzyczka, J.Clin.1nvest.94:1351 (1994)。在许多出版物中描述了重组AAV载体的构建，包括美国专利 N0.5，173，414 ；Tratschin 等，Mol.Cell.Biol.5:3251-3260(1985) ；Tratschin 等，Mol.Cell.Biol.4:2072-2081(1984) ；Hermonat&Muzyczka, PNAS81:6466-6470(1984)；和Samulski 等，J.Virol.63:03822-3828 (1989)。
[0177] 至少六种病毒载体方法目前可用于在临床试验中的基因转移，其利用牵涉用插入辅助细胞系的基因互补缺陷型载体的方法生成转导剂。
[0178]pLASN和MFG-S是已经用于临时试验的逆转录病毒载体的实例(Dunbar等，Blood85:3048-305 (1995) ；Kohn 等，Nat.Med.1: 1017-102 (1995) ；Malech 等，PNAS94:2212133-12138 (1997))。PA317/pLASN是首个用于基因疗法试验的治疗性载体。(Blaese 等，Science270:475-480 (1995))。对 MFG-S 包装载体已经观测到 50% 或更高的转导效率。(Ellem 等，Immunol Immunother.44 (I): 10-20 (1997) ;Dranoff 等，Hum.GeneTher.1:111-2(1997)。
[0179]重组腺相关病毒载体(rAAV)是基于缺陷型和非病原型细小病毒腺相关2型病毒的有前景的替代基因递送系统。载体全部源自仅保留了转基因表达盒侧面的AAV145bp末端反向重复序列的质粒。归因于整合到转导细胞基因组中的有效基因转移和稳定转基因递送是这种载体系统的主要特征(Wagner 等,Lancet351:91171702-3 (1998),Kearns 等,GeneTher.9:748-55(1996))。其它 AAV 血清型，包括 AAVl、AAV3、AAV4、AAV5、AAV6、AAV8、AAV
8.2、AAV9、AAV rhlO和假型AAV例如AAV2/8、AAV2/5和AAV2/6也可根据本发明使用。
[0180]复制缺陷型重组腺病毒载体(Ad)可在高滴度下生成并且容易感染许多不同细胞类型。大部分腺病毒载体经工程化，以致转基因置换Ad Ela, Elb和/或E3基因；随后复制缺陷型载体在提供反式缺失基因功能的人类293细胞中增殖。Ad载体可转导多种类型的体内组织，包括非分裂、分化细胞，例如在肝脏、肾脏和肌肉中发现的细胞。传统Ad载体的承载容量大。在临床试验中使用Ad载体的实例牵涉经肌肉内注射进行抗肿瘤免疫的多核苷酸疗法(Sterman等，Hum.GeneTher.7:1083-9 (1998))。在临床试验中使用腺病毒载体进行基因转移的另外的实例包括Rosenecker等，Infection24:15-10 (1996) ；Sterman等，Hum.Gene Ther.9:71083-1089(1998) ;WeIsh等，Hum.Gene Ther.2:205-18(1995) ；Alvarez等，Hum.Gene Ther.5:597-613(1997) ;Topf 等，Gene Ther.5:507-513(1998) ;Sterman 等,Hum.Gene Ther.7:1083-1089(1998)。
[0181]包装细胞用于形成能够感染宿主细胞的病毒粒子。此类细胞包括包装腺病毒的293细胞和包装逆转录病毒的Ψ2细胞或PA317细胞。一般由将核酸载体包装到病毒粒子中的生产细胞系生成基因疗法中使用的病毒载体。载体通常含有包装和随后整合到宿主(若适用)所需的最小病毒序列，其它病毒序列被编码待表达蛋白质的表达盒置换。由包装细胞系反式提供缺少的病毒功能。例如，基因疗法中使用的AAV载体通常仅具有来自AAV基因组的包装和随后整合到宿主基因组所需的末端反向重复(ITR)序列。病毒DNA包装在含有编码其它AAV基因的辅助质粒，即和cap，但是缺乏ITR序列的细胞系中。细胞系还感染了作为辅助病毒的腺病毒。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺乏ITR序列，辅助质粒未大量包装。可通过(例如)腺病毒比AAV更敏感的热处理减少受腺病毒的污染。
[0182]在许多基因疗法应用中，最好是以对特定组织类型的高度特异性递送基因治疗载体。相应地，通过在病毒外表面表达配体，呈与病毒外壳蛋白的融合蛋白，可将病毒载体修饰为对指定细胞类型具有特异性。选择对已知在目标细胞类型上存在的受体有亲和力的配体。例如，Han 等，Proc.Natl.Acad.Sc1.USA92:9747-9751 (1995)，报道可将莫洛尼(Moloney)鼠白血病病毒修饰为表达与gp70融合的人调蛋白(heregulin),并且重组病毒感染表达人表皮生长因子受体的某些人乳腺癌细胞。这种原理可扩展到其它病毒-靶细胞配对，其中靶细胞表达受体而病毒表达包含细胞表面受体的配体的融合蛋白。例如，丝状噬菌体可经工程化以展示对选择的几乎所有细胞受体均有特异性结合亲和力的抗体片段(例如，FAB或Fv)。虽然以上描述主要适用于病毒载体,但是相同原理可应用于非病毒载体。此类载体可经工程化为含有利于受特定靶细胞摄取的特定摄取序列。
[0183]如下所述，可通过向个别患者施用，通常通过全身施用(例如，静脉、腹腔内、肌肉内、皮下或颅内输注)或局部应用，在体内递送基因治疗载体。可选地，可将载体递送到体外细胞，例如从个别患者移植的细胞(例如，淋巴细胞、骨髓穿刺液或组织活检)或全适供血者造血干细胞，接着通常在选择已经并入载体的细胞后，将细胞再植入患者体内。
[0184]含有核酸酶和/或供体构建体的载体(例如，逆转录病毒、腺病毒、脂质体等)也可直接施用给生物体进行体内细胞的转导。可选地，可施用裸DNA。施用是通过通常用于将分子引入与血液或组织细胞的最终接触的任何途径，包括但不限于注射、输注、局部应用和电穿孔。施用此类核酸的适合方法为本领域技术人员可用且众所周知，并且虽然可使用一种以上的途径施用特定组合物，但是特定途径往往可提供比另一途径更直接且更有效的反应。
[0185]适合引入本文所述的多核苷酸的载体包括非整合慢病毒载体(IDLV)。见，例如，Ory 等(1996) Proc.Natl.Acad.Sc1.USA93: 11382-11388 ;Dull 等(1998)J.Virol.72:8463-8471 ；Zuffery 等(1998)J.Virol.72:9873-9880 ；Follenzi 等(2000)Nature Genetics25:217-222 ;美国专利公布 No2009/054985。
[0186]药学上可接受的载体部分由施用的特定组合物以及用于施用所述组合物的特定方法确定。相应地，如下所述，有各种各样的药物组合物的制剂(见，例如，Remington’ sPharmaceutical Sciences,第 17 版，1989)。
[0187]将显而易见的是，可使用相同或不同系统递送核酸酶编码序列和供体构建体。例如，供体多核苷酸可由质粒携带，而所述一种或多种核酸酶可由AAV载体携带。此外，可通过相同或不同途径(肌肉注射、尾静脉注射、其它静脉注射、腹腔内施用和/或肌肉注射)施用不同载体。可同时或按任何相继次序递送载体。
[0188]供体外和体内施用的制剂包括液体或乳化液体中的混悬液。活性成分往往混有药学上可接受并且与活性成分相容的赋形剂。适合的赋形剂包括(例如)水、盐水、右旋糖、甘油、乙醇等及其组合。另外，所述组合物可含有少量辅助物质，例如湿润剂或乳化剂、PH缓冲剂、稳定剂或增强药物组合物有效性的其它试剂。
[0189]应用
[0190]本发明的方法和组合物可用于其中需要提供编码一种或多种蛋白质的转基因，以致从靶细胞中分泌蛋白质的任何情形。因此，这种技术在患者由于出现问题(例如，表达水平方面的问题或表达为功能不足或无功能的蛋白质的问题)，缺乏某种蛋白质的情况下有用。用本发明特别有用的是表达转基因以在凝血障碍中修正或恢复功能性。另外，AlAT缺乏症例如COPD或肝损伤或可通过由分泌器官供给外源蛋白减轻的其它病症、病状或疾病可通过本发明的方法和组合物成功治疗。如同代谢疾病例如糖尿病一样,溶酶体贮积病可通过本发明的方法和组合物治疗。
[0191]治疗上有用并且通常通过注射或输注递送的蛋白质也可与本发明的方法和组合物一起使用。作为非限制性实例，生成C肽(例如，Cebix的Ersatta?)或用于糖尿病治疗的胰岛素。进一步的应用包括通过生成胶原蛋白VII治疗大疱性表皮松解。如本文所述在分泌组织中表达IGF-1可用于通过表达脂蛋白脂酶增加这种蛋白质在有肝硬化和脂蛋白脂酶缺乏症的患者体内的水平。也可为了治疗利益分泌抗体，例如为了治疗癌症、自身免疫性疾病和其它疾病。与凝血相关的其它蛋白质可在分泌组织中生成，包括纤维蛋白原、凝血酶原、组织因子、因子V、因子X1、因子XII (哈格曼因子(Hageman factor))、因子XIII (血纤维稳定因子)、温韦伯氏因子(von Willebrand factor)、前激肽释放酶、高分子量激肽原(菲茨杰拉德因子(Fitzgerald factor))、纤连蛋白、抗凝血酶II1、肝素辅因子I1、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂、纤溶酶原、α 2-抗纤维蛋白溶酶、组织纤溶酶原激活物、尿激酶、纤溶酶原激活物抑制剂-1和纤溶酶原激活物抑制剂_2。
[0192]下列实施例涉及本发明的示例性实施方案，其中核酸酶包含锌指核酸酶(ZFN)或TALEN0应认识到，这仅仅是为了举例说明的目的并且可使用其它核酸酶，例如具有工程化DNA结合结构域的和/或天然存在的工程化归巢内切核酸酶(大范围核酸酶)DNA结合结构域与异源裂解结构域的融合体的归巢内切核酸酶(大范围核酸酶)。
实施例
[0193]实施例1:革巴向小鼠白蛋白基因的锌指蛋白核酸酶(ZFN)的设计、构建和表征
[0194]将锌指蛋白设计为靶向小鼠白蛋白基因内含子1、12和13中的裂解位点。组装相应表达构建体并且并入质粒、AAV或腺病毒载体中，基本上如Urnov等(2005)Nature435 (7042): 646-651, Perez 等(2008) Nature Biotechnology26 (7):808-816 所述并且在美国专利N0.6，534，261中有描述。表1示出了示例性小鼠白蛋白特异性ZFP的DNA结合结构域中的识别螺旋，而表2示出了这些ZFP的靶位点。用大写字母标明了靶位点中与ZFP识别螺旋接触的核苷酸；未接触的核苷酸用小写字母标明。
[0195] 表1:鼠白蛋白特异性锌指核酸酶螺旋设计
【权利要求】
1.一种非天然存在的融合蛋白，其包含与内源白蛋白基因和裂解结构域结合的锌指蛋白，其中所述融合蛋白修饰了所述内源白蛋白基因。
2.根据权利要求2所述的融合蛋白，其中所述锌指蛋白包含4、5或6个包含识别螺旋区的锌指结构域，其中所述锌指蛋白包含在表1、表3、表5或表8的单行中示出的识别螺旋区。
3.一种多核苷酸，其编码根据权利要求1所述的一种或多种融合蛋白。
4.一种分离细胞，其包含根据权利要求1或2所述的一种或多种融合蛋白或根据权利要求3所述的一种或多种多核苷酸。
5.根据权利要求4所述的细胞，其中所述细胞为干细胞。
6.根据权利要求5所述的细胞，其中所述干细胞选自胚胎干细胞(ESC)、诱导多能干细胞(iPSC)、肝干细胞和肝脏干细胞。
7.一种试剂盒，其包含根据权利要求1或2所述的融合蛋白或根据权利要求3所述的多核苷酸。
8.—种裂解细胞中的内源白蛋白基因的方法，所述方法包括: 在以便表达所述一种或多种融合蛋白和裂解所述白蛋白基因的条件下，向所述细胞中引入包含根据权利要求1或2所述的至少一种融合蛋白或根据权利要求3所述的至少一种多核苷酸的一种或多种表达载体。
9.根据权利要求8所述的方法，其中所述多核苷酸包含AAV载体。
10.根据权利要求8或权利要求9所述的方法，其中所述细胞为肝细胞。
【文档编号】C12N5/074GK103917644SQ201280051774
【公开日】2014年7月9日申请日期:2012年9月21日优先权日:2011年9月21日
【发明者】E·J·瑞巴申请人:桑格摩生物科学股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：E·J·瑞巴
技术所有人：桑格摩生物科学股份有限公司
我是此专利的发明人

上一篇：使用孔和Hel308解旋酶表征目标多核苷酸的酶方法
上一篇：Gccr表达的反义调节的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。