一种sgRNA碱基错配靶位点文库及其应用

文档序号:9560521阅读:2078来源:国知局
一种sgRNA碱基错配靶位点文库及其应用
【技术领域】
[0001] 本发明属于基因修饰技术领域,具体涉及一种sgRNA碱基错配靶位点文库及其应 用。
【背景技术】
[0002] 基因编辑技术,是近年来发展起来的一项基因组修饰技术,可在基因组特定位点 进行InDel突变、敲入、多位点突变、小片段删除、以及片段替换等操作。在科学研究领域, 基因编辑技术可用于模式生物的快速构建;在农业领域,该技术可用于植物品种改造;而 在健康医疗领域,该技术还有可能通过改造人类自身基因,达到治疗疾病的目的。因此,基 因编辑技术具有极其广泛的发展前景和应用价值。
[0003] 目前,基因编辑技术主要有锌指核酸酶(ZFN)、转录激活样效应因子核酸酶 (TALEN)和成簇规律间隔短回文重复技术(CRISPR/Cas9)。技术原理上,三种主流的基因编 辑技术都是通过特异序列的靶向识别和切割,造成基因组DNA断裂,在细胞的非同源末端 连接修复(non-homologous end joining,NHEJ)和同源重组修复(HR)过程中,实现基因组 序列的编辑。
[0004] 作为第一代基因编辑技术,锌指核酸酶首次实现了基因的靶向操作,并得到了广 泛的应用。锌指核酸酶的DNA识别域是由一系列锌指蛋白模块串联组成,每个锌指蛋白模 块识别并结合DNA链上一个特异的三联体碱基,将目的基因对应的一系列锌指蛋白模块串 联在一起,即可实现对目标序列的特异性识别。锌指核酸酶是一个异源二聚体,其中每个亚 基含有一个锌指结构域和一个Fokl核酸内切酶结构域。Fokl结构域必须二聚化才有活性, 可确保必须同时存在两个相邻的DNA结合位点时才能引发DNA双链的断裂,从而增加了目 标特异性。尽管文献报道的锌指核酸酶的基因打靶效率能达到30%,并可以针对某些特定 的DNA序列设计相应的锌指核酸酶,实现基因组序列的定位修饰,但其发展也存在较大的 局限性。一方面,锌指核酸酶的识别结构域中存在上下文序列依赖性,增加了设计、筛选难 度;另一方面,锌指核酸酶的脱靶切割会导致细胞毒性,制约了其在基因治疗领域的应用。
[0005] 作为第二代主流基因编辑技术,TALEN在技术上比锌指核酸酶更加简便,使用上更 加灵活。TALEN是二聚化的转录因子/核酸酶,其核酸识别单元为间隔32个恒定氨基酸序 列的双连氨基酸,双连氨基酸序列与A、G、C、T的识别具有稳定的对应关系。通过组装这些 模块,研究人员可靶定任何目标序列。
[0006] CRISPR/Cas技术是新近发展起来的第三代基因编辑技术。与锌指核酸酶技术和 TALEN技术不同,CRISPR/Cas技术源于天然存在的原核生物适应性免疫系统。2012年8月, 美国加州大学伯克利分校和德国汉诺威医学院的研究人员在《Science》杂志上发表文章, 报道了该系统的工作原理,并提示可通过更换向导RNA序列来对该系统进行重新编程。
[0007] 对CRISPP/Cas系统的研究发现,CRISPR/Cas系统是通过RNA介导的DNA内 切酶进行基因组编辑操作,它们分别就是CRISPR RNA (crRNA)和反式作用CRISPR RNA(trans-acting CRISPR RNA,tracrRNA)。这两种 RNA 可以被"改装"成一个向导 RNA(single-guide RNA,sgRNA)。sgRNA包括一段20bp左右的DNA识别区与一段固定序 列,其DNA识别区与靶位点处碱基互补,引导Cas9蛋白在结合区随机剪切DNA双链,形成 DSB (Double Stranded Breaks)缺口,随后细胞通过非同源末端连接修复机制(NHEJ)修复 目的基因双链。在修复的过程中易形成移码突变,导致靶位点处基因失去功能。若同时转 入基因修饰过的目的基因片段,可靶向定点敲除、插入、突变、修复相应碱基位点。sgRNA切 割作用的一个重要特征是sgRNA靶位点的下游临近区域需要存在一个三碱基的PAM序列, 通常为NGG。
[0008] CRISPR/Cas技术介导的基因组编辑是由crRNA指导的,通过与DNA序列的碱基配 对,实现目标位点的识别。在技术原理上,比锌指核酸酶和TALEN技术(利用蛋白质功能 区识别DNA序列)要精确得多,降低了脱靶切割的几率,减低了细胞毒性。在实际操作中, CRISPR/Cas9的构建仅仅需要设计与靶序列互补的RNA即可,过程更为简单,大大提高了基 因编辑的操作效率。但对于所有基因编辑技术而言,高效性和特异性是技术成功的两个重 要方面,CRISPR/Cas技术野不例外。尤其是在人类疾病的基因治疗中,特异性的重要性更 显突出。
[0009] 在CRISPR/Cas技术研究中,近期发表的一些文章充分证明了 CRISPR/Cas系统 对非完全匹配靶位点的切割作用,也就是sgRNA脱靶作用的存在。这些工作包括:Nat Biotechnol. 2013,31 :822-6 ;Nat Biotechnol. 2013,31 :833-8。在人类疾病的基因治疗 中,sgRNA的对非完全匹配位点的切割,可能会在意外的位点破坏基因组的完整性或关键基 因的正常表达,引起癌症或者其他的疾病。因此,sgRNA能否做到特异性、精确靶向目标基 因是其能够成功应用于基因治疗的先决条件,设计、制备出精确性和特异性靶向目标基因 的sgRNA成为该技术发展的关键。
[0010] 研究发现很多因素都能影响SgRNA的脱靶作用,如Cas9和SgRNA的浓度。除了 这些非序列依赖性的因素外,sgRNA与靶位点的匹配程度也是影响脱靶作用的另一个重要 因素。利用不同技术路线,比如突变sgRNA序列、检测一个高活性sgRNA对基因组DNA的 切割等,研究人员近来对sgRNA的脱靶作用开展了大量研究,发现影响sgRNA切割活性的 重要位点均位于靶位点的"seed"区(种子区)。尽管通常认为,"seed"区域包括PAM序 列上游的10-12核苷酸,但不同的研究也报道了不同的意见。2013年的一篇研究(Nat Biotechnol. 2013, 31 :83943)报道,sgRNA脱靶作用的敏感位点主要位于PAM上游的7-12 碱基位点。2013年的另一篇研究(Nat Biotechnol. 2013,31 :827-32)报道,sgRNA切割敏 感位点位于PAM上游20个碱基范围内,其中最敏感的位点位于PAM上游的8-14位点。2015 年的一篇研究(Nat Biotechnol. 2015, 33 :175-8)发现,在与sgRNA之间存在1-13个喊基 错配的靶位点中,均发现了显著的脱靶作用。这些研究结果表明,sgRNA的脱靶作用是一个 较为普遍的现象,但我们对其发生的规律和机制的了解还非常有限。
[0011] sgRNA片段的DNA序列包括一段固定序列和一段目的DNA识别序列,所述目的DNA 识别序列是可与目的基因两条链中的一条链进行碱基互补配对的DNA序列,固定序列是招 募核酸酶的序列。现有的研究sgRNA脱靶效应的方法是根据同一个靶位点序列,设计不同 的sgRNA片段的DNA识别序列。虽然这种方法的固定序列一级序列没有发生变化,但是在识 别位点的序列发生变化的情况下,固定序列招募核酸酶的效率是否发生改变不得而知。也 就是说,当不同的sgRNA序列针对同一靶位点序列产生不同的切割效率时,难以评价是因 为DNA识别序列发生变化导致的识别效率发生的变化,还是因为DNA识别序列发生变化导 致的固定序列招募核酸酶的效率发生的变化。因此,基于该方法进行的脱靶效应研究的精 确性有待进一步提尚。

【发明内容】

[0012] 本发明要解决的技术问题是提供一种更精确地研究sgRNA分子脱靶效应的文库。
[0013] 本发明要解决的另一个问题是提供一种更精确地研究sgRNA分子脱靶效应的方 法。
[0014] 本发明所述SgRNA分子的靶位点序列,是指能与SgRNA分子的目的DNA识别序列 形成碱基互补配对的序列。本发明所述单碱基错配靶位点是指,当sgRNA某个位点的碱基 为U时,其DNA靶位点中对应的能形成碱基互补配对的碱基为A,两者之间形成U-A互补配 对,如果以T、G、C三种碱基中的任何一种取代靶位点上的A,就能获得单碱基错配的靶
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1