抗体靶向的重组融合蛋白以及其在表观遗传学中的应用的制作方法

文档序号:17011737发布日期:2019-03-02 02:16阅读:382来源:国知局
抗体靶向的重组融合蛋白以及其在表观遗传学中的应用的制作方法

本发明涉及生物技术领域,具体涉及抗体靶向的重组融合蛋白以及其在表观遗传学中的应用。



背景技术:

对于多细胞生物来说,比如人类,其每一个细胞的遗传物质(dna)都来源于相同的受精卵,所以其携带的遗传信息,即dna序列都是相同的,但是不同组织中的细胞,如皮肤和肝脏细胞,又表现出不同的形态和性质。相同的遗传信息却发育出不同类型的细胞,是由于不同细胞的基因表达模式差异引起的。而这些基因表达模式是受细胞内特定转录因子的结合、染色质和dna的状态影响的。表观遗传学就是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科。表观遗传学研究的内容包括dna甲基化(dnamethylation),基因组印记(genomicimprinting),母体效应(maternaleffects),基因沉默(genesilencing),休眠转座子激活等。

染色质免疫共沉淀(chromatinimmunoprecipitation,chip)是一种常用的研究表观遗传学的技术。其基本原理是将染色质和与之相互作用的转录因子和组蛋白通过甲醛等物质交联起来,然后将染色质通过超声打碎成较小的片段,加入针对特定转录因子或特殊修饰的组蛋白的抗体,通过proteina/proteing微球或者磁珠将抗体-转录因子-染色质复合物拖下来,通过pcr或者测序的方法检测与目的蛋白相结合的dna序列,进而研究这些转录因子在细胞发育或者生长中的作用位点。最近几年快速发展的二代测序技术(ngs,nextgenerationsequencing)与传统chip技术相结合,发展出的chip-sequencing(简称chip-seq)技术,进一步扩展了chip技术在表观遗传学方面的研究应用。

然而在传统chip技术中,需要先用甲醛将与dna相互作用的蛋白固定起来,在这个过程可能会造成一些非相关蛋白被交联,形成非特异性的背景(假阳性)。有一些作用力比较小的转录因子或者由于甲醛交联不充分,后续超声碎裂dna时蛋白和dna之间的作用被破坏,造成假阴性,而且传统chip耗时长(4天),还需要有高亲和力的抗体,因为低亲和力的抗体很难有效将蛋白和dna复合物“拖下来”,这也进一步限制了chip的使用范围。此外,传统chip-seq需要甲醛交联细胞并分离抗体和染色体片段的复合物,然后再进行建库和测序,需要较多的样本细胞,需要高亲和力的抗体,需要较长时间和复杂的操作,测序的分辨率不高,测序深度较大,成本高。而且不适用于胚胎发育、干细胞以及病理样本等珍贵样本的表观遗传学研究。



技术实现要素:

本发明的目的是针对现有技术存在的问题,提供一种抗体靶向的重组融合蛋白以及其在表观遗传学中的应用,本发明所述的重组融合蛋白可以改善chip-seq技术,简化操作,提高数据质量,降低操作难度,扩展应用范围,尤其是在珍贵、少量细胞上的应用。

本发明的目的可以通过以下措施达到:

本发明的第一方面,提供一种融合蛋白,所述融合蛋白包括abp-l-dfe的结构,其中abp位于融合蛋白的n端,表示具有结合抗体功能的结构域,l表示连接肽,dfe表示具有dna片段化功能的结构域。

发明人发现dna片段化酶(dfe)和抗体结合蛋白(abp)之间的连接顺序对两个功能单元的作用有较大影响。比如abp-l-tn5m和tn5m-l-abp的抗体结合与dna切割活性就有明显差异。发明人经过大量实验筛选发现,abp-l-dfe的总体活性优于dfe-l-abp,可能是因为dna片段化酶需要游离的c末端发挥活性,如tn5m的c末端对其二聚化以及活性发挥有重要作用。所以本发明选择abp-l-dfe融合蛋白形式。

优选的,本发明所述的abp表示具有结合抗体fc区功能的结构域。

在一种实施例中,abp表示抗体结合蛋白(antibodybindingprotein),优选为金黄色葡萄球菌a蛋白(proteina)、链球菌g蛋白(proteing)、链球菌l蛋白(proteinl)或其他具有结合抗体功能的蛋白或者多肽类似物。

本发明所述金黄色葡萄球菌a蛋白(proteina)可以为全长金黄色葡萄球菌a蛋白、金黄色葡萄球菌a蛋白的部分功能域、金黄色葡萄球菌a蛋白突变体、带标签的全长金黄色葡萄球菌a蛋白、带标签的金黄色葡萄球菌a蛋白的部分功能域或带标签的金黄色葡萄球菌a蛋白突变体。

本发明所述的链球菌g蛋白(proteing)可以为全长链球菌g蛋白、链球菌g蛋白的部分功能域、链球菌g蛋白突变体、带标签的全长链球菌g蛋白、带标签的链球菌g蛋白的部分功能域或带标签的链球菌g蛋白突变体。

在一种优选的实施例中,abp的氨基酸序列选自seqidno.2或seqidno.10。

本发明所述的l表示连接肽(linker),l的长短会影响融合蛋白的形状从而可能对融合蛋白对dna切割的有效性以及切割位置有重大影响,本发明优选l长度为0-50个氨基酸,进一步优选2-50个氨基酸。当l长度为0时,表示abp结构域和dfe结构域直接相连。

本发明所述的l可以为1-6个氨基酸的短linker(shortlinker,简称sl),也可以为7-20个氨基酸的中等长度linker(mediumlinker,简称ml)或>20个氨基酸的长linker(longlinker,简称ll)。

本发明所述的l可以为柔性连接肽或刚性连接肽,发明人发现柔性连接肽可能会导致两个结构域之间相互作用,影响各自的功能,优选为刚性连接肽。

在一种优选的实施方式中,本发明所述的l序列为eaaak(seqidno.6),优选为刚性连接肽。

在另一种优选的实施方式中,本发明所述的l序列为aeaaakeaaakeaaakeaaakaleaeaaakeaaakeaaakeaaaka(seqidno.8),优选为刚性连接肽。

在另一种优选的实施方式中,本发明所述的l的氨基酸序列如seqidno.14或seqidno.18所示。

在一种实施例中,本发明所述的dfe表示dna片段化酶(dnafragmentingenzyme)。

优选的,本发明所述的dfe为微球菌核酸酶(mnase)、dna酶1(dnasei)或tna转座酶家族。

本发明所述的tna转座酶家族选自全长或者为部分功能域的以下转座酶:tn1、tn2、tn3、tn4、tn5、tn6、tn7、tn8、tn9或tn10;所述的转座酶可以带标签或者不带标签,可以为突变体或非突变体。

在一种优选的实施例中,本发明所述的tna转座酶家族为tn5m(转座子5变体),所述的tn5m是指cn106754811a中公开的突变型tn5转座酶,如权利要求1或3或5~7任一项所述的突变型tn5转座酶。相比于其他dna酶介导的chip-seq,本发明优选的带有tn5m的融合蛋白的额外优势是可以省略片段分离、末端修复、加接头、片段分选等繁琐步骤,简化了建库操作的复杂性,进一步提高了精度和分辨率。

在一种优选的实施例中,本发明所述的dfe的氨基酸序列如seqidno.4、seqidno.12或seqidno.16所示。

在一种优选的实施例中,本发明所述的融合蛋白选自以下任一:abp-l-dfe1、abp-l-dfe2、abp-l-dfe3、abp-l-dfe4、abp-l-dfe5、abp-l-dfe6、abp-l-dfe7、abp-l-dfe8、abp-l-dfe9、abp-l-dfe10、abp-l-dfe11、abp-l-dfe12、abp-l-dfe13、abp-l-dfe14、abp-l-dfe15。

本发明的第二方面,提供一种用于编码上述融合蛋白的多核苷酸。

本发明所述的编码上述融合蛋白的多核苷酸,可以是dna形式或rna形式。本发明所述的多核苷酸,可以通过本领域技术人员熟知的任何适当的技术制备。所述技术见于本领域的一般描述,如《分子克隆实验指南》(j.萨姆布鲁克等,科学出版社,1995)。包括但不限于重组dna技术、化学合成等方法。

优选的,经过优化的,编码seqidno.2的abp的核苷酸序列如seqidno.1所示。

优选的,经过优化的,编码seqidno.10的abp的核苷酸序列如seqidno.9所示。

优选的,经过优化的,编码seqidno.4的dfe的核苷酸序列如seqidno.3所示。

优选的,经过优化的,编码seqidno.12的dfe的核苷酸序列如seqidno.11所示。

优选的,经过优化的,编码seqidno.16的dfe的核苷酸序列如seqidno.15所示。

优选的,经过优化的,编码seqidno.6的l的核苷酸序列如seqidno.5所示。

优选的,经过优化的,编码seqidno.8的l的核苷酸序列如seqidno.7所示。

优选的,经过优化的,编码seqidno.14的l的核苷酸序列如seqidno.13所示。

优选的,经过优化的,编码seqidno.18的l的核苷酸序列如seqidno.17所示。

本发明的第三方面,提供一种表达载体,其含有前述多核苷酸。

本发明所述的表达载体可以采用本领域的技术人员熟知的方法构建。这些方法包括重组dna技术、dna合成技术等。可将编码所述融合蛋白的dna有效连接到载体中的多克隆位点上,以指导mrna合成进而表达蛋白,或者用于同源重组。本发明的较佳案例中,表达载体可采用pet28a。

本发明的第四方面,提供一种宿主细胞,其被前述表达载体或克隆载体所转化。

在一种优选的实施例中,所述宿主细胞可采用大肠杆菌表达菌株bl21(de3)。

本发明的第五方面,提供一种制备前述融合蛋白的方法,包括如下步骤:

合成或者克隆目的dna序列,构建含有目的dna序列的克隆载体,构建含有目的dna序列的表达载体,将含目的dna序列的表达载体转化至原核宿主细胞,筛选在生长培养基中高表达的高产细胞株,培养筛选到的高表达细胞株并表达融合蛋白,从表达产物中纯化获得所述的融合蛋白。

本发明的较佳案例中,所述表达载体可采用pet28a。所述宿主细胞可采用大肠杆菌表达菌株bl21(de3)。

本发明的第六方面,提供前述融合蛋白在构建测序文库中的应用。

本发明的第八方面,提供前述融合蛋白在表观遗传学研究中的应用。

本发明的第七方面,提供前述融合蛋白在研究蛋白-染色质互作中的应用,更具体的是在染色质免疫共沉淀中的应用。

本发明还提供一种优选的融合蛋白在染色质免疫共沉淀中的应用,包括如下步骤:

(1)用去污剂在细胞上打洞;

(2)加入抗体与染色体结合蛋白或者甲基化组蛋白结合;

(3)再加入本发明所述融合蛋白与抗体特异性结合,形成三元复合物,优选再清洗去除非特异性结合的融合蛋白和抗体,以降低背景;

(4)添加金属离子激活融合蛋白,片段化染色体;

(5)释放目的片段到细胞外,回收进行后续建库和测序。

优选的,步骤(4)所述的金属离子为镁离子或者钙离子。

本发明步骤(1)的去污剂可以为常用的用于细胞穿孔的试剂,如triton或者地高辛。所述去污剂的浓度优选为0.05%-0.005%。

在一种优选的实施方式中,当用于与dna结合较紧密的蛋白或转录因子(如甲基化组蛋白)位点的特异性片段化时,步骤(3)选用含有短linker的融合蛋白,如本发明的abp-l-dfe-1、abp-l-dfe-3、abp-l-dfe-5、abp-l-dfe-7、abp-l-dfe-10或abp-l-dfe-12;当用于polii等大分子转录复合物的定点片段化时,步骤(3)选用含有长linker的融合蛋白,如本发明的abp-l-dfe-2、abp-l-dfe-4、abp-l-dfe-6、abp-l-dfe-9、abp-l-dfe-11、abp-l-dfe-14或abp-l-dfe-15。

在本发明所述的abp-l-dfe形式的融合蛋白的帮助下,实现细胞无需甲醛交联而在天然状态下进行chip-seq的方法。通过此abp-l-dfe融合蛋白以及abp-l-dfe介导的chip-seq技术(adeacs,abp-l-dfeassistantchip-seq),可以实现将传统的chip-seq时间从4天缩短到半天时间,而且由于细胞不需要甲醛交联等处理,大大降低了非特异性的背景,提高了切割的特异性和分辨率,一次实验所需要的细胞数可以低至100个,而传统的chip-seq需要至少5百万个细胞。降低细胞使用数量后可以大大扩展chip-seq的适用范围,如可以用于研究发育中胚胎或者干细胞以及人体病理标本中表观遗传学,这些珍贵样本的细胞数量很少,不适用于传统的chip-seq。

由于降低了非特异性的背景和细胞数,adeacs所需的测序深度也大大降低,减少了测序的成本和对数据分析的要求。此外,由于不需要额外将抗体和染色体片段分离,对抗体的亲和力要求也大大降低,很多以前受限于抗体亲和力的靶点蛋白也可以开展chip-seq研究,大大扩展了chip-seq的应用范围。

另外,当本发明所述的融合蛋白的dfe优选为tn5m转座酶时,在切割dna的时候可以同时加上接头,带接头的目标dna可以直接用于扩增并建库和测序,不需要对细胞进行交联处理,因此非特性的背景较低,整个操作在6小时内,大大缩短了操作时间,使chip-seq可以高通量,大规模开展。

附图说明

图1:dnasei/mnase融合蛋白介导的chip-seq技术示意图。

图2:tn5m融合蛋白介导的chip-seq技术示意图。

图3:融合蛋白诱导表达电泳图。

图4:兔igg抗体结合活性比较图,纵坐标表示od450值,横坐标表示不同融合蛋白,其中,1:abp-l-dfe-1;2:abp-l-dfe-2;3:abp-l-dfe-3;4:abp-l-dfe-4;5:abp-l-dfe-5;6:abp-l-dfe-6;7:abp-l-dfe-7;8:abp-l-dfe-8;9:abp-l-dfe-1;9:abp-l-dfe-1;10:abp-l-dfe-10;11:abp-l-dfe-11;12:abp-l-dfe-12;13:abp-l-dfe-13;14:abp-l-dfe-14;15:abp-l-dfe-15;16:dfe-l-abp-1;17:dfe-l-abp-2;18:阴性对照;19:空白对照。

图5:鼠igg抗体结合活性比较图,纵坐标表示od450值,横坐标表示不同融合蛋白,其中,1:abp-l-dfe-1;2:abp-l-dfe-2;3:abp-l-dfe-3;4:abp-l-dfe-4;5:abp-l-dfe-5;6:abp-l-dfe-6;7:abp-l-dfe-7;8:abp-l-dfe-8;9:abp-l-dfe-1;9:abp-l-dfe-1;10:abp-l-dfe-10;11:abp-l-dfe-11;12:abp-l-dfe-12;13:abp-l-dfe-13;14:abp-l-dfe-14;15:abp-l-dfe-15;16:dfe-l-abp-1;17:dfe-l-abp-2;18:阴性对照;19:空白对照。

图6:abp-l-dfe-1和abp-l-dfe-3的片段化活性验证图,其中,泳道1:dna分子量标准;泳道2:abp-l-dfe-1打断的dna;泳道3:abp-l-dfe-3打断的dna。

图7:abp-l-dfe-5、abp-l-dfe-6和abp-l-dfe-8的片段化活性比较图,其中,泳道1:dna分子量标准;泳道2:abp-l-dfe-5打断的dna;泳道3:abp-l-dfe-8打断的dna;泳道4:abp-l-dfe-6打断的dna。

图8:abp-l-dfe-11、abp-l-dfe-14和dfe-l-abp-1、dfe-l-abp-2的片段化活性比较图,其中,泳道1:dna分子量标准;泳道2:包埋adaptermix的dfe-l-abp-2打断的dna;泳道3:包埋adaptermix的abp-l-dfe-14打断的dna;泳道4:包埋adaptermix的dfe-l-abp-1打断的dna;泳道5:包埋adaptermix的abp-l-dfe-11打断的dna。

图9:abp-l-dfe-10、abp-l-dfe-11、abp-l-dfe-12和abp-l-dfe-14的片段化活性比较图,其中,泳道1:dna分子量标准;泳道2:包埋adaptermix的abp-l-dfe-11打断的dna;泳道3:包埋adaptermix的abp-l-dfe-14打断的dna;泳道4:包埋adaptermix的abp-l-dfe-12打断的dna;泳道5:包埋adaptermix的abp-l-dfe-10打断的dna。

图10:abp-l-dfe-13和abp-l-dfe-15的片段化活性比较图,其中,泳道1:dna分子量标准;泳道2:abp-l-dfe-15打断的dna;泳道3:abp-l-dfe-13打断的dna。

图11:在100个和1000个细胞水平上,在h3k27me3位点的切割谱图与encode(encyclopediaofdnaelements,dna元件百科全书)参照图谱。

图12:在100个细胞水平上,在h3k27me3位点的切割谱图与encode参照图谱。

图13:在500个细胞水平上,在ctcf结合位点的切割谱图与encode参照图谱。

图14:在500个细胞水平上,在polii转录复合物位点的切割谱图与encode参照图谱。

图15:在200个细胞水平上,在polii转录复合物位点的切割谱图与encode参照图谱。

图16:在100个细胞水平上,在h3k4me3位点的切割谱图与encode参照图谱。

具体实施方式

下面结合实施例对本发明做进一步说明,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,凡在本发明的构思前提下对本发明制备方法的简单改进都属于本发明的保护范围之内。下面实施例未注明具体条件的实验方法,通常按照本领域的公知手段。

实施例115种不同abp-l-dfe的克隆构建和两种dfe-l-abp的构建

本实施例制备了17个不同构造的abp-l-dfe和dfe-l-abp,分别命名为abp-l-dfe-1、abp-l-dfe-2、abp-l-dfe-3、abp-l-dfe-4、abp-l-dfe-5、abp-l-dfe-6、abp-l-dfe-7、abp-l-dfe-8、abp-l-dfe-9、abp-l-dfe-10、abp-l-dfe-11、abp-l-dfe-12、abp-l-dfe-13、abp-l-dfe-14、abp-l-dfe-15、dfe-l-abp-1和dfe-l-abp-2。

1、所有基因序列人工合成,使用同源重组试剂盒(clonexpressiionestepcloningkit,vazyme,c112)将基因片段分别克隆到pet28a载体中,构建重组表达载体。

(1)命名为abp-l-dfe-1的融合蛋白,其n端结构域为链球菌g蛋白(proteing)的一部分,c端结构域为dnasei,所述两个结构域通过短的刚性连接肽linker1连接。

所述proteing的一部分的编码核苷酸序列如seqidno.1所示。

所述proteing的一部分的氨基酸序列如seqidno.2所示。

所述dnasei的编码核苷酸序列如seqidno.3所示。

所述dnasei的氨基酸序列如seqidno.4所示。

所述短的刚性连接肽linker1的编码核苷酸序列如seqidno.5所示。

所述短的刚性连接肽linker1的氨基酸序列如seqidno.6所示。

(2)命名为abp-l-dfe-2的融合蛋白,其n端结构域为proteing的一部分,c端结构域为dnasei,所述两个结构域通过长的刚性连接肽linker2连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述dnasei的编码核苷酸序列同seqidno.3。

所述dnasei的氨基酸序列同seqidno.4。

所述长的刚性连接肽linker2的编码核苷酸序列如seqidno.7所示,具体为:

所述长的刚性连接肽linker2的氨基酸序列如seqidno.8所示,具体为:

(3)命名为abp-l-dfe-3的融合蛋白,其n端结构域为金黄色葡萄球菌a蛋白(proteina)的一部分,c端结构域为dnasei,所述两个结构域通过短的刚性连接肽linker1连接。

所述proteina的一部分的编码核苷酸序列如seqidno.9所示,具体为:

所述proteina的一部分的氨基酸序列如seqidno.10所示,具体为:

所述dnasei的编码核苷酸序列同seqidno.3。

所述dnasei的氨基酸序列同seqidno.4。

所述短的刚性连接肽linker1的编码核苷酸序列同seqidno.5。

所述短的刚性连接肽linker1的氨基酸序列同seqidno.6。

(4)命名为abp-l-dfe-4的融合蛋白,其n端结构域为proteina的一部分,c端结构域为dnasei,所述两个结构域通过长的刚性连接肽linker2连接。

所述proteina的一部分的编码核苷酸序列同seqidno.9。

所述proteina的一部分的氨基酸序列同seqidno.10。

所述dnasei的编码核苷酸序列同seqidno.3。

所述dnasei的氨基酸序列同seqidno.4。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

(5)命名为abp-l-dfe-5的融合蛋白,其n端结构域为proteing的一部分,c端结构域为mnase,所述两个结构域通过短的刚性连接肽linker1连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述mnase的编码核苷酸序列如seqidno.11所示。

所述mnase的氨基酸序列如seqidno.12所示。

所述短的刚性连接肽linker1的编码核苷酸序列同seqidno.5。

所述短的刚性连接肽linker1的氨基酸序列同seqidno.6。

(6)命名为abp-l-dfe-6的融合蛋白,其n端结构域为proteing的一部分,c端结构域为mnase,所述两个结构域通过长的刚性连接肽linker2连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述mnase的编码核苷酸序列同seqidno.11。

所述mnase的氨基酸序列同seqidno.12。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

(7)命名为abp-l-dfe-7的融合蛋白,其n端结构域为proteina的一部分,c端结构域为mnase,所述两个结构域通过短的刚性连接肽linker1连接。

所述proteina的一部分的编码核苷酸序列同seqidno.9。

所述proteina的一部分的氨基酸序列同seqidno.10。

所述mnase的编码核苷酸序列同seqidno.11。

所述mnase的氨基酸序列同seqidno.12。

所述短的刚性连接肽linker1的编码核苷酸序列同seqidno.5。

所述短的刚性连接肽linker1的氨基酸序列同seqidno.6。

(8)命名为abp-l-dfe-8的融合蛋白,其n端结构域为proteing的一部分,c端结构域为mnase,所述两个结构域通过中等长度的刚性连接肽linker3连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述mnase的编码核苷酸序列同seqidno.11。

所述mnase的氨基酸序列同seqidno.12。

所述中等长度的刚性连接肽linker3的编码核苷酸序列如seqidno.13所示。

所述中等长度的刚性连接肽linker3的氨基酸序列如seqidno.14所示。

(9)命名为abp-l-dfe-9的融合蛋白,其n端结构域为proteina的一部分,c端结构域为mnase,所述两个结构域通过长的刚性连接肽linker2连接。

所述proteina的一部分的编码核苷酸序列同seqidno.9。

所述proteina的一部分的氨基酸序列同seqidno.10。

所述mnase的编码核苷酸序列同seqidno.11。

所述mnase的氨基酸序列同seqidno.12。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

(10)命名为abp-l-dfe-10的融合蛋白,其n端结构域为proteing的一部分,c端结构域为tn5m,所述两个结构域通过短的刚性连接肽linker1连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述tn5m的编码核苷酸序列如seqidno.15所示。

所述tn5m的氨基酸序列如seqidno.16所示。

所述短的刚性连接肽linker1的编码核苷酸序列同seqidno.5。

所述短的刚性连接肽linker1的氨基酸序列同seqidno.6。

(11)命名为abp-l-dfe-11的融合蛋白,其n端结构域为proteing的一部分,c端结构域为tn5m,所述两个结构域通过长的刚性连接肽linker2连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

(12)命名为abp-l-dfe-12的融合蛋白,其n端结构域为proteina的一部分,c端结构域为tn5m,所述两个结构域通过短的刚性连接肽linker1连接。

所述proteina的一部分的编码核苷酸序列同seqidno.9。

所述proteina的一部分的氨基酸序列同seqidno.10。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述短的刚性连接肽linker1的编码核苷酸序列同seqidno.5。

所述短的刚性连接肽linker1的氨基酸序列同seqidno.6。

(13)命名为abp-l-dfe-13的融合蛋白,其n端结构域为proteing的一部分,c端结构域为tn5m,所述两个结构域通过中等长度的刚性连接肽linker3连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述中等长度的刚性连接肽linker3的编码核苷酸序列同seqidno.13。

所述中等长度的刚性连接肽linker3的氨基酸序列同seqidno.14。

(14)命名为abp-l-dfe-14的融合蛋白,其n端结构域为proteina的一部分,c端结构域为tn5m,所述两个结构域通过长的刚性连接肽linker2连接。

所述proteina的一部分的编码核苷酸序列同seqidno.9。

所述proteina的一部分的氨基酸序列同seqidno.10。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

(15)命名为abp-l-dfe-15的融合蛋白,其n端结构域为proteing的一部分,c端结构域为tn5m,所述两个结构域通过长的柔性连接肽linker4连接。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述长的柔性连接肽linker4的编码核苷酸序列如seqidno.17所示。

所述长的柔性连接肽linker4的氨基酸序列如seqidno.18所示。

(16)命名为dfe-l-abp-1的融合蛋白,其n端结构域为tn5m,c端结构域为proteina的一部分,所述两个结构域通过长的刚性连接肽linker2连接。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述proteina的一部分的编码核苷酸序列同seqidno.9。

所述proteina的一部分的氨基酸序列同seqidno.10。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

(17)命名为dfe-l-abp-2的融合蛋白,其n端结构域为tn5m,c端结构域为proteing的一部分,所述两个结构域通过长的刚性连接肽linker2连接。

所述tn5m的编码核苷酸序列同seqidno.15。

所述tn5m的氨基酸序列同seqidno.16。

所述proteing的一部分的编码核苷酸序列同seqidno.1。

所述proteing的一部分的氨基酸序列同seqidno.2。

所述长的刚性连接肽linker2的编码核苷酸序列同seqidno.7。

所述长的刚性连接肽linker2的氨基酸序列同seqidno.8。

2、融合蛋白的表达和纯化

将序列正确的17种重组质粒转化到制备的高效感受态大肠杆菌表达菌株bl21(de3)中,在1ml的lb培养基中,37℃培养45min,涂布于含有筛选抗生素卡那霉素的lb固体平板上,37℃过夜培养16h,挑选单克隆菌于接种于含有终浓度为50μg/ml卡那霉素的3ml液体lb培养基中,37℃过夜培养16h。第二天在1个250ml的培养瓶中加入含有终浓度为50μg/ml卡那霉素的50ml液体lb培养基,将过夜培养的菌液按照1:100的比例接入,37℃培养4-6h。在1个3l的培养瓶中加入含有终浓度为50ug/ml卡那霉素的1l液体lb培养基,将250ml培养瓶中的菌液按照1:100比例分别接入,37℃培养,待od600达到0.6左右时,加入iptg诱导剂至终浓度1mm,37℃诱导表达4h。发酵得到4l表达目的蛋白的基因工程菌菌液,使用高速离心机(湘仪)离心,12800g,4℃,5min,弃上清,收集菌体。用200ml缓冲液(50mmtris-hcl,500mmnacl,2mmedta,ph7.5)重悬菌体,高压均质机破碎菌体(条件),再次离心,12800g,4℃,60min,收集上清,弃沉淀。上清用0.22μm滤器过滤除颗粒杂质,使用阳离子层析纯化菌体裂解上清,得到纯度高的目的蛋白。

图3是17种融合蛋白的sds-page电泳图,1-15分别对应abp-l-dfe-1-abp-l-dfe-15,16为dfe-l-abp-1,17为dfe-l-abp-2,m为分子量对照品(marker),各融合蛋白分子量正确,与预期一致。

实施例2改造蛋白抗体结合活性的验证

应用elisa(酶联免疫吸附测定)原理检测融合蛋白的抗体(ig)结合活性,用包被缓冲液(50mm碳酸盐缓冲液,ph9.6)将待检融合酶稀释至1-10μg/ml,不同融合酶的摩尔浓度一致,充分混匀,加入酶标板,100μl/孔,每个融合蛋白三个复孔,阴性对照中不含有融合蛋白,2-8℃孵育过夜;用洗液(1*pbst)洗涤3次;加入封闭液(1*pbs,5%bsa),200μl/孔,37℃培养箱孵育2-3h;用稀释液(1*pbst,5%bsa)将酶标抗体(羊抗兔或羊抗鼠)稀释至5μg/ml,加入各孔中,200μl/孔,37℃培养箱孵育1h后,倒掉反应液;用洗液(1*pbst)洗涤4次;每孔加入tmb显色液,100μl/孔,37℃培养箱孵育10min后,每孔加入终止液(2mh2so4),50μl/孔,终止后立即用酶标仪检测od450。由图4和图5可知,所有改造的融合蛋白均具有良好的兔和鼠抗体结合活性(1-15分别对应abp-l-dfe-1-abp-l-dfe-15,16为dfe-l-abp-1,17为dfe-l-abp-2,18,19号为阴性对照),结果表明所有改造的融合蛋白均具有良好的兔抗体结合活性,不同融合蛋白的兔抗结合活性有所差异,活性高低不一,没有明显规律。

实施例3abp-l-dfe-1(gsldnasei)和abp-l-dfe-3(asldnasei)的dna片段化活性比较

取5-10ng等摩尔浓度的待测蛋白与500ngbl21基因组dna在buffera(20mmtris-hcl,10mmca2cl,ph8.0)中混合均匀,37℃孵育10min,立即上样跑1%的琼脂糖凝胶电泳,验证dna片段化效果。由图6可知,融合不同abp的同一dfe的dna片段化活性相当,具体为分别融合了proteina部分和proteing部分的dnasei在等摩尔浓度下,dna片段化活性相当。

实施例4abp-l-dfe-5(gslmnase)、abp-l-dfe-6(gllmnase)和abp-l-dfe-8(gmlmnase)的dna片段化活性比较

取5-10ng等摩尔浓度的待测蛋白abp-l-dfe-5和abp-l-dfe-6与500ngbl21基因组dna在buffera(20mmtris-hcl,10mmca2cl,ph8.0)中混合均匀,37℃孵育10min,最后通过琼脂糖凝胶电泳验证dna片段化效果。由图7可知,dna片段化活性abp-l-dfe-5>abp-l-dfe-8>abp-l-dfe-6,abp-l-dfe-5的片段化活性最强,abp-l-dfe-6最弱,等摩尔浓度下,短linker融合蛋白活性高于长linker融合蛋白。。

实施例5abp-l-dfe-11(glltn5m)、abp-l-dfe-14(alltn5m)和dfe-l-abp-1(tn5m-lz33)、dfe-l-abp-2(tn5m-lg)的dna片段化活性比较

使用vazyme的td501试剂盒验证融合蛋白的dna片段化活性。首先制备adaptermix,将1nmolprimea(5'-phos-ctgtctcttatacacatct-nh3-3')分别和1nmolprimerb(5′-taatacgactcactataggagatgtgtataagagacag-3′)、1nmolprimerc(primere:5′-ccaaggggttatgctagagatgtgtataagagacag-3′)混合成ab和ac,分别退火,然后将ab和ac混合均匀,即为adaptermix。将等摩尔浓度的融合蛋白与adaptermix30℃孵育1h,然后与600ng大肠杆菌bl21基因组dna在buffera(20mmtris-hcl,10mmca2cl,ph8.0)中混合均匀,55℃孵育10min,最后通过琼脂糖凝胶电泳验证dna片段化效果,结果见图8。

由图8可知,dna片段化活性abp-l-dfe-14>abp-l-dfe-11>dfe-l-abp-1>dfe-l-abp-2,即abp-l-dfe的dna片段化活性优于dfe-l-abp,abp融合在dfe的n端活性比融合在c端更高一些。分析原因可能是因为tn5m在二聚后发挥活性,而其聚合位点在c端,c端融合蛋白后可能影响了蛋白二聚,从而影响活性。

实施例6abp-l-dfe-10(gsltn5m)、abp-l-dfe-11(glltn5m)、abp-l-dfe-12(asltn5m)和abp-l-dfe-14(alltn5m)的dna片段化活性比较

使用vazyme的td501试剂盒验证融合蛋白的dna片段化活性。首先制备adaptermix,将1nmolprimea(5'-phos-ctgtctcttatacacatct-nh3-3')分别和1nmolprimerb(5′-taatacgactcactataggagatgtgtataagagacag-3′)、1nmolprimerc(primere:5′-ccaaggggttatgctagagatgtgtataagagacag-3′)混合成ab和ac,分别退火,然后将ab和ac混合均匀,即为adaptermix。将等摩尔浓度的融合蛋白与adaptermix30℃孵育1h,然后与600ng大肠杆菌bl21基因组dna在buffera(20mmtris-hcl,10mmca2cl,ph8.0)中混合均匀,55℃孵育10min,最后通过琼脂糖凝胶电泳验证dna片段化效果,结果见图9。

由图9可知,dna片段化活性abp-l-dfe-12>abp-l-dfe-10>abp-l-dfe-14>abp-l-dfe-11,即短linker的融合蛋白活性高于长linker的融合蛋白,该结果与实施例4的结果一致,linker越短,活性越高。

实施例7abp-l-dfe-13(gmltn5m)和abp-l-dfe-15(gg4stn5m)的dna片段化活性比较

使用vazyme的td501试剂盒验证融合蛋白的dna片段化活性。首先制备adaptermix,将1nmolprimea(5'-phos-ctgtctcttatacacatct-nh3-3')分别和1nmolprimerb(5′-taatacgactcactataggagatgtgtataagagacag-3′)、1nmolprimerc(primere:5′-ccaaggggttatgctagagatgtgtataagagacag-3′)混合成ab和ac,分别退火,然后将ab和ac混合均匀,即为adaptermix。将等摩尔浓度的融合蛋白与adaptermix30℃孵育1h,然后与600ng大肠杆菌bl21基因组dna在buffera(20mmtris-hcl,10mmca2cl,ph8.0)中混合均匀,55℃孵育10min,最后通过琼脂糖凝胶电泳验证dna片段化效果,结果见图10。

由图10可知,dna片段化活性abp-l-dfe-13>abp-l-dfe-15,即连接abp和dfe使用刚性linker活性优于柔性linker。

实施例8dnasei融合蛋白在adeacs(abp-l-dfeassistantchip-seq)中的应用

将培养的3t3细胞(小鼠胚胎成纤维细胞)按照每管100、1000个细胞分装,用1mltris缓冲液重悬。向每管中加入10ul伴刀豆球蛋白a磁珠(concanavalina–coatedbeads)吸附细胞。用tris缓冲液洗涤细胞2次,去除洗涤液。加入50ulanti-h3k27me3(cellsignalingtechnology)抗体溶液(抗体用tris缓冲液按照1:100稀释,添加浓度为0.05%的地高辛和2mmedta)重悬细胞,阴性对照中加入相同量的非特异兔igg,室温混合10分钟或者4℃过夜。

抗体孵育结束后,在磁力架上去除液体。用1ml缓冲液a(tris缓冲液+0.05%地高辛+2mmedta)重悬洗涤细胞,在磁力架上去除液体。

每管细胞分别加入50ul的abp-l-dfe-1(gsldnasei)和abp-l-dfe-3(asldnasei)(缓冲液a稀释至0.1ug/ml)覆盖细胞,轻轻弹开细胞,在垂直混匀仪上混合10分钟,离心并用磁力架上去除液体。加入150ultris缓冲液重悬细胞,加入3ul100mm氯化钙溶液,混合均匀,激活融合蛋白中dnasei的定点切割活性,在冰上切割20分钟,加入6ul250mmedta终止反应。37℃10分钟释放dna复合物。

高速离心5分钟,将离心管放在磁力架上,目的dna在离心上清中。用dna提取试剂盒或者酚氯仿抽提等方法回收上清中的dna。用vazyme的nd606试剂盒扩增dna并建库,用illumina测序。测序结果见图11。

由图11可知,在100个细胞水平上,abp-l-dfe-1(gsldnasei)和abp-l-dfe-3(asldnasei)在h3k27me3位点的切割谱图与encode(encyclopediaofdnaelements,dna元件百科全书)参照图谱最为接近,而且背景更低。而阴性对照(abp-l-dfe-1-igg,加入非特异性抗体)则没有发生特异性切割。

实施例9不同长度连接肽的mnase融合蛋白在adeacs(甲基化组蛋白位点)中的应用

将培养的mef细胞(小鼠胚胎成纤维细胞)按照每管100、1000个细胞分装,用1mltris缓冲液重悬。向每管中加入10ul伴刀豆球蛋白a磁珠吸附细胞。用tris缓冲液洗涤细胞2次,去除洗涤液。加入50ulanti-h3k27me3(cellsignalingtechnology)抗体溶液(抗体用tris缓冲液按照1:100稀释,添加浓度为0.05%的地高辛和2mmedta)重悬细胞,室温混合10分钟或者4℃过夜。

抗体孵育结束后,在磁力架上去除液体。用1ml缓冲液a(tris缓冲液+0.05%地高辛+2mmedta)重悬洗涤细胞,然后再离心并在磁力架上去除液体。

分别加入50ul的abp-l-dfe-5(gslmnase)、abp-l-dfe-6(gllmnase)和abp-l-dfe-8(gmlmnase)(缓冲液a稀释至1ug/ml)覆盖细胞,轻轻弹开细胞,在垂直混匀仪上混合10分钟,用磁力架上去除液体。加入150ultris缓冲液重悬细胞,加入3ul100mm氯化镁溶液,混合均匀,激活结合至靶位点的融合蛋白中mnase的dna切割活性,在冰上切割30分钟,加入6ul250mmedta终止反应。37℃10分钟释放dna复合物。

高速离心5分钟,将离心管放在磁力架上,目的dna在离心上清中。用dna提取试剂盒或者酚氯仿抽提等方法回收上清中的dna。用vazyme的nd606试剂盒扩增dna并建库,用illumina测序。测序结果见图12。

由图12可知,在100个细胞水平上,abp-l-dfe-5(gslmnase)在h3k27me3位点的切割谱图与encode参照图谱最为接近,而且背景很低,而abp-l-dfe-6(gllmnase)和abp-l-dfe-8(gmlmnase)则不能有效地切割,说明融合蛋白中间的连接肽(l)对融合蛋白的定点切割有重要影响,可能是因为甲基化的组蛋白和dna之间的距离较短,长连接肽的融合蛋白通过抗体结合至此甲基化组蛋白上时,由于连接肽太长,导致dna片段化酶不能和dna有效接触,从而没有引发特异性切割,所以,对于组蛋白甲基化位点以及ctcf等dna结合蛋白来说,需要用较短连接肽的融合蛋白才能进行定点特异性切割。

实施例10不同长度连接肽的mnase融合蛋白在adeacs(ctcf,ccctc结合因子)中的应用

将培养的mef细胞(小鼠胚胎成纤维细胞)按照每管500、5000个细胞分装,用1mltris缓冲液重悬。向每管中加入10ul伴刀豆球蛋白a磁珠吸附细胞。用tris缓冲液洗涤细胞2次,去除洗涤液。加入50ulanti-ctcf(millipore)抗体溶液(抗体用tris缓冲液按照1:100稀释,添加浓度为0.05%的地高辛和2mmedta)重悬细胞,室温混合10分钟或者4℃过夜。

抗体孵育结束后,在磁力架上去除液体。用1ml缓冲液a(tris缓冲液+0.05%地高辛+2mmedta)重悬洗涤细胞,然后再离心并在磁力架上去除液体。

分别加入50ul的abp-l-dfe-5(gslmnase)、abp-l-dfe-6(gllmnase)和abp-l-dfe-8(gmlmnase)(缓冲液a稀释至1ug/ml)覆盖细胞,轻轻弹开细胞,在垂直混匀仪上混合10分钟,离心并用磁力架上去除液体。加入3ul100mm氯化镁溶液,混合均匀,激活结合至靶位点的融合蛋白中mnase的dna切割活性,在冰上切割30分钟,加入6ul250mmedta终止反应。37℃10分钟释放dna复合物。

高速离心5分钟,将离心管放在磁力架上,目的dna在离心上清中。用dna提取试剂盒或者酚氯仿抽提等方法回收上清中的dna。用vazyme的nd606试剂盒扩增dna并建库,用illumina测序。测序结果见图13。

由图13可知,在500个细胞水平上,abp-l-dfe-5(gslmnase)在ctcf结合位点的切割谱图与encode参照图谱最为接近,而abp-l-dfe-6(gllmnase)和abp-l-dfe-8(gmlmnase)则不能有效地切割,和示例10中h3k27me3位点类似,ctcf这种染色体结合蛋白与dna之间的距离较小,需要较短连接肽的融合酶才能有效切割。

实施例11不同长度连接肽的mnase融合蛋白在adeacs(polii转录因子复合物)中的应用

将培养的mef细胞(小鼠胚胎成纤维细胞)按照每管500、5000个细胞分装,用1mltris缓冲液重悬。向每管中加入10ul伴刀豆球蛋白a磁珠吸附细胞。用tris缓冲液洗涤细胞2次,去除洗涤液。加入50ulanti-polii(abcam)抗体溶液(抗体用tris缓冲液按照1:100稀释,添加浓度为0.05%的地高辛和2mmedta)重悬细胞,室温混合10分钟或者4℃过夜。

抗体孵育结束后,在磁力架上去除液体。用1ml缓冲液a(tris缓冲液+0.05%地高辛+2mmedta)重悬洗涤细胞,然后再离心并在磁力架上去除液体。

分别加入50ul的abp-l-dfe-5(gslmnase)、abp-l-dfe-6(gllmnase)和abp-l-dfe-8(gmlmnase)(缓冲液a稀释至1ug/ml)覆盖细胞,轻轻弹开细胞,在垂直混匀仪上混合10分钟,离心并用磁力架上去除液体。加入150ultris缓冲液重悬细胞,加入3ul100mm氯化镁溶液,混合均匀,激活结合至靶位点的融合蛋白中mnase的dna切割活性,在冰上切割30分钟,加入6ul250mmedta终止反应。37℃10分钟释放dna复合物。

高速离心5分钟,将离心管放在磁力架上,目的dna在离心上清中。用dna提取试剂盒或者酚氯仿抽提等方法回收上清中的dna。用vazyme的nd606试剂盒扩增dna并建库,用illumina测序。测序结果见图14。

由图14可知,在500个细胞水平上,abp-l-dfe-6(gllmnase)在polii转录复合物位点的切割谱图与encode参照图谱最为接近,而abp-l-dfe-5(gslmnase)和abp-l-dfe-8(gmlmnase)则不能有效地切割,和甲基化的组蛋白以及ctcf等染色体结合蛋白不同,polii与多个转录因子形成大分子转录复合物,可能是polii转录复合物体积较大,与polii复合物以及其抗体结合的融合蛋白需要足够长的连接肽的融合蛋白才能与染色体dna接触并定点切割。

实施例12不同tn5m融合蛋白在adeacs(polii转录因子复合物)中的应用

将培养的mes细胞(小鼠胚胎干细胞)按照每管200个细胞分装,用1mltris缓冲液重悬。向每管中加入10ul伴刀豆球蛋白a磁珠吸附细胞。用tris缓冲液洗涤细胞2次,去除洗涤液。加入50ulanti-polii(abcam)抗体溶液(抗体用tris缓冲液按照1:100稀释,添加浓度为0.05%的地高辛和2mmedta)重悬细胞,室温混合10分钟或者4℃过夜。

抗体孵育结束后,在磁力架上去除液体。用1ml缓冲液a(tris缓冲液+0.05%地高辛+2mmedta)重悬洗涤细胞,然后再离心并在磁力架上去除液体。

分别加入50ul已包裹好接头的abp-l-dfe-10(gsltn5m),abp-l-dfe-11(glltn5m),abp-l-dfe-13(gmltn5m),abp-l-dfe-15(gg4stn5m),def-l-abp-2(tn5m-lg)(缓冲液a稀释至1ug/ml)覆盖细胞,轻轻弹开细胞,在垂直混匀仪上混合10分钟,离心并用磁力架上去除液体。加入150ultris缓冲液重悬细胞,加入3ul100mm氯化镁溶液(或40ul5×ttbl(vazymetd501)),混合均匀,激活结合至靶位点的融合蛋白中tn5m的dna切割活性,37℃切割30分钟,加入6ul250mmedta终止反应。用vazyme的td501试剂盒扩增dna并建库,用illumina测序并分析。测序结果见图15。

由图15可知,在200个细胞水平上,abp-l-dfe-11(glltn5m)在polii转录复合物位点的切割谱图与encode参照图谱最为接近,背景非常干净,abp-l-dfe-15(gg4stn5m)其次,而abp-l-dfe-10(gsltn5m)和abp-l-dfe-13(gmltn5m)则效果较差,这个结果和实施例11中mnase融合蛋白(abp-l-dfe-6、abp-l-dfe-5、abp-l-dfe-8)介导的切割相似,只有较长的连接肽才能有效介导融合蛋白在polii转录因子复合物上定点切割,短连接肽则效果比较差,其中,abp-l-dfe-11(glltn5m)和abp-l-dfe-14(alltn5m)这种长度合适的刚性连接肽融合蛋白的效果最好。def-l-abp-2(tn5m-lg)没有产生特异图谱,信号与背景相当,说明abp和dfe之间的相对顺序对融合蛋白(尤其是tn5m融合蛋白)的切割性能有显著影响,abp在融合蛋白的n端对dfe的活性干扰较小(和实施例5中结果一致)。

与dnasei和mnase融合酶相比,tn5m融合蛋白由于在切割同时会加上接头,不需要进行dna提取和连接接头,dna的损失更少,可以在200甚至更低数量上的细胞上进行特异性切割,灵敏度更低,应用更方便。

实施例13不同tn5m融合蛋白在adeacs(甲基化组蛋白)中的应用

将培养的mes细胞(小鼠胚胎干细胞)按照每管100个细胞分装,用1mltris缓冲液重悬。向每管中加入10ul伴刀豆球蛋白a磁珠吸附细胞。用tris缓冲液洗涤细胞2次,去除洗涤液。加入50ulanti-h3k4me3(millipore)抗体溶液(抗体用tris缓冲液按照1:100稀释,添加浓度为0.05%的地高辛和2mmedta)重悬细胞,室温混合10分钟或者4℃过夜。

抗体孵育结束后,在磁力架上去除液体。用1ml缓冲液a(tris缓冲液+0.05%地高辛+2mmedta)重悬洗涤细胞,然后再离心并在磁力架上去除液体。

分别加入50ul已包裹好接头的abp-l-dfe-10(gsltn5m),abp-l-dfe-11(glltn5m),abp-l-dfe-12(asltn5m),abp-l-dfe-13(gmltn5m),abp-l-dfe-15(缓冲液a稀释至1ug/ml)覆盖细胞,轻轻弹开细胞,在垂直混匀仪上混合10分钟,离心并用磁力架上去除液体。加入150ultris缓冲液重悬细胞,加入3ul100mm氯化镁溶液(或40ul5×ttbl(vazymetd501)),混合均匀,激活结合至靶位点的融合蛋白中tn5m的dna切割活性,37℃切割30分钟,加入6ul250mmedta终止反应。用vazyme的td501试剂盒扩增dna并建库,用illumina测序并分析。测序结果见图16。

由图16可知,在100个细胞水平上,abp-l-dfe-10(gsltn5m),abp-l-dfe-12(asltn5m)在h3k4me3位点的切割谱图与encode参照图谱最为接近,而abp-l-dfe-11(glltn5m),abp-l-dfe-13(gmltn5m),abp-l-dfe-15(gg4stn5m)等连接肽较长的融合酶则不能有效切割,和实施例9的现象相似,说明长连接肽的融合蛋白不适用于甲基化组蛋白等与dna结合较紧密的蛋白(或转录因子)位点的特异性切割。

综上所述:含有短连接肽的融合蛋白(abp-l-dfe-1,3,5,7,10,12)适用于甲基化组蛋白等与dna结合较紧密的蛋白(或转录因子)位点的特异性片段化;含有长连接肽的融合蛋白(abp-l-dfe-2,4,6,9,11,14,15)适用于polii等大分子转录复合物的定点片段化。不同长度连接肽的融合蛋白应用于不同的实验目的。这些融合蛋白都可以在较少细胞(100个细胞或者更少)上进行原位切割,获得高质量dna片段信息,片段大小合适,非常适合用于ngs分析,在不同细胞的应用中,都获得高质量的测序结果,与encode参照图谱一致或者更优。我们开发的abp-l-dfe以及adeacs(abp-l-dfeassistantchip-seq)在表观遗传学中有广泛的应用潜力。

序列表

<110>南京诺唯赞生物科技有限公司

<120>抗体靶向的重组融合蛋白以及其在表观遗传学中的应用

<160>18

<170>siposequencelisting1.0

<210>1

<211>165

<212>dna

<213>人工序列(artificialsequence)

<400>1

acctataaactggtgatcaacggcaaaaccctgaaaggcgagaccaccaccaaggcagtt60

gatgcagaaaccgccgagaaagccttcaagcagtatgccaacgataacggcgtggatggt120

gtgtggacctatgacgacgccaccaaaacctttaccgtgaccgaa165

<210>2

<211>55

<212>prt

<213>人工序列(artificialsequence)

<400>2

thrtyrlysleuvalileasnglylysthrleulysglygluthrthr

151015

thrlysalavalaspalagluthralaglulysalaphelysglntyr

202530

alaasnaspasnglyvalaspglyvaltrpthrtyraspaspalathr

354045

lysthrphethrvalthrglu

5055

<210>3

<211>780

<212>dna

<213>人工序列(artificialsequence)

<400>3

ctgaaaattgccgcctttaacatccgtaccttcggcgagaccaagatgagtaacgcaacc60

ctggccagctatattgtgcgcatcgtgcgccgctacgatatcgtgctgattcaggaagtg120

cgcgatagccatctggtggccgtgggcaagctgctggactatctgaaccaggacgatccg180

aacacctaccattacgtggttagcgaaccgctgggtcgcaacagctacaaagagcgctac240

ctgttcctgttccgtcctaacaaagtgagcgtgctggacacctatcagtatgacgatggc300

tgcgaaagctgcggtaacgatagcttcagtcgcgaaccggccgtggtgaaattcagcagt360

cacagcaccaaggtgaaggaattcgccattgtggccctgcatagtgccccgagcgatgcc420

gtggccgaaatcaatagcctgtacgacgtgtatctggacgtgcagcagaagtggcactta480

aacgacgtgatgctgatgggtgatttcaacgccgactgcagttacgtgaccagcagtcag540

tggagcagcattcgtctgcgcacaagcagcacctttcagtggctgattccggatagcgcc600

gataccaccgccacaagcaccaactgcgcctatgatcgcattgtggtggccggtagtctg660

ctgcagagtagtgtggtgccgggcagcgcagcaccgtttgattttcaggccgcttatggt720

ctgagcaacgaaatggccctggccattagcgatcattaccctgtggaagtgaccctgacc780

<210>4

<211>260

<212>prt

<213>人工序列(artificialsequence)

<400>4

leulysilealaalapheasnileargthrpheglygluthrlysmet

151015

serasnalathrleualasertyrilevalargilevalargargtyr

202530

aspilevalleuileglngluvalargaspserhisleuvalalaval

354045

glylysleuleuasptyrleuasnglnaspaspproasnthrtyrhis

505560

tyrvalvalsergluproleuglyargasnsertyrlysgluargtyr

65707580

leupheleupheargproasnlysvalservalleuaspthrtyrgln

859095

tyraspaspglycysglusercysglyasnaspserpheserargglu

100105110

proalavalvallyspheserserhisserthrlysvallysgluphe

115120125

alailevalalaleuhisseralaproseraspalavalalagluile

130135140

asnserleutyraspvaltyrleuaspvalglnglnlystrphisleu

145150155160

asnaspvalmetleumetglyasppheasnalaaspcyssertyrval

165170175

thrserserglntrpserserileargleuargthrserserthrphe

180185190

glntrpleuileproaspseralaaspthrthralathrserthrasn

195200205

cysalatyraspargilevalvalalaglyserleuleuglnserser

210215220

valvalproglyseralaalapropheasppheglnalaalatyrgly

225230235240

leuserasnglumetalaleualaileserasphistyrprovalglu

245250255

valthrleuthr

260

<210>5

<211>15

<212>dna

<213>人工序列(artificialsequence)

<400>5

gaagctgccgccaag15

<210>6

<211>5

<212>prt

<213>人工序列(artificialsequence)

<400>6

glualaalaalalys

15

<210>7

<211>138

<212>dna

<213>人工序列(artificialsequence)

<400>7

gccgaggccgcagcaaaagaagctgcagcaaaggaagccgccgccaaagaagctgccgca60

aaagcactggaagcagaggcagccgccaaagaggcagccgccaaagaagcagcagcaaaa120

gaggccgccgccaaggcc138

<210>8

<211>46

<212>prt

<213>人工序列(artificialsequence)

<400>8

alaglualaalaalalysglualaalaalalysglualaalaalalys

151015

glualaalaalalysalaleuglualaglualaalaalalysgluala

202530

alaalalysglualaalaalalysglualaalaalalysala

354045

<210>9

<211>174

<212>dna

<213>人工序列(artificialsequence)

<400>9

gtggataataaatttaataaggagcagcagaatgccttttacgagatcctgcacctgccg60

aacctgaatgaggagcagcgcaacgcattcattcagagcctgaaggatgacccgagtcag120

agcgccaacctgctggccgaagcaaaaaagctgaatgacgcccaggcaccgaaa174

<210>10

<211>58

<212>prt

<213>人工序列(artificialsequence)

<400>10

valaspasnlyspheasnlysgluglnglnasnalaphetyrgluile

151015

leuhisleuproasnleuasnglugluglnargasnalapheilegln

202530

serleulysaspaspproserglnseralaasnleuleualagluala

354045

lyslysleuasnaspalaglnalaprolys

5055

<210>11

<211>447

<212>dna

<213>人工序列(artificialsequence)

<400>11

gcgaccagcaccaagaaactgcacaaggagccggcgaccctgatcaaagcgattgacggt60

gataccgtgaagctgatgtacaaaggccagccgatgaccttccgtctgctgctggttgac120

accccggagaccaagcacccgaagaaaggtgttgagaaatatggcccggaagcgagcgcg180

ttcaccaagaaaatggtggaaaacgcgaagaaaatcgaggttgaatttgacaagggtcag240

cgtaccgataaatacggtcgtggcctggcgtacatttatgcggatggcaagatggtgaac300

gaagcgctggttcgtcaaggcctggcgaaggtggcgtacgtttataaaccgaacaacacc360

cacgagcagcacctgcgtaagagcgaggcgcaagcgaagaaagaaaaactgaacatctgg420

agcgaagacaacgcggatagcggccaa447

<210>12

<211>149

<212>prt

<213>人工序列(artificialsequence)

<400>12

alathrserthrlyslysleuhislysgluproalathrleuilelys

151015

alaileaspglyaspthrvallysleumettyrlysglyglnpromet

202530

thrpheargleuleuleuvalaspthrprogluthrlyshisprolys

354045

lysglyvalglulystyrglyproglualaseralaphethrlyslys

505560

metvalgluasnalalyslysilegluvalglupheasplysglygln

65707580

argthrasplystyrglyargglyleualatyriletyralaaspgly

859095

lysmetvalasnglualaleuvalargglnglyleualalysvalala

100105110

tyrvaltyrlysproasnasnthrhisgluglnhisleuarglysser

115120125

glualaglnalalyslysglulysleuasniletrpsergluaspasn

130135140

alaaspserglygln

145

<210>13

<211>45

<212>dna

<213>人工序列(artificialsequence)

<400>13

gaagctgccgccaaggaagccgccgccaaggaagcagccgccaag45

<210>14

<211>15

<212>prt

<213>人工序列(artificialsequence)

<400>14

glualaalaalalysglualaalaalalysglualaalaalalys

151015

<210>15

<211>1428

<212>dna

<213>人工序列(artificialsequence)

<400>15

atgataacttctgctcttcatcgtgcggccgactgggctaaatctgtgttctcttcggcg60

gcgctgggtgatcctcgccgtactgcccgcttggttaacgtcgccgcccaattggcaaaa120

tattctggtaaatcaataaccatctcatcagagggtagtaaagccgcgcaggaaggcgct180

taccgatttatccgcaatcccaacgtttctgccgaggcgatcagaaaggctggcgccatg240

caaacagtcaagttggctcaggagtttcccgaactgctggccattgaggaaaccacctct300

ttgagttatcgccaccaggtcgccgaagagcttggcaagctgggctctattcaggataaa360

tcccgcggatggtgggttcactccgttctcttgctcgaggccaccacattccgcaccgta420

ggattactgcatcaggagtggtggatgcgcccggatgaccctgccgatgcggatgaaaag480

gagagtggcaaatggctggcagcggccgcaactagccggttacgcatgggcagcatgatg540

agcaacgtgattgcggtctgtgaacgcgaagccgatattcatgcttatctgcaggacaaa600

ctggcgcataacgagcgcttcgtggtgcgctccaagcacccacgcaaggacgtagagtct660

gggttgtatctgtacgaccatctgaagaaccaaccggagttgggtggctatcagatcagc720

attccgcaaaagggcgtggtggataaacgcggtaaacgtaaaaatcgaccagcccgcaag780

gcgagcttgagcctgcgcagtgggcgcatcacgctaaaacaggggaatatcacgctcaac840

gcggtgctggccgaggagattaacccgcccaagggtgagaccccgttgaaatggttgttg900

ctgaccagcgaaccggtcgagtcgctagcccaagccttgcgcgtcatcgacatttatacc960

catcgctggcggatcgacgagttccataaggcatggaaaaccggagcaggagccgagagg1020

caacgcatggaggagccggataatctggagcggatggtctcgatcctctcgtttgttgcg1080

gtcaggctgttacagctcagagaaagcttcacgccgccgcaagcactcagggcgcaaggg1140

ctgctaaaggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccggat1200

gaatgtcagctactgggctatctggacaagggaaaacgcaagcgcaaagagaaagcaggt1260

agcttgcagtgggcttacatggcgatagctagactgggcggttttatggacagcaagcga1320

accggaattgccagctggggcgccctctgggaaggttgggaagccctgcaaagtaaactg1380

gatggctttcttgccgccaaggatctgatggcgcaggggatcaagatc1428

<210>16

<211>476

<212>prt

<213>人工序列(artificialsequence)

<400>16

metilethrseralaleuhisargalaalaasptrpalalysserval

151015

pheserseralaalaleuglyaspproargargthralaargleuval

202530

asnvalalaalaglnleualalystyrserglylysserilethrile

354045

sersergluglyserlysalaalaglngluglyalatyrargpheile

505560

argasnproasnvalseralaglualailearglysalaglyalamet

65707580

glnthrvallysleualaglnglupheprogluleuleualaileglu

859095

gluthrthrserleusertyrarghisglnvalalaglugluleugly

100105110

lysleuglyserileglnasplysserargglytrptrpvalhisser

115120125

valleuleuleuglualathrthrpheargthrvalglyleuleuhis

130135140

glnglutrptrpmetargproaspaspproalaaspalaaspglulys

145150155160

gluserglylystrpleualaalaalaalathrserargleuargmet

165170175

glysermetmetserasnvalilealavalcysgluargglualaasp

180185190

ilehisalatyrleuglnasplysleualahisasngluargpheval

195200205

valargserlyshisproarglysaspvalgluserglyleutyrleu

210215220

tyrasphisleulysasnglnprogluleuglyglytyrglnileser

225230235240

ileproglnlysglyvalvalasplysargglylysarglysasnarg

245250255

proalaarglysalaserleuserleuargserglyargilethrleu

260265270

lysglnglyasnilethrleuasnalavalleualaglugluileasn

275280285

proprolysglygluthrproleulystrpleuleuleuthrserglu

290295300

provalgluserleualaglnalaleuargvalileaspiletyrthr

305310315320

hisargtrpargileaspgluphehislysalatrplysthrglyala

325330335

glyalagluargglnargmetglugluproaspasnleugluargmet

340345350

valserileleuserphevalalavalargleuleuglnleuargglu

355360365

serphethrproproglnalaleuargalaglnglyleuleulysglu

370375380

alagluhisvalgluserglnseralagluthrvalleuthrproasp

385390395400

glucysglnleuleuglytyrleuasplysglylysarglysarglys

405410415

glulysalaglyserleuglntrpalatyrmetalailealaargleu

420425430

glyglyphemetaspserlysargthrglyilealasertrpglyala

435440445

leutrpgluglytrpglualaleuglnserlysleuaspglypheleu

450455460

alaalalysaspleumetalaglnglyilelysile

465470475

<210>17

<211>135

<212>dna

<213>人工序列(artificialsequence)

<400>17

ggtggtggtggcagtggtggtggtggtagcggtggtggtggcagcggtggtggtggcagt60

ggtggtggtggtagcggtggtggtggcagcggtggtggtggcagtggtggtggtggtagc120

ggtggtggtggcagc135

<210>18

<211>45

<212>prt

<213>人工序列(artificialsequence)

<400>18

glyglyglyglyserglyglyglyglyserglyglyglyglysergly

151015

glyglyglyserglyglyglyglyserglyglyglyglyserglygly

202530

glyglyserglyglyglyglyserglyglyglyglyser

354045

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1