一种通过酶切基因组构建CRISPR/Cas9基因组敲除文库的方法与流程

文档序号:11429089阅读:1013来源:国知局
一种通过酶切基因组构建CRISPR/Cas9基因组敲除文库的方法与流程

本发明涉及一种基因组敲除文库的构建方法。



背景技术:

基因敲除,是指利用基因工程技术手段,对染色体中特定基因或位点进行修饰,从而达到使其表达沉默的一种基因工程技术。crispr/cas9系统源自于细菌中免疫相关机制,自2013年以来,众多文章阐述其作用于真核细胞中的基因编辑作用。crispr/cas9系统包括两部分:具有核酸酶性质的cas9蛋白以及包含靶位点序列片段与guiderna二级结构的guiderna。其原理为:guiderna中靶位点序列片段特异性地与基因组靶位点结合并引导cas9蛋白对基因组靶位点进行切割,使其产生双链dna断裂,有概率发生碱基丢失或添加,在非同源末端连接发生后导致该位点遗传信息改变。利用此系统能够高效地对目的基因进行敲除,从而达到相应目的。crispr/cas9系统作为新兴的强有力的基因编辑以及遗传筛选工具,一经发现便被广泛的研究和应用。相比于早于其而出现的基因编辑工具锌指核酸酶(zfns)以及转录激活因子样的效应因子(talen),其最大的优势在于构造上更为简单高效。

利用crispr/cas9系统进行基因编辑时,靶位点的选定需满足如下条件:guiderna中与靶位点结合部位需紧邻原间隔序列(pam),即pam上游临近的20bp左右的dna序列为guiderna靶序列片段。guiderna结构序列部分为共通部分,不受靶位点影响,其作用是与cas9蛋白结合,在dna双链上产生缺口。因此在crispr/cas9系统的应用过程中仅需更改guiderna靶序列片段即可实现对于不同靶位点的编辑。

近年来,针对全基因组范围内设计的grna文库被应用于哺乳动物的遗传学基因功能的筛查中,利用crispr/cas9敲除文库对实验材料的某一生物学过程进行筛选,最终获得该生物学过程相关的基因。crispr/cas9敲除文库即guiderna文库的优劣在于是否能够最大限度地覆盖基因组中潜在的相关基因。人工设计guiderna需要对研究物种基因组注释为参照,但迄今只有小鼠与人类基因组注释水平较高,其他物种注释不完全,且人工设计guiderna需要筛选候选基因,在此过程中不免遗漏基因或未注释基因。尽管当前技术可以通过寡合苷酸基因合成的方式合成任意需要的grna,但尽可能高效的覆盖全基因组基因仍受限于实验材料基因组的解析程度以及合成过程中人力、财力、物力的消耗。解决上述问题是目前crispr/cas9敲除文库构建工作的瓶颈因素。



技术实现要素:

本发明是要解决现有敲除文库构建方法存在物种基因信息不完善、人工设计覆盖度低且耗时耗力的问题,提供一种通过酶切基因组构建crispr/cas9基因组敲除文库的方法。

本发明通过酶切基因组构建crispr/cas9基因组敲除文库的方法,包括以下步骤:

一、构建mspl.f-library文库

1)为了用于后续靶序列的连接,首先构建出c1-f.mspi-mmei载体:通过基因合成的方式合成含有acli、mmei、mlyi三个限制性内切酶识别位点的正向引物和反向引物,正向引物名称为c1-f.mspi-mmei-anneal-f,序列为:5’-catgtgagtccaacgttggactcg-3’,反向引物名称为c1-f.mspi-mmei-anneal-r,序列为:5’-gatccgagtccaacgttggactca-3’;

将两条引物单体通过退火形成具有粘性末端的双链dna,该dna片段的两粘性末端恰好与pcii和bamhi酶切后的切口相同。

对商品化的pegfp-c1质粒进行pcii和bamhi双酶切,并与退火后的双链dna进行连接,即形成含有两个mmei酶切位点、一个acli酶切位点和两个mlyi酶切位点的c1-f.mspi-mmei载体。

2)为了通过酶切基因组的方式产生grna,对所要研究的细胞提取基因组dna,以待研究的基因组dna为模板,采用mspi进行酶切,该酶的特征在于其识别位点为ccgg,而cgg恰好为grna识别的一类pam序列,酶切后产生的大小不等的dna片段,片段两端均含有cg的5’突出粘性末端;

将c1-f.mspi-mmei载体经acli酶切,产生cg的5’突出粘性末端,将所获得的大小不等的dna片段插入其中,获得mspl.f-library文库;

二、获得约20bpgrna靶序列片段

1)设计并合成含有5’端生物素标记的引物一对,引物名称为c1-f.mspi-a&bio-f,序列为5’-gggtttcgccacctctgacttg-3’,以及引物名称为c1-f.mspi-a&bio-r,序列为5’-gcaagtaaaacctctacaaatgtgg-3’,以mspl.f-library为模板,进行pcr扩增,扩增产物为长度不等的、并且两端均含有生物素标记的dna片段,该片段包括mmei、mlyi酶切识别位点以及mspi消化基因组后的产物片段(产物片段大小不一);

2)对步骤二1)得到的pcr产物进行mmei酶切,mmei酶切位点位于其识别位点下游的18/20bp处,具有2bp的游离端,因此酶切产物中的目的片段包含:mlyi内切酶识别位点与mmei识别位点及下游18/20bp,该片段一端为mmei酶切产生的粘性末端,另一端为带有生物素标记的平末端。mmei识别位点下游18/20bp区域将作为guiderna片段以用于构建敲除文库。此后,通过磁珠吸附系统对含酶切产物进行吸附,目的片段将吸附于链霉亲和素包被的磁珠上;

3)为了仅获得18/20bp的guiderna片段,去除多余部分,接着利用mlyi对磁珠系统进行酶切,mlyi酶切位点位于其识别位点下游5bp处,根据c1-f.mspi-mmei载体设计,mlyi酶切位点切割后,恰好将18/20bp的guiderna片段与多余部分分离并游离于液相,多余部分依旧吸附于磁珠表面。分离液相后即获得18/20bp的特异guiderna片段,该片段特征为:大小约18/20bp片段,来源于基因组ccgg位点中cgg上游18/20bp,一端为平末端、另一端为两碱基突出的粘性末端。该片段作为guiderna中靶向片段,连接guiderna结构序列后便可介导cas9蛋白对靶位点进行切割,从而达到基因敲除的目的。

其中18/20bp表示的是酶切后的双链dna双链长度,一条链长18bp,另外一条链经酶切后产生2bp的游离端,因此另一条链长20bp。

三、构建pam-f.library文库

通过基因合成的方式合成u6启动子以及guiderna结构序列并连入pegfp-c1载体中中kpni与ecori位点之间,获得pam-f载体,将步骤二所获得的约20bpgrna靶序列片段连入pam-f载体中,对pam-f载体进行bbsi内酶切酶切,酶切产物进行补平并磷酸化,产生的平末端用于接纳18/20bpguiderna片段的平末端;补平后进行bsrdi内切酶酶切,酶切获得共计16种不同的两碱基突出末端用于接纳8/20bpguiderna片段的粘性末端。将酶切后的载体与步骤二中得到的18/20bpguiderna片段进行连接,构建获得pam-f.library文库;

四、lenti-grna-library文库构建

对pam-f.library文库进行ecori-kpni双酶切,获得u6-guiderna片段,将u6-guiderna片段连入商品化的慢病毒质粒lenticrisprv2载体中,最终构建获得lenti-grna-library文库。该文库可用于病毒包装并获得慢病毒文库,用于感染细胞并进行相应筛选实验。

进一步的,步骤三中u6启动子的5’端具有kpni内切酶酶切位点,3’端具有bsrdi内切酶识别位点以及切割位点,能够产生2bp的突出端,u6启动子的序列如下:

ggtaccgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacaccnncattgc。

进一步的,步骤三中guiderna结构序列的5’端具有bbsi内切酶识别及酶切位点,3’端具有ecori内切酶酶切位点,guiderna结构序列如下:

gaagacaagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttgaattc。

本发明方法的流程图如图1所示。

本发明的有益效果:

基于crispr/cas9系统设计的grna文库,对于哺乳动物细胞中进行系统遗传学分析具有十分重要的作用。一般情况下,通过对已知的待研究的细胞基因组序列信息进行分析,即可确定pam区临近的20bp序列,再通过基因合成的方式合成grna文库,但目前已知序列信息的物种并不是很多,对于未知序列信息的物种则无法进行grna文库的合成。

本方法以待研究的基因组dna为底物,仅通过几步酶切连接的方式即可加工获得识别基因组中cgg上游位点的grna集合。本方法与传统方法(大量设计并合成grna以获得敲除文库)相比,避免了物种基因信息不完善、人工设计覆盖度低且耗时耗力等缺点,大大提高敲除文库的覆盖率,同时大大降低了生产成本,为广泛物种的敲除文库构建提供新方法。此外,此方法不受特定细胞系的限制,载体构建的操作简单,十分便捷。

本发明通过能够识别pam区的限制性内切酶对待研究的细胞基因组进行酶切,并通过后续几种限制性内切酶的简单酶切连接,从而获得grna文库,这种方式不依赖于已知物种基因组序列信息,避免了物种基因信息不完善、人工设计覆盖度低且耗时耗力等缺点,大大提高敲除文库的覆盖率;

本发明通过酶切连接的方式获得grna文库,相比于基因合成的方式更为简单,大大降低了生产成本;本方法最终构建获得质粒载体,感染细胞后,用于功能基因的筛选,质粒dna相比grna,存在更加稳定,当出现表型后,能够更加容易找到被基因改造的靶基因。

附图说明

图1为本发明通过酶切的方式构建crispr/cas9基因敲除文库的实施流程图。

图2为实施例1中荧光镜下以及光学显微镜下观察到的表达绿色荧光蛋白的pk-15细胞的一个克隆。

图3为实施例1中荧光镜下以及光学显微镜下观察到的稳定表达绿色荧光蛋白的一个pkpg-pi细胞系。

图4为实施例1中对pkpg-pi细胞系经流式细胞分析的表达绿色荧光蛋白的细胞比例。

图5为作为对照的未经转染绿色荧光蛋白。

图6为实施例1中质粒pegfp-c1经mspi酶切电泳结果。

图7为实施例1中针对pegfp-c1构建其对应的mspl.f-library文库,经生物素标记的引物pcr扩增产物电泳结果。

图8为实施例1中生物素标记的pcr产物经mmei酶切后电泳结果。

图9为实施例1中pam-f.library文库测序结果统计。

图10为实施例1中转染绿色荧光蛋白的细胞在转染实验组慢病毒质粒后流式细胞分析egfp阴性细胞比例。

图11为实施例1中转染绿色荧光蛋白的细胞转染了对照组质粒后流式细胞分析egfp阴性细胞比例。

图12为实施例1中细胞未经转染绿色荧光蛋白的流式细胞分析egfp阴性细胞比例。

图13为实施例1中转染绿色荧光蛋白的细胞未转染其他质粒的流式细胞分析egfp阴性细胞比例。

具体实施方式

下面对本发明的实施例做详细说明,以下实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方案和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1:

本实施例通过酶切基因组构建crispr/cas9基因组敲除文库的方法,包括以下步骤:

一、稳定表达绿色荧光蛋白的细胞筛选

将商品化的pegfp-c1质粒通过脂质体转染的方式转染pk-15细胞系,并利用g418进行筛选,挑取稳定表达绿色荧光蛋白的克隆继续进行培养,最终获得稳定表达绿色荧光蛋白的pk-15细胞系,命名为pkpg-pi。

荧光镜下以及光学显微镜下观察到的表达绿色荧光蛋白的pk-15细胞的一个克隆如图2所示,图2中的上面为荧光镜下照片,下面为光学显微镜下照片。荧光镜下以及光学显微镜下观察到的稳定表达绿色荧光蛋白的一个pkpg-pi细胞系如图3所示,图3中的上面为荧光镜下照片,下面为光学显微镜下照片。对pkpg-pi细胞系经流式细胞分析的表达绿色荧光蛋白的细胞比例如图4所示,图5为作为对照的未经转染绿色荧光蛋白。可以看出对照组也就是未经转染绿色荧光蛋白,经流式分选不出绿色蛋白表达的细胞,而实验组也就是经转染绿色荧光蛋白,经流式分选,97.4%细胞都表达绿色荧光蛋白而被筛选出来。

二、针对pegfp-c1构建其敲除文库

(1)以pegfp-c1质粒为底物,利用mspi内切酶对其进行酶切,酶切产物的特点为:24种长度不等的具有cg粘性末端的dna片段,将该酶切产物连入c1-f.mspi-mmei载体中acli位点中,获得pegfp-c1质粒的mspl.f-library文库,其中插入的dna片段两端均相邻有mmei与mlyi内切酶识别位点;质粒pegfp-c1经mspi酶切电泳结果如图6所示。

(2)利用具有生物素标记的引物,对pegfp-c1质粒的mspl.f-library文库进行pcr扩增,得到的扩增产物中包括有mspi酶切产生的片段以及mmei与mlyi识别位点,且扩增产物两端均有生物素标记。对扩增产物利用mmei进行酶切,酶切产物通过琼脂糖凝胶电泳分离后回收并纯化大小约为140bp与75bp两片段,同时利用链霉亲和素包被的磁珠对其进行吸附;针对pegfp-c1构建其对应的mspl.f-library文库,经生物素标记的引物pcr扩增产物电泳结果如图7所示。生物素标记的pcr产物经mmei酶切后电泳结果如图8所示,其中140bp与75bp两片段为目的片段,即包含mlyi内切酶识别位点与mmei识别位点及下游18/20bp。

其中链霉亲和素包被的磁珠为市售产品,商品名称dynabeadstmmyonetmstreptavidinc1,生产公司invitrigen,货号65001。

(3)以吸附产物作为底物,利用mlyi内切酶进行酶切,酶切后的体系中,18/20bp的guiderna片段游离于液相,而其他剩余dna片段仍吸附于磁珠上,分离磁珠与液相,回收液相上清液;

(4)利用pam-f载体中补平后的bbsi与bsrdi位点,将上清液连入其中,获得pegfp-c1质粒的pam-f.library文库;

(5)将pam-f.library文库中的u6-guiderna结构连入商品化的慢病毒质粒lenticrisprv2的eori-kpni间,即获得pegfp-c1质粒的敲除文库——lenti-grna-library文库,该文库可用于慢病毒包装,最终获得针对pegfp-c1质粒的敲除文库病毒。

pam-f.library文库测序统计结果如图9所示,图9中a表示egfp外来源guiderna,b表示egfp来源guiderna。成功的载体中18/20bpguiderna片段来源统计,15个成功载体中5个guiderna来源于egfp,其余对应在pegfp-c1中egfp以外的区域。

三、慢病毒的包装

将hek293t细胞接种于10cm直径的细胞皿中,使用聚氮丙啶(pei)将10μg的lenti-grna-library文库和两包装质粒7.5ug的pspax2和5ug的pmd2.g转入细胞,72小时后收获病毒液并浓缩;

四、病毒的感染及筛选

将pkpg-pi细胞接种于35mm细胞皿中,用上述病毒液按moi=0.05进行感染,作为实验组,命名为libgroup;以对照guiderna相应病毒感染作为对照组,命名为ctrlgroup;非感染组作为空白对照组,命名为nullgroup。感染后的第二天加入2ug/ml的嘌呤霉素进行筛选5天;

五、绿色荧光蛋白敲除效率检测

在感染后的第13天进行细胞的收集,对绿色荧光蛋白敲除效率进行检测。通过流式细胞仪分析各组细胞,获得各组中egfp阳性细胞比例,与对照组和空白对照组的egfp阳性率相比(8.3%,6.6%),实验组egfp阳性率增加(20.5%),即通过本方法获得的针对pegfp-c1质粒的敲除文库具有敲除egfp的功能。

流式细胞分析egfp阴性细胞比例如图10-图13所示。图10表示转染绿色荧光蛋白的细胞在转染实验组慢病毒质粒后有20.5%无绿色荧光信号,图11表示转染绿色荧光蛋白的细胞转染了对照组质粒(不会进行基因敲出),8.1%的细胞无绿色荧光信号,图12表示细胞未经转染绿色荧光蛋白,100%未绿,图13表示转染绿色荧光蛋白的细胞未转染其他质粒,也是一个对照组6.6%的细胞无绿色荧光信号。

这一结果表明通过本方法获得的针对pegfp-c1质粒的敲除文库具有敲除egfp的功能。

序列表

<110>东北农业大学

<120>一种通过酶切基因组构建crispr/cas9基因组敲除文库的方法

<160>6

<210>1

<211>24

<212>dna

<213>人工序列

<220>

<223>引物c1-f.mspi-mmei-anneal-f

<400>1

catgtgagtccaacgttggactcg24

<210>2

<211>24

<212>dna

<213>人工序列

<220>

<223>引物c1-f.mspi-mmei-anneal-r

<400>2

gatccgagtccaacgttggactca24

<210>3

<211>22

<212>dna

<213>人工序列

<220>

<223>引物c1-f.mspi-a&bio-f

<400>3

gggtttcgccacctctgacttg22

<210>4

<211>25

<212>dna

<213>人工序列

<220>

<223>引物c1-f.mspi-a&bio-r

<400>4

gcaagtaaaacctctacaaatgtgg25

<210>5

<211>263

<212>dna

<213>人工序列

<220>

<223>u6启动子序列

<400>5

ggtaccgagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgtt60

agagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtga120

cgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggac180

tatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtgg240

aaaggacgaaacaccnncattgc263

<210>6

<211>96

<212>dna

<213>人工序列

<220>

<223>guiderna结构序列

<400>6

gaagacaagttttagagctagaaatagcaagttaaaataaggctagtccgttatcaactt60

gaaaaagtggcaccgagtcggtgcttttttgaattc96

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1