一种高通量转录组文库构建方法与流程

文档序号:15457436发布日期:2018-09-15 01:29

本发明涉及分子生物学和生物技术领域,具体涉及一种高通量转录组文库构建方法。



背景技术:

转录组(transcriptom)即特定细胞在某一功能状态或生理条件下所有转录产物的集合,广义上指所能转录出来的所有RNA的总和;狭义上指所有mRNA的集合。

由于蛋白质是行使细胞功能的主要承担者,蛋白质组是细胞功能和状态的最直接描述,但目前蛋白质实验技术存在着一定程度的限制,这使得转录组成为研究基因表达的主要手段。转录组是连接基因组信息与生物功能的蛋白质组之间的必然纽带,是基因功能及结构研究的基础和出发点,目前已广泛应用于基础研究、临床诊断和药物研发等领域。

转录组测序可以得到特定条件下mRNA转录本的丰度信息,基于Illumina高通量测序平台的转录组测序技术使得我们能够在单核苷酸水平下对物种的整体转录活动进行检测,在分析转录本结构和表达水平的同时,还能够发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供全面的转录组信息,是目前深入研究转录组复杂性的强大工具。

目前,转录组文库构建主要包括以下几个方面:(1)mRNA纯化;(2)mRNA片段化;(3) 反转录第一链cDNA合成;(4)第二链cDNA合成;(5)末端修复以及加腺苷酸A;(6)Adapter 的连接;(7)PCR富集文库。其中在mRNA纯化以及后续核酸纯化过程中一般都需用到价格昂贵的核酸纯化磁珠,在mRNA片段化时则一般要用到专门的核酸片段化试剂盒,以及上机测序前利用qPCR对样品所做的绝对定量,这些步骤过程都显著地增加了文库构建的时间和价格成本。因此,在转录组文库构建方法上还需要进一步的改进和完善。



技术实现要素:

本发明的发明人针对上述现有技术的情况,提供一种高通量转录组文库构建方法,该方法利用反转录cDNA第一链合成Buffer作为片段化反应体系,使片段化反应与反转录第一链合成能够无缝衔接起来,简化实验操作步骤;在文库构建的cDNA第二链合成和末端修复完成后的产物纯化回收时,重复回收利用核酸纯化磁珠;在测序样品等量混匀时,无需通过qPCR 对样品进行绝对定量,可直接根据Qubit检测结果对样品做精确混匀。通过以上多处改进,能够有效地减少在文库构建过程中的工作量,同时,也极大地降低了文库构建的成本。

本发明中,发明人针对现有技术中存在三个不足做出了对应的调整如下:

普通转录组文库构建在mRNA片段化时通常会选择使用商品化的试剂盒产品,这样既增加了建库的价格成本,而且还需要对片段化后的mRNA进行纯化工作,致使建库流程更加繁琐。本发明针对此处做出了改进,以反转录cDNA第一链合成的Buffer作为mRNA片段化的反应体系(利用反转录cDNA第一链合成的Buffer作为打断缓冲液),这样既节省了时间提高了效率,又能降低实验成本;

这是由于核酸片段与二价阳离子混合并经过高温处理可以将核酸大片段打断成小片段,而在本发明中我们利用DNA第一链合成Buffer中已存在Mg2+,使用此Buffer直接替代商品化的核酸片段化试剂盒,这样就无需再另外购买核酸片段和试剂盒,由于mRNA片段化过程一直是处于cDNA第一链合成Buffer中,所以无需将片段化后的mRNA纯化分离出来,可直接用于下一步的cDNA第一链合成反应,减少操作步骤,节省时间。

在转录组文库构建过程中一般需要用纯化磁珠对反应产物分离纯化。例如在反转录后需要将反转后的cDNA产物从反应体系中纯化出来,这时就需用到纯化磁珠,但纯化磁珠价格高昂,传统文库构建的过程中一般在使用一次后就会将磁珠丢弃,这极大地增加了建库的成本。针对磁珠纯化部分本发明的发明人进行了系统的改良工作,首先是摸索出合适的纯化反应体系,在保证实验结果不受影响的前提下合理地降低了磁珠的用量,其次是在纯化过程中重复利用纯化磁珠,有效的降低了文库构建的成本。

由于上述采用反转录cDNA第一链合成的Buffer作为打断缓冲液,同时整个处理处于室温环境,这就为磁珠的工作提供了便利:磁珠对核酸的吸附能力与其所处的环境有密切关系,当且仅当其与本发明提供的特定的Buffer混合均匀并处于室温(25℃)时,才能有效发挥磁珠对核酸片段的吸附能力。在反应体系中,若未加入吸附用的特定Buffer,磁珠将不会特定吸附核酸片段,从而不会对反应过程造成影响,在反应结束后,重新加入一定配比的特定 Buffer并混匀,便可使磁珠恢复对核酸片段的吸附能力。

在多个样品的测序工作开始前,需先将样品混匀后再进行测序。通常情况下,在样品等量混匀前需先通过qPCR对样品进行绝对定量,以确定样品浓度的精确值,但是这一步的工作耗时较长,成本也很高。针对此处,我们摒弃了qPCR检测手段,直接利用Qubit检测结果对样品进行高质量、高精度的混匀工作,从而有效地减少了工作量,降低了实验成本。

之所以这样选择,主要原因在于在二代文库测序时,为了最大化的有效利用测序仪,通常会对上百个样品同时进行测序,这就需要将这些待测序的样品混匀到一起,为了保障每一个样品的测序所得数据量足够大并且接近,这就需要保证样品混合体系中各个样品的量是基本一致的,因此在样品混合前需先测定各个样品的浓度;通常为了保证测序结果的均一性,在样品浓度检测时,都会选择高精度的检测方法,例如通过qPCR进行绝对定量,但是二代测序文库样品进行绝对定量需购买转用的试剂盒,例如KAPA二代测序文库定量试剂盒,此方法虽然能够对样品浓度做精确测量,但也会大大增加成本。而本发明所采用的Qubit是一种能够较为精确测量核酸浓度的小型仪器,操作简单,成本低,但是与绝对定量相比,在结果的精度上欠缺一些,发明人在降低试验成本的同时,为了有效降低测定的误差,独创的通过两步Qubit检测来对待测序文库样品进行混匀(pooling)。测序结果表格中,Rawreads一栏的样品数据量波动幅度在可接受范围内,可用于后续分析,这也表明此改进是科学可行的。

在上述改进的基础上,本发明提供的具体步骤如下:

1)mRNA的纯化

利用带有oligo(dT)的磁珠能够将mRNA特异性吸附并分离出来,从而实现mRNA的纯化;原理:真核生物mRNA有特征性的结构,即具有3’端的poly(A)尾巴,因此可以利用带有 oligo(dT)的磁珠能够将其特异性吸附并分离;

2)mRNA片段化

将mRNA与反转录第一链合成Buffer混合均匀,94℃处理1min50s,可将其打断成 200-600bp左右长度的片段;

此处对mRNA进行打断处理时未使用商品化的专用打断试剂,由于核酸片段与二价阳离子混合经高温处理可被打断成小片段,而且在cDNA第一链合成Buffer中恰好含有适量的Mg2+,所以此处可直接选用第一链合成Buffer作为mRNA片段化试剂,此举既可以满足mRNA片段化的需求,又可以在片段化完成后直接将反应产物用于cDNA第一链的合成。

3)反转录cDNA第一链合成

以上一步反应所生成的mRNA片段作为模板,利用逆转录酶合成cDNA第一条链,生成RNA, DNA杂交双链,并利用核酸纯化磁珠从反应体系中将杂交链分离纯化出来,用于后续操作;

4)cDNA第二链合成

利用RNaseH降解上一步反应所得的杂交链中的RNA链,然后再利用DNA聚合酶补齐第二链,生成双链cDNA,并用磁珠吸附DNA双链,丢弃上清部分;由于在下一步的反应中反应体积变化不大,所以将吸附用的磁珠留存在管内,以便进行重复利用;

5)末端修复

针对反转录后cDNA形成的3’和5’突出末端,用酶和dNTP进行末端补平,形成3’和5’平末端,由于管内存有上一步留用的磁珠,故在反应结束后只需加入磁珠吸附用的XP Buffer并充分混匀即可吸附反应产物,吸附完成后将上清部分丢弃,与上一步相同,此处磁珠仍不舍弃,留存管内供下一步吸附使用;

6)加腺苷酸A

利用常用酶将dATP添加到上步反应所得的平末端DNA双链末端,反应得到带有A尾的 DNA双链;

由于管内存有上一步留用的磁珠,只加入磁珠吸附用的XP Buffer并充分混匀以吸附反应产物,由于后续反应的体积发生变化导致管内留存的磁珠量已不再适用,所以在此步将磁珠丢弃。

7)Adapter连接

利用T4DNA Ligase将Universal adapter连接至上一步反应所得的DNA片段的两端,反应结束后加入磁珠吸附,分离纯化反应产物;

8)PCR富集文库

利用高保真DNA聚合酶对加接头后的DNA双链进行富集工作,反应完成后通过加入磁珠吸附,分离得到500-600bp大小范围内的DNA片段;

9)文库检测

使用Qubit 2.0检测所构建文库的浓度,利用琼脂糖凝胶电泳和Agilent2100 Bioanalyzer检测文库的质量;

10)样品混匀

将上一步中所有样品统一稀释到接近同一浓度,利用Qubit 2.0对稀释后的样品浓度进行检测,根据检测结果将样品等量混匀。

如上所述,上述技术方案中,发明人对文库的构建进行了重新的整合,特别采用了三种改进以求获得最好的效果,其中:

其中:在mRNA片段化过程,直接利用cDNA第一链合成Buffer作为mRNA片段化反应的打断试剂,无需再另外购买专用的片段化试剂,反应结束后也无需将片段化后的RNA分离纯化出来,可直接用于下一步的cDNA第一链合成反应,有效节省时间,降低实验成本。

在二代测序文库构建过程中,从cDNA第一链合成至文库构建完成,这其中每一步反应结束后都需对反应体系中的有效产物进行分离纯化操作,目前对此过程大家普遍采用磁珠吸附的方式。但是磁珠本身价格极其昂贵,例如Agencourt AMPure XP Reagent,其中货号为 A63881的产品,体积为60mL,售价高达10000¥左右,当进行批量文库构建时,此部分资金消耗是十分巨大的。

本发明结合实际操作结果对磁珠的使用量做出了有效的减少,同时,在此基础上对部分实验步骤做出进一步改进,做到对磁珠的有效重复利用。其中,在文库构建流程中,自第二链合成开始,至末端加腺苷酸A结束这三步操作过程,反应体系体积基本接近,且在整个反应过程中反应物未发生结构上的巨大变化,所以在此三步反应中始终没有丢弃磁珠,而是留存在PCR管中,重复进行利用。磁珠的吸附能力与所处的液体环境有密切关系,当其处于普通的反应体系中时,并不具有有效的吸附能力,所以也不会对实验结果造成明显影响,而当在每一步反应结束后,加入特定的Buffer混匀,便能再次对反应产物进行有效吸附。通过此处改进,能够明显的降低磁珠的使用量,从而有效降低资金花费。

高通量测序过程中,需要将几十个甚至是百余个样品文库混合(合并文库的过程也称 pooling),然后上机测序。扩增文库分子的准确定量对于ILLUMINA测序平台的有效应用是非常重要的。文库构建得到的样品,在进行上机测序之前需经过多步检测,这是为了确保每一个样品的质量以及确定其浓度,从而有效提高测序成功率,避免失败造成的不必要浪费。

为了保证每一个测序样品的数据量能维持在一个较为统一的范围内,我们需要对每一个样品的浓度进行精细测定,以确保文库混合(合并文库)均匀和不同样品之间的量基本相同。特别是在大批量测序时,此步尤为重要。通常情况下,为了能够精确地测定每一个样品的浓度,我们会选择使用qPCR仪进行绝对定量,但是此方法需使用价格昂贵的二代文库定量试剂盒,这无疑又进一步增加了文库构建的成本。

针对此问题,我们通过实验探索并验证得到了另外一种有效的精确pooling的方法,两步Qubit检测定值法,通过此方法可以做到对样品进行均匀混合,保证在样品混合体系中所有样品的量基本接近,此举既能保证得到有效的测序结果,又避免了qPCR操作,有效降低了实验成本。

除上述三点改进外,其他各步骤为适应上述改进均进行了不同程度的适应性修改,由于各个反应步骤之间有着密切的关联,这种适应性修改绝不是简单的堆积和经验替换就能获得的。改进的步骤与其他未作明显改进步骤之间,有着流程承接上的重要作用,通过发明人的实验技术改进,简化了实验操作步骤,缩短了时间,大大节省了实验花费,提高了效率,是具有划时代意义的一项改进。

综上所述,本发明提供了一种高通量转录组文库构建方法,该方法利用反转录cDNA第一链合成Buffer作为片段化反应体系,使片段化反应与反转录第一链合成能够无缝衔接起来,简化实验操作步骤;在文库构建的cDNA第二链合成和末端修复完成后的产物纯化回收时,重复回收利用核酸纯化磁珠;在测序样品等量混匀时,无需通过qPCR对样品进行绝对定量,可直接根据Qubit检测结果对样品做精确混匀。通过以上多处改进,能够有效地减少在文库构建过程中的工作量,同时,也极大地降低了文库构建的成本。

附图说明

图1为实施例1中芒属植物转录组文库构建结果凝胶电泳图;

在图中最左侧一列是DNA Maker,其中500bp和600bp已被标出,下方为500bp,上方为 600bp,右侧4列是构建得到的文库样品,通过图片我们可以看出4个样品的大小基本实在500-600bp左右,符合实验进行上机测序的要求,说明文库构建结果是成功的;

图2为实施例1中芒属植物转录组文库构建结果Agilent检测图;

上图是对文库构建所得样品进行检测的结果展示,通过Agilent 2100对构建所得的样品的浓度以及大小做出精确检测,在图片的左半部分是凝胶结果,可见1、2、3、4四个样品的大小基本对齐且位于500-600bp左右,在图片的右半部分是对其中某一样品的详细描述,从中我们可以看出样品中DNA片段大小集中分布在550bp左右,这些结果均说明构建所得文库符合上机测序要求,实验结果成功。

具体实施方式

以下实施例中进一步定义本发明,根据以上的描述和这些实施例,本领域技术人员可以确定本发明的基本特征,并且在不偏离本发明精神和范围的情况下,可以对本发明作出各种改变和修改,以使其适用各种用途和条件。除特殊注明外,本发明所采用的均为本领域现有技术;

其中所采用的转录组文库构建部分缓冲液配方如下:

1.Washing Buffer

10mM Tris-Hcl PH7.5,

150mM LiCl

2mM EDTA

2.Binding Buffer

20mM Tris-Hcl PH7.5

1M LiCl

2mM EDTA

3.Agencout AMPure XP Buffer

20%PEG

2.5M NaCl

等量混匀5M NaCl和40%PEG-8000

转录组文库构建所需试剂详细列表

转录组文库构建所需仪器详细列表

实施例1:芒属植物总RNA的转录组文库构建

具体步骤如下:

(一)mRNA纯化

1.将15μg的总RNA用Nuclease-free H2O定容至50μL。

2.将RNA样品于65℃下加热2min,然后立即置于冰上。(破坏二级结构)

3.将25μL Olgio(dT)beads置于120μL Binding Buffer中,用枪头上下吸打进行清洗。清洗两次之后,将清洗后的Olgio(dT)beads置于50μL Binding Buffer中。 (若同时处理多个样品,此步可同时进行。如同时清洗200ul beads以供8个样品使用。)

4.将上述50μL Olgio(dT)beads与50μL total RNA混合,并在室温下涡旋培养10min。

5.将上述离心管放于磁力架上静置,待上清液澄清后,移除上清液。(不要触碰到磁珠)

6.从磁力架上取出离心管,用120μL of Washing Buffer清洗Olgio(dT)两次。 (清洗时需用枪头上下吸打混匀)

7.清洗后室温适度晾干。(磁珠表面无明显水润光泽即可)

8.加入9μL Elution buffer或RNase-free water,置于80℃下培养2min进行洗脱。

9.质量检测:Qubit,检测mRNA得率,一般位于1-5wt%之间;

(二)mRNA片段化

目的:获得富含300bp左右的mRNA片段。

准备下列mix:

●5X First Strand Buffer(包含在Superscript III RT) 4μL

●mRNA(50ng or variable) 8μL

94℃处理1min50s,然后立即置于冰上;所述mRNA为上步净化而得;

(三)cDNA第一链合成

1.试剂在使用前先进行短暂混匀离心。将PCR仪调至65℃。

2.在0.2ml管中配置下列混合体系(14μL):

●mRNA(片段化反应后混合体系) 12μL

●50ng/μL random hexamers 1μL

●10mM dNTP mix 1μL

3.于65℃下反应5min,然后放于冰上至少1min。

4.配制下列cDNA合成混合体系(6μL):

5.向3中体系内加入6μl上述cDNA合成混合体系,轻轻混匀,并短暂离心,25℃培养10min,然后50℃培养50min。

6.85℃下5min,终止反应,立即置于冰上待用。

7.向上述混合物中加入36μL Agencout AMPure XP Beads(提前取出混匀)以吸附 RNA/cDNA杂交链,混匀并室温(25℃)静置6min然后用75%乙醇清洗两次(清洗时无需将沉淀磁珠吸打混匀,只需上下颠倒两次即可)。

8.向上述清洗并适度晾干后的离心管中加入16μL Nuclease Free Water混匀室温静置6min后,磁力架静置吸附磁珠并将上清转移至新管中。

(四)cDNA第二链合成

1.调节PCR仪16℃预热。

2.在冰上混合下列物质(21μL):

3.混匀并短暂离心,16℃温育2.5h。

4.向上述混合物中加入36μL全新Agencout AMPure XP Beads以吸附dsDNA,然后用75%乙醇清洗两次。

5.向上述清洗并适度晾干后的离心管中加入17μL Nuclease Free Water混匀室温静置6min(无需将上清转移,磁珠留存续用)。

6.Qubit检测cDNA的浓度,以便于Pcr扩增时有选择性的确定循环数。

(五)末端修复

1.调节PCR仪20℃预热。

2.在冰上混合下列物质:

3.将上述混合物于20℃下培养30min。

4.向上述混合物中加入36μL Agencout AMPure XP Buffer以配合上步中留下的 Agencout AMPure XP Beads吸附end-repaired DNA,然后用75%乙醇清洗两次。

5.向上述清洗并适度晾干后的离心管中加入17μL Nuclease Free Water室温静置6min(无需将上清转移,磁珠留存续用)。

(六)末端加A

1.调节PCR仪37℃预热。

2.混合下列物质:

3.将上述混合物在37℃下培养30min。

4.向上述混合物中加入36μL Agencout AMPure XP Buffer以配合上步中留下的 Agencout AMPure XP Beads吸附产物,然后用75%乙醇清洗两次。

5.向上述清洗并适度晾干后的离心管中加入10μL Nuclease Free Water室温静置6min,将上清转移至一个新管中。

(七)通用型Y-adapter的连接

1.在冰上混合下列物质:

TruSeq Universal Adapter 1:

5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’,如SEQ NO.1所示;

TruSeq Universal Adapter 2:

5’-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3’,如SEQ NO.2所示;

2.将上述混合物于20℃下培养20min。

3.将上述混合物的一半(12μL)储存于-80℃备用。

4.将另一半定容至20ul,用Agencout AMPure XP beads进行片段筛选,此处连续进行了4次筛选,先选择用0.7倍的XP Beads去除大部分较小片段,再用0.55倍XP Beads 去除600bp及以上的大片段,再用0.65倍XP Beads连续筛选两次,基本可以去除450bp 一下的片段。经过连续多次筛选后最终获得450-600bp间的文库片段。

5.最后用30μLddH2O洗脱。将一半体积的洗脱液(15μL)储存于-80℃备用,另一半(15μL)进行下游实验操作。

(八)文库扩增

1.在冰上混合下列PCR反应物质:

Universal PCR primer:

AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,如SEQ NO.1所示;

Index primer:

CAAGCAGAAGACGGCATACGAGATnnnnnnGTGACTGGAGTTCAGACGTGT,如SEQ NO.3所示;

nnnnnn代表index标签序列;

2.进行PCR:

●一般此处设置为8-10cycles左右,如果cDNA第二链所得的产物浓度相对较低的话可以设置为12-14cycles左右;

3.向上述PCR管中加入20μL Agencout AMPure XP Beads吸附扩增后产物,然后用75%乙醇清洗磁珠两次。

4.用11μL ddH2O洗脱,储存于-80℃。

(九)文库验证(Validate the Library)

目的:检测构建的测序文库浓度和质量

方法:

1.使用Qubit 2.0检测所构建文库的浓度,若文库浓度过低,可用备份样品增加循环数进行再次扩增。

2.通过琼脂糖凝胶电泳检测,可粗略判断所构建文库的片段大小及质量。详见附图 1。

使用Agilent2100Bioanalyzer对所构建文库进行检测。详见附图2,通过比对可知本发明的构建方法是可行的。

(十)样品混匀

1.依据上一步中的Qubit检测结果将样品进行稀释,使稀释后的样品浓度基本相近且处于15-20nM/uL范围内。

2.对稀释后的样品浓度做最终检测,分别吸取1uL待测样品,使用Qubit 2.0检测并记录检测结果。

3.根据最终检测结果对样品进行等量混匀,使得最终混合体系中每个样品的量都为 15nM(如,样品1的最终检测结果为15nM/uL,则从样品1中吸取1uL加入到最终混合体系中)。

发明人利用实施例1中公开的文库构建方法成功构建了420份芒属植物总RNA的转录组文库(测序数据见下表),结果证明利用本发明中的方法能在成功构建转录组文库的同时节省大量时间及物质资源,尤其适用于大批量的文库构建工作,从而实现高效率、低成本、高通量转录组文库的构建。

转录组文库测序数据表

由表可见,相较于传统的文库构建过程,采用此方法能够节省0.5-1d的时间,更为重要的上表是测序数据结果统计,其中第三列是单个样品的测序出样量Rawreads,也即原始数据量,从中能够反映出文库混匀(pooling)时,所有样品是否做到等量混匀,从结果中我们可以看到,所有样品的原始数据量基本都处在一个稳定的范围内,不存在单个样品因为混匀时量过少而被掩埋的现象。

序列表

<110> 山东农业大学

<120> 一种高通量转录组文库构建方法

<160> 3

<170> SIPOSequenceListing 1.0

<210> 1

<211> 58

<212> DNA

<213> 人工序列()

<400> 1

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 2

<211> 33

<212> DNA

<213> 人工序列()

<400> 2

gatcggaaga gcacacgtct gaactccagt cac 33

<210> 3

<211> 51

<212> DNA

<213> 人工序列()

<400> 3

caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg t 51

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1