用于使用模板转换反应进行cDNA合成和单细胞转录组概况分析的方法和组合物的制作方法

文档序号:9816004阅读:503来源:国知局
用于使用模板转换反应进行cDNA合成和单细胞转录组概况分析的方法和组合物的制作方法
【专利说明】用于使用模板转换反应进行cDNA合成和单细胞转录组概况分 析的方法和组合物
[0001]相关申请的交叉引用
[0002]本申请要求2014年8月23日提交的美国临时专利申请序列号61/869,220的优先 权,该申请的内容通过引用结合在此。
技术领域
[0003] 本发明涉及用于以改善的收率和平均长度合成双链cDNA的方法、以及合成的cDNA 分子和由个体细胞产生的cDNA文库。
【背景技术】
[0004] 单细胞基因表达分析具有表征细胞异质性的前景,但是目前的方法牺牲了覆盖 度、灵敏度或通量。存在若干用于由大量RNA构建全长cDNA的方法,包括帽富集过程(cap enrichment procedure)(丸山· K· (Maruyama,Κ·)和菅野· S· (Sugano,S·),基因(Gene) 138,171-174(1994);卡宁奇· P.(Carninci,P.)和林崎· Y.(Hayashizaki,Y·),酶学方法 (Meth.Enzymol.)303, 19-44(1999);达什· M.(Das,M.)等人,生理基因组学 (卩1175^〇1.6611 〇1^(^)6,57-80(2001)),但是由单细胞量1?嫩获得全长覆盖度仍然是具有挑 战性的。现有方法使用cDNA的3'端po 1 yA加尾(例如,唐F . (Tang,F .)等人,自然方法 (Nat .Methods)6,377-382(2009);笹川· Y. (Sasagawa,Υ·)等人,基因组生物学(Genome 81〇1.)14,1?31(2013))或模板转换(朱¥.¥.(21111,¥.¥.)等人,生物技术(8丨(^6(*11丨9脱8)30, 8 9 2 - 8 9 7 ( 2 0 0 1 );拉姆斯科尔德· D . ( Ramsl、0ki D.)等人,自然生物技术 (Nat. Bio techno 1.) 30,777-782 (2012 )),而其他方法由于早期多重化完全牺牲了全长覆盖 度(伊斯兰· S. (Islam,S.)等人,基因组研究(Genome Res. )(2011)doi: 10.1101/ gr · 110882 · 110;哈希姆绍尼T· (Hashimshony T ·)等人,细胞报告(Cel 1 Rep ·)2,666-673 (2012))。最近已经表明,与polyA加尾方法相比,依赖模板转换的Smart-Seq在整个转录物 上具有更加均匀的读段覆盖度(拉姆斯科尔德· D.等人,自然生物技术30,777-782 (2012)),与模板转换在设计来直接捕获RNA 5'端的应用中的常见使用一致,这些应用包括 nanoCAGE(普莱西C.(Plessy,C.)等人,自然方法7,528-534(2010))和 STRT(伊斯兰 S.等人, 基因组研究(2011)do i : 10.1101 /gr. 110882.110)。利用模板转换的单细胞应用依赖于逆转 录、模板转换反应以及统一聚合酶链式反应(PCR)预扩增的效率来获得足量的代表性cDNA 以用于测序。尽管广泛使用这些反应,但是尚未报道由单细胞量改善cDNA文库收率和平均 长度的系统性努力。

【发明内容】

[0005] 本发明提供用于合成cDNA的改进方法,具体而言,在逆转录中,利用模板转换反应 进行单细胞应用的模板转换和预扩增,以增加由个体细胞产生的cDNA文库的收率和平均长 度。结合这些差异的单细胞转录组分析具有改善的灵敏度和准确度,并且偏差较少且更易 进行成本有效的自动化。
[0006] 确切地讲,为了改善由单细胞进行的全长转录组概况分析,本申请披露了在CDNA 文库收率和长度方面对逆转录、模板转换寡核苷酸(TS0)以及PCR预扩增的大量变型的评 估、以及这些结果与商用Smart-Seq(以下称为:SMARTer? )的比较。在此披露的改进出人意 料且显著地增加了从少至lng的启动总RNA获得的cDNA的收率和长度。
[0007] 在一个实施例中,本发明提供了一种用于制备与RNA分子互补的DNA的方法,该方 法包括在包含锁核酸残基的模板转换寡核苷酸(TS0)的存在下进行逆转录反应。
[0008] 在另一个实施例中,本发明提供了一种增加 cDNA收率的方法,包括在cDNA合成中 使用诸如甲基基团供体的添加剂。在一个实施例中,该甲基基团供体是甜菜碱。
[0009] 在另一个实施例中,本发明提供了一种增加 cDNA收率的方法,包括在cDNA的合成 中使用增大浓度的金属盐,例如MgCl2。
[0010] 在一个优选实施例中,该方法包括在cDNA合成中与增大浓度的MgCl2结合使用甲 基基团供体。在一个特别优选的实施例中,该方法包括与增大浓度的MgCl 2结合使用甲基基 团供体甜菜碱,该方法已显示出对cDNA收率的显著的正面影响。
[0011] 在另一个实施例中,本发明提供了一种增加预扩增cDNA的平均长度的方法,包括 在RNA变性之前而不是在逆转录酶(RT)主混合物中给予dNTP。
[0012] 在另一个实施例中,本发明提供了一种通过根据在此披露的实施例中任一个所述 的方法产生的cDNA文库。
[0013] 在另一个实施例中,本发明提供了根据在此披露的实施例中任一个产生的cDNA文 库用于单细胞转录组概况分析的用途。
[0014] 在另一个实施例中,本发明提供了一种用于分析多个单细胞中的基因表达的方 法,包括根据在此披露的实施例中任一个所述的方法制备cDNA文库的步骤;并且对该cDNA 文库进行测序。
[0015] 已根据本发明证实,在纯化的RNA上进行的这些方法可适用于包括例如哺乳动物 细胞的个体后生动物细胞。
[0016] 在另一个实施例中,本发明提供了一种在其3'末端包含LNA的模板转换寡核苷酸 (TS0)〇
[0017] 在另一个实施例中,本发明提供了根据在此披露的实施例中任一个所述的TS0用 于合成双链cDNA的用途。
[0018] 参考以下附图和详细描述将更好地理解本发明的这些和其他方面。
【附图说明】
[0019] 图1示出cDNA文库收率和长度的改善。(A)相对于使用rG3oligo获得的那些,使用 不同的模板转换寡核苷酸,由lng总RNA获得的预扩增cDNA的中值收率。所有oligo序列见于 表1中。(B)相对于使用类似SMARTer?的条件(甜菜碱和6mM Mg2+)获得的cDNA收率,在具有 甜菜碱(黑色)或不具有甜菜碱(灰色)的反应液中由lng总RNA获得且随着增大的Mg 2+浓度变 化的预扩增cDNA的中值收率。(C)在RNA变性之前(早期)或在RT主混合物(晚期)中采用dNTP 的反应液中由lng总小鼠脑RNA产生的预扩增cDNA的长度。(D)利用优化方案使用LNA-G和 SMAR_Ta_?IIA模板转换寡核苷酸由HEK293T细胞获得的预扩增cDNA的中值收率。虚线指示 从商用SMARTer?反应液获得的中值收率。(E)在具有或不具有甜菜碱的反应液中由DG-75 细胞获得的预扩增cDNA的中值收率。(F)在具有或不具有珠粒提取的情况下在反应液中由 单一 HEK293T细胞产生的cDNA文库的长度。注意,脑mRNA天然长于细胞系mRNA〇(A-F)以柱状 图表示重复测量结果,并且每种条件的重复数在括号中指出。使用学生t检验确定平均收率 或长度的显著差异。
[0020]图2示出单细胞中的灵敏的全长转录组概况分析。(A)根据表达水平分框的平行细 胞中可重复检测的基因的百分比。在优化方案和SMARTer?的重复内进行所有成对比较并 且报告为平均值和90%的置信区间。(B)根据表达水平分类的基因框中的重复之内的基因 表达估测值的标准差。误差条,8.6.111。(1124)。(〇在不同的1?^1截止值下,使用8^^丁61? 和优化方案在HEK293T细胞中检测到的基因的平均数目。在所有RPKM阈值下均获得优化方 案中基因检测的显著增加(全部在P〈〇.5下;学生t检验)。0)在根据它们的GC含量分类的基 因框中表达的(RPKM > 1)检测基因的平均分数。来自人组织的mRNA-Se q数据被包含作为未 预扩增对照。误差条表示SEM(n 2 4),并且下方的图示出每个框中的基因的GC范围。(E)对于 使用不同方案产生的单细胞数据,比对到基因的3'最末端的20% 最末端的20%以及中 间60%的读段的平均分数。(F)单细胞基因表达数据的主成分分析显示出两个最显著的成 分。根据预扩增酶和方案变体对细胞进行着色。
[0021 ]图3示出在模板转换寡核苷酸中使用LNA碱基的cDNA收率。
[0022]图4示出单细胞RNA-Seq灵敏度和变异性。(A)平行细胞中可重复检测的基因的百 分比。(B)基因表达估测值的标准差。
[0023]图5示出使用另一个分析通道对单细胞RNA-Seq结果的验证。(A)平行细胞中可重 复检测的基因的百分比。(B)基因表达估测值的标准差。(C)检测基因的平均数目。(D)所表 达的检测基因的平均分数。(E)对于使用不同方案产生的单细胞数据,比对到基因的3'最末 端的20 %、5'最末端的20 %以及中间60 %的读段的平均分数。
[0024] 图6示出用Smart-Seq2、Quartz_Seq以及SMARTer产生的单细胞转录组学数据的比 较。(A)平行细胞中可重复检测的基因的百分比。用Smart_Seq2和Quartz-seq进行所有成对 比较,并且报告为平均数和90%的置信区间。(B)(A)中基因表达估测值的标准差。(C)平行 细胞中可重复检测的基因的百分比
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1