用于使用模板转换反应进行cDNA合成和单细胞转录组概况分析的方法和组合物的制作方法_4

文档序号:9816004阅读:来源:国知局
算,通过对数表达的平均数将基因分框,排除任一样本中低于0.1RPKM 的基因。由于所有单细胞的基因表达水平通常是对数正态分布的(本特松(Bengtsson)基因 组研究(Genome Res)200515(10) :1388-1392),所以通过将一个框的平均差乘以0.886来计 算loglO表达值的绝对差和标准差。
[0098]读段覆盖度和GC公差的分析
[0099]针对所有蛋白质编码基因的最长转录物,使用RSeQC-2.3.4软件包(王(Wang)、王 (Wang)以及李(Li).生物信息学2012; 28(16) :2184-5)计算基因体覆盖度(图2E和图8)。对 于通过GC含量分框成10个相等大小的框的所有编码蛋白质的RefSeq基因,使用最长转录物 计算在不同GC含量下的基因检测,并且计算没有检测或具有在不同RPKM截止值下的检测的 基因的数目(图2D和图6)。
[0100] 读段峰分析
[0101] -些基因表现出基因体之内的高密度读段无法解释的峰。为了鉴定这些区域,将 每个基因的基因体分成101个相等大小的框,并且每个基因在该基因之内的平均读段分布 上具有至少一个具有>5的标准差读段密度的框。在这些分析中,弃去具有低表达基因的基 因(根据测序深度/细胞,所具有的读段少于大约2,000_10,000个读段的那些)。每个细胞中 这类基因的数目在图9A中示出。并且在最高数目的HEK239T细胞中具有峰的基因表现为图 9B中的热图,示出这些峰在所有实验中始终存在于相同位置。
[0102] 实例2
[0103] 为改善由单细胞获得的全长转录组概况分析,在cDNA文库收率和长度方面对逆转 录、模板转换寡核苷酸(TS0)以及PCR预扩增的大量变型(总计457个实验)进行评估,并且将 这些结果与商用Smart-Seq(以下称为SMARTcr? )相比较(表1)。重要的是,改进被鉴定显 著增大了由lng启动总RNA获得的cDNA收率和长度(表1)。
[0104] 具体而言,相对于商用Smart-Seq所用的SMARTerK IIA oligo,仅将TS0 3'端 (rGrG+G)的单个鸟苷酸换成锁核酸(LNA)鸟苷酸导致cDNA收率增加了 2倍(p = 0.003,学生t 检验;图la、表2以及图3)。
[0105] 另外,发现甲基基团供体甜菜碱与较高的MgCl2浓度结合对收率具有显著的正面 影响(增加2-4倍,p = 0.0012,学生t检验,针对所有比较)(图lb)。商用Smart-Seq缓冲液具 有6mM MgCl2的最终浓度,但是在此发现当浓度增加至9mM或超出时获得较高的收率。最后, 当在RNA变性之前而不是在RT主混合物中给予dNTP时,预扩增cDNA的平均长度增加370nt(p =7.8\109,学生七检验;图1(3)。
[0106] 进一步证实了用纯化RNA获得的这些改善扩展至在个体人和小鼠细胞的裂解物中 直接进行的cDNA反应。为此,由跨越不同细胞大小和总RNA含量的总计262个个体人或小鼠 细胞(159册1(2931'、3406-75、3(^2(:12以及391^?细胞)产生单细胞〇0嫩文库(表3)。单细胞 cDNA文库的分析表明在两种情况下获得较高的cDNA收率:使用含LNA的TS0(3倍增加,p〈 0.001,学生t检验;图Id)和甜菜碱连同高Mg 2+浓度一起存在(4倍增加 ,p = 3.7 X 10-6,学生t 检验;图le)。
[0107] 单细胞方法的灵敏度和准确度受每个样本处理步骤效率的限制。在用Advantage〗 聚合酶(Adv2)预扩增之前,SMARXer?方案使用珠粒纯化从第一链cDNA反应液中去除未掺 入的衔接子。然而,在小体积中进行珠粒纯化对液体处理自动化提出重大的回收挑战。在此 确定,ΚΑΡΑ HiFi Hot Start(KAPA)DNA聚合酶在逆转录之后立即有效地扩增第一链cDNA, 而无需前面的珠粒纯化。不经珠粒纯化预扩增的文库的收率没有降低,但是平均cDNA长度 增加了450nt(p = 2.6X1012,学生t检验;图lf),表明ΚΑΡΑ预扩增改善了cDNA生成并且提供 用于Smart-Seq自动化的可行方法。
[0108] 为了展示改善的cDNA生成对下游应用的重要性,估计了其对单细胞转录组概况分 析的影响。为此,对根据商用SMARTer(n = 4)和使用本发明方案的变型产生的单一 HEK293T 细胞文库进行测序(Smart-Seq2,η = 35)(表4)。
[0109] 由于可获得更多原始RNA分子用于测序,所以改善的RNA至cDNA转化率应改善基因 表达概况分析。实际上,对于低丰度和中等丰度转录物观察到检测基因表达的能力的显著 增加(图2a)和技术性偏差的降低(图2b和图4)。优化方案的改善的灵敏度导致在每个细胞 中平均检测到2,372个以上的基因(p〈0.05,学生t检验;图2c)。使用替代性RNA-Seq比对和 分析策略独立验证所有这些改善(图5)。此外,与Quartz-Seq获得的数据相比,在用Smart-Seq2产生的单细胞转录组数据中获得更好的灵敏度和更低的变异性(图6)。尽管测序的文 库具有与SARTer文库相似的映射特征,但是注意到未映射的读段增加了7% (图7)。
[0110] 相比于与SMARTcfi起使用的Advantage 2(Adv2),若干预扩增酶具有更低的GC 偏差,表明使用ΚΑΡΑ的cDNA预扩增也可改善单细胞概况分析。事实上,用ΚΑΡΑ预扩增的单细 胞文库在更高GC水平下检测到更多的基因(图2d和图8)并且改善灵敏度和准确度(图9)。当 与通过cDNA的3'端polyA加尾产生的单细胞数据中的5'区域的低覆盖度相比时,已用ΚΑΡΑ 预扩增的单细胞RNA-Seq文库在整个转录物全长上具有显著更好的覆盖度(ρ〈10-5,对于5' 和3'端分别为1.6 X 10-3,学生t检验),因为它们在5'和3'端达到预期的读段分数(图2e和图 10-11)。重要的是,在第一主成分上分离的使用ΚΑΡΑ和Adv2预扩增的细胞的总体基因表达 谱(图2f)表明预扩增偏差对绝对表达水平具有显著影响。对与必定会过滤的预扩增酶无关 而在Smart-Seq中系统性地出现的具有所比对的人工大量读段的区域(即,峰)进行测序(图 12)。总而言之,数据显示使用ΚΑΡΑ进行预扩增改善了 GC公差和在整个转录物上的读段覆盖 度。
[0111] 为确定使用Smart-Seq2的单细胞转录组概况分析中的技术变异性程度,由 HEK293T细胞的稀释系列(100、50以及10个细胞)以及总RNA(lng、100pg、10pg)产生测序文 库。当分析10个或更多个细胞时,技术性损失和偏差是小的,但是在单细胞水平下存在相当 大的变异性,如先前所观察到的。将相同或不同细胞类型来源的细胞中存在的技术变异性 与生物学变异性相对比是有益的(图13A-D)。为此,对来自DG-75(n = 7)、C2C12(n = 6)以及 MEF(n = 7)细胞的另外的单细胞转录组进行测序。分析细胞群之间和细胞群之内的生物学 变异性揭示,与细胞类型特异性表达相关的生物学变异性超过技术变异性大约50RPKM,但 是确切的阈值将取决于所研究的细胞类型中的RNA含量(图13E)。
[0112] 本发明提供一种改善灵敏度、准确度以及在整个转录物上的覆盖度且更易于自动 化的新方案。此外,新方案每个反应的费用小于当前方案的12%并且当使用内部制备的Tn5 时仅为3%(图14)。
[0113] 尽管在Smart-Seq单细胞基因表达分析的背景中实现了这些结果,但是这些改进 也可适用于依赖于模板转换的其他单细胞方法,包括在微流控芯片(例如Fluidigm C1)上 或在乳液滴内部进行的那些。
[0114] 上述实例和优选实施例的描述应视为说明而不是限制如权利要求所限定的本发 明。应当容易认识到,在不脱离如权利要求所阐述的本发明的情况下,可利用以上所阐述的 特征的大量变型和组合。这类变型不视为脱离本发明的精神和范围,并且所有这类变型旨 在被包括在以下权利要求的范围内。
[0115] 在此所引用的所有参考文件通过引用以其全部内容结合在此。
[0116]
[0117]
[0118]
[0119]
[0120]
[0121]
[0122]
[0123]
[0124]
[0125]
[0126]
[0127]
[0128]
[0129]
[0130]
[0131]
[0132]
[0133]
[0134]
[0135]
[0136]
[0137]
[0138]
[0139]
[0140]
[0141]
[0142]
[0143]
[0144]
[0145]
[0146]
[0147]
[0148]
[0149]
[0150]
[0151]
[0152]
[0153]
[0154]
[0155]
[0156]
[0157]
[0158]
[0159]
[0160]
[0161]
[0162]
[0163]
[0164]
[0165]
[0166]
[0167]
[0168]
[0169]
[0170]
[0171]<
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1