多种核酸共标记支持物及其制作方法与应用与流程

文档序号:29044903发布日期:2022-02-25 21:45阅读:442来源:国知局
多种核酸共标记支持物及其制作方法与应用与流程

1.本发明是关于一种多种核酸共标记支持物及其制作方法与应用。


背景技术:

2.传统的核酸分子反应,包括核酸杂交、延伸、扩增等反应都是在液相中进行的,液相为参与反应的核酸和酶反应提供了均一稳定的环境从而能够最大化产出。随着生物研究的逐渐深入,科学家发现将参与反应的核酸或者酶连接到固相表面可以赋予核酸空间位置信息从而更方便纯化、分离、检测与分析,因此开发出越来越多的固相核酸反应用于核酸序列分析和核酸定量,例如寡核苷酸有序固定在基质上的核酸芯片技术、应用于二代基因测序的桥式扩增和微球乳液扩增技术、应用于高通量单细胞测序的核酸编码微珠等。
3.单核苷酸多态(snp)作为遗传标记广泛应用于群体基因组学、全基因组关联研究(gwas)、亲子鉴定和人群鉴定。传统的snp鉴定技术可以同时分析数百个以内的位点,包括taqman荧光分析、kaspar鉴定技术以及直接pcr测序技术,优点在于在待检测snp位点数量较少时实验操作灵活,缺点是单个样本待检测snp数量多时(尤其≥50)成本线性增加;包括生物芯片和高通量测序在内的新检测技术可以实现10
3-106个snp的鉴定,例如rad测序(restriction site associated dna sequencing)、外显子测序和全基因组测序,其缺点在于单个样本检测建库与测序成本较高,尤其在单个样本检测snp数量少于1000时单个snp平均检测成本迅速增加;当单个样本待检测snp数量在20-1000时使用多重pcr建库结合二代测序能够有效地降低单snp平均检测成本。
4.多重pcr建库一般是指在pcr扩增体系中加入多对pcr引物以同时扩增多个目标片段,然后通过第二步通用引物扩增形成具有测序仪要求的含有接头和样本标签的核酸文库。由于在pcr扩增体系中加入较高浓度的多对引物,多重pcr容易形成大量的引物二聚体,而引物二聚体会直接影响构建文库的质量,所以如何去除引物二聚体成为多重pcr建库中的关键环节。据公开报道,zuiyi yang等人通过优化引物对序列可以降低多重pcr的引物二聚体,integrated dna technologies公司、adaptive biotechnology公司以及kenneth j.livak实验室利用rnaseh依赖的pcr原理对多重pcr引物进行rna碱基修饰也可以有效的降低反应过程中的引物二聚体。虽然引物二聚体可以通过以上披露的方法以及pcr后纯化去除,多重pcr还存在扩增目标区效率不同导致的pcr偏差以及引物对交叉组合导致的非特异扩增等问题。更重要的是,由于在液相条件中不同引物对的pcr扩增目标区域不能重叠,普通多重pcr很难在液相体系中实现单反应管长片段dna的连续序列分析。
5.众所周知复杂的生命机体由许多性质特异的细胞组成,在特定的状态下每个细胞表达的核酸和蛋白的种类与数量都有所不同,所以在单细胞水平上检测核酸和蛋白指标对生物医学研究有重要意义。单细胞测序从检测指标来看主要有单细胞基因组测序、单细胞rna测序、单细胞表观基因组测序及空间单细胞测序;从检测通量来看主要分为低通量单细胞测序(一次检测1-500细胞)和高通量单细胞测序(一次检测1000-10000细胞)。
6.高通量单细胞rna检测主要有基于油包水的液滴区隔技术、基于微孔板的beads标
记技术以及微流控三种实现方式。基于油包水的液滴区隔技术以10x genomics、drop-seq平台及indrop平台为代表。该类技术通过微流控技术将barcode标记的微珠和单个细胞包裹在个油滴中并裂解释放含有polya尾巴的rna;每一个凝胶微珠偶联了含有细胞标签和分子标签的oligo dt核酸序列;mrna结合到细胞标签和分子标签的oligo dt核酸分子后通过逆转录给不同细胞来源的cdna标记上不同的细胞标签并用于以后的混合建库并测序分析。基于微孔板的beads标技术以bd cytoseq、seqwell及microwell-seq为代表。该技术将细胞自然沉降至细胞数量十倍以上的微孔阵列中保证单细胞入孔率,然后在微孔中加入细胞标签标记的微珠用以捕获细胞裂解后的mrna;mrna结合到细胞标签和分子标签的oligo dt后通过逆转录给不同细胞来源的cdna标记上不同的细胞标签并用于以后的混合建库并测序分析。
7.液滴法通过油包水将细胞和标签微珠与其它细胞与微珠完全隔离,有效地降低了交叉污染的可能;同时除了可以实现3’rna表达谱文库外,液滴方案还可以将细胞标签和分子标签与模板转换序列偶联在一起从而实现5’单细胞rna表达谱测序;但由于液滴本身的不稳定性以及悬浮特性,基于液滴法的单细胞建库方案在rna被细胞标签标记前后不能换液,从而减少了其进一步进行复杂反应的可能,尤其是缺少标签微珠的位置信息。微孔板法避免了10x中存在的概率碰撞影响捕获效率的问题,有更好的细胞捕获效率;标签微珠落入微孔后具有固定的位置,可以进行更多的换液操作;但是由于微孔是顶部开放的半封闭结构会导致细胞rna扩散出孔,因此目前所有的微孔法只能构建3’单细胞rna表达谱文库。


技术实现要素:

8.本发明的一个目的在于提供一种多种核酸共标记的支持物。
9.本发明的另一目的在于提供一种多种核酸共标记的支持物的制作方法。
10.本发明的另一目的在于提供多种核酸共标记的支持物的应用。
11.本发明在支持物上修饰两种以上的核酸分子,其中一种核酸分子用于从反应池中捕获目的化合物并与共标记在同一固相化合物表面的其它类型分子一起参与特定的生物化学过程,包括但不限于多重pcr文库构建、单细胞rna表达谱、单细胞转录组测序文库构建和单细胞多组学测序文库构建等应用方向。
12.具体而言,一方面,本发明提供了一种多种核酸共标记的支持物,其包括支持物本体以及位于支持物本体表面和/或内部的多种核酸标记,单个支持物上标记的核酸至少包括:一或多个第一核酸标记,其作用至少包括捕获反应体系中的特定化合物到支持物表面;一或多个第二核酸标记,其作用至少包括可以参与到捕获到支持物表面的特定化合物的指定生物化学反应过程。
13.根据本发明的具体实施方案,本发明的多种核酸共标记的支持物中,所述支持物本体为固体珠子和/或半固态水凝胶珠。
14.根据本发明的具体实施方案,本发明的多种核酸共标记的支持物,其为包括多个支持物的组合物。
15.根据本发明的具体实施方案,本发明的多种核酸共标记的支持物中,同一支持物上的第一核酸标记、第二核酸标记的数量可以分别≥1个和/或≤10
13
个。
16.根据本发明的具体实施方案,本发明的多种核酸共标记的支持物中,同一支持物
上的多个第一核酸标记的序列相同或不同;不同支持物上的第一核酸标记的序列相同或不同;同一支持物上的多个第二核酸标记的序列相同或不同;或不同支持物上的第二核酸标记的序列相同或不同。
17.另一方面,本发明还提供了所述的多种核酸共标记的支持物的制作方法,其包括:
18.将多种核酸通过接枝到和/或接枝于的方式标记到支持物本体上,得到多种核酸共标记的支持物。
19.根据本发明的具体实施方案,本发明的多种核酸共标记的支持物的制作方法包括:
20.将支持物本体和核酸分别修饰上能相互作用的功能单位,使二者反应将核酸标记到支持物本体上;
21.按照预设好的核苷酸序列将核酸直接合成在支持物本体上;和/或
22.采用生物化学反应进行核酸延伸或连接的方案在支持物本体上进行核酸标记。
23.另一方面,本发明还提供了所述的多种核酸共标记的支持物在5’单细胞rna表达谱分析、构建微孔阵列平台的5’单细胞vdj文库、构建3’单细胞rna文库、构建单细胞转录组文库、单细胞多组学研究、多重pcr和/或构建多重pcr测序文库中的应用。
24.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物是用于5’单细胞rna表达谱分析。其中:支持物上固定有含有细胞标签与分子标签的模板转换序列以及rna捕获序列。具体地,支持物上标记了至少两种核酸序列:第一核酸序列和第二核酸序列;第一核酸序列至少包含捕获序列,用于捕获目的核酸分子并作为引物延伸或逆转录;第二核酸序列包括细胞标签序列,细胞标签序列用于标记来源于同一细胞中的所有mrna的分子;不同种类的支持物上具有不同的细胞标签。优选地,使得支持物在芯片的微孔中捕获单细胞裂解后释放的rna,并在逆转录过程中通过模板转换实现对来源于同一细胞的rna标记相同的细胞标签,而后通过扩增实现cdna扩增并最终构建为5’单细胞rna表达谱文库。
25.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物是用于构建微孔阵列平台的5’单细胞vdj文库。其中:支持物上固定有含有细胞标签与分子标签的模板转换序列以及rna捕获序列。具体地,支持物上标记了至少两种核酸序列:第一核酸序列和第二核酸序列;第一核酸序列至少包含捕获序列,用于捕获目的核酸分子并作为引物延伸或逆转录;第二核酸序列包括细胞标签序列、分子标签序列和模板转换序列,细胞标签序列用于标记来源于同一细胞中的所有mrna的分子;分子标签序列用于标记每个逆转录出来的cdna分子,从同一支持物上的不同的rna逆转录出来的cdna分子都被标记上不同的分子标签;模板转换序列可以作为模板使逆转录出来的cdna 3’端继续延伸以标记上分子标签序列和细胞标签序列;不同种类的支持物上具有不同的细胞标签。优选地,使得支持物在芯片的微孔中捕获单细胞裂解后释放的rna,并在逆转录过程中通过模板转换实现对来源于同一细胞的rna标记相同的细胞标签,进一步通过tcr与bcr/ig基因的恒定区引物实现tcr与bcr/ig核酸序列的富集并最终打断构建为高通量单细胞vdj测序文库。
26.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物是用于构建3’单细胞rna文库。其中:支持物上固定有含有细胞标签的可条件性封闭的随机引物以及rna捕获序列,具体地,支持物上标记了至少两种核酸序列:第一核酸序列和第二核酸序列;第一核酸序列至少包含捕获序列,用于捕获目的核酸分子并作为引物延伸或逆转录;第二
核酸序列包括含有细胞标签的可条件性封闭的随机引物,细胞标签序列用于标记来源于同一细胞中的所有mrna的分子;不同种类的支持物上具有不同的细胞标签。优选地,使得支持物在芯片的微孔中捕获单细胞裂解后释放的rna并逆转录为cdna,随后的含有细胞标签的随机引物通过二链合成实现对来源于同一细胞的cdna标记上相同的细胞标签,而后通过扩增实现cdna扩增构建为3’单细胞rna文库。
27.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物是用于构建单细胞转录组文库。其中:支持物上固定有含有细胞标签的随机引物序列以及rna捕获序列,不同种类的支持物上具有不同的细胞标签,能够检测rna分子上的任何一段序列而不局限于3’端或5’端;优选地,支持物包括两种类型的支持物,每种类型的单个支持物上至少有两种核酸序列,第一核酸序列和第二核酸序列的组合,或者是第三核酸序列和第二核酸序列的组合;第一核酸序列至少包含捕获序列用于捕获目的核酸分子;第二核酸序列包括含有细胞标签的随机引物序列,细胞标签序列用于标记来源于同一细胞中的所有mrna的分子;第三核酸序列包括细胞标签序列和捕获序列。优选地,使得支持物在芯片的微孔中捕获单细胞裂解后释放的rna,并在逆转录过程中实现对来源于同一细胞的rna标记相同的细胞标签,而后通过扩增实现cdna扩增并最终构建为单细胞rna转录组文库。
28.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物是用于单细胞多组学研究。优选地,包括用于构建rna表达水平的文库和/或通过蛋白的核酸标签用于检测蛋白表达水平。其中:支持物上固定有含有细胞标签的rna捕获序列和用于标记蛋白的核酸标签的捕获序列,而且不同种类的支持物上具有不同的细胞标签。优选地,第一核酸序列至少包含捕获序列用于捕获目的核酸分子并作为引物延伸;第二核酸序列包括细胞标签序列、分子标签序列和模板转换序列;细胞标签序列用于标记来源于同一细胞中的所有mrna的分子;分子标签序列用于标记每个逆转录出来的cdna分子,从同一支持物上的不同的rna逆转录出来的cdna分子都被标记上不同的分子标签;模板转换序列可以作为模板使逆转录出来的cdna 3’端继续延伸以标记上分子标签序列、细胞标签序列;第三核酸序列包括细胞标签序列、分子标签序列和蛋白核酸标签捕获序列,蛋白核酸标签捕获序列用来捕获并延伸与待测单细胞在同一空间结构的蛋白核酸标记。优选地,使得支持物在芯片的微孔中捕获单细胞裂解后释放的rna以及蛋白的核酸标签,并在逆转录过程中实现对来源于同一细胞的rna与蛋白核酸标签标记上相同的细胞标签,而后通过扩增最终构建为单细胞rna转录组文库及蛋白标记核酸文库。
29.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物是用于构建多重pcr测序文库。其中:将能够相互干扰的引物分别固定到不同支持物上。具体地,支持物包含至少两种类的支持物:一或多个第一种类的引物标记的支持物,一或多个第二种类的引物标记的支持物,每个支持物上标记上至少一对的核酸引物:第一种类的引物标记的支持物上标记上第一核酸引物对,第二种类的引物标记的支持物上标记上与第一核酸引物对不同的第二核酸引物对,两种类支持物各自独立地还可选择性包括更多的核酸引物对例如其他核酸引物对,同一支持物上的多对引物对所扩增的目标片段在模板上不重合;不同支持物上标记的引物对不同从而可扩增不同的目的区域,这些目的区域间可以部分重合或者不重合。优选地,将所有支持物按照比例混合后与核酸模板和pcr酶反应体系混合,从而进行单管无偏差的多重pcr。
30.另一方面,本发明还提供了一种试剂盒,其包括本发明所述的多种核酸共标记的支持物。优选地,所述试剂盒为可应用于5’单细胞rna表达谱分析、构建微孔阵列平台的5’单细胞vdj文库、构建3’单细胞rna文库、构建单细胞转录组文库、单细胞多组学研究、多重pcr和/或构建多重pcr测序文库的试剂盒。
31.更优选地,所述试剂盒还包括以下组合物中的一种或多种:
32.组合物1:含有细胞标签与分子标签的模板转换序列以及rna捕获序列的支持物的混合物、微孔芯片、细胞裂解液、逆转录试剂、核酸扩增试剂以及核酸打断建库模块;包含该组合物1的试剂盒可用于5’单细胞rna表达谱分析;
33.组合物2:含有细胞标签与分子标签的模板转换序列以及rna捕获序列的支持物的混合物、微孔芯片、细胞裂解液、逆转录试剂、恒定区引物、核酸扩增试剂以及核酸打断建库模块;包含该组合物2的试剂盒可用于构建微孔阵列平台的5’单细胞vdj文库;
34.组合物3:含有细胞标签的随机引物以及rna捕获序列的支持物的混合物、微孔芯片、细胞裂解液、逆转录试剂、二链合成模块和核酸扩增与延伸试剂;包含该组合物3的试剂盒可用于构建3’单细胞rna文库;
35.组合物4:含有细胞标签的随机引物序列以及rna捕获序列的支持物混合物、微孔芯片、细胞裂解液、逆转录试剂、二链合成模块以及核酸扩增与延伸试剂;包含该组合物4的试剂盒可用于构建单细胞转录组文库;
36.组合物5:含有细胞标签的蛋白标签核酸的捕获序列支持物混合物、微孔芯片、细胞裂解液、逆转录试剂、核酸打断建库模块;包含该组合物5的试剂盒可用于单细胞多组学研究;
37.组合物6:预混的已偶联引物的支持物混合物及多重pcr酶及缓冲液;进一步选择性地还包括适配高通量测序仪的标签引物;包含该组合物6的试剂盒可用于多重pcr和/或构建多重pcr测序文库(预混的已偶联引物的支持物混合物及多重pcr酶及缓冲液,可以实现单管无偏差的多重pcr;进一步包括适配高通量测序仪的标签引物,通过index pcr构建能够用于测序分析的多重pcr文库)。
38.综上所述,本发明提供了一种多种核酸共标记的支持物及其制作方法与应用。本发明的技术通过在固相(包括半固态)支持物上进行多种核酸修饰的方案,可以将核酸分子捕获到固相表面并与固相表面修饰的其它种类核酸一起进行特定的生物化学反应。特定种类的多核酸修饰固相支持物可以用于多重pcr文库构建、单分子长片段核酸测序文库构建、单细胞转录组测序文库构建和单细胞多组学测序文库构建等领域。
附图说明
39.图1a-图1c为本发明的多种核酸共标记的支持物的结构示意图。
40.图2a、图2b为本发明的多种核酸共标记的支持物应用于多重pcr反应的示意图。
41.图2c为本发明的多种核酸标记的支持物应用于多重pcr测序文库构建的示意图。
42.图2d、图2e为本发明的应用于多重pcr用途的多种核酸共标记支持物的设计方法及结构示意图。
43.图3a为本发明的应用于5’单细胞rna表达谱分析、构建微孔阵列平台的5’单细胞vdj文库的多种核酸共标记的支持物的结构示意图。
44.图3b为图3a中所示的多核酸标记支持物在应用于5’单细胞rna表达谱分析、构建微孔阵列平台的5’单细胞vdj文库的实验流程图。
45.图3c为本发明的应用于5’单细胞rna表达谱分析的核酸共标记支持物的制作示意图。
46.图4a为本发明的应用于3’单细胞rna文库的多种核酸共标记的支持物的结构示意图。
47.图4b为本发明的多种核酸共标记的支持物应用于3’单细胞rna文库的流程示意图。
48.图5a为本发明的用于构建单细胞转录组文库的多种核酸共标记支持物的结构示意图。
49.图5b为本发明的多种核酸共标记的支持物用于构建单细胞转录组文库的流程示意图。
50.图6a为本发明的用于构建多组学单细胞文库的多种核酸共标记支持物的结构示意图。
51.图6b为本发明的多种核酸共标记的支持物用于构建多组学单细胞文库的流程示意图。
52.图7a所示为采用实施例1中流程构建的膜蛋白核酸标签测序文库的琼脂糖电泳结果。
53.图7b所示为采用实施例1中流程构建的5’单细胞表达谱文库片段分析结果。
54.图7c所示为采用实施例1中流程构建的t细胞vdj文库片段分析结果。
55.图7d所示为采用实施例1中流程构建的b细胞vdj文库片段分析结果。
56.图8所示为采用实施例2中流程所构建的3’单细胞rna文库和实施例3中流程所构建的单细胞转录组文库经过测序分析得到reads在基因水平上的分布。bd phapsody 3’单细胞表达谱文库为完全采用bd rhapsody构建的文库分析结构。
57.图9所示为采用实施例4中流程构建的多重扩增pcr测序文库的片段大小分析结果。
具体实施方式
58.以下通过具体实施方式和实施例详细说明本发明的实施过程和产生的有益效果,旨在帮助阅读者更好地理解本发明的实质和特点,不作为对本案可实施范围的限定。下述具体实施方式和实施例中未详细注明的方法,按照所属领域的常规操作或是仪器厂商建议的操作条件进行。
59.本发明的描述中所使用的术语“一”、“一个”、“一种”以及“该”“所述”,意旨也包括复数形式,除非上下文另有明确说明或根据上下文含义能明确其表示单数。
60.本发明首先提供了多种核酸共标记的支持物的结构。如图1a至图1c所示,支持物本体可以是固体平面(图1a),也可以是固体珠子(图1b)或者半固态水凝胶(图1c);核酸标记可以位于固体表面(图1a和图1b)也可以位于水凝胶疏松的内部(图1c)。单个支持物上标记的核酸至少包括:一或多个第一核酸标记101,其作用至少包括捕获反应体系中的特定化合物到支持物表面(因此第一核酸标记101亦称为捕获核酸标记);一或多个第二核酸标记
102,其作用至少包括可以参与到捕获到支持物表面的特定化合物的指定生物化学反应过程(因此第二核酸标记102亦称为反应核酸标记)。支持物上还可选择性包括其他种类的核酸标记1n。
61.根据本发明的一些具体实施方案,本发明的多种核酸共标记的支持物,其为包括多个上述支持物(图1a、图1b和/或图1c所示意结构的支撑物)的组合物。
62.在特定的用途下,同一支持物上的多个第一核酸标记101的序列可以是相同的。在特定的用途下,同一支持物上的多个第一核酸标记101的序列可以是不相同的。
63.在特定的用途下,不同支持物上的第一核酸标记101的序列可以是相同的。在特定的用途下,不同支持物上的第一核酸标记101的序列可以是不相同的。
64.在特定的用途下,同一支持物上的多个第二核酸标记102的序列可以是相同的。在特定的用途下,同一支持物上的多个第二核酸标记102的序列可以是不相同的。
65.在特定的用途下,不同支持物上的第二核酸标记102的序列可以是相同的。在特定的用途下,不同支持物上的第二核酸标记102的序列可以是不相同的。
66.同样的,在特定的用途下,同一支持物上的多个其他种类的核酸标记1n的序列可以是相同的或是不同的。在特定的用途下,不同支持物上的其他种类的核酸标记1n的序列可以是相同的或是不同的。
67.根据不同的用途,同一支持物上的第一核酸标记、第二核酸标记、其他种类的核酸标记的数量可以分别≥1个和/或者≤10
13
个。
68.在特定的用途下,第一核酸标记与第二核酸标记的功能可以转换,即,同一种核酸标记即可具备本发明所述的“捕获反应体系中的特定化合物到支持物表面”功能,也可以具备本发明所述的“参与到捕获到支持物表面的特定化合物的指定生物化学反应过程”功能。举例而言,这样的第一核酸标记与第二核酸标记可以是引物对中的两条引物。
69.本发明还提供了针对不同用途的多种核酸共标记的支持物的制作方法。对支持物进行核酸标记可以采用“graft to”(接枝到)和“graft from”(接枝于)两种方案。在特定用途下,对支持物进行核酸标记可以单独采用“graft to”方案。在特定用途下,对支持物进行核酸标记可以单独采用“graft from”方案。在特定用途下,对支持物进行核酸标记可以混合采用“graft to”和“graft from”两种方案。
70.采用“graft to”方案时,支持物和核酸分别修饰上能相互作用的功能单位,功能单位包括但不限于羟基、醛基、环氧基、氨基、羧基及其活化形式、磷酸、炔基、叠氮、巯基、烯烃、生物素、亲和素、异硫氰酸酯、异氰酸酯、酰基叠氮、磺酰氯、甲苯磺酰基酯等中的一种或多种。不同种类的核酸标记(第一核酸标记、第二核酸标记、其他种类的核酸标记)可以修饰上相同的功能单位,也可以修饰上不同的功能单位。修饰后的支持物和核酸在特定的条件下充分接触以使能够相互作用的功能单位发生反应从而相互连接。
71.采用“graft from”方案时,可以按照预设好的核苷酸序列直接合成在支持物上,也可以采用生物化学反应进行核酸延伸或连接的方案进行核酸标记。标记的核酸中可以加入本领域内熟知的核酸修饰,包括但不限于氨基、磷酸、炔基、叠氮、巯基、双硫、烯烃、生物素、偶氮苯、甲基、spacer、光裂解集团、di、du、lna、xna、核糖核酸碱基和双脱氧核糖核酸碱基等中的一种或多种。
72.本发明还提供了多种核酸共标记的支持物应用于多重pcr的用途。在传统的多重
pcr应用中,所有的模板和引物被混合在同一个反应体系内,随着pcr的目的区域增加引物对的种类和总浓度也会相应增加,这就容易形成引物二聚体从而降低目标区域的扩增效率。使用本发明提供的多种核酸共标记的支持物可以很好地减少多重pcr中的引物二聚体的产生,而且由于避免了pcr引物间相互干扰可以实现单管分析长片段的连续序列。如图2a所示,在该用途下,本发明提供的多种核酸共标记的支持物包含至少两种类的支持物:一或多个第一种类的引物标记的支持物1,一或多个第二种类的引物标记的支持物2,每个支持物上标记上至少一对的核酸引物:如图所示,第一种类的引物标记的支持物1上标记上第一核酸引物对(第一正向引物201f和第一反向引物201r),第二种类的引物标记的支持物2上标记上与第一核酸引物对不同的第二核酸引物对(第二正向引物202f和第二反向引物202r,两种类支持物各自独立地还可选择性包括更多的核酸引物对例如其他核酸引物对(其他正向引物2nf与其他反向引物2nr)。且可以通过pcr引物设计软件例如primer premier优化引物序列降低同一个磁珠上的多对引物之间相互干扰。同一支持物上的多对引物对所扩增的目标片段在模板上不重合。不同支持物上标记的引物对可不同从而可以扩增不同的目的区域,这些目的区域间可以部分重合或者不重合。支持物上标记的各引物至少包括可以与目的区域结合并延伸的h区:第一正向引物h区201fh、第一反向引物h区201rh、第二正向引物h区202fh、第二正向引物h区202rh、其他正向引物h区2nfh、其他反向引物h区2nrh。在特定用途中,支持物上标记的各引物还至少包括通用核酸序列u区:第一正向引物u区201fu、第一反向引物u区201ru、第二正向引物u区202fu、第二反向引物u区202ru、其他正向引物u区2nfu、其他反向引物u区2nru。在特定用途中所有支持物上的引物的正向引物u区fu或反向引物u区ru序列可以是一致的:第一正向引物u区201fu=第二正向引物u区202fu=其他正向引物u区2nfu,第一反向引物u区201ru=第二反向引物u区202ru=其他反向引物u区2nru。在特定用途中所有支持物上的引物的正向引物u区fu或反向引物u区ru序列可以是不一致的。在多重pcr实施时将不同种类核酸引物标记的支持物按照预设的比例与多重pcr反应体系混合在一起,预设的比例根据不同种类支持物上核酸扩增效率确定,可以低至不同种类支持物平均比例(比如将引物p1/p2/p3标记到磁珠上形成第一类磁珠,将引物p4/p5/p6标记到磁珠上形成第二类磁珠,此处比例是指将磁珠混合时第一类磁珠与第二类磁珠的数量比例)的0.01倍,可以高至不同种类支持物平均比例的100倍。多重pcr反应体系至少包括dna模板、dna聚合酶、dntp、合适浓度的缓冲液等。如图2b所示,多重pcr反应开始时支持物上标记的其中一种引物(例如第一正向引物201f或第二正向引物202f)会与反应体系中dna单链模板203、204结合将其限制在支持物表面,并在聚合酶的作用下生成dna模板的互补链205、206,随后该互补链205、206与模板解离并被同一个支持物上另一种引物(例如第一反向引物201r、第二反向引物202r)结合并延伸得到与前述dna模板的互补链205、206互补的核酸链207、208;如此反复得到带有大量核酸序列的支持物。由于同一个支持物上标记的引物对种类有限且与其它支持物上的引物对物理距离远,所以可以有效减少不同引物对的相互结合形成二聚体的可能;同时可以通过给更多的支持物标记上不同种类的核酸以及增加每个支持物上的引物对标记数量从而有效增加多重pcr的目的扩增区域,例如每种支持物上可以偶联5种以内的引物对,或者每种支持物上可以偶联10种以内的引物对,或者每种支持物上可以偶联100种以内的引物对。
73.更进一步地,本发明还提供了使用多种核酸共标记的支持物应用于多重pcr测序
文库构建的用途。如图2c所示,以图2b所示反应中生成的带有与dna模板的互补链互补的核酸序列207、208的支持物作为模板与测序仪兼容的引物序列:第三正向引物209f和第三反向引物209r,进行第二步的pcr反应,从而得到可以用于测序的核酸测序文库。与测序仪兼容的引物序列至少包括图2a中所示引物中的通用结合序列(通用核酸序列u区,即其他正向引物u区2nfu/其他反向引物u区2nru)、样本标签2nfi/2nri和与测序仪兼容的核酸序列2nfa/2nra,此处所有支持物上的正向通用核酸序列u区均相同:第一正向引物u区201fu=第二正向引物u区202fu=其他正向引物u区2nfu,所有支持物上的反向通用核酸序列u区也均相同:第一反向引物u区201ru=第二反向引物u区202ru=其他反向引物u区2nru。用于测序的测序仪包括但不限于mgiseq测序平台、illumina测序平台、ion测序平台、pacbio测序平台、nanopore测序平台等。
74.本发明还提供了应用于多重pcr用途的多种核酸共标记支持物的制作方法。如图2d所示,当需要测序分析长片段210的连续碱基序列时,单引物对扩增已经不能满足需要,这时候需要设计多对引物分别进行扩增然后构建为文库测序,例如使用第一引物对(图2d所示方案中以引物的h区表示,即第一正向引物h区201fh和第一反向引物h区201rh)扩增第一目的片段201,使用第二引物对(第二正向引物h区202fh和第二反向引物h区202rh)扩增第二目的片段202,以及使用更多的引物对(其他正向引物h区2nfh和其他反向引物h区2nrh)扩增更多的目的片段2n,最后将测序结果拼接为所述长片段210的序列。在传统的液相多重pcr反应时由于第一目的片段201与第二目的片段202有部分重合,第二正向引物和第一反向引物在一起会产生小的非目的扩增产物,引物需要将多重pcr反应至少分为两管平行扩增,扩增目的片段没有重合的引物对:第一正向引物、第一反向引物、其他正向引物和其他反向引物为一管,第二正向引物和第二反向引物为一管。当使用本发明中的利用多核酸标记支持物进行多重pcr建库方法时,可以通过将扩增目的片段没有重合的第一引物对和其他引物对标记在同一磁珠如第一磁珠上得到第一种类的多种核酸共标记的支持物,而将与第一磁珠上的引物对的扩增目的片段有重合的第二引物对标记在另外的磁珠如第二磁珠上得到第二种类的多种核酸共标记的支持物,这样两种类的多种核酸共标记的支持物上的引物对即使在同一管中进行扩增引物之间也不会相互影响。根据图2d中所示的引物设计原理,本发明预先合成了具有5’特定修饰211的第一引物对201f、201r、具有5’特定修饰211的第二引物对202f、202r以及更多的具有5’特定修饰211的其他引物对2nf和2nr(图2e)。5’特定修饰包括但不限于羟基、醛基、环氧基、氨基、羧基及其活化形式、磷酸、炔基、叠氮、巯基、烯烃、生物素、亲和素、异硫氰酸酯、异氰酸酯、酰基叠氮、磺酰氯、甲苯磺酰基酯等,相对应的所选用的支持物上包括但不限于环氧基、氨基、羧基、炔基、叠氮、烯烃、重金属、叠氮、亲和素等功能基团212。在适当的条件下将具有功能基团212的支持物与具有5’特定修饰211的核酸引物接触并偶联,特别地将能够产生非特异产物的引物分开偶联在不同的支持物上,例如将具有5’特定修饰211的第一引物对201f、201r、具有5’特定修饰211的其他引物对2nf、2nr偶联到第一微珠上形成第一产物213,将具有5’特定修饰211的第二引物对202f和202r偶联到第二微珠上形成第二产物214(图2e),最后将第一产物213和第二产物214按照比例混合在一起形成最终的具有多种核酸标记的支持物应用于多重pcr建库。
75.本发明还提供了多种核酸共标记的支持物应用于5’单细胞rna表达谱分析的用途。众所周知在复杂的生命机体由许多性质特异的细胞组成,在特定的状态下每个细胞转
录表达的rna的种类和数量都有所不同,所以在单细胞水平上检测rna的转录有重要意义。目前检测单细胞转录组的技术根据通量可以分为中低通量和高通量单细胞转录组测序技术。中低通量单细胞转录组测序以smart-seq为代表,通过对单个细胞直接裂解得到的rna逆转录后扩增构建单细胞转录组;高通量单细胞转录组测序的文库制备以油包水微流控和微孔阵列平台为代表,通过含有细胞标签和分子标签的oligo dt引物或者模板转换寡核苷酸(template switch oligo,tso)将来源于不同细胞的mrna分子逆转录为含有对应特有标签的cdna分子,并通过进一步的测序可以同时分析成千上万的单细胞mrna表达情况。油包水技术平台将单个细胞和含有细胞标签的单个微珠包裹在单液滴内进行裂解逆转录一步操作,根据测序读取靠近rna的3’端或者5’端可以分为3’单细胞rna表达谱文库和5’单细胞rna表达谱文库。微孔阵列平台通常是由直径20-60μm的微孔组成的阵列芯片,单个细胞在微孔中裂解后具有polya尾巴的mrna被位于同一孔内携带有细胞标签oligo dt引物的微珠捕获,然后通过逆转录延伸将来源于同一细胞的rna逆转录产物标记上相同且唯一的细胞标签。目前基于微孔阵列的单细胞测序文库制备平台的效率很大程度上取决于含有oligo dt微珠在微孔中的rna捕获效率,而且与油包水平台不同微孔阵列平台目前只能构建3’单细胞rna表达谱文库。本发明通过对单细胞测序文库制备中的微珠进行多种核酸标记可以提高其在微孔中的rna捕获效率,并且能够实现5’单细胞rna表达谱文库制备。
76.本发明提供了一种多种核酸共标记的支持物应用于5’单细胞rna表达谱分析、构建微孔阵列平台的5’单细胞vdj文库的用途。
77.如图3a所示,此处的支持物为微珠(固体微珠或半固态水凝胶微珠),支持物上标记了至少两种核酸序列:第一核酸序列301和第二核酸序列304。
78.第一核酸序列301至少包含捕获序列303,用于捕获目的核酸分子并作为引物延伸或逆转录,比如是长度在15-40的碱基序列oligo dt,可以通过调整第一核酸序列301在支持物上的数量和密度来控制捕获rna的效率。在特定用途下第一核酸序列301也包括第一通用序列核酸302和可条件性断裂位点x。条件性可断裂位点包括但不限于双硫修饰、du修饰、rna碱基修饰、di修饰、dspacer修饰、ap位点修饰、光断裂pc linker以及限制性内切酶识别序列中的一种或多种。
79.第二核酸序列304由第二通用核酸序列305、细胞标签序列306、分子标签序列307和模板转换序列308中的一种或几种组成。其中第二通用核酸序列305可以包括与测序仪匹配的接头核酸序列,比如illumina测序仪中的read1 sequencing primer或者read2 sequencing primer。细胞标签序列306用于标记来源于同一细胞中的所有mrna的分子,每个支持物上具有相同的细胞标签而不同种类支持物上具有不同的细胞标签。细胞标签序列306可以是一段随机或半随机的核酸序列,比如12bp简并碱基nnnnnnnnnnnn,也可以是包含多种固定核酸序列的组合,比如96种8碱基序列与96种8碱基序列与96种8碱基序列的随机组合,8碱基序列之间可以包括也可以不包括连接核酸区。分子标签序列307用于标记每个逆转录出来的cdna分子,从同一支持物上的不同的rna逆转录出来的cdna分子都被标记上不同的分子标签。分子标签307可以是一段8-20碱基长度的随机或半随机的核酸序列,比如9个随机简并碱基nnnnnnnnn或nnnnnnnnnv。模板转换序列308可以作为模板使从第一核酸序列301逆转录出来的cdna 3’端继续延伸以标记上分子标签序列307、细胞标签序列306和第二通用核酸序列305。模板转换序列308至少在3’端包括两个以上的rna碱基rg或者其它
修饰的碱基g类似物,比如lna或xna。
80.如图3b所示为图3a中所示的多核酸标记支持物在构建微孔阵列平台的5’单细胞文库的实验流程图,在该具体应用下,每个支持物上偶联有两种核酸标记:第一核酸序列301与第二核酸序列304。单个含有第一核酸序列301和第二核酸序列304标记的支持物与来源于单细胞的rna接触时含有第二核酸序列304互补序列的rna309被支持物上的第一核酸序列301捕获并通过逆转录反应体系形成cdna分子310,其中cdna延伸到rna309的5’末端时被具有末端核酸转移酶功能的逆转录酶添加连续的碱基c至cdna链上,然后该cdna链会与同一支持物表面附近的含有两个以上碱基rg或其碱基类似物的第二核酸序列304互补结合并继续延伸至第二通用核酸序列305区域形成完整的具有细胞标签和分子标签的cdna分子310。可选的,cdna分子310可以通过可断裂位点x从支持物上脱离下来作为下一步扩增的模板,也可以通过第二通用核酸序列305单引物延伸后形成的与cdna分子310互补的延伸链作为下一步扩增的模板,或者通过酶处理去除支持物上未参与逆转录反应的第一核酸序列301和第二核酸序列304后含有cdna分子310的支持物作为下一步扩增的模板。在随后的步骤中,断裂或者不断裂的cdna分子310作为模板被与含有第一通用序列302和第二通用序列305的引物对pcr扩增形成双链核酸311产物。进一步地,双链核酸311可以通过两种建库方式对单细胞rna表达的种类和丰度进行分析,其中一种目的为无偏差的分析所有具有polya尾巴的rna分子的表达情况,该种建库方案为随机将双链核酸311打断、末端修复并在3’端添加碱基a形成分子结构312,然后与含有突出t的接头313连接并被含有第一样本index317的第一引物315和含有第二样本index321的第二引物319扩增形成第一最终文库323。其中第一引物315包括与测序仪兼容的第一核酸序列316、第一样本index317和与接头313中长链部分序列互补的序列318组成。第二引物319包括与测序仪兼容的第二核酸序列320、第二样本index321和与第二通用核酸序列305的部分序列相同的序列322组成。此种建库方法也可以替换为其它能够达到同样目的的随机文库构建方案,包括但不局限于转座酶法打断建库或者随机引物延伸的建库方案。另一种建库方案的目的是可以靶向分析目的基因的表达情况,可以通过两步多重pcr实现,如分别用第一基因特异性引物324、第二基因特异性引物326与通用引物305组成的引物对形成第一步多重pcr产物325和第二步多重pcr产物327,最后以第二步多重pcr产物327为模板通过与含有第一样本index317的第一引物315和含有第二样本index321的第二引物319扩增形成第二最终文库328。靶向多重pcr构建的文库可用于免疫组库的分析,更进一步地,第二步多重pcr产物327还可以按照第一种随机打断建库方案用于构建全长vdj免疫组库文库用以分析t细胞受体和抗体vdj序列。第一最终文库323和第二最终文库328均进一步用于测序和信息分析。
81.本发明还提供了应用于5’单细胞rna表达谱分析的核酸共标记支持物的制作方法。如图3c所示,细胞标签序列306由顺序连接的第一细胞标签329、第一连接区330、第二细胞标签331、第二连接区332、第三连接区333和第三细胞标签334共6个区域组成。为了将第一核酸序列301和第二核酸序列304共标记在支持物上,本发明预先合成了具有5’特定修饰340的第一核酸序列301和第三核酸序列335。5’特定修饰340包括但不限于羟基、醛基、环氧基、氨基、羧基及其活化形式、磷酸、炔基、叠氮、巯基、烯烃、生物素、亲和素、异硫氰酸酯、异氰酸酯、酰基叠氮、磺酰氯、甲苯磺酰基酯等,相对应的所选用的支持物上包括但不限于环氧基、氨基、羧基、炔基、叠氮、烯烃、重金属、叠氮、亲和素等功能基团339。在适当的条件下
将具有功能基团339的支持物与具有5’修饰的第一核酸序列301和第三核酸序列335经过接触并偶联(步骤341)形成第一产物342,第一核酸序列301与第三核酸序列355在第一产物342上的比例可通过加入浓度不同进行调节;随后第一产物342与第四核酸序列336在含有适当盐离子浓度、dntp和聚合酶缓冲环境下经过杂交步骤343杂交延伸得到第二产物344,第四核酸序列336核酸分子从5’开始依次含有第二连接区332的互补序列332’、第二细胞标签331的互补序列331’以及第一连接区330的互补序列330’;支持物上的第三核酸序列335通过自身的连接区330序列与第四核酸序列336上的互补序列330’杂交并延伸至序列第二细胞标签331与第二连接区332;第二产物344在变性条件下去除互补链后在dna连接酶的作用下经过连接步骤345与第五核酸序列346连接生成第三产物347;第五核酸序列346是由第一核酸分子337和第二核酸分子338提前退火杂交得到的双链dna,第一核酸分子337含有顺序连接的第三连接区333、第三细胞标签334、分子标签序列307以及模板转换序列308,第二核酸分子338至少含有第二连接区332和第三连接区333的部分序列的互补序列,在特定条件下还包括部分第三细胞标签334的互补序列,因此第二核酸分子338可以与第一核酸分子337上的第三连接区333以及第二产物344上的第二连接区332杂交在一起并通过连接酶相互连接;特别地,第一核酸分子337的5’端有时还含有磷酸修饰;最后在变性条件下第三产物347经过洗脱步骤348洗去互补核酸序列即第二核酸分子338形成最终有第一核酸序列301和第二核酸序列304标记的支持物349,该有第一核酸序列301和第二核酸序列304标记的支持物349可直接用于5’单细胞rna表达谱分析的建库流程。
82.本发明还提供了一种多种核酸共标记的支持物应用于3’单细胞rna文库的用途,其中细胞标签和逆转录引物oligo dt分别位于cdna分子的两端。如图4a所示为至少两种核酸标记的支持物,此处的支持物为微珠(固体微珠或半固态水凝胶微珠),支持物上标记了至少两种核酸序列:第一核酸序列401和第二核酸序列404。
83.第一核酸序列401至少包含捕获序列403,用于捕获目的核酸分子并作为引物延伸或逆转录,比如是长度在15-40的碱基序列oligo dt,可以通过调整第一核酸序列401在支持物上的数量和密度来控制捕获rna的效率;在特定用途下第一核酸序列401也包括第一通用序列核酸402。
84.第二核酸序列404由第二通用核酸序列405、细胞标签序列406、引物序列407和可逆性阻断位点408中的一种或几种组成。其中第二通用核酸序列405可以包括与测序仪匹配的接头核酸序列,比如illumina测序仪中的read1 sequencing primer或者read2 sequencing primer,可选的第二通用核酸序列405上含有可条件性断裂位点x。条件性可断裂位点包括但不限于双硫修饰、du修饰、rna碱基修饰、di修饰、dspacer修饰、ap位点修饰、光断裂pc linker以及限制性内切酶识别序列。细胞标签序列406用于标记来源于同一细胞中的所有mrna的分子,每个支持物上具有相同的细胞标签而不同种类支持物上具有不同的细胞标签。细胞标签序列406可以是一段随机或半随机的核酸序列,比如12bp简并碱基nnnnnnnnnnnn,也可以是包含多种固定核酸序列的组合,比如96种8碱基序列与96种8碱基序列与96种8碱基序列的随机组合,8碱基序列之间可以包括也可以不包括连接核酸区。引物序列407可作为引物延伸与其互补结合的cdna分子,可以与捕获序列403逆转录所得的cdna产物结合并延伸;引物序列407可以是一段5-15碱基长度的随机或半随机的核酸序列,比如6个随机简并碱基nnnnnn,也可以是和基因特异性序列用于富集靶向区域。可逆性阻断
位点408的作用是在第一核酸序列401捕获并延伸目标核酸时阻止引物序列407作为引物发生非特异延伸,并在特定的情形下解除阻断作用从而允许引物序列407作为引物延伸。可逆性阻断位点408可以是单纯的3’磷酸修饰、ddntp修饰或c3 spacer修饰,也可以是可断裂修饰与延伸阻断修饰之间的组合,可断裂修饰可以是dspacer修饰/rna碱基修饰/du修饰等,延伸阻断修饰包括但不限于lna/xna/3’磷酸/inverted dt/ddntp/c3 spacer/c6 spacer/各种荧光染料和淬灭修饰等,例如可逆性阻断位点408可以是(rn)nnnn-c3或(rn)n-c3-c3-ddn,rn代表任意一种核糖核苷酸简并碱基,n代表任意一种脱氧核糖核苷酸简并碱基,c3是延伸阻断修饰c3spacer,ddn是双脱氧核糖核苷算;此序列与靶向dna形成双链后能够被rnaseh识别切除并暴露出引物序列407的3’羟基从而激活引物序列407作为引物的核酸延伸能力。
85.图4b所示为图4a所示双核酸标记支持物构建3’单细胞rna文库的实验流程图。单个含有第一核酸序列401和第二核酸序列404标记的支持物与来源于单细胞的rna接触时含有第二核酸序列404互补序列的rna409被支持物上的第一核酸序列401捕获并通过逆转录反应体系形成cdna分子410,然后通过高温变性cdna分子410与rna解链后与同一支持物表面附近的第二核酸序列404上的引物序列407区域互补结合;可优化地,cdna分子410可以与支持物表面一个以上的第二核酸序列404互补结合;进一步地,与cdna分子410互补结合的引物序列407能够被相关的酶识别切除可逆性阻断位点408并暴露出引物序列407的3’羟基,该过程可以由rnaseh切割核糖核酸碱基完成,也可以由碱性磷酸酶单独处理3’磷酸完成,也可以由能够切除ap位点形成3’羟基的核酸内切酶完成,或者由user酶\ap位点切除酶结合碱性磷酸酶完成;随后通过具有链替代活性的dna聚合酶延伸形成一端包含第一核酸序列401互补序列另一端具有细胞标签序列406的第一核酸分子411;具有第一核酸分子411的支持物可以通过单引物扩增方法形成互补链412并从支持物上洗脱下来用于扩增模板,也可以通过条件性断裂位点x直接从支持物上断裂得到第二核酸分子413作为模板用于下一步的扩增从而形成双链核酸产物414,其中正反向扩增引物分别含有全部或部分第一通用序列核酸402与第二通用序列核酸405的核酸序列。进一步地,双链核酸产物414可以通过两种建库方式对单细胞rna表达的种类和丰度进行分析,其中一种目的为无偏差的分析所有具有polya尾巴的rna分子的表达情况,该种建库方案为扩增双链核酸产物414并被含有第一样本index417的第一引物415和含有第二样本index421的第二引物419扩增形成第一最终文库423,其中第一引物415包括与测序仪兼容的第一核酸序列416、第一样本index417和第一引物杂交区418,第二引物419包括与测序仪兼容的第二核酸序列420、第二样本index421和第二引物杂交区422。此种建库方法也可以替换为其它能够达到同样目的的随机文库构建方案,包括但不局限于转座酶法打断建库或者随机引物延伸的建库方案。另一种建库方案的目的是可以靶向分析目的基因的表达情况,可以通过两步多重pcr实现,如分别用第一基因特异性引物424和第二基因特异性引物426与通用引物305组成的引物对通过两步多重pcr的产物:第一步多重pcr的产物425和第二步多重pcr的产物427,最后以第二步多重pcr的产物427为模板通过与含有第一样本index417的第一引物415和含有第二样本index421的第二引物419扩增形成第二最终文库428。靶向多重pcr构建的文库可用于免疫组库的分析,尤其是用以分析全长的t细胞受体和抗体vdj序列。第一最终文库423和第二最终文库428均进一步用于测序和信息分析。
86.本发明进一步提供了一种多种核酸共标记的支持物应用于构建单细胞转录组文库的用途,细胞标签可以标记rna链的任意位置从而形成具有细胞和分子标签的cdna分子。如图5a所示为两种类型的支持物核酸标记结构,此处的支持物为微珠或水凝胶beads,单个支持物上至少有两种核酸序列,例如第一核酸序列501和第二核酸序列505的组合,或者是第三核酸序列509和第二核酸序列505的组合。
87.第一核酸序列501至少包含捕获序列503用于捕获目的核酸分子,比如是长度在15-40的碱基序列oligo dt,可以通过调整第一核酸序列501在支持物上的数量和密度来控制捕获rna的效率。第一核酸序列501还包括了聚合酶延伸阻断位点504,该位点可以阻止捕获序列503作为引物延伸捕获核酸分子,包括但不限于lna/xna/3’磷酸/inverted dt/ddntp/c3 spacer/c6 spacer/各种荧光染料和淬灭修饰等。在特定用途下第一核酸序列501也包括第一通用核酸序列502,可以通过调整第一通用核酸序列502的序列和长度调节503的捕获效率。
88.第二核酸序列505由第二通用核酸序列506、细胞标签序列507、引物序列508的一种或几种组成,其中第二通用核酸序列506可以包括与测序仪匹配的接头核酸序列,比如illumina测序仪中的read1 sequencing primer或者read2 sequencing primer;细胞标签序列507用于标记来源于同一细胞中的所有mrna的分子,每个支持物上具有相同的细胞标签而不同种类支持物上具有不同的细胞标签。细胞标签序列507可以是一段随机或半随机的核酸序列,比如12bp简并碱基nnnnnnnnnnnn,也可以是包含多种固定核酸序列的组合,比如96种8碱基序列与96种8碱基序列与96种8碱基序列的随机组合,8碱基序列之间可以包括也可以不包括连接核酸区。引物序列508可作为引物延伸与rna模板结合并延伸成为cdna分子,可以与捕获序列503捕获的rna结合并延伸,引物序列508可以是一段5-15碱基长度的随机或半随机的核酸序列,比如6个随机简并碱基nnnnnn,也可以是和基因特异性序列用于富集靶向区域。
89.第三核酸序列509由第二通用核酸序列506、细胞标签序列507、分子标签序列510和捕获序列503的一种或几种组成,其中第二通用核酸序列506可以包括与测序仪匹配的接头核酸序列,比如illumina测序仪中的read1 sequencing primer或者read2sequencing primer;细胞标签序列507用于标记来源于同一细胞中的所有mrna的分子,每个支持物上具有相同的细胞标签而不同种类支持物上具有不同的细胞标签,细胞标签序列507可以是一段随机或半随机的核酸序列,比如12bp简并碱基nnnnnnnnnnnn,也可以是包含多种固定核酸序列的组合,比如96种8碱基序列与96种8碱基序列与96种8碱基序列的随机组合,8碱基序列之间可以包括也可以不包括连接核酸区;分子标签序列510用于标记每个逆转录出来的cdna分子,从同一支持物上的不同的rna逆转录出来的cdna分子都被标记上不同的分子标签,分子标签510可以是一段5-20碱基长度的随机或半随机的核酸序列,比如9个随机简并碱基nnnnnnnnn或nnnnnnnnnv;捕获序列503用于捕获目的核酸分子,比如是长度在15-40的碱基序列oligo dt。
90.图5b所示为两种类型的双核酸标记支持物构建单细胞转录组文库的实验流程图。单个核酸标记的支持物与来源于单细胞的rna接触时含有与捕获序列503互补序列的rna512被支持物上的第一核酸序列501或者第三核酸序列509捕获,捕获到支持物表面的rna512在适宜条件下与第二核酸序列505的引物序列508结合并通过逆转录反应体系形成
sequencing primer;细胞标签序列606用于标记来源于同一细胞中的所有mrna的分子,每个支持物上具有相同的细胞标签而不同种类支持物上具有不同的细胞标签,细胞标签序列606可以是一段随机或半随机的核酸序列,比如12bp简并碱基nnnnnnnnnnnn,也可以是包含多种固定核酸序列的组合,比如96种8碱基序列与96种8碱基序列与96种8碱基序列的随机组合,8碱基序列之间可以包括也可以不包括连接核酸区;分子标签序列607用于标记每个逆转录出来的cdna分子,从同一支持物上的不同的rna逆转录出来的cdna分子都被标记上不同的分子标签,分子标签607可以是一段8-20碱基长度的随机或半随机的核酸序列,比如9个随机简并碱基nnnnnnnnn或nnnnnnnnnv;模板转换序列608可以作为模板使从第一核酸序列601逆转录出来的cdna 3’端继续延伸以标记上分子标签序列607、细胞标签序列606和第二通用核酸序列605,模板转换序列608至少在3’端包括两个及以上的rna碱基rg或者其它修饰的碱基g类似物,比如lna或xna。
95.第三核酸序列609由第三通用核酸序列610、细胞标签序列606、分子标签序列607和蛋白核酸标签捕获序列611中的一种或几种组成,其中细胞标签序列606和分子标签序列607与第二核酸序列604上的结构一致;第三通用核酸序列610是与第二通用核酸序列605不一致的含有与测序仪匹配的接头核酸序列,比如illumina测序仪中的read1 sequencing primer或者read2 sequencing primer;蛋白核酸标签捕获序列611用来捕获并延伸与待测单细胞在同一空间结构的蛋白核酸标记,同一空间结构指的是蛋白核酸标记可以位于细胞内部,也可以位于细胞表面,或者位于细胞所处的腔室或者液滴内。
96.图6b所示为图6a所示的三种核酸标记支持物构建多组学单细胞文库的实验流程图。首先将待测细胞与预先偶联有核酸标记的识别特定蛋白的抗体分子612接触结合并洗掉非特异结合的核酸偶联抗体,抗体分子612的结构包括可以和蛋白核酸标签捕获序列611互补结合的序列613、蛋白特异序列614、第四通用引物序列615及分子616,第四通用引物序列615是与第二通用核酸序列605、第三通用核酸序列610均不一致的含有与测序仪匹配的接头核酸序列,比如illumina测序仪中的read2sequencing primer或者read1 sequencing primer,分子616在此流程中指代特异性抗体,也可以是和目标检测蛋白相互结合的小分子化合物、糖类、肽类等其它物质;当单个支持物与结合有核酸偶联抗体分子612的单细胞接触时,细胞裂解释放出rna617以及核酸偶联抗体分子612并分别被支持物上的第一核酸序列601和第三核酸序列609捕获并通过逆转录反应体系形成cdna分子618或dna分子619,其中cdna延伸到rna617的5’末端时被具有末端核酸转移酶功能的逆转录酶添加连续的碱基c至cdna链上,然后该cdna链会与同一支持物表面附近的含有两个以上碱基rg或其碱基类似物的模板转换序列608互补结合并继续延伸至第二通用核酸序列605区域形成完整的具有细胞标签和分子标签的cdna分子618;可选地,cdna分子618和dna分子619可以通过可断裂位点x从支持物上脱离下来作为下一步扩增的模板,也可以通过第二通用核酸序列605和第四通用核酸序列615单引物延伸后形成的与cdna分子618或dna分子619互补的延伸链作为下一步扩增的模板,或者通过酶处理去除支持物上未参与逆转录反应的第一核酸序列601、第二核酸序列604和第三核酸序列609后以含有cdna分子618和619的支持物作为下一步扩增的模板;在随后的步骤中,断裂或者不断裂的cdna分子618和dna分子619混合物作为模板被与第一通用核酸序列602/第二通用核酸序列605及第三通用核酸序列610/第四通用核酸序列615双引物对pcr扩增形成第一双链核酸产物621和第二双链核酸产物620的混合物。进
一步地,形成的双链核酸产物可以通过三种建库方式进行单细胞多组学分析。第一种建库方案的目的是构建可以分析待检测蛋白丰度的核酸文库,可以直接通过第一index引物622和第二index引物626pcr扩增得到第一文库630;其中第一index引物622包括依序连接的与测序仪兼容的第一核酸序列623、第一样本index624和与第四通用核酸序列615互补的核酸序列625,第二index引物626包括依序连接的与测序仪兼容的第二核酸序列627、第二样本index628和与第三通用核酸序列610互补的核酸序列629组成。第二种建库方案的目的是无偏差的分析所有具有polya尾巴的rna分子的表达情况,该种建库方案为随机将第一双链核酸产物、第二双链核酸产物的混合物打断、末端修复并在3’端添加碱基a形成分子结构631,然后与含有突出t的接头632连接并被含有第一样本index624的第一引物634和含有第二样本index628的第二引物636扩增形成第二最终文库638,其中第一引物634包括依序连接的与测序仪兼容的第一核酸序列623、第一样本index624和与第一通用核酸序列602互补的核酸序列635,第二引物636包括依序连接的与测序仪兼容的第二核酸序列627、第二样本index628和与第二通用核酸序列605互补的核酸序列637,此种建库方法也可以替换为其它能够达到同样目的的随机文库构建方案,包括但不局限于转座酶法打断建库或者随机引物延伸的建库方案。第三种建库方案的目的是可以靶向分析目的基因的表达情况,可以通过两步多重pcr实现,如分别用第一基因特异性引物639和第二基因特异性引物641与第二通用引物605组成的引物对形成多重pcr产物:第一步多重pcr产物640和第二步多重pcr产物642,最后以第二步多重pcr产物642为模板通过与含有第一样本index624的第一引物634和含有第二样本index628的第二引物636扩增形成第三最终文库643。靶向多重pcr构建的文库可用于免疫组库的分析,更进一步地,第二步多重pcr产物642还可以按照第一种随机打断建库方案用于构建全长vdj免疫组库文库用以分析t细胞受体和抗体vdj序列。文库630、第二最终文库638和第三最终文库643均进一步用于测序和信息分析。
97.实施例1:多种核酸共标记的支持物应用于5’单细胞rna表达谱文库构建与vdj文库构建及多组学文库构建
98.本实施例中,按照以下操作步骤制备多种核酸共标记的支持物并应用于构建5’单细胞rna表达谱文库与vdj文库及多组学文库。
99.1制作多种核酸标记的磁珠
100.1.1合成以下序列的单链核酸。
[0101][0102]
1.2在0.25m edc浓度下分别将384种300pmol氨基修饰的cb1单链核酸(seq id no.2)与300pmol氨基修饰的dt单链核酸(seq id no.1)及6万个30μm羧基磁珠室温旋转混合3小时,洗涤两次后得到384种核酸标记磁珠。
[0103]
1.3将1.2中得到的384种核酸标记磁珠混合均匀后均分至384孔板中。
[0104]
1.4将具有相同cell barcode的单链核酸cb2-tso(seq id no.3,其3’端3个“(rg)”表示为rna的g)与cb2-t7(seq id no.5)一起和rcb(seq id no.4)退火形成具有粘性末端的双链结构,其中rcb2中的n’n’n’n’n’n’n’n’ctgtag序列与cb2-tso和cb2-t7中的ctacagnnnnnnnn是反向互补序列;nnnnnnnn为8bp的cell barcode序列,本实施例中共有384种类型。
[0105]
1.5分别将384种退火的cb2-rcb2双链核酸按以下配比加入到含有磁珠的384孔板中,22℃反应30分钟。
[0106]
试剂50μl体系2x rapid ligation buffer25μlcb2-rcb2双链核酸3μlt4 dna ligase3μlrnase-free water补充至50μl
[0107]
1.6反应完成后混匀384种磁珠,95℃高温处理去除互补链后置于4℃备用。
[0108]
2使用多核酸标记磁珠进行单细胞cdna及蛋白的细胞标签标记
[0109]
2.1将偶联有t7核酸序列的抗human cd4分子的抗体与新鲜的pbmc细胞混合孵育使抗体与细胞膜表面cd4蛋白充分结合,然后用新鲜pbs洗涤。
[0110]
2.2按照bd rhapsody单细胞测序试剂盒中提供的微孔芯片说明书处理芯片,并加入1万个孵育好的pbmc细胞。
[0111]
2.3加入30万个步骤1中制好的磁珠至微孔板中,磁吸入孔后清洗掉多余磁珠。
[0112]
2.4加入试剂盒中自带的裂解液,2min后磁吸取出磁珠并清洗。
[0113]
2.5按以下反应配置逆转录试剂200ul并悬浮磁珠。
[0114]
试剂200μl体系superscript ii first-strand buffer(5
×
)40
dtt(100mm)10betaine(5m)40mgcl2(1m)1.2dntp 10mm20rnase inhibitor5superscript ii reverse transcriptase10rnase-free water73.8
[0115]
2.6按以下条件逆转录。
[0116][0117]
2.7直接去除逆转录上清并加入以下200ul外切酶反应液,37℃反应30分钟去除磁珠上的多余引物。
[0118]
试剂200μl体系10x外切酶缓冲液20μl外切酶10μlrnase-free water170μl
[0119]
3构建单细胞膜蛋白表达量的高通量测序文库
[0120]
3.1用bd rhapsody试剂盒自带的洗脱缓冲液洗涤磁珠并重悬,在95℃高温下处理5min后立即吸出上清备用;剩余磁珠重悬于洗脱缓冲液中备用。
[0121]
3.2配置以下pcr mix。
[0122]
组分for 1library(μl)pcr mastermix(cat.no.91-1118)100universal oligo(cat.no.650000074)10bead rt/pcr enhancer(cat.no.91-1082)12primer t7(seq id no.7)102.2.8中洗脱上清68total200
[0123]
3.3按以下条件扩增后使用spri beads 1.4
×
纯化,30ul洗脱。
[0124][0125]
3.4配置以下index pcr mix。
[0126]
pcr mastermix(cat.no.91-1118)25
index p5 primer(seq id no.9)2index p7 primer(seq id no.10)2nuclease-free water182.3.3中的洗脱液3total50
[0127]
3.5按以下条件扩增后使用spri beads 0.8
×
纯化,30ul无菌水洗脱后得到膜蛋白cd4单细胞表达量文库,文库片段大小约280bp,符合库检标准,如图7a所示。
[0128][0129]
4单细胞5’表达谱文库及免疫受体vdj文库构建
[0130]
4.1全长cdna扩增:配置以下pcr反应体系并重悬2.3.1中制备的磁珠。
[0131]
kit组分for 1library(μl)pcr mastermix(cat.no.91-1118)60universal oligo(cat.no.650000074)10primer full(seq id no.8)10rnase-free water40total120
[0132]
4.2按以下条件扩增后使用spri beads 0.6
×
纯化,30ul洗脱后备用。
[0133][0134]
4.3将4.2中的部分洗脱产物使用10
×
genomics公司的chromium single cell v(d)j reagent kits中5’library construction kit(pn-1000020)进行打断建库,得到5’单细胞表达谱文库,如图7b中所示,由图中可见构建出来的文库主峰在484附近,符合库检标准。
[0135]
4.4将4.2中的部分洗脱产物使用10
×
genomics公司的chromium single cell v(d)j reagent kits中enrichment kit(human t cell,pn-1000005和human b cell,pn-1000016)进行扩增及打断建库,得到t细胞和b细胞的单细胞vdj文库,分别如图7c和图7d所示。由图7c中可见构建出来的文库大小在200-1000bp之间,符合预期。由图7d中可见构建出来的文库主峰在545附近,符合库检标准。
[0136]
实施例2:多种核酸共标记的支持物应用于3’单细胞rna文库构建
[0137]
本实施例中,按照以下操作步骤制备多种核酸共标记的支持物并应用于构建3’单
细胞rna文库。
[0138]
1制作多种核酸标记的磁珠
[0139]
1.1合成以下序列的单链核酸。
[0140][0141]
1.2在0.25m edc浓度下分别将384种300pmol氨基修饰的cb1单链核酸(seq id no.2)与300pmol氨基修饰的sp2-dt30vn单链核酸(seq id no.11)及6万个30μm羧基磁珠室温旋转混合3小时,洗涤两次后得到384种核酸标记磁珠。
[0142]
1.3将1.2中得到的384种核酸标记磁珠混合均匀后均分至384孔板中。
[0143]
1.4将单链核酸cb2-nrnx(seq id no.12,其中的“(rn)”表示为rna碱基,另,该序列3’端带有c3修饰)与rcb2退火形成具有粘性末端的双链结构,其中rcb2中的n’n’n’n’n’n’n’ctgtag序列与cb2-nrnx中的ctacagnnnnnnnn是反向互补序列;nnnnnnnn为8bp的cell barcode序列,共有384种类型。
[0144]
1.5分别将384种退火的cb2-nrnx/rcb2双链核酸按以下配比加入到含有磁珠的384孔板中,22℃反应30分钟。
[0145]
试剂50μl体系2x rapid ligation buffer25μlcb2-nrnx/rcb2双链核酸3μlt4 dna ligase3μlrnase-free water补充至50μl
[0146]
1.6反应完成后混匀384种磁珠,95℃高温处理去除互补链后置于4℃备用。
[0147]
2使用多核酸标记磁珠进行3’单细胞rna文库构建
[0148]
2.1抽取外周血并获得新鲜的pbmc细胞,重悬于pbs中。
[0149]
2.2按照bd rhapsody单细胞文库构建试剂盒中提供的微孔芯片说明书处理芯片,并加入1万个孵育好的pbmc细胞。
[0150]
2.3加入30万个步骤2.1中制好的磁珠至微孔板中,磁吸入孔后清洗掉多余磁珠。
[0151]
2.4加入试剂盒中自带的裂解液,2min后磁吸取出磁珠并清洗。
[0152]
2.5按以bd rhapsody单细胞文库构建试剂盒中说明逆转录并用exoi切除磁珠上未利用的引物。
[0153]
2.6随机引物nrnx二链延伸:配置以下杂交反应体系并悬浮3.2.5中得到的磁珠。
[0154]
kit组分for 1 library(μl)wta extension buffer(cat.no.91-1114)20nuclease-free water(cat.no.650000076)150rnase hii4total174
[0155]
2.7按照以下温度条件杂交。
[0156][0157]
2.8加入以下延伸试剂。
[0158]
kit组分for 1 library(μl)10mm dntp(cat.no.650000077)8bead rt/pcr enhancer(cat.no.91-1082)12wta extension enzyme(cat.no.91-1117)6total26
[0159]
2.9按照bd试剂盒指定条件延伸(如下条件)。
[0160][0161]
2.10延伸完毕洗涤磁珠,配置下列反应体系并悬浮磁珠。
[0162]
kit组分for 1library(μl)pcr mastermix(cat.no.91-1118)60universal oligo(cat.no.650000074)10upp-2(seq id no.13)10rnase-free water40
[0163]
2.11按照以下反应条件进行pcr,然后使用spri beads 0.9
×
纯化,30ul洗脱。
[0164][0165]
2.12配置以下index pcr mix。
[0166]
pcr mastermix(cat.no.91-1118)25index p5 primer2index p7 primer2nuclease-free water113.2.11中的洗脱液10total50
[0167]
2.13按以下条件扩增后使用spri beads 0.5/0.25
×
分选,30ul无菌水洗脱后得到3’单细胞rna文库。
[0168][0169]
2.14 illumina novaseq 6000测序,并分析测到的核酸序列在rna的位置,如图8中所示,所测得的核酸序列主要位于靠近rna 3’端。
[0170]
实施例3:多种核酸共标记的支持物应用于单细胞转录组文库构建
[0171]
本实施例中,按照以下操作步骤制备多种核酸共标记的支持物并应用于构建单细胞转录组文库。
[0172]
1制作多种核酸标记的磁珠
[0173]
1.1合成以下序列的单链核酸。
[0174]
seq id no.名称序列14cb2-dn6ctacagnnnnnnnnnnnnnn
[0175]
1.2在0.25m edc浓度下分别将384种300pmol氨基修饰的cb1单链核酸(seq id no.2)与300pmol氨基修饰的dt单链核酸(seq id no.1)及6万个30μm羧基磁珠室温旋转混合3小时,洗涤两次后得到384种核酸标记磁珠。
[0176]
1.3将1.2中得到的384种核酸标记磁珠混合均匀后均分至384孔板中。
[0177]
1.4将单链核酸cb2-dn6(seq id no.14)与rcb2退火形成具有粘性末端的双链结构,其中rcb2中的n’n’n’n’n’n’n’ctgtag序列与cb2-dn6中的ctacagnnnnnnnn是反向互补序列;nnnnnnnn为8bp的cell barcode序列,共有384种类型。
[0178]
1.5分别将384种退火的cb2-dn6/rcb2双链核酸按以下配比加入到含有磁珠的384孔板中,22℃反应30分钟。
[0179]
试剂50μl体系2x rapid ligation buffer25μlcb2-dn6/rcb2双链核酸3μlt4 dna ligase3μlrnase-free water补充至50μl
[0180]
1.6反应完成后混匀384种磁珠,95℃高温处理去除互补链后置于4℃备用。
[0181]
2使用多核酸标记磁珠进行单细胞转录组文库构建
[0182]
2.1抽取外周血并获得新鲜的pbmc细胞,重悬于pbs中。
[0183]
2.2按照bd rhapsody单细胞文库构建试剂盒中提供的微孔芯片说明书处理芯片,并加入1万个孵育好的pbmc细胞。
[0184]
2.3加入30万个步骤1中制好的磁珠至微孔板中,磁吸入孔后清洗掉多余磁珠。
[0185]
2.4加入试剂盒中自带的裂解液,2min后磁吸取出磁珠并清洗。
[0186]
2.5按照bd rhapsody单细胞文库构建试剂盒中说明逆转录并用exoi切除磁珠上未利用的引物,其中逆转录反应条件修改如下:
[0187][0188][0189]
2.6以下步骤严格按照bd rhapsody mrna whole transcriptome analysis(wta)library preparation protocol中所说的进行杂交延伸和扩增形成最终的文库。
[0190]
2.7illumina novaseq 6000测序,并分析测到的核酸序列在rna的位置。
[0191]
该方法测得的核酸序列比bd rhapsody与实施例2中的文库更均匀分布在rna全长上。如图8所示,为采用实施例2中流程所构建的3’单细胞rna文库和实施例3中流程所构建的单细胞转录组文库经过测序分析得到reads在基因水平上的分布。bd phapsody 3’单细胞表达谱文库为完全采用bd rhapsody构建的文库分析结构。由图中可见,实施例2中所构建的3’单细胞rna文库中包含的序列主要分布在基因的3’端,而实施例3中所构建的单细胞转录组文库中包含的序列明显比3’单细胞rna文库和bd phapsody 3’单细胞表达谱文库更偏向于基因的中间位置。
[0192]
实施例4:多种核酸共标记的支持物应用于多重pcr测序文库构建
[0193]
本实施例目的是实现单管多重pcr检测brca1和brca2全长基因序列,其设计多重pcr引物如下:
[0194]
pool 1:seq id no.15~seq id no.34;
[0195]
pool 2:seq id no.35~seq id no.54;
[0196]
pool 3:seq id no.55~seq id no.74;
[0197]
pool 4:seq id no.75~seq id no.94;
[0198]
pool 5:seq id no.95~seq id no.114;
[0199]
pool 6:seq id no.115~seq id no.134;
[0200]
pool 7:seq id no.135~seq id no.154;
[0201]
pool 8:seq id no.155~seq id no.174;
[0202]
pool 9:seq id no.175~seq id no.194;
[0203]
pool 10:seq id no.195~seq id no.214;
[0204]
pool 11:seq id no.215~seq id no.234;
[0205]
pool 12:seq id no.235~seq id no.254;
[0206]
pool 13:seq id no.255~seq id no.274;
[0207]
pool 14:seq id no.275~seq id no.294;
[0208]
pool 15:seq id no.295~seq id no.314;
[0209]
pool 16:seq id no.315~seq id no.334;
[0210]
pool 17:seq id no.335~seq id no.348。
[0211]
1提取基因组dna
[0212]
按照天根血液基因组dna提取试剂盒说明提取200ul人外周血基因组dna,并使用qubit测量浓度。
[0213]
2制作多核酸标记磁珠
[0214]
2.1按照表1中的序列合成5’氨基修饰的引物序列,并将相同pool编号的引物等量
混合在一起。
[0215]
2.2在0.25m edc浓度下分别将10nmol pool编号1-17的所引物混合物(pool 1、pool 2、pool 3、pool 4、pool 5、pool 6、pool 7、pool 8、pool 9、pool 10、pool 11、pool 12、pool 13、pool 14、pool 15、pool 16或pool 17)与10mg磁珠(dynabeads myone carboxylic acid)室温旋转混合3小时,洗涤两次后得到17类核酸标记磁珠。
[0216]
2.3将得到的17类核酸标记磁珠按照1:1的比例混合后待用。
[0217]
3多重pcr扩增
[0218]
3.1按照下表配置pcr体系。
[0219]
试剂50μl体系2x qiagen multiplex pcr master mix25μl核酸标记磁珠5μl基因组dna10ngrnase-free water补充至50μl
[0220]
3.2在pcr仪上按照以下程序运行。
[0221][0222]
4index pcr形成文库
[0223]
4.1按照下表配置index pcr体系。
[0224]
试剂50μl体系2x kapa hifi25μli5 primer5μli7 primer5μlrnase-free water补充至50μl
[0225]
4.2用配置好的50μl index pcr体系悬浮洗涤过的1.3.2中的磁珠,运行以下pcr程序:
[0226][0227]
4.3使用spri beads纯化长度300-500bp范围的dna,测量浓度并使用caliper进行片段长度分析,如图9所示,得到主峰为379bp左右的文库,符合库检标准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1