用于分析核酸的方法和组合物与流程

文档序号:29212337发布日期:2022-03-12 08:10阅读:513来源:国知局
用于分析核酸的方法和组合物1.相关专利申请2.本专利申请要求2019年4月5日提交的美国临时专利申请号62/830,211的权益,其名称为methodsandcompositionsforanalyzingnucleicacid(用于分析核酸的方法和组合物),kellym.harkinskincaid等为发明人,并且指定的代理师案卷编号为cbs-2002-pv。本专利申请还要求2019年6月14日提交的美国临时专利申请号62/861,594的权益,其名称为methodsandcompositionsforanalyzingnucleicacid(用于分析核酸的方法和组合物),kellym.harkinskincaid等为发明人,并且指定的代理师案卷编号为cbs-2002-pv2。本专利申请还要求2019年10月23日提交的美国临时专利申请号62/925,132的权益,其名称为methodsandcompositionsforanalyzingnucleicacid(用于分析核酸的方法和组合物),kellym.harkinskincaid等为发明人,并且指定的代理师案卷编号为cbs-2002-pv3。前述申请的全部内容通过引用并入本文,包括所有文本、表格和附图。
技术领域
:3.该技术部分涉及用于分析核酸的方法和组合物。在一些方面,该技术涉及用于从单链核酸片段制备核酸文库的方法和组合物。
背景技术
::4.活生物体(例如动物、植物和微生物)的遗传信息和其他形式的复制遗传信息(例如病毒)编码于核酸(即脱氧核糖核酸(dna)或核糖核酸(rna))中。遗传信息是一连串代表化学核酸或假定核酸的一级结构的核苷酸或修饰的核苷酸。5.多种高通量测序平台用于核酸分析。例如,illumina平台涉及衔接子连接的dna片段的克隆扩增。另一个平台是基于纳米孔的测序,它依赖于通过小通道转移核酸分子或单独的核苷酸。用于某些测序平台的文库制备通常包括dna片段化、片段末端修饰和衔接子连接,并且可能包括核酸片段的扩增(例如pcr扩增)。6.为特定类型的核酸分析选择合适的测序平台需要详细了解可用技术,包括错误来源、错误率以及测序速度和成本。虽然测序成本已经降低,但文库制备的通量和成本可能是一个限制因素。文库制备的一方面包括修饰核酸片段的末端,使得它们适合特定的测序平台。核酸末端可能含有有用信息。因此,修饰核酸末端(例如,用于文库制备)同时保留核酸末端所含信息的方法,对于处理和分析核酸将是有用的。7.文库制备的另一方面包括捕获单链核酸片段。在某些情况下,与传统的双链dna(dsdna)制备方法相比,单链文库制备方法可以生成更好、更复杂的文库。产生单链dna(ssdna)文库的缺点包括劳动密集、昂贵且耗时的方案,以及外来或定制试剂要求。因此,无需劳动密集、昂贵且耗时的方案和/或外来或定制试剂的情况下捕获单链核酸(例如,用于文库制备)的方法,对于处理和分析核酸(例如,单链核酸、变性双链核酸或含有单链核酸的混合物)将会是有用的。8.文库制备的另一方面包括捕获单链rna片段。通常,现有rna文库制备方法不仅需要使用逆转录酶从rna合成第一链dna,还需要合成第二链,以制备与下游双链测序衔接子连接相容的cdna分子。通常,需要生成链特异rna测序文库,以便准确评估转录本从哪条基因组dna链转录而来。为了创建链特异rna测序文库,方法可以包括在测序衔接子连接后降解第二dna链。然而,在rna预降解之前进行第二链dna合成是有问题的,因为它会产生第三链合成副产物,并且有时产生第四链合成副产物,这些副产物会使所得的rna测序数据复杂化,并部分混淆文库的链特异性。因此,无需第二链合成即可捕获单链rna(例如,用于文库制备)的方法,对于处理和分析含有rna的核酸会是有用的。技术实现要素:9.在一些方面提供了用于产生核酸文库的方法,包括组合(i)包含单链核酸(ssna)的核酸组合物、(ii)第一寡核苷酸和(iii)多个第一支架多核苷酸种类,其中(a)所述多个第一支架多核苷酸种类中的每种多核苷酸都包含ssna杂交区和第一寡核苷酸杂交区;和(b)所述核酸组合物、所述第一寡核苷酸和所述多个第一支架多核苷酸种类在以下条件下组合,其中所述第一支架多核苷酸种类的分子与(i)第一ssna末端区和(ii)所述第一寡核苷酸的分子杂交,从而形成所述第一寡核苷酸的分子的末端与所述第一ssna末端区的末端相邻的杂交产物。在一些方面,方法包括在组合之前,使所述第一寡核苷酸和/或所述多个第一支架多核苷酸种类与包含磷酸酶活性的试剂在以下条件下接触:其中所述第一寡核苷酸和/或所述多个第一支架多核苷酸种类被去磷酸化,从而生成去磷酸化的第一寡核苷酸和/或去磷酸化的第一支架多核苷酸种类。在一些方面,方法是用于从ssna产生文库的无ssb方法。10.在一些方面还提供了组合物,该组合物包含:核酸组合物,该核酸组合物包含单链核酸(ssna);第一寡核苷酸;和多个第一支架多核苷酸种类,每个种类都包含ssna杂交区和第一寡核苷酸杂交区。11.在一些方面还提供了试剂盒,该试剂盒包含:第一寡核苷酸、多个第一支架多核苷酸种类,每个种类都包含ssna杂交区和第一寡核苷酸杂交区;以及使用所述第一寡核苷酸和所述多个第一支架多核苷酸种类产生核酸文库的说明。12.在一些方面提供了用于产生核酸文库的方法,包括组合(i)包含单链核糖核酸(ssrna)或单链互补脱氧核糖核酸(sscdna)的核酸组合物,(ii)第一寡核苷酸,和(iii)多个第一支架多核苷酸种类,其中(a)所述多个第一支架多核苷酸种类中的每种多核苷酸都包含ssrna或sscdna杂交区和第一寡核苷酸杂交区;和(b)所述核酸组合物、所述第一寡核苷酸和所述多个第一支架多核苷酸种类在以下条件下组合,在该条件中,所述第一支架多核苷酸种类的分子与(i)第一ssrna或sscdna末端区和(ii)所述第一寡核苷酸的分子杂交,从而形成所述第一寡核苷酸的分子的末端与所述第一ssrna或sscdna末端区的末端相邻的杂交产物。在一些方面,方法包括在组合之前,使所述第一寡核苷酸和/或所述多个第一支架多核苷酸种类与包含磷酸酶活性的试剂在以下条件下接触:其中在所述第一寡核苷酸和/或所述多个第一支架多核苷酸种类被去磷酸化,从而生成去磷酸化的第一寡核苷酸和/或去磷酸化的第一支架多核苷酸种类的条件下。在一些方面,方法是用于从ssrna或sscdna产生文库的无ssb方法。13.在一些方面还提供了组合物,该组合物包含:包含单链核糖核酸(ssrna)或单链互englandbiolabsultraiirna第一链合成组件(商业方案)合成。i和ii是内部方案的技术复制,iii和iv是商业方案的技术复制。29.图13显示了从第一链cdna生成的四个ssdna文库的分子度量,该第一链cdna使用随机六聚体、八聚体和锚定多聚t引物以及mu-mlv逆转录酶(内部方案)或newenglandbiolabsultraiirna第一链合成组件(商业方案)合成。顶部图:最终rna-seq文库的凝胶图像。底部图:表示库产量(ng/μl)和大小(bp)的表格。i和ii是内部方案的技术复制品,iii和iv是商业图板的技术复制品。30.图14提供的表格显示了使用star-aligner生成的ssdna文库的测序度量,该ssdna文库从第一链cdna生成,该第一链cdna使用内部方案(随机六聚体、八聚体和锚定聚t引物以及mu-mlv逆转录酶)或商业方案(newenglandbiolabsultraiirna第一链合成组件)合成。优质文库的典型rna-seq度量可能包括:a)70-90%文库的唯一定位读段,以及b)定位到多基因座(约5)的读段百分比(此类度量以灰色标记)。表所提供的数据显示了成功的rna-seq文库生成。31.图15显示了rna-seq单链制备方法的概述以及详述第一链cdna合成后单链支架衔接子连接技术的示意图。32.图16显示了rna-seq单链制备方法的概述以及详述单链支架衔接子连接技术创建dna/rna杂交体,然后合成cdna第一链的示意图。33.图17显示了可以在本文所述ssdna/ssrna连接反应之前或之后的各种工作流程。34.图18显示了对具有高百分比衔接子二聚体的样品的系列1.2x固相可逆固定(spri)净化的结果。35.图19显示了连续0.6xspri+0.6xspri净化的结果。36.图20显示了假定的衔接子二聚体形成、衔接子二聚体的单链形式和添加仅与这种单链衔接子二聚体退火的寡核苷酸的实例。在一个实例中,当形成双链杂交产物时,就会形成xbai识别位点。37.图21显示了定向rna-seq文库制备ngs测定的示例性工作流程。38.图22显示了,对于本文所述rna单链文库制备(ssprep),1-20ngmrna输入的文库产量。显示了每个输入浓度的复制品平均值。除了1ng输入(扩增了11个pcr循环)之外,所有文库都扩增了9个循环。使用quant-itdsdna高灵敏度试剂盒对文库进行定量。39.图23提供的表格显示了本文所述rna的单链文库制备(ssprep)与三种商业可得的双链文库制备(dsprep)试剂盒(即nebnextultraii定向rna-seq试剂盒、nugen通用mrna文库试剂盒以及truseqmrna链特异文库试剂盒)的比较。显示了输入范围、工作流程时间和pcr周期的比较。40.图24提供的表格显示了从本文所述rna的单链文库制备(ssprep)或商业可得的双链文库制备(dsprep)试剂盒(即nebnextultraii定向rna-seq试剂盒)生成的人类读段的产量和作图度量的比较。来自对于ssprep和dsprep的复制文库的测序数据被定位到人类参考基因组(hg19)。ssprep文库的定位长度较短,可能是由于缺乏末端精修(endpolishing)所致。41.图25显示了本文所述rna的单链文库制备(ssprep)与商业可得的双链文库制备(dsprep)试剂盒(即nebnextultraii定向rna-seq试剂盒)的性能度量。顶部图:由两种方法生成的复制文库的平均作图度量。两个文库都有约90%的唯一定位读段和约5%的核糖体读段。约93%的读段定位到正确的链。底部图:对于两种方法的复制品的归一化读段计数(人类)之间以及彼此之间观察到的spearman相关系数为ρ~0.95。成对相关系数提供于方块中。42.图26显示了比较本文所述rna的单链文库制备(ssprep)与商业可得的双链文库制备(dsprep)试剂盒(即nebnextultraii定向rna-seq试剂盒)的数据。顶部图:使用picard工具collectrnaseqmetrics计算的基因体覆盖度;对于ssprep和dsprep的复制文库,显示了在转录本的整个长度上的归一化覆盖度。中部图:使用picard工具collectrnaseqmetrics计算读段的基因组分布,并绘制了编码区、未翻译(utr)区、基因内区和基因间区的平均组成。这两种方法都捕获了最小的基因间区。由于更均匀的基因体覆盖度,ssprep捕获了更多的未翻译区域。底部图:两种方法捕获的差异gc组成。插图显示了外源rna对照协会(ercc)掺入对照的gc分布。百分比表示观察到的每个文库的gc组成。43.图27提供的表格显示了,对于使用本文所述rna的单链文库制备(ssprep)或商业可得的双链文库制备(dsprep)试剂盒(即nebnextultraii定向rna-seq试剂盒)生成的文库,定位到ercc参考基因组的读段数目和定位到正确链的百分比。两种类型的文库都有>300,000个对照读段,且>99%的读段定位到正确的链。44.图28显示了单链文库制备(ssprep)方法的示意图。不同模板分子的dna输入池通过热变性并通过骤冷和使用热稳定的单链dna结合蛋白(ssb)保持为单链分子。模板dna被磷酸化,并且在组合磷酸化/连接反应中连接ssprep支架衔接子,所述支架衔接子(除了促进正确定向的文库分子的衔接子之外)都含有随机的7bp单链支架突出端和在所有末端上的连接阻断修饰,。净化后,分子即可用于索引pcr。45.图29显示了健康人类cfdna提取物(a,样品a;b,样品b)的来自单链文库制备(ssprep)和商业试剂盒(dsprep;即nebnextultraii)文库的合并读段的标准ngs度量。除非另有说明,否则在分析之前通过cfdna提取物组合每种方法的所有文库,并过滤pcr重复和等于或大于q20的质量分数。图a:分别为cfdna提取物a和b的插入分布图。图b:依据cfdna提取物,在人类基因组(hg19)中,ssprep和商业试剂盒以碱基百分比为单位的覆盖倍数(foldcoverage)。在计算覆盖倍数之前,组合文库被子采样到相似的读段深度(readdepth)。子采样深度设置为295m读长,这是ssprep-b测序读段的限度。图c:对于ssprep和商业试剂盒,依据cfdna提取物,在人类基因组中,在100bp滑动尺度上,作为gc含量的函数的的归一化覆盖度。阴影直方图表示100bp滑动窗口内的人类基因组gc。图d:依据cfdna提取物的ssprep和商业试剂盒的preseq复杂性估计。为了获得最准确的preseq估计可能性,每种方法组合了三个等效测序深度的文库,因为商业试剂盒,更多的文库通过ssprep制备。含有pcr重复读段的文件用于促进复杂性估计。图e:每个读段末端位置的归一化、对数转换碱基组成,该读段末端从读段开始位点的上游2bp开始并延伸至所述读段起始位点下游34bp。不论插入长度,考虑所有读段。46.图30显示了对于单链文库制备(ssprep)和商业试剂盒(dsprep;即nebnextultraii),含有单链突出端的双链寡核苷酸的覆盖度。图a:双链合成寡核苷酸的卡通示意图-一个平末端、可识别的50nt互补区域和特定长度和类型的突出端。图b:对于ssprep和商业试剂盒方法,在0碱基坐标中,三个技术复制品在所有双链寡核苷酸长度上的每个碱基的平均覆盖率。技术复制品在统计学上彼此没有差异(学生t检验:ssprepp=0.714,商业试剂盒p=0.985)。测序的每个寡核苷酸>5,000个读段。47.图31显示了通过ssprep进行的单链寡核苷酸分析。灰色和黑色线以及和点代表技术复制品。图a:等摩尔汇集的单链寡核苷酸文库的插入分布。通过标准脱盐纯化以10nt间隔合成的20-120nt寡核苷酸。未经过滤的原始测序数据。图b:由寡核苷酸分离的对于技术复制品的定位测序数据。表示为寡核苷酸长度的函数。黑色竖线和相关的黑色和灰色数字表示文库池(librarypool)中存在的每个寡核苷酸长度的全长产物百分比。每个文库的测序深度为约100,000个读段对(每个寡核苷酸10,000个读段对,不包括20nt和30nt长度)。图c:对于60nt合成寡核苷酸,各种纯化方法对寡核苷酸纯度的影响,作为寡核苷酸长度的函数。相关的黑色和灰色数字表示每个寡核苷酸的全长产物百分比。标准脱盐60nt合成寡核苷酸的数据是从图b提取的。48.图32显示了cfdna分析。图a:对于针对包括100bp±读段定位坐标在内的三个离散片段长度的ssprep数据,归一化基因组双核苷酸频率,作为读长的函数。读段中点以0为中心。负数表示中点上游(5’)的基因组区,正数表示中点下游(3’)的基因组区。输入数据来自合并的样品a和样品b的ssprep数据集。图b:对于针对包括读段中的9bp区(正数)和读段外的10bp(负数)在内的三个离散片段长度末端的ssprep数据,归一化基因组二核苷酸频率,作为读长的函数。读段开始和结束坐标以0为中心。输入数据来自组合的样本a和样本b的ssprep数据集。图c:除商业试剂盒数据外,与图a相同。图d:除商业试剂盒数据外,与图b相同。图e:在用于最初展示wps的12号染色体上相同中心体周围基因座处,与样品ch01相比的ssprep数据的归一化wps值(120bp窗口;120-180bp片段)。图f:与样品ch01相比,ssprep数据的对于长片段长度分箱数据(120bp窗口;120-180bp片段)和短片段长度分箱数据(16bp窗口;35-80bp片段)在注释ctcf结合位点±lkb内的平均归一化wps得分。49.图33a和33b显示了输入cfdna以及代表性ssprep和dsprep文库。图33a,顶部图:血浆提取/纯化后且ngs文库制备前的无细胞dna提取物(样品a)。根据制造商的说明,在d5000hstape和相关tapestation4200(agilent)上进行分析。显示了凝胶图像和电泳图。图33a,底部图:血浆提取/纯化后且ngs文库制备前的无细胞dna提取物(样品b)。根据制造商的说明,在d1000hstape和相关tapestation4200(agilent)上进行分析。显示了凝胶图像和电泳图。图33b,顶部图:在索引pcr后,根据制造商的说明,在d1000hstape和相关tapestation4200(agilent)上分析的一个来自cfdna提取物(样品a,文库id:a′)的代表性ssprep文库和一个来自cfdna提取物(样品b,文库id:b′)的代表性ssprep文库。显示了凝胶图像和电泳图。图33b,底部图:在索引pcr后,根据制造商的说明,在d1000hstape和相关tapestation4200(agilent)上分析的一个来自cfdna提取物(样品a,文库id:a″)的代表性dsprep(即nebnextultraii)文库和一个来自cfdna提取物(样品b,文库idb″)的代表性dsprep(即nebnextultraii)文库。显示了凝胶图像和电泳图。50.图34显示了样品a和样品b的复制文库的插入分布。图a:为样品acfdna提取物制作的所有文库的插入分布。图b:为样品bcfdna提取物制作的所有文库的插入分布。每个图例中列出的文库id的指示对应于图例所示迹线的指示。51.图35显示了索引pcr后dna纯化对片段长度保留的影响。使用1.2x或1.5xdna纯化珠体积:索引pcr反应体积比来纯化cfdna(样品a)的ssprep文库。对于从较低比例到较高比例,<100bp片段的回收率从9.3%变为14.7%。52.图36显示了单链dna文库制备(ssprep)的示例性工作流程。ssprep在一步化组合的磷酸化/连接步骤中工作,该步骤同时制备模板dna分子用于连接,无需末端精修(即末端修复),并通过利用本文所述的支架衔接子连接illumina衔接子。53.图37显示了cfdna保护模型的说明。54.图38提供的表格显示了文库制备试剂盒和输入cfdna摘要。测序文库是利用ssprep、两种商业可得末端精修dsdna文库制备试剂盒和商业可得ssdna试剂盒从两个健康的个体cfdna提取物(样品1和样品2)生成的。在illuminahiseqx上对文库进行2x151bp测序。商业试剂盒1,ultraiitm;商业试剂盒2,takaraplasma-seq;商业试剂盒3,swiftaccel-1splus。55.图39显示了索引pcr后的产量。使用qubit3.0,用2μl索引pcr后纯化的最终文库,对文库进行定量。所有文库都使用试剂盒提供的聚合酶预混液(mastermix)和引物进行了10个pcr循环的索引。每个直方图中从左到右表示制备试剂盒:ssprep、swift、takara、neb。56.图40显示了作图和短插入分箱数据。使用seqprep2.0修剪/合并文库,丢弃<30bp的合并读段。使用bwaaln将剩余读段定位到人类参考基因组hg19。使用自定义脚本进行尺寸分箱。每个直方图中从左到右表示制备试剂盒:ssprep、swift(swiftaccel-1splus)、takara(swiftaccel-1splus)、neb(ultraiitm)。57.图41提供的表格显示了索引pcr后的产率和作图统计学。*由于在文库制备过程中产生拖尾伪影,商业试剂盒3建议在作图之前从正向和反向读段修剪10bp。因此,对于30-100bp的分类大小(binsize)的上限从100bp减少到90bp。商业试剂盒1,ultraiitm;商业试剂盒2,takaraplasma-seq;商业试剂盒3,swiftaccel-1splus。58.图42a和42b显示了定位的插入长度分布。图42a显示了ssprep与dsdna制备试剂盒2,takaraplasma-seq;试剂盒1,ultraiitm。图42b显示了ssprep与商业ssdna制备试剂盒(swiftaccel-1splus)。每个文库中含有的所有分子的读长从正确定位和分类的bam文件中提取,然后绘图。59.图43显示了复杂性估计。文库制备试剂盒的复杂性估计输出来自preseq算法。来自图41的表的读段用作输入,唯一分子的数目被外推到300m的读对。60.图44显示了每个cfdna提取物的归一化文库覆盖度形式的gc覆盖度,作为在100bp滑动窗口上人类参考基因组(hg19)gc含量的函数。左y轴是指cfdna(线)。右轴是指参考基因组(灰色直方图)。数据是从picardtoolscollectgcbiasmetrics提取的。61.图45显示了核小体占位。生成wps计算并将其归一化为针对chr12上α卫星阵列子区域的绝对最高wps值。cfdna数据是通过组合健康cfdna样本1和2的ssprepbam文件并在wps计算之前过滤带有核小体相关插入的读段来获得的。62.图46显示了二核苷酸频率。对于相当于样品1在1657bp处的主要组蛋白单体峰的所有读长的5′和3′末端,将含有at和cg双核苷酸的二核苷酸频率绘图。63.图47显示了受损dna文库制备方法的比较。64.图48a至图48d显示了在多种纯化条件下对片段-支架衔接子连接产物进行spri纯化后回收的片段长度和衔接子二聚体百分比的比较。图48a显示了对于使用18%pegspri纯化并添加50μltris缓冲液(即添加到25μl连接产物中)纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。图48b显示了对于使用l8%pegspri纯化并添加25μl异丙醇和25μltris缓冲液纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。图48c显示了对于使用18%pegspri纯化并添加50μl异丙醇纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。图48d显示了对于使用含有38%peg的spri珠溶液缓冲液纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。65.图49a至图49e显示了在多种纯化条件下对片段-支架衔接子连接产物进行纯化后回收的片段长度和衔接子二聚体百分比的比较。图49a显示了对于使用18%pegspri纯化并添加50μltris缓冲液纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。图49b显示了对于使用柱纯化而被纯化的片段-支架衔接子连接产物的衔接子二聚体和片段长度峰。图49c显示了对于使用18%pegspri纯化并添加5μl异丙醇和45μltris缓冲液纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。图49d显示了对于使用18%pegspri纯化并添加10μl异丙醇和40μltris缓冲液纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。图49e显示了对于使用18%pegspri纯化并添加20μl异丙醇和30μltris缓冲液纯化的片段-支架衔接子连接产物,衔接子二聚体和片段长度峰。66.图50显示了用于从单链rna生成测序文库的示例性工作流程。67.图51显示了示例性支架衔接子设计,其中ssna杂交区中的一些或所有碱基是确定的或已知的碱基。68.图52a至图52d显示了用于富集修饰的核酸的示例性工作流程。可以在dsdna变性之前(图52a、52b)或之后(图52c、52d)进行修饰的核酸富集。69.图53a和图53b显示了从带切口dna生成文库的示例性工作流程。70.图54显示了包含dna、rna或其组合的示例性支架衔接子构造。71.图55显示了从含有病原体rna的样品生成测序文库的示例性工作流程。具体实施方式72.本文提供用于分析核酸的方法和组合物。本文还提供了用于产生核酸文库的方法和组合物。本文还提供了用于分析单链核酸片段的方法和组合物。在某些方面,该方法包括组合包含单链核酸片段的样品核酸和专用衔接子。在一些实施方案中,专用衔接子包括能够与单链核酸末端杂交的支架多核苷酸。例如,这种杂交的产物可用于产生核酸文库和/或进一步分析或加工。73.支架衔接子74.本文的某些方法包括将ssna与支架衔接子或其组分组合。支架衔接子通常包括支架多核苷酸和寡核苷酸。因此,支架衔接子的“组分”可以指支架多核苷酸和/或寡核苷酸,或其亚组分或区域。寡核苷酸和/或支架多核苷酸可由嘧啶(c、t、u)和/或嘌呤(a、g)核苷酸组成。额外的组分或亚组分可以包括以下中的一种或多种:索引多核苷酸(indexpolynucleotide)、唯一分子标识符(umi)、引物结合位点(例如测序引物结合位点、p5引物结合位点、p7引物结合位点)、流动槽结合区等以及其互补物(complement)。包含p5引物结合位点的支架衔接子可以称为p5衔接子或p5支架衔接子。包含p7引物结合位点的支架衔接子可称为p7衔接子或p7支架衔接子。75.支架多核苷酸是支架衔接子的单链组分。本文中的多核苷酸通常是指5-500个核苷酸,例如5-100个核苷酸的单链核苷酸多聚体。多核苷酸可以是合成的或可以酶促制备,并且在一些实施方案中,长度为约5-50个核苷酸。多核苷酸可以含有核糖核苷酸单体(即,可以是多聚核糖核苷酸或“rna多核苷酸”)、脱氧核糖核苷酸单体(即,可以是多聚脱氧核糖核苷酸或“dna多核苷酸”),或其组合。例如,多核苷酸的长度可以为10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-100、100-150或150-200个核苷酸,或最多500个核苷酸。术语多核苷酸和寡核苷酸可以互换使用。76.支架多核苷酸可以包括ssna杂交区(也称为支架、支架区、单链支架、单链支架区)和寡核苷酸杂交区。ssna杂交区和寡核苷酸杂交区可以称为支架多核苷酸的亚组分。ssna杂交区通常包含与或能够与ssna末端区杂交的多核苷酸。寡核苷酸杂交区通常包含与或能够与支架衔接子的全部或部分寡核苷酸组分杂交的多核苷酸。77.支架多核苷酸的ssna杂交区可以包含与ssna末端区互补或基本互补的多核苷酸。在一些实施方案中,ssna杂交区包含随机序列。在一些实施方案中,ssna杂交区包含与感兴趣的ssna末端区序列(例如,靶向序列)互补的序列。在某些实施方案中,ssna杂交区包含一个或多个都能够与ssna中的碱基进行非特异性碱基配对的核苷酸。能够进行非特异性碱基配对的核苷酸可称为通用碱基。通用碱基是能够与四种标准核苷酸碱基中的每一个不加选择地进行碱基配对的碱基:a、c、g和t。可以掺入ssna杂交区的通用碱基包括但不限于肌苷、脱氧肌苷、2′‑脱氧肌苷(di,dinosine)、硝基吲哚、5-硝基吲哚和3-硝基吡咯。在某些实施方案中,ssna杂交区包含一个或多个可以替代四个典型碱基中的两个或三个(但不是全部)的简并/摆动碱基(例如,非天然碱基p和k)。78.支架多核苷酸的ssna杂交区可以具有任何合适的长度和序列。在一些实施方案中,ssna杂交区的长度为10个核苷酸或更少。在某些方面,ssna杂交区的长度为4-100个核苷酸,例如长度为约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸。在某些方面,ssna杂交区的长度为4-20个核苷酸,例如长度为5-15、5-10、5-9、5-8或5-7(例如,6或7)个核苷酸。在一些实施方案中,ssna杂交区的长度为7个核苷酸。在一些实施方案中,ssna杂交区包含随机核苷酸序列或由随机核苷酸序列组成,使得当采用具有多种随机ssna杂交区的多个异质支架多核苷酸时,该集合能够充当异质ssna群的支架多核苷酸,而不管ssna末端区的序列如何。具有唯一ssna杂交区序列的每个支架多核苷酸可以称为支架多核苷酸种类,多个支架多核苷酸种类的集合可以称为多个支架多核苷酸种类(例如,对于设计为在ssna杂交区中具有7个随机碱基的支架多核苷酸,多个支架多核苷酸种类会包括47个唯一ssna杂交区序列)。因此,具有唯一支架多核苷酸(即,包含唯一ssna杂交区序列)的每个支架衔接子可以称为支架衔接子种类,并且多个支架衔接子种类的集合可以称为多个支架衔接子种类。一个支架多核苷酸种类通常具有相对于其他支架多核苷酸种类而言唯一的特征。例如,一个支架多核苷酸种类可以含有唯一的序列特征。唯一的序列特征可以包括唯一的序列长度、唯一的核苷酸序列(例如唯一的随机序列、唯一的靶向序列)或唯一的序列长度和核苷酸序列的组合。79.支架多核苷酸可以包含一个或多个额外的亚组分,包括索引多核苷酸、唯一分子标识符(umi)、引物结合位点(例如,p5引物结合位点、p7引物结合位点)、流动槽结合区等,或其互补多核苷酸。支架多核苷酸可以包含引物结合位点(或与引物结合位点互补的多核苷酸)。包含p5引物结合位点(或其互补物)的支架多核苷酸可以称为p5支架或p5支架多核苷酸。包含p7引物结合位点(或其互补物)的支架多核苷酸可以称为p7支架或p7支架多核苷酸。80.寡核苷酸可以是支架衔接子的另一个单链组分。本文中的寡核苷酸通常是指5-500个核苷酸,例如5-100个核苷酸的单链核苷酸多聚体。寡核苷酸可以是合成的或可以酶促制备,并且在一些实施方案中,长度为5-50个核苷酸。寡核苷酸可以含有核糖核苷酸单体(即,可以是寡核糖核苷酸或“rna寡核苷酸”)、脱氧核糖核苷酸单体(即,可以是寡脱氧核糖核苷酸或“dna寡核苷酸”),或其组合。例如,寡核苷酸的长度可以为10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-100、100-150或150-200个核苷酸,或最多500个核苷酸。术语寡核苷酸和多核苷酸可以互换使用。81.支架衔接子的寡核苷酸组分通常包含与支架多核苷酸的寡核苷酸杂交区互补或基本互补的核酸序列。支架衔接子的寡核苷酸组分可以包括一种或多种可用于一种或多种下游应用的亚组分,所述下游应用例如ssna片段或其衍生物的pcr扩增、ssna或其衍生物的测序等。在一些实施方案中,寡核苷酸的亚组分是测序衔接子。测序衔接子通常是指一个或多个核酸结构域,其包括至少一部分由感兴趣的测序平台使用的核苷酸序列(或其互补物),例如由以下提供的测序平台:(例如hiseqtm,miseqtm和/或genomeanalyzertm测序系统);oxfordnanoporetmtechnologies(例如miniontm测序系统),iontorrenttm(例如ionpgmtm和/或ionprotontm测序系统);pacificbiosciences(例如sequel或pacbiorsii测序系统);lifetechnologiestm(例如solidtm测序系统);roche(例如454gsflx+和/或gsjunior测序系统);genapsys;bgi;或任何感兴趣的测序平台。82.在一些实施方案中,支架衔接子的寡核苷酸组分是或包含选自以下的核酸结构域:与表面连接的测序平台寡核苷酸(例如,连接于测序系统中流动槽表面的p5或p7寡核苷酸)特异性结合的结构域(例如,“捕获位点”或“捕获序列”);测序引物结合结构域(例如,平台的read1或read2引物可以结合的结构域);唯一标识符或索引(例如,唯一标识被测序的ssna的样品来源的条形码或其他结构域,以能够通过使用特定条形码或“标签”标记来自给定样品的每个分子来实现样品多重分析(multiplexing));条形码测序引物结合结构域(用于对条形码测序的引物结合的结构域);分子识别结构域或唯一分子标识符(umi)(例如,分子索引标签,例如4、6或其他数目的核苷酸的随机标签),用于唯一地标记感兴趣的分子,例如,以基于对唯一标签进行测序的实例数确定表达水平;任何此类结构域的互补物;或其任何组合。在一些实施方案中,条形码结构域(例如,样品索引标签)和分子识别结构域(例如,分子索引标签;umi)可以包括在同一核酸中。测序平台寡核苷酸、测序引物和它们相应的结合结构域可以设计为与多种可用的测序平台和技术相兼容,包括但不限于本文讨论的那些。83.当支架衔接子的寡核苷酸组分包括一个测序衔接子或其部分时,可以使用多种方法添加一个或多个额外的测序衔接子和/或测序衔接子的剩余部分。例如,可以通过连接、逆转录、pcr扩增等中的任何一种来添加额外的和/或剩余部分的测序衔接子。在pcr的情况下,可以使用扩增引物对,其包括第一扩增引物和第二扩增引物,该第一扩增引物包括3′杂交区(例如,用于与寡核苷酸的衔接子区杂交)和5′区,该5′区包括额外的和/或剩余部分的测序衔接子,第二扩增引物包括3′杂交区(例如,用于与添加到ssna分子另一端的第二个寡核苷酸的衔接子区杂交)和任选的5′区,该5′区包括额外的和/或剩余部分的测序衔接子。84.支架衔接子的寡核苷酸组分可以包含一个或多个额外的亚组分,包括索引多核苷酸、唯一分子标识符(umi)、引物结合位点(例如,p5引物结合位点、p7引物结合位点)、流动槽结合区或测序衔接子等,或其互补多核苷酸。寡核苷酸可以包含引物结合位点(或与引物结合位点互补的多核苷酸)。包含p5引物结合位点(或其互补物)的寡核苷酸可以称为p5寡核苷酸(p5oligo)或p5寡聚核苷酸。包含p7引物结合位点(或其互补物)的寡核苷酸可称为p7寡核苷酸(p7oligo)或p7寡聚核苷酸。85.可以使支架多核苷酸与寡核苷酸杂交,从而在支架衔接子中形成双链体。因此,支架衔接子可以称为支架双链体、双链体衔接子、双链体寡核苷酸或双链体多核苷酸。每个具有唯一支架多核苷酸(即,包含唯一ssna杂交区序列)的支架双链体可称为支架双链体种类,并且多个支架双链体种类的集合可以称为多个支架双链体种类。在一些实施方案中,支架多核苷酸和寡核苷酸位于分开的dna链上。在一些实施方案中,支架多核苷酸和寡核苷酸位于单个dna链上(例如,能够形成发夹结构的单个dna链)。86.支架衔接子可以包含dna、rna或其组合。支架衔接子可以包含dna支架多核苷酸和dna寡核苷酸、dna支架多核苷酸和rna寡核苷酸、rna支架多核苷酸和dna寡核苷酸或rna支架多核苷酸和rna寡核苷酸。示例性支架衔接子的组成和设计示如图54所示(竖线阴影表示rna,斜线阴影表示dna)。图54的顶部显示了包含dna支架多核苷酸和dna寡核苷酸的支架衔接子,以及rna样品核酸;与这种衔接子一起使用的示例性连接酶包括t4rna连接酶2和t4dna连接酶。图54的中间显示了包含dna支架多核苷酸和rna寡核苷酸的支架衔接子,以及rna样品核酸;与这种衔接子一起使用的示例性连接酶包括t4rna连接酶1。图54的底部显示了包含rna支架多核苷酸和rna寡核苷酸的支架衔接子,以及rna样品核酸;与这种衔接子一起使用的示例性连接酶包括t4rna连接酶1。在一些情况下,选择衔接子核苷酸组成以提供样品核酸与支架衔接子核酸之间的同质性(例如,使得至少寡核苷酸与样品核酸同质)。在一些情况下,选择衔接子核苷酸组成以提供寡核苷酸与样品核酸之间的同质性以及支架多核苷酸与样品核酸之间的异质性。87.组合支架衔接子或其组分和ssna88.本文的方法可包括将一种或多种支架衔接子或其组分与包含单链核酸(ssna)的组合物组合以形成一种或多种复合物。支架多核苷酸被设计成用于与ssna片段和寡核苷酸组分同时杂交,使得在复合物形成后,寡核苷酸组分的末端与ssna片段的末端区的末端相邻。通常,在复合物形成后,寡核苷酸组分的5′末端与ssna末端区的3′末端相邻,或寡核苷酸组分的5′末端与ssna末端区的3′末端相邻。在支架衔接子连接到ssna片段两端的情况下形成复合物后,一个寡核苷酸组分的5′末端与ssna一个末端区的3′末端相邻,第二寡核苷酸组分的5′末端与ssna第二末端区的3′末端相邻。89.在一些实施方案中,方法包括通过组合ssna组合物、寡核苷酸和多个异质支架多核苷酸形成复合物,该异质支架多核苷酸具有能够充当ssna异质群的支架的多种随机ssna杂交区,该ssna具有未确定序列的末端区。90.在一些实施方案中,ssna杂交区包括设计成与已知序列的ssna末端区杂交的已知序列。在一些实施方案中,将具有已知序列的不同ssna杂交区的两种或更多种异质支架多核苷酸设计为与已知序列的相应ssna末端区杂交。ssna杂交区具有已知序列的实施方案可用于例如从具有已知序列末端区的ssna子集产生核酸文库。因此,在某些实施方案中,本文的方法包括通过将ssna组合物、寡核苷酸和一种或多种异质支架多核苷酸组合以形成复合物,所述异质支架多核苷酸具有已知序列的一个或多个不同ssna杂交区,该ssna杂交区能够充当一种或多种具有已知序列的一个或多个末端区的ssna的支架。91.ssna片段、寡核苷酸和支架多核苷酸可以以多种方式组合。在一些构造中,组合包括组合1)包含通过寡核苷酸杂交区与寡核苷酸组分杂交的支架多核苷酸的复合物,和2)ssna片段。在另一种构造中,组合包括组合1)包含通过ssna杂交区与ssna片段杂交的支架多核苷酸的复合物,和2)寡核苷酸组分。在另一种构造中,组合包括组合1)ssna片段、2)寡核苷酸和3)支架多核苷酸,其中在组合之前这三种组分均未与另一组分预复合或杂交。92.组合可以在杂交条件下进行,从而形成复合物,包括通过ssna杂交区与ssna片段的末端区杂交的支架多核苷酸,和通过寡核苷酸杂交区与寡核苷酸组分杂交的支架多核苷酸。是否发生特异性杂交,可以由支架多核苷酸杂交区、ssna片段的末端区和寡核苷酸组分之间的互补程度及其长度、盐浓度和发生杂交时的温度等因素决定,这可以通过相关区域的解链温度(tm)来了解。93.可以形成复合物,使得寡核苷酸组分的末端与ssna片段末端区的末端相邻。相邻是指寡核苷酸末端的末端核苷酸和ssna片段末端区的末端核苷酸彼此足够接近,使得末端核苷酸可以共价连接,例如通过化学连接、酶促连接等。在一些实施方案中,借助寡核苷酸末端的末端核苷酸和(与支架多核苷酸的相邻核苷酸杂交的)ssna末端区的末端核苷酸末端,末端彼此相邻。可以设计支架多核苷酸以确保寡核苷酸的末端与ssna片段的末端区域的末端相邻。94.可以用一个或多个尿嘧啶碱基代替胸腺嘧啶来设计支架多核苷酸。在一些实施方案中,支架衔接子双链体中的一条链可以通过在尿嘧啶碱基处生成多个切割位点来被降解,例如通过使用尿嘧啶-dna糖苷酶和内切核酸酶。95.支架衔接子、寡核苷酸组分和支架多核苷酸在本文中可以称为第一支架衔接子(或第一支架双链体)、第一寡核苷酸组分(或第一寡核苷酸)和第一支架多核苷酸;或第二支架衔接子(或第二支架双链体)、第二寡核苷酸组分(或第二寡核苷酸)和第二支架多核苷酸。术语第一和第二通常是指与ssna片段末端的第一末端和第二末端(即,5′末端和3′末端)杂交和/或共价连接的支架衔接子或其组分。术语第一末端和第二末端并不总是指ssna片段的具体方向性。因此,ssna末端的第一末端可以是5′末端或3′末端,并且ssna末端的第二末端可以是5′末端或3′末端。第一支架衔接子或其组分可以指p5衔接子或其组分,或p7衔接子或其组分。第二支架衔接子或其组分可以指p5衔接子或其组分,或p7衔接子或其组分。96.在一些情况下,在将支架衔接子或其组分与包含ssna的核酸样品组合之前,可以用核酸酶处理核酸样品以去除不需要的核酸。例如,双链特异性核酸酶(例如,t7核酸酶)可用于消化部分或所有双链dna,然后可以使用支架衔接子来制备本文公开的剩余核酸的测序文库。在一个实例中,双链特异性核酸酶用于消化样品中的双链核酸,在消化来自宿主生物和/或细菌的双链dna的同时,留下完整的单链核酸,例如来自单链dna病毒、单链rna病毒和单链dna(例如,受损的dna)的那些。97.组合支架衔接子或其组分和ssrna或sscdna98.本文的方法可以包括将一种或多种支架衔接子或其组分与包含单链核糖核酸(ssrna)或单链互补脱氧核糖核酸(sscdna)的组合物组合以形成一种或多种复合物。支架多核苷酸设计成用于与ssrna或sscdna片段和寡核苷酸组分同时杂交,从而在复合物形成后,寡核苷酸组分的末端与ssrna或sscdna片段末端区的末端相邻,如上文针对ssna所述。99.在一些实施方案中,核酸组合物包含sscdna。在一些实施方案中,方法包括,在组合之前从单链核糖核酸(ssrna)生成sscdna。通常,当核酸组合物包含sscdna时,本文的方法使用第一链cdna并且不需要生成第二链cdna。因此,在一些实施方案中,核酸组合物包含第一链sscdna。在一些实施方案中,核酸组合物基本上由第一链sscdna组成。“基本上由”第一链sscdna“组成”的核酸组合物通常包括第一链sscdna并且没有额外的蛋白质或核酸组分。基本上由第一链sscdna组成的核酸组合物通常不包含第二链sscdna。此外,例如,“基本上由”第一链sscdna“组成”的核酸组合物可以不包括双链cdna(dscdna)或可以包括低百分比的dscdna(例如,小于10%dscdna、小于5%dscdna、小于1%dscdna)。“基本上由”第一链sscdna“组成”的核酸组合物可以不包括蛋白质。例如,“基本上由”第一链sscdna“组成”的核酸组合物可以不包括单链结合蛋白(ssb)或可用于稳定第一链sscdna的其他蛋白质。“基本上由”第一链sscdna“组成”的核酸组合物可以包括通常存在于核酸组合物中的化学成分,例如缓冲液、盐、醇、拥挤剂(crowdingagent,例如peg)等;并且可以包括来自核酸来源(例如样品)、来自核酸提取或来自cdna合成的残留成分(例如,核酸(例如,残留rna)、蛋白质、细胞膜组分)。“基本上由”第一链sscdna“组成”的核酸组合物可以包括具有一个或多个磷酸酯(例如末端磷酸酯、5′末端磷酸酯)的第一链sscdna片段。“基本上由”第一链sscdna“组成”的核酸组合物可以包括包含一个或多个修饰核苷酸的第一链sscdna片段。100.在一些实施方案中,生成sscdna包括使ssrna与引物和包含逆转录酶活性的试剂接触,从而生成dna-rna双链体。在一些实施方案中,生成sscdna还可以包括使dna-rna双链体与包含rna酶活性的试剂接触,从而消化rna并生成sscdna产物。在一些实施方案中,包含逆转录酶活性的试剂还包含rna酶活性。因此,在一些实施方案中,逆转录和rna酶消化合并为一个步骤。在一些实施方案中,包含逆转录酶活性和rna酶活性的试剂是m-mulv逆转录酶(也称为m-mlv逆转录酶)。一种引物或多种引物可以是适合与逆转录酶结合使用的任何一种引物或多种引物。一种引物或多种引物可以选自随机引物(例如,随机六聚体引物、随机八聚体引物)和聚(t)引物中的一种或多种。可以通过合适的纯化或洗涤方法,例如本文所述的纯化或洗涤方法,纯化sscdna产物。101.在一些实施方案中,核酸组合物包含ssrna。在此类实施方案中,支架衔接子与ssrna片段直接杂交,并且寡核苷酸组分共价连接于ssrna末端的一个或多个末端,从而形成含有一个或多个支架衔接子和ssrna片段的杂交产物。在一些实施方案中,方法还包括从杂交产物生成单链连接产物(例如,通过使杂交产物变性)。在此类实施方案中,单链连接产物包含与一种或多种寡核苷酸组分共价连接的ssrna片段。在一些实施方案中,方法进一步包括使单链连接产物与引物和包含逆转录酶活性的试剂接触,从而生成dna-rna双链体。在一些实施方案中,方法进一步包括使dna-rna双链体与包含rna酶活性的试剂接触,从而消化rna并生成单链cdna(sscdna)产物。在一些实施方案中,包含逆转录酶活性的试剂还包含rna酶活性。因此,在一些实施方案中,逆转录和rna酶消化合并为一个步骤。在一些实施方案中,包含逆转录酶活性和rna酶活性的试剂是m-mulv逆转录酶(也称为m-mlv逆转录酶)。引物可以是任何适合与逆转录酶结合使用的引物。在一些实施方案中,引物包含与寡核苷酸组分(即,与ssrna片段共价连接的寡核苷酸组分)中的序列互补的核苷酸序列。可以通过合适的纯化或洗涤方法,例如本文所述的纯化或洗涤方法,纯化sscdna产蝴。102.在一些实施方案中,扩增sscdna产物。可以通过合适的扩增方法,例如本文所述的扩增方法,扩增sscdna产物。在一些实施方案中,扩增sscdna产物可以与生成dna-rna双链体和/或生成sscdna产物合并(例如,合并在单个步骤、反应、容器和/或体积中)。因此,用于生成dna-rna双链体的试剂(例如,一种或多种包含逆转录酶活性的试剂)、用于生成sscdna产物的试剂(例如,一种或多种包含rna酶活性的试剂)和用于扩增sscdna产物的试剂(例如,引物、包含聚合酶活性的试剂)可以组合用于单个步骤、反应、容器和/或体积中。在一些实施方案中,用于扩增sscdna产物的试剂包含与本文所述支架衔接子的组分(例如,第一寡核苷酸)杂交的扩增引物。扩增引物可以是适合与聚合酶结合使用的任何引物。在一些实施方案中,每个引物都包含与sscdna产物中对应于寡核苷酸组分(即,与ssrna片段共价连接的寡核苷酸组分)的序列互补的核苷酸序列。可以通过合适的纯化或洗涤方法,例如本文所述的纯化或洗涤方法,纯化扩增的sscdna产蝴。103.在一些实施方案中,本文的方法包括,在将ssrna与支架衔接子或其组分组合之前,或在生成sscdna之前,将ssrna片段化,从而生成ssrna片段。可以使用任何合适的片段化方法,例如,本文所述的片段化方法。在一些实施方案中,本文的方法包括在将ssrna与支架衔接子或其组分组合之前,或在生成sscdna之前,耗尽核糖体rna(rrna)和/或富集信使rna(mrna)。可以使用任何合适的rrna耗尽方法和/或mrna富集方法,例如本文所述的rrna耗尽方法和/或mrna富集方法。104.杂交和连接105.可以将核酸片段(例如,ssna片段)与支架衔接子或其组分组合,从而生成组合产物。将ssna片段与支架衔接子或其组分组合可以包括杂交和/或连接(例如,杂交产物的连接)。组合产物可以包括在ssna片段的一个末端或两个末端连接于(例如,杂交于和/或连接于)支架衔接子或其组分的ssna片段。组合产物可以包括在ssna片段的一个末端或两个末端与支架衔接子或其组分杂交的ssna片段,其可以称为杂交产物。组合产物可以包括在ssna片段的一个末端或两个末端连接到支架衔接子或其组分的ssna片段,其可以称为连接产物。在一些实施方案中,可以将来自切割步骤的产物(即切割产物)与支架衔接子或其组分组合,从而生成组合产物。本文的某些方法包括生成组合产物集合(例如,第一集合的组合产物和第二集合的组合产物)。在一些实施方案中,第一集合组合产物的包括连接于(例如,杂交于和/或连接到)来自第一集合的支架衔接子或其组分的支架衔接子或其组分的ssna。在一些实施方案中,第二集合的组合产物包括连接于(例如,杂交于和/或连接到)来自第二集合的支架衔接子或其组分的支架衔接子或其组分的第一集合的组合产物。106.可以在杂交条件下将ssna与支架衔接子或其组分组合,从而生成杂交产物。在一些实施方案中,支架衔接子作为预杂交产物提供,并且杂交步骤包括将支架衔接子与ssna杂交。在一些实施方案中,支架衔接子组分(即,寡核苷酸和支架多核苷酸)作为个体组分提供,并且杂交步骤包括将支架衔接子组分1)彼此杂交和2)与ssna杂交。在一些实施方案中,支架衔接子组分(即,寡核苷酸和支架多核苷酸)作为个体组分顺序提供,并且杂交步骤包括1)将支架多核苷酸与ssna杂交,然后2)将寡核苷酸与支架多核苷酸的寡核苷酸杂交区杂交。组合步骤期间的条件是这样的条件,其中支架衔接子或其组分(例如单链支架区)与具有一个或多个末端区的ssna特异性杂交,该末端区在序列上与单链支架区是互补的。组合步骤期间的条件还可包括这样的条件,其中支架衔接子的组分(例如,支架多核苷酸内的寡核苷酸和寡核苷酸杂交区)彼此特异性杂交或保持彼此杂交。107.特异性杂交可受多种因素影响(affect)或影响(influence),例如单链支架区与ssna末端区之间或寡核苷酸与寡核苷酸杂交区之间的互补程度、其长度以及发生杂交时的温度,这可以通过单链支架区的解链温度(tm)来了解。解链温度通常是指一半单链支架区/ssna末端区保持杂交且一半单链支架区/ssna末端区解离成单链时的温度。双链体的tm可以使用以下公式通过实验确定或预测:tm=81.5+16.6(log10[na+])+0.41(组分g+c)-(60/n),其中n是链长,[na+]小于1m。取决于各种参数的其他模型也可用于根据各种杂交条件预测相关区的tm。实现特异性核酸杂交的方法描述于例如,tijssen,laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes,parti,chapter2,“overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays(用核酸探针进行生物化学和分子生物学杂交的技术,第一部分,第二章,杂交原理和核酸探针测定策略概述),”elsevier(1993)。[0108]在一些实施方案中,本文的方法包括将杂交产物暴露于这样的条件,在该条件下,ssna的末端连接到与其杂交的支架衔接子的末端。特别是,本文的方法可以包括将杂交产物暴露于这样的条件,在该条件下,sssna的末端连接到与其杂交的支架衔接子的寡核苷酸组分的末端。可以通过允许ssna共价连接于与其杂交的支架衔接子和/或与其杂交的支架衔接子寡核苷酸组分的任何合适方法来实现连接。当ssna的一个末端连接到与其杂交的支架衔接子的末端和/或与其杂交的支架衔接子寡核苷酸组分的末端时,通常进行两个连接事件之一:1)ssna的3′末端连接于支架衔接子寡核苷酸组分的5′末端,或2)ssna的5′末端连接于支架衔接子寡核苷酸组分的3′末端。当ssna的两个末端各自连接于与其杂交的支架衔接子的末端和/或与其杂交的支架衔接子寡核苷酸组分的末端时,通常会进行两个连接事件:1)ssna的3′末端连接到第一支架衔接子寡核苷酸组分的5′末端,和2)ssna的5′末端连接到第二支架衔接子寡核苷酸组分的3′末端。[0109]在一些实施方案中,本文的方法包括,在ssna的末端共价连接于与靶核酸(ssna)杂交的支架衔接子的末端和/或与靶核酸(ssna)杂交的支架衔接子寡核苷酸组分的末端的条件下,使杂交产物与包含连接酶活性的试剂接触。连接酶活性可以包括例如平末端连接酶活性、切口密封连接酶活性、粘性末端连接酶活性(stickendligaseactivity)、环化连接酶活性、粘着末端连接酶活性(cohesiveendligaseactivity)、dna连接酶活性、rna连接酶活性、单链连接酶活性和双链连接酶活性。连接酶活性可以包括将一个多核苷酸的5′磷酸化末端连接于另一个多核苷酸的3′oh末端(5′p到3′oh)。连接酶活性可以包括将一个多核苷酸的3′磷酸化末端连接于另一个多核苷酸的5′oh末端(3′p到5′oh)。连接酶活性可以包括在连接反应中将ssna的5′末端连接于与其杂交的支架衔接子的3′末端和/或与其杂交的支架衔接子寡核苷酸组分的3′末端。连接酶活性可以包括在连接反应中将ssna的3′末端连接于与其杂交的支架衔接子的5′末端和/或与其杂交的支架衔接子寡核苷酸组分的5′末端。用于进行连接反应的合适试剂(例如,连接酶)和试剂盒是已知且可获得的。例如,可以使用可从newenglandbiolabs(ipswich,ma)获得的瞬时粘性末端连接酶预混液(instantsticky-endligasemastermix)。可以使用的连接酶包括但不限于例如t3连接酶、t4dna连接酶(例如,在低浓度或高浓度)、t7dna连接酶、e.colidna连接酶、electrorna连接酶、t4rna连接酶2、连接酶、rtcb连接酶、taq连接酶等及其组合。当需要时,可以使用合适的激酶,例如t4多核苷酸激酶(pnk),在寡核苷酸组分或ssna片段的5′末端添加磷酸酯基团。此类激酶和使用此类激酶磷酸化5′末端的指导可从例如newenglandbiolabs,inc.(ipswich,ma)获得。[0110]在一些实施方案中,方法包括将寡核苷酸组分和ssna末端区的相邻末端共价连接,从而生成共价连接的杂交产物。在一些实施方案中,共价连接包括,在其中ssna末端区的末端与寡核苷酸组分的末端共价连接的条件下,使杂交产物(例如,与本文的至少一个支架衔接子杂交的ssna片段)与包含连接酶活性的试剂接触。在一些实施方案中,方法包括将第一寡核苷酸组分和第一ssna末端区的相邻末端共价连接,和将第二寡核苷酸组分和第二ssna末端区的相邻末端共价连接,从而生成共价连接的杂交产物。在一些实施方案中,共价连接包括,在第一ssna末端区的末端与第一寡核苷酸组分的末端共价连接且第二ssna末端区的末端与第二寡核苷酸组分的末端共价连接的条件下,使杂交产物(例如,各自与本文的两个支架衔接子杂交的ssna片段)与包含连接酶活性的试剂接触。在一些实施方案中,包含连接酶活性的试剂是t4dna连接酶。在一些实施方案中,t4dna连接酶的使用量为约1个单位/μl至约50个单位/μl。在一些实施方案中,t4dna连接酶的使用量为约5个单位/μl至约30个单位/μl。在一些实施方案中,t4dna连接酶的使用量为约5个单位/μl至约15个单位/μl。在一些实施方案中,以约10个单位/μl使用t4dna连接酶。在一些实施方案中,t4dna连接酶的使用量小于25个单位/μl。在一些实施方案中,t4dna连接酶的使用量小于20个单位/μl。在一些实施方案中,t4dna连接酶的使用量小于15个单位/μl。在一些实施方案中,t4dna连接酶的使用量小于10个单位/μl。[0111]在一些实施方案中,使杂交产物与包含第一连接酶活性的第一试剂和包含不同于第一连接酶活性的第二连接酶活性的第二试剂接触。例如,第一连接酶活性和第二连接酶活性可以独立地选自平末端连接酶活性、切口密封连接酶活性、粘性末端连接酶活性、环化连接酶活性和粘着末端连接酶活性、双链连接酶活性、单链连接酶活性、5′p到3′oh连接酶活性和3′p到5′oh连接酶活性。[0112]在一些实施方案中,本文的方法包括通过生物相容连接将ssna连接至支架衔接子和/或支架衔接子的寡核苷酸组分。方法可以包括,例如,点击化学或加标签,其包括可用于连接生物分子的生物相容反应。在一些实施方案中,每个寡核苷酸组分的末端都包含第一化学反应部分,并且每个ssna的末端都包括第二化学反应部分。在此类实施方案中,第一化学反应部分通常能够与第二化学反应部分反应,并在支架衔接子的寡核苷酸组分和与支架衔接子杂交的ssna之间形成共价键。在一些实施方案中,本文的方法包括,在将第二化学反应部分掺入每个ssna片段的末端的条件下,使ssna与一种或多种化学试剂接触。在一些实施方案中,本文的方法包括将杂交产物暴露于这样的条件下,在该条件中,第一化学反应部分与第二化学反应部分反应,从而在寡核苷酸组分和与支架衔接子杂交的ssna之间形成共价键。在一些实施方案中,第一化学反应部分能够与第二化学反应部分反应以在寡核苷酸组分和与支架衔接子杂交至的ssna之间形成1,2,3-三唑。在一些实施例中,第一化学反应部分能够在包含铜的条件下与第二化学反应部分反应。第一和第二化学反应性部分可以包括任何合适的配对。例如,第一化学反应部分可以选自含叠氮化物的部分和5-辛二炔基脱氧尿嘧啶,而第二化学反应部分可独立地选自含叠氮化物的部分、己炔基和5-辛二炔基脱氧尿嘧啶。在一些实施方案中,含叠氮化物的部分是n-羟基琥珀酰亚胺(nhs)酯-叠氮化物。[0113]将寡核苷酸和ssna片段的相邻末端共价连接产生共价连接的产物,其可以称为连接产物。包括与寡核苷酸组分共价连接的ssna片段(其保持与支架多核苷酸杂交)的共价连接的产物,可以称为共价连接的杂交产物。可以使共价连接的杂交产物变性(例如,热变性)以将与寡核苷酸组分共价连接的ssna片段与支架多核苷酸分离。包括与寡核苷酸组分共价连接的ssna片段(其不再与支架多核苷酸杂交(例如,在变性后))的共价连接的产物,可以称为单链连接产物。在一些情况下,可以切割和/或降解部分支架多核苷酸,例如通过在支架多核苷酸中的一个或多个尿嘧啶碱基处使用尿嘧啶-dna糖基化酶和内切核酸酶。[0114]可以在用作感兴趣的下游应用(例如,扩增;测序)的输入之前,纯化共价连接的杂交产物和/或单链连接产物。例如,可以从在组合、杂交和/或共价连接(连接)步骤期间存在的某些组分,纯化共价连接的杂交产物和/或单链连接产物(例如,通过固相可逆固定(spri)、柱纯化和/或等)。[0115]在一些实施方案中,当本文的方法包括将ssna组合物与本文的支架衔接子或其组分组合并将寡核苷酸组分和ssna片段的相邻末端共价连接时,组合和共价连接的总持续时间可以是4小时或更短、3小时或更短、2小时或更短或1小时或更短。在一些实施方案中,组合和共价连接的总持续时间小于1小时。[0116]在一些实施方案中,在单个容器、单个室和/或单个体积(即,连续体积)中,包括但不限于在微流体装置上,进行本文的方法。在一些实施方案中,在单个容器、单个室和/或单个体积(即,连续体积)中,包括但不限于在微流体装置上,将ssna组合物与本文的支架衔接子或其组分组合,以及将寡核苷酸组分和ssna片段的相邻末端共价连接。在一些实施方案中,在孔、液滴、乳液、分区(partition)或其他反应体积的集合中,包括但不限于在微流体装置上,进行本文的方法。在一些实施方案中,在孔、液滴、乳液、分区或其他反应体积的集合中,包括但不限于在微流体装置上,将ssna组合物与本文的支架衔接子或其组分组合,以及将寡核苷酸组分和ssna片段的相邻末端共价连接。在一些情况下,将反应体积的集合制备成使得大多数或所有反应体积包含至多一种ssna。在一些情况下,将反应体积的集合制备成使得大多数或所有的反应体积包含至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000种或更多种ssna。将一种或有限数目的ssna分配到反应体积中可以提供有利的反应动力学,例如增加稀有种类的样品核酸的文库转换。[0117]衔接子二聚体[0118]在一些实施方案中,本文的方法包括用于防止、减少或消除衔接子二聚体的一个或多个修饰和/或额外步骤。衔接子二聚体可在本文所述的方法期间无意中形成。衔接子二聚体通常是指两个或更多个彼此杂交、或杂交和连接的支架衔接子、其组分或其部分。图20提供了某些适衔接子二聚体构造的实例。[0119]在某些实施方案中,修饰支架衔接子或其组分,以防止衔接子二聚体形成。对支架衔接子修饰的实例包括能够阻断支架衔接子、寡核苷酸组分或支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子(例如另一支架衔接子、寡核苷酸组分和/或支架多核苷酸)共价连接的修饰的核苷酸。修饰的核苷酸的实例在下文有描述。支架衔接子的其他/额外修饰包括诸如y-构造或发夹构造等构造,其在下文有进一步的详细描述。在一些实施方案中,支架衔接子、寡核苷酸组分和/或支架多核苷酸可以包含硫代磷酸酯主链修饰(例如,链上最后两个核苷酸之间的硫代磷酸酯键)。[0120]在一些实施方案中,方法包括去磷酸化步骤以防止或减少衔接子二聚体的形成。在一些实施方案中,方法包括在将支架衔接子或其组分与ssna组合之前,在支架衔接子、寡核苷酸组分和/或支架多核苷酸和/或支架多核苷酸去磷酸化的条件下,使支架衔接子、寡核苷酸组分和/或支架多核苷酸与包含磷酸酶活性的试剂接触,从而生成去磷酸化的支架衔接子、去磷酸化的寡核苷酸组分和/或去磷酸化的支架多核苷酸。[0121]在一些实施方案中,方法包括一种或多种分阶段连接方法以防止或减少衔接子二聚体的形成。在一些实施方案中,方法包括分阶段连接,其包括延迟添加包含磷酰基转移活性的试剂(例如,直到形成杂交产物之后)和/或延迟添加第二支架衔接子或其组分(参见图9)。例如,方法可以包括在形成杂交产物之后且在将寡核苷酸组分共价连接于ssna末端区之前,在将5′磷酸酯添加于寡核苷酸组分的5′末端的条件下,使寡核苷酸组分与包含磷酰基转移活性的试剂接触。在另一实例中,方法可以包括将第一集合的支架衔接子与ssna组合。第一集合的支架衔接子可以包括具有3′oh的寡核苷酸组分。使第一集合的支架衔接子与ssna杂交,并将寡核苷酸组分的3′oh共价连接于ssna末端区的5′末端(例如,5′磷酸化末端)。这种第一轮杂交和共价连接的产物可以称为中间共价连接的杂交产物。然后将中间共价连接的杂交产物与第二集合的支架衔接子组合。第二集合的支架衔接子可以包括具有可以如本文所述磷酸化的5′末端的寡核苷酸组分。使第二集合的支架衔接子与中间共价连接的杂交产物杂交,并将寡核苷酸组分的5′磷酸化末端共价连接于ssna末端区的3′末端。[0122]在一些实施方案中,方法包括分阶段连接,其包括使用具有腺苷酰化修饰的支架衔接子或其组分(参见图10)。例如,第一集合的支架衔接子可以在寡核苷酸组分的5′末端包含腺苷酰化修饰(5′app)。使第一集合的支架衔接子与ssna杂交,并将寡核苷酸组分的5′app共价连接于ssna末端区的3′末端。共价连接可以在不存在atp的情况下发生。这种第一轮杂交和共价连接的产物可以称为中间共价连接的杂交产物。然后将中间共价连接的杂交产物与第二集合的支架衔接子组合。第二集合的的支架衔接子可以包括具有3′oh末端的寡核苷酸组分。使第二集合的支架衔接子与中间共价连接的杂交产物杂交,并将寡核苷酸组分的3′oh末端共价连接于ssna末端区的5′末端(例如5′磷酸化末端)(添加了atp)。在一个变型中,在不存在atp的情况下,同时将第一集合的支架衔接子和第二集合的支架衔接子与ssna组合。第一集合的支架衔接子的连接可以在不存在atp的情况下进行,而第二集合的支架衔接子的连接仅在添加atp后才可以进行。[0123]在一些实施方案中,方法包括分阶段连接,其包括使用具有3′磷酸化末端的寡核苷酸(即,单链寡核苷酸)(参见图11)。具有3′磷酸化末端的寡核苷酸可以包含本文所述的用于支架衔接子的寡核苷酸组分的任何子组分(例如,引物结合位点、索引、umi、流动槽衔接子等)。具有3′磷酸化末端的寡核苷酸通常是单链的,并且不与支架多核苷酸杂交。在一个实例中,方法可以包括在将支架衔接子或其组分与ssna组合之前,将ssna与在3′末端包含磷酸酯的寡核苷酸组合并将该寡核苷酸的3′磷酸化末端共价连接到ssna末端区的5′末端(例如,5′非磷酸化末端)。在一些实施方案中,在将寡核苷酸共价连接于ssna之前,在ssna去磷酸化,从而生成去磷酸化的ssna的条件下,使ssna与包含磷酸酶活性的试剂接触。在一些实施方案中,将寡核苷酸共价连接于ssna包括,在ssna的5′末端与寡核苷酸的3′末端共价连接的条件下,使ssna和寡核苷酸与包含单链连接酶活性的试剂接触。在一些实施方案中,包含连接酶活性的试剂是rtcb连接酶。这种共价连接的产物可以称为中间共价连接的产物。然后将中间共价连接的产物与支架衔接子的集合组合。支架衔接子的集合可以包括具有5′磷酸化末端的寡核苷酸组分。使支架衔接子的集合与中间共价连接的产物杂交,并将寡核苷酸组分的5′磷酸化末端共价连接到ssna末端区的3′末端。[0124]在一些实施方案中,方法包括使用能够与寡核苷酸二聚体产物杂交的寡核苷酸(参见图20)以减少或消除衔接子二聚体。寡核苷酸二聚体产物可以是支架衔接子二聚体的组分,并且可以含有与来自第二支架衔接子的寡核苷酸组分共价连接的第一支架衔接子的寡核苷酸组分。本文的方法可以包括可从支架衔接子二聚体释放寡核苷酸二聚体产物的变性步骤。寡核苷酸二聚体产物可以与具有与寡核苷酸二聚体产物或其部分互补的序列的寡核苷酸杂交,从而形成寡核苷酸二聚体杂交产物。在一些实施方案中,寡核苷酸二聚体杂交产物包含切割位点。在一些实施方案中,切割位点是限制酶识别位点。在一些实施方案中,本文的方法还包括使寡核苷酸二聚体杂交产物与切割剂(例如,限制酶、稀切限制酶(rare-cutterrestrictionenzyme))接触。[0125]在一些实施方案中,方法包括在文库制备的不同阶段纯化或洗涤核酸产物以减少或消除衔接子二聚体。在一些情况下,纯化或洗涤核酸产品可以减少或消除衔接子二聚体。例如,可以通过任何合适的纯化或洗涤方法纯化或洗涤共价连接的杂交产物(即与支架衔接子杂交并与寡核苷酸组分共价连接的ssna)、单链连接产物(即变性的共价连接的杂交产物;与寡核苷酸组分共价连接且不再与支架多核苷酸杂交的ssna)或其扩增产物。在一些实施方案中,纯化或洗涤包括使用固相可逆固定(spri)。可以将spri珠重悬于dna结合缓冲液中,该缓冲液含有例如约2.5m至约5m的nacl、约0.1mm至约1m的edta、约10mm的tris、约0.01%至约0.05%的tween-20和约8%至约38%的peg-8000。例如,可以将1ml的spri珠悬浮液与2.5m的nacl、10mm的tris、1mm的edta、0.05%的tween-20和20%的peg-8000组合。在一些实施方案中,spri包括连续spri(背对背进行洗涤)和/或顺序spri(洗涤包括顺序添加spri珠并孵育)。连续spri可包括多次连续(背对背)洗涤,其可包括2、3、4、5、6、7、8、9、10或更多次连续洗涤。顺序spri可以包括多次顺序添加spri珠(具有中间孵育),其可以包括2、3、4、5、6、7、8、9、10或更多次顺序添加spri珠。在一些实施方案中,spri纯化中使用的spri珠的量可以包括0.1x至3xspri珠的量(x是珠与核酸的比例(例如,珠体积与反应体积))。例如,spri纯化中使用的spri珠的量可包括约0.1x、0.2x、0.3x、0.4x、0.5x、0.6x、0.7x、0.8x、0.9x、1.0x、1.1x、1.2x、1.3x、1.4x、1.5x、1.6x、1.7x、1.8x、1.9x、2.0x、2.1x、2.2x、2.3x、2.4x、2.5x、2.6x、2.7x、2.8x、2.9x或3.0x的spri珠。在一些实施方案中,spri纯化中使用的spri珠的量为1.2x。在一些实施方案中,spri纯化中使用的spri珠的量为1.5x。在一些实施方案中,纯化或洗涤包括柱纯化(例如柱色谱)。在一些实施方案中,纯化或洗涤不包括柱纯化(例如柱色谱)。在一些实施方案中,不纯化或洗涤共价连接的杂交产物、单链连接产物和/或其扩增产物。[0126]通常,在存在缓冲液的情况下进行spri纯化。可以使用任何合适的缓冲液,例如tris缓冲液、具有相似ph值的水等。可以将spri纯化珠直接添加于样品溶液(例如,含有共价连接的杂交产物(连接产物)或其扩增产物的样品溶液)中。在某些情况下,可以添加缓冲液以增加反应体积,因此可以添加额外的珠。在一些实施方案中,spri珠溶液由添加到溶于水、nacl、tris和edta中的peg8000的羧化磁珠组成。peg的量通常决定spri珠溶液的peg百分比。例如,在50mlspri珠溶液中添加9gpeg8000可以称为“18%spri”。在另一个实例中,在50mlspri溶液中添加19gpeg8000可以称为“38%spri”。通常,peg的比例越高,保留的dna片段的尺寸就越小。[0127]在一些实施方案中,纯化过程包括使共价连接的杂交产物(连接产物)与固相可逆固定(spri)珠和缓冲液接触。在一些实施方案中,一些或所有spri缓冲液被异丙醇替代。在一些实施方案中,spri缓冲液包含异丙醇。在一些实施方案中,spri缓冲液完全被异丙醇替代。在一些实施方案中,spri缓冲液包含约5%体积/体积(v/v)的异丙醇至约50%v/v的异丙醇。在一些实施方案中,spri缓冲液包含约10%v/v的异丙醇至约40%v/v的异丙醇。例如,spri缓冲液可以包含约10%v/v的异丙醇、15%v/v的异丙醇、20%v/v的异丙醇、25%v/v异丙醇、30%v/v的异丙醇、35%v/v的异丙醇或40%v/v的异丙醇。在一些实施方案中,spri缓冲液包含约20%v/v的异丙醇。[0128]在一些实施方案中,纯化或洗涤步骤可以富集具有特定长度或长度范围的核酸片段或其扩增产物。在一些实施方案中,spri纯化可以富集具有特定长度或长度范围的核酸片段或其扩增产物。在一些实施方案中,spri纯化使用的spri珠溶液中peg8000的量可以影响被富集的片段的长度或长度范围。例如,1.5xv/v比例的spri纯化可以比1.2x的spri纯化回收更多的《100碱基范围内的片段,因为peg8000的最终浓度在1.5x中比在1.2x中更高。在一些实施方案中,本文中的方法包括调整spri比例以富集所需的片段长度或长度范围。在一些实施方案中,本文的方法包括调整spri纯化中异丙醇的量以富集期望的片段长度或长度范围。在一些实施方案中,本文的方法包括调整spri纯化中异丙醇的量以富集期望的片段长度或长度范围,同时最小化不需要的伪影(例如,衔接子二聚体)的量。例如,本文的方法可以包括调整spri纯化中异丙醇的量以富集期望的片段长度或长度范围,其中回收的衔接子二聚体的量小于回收的总核酸的约10%。在另一个实例中,本文的方法可以包括调节spri纯化中异丙醇的量以富集期望的片段长度或长度范围,其中回收的衔接子二聚体的量小于回收的总核酸的约5%。[0129]在一些实施方案中,可以以合适的反应体积和/或合适的ssna量和/或ssna与支架衔接子(或其组分)的合适比例,进行本文的方法(例如,将ssna与支架衔接子或其组分组合、杂交和共价连接)。合适的反应体积和/或合适的ssna量和/或ssna与支架衔接子(或其组分)的合适比例可以包括减少或防止衔接子二聚体形成的反应体积、ssna的量和/或ssna与支架衔接子的比例。在一些实施方案中,合适量的ssna可以为约250pg至约5ngssna的范围。例如,ssna的合适量可以为约250pg、500pg、750pg、1ng、1.5ng、2ng、2.5ng、3ng、3.5ng、4ng、4.5ng或5ng。在一些实施方案中,合适量的ssna可以是约1ngssna。在一些实施方案中,对于25μl的最终反应体积,可以将1ngssna与以下组合:约1.0-2.0皮摩尔的每种支架衔接子(即约1.0-2.0皮摩尔与ssna末端区的5′末端杂交的支架衔接子(含有多个支架衔接子种类的支架衔接子池),和约1.0-2.0皮摩尔与ssna末端区的3′末端杂交的支架衔接子(含有多个支架衔接子种类的支架衔接子池))。例如,对于25μl的最终反应体积,1ngssna可以与约1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2.0皮摩尔的每种支架衔接子组合。在一些实施方案中,对于25μl的最终反应体积,1ngssna与约1.6皮摩尔的每种支架衔接子(即,约1.6皮摩尔与ssna末端区的5′末端杂交的支架衔接子,和约1.6皮摩尔与ssna末端区的3′末端杂交的支架衔接子)组合。对于更大的反应体积,可以按比例增加ssna和支架衔接子的量,只要保持相对量即可。对于较小的反应体积,可以按比例缩小ssna和支架衔接子的量,只要保留相对量即可。在一些实施方案中,在本文中,以约5∶1(支架衔接子:ssna)至约50∶1(支架衔接子:ssna)的摩尔比,将支架衔接子与ssna组合。例如,可以以约5∶1(支架衔接子:ssna)、约10∶1(支架衔接子:ssna)、约15∶1(支架衔接子:ssna)、约20∶1(支架衔接子:ssna)、约25∶1(支架衔接子:ssna)、约30∶1(支架衔接子:ssna)、约35∶1(支架衔接子:ssna)、约40∶1(支架衔接子:ssna)、约45∶1(支架衔接子:ssna)或约50∶1(支架衔接子:ssna)的摩尔比,将支架衔接子与ssna组合。在一些实施方案中,以约15∶1(支架衔接子与ssna)的摩尔比,将支架衔接子与ssna组合。在一些实施方案中,以约30∶1(支架衔接子:ssna)的摩尔比,将支架衔接子与ssna组合。[0130]在一些实施方案中,本文的方法包括使用拥挤剂。可以使用合适量的拥挤剂来减少或防止衔接子二聚体的形成。拥挤剂可以包括例如ficoll(聚蔗糖)70、葡聚糖(dextran)70、聚乙二醇(peg)2000和聚乙二醇(peg)8000。在一些实施方案中,本文的方法包括使用聚乙二醇(peg)8000。例如peg的使用量可以为约15%至约20%,该百分比是指连接反应中peg的最终浓度。例如,peg的使用量可以为约15%、15.5%、16%、16.5%、17%、17.5%、18%、18.5%、19%、19.5%或20%。在一些实施方案中,使用18.5%的peg。在一些实施例中,使用18%的peg。[0131]在纯化过程中,可以将spri珠溶液添加到样品溶液中,通常带有v/v比的说明。例如,1.2x18%spri是指,如果给定50μl样品,则添加60μl(50x1.2)18%spri磁珠。假设样品溶液中没有peg,这个v/v比导致peg的最终浓度为9.8%。然而,通常在连接后,样品溶液(即连接产物)中存在现有量的peg。因此,用户可以调整添加的spri珠的体积以达到期望的peg最终浓度。期望的peg最终浓度可以为约5%最终peg至约15%最终peg。例如,期望的peg最终浓度可以为约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%或15%。在一些实施方案中,期望的peg最终浓度为约10%(例如,对于毛发样品和cfdna样品)。在一些实施方案中,期望的peg最终浓度为约12%(例如,对于福尔马林固定石蜡包埋(ffpe)样品和具有大模板片段的样品)。[0132]y-衔接子[0133]在一些实施方案中,本文所述的支架衔接子包含两条链,具有位于第一末端的单链支架区和位于第二末端的两条非互补链。此类支架衔接子可以称为y-支架衔接子、y-衔接子、y-形支架衔接子、y-形衔接子、y-双链体、y-形双链体、y-支架双链体、y-形支架双链体等。具有y形结构的支架衔接子通常包含双链的双链体区、位于一个末端的两个单链“臂”和位于另一末端的单链支架区。[0134]y-支架衔接子可以包含多个核酸组分和亚组分。在一些实施方案中,y-支架衔接子包含第一核酸链和第二核酸链。在一些实施方案中,第一核酸链与第二核酸链互补。在一些实施方案中,第一核酸链的一部分与第二核酸链的一部分互补。在一些实施方案中,第一核酸链包含与第二核酸链的第一区互补的第一区,并且第一多核苷酸包含不与第二多核苷酸的第二区互补的第二区。互补区通常形成y-支架衔接子的双链体区,非互补区通常形成y-支架衔接子的臂或其部分。第一和第二核酸链可以包含亚组分(例如,本文所述的支架多核苷酸的亚组分、寡核苷酸的亚组分和测序衔接子的亚组分,例如扩增引发位点和/或具体测序衔接子(例如,p5、p7衔接子))。在一些实施方案中,第一和第二核酸链不包含本文所述的测序衔接子的某些亚组分,例如扩增引发位点和/或具体测序衔接子(例如,p5、p7衔接子)。[0135]在一些实施方案中,y-支架衔接子包含单链支架区(ssna杂交区)。y-支架衔接子的单链支架区通常位于双链的双链体部分附近并且位于非互补链(或“臂”)部分的相对端。y-支架衔接子的单链支架区通常与靶核酸的末端区(例如,单链核酸的末端区)互补。[0136]发夹[0137]在一些实施方案中,支架衔接子包含能够形成具有单链环的发夹结构的一条链。在一些实施方案中,支架衔接子头由能够形成具有单链环的发夹结构的一条链组成。具有发夹结构的支架衔接子通常包含双链“茎”区和单链“环”区。在一些实施方案中,支架衔接子包含能够采用发夹结构的一条链(即,一条连续链)。在一些实施方案中,支架衔接子基本上由能够采用发夹结构的一条链(即,一条连续链)组成。基本上由一条链组成是指,支架衔接子不包括不是连续链的一部分的任何额外的核酸链(例如,与支架衔接子杂交的核酸链)。因此,“基本上由......组成”在此是指支架衔接子中的链数,并且支架衔接子可以包括对链数不重要的其他特征(例如,可以包括可检测标记,可以包括其他区)。包含能够形成发夹结构的一条链或基本上由其组成的支架衔接子在本文中可以称为发夹、发夹支架衔接子或发夹衔接子。[0138]发夹支架衔接子可以在一条链内包含多个核酸组分和亚组分。在一些实施方案中,发夹支架衔接子包含寡核苷酸和支架多核苷酸。在一些实施方案中,寡核苷酸与支架多核苷酸中的寡核苷酸杂交区互补。在一些实施方案中,寡核苷酸的一部分与支架多核苷酸中寡核苷酸杂交区的一部分互补。在一些实施方案中,发夹支架衔接子包含互补区和非互补区。互补区通常形成发夹衔接子的茎,非互补区通常形成发夹支架衔接子的环或其部分。寡核苷酸和支架多核苷酸可以包含亚组分(例如,本文所述的支架多核苷酸的亚组分、寡核苷酸的亚组分和测序衔接子的亚组分,例如扩增引发位点和/或具体的测序衔接子(例如,p5、p7衔接子))。在一些实施方案中,寡核苷酸和支架多核苷酸不包含本文所述的测序衔接子的某些亚组分,例如扩增引发位点和具体的测序衔接子(例如,p5、p7衔接子)。[0139]发夹支架衔接子可以包含一个或多个能够在切割条件下被切割的切割位点。在一些实施方案中,切割位点位于寡核苷酸与支架多核苷酸之间。在切割位点处的切割通常会从发夹支架衔接子生成两条单独的链。在一些实施方案中,切割位点处的切割生成部分双链支架衔接子,其中两条未配对的链形成“y”结构。切割位点可以包括任何合适的切割位点,例如本文所述的切割位点。在一些实施方案中,切割位点包含rna核苷酸并且可以例如使用rna酶来切割。在一些实施方案中,切割位点包含尿嘧啶和/或脱氧尿苷并且可以例如使用dna糖基化酶、内切核酸酶、rna酶等及其组合来切割。在一些实施方案中,切割位点不包含尿嘧啶和/或脱氧尿苷。在一些实施方案中,本文的方法包括在将发夹支架衔接子与单链核酸组合后,将一个或多个切割位点暴露于切割条件,从而切割支架衔接子。[0140]在一些实施方案中,发夹支架衔接子包含单链支架区(ssna杂交区)。发夹支架衔接子的单链支架区通常位于双链茎部附近并位于环部分的相对端。发夹支架衔接子的单链支架区通常与靶核酸的末端区(例如,单链核酸的末端区)互补。[0141]在一些实施方案中,发夹支架衔接子在5′至3′方向包含:寡核苷酸、一个或多个切割位点以及包含寡核苷酸杂交区和支架区(ssna杂交区)的支架多核苷酸。在一些实施方案中,发夹寡核苷酸在5′至3′方向包含:包含支架区(ssna杂交区)和寡核苷酸杂交区的支架多核苷酸、一个或多个切割位点以及寡核苷酸。在一些实施方案中,多个发夹支架衔接子种类或发夹支架衔接子种类的池包含以下的混合物:1)发夹支架衔接子,其在5′至3′方向包含:寡核苷酸、一个或多个切割位点以及包含寡核苷酸杂交区和支架区(ssna杂交区)的支架多核苷酸区;和2)发夹支架衔接子,其在5′至3′方向包含:包含支架区(ssna杂交区)和寡核苷酸杂交区的支架多核苷酸、一个或多个切割位点以及寡核苷酸。[0142]修饰的核苷酸[0143]在一些实施方案中,支架衔接子或其组分包含一个或多个修饰的核苷酸。修饰的核苷酸可以称为修饰的碱基并且可以包括例如与结合对成员缀合的核苷酸、阻断的核苷酸、非天然核苷酸、核苷酸类似物、肽核酸(pna)核苷酸、吗啉代核苷酸、锁核酸(lna)核苷酸、桥接核酸(bna)核苷酸、乙二醇核酸(gna)核苷酸、苏糖核酸(tna)核苷酸等及其组合。在一些实施方案中,支架衔接子或其组分在双链体区内、在支架区内、在支架衔接子或其组分的一个末端或两个末端包含一个或多个修饰的核苷酸。在一些实施方案中,支架衔接子或其组分包含一个或多个未配对的修饰的核苷酸。在一些实施方案中,支架衔接子或其组分在衔接子的一个末端包含一个或多个未配对的修饰的核苷酸。在一些实施方案中,支架衔接子或其组分在衔接子的与靶核酸所杂交的末端(例如,包含单链支架区的末端)相对的末端包含一个或多个未配对的修饰的核苷酸。修饰的核苷酸可以存在于具有3′末端的链的末端或存在于具有5′末端的链的末端。[0144]在一些实施方案中,寡核苷酸组分包含一个或多个修饰的核苷酸。在一些实施方案中,一个或多个修饰的核苷酸能够阻断寡核苷酸组分与另一寡核苷酸、多核苷酸或核酸分子的共价连接。在一些实施方案中,寡核苷酸组分在不与ssna相邻的末端包含一个或多个修饰的核苷酸。在一些实施方案中,支架多核苷酸包含一个或多个修饰的核苷酸。在一些实施方案中,一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。支架多核苷酸可以在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。在一些实施方案中,一个或多个修饰的核苷酸包含阻断连接的修饰。[0145]在一些实施方案中,支架衔接子或其组分包含一个或多个阻断的核苷酸。在一个实例中,支架衔接子或其组分可以包含一个或多个能够阻断与另一支架衔接子或其组分中核苷酸杂交的修饰的核苷酸。在一些情况下,所述一个或多个修饰的核苷酸能够阻断与另一支架衔接子或其组分中核苷酸的连接。在另一个实例中,支架衔接子或其组分可以包含一个或多个能够阻断与靶核酸(例如,ssna)中核苷酸杂交的修饰的核苷酸。在一些情况下,所述一个或多个修饰的核苷酸能够阻断与靶核酸中核苷酸的连接。在一些实施方案中,支架多核苷酸的一个或两个末端包括阻断修饰和/或寡核苷酸组分的不与ssna片段相邻的末端可以包括阻断修饰。阻断修饰是指不能使用用于共价连接寡核苷酸组分和ssna片段的相邻末端的方法,来与另一核酸组分的末端连接的修饰的末端。在某些实施方案中,阻断修饰是连接阻断修饰。可以包括在支架多核苷酸的一个或两个不与ssna相邻的末端和/或寡核苷酸组分不与ssna相邻的末端的阻断修饰的实例包括不存在3′oh和不可接近的3′oh。末端具有不可接近的3′oh的阻断修饰的非限制性实例包括:氨基修饰剂、氨基接头、间隔子(spacer)、异脱氧碱基、双脱氧碱基、反向双脱氧碱基、3′磷酸酯等。在一些实施方案中,支架衔接子或其组分包含一个或多个不能与天然核苷酸结合的修饰的核苷酸。[0146]在一些实施方案中,一个或多个修饰的核苷酸包含异脱氧碱基。在一些实施方案中,一个或多个修饰的核苷酸包含异脱氧鸟嘌呤(iso-dg)。在一些实施方案中,一个或多个修饰的核苷酸包含异脱氧-胞嘧啶(iso-dc)。iso-dc和iso-dg分别是胞嘧啶和鸟嘌呤的化学变体。iso-dc可以与iso-dg形成氢键,但不能与未修饰的鸟嘌呤(天然鸟嘌呤)形成氢键。iso-dg可以与iso-dc碱基配对,但不能与未修饰的胞嘧啶(天然胞嘧啶)碱基配对。可以设计含有iso-dc的支架衔接子或其组分,使得其与含有iso-dg的互补寡核苷酸杂交,但不能与任何天然存在的核酸序列杂交。[0147]在一些实施方案中,一个或多个修饰的核苷酸包含表观遗传相关修饰,包括但不限于甲基化、羟甲基化和羧化。表观遗传相关修饰的实例包括羧基胞嘧啶、5-甲基胞嘧啶(5mc)及其氧化衍生物(例如,5-羟甲基胞嘧啶(5hmc)、5-甲酰基胞嘧啶(5fc)和5-羧基胞嘧啶(5cac))、n(6)-甲基腺嘌呤(6ma)、n4-甲基胞嘧啶(4mc)、n(6)-甲基腺苷(m(6)a)、假尿苷(ψ)、5-甲基胞苷(m(5)c)、羟甲基尿嘧啶、3′末端的2′‑o-甲基化、trna修饰、mirna修饰和snrna修饰。[0148]在一些实施方案中,一个或多个修饰的核苷酸包含双脱氧碱基。在一些实施方案中,一个或多个修饰的核苷酸包含双脱氧胞嘧啶。在一些实施方案中,一个或多个修饰的核苷酸包含反向双脱氧碱基。在一些实施方案中,一个或多个修饰的核苷酸包含反向双脱氧胸腺嘧啶。例如,位于序列5′末端的反向双脱氧胸腺嘧啶可以防止不需要的5′连接。[0149]在一些实施方案中,一个或多个修饰的核苷酸包含间隔子。在一些实施方案中,一个或多个修饰的核苷酸包含c3间隔子。c3间隔子亚磷酰胺可以在内部被掺入或在寡核苷酸的5′末端被掺入。可以在支架衔接子或其组分的任一末端添加多重c3间隔子,以引入长的亲水间隔臂(例如,用于连接荧光团或其他侧基)。其他间隔子包括例如可光切割(pc)间隔子、己二醇、间隔子9、间隔子18、1′,2′‑双脱氧核糖(dspacer)等。[0150]在一些实施方案中,修饰的核苷酸包含氨基接头或氨基阻断剂。在一些实施方案中,修饰的核苷酸包含氨基接头c6(例如,5′氨基接头c6或3′氨基接头c6)。在一个实例中,氨基接头c6可用于将活性伯氨基掺入到寡核苷酸的5′‑末端。然后可以将其与配体缀合。然后该氨基成为5′端配体的内部的。氨基通过6碳间隔臂与5′‑末端核苷酸碱基分开,以减少氨基与寡核苷酸之间的空间相互作用。在一些实施方案中,修饰的核苷酸包含氨基接头c12(例如,5′氨基接头c12或3′氨基接头c12)。在一个实例中,氨基接头c12可用于将活性伯氨基掺入到寡核苷酸的5′‑末端。该氨基通过12个碳的间隔臂与5′‑末端核苷酸碱基分开,以使氨基与寡核苷酸之间的空间相互作用最小化。[0151]在一些实施方案中,修饰的核苷酸包含结合对的成员。结合对可以包括例如抗体/抗原、抗体/抗体、抗体/抗体片段、抗体/抗体受体、抗体/蛋白a或蛋白g、半抗原/抗半抗原、生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、叶酸/叶酸结合蛋白、维生素b12/内因子、化学反应基团/互补化学反应基团、地高辛部分/抗地高辛抗体、荧光素部分/抗荧光素抗体、类固醇/类固醇结合蛋白、操纵物(operator)/阻遏物、核酸酶/核苷酸、凝集素/多糖、活性化合物/活性化合物受体、激素/激素受体、酶/底物、寡核苷酸或多核苷酸/其相应的互补物等或其组合。在一些实施方案中,修饰的核苷酸包含生物素。[0152]在一些实施方案中,修饰的核苷酸包含结合对的第一成员(例如,生物素);并且结合对的第二个成员(例如链霉抗生物素蛋白)与固体载体或基质缀合。固体载体或基质可以是结合对成员可以直接或间接地连接的任何物理上可分离的固体,包括但不限于微阵列和孔提供的表面,以及例如珠(例如顺磁珠、磁珠、微珠、纳米珠)、微粒和纳米颗粒等颗粒。固体载体还可以包括例如芯片、柱、光纤、擦拭物(wipe)、过滤器(例如,平面过滤器)、一种或多种毛细管、玻璃和改性或功能化玻璃(例如,可控孔玻璃(cpg))、石英、云母、重氮化膜(纸或尼龙)、聚甲醛、纤维素、乙酸纤维素、纸、陶瓷、金属、准金属、半导体材料、量子点、包被的珠或颗粒、其他色谱材料、磁性颗粒;塑料(包括聚甲基丙烯酸甲酯(acrylics)、聚苯乙烯、苯乙烯或其他材料的共聚物、聚丁烯、聚氨酯、teflontm、聚乙烯、聚丙烯、聚酰胺、聚酯、聚偏二氟乙烯(pvdf)等)、多糖、尼龙或硝化纤维素、树脂、硅石或硅基材料(包括硅、硅胶和改性硅)、碳、金属(例如钢、金、银、铝、硅和铜)、无机玻璃、导电聚合物(包括聚合物,例如聚吡咯和聚吲哚);微结构表面或纳米结构表面,例如核酸平铺芯片、纳米管、纳米线或纳米微粒装饰表面;或多孔表面或凝胶,例如甲基丙烯酸酯、丙烯酰胺、糖聚合物、纤维素、硅酸盐或其他纤维状或链状聚合物。在一些实施方案中,固体载体或基质可以使用具有任意数量的材料的被动式(passive)涂层或化学衍生的涂层来涂布,包括聚合物,例如葡聚糖、丙烯酰胺、明胶或琼脂糖。珠和/或颗粒可以是自由的或彼此连接的(例如,烧结的)。在一些实施方案中,固体载体可以是颗粒的集合。在一些实施方案中,颗粒可以包含硅石,并且硅石可以包括二氧化硅。在一些实施方案中,硅石可以是多孔的,并且在某些实施方案中,硅石可以是无孔的。在一些实施方案中,颗粒进一步包含赋予颗粒顺磁性的试剂。在某些实施方案中,该试剂包含金属,并且在某些实施方案中该试剂是金属氧化物(例如,铁或氧化铁,其中氧化铁含有fe2+和fe3+的混合物)。结合对成员可以通过共价键或通过非共价相互作用连接于固体载体,并且可以直接或间接(例如,通过诸如间隔分子或生物素等中间试剂)连接于固体载体。[0153]在一些实施方案中,支架多核苷酸、寡核苷酸组分或两者包括一个或多个非天然核苷酸,也称为核苷酸类似物。可包括在支架多核苷酸、寡核苷酸组分或两者中的非天然核苷酸的非限制性实例包括lna(锁核酸)、pna(肽核酸)、fana(2′‑脱氧-2′‑氟阿糖核苷酸)、gna(乙二醇核酸)、tna(苏糖核酸)、2′‑o-merna、2′‑氟rna、吗啉代核苷酸及其任何组合。[0154]末端处理[0155]在一些实施方案中,本文的方法包括在单链核酸(ssna)分子受到末端处理的条件下,使包含单链核酸(ssna)的核酸组合物与包含末端处理活性的试剂接触,从而生成末端处理的ssna组合物。末端处理可以包括但不限于磷酸化、去磷酸化、甲基化、去甲基化、氧化、去氧化、碱基修饰、延伸、聚合及其组合。可以用酶进行末端处理,包括但不限于连接酶、多核苷酸激酶(pnk)、末端转移酶、甲基转移酶、甲基化酶(例如,3′甲基化酶、5′甲基化酶)、聚合酶(例如,polya聚合酶(聚a聚合酶))、氧化酶及其组合。[0156]在一些实施方案中,本文的方法包括在单链核酸(ssna)分子去磷酸化的条件下,使包含单链核酸(ssna)的核酸组合物与包含磷酸酶活性的试剂接触,从而生成去磷酸化的ssna组合物。在一些实施方案中,本文的方法包括在支架衔接子或其组分去磷酸化的条件下,使支架衔接子或其组分与包含磷酸酶活性的试剂接触,从而生成去磷酸化的支架衔接子或其组分(例如,去磷酸化的寡核苷酸;去磷酸化的支架多核苷酸)。通常,在组合步骤之前(即在杂交之前),使ssna组合物和/或支架衔接子或其组分去磷酸化。ssna可以在组合步骤之前(即,在杂交之前)去磷酸化,然后随后磷酸化。支架衔接子或其组分可以在组合步骤之前(即,在杂交之前)去磷酸化,然后随后磷酸化。支架衔接子或其组分可以在组合步骤之前(即,在杂交之前)去磷酸化,然后不磷酸化。支架衔接子或其组分可以在组合步骤之前(即,在杂交之前)去磷酸化,不磷酸化,然后在组合步骤之后(即,在杂交之后)并且在连接步骤之前或期间磷酸化。用于使核酸去磷酸化的试剂和试剂盒是已知且是可获得的。例如,可以用磷酸酶(即,使用水将磷酸单酯切割成磷酸根离子和醇的酶)处理靶核酸(例如,ssna)和/或支架衔接子或其组分。[0157]在一些实施方案中,本文的方法包括在将5′磷酸酯添加到ssnas的5′末端的条件下,使包含单链核酸(ssna)的核酸组合物与包含磷酰基转移活性的试剂接触。在一些实施方案中,本文的方法包括在将5′磷酸酯添加到ssna的5′末端的条件下,使去磷酸化的ssna组合物与包含磷酰基转移活性的试剂接触。在一些实施方案中,本文的方法包括在将5′磷酸酯添加到支架衔接子或其组分的5′末端的条件下,使支架衔接子或其组分与包含磷酰基转移活性的试剂接触。在一些实施方案中,本文的方法包括在将5′磷酸酯添加到支架衔接子或其组分的5′末端的条件下,使去磷酸化的支架衔接子或其组分与包含磷酰基转移活性的试剂接触。在某些情况下,ssna组合物和/或支架衔接子或其组分在组合步骤之前(即,在杂交之前)磷酸化。可以通过多种技术进行核酸的5′磷酸化。例如可以用多核苷酸激酶(pnk)(例如t4pnk)处理ssna组合物和/或支架衔接子或其组分,多核苷酸激酶催化pi从atp的γ位置转移和交换到多核苷酸(双链和单链dna和rna)和核苷3′‑单磷酸的5′羟基末端。合适的反应条件包括,例如,将核酸与pnk在1xpnk反应缓冲液(例如,70mmtris-hcl、10mmmgcl2、5mmdtt,ph7.6@25℃)中在37℃下孵育30分钟;将核酸与pnk在t4dna连接酶缓冲液(例如,50mmtris-hcl、10mmmgcl2、1mmatp、10mmdtt,ph7.5@25℃)中在37℃下孵育30分钟。任选地,在磷酸化反应之后,pnk可以被热灭活,例如在65℃下20分钟。[0158]在一些实施方案中,本文的方法不包括使用包含磷酰基转移活性的试剂。在一些实施方案中,方法不包括通过磷酸化来自核酸样品的ssna的5′末端来产生5′磷酸化的ssna。在某些情况下,核酸样品包含具有天然磷酸化的5′末端的ssna。在一些实施方案中,方法不包括通过磷酸化支架衔接子或其组分的5′末端来产生5′磷酸化支架衔接子或其组分。[0159]切割[0160]在一些实施方案中,在本文所述的方法之前、期间或之后切割或剪切ssna、支架衔接子和/或杂交产物(例如,与ssna杂交的支架衔接子)。在一些实施方案中,在切割位点切割或剪切ssna、支架衔接子和/或杂交产物。在一些实施方案中,在发夹环内的切割位点切割或剪切支架衔接子和/或杂交产物。在一些实施方案中,在支架衔接子内部位置(例如,在支架衔接子的双链体区内)的切割位点,切割或剪切支架衔接子和/或杂交产物。在一些实施方案中,在仅存在于支架多核苷酸而非互补寡核苷酸组分上的内部位置处的切割位点(例如,尿嘧啶),切割支架衔接子。因此,在一些实施方案中,支架多核苷酸包含一个或多个尿嘧啶碱基,并且寡核苷酸组分不包含尿嘧啶碱基。在一些实施方案中,在本文所述的方法之前、期间或之后切割或剪切环状杂交产物。在一些实施方案中,在本文所述的方法之前、期间或之后切割或剪切核酸,例如细胞核酸和/或大片段(例如,长度大于500个碱基对)。大片段可以称为高分子量(hmw)核酸、hmwdna或hmwrna。hmw核酸片段可以包括大于约500bp、约600bp、约700bp、约800bp、约900bp、约1000bp、约2000bp、约3000bp、约4000bp、约5000bp、约10,000bp或更多的片段。术语“剪切”或“切割”通常是指核酸分子可以被断裂成两个(或更多)较小核酸分子的程序或状态。这种剪切或切割可以是序列特异性的、碱基特异性的或非特异性的,并且可以通过多种方法、试剂或条件中的任何一种来完成,包括例如化学、酶促和物理(例如,物理片断化)的方法、试剂或条件。剪切或切割的核酸的标称、平均(average)或均值(mean)长度可以为约5至约10,000个碱基对、约100至约1,000个碱基对、约100至约500个碱基对或约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000或9000个碱基对。[0161]剪切或切割的核酸可以通过合适的方法生成,其非限制性实例包括物理方法(例如剪切,例如声处理、超声处理、弗氏压碎器(frenchpress)、热、uv照射等)、酶促方法(例如,酶促切割剂(例如合适的核酸酶、合适的限制酶)、化学方法(例如烷基化、dms、哌啶、酸水解、碱水解、热等,或其组合)、紫外(uv)光(例如,在可光切割位点(例如,包含可光切割间隔子)等,或其组合。所得核酸片段的平均、均值或标称长度可以通过选择合适的片段生成方法来控制。[0162]术语“切割剂”通常是指可以在一个或多个特异性或非特异性位点切割核酸的试剂,有时是化学品或酶。特异性切割剂通常根据具体位点处的具体核苷酸序列特异性切割,该位点可称为切割位点。切割剂可包括酶促切割剂、化学切割剂和光(例如,紫外(uv)光)。[0163]酶促切割剂的实例包括但不限于内切核酸酶;脱氧核糖核酸酶(dna酶;例如,dna酶i、ii);核糖核酸酶(rna酶;例如,rna酶a、rna酶e、rna酶f、rna酶h、rna酶iii、rna酶l、rna酶p、rna酶phym、rna酶t1、rna酶t2、rna酶u2和rna酶v);内切核酸酶viii;cleavse酶;taqdna聚合酶;e.colidna聚合酶i;真核结构特异性内切核酸酶;鼠fen-1内切核酸酶;切口酶;i、ii或iii型限制性内切核酸酶(即限制酶),例如acci、acii、afliii、alui、alw44i、apai、asni、avai、avaii、bamhi、banii、bcli、bgli、bglii、blni、bsmi、bsshii、bsteii、bstui、cfoi、ciai、ddei、dpni、drai、ecixi、ecori、ecori、ecorii、ecorv、haeii、haeii、hhai、hindii、hindiii、hpai、hpaii、kpni、kspi、maeii、mcrbc、mlui、miuni、mspi、ncii、ncoi、ndei、ndeii、nhei、noti、nrui、nsii、psti、pvui、pvuii、rsai、saci、sali、sau3ai、scai、scrfi、sfii、smai、spei、sphi、sspi、stui、styi、swai、taqi、xbai、xhoi;糖苷酶(例如,尿嘧啶-dna糖苷酶(udg)、3-甲基腺嘌呤dna糖苷酶、3-甲基腺嘌呤dna糖苷酶ii、嘧啶水合物-dna糖苷酶、fapy-dna糖苷酶、胸腺嘧啶错配-dna糖苷酶(例如,次黄嘌呤-dna糖苷酶、尿嘧啶dna糖苷酶(udg)、5-羟甲基尿嘧啶dna糖苷酶(hmudg)、5-羟甲基胞嘧啶dna糖苷酶或1,n6-亚乙烯基(etheno)-腺嘌呤dna糖苷酶);外切核酸酶(例如外切核酸酶i、外切核酸酶ii、外切核酸酶iii、外切核酸酶iv、外切核酸酶v、核酸外切酶vi、核酸外切酶vii、核酸外切酶viii);5′到3′外切核酸酶(例如外切核酸酶ii);3′到5′外切核酸酶(例如外切核酸酶i);poly(a)特异性3′到5′外切核酸酶;核酶;脱氧核酶(dnazyme)等;及其组合。[0164]在一些实施方案中,切割位点包含限制酶识别位点。在一些实施方案中,切割剂包含限制酶。在一些实施方案中,切割位点包含稀切限制酶识别位点(例如,noti识别序列)。在一些实施方案中,切割剂包含稀切酶(例如稀切限制酶)。稀切酶通常是指具有在基因组(例如人类基因组)中仅稀有出现的识别序列的限制酶。实例是noti,它在5′‑gcggccgc-3′序列的第一个gc之后进行切割。具有七个和八个碱基对识别序列的限制酶通常视为稀切酶。[0165]选择用于在具体位点切割dna的限制酶的切割方法和程序是技术人员公知的。例如,许多限制酶供应商提供了有关被具体限制酶切割的dna序列的条件和类型的信息,包括newenglandbiolabs、pro-megabiochems、boehringer-mannheim等。[0166]通常在能够以约95%-100%的效率、优选以约98%-100%的效率切割dna的条件下使用酶。[0167]在一些实施方案中,切割位点包含一个或多个核糖核酸(rna)核苷酸。在一些实施方案中,切割位点包含含一个或多个rna核苷酸的单链部分。在一些实施方案中,单链部分的侧翼是双链体部分。在一些实施方案中,单链部分是发夹环。在一些实施方案中,切割位点包含一个rna核苷酸。在一些实施方案中,切割位点包含两个rna核苷酸。在一些实施方案中,切割位点包含三个rna核苷酸。在一些实施方案中,切割位点包含四个rna核苷酸。在一些实施方案中,切割位点包含五个rna核苷酸。在一些实施方案中,切割位点包含多于五个rna核苷酸。在一些实施方案中,切割位点包含一个或多个选自腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)和尿嘧啶(u)的rna核苷酸。在一些实施方案中,切割位点包含一个或多个选自腺嘌呤(a)、胞嘧啶(c)和鸟嘌呤(g)的rna核苷酸。在一些实施方案中,切割位点不包含尿嘧啶(u)。在一些实施方案中,切割位点包含一个或多个包含鸟嘌呤(g)的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由鸟嘌呤(g)组成的rna核苷酸。在一些实施方案中,切割位点包含一个或多个包含胞嘧啶(c)的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由胞嘧啶(c)组成的rna核苷酸。在一些实施方案中,切割位点包含一个或多个包含腺嘌呤(a)的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由腺嘌呤(a)组成的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由腺嘌呤(a)、胞嘧啶(c)和鸟嘌呤(g)组成的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由腺嘌呤(a)和胞嘧啶(c)组成的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由腺嘌呤(a)和鸟嘌呤(g)组成的rna核苷酸。在一些实施方案中,切割位点包含一个或多个由胞嘧啶(c)和鸟嘌呤(g)组成的rna核苷酸。在一些实施方案中,切割剂包含核糖核酸酶(rna酶)。在一些实施方案中,rna酶是内切核糖核酸酶。rna酶可以选自rna酶a、rnas酶e、rna酶f、rna酶h、rna酶iii、rna酶l、rna酶p、rna酶phym、rna酶t1、rna酶t2、rna酶u2和rna酶v中的一种或多种。[0168]在一些实施方案中,切割位点包含可光切割间隔子或可光切割修饰。可光切割修饰可以含有,例如,可被具体波长(例如300-350nm)的紫外(uv)光切割的光不稳定官能团。示例性可光切割间隔子(可从integrateddnatechnologies获得;产品编号1707)是只有暴露于适当光谱范围内的紫外光下时才能被切割的10原子连接臂。包含可光切割间隔子的寡核苷酸可以具有可用于后续连接酶反应的5′磷酸基团。可以将可光切割的间隔子放置在dna碱基之间或寡核苷酸与末端修饰(例如,荧光团)之间。在这样的实施方案中,紫外(uv)光可以视为切割剂。[0169]在一些实施方案中,切割位点包含二醇。例如,切割位点可包含以5′至5′连接加入的邻二醇。包含二醇的切割位点可以被化学切割,例如,使用高碘酸盐。在一些实施方案中,切割位点包含平末端限制酶识别位点。包含平末端限制酶识别位点的切割位点可以被平末端限制酶切割。[0170]切口密封和填补[0171]在一些实施方案中,本文中的方法包括进行切口密封反应(例如,使用dna连接酶或其他合适的酶,并且在某些情况下,使用适用于5′磷酸化核酸的激酶(例如,多核苷酸激酶(pnk))。在一些实施方案中,本文的方法包括进行填补反应。例如,当支架衔接子作为双链体存在时,一些或所有双链体可以在双链体的末端包括突出端,该末端与ssna所杂交的末端相对。当存在这种双链体突出端时,在组合之后,本文的方法还可以包括填补由双链体形成的突出端。在一些实施方案中,进行填补反应以生成平末端杂交产物。可以使用任何合适的试剂进行填补反应。适合进行填补反应的聚合酶包括,例如dna聚合酶i、大(klenow)片段、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)(bst)dna聚合酶等。在一些实施方案中,使用链置换聚合酶(例如,bstdna聚合酶)。[0172]外切核酸酶处理[0173]在一些实施方案中,用外切核酸酶处理核酸(例如,rna-dna双链体、杂交产物、环化杂交产物)。在一些实施方案中,用外切核酸酶处理rna-dna双链体(例如,通过第一链cdna合成生成的rna-dna双链体)中的rna。外切核酸酶是通过断裂3′或5′末端的磷酸二酯键的水解反应从多核苷酸链的末端一次切割一个核苷酸的酶。外切核酸酶包括例如dna酶、rna酶(例如rna酶h)、5′到3′外切核酸酶(例如外切核酸酶ii)、3′到5′外切核酸酶(例如外切核酸酶i)和poly(a)特异性3′到5′外切核酸酶。在一些实施方案中,外切核酸酶活性由逆转录酶提供(例如,由具有全功能rna酶h结构域的m-mlv逆转录酶提供的rna酶活性)。在一些实施方案中,用外切核酸酶处理杂交产物以去除污染核酸,例如来自rna-dna双链体的单链寡核苷酸、核酸片段或rna。在一些实施方案中,用外切核酸酶处理环化杂交产物以去除任何非环化杂交产物、非杂交寡核苷酸、非杂交靶核酸、寡核苷酸二聚体等及其组合。[0174]样品[0175]本文提供了用于处理和/或分析核酸的方法和组合物。在本文所述方法和组合物中使用的核酸或核酸混合物可以从获得自个体(例如,测试个体)的样品中分离。个体可以是任何有生命的或无生命的生物体,包括但不限于人类、非人类动物、植物、细菌、真菌、原生生物或病原体。可以选择任何人类或非人类动物,并且人类或非人类动物可以包括例如哺乳动物、爬行动物、鸟类、两栖动物、鱼、有蹄类动物、反刍动物、牛科动物(例如牛)、马科动物(例如马)、山羊类(caprine)和绵羊类(ovine)(例如绵羊(sheep)、山羊(goat))、猪(swine)(例如猪(pig))、骆驼科动物(例如骆驼、美洲驼、羊驼)、猴子、猿(例如大猩猩、黑猩猩)、熊科动物(例如熊)、家禽、狗、猫、小鼠、大鼠、鱼、海豚、鲸鱼和鲨鱼。个体可以是雄性或雌性(例如,女性、孕妇)。个体可以是任何年龄(例如,胚胎、胎儿、婴儿、儿童、成人)。个体可以是癌症患者、怀疑患有癌症的患者、缓解期的患者、具有癌症家族史的患者和/或获得癌症筛查的个体。个体可以是患有感染或传染病或被病原体(例如,细菌、病毒、真菌、原生动物等)感染的患者,疑似患有感染或传染病或被病原体感染的患者,从感染、传染病或病原体感染中恢复的患者,具有感染、传染病、病原体感染病史的患者,和/或获得传染病或病原体筛查的个体。个体可以是移植受体。个体可以是接受微生物组分析的患者。在一些实施方案中,测试个体是雌性。在一些实施方案中,测试个体是人类女性。在一些实施方案中,测试个体是雄性。在一些实施方案中,测试个体是人类男性。[0176]可以从任何类型的合适的生物样本或样品(例如,测试样品)分离或获得核酸样品。可以从单个细胞、多个细胞(例如培养的细胞)、细胞培养基、条件培养基、组织、器官或生物体(例如细菌、酵母等)分离或获得核酸样品。在一些实施方案中,从动物(例如,动物个体)的细胞、组织、器官和/或类似物分离或获得核酸样品。在一些实施方案中,从诸如细菌、酵母、昆虫(例如果蝇)、哺乳动物、两栖动物(例如青蛙(例如非洲爪蟾))、病毒、植物或任何其他哺乳动物或非哺乳动物核酸样品源等来源,分离或获得核酸样品。[0177]可以从现存的生物体或动物分离或获得核酸样品。在一些情况下,可以从已灭绝的(或“古代”)生物体或动物(例如,已灭绝的哺乳动物、来自人属(homo)的已灭绝哺乳动物)分离或获得核酸样品。在一些情况下,可以获得作为诊断分析的一部分的核酸样品。[0178]在一些情况下,可以获得作为法医分析的一部分的核酸样品。在一些实施方案中,将本文所述的单链核酸文库制备(ssprep)方法应用于法医样品或标本。法医样品或标本可以包括任何含有核酸的生物物质。例如,法医样品或标本可包括血液、精液、毛发、皮肤、汗液、唾液、分解的组织、骨头、指甲刮屑、舔过的邮票/信封、脱落物(sluff)、接触dna、剃刀残留物等。[0179]样品或测试样品可以是从个体或其部分(例如,人类个体、妊娠雌性、癌症患者、患有感染或传染病的患者、移植受体、胎儿、肿瘤、受感染的器官或组织、移植的器官或组织、微生物组)分离或获得的任何样本。样品有时来自在任何妊娠阶段怀有胎儿的妊娠雌性个体(例如,人类个体的第一个、第二个或第三个三个月),有时来自分娩后的个体。样品有时来自怀有所有染色体为整倍体的胎儿的妊娠个体,有时来自怀有具有染色体非整倍性(例如,一倍、三倍(即,三体(例如,t21、t18、t13)),或四倍染色体)或其他遗传变异的胎儿的妊娠个体。样本的非限制性实例包括来自个体的液体或组织,包括但不限于血液或血液制品(例如血清、血浆等)、脐带血、绒毛膜绒毛、羊水、脑脊髓液、脊髓液、灌洗液(例如支气管肺泡、胃、腹膜、导管、耳、关节镜)、活检样品(例如,来自植入前胚胎、癌症活检)、腹腔穿刺样品、细胞(血细胞、胎盘细胞、胚胎细胞或胎儿细胞)、胎儿有核细胞或胎儿细胞残余物、正常细胞、异常细胞(例如癌细胞))或其部分(例如线粒体、细胞核、提取物等)、女性生殖道冲洗液、尿液、粪便、痰液,唾液、鼻粘液、前列腺液、灌洗液、精液、淋巴液、胆汁、眼泪、汗液、母乳、乳房液等或其组合。在一些实施方案中,生物样品是来自个体的宫颈拭子。从中提取核酸的液体样品或组织样品可以是无细胞的(例如,不含细胞)。在一些实施方案中,液体样品或组织样品可以含有细胞成分或细胞残余物。在一些实施方案中,样品可以包括胎儿细胞或癌细胞。[0180]样品可以是液体样品。液体样品可以包含细胞外核酸(例如,循环无细胞dna)。液体样品的实例包括但不限于血液或血液制品(例如血清、血浆等)、尿液、脑脊髓液、唾液、痰液、活检样品(例如,用于检测癌症的液体活检)、上述液体样品、类似物或其组合。在某些实施方案中,样品是液体活检,其通常是指对来自个体的液体样品关于疾病(例如,癌症)的存在、不存在、进展或缓解的评估。液体活检可与出售的活检(例如,肿瘤活检)结合使用或用作其替代品。在某些情况下,在液体活检中分析细胞外核酸。[0181]在一些实施方案中,生物样品可以是血液、血浆或血清。术语“血液”涵盖全血、血液制品或血液的任何组分,例如血清、血浆、血沉棕黄层或常规定义的类似物。血液或其组分通常包含核小体。核小体包含核酸并且有时是无细胞的或细胞内的。血液还包含血沉棕黄层。有时通过使用ficoll(聚蔗糖)梯度来分离血沉棕黄层。血沉棕黄层可以包含白细胞(例如,白细胞、t细胞、b细胞、血小板等)。血浆是指对用抗凝剂处理过的血液进行离心而得到的全血的组分。血清是指血液样本凝固后剩余的液体的含水部分。通常根据医院或诊所通常遵循的标准方案收集液体或组织样品。对于血液,通常收集适量的外周血(例如,3-40毫升、5-50毫升),并且可以在制备之前或之后按照标准程序加以储存。[0182]可以使用例如全血、血清或血浆对个体血液中发现的核酸进行分析。例如,可以使用例如全血、血清或血浆进行对在母体血中发现的胎儿dna进行分析。例如,可以使用例如全血、血清或血浆对患者血液中发现的肿瘤或癌症dna进行分析。例如,可以使用例如全血、血清或血浆对患者血液中发现的病原体dna进行分析。例如,可以使用例如全血、血清或血浆对移植受体血液中发现的移植dna进行分析。从获自个体(例如,母体个体、患者、癌症患者)的血液制备血清或血浆的方法是已知的。例如,可以将个体的血液(例如,妊娠妇女的血液、患者的血液、癌症患者的血液)置于含有edta或专门的商业产品例如无细胞dnabct(streck,omaha,ne)或vacutainersst(bectondickinson,franklinlakes,n.j.)的管中,以防止血液凝固,然后可以通过离心从全血获得血浆。血液凝固后可以通过或不通过离心获得血清。如果使用离心,则它通常但不排除性地以适当的速度进行,例如1,500-3,000倍g。血浆或血清在转移到用于核酸提取的新试管之前可能需要进行额外的离心步骤。除了全血的无细胞部分之外,还可以从在血沉棕黄层部分中富集的细胞级分回收核酸,所述血沉棕黄层部分可以在将来自个体的全血样品离心并去除血浆之后获得。[0183]样品可以是肿瘤核酸样品(即从肿瘤分离的核酸样品)。术语“肿瘤”通常是指肿瘤细胞的生长和增殖,无论是恶性的还是良性的,并且可以包括癌前和癌性细胞和组织。术语“癌症”和“癌性”通常是指哺乳动物的生理状况,其典型特征是细胞生长/增殖不受调节。癌症的实例包括但不限于癌、淋巴瘤、母细胞瘤、肉瘤、白血病、鳞状细胞癌、小细胞肺癌、非小细胞肺癌、肺腺癌、肺鳞癌、腹膜癌、肝细胞癌、胃肠癌、胰腺癌、胶质母细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝癌、乳腺癌、结肠癌、结直肠癌、子宫内膜癌或子宫癌、唾液腺癌、肾癌、肝癌、前列腺癌、外阴癌、甲状腺癌、肝癌、各类头颈癌等。[0184]样品可以是异质的。例如,样品可以包括多于一种细胞类型和/或一种或多种核酸种类。在一些情况下,样品可以包括(i)胎儿细胞和母体细胞,(ii)癌细胞和非癌细胞,和/或(iii)病原细胞和宿主细胞。在一些情况下,样品可以包括(i)癌症和非癌症核酸,(ii)病原体和宿主核酸,(iii)胎儿来源和母体来源的核酸,和/或更一般地,(iv)突变和野生型核酸。在一些情况下,样品可以包括少数核酸种类和多数核酸种类,如下文进一步详细描述的。在一些情况下,样品可以包括来自单个个体的细胞和/或核酸,或可以包括来自多个个体的细胞和/或核酸。[0185]核酸[0186]本文提供了用于处理和/或分析核酸的方法和组合物。术语核酸、核酸分子、核酸片段、靶核酸、核酸模板、模板核酸、核酸靶标、靶核酸、多核苷酸、多核苷酸片段、靶多核苷酸、多核苷酸靶标等可以在整个公开中互换使用。这些术语是指任何组成形式的核酸,例如dna(例如,互补dna(cdna;由任何感兴趣的rna或dna合成)、基因组dna(gdna)、基因组dna片段、线粒体dna(mtdna)、重组dna(例如,质粒dna)等)、rna(例如,信使rna(mrna)、抑制性短rna(sirna)、核糖体rna(rrna)、转运rna(trna)、微rna、反式作用小干扰rna(ta-sirna)、天然小干扰rna(nat-sirna)、小核仁rna(snorna)、小核rna(snrna)、长链非编码rna(lncrna)、非编码rna(ncrna)、转运-信使rna(tmrna)、前体信使rna(pre-mrna)、小卡哈尔体特异性rna(scarna)、piwi相互作用rna(pirna)、内切核糖核酸酶制备的sirna(esirna)、小时序rna(smalltemporalrna,strna)、信号识别rna、端粒rna、由胎儿或胎盘等高度表达的rna等),和/或dna或rna类似物(例如,含有碱基类似物、糖类似物和/或非天然主链等)、rna/dna杂交体和聚酰胺核酸(pna),所有这些都可以是单链或双链形式,并且除非另有限制,否则可以包括天然核苷酸的已知类似物,其能够以与天然存在的核苷酸类似的方式起作用。在某些实施方案中,核酸可以是或可以来自质粒、噬菌体、病毒、细菌、自主复制序列(ars)、线粒体、着丝粒、人工染色体、染色体或能够在体外或在宿主细胞、细胞、细胞的细胞核或细胞质内复制或被复制的其他核酸。在一些实施方案中,模板核酸可以来自单个染色体(例如,核酸样品可以来自从二倍体生物体获得的样品的一个染色体)。除非特别限制,否则该术语包括含有天然核苷酸的已知类似物的核酸,该类似物具有与参考核酸相似的结合特性并且以类似于天然存在的核苷酸的方式代谢。除非另有说明,否则具体核酸序列还隐含地包括其保守修饰变体(例如,简并密码子置换)、等位基因、直向同源物、单核苷酸多态性(snp)和互补序列以及明确指出的序列。具体而言,简并密码子置换可以通过生成序列来实现,在该序列中,一个或多个选择的(或所有)密码子的第三个位置被混合碱基和/或脱氧肌苷残基取代。术语核酸可与基因座、基因、cdna和基因编码的mrna互换使用。该术语还可以包括由核苷酸类似物、单链(“有义”或“反义”、“正”链或“负”链、“正向”阅读框或“反向”阅读框)和双链多核苷酸合成的rna或dna的等同物、衍生物、变体和类似物。术语“基因”是指参与产生多肽链的dna片段;并且通常包括编码区之前和之后参与基因产物的转录/翻译和转录/翻译的调节的区域(前导序列和尾随序列(trailer)),以及各个编码区(外显子)之间的插入序列(内含子)。核苷酸或碱基通常是指核酸的嘌呤和嘧啶分子单位(例如腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)和胞嘧啶(c))。对于rna,碱基胸腺嘧啶被尿嘧啶代替。核酸的长度或大小可以表示为碱基数。[0187]靶核酸可以是任何感兴趣的核酸。核酸可以是由脱氧核糖核苷酸(即dna碱基)、核糖核苷酸(即rna碱基)或其组合组成的任何长度的聚合物,例如10个碱基或更长、20个碱基或更长、50个碱基或更长、100个碱基或更长、200个碱基或更长、300个碱基或更长、400个碱基或更长、500个碱基或更长、1000个碱基或更长、2000个碱基或更长、3000个碱基或更长、4000个碱基或更长、5000个碱基或更长。在某些方面,核酸是由脱氧核糖核苷酸(即,dna碱基)、核糖核苷酸(即,rna碱基)或其组合组成的聚合物,例如,10个碱基或更少、20个碱基或更少、50个碱基或更少、100个碱基或更少、200个碱基或更少、300个碱基或更少、400个碱基或更少、500个碱基或更少、1000个碱基或更少、2000个碱基或更少、3000个碱基或更少、4000个碱基或更少或5000个碱基或更少。[0188]核酸可以是单链或双链的。例如,可以通过加热或用碱处理使双链dna变性来生成单链dna(ssdna)。因此,在一些实施方案中,ssdna源自双链dna(dsdna)。在一些实施方案中,本文的方法包括在将包含dsdna的核酸组合物与本文的支架衔接子或其组分组合之前,使dsdna变性,从而生成ssdna。[0189]在某些实施方案中,核酸呈d-环结构,该结构是由寡核苷酸或dna样分子例如肽核酸(pna)对双链体dna分子的链侵入形成的。可以通过添加e.colireca蛋白和/或通过改变盐浓度,例如,使用本领域已知的方法,来促进d环的形成。[0190]核酸(例如,核酸靶标、单链核酸(ssna)、寡核苷酸、突出端、支架多核苷酸及其杂交区(例如,ssna杂交区、寡核苷酸杂交区))在本文中可以描述为,与另一核酸互补,具有互补区,能够与另一核酸杂交,或具有杂交区。术语“互补”或“互补性”或“杂交”通常是指通过非共价键与核酸区(例如,与ssna片段的末端区杂交的ssna杂交区域的核苷酸序列,和与支架衔接子的寡核苷酸组分杂交的寡核苷酸杂交区的核苷酸序列)碱基配对的核苷酸序列。在典型的watson-crick碱基配对中,在dna中,腺嘌呤(a)与胸腺嘧啶(t)形成碱基对,鸟嘌呤(g)与胞嘧啶(c)配对。在rna中,胸腺嘧啶(t)被尿嘧啶(u)替代。因此,a与t互补,g与c互补。在rna中,a与u互补,反之亦然。在dna-rna双链体中,a(在dna链中)与u(在rna链中)互补。在一些实施方案中,支架衔接子或其组分中的一个或多个胸腺嘧啶(t)碱基被尿嘧啶(u)替代,并且与腺嘌呤(a)互补。通常,“互补”或“互补性”或“能够杂交”是指至少部分互补的核苷酸序列。这些术语还可以包括这样的双链体,其是完全互补的,使得一条链中的每个核苷酸与另一条链中相应位置上的每个核苷酸互补或杂交。[0191]在某些情况下,核苷酸序列可以与靶标部分互补,其中并非所有核苷酸都与靶标核酸中所有相应位置上的每个核苷酸互补。例如,ssna杂交区可以与靶ssna末端区完美(即100%)互补,或者ssna杂交区可以共享某种程度的不够完美(例如,70%、75%、85%、90%、95%、99%)的互补性。在另一个实例中,寡核苷酸杂交区可以与寡核苷酸完美(即100%)互补,或者寡核苷酸杂交区可以共享某种程度的不够完美(例如,70%、75%、85%、90%、95%、99%)的互补性。[0192]两条核苷酸序列的百分比同一性可以通过出于最佳比较目的比对序列来确定(例如,可以在第一序列的序列中引入空位用于最佳比对)。然后比较相应位置处的核苷酸,并且两条序列之间的百分比同一性是序列共享的相同位置数目的函数(即,%同一性=相同位置的#/位置总#×100)。当一条序列中的位置被与另一序列中与相应位置相同的核苷酸占据时,则分子在该位置是相同的。[0193]在一些实施方案中,分析核酸混合物中的核酸。核酸混合物可以包含两个或更多个核酸种类,其具有相同或不同的核苷酸序列、不同长度、不同来源(例如,基因组来源、胎儿与母体来源、细胞或组织来源、癌症与非癌症来源、肿瘤与非肿瘤来源、宿主与病原体、宿主与移植物、宿主与微生物组、样品来源、个体来源等)、不同的突出端长度、不同的突出端类型(例如,5′突出端、3′突出端、无突出端)或其组合。在一些实施方案中,核酸混合物包含单链核酸和双链核酸。在一些实施方案中,核酸混合物包含dna和rna。在一些实施方案中,核酸混合物包含核糖体rna(rrna)和信使rna(mrna)。为本文所述方法提供的核酸可以含有来自一个样品或来自两个或更多个样品(例如来自1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多、9个或更多个、10个或更多个、11个或更多个、12个或更多个、13个或更多个、14个或更多个、15个或更多个、16个或更多个、17个或更多个、18个或更多个、19个或更多个或20个或更多个样品)的核酸。[0194]在一些实施方案中,靶核酸(例如,ssna)包含降解的dna。降解的dna可称为低质量dna或高度降解的dna。降解的dna可以是高度片段化的,并且可以包括例如经受错误编码损害和/或分子间交联的碱基类似物和无碱基位点等损伤。例如,由胞嘧啶残基脱氨基导致的测序错误可能存在于从降解dna获得的某些序列中(例如,c错误编码为t和g错误编码为a)。在一些实施方案中,靶核酸(例如,ssna)源自带切口双链核酸片段。带切口双链核酸片段可以被变性(例如,热变性)以生成ssna片段。[0195]核酸可以通过本领域已知的方法衍生自一种或多种来源(例如,生物样品、血液、细胞、血清、血浆、血沉棕黄层、尿液、淋巴液、皮肤、毛发、土壤等)。任何合适的方法都可以用于从生物样品(例如,从血液或血液制品)分离、提取和/或纯化dna,其非限制性实例包括dna制备方法(例如,描述于sambrookandrussell,molecularcloning:alaboratorymanual3ded.(分子克隆:实验室手册,第三版),2001),各种市售试剂或试剂盒,例如qiagen,inc.(germantown,md)的和(例如循环核酸试剂盒、dna小提试剂盒(minikit)或dna血液小提试剂盒)核酸分离/纯化试剂盒;genomicpreptm血液dna分离试剂盒(promega,madison,wis.);gfxtm基因组血液dna纯化试剂盒(amersham,piscataway,n.j.);lifetechnologies,inc.(carlsbad,ca)的核酸分离/纯化试剂盒;clontechlaboratories,inc.(mountainview,ca)的和该酸分离/纯化试剂盒;等或其组合。在某些方面,核酸分离自固定的生物样品,例如福尔马林固定石蜡包埋(ffpe)组织。可以使用市售试剂盒,例如qiagen,inc.(germantown,md)的dna/rnaffpe试剂盒,lifetechnologies,inc.(carlsbad,ca)的用于ffpe的全核酸分离试剂盒,以及clontechlaboratories,inc.(mountainview,ca)的ffpe试剂盒,分离ffpe组织的基因组dna。[0196]在一些实施方案中,使用细胞裂解程序从细胞中提取核酸。细胞裂解程序和试剂是本领域已知的,并且通常可以通过化学(例如,去污剂、低渗溶液、酶促程序等,或其组合)方法、物理(例如,弗氏压碎器、声处理等)方法或电解方法进行。可以使用任何合适的裂解程序。例如,化学方法通常使用裂解剂来破坏细胞并从细胞中提取核酸,然后用离液盐处理。物理方法,例如冷冻/解冻然后研磨、使用细胞压碎等,也是有用的。在一些情况下,可以使用高盐和/或碱裂解程序。在一些情况下,裂解程序可以包括使用edta/蛋白酶k的裂解步骤、使用大量盐(例如氯化胍(guhcl)、乙酸钠)和异丙醇的结合缓冲液步骤,以及将此溶液中的dna与硅基柱结合。在某些情况下,裂解方案包括以下文献中描述的某些程序:dabney等,proceedingsofthenationalacademyofsciences110,no.39(2013):15758-15763。[0197]在某些实施方案中,核酸可包括细胞外核酸。本文所用术语“细胞外核酸”可以指从基本上不含细胞的来源分离的核酸,也称为“无细胞”核酸(无细胞dna、无细胞rna或两者)、“循环无细胞核酸”(例如,ccf片段、ccfdna)和/或“无细胞循环核酸”。细胞外核酸可以存在于血液中并从血液中获得(例如,来自人类个体的血液中)。细胞外核酸通常不包括可检测的细胞并且可能含有细胞成分或细胞残余物。细胞外核酸的无细胞来源的非限制性实例是血液、血浆、血清和尿液。在某些方面,从选自全血、血浆、血清、羊水、唾液、尿液、胸腔积液、支气管灌洗液、支气管抽吸物、母乳、初乳、泪液、精液、腹膜液、胸腔积液和粪便的体液样品获得无细胞核酸。本文所用术语“获得无细胞循环样品核酸”包括直接获得样品(例如,收集样品,例如测试样品)或从已收集样品的另一人处获得样品。细胞外核酸可以是细胞分泌和/或核酸释放(例如dna释放)的产物。例如,细胞外核酸可以是任何形式的细胞死亡的产物。在一些情况下,细胞外核酸是任何形式的i型或ii型细胞死亡的产物,包括有丝分裂、胀亡、毒性、缺血等及其组合。在不受理论限制的情况下,细胞外核酸可以是细胞凋亡和细胞分解的产物,这为细胞外核酸通常具有跨幅度的一系列长度(例如“序列梯(ladder)”)提供了基础。在一些情况下,细胞外核酸是细胞坏死、坏死性凋亡、胀亡(oncosis)、侵入性死亡(entosis)、焦亡(pyrotosis)等及其组合的产物。在一些实施方案中,来自测试个体的样品核酸是循环无细胞核酸。在一些实施方案中,循环无细胞核酸来自测试个体的血浆或血清。在一些方面,无细胞核酸被降解。在一些实施方案中,无细胞核酸包含无细胞胎儿核酸(例如无细胞胎儿dna)。在某些方面,无细胞核酸包含循环癌症核酸(例如癌症dna)。在某些方面,无细胞核酸包含循环肿瘤核酸(例如肿瘤dna)。在一些实施方案中,无细胞核酸包含传染原核酸(例如病原体dna)。在一些实施方案中,无细胞核酸包括来自移植物的核酸(例如dna)。在一些实施方案中,无细胞核酸包含来自微生物组(例如肠道微生物组、血液微生物组、口腔微生物组、脊髓液微生物组、粪便微生物组)的核酸(例如dna)。[0198]无细胞dna(cfdna)可以来自降解来源,并且在提取时通常提供有限数量的dna。本文描述的用于生成单链dna(ssdna)文库的方法能够从cfdna中捕获大量的短dna片段。例如,来自癌症样品的cfdna往往含有更多的短片段群。在某些情况下,cfdna中的短片段可能富含源自转录因子而非核小体的片段。[0199]细胞外核酸可以包括不同的核酸种类,因此在本文中在某些实施方案中称为“异质的”。例如,来自患有肿瘤或癌症的人的血清或血浆可能包括来自肿瘤细胞或癌细胞(例如瘤形成)的核酸和来自非肿瘤细胞或非癌细胞的核酸。在另一个实例中,来自妊娠雌性的血清或血浆可包括母体核酸和胎儿核酸。在另一个实例中,来自患有感染或传染病的患者的血清或血浆可包括宿主核酸和传染原或病原体核酸。在另一个实例中,来自接受移植物的个体的样品可包括宿主核酸和来自供体器官或组织的核酸。在一些情况下,癌症核酸、肿瘤核酸、胎儿核酸、病原体核酸或移植物核酸有时占总核酸的约5%至约50%(例如,总核酸的约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48或49%是癌症、肿瘤、胎儿、病原体、移植物或微生物组核酸)。在另一个实例中,异质核酸可包括来自两个或更多个个体的核酸(例如,来自犯罪现场的样品)。[0200]至少两种不同的核酸种类可以以不同的量存在于细胞外核酸中,有时称为少数种类和多数种类。在某些情况下,少数种类的核酸来自受影响的细胞类型(例如,癌细胞、消耗性细胞、被免疫系统攻击的细胞)。在某些实施方案中,确定少数核酸种类的遗传变异或遗传改变(例如,拷贝数改变、拷贝数变异、单核苷酸改变、单核苷酸变异、染色体改变和/或易位)。在某些实施方案中,确定多数核酸种类的遗传变异或遗传改变。一般而言,并不意于在任何方面对术语“少数”或“多数”进行严格定义。一方面,视为“少数”的核酸的丰度,例如可以为样品中总核酸的至少约0.1%至样品中总核酸的小于50%。在一些实施方案中,少数核酸的丰度可以为样品中总核酸的至少约1%至样品中总核酸的约40%。在一些实施方案中,少数核酸的丰度可以为样品中总核酸的至少约2%至样品中总核酸的约30%。在一些实施方案中,少数核酸的丰度可以为样品中总核酸的至少约3%至样品中总核酸的约25%。例如,少数核酸的丰富可以为样品中总核酸的约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%。在一些情况下,少数种类的细胞外核酸有时占总核酸的约1%至约40%(例如,约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%或40%的核酸是少数种类的核酸)。在一些实施方案中,少数核酸是细胞外dna。在一些实施方案中,少数核酸是来自凋亡组织的细胞外dna。在一些实施方案中,少数核酸是来自其中一些细胞经历凋亡的组织的细胞外dna。在一些实施方案中,少数核酸是来自坏死组织的细胞外dna。在一些实施方案中,少数核酸是来自其中一些细胞经历坏死的组织的细胞外dna。在某些情况下,坏死可以指细胞死亡后的死后过程(post-mortemprocess)。在一些实施方案中,少数核酸是来自受细胞增殖病症(例如癌症)影响的组织的细胞外dna。在一些实施方案中,少数核酸是来自肿瘤细胞的细胞外dna。在一些实施方案中,少数核酸是细胞外胎儿dna。在一些实施方案中,少数核酸是来自病原体的细胞外dna。在一些实施方案中,少数核酸是来自移植物的细胞外dna。在一些实施方案中,少数核酸是来自微生物组的细胞外dna。[0201]在另一方面,视为“多数”的核酸,例如,其丰富可以为大于样品中总核酸的50%至样品中总核酸的约99.9%。在一些实施方案中,多数核酸的丰度可以为样品中总核酸的至少约60%至样品中总核酸的约99%。在一些实施方案中,多数核酸的丰度可以为样品中总核酸的至少约70%至样品中总核酸的约98%。在一些实施方案中,多数核酸的丰度可以为样品中总核酸的至少约75%至样品中总核酸的约97%。例如,多数核酸的丰度可以为样品中总核酸的至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施方案中,多数核酸是细胞外dna。在一些实施方案中,多数核酸是细胞外母体dna。在一些实施方案中,多数核酸是来自健康组织的dna。在一些实施方案中,多数核酸是来自非肿瘤细胞的dna。在一些实施方案中,多数核酸是来自宿主细胞的dna。[0202]在一些实施方案中,少数种类的细胞外核酸的长度为约500个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数物种核酸的长度为约500个碱基对或更少)。在一些实施方案中,少数种类的细胞外核酸的长度为约300个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数种类核酸的长度为约300个碱基对或更少)。在一些实施方案中,少数种类的细胞外核酸的长度为约250个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数种类核酸的长度为约250个碱基对或更少)。在一些实施方案中,少数种类的细胞外核酸的长度为约200个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数种类核酸的长度为约200个碱基对或更少)。在一些实施方案中,少数种类的细胞外核酸的长度为约150个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数种类核酸的长度为约150个碱基对或更少)。在一些实施方案中,少数种类的细胞外核酸的长度为约100个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数种类核酸的长度为约100个碱基对或更少)。在一些实施方案中,少数种类的细胞外核酸的长度为约50个碱基对或更少(例如,约80、85、90、91、92、93、94、95、96、97、98、99或100%的少数种类核酸的长度为约50个碱基对或更少)。[0203]可以在处理或不处理含有核酸的样品的情况下,提供用于进行本文所述方法的核酸。在一些实施方案中,在处理含有核酸的样品之后,提供用于进行本文所述方法的核酸。例如,可以从样品中提取、分离、纯化、部分纯化或扩增核酸。本文所用术语“分离的”是指将核酸从其原始环境(例如,如果核酸是天然存在的,则是自然环境,或者如果是外源表达的,则是宿主细胞)中取出,并且其因此通过人为干预(例如,“通过人之手”)自原始环境被改变。本文所用术语“分离的核酸”可以指从个体(例如人类个体)中取出的核酸。可以提供非核酸组分(例如蛋白质、脂质)的量比来源样品中存在的组分的量更少的分离的核酸。包含分离的核酸的组合物可以约50%至大于99%不含非核酸组分。包含分离的核酸的组合物可以约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%不含非核酸组分。本文所用术语“纯化的”可以指,所提供的核酸含有的非核酸组分(例如蛋白质、脂质、碳水化合物)的量少于在使核酸经受纯化程序之前存在的非核酸组分的量。包含纯化的核酸的组合物可以约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%不含其他非核酸组分。本文所用术语“纯化的”可以指,所提供的核酸含有的核酸种类少于衍生该核酸的样品来源中的核酸种类。包含纯化的核酸的组合物可以约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%不含其他核酸种类。例如,可以从包含母体核酸和胎儿核酸的混合物中纯化胎儿核酸。在某些实例中,可以从包含不同长度的核酸片段的混合物中纯化或部分纯化核酸小片段(例如,30-500bp的片段)。在某些实例中,可以从包含较大核酸片段的较大核小体复合物的混合物中纯化包含较小核酸片段的核小体。在某些实例中,可以从包含较小核酸片段的核小体中纯化包含较大核酸片段的较大核小体复合物。在某些实例中,可以从包含胎儿核酸片段和母体核酸片段的混合物中纯化或部分纯化小片段胎儿核酸(例如,30-500bp的片段)。在某些实例中,可以从包含较大母体核酸片段的较大核小体复合物的混合物中纯化包含较小胎儿核酸片段的核小体。在某些实例中,可以从包含癌细胞核酸和非癌细胞核酸的混合物中纯化癌细胞核酸。在某些实例中,可以从包含较大非癌症核酸片段的较大核小体复合物的混合物中纯化包含小片段癌细胞核酸的核小体。在一些实施方案中,在不预先处理含有核酸的样品的情况下,提供核酸用于进行本文所述的方法。例如,可以直接从样品分析核酸而无需预先提取、纯化、部分纯化和/或扩增。[0204]可以在扩增条件下扩增核酸。本文所用术语“扩增的”或“扩增”或“扩增条件”是指使样品中的靶核酸(例如ssna)或由本文方法生成的核酸产物经受这样一个过程,该过程以线性或指数方式生成具有与靶核酸(例如ssna)或其部分相同或基本上相同的核苷酸序列的扩增子核酸。在某些实施方案中,术语“扩增的”或“扩增”或“扩增条件”是指包括聚合酶链反应(pcr)的方法。在某些情况下,扩增产物可以比核酸模板序列中扩增的核苷酸区多一个或多个核苷酸(例如,除了与核酸模板基因分子互补的核苷酸之外,引物还可能含有“额外的”核苷酸,例如转录起始序列,导致扩增的产物含有“额外的”核苷酸或与核酸模板基因分子的扩增的核苷酸区不对应的核苷酸)。[0205]在为本文所述的方法提供核酸之前,也可以将核酸暴露于修饰核酸中某些核苷酸的过程。例如,可以将基于核苷酸甲基化状态选择性修饰核酸的过程应用于核酸。此外,高温、紫外辐射、x射线等条件可以诱导核酸分子序列发生变化。可以以用于进行序列分析的任何合适的形式提供核酸。[0206]在一些实施方案中,在与本文的支架衔接子或其组分组合之前,靶核酸(例如ssna)未受到修饰。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,靶核酸(例如ssna)在长度上未受到修饰。在此上下文中,“未受到修饰”是指从样品中分离靶核酸,然后与支架衔接子或其组分组合,而不修饰靶核酸的长度或组成。例如,靶核酸(例如ssna)可以不缩短(例如不使它们与限制酶或核酸酶或减少长度的物理条件(例如剪切条件、切割条件)接触),并且可以不使其长度增加一个或多个核苷酸(例如,未在突出端填补末端;未向末端添加核苷酸)。向靶核酸(例如ssna)的一个末端或两个末端添加磷酸酯或化学反应基团,通常不视为是修饰核酸或修饰核酸的长度。使双链核酸(dsna)片段变性以生成ssna片段通常不视为是修饰核酸或修饰核酸的长度。[0207]在一些实施方案中,当将ssna与本文的支架衔接子或其组分组合时,存在靶核酸(例如ssna)的一个或两个天然末端。天然末端通常是指核酸片段的未修饰末端。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,靶核酸(例如ssna)的天然末端在长度上未受到修饰。在该上下文中,“未受到修饰”是指从样品中分离靶核酸,然后与支架衔接子或其组分组合,而不修饰靶核酸天然末端的长度。例如,靶核酸(例如ssnas)可以不缩短(例如不使它们与限制酶或核酸酶或减少长度以生成非天然末端的物理条件(例如剪切条件、切割条件)接触),并且不使其长度增加一个或多个核苷酸(例如,未在突出端处填补天然末端;未向天然末端添加核苷酸)。向靶核酸的一个或两个天然末端添加磷酸酯或化学反应基团,通常不视为是修饰核酸的长度。[0208]在一些实施方案中,当ssna与本文的支架衔接子或其组分组合时,存在靶核酸(例如ssna)的一个或两个天然末端。天然末端通常是指核酸片段的未修饰末端。在一些实施方案中,靶核酸(例如,ssna)的天然末端在与本文的支架衔接子或其组分组合之前在长度上没有修饰。在此上下文中,“未修饰”是指从样品中分离靶核酸,然后与支架衔接子或其组分组合,而不修饰靶核酸的天然末端的长度。例如,靶核酸(例如,ssnas)不被缩短(例如,它们不与限制性酶或核酸酶或减少长度的物理条件(例如,剪切条件、切割条件)接触以产生非天然末端)和长度不增加一个或多个核苷酸(例如,天然末端未在突出端处填补;未向天然末端添加核苷酸)。向靶核酸的一个或两个天然末端添加磷酸酯或化学反应基团通常不被认为是修饰核酸的长度。[0209]在一些实施方案中,在与本文的支架衔接子或其组分组合之前,不使靶核酸(例如ssna)与切割剂(例如,内切核酸酶、外切核酸酶、限制酶)和/或聚合酶接触。在一些实施方案中,在与本文的支架衔接子或其组件组合之前,靶核酸未经受机械剪切(例如,超声处理(例如covaris的自适应聚焦声波(adaptivefocusedacoustics)tm(afa)过程))。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,不使靶核酸与外切核酸酶(例如dna酶)接触。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,不扩增靶核酸。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,靶核酸不连接于固体载体。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,靶核酸不与另一分子缀合。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,不将靶核酸克隆到载体中。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,可以使靶核酸经历去磷酸化。在一些实施方案中,在与本文的支架衔接子或其组分组合之前,可以使靶核酸经历磷酸化。[0210]在一些实施方案中,将靶核酸(例如ssna)与本文的支架衔接子或其组分组合包括,分离靶核酸,并将分离的靶核酸与本文的支架衔接子或其组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合包括,分离靶核酸,使分离的靶核酸磷酸化,以及将磷酸化的靶核酸与本文的支架衔接子或其组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合包括,分离靶核酸,使本文的支架衔接子或其组分去磷酸化,以及将分离的靶核酸与本文的去磷酸化的支架衔接子或其去磷酸化的组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合包括,分离靶核酸,使分离的靶核酸去磷酸化,使去磷酸化的靶核酸磷酸化,以及将磷酸化的靶核酸与本文的支架衔接子或其组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合包括,分离靶核酸,使分离的靶核酸去磷酸化,使去磷酸化的靶核酸磷酸化,使支架衔接子或其组分去磷酸化,以及将磷酸化的靶核酸与本文的去磷酸化的支架衔接子或其去磷酸化的组分组合。[0211]在一些实施方案中,将靶核酸(例如ssna)与本文的支架衔接子或其组分组合由以下组成:分离靶核酸,并将分离的靶核酸与本文的支架衔接子或其组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合由以下组成:分离靶核酸,磷酸化分离的靶核酸,以及将磷酸化的靶核酸与本文的支架衔接子或其组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合由以下组成:分离靶核酸,使支架衔接子或其组分去磷酸化,以及将分离的靶核酸与本文的去磷酸化的支架衔接子或其去磷酸化的组组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合由以下组成:分离靶核酸,使分离的靶核酸去磷酸化,使去磷酸化的靶核酸磷酸化,以及将磷酸化的靶核酸与本文的支架衔接子或其组分组合。在一些实施方案中,将靶核酸与本文的支架衔接子或其组分组合由以下组成:分离靶核酸,使分离的靶核酸去磷酸化,使去磷酸化的靶核酸磷酸化,使支架衔接子或其组分去磷酸化,以及将磷酸化的靶核酸与本文的去磷酸化的支架衔接子或其去磷酸化的组分组合。[0212]单链核酸[0213]本文提供了使用专用衔接子(例如用于生成测序文库)捕获单链核酸(ssna)的方法和组合物。单链核酸或ssna通常是指在70%或更高的长度上是单链(即分子间或分子内未杂交)的多核苷酸的集合。在一些实施方案中,在75%或更高、80%或更高、85%或更高、90%或更高、95%或更高或99%或更高的多核苷酸长度上,ssna是单链的。在某些方面,ssna在多核苷酸的整个长度上是单链的。单链核酸在本文中可以称为靶核酸。[0214]ssna可以包括单链脱氧核糖核酸(ssdna)。在一些实施方案中,ssdna包括但不限于源自双链dna(dsdna)的ssdna。例如,ssdna可以源自经变性(例如热变性和/或化学变性)单链核酸(ssna)“组成”的核酸组合物可以包括具有一个或多个磷酸酯(例如末端磷酸酯、5′末端磷酸酯)的ssna片段。“基本上由”单链核酸(ssna)“组成”的核酸组合物可以包括包含一个或多个修饰的核苷酸的ssna片段。[0219]富集核酸[0220]在一些实施方案中,核酸(例如细胞外核酸)对于核酸的亚群或种类而言被富集或相对富集。核酸亚群可以包括例如胎儿核酸、母体核酸、癌症核酸、肿瘤核酸、患者核酸、宿主核酸、病原体核酸、移植物核酸、微生物组核酸、包含具体长度或长度范围的片段的核酸或来自具体基因组区(例如单染色体、染色体组和/或某些染色体区)的核酸。这种富集的样品可以与本文提供的方法结合使用。因此,在某些实施方案中,该技术的方法包括富集样品中核酸亚群的额外步骤。在某些实施方案中,从样品中选择性地去除(部分、基本上、几乎完全或完全)来自正常组织(例如,非癌细胞、宿主细胞)的核酸。在某些实施方案中,从样品中选择性地去除(部分、基本上、几乎完全或完全)母体核酸。在某些实施方案中,富集特定低拷贝数种类的核酸(例如癌症、肿瘤、胎儿、病原体、移植物、微生物组核酸)可以提高定量灵敏度。富集样品的特定核酸种类的方法描述于例如美国专利号6,927,028、国际专利申请公开号wo2007/140417、国际专利申请公开号wo2007/147063、国际专利申请公开号wo2009/032779、国际专利申请公开号wo2009/032781、国际专利申请公开号wo2010/033639、国际专利申请公开号wo2011/034631、国际专利申请公开号wo2006/056480和国际专利申请公开号wo2011/143659,其全部内容各自通过引用并入本文,包括所有文字、表格、等式和附图。[0221]在一些实施方案中,针对某些靶片段种类和/或参考片段种类,富集核酸。在某些实施方案中,使用下述一种或多种基于长度的分离方法富集具体核酸片段长度或片段长度范围的核酸。在某些实施方案中,使用本文描述的和/或本领域已知的一种或多种基于序列的分离方法针对来自选定基因组区(例如染色体)的片段富集核酸。[0222]用于富集样品中核酸亚群的方法的非限制性实例包括,利用核酸种类之间的表观遗传差异的方法(例如,美国专利申请公开号2010/0105049描述的基于甲基化的胎儿核酸富集方法,该专利申请通过引用并入本文);限制性内切核酸酶增强的多态性序列方法(例如,美国专利申请公开号2009/0317818描述的方法,该专利申请通过引用并入本文);选择性酶促降解方法;大规模并行信号测序(mpss)方法;基于扩增(例如pcr)的方法(例如基因座特异性扩增方法、多重snp等位基因pcr方法;通用扩增方法);下拉方法(例如,生物素化的超聚体(ultramer)下拉方法);基于延伸和连接的方法(例如,分子倒置探针(mip)延伸和连接);及其组合。[0223]在一些实施方案中,可以富集修饰的核酸。核酸修饰包括但不限于羧基胞嘧啶、5-甲基胞嘧啶(5mc)及其氧化衍生物(例如,5-羟甲基胞嘧啶(5hmc)、5-甲酰基胞嘧啶(5fc)和5-羧基胞嘧啶(5cac))、n(6)-甲基腺嘌呤(6ma)、n4-甲基胞嘧啶(4mc)、n(6)-甲基腺苷(m(6)a)、假尿苷(ψ)、5-甲基胞苷(m(5)c)、羟甲基尿嘧啶、3′末端的2′‑o-甲基化、trna修饰、mirna修饰和snrna修饰。可以通过多种方法来富集包含一种或多种修饰的核酸,包括但不限于基于抗体的下拉。修饰的核酸富集可以在dsdna变性之前(例如,图52a-b)或之后(例如,图52c-d)进行。变性前的富集也会导致可能缺乏修饰的互补链富集,而变性后的富集不会富集缺乏修饰的互补链。[0224]在一些实施方案中,使用本文所述的一种或多种基于序列的分离方法针对来自选定基因组区(例如染色体)的片段富集核酸。基于序列的分离通常基于存在于样品的感兴趣的片段(例如,靶片段和/或参考片段)中且基本上不存在于其他片段中或以微量存在于其他片段(例如,5%或更少)中的核苷酸。在一些实施方案中,基于序列的分离可以产生分离的靶片段和/或分离的参考片段。分离的靶片段和/或分离的参考片段通常与核酸样品中的剩余片段分离。在某些实施方案中,分离的靶片段和分离的参考片段也彼此分离(例如,在单独的测定隔室中分离)。在某些实施方案中,分离的靶片段和分离的参考片段被一起分离(例如,在同一测定隔室中分离)。在一些实施方案中,可以有区别地去除或降解或消化未结合的片段。[0225]在一些实施方案中,支架衔接子用于富集靶核酸。例如,如图51所示,可以设计支架衔接子,使得ssna杂交区中的一些或所有碱基是确定的或已知的碱基。这些支架衔接子可以优先与具有与支架衔接子ssna杂交区的确定或已知碱基互补的序列的靶核酸杂交,从而在所得文库中富集靶核酸。例如,如图51所示,在ssna杂交区包括gc二核苷酸可用于富集具有末端cg(也称为cpg)二核苷酸的靶核酸。使用一些或全部长度的支架衔接子ssna杂交区,包括但不限于核酸酶切割位点、基因启动子区、病原体序列、肿瘤相关序列和其他基序,可以以类似的方式靶向任何其他确定的序列。在实例中,使用非富集支架衔接子和cg二核苷酸富集支架衔接子制备文库。对于未经富集而制备的文库,1.7%的读段从cg开始,1.1%的读段以cg结束。对于通过富集而制备的文库,5.2%的读段从cg开始,19.6%的读段以cg结束。在另一个实例中,如图55所示,用对感兴趣的病原体rna具有特异性的引物对包含rna(例如宿主和病原体rna)的样品进行逆转录以生成cdna;然后用本文讨论的单链文库制备方法,使用标准支架衔接子,或使用具有ssna杂交区的支架衔接子,纯化和制备cdna,该ssna杂交区被靶向由逆转录引物所富集的区域。也可以类似地富集病原dna。[0226]在一些情况下,5’或3’核酸末端的靶核酸序列是确定的或已知的。在其他情况下,支架衔接子可用于鉴别5′或3′核酸末端处感兴趣的新靶标。感兴趣的核酸序列或模式可以由经富集或未经富集的支架衔接子文库输出表征。在一些情况下,5’、3’或两个核酸末端的具体序列或序列模式可能与具体状态相关。这样的状态包括但不限于疾病状态、甲基化状态和基因表达状态。支架衔接子可用于定量样品与对照(例如来自癌症患者和健康对照的无细胞dna)之间核酸末端处已知或新靶序列的存在或相对丰度。这些数据可用于了解dna末端的序列信息与给定状态之间的关系。在一个实例中,通过对患者样品和健康样品的充分表征的数据集进行训练(training),可以使用分析方法或算法来预测状态或通过状态的转变。例如,我们观察到,与非aml患者样品相比,急性髓性白血病(aml)患者的cfdna中5′和3′dna末端的at二核苷酸增加而cpg二核苷酸减少。在此实例中,分析工具可以使用cfdna末端序列信息来预测一个人患aml的风险。[0227]在一些实施方案中,选择性核酸捕获过程用于将靶片段和/或参考片段与核酸样品分离。商业可得的核酸捕获系统包括例如nimblegen序列捕获系统(rochenimblegen,madison,wi)、illuminabeadarray平台(illumina,sandiego,ca)、affymetrixgenechip平台(affymetrix,santaclara,ca)、agilentsureselect靶标富集系统(agilenttechnologies,santaclara,ca),以及相关平台。此类方法通常涉及使捕获寡核苷酸与靶片段或参考片段的部分或全部核苷酸序列杂交,并且可以包括使用固相(例如固相阵列)和/或基于溶液的平台。可以选择或设计捕获寡核苷酸(有时称为“诱饵”),使得它们优先与来自选定基因组区或基因座的核酸片段或核酸靶标中的具体序列杂交。在某些实施方案中,可以使用基于杂交的方法(例如使用寡核苷酸阵列)来富集含有某些核酸序列的片段。因此,在一些实施方案中,通过使用与例如样品核酸中的选定序列互补的捕获寡核苷酸捕获片段子集,来任选地富集核酸样品。在某些情况下,扩增捕获的片段。例如,可以使用与衔接子序列互补的引物扩增含有衔接子的捕获片段,以形成根据衔接子序列索引的扩增片段的集合。在一些实施方案中,通过使用与含有感兴趣的区域或其部分的片段中的序列互补的寡核苷酸(例如,pcr引物)扩增一个或多个感兴趣的的区域,针对来自选定基因组区(例如染色体、基因)的片段富集核酸。[0228]在一些实施方案中,使用一种或多种基于长度的分离方法,针对特定核酸片段长度、长度范围或低于或高于具体阈值或截止值的长度,富集核酸。核酸片段长度通常是指片段中核苷酸的数目。核酸片段长度有时也称为核酸片段大小。在一些实施方案中,在不测量各片段长度的情况下进行基于长度的分离方法。在一些实施方案中,基于长度的分离方法与用于确定各片段长度的方法结合进行。在一些实施方案中,基于长度的分离是指尺寸分级程序,其中可以分离(例如保留)和/或分析分级池(fractionatedpool)的全部或部分。尺寸分级程序是本领域已知的(例如阵列分离、分子筛分离、凝胶电泳分离、柱色谱分离(例如尺寸排阻柱)和基于微流体的方法)。在某些情况下,基于长度的分离方法可以包括例如选择性序列加标签方法、片段环化、化学处理(例如甲醛、聚乙二醇(peg)沉淀)、质谱和/或尺寸特异性核酸扩增。[0229]在一些实施方案中,针对与一种或多种核酸结合蛋白结合的片段,富集核酸。示例性富集方法包括但不限于染色质免疫沉淀(chip)、交联chip(xchip)、天然chip(nchip)、无珠chip、载体chip(cchip)、快速chip(qchip)、快速定量chip(q2chip)、微芯片(μchip)、矩阵chip、病理学-chip(pat-chip)、chip-exo、chip-on-chip(嵌合芯片)、rip-chip、hichip、chia-pet和hichirp。[0230]在一些实施方案中,本文的方法包括富集rna种类混合物中的rna种类。例如,本文的方法可以包括富集存在于mrna和核糖体rna(rrna)混合物中的信使rna(mrna)。可以使用任何合适的mrna富集方法,包括rrna耗尽和/或mrna富集方法,例如用磁珠耗尽rrna(例如ribo-zerotm、ribominustm和microbexpresstm,它们使用rrna耗尽探针组合磁珠来耗尽样品中的rrna,从而富集mrna)、基于oligo(dt)的poly(a)富集(例如oligo(dt)20)、基于核酸酶的rrna耗尽(例如,使用terminatortm5′‑磷酸酯依赖性外切核酸酶消化rrna)及其组合。[0231]富集策略可以将靶核酸的相对丰度(例如,通过测序读段的百分比评估)增加至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1100%、1200%、1300%、1400%、1500%、1600%、1700%、1800%、1900%、2000%、3000%、4000%、5000%、6000%、7000%、8000%、9000%、10000%或更多。[0232]基于长度的分离[0233]在一些实施方案中,本文的方法包括根据片段长度分离靶核酸(例如ssna)。例如,可以使用一种或多种基于长度的分离方法,针对特定的核酸片段长度、长度范围或低于或高于特定阈值或截止值的长度,富集靶核酸(例如ssna)。核酸片段长度通常是指片段中核苷酸的数量。核酸片段长度也可以称为核酸片段大小。在一些实施方案中,在不测量各片段长度的情况下进行基于长度的分离方法。在一些实施方案中,基于长度的分离方法与用于确定各片段长度的方法结合进行。在一些实施方案中,基于长度的分离是指尺寸分级程序,其中可以分离(例如保留)和/或分析分级池的全部或部分。尺寸分级程序是本领域已知的(例如阵列分离、分子筛分离、凝胶电泳分离、柱色谱分离(例如尺寸排阻柱)和基于微流体的方法)。在一些实施方案中,基于长度的分离方法可以包括例如片段环化、化学处理(例如甲醛、聚乙二醇(peg))、质谱法和/或尺寸特异性核酸扩增。在一些实施方案中,使用固相可逆固定(spri)珠进行基于长度的分离。[0234]在一些实施方案中,从样品中分离某种长度、长度范围或低于或高于特定阈值或截止值长度的核酸片段。在一些实施方案中,长度低于特定阈值或截止值(例如500bp、400bp、300bp、200bp、150bp、100bp)的片段称为“短”片段,长度高于特定阈值或截止值(例如500bp、600bp、700bp、800bp、900bp、1000bp)的片段称为“长”片段、大片段和/或高分子量(hmw)片段。在一些实施方案中,保留一定长度、长度范围或低于或高于特定阈值或截止值长度的片段,用于分析,而不同长度或长度范围或高于或低于阈值或截止值长度的片段不被保留用于分析。在一些实施方案中,保留小于约500bp的片段。在一些实施方案中,保留小于约400bp的片段。在一些实施方案中,保留小于约300bp的片段。在一些实施方案中,保留小于约200bp的片段。在一些实施方案中,保留小于约150bp的片段。例如,保留小于约190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp、110凸p或100bp的片段。在一些实施方案中,保留约100bp至约200bp的片段。例如,保留约190bp、180bp、170bp、160bp、150bp、140bp、130bp、120bp或110bp的片段。在一些实施方案中,保留约100bp至约200bp的片段。例如,保留约110bp至约190bp、130bp至约180bp、140bp至约170bp、140bp至约150bp、150bp至约160bp或145bp至约155bp的片段。[0235]在一些实施方案中,将片段长度小于约1000bp的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度小于约500bp的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度小于约400bp的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度小于约300bp的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度小于约200bp的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度小于约100bp的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。[0236]在一些实施方案中,将片段长度为约100bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度为约200bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度为约500bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将长片段长度为约400bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度为约500bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。在一些实施方案中,将片段长度为约1000bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。[0237]在一些实施方案中,将具有任何片段长度或任何片段长度组合的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。例如,可以将片段长度小于500bp和片段长度为500bp或更多的靶核酸(例如ssna)与本文所述的多个支架衔接子种类或支架衔接子种类池或支架衔接子种类的组分组合。[0238]例如,可以与本文所述方法一起使用的某些基于长度的分离方法采用选择性序列加标签方法。在此类方法中,在包括长核酸和短核酸的样品中,对片段大小种类(例如短片段)核酸选择性添加标签。此类方法通常涉及使用包括内部引物和外部引物的一组嵌套引物进行核酸扩增反应。在一些实施方案中,可以对一个或两个内部引物加标签,由此将标签引入到靶扩增产物上。外部引物通常不会与携带(内部)靶序列的短片段退火。内部引物可以与短片段退火并生成携带标签和靶序列的扩增产物。通常,长片段加标签通过机制组合加以抑制,这些机制包括,例如,通过外部引物的预先退火和延伸来阻断内部引物延伸。带有标签的片段的富集可以通过多种方法中的任一种来完成,包括例如外切核酸酶消化单链核酸和使用对至少一个标签具有特异性的扩增引物扩增带有标签的片段。[0239]可以与本文所述方法一起使用的另一种基于长度的分离方法涉及,使核酸样品经受聚乙二醇(peg)沉淀。方法的实例包括描述于国际专利申请公开号wo2007/140417和wo2010/115016的那些方法。该方法通常需要在存在一种或多种单价盐的情况下,在足以基本上沉淀大核酸而基本上不沉淀小(例如小于300个核苷酸)核酸的条件下,使核酸样品与peg接触。[0240]可以与本文所述方法一起使用的另一种基于长度的富集方法涉及,通过连接,例如使用环化连接酶(circligase),进行环化。短核酸片段的环化效率通常高于长片段。非环化序列可以与环化序列分离,富集的短片段可以用于进一步分析。[0241]核酸文库[0242]本文的方法可以包括制备核酸文库和/或为了核酸文库而修饰核酸。在一些实施方案中,修饰核酸片段的末端,使得片段或其扩增产物可以掺入核酸文库中。通常,核酸文库是指为具体过程而制备、组装和/或修饰的多个多核苷酸分子(例如核酸样品),该具体过程的非限制性实例包括固定在固相(例如固体载体、流动池、珠)上、富集、扩增、克隆、检测和/或用于核酸测序。在某些实施方案中,在测序过程之前或期间制备核酸文库。可以通过本领域已知的合适方法制备核酸文库(例如测序文库)。可以通过靶向或非靶向制备过程制备核酸文库。[0243]在一些实施方案中,修饰核酸文库以包含经配置用于将核酸固定于固体载体上的化学部分(例如官能团)。在一些实施方案中,修饰核酸文库以包含经配置用于将文库固定于固体载体上的生物分子(例如官能团)和/或结合对的成员,其非限制性实例包括甲状腺素结合球蛋白、类固醇结合蛋白、抗体、抗原、半抗原、酶、凝集素、核酸、阻遏物、蛋白a、蛋白g、抗生物素蛋白、链霉抗生物素蛋白、生物素、补体成分c1q、核酸结合蛋白、受体、碳水化合物、寡核苷酸、多核苷酸、互补核酸序列等及其组合。具体结合对的一些实例包括但不限于:抗生物素蛋白部分和生物素部分;抗原表位和抗体或其免疫反应片段;抗体和半抗原;地高辛部分和抗地高辛抗体;荧光素部分和抗荧光素抗体;操纵物(operator)和阻遏物;核酸酶和核苷酸;凝集素和多糖;类固醇和类固醇结合蛋白;活性化合物和活性化合物受体;激素和激素受体;酶和底物;免疫球蛋白和蛋白a;寡核苷酸或多核苷酸和其相应互补物;等或其组合。[0244]在一些实施方案中,修饰核酸文库以包含一种或多种已知组成的多核苷酸,其非限制性实例包括标识符(例如标签、索引标签)、捕获序列、标记、衔接子、限制酶位点、启动子、增强子、复制起点、茎环、互补序列(例如引物结合位点、退火位点)、合适的整合位点(例如转座子、病毒整合位点)、修饰的核苷酸、本文所述的唯一分子标识符(umi)、本文所述的回文序列等或其组合。可以将已知序列的多核苷酸添加在合适的位置,例如添加在5′末端、3′末端上,或添加在核酸序列内。已知序列的多核苷酸可以是相同或不同的序列。在一些实施方案中,将已知序列的多核苷酸配置为与固定在表面(例如流动池中的表面)上的一种或多种寡核苷酸杂交。例如,包含5′已知序列的核酸分子可以与第一多个寡核苷酸杂交,而包含3′已知序列的核酸分子可以与第二多个寡核苷酸杂交。在一些实施方案中,核酸文库可以包含染色体特异性标签、捕获序列、标记和/或衔接子(例如,本文所述的寡核苷酸衔接子)。在一些实施方案中,核酸文库包含一种或多种可检测标记。在一些实施方案中,可以将一种或多种可检测标记掺入核酸文库的5′末端、3′末端和/或文库核酸内任何核苷酸位置处。在一些实施方案中,核酸文库包含杂交的寡核苷酸。在某些实施方案中,杂交的寡核苷酸是标记的探针。在一些实施方案中,核酸文库在固定于固相上之前包含杂交的寡核苷酸探针。[0245]在一些实施方案中,已知序列的多核苷酸包含通用序列。通用序列是整合到两种或更多种核酸分子或两种或更多种核酸分子亚组中的特定核苷酸序列,其中通用序列对于其整合入的所有分子或分子亚组是相同的。通常使用与通用序列互补的单个通用引物,将通用序列设计为杂交和/或扩增多种不同序列。在一些实施方案中,使用两种(例如一对)或更多种通用序列和/或通用引物。通用引物通常包含通用序列。在一些实施方案中,衔接子(例如通用衔接子)包含通用序列。在一些实施方案中,使用一种或多种通用序列捕获、鉴别和/或检测核酸的多个种类或子集。[0246]在制备核酸文库的某些实施方案中(例如在某些通过合成程序的测序中),核酸按大小加以选择和/或片段化成几百个碱基对或更短的长度(例如为文库生成做准备)。在一些实施方案中,在没有片段化的情况下,进行文库制备(例如当使用无细胞dna时)。[0247]在某些实施方案中,使用基于连接的文库制备方法(例如illuminatruseq、illumina、sandiegoca)。基于连接的文库制备方法通常利用衔接子(例如甲基化衔接子)设计,该设计可以在初始连接步骤掺入索引序列(例如,用于鉴别核酸序列的样品来源的样品索引序列)并且经常可用于制备用于单端测序、双端测序和多重测序的样品。例如,核酸(例如片段化的核酸或无细胞dna)可以通过填补反应、外切核酸酶反应或其组合进行末端修复。在一些实施方案中,所得平末端修复的核酸然后可以通过单个核苷酸来延伸,所述单个核苷酸与衔接子/引物3′末端上的单个核苷酸突出端互补。任何核苷酸均可用于延伸/突出端核苷酸。在一些实施方案中,省略末端修复,并且将支架衔接子(例如本文所述的支架衔接子)直接连接于核酸(例如单链核酸、片段化核酸和/或无细胞dna)的天然末端。[0248]在一些实施方案中,核酸文库制备包括将支架衔接子(例如本文所述的支架衔接子)或其组分连接于例如样品核酸、样品核酸片段、模板核酸、靶核酸、ssna。支架衔接子或其组分可以包含与流动池锚(flow-cellanchor)互补的序列,并且有时用于将核酸文库固定于固体载体,例如流动池的内表面上。在一些实施方案中,支架衔接子或其组分包含标识符、一个或多个测序引物杂交位点(例如,与通用测序引物互补的序列、单端测序引物、双端测序引物、多重测序引物等),或其组合(例如,衔接子/测序、衔接子/标识符、衔接子/标识符/测序)。在一些实施方案中,支架衔接子或其组分包含以下中的一种或多种:引物退火多核苷酸,在本文中也称为引发序列或引物结合结构域,(例如,用于与流动池连接的寡核苷酸和/或游离扩增引物退火),索引多核苷酸(例如,用于追踪来自不同样品的核酸的样品索引序列;也称为样品id),条形码多核苷酸(例如,用于追踪在测序之前扩增的样品核酸的各分子的单分子条形码(smb);也称为分子条形码或唯一分子标识符(umi))。在一些实施方案中,支架衔接子或其组分的引物退火组分(或引发序列或引物结合结构域)包含一种或多种通用序列(例如,与一种或多种通用扩增引物互补的序列)。在一些实施方案中,索引多核苷酸(例如样品索引、样品id)是支架衔接子或其组分的组分。在一些实施方案中,索引多核苷酸(例如样品索引、样品id)是通用扩增引物序列的组分。[0249]在一些实施方案中,当与扩增引物(例如通用扩增引物)组合使用时,支架衔接子或其组分经设计生成包含以下一种或多种的文库构建体:通用序列、分子条形码、样品id序列、间隔序列和样品核酸序列(例如ssna序列)。在一些实施方案中,当与通用扩增引物组合使用时,支架衔接子或其组分经设计生成包含以下一种或多种的有序组合的文库构建体:通用序列、分子条形码、样品id序列、间隔序列和样品核酸序列(例如ssna序列)。例如,文库构建体可以包含第一通用序列,接着是第二通用序列,接着是第一分子条形码,接着是间隔序列,接着是模板序列(例如样品核酸序列、ssna序列),接着是间隔序列,接着是第二分子条形码,接着是第三通用序列,接着是样品id,接着是第四通用序列。在一些实施方案中,当与扩增引物(例如通用扩增引物)组合使用时,支架衔接子或其组分经设计为模板分子(例如样品核酸分子、ssna分子)的每条链生成文库构建体。在一些实施方案中,支架衔接子是双连体衔接子。[0250]标识符可以是掺入或连接于核酸(例如多核苷酸)并允许检测和/或鉴别包含标识符的核酸的合适的可检测标记。在一些实施方案中,在测序方法期间将标识符掺入或连接于核酸(例如通过聚合酶)。在一些实施方案中,在测序方法之前,将标识符掺入或连接于核酸(例如通过延伸反应、通过扩增反应、通过连接反应)。标识符的非限制性实例包括核酸标签、核酸索引或条形码、放射性标记(例如同位素)、金属标记、荧光标记、化学发光标记、磷光标记、荧光团猝灭剂、染料、蛋白质(例如酶、抗体或其部分、接头、结合对成员)等或其组合。在一些实施方案中,标识符(例如核酸索引或条形码)是核苷酸或核苷酸类似物的独特的、已知的和/或可识别的序列。在一些实施方案中,标识符是六个或更多个连续核苷酸。可以利用许多具有各种不同激发光谱和发射光谱的荧光团。可以使用任何合适类型和/或数量的荧光团作为标识符。在一些实施方案中,在本文所述的方法(例如核酸检测和/或测序方法)中,使用1种或更多种、2种或更多种、3种或更多种、4种或更多种、5种或更多种、6种或更多种、7种或更多种、8种或更多种、9种或更多种、10种或更多种、20种或更多种、30种或更多种或50种或更多种不同的标识符。在一些实施方案中,一种或两种类型的标识符(例如荧光标记)与文库中的每个核酸连接。可以通过合适的方法、装置或机器进行标识符的检测和/或定量,其非限制性实例包括流式细胞术、定量聚合酶链反应(qpcr)、凝胶电泳、光度计、荧光计、分光光度计、合适的基因芯片或微阵列分析、蛋白质印迹、质谱、色谱、细胞荧光分析、荧光显微镜、合适的荧光或数字成像方法、共聚焦激光扫描显微镜、激光扫描细胞计数、亲和色谱、手动批量模式分离、电场悬浮、合适的核酸测序方法和/或核酸测序设备等及其组合。[0251]在一些实施方案中,通过单引物延伸(例如通过链置换聚合酶)将标识符、测序特异性索引/条形码和测序仪特异性流动池结合引物位点掺入核酸文库。[0252]在一些实施方案中,在扩增条件下扩增(例如通过基于pcr的方法扩增)核酸文库或其部分。在一些实施方案中,测序方法包括扩增核酸文库。可以在固定于固体支持物(例如流动池中的固体载体)上之前或之后扩增核酸文库。核酸扩增包括,通过产生一个或多个拷贝的模板和/或其互补物,扩增或增加存在(例如在核酸文库中存在的)的核酸模板和/或其互补物的数量的过程。扩增可以通过合适的方法进行。可以通过热循环法或等温扩增法扩增核酸文库。在一些实施方案中,使用滚环扩增方法。在一些实施方案中,扩增发生在固定有核酸文库或其部分的固体载体上(例如在流动池内)。在某些测序方法中,将核酸文库添加到流动池中并在合适的条件下通过与锚杂交来固定。这种类型的核酸扩增通常称为固相扩增。在固相扩增的一些实施方案中,通过从固定的引物起始的延伸,合成全部或部分扩增产物。固相扩增反应类似于标准溶液相扩增,不同之处在于将至少一种扩增寡核苷酸(例如引物)固定在固相载体上。在一些实施方案中,扩增修饰的核酸(例如通过添加衔接子而修饰的核酸)。[0253]在一些实施方案中,固相扩增包括核酸扩增反应,该反应包含仅一个种类的固定于表面的寡核苷酸引物。在某些实施方案中,固相扩增包括多个不同的固定的寡核苷酸引物种类。在一些实施方案中,固相扩增可以包括核酸扩增反应,该反应包含一个种类的固定于固体表面的寡核苷酸引物和溶液中的第二个不同的寡核苷酸引物种类。可以使用多个不同种类的固定的或基于溶液的引物。固相核酸扩增反应的非限制性实例包括界面扩增、桥式扩增、乳液pcr、wildfire扩增(例如美国专利申请公开号2013/0012399)等或其组合。[0254]核酸测序[0255]在一些实施方案中,对核酸(例如核酸片段、样品核酸、无细胞核酸、单链核酸、单链dna、单链rna)进行测序。在一些实施方案中,通过测序过程对与本文提供的支架衔接子杂交的ssna(“杂交产物”)进行测序。在一些实施方案中,通过测序过程对连接于本文提供的寡核苷酸组分的ssna(“单链连接产物”)进行测序。在一些实施方案中,通过扩增过程对杂交产物和/或单链连接产物进行扩增,并且通过测序过程对扩增产物进行测序。在一些实施方案中,不通过扩增过程扩增杂交产物和/或单链连接产物,并且通过测序过程在没有预先扩增的情况下,对杂交产物和/或单链连接产物进行测序。在一些实施方案中,测序过程生成序列读段(或测序读段)。在一些实施方案中,本文的方法包括基于序列读段确定单链核酸分子的序列。[0256]对于某些测序平台(例如双端测序),生成序列读段可以包括生成正向序列读段和生成反向序列读段。例如,使用某些双端测序平台的测序从两个方向对每个核酸片段进行测序,通常导致每个核酸片段有两个读段,第一个读段为正向(正向读段),第二个读长为反向互补方向(反向读段)。对于某些平台,正向读段从测序衔接子内的具体引物(例如,illumina衔接子,p5引物)生成,反向读长从测序衔接子内的不同引物(例如,illumina衔接子,p7引物)生成。[0257]可以使用任何合适的测序平台对核酸进行测序,包括sanger测序平台、高通量或大规模平行测序(下一代测序(ngs))平台等,例如由以下提供的测序平台:(例如,hiseqtm、miseqtm和/或genomeanalyzertm测序系统);oxfordnanoporetmtechnologies(例如minion测序系统)、iontorrenttm(例如ionpgmtm和/或ionprotontm测序系统);pacificbiosciences(例如,pacbiorsii测序系统);lifetechnologiestm(例如solid测序系统);roche(例如,454gsflx+和/或gsjunior测序系统);或任何其他合适的测序平台。在一些实施方案中,测序过程是高度多重测序(multiplexedsequencing)过程。在某些情况下,获得完整或基本完整的序列,有时获得部分序列。核酸测序通常产生序列读段集合。本文所用“读段”(例如,“读段”、“序列读段”)是由本文所述或本领域已知的任何测序过程产生的短核苷酸序列。可以从核酸片段的一端生成读段(单端读段),有时从核酸片段的两端生成读段(例如双端读段(paired-endread)、双端读段(double-endread))。在一些实施方案中,测序过程生成短测序读段或“短读段”。在一些实施方案中,短读段的标称、平均(average)、均值(mean)或绝对长度有时为约10个连续核苷酸至约250个或更多个连续核苷酸。在一些实施方案中,短读段的标称、平均、均值或绝对长度有时为约50个连续核苷酸至约150个或更多个连续核苷酸。[0258]序列读段的长度通常与所用的特定测序技术有关。例如,高通量方法提供的序列读段大小可以从数十到数百个碱基对(bp)变化。例如,纳米孔测序提供的序列读段大小可以从数十到数百到数千个碱基对变化。在一些实施方案中,序列读段的均值(mean)、中值、平均(average)或绝对长度为约15bp至约900bp。在某些实施方案中,序列读段的均值(mean)、中值、平均(average)或绝对长度为约1000bp或更多。在一些实施方案中,序列读段的均值(mean)、中值、平均(average)或绝对长度为约1500、2000、2500、3000、3500、4000、4500或5000bp或更多。在一些实施方案中,序列读段的均值(mean)、中值、平均(average)或绝对长度为约100bp至约200bp。[0259]在一些实施方案中,单端读段的标称、平均(average)、均值(mean)或绝对长度有时为约10个连续核苷酸至约250个或更多个连续核苷酸,约15个连续核苷酸至约200个或更多个连续核苷酸,约15个连续核苷酸至约150个或更多个连续核苷酸核苷酸,约15个连续核苷酸至约125个或更多个连续核苷酸,约15个连续核苷酸至约100个或更多个连续核苷酸,约15个连续核苷酸至约75个或更多个连续核苷酸,约15个连续核苷酸至约60个或更多个连续核苷酸,15个连续核苷酸至约50个或更多个连续核苷酸,约15个连续核苷酸至约40个或更多个连续核苷酸,有时约15个连续核苷酸或约36个或更多个连续核苷酸。在某些实施方案中,单端读段的标称、平均(average)、均值(mean)或绝对长度为约20至约30个碱基,或约24至约28个碱基。在某些实施方案中,单端读段的标称、平均(average)、均值(mean)或绝对长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、21、22、23、24、25、26、27、28或约29个碱基或更多。在某些实施方案中,单端读段的标称、平均(average)、均值(mean)或绝对长度为约20至约200个碱基、约100至约200个碱基或约140至约160个碱基。在某些实施方案中,单端读段的标称、平均(average)、均值(mean)或绝对长度为约30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或约200个碱基或更多。在某些实施方案中,双端读段的标称、平均(average)、均值(mean)或绝对长度有时为约10个连续核苷酸至约25个连续核苷酸或更多(例如,长度为约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸或更多),约15个连续核苷酸至约20个连续核苷酸或更多,有时为约17个连续核苷酸或约18个连续核苷酸。在某些实施方案中,双端读段的标称、平均(average)、均值(mean)或绝对长度有时为约25个连续核苷酸至约400个连续核苷酸或更多(例如,长度为约25、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390或400个核苷酸或更多),约50个连续核苷酸至约350个连续核苷酸或更多,约100个连续核苷酸至约325个连续核苷酸,约150个连续核苷酸至约325个连续核苷酸核苷酸,约200个连续核苷酸至约325个连续核苷酸,约275个连续核苷酸至约310个连续核苷酸,约100个连续核苷酸至约200个连续核苷酸,约100个连续核苷酸至约175个连续核苷酸,约125个连续核苷酸至约175个连续核苷酸,有时为约140个连续核苷酸至约160个连续核苷酸。在某些实施方案中,双端读段的标称、平均(average)、均值(mean)或绝对长度为约150个连续核苷酸,有时为150个连续核苷酸。[0260]读段通常是物理核酸中核苷酸序列的表示。例如,在含有序列的atgc描述的读段中,“a”代表物理核酸中的腺嘌呤核苷酸,“t”代表胸腺嘧啶核苷酸,“g”代表鸟嘌呤核苷酸,“c”代表胞嘧啶核苷酸。从来自个体的样品中获得的序列读段可以是来自少数核酸和多数核酸混合物的读段。例如,从癌症患者的血液获得的序列读段可以是来自癌症核酸和非癌症核酸混合物的读段。在另一个实例中,从妊娠雌性的血液获得的序列读段可以是来自胎儿核酸和母体核酸混合物的读段。在另一个实例中,从患有感染或传染病的患者的血液获得的序列读段可以是来自宿主核酸和病原体核酸混合物的读段。在另一个实例中,从移植受体的血液获得的序列读段可以是来自宿主核酸和移植物核酸混合物的读段。在另一个实例中,从样品获得的序列读段可以是来自微生物核酸混合物的读段,该微生物共同构成个体中的微生物组(例如肠道微生物组、血液微生物组、口腔微生物组、脊髓液微生物组、粪便微生物组)。在另一个实例中,从样品获得的序列读段可以是来自微生物核酸和宿主个体核酸混合物的读段,该微生物共同构成微生物组(例如肠道微生物组、血液微生物组、口腔微生物组、脊髓液微生物组、粪便微生物组)。可以通过本文所述的方法,将相对短的读段的混合物转化为表示存在于个体中的基因组核酸,和/或表示存在于肿瘤、胎儿、病原体、移植物或微生物组中的基因组核酸。[0261]在某些实施方案中,从个体“获得”样品的核酸序列读段,和/或从一个或多个参考人“获得”生物样品的核酸序列读段,可以涉及直接对核酸测序以获得序列信息。在一些实施方案中,“获得”可以涉及接收由另一个从核酸直接获得的序列信息。[0262]在一些实施方案中,在测序之前或期间富集和/或扩增(例如非特异性地,例如通过基于pcr的方法)样品中的一些或所有核酸。在某些实施方案中,在测序之前或期间富集和/或扩增样品中的具体核酸种类或子集。在一些实施方案中,对预先选择的核酸池的种类或子集进行随机测序。在一些实施方案中,在测序之前或期间不富集和/或扩增样品中的核酸。[0263]在一些实施方案中,对基因组的代表性组分进行测序并且有时将其称为“覆盖度”或“覆盖倍数”。例如,1倍覆盖度表示,读段代表基因组核苷酸序列的约100%。在一些情况下,覆盖倍数称为“测序深度”(并与其成正比)。在一些实施方案中,“覆盖倍数”是相对于作为参考的先前测序运行的相对术语。例如,第二次测序运行的覆盖度可能是第一次测序运行的2倍低。在一些实施方案中,对基因组进行冗余测序,其中基因组的给定区可以被两个或更多个读段或重叠读段覆盖(例如,“覆盖倍数”大于1,例如,2倍覆盖)。在一些实施方案中,以约0.01倍至约100倍的覆盖、约0.1倍至约20倍的覆盖或约0.1倍至约1倍的覆盖(例如约0.015、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90倍或更大的覆盖),对基因组(例如全基因组)进行测序。在一些实施方案中,对基因组的具体部分(例如,来自靶向方法的基因组部分)进行测序,并且覆盖倍数值通常是指被测序的具体基因组部分的组分(即覆盖倍数值不表示整个基因组)。在某些情况下,以1000倍或更多的覆盖对具体基因组部分进行测序。例如,可以以2000倍、5,000倍、10,000倍、20,000倍、30,000倍、40,000倍或50,000倍的覆盖对具体基因组部分进行测序。在一些实施方案中,测序为约1,000倍至约100,000倍的覆盖。在一些实施方案中,测序为约10,000倍至约70,000倍的覆盖。在一些实施方案中,测序为约20,000倍至约60,000倍的覆盖。在一些实施方案中,测序为约30,000倍至约50,000倍的覆盖。[0264]在一些实施方案中,对来自一个个体的一个核酸样品进行测序。在某些实施方案中,对来自两个或更多个样品中的每一个样品的核酸进行测序,其中样品来自一个个体或来自不同个体。在某些实施方案中,合并来自两个或更多个生物样品的核酸样品,其中每个生物样品都来自一个个体或两个或更多个个体,并且对池进行测序。在后面的实施方案中,来自每个生物样品的核酸样品通常由一个或多个唯一标识符来识别。[0265]在一些实施方案中,测序方法利用允许序列反应在测序过程中被多重化的标识符。唯一标识符的数量越多,用于检测的样品和/或染色体的数量(例如可以在测序过程中被多重化)就越大。可以使用任何合适数量的唯一标识符(例如,4、8、12、24、48、96或更多)进行测序过程。[0266]测序过程有时使用固相,并且有时固相包含流动池,来自文库的核酸可以附着于流动池上,并且试剂可以流动并与附着的核酸接触。流动池有时包括流动池泳道(lane),并且标识符的使用可以促进分析每个泳道中的许多样品。流动池通常是可以配置为保持和/或允许试剂溶液在结合的分析物上有序通过的固体载体。流动池通常为平面状、光学透明,通常为毫米或亚毫米级,并且通常具有发生分析物/试剂相互作用的通道或泳道。在一些实施例中,在给定的流动池泳道中分析的样品数量,取决于文库制备和/或探针设计期间使用的唯一标识符的数量。例如,使用12种标识符的多重化允许在8泳道流动池中同时分析96个样品(例如,等于96孔微孔板中的孔数)。类似地,例如,使用48种标识符的多重化允许在8泳道流动池中同时分析384个样品(例如,等于384孔微孔板中的孔数)。商业可得的多重测序试剂盒的非限制性实例包括illumina的多重样品制备寡核苷酸试剂盒和多重测序引物和phix对照试剂盒(例如,illumina的目录号分别为pe-400-1001和pe-400-1002)。[0267]可以使用任何合适的核酸测序方法,其非限制性实例包括maxim&gilbert、链终止法、合成测序、连接测序、质谱测序、基于显微镜的技术等或其组合。在一些实施方案中,可以在本文提供的方法中使用第一代技术,例如sanger测序方法,包括自动化sanger测序方法,包括微流体sanger测序。在一些实施方案中,可以使用包括利用核酸成像技术(例如,透射电子显微镜(tem)和原子力显微镜(afm))的测序技术。在一些实施方案中,使用高通量测序方法。高通量测序方法通常涉及以大规模平行方式有时在流动池中测序的克隆扩增的dna模板或单个dna分子。能够以大规模并行方式对dna进行测序的下一代(例如,第2代和第3代)测序技术可用于本文所述的方法,并且在本文中统称为“大规模并行测序”(mps)。在一些实施方案中,mps测序方法利用靶向方法,其中对感兴趣的具体染色体、基因或区域进行测序。在某些实施方案中,使用非靶向方法,其中样品中的大部分或所有核酸被随机测序、扩增和/或捕获。[0268]在一些实施方案中,使用靶向富集、扩增和/或测序方法。靶向方法通常通过使用序列特异性寡核苷酸分离、选择和/或富集样品中的核酸子集,以进一步处理。在一些实施方案中,使用序列特异性寡核苷酸文库来靶向(例如杂交到)样品中的一组或多组核酸。序列特异性寡核苷酸和/或引物通常对存在于一个或多个感兴趣的染色体、基因、外显子、内含子和/或调节区中的特定序列(例如独特的核酸序列)具有选择性。任何合适的方法或方法的组合都可以用于靶向核酸的一个或多个子集的富集、扩增和/或测序。在一些实施方案中,通过使用一个或多个序列特异性锚捕获到固相(例如流动池、珠),分离和/或富集靶向序列。在一些实施方案中,使用序列特异性引物和/或引物组通过基于聚合酶的方法(例如,基于pcr的方法,通过任何合适的基于聚合酶的延伸)富集和/或扩增靶向序列。序列特异性锚通常可用作序列特异性引物。[0269]mps测序有时利用合成测序和某些成像过程。可以用于本文所述方法的核酸测序技术是合成测序和基于可逆终止子的测序(例如,illumina的基因组分析仪(genomeanalyzer)、基因组分析仪ii、hiseq2000、hiseq2500(illumina,sandiegoca))。使用这项技术,可以对数百万个核酸(例如dna)片段进行并行测序。在此类测序技术的一个实例中,使用流动池,所述流动池包含光学透明载玻片,该载玻片具有8个单独的泳道,其表面上结合有寡核苷酸锚(例如衔接子引物)。[0270]通常通过以模板指导的方式向引物或预先存在的核酸链迭代添加(例如通过共价添加)核苷酸,进行合成测序。检测核苷酸的每次迭代添加,并且该过程重复多次,直到获得核酸链的序列。获得的序列长度部分取决于所执行的添加和检测步骤的数量。在合成测序的一些实施方案中,在一轮核苷酸添加中,添加和检测相同类型(例如a、g、c或t)的一个、两个、三个或更多个核苷酸。可以通过任何合适的方法(例如酶促或化学)添加核苷酸。例如,在一些实施方案中,聚合酶或连接酶以模板指导的方式将核苷酸添加到引物或预先存在的核酸链。在合成测序的一些实施方案中,使用不同类型的核苷酸、核苷酸类似物和/或标识符。在一些实施方案中,使用可逆终止子和/或可去除的(例如,可切割的)标识符。在一些实施方案中,使用荧光标记的核苷酸和/或核苷酸类似物。在某些实施方案中,合成测序包括切割(例如,切割和去除标识符)和/或洗涤步骤。在一些实施方案中,通过本文所述或本领域已知的合适方法检测一个或多个核苷酸的添加,所述方法的非限制性实例包括任何合适的成像装置、合适的相机、数码相机、基于ccd(电荷耦合装置)的成像设备(例如ccd相机)、基于cmos(互补金属氧化物硅)的成像设备(例如,cmos相机)、光电二极管(例如,光电倍增管)、电子显微镜、场效应晶体管(例如dna场效应晶体管)、isfet离子传感器(例如,chemfet传感器)等或其组合。[0271]可使用用于进行本文所述方法的任何合适的mps方法、系统或技术平台,来获得核酸序列读段。mps平台的非限制性实例包括illumina/solex/hiseq(例如,illumina的基因组分析仪、基因组分析仪ii、hiseq2000、hiseq)、solid、roche/454、pacbio和/或smrt、helicos真单分子测序、基于离子激流和离子半导体的测序(例如,由lifetechnologies开发)、wildfire、基于5500、5500xlw和/或5500xlwgeneticanalyzer的技术(例如,由lifetechnologies开发和销售,美国专利申请公开号2013/0012399);polony测序、焦磷酸测序(pyrosequencing)、大规模并行信号测序(mpss)、rna聚合酶(rnap)测序、lasergen系统和方法、基于纳米孔的平台、化学敏感场效应晶体管(chemfet)阵列、基于电子显微镜的测序(例如,由zsgenetics,halcyonmolecular开发)、纳米球测序等或其组合。可用于进行本文方法的其他测序方法包括数字pcr、杂交测序、纳米孔测序、染色体特异性测序(例如,使用dansr(选定区数字分析)技术。[0272]在一些实施方案中,在对测序的核酸进行分析之前或与其结合,对核酸进行测序并且处理测序产物(例如,序列读段的集合)。例如,可以根据下述一项或多项处理序列读段:比对、定位、过滤、计数、归一化、加权、生成分布图等,及其组合。可以以任何顺序进行某些处理步骤,并且可以重复某些处理步骤。[0273]本公开的方法可用于降低测序错误率。在一些实施方案中,在初始变性之前,可以用条形码标记双链分子,使得在随后的变性、单链文库制备和测序之后,可以关联来自最初配对在一起的核酸分子的序列。在一些实施方案中,在支架衔接子的初始连接之后,使用索引引物池进行索引pcr,使得生成的原始样品核酸分子的拷贝和来自初始pcr第一链合成的核酸的拷贝两者都包含相同的条形码或umi(或其互补物)。通过将最初杂交的链(因此具有互补序列)相关联的这些或其他方式,可以比较两条链的测序读段信息,并用于其降低测序错误率。[0274]定位读段[0275]可以定位序列读段,并且定位到具体核酸区(例如染色体或其部分)的读段的数量称为计数。可以使用任何合适的定位方法(例如,过程、算法、程序、软件、模块等或其组合)。定位过程的某些方面在下文中有描述。[0276]定位核苷酸序列读段(即来自物理基因组位置未知的片段的序列信息)可以通过多种方式进行,并且通常包括将获得的序列读段与参考基因组中的匹配序列进行比对。在这样的比对中,通常将序列读段与参考序列进行比对,并将那些匹配的称为“定位的”、“定位的序列读段”或“定位的读段”。在某些实施方案中,被定位的序列读段称为“命中(hit)”或“计数”。在一些实施方案中,定位的序列读段根据各种参数分组在一起,并分配给具体的基因组部分,这在下面进一步详细讨论。[0277]术语“比对(aligned)”、“比对(alignment)”或“比对(aligning)”通常是指可鉴定为匹配(例如100%同一性)或部分匹配的两条或多条核酸序列。比对可以手动或通过计算机(例如软件、程序、模块或算法)进行,其非限制性实例包括作为illumina基因分析管线的一部分发行的核苷酸数据的高效局部比对(efficientlocalalignmentofnucleotidedata)(eland)计算机程序。序列读段的比对可以是100%的序列匹配。在一些情况下,比对为小于100%的序列匹配(即非完美匹配、部分匹配、部分比对)。在一些实施例中,比对为约99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%或75%的匹配。在一些实施方案中,比对包含错配。在一些实施方案中,比对包含1、2、3、4或5个错配。可以使用任一链(例如,有义链或反义链)比对两条或多条序列。在某些实施方案中,将核酸序列与另一核酸序列的反向互补序列进行比对。[0278]可以使用各种计算方法将每个序列读段定位到一个部分。可用于比对序列的计算机算法的非限制性实例包括但不限于blast、blitz、fasta、bowtie1、bowtie2、eland、maq、probematch、soap、bwa或seqmap,或其变型或其组合。在一些实施方案中,可以将序列读段与参考基因组中的序列进行比对。在一些实施方案中,序列读段可以在本领域已知的核酸数据库中找到和/或与其中的序列进行比对,包括例如genbank、dbest、dbsts、embl(europeanmolecularbiologylaboratory,欧洲分子生物学实验室)和ddbj(dnadatabankofjapan,日本dna数据库)。可以使用blast或类似工具针对序列数据库搜索已鉴别的序列。例如,然后可以使用搜索命中将鉴别的序列分类成适当的部分(下文描述)。[0279]在一些实施方案中,读段可以唯一地或非唯一地定位到参考基因组中的部分。如果读段与参考基因组中的单个序列匹配,则该读段视为“唯一定位”。如果读段与参考基因组中的两条或多条序列匹配,则该读段视为“非唯一定位”。在一些实施方案中,从进一步分析(例如量化)中消除非唯一定位读段。在某些实施方案中,可以允许一定小程度错配(0-1)来解释参考基因组与来自个体样品的被定位的读段之间可能存在的单核苷酸多态性。在一些实施方案中,对于定位到参考序列的读段,不允许错配程度。[0280]本文所用术语“参考基因组”可以指任何生物体或病毒的任何具体的已知、测序或表征的基因组,无论是部分的还是完整的,其可用于供来自个体的已鉴别的序列参考。例如,可以在位于万维网urlncbi.nlm.nih.gov的国家生物技术信息中心(nationalcenterforbiotechnologyinformation)找到用于人类个体以及许多其他生物体的参考基因组。“基因组”是指以核酸序列表达的生物体或病毒的完整遗传信息。如本文所用,参考序列或参考基因组通常是来自个体或多个个体的组装或部分组装的基因组序列。在一些实施方案中,参考基因组是来自一个或多个人类个体的组装或部分组装的基因组序列。在一些实施方案中,参考基因组包含分配给染色体的序列。[0281]在某些实施方案中,评估基因组区(例如,部分、基因组部分)的可作图性(mappability)。可作图性是将核苷酸序列读段与参考基因组的一部分明确比对的能力,通常高达具体数目的错配,包括例如0、1、2或更多个错配。对于给定的基因组区,可以使用预设读段长度的滑动窗口方法并对得到的读段水平可作图性值求均值,来估计预期的可作图性。包含独特核苷酸序列片段的基因组区有时具有高可作图性值。[0282]对于双端测序,读段可以通过使用合适的作图和/或比对程序或算法定位到参考基因组,其非限制性例子包括bwa(lih.和durbinr.(2009)bioinformatics25,1754-60)、novoalign[novocraft(2010)]、bowtie(langmeadb等,(2009)genomebiol.10:r25)、soap2(lir等,(2009)bioinformatics25,1966-67)、bfast(homern等,(2009)plosone4,e7767)、gassst(rizk,g.和lavenier,d.(2010)bioinformatics26,2534-2540)和mpscan(rivalse.等,(2009)lecturenotesincomputerscience5724,246-260)等。读段可以通过使用合适的修剪和/或合并程序或算法来修剪和/或合并,其非限制性实例包括cutadapt、trimmomatic、seqprep和usearch。一些双端读段,例如那些来自比测序读段长度短的核酸模板的双端读段,可以具有通过正向读段和反向读段两者测序的部分;在这种情况下,可以使用正向读段和反向读段之间的重叠将正向读段和反向读段合并为单个读段。不重叠或不充分重叠的读段可以保持不合并,并被定位为配对读段。双端读段可以使用合适的短读段比对程序或算法进行定位和/或比对。短读段比对程序的非限制性实例包括barracuda、bfast、blastn、blat、bowtie、bwa、cashx、cuda-ec、cushaw、cushaw2、drfast、eland、erne、gnumap、gem、gensearchngs、gmap、geneiousassembler、isaac、last、maq、mrfast、mrsfast、mosaik、mpscan、novoalign、novoaligncs、novocraft、nextgene、omixon、palmapper、partek、pass、perm、qpalma、razers、real、creal、rmap、rna、rtg、segemehl、seqmap、shrec、shrimp、slider、soap、soap2、soap3、socs、ssaha、ssaha2、stampy、storm、subread、subjunc、taipan、ugene、velocimapper、timelogic、xpressalign、zoom等或其组合。根据参考基因组,通常将双端读段定位到同一多核苷酸片段的相对末端。在一些实施方案中,独立地定位读段配对(mate)。在一些实施方案中,将来自两个序列读段(即,来自每一末端)的信息计入在作图过程中。参考基因组通常用于确定和/或推断位于双端读段配对之间的核酸序列。本文所用术语“不一致读段对(discordantreadpair)”是指包含一对读段配对的双端读段,其中一个或两个读段配对未能明确定位到参考基因组的部分由连续核苷酸的段定义的同一区。在一些实施方案中,不一致读段对是定位到参考基因组意外位置的双端读段配对。参考基因组意外位置的非限制性实例包括(i)两条不同的染色体,(ii)被超过预定片段大小(例如,大于300bp、大于500bp、大于1000bp、大于5000bp或大于10,000bp)隔开的位置,(iii)方向与参考序列不一致(例如,相对方向),等或其组合。在一些实施方案中,根据样品中模板多核苷酸片段的长度(例如,平均长度、预定片段大小)或预期长度,鉴别不一致读段配对。例如,定位到分离大于样品中多核苷酸片段的平均长度或预期长度的位置的读段配对有时被鉴别为不一致读段配对。有时通过取读段之一的反向互补物并使用参考序列的同一链比较两个读段的比对,来确定以相反方向定位的读段对。可以通过本领域已知的或本文描述的任何合适方法和/或算法(例如,svdetect、lumpy、breakdancer、breakdancermax、crest、delly等或其组合)来鉴别不一致读段对。[0283]序列读段定量[0284]可以量化基于所选特征或变量定位或分区的序列读段,以确定定位到一个或多个部分(例如参考基因组的一部分)的读段的量或数目。在某些实施方案中,定位到部分或节段的序列读段的数量称为计数或读段密度。[0285]计数通常与基因组部分相关。在一些实施方案中,根据定位到(即关联)部分的一些或所有序列读段确定计数。在某些实施方案中,根据定位到一组部分(例如,节段或区域中的部分)的一些或所有序列读段确定计数。[0286]计数可以通过合适的方法、运算或数学过程确定。计数有时是所有序列读段的直和,该序列读段被定位到对应于节段的基因组部分或一组基因组部分、对应于基因组子区域(例如,拷贝数变异区、拷贝数改变区、拷贝数重复区、拷贝数缺失区、微重复区、微缺失区、染色体区、常染色体区、性染色体区)的一组部分,和/或有时是对应于基因组的一组部分。读段定量有时是比率,并且有时是针对区域a中部分的定量与针对区域b中部分的定量的比率。区域a有时是一部分、节段区、拷贝数变异区、拷贝数改变区、拷贝数重复区、拷贝数缺失区、微重复区、微缺失区、染色体区、常染色体区和/或性染色体区。区域b独立地有时是一部分、节段区、拷贝数变异区、拷贝数改变区、拷贝数重复区、拷贝数缺失区、微重复区、微缺失区、染色体区、常染色体区、性染色体区、包括所有常染色体的区、包括性染色体的区和/或包括所有染色体的区。[0287]在一些实施方案中,计数从原始序列读段和/或过滤的序列读段导出。在某些实施方案中,计数是定位到基因组部分或一组基因组部分(例如,区域中的基因组部分)的序列读段的平均值(average)、均值(mean)或总和。在一些实施方案中,计数与不确定值有关。有时会调整计数。可以根据与基因组部分或一组部分相关的序列读段来调整计数,所述部分已经被加权、去除、过滤、归一化、调整、求平均值、作为均值导出、作为中值导出、添加或其组合。[0288]序列读段定量有时是读段密度。可以确定和/或生成基因组的一个或多个节段的读段密度。在某些情况下,可以确定和/或生成一个或多个染色体的读段密度。在一些实施方案中,读段密度包括定位到参考基因组节段或部分的序列读段的计数的定量测量。读段密度可以通过合适的方法确定。在一些实施方案中,读段密度由合适的分布和/或合适的分布函数确定。分布函数的非限制性实例包括概率函数、概率分布函数、概率密度函数(pdf)、核密度函数(核密度估计)、累积分布函数、概率质量函数、离散概率分布、绝对连续单变量分布等,任何合适的分布,或其组合。读段密度可以是从合适的概率密度函数导出的密度估计。密度估计是基于观测数据,对潜在概率密度函数的估计构建。在一些实施方案中,读段密度包括密度估计(例如概率密度估计、核密度估计)。读段密度可以根据包括为基因组的一个或多个部分中的每一个生成密度估计的方法生成,其中每个部分都包括序列读段的计数。可以为定位到部分或节段的归一化和/或加权计数生成读段密度。在一些情况下,被定位到部分或节段的每个读段可对读段密度有贡献,即等于从本文所述归一化过程获得的权重的值(例如计数)。在一些实施方案中,调整针对一个或多个部分或节段的读段密度。可以通过合适的方法调整读段密度。例如,可以对一个或多个部分的读段密度进行加权和/或归一化。[0289]为给定部分或片段定量的读段可以来自一个来源或不同的来源。在一个实例中,可以从患有癌症或疑似患有癌症的个体的核酸获得读段。在这种情况下,定位到一个或多个部分的读段通常是代表健康细胞(即非癌细胞)和癌细胞(例如肿瘤细胞)两者的读段。在某些实施方案中,定位到一部分的一些读段来自癌细胞核酸,并且定位到相同部分的一些读段来自非癌细胞核酸。在另一个实例中,可以从来自怀有胎儿的妊娠雌性的核酸样品获得读段。在这种情况下,定位到一个或多个部分的读段通常是代表胎儿和胎儿母亲(例如,妊娠雌性个体)两者的读段。在某些实施方案中,定位到一部分的一些读段来自胎儿基因组,并且定位到相同部分的一些读段来自母体基因组。[0290]分类及其用途[0291]本文所述的方法可提供指示上述样品或来源的一种或多种特征的结果。本文所述的方法有时提供指示测试样品的表型和/或存在或不存在医学状况的结果(例如,提供确定存在或不存在医学状况和/或表型的结果)。结果通常是分类过程的一部分,并且分类(例如,对样品或来源的一个或多个特征的分类;和/或测试样品存在或不存在基因型、表型、遗传变异和/或医学状况的分类)有时基于和/或包括结果。结果和/或分类有时基于和/或包括测试样品的数据处理结果,该结果有助于在分类过程中确定样品或来源的一个或多个特征和/或基因型、表型、遗传变异、遗传改变和/或医学状况存在或不存在(例如,统计值)。结果和/或分类有时包括或基于确定样品或来源的一个或多个特征和/或基因型、表型、遗传变异、遗传改变和/或医学状况存在或不存在的得分,或基于对样品或来源的一个或多个特征和/或基因型、表型、遗传变异、遗传改变和/或医学状况存在或不存在的指令(call)。在某些实施方案中,结果和/或分类包括在分类过程中预测和/或确定样品或来源的一个或多个特征和/或基因型、表型、遗传变异、遗传改变和/或医学状况存在或不存在的结论。[0292]可以提供结果和/或分类的任何合适的表达。结果和/或分类有时基于和/或包括在一个或多个的概率考虑的背景下使用本文描述的处理方法生成的一个或多个数值。可以使用的值的非限制性实例包括灵敏度、特异性、标准偏差、中值绝对偏差(mad)、确定性度量、置信度度量、针对测试样品获得的值在特定范围值之内或之外的确定性或置信度度量、不确定性度量、针对测试样品获得的值在特定范围值之内或之外的不确定性度量、变异系数(cv)、置信水平、置信区间(例如,约95%的置信区间)、标准得分(例如z得分)、chi值、phi值、t检验结果、p值、倍性值、拟合的少数种类分数、面积比、中值水平等或其组合。在一些实施方案中,结果和/或分类包括读段密度、读段密度谱和/或图(例如谱图)。在某些实施方案中,将多个值一起分析,有时在这些值的谱中(例如,z-得分谱、p-值谱、chi值谱、phi值谱、t检验结果、值谱等,或其组合)。对概率的考虑可以有助于确定样品或来源的一个或多个特征和/或个体是否处于具有基因型、表型、遗传变异和/或医学状况的风险,或是否具有基因型、表型、遗传变异和/或医学状况,并且确定上述内容的结果和/或分类有时包括这样的考虑。[0293]在某些实施方案中,结果和/或分类基于和/或包括预测和/或确定测试样品存在或不存在基因型、表型、遗传变异和/或医学状况的风险或概率的结论。结论有时基于从本文所述数据分析方法确定的值(例如,指示概率、确定性和/或不确定性的统计值(例如,标准偏差、中值绝对偏差(mad)、确定性度量、置信度度量、针对测试样品获得的值在特定范围值之内或之外的确定性或置信度度量、不确定性度量、针对测试样品获得的值在特定范围值之内或之外的不确定性度量、变异系数(cv)、置信水平、置信区间(例如约95%的置信区间)、标准得分(例如,z-得分)、chi值、phi值、t检验结果、p值、灵敏度、特异性等或其组合)。结果和/或分类有时在针对特定测试样品的实验室测试报告中表示为与存在或不存在基因型、表型、遗传变异和/或医学状况相关的概率(例如,优势比、p值)、可能性或风险因素。对于特定基因型、表型、遗传变异和/或医学状况,测试样品的结果和/或分类有时以“阳性”或“阴性”提供。例如,在确定存在基因型、表型、遗传变异和/或医学状况的特定测试样品的实验室测试报告中,结果和/或分类有时被标示为“阳性”,以及有时在确定不存在基因型、表型、遗传变异和/或医学状况的特定测试样品的实验室测试报告中,结果和/或分类被标示为“阴性”。结果和/或分类有时是确定的,有时包括数据处理中使用的假设。[0294]在分类过程中通常会生成四种类型的分类:真阳性、假阳性、真阴性和假阴性。本文所用术语“真阳性”是指,针对测试样品正确地确定地基因型、表型、遗传变异或医学状况的存在。本文所用术语“假阳性”是指,针对测试样品错误地确定地基因型、表型、遗传变异或医学疾病的存在。本文所用术语“真阴性”是指,针对测试样品正确地确定地基因型、表型、遗传变异或医学状况的不存在。本文所用术语“假阴性”是指,针对测试样品错误地确定地基因型、表型、遗传变异或医学状况的不存在。分类过程性能的两种度量可以基于这些出现的比率来计算:(i)灵敏度值,通常是被正确识别为阳性的预测阳性的分数;(ii)特异性值,通常是正确识别为阴性的预测阴性的分数。[0295]在某些实施方案中,为分类过程生成的实验室测试报告包括测试性能的量度(例如灵敏度和/或特异性)和/或置信度的量度(例如置信水平、置信区间)。有时从对测试样品进行实验室测试之前进行的临床验证研究中获得测试性能和/或置信度的度量。在某些实施方案中,以百分比表示灵敏度、特异性和/或置信度中的一个或多个。在一些实施方案中,为灵敏度、特异性或置信水平中的每一个独立地表示的百分比大于约90%(例如,约90、91、92、93、94、95、96、97、98或99%,或大于99%(例如,约99.5%或更高、约99.9%或更高、约99.95%或更高、约99.99%或更高))。为特定置信水平(例如约90%至约99.9%(例如,约95%)的置信水平)表示的置信区间可以表示为值的范围,并且有时表示为针对特定置信区间的范围或敏感度和/或特异性。在一些实施方案中,变异系数(cv)表示为百分比,有时百分比为约10%或更少(例如,约10、9、8、7、6、5、4、3、2或1%,或小于1%(例如,约0.5%或更少、约0.1%或更少、约0.05%或更少、约0.01%或更少))。在某些实施方案中,概率(例如,特定结果和/或分类不是由于偶然)表示为标准得分(例如,z-得分)、p-值或t-检验结果。在一些实施方案中,可以使用本文所述的一种或多种数据处理操作,来生成结果和/或分类的测量方差、置信水平、置信区间、灵敏度、特异性等(例如,统称为置信参数)。[0296]测试样品的结果和/或分类通常由医护专业人员或其他有资格的个人(例如医生或助理)订购,并经常提供给他们,他们将结果和/或分类传送给获得测试样品的个体。在某些实施方案中,使用合适的视觉介质(例如,机器的外围设备或组件,例如打印机或显示器)提供结果和/或分类。通常以报告的形式将分类和/或结果提供给医护专业人员或有资格的个人。报告通常包括结果和/或分类的显示(例如,值,样品或来源的一个或多个特征,或存在或不存在基因型、表型、遗传变异和/或医学疾病的评估或概率),有时包括相关置信参数,并且有时包括用于生成结果和/或分类的测试的性能度量。报告有时包括对后续程序(例如,确认结果或分类的程序)的建议。报告有时包括染色体或其部分的可视化表示(例如,染色体模式图或核型图),有时显示针对测试样品鉴别的染色体的重复区和/或缺失区的可视化(例如,针对染色体缺失或重复,可视化整条染色体;可视化具有所示缺失区或重复区的整条染色体;可视化染色体的重复或缺失部分;在缺失部分染色体的情况下,可视化剩余的染色体)。[0297]报告可以以有助于医技专业人员或其他有资格的个人确定存在或不存在基因型、表型、遗传变异和/或医学状况的合适格式显示。适合用于生成报告的格式的非限制性实例包括数字数据、图形、2d图形、3d图形和4d图形、图片(例如,jpg、位图(例如bmp)、pdf、tiff、gif、raw、png等或合适的格式)、统计图(pictograph)、图表、表格、条形图、饼图、示意图、流程图、散点图、地图、直方图、密度图表、函数图、线路图、方框图、气泡图、星座图、等高线图、统计表、蜘蛛图、维恩图、列线图等,或前述的组合。[0298]报告可以由计算机和/或人工数据输入生成,并且可以使用合适的电子介质(例如,通过互联网、通过计算机、通过传真、从一个网络位置到同一或不同物理地点的另一个位置),或通过其他发送或接收数据的方法(例如,邮件服务、快递服务等),传送和传达。用于传送报告的通讯媒介的非限制性实例包括听觉文件、计算机可读文件(例如,pdf文件)、纸质文件、实验室文件、医疗记录文件或前一段所述的任何其他介质。在某些实施方案中,实验室文件或医疗记录文件可以是有形形式或电子形式(例如,计算机可读形式)。在生成和传送报告之后,可以通过经由合适的通信介质获得包括结果和/或分类的书面和/或图形表示来接收报告,其在审查后允许医护专业人员或其他有资格的个人确定样品或来源的一个或多个特征或测试样品存在或不存在基因型、表型、遗传变异和/或医学状况。[0299]结果和/或分类可由实验室提供并从实验室获得(例如,从实验室文件获得)。实验室文件可以由执行一项或多项测试以确定样品或来源的一个或多个特征和/或测试样品存在或不存在基因型、表型、遗传变异和/或医学状况的实验室生成。实验室人员(例如,实验室经理)可以分析与作为结果和/或分类基础的测试样品相关的信息(例如,测试谱、参考谱、测试值、参考值、偏差水平、患者信息)。对于接近的或有问题的与基因型、表型、遗传变异和/或医学状况相关的指令,实验室人员可以使用来自测试个体的相同(例如,相同样品的等分试样)或不同测试样品重新运行相同的程序。实验室可以与根据实验室文件评估存在或不存在基因型、表型、遗传变异和/或医疗状况的人员位于同一地点或不同地点(例如,在另一个国家/地区)。例如,实验室文件可以在一个地点生成并传送到另一个地点,在所述另一地点,将在那里的测试样品的信息由医护专业人员或其他有资格的个人评估,并且任选地传送给获得测试样品的个体。实验室有时会生成和/或传送包含对测试样品存在或不存在基因组不稳定性存、基因型、表型、遗传变异和/或医学状况进行分类的实验室报告。生成实验室测试报告的实验室有时是经过认证的实验室,并且有时是根据临床实验室改进修正案(clinicallaboratoryimprovementamendments,clia)认证的实验室。[0300]结果和/或分类有时是个体诊断的组成部分,并且有时结果和/或分类被用作和/或评估为为测试样品提供诊断的一部分。例如,医护专业人员或其他有资格的个人可以分析结果和/或分类,并基于或部分基于结果和/或分类提供诊断。在一些实施方案中,对医学状况、疾病、综合征或异常的确定、检测或诊断包括,使用确定存在或不存在基因型、表型、遗传变异和/或医学状况的的结果和/或分类。因此,本文提供了用于根据由本文所述方法生成的结果或分类,并且任选地根据生成和传送包括对测试样品存在或不存在基因型、表型、遗传变异和/或医学状况进行分类的实验室报告,来诊断测试样品存在或不存在基因型、表型、遗传变异和/或医学状况的方法。[0301]机器、软件和接口[0302]本文描述的某些过程和方法(例如,选择序列读段的子集、生成序列读段谱、处理序列读段数据、处理序列读段定量、基于序列读段数据或序列读段谱确定样品的一个或多个特征)往往过于复杂,无法在头脑中执行,没有计算机、微处理器、软件、模块或其他机器就无法执行。本文所述的方法可以是计算机执行的方法,并且方法的一个或多个部分有时由一个或多个处理器(例如微处理器)、计算机、系统、装置或机器(例如微处理器控制的机器)执行。[0303]适合使用的计算机、系统、装置、机器和计算机程序产品通常包括计算机可读存储介质,或与其结合使用。计算机可读存储介质的非限制性实例包括存储器、硬盘、cd-rom、闪存设备等。计算机可读存储介质通常是计算机硬件,并且通常是非暂时性计算机可读存储介质。计算机可读存储介质不是计算机可读传送介质,后者本身就是传送信号。[0304]本文提供了存储有可执行程序的计算机可读存储介质,其中该程序指示微处理器执行本文所述的方法。还提供了存储有可执行程序模块的计算机可读存储介质,其中该程序模块指示微处理器执行本文所述方法的一部分。本文还提供了系统、机器、装置和计算机程序产品,其包括存储有可执行程序的计算机可读存储介质,其中该程序指示微处理器执行本文所述的方法。还提供了系统、机器和装置,其包括存储有可执行程序模块的计算机可读存储介质,其中该程序模块指示微处理器执行本文所述方法的一部分。[0305]还提供了计算机程序产品。计算机程序产品通常包括计算机可用介质,该计算机可用介质包括体现在其中的计算机可读程序代码,该计算机可读程序代码适于被执行以实施本文所述的方法或本文所述方法的一部分。计算机可用介质和可读程序代码不是传送介质(即传送信号本身)。计算机可读程序代码通常适用于由处理器、计算机、系统、装置或机器执行。[0306]在一些实施方案中,由自动化方法执行本文所述的方法(例如,选择序列读段的子集、生成序列读段谱、处理序列读段数据、处理序列读段定量、基于序列读段数据或序列读段谱确定样品的一个或多个特征)。在一些实施方案中,本文所述方法的一个或多个步骤由微处理器和/或计算机执行,和/或结合存储器执行。在一些实施方案中,自动化方法体现在执行本文所述方法的软件、模块、微处理器、外围设备和/或包括类似物的机器中。本文所用的软件指的是当由微处理器执行时执行本文所述的计算机操作的计算机可读程序指令。[0307]机器、软件和接口可用于进行本文所述的方法。使用机器、软件和接口,用户可以输入、请求、查询或确定使用具体信息、程序或过程(例如,处理序列读段数据、处理序列读段定量和/或提供结果)的选项,这可能涉及例如执行统计分析算法、统计显著性算法、统计算法、迭代步骤、验证算法和图形表示。在一些实施方案中,用户可以输入数据集作为输入信息,用户可以通过合适的硬件介质(例如闪存驱动器)下载一个或多个数据集,和/或用户可以将数据集从一个系统发送到另一个系统,用于进行后续处理和/或提供结果(例如,将序列读段数据从测序仪发送到计算机系统,以进行序列读段处理;将处理后的序列读段数据发送到计算机系统以进一步进行处理和/或产生结果和/或报告)。[0308]系统通常包括一台或多台机器。每台机器都包括一个或多个存储器、一个或多个微处理器和指令。当系统包括两台或更多台机器时,一些或所有机器可以位于同一地点,一些或所有机器可以位于不同的地点,所有机器可以位于一个地点和/或所有机器可以位于不同的地点。当系统包括两台或更多台机器时,一些或所有机器可以位于与用户相同的地点,一些或所有机器可以位于与用户不同的地点,所有机器可以位于与用户相同的地点,和/或所有机器可以位于与用户不同的一个或多个地点。[0309]系统有时包括计算机器和测序装置或机器,其中测序装置或机器被配置为接收物理核酸并产生序列读段,并且计算装置被配置为处理来自测序装置或机器的读段。计算机器有时被配置为确定序列读段的结果(例如,样品的特征)。[0310]例如,用户可以对软件进行查询,然后该软件可以通过互联网访问获取数据集,并且在某些实施方案中,可以提示可编程微处理器基于给定参数获取合适的数据集。可编程微处理器还可以提示用户基于给定参数选择由微处理器选择的一个或多个数据集选项。可编程微处理器可以提示用户基于经由互联网找到的信息、其他内部或外部信息等,来选择由微处理器选择的一个或多个数据集选项。可以选择用于选择以下的选项:一种或多种数据特征选择、一种或多种统计算法、一种或多种统计分析算法、一种或多种统计显著性算法、迭代步骤、一种或多种验证算法以及一种或多种图形表示方法、机器、装置、计算机程序或存储有可执行程序的非暂时性计算机可读存储介质。[0311]本文提出的系统可包括计算机系统的通用组件,例如网络服务器、笔记本电脑系统(laptopsystem)、台式系统、手持系统、个人数字助理、计算亭等。计算机系统可以包括一个或多个输入器件,例如键盘、触摸屏、鼠标、语音识别或允许用户将数据输入系统的其他器件。系统还可以包括一个或多个输出,包括但不限于显示屏(例如crt或lcd)、扬声器、传真机、打印机(例如,激光、喷墨、冲击、黑白或彩色打印机),或其他用于提供视觉、听觉和/或硬拷贝输出信息(例如结果和/或报告)的输出。[0312]在系统中,输入和输出组件可以连接到中央处理单元,除其他组件外,中央处理单元可以包括用于执行程序指令的微处理器和用于存储程序代码和数据的存储器。在一些实施方案中,过程可以作为位于单个地理站点中的单个用户系统来执行。在某些实施方案中,过程作为多用户系统来执行。在多用户执行的情况下,多个中央处理单元可以通过网络而连接。该网络可以是局部的,包括建筑物一部分中的单个部门、整个建筑物、跨多个建筑物、跨一个区域、跨越整个国家或是世界范围的。该网络可以是私有的,由提供商拥有和控制,或者它可以作为基于互联网的服务来实施,其中用户访问网页以输入和检索信息。因此,在某些实施方案中,系统包括一个或多个机器,这些机器相对于用户可以是本地的或远程的。用户可以访问一个地点或多个地点中的一台以上的机器,并且可以串行和/或并行地定位和/或处理数据。因此,合适的配置和控制可用于使用多台机器来定位和/或处理数据,例如在本地网络、远程网络和/或“云”计算平台中。[0313]在一些实施方案中,系统可以包括通信接口。通信接口允许在计算机系统和一个或多个外部设备之间传输软件和数据。通信接口的非限制性实例包括调制解调器、网络接口(例如以太网卡)、通信端口、pcmcia插槽和卡等。通过通信接口传输的软件和数据通常是信号的形式,信号可以是电子的、电磁的、光的和/或其他能够被通信接口接收的信号。信号通常通过信道提供给通信接口。信道通常携带信号并且可以使用电线或电缆、光纤、电话线、移动电话连接、rf连接和/或其他通信信道来实施。因此,在实例中,通信接口可以用于接收可以由信号检测模块检测的信号信息。[0314]数据可以通过合适的设备和/或方法输入,包括但不限于手动输入设备或直接数据输入设备(dde)。手动设备的非限制性实例包括键盘、概念键盘、触敏屏幕、光笔、鼠标、跟踪球、操纵杆、图形输入板、扫描仪、数码相机、视频数字转换器和语音识别设备。dde的非限制性实例包括条形码阅读器、磁条码、智能卡、磁性墨水字符识别、光学字符识别、光学标记识别和周转文件。[0315]在一些实施方案中,来自测序装置或机器的输出可以用作可经由输入设备输入的数据。在某些实施方案中,序列读段信息可以用作可经由输入设备输入的数据。在某些实施方案中,定位的序列读段可以用作可经由输入设备输入的数据。在某些实施方案中,核酸片段大小(例如长度)可以用作可经由输入设备输入的数据。在某些实施方案中,来自核酸捕获过程的输出(例如,基因组区起源数据)可以用作可经由输入设备输入的数据。在某些实施方案中,核酸片段大小(例如,长度)与来自核酸捕获过程的输出(例如,基因组区起源数据)的组合,可以用作可经由输入设备输入的数据。在某些实施例中,模拟数据由计算机过程(insilicoprocess)生成并且模拟数据用作可以经由输入设备输入的数据。术语“计算机(insilico)”是指使用计算机进行的研究和实验。计算机处理包括但不限于根据本文所述过程定位序列读段和处理定位的序列读段。[0316]系统可包括用于执行本文所述过程或其一部分的软件,并且软件可包括用于执行此类过程的一个或多个模块(例如,测序模块、逻辑处理模块、数据显示组织模块)。术语“软件”指的是当由计算机执行时执行计算机操作的计算机可读程序指令。可由一个或多个微处理器执行的指令有时作为可执行代码来提供,该可执行代码当被执行时可以使一个或多个微处理器实施本文所述方法。本文所述方模块可以作为软件存在,并且包含在软件中的指令(例如,过程、例程(routine)、子例程(subroutine))可以由微处理器实施或执行。例如,模块(例如软件模块)可以是执行特定过程或任务的程序的一部分。术语“模块”是指可以在较大的机器或软件系统中使用的独立功能单元。模块可以包括一组用于执行模块功能的指令。模块可以转换数据和/或信息。数据和/或信息可以是合适的形式。例如,数据和/或信息可以是数字的或模拟的。在某些实施方案中,数据和/或信息有时可以是包、字节、字符或比特(bit)。在一些实施方案中,数据和/或信息可以是任何收集的、组装的或可用的数据或信息。数据和/或信息的非限制性实例包括合适的介质、图片、视频、声音(例如可听或不可听的频率)、数字、常量、值、对象、时间、函数、指令、地图、参考物、序列、读段、定位读段、水平、范围、阈值、信号、显示、表示或其转化形式。模块可以接受或接收数据和/或信息,将数据和/或信息转换成第二形式,并将第二形式提供或传送给机器、外围设备、组件或另一模块。在某些实施方案中,微处理器可以执行模块中的指令。在一些实施方案中,需要一个或多个微处理器来执行一个模块或一组模块中的指令。一个模块可以向另一个模块、机器或源提供数据和/或信息,并且可以从另一个模块、机器或源接收数据和/或信息。[0317]计算机程序产品有时体现在有形的计算机可读介质上,有时有形地体现在非暂时性计算机可读介质上。模块有时存储在计算机可读介质(例如磁盘、驱动器)或存储器(例如随机存取存储器)中。能够执行来自模块的指令的模块和微处理器可以位于机器中或不同机器中。能够为模块执行指令的模块和/或微处理器可以位于与用户相同的地点(例如,本地网络)或位于与用户不同的地点(例如,远程网络、云系统)。在结合两个或更多个模块执行方法的实施方案中,模块可以位于同一台机器中,一个或多个模块可以位于在同一物理地点的不同机器中,并且一个或多个模块可以位于在不同物理地点的不同机器中。[0318]在一些实施方案中,机器包括至少一个用于执行模块中的指令的微处理器。序列读段定量(例如计数)有时由执行被配置为执行本所述方法的指令的微处理器访问。微处理器访问的序列读段定量可以在系统的存储器中,并且序列读段计数在获得之后可以被访问并放入系统的存储器中。在一些实施方案中,机器包括微处理器(例如,一个或多个微处理器),该微处理器可以执行和/或实施来自模块的一个或多个指令(例如,过程、例程和/或子例程)。在一些实施方案中,机器包括多个微处理器,例如配合和并行工作的微处理器。在一些实施方案中,机器与一个或多个外部微处理器(例如,内部或外部网络、服务器、存储设备和/或存储网络(例如云))一起操作。在一些实施例中,机器包括模块(例如一个或多个模块)。包括模块的机器通常能够从其他模块接收一个或多个数据和/或信息,并将一个或多个数据和/或信息传输到其他模块。[0319]在某些实施方案中,机器包括外围设备和/或组件。在某些实施方案中,机器可以包括一个或多个外围设备或组件,这些外围设备或组件可以向和从其他模块、外围设备和/或组件传输数据和/或信息。在某些实施方案中,机器与提供数据和/或信息的外围设备和/或组件交互。在某些实施方案中,外围设备和组件帮助机器执行功能或直接与模块交互。外围设备和/或组件的非限制性实例包括合适的计算机外围设备、i/o或存储方法或设备,包括但不限于扫描仪、打印机、显示器(例如,监视器、led、lct或crt)、相机、麦克风、平板电脑(例如ipad、便携式电脑(tablet))、触摸屏、智能电话、移动电话、usbi/o设备、usb大容量存储设备、键盘、计算机鼠标、数字笔、调制解调器、硬盘驱动器、跳盘驱动器、闪存驱动器、微处理器、服务器、cd、dvd、图形卡、专用i/o设备(例如,定序器、光电管、光电倍增管、光学读取器、传感器等)、一个或多个流动池、流体处理组件、网络接口控制器、rom、ram、无线传输方法和设备(蓝牙、wifi等)、万维网(www)、互联网、计算机和/或另一模块。[0320]软件通常提供在包含记录在计算机可读介质上的程序指令的程序产品上,计算机可读介质包括但不限于包括软盘、硬盘和磁带在内的磁介质;以及光学介质,包括cd-rom盘、dvd盘、磁光盘、闪存设备(例如,闪存驱动器)、ram、软盘等,以及可以记录程序指令的其他此类介质。在在线实施时,可以配置由组织维护的服务器和网站向远程用户提供软件下载,或者远程用户可以访问由组织维护的远程系统以远程访问软件。软件可以获得或接收输入信息。软件可以包括专门获取或接收数据的模块(例如,接收序列读段数据和/或定位的读段数据的数据接收模块),并且可以包括专门处理数据的模块(例如,处理接收的数据的处理模块(例如,过滤器、标准化、提供结果和/或报告)。术语“获得”和“接收”输入信息是指,通过计算机通信手段(从本地或远程站点)、人数据输入或接收数据的任何其他方法接收数据(例如,序列读段、定位的读段)。输入信息可以在接收它的同一地点生成,或者它可以在不同地点生成并传送到接收地点。在一些实施方案中,输入信息在被处理之前被修改(例如,放入可依据处理(例如,制表)被修改的格式)。[0321]在某些实施方案中,软件可以包括一种或多种算法。算法可以用于根据有限的指令序列处理数据和/或提供结果或报告。算法通常是用于完成任务的已定义指令列表。从初始状态开始,指令可以描述通过一系列定义的连续状态进行的计算,最终以最终结束状态终止。从一种状态到下一种状态的转换不一定是确定性的(例如,某些算法包含随机性)。作为举例而非限制,算法可以是搜索算法、分类算法、合并算法、数值算法、图算法、字符串算法、建模算法、计算基因组算法、组合算法、机器学习算法、密码算法、数据压缩算法、解析算法等。算法可以包括一种算法或组合工作的两种或多种算法。算法可以具有任何合适的复杂性等级和/或参数化复杂性。算法可用于计算和/或数据处理,并且在一些实施方案中,可用于确定性或概率性/预测性方法。算法可以通过使用合适的编程语言在计算环境中实现,编程语言的非限制性实例是c、c++、java、perl、python、fortran等。在一些实施方案中,可以配置或修改算法以包括误差幅度、统计分析、统计显著性和/或与其他信息或数据集的比较(例如,当使用神经网络或聚类算法时适用)。[0322]在某些实施方案中,可以实现若干算法以供在软件中使用。在一些实施方案中,可以用原始数据训练这些算法。对于每个新的原始数据样品,经过训练的算法可以产生具有代表性的处理数据集或结果。与已处理的亲本数据集相比,经过处理的数据集有时具有降低的复杂性。在一些实施方案中,基于处理过的集,可以基于灵敏性和特异性来评估经过训练的算法的性能。在某些实施方案中,可以识别和利用具有最高灵敏性和/或特异性的算法。[0323]在某些实施方案中,模拟的(或模拟)数据可以帮助数据处理,例如,通过训练算法或测试算法。在一些实施方案中,模拟的数据包括不同序列读段分组的假设的各种采样。模拟的数据可能基于对真实群体的预期,或者可能会被歪曲以测试算法和/或分配正确的分类。模拟的数据在本文中也称为“虚拟”数据。在某些实施方案中,可以通过计算机程序来执行模拟。使用模拟数据集的一个可能步骤是评估鉴别结果的置信度,例如,随机采样匹配或最好地代表原始数据的程度。一种方法是计算概率值(p值),该值估计随机样品比所选样品得分更高的概率。在一些实施方案中,可以评估经验模型,其中假设至少一个样品匹配参考样品(有或没有已解决的变化)。在一些实施方案中,可以使用另一种分布,例如泊松分布来定义概率分布。[0324]在某些实施方案中,系统可包括一个或多个微处理器。微处理器可以连接到通信总线。计算机系统可以包括主存储器,通常是随机存取存储器(ram),并且还可以包括辅助存储器。在一些实施方案中,存储器包括非暂时性计算机可读存储介质。辅助存储器可以包括例如硬盘驱动器和/或可移动存储驱动器,代表软盘驱动器、磁带驱动器、光盘驱动器、存储卡等。可移动存储驱动器经常读取和/或写入可移动存储单元。可移动存储单元的非限制性实例包括软盘、磁带、光盘等,其可由例如可移动存储驱动器读取和写入。可移动存储单元可以包括其中存储有计算机软件和/或数据的计算机可用存储介质。[0325]微处理器可以在系统中实施软件。在一些实施方案中,微处理器可以被编程为自动执行用户可能执行的本文所述任务。因此,微处理器或由这种微处理器实施的算法几乎不需要用户的监督或输入(例如软件可以被编程为自动实现功能)。在一些实施方案中,过程的复杂性如此之大以致单个人或一组人无法在足够短的时间范围内执行确定样品的一个或多个特征的过程。[0326]在一些实施方案中,辅助存储器可以包括用于允许将计算机程序或其他指令加载到计算机系统中的其他类似器件。例如,系统可以包括可移动存储单元和接口设备。此类系统的非限制性实例包括程序盒式存储器和盒式存储器接口(例如在视频游戏设备中发现的)、可移动存储芯片(例如eprom或prom)和相关联的插槽,以及允许软件和数据从可移动存储单元传输到计算机系统的其他可移动存储单元和接口。[0327]核酸外析方法本文提供了用于分析核酸的方法。[0328]本文提供了用于评估核酸纯度和/或质量的方法。可以使用本文所述的单链文库制备方法评估核酸的纯度和/或质量。[0329]在一些实施方案中,本文所述的单链文库制备方法可用于评估单链核酸(ssna)的纯度和/或质量。ssna可以包括单个ssna种类(例如,具有相同序列和长度的ssna)或可以包括ssna种类池(例如,具有不同序列和/或长度的ssna)。在一些实施方案中,ssna包含单链寡核苷酸。在一些实施方案中,单链寡核苷酸是商业生产的。在一些实施方案中,单链寡核苷酸由用户产生。在一些实施方案中,ssna包含单链探针。在一些实施方案中,单链探针是商业生产的。在一些实施方案中,单链探针由用户产生。[0330]在一些实施方案中,本文所述的单链文库制备方法可用于评估单链核糖核酸(ssrna)的纯度和/或质量。ssrna可包括单个ssrna种类(例如,具有相同序列和长度的ssrna)或可包括ssrna种类池(例如,具有不同序列和/或长度的ssrna)。在一些实施方案中,ssrna包含单链rna寡核苷酸。在一些实施方案中,单链rna寡核苷酸是商业生产的。在一些实施方案中,单链rna寡核苷酸由用户产生。在一些实施方案中,ssrna包含单链rna探针。在一些实施方案中,单链rna探针是商业生产的。在一些实施方案中,单链rna探针由用户产生。[0331]在一些实施方案中,本文所述的单链文库制备方法可用于评估单链互补脱氧核糖核酸(sscdna)的纯度和/或质量。sscdna可以包括单个sscdna种类(例如,具有相同序列和长度的sscdna)或可以包括sscdna种类池(例如,具有不同序列和/或长度的sscdna)。在一些实施方案中,sscdna包含单链cdna寡核苷酸。在一些实施方案中,单链cdna寡核苷酸是商业生产的。在一些实施方案中,单链cdna寡核苷酸由用户产生。在一些实施方案中,sscdna包含单链cdna探针。在一些实施方案中,单链cdna探针是商业生产的。在一些实施方案中,单链cdna探针由用户产生。[0332]ssna、ssrna和/或sscdna的纯度和/或质量可以根据片段长度的评估来评估。可以使用用于确定片段长度的任何合适方法来确定片段长度。在一些实施方案中,根据单端测序读段的长度(例如,其中读段长度覆盖整个片段的长度)确定片段长度。在一些实施方案中,根据双端测序读段的定位位置确定片段长度。在一些实施方案中,根据片段长度谱评估ssna、ssrna和/或sscdna的纯度和/或质量。片段长度谱可以包括具有具体长度的片段的定量。图31提供了示例性片段长度谱。在一些实施方案中,根据片段长度谱中多数ssna、ssrna和/或sscdna种类的量和少数ssna、ssrna和/或sscdna种类的量,评估ssna、ssrna和/或sscdna的纯度和/或质量。多数种类通常是指样品中最丰富的片段长度。多数种类可以指被评估的ssna、ssrna和/或sscdna的预定或预期的片段长度。例如,对于设计为精确包括50个核苷酸的寡核苷酸,对该寡核苷酸纯度和/或质量的评估可能会产生50个核苷酸的多数种类长度。少数种类通常是指不是多数种类的剩余片段长度。少数种类可以指被评估的ssna、ssrna和/或sscdna的非预定或非预期的片段长度。例如,对于设计为精确包括50个核苷酸的寡核苷酸,对该寡核苷酸纯度和/或质量的评估可产生长度大于50和/或小于50个核苷酸,但不会精确是50个核苷酸的少数种类。ssna、ssrna和/或sscdna的纯度和/或质量可以表示为比率或百分比。例如,如果样品中90%的寡核苷酸具有多数种类片段长度并且样品中10%的寡核苷酸(总体地)具有少数种类片段长度,则对多数种类而言,可以认为寡核苷酸是90%纯的。[0333]可以估计或测量样品中带切口dna的数量。例如,可以在切口修复之前和之后从样品中制备测序文库。可以比较两个文库的测序结果,并且可以估计或测量带切口dna的量。带切口dna可以是cfdna,例如由于对经历细胞凋亡并随后在血流中的细胞内基因组dna的内切核酸酶和外切核酸酶活性而生成的cfdna。最初的核酸酶活性可以涉及核小体之间的内切核酸酶活性或dnasei(dna酶i)对核小体的切口活性。了解对切口敏感的核酸区可以为核小体占位提供信息。带切口dna的其他来源包括但不限于ffpe样品、毛发、降解样品和切口酶的体外测试。单链文库制备方法,例如本公开的那些方法,可以捕获带切口片段。此外,本公开的方法保留了由切口生成的末端。直接在带切口分子上进行本公开的方法会生成3条长度不同的链——1个长分子和2个较短分子(例如,图53b)。用切口密封酶(例如hifitaq连接酶)处理会连接两条带切口链;随后用这种密封dsdna进行本公开的方法会产生2条长度相似的链,而看不到在切口处生成的末端(例如图53a)。从两个文库中获得的序列(和片段末端)的比较将表明,在切口被密封的文库中,短片段更少,并且具有位于带切口区侧翼的序列的读段更少。[0334]在实例中,使用n.bstnbi在gdna中生成已知的切口,n.bstnbi在5′gagtcnnnn^n3′处生成切口。一部分带切口gdna样品用hifitaq连接酶进行切口密封,另一部分则没有。如本文所讨论的,对两者进行单链文库制备,并对文库进行测序和比较。从未进行切口的对照gdna显示0.07%以gagtcnnnn结尾的序列读段;未密封的带切口dna显示15.74%以gagtcnnnn结尾的序列读段;带切口dna和切口密封dna显示10.67%以gagtcnnnn结尾的序列读段。[0335]可以对核酸池(例如,适体、sirna、寡核苷酸探针)进行测序,而无需使核酸包含可能影响其特性的侧翼区,例如引物结合位点。可以生成用于给定目的的核酸池,针对所需特性进行一轮或多轮选择,并通过本公开的单链文库制备方法测序。例如,可以生成适体或sirna的随机池,使其进行一轮或多轮阳性和/或阴性选择(例如,结合期望靶标的阳性选择,脱靶结合的阴性选择),并且可以通过本公开的方法对成功的候选物进行测序,而无需使随机适体或sirna包括用于测序的侧翼区;这种侧翼区的存在可能影响适体或sirna的性能。[0336]在实例中,通过化学合成或从合成的dna转录,例如合成核酸(例如,适体、sirna、寡核苷酸探针)的随机池。然后对随机池进行一轮或多轮阳性选择和/或一轮或多轮阴性选择。阳性选择可以包括在越来越严格的结合条件下与期望结合靶标一起孵育。阴性选择可以包括在越来越有利的结合条件下与脱靶结合底物一起孵育。结合条件可以包括但不限于温度、盐浓度、ph、磁场、拥挤剂、竞争性结合剂、抑制剂和其他条件。通过本公开的方法的测序可以在选择之前、在几轮选择之间和/或选择完成之后进行,以允许对池及其变化进行生物信息学分析。可以使用umi或其他条形码来获得池中核酸种类相对数量的数字计数或绝对计数。例如,可以在存在期望结合靶标的情况下进行n轮阳性选择,对每个结合池分别进行测序,以监测结合序列池如何随不同的选择严格性而变化。在不同轮的选择过程中可以发现不同的核酸序列簇。在一些情况下,来自每轮阳性选择的结合核酸可以分别经历其余的选择和文库制备过程,以监测结合核酸库如何随着不同的选择严格性而变化,因为在不同轮的选择过程中可以发现不同的核酸序列簇。[0337]试剂盒[0338]在某些实施方案中提供了试剂盒。试剂盒可以包括可用于以任何合适的组合进行任何本文所述方法的、本文所述的任何组分和组合物(例如,支架衔接子及其组分/亚组分、寡核苷酸、寡核苷酸组分/区、支架多核苷酸、支架多核苷酸组分/区、核酸、单链核酸、引物、单链链结合蛋白、酶)。试剂盒可以进一步包括可用于实施任何本文所述方法的任何试剂、缓冲液或其他组分。例如,试剂盒可包括多个支架衔接子种类或多个支架多核苷酸种类和相应的寡核苷酸组分中的一种或多种、适用于5′磷酸化核酸的激酶(例如多核苷酸激酶(pnk))、dna连接酶及其任何组合。[0339]试剂盒可以包括用于捕获单链dna和/或单链rna的组分。可以配置用于捕获单链dna的试剂盒,由此用户提供双链或单链dna。可以配置用于捕获单链rna的试剂盒,由此用户提供cdna(单链或双链)或提供rna(例如,总rna或rrna耗尽的rna)。用于捕获单链rna的试剂盒可以包括rrna耗尽试剂、mrna富集试剂、片段化试剂、cdna合成试剂和/或rna消化试剂。[0340]试剂盒的组分可以存在于单独的容器中,或者多个组分可以存在于单个容器中。合适的容器包括单管(例如小瓶)、平板的一个或多个孔(例如96孔板、384孔板等)等。[0341]试剂盒还可以包括用于进行本文所述一种或多种方法的说明和/或描述本文所述一种或多种组分的描述。例如,试剂盒可以包括使用本文所述支架衔接子或其组分来捕获单链核酸片段和/或产生核酸文库的说明。说明和/或描述可以是印刷形式,并且可以包含在试剂盒插页中。在一些实施方案中,以存在于合适的计算机可读存储介质上的电子存储数据文件形式,提供说明和/或描述,计算机可读存储介质例如便携式闪存驱动器、dvd、cd-rom、磁盘等。试剂盒还可以包括提供此类说明或描述的互联网位置的书面描述。[0342]实施例[0343]下文阐述的实施例说明了某些实施例并且不限制该技术。[0344]实施例1:无细胞dna(cfdna)的单链特异性文库制备[0345]在本实施例中,描述了单链dna(ssdna)文库制备方法及其修改。下文描述的ssdna文库制备方法通过在衔接子连接之前使所有dna成为单链来捕获双链(dsdna)和ssdna分子。[0346]基本方案[0347]1)在存在热稳定单链dna结合蛋白(ssb)的情况下,通过将dna加热至95℃持续3分钟来产生和维持ssdna,然后在冰上快速冷却试管。[0348]2)制备适当稀释的支架衔接子,并添加a)6x过量的p5和p7支架衔接子组合和b)磷酸化/连接预混液,在80μl反应体积中得到18.5%peg8000最终浓度、1mm最终atp、11mm最终dtt、10mm最终mgcl2、50mmtris-hclph7.5、2000个单位的t4dna连接酶和10个单位的pnk。[0349]3)37℃下孵育1小时。[0350]4)使用qiagenminelutepcr纯化试剂盒进行柱纯化净化。[0351]5)进行索引pcr。[0352]对基本方案的修改和改进[0353]下文描述了对上述基本方案的各种修改。某些修改导致该方案的改进,例如文库质量更好、产量增加、文库生成更快、试剂更少或试剂剂量更低、步骤更少等。[0354]连接酶[0355]测试了从800个单位到2000个单位的t4dna连接酶输入量。结果表明,800个单位足以产生类似于2000个单位的结果。[0356]孵育时间[0357]测试了各种孵育时间。测试的反应时间为5分钟-60分钟。[0358]孵育时间短至5分钟,就产生了相当好的文库。将孵育时间增加到60分钟会增加dna产量,但从30分钟到60分钟的增加极小。[0359]ssdna衔接子连接/磷酸化反应后的纯化[0360]测试了不同的纯化方法。结果表明纯化方法不重要。固相可逆固定(spri)磁珠纯化与柱纯化一样有效。测试了多个spri珠制造商,并且全部运行良好。还测试了从连接/磷酸化反应直接进入索引pcr而无纯化步骤。虽然未经纯化的方法有效,但它在索引pcr后产生较少的产量和更成问题的dna尺寸谱。[0361]维护ssdna[0362]该方法在使用和不使用单链结合蛋白(ssb)的情况下进行。结果表明,即使在低复杂性混合物(例如寡核苷酸池)中,对于该方案来说ssb也不是必要的。结果表明,即使在不存在ssb的情况下,dna在热变性和快速冷却后仍保持足够的单链。测试了来自不同供应商的ssb滴定和ssb,在任何测试条件和无ssb对照之间没有观察到差异。分析的参数包括衔接子二聚体%、dna文库产量、30-130个碱基对(bp)之间的片段%、%作图率、%重复率、%过滤后读段(%readspassfilter)、过滤后读段作图率(passfilterreadsmappingrate)和文库产品大小分布。ssb与无ssb测试的结果如图2a、2b、3a和3b所示。[0363]支架衔接子:底物dna比率[0364]测试了各种支架衔接子与底物dna的比率。结果表明,支架衔接子与底物dna的理想比率约为30x。结果还显示,基础方案中的6x比率太低。[0365]支架衔接子修饰[0366]在进行ssdna连接/磷酸化反应之前用磷酸酶预处理支架衔接子改善了结果,从而增加产量并降低衔接子二聚体。改善如图4所示。[0367]还测试了支架衔接子末端的各种连接/延伸阻断修饰。所有经过测试的修饰都同等有效。[0368]连接/磷酸化预混液[0369]用于衔接子连接/磷酸化反应的组分是预制的并一起储存以方便使用。预混液包括:tris缓冲液ph8、dtt、mgcl2、atp、peg8000、t4dna连接酶和t4pnk。[0370]磷酸化[0371]连接/磷酸化反应的磷酸化(例如pnk)部分对于产生高质量文库不是必需的。将pnk从方案中完全省略或放置在连接步骤的上游,并以任何一种方式生成了高质量文库。此外,只要pnk包含在上游或与连接步骤同时发生,底物dna就可以去磷酸化。[0372]索引pcr[0373]用各种高保真热稳定聚合酶产生高质量文库。产生高质量文库的引物浓度为0.2μm-4μm最终浓度之间的任何浓度。选择1μm作为最终引物浓度。[0374]无pcr的ssdna文库[0375]如果合成含有测序仪相容性所需的所有必需dna序列的支架衔接子(称为“全长衔接子”),则无需索引pcr即可构建高质量文库。参见图5a和5b。在图5a中,支架衔接子的支架多核苷酸(底部链)和寡核苷酸(顶部链)各自包括流动池结合区。在图5b中,支架衔接子的寡核苷酸(顶部链)包括流动池结合区,支架衔接子的支架多核苷酸(底部链)不包括流动池结合区。[0376]peg浓度[0377]在连接/磷酸化反应中测试了0-30%的最终peg8000浓度,结果表明18.5%是理想的加入量。[0378]衔接子二聚体减少[0379]上述单链dna方案的一个问题是,它可以产生高百分比的衔接子二聚体,这很可能是由于支架衔接子的结构所致。为了对抗衔接子二聚体的形成,开发和测试了几种不同的技术,这些技术取得了不同程度的成功。一种技术是,在进行ssdna连接/磷酸化反应之前用磷酸酶预处理支架衔接子(如上所述)。另一种技术是,对连接/磷酸化反应进行体积滴定(如下所述)。其他经测试的技术如下文所述。[0380]进行索引pcr后,进行spri(例如18%peg8000)滴定以及系列和连续spri净化。例如,背靠背进行的两个或多个系列的1.2xspri降低了%衔接子二聚体并增加了文库与衔接子二聚体的相对量。图18显示的凝胶图像和表格证明了四次系列1.2xspri净化的每一次之后二聚体数目减少。系列spri对序列数据的影响减少了由于衔接子伪影而被丢弃的读段的数量,从而增加了可用数据的数量和人类基因组的可作图性。最小片段长度类别(即《100bp)有轻微损失。连续spri-涉及将样品与0.6xspri一起孵育几分钟,然后第二次添加0.6x磁珠至最终量为1.2xspri,也减少了二聚体并增加了感兴趣的文库大小。图19显示了对于cfdna的连续spri的凝胶和agilenttapestation迹线,其显示相对于衔接子二聚体大小的分子,对文库大小的分子的不成比例的回收。[0381]另一种方法是采用选择性限制酶,该酶结合二聚体的互补寡核苷酸在索引pcr前有差别地消化的二聚体,并在有或没有互补寡核苷酸的情况下,在索引pcr后消化二聚体。在此实施例中,添加仅与假定的衔接子二聚体互补的短寡核苷酸并在杂交和连接后孵育,形成双链dna片段,然后添加核酸酶xbai,该酶在存在于双链衔接子二聚体dna内的t*ctaga识别位点处切割。图20显示了假定的衔接子二聚体形成、衔接子二聚体(或寡二聚体)的单链形式以及添加仅与单链二聚体退火的寡聚体的实例。在本实施中,当生成双链杂交产物时形成了xbai识别位点。在pcr过程中,衔接子二聚体将变为双链。因此,xbai处理可以在pcr后进行,无需上述寡核苷酸。虽然在使用和不使用寡核苷酸的情况下使用xbai后观察到衔接子二聚体减少,但这种方法的一个风险或权衡是,感兴趣的基因组dna中xbai位点的耗尽。xbai位点的保留可以通过在xbai处理之前使样品变性和再退火来增加。基因组dna的高复杂性可以阻止感兴趣的gdna再退火,而衔接子二聚体的低复杂性可以导致较高的再退火率,从而使衔接子二聚体成熟以供核酸酶靶向。[0382]在某些配置中,修饰支架衔接子的结构以形成发夹(见图8),或通过添加硫代磷酸酯键进行修饰以增加支架衔接子的刚性并帮助防止核酸酶降解。[0383]连接/磷酸化反应体积[0384]对连接/磷酸化反应进行体积滴定。结果表明,降低整个反应体积增加了产量并抑制衔接子二聚体的形成。在不受理论限制的情况下,这可能是在存在18.5%peg的情况下每单位体积下dna分子末端与衔接子/支架分子的比率的结果。从cfdna产生具有最佳插入分布和最少衔接子二聚体形成的质量最高的文库的比率是,当存在18.5%peg8000的情况下底物dna末端为0.4飞摩尔/微升(fmol/μl)且每个支架衔接子为10fmol/μl时。该比率可以在任何体积下实现,并且可以通过根据需要增加体积或输入dna质量(mass)来克服限制。这个比率可以用许多不同的方式和单位来表示。例如,一个方案包括25μl的最终反应体积、1ng的无细胞dna输入以及添加1.6皮摩尔的每个支架衔接子。[0385]输入(底物)dna滴定[0386]测试了从5ng到100pg的输入dna量。由所有输入量均制备了文库,但250pg以下质量下降。[0387]连接/磷酸化反应温度[0388]测试了16℃-37℃的反应温度。最佳温度为37℃,随着温度降低,dna产量降低,衔接子二聚体%更高。[0389]唯一分子标识符(umi)[0390]将支架衔接子修饰为包括umi多核苷酸。设计一些配置,以将umi整合到支架衔接子中。例如,使用n或肌苷作为随机碱基将umi添加到直接位于插入物侧翼的短衔接子中,或者放置在全长衔接子中的索引条形码旁边(参见图6a或6b)。在图6b所示的配置中,全长p5和p7衔接子在反应过程中被连接。umi可以包含通用碱基、随机碱基或已知碱基。umi的长度可以为1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些配置中,短p5/p7被连接起来,并且在pcr扩增过程中将衔接子制成全长。将n个随机碱基的umi放置在p7衔接子的索引旁边的方法效果很好。[0391]可以在索引pcr之前,使用单引物延伸方法和链置换聚合酶,例如bst聚合酶,将umi多核苷酸掺入单链连接产物或文库中。引物可以各自含有与位于ssna3′的支架衔接子的一部分退火和并引发该部分的序列,和umi多核苷酸。在一些情况下,引物还包括测序索引或条形码序列和流动池结合位点(见图7)。引物在5′末端可以包括或可以不包括阻断修饰。在一个示例性工作流程中,ssna-支架衔接子连接产物可以变性,释放支架多核苷酸,产生单链连接产物(ssna连接到支架衔接子的寡核苷酸组分)。游离支架多核苷酸和单链连接产物各自含有阻断修饰,不能延伸。可以使用链置换聚合酶延伸含有umi或索引的引物(ssna连接产物作为模板),以生成仅在分子p7侧完整的文库链。延伸后,可以进行spri纯化。为了完成完整的索引文库分子,可以使用is4或其他版本的p5索引引物和与流动池结合位点互补的引物进行pcr(见图7)。在工作流程的一个变型中,用dna-尿嘧啶糖基化酶降解变性过程中从ssna连接产物释放的含有脱氧尿苷切割位点的过量支架多核苷酸,以防止它们退火。[0392]发央式衔接子[0393]为了减少衔接子二聚体的形成,设计了支架衔接子的发夹结构(见图8)。使用发夹式衔接子的方法有效,但性能并不比原始衔接子设计更好。[0394]选择性衔接子设计[0395]图9、10和11描述了对支架衔接子的修饰,其涉及操作的选择性顺序、酶或其他试剂的延迟添加、末端dna修饰和/或其他连接酶类型。[0396]一种衔接子配置和工作流程包括分阶段连接和酶延迟(图9)。将非磷酸化或去磷酸化的p5和p7支架衔接子与单链dna模板组合。将不包括pnk的连接预混合液添加到衔接子/模板组合中,并在室温下孵育5分钟。p5衔接子连接于具有5′磷酸酯的dna模板。在p5连接后,将pnk添加到反应中并将温度升至37℃。p7衔接子被pnk磷酸化,p7衔接子的5′磷酸化末端与dna模板的3′末端连接。进行了此工作流程,并且与sop相比,其将二聚体减少了一半且使产量大约翻了一番。此工作流程的一个变型包括延迟添加p7衔接子,直到p5衔接子已经与dna膜板连接后,或延迟添加p5衔接子,直到p7衔接子与dna模板连接后。此工作流程的一个变型包括首先添加磷酸化的p7,但将p5和pnk的添加延迟20分钟。还进行了此工作流程,与sop相比,其将二聚体减少了一半且使产量大约翻了一番。[0397]另一种衔接子配置和工作流程包括分阶段连接、5′appp7衔接子和atp延迟(图10)。将5’appp7支架衔接子与单链dna模板相组合。将不含atp的连接预混液添加到衔接子/模板组合中,并在室温下孵育5分钟。p7衔接子的5′app末端在无atp的情况下与dna模板的3′末端连接。p7连接之后,将非磷酸化或去磷酸化的p5支架衔接子和atp添加到反应中。p5衔接子与具有5′磷酸酯dna模板连接。[0398]另一种衔接子配置和工作流程包括分阶段连接和具有3′磷酸酯的单链p5衔接子(图11)。将模板dna去磷酸化并与具有3′磷酸酯的单链p5衔接子组合。将可以将dna3′磷酸酯末端连接到5′oh末端并优先连接单链的连接酶(例如rtcb)添加到衔接子/模板组合中。p5衔接子的3′磷酸酯末端与dna模板的5′oh末端连接。然后将5′磷酸化的p7支架衔接子和t4dna连接酶添加到反应中,p7衔接子的5′磷酸化末端与dna模板的3′末端连接。此工作流程的一个变型包括在添加单链p5衔接子时将5′磷酸化的p7支架衔接子与dna模板组合。[0399]实施例2:rna的单链特异性文库制备[0400]修改实施例1描述的单链dna文库制备方法,用于将rna分子转化为测序文库。在一种配置中,将从rrna耗尽或mrna富集的总rna生成的第一链dna合成产物掺入本文所述的单链dna文库制备方法中。在另一种配置中,将rrna耗尽或mrna富集的总rna直接掺入本文所述的单链dna文库制备方法中,然后合成第一链dna。除了酶促步骤较少、节省时间和节省试剂外,将单链dna文库制备方法应用于rna,与现有技术相比还具有多项生物学优势。例如,由于本文所述技术的单链性质,可以完全省略第二链合成。所得的rna测序文库可以产生链特异rna测序文库,从而产生更准确的转录本作图。[0401]一种配置的通用工作流程如图15所示,包括以下内容。提取总rna并通过rrna耗尽试剂盒或mrna富集试剂盒继续进行。然后将rna片段化,并使用随机引物和逆转录酶生成第一链合成cdna。进行rna酶h(rnaseh)消化以确保从rna-dna杂交体中去除rna。第一链cdna几乎没有修饰就被供给到单链dna文库制备试剂盒。通常,将cdna变性以去除二级结构。可以包括单链结合蛋白,但通常不是必需的。在磷酸化dna末端的pnk存在下,将本文所述的支架衔接子连接到第一链cdna。除了磷酸化之外,对天然末端没有改变。对连接产物进行净化和纯化,然后通过pcr扩增(例如,索引pcr)。然后对扩增产物进行净化和纯化。[0402]在上述工作流程的一个具体实例中,提取总rna并通过rrna耗尽试剂盒或mrna富集试剂盒继续进行。然后将rna片段化、热变性(94℃,15分钟),并使用随机六聚体/随机八聚体/polyt引物或商业随机引物和m-mlv逆转录酶产生第一链合成cdna。进行rna酶h消化(在37℃下30分钟)以确保从rna-dna杂交体中去除rna。将cdna加热变性以去除二级结构,然后快速冷却。在磷酸化dna末端的pnk存在下,将本文所述的支架衔接子连接到第一链cdna。对连接产物进行净化和纯化,然后通过索引pcr进行扩增。进行此方法并成功构建了文库。文库的分析结果提供在图12、13和14中。[0403]上述方案可以包括一个或多个变型。例如,可以在rrna耗尽(或mrna富集)和rna片段化后将支架衔接子直接连接到rna。然后第一链合成可以使用单链衔接子特异性引物。这种选择性方案也取消了第二条链的合成,但涉及cdna产生上游的额外rna加工(片段化)(参见图16的工作流程)。进行了该方法的一种变型,并成功构建了文库(参见图50所示的工作流程)。在此工作流程中,总rna输入经过mrna富集和/或rrna耗尽,rna被剪切(例如,bioruptor或其他片段化方法),将rna片段连接于本文所述的dna支架衔接子并进行spri纯化,并进行组合逆转录酶和pcr扩增步骤。在组合步骤中,dna/rna杂交连接产物通过逆转录酶(例如m-mlv逆转录酶)转化为cdna,然后通过pcr(例如,使用neb的onetaq一步法rt-pcr和从ssprepillumina相容性衔接子引发的pcr引物)扩增cdna分子。[0404]本实施例所述方案的其他变型可以包括1)在有或没有rrna耗尽(mrna富集)的情况下进行该方法,其中,通过消除随机引物混合物中的核糖体rna结合寡核苷酸,mrna富集、片段化和cdna合成在一个步骤中发生;2)在有或没有rna片段化的情况下进行该方法(例如,如果使用illumina以外的测序仪);3)在有或没有rna酶h消化的情况下进行该方法;4)在有或没有单链dna结合蛋白的情况下进行该方法;5)使用rsap处理的衔接子或非rsap处理的衔接子进行该方法;6)在分离pnk处理并置于上游或不置于上游的情况下,进行该方法;7)在pcr前进行任何类型的净化或不净化,而进行该方法;和8)以各种rna输入量进行该方法。其他变型包括在工作流中组合某些步骤。例如,图17显示了在工作流中组合了某些步骤的修改a、b和c。图50显示了一个示例性工作流程,其中将rna/dna杂交连接产物的逆转录和cdna产物的扩增组合在单个步骤中。[0405]实施例3:定向rna-seq文库制备ngs测定(用于rna的ssprep)[0406]rna-seq是用于基因表达谱和全转录组分析的下一代测序(ngs)工作流程。用于本文所述和图21所示的rna单链文库制备(ssprep)是定向rna-seq文库制备方法,该方法使用独特的ngs衔接子直接从第一链cdna生成文库,从而消除了第二链合成和dna末端修复。结果是提高了文库质量,同时显著降低了成本和时间。[0407]rna的ssprep的特点包括:在约2小时内直接从第一链cdna到序列就绪文库的工作流程;可以使用用户偏好的第一链cdna合成方案;试剂盒含有用于衔接子连接的试剂、索引pcr和用于磁珠纯化步骤的磁珠;针对10ngmrna进行了优化,最少的手动操作时间,以及用很少的pcr循环和减少的偏倚产生的序列就绪文库。rna的ssprep在一步反应中起作用,该反应同时制备用于连接的模板第一链cdna分子,无需末端精修,并连接支架衔接子(即本文所述的支架衔接子)以在平台上测序。例如,下游应用可以包括基因表达谱、同种型分析和剪接变体发现。[0408]mrna输入范围[0409]在本实施例中,证明了使用rna的ssprep方案制作的rna-seq文库的质量度量获得改善。将rna的ssprep方法的度量与商业可得双链(dsprep)方法(即nebnextultraii定向文库制备方法)的度量进行了比较。使用掺入mrna对照,rna的ssprep生成的文库在重复之间具有高度一致性,保留了文库链特异性,并捕获了真实的mrnagc组成。[0410]使用qiagen全制备dna、rna、蛋白质试剂盒从肺癌细胞系h2126中提取总rna。使用nebnextpolya磁性mrna分离模块分离mrna。使用nebnextultraii第一链合成模块,1-20ngmrna用作第一链cdna合成的输入。珠纯化后,根据rna的ssprep方案在索引pcr反应中扩增文库,并在illuminamiseq上测序。从mrna开始,在约4小时内从1-20ng输入生成序列就绪文库(产量如图22所示);在第一条链cdna合成和净化之后,该方案需要约2小时。与其他商业rna-seq试剂盒相比,rna的ssprep需要更少的pcr循环次数来生成序列就绪文库(图23)。[0411]与商业双链制备(dsprep)试剂盒的比较[0412]将rna的ssprep的性能与商业双链制备(dsprep)试剂盒(即nebnextultraii定向试剂盒)的性能进行了比较,该dsprep需要第二链合成。第二条链合成步骤将dutp掺入到互补链中,然后是da加尾、末端填补和衔接子连接。随后对含有dutp的链进行的酶促消化保留了原始链信息。与传统的rnaseq方法不同,rna的ssprep直接发生在第一链cdna上,从而自然地保持转录方向性。[0413]在第一条链合成(nebnext第一条链合成模块)之后,根据制造商的方案完成每个文库。为了评估rna的ssprep的相对性能,使用了可从外源rna对照协会(ercc)获得的掺入对照(每10ng复制mrna样品1000摩尔对照)。该对照是92个浓度、长度和序列已知的转录本的混合物,该转录本模拟真核mrna但不定位到人类基因组。设计ercc对照以评估与预期转录组复杂性的偏差。[0414]每个文库的测序深度大于1000万个读段(illuminamiseq2x76bp)。使用starv2.6.1d将读段定位到人类或ercc对照参考基因组。两种文库方法都显示了可比较的作图度量:>90%的唯一定位读段、最少的核糖体读段和链特异性的维持(图25,顶部图)。为人类和ercc读段二者确定了归一化读段计数。对于人类读段(图25,底部图)和ercc读段(未显示),在复制品和两种方法之间观察到高度一致性。[0415]进一步的分析表明,rna的ssprep在整个基因体中均匀捕获序列,而商业试剂盒文库具有轻微的5′偏倚(图26,顶部图)。这种偏倚也反映在转录组的基因组组成中,观察到未翻译区的回收率更高(图26,中部图)。两种方法生成的文库的人类dnagc组成略有不同,但是通过比较掺入对照的观察到的gc组成与预期(44.5%)gc组成,显示rna的ssprep比商业试剂盒更接近其预期值(图26,底部图,插图)。掺入对照分析还显示,对于两个文库而言,几乎100%的定位ercc读段来自正确的链(图27)。[0416]实施例4:用于分析无细胞dna和单链寡核苷酸的ngs文库制备的单链方法[0417]在本实施例中,介绍了一种经设计从低输入cfdna产生复杂文库而不会改变模板分子的天然末端的简单有效的基于连接的ssdna文库制备方法。这种方法有时称为ssprep,在组合的一步磷酸化/连接反应中起作用。ssprep方法制备用于无需末端精修而连接的模板dna分子,连接独特设计的下一代测序(ngs)支架衔接子。ssprep方法是一种快速高效的单链文库方法,其方案时间和测序结果比得上最高效的双链文库制备dna方法。使用两组独立的合成寡核苷酸证明了ssprep的天然末端保留的效用,并展示了ssprep测定单链寡核苷酸纯度的能力。最后,证明从ssprep生成的cfdna下一代测序数据可用于分析健康个体的核小体定位和转录因子结合位点。因此,ssprep是可将片段化dna分子(如cfdna片段)转化为保留天然长度和末端的测序文库的快速且通用的工具。[0418]本实施例描述了一种经设计从一纳克(ng)dna产生复杂的ngs文库,而不会改变模板分子的天然末端的快速、简单且有效的基于连接的单链dna文库制备方法(ssprep)。ssprep方法不需要外来试剂,可在2.5小时内完成,并在组合的一步磷酸化/连接反应中工作,该反应在连接illumina衔接子的同时制备用于无需末端精修而连接的模板dna分子。[0419]介绍了由健康人类cfdna供体制成的ssprep文库产生的标准测序度量,并将其与来自传统的末端精修的dsdna文库方法的结果进行了比较。将使用ssprep生成的ssdna文库与使用合成双链寡核苷酸的dsdna制备进行比较。接下来,证明了ssprep捕获长度短的ssdna片段的能力,并证明了使用不同长度和已知序列的单链合成寡核苷酸测定寡核苷酸纯度的能力。最后,证明了ssprep文库如何能够通过捕获广范围的dna片段而不改变其天然5’(5-prime)和3’(3-prime)末端来允许改进cfdna数据的分析。鉴于其效率和易用性,ssprep可以在许多应用中代替ssdna和dsdna文库制备方法。[0420]方法[0421]本实施例使用了以下方法。[0422]人类无细胞dna制备[0423]从加利福尼亚州帕洛阿尔托的斯坦福血液中心(stanfordbloodcenterinpaloalto,ca.)获得了来自未识别捐赠者的全血用于体外研究。通过在4℃下以1800g旋转采血管10分钟,从全血中提取血浆。在不干扰细胞层的情况下,将上清液在无菌条件下以2ml等分试样转移到微量离心管中,并在4℃下以16000g再次离心10分钟以去除细胞碎片。使用循环无细胞dna试剂盒(qiagentechnologies)按照制造商的方案从4ml血浆中制备cfdna。使用quant-it高灵敏度dsdna测定试剂盒和qubit荧光计(thermofisherscientfic)测量纯化的无细胞dna(cfdna)的浓度。使用tapestation和相关的d5000或d1000高灵敏度产品(agilent;图33a和33b)分析了cfdna尺寸分布。[0424]合成寡核苷酸制备[0425]使用gc含量为50%的随机序列发生器设计双链合成寡核苷酸(如下文表1所示);去除了与公共数据库中任何已知生物体匹配的序列。每个dsdna寡核苷酸(n=12)是独特的50nt双链dna序列,具有一个平末端和一个3’或5’单链随机序列突出端,长度为1-6个核苷酸。使用标准脱盐纯化来合成寡核苷酸,并通过集成dna技术(integrateddnatechnologies,idt)双链体化;所有随机核苷酸都是“手工混合”以减少合成偏倚。对照寡核苷酸以等摩尔比汇集在一起,用于单链文库制备(ssprep)。[0426][0427]以与双链对照寡核苷酸相同的方式生成单链合成寡核苷酸(如下文表2所示)。除非另有说明,否则对于长度为20-80nt的ssdna寡核苷酸使用标准脱盐纯化来合成寡核苷酸,对于长度为90-120nt的ssdna寡核苷酸使用超聚体纯化来合成寡核苷酸。[0428][0429]ssprep衔接子制备[0430]正向(p5)ssprep衔接子和反向(p7)ssprep衔接子都是双链支架衔接子。正向ssprep衔接子在衔接子的支架部分含有5’突出端,在连接末端含有一个游离的3’oh末端;所有其他末端都含有连接和延伸阻断修饰。反向ssprep衔接子在衔接子的支架部分含有3’突出端,在连接末端含有磷酸化的5’末端;所有其他末端都含有连接和延伸阻断修饰(下文表3)。ssprep衔接子使用标准脱盐纯化合成,并通过集成dna技术(idt)进行双链体化。通过在te+50mmnacl中稀释衔接子来制备衔接子的工作储备液。[0431][0432]ssprep文库制备[0433]在冰上在22μl变性反应中将1ng纯化的cfdna或5ng合成寡核苷酸(由quant-it测量)与10mmtrisph8.0和8ngetssb(newenglandbiolabs)组合。将反应置于预热至95℃的热循环仪中并孵育3分钟,然后立即放回冰上,持续至少2分钟。将1pmol正向和1pmol反向ssprep衔接子,以及将peg-8000、t4dna连接酶缓冲液、t4pnk和t4dna连接酶(均来自newenglandbiolabs),添加到冰上的变性反应中,至最终体积为50μl。添加peg-8000至终浓度为18.5%v/v。添加t4dna连接酶缓冲液至终浓度为1x。添加t4pnk和t4dna连接酶至终浓度分别为10个单位和800个单位。将该连接反应在37℃下孵育1小时,然后使用minelutepcr纯化试剂盒(qiagen)和制造商的说明进行纯化,但有以下变化:在台式离心机上以6000rpm进行初始结合旋转。重复洗涤旋转总共两次洗涤旋转,并且两次洗涤都在6000rpm下进行。在15μl10mmtrisph8.0中洗脱dna。[0434]通过将纯化的连接dna与1xkapahifihotstartreadymix(kapahifi高保真热启动预混液)(roche)和2mm最终浓度的通用引物和2mm最终浓度的索引引物在50μl反应中组合,对ssprep文库进行索引,并使用以下热循环条件进行扩增:在98℃下进行3分钟的初始变性,然后在98℃下20秒、68℃下30秒、72℃下30秒进行10个循环,最后在72℃下进行1分钟的延伸步骤。索引pcr后,用1.2xampureclean(beckmancoulter)纯化ssprep文库,并在20μl10mmtrisph8.0中洗脱,使用片段长度分布和dsdna浓度(agilenttapestation4200和qubit荧光定量单元)计算最终摩尔浓度估计值。[0435]双链dna文库制备[0436]取1ng纯化的cfdna或5ng合成寡核苷酸,由quant-it测量,按照nebnextultraii手册所述,使用所提供的试剂、推荐的ampure净化率和推荐的索引pcr循环,进行文库制备(末端精修、衔接子连接、索引pcr)。[0437]测序[0438]由fulgentgenetics在illuminahiseqx上以2x151读段长度对所有cfdna文库进行测序。按照制造商的说明,在内部的illuminamiseq台式测序仪上以2x151bp的读段长度对所有合成寡核苷酸文库进行测序。[0439]读段处理[0440]首先使用bwamem以默认参数将测序数据与phix基因组进行比对。未定位到phix(samtoolsfastq-f12)的提取读段用于下游分析。去除相邻的衔接子序列并同时合并读段。该过程包括基于序列相似性将正向和反向读段折叠成单个序列,同时使用seqprep(github.com/jstjohn/seqprep)修剪与已知illumina衔接子序列匹配的读段的末端。将过滤后保留的合并读段与从ucsc基因组浏览器下载的hg19人类参考基因组(下文的表4和5)或对应于合成寡核苷酸序列的自定义fasta文件(表1)进行比对。bwaaln和bwasampe以默认参数用于对齐和作图。由samtoolsflagstat确定对于人类文库的作图率。然后使用samtoolsrmdup去除重复读段。[0441][0442][0443][0444][0445]qc度量[0446]对于大多数分析,在分析前,使用samtools合并,将来自相同制备方法和相同cfdna提取物的个体文库的bam文件合并到样品和文库特定的bam文件中。对于合并读段的插入长度分布,对于相同的制备方法和cfdna提取,从使用samtoolsview-q20-f66生成并使用concatenate(连接)命令组合的个体文库的bam文件中解析插入长度信息。计算每个长度的读段频率,并将其绘制为总文库的读段百分比。使用samtoolsview-s从下采样合并重复去除的bam文件中提取归一化的基因组覆盖度,以便所有库具有相同的覆盖度。通过将下采样bam文件从samtoolsview-q20-b中输入到bedtoolsgenecov中,获得数据。通过在下采样之前为每个文库制备方法的每个cfdna输入样品仅组合3个文库来获得preseq复杂性估计,以免人为地增加ssprep的复杂性,ssprep的每个cfdna提取物具有比nebnextultraii更多的文库。为ssprep样品a组合的文库是:a1、a2、a3。为ssprep样品b组合的文库是:b6、b7、b8。为样品a和样品b的nebnextultraii组合的文库分别为ds1a-ds3a和ds4a-ds6a。在组合和下采样之后,使用preseqlcextract进行复杂性估计和外推。使用picardtools(broadinstitute)collectgcbiasmetrics从下采样合并重复去除的bam的文件中获得gc覆盖度。对于每种文库类型,通过计算在片段的两个读段上跨越-2到+34个碱基的区域的每个位置处每个碱基的比例,即碱基组成,进行片段末端核苷酸分析。使用该碱基沿该区域长度的模式,将每个位置的碱基组成归一化,并进行log-2转换。对于两个读段,计算了两个文库类型的归一化、对数转换比例,并绘图。使用ggplot2在r中生成所有图[0447]合成寡核苷酸分析[0448]使用类似于samtools深度的自定义脚本确定寡核苷酸中每个位置的双链合成寡核苷酸测序覆盖度,并使用ggplot2绘制在r中,作为在0碱基坐标中跨寡核苷酸长度的百分比的函数。[0449]单链合成寡核苷酸的片段长度分析的进行,与对于cfdna的片段长度分析类似。[0450]cfdna的生物学分析[0451]对于二核苷酸频率计算,使用samtoolsview-bh-f0x10-m-m-q20解析来自针对每一文库制备方法的组合样品a和样品b文库的合并bam文件,以提取具体插入长度的正向读段:167bp(染色体-包裹的dna长度)、144bp(核心颗粒包裹的dna长度和83bp(较短的dna长度,作为峰值出现在图29,图a中)。对于每个插入长度,对于100bp或11bp窗口的所有16个2聚体(2-mer)组合,其中分别在5’和3’片段化点添加了100bp或11bp的基因组环境,使用自定义python脚本估计在两个片段化点附近的二核苷酸计数。对于在两端用100bp侧翼窗口生成的数据,去除重叠区(其正当地具有相同的计数)。使用中值过滤器将数据归一化,并针对弱(aa/at/ta/tt)与强(cc/cg/gc/gg)二核苷酸相互作用绘制二核苷酸频率,使得插入物的中心为0,片段化点上游的区具有负值,并且下游具有正值。对于使用11bp侧翼窗口生成的数据,使用中值过滤器将数据归一化,并使用r绘制5’和3’末端的弱与强二核苷酸的二核苷酸频率。[0452]基因组中每个位置的wps得分通过收集在该位置周围的窗口中对齐的读段来确定(snyderetal.,cell164,57-68(2016)所述),在大片段分析的情况下为120bp,在短片段分析的情况下为35bp。得分计算如下:插入物每次在该窗口中开始或结束,从得分中减去一个。如果插入物未在该窗口中开始或结束,但仍与其对齐,则会在得分中添加一个。通过在不重叠的1000bp片段上取wps得分并通过减去中值wps得分调整到中值得分为零,来计算归一化wps得分。然后通过savitzky-golay过滤器平滑分数:将二阶多项式拟合到21bp窗口中每个位置的中值调整得分。平滑的得分是该位置的多项式的值。通过计算一组等长区域中的每个区域中每个位置的wps得分平均值,计算该组等长区域的平均wps得分,其中位置1是该组中每个区域的第一个核苷酸,位置2是每个区域中的第二个核苷酸,等等。如snyderetal.,cell164,57-68(2016)中所述,选择ctcf位点。从ucsc基因组浏览器表浏览器(genomebrowsertablebrowser)的jaspar2018表(hub_186875_jaspartfbs)将含有推定的tf结合位点列表的bed文件下载到到bed文件中,并过滤以仅包括ctcf位点。将这些位点与来自19个细胞系的ctcfchipseq数据进行了比较。在所有19个细胞系中具有重叠的chipseq峰的推定结合位点用于进一步分析。[0453].缩写[0454]cfdna:无细胞dna;ngs:下一代测序;ssdna:单链dna;dsdna:双链dna;bp:碱基对;nt:核苷酸;ssb:单链结合蛋白;ffpe:福尔马林固定石蜡包埋;ctdna:循环肿瘤dna;wps:窗口保护得分。[0455]文库构建[0456]本实施例描述的ssprep方法从片段化或降解的模板dna生成illumina测序文库(图28)。模板dna可以是dsdna、ssdna和带切口dsdna的复杂混合物,其首先被热变性,然后立即冷激,以使所有模板dna分子均匀地单链化。通过包括热稳定单链结合蛋白(ssb),在整个连接反应中将dna保持为单链。接下来,将现在是均匀的单链并涂有ssb的模板dna,与含有单链突出端的定向dsdnangs衔接子置于磷酸化/连接双重反应中。[0457]正向和反向测序衔接子具有相似的结构,但不同之处在于为了促进正确的连接哪个末端是未阻断的。除了出现在正向衔接子底部链的3’末端和反向衔接子底部链的5’末端的随机7碱基对(bp)单链支架突出端外,两个测序衔接子都是dsdna。以此方式,正向(p5)illumina衔接子总是被递送到模板分子的5’末端,而反向(p7)illumina衔接子总是被递送到模板分子的3’末端。[0458]在双重磷酸化/连接反应过程中,t4多核苷酸激酶(pnk)通过磷酸化5’末端和使3’末端去磷酸化来准备用于连接的模板dna末端。t4pnk对ssdna和dsdna分子都起作用,但对蛋白质的磷酸化状态没有活性。同时,支架衔接子的随机碱基与单链模板分子退火。这生成了短的局部dsdna分子,使得能够用t4连接酶将dna模板与衔接子连接,t4连接酶在双链dna模板上具有高连接效率,但在ssdna上具有低连接效率。单次磷酸化/连接反应完成后,将文库dna纯化并直接放入与单索引和双索引引物相容的标准ngs索引pcr中。[0459]ssprep方案的性能[0460]为了评估ssprep产生的数据的质量和数量,使用ssprep和标准末端精修dsdna文库试剂盒(newenglandbiolabsnebnextultraii;也称为商业试剂盒或dsprep),从获自两个健康人类个体的两个血浆cfdna提取物(样品a和样品b),生成几个测序文库。在文库制备和定量(图33a和33b)之后,将文库在illuminahiseqx(2x150bp)上进行双端测序,每个cfdna提取物约有4亿个读段对。组合从相同cfdna提取物和文库制备方法生成的文库中的测序数据,用于分析。当正向和反向序列读段重叠时合并这些读段以生成代表原始dna片段的单个读段。由于cfdna的多数序列读段为约167bp长,因此仅将合并的读段(其中读段1和读段2重叠至少30bp的互补性)用于下游分析(上文的表4和表5)。对于每个cfdna提取物的ssprep和dsprep样品,生成的数据导致人类基因组的约15倍的覆盖。[0461]由ssprep和dsprep(商业试剂盒)cfdna生成的文库具有为cfdna片段典型特征的长度分布特征。它们都显示了以167bp的染色体长度为中心的片段长度分布。它们都在较短的片段中显示出锯齿型,这是dna酶i以10.4bp的周期切割核小体结合dna的暴露的小沟的结果(图29,图a;图34)。然而,如图29图a及其插图所示,两种制备方法的不同之处在于不同片段长度下捕获的读段比例以及锯齿型中存在的子峰的长度分布。与dsprep相比,ssprep文库具有更高丰度的较短的-即亚核小体长度的-读段,在锯齿图案中具有较短的亚峰。亚核小体尺寸的读段比例的增加反映了ssdna方法将短和/或带切口dna片段转化为序列库分子的能力增强。在不受理论限制的情况下,亚核小体峰大小的差异可能是由于ssprep与dsdna方法相比能够保留天然末端所致。在dsdna文库方法中,填补了5’突出端并去除了3’突出端。因此,观察到的给定dna分子的长度会取决于存在何种类型的突出端。此信息在dsdna文库制备所需的末端精修步骤中丢失。[0462]比较了两种cfdna提取物的ssprep与dsprep(商业试剂盒)文库的读段覆盖度、gc含量和复杂性(文库中独特分子的数量)。图29的图b显示,ssprep产生与dsprep试剂盒相似的覆盖倍数,并且两种方法都产生相对均匀的基因组覆盖度。图29的图c显示,ssprep文库的gc含量类似于dsprep试剂盒的gc含量,后者反映了人类基因组参考的gc含量(直方图,以灰色绘制)。ssprep与dsprep之间低gc含量区所示的差异可能是索引pcr期间所用的聚合酶(nebq5对比kapahifihsrm)的差异的结果,也可能是合成ssprep支架衔接子的随机部分时富gc偏倚的结果。图29的图d显示,在3亿读段或约一个hiseq测序泳道的测序深度下,估计ssprep文库比dsprep文库具有更高的分子复杂性。在不受理论限制的情况下,这种差异可能反映了ssprep恢复传统dsdna文库制备中丢失的带切口链和ssdna链的能力。[0463]大多数dsdna文库制备,包括本实施例使用的dsprep试剂盒,都会对输入dna分子进行末端精修。由于ssprep方法将测序衔接子递送到dna片段的天然末端,因此可以使用单核苷酸分辨率检查每个dna片段准确的5’和3’末端及其周围的碱基组成。注意,末端精修过程保留了分子的天然5’末端。然而,当存在任一类型的突出端时,t4dna聚合酶的5’突出端“填补”和3’突出端外切核酸酶活性会生成不代表原始分子的3’末端。通过这种方式,预期末端精修程序使所有3’末端反映什么存在于互补链5’末端。[0464]为了测试dna末端信息的差异,对于ssprep和dsprepcfdna文库,比较了从合并的读段数据集推断出的正向(读段1)和反向(读段2)读段在跨起始坐标的每个位置的碱基组成(图29,图e)。有四个值得注意的发现。首先,对于ssprep和dsprep两者,在每次读段开始时以及生物片段化点的上游都存在与平均碱基组成的显著偏差。其次,与dsdna文库数据不同,ssprep文库中正向读段起点和反向长读段起点的平均碱基组成不同。这表明cfdna片段通常含有在dsdna文库制备的末端精修步骤中发生改变的突出端。第三,dsprep文库中正向读段起点始的平均碱基组成恰好是反向读段起点平均碱基组成的反向互补物(dsprep生成均匀平末端的分子,即末端精修的副产品))。最后,ssprep文库中正向读段起点的平均碱基组成几乎与dsprep文库相同(末端精修保留了天然5’末端,ssprep直接连接程序也是如此)。[0465]评估ssprep的特征[0466]5’和3’突出端[0467]鉴于cfdna在5’和3’末端碱基组成的差异,设计了一项实验来测试ssprep制备方法和dsdna文库制备方法(如nebnextultraii)是否正在改变(或不改变)输入dna片段。以等摩尔浓度构建了12个合成的双链寡核苷酸池,每个都具有具体长度和类型(5’或3’)的突出端。每个双链体都含有对每个突出端类型都是独特的50个核苷酸(nt)的核心序列,并具有共同的结构:一侧是平末端,另一侧是随机序列的具体长度(1-6nt)的5’或3’突出端(图30,图a;表1)。[0468]通过将这个寡核苷酸池掺入cfdna提取物中生成ssprep和dsprep文库。从测序数据中,通过将文库作图到含有每个寡核苷酸的已知独特的50nt核心序列的参考文件,来鉴别源自寡核苷酸池的读段。对于池中每个寡核苷酸,计算每个位置的覆盖深度,包括突出部分。结果(图30,图b)表明,与合成寡核苷酸的双链区相比,ssprep在突出区产生的覆盖度降低,说明该方法产生准确表征输入dna的链特异性数据(strandeddata)的能力。相比之下,dsprep产生的文库展示了削平的结果。5’突出端被填补,从而几乎完全覆盖了具有已知的5’突出端的分子的互补链。另一方面,当3’突出端序列存在时,3’(3’)外切核酸酶活性导致其几乎完全丢失。[0469]单链寡核苷酸文库[0470]为了在定义的输入dna模板长度范围内测试ssprep的效率,设计了一组11个单链寡核苷酸(标准脱盐纯化),其长度范围为20-120个核苷酸,长度间隔为10nt(表2)。使用等摩尔浓度的每种寡核苷酸制备池,并从该池生成ssprep文库。对来自这些文库测序的模板长度比例的分析表明,ssprep方案生成了跨越该长度范围的ssdna文库(图31,图a)。作为对照,尝试从该单链寡核苷酸池生成dsprep文库;该方案根本不能使用唯一单链输入dna模板生成任何文库(文库含有衔接子二聚体,但在预期尺寸分布下未检测到产量)。[0471]ssprep数据分析中有几个值得注意的观察结果。首先,最短的测试寡核苷酸(长度为20nt和30nt)在文库中呈现不足。这可能是由于连接后的珠净化步骤所致,净化步骤对在此大小范围内的dna寡核苷酸有长度偏倚。其次,在较长(>=40nt)的测试寡核苷酸中,文库转化效率存在一些变化。这种变化可能是由于测试寡核苷酸的细微偏倚造成的,对于每个长度而言,测试寡核苷酸都单个固定的序列。最后,观察到与输入寡核苷酸长度不对应的寡核苷酸长度的连续背景分数(fraction),并且观察到20-120之间每个长度的至少一些读段。[0472]为了测试这些意外长度的读段是由于截短和不完整的寡核苷酸合成还是由于较长单链寡核苷酸的不稳定断裂所致,将ssprep文库中的所有读段定位到它们各自的寡核苷酸参考(图31,图b;下文的表6)。每个寡核苷酸都存在截短产物。这些截短的dna片段的长度几乎均匀地分布在寡核苷酸的长度上。定位到每个寡核苷酸的正确、全长读段的分数(fraction)作为寡核苷酸长度的函数而减少。这样的观察表明了寡核苷酸合成磷酰胺方法的局限性。这些观察结果与在碱基添加的每个化学循环中核苷酸掺入效率低于100%的模型一致。[0473][0474]为了测试ssprep是否可以评估经历各种纯化方法的寡核苷酸的纯度,使用三种常见方案纯化60nt寡核苷酸:标准脱盐、hplc和page纯化。使用来自所有三种纯化方法的60nt寡核苷酸一式两份构建了ssprep文库。将序列数据定位到60nt参考序列(图31,图c)表明,与标准脱盐寡核苷酸生成的文库相比,在hplc和page纯化的寡文库中,归因于预期全长序列的读段的比例增加,而截短产物(定义为长度短于60nt的读段)减少。这些结果与基于亚磷酰胺合成(integrateddnatechnologiesproductliterature)的每种纯化方法的推断质量一致,并表明ssprep可用作确定化学合成的dna寡核苷酸纯度的简单而灵敏的测定方法。[0475]ssprepcfdna文库分析[0476]多数cfdna片段源自包裹在核小体周围的dna,核小体可保护dna在细胞死亡过程中免遭核酸酶降解。因此,cfdna片段的基因组图谱位置可用于推断组蛋白和其他dna结合蛋白在产生cfdna分子群的组织中的位置。单链dna文库方法,与本实施例所述的ssprep一样,保留了cfdna片段的天然末端,因此就这些蛋白质保护dna免受核酸内切酶活性影响而言,所述方法最大限度地可用于推断组蛋白和其他dna结合蛋白的位置。将来自两个健康个体(样品a和样品b)的ssprep数据组合以获得30倍的平均基因组覆盖。根据这些数据,检查了ssprep文库揭示定位核小体和其他dna结合蛋白方面的能力。[0477]核小体定位至少部分由基因组编码。对于与组蛋白结合的dna,当小沟面向组蛋白时,a/t双核苷酸通常被偏好,而当小沟面向外时,g/c二核苷酸通常被偏好。因此,当进行汇总分析时,与周围的基因组区相比,来自核小体保护的dna的dna片段应在捕获片段内含有振荡模式,即富含a/t和耗尽g/c域,紧接着是富g/c和耗尽a/t区。为了测试这种振荡模式是否存在于ssprep数据中,检查了在三个片段长度即167、144和83bp的分子中a/t和g/c基因组二核苷酸,包括三个读段长度中每一个上游和下游的100nt碱基(图32,图a)。每个都以序列的中点为中心。如所指出的,167bp对应于包裹在核小体核心颗粒周围的dna长度加上相关的接头区,144bp代表仅包裹在核小体核心颗粒周围的dna长度,83bp可能代表源自核小体相关dna的降解产物。[0478]观察到,与周围基因组区相比,测序分子长度内a/t和g/c二核苷酸的振荡富集。还观察到83bp片段长度上游约55bp的强振荡信号,表明这些分子可能衍生自降解的核小体相关dna。在dsprep方法的定义片段长度内也观察到这种二核苷酸振荡(图32,图c)。然而,没有观察到dsprep数据在83bp片段长度中的上游振荡信号。这可能是由于dsdna制备方法中短片段的回收率低,或者dsdna制备将片段化或带切口dna转化为测序文库的能力存在其他差异所致。[0479]二核苷酸介导的组蛋白包裹的另一个特征是,当小沟可接近时,发生dna酶i介导的切口。这种现象导致的g/c二核苷酸在核小体相关片段末端的特异性富集(图32,图a-d)。由于dsdna末端精修步骤,dsprep数据中5’和3’末端的末端谱是彼此的镜像(图32,图d)。在ssprep与dsprep之间显著不同的3’末端的二核苷酸频率表明大量不同的突出端群出现在核小体相关cfdna片段群中(图32,图b和d)。[0480]接下来,使用窗口保护得分(wps)检查核小体定位。wps是基因组中某个位置是否倾向于受到免遭内切核酸酶活性的保护或富含内切核酸酶活性的量度。它是多少读段跨越给定位置(因此未被切割)相对于多少读段在该位置开始或结束(因此被切割)的函数。使用ssprep数据在包含12号染色体上定位良好的核小体的区域,计算归一化wps。将wps结果与使用可选ssdna文库方案的先前结果进行比较,观察到峰和谷位置的良好一致性(图32,图e);总皮尔逊相关:r=0.80,p<0.0001)。[0481]通过计算实验确定的转录因子ctcf结合位点上游1kb或下游1kb内长度落入长尺寸箱(120-180bp,推测来自组蛋白保护的片段长度范围)和短尺寸箱(35-80bp,推测富含受其他dna结合蛋白保护的片段)的片段的归一化wps(图32,图f),进行ssprep数据的第二个wps验证。ctcf是dna结合蛋白,可封闭其结合的组蛋白并组织上游和下游的组蛋白定位。长片段wps显示出以推定的ctcf结合位点(位置0)为中心的降低和以约180bp的周期在两个方向上向外延伸的振荡模式,表明核小体定位良好。短片段结果显示了以推定的ctcf结合位点为中心的强峰,可能是由于ctcf的保护避免了核酸内切酶活性的影响。在上游和下游,较小的振幅振荡与不存在除核小体之外的dna结合蛋白的一致。[0482]实施例5:用于无细胞dna的ssprep试剂盒[0483]在本实施例中,描述了用于从单链无细胞dna制备ngs文库的试剂盒。ssprep试剂盒的示例性工作流程如图36所示。[0484]用于无细胞dna的ssprep试剂盒的特点包括:双链体dna回收以及标准制备中丢失的单链dna和带切口双链体dna;1ng的低输入产生复杂的文库并节省宝贵的样品;单一反应减少了由于错误导致的故障,减少了工作时间;没有末端精修保留所有dna片段的天然末端;短片段长度的出色回收;无下游数据修整确保管线相容性;在不到3小时内从dna到序列就绪的文库;每个试剂盒都提供用于文库制备、索引pcr和珠纯化的试剂;可用于单索引和双索引以及唯一分子标识符(umi)掺入的选项;针对1ng无细胞dna进行了优化,输入浓度低至50pg/μl;以及优化的预混液和最少的移液步骤确保标称操作时间(nominalhandsontime)。ssprep试剂盒的下游应用包括:外显子组测序、面板富集(panelenrichment)、核小体定位、snp识别以及新发现。ssprep试剂盒的使用领域包括:液体活检、肿瘤学、产前检测和移植医学。[0485]在血浆和其他体液中循环的无细胞dna含有丰富的临床相关生物学信息,并且可以从微创手术中回收。从cfdna获得的ngs数据可以揭示细胞生物学的各个方面,例如产前健康、器官移植接受或排斥、癌症检测和进展以及许多其他疾病。[0486]从血浆cfdna中提取的大多数dna片段的长度都集中在167个碱基对(bp)左右,并且通常是组蛋白单体结合dna防止其被核酸酶降解的结果。此外,来自血浆的cfdna含有少数有价值的短长度大小的dna片段(30-100bp),这些片段包含转录因子、其他dna结合蛋白、线粒体dna和微生物源dna的足迹,所有这些都增加了cfdna序列数据的细节(图37)。[0487]单链文库制备方法的优点包括能够捕获(1)较短和损坏较多的片段和(2)比dsdna制备更多样化的dna分子,但不会丢失双链体dna链。然而,尽管有这些优势,但现有的单链dna文库制备方法和试剂盒阻碍了ngs群体的广泛采用,这些方法和试剂盒比传统dsdna方法更耗时,需要外来或单一来源的酶,并且在某些情况下会产生测序伪影。[0488]本实施例描述的ssprep试剂盒是一种简单且高效的基于连接的单链dna文库制备方法,该方法经过工程设计可从1ng输入cfdna生成复杂文库,而不会改变模板分子的天然末端。ssprep可与传统dsdna试剂盒的产量、复杂性和制备时间相媲美,并提供dsdna试剂盒无法提供的额外信息,例如短片段覆盖度增强和保留天然末端,所有这些都在单个反应中(参见图38)。[0489]ssprep文库产生高dna产量[0490]索引后文库产量衡量文库的成功,并且是整体转化性能的间接度量。ssprep返回高dna产量,允许用户在测序前更灵活地进行测序和下游富集(见图39)。[0491]ssprep文库作图率和短片段保留[0492]ssprepcfdna文库的作图性能与市场上最好的商业试剂盒相当。ssprep通过捕获更高百分比的具有短插入片段(30-100bp)的读段来帮助研究人员利用短cfdna片段中编码的有价值的生物学,从而超越并胜过其他商业试剂盒(参见图40和41)。[0493]ssprep文库定位的插入长度提供生物信号的细节[0494]ssprep文库产生的典型cfdna分子长度谱显示出约167bp的组蛋白单体为中心的显著片段长度分布和揭示10.4bp周期性的锯齿型,该锯齿型可能是dna酶i切割核小体结合dna的暴露小沟所致。ssprep与dsdna制备的区别在于(图42a):(1)它能够捕获增加比例的亚核小体尺寸的片段并保留短dna片段,以及(2)省略dna削平步骤以恢复天然dna末端,揭示了真正的片段长度谱,如由比dsdna对应物略短的次峰(sub-peak)所证明。与ssprep或dsdna方法不同,swiftaccelngs1splus数据需要在作图之前进行读段修整,因为在其制备过程中添加了非模板核苷酸。这消除了生物信号(无锯齿型)并人为地使插入分布变得得更小(图42b)。[0495]ssprep生成复杂的文库[0496]ssprep保留了天然末端,而不牺牲文库的复杂性。ssprep从1ng输入生成复杂的文库,与市场上最好的商业试剂盒相当,无需末端精修(见图43)。[0497]ssprep文库产生统一的gc覆盖度[0498]文库质量的另一个度量跨gc谱的覆盖度。ssprep显示对低富gc区的基因组覆盖度与nebnextultraii试剂盒的比率相似,几乎全部一致地覆盖人类基因组gc含量箱的大部分,并且相对于其他试剂盒,高gc含量区的覆盖度增强(参见图44)。[0499]ssprep促进cfdna生物学发现[0500]无细胞dna含有可用于探索多种生物信号的核小体定位信息,例如组织起源调查、表达相关性和癌症演化。图45显示了来自12号染色体的良好定位核小体的高度保守区的ssprepcfdna文库的标准化窗口保护评分(wps)。正弦曲线表示有序的核小体定位,峰是cfdna片段的核小体保护最强的地方。[0501]局部二核苷酸组成对于核小体的旋转定位很重要。g/c与a/t二核苷酸之间的周期性振荡促进了dna对组蛋白的包裹。此外,dna酶i对dna的切口发生在富g/c的二核苷酸区,因为那是当小沟面向外并且dna酶i可以接近时。ssprep文库保留了核小体定位的这些特征,正如图46中通过读段长度中的振荡频率和片段化终点处的g/c二元体的富集所观察到的。[0502]实施例6:核酸片段大小富集[0503]在上文某些实施例所述单链文库制备方法的一些变型中,在使用spri纯化进行扩增之前纯化连接产物(例如,连接于本文所述支架衔接子(或其组分)的单链样品片段)。在本实施例所述的一些变型中,在spri纯化之前使用一定量的洗脱缓冲液(eb;即10mmtris缓冲液)增加连接产物的体积。在一些变型中,缓冲液的体积被替换为异丙醇以增加较小片段的保留。在纯化步骤的这部分添加异丙醇允许在降解dna(例如,降解的人类dna)尺寸分布的下端进行细粒度截止,而不会影响排除衔接子伪影(例如,衔接子二聚体)。如果执行不太严格的spri纯化以尝试回收最小的人类片段,则会回收更多的衔接子伪影。使用各种增量的异丙醇(例如2μl、5μl),可以定制所需的尺寸分布。[0504]文库由150pgdna生成,dna来自降解的25年的毛发样品。根据以下方案,在连接后spri珠纯化步骤期间将异丙醇添加到某些缓冲液-样品混合物中:[0505]1)向每个反应中添加50μleb或用异丙醇替换部分eb体积(以保留更高比例的小片段)[0506]2)添加72.6μl的18%pegspri珠溶液(即18%spri珠与样品为1.2x的比率,50μl样品)并进行spri纯化[0507]3)在20μleb中洗脱[0508]使用50μlamplitaqgold通过pcr扩增纯化的连接产物,并使用spri珠纯化以1.2x纯化扩增产物。pcr后纯化使用18%spri珠(18%peg于spri溶液中)以1.2x进行。连接后纯化以1.01xv/v比率(72.6ul18%spri,最终反应体积为75ul)进行。通常,在本实施例中,连接后纯化中peg的最终浓度为约12%,因为连接产物已经含有peg。[0509]图48a至图48d显示了pcr扩增和1.2x18%spri纯化后dna文库的迹线。每条迹线都基于扩增前使用的连接后spri条件而异。图48a至图48d和图49a至图49e中所示的片段大小分布显示了在掺入eb(即tris缓冲液)的不同体积的异丙醇下保留的片段的变化。特别是,随着异丙醇增加,100-148bp之间的峰保持成比例的高,而148-350之间的峰则成比例地减小,从而降低了平均片段大小。一个观察结果是,在某些条件下衔接子二聚体保留增加。例如,图48a显示了扩增的dna文库,其具有14.8%的衔接子二聚体,平均片段长度为206bp,以及在连接后spri纯化(72.6μl18%spri)(用50μltris缓冲液添加于25μl连接产物)后,扩增的连接产物(不包括衔接子二聚体)的浓度为60.7nmol/μl。图48b显示了26.4%的衔接子二聚体、197bp的平均片段长度,以及在连接后spri纯化(72.6μl的18%spri)(用25μl异丙醇和25μltris缓冲液添加于25μl连接产物)后,28.5nmol/μl的扩增的连接产物浓度。图48c显示了26.9%的衔接子二聚体、193bp的平均片段长度,以及在连接后spri纯化(72.6μl的18%spri)(用50μl异丙醇添加于25μl的连接产物)后,27.8nmol/μl的扩增的连接产物浓度。图48d显示了27.8%的衔接子二聚体、192bp的平均片段长度,以及使用spri纯化(72.6μl的38%peg)(用50μltris缓冲液添加于25μl连接产物)纯化的32.8nmol/μl的连接产物。[0510]在另一个实验中,从获得自新鲜毛发样品的150pgdna生成文库。该实验的某些参数包括:衔接子hyb=1∶1.4(ad∶sp);p5=1.6prsap;p7=0.4p磷,无rsap;ssb=64ng。在制备双链衔接子的过程中,p5衔接子的顶部链与p5衔接子的支架链以1∶1.4的比率退火(即在退火过程中加入更多的支架链);p7衔接子的顶部链与p7衔接子的支架链以1∶1.4的比率退火。添加1.6pmol未磷酸化p5衔接子和0.4pmol磷酸化的p7衔接子。在衔接子连接步骤之前,将dna模板与64ngssb组合。根据以下方案,在连接后spri珠纯化步骤期间将异丙醇添加到某些缓冲液-样品混合物中:[0511]1)向每个反应中添加50μleb或用异丙醇替换部分eb体积(以保留更高比例的小片段)[0512]2)添加72.6μl的18%pegspri珠溶液,并进行spri纯化[0513]3)在20μleb中洗脱[0514]使用100μlamplitaqgold(16个循环)通过pcr扩增纯化的连接产物,并使用18%pegspri珠纯化以1.2x纯化扩增产物。pcr后纯化使用18%spri珠(18%peg于spri溶液中)以1.2x进行。连接后纯化以1.01xv/v比(72.6ul的18%spri,最终反应体积为75ul)进行。通常,在本实施例中,连接后纯化中peg的最终浓度为约12%,因为连接产物已经含有peg。[0515]图49a至图49e显示了pcr扩增和1.2x18%spri纯化后dna文库的迹线。每条迹线都基于扩增前使用的连接后spri条件而异。图49a至图49e中所示的片段大小分布显示了在掺入eb(即tris缓冲液)的不同体积的异丙醇下保留的片段的变化。图49a显示了1.16%衔接子二聚体和连接产物的263bp的平均片段长度,该连接产物是使用spri纯化(72.6μl的18%spri)以50μltris缓冲液添加于25ul连接产物中纯化的。图49b显示了6.13%衔接子二聚体和使用柱纯化纯化的连接产物的232bp的平均片段长度。图49c显示了1.26%的衔接子二聚体和连接产物的256bp的平均片段长度,该连接产物是使用spri纯化(72.6μl的18%spri),以5μl异丙醇和45μltris缓冲液添加于25ul连接产物中纯化的。图49d显示了1.66%的衔接子二聚体和连接产物的236bp的平均片段长度,该连接产物是使用spri纯化(72.6μl的18%spri),以10μl异丙醇和40μltris缓冲液添加于25ul连接产物中纯化的。图49e显示了7.53%衔接子二聚体和连接产物的227bp的平均片段长度,该连接产物是使用spri纯化(72.6μl的18%spri),以20μl异丙醇和30μltris缓冲液添加于25ul连接产物中纯化的。[0516]该实验的平均片段长度、衔接子二聚体百分比和扩增后产量(浓度)提供于下文的表7中。[0517][0518][0519]在另一实验中,从获得自新鲜毛发样品的150pgdna生成文库。该实验的某些参数包括:衔接子hyb=1∶1.4(ad:sp);p5=1.6prsap;p7=0.4p磷,无rsap;ssb=64ng。在制备双链衔接子的过程中,p5衔接子的顶部链与p5衔接子的支架链以1∶1.4的比率退火(即在退火过程中加入更多的支架链);p7衔接子的顶部链与p7衔接子的支架链以1∶1.4的比率退火。添加1.6pmol未磷酸化p5衔接子和0.4pmol磷酸化的p7衔接子。在衔接子连接步骤之前,将dna模板与64ngssb组合。根据以下方案,在连接后spri珠纯化步骤期间将异丙醇添加到缓冲液-样品混合物中:[0520]1)将不同量的异丙醇和eb添加到25μl样品中,每次反应的总体积为75μl[0521]2)加入72.6μl的18%pegspri珠溶液,并进行spri纯化[0522]3)在20μleb中洗脱[0523]使用100μlamplitaqgold(15个循环)通过pcr扩增纯化的连接产物,并使用18%pegspri珠纯化以1.2x纯化扩增产物。pcr后纯化使用18%spri珠(18%peg于spri溶液中的)以1.2x进行。连接后纯化以1.01xv/v比(72.6ul的18%spri,最终反应体积为75ul)进行。通常,在本实施例中,连接后纯化中peg的最终浓度为约12%,因为连接产物已经含有peg。[0524]该实施例的平均片段长度、衔接子二聚体百分比和扩增后的产量(浓度)提供于下文的表8中。[0525][0526]实施例7:实施方案的实施例[0527]a1.产生核酸文库的方法,包括:[0528]组合(i)包含单链核酸(ssna)的核酸组合物、(ii)第一寡核苷酸和(iii)多个第一支架多核苷酸种类,其中:[0529](a)多个第一支架多核苷酸种类中的每种多核苷酸都包含ssna杂交区和第一寡核苷酸杂交区;和[0530](b)核酸组合物、第一寡核苷酸和多个第一支架多核苷酸种类在以下条件下组合,在该条件中,第一支架多核苷酸种类的分子与(i)第一ssna末端区和(ii)第一寡核苷酸分子杂交,从而形成第一寡核苷酸分子的末端与第一ssna末端区的末端相邻的杂交产物。[0531]a1.1如实施方案a1所述的方法,其中在组合之前,在第一寡核苷酸和/或多个第一支架多核苷酸种类去磷酸化的条件下,使第一寡核苷酸和/或多个第一支架多核苷酸种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第一寡核苷酸和/或去磷酸化的第一支架多核苷酸种类。[0532]a2.如实施方案a1或a1.1所述的方法,其中在组合之前,使每个第一支架多核苷酸种类都与第一寡核苷酸杂交以形成多个第一支架双链体种类。[0533]a3.如实施方案a2所述的方法,其中将多个第一支架双链体种类与ssna以约30:1(第一支架双链体种类比ssna)的摩尔比组合。[0534]a3.1如实施方案a2所述的方法,其中将多个第一支架双链体种类与ssna以约15:1(第一支架双链体种类比ssna)的摩尔比组合。[0535]a4.如实施方案a2至a3.1中任一项所述的方法,包括在组合之前,在第一支架双链体种类去磷酸化的条件下,使多个第一支架双链体种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的支架双链体种类。[0536]a5.如实施方案a1所述的方法,其中在组合之前,使每个第一支架多核苷酸种类都与第一ssna末端区杂交以形成多个第一支架-ssna复合物。[0537]a6.如实施方案a5所述的方法,包括在组合之前,在第一支架-ssna复合物去磷酸化的条件下,使多个第一支架-ssna复合物与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第一支架-ssna复合物。[0538]a7.如实施例a1至a6中任一项所述的方法,进一步包括共价连接第一寡核苷酸和第一ssna末端区的相邻末端,从而生成共价连接的杂交产物。[0539]a8.如实施方案a7所述的方法,其中共价连接包括,在第一ssna末端区的末端与第一寡核苷酸的末端共价连接的条件下,使杂交产物与包含连接酶活性的试剂接触。[0540]a9.如实施方案a1至a8中任一项所述的方法,包括在组合之前,将第二寡核苷酸共价连接至ssna的5′末端。[0541]a10.如实施方案a9所述的方法,包括在共价连接第二寡核苷酸之前,在ssna去磷酸化的条件下,使ssna与包含磷酸酶活性的试剂接触,从而生成去磷酸化的ssna。[0542]a11.如实施方案a9或a10所述的方法,其中第二寡核苷酸在3′末端包含磷酸酯。[0543]a12.如实施方案a11所述的方法,其中第二寡核苷酸的共价连接包括,在ssna的5′末端共价连接至第二寡核苷酸3′末端的条件下,使ssna和第二寡核苷酸与包含单链连接酶活性的试剂接触。[0544]a13.如实施方案a12所述的方法,其中包含连接酶活性的试剂是rtcb连接酶。[0545]a14.如实施方案a1至a8中任一项所述的方法,其进一步包括将核酸组合物与(iv)第二寡核苷酸和(v)多个第二支架多核苷酸种类组合,其中:[0546](c)多个第二支架多核苷酸种类中的每种多核苷酸都包含ssna杂交区和第二寡核苷酸杂交区;和[0547](d)核酸组合物、第二寡核苷酸和多个第二支架多核苷酸种类在以下条件下组合,在该条件中,第二支架多核苷酸种类的分子与(i)第二ssna末端区和(ii)第二寡核苷酸分子杂交,从而形成第二寡核苷酸分子的末端与第二ssna末端区的末端相邻的杂交产物。[0548]a14.1如实施方案a14所述的方法,其中在组合之前,在第二寡核苷酸和/或多个第二支架多核苷酸种类去磷酸化的条件下,使第二寡核苷酸和/或多个第二支架多核苷酸种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第二寡核苷酸和/或去磷酸化的第二支架多核苷酸种类。[0549]a15.如实施方案a14或a14.1所述的方法,其中在组合之前,使每个第二支架多核苷酸种类都与第二寡核苷酸杂交以形成多个第二支架双链体种类。[0550]a16.如实施方案a15所述的方法,其中将多个第一支架双链体种类与ssna组合并共价连接,从而形成中间共价连接的杂交产物。[0551]a17.如实施方案a16所述的方法,其中将中间共价连接的杂交产物与多个第二支架双链体种类组合并共价连接,从而形成共价连接的杂交产物。[0552]a18.如实施方案a15所述的方法,其中多个第一支架双链体种类中的一些或所有双链体在第一寡核苷酸的5′末端包含腺苷酰化修饰。[0553]a19.如实施方案a18所述的方法,其中在不存在atp的情况下,将多个第一支架双链体种类与ssna组合并共价连接,从而形成中间共价连接的杂交产物。[0554]a20.如实施方案a19所述的方法,其中将中间共价连接的杂交产物与多个第二支架双链体种类和atp组合并共价连接,从而形成共价连接的杂交产物。[0555]a21.如实施方案a15至a20中任一项所述的方法,其中将多个第二支架双链体种类与ssna以约30:1(第二支架双链体种类比ssna)的摩尔比组合。[0556]a21.1如实施方案a15至a20中任一项所述的方法,其中将多个第二支架双链体种类与ssna以约15∶1(第二支架双链体种类比ssna)的摩尔比组合。[0557]a22.如实施方案a15至a21.1中任一项所述的方法,包括在组合之前,在第二支架双链体种类去磷酸化的条件下,使多个第二支架双链体种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第二支架双链体种类。[0558]a23.如实施方案a14所述的方法,其中在组合之前,使每个第二支架多核苷酸种类都与第二ssna末端区杂交以形成多个第二支架-ssna复合物。[0559]a24.如实施方案a23所述的方法,包括在组合之前,在第二支架-ssna复合物去磷酸化的条件下,使多个第二支架-ssna复合物与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第二支架ssna复合物。[0560]a25.如实施方案a14至a24中任一项所述的方法,进一步包括共价连接第一寡核苷酸和第一ssna末端区的相邻末端,和共价连接第二寡核苷酸和第二ssna末端区的相邻末端,从而生成共价连接的杂交产物。[0561]a26.如实施方案a25所述的方法,其中共价连接包括,在第一ssna末端区的末端与第一寡核苷酸的末端共价连接且第二ssna末端区的末端与第二寡核苷酸的末端共价连接的条件下,使杂交产物与包含连接酶活性的试剂接触。[0562]a27.如实施方案a8或a26所述的方法,其中包含连接酶活性的试剂是t4dna连接酶。[0563]a28.如实施方案a27所述的方法,其中以小于25个单位/μl的量使用t4dna连接酶。[0564]a29.如实施方案a28所述的方法,其中以约10个单位/μl使用t4dna连接酶。[0565]a30.如实施方案a7至a29中任一项所述的方法,其中组合和共价连接进行1小时或更少。[0566]a31.如实施方案a7至a29中任一项所述的方法,其中组合和共价连接进行30分钟或更少。[0567]a32.如实施方案a7至a29中任一项所述的方法,其中组合和共价连接进行约5分钟。[0568]a33.如实施方案a7至a32中任一项所述的方法,其中在单个容器中进行组合和连接。[0569]a34.如实施方案a7至a33中任一项所述的方法,其中在约25μl的反应体积中进行组合和连接。[0570]a35.如实施方案a1至a34中任一项所述的方法,包括在组合之前或期间,在将5′磷酸酯添加至ssna的5′末端的条件下,使ssna与包含磷酰基转移活性的试剂接触。[0571]a36.如实施方案a7至a34中任一项所述的方法,包括在形成杂交产物之后且在共价连接之前,在将5′磷酸酯添加至ssna的5′末端的条件下,使ssna与包含磷酰基转移活性的试剂接触。[0572]a37.如实施方案a1至a36中任一项所述的方法,包括在组合之前或期间,在将5′磷酸酯添加至第一寡核苷酸的5′末端的条件下,使第一寡核苷酸与包含磷酰基转移活性的试剂接触。[0573]a38.如实施方案a14至a36中任一项所述的方法,包括在组合之前或期间,在将5′磷酸酯添加至第二寡核苷酸的5′末端的条件下,使第二寡核苷酸与包含磷酰基转移活性的试剂接触。[0574]a39.如实施方案a7至a36中任一项所述的方法,包括在形成杂交产物之后且在共价连接之前,在将5′磷酸酯添加至第一寡核苷酸的5′末端的条件下,使第一寡核苷酸与包含磷酰基转移活性的试剂接触。[0575]a40.如实施方案a14至a36中任一项所述的方法,包括在形成杂交产物之后且在共价连接之前,在将5′磷酸酯添加至第二寡核苷酸的5′末端的条件下,使第二寡核苷酸与包含磷酰基转移活性的试剂接触。[0576]a41.如实施方案a1至a34中任一项所述的方法,其中该方法不包括使用包含磷酰基转移活性的试剂。[0577]a42.如实施方案a7至a41中任一项所述的方法,进一步包括在组合和共价连接之后纯化共价连接的杂交产物。[0578]a43.如实施方案a42所述的方法,其中通过包括固相可逆固定的纯化过程纯化共价连接的杂交产物。[0579]a43.1.如实施方案a43所述的方法,其中纯化过程包括使共价连接的杂交产物与固相可逆固定珠和缓冲液接触。[0580]a43.2.如实施方案a43.1所述的方法,其中缓冲液包含异丙醇。[0581]a43.3.如实施方案a43.2所述的方法,其中缓冲液包含约10%v/v的异丙醇至约40%v/v的异丙醇。[0582]a43.4.如实施方案a43.2所述的方法,其中缓冲液包含约20%v/v的异丙醇。[0583]a43.5.如实施方案a43至a43.4中任一项所述的方法,其中通过包括系列固相可逆固定的纯化过程纯化共价连接的杂交产物。[0584]a43.6.如实施方案a43至a43.4中任一项所述的方法,其中通过包括连续固相可逆固定的纯化过程纯化共价连接的杂交产物。[0585]a44.如实施方案a42至a43.2中任一项所述的方法,其中通过不包括柱纯化的纯化过程纯化共价连接的杂交产物。[0586]a45.如实施方案a7至a41中任一项所述的方法,其中在组合和共价连接之后不纯化共价连接的杂交产物。[0587]a46.如实施方案a1至a45中任一项所述的方法,其中每个第一多核苷酸种类的ssna杂交区都不同于多个第一多核苷酸种类中其他第一多核苷酸种类的ssna杂交区。[0588]a47.如实施方案a14至a46中任一项所述的方法,其中每个第二多核苷酸种类的ssna杂交区都不同于多个第二多核苷酸种类中其他第二多核苷酸种类的ssna杂交区。[0589]a48.如实施方案a1至a47中任一项所述的方法,其中ssna杂交区包含随机序列。[0590]a49.如实施方案a1至a47中任一项所述的方法,其中ssna杂交区包含一个或多个通用碱基。[0591]a50.如实施方案a1至a49中任一项所述的方法,其中ssna杂交区包含约10个或更少的碱基。[0592]a51.如实施方案a1至a50中任一项所述的方法,其中第一寡核苷酸包含第一引物结合结构域。[0593]a52.如实施方案a51所述的方法,其中第一寡核苷酸杂交区包含与第一引物结合结构域互补的多核苷酸。[0594]a53.如实施方案a14至a52中任一项所述的方法,其中第二寡核苷酸包含第二引物结合结构域。[0595]a54.如实施方案a53所述的方法,其中第二寡核苷酸杂交区包含与第二引物结合结构域互补的多核苷酸。[0596]a55.如实施方案a1至a54中任一项所述的方法,其中第一寡核苷酸包含第一测序衔接子或其部分。[0597]a56.如实施方案a55所述的方法,其中第一寡核苷酸杂交区包含与第一测序衔接子或其部分互补的多核苷酸。[0598]a57.如实施方案a55所述的方法,其中第一寡核苷酸杂交区不包含与第一测序衔接子或其部分互补的多核苷酸。[0599]a58.如实施方案a14至a57中任一项所述的方法,其中第二寡核苷酸包含第二测序衔接子或其部分。[0600]a59.如实施方案a58所述的方法,其中第二寡核苷酸杂交区包含与第二测序衔接子或其部分互补的多核苷酸。[0601]a60.如实施方案a58所述的方法,其中第二寡核苷酸杂交区不包含与第二测序衔接子或其部分互补的多核苷酸。[0602]a61.如实施方案a1至a60中任一项所述的方法,其中第一寡核苷酸包含唯一分子标识符(umi)。[0603]a62.如实施方案a61所述的方法,其中第一寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0604]a63.如实施方案a14至a62中任一项所述的方法,其中第二寡核苷酸包含唯一分子标识符(umi)。[0605]a64.如实施方案a63所述的方法,其中第二寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0606]a65.如实施方案a1至a64中任一项所述的方法,其中第一寡核苷酸包含索引。[0607]a66.如实施方案a65所述的方法,其中第一寡核苷酸杂交区包含与索引互补的多核苷酸。[0608]a67.如实施方案a14至a66中任一项所述的方法,其中第二寡核苷酸包含索引。[0609]a68.如实施方案a67所述的方法,其中第二寡核苷酸杂交区包含与索引互补的多核苷酸。[0610]a69.如实施方案a1至a68中任一项所述的方法,其中第一寡核苷酸包含一个或多个修饰的核苷酸。[0611]a70.如实施方案a14至a69中任一项所述的方法,其中第二寡核苷酸包含一个或多个修饰的核苷酸。[0612]a71.如实施方案a69或a70所述的方法,其中一个或多个修饰的核苷酸能够阻断寡核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0613]a72.如实施方案a69、a70或a71所述的方法,其中寡核苷酸在不与ssna相邻的末端包含一个或多个修饰的核苷酸。[0614]a73.如实施方案a1至a72中任一项所述的方法,其中一些或所有的第一支架多核苷酸种类包含一个或多个修饰的核苷酸。[0615]a74.如实施方案a14至a73中任一项所述的方法,其中一些或所有的第二支架多核苷酸种类包含一个或多个修饰的核苷酸。[0616]a75.如实施方案a73或a74所述的方法,其中一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0617]a76.如实施方案a73至a75中任一项所述的方法,其中支架多核苷酸在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。[0618]a77.如实施方案a69至a76中任一项所述的方法,其中一个或多个修饰的核苷酸包含连接阻断修饰。[0619]a78.如实施方案a1至a77中任一项所述的方法,其中核酸组合物包含单链dna(ssdna)。[0620]a79.如实施方案a78所述的方法,其中ssdna衍生自双链dna(dsdna)。[0621]a80.如实施方案a79所述的方法,包括在组合之前,使dsdna变性,从而生成ssdna。[0622]a81.如实施方案a1至a77中任一项所述的方法,其中所述核酸组合物包含单链rna(ssrna)。[0623]a82.如实施方案a1至a81中任一项所述的方法,其中在组合之前不修饰ssna。[0624]a83.如实施方案a1至a82中任一项所述的方法,其中在组合之前或组合期间,不将ssna与单链核酸结合蛋白(ssb)组合。[0625]a84.如实施方案a1至a82中任一项所述的方法,包括在组合之前,使ssna与单链核酸结合剂接触。[0626]a84.1.如实施例a1至a82中任一项所述的方法,包括在组合之前,使ssna与单链核酸结合蛋白(ssb)接触以产生ssb结合的ssna。[0627]a85.如实施方案a1至a84.1中任一项所述的方法,其中当ssna与第一寡核苷酸和多个第一支架多核苷酸种类组合时,ssna的一个或两个天然末端存在。[0628]a86.如实施方案a1至a85中任一项所述的方法,其中ssna来自无细胞核酸。[0629]a87.如实施方案a1至a86中任一项所述的方法,其中核酸组合物包含约250pg至约5ng的ssna。[0630]a88.如实施方案a1至a87中任一项所述的方法,其中核酸组合物包含约1ng的ssna。[0631]a89.如实施方案a1至a88中任一项所述的方法,其中核酸组合物基本上由ssna组成。[0632]a90.如实施方案a7至a89中任一项所述的方法,进一步包括使共价连接的杂交产物变性,从而生成单链连接产物。[0633]a91.如实施方案a90所述的方法,进一步包括扩增单链连接产物,从而生成扩增的连接产物。[0634]a92.如实施方案a91所述的方法,进一步包括纯化扩增的连接产物。[0635]a93.如实施方案a92所述的方法,其中通过包括固相可逆固定的纯化过程纯化扩增的连接产物。[0636]a94.如实施方案a93所述的方法,其中通过包括系列固相可逆固定化的纯化过程来纯化扩增的连接产物。[0637]a95.如实施方案a93所述的方法,其中通过包括连续固相可逆固定的纯化过程来纯化扩增的连接产物。[0638]a96.如实施方案a92至a95中任一项所述的方法,其中通过不包括柱纯化的纯化过程来纯化扩增的连接产物。[0639]a97.如实施方案a91所述的方法,其中在扩增后,不纯化扩增的连接产蝴。[0640]a98.如实施方案a91至a97中任一项所述的方法,进一步包括对扩增的连接产物进行测序。[0641]a99.如实施方案a90所述的方法,其中不扩增单链连接产物。[0642]a100.如实施方案a99所述的方法,进一步包括对连接产物进行测序。[0643]a101.如实施方案a2至a100中任一项所述的方法,其中第一支架双链体种类包含(1)两条链以及在第一端的突出端和在第二端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0644]a102.如实施方案a15至a101中任一项所述的方法,其中第二支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0645]a103.如实施方案a101或a102所述的方法,其中突出端包含ssna杂交区。[0646]a104.如实施方案a2至a103中任一项所述的方法,其中第一支架双链体种类、第一寡核苷酸和/或多个第一支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0647]a105.如实施方案a15至a104中任一项所述的方法,其中第二支架双链体种类、第二寡核苷酸和/或多个第二支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0648]a106.如实施方案a90至a105中任一项所述的方法,进一步包括,在第三寡核苷酸与第一寡核苷酸和第二寡核苷酸的二聚体杂交的条件下,将单链连接产物与第三寡核苷酸组合,从而形成寡核苷酸二聚体杂交产物。[0649]a107.如实施方案a106所述的方法,其中寡核苷酸二聚体杂交产物包含切割位点。[0650]a108.如实施方案a107所述的方法,其中切割位点是限制酶识别位点。[0651]a109.如实施方案a106至a108中任一项所述的方法,进一步包括使寡核苷酸二聚体杂交产物与切割剂接触。[0652]a110.如实施方案a1至a109中任一项所述的方法,其中多个第一支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[0653]a111.如实施方案a14至a110中任一项所述的方法,其中多个第二支架多核苷酸种类中的一种或多种支架多核苷酸包含一种或多种脱氧尿苷碱基。[0654]a112.如实施方案al至a111中任一项所述的方法,其中第一寡核苷酸不包含脱氧尿苷碱基。[0655]a113.如实施方案a14至a110中任一项所述的方法,其中第二寡核苷酸不包含脱氧尿苷碱基。[0656]a114.如实施方案a110至a113中任一项所述的方法,进一步包括使共价连接的杂交产物与尿嘧啶dna糖基化酶和内切核酸酶接触。[0657]a115.如实施方案a90至a114中任一项所述的方法,进一步包括在杂交条件下使单链连接产物与包含测序衔接子、umi和索引中的一种或多种的延伸引物接触,从而生成与延伸引物杂交的单链连接产物。[0658]a116.如实施方案a115所述的方法,进一步包括使与延伸引物杂交的单链连接产物延伸,从而生成延伸产物。[0659]a117.如实施方案a116所述的方法,进一步包括扩增延伸产物,从而生成扩增的延伸产物。[0660]a118.如实施方案a117所述的方法,进一步包括对扩增的延伸产物进行测序。[0661]a119.如实施方案a1至a118中任一项所述的方法,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含dna。[0662]a120.如实施方案a1至a118中任一项所述的方法,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含rna。[0663]a121.如实施方案a1至a120中任一项所述的方法,其中第一寡核苷酸和/或第二寡核苷酸包含dna。[0664]a122.如实施方案a1至a120中任一项所述的方法,其中第一寡核苷酸和/或第二寡核苷酸包含rna。[0665]a123.如实施方案a1至a122中任一项所述的方法,包括在组合之前使核酸组合物与核酸酶接触。[0666]a124.如实施例a123所述的方法,其中核酸酶是双链特异性核酸酶。[0667]b1.一种组合物,包含:[0668]包含单链核酸(ssna)的核酸组合物;[0669]第一寡核苷酸;和[0670]多个第一支架多核苷酸种类,每个种类都包含ssna杂交区和第一寡核苷酸杂交区。[0671]b2.如实施方案b1所述的组合物,进一步包含:[0672]第二寡核苷酸;和[0673]多个第二支架多核苷酸种类,每个种类都包含ssna杂交区和第二寡核苷酸杂交区。[0674]b3.如实施方案b1或b2所述的组合物,包含多个第一支架双链体种类,其中每个第一支架多核苷酸种类都与第一寡核苷酸杂交。[0675]b4.如实施方案b2或b3所述的组合物,包含多个第二支架双链体种类,其中每个第二支架多核苷酸种类都与第二寡核苷酸杂交。[0676]b5.如实施方案b3或b4所述的组合物,其中多个第一支架双链体种类和ssna以约30∶1(第一支架双链体种类比ssna)的摩尔比存在。[0677]b6.如实施方案b3或b4所述的组合物,其中多个第一支架双链体种类和ssna以约15∶1(第一支架双链体种类比ssna)的摩尔比存在。[0678]b7.如实施方案b4、b5或b6所述的组合物,其中多个第二支架双链体种类和ssna以约30∶1(第二支架双链体种类比ssna)的摩尔比存在。[0679]b8.如实施方案b3或b4所述的组合物,其中多个第二支架双链体种类和ssna以约15∶1(第二支架双链体种类比ssna)的摩尔比存在。[0680]b9.如实施方案b3至b8中任一项所述的组合物,其中第一寡核苷酸、多个第一支架多核苷酸种类和/或多个第一支架双链体种类是去磷酸化的。[0681]b10.如实施方案b4至b9中任一项所述的组合物,其中第二寡核苷酸、多个第二支架多核苷酸种类和/或多个第二支架双链体种类是去磷酸化的。[0682]b11.如实施方案b1至b10中任一项所述的组合物,进一步包含用于将寡核苷酸的末端共价连接于ssna末端区的末端的试剂。[0683]b12.如实施方案b11所述的组合物,其中试剂是连接酶。[0684]b13.如实施方案b12所述的组合物,其中连接酶是t4连接酶。[0685]b14.如实施方案b13所述的组合物,其中t4连接酶以小于25个单位/μl的量存在。[0686]b15.如实施方案b14所述的组合物,其中t4连接酶以约10个单位/μl存在。[0687]b16.如实施方案b1至b15中任一项所述的组合物,其中ssna在5′末端是磷酸化的。[0688]b16.1.如实施方案b1至b15中任一项所述的组合物,其中ssna是去磷酸化的。[0689]b17.如实施方案b1至b16.1中任一项所述的组合物,其中第一寡核苷酸或第二寡核苷酸包含3′磷酸酯。[0690]b18.如实施方案b17所述的组合物,进一步包含用于将ssna末端区的5′末端共价连接于包含3′磷酸酯的第一寡核苷酸或包含3′磷酸酯的第二寡核苷酸的3′末端的试剂。[0691]b19.如实施方案b18所述的组合物,其中试剂是单链连接酶。[0692]b20.如实施方案b19所述的组合物,其中连接酶是rtcb连接酶。[0693]b21.如实施方案b1至b17中任一项所述的组合物,其中第一寡核苷酸或第二寡核苷酸在5′末端包含腺苷酰化修饰。[0694]b22.如实施方案b21所述的组合物,其中组合物不含atp。[0695]b23.如实施方案b1至b22中任一项所述的组合物,进一步包含具有磷酰基转移活性的试剂。[0696]b24.如实施方案b1至b22中任一项的组合物,不包含具有磷酰基转移活性的试剂。[0697]b25.如实施方案b1至b24中任一项所述的组合物,其中每个第一支架多核苷酸种类的ssna杂交区都不同于多个第一支架多核苷酸种类中其他第一支架多核苷酸种类的ssna杂交区。[0698]b26.如实施方案b2至b25中任一项所述的组合物,其中每个第二支架多核苷酸种类的ssna杂交区都不同于多个第二支架多核苷酸种类中其他第二支架多核苷酸种类的ssna杂交区。[0699]b27.如实施方案b1至b26中任一项所述的组合物,其中ssna杂交区包含随机序列。[0700]b28.如实施方案b1至b26中任一项所述的组合物,其中ssna杂交区包含一个或多个通用碱基。[0701]b29.如实施方案b1至b28中任一项所述的组合物,其中ssna杂交区包含约10个或更少的碱基。[0702]b30.如实施方案b1至b29中任一项所述的组合物,其中第一寡核苷酸包含第一引物结合结构域。[0703]b31.如实施方案b30所述的组合物,其中第一寡核苷酸杂交区包含与第一引物结合结构域互补的多核苷酸。[0704]b32.如实施方案b2至b31中任一项所述的组合物,其中第二寡核苷酸包含第二引物结合结构域。[0705]b33.如实施方案b32所述的组合物,其中第二寡核苷酸杂交区包含与第二引物结合结构域互补的多核苷酸。[0706]b34.如实施方案b1至b33中任一项所述的组合物,其中第一寡核苷酸包含第一测序衔接子或其部分。[0707]b35.如实施方案b34所述的组合物,其中第一寡核苷酸杂交区包含与第一测序衔接子或其部分互补的多核苷酸。[0708]b36.如实施方案b34所述的组合物,其中第一寡核苷酸杂交区不包含与第一测序衔接子或其部分互补的多核苷酸。[0709]b37.如实施方案b2至b36中任一项所述的组合物,其中第二寡核苷酸包含第二测序衔接子或其部分。[0710]b38.如实施方案b37所述的组合物,其中第二寡核苷酸杂交区包含与第二测序衔接子或其部分互补的多核苷酸。[0711]b39.如实施方案b37所述的组合物,其中第二寡核苷酸杂交区不包含与第二测序衔接子或其部分互补的多核苷酸。[0712]b40.如实施方案b1至b39中任一项所述的组合物,其中第一寡核苷酸包含唯一分子标识符(umi)。[0713]b41.如实施方案b40所述的组合物,其中第一寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0714]b42.如实施方案b2至b41中任一项所述的组合物,其中第二寡核苷酸包含唯一分子标识符(umi)。[0715]b43.如实施方案b42所述的组合物,其中第二寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0716]b44.如实施方案b1至b43中任一项所述的组合物,其中第一寡核苷酸包含索引。[0717]b45.如实施方案b44所述的组合物,其中第一寡核苷酸杂交区包含与索引互补的多核苷酸。[0718]b46.如实施方案b2至b45中任一项所述的组合物,其中第二寡核苷酸包含索引。[0719]b47.实施方案b46所述的组合物,其中第二寡核苷酸杂交区包含与索引互补的多核苷酸。[0720]b48.如实施方案b1至b47中任一项所述的组合物,其中第一寡核苷酸包含一个或多个修饰的核苷酸。[0721]b49.如实施方案b2至b48中任一项所述的组合物,其中第二寡核苷酸包含一个或多个修饰的核苷酸。[0722]b50.如实施方案b48或b49所述的组合物,其中一个或多个修饰的核苷酸能够阻断寡核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0723]b51.如实施方案b48、b49或b50所述的组合物,其中寡核苷酸在不与ssna末端区相邻的末端包含一个或多个修饰的核苷酸。[0724]b52.如实施方案b1至b51中任一项所述的组合物,其中一些或所有第一支架多核苷酸种类包含一个或多个修饰的核苷酸。[0725]b53.如实施方案b2至b52中任一项所述的组合物,其中一些或所有第二支架多核苷酸种类包含一个或多个修饰的核苷酸。[0726]b54.如实施方案b52或b53所述的组合物,其中一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0727]b55.如实施方案b52至b54中任一项所述的组合物,其中支架多核苷酸在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。[0728]b56.如实施方案b48至b55中任一项所述的组合物,其中所述一个或多个修饰的核苷酸包含连接阻断修饰。[0729]b57.如实施方案b1至b56中任一项所述的组合物,其中所述核酸组合物包含单链dna(ssdna)。[0730]b58.如实施方案b57所述的组合物,其中ssdna源自双链dna(dsdna)。[0731]b59.如实施方案b1至b56中任一项所述的组合物,其中核酸组合物包含单链rna(ssrna)。[0732]b60.如实施方案b1至b59中任一项所述的组合物,进一步包含单链核酸结合剂。[0733]b60.1.如实施方案b1至b59中任一项所述的组合物,进一步包含单链核酸结合蛋白(ssb)。[0734]b61.如实施方案b1至b60中任一项所述的组合物,其不含ssb。[0735]b62.如实施方案b1至b59和b61中任一项所述的组合物,其中核酸组合物基本上由ssna组成。[0736]b63.如实施方案b1至b62中任一项所述的组合物,其中ssna是未修饰的ssna。[0737]b64.如实施方案b1至b63中任一项所述的组合物,其中ssna在一个末端或两个末端包含天然末端。[0738]b65.如实施方案b1至b64中任一项所述的组合物,其中所述ssna来自无细胞核酸。[0739]b66.如实施方案b1至b65中任一项所述的组合物,包含约250pg至约5ng的ssna。[0740]b67.如实施方案b1至b66中任一项所述的组合物,包含约1ng的ssna。[0741]b68.如实施方案b3至b67中任一项所述的组合物,其中第一支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0742]b69.如实施方案b4至b68中任一项所述的组合物,其中第二支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0743]b70.如实施方案b68或b69所述的组合物,其中突出端包含ssna杂交区。[0744]b71.如实施方案b3至b70中任一项所述的组合物,其中第一支架双链体种类、第一寡核苷酸和/或多个第一支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0745]b72.如实施方案b4至b71中任一项所述的组合物,其中第二支架双链体种类、第二寡核苷酸和/或多个第二支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0746]b73.如实施方案b2至b72中任一项所述的组合物,进一步包含能够与第一寡核苷酸和第二寡核苷酸的二聚体杂交的第三寡核苷酸。[0747]b74.如实施方案b73所述的组合物,其中第三寡核苷酸包含当与第一寡核苷酸和第二寡核苷酸的二聚体杂交时形成切割位点的序列。[0748]b75.如实施方案b74所述的组合物,其中切割位点是限制酶识别位点。[0749]b76.如实施方案b73至b75中任一项所述的组合物,进一步包含切割剂。[0750]b77.如实施方案b1至b76中任一项所述的组合物,其中组合物存在于体积为约25μl的水溶液中。[0751]b78.如实施方案b1至b77中任一项所述的组合物,其中多个第一支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[0752]b79.如实施方案b2至b78中任一项所述的组合物,其中多个第二支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[0753]b80.如实施方案bl至b79中任一项所述的组合物,其中第一寡核苷酸不包含脱氧尿苷碱基。[0754]b81.如实施方案b2至b80中任一项所述的组合物,其中第二寡核苷酸不包含脱氧尿苷碱基。[0755]b82.如实施方案b1至b81中任一项所述的组合物,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含dna。[0756]b83如实施方案b1至b81中任一项所述的组合物,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含rna。[0757]b84.如实施方案b1至b83中任一项所述的组合物,其中第一寡核苷酸和/或第二寡核苷酸包含dna。[0758]b85.如实施方案b1至b83中任一项所述的组合物,其中第一寡核苷酸和/或第二寡核苷酸包含rna。[0759]b86.如实施方案b1至b85中任一项所述的组合物,进一步包含核酸酶。[0760]b87.如实施方案b86的组合物,其中核酸酶是双链特异性核酸酶。[0761]c1.一种试剂盒,包括:[0762]第一寡核苷酸;[0763]多个第一支架多核苷酸种类,每个种类都包含ssna杂交区和第一寡核苷酸杂交区;和[0764]使用第一寡核苷酸和多个第一支架多核苷酸种类产生核酸文库的说明。[0765]c2.如实施方案c1所述的试剂盒,进一步包括:[0766]第二寡核苷酸;和[0767]多个第二支架多核苷酸种类,每个种类都包含ssna杂交区和第二寡核苷酸杂交区,其中说明用于使用第一寡核苷酸、多个第一支架多核苷酸种类、第二寡核苷酸和多个第二支架多核苷酸种类来产生核酸文库。[0768]c3.如实施方案c1或c2所述的试剂盒,包含多个第一支架双链体种类,其中每个第一支架多核苷酸种类都与第一寡核苷酸杂交。[0769]c4.如实施方案c2或c3所述的试剂盒,包含多个第二支架双链体种类,其中每个第二支架多核苷酸种类都与第二寡核苷酸杂交。[0770]c5.如实施方案c3或c4所述的试剂盒,其中说明包括以约30∶1(第一支架双链体种类比ssna)的摩尔比组合多个第一支架双链体种类和ssna。[0771]c6.如实施方案c3或c4所述的试剂盒,其中说明包括以约15∶1(第一支架双链体种类比ssna)的摩尔比组合多个第一支架双链体种类和ssna。[0772]c7.如实施方案c4、c5或c6所述的试剂盒,其中说明包括以约30∶1(第二支架双链体种类比ssna)的摩尔比组合多个第二支架双链体种类和ssna。[0773]c8.如实施方案c3或c4所述的试剂盒,其中说明包括以约15∶1(第二支架双链体种类比ssna)的摩尔比组合多种第二支架双链体种类和ssna。[0774]c9.如实施方案c3至c8中任一项所述的试剂盒,其中第一寡核苷酸、多个第一支架多核苷酸种类和/或多个第一支架双链体种类是去磷酸化的。[0775]c10.如实施方案c4至c9中任一项所述的试剂盒,其中第二寡核苷酸、多个第二支架多核苷酸种类和/或多个第二支架双链体种类是去磷酸化的。[0776]c11.如实施方案c1至c10中任一项所述的试剂盒,进一步包括用于将寡核苷酸的末端共价连接于ssna末端区的末端的试剂。[0777]c12.如实施方案c11所述的试剂盒,其中试剂是连接酶。[0778]c13.如实施方案c12所述的试剂盒,其中连接酶是t4连接酶。[0779]c14.如实施方案c13所述的试剂盒,其中t4连接酶以小于25个单位/μl的量存在。[0780]c15.如实施方案c14所述的试剂盒,其中t4连接酶以约10个单位/μl存在。[0781]c16.如实施方案c1至c15中任一项所述的试剂盒,进一步包括磷酸酶。[0782]c17.如实施方案c1至c16中任一项所述的试剂盒,其中第一寡核苷酸或第二寡核苷酸包含3′磷酸酯。[0783]c18.如实施方案c17所述的试剂盒,进一步包括用于将ssna末端区的5′末端共价连接于包含3′磷酸酯的第一寡核苷酸或包含3′磷酸酯的第二寡核苷酸的3′末端的试剂。[0784]c19.如实施方案c18所述的试剂盒,其中试剂是单链连接酶。[0785]c20.如实施方案c19所述的试剂盒,其中连接酶是rtcb连接酶。[0786]c21.如实施方案c1至c17中任一项所述的试剂盒,其中第一寡核苷酸或第二寡核苷酸在5′末端包含腺苷酰化修饰。[0787]c22.如实施方案c21所述的试剂盒,其不含atp。[0788]c23.如实施方案c1至c22中任一项所述的试剂盒,进一步包括包含磷酰基转移活性的试剂。[0789]c24.如实施方案c1至c22中任一项所述的试剂盒,不包括包含磷酰基转移活性的试剂。[0790]c25.如实施方案c1至c24中任一项所述的试剂盒,其中每个第一支架多核苷酸种类的ssna杂交区都不同于多个第一支架多核苷酸种类中其他第一支架多核苷酸种类的ssna杂交区。[0791]c26.如实施方案c2至c25中任一项所述的试剂盒,其中每个第二支架多核苷酸种类的ssna杂交区都不同于多个第二支架多核苷酸种类中其他第二支架多核苷酸种类的ssna杂交区。[0792]c27.如实施方案c1至c26中任一项所述的试剂盒,其中ssna杂交区包含随机序列。[0793]c28.如实施方案c1至c26中任一项所述的试剂盒,其中ssna杂交区包含一个或多个通用碱基。[0794]c29.如实施方案c1至c28中任一项所述的试剂盒,其中ssna杂交区包含约10个或更少的碱基。[0795]c30.如实施方案cl至c29中任一项所述的试剂盒,其中第一寡核苷酸包含第一引物结合结构域。[0796]c31.如实施方案c30所述的试剂盒,其中第一寡核苷酸杂交区包含与第一引物结合结构域互补的多核苷酸。[0797]c32.如实施方案c2至c31中任一项所述的试剂盒,其中第二寡核苷酸包含第二引物结合结构域。[0798]c33.如实施方案c32所述的试剂盒,其中第二寡核苷酸杂交区包含与第二引物结合结构域互补的多核苷酸。[0799]c34.如实施方案c1至c33中任一项所述的试剂盒,其中第一寡核苷酸包含第一测序衔接子或其部分。[0800]c35.如实施方案c34所述的试剂盒,其中第一寡核苷酸杂交区包含与第一测序衔接子或其部分互补的多核苷酸。[0801]c36.如实施方案c34所述的试剂盒,其中第一寡核苷酸杂交区不包含与第一测序衔接子或其部分互补的多核苷酸。[0802]c37.如实施方案c2至c36中任一项所述的试剂盒,其中第二寡核苷酸包含第二测序衔接子或其部分。[0803]c38.如实施方案c37所述的试剂盒,其中第二寡核苷酸杂交区包含与第二测序衔接子或其部分互补的多核苷酸。[0804]c39.如实施方案c37所述的试剂盒,其中第二寡核苷酸杂交区不包含与第二测序衔接子或其部分互补的多核苷酸。[0805]c40.如实施方案c1至c39中任一项所述的试剂盒,其中第一寡核苷酸包含唯一分子标识符(umi)。[0806]c41.如实施方案c40所述的试剂盒,其中第一寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0807]c42.如实施方案c2至c41中任一项所述的试剂盒,其中第二寡核苷酸包含唯一分子标识符(umi)。[0808]c43.如实施方案c42所述的试剂盒,其中第二寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0809]c44.如实施方案c1至c43中任一项所述的试剂盒,其中第一寡核苷酸包含索引。[0810]c45.如实施方案c44所述的试剂盒,其中第一寡核苷酸杂交区包含与索引互补的多核苷酸。[0811]c46.如实施方案c2至c45中任一项所述的试剂盒,其中第二寡核苷酸包含索引。[0812]c47.如实施方案c46所述的试剂盒,其中第二寡核苷酸杂交区包含与索引互补的多核苷酸。[0813]c48.如实施方案c1至c47中任一项所述的试剂盒,其中第一寡核苷酸包含一个或多个修饰的核苷酸。[0814]c49.如实施方案c2至c48中任一项所述的试剂盒,其中第二寡核苷酸包含一个或多个修饰的核苷酸。[0815]c50.如实施方案c48或c49所述的试剂盒,其中一个或多个修饰的核苷酸能够阻断寡核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0816]c51.如施方案c48、c49或c50所述的试剂盒,其中寡核苷酸在不与ssna末端区相邻的末端包含一个或多个修饰的核苷酸。[0817]c52.如实施方案c1至c51中任一项所述的试剂盒,其中一些或所有第一支架多核苷酸种类包含一个或多个修饰的核苷酸。[0818]c53.如实施方案c2至c52中任一项所述的试剂盒,其中一些或所有第二支架多核苷酸种类包含一个或多个修饰的核苷酸。[0819]c54.如实施方案c52或c53所述的试剂盒,其中一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0820]c55.如实施方案c52至c54中任一项所述的试剂盒,其中支架多核苷酸在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。[0821]c56.如实施方案c48至c55中任一项所述的试剂盒,其中一个或多个修饰的核苷酸包含连接阻断修饰。[0822]c57.如实施方案c1至c56中任一项所述的试剂盒,其中说明包括将第一寡核苷酸和多个第一多核苷酸种类与包含单链核酸(ssna)的核酸组合物组合。[0823]c58.如实施方案c57的试剂盒,其中ssna包含单链dna(ssdna)。[0824]c59.如实施方案c57所述的试剂盒,其中ssna包含单链rna(ssrna)。[0825]c60.如实施方案c1至c59中任一项所述的试剂盒,进一步包括单链核酸结合剂。[0826]c60.1.如实施方案c1至c59中任一项所述的试剂盒,进一步包括单链核酸结合蛋白(ssb)。[0827]c61.如实施方案c1至c60中任一项所述的试剂盒,其不含ssb。[0828]c62.如实施方案c57至c59和c61中任一项所述的试剂盒,其中核酸组合物基本上由ssna组成。[0829]c63.如实施方案c57至c62中任一项所述的试剂盒,其中ssna是未修饰的ssna。[0830]c64.如实施方案c57至c63中任一项所述的试剂盒,其中ssna在一个末端或两个末端包含天然末端。[0831]c65.如实施方案c57至c64中任一项所述的试剂盒,其中ssna来自无细胞核酸。[0832]c66.如实施方案c57至c65中任一项所述的试剂盒,其中说明包括将第一寡核苷酸和多个第一多核苷酸种类与包含约250pg至约5ng的ssna的核酸组合物组合。[0833]c67.如实施方案c57至c66中任一项所述的试剂盒,其中说明包括将第一寡核苷酸和多个第一多核苷酸种类与包含约1ngssna的核酸组合物组合。[0834]c68.如实施方案c3至c67中任一项所述的试剂盒,其中第一支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0835]c69.如实施方案c4至c68中任一项所述的试剂盒,其中第二支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0836]c70.如实施方案c68或c69所述的试剂盒,其中突出端包含ssna杂交区。[0837]c71.如实施方案c3至c70中任一项所述的试剂盒,其中第一支架双链体种类、第一寡核苷酸和/或多个第一支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0838]c72.如实施方案c4至c71中任一项所述的试剂盒,其中第二支架双链体种类、第二寡核苷酸和/或多个第二支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0839]c73.如实施方案c2至c72中任一项所述的试剂盒,进一步包括能够与第一寡核苷酸和第二寡核苷酸的二聚体杂交的第三寡核苷酸。[0840]c74.如实施方案c73所述的试剂盒,其中第三寡核苷酸包含当与第一寡核苷酸和第二寡核苷酸的二聚体杂交时形成切割位点的序列。[0841]c75.如实施方案c74所述的试剂盒,其中切割位点是限制酶识别位点。[0842]c76.如实施方案c73至c75中任一项所述的试剂盒,进一步包括切割剂。[0843]c77.如实施方案c1至c76中任一项所述的试剂盒,进一步包括用于纯化核酸的试剂。[0844]c77.1.如实施方案c77所述的试剂盒,其中用于纯化核酸的试剂包括固相可逆固定珠和缓冲液。[0845]c77.2.如实施方案c77.1所述的试剂盒,其中缓冲液包含异丙醇。[0846]c77.3.如实施方案c77.2所述的试剂盒,其中缓冲液包含约10%v/v的异丙醇至约40%v/v的异丙醇。[0847]c77.4.如实施方案c77.2所述的试剂盒,其中缓冲液包含约20%v/v的异丙醇。[0848]c78.如实施方案c1至c77.4中任一项所述的试剂盒,进一步括用于扩增核酸的试剂。[0849]c79.如实施方案c1至c78中任一项所述的试剂盒,其中多个第一支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[0850]c80.如实施方案c2至c79中任一项所述的试剂盒,其中多个第二支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[0851]c81.如实施方案c1至c80中任一项所述的试剂盒,其中第一寡核苷酸不包含脱氧尿苷碱基。[0852]c82.如实施方案c2至c81中任一项所述的试剂盒,其中第二寡核苷酸不包含脱氧尿苷碱基。[0853]c83.如实施方案c78至c82中任一项所述的试剂盒,进一步包括尿嘧啶dna糖基化酶和内切核酸酶。[0854]c84.如实施方案c1至c83中任一项所述的试剂盒,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含dna。[0855]c85.如实施方案c1至c83中任一项所述的试剂盒,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含rna。[0856]c86.如实施方案c1至c85中任一项所述的试剂盒,其中第一寡核苷酸和/或第二寡核苷酸包含dna。[0857]c87.如实施方案c1至c85中任一项所述的试剂盒,其中第一寡核苷酸和/或第二寡核苷酸包含rna。[0858]c88.如实施方案c1至c87中任一项所述的试剂盒,进一步包括核酸酶。[0859]c89.如实施方案c88所述的试剂盒,其中核酸酶是双链特异性核酸酶。[0860]d1.一种产生核酸文库的方法,包括:[0861]组合(i)包含单链核糖核酸(ssrna)或单链互补脱氧核糖核酸(sscdna)的核酸组合物、(ii)第一寡核苷酸和(iii)多个第一支架多核苷酸种类,其中:[0862](a)多个第一支架多核苷酸种类中的每种多核苷酸都包含ssrna或sscdna杂交区和第一寡核苷酸杂交区;和[0863](b)核酸组合物、第一寡核苷酸和多个第一支架多核苷酸种类在以下条件下组合,在该条件中,第一支架多核苷酸种类的分子与(i)第一ssrna或sscdna末端区和(ii)第一寡核苷酸的分子杂交,从而形成第一寡核苷酸分子的末端与第一ssrna或sscdna末端区的末端相邻的杂交产物。[0864]d1.1.如实施方案d1所述的方法,其中在组合之前,在第一寡核苷酸和/或多个第一支架多核苷酸种类去磷酸化的条件下,使第一寡核苷酸和/或多个第一支架多核苷酸种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第一寡核苷酸和/或去磷酸化的第一支架多核苷酸种类。[0865]d2.如实施方案d1或d1.1所述的方法,其中核酸组合物包含sscdna。[0866]d3.如实施方案d2所述的方法,包括在组合之前从单链核糖核酸(ssrna)生成sscdna。[0867]d4.如实施方案d3所述的方法,其中生成sscdna包括使ssrna与引物和包含逆转录酶活性的试剂接触,从而生成dna-rna双链体。[0868]d5.如实施方案d4所述的方法,其中生成sscdna包括使dna-rna双链体与包含rna酶活性的试剂接触,从而消化rna并生成sscdna产物。[0869]d6.如实施方案d5所述的方法,进一步包括纯化sscdna产物。[0870]d7.如实施方案d5或d6所述的方法,其中包含逆转录酶活性的试剂还包含rna酶活性。[0871]d8.如实施方案d7所述的方法,其中试剂是m-mulv逆转录酶。[0872]d9.如实施方案d4至d8中任一项所述的方法,其中所述引物选自随机六聚体引物、随机八聚体引物和聚(t)引物中的一种或多种。[0873]d10.如实施方案d1所述的方法,其中核酸组合物包含ssrna。[0874]d11.如实施方案d10所述的方法,其中该方法进一步包括从杂交产物生成单链连接产物。[0875]d12.如实施方案d11所述的方法,进一步包括使单链连接产物与引物和包含逆转录酶活性的试剂接触,从而生成dna-rna双链体。[0876]d13.如实施方案d12所述的方法,进一步包括使dna-rna双链体与包含rna酶活性的试剂接触,从而消化rna并生成单链cdna(sscdna)产蝴。[0877]d14.如实施方案d13所述的方法,进一步包括纯化sscdna产物。[0878]d15.如实施方案d13或d14所述的方法,其中包含逆转录酶活性的试剂还包含rna酶活性。[0879]d16.如实施方案d15所述的方法,其中试剂是m-mulv逆转录酶。[0880]d17.如实施方案d12至d16中任一项所述的方法,其中引物包含与第一寡核苷酸中的序列互补的核苷酸序列。[0881]d17.1.如实施方案d13至d16中任一项所述的方法,进一步包括扩增sscdna产物,从而生成扩增的sscdna产物。[0882]d17.2.如实施方案d17.1所述的方法,其中在单个容器和/或单个体积中生成dna-rna双链体、生成sscdna产物和生成扩增的sscdna产物。[0883]d18.如实施方案d1至d17.2中任一项所述的方法,包括在组合之前将ssrna片段化,从而生成ssrna片段。[0884]d19.如实施方案d1至d18中任一项所述的方法,包括在组合之前耗尽核糖体rna(rrna)和/或富集信使rna(mrna)。[0885]d20.如实施方案d1至d19中任一项所述的方法,其中在组合之前,每个第一支架多核苷酸种类都与第一寡核苷酸杂交以形成多个第一支架双链体种类。[0886]d21.如实施方案d20所述的方法,其中多个第一支架双链体种类与ssrna或sscdna以约30∶1(第一支架双链体种类比ssrna或sscdna)的摩尔比组合。[0887]d22.如实施方案d20所述的方法,其中多个第一支架双链体种类与ssrna或sscdna以约15∶1(第一支架双链体种类比ssrna或sscdna)的摩尔比组合。[0888]d23.如实施方案d1至d22中任一项所述的方法,包括在组合之前,在第一支架双链体种类去磷酸化的条件下,使多个第一支架双链体种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第一支架双链体种类。[0889]d24.如实施方案d1至d19中任一项所述的方法,其中在组合之前,每个第一支架多核苷酸种类都与第一ssrna或sscdna末端区杂交以形成多个第一支架ssrna或第一支架sscdna复合物。[0890]d25.如实施方案d24所述的方法,包括在组合之前,在第一支架ssrna复合物或第一支架sscdna复合物去磷酸化的条件下,使多个第一支架ssrna复合物或第一支架sscdna复合物与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第一支架ssrna复合物或第一支架sscdna复合物。[0891]d26.如实施方案d1至d25中任一项所述的方法,进一步包括共价连接第一寡核苷酸和第一ssrna或sscdna末端区的相邻末端,从而生成共价连接的杂交产物。[0892]d27.如实施方案d26所述的方法,其中共价连接包括,在第一ssrna或sscdna末端区的末端共价连接至第一寡核苷酸的末端的条件下,使杂交产物与包含连接酶活性的试剂接触。[0893]d28.如实施方案d1至d27中任一项所述的方法,包括在组合之前,将第二寡核苷酸共价连接至ssrna或sscdna的5′末端。[0894]d29.如实施方案d28所述的方法,包括在共价连接第二寡核苷酸之前,在ssrna或sscdna去磷酸化的条件下,使ssrna或sscdna与包含磷酸酶活性的试剂接触,从而生成去磷酸化的ssrna或sscdna。[0895]d30.如实施方案d28或d29所述的方法,其中第二寡核苷酸在3′末端包含磷酸酯。[0896]d31.如实施方案d30所述的方法,其中第二寡核苷酸的共价连接包括,在ssrna或sscdna的5′末端共价连接至第二寡核苷酸的3′末端的条件下,使ssrna或sscdna和第二寡核苷酸与包含单链连接酶活性的试剂接触。[0897]d32.如实施方案d31所述的方法,其中包含连接酶活性的试剂是rtcb连接酶。[0898]d33.如实施方案d1至d27中任一项所述的方法,其进一步包括将核酸组合物与(iv)第二寡核苷酸和(v)多个第二支架多核苷酸种类组合,其中:[0899](c)多个第二支架多核苷酸种类中的每种多核苷酸都包含ssrna或sscdna杂交区和第二寡核苷酸杂交区;和[0900](d)核酸组合物、第二寡核苷酸和多个第二支架多核苷酸种类在以下条件下组合,在该条件中,第二支架多核苷酸种类的分子与(i)第二ssrna或sscdna末端区和(ii)第二寡核苷酸的分子杂交,从而形成第二寡核苷酸的分子的末端与第二ssrna或sscdna末端区的末端相邻的杂交产物。[0901]d33.1.如实施方案d33所述的方法,其中在组合之前,在第二寡核苷酸和/或多个第二支架多核苷酸种类被去磷酸化的条件下,使第二寡核苷酸和/或多个第二支架多核苷酸种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第二寡核苷酸和/或去磷酸化的第二支架多核苷酸种类。[0902]d33.2.如实施方案d33或d33.1所述的方法,其中实施方案d17的引物包含与第二寡核苷酸中的序列互补的核苷酸序列。[0903]d34.如实施方案d33、d33.1或d33.2所述的方法,其中在组合之前,每个第二支架多核苷酸种类都与第二寡核苷酸杂交以形成多个第二支架双链体种类。[0904]d35.如实施方案d34所述的方法,其中多个第一支架双链体种类与ssrna或sscdna组合并共价连接,从而形成中间共价连接的杂交产物。[0905]d36.如实施方案d35所述的方法,其中中间共价连接的杂交产物与多个第二支架双链体种类组合并共价连接,从而形成共价连接的杂交产物。[0906]d37.如实施方案d34所述的方法,其中多个第一支架双链体种类中的一些或所有双链体在第一寡核苷酸的5′末端包含腺苷酰化修饰。[0907]d38.如实施方案d37所述的方法,其中在不存在atp的情况下,多个第一支架双链体种类与ssrna或sscdna组合并共价连接,从而形成中间共价连接的杂交产物。[0908]d39.如实施方案d38所述的方法,其中中间共价连接的杂交产物与多个第二支架双链体种类和atp组合并共价连接,从而形成共价连接的杂交产蝴。[0909]d40.如实施方案d34至d39中任一项所述的方法,其中多个第二支架双链体种类与ssrna或sscdna以约30∶1(第二支架双链体种类比ssrna或sscdna)的摩尔比组合。[0910]d41.如实施方案d34至d39中任一项所述的方法,其中多个第二支架双链体种类与ssrna或sscdna以约15∶1(第二支架双链体种类比ssrna或sscdna)的摩尔比组合。[0911]d42.如实施方案d34至d41中任一项所述的方法,包括在组合之前,在第二支架双链体种类去磷酸化的条件下,使多个第二支架双链体种类与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第二支架双链体种类。[0912]d43.如实施方案d33所述的方法,其中在组合之前,每个第二支架多核苷酸种类都与第二ssrna或sscdna末端区杂交以形成多个第二支架-ssrna或第二支架-sscdna复合物。[0913]d44.如实施方案d43所述的方法,包括在组合之前,在第二支架ssrna复合物或第二支架sscdna复合物去磷酸化的条件下,使多个第二支架ssrna复合物或第二支架sscdna复合物与包含磷酸酶活性的试剂接触,从而生成去磷酸化的第二支架-ssrna复合物或第二支架-sscdna复合物。[0914]d45.如实施方案d33至d44中任一项所述的方法,进一步包括共价连接第一寡核苷酸和第一ssrna或sscdna末端区的相邻末端,以及共价连接第二寡核苷酸和第二ssrna或sscdna末端区的相邻末端,从而生成共价连接的杂交产物。[0915]d46.如实施方案d45所述的方法,其中共价连接包括,在第一ssrna或sscdna末端区的末端共价连接于第一寡核苷酸的末端且第二ssrna或sscdna末端区的末端共价连接于第二寡核苷酸的末端的条件下,使杂交产物与包含连接酶活性的试剂接触。[0916]d47.如实施方案d27或d46所述的方法,其中包含连接酶活性的试剂是t4dna连接酶。[0917]d48.如实施方案d47所述的方法,其中以小于25个单位/μl的量使用t4dna连接酶。[0918]d49.如实施方案d48所述的方法,其中以约10个单位/μl使用t4dna连接酶。[0919]d50.如实施方案d26至d49中任一项所述的方法,其中组合和共价连接进行1小时或更短。[0920]d51.如实施方案d26至d49中任一项所述的方法,其中组合和共价连接进行30分钟或更短。[0921]d52.如实施方案d26至d49中任一项所述的方法,其中组合和共价连接进行约5分钟。[0922]d53.如实施方案d26至d52中任一项所述的方法,其中在单个容器中进行组合和连接。[0923]d54.如实施方案d26至d53中任一项所述的方法,其中在约25μl的反应体积中进行组合和连接。[0924]d55.如实施方案d1至d54中任一项所述的方法,包括在组合之前或期间,在将5′磷酸酯添加于ssrna或sscdna的5′末端的条件下,使ssrna或sscdna与包含磷酰基转移活性的试剂接触。[0925]d56.如实施方案d26至d54中任一项所述的方法,包括在形成杂交产物之后且共价连接之前,在将5′磷酸酯添加于ssrna或sscdna的5′末端的条件下,使ssrna或sscdna与包含磷酰基转移活性的试剂接触。[0926]d57.如实施方案d1至d56中任一项所述的方法,包括在组合之前或期间,在将5′磷酸酯添加于第一寡核苷酸的5′末端的条件下,使第一寡核苷酸与包含磷酰基转移活性的试剂接触。[0927]d58.如实施方案d33至d56中任一项所述的方法,包括在组合之前或期间,在将5′磷酸酯添加于第二寡核苷酸的5′末端的条件下,使第二寡核苷酸与包含磷酰基转移活性的试剂接触。[0928]d59.如实施方案d26至d56中任一项所述的方法,包括在形成杂交产物之后且在共价连接之前,在将5′磷酸酯添加于第一寡核苷酸的5′末端的条件下,使第一寡核苷酸与包含磷酰基转移活性的试剂接触。[0929]d60.如实施方案d33至d56中任一项所述的方法,包括在形成杂交产物之后且在共价连接之前,在将5′磷酸酯添加于第二寡核苷酸的5′末端的条件下,使第二寡核苷酸与包含磷酰基转移活性的试剂接触。[0930]d61.如实施方案d1至d54中任一项所述的方法,其中该方法不包括使用包含磷酰基转移活性的试剂。[0931]d62.如实施方案d26至d61中任一项所述的方法,进一步包括在组合和共价连接之后,纯化共价连接的杂交产物。[0932]d63.如实施方案d62所述的方法,其中通过包括固相可逆固定的纯化过程纯化共价连接的杂交产物。[0933]d63.1.如实施方案d63所述的方法,其中纯化过程包括使共价连接的杂交产物与固相可逆固定珠和缓冲液接触。[0934]d63.2.如实施方案d63.1所述的方法,其中缓冲液包含异丙醇。[0935]d63.3.如实施方案d63.2所述的方法,其中所述缓冲液包含约10%v/v的异丙醇至约40%v/v的异丙醇。[0936]d63.4.如实施方案d63.2所述的方法,其中缓冲液包含约20%v/v的异丙醇。[0937]d64.如实施方案d63至d63.4中任一项所述的方法,其中通过包括系列固相可逆固定的纯化过程纯化共价连接的杂交产物。[0938]d65.如实施方案d63至d63.4中任一项所述的方法,其中通过包括连续固相可逆固定的纯化过程纯化共价连接的杂交产物。[0939]d66.如实施方案d62至d65中任一项所述的方法,其中通过不包括柱纯化的纯化过程纯化共价连接的杂交产物。[0940]d67.如实施方案d26至d61中任一项所述的方法,其中在组合和共价连接后不纯化共价连接的杂交产物。[0941]d68.如实施方案d1至d67中任一项所述的方法,其中每个第一多核苷酸种类的ssrna或sscdna杂交区都不同于多个第一多核苷酸种类中其他第一多核苷酸种类的ssrna或sscdna杂交区。[0942]d69.如实施方案d33至d68中任一项所述的方法,其中每个第二多核苷酸种类的ssrna或sscdna杂交区都不同于多个第二多核苷酸种类中其他第二多核苷酸种类的ssrna或sscdna杂交区。[0943]d70.如实施方案d1至d69中任一项所述的方法,其中ssrna或sscdna杂交区包含随机序列。[0944]d71.如实施方案d1至d69中任一项所述的方法,其中ssrna或sscdna杂交区包含一个或多个通用碱基。[0945]d72.如实施方案d1至d71中任一项所述的方法,其中ssrna或sscdna杂交区包含约10个或更少的碱基。[0946]d73.如实施方案d1至d72中任一项所述的方法,其中第一寡核苷酸包含第一引物结合结构域。[0947]d74.如实施方案d73所述的方法,其中第一寡核苷酸杂交区包含与第一引物结合结构域互补的多核苷酸。[0948]d75.如实施方案d33至d74中任一项所述的方法,其中第二寡核苷酸包含第二引物结合结构域。[0949]d76.如实施方案d75所述的方法,其中第二寡核苷酸杂交区包含与第二引物结合结构域互补的多核苷酸。[0950]d77.如实施方案d1至d76中任一项所述的方法,其中第一寡核苷酸包含第一测序衔接子或其部分。[0951]d78.如实施方案d77所述的方法,其中第一寡核苷酸杂交区包含与第一测序衔接子或其部分互补的多核苷酸。[0952]d79.如实施方案d77所述的方法,其中第一寡核苷酸杂交区不包含与第一测序衔接子或其部分互补的多核苷酸。[0953]d80.如实施方案d33至d79中任一项所述的方法,其中第二寡核苷酸包含第二测序衔接子或其部分。[0954]d81.如实施方案d80所述的方法,其中第二寡核苷酸杂交区包含与第二测序衔接子或其部分互补的多核苷酸。[0955]d82.如实施方案d80所述的方法,其中第二寡核苷酸杂交区不包含与第二测序衔接子或其部分互补的多核苷酸。[0956]d83.如实施方案d1至d82中任一项所述的方法,其中第一寡核苷酸包含唯一分子标识符(umi)。[0957]d84.如实施方案d83所述的方法,其中第一寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0958]d85.如实施方案d33至d84中任一项所述的方法,其中第二寡核苷酸包含唯一分子标识符(umi)。[0959]d86.如实施方案d85所述的方法,其中第二寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[0960]d87.如实施方案d1至d86中任一项所述的方法,其中第一寡核苷酸包含索引。[0961]d88.如实施方案d87所述的方法,其中第一寡核苷酸杂交区包含与索引互补的多核苷酸。[0962]d89.如实施方案d33至d88中任一项所述的方法,其中第二寡核苷酸包含索引。[0963]d90.如实施方案d89所述的方法,其中第二寡核苷酸杂交区包含与索引互补的多核苷酸。[0964]d91.如实施方案d1至d90中任一项所述的方法,其中第一寡核苷酸包含一个或多个修饰的核苷酸。[0965]d92.如实施方案d33至d91中任一项所述的方法,其中第二寡核苷酸包含一个或多个修饰的核苷酸。[0966]d93.如实施方案d91或d92所述的方法,其中一个或多个修饰的核苷酸能够阻断寡核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0967]d94.如实施方案d91、d92或d93所述的方法,其中寡核苷酸在不与ssrna或sscdna相邻的末端包含一个或多个修饰的核苷酸。[0968]d95.如实施方案d1至d94中任一项所述的方法,其中一些或所有的第一支架多核苷酸种类包含一个或多个修饰的核苷酸。[0969]d96.如实施方案d33至d95中任一项所述的方法,其中一些或所有的第二支架多核苷酸种类包含一个或多个修饰的核苷酸。[0970]d97.如实施方案d95或d96所述的方法,其中一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[0971]d98.如实施方案d95至d97中任一项所述的方法,其中支架多核苷酸在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。[0972]d99.如实施方案d91至d98中任一项所述的方法,其中一个或多个修饰的核苷酸包含连接阻断修饰。[0973]d100.如实施方案d1至d99中任一项所述的方法,其中在组合之前ssrna或sscdna是未修饰的。[0974]d101.如实施方案d1至d100中任一项所述的方法,其中在组合之前或组合期间,ssrna或sscdna未与单链核酸结合蛋白(ssb)组合。[0975]d102.如实施方案d1至d100中任一项所述的方法,包括在组合之前,使ssrna或sscdna与单链核酸结合剂接触。[0976]d102.1.如实施方案d1至d100中任一项所述的方法,包括在组合之前,使ssrna或sscdna与单链核酸结合蛋白(ssb)接触以产生ssb结合的ssrna或sscdna。[0977]d103.如实施方案d1至d102.1中任一项所述的方法,其中当ssrna或sscdna与第一寡核苷酸和多个第一支架多核苷酸种类组合时,ssrna或sscdna的一个或两个天然末端是存在的。[0978]d104.如实施方案d1至d103中任一项所述的方法,其中核酸组合物包含约250pg至约5ng的ssrna或sscdna。[0979]d105.如实施方案d1至d104中任一项所述的方法,其中核酸组合物包含约1ng的ssrna或sscdna。[0980]d106.如实施方案d1至d105中任一项所述的方法,其中核酸组合物基本上由ssrna或sscdna组成。[0981]d107.如实施方案d26至d106中任一项所述的方法,进一步包括使共价连接的杂交产物变性,从而产生单链连接产物。[0982]d108.如实施方案d107所述的方法,进一步包括扩增单链连接产物,从而生成扩增的连接产物。[0983]d109.如实施方案d108所述的方法,进一步包括纯化扩增的连接产物。[0984]d110.如实施方案d109所述的方法,其中通过包括固相可逆固定的纯化过程纯化扩增的连接产物。[0985]d111.如实施方案d110所述的方法,其中通过包括系列固相可逆固定的纯化过程纯化扩增的连接产物。[0986]d112.如实施方案d110所述的方法,其中通过包括连续固相可逆固定的纯化过程纯化扩增的连接产物。[0987]d113.如实施方案d109至d112中任一项所述的方法,其中通过不包括柱纯化的纯化过程纯化扩增的连接产物。[0988]d114.如实施方案d108所述的方法,其中在扩增后不纯化扩增的连接产物。[0989]d115.如实施方案d108至d114中任一项所述的方法,进一步包括对扩增的连接产物进行测序。[0990]d116.如实施方案d107所述的方法,其中不扩增单链连接产物。[0991]d117.如实施方案d116所述的方法,进一步包括对连接产物进行测序。[0992]d118.如实施方案d20至d117中任一项所述的方法,其中第一支架双链体种类包含(1)两条链以及在第一端的突出端和在第二端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0993]d119.如实施方案d34至d118中任一项所述的方法,其中所述第二支架双链体种类包含(1)两条链以及在第一端的突出端和在第二端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[0994]d120.如实施方案d118或d119所述的方法,其中突出端包含ssrna或sscdna杂交区。[0995]d121.如实施方案d20至d120中任一项所述的方法,其中第一支架双链体种类、第一寡核苷酸和/或多个第一支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0996]d122.如实施方案d34至d121中任一项所述的方法,其中第二支架双链体种类、第二寡核苷酸和/或多个第二支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[0997]d123.如实施方案d107至d122中任一项所述的方法,进一步包括在第三寡核苷酸与第一寡核苷酸和第二寡核苷酸的二聚体杂交的条件下,将单链连接产物与第三寡核苷酸组合,从而形成寡核苷酸二聚体杂交产物。[0998]d124.如实施方案d123所述的方法,其中寡核苷酸二聚体杂交产物包含切割位点。[0999]d125.如实施方案d124所述的方法,其中切割位点是限制酶识别位点。[1000]d126.如实施方案d123至d125中任一项所述的方法,进一步包括使寡核苷酸二聚体杂交产物与切割剂接触。[1001]d127.如实施方案d1至d126中任一项所述的方法,其中多个第一支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[1002]d128.如实施方案d33至d127中任一项所述的方法,其中多个第二支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[1003]d129.如实施方案d1至d128中任一项所述的方法,其中第一寡核苷酸不包含脱氧尿苷碱基。[1004]d130.如实施方案d33至d129中任一项所述的方法,其中第二寡核苷酸不包含脱氧尿苷碱基。[1005]d131.如实施方案d127至d130中任一项所述的方法,进一步包括使共价连接的杂交产物与尿嘧啶dna糖基化酶和内切核酸酶接触。[1006]d132.如实施方案d1至d131中任一项所述的方法,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含dna。[1007]d133.如实施方案d1至d131中任一项所述的方法,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含rna。[1008]d134.如实施方案d1至d133中任一项所述的方法,其中第一寡核苷酸和/或第二寡核苷酸包含dna。[1009]d135.如实施方案d1至d133中任一项所述的方法,其中第一寡核苷酸和/或第二寡核苷酸包含rna。[1010]d136.如实施方案d1至d135中任一项所述的方法,包括在组合之前使核酸组合物与核酸酶接触。[1011]d137.如实施方案d136所述的方法,其中核酸酶是双链特异性核酸酶。[1012]e1.一种组合物,包含:[1013]包含单链核糖核酸(ssrna)或单链互补脱氧核糖核酸(sscdna)的核酸组合物;[1014]第一寡核苷酸;和[1015]多个第一支架多核苷酸种类,每个种类都包含ssrna或sscdna杂交区和第一寡核苷酸杂交区。[1016]e2.如实施方案e1所述的组合物,进一步包括:[1017]第二寡核苷酸;和[1018]多个第二支架多核苷酸种类,每个种类包含ssrna或sscdna杂交区和第二寡核苷酸杂交区。[1019]e3.如实施方案e1或e2所述的组合物,包含多个第一支架双链体种类,其中每个第一支架多核苷酸种类都杂交至第一寡核苷酸。[1020]e4.如实施方案e2或e3所述的组合物,包含多个第二支架双链体种类,其中每个第二支架多核苷酸种类都杂交至第二寡核苷酸。[1021]e5.如实施方案e3或e4所述的组合物,其中多个第一支架双链体种类和ssrna或sscdna以约30∶1(第一支架双链体种类比ssrna或sscdna)的摩尔比存在。[1022]e6.如实施方案e3或e4所述的组合物,其中多个第一支架双链体种类和ssrna或sscdna以约15∶1(第一支架双链体种类比ssrna或sscdna)的摩尔比存在。[1023]e7.如实施方案e4、e5或e6的组合物,其中多个第二支架双链体种类和ssrna或sscdna以约30∶1(第二支架双链体种类比ssrna或sscdna)的摩尔比存在。[1024]e8.如实施方案e3或e4所述的组合物,其中多个第二支架双链体种类和ssrna或sscdna以约15∶1(第二支架双链体种类比ssrna或sscdna)的摩尔比存在。[1025]e9.如实施方案e3至e8中任一项所述的组合物,其中第一寡核苷酸、多个第一支架多核苷酸种类和/或多个第一支架双链体种类是去磷酸化的。[1026]e10.如实施方案e4至e9中任一项所述的组合物,其中第二寡核苷酸、多个第二支架多核苷酸种类和/或多个第二支架双链体种类是去磷酸化的。[1027]e11.如实施方案e1至e10中任一项所述的组合物,进一步包含用于将寡核苷酸的末端共价连接于ssrna或sscdna末端区的末端的试剂。[1028]e12.如实施方案e11所述的组合物,其中试剂是连接酶。[1029]e13.如实施方案e12所述的组合物,其中连接酶是t4连接酶。[1030]e14.如实施方案e13所述的组合物,其中t4连接酶以小于25个单位/μl的量存在。[1031]e15.如实施方案e14所述的组合物,其中t4连接酶以约10个单位/μl存在。[1032]e16.如实施方案e1至e15中任一项所述的组合物,其中ssrna或sscdna在5′末端是磷酸化的。[1033]e16.1.如实施方案e1至e15中任一项所述的组合物,其中ssrna或sscdna是去磷酸化的。[1034]e17.如实施方案e1至e16.1中任一项所述的组合物,其中第一寡核苷酸或第二寡核苷酸包含3′磷酸酯。[1035]e18.如实施方案e17所述的组合物,还包含用于将ssrna或sscdna末端区的5′末端共价连接于包含3′磷酸酯的第一寡核苷酸或包含3′磷酸酯的第二寡核苷酸的3′末端的试剂。[1036]e19.如实施方案e18所述的组合物,其中试剂是单链连接酶。[1037]e20.如实施方案e19所述的组合物,其中连接酶是rtcb连接酶。[1038]e21.如实施方案e1至e17中任一项所述的组合物,其中第一寡核苷酸或第二寡核苷酸在5′末端包含腺苷酰化修饰。[1039]e22.如实施方案e21所述的组合物,其中组合物不含atp。[1040]e23.如实施方案e1至e22中任一项所述的组合物,进一步包含含有磷酰基转移活性的试剂。[1041]e24.如实施方案e1至e22中任一项所述的组合物,不包含含有磷酰基转移活性的试剂。[1042]e25.如实施方案e1至e24中任一项所述的组合物,其中每个第一支架多核苷酸种类的ssrna或sscdna杂交区都不同于多个第一支架多核苷酸种类中其他第一支架多核苷酸种类的ssrna或sscdna杂交区。[1043]e26.如实施方案e2至e25中任一项所述的组合物,其中每个第二支架多核苷酸种类的ssrna或sscdna杂交区都不同于多个第二支架多核苷酸种类中其他第二支架多核苷酸种类的ssrna或sscdna杂交区。[1044]e27.如实施方案e1至e26中任一项所述的组合物,其中ssrna或sscdna杂交区包含随机序列。[1045]e28.如实施方案e1至e26中任一项所述的组合物,其中ssrna或sscdna杂交区包含一个或多个通用碱基。[1046]e29.如实施方案e1至e28中任一项所述的组合物,其中ssrna或sscdna杂交区包含约10个或更少的碱基。[1047]e30.如实施方案e1至e29中任一项所述的组合物,其中第一寡核苷酸包含第一引物结合结构域。[1048]e31.如实施方案e30所述的组合物,其中第一寡核苷酸杂交区包含与第一引物结合结构域互补的多核苷酸。[1049]e32.如实施方案e2至e31中任一项所述的组合物,其中第二寡核苷酸包含第二引物结合结构域。[1050]e33.如实施方案e32所述的组合物,其中第二寡核苷酸杂交区包含与第二引物结合结构域互补的多核苷酸。[1051]e34.如实施方案e1至e33中任一项所述的组合物,其中第一寡核苷酸包含第一测序衔接子或其部分。[1052]e35.如实施方案e34所述的组合物,其中第一寡核苷酸杂交区包含与第一测序衔接子或其部分互补的多核苷酸。[1053]e36.如实施方案e34所述的组合物,其中第一寡核苷酸杂交区不包含与第一测序衔接子或其部分互补的多核苷酸。[1054]e37.如实施方案e2至e36中任一项所述的组合物,其中第二寡核苷酸包含第二测序衔接子或其部分。[1055]e38.如实施方案e37的组合物,其中第二寡核苷酸杂交区包含与第二测序衔接子或其部分互补的多核苷酸。[1056]e39.如实施方案e37所述的组合物,其中第二寡核苷酸杂交区不包含与第二测序衔接子或其部分互补的多核苷酸。[1057]e40.如实施方案e1至e39中任一项所述的组合物,其中第一寡核苷酸包含唯一分子标识符(umi)。[1058]e41.如实施方案e40所述的组合物,其中第一寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[1059]e42.如实施方案e2至e41中任一项所述的组合物,其中第二寡核苷酸包含唯一分子标识符(umi)。[1060]e43.如实施方案e42所述的组合物,其中第二寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[1061]e44.如实施方案e1至e43中任一项所述的组合物,其中第一寡核苷酸包含索引。[1062]e45.如实施方案e44所述的组合物,其中第一寡核苷酸杂交区包含与索引互补的多核苷酸。[1063]e46.如实施方案e2至e45中任一项所述的组合物,其中第二寡核苷酸包含索引。[1064]e47.如实施方案e46所述的组合物,其中第二寡核苷酸杂交区包含与索引互补的多核苷酸。[1065]e48.如实施方案e1至e47中任一项所述的组合物,其中第一寡核苷酸包含一个或多个修饰的核苷酸。[1066]e49.如实施方案e2至e48中任一项所述的组合物,其中第二寡核苷酸包含一个或多个修饰的核苷酸。[1067]e50.如实施方案e48或e49所述的组合物,其中一个或多个修饰的核苷酸能够阻断寡核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[1068]e51.如实施方案e48、e49或e50所述的组合物,其中寡核苷酸在不与ssrna或sscdna末端区相邻的末端包含一个或多个修饰的核苷酸。[1069]e52.如实施方案e1至e51中任一项所述的组合物,其中一些或所有的第一支架多核苷酸种类包含一个或多个修饰的核苷酸。[1070]e53.如实施方案e2至e52中任一项所述的组合物,其中一些或所有的第二支架多核苷酸种类包含一个或多个修饰的核苷酸。[1071]e54.如实施方案e52或e53所述的组合物,其中一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[1072]e55.如实施方案e52至e54中任一项所述的组合物,其中支架多核苷酸在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。[1073]e56.如实施方案e48至e55中任一项所述的组合物,其中一个或多个修饰的核苷酸包含连接阻断修饰。[1074]e57.如实施方案e1至e56中任一项所述的组合物,进一步包含单链核酸结合剂。[1075]e57.1.如实施方案e1至e56中任一项所述的组合物,进一步包含单链核酸结合蛋白(ssb)。[1076]e58.如实施方案e1至e57中任一项所述的组合物,其不含ssb。[1077]e59.如实施方案e1至e56和e58中任一项所述的组合物,其中核酸组合物基本上由ssrna或sscdna组成。[1078]e60.如实施方案e1至e59中任一项所述的组合物,其中ssrna或sscdna是未修饰的ssrna或sscdna。[1079]e61.如实施方案e1至e60中任一项所述的组合物,其中ssrna或sscdna在一个末端或两个末端包含天然末端。[1080]e62.如实施方案e1至e61中任一项所述的组合物,包含约250pg至约5ng的ssrna或sscdna。[1081]e63.如实施方案e1至e62中任一项所述的组合物,包含约1ng的ssrna或sscdna。[1082]e64.如实施方案e3至e63中任一项所述的组合物,其中第一支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[1083]e65.如实施方案e4至e64中任一项所述的组合物,其中第二支架双链体种类包含(1)两条链以及在第一末端的突出端和在第二末端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[1084]e66.如实施方案e64或e65所述的组合物,其中突出端包含ssrna或sscdna杂交区。[1085]e67.如实施方案e3至e66中任一项所述的组合物,其中第一支架双链体种类、第一寡核苷酸和/或多个第一支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[1086]e68.如实施方案e4至e67中任一项所述的组合物,其中第二支架双链体种类、第二寡核苷酸和/或多个第二支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[1087]e69.如实施方案e2至e68中任一项所述的组合物,进一步包含能够与第一寡核苷酸和第二寡核苷酸的二聚体杂交的第三寡核苷酸。[1088]e70.如实施方案e69所述的组合物,其中第三寡核苷酸包含当与第一寡核苷酸和第二寡核苷酸的二聚体杂交时形成切割位点的序列。[1089]e71.如实施方案e70所述的组合物,其中切割位点是限制酶识别位点。[1090]e72.如实施方案e69至e71中任一项所述的组合物,进一步包含切割剂。[1091]e73如实施方案e1至e72中任一项所述的组合物,其中组合物存在于体积为约25μl的水溶液中。[1092]e74.如实施方案e1至e73中任一项的组合物,其中核酸组合物包含sscdna。[1093]e75.如实施方案e1至e73中任一项所述的组合物,其中核酸组合物包含ssrna。[1094]e76.如实施方案e1至e75中任一项所述的组合物,进一步包含含有逆转录酶活性的试剂。[1095]e77.如实施方案e1至e76中任一项所述的组合物,进一步包含含有rna酶活性的试剂。[1096]e78.如实施方案e1至e77中任一项所述的组合物,进一步包含含有逆转录酶活性和rna酶活性的试剂。[1097]e79.如实施方案e78所述的组合物,其中试剂是m-mulv逆转录酶。[1098]e80.如实施方案e1至e79中任一项所述的组合物,进一步包含引物。[1099]e81.如实施方案e80所述的组合物,其中引物选自随机六聚体引物、随机八聚体引物和聚(t)引物中的一种或多种。[1100]e82.如实施方案e80所述的组合物,其中引物包含与第一寡核苷酸或第二寡核苷酸中的序列互补的核苷酸序列。[1101]e83.如实施方案e1至e82中任一项所述的组合物,其中多个第一支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[1102]e84.如实施方案e2至e83中任一项所述的组合物,其中多个第二支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[1103]e85.如实施方案e1至e84中任一项所述的组合物,其中第一寡核苷酸不包含脱氧尿苷碱基。[1104]e86.如实施方案e2至e85中任一项所述的组合物,其中第二寡核苷酸不包含脱氧尿苷碱基。[1105]e87.如实施方案e1至e86中任一项所述的组合物,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含dna。[1106]e88.如实施方案e1至e86中任一项所述的组合物,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含rna。[1107]e89.如实施方案e1至e87中任一项所述的组合物,其中第一寡核苷酸和/或第二寡核苷酸包含dna。[1108]e90.如实施方案e1至e87中任一项所述的组合物,其中第一寡核苷酸和/或第二寡核苷酸包含rna。[1109]e91.如实施例e1至e90中任一项所述的组合物,进一步包含核酸酶。[1110]e92.如实施方案e91所述的组合物,其中核酸酶是双链特异性核酸酶。[1111]f1.一种试剂盒,包括:[1112]第一寡核苷酸;[1113]多个第一支架多核苷酸种类,每个种类都包含ssrna或sscdna杂交区和第一寡核苷酸杂交区;和[1114]使用第一寡核苷酸和多个第一支架多核苷酸种类从ssrna或sscdna产生核酸文库的说明。[1115]f2.如实施方案f1所述的试剂盒,进一步包括:[1116]第二寡核苷酸;和[1117]多个第二支架多核苷酸种类,每个种类都包含ssrna或sscdna杂交区和第二寡核苷酸杂交区,其中说明用于使用第一寡核苷酸、多个第一支架多核苷酸种类、第二寡核苷酸和多个第二支架多核苷酸种类来产生核酸文库。[1118]f3.如实施方案f1或f2所述的试剂盒,包括多个第一支架双链体种类,其中每个第一支架多核苷酸种类都杂交至第一寡核苷酸。[1119]f4.如实施方案f2或f3所述的试剂盒,包括多个第二支架双链体种类,其中每个第二支架多核苷酸种类都杂交至第二寡核苷酸。[1120]f5.如实施方案f3或f4所述的试剂盒,其中说明包括以约30∶1(第一支架双链体种类比ssrna或sscdna)的摩尔比组合多个第一支架双链体种类和ssrna或sscdna。[1121]f6.如实施方案f3或f4所述的试剂盒,其中说明包括以约15∶1(第一支架双链体种类比ssrna或sscdna)的摩尔比组合多个第一支架双链体种类和ssrna或sscdna。[1122]f7.如实施方案f4、f5或f6所述的试剂盒,其中说明包括以约30∶1的摩尔比(第二支架双链体种类比ssrna或sscdna)组合多个第二支架双链体种类和ssrna或sscdna。[1123]f8.如实施方案f3或f4所述的试剂盒,其中说明包括以约15:1(第二支架双链体种类比ssrna或sscdna)的摩尔比组合多个第二支架双链体种类和ssrna或sscdna。[1124]f9.如实施方案f3至f8中任一项所述的试剂盒,其中第一寡核苷酸、多个第一支架多核苷酸种类和/或多个第一支架双链体种类是去磷酸化的。[1125]f10.如实施方案f4至f9中任一项所述的试剂盒,其中第二寡核苷酸、多个第二支架多核苷酸种类和/或多个第二支架双链体种类是去磷酸化的。[1126]f11.如实施方案f1至f10中任一项所述的试剂盒,进一步包括用于将寡核苷酸的末端共价连接于ssrna或sscdna末端区的末端的试剂。[1127]f12.如实施方案f11所述的试剂盒,其中试剂是连接酶。[1128]f13.如实施方案f12所述的试剂盒,其中连接酶是t4连接酶。[1129]f14.如实施方案f13所述的试剂盒,其中t4连接酶以小于25个单位/μl的量存在。[1130]f15.如实施方案f14所述的试剂盒,其中t4连接酶以约10个单位/μl存在。[1131]f16.如实施方案f1至f15中任一项所述的试剂盒,进一步包括磷酸酶。[1132]f17.如实施方案c1至c16中任一项所述的试剂盒,其中第一寡核苷酸或第二寡核苷酸包含3′磷酸酯。[1133]f18.如实施方案f17所述的试剂盒,进一步包括用于将ssrna或sscdna末端区的5′末端共价连接于包含3′磷酸酯的第一寡核苷酸或包含3′磷酸酯的第二寡核苷酸的3′末端的试剂。[1134]f19.如实施方案f18所述的试剂盒,其中试剂是单链连接酶。[1135]f20.如实施方案f19所述的试剂盒,其中连接酶是rtcb连接酶。[1136]f21.如实施方案f1至f17中任一项所述的试剂盒,其中第一寡核苷酸或第二寡核苷酸在5′末端包含腺苷酰化修饰。[1137]f22.如实施方案f21所述的试剂盒,其不含atp。[1138]f23.如实施方案f1至f22中任一项所述的试剂盒,进一步包括包含磷酰基转移活性的试剂。[1139]f24.如实施方案f1至f22中任一项所述的试剂盒,不包括包含磷酰基转移活性的试剂。[1140]f25.如实施方案f1至f24中任一项所述的试剂盒,其中每个第一支架多核苷酸种类的ssrna或sscdna杂交区都不同于多个第一支架多核苷酸种类中其他第一支架多核苷酸种类的ssrna或sscdna杂交区。[1141]f26.如实施方案f2至f25中任一项所述的试剂盒,其中每个第二支架多核苷酸种类的ssrna或sscdna杂交区都不同于多个第二支架多核苷酸种类中其他第二支架多核苷酸种类的ssrna或sscdna杂交区。[1142]f27.如实施方案f1至f26中任一项所述的试剂盒,其中ssrna或sscdna杂交区包含随机序列。[1143]f28.如实施方案f1至f26中任一项所述的试剂盒,其中ssrna或sscdna杂交区包含一个或多个通用碱基。[1144]f29.如实施方案f1至f28中任一项所述的试剂盒,其中ssrna或sscdna杂交区包含约10个或更少的碱基。[1145]f30.如实施方案f1至f29中任一项所述的试剂盒,其中第一寡核苷酸包含第一引物结合结构域。[1146]f31.如实施方案f30所述的试剂盒,其中第一寡核苷酸杂交区包含与第一引物结合结构域互补的多核苷酸。[1147]f32.如实施方案f2至f31中任一项所述的试剂盒,其中第二寡核苷酸包含第二引物结合结构域。[1148]f33.如实施方案f32所述的试剂盒,其中第二寡核苷酸杂交区包含与第二引物结合结构域互补的多核苷酸。[1149]f34.如实施方案f1至f33中任一项所述的试剂盒,其中第一寡核苷酸包含第一测序衔接子或其部分。[1150]f35.如实施方案f34所述的试剂盒,其中第一寡核苷酸杂交区包含与第一测序衔接子或其部分互补的多核苷酸。[1151]f36.如实施方案f34所述的试剂盒,其中第一寡核苷酸杂交区不包含与第一测序衔接子或其部分互补的多核苷酸。[1152]f37.如实施方案f2至f36中任一项所述的试剂盒,其中第二寡核苷酸包含第二测序衔接子或其部分。[1153]f38.如实施方案f37所述的试剂盒,其中第二寡核苷酸杂交区包含与第二测序衔接子或其部分互补的多核苷酸。[1154]f39.如实施方案f37所述的试剂盒,其中第二寡核苷酸杂交区不包含与第二测序衔接子或其部分互补的多核苷酸。[1155]f40.如实施方案f1至f39中任一项所述的试剂盒,其中第一寡核苷酸包含唯一分子标识符(umi)。[1156]f41.如实施方案f40所述的试剂盒,其中第一寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[1157]f42.如实施方案f2至f41中任一项所述的试剂盒,其中第二寡核苷酸包含唯一分子标识符(umi)。[1158]f43.如实施方案f42所述的试剂盒,其中第二寡核苷酸杂交区包含与唯一分子标识符(umi)互补的多核苷酸。[1159]f44.如实施方案f1至f43中任一项所述的试剂盒,其中第一寡核苷酸包含索引。[1160]f45.如实施方案f44所述的试剂盒,其中第一寡核苷酸杂交区包含与索引互补的多核苷酸。[1161]f46.如实施方案f2至f45中任一项所述的试剂盒,其中第二寡核苷酸包含索引。[1162]f47.如实施方案f46所述的试剂盒,其中第二寡核苷酸杂交区包含与索引互补的多核苷酸。[1163]f48.如实施方案f1至f47中任一项所述的试剂盒,其中第一寡核苷酸包含一个或多个修饰的核苷酸。[1164]f49.如实施方案f2至f48中任一项所述的试剂盒,其中第二寡核苷酸包含一个或多个修饰的核苷酸。[1165]f50.如实施方案f48或f49所述的试剂盒,其中一个或多个修饰的核苷酸能够阻断寡核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[1166]f51.如实施方案f48、f49或f50所述的试剂盒,其中寡核苷酸在不与ssrna或sscdna末端区相邻的末端包含一个或多个修饰的核苷酸。[1167]f52.如实施方案f1至f51中任一项所述的试剂盒,其中一些或所有的第一支架多核苷酸种类包含一个或多个修饰的核苷酸。[1168]f53.如实施方案f2至f52中任一项所述的试剂盒,其中一些或所有的第二支架多核苷酸种类包含一个或多个修饰的核苷酸。[1169]f54.如实施方案f52或f53所述的试剂盒,其中一个或多个修饰的核苷酸能够阻断支架多核苷酸与另一寡核苷酸、多核苷酸或核酸分子的共价连接。[1170]f55.如实施方案f52至f54中任一项所述的试剂盒,其中支架多核苷酸在多核苷酸的一个末端或两个末端包含一个或多个修饰的核苷酸。[1171]f56.如实施方案f48至f55中任一项所述的试剂盒,其中一个或多个修饰的核苷酸包含连接阻断修饰。[1172]f57.如实施方案f1至f56中任一项所述的试剂盒,其中说明包括将第一寡核苷酸和多个第一多核苷酸种类与包含ssrna或sscdna的核酸组合物组合。[1173]f58.如实施方案f57所述的试剂盒,其中ssna包含ssrna。[1174]f59.如实施方案f57的试剂盒,其中ssna包含ssrna。[1175]f60.如实施方案f1至f59中任一项所述的试剂盒,进一步包括单链核酸结合剂。[1176]f60.1.如实施方案f1至f59中任一项所述的试剂盒,进一步包括单链核酸结合蛋白(ssb)。[1177]f61.如实施方案f1至f60中任一项所述的试剂盒,其不含ssb。[1178]f62.如实施方案f57至f59和f61中任一项所述的试剂盒,其中核酸组合物基本上由ssrna或sscdna组成。[1179]f63.如实施方案f57至f62中任一项所述的试剂盒,其中ssrna或sscdna是未修饰的ssrna或sscdna。[1180]f64.如实施方案f57至f63中任一项所述的试剂盒,其中ssrna或sscdna在一个末端包含天然末端。[1181]f65.如实施方案f57至f63中任一项所述的试剂盒,其中ssrna或sscdna在两个末端均包含天然末端。[1182]f66.如实施方案f57至f65中任一项所述的试剂盒,其中说明包括将第一寡核苷酸和多个第一多核苷酸种类与包含约250pg至约5ng的ssrna或sscdna的核酸组合物组合。[1183]f67.如实施方案f57至f66中任一项所述的试剂盒,其中说明包括将第一寡核苷酸和多个第一多核苷酸种类与包含约1ng的ssrna或sscdna的核酸组合物组合。[1184]f68.如实施方案f3至f67中任一项所述的试剂盒,其中第一支架双链体种类包含(1)两条链以及在第一端的突出端和在第二端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[1185]f69.如实施方案f4至f68中任一项所述的试剂盒,其中所述第二支架双链体种类包含(1)两条链以及在第一端的突出端和在第二端的两条非互补链,或(2)能够形成具有单链环和突出端的发夹结构的一条链。[1186]f70.如实施方案f68或f69所述的试剂盒,其中突出端包含ssrna或sscdna杂交区。[1187]f71.如实施方案f3至f70中任一项所述的试剂盒,其中第一支架双链体种类、第一寡核苷酸和/或多个第一支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[1188]f72.如实施方案f4至f71中任一项所述的试剂盒,其中第二支架双链体种类、第二寡核苷酸和/或多个第二支架多核苷酸种类包含一个或多个硫代磷酸酯主链修饰。[1189]f73.如实施方案f2至f72中任一项所述的试剂盒,进一步包括能够与第一寡核苷酸和第二寡核苷酸的二聚体杂交的第三寡核苷酸。[1190]f74.如实施方案f73所述的试剂盒,其中第三寡核苷酸包含当与第一寡核苷酸和第二寡核苷酸的二聚体杂交时形成切割位点的序列。[1191]f75.如实施方案f74所述的试剂盒,其中切割位点是限制酶识别位点。[1192]f76.如实施方案f73至f75中任一项所述的试剂盒,进一步包括切割剂。[1193]f77.如实施方案f1至f76中任一项所述的试剂盒,进一步包括包含逆转录酶活性的试剂。[1194]f78.如实施方案f1至f77中任一项所述的试剂盒,进一步包括包含rna酶活性的试剂。[1195]f79.如实施方案f1至f78中任一项所述的试剂盒,进一步包括包含逆转录酶活性和rna酶活性的试剂。[1196]f80.如实施方案f79所述的试剂盒,其中试剂是m-mulv逆转录酶。[1197]f81.如实施方案f1至f80中任一项所述的试剂盒,进一步包括引物。[1198]f82.如实施方案f81所述的试剂盒,其中引物选自随机六聚体引物、随机八聚体引物和聚(t)引物中的一种或多种。[1199]f83.如实施方案f81所述的试剂盒,其中引物包含与第一寡核苷酸或第二寡核苷酸中的序列互补的核苷酸序列。[1200]f84.如实施方案f1至f83中任一项所述的试剂盒,进一步包括用于纯化核酸的试剂。[1201]f84.1.如实施方案f84所述的试剂盒,其中用于纯化核酸的试剂包括固相可逆固定珠和缓冲液。[1202]f84.2.如实施方案f84.1所述的试剂盒,其中缓冲液包含异丙醇。[1203]f84.3.如实施方案f84.2所述的试剂盒,其中所述缓冲液包含约10%v/v的异丙醇至约40%v/v的异丙醇。[1204]f84.4.如实施方案f84.2所述的试剂盒,其中缓冲液包含约20%v/v的异丙醇。[1205]f85.如实施方案f1至f84.4任一项所述的试剂盒,进一步包括用于扩增核酸的试剂。[1206]f86.如实施方案f1至f85中任一项所述的试剂盒,进一步包括用于富集mrna和/或耗尽rrna的试剂。[1207]f87.如实施方案f1至f86中任一项的试剂盒,进一步包括用于片段化ssrna的试剂。[1208]f88.如实施方案f1至f87中任一项所述的试剂盒,其中多个第一支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[1209]f89.如实施方案f2至f88中任一项所述的试剂盒,其中多个第二支架多核苷酸种类中的一种或多种支架多核苷酸包含一个或多个脱氧尿苷碱基。[1210]f90.如实施方案f1至f89中任一项所述的试剂盒,其中第一寡核苷酸不包含脱氧尿苷碱基。[1211]f91.如实施方案f2至f90中任一项所述的试剂盒,其中第二寡核苷酸不包含脱氧尿苷碱基。[1212]f92.如实施方案f88至f91中任一项所述的试剂盒,进一步包括尿嘧啶dna糖基化酶和核酸内切酶。[1213]f93.如实施方案f1至f92中任一项所述的试剂盒,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含dna。[1214]f94.如实施方案f1至f92中任一项所述的试剂盒,其中第一支架多核苷酸种类和/或第二支架多核苷酸种类包含rna。[1215]f95.如实施方案f1至f94中任一项所述的试剂盒,其中第一寡核苷酸和/或第二寡核苷酸包含dna。[1216]f96.如实施方案f1至f94中任一项所述的试剂盒,其中第一寡核苷酸和/或第二寡核苷酸包含rna。[1217]f97.如实施方案f1至f96中任一项所述的试剂盒,进一步包括核酸酶。[1218]f98.如实施方案f97所述的试剂盒,其中核酸酶是双链特异性核酸酶。[1219]g1.如实施方案a1至a124中任一项所述的方法,用于评估单链核酸(ssna)的纯度和/或质量(quality)。[1220]g2.如实施方案g1所述的方法,其中ssna包含单链寡核苷酸。[1221]g3.如实施方案g2所述的方法,其中单链寡核苷酸是商业生产的。[1222]g4.如实施方案g1所述的方法,其中ssna包含单链探针。[1223]g5.如实施方案g4所述的方法,其中单链探针是商业生产的。[1224]g6.如实施方案g1至g5中任一项所述的方法,其中根据片段长度谱评估ssna的纯度和/或质量。[1225]g7.如实施方案g6所述的方法,其中根据片段长度谱中多数ssna种类的量和少数ssna种类的量来评估ssna的纯度和/或质量。[1226]h1.如实施方案d1至d137中任一项所述的方法,用于评估单链核糖核酸(ssrna)或单链互补脱氧核糖核酸(sscdna)的纯度和/或质量。[1227]h2.如实施方案h1所述的方法,其中ssrna包含单链rna寡核苷酸。[1228]h3.如实施方案h2所述的方法,其中单链rna寡核苷酸是商业生产的。[1229]h4.如实施方案h1所述的方法,其中ssrna包含单链rna探针。[1230]h5.如实施方案h4所述的方法,其中单链rna探针是商业生产的。[1231]h6.如实施方案h1所述的方法,其中sscdna包含单链cdna寡核苷酸。[1232]h7.如实施方案h6所述的方法,其中单链cdna寡核苷酸是商业生产的。[1233]h8.如实施方案h1所述的方法,其中sscdna包含单链cdna探针。[1234]h9.如实施方案h8所述的方法,其中单链cdna探针是商业生产的。[1235]h10.如实施方案h1至h9中任一项所述的方法,其中根据片段长度谱评估ssrna或sscdna的纯度和/或质量。[1236]h11.如实施方案h10所述的方法,其中根据片段长度谱中多数ssrna或sscdna种类的量和少数ssrna或sscdna种类的量评估ssrna或sscdna的纯度和/或质量。[1237]i1.如实施方案a1至a124中任一项所述的方法,用于评估包含带切口dna的样品。[1238]j1.如实施方案a1至a124中任一项所述的方法,用于富集核酸样品中的靶核酸。[1239]***[1240]通过引用并入本文引用的每件专利、专利申请、出版物和文件的全部内容。对上述专利、专利申请、出版物和文件的引用并非承认上述任何一项是相关的现有技术,也不构成对这些出版物或文献的内容或日期的任何承认。对它们的引用并不表示对相关公开的检索。关于文献日期或内容的所有陈述均基于可获得的信息,并且不是对其准确性或正确性的承认。[1241]在不脱离本技术的基本方面的情况下,可以对上述内容进行修改。尽管已经参考一个或多个具体实施方案对本技术进行了相当详细的描述,但本领域普通技术人员将认识到,可以对本技术中具体公开的实施方案进行更改,但这些修改和改进均在技术的范围和精神内。[1242]本文说明性描述的技术可以在不存在本文未具体公开的任何要素的情况下适当地实施。因此,例如,在本文的每一情况中,术语“包含/包括(comprising)”、“基本上由......组成”和“由......组成”中的任何一个都可以被其他两个术语中的任一个替换。已经使用的术语和表达用作描述的术语而非限制,并且这些术语和表达的使用不排除所示和所述特征或其部分的任何等同物,并且在请求包含的技术的范围内各种修改是可能的。术语“一(a)”或“一(an)”可以指一个/种或多个/种它修饰的要素(例如,“一种试剂”可以表示一种或多种试剂),除非上下文中清楚地说明描述了一个/一种要素或多个/多种要素。本文所用术语“约”是指基础参数10%(即正负10%)以内的值,并且在一串值的开头使用术语“约”修饰每个值(即“约1、2和3”是指约1、约2和约3)。例如,“约100克”的重量可以包括90克到110克之间的重量。此外,当本文描述值的列表时(例如,约50%、60%、70%、80%、85%或86%),该列表包括其所有中间值和分数值(例如54%、85.4%)。因此,应当理解,虽然已经通过代表性实施方案和可选特征具体公开了本技术,但是本领域技术人员可以诉诸本文公开的概念的修改和变化,并且这样的修改和变化被认为在本技术范围内。[1243]所述技术的某些实施方案列于随附的权利要求中。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1