用于复合单细胞核酸分析的基于微滴的方法和设备与流程

文档序号:14079041阅读:852来源:国知局
相关申请和通过引入并入本申请要求2014年9月9日提交的美国临时专利申请系列号62/048,227、2015年4月13日提交的美国临时专利申请系列号62/146,642的权益和优先权。前述申请以及在其中或在其审查过程中引用的所有文件(“申请引用文件”)和在所述申请引用文件中引用或参考的所有文件,以及在本文中引用或参考的所有文件(“本文引用文件”)和在所述本文引用文件中引用或参考的所有文件,与在本文中或通过引用并入本文的任何文件中提及的任何产品的任何制造商的指示、说明、产品说明书和产品插页一起由此通过并入本文,且可以用于实施本发明。更具体地,所有参考的文献通过引用并入达到如同各单个文献特别地和单独地表明通过引用并入的相同程度。本发明一般地涉及分子条码标记和基于乳液的微流体技术的组合,从而以高通量方式从单个细胞分离、裂解、条码标记和制备核酸。联邦资助说明本发明利用国立卫生研究院(nationalinstitutesofhealth)提供的合同号hg006193的政府支持完成。政府对本发明具有一定权利。
背景技术
::细胞以不同的类型、亚型和活性状态存在,申请人基于其形状、位置、功能或分子谱(如它们表达的rna的集合)来分类。rna谱型分析(profiling)在原则上是特别富信息量的,因为细胞表达数以千计的不同rna。测量例如每种类型的rna的水平的方法直到最近仍一直应用于“均质的”样品-其中所有细胞的内容物混合在一起。这极大地限制了我们利用这样的技术了解人组织功能和病理(例如,在脑中)的能力。在过去的两年中,已经开始出现在单一细胞中进行这些测量的新技术,但它们还未扩展到大量的细胞,且是非常昂贵的。在此,申请人开发了快速地和经济地确定数以万计的单个人细胞(包括来自脑组织的细胞)的rna内容物的谱特征的方法。为做到这一点,申请人采用特殊的微流体装置以将各细胞包封在单个液滴中,将各细胞的rna与对于该细胞/液滴独特的“细胞条码”相关联,用测序测量各rna的表达水平和然后利用细胞条码确定各rna分子来自于哪个细胞。申请人可以使用这一方法来更好地了解几乎任何生物样品;特别重要的是了解来自任何复杂组织(例如视网膜)的样品。进行需要单细胞(或单分子)水平的数据解析的研究在最好的情况下也可能是挑战性的或受到成本过高的限制。虽然存在着用于单分子或单细胞分析的技术或仪器(例如,分别地数字聚合酶链反应(pcr)或fluidigmc1),但目前没有一种技术或仪器允许用于动态递送试剂和/或对单个反应附加分子“信息”的可扩展方法,以使得可以共同地处理和分析大量的反应/试验而同时仍然保持按照单个反应/试验划分结果的能力。微流体技术涉及操作少量流体的微尺度装置。因为微流体技术可以精确地和可再现地控制和分配小流体体积,特别是小于1μl的体积,微流体技术的应用提供显著的成本节约。微流体技术的使用减少了循环时间,缩短了得到结果的时间(time-to-results)和增大了通量。此外,微流体技术的整合增强了系统集成和自动化。微流体反应一般在微液滴(microdroplet)中进行。在微液滴中进行反应的能力依赖于能够合并不同的样品流体和不同的微液滴。参见,例如,美国专利公开no.20120219947。微滴(droplet)微流体技术对于进行高通量筛选和灵敏的分析提供了显著的优势。微滴允许样品体积显著减小,导致成本的随之降低。以千赫兹速度进行的操作和测量使得能够在一天内筛选最多108个独立的生物实体(包括,但不限于单个细胞或细胞器)。在微滴中的区室化通过提高稀有物质的有效深度和减少达到检测阈值所需的时间来提高试验灵敏度。微滴微流体技术将这些有力的特征相结合以使得能够实现目前达不到的高通量筛选应用,包括单细胞和单分子分析。参见,例如,guo等,labchip,2012,12,2146-2155。本申请中任何文献的引用或确认并不是承认该文献可是用作本发明的现有技术。技术实现要素:本发明特别地涉及分子条码标记和基于乳液的微流体技术的组合,从而以高通量方式从单个细胞分离、裂解、条码标记和制备核酸。本发明提供高通量单细胞rna-seq和/或靶核酸谱型分析(例如,测序、定量反转录聚合酶链反应等等),其中来自不同细胞的rna单独地加标签,从而允许建立单一文库而同时保持各阅读片段的细胞身份。使用了分子条码标记和基于乳液的微流体技术的组合而以高通量从单个细胞分离、裂解、条码标记和制备核酸。微流体装置(例如,用聚二甲基硅氧烷制造的),亚纳升反相乳液微滴。这些微滴用于共包封核酸与条码标记的捕获珠。例如,各珠独特地条码标记以使得各液滴及其内容物是可区分的。核酸可以本领域中已知的任何来源,例如,来自单细胞、细胞对、细胞裂解产物或溶液的那些。细胞在被包封在微滴中时裂解。为将单一细胞和条码标记的珠以泊松统计加载到这些微滴中,需要100,000至1千万个这样的珠以条码标记~10,000-100,000个细胞。本发明提供用于建立单细胞测序文库的方法,包括:将一个独特地条码标记的mrna捕获微珠与75-125μm直径的乳液微滴中的单细胞合并;裂解细胞以使得其rna可供通过杂交到rna捕获微珠上而捕获;在乳液微滴内部或外部进行反转录以将细胞的mrna转换为第一链edna,其共价连接于mrna捕获微珠;汇合来自所有细胞的cdna-附着的微珠;和制备和测序单一复合rna-seq文库。本发明提供用于制备独特地条码标记的mrna捕获微珠的方法,该mrna捕获微珠具有独特的条码和适合于微流体装置的直径,该方法包括:1)在珠的表面上以汇合-和-分割方式进行反向亚磷酰胺合成,以使得在各个合成循环中,所述珠分割到具有四种规范核苷酸(canonicalnucleotide)(t、c、g或a)之一或长度两个或更多个碱基的独特寡核苷酸的四个反应之一中;2)重复这一过程许多次,至少两次和最佳地超过十二次,以使得在后一种情况中在池中的各珠的表面上存在超过1600万独特的条码。(参见http://www.ncbi.nlm.nih.gov/pmc/articles/pmc206447)一般地,本发明提供用于制备大量具有独特核酸条码的珠、颗粒、微珠、纳米颗粒等的方法,包括以汇合-和-分割方式在珠的表面上进行多核苷酸合成,以使得在各个合成循环中,珠分割成经历不同的化学反应的亚集;和然后在两个或更多个循环中重复这一分割-汇合过程以组合地产生大量的不同核酸条码。本发明进一步提供进行多核苷酸合成,其中所述合成可以是本领域技术人员已知以逐步方式“构建”多核苷酸序列的任何类型的合成。实例包括,但不限于利用亚磷酰胺化学过程的反向合成或利用具有亚磷酰胺化学过程的正向合成。之前和公知的方法单独地合成寡核苷酸,然后将整个所需序列酶促“粘结”到珠上。申请人提出了复合的珠和用于产生这些珠的新方法,其中核苷酸以高通量方式化学构建到珠材料上。此外,申请人总体描述了递送一“包”的珠,其允许递送数百万序列到单独的区室中和然后一次性筛选所有序列。本发明进一步提供用于通过微流体系统建立单细胞测序文库的设备,包括:包含过滤器和载体流体通道的油-表面活性剂入口,其中所述载体流体通道还包括阻流体(resistor);包含过滤器和载体流体通道的分析物入口,其中所述载体流体通道进一步包括阻流体;包含过滤器和载体流体通道的mrna捕获微珠和裂解试剂入口,其中所述载体流体通道进一步包括阻流体;所述载体流体通道具有在其中以可调节的或预定的流率流动的载体流体;其中各所述载体流体通道在接合点处合并;和所述接合点连接于混合器,其包含液滴的出口。因此,本发明的目的是在本发明不包括任何之前已知的产品、制备该产品的工艺或使用该产品的方法,从而申请人保留权利且在此声称放弃任何之前已知的产品、工艺或方法。还应注意本发明不意图在本发明范围内包含不符合uspto(35u.s.c.§112,第1款)或epo(epc的第83条)的文字说明和可实现的要求的任何产品、工艺或者产品的制备或使用方法,从而申请人保留权利且在此声称放弃任何之前描述的产品、制备该产品的工艺或使用该产品的方法。应注意,在本公开中和特别地在权利要求和/或段落中,如“包含”、“包括”、“含有”等的术语可以具有在美国专利法中赋予其的含义;例如,它们可以意味着“包括”、“包括的”、“包括有”等等,且如“基本上由...组成”和“基本上由...构成”的术语具有在美国专利法中赋予其的含义,例如,它们允许未明确陈述的要素,但排除在现有技术中发现的或影响本发明的基本或新颖的特性的要素。这些实施方式和其它实施方式被公开或从以下详细说明来看是显而易见的且被以下详细说明涵盖。附图说明通过举例给出的以下详细说明不意图将本发明仅限制于所描述的特定实施方式,其可以结合附图最好地理解。图1显示了按照公开的示例性实施方式的微流体微滴。图2a和2b显示了使用单一碱基通过分割-和-汇合合成在珠上构建条码的本发明实施方式和用于mrna捕获的最终寡聚-dt尾。图3a-3d显示了接近理论复杂性水平的细胞条码序列。图4.阐明在注射(一次)的pbs中细胞的共包封的微流体装置。图5.微流体装置的示意性图示。图6.显示使用从微流体装置产生的使用drop-seq方法的分选目标液滴。图7a-d显示微滴中细胞转录组的分子条码标记。图8a-d显示通过drop-seq的单细胞转录组的提取和加工。图9a-g显示使用物种混合实验的drop-seq的临界评估(criticalevaluation)。图10a-c显示通过drop-seq分析的hek和3t3细胞的细胞-周期分析。图11a-f显示从通过drop-seq制备的44,808个单细胞转录谱从头重构视网膜细胞类型。图12a-i.无长突细胞、视锥细胞和视网膜神经节细胞之间的精密尺度(finer-scale)表达差别。图13a-c显示从通过drop-seq制备的471个单细胞转录谱从头重构人骨髓细胞类型。图14a-c显示微粒(珠)表面上条码标记的引物的性质的评估。图15a-e显示对drop-seq文库制备中的装置设计和对单细胞杂质的技术贡献的剖析。图16a-f显示随测序覆盖率变化的特异性和灵敏度,通过对以50细胞/μl的浓度制备的低深度和高深度物种混合(hek/293t)drop-seq文库下采样(down-sampling)进行评估。(a,b)特异性的分析。图17a-f显示drop-seq表达偏向和捕获效率的估计。图18显示分析中使用的44,808个视网膜细胞stamp的主成分1-32的图。图19阐明了显示通过非监督的单细胞基因表达分析产生的39个视网膜细胞簇中所选择标志物基因的表达的小提琴图(violinplot)。图20显示源自由构成完全44,808-细胞数据集的七个重复之一的细胞构成的各簇的分数。图21显示drop-seq设备的示意性图示。具体实施方式以下详细说明是本申请要求保护的发明参照附图的示例实施方式。这种说明旨在是说明性的而对于本发明的范围是非限制性的。这些实施方式足够详细地描述以使得本领域技术人员能够实施本发明,且应理解其它实施方式可以采用一些变化来实施而不脱离本发明的精神或范围。本发明提供了核苷酸-或寡核苷酸-装饰的珠,其中所述珠包含:连接体、用作测序引发位点(sequencingprimingsite)的相同序列、均一或近均一的核苷酸或寡核苷酸序列、独特分子标识(其对于各引发位点是不同的)、任选地用于捕获聚腺苷酸化mrna和启动反转录的寡核苷酸冗余(redudant)序列和任选地至少一个另外的寡核苷酸条码(其提供用于鉴别的另外的基质)。在本发明的实施方式中,珠表面上的核苷酸或寡核苷酸序列是分子条码。在进一步的实施方式中,条码长度范围为4-1000个核苷酸。在另一实施方式中,用于捕获聚腺苷酸化mrna和启动反转录的寡核苷酸序列是寡聚dt序列。在本发明的实施方式中,连接体是不可切割的直链聚合物。在另一实施方式中,连接体是可化学切割的直链聚合物。在进一步的实施方式中,连接体是不可切割的、任选取代的烃聚合物。在另一实施方式中,连接体是光不稳定的任选取代的烃聚合物。在另一实施方式中,连接体是聚乙二醇。在一个实施方式中,连接体是peg-c3至peg-24。本发明提供了包含多个核苷酸-或寡核苷酸-装饰的珠的混合物,其中所述珠包含:连接体、用作测序引发位点的相同序列、均一或近均一的核苷酸或寡核苷酸序列、对于各引发位点不同的独特分子标识、用于捕获聚腺苷酸化mrna和启动反转录的寡核苷酸冗余序列和任选地至少一个另外的寡核苷酸序列,其提供用于下游分子-生物反应的基质;其中均一或近均一的核苷酸或寡核苷酸序列对于任一个珠上的所有引发位点是相同的,但在单个珠上的寡核苷酸之间变化。在本发明的实施方式中,珠表面上的核苷酸或寡核苷酸序列是分子条码。在进一步的实施方式中,条码长度范围为4-1000个核苷酸。在另一实施方式中,用于捕获聚腺苷酸化mrna和启动反转录的寡核苷酸序列是寡聚dt序列。在本发明的实施方式中,混合物包含至少一个寡核苷酸序列,该寡核苷酸序列提供用于下游分子-生物反应的基质。在另一实施方式中,下游分子生物反应是用于成熟mrna的反转录;捕获转录组的特定部分、dna聚合酶和/或相似酶的启动;或在整个转录组或基因组中启动。在本发明的实施方式中,另外的寡核苷酸序列包含寡聚dt序列。在本发明的另一实施方式中,另外的寡核苷酸序列包含引物序列。在本发明的实施方式中,另外的寡核苷酸序列包含寡聚dt序列和引物序列。本发明提供了误差校正条码珠,其中所述珠包含:连接体、用作测序引发位点的相同序列、包含至少核苷酸碱基重复(nucleotidebaseduplicate)的均一或近均一的核苷酸或寡核苷酸序列、对于各引发位点不同的独特分子标识和用于捕获聚腺苷酸化mrna和启动反转录的寡核苷酸冗余。在本发明的实施方式中,误差校正条码珠不能与mrna杂交,从而不能发生反转录。本发明还提供了一种试剂盒,其包含寡核苷酸结合的珠和自身校正条码珠的混合物。本发明提供了用于建立单细胞测序文库的方法,包括:将一个独特地条码标记的rna捕获微珠与50μm-210μm直径的乳液微滴中的单细胞合并;裂解细胞从而在rna捕获微珠上捕获rna;破坏微滴并在溶液中汇合珠;进行反转录反应以将细胞的rna转换为第一链cdna,其共价连接于rna捕获微珠;或在微滴内逆向地反转录且随后破坏微滴和收集cdna-附着的珠;制备和测序单一复合rna-seq文库,其含有记录各rna的细胞来源的细胞条码和区分来自相同细胞的rna的分子条码。在一个实施方式中,乳液微滴的直径在50-210μm之间。在进一步的实施方式中,该方法中mrna捕获微珠的直径是10μm-95μm。在进一步的实施方式中,乳液微滴的直径是125μm。本发明提供了用于制备具有独特核酸序列的多个珠的方法,包括:在汇合-和-分割过程中在多个珠的表面上进行多核苷酸合成,以使得在各个合成循环中,珠分割成多个亚集,其中各亚集经历不同的化学反应;重复汇合-和-分割过程2个循环-200个循环之间任一次数的循环。在本发明的一个实施方式中,多核苷酸合成是亚磷酰胺合成。在本发明的另一实施方式中,多核苷酸合成是反向亚磷酰胺化学过程。在本发明的实施方式中,各亚集经历不同的核苷酸。在另一实施方式中,各亚集经历不同的规范核苷酸。在本发明的一个实施方式中,该方法重复三次、四次或十二次。在一个实施方式中,共价键是聚乙二醇。在另一实施方式中,mrna捕获微珠的直径是10μm-95μm。在一个实施方式中,其中多个步骤是十二个步骤。在进一步的实施方式中,所述方法进一步包括用于制备独特地条码标记的mrna捕获微珠的方法,该mrna捕获微珠具有独特的条码和适合于微流体装置的直径,该方法包括:1)在珠的表面上以汇合-和-分割方式进行反向亚磷酰胺合成,以使得在各个合成循环中,珠分割到具有四种规范核苷酸(t、c、g或a)之一的四个反应中;2)重复这一过程许多次,至少六次和最佳地超过十二次,以使得在后一情况中,池中的各珠的表面上存在超过1600万独特的条码。在一个实施方式中,mrna捕获微珠的直径是10μm-95μm。本发明提供了用于同时制备多个核苷酸-或寡核苷酸-装饰的珠的方法,其中均一、近均一或模式化的核苷酸或寡核苷酸序列在任何单个珠上合成而大量的不同核苷酸或寡核苷酸序列在不同的珠上同时合成,该方法包括:形成包含多个珠的混合物;将珠分离成亚集;通过化学合成添加单个核苷酸而在珠的表面上延伸核苷酸或寡核苷酸序列;将(c)中的珠的亚集汇合成单一公共池;重复步骤(b)、(c)和(d)多次以组合地产生一千或更多的核苷酸或寡核苷酸序列;和收集核苷酸-或寡核苷酸-装饰的珠。在本发明的实施方式中,珠表面上的核苷酸或寡核苷酸序列是分子条码。在进一步的实施方式中,汇合-和-分割合成步骤每2-10个循环进行,而不是每个循环进行。在本发明的实施方式中,条码包含内置误差校正。在另一实施方式中,条码长度范围为4-1000个核苷酸。在本发明的实施方式中,多核苷酸合成是亚磷酰胺合成。在进一步的实施方式中,多核苷酸合成是反向亚磷酰胺化学过程。在本发明的一个实施方式中,各亚集经历不同的核苷酸。在进一步的实施方式中,一个或多个亚集接受两种核苷酸的混合物。在一个实施方式中,各亚集经历不同的规范核苷酸。本发明提供的方法设想多种实施方式,其中珠是微珠、纳米颗粒或大珠。类似地,本发明设想寡核苷酸序列是二核苷酸或三核苷酸。本发明提供了用于同时制备一千或更多个核苷酸-或寡核苷酸-装饰的珠的方法,其中均一或近均一的核苷酸或寡核苷酸序列在任何单个珠上合成而多个不同的核苷酸或寡核苷酸序列同时在不同的珠上合成,该方法包括:形成包含多个珠的混合物;将珠分离成亚集;通过化学合成添加单个核苷酸而在珠的表面上延伸核苷酸或寡核苷酸序列;将(c)中的珠的亚集汇合成单一公共池;重复步骤(b)、(c)和(d)多次以组合地产生大量的核苷酸或寡核苷酸序列;和收集核苷酸-或寡核苷酸装饰的珠;以汇合-和-分割合成在多个珠的表面上进行多核苷酸合成,以使得在各合成循环中,珠分割成多个亚集,其中各亚集经历不同的化学反应;重复汇合-和-分割合成多次。在本发明的实施方式中,珠表面上的核苷酸或寡核苷酸序列是分子条码。在一个实施方式中,汇合-和-分割合成步骤每2-10个循环进行,而不是每个循环进行。在一个实施方式中,所产生的条码包含内置误差校正。在另一实施方式中,条码长度范围为4-1000个核苷酸。在本发明的实施方式中,多核苷酸合成是亚磷酰胺合成。在进一步的实施方式中,多核苷酸合成是反向亚磷酰胺化学过程。在本发明的一个实施方式中,各亚集经历不同的核苷酸。在进一步的实施方式中,一个或多个亚集接受两种核苷酸的混合物。在一个实施方式中,各亚集经历不同的规范核苷酸。本发明提供的方法设想多种实施方式,其中珠是微珠、纳米颗粒或大珠。类似地,本发明设想寡核苷酸序列是二核苷酸或三核苷酸。本发明进一步提供用于通过微流体系统建立复合单细胞测序文库的设备,包括:包含过滤器和两个载体流体通道的油-表面活性剂入口,其中所述载体流体通道进一步包括阻流体;包含过滤器和两个载体流体通道的分析物入口,其中所述载体流体通道进一步包括阻流体;包含载体流体通道的mrna捕获微珠和裂解试剂入口;所述载体流体通道具有在其中以可调节的或预定的流率流动的载体流体;其中各所述载体流体通道在接合点处合并;和所述接合点连接于用于微滴夹止(dropletpinch-off)的收缩部,接着是混合器,其连接于液滴出口。在该设备的一个实施方式中,分析物包括化学试剂、遗传扰动的细胞、蛋白质、药物、抗体、酶、核酸、细胞器如线粒体或细胞核、细胞或其任何组合。在该设备的一个实施方式中,分析物是细胞。在进一步的实施方式中,分析物是哺乳动物细胞。在另一实施方式中,该设备的分析物是复杂组织。在进一步的实施方式中,细胞是脑细胞。在本发明的实施方式中,细胞是视网膜细胞。在另一实施方式中,细胞是人骨髓细胞。在一个实施方式中,细胞是宿主-病原体细胞(host-pathgencell)。在该设备的一个实施方式中,裂解试剂包括阴离子型表面活性剂如月桂酰基肌氨酸钠,或离液盐如硫氰酸胍。在该设备的一个实施方式中,过滤器由方形pdms柱组成;细胞通道上的过滤器由这种柱组成,侧边范围为125-135μm,柱间间隔70-100mm。油-表面活性剂入口上的过滤器包含两种尺寸的方形柱:一种具有75-100μm范围的侧边和其间25-30μm的间隔,和另一种具有40-50μm范围的侧边和10-15μm的间隔。在该设备的一个实施方式中,阻流体是长度7000-9000μm、宽度50-75μm和深度100-150mm的蛇形体(serpentine)。在该设备的一个实施方式中,通道对于油-表面活性剂入口具有8000-12,000μm的长度,对于分析物(细胞)入口具有5000-7000的长度,和对于微珠和裂解试剂入口具有900-1200μm的长度。所有通道具有125-250mm的宽度和100-150mm的深度。在另一实施方式中,细胞通道的宽度是125-250μm和深度是100-150μm。在该设备的一个实施方式中,混合器长度为7000-9000μm和宽度为110-140μm,每150μm具有35-45°的曲折。在一个实施方式中,混合器的宽度是125μm。在该设备的一个实施方式中,油-表面活性剂是peg嵌段聚合物如bioradtmqx200微滴产生油(dropletgenerationoil)。在该设备的一个实施方式中,载体流体是水-甘油混合物。混合物包含用以下元件的组合装饰的多个微珠:通过所提供的方法产生的珠特异性的寡核苷酸条码;另外的寡核苷酸条码序列,其在单个珠上的寡核苷酸之间变化且因此可以用于区分或帮助鉴别那些单个寡核苷酸分子;产生用于下游分子-生物反应的基质的另外的寡核苷酸序列,如寡聚-dt(用于成熟mrna的反转录)、特异性序列(用于捕获转录组的特定部分或dna聚合酶和类似酶的启动)或随机序列(用于在整个转录组或基因组上的启动)。在一个实施方式中,任何单个微珠上的单个寡核苷酸分子包含所有这三种元件,且第三种元件包括寡聚-dt和引物序列两者。在另一实施方式中,混合物包含多个微珠,其中所述微珠包含以下元件:可通过概述的方法获得的至少一个珠特异性的寡核苷酸条码;至少一个另外的标识寡核苷酸条码序列,其在单个珠上的寡核苷酸之间变化且由此帮助鉴别珠特异性寡核苷酸分子;任选地至少一个另外的寡核苷酸序列,其提供用于下游分子-生物反应的基质。在另一实施方式中,混合物包含至少一个寡核苷酸序列,其提供用于下游分子-生物反应的基质。在进一步的实施方式中,下游分子生物反应用于成熟mrna的反转录;捕获转录组的特定部分,dna聚合酶和类似酶的启动;或在整个转录组或基因组上的启动。在进一步的实施方式中,混合物包含含有寡聚dt序列的另外的寡核苷酸序列。在另一实施方式中,混合物进一步包含含有引物序列的另外的寡核苷酸序列。在另一实施方式中,混合物进一步包含含有寡聚dt序列和引物序列的另外的寡核苷酸序列。可以使用的标记物质的实例包括本领域技术人员已知的标记物质,如荧光染料、酶、辅酶、化学发光物质和放射性物质。特定的实例包括放射性同位素(例如,32p、14c、125i、3h和131i)、荧光素、罗丹明、丹磺酰氯、伞形酮、萤光素酶、过氧化物酶、碱性磷酸酶、β-半乳糖苷酶、β-葡糖苷酶、辣根过氧化物酶、葡糖淀粉酶、溶菌酶、糖氧化酶、微过氧化物酶、生物素和钌。在使用生物素作为标记物质的情况中,优选地在添加生物素标记的抗体后,进一步添加与酶(例如,过氧化物酶)结合的链霉亲和素。有利地,标记是荧光标记。荧光标记的实例包括,但不限于atto染料、4-乙酰胺基-4′-异硫氰酸合芪-2,2′-二磺酸;吖啶及衍生物:吖啶、吖啶异硫氰酸酯;5-(2′-氨基乙基)氨基萘-1-磺酸(edans);4-氨基-n-[3-乙烯基磺酰基)苯基]萘酰亚胺-3,5-二磺酸酯;n-(4-苯胺基-1-萘基)马来酰亚胺;邻氨基苯甲酰胺(anthranilamide);bodipy;亮黄;香豆素及衍生物:香豆素、7-氨基-4-甲基香豆素(amc,coumarin120)、7-氨基-4-三氟甲基香豆素(couluarin)(coumaran151);花青染料;标记红(cyanosine);4′,6-二脒基(diaminidino)-2-苯基吲哚(dapi);5′5″-二溴焦棓酚-磺酚酞(sulfonaphthalein)(溴焦酚红);7-二乙基氨基-3-(4′-异硫氰酸根合苯基)-4-甲基香豆素;二亚乙基三胺五乙酸;4,4′-二异硫氰酸根合二氢-芪-2,2′-二磺酸;4,4′-二异硫氰酸根合芪-2,2′-二磺酸;5-[二甲基氨基]萘-1-磺酰氯(dns,丹磺酰氯);4-二甲基氨基苯基偶氮苯基-4′-异硫氰酸酯(dabitc);曙红及衍生物:曙红、曙红异硫氰酸酯;赤藓红及衍生物:赤藓红b、赤藓红异硫氰酸酯;乙啡啶;荧光素及衍生物:5-羧基荧光素(fam)、5-(4,6-二氯三嗪-2-基)氨基荧光素(dtaf)、2′,7′-二甲氧基-4′5′-二氯-6-羧基荧光素、荧光素、荧光素异硫氰酸酯、qfitc、(xritc);荧光胺;ir144;ir1446;孔雀绿异硫氰酸酯;4-甲基伞形酮邻-甲酚酞;硝基酪氨酸;副蔷薇苯胺;酚红;b-藻红蛋白;邻苯二甲醛;芘及衍生物:芘、芘丁酸酯、琥珀酰亚胺1-芘;丁酸酯量子点;活性红4(cibacron.tm.brilliantred3b-a);罗丹明及衍生物:6-羧基-x-罗丹明(rox)、6-羧基罗丹明(r6g)、丽丝胺罗丹明b磺酰氯罗丹明(rhod)、罗丹明b、罗丹明123、罗丹明x异硫氰酸酯、磺酰罗丹明b、磺酰罗丹明101、磺酰罗丹明101的磺酰氯衍生物(德克萨斯红);n,n,n′,n′-四甲基-6-羧基罗丹明(tamra);四甲基罗丹明;四甲基罗丹明异硫氰酸酯(tritc);核黄素;玫瑰红酸;铽螫合物衍生物;cy3;cy5;cy5.5;cy7;ird700;ird800;lajoltablue;酞菁和萘菁。荧光标记可以是荧光蛋白如蓝色荧光蛋白、青色荧光蛋白、绿色荧光蛋白、红色荧光蛋白、黄色荧光蛋白或任何光转化蛋白。比色标记、生物发光标记和/或化学发光标记可以进一步完成标记。标记可以进一步包括杂交复合体中的分子之间通过扰动分析、淬灭或供体和受体分子之间的电子传递的能量转移,其中后者可以通过双链匹配杂交复合体促进。荧光标记可以是苝或terrylen。在替代方式中,荧光标记可以是荧光条码。在有利的实施方式中,标记可以是光敏感的,其中标记是光激活的和/或光切割一个或多个连接体以释放分子载质(molecularcargo)。光激活的分子载质可以是主要的捕光复合物(lhcii)。在另一实施方式中,荧光标记可以诱导自由基形成。在有利的实施方式中,试剂可以以动态方式独特地标记(参见,例如,2012年9月12日提交的美国临时专利申请系列号61/703,884)。独特的标记性质上至少部分地是核酸,且可以通过顺序地将两个或更多个可检测寡核苷酸标签彼此连接来产生,和各独特标记可以与单独的试剂相关联。可检测寡核苷酸标签可以是可通过其核苷酸序列的测序和/或通过检测其可能连接的非核酸可检测部分来检测的寡核苷酸。寡核苷酸标签可以通过其核苷酸序列或通过与该寡核苷酸连接的非核酸可检测部分(例如,但不限于荧光团)或通过其核苷酸序列和非核酸可检测部分的组合而是可检测的。在一些实施方式中,可检测寡核苷酸标签可以包含一个或多个非寡核苷酸可检测部分。可检测部分的实例可以包括,但不限于荧光团、微粒包括量子点(empodocles等,nature399:126-130,1999)、金纳米颗粒(reichert等,anal.chem.72:6025-6029,2000)、微珠(lacoste等,proc.natl.acad.sci.usa97(17):9461-9466,2000)、生物素、dnp(二硝基苯基)、岩藻糖、地高辛、半抗原和本领域技术人员已知的其它可检测部分。在一些实施方式中,可检测部分可以是量子点。用于检测这些部分的方法是本文中描述的和/或本领域中已知的。因此,可检测寡核苷酸标签可以是,但不限于可以包含独特核苷酸序列的寡核苷酸、可以包含可检测部分的寡核苷酸和可以包含独特核苷酸序列和可检测部分两者的寡核苷酸。独特标记可以通过顺序地将两个或更多个可检测寡核苷酸标签彼此连接来产生。可检测标签可以在多个可检测标签中存在或提供。可以使用相同或不同的多个标签,因为各可检测标签的来源可以是独特标记的部分。换句话说,多个标签可以细分成亚集且单一亚集可以用作各标签的来源。在一些实施方式中,一个或多个其它种类可以与标签相关联。特别地,由裂解的细胞释放的核酸可以连接于一个或多个标签。这些可以包括,例如,染色体dna、rna转录物、trna、mrna、线粒体dna等。这样的核酸可以在标签本身的测序之外进行测序,这可以产生关于细胞的核酸谱(其可以与标签相关联)或者相应的微滴或细胞暴露的条件的信息。本文描述的本发明通过使用单分散水性微滴能够实现对于可能包含细胞、细胞器、核酸、蛋白质等的单个乳液微滴的高通量和高分辨率的试剂递送,该单分散水性微滴通过微流体装置作为油包水乳液产生。微滴携带在流动油相中并通过表面活性剂稳定。在一个方面中,单一细胞或单一细胞器或单一分子(蛋白质、rna、dna)从水性溶液/分散液包封到均一的微滴中。在相关的方面中,多种细胞或多种分子可以取代单一细胞或单一分子。体积范围1pl-10nl的水性微滴作为单个反应器发挥作用。所公开的实施方式在微滴中提供数以千计的单一细胞,其可以在单次操作中处理和分析。为利用微液滴进行快速大规模化学筛选或复杂生物学文库的鉴定,不同种类的微液滴(各包含特定化学化合物或者生物探针细胞或目标分子条码)必须在优选的条件下(例如,混合比率、浓度和组合顺序)产生和组合。各微滴种类在汇合点从单独的入口微流体通道引入到主微流体通道中。优选地,按照设计选择微滴体积以使得一个种类大于其它种类且在载体流体中以不同的速率移动,通常慢于其它种类,如美国公开号us2007/0195127和国际公开号wo2007/089541中公开的,其各自全文通过引用并入本文。通道宽度和长度选择为使得较快的微滴种类赶上最慢的种类。通道的尺寸限制防止较快移动的微滴经过较慢移动的微滴,从而导致微滴串进入合并区。多步骤化学反应、生物化学反应或分析检测化学作用经常在不同类型的物质添加到反应之前需要固定的反应时间。多步骤反应通过用第二、第三或更多个汇合点(各具有单独的合并点)重复该过程多次来实现。高度有效和精确的反应及反应的分析在来自入口通道的微滴的频率与最优比率匹配且种类的体积匹配以在组合的微滴中提供最优反应条件时实现。流体微滴可以通过改变包含微滴的液体的流动在本发明的液体系统中筛选或分选。例如,在一组实施方式中,流体微滴可以通过将包围流体微滴的液体指引到第一通道、第二通道等中来操纵或分选。在另一组实施方式中,流体系统内(例如,不同通道内或不同通道部分内)的压力可以被控制以指引流体微滴的流动。例如,微滴可以指引到通道接合点,其包括用于进一步的流动方向的多个选项例如,指引到通道中限定任选的下游流动通道的分支或分叉)。一个或多个任选的下游流动通道内的压力可以被控制以指引微滴选择性地进入一个通道,且压力的变化可以以相继的微滴到达接合点所需时间的顺序来实现,使得各相继的微滴的下游流路可以独立地控制。在一种配置中,液体储库的扩展和/或收缩可以用于操纵或分选流体微滴到通道中,例如,通过导致包含流体微滴的流体的定向移动。在另一实施方式中,液体储库的扩展和/或收缩可以与其它流控制装置和方法结合,例如,如本文中所述的。能够导致液体储库的扩展和/或收缩的装置的非限制性实例包括活塞。使用微流体通道处理微滴的关键要素包括:(1)产生适当体积的微滴,(2)以适当频率产生微滴和(3)以第一样品微滴流的频率匹配第二样品微滴流的频率的方式使第一样品微滴流与第二样品微滴流集合到一起。优选地,以文库微滴的频率匹配样品微滴的频率的方式使样品微滴流与预制文库微滴流集合到一起。用于以规则的频率产生均一体积的微滴的方法是本领域中公知的。一种方法是使用分散相流体和非混溶载体流体的流体动力学聚焦产生微滴,如美国公开号us2005/0172476和国际公开号wo2004/002627中公开的。希望的是在汇合处引入的种类之一是预制的微滴文库,其中该文库包含多种反应条件,例如,文库可以以一定浓度范围包含作为单独文库元件包封的用于筛选其对于细胞或酶的作用的多种不同的化合物,或者文库可以由作为不同文库元件包封的用于基因座集合的靶向扩增的多个不同引物对构成,或者文库可以包含作为不同文库元件包封以进行多个结合分析的多个不同抗体种类。将反应条件库引入到基质上通过将预制的文库微滴集合用驱动流体推出小瓶来实现。驱动流体是连续流体。驱动流体可以包含与载体流体(例如,氟碳油(fluorocarbonoil))相同的物质。例如,如果由10pl微滴组成的文库用10,000pl/秒流率的驱动流体驱动进入微流体基底上的入口通道中,则名义上微滴预期进入汇合点的频率是1000/秒。但是,实际上微滴在其之间用缓慢排出的油包装。载体流体随着时间从文库微滴排出且微滴的数量密度(数量/ml)提高。因此,驱动流体的简单固定输注速率不提供将微滴引入基底的微流体通道中的均一速率。此外,平均文库微滴体积的文库-文库差异导致在汇合点处微滴引入频率的偏移。因此,由于样品差异和油排出导致的微滴均一性的缺乏提出了待解决的另一问题。例如,如果名义微滴体积在文库中预期是10pl,但在文库之间从9pl至11pl变化,则10,000pl/秒的输注速率名义上将产生900-1,100微滴/秒的频率范围。简言之,在芯片上形成的微滴的分散相组成的样品-样品差异、文库微滴的数量密度随时间提高的趋势和平均微滴体积的文库-文库差异严重地限制微滴频率可以通过简单地使用固定输注速率可靠地在汇合处匹配的程度。另外,这些限制也具有对体积可以重现地组合的程度有影响。与泵流率精度的典型变化和通道尺寸的变化相结合,系统受到严重的限制而无没有基于逐次操作进行补偿的手段。前述事实不仅说明了待解决的问题,而且阐明对于即时调节对微流体通道内微液滴的微流体控制的方法的需要。表面活性剂和油的组合必须开发为利于微滴的产生、储存和操作以保持多样化文库的各微滴内独特的化学/生物化学/生物学环境。因此,表面活性剂和油的组合必须(1)在液滴形成过程及随后的收集和储存过程中稳定微滴以避免不受控的聚并,(2)最小化任何微滴内容物至油相的转运和/或在微滴之间的转运,和(3)维持与各微滴的内容物的化学和生物学惰性(例如,没有包封的内容物在油-水界面处的吸附或反应,和没有对微滴中生物或化学成分的负面影响)。除了对微滴文库功能和稳定性的要求外,油中表面活性剂的溶液必须与流体物理和材料(其与平台相关)相结合。具体地,油溶液必须不使用于构建微流体芯片的材料溶胀、溶解或降解,且油的物理性质(例如,粘度、沸点等)必须适合于平台的流动和操作条件。在没有表面活性剂的油中形成的微滴不是稳定的而允许聚并,因此表面活性剂必须溶解在用作用于乳液文库的连续相的油中。表面活性剂分子是两亲性的--分子的一部分是油溶性的且分子的一部分是水溶性的。当水-油界面在微流体芯片的喷嘴处(例如,本文描述的入口模块中)形成时,溶解于油相中的表面活性剂分子吸附到界面。分子的亲水性部分居于微滴的内部和分子的亲氟部分(fluorophilicportion)分布于微滴的外部。微滴的表面张力在界面充满表面活性剂时降低,因此乳液的稳定性提高。除了针对聚并使微滴稳定外,表面活性剂应当对于各微滴的内容物是惰性的且表面活性剂不应当促进包封的组分至油或其它微滴的转运。微滴文库可以由在一起汇合在单一集合中的多种文库元件构成(参见,例如,美国专利公开no.2010002241)。文库的复杂性可以从单一文库元件至1015个或更多个文库元件变化。各文库元件可以是固定浓度的一种或多种给定组分。元件可以是,但不限于细胞、细胞器、病毒、细菌、酵母、珠、氨基酸、蛋白质、多肽、核酸、多核苷酸或小分子化学化合物。元件可以包含标识如标记。术语″微滴文库″或″多个微滴文库″在本文中也称为″乳液文库″或″多个乳液文库″。这些术语在整个说明书可互换使用。细胞文库元件可以包括,但不限于杂交瘤、b-细胞、原代细胞、培养细胞系、癌细胞、干细胞、从组织(例如,视网膜或人骨髓)获得的细胞、外周血单核细胞或任何其它细胞类型。细胞文库元件通过在单个微滴中包封一个至成千上万的多个细胞来制备。包封的细胞数通常从细胞的数量密度和微滴的体积通过泊松统计给出。但是,在一些情况中,如edd等,″controlledencapsulationofsinglecellsintomonodispersepicolitredrops.″labchip,8(8):1262-1264,2008中所述的,数字偏离泊松统计。细胞的离散特性允许大量制备具有全部存在于单一起始介质中的多种细胞变体的文库,且然后该介质分散成包含至多一个细胞的单个微滴囊。这些单个微滴囊然后组合或汇合以形成由独特文库元件组成的文库。继包封之后或者,在一些实施方式中,紧接着包封,细胞分裂产生克隆文库元件。多种分析物可以设想用于前述的drop-测序方法。设想的细胞的实例是哺乳动物细胞,但本发明包括用于对宿主-病原体细胞进行谱型分析的方法。为表征宿主-病原体相互作用的表达,重要的是使宿主和病原体在相同的细胞中生长而没有病原体感染的多次机会。基于珠的文库元件可以包含给定类型的一个或多个珠,且也可以包含其它试剂,如抗体、酶或其它蛋白质。在其中所有文库元件包含不同类型的珠,但包含相同的周围介质的情况中,文库元件可以全部从单一起始流体制备或具有多种起始流体。在从变体(如遗传修饰的)酵母或细菌细胞的集合大量制备的细胞文库的情况中,文库元件从多种起始流体制备。经常希望的是,当用多个经工程化以产生蛋白质的变体的细胞或酵母或细菌开始时,恰好每微滴具有一个细胞而仅具有一些微滴包含超过一个细胞。在一些情况中,可以获得与泊松统计的偏离以提供加强的微滴加载,从而使得更多的微滴恰好具有一个细胞/微滴和很少空微滴或包含超过一个细胞的微滴的例外。微滴文库的实例是具有不同内容物的微滴的集合,范围为珠、细胞、小分子、dna、引物、抗体。较小的微滴可以是大约毫微微升(fl)体积的液滴,其特别地用微滴分配器设定。体积范围可以为约5-约600fl。较大的微滴大小范围为大约0.5微米至500微米的直径,其对应于约1pl-1nl。但是,微滴可以小到5微米和大至500微米。优选地,微滴直径为小于100微米、约1微米-约100微米。最优选的大小是直径约20-40微米(10-100pl)。微滴文库检验的优选性质包括渗透压平衡、均一大小和尺寸范围。本发明的乳液文库内包含的微滴可以包含在不混溶的油内,其可以包含至少一种含氟表面活性剂。在一些实施方式中,不混溶的氟碳油内包含的含氟表面活性剂是由一个或多个全氟化聚醚(pfpe)嵌段和一个或多个聚乙二醇(peg)嵌段组成的嵌段共聚物。在其它实施方式中,含氟表面活性剂是由通过酰胺连接基团与两个pfpe嵌段共价结合的peg中心嵌段组成的三嵌段共聚物。含氟表面活性剂的存在(与文库中微滴的均一大小类似)对于维持微滴的稳定性和完整性是关键的且也对于文库内微滴用于本文中描述的各种生物学和化学分析的后续使用是必要的。可以在本发明的微滴文库中使用的流体(例如,水性流体、不混溶油等)和其它表面活性剂在本文中更详细地描述。本发明提供了可以在不混溶油(例如,氟碳油)中包含多个水性微滴的乳液文库,不混溶油可以包含至少一种含氟表面活性剂,其中各微滴大小均一且可以包含相同的水性流体和可以包含不同的文库元件。本发明还提供用于形成乳液文库的方法,其可以包括提供单一水性流体(其可以包含不同文库元件),将各文库元件包封到不混溶氟碳油(其可以包含至少一种含氟表面活性剂)内的水性微滴中,其中各微滴大小均一且可以包含相同的水性流体和可以包含不同的文库元件,和汇合不混溶氟碳油(其可以包含至少一种含氟表面活性剂)内的水性微滴,从而形成乳液文库。例如,在一种类型的乳液文库中,所有不同类型的元件(例如,细胞或珠)可以汇合到相同介质中包含的单一源中。在初始汇合后,细胞或珠然后包封在微滴中以产生微滴的文库,其中具有不同类型的珠或细胞的各微滴是不同文库元件。初始溶液的稀释使得包封过程成为可能。在一些实施方式中,形成的微滴包含单细胞或珠或者不包含任何东西,即是空的。在其它实施方式中,形成的微滴包含多个拷贝的文库元件。包封的细胞或珠一般是相同类型的细胞或珠的变体。在一个实例中,细胞可以包含组织活检的癌细胞,且各细胞类型被包封以筛选基因组数据或针对不同药物疗法进行筛选。另一实例是1011或1015个不同类型的细菌;各自具有在其中剪接的不同质粒,其被包封。一个实例是细菌文库,其中各文库元件生长成分泌酶的变体的克隆群体。在另一个实例中,乳液文库可以包含不混溶氟碳油内的多个水性微滴,其中单分子可以被包封,以使得对于所产生的每20-60个微滴(例如,20、25、30、35、40、45、50、55、60个微滴,或其间的任何整数)存在微滴内包含的单一分子。单一分子可以通过稀释包含该分子的溶液至使得能够实现单一分子的包封的这种低浓度而包封。在一种特定的实例中,lacz质粒dna在2小时孵育后以20fm的浓度包封,以使得在40个微滴中具有约一个基因,其中10μm微滴以10khz/秒形成。这些文库的形成依赖于有限的稀释。本发明还提供可以在氟碳油(其可以包含至少一个含氟表面活性剂)内包含至少第一水性微滴和至少第二水性微滴的乳液文库,其中至少第一微滴和至少第二微滴尺寸上是均一的并包含不同的水性流体和不同的文库元件。本发明还提供用于形成乳液文库的方法,其可以包括提供至少第一水性流体(其可以包含至少第一元件文库),提供至少第二水性流体(其可以包含至少第二元件文库),包封所述至少第一文库的各元件到不混溶氟碳油(其可以包含至少一个含氟表面活性剂)内的至少第一水性微滴中,包封所述至少第二文库的各元件到不混溶氟碳油(其可以包含至少一个含氟表面活性剂)内的至少第二水性微滴中,其中至少第一微滴和至少第二微滴尺寸上是均一的并包含不同的水性流体和不同的文库元件,和在不混溶氟碳油(其可以包含少一个含氟表面活性剂)内汇合至少第一水性微滴和至少第二水性微滴,从而形成乳液文库。本领域技术人员将认识到,本发明的方法和系统不限于任何特定的样品类型,且本发明的方法和系统可以用于任何类型的有机、无机或生物分子(参见,例如,美国专利公开no.20120122714)。在特定实施方式中,样品可以包括核酸靶分子。核酸分子可以是合成的或来源于天然存在的来源。在一个实施方式中,核酸分子可以从包含多种其它组分如蛋白质、脂质和非模板核酸的生物样品分离。核酸靶分子可以从获自动物、植物、细菌、真菌或任何其它细胞有机体的任何细胞物质获得。在某些实施方式中,核酸靶分子可以从单一细胞获得。用于本发明中的生物样品可以包括病毒颗粒或制剂。核酸靶分子可以直接获自有机体或获自从有机体获得的生物样品,例如,获自血液、尿液、脑脊液、精液、唾液、痰、粪便和组织。任何组织或体液样本可以用作本发明中使用的核酸的来源。核酸靶分子也可以从培养的细胞如原代细胞培养物或细胞系分离。核酸由其获得的细胞或组织可以用病毒或其它细胞内病原体感染。样品也可以是从生物样本提取的总rna、edna文库、病毒或基因组dna。一般地,核酸可以通过多种技术如maniatis等,molecularcloning:alaboratorymanual,coldspringharbor,n.y.,pp.280-281(1982)中描述的那些从生物样品提取。核酸分子可以是单链的、双链的或具有单链区的双链(例如,茎-和环-结构)。从生物样品获得的核酸通常可以断裂以产生用于分析的适宜片段。靶核酸可以使用多种机械、化学和/或酶促方法断裂或剪切到所需长度。dna可以通过超声处理(例如,covaris法)、短暂暴露于dnase或使用一种或多种限制性酶或者转座酶或切口酶的混合物随机剪切。rna可以通过短暂暴露于rnase、热加镁或通过剪切断裂。rna可以转换为edna。如果采用断裂,rna可以在断裂之前或之后转换为cdna。在一个实施方式中,来自生物样品的核酸通过超声处理断裂。在另一实施方式中,核酸通过水力剪切仪断裂。一般地,单个核酸靶分子可以为约40碱基至约40kb。核酸分子可以是单链的、双链的或或具有单链区的双链(例如,茎-和环-结构)。如本文中所述的生物样品可以在清洁剂或表面活性剂的存在下均质化或断裂。缓冲液中清洁剂的浓度可以为约0.05%-约10.0%。清洁剂的浓度可以最高达到其中清洁剂保持溶解于溶液中的量。在一个实施方式中,清洁剂的浓度为0.1%-约2%。清洁剂,特别是非变性的温和清洁剂,可以起到增溶样品的作用。清洁剂可以是离子的或非离子的。非离子清洁剂的实例包括triton,如tritontmx系列(tritontmx-100t-oct-c6h4--(och2--ch2)xoh,x=9-10,tritontmx-100r,tritontmx-114x=7-8)、辛基糖苷、聚氧乙烯(9)十二烷基醚、洋地黄皂苷、igepaltmca630辛基苯基聚乙二醇、n-辛基-β-d-吡喃葡萄糖苷(betaog)、n-十二烷基-β,tweentm20聚乙二醇脱水山梨醇单月桂酸酯、tweentm80聚乙二醇脱水山梨醇单油酸酯、聚多卡醇(polidocanol)、n-十二烷基β-d-麦芽糖苷(ddm)、np-40壬基苯基聚乙二醇、c12e8(八乙二醇n-十二烷基单醚)、六乙二醇单-n-十四烷基醚(c14e06)、辛基-β-硫代吡喃葡萄糖苷(辛基硫代葡萄糖苷,otg)、emulgen和聚氧乙烯10月桂基醚(c12e10)。离子清洁剂(阴离子型或阳离子型)的实例包括脱氧胆酸盐、十二烷基硫酸钠(sds)、n-月桂酰基肌氨酸和鲸蜡基三甲基溴化铵(ctab)。两性离子试剂也可以用于本发明的纯化方案中,如chaps、zwitterion3-14和3-[(3-胆酰胺丙基)二甲基铵基]-1-丙烷磺酸盐。也设想尿素可以在具有或不具有另一清洁剂或表面活性剂的情况下添加。裂解或均质化溶液可以进一步包含其它试剂,如还原剂。这些还原剂的实例包括二硫苏糖醇(dtt)、β-巯基乙醇、dte、gsh、半胱氨酸、半胱胺、三羧基乙膦(tcep)或亚硫酸的盐。可以进行核酸的尺寸选择以除去非常短的片段或非常长的片段。核酸片段可以使用本领域中已知的任何合适方法分配到可包含所需数目的片段的级分中。限制各片段的片段大小的合适方法是本领域中已知的。在本发明的各种实施方式中,片段大小限制于约10和100kb之间或更长。在另一实施方式中,样品包括单个目标蛋白质、蛋白质复合体、具有翻译修饰的蛋白质和蛋白质/核酸复合体。蛋白质靶标包括肽,且也包括酶、激素、结构组分(如病毒衣壳蛋白质)和抗体。蛋白质靶标可以是合成的或源自天然存在的来源。在本发明的一个实施方式中,蛋白质靶标从包含多种其它组分(包括脂质、非模板核酸和核酸)的生物样品分离。在某些实施方式中,蛋白质靶标可以从动物、细菌、真菌、细胞有机体和单细胞获得。蛋白质靶标可以直接获自有机体或获自从有机体获得的生物样品,包括体液如血液、尿液、脑脊液、精液、唾液、痰、粪便和组织。蛋白质靶标也可以获自细胞和组织裂解产物及生物化学部分。单个蛋白质是分离的多肽链。蛋白质复合体包括两个或更多个多肽链。样品可以包括具有翻译后修饰(包括,但不限于磷酸化、蛋氨酸氧化、脱酰胺作用、糖基化、泛素化、氨甲酰化、s-羧甲基化、乙酰化和甲基化)的蛋白质。蛋白质/核酸复合体包括交联的或稳定的蛋白质-核酸复合体。单个蛋白质、蛋白质复合体、具有翻译修饰的蛋白质和蛋白质/核酸复合体的提取或分离使用本领域中已知的方法进行。本发明的方法涉及形成样品微滴。微滴是被不混溶的载体流体包围的水性微滴。形成这种微滴的方法例如显示于link等(美国专利申请号2008/0014589,2008/0003142和2010/0137163)、stone等(美国专利号7,708,949和美国专利申请号2010/0172803)、anderson等(美国专利号7,041,481且作为re41,780重授权)和raindancetechnologiesinc.的欧洲公开号ep2047910中。其各自的内容通过引用全文并入本文中。本发明涉及用于在高通量微流体系统中操作微滴的系统和方法。参见图1,微流体微滴(10)包封分化的细胞(图中未显示)。细胞被裂解且其mrna(20)杂交到表面上包含条码标记的寡聚dt引物(30)的捕获珠(40)上,这些全部在微滴内部。条码通过柔性多原子连接体如peg(50)共价连接于捕获珠。在优选的实施方式中,微滴通过添加含氟表面活性剂(如全氟辛醇)破碎、洗涤和收集。然后进行反转录(rt)反应以将各细胞的mrna转换成第一链cdna,其被独特地条码标记并共价连接于mrna捕获珠。随后,通过模板转换反应的通用引物使用常规文库制备方案修复以制备rna-seq文库。由于来自任何给定细胞的所有mrna被独特地条码标记,单一文库进行测序并然后计算地解析以确定哪些mrna来自哪些细胞。以这种方式,通过单一测序轮,可以同时获得数以万计(或更多)的可区分转录组。参见图2a和2b,在珠表面上产生的寡核苷酸序列显示于图2a中。在这些循环过程中,珠从合成柱移除,汇合并按质量等分成四个相等部分;这些珠等份然后置于单独的合成柱中且与dg、dc、dt或da亚磷酰胺任一反应。在其它情况中,使用二核苷酸、三核苷酸或长度较长的寡核苷酸,在其它情况中,寡聚-dt尾用基因特异性的寡核苷酸替换以启动特定的靶标(单数或复数),任意长度的随机序列用于捕获所有或特定rna。这一过程重复12次,达到总共412=16,777,216个独特的条码序列(图2b)。在完成这些循环时,8个循环的简并寡核苷酸合成在所有珠上进行(图2a中的分子条码“mbc”),接着30个循环的dt添加。在其它实施方式中,简并合成被省略、缩短(少于8个循环)或延长(多于8个循环);换句话说,30个循环的dt添加用基因特异性的引物(单一靶标或多个靶标)或简并序列替换。在图3a至3d中,分析一千个细胞条码序列以测定细胞条码复杂性(图3a)。前述微流体系统视为是试剂递送系统微流体文库打印机或本发明的微滴文库打印系统(图4)。微滴(55)从包含裂解试剂和条码的微滴发生器(51)通过包含油(53)的微流体出口通道(52)朝向接合点(54)形成为样品流体流。限定体积的加载试剂乳液(对应于限定数目的微滴)按照需要分配到载体流体的流动流中。样品流体通常可以包含水性缓冲溶液,如超纯水(例如,18兆欧电阻率,例如通过柱色谱获得的)、10mmtrishcl和1mmedta(te)缓冲液、磷酸盐缓冲盐水(pbs)或乙酸盐缓冲液。可以使用与核酸分子生理上相容的任何液体或缓冲液。载体流体可以包括与样品流体不混溶的载体流体。载体流体可以是非极性溶剂,癸烷(例如,十四烷或十六烷)、氟碳油、硅油、惰性油(如烃)或另一种油(例如,矿物油)。在某些实施方式中,载体流体可以包含一种或多种添加剂,如降低表面张力的试剂(表面活性剂)。表面活性剂可以包括tween、span、含氟表面活性剂和相对于水可溶于油中的其它试剂。在一些应用中,通过向样品流体添加第二表面活性剂来改善性能。表面活性剂可以帮助控制或优化微滴尺寸、流动和均匀性,例如通过降低挤出或注射微滴到交叉通道中所需的剪切力。这可以影响微滴体积和周期性或者微滴破碎到交叉通道中的速率或频率。此外,表面活性剂可以用于稳定氟化油中的水性乳液以免于聚并。在某些实施方式中,微滴可以被表面活性剂包围,该表面活性剂通过降低水油界面处的表面张力来稳定微滴。可以添加到载体流体的优选的表面活性剂包括,但不限于表面活性剂如基于脱水山梨醇的羧酸酯(例如,″span″表面活性剂,flukachemika),包括脱水山梨醇单月桂酸酯(span20)、脱水山梨醇单棕榈酸酯(span40)、脱水山梨醇单硬脂酸酯(span60)和脱水山梨醇单油酸酯span80),及全氟化聚醚(例如,dupontkrytox157fsl、fsm和/或fsh)。可以使用的非离子表面活性剂的其它非限制性实例包括聚氧乙烯化烷基酚类(例如,壬基-、p-十二烷基-和二壬基酚)、聚氧乙烯化直链醇、聚氧乙烯化聚氧丙烯二醇类、聚氧乙烯化硫醇类、长链羧酸酯类(例如,天然脂肪酸的甘油酯和聚甘油酯、丙二醇、山梨醇、聚氧乙烯化山梨醇酯、聚氧乙烯甘醇酯等)和烷醇胺类(例如,二乙醇胺-脂肪酸缩合物和异丙醇胺-脂肪酸缩合物)。图5显示了用于通过微流体系统建立单细胞测序文库的设备的示意图。在一些情况中,该装置提供体积驱动的流,其中随时间注射恒定的体积。流体通道中的压力是注射速率和通道尺寸的函数。在按照图5的方案的一个实施方式中,装置提供油/表面活性剂入口(60)、分析物入口(70)、过滤器(80)、mrna捕获微珠和裂解试剂入口(90)、如图5中所示的连接入口的载体流体通道、阻流体(100)、用于微滴夹止的收缩部(101)、混合器(110)和液滴的出口(120)。在一个实施方式中,本发明提供用于通过微流体系统建立单细胞测序文库的设备,包括:包含过滤器和载体流体通道的油-表面活性剂入口,其中所述载体流体通道还包含阻流体;包含过滤器和载体流体通道的分析物入口,其中所述载体流体通道还包含阻流体;包含过滤器和载体流体通道的mrna捕获微珠和裂解试剂入口,其中所述载体流体通道还包含阻流体;所述载体流体通道具有在其中以可调节的或预定的流率流动的载体流体;其中各所述载体流体通道在接合点处合并;和所述接合点连接于混合器,其包含液滴出口。图6显示了(a)单细胞rna-seq的微流体流方案。两个通道(一个承载细胞悬浮液和另一个承载独特地条码标记的mrna捕获珠、裂解缓冲液和文库制备试剂)在接合处相交且立即以一个细胞和一个珠/液滴的速率共包封在惰性载体油中。在各液滴中,使用珠的条码加标签的寡核苷酸作为cdna模板,各mrna用独特的细胞-特异性标识加标签。(b)小鼠和人细胞的混合物的drop-seq文库。各点代表独特的条码并指示可以与人(x轴)和小鼠(y轴)基因组比对的基因的数目。图7显示微滴中细胞转录组的分子条码标记。(a)drop-seq条码标记示意图。复杂组织解离成单个细胞,其然后与递送条码标记的引物的微粒(灰色圆)一起包封在微滴中。各细胞在微滴内裂解;其mrna与伴随微粒上的引物结合。mrna反转录成cdna,从而产生称为“附接于微粒的单细胞转录组”(stamp)的一组珠。条码标记的stamp然后可以在用于高通量mrna-seq的池中扩增以分析任何所需数目的单个细胞。(b)微粒上引物的序列。所有珠上的引物包含共同序列(“pcr柄(pcrhandle)”)以使得在stamp形成后的pcr扩增成为可能。各微粒包含超过108个共有相同的“细胞条码”但具有不同的独特分子标识(umi)的单个引物(图c),使得mrna转录物能够数字地计数(图d)。30bp寡聚dt序列存在于所有引物序列的末端用于通过其聚腺苷酸化3’末端捕获mrna。(c)细胞条码的分割-和-汇合合成。为产生细胞条码,微粒池重复地分割成四个均等大小的寡核苷酸合成反应(向其中添加四种dna碱基中的一种)中,和然后在各循环后汇合在一起,总共12个分割-汇合循环。任何单个珠上合成的条码反映该珠通过合成反应系列的独特路径。结果是微粒池,各微粒具有在引物的整个互补序列上412(16,777,216)种可能的序列之一。(d)独特分子标识(umi)的合成。在完成“分割-和-汇合”合成循环后,所有微粒一起经历八轮简并合成,在各循环过程中所有四种dna碱基可用,使得各单个引物接受48(65,536)个可能序列(umi)之一。图8显示了通过drop-seq的单细胞转录组的提取和加工。(a)使用drop-seq的单细胞mrna-seq文库制备的示意图。专门设计的微流体装置将两个水性流结合,之后将其划分成离散的微滴。一个流包含细胞,和另一个流包含悬浮在裂解缓冲液中的条码标记的引物珠。紧接在微滴形成后,细胞暴露于裂解试剂并释放其mrna,mrna随后与微粒表面上的引物杂交。微滴通过添加试剂以使油-水界面失稳而破碎(扩展实验过程)并收集和洗涤微粒。mrna然后大批量地反转录从而形成stamp,且模板转换用于在合成的cdna的下游引入pcr柄(zhu等,2001)。(b)用于drop-seq中的微流体装置。悬浮在裂解试剂中的珠(图像中棕色)从中央通道进入装置;细胞从顶部和底部进入。层流防止两个水性输入在微滴形成之前混合;这在图像中从沿两个流的界面的光折射来证明(也参见movies1)。(c)drop-seq测序文库的分子元件。第一阅读片段产生细胞条码和umi。第二个配对的阅读片段查询来自cdna的序列(通常测序50bp,尽管更长或更短的阅读片段也是可能的);这一序列然后与基因组比对以确定转录物的基因来源。细胞条码用于确定转录物的细胞来源。(d)数以千计的单细胞转录组的计算机重构。数百万的末端配对阅读片段通过高通量测序仪(例如,miseq、nextseq或hiseq)从drop-seq文库产生。阅读片段首先与基准基因组比对以鉴定cdna的基因来源。接着,阅读片段通过其细胞条码组织化,且单个umi对于各细胞中的各基因计数(扩展实验过程)。在最右侧显示的结果是“数字表达矩阵(digitalexpressionmatrix)”,其中各列对应于细胞,各行对应于基因,且各条目是从该细胞中该基因检测的转录物的整数。图9显示了使用物种混合实验的drop-seq的临界评估。(a,b)小鼠和人细胞的混合物的drop-seq分析。人(hek)和小鼠(3t3)细胞的混合物以所示的浓度通过drop-seq进行分析。散点图显示与各stamp相关的人和小鼠转录物的数目。蓝色点指示从这些数据指定为包含人-特异性转录物集(平均99%人转录物)的stamp;红色点指示推断为小鼠-特异性(平均99%)的stamp。在较低细胞浓度下,(570中的)一个stamp条码与人和小鼠转录物的混合物相关(图a,紫色)。在较高细胞浓度下,约1.9%的stamp条码与小鼠-人混合物相关(图b)。其它细胞浓度和不同单细胞分析平台的数据在图s2c和s2d中。(c,d)高阅读-深度(read-depth)下drop-seq的灵敏度分析。小提琴图显示对于54个hek(人)stamp(蓝色)和28个3t3(小鼠)stamp(绿色)的每细胞的检测的转录物(b,按照umi评分)和基因(c)的数量的分布,其被测序达到737,240高质量比对阅读片段/细胞的平均阅读深度。(e,f)drop-seq和非单细胞rna-seq方法中基因表达测量的相关性。drop-seq基因表达测量(在550个stamp上平均)与(e)通过与smart-seq2(picelli等,2013)类似的溶液中模板转换扩增(tsa)过程制备的mrna-seq文库和(f)illuminatru-seqmrna-seq中分析的总体rna的测量的比较(扩展实验过程)。所有比较涉及源自相同细胞培养瓶(3t3细胞)的rna。所有表达计数转换为每百万的平均转录物(atpm)并作为log(1+atpm)作图。(g)drop-seq捕获效率通过ercc加标(spike-ins)的定量。drop-seq用以100,000erccrna分子/微滴的估计浓度掺入的ercc对照合成rna进行。84个stamp以与ercc基准序列对齐的240万阅读片段的平均深度进行测序,且在针对潜在测序误差应用严格的下校正(down-correction)后,umi对于各ercc种类进行计数(扩展实验过程)。对于以至少一个分子/微滴存在的各erccrna种类,预测的分子数/微滴以对数尺度(x-轴)相对于也是对数尺度的通过drop-seq检测的实际分子数/微滴(y-轴)作图。限制为具有斜率1并与七个最高点拟合的回归线的截距用于估计变换因数(0.128)。使用平均的检测转录物数除以使用的ercc分子数(100,000)的第二估值产生0.125的变换因数。图10显示通过drop-seq分析的hek和3t3细胞的细胞-周期分析。(a)通过drop-seq测量的589个hek细胞(左)和412个3t3细胞(右)的细胞-周期状态。通过各细胞的全局基因表达谱与已知在周期的五个期(水平行)之一中富集的基因集比较对细胞通过细胞周期的进展进行评价。对于各细胞在这五个期的各期计算阶段特异性的评分(扩展实验过程),且细胞按照其期评分排序。(b)细胞周期调控基因的发现。热图显示在drop-seq-测序细胞中据发现按照细胞周期调控的544个人和668个小鼠基因的平均正常化表达的。为发现细胞周期调控的基因,最大和最小表达对于各基因在整个排序细胞的滑动窗口(slidingwindow)上计算,并与混杂细胞(shuffledcells)比较以获得错误发现率(fdr)(实验过程)。作图的基因(5%的fdr阈值)然后通过k-均值分析进行聚类以鉴定具有相似表达谱的基因集。簇边界通过灰色断线表示。(c)通过drop-seq发现的代表性的细胞周期调控基因。在hek和3t3细胞集两者中选择的基因被发现是细胞周期调控的。左,公知为细胞周期调控的所选择基因。右侧是在这一分析中鉴定的先前未知为与细胞周期相关的一些基因(实验过程)。细胞周期调控基因的完整列表可以在表4中发现。图11显示从通过drop-seq制备的44,808个单细胞转录谱的视网膜细胞类型的从头重构。(a)视网膜中主要细胞类别的示意性图示。光感受器(视杆或视锥)检测光并将信息传递到双极细胞,其随之接触视网膜神经节细胞(其将轴突延伸到其它cns组织中)。无长突细胞和水平细胞是视网膜中间神经元;米勒神经胶质细胞起到用于周围神经元的支持细胞的作用。(b)44,808个drop-seq单细胞表达谱聚类成39个视网膜细胞群体。该图形显示44,808个细胞之间全局基因表达关系的二维表示;簇按照细胞类别着色(根据图11a着色)。(c)39个视网膜细胞群体中差异表达的基因。在这一热图中,行对应于发现为在单个簇中选择性地上调的单个基因(p<0.01,bonferroni校正的);列是按照簇(1-39)排序的单个细胞。>1,000个细胞的簇下采样到1,000细胞以防止它们主导图形。(d)39个推断的细胞群体之间的基因表达相似性关系。所有检测的基因中的平均基因表达对于39个细胞簇的各细胞簇中的细胞计算,且39个簇的基因-表达谱之间的相对(euclidean)距离通过系统树图表示。(系统树图表示全局基因表达相似性关系;其不代表发育谱系(developmentallineage)。)系统树图的分支通过检验对于视网膜细胞类别和类型的已知标志物的差异表达来注释。十二个实例显示在右侧,使用小提琴图以代表簇内的表达分布。用于另外的基因的小提琴图在图s6中。(e)各细胞群体中重复实验的图示。来自图8b的tsne图,各细胞现在按照重复实验着色。7个重复各自有助于所有39个细胞群体。其中这些重复非均匀地表示的簇36(箭头)表达非视网膜原有的和假定为解剖伪影(dissectionartifact)的成纤维细胞的标志物。(f)无长突神经聚类随分析的细胞数变化的轨迹。产生三个不同的下采样数据集:(1)500,(2)2,000或(3)9,451个细胞(扩展实验过程)。在完全分析中鉴定为无长突细胞(簇3-23)的细胞在此按照其在该分析中的其簇身份着色。较小数目的细胞的分析不完全彼此区分这些亚群。图12.无长突细胞、视锥细胞和视网膜神经节细胞之间的精密尺度表达差别。(a)泛-无长突细胞标志物。鉴定的六个基因(nrxn2,atp1b1,pax6,slc32a1,slc6a1,elavl3)的表达水平表示为所有39个簇上的点图;较大的点指示簇内的较宽表达;较深的红色表示较高表达水平。(b)簇间已知无长突细胞类型的鉴定。二十一个无长突细胞簇由十二个gaba能、五个甘氨酸能、一个谷氨酸能和三个非-gaba能非-甘氨酸能簇组成。星爆无长突细胞在簇3中通过其chat的表达鉴定;兴奋性无长突细胞通过slc17a8的表达鉴定;a-ii无长突细胞在簇16中通过其gjd2的表达鉴定;和seg无长突神经元在簇17和20中通过其ebf3的表达鉴定。(c)无长突细胞亚群的新型候选标志物的提名。各簇筛选在该簇中相对于所有其它无长突细胞簇差异表达的基因(p<0.01,bonferroni校正的)(mcdavid等,2013),并对于具有最高相对富集的那些进行过滤。各簇的单一候选标志物的表达在所有视网膜细胞簇上显示(簇中所有差异表达的基因可以在表6中发现;所有簇对之间差异表达的基因可以在表7中发现)。(d)maf作为gaba能无长突细胞群体的标志物的验证。来自野生型小鼠的固定的成熟视网膜对于maf(图i、ii、v,且在图iv和vii中绿色染色)、gad1(图iii和iv,红色染色)和slc6a9(图vi和vii,红色染色;maf染色显示为绿色)的染色,表明maf与gad1的共定位,但maf不与slc6a9共定位。(e)簇7(maf+)与最接近的相邻无长突细胞簇(#6)的差异表达。平均基因表达在簇6和7中的细胞之间比较;十六个基因(红色点)在簇7中鉴定为具有>2.8-倍的富集(p<10-9)。(f)ppp1r17作为无长突细胞亚群的标志物的验证。来自mito-p小鼠的固定的成熟视网膜(其在ngng无长突细胞和1型双极细胞中表达cfp)的染色(kay等,2011)。星号(*)表示在mito-p系中标记的双极细胞,而箭头指示ngng无长突神经元细胞,其按照mito-p转基因系(红色)和ppp1r17抗体(绿色)两者标记。85%的cfp+细胞是ppplrl7+;50%的ppp1r17+是cfp-,表明表达这一标志物的第二种无长突细胞类型。(g)簇20(ppp1r17+)与最接近的相邻无长突细胞簇(#21)的差异表达。平均基因表达在簇20和21中的细胞之间比较;十二个基因(红色点)在簇7中鉴定为具有>2.8-倍的富集(p<10-9)。(h)m-视蛋白和s-视蛋白视锥细胞的差异表达。簇25中的细胞鉴定为视锥光感受器,其表达m-视蛋白(用于检测绿光)和/或s-视蛋白(用于检测蓝光)。平均基因表达在仅表达m-视蛋白的细胞(x-轴)和仅表达s-视蛋白的细胞(y-轴)之间比较。显示高于2倍的表达差异的八个基因(p<10-9)在图上与两个视蛋白基因opnlsw和opn1mw一起标记。绿色点是在m-视锥细胞中富集的基因,而红色点是在s-视锥细胞中富集的基因。(i)黑视蛋白-阳性和阴性rgc的差异表达。在簇2中鉴定表达opn4(编码黑视蛋白的基因)的24个视网膜神经节细胞,且平均表达在这些细胞和簇2的其余部分之间比较。七个基因鉴定为差异表达的(红色点,>2-fold,p<10-9)。图13a-c显示从通过drop-seq制备的471个单细胞转录谱从头重构人骨髓细胞类型。(a)单细胞表达谱聚类成8个细胞类别。图形显示细胞之间全局基因表达关系的二维表示(tsne);簇按照细胞类别着色和标记。(b)8个细胞类别中差异表达的基因的热图。行对应于单个标志物基因;列是按照簇(1-8)排序的单个细胞。(c)标志物基因表达(红色是高)的实例显示在tsne图上。图14a-c显示对微粒(珠)表面上条码标记引物的性质的评价。(a)多重实验中单个珠条码的鉴别。合成的聚腺苷酸化rna反转录到条码标记的引物珠的表面上。这些珠中的十一个然后人工选择并用作构建测序文库的模板(扩展实验过程)。文库在miseq上测序,且收集和计数细胞条码序列。在测序阅读片段中的条码位置处携带第十一和第十二高丰度的12mer的阅读片段的数目之间观察到明确的差别,证明来自各珠的细胞条码可以通过其在测序实验的结果中的高表现来识别。(b)12bp细胞条码的碱基组成分析。评价了在另一测序实验中确定的1,000个细胞条码的序列的总体核苷酸和二核苷酸组成。红色断线代表缺乏任何序列偏向的完全随机条码集的值。(c)12bp细胞条码的计算截断。(b)中的1,000个细胞条码序列从3’末端修整,且保留的独特条码的数量在各修整碱基数下计算(蓝线)。各修整数下的独特条码的数量与随机产生的1,000个12-mer的集合(绿线)比较。图15a-e显示drop-seq文库制备中的装置设计和对单细胞杂质的技术贡献的剖析。(a)微流体共流装置设计。三个入口-用于油、细胞悬浮液和微粒-汇聚并产生由来自细胞悬浮液和微粒通道的等体积供给构成的水性微滴。弯曲的、隆突的出口改善微滴的混合以促进释放的rna杂交到珠上。装置的cad文件可以在datafile1中发现。(b)扩增珠的池中stamp的鉴定。drop-seq涉及通过稀释细胞到微滴中的泊松限制浓度而产生单细胞分布;因此,绝大部分的扩增珠(90-99%)未暴露于细胞的rna,仅暴露于环境rna。为鉴定对应于stamp的细胞条码,来自图3a中显示的实验的细胞条码按大小(阅读片段的数目)的降序排列,且对阅读片段的累积分数作图。拐点(570处的垂直断线)观察到非常接近于通过泊松统计对于计数的和等分的珠数量(~500)预测的细胞数。这一拐点的确认通过对单个stamp的种类特异性作图且观察该拐点处特异性的急剧下降而观察到,表明从从采样细胞rna的珠到采样环境rna的珠的转变。(c)fluidigmc1上的人-小鼠实验。人(hek)和小鼠(3t3)细胞以相等浓度混合并按照制造商的说明在两个fluidigmc1芯片上运行。阅读片段以与drop-seq完全相同的分析管道与联合的人-小鼠基准比对。56个混合有机体文库从182个鉴别出来,对细胞-细胞二联体设置31%的下界。十二个c1端口通过显微镜鉴定为具有>1个细胞,其中五个按照测序是混合种类。(d)drop-seq文库纯度的浓度相关性。stamp使用四个不同浓度的人(hek)和小鼠(3t3)细胞的混合物制备(对于100细胞/μl、50细胞/μl、25细胞/μl和12.5细胞/μl分别为n=1150、690、595和560个stamp)。细胞二联体率通过将混合种类stamp的数目乘以2来计算;单细胞纯度通过将平均人-细胞和平均小鼠-细胞纯度相加来计算。(e)单细胞杂质分析。drop-seq文库从在dropseq文库制备的三个不同阶段汇合的人和小鼠细胞的组合制备。在第一种情况中,人和小鼠细胞在微滴形成之前混合在一起(红色小提琴图,“细胞混合物”)。在第二种情况中,人和小鼠细胞单独地包封在微滴中,其然后混合,之后将其破碎和对混合物进行后续分析(蓝色,“微滴混合物”)。在第三种情况中,人和小鼠细胞单独地包封在微滴中,其在单独的反应中破碎和然后反转录以形成共价stamp的独立池,其在pcr扩增之前混合(绿色,“pcr混合物”)。来自各有机体的二十个最大stamp对于三种情况中的每一种进行选择,下采样到相同的阅读深度,且有机体纯度表示为小提琴图。黑色点是各分布中的四十个stamp的平均有机体纯度。使用的细胞混合物在微滴中稀释到50细胞/μl的最终浓度。从这些数据,申请人估计(在这一细胞浓度下)细胞悬浮液构成杂质的48%,微滴破碎后的rna转移构成40%,和pcr假象构成12%。图16a-f显示随测序覆盖率变化的特异性和灵敏度,通过对以50细胞/μl的浓度制备的低深度和高深度物种混合(hek/293t)drop-seq文库下采样来评估。(a,b)特异性分析。以较低阅读-深度(图a,589个人-特异性的和412个小鼠-特异性的stamp)或高阅读-深度(图b,54个人特异性的和28个小鼠特异性的)测序的人-特异性stamp和小鼠-特异性stamp的物种特异性的下采样分析。(c-f)灵敏度的分析。对于低阅读-深度drop-seq运行(c和e)和高-深度阅读测序(d和f)按照平均检测基因数(c和d)和平均检测转录物数(e和f)的单细胞文库灵敏度的下采样分析。图17a-f显示drop-seq表达偏向和捕获效率的估计。(a)drop-seq和溶液中模板转换扩增(tsa)中平均基因表达之间的gc含量偏向。来自550个3t3stamp的文库的低gc含量基因(<0.4平均含量,红色点)和使用源自drop-seq中使用的相同细胞培养瓶的rna通过类似于smart-seq2(picelli等,2013)的溶液中模板转换扩增(tsa)过程(扩展实验过程)制备的mrna-seq文库中平均基因表达的比较。(b)drop-seq和标准mrna-seq中的平均基因表达之间的gc含量偏向。来自550个3t3stamp的文库的低gc含量基因(<0.4平均含量,红色点)和使用源自drop-seq中使用的相同细胞培养瓶的rna通过标准方法(扩展实验过程)制备的mrna-seq文库中平均基因表达的比较。(c)drop-seq和标准mrna-seq中的平均基因表达之间的长度偏差。来自550个3t3stamp的文库的长转录物(>5000平均转录物长度,红色点)和使用源自drop-seq中使用的相同细胞培养瓶的rna通过标准方法(扩展实验过程)制备的mrna-seq文库中平均基因表达的比较。此处观察到的偏向未在drop-seq和溶液中tsa(数据未显示)的比较中发现,表明这一偏向很可能是模板抑制pcr(其优先扩增较长片段)的结果(zhu等,2001)。(d)ddpcr的灵敏度估计。rna从50,000个hek细胞的培养物分离,且十个基因(actb、b2m、ccnb1、gapdh、eef2、eno1、psmb4、top2a、ybx3和ywhah)的水平使用rt-ddpcr在这一本体溶液中数字定量。这些转录物计数然后与通过drop-seq计数的每细胞的独特转录物平均数比较。误差棒显示单个ddpcr测量(水平条,n=3个重复)或stamp上(垂直条,n=54)的标准误,基于这十个基因表达测量的平均值,申请人估计dropseq捕获大约10.7%的细胞mrna。(e)条码标记的引物珠的捕获效率。drop-seq中使用的相同的条码标记的引物珠在溶液中与20ng/μl的浓度的纯化的人脑rna杂交(扩展实验过程)。珠然后离心和洗涤三次,且结合的rna通过在水的存在下加热珠来洗脱。两个mrna转录物gapdh和actb的浓度在五个步骤的每一个中测量。误差棒,平均值的标准误。(f)条码标记的珠引物结合饱和的评估。使用三种不同的输入rna浓度:20ng/μl、50ng/μl和100ng/μl进行(e)中描述的相同过程。从珠洗脱的输入rna的分数随输入rna浓度线性缩放,表明与珠的杂交未受到mrna结合位点的饱和的限制。图18显示分析中使用的44,808个视网膜细胞stamp的主成分1-32的图。(a)44,808个stamp的未着色pca图;(b)(a)中相同的pca图,但各细胞使用图11b中的颜色按照其最终簇身份着色。图19阐明了显示通过非监督的单细胞基因表达分析产生的39个视网膜细胞簇中所选择标志物基因的表达的小提琴图。图20显示源自由构成完全44,808-细胞数据集的七个重复(在不同的四天制备(扩展实验过程))之一的细胞构成的各簇的分数。各重复的分数表示为堆叠的条形图。重复1-6以drop-seq的“积极模式”制备(~90%单细胞,~90%纯度);重复7以“纯模式”制备(>99%单细胞,98.6%纯度)。星形指定两者失衡的簇,#36,对应于由于不完美的视网膜解剖导致的污染成纤维细胞。图21显示drop-seq设备的示意性图示。分别加载油、细胞和珠的三个注射泵通过柔性管道连接于图s2a中的pdms装置。该装置静置于倒置显微镜的载台上以使得微滴产生可以实时监测。管道将出口通道连接于用于收集微滴的50ml锥形管。在某些实施方式中,可以导致载体流体流过出口通道,从而载体流体中的表面活性剂涂覆通道壁。在一个实施方式中,含氟表面活性剂可以通过使全氟化聚醚dupontkrytox157fsl、fsm或fsh与氢氧化铵水溶液在挥发性氟化溶剂中反应来制备。溶剂及残留的水和氨可以用旋转蒸发器除去。表面活性剂然后可以溶解(例如,2.5wt%)在氟化油(例如,flourinert(3m))中,其随后用作载体流体。现在描述样品流体库1012的激活以产生试剂(regent)微滴1006。本公开的发明是基于通过按需功能的动态试剂递送的概念(例如,组合条码标记)。按需特征可以通过用于释放递送微滴到原始微滴的多种技术能力之一提供,如本文中所述的。这一装置开发中的一个方面是确定流速、通道长度和通道几何形状。一旦这些设计规格确定,包含随机或指定的试剂组合的微滴可以按需产生和与包含样品/细胞/目标基质的“反应室”微滴合并。通过将多个独特标签并入另外的微滴中并将标签结合到设计为对于原始微滴特异性的固体载体上,原始微滴所暴露的条件可以被编码和记录。例如,核酸标签可以顺序地连接以产生反映条件和条件的顺序的序列。或者,标签可以独立地添加而附接于固体载体。可以用于生物信息学地记录信息的动态标记系统的非限制性实例可以在2012年9月21日和2012年11月29日提交的名称为“compositionsandmethodforuniquelylabelingofagents”的美国临时专利申请中找到。以这种方式,两个或更多个微滴可以暴露于多种不同的条件,其中每次微滴暴露于某一条件,编码该条件的核酸各自连接在一起添加到微滴或添加到与微滴相关的独特固体载体,使得即使具有不同历史的微滴随后组合,各微滴的条件通过不同核酸保持为可得的。评估对暴露于多种条件的反应的方法的非限制性实例可以在2012年9月21日提交的名称为“systemandmethodfordroplettagging”的美国临时专利申请中找到。本公开的装置的应用可以包括用于动态产生分子条码(例如,dna寡核苷酸、荧光团(flurophores)等),其与各种目标化合物(药物、小分子、sirna、crispr指导rna、试剂等)的受控递送无关或与之协同。例如,独特分子条码可以在一个喷嘴阵列中产生,而单个化合物或化合物组合可以通过另一喷嘴阵列产生。条码/目标化合物然后可以与含细胞微滴合并。保持计算机日志文件形式的电子记录以将递送的条码与递送的下游试剂相关联。这一方法使得可能对于如单细胞药物筛选、调控途径的受控扰动等的应用有效地筛选大的细胞群体。所公开的发明的装置和技术有助于以经济的方式进行需要单细胞(或单分子)水平的数据解析的研究的努力。公开的实施方式通过使用在微流体芯片中作为油包水乳液逐一产生的单分散水性微滴提供了将试剂递送至单个乳液微滴的高通量和高分辨率递送,该乳液微滴可以包含细胞、核酸、蛋白质等。因此,本发明通过能够在生存期实验过程中动态跟踪单个细胞和微滴处理/组合证明了优于现有技术系统的优势。所公开的发明的另外的优势提供了按需产生乳液微滴的文库的能力,及进一步具有通过所公开的方法操作微滴的能力。公开的实施方式从而可以提供微滴的动态跟踪和产生在基于单细胞的环境中微滴部署和应用的历史。微滴的产生和部署按照本发明的所公开实施方式通过动态索引策略且以受控的方式产生。本文描述的微流体装置的所公开实施方式提供了以每秒几千微滴的高效的速率加工、分析和分选的微滴的能力,从而提供允许在疾病的生物学机制的细胞模型中或者在生物化学或药理学分析中快速筛选数百万不同的化合物、生物探针、蛋白质或细胞的有力平台。多种生物学分析以及生物学合成设想用于本发明。在有利的实施方式中,设想了聚合酶链反应(pcr)(参见,例如,美国专利公开no.20120219947)。本发明的方法可以用于合并样品流体以进行任何类型的化学反应或任何类型的生物学分析。在某些实施方式中,本发明的方法用于合并样品流体以在微滴中进行扩增反应。扩增是指产生核酸序列的另外的拷贝且一般使用聚合酶链反应或本领域中公知的其它技术(例如,dieffenbach和dveksler,pcrprimers,alaboratorymanual,coldspringharborpress,plainview,n.y.[1995])完成。扩增反应可以是本领域中已知扩增核酸分子的任何扩增反应,如聚合酶链反应、嵌套聚合酶链反应、聚合酶链反应-单链构象多态性、连接酶链反应(baranyf.(1991)pnas88:189-193;baranyf.(1991)pcrmethodsandapplications1∶5-16)、连接酶检测反应(baranyf.(1991)pnas88:189-193)、链置换扩增和限制性片段长度多态性、转录依赖的扩增系统、依赖核酸序列的扩增、滚环扩增和超分支滚环扩增。在某些实施方式中,扩增反应是聚合酶链反应。聚合酶链反应(pcr)是指用于在没有克隆或纯化的情况下提高基因组dna的混合物中靶序列的片段的浓度的由k.b.mullis(美国专利号4,683,195和4,683,202,通过引用合并于此)提出的方法。用于扩增靶序列的方法包括向包含所需的靶序列的dna混合物引入过量的寡核苷酸引物,接着在dna聚合酶的存在下进行精确顺序的热循环。引物与双链靶序列的其相应链互补。为实现扩增,引物与靶分子内的其互补序列退火。在退火后,引物用聚合酶延伸以形成新的互补链对。变性、引物退火和聚合酶延伸的步骤可以重复许多次(即,变性、退火和延伸构成一个循环;可以存在许多的循环)以获得高浓度的所需靶序列的扩增片段。所需靶序列的扩增片段的长度通过引物相对于彼此的相对位置确定,且因此,这一长度是可控的参数。用于在微滴中进行pcr的方法显示于例如link等(美国专利申请号2008/0014589、2008/0003142和2010/0137163)、anderson等(美国专利号7,041,481且作为re41,780再授权)和raindancetechnologiesinc.的欧洲公开号ep2047910中,其各自的内容通过引用全文并入本文中。第一样品流体包含核酸模板。第一样品流体的微滴如上所述形成。那些微滴包括核酸模板。在某些实施方式中,微滴仅包括单一核酸模板,且因此可以进行数字pcr。第二样品流体包含用于pcr反应的试剂。这些试剂一般包括taq聚合酶、a、c、g和t型的脱氧核糖核苷酸、氯化镁及正向和反向引物,其全部悬浮于水性缓冲液中。第二流体还包括用于检测扩增的靶核酸的可检测地标记的探针。其细节在下面讨论。两个样品流体之间试剂的这种类型的分配不是唯一的可能性。在某些实施方式中,第一样品流体包括一些或所有pcr所需的试剂,而第二样品流体包含pcr所需的其余试剂以及检测探针。引物可以通过多种方法制备,包括但不限于适宜序列的克隆和使用本领域中公知的方法的直接化学合成(narang等,methodenzymol.,68:90(1979);brown等,methodenzymol.,68:109(1979))。引物也可以从商业来源获得,如operontechnologies、amershampharmaciabiotech、sigma和lifetechnologies。引物可以具有相同的解链温度。引物的长度可以在5′末端或3′末端延长或缩短以产生具有所需解链温度的引物。另外,各引物对的退火位置可以设计为使得序列及引物对的长度产生所需的解链温度。用于确定小于25个碱基对的引物的解链温度的最简单公式是wallace规则(td=2(a+t)+4(g+c))。计算机程序也可以用于设计引物,包括但不限于arraydesignersoftware(arrayitinc.)、用于遗传分析的寡核苷酸探针序列设计软件(olympusopticalco.)、netprime和来自hitachisoftwareengineering的dnasis。各引物的tm(解链或退火温度)使用软件程序如oligodesign(可从invitrogencorp.获得)计算。包含核酸的微滴然后按照如上所述的本发明方法使得与第二流体中的pcr试剂合并,从而产生包括taq聚合酶、a、c、g和t型的脱氧核糖核苷酸、氯化镁、正向和反向引物、可检测地标记的探针及靶核酸的微滴。一旦混合的微滴产生,微滴被热循环,导致各微滴中靶核酸的扩增。在某些实施方式中,微滴流过在加热和冷却管线之间蛇形路径中的通道以扩增微滴中的核酸。通道的宽度和深度可以调节以设置在各温度下的停留时间,其可以被控制为在少于一秒至数分钟之间的任何时间。在某些实施方式中,三个温度区用于扩增反应。三个温度区被控制为导致双链核酸的变性(高温区)、引物的退火(低温区)和单链核酸的扩增以产生双链核酸(中温区)。这些区内的温度落入本领域中公知用于进行pcr反应的范围内。参见例如,sambrook等(molecularcloning,alaboratorymanual,3rdedition,coldspringharborlaboratorypress,coldspringharbor,n.y.,2001)。在某些实施方式中,三个温度区被控制为具有如下的温度:95℃(th)、55℃(tl)、72℃(tm)。制备的样品微滴以受控的速率流过通道。样品微滴首先在热循环前通过初始变性区(th)。初始预热是扩展的区以确保样品微滴内的核酸在热循环之前成功变性。对于预热区的需求和所需的变性时间长度依赖于反应中所用的化学过程。样品进入大约95℃的高温区,其中样品首先在称为变性的过程中分离成单链dna。样品然后流到大约55℃的低温区,在其中发生杂交过程,在此期间引物与样品的互补序列退火。最后,随着样品流过大约72℃的第三中温区,聚合酶处理在引物利用热稳定的酶沿dna的单链延伸时发生。在微滴随着流过通道而经过各热循环时,核酸经历相同的热循环和化学反应。装置中循环的总数容易通过热区的扩展而改变。在样品经过完整热装置的n个扩增循环时,样品经历相同的热循环和化学反应。在其它实施方式中,温度区被控制为实现用于pcr反应的两个单独温度区。在某些实施方式中,两个温度区被控制为具有如下的温度:95℃(th)和60℃(tl)。样品微滴任选地流过初始预热区,之后进入热循环。预热区对于激活一些化学作用及也对于确保微滴中的双链核酸在热循环反应开始之前完全变性可能是重要的。在示例性的实施方式中,预热停留长度导致在较高温度下微滴大约10分钟的预热。样品微滴持续进入大约95℃的高温度区,在其中样品首先在称为变性的过程中分离成单链dna。样品然后经过装置流到大约60℃的低温区,在其中发生杂交过程,在此期间引物与样品的互补序列退火。最后,聚合酶处理在引物利用热稳定的酶沿dna的单链延伸时发生。在样品经过完整装置的各个热循环时,样品经历相同的热循环和化学反应。装置中循环的总数容易通过模块长度和管道的延伸而改变。在扩增后,微滴可以流到检测模块用于检测扩增产物。微滴可以使用本领域中已知的任何方法单独地分析和检测,如检测报告体的存在或量。一般地,检测模块与一个或多个检测设备通讯。检测设备可以是光学或电学检测器或者其组合。合适的检测设备的实例包括光波导、显微镜、二极管、光刺激装置(例如,激光器)、光电倍增管和处理器(例如,计算机和软件)及其组合,它们配合以检测代表特征、标志物或报告体的信号及确定和指导测量或分选模块处的分选动作。检测微滴中的扩增产物的检测模块和方法的进一步描述在link等(美国专利申请号2008/0014589、2008/0003142和2010/0137163)及raindancetechnologiesinc.的欧洲公开号ep2047910中显示。在另一实施方式中,分析方法的实例是elisa分析(参见,例如,美国专利公开no.20100022414)。本发明提供另一种乳液文库,其可以在不混溶氟碳油(其可以包含至少一种含氟表面活性剂)中包含多个水性微滴,其中各微滴大小均一且可以包含至少第一抗体及与至少第二抗体连接的单一元件,其中所述第一抗体和第二抗体不同。在一个实例中,各文库元件可以包含不同的珠,其中各珠附接于多个抗体且珠包封在包含溶液中的不同抗体的微滴内。这些抗体然后可以允许形成″elisa三明治″,其可被洗涤和制备用于elisa分析。此外,微滴的这些内容物可以改变为对于其中包含的抗体是特异性的以最大化该分析的结果。在另一实施方式中,单细胞分析也设想为本发明的部分(参见,例如,ryan等,biomicrofluidics5,021501(2011)关于微流体技术应用于分析单个细胞的综述)。当单个细胞与其环境的相互作用可以精确地控制或可以与所检验的功能或性质分离时,单细胞分析可以设想为定量单个细胞的功能或性质的实验。单细胞分析的研究和开发大部分是在遗传变异引起疾病且小的细胞亚群代表疾病的起源的概念上预测的。分析从细胞分泌的化合物、亚细胞成分、细胞-细胞或细胞-药物相互作用的方法以及对单个细胞进行谱型分析的方法也设想在本发明内。在其它实施方式中,化学原型和合成化学反应也设想在本发明的方法内。虽然本发明及其优势已经详细描述,但应当理解各种变化、置换和改变可以在本发明中进行而不脱离如所附权利要求中限定的本发明的精神和范围。本发明进一步在以下实施例中阐明,其仅为说明的目的给出,而不是旨在以任何方式限制本发明。实施例实施例1在这一实验方案中,合成独特地条码标记的珠以用作用于反转录的引物。珠首先以具有在表面上合成的固定的序列(图2a中的smta)开始,其用作下游pcr的引发位点。接下来,珠被分割和汇合到四个等同反应容器中总共12次,以产生对于各珠独特的4^12个独特的条码序列(图2b)。这一12bp区域用作细胞条码,因为其对于各珠是特异性的。接下来,珠全部汇合在一起用于使用所有四种碱基的8轮简并合成;这一8bp区域是“分子条码”且将独特地对各mrna加标签,使得细胞中的各mrna分子可以数字地计数。最后,合成30dt碱基,其用作mrna的聚腺苷酸化尾的捕获区域(在文献中经常地称为“寡聚dt”)。独特地条码标记的珠的合成toyopearlhw-65s树脂购自tosohbiosciences,inc。表面羟基与peg衍生物反应以产生18-碳长的柔性链连接体。衍生化的珠然后用作在expedite8909dna/rna合成仪上使用10μmol循环规模和3分钟的耦合时间的dna合成的反向5′->3′亚磷酰胺合成的固体载体。使用的酰胺化物(amidite)是:n6-苯甲酰基-3′-o-dmt-2′-脱氧腺苷-5′-氰乙基-n,n-二异丙基-亚磷酰胺(da-n-bz);n4-乙酰基-3′-o-dmt-2′-脱氧-胞苷-5′-氰乙基-n,n-二异丙基-亚磷酰胺(dc-n-ac);n2-dmf-3′-o-dmt-2′-脱氧鸟苷-5′-氰乙基-n,n-二异丙基亚磷酰胺(dg-n-dmf);3′-o-dmt-2′-脱氧胸苷-5′-氰乙基-n,n-二异丙基亚磷酰胺和3′-o-dmt-2′-脱氧尿苷-5′-氰乙基-n,n-二异丙基亚磷酰胺。乙酸酐和n-甲基咪唑用于加帽步骤中;乙基硫代四唑用于激活步骤中;碘用于氧化步骤中;和二氯乙酸用于去封闭步骤(deblockingstep)中。珠表面上产生的寡核苷酸序列显示于图2a中。合成了用作pcr柄的恒定序列(图中的“smta”)。然后,进行12个循环的汇合-和-分割亚磷酰胺合成(图2a中的细胞条码或“cbc”)。在这些循环过程中,珠从合成柱除去,汇合并按质量等分成四个相等部分;这些珠等份然后置于单独的合成柱中并与dg、dc、dt或da亚磷酰胺反应。这一过程重复12次以得到总共4^12=16,777,216个独特的条码序列(图2b)。在完成这些循环时,在所有珠上进行8个循环的简并寡核苷酸合成(图2a中的分子条码“mbc”),接着30个循环的dt添加。珠的表征1)对于聚腺苷酸化rna的珠结合能力的测定。饱和量(100pmol/20,000珠)的聚腺苷酸化合成rna在2xssc中与条码珠退火5min。珠然后用200ul的1xte+0.01%tween洗涤3x,并重悬在10ul的te中。珠然后在65c下加热5min且1ul的上清液在nanodropspectrophotometer上260nm下定量。2)细胞条码序列的质量和同质性的测定。合成的rna以0.2um的浓度流入125μl微流体共流微滴产生装置中。其它流包含2x反转录混合物。微滴在42℃下孵育30分钟,然后破碎。11个珠挑取到pcr管并用17个循环的pcr扩增。扩增子产物在bioanalyzer2100上纯化和定量,然后在miseq上测序。提取细胞条码序列并以编辑距离1折叠(collapse)以获得图3b。3)细胞条码复杂性的测定。分析1000个细胞条码序列的碱基组成(图2c)、二核苷酸组成(图2d),并从3′末端连续地修剪和检查重复序列(图2e)。在所有三个分析中,经验的细胞条码显示仅略低于给定长度的复杂性的理论限度(4^12个独特序列)的复杂性。dropseq方案1.用于制备细胞和用于加工的珠的试剂:裂解缓冲液(每ml):680μlh2o120μl50%ficoll10μl20%sarkosyl40μledta100μl2mtrisph7.550μl1mdtt(在结束时添加)pbs-bsa:995μl冷1xpbs5μlnebbsa(20mg/ml)制备油和装置:将油加载到10ml注射器中。固定针(27g1/2)和管道(pe-2),通过管道推送油到末端,和加载到泵中。将管道末端置于清洁装置的最左侧通道中(参见图6,装置上的所有特征是125μm深)。细胞培养物购买人293t细胞以及鼠nih/3t3细胞。293t和3t3细胞在补充有10%fbs和1%青霉素-链霉素的dmem中生长。细胞生长到30-60%的汇合并用tryple处理5min,用相等体积的生长培养基淬灭,并以300xg离心5min。移除上清液,且细胞悬浮在1ml的1xpbs+0.2%bsa中并以300xg再离心3min。上清液再次移除,且细胞重悬浮在1ml的1xpbs中,经过40-微米细胞筛,并计数。对于drop-seq,细胞在1xpbs+200μg/mlbsa中稀释到最终浓度。全视网膜悬浮液的产生单细胞悬浮液通过采用先前描述的用于从大鼠视网膜纯化视网膜神经节细胞的方法从p14小鼠视网膜制备(barres等,1988)。简言之,小鼠视网膜在木瓜蛋白酶溶液(40u木瓜蛋白酶/10mldpbs)中消化45分钟。木瓜蛋白酶然后在胰蛋白酶抑制剂溶液(dpbs中的0.15%卵类粘蛋白)中中和且组织磨碎以产生单细胞悬浮液。在磨碎后,细胞成团和重悬且细胞悬浮液通过20μmnitex筛网过滤器过滤以消除任何结块的细胞,并且这一悬浮液然后用于drop-seq。细胞然后在dpbs+0.2%bsa中稀释到200细胞/μl(重复1-6)或30细胞/μl(重复7)。视网膜悬浮液在分开的四天通过drop-seq处理。一个文库在第1天制备(重复1);两个文库在第2天制备(重复2和3);三个文库在第3天制备(重复4-6);和一个文库在第4天制备(重复7,高纯度)。对于重复4-6,人hek细胞以1细胞/μl(0.5%)的浓度加标,但视网膜数据中宽范围的细胞大小使得不可能使用跨物种比较方法校准单细胞纯度或二联体。七个重复中的每一个单独地测序。珠的制备珠(条码标记的珠seqa或条码标记的珠seqb)用30ml的100%etoh洗涤两次和用30ml的te/tw(10mmtrisph8.0,1mmedta,0.01%tween)洗涤两次。珠球粒重悬在10mlte/tw中并通过100μm过滤器进入50mlfalcon管中用于在4℃下长期储存。珠的物料浓度(以珠/μl计)使用fuchs-rosenthal细胞计数器评估。对于drop-seq,等份的珠从物料管移除,在500μl的drop-seq裂解缓冲液(dlb,200mmtrisph7.5,6%ficollpm-400,0.2%sarkosyl,20mmedta)中洗涤,然后重悬在适宜体积的dlb+50mmdtt中达到100珠/μl的珠浓度。在微流体装置上的细胞裂解和mrna与珠的杂交。1)包含表面活性剂的油;2)悬浮在水性溶液(如pbs)中的细胞;和3)悬浮在裂解试剂(即,清洁剂)中的条码标记的珠。细胞和珠同时流入装置中,它们在此处联合和形成微滴。一旦在微滴内,细胞裂解,rna释放,并通过杂交捕获到条码标记的珠的表面上。注射泵:对于油为14,000μl/hr;对于珠和细胞各为4,100μl/hr;收集微滴在50mlfalcon管中;使用1falcon管/1500μl水性溶液(750μl的各流)。3.rna-杂交的珠装置后处理成cdna如下孵育和旋转:rt,30分钟42℃,90分钟洗涤用te+0.5%sds洗涤珠一次,然后用te+tw(0.02%)洗涤2x,然后添加1ml10mmtrisph7.5。微流体装置使用聚二甲基硅氧烷(pdms)从由su8photo-resistl制成的母板制造。pdms装置然后等离子体处理以与玻璃显微镜载片(75mmx50mmx1mm)粘结。由于我们采用连续油相,通道通过经油入口流入aquapel(rider,ma,usa)和利用加压空气经其余入口/出口冲洗掉过量流体而赋予疏水性。参见mcdonald,j.c.等,fabricationofmicrofluicsystemsinpoly(dimethylsiloxane).electrophoresis21,27(2000)。实施例2:数以千计的单个细胞使用纳升微滴的全基因组表达谱型分析疾病在由不同类型的细胞构成的复杂组织中发生,且(几乎)从不涉及对其自身发挥作用的单一细胞:细胞总是彼此相互作用,从而进行集体决策、协作动态变化和一起发挥作用。在正常组织中,这导致内稳态;在疾病中,一个或多个相互作用的功能异常可导致或加重病理状态。细胞,生物结构和功能的基础单元,在类型和状态方面广泛地变化。单细胞基因组学可以表征细胞身份和功能,但简易性和规模的限制阻止了其广泛应用。申请人在此描述了drop-seq,这是通过将数以千计的单个细胞分离到纳升大小的水性微滴中,对各细胞的rna施加不同条码和对它们一起进行测序而快速地对数以千计的单个细胞进行谱型分析的策略。drop-seq分析来自数以千计的单个细胞的mrna转录物而同时记住转录物的细胞来源。申请人分析了来自44,808个小鼠视网膜细胞的转录组和定义了39个不同的细胞群体,重演了主要视网膜细胞类别,鉴定了亚型的候选标志物和对其各自进行基因表达谱型分析。申请人还分析了471个人骨髓细胞和定义了8个不同的细胞群体。drop-seq通过使得能够以单细胞分辨率进行常规转录谱型分析来加速生物学发现。单个细胞是组织、器官和生物体的构建单元。各组织包含许多类型的细胞,且各类型的细胞可以在生物学状态之间转换。组织中细胞类型的数目可以超过100,且每种细胞的状态数是未知的。因为各类型和状态具有独特的功能能力、反应和分子组成,有必要确定细胞类型和状态以了解组织生理、发育过程和疾病。在大多数生物系统中,申请人关于细胞多样性的知识是不完全的。例如,脑的细胞-类型复杂性是未知的且存在广泛争议(luo等,2008;petillainterneuronnomenclature等,2008)。许多重要但稀有的细胞群体很可能未被发现。这类稀有类型可能发挥关键作用。例如,浦肯野神经元对于脑功能是必不可少的,尽管它们占小脑中神经元的不到0.05%(andersen等,1992)。发现稀有细胞群体可能需要分析大量的细胞,理想地以无偏的方式。各细胞的功能的主要决定因素是其转录程序。目前,最近的进展使得单个细胞的mrna-seq分析成为可能(kurimoto等,2006;tang等,2009)。hofigs.ver,制备用于谱型分析的细胞的当前方法适用于数百个细胞(hashimshony等,2012;islam等,2012;picelli等,2013;pollen等,2014;shalek等,2014)或(利用自动化)适用于几千个细胞(jaitin等,2014),通常在首先通过分选(shalek等,2013)、挑选(hashimshony等,2012)或微流体技术(shalek等,2014)分离细胞后,和然后在其自身的孔或微流体腔中扩增各细胞的转录组。可扩展的方法是表征在多样的条件和扰动下具有许多细胞类型和状态的复杂组织所需的。对大量细胞进行谱型分析对于区分噪音与在许多细胞中重现的生物学上有意义的模式(有时涉及少数的基因)也可能是重要的(grun等,2014;kharchenko等,2014)。大规模单细胞研究的主要障碍是制备用于测序的大量单个细胞所涉及的费用和时间。在此,申请人描述了通过将数以千计的单个细胞包封在微小的“微滴”-在水和油混合时形成的纳升级的水性区室-中,然后条码标记各微滴中的rna以合并数以千计的条码标记的单细胞转录组为用于测序的一个样品而回避这一障碍的途径。尽管之前已经描述了单mrna-序列分析,但可以捕获其它类型的核苷酸如dna和来自细胞的病毒或可以利用亚磷酰胺化学过程的任何分子化合物。微流体装置可以每分钟形成成千上万的尺寸精确(“单分散的”)皮升-或纳升-级的微滴(thorsen等,2001;umbanhowar,2000)。这些微滴(其用作微小反应室)已经用于pcr(hindson等,2011;vogelstein和kinzler,1999)、反转录(beer等,2008)、细胞存活力筛选(brouzes等,2009)和荧光显微术(jarosz等,2014)。但是,将微滴用于转录组学的基础的问题是保留关于各mrna转录物由其中分离的细胞的身份的分子记忆。缺乏有效的分子条码标记阻止了微滴在许多遗传学和基因组学领域中的应用(guo等,2012)。此处,申请人通过引入对各转录物赋予微滴-特异性的分子标签的条码标记系统解决了这一问题。申请人的方法(称为drop-seq)将微滴微流体技术与大量的分子条码标记相结合以在一个测序反应中同时标记和处理来自数千细胞的mrna转录物而不需要单个细胞的机械分选或挑取。为证明drop-seq归类复杂组织中的细胞的能力,申请人将其应用于小鼠视网膜。视网膜是神经结构、功能和发育的分析的有力模型,因为虽然它与脑的任何其它部分差不多一样复杂,但它在小型的体积中提供了完整和可达的回路(hoon等,2014;masland,2012;masland和sanes,2015;sanes和zipursky,2010)。视网膜包含五个神经元类别,其分成~100个类型,其中仅小部分已经被分子表征。申请人使用drop-seq来分析来自小鼠视网膜的44,808个单细胞,其中申请人仅基于许多单个细胞的转录谱通过计算方式汇集了39个细胞类型的从头细胞分类。这一分类重现了-在单一实验中-数十年来视网膜的分子、生理和解剖学研究的发现,同时提出了许多新的推定亚型和特定标志物。该结果表明大规模单细胞分析将如何加深申请人对复杂组织和细胞群体的生物学的理解。为进一步证明drop-seq归类复杂组织中的细胞的性能和能力,申请人将drop-seq应用于人骨髓细胞。申请人在有限的细胞数量上研究了人骨髓细胞复杂性并仅基于其谱确认了已知的关键分类。结果为有效地对大量单个细胞进行谱型分析,申请人开发了drop-seq,其中申请人将细胞包封在微小微滴中并条码标记来自各单个微滴(包封的细胞)的转录物以记住其细胞来源。drop-seq由以下步骤组成(图7a):(1)从组织制备单细胞悬浮液;(2)在纳升级的微滴中共包封各单个细胞及一种各别地条码标记的微粒、珠或颗粒(例如,微珠、大珠、纳米颗粒等);(3)仅在被分离到微滴中后裂解细胞;(4)捕获细胞的mrna在其伴随微粒上,从而形成stamp(附接于微粒的单细胞转录组);(5)在单一反应中反转录、扩增和测序数以千计的stamp;和(6)使用stamp条码推断各转录物的细胞来源。申请人描述了这一途径的关键成分及其验证。产生大量各别条码标记的珠的分割-汇合合成途径。分割-和-汇合可以在各循环后或在任何指定次数的循环后进行。因此,各信息条码的范围可以为单一核苷酸至二核苷酸或三核苷酸等。为将大量条码标记的引物分子递送到单个微滴中,申请人直接在珠上合成寡核苷酸。作为珠材料,申请人使用由具有大表面积的多孔微粒构成的甲基丙烯酸酯树脂,其最初为色谱而开发(扩展实验过程)。多种珠材料预想作为可用的珠基质。可以使用的珠材料的实例包括可以利用亚磷酰胺(phosphoramidate)化学作用的任何珠,如用于本领域技术人员已知的寡核苷酸合成中的那些。特定的实例包括,但不限于,功能化聚合物(例如,甲基丙烯酸酯类、聚苯乙烯类、聚丙烯酰胺类、聚乙二醇类)、顺磁珠和磁珠。申请人然后使用反向亚磷酰胺合成以从5′至3′构建从微粒向外的寡核苷酸从而产生可用于酶促引发的游离3′末端(cheong等,2012;kadonaga,1991;srivastava等,2008)。用于产生条码的亚磷酰胺合成能够实现沿寡核苷酸的任何碱基的化学修饰,其可以利用这一类型的化学作用。具体实例包括,但不限于使用dna碱基、rna碱基、lna碱基、生物素-修饰的碱基、荧光团-偶联的碱基和非规范碱基(即,iso-g、iso-c、iso-a等)的条码标记。另外,这些条码标记的珠可以与其它形式的条码标记结合,如通过使珠形成图案或用各种荧光团或荧光团的组合的荧光标记的光学(optioal)条码标记。各微粒-结合的寡核苷酸由五个部分构成(图7b):(1)用作pcr和测序的引发位点的恒定序列(在所有引物上相同);(2)在任何一个珠的表面上的在所有引物之间相同的“细胞条码”,但其不同于所有其它珠上的细胞条码;(3)在各引物上不同的独特分子标识(umi),其使得源自相同的原始mrna分子(扩增和pcr重复)的序列阅读片段能够被计算地鉴别以使得它们不被双重计数(kivioja等,2012);(4)用于捕获聚腺苷酸化mrna和启动反转录的寡聚dt序列(30碱基);和(5)附接于珠材料的表面(未标记)的非可切割的连接体和启动序列。为有效地产生大量珠(其各自具有与其它珠上的条码不同的数百万拷贝的细胞条码),申请人开发了“分割-和-汇合”合成策略(图7c)。数百万微粒的池分成四个等同大小的组;不同的dna碱基(a、g、c或t)添加到四个组的每一个。四个微粒组然后重新汇合、混合和重新随机分割成另四个组,且另一dna碱基(a、g、c或t)添加到四个新组的每一个。在重复这一分割-汇合过程12次后,各珠的条码反映出珠经过十二个合成反应的独特路径(图7c),以使得单一微粒上的所有引物具有412=16,777,216个可能的12-bp条码中相同的一个。整个微粒池然后经历八轮简并寡核苷酸合成以在各寡聚体上产生umi(图7d);最后,在所有珠的所有寡聚体的3’末端上合成寡聚dt序列(t30)。寡核苷酸结合珠合成的各种实施方式中,可以使用任选的“软碱基(floppybases)”,如之前描述的寡聚dt。但是,这些“软碱基”不限于t-碱基且可以使用0-20碱基范围内的任何合适的碱基。尽管微珠在之前描述,但这一方法不限于“微”尺寸的珠且适当调整大小的任何珠可用于其中引物、pcr模板、转座子、sirna或捕获探针递送到目标区室的应用中。珠可以同时递送寡核苷酸及其它化学化合物、生物颗粒或甚至试剂。实例包括,但不限于小分子文库、sirna、抗体、病毒、细菌等等。因此,珠尺寸与珠的应用相关。例如,直径1cm的珠可以容纳数百万的引物,然后递送引物到96-孔滴定板,其中连接体随后被切割以释放和递送引物到这些孔。可切割的连接体可以包括多种聚合物(或其它类型的“柔性”应变-链化合物),其在水性酸性或碱性条件下水解、发生光解、在氢化作用下切割或以本领域技术人员已知的任何方法以从mrna或核苷酸序列释放珠。申请人以七种方式评价了申请人的条码标记的珠的质量和复杂性。第一,为估计每微粒的引物数量,申请人将合成的聚腺苷酸化rna与微粒杂交,洗脱合成的rna和测量其浓度;从这些实验,申请人估计各珠含有超过108个引物位点(扩展实验过程)。第二,为确定基于连接的条码区分rna的能力,申请人反转录与11个微粒杂交的合成的rna,在单一溶液中扩增这些条码标记的cdna和产生测序文库(扩展实验过程)。在所得的序列数据中,11个细胞条码各占到测序阅读片段的3.5%-14%,而在条码位置具有第二高丰度的12-mer仅占阅读片段的0.06%(图13a)。这些结果表明大多数cdna的微粒来源可以通过测序识别。最后,为评价条码复杂性,申请人对来自1,000个微粒的细胞条码测序并测量碱基和二核苷酸组成(图13b),以及在序列被计算修整时保留的独特细胞条码的数量(图13c)。所有三个分析表明,细胞条码的序列多样性接近理论限度,且因此细胞条码可以容易地在数以千计的stamp中区分。用于共包封细胞与珠的微流体装置。申请人设计了微流体“共流”装置(utada等,2007)以共包封细胞与条码标记的微粒(图8a,14a)。这一装置可以快速地使两个水性溶液共同流过整个油通道以形成每分钟超过50,000个纳升级微滴。一个流包含条码标记的微粒,其悬浮在裂解缓冲液中。另一个流包含细胞悬浮液(图8a,左)。流在包封前是层状流,使得两个溶液仅在微滴形成后混合。为最大化细胞裂解和mrna到珠表面上的扩散,申请人的装置包含“混合器”,其中通过混沌对流的快速混合在崎岖不平的弯曲微流体通道中发生(bringer等,2004)。微滴、细胞和微粒的相对数量对于drop-seq的效率是关键的。产生的微滴的数量大大超过注射的珠或细胞的数量,使得微滴一般包含零个或一个细胞及零个或一个珠。小心地选择细胞的浓度对于调节细胞-细胞二联体和潜在的单细胞杂质也是重要的,如申请人以下讨论的。每小时产生数百万纳升级微滴,其中数千个包含珠和细胞两者。stamp仅在包含珠和细胞两者的微滴亚集中产生。单一反应中许多stamp的测序和分析。为有效地一次性分析数以千计的stamp,申请人开发了在一个反应中处理与任意数量的微粒结合的核酸的方法。申请人首先在大体积的高盐溶液中破碎微滴以最小化珠与珠之间的rna转移(实验过程)。与微粒关联的mrna然后在一个反应中一起反转录,从而形成共价stamp(图8a,步骤7)。(反转录原则上可以在微滴内进行,尽管申请人发现其在微滴外更有效,可能是由于细胞溶解产物来源的抑制反应的因子(white等,2011)。)在这一阶段,明智地,科学家可以选择任何需要数量的stamp用于分析,多到从细胞悬浮液选择的所需的细胞数量。stamp可以在多个实验中“积存(banked)”;申请人已经储存stamp超过两个月而没有观察到显著的cdna降解(数据未显示)。申请人pcr-扩增附接于stamp的条码标记的cdna,然后通过使用转座酶将测序接头插入cdna中制备3’-末端文库(实验过程)。申请人使用高能平行测序(例如,illuminamiseq、nextseq或hiseq)从各末端测序所得分子(图8c),并使用这些阅读片段组装数字基因-表达测量(各细胞中各基因的计数)的矩阵用于进一步分析(图8d,实验过程)。drop-seq具有高的单细胞特异性,如在物种混合实验中评定的。为确定drop-seq是否正确地记忆单个转录物从其分离的细胞,申请人设计了物种混合实验,其中申请人制备包含培养的人(hek)和小鼠(3t3)细胞的悬浮液。几乎所有人或小鼠mrna序列片段可以毫无疑义地指定到正确的基因组来源;细胞文库的“生物体纯度”因此可以用于估计其单细胞纯度。申请人从人和小鼠细胞的混合物制备drop-seq文库,从而对测序数据中与各细胞条码相关联的人和小鼠转录物的数量进行评分(图9a,9b,14b)。这一分析揭示,stamp与高度生物体特异性的转录物集相关联(图9a和9b),这在没有高单细胞特异性的情况下是不可能的结果。在82个stamp(737,240个阅读片段/细胞,图15)的大部饱和测序的深测序水平下,申请人从hek细胞中的6,722个基因检测到平均44,295个转录物,和从3t3细胞中的5,663个基因检测到平均26,044个转录物(图9c和9d)。drop-seq文库的单细胞纯度。重要的是了解新技术的限制以及长处。因此申请人鉴定了单细胞文库中的两个杂质来源。细胞二联体。任何单细胞方法中的一种失败模式涉及粘结在一起或者恰好另外共分离用于文库制备的细胞。在一些较早的方法中,孔的显微镜成像已用于鉴定“可见二联体”和确立二联体率的下界。之前使用facs分选单细胞的研究报告,2.3%的孔包含可见的细胞二联体(jaitin等,2014)。主要的商业单细胞分析平台(fluidigmc1)成像96个微流体分离细胞的集合,部分地使得使用者可以从这些图像鉴定二联体。一项最近的研究在11%±9%的包含细胞的捕获室中确认可见二联体(shalek等,2014)。通过物种混合的分子分析提供鉴定从二联体制备的文库的有力和灵敏的新途径,且可以鉴定未通过显微镜检测的许多二联体。例如,当申请人如在drop-seq的分析中精确地制备物种混合细胞群体(图9a,9b)并在fluidigmc1上分析它们时,申请人发现30%的制备文库是物种混合的(图14c),其中约三分之一在显微图像中是可见二联体。当申请人从12.5细胞/μl细胞浓度(其允许每小时处理约1,200个细胞)的细胞悬浮液制备drop-seq文库时,几乎所有文库是物种特异性的(图9a)。当申请人从较高细胞浓度(50细胞/μl)的细胞悬浮液制备drop-seq文库,从而适应更快的细胞处理(4,800细胞/小时)时,1.9%的测序stamp是物种混合的(图9b)。在跨越12.5细胞/μl至100细胞/μl的四种条件中,在使用的细胞浓度与物种混合的stamp的分数之间具有强的线性关系(图15d;实验过程),反映了微滴在较高细胞浓度下包封小鼠和人细胞两者的较大可能。由于人-小鼠二联体占到所有细胞-细胞二联体的一半,申请人对于从最高纯度到最高通量的范围内的drop-seq条件计算了0.36%-11.3%的总体二联体率。单细胞杂质。单细胞分析中大部分未研究的问题涉及单细胞文库被来自其它细胞的转录物污染的程度。drop-seq的高通量及申请人使用的物种混合实验允许我们仔细地测量以不同细胞浓度制备的数以千计的单细胞文库中的单细胞纯度。申请人发现杂质与细胞悬浮液加载的浓度强相关:有机体纯度范围为12.5细胞/μl下的98.8%至100细胞/μl下的90.4%(图15d)。通过在不同阶段(细胞悬浮液;包含珠和裂解细胞的微滴;微滴后stamp)混合人和小鼠细胞-文库管线,申请人发现细胞悬浮液造成48%的杂质,微滴破碎后的rna转移造成40%,和pcr假象造成12%(图15e)。因此,最大的污染源似乎是在实验开始时存在于细胞悬浮液中的环境rna且推测由在制备过程中受损的细胞产生。这一结果对于单细胞转录组学研究是重要的,因为细胞悬浮液的产生是几乎所有这类方法的必不可少的第一步骤。事实上,当申请人在商业单细胞测序平台(fluidigmc1)上分析相同的物种混合细胞群体时,申请人测定95.8%的平均单细胞纯度(图15c),其与50细胞/μl下的drop-seq相似。重要的是使用在此进行的种类的物种混合实验小心地评价所有单细胞方法。尽管drop-seq的高纯度模式(图9a)基于这些理由看起来优于最高通量模式(图9b),但申请人注意到,在可能的实验环境中,可能希望的是尽可能快地处理活细胞,因为活细胞的超快处理可以加强再现性且由此有助于相对于较慢-通量(slower-throughput)的现有方法实现drop-seq的潜在长处。申请人在以下视网膜实验中进一步研究这些问题。drop-seq采样细胞中约12%的转录物。申请人接着试图理解通过drop-seq确定的数字单细胞转录组如何与细胞的基础mrna内容物相关。drop-seq包括rna与珠的杂交,其可能影响基因的绝对表达水平的测量,因此申请人将drop-seq表达测量与来自通常使用的溶液中cdna扩增过程,模板转换扩增,的那些比较(扩展实验过程)。尽管模板转换扩增之前已描述,t7线性扩增或指数式恒温扩增也可以用于扩增产物。在两个文库中的基因-水平的log-表达测量是高度相关的(r=0.94,图9e),尽管drop-seq定量地显示富gc的转录物的较低确认(图17a)。申请人也将drop-seq单细胞log-表达测量与来自总体mrna-seq的测量进行比较,并观察到r=0.90的相关性(图9f)。单细胞转录组学中的重要和长期存在的挑战是了解在实验中确认的rna如何与细胞的原始rna内容物相关。已知浓度的externalrnacontrolsconsortium(ercc)“加标”对照更多使用与使用umi以避免双重计数结合现在允许估计数字单细胞表达技术的捕获率(brennecke等,2013)。三项最近的研究估计的当前单细胞数字-表达技术的捕获率为3%(mars-seq)(jaitin等,2014)、3.4%(cel-seq)(grun等,2014)和48%(5’-末端smart-seq)(islam等,2014)。使用islam等的校正方法(以试图避免由于pcr或测序误差的双重计数umi)的drop-seq捕获率估计对于drop-seq产生47%的捕获率估计值;但是,申请人确定了测序误差仍然可以扩大umi计数的证据,甚至在使用该校正方法时(扩展实验过程),因此申请人在drop-seq中利用8bpumi以基于将相似的umi序列折叠到单一计数的新途径得到更保守的估计(12.8%,图9g)。为进一步评价捕获率,申请人使用微滴数字pcr(ddpcr)(hindson等,2011)对10个基因进行独立的数字表达测量(对来自50,000个hek细胞的总体rna)。drop-seq捕获通过数字pcr预测的平均10.7%数量的rna(图17d,17e和17f)。这些数据表明,drop-seq的灵敏度在通过最近开发的数字表达方法确定的范围内,甚至当申请人的新型和极端保守umi计数方法用于评价drop-seq时。细胞周期的单细胞分析揭示连续变化的细胞状态。为评价通过drop-seq的细胞状态的可见性,申请人首先检验申请人在上述实验中用于制备stamp的589个hek和412个3t3细胞(61,697个阅读片段/细胞)中的细胞-细胞的变异。两种培养物由异步分裂细胞组成;单细胞表达谱的主成分分析(pca)显示主要成分由在蛋白质合成、生长、dna复制和细胞周期的其它方面(表5)中具有作用的基因主导。申请人通过对反映之前在化学同步细胞中表征的细胞周期的五个阶段(g1/s、s、g2/m、m和m/g1)的基因集(印记)进行评分来推测1,001个细胞各自的细胞-周期阶段(表6)(whitfield等,2002)。各印记中的基因在全部单个细胞中共同变化,从而允许我们沿细胞周期按时间排序细胞(图10a)。使用这一排序,申请人鉴定了具有沿细胞周期变化的表达谱的基因(以5%的错误发现率;实验过程),从而在人(hek)和小鼠(3t3)细胞中分别得到544和668个基因(图10b)。大多数基因在g1+s期或g2+m期具有峰表达(图10b),少数显示其它模式,如在m/g1过渡期的峰表达(例如,小鼠细胞中的簇8,图10b)。在这些基因中,在两个物种之间的直系同源基因中具有显著的重叠(200个共有的直系同源物,通过超几何检验p<10-65),这与保守的细胞周期程序一致。大多数(82.5%)的这些“保守”周期基因(在两个物种中鉴定为细胞周期调节的基因)之前已经注释为在至少一个物种中与细胞周期相关。在17.5%的之前未注释为细胞周期调节的保守周期基因中,申请人发现一些基因预期显示细胞周期变化(例如,e2f7、ncapg、cdca4、dnmt1和parpbp)以及一些基因据申请人所知之前未与细胞周期相关联,包括转录物因子(tcf19、atf4、zfhx4)和其它基因(图10c)。最后,申请人发现在各物种中,前五个pc中的四个与细胞周期阶段特异性评分中的至少一个高度相关(p<10-10),表明细胞周期在这些细胞的细胞间变异中的主要作用,其与分裂细胞中的其它报告一致(buettner等,2015)。因此,drop-seq单细胞谱可以揭示按照亚群表型变化的基因集。特别地,这使得能够在大量细胞中在没有化学同步的情况下以高时间分辨率研究细胞周期,其可以帮助鉴定之前未知与细胞周期一起振荡的保守人-小鼠基因对。视网膜的drop-seq分析揭示细胞类别。申请人选择视网膜来进行drop-seq的研究,因为几十年来的工作已经产生关于许多视网膜细胞类型的信息(masland,2012;sanes和zipursky,2010),从而提供将申请人的单细胞rna-seq数据与现有细胞分类方案相关联的机会。视网膜包含五个类别的神经元细胞,其各自通过形态、生理和分子标准的组合定义(图11a)。三个细胞层的最外层包含光感受器,其将光转换成电信号。中间层包含三个类别的中间神经元-水平细胞、双极细胞和无长突细胞-以及米勒神经胶质细胞。最内层包含视网膜神经节细胞和一些无长突细胞。光感受器突触连接到中间神经元上,中间神经元处理视觉信号并将它们传送到视网膜神经节细胞,视网膜神经节细胞随之将它们发送到脑的其余部分。大多数的类别可分成离散的类型-当前估计总共约100个类型-但远低于一半具有使它们特异性地与其它的相关类型区分开的分子标志物。drop-seq提供了鉴定先前专门地通过形态或生理标准定义的细胞类型的分子印记的机会。视网膜对于大规模单细胞谱型分析提出了难以克服的技术挑战。首先,视网膜中约70%的细胞是视杆光感受器;其它视网膜细胞类别各占0.5-8%的视网膜细胞且进一步划分成类型。因此,视网膜中的问题是鉴定多种单独地稀有的细胞类型。其次,视网膜细胞之间的尺寸变化-直径范围从1.2微米(视杆细胞)至20微米(视网膜神经节细胞)且因此在体积上跨越三个数量级-不仅可以对无偏的细胞分离造成技术挑战,而且由于mrna内容物的巨大的细胞间差异使分析变得复杂。申请人对由14-天龄小鼠的全视网膜制得的细胞悬浮液进行drop-seq,测序49,300个stamp至14,084个阅读片段的平均深度(stamp在四天内在七个实验批次中收集)。为从单细胞表达谱从头发现细胞类型,申请人首先使用显示出比通过转录物(细胞内)的随机统计采样可能解释的表达变异(细胞间)更高水平的表达变异的基因和最初集中于具有最大转录物数量的13,155个细胞(以减小微小光感受器细胞对分析的其它方面不成比例的影响)进行主成分分析(实验过程)。申请人利用经典排列检验(peres-neto等,2005)和最近开发的重采样过程(chung和storey,2014)以鉴定统计学显著的主成分(pc),从而在这些数据中发现32个显著pc(图18)。几乎所有的显著pc通过作为视网膜细胞类型的公知标志物的基因强力地定型(shaped)。申请人使用与这些主成分相关的细胞负载作为t-distributedstochasticneighborembedding(tsne)的输入(vandermaaten和hinton,2008)以缩减这32个pc到两个维度。申请人将数据中的其余36,145个细胞投影到tsne上,并将密度聚类方法与差异表达分析结合以从这一tsne分析鉴定不同的细胞簇(扩展实验过程)。这些步骤为我们留下39个转录上不同的细胞群体-最大的包含29,400个细胞,最小的包含50个细胞,总共由44,808个细胞构成(图11b)。最后,申请人通过基于基因-表达空间中的euclidean距离构建39个细胞群体之间相似性关系的系统树图将39个细胞群体组织成较大的转录上相似的簇的类别(种类)(图11d,左)。申请人发现他们的非监督聚类结果-其完全得自单细胞转录组数据本身的聚类,而非通过已知标志物“指示”-与对于许多视网膜细胞类型现有的已知分子标志物的表达显著地相关(图11d,右)。视网膜细胞类型的公知标志物包括对于视网膜神经节细胞的slc17a6(vglut2)和thy1,对于双极细胞的vsx2、对于水平细胞的lhxl、对于光感受器的视蛋白、对于无长突细胞的tfap2b和pax6,及对于米勒神经胶质细胞的rlbpl。这些标志物各自显示与源自申请人的非监督分析的系统树图的分支或叶对应的单细胞基因表达谱(图11d)。光感受器聚类成可容易地基于其视杆和视锥视蛋白的表达鉴定为视杆细胞和视锥细胞的两个组。另外的簇对应于与视网膜相关的非神经元细胞,包括星形细胞(与离开视网膜的视网膜神经节细胞轴突相关)、常驻小胶质细胞(provis等,1996)、内皮细胞(来自视网膜内脉管系统)、周细胞(包围内皮的细胞)和成纤维细胞(图11d)。此外,申请人发现申请人的数据中主要细胞类别的相对比例大部分与来自显微术的较早估计一致(jeon等,1998)。非监督分析以预期的比率鉴定所有这些生物学已知的细胞类别的能力表明这样的分析可以适用于其常驻细胞群体远未表征的许多其它组织。drop-seq数据的复制和累积能力。实验期的重复使得能够构建累积地更有力的数据集用于检测细微的生物信号。视网膜stamp利用不同的四窝小鼠在不同的四天(间隔数周)产生,几个实验期产生多个重复drop-seq轮,总共七个重复。申请人以特别低的细胞浓度(15细胞/μl)和高纯度制备这些重复之一以评估是否任何分析结果是细胞-细胞二联体或单细胞杂质的假象(即,是否它们排除这些“高纯度”细胞),因为drop-seq的最快通量模式允许活细胞的极快处理(对于保持与体内系统的对应性是有价值的),但相对于最高纯度模式具有单细胞纯度的一些代价(图9a,9b),且在这些模式中鉴定的转录谱之间的对应性对于理解是重要的。然而,关键问题是每个实验期是否将细胞归属于申请人在以上分析中观察到的39个群体中的各群体(图11b)。申请人发现所有39个簇包含来自每个实验期和条件的细胞。但是,簇36(图11e中的箭头;图20中的星号)不成比例地从重复2和3得到。这一簇表达成纤维细胞的标志物,成纤维细胞是非视网膜原有的而是相反存在于视网膜周围组织中的细胞类型;两个重复中包括较大量的成纤维细胞最可能代表在视网膜周边解剖的挑战。最重要地,在高纯度条件下制备的3,226个细胞(重复7)归属于每个簇,表明没有簇是二联体或其它杂质的假象(图11e)。尽管申请人不能排除实验变异影响drop-seq中的基因表达测量的可能性,但在这些实验中,这类效应表现为相对于甚至高度相似的细胞亚型(例如,以下描述的无长突细胞的21个群体)之间的差异是小的。申请人接着检验细胞的分类(基于其基因表达谱)如何随分析的细胞数量而进化,以评估聚类分析的稳定性和对于分析大量细胞的科学效益两者。申请人使用来自申请人的数据集的500、2,000或9,431个细胞,并询问在完全(44,808-细胞)分析中鉴定的(例如)无长突细胞在较小细胞数量的分析中如何聚类(图11f)。申请人发现,随着数据中的细胞数量增加,相关簇之间的区分变得更清楚、更强和分辨率更高,其结果是更大数量的稀有无长突细胞群体(各代表实验中细胞的0.1-0.9%)可以最终彼此区分开(图11f)。在较小数量细胞的分析中,这些细胞经常共聚类成“超类型”,反映了在全基因组实验中将重现谱(通常涉及少量的基因)与单细胞生物、技术和统计噪音区分的挑战。21个候选无长突细胞类型的谱。为更好地理解单细胞分析区分紧密相关的细胞类型的能力,申请人聚焦于鉴定为无长突神经元细胞的21个簇,其是被认为形态学上最多样性的神经元种类(masland,2012)。大多数无长突细胞是抑制性的,大约一半使用甘氨酸且另一半使用gaba作为神经递质。表达slc17a8(vglut3)和释放谷氨酸的兴奋性无长突细胞也被鉴定(haverkamp和wassle,2004)。另一最近发现的无长突细胞群体不释放已知的经典神经递质(ngng无长突细胞)(kay等,2011)。申请人首先鉴定相对于其它细胞类别最普遍地由无长突细胞簇表达的潜在无长突细胞标志物(图12a)。申请人然后评价已知甘氨酸能和gaba能标志物的表达;它们的互斥表达作为与形态相关的根本区分观察到:大多数gaba能无长突细胞具有限制于单一子层的宽的树突棘(宽域),而甘氨酸能无长突细胞具有跨越多个子层的窄的树突棘(窄域)。在21个无长突细胞簇中,分别基于gaba合成酶、谷氨酸脱羧酶(两个同工型,由gadl和gad2编码)和甘氨酸转运蛋白(slc6a9)的表达,12个组(一起包含2,516个细胞)可鉴定为gaba能的和不同的5个簇(一起包含1,121个细胞)可鉴定为甘氨酸能的(图12b)。另外的细胞群体(包含73个细胞)通过其slc17a8的表达鉴定为兴奋性的,slc17a8不在其它无长突细胞群体中表达(图12b)。其余的三个无长突细胞群体(簇4、20和21)不具有或具有低水平的gad1、gad2、slc6a9和slc17a8;这些很可能包括ngng无长突细胞,如下所述。具有已知的分子标志物的无长突细胞类型很容易从分析分配到特定细胞群体(簇)。甘氨酸能a-ii无长突神经元细胞表现为对应于最相异的甘氨酸能簇(图12b,簇16),因为这是强烈表达编码间隙连接蛋白连接蛋白36的gjd2基因的唯一簇(feigenspan等,2001;mills等,2001)。ebf3,seg甘氨酸能以及ngng无长突细胞中发现的转录因子,对于簇17和20是特异性的。星爆无长突神经元细胞(sac),使用乙酰胆碱作为辅递质(co-transmitter)的唯一视网膜细胞,可通过那些细胞的胆碱乙酰转移酶基因chat的表达鉴定为簇3(图12b);drop-seq数据也表明sac,与其它gaba能细胞不同,表达gadl而不表达gad2,如之前在兔中观察到的(famiglietti和sundquist,2010)。除以上区别以外,很少知道在生理和形态上多样的无长突细胞类型之间的分子区别。这些类型的分子标志物是用于更全面地研究无长突细胞的回路、发育和功能的有力工具。对于21个无长突细胞群体(簇)中的各个群体,申请人鉴定了在各个簇中相对于其它无长突细胞高度富集的多个基因(图12c)。各簇的许多标志物(图12c)是参与神经传递或神经调节的基因;这些基因历史上是其它脑区域中单个神经元细胞类型的良好标志物。drop-seq可以细胞类型的新标志物吗?申请人分析了在两个无长突细胞簇中表达的基因:簇7,gaba能簇,和簇20,其具有甘氨酸能和ngng细胞的混合物。首先,申请人用转录因子maf(簇7的主要标志物)的抗体加gad1或slc6a9(分别是gaba能和甘氨酸能传递的标志物)的抗体共染色视网膜切片。如通过drop-seq数据预测的,maf特别地在为gaba能而非甘氨酸能的无长突细胞的小亚集中发现(图12d)。簇7具有相对于其最近的邻居(簇6)富集的多个基因(图12e,16个基因>2.8-倍富集,p<10-9),包括crybb3,其属于已知在晶状体发育过程中通过maf直接上调的晶状体蛋白家族(yang和cvekl,2005),及另一种,基质金属蛋白酶mmp9,其证明接受晶状体蛋白作为底物(descamps等,2005;starckx等,2003)。其次,申请人用针对在簇20中选择性表达的ppp1r17的抗体对切片染色。簇20显示弱的不常见的甘氨酸转运蛋白表达且是表达neurod6(ngng神经元的标志物)的仅两个簇(与簇21)之一(kay等,2011),其既不是甘氨酸能的也不是gaba能的。申请人使用已经证明在ngng无长突细胞中特异性表达青色荧光蛋白(cfp)的转基因品种(mitop)(kay等,2011)。ppplr17在mitop系的所有cfp-阳性无长突细胞的85%中染色,确认这为ngng细胞的标志物。簇21中推定ngng无长突细胞的ppp1r17缺乏表明ngng无长突细胞中迄今未知的异质性水平。如簇7一样,簇20表达将其与最接近的邻居区分的多种标志物(图12g;12个基因>2.8-倍富集,p<10-9)。单个簇中其它的细胞多样性的鉴定。申请人的非监督聚类分析将细胞分组成39个不同群体;基于形态学和生理学提出了存在多达100个视网膜细胞类型。申请人因此询问是否额外的异质性和群体结构可以在簇内存在和在监督分析中可见;这表明还更深的分类用更大的细胞数量或用非监督的和已知标志物驱动的分析的组合成为可能。此处,申请人聚焦于视锥光感受器和视网膜神经节细胞。视锥细胞。小鼠是二原色视者,其仅具有分别由基因opnlsw和opnlmw编码的短波长(蓝色或s-)和中波长(绿色或m-)视蛋白。s-和m-视蛋白以沿背腹轴的相反梯度表达,许多视锥细胞(特别是在中央视网膜中)表达这两种视蛋白(szel等,2000)。没有其它基因鉴定为选择性地标志s-或m-视锥细胞。申请人通过opnlmw、opnlsw、arr3和其它视锥细胞特异性基因的表达鉴定簇25为视锥细胞。申请人比较了仅表达opnlsw(蓝光敏感视蛋白)的336个细胞(簇25中)的全基因组基因表达与仅表达opnlmw(绿光敏感视蛋白)的551个细胞(相同簇中)的表达(图12h)。8个基因在两个细胞群体之间表达相差至少2-倍(且p<10-9)。一个这样的基因,thrb,编码甲状腺激素的受体,甲状腺激素是定型差异视蛋白表达的背-腹图式形成(dorsal-ventralpatterning)的关键发育调节剂(roberts等,2006)。两个其它基因,smugl和ccdc136,已经证明分别集中在背和腹视锥细胞中集中(corbo等,2007),与申请人将它们指定为m-和s-视锥细胞一致。视网膜神经节细胞。视网膜神经节细胞(rgc),来自视网膜的唯一输出神经元种类,据信由约20个类型组成,其中几种具有已知的分子标志物(masland和sanes,2015)。rgc总共构成视网膜中少于1%的细胞(jeon等,1998)。在申请人的44,808个细胞的分析中,申请人鉴定了单一rgc簇,其由少于1%的全部分析细胞组成。opn4,编码黑视蛋白的基因,是独特rgc类型的已知标志物(hattar等,2002);在432个rgc中,申请人鉴定了表达opn4的26个细胞。这26个细胞比406个opn4-rgc强至少两倍地表达七个基因(p<109,图12i);这七个基因之一是eomes,最近证明是含黑视蛋白rgc的发育和维持所需的(mao等,2014)。人骨髓细胞。人骨髓细胞包含多能造血干细胞,其分化成两个祖细胞类型:淋巴干细胞和骨髓干细胞。淋巴干细胞分化为发育成t、b和nk细胞(即,外周血单核细胞)的前淋巴细胞,而骨髓干细胞分化成三个类型的细胞系:粒细胞-单核细胞祖细胞、红系祖细胞和巨核细胞。外周血单核细胞(pbmc)由具有圆形细胞核的血液细胞组成,其参与对抗疾病如白血病、癌症和传染病。申请人对通过drop-seq制备的471个单细胞转录谱的分析鉴定了与造血干细胞的已知细胞类型相关的8个基因标志物簇。过论此处,申请人已经描述了drop-seq,这是用于同时分析不受限数量的单个细胞中的全基因组表达的新技术。申请人首先通过完整人和小鼠细胞的混合物的谱型分析来验证drop-seq。申请人然后使用drop-seq以确定复杂组织中名义同质的细胞群体和细胞类型的细胞状态。为分析细胞状态,申请人在来自两个物种的1,001个异步生长细胞中以近连续的时间分辨率对细胞周期进行谱型分析,揭示了具有进化上保守的表达振荡的新的细胞周期调控基因。为分析细胞类型,申请人对来自小鼠视网膜(中枢神经系统的可及部分)的44,808个单个细胞进行谱型分析。申请人鉴定了视网膜中39个转录上不同的细胞群体,揭示了那些细胞之间的新关系和提出了新的细胞类型特异性的标志物,其中两个由申请人通过免疫组织化学验证。在该技术的其它实施方式中,技术的应用可以用于通过确定相对于健康状态特别地存在于疾病状态中的细胞群体、细胞标志物或细胞群体的组合而鉴定疾病如癌症或自身免疫疾病的新的生物标志物。在进一步的应用中,drop-seq技术可以应用于疾病建模或疾病预测。单细胞技术可以用于诊断具有不清楚的病因学或起源的疾病。例如,未知原发组织的癌症可以通过鉴定中组织表达特定组织的细胞类型标志物的稀有细胞而追溯到组织来源。如以上讨论的,dropq-seq过程产生stamp(附接于微粒的单细胞转录组)。因此,微粒具有存在于细胞中的mrna的稳定记录且因此可以探测不同基因的表达。例如,由于drop-seq技术可以用于快速地对基因平行测序,有可能探测与人体相关的微生物组中与表型差异相关的那些基因。因此该技术可以扩展到分析分子、细胞器、细胞片段(例如,突触)、全细胞或细胞集合(即,类器官)。为成为广泛适用的和为推进生物学的发展,新技术应具有这些特性:1.应当符合未满足的科学需求。生物学家正迅速地认识到通过在细胞水平确定转录变异而能够实现的科学机会。但是,目前的方法仅可以每天对几百细胞进行谱型分析,每细胞$3-$50的成本。相比之下,采用drop-seq的单个科学家可以完整地制备10,000个单细胞文库用于测序,每细胞约6美分。申请人希望,简易性、速度和低成本有利于丰富的试验、仔细的重复及多个循环的实验、分析、理念和更多实验。2.应当容易采用。技术越简单,它可能被知道如何良好地使用该技术的科学家采用的可能性越高。drop-seq利用任何生物实验室可得的设备-小的倒置显微镜和注射泵如日常用于微量注射的那些。drop-seq设施可以快速地和经济地构建(图21和扩展实验过程)。drop-seq也使用两种新试剂:用于微滴制备的微流体装置和单独地条码标记各细胞的rna的珠。申请人设计微流体装置(通过30个设计迭代)为简单的、无源装置,其可以容易地以任何学术或商业微流体技术设备构建,且申请人提供cad文件以使得其成为可能。本文描述的条码标记的珠在该文章公开时是可得的(扩展实验过程)。申请人的补充材料包括对有兴趣的阅读者的详细实验方案。3.应当完全地测试以提供对该技术的优势和限制的清楚了解。此处,申请人使用小鼠和人细胞的混合物以仔细地测量单细胞纯度和细胞二联体的频率两者-申请人理解以这种方式测试任何单细胞分析策略的第一项工作。申请人发现可以通过调节输入细胞浓度来调整两种关键的质量参数-细胞-细胞二联体和污染rna,且在较低细胞浓度下(仍适应1,200细胞/小时的通量),drop-seq与现有技术比较对于二联体和纯度两方面都是有利的。申请人的结果表明从细胞悬浮液分离单细胞的其它方法如荧光激活细胞分选(facs)或微流体技术也易受二联体和单细胞杂质的影响。对申请人的视网膜数据集的分析表明,以“超高通量”模式(100细胞/μl,允许以~10%二联体和杂质率处理10,000细胞/小时)产生的甚至相对不纯的文库可以产生丰富、稳定和生物学验证的细胞分类,但其它组织或应用可能需要使用更纯的drop-seq模式。申请人总是建立,前导分析用drop-seq的较高纯度模式之一开始。单细胞谱型分析技术的另一主要质量度量是捕获效率。申请人基于合成rna“加标”的分析估计drop-seq的捕获效率为约12%,申请人然后通过十个基因的高灵敏数字pcr测量对其进行证实。过去一年中单细胞数字表达谱型分析方法的研究报告了3%、3.4%和48%的捕获率,尽管这些比率未以均一方式估计或校正;申请人选择特别保守的估计方法以得到drop-seq的12%的估计值且表明单细胞基因组学的巨大需求是均一比较策略和度量。申请人对视网膜的分析指示,捕获仅~12%的各细胞的转录组(及少于此的测序)可以允许识别甚至细微的细胞类型差异(例如,21个无长突细胞群体之间);这扩展了最近在301个皮层细胞的研究中提出的概念(pollen等,2014)。分析如此多的细胞的能力可以帮助阐明以另外的方式难以捉摸的生物学特征,因为这些特征此时以压倒在单细胞水平上存在的生物、技术和统计-采样噪音的方式在大量的分析细胞中共有。drop-seq数据的非监督计算分析鉴定了39个转录上不同的视网膜细胞群体;全部证明属于已知细胞类别,且大多数基于先前验证的标志物的表达表现为对应于已知的或假设的视网膜细胞类型和亚型(图11和12)。对于视网膜特别强调的是建立簇和类型之间的对应性在许多情况中是简单明确的;分类在脑的大多数其它部分中还远远不足以允许这种验证,这是为什么组织(如视网膜)中的初始验证如此重要的原因。这些细胞群体中的多种-特别是无长突细胞类别中的那些-对于之前仅通过形态学和生理学鉴定的细胞指定新的区别标志物。许多有趣的问题围绕来自转录组学数据的细胞类型的定义。例如,总是存在界定两个细胞组是明显不同的类型的明确表达阈值吗或者区分有时是分级的或连续的吗?更重要地,细胞群体之间的转录差异如何造成解剖学和生理学的差异?通过drop-seq提供的通量可以通过甚至在稀有细胞类型中对适当表达模式提供足够数量的谱而使得这类问题能够在整个组织中全面地解决。申请人看到drop-seq在生物学中细胞类型和细胞状态鉴定以外的许多其它重要的应用。基因组规模的遗传研究正在鉴定其中遗传变异造成疾病风险的大量基因;但生物学缺乏将基因与特定细胞群体及其独特功能反应相关联的类似高通量途径。发现如此多的基因的细胞位点和生物活性对于从遗传学先导到生物学认识是重要的。高通量单细胞转录组学可以将风险基因的表达定位到特定细胞类型,且与遗传扰动相结合,也可以帮助系统性地将各基因与(i)受到那些基因的缺失或扰动最大影响的细胞类型和(ii)由这类扰动诱发的细胞状态的改变相关联。这类方法可帮助跨越从高通量基因发现到(更难获得的)对人类疾病病因学的真实见解的巨大差距(mccarroll等,2014)。drop-seq与另外的扰动-如小分子、突变(天然的或工程的)、病原体或其它刺激-的结合可用于产生关于扰动对许多种类的细胞的影响的信息丰富的多维读数。在研究突变的作用时,例如,drop-seq可以同时揭示其中相同的突变以细胞-自主的和非细胞-自主的方式影响许多细胞类型的途径。基因表达的功能相关不仅仅是基因或编码蛋白质的内在性质的结果,而且也牵涉到其中基因被表达的整个细胞水平的环境。申请人希望drop-seq能够在许多生物学领域中实现这类关系的丰富和常规的发现。实验过程装置制造。微流体装置使用autocad软件(autodesk,inc.)设计,且部件使用comsolmultiphysics(comsolinc.)测试。cad文件也在增补中提供。装置利用环氧树脂基光阻剂su8作为母板通过复制模塑使用生物相容的硅基聚合物聚二甲基硅氧烷(pdms)制造,如之前描述的(mazutis等,2013;mcdonald等,2000)。pdms装置然后通过经通道流入aquapel(rider,ma,usa),通过流入加压空气干燥掉过量流体和在65℃下烧烤该装置10分钟而赋予疏水性。条码标记的微粒的合成。珠功能化和反向亚磷酰胺合成通过chemgenescorp(wilmington,ma)进行。“分割-和-汇合”循环通过从各柱除去干燥树脂,手动混合和在将树脂返回用于另外的合成循环之前称量出四个相同部分来完成。全部细节(包括珠的可用性)在扩展实验过程中描述。drop-seq程序。可以在扩展实验过程中发现实验方案(包括所有试剂的组合物和目录编号)的完整、深入的说明。简言之,尺寸~1nl的微滴使用如上所述的共流微流体装置产生,其中悬浮在裂解缓冲液中的条码标记的微粒以等于单细胞悬浮液的速率流动,使得微滴由等同量的各成分组成。微滴产生一完成,微滴用在30ml的6xssc中的全氟辛醇破碎。将大体积的水性液体添加到微滴减少了微滴破碎后的杂交事件,因为dna碱基配对遵循二阶动力学(britten和kohne,1968;wetmur和davidson,1968)。珠然后洗涤并重悬在反转录酶混合物中。在25℃下孵育30min和在42℃下孵育90min后,珠洗涤并重悬在核酸外切酶i混合物中并在37℃下孵育45min。珠被洗涤、计数、等分到pcr管中且pcr扩增(细节参见扩展实验过程)。pcr反应被纯化和汇合,且扩增的edna在bioanalysishighsensitivity芯片(agilent)上定量。3′-末端片段化并使用使得能够特异性扩增仅3′末端的定制引物利用nexteraxtdna样品制备试剂盒(illumina)扩增用于测序(表9)。文库被纯化和在highsensitivity芯片上定量,并在illuminanextseq500上测序。关于反应条件、使用的引物和测序说明的所有细节可以在扩展实验过程中找到。比对和数字表达水平的估计。原始序列数据使用starv2.4.0(dobin等,2013)过滤、接头-和聚a-修整和与用于视网膜实验的小鼠(mm10)基因组或综合小鼠(mm10)-人(hg19)mega-基准比对。所有具有相同细胞条码的阅读片段分组在一起,且合并具有ed=1内的umi的与相同基因比对的来自相同细胞的阅读片段。在各细胞上,对于各基因,独特umi被计数;这一计数然后置于数字表达矩阵中。该矩阵按照每细胞所有umi的总和排序,且产生累积总和图。申请人通过估计第一拐点确定stamp的数目(图14b),申请人经验地发现第一拐点总是接近于扩增的stamp的估计值。另外的细节可以在扩展实验过程中找到。hek和3t3细胞的细胞周期分析。反映hela细胞周期的五个阶段(g1/s、s、g2/m、m和m/g1)的基因集从whitfield等(whitfield等,2002)获取,其中具有一些改变(扩展实验过程)。阶段特异性的评分使用各基因集中基因的平均标准化表达水平(log2(tpm+1))在所有五个阶段中对于各细胞产生。细胞然后通过比较每细胞的这五个阶段评分的模式沿细胞周期排序。为鉴定细胞周期调控基因,申请人使用滑动窗方法并确定最大和最小平均表达的窗口(两者都用于排序的细胞和用于乱序的细胞)以评估错误发现率。全部细节可以在扩展实验过程中找到。全视网膜悬浮液的产生。悬浮液通过采用之前描述的方法(barres等,1988)从14-天龄(p14)c57bl/6小鼠的视网膜制备。另外的细节参见扩展实验过程。视网膜数据的主成分和聚类分析。主成分分析(pca)首先使用具有>900个基因的单细胞文库在49,300-细胞数据集的13,155-细胞“训练集”上进行。申请人发现他们的方法在发现对应于稀有细胞类型的结构方面比在完全数据集上进行pca更有效,完全数据集由众多的微小视杆光感受器主导(扩展实验过程)。在这一训练集中显示出显著的变异性或结构的384个基因用于学习主成分(pc)。三十二个统计学显著的pc使用排列检验鉴定且使用改进的重采样过程独立地确认(chung和storey,2014)。为显示视网膜中细胞类型的组织化,申请人使用t-distributedstochasticneighborembedding(t-sne)基于单个细胞沿显著pc的评分将训练集内的单个细胞投影到单一的二维图上(vandermaaten和hinton,2008)。其余36,145个单细胞文库(<900个检测的基因)接着基于其在训练集的pc-子空间内的表现投影到这一t-sne图上(berman等,2014;shekhar等,2014)。这一方法减轻了由于基因放弃(genedropouts)导致的噪音变化在较低复杂性文库中的影响,且在这种意义上来说也是可靠的:当申请人从tsne撤出来自给定簇的所有细胞且然后尝试投影它们时,这些撤出的细胞不会不合逻辑地通过投影分配到另一簇(表10)。此外,细胞不允许基于与少于10个细胞的相似性投影(参见扩展实验过程)。t-sne图上的点云代表细胞类型,且密度聚类(ester等,1996)使用用于定义大和小的簇两者的两个参数集鉴定这些这些区域。差异表达检验(mcdavid等,2013)然后用于确认该簇彼此不同。基于euclidean距离和全联的分层聚类用于构建关联该簇的树。申请人注意到在每个细胞簇中七个视杆细胞特异性基因,如rho和nrl,的表达,这是已经在另一视网膜细胞基因表达研究中观察到的现象(siegert等,2012)。这很可能由在细胞悬浮液制备过程中这些高丰度转录物的增溶产生。关于视网膜细胞数据分析的另外的信息可以在扩展实验过程中找到。实施例3:实施例2的扩展实验过程珠合成。珠功能化和反向亚磷酰胺合成(5′-3′)由chemgenescorp.进行。toyopearlhw-65s树脂(30微米的平均粒径)购自tosohbiosciences,且表面醇用peg衍生物功能化以产生18-碳长的柔性链连接体。功能化的珠然后用作在expedite8909dna/rna合成仪上使用10μmol循环规模和3分钟的耦合时间的dna合成的反向亚磷酰胺合成(5′→3′)的固体载体。使用的酰胺化物是:n6-苯甲酰基-3′-o-dmt-2′-脱氧腺苷-5′-氰乙基-n,n-二异丙基-亚磷酰胺(da-n6-bz-cep);n4-乙酰基-3′-o-dmt-2′-脱氧-胞苷-5′-氰乙基-n,n-二异丙基-亚磷酰胺(dc-n4-ac-cep);n2-dmf-3′-o-dmt-2′-脱氧鸟苷-5′-氰乙基-n,n-二异丙基-亚磷酰胺(dg-n2-dmf-cep);和3′-o-dmt-2′-脱氧胸苷-5′-氰乙基-n,n-二异丙基-亚磷酰胺(t-cep)。乙酸酐和n-甲基咪唑用于加帽步骤中;乙基硫代四唑用于激活步骤中;碘用于氧化步骤中;和二氯乙酸用于去封闭步骤中。在十二个分割-和-汇合亚磷酰胺合成循环的各循环后,珠从合成柱除去、汇合、手动混合和按质量分配到四个相等部分中;这些珠等份然后置于单独的合成柱中并与dg、dc、dt或da亚磷酰胺任一反应。这一过程重复12次以得到总共4^12=16,777,216个独特的条码序列。对于所使用的条码标记的珠序列的全部细节。细胞培养物。人293t细胞以及鼠nih/3t3细胞购买。293t和3t3细胞在补充有10%fbs和1%青霉素-链霉素的dmem中生长。细胞生长到30-60%汇合并用tryple处理5min,用相等体积的生长培养基淬灭,并以300xg离心5min。移除上清液,且细胞重悬浮在1ml的1xpbs+0.2%bsa中并以300xg再离心3min。上清液再次移除,且细胞重悬浮在1ml的1xpbs中,经过40-微米细胞筛并计数。对于drop-seq,细胞在1xpbs+200μg/mlbsa中稀释到最终浓度。全视网膜悬浮液的产生。单细胞悬浮液通过采用先前描述的用于从大鼠视网膜纯化视网膜神经节细胞的方法从p14小鼠视网膜制备(barres等,1988)。简言之,小鼠视网膜在木瓜蛋白酶溶液(40u木瓜蛋白酶/10mldpbs)中消化45分钟。木瓜蛋白酶然后在胰蛋白酶抑制剂溶液(dpbs中的0.15%卵类粘蛋白)中中和且组织磨碎以产生单细胞悬浮液。在磨碎后,细胞成团和重悬,且细胞悬浮液通过20μmnitex筛网过滤器过滤以消除任何结块的细胞,并且这一悬浮液然后用于drop-seq。细胞然后在dpbs+0.2%bsa中稀释到200细胞/μl(重复1-6)或30细胞/μl(重复7)。视网膜悬浮液在分开的四天通过drop-seq处理。一个文库在第1天制备(重复1);两个文库在第2天制备(重复2和3);三个文库在第3天制备(重复4-6);和一个文库在第4天制备(重复7,高纯度)。对于重复4-6,人hek细胞以1细胞/μl(0.5%)的浓度掺入,但视网膜数据中宽的细胞大小范围使得不可能使用跨物种比较方法校准单细胞纯度或二联体。七个重复中的每一个单独地测序。drop-seq珠的制备。珠(条码标记的珠seqa或条码标记的珠seqb;表9并参见扩展实验过程末尾的注解)用30ml的100%etoh洗涤两次和用30ml的te/tw(10mmtrisph8.0,1mmedta,0.01%tween)洗涤两次。珠球粒重悬在10mlte/tw中并通过100μm过滤器进入50mlfalcon管中用于在4℃下长期储存。珠的物料浓度(以珠/μl计)使用购自incyto的fuchs-rosenthal细胞计数器评估。对于drop-seq,等份的珠从物料管移出,在500μl的drop-seq裂解缓冲液(dlb,200mmtrisph7.5,6%ficollpm-400,0.2%sarkosyl,20mmedta)中洗涤,然后重悬在适宜体积的dlb+50mmdtt中达到100珠/μl的珠浓度。微滴产生。两种水性悬浮液-单细胞悬浮液和珠悬浮液-加载到含有6.4mm磁力搅拌盘的3ml塑料注射器中。微滴产生油加载到10ml塑料注射器中。三个注射器通过0.38mm内径的聚乙烯管道连接到125μm共流装置(图15a),并使用注射泵对于各水性悬浮液以4.1ml/hr的流率和对于油以14ml/hr的流率注射,从而得到各具有~1纳升体积的~125μm乳液滴。对于生成视频,液流在光学显微镜下以10x放大率可视化并使用fastcamsa5彩色相机以每秒~1000-2000帧成像。微滴收集在50mlfalcon管中;收集管对于每1ml的合并水性流体积更换以降低微滴破碎时溶液中可溶性rna的量。在微滴产生过程中,珠通过连续的、温和的磁力搅拌保持在悬浮液中。微滴大小的均匀性和珠的占据通过在具有亮视野照明的光学显微镜下观察等份的微滴进行评价;在各实验中,超过95%的珠占据微滴仅包含单一珠。微滴破碎。来自各等份微滴的底部的油用p1000移液器移除,之后在室温下添加30ml6xssc。为破碎微滴,申请人添加600μl的全氟-1-辛醇,并用手剧烈地摇动管约20秒。管然后以1000xg离心1分钟。为降低退火的mrna从珠解离的可能性,样品在破碎方案的其余部分中保持在冰上。除去上清液到油-水界面上方大约5ml,且珠用另外30ml的室温6xssc洗涤,水层转移到新管,并再次离心。除去上清液,且珠球粒转移到非粘的1.5ml微量离心管。球粒然后用1ml的室温6xssc洗涤两次和用300μl的5xmaximah-rt缓冲液(ep0751)洗涤一次。反转录和核酸外切酶i处理。向90,000个珠的球粒中,添加200μl的rt混合物,其中rt混合物包含1xmaximart缓冲液,4%ficollpm-400,1mmdntps,1u/μlrnase抑制剂,2.5μm模板_switch_oligo(表9)和10u/μlmaximah-rt。ficoll被包括以减少沉降,且为了其提高rt效率的能力(lareu等,2007)。珠在室温下孵育30分钟,接着在42℃下孵育90分钟。珠然后用1ml1xte+0.5%十二烷基硫酸钠洗涤一次,用1mlte/tw洗涤两次和用10mmtrisph7.5洗涤一次。珠球粒然后重悬在包含1x核酸外切酶i缓冲液和1u/μl核酸外切酶i的200μl的核酸外切酶i混合物中,和在37℃下孵育45分钟。珠然后用1mlte/sds洗涤一次,用1mlte/tw洗涤两次,用1mlddh2o洗涤一次,和重悬在ddh2o中。珠浓度使用fuchs-rosenthal细胞计数器测定。1000个珠的等份使用1xhifihotstartreadymix和0.8μmtemplate_switch_pcr引物在50μl体积中通过pcr扩增(表9)。等份然后如下热循环:95℃3min;然后四个以下循环:98℃下20sec,65℃下45sec,72℃下3min;然后x个以下循环:98℃下20sec,67℃下20sec,72℃下3min;然后5min的最终延伸步骤。对于使用培养的细胞的人-小鼠实验,x是8个循环;对于解离视网膜实验,x是9个循环。等份的对在pcr后汇合在一起和按照制造商的说明用0.6xagencourtampurexp珠纯化,并在10μl的h2o中洗脱。等份按照待测序的stamp数量合并,且池的浓度在bioanalyzerhighsensitivity芯片上定量。用于测序的drop-seqcdna文库的制备。为制备用于测序的3′-末端cdna片段,各样品的四个等份的600pg的edna用作按照制造商的说明进行的标准nexteraxttagmentation反应的输入,除了使用200nm的定制引物p5_tso_hybrid和nextera_n701(表9)替代试剂盒提供的寡核苷酸。样品然后如下扩增:95℃下30sec;11循环的95℃下10sec,55℃下30sec,72℃下30sec;然后72℃下最终延伸步骤5min。4个等份的对合并在一起,且然后使用0.6xagencourtampurexp珠按照制造商的说明纯化和在10μl的水中洗脱。两个10μl等份组合在一起并使用bioanayzerhighsensitivity芯片测定浓度。测序文库的平均大小在450和650bp之间。文库使用3mlht1中的4.67pm和用于阅读片段1启动的3ml的0.3μmread1custseqa或read1custseqb在illuminanextseq上测序(表9和参见扩展实验过程末尾的注解)。阅读片段1是20bp(碱基1-12细胞条码,碱基13-20umi);阅读片段2(配对末端)对于人-小鼠实验是50bp和对于视网膜实验是60bp。物种污染实验。为确定stamp文库的脱离物种的污染的来源(图15e),申请人(1)用浓度100细胞/μl的hek/3t3细胞悬浮混合物精确地如上(对照实验)进行drop-seq;(2)单独地用各自100细胞/μl浓度的hek和3t3细胞进行微流体共流步骤,且然后在破碎之前混合微滴;和(3)单独地使用hek和3t3细胞通过核酸外切酶消化进行stamp产生,然后在pcr扩增之前混合等同数量的stamp。对于三种条件中的每一条件扩增单一的1000微粒等份,然后纯化和在bioanalyzerhighsensitivitydna芯片上定量。600pg的各文库如上所述用于单一nexteratagmentation反应中,除了三个文库中各文库单独地用引物nextera_n701(条件1)、nextera_n702(条件2)或nextera_n703(条件3)条码标记,且总共12个而非11个pcr循环用于nexterapcr中。所得文库在highsensitivitydna芯片上定量,并使用0.5μmread1custseqa作为用于阅读片段1的定制引物以25pm的浓度在miseq上运行。可溶性rna实验。为定量引物退火位点的数量,20,000个珠在室温下2xssc中用10μm的聚腺苷酸化合成的rna(synrna,表9)孵育5min,并用200μl的te-tw洗涤三次,然后重悬在10μl的te-tw中。珠然后在65℃下孵育5分钟,且1μl的上清液取出用于在nanodrop2000上的光谱测量分析。浓度与用相同方式处理的珠比较,除了不添加synrna。为确定珠结合的引物是否能够反转录和测量珠表面上细胞条码序列的均质性,珠用te-tw洗涤,以100/μl的浓度添加到如上所述的反转录酶混合物。这一混合物然后共流到具有1xpbs+0.02%bsa中的200nmsynrna的标准drop-seq120-微米共流装置中。收集微滴并在42℃下孵育30分钟。150μl的50mmedta添加到乳液,接着添加12μl的全氟辛酸以破碎乳液。珠在1mlte-tw中洗涤两次,接着在h2o中洗涤一次,然后重悬在te中。十一个珠在显微镜下手工挑选到包含1xkapahifihotstartpcr主混合物、400nmp7-tso_hybrid和400nmtruseq_f的50μlpcr混合物中(表9)。pcr反应如下循环:98℃下3min;12个以下循环:98℃下20s,70℃下15s,72℃下1min;然后最终72℃孵育5min。所得扩增子在zymodnacleanandconcentrator5柱上纯化,并在bioanalyzerhighsensitivity芯片上运行以估计浓度。扩增子然后稀释到2nm和在illuminamiseq上测序。使用标准illuminatruseq引物启动的阅读片段1是synrna上的20bp分子条码,而用custsynrnaseq启动的阅读片段2包含12bp细胞条码和8bpumi。为估计drop-seq的效率,申请人使用一组外部rna。申请人在1xpbs+1u/μlrnaseinhibitor+200μg/mlbsa(neb)中稀释ercc加标到原液的0.32%,并用其代替drop-seq方案中的细胞流,使得各珠与每纳升微滴~100,000erccmrna分子孵育。序列阅读片段使用人序列作为“诱饵”与双重ercc-人(hg19)基准比对,这与仅ercc基准的比对相比急剧地减少通过star报告的与ercc转录物的低质量比对的数量。标准mrna-seq。为比较drop-seq平均表达数据与标准mrnaseq数据,申请人使用来自3t3细胞的1.815ug的纯化rna,申请人也从3t3细胞制备和测序550个stamp。rna按照制造商的说明在truseqstrandedmrna样品制备试剂盒中使用。对于nextseq500测序,0.72pm的drop-seq文库与0.48pm的mrnaseq文库组合。溶液中模板转换扩增。为比较drop-seq平均表达数据与通过标准的溶液中模板转换扩增方法制备的mrnaseq文库,来自3t3细胞的5ng纯化rna在2.75μl的h2o中稀释,申请人也是从3t3细胞制备和测序550个stamp。向rna添加1μl的10μmumi_smartdt引物(表9)并加热到72℃,接着在4℃下孵育1min,之后申请人添加2μl20%ficollpm-400,2μl5xrt缓冲液(maximah-试剂盒),lμl10mmdntps,0.5μl50μmtemplate_switch_oligo(表9)和0.5μlmaximah-rt。rt在42℃下孵育90分钟,接着在85℃下热灭活5min。添加rnase混合物(0.5μlrnasei,epicentren6901k和0.5μlrnaseh)以从模板转换寡聚物除去末端ribog,且样品在37℃下孵育30min。然后添加0.4μl的mtemplate_switch_pcr引物以及25μl2xkapahifi超混合物和13.6μlh2o。样品如下循环:95℃3min;14个以下循环:98℃20s,67℃20s和72℃3min;然后72℃5min。样品按照制造商的说明用0.6ampurexp珠纯化,并在10μl中洗脱。600pg的扩增cdna用作nexteraxt反应中的输入。0.6pm的文库在nextseq500上测序,与三个其它样品复用;read1custseqb用于启动阅读片段1。微滴数字pcr(ddpcr)实验。为量化drop-seq的效率,以如drop-seq中的相同方式制备的50,000个hek细胞成团且rna使用qiagenrneasypluskit按照制造商的实验方案纯化。洗脱的rna在含有rt-ddpcr超混合物和基因引物-探针组的rt-ddpcr反应中稀释到1细胞当量/微升的最终浓度。微滴使用bioradddpcr微滴产生系统产生,且用制造商推荐的实验方案热循环,和微滴荧光在bioradqx100微滴阅读仪上分析。rna的浓度和置信区间通过bioradquantasoft软件计算。50,000个hek细胞的三个重复平行地纯化,且各重复中各基因的浓度独立地测量两次。使用的探针是:actb(hs01060665_gl)、b2m(hs00984230_ml)、ccnb1(mm03053893)、eef2(hs00157330_ml)、eno1(hs00361415_ml)、gapdh(hs02758991_gl)、psmb4(hs01123843_gl)、top2a(hs01032137_ml)、ybx3(hs01124964_ml)和ywhah(hs00607046_ml)。为估计drop-seq的rna杂交效率,人脑总rna在20μl的体积中稀释到40ng/μl并与以2,000个珠/μl的浓度在drop-seq裂解缓冲液(dlb,组成如下显示)中重悬的20μl条码标记的引物珠组合。溶液伴随旋转孵育15分钟,然后离心和上清液转移到新鲜管。珠用100μl的6xssc洗涤3次,重悬在50μlh2o中并加热到72℃5min以从珠洗脱掉rna。洗脱步骤重复一次且合并洗脱液。杂交的所有步骤(rna输入、杂交上清液、三次洗涤和组合洗脱)使用qiagenrneasyplusminikit按照制造商的说明单独地纯化。洗脱液的各个稀释用于具有actb或gapdh的引物和探针的rt-ddpcr反应中。fluidigmc1实验。c1实验如前所述进行(shalek等,2014)。简言之,3t3和hek细胞的悬浮液按照制造商的推荐用钙黄绿素紫和钙黄绿素橙(lifetechnologies)染色,稀释到250,000细胞/ml的浓度,并1∶1混合。这种细胞混合物然后加载到来自fluidigm的两个中等c1细胞捕获芯片,且在加载后,捕获的细胞使用dapi和tritc荧光可视化和鉴定。亮视野图像用于鉴定具有>1个细胞的端口(总共12个从使用的两个c1芯片鉴定,来自总共192中)。在c1-介导的全转录组扩增后,文库使用nexteraxt(illumina)制备,并以2.2pm加载到nextseq500上。进行单阅读片段测序(60bp)以模拟dropseq中的阅读片段结构,且阅读片段按照以下所述比对。阅读片段比对和数字表达数据的产生。原始序列数据首先过滤以除去所有具有小于10的条码碱基质量的阅读片段对。第二阅读片段(50或60bp)然后在5′末端修剪以除去任何tso接头序列,和在3′末端修剪以除去长度6或更长的聚a尾,然后使用starv2.4.0a以默认设置与小鼠(mm10)基因组(视网膜实验)或组合小鼠(mm10)-人(hg19)mega-基准比对。唯一地映射的阅读片段通过细胞条码分组。为数字地计数基因转录物,组装各细胞内各基因的umi列表,且ed=1内的umi合并到一起。独特umi序列的总数进行计数,且这一数字对于给定细胞报告为该基因的转录物数。为区分由stamp产生的细胞条码而非与从未暴露于细胞溶解产物的珠对应的那些,申请人按照每细胞条码的转录物总数对数字表达矩阵排序,并对于各个相继较小的细胞条码对矩阵中所有转录物的累积分数作图。经验上,申请人的数据总是在接近估计的扩增stamp数的细胞条码数处显示“弯曲点”(图14b)。大于这一截止值的所有细胞条码用于下游分析中,而其余细胞条码丢弃。hek和3t3细胞的细胞周期分析。反映hela细胞周期的五个阶段(g1/s、s、g2/m、m和m/g1)的基因集从whitfield等(whitfield等,2002)获取(表3),并通过检验各基因的表达谱与相应基因集中所有基因的平均表达谱之间的相关性和排除具有低相关性(r<0.3)的基因来优化。这一步骤除去鉴定为在hela细胞中阶段特异性的但在申请人的单细胞数据中不与该阶段相关的基因。各优化基因集中的其余基因是高度相关的(未显示)。申请人然后平均各基因集中基因的标准化表达水平(1og2(tpm+1))以限定各细胞的阶段特异性的评分。这些评分然后经历两个标准化步骤。第一,对于各阶段,评分集中(centered)并除以其标准差。第二,各细胞的标准化评分集中和标准化。为按照其沿细胞周期的进展对细胞排序,申请人首先将各细胞的阶段特异性的评分的模式与沿细胞周期的八个潜在模式比较:仅g1/s、g1/s和s两者、仅s、仅g2/m、g2/m和m、仅m、仅m/g1、m/g1和g1。申请人也对所有阶段的相等评分添加第九模式(全部活性的或全部非活性的)。各模式简单地对于活性程序定义为1的向量和对于非活性程序定义为零。申请人然后基于阶段特异性的评分与这些潜在模式的最大相关性将细胞分类到限定的模式。重要的是,没有细胞分类到相等活性的第九模式,而多个细胞分类到其它模式中的各个模式。为进一步对各种类中的细胞排序,申请人基于其与在前和后继的模式的相对相关性对细胞分类,从而使种类之间的过渡平滑(图10a)。为鉴定细胞周期调控基因,申请人使用以上定义的细胞周期排序和具有100个细胞的窗口大小的滑动窗方法。申请人确定了对于各基因具有最大平均表达和最小平均表达的窗口和使用两样本t-检验以对于最大和最小窗口之间的差异分配初始p-值。相似分析在打乱细胞的顺序后进行以产生可用于评估错误发现率(fdr)的对照p-值。具体地,申请人对于各潜在p-值阈值检验在排序的细胞周期中和在分配fdr的随机排序分析中多少基因通过该阈值。如果基因包括在细胞周期go/kegg/reactome基因集中或在在同步复制细胞中最近的全基因组基因表达研究中报告,则该基因定义为之前已知是细胞周期调控的(bar-joseph等,2008)。视网膜数据的非监督降维和聚类分析。p14小鼠视网膜悬浮液在分开的四天的七个不同重复中通过drop-seq处理,且各自单独地测序。原始数字表达度量对于七个测序轮产生。各样品重复的拐点(细胞数)如下:6,600、9,000、6,120、7,650、7,650、8280和4000。全部49,300个细胞在单一矩阵中合并在一起,并首先通过将umi数除以每细胞的umi总数然后乘以10,000标准化。所有计算和数据然后在对数空间(即ln(转录物-per-10,000+1))中进行。初始下采样和高可变基因的鉴定。视杆光感受器占视网膜细胞群体的60-70%。此外,它们显著小于其它视网膜细胞类型(carter-dawson和lavail,1979),且结果在申请人的单细胞数据中产生显著更少的基因(和更高水平的噪音)。在申请人的初步计算实验中,对完全数据集进行非监督降维导致由众多视杆细胞亚集内的噪音变异主导的表现;这损害了申请人解析频率上相对较小的其它细胞类型(例如,无长突细胞,小神经胶质细胞)内的异质性的能力。因此,为提高非监督降维技术对于发现这些类型的能力,申请人首先对49,300-细胞数据集下采样以提取单细胞文库,其中检测900个或更多的基因,从而得到13,155-细胞的“训练集”。申请人推论,这一“训练集”以“噪音的”视杆细胞为代价富集尺寸较大的稀有细胞类型。其余的36,145细胞(以下称“投影集”)然后直接嵌入到从训练集学习的低维表示上(参见以下)。这使得我们能够利用申请人的数据的完全统计能力来定义和注释细胞类型。申请人首先在平均表达和变异性之间关系的控制后鉴定在整个训练集中最多变的基因的集合。申请人计算了所有13,155个单细胞中各基因的平均值和分散度测量(方差/平均值),并基于其平均表达将基因置于20个单元中。在各单元中,申请人然后使单元中所有基因的分散度测量z-标准化以鉴定其表达值甚至在与具有相似平均表达的基因相比时高度可变的离群基因。申请人使用1.7的z-评分截止值以鉴定384个显著多变的基因,其如预期的,由对于不同视网膜细胞类型的标志物组成。主成分分析。申请人在沿各基因对数据换算和集中后,使用r中的prcomp函数,如之前所述对申请人的训练集运行主成分分析(pca)(shalek等,2013)。申请人仅使用之前鉴定的“高度多变”基因作为pca的输入以确保数据中的初级结构的稳定鉴定。尽管返回的主成分的数目等于谱型分析的细胞的数目,但仅这些成分的一小部分解释了统计学显著比例的方差,如与空模型相比的。申请人使用两种方法来鉴定统计学显著的pc用于进一步分析:(1)申请人进行数据的10000个独立随机化以使得在各次实现中,沿放大的表达矩阵的每行(基因)的值随机排列。这一操作使基因间的成对相关性随机化而同时保持每一基因的表达分布不变。对这10000个“随机化”数据集中的每一个进行pca。未排列数据中的显著pc鉴定为与10000个随机化数据集中的最高本征值相比具有较大本征值的那些(p<0.01,bonferroni校正的)。(2)申请人改进了由chung和storey(chung和storey,2014)提出的且申请人之前将其应用于单细胞rna-seq数据(shalek等,2014)的随机化方法(“挑棒(jackstraw)”)。简言之,申请人对输入数据进行1,000个pca,但在各分析中,申请人随机地“打乱”1%的基因以对于每个基因经验地估计评分的零分布。申请人使用联合空标准(joint-nullcriterion)(leek和storey,2011)来鉴定具有显著不同于相应零分布的基因评分的pc(p<0.01,bonferroni校正的)。(1)和(2)两者都产生32个“显著的”pc。目视检查确认这些pc中没有一个主要由线粒体、管家或血红蛋白基因驱动。如预期的,不同视网膜细胞类型的标志物在沿这些pc具有最大评分的基因(+ve和-ve)中是高度代表的(表5)。其余细胞的t-sne表现和事后投影。因为不同视网膜细胞类型的规范标志物沿显著pc强表现(图17),申请人推理,训练集中沿主特征向量的单个细胞的载荷(也就是“pc子空间表现”)可以用于分离出数据中的不同细胞类型。申请人注意到,这些载荷利用了来自pca中的384个基因的信息,且因此对于技术噪音比单个基因的单细胞测量更稳定。申请人使用这些pc载荷作为t-distributedstochasticneighborembedding(tsne)(vandermaaten和hinton,2008)的输入,如在r中的tsne软件包中以设定为30的“复杂度”参数实施的。t-sne过程返回单细胞的二维嵌入。在申请人的变量集内具有相似的基因表达特征且因此相似的pc载荷的细胞很可能在嵌入中彼此靠近地定位,且因此不同的细胞类型应当在tsne图上形成二维点云。在鉴定和注释簇之前,申请人通过以下过程投影剩余的36,145个细胞(投影集)到训练集的tsne图上:(1)申请人将这些细胞投影到由从训练集鉴定的显著pc限定的子空间上。简言之,申请人集中和换算对应于投影集的384x36,145表达矩阵,从而仅考虑高度可变的基因;训练集的换算参数用于对各行进行集中和换算。申请人然后将这一换算的表达矩阵的转置阵乘以从训练集pca学习的384x32基因评分矩阵。这产生沿在训练集上学习的32个显著pc对投影集中的细胞的pc“载荷”。(2)基于其pc载荷,投影集中的细胞使用与原始tsne算法一致的数学框架独立地嵌入到先前引入的训练集的tsne图上(shekhar等,2014)。申请人注意到,尽管这一方法未发现从训练集鉴定的簇以外的新簇,但它通过利用全数据集的统计能力加强了不同簇的区分。此外,细胞基于其它pc特征而非原始基因表达值投影,这使得申请人的方法针对单个基因测量中的技术噪音更稳定。完整细节参见以下章节“投影集嵌入到tsne图上”。关于这一“事后投影方法”的一个潜在问题是完全不存在于训练集的细胞类型可能不合逻辑地投影到定义的簇之一中的可能性。申请人在对照数据集上测试投影算法以研究这一可能性,并设置严格条件以确保仅在训练集内充分代表的细胞类型被投影以避免不合逻辑的分配(参见“‘样本外’投影测试”)。使用这一方法,投影集中97%的细胞成功地嵌入,产生由49300个测序细胞中的48296个组成的tsne图(表10)。作为申请人的方法的另外的验证,注意到在全数据聚类(参见以下)后鉴定的不同细胞类型的相对频率密切匹配文献中的估计值(表1)。除了视杆细胞以外,所有其它细胞类型在训练集中与其全数据频率相比以2.3x的中位值富集。这强烈地表明申请人的下采样方法实际上以视杆细胞为代价提高了其它的细胞类型的表现,从而使得我们能够发现限定这些细胞的pc。密度聚类以鉴定细胞类型。为在tsne图上自动地鉴定推定的细胞类型,申请人使用了在dbscanr软件包中实施的密度聚类方法(ester等,1996),设定可达距离参数(eps)为1.9,和除去少于50个细胞的簇。大多数除去的细胞包括位于较大簇的界面之间的单态细胞(singletoncell)。作为这些步骤的结果,申请人能够分配44808个细胞(数据的91%)到49个簇中。申请人接着检查总共49个簇以确保鉴定的簇真实地代表不同的细胞类别,如不是过度分配(over-partitioning)。申请人进行事后检验,其中申请人搜索每个簇对之间差异表达的基因(mcdavid等,2013)(需要至少10个基因,以bonferroni校正的p<0.01,各自具有簇间大于1的自然对数值的平均表达差异)。申请人重复地合并不满足这一标准的簇对,从而用两个最相关的对(最低的差异表达的基因数)开始。这一过程得到10个合并的簇,留下39个剩余的。申请人然后对于39个剩余簇中的每个计算平均基因表达,并使用这一数据作为全联分层聚类和系统树图组装的输入计算所有对之间的euclidean距离。申请人然后使用似然比检验(mcdavid等,2013)将39个簇中的各簇与剩余的细胞进行比较以鉴定在该簇中差异表达的标志物基因。投影集嵌入到tsne图上。申请人使用shekhar等(shekhar等,2014)和berman等(berman等,2014)中的计算方法以将新细胞投影到现有tsne图上。首先,细胞的表达向量被简化以仅包括高度可变基因的集合,且随后使用训练集中基因表达的平均值和标准差沿各基因集中和换算。这一换算的表达向量z(维度1x384)乘以基因s(维度384x32)的评分矩阵以获得其沿显著pcu(维度1x32)的“载荷”。因此,u′=z′.s。u(维度1x32)表示从训练集鉴定的pc子空间中新细胞的表现。申请人注意到此处的一致点在于对从训练集获得的细胞的换算表达向量z进行以上点积恢复其正确子空间表现u,如应当如此的情况。已知训练集中细胞的pc载荷{ui}(i=1,2,...ntrain)及它们的tsne坐标{yi}(i=1,2,...ntrain),现在的任务是基于其载荷向量u’发现新细胞的tsne坐标y’。如在原始tsne框架(vandermaaten和hinton,2008)中,申请人通过计算一组转移概率“定位”新细胞在相对于训练集中的细胞的子空间中,此处,d(.,.)代表euclidean距离,且带宽σu通过简单的二分检索来选择以约束与p(u′|ui)相关的香农熵至log2(30),其中30相当于训练集的tsne嵌入中使用的复杂性参数的值。注意σu’对于各细胞独立地选择。低维嵌入中相应的转移概率集如下基于student’st-分布定义,其中y’是未知的新细胞的坐标。申请人通过最小化p(u′|ui)和q(y′|yi)之间的kullback-leibler散度来计算这些,这是关于其自变数的非凸目标函数,且使用nelder-mead单纯型算法最小化,如在matlab函数fminsearch中实施的。这一过程可以在投影集的所有细胞上并行。关于实施的一些注解,1.由于这是事后投影,且p(u′|ui)仅是其中总是约束于总和1的配对相似性的相对量度,申请人想避免新细胞通过其与一个或两个训练细胞的高相对相似性(“短路”)嵌入到tsne图上的可能性。换句话说,申请人选择投影仅从在训练集中由至少一些细胞良好代表的pc子空间的区域得出的那些细胞。因此,申请人仅在p(u′|ui)>pthres对于训练集中的至少nmin个细胞为真(pthres=5×10-3,nmin=10)时保留细胞u’用于投影。申请人通过对其中投影集已知完全不同于训练集的情况测试投影算法来校准pthres和nmin的值以确保这类细胞主要地通过这一限制排除。(参见章节“‘样本外’投影测试”)2.对于通过部分1中的限制的细胞,tsne坐标的初始值y’0设定为,即,具有设定为pc子空间表示中的配对相似性的权重的训练集的tsne坐标的加权平均。3.当至少kl散度可以在最多的迭代次数内发现时,满足1中的条件的细胞被称为是“成功地投影”到位置y’*。但是,由于该程序是非凸的且保证仅发现局部极小,申请人想要研究是否可以发现更好的极小值。简言之,申请人均匀地采样来自以y’*为中心的25x25网格的点以检查其中kl-散度的值在其y’*处的值或更低的5%内的点。无论何时这一条件被满足(<2%),申请人通过设定新的点作为初始值来重新运行该优化。“样本外”投影测试。为测试事后投影方法,申请人进行其中tsne图上39个不同簇中的各簇从tsne图综合地“移除”,且然后使用以上概述的过程逐细胞地投影到其余簇的tsne图上的以下计算实验。仅来自训练集的细胞用于这些计算中。假定申请人的簇区分是正确的,在这39个实验的各实验中,重新投影的簇代表“样本外”细胞类型。因此成功地将这些细胞分配到其余38个簇之一中是假性的。对于移除和重新投影的39个簇中的各簇,申请人基于投影方法的结果将细胞分类到三个组中,(1)在前一章节中不满足条件1(即与至少nmin个训练细胞不具有高相对相似性)且因此“不能”投影的细胞。(2)成功地分配tsne坐标y’,但根据以下条件不能分配到任何现有簇中的细胞。(3)成功地分配tsne坐标y’,且其“错误地分配”到现有簇之一的细胞。如果和仅当y’和质心之间的距离小于簇半径(最远点距质心的距离)时,细胞分配到其质心最靠近y’的簇。鼓舞人心地,对于所有39个“样本外”投影实验,仅一小部分的细胞不合逻辑地分配到一个簇,即以参数pthres=5×10-3和nmin=10满足以上(3)(表10)。这提供了申请人的投影集的事后嵌入不会将不同的细胞类型不合逻辑地分配到现有簇之一中的信心。视网膜数据和下采样分析。为产生图11f中显示的500-细胞和2000-细胞下采样的tsne图,细胞从高纯度重复(重复7)随机采样,并用作pca和tsne的输入。500-细胞tsne使用5.5的可达距离参数(eps)聚类,而2000-细胞tsne使用3.0的eps值聚类。除去未聚类的细胞。为产生9,431-细胞下采样tsne图,10,000个细胞从全数据集随机采样,且表达超过900个基因的转录物的细胞用于主成分分析和tsne中;其余(较小)细胞投影到tsne嵌入上,并使用2.0的eps值聚类,得到具有9,431个细胞的图。免疫组织化学。野生型c57小鼠或mito-p小鼠,其在ngng无长突细胞和1型双极细胞中表达cfp(kay等,2011),通过腹膜内注射戊巴比妥处死。眼睛在冰上pbs中的4%pfa中固定1小时,接着进行视网膜解剖和后固定另外30min,然后用pbs清洗。视网膜冷冻并在低温箱中以20μm切片。切片用一抗(鸡抗-gfp[abcam]或兔抗-ppp1r17[atlas])在4℃下孵育过夜,并用二抗(invitrogenandjacksonimmunoresearch)在室温下孵育2hr。切片然后使用fluoromountg(southernbiotech)封片和用olympusfvb共焦显微镜观看。关于珠表面引物和定制测序引物的注解。在本文的实验的过程中,申请人使用两个批次的珠,其具有两种略微不同的序列(条码标记的珠seqa和条码标记的珠seqb,表9)。条码标记的珠seqa用于人-小鼠实验中及在视网膜实验的重复1-3中。重复4-7用条码标记的珠seqb进行。为对于使用条码标记的珠seqa珠产生的drop-seq文库启动阅读片段1,使用read1custseqa;为对于使用条码标记的珠seqb珠产生的drop-seq文库启动阅读片段2,使用read1custseqb。chemgenes计划制造携带条码标记的珠seqb序列的大量珠。这些珠应当用于read1custseqb。关于drop-seq实施的额外注解细胞和珠浓度。申请人的实验已经证明drop-seq中使用的细胞浓度具有与所得文库的纯度和二联体率的强的线性关系(图9a、9b和14d)。细胞浓度也线性地影响通量:当细胞以100细胞/ul的最终浓度使用时,每小时可以处理~10,000个单细胞文库,且当细胞以12.5细胞/ul的最终浓度使用时,可以处理~1,200个单细胞文库。通量和纯度之间的权衡很可能不同地影响使用者,取决于所探询的特定科学问题。目前,对于标准实验,申请人使用50细胞/ul的最终浓度(其耐受小百分比的二联体和细胞污染物),以能够在几个小时的时程中容易地和可靠地处理10,000个细胞。如以上推荐的,申请人当前愿意以120/ul的浓度加载珠(微滴中的最终浓度=60/ul),这按照经验产生<5%的珠二联体率。drop-seq启动成本。实施drop-seq所需的设备的主要部件是三个注射泵(kdlegato100泵,每个标价~$2,000)、标准倒置显微镜(moticae31,标价~$1,900)和磁力搅拌器(v&pscientific,#710d2,标价~$1,200)。快速相机(用于实时监测微滴产生)对于绝大多数使用者不是必要的(微滴质量可以容易地通过直接地将3ul的微滴置于具有17ul微滴产生油的fuchs-rosenthal血细胞计数器中以稀释微滴成单一焦点平面来监测)。实施例4:实施例2和3的表格表1.小鼠视网膜中通过drop-seq的细胞类型和频率的确认。从drop-seq产生的39个注释的细胞簇的大小用于估计其总细胞群体的分数。这些数据与通过显微技术获得的那些数据相比较(jeon等,1998)。表1.umi之间的编辑距离关系。对于图3g中的数据。各细胞条码中检测的各ercc基因的umi的序列以1的编辑距离折叠,仅包括置换(左栏)或具有置换和插入/删除两者(右栏)。对照umi集使用在所有基因/细胞上随机采样的相等数量的umi对于各基因制备。对于各种条件所折叠的原始umi的百分比报告在表中。表2.在从人(hek)单细胞表达数据计算的前5个主成分的每一个中表现的前100个基因。表3.用于图4中的分析的细胞周期各阶段的基因。表4.从589个hek和412个3t3细胞的分析鉴定的细胞周期调控基因的列表。表5.来自44,808个视网膜stamp的前40个主成分各自的最高基因载荷的列表。表6.在39个视网膜细胞簇的各细胞簇中差异表达的基因。表7.39个视网膜细胞簇的各配对组合之间的差异基因表达。表8.drop-seq的成本分析。表9.用于制备drop-seq文库的寡核苷酸序列。“b”指示除“a”外的任何碱基,“j”指示分割-和-汇合合成轮;“n”指示简并碱基。“*”指示硫代磷酸酯键。所有可溶性引物购自integrateddnatechnologies,并通过标准脱盐纯化,除了通过离子交换hplc纯化的template_switch_oligo之外。表10.“样本外”投影测试。对于各簇,“训练”细胞从tsne图移除和然后投影到tsne上。对成功地投影到嵌入中的细胞的数目和不适当地并入到不同簇中的细胞的数目制表。参考文献andersen,b.b.,korbo,l.和pakkenberg,b.(1992).aquantitativestudyofthehumancerebellumwithunbiasedstereologicaltechniques.thejournalofcomparativeneurology326,549-560.bar-joseph,z.,siegfried,z.,brandeis,m.,brors,b.,lu,y.,eils,r.,dynlacht,b.d.和simon,i.(2008).genome-widetranscriptionalanalysisofthehumancellcycleidentifiesgenesdifferentiallyregulatedinnormalandcancercells.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica105,955-960.barres,b.a.,silverstein,b.e.,corey,d.p.和chun,l.l.(1988).immunological,morphological,andelectrophysiologicalvariationamongretinalganglioncellspurifiedbypanning.neuron1,791-803.beer,n.r.,wheeler,e.k.,lee-houghton,l.,watkins,n.,nasarabadi,s.,hebert,n.,leung,p.,arnold,d.w.,bailey,c.g.和colston,b.w.(2008).on-chipsingle-copyreal-timereverse-transcriptionpcrinisolatedpicoliterdroplets.analyticalchemistry80,1854-1858.berman,g.j.,choi,d.m.,bialek,w.和shaevitz,j.w.(2014).mappingthestereotypedbehaviouroffreelymovingfruitflies.journaloftheroyalsociety,interface/theroyalsociety11.brennecke,p.,anders,s.,kim,j.k.,kolodziejczyk,a.a.,zhang,x.,proserpio,v.,baying,b.,benes,v.,teichmann,s.a.,marioni,j.c.,etal.(2013).accountingfortechnicalnoiseinsingle-cellrna-seqexperiments.naturemethods10.1093-1095.bringer,m.r.,gerdts,c.j.,song,h.,tice,j.d.和ismagilov,r.f.(2004).microfluidicsystemsforchemicalkineticsthatrelyonchaoticmixingindroplets.philosophicaltransactionsseriesa,mathematical,physical,andengineeringsciences362,1087-1104.britten,r.j.和kohne,d.e.(1968).repeatedsequencesindna.hundredsofthousandsofcopiesofdnasequenceshavebeenincorporatedintothegenomesofhigherorganisms.science161,529-540.brouzes,e.,medkova,m.,savenelli,n.,marran,d.,twardowski,m.,hutchison,j.b.,rothberg,j.m.,link,d.r.,perrimon,n.和samuels,m.l.(2009).dropletmicrofluidictechnologyforsingle-cellhigh-throughputscreening.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica106,14195-14200.buettner,f.,natarajan,k.n.,casale,f.p.,proserpio,v.,scialdone,a.,theis,f.j.,teichmann,s.a.,marioni,j.c.和stegle,o.(2015).computationalanalysisofcell-to-cellheterogeneityinsingle-cellrna-sequencingdatarevealshiddensubpopulationsofcells.naturebiotechnology33,155-160.carter-dawson,l.d.和lavail,m.m.(1979).rodsandconesinthemouseretina.i.structuralanalysisusinglightandelectronmicroscopy.thejournalofcomparativeneurology188,245-262.cheong,h.k.,hwang,e.和cheong,c.(2012).rapidpreparationofrnasamplesusingdna-affinitychromatographyanddnazymemethods.methodsinmolecularbiology941,113-121.chung,n.c.和storey,j.d.(2014).statisticalsignificanceofvariablesdrivingsystematicvariationinhigh-dimensionaldata.bioinformatics.corbo,j.c.,myers,c.a.,lawrence,k.a.,jadhav,a.p.和cepko,c.l.(2007).atypologyofphotoreceptorgeneexpressionpatternsinthemouse.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica104,12069-12074.descamps,f.j.,martens,e.,proost,p.,starckx,s.,vandensteen,p.e.,vandamme,j.和opdenakker,g.(2005).gelatinaseb/matrixmetalloproteinase-9provokescataractbycleavinglensbetablcrystallin.fasebjournal:officialpublicationofthefederationofamericansocietiesforexperimentalbiology19,29-35.dobin,a.,davis,c.a.,schlesinger,f.,drenkow,j.,zaleski,c.,jha,s.,batut,p.,chaisson,m.和gingeras,t.r.(2013).star:ultrafastuniversalrna-seqaligner.bioinformatics29,15-21.ester,m.,kriegel,h.p.,sander,j.和xu,x.(1996).adensity-basedalgorithmfordiscoveringclustersinlargespatialdatabaseswithnoise.(menlopark,calif.:aaaipress).famiglietti,e.v.和sundquist,s.j.(2010).developmentofexcitatoryandinhibitoryneurotransmittersintransitorycholinergicneurons,starburstamacrinecells,andgabaergicamacrinecellsofrabbitretina,withimplicationsforprevisualandvisualdevelopmentofretinalganglioncells.visualneuroscience27,19-42.feigenspan,a.,teubner,b.,willecke,k.和weiler,r.(2001).expressionofneuronalconnexin36inaiiamacrinecellsofthemammalianretina.thejournalofneuroscience:theofficialjournalofthesocietyforneuroscience21,230-239.grun,d.,kester,l.和vanoudenaarden,a.(2014).validationofnoisemodelsforsingle-celltranscriptomics.naturemethods11,637-640.guo,m.t.,rotem,a.,heyman,j.a.和weitz,d.a.(2012).dropletmicrofluidicsforhigh-throughputbiologicalassays.labonachip12,2146-2155.hashimshony,t.,wagner,f.,sher,n.和yanai,i.(2012).cel-seq:single-cellrna-seqbymultiplexedlinearamplification.cellreports2,666-673.hattar,s.,liao,h.w.,takao,m.,berson,d.m.和yau,k.w.(2002).melanopsin-containingretinalganglioncells:architecture,projections,andintrinsicphotosensitivity.science295,1065-1070.haverkamp,s.和wassle,h.(2004).characterizationofanamacrinecelltypeofthemammalianretinaimmunoreactiveforvesicularglutamatetransporter3.thejournalofcomparativeneurology468,251-263.hindson,b.j.,ness,k.d.,masquelier,d.a.,belgrader,p.,heredia,n.j.,makarewicz,a.j.,bright,i.j.,lucero,m.y.,hiddessen,a.l.,legler,t.c.等(2011).high-throughputdropletdigitalpcrsystemforabsolutequantitationofdnacopynumber.analyticalchemistry83,8604-8610.hoon,m.,okawa,h.,dellasantina,l.和wong,r.o.(2014).functionalarchitectureoftheretina:developmentanddisease.progressinretinalandeyeresearch42,44-84.islam,s.,kjallquist,u.,moliner,a.,zajac,p.,fan,j.b.,lonnerberg,p.和linnarsson,s.(2012).highlymultiplexedandstrand-specificsingle-cellrna5′endsequencing.natureprotocols7,813-828.islam,s.,zeisel,a.,joost,s.,lamanno,g.,zajac,p.,kasper,m.,lonnerberg,p.和linnarsson,s.(2014).quantitativesingle-cellrna-seqwith独特分子标识s.naturemethods11,163-166.jaitin,d.a.,kenigsberg,e.,keren-shaul,h.,elefant,n.,paul,f.,zaretsky,i.,mildner,a.,cohen,n.,jung,s.,tanay,a.等(2014).massivelyparallelsingle-cellrna-seqformarker-freedecompositionoftissuesintocelltypes.science343,776-779.jarosz,d.f.,brown,j.c.,walker,g.a.,datta,m.s.,ung,w.l.,lancaster,a.k.,rotem,a.,chang,a.,newby,g.a.,weitz,d.a.等(2014).cross-kingdomchemicalcommunicationdrivesaheritable,mutuallybeneficialprion-basedtransformationofmetabolism.cell158,1083-1093.jeon,c.j.,strettoi,e.和masland,r.h.(1998).themajorcellpopulationsofthemouseretina.thejournalofneuroscience:theofficialjournalofthesocietyforneuroscience18,8936-8946.kadonaga,j.t.(1991).purificationofsequence-specificbindingproteinsbydnaaffinitychromatography.methodsinenzymology208,10-23.kay,j.n.,voinescu,p.e.,chu,m.w.和sanes,j.r.(2011).neurod6expressiondefinesnewretinalamacrinecellsubtypesandregulatestheirfate.natureneuroscience14,965-972.kharchenko,p.v.,silberstein,l.和scadden,d.t.(2014).bayesianapproachtosingle-celldifferentialexpressionabalysis.naturemethods11,740-742.kivioja,t.,vaharautio,a.,karlsson,k.,bonke,m.,enge,m.,linnarsson,s.和taipale,j.(2012).countingabsolutenumbersofmoleculesusinguniquemolecularidentifiers.naturemethods9,72-74.kurimoto,k.,yabuta,y.,ohinata,y.,ono,y.,uno,k.d.,yamada,r.g.,ueda,h.r.和saitou,m.(2006).animprovedsingle-cellcdnaamplificationmethodforefficienthigh-densityoligonucleotidemicroarrayanalysis.nucleicacidsresearch34,e42.lareu,r.r.,harve,k.s.和raghunath,m.(2007).emulatingacrowdedintracellularenvironmentinvitrodramaticallyimprovesrt-pcrperformance.biochemicalandbiophysicalresearchcommunications363,171-177.leek,j.t.和storey,j.d.(2011).thejointnullcriterionformultiplehypothesistests.applicationsingeneticsandmolecularbiology10,1-22.luo,l.,callaway,e.m.和svoboda,k.(2008).geneticdissectionofneuralcircuits.neuron57,634-660.mao,c.a.,li,h.,zhang,z.,kiyama,t.,panda,s.,hattar,s.,ribelayga,c.p.,mills,s.l.和wang,s.w.(2014).t-boxtranscriptionregulatortbr2isessentialfortheformationandmaintenanceofopn4/melanopsin-expressingintrinsicallyphotosensitiveretinalganglioncells.thejournalofneuroscience:theofficialjournalofthesocietyforneuroscience34,13083-13095.masland,r.h.(2012).theneuronalorganizationoftheretina.neuron76,266-280.masland,r.h.和sanes,j.r.(2015).retinalganglioncelltypes:currentstatesandlessonsforthebrain.annrevneurosciinpress.mazutis,l.,gilbert,j.,ung,w.l.,weitz,d.a.,griffiths,a.d.和heyman,j.a.(2013).single-cellanalysisandsortingusingdroplet-basedmicrofluidics.natureprotocols8,870-891.mccarroll,s.a.,feng,g.和hyman,s.e.(2014).genome-scaleneurogenetics:methodologyandmeaning.natureneuroscienee17,756-763.mcdavid,a.,finak,g.,chattopadyay,p.k.,dominguez,m.,lamoreaux,l.,ma,s.s.,roederer,m.和gottardo,r.(2013).dataexploration,qualitycontrolandtestinginsingle-cellqpcr-basedgeneexpressionexperiments.bioinformatics29,461-467.mcdonald,j.c.,duffy,d.c.,anderson,j.r.,chiu,d.t.,wu,h.,schueller,o.j.和whitesides,g.m.(2000).fabricationofmicrofluidicsystemsinpoly(dimethylsiloxane).electrophoresis21,27-40.mills,s.l.,o′brien,j.j.,li,w.,o′brien,j.和massey,s.c.(2001).rodpathwaysinthemammalianretinauseconnexin36.thejournalofcomparativeneurology436,336-350.peres-neto,p.r.,jackson,d.a.和somers,k.m.(2005).howmanyprincipalcomponents?stoppingrulesfordeterminingthenumberofnon-trivialaxesrevisited.computationalstatisticsanddataanalysis49,974-997.petillainterneuronnomenclature,g.,ascoli,g.a.,alonso-nanclares,l.,anderson,s.a.,barrionuevo,g.,benavides-piccione,r.,burkhalter,a.,buzsaki,g.,cauli,b.,defelipe,j.等(2008).petillaterminology:nomenclatureoffeaturesofgabaergicinterneuronsofthecerebralcortex.naturereviewsneuroscience9,557-568.picelli,s.,bjorklund,a.k.,faridani,o.r.,sagasser,s.,winberg,g.和sandberg,r.(2013).smart-seq2forsensitivefull-lengthtranscriptomeprofilinginsinglecells.naturemethods10,1096-1098.pollen,a.a.,nowakowski,t.j.,shuga,j.,wang,x.,leyrat,a.a.,lui,j.h.,li,n.,szpankowski,l.,fowler,b.,chen,p.等(2014).low-coveragesingle-cellmrnasequencingrevealscellularheterogeneityandactivatedsignalingpathwaysindevelopingcerebralcortex.naturebiotechnology.provis,j.m.,diaz,c.m.和penfold,p.l.(1996).microgliainhumanretina:aheterogeneouspopulationwithdistinctontogenies.perspectivesondevelopmentalneurobiology3,213-222.roberts,m.r.,srinivas,m.,forrest,d.,morrealedeescobar,g.和reh,t.a.(2006).makingthegradient:thyroidhormoneregulatesconeopsinexpressioninthedevelopingmouseretina.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica103,6218-6223.sanes,j.r.和zipursky,s.l.(2010).designprinciplesofinsectandvertebratevisualsystems.neuron66,15-36.shalek,a.k.,satija,r.,adiconis,x.,gertner,r.s.,gaublomme,j.t.,raychowdhury,r.,schwartz,s.,yosef,n.,malboeuf,c.,lu,d.等(2013).single-celltranscriptomicsrevealsbimodalityinexpressionandsplicinginimmunecells.nature498,236-240.shalek,a.k.,satija,r.,shuga,j.,trombetta,j.j.,gennert,d.,lu,d.,chen,p.,gertner,r.s.,gaublomme,j.t.,yosef,n.等(2014).single-cellrna-seqrevealsdynamicparacrinecontrolofcellularvariation.nature510,363-369.shekhar,k.,brodin,p.,davis,m.m.和chakraborty,a.k.(2014).automaticclassificationofcellularexpressionbynonlinearstochasticembedding(accense).proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica111,202-207.siegert,s.,cabuy,e.,scherf,b.g.,kohler,h.,panda,s.,le,y.z.,fehling,h.j.,gaidatzis,d.,stadler,m.b.和roska,b.(2012).transcriptionalcodeanddiseasemapforadultretinalcelltypes.natureneuroscience15,487-495,s481-482.srivastava,s.c.,pandey,d.,srivastava,n.p.和bajpai,s.p.(2008).rnasynthesis:phosphoramiditesforrnasynthesisinthereversedirection.highlyefficientsynthesisandapplicationtoconvenientintroductionofligands,chromophoresandmodificationsofsyntheticrnaatthe3′-end.nucleicacidssymposiumseries,103-104.starckx,s.,vandensteen,p.e.,verbeek,r.,vannoort,j.m.和opdenakker,g.(2003).anovelrationaleforinhibitionofgelatinasebinmultiplesclerosis:mmp-9destroysalphab-crystallinandgeneratesapromiscuoustcellepitope.journalofneuroimmunology141,47-57.szel,a.,lukats,a.,fekete,t.,szepessy,z.和rohlich,p.(2000).photoreceptordistributionintheretinasofsubprimatemammals.journaloftheopticalsocietyofamericaa,optics,imagescience,andvision17,568-579.tang,f.,barbacioru,c.,wang,y.,nordman,e.,lee,c.,xu,n.,wang,x.,bodeau,j.,tuch,b.b.,siddiqui,a.等(2009).mrna-seqwhole-transcriptomeanalysisofasinglecell.naturemethods6,377-382.thorsen,t.,roberts,r.w.,arnold,f.h.和quake,s.r.(2001).dynamicpatternformationinavesicle-generatingmicrofluidicdevice.physicalreviewletters86,4163-4166.umbanhowar,p.b.p.,v.;weitz,d.a.(2000).monodisperseemulsiongenerationviadropbreakoffinacoflowingstream.langmuir16,347-351.utada,a.s.,fernandez-nieves,a.,stone,h.a.和weitz,d.a.(2007).drippingtojettingtransitionsincoflowingliquidstreams.physicalreviewletters99,094502.vandermaaten,l.和hinton,g.(2008).visualizingdatausingt-sne.journalofmachinelearningresearch9,2579-2605.vogelstein,b.和kinzler,k.w.(1999).digitalpcr.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica96,9236-9241.wetmur,j.g.和davidson,n.(1968).kineticsofrenaturationofdna.journalofmolecularbiology31,349-370.white,a.k.,vaninsberghe,m.,petriv,o.i.,hamidi,m.,sikorski,d.,marra,m.a.,piret,j.,aparicio,s.和hansen,c.l.(2011).high-throughputmicrofluidicsingle-cellrt-qpcr.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica108,13999-14004.whitfield,m.l.,sherlock,g.,saldanha,a.j.,murray,j.i.,ball,c.a.,alexander,k.e.,matese,j.c.,perou,c.m.,hurt,m.m.,brown,p.o.等(2002).identificationofgenesperiodicallyexpressedinthehumancellcycleandtheirexpressionintumors.molecularbiologyofthecell13,1977-2000.yang,y.和cvekl,a.(2005).tissue-specificregulationofthemousealphaa-crystallingeneinlensviarecruitmentofpax6andc-maftoitspromoter.journalofmolecularbiology351,453-469.zhu,y.y.,machleder,e.m.,chenchik,a.,li,r.和siebert,p.d.(2001).reversetranscriptasetemplateswitching:asmartapproachforfull-lengthcdnalibraryconstruction.biotechniques30,892-897.***虽然详细描述了本发明的优选实施方式,但应理解通过上述段落限定的本发明不限于以上说明中给出的特定细节,因为其许多明显的变化是可能的而不脱离本发明的精神或范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1