使用样品拆分和DNA标签进行稀有细胞分析的制作方法

文档序号:14468246阅读:136来源:国知局
使用样品拆分和DNA标签进行稀有细胞分析的制作方法
交叉参考本申请是基于中国专利申请第200780030309.3号的分案申请。本申请要求保护2006年6月14日申请的美国临时申请号60/804,819和2006年7月28日申请的美国临时申请号60/820,778的权益,该申请在此引入作为参考。发明背景分析特定细胞可以洞察多种疾病。这些分析可为检测、诊断和预后例如癌症或胎儿异常的疾病提供非侵入性检查,从而消除侵入性诊断的风险。关于胎儿异常,现有的产前诊断,例如羊膜穿刺术和绒毛膜绒毛取样(cvs),可能对母亲和胎儿造成伤害。经历羊膜穿刺术的孕妇的流产率增加0.5-1%,而对于cvs,该数值还要稍高一些。由于羊膜穿刺术和cvs引起的特有风险,所以这些方法主要用于孕育先天性缺陷儿的统计学概率较高的高龄妇女,比如35岁以上的妇女。因此,35岁的孕妇就不得不在羊膜穿刺术诱发流产的0.5-1%平均风险与小于0.3%的年龄相关的21三体性概率之间权衡。关于产前诊断,已经开发出一些非侵入性方法来筛选特异性先天缺陷风险较高的胎儿。例如,产妇血清甲胎蛋白,以及未缀合的雌三醇和人绒毛膜促性腺激素的水平,可用于鉴定患唐氏综合征的胎儿的比例。然而,这些检测出现许多假阳性。类似地,超声波检查法用于确定先天性缺陷,包括神经管缺陷和四肢异常,但这些方法只限于15周妊娠期之后的时间段,且提供的结果不可靠。孕妇血液中存在的胎儿细胞为开发替代羊膜穿刺术并由此消除现今的侵入性诊断风险的产前诊断提供了机会。然而,相对于血液中大量母体细胞的背景,胎儿细胞仅占少数,这使得分析既耗时又易出错。对于癌症诊断,早期检测极为重要。癌症是以不受控的异常细胞增殖为标志的疾病。在正常组织中,细胞发生分裂在周围细胞信号作用下在组织中组织化。癌细胞不以相同的方式响应这些信号,使得它们发生增殖,在许多器官中形成肿瘤。随着肿瘤持续生长,遗传改变可以累积,表现为更具侵袭性的癌细胞生长表型。如果放任不治疗,则可能接着发生转移—癌细胞通过淋巴系统或血流扩散至机体的远方区域。转移导致在多个部位形成继发性肿瘤,伤害健康组织。大部分癌症死亡都是由这些继发性肿瘤引起的。尽管癌症诊断和治疗已发展了几十年,但许多癌症仍然是直到晚期才能检测到。作为一个实例,最早期的肺癌是无症状的,不能及时检测到而进行药物治疗,导致肺癌患者大体上5年的生存率低于15%。然而,在早期检测到肺癌并治疗的情况下,预后有利得多。本发明的方法使得在胎儿细胞与母体细胞群混合时,即便在细胞混合体中母体细胞占主要时,也可以检测胎儿细胞和胎儿异常。另外,本发明的方法还可以用于检测或诊断癌症。发明概述本发明涉及检测混合样品中的胎儿细胞或癌细胞的方法。在一个实施方案中,本发明提供在含有与母体细胞群混合的胎儿细胞的样品中测定胎儿异常的方法。在某些实施方案中,测定胎儿细胞和胎儿异常的存在情况包括用不同标记来标记含有至少一个胎儿细胞的混合样品中的每个细胞的基因组dna的一个或多个区,其中每个标记对每个细胞都是特异性的。在某些实施方案中,待标记的基因组dna包含一种或多种多态性,尤其是str或snp。在某些实施方案中,本发明的方法使得在胎儿细胞与母体细胞群混合时,即便母体细胞在混合物中占优势时,也可以同时检测胎儿细胞和胎儿异常的存在情况。在某些实施方案中,富集样品,以包含至少一个胎儿细胞和一个非胎儿细胞,在其它实施方案中,富集群的细胞可分配在两个或更多个可用作可寻址部位的离散位置。可寻址部位的实施例包括孔(wells)、区(bins)、筛、小孔(pore)、几何位点、载玻片、基质、膜、电阱(electrictraps)、间隙、障碍物或细胞膜或核膜原位。在某些实施方案中,所述方法包括用不同标记来标记富集样品中的每个细胞的基因组dna的一个或多个区,其中每个标记对每个细胞都是特异性的,并定量标记的dna区。标记方法可包括在混合样品中加入每个细胞的独有标签序列。在某些实施方案中,独有的标签序列鉴定混合样品的每个细胞中是否存在dna多态性。使用可通过pcr方法进行的扩增反应将标记加至细胞/dna。例如,扩增可通过多重pcr实现。在某些实施方案中,使用基因组dna区的嵌套引物进行进一步的pcr扩增。在某些实施方案中,dna区可在定量前扩增。标记的dna可以使用测序方法定量,测序方法在某些实施方案中可在扩增dna区之前。扩增的dna区可通过测序方法分析。例如,超深测序可用于为每个str或snp提供精确定量的等位基因丰度检测。在其它实施方案中,定量基因分型可用于显示胎儿细胞的存在情况及确定胎儿染色体的拷贝数。优选地,定量基因分型使用分子倒置探针进行。本发明还涉及对含非母体基因组dna的混合样品进行细胞鉴定并鉴定具有非母体基因组dna的细胞为胎儿细胞的方法。在某些实施方案中,对由混合样品鉴定出的胎儿细胞比较母体对父体等位基因的比率。在一个实施方案中,本发明提供测定母体样品中的胎儿异常的方法,所述母体样品含有至少一个胎儿细胞和一个非胎儿细胞。可富集样品,以包含至少一个胎儿细胞,并可将富集的母体样品阵列入大量离散位置中。在某些实施方案中,每个离散位置都含有不超过一个细胞。在某些实施方案中,本发明包括使用对每个dna区或位置特异性的引物标记阵列样品的一个或多个基因组dna区,扩增dna区,并定量标记的dna区。dna区的标记可以包括用独特的标签序列标记每个区,所述标签序列可用于鉴定阵列细胞是否存在dna多态性和细胞的不同位置。测定步骤可包括鉴定不同位置的非母体等位基因,这可由比较该位置的母体对父体等位基因的比率产生。在某些实施方案中,鉴定阵列样品中的胎儿异常的方法可进一步包括扩增基因组dna区。基因组dna区可以包含一种或多种多态性,例如str和snp,其可使用包括多重pcr的pcr法扩增。附加扩增步骤可以使用嵌套引物进行。扩增的dna区可通过测序方法分析。例如,超深测序可用于为每个str或snp提供精确定量的等位基因丰度检测。在其它实施方案中,定量基因分型可用于表明胎儿细胞的存在情况,并确定胎儿染色体的拷贝数。优选地,定量基因分型使用分子倒置探针进行。在一个实施方案中,本发明提供如下诊断癌症并给出预后的方法:由患者获得血样并富集血样的上皮细胞,将富集的样品拆分(splitting)至离散位置,并对富集并拆分的样品进行一种或多种分子和/或形态学分析。分子分析可以包括检测在图10中公开的基因的表达水平或突变。优选地,所述方法包括对每个阵列细胞中的egfr、epcam、ga733-2、muc-1、her-2或紧密连接蛋白(claudin)-7进行分子分析。形态学分析可以包括鉴定、定量和/或表征线粒体dna、端粒酶或核基质蛋白。在某些实施方案中,可富集样品的上皮细胞达至少10,000倍,并可以在治疗癌症患者之前提供诊断和预后。优选地,血样以定期间隔得自患者,例如每日1次,或每2、3或4天1次、每周1次、每半个月1次、每月1次、每半年1次或每年1次。在某些实施方案中,富集患者血样的上皮细胞的步骤包括使样品流经第一障碍物阵列,该阵列将大于预定尺寸的细胞选择性地导向第一出口,将小于预定尺寸的细胞选择性地导向第二出口。可选地,可通过使样品流经第二障碍物阵列对样品进行进一步的富集,该阵列可用选择性结合白细胞或上皮细胞的抗体包被。例如,第二阵列的障碍物可以用抗epcam抗体包被。拆分富集群的细胞样品可以包括拆分富集样品,以将单个细胞定位在可为可寻址部位的离散位置。可寻址部位的实例包括孔、区、筛、小孔、几何位点、载玻片、基质、膜、电阱、间隙、障碍物或细胞膜或核膜原位。在某些实施方案中,提供含有富集样品的装置以及进行遗传分析所需要的装置和试剂的试剂盒。该试剂盒可含有基于尺寸分离的阵列、用于独有地标记细胞的试剂、将细胞拆分至单独的可寻址部位中的装置和用于遗传分析的试剂。在非限制性的多个方面,本申请提供了以下示例性实施方案:1.一种用于胎儿诊断的方法,包括:使用适于区分各个细胞的标记标记由母体血样富集的胎儿和非胎儿细胞中的一个或多个基因组dna区,并通过分析所述标记的基因组dna区确定是否存在胎儿异常。2.一种用于胎儿诊断的方法,包括:使用适于区分各个细胞的标记标记由胎儿细胞和非胎儿细胞产生的一个或多个cdna序列,其中所述胎儿细胞和非胎儿细胞由母体血样富集,并通过分析所述标记的cdna区确定是否存在胎儿异常。3.实施方案1的方法,进一步包括拆分所述胎儿细胞和非胎儿细胞,使得各个细胞处于可寻址的部位。4.实施方案2的方法,进一步包括拆分所述胎儿细胞和非胎儿细胞,使得各个细胞处于可寻址的部位。5.实施方案3的方法,进一步包括由每个细胞扩增所述一个或多个基因组dna区,以产生大量扩增子。6.实施方案5的方法,进一步包括合并所述扩增子。7.实施方案5的方法,其中所述基因组dna的区域包含一种或多种多态性。8.实施方案7的方法,其中所述多态性为str或snp。9.实施方案5的方法,其中所述扩增通过多重pcr进行。10.实施方案9的方法,其中所述扩增还包括嵌套pcr。11.实施方案3的方法,其中所述标记各自包含对每个可寻址部位特异性的独有标签序列。12.实施方案1或2的方法,其中所述标记包含长度介于4-20bp之间的、对每个细胞独有的核酸序列。13.实施方案1的方法,其中标记目标染色体上的至少两个基因组dna区。14.实施方案1的方法,其中所述基因组dna区位于两个或更多个目标染色体上。15.实施方案1或2的方法,其中所述分析包括进行超深测序或定量基因分型。16.实施方案1或2的方法,其中所述胎儿异常包括选自以下的异倍性:13三体性、18三体性、21三体性(唐氏综合征)、克兰费尔特综合征(xxy)、单体性、三倍性、四倍性或其它不规则数量的性染色体或常染色体,及其组合。17.实施方案1或2的方法,其中所述胎儿异常包含母体或父体来源的异倍性。18.实施方案1或2的方法,其中胎儿异常为节段异倍性。19.实施方案15的方法,其中所述定量基因分型使用分子倒置探针技术进行。20.一种用于胎儿诊断的方法,包括:由一个或多个自母体血液富集的胎儿细胞扩增大量基因组dna区;其中产生的扩增子包含细胞特异性标记,并通过分析所述扩增子确定是否存在胎儿异常。21.一种用于胎儿诊断的方法,包括:扩增由一个或多个自母体血液富集的胎儿细胞产生的大量cdna序列;其中产生的扩增子包含细胞特异性标记,并通过分析所述扩增子确定是否存在胎儿异常。22.实施方案20或21的方法,进一步包括拆分所述一个或多个胎儿细胞,使得每个各个细胞都处于可寻址的部位。23.实施方案20或21的方法,进一步包括合并所述扩增子。24.实施方案20或21的方法,其中所述基因组dna区包含一种或多种多态性。25.实施方案24的方法,其中所述多态性为str或snp。26.实施方案20或21的方法,其中所述扩增通过下列方法进行:多重pcr、单重pcr、定量pcr、定量荧光pcr(qf-pcr)、多重荧光pcr(mf-pcr)、实时pcr(rt-pcr)、单细胞pcr、限制片段长度多态性pcr(pcr-rflp)、pcr-rflp/rt-pcr-rflp、热启动pcr、原位polononypcr、原位滚环扩增(rca)、桥接pcr、微微量滴定板pcr、乳液pcr、连接酶链式反应(lcr)、转录扩增、自主序列复制、靶多核苷酸序列的选择扩增、共有序列引物聚合酶链式反应(cp-pcr)、随机引物聚合酶链式反应(ap-pcr)、简并寡核苷酸引物pcr(dop-pcr)、mda和基于核酸的序列扩增(nabsa)。27.实施方案26的方法,其中所述扩增还包括嵌套pcr。28.实施方案20或21的方法,其中所述标记每个均含有对每个可寻址部位特异性的独有标签序列。29.实施方案20或21的方法,其中所述标记含有对每个细胞独有的、长度介于4-20bp之间的核酸序列。30.实施方案20的方法,其中标记目标染色体上至少两个基因组dna区。31.实施方案20的方法,其中所述基因组dna区位于两个或更多个目标染色体上。32.实施方案20或21的方法,其中所述分析包括进行超深测序或定量基因分型。33.实施方案20或21的方法,其中所述胎儿异常包含的异倍性选自:13三体性、18三体性、21三体性(唐氏综合征)、克兰费尔特综合征(xxy)、其它不规则数量的性染色体或常染色体,及其组合。34.实施方案20或21的方法,其中所述胎儿异常包含的异倍性是母体或父体来源的。35.实施方案20或21的方法,其中胎儿异常为节段异倍性。36.实施方案32的方法,其中所述定量基因分型使用分子倒置探针技术进行。37.含有用于分析大量扩增子的逻辑的计算机可读介质,所述扩增子来自由母体血液富集的至少一个胎儿细胞和至少一个母体细胞的一个或多个染色体上的一个或多个基因组dna区。38.含有用于分析大量扩增子的逻辑的计算机可读介质,所述扩增子来自由母体血液富集的至少一个胎儿细胞和至少一个母体细胞产生的一个或多个cdna序列。39.实施方案37或39的计算机可读介质,其中所述逻辑分析母体对胎儿染色体拷贝数的比率。40.实施方案37或39的方法,其中所述扩增子含有独特的标签序列。41.实施方案37或39的方法,其中所述扩增子包含一种或多种多态性。42.实施方案41的方法,其中所述多态性为str或snp。43.实施方案37的方法,其中所述大量扩增子来自目标染色体上的至少两个基因组dna区。44.实施方案37的方法,其中所述大量扩增子来自位于两个或更多个目标染色体上的基因组dna区。45.实施方案37或39的方法,其中所述大量扩增子含有至少6,000个扩增子。46.实施方案1、2、20或21的方法,所述方法进一步包括分区所述富集细胞的至少一部分。47.实施方案46的方法,其中所述分区使用选自以下的平台进行:微量滴定板、pcr孔、纳流化系统、微囊化及其组合。48.实施方案46的方法,其中所述分区使用连续稀释进行。49.实施方案46的方法,进一步包括在所述分区之前负选择非靶细胞或正选择靶细胞。50.实施方案46的方法,其中所述分区使用低于100的区数进行。51.实施方案46的方法,其中所述分区使用大于100的区数进行。52.实施方案50的方法,其中分析所述分区的至少一种胎儿细胞的存在情况。53.实施方案51的方法,其中分析所述分区的至少一种胎儿细胞的存在情况。54.实施方案52的方法,其中所述分析使用选自以下的分析方法进行:fish、胎儿生物标记标记、snp检测、pcr和str检测。附图概述图1a-1d图解了基于尺寸的分离模块的多个实施方案。图2a-2c图解阐述了亲和分离模块的一个实施方案。图3图解了磁分离模块的一个实施方案。图4图解了诊断、预后或监测胎儿的出生前状况的纵览。图5图解了诊断、预后或监测胎儿的出生前状况的纵览。图6图解了诊断、预后或监测患者癌症的纵览。图7a-7b图解了使用分子倒置探针的测定,图7b为对500个孔中的每个孔进行的40路mip测定。图7c图解了使用核酸标签的纵览。图8a-8c图解了样品拆分装置(asamplesplittingapparatus)的一个实例。图9图解了将2个以上的ctc加载至单个样品孔中的的概率。图10图解了其表达或突变可能与本文诊断的癌症或另一种病症相关的基因。图11图解了可用于本文方法的引物。图12a-b图解了产物和废物级分的细胞涂片。图13a-f图解了分离的胎儿细胞,其通过可信的雄细胞存在而证实。图14图解了具有异常21三体病理的细胞。图15图解了基于尺寸的分离模块的性能。图16图解了由基于尺寸的分离模块产生的这些细胞级分的柱形图。图17图解了基于尺寸的分离模块的第一出口和第二出口。图18图解了结合包被抗epcam的障碍物阵列的捕获模块的上皮细胞。图19a-c图解了一个基于流通尺寸的分离模块的实施方案,及可用于该装置的备选参数,所述分离模块适于由血液中分离上皮细胞。图20a-d图解了多个被靶向的细胞亚群和多个截留尺寸,所述亚群可使用基于尺寸的分离来分离,所述截留尺寸可用于分离这些被靶向的亚群。图21图解了本发明的装置和确定富集样品中的细胞数的计数方法。图22图解了用于诊断、预后或监测患者癌症的本发明的一个方面的纵览。图23图解了egfrmrna产生测序模板的应用。图24图解了进行实时定量等位基因特异性pcr反应,以证实megfrmrna中的突变序列。图25表明,当突变等位基因探针的信号超过荧光背景水平时,证实存在突变。图26a-b图解了在上皮细胞中存在egfrmrna,但在白细胞中不存在egfrmrna。图27图解了第一个和第二个egfrpcr反应的结果。图28a-b图解了第一个和第二个egfrpcr反应的结果。图29表明,易于检测egfr野生型和突变体扩增片段,尽管白细胞背景高。图30图解了通过qpcr检测单个拷贝的胎儿细胞基因组。图31图解了通过snp分析检测分区样品(binnedsamples)中的单个胎儿细胞。图32图解了三体性测试方法。21三体筛选基于得自母体血液的靶细胞计数。血液使用用于血红蛋白富集的细胞分离模块(csm-he)处理。将富集细胞转移至载玻片,首先对载玻片染色,随后通过fish探测。例如由亮视野或荧光显微镜获取图像,并计数。某些类型的三体性细胞的比例用作胎儿21三体风险的分类器。胎儿基因组鉴定可以使用诸如以下的测定进行:(1)str标记;(2)使用针对基因座(例如y-染色体上的多次重复的dyz基因座)的引物和探针的qpcr;(3)snp检测;和(4)cgh(比较基因组杂交)阵列检测。图33图解了可产生有关靶细胞中异倍性和其它遗传疾病的存在情况的信息的测定。有关靶细胞中异倍性和其它遗传疾病的信息可以使用诸如以下的技术获得:(1)建立用于染色体计数的cgh阵列,其可用于异倍性测定和/或染色体内缺失检测;(2)snp/taqman测定,其可用于检测单核苷酸多态性;和(3)超深测序,其可用于产生部分或完整的基因组序列用于分析。图34图解了胎儿诊断测定的方法。胎儿细胞通过由血液csm-he富集靶细胞而分离。胎儿细胞的认定可使用包括fish染色(使用载玻片或膜和可选的自动化检测器)、facs和/或分区(binning)的技术证实。分区可以包括将富集细胞分配在板(例如96孔或384孔板)中的各孔间、细胞在于乳液中分离的液滴中微囊化或通过将细胞导入纳流化区的微阵列中。然后使用下列方法鉴定胎儿细胞:可包括使用生物标记(例如胎儿(γ)血红蛋白)、可检测胎儿基因组dna的等位基因特异性snp组、检测差异表达的母体和胎儿转录物(例如affymetrix芯片)或针对胎儿特定基因座(例如在y-染色体上的多次重复的dyz基因座)的引物和探针。然后可使用诸如cgh阵列检测、超深测序(例如solexa、454或质谱)、str分析或snp检测的技术分析含有胎儿细胞的分区部位(binningsites)的异倍性和/或其它遗传缺陷。图35图解了胎儿诊断测定方法,该方法进一步包括在异倍性和/或其它遗传缺陷分析之前进行完整基因组扩增的步骤。通过引用结合在本说明书中提及的所有出版物和专利申请都在此引入作为参考,其程度如同每个单独的出版物或专利申请被明确地且单独地指出引入作为参考一样。发明详述本发明提供在混合分析物或细胞群样品(例如母体外周血样)中检测稀有分析物或细胞的存在情况或异常的系统、装置和方法,所述稀有分析物或细胞例如为造血骨髓祖细胞、内皮细胞、胎儿细胞、上皮细胞或循环肿瘤细胞。i.样品收集/制备含有稀有细胞的样品可得自需要诊断或预后的任何动物,或者得自需要诊断或预后的怀有胎儿的怀孕动物。在一个实施例中,样品可以得自怀疑怀孕、怀孕或已怀孕的动物,以检测胎儿或胎儿异常的存在情况。在另一个实施例中,样品得自怀疑患有、患有或曾经患有疾病或病症(例如癌症)的动物。所述病症可被诊断、预后、监测,并可基于本文的方法和系统确定疗法。本发明的动物可以为人或驯养动物,例如母牛、鸡、猪、马、兔、狗、猫或山羊。来源于动物或人的样品可以包括例如全血、汗、眼泪、耳流出物、痰、淋巴、骨髓悬浮液、淋巴、尿、唾液、精液、阴道流出物、脑脊髓液、脑液、腹水、奶、呼吸道分泌物、肠道液或泌尿生殖道液。为获得血样,可以使用本领域已知的任何技术,例如注射器或其它真空抽吸装置。血样可选地在富集前预处理或加工。预处理步骤的实例包括加入诸如以下的试剂:稳定剂、防腐剂、固定剂(fixant)、裂解剂、稀释剂、抗凋亡剂、抗凝剂、抗血栓形成剂、磁性调节剂、缓冲剂、重量克分子渗透浓度调剂、ph调节剂和/或交联剂。当获得血样时,经常在富集前将防腐剂如抗凝剂和/或稳定剂加入样品中。这使得可以延长分析/检测的时间。因此,可以按照本文的任何方法和系统,在距离获得样品的时间1周、6天、5天、4天、3天、2天、1天、12小时、6小时、3小时、2小时或1小时内富集和/或分析样品,如血样。在某些实施方案中,血样可以与选择性裂解血样中的一种或多种细胞或组分的物质混合。例如,当将包含胎儿细胞的血样与去离子水混合时,可以选择性裂解胎儿细胞,释放其细胞核。这样的选择性裂解允许随后使用例如基于尺寸或亲和性的分离来富集胎儿细胞核。在另一个实施例中,选择性裂解血小板和/或无核红细胞,产生富含有核细胞的样品,所述有核细胞例如为胎儿有核红细胞(fnrbc)、母体有核红细胞(mnbc)、上皮细胞和循环肿瘤细胞。随后可利用例如抗原-i亲和性或血红蛋白差异将fnrbc与mnbc分离。在由动物获得样品(例如血样)时,样品量可以根据动物大小、其妊娠期和待筛选的病症改变。在某些实施方案中,获得至多50、40、30、20、10、9、8、7、6、5、4、3、2或1ml样品。在某些实施方案中,获得1-50、2-40、3-30或4-20ml样品。在某些实施方案中,获得超过5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100ml的样品。为检测胎儿异常,血样可以得自妊娠期36、24、22、20、18、16、14、12、10、8、6或4周的怀孕的动物或人。ii.富集可以使用本领域已知的(例如guetta,em等,stemcelldev,13(1):93-9(2004))或本文描述的一种或多种任何方法富集样品(例如血样)的稀有分析物或稀有细胞(例如胎儿细胞、上皮细胞或循环肿瘤细胞)。富集增加了样品中稀有细胞的浓度或稀有细胞对非稀有细胞的比率。例如,富集可以将目标分析物(例如胎儿细胞或上皮细胞或ctc)的浓度增加达其在原始样品中的浓度的至少2、4、6、8、10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、50,000,000、100,000,000、200,000,000、500,000,000、1,000,000,000、2,000,000,000或5,000,000,000倍。具体地说,当由母体外周静脉血样富集胎儿细胞时,胎儿细胞的初始浓度可为约1:50,000,000,其可增加至至少1:5,000或1:500。富集还可以增加以稀有细胞量/总样品量(除去液体)计的稀有细胞浓度。可以浓缩含有目标稀有组分的大于10、15、20、50或100ml总体积的流体样品(例如血样),使得目标稀有组分成为低于0.5、1、2、3、5或10ml总体积的浓缩溶液。富集可以使用一类或多类分离模块发生。本文描述了几种不同模块,它们全部都可以在流体学上彼此串联耦合,用以增强性能。在某些实施方案中,富集通过如上所述的选择性裂解发生。在一个实施方案中,使用一个或多个基于尺寸的分离模块进行稀有细胞富集。基于尺寸的分离模块的实例包括过滤模块、筛、基质等。本发明设想的基于尺寸的分离模块的实例包括在国际公布号wo2004/113877中公开的那些。其它基于尺寸的分离模块公开于国际公布号wo2004/0144651。在某些实施方案中,基于尺寸的分离模块包含一个或多个障碍物阵列,形成间隙网络。配置障碍物,在颗粒流经阵列/间隙网络时基于颗粒的流体动力学尺寸将颗粒导向不同方向或出口。例如,在血样流经障碍物阵列时,有核细胞或流体动力学尺寸大于预定的某些大小(例如截留尺寸或预定尺寸,例如8μm)的细胞被由流体流动进口导向位于障碍物阵列对侧的第一出口,而无核细胞或流体动力学尺寸小于预定尺寸(例如8μm)的细胞被由流体流动进口导向也位于障碍物阵列对侧的第二出口。可通过调节间隙、障碍物和每个连续行障碍物之间的周期中的偏移的尺寸配置阵列,以便分离小于或大于预定尺寸的细胞。例如,在某些实施方案中,障碍物或障碍物之间的间隙可至多长10、20、50、70、100、120、150、170或200μm,或者长约2、4、6、8或10μm。在某些实施方案中,用于基于尺寸分离的阵列包括100、500、1,000、5,000、10,000、50,000或100,000个以上的障碍物,它们排列成10、20、50、100、200、500或1000多行。优选地,第一行障碍物中的障碍物偏离前(上游)行障碍物达前行障碍物周期的至多50%。在某些实施方案中,第一行障碍物中的障碍物偏离前行障碍物达前行障碍物周期的至多45%、40%、35%、30%、25%、20%、15%或10%。而且,第一行障碍物和第二行障碍物之间的距离可至多为10、20、50、70、100、120、150、170或200μm。具体的偏移可以为连续的(重复多行)或非连续的。在某些实施方案中,分离模块包括多个独立的障碍物阵列,它们在流体学上耦合,使得它们彼此串联。每个障碍物阵列都具有连续偏移。但每个随后(下游)的障碍物阵列所具有的偏移都不同于之前(上游)的偏移。优选地,每个随后的障碍物阵列所具有的偏离都小于之前的障碍物阵列。这允许在细胞移经障碍物阵列时在分离过程中进行细分。因此,大量阵列可在流体学上串联或并联耦合,(例如2、4、6、8、10、20、30、40、50个以上)。在流体学上并联耦合的分离模块(例如阵列)允许高通量分析样品,使得每小时至少1、2、5、10、20、50、100、200或500ml流经富集模块,或者每小时100、500、1000或5000万个细胞被分拣或流经该装置。图1a图解了基于尺寸的分离模块的实例。障碍物(其可以为任何形状)与平面基质耦合,形成间隙阵列。可使用透明盖或罩覆盖该阵列。障碍物构成二维阵列,每个连续行相对于前一行障碍物平移,其中障碍物阵列将流体动力学尺寸小于预定尺寸的组分导向第一方向,将流体动力学尺寸大于预定尺寸的组分导向第二方向。为由无核细胞富集上皮细胞或循环肿瘤细胞,可以得到6-12μm或6-8μm的预定尺寸的障碍物阵列。为了由混合样品(例如母体血样)富集胎儿细胞,预定尺寸的障碍物阵列可介于4-10μm或6-8μm之间。就阵列视线而论,可以小角度(流通角)定位样品向障碍物阵列的流动。可选地,阵列与灌输泵偶联,以经由障碍物灌注样品。本文所述的基于尺寸的分离模块的流动条件使得细胞以最小损伤被阵列分拣。这使得可更有效和可靠地进行完整细胞和完整细胞核的下游分析。在某些实施方案中,基于尺寸的分离模块包含障碍物阵列,该阵列经配置引导大于预定尺寸的细胞在阵列中沿着视线迁移(例如向第一出口或通向第一出口的旁路通道),同时引导小于预定尺寸的细胞和分析物以和较大细胞不同的方向经障碍物阵列迁移(例如向第二出口)。这样的实施方案部分图解于图1b-1d。可利用多种富集方案,但需要温和操作细胞,以降低对细胞或其dna的任何机械损伤。该温和操作还保存样品中的少量胎儿细胞或稀有细胞。待评价核酸的完整性是重要特征,允许区分样品中胎儿细胞或稀有细胞和其它细胞的基因组材料。具体地说,使用障碍物阵列富集和分离胎儿细胞或稀有细胞产生温和处理,其使细胞损伤最小,使核酸完整性最大,可提供非同一般的分离水平,以及随后利用多种形式非常精确地分析以极低量存在于样品中的细胞基因组的能力。在某些实施方案中,使用一个或多个捕获模块进行稀有细胞(例如胎儿细胞、上皮细胞或循环肿瘤细胞(ctc))富集,所述捕获模块选择性抑制一种或多种目标细胞的活动性。优选的捕获模块在流体学上耦合在基于尺寸的分离模块的下游。捕获模块可以包括具有多个障碍物的基质,所述障碍物限制大于预定尺寸的细胞或分析物移动。基于尺寸抑制细胞迁移的捕获模块的实例公开于美国专利号5,837,115和6,692,952。在某些实施方案中,捕获模块包括二维障碍物阵列,其选择性过滤或捕获流体动力学尺寸大于特定间隙尺寸(预定尺寸)的细胞或分析物,国际公布号wo2004/113877。在某些情况下,捕获模块基于其亲和性捕获分析物(例如目标细胞或非目标细胞)。例如,可捕获细胞或分析物的基于亲和性的分离模块可以包括要不是以下事实会适于使样品流通的障碍物阵列:障碍物被选择性结合一种或多种目标(例如红细胞、胎儿细胞、上皮细胞或有核细胞)分析物(例如细胞群)或非目标(例如白细胞)分析物的结合部分覆盖。适于通过捕获分离的障碍物阵列可包括具有一种或多种形状的障碍物,并可以均一或非均一的顺序排列。在某些实施方案中,二维障碍物阵列交错,使得随后的每行障碍物偏离前行障碍物,以增加待分拣(分离)的分析物和障碍物之间的相互作用数。与障碍物偶联的结合部分可以包括例如蛋白(例如配体/受体)、在保留的分析物中具有互补对应物的核酸、抗体等。在某些实施方案中,基于亲和性的分离模块包含二维障碍物阵列,其被选自以下的一种或多种抗体覆盖:抗-cd71、抗-cd235a、抗-cd36、抗-碳水化合物、抗-选择素、抗-cd45、抗-gpa、抗-抗原-i、抗-epcam、抗-e-钙粘素和抗-muc-1。图2a图解了第一个分析物通过柱阵列的路径,其中不特异性结合某个柱的分析物通过阵列一直迁移,而确实结合某个柱的分析物被阵列捕获。图2b是包被抗体的柱的图片。图2c图解了抗体与本发明设想的基质(例如障碍物、侧壁等)的偶联。这些基于亲和性的分离模块的实例描述于国际公布号wo2004/029221。在某些实施方案中,捕获模块利用磁场,基于在此目标分析物或非目标分析物中的磁性或磁位,分离和/或富集一种或多种分析物(细胞)。例如,可通过将血红蛋白脱氧为高铁血红蛋白,将在生理状态下稍微反磁性(被磁场排斥)的红细胞变成顺磁的(被磁场吸引)。该磁性可通过物理或化学处理红细胞实现。因此,含有一个或多个红细胞和一个或多个白细胞的样品可如下被富集红细胞:首先诱导红细胞中的磁性,然后使样品通过磁场(均一的或非均一的)分离红细胞和白细胞。例如,母体血样可首先流经基于尺寸的分离模块,以基于尺寸除去无核细胞和细胞组分(例如流体动力学尺寸小于6μm的分析物)。随后,用试剂如co2、n2或nano2处理富集的有核细胞(例如流体动力学尺寸大于6μm的分析物)、白细胞和有核红细胞,所述试剂改变红细胞的血红蛋白的磁性。然后使处理的样品流经磁场(例如耦合外部磁体的柱),使得顺磁分析物(例如红细胞)被磁场捕获,而白细胞和任何其它的非红细胞流经该装置,导致样品富集有核红细胞(包括胎儿有核红细胞或fnrbc)。磁性分离模块的其它实例描述于2005年12月29日申请的题为“devicesandmethodsformagneticenrichmentofcellsandotherparticles”的美国申请序号11/323,971和2005年9月15日申请的题为“devicesandmethodsforenrichmentandalterationofcellsandotherparticles”的美国申请序号11/227,904。随后的富集步骤可用于分离稀有细胞(例如fnrbc)和非稀有细胞母体有核红细胞。在某些实施方案中,使用荧光活化的细胞分拣(facs)或选择性裂解部分细胞,对通过基于尺寸的分离继之以亲和/磁性分离富集的样品进一步富集稀有细胞。在某些实施方案中,富集包括通过选择性启动稀有细胞凋亡检测和/或分离稀有细胞或稀有dna(例如胎儿细胞或胎儿dna)。这可例如通过对包含稀有细胞的样品(例如混合样品)施加高压(增加co2水平;例如4%co2)实现。这将选择性启动样品中稀有细胞或易碎细胞(例如胎儿细胞)的凋亡。一旦稀有细胞(例如胎儿细胞)开始凋亡,则它们的细胞核将浓缩,并可选地从稀有细胞排出。在那时,可使用本领域已知的任何检测浓缩细胞核的技术,包括dna凝胶电泳、使用末端脱氧核苷酸转移酶(tdt)介导的dutp原位缺口标记(tunel)原位标记dna缺口(gavrieli,y.等,j.cellbiol.119:493-501(1992))和连接具有一或二个碱基的3'突出端的dna链断裂体(基于taq聚合酶的原位连接),检测稀有细胞或细胞核。(didenkov.等,j.cellbiol.135:1369-76(1996))。在某些实施方案中,可使用基于尺寸的分离模块进一步检测排出的细胞核,所述分离模块适于选择性富集小于预定尺寸(例如6μm)的细胞核和其它分析物,并将它们与流体动力学直径大于6μm的细胞和分析物分离。因此,在一个实施方案中,本发明设想检测胎儿细胞/胎儿dna,并可选地使用这些胎儿dna诊断或预后胎儿中的病症。这样的检测和诊断可如下进行:由怀有胎儿的孕妇获得血样,并使用例如适于基于尺寸分离的障碍物阵列富集样品中大于8μm的细胞和分析物,其中预定尺寸的分离为8μm(例如障碍物之间的间隙至多8μm)。然后,通过氧化样品,以使血红蛋白顺磁,并使样品流经一个或多个磁性区,使已富集的产物进一步富集红细胞(rbc)。这选择性捕获rbc,并由样品中除去其它细胞(例如白细胞)。随后,可对第二次富集产物施加高压或选择性引起胎儿细胞开始凋亡和浓缩/排出其细胞核的其它刺激,由第二次富集产物中的mnrbc富集fnrbc。然后,使用例如激光捕获显微解剖或由样品中分离小于3、4、5或6μm的组分的基于尺寸的分离模块,鉴定/分离这些浓缩细胞核。然后可使用本领域已知的或本文描述的任何方法分析该胎儿细胞核。在某些实施方案中,当要分离的分析物(例如红细胞或白细胞)不是铁磁体或者没有潜在磁性时,可使磁性粒子(例如珠)或化合物(例如fe3+)与分析物偶联,给予其磁性。在某些实施方案中,可以用选自抗cd71或cd75的抗体修饰偶联选择性结合目标分析物的抗体的珠。在某些实施方案中,磁性化合物,例如fe3+,可以偶联诸如上述的那些抗体。本文的磁性粒子或磁性抗体可以偶联本文的任一个或多个装置,之后接触样品,或者可以与样品混合,之后将样品传递至所述装置。磁性粒子还可以用于修饰一种或多种分析物(目标细胞或非目标细胞),以增加尺寸,然后进行基于尺寸的分离。用于在本文的任何实施方案中分离分析物/细胞的磁场可为均一的或非均一的,以及对本文的装置可为外部的或内部的。外部磁场是其来源处于本文装置(例如容器、通道、障碍物)之外的磁场。内部磁场是其来源在本文设想装置之内的磁场。内部磁场的实例是:其中磁性粒子可附着至装置中存在的障碍物(或被操作,以产生障碍物),以增加与分析物相互作用的表面积,从而增加结合的可能性。可通过去磁保留磁性粒子的磁性区释放磁场捕获的分析物。为了由区域选择性释放分析物,可将去磁限于选定的障碍物或区域。例如,可将磁场设计成电磁的,使得能够对每个单独区域或障碍物随意开启和关闭磁场。图3图解了装置的实施方案,其经配置用于由复杂混合物捕获和分离表达转铁蛋白受体的细胞。针对cd71受体的单克隆抗体易于现成获得,并可以共价偶联至含有任何常规铁粒的磁性物质,例如但不限于掺杂亚铁的聚苯乙烯和铁粒或铁-胶体(例如得自miltenyi和dynal)。结合磁粒的抗cd71流入所述装置中。将包被抗体的粒子引入障碍物(例如柱)、层和壁,并被粒子和磁场之间的磁场相互作用的强度保留。通过冲洗除去障碍物之间的粒子和在远离障碍物的局部磁场影响范围内松散保留的那些粒子。本文的一个或多个富集模块(例如基于尺寸的分离模块和捕获模块)可以在流体学上彼此串联或并联耦合。例如,分离模块的第一出口可与捕获模块在流体学上耦合。在某些实施方案中,分离模块和捕获模块整合,使得大量障碍物既用于根据尺寸偏转某些分析物,并将它们导向不同于目标分析物方向的路径,还用作捕获模块,以基于尺寸、亲和性、磁性或其它物理特性捕获、保留或结合某些分析物。在本文的任一实施方案中,实施的富集步骤具有的特异性和/或灵敏度大于50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或99.95%。本文的富集模块的保留率使≥50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.9%的目标分析物或细胞(例如有核细胞或有核红细胞或得自红细胞的有核细胞)得以保留。同时,配置富集模块,以由样品中除去≥50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%,96%、97%、98%、99%或99.9%的全部不需要的分析物(例如红细胞-血小板富集细胞)。本文的任一富集方法都可以进一步将富集样品拆分为等份试样或子样品。在某些实施方案中,将富集样品拆分成至少2、5、10、20、50、100、200、500或1000个子样品。因此,当富集样品包含约500个细胞并被拆分成500或1000个不同子样品时,每个子样品都将具有1或0个细胞。在某些情况下,拆分或排列样品,使得每个子样品处于独有的或不同的位置(例如孔)。该位置可为可寻址的。每个位置都可以进一步包含将细胞捕获至目标位置的捕获机制和/或由目标位置选择性释放细胞的释放机制。在某些情况下,设置所述孔使其保有单个细胞。iii.样品分析在某些实施方案中,本文的方法用于检测稀有细胞的存在或状况,所述稀有细胞在混合样品中(可选地即便在富集后)的浓度至多为混合样品中所有细胞的90%、80%、70%、60%、50%、40%、30%、20%、10%、5%或1%,或者低于样品中所有细胞的1:2、1:4、1:10、1:50、1:100、1:200、1:500、1:1000、1:2000、1:5000、1:10,000、1:20,000、1:50,000、1:100,000、1:200,000、1:1,000,000、1:2,000,000、1:5,000,000、1:10,000,000、1:20,000,000、1:50,000,000或1:100,000,000,或者低于1×10-3、1×10-4、1×10-5、1×10-6或1×10-7个细胞/μl流体样品。在某些实施方案中,混合样品具有总共至多2、3、4、5、6、7、8、9、10、15、20、30、40、50或100个稀有细胞(例如胎儿细胞或上皮细胞)。富集的靶细胞(例如fnrbc)可以在进一步分析富集细胞之前“分区”(图34和35)。分区是导致富集细胞输出的复杂性和/或总细胞数减少的任何方法。分区可以通过本领域已知的或本文描述的任何方法进行。一种分区方法是通过连续稀释。该稀释可使用任何适宜的平台(例如pcr孔、微量滴定板)和适宜的缓冲液进行。其它方法包括可将样品分离成液滴的纳流系统(例如biotrove、raindance、fluidigm)。这类纳流系统可使纳液滴中存在单个细胞。可在正选择靶细胞之前分区,所述正选择包括但不限于亲和结合(例如使用抗-cd71抗体)。或者,可在分区之前负选择非靶细胞。例如,基于尺寸的分离模块的输出可通过磁性血红蛋白富集模块(mhem),该模块通过吸引含磁性血红蛋白的细胞由富集样品中选择性除去wbc。例如,已通过基于尺寸的分离模块(有或没有通过使富集样品经过mhem而进一步富集)的富集母体血液的输出的可能细胞内容物可由以下组成:1)约20个fnrbc;2)1,500个mnrbc;3)4,000-40,000个wbc;4)15×106个rbc。如果将该样品分成100个区(bins)(pcr孔或其它可接受的分区平台),则预期每个区应包含:1)80个阴性区和20个对1个fnrbc阳性的区;2)150个mnrbc;3)400-4,000个wbc;4)15×104个rbc。如果分成10,000个区,则预期每个区应包含:1)9,980个阴性区和20个对1个fnrbc阳性的区;2)8,500个阴性区和1,500个对1个mnrbc阳性的区;3)<1-4个wbc;4)15×102个rbc。本领域技术人员将认识到,可根据用于分区的实验设计和/或平台增加或降低区数量。降低分区细胞群的复杂性可有利于通过减少单个区中的非靶细胞数目对靶细胞进行进一步的遗传的和/或细胞的分析。可对单个区进行分析,以证实在单个区中存在靶细胞(例如fnrbc)。该分析可由本领域已知的任何方法组成,包括但不限于fish、pcr、str检测、snp分析、生物标记检测和序列分析(图34和35)。例如,可分析通过本文方法富集的外周母体静脉血样,以确定妊娠或胎儿状态(例如胎儿性别或异倍性)。胎儿细胞的分析步骤可进一步包括针对所鉴定的胎儿细胞比较母体对父体基因组dna的比率。iv.胎儿生物标记在某些实施方案中,胎儿生物标记可用于在富集后或在检测胎儿异常或其缺失后检测和/或分离胎儿细胞。例如,这可通过基于在胎儿发育过程中差异表达的基因(例如dys1、dyz、cd-71、ε-和ζ-球蛋白)的相对表达来区分胎儿和母体nrbc而进行。在优选的实施方案中,生物标记基因在妊娠头三个月和/或妊娠中三个月差异表达。“差异表达的”在应用于细胞或细胞核中的核苷酸序列或多肽序列时,是指在与另一个样品、对照或参比样品中的相同序列的表达水平相比时,该序列过表达/表达不足的差异。在某些实施方案中,表达差异可为暂时的和/或细胞特异性的。例如,对于生物标记的细胞特异性表达,目标细胞中的一个或多个生物标记的差异表达可高于或低于背景细胞群。检测此生物标记表达的差异可以指示混合样品(例如背景细胞群)中稀有细胞(例如fnrbc)相对于其它细胞的存在情况。在其它实施方案中,可以检测两个或多个这类差异表达的生物标记的比率,并可用于检测稀有细胞。在一个实施方案中,胎儿生物标记包含差异表达的血红蛋白。成红血细胞(nrbc)在早期胎儿循环中非常丰富,实际上在正常成人血液中不存在,由于有限寿命短,所以没有获得可由先前妊娠存留的fnrbc的风险。此外,与滋养层细胞不同,胎儿成红细胞不倾向于嵌合体特征。卵黄囊成红细胞合成ε-、ζ-、γ-和α-球蛋白,这些组合形成胚胎血红蛋白。在6-8周之间,红细胞生成的主要部位由卵黄囊迁移至肝脏,3种胚胎血红蛋白被作为主要氧运输系统的胎儿血红蛋白(hbf)替代,在定向红细胞中ε-和ζ-球蛋白生产被γ-、α-和β-球蛋白生产所替代(peschle等,1985)。在发生第二种球蛋白转换和β-球蛋白生产加速时,hbf保留主要血红蛋白直至出生。血红蛋白(hb)是由两条相同的α球蛋白链和两个拷贝的第二种球蛋白组成的杂二聚体。由于在胎儿发育过程中的差异基因表达,第二条链的组成由早期胚胎发育过程(妊娠1-4周)中的ε球蛋白改变为胎儿发育过程(妊娠6-8周)中的γ球蛋白,直至新生儿和成人中的β球蛋白,如在(表1)中所示。表1.在母体和胎儿rbc中的ε、γ和β的相对表达在头三个月后期(可通过cvs取样胎儿细胞的最早期),fnrbc除了含有α球蛋白之外,主要含有ε和γ球蛋白。在头三个月至中三个月,当通常进行羊膜穿刺术时,fnrbc主要含有γ球蛋白和一些成人β球蛋白。母体细胞含有几乎独有的α和β球蛋白,在某些样品中含有可检测的痕量γ。因此,通过检测由母体血样纯化的rbc中的ε、γ和β基因的相对表达,可以确定样品中胎儿细胞的存在情况。而且,可利用阳性对照评价fish分析自身的失败。在多个实施方案中,基于血红蛋白β、γ或ε的差异表达区分胎儿细胞和母体细胞。可测定胞质或细胞核中的表达水平或rna水平。因此,在某些实施方案中,本文的方法包括测定信使rna(mrna)、核糖体rna(rrna)或核rna(nrna)的水平。在某些实施方案中,可通过检测胞质或细胞核中至少两种血红蛋白的水平实现fnrbc的鉴定。在多个实施方案中,鉴定和测定来自1、2、3、4、5、6、7、8、9、10、15或20个胎儿细胞核。此外,在一个或多个载玻片上排列的总细胞核可计为约100、200、300、400、500、700、800、5000、10,000、100,000、1,000,000、2,000,000至约3,000,000个。在某些实施方案中,γ/β或ε/β的比率用于确定胎儿细胞的存在情况,其中低于1个的数量指示不存在fnrbc。在某些实施方案中,γ/β或ε/β的相对表达提供了以γ或ε相对于β检测的fnrbc指数(“fni”)。在某些实施方案中,γ/β的fni大于5、10、15、20、25、30、35、40、45、90、180、360、720、975、1020、1024、1250至约1250指示存在fnrbc。在又一个实施方案中,低于约1的γ/β的fni指示不存在fnrbc。优选地,由在头三个月当中获得的样品测定以上fni。然而,在中三个月和后三个月当中可以使用类似的比率。在某些实施方案中,通过检测细胞核rna转录物(包括初生或未加工的转录物)测定表达水平。在另一个实施方案中,通过检测mrna(包括核糖体rna)测定表达水平。有许多本领域已知的方法成像(例如检测)核酸或rna,包括但不限于使用affymetrix,inc.或illumina,inc的表达阵列。可如下设计rt-pcr引物:靶向球蛋白可变区,选择扩增子大小,并调节引物退火温度,以实现相等的pcr扩增效率。因此,可针对每种扩增子设计taqman探针,对于ε用充分分离的荧光染料alexa对于γ用alexa对于β用alexafluor-555。这些引物的特异性可首先使用ε、γ和βcdna作为模板证实。可选择提供最佳特异性的引物组用于进一步的测定开发。作为替代,可由两个覆盖内含子序列的外显子选择引物,以仅扩增mrna,从而消除基因组dna污染。可首先使用靶cdna模板以双链体形式检验选定的引物,以证实它们的特异性、检测限度和扩增效率。可以三链体形式进一步检验最好的引物组合的扩增效率、检测动态范围和检测限度。多种市售可得的试剂可用于rt-pcr,例如一步rt-pcr试剂,包括qiagen一步rt-pcr试剂盒和appliedbiosytemstaqman一步rt-pcrmastermixreagents试剂盒。这些试剂可用于使用由富集样品纯化的rna建立ε、γ和β的表达比率。可以针对每个靶标记正向引物,对ε使用alexafluor-355,对γ使用alexafluor-488,对β使用alexafluor-555。富集细胞可通过细胞离心涂片在玻璃载玻片上沉积。另外,细胞离心涂片富集细胞可在原位rt-pcr后进行。此后,可通过荧光显微镜目测荧光标记的扩增子的存在情况。逆转录时间和pcr循环可被优化,以最大化扩增子信号:背景比率,从而获得最大的胎儿相对于母体特征的分离。优选地,信号:背景比大于5、10、50或100,该过程中的总体细胞损失低于50%、10%或5%。v.胎儿细胞分析图4图示了本发明的某些实施方案的纵览。异倍性是指低于或大于染色体的正常二倍数的状态。换句话说,其为整倍性的任何偏离。异倍性包括诸如以下的状态:单体性(在细胞核中仅存在1对中的1个染色体)、三体性(在细胞核中具有特定类型的3个染色体)、四体性(在细胞核中具有特定类型的4个染色体)、五体性(在细胞核中具有特定类型的5个染色体)、三倍性(在细胞核中每种染色体具有3个)和四倍性(在细胞核中每种染色体具有4个)。活体三倍体出生极其稀有,这类个体相当异常,然而,三倍性占所有人类妊娠大约2-3%,似乎是约15%的流产的影响因素。四倍性占所有流产的大约8%。(http://www.emedicine.com/med/topic3241.htm)。在步骤400中,样品得自动物,例如人。在某些实施方案中,动物或人为怀孕的、怀疑怀孕的,或者可为已怀孕的,本文的系统和方法用于诊断妊娠和/或胎儿状态(例如三体性)。在某些实施方案中,动物或人怀疑患病、患病或已患病(例如癌症),本文的系统和方法用于诊断病症、确定适宜的治疗和/或监测复发。在两种情况中,得自动物的样品可为血样,例如至多50、40、30、20或15ml。在某些情况中,多个样品于不同时间点及时得自相同动物(例如治疗前、治疗中和治疗后,或者在妊娠的头三个月、中三个月和后三个月当中)。在可选步骤402中,使用本领域已知的或本文描述的一种或多种方法富集稀有细胞(例如胎儿细胞或上皮细胞)或这些稀有细胞的dna。例如,为了由母体血样富集胎儿细胞,可将样品施加至基于尺寸的分离模块(例如二维障碍物阵列),该模块被配置成将样品中大于8μm的细胞或粒子导向第一出口,将样品中小于8μm的细胞或粒子导向第二出口。随后,可基于胎儿细胞潜在的磁性,由母体白细胞(其也大于8μm)进一步富集胎儿细胞。例如,将包被n2或抗-cd71的磁珠加入第一个富集产物,以使红细胞(母体和胎儿)中的血红蛋白变为顺磁的。然后使富集样品流经耦合外磁铁的柱子。这既捕获fnrbc,又捕获mnrbc,产生第二个富集产物。然后可对样品施加高压或其它刺激以启动胎儿细胞凋亡。然后可使用例如显微解剖富集胎儿细胞/细胞核。应当指出的是,即便是富集产物也可以非目标细胞(例如母体红细胞)为主(>50%)。在某些情况下,富集样品具有的稀有细胞(或稀有基因组)由富集样品中所有细胞(或基因组)的至多0.01%、0.02%、0.05%、0.1%、0.2%、0.5%、1%、2%、5%、10%、20%或50%组成。例如,使用本文的系统,可富集孕妇的20ml母体血样的胎儿细胞,使得富集样品具有总共约500个细胞,其中2%为胎儿的,余下的为母体的。在步骤404中,将富集产物拆分在两个或更多个离散位置之间。在某些实施方案中,将样品拆分到总共至少2、10、20、50、100、200、300、400、500、600、700、800、900、1000、2000、3,000、4,000、5000或10,000个不同离散位置中或约100、200、500、1000、1200、1500个位置中。在某些实施方案中,将富集模块的输出连续分入1536个微孔的板的各孔中(图8)。这可导致每个位置1个细胞或基因组或者每个位置0个或1个细胞或基因组。在某些实施方案中,细胞拆分产生每个位置1、2、3、4、5、6、7、8、9、10、20、50、100、200、500、1000、2000、5000、10,000、20,000、50,000、100,000、200,000或500,000个以上的细胞或基因组。在拆分富集上皮细胞、内皮细胞或ctc的样品时,在每个离散位置(例如孔)的载荷可以包括几个白细胞,而仅一个数个载荷包含一个或多个ctc。在拆分富集胎儿细胞的样品时,优选每个位置包含0或1个胎儿细胞。可用作可寻址部位的离散位置的实例包括但不限于孔、区、筛、小孔、几何位点、载玻片、基质、膜、电阱、间隙、障碍物或细胞膜或核膜中的原位。在某些实施方案中,离散细胞是可寻址的,使得人们可将细胞或细胞样品与特定位置关联起来。将样品拆分到离散的可寻址部位的方法的实例包括但不限于荧光活化的细胞分拣(facs)(sherlock,jv等,ann.hum.genet.62(第1部分):9-23(1998))、显微操作(samura,o.,ctalhum.genet.107(1):28-32(2000))和稀释策略(findlay,i.等,mol.cell.endocrinol.183,增刊1:s5-12(2001))。还可以使用本领域已知用于样品拆分细胞分拣的其它方法和拆分方法。例如,可使用结合任何固定化或移动的基质的亲和物质(例如抗体)通过亲和分拣技术拆分样品(samurao.等,hum.genet.107(1):28-32(2000))。这些亲和物质对某个细胞类型可为特异性的,所述细胞类型例如为rbc、胎儿细胞、上皮细胞,包括特异性结合epcam、抗原-i或cd-71的那些。在某些实施方案中,将样品或富集样品转移至细胞分拣装置,该装置包含离散位置阵列,用于捕获顺着液流移动的细胞。离散位置可在整个表面上以限定模式排列,使得离散地址也是可寻址的。在某些实施方案中,分拣装置耦合本领域已知的或本文公开的任一种富集装置。所包括的细胞分拣装置的实例描述于国际公布号wo01/35071。可用于在离散的可寻址部位建立细胞阵列的表面的实例包括但不限于纤维素、乙酸纤维素、硝酸纤维素、玻璃、石英或其它晶体基质如砷化镓、二氧化硅、金属、半导体、多种塑料和塑料共聚物、环-烯烃聚合物、多种膜和凝胶、微球、珠以及顺磁性或超磁性微粒。在某些实施方案中,分拣装置含有孔或离散位置的阵列,其中每个孔或离散位置都被配置得以保留至多1个细胞。每个孔或离散的可寻址部位均可具有适于保留该细胞的捕获机制(例如重力、吸力等),并可选地具有由特定孔或位置选择性释放目标细胞的释放机制(例如鼓泡驱动)。图b图解了该实施方案。在步骤406中,通过扩增标记阵列的每个细胞或细胞核的目标核酸。优选地,扩增的/标记的核酸含有至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、90、90或100个多态基因组dna区,例如短串联重复序列(str)或可变数目的串联重复序列(“vntr”)。当扩增的dna区包含一种或多种str时,针对高杂合性(等位基因多样性)选择str,使得任何胎儿细胞的父体等位基因在长度上更有可能与母体等位基因不同。这导致检测混合样品中的胎儿细胞存在情况和这些细胞中的任何潜在胎儿异常性的能力改善。在某些实施方案中,根据其与特定病症的关联选择扩增的str。例如,为测定胎儿异常,扩增含有与胎儿异常或病症相关的突变的str序列。可通过本文方法扩增/分析的str的实例包括但不限于d21s1414、d21s1411、d21s1412、d21s11mbp、d13s634、d13s631、d18s535、amgxy和xhprt。可通过本文方法扩增/分析的其它str包括但不限于在基因座f13b(1:q31-q32);tpox(2:p23-2pter);fibra(fga)(4:q28);csfipo(5:q33.3-q34);fi3a(6:p24-p25);thoi(11:p15-15.5);vwa(12:p12-pter);cdu(12p12-pter);d14s1434(14:q32.13);cyar04(p450)(15:q21.1)、d21s11(21:q11-q21)和d22s1045(22:q12.3)的那些。在某些情况下,选择在怀疑三体性的染色体上和对照染色体上的str基因座。经常为三体性的染色体的实例包括染色体21、18、13和x。在某些情况下,每个测试的染色体扩增1个或1个以上、2、3、4、5、6、7、8、9、10、15或20个str(samura,o.等,clin.chem.47(9):1622-6(2001))。例如,扩增可用于产生至多20个、至多30个、至多40个、至多50个、至多60个、至多70个、至多80个、至多90个、至多100个、至多150个、至多200个、至多300个、至多400个、至多500个或至多1000个核苷酸长度的扩增子。二-、三-、四-或五-核苷酸重复str基因座可用于本文所述的方法。为扩增和标记目标基因组dna区,pcr引物可以包括:(i)引物元件,(ii)测序元件,和(iii)定位元件。配置引物元件,以扩增目标基因组dna区(例如str)。引物元件必要时包含用于扩增反应的上游和下游引物。可以选择在同一扩增反应中可与其它标记的其它引物对多重化的引物元件(例如相当均一的解链温度、没有针对人基因组的交叉引发以及基于序列分析没有引物-引物相互作用)。引物元件可具有至少4、5、6、7、8、9、10、15、20、25、30、40或50个核苷酸碱基,这些碱基设计用于特异性杂交并扩增目标基因组dna区。测序元件可位于每个引物元件或核酸标签的5'末端。测序元件适于克隆和/或测序扩增子。(marguiles,m,nature437(7057):376-80)。测序元件可为约4、6、8、10、18、20、28、36、46或50个核苷酸碱基长。定位元件(也称为单一标签序列)经常掺入上游引物的中间部分,可以包括长度介于4-20bp之间的短dna或核酸序列(例如约4、6、8、10或20个核苷酸碱基)。定位元件使得有可能在扩增步骤之后合并所有离散的可寻址部位的扩增子,并平行分析扩增子。在某些实施方案中,每个定位元件对单个可寻址部位都是特异性的。使用扩增反应将标签加至每个离散位置的细胞/dna。扩增可以使用pcr或通过多种方法进行,所述方法包括但不限于单重pcr、定量pcr、定量荧光pcr(qf-pcr)、多重荧光pcr(mf-pcr)、实时pcr(rt-pcr)、单细胞pcr、限制片段长度多态性pcr(pcr-rflp)、pcr-rflp/rt-pcr-rflp、热启动pcr、嵌套pcr、原位polononypcr(insitupolononypcr)、原位滚环扩增(rca)、桥接pcr、微微量滴定板pcr、多链置换扩增(mda)和乳液pcr。其它适宜的扩增方法包括连接酶链式反应(lcr)、转录扩增、自主序列复制、靶多核苷酸序列的选择扩增、共有序列引物聚合酶链式反应(cp-pcr)、随机引物聚合酶链式反应(ap-pcr)、简并寡核苷酸引物pcr(dop-pcr)和基于核酸的序列扩增(nabsa)。使用pcr引物的扩增技术的其它实例描述于美国专利号5,242,794、5,494,810、4,988,617和6,582,938。在某些实施方案中,进一步的pcr扩增使用针对一个或多个目标基因组dna区的嵌套引物进行,以确保多重扩增的最佳效力。嵌套pcr扩增产生足够用于进一步分析的基因组dna原料,例如用于以下的平行测序方法。在步骤408中,在进一步处理前合并和纯化标记/扩增的基因组dna区。用于合并和纯化基因组dna的方法是本领域已知的。在步骤410中,分析合并的基因组dna/扩增子,以检测例如基因组dna区(例如扩增的str)的等位基因丰度。在某些实施方案中,该分析包括使用毛细管凝胶电泳(cge)。在其它实施方案中,该分析包括测序或超深测序。测序可以使用经典的sanger测序法或本领域已知的任何其它方法进行。例如,测序可通过合成测序进行,合成测序包括通过合成与靶核酸序列互补的链推测模板序列。合成测序可使用与核酸标签上的测序元件互补的测序引物启动。该方法包括在聚合酶反应中将标记的核苷酸或核苷酸类似物掺入互补核酸序列的增长链中之后(基本上实时)或当时(实时)立即检测每个核苷酸的身份。在成功掺入标记核苷酸后,检测信号,然后通过本领域已知的方法消除信号。合成测序方法的实例描述于美国申请公布号2003/0044781、2006/0024711、2006/0024678和2005/0100932。可用于标记合成测序用核苷酸或核苷酸类似物的标记的实例包括但不限于发色团、荧光部分、酶、抗原、重金属、磁探针、染料、磷光团、放射性物质、化学发光部分、散射或荧光纳颗粒、raman信号产生部分和电化学检测部分。合成测序每小时可以产生至少1,000个、至少5,000个、至少10,000个、至少20,000个、30,000个、至少40,000个、至少50,000个、至少100,000个或至少500,000个读取序列。这些读取序列可具有每个读取序列至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少120个或至少150个碱基。另一种测序方法包括使扩增的目标基因组区与同其互补的引物杂交。该杂交复合物与聚合酶、atp硫酸化酶、萤光素酶、三磷酸腺苷双磷酸酶以及底物萤光素和腺苷酰硫酸温育。接着,顺序加入对应于碱基a、c、g和t(u)的脱氧核苷三磷酸。每个碱基掺入伴随着焦磷酸释放,通过硫酸化酶转变为atp,atp驱动氧化萤光素的合成和可见光的释放。因为焦磷酸释放与掺入碱基的数量等摩尔,所以发出的光与在任一个步骤加入的核苷酸数成比例。重复该过程,直至完整序列被测定。又一个测序方法包括通过连接方案(简并连接)进行的4色测序,其包括使锚定引物与4个位置中的1个杂交。然后,进行锚定引物与用荧光染料标记的简并九聚体群的酶连接反应。在任意给定的循环,所用的九聚体群的结构使其位置之一的身份与连接至该九聚体的荧光团的身份相关联。就连接酶区分该查询位置的互补性而言,荧光信号允许推断碱基身份。在进行连接和4色成像后,剥下锚定引物:九聚体复合物,开始新循环。在进行连接后成像序列信息的方法是本领域已知的。优选地,分析包括使用超深测序,例如描述于marguiles等,nature437(7057):376-80(2005)。简而言之,稀释扩增子,并与珠混合,使得每个珠均捕获单个分子的扩增材料。然后扩增每个珠上的dna分子,以产生数百万拷贝的序列,它们全部保持与珠结合。该扩增可通过pcr进行。每个珠都可以置于单独的孔中,所述孔可为(可选地为可寻址的)皮升大小的孔。在某些实施方案中,每个珠都被捕获在油乳液包pcr反应混合物的液滴中,pcr扩增在每个液滴中发生。在珠上的扩增导致每个珠携带至少100万、至少500万或至少1000万拷贝的与其偶联的原始扩增子。最后,将珠置于高度平行的合成测序机器中,该机器在单次4小时运行中产生400,000多个读取序列(每个读取序列约100bp)。可以使用的其它超深测序方法描述于hong,s.等,nat.biotechnol.22(4):435-9(2004);bennett,b.等,pharmacogenomics6(4):373-82(2005);shendure,p.等,science309(5741):1728-32(2005)。超深测序的作用是提供精确定量的方式来检测每个str的等位基因丰度。每个等份试样孔所需要的读取序列总数由str数、多重pcr的出错率和与测序方法相关的poisson抽样统计确定。在一个实施例中,步骤402的富集输出产生约500个细胞,其98%为母体细胞,2%为胎儿细胞。随后将这些富集细胞拆分入微量滴定板中的500个离散位置(例如孔),使得每个孔含有1个细胞。使用pcr扩增每个目标染色体上的str(约3-10个str基因座)。基于以上实施例,随着胎儿/母体比率下降,异倍性信号被稀释,需要更多的基因座来达到与基因座之间的可变dna扩增效率相关的检测误差的平均数。在本文所述方法中提出的含约1个细胞的样品分入孔中实现了在某些孔中纯且高度富集的胎儿/母体比率,缓解了对许多基因座求pcr错误平均值的需求。在一个实施例中,令‘f’为具体pcr反应中的胎儿/母体dna拷贝比率。三体性将母体对父体等位基因的比率增加1+f/2倍。pcr效率在基因座内的等位基因之间以由σ等位基因2给出的对数均方差变化,并在基因座之间以σ基因座2变化,其中该第二个方差由于引物效率的差异而往往更大。na是每个怀疑的异倍体染色体的基因座,nc是对照基因座。如果在任何基因座的两个母体等位基因强度的平均值为‘m’,父体等位基因强度为‘p’,那么预期的方差为ln(比率(m/p))的平均值,其中对n个基因座所取的该平均值由2(σ等位基因2)/n给出。在考虑怀疑的异倍性区和对照区之间的该ln(比率(m/p))的平均值差异时,该差异的误差如下给出:σ差异2=2(σ等位基因2)/na+2(σ等位基因2)/nc(1)为粗略检测异倍性,我们要求3σ差异<f/2为简化起见,假定等式1中na=nc=n,这得到必要条件6σ等位基因/n1/2<f/2(3)或最小值nn=144(σ等位基因/f)2(4)在三体性检测背景下,怀疑的异倍性区通常为整个染色体,n代表每个染色体的基因座数。作为参考,在下表2中针对σ等位基因和f的多个值求等式3的n。fσ等位基因0.10.31.00.11441610.31296144131.0144001600144表2.随σ等位基因和f而变的每个染色体需要的基因座数目。因为样品拆分降低了起始基因组拷贝数(其增加σ等位基因,同时其增加某些孔中的f值),所以本文的方法基于以下假设:拆分的总体作用是有利的;即pcr错误没有随着起始基因组拷贝数降低而增加得太快以致抵消某些孔具有大f的利益。需要的基因座数可略微较大,因为对于许多基因座而言父体等位基因与母体等位基因无差别,该发生率取决于基因座的杂合性。对于高度多态性的str,这相当于约双倍的n。测序的作用是检测扩增步骤的等位基因丰度输出。合乎需要的是这样做而没有由于选择仅有限量的测序用扩增子的poisson统计增加显著更多的错误。归因于poisson统计的ln(丰度)的rms误差约为(n读取序列)-1/2。理想的是保持该值低于或等于pcr误差σ等位基因。因此,典型的父体等位基因需要分配至少(σ等位基因)-2个读取序列。母体等位基因由于更丰富而没有在形成针对m/p的比估计时可观地增加该误差。输入测序的混合物包含得自n基因座的扩增子,其基因座约f/2丰度分数为父体等位基因。因此,每个等份孔所需要的读取序列总数以约2n基因座/(fσ等位基因2)给出。合并等式4的该结果发现,所有孔中读取序列的总数由以下近似给出:n读取序列=288个n孔f-3(5)在进行样品拆分时,粗略近似将保证样品拆分使至少几个孔中的f接近一致。如果样品拆分要有优势,那么这些孔必须在最终结果中占信息量优势。因此,采用f=1的等式(5),其表示每孔至少约300个读取序列。对于500个孔,这产生的最低需求为约150,000个读取序列。考虑到有限的基因座杂合性往往增加需求(就str而言达约2倍),而多个孔的数据增强作用往往放松对该结果的要求(在以上检查的基线情况下,假定约10个孔具有纯胎儿细胞)。因此,每名患者需要的读取序列总数预计在100,000-300,000个的范围内。在步骤412中,鉴定具有稀有细胞/等位基因(例如胎儿等位基因)的孔。每个标记的定位元件可用于将读取序列(约200,000个读取序列)拣选入对应于微量滴定板的单独孔的‘区’(约500个区)中。然后使用标准序列比对算法将每个区的读取序列(每个区约400个读取序列)分入不同的基因组dna区类别(例如str基因座)。每个区的比对序列用于鉴定稀有(例如非母体)等位基因。估计平均15ml孕妇血样将产生约10个区,每个区具有一个胎儿细胞。以下是鉴定稀有等位基因的两个实例。在第一个方案中,可如上所述分析已知仅含母体细胞的独立血样级分,以便获得母体等位基因。该样品可为白细胞级分,或者仅为富集前的原始样品稀释液。在第二个方案中,所有孔的序列或基因型均可进行相似度聚类,以鉴定与母体细胞相关的显性模式。在任一个方案中,检出非母体等位基因确定哪个离散位置(例如孔)含有胎儿细胞。确定相对于总区数的具有非母体等位基因的区数提供了对原始细胞群或富集样品中存在的胎儿细胞数的估计。因为通过多个独立的多态dna区如str基因座检测出非母体等位基因,所以以高置信水平鉴定出含有胎儿细胞的区。在步骤414中,确定稀有细胞或dna的状况。这可通过确定含稀有细胞/dna的区中的选定等位基因(多态基因组dna区)的丰度来实现。在某些实施方案中,等位基因丰度用于确定异倍性,例如染色体13、18和21。等位基因的丰度可通过比较每个扩增的基因组区(例如约12个str)的母体对父体等位基因的比率来确定。例如,如果分析12个str,则对于每个区而言,对每个str有33个读取序列。在正常胎儿中,给定str的母体对父体等位基因的比率为1:1,对应于每个等位基因(正常二等位基因)有约16个读取序列。在三体性胎儿中,3剂str标记将被检测为具有1:1:1比率的3个等位基因(三体性三等位基因)或具有2:1比率的2个等位基因(三体性二等位基因)。(adinolfi,p.等,prenat.diagn,17(13):1299-311(1997))。在罕有的情况下,全部3个等位基因都可以一致,基因座将不会为该个体患者提供信息。在某些实施方案中,组合每个染色体上的不同dna区的信息,以增加给出的异倍性检出信号的置信度。在某些实施方案中,也可以组合含有胎儿细胞的独立分区的信息,以进一步增加检出信号的置信度。在某些实施方案中,等位基因丰度用于确定节段异倍性。正常二倍体细胞每个染色体具有两个拷贝,因此每个基因或基因座具有两个等位基因。特定染色体区的等位基因丰度的改变可指示染色体重排,例如缺失、复制或转座事件。在某些实施方案中,组合每个染色体上不同dna区的信息,以增加给出的节段异倍性检出信号的置信度。在某些实施方案中,也可以组合含有胎儿细胞的独立分区的信息,以进一步增加检出信号的置信度。胎儿三体性测定可用于诊断例如异常胎儿基因型的病症,包括13三体、18三体、21三体(唐氏综合征)和克兰费尔特综合征(xxy)。其它异常胎儿基因型的实例包括但不限于异倍性,例如一个或多个染色体的单体性(x染色体单体性,也称为turner综合征)、一个或多个染色体的三体性(13、18、21和x)、一个或多个染色体的四体性和五体性(其在人中最常于性染色体中观察到,例如xxxx、xxyy、xxxy、xyyy、xxxxx、xxxxy、xxxyy、xyyyy和xxyyy)、三倍性(每个染色体有3个,例如在人中的69个染色体)、四倍性(每个染色体有4个,例如在人中的92个染色体)和多倍性。在某些实施方案中,异常胎儿基因型为节段异倍性。节段异倍性的实例包括但不限于1p36复制、dup(17)(p11.2p11.2)综合征、唐氏综合征、pelizaeus-merzbacher病、dup(22)(q11.2q11.2)综合征和猫眼综合征。在某些情况下,异常胎儿基因型归因于性或常染色体的一个或多个缺失,该缺失可导致诸如以下的疾病:猫叫综合征、wolf-hirschhorn综合征、wilhams-beuren综合征、腓骨肌萎缩症、有压力麻痹倾向的遗传性神经病、smith-magenis综合征、神经纤维瘤病、alagille综合征、颚心脸综合征(velocardiofacialsyndrome)、digeorge综合征、类固醇硫酸酯酶缺乏症、kallmann综合征、具有线性皮肤缺陷的小眼球、肾上腺发育不全、甘油激酶缺陷、pelizaeus-merzbacher病、y上的睾丸决定因子、无精子症(因子a)、无精子症(因子b)、无精子症(因子c)或1p36缺失。在某些实施方案中,染色体数目下降导致xo综合征。在一个实施方案中,本发明的方法允许确定母体或父体三体性。在某些实施方案中,本发明的方法允许测定由1个以上的胎儿产生的混合母体样品中的胎儿细胞的三体性或其它病症。在本发明的另一方面,使用标准定量基因分型技术推断胎儿细胞的存在情况和确定胎儿染色体的拷贝数(倍数性)。几个小组已证实,定量基因分型方法可用于检测拷贝数变化(wang,moorhead等,2005)。然而,这些方法对细胞混合物实施得不好,通常需要相对大量的输入细胞(约10,000个)。本发明通过对单个细胞进行定量基因分型反应解决了复杂问题。另外,使用多重pcr和dna标签以高度平行的方式对单个细胞进行成千上万的基因分型反应。该实施方案的纵览示于图5。在步骤500中,样品(例如稀有和非稀有细胞的混合样品)得自动物或人。参见例如图4的步骤400。优选地,样品为外周母体血样。在步骤502中,通过本领域已知的或本文描述的任何方法富集样品的稀有细胞(例如胎儿细胞)。参见例如图4的步骤402。在步骤504中,将富集的产物拆分入多个不同位置(例如孔)。参见例如图4的步骤404。在步骤506中,将用于扩增多个(例如2-100个)高度多态性的基因组dna区(例如snp)的pcr引物对加至阵列或微量滴定板中的每个离散位置或孔。例如,可设计用于沿着染色体13、18、21和/或x扩增snp的pcr引物对,以检测最常见的异倍性。可设计其它pcr引物对,以沿着其中预期无异倍性的基因组对照区扩增snp。根据高多态性选择异倍性区或怀疑为异倍性区中的基因组基因座(例如snp),使得胎儿细胞的父体等位基因更有可能与母体等位基因不同。这改善了检测混合样品的胎儿细胞存在情况以及胎儿病症或异常性的能力。还可以根据其与胎儿中待检测的具体病症的关联选择snp。在某些情况下,每个目标染色体(例如13、18、21和/或x)分析1个或1个以上的、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个snp。每个染色体所询问的snp数的增加确保了精确的结果。选择pcr引物,以便可与其它引物对多重化(相当一致的解链温度、对人基因组没有交叉引发,以及基于序列分析没有引物-引物相互作用)。所述引物设计用于产生大小为10-200、20-180、40-160、60-140或70-100bp的扩增子,以增加多重pcr的性能。可使用嵌套引物进行第二轮pcr,以确保多重扩增的最佳性能。单个细胞的多重扩增有助于产生足够用于平行基因分型方法的原料。可以最低水平的等位基因脱落和优先扩增对单个细胞进行多重pcr。参见sherlock,j.等,ann.hum.genet.61(第1部):9-23(1998);和findlay,i.等,mol.cell.endocrinol.183,增刊1:s5-12(2001)。在步骤508中,例如采用核酸标签标记扩增的目标多态dna区(例如snp)。优选地,核酸标签起两个作用:确定不同snp的身份,以及确定得到基因型的分区的身份。核酸标签可包含允许等位基因特异性扩增和/或检测的引物。核酸标签可为多种大小,包括至多长10个碱基对、10-40个、15-30个、18-25个或约22个碱基对。在某些实施方案中,核酸标签包含分子倒置探针(mip)。mip的实例及其应用描述于hardenbol,p.等,nat.biotechnol.21(6):673-8(2003);hardenbol,p.等,genomeres.15(2):269-75(2005);和wang,y.等,nucleidacidsres.33(21):e183(2005)。图7a图解了本文使用的mip测定的1个实例。mip标签可包含定位元件,以确定得到基因型的分区的身份。例如,当富集方法的输出产生约500个细胞时,可将富集产物/细胞拆分入含有500个孔的微量滴定板中,使得每个细胞都处于不同的孔中。图7b图解了具有500个孔的微量滴定板,其中每个孔都含有单个细胞。每个细胞都以每个染色体10个不同snp对4个染色体(例如染色体13、18、21和x)询问。对于每500个孔总共20,000个标签(即4个染色体×10个snp×500个孔),该分析需要40个mip/细胞/孔。标记步骤还可以包括在mip重排或酶促“补平缺口”后扩增mip。在一个实施方案中,核酸标签包含独有的特性,例如与其它标签的质量或化学特性差异。在又一个实施方案中,核酸标签包含可光敏化的标记,使得其在其结合的位置交联。在又一个实施方案中,核酸标签可以用作超深测序的接头。在又一个实施方案中,核酸标签可以用作阵列的接头。在又一个实施方案中,核酸标签包含独特的荧光标记,(例如fam、joe、rox、ned、hex、sybr、pet、tamra、vic、cy-3、cy-5、dr6g、ds-33、liz、ds-02、dr110和texasred),该标记可用于区分单独的dna片段。在又一个实施方案中,核酸标签可用作引物或探针的杂交位点,以利于使用易处理的标记由单个细胞进行信号扩增或检测。在某些实施方案中,可以使用耦合光源的系统分析标记的核酸标签,所述系统例如为abi377、310、3700或任何其它可检测荧光标记的dna的系统。在步骤510中,将被标记的扩增子合并在一起,用于进一步的分析。在步骤512中,使用本领域已知的任何技术测定和/或定量在每个多态位点的基因型。在一个实施方案中,通过使mip标签与含有与每个mip标签的序列互补的探针的微阵列杂交进行基因分型。参见美国专利号6,858,412。使用采用mip探针的上述实施例,使20,000个标签与含有每个标记的mip探针的互补序列的单个标签阵列杂交。微阵列(例如标签阵列)可包含大量固定至基质表面上的离散点(例如限定的位置或分配的位置)的核酸探针。例如,微阵列可以具有至少5、10、20、30、40、50、60、70、80、90、100、500、1,000、5,000、10,000、15,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000或100,000个与mip标记探针互补的不同探针。制备能够按照本发明方法监测几个基因的微阵列的方法在本领域众所周知。可以使用可用于核酸分析的微阵列的实例描述于美国专利6,300,063、美国专利5,837,832、美国专利6,969,589、美国专利6,040,138、美国专利6,858,412、美国公布号2005/0100893、美国公布号2004/0018491、美国公布号2003/0215821和美国公布号2003/0207295。在步骤516中,鉴定具有稀有等位基因(例如胎儿等位基因)的分区。使用上述实施例,首先可通过使用22bp标签将20,000个基因型分拣入对应于原始微量滴定板上的单独孔的500个分区中完成稀有等位基因鉴定。然后,人们可鉴定含有非母体等位基因的分区,该分区对应于含胎儿细胞的孔。确定含非母体等位基因的区数相对于其总数提供了对存在于原始富集细胞群中的fnrbc数的精确估计。当在给定分区中鉴定胎儿细胞时,非母体等位基因可通过40个独立的snp检测,这些snp提供了极高水平的结果置信度。在步骤518中,基于稀有细胞多态性确定诸如三体性的病症。例如,在鉴定约10个含胎儿细胞的分区之后,人们可以通过比较每个染色体(x、13、18、21)上约10个snp中每一个的母体对父体等位基因的比率确定这些细胞的染色体13、18、21和x的倍数性。可以组合每个染色体上多个snp的比率(平均),以增加该染色体的异倍性检出信号的置信度。另外,还可以组合约10个含有胎儿细胞的独立分区的信息,以进一步增加检出信号的置信度。如上所述,可将含500个细胞的富集母体样品拆分入500个离散位置,使得每个位置含1个细胞。如果对4个不同染色体的每一个分析10个snp,则每个离散位置加入40个标记的mip探针,从而每个细胞分析40个不同的snp。然后使用如上所述的mip探针中的引物元件在该位置扩增40个snp。然后将所有离散位置的所有扩增子合并在一起,并如上所述使用定量基因分型分析。在该实施例中,在微阵列中对500个离散位置的每一个中的40个相同snp进行基因分型需要总共20,000个探针(4个染色体×10个snp×500个离散位置)。还可以通过使核酸标签与珠阵列杂交修改以上实施方案,以供基因分型使用,所述珠阵列可由illumina,inc.商购,并描述于美国专利号7,040,959;7,035,740;7033,754;7,025,935;6,998,274;6,942,968;6,913,884;6,890,764;6,890,741;6,858,394;6,846,460;6,812,005;6,770,441;6,663,832;6,620,584;6,544,732;6,429,027;6,396,995;6,355,431和美国专利申请号20060019258;20050266432;20050244870;20050216207;20050181394;20050164246;20040224353;20040185482;20030198573;20030175773;20030003490;20020187515;和20020177141;以及shen,r.等,mutationresearch57370-82(2005)。应用核酸标签的纵览描述于图7c。在如上所述的富集和扩增之后,在步骤702中活化靶基因组dna区,使得它们可结合顺磁粒子。在步骤703中,将测定寡核苷酸、杂交缓冲液和顺磁粒子与活化的dna组合在一起,并使之杂交(杂交步骤)。在某些情况下,对每个待检测的snp加入3个寡核苷酸。3个寡核苷酸中的2个对在snp位的2个等位基因中的每一个都是特异性的,被称为等位基因特异性寡核苷酸(aso)。第三个寡核苷酸与snp位点下游的几个碱基杂交,被称为基因座特异性寡核苷酸(lso)。全部3个寡核苷酸均含有基因组互补区(c1、c2和c3)和通用pcr引物位点(p1、p2和p3)。lso还含有靶向特定珠类型的独有地址序列(地址)。在某些情况下,以该方式至多可查询1,536个snp。在引物杂交过程中,测定寡核苷酸与结合顺磁粒子的基因组dna样品杂交。因为杂交在任何扩增步骤之前进行,所以没有将扩增偏差引入到该测定中。以上引物可被进一步修饰,以起两种作用:测定不同snp的身份和测定得到基因型的分区的身份。在步骤704中,在杂交步骤后,进行几个洗涤步骤,通过除去过量和错杂交的寡核苷酸降低噪音。延伸适宜的aso和延伸产物连接至lso将关于snp位点存在的基因型的信息与lso上的地址序列接合。在步骤705中,已接合的全长产物提供了模板,用于使用通用pcr引物p1、p2和p3进行pcr反应。用两个不同标记(例如cy3和cy5)标记通用引物p1和p2。其它可使用的标记包括发色团、荧光部分、酶、抗原、重金属、磁探针、染料、磷光团、放射性物质、化学发光部分、散射或荧光纳颗粒、raman信号产生部分和电化学检测部分。在步骤706中,洗脱单链的标记dna,并准备杂交。在步骤707中,单链的标记dna通过其独有地址序列与其互补珠类型杂交。在beadchip阵列基质上的goldengateassay产物的杂交允许分离溶液中的、固体表面上的测定产物,用于单独的snp基因型读出。在步骤708中,洗涤阵列并干燥。在步骤709中,使用读取器如beadarray读取器分析标记的信号。例如,当标记为染料标记如cy3和cy5时,读取器可分析sentrixarraymatrix或beadchip上的荧光信号。在步骤710中,其上刻录计算机可执行逻辑的计算机可读介质可在计算机中用于由一个或多个定量dna基因组区进行数据接收,以自动化基因分型聚类和信号检出。使用微阵列进行表达检测和分析部分地描述于valk,p.j.等,newenglandjournalofmedicine350(16),1617-28,2004;modlich,o.等,clinicalcancerresearch10(10),3410-21,2004;onken,michaeld.等,cancerres.64(20),7205-7209,2004;gardian等,j.biol.chem.280(1),556-563,2005;becker,m.等,mol.cancerther.4(1),151-170,2005;和flechner,sm等,amjtransplant4(9),1475-89,2004,以及美国专利号5,445,934;5,700,637;5,744,305;5,945,334;6,054,270;6,140,044;6,261,776;6,291,183;6,346,413;6,399,365;6,420,169;6,551,817;6,610,482;6,733,977;和ep619321;323203。在本文的任一个实施方案中,优选地,平行询问1000、5,000、10,000、50,000、100,000、500,000或1,000,000以上的snp。图6部分地图解了本发明的另一方面,本文的系统和方法可用于诊断、预后和监测肿瘤病症,例如患者的癌症。本文考虑的肿瘤病症的实例包括急性淋巴性白血病、急性或慢性淋巴性或粒细胞肿瘤、急性骨髓性白血病、急性早幼粒细胞性白血病、腺癌、腺瘤、肾上腺癌、基底细胞癌、骨癌、脑癌、乳癌、支气管癌、子宫颈非典型增生、慢性骨髓性白血病、结肠癌、表皮样癌、ewing肉瘤、胆囊癌、胆石肿瘤、巨细胞瘤、多形性胶质母细胞瘤、毛细胞瘤、头癌、增生、增生性角膜神经肿瘤、原位癌、肠神经节瘤、胰岛细胞肿瘤、卡波西肉瘤、肾癌、喉癌、平滑肌瘤、肝癌、肺癌、淋巴瘤、恶性类癌瘤、恶性高钙血症、恶性黑素瘤、马方综合征样肿瘤、髓样癌、转移性皮肤癌、粘膜神经瘤、蕈样肉芽肿、骨髓发育异常综合征、骨髓瘤、颈癌、神经组织癌、成神经细胞瘤、骨原性肉瘤、骨肉瘤、卵巢肿瘤、胰腺癌、甲状旁腺癌、嗜铬细胞瘤、真性红细胞增多症、原发性脑肿瘤、前列腺癌、直肠癌、肾细胞肿瘤、成视网膜细胞瘤、横纹肌肉瘤、精原细胞瘤、皮肤癌、小细胞肺癌、软组织肉瘤、鳞状细胞癌、胃癌、甲状腺癌、局部皮肤病变、网状细胞(veticulumcell)肉瘤和wilm肿瘤。诸如乳癌、结肠癌、肝癌、卵巢癌、前列腺癌和肺癌以及其它肿瘤的癌症将上皮细胞剥落入血流中。存在增加数量的上皮细胞与活动肿瘤或其它肿瘤病症、肿瘤发展和扩散、对治疗的响应差、疾病复发和/或在几年的时间段内存活率下降相关。因此,计数和/或分析血流中的上皮细胞和ctc可用于诊断、预后和/或监测肿瘤病症。在步骤600中,样品得自诸如人的动物。可怀疑人患有癌症或癌症复发或者可能患有癌症,并需要治疗选择。获得的样品是含有正常细胞以及一个或多个ctc、上皮细胞、内皮细胞、干细胞或指示癌症的其它细胞的混合样品。在某些情况下,样品为血样。在某些情况下,多个样品于不同时间点及时得自动物(例如定期间隔,例如每日1次,或2、3或4天1次、每周1次、每半个月1次、每月1次、每半年1次或每年1次)。在步骤602中,然后富集混合样品的上皮细胞或ctc或指示癌症的其它细胞。已发现由实体瘤脱落的上皮细胞以非常低的浓度存在于晚期乳癌、结肠癌、肝癌、卵巢癌、前列腺癌和肺癌患者循环中,这些细胞在血液中的存在情况或相对数量与对治疗的总体预后和响应有关。这些实际上为ctc的上皮细胞可以在出现临床症状之前用作肿瘤扩增或转移的早期指示剂。ctc一般大于大部分血液细胞。因此,一种可用于获得血液中的ctc的方法是基于尺寸富集它们,产生富集ctc的细胞群。另一种富集ctc的方法是通过亲和分离,可以使用对特定细胞表面标记特异性的抗体。有用的内皮细胞表面标记包括cd105、cd106、cd144和cd146;有用的肿瘤内皮细胞表面标记包括tem1、tem5和tem8(参见例如carson-walter等,cancerres.61:6649-6655(2001));有用的间充质细胞表面标记包括cd133。针对这些或其它标记的抗体可得自例如chemicon、abcam和r&dsystems。在一个实施例中,由流体样品(例如血液)富集ctc的基于尺寸的分离模块包含障碍物阵列,其将流体动力学尺寸大于10μm的粒子选择性偏转入第一出口,将流体动力学尺寸小于10μm的粒子选择性偏转入第二出口,使用该阵列由样品富集上皮细胞和ctc。在步骤603中,将富集产物拆分入多个离散地址,例如微孔。可用于本发明的示例性微孔包括具有1536个孔的微板以及更低密度的微板(例如96个和384个孔)。本文设想的微孔板设计包括具有14个出口的那些,其可在同一时间自动分配,以及具有16、24或32个出口的那些,使得例如32个出口可同时分配。图9图示了本文设想的微孔板的一个实施方案。将细胞分配入多个离散地址优选是自动化的。在某些情况下,将约1、5、10或15μl富集样品分配入每个孔中。优选地,孔的大小和分配入每个孔中的体积是使得每个孔仅分配1个细胞,每个孔可适合仅1-5个或少于3个细胞。用于样品拆分的示例性阵列示于图8a。图8b图示了等距视图,图8b图示了该阵列的顶视图和横断面视图。将孔排列为方形阵列,使得随后的每行或每列孔分别与前一行或列的孔相同。在某些实施方案中,孔阵列被布置在约2.0cm2、2.5cm2、3cm2或更大的基质或板上。孔可以为任何形状,例如圆形、方形或椭圆形。每个孔的高度或宽度可为5-50μm、10-40μm或约25μm。每个孔的深度可为至多100、80、60或40μm;一列中两个孔中心之间的半径为10-60μm、20-50μm或约35μm。使用这些配置,2.5cm2面积的孔阵列可具有至少0.1×106个孔、0.2×106个孔、0.3×106个孔、0.4×106个孔或0.5×106个孔。在某些实施方案中,例如示于图8c中的那些,每个孔可在底部具有开口。底部开口优选小于目标细胞的大小。在此情况下,如果ctc的平均半径为约10μm,则每个孔的底部开口可具有至多8、7、6、5、4、3、2或1μm的半径。底部开口使得可使用流动压力将非目标细胞和小于目标细胞的其它组分由孔中除去,将目标细胞留在孔中,用于进一步的加工。执行由离散的预定位置除去细胞的方法和系统公开于美国专利号6,692,952和美国申请序号11/146,581。在某些情况下,孔的阵列可为微电子机械系统(mems),使得其通过微细加工技术将机械元件、传感器、传动装置和电子元件整合在普通的硅基质上。系统中的任何电子元件均可以使用集成电路(ic)工艺步骤(例如cmos、bipolar、或bicmos工艺)加工,而微型机械元件使用相适的显微机械加工工艺加工,该工艺选择性地将部分硅片蚀刻掉,或者加入新的结构层,以形成机械和电子机械装置。孔的mems阵列的一个实例包括每个孔中的mems分离元件。mems分离元件可使用压力和/或真空建立流动,以增加对非目标细胞和粒子的压力,从而通过孔开口脱离孔。在本文的任一个实施方案中,孔的阵列可与显微镜载玻片或其它基质偶联,以允许在显微镜下便利且快速地光学扫描所有室(即离散地址)。在某些实施方案中,使用1536个孔的微量滴定板增强试剂添加和其它操作的便利性。在某些情况下,可将富集产物拆分入孔中,使得每个孔加载大量白细胞(例如多于100、200、500、1000、2000或5000个)。在某些情况下,每个孔分散约2500个白细胞,而随机的孔将具有单个上皮ctc或至多2、3、4或5个上皮细胞或ctc。优选地,计算使单个上皮细胞或ctc进入孔中的概率,使得每个孔加载不超过1个ctc。可以使用poisson统计计算将ctc由样品分配入孔中的概率。当将15ml样品以10μl/孔分配入1536个孔的板中时,直到样品中的ctc数>100,样品孔中加载两个以上ctc的概率才不可忽略。图9图示了将2个ctc加载入同一平板中的概率密度函数。在步骤604中,检测和/或分析每个孔中的稀有细胞(例如上皮细胞或ctc)或稀有dna。在某些实施方案中,检测和分析包括计数上皮细胞和/或ctc。ctc通常具有约1天的短半衰期,它们的存在一般指示增殖肿瘤的近期流入。因此,ctc代表了可反映患者疾病和治疗响应的当前临床状态的动态过程。因此,在某些实施方案中,步骤604包括计数样品中的ctc和/或上皮细胞(孔阵列),并基于它们的数目确定患者是否患有癌症、疾病的严重性、要使用的治疗或所给予治疗的有效性。在某些情况下,本文的方法包括进行一系列检测,可选地以定期间隔进行,例如1天、2天、3天、1周、2周、1个月、2个月、3个月、6个月或1年,人们可追踪随时间变化的患者血流中存在的上皮细胞水平。对于存在癌症的患者,这提供了有用的疾病发展指示,帮助医务工作者基于患者血流中的上皮细胞(例如ctc)的增加、降低或没有变化做出适宜的治疗选择。对于有癌症风险的那些人,所检测细胞数的突然增加可提供患者已出现肿瘤的早期警告。这种早期诊断连同随后的治疗干预,有可能使患者结果与没有诊断信息相比有所改善。在某些情况下,可计数1种以上的细胞(例如上皮细胞、内皮细胞等),并可获得细胞数比率或多种细胞分布的测定结果,以产生诊断或预后。或者,稀有细胞或稀有dna(例如上皮细胞或ctc)的检测可通过检测阵列中一个或多个细胞中的一个或多个癌症生物标记进行,例如在图10中列出的任一个癌症生物标记。癌症生物标记的检测可以使用例如对标记特异性的抗体或通过检测编码癌症生物标记的核酸(例如在图9中所列出的)来完成。在某些情况下,使用单个细胞分析技术分析每个孔中的单个细胞。例如,可对离散位置中的单个细胞进行单细胞pcr,以检测细胞中的一个或多个突变等位基因(thornhillar,j.mol.diag;(4)11-29(2002))或在图9中所列基因的突变。即便在每个孔的细胞数非常低时(例如每个孔1个细胞),也可以使用本领域已知的技术进行胞内pcr基因表达分析。(giordano等,am.j.pathol.159:1231-1238(2001),和buckhaults等,cancerres.63:4144-4149(2003)。在某些情况下,可进行单个细胞表达分析,以检测一个或多个目标基因(包括在图9中列出的那些)的表达(lissb.,nucleicacidsres.,30(2002))。而且,可使用诸如在marguilesm.等,nature,“genomesequencinginmicrofabricatedhigh-densitypicolitrereactors.”doi10.1038中所述的方法对单个细胞进行超深测序,其中片段化整个基因组,使用在它们自身珠上和乳液液滴中的通用适体捕获片段,克隆性扩增。该超深测序还可用于检测与癌症相关的基因的突变,例如在图9中列出的那些。另外,可以使用例如荧光原位杂交,以测定待分析的细胞的一个或多个来源组织。在某些情况下,对每个孔中的细胞进行形态学分析。形态学分析包括鉴定、定量和表征线粒体dna、端粒酶或核基质蛋白。parrella等,cancerres.61:7623-7626(2001),jones等,cancerres.611299-1304(2001);fliss等,science287:2017-2019(2000),和soria等,clin.cancerres.5:971-975(1999)。具体地说,在某些情况下,分子分析包括确定是否存在任何线粒体异常或是否存在核周区室。carew等,mol.cancer1:9(2002);和wallace,science283:1482-1488(1999)。可以使用本领域已知的任何技术检测多种细胞特征,包括:蛋白磷酸化、蛋白糖基化、dna甲基化(das等,j.clin.oncol.22:4632-4642(2004))、微rna水平(he等,nature435:828-833(2005),lu等,nature435:834-838(2005),o'donnell等,nature435:839-843(2005),和calm等,n.engl.j.med.353:1793-1801(2005))、细胞形态或其它结构特征,例如多形性、粘附、迁移、结合、分裂、基因表达水平和存在体细胞突变。该分析可对任何数量的细胞进行,包括单个目标细胞,例如癌细胞。在一个实施方案中,裂解每个孔中的细胞(例如胎儿、母体、上皮或ctc),使用本领域已知的任何方法提取rna。例如,quiagenrneasytm96biorobottm8000系统可用于由每个离散地址自动化高通量分离总rna。一旦提取出rna,就可以进行逆转录反应,以产生cdna序列,该序列然后可用于对靶基因进行多重pcr反应。例如,可以同一反应扩增1个或1个以上的、2、3、4、5、6、7、8、9、10、15或20个靶基因。当1个以上的靶基因用于同一扩增反应时,选择可与其它引物对多重化的引物(相当均一的解链温度、没有对人基因组的交叉引发,以及基于序列分析没有引物-引物相互作用)。多种染料和多色荧光读数可用于增加多重化能力。可用于标记扩增用引物的染料的实例包括但不限于发色团、荧光部分、酶、抗原、重金属、磁探针、染料、磷光团、放射性物质、化学发光部分、散射或荧光纳颗粒、raman信号产生部分和电化学检测部分。在又一个实施方案中,使用本文公开的一种或多种方法富集胎儿或母体细胞或细胞核。优选地,通过使样品流经障碍物阵列富集胎儿细胞,所述阵列将不同流体动力学尺寸的颗粒或细胞选择性地导向不同出口,使得胎儿细胞和大于胎儿细胞的细胞被导向第一出口,小于稀有细胞的一种或多种细胞或颗粒被导向第二出口。然后使用本领域已知的纯化技术由富集细胞(胎儿或母体细胞)获得总rna或聚腺苷酸mrna。一般而言,约1μg至2μg的总rna就足够了。接着,使用逆转录酶和单个t7-寡聚(dt)引物合成首链互补dna(cdna)。接着,使用dna连接酶、dna聚合酶和rna酶合成第二链cdna。接着,纯化双链cdna(ds-cdna)。在又一个实施方案中,由富集细胞(胎儿细胞或母体细胞)提取总rna。接着,使用200ng总rna对每个rna提取物进行两个四分之一规模的messageampii反应(ambion,austin,texas)。messageamp是基于反义rna(arna)扩增的方法,包括一系列酶促反应,导致线性扩增极少量的rna用于阵列分析。与指数rna扩增方法如nasba和rt-pcr不同,arna扩增保持代表起始mrna群。该方法以使用含有寡聚(dt)和t7rna聚合酶启动子序列这二者的引物逆转录的总rna和多聚(a)rna开始。在首链合成后,用rna酶h处理反应物,以将mrna切成小片段。这些小rna片段在产生双链cdna模板的第二链合成反应中用作引物。在某些实施方案中,标记并测序由得自胎儿或母体细胞的mrna逆转录的cdna。cdna的类型和丰度可用于确定细胞是否为胎儿细胞(例如根据y染色体特异性转录物的存在情况)或胎儿细胞是否具有遗传异常(例如异倍性、可变转录物的丰度或类型或具有dna甲基化或印记的问题)。在一个实施方案中,可对在上皮细胞中表达但不在正常细胞中表达的基因进行pcr扩增,例如保留在富集产物中的白细胞或其它细胞。可按照本文方法分析的示例性基因包括egfr、epcam、ga733-2、muc-1、her-2、紧密连接蛋白-7和在图10中鉴定的任何其它基因。例如,分析这些多肽或核酸(例如细胞表面标记、基因组dna、mrna或微rna)的表达水平或模式,可产生对癌症的诊断或预后。在某些实施方案中,标记并测序由得自胎儿或母体细胞的mrna逆转录的cdna。cdna的类型和丰度可用于确定细胞是否为胎儿细胞(例如根据y染色体特异性转录物的存在情况)或胎儿细胞是否具有遗传异常(例如异倍性,或具有dna甲基化或印记的问题)。在某些实施方案中,分析步骤604包括鉴定混合样品中表达在非稀有细胞中不表达的基因(例如egfr或epcam)的细胞。例如,循环肿瘤细胞的重要指示剂是存在/以高水平表达egfr或egf,其中非癌性上皮细胞即便有的话也以较小量表达egfr或egf。另外,对于肺癌和其它癌症,在egfr中存在或不存在某些突变可能也与癌症的诊断和/或预后相关,并也可用于选择更有效的治疗(参见例如国际公布号wo2005/094357)。例如,许多具有egfr突变的非小细胞肺肿瘤响应于小分子egfr抑制剂,例如吉非替尼(iressa;astrazeneca),但经常最终获得使它们成为药物抗性的次级突变。在某些实施方案中,人们可以如下确定对患者的治疗性治疗:通过使用本文的方法富集上皮细胞和/或ctc,拆分细胞样品(优选这样:离散位置中不超过1个ctc),并检测这些细胞的egfr基因的一个或多个突变。可以分析的示例性突变包括聚集在egfrtk结构域的atp结合袋周围的那些,已知它们使细胞对吉非替尼抑制敏感。因此,存在这些突变支持有可能响应于使用吉非替尼的治疗的癌症诊断。许多响应于吉非替尼的患者最终发展出次级突变,经常在tk结构域的外显子20中的790位出现甲硫氨酸-苏氨酸置换。该类突变使这些患者抗吉非替尼。因此,本发明同样设想了针对该突变的测试,以提供进一步的诊断信息。因为迄今为止报告的许多egfr突变,包括在nsc肺癌中的所有egfr突变,已知赋予对吉非替尼的敏感性或抗性,位于外显子18-21的编码区内,所以可在用于突变存在情况的测定开发中强调egfr基因的该区域。可用于检测egfr中的突变的引物的实例包括列于图11的那些。在步骤605中,基于以上进行的分析针对患者病症做出决定。在某些情况下,可以诊断患者是否患有癌症。在某些情况下,可以预测患有特定类型癌症的患者的预后。对于患有癌症的患者,可基于检测到的突变类型确定疗法。在又一个实施方案中,可以使用本文所述的一种或多种测序方法检测混合样品(例如循环肿瘤细胞和循环正常细胞)中的癌细胞。简而言之,由每个位置的细胞提取rna,并如上所述转变为cdna。然后扩增靶基因,并进行高通量超深测序,以检测与癌症相关的突变表达水平。vi.计算机可执行逻辑本文的任何步骤均可使用计算机程序产品执行,所述产品包括刻录在计算机可读介质上的计算机可执行逻辑。例如,计算机程序可以使用靶基因组dna区的数据,以确定样品中是否存在胎儿细胞,并确定所检测细胞中的胎儿异常。在某些实施方案中,计算机可执行逻辑使用关于str或snp密度的数据输入,以确定测试样品中胎儿细胞的存在情况,并确定所述细胞中的胎儿异常性和/或病症。可特别地设计并配置计算机程序,以支持和执行部分或全部功能,用于确定混合样品中稀有细胞(例如胎儿细胞或上皮/ctc)的存在情况,以及异常性和/或与这些稀有细胞或其dna相关的病症,所述功能包括以下作用:(i)控制细胞或dna拆分或分拣入离散位置,(ii)在来自混合样品和可选的对照样品的细胞中扩增基因组dna的一个或多个区,例如三体区和非三体区(尤其是dna多态性,例如str和snp),(iii)接收分析的一个或多个基因组dna区的数据(例如测序或基因分型数据);(iv)鉴定具有稀有(例如非-母体)等位基因的分区,(v)将具有稀有(例如非-母体)等位基因的分区鉴定为含胎儿细胞或上皮细胞的分区,(vi)测定混合样品中的稀有细胞(例如胎儿细胞或上皮细胞)数,(vii)检测鉴定的胎儿细胞中母体和非-母体等位基因的水平,(viii)检测所述胎儿细胞中的胎儿异常或病症,和/或(ix)检测肿瘤病症和与该病症相关的信息,例如其流行性、起源、对药物治疗的易感性等。具体地说,所述程序可将每种多态性的等位基因丰度的量的数据拟合为一个或多个数据模型。使用在高度富集胎儿细胞的样品的dna中的基因座存在的扩增多态性的数据提供一个数据模型实例,用于确定是否存在异倍性。可由计算机程序或用户确定混合样品中胎儿细胞的存在情况和所述细胞中的胎儿异常性和/或病症。在一个实施例中,令‘f’为具体pcr反应中的胎儿/母体dna拷贝比率。三体性将母体对父体等位基因的比率增加1+f/2倍。pcr效率在基因座内的等位基因之间以由σ等位基因2给出的对数均方差变化,并在基因座之间以σ基因座2变化,其中该第二个方差由于引物效率的差异而往往更大。na是每个怀疑的异倍体染色体的基因座,nc是对照基因座。如果在任何基因座的两个母体等位基因强度的平均值为‘m’,父体等位基因强度为‘p’,那么预期的方差为ln(比率(m/p))的平均值,其中对n个基因座所取的该平均值由2(σ等位基因2)/n给出。在考虑怀疑的异倍性区和对照区之间的该ln(比率(m/p))的平均值差异时,该差异的误差如下给出:σ差异2=2(σ等位基因2)/na+2(σ等位基因2)/nc(1)为粗略检测异倍性,我们要求3σ差异<f/2为简化起见,假定等式1中na=nc=n,这得到必要条件6σ等位基因/n1/2<f/2(3)或最小值nn=144(σ等位基因/f)2(4)在三体性检测背景下,怀疑的异倍性区通常为整个染色体,n代表每个染色体的基因座数。作为参考,在表2中针对σ等位基因和f的多个值求等式3的n。测序的作用是检测扩增步骤的等位基因丰度输出。合乎需要的是这样做而没有由于选择仅有限量的测序用扩增子的poisson统计增加显著更多的错误。归因于poisson统计的ln(丰度)的rms误差约为(n读取序列)-1/2。理想的是保持该值低于或等于pcr误差σ等位基因。因此,典型的父体等位基因需要分配至少(σ等位基因)-2个读取序列。母体等位基因由于更丰富而没有在形成针对m/p的比估计时可观地增加该误差。输入测序的混合物包含得自n基因座的扩增子,其基因座约f/2丰度分数为父体等位基因。因此,每个等份孔所需要的读取序列总数以约2n基因座/(fσ等位基因2)给出。合并等式4的该结果发现,所有孔中读取序列的总数由n读取序列=288个n孔f-3近似给出。因此,所述程序可以确定为测定患者样品中是否存在异倍性而需要获得的读取序列的总数。计算机程序可在任何计算机中工作,所述计算机可为众多类型的一般用途计算机中的任一种,例如个人计算机、网络服务器、工作站或现在或未来开发的其它计算机平台。在某些实施方案中,描述了含有计算机可用介质的计算机程序产品,所述介质中存储有计算机可执行逻辑(计算机软件程序,包括程序码)。计算机可执行逻辑可通过处理器执行,使处理器执行本文描述的功能。在其它实施方案中,某些功能主要在硬件中使用例如硬件状态机实现。例如,实现硬件状态机以便进行本文所述功能对相关领域的技术人员显而易见。在一个实施方案中,执行本发明的计算机逻辑的计算机还可以包括数字输入装置,例如扫描仪。数字输入装置可以依据本发明的方法提供靶基因组dna区(例如dna多态性,优选str或snp)的图像。例如,扫描仪可以通过检测荧光、放射性或其它发射提供图像;通过检测传播的、反射的或散射的辐射提供图像;通过检测电磁特性或特征提供图像;或通过其它技术提供图像。根据发射类型和其它因素使用多种检测方案。数据通常以数据文件的形式记录在存储装置中,例如上述的系统存储器。在一个实施方案中,扫描仪可以鉴定一个或多个标记靶。例如,在本文描述的基因分型分析中,可以用响应于特定频率激发源以特定特征频率或窄带频率发荧光的第一种染料标记第一个dna多态性。可以用以不同特征频率发荧光的第二种染料标记第二种dna多态性。第二种染料的激发源可以但不是必须具有与第一种染料的激发源不同的激发频率,例如,激发源可以为相同或不同的激光器。在一个实施方案中,人们可以检查由图象档案中的数据建立的打印或显示图像,并可以鉴定适于按照本发明方法分析的数据(例如得自微阵列的荧光)。在又一个实施方案中,信息以自动化的、可定量的和可重复的方式提供,所述方式与多种图像处理和/或分析技术相适应。本发明的又一方面是允许富集和分析在样品中少量存在的稀有细胞的试剂盒。这些试剂盒可以包括描述用于单独步骤或涵盖富集至遗传分析基因组材料的步骤组合的任何材料或材料组合。因此,所述试剂盒可以包括用于基于尺寸分离或富集的阵列、用于独特标记每个细胞的标记、用于将细胞拆分入单独的可寻址部位中的装置和用于遗传分析的试剂。例如,试剂盒可以包含用于基于尺寸分离的阵列、用于细胞的独有标记和用于检测多态性(包括str或snp)的试剂,例如用于进行pcr的试剂。尽管本文已显示并描述了本发明的优选实施方案,但对本领域技术人员显而易见的是,这些实施方案仅作为实例提供。在不偏离本发明的情况下,本领域技术人员现在会想到众多变化、改变和替代。应当理解的是,对本文描述的本发明的实施方案的多种替代可用于实施本发明。拟由以下的权利要求限定本发明的范围,并因此包括在这些权利要求范围及其等同实施方案范围内的方法和结构。实施例实施例1.分离胎儿脐血图1e显示了用于由胎儿脐血分离有核细胞的装置的示意图。尺寸:100mm×28mm×1mm阵列设计:3段,第一、第二和第三段的间隙大小分别=18、12和8μm。装置加工:使用标准光刻法和深度硅反应蚀刻技术在硅中加工阵列和通道。蚀刻深度为140μm。使用koh湿蚀刻制作用于流体进入的通孔。使用与血液相适的压力敏感性粘附剂(9795,3m,stpaul,mn)在蚀刻表面上密封硅基质,以形成密闭的流体通道。装置装配:该装置机械性紧密连接具有外部流体贮存器的塑料歧管,以将血液和缓冲液传递至所述装置,并提取产生的级分。(00217]装置操作:使用外部压力源向缓冲液和血液贮存器施加2.0psi的压力,以调节经由装配的装置的流体传递和提取。实验条件:将人胎儿脐血抽取入含有柠檬酸葡萄糖抗凝剂的磷酸缓冲盐水中。于室温并在抽取的48小时内,使用上述装置以3ml/小时加工1ml血液。将血液的有核细胞与无核细胞(红细胞和血小板)分离,将血浆传递入含有1%牛血清白蛋白(bsa)(a8412-100ml,sigma-aldrich,stlouis,mo)和2mmedta(15575-020,invitrogen,carlsbad,ca)的无钙和镁的dulbecco磷酸缓冲盐水(14190-144,invitrogen,carlsbad,ca)缓冲液流中。检测技术:制备产物和废物级分的细胞涂片(图12a-12b),并用改良的wright-giemsa(wg16,sigmaaldrich,st.louis,mo)染色。性能:在产物级分中观察到胎儿有核红细胞(图12a),废物级分中不存在(图12b)。实施例2.由母体血液分离胎儿细胞在实施例1中详述的装置和方法与免疫磁性亲和富集技术组合使用,以证实由母体血液分离胎儿细胞的可行性。实验条件:将怀有男性胎儿的同意母体供体的血液收集到k2edta真空采血管(366643,bectondickinson,franklinlakes,nj)中,之后立即选择终止妊娠。于室温并在抽取的9小时内,使用在实施例1中描述的装置加工未稀释的血液。将血液的有核细胞与无核细胞(红细胞和血小板)分离,将血浆传递入含有1%牛血清白蛋白(bsa)(a8412-100ml,sigma-aldrich,stlouis,mo)的不含钙和镁的dulbecco磷酸缓冲盐水(14190-144,invitrogen,carlsbad,ca)的缓冲液流中。随后,用抗-cd71微珠标记有核细胞级分(130-046-201,miltenyibiotechinc.,auburn,ca),并使用minimacstmms柱(130-042-201,miltenyibiotechinc.,auburn,ca)按照生产商的说明富集。最后,将cd71-阳性级分点样在玻璃载玻片上。检测技术:按照生产商的说明,使用vysis探针(abbottlaboratories,downer'sgrove,il),使用荧光原位杂交(fish)技术染色点样的载玻片。对样品中存在的x和y染色体染色。在一种情况下,又对由已知的21三体妊娠制备的样品的染色体21染色。性能:通过在由有核细胞级分制备的cd71阳性群中可信存在的雄性细胞证实胎儿细胞分离(图13a-13f)。在测试的单个异常情况中,还鉴定到21三体病理(图14)。实施例3.证实在富集样品中存在雄性胎儿细胞证实在富集样品中存在雄性胎儿细胞使用qpcr进行,qpcr采用dyz特异性引物,dyz是在y染色体上以高拷贝数重复的标记。在通过本文所述的任何方法富集fnrbc之后,通过将样品分入100个pcr孔中对产生的富集fnrbc分区。在分区前,可通过fish筛选富集样品,以确定含有目标异倍性的任何fnrbc的存在情况。因为在母体血液中的fnrbc数量低,所以仅一部分孔包含单个fnrbc(预期其它孔对fnrbc为阴性的)。在2%多聚甲醛中固定细胞,并储存于4℃。沉淀每个分区中的细胞,并重悬浮在5μlpbs加1μl20mg/ml蛋白酶k(sigma#p-2308)中。细胞于65℃温育60分钟裂解,之后于95℃温育15分钟失活蛋白酶k。对于每个反应,加入引物组(dyz正向引物tcgagtgcattccattccg;dyz反向引物atggaatggcatcaaacggaa;和dyztaqman探针6fam-tggctgtccattcca-mgbnfq)、taqman通用pcrmastermix、noamperase和水。操作样品,并在abi7300上进行分析:2分钟,50℃;10分钟,95℃;接着40个循环,95℃(15秒)和60℃(1分钟)。在证实存在雄性胎儿细胞后,对含有fnrbc的分区进行进一步的分析。可在进一步分析前合并阳性分区。图30显示了该实验的预期结果。图30中的数据通过以下方案收集。通过两个蔗糖梯度的血红素提取(he)由男性胎儿的脐带细胞血富集有核红细胞。在2%多聚甲醛中固定细胞,并储存于4℃。沉淀约10×1000细胞,并每个均重悬浮在5μlpbs加1μl20mg/ml蛋白酶k(sigma#p-2308)中。于65℃温育60分钟裂解细胞,接着于95℃温育15分钟失活蛋白酶k。合并细胞,并用pbs连续稀释10倍,用以获得每6μl100个、10个和1个细胞的终浓度。以96孔形式一式四份测定6μl的每个稀释度。对于每个反应,将引物组(0.9μmdyz正向引物tcgagtgcattccattccg,0.9μmdyz反向引物atggaatggcatcaaacggaa;和0.5μmdyztaqman探针6fam-tggctgtccattcca-mgbnfq)、taqman通用pcrmastermix、noamperase和水加入至每个反应25μl终体积。操作平板并在abi7300上分析:2分钟,50℃;10分钟,95℃;接着40个循环的95℃(15秒)和60℃(1分钟)。这些结果表明,有可能使用该方法检测分区中的单个fnrbc。实施例4.通过str分析证实在富集样品中存在胎儿细胞通过基于尺寸的分离模块处理母体血液,随后有或没有mhem富集fnrbc。然后使用对目标异倍性特异性的探针对增强的样品进行fish分析(例如13三体、18三体和xyy)。使用标准的显微操作技术通过由增强的样品“拔出”单独的阳性细胞分离单独的阳性细胞。使用嵌套pcr方案,扩增str标记组并分析,以证实fish-阳性异倍体细胞为胎儿来源。对于该分析,典型的是与母体基因型比较。潜在的所获数据集的实例示于表3。非母体等位基因可通过父体基因分型或已知胎儿组织样品的基因分型证实为父体等位基因。可以看出,在产生的细胞中存在父体等位基因,证实细胞为胎儿来源(细胞#1、2、9和10)。可合并阳性细胞,用于进一步的分析,以诊断胎儿异倍性,或者可以单独地进一步分析。表3.在母体和胎儿细胞中的str基因座等位基因实施例5.通过snp分析证实富集样品中存在胎儿细胞通过基于尺寸的分离模块处理母体血液,随后有或没有mhem富集fnrbc。然后使用对目标异倍性特异性的探针对增强的样品进行fish分析(例如13三体、18三体和xyy)。然后将fish分析测试为阳性的样品分区入96孔微量滴定板的孔中,每个孔均含有15μl增强的样品。在96孔中,预期5-10个含单个fnrbc,每个孔应当含有约1000个有核母体细胞(wbc和mnrbc这二者)。沉淀细胞,并重悬浮在5μlpbs加1μl20mg/ml蛋白酶k(sigma#p-2308)中。于65℃温育60分钟裂解细胞,之后于95℃温育15分钟失活蛋白酶k。在本实施例中,针对特定snp组别的母体基因型(bb)和胎儿基因型(ab)是已知的。基因型a和b包含全部3个snp,并在全部3个snp方面彼此不同。以下的染色体7的序列含有这3个snp(分别在括弧中指示的rs7795605、rs7795611和rs7795233):(atgcagcaaggcacagactaa[g/a]caaggaga[g/c]gcaaaattttc[a/g]taggggagagaaatgggtcatt)。在第一轮pcr中,使用对胎儿特异性的等位基因a的外部部分特异性的引物扩增分区的富集细胞的基因组dna,该引物侧接内部snp(正向引物atgcagcaaggcacagactacg;反向引物agaggggagagaaatgggtcatt)。在第二轮pcr中,用对等位基因a的内部部分特异性的引物使用实时sybrgreenpcr进行扩增,该引物包含内部snp(正向引物caaggcacagactaagcaaggagag;反向引物ggcaaaattttcataggggagagaaatgggtcatt)。预期结果示于图31。在此,96个孔中的6个对等位基因a测试阳性,证实存在胎儿来源的细胞,因为母体基因型(bb)是已知的,不可能对等位基因a为阳性。可合并阳性孔的dna进行进一步的分析,或者可单独分析阳性孔的dna。实施例6.使用分子倒置探针进行定量基因分型,用于胎儿细胞的三体性诊断胎儿细胞或细胞核可以如在富集部分中所述或如在实施例1中所述分离。然后,可使用定量基因分型检测染色体拷贝数改变。图5图示了流程图,其指示的主要步骤涉及使用本文描述的方法检测染色体拷贝数改变。例如,在实施例1中描述的富集方法可以由取自头三个月后期的最初20ml血样开始,产生含约500个母体白细胞(wbc)、约100个母体有核红细胞(mnbc)和最低约10个胎儿有核红细胞(fnrbc)的最终混合物。富集方法的输出应被分入具有选定的孔数目的微量滴定板的独立孔中,所以每个孔定位不超过1个细胞或基因组拷贝,其中某些孔可能根本没有细胞或基因组拷贝。进行多重pcr和嵌套pcr:然后可将用于多个(40-100个)高多态性snp的pcr引物对加入微量滴定板中的每个孔。例如,可根据染色体13、18、21和x设计snp引物,以检测最常见的异倍体,并根据其中预期无异倍性的基因组的对照区设计snp引物。应针对每个目标染色体设计多个(约10个)snp,以允许无信息的基因型,并确保精确的结果。在下表中列出的snp可用于进行分析,并可如下所述设计相关的pcr引物。应选择与其它引物对多重化的pcr引物(相当均一的解链温度、没有对人基因组的交叉引发,以及基于序列分析没有引物-引物相互作用)。应设计引物,以产生70-100bp大小的扩增子,以增加多重pcr的效力。引物应在5'上包含22bp的标记,其用于基因分型分析。多重pcr方案可如在findlay等,molecularcellendocrinology183(2001)s5-s12中所述进行。引物浓度可以由每个反应0.7pmol-60pmol变化。简而言之,pcr以每孔25μl总体积、taq聚合酶缓冲液(perkin-elmer)、200μmdntp、引物、1.5mmmgcl2和0.6单位amplitaq(perkin-elmer)进行。在于95℃变性5分钟后,在mjdnaengine热循环仪中进行41个循环的94℃、60℃和72℃,45秒。可根据要扩增的引物对,用不同于60℃的退火温度进行扩增。最终的延伸可达10分钟。可使用嵌套引物进行第二轮pcr,以确保多重扩增的最佳效力。用得自pcr试剂盒的无核酸酶的水将2μl等份的每个pcr反应物稀释40倍(至80μl总量)。产生无模板或阴性的对照,以测试污染。根据要扩增的引物对,用60℃-68℃的退火温度进行采用嵌套pcr引物的扩增。由affymetrix(santaclara,ca)开发的分子倒置探针(mip)技术可以在单一反应中基因分型20,000以上的snp。在典型的mip测定中,每个snp应被分配22bp的dna标签,其允许在高度平行的基因分型测定中独有地鉴定snp。在该实施例中,dna标签起两个作用:(1)确定不同snp的身份,和(2)确定得到基因型的孔的身份。例如,基因分型500个不同孔中的40个相同snp应需要总共20,000个标签(4个染色体×10个snp×500个孔)。标记的mip探针应与初始多重单细胞pcr(或嵌套pcr)的扩增子组合,并应进行基因分型反应。探针/模板混合物应被分入4个管中,每个管含有不同的核苷酸(例如g、a、t或c)。在延伸和连接步骤后,应用外切核酸酶处理混合物,以除去所有线性分子,继续存在的环形分子的标签应使用pcr扩增。然后合并构成所有分区的扩增标签,并与含有20,000个标签中的每一个的互补序列的单个dna微阵列杂交。鉴定含非母体等位基因(例如胎儿细胞)的分区:数据分析程序中的第一步应是使用22bp的标签,以将20,000个基因型分拣入对应于原始微量滴定板的单独孔的分区中。第二步应鉴定含非母体等位基因的分区,这些分区对应于含胎儿细胞的各孔。确定含非母体等位基因的区数相对于总区数应提供在原始富集细胞群中存在的fnrbc数的精确估计。在鉴定给定分区中的胎儿细胞时,应通过40个独立snp检测非母体等位基因,这提供了极高水平的结果置信度。检测染色体13、18和21的倍数性:在鉴定含胎儿细胞的约10个分区后,下一步应通过比较每个染色体上的10个snp的每一个的母体对父体等位基因的比率,确定染色体13、18、21和x的倍数性。每个染色体上的多个snp的比率可以组合(平均),以增加该染色体的异倍性检出信号的置信度。另外,含胎儿细胞的约10个独立分区的信息也可以组合,以进一步增加检出信号的置信度。实施例7.用于胎儿细胞的三体性诊断的超深测序胎儿细胞或细胞核可以如在富集部分中所述或如在实施例1中所述分离。在实施例1中描述的富集方法可以由取自头三个月后期的最初20ml血样开始,产生含约500个母体白细胞(wbc)、约100个母体有核红细胞(mnbc)和最低约10个胎儿有核红细胞(fnrbc)的最终混合物。富集方法的输出应被分入具有选定的孔数目的微量滴定板的独立孔中,所以每个孔定位不超过1个细胞或基因组拷贝,其中某些孔可能根本没有细胞或基因组拷贝。进行多重pcr和用分区特异性标签进行超深测序:然后将高度多态性的str基因座(每个目标染色体多个基因座)的pcr引物对加入微量滴定板中的每个孔。在下表中列出的多态str可用于进行分析,并可设计相关的pcr引物。每个str的引物将具有两个重要特征。首先,每个引物将在5'末端包含共有的约18bp序列,该序列用于随后的dna克隆和测序程序。其次,微量滴定板中的每个孔被分配独有的约6bp的dna标签序列,其掺入到每个不同str的上游引物的中间部分。dna标签使得有可能在多重pcr之后合并所有的str扩增子,这使得有可能在超深测序程序中更成本有效地平行分析扩增子。长约6bp的dna标签兼顾了信息量(4096个潜在分区)和合成引物的成本。多重pcr方案可如在findlay等,molecularcellendocrinology183(2001)s5-s12中所述进行。引物浓度可以由每个反应0.7pmol-60pmol变化。简而言之,pcr以每孔25μl总体积、taq聚合酶缓冲液(perkin-elmer)、200μmdntp、引物、1.5mmmgcl2和0.6单位amplitaq(perkin-elmer)进行。在于95℃变性5分钟后,在mjdnaengine热循环仪中进行41个循环的94℃、60℃和72℃,45秒。可根据要扩增的引物对,用不同于60℃的退火温度进行扩增。最终的延伸可达10分钟。在pcr之后,合并微量滴定板中的每孔的扩增子,纯化,并使用如在margulies等,nature437(2005)376-380中所述的单分子测序策略分析。简而言之,稀释扩增子,并与珠混合,使得每个珠均捕获单个分子的扩增材料。通过产生油包pcr反应混合物乳液制备的单独的100μm水性液滴分离携带dna的珠。然后扩增每个珠上的dna分子,产生数百万拷贝的序列,它们全部保持与珠结合。最后,将珠置于高度平行的合成测序机器中,该机器在单次4小时运行中产生400,000多个读取序列(每个读取序列约100bp)。超深测序提供了精确定量的方式来检测每个str的等位基因丰度。每个等份试样孔所需要的读取序列总数由str数和多重pcr的误差率以及与测序方法相关的poisson抽样统计来确定。可说明扩增差异的统计学模型可用于以高置信水平检测倍数性变化。使用该统计学模型,可以预测分析每名患者需要约100,000-300,000个读取序列,每个染色体约3-10个str基因座。具体地说,在微量滴定板的每个单独孔中的12个str中的每一个都将读取约33个读取序列(33个读取序列×12个str/孔×500个孔=200,000个读取序列)。鉴定含非母体等位基因(例如胎儿细胞)的分区:数据分析步骤中的第一步应使用6bpdna标签将200,000个读取序列分拣入对应于微量滴定板的单独孔的分区中。然后,使用标准序列比对算法将每个分区的约400个读取序列分入不同的str组别中。然后,应分析每个分区的比对序列,以鉴定非母体等位基因。这些可以以两种方式之一鉴定。首先,可以如上所述分析已知仅含母体细胞的独立血样级分。该样品可以为白细胞级分(其将仅包含可忽略数的胎儿细胞),或者仅仅在富集前稀释原初样品。或者,所有孔的基因型分布均可进行相似度聚类,以鉴定与母体细胞相关的显性模式。在任一种方案中,非母体等位基因的检测然后确定在初始微量滴定板中的哪些孔含有胎儿细胞。确定含非母体等位基因的区数相对于总区数提供了对初始富集细胞群中存在的胎儿细胞数的估计。含有胎儿细胞的分区应以高置信水平鉴定,因为非母体等位基因通过多个独立的str检测。检测染色体13、18和21的倍数性:在鉴定含有胎儿细胞的分区后,下一步应通过比较每个str的母体对父体等位基因的比率确定染色体13、18和21的倍数性。再者,对于每个分区,12个str中的每一个都将有约33个读取序列。在正常胎儿中,给定的str具有1:1的母体对父体等位基因比率,每个等位基因(正常二等位基因)对应约16个读取序列。在三体性胎儿中,3剂str标记可被检测为具有1:1:1比率(三体性三等位基因)的3个等位基因或具有21比率(三体性二等位基因)的2个等位基因。在罕有情况下,全部3个等位基因都可以相同,基因座将不提供该单独患者的信息。每个染色体上的不同str的信息可以组合,以增加给出的异倍性检出信号的置信度。另外,含有胎儿细胞的独立分区的信息也可以组合,以进一步增加检出信号的置信度。实施例8.用于胎儿细胞的三体性诊断的测序胎儿细胞或细胞核可以如在富集部分中所述或如在实施例1和2中所述分离。然后,测序方法可用于检测染色体拷贝数改变。图4图示了流程图,其指示的主要步骤涉及使用本文描述的方法检测染色体拷贝数改变。例如,在实施例1中描述的富集方法可以由取自头三个月后期的最初20ml血样开始,产生含约500个母体白细胞(wbc)、约100个母体有核红细胞(mnbc)和最低约10个胎儿有核红细胞(fnrbc)的最终混合物。富集方法的输出应被分入具有选定的孔数目的微量滴定板的独立孔中,所以每个孔定位不超过1个细胞或基因组拷贝,其中某些孔可能根本没有细胞或基因组拷贝。进行多重pcr和采用分区特异性标签进行测序:可将用于高多态性str基因座(每个目标染色体多个基因座)的pcr引物对加入微量滴定板中的每个孔。例如,可根据染色体13、18、21和x设计str,以检测最常见的异倍体,并根据其中预期无异倍性的基因组的对照区设计str。通常,每个目标染色体应分析4个以上的str,以确保精确的异倍性检测。每个str的引物都可以设计得具有两个重要特征。首先,每个引物都可以在5'末端上包含共有的约18bp序列,其可用于随后的dna克隆和测序程序。其次,微量滴定板中的每个孔都可以分配独有的约6bpdna标签序列,其可掺入到不同str的每一个的上游引物的中间部分。该dna标签使得有可能在多重pcr之后合并所有的str扩增子,这使得有可能在超深测序程序中平行分析扩增子。而且,用于str扩增的嵌套pcr策略可以由单个细胞实现更高的扩增可靠性。测序可以使用经典的sanger测序法或本领域已知的任何其它方法进行。例如,测序可通过合成测序进行,合成测序包括通过合成与靶核酸序列互补的链推测模板序列。合成测序可使用与核酸标签上的测序元件互补的测序引物启动。该方法包括在聚合酶反应中将标记的核苷酸或核苷酸类似物掺入互补核酸序列的增长链中之后(基本上实时)或当时(实时)立即检测每个核苷酸的身份。在成功掺入标记核苷酸后,检测信号,然后通过本领域已知的方法消除信号。合成测序方法的实例描述于美国申请公布号2003/0044781、2006/0024711、2006/0024678和2005/0100932。可用于标记合成测序用核苷酸或核苷酸类似物的标记的实例包括但不限于发色团、荧光部分、酶、抗原、重金属、磁探针、染料、磷光团、放射性物质、化学发光部分、散射或荧光纳颗粒、raman信号产生部分和电化学检测部分。合成测序每小时可以产生至少1,000个、至少5,000个、至少10,000个、至少20,000个、30,000个、至少40,000个、至少50,000个、至少100,000个或至少500,000个读取序列。每个这样读取序列可具有至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少120个或至少150个碱基。另一种测序方法包括使扩增的目标基因组区与同其互补的引物杂交。该杂交复合物与聚合酶、atp硫酸化酶、萤光素酶、三磷酸腺苷双磷酸酶以及底物萤光素和腺苷酰硫酸温育。接着,顺序加入对应于碱基a、c、g和t(u)的脱氧核苷三磷酸。每个碱基掺入伴随着焦磷酸释放,通过硫酸化酶转变为atp,atp驱动氧化萤光素的合成和可见光的释放。因为焦磷酸释放与掺入碱基的数量等摩尔,所以发出的光与在任一个步骤加入的核苷酸数成比例。重复该过程,直至完整序列被测定。又一个测序方法包括通过连接方案(简并连接)进行的4色测序,其包括使锚定引物与4个位置中的1个杂交。然后,进行锚定引物与用荧光染料标记的简并九聚体群的酶连接反应。在任意给定的循环,所用的九聚体群的结构使其位置之一的身份与连接至该九聚体的荧光团的身份相关联。就连接酶区分该查询位置的互补性而言,荧光信号允许推断碱基身份。在进行连接和4色成像后,剥下锚定引物:九聚体复合物,开始新循环。鉴定含非母体等位基因(例如胎儿细胞)的分区:数据分析步骤中的第一步应使用6bpdna标签将200,000个读取序列分拣入对应于微量滴定板的单独孔的分区中。然后,使用标准序列比对算法将每个分区的约400个读取序列分入不同的str组别中。然后,应分析每个分区的比对序列,以鉴定非母体等位基因。这些可以以两种方式之一鉴定。首先,可以如上所述分析已知仅含母体细胞的独立血样级分。该样品可以为白细胞级分(其将仅包含可忽略数的胎儿细胞),或者仅仅在富集前稀释原初样品。或者,所有孔的基因型分布均可进行相似度聚类,以鉴定与母体细胞相关的显性模式。在任一个方案中,检出非母体等位基因随后确定在初始微量滴定板中的哪些孔含有胎儿细胞。确定相对于总区数的含非母体等位基因的区数提供了对初始富集细胞群中存在的胎儿细胞数的估计。因为通过多个独立str检测出非母体等位基因,所以以高置信水平鉴定出含有胎儿细胞的分区。检测染色体13、18和21的倍数性:在鉴定含有胎儿细胞的分区后,下一步应通过比较每个str的母体对父体等位基因的比率确定染色体13、18和21的倍数性。再者,对于每个分区,12个str中的每一个都将有约33个读取序列。在正常胎儿中,给定的str具有1:1的母体对父体等位基因比率,每个等位基因(正常二等位基因)对应约16个读取序列。在三体性胎儿中,3剂str标记可被检测为具有1:1:1比率(三体性三等位基因)的3个等位基因或具有2:1比率(三体性二等位基因)的2个等位基因。在罕有情况下,全部3个等位基因都可以相同,基因座将不提供该单独患者的信息。每个染色体上不同str的信息可以组合,以增加给出的异倍性检出信号的置信度。另外,含有胎儿细胞的独立分区的信息也可以组合,以进一步增加该检出信号的置信度。实施例9.装置实施方案本发明的微流化装置通过计算机辅助设计(cad)来设计,并通过光刻法显微加工。开发两步法,其中首先压实血样,以除去一大群小细胞,然后通过免疫亲和捕获回收稀有目标—上皮细胞靶细胞。所述装置通过光刻法勾画轮廓,并基于cad产生的设计蚀刻入硅基质中。细胞富集模块约为标准显微镜载玻片的大小,含有14个平行样品处理部分和相关的样品操作通道,这些通道连接共用的样品和缓冲液进口以及产物和废物出口。每个部分都包含显微加工的障碍物阵列,其进行了优化,以经由将较大细胞置换入产物流中而根据流体动力学尺寸富集靶细胞类型。在该实施例中,设计微芯片,以将红细胞(rbc)和血小板与较大白细胞和ctc分离。通过该装置由全血回收富集的靶细胞群。细胞富集微芯片的效力通过将正常全血中的rbc和血小板与白细胞(wbc)分离来评价(图15)。在癌症患者中,在较大的wbc级分中发现ctc。血液被最低稀释(30%),以至多6ml/小时的流速加工6ml样品。以coulter“ac-tdiff”型临床血液分析仪评价产物和废物流,该分析仪自动辨别、大小分离和计数不同的血细胞群。富集芯片实现了rbc与wbc的分离,其中wbc级分具有>99%的有核细胞保留、>99%的rbc缺失和>97%的血小板缺失。这些细胞级分的代表性直方图示于图16。常规细胞学证实wbc和rbc级分的高度富集(图17)。接着,用固定化抗体官能化的微流化模块通过亲和捕获回收上皮细胞。设计具有单室的捕获模块,该单室含有包被抗体的显微操作障碍物的规则阵列。通过增加捕获面积约4倍,并减慢邻近障碍物的层流下的细胞流动,以增加细胞和固定化抗体之间的接触时间,来处理这些障碍物,以最大化细胞捕获。捕获模块可在相对高流速但低剪切力的条件下操作,以保护细胞对抗损伤。捕获模块的表面通过用10%硅烷、0.5%戊二醛和抗生物素蛋白继之以生物素化抗-epcam序贯处理而官能化。活性位点用3%牛血清白蛋白的pbs溶液封闭,并用稀释的trishcl猝灭,并用稀释的l-组氨酸稳定。在每个阶段后用pbs洗涤模块,最后干燥,并储存于室温。捕获效力用人晚期肺癌细胞系nci-h1650(atcc编号crl-5883)检测。该细胞系在egfr的外显子19中具有15bp杂合的符合读框的缺失,使该细胞系对吉非替尼敏感。用胰蛋白酶收获汇合培养物的细胞,用活体染料celltrackerorange(cmrareagent,molecularprobes,eugene,or)染色,重悬浮在新鲜全血中,并以多种流速在微流化芯片中分级分离。在这些初始可行性实验中,直接在捕获模块中处理细胞悬浮液,而没有预先在细胞富集模块中分级分离而压实红细胞;因此,样品流含有正常红细胞和白细胞以及肿瘤细胞。在捕获模块中加工细胞后,用缓冲液以较高流速(3ml/小时)洗涤该装置,以除去非特异性结合的细胞。移开粘性上层,用多聚甲醛将粘附细胞固定在芯片上,并通过荧光显微镜观察。由血细胞计数器计数计算细胞回收率;代表性的捕获结果示于表4。采用未分级分离血液的重建研究中的初始得率大于60%,非特异性结合低于5%。表4轮数平均流速每轮长度处理的细胞数捕获的细胞数得率13.01小时150,00038,01225%21.52小时150,00030,000/ml60%31.082小时108,00068,66164%41.212小时121,00075,49162%接着,将nci-h1650细胞搀入全血中,并通过如上所述的大小分级分离和亲和捕获回收,成功地对该细胞进行原位分析。在进行上皮细胞和白细胞区分的实验中,将荧光素-标记的cd45泛-白细胞单克隆抗体的0.5ml母液通入捕获模块中,并于室温温育30分钟。用缓冲液洗涤模块,以除去未结合的抗体,用1%多聚甲醛将细胞固定在芯片上,并通过荧光显微镜观察。如在图18中所示,上皮细胞结合捕获模块的障碍物和基底。cd45泛-白细胞抗体流道的背景染色是可见的,几种染色的白细胞也是可见的,这明显是因低水平的非特异性捕获所致。实施例10:装置实施方案本发明的优选装置实施方案的设计示于图19a,对应于与该设计相关的3个优选装置实施方案的参数示于图19b和19c。这些实施方案尤其可用于由血液富集上皮细胞。实施例11:测定大细胞类型的计数使用本发明的方法,没有癌症、有癌症或癌症发展的诊断可基于细胞样品中大于特定截留尺寸的细胞数。例如,可以选择14μm或更大的流体动力学尺寸的细胞。该截留尺寸应消除大部分白细胞。这些细胞的性质然后可以通过下游分子或细胞学分析确定。应可用于分析的非上皮细胞的细胞类型包括内皮细胞、内皮祖细胞、子宫内膜细胞或指示病症的滋养层。而且,确定单独的上皮细胞(例如癌细胞)和其它细胞类型(例如内皮细胞)的计数,接着确定上皮细胞数和其它细胞类型数之间的比率,可以提供有用的诊断信息。可配置本发明的装置,以分离作为目标的细胞亚群,例如上述的那些,如在图20a-d中所示。可以选择截留尺寸,使得大部分天然血细胞,包括红细胞、白细胞和血小板,流向废物端,而非天然细胞,可以包括内皮细胞、内皮祖细胞、子宫内膜细胞或滋养层,收集在富集样品中。该富集样品可进一步分析。因此,使用本发明的装置,有可能基于尺寸由血液或其它体液分离细胞亚群,该装置在以大细胞类型为目标时允许便利地除去大比例的天然血细胞。如在图21中所示,本发明的装置可包括计数工具,以确定富集样品中的细胞数或富集样品中特定类型的细胞(例如癌细胞)的数目,进一步分析富集样品中的细胞可提供用于诊断或其它用途的其它信息。实施例12:检测egfr突变的方法使用本发明的装置和方法处理和分析癌症患者的血样,产生含ctc的上皮细胞的富集样品。然后,分析该样品,以鉴定潜在的egfr突变。该方法允许鉴定已知的临床相关的egfr突变以及发现新突变。该方法的纵览示于图22。以下是检测和证实egfr突变的策略的概览:1)序列ctcegfrmrnaa)由血样纯化ctc;b)由ctc纯化总rna;c)使用逆转录酶将rna转变为cdna;d)使用产生的cdna进行第一轮和第二轮pcr反应,以产生测序模板;和e)纯化嵌套pcr扩增子,并用作测序模板,以测序egfr外显子18-21。2)使用ctc基因组dna证实rna序列a)由血样纯化ctc;b)由ctc纯化基因组dna(gdna);c)经pcr反应扩增外显子18、19、20和/或21;和d)在实时定量等位基因特异性pcr反应中使用产生的pcr扩增子,以便证实经rna测序发现的突变序列。以上概述的每个步骤的进一步的细节如下。1)序列ctcegfrmrnaa)由血样纯化ctc。使用本发明的任何基于尺寸的富集和/或亲和纯化装置分离ctc。b)由ctc纯化总rna。然后使用例如qiagenmicrorneasy试剂盒,或另一个生产商的相似总rna纯化方案,由分离的ctc群纯化总rna;或者,可以使用标准rna纯化方案,例如异硫氰酸胍匀化,接着苯酚/氯仿提取和乙醇沉淀。一种这样的方法描述于j.sambrook,e.f.fritch和t.mamatis的“molecularcloning-alaboratorymanual,第二版”(1989)的7.24页。c)使用逆转录酶将rna转变为cdna。基于逆转录酶供应商的方案进行cdna反应。通常,将rna输入cdna反应中的量在10pg至2μg总rna的范围内。通过使随机7聚体dna引物或寡聚dt引物或基因特异性引物与rna模板于65℃杂交,接着在冰上急冷,进行首链dna合成。通过加入iscript逆转录酶(biorad)或superscript逆转录酶(invitrogen)或另一个商业供应商的逆转录酶连同适宜的酶反应缓冲液启动cdna合成。对于iscript,逆转录酶反应于42℃进行30-45分钟,接着于85℃酶失活5分钟。cdna储存于-20℃,直至使用,或者立刻用于pcr反应。通常,cdna反应以终体积20μl进行,并将10%(2μl)的所获cdna用于随后的pcr反应。d)使用产生的cdna进行第一轮和第二轮pcr反应,产生测序模板。将逆转录酶反应的cdna与目标区域特异性的dna引物混合(图23)。参见表5关于可用于扩增外显子18-21的引物组。在表5中,引物组m13(+)/m12(-)在引物组m11(+)/m14(-)内部。因此,如果引物m11(+)和m14(-)用于第一轮扩增,则引物m13(+)和m12(-)可用于嵌套轮次的扩增。同样,引物组m11(+)/m14(-)在引物组m15(+)/m16(-)内部,引物组m23(+)/m24(-)在引物组m21(+)/m22(-)内部。热启动pcr反应使用qiagen热启动taq聚合酶试剂盒或appliedbiosystems热启动taqman聚合酶或其它热启动热稳定聚合酶进行,或者没有热启动,使用promegagotaqgreentaq聚合酶mastermix、taqmandna聚合酶或其它热稳定dna聚合酶。通常,反应体积为50μl,核苷酸三磷酸以每个核苷酸200μm的终浓度存在,mgcl2以1-4mm的终浓度存在,寡聚引物以0.5μm的终浓度存在。热启动方案于95℃温育10-15分钟开始,接着40个循环的94℃、1分钟(变性);52℃、1分钟(退火)以及72℃、1分钟(延伸)。于72℃进行10分钟末端延伸,之后将样品储存于4℃,直至它们或者在第二轮(嵌套)pcr中用作模板,或者在测序前使用qiaquick离心柱(qiagen)纯化。如果不使用热启动方案,则省略于95℃的初始温育。如果pcr产物用于第二轮pcr,则2μl(4%)的初始pcr产物在第二轮反应中用作模板,使用相等的试剂浓度和循环参数。表5.用于扩增外显子18-21周围的egfrmrna的引物组e)纯化嵌套pcr扩增子,并用作测序模板,以测序egfr外显子18-21。通过abi自动化荧光测序机器以及荧光标记的dna测序梯进行测序,所述dna测序梯经由sanger型测序反应使用荧光双脱氧核苷酸混合物产生。使用qiagenquickspin柱、agencourtampurepcr纯化系统或得自其它供应商的pcr产物纯化试剂盒纯化pcr产物。在纯化pcr产物后,用nanodrop7000分光光度计确定核苷酸浓度和纯度,使pcr产物浓度达到25ng/μl的浓度。作为质量控制检测,只有uv线吸收比率(a260/a280)大于1.8的pcr产物才用于测序。使测序引物浓度达到3.2pmol/μl。2)使用ctc基因组dna证实rna序列:a)由血样纯化ctc。如上使用本发明的任一种基于尺寸的富集和/或亲和纯化装置分离ctc。b)由ctc纯化基因组dna(gdna)。基因组dna使用qiagendneasymini试剂盒、invitrogenchargeswitchgdna试剂盒或另一个市售试剂盒或经由以下方案纯化:1.细胞沉淀或者新鲜裂解,或者储存于-80℃,并在裂解前立即融化。2.加入500μl的50mmtrisph7.9/100mmedta/0.5%sds(tes缓冲液)。3.加入12.5μl蛋白酶k(ibi5406,20mg/ml),产生的最终[protk]=0.5mg/ml。4.在旋转温育器中于55℃过夜温育。5.加入20μlrna酶混合物(500u/mlrna酶a+20,000u/mlrna酶t1,ambion#2288),并于37℃温育4小时。6.用苯酚(kodak,trisph8平衡)提取,振摇混合,在台式离心机中离心5分钟。7.将水相转移至新鲜管。8.用苯酚/氯仿/异戊醇(emd,25:24:1比率,trisph8平衡的)提取,振摇混合,在台式离心机中离心5分钟。9.加入50μl3mnaoacph=6。10.加入500μletoh。11.振摇混合。可见沉淀dna的条带。如果预期的dna浓度非常低,则加入载体核苷酸(通常为酵母trna)。12.在台式离心机中以最大速度离心1分钟。13.除去上清液。14.于室温(rt)加入500μl70%etoh。15.振摇混合。16.在台式离心机中以最大速度离心1分钟。17.在加入te之前风干10-20分钟。18.重悬浮在400μlte中。于65℃温育10分钟,然后于室温过夜放置,之后在nanodrop上定量。c)经pcr反应扩增外显子18、19、20和/或21。如在步骤1d中所述进行热启动嵌套pcr扩增,只是没有嵌套轮次的扩增。初始pcr步骤可在对数期当中终止,以便使扩增过程中的等位基因特异性信息丢失的可能性最小。用于扩增egfr外显子18-21的引物组列于表6(另参见paez等,science304:1497-1500(补充材料)(2004))。表6.用于扩增egfr基因组dna的引物组d)在实时定量等位基因特异性pcr反应中使用产生的pcr扩增子,以便证实经由rna测序发现的突变序列。等份的pcr扩增子在多重等位基因特异性定量pcr反应中用作模板,该pcr反应使用taqmanpcr5'核酸酶测定和appliedbiosystems7500型实时pcr机器(图24)。该轮pcr扩增对每个目标突变特异性的初始pcr产物的子区域。已知实时pcr的敏感性非常高,有可能获得关于egfr基因突变状态的完整信息,即使分离出少至10个ctc。实时pcr在8个对数的输入dna浓度内提供了等位基因序列的定量;因此,即便在不纯的群体中的杂合突变也容易使用该方法检测。针对影响吉非替尼在nsclc患者中的响应性的所有已知突变设计探针和引物组,所述突变包括40多个这样的体细胞突变,包括点突变、缺失和插入,它们已在医学文献中报告。为了阐述用途,其中5个点突变的引物和探针组的实例列于表7。一般而言,可以使用引物优化软件程序primerexpress(appliedbiosystems)设计寡核苷酸,杂交条件进行了优化,以区分野生型egfrdna序列和突变等位基因。由已知携带egfr突变(例如h358(野生型)、h1650(15-bp缺失,δ2235-2249)和h1975(两个点突变,2369c→t,2573t→g))的肺癌细胞系扩增的egfr基因组dna,用于优化等位基因特异性实时pcr反应。使用taqman5'核酸酶测定,开发对野生型序列或已知的egfr突变特异性的等位基因特异性标记探针。设计所具有的解链温度易于区分匹配和错配的寡核苷酸,并优化实时pcr条件,以区分野生型和突变等位基因。所有的实时pcr反应都以一式三份进行。最初,含有野生型序列的标记探针在同一反应中与单个突变探针多重化。将结果表示为1个突变等位基因序列对野生型序列的比率可以鉴定含有或没有给定突变的样品。在针对给定探针组优化条件后,然后有可能在同一实时pcr测定中多重化针对给定外显子中的所有突变等位基因的探针,增加该分析工具在临床环境中的易用性。针对每个野生型等位基因和突变等位基因序列设计独特的探针。用在5'末端的荧光染料vic标记野生型序列,用荧光fam标记突变序列。荧光猝灭剂和小沟结合部分连接至探针的3'末端。rox用作用于标准化用途的被动参比染料。产生针对野生型序列的标准曲线,并用于相对定量。不需要精确定量突变信号,因为输入细胞群是未知的,且纯度可变。如abi产品文献所述设置测定,当产生的突变等位基因探针的信号高于荧光的背景水平时,证实存在突变(图25),该阈值循环产生输入样品中的突变等位基因的相对频率。表7.用于等位基因特异性qpcr的探针和引物实施例13:在白细胞中没有egfr表达为测试白细胞中是否存在egfrmrna,进行几个pcr实验。设计示于表8的4个引物组,以扩增4个对应基因:1)bckdk(支链酮酸脱氢酶复合激酶)—在所有细胞类型中表达的“看家”基因,是白细胞和肿瘤细胞这二者的阳性对照;2)cd45—在白细胞中特异性表达,是白细胞的阳性对照和肿瘤细胞的阴性对照,3)epcam—在上皮细胞中特异性表达,是白细胞的阴性对照和肿瘤细胞的阳性对照,和4)egfr—要检验的靶mrna表8使用本发明的细胞富集装置(截留尺寸4μm)分离约9×106个白细胞的总rna,使用rneasy小型试剂盒(qiagen)分离5×106个h1650细胞。使用100pmol随机六聚体(roche)和200usuperscriptii(invitrogen)在20μl反应中逆转录白细胞和h1650细胞的2μg总rna,以获得首链cdna。使用0.5μl首链cdna反应物和10pmol正向和反向引物在总共25μl混合物中进行随后的pcr。进行40个循环的pcr:95℃,20秒;56℃,20秒,和70℃,30秒。在1%琼脂糖凝胶上分离扩增的产物。如在图26a中所示,发现bckdk在白细胞和h1650细胞中均表达;cd45仅在白细胞中表达;epcam和egfr均仅在h1650细胞中表达。这些结果与示于图26b的egfr表达模式完全一致,证实egfr对于测定含白细胞和癌细胞的细胞混合物是特别有用的靶,因为预期只有癌细胞才产生信号。实施例14:采用少量靶rna或大量背景rna的egfr测定为了测定在实施例12中描述的测定的灵敏度,测试多种量的输入nsclc细胞系总rna,其在100pg-50ng的范围内。第一轮和第二轮egfrpcr反应的结果(步骤1d,实施例12)示于图27。已表明第一轮pcr反应对检测1ng输入rna足够灵敏,而第二轮增加灵敏度至100pg以下的输入rna。这相当于7-10个细胞,表明使用该测定甚至极度稀释的样品也可以产生可检测的信号。接着,将含1ngnci-h1975rna的样品与1ng-1μg范围的可变量的外周血单核细胞(pbmc)rna混合,并用于如前的pcr反应。如在图28a中所示,第一组pcr反应证实,尽管扩增在所有情况下都发生,但在最高污染水平出现乱真谱带。然而,如在图28b中所示,在第二组嵌套pcr反应后,产生所需的特异性扩增子,即便在最高污染水平也没有乱真谱带。因此,本实施例表明,本文描述的egfrpcr测定即便在靶rna占测试样品中的总rna的微小部分时也是有效的。表8列出了多种细胞中的rna得率,表明每个细胞的得率广泛变化,这取决于细胞类型。该信息是有用的,以便基于细胞计数估计样品中靶和背景rna的量。例如,1ngncl-h1975rna对应于约100个细胞,而1μgpbmcrna对应于约106个细胞。因此,在上述实验中的最高污染水平1,000:1的pbmcrna比ncl-h1975rna实际上对应于10,000:1比率的pbmc对ncl-h1975细胞。因此,这些数据表明,egfr可由被多达106个白细胞污染的少至100个ctc测序。表8.rna得率对细胞类型细胞计数rna产量[rna]/细胞nci-h19752×10626.9μg13.5pgnci-h16502×10626.1μg13.0pgh3582×10626.0μg13.0pght292×10621.4μg10.7pgmcf72×10625.4μg12.7pgpbmc#119×10610.2μg0.5pgpbmc#216.5×10618.4μg1.1pg接着,搀入1,000个细胞/ml的celltracker(invitrogen)-标记的h1650细胞的全血跑过图19c的捕获模块芯片。为避免由固定样品提取的rna无效,在跑过后立即计数捕获的h1650细胞,随后裂解,在没有甲醛固定的情况下用于rna提取。用0.5ml的4m异硫氰酸胍溶液将约800个捕获的h1650细胞和>10,000个污染白细胞在芯片上裂解。裂解物用0.5ml苯酚/氯仿提取,并在作为载体的10μg酵母trna存在下用1ml乙醇沉淀。dna酶i处理沉淀的rna30分钟,然后用苯酚/氯仿提取,并用乙醇沉淀,然后进行首链cdna合成,随后进行pcr扩增。这些步骤用第二个血样和第二个芯片重复。使用2组引物cd45_1和cd45_2(表7)以及egfr_5(正向引物5'-gttcggcacggtgtataagg-3')(seqidno:_)和egfr_6(反向引物,5'-ctggccatcacgtaggcttc-3')(seqidno:_),pcr扩增由芯片1和芯片2rna连同h1650和白细胞cdna合成的cdna。egfr_5和egfr_6在h1650细胞中产生138bp的野生型扩增片段和123bp的突变扩增片段。pcr产物在2.5%琼脂糖凝胶上分离。如在图29中所示,egfr野生型和突变扩增的片段易于检测,不管高白细胞背景,表明egfr测定是较粗的,不需要高度纯化的样品。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1