同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用

文档序号:9541708阅读:438来源:国知局
同时对单细胞基因组和转录组构库及测序的方法基于单细胞整合基因组学的测序方法及应用
【技术领域】
[0001] 本发明涉及高通量测序领域,具体涉及一种同时对单细胞基因组和转录组构库及 测序的方法,基于单细胞整合基因组学(SCIG)的测序方法及应用。
【背景技术】
[0002] 单细胞DNA全基因组测序和RNA转录组测序技术在近年来发展迅速。单细胞DNA 扩增方法,在最初的Multipledisplacementamplification(MDA)方法基础上,又陆续产 生了GenomePlex(WGA4)方法和MultipleAnnealingandLoopingBasedAmplification Cycles(MALBAC)方法。单细胞mRNA扩增方面也陆续产生了SMART-Seq,CEL-Seq, Quartz-Seq等新技术,极大提高了微量mRNA的扩增效率。
[0003]目前所有有关单细胞技术方面的研究成果尚不完善,具体分成两类:a只测基因 组,不测转录组;b只测转录组,不测基因组;然而,这些分析方法无法展示单细胞的全貌。 如何实现在单次实验中同时得到一个单细胞的基因组和转录组,获得单个细胞中遗传和表 观遗传信息,并进行综合分析,全方位,多层面的展示该细胞的状态,仍是行业难点。

【发明内容】

[0004] 为解决上述问题,本发明提供了一种同时对单细胞基因组和转录组构库及测序的 方法,基于单细胞整合基因组学(SCIG)的测序方法及应用。
[0005] 本发明提供的"单细胞整合基因组学(SingleCellIntegratedGenomics,SCIG) 方法"是指,通过对单个细胞的核质分离,对细胞核和细胞质分别进行单细胞全基因组扩增 和转录组扩增,用高通量测序和生物信息学分析。
[0006] 进一步地,其中的生物信息分析方法,包括:将单个细胞的基因组和转录组数据整 合,综合考虑,分别开展聚类分析,相关性分析和进化树分析,准确鉴定细胞(比如单个肿 瘤)中的多个亚克隆,结合细胞(比如癌细胞)的基因型和表型特征之间的一一对应关系 的分析模型,更准确地鉴定组织内部(尤其是肿瘤内部)的多个不同的细胞克隆。
[0007] 本发明生物信息分析方法,还包括但不限于:等位基因分析、基因表达分析、RNA 编辑分析,比较基因组和转录本之间的关联分析,如某原癌基因调控区域小片段的缺失导 致基因表达的不正常上升,引发疾病,或者该基因表达区域一个碱基突变,导致所表达的蛋 白失活等等。本发明提供的技术方案可以做到个体样本点对点的相关性分析,而非传统的 通过群体相关来推断。
[0008] 第一方面,本发明提供了一种同时构建单细胞基因组和转录组高通量测序文库的 方法,包括如下步骤:
[0009]a)获取单细胞;
[0010] b)分离细胞核和细胞质;
[0011] c)单个细胞核全基因组扩增,获得基因组测序文库;
[0012] d)单个细胞去核细胞质全转录组扩增,获得转录组测序文库。
[0013] 优选地,所述步骤a)中,所述单细胞为卵母细胞、肿瘤细胞、神经细胞或癌细胞。
[0014] 优选地,所述步骤b)中,采用显微注射(Microinjection)法对单个细胞进行核质 分呙。
[0015] 进一步优选地,所述显微注射法中,微细管针(microcapillaryneedle)的直径在 0· 5-5 微米(microns),抓针(holdingneedle)的直径在 10-50 微米(microns)。
[0016] 在本发明实施例中,分别以卵母细胞和癌细胞为例进行了实验。其中,卵母细胞胞 体较大(100微米左右直径),核相对较小,采用显微操作,抽核效果比较好;但是肿瘤细胞 胞体比较小(25微米左右直径),核则相对于细胞体比较大,如果用抽核的方法,很难成功, 本发明反过来通过抽取细胞质的方法或者采用完全不同的方法,通过裂解细胞膜但保持细 胞核膜完整,释放细胞质,收集RNA,然后分别进行细胞质和细胞核的分析。
[0017] 优选地,所述步骤c)中,采用WGA4或MDA进行全基因组扩增。
[0018] 优选地,所述步骤d)中,采用Smart_seq2进行全转录组扩增。
[0019] 本发明提供的同时构建单细胞基因组和转录组高通量测序文库的方法,先对单个 细胞的分选,对单细胞进行核质分离,对两种组分分别进行基因组和转录组的扩增、测序文 库的构建和质检、二代深度测序等步骤获得完整的单细胞序列文库。
[0020] 第二方面,本发明提供了 一种同时对单细胞基因组和转录组进行高通量测序的方 法,包括如下步骤:对第一方面所得的基因组测序文库和转录组测序文库进行高通量测序, 分别获得单细胞的基因组序列信息和转录组序列信息。
[0021] 优选地,对第一方面所得的基因组测序文库进行外显子组高通量测序。
[0022] 第三方面,本发明提供了一种基于单细胞整合基因组学的测序方法,包括如下步 骤:对第二方面所得的单细胞的基因组序列信息和转录组序列信息进行生物信息学分析。
[0023] 第四方面,本发明提供了一种基于单细胞整合基因组学的方法鉴定细胞亚克隆的 方法,包括如下步骤:根据多个第三方面所得的生物信息学分析序列信息,鉴定细胞亚克 隆。
[0024] 优选地,所述生物信息学分析的方法包括:将单个细胞的基因组和转录组数据整 合,分别开展聚类分析,相关性分析和进化树分析,准确鉴定细胞(优选为单个肿瘤)中的 多个亚克隆。
[0025] 进一步优选地,所述生物信息学分析的方法还包括:结合细胞(优选为癌细胞)的 基因型和表型特征之间的一一对应关系的分析模型,更准确地鉴定组织内部(优选为肿瘤 内部)的多个不同的细胞克隆。
[0026] 如本发明所述的,所述的"聚类分析"、"相关性分析"和"进化树分析"包括但不限 于行业内相应的常规分析方法。
[0027] 优选地,所述细胞亚克隆为肿瘤细胞亚克隆或癌细胞亚克隆。
[0028] 第五方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法 在等位基因检测中的应用。
[0029] 优选地,所述等位基因检测为检测杂合子数量和/或纯合子数量。
[0030] 第六方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法 在基因表达检测中的应用。
[0031] 优选地,所述的基因表达检测包括检测mRNA和IncRNA中的至少一种。
[0032] 优选地,所述的基因表达检测为检测小鼠卵母细胞的基因表达,且检测量不低于 13, 000 (优选为13,686)条蛋白编码基因的表达和/或不低于500 (优选为521)条IncRNA 基因的表达。
[0033] 第七方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法 在单等位基因(monoallelic)表达检测中的应用。
[0034] 优选地,所述的单等位基因(monoallelic)表达检测为检测杂合子的单等位基因 (monoallelic)表达数量。
[0035] 第八方面,本发明提供了如第三方面所述的基于单细胞整合基因组学的测序方法 在RNA编辑位点(RNAeditingsites,RESs)检测中的应用。
[0036] 优选地,所述的RESs检测包括但不限于:A-to-G、A-to-C、A-to-T、T-to-C、 T_to_G、T_to_A、C_to_T、C_to_A、C_to_G、G_to_A、G_to_T、G_to_C、插入突变(ins)及缺失 突变(del)中的一种或多种。
[0037] 优选地,所述的RESs检测为检测小鼠卵母细胞的RESs,且A-to-G和T-to-C类型 的检出值占所有检出RESs位点总量不低于20% (优选为30% -38% )。
[0038] 第九方面,本发明提供了如第一方面所述的同时构建单细胞基因组和转录组高通 量测序文库的方法、或如第三方面所述的基于单细胞整合基因组学的测序方法在二代、下 一代或单分子高通量测序中的应用。
[0039] 本发明提供的SCIG方案能够实现在单次实验中同时得到一个单细胞的基因组和 转录组,获得单个细胞中遗传和表观遗传信息,并进行综合分析,全方位,多层面的展示该 细胞的状态;这些优势使得SCIG在鉴定单细胞的特性和共性方面具有优越性。
[0040] 目前,高通量测序的主要平台代表有罗氏公司(Roche)的454测序仪(RochGS FLXsequencer)、Illumina公司的Solexa基因组分析仪(IlluminaGenomeAnalyzer)和 ABI的SOLiD测序仪(ABISOLiDsequencer)等,应当指出的是,本发明提供的技术方案适 用于目前任一一种二代高通量测序的文库构建工作,尤其可大大缩短Miseq及Hiseq测序 平台中PCR产物的文库构建的工作时间,提高接头(adapter)的连接效果,进而提高目的产 物的测序数据质量。
【附图说明】
[0041] 图1是本发明实施例提供的SCIG实验流程不意图;
[0042]图2是本发明实施例提供的SCIG生物信息学分析流程图;
[0043]图3是本发明实施例提供的多个样品分析单细胞外显子组和转录组的流程示意 图;
[0044]图 3_b中英文:nucleus:细胞核;cytoplasm:细胞质;MDAorWAGA4 amplification:MDA或WAGA4 扩增;exome-sequencing:外显子测序;Smart_seq2 amplification:Smart_seq2 扩增;heterozygousloci:杂合子位点;alleleexpression frequency:等位基因表达频率;allelespecificexpression:等位基因特异性表达; homozygousloci:纯合子位点;mismatchedRNAsequence:错配RNA测序;RNAediting: RNA编辑。
[0045]图4是本发明实施例提供的卵母细胞外显子序列的生物分析结果;
[0046]图5是本发明实施例提供的卵母细胞转录组序列的生物分析结果;
[0047]图6是本发明实施例提供的卵母细胞基因表达水平的分析结果;
[0048] 图7是本发明实施例提供的基因组和转录组序列比对分析结果;
[0049] 图8是本发明实施例进行的预实验中提供的小鼠单个卵母细胞取核过程;
[0050] 图9是本发明实施例进行的预实验中采用Quartz-Seq方法,不同样品的转录组以 及全基因组的扩增结果;
[0051] 图10是本发明实施例进行的预实验中提供的单个神经元基因组二代测序结果。
【具体实施方式】
[0052] 以下所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员 来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为 本发明的保护范围。
[0053] 本发明实施例中若无特别说明,所用试剂及耗材均为市售商品。
[0054] 本发明实施例中若特别说明,测序文库构建参照罗氏、illumina或ABI的高通量 测序文库构建说明书。
[0055]图1是本发明实施例提供的SCIG实验流程示意图,包括单个细胞的分选,对单细 胞进行核质分离,对两种组分分别进行基因组和转录组的扩增,测序文库的构建和质检,二 代深度测序等获得完整的单细胞序列文库。
[0056]图2是本发明实施例提供的SCIG生物信息学分析流程图,为行业常规分析方法, 将单个细胞的基因组和转录组数据整合,综合考虑,分别开展聚类分析,相关性分析和进化 树分析,准确鉴定单个肿瘤中的多个亚克隆。
[0057] (1)聚类分析(ClusteringAnalysis):比如通过主成分分析(Principle ComponentAnalysis,PCA)比较同一组织中的来源于不同位置的单个细胞,展示同一个组 织(比如肿瘤)中几十个细胞的分布,确定几个主要的分支,即亚克隆群。
[0058] (2)相关性分析(CorrelationAnalysis) :Heatmap图谱展示单个细胞(比如癌 细胞)中单基因突变和细胞拷贝数变化和基因转录水平的相关性,从遗传学和表观遗传两 个方面全景展示单个细胞(比如癌细胞)的时空差异。优化单细胞基因组和转录组分析的 方法:主要是转录本分别和基因拷贝数CNV和基因突变之前的对应关系的分析。在过去的 几年中,有关CNV分析的方法已经有若干种,但是大部分的CNV研究方法都是针对多细胞 的,所以我们将在这些方法上结合这一两年发表的有关单个细胞CNV的研究进一步优化去 噪。这方面的工作已经取得了初步成果[NingL,LiuG,LiG,HouY,TongY,etal. (2014) CurrentChallengesintheBioinformaticsofSingleCellGenomics.FrontOncol 4:7]。再者,我们还进一步分析基因蛋白编码区的序列中的突变。将这个细胞中基因序列, 拷贝数的情况和他的转录组的水平结合,找出相关性。
[0059] (3)生物进化树分析(HierarchicalTree):通过SCIG数据的整合,展示所有癌细 胞的进化关系。包括不同位置的癌细胞异同,比如癌中心位置和癌周边的单个细胞对于缺 氧(hypoxia)和细胞运动(cellmobility)方面基因表达的特异性等。
[0060] 参照图1和图2,本发明分别对
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1