确定个体基因突变的方法和系统的制作方法_2

文档序号:9645760阅读:来源:国知局
本的测序文库,
[0098]其中,
[0099]在进行步骤(e)之前,利用所述探针对所述连接产物进行筛选。
[0100] 根据本发明的一个实施例,步骤(f)进一步包括:
[0101 ]利用双链特异性核酸酶,对所述cDNA扩增产物进行均一化处理,以便得到均一化 的cDNA扩增产物;
[0102] 对所述均一化的cDNA扩增产物进行二次扩增,以便获得二次扩增产物,所述二次 扩增产物构成所述RNA样本的测序文库。
[0103]根据本发明的一个实施例,与所述疾病相关的基因突变包括下列至少之一 :SNV、 SomaticIndel、SomaticSV、SomaticCNV以及在正常组织和肿瘤组织之间存在表达差异 的基因,
[0104]其中,任选的,在正常组织和肿瘤组织之间存在表达差异的基因是通过下列步骤 确定的:
[0105] 将所述患病组织的RNA样本测序数据和所述正常组织的RNA样本测序数据分别比 对到全基因组和基因区域;
[0106]基于能够比对到所述基因区域的测序数据的量,分别计算每个基因在正常组织和 肿瘤组织中的RPKM值;
[0107]基于所述RPKM值,确定所述在正常组织和肿瘤组织之间存在表达差异的基因。
[0108]根据本发明的一个实施例,所述靶基因包括选自下列的至少之一:靶向药物相关 基因、化疗药物相关基因、药物代谢相关基因、放疗相关基因、激素药物相关基因、抗体药物 相关基因和疫苗相关基因。
[0109]根据本发明的一个实施例,所述基因突变确定装置:
[0110] 用Varscan进行SNV的查找;
[0111]用GATK进行SomaticIndel的查找;
[0112] 用CREST进行Somatic SV的查找;
[0113] 用CONTRA或ExomeCNV进行Somatic CNV的查找;或
[0114] 用GATK进行化疗、放疗、代谢特殊位点SNP和基因型的判定。
[0115] 根据本发明的一个实施例,所述测序装置为选自把8叫2000、501^0、454、和单分子 测序装置的至少一种。
[0116]根据本发明的一些实施例,在数以千记的已报道疾病例如肿瘤相关基因中,根据 针对性选择相关基因,设计捕获芯片,利用DNA芯片捕获技术进行疾病例如肿瘤病人个体化 基因检测,配合个体转录组测序得到的转录表达数据,可以有方向性地以最低的成本获得 疾病例如肿瘤病人个体遗传信息,建立个体化的疾病例如肿瘤遗传信息模型,为后续的研 究和治疗提供数据基础。
[0117] 本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0118] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中:
[0119] 图1显示了根据本发明一个实施例的确定个体基因突变的方法的流程示意图。
[0120] 图2显示了根据本发明一个实施例的用于确定个体基因突变的方法的系统的示意 图。
【具体实施方式】
[0121] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0122] 需要说明的是,术语"第一"、"第二"仅用于描述目的,而不能理解为指示或暗示相 对重要性或者隐含指明所指示的技术特征的数量。由此,限定有"第一"、"第二"的特征可以 明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说 明,"多个"的含义是两个或两个以上。
[0123] 本发明的一个方面提出了一种确定个体基因突的方法。参考图1,根据本发明的实 施例,该方法包括以下步骤:
[0124]S100:获取核酸样本。
[0125] 根据本发明的实施例,在该步骤中,从个体的患病组织获取患病组织核酸样本。根 据本发明的实施例,还可以从个体的正常组织获得正常组织核酸样本。
[0126] 根据本发明的实施例,个体的类型并不受特别限制。根据本发明的一个实施例,所 述个体为哺乳动物。根据本发明的一个实施例,所述个体为人。根据本发明的一个实施例, 所述疾病为癌症。根据本发明的一个实施例,所述患病组织是以石蜡切片形式提供的。根据 本发明的一个实施例,所述正常组织为血液。根据本发明的一个实施例,所述核酸样本包括 DNA样本和RNA样本。
[0127]S200:探针筛选及文库构建。
[0128]根据本发明的实施例,在获取核酸样本之后,利用探针对所述患病组织核酸样本 以及任选的正常组织核酸样本进行筛选并构建测序文库,其中,所述探针特异性识别所述 疾病相关的靶基因。根据本发明的一个实施例,所述探针是以固相芯片的形式提供的。根据 本发明的一个实施例,所述靶基因包括选自下列的至少之一:靶向药物相关基因、化疗药物 相关基因、药物代谢相关基因、放疗相关基因、激素药物相关基因、抗体药物相关基因和疫 苗相关基因。
[0129]根据本发明的一个实施例,在步骤(2)中,针对所述DNA样本,通过下列步骤构建所 述测序文库:
[0130] (a)对所述DNA样本进行片段化,以便获得DNA片段;
[0131] (b)将所述DNA片段进行末端修复,以便获得经过末端修复的DNA片段;
[0132] (c)将所述经过末端修复的DNA片段的3'末端添加碱基A,以便获得具有粘性末端A 的DNA片段;
[0133] (d)将所述具有粘性末端A的DNA片段与接头相连,以便获得连接产物;
[0134] (e)将所述连接产物进行PCR扩增,以便获得第二扩增产物;以及
[0135] (f)将所述第二扩增产物进行纯化回收,以便获得回收产物,所述回收产物构成所 述测序文库,
[0136]其中,
[0137]在进行步骤(e)之前,利用所述探针对所述连接产物进行筛选。
[0138]根据本发明的一个实施例,在步骤(2)中,针对所述RNA样本,通过下列步骤构建所 述测序文库:
[0139] (a)对所述RNA样本进行反转录PCR,以便获得cDNA片段;
[0140] (b)对所述cDNA样本进行末端修复,以便获得经过末端修复的cDNA片段;
[0141] (c)将所述经过末端修复的cDNA片段的3'末端添加碱基A,以便获得具有粘性末端 A的cDNA片段;
[0142] (d)将所述具有粘性末端A的DNA片段与接头相连,以便获得连接产物;
[0143] (e)将所述连接产物进行PCR扩增,以便获得cDNA扩增产物;以及
[0144] (f)基于所述cDNA扩增产物,建立所述RNA样本的测序文库,
[0145]其中,
[0146]在进行步骤(e)之前,利用所述探针对所述连接产物进行筛选。
[0147]根据本发明的一个实施例,步骤(f)进一步包括:
[0148]利用双链特异性核酸酶,对所述cDNA扩增产物进行均一化处理,以便得到均一化 的cDNA扩增产物;
[0149]对所述均一化的cDNA扩增产物进行二次扩增,以便获得二次扩增产物,所述二次 扩增产物构成所述RNA样本的测序文库。
[0150]根据本发明的实施例,根据本发明的实施例,将所得的DNA进行片段化的方法不受 特别限制,根据一些具体示例,可以通过选自雾化、超声打断法、HydroShear以及酶切处理 的至少一种进行片段化,优选使用ovaris超声打断仪将经过DNA进行片段化。根据本发明的 实施例,片段化处理后所得的DNA片段的长度为200-400bp,优选350bp。发明人发现,通过采 用所获得的该长度的DNA片段能够有效地用于核酸文库的构建及后续处理。
[0151]根据本发明的实施例,可以利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶将 DNA片段进行末端修复,其中,该Klenow片段具有5 ' -3 '聚合酶活性和3 ' -5 '外切酶活性, 但缺少5 ' -3 '外切酶活性,由此,能够有效地将DNA片段进行末端修复。
[0152]根据本发明的一些具体示例,可以利用Klenow片段(3'-5'^〇-),即缺失了3'-5' 外切酶活性的Klenow片段,将经过末端修复的DNA片段的3 '末端添加碱基A,由此,能够有效 地获得具有粘性末端A的DNA片段。
[0153]根据本发明的实施例,可以利用T4DNA连接酶将具有粘性末端A的DNA片段与接头 相连,由此,能够有效地获得连接产物。根据本发明的实施例,该接头中可以进一步包含标 签,由此可以方便地同时构建多个样本的测序文库,对多个样本的测序文库进行组合,同时 进行测序。由此,能够充分地利用高通量测序平台,有效地节省时间、降低测序成本。
[0154]S300 测序
[0155]在构建了测序文库后,根据本发明的实施例,可以对所述测序文库进行测序。当 然,本领域技术人员能够理解的是本发明的测序步骤可通过任何测序方法进行,包括但不 限于双脱氧链终止法;优选高通量的测序方法,由此,能够利用这些测序装置的高通量、深 度测序的特点,进一步提高了确定有核红细胞染色体非整倍性的效率。所述高通量的测序 方法包括但不限于第二代测序技术或者是单分子测序技术。
[0156]所述第二代测序平台(MetzkerML.Sequencingtechnologies-thenext generation.NatRevGenet. 2010Jan; 11 (1): 31-46)包括但不限于Illumina-Solexa (GA?,HiSeq2000?等)、ABI_Solid和Roche_454(焦磷酸测序)测序平台;单分子测序平台 (技术)包括但不限于Helicos公司的真实单分子测序技术(TrueSingleMoleculeDNA sequencing),PacificBiosciences公司单分子实时测序(singlemoleculereal-time (SMRT?)),以及OxfordNanoporeTechnologies公司的纳米孔测序技术等(Rusk,Nicole (2009-04-01).CheapThird-GenerationSequencing.NatureMethods6(4):244_245)〇
[0157]随着测序技术的不断进化,本领域技术人员能够理解的是还可以采用其他的测序 方法和装置进行测序。根据本发明的实施例,通过测序所得到的测序数据的长度不受特别 限制。根据本发明的一个具体示例,所述多个测序数据的平均长度为约50bp。发明人发现, 当测序数据的平均长度为约50bp时,能够极大地方便对测序数据进行分析,提高分析效率, 同时能够显著降低分析的成本。这里所使用的术语"平均长度"是指各个测序数据长度数值 的平均值。
[0158]S400:确定所述疾病相关的基因突变
[0159]根据本发明的实施例,在对核酸测序文库进行测序获得测序结果之后,基于所述 患病组织核酸测序结果,确定与所述疾病相关的基因突变。在本文中所使用的术语"基因突 变"应做广义理解,其可以是指的是基因组序列的任何变化,例如染色体非整倍性,结构变 异,单核苷酸突变等遗传变异(http://en.wikipedia·org/wiki/Genetic_variation);也 可以是基因组修饰位点的变化例如甲基化水平等。根据本发明的实施例,所研究的基因组 异常为选自染色体的非整倍型、和预定区域的突变至少一种。在本发明的实施例中预定区 域的突变是指结构变异(http://en.wikipedia.org/wiki/Structural_variation)或单核 苷酉爱突变(SNP,http://en·wikipedia·org/wiki/Single-nucleotide_polymorphism) 〇根 据本发明的一个实施例,与所述疾病相关的基因突变包括下列至少之一 :SNV、S〇matic Indel、SomaticSV、SomaticCNV以及在正常组织和肿瘤组织之间存在表达差异的基因。
[0160]根据本发明的一个实施例,在该步骤中,
[0161] 用Varscan进行SNV的查找;
[0162]用GATK
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1