确定个体基因突变的方法和系统的制作方法_3

文档序号:9645760阅读:来源:国知局
进行SomaticIndel的查找;
[0163]用CREST进行SomaticSV的查找;
[0164]用CONTRA或ExomeCNV进行SomaticCNV的查找;或
[0165]用GATK进行化疗、放疗、代谢特殊位点SNP和基因型的判定。
[0166]其中,任选的,在正常组织和肿瘤组织之间存在表达差异的基因是通过下列步骤 确定的:
[0167] 将所述患病组织的RNA样本测序数据和所述正常组织的RNA样本测序数据分别比 对到全基因组和基因区域;
[0168]基于能够比对到所述基因区域的测序数据的量,分别计算每个基因在正常组织和 肿瘤组织中的RPKM值;
[0169]基于所述RPKM值,确定所述在正常组织和肿瘤组织之间存在表达差异的基因。
[0170]根据本发明的实施例,本发明提出的技术方案结合目前最先进的第二代测序手 段,通过芯片捕获结合全基因高通量二代测序,针对性地检测肿瘤病人个体遗传信息,例 如,与常用靶向药物药效相关的突变信息、与化疗相关的突变信息或药物代谢信息等,经过 突变解读,建立单个病人个体化肿瘤遗传信息数学模型,为后续专业医生的设定治疗方法 提供数据基础。主要技术路线包括:1、建立肿瘤基因数据库;2、通过石蜡/冰冻肿瘤组织/血 液样本获取DNA及RNA; 3、通过高通量液相捕获技术对DNA及RNA进行富集;4、通过高通量测 序平台及生物信息平台获得病人个体肿瘤的突变列表,建立个人肿瘤遗传信息模型。
[0171]根据具体的实施例,
[0172] (1)预定肿瘤基因数据库建立:通过调研确定肿瘤相关基因范围,收集基因突变、 对应药物及治疗、治疗效果等信息,建立一个包含肿瘤基因变异、药物治疗、代谢、生存等信 息的肿瘤遗传信息数据库。数据库具体包含基因名、基因描述、基因突变信息(包括突变类 型、突变位置及突变信息、基因表达量变化、融合基因)、癌肿、所用疗法或药物、基因突变与 用药关系判断、实验样本类型、实验样本数量、生存统计。例如,可以按照下表统计相关基因 的信息。
[0173]肿瘤基因数据库项目内容

[0176] Gene:基因名
[0177]Drug:药物名称。
[0178]Genedescription:基因描述。
[0179]MutationInformation:突变信息.
[0180] Ref genome database/database version num:基因组版本
[0181] Ref transcript database/database version num:基因的车专录ID
[0182]SNV
[0183]Nt(g):在基因组上的核苷酸的突变位置及突变信息
[0184] Nt:在基因中的核苷酸的位置及突变信息,如c. 52G>A
[0185]AA:在基因中的核苷酸的氨基酸位置及突变信息,如p.A18T
[0186]Indel
[0187]Nt(g):在基因组上的核苷酸的位置及突变信息
[0188]Nt:在基因中的核苷酸的位置及突变信息,如c.405_406insT,c.424delG,c.341_ 342insCCTCAA
[0189]AA:在基因中的核苷酸的氨基酸位置及突变信息,如p.V137fs,p.N114_R115insLN
[0190]CNV:基因拷贝数的变化
[0191] Expression:基因表达量的变化
[0192] Fusion:融合基因。如ABL与BCR基因融合,填写为ABL-BCR
[0193]DrugInformation:药物信息。
[0194] Cancer:癌种。
[0195]Phase:药物的临床信息。
[0196]Effect:根据文章中药物与基因突变的关系判断的药效 [0197]Originaldescription:判断药效或是治疗效果的资料依据。
[0198]SampleInformation:样本信息
[0199]CA/RA:资料结果是来自于临床试验(CA)还是科研试验(RA)。临床试验 (ClinicalTrial),指任何在人体(病人或健康志愿者)进行药物的系统性研究,以证实或揭 示试验药物的作用、不良反应及/或试验药物的吸收、分布、代谢和排泄,目的是确定试验药 物的疗效与安全性。临床试验一般分为I、II、III和IV期临床试验。其余为科研试验。
[0200] Sampletype:样本类型。
[0201]Number:实验样本的数量,分为case和control·Case是观测的样本数量,Control是对照样本数量。
[0202] Survival rates(PFS):无进展生存率统计[0203] Time(Year):实验观测的时间。
[0204] Case和Control:Case和Control的存活率。
[0205]Survival time(PFS):无进展生存时间统计。
[0206]Case和Control:Case和Control的存活率。
[0207]Survival rates(0S)&&Survival time(0S):0S是指Overal Survival,生存率和 生存时间的另一种统计方法。
[0208]Other:其他的生存率,生存时间或药效的统计方法及结果。
[0209]ReferenceInformation:参考文献信息
[0210] (2)从肿瘤病人正常组织样本及肿瘤组织样本(包括石蜡、冰冻组织、血液等样本 类型)中提取达到检测要求的DNA及RNA。所获得的DNA和RNA需要满足下列要求:
[0211] 检测所需DNA和RNA样品要求
[0213] *m:总量(TotalMass),DNA/RNA总量。c:浓度(Concentration),DNA/RNA浓度。 RIN:RNAIntegrityNumber,RNA分子完整性指数。28S/18S:28S/18S比值,真核生物rRNA中 28S与18S比值,反映真核RNA完整性
[0214] (3)芯片捕获靶向基因测序:通过步骤(2)所建立的预定肿瘤基因数据库,根据需 要对癌肿、基因突变与用药关系、生存统计等项目对所有基因进行评估,有针对性地挑选目 的基因,设计定制化基因捕获芯片(Agi1entSureSe1ect),对步骤(1)所得的样本DNA进行 目的基因的外显子部分及挑选部分基因的融合部分捕获,对获得的DNA片段建库并用 IlluminaHiseq测序系统进行500x深度的测序。DNA建库流程如下:
[0215] a.将l_3ygDNA样品打断成200_300bp的片段并进行纯化。
[0216]b.对打断后的样品分别进行末端修复及末端加"A"并纯化。
[0217] c.将步骤b中得到的产物与Illumina测序接头相连接并纯化。
[0218] d.以步骤c中得到的产物为模板,以IlluminaIndexP1及IlluminaIndexN为引 物进行PCR,反应条件为:94°C2min; 94°C20s,62°C40s,72°C40s,7cycles; 72°ClOmin。纯化 PCR产物并质控产物主带处于250-450bp之间,总量大于500ng。
[0219]e.按照AgilentSureSelect说明流程对步骤d所得产物进行捕获杂交并洗脱。
[0220] f·以步骤e中得到的产物为模板,以HS-EX0N-FC-1 · 1(10μΜ)及HS-EX0N-FC-1.2(10 μΜ)为引物进行PCR,反应条件为:98°C2min;98°C20s,60°C30s,72°C30s,10cycles;72°C 5min;4°Chold。纯化PCR产物。
[0221] g.将步骤f所得文库送检并进行Hiseq2000平台测序。
[0222] (4)RNA测序:对步骤(1)中所得的样本RNA进行RNA-seq建库并采用Illumina Hiseq测序系统进行SE50测序,通过步骤(2)所建立的预定肿瘤基因数据库提供的信息,针 对性关注相关的基因的表达量变化。RNA建库流程如下:
[0223]a.取200ng-2yg样品TotalRNA加DNaseI进行DNA消化,并纯化。
[0224]b.反转录第一链的合成。
[0225]c.反转录第二链合成,并对产物进行纯化。
[0226]d.对步骤c中得到的二链合成后DNA产物进行末端修复与纯化。
[0227]e.对步骤d中得到的产物进行3 '末端加"A"碱基。
[0228]f.将步骤e中得到的产物与11lumina测序接头相连接并纯化。
[0229]g.以步骤f中得到的产物为模板,以IlluminaIndexP1及IlluminaIndexN为引 物进行PCR,反应条件为:94°C2min; 94°C15s,62°C30s,72°C30s,15cycles; 72°C10min; 16°C hoId。并对PCR产物进行纯化。
[0230]h.将步骤g所得文库送检并进行IlluminaHiseqSE50测序。
[0231 ]i.若样品为石錯包埋样品提取的RNA,应按照DSNNormalization protocol.Illumina.Part#l5014673Rev.C.流程对步骤g所得产物进行DSN均一化处理后再 进行二次PCR并纯化,之后送检进行测序。
[0232] (5)得到靶向基因DNA重测序原始下机数据后,进行以下方面的信息分析:
[0233]a.输入原始数据进行过滤;过滤后数据进行比对,去重,重比对。
[0234]b.输入重比对后的数据进行深度和覆盖度计算。
[0235]c·输入重比对后的数据用Varscan进行SNV的查找。
[0236]d.输入重比对后的数据用GATK进行SomaticIndel的查找。
[0237]e.输入重比对后的数据用CREST进行SomaticSV的查找。
[0238]f.输入重比对后的数据用CONTRA或ExomeCNV进行SomaticCNV的查找。
[0239] g.输入重比对后的数据用GATK进行特殊位点SNP和基因型的判定。
[0240](6)得到RNA测序原始下机数据后,进行以下方面的信息分析:
[0241] a.输入原始数据进行过滤;过滤后数据分别比对到全基因组和基因区域。
[°242]b.输入比对到基因区域的数据,计算每个基因的RPKM值,并计算norma 1 - tumor的 差异表达基因。
[0243] c.输入比对到全基因组的数据,利用SOAPfuse查找融合基因。
[0244](7)整合步骤(5)、(6)分析结果,结合病人目的基因的DNA重测序突变检测结果和 相关表达量的变化,获得病人个体肿瘤的突变列表。
[0245](8)通过预定数据库,根据对病人基因的分析突变分型及病理学特征,建立个体肿 瘤遗传信息模型。
[0246]根据本发明的实施例,建立了一个肿瘤个体化遗传信息数据库,可在数据库的基 础上有针对性地挑选待检测基因,一次性定制化设计相关基因位点捕获芯片。
[0247]根据本发明的实施例,通过对病人肿瘤相关基因DNA进行SNV、Somatic Indel、Somatic SV、Somatic CNV查找,综合对某些基因正常组织-患病组织的差异表达进行比较, 并寻找融合基因,综合性的对病人癌症分子突变分型进行定位,结合数据库中的各种基因 变异对应的疗法及疗效信息,建立个体化肿瘤遗传信息数学模型。
[0248]根据本发明的实施例,可以一次性综合检测数百个基因,有效地减少样本消耗,降 低检测成本。
[0249]根据本发明的实施例,形成适合国人的癌症基因数据库及模型。
[0250]确定个体基因突变的系统
[0251]在本发明的又一方面,本发明提出了一种确定个体基因突变的系统,所述基因突 变与预定的疾病相关,该系统包括:
[0252]核酸样本获取装置100、文库构建装置200、测序装置300和基因突变确定装置400。根据本发明的实施例,核酸样本获取
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1