一种膀胱癌的无创检测及其复发监测方法与流程

文档序号:12413124阅读:174来源:国知局

本发明涉及生物技术领域,具体地,涉及一种膀胱癌的无创检测及其复发监测方法。



背景技术:

膀胱尿路上皮癌是泌尿生殖系统中最常见的恶性肿瘤,具有病灶多,复发率高的特点。由于泌尿系统的癌肿位于腹腔及盆腔,只有用特殊检查方法检测,故膀胱癌早期诊断率较低。因此,膀胱癌的早期诊断、早期治疗显得尤为重要。此外,膀胱肿瘤单纯手术复发率较高,经尿道膀胱肿瘤切除(TURBT)后临床面临的一个重要问题是肿瘤复发,而且肿瘤复发后的病理分级和临床分期将加重。如果在术后随访期间出现肉眼血尿,则要考虑复发的可能性。因此,膀胱癌术后在预防复发的治疗期间需要每3个月进行1次膀胱镜复查。

尿脱落细胞学检查和膀胱镜检查是现有临床诊断及监测膀胱癌复发最重要的两种手段。其中,尿脱落细胞学检查是对尿液或膀胱冲洗液进行癌细胞检测。尿细胞学检测膀胱癌虽然具有无创、特异性高的优点,但其检测敏感性与癌细胞恶性分级密切相关,对于低级别尿路上皮病变敏感性较差,且受主观因素影响大。

膀胱镜目前是临床诊断膀胱癌的金标准,也是判断膀胱癌复发随诊的主要方法之一。但膀胱镜检查的局限性在于其侵入性、检测过程造成患者痛苦难以接受并且价格昂贵,还有可能错过平坦型病变和上尿路的病变,因此其他辅助诊断方法常伴随膀胱镜进行检测。膀胱镜针对出现血尿、脱落细胞结果有异常的患者进行检测更合适。

很多恶性肿瘤细胞为DNA非整倍体性,并且非整倍体肿瘤的侵袭性或恶性程度往往比形态相似的二倍体肿瘤更高。针对细胞内染色体数目或结构的异常是肿瘤发生发展的根本原因,UroVysion使用荧光原位杂交技术(Fluorescence in situ hybridization,FISH)检测技术,主要用于染色体数目和结构畸变的研究。但FISH探针特异性高但敏感性稍差,且价格也较昂贵,目前FISH检测同类产品在中国临床应用率并不高。

因此,本领域迫切需要开发能够快速、高效诊断膀胱癌,并且可作为膀胱癌早期筛查及复发检测的方法。



技术实现要素:

本发明的目的在于提供一种能够快速、高效诊断膀胱癌,并且可作为膀胱癌早期筛查及复发检测的方法。

在本发明第一方面,提供了一种非治疗性非诊断性的检测样本中突变位点的方法,包括步骤:

(i)提供一待测样本;

(ii)对所述待测样本进行测序,从而获得所述样本的基因组序列;

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对,从而获得基因组序列在参考基因组上的位置信息;

(iv)将所述的参考基因组分成M个区域片段,其中每个区域片段为一个窗口b,计算每个窗口b的拷贝数;

(v)对步骤(iv)的每个窗口b进行Z检验,从而计算每个窗口b的Z值;和

(vi)根据步骤(v)所得到的Z值,计算全基因组混乱度评分(WGAS,Whole genomic abnormality score);和

(vii)基于全基因组混乱度评分(WGAS),对于评分大于预定值Vd的样本进一步检测所述样本中的肿瘤相关的突变位点,从而获得所述待测样本中的肿瘤相关突变位点的检测结果。

在另一优选例中,所述的肿瘤选自下组:膀胱癌、乳腺癌、卵巢癌、胃癌、肺癌、结直肠癌、食管癌、胰腺癌、皮肤癌、前列腺癌、食管癌、胆囊癌、甲状腺癌、肝癌、喉癌、口咽癌、白血病、或其组合。

在另一优选例中,所述预定值Vd为60。

在另一优选例中,在步骤(ii)中,对所述待测样本无需提取其中DNA,直接进行测序,从而获得所述样本的基因组序列。

在另一优选例中,在步骤(ii)中,可提取所述待测样本中的DNA,进行测序,从而获得所述样本的基因组序列。

在另一优选例中,可对步骤(ii)获得的所述样本基因组序列直接检测样本中的突变位点。

在另一优选例中,所述参考基因组指该物种(如人)所有染色体的全长、单条或多条染色体的全长、单条或多条染色体的一部分、或其组合。

在另一优选例中,所述参考基因组可以是连续的,也可以是不连续的。

在另一优选例中,所述参考基因组包括全基因组。

在另一优选例中,所述参考基因组的覆盖率达到全基因组的50%以上,较佳地,60%以上,更佳地,70%以上,更佳地,80%以上,最佳地,95%以上。

在另一优选例中,所述样本来自待检测个体。

在另一优选例中,所述待检测个体为人或非人哺乳动物。

在另一优选例中,所述样本为固体样本或液体样本。

在另一优选例中,所述样本包括体液样本。

在另一优选例中,所述样本选自下组:血液、血浆、组织间隙液、淋巴液、脑脊液、尿液、唾液、房水、精液、胃肠道分泌液、或其组合。

在另一优选例中,所述样本选自下组:循环肿瘤细胞(CTC)、细胞外游离DNA(cfDNA)、外泌体、或其组合。

在另一优选例中,所述测序选自下组:单端测序、双端测序、或其组合。

在另一优选例中,所述步骤(iv)还包括校正每个窗口b的拷贝数,计算每个窗口b校正后的拷贝数的步骤。

在另一优选例中,所述校正方法选自下组:Loess校正、权重法、残差法、或其组合。

在另一优选例中,根据基因组序列在参考基因组上的位置信息,统计落到每个窗口b的序列数目、碱基分布、参考基因组的碱基分布。

在另一优选例中,根据每个窗口b的序列及碱基含量,校正每个窗口b的拷贝数。

在另一优选例中,用下述公式计算每个窗口b的Z值:

其中,i为1至M的任意正整数;M为参考基因组分成的窗口的总数量,其中M为≥50的正整数,较佳地,50≤M≤105,更佳地,100≤M≤105,最佳地,200≤M≤105;xi为所述待测样本在第i个窗口bi检测的拷贝数值;bi为第i个窗口。

在另一优选例中,所述正常对照样本指同一物种的正常人的同类样本。

在另一优选例中,用下述公式计算全基因组混乱度评分:

其中,mb为排序在第m%的窗口,pb为排序在第p%的窗口,m为30-98,较佳地,40-97,更佳地,60-96,最佳地,80-95,最佳地,95,p为80-100,较佳地,85-100,更佳地,90-100,最佳地,100,且p-m≥2(较佳地,≥5,更佳地,≥10,更佳地,≥15,最佳地,≥20)。

在另一优选例中,所述计算全基因组混乱度评分之前,包括如下步骤:

(a)根据参考基因组序列特征去除基因组上着丝粒、端粒、随体、异染色质等高通量测序测不到的区域,去除基因组上着丝粒、端粒、随体、异染色质附近L长度的区域,L为小于3M的任何长度;或

(b)根据样本的拷贝数特征去除基因组上着丝粒、端粒、随体、异染色质等高通量测序测不到的区域。

在另一优选例中,所述步骤(v)之前还包括如下步骤:

(iv1)根据步骤(iv)的每个窗口b的拷贝数,计算正常对照样本中每个窗口b的变异系数CVi;和

(iv2)将所述CVi从小到大排序,去除最大的前n%的窗口,其中,n为大于0,小于等于5的任意数值,较佳地,n=1、2、2.5、3、3.1、4、4.2或5。

在另一优选例中,所述变异系数CVi用下述公式进行计算:

其中,μi为正常对照样本在窗口bi的拷贝数的算术平均值,用如下公式计算:

其中,j为1至N的任意正整数;N为正常对照样本的总数量,其中N为≥30的正整数,较佳地,30≤N≤108,更佳地,50≤N≤107,最佳地,100≤N≤104;Xj指第j个正常对照样本在所述窗口bi检测的拷贝数值;

σi为正常对照样本在所述窗口bi的拷贝数的标准差,用如下公式计算:

式中,N、j、Xj、μi和σi的定义如上。

在另一优选例中,所述突变位点针对选自下组的基因:FGFR3、PIK3CA、TERT、TP53、TSC1、ERBB2、ELF3、ARID1A、KDM6A、RXRA、ERCC2、STAG2、FBXW7、NFE2L2、HRAS、AKT1、或其组合。

在另一优选例中,所述的突变位点选自下表:

在另一优选例中,所述突变位点选自下组:FGFR3、S249C、Y375C、R248C、G372C、A393E、K652E,PIK3CA、E545K、E542K、H1047R、H1047L、Q546R、E545D、E545G、TERT、c.1-124C>T、c.1-146C>T、c.1-124C>A、c.1-138_1-139CC>TT、TP53、R175H、G245S、G245D、R248Q、R248W、R248L、R249S、R273H、R273C、R273L、R282W、R213X、R196X、R306X、W146X、E298X,TSC1、E636Gfs、H68R、F158C、W347X、T417I、L576C、L576_P583>C,ERBB2、S310Y、S310F、I767M、R678Q、G292R、ELF3、E262Q、R251P、ARID1A、S614L、KDM6A、Q555*、W1193*、RXRA、S427F、S427Y、ERCC2、N238S、Y14C、STAG2、Q593*、FBXW7、R505G、S546L、NFE2L2、R18G、R18P、R34G、E79K、E63K、HRAS、Q61L、Q61R、G13R、G12C、G12V、G13V、AKT1、E17K、E49K、或其组合。

在另一优选例中,对所述全基因组混乱度评分(WGAS)<40-100,较佳地,<50-80,更佳地<60-70的所述待测样本(例如对于WGAS值为20-100,较佳地30-80,更佳地40-70的样本)进行突变位点的检测。

在另一优选例中,对所述全基因组混乱度评分(WGAS)≥60,较佳地≥70,更佳地≥80,更佳地≥100,最佳地≥120(例如在100-1000,较佳地100-500,更佳地100-200样本)的所述待测样本进行突变位点的检测。

在本发明第二方面,提供了一种无创的用于评估泌尿系统癌症复发风险的辅助诊断设备,包括:

Malbac-L扩增单元(设备或模块);

测序单元(设备或模块);

泌尿系统肿瘤相关突变位点检测单元(设备或模块);和

全基因组混乱度评分单元(设备或模块);其中,所述全基因组混乱度评分单元(设备或模块)用于执行本发明第一方面中步骤(iii)-(vi)的任务,并输出所得到的全基因组混乱度评分结果。

在另一优选例中,所述装置还包括样品预处理单元(设备或模块)。

在另一优选例中,所述预处理单元(设备或模块)用于对待测样本进行沉淀处理、和/或裂解处理。

在另一优选例中,所述待测样本为细胞样本。

在另一优选例中,所述待测样本为尿液。

在另一优选例中,所述测序单元(设备或模块)包括二代测序仪和/或三代测序仪。

在本发明第三方面,提供了一种诊断膀胱癌的方法,包括步骤:

(i)提供一待测样本;进行测序,从而获得所述样本的基因组序列;

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对,从而获得基因组序列在参考基因组上的位置信息;

(iv)将所述的参考基因组分成M个区域片段,其中每个区域片段为一个窗口b,计算每个窗口b的拷贝数;

(v)对步骤(iv)的每个窗口b进行Z检验,从而计算每个窗口b的Z值;和

(vi)根据步骤(v)所得到的Z值,计算全基因组混乱度评分(WGAS,Whole genomic abnormality score);

(vii)基于全基因组混乱度评分(WGAS),对于评分大于预定值Vd的样本进一步检测所述样本中的肿瘤相关的突变位点,从而获得所述待测样本中的肿瘤相关突变位点的检测结果;和

(viii)基于全基因组混乱度评分(WGAS)和所述样本中的肿瘤相关的突变位点的综合结果,从而诊断膀胱癌。

在另一优选例中,在步骤(viii)中,按以下判断标准进行判断:

(a)高风险:同时满足标准S1:WGAS评分≥60;和标准S2:泌尿系统肿瘤相关突变位点检测结果呈阳性;

(b)中风险:只满足标准S1或只满足标准S2;

(c)低风险:标准S1和标准S2均不满足。

在另一优选例中,所述突变位点是肿瘤复发相关突变位点。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

附图说明

图1显示了本发明实施例1中的检测结果。

具体实施方式

本发明人通过广泛而深入的研究,首次建立了一种有效且可提高膀胱癌检测的灵敏性和通用性的诊断膀胱癌的方法,具体地,通过计算全基因组混乱度评分(WGAS),并结合样本中的突变位点,从而诊断膀胱癌。在此基础上,本发明人完成了本发明。

术语

如本文所用,术语“突变频率”指已确诊肿瘤患者的检出频率。

如本文所用,术语“拷贝数变异(Copy Number Variations,CNV)”是指样本基因组染色体或染色体片段拷贝数异常,包括但不限于染色体非整倍体、缺失、重复,大于1000bp碱基的微缺失、微重复。

如本文所用,术语“全基因组混乱度值(Whole Genomic Abnormality Score,WGAS)”是根据样本基因组染色体或染色体片段拷贝数异常计算得到的分值,分值检测范围包括但不限于全基因组、特定的染色体、染色体片段、特定基因。

如本文所用,术语“Z值(Z-score)”也叫标准分值(standard score),是一个数值与平均数的差再除以标准差的过程。用公式表示为:

Z score=(x-μ)/σ

其中x为某一具体数值,μ为算术平均值,σ为标准差;Z值代表着原始数值和参考平均值之间的距离,是以标准差为单位计算。

如本文所用,术语“系统”、“设备”为相同含义。

在本发明中,所述突变位点没有特别限制,可以是已知的位点,也可以是将来鉴定出的与肿瘤(优选膀胱癌)相关的位点。

如本文所用,术语“设备”、“单元”、“模块”可互换使用。

参考基因组

在本发明中,以人为例,所述参考基因组可以是全基因组,也可以是部分基因组。并且,所述参考基因组可以是连续的,也可以是不连续的。当所述参考基因组为部分基因组时,所述参考基因组的总覆盖率(F)为全基因组的50%以上,较佳地,较佳地,60%以上,更佳地,70%以上,更佳地,80%以上,最佳地,95%以上,其中,所述总覆盖率(F)指参考基因组占全基因组的百分比。

在一优选实施方式中,所述参考基因组为全基因组。

在一优选实施方式中,所述参考基因组为该物种(如人)所有染色体的全长、单条或多条染色体的全长、单条或多条染色体的一部分、或其组合。

测序

在本发明中,可用常规的测序技术和平台进行测序。测序平台不受特别限制,其中第二代测序平台包括(但不限于):Illumina公司的GA、GAII、GAIIx、HiSeq1000/2000/2500/3000/4000、X Ten、X Five、NextSeq500/550、MiSeq、MiSeqDx、MiSeq FGx、MiniSeq;Applied Biosystems的SOLiD;Roche的454FLX;Thermo Fisher Scientific(Life Technologies)的Ion Torrent、Ion PGM、Ion Proton I/II;华大基因的BGISEQ1000、BGISEQ500、BGISEQ100;博奥生物集团的BioelectronSeq 4000;中山大学达安基因股份有限公司的DA8600;贝瑞和康的NextSeq CN500;紫鑫药业旗下子公司中科紫鑫的BIGIS;华因康基因HYK-PSTAR-IIA。

第三代单分子测序平台包括(但不限于):Helicos BioSciences公司的HeliScope系统,Pacific Bioscience的SMRT系统,Oxford Nanopore Technologies的GridION、MinION。测序类型可为单端(Single End)测序或双端(Paired End)测序,测序长度可为30bp、40bp、50bp、100bp、300bp等大于30bp的任意长度,测序深度可为基因组的0.01、0.02、0.1、1、5、10、30倍等大于0.01的任意倍数。

在本发明中,优选Illumina公司的HiSeq2500高通量测序平台,针对基因组混乱度评分(WGAS)的测序类型为单端(Single End)测序,测序长度41bp,测序数据量为5M,针对热点突变检测的测序类型为单端(Single End)测序,测序长度91bp,测序数据量为2M。

数据处理

在本发明中,数据处理通常包括以下步骤:

(a)对待测样本的基因组进行核酸提取、测序,以获得基因组序列;

(b)将所述样本的基因组序列比对到参考基因组,得到序列在参考基因组上的位置;

(c)将参考基因组分成一定长度的窗口,计算每个窗口b的拷贝数;

(d)对每个窗口b进行Z检验,计算每个窗口的Z值;和

(e)计算全基因组混乱度评分(WGAS)。

其中,在步骤(a)中,具体还包括:所述待测样本的类型为体液,体液可以是血液、组织间隙液(简称组织液或细胞间液)、淋巴液、脑脊液、尿液、唾液,检测目标为体液中的脱落细胞等。所述待测样本基因组DNA的提取方式包括(但不限于):柱式提取、磁珠提取。对样本进行文库构建,采用高通量测序平台,对样本进行测序。

其中,在步骤(b)中,具体还包括:将测序结果去掉接头及低质量数据,比对到参考基因组。参考基因组可为全基因组、任意染色体、染色体的一部分。参考基因组通常选择已被公认确定的序列,如人的基因组可为NCBI或UCSC的hg18(NCBI36)、hg19(GRCh37)、hg38(GRCh38),或任意一条染色体及染色体的一部分。比对软件可用任何一种免费或商业软件,如BWA(Burrows-Wheeler Alignment tool)、SOAPaligner/soap2(Short Oligonucleotide Analysis Package)、Bowtie/Bowtie2。将序列比对到参考基因组,得到序列在基因组上的位置。可以选择在基因组上唯一比对的序列,去除基因组上多处比对的序列,消除重复序列对拷贝数计算带来的误差。

其中,在步骤(c)中,具体还包括:将基因组分成一定长度的窗口,根据测的数据量,窗口长度也可以为100bp-3,000,000bp(3M)范围内相同或不同的整数。窗口的数量可以是1,000-30,000,000范围内的任意整数。根据测的序列在基因组上的位置,统计落到每个窗口的序列数目、碱基分布、参考基因组的碱基分布。根据每个窗口的序列及碱基GC含量,校正每个窗口的拷贝数,校正方法包括但不限于Loess校正,计算每个窗口校正后的拷贝数。

其中,在步骤(d)中,具体还包括:取N(N为不少于30的自然数)个正常人的样本,同样的提取、建库、测序条件,重复上述步骤(a)-(c),作为参考数据集。对于每个窗口bi,都对应N个正常拷贝数值。

计算正常对照样本拷贝数的算术平均值μi,算术平均值μi计算公式为:

计算正常对照样本拷贝数的标准差σi,标准差的计算公式为:

X1,X2,X3,......Xj为正常样本的拷贝数值。

计算待检测样本每个窗口bi的Z值,Z值的计算公式为:

xi为窗口bi检测的拷贝数值。

其中,在步骤(e)中,具体还包括:在整个基因组、某条染色体、染色体片段或基因周围存在高重复区域,如近着丝粒、端粒、随体、异染色质等区域。首先去除高重复区域,以消除对混乱度计算的影响。

在一优选实施方式中,去除的方法包括(但不限于):

a.根据参考基因组序列特征去除

去除基因组上着丝粒、端粒、随体、异染色质等高通量测序测不到的区域,去除基因组上着丝粒、端粒、随体、异染色质附近L长度的区域,L可以为小于3M的任何长度;或

b.根据正常样本的拷贝数特征去除

对于每个窗口bi,计算正常对照样本在这个窗口的变异系数CVi(Coefficient of Variation),CVi计算公式为:

μi为正常对照样本拷贝数的算术平均值,σi为正常对照样本拷贝数的标准差。

CV从小到大排序,去除最大的前n%的窗口,n可以为大于0,小于等于5的任意数值。

其中,在步骤(e)中,具体还包括全基因组混乱度评分(WGAS)的计算方式:

首先确定混乱度的检测范围,检测范围包括但不限于整个基因组、特定染色体、特定染色体片段或特定的基因等1M到基因组长度(如人的基因组约3G)范围内的任意值。在混乱度检测范围内,去除重复序列影响的窗口的Z值取绝对值,Z值绝对值从小到大排序,并将排好序的Z值绝对值平均分配到0%-100%范围内,其中Z值绝对值最小值被分配至0%,Z值绝对值的最大值被分配给100%。计算对应于第m%到第p%范围内的各窗口Z值绝对值的累计值,其中,m为30-98,较佳地,40-97,更佳地,60-96,最佳地,80-95,最佳地,95;p为80-100,较佳地,85-100,更佳地,90-100,最佳地,100,且p-m≥2(较佳地≥5,更佳地≥10,更佳地≥15,最佳地≥20),所述的累计值即为全基因组混乱度评分(WGAS),计算公式为:

mb为排序在第m%的窗口,pb为排序在第p%的窗口。用WGAS的值鉴定体液中肿瘤负荷。

全基因组混乱度评分(WGAS)

根据样本全基因组染色体或染色体片段拷贝数异常计算得到的分值,分值检测范围包括但不限于全基因组、特定的染色体、染色体片段、特定基因。

检测样本中突变位点的方法

本发明还提供了一种有效检测样本中突变位点的方法,包括步骤:

(i)提供一待测样本;

(ii)对所述待测样本进行测序,从而获得所述样本的基因组序列;

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对,从而获得基因组序列在参考基因组上的位置信息;

(iv)将所述的参考基因组分成M个区域片段,其中每个区域片段为一个窗口b,计算每个窗口b的拷贝数;

(v)对步骤(iv)的每个窗口b进行Z检验,从而计算每个窗口b的Z值;

(vi)根据步骤(v)所得到的Z值,计算全基因组混乱度评分(WGAS,Whole genomic abnormality score);和

(vii)基于全基因组混乱度评分(WGAS),对于评分大于预定值Vd的样本进一步检测所述样本中的肿瘤相关的突变位点,从而获得所述待测样本中的肿瘤相关突变位点的检测结果。

在一优选实施方式中,本发明的有效检测样本中突变位点的方法,包括步骤:

(i)提供一待测样本;

(ii)提取待测样本的基因组DNA;

(iii)对所提取的基因组DNA进行靶向测序,从而获得所述样本的涵盖突变位点的碱基序列;

(iv)将步骤(iii)获得的碱基序列与参考基因组进行比对,得到序列在基因组上的位置,选择在基因组上唯一比对的序列;

(v)Call原始SNP,统计膀胱癌热点突变。本发明的检测方法可大幅度提高样本中突变位点的检出率。

诊断膀胱癌的方法

本发明还提供了一种诊断膀胱癌的方法,包括步骤:

(i)提供一待测样本;进行测序,从而获得所述样本的基因组序列;

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对,从而获得基因组序列在参考基因组上的位置信息;

(iv)将所述的参考基因组分成M个区域片段,其中每个区域片段为一个窗口b,计算每个窗口b的拷贝数;

(v)对步骤(iv)的每个窗口b进行Z检验,从而计算每个窗口b的Z值;和

(vi)根据步骤(v)所得到的Z值,计算全基因组混乱度评分(WGAS,Whole genomic abnormality score);

(vii)基于全基因组混乱度评分(WGAS),对于评分大于预定值Vd的样本进一步检测所述样本中的肿瘤相关的突变位点,从而获得所述待测样本中的肿瘤相关突变位点的检测结果;和

(viii)基于全基因组混乱度评分(WGAS)和所述样本中的肿瘤相关的突变位点的综合结果,从而诊断膀胱癌。

在一优选实施方式中,本发明的有效且可提高膀胱癌检测的灵敏性和通用性的诊断膀胱癌的方法,包括步骤:

(i)提供一待测样本;

(ii)提取待测样本的基因组DNA;

(ii)对所述待测样本进行测序,从而获得所述样本的基因组序列;

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对,从而获得基因组序列在参考基因组上的位置信息;

(iv)将所述的参考基因组分成M个区域片段,其中每个区域片段为一个窗口b,计算每个窗口b的拷贝数;

(v)对步骤(iv)的每个窗口b进行Z检验,从而计算每个窗口b的Z值;

(vi)根据步骤(v)所得到的Z值,计算全及基因组混乱度评分(WGAS);和

(vii)对步骤(ii)中所获得的基因组序列进行突变位点的检测,从而诊断膀胱癌。

本发明的主要优点包括:

(1)本发明首次建立一种膀胱癌无创检测和复发监测方法,主要是通过检测膀胱癌患者尿沉淀的全基因组混乱度评分(WGAS)并结合膀胱癌热点突变,进而提供无创、有效的膀胱癌早期筛查及复发检测的手段。

(2)本发明提供的膀胱癌诊断方法可进一步提升NGS无创检测尿沉淀全基因组混乱度评分(WGAS)在不同分级样本中的灵敏性。

(3)本发明提供的膀胱癌诊断方法可提高膀胱癌检测的灵敏性和通用性。

(3)本发明的方法可减少膀胱癌患者检测时取样带来的痛苦,实现无创检测。

(4)本发明的方法可有效的检测某些常规检测很难取样或者无法取样的患者。

下面结合具体实施例,进一步陈述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。

除非有特别说明,否则实施例所用的材料均为市售产品。

实施例1

在本实施例中,对37例来自膀胱癌患者癌组织/尿沉淀、非肿瘤泌尿系统病变患者的尿沉淀和正常人的尿沉淀进行检测。详细实施过程如下:

1.对样本基因组进行核酸提取、测序

在本实施例中,检测样本来源为膀胱癌患者尿液,尿液经离心后取尿沉淀,再用PBS缓冲液洗过之后,提取尿沉淀中的基因组DNA(gDNA)。核酸提取采用康为世纪生物科技有限公司的CW2298核酸提取试剂盒,提取方法按照康为世纪生物科技有限公司提供的产品说明书操作。

采用康为世纪生物科技有限公司的CW2585建库试剂盒进行文库构建,上机测序。上机测序采用Illumina公司的HiSeq2500高通量测序平台,按照Illumina公司提供的说明书操作。测序类型为单端(Single End)测序,测序长度41bp,测序数据量为5M。

2.将序列比对到参考基因组,得到序列在基因组上的位置

将测序结果去掉接头及低质量数据,比对到参考基因组。参考基因组为人的基因组UCSC的hg19(GRCh37),比对软件为BWA(Burrows-Wheeler Alignment tool),采用默认参数,将序列比对到参考基因组,得到序列在基因组上的位置,选择在基因组上唯一比对的序列。

3.将参考基因组分成一定长度的窗口,计算每个窗口的拷贝数

将基因组分成15489个窗口b(区域),每个窗口b长度为200K,根据序列在基因组上的位置,统计落到每个窗口b的序列数目、碱基分布、参考基因组的碱基分布。根据每个窗口b的序列及碱基GC含量,校正每个窗口b的拷贝数,校正方法为Loess,计算每个窗口b校正后的拷贝数。

4.计算每个窗口的CV值

取100个正常人的样本,同样的提取、建库、测序条件,重复上述1、2、3步骤,获得正常对照样本数据,作为参考数据集,计算待检测样本每个窗口bi的CV值。

对于每个窗口bi,都对应N(本实施例N=100)个正常拷贝数值。

计算正常对照样本拷贝数的算术平均值μi,算术平均值μi计算公式为:

计算正常对照样本拷贝数的标准差σi,标准差的计算公式为:

X1,X2,X3,......Xj为正常样本的拷贝数值。

计算待检测样本每个窗口bi的CV值,CV值的计算公式为:

5.对每个窗口进行Z检验,计算每个窗口的Z值

计算待检测样本每个窗口bi的Z值,Z值的计算公式为:

xi为窗口bi检测的拷贝数值。

6.计算全基因组混乱度评分(WGAS)

在本实施例中,每个窗口CV从小到大排序,去除最大的前5%的窗口,不参与以下混乱度计算。混乱度的检测范围为整个基因组;Z值从小到大排序,计算第m%到第p%窗口Z值绝对值的累计值,其累计值即为基因组混乱度(GAS)。计算公式为:

mb为排序在第m%的窗口,pb为排序在第p%的窗口,其中,m为95,p为99。

检测结果表明,对于膀胱癌患者的组织或者尿沉淀样本,其WGAS值大多分布在60-110之间(约占90%),部分病情严重的病人甚至大于115。对于非肿瘤泌尿系统病变患者和正常人的尿沉淀样本,其WGAS值大多分布在40-60之间(约占99%)。这表明,基因组混乱度(GWAS值)可有效地和较为客观地反映膀胱癌的肿瘤负荷。

此外,为进一步提高检测的准确度和灵敏度,可进行进一步的突变基因和位点的筛查,以便尽早诊断和更有针对性地进行治疗。

实施例2

全基因组混乱度评分+膀胱癌热点突变的检测

在本实施例中,对部分对象同时进行全基因组混乱度评分和膀胱癌热点突变的检测。以FGFR3基因上的S249C、Y375C和PIK3CA基因上的E545K、H1047R为例,进行以下操作。

1.样本基因组的提取,PCR扩增及建库、测序

在本实施例中,检测样本为3例膀胱癌患者术后随访时采集的尿液,以及2例正常人的尿液。尿液经离心后取尿沉淀,再用PBS缓冲液洗过之后,采用康为世纪生物科技有限公司的CW2298核酸提取试剂盒,提取方法按照康为世纪生物科技有限公司提供的产品说明书操作。

选取膀胱癌突变频率最高的热点基因设计突变位点检测panel,进一步提高WGAS在不同样本中的灵敏性。以FGFR3基因上的S249C、Y375C和PIK3CA基因上的E545K为例,引物的碱基序列如下:

以提取的gDNA作为模板,用突变位点检测panel中的引物进行PCR扩增。再用康为世纪生物科技有限公司的CW2585建库试剂盒进行文库构建,上机测序。上机测序采用Illumina公司的HiSeq2500高通量测序平台,按照Illumina公司提供的说明书操作。测序类型为单端(Single End)测序,测序长度91bp,测序数据量为2M。

2.将序列比对到参考基因组上

将测序结果去掉接头及低质量数据,比对到参考基因组。参考基因组为人的基因组UCSC的hg19(GRCh37),比对软件为BWA(Burrows-Wheeler Alignment tool),采用默认参数,将序列比对到参考基因组,得到序列在基因组上的位置,选择在基因组上唯一比对的序列。

3.Call原始SNP,统计膀胱癌热点突变

将上一步得到的bam文件进行变异检测,软件为varscan,采用默认参数,得到原始SNP的vcf文件。然后使用annovar进行临床注释,过滤低质量以及无意义突变。最后统计膀胱癌相关热点突变,结果输出到excel表格,即总结出样本综合信息,用以评估膀胱癌诊断的结果,如下表。

上表中,样品1和样品2在之后的随访中均出现了肉眼血尿,需考虑复发的可能性,而样品3并未出现。

本发明的上述实施例表明,采用本发明方法,结合全基因组混乱度评分和膀胱癌热点突变的检测,可以更准确、更有效地进行膀胱癌无创检测的灵敏性和通用性。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 上海亿康医学检验所有限公司

<120> 一种膀胱癌的无创检测及其复发监测方法

<130> P2016-1732

<160> 6

<170> PatentIn version 3.5

<210> 1

<211> 22

<212> DNA

<213> 人工序列

<400> 1

ggagaacaag tttggcagca tc 22

<210> 2

<211> 23

<212> DNA

<213> 人工序列

<400> 2

actgtacacc ttgcagtgga act 23

<210> 3

<211> 18

<212> DNA

<213> 人工序列

<400> 3

cttccgctcc cagtggtg 18

<210> 4

<211> 18

<212> DNA

<213> 人工序列

<400> 4

gagcccaggc ctttcttg 18

<210> 5

<211> 27

<212> DNA

<213> 人工序列

<400> 5

gagtaacaga ctagctagag acaatga 27

<210> 6

<211> 26

<212> DNA

<213> 人工序列

<400> 6

gagatcagcc aaattcagtt attttt 26

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1