基于高通量测序法筛查和诊断卵巢高级别浆液性癌的方法和装置与流程

文档序号:18145652发布日期:2019-07-10 11:47阅读:446来源:国知局
本发明涉及医学和生物学领域。具体而言,本发明涉及医学检测。更具体而言,本发明涉及通过基因组检测进行卵巢高级别浆液性癌的诊断、筛查和风险分级。
背景技术
:卵巢癌是妇科恶性肿瘤中死亡率最高的肿瘤。由于卵巢癌发病隐匿、无特异性、并且进展迅速,70%的卵巢癌患者发现时已为中晚期,总体5年生存率仅约30%。高级别浆液性癌(hgsc)是最常见的卵巢癌类型,占上皮性卵巢癌的70%~80%,大多数高级别浆液性癌被诊断为晚期(iii期或iv期),总体预后较差。因此,提高卵巢高级别浆液性癌的早期发现、早期诊断水平可以提高患癌患者治疗机会、生存期及生活质量。卵巢高级别浆液性癌的筛查主要是在高危人群中进行。患卵巢癌的高危人群包括以下情形:(1)高龄,如年龄大于50岁;(2)有一位或多位血亲患卵巢癌;(3)体内存在brca1或brca2基因突变;(4)患有林奇综合征或存在林奇综合征相关基因突变;(5)未孕妇女等。目前筛查和诊断卵巢高级别浆液性癌的主要手段包括检测肿瘤标记物ca125及经阴道b超。ca125被广泛地应用于卵巢癌的诊断,但约有30%的卵巢癌患者在诊断卵巢癌时ca125并无异常。另一方面,在妇女妊娠期、腹腔炎症、子宫内膜异位症等良性肿瘤情况下,ca125可轻微或明显增高。因此可见,ca125对于卵巢癌患者筛查并不是一个良好的指标。而经阴道b超,由于操作涉及患者的隐私及侵入性,普通人群的依从性较差,且b超检查依赖有经验的医生,具有一定的主观性,不适合作为临床常用的筛查方式。其它检查方式如盆腹部ct、pet-ct,均具有x射线的辐射,更不适用于普通人群的卵巢癌的筛查。ctdna(循环肿瘤dna,circulatingtumordna)是一种游离在血浆中的小片段dna,由凋亡或坏死的肿瘤细胞中的基因组入血产生,因此携带有原发瘤或转移瘤特定的基因特征。ctdna获取方便且较为稳定。染色体不平衡是恶性肿瘤的特征之一,是指相对于常见的二倍体基因组发生的基因组结构变异,包括染色体数量的改变,如多倍体或单倍体;也包括染色体局部的改变,如拷贝数增加或拷贝数缺失等。染色体的不平衡可通过基因剂量效应直接改变基因的表达水平,或调控其他基因的表达,因此,染色体的不平衡在肿瘤的发生发展有着重要的意义。通过研究ctdna来反映染色体的平衡态可能对与肿瘤的定性具有一定的意义。ngs(下一代测序技术)可一次对几十万到几百万条dna分子进行序列测定,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deepsequencing)。本领域对于卵巢高级别浆液性癌的筛查和诊断的方法存在迫切需求。然而,据了解,迄今为止,尚无通过ngs来对卵巢癌进行快速诊断、尤其是早期诊断的有效方法。本发明人首次发现一种基于ngs方法通过研究ctdna的重组后的染色体不平衡态,从而进行卵巢高级别浆液性癌的筛查、诊断和风险分级。技术实现要素:本文提供了用于进行卵巢高级别浆液性癌的筛查、诊断和风险分级的系统和方法。特别地,本文提供了用于通过高通量测序进行卵巢高级别浆液性癌的筛查、诊断和风险分级的系统和方法。本发明利用高通量测序技术,从分子生物学层面上解决早期卵巢高级别浆液性癌症状隐匿、难以发现;卵巢包块性质待定;及肿瘤标记物阴性伴盆腔包块恶性可能的临床问题。本发明的方法和系统通过一次检测即能够发现可能的卵巢高级别浆液性癌。具体而言,本发明涉及以下方面,各方面之间的各技术方案可以根据需要进行组合。在本发明的第一个方面,涉及用于对卵巢高级别浆液性癌进行筛查、诊断或风险分级的一组染色体,该组染色体包含第2、3、5、7、8号染色体中的至少1、2、3、4或5个。在一个优选实施方案中,该组染色体包含第3、5和8号染色体。在一个具体实施方案中,该组染色体为第3、5、8号染色体的组合。在另一个具体实施方案中,该组染色体为第2、3、5、7、8号染色体的组合。在一个进一步的具体实施方案中,该组染色体为分离的。在一个具体实施方案中,所述诊断为早期诊断。在一个更具体的实施方案中,所述诊断为早期诊断,并且卵巢包块待定。在进一步的具体实施方案中,所述诊断为体外诊断。在本发明的第二个方面,涉及一种计算机可读介质,其上存储有指令,其中当所述指令被处理器执行时,使得计算机执行以下操作:判断来自受试者(例如人)的样品的第2、3、5、7、8号染色体中至少1条是否存在染色体不平衡(例如染色体长臂拷贝数与短臂拷贝数的差异是否高于或等于阈值,再如染色体长臂覆盖度与短臂覆盖度的差异是否高于或等于阈值);例如,将来自受试者的样品的第2、3、5、7、8号染色体中至少1条的染色体结构信息(例如测定染色体不平衡、染色体长臂拷贝数与短臂拷贝数的差异或染色体长臂覆盖度与短臂覆盖度的差异所需的结构信息)与来自健康个体的相应染色体的染色体结构信息进行比较,以确定来自所述个体的样品中上述染色体是否存在染色体不平衡。在一个具体实施方案中,在染色体不平衡(例如染色体长臂拷贝数与短臂拷贝数的差异高于或等于阈值,再如染色体长臂覆盖度与短臂覆盖度的差异高于或等于阈值)的情况下,判断为受试者患有卵巢高级别浆液性癌或者存在患卵巢高级别浆液性癌的风险)在一个具体实施方案中,所述受试者为哺乳动物,优选人。在进一步的具体实施方案中,所述受试者中存在肿瘤标记物ca125增高。在另一个进一步的具体实施方案中,其中所述受试者中不存在肿瘤标记物ca125增高。在一个具体实施方案中,通过以下方式进行判断染色体不平衡:将受试者(例如人)的全基因组数据序列(例如高通量测序技术获得的全基因组数据序列)比对到参考基因组(例如人类参考基因组hg19),并例如按照10~1000k/bin(优选200k/bin),平均分成多个段(例如bin);分别计算第i号染色体长臂覆盖到的段(例如bin)的读出序列(reads)的平均数(covchrip)和染色体短臂覆盖到的段(例如bin)的读出序列(reads)的平均数(covchriq);根据下列公式,计算r值:或其中p代表长臂,q代表短臂,chr为染色体(chromosome)的缩写,i选自2、3、5、7和8。在进一步的具体实施方案中,基于r值,根据公式(2)计算第i号染色体的z-score:其中μrchri是健康人群所对应的r值的平均数,σrchri是健康人群所对应的r值的标准偏差;任选地,选择z-score的绝对值大于等于3的染色体,根据公式(3),求cscore值:在进一步的具体实施方案中,其中所述样品来自受试者的外周血,优选外周静脉血。更具体地,所述样品为外周静脉血血浆中的游离dna,。在进一步的具体实施方案中,当满足以下条件之一时,将认为受试者存在染色体不平衡:-某一条染色体的z-score绝对值≥3;或-cscore>0;当满足以下条件之一时,将认为受试者不存在染色体不平衡:-所有染色体的z-score绝对值<3;或-cscore=0。在进一步的具体实施方案中,在任何染色体的z-score的绝对值大于等于3和/或cscore≥0的情况下,判断为受试者患有卵巢高级别浆液性癌或者存在患卵巢高级别浆液性癌的风险。本发明的第三方面涉及一种计算设备,其包含:本发明的计算机可读介质;和处理器。本发明的第四方面涉及一种系统,其包含:测序装置,其用于接收来自试验样品的核酸以提供来自该样品的核酸序列信息(例如,通过高通量测序技术获得的全基因组数据序列);以及本发明的计算设备。在一个具体实施方案中,所述测序装置为高通量测序仪,优选包括illuminamiseq、nextseq、hiseq、x10、novaseq。在进一步的具体实施方案中,所述高通量测序技术为下一代测序技术。本发明的第五方面涉及检测第2、3、5、7、8号染色体中的至少1条的染色体不平衡(优选染色体长臂拷贝数与短臂拷贝数的差异,更优选染色体长臂覆盖度与短臂覆盖度的差异)的试剂在制备对卵巢高级别浆液性癌进行筛查、诊断或风险分级的诊断剂中的用途。本发明的第六方面涉及检测第2、3、5、7、8号染色体中的至少1条的染色体不平衡(优选染色体长臂拷贝数与短臂拷贝数的差异,更优选染色体长臂覆盖度与短臂覆盖度的差异)的装置在制备对卵巢高级别浆液性癌进行筛查、诊断或风险分级的设备中的用途。在本发明的第八方面,涉及一种检测受试者中染色体不平衡的方法,其包括:判断来自受试者(例如人)的样品的第2、3、5、7、8号染色体中至少1条是否存在染色体不平衡(优选染色体长臂拷贝数与短臂拷贝数的差异,更优选染色体长臂覆盖度与短臂覆盖度的差异);例如,将来自受试者的样品的第2、3、5、7、8号染色体中至少1条的染色体结构信息(例如测定染色体拷贝数变异所需的结构信息)与来自健康个体的相应染色体的染色体结构信息进行比较,以确定来自所述个体的样品中上述染色体是否存在染色体不平衡。在本发明的第九方面,涉及一种用于对卵巢高级别浆液性癌进行筛查、诊断或风险分级的方法,其包括以下步骤:在一个具体实施方案中,所述方法包括以下步骤:将通过高通量测序技术获得的人类受试者的全基因组数据序列比对到人参考基因组hg19,并按照200k/bin,分成多个bin;分别计算第i号染色体长臂覆盖到的段(例如bin)的读出序列(reads)的平均数(covchrip)和染色体短臂覆盖到的段(例如bin)的读出序列(reads)的平均数(covchriq);根据下列公式,计算r值:或其中p代表长臂,q代表短臂,chr为染色体(chromosome)的缩写,i选自2、3、5、7和8;基于r值,根据公式(2)计算第i号染色体的z-score:其中μrchri是对应于健康人群的r值的平均数,σrchri是对应于健康人群的r值的标准偏差;任选地,选择z-score的绝对值大于等于3的染色体,根据公式(3),求cscore值:当某一染色体的z-score绝对值≥3时,则认为该染色体存在不平衡;当某一染色体的z-score绝对值<3时,则认为该染色体为正常染色体;进一步,当满足以下条件之一时,将受试者诊断为卵巢高级别浆液性癌患癌高风险患者:-所选染色体中至少一条染色体的z-score绝对值≥3;或-cscore>0;当满足以下条件之一时,将受试者诊断为卵巢高级别浆液性癌患癌低风险患者:-所选染色体中所有染色体的绝对值<3;或-cscore=0。在一个具体实施方案中,所述方法与用于诊断卵巢癌的其他方法组合。所述其他方法包括阴道b超、肿瘤标记物ca125水平测定、影像学诊断。更具体而言,所述影像学诊断包括ct、mri。【本发明的有益效果】本发明至少在以下方面取得了出人意料的有益效果:1.本发明从分子生物学水平上进一步提高卵巢高级别浆液性癌的筛出率,减少假阳性和假阴性。2.本发明的方法具备敏感性和特异性高的优点。3.本发明提出高通量测序法用于血浆cfdna测序,能够有效地检测肿瘤的染色体平衡状态。4.本发明提出了用一次检测,避免ca125假阳性、假阴性高的难题,阴道b超的侵入性及ct等影像学检查的辐射等问题。5.本方法适用于测序深度0.01以上的所有测序深度和测序量。【发明详述】下面将结合具体实施方式对本发明的实施方案进行详细描述,但是,本领域技术人员将理解,下列实施例仅用于说明本发明,而不是对本发明的范围的限定。根据优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得明显。【定义】在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所涉及的实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。如本文中使用的,术语“染色体”是指是细胞核中载有遗传信息的物质,在显微镜下呈圆柱状或杆状,主要由dna和蛋白质组成。从着丝粒到染色体两端之间的部分称为染色体臂,如果着丝粒不在染色体的中央,则可区分为长臂(q)和短臂(p)。两臂的长度对于鉴别染色体是重要的。如本文中使用的,术语“dna”即脱氧核糖核酸(deoxyribonucleicacid),是染色体的主要组成成分,同时也是主要遗传物质。如本文中使用的,术语“ctdna”即是一种游离在血浆中的小片段dna,由凋亡或坏死的肿瘤细胞中的基因组入血产生,因此携带有原发瘤或转移瘤特定的基因特征。如本文中使用的,术语“高通量测序(high-throughputsequencing)”(又被称为下一代测序(next-generationsequencing))是指能一次并行对几十万到几百万条dna分子进行序列测定的测序技术。如本文中使用的,术语“读出序列(reads)”,也称为读长,是指测序反应所能测得序列的长度。如果dna序列长度高于读出序列,那么必须把dna序列分割成长度在读出序列以内短序列才能测序。如本文中使用的,术语“序列比对”是指使读出序列(reads)通过序列一致性原则对齐到标准参考基因组(例如标准人参考基因组)上。如本文中使用的,术语“通量”是指单位时间内所能产生的数据量,是测序速度、测序数量的综合体现。如本文中使用的,术语“ca125”是一种卵巢癌生物标记物。1981年由bast等从上皮性卵巢癌抗原检测出可被单克隆抗体oc125结合的一种糖蛋白,来源于胚胎发育期体腔上皮。血清中ca125正常参考范围<35u/ml。如本文所用,术语“体外”是指人造环境以及在人造环境内发生的过程或反应。体外环境可以由试管和细胞培养物组成但不限于试管和细胞培养物。术语“体内”是指天然环境(例如动物或细胞)以及在天然环境中发生的过程或反应。如本文中使用的,术语“敏感性”是指患者中得出阳性检测的样本占患者总数的百分比。在医学诊断中,敏感性可通过如下公式表示,反映正确判断患者的比率:敏感性=真阳性人数/(真阳性人数+假阴性人数)×100%。如本文中使用的,术语“特异性”是指健康人中得出阴性检测的样本占健康人总数的百分比。在医学诊断中,特异性可通过如下公式表示,反映正确判断非患者的比率:特异性=真阴性人数/(真阴性人数+假阳性人数)×100%。如本文中使用的,术语“漏诊率”又称假阴性率,是指在一个群体中进行某疾病的筛检或诊断时,实际有病的受试者,按诊断标准被定为非患者的百分率。在医学诊断中,漏诊率可通过如下公式表示:漏诊率=假阴性人数/(真阳性人数+假阴性人数)×100%。如本文中使用的,术语“误诊率”又称假阳性率,是指在一个群体中进行某疾病的筛检或诊断时,实际没有病的受试者,按诊断标准被定为患者的百分率。在医学诊断中,误诊率可通过如下公式表示:误诊率=假阳性人数/(真阴性人数+假阳性人数)×100%。如本文中使用的,术语“健康人群”是指未患有卵巢高级别浆液性癌风险也不存在患卵巢高级别浆液性癌风险的个体。如本文中使用的,术语“z-score”,也称为z分数或标准分数(standardscore),是一个数与平均数的差再除以标准差的过程。在统计学中,标准分数是一个观测或数据点的值高于被观测值或测量值的平均值的标准偏差的符号数。在统计学中,z-score通过如下公式进行表示:其中μ为总体平均值,x-μ为离均差,σ表示总体标准偏差。如本文中使用的,术语“分离的”是指使被检测对象离开受试者(例如人)的体内环境。如本文中使用的,术语“约”应该被本领域技术人员理解,并将随其所用之处的上下文而有一定程度的变化。如果根据术语应用的上下文,对于本领域技术人员而言,其含义不是清楚的,那么“约”的意思是偏差不超过所述特定数值或范围的正负10%。除非上下文另外清楚地指示,否则单数形式“一个”、“一种”以及“所述”包括复数形式的指代物。类似地,除非上下文另外清楚地指示,否则词语“或”意图包括“和”。【高通量测序技术】高通量测序技术又称“下一代”测序技术,是相对于传统的桑格测序(sangersequencing)而言的,以能够一次并行对几十万到几百万条dna分子进行序列测定和一般读出序列较短等为标志。同时,高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为“深度测序”。随着高通量测序技术的迅猛发展,科学界也开始越来越多地应用高通量测序技术来解决生物学和医学问题。比如在基因组水平上对还没有参考序列的物种进行从头测序,获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序,在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序,从而开展可变剪接、编码序列单核苷酸多态性(csnp)等研究;或者进行小分子rna测序(smallrnasequencing),通过分离特定大小的rna分子进行测序,从而发现新的microrna分子。在转录组水平上,与染色质免疫共沉淀(chip)和甲基化dna免疫共沉淀(medip)技术相结合,从而检测出与特定转录因子结合的dna区域和基因组上的甲基化位点。高通量测序技术的诞生可谓基因组学研究领域一个具有里程碑意义的事件。高通量测序一般通过以下步骤进行:1.样本准备2.文库构建3.测序反应4.数据分析在本发明的方法中,总体上涉及以下步骤:1.收集血浆(1)采集受试者外周血12ml(6ml×2)置于edta抗凝管中,立即轻柔颠倒混合采血管10次,获得新鲜血液。(2)在采集新鲜血液4小时之内,将其于4℃、1600g离心10分钟。(3)离心后将上清液(血浆)分装到多个1.5ml离心管中。(4)将步骤(3)中收集的上清液于4℃、16000g离心10分钟,去除残余细胞;将上清液(即血浆)分装到新的1.5ml离心管中。2.提取cfdna可以通过本领域已知的方式提取cfdna。kapadna打断酶(如实施例中所述的蛋白酶k)可以有效地将双链dna进行片段化,而且不限dna种类和起始量(1ng~1μg),片段化的程度由酶切的时间和温度控制。打断后的dna可以直接用于二代测序的文库构建,效果和covaris机器打断效果相当;–15℃以下储存,有效期6个月。尽量避免反复冻融,冻融次数应不能超过5次。运输过程中试剂盒采用冰袋加干冰包装进行运输。3.建库测序dna文库的建立和染色体测序可通过本领域已知的方式进行。在本发明的具体事实方案中,通过以下方式进行:(1)纯化用磁珠室温放置30分钟备用;(2)磁珠涡旋混匀,每个样品中加入0.6x磁珠(加每个样品前都要再次混匀磁珠)。用200μl移液器吸打10次,混匀样品。样品室温混合5分钟;(3)样品放在磁力架上,室温静置5分钟,直到液体变清澈;(4)用200μl移液器将上清液转移到新的1.5ml离心管中,标记相应编号;(5)磁珠涡旋混匀,每个新离管心中加入初始样本体积0.3x磁珠(加每个样品前都要再次混匀磁珠)。用200μl移液器吸打10次,混匀样品。样品室温混合5分钟;(6)用200μl移液器移除上清液(注意:不要搅动磁珠),并立刻加入200μl80%乙醇,吹打两次,磁力架上静置1分钟;(7)将乙醇吸出后,再次加入200μl80%乙醇,吹打两次,磁力架上静置30秒;(8)吸干样品中的液体,在磁力架上晾干10分钟;(9)加入32μl无核酸酶水,取下样品管,枪头吹打至磁珠全部混匀;(10)室温放置2分钟后,再次放置在磁力架上5分钟,直到液体变清澈;(11)吸出30μl液体至1.5mll离心管中;(12)使用illuminamiseq、nextseq、hiseq、x10、novaseq以及任何读出序列超过30bp的测序平台产生测序数据。在本申请实施例中,将进一步详细描述具体操作步骤。目前市场上高通量测序平台的代表及其原理如下表所示:【表1】公司名称技术原理applybiosystems(abi)基于磁珠的大规模并行克隆连接dna测序法illumina合成测序法roche大规模并行焦磷酸合成测序法helicos大规模并行单分子合成测序法completegenomicsdna纳米阵列与组合探针锚定连接测序法任何适宜的高通量测序平台均可用于本发明。优选地,在本发明中所用的测序技术为由illumina提供的测序平台,包括但不限于miseq、nextseq、hiseq、x10、novaseq。illumina测序采用边合成边测序技术(sequencingbysythesis,sbs)。【染色体不平衡】染色体不平衡,又称染色体失衡。染色体不平衡是恶性肿瘤的特征之一,是指相对于常见的二倍体基因组发生的基因组结构变异。广义上的染色体不平衡包括染色体数量的改变,如多倍体或单倍体;也包括染色体局部的改变,如拷贝数增加或拷贝数缺失等。狭义的染色体不平衡则指非整倍性。在二倍体中,非整倍体变异有四种主要类型。1.非整倍性缺体性丢失一对同源染色体,即细胞的染色体数为2n-2。2.非整倍性单体性丢失单条染色体,即细胞的染色体数为2n-1。3.非整倍性三体性增加一条额外的染色体,即染色体组中有一条染色体具有三个拷贝。即细胞的染色体数为2n+1。4.非整倍性四体性增加一对额外的染色体,使染色体组中有一条染色体具有四个拷贝。即细胞的染色体数为2n+2。染色体的不平衡可通过基因剂量效应直接改变基因的表达水平,或调控其他基因的表达,因此,染色体的不平衡在肿瘤的发生发展有着重要的意义。通过研究ctdna来反映染色体的平衡态可能对与肿瘤的定性具有一定的意义。在本申请中,染色体不平衡可表现为染色体长臂拷贝数与短臂拷贝数之间存在差异导致的染色体不平衡。染色体不平衡可以通过高通量测序技术测得的染色体长臂覆盖度与短臂覆盖度之间的差异来进行判断,所述差异可以为两者之间的比值或者两者之间的差值。在染色体不平衡(例如染色体长臂拷贝数与短臂拷贝数的差异高于或等于阈值,再如染色体长臂覆盖度与短臂覆盖度的差异高于或等于阈值)的情况下,判断为受试者患有卵巢高级别浆液性癌或者存在患卵巢高级别浆液性癌的风险。在现有技术中,通过无创dna、染色体原位杂交(fish)、微阵列、基因芯片、染色体核型等方式来获得染色体结构信息,分析染色体不平衡。在本申请中,本发明人出人意料地发现,判断特定的染色体是否存在不平衡,能够用于对卵巢高级别浆液性癌进行诊断、筛查或风险分级。本发明人还出人意料地发现,通过特定的计算模型,计算z-score和cscore的值,来判断受试者中是否存在染色体不平衡,进而对卵巢高级别浆液性癌进行诊断、筛查或风险分级。具体而言,首先,将通过高通量测序技术获得的人类受试者的全基因组数据序列比对到人参考基因组hg19,并按照10~1000k、优选200k/bin,平均分成多个bin;分别计算第i号染色体长臂覆盖到的段(例如bin)的读出序列(reads)的平均数(covchrip)和染色体短臂覆盖到的段(例如bin)的读出序列(reads)的平均数(covchriq);根据下列公式,计算r值:或其中p代表长臂,q代表短臂,chr为染色体(chromosome)的缩写,i选自2、3、5、7和8。其次,基于r值,根据公式(2)计算第i号染色体的z-score:其中μrchri是对应于健康人群的r值的平均数,σrchri是对应于健康人群的r值的标准偏差;任选地,选择z-score的绝对值大于等于3的染色体,根据公式(3),求cscore值:再次,当某一染色体的z-score绝对值≥3时,则认为该染色体存在不平衡;当某一染色体的z-score绝对值<3时,则认为该染色体为正常染色体。进一步,当满足以下条件之一时,将受试者诊断为卵巢高级别浆液性癌患癌高风险患者:-所选染色体中至少一条染色体的z-score绝对值≥3;或-cscore>0;当满足以下条件之一时,将受试者诊断为卵巢高级别浆液性癌患癌低风险患者:-所选染色体中所有染色体的绝对值<3;或-cscore=0。【卵巢癌】卵巢癌是妇科恶性肿瘤中死亡率最高的肿瘤。在西方国家中,卵巢癌是所有妇科癌症之中引起死亡的主导原因。这种高死亡率是由大多数患者在晚期进行诊断所致。由于卵巢癌发病隐匿、无特异性、并且进展迅速,70%的卵巢癌患者发现时已为中晚期,总体5年生存率仅约30%,而早期的卵巢癌患者5年生存期可达到90%。卵巢癌包括卵巢浆液性癌、粘液性癌、透明细胞癌、子宫内膜样癌。卵巢高级别浆液性癌是卵巢浆液性癌中的一种类型,也最常见的卵巢癌类型,占上皮性卵巢癌的70%~80%。卵巢癌的分期主要是跟瘤体大小,有无侵犯到别的器官,有无淋巴转移,有无远处转移。卵巢癌分期主要可分为以下四期,即第一期、第二期、第三期和第四期。i期:病变局限于卵巢a期:病变局限于一侧卵巢,包膜完整,表面无肿瘤,无腹水;b期:病变局限于双侧卵巢,包膜完整,表面无肿瘤,无腹水;c期:ⅰa或ⅰb期病变已穿出卵巢表面,或包膜破裂,或在腹水中或腹腔洗液中找到恶性细胞。ii期:病变累及一侧或双侧卵巢,伴盆腔转移a期:病变扩展或转移至子宫或输卵管;b期:病变扩展至其他盆腔组织;c期:ⅱa或ⅱb期病变,肿瘤穿出卵巢表面;或包膜破裂;或在腹水或腹腔洗液中找到恶性细胞。iii期:病变累及一侧或双侧卵巢,伴盆腔以外种植或腹膜后淋巴结转移a期:病变大体所见局限于盆腔,淋巴结阴性,但镜下腹腔腹膜面有种植瘤;b期:腹腔腹膜种植瘤直径<2cm,淋巴结阴性;c期:腹腔腹膜种植瘤直径≥2cm,或伴有腹膜后或腹股沟淋巴结转移。iv:远处转移腹水存在时需找到恶性细胞;肝转移(累及肝实质)。【cfdna和ctdna】cfdna(cell-freedna)是血浆中的游离dna,以高浓度在癌症患者的外周血中循环。而ctdna(肿瘤循环dna)代表cfdna的一小部分,由凋亡或坏死的肿瘤细胞中的基因组入血产生,因此携带有原发瘤或转移瘤特定的基因特征。【试剂盒】用于进行本文所描述的方法的试剂、工具和/或说明书可以被提供于试剂盒中。例如,试剂盒可以包含用于确定癌症患者的适当疗法的试剂、工具以及说明书。这种试剂盒可以包括用于从患者收集组织(如血液)的试剂,和用于处理所述组织的试剂。所述试剂盒还可以包括用于测定的适当的缓冲液。还可以包括这些测定中的任一种所需的检测试剂。本文所表征的试剂盒还可以包括一份说明书,它描述了如何进行这些测定。试剂盒中所包括的信息材料可以是涉及本文所描述的方法和/或用于本文所描述的方法的试剂的使用的描述性、指导性、销售或其它材料。例如,试剂盒的信息材料可以包含联系信息,例如物理地址、电子邮件地址、网站或电话号码,其中试剂盒的使用者可以获得关于进行基因表达分析和解释结果的大量信息。【病理诊断和筛查标准】在病理诊断和筛查中,通常采用敏感性、特异性、漏诊率、误诊率和准确度作为诊断标准。“敏感性”是指患者中得出阳性检测的样本占患者总数的百分比。在医学诊断中,敏感性可通过如下公式表示,反映正确判断患者的比率:敏感性=真阳性人数/(真阳性人数+假阴性人数)×100%。“特异性”是指健康人中得出阴性检测的样本占健康人总数的百分比。在医学诊断中,特异性可通过如下公式表示,反映正确判断非患者的比率:特异性=真阴性人数/(真阴性人数+假阳性人数)×100%。“漏诊率”又称假阴性率,是指在一个群体中进行某疾病的筛检或诊断时,实际有病的受试者,按诊断标准被定为非患者的百分率。在医学诊断中,漏诊率可通过如下公式表示:漏诊率=假阴性人数/(真阳性人数+假阴性人数)×100%。“误诊率”又称假阳性率,是指在一个群体中进行某疾病的筛检或诊断时,实际没有病的受试者,按诊断标准被定为患者的百分率。在医学诊断中,误诊率可通过如下公式表示:误诊率=假阳性人数/(真阴性人数+假阳性人数)×100%。简而言之,如果真阳性、假阳性、真阴性和假阴性分别以a、b、c、d来表示,则敏感性、特异性、漏诊率、误诊率和准确度的关系可以如下所示。【表2】采用本方法筛查结果为阳性的病例数中,真阳性(a)表示病理诊断为患病,同时本方法结果也为阳性的病例数;假阳性(b)表示病理诊断为无病,同时本方法结果也为阳性的病例数;假阴性(c)表示病理诊断为患病,本方法结果也为阴性的病例数;真阴性(d)表示病理诊断为无病,同时本方法结果也为阴性的病例数。敏感性sen=a/(a+c);特异性sep=d/(b+d);漏诊率=c/(a+c);误诊率=b/(b+d);准确度=(a+d)/(a+b+c+d)如本领域技术人员所知晓,敏感性和特异性的值越高越好;漏诊率和误诊率值越低越好。【具体实施方式】下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。【实施例】【实施例1.收集血浆】通过以下方式收集血浆:(1)采集受试者外周血12ml(6ml×2)置于edta抗凝管中,立即轻柔颠倒混合采血管10次,获得新鲜血液。(2)在采集新鲜血液4小时之内,将其于4℃、1600g离心10分钟。(3)离心后将上清液(血浆)分装到多个1.5ml离心管中。(4)将步骤(3)中收集的上清液于4℃、16000g离心10分钟,去除残余细胞;将上清液(即血浆)分装到新的1.5ml离心管中。【实施例2.提取血浆中的cfdna】采用标准qiagen游离dna提取试剂盒(qiagen,qiaampdnabloodminikit,55114),按照说明书操作,每4ml外周血提取1~50ngdna。具体操作步骤如下:(1)取1管血浆冰上融解后,加入100ml的qiagen蛋白酶k。(2)加入0.8mlbufferacl(事先加入1.0ygcarrierrna)盖上管盖,涡旋30s,直至管内液体呈均相。(3)60℃孵育分钟。(4)加入1.8ml的bufferacb,涡旋混匀冰置5分钟。(5)将qiaamp微柱插入置于qiavac24plus的vac连接器内,将20ml管扩展器插入qiaamp微柱内。(6)将第(4)步所得的裂解混合液小心加入qiaamp微柱的管扩展器内,打开真空泵,待所有裂解液均从管内完全渗下,关闭真空泵,释压至ombar,小心取出管扩展器并弃去。(7)向管内加入600ylbufferacw1,保持管盖打开,打开真空泵,让bufferacw1完全渗透过qiaamp微柱,关闭真空泵,释压至omba。(8)向qiaamp微柱内加入750mlbufferacw2;保持管盖打开,开启真空泵,让acw2buffer完全渗过qiaamp微柱,关闭真空泵,释压至ombars。(9)加入750此乙醇(96~100%)至qiaamp微柱,保持管盖开启,打开真空泵使所有乙醇完全渗下,关闭真空泵,释压至ombars。(10)关闭管盖;将qiaamp微柱从真空歧管上取下,丢弃vac连接器;将qiaamp微柱放置于新的2ml连接管上,全速离心(20,000×g;14,000rpm)3分钟。(11)将qiaamp微柱放置于新的2ml收集管,打开管盖,56℃孵育10分钟。(12)将qiaamp微柱放置于新的1.5ml洗脱管上,弃去上一步的收集管;小心向膜中间加入的bufferave。关上管盖,室温孵育3分钟。(13)全速离心(20,000×g;14,000rpm)1分钟以洗脱核酸,收集得到血浆游离双链dna。【实施例3.建立测序文库】(1)纯化用磁珠室温放置30分钟备用;(2)磁珠涡旋混匀,每个样品中加入0.6x磁珠(加每个样品前都要再次混匀磁珠)。用200μl移液器吸打10次,混匀样品。样品室温混合5分钟;(3)样品放在磁力架上,室温静置5分钟,直到液体变清澈;(4)用200μl移液器将上清液转移到新的1.5ml离心管中,标记相应编号;(5)磁珠涡旋混匀,每个新离管心中加入初始样本体积0.3x磁珠(加每个样品前都要再次混匀磁珠)。用200μl移液器吸打10次,混匀样品。样品室温混合5分钟;(6)用200μl移液器移除上清液(注意:不要搅动磁珠),并立刻加入200μl80%乙醇,吹打两次,磁力架上静置1分钟;(7)将乙醇吸出后,再次加入200μl80%乙醇,吹打两次,磁力架上静置30秒;(8)吸干样品中的液体,在磁力架上晾干10分钟;(9)加入32μl无核酸酶水,取下样品管,枪头吹打至磁珠全部混匀;(10)室温放置2分钟后,再次放置在磁力架上5分钟,直到液体变清澈;(11)吸出30μl液体至1.5mll离心管中。【实施例4.高通量测序】使用illuminax10测序仪,对于在实施例2中得到的经扩增的dna片段文库,自该dna片段文库的一端或两端开始进行测序,从测得的序列减去接头(adapter)和样本标签(barcode),并且去除噪音(如低质量区域)而得到样品dna片段的序列,即有效读出序列(reads)。【实施例5.序列比对】(1)有效读出序列(reads)与标准人参考基因组的比对使用bwa-mem软件(http://bio-bwa.sourceforge.net),将实施例3中得到的有效读出序列(reads)比对到标准人参考基因组,并将该比对结果以每段200kb的大小分别写入多个*.bin格式的文件中。(2)对比对到标准人参考基因组的读出序列(reads)的个数的统计从(1)中得到诸多*.bin文件中选取人i号染色体(chri)的长臂和短臂所覆盖的多个*.bin文件,并计算所选取的*.bin文件中比对到标准人参考基因组上的有效读出序列(reads)的个数的平均数(covchrip和covchriq,其中p代表长臂,q代表短臂)。【实施例6.判断染色体不平衡的存在与否】使用计算模型如下计算染色体平衡态分值(z-score和cscore)。(1)将受试者的全基因组数据序列比对到人参考基因组,并按照200k/bin分成多个bin;(2)分别计算染色体长臂和短臂覆盖到的bin的读出序列(reads)的平均数(cov);(3)根据公式(1),通过长臂reads平均数除以短臂reads平均数,计算r值:或其中p代表长臂,q代表短臂,chr为染色体(chromosome)的缩写,i代表某条染色体;(4)利用上一步骤得出的r值,计算每条染色体的z-score:其中μ为由健康人群计算得出的r的平均数,σ为由健康人群计算得出的标准差;(5)任选地,利用公式(2)计算得出的z-score的绝对值大于等于3的染色体,通过公式(3),求cscore值:【实施例7.染色体不平衡以及患卵巢高级别浆液性癌的风险判断】在实施例6的基础上,通过计算得到的染色体平衡态分值,判断染色体是否存在异常、患者是否存在患卵巢癌的风险、以及风险高低。1.异常染色体:某一染色体z-score绝对值≥32.正常染色体:某一染色体z-score绝对值<33.患癌高风险当满足以下条件之一时,将受试者诊断为卵巢癌患癌高风险患者:-某一条染色体的z-score绝对值≥3;或-cscore>0。4.患癌低风险当满足以下条件之一时,将受试者诊断为卵巢癌患癌低风险患者:-所有染色体的z-score绝对值<3;或-cscore=0。【实施例8.ca125正常受试者中卵巢高级别浆液性癌的筛查与诊断】受试者情况:接受检测的受试者为一名59岁中年女性,因“发现盆腔包块半年”入院。检查ca125为6.96u/ml,出于正常值范围内。妇科检查可扪及6×6cm肿物,肿块性质不明。筛查对象:第2、3、5、7、8号染色体通过本发明所述的方法,针对该受试者计算得出的各染色体z-score分别如下表所示:【表3】染色体编号z-score211.5237.2456.9788.37鉴于第2、3、5、8号染色体中任一条的z-score≥3,判断该患者患卵巢癌风险高。对该受试者的包块进行手术切除,术后肿块组织进行病理检查,确定为卵巢高级别浆液性癌(figoic期)。本实施例表明:通过本发明的方法,对上述染色体的筛查,能够对卵巢高级别浆液性癌进行早期诊断。【实施例9.ca125升高受试者中卵巢高级别浆液性癌的筛查与诊断】受试者情况:接受检测的受试者为一名47岁中年女性,因“发现盆腔包块半年”入院。检查ca125水平为312u/ml,远超出正常参考值。经阴道b超显示:右附件区囊实型包块(13.2cm×7.8cm),包块性质不明。筛查对象:第2、3、5、7、8号染色体根据本发明的方法,计算上述染色体的z-score,均低于3(数据未显示),未发现有染色体出现不平衡。由此,判断该受试者患卵巢高级别浆液性癌的风险低。对该受试者的包块进行手术切除,术后肿块组织进行病理检查,确定为良性肿瘤(浆液性囊腺瘤)。本实施例表明:通过本发明的方法,对上述染色体的筛查,有利于确定受试者患卵巢高级别浆液性癌的风险高低。【实施例10.ca125升高受试者中卵巢高级别浆液性癌的筛查与诊断】受试者情况:接受检测的受试者为一名46岁中年女性,因“腹胀20+天,盆腔包块5天”入院。检查ca125水平为205.8u/ml,ct检查显示左侧附件区囊性包块,性质不明。筛查对象:第3、5、8号染色体通过本发明所述的方法,针对该受试者计算得出的各染色体z-score分别如下表所示:【表4】染色体编号z-score34.1384.84鉴于第3、8号染色体中任一条的z-score≥3,判断该患者患卵巢癌风险高。对该受试者的包块进行手术切除,术后肿块组织进行病理检查,确定为卵巢高级别浆液性卵巢癌(figoiiic期)。本实施例表明:通过本发明的方法,对第3、5、8号染色体的筛查,能够有效地判断受试者患卵巢高级别浆液性癌的风险高低,当卵巢高级别浆液性卵巢癌处于中晚期时,尤为如此。【实施例11.数据统计和诊断分析】本研究纳入总计52名受试者。对这些受试者根据本发明的方法计算z-score和cscore,列示于下表5。【表5】注:上表中,i表示染色体编号。如i=2,则表示第2号染色体。结果表明:根据本发明的方法,当筛查对象为第3、5、8号染色体时,第1~17号受试者均被诊断为卵巢高级别浆液性癌高风险(z-score≥3,或cscore>0)。病理证实,第1~18号(18位)受试者均为卵巢高级别浆液性癌患者,第18~52号(34位)受试者非癌患者。本研究方法对于高级别浆液性癌的筛查,敏感性为94.4%(17/18),特异性为100%(34/34)。准确性为%(52/52),漏检率为5.56%(1/18),误诊率为0%(0/34)。进一步地,结果表明:根据本发明的方法,当筛查对象为第2、3、5、7、8号染色体时,第1~18号受试者均被诊断为卵巢高级别浆液性癌高风险(z-score≥3,或cscore>0)。病理证实,第1~18号(18位)受试者均为卵巢高级别浆液性癌患者,第19~52号(34位)受试者非癌患者。本研究方法对于高级别浆液性癌的筛查,敏感性为100%(18/18),特异性为100%(34/34)。准确性为100%(52/52),漏检率为0%(0/18),误诊率为0%(0/34)。以上结果表明,本发明的方法可以简便、高效地诊断和筛查卵巢高级别浆液性癌,具备敏感性、特异性和准确性都非常高以及漏检率和误诊率低的优点,相对于现有技术取得了出人意料的技术效果。尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公开的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1