1.检测肿瘤异质性程度的方法,其特征在于,包括以下步骤:
获取来自于每一受试者的同一肿瘤组织样本和对照样本的测序数据,对所述肿瘤组织样本和对照样本进行体细胞变异检测,获得体细胞变异位点;
将所述体细胞变异位点按簇进行聚类;
根据聚类结果,如果肿瘤细胞簇比例最高的簇包含两个或两个以上变异的异常结果,则将肿瘤细胞簇比例最高的簇判断为主克隆突变簇,剩余的突变簇判断为亚克隆突变簇;如果肿瘤细胞簇比例最高的簇仅包含一个变异的异常结果,则将肿瘤细胞簇比例最高和次高的突变簇同时判断为主克隆突变簇,剩余的突变簇判断为亚克隆突变簇;
计算所述肿瘤组织样本中亚克隆突变簇中的体细胞变异数量占所有体细胞变异数量的比值,该比值即为肿瘤异质性数值。
2.根据权利要求1所述的方法,其特征在于,根据所述体细胞变异位点,计算变异等位测序深度、变异等位频率、变异位点拷贝数、肿瘤纯度值,根据所述体细胞变异位点以及变异等位测序深度、变异等位频率、变异位点拷贝数、肿瘤纯度值进行聚类分析,将所述体细胞变异位点按簇进行聚类。
3.根据权利要求2所述的方法,其特征在于,所述变异等位测序深度vi是指测序数据中在相应位点发生体细胞变异的变异序列的条数;
所述变异等位频率
所述肿瘤纯度值是指肿瘤细胞数量在所述肿瘤组织样本细胞总数中的占比pur,取值范围为(0,1],所述肿瘤细胞是指发生体细胞变异的所有细胞的总和;
所述变异位点拷贝数的计算过程如下:根据体细胞变异位点vari所在区域的拷贝数变异cnvi,计算所述体细胞变异位点vari所在区域的参考拷贝数ncni和实际总拷贝数tcni,其中:
并获得体细胞变异位点vari所在的两条染色体上等位特异的拷贝数变异cnvi,major、cnvi,minor,其中cnvi,major≥cnvi,minor,
从而计算出实际的等位特异的拷贝数cni,major、cni,minor:
4.根据权利要求1所述的方法,其特征在于,聚类分析时,对于任一类型的体细胞变异,将所述受试者的肿瘤组织样本中的细胞被分为三类:正常细胞n、不携带所述体细胞变异的肿瘤细胞twt和携带所述体细胞变异的肿瘤细胞tmuut,携带所述体细胞变异的肿瘤细胞tmut占所有肿瘤细胞(tmut+twt)的比例称为该体细胞变异的肿瘤细胞比例,如果两个或以上体细胞变异的变异肿瘤细胞比例满足在同一个分布模型中,则对所述同一个分布模型中的变异赋予相同的簇标签,聚类成一簇,称为一个克隆;
每个受试者的每个簇标签cj(j=1,…,c),都有与之对应的肿瘤细胞簇比例
如果所述肿瘤细胞簇比例
其中,j=1,...,c,k=1,...,c且k≠j;
同时将剩余的簇一同判断为亚克隆突变簇csub:
csub=cl,l∈{1,...,c},l≠j,l≠k;
统计主克隆突变簇cmain中体细胞变异位点vari的数量nmain和亚克隆突变簇csub中体细胞变异位点vari的数量nsub,计算肿瘤异质性数值ith,所述肿瘤异质性数值ith是指亚克隆突变簇中的变异数量占所有变异数量的比值:
5.根据权利要求1所述的方法,其特征在于,还包括:根据所述肿瘤异质性数值ith设定阈值,将小于或等于所述阈值的样本所对应的受试者判定为低风险受试者,将大于所述阈值的样本所对应的病例判定为高风险受试者。
6.根据权利要求5所述的方法,其特征在于,取所有受试者的肿瘤异质性数值的中位数作为判断每位受试者肿瘤异质性高/低的阈值,克隆层级低于该阈值的受试者,其肿瘤异质性较低,反之,则肿瘤异质性较高。
7.根据权利要求1所述的方法,其特征在于,所述受试者为实体瘤患者,优选为肺癌、鼻咽癌或黑色素瘤患者;
和/或,所述体细胞变异选自点突变、插入/缺失、结构变异、拷贝数变异中的至少一种;
和/或,所述肿瘤组织样本和对照样本的测序方法为全基因组测序、全外显子组测序或探针捕获测序,优选为全外显子组测序。
8.一种检测肿瘤异质性程度的系统,其特征在于,所述系统包括:
数据获取模块,用于获取来自于每一受试者的同一肿瘤组织样本和对照样本的测序数据;
体细胞变异检测模块,用于对所述肿瘤组织样本和对照样本进行体细胞变异检测,获得体细胞变异位点;
聚类模块,用于将所述体细胞变异位点按簇进行聚类;
主克隆亚克隆判断模块,用于根据聚类结果,如果肿瘤细胞簇比例最高的簇包含两个或两个以上变异的异常结果,则将肿瘤细胞簇比例最高的簇判断为主克隆突变簇,剩余的突变簇判断为亚克隆突变簇;如果肿瘤细胞簇比例最高的簇仅包含一个变异的异常结果,则将肿瘤细胞簇比例最高和次高的突变簇同时判断为主克隆突变簇,剩余的突变簇判断为亚克隆突变簇;
肿瘤异质性程度计算模块:用于计算所述肿瘤组织样本中亚克隆突变簇中的体细胞变异数量占所有体细胞变异数量的比值,该比值即为肿瘤异质性数值。
9.一种检测肿瘤异质性程度的装置,其特征在于,所述装置包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-7任意一项所述的方法。