建立检测微卫星不稳定的基线及模型的方法与应用与流程

文档序号:19422515发布日期:2019-12-14 01:42阅读:480来源:国知局
建立检测微卫星不稳定的基线及模型的方法与应用与流程
本发明涉及基因测序数据分析领域,具体而言,涉及一种建立检测微卫星不稳定的基线及模型的方法与应用。
背景技术
:微卫星不稳定(microsatelliteinstability,msi)指的是微卫星重复次数减少或者增加,出现新的等位基因。大量研究表明,微卫星不稳定性是由错配修复基因发生缺陷引起的,与肿瘤的发生密切相关。临床上已将微卫星不稳定性作为结直肠癌及其他实体瘤预后和制定辅助治疗方案的重要分子标志物,并应用于协助lynch综合征筛查。然而,对于ngs数据,缺乏判别微卫星不稳定性的金标准。目前,对于ngs数据,如图1所示,大多数检测方法都是使用来自nccn等的微卫星位点进行检测,然后以20%为分界线,即有20%及以上的微卫星位点发生不稳定,即判定此样本为微卫星不稳定。然而,现有方法对微卫星不稳定的检测方法仍存在灵敏度低的缺陷。技术实现要素:本发明的主要目的在于提供一种建立检测微卫星不稳定的基线及模型的方法与应用,以解决现有技术中对测序数据中的微卫星位点检测灵敏度低的问题。为了实现上述目的,根据本发明的一个方面,提供了一种建立检测微卫星不稳定的基线的方法,该方法包括:针对待测样本的测序数据在人类参考基因组上所对应的区域,搜索区域内所有可用的微卫星位点;利用多个对照血细胞样本的测序数据,统计各对照血细胞样本中各微卫星位点的平均覆盖深度基线,并保留平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;利用各候选微卫星位点及平均覆盖深度基线,计算多个阳性样本和多个阴性样本各自的测序数据中每个候选微卫星位点的平均覆盖深度及peaks数目,并找出peaks数目在多个阳性样本和多个阴性样本中存在显著差异的候选微卫星位点,作为检测微卫星位点,各检测微卫星位点在多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目即形成检测微卫星不稳定的基线。进一步地,所有可用的微卫星位点的最小长度为10bp。进一步地,深度阈值大于等于30。根据本发明的第二个方面,提供了一种建立检测微卫星不稳定的模型的方法,该方法包括:采用上述任一种方法建立检测微卫星不稳定的基线;利用机器学习算法将基线中多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目进行建模,得到检测微卫星不稳定的模型。进一步地,机器学习算法为随机森林算法。根据本发明的第三个方面,提供了一种检测微卫星不稳定的模型,该模型采用上述任一种方法建成。根据本发明的第四个方面,提供了一种检测微卫星不稳定的方法,该方法包括:按照上述任一种方法中的检测微卫星位点,检测待测样本的测序数据中各检测微卫星位点的peaks数目;利用上述任一种检测微卫星不稳定的模型,对待测样本的测序数据中各检测微卫星位点的peaks数目进行分析,从而得到待测样本的微卫星不稳定状态结果。根据本发明的第五个方面,提供了一种建立检测微卫星不稳定的基线的装置,该装置包括:微卫星位点搜索模块、候选微卫星位点筛选模块及基线建立模块,微卫星位点搜索模块,用于将待测样本的测序数据与人类参考基因组序列进行比对,得到所有可用的微卫星位点,待测样本的测序数据包括所有已知微卫星位点的测序数据;候选微卫星位点筛选模块,用于利用多个对照血细胞样本的测序数据,统计各对照血细胞样本中各微卫星位点的平均覆盖深度基线,并保留平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;基线建立模块,用于利用各候选微卫星位点及平均覆盖深度基线,计算多个阳性样本和多个阴性样本各自的测序数据中每个候选微卫星位点的平均覆盖深度及peaks数目,并找出peaks数目在多个阳性样本和多个阴性样本中存在显著差异的候选微卫星位点,作为检测微卫星位点,各检测微卫星位点在多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目形成检测微卫星不稳定的基线。根据本发明的第六个方面,提供了一种建立检测微卫星不稳定的模型的装置,该装置包括:上述建立检测微卫星不稳定的基线的装置中的微卫星位点搜索模块、候选微卫星位点筛选模块、基线建立模块以及机器学习建模模块,其中,机器学习建模模块用于利用机器学习算法将基线中多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目进行建模,得到检测微卫星不稳定的模型。根据本发明的第七个方面,提供了一种检测微卫星不稳定的装置,该装置包括:上述建立检测微卫星不稳定的基线的装置中的微卫星位点搜索模块、候选微卫星位点筛选模块、基线建立模块以及上述建立检测微卫星不稳定的模型的装置中的机器学习建模模块,检测模块以及预测模块,检测模块,用于检测待测样本的测序数据中各检测微卫星位点的peaks数目;预测模块,用于利用检测微卫星不稳定的模型,对待测样本的测序数据中各检测微卫星位点的peaks数目进行分析,从而得到待测样本的微卫星不稳定状态结果。根据本发明的第八个方面,提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述建立检测微卫星不稳定的基线方法,或者执行上述建立检测微卫星不稳定的模型的方法,或者执行上述检测微卫星不稳定的方法。根据本发明的第九个方面,提供了一种处理器,该处理器包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述建立检测微卫星不稳定的基线方法,或者执行上述建立检测微卫星不稳定的模型的方法,或者执行上述检测微卫星不稳定的方法。应用本发明的技术方案,通过将测序数据与人参考基因组序列进行比对,找到测序数据中所有可用的微卫星位点,充分利用了ngs数据中包含的微卫星位点,然后利用肿瘤对照血细胞样本的测序数据,从这些微卫星位点中筛选出捕获效率较高的微卫星位点进行后续分析,进一步通过已知微卫星状态的阳性样本和阴性样本的测序数据,从筛选出的捕获效率高的微卫星位点中找出peaks数目在两组样本存在显著性差异的微卫星位点,进而利用这些peaks数目存在显著性差异的微卫星位点的平均覆盖深度及其peaks数目形成后续检测待测样本微卫星不稳定的基线。相比目前市场上的常用方法,该方法首先利用更多的微卫星位点信息进行基线建立,在后续对待测样本的微卫星状态进行检测或判断时,同样对更多的微卫星位点进行检测和判断,因而不仅提高了测序数据的利用效率,而且提高了检测的灵敏度。附图说明构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1示出了根据现有技术中检测微卫星不稳定的方法的流程示意图;以及图2示出了根据本申请的一种优选实施例中建立检测微卫星不稳定的基线的方法的流程示意图;图3示出了根据本申请的一种优选实施例中检测微卫星不稳定的方法的详细流程示意图;图4示出了实施例5中的对在微卫星阳性样本和微卫星阴性样本中的peaks数目存在显著差异的微卫星位点的聚类分析图;图5示出了实施例5中的对在微卫星阳性样本和微卫星阴性样本中的peaks矩阵进行roc分析的结果图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。微卫星:微卫星是遍布于人类基因组中的短串联重复序列,有单核苷酸、双核苷酸或高位核苷酸的重复,重复次数10-50次。微卫星稳定性:微卫星由于重复单位的插入或缺失而导致微卫星长度的改变。bed文件格式是一种可变方式的数据线,用来描述注释的数据。bed线有3个要求的字段和9个额外的字段。三个要求的字段分别是:1,chrom,染色体或scafflold的名字,如chr3,chry。2,chromstart染色体或scafflold的起始位置,第一个染色体的位置是0。3,chromen,染色体或scafflold的终止位置。9个额外的可选bed字段是:4,name,定义bed的名字;5,score0-1000的分值,如果track线在注释时属性设置为1,该分值觉得现示灰度水平,水中越大,灰度越高;6,strand定义链的+或-;7,thickstart开始的位置;8,thickend结束的位置;9,itemrgbanagb值的形式;10,blockcountbed线,在exon的block数目;11,blocksize用逗号分隔blocksize,该item列表对应于blockcount;12,blockstarts用逗号分隔的列表。实施例1在本申请一种优选的实施例中,提供了一种建立检测微卫星不稳定的基线的方法,图2是根据本发明实施例的建立检测微卫星不稳定的基线的方法的流程图。如图2所示,该方法包括:步骤s101,针对待测样本的测序数据在人类参考基因组上所对应的区域,搜索所述区域内所有可用的微卫星位点;步骤s102,利用多个对照血细胞样本的测序数据,统计各对照血细胞样本中各微卫星位点的平均覆盖深度基线,并保留平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;步骤s103,利用各候选微卫星位点及平均覆盖深度基线,计算多个阳性样本和多个阴性样本各自的测序数据中每个候选微卫星位点的平均覆盖深度及peaks数目,并找出peaks数目在多个阳性样本和多个阴性样本中存在显著差异的候选微卫星位点,作为检测微卫星位点,各检测微卫星位点在多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目形成检测微卫星不稳定的基线。上述方法,通过将测序数据与人参考基因组序列进行比对,找到测序数据中所有可用的微卫星位点,充分利用了ngs数据中包含的微卫星位点,然后利用肿瘤对照血细胞样本的测序数据,从这些微卫星位点中筛选出捕获效率较高的微卫星位点进行后续分析,进一步通过已知微卫星状态的阳性样本和阴性样本的测序数据,从筛选出的捕获效率高的微卫星位点中找出peaks数目在两组样本存在显著性差异的微卫星位点,进而利用这些peaks数目存在显著性差异的微卫星位点的平均覆盖深度及其peaks数目形成后续检测待测样本微卫星不稳定的基线。相比目前市场上的常用方法,该方法首先利用更多的微卫星位点信息进行基线建立,在后续对待测样本的微卫星状态进行检测或判断时,同样对更多的微卫星位点进行检测和判断,因而不仅提高了测序数据的利用效率,而且提高了检测的灵敏度。需要说明的是,上述实施例中,待测样本的测序数据优选为待测样本的肿瘤组织的测序数据。而对照血细胞样本与肿瘤组织来源于同一待测样本(如同一待测个体)。更优选地,针对已经报道的所有微卫星位点,通过针对所有已知与肿瘤突变相关的位点设计panel构建捕获文库,进而测序得到测序数据。在确定微卫星位点时,除了包括常用的nccn报道的微卫星位点外,还包括根据测序数据与参考基因组序列进行比对所筛选到的微卫星位点(未曾报道过的)。上述对照血细胞样本与现有检测微卫星不稳定的方法中所用到的血细胞样本的涵义相同,均是指与待测的肿瘤组织同一样本来源的血细胞样本。此处,该血细胞样本用来计算待检测的各微卫星位点的平均覆盖深度。血细胞样本的数目通常为多个,优选至少为5个、10个、15个、20个、25个、30个、40个、50个或者50个以上。在本申请一可选实施例中,血细胞样本为52个。上述在利用微卫星阳性样本及微卫星阴性样本,计算捕获效率高的微卫星位点的peaks,利用这些peaks进一步筛选出在两组中区分度大的微卫星位点,即在微卫星阳性样本及微卫星阴性样本两组中peaks个数有显著差异的位点,此处显著性差异优选采用秩和检验,p<=0.01来进行检验。本申请中,peak或peaks是指微卫星位点的插入缺失情况统计值,对检测的样本的微卫星位点,统计其读段长度种类,每种长度种类的支持reads需大于3才可算为有效的长度种类,如一个微卫星位点在参考基因组上为24个a,在一个检测样本中出现了多种情况,分别为15个a(2条reads),20个a(10条reads),21个a(20条reads),22个a(40条reads),23个a(100条reads),首先将15个a的情况删除,因为支持reads数小于3,剩下的有4个读段长度种类,所以peaks即为4。一可选的实施例中,将待测样本的测序数据与人类参考基因组序列进行比对,得到所有可用的微卫星位点的步骤,采用msisensor软件(v0.5)在人参考基因组序列(hg19)搜索待测样本测序数据文件范围内的所有微卫星位点,该软件参数除了将微卫星位点的最小长度设置为10之外,其余均采用默认参数。步骤s102是从所有可用的微卫星位点筛选出捕获效率高的微卫星位点。一可选实施例中,利用同时测序的多个血细胞的测序数据,计算所有可用的微卫星位点的平均覆盖深度,选取平均覆盖深度大于30的微卫星位点为捕获效率高的微卫星位点。实施例2在一种优选的实施例中,本申请还提供了一种建立检测微卫星不稳定的模型的方法,该方法包括:采用前述任一种方法建立检测微卫星不稳定的基线;利用机器学习算法将基线中多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目进行建模,得到检测微卫星不稳定的模型。该优选实施例,一方面通过最大化的利用测序数据中的微卫星位点信息建立检测的基线,另一方面采用机器学习的算法,利用基线中的阳性样本中的各检测微卫星位点的peaks数目和阴性样本中的各检测微卫星位点的peaks数目建立了检测微卫星不稳定的预测模型。通过机器学习方法建立的模型对样本的微卫星状态进行预测时同样采用机械学习的方法来进行分析和判断,因而,检测灵敏度更高,且特异性也更高,与目前市场上一般选用20%为分界线的判断方法相比,避免了现有方法主观性过强的缺陷。上述利用机器学习方法建立模型的步骤中,优选采用随机森林算法(sklearn0.20.0)进行建模。实施例3在本申请一种优选的实施例中,还提供了一种检测微卫星不稳定的模型,该模型采用上述方法建立检测微卫星不稳定的模型的方法建成。利用机器学习算法建立的模型,对样本的微卫星状态进行分析和判断,具有较高的灵敏度和特异性。实施例4在本申请一种优选的实施例中,还提供了一种检测微卫星不稳定的方法,该方法包括:按照上述建立检测微卫星位点的基线的方法中的检测微卫星位点,检测待测样本的测序数据中各检测微卫星位点的peaks数目;利用上述检测微卫星不稳定的模型,对待测样本的测序数据中各检测微卫星位点的peaks数目进行分析,从而得到待测样本的微卫星不稳定状态结果。利用机器学习算法建立的模型,对样本的微卫星状态进行分析和判断,具有较高的灵敏度和特异性。一种更具体地的实施例中,微卫星稳定性检测的步骤包括:1)对于待检测样本先计算出微卫星位点的peaks;2)利用阴性样本集和阳性样本集中的peaks矩阵建立模型,利用随机森林机器学习模型(sklearn0.20.0)对计算出的最终微卫星位点的peaks进行分析给出样本微卫星状态为阳性的概率,模型参数均为默认;3)对样本预测为阳性的概率大于0.6的时候判读为msi-h,大于0.4且小于0.6的时候判读为msi-l,小于0.4的时候判读为mss(0.4和0.6的阈值根据阳性样本集和阴性样本集所能够区分的最佳值确定的)。现有技术中有报道通过先判断单个位点的稳定性(以将阴性样本的微卫星位点的稳定性均值与三倍方差的和作为该微卫星位点稳定性的阈值,大于该阈值则预测此微卫星位点为不稳定。此方案是一刀切的特点,对于临界值不能灵活处理),然后对每个样本计算不稳定位点占所有检测到有效位点的比例,然后根据比例对样本微卫星不稳定性进行判断,此处的比例一旦确定也是一个具体的值,也会出现对于临界值不能很好地处理问题。而上述优选实施例,通过直接对阴性样本集和阳性样本集中的peaks矩阵建立模型,利用机器学习的学习能力对新的样本进行预测,避免了临界值的处理,提高的对样本的判别准确性。实施例5目标:检测一个ngs测序(panel测序,参考基因组为hg19)样本的微卫星状态。步骤:具体检测流程如图3所示,1.使用msisensor软件(v0.5)搜索此样本测序panel文件(即bed区域文件)范围内对应在人参考基因组上的所有微卫星位点,软件参数除了微卫星位点最小长度设置为8bp之外,其余均为默认参数。此步骤获(即步骤a)取可用的所有微卫星位点,部分结果如表1所示。表1:chrstartendmsrepeatmsidchr180741688074175ag4ms1chr11118207111182082tct4ms2chr11620314416203155cag4ms3chr11625514216255153ga6ms4chr11625610716256114ag4ms5chr11626269516262702ca4ms6chr12702294027022954ccg5ms7chr12702297727022988agc4ms8chr12702300827023022ggc5ms9………………附:chr表示染色体,start表示微卫星位点的起始位置;end表示微卫星位点的终止位置;ms表示重复单元的最小单位,repeat表示重复次数,msid表示微卫星位点的编号。2.选取同样panel测序的52个血细胞,计算步骤1中的所有微卫星位点的平均覆盖深度,选取平均覆盖深度大于30的为捕获效率高的位点,作为后续进一步筛选的基础位点。此步骤(即步骤b)主要是获取位点平均深度的基线(baseline)及捕获效率高的微卫星位点,结果如表2所示。表2:msidqcsaverage_total_readscountms1pass302.352941251ms2pass236.215686351ms3pass234.470588251ms4pass200.823529451ms5pass199.62745151ms6pass481.725490251ms7pass131.333333351ms8pass133.980392251ms9pass125.9650…………附:表2中,msid表示微卫星位点的编号;qcs:表示支持序列质控状态;average_total_reads表示覆盖各微卫星位点的平均reads数(即平均覆盖深度);count表示通过质控的样本数。3.利用已知微卫星状态的9例阳性样本(msi-h,微卫星高频不稳定)及18例阴性样本(mss,微卫星稳定)及步骤2中获取的捕获效率高的微卫星位点的位点平均覆盖深度的基线,计算得到各位点平均深度及peaks数目以及在阳性和阴性样本中区分度大的微卫星位点,分度大的微卫星位点即在9例阳性样本及18例阴性样本两组中peaks个数有显著差异的位点(秩和检验,p<=0.01,共53个位点)。此步骤(即步骤c)获取了阳性和阴性样本的区分度大的微卫星位点的平均覆盖深度及peaks矩阵baseline。结果见表3-1和表3-2。表3-1:表3-2:4.利用pca算法对捕获效率高且在阳性和阴性样本中区分度大的微卫星位点的peaks矩阵进行分类,分类结果见图4。从图4(pc1代表第一主成分,pc2代表第二主成分)可以看出,筛选出的微卫星位点在两组样本中存在明显差异。5.利用交叉验证对捕获效率高且在阳性和阴性样本中区分度大的微卫星位点的peaks矩阵进行roc分析,分析结果见图5。从图5可以看出,上述所构建的模型的灵敏性及特异性均为100%。6.对于待检测样本,先计算出捕获效率高且在阳性和阴性样本中区分度大的微卫星位点的peaks,然后利用以上模型进行预测,最终给出结果(即步骤d),结果如表4所示。表4:样本为mis-h的概率180504253t10.9从该实施例可以看出:该方法对于已知的9例msi-h及18例mss样本有100%的灵敏性及100%的特异性。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。对应于上述方式,本申请还分别提供了一种建立检测微卫星不稳定的基线的装置、一种建立检测微卫星不稳定的模型的装置以及一种检测微卫星不稳定的装置,这些装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。下面结合可选的实施例进一步说明。实施例6在本实施例中,还提供了一种建立检测微卫星不稳定的基线的装置,该装置包括:微卫星位点搜索模块、候选微卫星位点筛选模块及基线建立模块,其中,微卫星位点搜索模块,用于针对待测样本的测序数据在人类参考基因组上所对应的区域,搜索所述区域内所有可用的微卫星位点;候选微卫星位点筛选模块,用于利用多个对照血细胞样本的测序数据,统计各对照血细胞样本中各微卫星位点的平均覆盖深度基线,并保留平均覆盖深度基线满足深度阈值的微卫星位点作为候选微卫星位点;基线建立模块,用于利用各候选微卫星位点及平均覆盖深度基线,计算多个阳性样本和多个阴性样本各自的测序数据中每个候选微卫星位点的平均覆盖深度及peaks数目,并找出peaks数目在多个阳性样本和多个阴性样本中存在显著差异的候选微卫星位点,作为检测微卫星位点,各检测微卫星位点在多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目形成检测微卫星不稳定的基线。该装置通过利用微卫星位点搜索模块将测序数据与人参考基因组序列进行比对,找到测序数据中所有可用的微卫星位点,充分利用了ngs数据中包含的微卫星位点,然后执行候选微卫星位点筛选模块利用肿瘤对照血细胞样本的测序数据,从这些微卫星位点中筛选出捕获效率较高的微卫星位点进行后续分析,进一步执行基线建立模块通过已知微卫星状态的阳性样本和阴性样本的测序数据,从筛选出的捕获效率高的微卫星位点中找出peaks数目在两组样本存在显著性差异的微卫星位点,进而利用这些peaks数目存在显著性差异的微卫星位点的平均覆盖深度及其peaks数目形成后续检测待测样本微卫星不稳定的基线。相比目前市场上的常用装置,该装置首先利用更多的微卫星位点信息进行基线建立,在后续对待测样本的微卫星状态进行检测或判断时,同样对更多的微卫星位点进行检测和判断,因而不仅提高了测序数据的利用效率,而且提高了检测的灵敏度。可选地,所有可用的所述微卫星位点的最小长度为10bp。可选地,深度阈值大于等于30。实施例7在本实施例中,还提供了一种建立检测微卫星不稳定的模型的装置,该装置除了包括上述建立检测微卫星不稳定的基线的装置中的微卫星位点搜索模块、候选微卫星位点筛选模块、基线建立模块外,还包括机器学习建模模块,其中,机器学习建模模块用于利用机器学习算法将基线中多个阳性样本和多个阴性样本中的平均覆盖深度及peaks数目进行建模,得到检测微卫星不稳定的模型。相对于现有装置,本装置所用的微卫星位点不仅包含了现有算法所用到微卫星位点,并且还包含一些其他的能够显著区分msi-h和mss的位点,提高了灵敏性。另外本装置采用机器学习的方式利用已知微卫星不稳定状态的阳性样本和阴性样本建立模型,后续利用该模型对待检测样本进行判别,相对于现有装置中通过硬性的20%分界线进行判别,提高了检测的特异性。实施例8在本实施例中,还提供了一种检测微卫星不稳定的装置,该装置包括:上述建立检测微卫星不稳定的基线的装置中的微卫星位点搜索模块、候选微卫星位点筛选模块、基线建立模块以及上述建立检测微卫星不稳定的模型的装置中的机器学习建模模块,还包括检测模块和预测模块,检测模块,用于检测待测样本的测序数据中各检测微卫星位点的peaks数目;预测模块,用于利用检测微卫星不稳定的模型,对待测样本的测序数据中各检测微卫星位点的peaks数目进行分析,从而得到待测样本的微卫星不稳定状态结果。从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本申请提供的建立检测微卫星不稳定的基线的方法及装置,所用的微卫星位点不仅包含了现有所用到微卫星位点,并且还包含一些其他的能够显著区分msi-h和mss的位点,提高了灵敏性。另外本申请的方法和装置对于最终的样本微卫星状态的判别不是使用20%为分界线,而是使用机器学习的方式利用已知微卫星不稳定状态的阳性样本和阴性样本进行建模,然后对待检测样本进行判别,相对于硬性的20%分界线提高了特异性。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1