基因型检测方法、样本污染检测方法、装置、设备及介质与流程

文档序号:31479178发布日期:2022-09-10 01:19阅读:353来源:国知局
基因型检测方法、样本污染检测方法、装置、设备及介质与流程

1.本发明涉及生物技术领域,尤其涉及一种基因型检测方法、样本污染检测方法、装置、设备及介质。


背景技术:

2.snp位点基因型分型和批量snp位点基因型分型是基于高通量测序的位点基因型识别及基于高通量测序的拷贝数变异检测中的必要步骤。snp(single nucleotide polymorphism,单核苷酸多态性)主要是指基因组水平上由单个核苷酸的变异所引起的dna(deoxyribo nucleic acid,脱氧核糖核酸)序列多态性。snp位点所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换或颠换所引起,也可以是碱基的插入或缺失所致。有数据显示,特定的酶类snp位点与药物代谢相关,例如携带cyp2d6*10纯合突变的乳腺癌患者,使用莫昔芬辅助治疗的复发风险有可能高于野生型患者。另外,基于批量杂合snp丰度的变换识别染色体拷贝数变异首先需要依赖snp基因型的识别。通常的,snp基因型分型采用静态丰度阈值方法(例如:peter van loo等人发表的allele-specific copy number analysis of tumors,pnas vol.107,no.30:16910-16915),即通过丰度高于预设阈值(例如95%)即为纯合突变的方法。该方法受肿瘤占比,染色体结构变异,样本质量及样本污染的影响大,稳定性和准确性不高。
3.另一方面,在高通量测序中,样本储存,制备等过程中导致的异源dna污染是无法忽略的问题。样本污染直接导致突变检测中存在大量来自异源dna的低丰度突变,与待测样本真实的体系突变难以区分,从而导致突变结果的误判。因此,样本污染的识别是高通量测序质量控制的重要环节,样本污染的准确定量有助于识别和提取可靠的体系突变。通常的,样本污染的识别依赖于对照样本,在实际实践中存在取样困难,额外成本增加等问题。样本污染定量具有更大的难度,包括样本可能存在大量拷贝数变异,可能受多个污染源污染,对低程度污染识别和定量不敏感等问题。一些研究通过构建杂合snp丰度模型用于污染水平定量,然而基于静态阈值的snp基因型识别办法直接导致杂合snp数据集的不可靠。
4.例如:fi
é
vet等人的art-deco:easy tool for detection and characterization of cross-contamination of dna samples in diagnostic next-generation sequencing analysis(european journal of human genetics(2019)27:792

800)描述了一种检测测序样本污染的方法,包括筛选非杂合snp位点和检测污染来源的比例。其中的筛选非杂合型snp位点采用的静态阈值,当ar(allelic ratio,等位基因比率,类似于等位基因频率)为[0-0.005]和[0.995-1]时认为是非杂合型。其中检测污染来源的比例有两种方法,一是基于待测样本的非杂合snp位点的测序数据,按照wcs公式(见该论文第794页右栏)简单检测污染来源的比例,二是基于一种污染样本的snp基因型和待测样本的非杂合snp位点的测序数据,精细化计算检测污染来源的比例。
[0005]
然而,由于样本间的差异性,采用这种静态阈值来对所有样本的snp基因型进行判别,有时候是不够准确的。而为了识别污染来源,除了待测样本,还需要额外检测一组污染
样本,无法实现通过单一待测样本本身的检测数据来实现污染识别的目的。


技术实现要素:

[0006]
本发明提供了一种基因型检测方法、样本污染检测方法、装置、设备及介质,以解决现有基因型检测方法依赖配对测序数据的问题,为后续样本污染检测的精确度提供数据保障。
[0007]
根据本发明的一方面,提供了一种基因型检测方法,该方法包括:
[0008]
获取待检测样本中的至少10个待测snp位点以及获取至少3个待测丰度阈值;
[0009]
针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平;
[0010]
将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值;
[0011]
基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0012]
根据本发明的另一方面,提供了一种样本污染检测方法,该方法包括:
[0013]
获取待检测样本中的至少10个待检测snp位点,并确定各待测snp位点分别对应的基因型;
[0014]
基于满足基因型条件的待测snp位点对应的次等位基因频率,构建高斯混合模型;其中,所述基因型条件包括基因型为野生型和/或基因型为纯合型;
[0015]
对所述高斯混合模型进行最优化求解操作,得到所述待检测样本对应的污染状态数据;其中,所述污染状态数据包括污染比例、次等位基因频率方差和污染源的数目中至少一种。
[0016]
根据本发明的另一方面,提供了一种基因型检测装置,该装置包括:
[0017]
待测snp位点获取模块,用于获取待检测样本中的至少10个待测snp位点以及获取至少3个待测丰度阈值;
[0018]
丰度波动水平确定模块,用于针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平;
[0019]
第一丰度阈值确定模块,用于将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值;
[0020]
基因型确定模块,用于基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0021]
根据本发明的另一方面,提供了一种样本污染检测装置,该装置包括:
[0022]
基因型确定模块,用于获取待检测样本中的至少10个待检测snp位点,并确定各待测snp位点分别对应的基因型;
[0023]
高斯混合模型构建模块,用于基于满足基因型条件的待测snp位点对应的次等位基因频率,构建高斯混合模型;其中,所述基因型条件包括基因型为野生型和/或基因型为纯合型;
[0024]
污染状态数据确定模块,用于对所述高斯混合模型进行最优化求解操作,得到所述待检测样本对应的污染状态数据;其中,所述污染状态数据包括污染比例、次等位基因频
率方差和污染源的数目中至少一种。
[0025]
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
[0026]
至少一个处理器;以及
[0027]
与所述至少一个处理器通信连接的存储器;其中,
[0028]
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的基因型检测方法或样本污染检测方法。
[0029]
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的基因型检测方法或样本污染检测方法。
[0030]
本发明实施例的技术方案,通过针对获取到的每个待测丰度阈值,基于待测丰度阈值与各待测snp位点分别对应的次等位基因频率,确定待检测样本的丰度波动水平,将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值,本发明实施例通过构建的动态丰度阈值模型,确定第一丰度阈值,并根据第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0031]
通过这种动态阈值的方法,有效的避免了由于高肿瘤占比,拷贝数变异,样本污染等导致的纯合,杂合,野生型snp丰度偏离0%,50%和100%,从而导致基因型判别不准确的问题。同时,该算法不依赖对照样本,解决了对照样本取样困难,检测成本增加等问题。
[0032]
进一步地,本发明对依赖于动态阈值用于区分snp杂合和非杂合的基因型,可以具有更高的准确性,即:更低的假阳性或假阴性。同时,本发明的混合模型方法可以确认样本污染来源的个数,能够用于多污染源的污染识别和定量,低程度污染的识别和定量,以及具有不同染色体状态,包括染色体稳定和存在大量拷贝数变异的样本,稳定识别和定量污染程度,同时也不需要用到除了待测样本之外的其他样本(例如:参照样本、污染样本等)的测序信息。
[0033]
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0034]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]
图1是根据本发明实施例一提供的一种基因型检测方法的流程图;
[0036]
图2是根据本发明实施例二提供的一种样本污染检测方法的流程图;
[0037]
图3是根据本发明实施例三提供的一种样本污染检测方法的流程图;
[0038]
图4是根据本发明实施例四提供的一种基因型检测装置的结构示意图;
[0039]
图5是根据本发明实施例五提供的一种样本污染检测装置的结构示意图;
[0040]
图6是根据本发明实施例六提供的一种电子设备的结构示意图。
具体实施方式
[0041]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0042]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0043]
实施例一
[0044]
图1是根据本发明实施例一提供的一种基因型检测方法的流程图,本实施例可适用于对单一组织样本中的胚系snp位点进行基因型检测的情况,该方法可以由基因型检测方法装置来执行,该基因型检测装置可以采用硬件和/或软件的形式实现,该基因型检测装置可配置于终端设备中。如图1所示,该方法包括:
[0045]
s110、获取待检测样本中的至少10个待测snp位点以及获取至少3个待测丰度阈值。
[0046]
其中,示例性的,待检测样本为单一组织样本,如癌组织样本。在本实施例中,待测snp位点的类型为胚系snp位点。人体基因组存在大量的变异位点,根据来源的不同可分为胚系突变和体细胞突变,其中,胚系突变又称生殖细胞突变,是来源于精子或卵子这些生殖细胞的突变,因此,通常身上所有细胞都带有该突变,包括癌组织样本。体细胞突变,又称获得性突变,是在生长发育过程中或环境因素影响下后天获得的突变,通常身上只有部分细胞带有该突变。
[0047]
其中,具体的,对包含待检测样本的高通量测序序列的fastq文件(下机数据)进行质控后,采用比对软件将高通量测序序列比对到人类参考基因组上,将高通量测序序列中比对到人类参考基因组上的snp位点作为待测snp位点,并生成sam文件。其中,示例性的,比对软件可以是bwa-mem(0.7.10),人类参考基因组可以是hg19或b37。示例性的,通过samtools(0.1.19)软件将sam文件转成bam文件。
[0048]
作为一种可选的实施方式,所述获取待检测样本中的至少10个待测snp位点,包括:将待检测样本中人群频率满足预设人群频率范围的至少10个snp位点分别作为待测snp位点;其中,所述预设人群频率范围包括0.4-0.6。其中,人群频率用于表征snp位点在人群基因组中出现的频率,具体的,将比对到人类参考基因组上的人群频率满足0.4-0.6的snp位点作为待测snp位点。
[0049]
其中,具体的,待测丰度阈值用于表征次等位基因频率对应的筛选阈值。各待测丰度阈值之间的阈值差值可以相同,也可以不同。示例性的,一组待测丰度阈值th满足th∈{0%,1%,2%,

10%,30%}。此处对待测丰度阈值的具体参数不作限定,用户可根据实际
需求设置每个待测丰度阈值。
[0050]
s120、针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平。
[0051]
作为一种可选的实施方式,所述基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平,包括:针对各待测snp位点所在的每条染色体,基于所述染色体上的至少两个待测snp位点分别对应的拷贝数,对所述染色体执行分割操作,得到一个或多个染色体区段;其中,每个染色体区段中的任意两个待测snp位点对应的拷贝数差值小于预设差值阈值;针对每个染色体区段,将所述染色体区段中次等位基因频率大于所述待测丰度阈值的待测snp位点作为目标snp位点;基于至少两个目标snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平。
[0052]
其中,具体的,染色体的类型包括常染色体和/或性染色体。人类的23对染色体中有22对是常染色体,有1对是性染色体。本实施例中的染色体包含所有可能存在杂合变异的染色体。
[0053]
其中,具体的,拷贝数用于表征某一基因或某一段基因序列在基因组中出现的数目,也可以说是某一基因片段在基因组中重复出现的次数。正常情况下,拷贝数为2。当发生拷贝数变异时,基因组发生重排,基因的拷贝数从2变成n,其中,n为不等于2的自然数。
[0054]
其中,具体的,通过gatk软件计算待测snp位点的覆盖深度,并基于覆盖深度计算待测snp位点的拷贝数。其中,覆盖深度是指测序得到的碱基总量(bp)与基因组大小(genome)的比值。在本实施例中,待测snp位点的覆盖深度均高于200x。
[0055]
其中,示例性的,采用cbs(circular binary segmentation)算法,将染色体基于拷贝数分割成一个或多个染色体区段。其中,cbs算法可通过r软件包pscbs实现。在本实施例中,每个染色体区段中任意两个待测snp位点对应的拷贝数差值小于预设差值阈值,其中,示例性的,预设差值阈值可以为2。举例而言,染色体上4个待测snp位点的拷贝数分别为2、3、5和6,则染色体区段a包含拷贝数分别为2和3的2个待测snp位点,染色体区段b包含拷贝数分别为5和6的2个待测snp位点。
[0056]
其中,次等位基因频率对于每个突变的snp位点,主等位基因是给定群体中计数最高的等位基因,次要等位基因是给定群体中第二高计数的等位基因,次等位基因频率用于表征次要等位基因个数与所有等位基因个数的比值。其中,等位基因用于描述位于一对同源染色体相同位置上控制同一性状不同形态的基因。举例而言,假设在100个人里面,某条染色体上的snp位点上有三个等位基因,分别为a,c和g,采用基因组测序方法得到碱基a、碱基c和碱基g出现的次数分别为100、80和20,则该snp位点对应的次等位基因频率为80/200=0.4。
[0057]
作为一种可选的实施方式,所述基于至少两个目标snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平,包括:基于各目标snp位点分别在染色体中的位点位置,对各目标snp位点进行排序;基于排序结果,将当前目标snp位点的次等位基因频率与下一目标snp位点的次等位基因频率的差值作为丰度差值;对至少一个丰度差值执行求均值处理,得到所述待检测样本的丰度波动水平。
[0058]
其中,示例性的,假设染色体上4个目标snp位点,依次为目标snp位点a、目标snp位点b、目标snp位点c和目标snp位点d,对应的拷贝数分别为2、6、5和3。则染色体区段a包含的
目标snp位点及其顺序为目标snp位点a和目标snp位点d,染色体区段b包含的目标snp位点及其顺序为目标snp位点b和目标snp位点c。
[0059]
举例而言,假设染色体区段a包含100个目标snp位点,则计算得到的丰度差值的个数为99个,对各丰度差值求平均,得到染色体区段a对应的丰度波动水平。
[0060]
s130、将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值。
[0061]
其中,具体的,以待测丰度阈值作为横坐标,丰度波动水平作为纵坐标,构建丰度波动水平曲线。随着待测丰度阈值的增加,丰度波动水平先升高后趋于稳定。
[0062]
s140、基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0063]
其中,突变丰度,又称突变等位基因频率,用于表征突变的等位基因的读长个数占整个snp位点的读长个数的比例。其中,具体的,采用samtools mpileup软件计算待测snp位点上突变的等位基因的读长个数a和野生的等位基因的读长个数b,突变丰度=a/(a+b)。举例而言,snp位点上的等位基因表示为aaa、bbb、abb和aab,则与各等位基因表示对应的突变丰度分别为100%、0%、25%和75%。
[0064]
在本实施例中,基因型包括杂合型、野生型和纯合型。杂合型用于表征同源染色体上包含不同类型的等位基因的基因型个体,如ab。野生型用于表征同源染色体上包含野生的等位基因的基因型个体,如aa,纯合型用于表征同源染色体上包含纯合的等位基因的基因型个体,如bb。
[0065]
作为一种可选的实施方式,所述基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型,包括:基于所述第一丰度阈值,计算第二丰度阈值;其中,所述第一丰度阈值与所述第二丰度阈值的和为一;针对每个待测snp位点,如果所述待测snp位点对应的突变丰度小于或等于第一丰度阈值,则待测snp位点的基因型为野生型;如果所述待测snp位点对应的突变丰度大于或等于第二丰度阈值,则待测snp位点的基因型为纯合型;如果所述待测snp位点对应的突变丰度大于第一丰度阈值且小于第二丰度阈值,则待测snp位点的基因型为杂合型。
[0066]
其中,具体的,第二丰度阈值=1-第一分度阈值,待测snp位点的基因型满足下述关系:
[0067][0068]
其中,af表示突变丰度,tbest表示第一丰度阈值,mbest表示第二丰度阈值。
[0069]
本实施例数据基于对100例真实组织样本进行高通量测序的结果。组织样本包括不同肿瘤占比水平,不同染色体稳定程度及无污染和不同污染程度的样本。同时,对来自与组织样本相同个体的对照白细胞样本进行高通量测序,以确定snp的真实基因型作为性能参考标准。与癌组织样本不同,白细胞样本基因组稳定,几乎不存在样本储存和制备造成的污染。为了保证参考标准的可靠性,我们采用简单模型,即接近0%为野生型,接近100%为纯合型,接近50%为杂合型的原则直接进行基因型判读。考虑到数据噪音,容许5%的丰度
波动,即丰度0%-5%为野生型,95%-100%为纯合型,47.5%-52.5%为杂合型。对于组织样本,我们对比了基于两种静态阈值组合和本发明的动态阈值算法进行基因型识别。
[0070]
其中,静态阈值组合1:
[0071][0072]
其中,静态阈值组合2:
[0073][0074]
进一步的,以杂合型snp位点设为阳性位点,非杂合位点设为阴性位点,评估三种策略与白细胞参考标准的一致性水平,如下表1所述。动态阈值法在敏感性和特异性上均有较好和稳定的表现,准确性水平最高。
[0075]
表1是本发明实施例一提供的一种基因型识别的一致性列表。
[0076][0077][0078]
本实施例的技术方案,通过针对获取到的每个待测丰度阈值,基于待测丰度阈值与各待测snp位点分别对应的次等位基因频率,确定待检测样本的丰度波动水平,将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值,本发明实施例通过构建的动态丰度阈值模型,确定第一丰度阈值,并根据第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型,解决了现有基因型检测方法依赖配对测序数据的问题,提高了基因型检测结果的准确度。
[0079]
实施例二
[0080]
图2是根据本发明实施例二提供的一种样本污染检测方法的流程图。本实施例可适用于对单一组织样本的污染水平进行检测评估的情况,该方法可以由样本污染检测方法装置来执行,该基因型检测装置可以采用硬件和/或软件的形式实现,该样本污染检测装置可配置于终端设备中。如图2所示,该方法包括:
[0081]
s210、获取待检测样本中的至少10个待检测snp位点,并确定各待测snp位点分别对应的基因型。
[0082]
其中,示例性的,待检测样本为单一组织样本,如癌组织样本。在本实施例中,待测
snp位点的类型为胚系snp位点。人体基因组存在大量的变异位点,根据来源的不同可分为胚系突变和体细胞突变,其中,胚系突变又称生殖细胞突变,是来源于精子或卵子这些生殖细胞的突变,因此,通常身上所有细胞都带有该突变,包括癌组织样本。体细胞突变,又称获得性突变,是在生长发育过程中或环境因素影响下后天获得的突变,通常身上只有部分细胞带有该突变。
[0083]
其中,具体的,对包含待检测样本的高通量测序序列的fastq文件(下机数据)进行质控后,采用比对软件将高通量测序序列比对到人类参考基因组上,将高通量测序序列中比对到人类参考基因组上的snp位点作为待测snp位点,并生成sam文件。其中,示例性的,比对软件可以是bwa-mem(0.7.10),人类参考基因组可以是hg19或b37。示例性的,通过samtools(0.1.19)软件将sam文件转成bam文件。
[0084]
作为一种可选的实施方式,所述获取待检测样本中的至少10个待测snp位点,包括:将待检测样本中人群频率满足预设人群频率范围的至少10个snp位点分别作为待测snp位点;其中,所述预设人群频率范围包括0.4-0.6。其中,人群频率用于表征snp位点在人群基因组中出现的频率,具体的,将比对到人类参考基因组上的人群频率满足0.4-0.6的snp位点作为待测snp位点。
[0085]
作为一种可选的实施方式,确定各待测snp位点分别对应的基因型,包括:采用预设检测方法,确定各待测snp位点分别对应的基因型;其中,预设检测方法包括测序法、芯片法和质谱法中至少一种。
[0086]
在另一个实施例中,可选的,确定各待测snp位点分别对应的基因型,包括:确定各待测snp位点分别对应的基因型,包括:获取第一丰度阈值,以及确定各待测snp位点分别对应的突变丰度;基于第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0087]
作为一种可选的实施方式,第一丰度阈值为用户预先设置的。示例性的,第一预设丰度阈值可以是0.01或0.03,此处对第一预设丰度阈值的具体数值不作限定,用户可根据实际需求进行设置。
[0088]
其中,突变丰度,又称突变等位基因频率,用于表征突变的等位基因的读长个数占整个snp位点的读长个数的比例,其中,等位基因用于描述位于一对同源染色体相同位置上控制同一性状不同形态的基因。其中,具体的,采用samtools mpileup软件计算待测snp位点上突变的等位基因的读长个数a和野生的等位基因的读长个数b,突变丰度=a/(a+b)。举例而言,snp位点上的等位基因表示为aaa、bbb、abb和aab,则与各等位基因表示对应的突变丰度分别为100%、0%、25%和75%。
[0089]
在本实施例中,基因型包括杂合型、野生型和纯合型。杂合型用于表征同源染色体上包含不同类型的等位基因的基因型个体,如ab。野生型用于表征同源染色体上包含野生的等位基因的基因型个体,如aa,纯合型用于表征同源染色体上包含纯合的等位基因的基因型个体,如bb。
[0090]
作为一种可选的实施方式,所述基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型,包括:基于所述第一丰度阈值,计算第二丰度阈值;其中,所述第一丰度阈值与所述第二丰度阈值的和为一;针对每个待测snp位点,如果所述待测snp位点对应的突变丰度小于或等于第一丰度阈值,则待测snp位点的
基因型为野生型;如果所述待测snp位点对应的突变丰度大于或等于第二丰度阈值,则待测snp位点的基因型为纯合型;如果所述待测snp位点对应的突变丰度大于第一丰度阈值且小于第二丰度阈值,则待测snp位点的基因型为杂合型。
[0091]
其中,具体的,第二丰度阈值=1-第一分度阈值,待测snp位点的基因型满足下述关系:
[0092][0093]
其中,af表示突变丰度,tbest表示第一丰度阈值,mbest表示第二丰度阈值。
[0094]
s220、基于满足基因型条件的待测snp位点对应的次等位基因频率,构建高斯混合模型。
[0095]
在本实施例中,所述基因型条件包括基因型为野生型和/或基因型为纯合型。
[0096]
其中,具体的,snp位点通常仅包含两种等位基因。对于一组待测snp位点,假设4个待测snp位点包含的等位基因分别为aaa、bbb、abb和aab。在计算突变丰度时,我们需获取a或b占等位基因总数的比例,如a属于突变基因,则4个待测snp位点的突变丰度分别为100%、0%、25%和75%。对于非杂合型的待测snp位点,我们只关心a和b的个数不一样的程度,并不关心a或b占等位基因总数的比例,所以此等位基因频率可以很好的满足上述需求,4个待测snp位点的次等位基因频率分别为0%、0%、25%和25%。通过上述举例可以得到,将突变丰度以50%为映射中心,映射后的突变丰度等于次等位基因频率。
[0097]
作为一种可选的实施方式,所述高斯混合模型满足公式:
[0098][0099]
其中,
[0100][0101]
其中,
[0102][0103]
其中,maf表示次等位基因频率,δ2表示次等位基因频率的方差,n表示污染来源的数目,α表示污染比例,pbinom表示伯努利概率分布,p(c=i)表示i个污染源对应的概率分布,n表示高斯混合模型的概率分布。
[0104]
s230、对所述高斯混合模型进行最优化求解操作,得到所述待检测样本对应的污染状态数据。
[0105]
其中,示例性的,最优化求解的方法包括但不限于最大似然估计法、期望最大化算法和马尔可夫链蒙特卡罗算法中至少一种。其中,具体的,可由r软件包stats的optim函数采用l-bfgs-b算法对高斯混合模型进行最优化求解操作,得到污染状态数据。
[0106]
在本实施例中,所述污染状态数据包括污染比例、次等位基因频率方差和污染源的数目中至少一种。
[0107]
本实施例的技术方案,通过获取待检测样本中的至少10个待检测snp位点,确定各待测snp位点分别对应的基因型,基于非杂合型的待测snp位点对应的次等位基因频率,构建高斯混合模型,并对高斯混合模型进行最优化求解操作,得到待检测样本对应的污染状态数据,解决了现有样本污染测量方法受拷贝数变异/杂合性缺失影响大以及检测低水平污染困难的问题,提高了样本污染的测量结果的准确度。
[0108]
实施例三
[0109]
图3是根据本发明实施例三提供的一种样本污染检测方法的流程图,本实施例对上述实施例中的“获取第一丰度阈值”的技术特征进行进一步细化。如图3所示,该方法包括:
[0110]
s310、获取待检测样本中的至少10个待测snp位点以及获取至少3个待测丰度阈值。
[0111]
其中,具体的,待测丰度阈值用于表征次等位基因频率对应的筛选阈值。各待测丰度阈值之间的阈值差值可以相同,也可以不同。示例性的,一组待测丰度阈值th满足th∈{0%,1%,2%,

10%,30%}。此处对待测丰度阈值的具体参数不作限定,用户可根据实际需求设置每个待测丰度阈值。
[0112]
s320、针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平。
[0113]
作为一种可选的实施方式,所述基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平,包括:针对各待测snp位点所在的每条染色体,基于所述染色体上的至少两个待测snp位点分别对应的拷贝数,对所述染色体执行分割操作,得到一个或多个染色体区段;其中,每个染色体区段中的任意两个待测snp位点对应的拷贝数差值小于预设差值阈值;针对每个染色体区段,将所述染色体区段中次等位基因频率大于所述待测丰度阈值的待测snp位点作为目标snp位点;基于至少两个目标snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平。
[0114]
其中,具体的,染色体的类型包括常染色体和/或性染色体。人类的23对染色体中有22对是常染色体,有1对是性染色体。本实施例中的染色体包含所有可能存在杂合变异的染色体。
[0115]
其中,具体的,拷贝数用于表征某一基因或某一段基因序列在基因组中出现的数目,也可以说是某一基因片段在基因组中重复出现的次数。正常情况下,拷贝数为2。当发生拷贝数变异时,基因组发生重排,基因的拷贝数从2变成n,其中,n为不等于2的自然数。
[0116]
其中,具体的,通过gatk软件计算待测snp位点的覆盖深度,并基于覆盖深度计算待测snp位点的拷贝数。其中,覆盖深度是指测序得到的碱基总量(bp)与基因组大小(genome)的比值。在本实施例中,待测snp位点的覆盖深度均高于200x。
[0117]
其中,示例性的,采用cbs(circular binary segmentation)算法,将染色体基于拷贝数分割成一个或多个染色体区段。其中,cbs算法可通过r软件包pscbs实现。在本实施例中,每个染色体区段中任意两个待测snp位点对应的拷贝数差值小于预设差值阈值,其中,示例性的,预设差值阈值可以为2。举例而言,染色体上4个待测snp位点的拷贝数分别为
2、3、5和6,则染色体区段a包含拷贝数分别为2和3的2个待测snp位点,染色体区段b包含拷贝数分别为5和6的2个待测snp位点。
[0118]
作为一种可选的实施方式,所述基于至少两个目标snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平,包括:基于各目标snp位点分别在染色体中的位点位置,对各目标snp位点进行排序;基于排序结果,将当前目标snp位点的次等位基因频率与下一目标snp位点的次等位基因频率的差值作为丰度差值;对至少一个丰度差值执行求均值处理,得到所述待检测样本的丰度波动水平。
[0119]
其中,示例性的,假设染色体上4个目标snp位点,依次为目标snp位点a、目标snp位点b、目标snp位点c和目标snp位点d,对应的拷贝数分别为2、6、5和3。则染色体区段a包含的目标snp位点及其顺序为目标snp位点a和目标snp位点d,染色体区段b包含的目标snp位点及其顺序为目标snp位点b和目标snp位点c。
[0120]
举例而言,假设染色体区段a包含100个目标snp位点,则计算得到的丰度差值的个数为99个,对各丰度差值求平均,得到染色体区段a对应的丰度波动水平。
[0121]
s330、将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值。
[0122]
其中,具体的,以待测丰度阈值作为横坐标,丰度波动水平作为纵坐标,构建丰度波动水平曲线。随着待测丰度阈值的增加,丰度波动水平先升高后趋于稳定。
[0123]
s340、基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0124]
s350、基于满足基因型条件的待测snp位点对应的次等位基因频率,构建高斯混合模型。
[0125]
s360、对所述高斯混合模型进行最优化求解操作,得到所述待检测样本对应的污染状态数据。
[0126]
本发明实施例三还提供了采用本实施例记载的样本污染检测方法对来自20组人类癌组织样本的模拟数据进行测量的结果数据。
[0127]
具体的,对来自20组人类癌组织样本,通过预设污染比例进行混合,对样本数据进行污染,得到待检测样本。如下表2是本发明实施例三提供的一种样本污染说明列表。
[0128][0129]
如下表3是本发明实施例三提供的样本污染检测方法得到的污染比例数据。
[0130]
污染程度污染检出率预测污染比例0.5%100%0.47%
1%100%0.81%5%100%5.2%10%100%9.6%20%100%18%
[0131]
通过表3可以得到,本发明实施例适用于单样本和多样本来源污染的污染情形,在污染水平0.5%仍能稳定检出,且污染水平预测准确。
[0132]
如下表4是本发明实施例三提供的一种不同检测方法对不同污染程度测量得到的污染检出率。
[0133][0134][0135]
如下表5是本发明实施例三提供的一种现有conpair(v0.2)方法得到的污染比例数据。
[0136][0137]
通过表4和表5可以得到现有art-deco(v1.1)方法无法识别出低污染程度的污染样本。现有conpair(v0.2)方法虽然能够检出低污染程度的污染样本,但对于包含大量拷贝数样本的污染样本,得到的污染比例显著高于实际污染比例。
[0138]
因此,本发明实施例提供的样本污染检测方法在检出敏感性和污染水平评估的准
确性均高于同类软件。
[0139]
本实施例的技术方案,通过针对获取到的每个待测丰度阈值,基于待测丰度阈值与各待测snp位点分别对应的次等位基因频率,确定待检测样本的丰度波动水平,将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值,本发明实施例通过构建的动态丰度阈值模型,确定第一丰度阈值,并根据第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型,解决了现有基因型检测方法依赖配对测序数据的问题,提高了基因型检测结果的准确度,从而进一步提高了样本污染的检测结果的准确度。
[0140]
实施例四
[0141]
图4是根据本发明实施例四提供的一种基因型检测装置的结构示意图。如图4所示,该装置包括:待测snp位点获取模块410、丰度波动水平确定模块420、第一丰度阈值确定模块430和基因型确定模块440。
[0142]
其中,待测snp位点获取模块410,用于获取待检测样本中的至少10个待测snp位点以及获取至少3个待测丰度阈值;
[0143]
丰度波动水平确定模块420,用于针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平;
[0144]
第一丰度阈值确定模块430,用于将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值;
[0145]
基因型确定模块440,用于基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0146]
本实施例的技术方案,通过针对获取到的每个待测丰度阈值,基于待测丰度阈值与各待测snp位点分别对应的次等位基因频率,确定待检测样本的丰度波动水平,将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值,本发明实施例通过构建的动态丰度阈值模型,确定第一丰度阈值,并根据第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型,解决了现有基因型检测方法依赖配对测序数据的问题,提高了基因型检测结果的准确度。
[0147]
在上述实施例的基础上,可选的,丰度波动水平确定模块420,包括:
[0148]
染色体区段确定单元,用于针对各待测snp位点所在的每条染色体,基于所述染色体上的至少两个待测snp位点分别对应的拷贝数,对所述染色体执行分割操作,得到一个或多个染色体区段;其中,每个染色体区段中的任意两个待测snp位点对应的拷贝数差值小于预设差值阈值;
[0149]
目标snp位点确定单元,用于针对每个染色体区段,将所述染色体区段中次等位基因频率大于所述待测丰度阈值的待测snp位点作为目标snp位点;
[0150]
丰度波动水平单元,用于基于至少两个目标snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平。
[0151]
在上述实施例的基础上,可选的,丰度波动水平单元,具体用于:
[0152]
基于各目标snp位点分别在染色体中的位点位置,对各目标snp位点进行排序;
[0153]
基于排序结果,将当前目标snp位点的次等位基因频率与下一目标snp位点的次等位基因频率的差值作为丰度差值;
[0154]
对至少一个丰度差值执行求均值处理,得到所述待检测样本的丰度波动水平。
[0155]
在上述实施例的基础上,可选的,基因型确定模块440,具体用于:
[0156]
基于所述第一丰度阈值,计算第二丰度阈值;其中,所述第一丰度阈值与所述第二丰度阈值的和为一;
[0157]
针对每个待测snp位点,如果所述待测snp位点对应的突变丰度小于或等于第一丰度阈值,则待测snp位点的基因型为野生型;
[0158]
如果所述待测snp位点对应的突变丰度大于或等于第二丰度阈值,则待测snp位点的基因型为纯合型;
[0159]
如果所述待测snp位点对应的突变丰度大于第一丰度阈值且小于第二丰度阈值,则待测snp位点的基因型为杂合型。
[0160]
在上述实施例的基础上,可选的,待测snp位点获取模块410,具体用于:
[0161]
将待检测样本中人群频率满足预设人群频率范围的至少10个snp位点分别作为待测snp位点;其中,所述预设人群频率范围包括0.4-0.6。
[0162]
本发明实施例所提供的基因型检测装置可执行本发明任意实施例所提供的基因型检测方法,具备执行方法相应的功能模块和有益效果。
[0163]
实施例五
[0164]
图5是根据本发明实施例五提供的一种样本污染检测装置的结构示意图。如图5所示,该装置包括:基因型确定模块510、高斯混合模型构建模块520和污染状态数据确定模块530。
[0165]
其中,基因型确定模块510,用于获取待检测样本中的至少10个待检测snp位点,并确定各待测snp位点分别对应的基因型;
[0166]
高斯混合模型构建模块520,用于基于满足基因型条件的待测snp位点对应的次等位基因频率,构建高斯混合模型;其中,所述基因型条件包括基因型为野生型和/或基因型为纯合型;
[0167]
污染状态数据确定模块530,用于对所述高斯混合模型进行最优化求解操作,得到所述待检测样本对应的污染状态数据;其中,所述污染状态数据包括污染比例、次等位基因频率方差和污染源的数目中至少一种。
[0168]
本实施例的技术方案,通过获取待检测样本中的至少10个待检测snp位点,确定各待测snp位点分别对应的基因型,基于非杂合型的待测snp位点对应的次等位基因频率,构建高斯混合模型,并对高斯混合模型进行最优化求解操作,得到待检测样本对应的污染状态数据,解决了现有样本污染测量方法受拷贝数变异/杂合性缺失影响大以及检测低水平污染困难的问题,提高了样本污染的测量结果的准确度。
[0169]
在上述实施例的基础上,可选的,所述高斯混合模型满足公式:
[0170][0171]
其中,
[0172]
[0173]
其中,
[0174][0175]
其中,maf表示次等位基因频率,δ2表示次等位基因频率的方差,n表示污染来源的数目,α表示污染比例,pbinom表示伯努利概率分布,p(c=i)表示i个污染源对应的概率分布,n表示高斯混合模型的概率分布。
[0176]
在上述实施例的基础上,可选的,基因型确定模块510,包括:
[0177]
第一丰度阈值获取单元,用于获取第一丰度阈值,以及确定各待测snp位点分别对应的突变丰度;
[0178]
基因型确定单元,用于基于第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0179]
在上述实施例的基础上,可选的,基因型确定单元,具体用于:
[0180]
基于所述第一丰度阈值,计算第二丰度阈值;其中,所述第一丰度阈值与所述第二丰度阈值的和为一;
[0181]
针对每个待测snp位点,如果所述待测snp位点对应的突变丰度小于或等于第一丰度阈值,则待测snp位点的基因型为野生型;
[0182]
如果所述待测snp位点对应的突变丰度大于或等于第二丰度阈值,则待测snp位点的基因型为纯合型;
[0183]
如果所述待测snp位点对应的突变丰度大于第一丰度阈值且小于第二丰度阈值,则待测snp位点的基因型为杂合型。
[0184]
在上述实施例的基础上,可选的,第一丰度阈值获取单元,包括:
[0185]
待测丰度阈值获取子单元,用于获取至少三个待测丰度阈值;
[0186]
丰度波动水平确定子单元,用于针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平;
[0187]
第一丰度阈值确定子单元,用于将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值
[0188]
在上述实施例的基础上,可选的,丰度波动水平确定子单元,具体用于:
[0189]
针对各待测snp位点所在的每条染色体,基于所述染色体上的至少两个待测snp位点分别对应的拷贝数,对所述染色体执行分割操作,得到一个或多个染色体区段;其中,每个染色体区段中的任意两个待测snp位点对应的拷贝数差值小于预设差值阈值;
[0190]
针对每个染色体区段,将所述染色体区段中次等位基因频率大于所述待测丰度阈值的待测snp位点作为目标snp位点;
[0191]
基于至少两个目标snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平。
[0192]
在上述实施例的基础上,可选的,丰度波动水平确定子单元,具体用于:
[0193]
基于各目标snp位点分别在染色体中的位点位置,对各目标snp位点进行排序;
[0194]
基于排序结果,将当前目标snp位点的次等位基因频率与下一目标snp位点的次等位基因频率的差值作为丰度差值;
[0195]
对至少一个丰度差值执行求均值处理,得到所述待检测样本的丰度波动水平。
[0196]
在上述实施例的基础上,可选的,基因型确定模块510,包括:
[0197]
待测snp位点确定单元,用于将待检测样本中人群频率满足预设人群频率范围的至少10个snp位点分别作为待测snp位点;其中,所述预设人群频率范围包括0.4-0.6。
[0198]
本发明实施例所提供的样本污染检测装置可执行本发明任意实施例所提供的样本污染检测方法,具备执行方法相应的功能模块和有益效果。
[0199]
实施例六
[0200]
图6是根据本发明实施例六提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0201]
如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0202]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0203]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如基因型检测方法或样本污染检测方法。
[0204]
在一些实施例中,基因型检测方法或样本污染检测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的基因型检测方法或样本污染检测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基因型检测方法或样本污染检测方法。
[0205]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器
可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0206]
用于实施本发明的基因型检测方法或样本污染检测方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0207]
实施例七
[0208]
本发明实施例七还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行一种基因型检测方法,该方法包括:
[0209]
获取待检测样本中的至少10个待测snp位点以及获取至少3个待测丰度阈值;
[0210]
针对每个待测丰度阈值,基于所述待测丰度阈值和各待测snp位点分别对应的次等位基因频率,计算所述待检测样本的丰度波动水平;
[0211]
将至少3个丰度波动水平中符合拐点特征的丰度波动水平对应的待测丰度阈值作为第一丰度阈值;
[0212]
基于所述第一丰度阈值和各待测snp位点分别对应的突变丰度,确定各待测snp位点分别对应的基因型。
[0213]
或者,计算机指令用于使处理器执行一种样本污染检测方法,该方法包括:
[0214]
获取待检测样本中的至少10个待检测snp位点,并确定各待测snp位点分别对应的基因型;
[0215]
基于满足基因型条件的待测snp位点对应的次等位基因频率,构建高斯混合模型;其中,所述基因型条件包括基因型为野生型和/或基因型为纯合型;
[0216]
对所述高斯混合模型进行最优化求解操作,得到所述待检测样本对应的污染状态数据;其中,所述污染状态数据包括污染比例、次等位基因频率方差和污染源的数目中至少一种。
[0217]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0218]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给
用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0219]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0220]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0221]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0222]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1