一种基于突变特征确定cfDNA组织来源的系统的制作方法

文档序号:32060306发布日期:2022-11-04 22:55阅读:88来源:国知局
一种基于突变特征确定cfDNA组织来源的系统的制作方法
一种基于突变特征确定cfdna组织来源的系统
技术领域
1.本发明涉及umi分子标签技术和高通量靶向测序技术领域,具体为一种基于突变特征确定cfdna组织来源的系统。


背景技术:

2.目前,研究液体活检、癌症早筛的常规方法为通过对致癌基因或者抑癌基因的突变检测来识别肿瘤释放的cfdna。文献razavi,p.,li,b.t.,brown,d.n.et al.high-intensity sequencing reveals the sources ofplasma circulating cell-free dnavariants.nat med 25,1928

1937(2019).中pedram等人通过对124个转移的癌症患者和47个健康人的外周血进行了508个特定基因,大于60000倍的超深度检测,发现大量的cfdna突变,81.6%来自于健康人,53.2%来自于癌症患者,都是白细胞的克隆性造血引起的,而非肿瘤细胞。这样会使得通过特定靶标基因的突变来识别癌症患者会发生很大的误判率。因此需要一种基于突变特征确定cfdna组织来源的系统来解决上述问题。


技术实现要素:

3.本发明所解决的技术问题在于提供一种基于突变特征确定cfdna组织来源的系统,解决了现有技术中的技术问题。为实现上述目的,本发明提供如下技术方案:一种基于突变特征确定cfdna组织来源的系统,具体包括:基于分子标签的cfdna高通量靶向测序模块,靶基因突变特征分析模块和基于突变特征确定cfdna组织来源的模块;
4.所述基于分子标签的cfdna高通量靶向测序模块配置为提取血浆样本中cfdna,添加分子标签并使用特异性探针从dna文库中捕获包含靶基因选定的外显子区域的dna片段,并对所述的dna片段进行测序以获得所述靶基因外显子区域的序列信息;
5.所述靶基因突变特征分析模块为将所述序列信息通过分子标签进行分组生成来源于同一个dna片段的reads序列即一致性序列(consensus),将所述一致性序列与人参考基因组序列信息进行比对,使用软件进行突变检测和突变注释,得到cfdna靶基因外显子区域的突变特征;
6.所述基于突变特征确定cfdna组织来源的模块分为以下几个步骤:
7.1)根据突变的染色体位置与正常人突变数据库,肿瘤病人突变数据进行检索和注释得到该突变在正常人数据库中的样本数量与携带率,该突变在肿瘤病人数据库中的样本数量;
8.2)对注释好的突变点进行过滤,剔除非体细胞或正常人可能携带的非肿瘤特异突变;
9.3)过滤后的突变点进一步筛选出阳性突变;
10.4)通过阳性突变点根据打分系统原则实现对组织部位的打分,按照打分排序,确定cfdna的组织来源。
11.优选地,所述基于突变特征确定cfdna组织来源的模块中对注释好的突变点进行
过滤的具体配置为满足以下条件的其中一条的突变点需要剔除掉:
12.(1)突变比例大于0.02的突变,可能为白细胞突变;
13.(2)在正常人突变数据库中样本数大于3的突变位点,可能为正常人携带的突变;
14.(3)在肿瘤病人突变数据库中样本数小于10的突变位点,可能为非肿瘤特异突变。
15.优选地,所述基于突变特征确定cfdna组织来源的模块中过滤后的突变点进一步筛选出阳性突变的具体配置为满足以下条件中其中一条的突变点为阳性突变点:
16.(1)检测到的总tag数大于等于3500,且突变tag数大于等于2;
17.(2)突变点检测到的总tag数小于3500,且突变tag数大于等于3;
18.(3)该突变在肿瘤突变数据库中的样本数大于150;
19.(4)在肿瘤突变数据库中的样本数大于100,且注释到的肿瘤有2条以上的突变点。
20.优选地,所述基于突变特征确定cfdna组织来源的模块中通过阳性突变点根据打分系统原则实现对组织部位的打分的具体配置为:
21.(1)每个组织部位的综合风险系数,作为组织癌变风险权重打分;
22.(2)每个组织部位的检测到的阳性突变在肿瘤突变数据库中样本数的加和,作为组织突变风险证据打分;
23.(3)每个组织部位检测到的阳性突变位点个数,作为组织突变比例打分;
24.(4)依次通过权重打分,证据打分,比例打分对组织部位进行从高到低的排序,并保留前三个组织部位检测到的阳性突变点。
25.优选地,所述综合风险系数的具体配置为:
26.(1)特异突变t在肿瘤病人突变数据库中的案例数定义为m;
27.(2)组织部位a在肿瘤病人突变数据库中的案例数定义为m;
28.(3)中国人群的男性/女性的组织部位a的癌症百万人发病率定义为f;
29.(4)根据公式((m*1000000)/m)/f计算出组织部位a出现特异突变t可能的患癌风险c1;
30.(5)通过累加计算组织部位a出现所有特异突变可能的患癌风险,得到组织部位a的综合风险系数。
31.与现有技术相比,本发明具有以下有益效果:通过该系统能够通过突变点的过滤和阳性突变点的筛选,最后使用打分系统实现对组织部位的打分,对打分进行排序,确定cfdna的组织准确来源。
附图说明
32.为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
33.图1为具体案例1中具体案例病人基于突变特征确定cfdna组织来源的系统的检测结果;
34.图2为具体案例1中具体案例病人影像学检测结果;
35.图3为具体案例2中案例病人医院检测结果;
36.图4为具体案例2中具体案例病人基于突变特征确定cfdna组织来源的系统的检测结果;
37.图5为具体案例2中案例病人医院复查结果;
38.图6为具体案例3中案例病人年度体检结果;
39.图7为具体案例3中具体案例病人基于突变特征确定cfdna组织来源的系统的检测结果;
40.图8为具体案例3中案例病人医院确诊结果。
具体实施方式
41.为了使本发明的技术手段、创作特征、工作流程、使用方法达成目的与功效易于明白了解,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,及进行非创造性的扩展而得出的其它结论,都属于本发明保护的范围。
42.实施例
43.一种基于突变特征确定cfdna组织来源的系统,具体包括:基于分子标签的cfdna高通量靶向测序模块,靶基因突变特征分析模块和基于突变特征确定cfdna组织来源的模块;
44.所述基于分子标签的cfdna高通量靶向测序模块配置为提取血浆样本中cfdna,添加分子标签并使用特异性探针从dna文库中捕获包含靶基因选定的外显子区域的dna片段,并对所述的dna片段进行测序以获得所述靶基因外显子区域的序列信息;
45.所述靶基因突变特征分析模块为将所述序列信息通过分子标签进行分组生成来源于同一个dna片段的reads序列即一致性序列(consensus),将所述一致性序列与人参考基因组序列信息进行比对,使用软件进行突变检测和突变注释,得到cfdna靶基因外显子区域的突变特征,包括突变位置,数量,比例,氨基酸变化,碱基变化等;
46.所述基于突变特征确定cfdna组织来源的模块分为以下几个步骤:
47.1)根据突变的染色体位置与正常人突变数据库,肿瘤病人突变数据进行检索和注释得到该突变在正常人数据库中的样本数量与携带率,该突变在肿瘤病人数据库中的样本数量;
48.2)对注释好的突变点进行过滤,剔除非体细胞或正常人可能携带的非肿瘤特异突变;
49.3)过滤后的突变点进一步筛选出阳性突变;
50.4)通过阳性突变点根据打分系统原则实现对组织部位的打分,按照打分排序,确定cfdna的组织来源。
51.其中,所述基于突变特征确定cfdna组织来源的模块中对注释好的突变点进行过滤的具体配置为满足以下条件的其中一条的突变点需要剔除掉:
52.(1)突变比例大于0.02的突变,可能为白细胞突变;
53.(2)在正常人突变数据库中样本数大于3的突变位点,可能为正常人携带的突变;
54.(3)在肿瘤病人突变数据库中样本数小于10的突变位点,可能为非肿瘤特异突变。
55.其中,所述基于突变特征确定cfdna组织来源的模块中过滤后的突变点进一步筛选出阳性突变的具体配置为满足以下条件中其中一条的突变点为阳性突变点:
56.(1)检测到的总tag数大于等于3500,且突变tag数大于等于2;
57.(2)突变点检测到的总tag数小于3500,且突变tag数大于等于3;
58.(3)该突变在肿瘤突变数据库中的样本数大于150;
59.(4)在肿瘤突变数据库中的样本数大于100,且注释到的肿瘤有2条以上的突变点。
60.其中,所述基于突变特征确定cfdna组织来源的模块中通过阳性突变点根据打分系统原则实现对组织部位的打分的具体配置为:
61.(1)每个组织部位的综合风险系数,作为组织癌变风险权重打分;
62.(2)每个组织部位的检测到的阳性突变在肿瘤突变数据库中样本数的加和,作为组织突变风险证据打分;
63.(3)每个组织部位检测到的阳性突变位点个数,作为组织突变比例打分;
64.(4)依次通过权重打分,证据打分,比例打分对组织部位进行从高到低的排序,并保留前三个组织部位检测到的阳性突变点。
65.其中,所述综合风险系数的具体配置为:
66.(1)特异突变t在肿瘤病人突变数据库中的案例数定义为m;
67.(2)组织部位a在肿瘤病人突变数据库中的案例数定义为m;
68.(3)中国人群的男性/女性的组织部位a的癌症百万人发病率定义为f;
69.(4)根据公式((m*1000000)/m)/f计算出组织部位a出现特异突变t可能的患癌风险c1;
70.(5)通过累加计算组织部位a出现所有特异突变可能的患癌风险,得到组织部位a的综合风险系数。
71.具体案例1:42岁的中国男子,通过使用基于突变特征确定cfdna组织来源的系统,检测发现其血浆中,捕获的3747条含有g245氨基酸的tp53基因片段,其中2条含有g245c突变(c.733g》t),突变比率为0.05%,系统的溯源结果显示这些片段来自于肺组织,如图1所示。
72.根据dna检测结果和影像学检测结果,如图2所示,中山医院的肺科主任和嘉兴第一人民医院的肺科主任均做出了微创摘除结节的诊断。
73.在2021年x月x日,病人在上海中山医院完成了微创手术。通过病理检测,最终确诊为微浸润腺癌。
74.具体案例2:68岁的胡女士,2021年8月14日泛癌早筛,结果提示可疑突变风险为:乳腺癌。2021年10月18日医院进行检测,检测结果如图3所示:乳腺未见明显异常。后来感觉身体不太舒服,通过使用基于突变特征确定cfdna组织来源的系统,检测发现其血浆中,捕获的5009条含有c242氨基酸的tp53基因片段,其中2条含有c242y突变(c.725g》a),突变比率为0.04%,具有乳腺癌风险,如图4所示。2022年7月11日医院进行复查结果为乳腺癌,如图5所示。
75.具体案例3:40岁的徐先生,公司高管,年年体检无异常,肿瘤标志物无异常,如图6所示。后通过使用基于突变特征确定cfdna组织来源的系统,检测发现其血浆中,捕获的1003条含有g12氨基酸的kras基因片段,其中7条含有g12s突变(c.34g》a),突变比率为
0.7%,具有结肠癌风险,如图7所示。后经上海市第十人民医院确诊为结肠癌,如图8所示。
76.以上显示和描述了本发明的基本原理、主要特征及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明的要求保护范围由所附的权利要求书及其等效物界定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1