结直肠肿瘤多基因遗传风险评分系统、存储介质和电子设备

文档序号:35894745发布日期:2023-10-28 21:49阅读:30来源:国知局
结直肠肿瘤多基因遗传风险评分系统、存储介质和电子设备

本发明涉及医学工程,具体涉及结直肠肿瘤多基因遗传风险评分系统、存储介质和电子设备。


背景技术:

1、结直肠癌作为全球最常见的恶性肿瘤之一,是由环境和遗传因素共同引起的复杂疾病。早期筛查与治疗是防治结直肠肿瘤的重要途径。目前,全基因组关联研究(genome-wide association study,gwas)已鉴定出若干与结直肠肿瘤相关的遗传易感位点。多基因遗传风险评分(polygenic risk score,prs)通过整合多个遗传变异的信息,将各单核苷酸多态性(single nucleotide polymorphism,snp)位点的微弱效应进行叠加,以提高遗传风险预测的准确性,有助于开展结直肠肿瘤遗传风险评估和高危人群识别。然而,现有遗传评分研究在国内尚未完善,目前能够获得的相关信息是基于欧洲人群构建,由于不同种族人群遗传背景的显著差异,这些遗传评分信息对于我国人群的适用程度尚不知晓。此外,进展期结直肠腺瘤是结直肠癌重要的癌前病变,与结直肠癌的发生、发展密切相关,寻找与进展期结直肠腺瘤相关的遗传易感位点并全面构建prs对结直肠癌高危人群的准确识别和早期干预至关重要。基于此,本发明旨在构建适合我国人群的结直肠肿瘤遗传风险评分模型。


技术实现思路

1、本发明的目的是提供结直肠肿瘤多基因遗传风险评分系统、存储介质和电子设备,以通过prs构建针对我国结直肠癌高危人群的评分模型,实现准确识别和早期干预。

2、为解决上述技术问题,本发明采用的技术方案为:

3、第一方面,本发明提供检测个体信息的试剂在制备结直肠肿瘤多基因遗传风险的检测装置中的应用,其中,所述个体信息包括以下单核苷酸多态性位点信息:

4、rs112791300、rs66572578、rs148581398、rs117388114、rs562386、rs2332057、rs113551494、rs1154015、rs61832090、rs514350、rs796496654、rs149754992、rs58815470、rs1895136、rs111976844、rs7568465、rs530368762、rs10184431、rs117832794、rs186630989、rs117920212、rs79062588、rs531450721、rs78163413、rs13058898、rs1240966、rs6777038、rs531040040、rs33941150、rs10573056、rs2940781、rs555115590、rs57969304、rs17017151、rs1757937、rs4315753、rs1491110450、rs183537419、rs77967017、rs72775764、rs77898034、rs77889528、rs7379682、rs1428981180、rs155074、rs184971456、rs76782373、rs12662019、rs4839969、rs979679927、rs1076668、rs144647955、rs11769234、rs435714、rs11980421、rs188165261、rs4571718、rs56787477、rs10113303、rs1494921、rs13273662、rs55642373、rs9330465、rs71356106、rs117373254、rs11789984、rs115205063、rs74554130、rs117451546、rs76372788、rs12247215、rs528696020、rs11197481、rs71484317、rs11345974、rs2804246、rs533062181、rs36112701、rs540269946、rs11439697、rs558391、rs3741255、rs147657675、rs7488529、rs12818737、rs12813911、rs544720729、rs9597502、rs74085350、rs12585231、rs10636332、rs9549186、rs7327884、rs1416992968、rs9549222、rs377347658、rs78958920、rs4261445、rs3007066、rs35466209、rs201865275、rs11635392、rs77832859、rs74870706、rs11857736、rs79335856、rs11547962、rs137920220、rs34294057、rs72766494、rs12601930、rs12450934、rs7208724、rs1238858355、rs16978159、rs117667007、rs199786761、rs78204423、rs1560901、rs1943895、rs1178551783、rs6603067、rs329716、rs5828224、rs181969064、rs73610697、rs6040412。

5、优选地,根据各单核苷酸多态性位点的信息获得满足以下计算公式的遗传风险评分:

6、

7、其中,i表示第i个snp位点,i=1~m,m表示snp位点的总数,lnor表示该snp位点对于结直肠癌的or值的自然对数,j表示第i个snp位点的基因型,gi,j分别用0、1、2表征没有突变、杂合突变和纯合突变;

8、进一步优选地,遗传风险评分越高,个体患结直肠肿瘤的风险越高。

9、第二方面,本发明提供结直肠肿瘤多基因遗传风险评分系统,包括:

10、质量控制模块,用于获取符合分析标准的系列样本和所述系列样本的snp位点;

11、数据获取模块,用于获取所述系列样本的个体基因分型数据;

12、基因分析模块,用于计算所述系列样本的单个遗传变异与结直肠肿瘤发病风险关联的比值比和95%置信区间,并形成汇总数据;

13、遗传位点提取及组合模块,根据所述汇总数据,获取所述系列样本结直肠肿瘤相关遗传位点的效应等位基因、效应值及p值,并形成结直肠肿瘤相关snp位点组合模型;

14、评分模块,通过所述结直肠肿瘤相关snp位点组合模型,并结合以下计算公式,对待评估样本进行结直肠肿瘤发病风险评分:

15、

16、其中,i表示第i个snp位点,i=1~m,m表示snp位点的总数,lnor表示该snp位点对于结直肠肿瘤的or值的自然对数,j表示第i个snp位点的基因型,gi,j分别用0、1、2表征没有突变、杂合突变和纯合突变。

17、优选地,所述结直肠肿瘤相关snp位点组合模型是采用不同的连锁不平衡r2和不同的显著性阈值p交叉构建的具有多个结直肠肿瘤相关候选snp位点组合的模型;

18、优选地,所述模型中,具有9个结直肠肿瘤相关候选snp位点组合;

19、进一步优选地,所述9个结直肠肿瘤相关候选snp位点组合中,r2=0.4、0.6、或者0.8,p值=0.05、5×10-4、或者5×10-5;

20、更进一步优选地,采用logistic回归模型评估所述9个结直肠肿瘤相关候选snp位点组合,比较各个组合的接收者操作特征曲线下面积,当auc无统计学差异时,选择snp位点个数较少的组合作为结直肠肿瘤相关snp位点组合模型,当auc有统计学差异时,选择auc更高的组合作为结直肠肿瘤相关snp位点组合模型。

21、优选地,所述质量控制模块中,对样本和snp位点的筛选原则为:①保留哈迪温伯格平衡p值大于1e-6的位点;②保留最小等位基因频率(maf)大于1%的位点;③保留检出率95%以上的位点;④保留检出率95%以上的样本;⑤过滤杂合率大于或小于三倍标准差的样本;⑥亲缘关系质控;⑦去除主成分分析离群的样本。

22、优选地,所述基因分析模块是采用logistic回归分析,以遗传变异的基因型剂量为自变量,以结直肠肿瘤样本或对照样本为因变量;优选地,以年龄、性别和前几个遗传主成分为协变量;优选为前4个遗传主成分。

23、优选地,所述结直肠肿瘤相关snp位点组合模型是由连锁不平衡r2=0.4和显著性阈值p=5×10-4交叉构建的模型。

24、第三方面,本发明提供一种存储介质,所述存储介质上有计算机程序,所述计算机程序被处理器执行时实现结直肠肿瘤多基因遗传风险评估模型的构建方法,所述构建方法包括:

25、获取符合分析标准的系列样本和所述系列样本的snp位点;

26、获取所述系列样本的个体基因分型数据;

27、计算所述系列样本的单个遗传变异与结直肠肿瘤发病风险关联的比值比和95%置信区间,并形成汇总数据;

28、根据所述汇总数据,获取所述系列样本结直肠肿瘤相关遗传位点的效应等位基因、效应值及p值,并形成结直肠肿瘤相关snp位点组合模型;

29、通过所述结直肠肿瘤相关snp位点组合模型,并结合以下计算公式,对待评估样本进行结直肠肿瘤发病风险评分:

30、

31、其中,i表示第i个snp位点,i=1~m,m表示snp位点的总数,lnor表示该snp位点对于结直肠肿瘤的or值的自然对数,j表示第i个snp位点的基因型,gi,j分别用0、1、2表征没有突变、杂合突变和纯合突变。

32、第四方面,本发明提供另一种存储介质,所述存储介质上有计算机程序,所述计算机程序被处理器执行时实现结直肠肿瘤多基因遗传风险评估模型的应用方法,所述应用方法包括:通过结直肠肿瘤多基因遗传风险评估模型计算待评估样本的风险评分;

33、所述结直肠肿瘤多基因遗传风险评估模型的构建方法包括:

34、获取符合分析标准的系列样本和所述系列样本的snp位点;

35、获取所述系列样本的个体基因分型数据;

36、计算所述系列样本的单个遗传变异与结直肠肿瘤发病风险关联的比值比和95%置信区间,并形成汇总数据;

37、根据所述汇总数据,获取所述系列样本结直肠肿瘤相关遗传位点的效应等位基因、效应值及p值,并形成结直肠肿瘤相关snp位点组合模型;

38、通过所述结直肠肿瘤相关snp位点组合模型,并结合以下计算公式,对待评估样本进行结直肠肿瘤发病风险评分:

39、

40、其中,i表示第i个snp位点,i=1~m,m表示snp位点的总数,lnor表示该snp位点对于结直肠肿瘤的or值的自然对数,j表示第i个snp位点的基因型,gi,j分别用0、1、2表征没有突变、杂合突变和纯合突变。

41、第五方面,本发明提供一种电子设备,所述电子设备包括:

42、一个或多个处理器;以及,

43、存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现结直肠肿瘤多基因遗传风险评估模型的构建方法,所述结直肠肿瘤多基因遗传风险评估模型的构建方法包括:

44、获取符合分析标准的系列样本和所述系列样本的snp位点;

45、获取所述系列样本的个体基因分型数据;

46、计算所述系列样本的单个遗传变异与结直肠肿瘤发病风险关联的比值比和95%置信区间,并形成汇总数据;

47、根据所述汇总数据,获取所述系列样本结直肠肿瘤相关遗传位点的效应等位基因、效应值及p值,并形成结直肠肿瘤相关snp位点组合模型;

48、通过所述结直肠肿瘤相关snp位点组合模型,并结合以下计算公式,对待评估样本进行结直肠肿瘤发病风险评分:

49、

50、其中,i表示第i个snp位点,i=1~m,m表示snp位点的总数,lnor表示该snp位点对于结直肠肿瘤的or值的自然对数,j表示第i个snp位点的基因型,gi,j分别用0、1、2表征没有突变、杂合突变和纯合突变。

51、第六方面,本发明提供另一种电子设备,所述电子设备包括:

52、一个或多个处理器;以及,

53、存储装置,用于存储一个或多个程序,当所述一个或多个程序被一个或多个处理器执行,使得所述一个或多个处理器实现结直肠肿瘤多基因遗传风险评估模型的应用方法;

54、所述应用方法包括:通过结直肠肿瘤多基因遗传风险评估模型计算待评估样本的风险评分;

55、所述结直肠肿瘤多基因遗传风险评估模型的构建方法包括:

56、获取符合分析标准的系列样本和所述系列样本的snp位点;

57、获取所述系列样本的个体基因分型数据;

58、计算所述系列样本的单个遗传变异与结直肠肿瘤发病风险关联的比值比和95%置信区间,并形成汇总数据;

59、根据所述汇总数据,获取所述系列样本结直肠肿瘤相关遗传位点的效应等位基因、效应值及p值,并形成结直肠肿瘤相关snp位点组合模型;

60、通过所述结直肠肿瘤相关snp位点组合模型,并结合以下计算公式,对待评估样本进行结直肠肿瘤发病风险评分:

61、

62、其中,i表示第i个snp位点,i=1~m,m表示snp位点的总数,lnor表示该snp位点对于结直肠肿瘤的or值的自然对数,j表示第i个snp位点的基因型,gi,j分别用0、1、2表征没有突变、杂合突变和纯合突变。

63、本发明的评分系统可以快速、简洁、有效地用于结直肠肿瘤遗传风险评估和分级筛查。在实际应用中,一方面可联合环境风险评分进行综合风险评估,针对各个风险区域的人群进行准确评估。另一方面,可结合成熟的结肠镜和粪便潜血检测筛查技术,实现结直肠癌高风险人群的精准识别以及不同风险人群的筛查分流,可提高人群筛查依从性和阳性病变的检出率,将为实现结直肠癌个体化、精准化筛查策略的制定提供重要理论参考,对进一步提升我国结直肠癌筛查效果起到推动作用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1