一种乳腺癌标记物筛选方法及相关装置与流程

文档序号:35465966发布日期:2023-09-16 05:21阅读:30来源:国知局
一种乳腺癌标记物筛选方法及相关装置与流程

本发明涉及癌症标记物筛选,具体是涉及一种乳腺癌标记物筛选方法及相关装置。


背景技术:

1、乳腺癌是女性最常见的恶性肿瘤之一,早期发现和诊治可以提高乳腺癌治疗成功率和患者生存率。随着基因组测序技术的不断发展,测序成本不断降低,测序精度不断提高,使得科学家们能够在更深更广的研究人类基因组及其相关的疾病发生机制。也就是要从已患乳腺癌的群体中判断出这部分群体有哪些共性(共性即癌症群体相对非癌症群体而变异具有标记性的部分,即标记物)。但单一组学的研究很难全面的阐述乳腺癌的致病机理,即现有技术只是从基因组的角度筛选出乳腺癌样本(离体的样本)中相比非乳腺癌样本而产生的标记物(如果人体组织中出现标记物就代表患癌了,即标记物用于判断对人体是否患癌进行分类),如果乳腺癌样本除基因组之外的位置发生癌症变异,那么现有技术是筛选不出该位置因变异而产生的标记物了,因此现有技术筛选出的标记物比较片面,不足以用于人体癌症病变分类。

2、综上所述,现有技术筛选出的标记物比较片面。

3、因此,现有技术还有待改进和提高。


技术实现思路

1、为解决上述技术问题,本发明提供了一种乳腺癌标记物筛选方法及相关装置,解决了现有技术筛选出的标记物比较片面的问题。

2、为实现上述目的,本发明采用了以下技术方案:

3、第一方面,本发明提供一种乳腺癌标记物筛选方法,其中,包括:

4、识别出乳腺癌样本相对参照样本而产生的各个初选基因组标记物,所述参照样本为未发生癌变的样本,基因组标记物用于从基因上识别乳腺癌;

5、识别出乳腺癌样本相对参照样本而产生的各个初选甲基化标记物,甲基化标记物用于从甲基化上识别乳腺癌;

6、分别对各个所述初选基因组标记物和各个所述初选甲基化标记物进行转录组数据分析,从各个所述基因组标记物筛选出目标基因组标记物和目标甲基化标记物,所述转录组数据用于记录所有的基因组数据和甲基化数据。

7、在一种实现方式中,所述识别出乳腺癌样本相对参照样本而产生的各个初选基因组标记物,所述参照样本为未发生癌变的样本,基因组标记物用于从基因上识别乳腺癌,包括:

8、对乳腺癌样本和参照样本应用若干个体细胞变异识别工具,得到各个所述个体细胞变异识别工具分别识别出的各个第一基因组标记物集合,第一基因组标记物为在形成体细胞的过程中发生变异的基因组;

9、对乳腺癌样本和参照样本应用若干个拷贝变异识别工具,得到各个所述拷贝变异识别工具分别识别出的各个第二基因组标记物集合,第二基因组标记物为基因在复制过程中发生变异的基因组;

10、对各个所述第一基因组标记物集合进行交集处理,得到各个初选基因组标记物中的各个初选第一基因组标记物;

11、对各个所述第二基因组标记物集合进行交集处理,得到各个初选基因组标记物中的各个初选第二基因组标记物。

12、在一种实现方式中,所述识别出乳腺癌样本相对参照样本而产生的各个初选甲基化标记物,甲基化标记物用于从甲基化上识别乳腺癌,包括:

13、对乳腺癌样本和参照样本应用champ工具,识别出所述乳腺癌样本所携带的各个第一差异甲基化位点集合和各个第一差异甲基化区域集合;

14、对乳腺癌样本和参照样本应用bismark工具和methylkit工具,识别出所述乳腺癌样本所携带的各个第二差异甲基化位点集合;

15、对乳腺癌样本和参照样本应用metilene工具,识别出所述乳腺癌样本所携带的各个第二差异甲基化区域集合;

16、对各个所述第一差异甲基化位点集合和各个所述第二差异甲基化位点集合进行交集处理,得到各个初选甲基化标记物中的各个初选差异甲基化位点;

17、对各个所述第一差异甲基化区域集合和各个所述第二差异甲基化区域集合进行交集处理,得到各个初选甲基化标记物中的各个初选差异甲基化区域。

18、在一种实现方式中,所述分别对各个所述初选基因组标记物和各个所述初选甲基化标记物进行转录组数据分析,从各个所述基因组标记物筛选出目标基因组标记物和目标甲基化标记物,所述转录组数据用于记录所有的基因组数据和甲基化数据,包括:

19、分别对各个所述初选基因组标记物和各个所述初选甲基化标记物应用特征计数工具,得到所述特征计数工具针对各个所述初选基因组标记物进行转录组数据分析而输出的基因组显著性特征和针对各个所述初选甲基化标记物进行转录组数据分析而输出的甲基化显著性特征;

20、根据各个所述初选基因组标记物的基因组显著性特征,从各个所述初选基因组标记物中筛选出目标基因组标记物;

21、根据各个所述初选甲基化标记物的甲基化显著性特征,从各个所述初选甲基化标记物中筛选出目标甲基化标记物。

22、在一种实现方式中,还包括:

23、对各个所述目标基因组标记物和各个所述目标甲基化标记物应用套索算法,得到各个标记物权重值,所述标记物权重值包括基因组标记物权重值和甲基化标记物权重值。

24、在一种实现方式中,所述对各个所述目标基因组标记物和各个所述目标甲基化标记物应用套索算法,得到各个标记物权重值,所述标记物权重值包括基因组标记物权重值和甲基化标记物权重值,包括:

25、给乳腺癌样本赋予癌症标签,给各个标记物赋予各个标记标签,给各个标记物所对应的各个权重赋予各个权重参数;

26、以所述癌症标签和各个所述标记标签以及各个所述权重参数构建所述套索算法的目标函数;

27、以各个所述权重参数绝对值之和小于设定值为所述套索算法的限定条件;

28、基于所述目标函数和所述限定条件,确定各个所述权重参数所对应的各个参数值;

29、根据各个所述参数值,确定各个标记物权重值。

30、在一种实现方式中,所述基于所述目标函数和所述限定条件,确定各个所述权重参数所对应的各个参数值,包括:

31、在所述限定条件下,确定所述目标函数取最小值时,各个所述权重参数所对应的各个参数值。

32、第二方面,本发明实施例还提供一种乳腺癌标记物筛选装置,其中,所述装置包括如下组成部分:

33、基因组标记物识别模块,用于识别出乳腺癌样本相对参照样本而产生的各个初选基因组标记物,所述参照样本为未发生癌变的样本,基因组标记物用于从基因上识别乳腺癌;

34、甲基化标记物识别模型,用于识别出乳腺癌样本相对参照样本而产生的各个初选甲基化标记物,甲基化标记物用于从甲基化上识别乳腺癌;

35、标记物筛选模块,用于分别对各个所述初选基因组标记物和各个所述初选甲基化标记物进行转录组数据分析,从各个所述基因组标记物筛选出目标基因组标记物和目标甲基化标记物,所述转录组数据用于记录所有的基因组数据和甲基化数据。

36、第三方面,本发明实施例还提供一种终端设备,其中,所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的乳腺癌标记物筛选程序,所述处理器执行所述乳腺癌标记物筛选程序时,实现上述所述的乳腺癌标记物筛选方法的步骤。

37、第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有乳腺癌标记物筛选程序,所述乳腺癌标记物筛选程序被处理器执行时,实现上述所述的乳腺癌标记物筛选方法的步骤。

38、有益效果:本发明将乳腺癌样本和参照样本进行比较,筛选出乳腺癌样本相对参照样本而发生变异的基因组(记为初选基因组标记物),同时也筛选出乳腺癌样本相对参照样本而发生变异的甲基化(记为初选甲基化标记物)。之后,本发明对初选标记物进行转录组数据分析,以从初选标记物中筛选出真正因为变异而产生的标记物(目标基因组标记物和目标甲基化标记物)。从上述分析可知,本发明基于基因组和甲基化这两种组学从乳腺癌样本中筛选出因发生癌症变异而产生的标记物,从而能够较全面的筛选出导致癌变的标记物。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1