用于癌症筛查的基于m1A相关miRNA诊断试剂、模型及制备方法

文档序号:34240734发布日期:2023-05-25 00:44阅读:26来源:国知局
用于癌症筛查的基于m1A相关miRNA诊断试剂、模型及制备方法

本发明涉及生物医学,特别地涉及用于癌症筛查的基于m1a相关mirna诊断试剂、模型及制备方法。


背景技术:

1、大多数新发癌症病例通常发现在晚期,使患者失去了最佳治疗机会,导致预后不良。癌症的早期诊断对于降低癌症死亡率、延长患者生存期、减轻社会负担具有重要意义。由于现有癌症筛查方法存在成本高、侵入性强和准确率低等缺陷,基于这些现有方法进行大规模癌症筛查既不可行,也不具有成本效益。近年来,循环肿瘤dna(circulating tumordna,ctdna)在大规模的癌症筛查中展现出极大的临床应用前景,但其敏感性还有待提高。因此,迫切需要开发一种更有效和低侵入性、低成本的新型生物标志物,用于大规模癌症筛查。

2、m1a是哺乳动物中最常见的rna修饰类型之一,由甲基转移酶、去甲基酶和结合蛋白调节,分别被称为“编码器(writer)”、“消码器(eraser)”和“读码器(reader)”。m1a修饰水平的失调与肿瘤的发生和发展密切相关。有证据表明,m1a修饰异常介导的tp53突变,可以促进肿瘤的发生。ythdf1“读码器”通过与eif3c mrna结合,影响eif3c翻译,进而促进卵巢癌的发生和发展。在外周血中,m1a修饰对肿瘤的临床诊断、手术根治程度评估和预后预测具有重要的参考价值。胃癌患者癌组织的m1a修饰水平显著高于正常组织,且m1a修饰水平与肿瘤大小、胃癌tnm分期密切相关。m1a调控子(编码器、消码器和读码器)的表达受多种mirna的调节,并且这些mirna在肿瘤转移和进展中发挥了重要作用。mir-17-5p和mir-432可以直接靶向adar1(“编码器”),抑制adar1的表达,促进黑色素瘤的转移和侵袭。adar1通过mirna-302a介导的irf9/stat1途径抑制胃癌中的干扰素信号传导。mir-451a能通过调控ythdc1(“读码器”)激活akt/mtor信号通路,进而促进骨肉瘤细胞的侵袭。血清中的循环mirna稳定性高且易检测,是肿瘤无创诊断的理想标志物。因此,开发基于血清中m1a-mirnas的新型诊断生物标志物是大规模癌症筛查的潜在策略。


技术实现思路

1、有鉴于此,本发明旨在确定与m1a相关的mirna,并基于m1a-mirnas构建诊断模型应用于大规模癌症筛查。所构建的m1a-mirnas指标展示出了很高的准确性,并在区分癌症类型方面表现出优异的敏感性。m1a-mirnas指标的诊断性能不受性别、年龄和良性疾病的影响,并且适用于癌症的早期筛查。

2、本发明的一个目的是提供一种用于癌症筛查的的诊断试剂。

3、本发明所提供的用于癌症筛查的的诊断试剂,所述试剂包括选自seq id no.1至seq id no.20所示序列的rna(以下seq id no.1至seq id no.20中的“t”表示rna中的尿嘧啶):

4、seq id no.1:agtatcgggacatgttacgacga;

5、seq id no.2:tcggataggacctaatgaactt;

6、seq id no.3:tacgggaaaattgtaacgtgac;

7、seq id no.4:ttgatatgttggatgatggagt;

8、seq id no.5:ccattagggaccgttacacta;

9、seq id no.6:ggatgcaaggtatcagatggt;

10、seq id no.7:gcggttataaatgcacgacgat;

11、seq id no.8:aggttagtcaaggactacgtcat;

12、seq id no.9:cctttagggaccgttacacta;

13、seq id no.10:acatttggtactacacgacgat;

14、seq id no.11:ttcgtaccttcgtgaat;

15、seq id no.12:cgaaactgttatgataacgtgac;

16、seq id no.13:ttgatatgttggaggatggagt;

17、seq id no.14:tcatgtagtagatatgacat;

18、seq id no.15:gatggacgtgatactcgtgaaac;

19、seq id no.16:tgggatattcgttataacgtgat;

20、seq id no.17:gatggacgtgacattcgtgaaac;

21、seq id no.18:ttagtcagagtaacgaaatatt;

22、seq id no.19:ggtgactttgtaccttcgtgaat;

23、seq id no.20:tccctaaggacccttttgacctg。

24、所述试剂包括seq id no.1至seq id no.20所示序列的rna:

25、seq id no.1:agtatcgggacatgttacgacga;

26、seq id no.2:tcggataggacctaatgaactt;

27、seq id no.3:tacgggaaaattgtaacgtgac;

28、seq id no.4:ttgatatgttggatgatggagt;

29、seq id no.5:ccattagggaccgttacacta;

30、seq id no.6:ggatgcaaggtatcagatggt;

31、seq id no.7:gcggttataaatgcacgacgat;

32、seq id no.8:aggttagtcaaggactacgtcat;

33、seq id no.9:cctttagggaccgttacacta;

34、seq id no.10:acatttggtactacacgacgat;

35、seq id no.11:ttcgtaccttcgtgaat;

36、seq id no.12:cgaaactgttatgataacgtgac;

37、seq id no.13:ttgatatgttggaggatggagt;

38、seq id no.14:tcatgtagtagatatgacat;

39、seq id no.15:gatggacgtgatactcgtgaaac;

40、seq id no.16:tgggatattcgttataacgtgat;

41、seq id no.17:gatggacgtgacattcgtgaaac;

42、seq id no.18:ttagtcagagtaacgaaatatt;

43、seq id no.19:ggtgactttgtaccttcgtgaat;

44、seq id no.20:tccctaaggacccttttgacctg。

45、所述癌症选自乳腺癌、膀胱癌、结直肠癌、食管癌、神经胶质瘤、胃癌、肝癌、肺癌、卵巢癌、胰腺癌、前列腺癌和肉瘤。

46、本发明还提供了一种用于癌症筛查的诊断试剂盒,所述试剂盒包括所述的用于癌症筛查的诊断试剂。

47、本发明还提供了一种癌症筛查模型的构建方法。

48、本发明所提供的癌症筛查模型的构建方法,包括如下步骤:

49、(1)筛选样本:从数据库中获取包含癌症的血清样本的mirna芯片测序数据;

50、(2)鉴定候选的m1a-mirnas:通过targetscan数据库得到与调控子相关的mirna,同时通过pubmed数据库检索m1a修饰相关的mirna;再通过ebayes检验进行差异分析,鉴定出高表达的m1a-mirna;最后通过lasso回归进行降维分析,筛选得到m1a-mirnas用于模型的验证;

51、(3)构建用于肿瘤筛查的模型:将所述步骤(1)中获取的血清样本随机分为训练集和测试集,用训练集样本基于支持向量机算法进行模型的构建;用验证集来判断模型的准确性;同时用所述步骤(2)筛选得到m1a-mirnas对模型进行验证。

52、所述步骤(1)中所述数据库为geo数据库,所述包含癌症的血清样本中癌症选自:乳腺癌、膀胱癌、结直肠癌、食管癌、神经胶质瘤、胃癌、肝癌、肺癌、卵巢癌、胰腺癌、前列腺癌和肉瘤。

53、所述步骤(2)中所述通过ebayes检验进行差异分析,鉴定出高表达的m1a-mirna,是以fdr<0.05,log|fold changes|>1.8为标准,筛选差异表达的m1a-mirnas。

54、所述步骤(2)中通过lasso回归进行降维分析后,还包括通过绘制roc曲线分析单个m1a-mirna对肿瘤的鉴别能力,挑选出在训练集和验证集中auc值均大于0.6的m1a-mirna。

55、通过lasso回归分析后,得到20个m1a-mirna,通过绘制单个m1a-mirna的roc曲线展示对肿瘤的鉴别能力,单个m1a-mirna的auc值无论在训练集还是验证集,auc值都大于0.6(训练集和验证集都是通过森林图展示单个m1a-mirna的auc值,图1中c和d)。

56、所述步骤(2)中通过lasso回归进行降维分析,筛选得到的m1a-mirnas包括选自seq id no.1至seq id no.20所示序列的rna:

57、seq id no.1:agtatcgggacatgttacgacga;

58、seq id no.2:tcggataggacctaatgaactt;

59、seq id no.3:tacgggaaaattgtaacgtgac;

60、seq id no.4:ttgatatgttggatgatggagt;

61、seq id no.5:ccattagggaccgttacacta;

62、seq id no.6:ggatgcaaggtatcagatggt;

63、seq id no.7:gcggttataaatgcacgacgat;

64、seq id no.8:aggttagtcaaggactacgtcat;

65、seq id no.9:cctttagggaccgttacacta;

66、seq id no.10:acatttggtactacacgacgat;

67、seq id no.11:ttcgtaccttcgtgaat;

68、seq id no.12:cgaaactgttatgataacgtgac;

69、seq id no.13:ttgatatgttggaggatggagt;

70、seq id no.14:tcatgtagtagatatgacat;

71、seq id no.15:gatggacgtgatactcgtgaaac;

72、seq id no.16:tgggatattcgttataacgtgat;

73、seq id no.17:gatggacgtgacattcgtgaaac;

74、seq id no.18:ttagtcagagtaacgaaatatt;

75、seq id no.19:ggtgactttgtaccttcgtgaat;

76、seq id no.20:tccctaaggacccttttgacctg。

77、所述步骤(2)中通过lasso回归进行降维分析,筛选得到的m1a-mirnas包括seq idno.1至seq id no.20所示序列的rna:

78、seq id no.1:agtatcgggacatgttacgacga;

79、seq id no.2:tcggataggacctaatgaactt;

80、seq id no.3:tacgggaaaattgtaacgtgac;

81、seq id no.4:ttgatatgttggatgatggagt;

82、seq id no.5:ccattagggaccgttacacta;

83、seq id no.6:ggatgcaaggtatcagatggt;

84、seq id no.7:gcggttataaatgcacgacgat;

85、seq id no.8:aggttagtcaaggactacgtcat;

86、seq id no.9:cctttagggaccgttacacta;

87、seq id no.10:acatttggtactacacgacgat;

88、seq id no.11:ttcgtaccttcgtgaat;

89、seq id no.12:cgaaactgttatgataacgtgac;

90、seq id no.13:ttgatatgttggaggatggagt;

91、seq id no.14:tcatgtagtagatatgacat;

92、seq id no.15:gatggacgtgatactcgtgaaac;

93、seq id no.16:tgggatattcgttataacgtgat;

94、seq id no.17:gatggacgtgacattcgtgaaac;

95、seq id no.18:ttagtcagagtaacgaaatatt;

96、seq id no.19:ggtgactttgtaccttcgtgaat;

97、seq id no.20:tccctaaggacccttttgacctg。

98、所述步骤(3)中所述基于支持向量机算法构建的模型是二分类模型,用如下公式寻找最优超平面:

99、

100、s.t.0≤αi≤c,i=1,...,m

101、

102、本发明还提供了一种癌症筛查模型,是通过所述癌症筛查模型的构建方法构建得到。

103、本发明从geo数据库中下载正常人和癌症患者血清样本的mirna芯片测序数据,包括12种癌症类型(乳腺癌、膀胱癌、结直肠癌、食管癌、神经胶质瘤、胃癌、肝癌、肺癌、卵巢癌、胰腺癌、前列腺癌和肉瘤),共16902个样本。同时下载对应的临床信息,包括年龄、性别等。通过数据库筛选及文献调研确定了80个m1a相关的mirna。

104、通过ebayes检验筛选在癌症样本中高表达的m1a-mirnas,共有32个(筛选条件为fdr<0.05,log|fold changes|>1.8)。再利用最小绝对收缩和选择算子(lasso)回归的方法进行降维分析,进一步得到了20个具有诊断潜力的候选m1a-mirna。

105、基于上述20个m1a-mirna,通过支持向量机算法(support vector machinealgorithm,svm)构建诊断模型,建立最终的m1a-mirna指标。通过与svm模型来判断样本是否为癌症样本,以及癌症的类型。此外,在i期和ii期的肿瘤患者中验证模型的有效性,并分析m1a-mirnas指标与患者年龄、性别等临床参数的关系。

106、我们所构建的m1a-mirnas指标在癌症筛查和癌症类型的鉴定中都展现出了极高的准确性,并且适用于癌症的早期筛查。此外,m1a-mirnas的诊断性能不受性别、年龄和良性疾病的影响。总之,m1a-mirnas指标是一个高精度、低成本、侵入性小的新型标志物,可以用于大规模癌症筛查。

107、与现有技术相比,本发明具有以下优点:

108、(1)本发明所构建的m1a-mirnas指标可应用于大规模的癌症筛查(适用于最常见的12种癌症类型),且模型的准确度高,auc值为0.974。根据auc值来判断模型的准确度,范围是0~1。当auc值>=0.85时,说明模型效果好,越趋近于1,模型越好。

109、(2)本发明所构建的m1a-mirnas指标可进一步用于区分癌症类型,并表现出优异的敏感性,模型的auc值均大于0.720。模型的敏感性是根据诊断为阳性的正确率判断的,tpr=tp/(tp+fn),tpr表示阳性率、tp表示真阳性,fn表示伪阴性。

110、(3)本发明所构建的筛查指标不受年龄、性别等因素的影响,并且适用于癌症的早期筛查。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1