基于血清蛋白的乳腺肿瘤筛查的标志物及应用的制作方法

文档序号:37012805发布日期:2024-02-09 13:02阅读:22来源:国知局
基于血清蛋白的乳腺肿瘤筛查的标志物及应用的制作方法

本发明涉及生物医疗,具体涉及基于血清蛋白的乳腺肿瘤筛查的标志物及应用。


背景技术:

1、乳腺癌是全球女性最常见的恶性肿瘤之一,由于缺乏无创高敏、特异稳定的早期诊断标志物,造成我国乳腺癌早诊、防治形势严峻。

2、血液由于易获取、同质性高,富含各类物质,已成为新型肿瘤标志物研究的首选对象。而血液中的蛋白由于稳定、可兼容方法学多受到早诊领域的青睐。m toi等人通过质谱技术对90例健康人及54例乳腺癌患者血清进行筛查,发现ralgapa2、pkg1、tjp2以及nfx1蛋白可能成为乳腺癌诊断标志物,受试者曲线下面积达到0.874;此外,学者还发现cdh5可能作为转移性乳腺癌的血清标志物,且其表达水平可以显著区分复发性乳腺癌及非复发性乳腺癌,特异性达到90%;与此同时,ladd团队则发现血清乳腺癌蛋白dusp9、eed、efna5、itgb1及ppmt1可作为早期的三阴性乳腺癌的提示指标。

3、然而,目前由于既往乳腺癌蛋白标志物研究缺乏良性乳腺病变及乳腺癌全病程队列,导致目前缺乏可用于区分健康人、乳腺良性结节、乳腺癌的血清蛋白质标志物谱,且前期学者筛选蛋白标志物或基于肿瘤组织,或基于肿瘤患者的血清,并未对二者存在交集的蛋白质谱进行研究,因此,开发基于患者血清和蛋白标志物的可用于区分健康人、乳腺良性结节、乳腺癌的血清蛋白质标志物谱至关重要。


技术实现思路

1、有鉴于此,本发明要解决的技术问题在于提供基于血清蛋白的乳腺肿瘤筛查的标志物及应用。

2、本发明提供了乳腺疾病筛查的标志物,其包括:oxct1、hdgfl3、ddx39b、aco1、sart3、cog1、actr2、qdpr、umod、dennd4c、csta、aoc2、rgn、mvp、trap1、ube2l5、ptgfrn、smarcc2、fkbp15、oxsr1、plxnb1、ttr、psmb3和中性粒细胞比率gr。

3、进一步的,

4、所述乳腺疾病包括:乳腺肿瘤良性病变和/或乳腺恶性肿瘤;所述乳腺肿瘤良性病变包括纤维腺瘤或乳头状瘤;所述乳腺恶性肿瘤包括乳腺癌。本发明所述的标志物,包括了23种血清蛋白和中性粒细胞比率,本发明的检测结果发现,加入中性粒细胞比率与不加中性粒细胞比率进入到分类检测谱相比的诊断效能显著提高。

5、本发明提供了所述的标志物的制备方法,其包括如下步骤:

6、步骤1、将健康人血清样本、乳腺肿瘤良性病变血清样本和乳腺恶性肿瘤血清样本进行前处理、质谱检测后,经蛋白鉴定和定量,分别获得三种血清样本蛋白质组数据;

7、步骤2、所述三种血清样本蛋白质组数据经质控、预处理、矫正和筛选,获得差异蛋白质组数据1;

8、步骤3、所述差异蛋白质组数据1与血常规指标联合后分类,并基于训练集和测试集,筛选获得所述标志物。

9、所述前处理的包括如下步骤:利用high-select top 14蛋白去除试剂盒去除血清中丰度最高的5种血清蛋白后,在胰酶:蛋白的质量比为1:25条件下处理17h。

10、所述前处理后还包括干燥的步骤;干燥后的样品利用含有体积分数为0.1%甲酸的水溶液芙蓉后进行质谱检测。

11、所述蛋白鉴定的错误发现率(fdr)为1%;

12、所述定量的参数设置为:precursor fdr为1%;log lev为1;质量精度为20ppm;ms1精度为10ppm;扫描窗口为30;隐式蛋白组为基因;定量策略为robust lc(高精度)。

13、所述步骤2中,三种血清样本蛋白质组数据经预处理前还包括质控的步骤,所述质控为将所述三种血清样本我们将所有样品混合到血清池中作为qc标准。qc标准采用与血清队列相同的方法和条件进行分析。计算qc标准的pearson相关系数。qc标准的平均相关系数为0.85。最小相关系数为0.82,最大相关系数为0.89,证明了该质谱分析平台的稳定性。

14、所述预处理的阈值为:

15、三种血清样本中,每种血清样品中的蛋白种类与其他两种血清样本中的重叠度≥50%。

16、本发明中,所述预处理的阈值设置将会影响蛋白鉴定的可信度,或者重现度,进一步影响到诊断性能;本发明中,对所述预处理的阈值进行了优化;本发明的一些实施例中,所述阈值设置为30%;则诊断性能显著下降。

17、所述矫正为利用impute对每种样本类型的数据分别执行knn imputation,进行缺失值填充,所述填充的参数设置为10-5。

18、所述筛选的标准为:三种血清样本中,特异性血清蛋白在任意病变血清样本中的表达值≥其他2组表达值的1.5倍;且所述特异性血清蛋白为多组差异表达蛋白中差异最大的前10%;

19、所述任意病变血清样本包括乳腺肿瘤良性病变血清样本和乳腺恶性肿瘤血清样本。

20、本发明对所述筛选标准进行了优化,在结合预处理阈值的情况下,实验结果表明,只有在预处理阈值设置为50%,且特异性血清蛋白在任意病变血清样本中的表达值≥其他2组表达值的1.5倍,并联合血常规指标中的中性粒细胞比率后,对乳腺病变诊断效果显著显著优于其他条件。且差异蛋白数量也会对筛选获得的标志物的诊断效能产生影响,各组特异表达蛋白各组差异蛋白的top10%和多组差异表达蛋白差异最大的前两组相比较,选择多组差异表达蛋白差异最大的top10%更适于本发明特异性强、准确度高的标志物的筛选。

21、所述分类的方法包括随机森林算法、支持向量机算法、自适应增强算法、极限梯度增强算法等,本发明的具体实施例中,利用随机森林算法和极值梯度增强算法进行分类,结果表明,极值梯度增强算法更适于本发明标志物的筛选。

22、更进一步的,本发明所述的制备方法中,

23、所述质谱检测的参数包括:

24、色谱柱:c18,粒径1.9μm;内径150μm,长度15cm;孔径

25、色谱条件为:

26、流动相a:体积分数0.1%甲酸和水;

27、流动相b:体积分数0.1%甲酸和乙腈;

28、流速为600nl/min;

29、梯度范围和持续时间为:15%~30%流动相b,分离75min。

30、质谱条件:60k分辨率(agc目标4e5或50ms)下从300-1,400m/z进行ms1扫描。然后,在15k分辨率下获得30个dia片段,agc目标为5e4或最大注射时间为22ms。启用了“为所有可用的并行时间注入离子”设置。高能碰撞解离(hcd)破碎设定为归一化碰撞能量的30%。光谱以剖面模式记录。日志含义ms2的默认收费状态设置为3。

31、本发明所述的标志物,是在多种参数条件优化下获得的可准确进行乳腺病变诊断的标志物,与其他只能诊断肿瘤和非肿瘤的方法相比,本发明的标志物可对健康人群、良性乳腺病变和恶性乳腺肿瘤进行诊断,诊断的准确度高、特异性强。本发明所述的标志物的制备方法的各个参数相互配合,在预处理的阈值为:三种血清样本中,每种血清样品中的蛋白种类与其他两种血清样本中的重叠度≥50%;筛选的标准为:三种血清样本中,特异性血清蛋白在任意病变血清样本中的表达值≥其他2组表达值的1.5倍;且所述特异性血清蛋白为多组差异表达蛋白差异最大的前10%;且采用极值梯度增强算法的情况下才可以获得本发明所述的准确度高、特异性强的诊断标志物。

32、本发明提供了所述的标志物或所述的制备方法制备获得的标志物在制备乳腺病变诊断产品或建立乳腺疾病筛查模型中的应用。

33、本发明提供了乳腺肿瘤诊断产品,其包括或利用本发明所述的标志物或所述的制备方法制备获得的标志物。

34、本发明构建了一种基于血清蛋白的乳腺肿瘤标志物,对于怀疑乳腺肿瘤的患者可以进行血清检测,有效区分健康人、乳腺结节患者及乳腺癌患者,该分类器在独立验证队列中accuracy为0.87,precision为0.93,recall为0.82,f1-score为0.86,对于良性结节的roc曲线下面积为0.96,对于乳腺癌的roc曲线下面积为0.96,对于健康人roc曲线下面积为0.96;准确率高、特异性好,在乳腺病变临床诊断中具有良好的应用前景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1