一种针对肺炎克雷伯菌的药物敏感性预测方法及装置与流程

文档序号:37183979发布日期:2024-03-01 12:45阅读:25来源:国知局
一种针对肺炎克雷伯菌的药物敏感性预测方法及装置与流程

本发明属于生物医学的,尤其涉及一种针对肺炎克雷伯菌的药物敏感性预测方法及装置。


背景技术:

1、欧洲疾病控制中心ecdc、疾病控制与预防中心cdc和世界卫生组织等不同组织将能够产生碳青霉烯酶的肺炎克雷伯菌cpk的日益增多视为全球健康问题。β-内酰胺是最常用于治疗肠杆菌引起的感染的抗生素,然而经过大量验证发现碳青霉烯酶可以对几乎所有可用的β-内酰胺产生耐药性,因此,早期识别肺炎克雷伯菌cpk的耐药性对于改善治疗方案非常重要。

2、抗菌药物耐药性的检测通常基于广泛认可的全基因组测序wgs技术。在利用wgs技术进行抗菌药物耐药性检测时,通常需要先分离细菌,然后对细菌进行体外扩大培养,之后对培养的细菌提取dna后进行基因组测序以获得细菌的完整基因组序列,最后基于完整基因组序列确定细菌的耐药性;由此,在采用wgs技术进行耐药性检测时从样本采集到输出耐药性报告的时间可能长达48至72小时;而使用基质辅助激光解析串联飞行时间质谱仪maldi-tof-ms进行耐药性的检测时,在短短几分钟内就能表征单个细菌物种耐药性。因此wgs技术比基质辅助激光解吸/电离飞行时间maldi-tof技术更耗时、更昂贵。

3、与wgs等分子技术不同,maldi-tof技术已在许多临床微生物学实验室中实施。直接从maldi-tof质谱中提取附加信息也可以检测抗菌素耐药性,例如:在抗生素耐药性检测领域,maldi-tof-ms最初用于检测与耐药性相关的标记物;然而由于缺乏针对所有潜在病原体和药物组合的全面且可靠的标记物目录,导致转向更复杂的方法。

4、目前,加快程序和增加结果可追溯性的需要使得临床实验室对抗菌素耐药性检测的需求越来越大。人们开始探索机器学习工具,机器学习工具(例如:神经网络、支持向量和随机森林等)是强大的分类系统,已用于健康科学(例如:癌症基因组学)。随着高通量技术的进步产生大量数据,这种分类特征适合应用于基于蛋白质组学的临床微生物诊断。虽然现有技术中已经开发了几种基于maldi-tof-ms的程序和数据分析程序。然而,这些技术的生物学和技术再现性仍然存在一些不一致的地方。此外,缺乏通用的参考质谱数据库限制了maldi-tof-ms作为一线临床工具的整体适用性。


技术实现思路

1、针对现有技术存在的上述问题,本发明实施例提供了一种针对肺炎克雷伯菌的药物敏感性预测方法及装置,该方法不需要依赖质谱数据库就能够对分离菌株的药物敏感性进行准确预测,提高了微生物药物敏感性预测的效率。

2、根据本发明实施例第一方面,提供一种针对肺炎克雷伯菌的药物敏感性预测方法,所述方法包括:将携带药物敏感性标记的分离菌株作为检测样本,基于每个所述检测样本对应的质谱特征峰,获得若干所述检测样本对应的所有质谱特征峰,生成特征峰数据集;其中,所述药物敏感性标记包括用于指示敏感的第一标记和用于指示不敏感的第二标记;将所述特征峰数据集中满足第一预设条件的质谱特征峰作为训练样本,获得训练数据集;对所述训练数据集进行药物敏感性相关特征筛选处理,获得由若干个质谱特征峰形成的目标特征峰数据集;基于所述目标特征峰数据集进行有监督的模型训练,获得药物敏感性预测模型。

3、可选的,所述方法还包括:获取所述待测分离菌株对应的质谱特征峰;利用所述药物敏感性预测模型对所述质谱特征峰进行药物敏感性预测,生成与所述待测分离菌株对应的药物敏感性预测结果。

4、可选的,所述的方法还包括: 获取所述检测样本对应的质谱数据;对所述质谱数据进行降噪处理,获得降噪后质谱数据;对降噪后质谱数据进行扭曲和对齐处理,获得处理后质谱数据;对所述处理后质谱数据进行特征峰检测,获得所述检测样本对应的质谱特征峰。

5、可选的,所述对所述训练数据集进行药物敏感性相关特征筛选处理,获得若干个与药物敏感性相关的质谱特征峰,生成目标特征峰数据集;包括:针对所述训练数据集中任一训练样本:对所述训练样本进行随机重排,生成影子特征峰;将所述影子特征峰和所述训练样本输入训练好的药物敏感性评分模型,输出所述训练样本对应的第一得分集和所述影子特征峰对应的第二得分集;若所述第一得分集中分值中位数与所述第二得分集中最高分值之间的差值大于预设阈值,则将所述训练样本确定为与药物敏感性相关的质谱特征峰;其中,所述预设阈值为大于0的数值;基于所述训练数据集中每个所述训练样本对应的与药物敏感性相关的质谱特征峰,生成目标特征峰数据集。

6、可选的,所述的方法还包括:针对所述训练数据集中任一训练样本:对所述训练样本进行随机重排,生成影子特征峰;将所述训练样本和所述影子特征峰共同作为子训练样本;基于随机森林算法对每个训练样本所对应的子训练样本进行模型训练,生成药物敏感性评分模型。

7、可选的,将所述特征峰数据集中满足第一预设条件的质谱特征峰作为训练样本,获得训练数据集;包括:从所述特征峰数据集中选取至少在预设数量的检测样本中重复出现的质谱特征峰;基于若干个所选取的质谱特征峰,获得模型数据集;将所述模型数据集按照预设比例分割成两份,获得训练数据集和验证数据集。

8、可选的,所述基于所述目标特征峰数据集进行有监督的模型训练,获得药物敏感性预测模型;包括:基于所述目标特征峰数据集,利用不同算法进行有监督的模型训练,生成若干个模型;基于roc指标对所述若干个模型进行筛选处理,获得药物敏感性预测模型。

9、可选的,与药物敏感性相关的质谱特征峰中排名前三位的特征峰分别为7814.64,9092.92和12311.47。

10、根据本发明实施例第二方面,还提供一种针对肺炎克雷伯菌的药物敏感性预测装置,所述装置包括:第一获得模块,用于将携带药物敏感性标记的分离菌株作为检测样本,基于每个所述检测样本对应的质谱特征峰,获得若干所述检测样本对应的所有质谱特征峰,生成特征峰数据集;其中,所述药物敏感性标记包括用于指示敏感的第一标记和用于指示不敏感的第二标记;训练数据集模块,用于将所述特征峰数据集中满足第一预设条件的质谱特征峰作为训练样本,获得训练数据集;筛选模块,用于对所述训练数据集进行药物敏感性相关特征筛选处理,获得由若干个质谱特征峰形成的目标特征峰数据集;模型训练模块,用于基于所述目标特征峰数据集进行有监督的模型训练,获得药物敏感性预测模型。

11、可选的,所述装置还包括:第二获得模块,用于获取所述待测分离菌株对应的质谱特征峰;预测模块,用于利用所述药物敏感性预测模型对所述质谱特征峰进行药物敏感性预测,生成与所述待测分离菌株对应的药物敏感性预测结果。

12、根据本发明实施例第三方面,还提供一种电子设备,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面所述的方法。

13、根据本发明实施例第四方面,还提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。

14、本发明实施例提供一种针对肺炎克雷伯菌的药物敏感性预测方法,所述方法包括:首先,将携带药物敏感性标记的分离菌株作为检测样本,基于每个所述检测样本对应的质谱特征峰,获得若干所述检测样本对应的所有质谱特征峰,生成特征峰数据集; 其中,所述药物敏感性标记包括用于指示敏感的第一标记和用于指示不敏感的第二标记;其次,将所述特征峰数据集中满足第一预设条件的质谱特征峰作为训练样本,获得训练数据集;之后,对所述训练数据集进行药物敏感性相关特征筛选处理,获得由若干个质谱特征峰形成的目标特征峰数据集;最后,基于所述目标特征峰数据集进行有监督的模型训练,获得药物敏感性预测模型。本实施例基于各种预处理手段对携带药物敏感性标记的分离菌株所对应的质谱特征峰进行特征峰筛选处理,之后基于筛选后的质谱特征峰进行模型训练,获得药物敏感性预测模型。由此,通过特征峰筛选处理,能够减少了不必要的特征,降低模型的复杂度,缩短模型训练时间,不仅提高了药物敏感性预测模型训练的准确度,而且提高了待测分离菌株药物敏感性的预测效率,解决了现有技术由于需要进行体外细菌培养等繁琐步骤导致药物敏感性检测时间长而无法实现在样本采集后24小时内直接追踪分离菌株药物敏感性的技术问题;而且本实施例不需要额外依赖质谱数据库就能够对分离菌株的药物敏感性进行准确预测,进一步解决了现有技术由于缺乏通用的参考质谱数据库导致预测结果不稳定的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1