本发明涉及影像分析,尤其涉及一种msi分型确定方法、装置、电子设备及存储介质。
背景技术:
1、微卫星,也称为短串联重复序列或简单序列重复序列,由1-6个核苷酸的重复序列组成。分布特征不同于小卫星dna的15至65个核苷酸串联重复序列,主要位于染色体末端附近。微卫星生成的机制一般认为是复制过程中的dna滑移,或dna复制修复过程中滑链和互补链的基本组不匹配,导致一个或多个重复单元缺失或插入。正常的组织dna修复系统,称为错配修复(mmr),可以在dna复制过程中纠正错误,但由于肿瘤细胞中缺乏mmr基因或存在复制修复过程中的缺陷,基因突变的可能性增加,这种现象称为微卫星不稳定(msi)。相关研究表明,msi是肿瘤发生发展的重要因素,结直肠癌的微卫星不稳定性分型根据微卫星不稳定位点发生的频率,可分为微卫星高度不稳定性(msi-h)、低微卫星不稳定性(msi-l)和微卫星稳定(mss)三种类型。随着msi检测技术和免疫抑制剂在肿瘤治疗中的发展,研究人员发现msi-h具有较高的肿瘤突变负荷,肿瘤组织中有大量的免疫细胞浸润和较高水平的肿瘤新生抗原,从而对免疫治疗反应良好。目前国际和国内临床诊疗指南均推荐,对所有crc患者进行mmr表达或msi检测,用于遗传性非息肉病性结直肠癌(lynch综合征)筛查、crc预后分层及指导免疫治疗等。
2、组织病理学报告是诊断结直肠癌的金标准,肿瘤的msi分子病理分型检测有赖于组织活检和分子诊断技术。组织活检属于机体有创的临床诊疗操作,会给患者带来不适和健康风险,活检依托的内镜检查或外科手术要求一定的临床适应证,同时具有较高的技术门槛和经济负担,不适合快速简便的医学筛查。基于肿瘤组织的pcr测序技术虽然是诊断msi分型的“金标准”,但也存在基因突变位点选择差异导致的错误,而其繁琐的操作步骤、较高的时间成本和额外的经济成本,也限制了pcr技术在结直肠癌msi分型诊断中的使用效率,不利于临床筛查、诊疗决策和基层医疗机构的推广应用。
3、基于肿瘤组织病理切片he染色图像的深度学习算法模型在一定程度上降低了msi分型检测的成本,但该方法受制于活检组织样本采集的准确性。研究表明,病理切片扫描时产生的伪影会对模型的准确性产生显著影响。目标该检测方法的最佳实现技术尚没有明确共识,相关流程仍在不断优化,临床效果有待进一步验证。
4、基于ngs技术开展特定基因或全外显子组测序,通过对测序数据的复杂生物信息学分析间接推断肿瘤msi分型的方法已有应用。但该方法依赖于基因测序的范围、深度,以及生信分析的水平,检测和分析者的水平显著影响结果的准确性。针对msi分型诊断,目前已被公开认证的ngs检测方法较少。利用肿瘤组织的ngs检测无法避免上述临床活检或外科手术的弊端,而利用外周血液中循环肿瘤dna(ctdna)进行检测的技术,则受限于ctdna采集样本的质量。肿瘤患者外周血液中的ctdna浓度低且不稳定,检测样本中背景噪声水平高,目前用于分析ctdna的精确分子捕获、测序和定位技术等仍不完善。此外,ngs技术的经济成本高昂,时间花费高,导致该方法的适应人群较窄,不适合普遍的临床推广及应用。
技术实现思路
1、本发明提供了一种msi分型确定方法、装置、电子设备及存储介质,用途解决现有的msi分型确定方法存在对患者造成损伤的风险,且诊断流程复杂,患者的就诊时间长和经济负担大的技术问题。
2、本发明提供了一种msi分型确定方法,包括:
3、获取结直肠癌的历史病例影像学检查数据;
4、对所述历史病例影像学检查数据进行标注,得到标注区域;
5、根据所述标注区域确定裁剪尺寸;
6、按照所述裁剪尺寸对所述历史病例影像学检查数据和所述标注区域进行裁剪,得到裁剪图像;
7、采用所述裁剪图像生成训练样本;
8、采用所述训练样本训练深度学习模型;
9、将待分析图像输入已训练的深度学习模型,得到图像判别结果;
10、获取诊断所需临床数据;
11、根据所述图像判别结果和所述诊断所需临床数据确定msi分型。
12、可选地,所述根据所述标注区域确定裁剪尺寸的步骤,包括:
13、获取所述标注区域的最小外接矩形;
14、以所述最小外接矩形作为裁剪尺寸。
15、可选地,所述采用所述裁剪图像生成训练样本的步骤,包括:
16、对所述裁剪图像进行图像处理,得到副本图像;所述图像处理包括小角度旋转、镜像变换、剪切变换中的一种或多种;
17、采用所述裁剪图像和所述副本图像作为训练样本。
18、可选地,所述采用所述训练样本训练深度学习模型的步骤之后,还包括:
19、采用5折交叉验证法,将测试集数据输入所述深度学习模型,得到若干个分类结果;
20、确定各所述分类结果对应的模型参数的分类性能;
21、将分类性能最优的模型参数作为最优解;
22、采用所述最优解优化所述深度学习模型,得到已训练的深度学习模型。
23、本发明还提供了一种msi分型确定装置,包括:
24、历史病例影像学检查数据获取模块,用于获取结直肠癌的历史病例影像学检查数据;
25、标注模块,用于对所述历史病例影像学检查数据进行标注,得到标注区域;
26、裁剪尺寸确定模块,用于根据所述标注区域确定裁剪尺寸;
27、裁剪模块,用于按照所述裁剪尺寸对所述历史病例影像学检查数据和所述标注区域进行裁剪,得到裁剪图像;
28、训练样本生成模块,用于采用所述裁剪图像生成训练样本;
29、深度学习模块训练模块,用于采用所述训练样本训练深度学习模型;
30、判别模块,用于将待分析图像输入已训练的深度学习模型,得到图像判别结果;
31、临床数据获取模块,用于获取诊断所需临床数据;
32、msi分型确定模块,用于根据所述图像判别结果和所述诊断所需临床数据确定msi分型。
33、可选地,所述裁剪尺寸确定模块,包括:
34、最小外接矩形获取子模块,用于获取所述标注区域的最小外接矩形;
35、裁剪尺寸确定子模块,用于以所述最小外接矩形作为裁剪尺寸。
36、可选地,所述训练样本生成模块,包括:
37、图像处理子模块,用于对所述裁剪图像进行图像处理,得到副本图像;所述图像处理包括小角度旋转、镜像变换、剪切变换中的一种或多种;
38、训练样本生成子模块,用于采用所述裁剪图像和所述副本图像作为训练样本。
39、可选地,还包括:
40、测试模块,用于采用5折交叉验证法,将测试集数据输入所述深度学习模型,得到若干个分类结果;
41、分类性能确定模块,用于确定各所述分类结果对应的模型参数的分类性能;
42、最优解确定模块,用于将分类性能最优的模型参数作为最优解;
43、优化模块,用于采用所述最优解优化所述深度学习模型,得到已训练的深度学习模型。
44、本发明还提供了一种电子设备,所述设备包括处理器以及存储器:
45、所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
46、所述处理器用于根据所述程序代码中的指令执行如上任一项所述的msi分型确定方法。
47、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行如上任一项所述的msi分型确定方法。
48、从以上技术方案可以看出,本发明具有以下优点:本发明提供了一种msi分型确定方法,包括:获取结直肠癌的历史病例影像学检查数据;对历史病例影像学检查数据进行标注,得到标注区域;根据标注区域确定裁剪尺寸;按照裁剪尺寸对历史病例影像学检查数据和标注区域进行裁剪,得到裁剪图像;采用裁剪图像生成训练样本;采用训练样本训练深度学习模型;将待分析图像输入已训练的深度学习模型,得到图像判别结果;获取诊断所需临床数据;根据图像判别结果和诊断所需临床数据确定msi分型。本发明通过影像学检查数据与临床数据结合的方式实现结直肠癌分子分型的辅助诊断,避免了侵入式检查对患者造成的损伤,且简化了诊断流程,减少了患者的时间成本和经济成本。