基于舌苔微生物的肿瘤预测系统的应用的制作方法

文档序号:35848140发布日期:2023-10-25 18:17阅读:28来源:国知局
基于舌苔微生物的肿瘤预测系统的应用的制作方法

本发明涉及肿瘤学诊断、预测、评估,更具体来说,涉及基于舌苔微生物的肿瘤预测系统、方法及其应用,通过分析舌苔微生物与肿瘤学的关联关系,从而实现经济的、非侵入性的且具有较高准确度的肿瘤预测。


背景技术:

1、根据最新数据,胃癌(gc)是全球第三大癌症相关死亡原因。gc的诊断和筛查仍然依赖于胃镜检查,但由于其侵入性强、成本高以及需要专业的内镜医师,其应用受到很大限制。此外,由于胃癌早期缺乏特异性症状,临床疾病标志物的特异性和敏感性较差,超过60%的患者在确诊时即发生局部或远处转移。局部早期gc患者的5年生存率超过60%,而局部、远处转移患者的5年生存率分别显著下降至30%和5%。因此,迫切需要新的gc诊断或筛查方法,以提高该人群的早期诊断率和预后效果。

2、中医药是几千年来中国人民经验应用和保留的医学科学和文化遗产,舌象诊断是中医诊断疾病的重要依据之一。中医理论认为,舌象的变化(舌的颜色、大小和形状,舌苔的颜色、厚度和含水量)可以反映人体的健康状况,尤其与胃病密切相关。在中医胃病诊断中,往往根据舌象信息采取经验或辩证的方式得出胃病的具体表现形式,又有研究表明口腔或者舌苔微生物群密切相关。

3、人工智能(ai)可用于筛查、诊断和治疗各种疾病,cheung cy等学者的论文(cheung cy,xu d,cheng cy,et al.a deep-learning system for the assessment ofcardiovascular disease risk via the measurement of retinal-vesselcalibre.nature biomedical engineering 2021;5(6):498-508.doi:10.1038/s41551-020-00626-4[published online first:2020/10/14])公开了一种深度学习系统,通过测量视网膜血管的口径来评估心血管疾病的风险,可以有效预测心血管疾病的风险。takenaka k等学者的论文(takenaka k,ohtsuka k,fujii t,et al.development andvalidation of a deep neural network for accurate evaluation of endoscopicimages from patients with ulcerative colitis.gastroenterology 2020;158(8):2150-57.doi:10.1053/j.gastro.2020.02.012[published online first:2020/02/16])公开了一种深度神经网络(见参考文献),用于评估溃疡性结肠炎患者的内窥镜图像,该网络以90.1%的准确度识别内镜缓解和组织学缓解的患者,准确率为92.9%。

4、福州数据技术研究院有限公司专利cn110251084a提供一种基于人工智能的舌像检测与识别方法,用于解决舌像采集过程中舌像舌体的实时检测拍摄、保存、上传,同时识别舌像舌色、舌形、苔质、苔色;其方案主要涉及了舌像的采集和识别技术,其中舌像识别更侧重于提取舌像颜色、纹理、舌苔区域或舌苔厚薄等特性,然而这些工作并没有将舌像、舌苔信息与某一特殊胃病比如胃癌建立对应关系。

5、沈阳智朗科技有限公司专利cn111710394a提出一种人工智能辅助的早期胃癌筛查系统,以自动化代替人工分析胃镜切片图像来解决胃癌阳性确定工作量大的问题;然而此种基于胃镜图像分析的策略,仍然首先需要获得大量的专业仪器采集的胃镜图像用于模型的学习,在测试阶段仍然需要依据每个测试者的胃镜图像做出决策,而胃镜图像的获得仍然存在时间消耗大、物质成本高、测试人群标准高等缺陷,很难做到全国范围的普查筛选。

6、江苏天瑞精准医疗科技有限公司专利cn112133427a提供了一种基于人工智能的胃癌辅助诊断系统,包括:诊断选择模块、数据采集模块、预处理模块、诊断模块和显示输出模块,该系统能够根据采集到的就诊者的数据,个性化地给出诊断结果。该诊断系统诊断所依据的数据包括就诊者的基本信息、生活饮食、感染史、疾病史、家族史、临床症状和检验项目等,其中临床症状和检验项目等数据的收集难度较大,而单独依靠基本信息、生活饮食、感染史、疾病史、家族史等信息则会影响前期的筛查诊断效果。

7、上海仁东医学检验所有限公司专利cn114203256a提供了一种基于微生物丰度的mibc分型及预后预测模型构建方法,该方法主要是从tcga数据库中的mibc转录组rna-seq数据中分析得到mibc(肌层浸润性膀胱癌)患者的微生物数据,然后以微生物丰度谱为特征进行nmf聚类,建立mibc微生物层面的分子分型,从而从肿瘤组织微生物层面深度解析了微生物与mibc的相关性,建立了mibc预后预测模型,该模型有助于精准预测mibc患者的1-5年生存率。因此该发明方案主要是为在微生物层面为mibc建立分子分型,目的是精准预测患者预后生存率。

8、然而遗憾的是目前尚未有研究证实舌苔微生物种群的变化与肿瘤存在对应关系,以及舌苔微生物种群变化在肿瘤诊断和筛查中的价值。

9、本发明力图解决这些和本领域中的其他待解决的需要。


技术实现思路

1、为解决上述背景技术中提及的至少一种技术问题,本发明旨在利用计算机辅助手段,设计一种基于深度学习的肿瘤筛查系统,该系统根据舌苔微生物中不同种、属丰度自动化预测不同测试试样属于肿瘤阳性的概率,以此来作为一种经济的、非侵入性的、高效的、准确的肿瘤早期筛查策略。

2、基于舌苔微生物的肿瘤预测系统,包括:

3、微生物信息获取模块,其被配置为获取测试试样的舌苔微生物信息;

4、数据处理模块,其被配置为通过下述操作来获得测试试样属于肿瘤阳性的概率:

5、依据自动学习获得的舌苔微生物信息上的可判别性的特征预测测试试样属于阳性的概率。

6、在一个具体实施例中,所述肿瘤是胃癌、乳腺癌、结直肠癌、食道癌、肝胆胰腺癌、肺癌、前列腺癌、甲状腺癌、卵巢癌、神经母细胞瘤、滋养细胞肿瘤或头颈部鳞癌中的至少一种。

7、在一个具体实施例中,所述肿瘤是胃癌、乳腺癌、结直肠癌、食道癌、肝胆胰腺癌或肺癌中的至少一种。

8、在一个具体实施例中,所述肿瘤是胃癌。

9、在一个具体实施例中,所述系统还包括输出模块,其被配置为输出预测结果。

10、在一个具体实施例中,所述输出模块被配置为输出舌苔微生物信息与预测结果。

11、在一个具体实施例中,所述输出模块以电子显示、声音播报、打印、网络传输的至少一种模式输出。

12、在一个具体实施例中,所述舌苔微生物信息包括舌苔微生物的属、种丰度。

13、在一个具体实施例中,所述可判别性的特征来自于微生物的属、种丰度。

14、在一个具体实施例中,所述可判别性的特征来自于微生物的属、种丰度的高维特征。旨在通过充分对比、分析、学习阳性患者与阴性患者之间关于舌苔微生物信息的共性和差异,通过深度判别测试试样舌苔微生物属、种丰度之间可判别性的特征,获得阳性患者和阴性患者之间的差异,即可判断得出测试试样属于肿瘤阳性的概率,从而通过对舌苔微生物信息的对比、分析、学习即可实现对测试试样肿瘤的诊断和预测,提供一种非侵入性的、非以人体组织为来源的、经济性高、准确率高的肿瘤诊断预测系统。

15、在一个具体实施例中,所述数据处理模块通过下述操作来获得测试试样属于肿瘤阳性的概率:

16、训练完成的神经网络对输入其中的微生物属、种丰度提取高维特征后预测测试试样属于阳性的概率。

17、在一个具体实施例中,所述神经网络是多层感知器(mlp)。

18、在一个具体实施例中,所述神经网络以下述步骤训练:

19、1)将采集自肿瘤阳性患者和/或肿瘤阴性人群的舌苔微生物属和/或种丰度作为输入向量输入至模型的输入层;

20、2)模型的隐藏层提取微生物种和/或属丰度的高维特征;

21、3)通过输出层的softmax分类器输出舌苔微生物属和/或种分属阳性和阴性的概率分布。

22、在一个具体实施例中,所述输入向量的长度是706/1339,分别代表微生物属/种。

23、在一个具体实施例中,所述输入向量的每一个元素代表在特定属或种上的微生物丰度。

24、在一个具体实施例中,所述输入层和输入向量长度对应。

25、在一个具体实施例中,所述隐藏层的神经元个数设置为512。隐藏层神经元个数大于输入层神经元个数,所以在前向运算时,将输入层的丰度特征非线性映射到高维空间中,形成高维特征,提取获得高维特征后即可精油输入层输出分属阳性和阴性的概率。

26、在一个具体实施例中,所述神经网络中除了输出层之外的每一层都附带激活函数和归一化。

27、在一个具体实施例中,所述输出层包括两个神经元:肿瘤阳性和肿瘤阴性。

28、在一个具体实施例中,所述神经网络的各层神经元分别互相连接,利用输出的概率分布最小化交叉熵目标函数:

29、

30、其中yi是测试样例对应的真实one-hot标注向量中的元素,是模型预测为类别yi的概率,其中0代表阴性类别,1代表阳性类别。one-hot标注是0、1向量形式的标注,比如分两个类别,类别0,1所对应的one-hot形式的标注是(1,0,0),(0,1,0)。

31、经过大量真实患者的验证,表明应用舌苔微生物作为无创诊断和筛查肿瘤的手段明显优于常规的血液肿瘤标志物,基于舌苔微生物的肿瘤预测系统具有比常规基于血液肿瘤标志物的人工智能模型更为优异的属/种敏感性(0.914/0.929vs 0.283-0.566、0.362-0.539)、特异性(0.947/0.947vs 0.688-0.976、0.759-0.938)和准确性(0.929/0.937vs0.603-0.622、0.645-0.662),其auc值也更高(0.945/0.975vs 0.682-0.715、0.694-0.760),考虑到中国及全球肿瘤检测的巨大负担,认为舌苔微生物结合人工智能深度学习方法的广泛使用,是筛查和预测早起肿瘤的最经济的、非侵入性的和可接受的方法,这也将带来巨大的社会经济影响。

32、增加隐藏层数量或者调整隐藏层单元个数也可以达到相近的识别精度,即由不同超参数的全连接层组成的神经网络都适用于基于微生物丰度的肿瘤阳性判别任务,并通过深度学习技术,自动化判断肿瘤阳性的概率,以筛选出肿瘤高发人群。

33、基于舌苔微生物的肿瘤预测方法,其包括:

34、获得测试试样的舌苔微生物信息;

35、将测试试样的舌苔微生物信息输入前述所述系统获得所述测试试样的肿瘤阳性概率。

36、所述舌苔微生物信息包括舌苔微生物的属、种丰度。

37、前述所述基于舌苔微生物的肿瘤预测系统和/或方法的应用,其包括:

38、应用所述系统和/或方法对测试试样进行肿瘤预测。

39、在符合本领域常识的基础上,上述各优选条件,可以相互组合,得到具体实施方式。

40、本发明的有益效果为:

41、本发明旨在提供一种基于深度学习的肿瘤筛查系统,通过充分对比、分析、学习阳性患者与阴性患者之间关于舌苔微生物信息的共性和差异,获得阳性患者和阴性患者之间的差异,通过深度判别测试试样舌苔微生物属、种丰度之间可判别性的特征即可判断得出测试试样属于肿瘤阳性的概率,从而通过对舌苔微生物信息分析学习即可实现对测试试样肿瘤的诊断和预测,验证得知舌苔微生物预测胃癌时的属/种敏感性达0.914/0.929,特异性均达0.947,准确性达0.929/0.937,其auc值达0.945/0.975,预测效果比常规基于血液肿瘤标志物的人工智能模型更加优异,可以此来作为一种经济的、非侵入性的、高效的、准确的肿瘤早期筛查策略,必将带来巨大的社会经济效益。

42、本发明为实现上述目的而采用了上述技术方案,弥补了现有技术的不足,设计合理,操作方便。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1