本发明涉及计算机多媒体,尤其涉及基于深度学习的ct报告处理方法、装置、设备及介质。
背景技术:
1、随着深度学习的快速发展,越来越多的技术人员都热衷于将深度学习应用到不同的领域,以改善传统的工作模式,提高工作效率,在医疗领域,深度学习的应用也越来越普遍,但是一般是用于进行ct图像处理,在医疗文字处理,如ct报告的处理方面的应用还较为缺乏,ct报告由于是不同医生撰写,不同的医生由于个人习惯,在撰写ct报告时,在文字描述、句式、表达方法上都有很多不同,导致了ct报告的理解或者整理十分不方便。
技术实现思路
1、有鉴于此,本发明的目的是为了克服现有技术中的不足,提供了基于深度学习的ct报告处理方法、装置、设备及介质。
2、本发明提供如下技术方案:
3、第一方面,本申请提供了深度学习的ct报告处理方法,包括:
4、获取训练数据集,将所述训练数据集输入初始训练模型,得到最终训练模型;
5、从所述训练数据集中选取候选数据集,对所述候选数据集进行标注,得到标注数据集;
6、将所述标注数据集输入提取器,通过所述提取器对所述标注数据集进行关键词提取,得到提取数据;
7、将所述提取数据输入分类器,通过所述分类器对所述提取数据进行分类计算,得到分类数据;
8、将所述分类数据输入所述最终训练模型,将所述最终训练模型的输出结果作为标准ct报告文本,所述标准ct报告文本包括疾病官方名称。
9、一种实施方式中,所述获取训练数据集,包括:
10、获取多个ct报告文本,将每个所述ct报告文本转换成词向量;
11、将多个所述ct报告文本对应的所述词向量作为所述训练数据集。
12、一种实施方式中,所述初始训练模型为双向lstm网络,所述将所述训练数据集输入初始训练模型,得到最终训练模型,包括:
13、将所述ct报告对应的词向量输入所述双向lstm网络,得到输出结果;
14、判断所述输出结果与所述ct报告对应的词向量的相似度;
15、如果所述输出结果与所述ct报告对应的词向量的相似度大于第一阈值,则将所述双向lstm网络作为最终训练模型。
16、一种实施方式中,所述判断所述输出结果与所述ct报告对应的词向量的相似度,还包括:
17、如果所述输出结果与所述ct报告对应的词向量的相似度小于或等于所述第一阈值,则调整所述双向lstm网络的参数,直到所述相似度大于所述第一阈值。
18、一种实施方式中,所述对候选数据集进行标注,得到标注数据集,包括:
19、对所述候选数据集中的关键词进行标注,得到标注数据集,所述关键词包括:疾病名称、疾病位置和疾病状态变化。
20、一种实施方式中,所述将所述标注数据集输入提取器,得到提取数据,包括:
21、将所述标注数据集输入所述提取器,所述提取器从所述标注数据集中提取所述关键词,得到提取数据。
22、一种实施方式中,所述将所述提取数据输入分类器,得到分类数据,包括:
23、将所述提取数据输入分类器,通过所述分类器将所述提取数据中的所述疾病名称与所述疾病官方名称进行对比,根据对比的结果对所述提取数据进行分类,得到分类数据。
24、第二方面,本申请还提供了基于深度学习的ct报告处理装置,包括:
25、训练模块,用于获取训练数据集,将所述训练数据集输入初始训练模型,得到最终训练模型;
26、标注模块,用于从所述训练数据集中选取候选数据集,对所述候选数据集进行标注,得到标注数据集;
27、提取模块,用于将所述标注数据集输入提取器,通过所述提取器对所述标注数据集进行关键词提取,得到提取数据;
28、分类模块,用于将所述提取数据输入分类器,通过所述分类器对所述提取数据进行分类计算,得到分类数据;
29、输出模块,用于将所述分类数据输入所述最终训练模型,将所述最终训练模型的输出结果作为标准ct报告文本,所述标准ct报告文本包括疾病官方名称。
30、第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和至少一个处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实施如第一方面所述的基于深度学习的ct报告处理方法。
31、第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如第一方面所述的基于深度学习的ct报告处理方法。
32、本发明的实施例具有如下有益效果:
33、本申请通过深度学习模型,对ct报告文本进行学习之后,可以将各种不同描述或句式的ct报告,输入深度学习模型中,输出标准化的ct报告,实现ct报告的标准化处理,便于ct报告的理解和分类。
34、为使本发明的上述目的、特征和优点能更明显和易懂,下文特举较佳实施例,并配合所附附图,做详细说明如下。
1.基于深度学习的ct报告处理方法,其特征在于,包括:
2.根据权利要求1所述的基于深度学习的ct报告处理方法,其特征在于,所述获取训练数据集,包括:
3.根据权利要求2所述的基于深度学习的ct报告处理方法,其特征在于,所述初始训练模型为双向lstm网络,所述将所述训练数据集输入初始训练模型,得到最终训练模型,包括:
4.根据权利要求3所述的基于深度学习的ct报告处理方法,其特征在于,所述判断所述输出结果与所述ct报告对应的词向量的相似度,还包括:
5.根据权利要求1所述的基于深度学习的ct报告处理方法,其特征在于,所述对所述候选数据集进行标注,得到标注数据集,包括:
6.根据权利要求5所述的基于深度学习的ct报告处理方法,其特征在于,所述将所述标注数据集输入提取器,得到提取数据,包括:
7.根据权利要求6所述的基于深度学习的ct报告处理方法,其特征在于,所述将所述提取数据输入分类器,得到分类数据,包括:
8.基于深度学习的ct报告处理装置,其特征在于,包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和至少一个处理器,所述存储器存储有计算机程序,所述处理器用于执行所述计算机程序以实施如权利要求1至7中任意一项所述的基于深度学习的ct报告处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时,实现如权利要求1至7中任意一项所述的基于深度学习的ct报告处理方法。