一种目标检测方法与流程

文档序号:33180661发布日期:2023-02-04 04:53阅读:32来源:国知局
一种目标检测方法与流程

1.本发明涉及目标检测技术领域,尤其是一种基于人体计算机断层扫描影像的目标检测方法。


背景技术:

2.在传统医疗领域,医学影像数据需要影像科医生耗费大量的精力去进行筛查和判别,大量重复性和机械性的工作容易使医生过度疲劳而产生误判。而目标检测可以在目标周围绘制合适的边界框(bbox:bounding box)实现快速定位,能够在大量的医学影像序列中快速地定位到医生感兴趣的病灶,关节等区域,辅助医生更快地进行疾病的诊断与治疗。深度学习的发展也对医学图像中的目标检测带来了巨大提升。深度学习模型的训练需要大量带标注的数据集,需要足够的医疗资源与成本来支撑,对于一些三维的目标检测更需要时间与精力来标注准确的训练数据,同时也需要更多的计算机资源来实现。


技术实现要素:

3.本发明要解决的技术问题是:克服现有技术中之不足,提供一种目标检测方法,提高了基于人体计算机断层扫描影像中目标检测的效率与准确性。
4.本发明解决其技术问题所采用的技术方案是:一种目标检测方法,用于定位人体计算机断层扫描影像中的感兴趣区域,包括如下步骤:
5.s1、获取不同对象的人体医学数字成像与通信影像数据集,将医学数字成像与通信数据集中的序列文件重建生成三维ct影像;
6.s2、对步骤(s1)的三维ct影像分别在冠状面和水平面方向上生成二维的数字重建放射影像,在二维的数字重建放射影像上标注相应目标区域作为训练标签;
7.s3、基于步骤(s2)中二维的数字重建放射影像构建yolo目标检测网络,采用二维的数字重建放射影像和对应区域标签训练目标检测网络,获得检测模型;
8.s4、采用步骤(s3)中获得的检测模型对三维ct影像进行目标检测,获得目标区域的定位信息。
9.进一步地,所述步骤(s1)中医学数字成像与通信影像数据集中的序列文件根据头文件中包括的图像方位、图像位置、像素间距、切片厚度信息重建生成三维ct影像。
10.进一步地,所述步骤(s2)具体操作步骤为:
11.先在人体三维ct影像的水平面方向生成二维数字重建放射影像:主体的数字重建放射影像;生成的数字重建放射影像上包含人体主干区域和ct床等其他干扰区域,人工标注出感兴趣的人体主干区域作为训练标签:主体标签;通过上一步标注结果映射到三维ct影像,裁剪出人体主干的三维ct体数据,在此体数据的冠状面方向再生成数字重建放射影像:冠状面的数字重建放射影像,在此数字重建放射影像上标注出目标区域作为训练标签:冠状面标签;再通过上一步标注结果映射到人体主干的三维ct体数据,裁剪出目标区域的三维ct体数据,在此体数据的水平面方向生成数字重建放射影像:水平面的数字重建放射
影像,在此数字重建放射影像上标注出目标区域作为训练标签:水平面标签。
12.更进一步地,所述步骤(s3)具体操作步骤为:
13.采用主要的数字重建放射影像和主要标签构建人体主干的定位网络:主体定位,训练保存模型;采用冠状面的数字重建放射影像和冠状面标签构建冠状面的定位网络:冠状面目标定位,训练保存模型;采用水平面的数字重建放射影像和水平面的标签构建水平面的定位网络:水平面目标定位,训练保存模型。
14.更进一步地,所述步骤(s4)具体操作步骤为:
15.将医学数字成像与通信数据集的序列文件重建成三维ct体数据,对ct体数据在水平面方向生成主体二维数字重建放射影像,采用所述主体定位模型在主体数字重建放射影像上检测出人体主干区域,根据主体定位结果在原始ct影像中裁剪出只包含人体主干区域的三维体数据:主要数据;然后对主体数据在冠状面方向生成数字重建放射影像,采用冠状面目标定位模型在冠状面数字重建放射影像上检测出感兴趣区域在立体坐标系中x轴与z轴的起始位置与长宽信息;根据上一步结果在主体数据中裁剪出包含目标区域和其他区域的体数据:冠状面体数据,对冠状面体数据在水平面方向生成数字重建放射影像,采用水平面目标定位模型在水平面数字重建放射影像上检测出感兴趣区域y轴起始位置与高度信息,映射到原始人体三维ct影像中,绘制出目标区域的边界框,完成目标检测。
16.本发明的有益效果是:
17.本发明所提供的方法中三维ct体数据生成二维数字重建放射影像算法保证了算法的快速性,有效性;
18.本发明所提供的方法中yolo算法保证了算法的准确性;
19.本发明所提供的方法利用不同方向上的二维数字重建放射影像实现对三维目标进行检测定位,提升了三维目标检测的效率,节省了计算成本。
附图说明
20.下面结合附图和实施例对本发明进一步说明。
21.图1是本发明的一种目标检测方法的流程图。
22.图2是本发明的一种目标检测方法的原理图。
具体实施方式
23.现在结合附图和优选实施例对本发明作进一步的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
24.如图1所示,一种目标检测方法,用于定位人体计算机断层扫描影像中的感兴趣区域,包括如下步骤:
25.获取不同对象的人体医学数字成像与通信(dicom)影像数据集,将医学数字成像与通信(dicom)数据集中的序列文件重建生成三维ct影像;其中,医学数字成像与通信(dicom)影像数据集中的序列文件根据头文件中图像方位(imageorientation)、图像位置(imageposition)、像素间距(pixelspacing)、切片厚度(slicethickness)等信息重建生成三维ct影像;
26.对三维ct影像分别在冠状面和水平面方向上生成二维的数字重建放射影像
(drr),在二维的数字重建放射影像(drr)上标注相应目标区域作为训练标签,具体操作步骤为:
27.先在人体三维ct影像的水平面方向生成二维数字重建放射影像(drr):主体的数字重建放射影像(drr_main);生成的主体数字重建放射影像(drr_main)上包含人体主干区域和ct床等其他干扰区域,人工标注出感兴趣的人体主干区域作为训练标签:主体标签(label_main);通过上一步标注结果映射到三维ct影像,裁剪出人体主干的三维ct体数据,在此体数据的冠状面方向再生成数字重建放射影像:冠状面的数字重建放射影像(drr_coronal),在此数字重建放射影像上标注出目标区域作为训练标签:冠状面标签(label_coronal);再通过上一步标注结果映射到人体主干的三维ct体数据,裁剪出目标区域的三维ct体数据,在此体数据的水平面方向生成数字重建放射影像:水平面的数字重建放射影像(drr_axial),在此数字重建放射影像上标注出目标区域作为训练标签:水平面标签(label_axial);
28.基于二维的数字重建放射影像(drr)构建yolo目标检测网络,采用二维的数字重建放射影像(drr)和对应区域标签训练目标检测网络,获得检测模型,具体操作步骤为:
29.在模型训练之前,需要对数据集进行预处理和数据增强,数据预处理主要是对生成的数字重建放射影像(drr)进行伪彩色处理,将只包含灰度信息的二维数字重建放射影像(drr)转换成具有色彩信息的伪彩色图像,适应于yolo模型的训练推理;然后对进行伪彩色处理之后的数字重建放射影像(drr)和对应的标签(label)进行旋转,翻转,裁剪,缩放等方式的数据增强;采用主体的数字重建放射影像(drr_main)和主体标签(label_main)构建人体主干的定位网络:主体定位(focus_main),训练保存模型;采用冠状面的数字重建放射影像(drr_coronal)和冠状面标签(label_coronal)构建冠状面的定位网络:冠状面目标定位(focus_coronal),训练保存模型;采用水平面的数字重建放射影像(drr_axial)和水平面的标签(label_axial)构建水平面的定位网络:水平面目标定位(focus_axial),训练保存模型;
30.采用获得的检测模型对三维ct影像进行目标检测,获得目标区域的定位信息,具体操作步骤为:
31.将医学数字成像与通信(dicom)数据集的序列文件重建成三维ct体数据,对ct体数据在水平面方向生成主体二维数字重建放射影像(drr_main),采用主体定位(focus_main)模型在主体数字重建放射影像(drr_main)上检测出人体主干区域,根据主体定位(focus_main)结果在原始ct影像中裁剪出只包含人体主干区域的三维体数据:主要数据(main_volume);然后对主体数据(main_volume)在冠状面方向生成数字重建放射影像(drr_main),采用冠状面目标定位(focus_coronal)模型在冠状面数字重建放射影像(drr_coronal)上检测出感兴趣区域在立体坐标系中x轴与z轴的起始位置与长宽信息(x-position,z-position,width,height);根据上一步结果在主体数据(main_volume)中裁剪出包含目标区域和其他区域的体数据:冠状面体数据(coronal_volume),对冠状面体数据(coronal_volume)在水平面方向生成数字重建放射影像(drr_axial),采用水平面目标定位(focus_axial)模型在水平面数字重建放射影像(drr_axial)上检测出感兴趣区域y轴起始位置与高度信息(y-position,length),映射这些信息(x-position,y-position,z-position,width,height,length)到原始人体三维ct影像中,绘制出目标区域的边界框
(bbox),完成目标检测。
32.其中,yolo是一个卷积神经网络(cnn),用于实时进行目标检测。该算法将单个神经网络应用于完整的图像,然后将图像划分为多个区域,并预测每个区域的边界框和概率,这些边界框是由预测的概率加权。yolo算法是一种基于回归的算法,它不是选择图像中有趣的部分,而是预测整个图像中的类和包围框运行一次算法,不会在输入图像中搜索可能包含对象的感兴趣区域,而是将图像分割成单元格,每个细胞负责预测n个包围框,具有最大概率的类被选择并分配给特定的网格单元。在预测类概率后,下一步进行非最大抑制,这有助于算法消除不必要的锚点。一旦完成,算法就会找到具有下一个最高类别概率的包围框,并进行相同的过程,直到剩下所有不同的包围框为止,算法最终输出所需的向量,显示各个类的包围框的细节。
33.dicom(digital imaging and communications in medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准,被广泛应用于放射医疗、心血管成像以及放射诊疗诊断设备(x射线、ct、核磁共振、超声等),所有患者的医学图像都以dicom文件格式进行储存,这个格式包含患者的信息以及其他图像相关信息。放射诊疗诊断设备围绕人体的某一部位作一个接一个的断面扫描,扫描后得到的图像是多层的图像,再把一层层的图像在z轴上堆叠起来形成三维图像,每一层的图像都存在dicom文件中,dicom文件一般有dicom文件头和dicom数据集合组成,dicom文件头包含了标识数据集合的相关信息,每个dicom文件都包括一个文件头。
34.drr(digitally reconstructured radiograph)即数字重建放射影像,运用模拟光线穿过人的身体,对人体进行三维扫描,重建形成能够体现人体内部各个器官的灰度图像。
35.如图2所示,目标检测方法的原理为:对重建后的三维人体ct影像在水平面方向生成主体二维drr影像,用于主体定位进行人体主干定位,通过定位结果在原始体数据中裁剪出包含人体主干的主体数据;对主体数据在冠状面方向生成冠状面二维drr影像,用于冠状面目标定位进行目标在立体坐标系中(x-position,z-position,width,height)的确认,根据定位结果在主体数据中裁剪出包含目标区域和其他区域的冠状面体数据;对冠状面体数据在水平面方向生成二维drr影像,用于水平面目标定位进行目标在立体坐标系中(y-position,length)的确认;通过(x-position,y-position,z-position,width,length,height)在原始ct影像中绘制出目标区域的bbox,完成对目标的检测。
36.上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1