心电图数据集生成方法、系统和设备

文档序号:35623169发布日期:2023-10-05 19:18阅读:49来源:国知局
心电图数据集生成方法、系统和设备

本发明涉及数据处理,具体涉及一种心电图数据集生成方法、系统和设备。


背景技术:

1、心脑血管疾病是一种严重威胁人类,特别是年龄偏大的中老年人的常见病。具有患病率高、致残率高、死亡率高的特点,即使在拥有先进的、完善的医疗体系与治疗手段之下,仍然有百分之五十以上的患者生活不能自理,全世界每年死于心脑血管疾病的人数高达1500万人,居于人类各种死亡原因的首位。其中心源性猝死是心血管疾病中最常见、最凶险的死亡原因。其中我国的每年猝死人数达54.4万例,居于世界首位,而心源性猝死大部分是由心律失常引起的。心律失常即心脏活动的起源和传导障碍导致心脏搏动的频率和节律异常。

2、心电图(ecg)是利用心电图机从体表记录心脏每一心动周期所产生电活动变化的技术,这种技术具有低成本、无创等特点。随着深度学习技术的不断发展,通过深度学习辅助诊断,可以大大减少医护人员的工作量,越来越受到人们的重视。

3、现有技术中,针对诊断的深度学习需要通过神经网络提取海量医疗数据中的特征,建立疾病分类的方法和预测模型,才能为临床诊断提供帮助。而且,神经网络在数据量越大的情况下,层次就越深,对于特征的提取和学习的能力就会越强。但目前在关于ecg研究领域,可以用于研究的公开数据集规模较少,数据存在量少且不平衡的情况,尤其是可以供二维卷积神经网络用来训练的心电图像十分稀少。因此,在这样数据稀少的情况下进行深度学习,会导致深度学习学习不充分、准确率不高以及特异性较差的结果。因此,亟需一种能够解决心电图数据量少,避免后续诊断模型训练学习效果差的方法。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种心电图数据集生成方法、系统和设备,以克服目前针对ecg数据少,导致诊断模型学习效果差的问题。

2、为实现以上目的,本发明采用如下技术方案:

3、第一方面,本申请实施例提供一种心电图数据集生成方法,包括:

4、获取用户上传的第一心电报告;

5、通过预设检测提取模型,检测提取所述第一心电报告中的心电图像,得到所述第一心电报告的心电图像;

6、基于文字识别技术,确定所述第一心电报告的心跳节拍类型;

7、基于所述心跳节拍类型对所述心电图像进行标记,得到目标数据;

8、基于所述目标数据生成第一心电图数据集。

9、进一步地,所述基于文字识别技术,确定所述第一心电报告的心跳节拍类型,包括:

10、基于文字识别技术,提取所述第一心电报告中的文字;

11、基于预设分词技术,对提取到的文字进行分词,得到目标关键词;

12、基于预设关键词与心跳节拍类型的匹配关系,确定与所述目标关键词对应的心跳节拍类型;

13、将与所述目标关键词对应的心跳节拍类型,作为该第一心电报告的心跳节拍类型。

14、进一步地,所述基于所述心跳节拍类型对所述心电图像进行标记,得到目标数据,包括:

15、在得到一个第一心电报告的心电图像和心跳节拍类型后,基于该第一心电报告的心跳节拍类型对该第一心电报告的心电图像进行标记,得到该第一心电报告的目标数据。

16、进一步地,还包括:

17、将多个所述第一心电报告的心电图像组成图像集,和将多个所述第一心电报告的心跳节拍类型组成标签集;且所述图像集中的心电图像与所述第一心电报告一一对应,所述标签集中的标签与所述第一心电报告一一对应;

18、所述基于所述心跳节拍类型对所述心电图像进行标记,得到目标数据,包括:

19、基于标签对相同第一心电报告对应的心电图像进行标记,得到该第一心电报告的目标数据。

20、进一步地,预设检测提取模型的构建过程包括:

21、基于第二心电报告生成第二心电图数据集,其中所述第二心电报告为预存的心电报告;

22、基于所述第二心电图数据集和yolov5检测网络,训练得到所述预设检测提取模型。

23、进一步地,所述基于所述第二心电图数据集和yolov5检测网络,训练得到所述预设检测提取模型,包括:

24、将cbam注意力机制引入到yolov5检测网络的骨干网络中,对所述yolov5检测网络进行特征提取算法优化;

25、基于所述第二心电图数据集和优化后的yolov5检测网络,训练得到基础检测模型;

26、基于focal loss损失函数对所述基础检测提取模型中的参数进行优化,得到所述预设检测提取模型。

27、进一步地,还包括:将所述第二心电图数据集中的非黑白图像转换为黑白图像;

28、所述基于所述第二心电图数据集和yolov5检测网络,训练得到所述预设检测提取模型,包括:

29、基于图像转换后的第二心电图数据集和yolov5检测网络,训练得到所述预设检测提取模型。

30、进一步地,在所述通过预设检测提取模型,检测提取所述第一心电报告中的心电图像之后,还包括:

31、基于预设尺寸信息,对所述心电图像进行裁剪,得到目标尺寸的心电图像;

32、所述基于所述心跳节拍类型对所述心电图像进行标记,得到目标数据,包括:

33、基于所述心跳节拍类型对目标尺寸的心电图像进行标记,得到目标数据。

34、第二方面,本申请实施例还提供一种心电图数据集生成系统,包括:获取模块、提取模块和生成模块;

35、所述获取模块,用于获取用户上传的第一心电报告;

36、所述提取模块,用于通过预设检测提取模型,检测提取所述第一心电报告中的心电图像,得到所述第一心电报告的心电图像;

37、所述提取模块,还用于基于文字识别技术,确定所述第一心电报告的心跳节拍类型;

38、所述生成模块,用于基于所述心跳节拍类型对所述心电图像进行标记,得到目标数据;并基于所述目标数据生成第一心电图数据集。

39、第三方面,本申请实施例还提供一种心电图数据集生成设备,包括处理器和存储器,所述处理器与存储器相连:

40、其中,所述处理器,用于调用并执行所述存储器中存储的程序;

41、所述存储器,用于存储所述程序,所述程序至少用于执行上述的心电图数据集生成方法。

42、本发明涉及数据处理技术领域,具体公开一种心电图数据集生成方法、系统和设备,该方法包括:获取用户上传的第一心电报告;通过预设检测提取模型,检测提取第一心电报告中的心电图像,得到第一心电报告的心电图像;基于文字识别技术,确定第一心电报告的心跳节拍类型;基于心跳节拍类型对心电图像进行标记,得到目标数据;基于目标数据生成第一心电图数据集。如此,可以实现基于用户上传的心电报告,自动生成为基于心跳节拍类型标记的心电图像,生成第一心电图数据集,为后续构建针对ecg诊断判断的神经网络模型,提供充足的数据,保证诊断神经网络的准确性。



技术特征:

1.一种心电图数据集生成方法,其特征在于,包括:

2.根据权利要求1所述的心电图数据集生成方法,其特征在于,所述基于文字识别技术,确定所述第一心电报告的心跳节拍类型,包括:

3.根据权利要求1所述的心电图数据集生成方法,其特征在于,所述基于所述心跳节拍类型对所述心电图像进行标记,得到目标数据,包括:

4.根据权利要求1所述的心电图数据集生成方法,其特征在于,还包括:

5.根据权利要求1所述的心电图数据集生成方法,其特征在于,预设检测提取模型的构建过程包括:

6.根据权利要求5所述的心电图数据集生成方法,其特征在于,所述基于所述第二心电图数据集和yolov5检测网络,训练得到所述预设检测提取模型,包括:

7.根据权利要求5所述的心电图数据集生成方法,其特征在于,还包括:将所述第二心电图数据集中的非黑白图像转换为黑白图像;

8.根据权利要求1所述的心电图数据集生成方法,其特征在于,在所述通过预设检测提取模型,检测提取所述第一心电报告中的心电图像之后,还包括:

9.一种心电图数据集生成系统,其特征在于,包括:获取模块、提取模块和生成模块;

10.一种心电图数据集生成设备,其特征在于,包括处理器和存储器,所述处理器与存储器相连:


技术总结
本发明涉及数据处理技术领域,具体公开一种心电图数据集生成方法、系统和设备,该方法包括:获取用户上传的第一心电报告;通过预设检测提取模型,检测提取第一心电报告中的心电图像,得到第一心电报告的心电图像;基于文字识别技术,确定第一心电报告的心跳节拍类型;基于心跳节拍类型对心电图像进行标记,得到目标数据;基于目标数据生成第一心电图数据集。如此,可以实现基于用户上传的心电报告,自动生成为基于心跳节拍类型标记的心电图像,生成第一心电图数据集,为后续构建针对ECG诊断判断的神经网络模型,提供充足的数据,保证诊断神经网络的准确性。

技术研发人员:刘强,韦语轩,安翔,卢思超,夏天
受保护的技术使用者:北京石油化工学院
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1