数据分类方法、装置、电子设备及存储介质与流程

文档序号:31472506发布日期:2022-09-09 23:37阅读:66来源:国知局
数据分类方法、装置、电子设备及存储介质与流程

1.本技术属于数据分类技术领域,具体涉及一种数据分类方法、装置、电子设备及存储介质。


背景技术:

2.在数据分类领域中,经过训练的良好神经网络模型能够分辨出数据中不同类别的物体,并且已经可以达到较高的识别率。但是目前的大部分神经网络并不能满足识别未训练过的物体。即神经网络模型仅能识别已知类别的物体,对于未训练的物体,神经网络模型会将该物体错误的归到已知的类别,从而导致识别精度下降。
3.现有分类方法,其主要缺陷在于当类别不断增加时,由于储存空间有限,每一类的关键样例在逐渐减少,模型对于旧类别的遗忘程度会逐步加大,而且无法挽回。


技术实现要素:

4.本技术的目的是提供一种数据分类方法、装置、电子设备及存储介质以提高心电信号数据分类的精度。
5.根据本技术实施例的第一方面,提供了一种数据分类方法,该方法可以包括:
6.获取待分类心电信号数据;
7.将所述待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集,每一种心电信号数据集中的心电信号数据在预设心拍范围内,所述训练好的机器学习模型是通过类别增量学习训练得到的。
8.在本技术的一些可选实施例中,所述训练好的机器学习模型是通过下述步骤训练得到的:
9.获取心电信号训练数据集;
10.将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型。
11.在本技术的一些可选实施例中,所述获取心电信号训练数据集,包括:
12.获取初始心电信号数据集;
13.对所述初始心电信号数据集的心电信号数据进行标注,得到标注心电信号数据集;
14.对所述标注心电信号数据集中的心电信号数据依次进行中值滤波、滑动平均滤波及心拍分割处理,得到所述心电信号训练数据集。
15.在本技术的一些可选实施例中,所述将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型,包括:
16.将所述心电信号训练数据集中的数据进行分类,得到第一分类心电信号数据,所述第一分类心电信号数据包括n1类,其中,第1类为预设心拍集,在后续增量中仍会出现,第2-n1类为对应的n
1-1种目标心拍集;
17.将所述第一分类心电信号数据输入到机器学习模型,对所述机器学习模型进行训练直到所述机器学习模型对所述第一分类心电信号数据达到预设指标,得到初始训练模型;
18.对所述初始训练模型进行扩增,得到扩增训练模型,所述扩增训练模型包括所述初始训练模型的第一特征提取器,所述第一特征提取器在后续训练过程中保持其冻结状态、特征传导层、第二特征提取器及分类器,其中,所述特征传导层利用已经学习到的知识传递给所述第二特征提取器,以使所述第二特征提取器具有全新的学习能力;
19.对所述扩增训练模型进行n2种类别的样例选择,得到所述训练好的机器学习模型。
20.根据本技术实施例的第二方面,提供一种数据分类装置,包括:
21.第一获取模块,用于获取待分类心电信号数据;
22.第一输入模块,用于将所述待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集,每一种心电信号数据集中的心电信号数据在预设心拍范围内。
23.在本技术的一些可选实施例中,所述训练好的机器学习模型是通过下述步骤训练得到的:
24.第二获取模块,用于获取心电信号训练数据集;
25.第二输入模块,用于将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型。
26.在本技术的一些可选实施例中,所述获取心电信号训练数据集,包括:
27.第三获取模块,用于获取初始心电信号数据集;
28.标注模块,用于对所述初始心电信号数据集的心电信号数据进行标注,得到标注心电信号数据集;
29.预处理模块,用于对所述标注心电信号数据集中的心电信号数据依次进行中值滤波、滑动平均滤波及心拍分割处理,得到所述心电信号训练数据集。
30.在本技术的一些可选实施例中,所述将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型,包括:
31.分类模块,用于将所述心电信号训练数据集中的数据进行分类,得到第一分类心电信号数据,所述第一分类心电信号数据包括n1类,其中,第1类为预设心拍集,在后续增量中仍会出现,第2-n1类为对应的n
1-1种目标心拍集;
32.第三输入模块,用于将所述第一分类心电信号数据输入到机器学习模型,对所述机器学习模型进行训练直到所述机器学习模型对所述第一分类心电信号数据达到预设指标,得到初始训练模型;
33.扩增模块,用于对所述初始训练模型进行扩增,得到扩增训练模型,所述扩增训练模型包括所述初始训练模型的第一特征提取器,所述第一特征提取器在后续训练过程中保持其冻结状态、特征传导层、第二特征提取器及分类器,其中,所述特征传导层利用已经学习到的知识传递给所述第二特征提取器,以使所述第二特征提取器具有全新的学习能力;
34.样例选择模块,用于对所述扩增训练模型进行n2种类别的样例选择,得到所述训练好的机器学习模型。
35.根据本技术实施例的第三方面,提供一种电子设备,该电子设备可以包括:
36.处理器;
37.用于存储处理器可执行指令的存储器;
38.其中,处理器被配置为执行指令,以实现如第一方面的任一项实施例中所示的数据分类方法。
39.根据本技术实施例的第四方面,提供一种存储介质,当存储介质中的指令由信息处理装置或者服务器的处理器执行时,以使信息处理装置或者服务器实现如第一方面的任一项实施例中所示的数据分类方法。
40.本技术的上述技术方案具有如下有益的技术效果:
41.本技术实施例方法通过将获取的待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集,每一种心电信号数据集中的心电信号数据在预设心拍范围内;该训练好的机器学习模型对抗“灾难性遗忘”现象明显加强,同时针对不平衡数据也能达到很好的效果,另一方面,扩展网络可以保存原有模型的知识,使得增量过程可逆,保证了工程应用的稳定性、可靠性,进而使心电信号的分类更加准确。
附图说明
42.图1是本技术一示例性实施例中数据分类方法流程图;
43.图2是本技术一示例性实施例中初始数据处理、训练流程图;
44.图3是本技术一示例性实施例中增量扩展模型结构图;
45.图4是本技术一示例性实施例中电子设备结构示意图;
46.图5是本技术一示例性实施例中电子设备的硬件结构示意图。
具体实施方式
47.为使本技术的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本技术进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本技术的概念。
48.在附图中示出了根据本技术实施例的层结构示意图。这些图并非是按比例绘制的,其中为了清楚的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
49.显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
50.在本技术的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
51.此外,下面所描述的本技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
52.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的数据分类方法进行详细地说明。
53.如图1所示,在本技术实施例的第一方面,提供了一种数据分类方法,该方法可以包括:
54.s110:获取待分类心电信号数据;
55.s120:将所述待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集,每一种心电信号数据集中的心电信号数据在预设心拍范围内。
56.上述实施例方法通过将获取的待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集,每一种心电信号数据集中的心电信号数据在预设心拍范围内;该训练好的机器学习模型对抗“灾难性遗忘”现象明显加强,同时针对不平衡数据也能达到很好的效果,另一方面,扩展网络可以保存原有模型的知识,使得增量过程可逆,保证了工程应用的稳定性、可靠性,进而使心电信号的分类更加准确。
57.为了更加清楚的说明,接下来对于上述步骤进行详细介绍:
58.首先是步骤s110:获取待分类心电信号数据。
59.本步骤的待分类心电信号数据可以是心脏的实时监测数据,也可以是心电图数据,可以是正常人的心电图数据也可以心律失常人的心电图数据。
60.然后是步骤s120:将所述待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集。
61.本步骤中的训练好的机器学习模型是通过类别增量学习训练得到的,类别增量学习训练是指在已经训练好的能够识别预设的类别数据的深度学习模型基础上,继续获取了新的不在该预设类别中的数据,然后对该模型进行扩展,使得该模型在能够在识别原有类别数据的基础上,获得识别新类别数据的能力。这里的增量过程是属于基于样例选择与模型网络动态扩展相结合的方法实现的,即输入是新类别数据和旧模型,输出是新模型,该训练好的机器学习模型可以通过下述方法步骤训练得到的:
62.(1)针对初始采集、整理、标注后的数据库进行数据预处理,包括中值滤波、滑动平均滤波、心拍分割等操作,获得初始数据集d1;
63.(2)针对初始心电数据共1,2
……
n1类,其中1类为正常心拍,在后续增量中仍会出现,2
……
n1为对应的n
1-1种心律失常疾病心拍,基于现有心律失常分类研究选择基础深度学习模型作为初始模型m1,其初始流程如下图2所示,
64.(3)当m1针对数据集d1已达到指标后,针对d1中的2,3
……
n1类心律失常疾病数据选择k个特例,k是根据增量学习要求即应用场景内存有一定上限,不能无限制地存储所有收集的数据,这里利用k来表示存储上限。步骤如下:
65.a)对于每一类疾病,其包含numi条数据,遍历每一条数据x
ij
,获得基于已训练好的模型m1中的特征提取器f1输出神经网络特征fx
ij
、心率变异率特征rrx
ij
、qrs形态特征qrsx
ij
、频域特征freqx
ij
,组成类别特征向量并求解其类别平均特征
66.b)在疾病i中选择个样例,每一类取采用“探索+利用”模式,其中70%的样例进行如下规则选取:
67.i)计算f
ij
与之间的欧氏距离d
ij

68.ii)对d
ij
进行从小到大排序,取前个样本作为该类疾病的样例e
1i

69.30%的数据在{d
1i-e
1i
}中随机选取,保持样例的不确定度。
70.(4)当获得包含1,n1+1,....n2+n1类心律失常疾病数据集d2后,其中数据集d2是随着不断收集数据并经过标注、整理后得到的,整个增量过程是随着时间推移的,一开始有一个初始数据集由于时间、成本问题暂时只包含一些类别,后续时间久了,其他不太常见的数据的规模也积累起来了,形成了数据集d2,其与样例数据集e1合并组成新的训练集{d1,e1}进行增量过程,对初始模型m1的扩展,如下图3所示,针对增量扩展模型m2,其由四部分构成,第一部分为来自上一阶段的模型m1的特征提取器f1,并在后续训练过程中保持其冻结状态,使得新模型保持旧模型的全部性能;第二部分为特征传导层,利用f1已经学习到的知识传递给第三部分新的特征提取器,使得网络更快收敛;第三部分为m2中新的特征提取器,其保证了新模型具有全新的学习能力;第四部分为分类器c2,因为模型识别类别增加,分类器需要重新训练,详见第(6)步。
71.(5)在增量训练过程完成后,模型m2需要进行n1+1,....n2+n1这n2种新类别的样例选择,因存储空间有k个上限,需要对原有样例进行剔除将按照以下规则进行剔除:
72.a)针对每一类数据i∈[2,n1],对于其“利用”部分的样例,剔除其靠后的个数据,对于“探索”部分样例随机剔除的数据;
[0073]
b)对于新类别数据集d2采用步骤3操作,进行新的样例选择以组成样例数据集e2。
[0074]
(6)针对上述获得的样例数据集e2,重新训练分类器c2,利用反向传播算法,优化器为adam,学习率为0.01,损失函数为交叉熵函数。将训练完成的c2与特征提取器f2结合获得增量完成后的m2模型,m2将同时具备识别旧类别(d1)和新类别(d2)的能力。上述为一个完整的类别增量学习过程。后续类别增量过程将重复步骤(4)-(6)。
[0075]
在一些实施例中,所述训练好的机器学习模型是通过下述步骤训练得到的:
[0076]
获取心电信号训练数据集;
[0077]
将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型。
[0078]
在一些实施例中,所述获取心电信号训练数据集,包括:
[0079]
获取初始心电信号数据集;
[0080]
对所述初始心电信号数据集的心电信号数据进行标注,得到标注心电信号数据集;
[0081]
对所述标注心电信号数据集中的心电信号数据依次进行中值滤波、滑动平均滤波及心拍分割处理,得到所述心电信号训练数据集。
[0082]
在一些实施例中,所述将所述初始心电信号数据集输入到机器学习模型中,对所
述机器学习模型进行训练,得到所述训练好的机器学习模型,包括:
[0083]
将所述心电信号训练数据集中的数据进行分类,得到第一分类心电信号数据,所述第一分类心电信号数据包括n1类,其中,第1类为预设心拍集,在后续增量中仍会出现,第2-n1类为对应的n
1-1种目标心拍集;
[0084]
将所述第一分类心电信号数据输入到机器学习模型,对所述机器学习模型进行训练直到所述机器学习模型对所述第一分类心电信号数据达到预设指标,得到初始训练模型;
[0085]
对所述初始训练模型进行扩增,得到扩增训练模型,所述扩增训练模型包括所述初始训练模型的第一特征提取器,所述第一特征提取器在后续训练过程中保持其冻结状态、特征传导层、第二特征提取器及分类器,其中,所述特征传导层利用已经学习到的知识传递给所述第二特征提取器,以使所述第二特征提取器具有全新的学习能力;
[0086]
对所述扩增训练模型进行n2种类别的样例选择,得到所述训练好的机器学习模型。
[0087]
本实施例中的在后续增量中仍会出现是因为心电数据不同类别间出现频率差距很大,这里的第一类是指正常的心拍,在数据收集过程中必定出现。
[0088]
需要说明的是,本技术实施例提供的数据分类方法,执行主体可以为数据分类装置,或者该数据分类装置中的用于执行数据分类的方法的控制模块。本技术实施例中以数据分类装置执行数据分类的方法为例,说明本技术实施例提供的数据分类的装置。
[0089]
在本技术实施例的第二方面,提供一种数据分类装置,包括:
[0090]
第一获取模块,用于获取待分类心电信号数据;
[0091]
第一输入模块,用于将所述待分类心电信号数据输入到训练好的机器学习模型中,得到多种类别心电信号数据集,每一种心电信号数据集中的心电信号数据在预设心拍范围内。
[0092]
在一些实施例中,所述训练好的机器学习模型是通过下述步骤训练得到的:
[0093]
第二获取模块,用于获取心电信号训练数据集;
[0094]
第二输入模块,用于将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型。
[0095]
在一些实施例中,所述获取心电信号训练数据集,包括:
[0096]
第三获取模块,用于获取初始心电信号数据集;
[0097]
标注模块,用于对所述初始心电信号数据集的心电信号数据进行标注,得到标注心电信号数据集;
[0098]
预处理模块,用于对所述标注心电信号数据集中的心电信号数据依次进行中值滤波、滑动平均滤波及心拍分割处理,得到所述心电信号训练数据集。
[0099]
在一些实施例中,所述将所述初始心电信号数据集输入到机器学习模型中,对所述机器学习模型进行训练,得到所述训练好的机器学习模型,包括:
[0100]
分类模块,用于将所述心电信号训练数据集中的数据进行分类,得到第一分类心电信号数据,所述第一分类心电信号数据包括n1类,其中,第1类为预设心拍集,在后续增量中仍会出现,第2-n1类为对应的n
1-1种目标心拍集;
[0101]
第三输入模块,用于将所述第一分类心电信号数据输入到机器学习模型,对所述
机器学习模型进行训练直到所述机器学习模型对所述第一分类心电信号数据达到预设指标,得到初始训练模型;
[0102]
扩增模块,用于对所述初始训练模型进行扩增,得到扩增训练模型,所述扩增训练模型包括所述初始训练模型的第一特征提取器,所述第一特征提取器在后续训练过程中保持其冻结状态、特征传导层、第二特征提取器及分类器,其中,所述特征传导层利用已经学习到的知识传递给所述第二特征提取器,以使所述第二特征提取器具有全新的学习能力;
[0103]
样例选择模块,用于对所述扩增训练模型进行n2种类别的样例选择,得到所述训练好的机器学习模型。
[0104]
本技术实施例中的数据分类装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,非移动电子设备可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
[0105]
本技术实施例中的数据分类装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
[0106]
本技术实施例提供的数据分类装置能够实现图1-3的方法实施例实现的各个过程,为避免重复,这里不再赘述。
[0107]
可选地,如图4所示,本技术实施例还提供一种电子设备400,包括处理器401,存储器402,存储在存储器402上并可在所述处理器401上运行的程序或指令,该程序或指令被处理器401执行时实现上述数据分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0108]
需要说明的是,本技术实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
[0109]
图5为实现本技术实施例的一种电子设备的硬件结构示意图。
[0110]
该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、以及处理器510等部件。
[0111]
本领域技术人员可以理解,电子设备500还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
[0112]
应理解的是,本技术实施例中,输入单元504可以包括图形处理器(graphics processing unit,gpu)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元506可包括显示面板5061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板
5061。用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器509可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
[0113]
本技术实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述数据分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0114]
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等。
[0115]
本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述数据分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0116]
应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
[0117]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
[0118]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0119]
上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1