数据预处理方法、装置、训练系统、穿戴设备及存储介质与流程

文档序号:22679115发布日期:2020-10-28 12:38阅读:95来源:国知局
数据预处理方法、装置、训练系统、穿戴设备及存储介质与流程

本发明涉及检测领域,具体涉及数据预处理方法、装置、训练系统、穿戴设备及存储介质。



背景技术:

近年来,随着信息技术的不断发展,基于深度神经网络(deepneuralnetwork)的识别方法在分类领域取得了巨大的成功,应用领域也衍伸到各行各业。深度神经网络训练流程通常为将训练样本输入深度神经网络模型,经过深度神经网络处理输出分类结果与训练样本值进行比较,得到损失函数计算出的网络损失,然后将网络损失回传给深度神经网络,修正深度神经网络上各层的参数,重复上述步骤,直到该网络损失满足一定的收敛条件,则认为达到了深度神经网络的优化目标,训练结束。通常网络损失以最小化为优化目标。在现有的医学领域对深度神经网络进行训练时,大多采用的输入训练数据的方式为从采集到的整段数据的开始端开始逐一输入,直到结束端输入完成为止,采用该种训练数据输入方式,需要大量的训练数据样本才能实现可用的效果。但是医学数据需要基于人体采集,特别是一些判断疾病的信息还不易采集,其特殊性导致了其采集和标记的工作量较大,给医学领域的深度神经网络训练到可用的地步增加了难度。



技术实现要素:

本发明所要解决的技术问题是采用很少的训练样本让深度神经网络达到可用的目的,目的在于提供数据预处理方法、装置、训练系统、穿戴设备及存储介质,通过提取ecg波形上的rr间期,且rr间期不需要进一步提特征,并处理为特定形式后,再送入相应的深度神经网络进行训练,实现心脏节律分类,用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。

本发明通过下述技术方案实现:

第一方面,本发明公开了一种数据预处理方法,通过该方法处理后的数据用

于送入深度神经网络进行训练,实现心脏节律分类,包括如下步骤:

采集ecg波形上第k-1到第k个r的间期,或者采集ecg波形上第k到第k+1个r的间期,k>1;连续采集m个上述rr间期直接作为一个输入样本,或者连续采集m个上述归一化处理后的rr间期作为一个输入样本,m>0;将上述输入样本以1×1×m的三维形式输入cnn深度神经网络模型,或者将上述输入样本以m×1×1的三维形式输入cnn深度神经网络模型,或者将上述输入样本分解为m个1×1的点对应送入rnn深度神经网络模型上的m个rnn基本神经单元。

第二方面,本发明公开了一种数据预处理装置,通过该装置处理后的数据用于送入深度神经网络进行训练,实现心脏节律分类,包括r间期采集处理单元:用于采集ecg波形上第k-1到第k个r的间期,或者采集ecg波形上第k到第k+1个r的间期,k>1;

样本成型单元:连续采集m个上述rr间期直接作为一个输入样本,或者连续采集m个上述归一化处理后的rr间期作为一个输入样本,m>0;输入样本格式处理单元:将上述输入样本以1×1×m的三维形式输入cnn深度神经网络模型,或者将上述输入样本以m×1×1的三维形式输入cnn深度神经网络模型,或者将上述输入样本分解为m个1×1的点对应送入rnn深度神经网络模型上的m个rnn基本神经单元。

第三方面,本发明公开了一种训练系统,包括数据预处理装置:用于提取ecg波形上的特征点,组成一个输入样本,然后将输入样本处理为特定形式;训练模块:将数据预处理装置处理为特定形式的输入样本,送入对应的深度神经网络模型进行训练,调整深度神经网络模型中的滤波器权重,直到损失函数判断调整后的滤波器权重满足要求为止。

优选的,所述数据预处理装置包括r间期采集处理单元:用于采集ecg波形上第k-1到第k个r的间期,或者采集ecg波形上第k到第k+1个r的间期,k>1;

样本成型单元:连续采集m个上述rr间期直接作为一个输入样本,或者连续采集m个上述归一化处理后的rr间期作为一个输入样本,m>0;输入样本格式处理单元:将上述输入样本以1×1×m的三维形式输入cnn深度神经网络模型,或者将上述输入样本以m×1×1的三维形式输入cnn深度神经网络模型,或者将上述输入样本分解为m个1×1的点对应送入rnn深度神经网络模型上的m个rnn基本神经单元。

第四方面,本发明公开了一种穿戴设备,包括上述任意一项所述数据预处理装置或者训练系统。

第五方面,本发明公开了一种存储介质,包含有计算机程序指令,所述计算机程序指令被处理器执行以实现上述任意一项所述数据预处理装置或者训练系统所具备的模块功能。

本发明与现有技术相比,具有如下的优点和有益效果:

本发明选取采集和标记都更容易的rr间期作为训练特征,且rr间期不需要进一步提特征,然后对选取的rr间期或者归一化处理后的rr间期处理为特定的数据形式后,送入对应的深度神经网络进行训练,并且即便是不同的采样率,都可采用同一深度神经网络模型,无需再更换深度神经网络模型,即可实现心脏节律分类,用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:

图1为本发明的流程图;

图2为本发明的原理框图;

图3为一种cnn型深度神经网络结构原理框图;

图4另一种cnn型深度神经网络结构原理框图;

图5为r间期作为模型输入的rnn结构原理框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。

实施例1:

如图1所示,本发明公开了一种数据预处理方法,通过该方法处理后的数据

用于送入深度神经网络进行训练,实现心脏节律分类,包括如下步骤:

步骤s1:采集ecg波形上第k-1到第k个r的间期,或者采集ecg波形上第k到第k+1个r的间期,k>1,k为正整数;其中ecg波形可以为原始ecg波形或者是滤波后的ecg波形。

步骤s2:连续采集m个上述rr间期直接作为一个输入样本,或者连续采集m个上述归一化处理后的rr间期作为一个输入样本,m>0;其中rr间期是指相邻两个r波波峰之间的时间差。m为大于零的正整数。其中m个rr间期进行归一化处理,处理方式可选为rr间期除以采样率fs。fs为能保存必要波形特征的采样率,fs本领域技术人员可以根据经验值得到。

步骤s3:将上述输入样本以1×1×m的三维形式输入cnn深度神经网络模型,则输出1×1的二维数据;或者将上述输入样本以m×1×1的三维形式输入cnn深度神经网络模型,或者将上述输入样本分解为m个1×1的点对应送入rnn深度神经网络模型上的m个rnn基本神经单元,则输出结果y的大小为1×1。

例如一种可用的cnn深度神经网络模型包括2层卷积层,每层卷积层后都要进行最大池化处理,进行最后一次最大池化处理后,将该三维形式展开成一维,再经过两个全连接层,最后取最大值或阈值判断后输出结果。另一种可用的cnn深度神经网络模型包括2层卷积层,2层全连接层,最后取最大值或阈值判断后输出结果。一种可用的rnn循环神经网络模型,包括x层循环神经网络层,其基本神经单元为rnn单元,rnn单元有m×x,m和x为正整数,其中rnn基本神经单元结构包括传统的rnn、lstm或门控循环单元gru等。也可以采用其它可用的cnn深度神经网络模型或rnn循环神经网络模型。

由于医学数据需要基于人体采集,特别是一些判断疾病的信息还不易采集标记,其特殊性导致了其采集和标记的工作量较大,给医学领域的深度神经网络训练到可用的地步增加了难度。

本发明选取采集和标记都更容易的rr间期作为训练特征,且rr间期不需要进一步提特征,然后对选取的rr间期或者归一化处理后的rr间期处理为特定的数据形式后,送入对应的深度神经网络进行训练,并且即便是不同的采样率,都可采用同一深度神经网络模型,无需再更换深度神经网络模型,即可实现心脏节律分类,用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。

实施例2:

如图2所示,本发明还公开了一种数据预处理装置,通过该装置处理后的数据用于送入深度神经网络进行训练,实现心脏节律分类,包括处理器、存储器、r间期采集处理单元、样本成型单元和输入样本格式处理单元。

其中,r间期采集处理单元:用于采集ecg波形上第k-1到第k个r的间期,或者采集ecg波形上第k到第k+1个r的间期,k>1;k为正整数。其中ecg波形可以为原始ecg波形或者是滤波后的ecg波形。

样本成型单元:连续采集m个上述rr间期直接作为一个输入样本,或者连续采集m个上述归一化处理后的rr间期作为一个输入样本,m>0;

输入样本格式处理单元:将上述输入样本以1×1×m的三维形式输入cnn深度神经网络模型,则输出1×1的二维数据;或者将上述输入样本以m×1×1的三维形式输入cnn深度神经网络模型,或者将上述输入样本分解为m个1×1的点对应送入rnn深度神经网络模型上的m个rnn基本神经单元,则输出结果y的大小为1×1。

例如一种可用的cnn深度神经网络模型包括2层卷积层,每层卷积层后都要进行最大池化处理,进行最后一次最大池化处理后,将该三维形式展开成一维,再经过两个全连接层,最后取最大值或阈值判断后输出结果。另一种可用的cnn深度神经网络模型包括2层卷积层,2层全连接层,最后取最大值或阈值判断后输出结果。一种可用的rnn循环神经网络模型,包括x层循环神经网络层,其基本神经单元为rnn单元,rnn单元有m×x,m和x为正整数,其中rnn基本神经单元结构包括传统的rnn、lstm或门控循环单元gru等。也可以采用其它可用的cnn深度神经网络模型或rnn循环神经网络模型。

本装置本发明选取采集和标记都更容易的rr间期作为训练特征,且rr间期不需要进一步提特征,然后对选取的rr间期或者归一化处理后的rr间期处理为特定的数据形式后,送入对应的深度神经网络进行训练,并且即便是不同的采样率,都可采用同一深度神经网络模型,无需再更换深度神经网络模型,即可实现心脏节律分类,用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。

实施例3:

本发明还公开了一种训练系统,包括

数据预处理装置:用于提取ecg波形上的用于判断疾病的特征点,组成一个输入样本,然后将输入样本处理为特定形式;

训练模块:将数据预处理装置处理为特定形式的输入样本,送入对应的深度神经网络模型进行训练,调整深度神经网络模型中的滤波器权重,直到损失函数判断调整后的滤波器权重满足要求为止。

如图3-5所示,深度神经网络模型可以为cnn深度神经网络或rnn循环神经网络。其中cnn深度神经网络模型包括2层卷积层,每层卷积层后都要进行最大池化处理,进行最后一次最大池化处理后,将该三维形式展开成一维,再经过两个全连接层,最后取最大值或阈值判断后输出结果。例如如图3所示,一种cnn模型,当输入样本为m×1×1,先通过输入层输入将数据预处理装置传送过来的m×1×1的输入样本,m为rr间期的个数;然后经过第一卷积层f=5×1×1×32,即filter数量为32,filter大小为5×1×1,移动的步长s=1,输出结果为m×1×32的三维形式;然后经过第一最大池化层f=2×1,即window大小为2×1,移动步长s=2,输出池化结果为m/2×1×32的三维形式;然后经过第二卷积层f=5×1×32×64,即filter数量为64,filter大小为5×1×32,移动的步长s=1,输出结果为m/2×1×64的三维形式;然后经过第二最大池化层f=2×1,即window大小2×1,移动步长s=2,输出池化结果为m/4×1×64的三维形式;最后经过两个全连接层,依次得到256个数值的一维向量和大小为v×1的数据,v代表分类数,1代表输出结果的个数,然后取最大值或阈值判断后输出最后结果1×1,其中卷积层、最大池化层以及全连接层与现有深度神经网络中的各层作用相同,属于现有技术,这里就不再复述。如图4所示,为当输入样本为1×1×m的cnn模型,通过输入层输入将数据预处理装置传送过来的1×1×m的输入样本,m为rr间期的个数;然后经过第一卷积层f=1×1×m×32,即filter数量为32,filter大小为1×1×m,移动的步长s=1,输出卷积结果为1×1×32的三维形式;然后经过第二卷积层f=1×1×32×64,即filter数量为64,filter大小为1×1×32,移动的步长s=1,输出卷积结果为1×1×64的三维形式;最后将该三维形式展开成一维,再经过两个全连接层,依次得到256个数值的一维向量和大小为v×1的数据,v代表分类数,1代表输出结果的个数,然后取最大值或阈值判断后输出最后结果1×1。一种rnn循环神经网络,其基本神经单元为rnn单元,rnn单元有m个,m为正整数,其中rnn基本神经单元结构包括传统的rnn、lstm或门控循环单元gru等。一种crnn模型结构包括卷积神经网络cnn和循环神经网络rnn,其中卷积神经网络包括2层卷积层,每层卷积层后都要进行最大池化处理,进行最后一次最大池化处理后还要经过全连接层,再传输给循环神经网络rnn,如图3所示cnn网络结构不要虚线框内的部分。

进一步优选的,所述数据预处理装置包括

r间期采集处理单元:用于采集ecg波形上第k-1到第k个r的间期,或者采集ecg波形上第k到第k+1个r的间期,k>1;

样本成型单元:连续采集m个上述rr间期直接作为一个输入样本,或者连续采集m个上述归一化处理后的rr间期作为一个输入样本,m>0;

输入样本格式处理单元:将上述输入样本以1×1×m的三维形式输入cnn深度神经网络模型,或者将上述输入样本以m×1×1的三维形式输入cnn深度神经网络模型,或者将上述输入样本分解为m个1×1的点对应送入rnn深度神经网络模型上的m个rnn基本神经单元。

目前针对rr间期多用的普通的机器学习方法,需要进一步提特征,且识别结果不够好,本系统本发明选取采集和标记都更容易的rr间期作为训练特征,且rr间期不需要进一步提特征,然后对选取的rr间期或者归一化处理后的rr间期处理为特定的数据形式后,送入对应的深度神经网络进行训练,并且即便是不同的采样率,都可采用同一深度神经网络模型,无需再更换深度神经网络模型,即可实现心脏节律分类,用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。通过本发明方法训练的训练系统,输入是rr间期,不需要进一步提特征,并且能够用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。

完成训练后的系统,通过心脏节律分类,医生可用于检测节律相关的疾病检测,比如房颤、房扑、心律失常等,检测结果可信度高。这是由于该训练系统训练所用rr间期数据少,且rr间期采集标记容易,数据的可靠性高,大大降低了整个训练系统占用空间以及训练时间,方便移植到移动终端、固定终端,特别是应用到医学领域存储空间有限的小型便携式健康监测设备上,意义重大。

实施例4:

本发明公开了另一种穿戴设备,包括上述任意实施例所述数据预处理装置或者训练系统。带有该训练系统的可穿戴设备可以更好的收集使用者的数据,不断的优化训练系统,不断的提高检测结果的准确性,实现了采用很少的训练样本让深度神经网络达到可用的目的,大大降低了医学领域的深度神经网络训练难度。

实施例5:

本发明公开了另一种存储介质,包含有计算机程序指令,所述计算机程序指令被处理器执行以实现上述任意实施例所述数据预处理装置或者训练系统所具备的模块功能。该存储介质方便移植到各种设备上,实现了采用很少的训练样本让深度神经网络达到可用的目的,大大降低了医学领域的深度神经网络训练难度。

综上所述,本发明提供了数据预处理方法、装置、训练系统、穿戴设备及存储介质,本发明选取采集和标记都更容易的rr间期作为训练特征,且rr间期不需要进一步提特征,然后对选取的rr间期或者归一化处理后的rr间期处理为特定的数据形式后,送入对应的深度神经网络进行训练,并且即便是不同的采样率,都可采用同一深度神经网络模型,无需再更换深度神经网络模型,即可实现心脏节律分类,用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。而目前针对rr间期多用的普通的机器学习方法,需要进一步提特征,且识别结果不够好,通过本发明方法训练的训练系统,输入是rr间期,不需要进一步提特征,并且能够用很少的rr间期数,达到甚至超过采用较多rr间期数的传统的机器学习算法。

通过该方法训练的训练系统,结构简单,占用内存小,可移植性强,非常适合在适于移植到便携式检测设备中进行在线应用,如智能手表、手链、脚链、手环、动态心电监测设备上使用。

本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于计算机可读存储介质中,该程序在执行时,可以包括如上述各方法的实施例的流程。其中,所述的存储介质可以是只读存储记忆体、随机存储记忆体、磁盘或光盘等。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1