一种胎儿心率状态分类方法与流程

文档序号:11697625阅读:163来源:国知局

本发明涉及胎儿心率判断领域,特别是一种胎儿心率状态分类方法。



背景技术:

胎心率曲线及其变化是目前判断胎儿在子宫内的状态最常用的手段,通过胎心率信号所记录瞬间的胎儿心率变化形成的图形曲线,可以推测胎儿在子宫内的状态。依靠计算机进行胎心率与宫缩描记图的自动分析可以克服判断者自身经验和自身差异所带来的主观性的差异,提高胎心率监护的临床价值。依靠计算机从胎心率中诊断胎儿状态,首先最重要的是提取有用的特征,然后作为分类器的输入训练出模型,最后加以判断输出。目前胎儿心率的特征提取主要是提出胎心率的平均、胎心率的变异、胎心率的减速和加速以及胎心率的移动情况作为判断的标准。提取特征之后作为分类器的输入,通过训练出模型,然后对新来的样本进行预测。目前机器学习方法在胎心率信号判断中大量运用,并且取得了不错的效果,但这些机器学习模型大多无法去解释。虽然一些模型在胎心率判断中得到使用,例如贝叶斯、决策树、逻辑回归具有高度的可解释性,但它们已经被证明效果不好。



技术实现要素:

有鉴于此,本发明的目的是提出一种胎儿心率状态分类方法,不仅可以保证较高的分类准确性,还可以更直观地观察到不同种类的胎儿心率之间的差异,使结果具有一定的可解释性。

本发明采用以下方案实现:一种胎儿心率状态分类方法,具体包括以下步骤:

步骤s1:进行胎儿心率的特征提取,所述胎儿心率的特征包括胎心率的平均、胎心率的变异、胎心率的减速、胎心率的加速以及胎心率的移动情况;

步骤s2:采用smote算法对步骤s1提取的特征样本进行预处理,解决样本不平衡的问题;

步骤s3:将随机森林分类器应用到从胎心率曲线中提取的特征中,获得两两样本间的相似性;

步骤s4:提出t-sne流形学习算法,从得到的相似性矩阵中产生一个低维嵌入的流形,作为随机森林分类器的输入,最后输出分类结果。

进一步地,步骤s3具体包括以下步骤:

步骤s31:给定由k棵决策树组成的随机森林模型f={t1,t2,...,tk},其中tk代表随机森林模型中的某棵决策树;

步骤s32:令di={t1i,t2i,...,tki}和dj={t1j,t2j,...,tkj}分别表示第i样本点xi和第j个样本点xj落在随机森林中的叶子节点位置;

步骤s33:计算样本点xi与xj的相似性度量,采用下式:

其中,

进一步地,所述步骤s4具体包括以下步骤:

步骤s41:随机森林模型从不同样本数据中学习出相似性度量矩阵;采用t-sne流形学习方法从所述相似性度量矩阵中学习一个低维空间表示,达到可视化的目的;

步骤s42:随机森林模型训练通过t-sne降维之后的数据,测试样本通过映射到这个空间来推断该样本数据的标签。

与现有技术相比,本发明有以下有益效果:通过本发明的这种方法,不仅可以保证较高的分类准确性,而且可以更直观地观察到不同种类的胎儿心率之间的差异,使结果具有一定的可解释性。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

在本实施例中,由于在实际应用中,会出现不同类别的胎心率样本不平衡的问题,这将导致糟糕的分类结果。因此,本实施例在第一个阶段先做样本数据的预处理,解决样本不平衡的问题。在此框架中,本实施例首先将随机森林分类器应用到从胎心率曲线中提取的特征中,获得两两样本间的相似性。然后提出t-sne流形学习算法,从得到的相似性矩阵中产生一个低维嵌入的流形,作为随机森林分类器的输入,最后输出分类结果,具体过程如图1所示。

本实施例的详细步骤如下:

1、首先进行胎儿心率的特征提取,提取出胎心率的平均、胎心率的变异、胎心率的减速和加速以及胎心率的移动情况等特征。

2、预处理。训练数据集不平衡在模式识别中会造成很多问题。比如,如果数据不平衡,那么分类器使得它的准确率最高更偏向于比例高的样本。为了解决这个问题,采用smote方法。

3、随机森林相似性度量的学习。相似性度量是随机森林内部基于决策树组合的方法去评价两个样本间的相似性。例如有两个样本(x1,y1)和(x2,y2),其中x1、x2分别表示两个样本的输入特征,y1、y2分别表示输出标签。在随机森林模型中,相似性度量是当这个数据点落到一棵树上的同一个叶子节点时,它们的相似性在这棵树上就被判为1,否则判为0。累计随机森林中所有决策树的判定,最后做归一化处理。给定由k棵决策树组成的随机森林模型f={t1,t2,...,tk},其中tk代表随机森林模型中的某棵决策树。令di={t1i,t2i,...,tki}和dj={t1j,t2j,...,tkj}分别表示第i样本点xi和第j个样本点xj落在随机森林中的叶子节点位置;对于两个样本点xi和xj相似性度量计算公式表示为下式:

其中

4、基于t-sne降维的可视化随机森林。随机森林从不同样本数据中学习出相似性度量矩阵。t-sne流形学习方法从中学习一个低维空间表示,达到可视化的目的。基于t-sne的降维可视化随机森林算法首先计算随机森林相似性度量,然后t-sne降维可视化。

5、随机森林训练通过t-sne降维之后的数据,最后,测试样本通过映射到这个空间用来推断该样本数据的标签。

本实施例不仅可以保证较高的分类准确性,而且可以更直观地观察到不同种类的胎儿心率之间的差异,使结果具有一定的可解释性。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。



技术特征:

技术总结
本发明涉及一种胎儿心率状态分类方法,首先将随机森林分类器应用到从胎心率曲线中提取的特征中,获得两两样本间的相似性。然后提出t‑SNE流形学习算法,从得到的相似性矩阵中产生一个低维嵌入的流形,作为随机森林分类器的输入,最后输出分类结果。本发明不仅可以保证较高的分类准确性,还可以更直观地观察到不同种类的胎儿心率之间的差异,使结果具有一定的可解释性。

技术研发人员:黄立勤;马源
受保护的技术使用者:福州大学
技术研发日:2017.03.31
技术公布日:2017.07.18
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1