一种基于心电信号动态自更新样本的身份识别方法

文档序号：6552089阅读：252来源：国知局

一种基于心电信号动态自更新样本的身份识别方法
【专利摘要】本发明涉及一种基于心电信号的动态自更新样本的身份识别方法，用于通过采集个人的心电信号来识别及验证个人的身份信息。属于生物特征身份识别【技术领域】。其特征在于：首先，利用个人心电信号的R波位置分割出心搏周期信号，其次，通过离散余弦变换提取特征向量，然后，使用一个两层决策分类器进行个人身份识别，最后，判断输入的个人心电信号的所属身份，并根据成功识别的样本进行反馈，定期更新样本库，保证算法在长期时间能正常有效地运作。算法包括了四个模块：预处理及特征向量提取模块、训练学习模块、匹配识别模块、样本评估更新模块。
【专利说明】-种基于心电信号动态自更新样本的身份识别方法

【技术领域】：
[0001] 本发明涉及一种基于心电信号的动态自更新样本的身份识别方法，属于生物特征身份识别【技术领域】，主要适用于通过采集个人心电信号来识别及验证个人的身份信息。

【背景技术】：
[0002] 心电信号（Electrocardiogram, ECG)有着以下的优点：
[0003] 1.任何人都有心电，具有普遍性；
[0004] 2.心电是人的心脏跳动产生的生物电势，来自于人的心脏，不易被轻易仿制，与指纹和人脸等相比，具备高安全性；
[0005] 3.心电信号因人而异，不同的心脏位置、大小、形状、胸部构造、年龄、性别、体重等因素造成了心电信号的差异，心电信号具有唯一性的特点；
[0006] 4.心电信号可以通过体表电极方便的采集，具有可采集性；
[0007] 5.在较长时间内，同一个人的心电信号往往十分相似，心电信号具有稳定性。
[0008] 综上所述，心电信号具有惟一的、显著的生物特征，因此，心电信号可以作为一种生物特征，用来识别人的身份。使用心电信号进行身份识别，除上述特点之外还具有以下优点：心电信号是一维信号，处理简单，数据量小，节省存储空间；心电信号的异常诊断领域研究多年，去噪、滤波、QRS波定位等均有成熟的算法。
[0009] 目前心电身份识别算法分为基于基点检测的特征提取方法和非基点检测的特征提取方法。其中，较为常见的为基于多基点检测的特征提取方法。基于多基点检测的特征提取方法是通过提取P、R、T波振幅和PR、QRS、QT、ST间期及P波间期等作为身份识别的样本数据，计算繁琐复杂、不易操作。真实心电信号在基点处也可能存在着多个极点，特征提取的精度也受传感器噪声的影响。因此，基点检测困难，算法准确度受到很大限制。
[0010] 此外，虽然心电信号在较长时间内具有稳定性，但当时间跨度较大时，同一个人的心电信号模式并非一成不变的：由于体质变化、健康状况或年龄变化等因素，心电信号可能会发生一定的微小变化。随着时间跨度的不断增加，微小变化得到累积，原有的样本库中的样本不能很好地代表用户的心电模式。为了保证心电信号身份识别系统能够长期正常运作，当个体心电信号模式在长时间内逐渐变化时，有必要对系统的样本库和决策模型进行更新。而目前的心电身份识别算法中，均需要人为的重新采样及重新训练决策模型，操作繁琐。

【发明内容】
：
[0011] 本发明的目的在于提供一种基于心电信号的动态自更新样本的身份识别方法，可以通过采集用户的心电数据进行身份识别及验证，同样也适用于其他生理信号身份识别的类似应用中。
[0012] 本发明使用的相关理论包括：心电数据前期处理、离散余弦变换、随机森林的应用。
[0013] 本发明提出的基于心电信号的动态自更新样本的身份识别方法主要包括四个模块：预处理及特征向量提取模块、训练学习模块、匹配识别模块、样本评估更新模块。其中，训练学习阶段包括心电信号预处理及特征向量提取模块和训练学习模块，该阶段将所有用户个人的心电数据进行处理，提取出心电信号特征向量存入样本库，并生成随机森林模型；匹配识别阶段包括心电信号预处理及特征向量提取模块和匹配识别模块，在该阶段中输入待识别用户个人的心电数据，将提取的心电信号特征向量通过两层决策分类器，得到识别结果；样本评估更新阶段包括样本评估更新模块，该阶段将成功识别的样本暂存于另一样本库，并定期进行样本的评估，以更有效地代表用户的样本替换失效的旧样本，更新样本库，并重新训练随机森林模型，以保证身份识别算法在长期能正常有效地运作。
[0014] 本发明提出的基于心电信号的动态自更新样本的身份识别方法在应用上分为三个阶段：
[0015] 1训练学习阶段：
[0016] 1. 1心电数据采集。对每个用户个人在不同时间采集多段具有一定时长的心电数据，并记录样本的采集时间。
[0017] 1. 2心电信号预处理及特征向量提取。对所有输入的个人心电数据进行预处理及周期分割。对处理后的数据进行离散余弦变换（DCT变换），提取特征向量。
[0018] 1.3心电信号样本库的建立。将变换后的特征向量与用户个人一一对应，存入数据库。
[0019] 1. 4使用两层决策分类器（随机森林-最近邻分类器）对数据进行第一层随机森林决策层的训练学习。
[0020] 2匹配识别阶段：
[0021] 2.1心电数据采集。对待识别用户个人采集心电数据。
[0022] 2. 2心电信号预处理及特征向量提取。对输入的个人心电数据进行预处理及周期分割。对处理后的信号进行离散余弦变换（DCT变换），提取特征向量。
[0023] 2. 3心电信号匹配识别。将提取后的特征向量使用两层决策分类器（随机森林-最近邻分类器），得到决策结果。
[0024] 3样本评估更新阶段：
[0025] 3. 1成功识别的样本的保存。对成功识别的样本，将其保存在近期识别成功样本库中。
[0026] 3. 2定期的样本评估更新。检查原心电信号样本库及近期识别成功样本库，评估原心电信号样本库的样本是否仍能有效地代表用户的心电信号模式。若存在偏离度较高的样本，则在近期识别成功样本库中寻找最优样本进行替换。完成心电信号样本库的更新，并重新训练随机森林模型。
[0027] 本发明中涉及的基于心电信号的动态自更新样本的身份识别方法与上述技术的不同之处，在于只需检测R波位置，无需进行其他复杂的基点检测；利用R波位置分割出心搏周期信号，通过离散余弦变换（DCT)提取特征向量，通过一个两层决策分类器（随机森林-最近邻分类器）进行身份识别，判断输入信号的所属身份；增加了样本评估更新模块，根据成功识别的样本进行评估，并进行反馈，更新样本库，保证身份识别算法在长期时间内能正常有效地运作。本发明的算法结构示意图如图1所示。
[0028] 本发明的优点在于：
[0029] 1)只需检测R波位置，无需进行其他复杂的基点检测，而R波为正常人心电波形中幅值最大的波段，检测简单，定位准确。有效地避免了因其他复杂基点定位不准而导致算法准确率下降的情况。
[0030] 2)特征提取采用了离散余弦变换进行，离散余弦变换具有快速算法，可以加快运算速度。使得该算法在单片机、智能手机等嵌入式平台上也能正常运作。
[0031] 3)识别决策时采用随机森林-最近邻分类器进行。对于大的样本库，第一层的随机森林决策层将预选范围大大减小，在保证准确度的同时很好的保证了匹配的速度，第二层的最近邻决策层进一步提高了准确度，并在很大程度上减少第一层中随机森林所需的决策树数目，提高了训练效率。
[0032] 4)以国际权威心电数据库MIT-BIH Normal Sinus Rhythm Database作为测试，对数据库里每个个体ECG记录截取不同时间点共100次心搏周期的心电信号进行交叉验证。实验结果表明，平均准确率达99%以上，误拒率为2. 5%以下，符合身份识别的要求。
[0033] 5)样本评估更新模块的增设，使得当用户心电模式发生微小变化时，样本库中的样本能够自动更新，决策模型自动调整。克服了其他算法中在长时间后识别率下降的问题，保证身份识别算法在长期时间内能正常有效地运作，也省去了人工重新采样的步骤。

【专利附图】

【附图说明】：
[0034] 图1是本发明提出的算法结构示意图；
[0035] 图2是预处理及特征向量提取模块的流程图；
[0036] 图3是训练学习模块的流程图；
[0037] 图4是匹配识别模块的流程图；
[0038] 图5是样本评估更新模块的流程图。具体实施方案：
[0039] 为进一步详细表述本发明的实施步骤，下面将结合附图对本发明的实施方式作进一步的说明。
[0040] 本发明提出了一种基于心电信号的动态自更新样本的身份识别方法，可以分为四个模块，如图1所示，该方法包括：
[0041] 101 :预处理及特征向量提取模块；
[0042] 102 :训练学习模块；
[0043] 103:匹配识别模块；
[0044] 104 :样本更新评估模块。
[0045] 预处理及特征向量提取模块：
[0046] 201 :对心电数据进行滤波。对采集的心电波形进行滤波，以消除工频干扰、肌电干扰、基线漂移等不利影响。使用截止频率30Hz，带宽3dB的巴特沃兹低通滤波器消除工频干扰及高频干扰，然后使用截止频率为1Hz的巴特沃兹低通滤波器检测基线信号，并用信号减去基线信号以消除基线漂移。
[0047] 202 :检测R波位置，以相邻的R波位置进行分割，提取得到多个完整的周期信号。 R波检测的方法为对信号作一阶差分，利用R波幅度大且斜率高的特点，寻找局部极大值，并根据阈值排除干扰。
[0048] 203 :波形的规范化。由于心电采集设备的采集频率、采集人的身体状态等因素的影响，心电波形存在一定的不同。为了消除这些不同，要对分割后的心搏周期信号进行波形的规范化。波形的规范化分为时轴上的规范化和电压轴上的规范化。
[0049] a)时间轴上的规范化：将心率规范为60次/min，即心搏周期时间规范为ls，也即将每个周期信号采样点规范为sfreq个（其中，sfreq为心电采集设备的采样频率）。这样可以减小不同心跳速率对识别的不利影响。
[0050] 记提取的心搏周期信号序列{a[n]}长度为1，心电采集设备采样频率为sfreq，经时间轴上的规范化后输出lb [η]}:

【权利要求】
1. 一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：利用个人心电信号的R波位置分割出心搏周期信号，通过离散余弦变换提取心电特征向量，使用一个两层决策分类器进行个人身份识别，判断输入的个人心电信号的所属个人身份，并根据成功识别的样本进行反馈，定期更新样本库，保证算法在长期时间能正常有效地运作。算法包括了四个模块：预处理及特征向量提取模块、训练学习模块、匹配识别模块、样本评估更新模块。
2. 根据权利要求1所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：算法主要包括以下三个阶段： 2.1训练学习阶段： 2. 1. 1对每个用户个人在不同时间采集多段具有一定时长的心电数据。 2. 1. 2对所有输入的个人心电数据进行预处理及周期分割。对处理后的数据进行离散余弦变换（DCT变换），提取特征向量。 2. 1. 3将变换后的特征向量与用户个人一一对应，存入数据库。 2. 1. 4使用两层决策分类器（随机森林-最近邻分类器）对数据进行第一层随机森林决策层的训练学习。 2. 2匹配识别阶段： 2. 2. 1对待识别用户个人采集心电数据。 2. 2. 2对输入的个人心电数据进行预处理及周期分割。对处理后的信号进行离散余弦变换（DCT变换），提取特征向量。 2. 2. 3将提取后的特征向量使用两层决策分类器（随机森林-最近邻分类器），得到决策结果。 2. 3样本评估更新阶段： 2. 3. 1对成功识别的样本，将其保存在近期识别成功样本库中。 2. 3. 2评估原心电信号样本库的样本是否仍能有效地代表用户的心电信号模式。若存在偏离度较高的样本，则在近期识别成功样本库中寻找最优样本进行替换。完成心电信号样本库的更新，并重新训练随机森林模型。
3. 根据权利要求1、2所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：所述的预处理及特征向量提取模块包括以下步骤： 3.1对心电数据进行滤波。 3. 2定位R波位置，以相邻的R波位置进行分割，提取得到多个完整的周期信号。 3. 3对分割后的心搏周期信号进行时间轴上的规范化和电压轴上的规范化。 3. 3. 1时间轴上的规范化：将心搏周期时间规范为固定时间，即将每个周期信号采样点规范为相同个数； 3. 3. 2电压轴上的规范化：首先提取信号幅值的中位数，将信号的每个采样值均减去中位数，以对齐零电平。 3. 4特征向量提取。 3. 4. 1对预处理后的心电信号序列进行DCT变换； 3. 4. 2保留前K个DCT变换参数组成特征向量并输出。
4. 根据权利要求1、2所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：所述的两层决策分类器结构及作用为：第一层决策层将预选范围大大减小，保证匹配的速度，同时保证一定的准确度；第二层决策层根据第一层决策层的决策结果进行分情况讨论，输出最后识别身份，进一步提高准确度。
5.根据权利要求1、2、4所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：所述的两层决策分类器在进行匹配识别的步骤为： 5. 1随机森林决策层决策。将待识别特征向量经已训练好的随机森林模型进行决策，得到第一层决策层的决策置信度Confidence数组。 5. 2最近邻决策层决策。根据第一层的决策结果置信度Confidence数组内的分布，选择具有较大置信度的类别，根据其置信度的大小进行讨论，决定是否需进一步使用最近邻决策。并输出最终身份识别决策结果。
6. 根据权利要求1所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：根据成功识别的样本进行反馈，定期更新样本库，保证算法在长期时间能正常有效地运作。其中，样本为心电数据特征向量，特征向量的提取方法包括但不限于离散余弦变换，决策分类器包括但不限于随机森林分类器、近邻分类器及由两者组合的多层次分类器。样本评估更新的步骤为： 6. 1将识别成功的特征向量与识别用户类别对应，存入近期成功识别样本库，并记录采集时间t。 6. 2综合原心电信号样本库与近期成功识别样本库，计算用户的平均心电样本 {Sa[η]}。对某一特定用户，记原心电信号样本库的样本数目为&，近期成功识别样本库样本数目为队，样本为{S(i) [n]}，i = 1，2,3, . . .，&+队，则
6. 3计算每个样本与平均心电样本的偏离度。 6. 4根据阈值判断原心电信号样本库中的样本是否偏离度过高。如果是，则从近期成功识别样本库中选取偏离度最小的样本进行替换。
7. 根据权利要求1、6所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：对某一特定用户，其所有样本与平均心电样本的偏离度计算方法为：首先计算每个样本{S(i)[n]}与平均心电样本{S a[n]}的距离d(i)。并根据样本采集时间t(i)，对距离d(i)进行修正，得到修正距离d' (i)。
(Γ (i) = [1+P(t(i))] · d(i) 其中，i = 1，2,3, . . .，K+N2。P(t)为基于采样时间的惩罚因子函数，输出值域为[0， 1]:样本采集时间距今越久，惩罚因子越大，越接近于1 ;样本采集时间越接近当前时间，惩罚因子越小，越接近于0。一种可行的P(t)表示式为：
其中，tnOT-t表示样本采集时间距当前时间的天数。
8.根据权利要求1、6、7所述的一种基于心电信号的动态自更新样本的身份识别方法，其特征在于：根据阈值判断原心电信号样本库中的样本是否偏离度过高的方法是：首先计算平均修正距离d' m:
以平均修正距离(Γ m的λ (λ > 1)倍为阈值，若原心电信号样本库中的样本，其修正距离d' (i)大于λ · d' m时，则认为该样本相较于其他样本，已经不能很好的代表用户此时的心电信号模式，则用近期成功识别样本库中修正距离d' (i)最小的样本进行替换，完成样本库的更新。
【文档编号】G06F21/32GK104063645SQ201410313478
【公开日】2014年9月24日申请日期:2014年7月1日优先权日:2014年7月1日
【发明者】张跃, 施友群申请人:清华大学深圳研究生院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张跃;施友群
技术所有人：清华大学深圳研究生院
我是此专利的发明人

上一篇：单片机仿真芯片及单片机仿真方法
上一篇：基于群体行为环境敏感的虚拟根系构建方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。