一种基于时间序列平稳性检验的异常体温序列筛选方法与流程

文档序号:23273866发布日期:2020-12-11 19:20阅读:75来源:国知局
一种基于时间序列平稳性检验的异常体温序列筛选方法与流程

本发明属于体温检测技术领域,尤其涉及基于时间序列的平稳性检验的异常体温序列筛选技术。



背景技术:

随着我国各行各业复产复工,人群流动加大,新型冠状病毒传播的防控压力也随之增大。包括核酸检测在内的患病人员检测存在着不精确、初期难以大范围开展等弊端,因此非常有必要挖掘一种新的体温筛查辅助技术。

体温变化是反映人体健康情况的最直接指标,相比其他检测方法而言,体温监测更易实现且成本更低。当前在人流密集场所设置的体温检测站仅能获取人群中单个个体体温点,不能捕捉到长期的体温变化,而长期的体温变化序列往往蕴涵着丰富的特征信息,可以通过对与人群密切接触的重点行业(如厨师、保安等)人员进行长期的体温监测,来进一步挖掘异常体温信息,从而辅助筛查体温异常人员,从而为新冠感染人员做进一步检测提供参考。目前体温检测领域针对异常体温序列筛选没有有效的技术方案,本发明针对这一问题填补了行业内空白。



技术实现要素:

本发明针对目前数据分析领域并没有使用体温时间序列筛查体温异常人员的技术方法,且在实际体温监测中存在着体温数据缺失、数据精度不高等问题,提出了一种基于时间序列平稳性检验的异常体温序列筛选方法。

本发明提出的一种基于时间序列平稳性检验的异常体温序列筛选方法,包括如下步骤:

步骤一、生成初始体温时间序列;

在不同时间段内的体温数据数量分布确定采样到较多数据的体温监测连续时间段,本发明对每个用户提取每天固定时间段的体温,以每半小时的体温均值为序列值,将包括目标日期在内的前三到五天的体温数据,生成初始体温时间序列。目标用户是指待检测身体状况的用户,目标日期一般是指当前日期。本发明可根据当天测量体温和历史体温实现对当前用户的身体状况检测。

步骤二、对用户体温时间序列进行插值,补充缺失数据,形成完整的体温时间序列数据集;查找到当前体温缺失值时间段之前最近的两个有效体温时间序列值和当前体温缺失值时间段之后最近的两个有效体温时间序列值,即四个体温值;有效体温值时间段和当前缺失值时间段的间隔不超过24小时;然后由步骤201或202的插值方式来补充缺失值。

步骤201、根据距离当前体温缺失值时间段的时间间隔来计算权重值并做加权平均,得到体温缺失值;设c代表所找到的4个有效体温值对应的时间段序号的集合,其中序号为k的时间段,距离当前缺失值时间段的时间间隔数为dk;以半小时为时间间隔单位;序号为k的时间段的体温值的权重wk=exp{-dk/2};加权平均计算的缺失值tempavg如下:

其中,tempk代表目标用户的序号为k的时间段的体温;

步骤202、计算四个有效体温值和对应时间段的全体用户体温均值的差值,设序号为k的时间段的全体用户体温均值为total_tempk,序号为k的时间段的目标用户的有效体温值与全体用户体温均值的差值为diffk,则加权平均计算的体温插值tempdiff为缺失值;

其中,wk为序号为k的时间段的有效体温值的权重。

步骤三、对用户的体温时间序列的平稳性利用扩展迪基-福勒方法进行检验,对检验结果为不平稳的体温时间序列,进一步做阶数为周期长度的差分,周期长度是指每日固定时间段长度,然后对差分所得体温序列再用扩展迪基-福勒方法进行平稳性检验。检验结果为平稳的体温时间序列对应的用户认为是正常用户。

步骤四、计算用户体温时间序列的特征评分,进行异常体温判定;包括:

步骤401,对全体用户在目标日期的体温时间序列,利用极大似然估计方法估计出全体用户体温的均值分布和方差分布;

步骤402,根据已知异常体温用户的体温时间序列计算出的体温均值和方差,计算其分别在全体用户体温均值分布和方差分布中的位置评分,并根据所得位置评分设定一个评分阈值;

步骤403,对步骤三输入的体温时间序列,计算其体温均值和方差,进一步获得在全体用户体温均值分布和方差分布中的位置评分,若评分大于设定的评分阈值,则判定为异常体温时间序列,表示所对应用户非正常用户;否则认为是正常用户。

本发明与现有技术相比,具有以下优势:

(1)本发明使用平稳性检验方法初步筛选体温时间序列,可以增加异常体温筛选工作的效率,避免大规模的计算工作。

(2)本发明提出的体温序列自动插值方法,可以免去大量繁杂的人工操作,并且仅需要调整参考的时间段范围和体温有效数据量,以应对不同条件下的体温时间序列生成需求。

(3)本发明不需要繁琐的训练步骤,仅需要使用少量带标签的异常体温时间序列确定特征得分阈值,属于弱监督范畴,同时保证了筛查的精度,具体工作中仅需要根据需求调整阈值。

附图说明

图1是本发明基于时间序列平稳性检验的异常体温序列筛选方法的整体流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图对本发明作进一步的详细和深入描述。

本发明提出的基于时间序列平稳性检验的异常体温序列筛选方法,结合了极大似然估计、扩展迪基福勒检验技术,在体温数据库中根据目标日期筛选体温异常用户。本发明首先根据体温数据库分布情况提取最近三到五天固定时间段(如早6点到晚10点)的体温数据,并按每半小时取均值生成体温时间序列,然后对体温时间序列中的缺失值,综合考量前后时间段的用户个人体温和全体用户体温均值进行插值处理。在完成插值处理得到完整体温时间序列数据集后,采用扩展迪基福勒检验技术对体温时间序列进行平稳性检验,找到去除周期性后仍不具备平稳性的体温时间序列及其用户。对于这些用户,一方面使用极大似然估计方法估计出全体用户在目标日期的体温均值分布和体温方差分布,另一方面根据不具备平稳性的用户均值和方差在这两个分布中的位置综合评分。最后综合评分结果将被用于和提前设定好的分数阈值比较,从而完成异常体温序列的筛选。

本申请公开了一种基于时间序列平稳性检验的异常体温序列筛选方法,包括以下步骤:步骤1、在用户体温数据库中,对每个用户提取固定时间段体温序列生成体温时间序列数据集;步骤2、对待检验的体温时间序列进行预处理,补足缺失数据部分并生成完整体温时间序列数据;步骤3、利用扩展迪基-福勒检验方法判断体温时间序列平稳性;步骤4、计算目标日期体温时间序列的均值和方差,并根据在全体用户中的分布情况评分;步骤5、根据序列平稳性和评分综合判断用户目标日期体温序列是否异常。

如图1所示,本发明基于时间序列平稳性检验的异常体温序列筛选方法,分为如下五个步骤来说明。

步骤一:生成初始体温时间序列。

本发明考虑到用户往往是在白天佩戴体温监测设备,每日的体温数据提取应尽量选择在有较多有效数据的时间,如早上6时到晚上10时。因此本发明对个体一天固定时间段的体温进行处理,如早6点到晚10点。

此外,无论正常体温序列还是异常体温序列,序列在30分钟内的体温波动一般是不剧烈的,因此可以使用每半个小时的体温均值作为序列值,保证体温时间序列的均匀有序。而过长的体温时间序列会由于波动表现的不明显,更容易被判别为平稳序列,因此本发明选择最近三到五天的体温数据最佳,过长不能凸出异常体温波动,过短则易受轻微波动影响。

本发明考虑到正常人在最近几天的体温序列应当是平稳序列,因此从体温数据库中选取全体用户在目标日期前三到五天(包含目标日期)的在固定时间段的体温数据,以半小时的体温数据均值为数据点生成初始体温时间序列。

虽然选取每天某一时间段的体温数据并不能保证整体序列的连续性,但经统计发现正常人晚上和早上的体温差异并不明显,不会影响体温序列平稳性。另外由于提取的体温时间序列为一周期序列,周期长度即为每日提取体温的时间段长度,可以对整体体温时间序列进行阶数为周期长度的差分,对于正常体温时间序列而言,差分所得体温序列应仍满足平稳性。

步骤二:对体温时间序列进行插值,补充缺失数据生成完整体温时间序列数据。

考虑到实际体温监测不能严格保证长期连续性,体温时间序列中会存在着大量的缺失值。对于这些缺失值,找到离当前体温缺失值时间段前后时间间隔最近的四个(或更少)体温时间序列有效数据,且满足时间间隔不超过24小时,保证不会有强烈的体温波动。一方面使用这几个体温有效数据的加权平均模拟当前时段实际体温数据,另一方面计算这几个有效数据和全体用户在对应时间段体温均值的差值,使用这些差值的加权平均模拟当前时段体温数据和全体用户体温均值的差值。根据这两种方法所得体温数据的均值综合考量了个体体温变化和全体体温变化,最终用于体温时间序列的缺失值补充,至此可得到完整体温时间序列数据集。

对于序列中的体温缺失值,首先找到当前体温缺失值时间段之前最近的两个有效体温序列值和之后最近的两个有效体温序列值,同时有效体温值时间段和当前缺失值时间段间隔不能超过24小时。对于这四个(或更少)找到的体温数据值,根据距离当前体温缺失值时间段的时间间隔来计算权重值并做加权平均,得到的体温即可用于缺失值补充。

权重和平均体温插值计算公式如下:

wk=exp{-dk/2}

其中,本发明实施例以半小时为时间间隔单位,每半个小时为一个时间段,对应有一个序号,c代表所找到的4个有效体温值对应的时间段序号的集合,对于其中序号为k的时间段,距离当前缺失值时间段的时间间隔数为dk;wk表示序号为k的时间段的体温的权重;tempavg是计算的加权平均体温插值,即当前缺失值;tempk代表测量用户的序号为k的时间段的体温。

另外,经统计可以发现正常人体温在每天不同时段的均值是不同的,对于找到的四个(或更少)体温数据值,还需计算这四个数值和对应时间段全体用户均值的差值,对四个差值进行如上面公式的加权平均计算,从而计算出目标用户体温与大众均值的平均差距,再用待补充缺失值对应时间段的全体用户体温均值加上平均差距,得到另一种用于缺失值补充的体温。体温差值和基于平均体温差值的体温插值计算公式如下:

diffk=total_tempk-tempk

其中,total_tempk表示序号为k的时间段的全体用户的有效体温平均值,diffk代表序号为k的时间段的目标用户的体温有效值与全体用户体温均值的差值,tempdiff表示所计算的缺失值,是基于前后四个有效体温值与全体用户体温均值差距的体温插值。

采用上述两种插值方式来补充缺失值,既根据前后有效体温值拟合了体温变化趋势,又利用大众体温均值和个人体温均值的平均差距缓解了可能由趋势拟合导致的极值影响,属于体温插值的重要创新。

步骤三:对用户的体温时间序列平稳性进行检验;

经上述步骤二生成的体温时间序列进一步做平稳性检验。首先使用扩展迪基福勒检验方法检验体温时间序列平稳性,初步筛选掉一批体温波动不大的用户。考虑到体温时间序列生成时有一些数据量较少的时间段被舍去,体温时间序列在时间上并不连续,不具备平稳性可能是由于时间的不连续性导致的。但体温时间序列生成是连接连续几天完全相同时间段体温数据实现的,属于周期序列,如无剧烈体温变化去除周期性后应仍满足平稳序列。因此接下来对体温时间序列进行阶数为序列周期的差分,继续进行平稳性检验,验证为不具备平稳性的体温时间序列和其用户留作下一步筛查。

使用扩展迪基福勒检验方法,根据输入体温时间序列得到验证序列平稳性的参数p-value,若p-value小于0.05,则可以认为输入序列为平稳时间序列。

对于验证为非平稳序列的体温时间序列,考虑到非平稳可能是选取时间段不连续导致,还需对序列做阶数为周期长度(即选取的每日体温时间段长度)的差分,然后对差分所得体温序列再做扩展迪基-福勒检验。若得到的参数p-value仍不小于0.05,则该体温时间序列可视为不具备平稳性,即用户在最近几天体温波动较剧烈。

步骤四:对于经步骤三验证不具备平稳性的体温时间序列和其用户,将进一步使用体温时间序列特征评分确定其是否为异常体温时间序列。

首先,计算步骤二插值后的全体用户在目标日期的体温时间序列的均值和方差,利用极大似然估计方法估计出均值分布和方差分布。

然后,对于已知的异常体温用户,根据这些用户的体温时间序列计算出的均值和方差,计算出其分别在全体用户体温均值分布和方差分布中的位置评分,根据这些异常体温用户的体温评分设置足够包含大多数异常体温时间序列的分数阈值,该分数阈值可根据实际工作需要进行调整。

最后,对于经步骤三平稳性检验留作筛查的用户,对其在目标日期的体温均值和方差评分,将大于设定阈值的判定为异常体温时间序列,所对应的用户为非正常用户,否则,认为是正常用户。

考虑到全体用户理想的体温分布和方差分布应属于正态分布,则可根据目标用户的体温均值和方差在总体分布中位置计算得分,均值得分或方差得分score可由下面的公式计算得出:

其中,φ为正态分布函数,x为目标用户在目标日期的体温均值或方差,μ为全体用户在目标日期的均值分布或方差分布的均值,σ为全体用户在目标日期的均值分布或方差分布的方差。

进一步地,最终的体温时间序列特征评分可由两个评分的平均值得出。相应的评分阈值也可以是由异常体温时间序列得到的体温均值和方差评分的平均值来获得。

经过上面步骤四和五,本发明对目标用户,先将其体温时间序列进行平稳性判定,对不平稳的序列再进行特征评分,对高于预先设定分数阈值的用户,定位为潜在异常用户,实现了一种综合判断用户目标日期体温时间序列是否异常的技术操作。

然后对于普通用户,若经步骤三判定为不具备平稳性,并且经步骤四评分可被并接受其他技术操作。

为了避免使本说明书的描述限于冗繁,在本说明书中的描述中,可能对可在上述参考文献或其它现有技术资料中获得的部分技术细节进行了省略、简化、变通等处理,这对于本领域的技术人员来说是可以理解的,并且这不会影响本说明书的公开充分性。在此,将上述参考文献通过引用而全文合并于此。

综上所述,本领域的技术人员能够理解,对本发明的上述实施例能够做出各种修改、变型、以及替换,其均落入如所附权利要求限定的本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1