生理数据的处理方法、装置、电子设备和存储介质与流程

文档序号:21880558发布日期:2020-08-18 16:38阅读:159来源:国知局
生理数据的处理方法、装置、电子设备和存储介质与流程

本申请涉及数据处理技术领域,尤其涉及一种生理数据的处理方法、装置、电子设备和存储介质。



背景技术:

随着智能可穿戴设备(如智能手表、智能手环等)的普及,通过智能可穿戴设备实时监测的用户的健康大数据,例如心率、活动量、睡眠质量和睡眠时间等连续数据,不仅可以直接反应区域性的公共卫生健康水平,还可以对该区域的公共卫生和健康预测起到重要的参考作用。例如,在世界范围内相继爆发的新型冠状病毒肺炎,属于人传人性质的突发公共卫生传染性疾病。如果在疾病爆发之前通过用户的健康大数据能进行准确预警,不仅为控制疾病的大面积传染起到至关重要的作用,同时也为当地政府做好疫情防控赢得宝贵时间。

突发性公共卫生传染病一般是由病毒(如新型冠状病毒肺炎、病毒流感等)引起的,而且病毒具有潜伏期。但是,传统的基于病毒学和症状学方法预测病毒发病的趋势时时仅基于某一疾病的发病统计数据,导致现有的预测方法的准确度受到发病统计数据准确度的影响,从而无法起到实时或提前预警的作用。



技术实现要素:

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

本申请第一方面实施例提出了一种生理数据的处理方法,包括:

根据设定区域中各用户设备在历史时段采集的生理数据,确定所述生理数据的实际异常率;

获取所述设定区域中目标疾病在所述历史时段的实际发病数据;

在受到所述目标疾病影响条件下,根据所述生理数据的实际异常率,预测所述生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据所述目标疾病在所述历史时段的实际发病数据确定的;

在排除所述目标疾病影响条件下,根据所述生理数据的实际异常率,预测所述生理数据在所述预测时段的第二预测异常率;

根据所述第一预测异常率和所述第二预测异常率的差值,确定所述设定区域中所述目标疾病所导致的生理数据的异常率。

作为本申请实施例的第一种可能的实现方式,所述在受到所述目标疾病影响条件下,根据所述生理数据的实际异常率,预测所述生理数据在预测时段的第一预测异常率,包括:

根据所述实际发病数据,确定实际人群发病密度值;

将所述生理数据的实际异常率,以及所述实际人群发病密度值作为输入参数,输入所述设定区域对应的预测模型,得到所述第一预测异常率;

作为本申请实施例的第二种可能的实现方式,所述在排除所述目标疾病影响条件下,根据所述生理数据的实际异常率,预测所述生理数据在所述预测时段的第二预测异常率,包括:

将所述生理数据的实际异常率,以及取值为零的实际人群发病密度值作为输入参数,输入所述设定区域对应的预测模型,得到所述第二预测异常率。

作为本申请实施例的第三种可能的实现方式,还包括:

根据所述设定区域中所述目标疾病在所述预测时段的实际发病数据,确定所述预测时段所述目标疾病所导致的生理数据的异常率期望值;

根据所述预测时段所述目标疾病所导致的生理数据的异常率期望值,生成训练样本;

根据所述训练样本,对所述预测模型进行更新。

作为本申请实施例的第四种可能的实现方式,所述根据所述训练样本,对所述预测模型进行更新,包括:

根据当前周期对应的时间窗,获取所述生理数据的异常率期望值所属预测时段处于所述时间窗内的训练样本;

采用当前周期对应的时间窗内的训练样本,在所述当前周期前一个周期的预测模型基础上,训练得到所述当前周期的预测模型。

作为本申请实施例的第五种可能的实现方式,所述输入参数还包括用于指示影响因素的稀疏向量,所述预测模型包括:

第一子神经网络,用于输入所述稀疏向量,以提取所述稀疏向量的特征;

第二子神经网络,用于输入稠密向量,以提取所述稠密向量的特征;其中,所述稠密向量包括所述历史时段所述生理数据的实际异常率、所述目标疾病在所述历史时段的所述实际人群发病密度值和活跃用户设备的密度;所述历史时段,包括最近设定天数;所述活跃用户设备,为在线时长满足阈值的用户设备;

全连接网络,用于连接所述第一子神经网络和所述第二子神经网络,用于根据所述稀疏向量的特征,以及所述稠密向量的特征预测所述生理数据的异常率。

作为本申请实施例的第六种可能的实现方式,所述稀疏向量包括天气状态、节假日信息或季节信息中的一个或多个组合。

作为本申请实施例的第七种可能的实现方式,所述设定区域是全球、大洲、国家、省或市。

作为本申请实施例的第八种可能的实现方式,所述根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率,包括:

根据所述设定区域中所述历史时间段内各用户设备的在线时长,确定在线时长满足阈值的用户设备;

获取所述在线时长满足阈值的用户设备的生理数据;

根据所获取的在线时长满足阈值的用户设备的生理数据,确定所述生理数据的实际异常率。

作为本申请实施例的第九种可能的实现方式,所述根据所述第一预测异常率和所述第二预测异常率的差值,确定所述目标疾病所导致的生理数据的异常率之后,还包括:

根据多个预测时段所述目标疾病所导致的生理数据的异常率,绘制生理数据的异常率的变化曲线;

根据所述变化曲线中峰值对应时刻,预测所述目标疾病实际发病数据的峰值时刻。

作为本申请实施例的第十种可能的实现方式,所述生理数据包括睡眠时长和静息心率;所述根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率,包括:

对所述设定区域中任意用户设备在所述历史时段采集的生理数据,若所述静息心率大于心率阈值,且所述睡眠时长大于时长阈值,则将用户设备识别为异常用户设备;

根据异常用户设备占所述设定区域中在所述历史时段采集生理数据的总用户设备的比率,确定所述生理数据的实际异常率。

本申请实施例的生理数据的处理方法,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率;获取设定区域中目标疾病在历史时段的实际发病数据;在受到目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据目标疾病在历史时段的实际发病数据确定的;在排除目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率;根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。由此,在目标疾病的实际发病数据进行弱监督的基础上,根据设定区域中各用户设备采集的生理数据确定的实际异常率,预测未来时段目标疾病所导致的生理数据异常率,提高了预测的准确性。

本申请第二方面实施例提出了一种生理数据的处理装置,包括:

确定模块,用于根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率;

获取模块,用于获取所述设定区域中目标疾病在所述历史时段的实际发病数据;

第一预测模块,用于在受到所述目标疾病影响条件下,根据所述生理数据的实际异常率,预测所述生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据所述目标疾病在所述历史时段的实际发病数据确定的

第二预测模块,用于在排除所述目标疾病影响条件下,根据所述生理数据的实际异常率,预测所述生理数据在所述预测时段的第二预测异常率;

处理模块,用于根据所述第一预测异常率和所述第二预测异常率的差值,确定所述设定区域中所述目标疾病所导致的生理数据的异常率。

本申请实施例的生理数据的处理装置,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率;获取设定区域中目标疾病在历史时段的实际发病数据;在受到目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据目标疾病在历史时段的实际发病数据确定的;在排除目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率;根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。由此,在目标疾病的实际发病数据进行弱监督的基础上,根据设定区域中各用户设备采集的生理数据确定的实际异常率,预测未来时段设定区域中的目标疾病所导致的生理数据的异常率,提高了预测的准确性。

本申请第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面实施例中所述的生理数据的处理方法。

本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例中所述的生理数据的处理方法。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请实施例提供的第一种生理数据的处理方法的流程示意图;

图2为本申请实施例提供的第二种生理数据的处理方法的流程示意图;

图3为本申请实施例提供的一种预测模型的网络结构示意图;

图4为本申请实施例提供的第三种生理数据的处理方法的流程示意图;

图5为本申请实施例提供的一种预测模型更新方法的示例图;

图6为本申请实施例提供的生理数据的处理结果示例图;

图7为本申请实施例提供的第四种生理数据的处理方法的流程示意图;

图8为本申请实施例提供的一种生理异常率的变化曲线示例图;

图9为本申请实施例提供的一种生理数据的处理装置的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的生理数据的处理方法、装置、电子设备和存储介质。

图1为本申请实施例提供的第一种生理数据的处理方法的流程示意图。

如图1所示,该生理数据的处理方法包括以下步骤:

步骤101,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率。

其中,生理数据,是指设定区域中用户佩戴设备时,各设备采集得到的用户的睡眠时长、静息心率、活动量等等。其中,生理数据的实际异常率,为设定区域中生理数据出现异常的用户设备占总用户设备的比率。

需要说明的是,为了避免泄露各用户设备对应的用户的信息,获取到的各用户设备采集的生理数据为脱敏数据。也就说,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。此外,为了提高异常预测的准确率,可以获取不同地区的用户设备采集的生理数据。例如,可以获取位于中国北部、中部、南部,以及欧洲等区域的用户设备在历史时段采集的生理数据。

本申请实施例中,在获取到各用户设备在历史时段采集的生理数据中,可能存在异常生理数据,例如,用户在历史时段内佩戴设备次数较低时采集的生理数据,缺失睡眠时长或静息心率的生理数据。为了提高预测的准确率,可以去除这些用户对应的在历史时段内采集的异常生理数据。例如,设定历史时段为2019年7月1日至2020年3月31日,可以去除佩戴设备不足100天的用户设备采集的生理数据,以及缺少睡眠时长或静息心率的生理数据。

在一种情况下,获取到的设定区域中各用户设备在历史时段采集的生理数据包括睡眠时长和静息心率。由于受病毒感染后,无论是新型冠状病毒肺炎还是季节性流感引起的感染,用户身体都会出现发热现象,此时,病人的静息心率会有所升高。但是,熬夜等用户的个人行为也会导致用户的静息心率升高,因此,在确定生理数据的实际异常率之前,还需要去除因睡眠不足而引起的静息心率升高的用户。进一步的,可以根据去除掉所有的异常生理数据后剩余的生理数据,确定生理数据的实际异常率。

本申请实施例中,对设定区域中任意用户设备在历史时段采集的生理数据,若静息心率大于心率阈值,且睡眠时长大于时长阈值,则将该用户设备识别为异常用户设备。进而,根据异常用户设备占设定区域中在历史时段采集生理数据的总用户设备的比率,确定生理数据的实际异常。

具体地,对每一个用户设备在历史时段采集的生理数据,若静息心率大于相应用户设备的心率阈值,且睡眠时长大于相应用户设备的时长阈值,则将该用户设备识别为异常。进而,根据异常用户设备与总用户设备的比值,确定异常用户设备所占比率,以根据异常用户设备所占比率,确定生理数据的实际异常率。

其中,心率阈值,是根据相应用户设备的静息心率均值和静息心率方差确定的;时长阈值,是根据相应用户设备对应的睡眠时长均值和睡眠时长方差确定的。例如,心率阈值,可以为相应用户设备的静息心率均值与1.5倍的静息心率方差之和;时长阈值,可以为相应用户设备对应的睡眠时长均值与0.5倍的睡眠时长方差的差值。由于每一个用户的静息心率均值和失眠时长均值并不相同,因此每一个用户设备均有对应的心率阈值和时长阈值。

需要说明的是,历史时段,是可采集到生理数据的时段,若当前时刻可采集到生理数据则历史时段可以包括当前时刻,若当前时刻无法采集得到生理数据,则历史时段不含当前时刻。其中,历史时段包括多个时段,各时段之间存在间隔;其中多个时段中包含最近设定天数,其余各时段可以为去年对应的设定天数。

作为一种示例,在设定区域中,假设获取到的当天佩戴设备的日活跃用户设备总数为n,且确定当天有m个用户设备采集的生理数据出现异常,则可以确定该区域当天的生理数据的实际异常率r=m/n。

步骤102,获取设定区域中目标疾病在历史时段的实际发病数据。

本申请实施例中,可以从设定区域的官方网站获取目标疾病在历史时段的实际发病数据。

例如,假设目标疾病为新型冠状病毒肺炎,可以从官方网站获取设定区域中历史时段的实际发病数据。

步骤103,在受到目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第一预测异常率。

其中,预测时段,可以以天为时段,以星期为时段,等等。例如,可以预测生理数据在明天的生理数据的预测异常率。第一预测异常率,是指预测生理数据在预测时段感染目标疾病和其他病毒的异常率。例如,第一预测异常率,可以为感染新型冠状病毒肺炎和季节性流感而引起的异常率。

本申请实施例中,目标疾病的影响程度是根据目标疾病在历史时段的实际发病数据确定的。作为一种可能的实现方式,在获取到设定区域中目标疾病在历史时段的实际发病数据后,可以根据实际发病数据,确定实际人群发病密度值。进而,将用于指示影响因素的特征,历史时段的生理数据的实际异常率,活跃用户设备的密度,以及实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第一预测异常率。

其中,用于指示影响因素的特征,可以为天气状态、节假日和季节中的一个或多个组合。

步骤104,在排除目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率。

其中,第二预测异常率,是指排除了感染目标疾病后因其他疾病引起的异常率。例如,第二预测异常率,可以为感染季节性流感而引起的异常率。

本申请实施例中,在排除了目标疾病影响的条件下,不需要官方公布的目标疾病的实际发病数据,仅根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率。

作为一种可能的实现方式,可以将用于指示影响因素的特征,历史时段的生理数据的实际异常率,活跃用户设备的密度,以及取值为零的人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第二预测异常率。

需要说明的是,步骤103和步骤104的执行顺序不做限定,上述仅作为一种示例性表述,还可以先执行步骤104,再执行步骤103,或者同时执行步骤103和步骤104。

步骤105,根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。

本申请实施例中,在受到目标疾病影响条件下,预测得到第一预测异常率,以及,在排除目标疾病影响条件下,预测得到第二预测异常率后,计算第一预测异常率和第二预测异常率的差值,即可确定设定区域中目标疾病所导致的生理数据的异常率。

作为一种示例,假设目标疾病为新型冠状病毒肺炎,实际发病数据为某区域官方公布的新型冠状病毒肺炎的实际发病数据。将根据某一区域的用户设备在历史时段采集的生理数据确定的生理数据的实际异常率,预测得到该区域的第一预测异常率。在排除新型冠状病毒肺炎影响的条件下,将根据该区域的用户设备在历史时段采集的生理数据确定的生理数据的实际异常率,预测得到该区域的第二预测异常率。进而计算第一预测异常率和第二预测异常率的差值,即可确定该区域新型冠状病毒肺炎所导致的生理数据的异常率。

本申请实施例的生理数据的处理方法,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率;获取设定区域中目标疾病在历史时段的实际发病数据;在受到目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据目标疾病在历史时段的实际发病数据确定的;在排除目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率;根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。由此,在目标疾病的实际发病数据进行弱监督的基础上,根据设定区域中各用户设备采集的生理数据确定的生理数据的实际异常率,预测未来时段目标疾病所导致的生理数据的异常率,提高了异常预测的准确性。

在上述实施例的基础上,本申请提出了另一种生理数据的处理方法。图2为本申请实施例提供的第二种生理数据的处理方法的流程示意图。

如图2所示,该生理数据的处理方法,还可以包括以下步骤:

步骤201,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率。

步骤202,获取设定区域中目标疾病在历史时段的实际发病数据。

本申请实施例中,步骤201和步骤202的实现过程,可以参见上述实施例中步骤101和步骤102的实现过程,在此不再赘述。

步骤203,根据实际发病数据,确定实际人群发病密度值。

其中,实际人群发病密度值,是指设定区域中目标疾病在历史时段的实际发病数据与该区域中常住人口总数的比值。

本申请实施例中,获取到设定区域中目标疾病在历史时段的实际发病数据后,可以根据实际发病数据,确定实际人群发病密度值。

作为一种可能的实现方式,在确定某一区域的实际人群发病密度值时,可以用该区域的目标疾病在历史时段的实际发病数据,除以该区域的常住人口总数,以得到当前时段该区域的实际人群发病密度值。

步骤204,将生理数据的实际异常率,以及实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第一预测异常率。

可以理解的是,不同区域的不同地理位置的季节性气候存在差异,导致各区域中用户的生理异常率的判断标准并不相同。为了提高模型预测的准确性,预测模型为多个,各区域均有对应的预测模型,因此,在预测生理数据的异常率时,需要根据设定区域选取相应区域的预测模型。其中,设定区域可以为全球、大洲、国家、省或市。

作为一种示例,设定区域为北京市,则可以选取北京市对应的预测模型进行生理数较多异常率的预测。

在一种可能的情况下,预测模型可以包括第一子神经网络,第二子神经网络和全连接网络。

其中,第一子神经网络,用于输入稀疏向量,以提取稀疏向量的特征。

稀疏向量可以包括天气状态、节假日信息或季节信息中的一个或多个组合。例如,稀疏向量可以包括多种元素,每一个元素对应一个影响因素,各元素的取值,用于指示是否具备相应影响因素。其中,元素可以分别对应于天气是否晴朗、各种节假日、季节,等等。若符合设定的条件,则相应元素取值为1,否则为0。

第二子神经网络,用于输入稠密向量,以提取稠密向量的特征。其中,稠密向量包括历史时段生理数据的实际异常率、实际人群发病密度值和活跃用户设备的密度。其中,历史时段,包括最近设定天数。

其中,活跃用户设备,为在线天数满足阈值的用户设备。活跃用户设备的密度,是指历史时段内设定区域中活跃用户设备数量与用户设备总数量的比值。可以根据在历史时段内各用户设备的在线时长,确定在线时长满足阈值的用户设备为活跃用户设备,将活跃用户设备数量与用户设备总数量的比值作为活跃用户设备的密度。

例如,输入第一子神经网络的稀疏向量可以为12维,包括星期一到星期日,四个季节,以及是否节假日。如4月4日,是星期六,属于第二季度,是清明节,所以该稀疏向量可以是{0,0,0,0,0,1,0,0,1,0,0,1}。输入第二子神经网络的稠密向量可以为16维,包括当前时段倒数的7个异常率数值,去年同期的7个异常率数值,以及目标疾病的实际发病数据和该区域的用户密度。

全连接网络,用于连接第一子神经网络和第二子神经网络,用于根据稀疏向量的特征,以及稠密向量的特征预测生理数据的异常率。

作为一种示例,参见图3,图3为本申请实施例提供的一种预测模型的网络结构示意图。如图3所示,将稀疏向量和稠密向量分别输入第一子神经网络和第二子神经网络后,第一子神经网络根据输入的稀疏向量,提取出稀疏向量的特征;第二子神经网络根据输入的稠密向量,提取出稠密向量的特征;全连接网络根据稀疏向量的特征,以及稠密向量的特征预测生理数据的异常率。

本申请实施例中,可以将设定区域中用于指示影响因素的稀疏向量、历史时段生理数据的实际异常率、活跃用户设备的密度和实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,预测模型即可输出第一预测异常率。

需要说明的是,这里预测得到的第一预测异常率,是指预测生理数据在预测时段感染目标疾病和其他病毒的生理数据的异常率。例如,第一预测异常率,可以为感染新型冠状病毒肺炎和季节性流感而引起的生理数据的异常率。

在一种可能的情况下,输入预测模型的输入参数还可以包括活跃用户设备的密度。这种情况下,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率时,可以根据设定区域中历史时段内各用户设备的在线时长,确定在线时长满足阈值的用户设备为活跃用户设备。进而,获取在线时长满足阈值的用户设备的生理数据,以根据所获取的在线时长满足阈值的用户设备采集的生理数据,确定生理数据的实际异常率。以将设定区域中用于指示影响因素的稀疏向量、根据活跃用户设备确定的生理数据的实际异常率、活跃用户设备的密度和实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,预测模型即可输出第一预测异常率。

作为一种示例,假设目标疾病为新型冠状病毒肺炎,实际发病数据为某区域官方公布的新型冠状病毒肺炎的实际发病数据。将实际发病数据除以该区域的常住人口总数,即可确定该区域的实际人群发病密度值。将根据该区域的用户设备在历史时段采集的生理数据确定的生理数据的实际异常率、用于指示影响因素的稀疏向量、活跃用户设备的密度和实际人群发病密度值作为输入参数,输入该区域对应的预测模型,得到该区域的第一预测异常率。

步骤205,将生理数据的实际异常率,以及取值为零的实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第二预测异常率。

具体地,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率后,可以将生理数据的实际异常率、用于指示影响因素的稀疏向量、活跃用户设备的密度和取值为零的实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第二预测异常率。

需要说明的是,这里的第二预测异常率,是指排除了感染目标疾病后因其他疾病引起的生理数据的异常率。例如,第二预测异常率,可以为感染季节性流感而引起的生理数据的异常率。

继续以上述示例为例,假设目标疾病为新型冠状病毒肺炎,实际发病数据为某区域官方公布的新型冠状病毒肺炎的实际发病数据。在排除目标疾病影响的条件下,将根据某一区域的用户设备在历史时段采集的生理数据确定的实际异常率、用于指示影响因素的稀疏向量、活跃用户设备的密度和取值为零的实际人群发病密度值作为输入参数,输入该区域对应的预测模型,得到该区域的第二预测异常率。

需要说明的是,步骤204和步骤205的执行顺序不做限定,上述仅作为一种示例性表述,还可以先执行步骤205,再执行步骤204,或者同时执行步骤204和步骤205。

步骤206,根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。

作为一种示例,用于预测生理数据的异常率的预测模型的数学模型可以如下公式所示:

r’t+1,k=cdnet({rt-j,k,rt-j,k,ct-j,k,ct-j,k,j=0,1,...,6},rct,k,dt,k)

其中,r’表示所预测的某一区域在预测时段的生理数据的异常率;r和r分别表示该区域在历史时段内的生理数据的实际异常率;c和c分别表示该区域在历史时段内的稀疏向量的特征;rc表示该区域目标疾病在相应历史时段的实际发病数据;d表示该区域的日活跃用户设备的密度;t为当前时段;k表示区域代号。

本申请实施例中,在通过预测模型预测生理数据在预测时段的生理异常率时,在受到目标疾病影响条件下,预测得到第一预测异常率为r’t+1,k,并在排除目标疾病影响条件下,预测得到第二预测异常率为r’t+1,k|rct,k=0。进而,可以根据公式p’t+1,k=r’t+1,k-{r’t+1,k|rct,k=0},计算第一预测异常率和第二预测异常率的差值,以确定设定区域中目标疾病所导致的生理数据的异常率。其中,p’t+1,k为计算得到的某一区域(代号为k)在预测时段感染目标疾病的异常率。

本申请实施例中,步骤206的实现过程,还可以参见上述实施例中步骤105的实现过程,在此不再赘述。

本申请实施例的生理数据的处理方法,通过根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率;获取设定区域中目标疾病在历史时段的实际发病数据;根据实际发病数据,确定实际人群发病密度值;将生理数据的实际异常率,以及实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第一预测异常率;将生理数据的实际异常率,以及取值为零的实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第二预测异常率;根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。由此,在目标疾病的实际发病数据进行弱监督的基础上,根据设定区域的用户设备采集的生理数据确定的实际异常率,以及相应区域的预测模型,预测未来时段目标疾病所导致的生理数据的异常率,提高了异常率预测的准确性。

在上述实施例的基础上,在确定预测时段内目标疾病所导致的生理异常率之后,还可以根据预测时段的异常率期望值生成训练样本,以根据不断增加的训练样本对预测模型进行更新,从而实现了根据在线学习的方式,使得预测模型的参数根据新的训练样本的而得到逐步调整,有利于提高模型预测的准确率。下面结合图4对上述过程进行详细介绍,图4为本申请实施例提供的第三种生理数据的处理方法的流程示意图。

如图4所示,在上述步骤105之后,该生理数据的处理方法还可以包括以下步骤:

步骤301,根据设定区域中目标疾病在预测时段的实际发病数据,确定预测时段目标疾病所导致的生理数据的异常率期望值。

其中,异常率期望值,是指预测时段目标疾病所导致的生理数据的实际异常值。

本申请实施例中,在获取到设定区域中目标疾病在预测时段的实际发病数据后,可以根据实际发病数据与该区域的常住人口总数的比值,确定该区域在预测时段目标疾病所导致的生理数据的异常率期望值。

步骤302,根据预测时段目标疾病所导致的生理数据的异常率期望值,生成训练样本。

本申请实施例中,确定预测时段目标疾病所导致的生理数据的异常率期望值后,可以根据该异常率期望值生成训练样本。

需要说明的是,由于预测模型为多个,不同区域对应的预测模型并不相同,在生成训练样本时,也是根据各区域对应的预测时段的目标疾病所导致的生理数据的异常率期望值生成的。

步骤303,根据训练样本,对预测模型进行更新。

本申请实施例中,根据预测时段的目标疾病所导致的生理数据的异常率期望值,生成训练样本后,可以通过生成的训练样本增加设定区域对应的训练样本,以通过设定区域增加后的训练样本对相应区域的预测模型进行更新。

作为一种可能的实现方式,可以根据当前周期对应的时间窗,获取生理数据的异常率期望值所属预测时段处于时间窗内的训练样本,以采用当前周期对应的时间窗内的训练样本,在当前周期前一个周期的预测模型基础上,训练得到当前周期的预测模型。

下面以a地区爆发的新型冠状病毒肺炎为例对预测模型进行更新进行详细说明,如图5所示,假设a地区的首例新型冠状病毒肺炎感染发生在某年12月1日之后,获取a地区各用户设备在该年12月1日之前采集的生理数据,并根据生理数据训练得到预测模型m0。然后以一个设定的时间窗往前滑动,通过将时间窗内的实际异常率作为训练样本,不断更新原有预测模型,得到新的模型m1、m2,等等。

例如,设定时间窗为一周,在训练预测模型m0时的训练样本可以是随机数,或者训练样本全部设置为0。在预测模型m0的基础上,将时间窗内的目标疾病所导致的生理数据的异常率期望值作为训练样本训练预测模型m1,如此类推,可以训练得到当前周期的预测模型。在不同的时间段,采用对应的预测模型来预测a地区的生理数据的实际异常率。图5中各时间窗内的训练样本存在重叠的现象,实现了对训练样本的重复利用。

还例如,参见图6,图6为本申请实施例提供的生理数据的处理结果示例图。由图6可知,本申请的预测模型预测得到的生理数据的异常率曲线和2020年的异常率期望值曲线呈拟合状态,可见,本申请的预测模型能够准确的预测出目标疾病的爆发趋势。

本申请实施例的生理数据的处理方法,通过根据设定区域中目标疾病在预测时段的实际发病数据,确定预测时段目标疾病所导致的生理数据的异常率期望值,根据预测时段目标疾病所导致的生理数据的异常率期望值,生成训练样本,根据训练样本,对预测模型进行更新。由此,通过不断的增加训练样本,使得预测模型的参数根据不断增加的训练样本而得到逐步调整,有利于提高模型的预测能力。

在上述实施例的基础上,可以根据设定区域中的多个预测时段的生理数据的异常率,绘制生理数据的异常率变化曲线,以根据变化曲线预测目标疾病实际发病数据的峰值时刻。下面结合图7对上述过程进行详细介绍,图7为本申请实施例提供的第四种生理数据的处理方法的流程示意图。

如图7所示,该生理数的处理方法,还可以包括以下步骤:

步骤401,根据多个预测时段目标疾病所导致的生理数据的异常率,绘制生理数据的异常率的变化曲线。

本申请实施例中,根据设定地域的生理数据的异常率,以及相应区域的预测模型,可以预测出多个预测时段目标疾病所导致的生理数据的异常率,进而,可以绘制出多个预测时段生理数据的异常率的变化曲线。

仍以a地区爆发的新型冠状病毒肺炎为例,预测得到a地区爆发的新型冠状病毒肺炎在多个预测时段的生理数据的异常率后,绘制的生理数据的异常率的变化曲线如图8所示。同时,图8中还绘制了相应时段官方公布的a地区日累计新型冠状病毒肺炎的实际感染人数。

步骤402,根据变化曲线中峰值对应时刻,预测目标疾病实际发病数据的峰值时刻。

本申请实施例中,根据多个预测时段目标疾病所导致的生理数据的异常率,绘制生理数据的异常率的变化曲线后,可以确定出变化曲线中的峰值对应时刻,进而可以根据峰值对应时刻预测目标疾病实际发病数据的峰值时刻。由此,通过绘制的生理数据的异常率的变化曲线中的峰值对应时刻,可以提前预测出目标疾病实际发病数据的峰值,与官方发布的目标疾病的实际发病数据相比,本申请中的数据更新更加及时。

继续以图8中绘制的生理数据的异常率的变化曲线为例,由图8可以确定新型冠状病毒肺炎感染的异常率曲线的峰值时刻(即1月28日),对应官方公布的日累计新型冠状病毒肺炎感染人数曲线的上升斜率最大的时刻(即2月8日)。由此可见,本申请的预测模型可以提前11天预测新型冠状病毒肺炎在a地区爆发达到高峰的时间。

可以理解为,在新型冠状病毒肺炎感染的异常率曲线的峰值时刻,a地区的新型冠状病毒肺炎感染的人数已经达到最大值,但是由于存在潜伏期,病毒检测需要一定的时间确定检测结果等原因,导致官方公布的新型冠状病毒肺炎感染人数在2月8日才达到最多。可见,本申请的预测模型能够准确的预测出病毒的爆发趋势,并能够提前预测出爆发高峰到来的时间。

本申请实施例的生理数据的处理方法,通过根据多个预测时段目标疾病所导致的生理数据的异常率,绘制生理数据的异常率的变化曲线;根据变化曲线中峰值对应时刻,预测目标疾病实际发病数据的峰值时刻。由此,该方法根据生理数据的异常率变化曲线中峰值对应时刻,提前预测目标疾病实际发病数据的峰值时刻,实现了提前预测出爆发高峰到来的时间。

为了实现上述实施例,本申请还提出一种生理数据的处理装置。

图9为本申请实施例提供的一种生理数据的处理装置的结构示意图。

如图9所示,该生理数据的处理装置900,可以包括:确定模块910、获取模块920、第一预测模块930、第二预测模块940和处理模块950。

其中,确定模块910,用于根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率。

获取模块920,用于获取设定区域中目标疾病在历史时段的实际发病数据。

第一预测模块930,用于在受到目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据目标疾病在所述历史时段的实际发病数据确定的。

第二预测模块940,用于在排除目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率。

处理模块950,用于根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。

作为一种可能的情况,第一预测模块930,还用于根据实际发病数据,确定实际人群发病密度值;

将生理数据的实际异常率,以及实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第一预测异常率;

第二预测模块940,还用于将生理数据的实际异常率,以及取值为零的实际人群发病密度值作为输入参数,输入设定区域对应的预测模型,得到第二预测异常率。

作为另一种可能的情况,该生理数据的处理装置900,还可以包括:

第二确定模块,用于根据设定区域中目标疾病在预测时段的实际发病数据,确定预测时段目标疾病所导致的生理数据的异常率期望值。

生成模块,用于根据预测时段目标疾病所导致的生理数据的异常率期望值,生成训练样本。

更新模块,用于根据训练样本,对预测模型进行更新。

作为另一种可能的情况,更新模块,还用于:

根据当前周期对应的时间窗,获取生理数据的异常率期望值所属预测时段处于时间窗内的训练样本;

采用当前周期对应的时间窗内的训练样本,在当前周期前一个周期的预测模型基础上,训练得到当前周期的预测模型。

作为另一种可能的情况,输入参数还包括用于指示影响因素的稀疏向量,预测模型包括:

第一子神经网络,用于输入稀疏向量,以提取稀疏向量的特征;

第二子神经网络,用于输入稠密向量,以提取稠密向量的特征;其中,稠密向量包括历史时段生理数据的实际异常率、目标疾病在历史时段的实际人群发病密度值和活跃用户设备的密度;历史时段,包括最近设定天数;活跃用户设备,为在线时长满足阈值的用户设备。

全连接网络,用于连接第一子神经网络和第二子神经网络,用于根据稀疏向量的特征,以及稠密向量的特征预测生理数据的异常率。

作为另一种可能的情况,稀疏向量包括天气状态、节假日信息或季节信息中的一个或多个组合。

作为另一种可能的情况,设定区域是全球、大洲、国家、省或市。

作为另一种可能的情况,确定模块910,还可以用于:

根据设定区域中历史时间段内各用户设备的在线时长,确定在线时长满足阈值的活跃用户设备;

获取在线时长满足阈值的用户设备的生理数据;

根据所获取的在线时长满足阈值的用户设备的生理数据,确定生理数据的实际异常率。

作为另一种可能的情况,该生理数据的处理装置900,还可以包括:

绘制模块,用于根据多个预测时段目标疾病所导致的生理数据的异常率,绘制生理数据的异常率的变化曲线;

预测模块,用于根据变化曲线中峰值对应时刻,预测目标疾病实际发病数据的峰值时刻。

作为另一种可能的情况,生理数据包括睡眠时长和静息心率;确定模块910,还用于:

对设定区域中任意用户设备在历史时段采集的生理数据,若静息心率大于心率阈值,且睡眠时长大于时长阈值,则将用户设备识别为异常用户设备;

根据异常用户设备占设定区域中在历史时段采集生理数据的总用户设备的比率,确定生理数据的实际异常率;

需要说明的是,前述对生理数据的处理方法实施例的解释说明也适用于该实施例的生理数据的处理装置,此处不再赘述。

本申请实施例的生理数据的处理装置,根据设定区域中各用户设备在历史时段采集的生理数据,确定生理数据的实际异常率;获取设定区域中目标疾病在历史时段的实际发病数据;在受到目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第一预测异常率;其中,目标疾病的影响程度是根据目标疾病在历史时段的实际发病数据确定的;在排除目标疾病影响条件下,根据生理数据的实际异常率,预测生理数据在预测时段的第二预测异常率;根据第一预测异常率和第二预测异常率的差值,确定设定区域中目标疾病所导致的生理数据的异常率。由此,在目标疾病的实际发病数据进行弱监督的基础上,根据设定区域中各用户设备采集的生理数据确定的生理数据的实际异常率,预测未来时段目标疾病所导致的生理数据的异常率,提高了预测的准确性。

为了实现上述实施例,本申请还提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述实施例中所述的生理数据的处理方法。

为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例中所述的生理数据的处理方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1