基于迁移学习的新冠危险阶段评估方法和系统

文档序号:26091520发布日期:2021-07-30 18:00阅读:121来源:国知局
基于迁移学习的新冠危险阶段评估方法和系统
本发明涉及新冠等传染病领域,具体涉及基于迁移学习的新冠危险阶段评估方法和系统,主要功能是判断当前新冠危险阶段,对于了解新冠整体发展趋势与疫情下的社会管理具有重要意义。
背景技术
:目前新冠阶段的评估还存在以下缺点:一是没有一个好的新冠风险阶段评估指标的定义;二是在新冠爆发的初期,由于缺乏本国疫情的数据,所以需要其他国家的数据来帮助该过进行新冠危险阶段的确定,而在不同国家疫情数据差别巨大,迁移学习的方法有待提出。故新冠疫情危险阶段评估存在巨大的挑战。技术实现要素:本发明要克服现有技术的上述缺点,提出一种基于迁移学习的新冠危险阶段评估方法和系统。针对上述情况,本发明先是进行了新冠危险阶段的定义,提出了一种新冠危险阶段评估方法。进一步提出了完整的数据迁移评估流程,对新冠危险阶段进行评估,为政府决策提供有效的依据。本发明是通过以下技术方案达到上述目的:基于迁移学习的新冠危险阶段评估方法,包括如下步骤:(1)提出新冠危险阶段;(2)设计解码器;(3)预训练解码器,以获得标准特征空间映射方法;(4)通过解码器,对国家新冠数据按照相似程度分类;(5)定量分析每一类别数据的特征;(6)待评估国家根据数据特征匹配相应国家类别;(7)基于实例的迁移学习评估;(8)标准化后基于实例的迁移学习评估;其中,所述步骤(1)具体包括如下步骤:目前,各国还没有统一的评估新冠肺炎风险阶段的标准。现有评估标准一般以确诊病例数为依据。但这种以数量为基础的风险阶段评估方法存在诸多问题,一是尚不清楚疫情未来发展趋势,二是无法从一个完整的确诊周期来评估疫情的风险阶段。我们的评估标准是以完整的确诊周期为基础,结合未来疫情发展趋势。具体评价标准如下定义定义:新冠危险阶段。我们需要引入一个标准—recent_to_max,用来描述一个国家所处的感染状态。rdc代表最近三天感染量的平均值,天数太短会对每日上下波动太敏感,天数太长会导致早期比率高的国家差别不大。三天比较合理,且能赶上最新的增长趋势。mdc表示整个感染周期中最大每日确诊量,为尽可能消除误差,我们也是去整个covid-19感染周期中最大三天确诊数的平均值。casen表示某天的确诊数量。具体covid-19阶段确定见表1。经过多次尝试,这个分类标准是最符合我们目前研究的。在所有国家的整个covid-19周期上打上标签如图2所示,在图上我们可以清楚的看到标签的分布十分的契合covid-19周期的发展。表1其中,所述步骤(2)具体包括如下步骤:lstm可以捕获输入的定量特征和趋势。如图1所示:编码器由lstm加一层全连层在经过argmax函数组成。输入为历史4天的covid-19感染量和未来一天的covid-19确诊数据,输出为当前covid-19所处的阶段。具体公式如下:取经过lstm的最后一个最为输出。ylable就是我们所需要的危险阶段评估结果。损失函数用如下公式所示。前半部分最小化真实值与预测值之间的错误。后半部分lreg为l2正则化项用来避免函数的过拟合,λ是一个超参数。其中,所述步骤(3)具体包括如下步骤:31.数据预处理;从全球的covid-19确诊数据集的187个国家中选择出recent_to_max小于等于0.1且总确诊人数大于3000的国家,这些国家被认为已经处于一个完整周期的末尾或已经超过了这个周期。提前排除有明显数据错误国家,再按照前面的规则,给已选择的国家数据打上相应的标签。32.正式预训练;我们依次使用一个国家的新冠确诊数据进行训练,我们一般选择训练后的解码器能够100%解码出所训练的国家作为停止标志。其中,所述步骤(4)具体包括如下步骤:具体的分类过程如下:我们每次随机吧一个国家疫情数据作为基准训练解码器,用该解码器解码所有国家,得到其与每个国家的相似程度,我们选择相似程度大于一定标准的数据作为一类。一直循环,直到所有的数据都分好类。其中,所述步骤(5)具体包括如下步骤:不同类别数据的差异主要体现在确诊病例数上。同一类别的国家具有类似的covid-19周期变化和最大分布。同一类别国家的平均确诊病例数大致相同。因此,我们应该在每个类别的数据中找到特征趋势,这反过来可以帮助我们对未知类别的数据进行分类。通过对数据的统计分析,我们得到这些特征。其中,所述步骤(6)具体包括如下步骤:根据特征确定所需要评估的国家处于哪一类别。其中,所述步骤(7)具体包括如下步骤:对于同一类数据,我们可以直接迁移数据,解决数据缺乏的问题。直接迁移统一类别数据来训练解码器,然后使用该解码器解码出所需要评估国家的当前新冠危险阶段。其中,所述步骤(8)具体包括如下步骤:标准化后基于实例的评估过程见图7,所有国家的数据都根据自己国家数据的最大值进行标准化处理,都标准化值[0,1],即映射到同一分布空间。然后这一部分数据作为源数据去训练解码器。而需要评估的国家,因为不知该国家的新冠确诊的最大值,所以根据该国家特征匹配到国家类别的标准化规则去标准化该国家。标准化后的数据输入解码器得到该国家的新冠危险阶段。实施前述的基于迁移学习的新冠危险阶段评估方法的系统,包括依次连接的新冠危险阶段评价标准模块、解码器、解码器预训练模块、国家新冠疫情数据分类模块、数据分析模块、国家类别匹配模块、迁移学习评估模块、标准化后迁移学习评估模块。本发明的优点是:1.根据新冠周期对新冠危险等级进行了划分,使抽象的新冠危险具体化。2.通过对不同疫情确诊数据特征分析,充分利用其它国家数据以附图说明图1是本发明方法的整体流程图。图2(a)~图2(p)是本发明的定义后的实例中新冠危险阶段展示图,其中图2(a)是a国;图2(b)是b国;图2(c)是c国;图2(d)是d国;图2(e)是e国;图2(f)是f国;图2(g)是g国;图2(h)是h国;图2(i)是i国;图2(j)是j国;图2(k)是k国;图2(m)是m国;图2(n)是n国;图2(o)是o国;图2(p)是p国。图3是本发明实例中新冠国家数据相似度展示图。图4是本发明实例中分类标准选择图。图5是本发明实例中新冠国家数据分类后的疫情确诊展示图。图6是本发明实例中新冠国家数据分类后的周期平均确诊数展示图。图7是本发明的标准基于实例迁移学习方法说明图。图8(a)~图8(i)是本发明实例中在9个国家的实际评估效果展示,其中图8(a)是a国;图8(b)是b国;图8(c)是e国;图8(d)是h国;图8(e)是j国;图8(f)是k国;图8(g)是q国;图8(h)是m国;图8(i)是o国。具体实施方案下面结合9个国家新冠危险阶段评估的实例对本发明进行进一步描述。本实例中的新冠危险阶段评估方法整体方法如图1所示,具体包括以下步骤:(1)提出新冠危险阶段:目前,各国还没有统一的评估新冠肺炎风险阶段的标准。现有评估标准一般以确诊病例数为依据。但这种以数量为基础的风险阶段评估方法存在诸多问题,一是尚不清楚疫情未来发展趋势,二是无法从一个完整的确诊周期来评估疫情的风险阶段。我们的评估标准是以完整的确诊周期为基础,结合未来疫情发展趋势。具体评价标准如下定义定义:新冠危险阶段。我们需要引入一个标准—recent_to_max,用来描述一个国家所处的感染状态。rdc代表最近三天感染量的平均值,天数太短会对每日上下波动太敏感,天数太长会导致早期比率高的国家差别不大。三天比较合理,且能赶上最新的增长趋势。mdc表示整个感染周期中最大每日确诊量,为尽可能消除误差,我们也是去整个covid-19感染周期中最大三天确诊数的平均值。casen表示某天的确诊数量。具体covid-19阶段确定见表1。经过多次尝试,这个分类标准是最符合我们目前研究的。在所有国家的整个covid-19周期上打上标签如图2所示,在图上我们可以清楚的看到标签的分布十分的契合covid-19周期的发展。(2)设计解码器:lstm可以捕获输入的定量特征和趋势。如图1所示:编码器由lstm加一层全连层在经过argmax函数组成。输入为历史4天的covid-19感染量和未来一天的covid-19确诊数据,输出为当前covid-19所处的阶段。具体公式如下:取经过lstm的最后一个最为输出。ylable就是我们所需要的危险阶段评估结果。损失函数用如下公式所示。前半部分最小化真实值与预测值之间的错误。后半部分lreg为l2正则化项用来避免函数的过拟合,λ是一个超参数。(3)预训练解码器,以获得标准特征空间映射方法:31.数据预处理;从全球的covid-19确诊数据集的187个国家中选择出recent_to_max小于等于0.1且总确诊人数大于3000的国家,这些国家被认为已经处于一个完整周期的末尾或已经超过了这个周期。提前排除有明显数据错误国家,再按照前面的规则,给已选择的国家数据打上相应的标签。32.正式预训练;我们依次使用一个国家的新冠确诊数据进行训练,我们一般选择训练后的解码器能够100%解码出所训练的国家作为停止标志。(4)通过解码器,对国家新冠数据按照相似程度分类:图3是我们,把奥地利作为预训练国家得出来的国家相似度,图4展示了当我们选择不同的相似度标准之后对基于实例的迁移学习后的新冠危险阶段评估的准确度,所以我们选择80%这个标准。具体的分类过程如下:我们每次随机吧一个国家疫情数据作为基准训练解码器,用该解码器解码所有国家,得到其与每个国家的相似程度,我们选择相似程度大于80%的数据作为一类。一直循环,直到所有的数据都分好类。实例中我们的分类结果见表2表2(5)定量分析每一类别数据的特征:从图5,图6中可以看出,不同类别数据的差异主要体现在确诊病例数上。在图5中,同一类别的国家具有类似的covid-19周期变化和最大分布。在图6中,同一类别国家的平均确诊病例数大致相同。因此,我们应该在每个类别的数据中找到特征趋势,这反过来可以帮助我们对未知类别的数据进行分类。通过对数据的统计分析,我们得到了这些特征,如表2所示。(6)待评估国家根据数据特征匹配相应国家类别:根据特征确定所需要评估的国家处于哪一类别。(7)基于实例的迁移学习评估:对于同一类数据,我们可以直接迁移数据,解决数据缺乏的问题。直接迁移统一类别数据来训练解码器,然后使用该解码器解码出所需要评估国家的当前新冠危险阶段。(8)标准化后基于实例的迁移学习评估:标准化后基于实例的评估过程见图7,所有国家的数据都根据自己国家数据的最大值进行标准化处理,都标准化值[0,1],即映射到同一分布空间。然后这一部分数据作为源数据去训练解码器。而需要评估的国家,因为不知该国家的新冠确诊的最大值,所以根据该国家特征匹配到国家类别的标准化规则去标准化该国家。标准化后的数据输入解码器得到该国家的新冠危险阶段。9个国家依次经过(6)(7)(8)后的评估结果见图8。真实值表示真实的新冠危险阶段,i.代表基于实例的迁移学习评估,n.i.表示标准化后基于实例的迁移学习评估,括号里面的31.25%表示对源数据的利用率,其他以此类推。从结果中我们可以看到,该评估方式十分契合新冠疫情的发展,并且在一个未曾发生新冠疫情的国家能够成功实施,这对于政府工作的安排具有重要参考价值。在面对未知疫情时,有一定的指导意义。实施前述的基于迁移学习的新冠危险阶段评估方法的系统,包括依次连接的新冠危险阶段评价标准模块、解码器、解码器预训练模块、国家新冠疫情数据分类模块、数据分析模块、国家类别匹配模块、迁移学习评估模块、标准化后迁移学习评估模块;其中,新冠危险阶段评价标准模块具体包括:定义具体评价标准如下:定义:新冠危险阶段;我们需要引入一个标准—recent_to_max,用来描述一个国家所处的感染状态;rdc代表最近三天感染量的平均值,天数太短会对每日上下波动太敏感,天数太长会导致早期比率高的国家差别不大;三天比较合理,且能赶上最新的增长趋势;mdc表示整个感染周期中最大每日确诊量,为尽可能消除误差,取整个covid-19感染周期中最大三天确诊数的平均值;casen表示某天的确诊数量;具体covid-19阶段确定见表1;rtm范围covid-19危险阶段[0,0.2)低分险[0.2,0.5)中风险[0.5,0.8)高风险[0.8,+∞)严重表1其中,解码器具体包括:lstm能捕获输入的定量特征和趋势;编码器由lstm加一层全连层在经过argmax函数组成;输入为历史4天的covid-19感染量和未来一天的covid-19确诊数据,输出为当前covid-19所处的阶段;具体公式如下:取经过lstm的最后一个最为输出;ylable就是所需要的危险阶段评估结果;损失函数用如下公式所示;前半部分最小化真实值与预测值之间的错误;后半部分lreg为l2正则化项用来避免函数的过拟合,λ是一个超参数;其中,解码器预训练模块具体包括:数据预处理子模块和正式预训练子模块;数据预处理子模块:从全球的covid-19确诊数据集的187个国家中选择出recent_to_max小于等于0.1且总确诊人数大于3000的国家,这些国家被认为已经处于一个完整周期的末尾或已经超过了这个周期;提前排除有明显数据错误国家,再按照前面的规则,给已选择的国家数据打上相应的标签;正式预训练子模块:依次使用一个国家的新冠确诊数据进行训练,选择训练后的解码器能够100%解码出所训练的国家作为停止标志;其中,国家新冠疫情数据分类模块的具体的分类过程如下:每次随机吧一个国家疫情数据作为基准训练解码器,用该解码器解码所有国家,得到其与每个国家的相似程度,选择相似程度大于一定标准的数据作为一类;一直循环,直到所有的数据都分好类;其中,数据分析模块具体包括:不同类别数据的差异主要体现在确诊病例数上;同一类别的国家具有类似的covid-19周期变化和最大分布;同一类别国家的平均确诊病例数大致相同;因此,应该在每个类别的数据中找到特征趋势,这反过来可以帮助我们对未知类别的数据进行分类;通过对数据的统计分析,我们得到这些特征;其中,国家类别匹配模块根据特征确定所需要评估的国家处于哪一类别;其中,迁移学习评估模块包括:对于同一类数据,直接迁移数据,解决数据缺乏的问题;直接迁移统一类别数据来训练解码器,然后使用该解码器解码出所需要评估国家的当前新冠危险阶段;其中,标准化后迁移学习评估模块具体包括:标准化后基于实例的评估,所有国家的数据都根据自己国家数据的最大值进行标准化处理,都标准化值[0,1],即映射到同一分布空间;然后这一部分数据作为源数据去训练解码器;而需要评估的国家,因为不知该国家的新冠确诊的最大值,所以根据该国家特征匹配到国家类别的标准化规则去标准化该国家;标准化后的数据输入解码器得到该国家的新冠危险阶段。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1