一种连续动态运动和生理数据处理分析系统及方法与流程

文档序号:13907148阅读:973来源:国知局
一种连续动态运动和生理数据处理分析系统及方法与流程

本发明涉及一种基于大数据的人体运动数据的处理分析方法及系统,尤其涉及一种基于具有一定持续性的连续动态运动数据以及生理数据的处理及分析。



背景技术:

糖尿病、高血压、冠心病、肿瘤等慢性疾病呈逐年递增之势,已严重威胁着人类的生命健康。2013年我国卫生总费用超过3万亿元,且近三年的平均增长速度达到13.2%,是同期gdp增长速度的1.62倍。虽然卫生部等部门投入了大量的人力和资金,但治疗效果并不理想。这种“被动医疗”的病后治疗理念只能导致病患越来越多,花费越来越高。因此跳出“被动医疗”的末端治理局限,转向“主动健康”的源头治理,才能从根本上破解医疗卫生体系的困境。

慢性疾病多数是由长期过量饮食、运动量不足导致的营养失衡或吸烟、饮酒等不良的生活习惯所致。运动对健康的促进作用已经被越来越多的研究证实。但调查发现并不是所有形式的运动均具有积极效应,只有长期有规律的坚持运动才能对健康产生积极效应。此外,国内外相关研究证实,“体育锻炼参与容易,坚持难”是一种普遍存在的现象,例如,只有不到20%的北美成年人能够长期坚持体育锻炼,而约有50%的人在体育锻炼计划的前6个月就因坚持不下去而中途退出。

要达到科学健身促进健康目标,涉及3个方面关键问题:(1)如何科学设定运动强度和运动量;(2)如何判定运动是否促进了健康;(3)如何保证健身方案执行下去。

针对问题(1),传统的做法是通过最大摄氧量的测定衡量人的最大运动功能能力。具体测试方法包括采用气体代谢、功率自行车、台阶试验、心率测定等方法。根据测定的最大摄氧量设定目标运动强度,目标运动强度常常用最大摄氧量的百分比表示,具体使用中往往采用靶心率,靶心率设定的精度取决于回归方程的拟合精度,以及当时所测定的数据的准确度和精度,并且,需要测定非常庞大大样本人群。因此,传统的方法是基于既往的静态数据建立的线性模型,无法对动态的、连续的数据进行很好处理。

针对问题(2),传统方法的原理是根据经过一段时间,比如:1~3个月,观察在设定的运动强度锻炼后,观察人体的一些间接生理生化方面指标是否发生了有益的变化,比如肌肉做功能力增加、心脏能力增强、肺功能加大等来判断该运动方法是否对人体有健康促进,进而间接证明运动对健康的良好作用。由此可见,首先,传统方法没有给出运动促进健康的基本规律和机理,而是通过间接证明;其次,对间接指标的判断的时间间隔往往比较长,大部分等不到下一次观察的时候就放弃了运动方案;当然,由于间接指标的变化比较缓慢,无法实时对健身行为做出快速反馈。

针对问题(3),传统健身科学体系中,运动坚持方法尚未有成熟的方法,大都停留于理论探讨阶段,描述问题阶段,缺乏运动行为量化的数据研究,更缺乏有效的技术方法实施。

随着可穿戴、物联网、云计算和大数据等技术的快速发展,集成感知、计算和通信能力的普适智能系统已逐步融入到人类的日常生活中,可以实时不间断的连续获取健身健康数据的能力日益增强。比如运动手环、手表等可穿戴的设备,可以获得动作、心率、血压等连续动态变化的数据。因此,我们可以根据这些连续不间断的动态大数据中所涌现出来的特征,通过人体对外界刺激的适应能力评估人体行为对健康的影响程度,从结构决定功能的角度整体研究运动行为的变化,并通过连续不断的海量数据预测判断运动坚持及退出状态,从而实现在线监测个体运动行为。这种基于健身大数据的运动坚持模型和干预方法,在国内外尚属空白,具有重大的科学意义和社会价值。



技术实现要素:

基于现有技术中存在的上述问题,以及市场需求,本发明提供了以下的技术方案:

一方面,本发明实施例提供一种连续动态运动和生理数据处理分析方法,该方法包括:

s1、获取健身行为产生的连续、动态数据,并对所述数据进行预处理;所述预处理后的数据至少包含强度参数、量参数、持续时间参数之一;以及依据所述强度参数、量参数、持续时间参数分别形成分布表;

s2、对预处理后的数据进行特征提取,建立识别模型,对行为进行识别;

并对识别后的数据进行目标数据集截取,获得关键数据集;所述关键数据集指影响数据系统性发展走向的数据集;

s3、对所述关键数据集进行参数提取,获得运动行为的参数;所述运动行为的参数至少包含稳态强度参数、稳态节奏参数、绝对稳态强度参数之一;

所述稳态强度参数代表运动强度;所述稳态节奏参数代表运动节奏;所述绝对稳态强度参数代表目标数据集中变化较小的运动强度;

s4、依据所述运动行为的参数,对所述目标数据集进行判定;所述判定包含对所述目标数据集进行分级。

优选地,所述步骤s1中,对数据进行预处理,包括:以预设的时间周期t1,截取所述数据;以及

以每一所述时间周期内的相同时间点数据,作为比对分析依据;

若所述相同时间点数据缺失,则以上一时间周期内的同一时间点数据作为填补。

优选地,所述步骤s1中,对数据进行预处理,还包括:

删除所述数据中的脏数据,并在删除脏数据之后,填补缺失的数据字段;所述数据字段指分析中必须的数据字段。

优选地,所述步骤s1中,对数据进行预处理,还包括对异常数据的识别和处理,具体为:对前一完整时间周期内的对应的每天数据进行统计,求解所述每天数据的平均值和标准方差;并且

获取最新数据,判断所述最新数据是否偏离所述平均值a倍标准方差的值;若是,则将所述最新数据替换为前一时间周期内的对应的数据。

优选地,所述强度参数是指在测量过程中,单位时间内所获得的数据的量;所述量参数是指一时间段内测量的某参数的总量。

优选地,所述s1中,所述预处理后的数据包含持续时间参数,所述持续时间参数是指一次数据记录中不间断连续的时间。

优选地,形成强度参数分布表进一步包括:强度参数-频次分布,是指将数据中的某一强度参数,按照记录的出现次数进行累加统计,构造该数据中所有强度参数所对应的频次表;

强度参数-时间贡献分布,是指将数据中的强度参数所占用的时间进行统计,按照预设顺序,累计强度参数对应的时间,构造强度参数所对应的时间贡献表;

强度参数-总量贡献分布,是指将数据中的强度参数所贡献的总量进行统计,按照预设顺序,累计其对应的运动数据的总量,构造该强度参数所对应的总量贡献表。

优选地,形成持续时间参数分布表进一步包括:持续时间参数-频次分布,是指将数据中的某一个持续时间参数按照记录的出现次数进行累加统计,构造数据中所有持续时间参数的频次表;

持续时间参数-时间贡献分布,是指将数据中的持续时间参数按照预设顺序,累计其对应的时间,构造持续时间参数对应的时间贡献表;

持续时间参数-总量贡献分布,是指将数据中的持续时间参数总量进行统计,累计其对应的时间总量,构造持续时间参数对应的总量贡献表。

优选地,所述s2中,依据强度参数-频次分布、强度参数-时间贡献分布、强度参数-总量贡献分布、持续时间参数-频次分布、持续时间参数-时间贡献分布、持续时间参数-总量贡献分布,提取分布特征。

优选地,所述s2中,进一步包括:

采用支持向量机及马尔科夫模型,对运动行为进行识别;所述支持向量机依据预处理后的数据提取的特征,对数据进行分类,完成行为识别;所述马尔科夫模型把运动的每一种静态姿势定义为一个状态或者一个状态的集合,通过网络的方式将这些状态连接起来,状态和状态之间的切换采用概率来描述,完成运动行为的识别。

优选地,所述目标数据集截取,进一步包括:在所述识别后的数据中,选取要分析的数据集,再基于所述数据集的分布表,获得分布特征,基于所述分布特征,进行聚类;以及

将总量贡献占比超过预设阈值w1的数据作为目标数据,形成目标数据集。

优选地,获得目标数据集后,还包括对所述目标数据集进行评估,计算所述目标数据集的行为熵;

所述行为熵计算方法如下:

其中,r表示一类行为的出现概率,n表示行为事件数量,xi表示第i个行为的概率。

优选地,将强度参数大于所述预设阈值w1的区间,设定为稳态强度区间;所述稳态强度区间中的强度参数设定为稳态强度参数;所述稳态强度参数代表运动强度。

优选地,将持续时间参数大于所述预设阈值w1的区间,设定为稳态节奏区间;所述稳态节奏区间中的持续时间参数设定为稳态节奏参数;所述稳态节奏参数代表运动节奏。

优选地,计算所述行为熵最小的目标数据集,该目标数据集所对应的强度参数定义为绝对稳态强度参数,所述绝对稳态强度参数所对应的取值区间设定为绝对稳态强度参数区间。

优选地,所述s4中,所述对目标数据集进行分级,包括:对目标数据集求取均值及标准方差,将均值±1个标准方差,作为基准级别;每增加一个标准方差增加1个级别,反之,减少1个级别。

优选地,所述步骤s4之后,还可以包括:

s5、依据所述的判定结果,设置运动方案;

s6、对所述运动方案进行过程中产生的新数据进行收集,依据所述新数据,作为所述运动方案的调整依据;

s7、依据所述新数据,对运动行为进行持续性判定。

优选地,所述s6中,进一步包括,将所述新数据与过往数据形成新的数据集,计算所述新的数据集的稳态强度参数;

若该稳态强度参数达到了预定的目标数据集的分级级别,则调整运动方案。

优选地,所述s6中,进一步包括,将所述新数据与过往数据形成新的数据集,计算所述新的数据集的行为熵,对新的数据集数据进行评估。

优选地,所述s7进一步包括:

s71、设定运动行为的持续性模型;所述模型采用马尔科夫模型;

s72、求取模型的转移矩阵;

s73、求取第n个单位时间时的运动状态;所述n为大于等于1的自然数;

s74、求取长期运动状态。

优选地,所述s71中,所述持续性模型分为z个状态,所述状态之间的转移时间为一个单位时间,所述状态之间的转移只依赖于当前状态,初始状态可以根据不同个体来选取。

优选地,所述s72中,所述转移矩阵的求取方法为:

令{x(n),n≥0}为一个时间齐次的马尔科夫链,其一步转移矩阵为:

p=(pij)z×z,初始概率向量为α0=(α1,α2,…,αz),

则,第n个单位时间时,运动状态为:α0pn

其中,αi为马尔科夫向量。单位时间可以是例如1天,一周等。此处,也可以采用二阶齐次马尔科夫模型过程处理。

优选地,所述s74中,所述长期运动状态可通过下列线性方程获得:

其中上述方程的解x=(x1,x2,…,xz)长期运动状态,其表示在长期运动状态下,主动状态在第i种状态的可能性为xi,其中,i=1,2,…,z。

优选地,所述转移矩阵中的元素的估计,通过如下方式获得:

通过运动情况数据的汇集,得到pij的估计,即

其中nij为从状态i到状态j的转移次数,所述转移为相邻的单位时间间的转移,ni·为从状态i到所有状态的转移次数。

优选地,所述方法还可以包括:

s75、对所述持续性模型进行验证;所述验证通过一定量的运动坚持数据来检验所述持续性模型的离散几何分布是否成立来实现。

优选地,所述验证方法为,通过kolmogorov-smirnov分布拟合检验进行验证:

令pearsonχ2统计量为:

其中ni为实际观测数,ei为理论平均数,k为分组数;如果则拒绝几何分布。

在另一个方面,本发明还提供了一种实时在线健康指示方法,该方法包括:收集以往的运动数据,并对所述运动数据进行预处理;

基于所述预处理后的运动数据,对运动行为进行识别,并基于识别后的运动行为及预处理后的运动数据,进行运动行为评估;

至少部分地基于运动行为评估结果、识别后的运动行为及预处理后的运动数据,设置运动数据目标方案;

收集所述运动数据目标方案执行过程中产生的新数据,计算所述运动数据目标方案的执行程度,至少部分地基于所述执行程度及所述运动数据,获取所述执行程度的评估值;

当所述评估值满足一预设区间时,优化所述运动数据目标方案;当所述评估值不满足所述预设区间时,进行预警,并修改所述运动数据目标方案。

优选地,对所述运动数据进行预处理,包括:以预设的时间周期t1,截取所述数据;以及

以每一所述时间周期内的相同时间点数据,作为比对分析依据;

若所述相同时间点数据缺失,则以上一时间周期内的同一时间点数据作为填补。

优选地,对所述运动数据进行预处理,还包括:求取所述运动数据的参数,并建立所述参数的分布数据,基于所述分布数据求取所述参数的分布特征;所述参数至少包括强度参数、量参数、持续时间参数之一。

优选地,至少部分地基于所述参数及所述分布特征,建立行为模型;以及

基于所述行为模型,对运动行为进行识别。

优选地,基于所述行为模型以及运动行为的识别结果,截取所述运动数据中的目标数据集;以及

基于所述目标数据集进行运动数据的评估。

在又一个方面,本发明还提供了一种连续动态运动和生理数据处理分析系统,该系统包括:运动大数据预处理模块,用于对收集到的运动数据进行预处理:

连续动态数据特征获取模块,用于对预处理后的运动数据提取分布特征;

行为识别模块,用于基于所述分布特征,建立运动模型,并进行行为识别;

行为评估模块,用于基于所述预处理后的运动数据及运动行为识别结果,对运动行为进行评估;

方案制定模块,用于基于评估结果、预处理后的运动数据及运动行为识别结果,设置运动数据目标方案;

运动坚持监测模块,用于基于所述运动数据目标方案执行中产生的新数据,计算所述运动数据目标方案的执行程度,至少部分地基于所述执行程度及所述运动数据,计算所述执行程度的评估值;

在线实时干预模块,用于基于所述执行程度的评估值,重新设置所述运动数据目标方案。

优选地,所述系统进一步包括:系统融合模块,用于将运动大数据预处理模块、连续动态数据特征获取模块、行为识别模块、行为评估模块、方案制定模块、运动坚持监测模块、在线实时干预模块进行融合,以及协调各模块间的数据传输及数据调用。

优选地,所述系统还可以与用户终端建立通信连接,以与所述用户终端进行数据交互。该些用户终端可以是例如手环、智能手机、运动胸带、运动监护设备、其他可穿戴智能设备等等。

与现有技术相比,本发明技术方案至少具有以下的有点:

(1)本发明实现了对日常生活中个体化的、日常生活化的、连续动态的运动强度和量的实时评估,尤其使用于诸如手环手表等可穿戴设备采集的个体化、日常性连续动态运动行为数据的分析。本发明分析方式更加科学深入、实时有效,且成本极低。

(2)本发明首次用“稳态强度”度量运动强度,以取代传统理论所使用的“最大摄氧量”度量方法。稳定状态是根据“运动熵”来确定。用“稳态强度”描述更加符合一个人的动态变化规律,同时,又可以用“运动熵”来量化稳态的程度。这种方法成本极低,并且可以实时分析处理。

(3)本发明便于形成行为坚持习惯的统一“刺激一适应”的机制模型,相比传统的健身理论从微观角度,利用间接影响证明运动促进健康的方法更加普适和有效,同时也解决了运动坚持干预的工程化问题。

(4)本发明首次提出了运用连续动态的个体运动和人体生理数据,根据系统涌现理论建立模型,并根据现有条件预测判断随后的行为变化,是一种基于系统演变的方法。这种方法相比传统理论体系靠找出引起机体变化证据的循证方法更加适合高度复杂的人体系统。

(5)本发明实现了在线的、实时的运动健康指导。该模式通过大数据计算,利用api接口为第三方业务系统提供计算服务。通过实时在线计算当前运动强度和量与目标值的差距,并且实时在线提供指导的方案。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明一实施例的系统结构示意图;

图2为本发明一实施例的方案流程图;

图3为本发明一实施例的方法模块图。

具体实施方式

下面结合附图对本发明实施例一种应用程序推荐方法及装置进行详细描述。应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。

实施例1:

在一个具体的实施例中,本发明实施例提供一种连续动态运动和生理数据处理分析方法,该方法包括:

s1、获取健身行为产生的连续、动态数据,并对所述数据进行预处理;所述预处理后的数据至少包含强度参数、量参数、持续时间参数之一;以及依据所述强度参数、量参数、持续时间参数分别形成分布表;

s2、对预处理后的数据进行特征提取,建立识别模型,对行为进行识别;

并对识别后的数据进行目标数据集截取,获得关键数据集;所述关键数据集指影响数据系统性发展走向的数据集;

s3、对所述关键数据集进行参数提取,获得运动行为的参数;所述运动行为的参数至少包含稳态强度参数、稳态节奏参数、绝对稳态强度参数之一;

所述稳态强度参数代表运动强度;所述稳态节奏参数代表运动节奏;所述绝对稳态强度参数代表目标数据集中变化较小的运动强度;

s4、依据所述运动行为的参数,对所述目标数据集进行判定;所述判定包含对所述目标数据集进行分级。

优选地,所述步骤s1中,对数据进行预处理,包括:以预设的时间周期t1,截取所述数据;以及

以每一所述时间周期内的相同时间点数据,作为比对分析依据;

若所述相同时间点数据缺失,则以上一时间周期内的同一时间点数据作为填补。

人的生活规律常常以日、周呈现一定的规律,并且与月份和季度不同而不同。在一个具体的实施方式中,我们对每周数据进行截取,作为一个基本周期进行分析,然后再从对照每周中的每日数据进行分析,即本周一的对照分析的参照数据是上一周周一的数据,如此类推。由于本理论是基于每周数据处理,因此,如果出现了上周没有数据的情况则用上上一周对应的数据填补,但是,优选地,最多不宜超过3个月,即1个季度。

优选地,所述步骤s1中,对数据进行预处理,还包括:

删除所述数据中的脏数据,并在删除脏数据之后,填补缺失的数据字段;所述数据字段指分析中必须的数据字段。

在一个具体的实施方式中,由于所分析的数据不确定来源,不同的系统产生的原始数据不尽相同,必然会产生定义不统一的数据,不规范的编码,以及其他原因造成无效的数据,根据设定的处理规范和标准,首先将这些脏数据进行删除屏蔽,否则会影响系统分析的准确性。在除去脏数据后,紧接着就是对缺失值填补,分析所必要数据字段,比如性别、年龄、身高、体重等,因此,需要通过填补核实,对缺失值进行填补处理。

优选地,所述步骤s1中,对数据进行预处理,还包括对异常数据的识别和处理,具体为:对前一完整时间周期内的对应的每天数据进行统计,求解所述每天数据的平均值和标准方差;并且

获取最新数据,判断所述最新数据是否偏离所述平均值a倍标准方差的值;若是,则将所述最新数据替换为前一时间周期内的对应的数据。

在一个具体的实施方式中,不同系统(例如可穿戴设备、智能手机、健身器械等)在存储、读取和传输过程中,难免会出现异常数据,删除异常值的方法是,对过往一周中相对应的每天的数据进行统计,求解平均数和标准方差。根据最新获得数据判断其实否偏离例如5个标准差的数值,并将大于5个标准差的数据改写为数据序列中的上一个数值,以便剔除异常值。

优选地,所述强度参数是指在测量过程中,单位时间内所获得的数据的量;所述量参数是指一时间段内测量的某参数的总量。

优选地,所述s1中,所述预处理后的数据包含持续时间参数,所述持续时间参数是指一次数据记录中不间断连续的时间。

优选地,形成强度参数分布表进一步包括:强度参数-频次分布,是指将数据中的某一强度参数,按照记录的出现次数进行累加统计,构造该数据中所有强度参数所对应的频次表;

强度参数-时间贡献分布,是指将数据中的强度参数所占用的时间进行统计,按照预设顺序,累计强度参数对应的时间,构造强度参数所对应的时间贡献表;

强度参数-总量贡献分布,是指将数据中的强度参数所贡献的总量进行统计,按照预设顺序,累计其对应的运动数据的总量,构造该强度参数所对应的总量贡献表。

在一个具体的实施方式中,强度是测试中单位时间内所测量的数据,比如:步频,即每分钟的步数。也可以指心率,如此类推,也可以是每分钟血压、每分钟血氧值。量则指的是总的步数、总心率数、总时间。该部分处理方法可以是对每日这的数据进行以下3种方式进行统计分析:

(1)强度参数-频次分布

即将个体的某一个强度参数,比如步频,按照记录的出现次数进行累加统计,构造该个体所有强度参数所对应的频次表。

(2)强度参数-时间贡献分布

即将个体的强度参数所占用的时间进行统计,比如步频,按照个体所记录步频从小到大,累计其对应的时间。构造强度参数-时间贡献表。

(3)强度参数-总量贡献分布

即将个体的强度参数所贡献的总量进行统计,比如步频,按照个体所记录步频从小到大,累计其对应的步数,构造该强度参数-总量贡献表。

优选地,形成持续时间参数分布表进一步包括:持续时间参数-频次分布,是指将数据中的某一个持续时间参数按照记录的出现次数进行累加统计,构造数据中所有持续时间参数的频次表;

持续时间参数-时间贡献分布,是指将数据中的持续时间参数按照预设顺序,累计其对应的时间,构造持续时间参数对应的时间贡献表;

持续时间参数-总量贡献分布,是指将数据中的持续时间参数总量进行统计,累计其对应的时间总量,构造持续时间参数对应的总量贡献表。

在一个具体的实施方式中,数据的持续时间是指一次数据记录中所不间断连续的时间,比如:一次未被做过任何中断的运动所花费的时间。如果是心率则指一次完整心跳动作所花费的时间,该时间不包含每两次心跳动作的间隔时间。这部分处理也分为3个侧面进行统计分析:

(1)持续时间-频次分布统计

即将个体的某一个持续时间按照记录的出现次数进行累加统计,构造该个体所有持续时间的频次表。

(2)持续时间-时间贡献分布统计

即将个体的持续时间按照个体所记录从小到大,累计其对应的时间,构造持续时间-总时间贡献表。

(3)持续时间-总量贡献分布统计

即将个体的持续时间总量进行统计,累计其对应的时间总量,构造该持续时间-总量贡献表。

优选地,所述s2中,依据强度参数-频次分布、强度参数-时间贡献分布、强度参数-总量贡献分布、持续时间参数-频次分布、持续时间参数-时间贡献分布、持续时间参数-总量贡献分布,提取分布特征。

优选地,所述s2中,进一步包括:

采用支持向量机及马尔科夫模型,对运动行为进行识别;所述支持向量机依据预处理后的数据提取的特征,对数据进行分类,完成行为识别;所述马尔科夫模型把运动的每一种静态姿势定义为一个状态或者一个状态的集合,通过网络的方式将这些状态连接起来,状态和状态之间的切换采用概率来描述,完成运动行为的识别。

人的日常运动行为包括:如静止、微动、间歇运动、连续运动、骑自行车、开车、上楼、下楼、睡眠等行为,也包括按照指导方案进行的一次有目的的锻炼。在一个具体的实施方式中,选取支持向量机(supportvectormachine,svm)算法和马尔科夫模型(hmm)完成运动人体的行为识别。svm主要是通过线性分类器对提取的数据值进行分类,完成行为识别;hmm是把运动的每一种静态姿势定义为一个状态或者一个状态的集合,通过网络的方式将这些状态连接起来,状态和状态之间的切换采用概率来描述,完成人体运动行为的识别。

优选地,所述目标数据集截取,进一步包括:在所述识别后的数据中,选取要分析的数据集,再基于所述数据集的分布表,获得分布特征,基于所述分布特征,进行聚类;以及

将总量贡献占比超过预设阈值w1的数据作为目标数据,形成目标数据集。

在一个具体的实施方式中,首先根据运动行为的识别选取要分析的数据集,再根据其参数的分布特征进行综合分析,按照分布特征,并进行聚类分析,例如分成5个类。之后,按照其分布特征建立评价模型进行分级分类。对总量贡献超过预设阈值,例如50%的数据作为目标数据集。我们认为贡献超过50%的数据对将会影响系统发展走向的关键数据集,其目的是要筛选出对分析起到关键作用的数据以供下一步详细分析。

优选地,获得目标数据集后,还包括对所述目标数据集进行评估,计算所述目标数据集的行为熵;

所述行为熵计算方法如下:

其中,r表示一类行为的出现概率,n表示行为事件数量,xi表示第i个行为的概率。

优选地,将强度参数大于所述预设阈值w1的区间,设定为稳态强度区间;所述稳态强度区间中的强度参数设定为稳态强度参数;所述稳态强度参数代表运动强度。

稳态强度参数是本发明重要内容之一。比如:在传统运动强度度量中,它对应的是最大摄氧量,是衡量运动强度的最重要的指标,所有的运动方案的设计均以该指标为基础。同样,在本发明中,特征强度参数就是描述一个人当前状态的特征强度,代表当前的水平。该参数同样可用于心率的特征参数计算和表达。

在一个具体的实施方式中,通过截取的数据集进行进一步计算,进行排序,计算最大值,计算平均值,中值,观察其分布特征。计算占总量贡献在50%以上的所对应强度参数区间,该区间是稳态强度。该参数被认定为是代表该个体特征的运动强度。

优选地,将持续时间参数大于所述预设阈值w1的区间,设定为稳态节奏区间;所述稳态节奏区间中的持续时间参数设定为稳态节奏参数;所述稳态节奏参数代表运动节奏。

稳态节奏参数也是本发明重要内容之一。比如:在传统运动数据分析中,比较少关注运动节奏,而在复杂系统理论的指导下,系统节奏是结构的重要组成部分。因此,在本发明中,运动节奏作为一个重要的参数参与系统分析。运动节奏是指在运动强度不变的情况下所持续运动时间。

在一个具体的实施方式中,对持续时间参数数据,利用数据集截取方法截取的数据集进行进一步计算,进行排序,计算最大值,计算平均值,中值,观察其分布特征。计算占总量贡献在50%以上的所对应强度参数区间,该区间是稳态强度。该参数被认定为是代表该个体特征的运动节奏。

优选地,计算所述行为熵最小的目标数据集,该目标数据集所对应的强度参数定义为绝对稳态强度参数,所述绝对稳态强度参数所对应的取值区间设定为绝对稳态强度参数区间。

由于每天的目标数据集均会发生变化,所以稳态强度是动态的变化。前述稳态数据所计算的是相对特征强度参数,该参数会随着每天的数据变化而变化。为了确定稳定的特征强度参数,需要对目标数据集进行求解“行为熵”,并寻找最小熵,最小熵所对应的特征强度参数即为绝对稳态强度参数。相对应的,绝对稳态强度参数所对应的取值区间即为绝对稳态强度参数区间。如此类推,按照上述方法计算得出数据稳态节奏,即稳态的持续时间的特征。

优选地,所述s4中,所述对目标数据集进行分级,包括:对目标数据集求取均值及标准方差,将均值±1个标准方差,作为基准级别;每增加一个标准方差增加1个级别,反之,减少1个级别。

优选地,所述步骤s4之后,还可以包括:

s5、依据所述的判定结果,设置运动方案;

s6、对所述运动方案进行过程中产生的新数据进行收集,依据所述新数据,作为所述运动方案的调整依据;

s7、依据所述新数据,对运动行为进行持续性判定。

优选地,所述s6中,进一步包括,将所述新数据与过往数据形成新的数据集,计算所述新的数据集的稳态强度参数;

若该稳态强度参数达到了预定的目标数据集的分级级别,则调整运动方案。

在一个具体的实施方式中,可以采用例如如下的方式设置运动方案,制定健身制定方案的目的是通过科学的运动强度和运动量的设定提高人体对刺激负荷适应水平。根据刺激-适应机制,人的适应性遵循以下几个过程:(1)机体对实施负荷刺激产生相对应的适应;(2)对反复连续性的刺激产生适应性;(3)在一定的时间阶段内产生超量恢复;(4)适应性的过程是自组织的;(4)适应是遵循循序渐进的原则。

例如,对目标数据集的数据按照强度按照分布进行5级分类。稳定强度是占50%的基准点即:平均数±1个标准差。然后,每增加一个标准方差增加1个级别,反之,减少1个级别。为此,形成[-2,-1,0,1,2]分类标准,指导方案目标强度设定原则是首先设定到1为对应的强度,目的通过按照方案锻炼,将稳定强度提高1所对应的强度。当然,如果在身体条件允许的情况下,可以将目标强度调整到2所对应的强度。

优选地,所述s6中,进一步包括,将所述新数据与过往数据形成新的数据集,计算所述新的数据集的行为熵,对新的数据集数据进行评估。

对于具体的评估方式,在一个具体的实施方式中,可以采用如下方式:健身效果的评估是当天健身运动强度和量是否达到运动方案所设定的目标,评估的判据是对该数据集的熵计算结果进行评价,根据熵的大小判定运动的结果是否出现了对称破缺。其判据就是熵出现大值。同时,根据稳态强度,如果稳态强度达到了预设的目标区间,那么,判定目标已经实现,此刻需要进一步调整指导方案,反之则需要继续该方案。当然,如果有心率等连续动态的生理指标则优先采用该参数。

优选地,所述s7进一步包括:

s71、设定运动行为的持续性模型;所述模型采用马尔科夫模型;

s72、求取模型的转移矩阵;

s73、求取第n个单位时间时的运动状态;所述n为大于等于1的自然数;

s74、求取长期运动状态。

在一个具体的实施方式中,我们可以将健身锻炼坚持行为分为若干阶段进行研究,例如:预准备阶段,准备阶段,运动阶段,坚持阶段以及退出阶段。通过状态转移概率矩阵、马尔科夫链等,将锻炼者的运动过程依据坚持行为的阶段理论进行划分,同时以每天、每周为单位进行完成计划次数的统计,得出随时间演化的运动坚持基础模型。通过运动数据判断其坚持行为,进行评估,如处于坚持行为的哪一阶段或坚持行为的程度等,并通过进一步分析,找出其可能退出的判据,并有效的进行预警。

优选地,所述s71中,所述持续性模型分为z个状态,所述状态之间的转移时间为一个单位时间,所述状态之间的转移只依赖于当前状态,初始状态可以根据不同个体来选取。

优选地,所述s72中,所述转移矩阵的求取方法为:

令{x(n),n≥0}为一个时间齐次的马尔科夫链,其一步转移矩阵为:

p=(pij)z×z,初始概率向量为α0=(α1,α2,…,αz),

则,第n个单位时间时,运动状态为:α0pn

单位时间可以是例如1天,一周等。此处,也可以采用二阶齐次马尔科夫模型过程处理。

优选地,所述s74中,所述长期运动状态可通过下列线性方程获得:

其中上述方程的解x=(x1,x2,…,xz)长期运动状态,其表示在长期运动状态下,主动状态在第i种状态的可能性为xi,其中,i=1,2,…,z。

优选地,所述转移矩阵中的元素的估计,通过如下方式获得:

通过运动情况数据的汇集,得到pij的估计,即

其中nij为从状态i到状态j的转移次数,所述转移为相邻的单位时间间的转移,ni·为从状态i到所有状态的转移次数。

下面以设置5个运动阶段为例,对上述方法进行详细说明:

通过建立马尔科夫链模型,利用基期状态概率及转移概率计算运动坚持与退出的理论状态概率,并与利用实际数据计算的实际状态概率比较分析不同运动行为仿真的差异性。对根据已经完成的运动行为分类,给予运动者一定的运动处方,按照每周完成计划目标的数量为单位,按照日期,将运动坚持/退出序列看作是由不同状态组成的一个马尔科夫链,全部的运动坚持行为系统调用构成状态的取值空间,这样可从运动坚持行为系统调用序列中计算出状态转移矩阵。

建立起运动处方完成情况的马尔科夫链模型后,可以通过对以往的运动处方完成情况,对预期的某一时刻的运动情况进行评估和预测,并由此判断出该时刻坚持运动或者退出运动,以及其所处状态的概率,从而可以进行退出预警,建立运动坚持行为的机制。

以马尔科夫模型研究运动坚持行为,具体如下:

运动坚持行为的模型假设:

(1)群体/个体运动坚持分为5个状态:{运动终止,运动偶尔坚持,运动坚持,运动坚持良好,运动坚持优秀},分别记为状态1,2,3,4,5。

(2)状态之间的转移时间为一个单位时间(1天、1周等)。

(3)状态之间的转移只依赖于当前状态,即一个离散时间的马尔可夫链随机过程。

(4)过程的初始状态可根据不同个体来假设,但这不影响稳态的情况。

令{x(n),n≥0}是一个时间齐次的马尔可夫链,其一步转移矩阵为

p=(pij)5×5,初始概率向量为

则,第n天时,群体/个体的运动状态为:α0pn

群体/个体长期的运动状态为(稳态概率)下列线性方程的解(有唯一解存在),

其中x=(x1,x2,…,x5)。即在长期的运动状态下,主动状态在第i中状态的可能性为xi(i=1,2,…,5)。

模型参数的估计问题,即概率转移矩阵中的元素的估计问题,可通过下面的方式来给出。

通过对群体/个体的运动情况进行调查,然后给pij的估计,即

其中nij为从状态i到状态j的转移次数(注意是相邻天的转移),ni·为从状态i到所有状态的转移次数。

除上述方式外,也可进一步假设为2阶齐次马尔可夫过程。

模型中参数的估计问题,即概率转移矩阵中的元素的估计问题,包括连接矩阵,可通过类似于前面的方式来给出。

事实上,我们可根据建立的马尔可夫模型讨论许多问题,如若干年后的运动坚持状态的效果、保持坚持运动状况努力的最佳方向等问题。

优选地,所述方法还可以包括:

s75、对所述持续性模型进行验证;所述验证通过一定量的运动坚持数据来检验所述持续性模型的离散几何分布是否成立来实现。

优选地,所述验证方法为,通过kolmogorov-smirnov分布拟合检验进行验证:

令pearsonχ2统计量为:

其中ni为实际观测数,ei为理论平均数,k为分组数;如果则拒绝几何分布。

实施例2:

在另一个方面,本发明还提供了一种实时在线健康指示方法,该方法中可以应用例如实施例1中的技术方案,对数据进行相应的处理。结合图2所示,该方法包括:收集以往的运动数据,并对所述运动数据进行预处理;

基于所述预处理后的运动数据,对运动行为进行识别,并基于识别后的运动行为及预处理后的运动数据,进行运动行为评估;

至少部分地基于运动行为评估结果、识别后的运动行为及预处理后的运动数据,设置运动数据目标方案;

收集所述运动数据目标方案执行过程中产生的新数据,计算所述运动数据目标方案的执行程度,至少部分地基于所述执行程度及所述运动数据,获取所述执行程度的评估值;

当所述评估值满足一预设区间时,优化所述运动数据目标方案;当所述评估值不满足所述预设区间时,进行预警,并修改所述运动数据目标方案。

优选地,对所述运动数据进行预处理,包括:以预设的时间周期t1,截取所述数据;以及

以每一所述时间周期内的相同时间点数据,作为比对分析依据;

若所述相同时间点数据缺失,则以上一时间周期内的同一时间点数据作为填补。

优选地,对所述运动数据进行预处理,还包括:求取所述运动数据的参数,并建立所述参数的分布数据,基于所述分布数据求取所述参数的分布特征;所述参数至少包括强度参数、量参数、持续时间参数之一。

优选地,至少部分地基于所述参数及所述分布特征,建立行为模型;以及

基于所述行为模型,对运动行为进行识别。

优选地,基于所述行为模型以及运动行为的识别结果,截取所述运动数据中的目标数据集;以及

基于所述目标数据集进行运动数据的评估。

实施例3:

在又一个方面,本发明还提供了一种连续动态运动和生理数据处理分析系统,该系统可以适用例如实施例1、实施例2中的具体数据处理方法及在线指示方法,实现系统的整体运行。结合图1所示,该系统包括:运动大数据预处理模块,用于对收集到的运动数据进行预处理;

连续动态数据特征获取模块,用于对预处理后的运动数据提取分布特征;

行为识别模块,用于基于所述分布特征,建立运动模型,并进行行为识别;

行为评估模块,用于基于所述预处理后的运动数据及运动行为识别结果,对运动行为进行评估;

方案制定模块,用于基于评估结果、预处理后的运动数据及运动行为识别结果,设置运动数据目标方案;

运动坚持监测模块,用于基于所述运动数据目标方案执行中产生的新数据,计算所述运动数据目标方案的执行程度,至少部分地基于所述执行程度及所述运动数据,计算所述执行程度的评估值;

在线实时干预模块,用于基于所述执行程度的评估值,重新设置所述运动数据目标方案。

优选地,所述系统进一步包括:系统融合模块,用于将运动大数据预处理模块、连续动态数据特征获取模块、行为识别模块、行为评估模块、方案制定模块、运动坚持监测模块、在线实时干预模块进行融合,以及协调各模块间的数据传输及数据调用。

优选地,所述系统还可以与用户终端建立通信连接,以与所述用户终端进行数据交互。该些用户终端可以是例如手环、智能手机、运动胸带、运动监护设备、其他可穿戴智能设备等。

实施例4:

如图3所示,本发明的方法主要涉及到四个方面的改进,包括:

a、运动结构模型。传统运动科学理论通过实验测量方法描述运动的,其方法是把运动可以描述为运动强度大小和运动量多少。本发明基于对连续运动数据统计描述运动的,其方法是通过统计不同强度的运动持续时间、在总运动量中的贡献等参数构建运动结构。传统科学理论认为运动效果取决于运动强度大小和运动的量多少。而本发明则认为,运动的效果取决于运动结构。本发明把特定的运动结构称为运动相,这是一个区别传统运动科学理论的一种全新的模型。

b、运动结构度量方法。传统运动科学研究的运动强度的度量常用的是在实验室利用气体代谢设备测量一个人的最大摄氧量,通过最大摄氧量表示一个人的最大运动强度。为了使用方便,在日常应用中也常常根据建立的数学模型用心率间接估算最大摄氧量。基于测量得到最大摄氧量,采用最大摄氧量的百分比来计量运动强度。而本发明则采用运动结构的熵作为度量,熵的大小来衡量运动结构的稳定性,而运动结构的熵是根据运动结构的组成元素联合计算的。并且,规定运动结构熵最小时对应的运动叫做特征运动,特征运动所对应的运动参数(比如步频,持续时间等)叫做特征参数。

c、运动行为评估方法。传统运动科学研究是通过寻找运动强度大小和运动量多少与运动效果之间的相关性,建立与测量指标的回归方程,比如心率,然后设定运动强度大小和运动量多少。而基于运动结构模型则关注结构稳定性,计算运动结构的熵。熵增表示运动结构处于不稳定状态,熵减表示运动结构正在趋于稳定结构。传统运动科学评估运动是否达到所设定的目标是,通过计算一天的运动强度的大小和运动量。而本发明则是通过计算一天运动结构的熵,判定运动结构稳定星是否达到了所设定的目标区间。

d、基于运动结构理论的行为干预指导方法。传统的运动干预指导方法是在给定的运动目标以后进行一段时间的训练,比如1个月,然后再次测定人体体质参数进行评估,评判是否达到设定目标。这种方法在实际应用中,无法实现实时动态校正指导训练活动。本发明首先通过每天完成目标的情况建立马尔可夫链模型,计算锻炼者退出训练计划的概率,之后计算其运动行为熵,判断退出风险进行实时预警。其次,根据特征运动所对应的特征参数作为目标值,比如目标步频,以及目标步频应该支持的时间。通过对实时采集的数据进行计算对比,达到实时判断指导训练。

在一个具体的实施方式中,所包含的流程和实现方法包括:

s1、获取个体人日常行为和采集产生的连续、动态的数据,并对所述数据进行预处理;所述预处理后的数据至少包含强度参数、量参数或者持续时间参数。

s2、不同强度的值作为向量a,与强度所对应的量作为向量b,并对b按照从小达到进行排序,此时排序后的数据成指数分布,所对应的物理意义是不同强度对总量的贡献分布。将按照一定的规则形成向量c,获得目标数据集;所述目标数据集指影响数据系统性发展走向的数据集;对预处理后的数据进行特征提取,建立识别模型,对行为进行识别。

s3、对所述关键数据集进行参数提取,获得运动行为的关键参数;所述运动行为的参数至少包含运动相、相强度;

所述运动相代表一个体运动结构,是表示一个个体在一定时间内呈现的运动时空特征。包括:运动强度和持续时间。运动强度是指单位时间内的动作数,比如走跑运动的步频。所述相节奏参数代表个体当前时间段运动持续时间。相强度代表个体当前时间段运动特征的运动强度。

s4、依据所述运动行为的参数,对所述目标数据集进行判定;所述判定包含对所述目标数据集进行分级。

所述步骤s1中,对数据进行预处理,要求数据的记录最小单位时间是分钟;每天数据为一个基本计算数据集,包含24小时×60分钟=1440个数据单元;分析数据集预设时间周期为一周,即7天,所以,一个分析数据集包含7天基本计算数据集。由此,要求每一所述时间周期内的相同时间点数据,作为比对分析依据;

若所述当前周期相同时间点数据缺失,则以上一时间周期内的同一时间点数据作为填补。但是,填补周期不超过2个。

所述步骤s1中,对数据进行预处理,包括对异常数据的识别和处理,具体为:异常值的处理方法。计算上一周期所有数据强度分布,比如:在走跑运动的计步数据集中,计算该个体步频的标准方sd;统计每一个步频对应的步数,步数对应最多的所对应的步频设为es,如果步频大于es+3*sd,或者小于es-3*sd,那么判定为异常值。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1