指标数据的分析方法、装置、设备及存储介质与流程

文档序号:26014268发布日期:2021-07-23 21:35阅读:255来源:国知局
指标数据的分析方法、装置、设备及存储介质与流程

本申请实施例涉及人工智能领域,特别涉及一种指标数据的分析方法、装置、设备及存储介质。



背景技术:

血糖是指在人体血液中的葡萄糖,当血糖偏高时,容易产生糖尿病、甲状腺功能亢进的问题,而当血糖偏低时,易产生糖代谢异常、肾上腺功能减退、甲状腺功能减退等问题。故针对血糖异常的人群,需要通过血糖仪对血糖高度进行监控。

相关技术中,由于血糖是针对血液中的葡萄糖进行确定的参数,故血糖仪的工作原理通常是对人体血液进行采集后,根据采集得到的血液进行葡萄糖含量的分析。

然而,通过上述方式进行血糖检测时,会对人体产生创口,而产生创口则无疑会对人体增大受感染的风险,安全性较低。



技术实现要素:

本申请实施例提供了一种指标数据的分析方法、装置、设备及存储介质,能够避免通过产生创口对血液进行检测而导致的感染风险。所述技术方案如下:

一方面,提供了一种指标数据的分析方法,所述方法包括:

获取目标采集设备采集得到的指标测量数据,所述指标测量数据为所述目标采集设备通过表面传感方式采集得到的数据;

获取数据分析模型,所述数据分析模型为预先训练的机器学习模型,所述数据分析模型用于指示目标指标数据与所述指标测量数据之间的关联关系,所述目标指标数据用于指示与血液相关的异常生命状态;

将所述指标测量数据输入所述数据分析模型,通过所述数据分析模型对所述指标测量数据进行分析,得到与所述指标测量数据对应的目标指标数据。

另一方面,提供了一种指标数据的分析装置,所述装置包括:

获取模块,用于获取目标采集设备采集得到的指标测量数据,所述指标测量数据为所述目标采集设备通过表面传感方式采集得到的数据;

所述获取模块,还用于获取数据分析模型,所述数据分析模型为预先训练的机器学习模型,所述数据分析模型用于指示目标指标数据与所述指标测量数据之间的关联关系,所述目标指标数据用于指示与血液相关的异常生命状态;

分析模块,用于将所述指标测量数据输入所述数据分析模型,通过所述数据分析模型对所述指标测量数据进行分析,得到与所述指标测量数据对应的目标指标数据。

在一个可选的实施例中,所述数据分析模型包括第一数据分析模型,所述第一数据分析模型用于实现分类预测,所述目标指标数据中包括与血液相关的至少两个候选生命状态;

所述分析模块,包括:

预测单元,用于通过第一数据分析模型对所述指标测量数据进行分类预测;

确定单元,用于基于分类预测过程从所述至少两个候选生命状态中确定与所述指标测量数据对应的生命状态。

在一个可选的实施例中,所述目标指标数据用于指示血糖状态;

所述确定单元,还用于基于分类预测过程从所述至少两个候选生命状态中确定与所述指标测量数据对应的血糖状态,所述至少两个候选生命状态中包括高血糖状态、中血糖状态、低血糖状态。

在一个可选的实施例中,所述数据分析模型包括第二数据分析模型,所述第二数据分类模型用于实现回归预测;

所述分析模块,包括:

预测单元,用于通过所述第二数据分析模型对所述指标测量数据进行回归预测;

确定单元,用于基于回归预测过程得到与所述指标测量数据对应的目标指标数据值,所述目标指标数据值用于指示与血液相关的异常生命状态。

在一个可选的实施例中,所述目标指标数据用于指示血糖状态;

所述确定单元,还用于基于回归预测过程得到与所述指标测量数据对应的血糖值。

在一个可选的实施例中,所述获取模块,还用于获取参考指标数据,所述参考指标数据为与所述指标测量数据对应的参考值;

所述装置还包括:

训练模块,用于基于所述参考指标数据和所述目标指标数据之间的差异,对所述数据分析模型进行训练。

在一个可选的实施例中,所述分析模块,还用于对所述指标测量数据进行用户协作需求判定;

所述装置,还包括:发送模块,用于响应于存在用户协作需求,向所述目标采集设备发送所述协作数据发送指示,所述协作数据发送指示用于指示所述目标采集设备发送所述参考指标数据;

所述训练模块,还用于基于所述参考指标数据对所述目标指标数据进行修正。

在一个可选的实施例中,所述目标指标数据用于指示血糖状态;

所述指标测量数据包括:体温数据、手指温度数据、心跳数据、环境温度数据和环境湿度数据中的至少一种。

在一个可选的实施例中,所述数据分析模型包括随机森林模型;

所述获取模块,还用于获取样本数据,所述样本数据中包括n组测量得到的数据组,n为正整数,所述数据组中包括参考数据和通过表面传感方式采集得到的数据;基于所述样本数据训练得到k个决策树,得到由所述k个决策树构成的所述随机森林模型,k为正整数。

另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述实施例中提供的指标数据的分析方法。

另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述实施例中提供的指标数据的分析方法。

另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的指标数据的分析方法。

本申请实施例提供的技术方案带来的有益效果至少包括:

通过表面传感方式采集得到指标测量数据后,通过数据分析模型对指标测量数据进行分析,从而得到目标指标数据,而目标指标数据用于指示与血液相关的异常生命状态,也即通过表面传感方式即可以对血液的异常生命状态进行监控,而无需在人体表面造成创口,减少用户受感染的风险,提高了目标指标数据获取过程中的安全系数。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本申请一个示例性实施例提供的实施环境示意图;

图2是本申请一个示例性实施例提供的指标数据的分析方法的流程图;

图3是基于图2示出的实施例提供的血糖分析整体过程示意图;

图4是本申请另一个示例性实施例提供的指标数据的分析方法的流程图;

图5是本申请一个示例性实施例提供的通用训练和个性化学习流程的示意图;

图6是本申请另一个示例性实施例提供的指标数据的分析方法的流程图;

图7是本申请一个示例性实施例提供的指标数据的分析装置的结构框图;

图8是本申请另一个示例性实施例提供的指标数据的分析装置的结构框图;

图9是本申请一个示例性实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

首先,对本申请实施例中涉及的名词进行简单介绍:

人工智能(artificialintelligence,ai):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(machinelearning,ml):是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

指标测量数据:本申请实施例中,该指标测量数据是指通过表面传感方式采集得到的数据,也即,在人体皮肤表面通过传感方式进行采集得到的数据,示意性的,表面传感方式包括热代谢综合方式、光学检测方式、电磁波检测方式等,本申请实施例对此不加以限定。其中,表面传感方式是指在人体皮肤表面以不对人体皮肤产生创口为要求的检测方式。即,本申请实施例中的目标采集设备配置有热代谢检测部件、光学检测部件、电磁波检测部件中的至少一种。

本申请实施例中,以表面传感方式采集得到的指标测量数据,对目标指标数据进行分析,其中,目标指标数据是指与血液的异常生命状态相关的数据,如:本申请实施例中,该目标指标数据中包括血糖数据。

也即,相关技术中,需要通过产生创口的方式采集血液样本,并对血液样本进行分析,得到血糖数据,而本申请实施例中,通过无创的表面传感方式对指标测量数据进行采集,由于指标测量数据与血糖数据之间存在复杂的关联关系,从而在指标测量数据的基础上对血糖数据进行分析。

云计算(cloudcomputing):指计算机基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是计算机技术和软件、互联网相关,也可是其他服务。云计算是网格计算(gridcomputing)、分布式计算(distributedcomputing)、并行计算(parallelcomputing)、效用计算(utilitycomputing)、网络存储(networkstoragetechnologies)、虚拟化(virtualization)、负载均衡(loadbalance)等传统计算机和网络技术发展融合的产物。

本申请实施例中,数据分析模型配置在物理服务器中,或者配置在云服务器中,通过云服务器在指标测量数据的基础上对血糖数据进行分析预测。

数据分析模型:是指用于构建指标测量数据与目标指标数据之间的关联关系的模型,其中,数据分析模型为机器学习模型,在一些实施例中,该数据分析模型为决策树模型,可选地,数据分析模型为由n个决策树构成的随机森林模型,n为正整数。

在一些实施例中,数据分析模型为预先训练的机器学习模型,而在训练过程中,由用户采集并上传指标测量数据的同时,向服务器提供参考血糖值,从而通过参考血糖值建立与指标测量数据之间的关联关系,或者,对血糖值与指标测量数据之间的关联关系进行修正。其中,参考血糖值为用户通过有创测量方式测量得到的血糖值,如:参考血糖值为用户采用传统的血糖仪,采集血液样本后经过试纸测量得到的血糖值。

血液中的葡萄糖具有如下特点:1、血糖在可见光波段无色,难以分辨;2、血糖在人体内的分布并不集中在血管中,还分布于细胞内、细胞外,且每个组织中的葡萄糖含量可以不同,因此,单检测血管中的葡萄糖含量会被其他组织中的葡萄糖干扰,另外,血糖浓度会随着身体状态(如:体温、身体含水量)而变化;3、葡萄糖在血液中的浓度较低,每100ml血液,可能仅存在0.1克葡萄糖;4、血糖与体内对的许多化合物的化学结构较为类似,其中某些化合物在血液中会与血糖结合,如:白蛋白,从而干扰血糖的检测结果。

相关技术中,无论是光学方法还是热代谢综合法均无法直接获取一个与血糖高度正相关的生理指标,只能通过可以获得的间接指标,通过预置的算法校正来模拟得出血糖值,实验数据有限,因此算法的实用性和准确性均非常不理想。

而本申请实施例中,针对相关技术所存在的问题和缺点,通过一个更综合的系统来解决无创检测血糖的问题,将无创血糖检测视为一个包含云端和地面的完整系统,将算法部署在云端,与用户手中持有的终端共同构成整体。

具体而言,系统将在云端部署一个利用间接数据来测算人体血糖值的人工智能算法,通过可以联网的无创血糖检测终端将检测所得的人体数据传输回云端服务器,从而对无创血糖数据进行预测。在训练时,结合从外部获得的用户通过其他更精准的手段检测得出的生理指标,以及温度、湿度、气压等外部数据来训练云端的人工智能算法。换言之,系统包含的云端算法是实时成长的,随着数据的累积,测算人体血糖的精度也将不断提升,最终实现通过无创手段精确测量人体血糖的目标。

结合上述说明,图1是本申请一个示例性实施例提供的实施环境示意图,如图1所示,该实施环境中包括:采集设备110、服务器120,其中,采集设备110和服务器120之间通过通信网络130连接。

其中,采集设备110是用于在人体表面通过表面传感方式进行数据采集的设备,示意性的,采集设备110实现为血糖检测笔,血糖检测笔的笔头位置处设置有传感器,如:温度传感器、湿度传感器、光学传感器、电磁波传感器等,通过传感器在人体表面进行接触或者不接触的数据采集,得到指标测量数据。

在一些实施例中,采集设备110通过通信网络130向服务器120发送指标测量数据,或者,采集设备110首先通过短距离无线通信技术(如:蓝牙、紫蜂等技术)向绑定的终端设备发送该指标测量数据,由终端设备通过通信网络向服务器120发送指标测量数据。

服务器120中包括数据分析模型121,通过算法分析模型121对指标测量数据进行分析,得到无创血糖数据,该无创血糖数据用于表示无需在人体表面产生创口,即可预测得到血糖情况的数据。

服务器120在分析得到无创血糖数据后,将无创血糖数据反馈至终端设备,或者将无创血糖数据直接反馈至采集设备110。

上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdeliverynetwork,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。

终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。

结合上述内容,对本申请实施例提供的指标数据的分析方法进行介绍,图2是本申请一个示例性实施例提供的指标数据的分析方法的流程图,以该方法应用于服务器中为例进行说明,如图2所示,该方法包括:

步骤201,获取目标采集设备采集得到的指标测量数据。

指标测量数据为目标采集设备通过表面传感方式采集得到的数据。

在一些实施例中,指标测量数据的采集方式包括如下方式中的至少一种:

1、通过近红外、中红外光谱技术采集得到的数据;

2、通过拉曼光谱技术采集得到的数据;

3、通过经皮透析技术采集得到的数据;

4、通过眼部测量采集得到的数据;

5、通过多种传感器采集得到的热量及多参数;

6、通过其他光谱技术;

7、通过其他身体代谢物等。

当前的无创血糖仪存在多种技术路径,如:热代谢综合法、光学检测法和电磁波检测法等等,但是目前的无创血糖检测技术的实际效果均较差,无创血糖检测的精度非常低。其原因在于,当前的检测手段无法直接获取与血糖高度正相关的生理指标,只能通过可以获得的间接指标,通过预置的算法校正来模拟得出血糖值,由于计算过程非常复杂,涉及的外部变量非常多,因此算法的实用性和准确性均非常不理想,导致无创血糖监测的精度无法达到家用和临床的标准。

在一些实施例中,本申请涉及的指标测量数据包括:体温、手指温度、心跳、环境温度、环境湿度中的至少一种。

在一些实施例中,目标采集设备实现为一台综合的采集设备;或者,目标采集设备实现为一组分别采集不同类型数据的采集设备,示意性的,体温、手指温度和环境温度通过温度采集设备完成,且体温在人体指定部位采集得到,手指温度在人体手指部位采集得到,环境温度对空气进行采集得到;心跳通过心跳监控设备完成,且心跳监控设备在人体的脉搏部位采集得到,如:手腕、脖子等部位;环境湿度可以额外设置一个湿度采集设备,也可以集成在温度采集设备或者心跳监控设备中,通过湿度传感器对空气湿度进行采集。

值得注意的是,上述指标测量数据的测量方法包括如下方法中的至少一种:热代谢综合法、光学方法以及电磁波方法。

值得注意的是,本申请实施例涉及的指标数据的分析方法包括训练过程和应用过程两个过程,本实施例中,主要针对应用过程进行说明,也即,指标测量数据包括如下两种情况:

第一,指标测量数据不包含血液血糖值(也即参考指标数据),包含其他指标测量数据,即上述指标测量数据;

第二,指标测量数据不包含血液血糖值,且缺少部分指标测量数据,也即指标测量数据不完整。

可选地,当服务器判断指标测量数据不完整时,指示用户提供确实的指标测量数据,或者,采用不完整的指标测量数据对血糖值进行分析。

步骤202,获取数据分析模型,数据分析模型为预先训练的机器学习模型。

数据分析模型用于指示目标指标数据与指标测量数据之间的关联关系,目标指标数据用于指示与血液相关的异常生命状态。

在一些实施例中,数据分析模型为已经训练完成的机器学习模型;或者,数据分析模型为在训练过程中,待进行继续训练的机器学习模型。

本实施例中,以该数据分析模型为训练完成的机器学习模型为例进行说明,也即,机器学习模型在对目标指标数据进行预测时达到的准确率符合准确率要求。

在一些实施例中,该数据分析模型用于对指标测量数据进行分类预测,也即目标指标数据中指定有至少两个分类结果,对指标测量数据进行分类预测后,从至少两个分类结果中确定与指标测量数据匹配的分类结果。示意性的,以目标指标数据用于指示血糖状态为例,则至少两个分类结果中包括高血糖、中血糖和低血糖,从至少两个分类结果中预测得到血糖状态。

在另一些实施例中,该数据分析模型用于对指标测量数据进行回归预测,也即将指标测量数据与回归曲线进行匹配,从而从回归曲线中匹配到与指标测量数据对应的目标指标数据值。示意性的,以目标指标数据用于指示血糖状态为例,则将指标测量数据与回归曲线进行匹配,得到与指标测量数据对应的血糖值。

步骤203,将指标测量数据输入数据分析模型,通过数据分析模型对指标测量数据进行分析,得到与指标测量数据对应的目标指标数据。

在一些实施例中,首先进行用户协作需求判定,当存在用户协作需求时,指导用户测量指标相关的数据,指标相关数据的测量结果会用来对目标指标数据进行修正,若不存在用户协作需求,则返回上述对指标测量数据进行分析得到的目标指标数据。

结合上述数据分析模型的两种分析方式(1、分类预测方式;2、回归预测方式),在一些实施例中,该数据分析模型包括如下两种情况中的至少一种:

第一种,数据分析模型中包括第一数据分析模型,该第一数据分析模型用于实现分类预测,该目标指标数据中包括与血液相关的至少两种候选生命状态;

则通过第一数据分析面模型对指标测量数据进行分类预测,基于分类预测过程从至少两个候选生命状态中确定与指标测量数据对应的生命状态。

示意性的,该目标指标数据用于指示血糖状态,则基于分类预测过程从至少两个候选生命状态中确定与指标测量数据对应的血糖状态,至少两个候选生命状态中包括高血糖状态、中血糖状态、低血糖状态。也即,在通过指标测量数据进行血糖状态的分析时,仅需要从高血糖状态、中血糖状态和低血糖状态中预测与指标测量数据匹配的血糖状态。

第二种,数据分析模型中包括第二数据分析模型,该第二数据分析模型用于实现回归预测。

则通过第二数据分析模型对指标测量数据进行回归预测,基于回归预测过程得到与指标测量数据对应的目标指标数据值,该目标指标数据值用于指示与血液相关的异常生命状态。

示意性的,目标指标数据用于指示血糖状态,则基于回归预测过程得到与指标测量数据对应的血糖值。

值得注意的是,上述实施例中,以数据分析模型包括第一数据分析模型和第二数据分析模型为例进行说明,在另一个示例性实施例中,数据分析模型为一个整体的模型,该数据分析模型包括回归预测部分和分类预测部分。

示意性的,数据分析模型实现为随机森林模型,随机森林属于一种机器学习算法,即能够用于分类问题,也可以用于回归问题;且对于多种数据指标,随机森林能够产生高准确率的分类器。以血糖分析场景为例进行说明,请参考图3,其示出了本申请一个示例性实施例提供的血糖分析整体过程示意图,如图3所示,该过程中包括:

步骤301,获取指标测量数据。

也即上述通过表面传感方式采集得到的数据。

步骤302,使用随机森林进行分类预测。

在一些实施例中,随机森林由至少两个决策树构成,将指标测量数据代入随机森林后,通过随机森林进行分类预测,在至少两个候选预测结果中确定出与指标测量数据对应的预测结果。

步骤303,根据预测结果,提示用户高/中/低血糖。

也即,预测结果包括高血糖、中血糖以及低血糖中的至少一种。

步骤304,使用随机森林进行回归预测。

在一些实施例中,随机森林由至少两个决策树构成,将指标测量数据代入随机森林后,通过随机森林进行回归预测,回归得到与指标测量数据对应的预测结果,也即一个具体的数值。

步骤305,根据预测结果,提示用户具体的血糖值。

也即,预测结果中包括与指标测量数据对应的血糖值。

综上所述,本申请实施例提供的指标数据的分析方法,通过表面传感方式采集得到指标测量数据后,通过数据分析模型对指标测量数据进行分析,从而得到目标指标数据,而目标指标数据用于指示与血液相关的异常生命状态,也即通过表面传感方式即可以对血液的异常生命状态进行监控,而无需在人体表面造成创口,减少用户受感染的风险,提高了目标指标数据获取过程中的安全系数。

另外,在用户体验上,由于无需对血液样本进行采集,也即无需使用血糖仪在皮肤表面造成创口,血糖检测过程中的心理压力较小,血糖检测过程的用户体验较好。

上述实施例中,以应用过程为例进行说明,在一些实施例中,该数据分析模型还需要进行训练。也即,上述数据分析模型为训练过程中的模型,图4是本申请另一个示例性实施例提供的指标数据的分析方法的流程图,以该方法应用于服务器中为例进行说明,如图4所示,该方法包括:

步骤401,获取目标采集设备采集得到的指标测量数据。

指标测量数据为目标采集设备通过表面传感方式采集得到的数据。

在一些实施例中,目标采集设备实现为无创血糖检测终端,其中,无创血糖检测终端主要用于收集与血糖相关的间接指标,终端通过热代谢综合法、近红外反射法、拉曼反射法等多种获取人体与血糖相关的生理指标,如:体温、血细胞压积、血液酸碱度、手指温度、心跳、血氧等指标测量数据。在一些实施例中,指标测量数据中还包括温度、湿度、气压等人体所处环境数据。

在一些实施例中,无创血糖检测终端包括如下几个部分:

1、温度感知模块:包括用于采集人体温度数据的子模块以及用于采集人体所处环境数据的子模块。

2、光学模块:包括光源发射以及接收模块,通过发光二极管(light-emittingdiode,led)光源发射近红外、太赫兹等多个频率的光源,并通过光学传感器接收反射的光源信号。

3、通信模块:用于将无创血糖检测终端采集到的数据实时上传至云端服务器中,并接收云端服务器反馈的血糖测量结果予以展示。

4、显示模块,用于向用户展示血糖测量结果。

步骤402,获取参考指标数据,参考指标数据为与指标测量数据对应的参考值。

在一些实施例中,对指标测量数据进行用户协作需求判定,响应于存在用户协作需求,向目标采集设备发送协作数据发送指示,该协作数据发送指示用于指示目标采集设备发送参考指标数据,基于参考指标数据对目标指标数据进行修正。

其中,用户协作需求是指在数据分析模型的应用过程中,存在一些协作用户,用于对数据分析模型进行边应用边训练,其中,当用户为协作用户时,则需要针对协作用户进行参考指标数据的采集,从而基于参考指标数据和目标指标数据对数据分析模型进行训练,并将对数据分析模型进行训练后的更新。

在一些实施例中,参考指标数据为通过传统的精确测量手段测量得到的参考值,且参考指标数据用于指示与血液相关的异常生命状态,也即,参考指标数据是用于对数据分析模型进行训练的数据。

其中,用户协作还包括通用协作和个性化协作,通用协作是指用户上传的参考指标数据包括传统的精确测量手段测量得到的参考值,仅需要通过当前针对通用协作用户测量得到的目标指标数据和参考指标数据之间的差异对数据分析模型即可实现通用的数据分析模型训练;个性化协作是指用户上传的参考指标数据既包括可通过传统的精确测量手段测量得到的参考值(但针对当次检测尚未获取及上传),也包括用户的个性化数据,如:身高、体重、血型、年龄、性别等数据,从而针对当前个性化协作用户对数据分析模型集合个性化数据进行个性化的训练,提高数据分析模型针对个性化协作用户的数据分析准确率。

在一些实施例中,该参考指标数据也可以称为外部数据。是通过外部数据输入模块输入至服务器中的,其中,外部数据输入模块可以集成在无创血糖测量终端中,也可以实现为一个独立的终端,本申请实施例对此不加以限定。外部数据输入模块主要用于输入通过其他传统的或者更加精确的手段检测得出的血糖、血压、血脂等生理指标,外部数据输入模块的数据将用于和无创血糖测量终端采集得到的数据进行对比、验算,从而进一步优化云端算法,提升系统测算结果的精确性。

也即,以血糖预测场景为例,针对训练过程,需要获取的数据中包括血液血糖值,且包含上述指标测量数据,在一些实施例中,指标测量数据中包括完整的测量值,或者,缺少部分测量值。

步骤403,基于指标测量数据和参考指标数据,对数据分析模型进行训练。

在一些实施例中,数据分析模块的训练包括通用训练和个性化训练中的至少一种,其中,通用训练是指获取不同用户对应的指标测量数据和外部输入数据,从而对数据分析模型以通用为目标的训练;个性化训练是指针对指定用户对应的指标测量数据和外部输入数据进行个性化的训练,从而训练得到的数据分析模型能够针对性的提高对指定用户进行预测的准确率。

在一些实施例中,对数据分析模型进行训练的方式包括如下方式中的至少一种:

第一,将指标测量数据输入数据分析模型,通过数据分析模型对指标测量数据进行分析,得到与指标测量数据对应的目标指标数据;基于参考指标数据和目标指标数据之间的差异,对数据分析模型进行训练。

其中,数据分析模型中包括模型参数,基于参考指标数据与目标指标数据之间的差异,对模型参数进行调整。示意性的,计算目标指标数据与参考指标数据之间的差异度,如:余弦相似度,从而基于差异度对模型参数进行调整。

第二,建立参考指标数据与指标测量数据之间的关联关系,并基于建立得到的参考指标数据与指标测量数据之间的关联关系对数据分析模型中表达的关联关系进行调整。

在一些实施例中,数据分析模型为应用过程和训练过程穿插的模型,也即在应用过程中,当存在用户为协作用户时,该用户上传指标测量数据的同时还会上传参考指标数据,从而对数据分析模型进行训练。

也即,本申请实施例中包括两种类型的用户:1、普通用户;2、协作用户。其中,普通用户用于提供上述指标测量数据,从而接收服务器反馈的目标指标数据;而协作用户用于在提供指标测量数据的基础上,提供参考指标数据,从而服务器根据参考指标数据和指标测量数据对数据分析模型进行训练。

示意性的,图5是本申请一个示例性实施例提供的通用训练和个性化学习流程的示意图,如图5所示,该过程中包括:

一、通用训练流程

步骤501,用户数据采集。

在一些实施例中,采集上述指标测量数据,其中,当用户为协作用户时,则采集的数据中还包括通过传统血液样本采集手段检测得到的血液血糖测量值,而当用户为普通用户时,则采集的数据中仅包括通过表面传感方式采集得到的指标测量数据。

步骤502,用户数据测量指标完整性分析。

即判断指标测量数据是否完整,是否存在缺失的数据。

步骤503,判断用户数据中是否包含血液血糖测量值。

步骤504,当包含血液血糖测量值时,建立无创血糖与人体各测量值的关联关系。

通过关联规则,挖掘出当所有指标都具备的情况下,无创血糖与用户各测量值的关联关系。

步骤505,当不包含血液血糖测量值时,建立部分指标可用情况下人体各测量值之间的潜在关系。

当没有血液血糖测量值时且只有部分指标可用情况下,通过关联规则挖掘算法,挖掘出用户各测量值之间的关联关系。

步骤506,算法分析、预测及优化。

利用机器学习算法(如随机森林等),对已有数据进行分析,建立机器学习模型,提供预测服务,并在线上运行时动态地进行优化。即,通过协作用户上传的数据进行优化。

二、个性化学习流程

步骤507,收集用户测量数据。

在一些实施例中,个性化学习流程是针对用户进行个性化分析的过程,故采集指定用户所特有的指标特征。

步骤508,用户通用协作需求分析。

当采集到的用户测量数据上传到服务器后,服务器根据计算判断是否需要用户配合提供更多的测量数据,用以优化现有数据分析模型的精确度。

步骤509,用户个性化协作需求分析。

针对用户所特有的指标特征,服务器根据计算判断是否需要用户配合提供更多的测量数据,用以优化提高针对指定用户的模型精确度。

步骤510,判断用户是否协作。

也即,判断当前上传用户测量数据的是否为协作用户。

步骤511,若用户不需要协作,则进行常规血糖计算。

即,直接使用已有的数据分析模型对血糖进行计算。

步骤512,若用户需要协作,则进行用户行为及数据采集。

若用户为协作用户,则指示用户采集更为精确和详细的数据,在一些实施例中,服务器向用户指示需要采集的数据类型。示意性的,指示用户需要采集的数据类型包括:身份信息、身高、体重、血型等特征,以及常规测量手段测量得到的血糖、血脂、血压、体温、手指温度、心跳、环境温度和环境湿度等特征。

步骤513,个性化用户血糖计算。

针对用户特有的数据,结合综合训练后的模型,提取个性化特征,进行个性化用户血糖计算。

步骤514,数据上传及通用模型更新。

综上所述,本申请实施例提供的指标数据的分析方法,通过表面传感方式采集得到指标测量数据后,通过数据分析模型对指标测量数据进行分析,从而得到目标指标数据,而目标指标数据用于指示与血液相关的异常生命状态,也即通过表面传感方式即可以对血液的异常生命状态进行监控,而无需在人体表面造成创口,减少用户受感染的风险,提高了目标指标数据获取过程中的安全系数。

本实施例提供的方法,在数据分析模型的应用过程中,通过协作用户上传的参考指标数据对数据分析模型进行训练,从而在应用过程中对数据分析模型进行同步的优化,不断提高数据分析模型的分析准确率。

在一个可选的实施例中,上述数据分析模型包括随机森林模型,图6是本申请一个示例性实施例提供的指标数据的分析方法的流程图,其中,获取数据分析模型的过程包括:

步骤601,获取样本数据,样本数据中包括n组测量得到的数据组,n为正整数。

在一些实施例中,样本数据的样本容量为n,即该样本数据中包括n组数据组。在一些实施例中,一组数据组中包括用户单轮次测量得到的血糖数据,以及体温、血细胞压积、血液酸碱度、手指温度、心跳、血氧等指标测量数据。

首先,从样本数据中有放回的抽取n次,每次抽取一个数据组,最终形成n个样本,通过n个样本训练一个决策树,作为决策树根节点处的样本。

其中,当每个样本对应存在m种属性时,也即在决策树的每个节点需要分裂时,随机从m个属性中选取m个属性,满足m<<m,从m个属性中采用预设策略(如:信息增益策略)选择1个属性作为节点分裂属性。对每个节点进行上述分裂方式的分裂处理后,直至分裂至叶子节点,则形成决策树。

步骤602,基于样本数据训练得到k个决策树,得到由k个决策树构成的随机森林模型,k为正整数。

通过上述方式建立k个决策树,得到随机森林模型。

本申请实施例中,采用分类与回归树(classificationandregressiontree,cart)作为数据分析模型的基学习器。cart分类树是一种典型的二叉决策树,可以做分类或者回归。若预测结果是离散型数据,则cart树为分类树;若预测结果是连续型数据,则cart树是回归树。

其中,cart分类树建立算法流程如下:

首先,算法输入内容包括:样本数据d、基尼系数的阈值、样本数量的阈值;输出内容包括:决策树t。

1)对于当前决策树节点的样本数据d,若样本数量小于样本数量的阈值,则返回决策树子树,当前决策树节点停止递归;

2)确定样本数据d的基尼系数,当基尼系数小于基尼系数的阈值时,返回决策树子树,当前决策树节点停止递归;

其中,基尼系数的确定方式为:从样本数据d中随机抽取至少两个样本,对至少两个样本计算相似度,作为当前样本数据d的基尼系数。

3)计算当前节点现有的各个特征的各个特征值(也即数据组中用户上传的数据值)对样本数据d的基尼系数;

4)在计算得到的各个特征值对样本数据d的基尼系数中,选择基尼系数最小的特征a和对应的特征值a。根据这个最优特征和最优特征值,把样本数据d划分成两部分d1和d2,同时建立当前节点的左右节点,左节点的数据集为d1,右节点的数据集为d2;

5)对左右节点进行递归,生成决策树t。

综上所述,本申请实施例提供的指标数据的分析方法,通过表面传感方式采集得到指标测量数据后,通过数据分析模型对指标测量数据进行分析,从而得到目标指标数据,而目标指标数据用于指示与血液相关的异常生命状态,也即通过表面传感方式即可以对血液的异常生命状态进行监控,而无需在人体表面造成创口,减少用户受感染的风险,提高了目标指标数据获取过程中的安全系数。

通过对整体人群的随机采用,建立起无创血糖与人身体各测量值的关联关系;进一步,通过对个体进行个性化建模,进一步确定无创血糖与个体的身体各测量值的关联关系。针对个体来说,在依托大数据分析的基础上,充分考虑到了个体的身体特点,从而使得优化计算出的无创血糖值更加接近真实值。

图7是本申请一个示例性实施例提供的指标数据的分析装置的结构示意图,如图7所示,该装置包括:

获取模块710,用于获取目标采集设备采集得到的指标测量数据,所述指标测量数据为所述目标采集设备通过表面传感方式采集得到的数据;

所述获取模块710,还用于获取数据分析模型,所述数据分析模型为预先训练的机器学习模型,所述数据分析模型用于指示目标指标数据与所述指标测量数据之间的关联关系,所述目标指标数据用于指示与血液相关的异常生命状态;

分析模块720,用于将所述指标测量数据输入所述数据分析模型,通过所述数据分析模型对所述指标测量数据进行分析,得到与所述指标测量数据对应的目标指标数据。

在一个可选的实施例中,所述数据分析模型包括第一数据分析模型,所述第一数据分析模型用于实现分类预测,所述目标指标数据中包括与血液相关的至少两个候选生命状态;

如图8所示,所述分析模块720,包括:

预测单元721,用于通过第一数据分析模型对所述指标测量数据进行分类预测;

确定单元722,用于基于分类预测过程从所述至少两个候选生命状态中确定与所述指标测量数据对应的生命状态。

在一个可选的实施例中,所述目标指标数据用于指示血糖状态;

所述确定单元722,还用于基于分类预测过程从所述至少两个候选生命状态中确定与所述指标测量数据对应的血糖状态,所述至少两个候选生命状态中包括高血糖状态、中血糖状态、低血糖状态。

在一个可选的实施例中,所述数据分析模型包括第二数据分析模型,所述第二数据分类模型用于实现回归预测;

所述分析模块720,包括:

预测单元721,用于通过所述第二数据分析模型对所述指标测量数据进行回归预测;

确定单元722,用于基于回归预测过程得到与所述指标测量数据对应的目标指标数据值,所述目标指标数据值用于指示与血液相关的异常生命状态。

在一个可选的实施例中,所述目标指标数据用于指示血糖状态;

所述确定单元722,还用于基于回归预测过程得到与所述指标测量数据对应的血糖值。

在一个可选的实施例中,所述获取模块710,还用于获取参考指标数据,所述参考指标数据为与所述指标测量数据对应的参考值;

所述装置还包括:

训练模块730,用于基于所述参考指标数据和所述目标指标数据之间的差异,对所述数据分析模型进行训练。

在一个可选的实施例中,所述目标指标数据用于指示血糖状态;

所述指标测量数据包括:体温数据、手指温度数据、心跳数据、环境温度数据和环境湿度数据中的至少一种。

在一个可选的实施例中,所述分析模块,还用于对所述指标测量数据进行用户协作需求判定;

所述装置,还包括:发送模块740,用于响应于存在用户协作需求,向所述目标采集设备发送所述协作数据发送指示,所述协作数据发送指示用于指示所述目标采集设备发送所述参考指标数据;

所述训练模块730,还用于基于所述参考指标数据对所述目标指标数据进行修正。

在一个可选的实施例中,所述数据分析模型包括随机森林模型;

所述获取模块710,还用于获取样本数据,所述样本数据中包括n组测量得到的数据组,n为正整数,所述数据组中包括参考数据和通过表面传感方式采集得到的数据;基于所述样本数据训练得到k个决策树,得到由所述k个决策树构成的所述随机森林模型,k为正整数。

综上所述,本申请实施例提供的指标数据的分析装置,通过表面传感方式采集得到指标测量数据后,通过数据分析模型对指标测量数据进行分析,从而得到目标指标数据,而目标指标数据用于指示与血液相关的异常生命状态,也即通过表面传感方式即可以对血液的异常生命状态进行监控,而无需在人体表面造成创口,减少用户受感染的风险,提高了目标指标数据获取过程中的安全系数。

需要说明的是:上述实施例提供的指标数据的分析装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的指标数据的分析装置,与指标数据的分析方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图9示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体来讲:

计算机设备900包括中央处理单元(centralprocessingunit,cpu)901、包括随机存取存储器(randomaccessmemory,ram)902和只读存储器(readonlymemory,rom)903的系统存储器904,以及连接系统存储器904和中央处理单元901的系统总线905。计算机设备900还包括用于存储操作系统913、应用程序914和其他程序模块915的大容量存储设备906。

大容量存储设备906通过连接到系统总线905的大容量存储控制器(未示出)连接到中央处理单元901。大容量存储设备906及其相关联的计算机可读介质为计算机设备900提供非易失性存储。也就是说,大容量存储设备906可以包括诸如硬盘或者紧凑型光盘只读存储器(compactdiscreadonlymemory,cd-rom)驱动器之类的计算机可读介质(未示出)。

不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括ram、rom、可擦除可编程只读存储器(erasableprogrammablereadonlymemory,eprom)、带电可擦可编程只读存储器(electricallyerasableprogrammablereadonlymemory,eeprom)、闪存或其他固态存储其技术,cd-rom、数字通用光盘(digitalversatiledisc,dvd)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器904和大容量存储设备906可以统称为存储器。

根据本申请的各种实施例,计算机设备900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备900可以通过连接在系统总线905上的网络接口单元911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由cpu执行。

本申请提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述各个方法实施例提供的指标数据的分析方法。

本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的指标数据的分析方法。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1