数据处理方法、装置、设备及计算机可读存储介质

文档序号：25027702发布日期：2021-05-11 16:55阅读：71来源：国知局

本发明涉及计算机技术领域，尤其涉及一种数据处理方法、装置、设备及计算机可读存储介质。

背景技术：

重症加强护理病房(intensivecareunit，简称icu)，为重症或昏迷患者提供隔离场所和设备，提供最佳护理，有针对性的监测供给，又被称为深切治疗部。因为，为了实现对icu病人的及时治疗以及有限资源的合理应用，需要对icu病人的生存状态进行有效地预测。

为了解决上述技术问题，现有技术中一般都采用神经网络模型对icu病人的生存状态进行预测。具体地，获取病人的数值特征数据，如呼吸、体温、脉搏等数据，将该数值特征数据输入至预设的预测模型中，获得预测结果。

但是，上述方法仅根据呼吸、体温、脉搏等数值特征数据对病人的生存状况进行预测往往结果不准确，进而无法根据预测结果进行及时的救助以及资源的合理应用。

技术实现要素：

本发明提供一种数据处理方法、装置、设备及计算机可读存储介质，用于解决现有的生存状况预测方法准确度不高的技术问题。

本发明的第一个方面是提供一种数据处理方法，包括：

获取终端设备发送的目标用户的状态数据，所述状态数据包括所述目标用户的数值特征数据以及类别特征数据；

将所述状态数据输入至预设的状态预测模型，获得所述目标用户预设时间间隔内的状态预测结果；

将所述状态预测结果发送至所述终端设备。

在一种可能的设计中，所述将所述状态数据输入至预设的状态预测模型之前，还包括：

获取数据库中预设的待训练数据集，所述待训练数据集中包括多个用户的待训练数据；

通过所述待训练数据集对预设的待训练模型进行训练，获得所述状态预测模型。

在一种可能的设计中，所述待训练数据中包括所述目标用户对应的至少一个状态数据，所述状态数据包括所述目标用户在预设时间间隔内的生存状态信息、数值特征数据以及类别特征数据。

在一种可能的设计中，所述通过所述待训练数据集对预设的待训练模型进行训练之前，还包括：

若所述用户在预设时间间隔内的生存状态信息为生存，则为所述生存状态信息设置第一数值；若所述用户在预设时间间隔内的生存状态信息为死亡，则为所述生存状态信息设置第二数值；

对所述类别特征数据进行标准化处理，获得标准化的特征数据；

所述通过所述待训练数据集对预设的待训练模型进行训练，包括：

通过所述生存状态信息对应的第一数值或第二数值、所述离散化的特征数据以及数值特征数据对预设的待训练模型进行训练。

在一种可能的设计中，所述待训练模型为lightgbm模型。

在一种可能的设计中，所述通过所述待训练数据集对预设的待训练模型进行训练，包括：

将所述待训练数据集随机分为训练集与验证集；

通过所述训练集对所述待训练模型进行训练，通过所述验证集计算所述待训练模型对应的auc数值；

根据所述auc数值对所述训练集以及所述待训练模型的参数进行调整优化，直至所述auc数值满足预设的条件，获得所述状态预测模型。

在一种可能的设计中，所述将所述状态数据输入至预设的状态预测模型，获得所述目标用户预设时间间隔内的状态预测结果之后，还包括：

根据所述状态预测结果对所述目标用户占用的区域进行规划处理。

本发明的另一个方面是提供一种数据处理装置，包括：

获取模块，用于获取终端设备发送的目标用户的状态数据，所述状态数据包括所述目标用户的数值特征数据以及类别特征数据；

处理模块，用于将所述状态数据输入至预设的状态预测模型，获得所述目标用户预设时间间隔内的状态预测结果；

发送模块，用于将所述状态预测结果发送至所述终端设备。

在一种可能的设计中，所述装置还包括：

数据获取模块，用于获取数据库中预设的待训练数据集，所述待训练数据集中包括多个用户的待训练数据；

训练模块，用于通过所述待训练数据集对预设的待训练模型进行训练，获得所述状态预测模型。

在一种可能的设计中，所述装置还包括：

设置模块，用于若所述用户在预设时间间隔内的生存状态信息为生存，则为所述生存状态信息设置第一数值；若所述用户在预设时间间隔内的生存状态信息为死亡，则为所述生存状态信息设置第二数值；

特征处理模块，用于对所述类别特征数据进行标准化处理，获得标准化的特征数据；

所述训练模块用于：

通过所述生存状态信息对应的第一数值或第二数值、所述离散化的特征数据以及数值特征数据对预设的待训练模型进行训练。

在一种可能的设计中，所述待训练模型为lightgbm模型。

在一种可能的设计中，所述训练模块用于：

将所述待训练数据集随机分为训练集与验证集；

通过所述训练集对所述待训练模型进行训练，通过所述验证集计算所述待训练模型对应的auc数值；

根据所述auc数值对所述训练集以及所述待训练模型的参数进行调整优化，直至所述auc数值满足预设的条件，获得所述状态预测模型。

在一种可能的设计中，所述装置还包括：

规划模块，用于根据所述状态预测结果对所述目标用户占用的区域进行规划处理。

本发明的又一个方面是提供一种数据处理设备，包括：存储器，处理器；

存储器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为由所述处理器执行如第一方面所述的数据处理方法。

本发明的又一个方面是提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如第一方面所述的数据处理方法。

本发明提供的数据处理方法、装置、设备及计算机可读存储介质，通过获取目标用户的数值特征数据以及类别特征数据，并采用预设的状态预测模型实现对目标用户生成状态的预测，获得用户预设时间间隔内的状态预测结果，从而能够提高用户生存状态预测的准确性，进而能够实现对目标用户的有效救治以及icu病房的合理规划。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明基于的网络架构示意图；

图2为本发明实施例一提供的数据处理方法的流程示意图；

图3为本发明实施例二提供的数据处理方法的流程示意图；

图4为本发明所基于的又一系统架构图；

图5为本发明实施例提供的生存状态信息示意图；

图6为本发明实施例三提供的数据处理装置的结构示意图；

图7为本发明实施例四提供的数据处理装置的结构示意图；

图8为本发明实施例五提供的数据处理设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例，都属于本发明保护的范围。

针对上述提及的在现有的icu病人生存状况预测方法中，仅采用体温、心率、血压等数据进行预测，准确率不高的技术问题，本发明提供了一种数据处理方法、装置、设备及计算机可读存储介质。

需要说明的是，本申请提供数据处理方法、装置、设备及计算机可读存储介质可运用在对各种icu病房病人生存状况预测的场景中。

为了实现对icu病人生存状况的预估，现有技术中一般都是获取病人对应的呼吸、体温、脉搏等数据，根据上述数据采用预设的预测模型进行预测，获得预测结果。但是，仅采用呼吸、体温、脉搏等数据进行预测，往往预测结果精准度不高。

发明人在研究的过程中发现，除了呼吸、体温、脉搏等数值特征数据以外，还可以获取病人对应的类别特征数据，通过数值特征数据一级类别特征数据一同实现对病人生存状况的预测。

发明人进一步地研究发现，通过获取目标用户的数值特征数据以及类别特征数据，并采用预设的状态预测模型实现对目标用户生成状态的预测，获得用户预设时间间隔内的状态预测结果，从而能够提高用户生存状态预测的准确性，进而能够实现对目标用户的有效救治以及icu病房的合理规划。

图1为本发明基于的网络架构示意图，如图1所示，本发明基于的系统架构至少包括：终端设备1、数据处理装置2以及数据服务器3。其中，数据处理装置2采用c/c++、java、shell或python等语言编写；终端设备1则可例如台式电脑、平板电脑等。

图2为本发明实施例一提供的数据处理方法的流程示意图，如图2所示，所述方法包括：

步骤101、获取终端设备发送的目标用户的状态数据，所述状态数据包括所述目标用户的数值特征数据以及类别特征数据。

本实施例的执行主体为数据处理装置，该数据装置与终端设备通信连接，从而能够与终端设备进行信息交互。

其中，该终端设备可以为用户的手持终端，例如，其可以为医护人员的手机，医护人员可以在获取到医疗设备采集的目标用户的状态数据之后，输入至终端设备中，并将该状态数据发送至数据处理装置。该目标用户具体可以为icu内的患者。

可选地，该终端设备也可以为医院中各医疗设备，各医疗设备可以对目标用户的状态数据进行测量，并将该状态数据发送至数据处理装置。实际应用中，各医疗设备采集状态数据的时间间隔可以不同，各医疗设备可以在采集之后即将状态数据发送至数据处理装置，也可以按照预设的时间周期，将该时间周期内采集的状态数据发送至数据处理设备。

需要说明的是，为了提高目标用户生存状态的预测精准度，该状态数据中可以目标用户的数值特征数据以及类别特征数据，其中数值特征数据可以为目标用户的体温、血压、心率等具有具体数值的特征数据，类别特征数据则可以为临床检验中的分类指标，例如阴性、阳性、性别等特征数据。

步骤102、将所述状态数据输入至预设的状态预测模型，获得所述目标用户预设时间间隔内的状态预测结果。

在本实施方式中，获取到目标用户对应的状态数据之后，为了实现对目标用户未来预设时间间隔内生存状态的预测，可以将该状态数据输入至预设的状态预测模型中，该状态预测模型可以根据状态数据输出相应的状态预测结果。在实际应用中，该预设时间间隔可以为两小时，该状态预测结果具体可以为目标用户在未来两小时生存或死亡。

步骤103、将所述状态预测结果发送至所述终端设备。

在本实施方式中，通过状态预测模型获得状态预测结果之后，为了使医护人员能够尽快地获得目标用户预设时间间隔内的生存状态，数据处理装置可以将该状态预测结果发送至终端设备中，从而医护人员可以在终端设备上实现对状态预测结果的查看。

进一步地，在步骤102之后，所述方法还包括：

根据所述状态预测结果对所述目标用户占用的区域进行规划处理。

在本实施例中，医护人员可以在终端设备上状态预测结果进行查看之后，可以根据状态预存结果对目标用户进行紧急救助，或者，可以根据预测结果对目标用户所占用的区域进行规划处理。以实际应用举例来说，当icu病床占用率很高时，可以根据预测结果对icu病床进行规划，以使icu病床得到最大化的利用。

本实施例提供的数据处理方法，通过获取目标用户的数值特征数据以及类别特征数据，并采用预设的状态预测模型实现对目标用户生成状态的预测，获得用户预设时间间隔内的状态预测结果，从而能够提高用户生存状态预测的准确性，进而能够实现对目标用户的有效救治以及icu病房的合理规划。

图3为本发明实施例二提供的数据处理方法的流程示意图，在上述任一实施例的基础上，如图3所示，步骤102之前，还包括：

步骤202、获取数据库中预设的待训练数据集，所述待训练数据集中包括多个用户的待训练数据；

步骤203、通过所述待训练数据集对预设的待训练模型进行训练，获得所述状态预测模型。

图4为本发明所基于的又一系统架构图，如图4所示，本发明所基于的系统架构还包括数据服务器3，其中，数据服务器3则可为云端服务器或服务器集群，其内存储有大量的数据。该数据处理装置2分别与终端设备1以及数据服务器3通信连接，从而能够分别与终端设备1以及数据服务器3进行信息交互。

在本实施例中，数据处理装置可以从数据服务器中获取预设的待训练数据集，其中，该待训练数据集中包括多个用户的待训练数据。具体地，所述待训练数据中包括所述用户对应的至少一个状态数据。具体地，状态数据包括所述用户在预设时间间隔内的生存状态信息、数值特征数据以及类别特征数据。其中数值特征数据可以为目标用户的体温、血压、心率等具有具体数值的特征数据，类别特征数据则可以为临床检验中不具有具体数值的分类指标，例如阴性、阳性、性别等特征数据。

实际应用中，每一位目标用户在icu住院期间，可以以预设的时间间隔为单位，对目标用户的生存状态信息进行总结，获得各目标用户对应的至少一个样本序列，其中，该预设的时间间隔可以根据实际需求进行设置，例如，该预设的时间间隔可以为一小时、两小时等，本发明对此不做限制。图5为本发明实施例提供的生存状态信息示意图，如图5所示，以患者a举例来说，对患者a入住icu后的生存状态进行监测总结，获得患者a对应的样本序列，该样本序列中包括四个样本，每个样本对应的时间为两个小时。如图5所示，患者a一共入住icu两次，第一次治疗之后，患者a情况有所好转，顺利转出icu。因此，对于第一次治疗，其对应的两个样本，在预设的时间间隔内均为存活。在患者a第二次进入icu治疗时，4小时后死亡，因此，第二次治疗对应的两个两小时样本为死亡。

在获取到预设的待训练数据集之后，既可以通过该待训练数据集对预设的待训练模型进行训练操作，直至模型收敛，获得状态预测模型。需要说明的是，由于该待训练数据集中包括目标用户在预设时间间隔内的生存状态信息、数值特征数据以及类别特征数据，从而根据该待训练数据集训练得到的状态预测模型，可以根据数值特征数据以及类别特征数据实现对目标用户在预设时间间隔内的生存状态进行精准预测。

具体地，所述待训练模型为lightgbm模型。

进一步地，为了提高模型训练的效率，在通过待训练数据集对待训练模型进行训练之前，还需要对待训练数据集进行数据处理操作。在上述任一实施例的基础上，步骤202之前，还包括：

对所述类别特征数据进行标准化处理，获得标准化的特征数据；

步骤202具体包括：

通过所述生存状态信息对应的第一数值或第二数值、所述离散化的特征数据以及数值特征数据对预设的待训练模型进行训练。

在本实施例中，由于数值特征数据为离散的数值，其可以直接用于待训练模型的训练，而目标用户在预设时间间隔内的生存状态信息以及类别特征数据，其无法直接用于模型的训练，因此，需要对待训练数据集进行预处理。

具体地，若用户在预设时间间隔内的生存状态信息为生存，则为生存状态信息设置第一数值，该第一数值具体可以为0；若用户在预设时间间隔内的生存状态信息为死亡，则为生存状态信息设置第二数值，该第二数值具体可以为1。

相应地，可以对类别特征数据进行标准化处理，获得标准化的特征数据，具体可以采用labelencoder编码对类别特征数据进行标准化处理，例如，阴性、阳性分别编码为0、1，把编码作为该特征的值，获得标准化的特征数据。

进一步地，为了提高待训练模型的训练精度，在训练过程中，可以对待训练模型的参数以及待训练数据进行调整操作，在上述任一实施例的基础上，步骤202具体包括：

将所述待训练数据集随机分为训练集与验证集；

通过所述训练集对所述待训练模型进行训练，通过所述验证集计算所述待训练模型对应的auc数值；

根据所述auc数值对所述训练集以及所述待训练模型的参数进行调整优化，直至所述auc数值满足预设的条件，获得所述状态预测模型。

在本实施例中，为了进一步地提高状态预测模型的预测精度，在模型训练过程中，如图5所示，可以将待训练数据集随机分为训练集与验证集，通过训练集对待训练模型进行训练，通过验证集对待训练模型进行验证，直至模型收敛，获得该状态预测模型。

具体地，可以通过验证集确定待训练模型对应的auc值(areaundercurve)被定义为roc曲线下与坐标轴围成的面积，auc越接近于1，则表征模型分类效果越好。因此，可以根据该auc数值对训练集以及待训练模型的参数进行调整优化操作，直至auc数值满足预设的条件，获得所述状态预测模型。

本实施例提供的数据处理方法，通过采用预设的待训练数据集对预设的待训练模型进行训练操作，由于该待训练数据集中包括目标用户在预设时间间隔内的生存状态信息、数值特征数据以及类别特征数据，从而根据该待训练数据集训练得到的状态预测模型，可以根据数值特征数据以及类别特征数据实现对目标用户在预设时间间隔内的生存状态进行精准预测。

图6为本发明实施例三提供的数据处理装置的结构示意图，如图6所示，所述装置包括：获取模块31、处理模块32以及发送模块33，其中，获取模块31，用于获取终端设备发送的目标用户的状态数据，所述状态数据包括所述目标用户的数值特征数据以及类别特征数据；处理模块32，用于将所述状态数据输入至预设的状态预测模型，获得所述目标用户预设时间间隔内的状态预测结果；发送模块33，用于将所述状态预测结果发送至所述终端设备。

进一步地，在实施例三的基础上，所述装置还包括：

规划模块，用于根据所述状态预测结果对所述目标用户占用的区域进行规划处理。

本实施例提供的数据处理装置，通过获取目标用户的数值特征数据以及类别特征数据，并采用预设的状态预测模型实现对目标用户生成状态的预测，获得用户预设时间间隔内的状态预测结果，从而能够提高用户生存状态预测的准确性，进而能够实现对目标用户的有效救治以及icu病房的合理规划。

图7为本发明实施例四提供的数据处理装置的结构示意图，在实施例三的基础上，如图7所示，所述装置还包括：数据获取模块41以及训练模块42，其中，数据获取模块41，用于获取数据库中预设的待训练数据集，所述待训练数据集中包括多个用户的待训练数据；训练模块42，用于通过所述待训练数据集对预设的待训练模型进行训练，获得所述状态预测模型。

进一步地，在上述任一实施例的基础上，所述待训练数据中包括所述目标用户对应的至少一个状态数据，所述状态数据包括所述目标用户在预设时间间隔内的生存状态信息、数值特征数据以及类别特征数据。

进一步地，在上述任一实施例的基础上，所述待训练模型为lightgbm模型。

进一步地，在上述任一实施例的基础上，所述装置还包括：

特征处理模块，用于对所述类别特征数据进行标准化处理，获得标准化的特征数据；

所述训练模块用于：

通过所述生存状态信息对应的第一数值或第二数值、所述离散化的特征数据以及数值特征数据对预设的待训练模型进行训练。

进一步地，在上述任一实施例的基础上，所述训练模块用于：

将所述待训练数据集随机分为训练集与验证集；

通过所述训练集对所述待训练模型进行训练，通过所述验证集计算所述待训练模型对应的auc数值；

根据所述auc数值对所述训练集以及所述待训练模型的参数进行调整优化，直至所述auc数值满足预设的条件，获得所述状态预测模型。

本实施例提供的数据处理装置，通过采用预设的待训练数据集对预设的待训练模型进行训练操作，由于该待训练数据集中包括目标用户在预设时间间隔内的生存状态信息、数值特征数据以及类别特征数据，从而根据该待训练数据集训练得到的状态预测模型，可以根据数值特征数据以及类别特征数据实现对目标用户在预设时间间隔内的生存状态进行精准预测。

图8为本发明实施例五提供的数据处理设备的结构示意图，如图8所示，所述数据处理设备包括：存储器51，处理器52；

存储器51；用于存储所述处理器52可执行指令的存储器51；

其中，所述处理器52被配置为由所述处理器52执行如上述任一实施例所述的数据处理方法。

存储器51，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器51可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

其中，处理器52可能是一个中央处理器(centralprocessingunit，简称为cpu)，或者是特定集成电路(applicationspecificintegratedcircuit，简称为asic)，或者是被配置成实施本发明实施例的一个或多个集成电路。

可选的，在具体实现上，如果存储器51和处理器52独立实现，则存储器51和处理器52可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(industrystandardarchitecture，简称为isa)总线、外部设备互连(peripheralcomponent，简称为pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture，简称为eisa)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器51和处理器52集成在一块芯片上实现，则存储器51和处理器52可以通过内部接口完成相同间的通信。

本发明又一实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上述任一实施例所述的数据处理方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱卫国;隆云;姜会珍;李冬凯;王郝;苏龙翔
技术所有人：中国医学科学院北京协和医院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。