基于深度强化学习的数据分类方法、装置、设备及介质与流程

文档序号:22618056发布日期:2020-10-23 19:20阅读:186来源:国知局
基于深度强化学习的数据分类方法、装置、设备及介质与流程

本申请涉及人工智能技术领域,尤其涉及基于深度强化学习的数据分类方法、装置、设备及介质。



背景技术:

为了节约医疗资源,目前人们将医疗辅助决策模型和方法运用于人群分类中,其能够帮助临床诊疗时医生的判断,降低医生工作负担,提高诊疗准确性,并且通过医疗辅助决策模型和方法能够对人群的数据划分不同的分类,从而提升人群对疾病的认知、自身与人群的对比情况的认知,同时提升人群对自己用药策略的认知。

现有的医疗辅助决策模型和方法仅仅根据人体的特征数据,对人群进行分类,不考虑其他因素。但是,在实际情况下,人群的不同用药策略、治疗结果和人体特征数据等等因素,都对人群的分类产生或大或小的影响。所以现有的医疗辅助决策模型和方法由于不考虑到用药策略、治疗结果等因素,这样导致对该疾病的数据分类准确性较低。现亟需一种能够通过不同因素对疾病进行数据分析,提高对疾病的数据分类的准确性的方法。



技术实现要素:

本申请实施例的目的在于提出一种基于深度强化学习的数据分类方法,能够通过不同因素对疾病进行数据分析,以提高对疾病的数据分类的准确性的方法。

为了解决上述技术问题,本申请实施例提供一种基于深度强化学习的数据分类方法,包括:

从调查数据库中提取待分类疾病对应的调查数据,并对所述调查数据进行格式化处理,得到初始数据,所述初始数据包括:分类特征、特征方案和结果信息;

对所述分类特征进行预处理,得到训练数据;

通过所述训练数据和所述特征方案对所述结果信息进行训练,产生特征值;

使用所述特征值调整所述训练数据的参数和所述特征方案的参数,并将参数调整后的训练数据和特征方案作为目标方案;

通过深度强化学习模型,使用所述目标方案对所述结果信息进行迭代计算,得到分群决策模型;

针对任一用户,获取所述用户的特征数据,并将所述特征数据输入到所述分群决策模型中,得到所述用户对应的分类。

进一步的,所述对所述分类特征进行预处理,得到训练数据包括:

对所述分类特征中的分类变量做one-hot编码,得到分类特征编码;

采用z-score标准化方法,对所述分类特征编码做连续标准化,得到标准化数据;

对所述分类特征中的结局做二值化处理,得到二值化结果;

将所述标准化数据和所述二值化结果作为训练数据。

进一步的,所述对所述分类特征进行预处理,得到训练数据还包括:

通过特征工程,对所述分类特征进行特征合并,得到新的分类特征特征。

进一步的,所述通过所述训练数据和所述特征方案对所述结果信息进行训练,产生特征值包括:

将所述分类特征的对应数值作为所述训练数据的状态;

将所述特征方案进行离散值处理,作为所述训练数据的动作;

通过所述状态和所述动作对所述结果信息进行训练,得到所述特征值。

进一步的,所述使用所述特征值调整所述训练数据的参数和所述特征方案的参数,并将参数调整后的训练数据和特征方案对结果信息作为目标方案包括:

采用梯度下降法,通过所述特征值逐渐下调所述训练数据的参数和所述特征方案的参数;

将参数调整后的训练数据和特征方案对结果信息作为所述目标方案。

进一步的,所述通过深度强化学习模型,使用所述目标方案对所述结果信息进行迭代计算,得到分群决策模型包括:

采用优先经验回放的方式,抽取所述目标方案;

通过深度强化学习模型,将所述目标方案对所述结果信息进行迭代计算,得到所述分群决策模型。

进一步的,在所述从调查数据库中提取待分类疾病对应的调查数据,并对所述调查数据进行格式化处理,得到初始数据之前,所述方法还包括:

从医学指南中,获取所述待分类疾病的特征方案。

为了解决上述技术问题,本申请实施例提供一种基于深度强化学习的数据分类装置,包括:

初始数据获取模块,用于从调查数据库中提取待分类疾病对应的调查数据,并对所述调查数据进行格式化处理,得到初始数据,所述初始数据包括:分类特征、特征方案和结果信息;

训练数据获取模块,用于对所述分类特征进行预处理,得到训练数据;

结果信息训练模块,用于通过所述训练数据和所述特征方案对所述结果信息进行训练,产生特征值;

目标方案获取模块,用于使用所述特征值调整所述训练数据的参数和所述特征方案的参数,并将参数调整后的训练数据和特征方案作为目标方案;

分群决策模型模块,用于通过深度强化学习模型,使用所述目标方案对所述结果信息进行迭代计算,得到分群决策模型;

用户分类确定模块,用于针对任一用户,获取所述用户的特征数据,并将所述特征数据输入到所述分群决策模型中,得到所述用户对应的分类。

为解决上述技术问题,本发明采用的一个技术方案是:提供一种计算机设备,包括,一个或多个处理器;存储器,用于存储一个或多个程序,使得一个或多个处理器实现上述任意一项所述的基于深度强化学习的数据分类方案。

为解决上述技术问题,本发明采用的一个技术方案是:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于深度强化学习的数据分类方案。

以上方案中的一种基于深度强化学习的数据分类方法,通过对获取的调查数据进行格式化处理,得到初始数据,使得调查数据得以一致的格式进行后续步骤的处理,然后对初始数据中的分类特征预处理,得到训练数据,并通过训练数据和特征方案对结果信息进行训练,产生特征值,再使用特征值调整训练数据的参数和特征方案的参数,实现不断改变参数,有利于不同参数对后续分群决策模块的训练获取;然后通过深度强化学习模型,使用目标方案对结果信息进行迭代计算,得到分群决策模型,再将获取用户的特征数据输入到分群决策模型中,得到用户对应的分类,实现通过不同因素对疾病进行数据分析,以提高对疾病的数据分类的准确性。

附图说明

为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的基于深度强化学习的数据分类方法的应用环境示意图;

图2根据本申请实施例提供的基于深度强化学习的数据分类方法的一实现流程图;

图3是本申请实施例提供的基于深度强化学习的数据分类方法中步骤s2的一实现流程图;

图4是本申请实施例提供的基于深度强化学习的数据分类方法中步骤s3的一实现流程图;

图5是本申请实施例提供的基于深度强化学习的数据分类装置示意图;

图6是本申请实施例提供的计算机设备的示意图。

具体实施方式

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。

下面结合附图和实施方式对本发明进行详细说明。

请参阅图1,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、搜索类应用、即时通信工具等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是,本申请实施例所提供的一种基于深度强化学习的数据分类方法一般由服务器执行,相应地,一种基于深度强化学习的数据分类装置一般设置于服务器中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

请参阅图2,图2示出了基于深度强化学习的数据分类方法的一种具体实施方式。

需注意的是,若有实质上相同的结果,本发明的方法并不以图2所示的流程顺序为限,该方法包括如下步骤:

s1:从调查数据库中提取待分类疾病对应的调查数据,并对调查数据进行格式化处理,得到初始数据,初始数据包括:分类特征、特征方案和结果信息。

具体的,对获取的调查数据进行格式化处理,使整理成为结构化数据的形式,便于后续对调查数据的处理。

其中,结构化数据也称为行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。

其中,待分类疾病是针对某一疾病的,不同的疾病有不同的疾病数据。如需要获知房颤病患者的分类情况,则需要获取房颤病在医学知识库中的信息。根据需要获哪一疾病的分类情况,获取该疾病的疾病数据。

其中,调查数据库是通过以真实世界人群的流行病学调查而来的横断面数据。其中,待分类疾病数据包括以往患有该疾病人员的信息以及疾病人员的表现情况,如年龄、患病表现、身体指标、遗传病史、用药策略、和治疗结局等等。

其中,分类特征指的是某一类待分类疾病的患者的身体特征数据和治疗数据,例如包括患者的基本信息、疾病史、遗传史、用药史、检验检查结果、风险预测结果和诊断结果等等。

其中,特征方案指的是某一类待分类疾病,所有的治疗方案。

其中,结果信息指的是某一类待分类疾病才有治疗方案后,患者的表现的结果情况。该结果信息包括采取治疗方案后,患者的短期和长期的表现的结果情况。

s2:对分类特征进行预处理,得到训练数据。

具体的,对分类特征进行预处理包括对分类特征数据的筛选、对分类特征中分类变量进行编码和标准化,是分类特征中的数据能够以设定的形式,进行后续步骤的训练过程。对分类特征进行预处理,得到训练数据的详细步骤如下文步骤s21-s24描述,此处不再累赘。

训练数据是指对分类特征进行预处理之后,得到分类特征中的数据能够以设定的形式,能够进行训练的数据。

s3:通过训练数据和特征方案对结果信息进行训练,产生特征值。

具体的,每次将训练数据与特征方案共同作用下,观察患者的结果信息的变化情况,从而每次获取都能得到特征值,该特征值可以反应出训练数据和特征方案对结果信息作用情况。具体的训练过程详见步骤s31-s33,此处不再累赘。

特征值是强化学习中的反馈信号的标量度量,是一个数字,用来度量主体agent每一步做的怎么样。主体agent的目标是把每一步的奖励累加起来,尽可能使奖励的总价值达到最大。通过产生的特征值对后续调整训练数据和特征方案的参数,最终得到分群决策模型。

s4:使用特征值调整训练数据的参数和特征方案的参数,并将参数调整后的训练数据和特征方案作为目标方案。

具体的,每次产生的特征值都会对训练数据的参数和特征方案的参数进行调整,每次参数调整后,都得到一个目标方案。

其中,目标方案为使用特征值调整训练数据的参数和特征方案的参数后,得到的训练数据和特征方案,用以后续步骤对结果信息的迭代计算。

s5:通过深度强化学习模型,使用目标方案对结果信息进行迭代计算,得到分群决策模型。

具体的,通过深度强化学习模型,使用目标方案对结果信息进行迭代计算,当结果信息呈现预期的结果时,得到分群决策模型。

其中,预期的结果为针对某一待分类疾病,在分类特征和特征方案的作用下,迭代计算结果已经完全收敛。

其中,深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能方法。在本申请实施例中,通过深度强化学习模型,使用目标方案对结果信息进行迭代计算,得到分群决策模型。

s6:针对任一用户,获取用户的特征数据,并将特征数据输入到分群决策模型中,得到用户对应的分类。

其中,特征数据是指任一用户对待分类疾病的身体特征数据和治疗数据,例如包括任一用户的基本信息、疾病史、遗传史、用药史、检验检查结果、风险预测结果和诊断结果等等。

在本方案中,通过对获取的调查数据进行格式化处理,得到初始数据,使得调查数据得以一致的格式进行后续步骤的处理,然后对初始数据中的分类特征预处理,得到训练数据,并通过训练数据和特征方案对结果信息进行训练,产生特征值,再使用特征值调整训练数据的参数和特征方案的参数,实现不断改变参数,有利于不同参数对后续分群决策模块的训练获取;然后通过深度强化学习模型,使用目标方案对结果信息进行迭代计算,得到分群决策模型,再将获取用户的特征数据输入到分群决策模型中,得到用户对应的分类,实现通过不同因素对疾病进行数据分析,以提高对疾病的数据分类的准确性。

请参阅图3,图3示出了步骤s2的一种具体实施方式,步骤s2中对分类特征进行预处理,得到训练数据的具体实现过程,详叙如下:

s21:对分类特征中的分类变量做one-hot编码,得到分类特征编码。

其中,分类特征中的分类变量是指分类特征中,某些可以发生变化的量,例如,房颤患者的心率、血压等等特征。

其中,one-hot编码是指独热码,在英文文献中称做one-hotcode,直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制。通常,在通信网络协议栈中,使用八位或者十六位状态的独热码,且系统占用其中一个状态码,余下的可以供用户使用。例如,如教育程度分为小学,中学,本科,研究生即以上,采用one-hot编码之后,小学用向量[1,0,0,0]表示,中学用向量[0,1,0,0]表示,以此类推。

s22:采用z-score标准化方法,对分类特征编码做连续标准化,得到标准化数据。

具体的,连续变量标准化采用z-score标准化的公式为z表示z分数,x为观测值(特征真实值,如年龄76),u为总体平均值(例如所有样本的平均年龄),δ为总体标准差(所有样本的年龄标准差)。通过z-score标准化方法,对分类特征编码做连续标准化,得到标准化数据。

其中,z-score即z分数,是一种能够真实的反应一个分数距离平均数的相对标准距离。如果我们把每一个分数都转换成z分数,那么每一个z分数会以标准差为单位表示一个具体分数到平均数的距离或离差。将成正态分布的数据中的原始分数转换为z分数,我们就可以通过查阅z分数在正态曲线下面积的表格来得知平均数与z分数之间的面积,进而得知原始分数在数据集合中的百分等级。一个数列的各z分数的平方和等于该数列数据的个数,并且z分数的标准差和方差都为1,平均数为0。

s23:对分类特征中的结局做二值化处理,得到二值化结果。

具体的,对分类特征中的结局做二值化处理后,用0和1表示类特征中的结局有无发生,0表示未发生,1表示发生,从而得到二值化结果。

s24:将标准化数据和二值化结果作为训练数据。

具体的,将标准化数据和二值化结果作为训练数据,便于后续对分群决策模型的训练。

本实施例中,通过对分类特征中的分类变量做one-hot编码,得到分类特征编码,并采用z-score标准化方法,对分类特征编码做连续标准化,得到标准化数据,然后对分类特征中的结局做二值化处理,得到二值化结果,最后将标准化数据和二值化结果作为训练数据,便于后续对对分群决策模型的训练,提高对疾病的数据分类的准确性。

进一步的,步骤s2还包括:

通过特征工程,对分类特征进行特征合并,得到新的分类特征特征。

具体的,通过特征工程,获取各个分类特征的特征基元,再通过特征基元的聚合,将关系相近的分类特征进行特征合并,得到新的分类特征特征。

例如,在房颤患者中,患者的胃穿孔、胃溃疡,由于胃穿孔、胃溃疡对于房颤并而言,并无直接关系,这可以将胃穿孔、胃溃疡合并成胃病,以减少分类特征对后续训练的影响,而有些多种特征无直接对房颤病有影响,但是合并成一个特征后,则对房颤病有直接的影响,所以通过合并有直接影响和无直接影响的特征,从而提高对疾病的数据分类的准确性。

本实施例中,通过特征工程,对分类特征进行特征合并,得到新的分类特征特征,获取到更多的分类特征,从而提高对疾病的数据分类的准确性。

请参阅图4,图4示出了步骤s3的一种具体实施方式,步骤s3中通过训练数据和特征方案对结果信息进行训练,产生特征值具体实现过程,详叙如下:

s31:将分类特征的对应数值作为训练数据的状态。

具体的,将分类特征的对应数值作为训练数据的状态,用以后续对结果信息的训练。

其中,状态是指强化学习中的state。状态state是对信息的总结,包含了强化学习需要的所有信息,决定了下一步的动作action。

例如将患者特征对应的数值作为状态state,即人口统计学信息(如性别、年龄等)、检验检查指标(如心率、肝功、肾功等)、疾病史、用药史等等。

s32:将特征方案进行离散值处理,作为训练数据的动作。

具体的,离散处理是一个训练集预处理的方法,用于将连续的数值属性转化为离散的数值属性。

其中,动作是指强化学习中的action,强化学习通过主体agent取动作action来影响训练环境。

s33:通过状态和动作对结果信息进行训练,得到特征值。

具体的,通过状态和动作对结果信息进行训练,得到特征值,用以后续改变分类特征和特征方案的参数。

本实施例中,通过将分类特征的对应数值作为训练数据的状态,将特征方案进行离散值处理,作为训练数据的动作,通过状态和动作对结果信息进行训练,得到特征值,实现了特征值的获取,进而改变后续步骤的分类特征和特征方案的参数,有利于提高对疾病的数据分类的准确性。

进一步的,步骤s4的具体实现过程,祥叙如下:

采用梯度下降法,通过特征值逐渐下调训练数据的参数和特征方案的参数。

其中,梯度下降法是迭代法的一种,可以用于求解最小二乘问题。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(gradientdescent)是最常采用的方法之一。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。反过来,如果我们需要求解损失函数的最大值,这时就需要用梯度上升法来迭代了。在机器学习中,基于基本的梯度下降法发展了两种梯度下降方法,分别为随机梯度下降法和批量梯度下降法。在本申请实施例中,采用梯度下降法,通过特征值逐渐下调训练数据的参数和特征方案的参数,便于后续获取分群决策模型。

将参数调整后的训练数据和特征方案对结果信息作为目标方案。

具体的,每次参数调整后的训练数据和特征方案后,都作为一个目标方案,用于后续对分群决策模型的训练。

本实施例中,采用梯度下降法,通过特征值逐渐下调训练数据的参数和特征方案的参数,将参数调整后的训练数据和特征方案对结果信息作为目标方案,实现对训练数据和特征方案参数的调整,以提高对分群决策模型的训练效率,从而提高对疾病的数据分类的准确性。

进一步的,步骤s5的具体实现过程,祥叙如下:

采用优先经验回放的方式,抽取目标方案。

具体的,本申请实施例采用优先经验回放的方式,即抽取目标方案时,优先抽取最有价值的目标方案,但是又不能只抽取最有价值的,从而实现目标方案的抽取具有针对性。

通过深度强化学习模型,将目标方案对结果信息进行迭代计算,得到分群决策模型。

具体的,当迭代计算结束后,获得分群决策模型,用以输出用户的分类情况。

本实施例中,采用优先经验回放的方式,抽取目标方案,并通过深度强化学习模型,将目标方案对结果信息进行迭代计算,得到分群决策模型,用以输出用户的分类情况,从而提高对疾病的数据分类的准确性。

进一步的,在步骤s1之前,该基于深度强化学习的数据分类方法还包括:

从医学指南中,获取待分类疾病的特征方案。

具体的,梳理医学指南,获取待分类疾病的特征方案,从而获知针对某一待分类疾病,所公开的特征方案。例如,从医学指南中,获取治疗房颤病的所有治疗方案,便于后续对特征方案的进一步筛选。

进一步的,通过将医学指南规则化,并结合分群决策树,对待分类疾病的人群进行划分。

具体的,分群决策树是仅根据医学指南得到的一个粗粒度的分群方法,根据该分群决策树我们可以确定哪些人是已经较精准分群的,哪些需要其他方法更进一步分群。如:在房颤患者的抗凝治疗场景中,医学指南推荐“cha2ds2-vasc积分≥2分的男性或≥3分的女性房颤患者血栓事件的年发生率较高,抗凝治疗带来的临床净获益明显”,也就是说,对于cha2ds2-vasc积分小于2分的男性或小于3分的女性房颤患者可以作为一个明确的分群,该群的抗凝治疗手段也很明确,即不需要抗凝治疗。但是对于cha2ds2-vasc积分≥2分的男性或≥3分的女性房颤患者仍需要进一步细分,有的抗凝治疗药物在控制血栓事件发生率的同时可能会增加出血事件的发生率。通过医学指南来定义结果信息是为了保证结果信息的可信度和权威性,即将医学指南中提到的结果作为计算特征值时要用的结果信息。

需要强调的是,为进一步保证上述调查数据的私密和安全性,上述调查数据还可以存储于一区块链的节点中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等非易失性存储介质,或随机存储记忆体(randomaccessmemory,ram)等。

请参考图5,作为对上述图5所示方法的实现,本申请提供了一种基于深度强化学习的数据分类装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图5所示,本实施例的基于深度强化学习的数据分类装置包括:初始数据获取模块71、训练数据获取模块72、结果信息训练模块73、目标方案获取模块74、分群决策模型模块75及用户分类确定模块76,其中:

初始数据获取模块71,用于从调查数据库中提取待分类疾病对应的调查数据,并对调查数据进行格式化处理,得到初始数据,初始数据包括:分类特征、特征方案和结果信息;

训练数据获取模块72,用于对分类特征进行预处理,得到训练数据;

结果信息训练模块73,用于通过训练数据和特征方案对结果信息进行训练,产生特征值;

目标方案获取模块74,用于使用特征值调整训练数据的参数和特征方案的参数,并将参数调整后的训练数据和特征方案作为目标方案;

分群决策模型模块75,用于通过深度强化学习模型,使用目标方案对结果信息进行迭代计算,得到分群决策模型;

用户分类确定模块76,用于针对任一用户,获取用户的特征数据,并将特征数据输入到分群决策模型中,得到用户对应的分类。

进一步的,训练数据获取模块72包括:

分类特征编码单元,用于对分类特征中的分类变量做one-hot编码,得到分类特征编码;

标准化数据单元,用于采用z-score标准化方法,对分类特征编码做连续标准化,得到标准化数据;

二值化结果单元,用于对分类特征中的结局做二值化处理,得到二值化结果;

训练数据确定单元,用于将标准化数据和二值化结果作为训练数据。

进一步的,训练数据获取模块72还包括:

新的分类特征特征单元,用于通过特征工程,对分类特征进行特征合并,得到新的分类特征特征。

进一步的,结果信息训练模块73包括:

状态获取单元,用于将分类特征的对应数值作为训练数据的状态;

动作获取单元,用于将特征方案进行离散值处理,作为训练数据的动作;

特征值获取单元,用于通过状态和动作对结果信息进行训练,得到特征值。

进一步的,目标方案获取模块74包括:

参数调整单元,用于采用梯度下降法,通过特征值逐渐下调训练数据的参数和特征方案的参数;

目标方案确定单元,用于将参数调整后的训练数据和特征方案对结果信息作为目标方案。

进一步的,分群决策模型模块75包括:

目标方案抽取单元,用于采用优先经验回放的方式,抽取目标方案;

迭代计算单元,用于通过深度强化学习模型,将目标方案对结果信息进行迭代计算,得到分群决策模型。

进一步的,该基于深度强化学习的数据分类装置还包括:

特征方案获取模块,用于从医学指南中,获取待分类疾病的特征方案。

需要强调的是,为进一步保证上述调查数据的私密和安全性,上述调查数据还可以存储于一区块链的节点中。

为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6,图6为本实施例计算机设备基本结构框图。

计算机设备8包括通过系统总线相互通信连接存储器81、处理器82、网络接口83。需要指出的是,图中仅示出了具有三种组件存储器81、处理器82、网络接口83的计算机设备8,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。

计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

存储器81至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器81可以是计算机设备8的内部存储单元,例如该计算机设备8的硬盘或内存。在另一些实施例中,存储器81也可以是计算机设备8的外部存储设备,例如该计算机设备8上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器81还可以既包括计算机设备8的内部存储单元也包括其外部存储设备。本实施例中,存储器81通常用于存储安装于计算机设备8的操作系统和各类应用软件,例如基于深度强化学习的数据分类方法的程序代码等。此外,存储器81还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器82在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器82通常用于控制计算机设备8的总体操作。本实施例中,处理器82用于运行存储器81中存储的程序代码或者处理数据,例如运行一种基于深度强化学习的数据分类方法的程序代码。

网络接口83可包括无线网络接口或有线网络接口,该网络接口83通常用于在计算机设备8与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,计算机可读存储介质存储有服务器维护程序,服务器维护程序可被至少一个处理器执行,以使至少一个处理器执行如上述的一种基于深度强化学习的数据分类方法的步骤。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1