基于孪生神经网络的用药方案推荐系统及方法

文档序号：26091477发布日期：2021-07-30 18:00阅读：158来源：国知局

本发明属于信息推荐技术领域，具体涉及一种基于孪生神经网络的用药方案推荐系统及方法。

背景技术：

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

据《中国心血管健康与疾病报告2019》报告，中国现有3.3亿人罹患心血管疾病，且致病率和致死率仍旧在不断增加。由于这类疾病患病周期很长，难以完全治愈，采取有效的用药方案能够帮助缓解病情的进展，因此，如何合理地对心血管疾病患者的用药方案进行控制，为医生提供可靠的用药建议，从而改善患者的临床症状，防止患者疾病复发，是非常重要的。

患者与用药方案之间存在潜在的关联，通过挖掘大量患者历史诊疗记录中潜在的相似性关联，能够为医生提供可靠的临床决策支持，有助于医生实现个性化的精准医疗。

用药方案的推荐问题可以映射成为患者分类问题。传统的分类算法需要首先确切的知道每个样本从属于哪个类别，每个样本都要有确切的类别标签。由于不同患者的临床特征不同，患者的用药方案没有固定的分类标准，因而无法确切地划分用药方案的种类。

传统推荐方法可以通过先行对患者进行聚类，然后为临床相似的患者类簇群体推荐相同的用药方案，这种追求通用性的做法忽略了患者身体状况的特异性。此外，传统的推荐算法还可以根据患者罹患疾病的相似性来推荐，但是针对单一疾病，患者的诊断存在很大重复性，区分难度高。

技术实现要素：

本发明为了解决上述问题，提出了一种基于孪生神经网络的用药方案推荐系统及方法，本发明有效地解决了数据集中正负样本类别不均衡的问题，同时淡化了类别标签，使模型具有很强的可扩展性；依据患者身体状况的特异性，能够实现患者诊疗个性化，为医生提供可靠的用药建议，既提升了推荐的效率，亦提高了推荐信息的准确性。

根据一些实施例，本发明采用如下技术方案：

一种基于孪生神经网络的用药方案推荐方法，包括以下步骤：

获取患者的个人信息，所述个人信息包括体检信息和诊断信息；

利用训练后的孪生神经网络模型，依据患者的个人信息，得到推荐用药方案；

所述孪生神经网络模型的训练过程包括：

获取每个参与模型训练的患者的个人信息及用药方案表征向量；

根据各个患者与药物之间的连接关系，构建不同患者和药品之间元路径，形成异构医学信息网络；

基于元路径计算每对患者用药方案之间的相似度，分配相应的相似性标签；

构建孪生神经网络模型，利用患者信息以及相似性标签，对模型进行训练，直到模型的总体相似性损失小于设定阈值。

作为可选择的实施方式，获取每个参与模型训练的患者的个人信息及用药方案表征向量的具体过程包括：采用词袋模型来获取每个参与模型训练患者的个人信息及用药方案表征向量，用药方案包含该患者在住院期间服用的所有药物信息；

每位患者住院期间的用药方案均被表示为一个无序药物集合，患者的用药方案表征向量中的药物之间相互独立。

作为可选择的实施方式，所述患者和药品的连接关系，用于揭示患者的用药情况。

作为可选择的实施方式，异构医学信息网络中，通过患者-药物-患者的元路径，表示两个患者服用了共同的药物，通过这种元路径，将患者服用的其他药物，推荐给服用相同药物的患者；

通过患者-药物-患者-药物的元路径，能够寻找服用过相同药物的患者还在服用的其他药物。

作为可选择的实施方式，计算每对患者用药方案之间的相似度的具体过程包括：基于给定元路径：患者-药物-患者，患者m和n之间的相似度计算方式定义如下：

其中，pa→b为异构信息网络中节点对象a与b之间连接的路径实例个数，其中，a、b取值为m或n，代表患者节点，pm→n为节点m与节点n之间连接的路径实例个数，代表患者m与患者n共同服用的药物，pm→m为节点m自连接的路径实例个数，pn→n为节点n自连接的路径实例个数。

作为可选择的实施方式，对模型进行训练的过程中，根据所有患者对之间的相似度，对相似度进行排名，挑选出一位相似度最高的患者和相似度最低的患者，形成成对的患者对，即确定每位患者信息最相似的相似输入对和最不相似的相异输入对。

作为可选择的实施方式，所述孪生网络模型采用双层相同的子循环神经网络，各子网络具有相同的参数和权重配置，网络模型每次的输入为一个三元组，包含成对患者m和n的信息patient_m、patient_n，以及他们之间用药方案的相似性标签；

网络模型将输入独立地映射到目标空间，使用欧几里得距离来计算目标空间中两个输出向量之间的相似度评分，将每一时刻的输出取平均作为原始输入的表征向量。

作为可选择的实施方式，在训练过程中，利用每个输入对的患者是否采用了相似的用药方案来设计损失函数，如果每个输入对的患者采用了相似的用药方案，则认为输入的样本对从属于同一个类别，否认，认为不属于同一类别；

最小化来自相同类别的样本对的损失函数值，最大化来自不同类别的样本对的损失函数值，使用基于梯度下降规则的反向传播算法来更新两个子循环神经网络的共享权值。

一种基于孪生神经网络的用药方案推荐系统，包括：

参数获取模块，被配置为获取每个参与模型训练的患者的个人信息及用药方案表征向量；

网络构建模块，被配置为根据各个患者与药物之间的连接关系，构建不同患者和药品之间元路径，形成异构医学信息网络；

相似性度量模块，被配置为基于元路径计算每对患者用药方案之间的相似度，确定每位患者信息最相似的相似输入对和最不相似的相异输入对，分配相应的相似性标签；

药物推荐模块，被配置为构建孪生神经网络模型，利用相似输入对和相异输入对患者信息，以及相似性标签对模型进行训练，直到模型的总体相似性损失小于设定阈值，利用训练后的孪生神经网络模型，依据患者的个人信息，得到推荐用药方案。

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成上述方法中的步骤。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成上述方法中的步骤。

与现有技术相比，本发明的有益效果为：

本发明中推荐模型的设计淡化了类别标签，使得模型具有很好的扩展性，可以对未知类别的患者样本的用药方案进行分类；通过所设计的基于元路径的相似度度量方式，匹配和收集患者对，有效地解决数据集中正负样本类别不均衡的问题；特别地，对于患者数目样本较少的数据集，相当于变相均匀地增加了数据集中的样本数量，使得小样本量的数据集也能够基于深度神经网络训练出不错的效果。

通过在多类型、多来源数据集上进行测试和验证，本发明的准确率、精确率、auc值相较于传统模型，均获得了显著提升。

本发明有助于为医生提供可靠的用药建议，辅助医生高效地制定临床决策，提供个性化合理用药指导，改善患者的临床症状。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为基于孪生神经网络的个性化用药方案推荐模型的流程图；

图2为包含元路径“患者-药物-患者”(pdp)的异构医学信息网络结构图；

图3为孪生循环神经网络的设计架构图。

具体实施方式：

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本发明提出一种基于孪生神经网络的个性化用药方案推荐模型，通过挖掘大量已知患者的历史诊疗记录中潜在的相似性关联，为医生提供可靠的用药建议，辅助医生高效制定用药方案，以改善患者的临床症状，实现面向个性化的精准医疗。具体运行步骤如下所述：

步骤一：获取患者诊疗信息表征向量。

在本发明中，采用词袋模型(bag-of-wordsmodel)来获取每个参与模型训练患者的个人信息及用药方案表征向量，其中个人信息包含体检信息、诊断信息，用药方案包含该患者在住院期间服用的所有药物信息。每位患者住院期间的用药方案均被表示为一个无序药物集合，患者的用药方案表征向量中的药物之间相互独立。

步骤二：构建异构医学信息网络。

如图2所示，在所构建的异构医学信息网络中，共包含两种节点对象类型：患者(p)和药物(d)，以及一种关系类型：患者与药物之间的链接，揭示患者的用药情况。异构医学信息网络包括更加丰富的对象信息，能够灵活地对异构数据建模，并充分表达它们之间的联系，将隐含的语义关系进行整合。网络中节点对象之间可以通过多种元路径进行连接，对于不同的元路径，它们所隐含的语义不同。在接下来的步骤中，将基于“患者-药物-患者”元路径进行患者对象之间的相似度计算，这样的元路径融合了更多关于患者及其用药方案相似性的信息。

步骤三：基于元路径“患者-药物-患者”的患者相似性度量。

患者之间的相似性评估是临床决策支持系统的基础之一，通过寻找临床上表现相似的患者，以相似的方式治疗他们，能够更加可靠和高效。建立异构医学信息网络后，在pathsim框架下基于网络上的元路径“患者-药物-患者”来计算每对患者用药方案之间的相似度，那些服用更多相同药物的患者将具有更高的相似性评分。pathsim是一种能够在异质信息网络中基于元路径进行topk相似搜索的算法，该步骤用于为成对的患者分配一个用药方案相似标签，标记患者之间用药方案是否相似，以作为后期训练神经网络输入的一部分。此过程旨在根据相似度评分为每个患者匹配一个最相似的患者和最不相似的患者，以便我们可以分配相应的相似性标签，以输入到孪生神经网络中进行下一步训练。

假定m和n为一对参与模型训练的患者，tm为患者m的用药方案表征向量，tn为患者n的用药方案表征向量。令simlabel为表征每对患者是否相似的二进制标签，如果对于患者m来说，患者n的用药方案和其最为相似，即在所有参与模型训练的患者中，患者n的用药方案与患者m之间的相似度评分最高，此时我们令simlabel＝0。相反地，如果对于患者m来说，患者n的用药方案和其最不相似，即在所有参与模型训练的患者中，患者n的用药方案与患者m之间的相似度评分最低，此时我们令simlabel＝1。

在本发明中，采用pathsim算法计算患者之间的用药相似度以后，为每个患者选取相似度最大的一个病人，和一个相似度最小的患者的体检数据参与训练，即每个患者都有两个输入对，一个是和他最相似的患者的体检信息，另一个是和他最不相似的患者的体检信息。给定元路径“患者-药物-患者”(pdp)，患者m和n之间的相似度计算方式定义如下：

步骤四：基于孪生神经网络的药物推荐。

对孪生神经网络进行训练需要成对的相似和相异的输入对象集合。因此，在计算了训练集中所有患者对之间的相似度评分之后，对于每个患者，根据计算得到的训练集中其他所有患者相对于当前患者的相似度评分进行排名，分别挑选出一位得分最高的患者和一位得分最低的患者，收集好所有成对的患者对象，以便后续输入到模型进行训练。

每个训练患者至少匹配成两对，其中每对被分配一个二进制标签simlabel，该二进制标签取值为0或1，取决于该对中的患者与当前训练患者计算出的相似度最高或最低。在匹配后的成对患者中，有一半的用药方案极为相似，另一半的用药方案极为不相似，这种方法可以很好地均衡数据集中正负样本的数量，有效地解决类别不均衡的问题。对于样本量相对较小的数据集，相当于变相均匀地增加整个数据集的大小，使得小数据集也能够利用深度神经网络达到很好的训练效果。

如图3所示，在本发明中，孪生网络架构采用双层相同的子循环神经网络(sub-rnn)实现，这些子网络具有相同的参数和权重配置w。网络每次的输入为一个三元组(patient_m,patient_n,simlabel)，包含成对患者m和n的信息patient_m、patient_n，以及他们之间用药方案的相似性标签simlabel。simlabel是用来训练模型和计算模型训练损失的。每次将两个患者的个人就诊信息将分别输入到两个子网中，包含患者的人口统计学信息，诊断信息，所做检查信息，网络将输入独立地映射到目标空间，然后使用欧几里得距离来计算目标空间中两个输出向量gw(m)和gw(n)之间的相似度评分，将每一时刻的输出取平均作为原始输入的表征向量。通过将成对患者m和n的原始信息表征向量映射到目标空间，可以获得新的信息表征向量gw(m)和gw(n)，其中w是要由孪生神经网络学习的共享权值。在学习过程中，权值w将由两个子循环神经网络(sub-rnn)共享。目标空间中子循环神经网络的两个输出向量gw(m)和gw(n)之间的相似度欧几里德距离e计算方式如下：

e＝euclidean(gw(m),gw(n))＝|gw(m)-gw(n)|

在模型训练阶段，孪生神经网络旨在最大程度地减少总体相似性损失。两个子循环神经网络(sub-rnn)都采用了孪生网络的参数更新机制，这有助于他们更好地学习一种基于所有患者对的全局层面的相似性度量。针对输入的样本对是否从属于同一个类别(即每个输入对的患者是否采用了相似的用药方案)来设计损失函数，采用对比损失(contrastiveloss)可以很好地描述输入样本对之间的相似度，这有助于学习子网的参数，从而可以将相似样本聚类在一起，并且可以将不相似样本分离。这种损失函数能够更加直观地表达所输入的样本对的匹配程度，原本相似的样本，到达新的目标空间后变得更加相似，而原本不相似的样本，到达新的目标空间中变得更加不相似。在模型的学习训练阶段，最小化来自相同类别的样本对的损失函数值，最大化来自不同类别的样本对的损失函数值，使用基于梯度下降规则的反向传播算法来更新两个子循环神经网络的共享权值w。

综上，本发明通过寻找与未知患者具有相似临床特征的历史病例，基于已知患者的历史诊疗记录为未知患者推荐用药方案。能够有效地解决了数据集中正负样本类别不均衡的问题，同时淡化了类别标签，使模型具有很强的可扩展性；依据患者身体状况的特异性，能够实现患者诊疗个性化，为医生提供可靠的用药建议，既增强了推荐的效率，亦提高了推荐的可靠性。

本发明还提供以下产品实施例：

一种基于孪生神经网络的用药方案推荐系统，包括：

参数获取模块，被配置为获取每个参与模型训练的患者的个人信息及用药方案表征向量；

网络构建模块，被配置为根据各个患者与药物之间的连接关系，构建不同患者和药品之间元路径，形成异构医学信息网络；

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成上述方法中的步骤。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成上述方法中的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李晖;孟倩雯;崔立真;郭伟;闫中敏
技术所有人：山东大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。