本发明属于药物设计和医药技术领域,具体涉及一种基于多模态深度神经网络的药物-药物相互作用事件预测方法、系统、终端及可读存储介质。
背景技术:
随着药物种类数量的快速增长,当服用多种药物进行疾病的治疗时,确保药物之间的安全至关重要。药物-药物相互作用(druganddruginteraction,ddi)预测问题是指当多种药物同时服用的时候,由于组成药物的化合物分子的影响、药物作用的靶向蛋白、靶向通路以及不同酶的作用可能导致药物之间发生不良的相互作用,从而对患者造成不良的伤害或者巨大的医疗费用。另外,ddi还可能导致不同的生物学后果和事件。因此,准确预测ddi事件已成为一项临床重要任务,可帮助临床医生做出有效的决策并建立适当的治疗方案。另外,正确使用多种药物可以最大程度地降低患者的治疗风险和发挥药物的协同效益。
药物-药物相互作用事件来源于多种方面,包括组成药物的化合物分子的影响、药物作用的靶向蛋白、靶向通路以及酶的作用等,这些因素影响着药物之间的相互作用事件。每一种因素与药物都可以组合成一个独立的特征矩阵,将多个特征矩阵的信息聚集会提供给药物-药物相互作用事件预测任务很大的帮助。然而,由于缺乏足够的临床数据和知识,药物-药物相互作用事件的预测任务是一个严峻的挑战。因此,发现潜在药物-药物相互作用事件的研究方案在改善医疗保健和提高药物警戒性上具有深远的影响。
但是现有的方法大多数利用药物的多源特征进行独立的分析,从而导致现有方法中药物-药物相互作用预测结果的可靠性还有待进一步提高。
技术实现要素:
本发明针对现有技术存在的问题,提供一种基于多模态深度神经网络的药物-药物相互作用事件预测方法,其分析不同模态特征间的关联性与互补性以提高ddi事件预测的准确性。
一方面,本发明提供的一种基于多模态深度神经网络的药物-药物相互作用事件预测方法,包括如下步骤:
步骤s1:获取药物数据作为样本,所述药物数据包括药物-药物相互作用事件、药物异质特征以及基于药物属性构建的药物知识图谱;
步骤s2:基于药物知识图谱获得药物在知识图谱中的拓扑嵌入表示;以及基于药物异质特征进行相似性计算得到药物的相似嵌入表示;
步骤s3:将药物在知识图谱中的拓扑嵌入表示以及药物的相似嵌入表示进行拼接融合构建药物-药物相互作用事件预测模型,并利用步骤s1中样本中药物-药物的相互作用事件进行模型训练得到药物-药物相互作用事件预测模型;
步骤s4:利用步骤s3得到的药物-药物相互作用事件预测模型进行药物-药物相互作用事件预测;
其中,将待预测的药物对中药物在知识图谱中的拓扑嵌入表示以及药物的相似嵌入表示输入所述药物-药物相互作用事件预测模型得到药物-药物相互作用事件预测结果。
本发明的技术思路为:通过构建药物知识图谱,设计图神经网络利用药物的拓扑结构和语义信息获得药物的拓扑嵌入表示;通过收集药物的异质特征,计算药物异质特征的相似性作为药物的相似嵌入表示;通过将药物的拓扑嵌入表示和相似嵌入表示进行拼接,经过多层全连接层进行多模态特征分析,进行药物-药物相互作用事件的预测。
其中,多模态特征之间往往存在一定互补性,分析不同模态特征间的关联性与互补性可以提高ddi事件预测的准确性。另外,药物知识图谱蕴含了药物丰富的信息,包括药物的拓扑结构信息和语义信息,这些信息的重要性不可忽视。因此,本发明将上述两种特性应用至本发明的所述方案中,以提高预测结果的可靠性。
可选地,所述药物-药物相互作用事件预测模型如下所示:
其中,
可选地,若药物异质特征包括:亚结构fs、靶标ft和酶fe,步骤s2中基于药物异质特征进行相似性计算得到药物的相似嵌入表示为:
其中,药物di的亚结构相似嵌入
所述亚结构相似矩阵、靶标相似矩阵、酶相似矩阵中的元素均是利用药物对的药物异质特征及相似值计算公式计算得到。
可选地,所述亚结构相似矩阵、靶标相似矩阵、酶相似矩阵中的元素均是利用jaccard相似计算得到,其中,jaccard相似计算公式如下:
其中,j(fi,fj)表示两个药物的异质特征之间的相似值,fi,fj分别为两个药物的异质特征。
可选地,步骤s2中基于药物知识图谱获得药物在知识图谱中的拓扑嵌入表示的过程如下:
首先,初始化药物知识图谱中每个节点的嵌入表示,节点包括药物节点和属性节点;
然后,利用计算药物知识图谱中药物节点与属性节点的边的权重分数,公式如下:
其中,
其次,根据每个邻居节点的不同权重分数计算药物节点的邻居嵌入表示:
其中ns(di)表示药物di的采样邻居节点集合,
最后,药物di在知识图谱中的拓扑嵌入表示:
其中,
可选地,步骤s1中基于药物属性构建的药物知识图谱表示如下:
其中,d表示药物集合,r表示关系集合,t表示药物的属性节点集合,d,rdt,t分别表示药物、关系以及属性节点。
二方面,本发明还提供一种基于上述方法的系统,包括:
药物数据采集模块:用于采集药物-药物相互作用事件、药物异质特征;
药物知识图谱构建模块,用于基于药物属性构建的药物知识图谱;
药物的嵌入表示获取模块,用于基于药物知识图谱获得药物在知识图谱中的拓扑嵌入表示;以及基于药物异质特征进行相似性计算得到药物的相似嵌入表示;
预测模型构建及训练模块,用于将药物在知识图谱中的拓扑嵌入表示以及药物的相似嵌入表示进行拼接融合构建药物-药物相互作用事件预测模型,并利用采集的药物-药物的相互作用事件进行模型训练得到药物-药物相互作用事件预测模型;预测模块,用于利用步骤s3得到的药物-药物相互作用事件预测模型进行药物-药物相互作用事件预测。
三方面,本发明还提供一种终端,包括处理器和存储器,所述存储器存储了计算机程序,所述处理器调用所述计算机程序以执行:一种基于多模态深度神经网络的药物-药物相互作用事件预测方法的步骤。
四方面,本发明还提供一种可读存储介质,存储了计算机程序,所述计算机程序被处理器调用以执行:一种基于多模态深度神经网络的药物-药物相互作用事件预测方法的步骤。
有益效果
1.本发明提供了一种基于多模态深度神经网络的药物-药物相互作用事件预测方法,将药物的多模态嵌入表示进行拼接,高效地分析了不同模态药物嵌入表示的相关性与互补性,带来了更好的药物-药物相互作用事件预测效果。
2.本发明有效地构建了药物知识图谱,并且设计了这一种图神经网络,利用药物知识图谱中的拓扑结构信息和语义信息获得药物的嵌入表示,提高了药物-药物相互作用事件预测的准确率。
3.本发明考虑了不同的药物异质特征,能从多个角度分析药物-药物相互作用的关系,提高了药物嵌入表示的准确性。
附图说明
图1为本发明提供的一种基于多模态深度神经网络的药物-药物相互作用事件预测方法整体框架图。
图2为本发明提供的一种基于多模态深度神经网络的药物-药物相互作用事件预测方法的流程示意图。
图3为药物-药物相互作用事件示意图。
具体实施方式
本发明提供的一种基于多模态深度神经网络的药物-药物相互作用事件预测方法,其首先构建药物知识图谱,其次设计合适的图神经网络在药物知识图谱上获得药物的拓扑嵌入表示,以及分析药物的异质特征进行相似性计算得到药物的异质特征嵌入表示,最后将药物的拓扑嵌入表示和异质特征嵌入表示进行拼接,从而实现多模态特征的分析进行药物-药物相互作用事件的预测。下面将结合实施例对本发明做进一步的说明。
如图1和图2所示为本发明方法的整体框架图:本发明提供的一种基于多模态深度神经网络的药物-药物相互作用事件预测方法,包括如下步骤:
步骤s1:获取药物数据作为样本,所述药物数据包括药物-药物相互作用事件、药物异质特征以及基于药物属性构建的药物知识图谱。
具体流程如下。
图3所示为药物相互作用事件示意图。本发明所使用的数据集主要是从drugbank上获得,数据集主要有三部分组成:药物-药物相互作用事件、药物异质特征和药物知识图谱。
a.药物-药物相互作用事件
药物-药物相互作用事件矩阵
b.药物异质特征
药物的异质特征主要包括亚结构(substructure)fs、靶标(target)ft和酶(enzyme)fe。
c.药物知识图谱
本发明在drugbank上获取药物知识图谱g=(d,r,t),具体表示为:
其中,d表示药物集合,r表示关系集合,t表示药物的属性节点集合。结合drugbank数据库构建生物知识图谱。知识图谱可以形象化为三元组的形式,即<头实体,尾实体,关系>。在drugbank数据库中包含了每个药物的详细属性信息,包括药物的子结构、转运蛋白、pathway、靶标等信息。我们将药物作为头实体,药物包含的一个属性节点作为尾实体,关系为该种尾实体的功能描述。例如,药物db00130包含一个编号为p17812的靶标,该靶标的作用为:ctpsynthaseactivity,那么该三元组表示为<db00130,p17812,ctpsynthaseactivity>。通过收集每个药物的属性,可以构建出药物的知识图谱,从而为后序使用图神经网络获取药物嵌入表示提供了拓扑结构信息。
s2.设计图神经网络模块以步骤s1得到的药物知识图谱作为输入信息得到药物在知识图谱中的拓扑嵌入表示;以及基于药物异质特征进行相似性计算得到药物的相似嵌入表示。
a:针对药物在知识图谱中的拓扑嵌入表示的获取流程如下:
在步骤s1获得的药物知识图谱基础上,本发明设计了一种图神经网络利用药物知识图谱中的拓扑结构信息和语义信息得到药物的拓扑嵌入表示。
首先初始化药物知识图谱中每个节点的嵌入表示,该嵌入表示为随机生成的数值化信息,譬如,128维的一行向量。该节点包含药物节点和属性节点;然后针对每个节点随机选取6个邻居节点更新中心节点的嵌入表示。譬如,针对药物节点i,所有与药物节点i有边连接的节点统称为该药物节点i的邻居节点;
利用语义信息计算药物知识图谱中药物节点与属性节点的边的权重分数:
其中,
根据每个邻居节点的不同权重分数计算药物节点的邻居嵌入表示:
其中ns(di)表示药物di的采样邻居节点集合,
计算药物di的拓扑嵌入表示
其中,
从上述知识图谱的内容可知,药物di的拓扑嵌入表示
b:药物异质特征相似性计算,具体流程如下:
该发明使用jaccard相似计算药物的异质特征,获得药物的相似嵌入,jaccard相似计算可以表示为:
其中,j(fi,fj)表示两个药物异质特征之间的相似值,fi,fj分别为两个药物异质特征。
通过使用jaccard相似方法计算,可以得到亚结构相似矩阵
同样的方法,也可以获得药物di的相似嵌入表示
s3:多模态表示融合分析模块,具体流程为将药物在知识图谱中的拓扑嵌入表示以及药物的相似嵌入表示进行拼接融合构建药物-药物相互作用事件预测模型,并利用步骤s1中样本中药物-药物的相互作用事件进行模型训练得到药物-药物相互作用事件预测模型。
根据步骤s2得到的药物拓扑嵌入表示和药物相似嵌入表示,该发明将这两部分嵌入拼接作为药物di最终的嵌入表示,进行多模态嵌入分析。表示如下:
同样可以获得药物dj最终的嵌入表示
其中σ是非线性激活函数softmax,w3,b3为可训练权重和偏置,
其中,训练和优化过程通过反向传播梯度下降来优化更新权重参数,使用5-fold交叉验证的方法进行训练,调整超参及验证模型的准确性。模型损失函数采样多分类交叉熵损失函数。由于该过程是现有技术实现过程,因此对其不进行具体的阐述。应当理解,本发明步骤s1中采集了药物-药物相互作用事件并将其作为样本数据,其次,利用样本并按照步骤s2可以得到药物在知识图谱中的拓扑嵌入表示以及药物的相似嵌入表示,再将其两者代入预测模型中,与样本的药物-药物相互作用事件进行模型训练得到预测模型。其中,利用所述预测模型可以预测出药物对之间的药物-药物相互作用事件。
在一些实现方式中,本发明还提供一种基于多模态深度神经网络的药物-药物相互作用事件预测方法的系统,其包括:药物数据采集模块、药物知识图谱构建模块、药物的嵌入表示获取模块、预测模型构建及训练模块以及预测模块。
其中,药物数据采集模块:用于采集药物-药物相互作用事件、药物异质特征;
药物知识图谱构建模块,用于基于药物属性构建的药物知识图谱;
药物的嵌入表示获取模块,用于基于药物知识图谱获得药物在知识图谱中的拓扑嵌入表示;以及基于药物异质特征进行相似性计算得到药物的相似嵌入表示;
预测模型构建及训练模块,用于将药物在知识图谱中的拓扑嵌入表示以及药物的相似嵌入表示进行拼接融合构建药物-药物相互作用事件预测模型,并利用采集的药物-药物的相互作用事件进行模型训练得到药物-药物相互作用事件预测模型;
预测模块,用于利用步骤s3得到的药物-药物相互作用事件预测模型进行药物-药物相互作用事件预测。
其中,各个单元模块的具体实现过程请参照前述方法的对应过程。应当理解,上述单元模块的具体实现过程参照方法内容,本发明在此不进行具体的赘述,且上述功能模块单元的划分仅仅是一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。同时,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
在一些实现方式中,本发明还提供一种终端,包括处理器和存储器,所述存储器存储了计算机程序,所述处理器调用所述计算机程序以执行:一种基于多模态深度神经网络的药物-药物相互作用事件预测方法的步骤。
在一些实现方式中,本发明还提供一种可读存储介质,存储了计算机程序,所述计算机程序被处理器调用以执行:一种基于多模态深度神经网络的药物-药物相互作用事件预测方法的步骤。
其中,各个步骤的实现过程请参照前述方法的具体实现过程,在此不再赘述。
应当理解,在本发明实施例中,所称处理器可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
所述可读存储介质为计算机可读存储介质,其可以是前述任一实施例所述的控制器的内部存储单元,例如控制器的硬盘或内存。所述可读存储介质也可以是所述控制器的外部存储设备,例如所述控制器上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述可读存储介质还可以既包括所述控制器的内部存储单元也包括外部存储设备。所述可读存储介质用于存储所述计算机程序以及所述控制器所需的其他程序和数据。所述可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
需要强调的是,本发明所述的实例是说明性的,而不是限定性的,因此本发明不限于具体实施方式中所述的实例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,不脱离本发明宗旨和范围的,不论是修改还是替换,同样属于本发明的保护范围。