一种基于安全多方计算的药物与药物相互作用预测方法

文档序号:32480385发布日期:2022-12-09 22:03阅读:56来源:国知局
一种基于安全多方计算的药物与药物相互作用预测方法

1.本发明涉及药物技术领域,更具体地说,特别涉及一种基于安全多方计算的药物与药物相互作用预测方法。


背景技术:

2.药物与药物相互作用是药物发现和药物警戒中的一个重要问题。同时服用两种以上药物时,有些药物会改变其他药物的活性,引起药物不良反应可能导致疾病或死亡。此外,随着患者服用药物数量的增加,药物与药物相互作用事件迅速增加。因此,快速地预测潜在的药物与药物相互作用,可以有效地减少药物不良反应和疾病的发生。
3.近些年来,越来越多的研究者开始使用计算机技术提高药物与药物相互作用预测的性能。尤其是,各种深度学习模型获得了良好的预测性能,并成为药物与药物相互作用预测的关键技术。然而,大多数深度学习模型都过度依赖药物特征数据和训练数据。不幸的是,在真正的药物发现中,高质量的药物数据相对较少。因此,这些基于深度学习的药物与药物相互作用预测模型在实际药物开发场景中可能并不能取得良好的性能。
4.随着生物医学研究的快速发展,构建了各种公开的生物信息学和药物基因组学数据库。例如:drugbank是一个用于药物发现的综合数据库,它提供了详尽的药物信息和目标数据。治疗靶点数据库(ttd)提供了许多药物信息,包括核酸靶点、治疗蛋白、通路和靶向疾病。supertarget数据库是一个一站式数据库,是探索药物与靶标相互作用的资源。更重要的是,在各个制药公司和研究机构中具有大量有价值的私人药物数据。同时,现有研究表明整合来自各种公共数据库和机构的多源数据可以提高药物与药物相互作用预测的性能。但是,出于对药品数据隐私的担忧,制药公司不愿共享其数据,进而严重阻碍了药物与药物相互作用预测的发展。另一方面如何把隐私计算和深度学习技术进行有融合,实现在不泄露隐私信息的情况下促进各研究机构之间的协作,进而提高药物与药物相互作用预测性能是药物研发过程中的关键。为此,有必要开发一种基于安全多方计算的药物与药物相互作用预测方法。


技术实现要素:

5.本发明的目的在于提供一种基于安全多方计算的药物与药物相互作用预测方法,以克服现有技术所存在的缺陷。
6.为了达到上述目的,本发明采用的技术方案如下:
7.一种基于安全多方计算的药物与药物相互作用预测方法,包括以下步骤:
8.s1、获取药物与药物相互作用网络、药物与蛋白质相互作用网络、药物与疾病关联网络、药物与副作用关联网络,并将药物smiles序列转换为药物分子指纹;
9.s2、根据步骤s1中药物分子指纹计算所有药物之间的jaccard相似性特征,以及根据步骤s1中的药物与蛋白相互作用网络、药物与疾病相互作用网络、药物与副作用关联网络分别计算药物之间的jaccard相似特征,并利用主成分分析技术对所有的药物相似性特
征进行降维,并作为每个用户的药物私有特征;
10.s3、将每个用户的私有特征数据分成四部分,并通过秘密共享技术进行加密,并利用附加秘密共享机制发送到四个服务器,每个服务器获得来自四个用户的部分特征数据f
mofp
,f
dpi
,f
dda
,f
dsa

11.s4、在任意一方获取四个部分特征数据f
mofp
,f
dpi
,f
dda
,f
dsa
后,将该四个部分特征数据f
mofp
,f
dpi
,f
dda
,f
dsa
输入到预设的私密深度学习模型中进行药物与药物相互作用预测。
12.进一步地,所述步骤s1中从drugbank数据库中提取药物与药物相互作用和药物与蛋白质相互作用网络,从ctd数据库中提取药物与疾病关联网络,从ctd和sider数据库中提取药物与副作用关联网络,再通过rdkit技术将分子的smiles序列转换为分子指纹。
13.进一步地,所述步骤s2中计算jaccard相似度的公式为:
[0014][0015]
式中,a和b为两种药物的二进制向量,|a∩b|代表a和b的交集,|a|和|b|代表a和b向量中为1的总数。
[0016]
进一步地,所述步骤s3中利用4-out-of-4附加秘密共享机制发送到四个服务器。
[0017]
进一步地,所述步骤s4中的私密深度学习模型包括特征投影模块和药物与药物相互作用预测模块,所述投影模块用于将不同类型的药物特征映射到同一空间中,所述药物与药物相互作用预测模块用于对投影模块的输出进行预测得到预测结果。
[0018]
与现有技术相比,本发明的优点在于:本发明提供的一种基于安全多方计算的药物与药物相互作用预测方法,利用秘密共享技术计算来自多个机构的药物相关特征数据,并设计了多模态特征融合的深度学习模型来提高药物-药物相互作用预测,而且所有的数据传输和深度学习操作都集成在安全多方计算框架中,在不泄露药物隐私信息的前提下,实现各制药公司以及研究机构之间的高质量协作,进而提高药物与药物相互作用预测。
附图说明
[0019]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]
图1是本发明基于安全多方计算的药物与药物相互作用预测方法的框架图。
[0021]
图2是本发明的实验结果图。
具体实施方式
[0022]
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
[0023]
参阅图1和图2所示,本实施例公开了一种基于安全多方计算的药物与药物相互作用预测方法,包括以下步骤:
[0024]
步骤s1、从drugbank数据库中提取药物与药物相互作用和药物与蛋白质相互作用网络,从ctd数据库中提取药物与疾病关联网络,从ctd和sider数据库中提取药物与副作用
关联网络,再将药物smiles序列转换为药物分子指纹。这四种数据是四个二进制的特征矩阵,被分给四个制药公司当做每个药企的私有特征数据;
[0025]
步骤s2、私有特征预处理:基于四个制药公司分别拥有的药物数据进行明文环境的特征预处理。
[0026]
每个药物公司根据自己拥有的药物特征,根据步骤s1中药物分子指纹计算所有药物之间的jaccard相似度以获得药物之间的相似矩阵,公式如下:
[0027][0028]
式中,a和b为两种药物的二进制向量,|a∩b|代表a和b的交集,|a|和|b|代表a和b向量中为1的总数。
[0029]
以及根据步骤s1中的药物与蛋白相互作用网络、药物与疾病相互作用网络、药物与副作用关联网络分别计算药物之间的jaccard相似特征。
[0030]
再利用主成分分析技术对所有的药物相似性特征进行降维,并作为每个用户的药物私有特征,进而提高输入特征的质量。
[0031]
步骤s3、基于多方安全计算的数据共享:本实施例中安全多方计算被当作用户端-服务器模型,其中每个拥有私有数据的制药机构被当作一个用户端,每个用户拥有私有的药物特征数据。每一方服务器都遵守规则,避免向其他服务器发送虚构或不正确的信息,任何两方服务器之间互不勾结,具体为:
[0032]
将每个用户的私有特征数据分成四部分,并通过秘密共享技术进行加密;利用4-out-of-4附加秘密共享机制发送到四个服务器,每个服务器获得来自四个用户的部分特征数据f
mofp
,f
dpi
,f
dda
,f
dsa
,因此,任何服务器都无法获得单个药企的完整数据。
[0033]
步骤s4、在任意一方获取四个部分特征数据f
mofp
,f
dpi
,f
dda
,f
dsa
后,将该四个部分特征数据f
mofp
,f
dpi
,f
dda
,f
dsa
输入到预设的私密深度学习模型中进行药物与药物相互作用预测。
[0034]
具体的,私密深度学习模型包括特征投影模块和药物与药物相互作用预测模块。该两个模块可以进一步分解成一些基本运算,包括私有加法、私有乘法、比较以及一些线性和非线性函数,这些私有的深度学习操作都是通过crypten框架完成,其中大多数运算包括双线性运算和乘法都采用算术秘密共享机制,相反二进制秘密共享用于评估逻辑表达式,例如relu激活函数;同时通过aby共享转换技术进行算术秘密共享和二进制秘密共享之间的转换。四个服务器依次完成所有的私密深度学习操作,并获得加密结果,最后,每一个服务器分别将自己的秘密结果发送给对应的用户。
[0035]
其中,所述投影模块用于将不同类型的药物特征映射到同一空间中,投影模块定义为:
[0036]
h0=bnlayer(h
mofp
||h
dpi
||h
dda
||h
dsa
)
[0037]
式中||代表拼接操作,bnlayer(
·
)表示批量归一操作;h
l
∈{h
mofp
,h
dpi
,h
dda
,h
dsa
}可以通过公式(3)计算:
[0038]hl
=wf
l
+b
[0039]
式中w是线性变换的可学习权重矩阵,b是偏置向量,f
l
∈{f
mofp
,f
dpi
,f
dda
,f
dsa
},为了将不同类型的特征投影到同一空间,四个秘密特征共享一个权重矩阵和偏置向量。最后,
h0被输入到预测模块进行药物-药物相互作用预测。
[0040]
其中,所述药物与药物相互作用预测模块用于对投影模块的输出进行预测得到预测结果,药物与药物相互作用预测模块采用具有三个全连接层的多层感知器,两个隐藏层和输出层分别采用relu激活函数和sigmoid激活函数。本实施例使用私有操作协议训练深度学习模型,只向相应的用户传输预测的药物与药物相互作用结果。
[0041]
本实施例以drugbank数据库中的708个药物为实施例,运用以上方法预测药物与药物相互作用,接受者操作曲线下面积(auroc)为0.938,精确召回曲线下面积(aupr)为0.942,召回率(recall)为0.870,优于其他的5种方法,如图2所示。
[0042]
虽然结合附图描述了本发明的实施方式,但是专利所有者可以在所附权利要求的范围之内做出各种变形或修改,只要不超过本发明的权利要求所描述的保护范围,都应当在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1