一种分子对接药物筛选方法和装置

文档序号:34534845发布日期:2023-06-27 11:05阅读:81来源:国知局
一种分子对接药物筛选方法和装置

本发明涉及量子计算与药物设计,尤其涉及一种分子对接药物筛选方法和装置。


背景技术:

1、新型药物的研发过程主要由目标发现,分子设计,临床前研究和临床试验这几个阶段组成。食品药品监督管理局批准的大部分新药都是小分子药物,其结构和功能的多样性使其与生物结合位点的匹配成为可能。长期以来,药物研发主要通过人工反复实验探索、对比为主,不仅需要时间、劳力和财力,还存在较大的误差与不确定性。为了解决上述问题,物理和化学、计算机和信息科学、材料科学等多种学科越来越多地参与到创新药物的研发中,具有重大潜力的新技术、新方法不断涌现。

2、2014年,edward farhi等人提出了量子近似优化算法(qaoa:quantumapproximate optimization algorithm),并将其运用在了有界约束问题中。量子近似优化算法是一种广泛研究的方法,用于解决nisq设备上的组合优化问题。量子近似优化算法通过时间演化在哈密顿量和量子电路之间建立联系,并构建层级的电路来实现强大的算法功能。这是一种启发式方法,可以被认为是绝热量子计算的时间离散化。与量子计算的许多近期方法一样,qaoa是一种混合经典量子算法,它将量子电路和经典优化问题相结合。量子qaoa的应用广泛而深远,其算法的性能也是量子计算研究界非常感兴趣的。

3、综合上述背景,在医药领域,分子对接作为计算基辅助药物设计的重要应用,是通过研究小分子配体与受体生物大分子相互作用,预测其亲和度和结合模式的过程,实现了基于受体结构的药物设计。然而基于传统优化算法及计算机的分子对接算法,面对指数大的分子及化合物空间,其复杂度较高,且在训练过程中会出现不稳定的现象。


技术实现思路

1、鉴于上述的分析,本发明实施例旨在提供一种分子对接药物筛选方法和装置,用以解决现有优化算法及计算机的分子对接算法,面对指数大的分子及化合物空间,其复杂度较高,且在训练过程中会出现不稳定的现象的问题。

2、一方面,本发明实施例提供了一种分子对接药物筛选方法,包括:将药物分子按其结合基团的特征抽象成结合部位节点和结合原件节点的集合,其中,受体分子包含结合部位节点,配体分子包含结合原件节点;根据结合基团之间的亲和度打分函数值构建结合部位和结合原件的亲和度矩阵,并列出约束条件和优化目标;根据亲和度矩阵和约束条件,对需要优化设计的相关变量进行简化;根据亲和度矩阵,基于横向独热模型构建量子比特分配与算子映射;根据映射得到的mixer算子和phaser算子,分层构建qaoa参数化线路;设置迭代次数,优化步长,通过损失函数的梯度下降对qaoa参数化线路进行训练;以及多次测量训练后的qaoa参数化线路,并获取目标函数最大的比特串作为结果。

3、上述技术方案的有益效果如下:利用量子计算在生物化学分子体系中进行准确、快速计算的量子优势。分子对接药物筛选方法,将传统的0-1规划问题转换为独热问题的组合,引入辅助优化变量,使得优化效率大大提高,减少量子比特,避免了引入过多额外的量子比特求解提升复杂度。针对分子对接算法,在指数大的分子及化合物空间中计算时复杂度较高、不稳定的现象,该方法不仅减少了训练参数,提升了表达性,并且充分运用量子电路并行处理数据的能力,是量子计算与药物发现相结合的重要应用。

4、基于上述方法的进一步改进,亲和度打分函数是配体分子与受体分子结合位点间的相互作用能的线性表示,其中,列出约束条件和优化目标包括:约束条件为配位相关约束条件;以及优化目标为使总亲和度最大,其中,当亲和度打分函数值为-∞时,结合部位节点与结合原件节点无法结合。

5、基于上述方法的进一步改进,根据亲和度矩阵和约束条件,对优化设计的相关变量进行简化包括:

6、根据亲和度矩阵、目标函数以及约束条件,抽象出以下数学模型:给定矩阵w∈rm×n、集合b:={x1,x2,...},对二值矩阵变量x∈{0,1}m×n进行求解,使得:

7、

8、

9、

10、

11、其中,b表示额外限制条件的集合,x表示不允许同时配对的结合方式集合,wij表示配体分子的第i结合原件与受体分子的第j结合部位基团间亲和度的打分函数结果,xij表示配体分子的第i结合原件与受体分子的第j结合部位配对;以及当亲和度打分函数值为-∞时,去除其对应逻辑量子比特并短路其横向连接。

12、基于上述方法的进一步改进,根据亲和度矩阵,基于横向独热模型构建量子比特分配与算子映射包括:通过增加全0列,将原始m×n维亲和度矩阵w重写为m×(n+1)维矩阵w′,根据重写矩阵w′的维度设置m×(n+1)位逻辑量子比特;将所有判定xm,n+1=0的对应辅助量子比特qm,n+1删除;mixer算子和phaser算子分别为和hp=hs+hpv+hpb,其中,为表示横向连接的集合,dk,l;m,n=xk,lxm,n+yk,lym,n,xk,l、xm,n、yk,l、ym,n是下标编号为k,l和m,n的哈密顿量pauli-x和pauli-y算符,hs为编码原问题的目标函数,hpv为编码纵向惩罚项,hpb为编码额外限制条件;以及获得单层参数化量子线路u(β,γ)=um(β)up(γ),其中,um(β)=exp(-iβhm),up(γ)=exp(-iγhp)。

13、基于上述方法的进一步改进,当亲和度矩阵w∈rm×n的维度满足列数大于等于行数时,使得额外增加的优化变量尽可能小;以及当亲和度矩阵w∈rm×n的维度不满足列数大于等于行数时,对亲和度矩阵进行转置,使得转置矩阵wt的维度满足列数大于等于行数。

14、基于上述方法的进一步改进,将mixer算子改写为2组m个独立量子系统的哈密顿量的和:

15、

16、当实现exp(-iβhm)时,每个独立量子系统的哈密顿模拟并行实现,线路深度仅为o(1);phaser算子为hp=hs+hpv+hpb,其中,hs编码原问题的目标函数为:

17、

18、编码纵向惩罚项hpv为:

19、

20、编码额外限制条件hpb为:

21、

22、其中,zi,j为下标编号i,j对应的pauli-z算符,pv,j为纵向惩罚系数,满足pb为编码额外惩罚系数,满足

23、

24、基于上述方法的进一步改进,根据映射得到的mixer算子和phaser算子,分层构建qaoa参数化线路包括:qaoa参数化量子线路每层均包括一个phaser算子的哈密顿模拟up(γ)=exp(-iγhp)和mixer算子的哈密顿模拟um(β)=exp(-iβhm);所有mixer算子和phaser算子均是以下1-local和2-local泡利串的和,其中,li,ki∈[1:nq],nq为量子比特的数目,pj∈{i,xj,yj,zj}表示作用在第j量子比特的泡利矩阵,表示张量积,由于泡利串的互易性对于任意参数t,有以及对于1-local泡利串,中的一个为i,其哈密顿模拟为对应单比特泡利旋转门,以及基于实现2-local哈密顿模拟,zi表示下标编号为i的泡利z算子。

25、基于上述方法的进一步改进,设置迭代次数,优化步长,通过损失函数的梯度下降对qaoa参数化线路进行训练包括:根据mixer和phaser算子设置qaoa参数化线路,初始化训练参数;更新迭代次数,基于全部训练样本计算损失函数梯度;根据损失函数的梯度下降更新qaoa参数化线路的参数;计算损失函数,并且判断损失函数是否达到预设的迭代次数,其中,当损失函数未达到预设的迭代次数时,通过损失函数的梯度下降对qaoa参数化线路进行反复训练,以及当损失函数达到预设的迭代次数时,执行多次测量训练后的qaoa参数化线路,并获取目标函数最大的比特串作为结果。

26、另一方面,本发明实施例提供了一种分子对接药物筛选装置,包括:特征抽象模块,用于将药物分子按其结合基团的特征抽象成结合部位节点和结合原件节点的集合,其中,受体分子包含结合部位节点,配体分子包含结合原件节点;矩阵构建模块,用于根据结合基团之间的亲和度打分函数值构建结合部位和结合原件的亲和度矩阵,并列出约束条件和优化目标;简化模块,用于根据亲和度矩阵和约束条件,对需要优化设计的相关变量进行简化;映射模块,用于根据亲和度矩阵,基于横向独热模型构建量子比特分配与mixer算子和phaser算子映射;线路构建模块,根据映射得到的mixer算子和phaser算子,分层构建qaoa参数化线路;训练模块,用于设置迭代次数,优化步长,通过损失函数的梯度下降对qaoa参数化线路进行训练;以及结果获取模块,用于多次测量训练后的qaoa参数化线路,并取使得目标函数最大的比特串作为结果。

27、基于上述装置的进一步改进,映射模块用于:通过增加全0列,将原始m×n维亲和度矩阵w重写为m×(n+1)维矩阵w′,根据重写矩阵w′的维度设置m×(n+1)位逻辑量子比特;将所有判定xm,n+1=0的对应辅助量子比特qm,n+1删除;mixer算子和phaser算子分别为和hp=hs+hpv+hpb,其中,为表示横向连接的集合,dk,l;m,n=xk,lxm,n+yk,lym,n,xk,l、xm,n、yk,l、ym,n是下标编号为k,l和m,n的哈密顿量pauli-x和pauli-y算符,hs为编码原问题的目标函数,hpv为编码纵向惩罚项,hpb为编码额外限制条件;以及获得单层参数化量子线路u(β,γ)=um(β)up(γ),其中,um(β)=exp(-iβhm),up(γ)=exp(-iγhp)。

28、与现有技术相比,本发明至少可实现如下有益效果之一:

29、1、本发明提供了一种基于横向独热模型量子近似最优化算法的分子对接药物筛选方法,将传统的0-1规划问题转换为独热问题的组合,引入辅助优化变量,使得优化效率大大提高,还提供了一种减少量子比特使用的方法,避免了引入过多额外的量子比特求解提升复杂度。

30、2、针对分子对接算法,在指数大的分子及化合物空间中计算时复杂度较高、不稳定的现象,该方法不仅减少了训练参数,提升了表达性,并且充分运用量子电路并行处理数据的能力,是量子计算与药物发现相结合的重要应用。

31、3、分子对接药物筛选方法对于药物分子设计具有良好的效果,其态空间小,虽然引入辅助比特,但通过合理优化进行了变量简化,量子线路训练过程收敛快,能有效求得药物分子对接的可行解。横向独热模型由于其相对较小的态空间,使得其所需层数和优化步数大大缩减,仅2层时可达到单次测量成功概率100%。然而,当层数较多时,其单次测量成功概率下降。其原因可能是层数较多而引入的参数较多,所需优化步数随之增加,50次难以完成收敛导致的。层数增加会影响线路的可表达性从而影响优化结果。

32、本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1