药物和靶点匹配的判断方法、系统、设备及介质与流程

文档序号:34936607发布日期:2023-07-28 10:17阅读:61来源:国知局
药物和靶点匹配的判断方法、系统、设备及介质与流程

本发明涉及自然语言处理领域及数字医疗领域,特别涉及一种药物和靶点匹配的判断方法、系统、设备及介质。


背景技术:

1、一颗新药从实验室研发到商业化销售,需要经过药物发现、临床前研究、临床研究和审批上市四个阶段。药物和靶蛋白匹配的判断是药物发现的重要手段,指的是采用适当的方法,对可能作为药物使用的化合物,以及药物可能治疗的靶蛋白进行生物活性、药理作用及药用价值的评估过程。

2、新药研发的过程难度巨大,业内一直流传着“三十定律”,即一款药物从实验室研发到临床获批平均耗时十年,耗资十亿美金,成功率仅10%。据统计,目前这个定律里的时间和资金还在增长,某些药物的耗资远远超过了十亿美金。传统的判断药物是否能对靶蛋白具有靶向治疗作用的方式,通常是使用细胞水平筛选。即通过用候选药物处理靶细胞,再通过生化实验判断药物对靶细胞是否具有治疗的作用。

3、发明人意识到,上述判断药物是否对靶蛋白具有靶向治疗的方式,对于新的药物和拟判断靶蛋白,需要多次实验才能确定两者的靶向关系,且实验结果具有随机性,因此,无法快速准确的确定新药物和拟判断靶蛋白之间的靶向关系。


技术实现思路

1、本发明的目的在于提供一种药物和靶点匹配的判断方法、系统、设备及介质。以解决现有的判断药物是否对靶蛋白有效的方法中,判断药物和靶蛋白靶向关系速度和准确性较低的问题。

2、第一方面,提供了一种药物和靶点匹配的判断方法,包括:

3、获取药物分子序列和靶点蛋白质序列;

4、将所述药物分子序列和靶点蛋白质序列分别输入至第一模型级联的两个bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;其中,所述第一模型用于获取所述药物分子序列和所述靶点蛋白质序列的位置编码关系;

5、将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道gnn网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;其中,所述第二模型用于获取所述药物分子序列和所述靶点蛋白质序列的关联关系;

6、将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。

7、第二方面,提供了一种种药物和靶点匹配的判断系统,包括:

8、数据获取模块,用于获取药物分子序列和靶点蛋白质序列;

9、第一置信度得分获取模块,用于将所述药物分子序列和靶点蛋白质序列分别输入至第一模型级联的两个bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;其中,所述第一模型用于获取所述药物分子序列和所述靶点蛋白质序列的位置编码关系;

10、第二置信度得分获取模块,用于将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道gnn网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;其中,所述第二模型用于获取所述药物分子序列和所述靶点蛋白质序列的关联关系;

11、匹配判断模块,用于将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。

12、第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述药物和靶点匹配的判断方法的步骤。

13、第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述药物和靶点匹配的判断方法的步骤。

14、本发明的药物和靶点匹配的判断方法、系统、设备及介质。通过将获取到的药物分子序列和靶点蛋白质序列输入至第一模型级联的两个bert网络中,通过对所述药物分子序列和靶点蛋白质序列分别进行多模态处理,得到第一置信度得分。与此同时,还需将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道gnn网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分。然后将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。实现了快速准确的确定新药物和拟判断靶蛋白之间的靶向关系,有效提升了药物筛选的效率。通过使用bert网络,对药物分子序列和靶点蛋白质序列分别进行位置编码和特征嵌入,从而能够提升药物分子序列和靶点蛋白质的有序性。避免输入bert模型时,由于初始化处理是对序列进行随机打乱,导致药物分子序列或靶点蛋白质序列出现错乱,影响后续判断结果。通过使用图神经网络,虽然网络层数较少,但可以充分利用药物分子序列或靶蛋白序列中各原子之间的键连接关系,从而极大提升了判定的准确度,缩短了判定时间。使用图神经网络和bert网络有效级联,由于模型较小,大大提高了判断药物和靶点匹配度的规模和速度,减少了计算机耗费的计算资源,大大提升了新药研发的效率,为降本增效提供了可能。



技术特征:

1.一种药物和靶点匹配的判断方法,其特征在于,包括:

2.根据权利要求1所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列和靶点蛋白质序列分别输入至第一模型级联的两个bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分,包括:

3.根据权利要求2所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列输入至所述第一模型的第一bert网络,编码所述药物分子序列,得到药物分子矩阵,包括:

4.根据权利要求1所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道gnn网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分,包括:

5.根据权利要求4所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列输入至所述第二模型的第一gnn网络,获取药物特征向量,包括:

6.根据权利要求5所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子特征矩阵和所述药物分子邻接矩阵输入至所述第一gnn网络,获取药物特征向量,包括:

7.根据权利要求1所述的药物和靶点匹配的判断方法,其特征在于,所述在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配之后,还包括:检验所述药物是否符合预设的成药性标准,所述检验所述药物是否符合预设的成药性标准,包括:

8.一种药物和靶点匹配的判断系统,其特征在于,所述系统包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。


技术总结
本发明涉及自然语言处理领域及数字医疗领域,提供一种药物和靶点匹配的判断方法、系统、设备及介质。方法包括:获取药物分子序列和靶点蛋白质序列;将药物分子序列和靶点蛋白质序列分别输入至第一模型中,对药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;将药物分子序列和靶点蛋白质序列分别输入至第二模型中,对药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;将第一置信度得分和第二置信度得分进行加权求和,得到总置信度得分,并在总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。实现了快速准确的确定新药物和拟判断靶蛋白之间的靶向关系,有效提升了药物筛选的效率。

技术研发人员:徐艳丽,谷志广,郝碧波,李春宇,李响,谢国彤
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1