基于L1范数图的抗病毒药物筛选方法与流程

文档序号：33814165发布日期：2023-04-19 14:48阅读：62来源：国知局

本发明属于生物信息学、计算生物学与人工智能交叉领域，具体涉及一种基于l1范数图的抗病毒药物筛选方法。

背景技术：

1、冠状病毒sars-cov-2引发全球性疫情，成为了世界公共卫生的严重威胁，寻找有效的抗病毒药成为极为紧迫的任务。然而，按常规方法研发药物可能需要耗时十多年、耗资数十亿美元，在短时间内开发出一种有效抗病毒药物是极为困难的。考虑到已成熟的药品其有效性、安全性和毒性都是经过测试的，于是“老药新用”从已经应用的药品中寻找有效方案是应对突发疫情应对药物的一种高效的解决方法。

2、抗病毒药物筛选方法已有报道，其中一类是基于结构的虚拟筛选方法，如使用动力学模拟技术计算潜在药物和靶标间的结合能力，通过分子动力学模拟计算药物的吸收、分布、代谢、排泄和毒性等。此类方法通常存在模拟过程复杂、对使用者经验要求高等不足。国防科技大学天河超算团队提出了基于自由能微扰-绝对结合自由能方法的新冠药物虚拟筛选方法，但这种基于自由能的大规模筛选方法对算力要求较高，需要借助超级计算机平台，且耗时以周计算。

技术实现思路

1、为了克服现有技术的上述缺陷，本发明提供一种基于l1范数图的抗病毒药物筛选方法（virus-drug association prediction based on l1-norm graph，简称l1norm-vda），其步骤大体为，首先通过构建病毒-药物关联的邻接矩阵，分别计算病毒高斯距离相似性、药物高斯距离相似性，然后根据病毒基因组序列计算病毒序列相似性，根据药物化学结构计算药物化学结构相似性，再使用快速核学习法计算整合病毒相似性、整合药物相似性；接下来使用病毒-药物关联邻接矩阵、整合病毒相似性构建目标函数并求解得到病毒视角的预测得分矩阵，再使用病毒-药物关联邻接矩阵、整合药物相似性构建目标函数并求解得到药物视角的预测得分矩阵；然后将上述两个得分矩阵加权组合得到总预测得分矩阵，最后排序给出最终预测结果。本方法能根据病毒-药物关联数据，准确高效地预测抗病毒相关药物。

2、本发明提供的技术方案具体包括以下步骤：

3、步骤一，输入已知的病毒-药物关联对，构建邻接矩阵a，若为已知关联对则对应位置为1，否则为0，此矩阵的行数为病毒数量nv，列数为药物数量nd；

4、步骤二，分别计算药物间高斯距离相似性和病毒间高斯距离相似性：若药物d(i)与某个病毒之间存在关联，则对应位置记为1否则记为0，形成一个1×nv大小的0或1构成的向量，记之为药物d(i)的向量谱ip(d(i))，然后计算药物d(i)和d(j)之间的高斯距离相似性

5、

6、上式中，参数γd用于控制核带宽，通过归一化新带宽参数γ’d获得：

7、

8、以类似的方式定义病毒v(i)和v(j)之间的高斯距离相似性，1×nd大小的0或1构成的向量，记之为病毒v(i)的向量谱ip(v(i))；

9、

10、

11、以上γ’d和γ’v都是常数；

12、步骤三，输入病毒基因组序列，使用既有较为成熟的多序列比方法计算病毒序列相似性，输入药物的化学结构得到药物maccs指纹，采用谷本系数（tanimoto coefficient，即jaccard相似度）计算药物化学结构相似性；

13、步骤四，使用快速核学习方法整合病毒基因组序列相似矩阵和病毒高斯距离相似矩阵，具体是通过求解下面的半正定规划式：

14、

15、式中，第一项为范数项表示相似矩阵的整合误差大小，第二项为为正则化项，作用是避免过拟合，其中a为病毒-药物关联邻接矩阵，sjv（j=1,2）分别表示病毒高斯距离相似矩阵、病毒基因组序列相似矩阵，μv为正则化参数，λv∈r1×2为待求解的系数，通过λv得到病毒的整合相似矩阵；类似方法可获得药物结构相似性与药物高斯距离相似性集成参数λd∈r1×2，然后计算药物整合相似矩阵，其中sjd（j=1,2）分别表示药物高斯距离相似矩阵、药物结构相似矩阵；

16、步骤五，基于半监督学习方法，从病毒空间视角构造目标函数，具体为：

17、

18、其中sv为病毒相似性矩阵，qv表示待求的病毒-药物关联概率矩阵，qiv和qjv分别表示qv的第i和第j列；uv为对角矩阵，a为已知的病毒-药物关联矩阵。

19、步骤六，使用l1范数重写上述目标函数得到：，其中pv表示大小为nv×nv，第(i , j)个元素为的矩阵；然后通过在每轮迭代期间更新计算，得到加权相似度矩阵；通过求导再反解可得病毒视角得分矩阵，其中是拉普拉斯矩阵，是对角矩阵，其第i个对角元素为；类似地方法，从疾病空间的视角构建基于l1范数的目标函数，可得药物视角得分矩阵；

20、步骤七，求算数平均值，得到最终的预测结果，根据病毒-药物关联对预测分数qfinal筛选出特定病毒所对应的行，排序即得到最终预测结果。

21、本发明的技术效果和优点：

22、1、通过引入稀疏范数约束项使目标函数生成稀疏解，能有效减轻训练数据集中存在的内在噪声的影响，进而使得病毒-药物关联预测结果更具有鲁棒性、更准确；

23、2、整合的病毒相似性以及整合的药物相似性都可以在每轮迭代期间根据标签矩阵自适应地改变，具有较好的可扩展性与健壮性，使本方法能获得较佳预测结果；

24、3、通过集成了拉普拉斯项融合了流形学习理论，属于半监督模型，能够高效利用阴性样本信息，降低了模型构建的难度，提升了预测性能。

技术特征：

1.基于l1范数图的抗病毒药物筛选方法，其特征在于具体包括如下步骤：

2.根据权利要求1所述的基于l1范数图的抗病毒药物筛选方法，其特征在于上述步骤六中的求解过程包括如下步骤：使用l1范数重写目标函数得到，其中矩阵pv的第(i , j)个元素为；然后求导再反解可得病毒视角得分矩阵，其中是拉普拉斯矩阵，是对角矩阵，其第i个对角元素为，其中加权相似度矩阵通过迭代更新计算；类似地方法求解，可得药物视角得分矩阵。

技术总结
本发明公开了一种基于L1范数图的抗病毒药物筛选方法，属于人工智能与生物学交叉领域。具体包括如下步骤：构建病毒‑药物关联的邻接矩阵，分别计算病毒高斯距离相似性和药物高斯距离相似性；使用病毒基因组序列计算病毒基因序列相似性，使用药物的化学结构信息计算药物化学结构相似性；使用快速核学习法计算整合病毒相似性、整合药物相似性；结合稀疏约束与拉普拉斯半监督学习方法，构建目标函数，分别求解得到病毒视角、药物视角的预测得分矩阵，筛选、排序得到最终结果。本发明能有效克服已知数据中内在噪声信息的不利影响，快速、精确且高效地筛选出病毒有效治疗药物，避免生物医学实验方法耗时长、成本高且风险大的问题。

技术研发人员：汤永,张益萌,柴勇
受保护的技术使用者：汤永
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汤永张益萌柴勇
技术所有人：汤永
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。