一种基于病毒结构蛋白的生物活性成分筛选系统

文档序号:29562833发布日期:2022-04-09 01:29阅读:307来源:国知局
一种基于病毒结构蛋白的生物活性成分筛选系统

1.本发明涉及计算机辅助药物设计领域,更具体地,涉及一种基于病毒结构蛋白的生物活性成分筛选系统、筛选方法、设备、系统、计算机可读存储介质。


背景技术:

2.抗病毒药物的研发是一项复杂的系统工程,时间成本和研发成本极大,计算机辅助药物设计(cadd)是一种提高新药研发效率的有效方法,cadd与分子生物学等学科整合,在一定程度上缩短了新药研发周期、降低了研发成本、提高了研发的成功率。
3.但是传统的基于cadd进行病毒结构蛋白的生物活性成分筛选步骤包含复杂的结构文件处理,对结构文件的不同处理需要借助不同的软件,研发人员需要一一学习和研究这些软件,即使熟悉软件后,不同软件的分散运行,也将导致结构文件的处理上花费大量的时间,延缓项目研发进度。此外,大量的分子对接软件的出现,虽然是对分子对接技术的不断开拓,但是很多分子对接软件背后的原理不同,采用的方法不同,各有利弊,难以取舍,每种分子对接软件结果可能相差甚远,选择哪种才更适合自有项目,反而成为研发人员的难题。


技术实现要素:

4.为了简化了病毒结构蛋白生物活性成分筛选步骤,提高了筛选的速度和效率,本发明提供了一种新的基于病毒结构蛋白的生物活性成分筛选系统、筛选方法、设备、系统、计算机可读存储介质。
5.本技术公开一种基于病毒结构蛋白的生物活性成分筛选系统,包括:
6.第一获取单元,用于获取待筛选的生物活性成分的结构文件及信息,所述信息包括生物活性成分的类别及大小;
7.选择单元,用于根据所述信息将待筛选的生物活性成分的结构文件输入相应的分子对接模块,所述分子对接模块包括蛋白-蛋白分子对接模块、蛋白-大核酸分子对接模块、蛋白-小核酸分子对接模块、蛋白-小分子分子对接模块;
8.第二获取单元,用于获取病毒结构蛋白的结构文件;
9.匹配单元,用于将所述病毒结构蛋白的结构文件与待筛选的生物活性成分的结构文件匹配到同一分子对接模块;
10.分子对接单元,用于将所述分子对接模块识别病毒结构蛋白的结合位点和待筛选的生物活性成分的三维构象,完成病毒蛋白与待筛选的生物活性成分结合及排序;
11.可视化单元,用于根据所述排序得到排名靠前的病毒蛋白与待筛选的生物活性成分结合后的复合物并进行三维可视化展示。
12.进一步,所述系统还包括蛋白结构预测单元,所述蛋白结构预测单元位于第二获取单元前,当原始输入文件是病毒结构蛋白的核酸序列或氨基酸序列时,所述蛋白结构预测单元用于将病毒结构蛋白的核酸序列或氨基酸序列生成病毒结构蛋白的结构文件,优选
的,所述蛋白结构预测单元为alphafold软件。
13.本发明的目的在于提供一种基于病毒结构蛋白的生物活性成分筛选方法,包括:
14.获取待筛选的生物活性成分的结构文件及生物信息,所述生物信息包括生物活性成分的类别及大小;
15.根据所述生物信息将待筛选的生物活性成分的结构文件输入相应的分子对接模块,所述分子对接模块包括蛋白-蛋白分子对接模块、蛋白-大核酸分子对接模块、蛋白-小核酸分子对接模块、蛋白-小分子分子对接模块;
16.获取病毒结构蛋白的结构文件;
17.将所述病毒结构蛋白的结构文件与待筛选的生物活性成分的结构文件匹配到同一分子对接模块;
18.所述分子对接模块识别病毒结构蛋白的结合位点和待筛选的生物活性成分的三维构象,完成病毒蛋白与待筛选的生物活性成分结合及排序;
19.根据所述排序得到排名靠前的病毒蛋白与待筛选的生物活性成分结合后的复合物并进行三维可视化展示。
20.进一步,所述生物活性成分的类别包括蛋白、核酸、小分子;
21.可选的,当待筛选的生物活性成分为蛋白时,所述待筛选的生物活性成分的结构文件属于蛋白-蛋白分子对接模块;当待筛选的生物活性成分为小分子时,将所述待筛选的生物活性成分的结构文件输入蛋白-小分子分子对接模块;当待筛选的生物活性成分为核酸时,根据核酸大小将所述待筛选的生物活性成分的结构文件输入蛋白-小核酸分子对接模块或蛋白-大核酸分子对接模块。
22.进一步,获取病毒结构蛋白的结构文件后对所述病毒蛋白的结构文件进行预处理,所述预处理包括加氢、计算电荷、去水分子、去杂原子、将非标准氨基酸转换成标准氨基酸、结构完整性检查和/或结构修复;优选的,所述结构修复包括对结构蛋白残缺或断裂部分进行连接;
23.可选的,所述生物信息将待筛选的生物活性成分的结构文件输入相应的分子对接模块前对所述待筛选的生物活性成分的结构文件进行预处理,所述预处理包括加氢、加电荷、化学键、优化氢的取向、检查有无原子缺失、有无侧链缺失。
24.进一步,所述分子对接模块选自商业或免费的分子对接程序中的一种或几种,优选的,所述分子对接程序包括:ligandfit、glide、gold、moe dock、surflex-dock、covdock、flexx、icm-pro、autodock、autodock vina、ledock、rdock、ucsf dock、rosetta、zdock、gramm-x、haddock、patchdock;
25.可选的,所述蛋白-蛋白分子对接模块包括:rosetta、zdock、gramm-x;蛋白-大核酸分子对接模块包括:rosetta、zdock、gramm-x;蛋白-小核酸分子对接模块包括:autodock、autodock vina、haddock、patchdock;蛋白-小分子分子对接模块包括:autodock、ledock、rdock、glide、gold、surflex-dock。
26.进一步,所述分子对接模块为两种以上的分子对接程序的组合,所述排序为各个分子对接程序打分函数的打分结果求均值;
27.优选的,所述蛋白-蛋白分子对接模块包括rosetta、zdock、gramm-x中的一种多种的组合;蛋白-大核酸分子对接模块包括:rosetta、zdock、gramm-x中的一种多种的组合;蛋
白-小核酸分子对接模块包括:autodock、autodock vina、haddock、patchdock;蛋白-小分子分子对接模块包括:autodock、ledock、rdock、glide、gold、surflex-dock。
28.进一步,所述三维可视化展示是通过可读取pdb文件的插件实现,优选的,所述三维可视化展示通过软件vmd实现。
29.本技术的目的在于提供一种基于病毒结构蛋白的生物活性成分筛选的设备,所述设备包括:存储器和处理器;
30.所述存储器用于存储程序指令;
31.所述处理器用于调用程序指令,当程序指令被执行时,用于执行上述的基于病毒结构蛋白的生物活性成分筛选方法。
32.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于病毒结构蛋白的生物活性成分筛选方法。
33.本技术的优点:
34.1.本技术整合了病毒结构蛋白的生物活性成分筛选过程中所用的各种软件单元,形成一种基于病毒结构蛋白的生物活性成分筛选系统,简化了病毒结构蛋白生物活性成分筛选步骤,提高了筛选的速度,在进行病毒结构蛋白的生物活性成分筛选过程中,原始输入文件不仅局限于有结构文件的病毒结构蛋白,还可以是病毒结构蛋白的核酸序列或氨基酸序列,大的简化了研发人员的操作步骤和操作难度;
35.2.本技术在分子对接后增加了可视化,将对接后的复合物进行筛查,三维可视化展示能够直观、有效的查看蛋白复合物对接的是否合理。因为尽管分子对接软件采用了不同的打分函数,但是分子对接的复杂性以及可变性使得分子对接软件打分函数泛化性欠佳,需要进行人工复核;
36.3.本技术创新性的将各分子对接模块软件进行分类和整合,通过获取的待筛选的生物活性成分的信息,匹配到不同类型的分子对接软件,实现高效的筛选;
37.4.本技术还创新性的将各分子对接模块软件进行整合,在选择合适类型的分子对接软件进行匹配的同时,基于不同分子对接软件构象采样性能和打分函数的不同原理,进行软件的整合,排序时所依据的评分为各分子对接软件打分函数的打分结果加和,有效的避免单个分子对接导致的过度偏差。
附图说明
38.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
39.图1是本发明实施例提供的一种基于病毒结构蛋白的生物活性成分筛选方法流程图;
40.图2是本发明实施例提供的一种基于病毒结构蛋白的生物活性成分筛选系统示意流程图;
41.图3是本发明实施例提供的一种基于病毒结构蛋白的生物活性成分筛选设备示意图;
42.图4是本发明实施例提供的基于病毒结构蛋白的生物活性成分筛选系统页面展示图。
具体实施方式
43.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
44.在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
45.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
46.图1是本发明实施例提供的一种基于病毒结构蛋白的生物活性成分筛选方法示意流程图,具体地,所述方法包括如下步骤:
47.101:获取待筛选的生物活性成分的结构文件及信息,所述信息包括生物活性成分的类别及大小;
48.在一个实施例中,所述生物活性成分的类别包括蛋白、核酸、小分子。
49.在一个实施例中,核酸的包括dna和rna,单链、双链等,优选的,核酸的大小以9、12、15、18、21个核苷酸为阈值,小于阈值的为小核酸,大于阈值的为大核酸分子。
50.在一个实施例中,所述将待筛选的生物活性成分的结构文件输入相应的分子对接模块前对所述待筛选的生物活性成分的结构文件进行预处理,所述预处理包括加氢、计算电荷、化学键、优化氢的取向、检查有无原子缺失、有无侧链缺失。
51.在一个实施例中,采用不同经验电荷计算方法(如del-re、formal、gm、gh、huckel、mmff和pullman中的任意一种或几种的组合)计算小分子的电荷。
52.102:根据所述信息将待筛选的生物活性成分的结构文件输入相应的分子对接模块,所述分子对接模块包括蛋白-蛋白分子对接模块、蛋白-大核酸分子对接模块、蛋白-小核酸分子对接模块、蛋白-小分子分子对接模块;
53.在一个实施例中,当待筛选的生物活性成分为蛋白时,所述待筛选的生物活性成分的结构文件属于蛋白-蛋白分子对接模块;当待筛选的生物活性成分为小分子时,将所述待筛选的生物活性成分的结构文件输入蛋白-小分子分子对接模块;当待筛选的生物活性成分为核酸时,根据核酸大小将所述待筛选的生物活性成分的结构文件输入蛋白-小核酸分子对接模块或蛋白-大核酸分子对接模块。
54.在一个实施例中,所述分子对接模块选自商业或免费的分子对接程序中的一种或几种,优选的,所述分子对接程序包括:ligandfit、glide、gold、moe dock、surflex-dock、covdock、flexx、icm-pro、autodock、autodock vina、ledock、rdock、ucsf dock、rosetta、
zdock、gramm-x、haddock、patchdock。
55.在一个实施例中,所述蛋白-蛋白分子对接模块包括:rosetta、zdock、gramm-x;蛋白-大核酸分子对接模块包括:rosetta、zdock、gramm-x;蛋白-小核酸分子对接模块包括:autodock、autodock vina、haddock、patchdock;蛋白-小分子分子对接模块包括:autodock、ledock、rdock、glide、gold、surflex-dock。
56.103:获取病毒结构蛋白的结构文件;
57.在一个实施例中,当原始输入文件是病毒结构蛋白的核酸序列或氨基酸序列时,将病毒结构蛋白的核酸序列或氨基酸序列生成病毒结构蛋白的结构文件,优选的,所述蛋白结构预测单元为alphafold或rosettafold软件。
58.在一个实施例中,获取病毒结构蛋白的结构文件后对所述病毒蛋白的结构文件进行预处理,所述预处理包括加氢、计算电荷、去水分子、去杂原子、将非标准氨基酸转换成标准氨基酸、结构完整性检查和/或结构修复;优选的,所述结构修复包括对结构蛋白残缺或断裂部分进行连接。
59.在一个实施例中,所述计算电荷采用gasteiger方法计算病毒结构蛋白的电荷并进行加氢处理。
60.在一个实施例中,当获取病毒结构蛋白的结构文件来自pdb数据库,使用sybyl-x等软件包进行结构完整性检查。
61.104:将所述病毒结构蛋白的结构文件与待筛选的生物活性成分的结构文件匹配到同一分子对接模块;
62.105:所述分子对接模块识别病毒结构蛋白的结合位点和待筛选的生物活性成分的三维构象,完成病毒蛋白与待筛选的生物活性成分结合及排序;
63.在一个实施例中,所述分子对接模块为两种以上的分子对接程序的组合,所述排序为各个分子对接程序打分函数的打分结果求均值。市面上的分子对接软件本身的核心计算公式比较粗糙,根据原理的不同大致分为基于物理的打分函数、基于经验的打分函数、基于知识的打分函数和基于描述的打分函数四大类。各种打分函数各有利弊,故而,可采用综合各个分子对接程序打分函数的打分结果求均值的方法,或者对不同的打分函数的打分结果乘以其权重后求和的方式,来获得更好的结果。
64.在一个实施例中,所述蛋白-蛋白分子对接模块包括rosetta、zdock、gramm-x中的一种多种的组合,所述排序为rosetta、zdock、gramm-x中的一种多种的组合打分函数的打分结果求均值;蛋白-大核酸分子对接模块包括:rosetta、zdock、gramm-x中的一种多种的组合,所述排序为rosetta、zdock、gramm-x中的一种多种的组合打分函数的打分结果求均值;蛋白-小核酸分子对接模块包括:autodock、autodock vina、haddock、patchdock,所述排序为autodock、autodock vina、haddock、patchdock中的一种多种的组合打分函数的打分结果求均值;蛋白-小分子分子对接模块包括:autodock、ledock、rdock、glide、gold、surflex-dock,所述排序为autodock、ledock、rdock、glide、gold、surflex-dock中的一种多种的组合打分函数的打分结果求均值。
65.106:根据所述排序得到排名靠前的病毒蛋白与待筛选的生物活性成分结合后的复合物并进行三维可视化展示。
66.在一个实施例中,所述三维可视化展示是通过可读取pdb文件的插件实现,优选
的,所述三维可视化展示通过软件vmd实现。
67.图2是本发明实施例提供的一种基于病毒结构蛋白的生物活性成分筛选设备,所述设备包括:存储器和处理器;
68.所述存储器用于存储程序指令;
69.所述处理器用于调用程序指令,当程序指令被执行时,用于执行上述的基于病毒结构蛋白的生物活性成分筛选方法。
70.图3是本发明实施例提供的一种基于病毒结构蛋白的生物活性成分筛选系统,包括:
71.第一获取单元301,用于获取待筛选的生物活性成分的结构文件及信息,所述信息包括生物活性成分的类别及大小;
72.选择单元302,用于根据所述信息将待筛选的生物活性成分的结构文件输入相应的分子对接模块,所述分子对接模块包括蛋白-蛋白分子对接模块、蛋白-大核酸分子对接模块、蛋白-小核酸分子对接模块、蛋白-小分子分子对接模块;
73.第二获取单元303,用于获取病毒结构蛋白的结构文件;
74.匹配单元304,用于将所述病毒结构蛋白的结构文件与待筛选的生物活性成分的结构文件匹配到同一分子对接模块;
75.分子对接单元305,用于将所述分子对接模块识别病毒结构蛋白的结合位点和待筛选的生物活性成分的三维构象,完成病毒蛋白与待筛选的生物活性成分结合及排序;
76.可视化单元306,用于根据所述排序得到排名靠前的病毒蛋白与待筛选的生物活性成分结合后的复合物并进行三维可视化展示。
77.优选的,所述系统还包括蛋白结构预测单元,所述蛋白结构预测单元位于第二获取单元前,当原始输入文件是病毒结构蛋白的核酸序列或氨基酸序列时,所述蛋白结构预测单元用于将病毒结构蛋白的核酸序列或氨基酸序列生成病毒结构蛋白的结构文件,优选的,所述蛋白结构预测单元为alphafold或rosettafold软件。
78.优选的,所述系统还包括预处理单元,所述预处理蛋白用于对获取的结构文件进行预处理,所述预处理包括对蛋白结构文件进行加氢、计算电荷、去水分子、去杂原子、将非标准氨基酸转换成标准氨基酸、结构完整性检查和/或结构修复;所述预处理还包括对小分子结构文件进行加氢、加电荷、化学键、优化氢的取向、检查有无原子缺失和/或有无侧链缺失。优选的,所述预处理单元是
79.在一个实施例中,所述系统的第一获取单元和第二获取单元结构文件和序列文件,支持的蛋白、核酸大分子文件包括:pdb结构文件格式、fasta序列格式;小分子文件包括:sdf、pdb、pdbqt结构式文件。系统可以自行判断处理上传的文件,如果上传序列数据,系统将自动通过蛋白结构预测单元进行蛋白结构预测。并对结构文件自动进行加氢、计算电荷等常规数据处理。
80.在一个实施例中,基于病毒结构蛋白的生物活性成分筛选系统页面展示如图4所示,在web页面中,提交病毒结构蛋白(receptor)、病毒结构蛋白的生物活性成分结构文件,所述结构文件可以是已经预处理后的结构文件,所述病毒结构蛋白的生物活性成分可以是蛋白、核酸或小分子;点击submit,将病毒结构蛋白、病毒结构蛋白的生物活性成分进行分子对接,运行结束后,在前端网页呈现。
81.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于病毒结构蛋白的生物活性成分筛选方法。
82.本验证实施例的验证结果表明,为适应症分配固有权重相对于默认设置来说可以适度改善本方法的性能。
83.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
84.在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
85.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
86.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
87.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(rom,read only memory)、随机存取存储器(ram,random access memory)、磁盘或光盘等。
88.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
89.以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1