基于贝叶斯优化的分子生成方法及装置与流程

文档序号:37925435发布日期:2024-05-11 00:04阅读:6来源:国知局
基于贝叶斯优化的分子生成方法及装置与流程

本发明属于分子生成,具体涉及一种基于贝叶斯优化的分子生成方法及装置。


背景技术:

1、当代化工、制药、食品等领域的产品开发通常需要发现新的分子。传统的分子设计依赖于人类的专业知识来提出、合成和测试新分子,但这个过程往往耗时且成本高,限制了实际可测试的分子数量。分子生成建模提供了另一种方法,通过设定目标条件来引导分子的生成过程。目前,循环神经网络、自编码器、生成对抗网络等深度学习模型是主流的分子生成方法。这些方法在给定明确的条件下能够生成大量的分子,并且在已知分子构效关系的条件下,生成的候选分子性能表现出色。然而,这些方法生成分子的方向很难掌握,即难以确定生成的新分子与现有分子的相似程度。这经常导致最终生成的候选分子在实验合成过程中遇到困难、成本高,甚至无法成功合成,进而使得分子生成在实际实验阶段难以实施,甚至合成失败。

2、因此,如何在生成性能优异的分子的同时确保分子的可控性,成为分子生成领域面临着一个急需解决的问题。


技术实现思路

1、为此,本发明提供一种基于贝叶斯优化的分子生成方法及装置,通过构建分子骨架的方法,生成大量的分子并使得分子生成的方向可控。同时使用贝叶斯优化算法可以通过快速迭代获取最佳候选分子,从而实现最终分子生成的目标。

2、为了实现上述目的,本发明提供如下技术方案:基于贝叶斯优化的分子生成方法,包括:

3、将目标分子对象与目标分子性能的关系转化为函数表达式,并通过经验统计知识确定满足预设条件的所述目标分子性能的最优值;

4、确定所述目标分子对象的分子骨架,通过所述目标分子对象的分子骨架确定所述目标分子对象的分子输入信息的格式;根据所述目标分子对象的分子输入信息的格式构建所述目标分子对象的分子输入信息库,确定所述目标分子对象的生成空间;

5、将所述目标分子对象转化为所述目标分子对象的分子输入信息格式,通过对所述目标分子对象的分子输入信息库中未出现的位点编码进行重新组合,构成新分子;将所述新分子通过所述函数表达式计算所述新分子的性能;将所述新分子转化为所述目标分子对象的分子输入信息格式,更新到所述目标分子对象的分子输入信息中,得到所述目标分子对象的最终分子性能输入参数;

6、将所述目标分子对象的分子输入信息库和所述目标分子对象的分子性能输入参数输入到贝叶斯算法中,通过所述贝叶斯算法进行迭代推荐,直到满足预设条件下所述目标分子对象的性能的最优值,得到最终生成的候选目标分子对象。

7、作为基于贝叶斯优化的分子生成方法优选方案,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,也可以根据需要选择其它相关的模型,所述模型的函数表达式为所述模型的函数方程;

8、当所述目标分子对象与所述目标分子性能的构效关系不明确时,所述模型的函数表达式通过实验获得分子性能值确定。

9、作为基于贝叶斯优化的分子生成方法优选方案,确定所述目标分子对象的分子骨架,是通过对所述目标分子对象进行分析,保留所述目标分子对象中相同的框架,将所述目标分子对象中可变部分划分出来;每个所述可变部分作为一个位点,并进行编号;对每个编号的位点进行枚举,并将每个位点的枚举情况转化为整数编码;构建每个位点枚举情况和所述整数编码的位点字典,并通过所述位点字典与位点编号构成分子输入信息库,确定所述目标分子对象的生成空间。

10、作为基于贝叶斯优化的分子生成方法优选方案,将所述目标分子对象转化为所述目标分子对象的分子输入信息格式时,所述输入信息格式包括所述目标分子对象的所有位点编码和分子性能值。

11、作为基于贝叶斯优化的分子生成方法优选方案,将所述目标分子对象的分子输入信息库去掉位点枚举名信息,改为含有数值的列表,得到贝叶斯搜索空间输入;在所述贝叶斯搜索空间输入中添加所述目标分子对象的分子性能输入参数,形成所述目标分子对象的贝叶斯优化的初始输入;

12、所述贝叶斯优化步骤为:

13、第一步,代入所述目标分子对象的贝叶斯优化的初始输入,进行贝叶斯优化算法第一次推荐,推荐得到第一组所述目标分子对象的输入信息和对应的分子性能;

14、第二步,若第一组所述目标分子对象的输入信息对应的分子性能不满足设定的所述目标分子性能的最优值,则通过所述函数表达式计算第一组所述目标分子对象的输入信息的分子性能值,并将第一组所述目标分子对象的输入信息的分子性能值更新到所述目标分子对象的分子性能输入参数中;然后进行贝叶斯优化算法第二次推荐;若第一组所述目标分子对象的输入信息对应的分子性能满足设定的所述目标分子性能的最优值,则进入第三步;

15、第三步,将满足设定的所述目标分子性能的最优值的一组所述目标分子对象的输入信息通过所述函数表达式检验这一组分子的分子性能;若计算得到的值不满足设定的所述目标分子性能的最优值,则继续通过贝叶斯优化算法推荐;若满足设定的所述目标分子性能的最优值,则最终生成的候选目标分子对象。

16、本发明还提供一种基于贝叶斯优化的分子生成装置,采用上述的基于贝叶斯优化的分子生成方法,包括:

17、分子关系函数表达式转化模块,用于将目标分子对象与目标分子性能的关系转化为函数表达式,并通过经验统计知识确定满足预设条件的所述目标分子性能的最优值;

18、分子生成空间确定模块,用于确定所述目标分子对象的分子骨架,通过所述目标分子对象的分子骨架确定所述目标分子对象的分子输入信息的格式;根据所述目标分子对象的分子输入信息的格式构建所述目标分子对象的分子输入信息库,确定所述目标分子对象的生成空间;

19、分子性能输入参数生成模块,用于将所述目标分子对象转化为所述目标分子对象的分子输入信息格式,通过对所述目标分子对象的分子输入信息库中未出现的位点编码进行重新组合,构成新分子;将所述新分子通过所述函数表达式计算所述新分子的性能;将所述新分子转化为所述目标分子对象的分子输入信息格式,更新到所述目标分子对象的分子输入信息中,得到所述目标分子对象的最终分子性能输入参数;

20、目标分子对象生成模块,用于将所述目标分子对象的分子输入信息库和所述目标分子对象的分子性能输入参数输入到贝叶斯算法中,通过所述贝叶斯算法进行迭代推荐,直到满足预设条件下所述目标分子对象的性能的最优值,得到最终生成的候选目标分子对象。

21、作为基于贝叶斯优化的分子生成装置优选方案,在所述分子关系函数表达式转化模块中,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,也可以根据需要选择其它相关的模型,所述模型的函数表达式为所述模型的函数方程;

22、当所述目标分子对象与所述目标分子性能的构效关系不明确时,所述模型的函数表达式通过实验获得分子性能值确定。

23、作为基于贝叶斯优化的分子生成装置优选方案,在所述分子生成空间确定模块中,确定所述目标分子对象的分子骨架,是通过对所述目标分子对象进行分析,保留所述目标分子对象中相同的框架,将所述目标分子对象中可变部分划分出来;每个所述可变部分作为一个位点,并进行编号;对每个编号的位点进行枚举,并将每个位点的枚举情况转化为整数编码;构建每个位点枚举情况和所述整数编码的位点字典,并通过所述位点字典与位点编号构成分子输入信息库,确定所述目标分子对象的生成空间。

24、作为基于贝叶斯优化的分子生成装置优选方案,在所述分子性能输入参数生成模块中,将所述目标分子对象转化为所述目标分子对象的分子输入信息格式时,所述输入信息格式包括所述目标分子对象的所有位点编码和分子性能值。

25、作为基于贝叶斯优化的分子生成装置优选方案,在所述目标分子对象生成模块中,将所述目标分子对象的分子输入信息库去掉位点枚举名信息,改为含有数值的列表,得到贝叶斯搜索空间输入;在所述贝叶斯搜索空间输入中添加所述目标分子对象的分子性能输入参数,形成所述目标分子对象的贝叶斯优化的初始输入;

26、所述贝叶斯优化步骤为:

27、第一步,代入所述目标分子对象的贝叶斯优化的初始输入,进行贝叶斯优化算法第一次推荐,推荐得到第一组所述目标分子对象的输入信息和对应的分子性能;

28、第二步,若第一组所述目标分子对象的输入信息对应的分子性能不满足设定的所述目标分子性能的最优值,则通过所述函数表达式计算第一组所述目标分子对象的输入信息的分子性能值,并将第一组所述目标分子对象的输入信息的分子性能值更新到所述目标分子对象的分子性能输入参数中;然后进行贝叶斯优化算法第二次推荐;若第一组所述目标分子对象的输入信息对应的分子性能满足设定的所述目标分子性能的最优值,则进入第三步;

29、第三步,将满足设定的所述目标分子性能的最优值的一组所述目标分子对象的输入信息通过所述函数表达式检验这一组分子的分子性能;若计算得到的值不满足设定的所述目标分子性能的最优值,则继续通过贝叶斯优化算法推荐;若满足设定的所述目标分子性能的最优值,则最终生成的候选目标分子对象。

30、本发明具有如下优点:将目标分子对象与目标分子性能的关系转化为函数表达式,并通过经验统计知识确定满足预设条件的所述目标分子性能的最优值;确定所述目标分子对象的分子骨架,通过所述目标分子对象的分子骨架确定所述目标分子对象的分子输入信息的格式;根据所述目标分子对象的分子输入信息的格式构建所述目标分子对象的分子输入信息库,确定所述目标分子对象的生成空间;将所述目标分子对象转化为所述目标分子对象的分子输入信息格式,通过对所述目标分子对象的分子输入信息库中未出现的位点编码进行重新组合,构成新分子;将所述新分子通过所述函数表达式计算所述新分子的性能;将所述新分子转化为所述目标分子对象的分子输入信息格式,更新到所述目标分子对象的分子输入信息中,得到所述目标分子对象的最终分子性能输入参数;将所述目标分子对象的分子输入信息库和所述目标分子对象的分子性能输入参数输入到贝叶斯算法中,通过所述贝叶斯算法进行迭代推荐,直到满足预设条件下所述目标分子对象的性能的最优值,得到最终生成的候选目标分子对象。本发明通过构建分子骨架的方法,生成大量的分子并使得分子生成的方向可控。同时使用贝叶斯优化算法可以通过快速迭代获取最佳候选分子,从而实现最终分子生成的目标。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1