一种化合物逆合成方法及装置

文档序号:33361520发布日期:2023-03-07 21:01阅读:75来源:国知局
一种化合物逆合成方法及装置

1.本发明涉及逆合成技术领域,特别是指一种结合多尺度卷积与自注意力编码的化合物逆合成方法及装置。


背景技术:

2.化合物逆合成是当今研究化合物合成路线的重要手段之一,该合成方法以通过目标化合物寻找多种合成原料为研究路线。在化合物合成的研究中,由简单原料合成指定的复杂化合物是困难的,因此通过化合物逆合成辅助设计方法是十分重要的。对于化合物逆合成推理的一般过程,化合物被逐步分解为简单原料,最终选择出更为合理的化合物合成工艺路线。为了后续将该方法扩展应用于新化合物的逆合成,需要模型对于推理过程具有较强的适应能力。化合物逆合成方法一般利用循环神经网络和基于注意力机制的transformer模型。在这些方法中,首先目标化合物根据smiles规则被转化为线性的序列形式,然后序列输入到特定的深度神经网络中对特征序列完成逆向合成推理。其中,基于循环神经网络的方法依赖隐式记忆建模和递归输出,推理速度较慢。另外,该方法还有着两个问题:1、化学分子序列过长易产生梯度爆炸的问题;2、多层循环神经网络的堆叠设计易导致模型退化和无法学习更加丰富特征的问题。近期,基于transformer的方法越来越受到重视。基于transformer的方法不依赖隐藏信息建模,而是直接计算每个序列特征之间的关系。另外,基于transformer的方法能够同步完成化学分子序列之间的信息传递,学习速度较快而且避免了梯度爆炸等问题。但是在化合物逆合成的问题中,基于transformer的方法不通过隐藏信息传递来建模,而是直接计算每个序列特征之间的关系,能够同步完成化学分子序列之间的信息传递,因而不会出现循环神经网络中的梯度爆炸等问题。虽然基于transformer的方法能够解决rnn的长期依赖问题,但是却过于关注序列的全局特征,易产生对化学分子的局部特征提取不充分的问题。


技术实现要素:

3.针对现有技术中,transformer模型过于关注化学分子序列的全局特征,易产生化学分子的局部特征提取不充分的问题,本发明提出了一种化合物逆合成方法及装置。
4.为解决上述技术问题,本发明提供如下技术方案:
5.一方面,提供了一种化合物逆合成方法,该方法应用于电子设备,包括以下步骤:
6.s1:通过基于transformer的序列模型提取原化合物的化学分子式特征;
7.s2:通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取;
8.s3:将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
9.可选地,s1中,通过基于transformer的序列模型提取原化合物的化学分子式特征,包括:
10.s11:将原化合物的化学分子式转化为smiles格式的线性表示,并进行分词;
11.s12:通过基于transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
12.s13:通过自适应池化法将特征序列的长度进行统一。
13.可选地,步骤s2中,通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取,包括:
14.s21:通过多尺度卷积特征融合模块,对特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
15.s22:通过基于transformer的序列模型进行特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
16.可选地,步骤s21中,通过多尺度卷积特征融合模块,对特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征,包括:
17.将化学分子的特征序列x输入到一个含有三个不同尺寸卷积核的卷积模块s中,产生多种感受野的局部特征其中卷积模块s中包含k个尺寸大小为1
×
f的卷积核其中k=3,f=2k+1;
18.对在维度j上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和softmax函数,计算局部特征注意力图:
[0019][0020]
其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;
[0021]
注意力图a和特征z重新整合出局部特征在维度j上进行特征融合获得新的局部特征。
[0022]
可选地,步骤s3中,将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成,包括:
[0023]
根据多尺度局部特征和差分特征,通过基于注意力机制的gru的序列生成模型进行原化合物的回归生成;
[0024]
其中,回归生成过程中,每一步的回归生成均根据上一时刻的输出对局部特征和差分特征进行特征选择;
[0025]
基于注意力机制的gru的序列生成模型在训练时,前一时刻的输入直接采用真值,推断时通过集束搜索生成原料序列,完成化合物逆合成。
[0026]
可选地,步骤s3中,还包括:
[0027]
基于注意力机制的gru的序列生成模型在训练时,加入对注意力系数先验约束,若当前时刻的输出在产物的序列中未被搜索出时,则约束差分特征的注意力系数加和为1,局部特征的注意力系数加和为0;反之差分特征注意力系数加和为0,局部特征注意力系数加
和为1。
[0028]
一方面,提供了一种化合物逆合成装置,该装置应用于电子设备,该装置包括:
[0029]
初步特征提取模块,用于通过基于transformer的序列模型提取原化合物的化学分子式特征;
[0030]
局部特征提取模块,用于通过多尺度卷积模块,对所述化学分子式特征进行多尺度局部特征和差分特征提取;
[0031]
回归合成模块,用于将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0032]
可选地,初步特征提取模块,用于将原化合物的化学分子式转化为smiles格式的线性表示,并进行分词;
[0033]
通过基于transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
[0034]
通过自适应池化法将所述特征序列的长度进行统一。
[0035]
可选地,局部特征提取模块,用于过多尺度卷积特征融合模块,对所述特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
[0036]
通过基于transformer的序列模型进行所述特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
[0037]
可选地,局部特征提取模块,用于将化学分子的特征序列x输入到一个含有三个不同尺寸卷积核的卷积模块s中,产生多种感受野的局部特征其中卷积模块s中包含k个尺寸大小为1
×
f的卷积核其中k=3,f=2k+1;
[0038]
对在维度j上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和softmax函数,计算局部特征注意力图:
[0039][0040]
其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;
[0041]
注意力图a和特征z重新整合出局部特征在维度j上进行特征融合获得新的局部特征。
[0042][0043]
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述一种化合物逆合成方法。
[0044]
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述一种化合物逆合成方法。
[0045]
本发明实施例的上述技术方案至少具有如下有益效果:
[0046]
上述方案中,针对基于注意力机制的transformer模型在化合物逆合成场景中存在的过度捕获全局的上下文信息和对局部特征提取不足的问题,创新地提出了一种基于多尺度编码和自注意力机制的化合物逆合成方法,具体实现方式为:利用多尺度卷积和基于注意力机制的transformer完成的局部特征和差分特征提取,使用基于注意力机制的gru生成模型和引入了先验损失的注意力系数约束完成化合物逆合成。这种化合物逆合成方法在降低化合物研发成本、提高化合物研发效率的场景下具有显著的应用价值,为实现全面、准确的化合物逆合成以及化合物合成的广泛应用奠定了模型基础。
附图说明
[0047]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]
图1是本发明实施例提供的一种化合物逆合成方法的流程图;
[0049]
图2是本发明实施例提供的一种化合物逆合成方法的流程图;
[0050]
图3是本发明实施例提供的一种化合物逆合成方法的逆合成模型框架图;
[0051]
图4是本发明实施例提供的一种化合物逆合成方法的基于注意力机制的gru内部结构图;
[0052]
图5是本发明实施例提供的一种化合物逆合成装置框图;
[0053]
图6是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
[0054]
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0055]
本发明实施例提供了一种化合物逆合成方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图1所示的结合多尺度卷积与自注意力编码的化合物逆合成方法流程图,该方法的处理流程可以包括如下的步骤:
[0056]
s101:通过基于transformer的序列模型提取原化合物的化学分子式特征;
[0057]
s102:通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取;
[0058]
s103:将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0059]
可选地,s101中,通过基于transformer的序列模型提取原化合物的化学分子式特征,包括:
[0060]
s111:将原化合物的化学分子式转化为smiles格式的线性表示,并进行分词;
[0061]
s112:通过基于transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
[0062]
s113:通过自适应池化法将特征序列的长度进行统一。
[0063]
可选地,步骤s102中,通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取,包括:
[0064]
s121:通过多尺度卷积特征融合模块,对特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
[0065]
s122:通过基于transformer的序列模型进行特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
[0066]
可选地,步骤s121中,通过多尺度卷积特征融合模块,对特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征,包括:
[0067]
将化学分子的特征序列x输入到一个含有三个不同尺寸卷积核的卷积模块s中,产生多种感受野的局部特征其中卷积模块s中包含k个尺寸大小为1
×
f的卷积核其中k=3,f=2k+1;
[0068]
对在维度j上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和softmax函数,计算局部特征注意力图:
[0069][0070]
其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;
[0071]
注意力图a和特征z重新整合出局部特征在维度j上进行特征融合获得新的局部特征。
[0072]
可选地,步骤s103中,将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成,包括:
[0073]
根据多尺度局部特征和差分特征,通过基于注意力机制的gru的序列生成模型进行原化合物的回归生成;
[0074]
其中,回归生成过程中,每一步的回归生成均根据上一时刻的输出对局部特征和差分特征进行特征选择;
[0075]
基于注意力机制的gru的序列生成模型在训练时,前一时刻的输入直接采用真值,推断时通过集束搜索生成原料序列,完成化合物逆合成。
[0076]
可选地,步骤s103中,还包括:
[0077]
基于注意力机制的gru的序列生成模型在训练时,加入对注意力系数先验约束,若当前时刻的输出在产物的序列中未被搜索出时,则约束差分特征的注意力系数加和为1,局部特征的注意力系数加和为0;反之差分特征注意力系数加和为0,局部特征注意力系数加和为1。
[0078]
本发明实施例中,针对基于注意力机制的transformer模型在化合物逆合成场景中存在的过度捕获全局的上下文信息和对局部特征提取不足的问题,创新地提出了一种基于多尺度编码和自注意力机制的化合物逆合成方法,具体实现方式为:利用多尺度卷积和
基于注意力机制的transformer完成的局部特征和差分特征提取,使用基于注意力机制的gru生成模型和引入了先验损失的注意力系数约束完成化合物逆合成。这种化合物逆合成方法在降低化合物研发成本、提高化合物研发效率的场景下具有显著的应用价值,为实现全面、准确的化合物逆合成以及化合物合成的广泛应用奠定了模型基础。
[0079]
本发明实施例提供了一种化合物逆合成方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图2所示的结合多尺度卷积与自注意力编码的化合物逆合成方法流程图,该方法的处理流程可以包括如下的步骤:
[0080]
s201:将原化合物的化学分子式转化为smiles格式的线性表示,并进行分词;
[0081]
s202:通过基于transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
[0082]
s203:通过自适应池化法将所述特征序列的长度进行统一。
[0083]
一种可行的实施方式中,本发明首先需要使用基于transformer的序列模型提取化合物化学分子式的特征。首先,将化学分子式转化为smiles格式的线性表示并进行分词,使用序列模型提取各个分词的特征,然后使用自适应池化的方法将化合物化学分子序列长度进行统一。
[0084]
一种可行的实施方式中,由于不同化学分子的特征序列的长度不一,在实际操作中规定化学分子序列的目标长度为n,然后用自适应池化统一每个化学分子序列的长度,表示为其中d1表示特征维度。
[0085]
s204:通过多尺度卷积特征融合模块,对所述特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
[0086]
本发明实施例中,由于需要提取化学分子特征序列的多尺度的语义信息,所以引入了结合多尺度卷积和注意力机制的编码方法,提取多尺度的局部和差分特征。首先使用多尺度卷积特征融合模块,对化学分子序列特征通过不同尺寸的卷积核进行卷积操作,旨在从产物分子序列中提取显式的局部特征。
[0087]
一种可行的实施方式中,基于transformer模型要求序列中的每个元素都关注全局的上下文信息,因此所学的特征表示过度关注全局信息和缺乏对局部特征的细节描述。多尺度局部和差分特征的提取能够增强化学分子序列特征的局部表达性。多尺度局部特征提取的具体实现方式是:首先对化学分子序列特征使用不同尺寸的卷积核进行卷积操作得到多个局部特征图,然后对多个局部特征图进行融合。
[0088]
一种可行的实施方式中,将化学分子特征x输入到一个含有三个不同尺寸卷积核的卷积模块s中,产生多种感受野的局部特征其中卷积模块s中包含k个尺寸大小为1
×
f的卷积核其中k=3,f=2k+1;
[0089]
一种可行的实施方式中,考虑到不同大小的感受野下提取的局部特征zj所捕捉的局部结构信息不同,引入了注意力机制来融合最终的局部特征。对在维度j上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和softmax函数,计算局部
特征注意力图a∈rj×j:
[0090][0091]
其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;
[0092]
注意力图a和特征z重新整合出局部特征在维度j上进行特征融合获得新的局部特征。
[0093]
一种可行的实施方式中,为了让网络自适应地捕捉多尺寸局部特征,引入了一组参数在维度j上进行特征融合来获得最终的局部特征编码在维度j上进行特征融合来获得最终的局部特征编码如公式(2)所示:
[0094][0095]
其中αj是可学习的并被初始化为1。
[0096]
s205:通过基于transformer的序列模型进行所述特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
[0097]
一种可行的实施方式中,为了满足化学分子序列的精准表示和原料回归生成的任务,所学的局部特征还需要进一步优化得到差分特征:首先使用transformer序列模型对化学分子序列进行全局特征建模,获得化学分子序列的全局表示然后通过全局特征和局部特征做差得到差分特征,x
diff
=x
glb-x
loc

[0098]
s206:将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0099]
一种可行的实施方式中,本发明以化合物逆合成为研究背景,来解决化合物逆合成的特征表示与原料回归建模问题。如图3所示为逆合成模型框架图。根据多尺度局部特征和差分特征,通过基于注意力机制的gru的序列生成模型进行原化合物的回归生成;gru(gated recurrent unit)是针对rnn的梯度问题所提出来的变体。
[0100]
其中,生成过程中,每一步都根据上一时刻的输出对局部特征和差分特征进行特征选择;训练时前一时刻的输入直接采用真值,推断时通过集束搜索生成原料序列,完成化合物逆合成。
[0101]
一种可行的实施方式中,引入基于注意力机制的gru序列生成模型来实现原料的生成。如图4所示,为基于注意力机制的gru内部结构图。生成过程中,每一步都利用注意力机制并根据前一时刻的输出对局部特征和差分特征进行特征选择。训练时,加入对注意力系数先验约束,若当前时刻的输出在产物序列中未被搜索出时,则约束差分特征的注意力系数加和为1,局部特征的注意力系数加和为0;反之差分特征注意力系数加和为0,局部特征注意力系数加和为1。
[0102]
一种可行的实施方式中,在测试时,利用集束搜索回归生成的序列。具体地,将所学的局部特征x
loc
与差分特征x
diff
与步骤1所学习的池化后的化学分子特征分别输入到基于注意力机制的序列模型中计算注意力因子向量β:
[0103]
β=softmax(f(w,[x
loc
;x
diff
]))#(3)
[0104]
其中w表示原料序列的分词特征,与步骤1中的产物序列分词特征映射方式相同,f(
·
)表示非线性函数,用于度量特征之间的相关性,之后使用注意力因子对x
loc
以及x
diff
进行约束并通过基于注意力机制的gru序列生成模型分别进行回归。最后根据top-n预测评价指标完成对逆合成模型的端到端训练。
[0105]
本发明实施例中,整体设计过程分为四大步骤。第一步利用基于transformer的序列模型提取化学分子的序列特征;第二步使用多尺度卷积模块提取化学分子序列的局部特征,并结合基于注意力机制的transformer提取的全局特征得到差分特征。第三步设计基于注意力机制的gru序列生成模型并引入注意力系数先验约束方法,通过top-n评价指标完成原料的回归生成学习。
[0106]
本发明实施例中,针对基于注意力机制的transformer模型在化合物逆合成场景中存在的过度捕获全局的上下文信息和对局部特征提取不足的问题,创新地提出了一种基于多尺度编码和自注意力机制的化合物逆合成方法,具体实现方式为:利用多尺度卷积和基于注意力机制的transformer完成的局部特征和差分特征提取,使用基于注意力机制的gru生成模型和引入了先验损失的注意力系数约束完成化合物逆合成。这种化合物逆合成方法在降低化合物研发成本、提高化合物研发效率的场景下具有显著的应用价值,为实现全面、准确的化合物逆合成以及化合物合成的广泛应用奠定了模型基础。
[0107]
本发明实施例中,创新地提出了一种结合多尺度卷积与自注意力编码的化合物逆合成模型,基于该模型完成化合物逆合成任务。该方法受启发于对化学分子序列的局部特征提取的研究,即通过深度学习模型对一个化学分子序列进行建模时,现有的深度序列模型往往会倾向于总结全局信息,而忽略了对局部特征的信息编码。在本发明的建模过程中,首先将化学分子式通过smiles规则转化为序列形式,并使用基于transformer的序列模型进行特征提取。考虑到化学分子信息编码的局部性,引入了多尺度卷积模块和基于注意力机制的transformer模块。为了进一步完成化合物逆合成的任务,引入了基于注意力机制gru和基于先验损失的注意力系数约束的原料生成学习方法,使得所分解的特征只包含具有专属于自己的特定结构信息,进而准确生成不同原料信息的初始表达。这样得到的逆合成原料分子式信息精确完整,适用性强。和传统的循环神经网络和基于注意力机制的transformer模型相比,基于多尺度信息编码和自注意力机制的化合物逆合成模型能够有效避免特征信息提取不够精准、信息表达不完全的问题,因此本发明具有十分重要的理论价值和应用价值。
[0108]
图5是根据一示例性实施例示出的一种化合物逆合成装置框图。参照图5,该装置300包括:
[0109]
初步特征提取模块310,用于通过基于transformer的序列模型提取原化合物的化学分子式特征;
[0110]
局部特征提取模块320,用于通过多尺度卷积模块,对所述化学分子式特征进行多尺度局部特征和差分特征提取;
[0111]
回归合成模块330,用于将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0112]
可选地,初步特征提取模块310,用于将原化合物的化学分子式转化为smiles格式
的线性表示,并进行分词;
[0113]
通过基于transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
[0114]
通过自适应池化法将所述特征序列的长度进行统一。
[0115]
可选地,局部特征提取模块320,用于过多尺度卷积特征融合模块,对所述特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
[0116]
通过基于transformer的序列模型进行所述特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
[0117]
可选地,局部特征提取模块320,用于将化学分子的特征序列x输入到一个含有三个不同尺寸卷积核的卷积模块s中,产生多种感受野的局部特征其中卷积模块s中包含k个尺寸大小为1
×
f的卷积核其中k=3,f=2k+1;
[0118]
对在维度j上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和softmax函数,计算局部特征注意力图:
[0119][0120]
其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;
[0121]
注意力图a和特征z重新整合出局部特征在维度j上进行特征融合获得新的局部特征。
[0122]
可选地,回归合成模块330,用于根据所述多尺度局部特征和差分特征,通过基于注意力机制的gru的序列生成模型进行原化合物的回归生成;
[0123]
其中,回归生成过程中,每一步的回归生成均根据上一时刻的输出对局部特征和差分特征进行特征选择;
[0124]
基于注意力机制的gru的序列生成模型在训练时,前一时刻的输入直接采用真值,推断时通过集束搜索生成原料序列,完成化合物逆合成。
[0125]
可选地,基于注意力机制的gru的序列生成模型在训练时,加入对注意力系数先验约束,若当前时刻的输出在产物的序列中未被搜索出时,则约束差分特征的注意力系数加和为1,局部特征的注意力系数加和为0;反之差分特征注意力系数加和为0,局部特征注意力系数加和为1。
[0126]
本发明实施例中,针对基于注意力机制的transformer模型在化合物逆合成场景中存在的过度捕获全局的上下文信息和对局部特征提取不足的问题,创新地提出了一种基于多尺度编码和自注意力机制的化合物逆合成方法,具体实现方式为:利用多尺度卷积和基于注意力机制的transformer完成的局部特征和差分特征提取,使用基于注意力机制的gru生成模型和引入了先验损失的注意力系数约束完成化合物逆合成。这种化合物逆合成
方法在降低化合物研发成本、提高化合物研发效率的场景下具有显著的应用价值,为实现全面、准确的化合物逆合成以及化合物合成的广泛应用奠定了模型基础。
[0127]
图6是本发明实施例提供的一种电子设备400的结构示意图,该电子设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条指令,所述至少一条指令由所述处理器401加载并执行以实现下述化合物逆合成方法的步骤:
[0128]
s1:通过基于transformer的序列模型提取原化合物的化学分子式特征;
[0129]
s2:通过多尺度卷积模块,对所述化学分子式特征进行多尺度局部特征和差分特征提取;
[0130]
s3:将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的gru的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0131]
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述化合物逆合成方法。例如,所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0132]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0133]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1