一类人工智能辅助活性小分子构象和蛋白结合位点预测构建活性荧光探针方法

文档序号:30948259发布日期:2022-07-30 06:15阅读:153来源:国知局
1.本发明属于分子生物学、医学等领域,尤其涉及本发明涉及一类人工智能辅助活性小分子构象和蛋白结合位点预测方法方法及应用说明书。
背景技术
::2.在过去的几年里,大量数据的可用性不断增加,导致了机器学习(machinelearning)中一个子领域的发展,即深度学习(deeplearning)领域。深度学习(deeplearning)的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。基于深度学习的生物医学图像分析在人工智能与医疗保健的交叉领域发挥着重要作用。由于生物医学固有的复杂性,生物医学图像分析中的数据模式、数据集规模和任务可能高度多样化。通过调整传感器和成像协议,为特定目的设计了许多生物医学成像模式。近年来,人们越来越有兴趣将注意力整合到用于生物医学图像分割的深度学习架构中。dl在许多科学领域(计算机视觉)已经超越了更传统的ml方法)、自然语言处理等)并且最近已应用于各种结构生物信息学任务,例如虚拟筛选、结合亲和力预测或蛋白质结构预测。近年来,基于深度学习(dl)的人工智能(ai)在全球引起了极大的兴趣。3.神经网络(neuralnetworks)是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。神经网络构成生命的多样性是生物学的核心原则,而保护生物多样性是实现更可持续生活的关键。监测生物多样性需要在可能的最低分类水平上识别活生物体。传统的识别方法使用已发布的形态二分键来识别收集的样本。这种识别涉及一个繁琐的过程,即手动评估一长串按层次排列的形态特征是否存在。分析通常由训练有素的人类分类学家在实验室环境中进行,难以大规模进行。4.人工智能和机器学习技术在药物发现和开发中起着至关重要的作用。机器学习和深度学习算法已经在几个药物发现过程中得到应用,如肽合成、基于结构的虚拟筛选、基于配体的虚拟筛选、毒性预测、药物监测和释放、药物团建模、定量构效关系、药物重新定位、多药理学和理化交流过去的证据加强了人工智能和深度学习在该领域的实施。基于结构的药物发现主要依赖于小分子化合物在蛋白质结构上的潜在结合位点。了解配体与其分子靶标之间形成的相互作用是指导分子优化的关键。不同的实验和计算方法是更好地理解这些分子间相互作用的关键。基于几何深度学习的方法便能够预测配体与蛋白质靶标的结合构象。具体来说,该模型是为每个配体-目标对量身定制的。这种潜力可以与全局优化算法相结合,以重现配体的实验结合构象。该方法实现了如何使用人工智能来改进基于结构的药物设计。使用深度学习来学习这些潜力具有一些优势,例如考虑分子的较大部分或推断未包含在训练集中的原子组合的潜力。在最近用于蛋白质结构预测的深度学习潜力中也观察到了类似的优势。本发明中,我们表明基于距离似然的建议潜力在对接和筛选任务中的表现与完善的评分函数相似或更好。此外,它还可以与全局优化算法相结合,以重现配体的实验结合构象。5.计算结合位点预测(bsp)允许预测需要大量努力通过实验建立的计算机特性,并且可以显着增强药物发现过程。多年来,已经为基于结构的bsp任务提出了大量方法,它们可以大致分为三类:基于几何的、基于能量的和基于能量的。基于模板的方法。基于几何的方法仅基于几何预测结合腔分子表面;而基于能量的方法计算蛋白质原子和化学探针之间的相互作用能;另一方面,基于模板的方法旨在提取结合通过在蛋白质和一组预先存在的模板之间执行全局或局部结构比对来定位蛋白质上的位点。此外,已经提出了共识算法,将许多独立方法的结果结合起来。机器学习技术利用可用的标记数据量,并通过自动和迭代的学习过程,设法分析和提取最终与数据及其分配的标签。这种方法最近也被引入到基于结构的bsp任务中。6.近年来,实验结构数据的爆炸式增长也使得机器学习和人工智能在研究配体-靶标相互作用方面的应用成为可能。例如,机器学习已成功应用于识别配体可以直接结合的蛋白质区域。此外,还开发了多种方法来从配体-靶标复合物的三维结构预测结合亲和力。其中许多方法利用工程描述子捕捉主要配体-目标相互作用,这些描述子可以输入预测算法,而其他方法直接使用卷积神经网络(cnn)或图卷积神经网络(gnn用于预测任务。7.尽管需要更高效的基于结构的设计方法,但很少有努力通过使用人工智能或机器学习来加速或改进结合配体的结构预测。目前应用于基于结构的药物发现的大多数人工智能方法依赖于先前通过实验或计算方法获得的配体-靶标复合物的3d结构。现有的bsp预测方法基于各种算法方法。传统上,方法根据其主要算法策略分为几何、能量、基于守恒、基于模板(后两种有时也称为进化)和基于机器学习/知识的方法。8.在此,本发明发明了一种基于几何深度学习的方法,能够预测配体与蛋白质靶标的结合构象,以此来设计针对蛋白质的荧光探针进行成像。技术实现要素:9.发明目的:10.1.提供一种基于深度学习的方法,它能够预测配体与蛋白质靶标的结合构象。11.2.提供一种基于深度学习的方法,构建针对蛋白质的荧光探针。12.3.利用该方法模拟了小分子配体对蛋白的结合构建荧光探针进行荧光成像。13.技术方案:一种基于几何深度学习的方法,它能够预测配体与蛋白质靶标的结合构象和位点以构建活性荧光探针。14.其主要流程见图9。15.首先我们对蛋白质的结构极性描述符提取,使用了一种用于预测蛋白质配体结合位点的纯机器学习方法deepsite。16.deepsite:计算机视觉的角度处理蛋白质结构,就好像它们是3d图像一样。该3d图像的坐标被定义为跨越蛋白质的边界框加上的缓冲区,以解释靠近其边缘的口袋。然后将3d图像离散化为3大小的体素网格。对于每个所述体素,定义了基于原子的药效学特性的概要。体素占有率是根据蛋白质中的原子定义的,具体取决于它们的排除体积和其他七个原子特性:疏水性、芳香性、氢键受体或供体、正离子或负离子可电离和金属。这些被称为渠道,与计算机视觉进行比较,其中图像可以用三种不同的颜色阵列表示:红色、绿色和蓝色。表1中的autodock4原子类型与表2的规则一起使用,以将每个原子分配给特定通道。然后对这些阵列中16×16×16体素的子网格进行采样,定义具有局部特性的较小蛋白质区域。我们利用数据库中所有蛋白质的事实,我们知道其相应结合位点的位置,将每个子网格标记为正,如果其几何中心距口袋几何中心的距离小于否则为负。然后利用dcnn计算结合位点。17.table1:autodock4中的原子类型(*为默认在gpf中存在的原子类型)[0018][0019]table2:用于3d描述符计算的属性-原子类型(autodock4)对应关系[0020][0021]附图10为deepsite的内部dcnn架构。输入由八个大小为3的属性通道组成。过滤器大小为8、4和2的几个卷积层在一维密集层中展平之前降低了子网格的维数。[0022]本发明采用aβ(1-42)纤维体蛋白为实例,采用上述方法对其活性口袋进行预测,得到结果。(附图1至图4)并依照该结果进行探针设计。活性位点集中在蛋白纤维体的空腔中。[0023]针对活性位点的探针设计:[0024]探针adop结构式如下:[0025][0026]探针adop的合成路线如下:[0027][0028]化合物1:将2,5-二溴呋喃(4.5g,20mmol),二甲胺(1.1g,24mmol),2,5-二甲基苯硼酸(3.6g,24mmol),csco3(9.1g,28mmol),binap(370mg,6mmol),pd(oac)2(60mg,3mmol)溶于甲苯,110℃反应过夜。反应完成后,将反应溶液冷却至室温,过滤除去沉淀物,减压浓缩滤液。粗产物通过硅胶柱色谱纯化,得到相应的产物1(2.0g,9.2mmol,46%)。1hnmr(500mhz,chloroform-d)δ7.23-7.19(m,1h),7.17-7.06(m,3h),6.87(d,j=7.5hz,1h),3.08(s,5h),2.46(d,j=1.1hz,3h),2.41(d,j=0.9hz,2h).[0029]化合物2:将seo2(1.1g,10mmol)溶解在1,4-二氧六环/h2o(10∶1,v/v)中,并在60℃下加热30min。加入化合物1(2.1g,10mmol)并在80℃下搅拌4h。反应完成后,将反应产物冷却至室温,过滤除去沉淀物,减压浓缩滤液。粗产物通过硅胶柱色谱纯化,得到相应的醛2(1.1g,5mmol,50%)。1hnmr(500mhz,chloroform-d)δ9.98(s,1h),7.96(d,j=1.6hz,2h),7.77(dd,j=7.6,1.5hz,2h),7.37(dq,j=7.4,1.0hz,2h),7.12(d,j=7.5hz,2h),6.89(d,j=7.5hz,2h),3.09(s,9h),2.45(d,j=0.9hz,5h).[0030]化合物3:将异佛尔酮(6.9g,50mmol),丙二腈(3.3g,50mmol)溶解在无水乙醇中并加入及哌啶(490μl,5mmol)在80℃下搅拌过夜。反应完成后,将反应溶液冷却至室温,减压浓缩滤液。粗产物通过硅胶柱色谱纯化,得到化合物3(7.6g,41mmol,822%)。[0031]化合物4:将化合物2(2.3g,10mmol)溶解在无水乙醇中并加入化合物3(1.9g,10mmol)及哌啶(98μl,1mmol)在80℃下搅拌过夜。反应完成后,将反应溶液冷却至室温,减压浓缩滤液。粗产物通过硅胶柱色谱纯化,得到最终产物4(3.1g,7.8mmol,78%)。1hnmr(500mhz,acetone-d6)δ7.50(d,j=1.4hz,1h),7.23-7.14(m,5h),6.79(d,j=7.5hz,1h),6.41(q,j=1.0hz,1h),3.10(s,4h),2.48(d,j=1.1hz,2h),2.45-2.40(m,4h),1.02(s,4h).[0032]探针hcop的氢谱:[0033]见附图5[0034]探针hcop的碳谱:[0035]见附图6[0036]探针adop与aβ(1-42)与预测的活性位点对接结果:[0037]采用autodock4及逆行对接模拟,得到结果附图3至图5[0038]探针adop的体外应用说明:[0039]体外活性的测试:使用dmso配制adop浓储母液(10nm),体外活性测试一律于200ul终体积的pbsbuffer(包括2%dmso,10umhcop)中进行,荧光测试采用hitachif7000荧光光谱仪。激发:450nm,发射:615nm.紫外吸收测试采用hitachiuv2550.选择性,分别选取hsa和bsa进行测试。ph影响情况,采用上述体系,并将pbs置换为不同ph值的缓冲溶液。附图说明[0040]图1是本发明实例的深度学习预测活性位点site1图[0041]图2是本发明实例的深度学习预测活性位点site2图[0042]图3是基于深度学习预测的活性位点site1与配体对接图[0043]图4是基于深度学习预测的活性位点site2与配体对接图[0044]图5是本发明探针adop的核磁氢谱示意图[0045]图6是本发明探针adop的核磁氢谱示意图[0046]图7是本发明探针adop对aβ纤维体的浓度剃度响应测试示意图[0047]图8是本发明探针adop选择性测试示意图[0048]图9是deepsite的内部dcnn架构图[0049]图10是基于深度学习构建蛋白探针的方法流程图。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1