一种新颖分子结构表征方法的设计及应用的制作方法

文档序号:6461062阅读:245来源:国知局

专利名称::一种新颖分子结构表征方法的设计及应用的制作方法
技术领域
:本发明涉及一种分子定量结构-性质/活性关系研究方法,特别是一种新颖分子结构表征方法的设计及应用方法。
背景技术
:近年来,新化合物不断出现,其数量正以惊人速度不断增长,然而,分子结构尤其是三维结构的实验测试技术进展缓慢,已越来越难以跟上新分子爆炸式增长的速度,数以万计的分子结构等待测试,同时,要对大量分子的性质或生物活性等进行逐一评价,无疑是不现实和不必要的。定量结构-性质/活性关系(QSP/AR)则为研究分子的结构-活性/性质关系提供一个重要的工具。QSP/AR是采用数学模型来描述分子性质/活性与结构间的定量依赖关系,进而预测新化合物的性质/活性,并指导分子设计。现在QSP/AR的研究内容涉及定量结构毒性相关、定量结构热力学函数相关、定量结构谱学性质相关、定量结构保留指数相关、定量结构药代动力学相关等诸多方面。分子结构表征是QSP/AR研究的重要一环,如何构建有效的结构表征方法,提取与分子性质/活性密切相关的结构信息,对于QSP/AR研究至关重要。
发明内容有鉴于此,为了解决上述问题,本发明提供了一种新颖分子结构表征方法,该方法能够用于分子定量结构-性质/活性关系研究,进一步为设计具有特定性质/活性分子提供方法借鉴。本发明的目的是这样实现的一种新颖分子结构表征方法的设计及应用,包括如下步骤a)定义原子类型,将原子按其所处周期表的主族分为5类,再把不同主族中的原子按其杂化状态细分为10类;b)将原子相对碳原子的鲍林电负性大小定义为原子相对电负性;c)将连接两原子最短路径中所有化学键相对键长之和定义为原子相对键长;d)根据库仑定律计算io类原子间的相互作用,从而定义分子电性杂化作用矢量。进一步,在于步骤a)具体包括如下步骤将有机物中的常见原子按其所处元素周期表中IA,IVA,VA,VIA,VIIA主族分为5类,再把不同主族中的原子按其杂化状态细分为10类;进一步,步骤b)具体包括如下步骤使用原子的鲍林电负性代替其实际净电荷数,再将原子相对碳原子的鲍林电负性大小规定为各原子的相对电负性;进一步,步骤c)具体包括如下步骤将原子的作用距离看作是连接它们的最短键距,而忽略其他连接路径,将碳碳键长作为标准键长,将原子间化学键的键长与其比值定义为相对键长,进一步将分子中原子相对^:长定义为连接两原子最短路径中所有化学键原子相对键长之和;进一步,步骤d)具体包括如下步骤对于在环中处于共轭状态的系列原子,都将其看作是spZ杂化状态处理,从而根据库仑定律计算IO类原子间的相互作用,最多可有10x(10+l)/2=55项,从而将该作用项定义分子电性杂化作用矢量。本发明的一种新颖分子结构表征方法的设计及应用方法,其中提出的分子电性杂化作用矢量具有表征能力强、使用操作方便、物化意义明显及拓展性能好的优点;基于分子电性杂化作用矢量方法表征多组有机分子的结构,建立的定量结构-谱学性质关系模型可以很好的预测分子的相关谱学性质,分析分子构本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。具体实施例方式以下将对采用本发明的方法用于分子定量结构-谱学性质关系研究为例进行详细的描述,包括以下步骤a)定义原子类型,将原子按其所处周期表的主族分为5类,再把不同主族中的原子按其杂化状态细分为10类;为了区分不同原子所处的不同微环境。有机分子中包含的常见原子为H、C、N、O、S、F、Cl、Br、I等其大都处于元素周期表中IA,IVA,VA,VIA,VIIA族。根据元素周期表中族的定义,同一族元素具有相似的化学性质,由此将有机物中常见原子分为5类(表1)。在上述分类的基础上进一步把不同主族中的原子按其杂化状态细分为10类(表2)。表l按元素周期表划分的5类原子<table>tableseeoriginaldocumentpage5</column></row><table>78910N(sp),P(sp)0(sp3),S(sp3)0(sp2),S(sp2)F,Cl,Br,I7-77-88-87-98-99-97-108-109-1010-10b)将原子相对碳原子的鲍林电负性大小定义为原子相对电负性;将分子体系中的原子看作是没有体积但带有电荷的质点,原子之间通过化学键传递电性而发生相互作用。电负性是指原子在分子中吸引电子能力的相对大小,其在一定程度上反映了分子内部电荷分布的情况。本发明使用原子的鲍林电负性代替实际净电荷数,进一步规定各原子的原子相对电负性值,即该原子相对碳原子的电负性大小。各类原子的鲍林电负性及其相对电负性大小列于表3中。表3原子的鲍林电负性和相对电负性原子鲍林电负性相对电负性原子鲍林电负性相对电负性H2.200.8627Fe1.900.7451C2.55l扁0Na0.900.3529Si1.900.7451K0.800.3137N3.041.1922Mg1.200.4706P2.190.8588Mn1.500.5882As2.000.7843Cu2.000.784303.441.3490Zn1.600.6275S2.581.0118Al1.500.5882Se2.450.9608Cr1.600.6275F3.981.5608Co1.800.7059Cl3.161.2392Ca1.000.3922Br2.961.1608Al1.500.5882I2.661.0431B2.000.7843c)将连接两原子最短路径中所有化学键相对键长之和定义为原子相对键长;分子中各原子是通过化学键连接起来的,而原子相互作用是随其连接距离的增加而迅速减小的。故可将原子的作用距离看作是连接它们的最短键距,而忽略其他连接路径。为了达到数据统一,仿照原子相对电性的处理方法,将碳-碳作为标准键长,而其他化学键的键长与其比值就为相对键长。进一步将分子中厚子相对键长定义为连接两原子最短路径中所有化学键相对键长之和。有机化合物中一些常见的化学键实际键长和相对键长列于表4。表4有机化合物中常见化学键的键长和相对键长<table>tableseeoriginaldocumentpage7</column></row><table>"-为共轭键;^在呋喃中;c在'塞吩中;"在嘧啶中;£在硝基中;7在哒。秦中;^在吡唑中d)根据库仑定律计算10类原子间的相互作用,从而将该作用项定义分子电性杂化作用矢量;根据库仑定律计算表2中IO类原子间的相互作用最多可有10x(10+l)/2=55项,需要注意的是,在表2的划分方案中,对于在环中处于共轭状态的系列原子,都将其看作是sp"杂化状态处理。计算公式如下上式中A与/代表原子所属种类;^iM为原子相对电性大小;^iB"是指从/原子到/原子所经历最短^各径上各个化学4走相对#:长之和。将上述得到的描述子定义为分子电性杂化作用矢量。下面以乙醇为例详细说明分子电性杂化作用矢量的计算过程。其分子结构和原子编号见结构式1。根据表2常见原子的分类方法,该分子中包含了H、C、O三类原子,且C、O原子均为spS杂化类型,因此按照(l)式除去没有意义的全零项后,计算得到5个非零描述子。计算方法如下对于碳-氧原子相互作用包括l-3号和2-3号原子作用情况,可以表达为<formula>formulaseeoriginaldocumentpage8</formula>.(2)同理可以计算出剩下4个描述子^-1=0.3647,v丄—2=5.3364,v丄f4.2953,v2.2=1.0000。其中Vm表示第1类原子(H原子)与第1类原子(H原子)相互作用项;vw对应于第1类原子(H原子)与第2类原子(spg杂化C原子),以此类推。<formula>formulaseeoriginaldocumentpage8</formula>结构式l乙醇的分子结构分子电性杂化作用矢量在多类有机物离子迁移谱中的应用实例以下将分子电性杂化作用矢量分别对25种烷烃、23种芳香烃、22种脂肪醇、30种醛和酮及35种饱和羧酸酯共5类有机物的结构进行表征并与其约化迁移常数Ko建立多元线性回归模型,从而-险证分子电性杂化作用矢量在分子定量结构-谱学性质关系研究的有效性。①与烷烃约化迁移常数《o关联由于烷烃中只包含2类原子即H原子和sp3杂化C原子,因此按(l)式计算方法除去全零项后,可得到3个描述子,采用多元线性回归方法与25种烷烃约化迁移常数建立3参数回归才莫型Ml如下K(F(2.353土0.053)+(0.040土0.014)巧扁丄-(0.022土0.004)-Vh2+(0.020土0.010).V2.2(3)模型相关统计量为复相关系数(i)为0.915,标准差(SD)为0.044,留一法交互检验的复相关系数(icv)和标准差(SZ)cv)分别为0.792和0.067。进一步对模型进行回归诊断,三个变量的t绝对值均大于2,而膨胀因子值分别为1.909、6.733、5.247,远低于10.000的标准,因此可以认为模型不存在多重共线性问题。模型中三个变量Vw、力-2和v2—2分别表示烷烃分子中H原子与H原子、H原子与sp3杂化C原子相互作用项以及sp3杂化C原子与sp3杂化C原子之间的相互作用项。②与芳香烃约化迁移常数i^关联所获取的23个芳香烃包括苯及苯的衍生物,这类化合物分子结构的特点是苯环上碳原子均为spS杂化且形成共轭大键。根据表2常见原子分类方法,分子中包含了3类原子即H原子、spS杂化C原子和spZ杂化C原子,故按(l)式计算,除去全零项后得到6个描述子,通过多元线性回归方法得到模型M2:K(f(2.156土0.100)-(0.209土0.088).vw+(0.062土0.025)'巧—2+(0.001土0.011).vw(0.209土0.068).v2-2-(0.055±0.026).v2.3-(0.017±0.008)-v3.3(4)相关统计量为i=0.926,5£>=0.053,icv=0.787,Si)cv=0.086。对模型进行回归诊断,模型中6个变量的f绝对值均大于2且不存在明显的多重共线性问题。与烷烃分子相比,芳香烃考虑了spZ杂化C原子与spS杂化C原子以及SpZ杂化C原子之间相互作用项。其中变量v2-2对模型的影响较显著,表明苯环外侧链烷基spS杂化的C原子间相互作用项对单环芳烃约化迁移常数影响显著。③与脂肪醇约化迁移常数K。关联在分子结构上,脂肪醇可以看作是脂肪烃分子中氢原子被羟基-OH取代而成,醇分子中O原子外层电子为spS杂化。脂肪醇分子中包含了3类原子分别是即H原子、spS杂化C原子和spS杂化0原子,故按式(l)计算得到5个非零描述子,采用多元线性回归方法建立M3模型如下Kf(3.668土1.034H0.312土0.122).i^-(0.178土0.045)-Vl2-(0.464土0.268).vl8+(0.701土0.201)-v2-2+(0.398±0.166)-v2-8(5)相关统计量i=0.978,52)=0.042,icv=0.949,SZ)cv二0.064。由方程可知进入模型M3的5个变量中,对约化迁移常数影响较大的是变量^2.2和v2_8,即sp3杂化C原子之间以及spS杂化C原子与spS杂化O原子相互作用项,同时这两个变量与约化迁移常数呈现正相关,即提高这两项的取值可以增加约化迁移常数。可以看到脂肪醇分子中烷基结构、碳原子数目以及羟基所处位置对其约化迁移常数有显著影响。与脂肪族醛和酮约化迁移常数Ko关联考虑到这两类化合物分子结构中均包含羰基C=0,故将其放在一起进行讨论,羰基上C原子为spZ杂化且与氧原子形成p键。首先将30个脂肪族醛、酮的约化迁移常数与其描述子间建立8参数回归模型如下Ko-(2.648土1.153)+(0.092土0.050).v!.r(0.016土0,007)力.2+(0.825土0.428)-vl3-(1.657土0.478).vl9+(0.005土0.021).V2.2+(1.325土0.944)-V2—3-(1.373±1.401).v2.9-(0.806±0.406)'v3-9(6)相关统计量为i=0.987,Si)=0.029,icv-0.972,>Si)cv=0.043。经回归i貪断发现,变量vw和Vl-9的膨胀因子值较大(分别为4774.074和9875.320),即这两个描述子存在严重的多重共线性问题。由于多重共线性的存在会影响模型的稳定性能,使之对外部样本的预测能力降低,因此,考虑剔除不显著变量后重建模型。通过逐步回归筛选变量,只引入对模型相关的变量,最终得到3参数模型M4:^f(2.417土0,045)隱(0,008土0.002).力.2-(0.146土0.017)!.3-(0.935土0.536).v2.9(7)统计结果为"=0.978,^£>=0.034,icv二0.971,SZ)CV=0.039。再次对M4进行回归诊断发现3个变量的f绝对值均大于2,而膨胀因子值表现为显著降低。从进入模型的3个变量可知,分子结构中具有代表性的原子间相互作用在模型中均有体现,这说明分子中与羰基相连的烷基结构及烷基上spS杂化C原子与羰基上C、O原子的相互作用对脂肪族醛、酮的约化迁移常数有显著影响。与羧酸酯约化迁移常数K。关联从文献中取得35个羧酸酯的分子结构,按照表2分类方法,该类分子包含了5种原子即H原子、spS杂化C原子、spS杂化C原子、spS杂化0原子和sp2杂化O原子。首先通过多元线性回归技术建立12参数回归模型如下iC(P(3.792土0.230)陽(0.068土0.030).vw+(0.005土0.004)力.2+(0.659土0.125).V2陽3-(0.110土0.192)'vl8-(3.240土0.602)'vl9-(0.035土0.009).V2.2-(0.091土0.023).V2.3+(0.072土0.031)'v2.8+(1.583±0.263).v2.9-(0.036±0.029).v3.8-(0.078±0.051).v3.9+(0.602±0.368).v8-9(8)该模型相关统计量为^=0.993,SD=0.030。同时对才莫型使用留一法进行交互检验,但得到交互校验复相关系数icv为负值,说明模型可能存在严重的多重共线性问题,因此有必要通过逐步回归进行变量筛选,当引入变量数达到4时,留一法交互才全验的复相关系数及标准偏差Si)cv分别达到最大值(0.981)和最小值(0.042),得到的^^莫型M5如下Kf(2.837土0.159)+(0.494土0.091).Vl3-(2.529土0.392).vl9-(0.026土0.003).V2.2+(1,169土0.192).v2-9(9)可以看到模型M5在大大降低复杂度的情况下,模型拟和复相关系数i及交互检验复相关系数icv几乎没有减少。进一步分析模型的内部结构,对M5进行回归诊断发现4个变量的f值分布为5.426、-6.456、-9.104和6.078,方差膨胀因子值分布为10.005、9.150、6.706和9.484,因此可以认为该模型不存在多重共线性及变量不显著问题。分析4个变量发现,它们分别代表了H原子与spZ杂化C原子、H原子与spZ杂化0原子、spS杂化C原子之间以及spS杂化C原子与羰基上spZ杂化0原子的相互作用项。其中第9类原子(即spZ杂化0原子)与第1类原子(H原子)相互作用所得变量vl9与约化迁移常数呈现负相关,而第9类原子与spS杂化C原子相互作用所得的变量^9与约化迁移常数呈现正相关。以上5个模型的相关统计结果表明,用分子电性杂化作用矢量描述子对烷烃、芳香烃、脂肪醇、脂肪族醛和酮多类有机化合物进行结构表征,所建模型均具有较好的稳定性和估计能力。为了进一步考察分子电性杂化作用矢量对多类有机物的综合结构表征能力,同时验证模型对外部测试集样本的预测能力,将上述5类样本共135个有机物分为训练集和测试集两部分。为了使测试结果更具可信度,分别从5类有机物中随机选取7个分子共计35个样本进入测试集,并由剩下100个样本作为训练集建立模型。考虑到多元线性回归过程中经常存在着变量不显著及多重共线性等问题,采用逐步回归进行变量4光选,根据有进有出的原则,按费歇尔显著性检验依次引入变量,以100个训练集样本所建5参数回归模型M6如下Ko-(2.301土0.022)-(0.004土0.001)-v工-2隱(0.022土0.001)-力-3-(0.107土0.009)-v3-8隱(0.066土0.004).vl8陽(0.030土0.005》V2-2(10)M6模型相关统计量为_R=0.942,icv=0.923,SZ)CV=0.066。采用该模型对测试集35个样本进行预测,所得预测值的统计结果为i=0.926和为0.069。对模型进行回归诊断发现5个变量的f绝对值均大于2,方差膨胀因子值分别为9.964、2.262、1.527、10.136、1.981,因此可以i人为才莫型不存在多重共线性问题及变量不显著。由此可见使用分子电性杂化作用矢量描述子建立的多类有机物离子迁移语约化迁移常数预测模型具有较好的稳定性及预测能力。以上所述仅为本发明的优选实施例,并不用于限制本发明,显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。权利要求1.一种新颖分子结构表征方法的设计及应用,其特征在于包括如下步骤a)定义原子类型,将原子按其所处周期表的主族分为5类,继而把不同主族中的原子按其杂化状态细分为10类;b)将原子相对碳原子的鲍林电负性大小定义为原子相对电负性;c)将连接两原子最短路径中所有化学键相对键长之和定义为原子相对键长;d)根据库仑定律计算10类原子间的相互作用,从而定义分子电性杂化作用矢量。2.根据权利要求1的一种新颖分子结构表征方法的设计及应用,其特征在于步骤a)具体包括如下步骤将有机物中的常见原子按其所处元素周期表中IA,IVA,VA,VIA,VIIA主族分为5类,再把不同主族中的原子按其杂化状态细分为10类。3.根据权利要求2的一种新颖分子结构表征方法的设计及应用,其特征在于步骤b)具体包括如下步骤使用原子的鲍林电负性代替其实际净电荷数,再将原子相对碳原子的鲍林电负性大小规定为各原子的相对电负性。4.根据权利要求3的一种新颖分子结构表征方法的设计及应用,其特征在于步骤c)具体包括如下步骤将原子的作用距离看作是连接它们的最短键距,而忽略其他连接路径,将碳碳键长'作为标准键长,将原子间化学键的键长与其比值定义为相对键长,进一步将分子中原子相对键长定义为连接两原子最短路径中所有化学键原子相对键长之和。5.根据权利要求1至4中任一项的一种新颖分子结构表征方法的设计及应用,其特征在于步骤d)具体包括如下步骤对于在环中处于共轭状态的原子,都将其看作是spZ杂化状态处理,根据库仑定律计算10类原子间的相互作用,最多可有10x(10+l)/2=55项,从而定义该作用项为分子电性杂化作用矢量。全文摘要本发明属于分子定量结构-性质/活性关系研究方法领域。本发明公开一种新颖分子结构表征方法的设计及应用,包括如下步骤a)定义原子类型,将原子按其所处周期表的主族分为5类,再把不同主族中的原子按其杂化状态细分为10类;b)将原子相对碳原子的鲍林电负性大小定义为原子相对电负性;c)将连接两原子最短路径中所有化学键相对键长之和定义为原子相对键长;d)根据库仑定律计算10类原子间的相互作用,从而定义分子电性杂化作用矢量。本发明的分子结构表征方法具有物化意义明确、结构表征能力强、操作简便及拓展性能好的优点,用于多类分子的定量构谱关系研究获得了成功,也可以用于相关领域的分子结构-性质/活性关系研究等。文档编号G06F19/00GK101350040SQ20081007017公开日2009年1月21日申请日期2008年8月25日优先权日2008年8月25日发明者留何,李志良,梁桂兆申请人:重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1