利用碳谱数据确定长链有机化合物结构的方法及系统的制作方法

文档序号:6534840阅读:863来源:国知局
利用碳谱数据确定长链有机化合物结构的方法及系统的制作方法
【专利摘要】本发明提供一种利用核磁共振碳谱数据确定长链有机化合物结构的方法及系统,包括如下步骤:输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氘代试剂、容差值;提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表;将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时列表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据;记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数;计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度。利用本发明方法,节省研究时间,提高科研效率,节约科研成本。
【专利说明】利用碳谱数据确定长链有机化合物结构的方法及系统
【技术领域】
[0001]本发明涉及一种利用部分核磁共振碳谱数据快速确定长链有机化合物结构的方法及系统。
【背景技术】
[0002]核磁共振碳谱(Carbon-13Nuclear Magnetic Resonance, 13C-NMR)技术在上世纪70年代开始应用于化合物结构分析,碳谱数据具有精确度高,分布范围宽,重叠少,易辨认等优点,已成为确定有机化合物结构的指纹特征,迄今已积累了约5万个长链有机化合物的核磁共振碳谱数据。
[0003]有机化学研究领域中,根据核磁共振碳谱数据对分离得到的未知化合物的结构确定,一直以来都是依靠个人经验和手工查阅文献资料。个人经验需要长时间的积累,且具有较大的主观性和局限性,另外,有机化合物种类繁多,结构复杂,即使毕生从事核磁共振碳谱研究的专家,也只能精通部分化合物的碳谱特征。核磁共振碳谱数据分布于国内外500余种期刊,且跨度长达40余年,查阅起来非常困难。
[0004]利用上述常规方法,即使确定一个文献中已发表过的长链化合物的结构,也往往需要数天至数周的时间,如果文献资料不充足,还需要对该化合物进行多种波谱测试,如二维核磁共振,紫外,红外等,浪费了大量的时间和经费;对于文献中从未发表过的新长链化合物,通常需要数周至数月的时间,严重了影响了研究的速度。
[0005]对于长链有机化合物分子,侧链中常具有5个至数十个CH2基团,且彼此相连,由于化学环境相似,这些CH2的核磁共振碳谱数据相差较小,常堆积在一起,不易区分,文献中对于这些CH2的碳谱数据通常都是给出一段范围,而没有对其进行具体归属,这就导致了这类化合物的碳谱数据存在严重的残缺性。文献中,长链有机化合物的碳谱值常由两部分组成,精确碳谱数值(每个碳原子有具体的碳谱数值)和非精确碳谱数值(该部分碳原子没有具体的碳谱数值,仅给出一个范围)。如果采用常规的碳谱数据比较方法,仅能比较精确碳谱数值,即使对同一个长链有机化合物的实验数据和文献数据进行比较,得到的相似度也会非常低,不利于用计算机进行智能检索。
[0006]

【发明内容】

[0007]本发明的目的是为了解决上述问题,提供一种利用核磁共振碳谱数据快速确定长链有机化合物结构的方法及系统。
[0008]为了实现上述目的,本发明的技术方案如下:
一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,包括如下步骤:
(1)输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氣代试剂、容差值和Whma加权值;
(2)提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表;
(3)将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时列表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据;
(4)记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数,所述匹配成功的碳谱值个数分为匹配成功的精确碳谱值个数和匹配成功的非精确碳谱值个数;
(5)计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度,
【权利要求】
1.一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,其特征在于,包括如下步骤: (1)输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氣代试剂、容差值和Whma加权值; (2)提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表; (3)将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时列表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据; (4)记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数,所述匹配成功的碳谱值个数分为匹配成功的精确碳谱值个数和匹配成功的非精确碳谱值个数; (5)计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度,
2.根据权利要求1所述的方法,其特征在于,所述步骤(3)中的循环比对具体实现为:将临时表中各个碳谱数据中的各个碳谱值依次与所输入的碳谱数据进行比对,若进行比对的碳谱值为非精确值,即范围值,将此范围值中的最小值减去容差值,最大值加上容差值,得到比对范围值;若进行比对的碳`谱值为精确值,将此精确值分别减去和加上容差值,得到比对范围值;若所输入的碳谱数据落入上述比对范围值,则此碳谱值匹配成功。
3.根据权利要求1所述的方法,其特征在于,所述a的取值范围为0.4-0.8,所述b的取值范围为0.6-0.2。
4.根据权利要求1所述的方法,其特征在于,所述步骤(6)中的匹配相似度>80%时,记录该组碳谱数据对应的有机化合物的编号。
5.根据权利要求1所述的方法,其特征在于,所述容差值的取值范围为0.5-2。
6.一种利用核磁共振碳谱数据确定长链有机化合物结构的系统,所述系统包括: 输入模块,用于输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氣代试剂、容差值和whma加权值; 储存模块,建立数据库的基本单元,存放结构已知的长链有机化合物的碳谱数据、结构和名称; 处理模块,将储存模块中符合参数条件的各组碳谱数据提取,并与所输入的碳谱数据进行循环比对,记录匹配成功的碳谱值个数,根据匹配成功的碳谱值个数计算各组碳谱数据与所输入的碳谱数据的匹配相似度; 输出模块,将匹配相似度> 60%的化合物信息输出给用户; 维护模块,用于后台管理、数据的导入及维户。
7.根据权利要求6所述的系统,其特征在于,所述化合物信息包括化合物的名称,分子式,结构图及文献信息。
8.根据权利要求6所述的系统,其特征在于,所述匹配相似度的计算公式为
【文档编号】G06F19/00GK103678947SQ201410003547
【公开日】2014年3月26日 申请日期:2014年1月6日 优先权日:2014年1月6日
【发明者】马文辉, 蔡芳正 申请人:上海微谱信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1