本发明属于质谱及化学分析领域,具体设计一种将电子轰击电离(ei)源质谱库中低分辨质谱信号转化为高分辨质谱信号的方法,同时将高分辨信号用于大气有机污染物高通量筛查。
背景技术:
1、经济的快速发展和城市化导致了大量的污染物排放到大气中,大气污染日益严重,已经成为全球性的污染问题。大气污染中包含种类繁多的有机物,包括多环芳烃、卤代烃、醛类、醇类、醚类等化合物,种类多达几千种。各种污染物在大气中发生复杂的化学/物理过程,相互作用和影响。因成分复杂且多变,大气中有机污染物的种类尚未摸清,对其开展全面筛查有助于了解大气污染情况。
2、目前,国内外有机污染物监测主要以靶向分析为主,其针对的目标物有限,不同研究报道中分析的有机污染物种类在几十至上百种,难以实现大气有机污染物的全面筛查。近年来,随着高分辨质谱仪器的发展,非靶向和高通量筛查方法也得以发展。筛查过程主要利用高分辨质谱测得信号与大型质谱库比对,获得相似性较高的备选分子。由于目前公开的大型质谱数据库(如nist数据库)均为低分辨库,比对过程需将测得高分辨信号降维为低分辨,造成备选分子数量多,筛选较困难,筛选结果假阳性率高等问题。高分辨质谱信号能够更加准确的表征分子的结构信息,但由于大气中很多有机污染物难以获得标样,因此目前只能获取少量大气有机污染物的高分辨质谱图。因此,发展一种不基于标准样品的高分辨库建立方法是研究大气中有机污染物亟待解决的关键技术问题。
3、在质谱分析中,有机物分子在ei电离源中经电离发生裂解反应,产生不同的碎片离子,在质谱图中以特征指纹峰的形式体现。因此,根据已有的低分辨质谱图可以推算各信号峰所对应碎片可能的化学式。一般认为ei电离源裂解反应是电子和有机分子的单分子反应,因此理论上碎片化学式中元素的种类和个数会低于分子,所以各信号对应的化学式数量取决于分子的大小和结构的复杂程度,若能从中推理计算出正确化学式,根据化学式中包含的原子数目和种类的高精度质量,就能够通过计算得到该碎片相应的高分辨质谱信号。因此,排除冗余并选出正确的化学式,是质谱信号从低分辨升级为高分辨信息的关键和技术难点。部分有机物质谱裂解规律可以辅助排除冗余化学式,如“internationaljournal of mass spectrometry and ion physics,1981,38(1):79-90”发现烷烃类物质在ei电离源中主要断裂非氢键,裂解过程几乎不改变其结构的不饱和度。以往研究中,不饱和度常用来表征分子结构特点。探讨质谱中碎片与原分子的不饱和度关系,可以一定程度上表征裂解过程中化学结构的变化规律。但是,目前尚未有基于低分辨质谱信息进行高分辨质谱信息解析的研究报道。此外,谱图中信号的丰度关系也能体现碎片相应的元素个数,部分研究利用该规律帮助非靶向筛查分析。
4、然而,并非所有冗余化学式都能通过简单规律排除,为筛选出正确的化学式就不得不考虑分子的具体裂解过程。裂解过程由断键位置和反应机理共同决定,其均随具体的化学结构的不同而变化。已有裂解规律难以覆盖大量的有机结构,目前没有明确的规则可以直接判断分子的裂解途径。由于相似的化学结构一般会遵循相似的裂解途径,可以利用已知裂解过程进行类比推测。探究类比的相似性条件与推测方法是实现该方法流程化的重要步骤。但是,已知的裂解过程极为有限,该类比方法难以覆盖复杂或少见的化学结构。
5、利用量子化学计算方法,从电子分布来理解化合物的结构、性质以及键断裂所涉及的能量变化,可以解析和理解各类有机化合物质谱的不同的裂解机理。文献“journal ofcheminformatics,2016,8(1):1-16”从键解离能角度判断有机分子裂解过程。虽然,有机分子质谱裂解一般遵循能量最低原则,但是裂解反应还受到分子中官能团得失电子能力、共价键电子云密度等因素的综合影响,仅以单一参数解析分子裂解规律并不全面,对质谱信号的解析正确率有待提升。“journal of mass spectrometry,2018,53(11):1104-1115”从键稳定性和反应焓角度分析裂解过程,相比于从有限的候选碎片化学式中选出正确化学式这一目标,其考虑了过多裂解途径,整个计算推理过程较为繁琐,计算量比较大,降低了方法的可行性和推广性。目前,尚缺少明确且便捷的量子化学计算方法的流程用于质谱信号的计算解析。
6、综上,对于大气中高达几千中的有机污染物分子,虽然具有低分辨的质谱信息,但是仅根据目前已知的质谱裂解规律难以得到相对应的碎片化学式。进一步探究不同结构的裂解规律、有效利用已知裂解途径类比、从电子分布来分析有机结构的裂解过程与机理,能够从不同层面实现低分辨信号向高分辨信息的正确注释。单一层面的分析方法难以同时实现分子覆盖面广和计算量可控,本发明通过耦合分子裂解过程的不饱和度规律、分子裂解相似性分析和量子化学计算等方法,综合各方法的优势,实现大气有机污染物的低分辨质谱信号升级,并利用高分辨质谱信息进一步设计了筛查流程,克服低分辨谱图匹配的假阳性高的问题。
技术实现思路
1、本发明提供了一种基于已有低分辨质谱库构建高分辨质谱信号库的方法。该方法设计流程,综合利用了化合物裂解的不饱和度规律、同位素丰度比、相似结构类比方法以及量子化学计算方法,将低分辨质谱信号注释为碎片离子化学式,然后计算出相应高分辨质谱信号并统计建库。将该库运用于大气有机污染物的筛查可减少假阳性结果,缩短分析时间。该方法为高分辨质谱库的构建与应用提供新的思路与技术支撑。
2、本发明的技术方案:
3、一种基于低分辨质谱库构建大气有机污染物高分辨质谱库的集成计算方法,包括基础数据收集、基于低分辨质谱图注释构建高分辨质谱信号库(见图1)和高通量筛查(见图6);
4、(1)基础数据收集
5、(1.1)收集目标分子的名称、分子式、cas码、smiles码、低分辨质谱图,统计目标分子的低分辨质谱图中丰度大于基峰(基峰为质谱图中最高峰)15%的特征峰的丰度和质荷比,利用以上信息构建目标分子的低分辨质谱信号库;
6、(1.2)在文献、书籍或公开资料中收集各类有机分子的质谱裂解途径,将有机分子称为参考分子;当参考分子的质谱裂解机理是i断裂时,收集参考分子的名称、smiles码、中性丢失化学式、中性丢失单位分辨率的道尔顿质量和裂解机理;当参考分子的质谱裂解机理不是i断裂时,收集参考分子的名称、smiles码、碎片离子化学式、碎片离子单位分辨率的道尔顿质量和裂解机理;将收集到的信息整理为参考数据库;
7、(2)基于低分辨谱图注释构建高分辨质谱信号库
8、(2.1)计算候选碎片离子化学式:利用原子精确质量表,计算步骤(1.1)构建的低分辨质谱信号库中,各目标分子特征峰所对应的候选碎片离子化学式需满足两个条件:候选碎片离子化学式的质量与特征峰的质荷比误差小于0.5;候选碎片离子化学式中原子的种类和个数小于等于其分子;此时,各特征峰对应的候选碎片离子化学式中同时包含该特征峰真实碎片离子化学式以及错误的冗余碎片离子化学式;
9、(2.2)利用同位素丰度比规律去除冗余的碎片离子化学式:对包含氯或溴原子的目标分子,根据步骤(1.1)中收集的低分辨质谱信号库中的特征峰丰度,判断特征峰对应碎片离子中应含有的氯或溴原子个数,删除步骤(2.1)所得该特征峰的候选碎片离子化学式中,氯或溴原子个数与判断不符的冗余候选碎片离子化学式;
10、(2.3)利用不饱和度规律去除冗余的候选碎片离子化学式:对以下两种情况的候选碎片离子化学式进行删除:1)候选碎片离子化学式不饱和度小于0;2)候选碎片离子化学式不饱和度减去3.5后仍大于其对应目标分子的不饱和度;
11、
12、其中,ω表示不饱和度,n4表示正四价元素(如:c、si)的个数,n3表示正3价元素(如:n)的个数,n1表示正1价元素(如:h、cl)的个数。
13、(2.4)利用相似分子结构类比方法选择正确碎片离子化学式(见图4):利用maccs分子指纹与tanimoto相似性系数结合的相似度计算方法表征分子之间的相似程度;计算步骤(1.2)中参考分子与步骤(1.1)中目标分子的相似度,当分子间相似度大于等于0.75时,利用参考分子裂解结果类比目标分子的裂解结果;具体类比方式:当参考分子的裂解机理为i断裂时,使用中性丢失类比方式;当参考分子的裂解机理不为i断裂时,使用碎片离子类比方式;
14、(2.4.1)中性丢失类比方式:将步骤(1.2)参考数据库中,该参考分子的中性丢失化学式以及中性丢失单位分辨率的道尔顿质量作为参考数据进行类比;计算步骤(1.1)目标分子的低分辨质谱信号库中目标分子各特征峰相应的中性丢失单位分辨率的道尔顿质量,中性丢失单位分辨率的道尔顿质量=目标分子单位分辨率的道尔顿质量-特征峰的质荷比,从中寻找与上述参考分子相等的中性丢失单位分辨率的道尔顿质量和其所对应的特征峰;该特征峰对应的碎片离子化学式=目标分子式-参考中性丢失化学式;
15、(2.4.2)碎片离子类比方式:将步骤(1.2)参考数据库中,该参考分子的碎片离子化学式以及相应单位分辨率的道尔顿质量作为参考数据进行类比;关注步骤(1.1)目标分子的低分辨质谱信号库中目标分子各特征峰相应的质荷比,并从中寻找与参考碎片离子单位分辨率的道尔顿质量相同的质荷比和其所对应的特征峰;该特征峰对应的碎片离子化学式=参考碎片离子化学式;
16、(2.5)利用量子化学计算方法选择正确碎片化学式(见图5)
17、(2.5.1)使用rdkit软件包中的子结构搜索功能将步骤(1.1)中的目标分子按照官能团分类;利用步骤(1.1)的目标分子的低分辨质谱信号库,统计在同类目标分子中出现频率较大的特征峰质荷比;选择含有此类的特征峰质荷比较多的目标分子作为计算对象;
18、(2.5.2)优化构型:使用gaussian 09软件,基于密度泛函理论,在b3lyp/6-31+g(d,p)的水平上,对步骤(2.5.1)所选目标分子失去一个电子后产生的分子离子,进行几何构型全优化和频率计算,并确认优化结果无虚频;
19、(2.5.3)选择正确候选碎片离子化学式:对步骤(2.5.1)所选的目标分子的特征峰,判断由步骤(2.1)计算出的候选碎片离子化学式在裂解过程中的断键位置;对某一特征峰的质荷比来说,当其对应的多个候选碎片离子断键位置一致时,计算各候选碎片离子裂解过程的反应能,选择反应能最低的碎片离子化学式作为该特征峰的注释结果;当其对应的多个候选碎片离子化学式断键位置不一致时,计算经步骤(2.5.2)优化后的分子离子中,各键的wiberg键级;选择所断键的wiberg键级综合指数最小的碎片离子化学式作为该特征峰的注释结果;为避免wiberg键级单一参数造成的错误判断,结合其他参数进一步确证:采用步骤(2.5.2)方法优化目标分子构型,结合步骤(2.5.2)所得分子离子构型,计算目标分子成为分子离子过程中的各键长的变化,在候选碎片离子化学式中,选择所断键增长更多的碎片离子化学式作为确证结果;运用自然轨道分析方法(natural populationanalysis)计算目标分子失去一个电子后产生的分子离子的自旋密度,得到分子离子的自由基位置;结合质谱裂解机理判断由自由基可能会引发的断键位置,在候选碎片离子化学式中,选择断键位置与其一致的碎片离子化学式作为确证结果;计算电离前后电荷变化,判断化学键两端原子电荷变化差较大的键为易断键,在候选碎片离子化学式中,选择所断键与易断键一致的碎片离子化学式作为确证结果;当各参数确证结果与依据wiberg键级选择的注释结果相同时,可进一步提高注释结果可信度;
20、(2.6)将步骤(2.5.3)所得结论整理入步骤(1.2)的参考数据库中,具体操作:判断步骤(2.5.3)所选碎片离子化学式的裂解机理,当其是i断裂时,计算该裂解过程产生的中性丢失化学式、中性丢失单位分辨率的道尔顿质量;当其不是i断裂时,计算该裂解过程产生的碎片离子化学式单位分辨率的道尔顿质量;按照步骤(1.2)要求,收集步骤(2.5)中所计算的目标分子以及步骤(2.5.3)所得分子裂解途径的各类信息,加入参考数据库中;
21、(2.7)计算碎片离子化学式的高分辨质荷比:经过步骤(2.2)-(2.6)处理后,当某特征峰对应的候选碎片离子化学式唯一时,利用原子精确质量表,计算该碎片离子化学式的道尔顿质量,即为该特征峰相应的高分辨率信号;
22、(2.8)利用高分辨质谱信号建库
23、入库条件:对于步骤(1.1)中任何一个目标分子来说,经过步骤(1.2)-(2.7)后,至少得到3个特征峰的高分辨质谱信号;将符合入库条件的目标分子的名称、cas码、高分辨信号整理为高分辨质谱信号库;
24、(3)利用自建高分辨质谱库进行高通量筛查(见图6)
25、采用gc-hrms测样,将样品在ei模式下进行质谱全扫描,对数据进行解卷积;利用低分辨谱库中各质谱图与解卷积后的测得谱图匹配,计算匹配参数:检索得分;选择检索得分大于600的分子为备选分子;利用保留指数对备选分子进行偏差筛选;将自建高分辨信号库中的高分辨信号与解卷积后的测得谱图中的信号匹配;去除包含在库内,但信号误差大于5ppm的假阳性备选分子;进一步分析剩余备选分子,选择低分辨谱库匹配过程中检索得分较高,且符合相应大气污染特征的分子作为筛选结果。
26、本发明的有益效果:本发明同现有技术相比,提供了一种不基于标准样品的高分辨质谱信号库建立方法。本发明使用多种方法集成,有效将目标分子低分辨质谱图中的信号转变为高分辨的信号,其与高分辨质谱测得的真实信号误差普遍小于5ppm。在大气有机污染物的高通量筛查流程中,利用自建高分辨信息,可有效排除筛选过程中由低分辨谱库匹配所得的假阳性备选分子。具体有以下优点:
27、(1)本发明利用有机分子与其质谱中碎片离子的不饱和度规律,有效去除谱图注释过程中计算出的冗余候选碎片离子化学式,操作简单,计算量低。
28、(2)本发明通过分析结构相似物质的裂解特征,设计了类比过程的条件和方法。包括选择相似度算法合理表征分子结构相似性,划定相似度阈值保证类比过程的合理性,制定快捷的类比方式。实现了该类比方法流程化。
29、(3)本发明分析了不同量子化学参数在不同情况下,对真实裂解过程的判断能力。针对特征峰的多个候选碎片离子化学式断键位置的具体情况,设计了不同的判断流程。相比于其他使用量子化学计算方法解释质谱图的工作来说,该方法流程清晰,能够实现碎片化学式的快速判断。
30、(4)本发明将多种方法集成为一个完整的流程。该流程由易到难,由普适到特殊,先排除冗余碎片离子化学式,后选择正确碎片离子化学式,尽可能节约计算量与建库时间,适用于构建大批量有机分子的高分辨质谱信号库。且本集成方法只需收集有机物低分辨质谱图,无需购买标准样品,极大的降低了高分辨质谱信号库的建库成本。
31、(5)本发明结合该高分辨质谱信号库,建立了一套高通量筛查流程,高分辨质谱信息可以有效排除部分由低分辨质谱库匹配得到的错误备选分子,提升了筛查准确率,节约分析时间,降低筛查成本。