用于识别感兴趣的肽数据的质谱分析数据的实时分析的制作方法

文档序号:442077阅读:182来源:国知局
专利名称:用于识别感兴趣的肽数据的质谱分析数据的实时分析的制作方法
技术领域
本发明的技术领域涉及分析仪器,更具体而言涉及质谱分析。
背景技术
各种分析仪器可用于分析肽、蛋白质和其他生物分子。质谱分析由于其能够以高灵敏度和快速的吞吐量处理广泛的各种生物分子而变得突出。例如,可以经由对利用串列式质谱仪获取的谱进行分析来识别蛋白质。在某些情形中,首先利用蛋白水解剂消化蛋白质以产生各种肽,然后利用串列式质谱仪分析肽以获取一系列谱。
在某些情形中,串列式质谱仪耦合到色谱系统以分析样品流中存在的生物分子。例如,样品流的连续洗脱部分可以从诸如高性能液相色谱(“HPLC”)柱之类的色谱柱流入到串列式质谱仪中,并且可以从该洗脱部分中获取一系列谱。尽管由于各种原因希望将串列式质谱仪耦合到色谱系统,但是这种配置在特定色谱法运行期间可以获取质谱分析数据的效率方面遇到了挑战。例如,通过分析从样品流的特定洗脱部分获取的谱,可能还希望从该相同的洗脱部分获取附加的谱。然而,样品流中存在的生物分子的洗脱速率可能太快而无法对串联式质谱仪进行有效的手工控制。另外,可能不希望中断样品流的流动或者中断样品流的流动是不实际的。另外,可能没有足够的材料用于进行重复分析。

发明内容
本发明提供了一种质谱分析系统。该质谱分析系统包括(a)质谱仪;和(b)连接到质谱仪的控制器。该控制器被配置用来(i)引导质谱仪获取样品流的母体离子谱;(ii)实时分析母体离子谱以确定是否满足第一评估标准;(iii)如果满足第一评估标准,则引导质谱仪获取样品流的产物离子谱;(iv)实时分析产物离子谱以确定是否满足第二评估标准;以及(v)如果满足第二评估标准,则分析产物离子谱以向产物离子谱分配标识。
本发明还提供了计算机可读介质。该计算机可读介质包括可执行指令,所述指令用来(a)对母体离子谱执行肽质量指纹搜索,以选择与母体离子谱相关联的一组质荷比;(b)以该组质荷比引导一组产物离子谱的获取;(c)对该组产物离子谱执行序列标签分析,以选择该组产物离子谱中的至少一个;以及(d)分析所述该组产物离子谱中的至少一个,以向母体离子谱分配标识。
本发明还提供了一种操作质谱分析系统的方法。该方法包括(a)获取样品流的母体离子谱;(b)分析母体离子谱以确定是否满足肽质量指纹分数标准;以及(c)如果满足肽质量指纹分数标准,则获取样品流的产物离子谱。
有利地,本发明的实施例允许对质谱分析数据进行实时分析,从而使实时分析的结果可以成为用于启动或提炼附加分析或者启动或提炼附加质谱分析数据的获取的基础。对于本发明的某些实施例,可以利用一组评估标准来实现质谱分析数据的实时分析,这组评估标准用来有效地过滤掉无关的或不感兴趣的质谱分析数据。以这种方式,可以使有价值的存储器资源和处理时间投入到实际相关或感兴趣的质谱分析数据。
本发明的其他方面和实施例也可以预期。前面的发明内容和下面的具体实施方式
并不意味着将本发明限制在任何特定实施例,而仅仅是描述本发明的某些实施例。


为了更好的理解本发明的某些实施例的本质和目的,应该结合附图参考以下详细描述。
图1图示了根据本发明实施例实现的质谱分析系统。
图2A和图2B图示了根据本发明实施例可以执行的操作。
图3图示了根据本发明实施例指示识别出的氨基酸序列中的y和b系列离子的产物离子谱。
具体实施例方式
定义下面的定义适用于相对于本发明某些实施例所述的某些元素。这些定义可以于此被同样地扩展。
这里所用的单数术语“一个”和“这个”包括复数的指示物,除非上下文明确指明。从而例如,对“控制器”的引用可以包括多个控制器,除非上下文明确指明。
这里所用的术语“组”指一个或多个元素的集合。从而例如,一组质荷比可以包括单个质荷比或多个质荷比。组中的元素也可被称为组中的成员。组中的元素可以相同,也可以不同。在某些情形中,组中的元素可以共享一个或多个公共特性。
这里所用的术语“生物分子”指生物样品中可能存在的分子。生物分子的示例包括肽、蛋白质、低聚糖、多聚糖、油脂、核酸、代谢物等等。
这里所用的术语“生物样品”指从诸如单细胞机体或多细胞机体之类的有机体中获得的、提取的、排泄的或分泌的样品。一般来说,生物样品包括一组生物分子,如一组肽或一组蛋白质。生物样品的示例包括血液;血浆;血清;尿;胆汁;脑脊髓液;水或玻璃状液;体分泌液;从脓肿或其他感染或炎症位置处获得的血液;从关节处获得的血液;任何组织或器官的一部分;原始细胞;酸性细胞;和被任何细胞、组织或器官调节的中间层。在某些情形中,可以对生物样品进行初步处理或其他样品准备过程。例如,可以利用各种蛋白水解剂中的任何一种对生物样品中存在的生物分子进行分裂或蛋白质水解,这些蛋白水解剂例如是胰岛素、内蛋白酶glu-C、溴化氰等等。作为另一个示例,可以对生物样品进行一组分离过程,如亚细胞分馏、一维电泳、两维电泳、HPLC等等。
这里所用的术语“蛋白质”指包括链接在一起的多个氨基酸的分子。一般来说,蛋白质包括多于50个氨基酸,这些氨基酸经由肽键被链接在一起。氨基酸的示例包括20种遗传编码的氨基酸,其包括丙胺酸(单字母缩写A)、精氨酸(单字母缩写R)、天冬酰胺酸(单字母缩写N)、天冬氨酸(单字母缩写D)、半胱氨酸(单字母缩写C)、谷氨酸盐(单字母缩写Q)、谷氨酸酯(单字母缩写E)、氨基乙酸(单字母缩写G)、组氨酸(单字母缩写H)、异亮氨酸(单字母缩写I)、亮氨酸(单字母缩写L)、赖氨酸(单字母缩写K)、甲硫氨酸(单字母缩写M)、苯基丙氨酸(单字母缩写F)、脯氨酸(单字母缩写P)、丝氨酸(单字母缩写S)、苏氨酸(单字母缩写T)、色氨酸(单字母缩写W)、酪氨酸(单字母缩写Y)和缬氨酸(单字母缩写V)。氨基酸的另外示例包括D-氨基酸、修饰氨基酸、氨基酸相似体、合成产生的氨基酸等等。蛋白质可以自然产生、重组产生或者合成产生。在某些情形中,可以对蛋白质进行一组翻译后修饰,如糖基化、乙酰化、磷酸化、泛素化等等。
这里所用的术语“肽”指包括链接在一起的多个氨基酸的分子。一般来说,肽包括多个氨基酸,这些氨基酸经由肽键链接在一起。肽可以自然产生、重组产生或者合成产生。在某些情形中,可以通过对蛋白质进行分裂或蛋白质水解来产生一组肽。通过分裂或蛋白质水解产生的肽一般包括2-50个氨基酸。
这里所用的术语“肽的”指与一组肽相关联或者指示一组肽。从而例如,肽数据可以包括与一组肽相关联或者指示一组肽的数据。
这里所用的术语“实时”指执行一组操作,从而基于特定定时约束产生该组操作的输出或结果。尽管操作有时在这里被称为实时执行的,但是可以预期操作的输出的产生可以有某些可检测的延迟或等待时间。例如,如果操作输出的产生速率与获取操作输入的速率相同或基本相同,则操作可以实时执行。作为另一个示例,如果操作输出的产生发生在特定的响应时间的上限内,如1秒内、0.1秒内、0.01秒内或0.001秒内,则操作可以实时执行。作为进一步的示例,如果操作的输出及时产生从而能在其发生的同时影响或控制过程,则操作可以实时执行。
首先关注图1,图1图示了根据本发明实施例实现的质谱分析系统100。质谱分析系统100包括实现为串列式质谱仪的质谱仪102。在图示实施例中,取决于要进行的质谱分析实验的特定类型,质谱仪102可以工作在各种模式中。例如,质谱仪102可以工作在质谱分析模式(“MS模式”)中以获取母体离子谱,或者工作在串列式质谱分析模式(“MS/MS模式”)中以获取产物离子谱。
如图1所示,质谱仪102包括操作用于产生离子的离子源106。取决于质谱仪102的特定操作模式,离子源106所产生的离子可以充当母体离子,母体离子被打碎以产生产物离子。在图示实施例中,离子源106利用电喷雾离子化(ESI)来产生离子。ESI的一个优点是其可以容易地与各种分离过程(例如HPLC)结合使用。如图1所示,离子源106从样品流116中存在的被分析物中产生离子。具体而言,样品流116包括分散在合适的溶剂中的生物分子。例如,生物分子可以包括通过将一组蛋白质进行分裂或蛋白质水解而产生的肽。在图示实施例中,样品流116以连续或流动方式从诸如HPLC柱之类的色谱柱(未在图1中示出)引入到离子源106中,并且样品流116的连续洗脱部分被质谱分析系统100分析,如下进一步所述。
参考图1,质谱仪102以空间串列方式实现,并且包括一对质量分析器108和112以及位于质量分析器108和112之间的碰撞池110。尽管在图1中示出了两个质量分析器108和112,但是可以预期在其他实现方式中,质谱仪102可以包括更多个或更少个质量分析器。例如,可以预期质谱仪102以以时间串列方式实现,这种情况下质谱仪102可以包括单个质量分析器。如图1所示,质量分析器108位于离子源106的下游以接收离子。取决于质谱仪102的特定操作模式,质量分析器108操作来基于质荷比选择离子,或传输所有的或基本所有的离子。碰撞池110位于质量分析器108的下游以接收离子。取决于质谱仪102的特定操作模式,碰撞池110操作来引入离子碎片以产生产物离子,或传输所有的或基本所有的离子。质量分析器112位于碰撞池110的下游以接收离子并操作来基于质荷比分离离子。质量分析器108和112可以用各种方式实现,例如利用四极质量分析器、飞行时间质量分析器、离子阱质量分析器等等实现。碰撞池110可以用各种方式实现,例如利用惰性气体基于碰撞诱导的分裂来引入离子碎片。
如图1所示,质谱仪102还包括检测器114,其位于质量分析器112的下游以接收离子。检测器114操作来检测离子丰度以获取样品流116的一组谱。例如,检测器114可以检测母体离子的丰度以获取母体离子谱,或者检测产物离子的丰度以获取产物离子谱。检测器114可以用各种方式实现,例如利用电子倍增器、闪烁计数器等实现。
参考图1,质谱分析系统100还包括控制器104,其利用任何有线或无线传输信道连接到质谱仪102,并且操作来控制质谱仪102。具体而言,控制器104取决于要进行的质谱分析实验的特定类型,而引导质谱仪102以特定操作模式进行操作。与指定特定操作模式协同地,控制器104可以指定或主动改变质谱仪102的各种获取参数,如离子源106、质量分析器108和112、碰撞池110和检测器114的获取参数。例如,控制器104可以指定或主动改变获取参数以获得特定离子化设置、特定质荷比范围、特定谱获取速率、特定信噪比、特定质量分辨率、特定片段设置、特定检测器增益等等。
如图1所示,控制器104操作为实时引擎以执行获取谱的实时分析并基于实时分析的结果引导质谱仪102以特定操作模式进行操作。有利地,控制器104通过基于实时分析的结果指定或主动改变要进行的质谱分析实验的类型,来允许质谱分析数据的自动的、依赖于数据的获取。具体而言,实时分析的结果可以成为用于启动或提炼附加分析或者启动或提炼附加质谱分析数据的获取的基础。以这种方式,控制器104提高了在样品流116的特定色谱运行期间可以获取质谱分析数据的效率。控制器104的这种能力在以下情形中尤为有用,即在样品流116中存在的生物分子的洗脱速率对于质谱仪102的有效手工控制来说太快时,在不希望中断样品流116的流动或者中断样品流116的流动不实际时,以及在没有足够的材料用以进行重复分析时。
在图示实施例中,控制器104基于一组评估标准来执行获取谱的实时分析。有利地,这组评估标准可以以分层或连续方式施加,从而有效地过滤掉无关或不感兴趣的质谱分析数据。以这种方式,可以使有价值的存储器资源和处理时间投入到实际相关或感兴趣的质谱分析数据。结果,这组评估标准通过增强感兴趣数据的获取同时减少不感兴趣数据的获取,从而允许对样品流116进行全面的分析。通过减少要存储和分析的不感兴趣数据的量,这组评估标准还有助于促进并简化样品流116中存在的生物分子的识别。
例如,在质谱分析系统100的操作期间,控制器104可以引导质谱仪102获取样品流116的特定洗脱部分的母体离子谱。随后,控制器104可以基于第一评估标准执行母体离子谱的实时分析,以确定母体离子谱是否包括感兴趣的质谱分析数据。基于母体离子谱的实时分析,控制器104可以识别出一组感兴趣的峰值,并可以选择这组峰值以获取附加的质谱分析数据。具体而言,控制器104可以引导质谱仪102获取这组峰值的一组产物离子谱。通过实时执行母体离子谱的分析,可以从与获取了母体离子谱的样品流116的相同洗脱部分中获取这组产物离子谱,从而允许对该洗脱部分进行全面分析。随后,控制器104可以基于第二评估标准执行这组产物离子谱的实时分析,以确定这组产物离子谱是否包括感兴趣的质谱分析数据。基于这组产物离子谱的实时分析,控制器104可以识别出感兴趣的那些产物离子谱,并可以选择那些产物离子谱以进行附加分析。具体而言,控制器104可以分析那些产物离子谱,以为那些产物离子谱中的每一个分配标识。基于这样分配的标识,控制器104也可以向母体离子谱分配标识。
控制器104可以用各种方式实现,例如利用计算机代码、硬连线电路或计算机代码和硬连线电路的组合实现。可以预期,控制器104可以包括计算设备,也可以与计算设备协同操作,计算设备例如是个人计算机、服务器计算机、web设备、个人数字助理产品等等。例如,结合基于特定评估标准执行的谱分析,控制器104可以与驻留在个人计算机或服务器计算机中的搜索引擎协同操作,该搜索引擎可以利用任何有线或无线的传输信道连接到控制器104。在某些情形中,控制器104可以提供用户接口以允许用户指定各种处理选项。
下面转到图2A和图2B,图2A和图2B图示了根据本发明实施例可以执行的操作。具体而言,图2A和图2B图示了可以由控制器104执行的引导质谱分析数据的自动的、依赖于数据的获取的操作。
参考图2A,控制器104首先配置质谱仪102以工作在MS模式中(方框200)。在MS模式中,离子源106从样品流116的特定洗脱部分中存在的生物分子中产生离子。具体而言,离子源106可以从洗脱部分中存在的肽中产生离子。离子源106也可以从其他类型的生物分子或从化学杂质中产生离子。随后,质量分析器108和碰撞池110传输所有的或基本所有的离子到质量分析器112,质量分析器112基于质荷比分离离子。离子最终到达检测器114,检测器114检测离子丰度以获取母体离子谱。取决于母体离子谱的特定格式,控制器104可以处理母体离子谱以促进附加分析。如图2A所示,母体离子谱以原始格式被获取,并且控制器104对母体离子谱执行各种谱处理操作,例如峰值检测、同位素族检测、电荷状态确定等等(方框202)。具体而言,控制器104首先导出峰值列表,其包括母体离子谱中存在的峰值。每个峰值可以包括强度值,强度值代表在特定质荷比时离子的丰度。随后,控制器104使用峰值列表来检测母体离子谱中存在的同位素族,然后确定每种同位素族的电荷状态。
如图2A所示,控制器104随后基于第一评估标准执行母体离子谱的实时分析,以确定母体离子谱是否包括感兴趣的质谱分析数据(方框204)。在图示实施例中,第一评估标准被用来确定母体离子谱是否包括为肽或为肽的可能性足够大的质谱分析数据。另外,第一评估标准可以对感兴趣的特定肽数据施加附加约束。这里,第一评估标准包括肽质量指纹分数标准,其被用来确定母体离子谱中存在的峰值与一组参考母体离子谱中存在的峰值的匹配程度。这组参考母体离子谱可以包括实验的或理论的肽的母体离子谱,其通过对蛋白质进行分裂或蛋白质水解而产生。如图2A所示,控制器104执行母体离子谱的肽质量指纹搜索以导出一组肽质量指纹分数,然后将这组肽质量指纹分数与阈值相比较,阈值可以由用户选定或指定。例如,阈值可以对应于表达为百分比的置信度的最小水平,如50%、60%、70%、80%、90%或95%。母体离子谱中存在的每个在阈值上导致匹配或超过阈值匹配的峰值可被识别为感兴趣的肽数据,或者具有足够可能性被识别为感兴趣的肽数据。以这种方式,控制器104可以识别出一组感兴趣的峰值,并且可以选择该组峰值以获取一组产物离子谱。有利地,肽质量指纹搜索可以被加速从而被实时执行,因而可被称为“快速”肽质量指纹搜索。肽质量指纹搜索的加速是可以实现的,因为搜索不必产生可能匹配的全面列表,而是仅被用来导出关于母体离子谱中存在哪些在阈值上导致匹配或超过阈值匹配的峰值的初步指示。从而,肽质量指纹搜索不必包括穷举数据库搜索,而是可以被限于搜索空间。在某些情形中,肽质量指纹搜索可以通过将搜索空间缩窄到可以由用户选定或指定的感兴趣的一组肽或一组蛋白质来被进一步加速。可以预期,控制器104可以提供允许用户指定特定肽或特定蛋白质的功能,例如包括特定氨基酸序列的那些肽或蛋白质;包括具有固定修饰的氨基酸的那些肽或蛋白质,如半胱氨酸的脲基甲基化;包括具有可变修饰的氨基酸的那些肽或蛋白质,如丝氨酸的磷酰基化;包括指示特定损失(如磷酸盐损失)的质量差的那些肽或蛋白质,等等。
可以预期,第一评估标准可以可替换地或相结合地包括另一种类型的评估标准以识别一组感兴趣的峰值。例如,可以基于其绝对强度值、其相对于其他峰值的强度值的相对强度值、其相对于阈值的相对强度值等等来识别特定峰值。具体而言,可以预期,可以识别母体离子谱中存在的n个最强的峰值,其中n是可由用户选定或指定的任意整数。作为另一个示例,可以基于其是包含列表中的成员或其不是排除列表中的成员来识别特定峰值。
如图2A所示,如果满足第一评估标准(方框206),则控制器104以持续格式(如数据文件的格式)协调母体离子谱的存储(方框208),然后执行附加操作,如下进一步所述。另一方面,如果不满足第一评估标准(方框206),则不需要保存母体离子谱,从而减少了要持续的质谱分析数据量。然后,控制器104确定是否要获取任何附加的母体离子谱(方框210)。这种确定例如可以基于定时约束,基于样品流116的任何剩余洗脱部分是否仍然要分析,或者基于是否应当使用不同的获取参数。如果不需要获取附加的母体离子谱(方框210),则控制器104引导质谱仪102进行结束配置。另一方面,如果要获取附加的母体离子谱(方框210),则控制器104配置质谱仪102工作在MS模式中,以从样品流116的相同或后续的洗脱部分中获取附加的母体离子谱(方框200)。有利地,控制器104可以引导质谱仪102使用不同的获取参数来获取附加的母体离子谱。以这种方式,可以从相同洗脱部分中以改进的谱特性获取附加的母体离子谱。然后,控制器104以与上述类似的方式处理附加的母体离子谱。
参考图2B,控制器104随后配置质谱仪102工作在MS/MS模式中(方框212)。具体而言,通过利用第一评估标准识别出感兴趣的峰值,控制器104引导质谱仪102以该峰值的质荷比获取产物离子谱。还可以预期,质谱仪102可以以一个质荷比范围来获取产物离子谱,这个范围包括了感兴趣峰值的质荷比。例如,可以基于包括感兴趣峰值的同位素族来确定质荷比的范围。在MS/MS模式中,离子源106从样品流116的特定洗脱部分中存在的生物分子中产生离子。具体而言,离子源106可以从已经从其获取了母体离子谱的样品流116的相同洗脱部分中存在的肽中产生离子。离子源106也可以从其他类型的生物分子或从化学杂质中产生离子。随后,质量分析器108基于感兴趣峰值的质荷比选择特定离子,该离子充当母体离子,其在碰撞池110中被打碎以产生产物离子。质量分析器112接收产物离子,并基于质荷比分离产物离子。产物离子最终到达检测器114,检测器114检测产物离子丰度以获取产物离子谱。取决于产物离子谱的特定格式,控制器104可以处理产物离子谱以促进附加的分析。如图2B所示,产物离子谱以原始格式被获取,并且控制器104对产物离子谱执行各种谱处理操作,例如峰值检测、同位素族检测、电荷状态确定等等(方框214)。具体而言,控制器104首先导出峰值列表,其包括产物离子谱中存在的峰值。每个峰值可以包括一个强度值,该强度值代表在特定质荷比时产物离子的丰度。随后,控制器104使用峰值列表来检测产物离子谱中存在的同位素族,然后确定每种同位素族的电荷状态。
如图2B所示,控制器104随后基于第二评估标准执行产物离子谱的实时分析,以确定产物离子谱是否包括感兴趣的质谱分析数据(方框216)。在图示实施例中,第二评估标准被用来确定产物离子谱是否包括为肽或具有足够可能性为肽的质谱分析数据。另外,第二评估标准可以对感兴趣的特定肽数据施加附加约束。这里,第二评估标准包括序列标签长度标准,其被用来确定产物离子谱中存在的峰值是否指示序列标签,即可能存在于肽或蛋白质中的连续氨基酸的序列。具体而言,序列标签长度标准被用来确定产物离子谱中存在的一系列峰值是否指示特定序列标签长度,即特定数目的连续氨基酸。如图2B所示,控制器104执行产物离子谱的序列标签分析以导出序列标签长度,并将该序列标签长度与阈值相比较,该阈值可由用户选定或指定。例如,阈值可以对应于最小序列标签长度,并且可以是大于或等于1的任何整数。如果序列标签分析导致出等于或大于阈值的序列标签长度,则产物离子谱可被识别为包括感兴趣的肽数据,或者具有足够可能性包括感兴趣肽数据。以这种方式,控制器104可以识别出感兴趣的产物离子谱,并且可以选择产物离子谱以进行附加分析,如下进一步所述。有利地,序列标签分析可以被加速从而被实时执行,因而可被称为“快速”序列标签分析。序列标签分析的加速是可以实现的,因为分析不必产生包括序列标签的氨基酸的全面标识,而是仅被用来导出关于产物离子谱中存在的峰值是否指示等于或超过阈值的序列标签长度的初步指示。从而,序列标签分析不必包括全面排序的确定,而是可以包括有限的排序确定以导出这种初步指示。
可以预期,第二评估标准可以可替换地或相结合地包括另一种类型的评估标准以识别感兴趣的产物离子谱。例如,第二评估标准可以被定义为确定产物离子谱是否指示可由用户选定或指定的感兴趣的序列标签。可以预期,控制器104可以提供允许用户指定特定序列标签的功能,例如包括特定氨基酸序列的那些序列标签;包括具有固定修饰的氨基酸的那些序列标签;包括具有可变修饰的氨基酸的那些序列标签;包括指示特定损失的质量差的那些序列标签,等等。
如图2B所示,如果满足第二评估标准(方框218),则控制器104执行附加操作,如下进一步所述。另一方面,如果不满足第二评估标准(方框218),则控制器104确定是否要获取任何附加的产物离子谱(方框220)。这种确定例如可以基于定时约束,基于母体离子谱中存在的任何剩余峰值是否仍然要被分析,或者基于是否应当使用不同的获取参数。如果不需要获取附加的产物离子谱(方框220),则控制器104确定是否要获取任何附加的母体离子谱,如前面结合图2A所述(方框210)。另一方面,结合图2B,如果要获取附加的产物离子谱(方框220),则控制器104配置质谱仪102操作在MS/MS模式,以从样品流116的相同或后续的洗脱部分中获取附加的产物离子谱(方框212)。有利地,控制器104可以引导质谱仪102使用不同的获取参数获取附加的产物离子谱。以这种方式,可以从相同洗脱部分中以相同质荷比但是以改进的谱特性获取附加的产物离子谱。然后,控制器104以与上述类似的方式处理附加的产物离子谱。
参考图2B,控制器104随后基于第三评估标准执行产物离子谱的分析,以确定产物离子谱是否包括感兴趣的质谱分析数据(方框222)。在图示实施例中,第三评估标准再次被用来确定产物离子谱是否包括为肽或具有足够可能性为肽的质谱分析数据。另外,第三评估标准可以对感兴趣的特定肽数据施加附加约束。这里,与第二评估标准类似,第三评估标准包括序列标签长度标准,其被用来确定产物离子谱中存在的一系列峰值是否指示特定序列标签长度。然而,第三评估标准在最小序列标签长度方面可以更为严格。如图2B所示,控制器104执行产物离子谱的全程(denovo)排序分析,以识别包括序列标签的氨基酸。结合执行全程排序分析,控制器104还导出序列标签长度,并将该序列标签长度与阈值相比较,阈值可由用户选定或指定。例如,阈值可以对应于最小序列标签长度,并且可以是大于或等于1的任何整数。如上所述,第三评估标准在最小序列标签长度方面可能更为严格,从而为第三评估标准指定的阈值可能大于为第二评估标准指定的阈值。如果全程排序分析导致出等于或大于阈值的序列标签长度,则产物离子谱可被识别为包括感兴趣的肽数据,或者具有足够可能性包括感兴趣肽数据。以这种方式,控制器104可以识别出感兴趣的产物离子谱,并且可以选择产物离子谱以进行存储,如下进一步所述。
可以预期,第三评估标准可以可替换地或相结合地包括另一种类型的评估标准以识别感兴趣的产物离子谱。例如,第三评估标准可以包括序列数据库分数标准,其被用来确定产物离子谱中存在的峰值与一组参考产物离子谱中存在的峰值的匹配程度。这组参考产物离子谱可以包括通过对蛋白质进行分裂或蛋白质水解而产生的肽的实验的或理论的产物离子谱。具体而言,控制器104可以执行产物离子谱的序列数据库搜索以导出一组序列数据库分数,然后将这组序列数据库分数与阈值相比较,该阈值可以由用户选定或指定。例如,阈值可以对应于表达为百分比的置信度的最小水平,如50%、60%、70%、80%、90%或95%。如果序列数据库搜索导致等于或超过阈值的匹配,则产物离子谱可被识别为与匹配肽或匹配蛋白质相关联,或者具有足够可能性与匹配肽或匹配蛋白质相关联。以这种方式,控制器104可以识别感兴趣的产物离子谱,并且可以选择产物离子谱以进行存储。有利地,序列数据库搜索可以被加速,从而可以被称为“快速”序列数据库搜索。具体而言,可以预期序列数据库搜索可以被充分加速以便实时执行。序列数据库搜索的加速可以通过缩窄搜索空间到感兴趣的一组肽或一组蛋白质来实现,这组肽或蛋白质可由用户选定或指定。可以预期,控制器104可以提供允许用户指定特定肽或特定蛋白质的功能,例如包括特定氨基酸序列的肽或蛋白质;包括具有固定修饰的氨基酸的肽或蛋白质;包括具有可变修饰的氨基酸的肽或蛋白质;包括指示特定损失的质量差的肽或蛋白质,等等。在某些情形中,序列数据库搜索可以通过缩窄搜索空间到包括了前述结合第二评估标准识别出的序列标签的一组肽或一组蛋白质来被进一步加速。作为另一个示例,第三评估标准可被定义为确定产物离子谱是否指示感兴趣的序列标签,感兴趣的序列标签可由用户选定或指定。可以预期,控制器104可以提供允许用户指定特定序列标签的功能,例如包括特定氨基酸序列的序列标签;包括具有固定修饰的氨基酸的序列标签;包括具有可变修饰的氨基酸的序列标签;包括指示特定损失的质量差的序列标签,等等。
如图2B所示,如果满足第三评估标准(方框224),则控制器104以持续格式(如数据文件的格式)协调产物离子谱的存储(方框226),然后确定是否要获取任何附加的产物离子谱(方框220)。另一方面,如果不满足第三评估标准(方框224),则不必保存产物离子谱,从而减少了要持续的质谱分析数据量。然后,控制器104确定是否要获取任何附加的产物离子谱(方框220)。
示例下面的示例描述了本发明某些实施例的特定方面,以向本领域技术人员说明并描述这些实施例。示例不应当被理解为限制本发明,而是仅仅提供了对理解和实践本发明的某些实施例有帮助的特定方法。
下面提供了质谱分析数据的自动的、依赖于数据的获取的工作流程的示例。
1)用户基于排除列表和包含列表中的任何一个或其两者定义第一评估标准,其可以包括一组质荷比的中断(break-off)条件或阈值。
2)用户通过指定感兴趣的氨基酸序列来定义第二评估标准。例如,用户可以使用图形用户界面来指定以下序列[质量范围]VLESXDIDDLK。其中标号X代表指定序列中的未知间隙,并且质量范围指示要在其中搜索指定序列(或其任何片段)的质荷比范围。也可以对氨基酸序列指定多个间隙,如[10-1200]VLESXDIX’LK,其中X和X’可以相同,也可以不同。
3)用户随后向实时引擎提交依赖于数据的实验结果,实时引擎实时分析质谱分析数据以识别对应于指定序列(或其任何片段)的氨基酸序列。图3图示了指示这种识别出的氨基酸序列的y和b系列离子的产物离子谱,即VLESAIANAEHNDGADIDDLK。
应当认识到,上述本发明的实施例只是以示例方式提供,本发明还包含了各种其他的实施例。例如,参考图1,可以预期,离子源106可以实现为使用其他类型的离子化过程来产生离子,例如矩阵辅助激光解吸附离子化(“MALDI”)、大气压-矩阵辅助激光解吸附离子化(“AP-MALDI”)等等。具体而言,可以预期,这里所述的某些操作可以有利地与MALDI或AP-MALDI结合使用,以促进并提高获取质谱分析数据的效率。作为另一个示例,尽管某些操作被描述为由控制器104执行,但是可以预期这些操作可以由任何实时引擎执行。这种实时引擎可以用各种方式实现,例如利用计算机代码、硬连线电路或计算机代码和硬连线电路的组合来实现。作为另一个示例,尽管某些操作被描述为实时执行,但是可以预期这些操作可以可替换地或相结合地在质谱分析数据的获取后处理期间执行。作为另一个示例,尽管参考图2A和图2B描述了三个评估标准,但是可以预期对于其他实现方式也可使用更多个或更少个评估标准。作为进一步的示例,尽管某些操作被描述为相对于样品流被执行,但是可以预期这些操作可以相对于任何样品被执行,如离散的或固定的样品。具体而言,可以预期这里所述的某些操作可以有利地与离散或固定样品结合使用,以促进并提高可以获取质谱分析数据的效率。
本发明的实施例涉及具有计算机可读介质的计算机存储产品,计算机可读介质包括用于执行一组计算机实现的操作的计算机代码或可执行指令。介质和计算机代码可以是针对本发明的目的特殊设计和构造的,也可以是公知种类的并且是计算机软件领域普通技术人员可获得的。计算机可读介质的示例包括诸如硬盘、软盘和磁带之类的磁介质;诸如只读光盘(“CD-ROM”)和全息设备之类的光学介质;诸如可光读盘之类的磁光介质;和特殊配置以存储并执行计算机代码的硬件设备,如专用集成电路(“ASIC”)、可编程逻辑器件(“PLD”)以及只读存储器(“ROM”)和随机存取存储器(“RAM”)设备。计算机代码的示例包括诸如由编译器产生的机器代码和包括由计算机利用解释器执行的高级代码的文件。例如,本发明的实施例可以利用Java、C++或其他编程语言和开发工具实现。计算机代码的另外示例包括加密代码和压缩代码。而且,本发明的实施例可以被下载为计算机程序产品,其可以经由传输信道以包含在载波或其他传播介质中的数据信号的形式从远程计算机传送到请求计算机。因此,这里所用的载波可以认为是计算机可读介质。本发明的另一个实施例可以用硬连线电路来代替计算机代码或与计算机代码相组合来实现。
尽管已参考特定实施例描述了本发明,但是本领域普通技术人员应当理解,可以在不脱离所附权利要求定义的本发明的精神和范围的前提下进行各种变化以及替换各种等同物。另外,可以进行各种修改以使特定情形、材料、物质组成、方法、操作适应本发明的目的、精神和范围。所有这些修改都应当认为落在所附权利要求的范围内。具体而言,尽管这里所公开的方法是结合以特定顺序执行的特定操作进行描述的,但是应当理解,这些操作可以被组合、细分或者重新排序以形成等同方法,而不脱离本发明的教导。因此,除非特别指出,否则这些操作的顺序和组合不是对本发明的限制。
权利要求
1.一种质谱分析系统,包括(a)质谱仪;和(b)连接到所述质谱仪的控制器,所述控制器被配置用来(i)引导所述质谱仪获取样品流的母体离子谱;(ii)实时分析所述母体离子谱以确定是否满足第一评估标准;(iii)如果满足所述第一评估标准,则引导所述质谱仪获取所述样品流的产物离子谱;(iv)实时分析所述产物离子谱以确定是否满足第二评估标准;以及(v)如果满足所述第二评估标准,则分析所述产物离子谱以向所述产物离子谱分配标识。
2.如权利要求1所述的质谱分析系统,其中所述第一评估标准被配置用来确定所述母体离子谱是否指示一组肽。
3.如权利要求1所述的质谱分析系统,其中所述控制器被配置用来通过实时比较所述母体离子谱与一组参考母体离子谱,来在(ii)中分析所述母体离子谱。
4.如权利要求1所述的质谱分析系统,其中所述控制器被配置用来在(ii)中分析所述母体离子谱以选择获取所述产物离子谱的质荷比。
5.如权利要求1所述的质谱分析系统,其中所述母体离子谱是第一母体离子谱,并且所述控制器被配置用来在不满足所述第一评估标准时,引导所述质谱仪获取所述样品流的第二母体离子谱。
6.如权利要求1所述的质谱分析系统,其中所述第二评估标准被配置用来确定所述产物离子谱是否指示一组氨基酸。
7.如权利要求1所述的质谱分析系统,其中所述控制器被配置用来通过对所述产物离子谱实时执行第一排序确定,来在(iv)中分析所述产物离子谱。
8.如权利要求7所述的质谱分析系统,其中所述控制器被配置用来通过对所述产物离子谱执行第二排序确定,来在(v)中分析所述产物离子谱。
9.如权利要求1所述的质谱分析系统,其中所述控制器被配置用来通过比较所述产物离子谱与一组参考产物离子谱,来在(v)中分析所述产物离子谱。
10.如权利要求1所述的质谱分析系统,其中所述产物离子谱是第一产物离子谱,并且所述控制器被配置用来在不满足所述第二评估标准时,引导所述质谱仪获取所述样品流的第二产物离子谱。
11.一种包括可执行指令的计算机可读介质,所述指令用来(a)对母体离子谱执行肽质量指纹搜索,以选择与所述母体离子谱相关联的一组质荷比;(b)以该组质荷比引导一组产物离子谱的获取;(c)对该组产物离子谱执行序列标签分析,以选择该组产物离子谱中的至少一个;以及(d)分析所述该组产物离子谱中的至少一个,以向所述母体离子谱分配标识。
12.如权利要求11所述的计算机可读介质,其中用来在(a)中执行肽质量指纹搜索的可执行指令包括用来识别与一组肽相关联的该组质荷比的可执行指令。
13.如权利要求11所述的计算机可读介质,其中用来在(a)中执行肽质量指纹搜索的可执行指令包括用来比较所述母体离子谱与一组参考母体离子谱的可执行指令。
14.如权利要求11所述的计算机可读介质,其中用来在(c)中执行序列标签分析的可执行指令包括用来识别与多个连续氨基酸相关联的该组产物离子谱中的至少一个的可执行指令。
15.如权利要求11所述的计算机可读介质,其中用来在(d)中分析所述该组产物离子谱中的至少一个的可执行指令包括用来对所述该组产物离子谱中的至少一个执行全程排序分析的可执行指令。
16.如权利要求11所述的计算机可读介质,其中用来在(d)中分析所述该组产物离子谱中的至少一个的可执行指令包括用来对所述该组产物离子谱中的至少一个执行序列数据库搜索的可执行指令。
17.一种操作质谱分析系统的方法,包括(a)获取样品流的母体离子谱;(b)分析所述母体离子谱以确定是否满足肽质量指纹分数标准;以及(c)如果满足所述肽质量指纹分数标准,则获取所述样品流的产物离子谱。
18.如权利要求17所述的方法,其中在(b)中分析所述母体离子谱的步骤是在不中断所述样品流的流动的情况下执行的。
19.如权利要求17所述的方法,其中在(b)中分析所述母体离子谱的步骤包括对所述母体离子谱执行肽质量指纹搜索以导出肽质量指纹分数,并将所述肽质量指纹分数与阈值相比较。
20.如权利要求17所述的方法,还包括(d)分析所述产物离子谱以确定是否满足序列标签长度标准;以及(e)如果满足所述序列标签长度标准,则分析所述产物离子谱以向所述产物离子谱分配标识。
21.如权利要求20所述的方法,其中在(d)中分析所述产物离子谱的步骤是在不中断所述样品流的流动的情况下执行的。
22.如权利要求20所述的方法,其中在(d)中分析所述产物离子谱的步骤包括对所述产物离子谱执行序列标签分析以导出序列标签长度,并将所述序列标签长度与阈值相比较。
23.如权利要求20所述的方法,其中所述序列标签长度标准是第一序列标签长度标准,并且在(e)中分析所述产物离子谱的步骤包括(i)分析所述产物离子谱以确定是否满足第二序列标签长度标准;以及(ii)如果满足所述第二序列标签长度标准,则协调所述产物离子谱的存储。
24.如权利要求20所述的方法,其中在(e)中分析所述产物离子谱的步骤包括(i)分析所述产物离子谱以确定是否满足序列数据库分数标准;以及(ii)如果满足所述序列数据库分数标准,则协调所述产物离子谱的存储。
全文摘要
描述了一种质谱分析系统。该质谱分析系统包括(a)质谱仪;和(b)连接到质谱仪的控制器。该控制器被配置用来(i)引导质谱仪获取样品流的母体离子谱;(ii)实时分析母体离子谱以确定是否满足第一评估标准;(iii)如果满足第一评估标准,则引导质谱仪获取样品流的产物离子谱;(iv)实时分析产物离子谱以确定是否满足第二评估标准;以及(v)如果满足第二评估标准,则分析产物离子谱以向产物离子谱分配标识。对于某些实现方式,控制器允许质谱分析数据的自动的、依赖于数据的获取,以提高可以获取感兴趣的肽数据的效率。
文档编号C12Q1/68GK1873409SQ200610075750
公开日2006年12月6日 申请日期2006年4月26日 优先权日2005年4月29日
发明者格雷戈尔·T·欧瓦内, 约瑟夫·查尔斯·罗克 申请人:安捷伦科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1