用于蛋白熔解曲线数据分析的系统和方法

文档序号:6494726阅读:3554来源:国知局
用于蛋白熔解曲线数据分析的系统和方法
【专利摘要】本教导涉及用于分析多个样品的熔解曲线数据的系统和方法的实施方案。根据多个实施方案,为了适应蛋白熔解曲线数据的复杂性,熔解温度(Tm)可通过一系列不同类型的蛋白熔解曲线数据来确定,所述蛋白熔解曲线数据在多种分析属性上具有可变性。多个样品的组合,连同数据的复杂性产生了以很容易方便最终用户分析数据的方式处理所述数据的需要。本教导的交互式图形用户界面(GUI)的多个实施方案提供了可由最终用户进行的快速且连续的变化,从而显示蛋白熔解曲线数据以允许此类分析。
【专利说明】用于蛋白熔解曲线数据分析的系统和方法
[0001]相关申请的交叉引用:
[0002]本申请要求于2011年2月I日提交的美国临时专利申请第61/438621号、于2011年3月8日提交的美国临时专利申请第61/450306号和于2011年6月14日提交的美国临时专利申请第61/496980号的优先权,所述申请全部在此通过引用并入本文中。
[0003]背景
[0004]正如蛋白化学领域中的技术人员可获悉的,蛋白熔解曲线数据可发生很大的变化,并且可在多种分析属性上展现出可变性。此类分析属性可包括,例如但不限于曲线形状、背景信号、信号幅度的变化以及噪声。
[0005]用于蛋白熔解曲线数据分析的本教导的系统和方法(其中可确定熔解温度(Tm)),满足了客观且一致地分析蛋白熔解曲线数据的需要。对于蛋白熔解曲线数据,例如在高通量分析中,可处理多个蛋白样品,这可产生一组蛋白熔解曲线数据,其在一系列分析属性上展现出高可变性。
[0006]同时处理的多个样品的组合,连同数据的复杂性,产生了以容易帮助最终用户评价数据的方式处理数据的需要。
[0007]附图简述
[0008]图1的框图说明了示例性计算机系统的元件,所述计算机系统可应用于用于处理熔解曲线分析的蛋白样品的系统的控制和连接中。
[0009]图2为可用于熔解曲线分析的蛋白样品的处理的一些仪器特征的实例的框图。
[0010]图3为用于分析熔解曲线数据的交互式GUI的多个实施方案的输入示意图/输出示意图。
[0011]图4的流程图描述了用于分析蛋白熔解曲线数据的系统和方法的多个实施方案。
[0012]图5的流程图描述了用于分析蛋白熔解曲线数据的系统和方法的多个实施方案。
[0013]图6的流程图描述了用于分析蛋白熔解曲线数据的系统和方法的多个实施方案。
[0014]图7的图示说明了用于多相蛋白熔解的峰选择的方法的多个实施方案。
[0015]图8的图示说明了用于多相蛋白熔解的峰选择的方法的多个实施方案。
[0016]图9为根据本教导中系统和方法的多个实施方案的交互式⑶I的不例性窗口。
[0017]图1OA和图1OB为图9的⑶I的实施方案的示例性部分,其显示了示例性弹出窗口的功能选择的作用。
[0018]图11为根据本教导中系统和方法的多个实施方案的交互式GUI的示例性窗口。
[0019]图12为图9的交互式GUI的实施方案的示例性部分,其显示了最终用户比较熔解温度(Tm)确定的多个实施方案的交互性质。
[0020]图13为图9的交互式GUI的实施方案的示例性部分,其显示了最终用户选择用于分析熔解温度(Tm)确定的多个实施方案的目标温度区域的交互性质。
[0021]图14为图9的交互式GUI的实施方案的示例性部分,其显示了用于观察熔解温度(Tffl)确定的多个实施方案的选择数据的数据的拟合的设施。
[0022]图15为本教导中交互式GUI的实施方案的示例性部分,其显示了用于观察显示多相熔解的数据的拟合的设施。
[0023]图16为图14的交互式⑶I的实施方案的示例性部分,其显示了用于观察显示多相的数据的拟合的设施。
[0024]图17A和图17B显示了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征,其显示了用于观察曲线与共有y轴对齐的多条曲线的设施。
[0025]图18为显示了用于传送重复数据组相关信息的本教导中的多个实施方案的交互式⑶I的特征。
[0026]图19的图表描述了根据本教导中交互式GUI的系统和方法的多个实施方案,其描述了最终用户可接收的标志通知的多种条件图20描述了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征的示例性部分,其显示了用于观察多种参数对重复数据组的影响的设施。
[0027]图21描述了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征的示例性部分,其显示了经由示例性弹出窗口的选择用于观察多种参数对重复数据组的影响的设施。
[0028]图22是图19的交互式GUI的实施方案的示例性部分,其显示了用于观察多种参数对重复数据组的影响的设施。
[0029]图23是图19的交互式GUI的实施方案的示例性部分,其显示了用于观察多种参数对重复数据组的影响的设施。
[0030]图24A和图24B为本教导中交互式⑶I的实施方案的示例性部分,其显示了用于观察显示出双相熔解的所选数据集的设施。图24C是本教导的交互式GUI的实施方案的示例性部分,其显示了用于观察多种参数对图24A和图24B中选择的数据集的重复数据组的影响的设施。
[0031]图25A描述了根据提供蛋白熔解分析的系统的多个实施方案的交互式GUI的特征的示例性部分,其显示了经由示例性弹出窗口的选择用于观察Λ 所选正阈值的结果的设施。图25Β是图25Α的交互式GUI的实施方案的示例性部分,其显示了用于观察落入所选正阈值的重复数据组的设施。
[0032]图26Α描述了本教导中交互式⑶I的特征的示例性部分,其显示了经由示例性弹出窗口的选择用于观察Λ Tm的所选负阈值的结果的设施。图26Β是图25Α的交互式GUI的实施方案的示例性部分,其显示了用于观察落入所选负阈值的重复数据组的设施。
[0033]详述
[0034]本教导涉及容易帮助最终用户分析蛋白熔解曲线数据的系统和方法的实施方案。根据多个实施方案,熔解温度CU可通过一系列不同类型的蛋白熔解曲线数据从蛋白热稳定性研究来确定,所述蛋白熔解曲线数据可在多种分析属性上展现出可变性。对于多个实施方案,分析属性可包括,例如但不限于曲线形状、背景信号、信号幅度的变化以及噪声。另夕卜,多个样品可在多种实验条件下进行处理,从而产生最终用户可评价的大量数据。对于多个实施方案,由于产生数据的复杂性和数量,本教导的系统和方法提供了最终用户分析和评价数据的容易便利性。根据多个实施方案,提供了交互式图形用户界面(GUI)以方便最终用户分析和评价数据。在多个实施方案中,交互式GUI可为能提供允许最终用户连续并快速分析蛋白熔解曲线数据的各种特征的交互式工具。根据多个实施方案,交互式GUI可允许最终用户连续并快速分析和评价蛋白熔解曲线数据和用于确定Tm的数据亚集。对于多个实施方案,交互式GUI可允许最终用户连续并快速分析和评价蛋白熔解曲线数据和关于重复组数据的数据亚集,例如多个实验变量对重复数据集的影响,以及与所选组的蛋白熔解曲线数据有关的重复的集中趋势和方差。
[0035]本领域技术人员可认识运用蛋白的熔解温度(Tm)的确定情况的各种测定。其中具有例如三级结构的蛋白,从所述三级结构变成无规卷曲结构的过程在本领域中被称为,例如但不限于蛋白变性、蛋白解折叠和蛋白熔解。此外,在多种样品溶液条件下,蛋白可显示出针对该蛋白所观察到的Tm的变化或移位为所述样品溶液条件的函数。多个术语例如热熔解测定(TMA)、热转移测定(TSA)、蛋白热转移(PTS)分析和差示扫描荧光光谱(DSF)是其中一种或多种蛋白的Tm的确定情况对分析是至关重要的领域中的术语的实例。
[0036]关于蛋白化学适用的测量科学的方面,可以观察到检测器信号幅度的变化为蛋白折叠状态的变化的函数。在这方面,由于荧光信号幅度随施加于蛋白样品的温度而变化,可基于所述荧光信号幅度的增加或减少来进行多种分析。
[0037]例如,在多种分析中,信号幅度可源自蛋白的氨基酸残基例如色氨酸。如本领域的技术人员所获悉的,色氨酸的最大荧光发射的强度、量子产率和波长是非常依赖于溶剂的。随着色氨酸残基周围溶剂极性的降低,荧光色谱位移至较短的波长并且荧光的强度增加。因此,当蛋白解折叠时,埋藏的色氨酸残基可暴露于更极性水溶剂环境中,以致从折叠状态到解折叠状态可观察到减少的信号幅度。
[0038]不是使用源自蛋白分子的固有信号,其它分析可运用染料以指示蛋白的折叠状态。例如,可运用例如Sypro?Orange的荧光染料以监测蛋白的折叠状态。对于极性溶剂
环境中的Sypro? Orange,观察到荧光信号的淬灭。对于与溶液中折叠蛋白的表面基团相
关的SypiO?Orange,所述染料是在水环境中,以致其荧光信号被淬灭。当蛋白利用例如
热解折叠来解折叠时,可暴露疏水区或疏水残基。接着Sypro?Omnge可结合疏水区或
疏水残基,从而可增加荧光。对于此类Sypro?Orange测定,接着可观察到从折叠状态到
解折叠状态增加的信号幅度。染料例如1-苯胺基萘-8-磺酸(1,8-ANS)和4,4’ - 二苯胺基-1,I’ -联萘_5,5’ - 二磺酸(双-ANS),其在水环境中淬灭,已显示可用于监测蛋白的折叠,其中,1,8-ANS和双-ANS的荧光在例如蛋白再折叠的过程中可大大增加。
[0039]如蛋白质科学领域中的普通技术人员所获悉的,可出于多种原因在学术界以及工业中进行蛋白热稳定性的监测。为了研究例如由定向诱变研究所引起的靶蛋白的突变,可进行例如但不限于,蛋白熔解曲线研究或热研究。此外,可进行蛋白热稳定性研究以筛选由于多种体外处理和保存条件对蛋白稳定性的影响。此类蛋白热稳定性研究可筛选多种添加物,例如缓冲液、配体和有机试剂可以对目标蛋白的热稳定性产生的影响。侯选药物对蛋白靶标的结合的高通量筛选也可通过侯选药物的结合可以对蛋白热稳定性产生的影响来监测。因此,鉴定影响蛋白热稳定性的条件可提高影响蛋白纯化、结晶和功能性表征的多种所需条件的鉴定。
[0040]正如随后将更详细讨论的,系统和方法的多个实施方案可运用从蛋白熔解测定的全部限定的温度范围收集起来的检测器信号数据。此类信号可存储于各种计算机可读介质中。在本教导的多个实施方案中,可提供计算机程序产品,其可包括有形计算机可读存储介质,其内容包括具有这样的指令的程序,当在处理器上实施时,该指令执行用于向最终用户提供连续并快速分析和评价蛋白熔解曲线数据的能力的方法。
[0041]图1的框图说明了可用于根据多个实施方案执行处理功能的计算机系统100,依靠该计算机系统可实施本教导的实施方案。计算机系统100可包括一个或多个处理器,例如处理器104。处理器104可利用通用用途或特殊用途的处理引擎(例如微处理器、控制器或其它控制逻辑)来实施。在该实例中,处理器104与总线102或其它通信介质连接。
[0042]此外,应理解的是,图1的计算机系统100可以多种形式的任何一种呈现,例如机架式计算机、大型机、超级计算机、服务器、客户端、台式电脑、笔记本电脑、平板电脑、手持计算设备(如PDA、手机、智能手机、掌上电脑等)、集群网格、上网本、嵌入式系统、或者任何其它类型的特殊用途或通用用途的计算设备,其是给定应用或环境所需或适用的。此外,计算机系统100可包括传统的网络系统包括客户端/服务器环境以及一个或多个数据库服务器,或带有LIS/LIMS基础设施的集成。一些传统的网络系统,包括局域网(LAN)或广域网(WAN),并包括无线元件和/或有线元件,是本领域中已知的。此外,客户端/服务器环境、数据库服务器和网络在本领域中都是有良好记录的。
[0043]计算机系统100可包括总线102或用于通信的其它通信机制,以及与总线102耦合的用于处理信息的处理器104。
[0044]计算机系统100还包括存储器106,其可为与总线102耦合的用于存储由处理器104执行的指令的随机存取存储器(RAM)或其它动态存储器。存储器106还可用于在由处理器104执行指令的执行期间存储临时变量或其它中间信息。计算机系统100进一步包括与总线102耦合的用于存储静态信息和处理器104的指令的只读存储器(ROM) 108或其它静态存储设备。
[0045]计算机系统100还可包括存储设备110,例如提供与总线102耦合的用于存储信息和指令的磁盘、光盘、或固态驱动器(SSD)。存储设备110可包含介质驱动器和移动式存储接口。介质驱动器可包括驱动器或其它机制以支持固定式存储介质或移动式存储介质,例如硬盘驱动器、软盘驱动器、磁带驱动器、光盘驱动器、⑶驱动器或DVD驱动器(R或RW)、闪存驱动器或其它移动式或固定式介质驱动器。正如这些实例所示,存储介质可包括在其中存储有特定的计算机软件、指令和/或数据的计算机可读存储介质。
[0046]在备选的实施方案中,存储设备110可包括其它类似的工具,用于允许将计算机程序或者其它指令或数据加载到计算机系统100中。此类工具可包括,例如移动式存储单元和接口,例如程序盒和盒式接口、移动式存储器(例如,闪存或其它移动式存储器模块)和存储器插槽以及允许软件和数据从存储设备110传输至计算机系统100的其它移动式存储单元和接口。
[0047]计算机系统100还可包括通信接口 118。通信接口 118可用于允许软件和数据在计算机系统100和外部设备之间传输。通信接口 118的实例可包括调制解调器、网络接口(如以太网或其它NIC卡)、通信端口(例如如,USB端口、RS-232C串行端口)、PCMCIA插槽、PCMCIA卡、蓝牙等。经由通信接口 118传输的软件和数据为这样的信号形式,该信号可以为能被通信接口 118接收的电子信号、电磁信号、光信号或其它信号。这些信号可通过诸如无线介质、电线或电缆、光纤或其它通信介质的通道由通信接口 118来发送和接收。通道的一些实例包括电话线、手机链接、RF链路、网络接口、局域网或广域网及其它通信通道。
[0048]计算机系统100可通过通信接口 118与显示器112通信,例如用于向计算机用户显示信息的阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)显示器。在多个实施方案中,计算机系统100可通过总线与显示器耦合。输入设备114,包括字母数字键和其它键,与总线102耦合,用于向处理器104通信信息和命令选择。例如,输入设备也可为显示器,如配置具有触屏输入功能的IXD显示器。用户输入设备的另一种类型是光标控制116,例如鼠标、轨迹球或光标方向键,用于向处理器104通信方向信息和命令选择和用于在显示器112上控制光标的移动。该输入设备通常在两个轴(第一轴(例如,X)和第二轴(例如,y))上具有二维自由度,其允许设备在平面内指定位置。计算机系统100提供了数据处理并对此类数据提供了置信水平。与本教导中实施方案的某些实施一致,计算机系统100提供数据处理和置信值,以响应处理器104执行的包含于存储器106中的一个或多个指令的一个或多个序列。此类指令可从另一种计算机可读介质,如存储设备110读入存储器106中。存储器106中包含的指令序列的执行导致处理器104进行本文所述的处理状态。或者,硬接线电路可用于代替或结合软件指令以实施本教导的实施方案。因此,本教导中实施方案的实施并不限于硬件电路和软件的任何特定组合。
[0049]本文所用术语“计算机可读介质”和“计算机程序产品”通常是指参与向处理器104提供用于执行的一个或多个序列或一个或多个指令的任何介质。此类指令,通常被称作“计算机程序代码”(其可以计算机程序或其它分组的形式分组),当执行时,能使计算机系统100进行本发明的实施方案的特征或功能。计算机可读介质的这些形式和其它形式可采用很多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如,固态硬盘、光盘或磁盘,比如存储设备110,易失性介质包括动态存储器,例如存储器106。传输介质包括同轴电缆、铜线和光纤,包括与总线102的连通性。
[0050]计算机可读介质的常见形式包括例如,软盘、柔性盘、硬盘、磁带或任何其它磁性介质、CD-ROM、任何其它光学介质、穿孔卡、纸带、带有孔图案的任何其它物理介质、RAM、PROM和EPROM、FLASH-EPR0M、任何其它存储芯片或盒、如下文所述的载波,或者计算机可读取的任何其它介质。
[0051]计算机可读介质的各种形式可携带一个或多个指令的一个或多个序列至处理器104用于执行。例如,所述指令最初可携带在远程计算机的磁盘上。所述远程计算机可将所述指令加载到其动态存储器中并用调制解调器通过电话线发送指令。计算机系统100的本地调制解调器可接收电话线上的数据并用红外发射器将数据转换成红外线信号。与总线102耦合的红外检测器可接收红外线信号中携带的数据并将所述数据置于总线102上。总线102将所述数据携带至存储器106,从存储器106中,处理器104检索并执行指令。在由处理器104执行之前或之后,通过存储器106接收的指令可任选存储于存储设备110上。
[0052]若适用的话,本领域技术人员应认识到,多个实施方案的操作可使用硬件、软件、固件或其组合来实施。例如,可在软件、固件或硬线逻辑的控制下使用处理器或其它数字电路来进行某些处理。(正如本领域技术人员进行所述功能应认识到的,本文术语“逻辑”是指固定的硬件、可编程逻辑和/或其合适的组合)。软件和固件可存储于计算机可读介质上。一些其它处理可利用模拟电路来实施,如本领域普通技术人员所熟知的。此外,存储器或其它存储以及通信元件可应用于本发明的实施方案中。[0053]为清楚起见,应理解的是以上描述已参考不同的功能单元和处理器来描述本发明的实施方案。然而,显而易见的是在不损害本发明的情况下可使用不同的功能单元、处理器或域之间功能性的任何合适的分布。例如,说明由单独的处理器或控制器执行的功能可通过同一处理器或同一控制器来执行。因此,提及特定的功能单元仅被视为提及用于提供所述功能的合适方式,而非指示严格的逻辑或物理结构或组织。
[0054]本教导中用于分析蛋白熔解曲线数据的方法和系统的多个实施方案可运用图2所示的框图中所述的循环仪的多个实施方案。
[0055]正如前面所提及的,其中蛋白可解折叠的一种方法是通过利用热解折叠,其中随着温度的升高可进行解折叠。本教导中用于分析蛋白熔解曲线的方法和系统的多个实施方案可运用如图2所示框图中所述的热循环仪的多个实施方案。如图2所示,热循环仪可包括置于样品支持设备中含有的多份样品216之上的加热盖214。在多个实施方案中,样品支持设备也可为具有多个样品区的玻璃的、金属的或塑料的载片或基底,其样品区在所述样品区和加热盖214之间有盖。样品支持设备的一些实例可包括,但不局限于多孔板,例如标准的微量滴定的96孔板、384孔板、能够在每次分析时处理几千个样品的微型设备、或微卡、或基本平的支持物,例如各种微流体装置,微卡设备和从例如但不限于玻璃的、金属的或塑料的载片或基底构建的微芯片设备。样品支持设备的多个实施方案的样品区可包括凹陷、凹口、洞、隆起及其组合,以在载片或基底的表面上形成规则或不规则的阵列来定制。热循环仪的多个实施方案可包括样品块218、用于加热和冷却的元件220以及热交换器222。
[0056]热循环仪的多个实施方案可同时处理多个样品,并且可用于蛋白熔解曲线数据的生成和采集。在图2中,热循环系统200的多个实施方案提供了针对多个生物样品中的各样品的运行时间信号采集的检测系统,在进行用于产生蛋白熔解曲线数据的全部温度范围内。检测系统可具有发射电磁能量的照明源和检测器或成像器210,用于从样品支持设备中的样品216中接收电磁能量。因此,虽然热循环仪可为蛋白熔解曲线数据的生成和采集的可用平台,但本领域技术人员应认识到,具有检测和样品调温能力的仪器可用于产生蛋白熔解曲线数据。
[0057]控制系统224可用于控制检测器、加热盖和热块组件的功能。所述控制系统可通过热循环仪200的用户界面226由最终用户访问。如图1所示,计算机系统100可用于提供热循环仪的功能的控制以及用户界面功能的控制。此外,计算机系统100可提供数据处理、显示和报告准备功能。所有此类仪器控制功能可局部专用于热循环仪,或者计算机系统100可提供所述控制、分析和报告功能的部分或全部的远程控制。
[0058]如上所述,大量蛋白熔解曲线数据可作为用于同一运行中分析的大量样品各自的蛋白熔解测定的整个限定的温度范围中收集的检测器信号数据来生成。由于大量的数据,连同蛋白熔解曲线数据的复杂性,本教导中系统和方法的多个实施方案提供了计算机可读介质的实施方案,所述计算机可读介质可从收集为检测器信号输出的初始蛋白熔解曲线数据生成已处理的数据,所述检测器信号输出为样品支持设备中各样品的温度的函数。
[0059]此外,本教导中系统和方法的多个实施方案提供了计算机可读介质的实施方案,所述计算机可读介质可允许最终用户利用交互式用户界面来灵活地和动态地分析大数据集及其所选子集。此类交互式用户界面可有助于最终用户选择以下:例如但不限于一组新的分析参数,可分析数据的另一方法、为所选的重复的数据集检查数据、以及用于所述重复集的相关统计以及检查哪组数据集可以落入与目标样品集相比的所选阈值内。
[0060]图3描述了旨在传达这样的过程的输入图/输出图,通过该过程,用于分析蛋白熔解曲线数据的系统和方法的多个实施方案可提供最终用户动态分析蛋白熔解曲线数据的大数据集的能力。如图3所示,初始输入可包括,例如但不限于板设置信息(set-upinformation)以及在整个运行中对各样品收集的检测器输出信号。板设置信息包括识别样品名称、以及待测试条件例如缓冲液、配体或测试化合物的类型、蛋白样品的类型等。在多个实施方案中,板设置信息稍后可用于识别复孔并展示针对包括重复统计结果在内的各测试条件的最终结果。根据本教导中系统和方法的多个实施方案,板设置信息可作为初始输入由最终用户在分析前输入,并接着可以输入生成结果的自动模式的多个实施方案中的分析引擎中。此类信息提供了条件值,所述条件例如但不限于样品类型、样品浓度、缓冲液类型以及很多其它的测定条件。在多个实施方案中,板设置信息可在运行后通过最终用户利用测定条件的值的手工分配作为二次输入来手动编辑。对于本教导中系统和方法的多个实施方案,分析组可通过最终用户在运行前作为初始输入或在运行后的分析期间作为二次输入来限定。在多个实施方案中,最终用户可从整个样品支持设备(例如微量滴定板)限定样品数据作为分析组。对于多个实施方案,分析组可包含来自多个样品支持设备的样品数据。在多个实施方案中,分析组可由最终用户限定为来自选择的样品区,例如微量滴定板的孔中的样品数据,所述选择的样品区选自一个或多个样品支持设备。在多个实施方案中,选自单个样品支持设备的样品区的样品数据可分成多个分析组。分析组可由在相同或不同的条件下测定的一个样品的数据组成,或可由相同或不同的条件下测定的多个样品的数据组成,或以上的任何组合。因此,本教导中系统和方法的多个实施方案向最终用户提供了限定的动态灵活性,例如但不限于板设置信息、分析组、分析设置和阈值设置。
[0061]如图3的分析引擎所示,计算机可读介质的多个实施方案可采用初始输入或二次输入并生成已处理的熔解曲线数据,例如但不限于,检测器信号响应相对温度的熔解曲线图、所述熔解曲线图的η阶导数图、Tffl的确定、用于提醒最终用户数据的各个方面及其分析的标志、以及由最终用户识别的作为样品重复的样品组的重复组统计结果,其中多个重复组可包含分析组。自动模式或手动模式的分析设置利用初始输入,例如检测器输出信息和板设置信息,其可用于生成如图3所示的各样品的孔水平的结果。最终用户的板设置信息的输入也可用于计算重复水平的结果和统计结果。在用于蛋白熔解曲线分析的系统和方法的多个实施方案中,用户界面可显示来自初始输入的已处理数据的结果。对于本教导中系统和方法的多个实施方案,一旦通过用户界面已复查来自初始输入的已处理的数据的显示情况,最终用户可通过二次输入的选择来改变影响数据处理的参数。根据用于本教导的蛋白熔解曲线分析的系统和方法的多个实施方案,二次输入是继初始输入后发生的任何用户输入。在这方面,对于本教导中系统和方法的多个实施方案,最终用户可反复选择用于分析和显示数据的参数的方式数目并不受限制。此外,最终用户可同时分析来自不同类型的计算机可读介质上存储的任何初始数据的数据。在这方面,最终用户可同时分析来自不同仪器、不同的运行、不同的实验条件或最终用户可期望选择和分析蛋白熔解曲线数据的任何组合的数据。此类参数可包括,例如但不限于:分析设置、阈值分析、分析模式或Tm可如何确定的方法的选择、用于比较样品或重复组的Tm与另一样品或另一重复组的Tm的方法、作为用户选择的实验变量的函数的重复组显示以及作为用户确定的阈值的函数的重复组显示。板设置的相关信息尤其可影响需要多于一个孔的所有结果,以产生如ATm、重复水平的标志和统计分析。
[0062]在图4-图6中,显示了用于分析初始蛋白熔解曲线数据的方法的多个实施方案。在方法300的图3、方法310的图4和方法320的图5的步骤10中,初始蛋白熔解曲线数据的数据集由用于多个样品的处理器来接收。如前面所述,所述初始蛋白熔解曲线数据包括作为多个样品中每一个样品的温度的函数的检测器信号。
[0063]参考图4-图6,方法300和方法310的步骤20中,可分别进行多个样品蛋白熔解曲线的每一个的预处理以对检测收集的数据进行降噪。如信号处理领域中的技术人员所知悉的,降噪数据可包括例如但不限于以下的处理步骤:清理、归一化、变换、特征提取和特征选择。对于多个实施方案,可进行第一全局平滑(global smoothing)步骤,其中可去除较高频率的噪声元件。在多个实施方案中,可应用傅立叶变换平滑。依照多个实施方案,可进行第二局部平滑。在多个实施方案中,可进行局部回归平滑,其中在限定的窗口内对样品熔解曲线依次进行平滑处理。对于多个实施方案,可基于诸如数据点和系统噪声的数目来选择窗口。依照多个实施方案,可应用局部平滑函数例如但并不限于,二次回归、线性回归和Savitzky-Golay平滑函数。在多个实施方案中,可利用鲁棒二次平滑函数或线性平滑函数。
[0064]参考方法300的图4的步骤30和方法310的图5的步骤40,对于用于分析蛋白熔解曲线数据的多种系统和方法,在预处理数据的步骤之后,可进行选择分析区域的步骤。
[0065]根据用于分析蛋白熔解曲线数据的系统和方法的多个实施方案,在确定分析区域的步骤后可将Boltzmann拟合应用于样品蛋白熔解曲线中。根据多个实施方案,可通过以下给出描述Boltzmann拟合的等式:
【权利要求】
1.系统,所述系统包括: 处理器;和 与所述处理器通信的存储器;所述存储器存储以下指令: 通过所述处理器接收一组蛋白熔解曲线数据; 从初始熔解曲线数据生成并显示已处理的熔解曲线数据的第一数据集; 向最终用户呈递用于交互式分析所述已处理的蛋白熔解曲线数据的第一数据集的界面,其中所述交互式分析包括生成已处理的蛋白熔解曲线数据的第二数据集的显示,其中所述已处理的蛋白熔解曲线数据的第二数据集响应于用户输入而生成。
2.如权利要求1所述的系统,其中所述蛋白熔解曲线数据包括作为最终用户所选分析组的温度的函数的检测器响应值。
3.如权利要求1所述的系统,其中所述第一数据集和所述第二数据集的显示为所述数据的Boltzmann拟合的显示。
4.如权利要求1所述的系统,其中所述第一数据集和所述第二数据集的显示为所述数据的η阶导数图的显示。
5.如权利要求1所述的系统,其中所述第一数据集和所述第二数据集的显示为显示重复组集中趋势和方差的菱形图。
6.计算机可读介质,其由处理器可执行的用于分析蛋白熔解曲线数据的指令编码,所述指令包括以下指令:` 接收多个样品的一组蛋白熔解曲线数据; 从初始熔解曲线数据生成并显示已处理的熔解曲线数据的第一数据集;和 向最终用户呈递用于交互式分析所述已处理的蛋白熔解曲线数据的第一数据集的界面,其中所述交互式分析包括生成已处理的蛋白熔解曲线数据的第二数据集的显示,其中所述已处理的蛋白熔解曲线数据的第二数据集响应于用户输入而生成。
7.如权利要求6所述的计算机可读介质,其中所述蛋白熔解曲线数据包括作为最终用户所选分析组的温度的函数的检测器响应值。
8.如权利要求6所述的计算机可读介质,其中所述第一数据集和所述第二数据集的显示为所述数据的Boltzmann拟合的显示。
9.如权利要求6所述的计算机可读介质,其中所述第一数据集和所述第二数据集的显示为所述数据的η阶导数图的显示。
10.如权利要求6所述的计算机可读介质,其中所述第一数据集和所述第二数据集的显示为显示重复组集中趋势和方差的菱形图。
11.计算机执行的方法,所述方法用于确定生物样品中基因组基因座的基因型,所述方法包括: 通过处理器接收一组蛋白熔解曲线数据; 在计算机上处理该组蛋白熔解曲线数据,所述处理包括: 从初始熔解曲线数据生成并显示已处理的熔解曲线数据的第一数据集;和向最终用户呈递用于交互式分析所述已处理的蛋白熔解曲线数据的第一数据集的界面,其中所述交互式分析包括生成已处理的蛋白熔解曲线数据的第二数据集的显示,其中所述已处理的蛋白熔解曲线数据的第二数据集响应于用户输入而生成。
12.如权利要求11所述的计算机执行的方法,其中所述蛋白熔解曲线数据包括作为最终用户所选分析组的温度的函数的检测器响应值。
13.如权利要求11所述的计算机执行的方法,其中所述第一数据集和所述第二数据集的显示为所述数据的Boltzmann拟合的显示。
14.如权利要求11所述的计算机执行的方法,其中所述第一数据集和所述第二数据集的显示为所述数据的η阶导数图的显示。
15.如权利要求11所述的计算机执行的方法,其中所述第一数据集和所述第二数据集的显示为显示重复组集中趋势和方差的菱形图。
【文档编号】G06F19/26GK103688264SQ201280015278
【公开日】2014年3月26日 申请日期:2012年2月1日 优先权日:2011年2月1日
【发明者】奈弗蒂塔·马朱木达尔, 哈里森·梁, 吴若云 申请人:生命技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1