自适应纳米孔信号压缩的制作方法

文档序号:18743553发布日期:2019-09-21 02:04阅读:280来源:国知局
自适应纳米孔信号压缩的制作方法

具有在内直径方面大约一纳米的孔大小的纳米膜器件在快速核苷酸测序方面示出了希望。当跨浸在导电流体中的纳米孔而施加电压电势的时候,可存在小离子电流,其归因于跨纳米孔的离子的传导。电流的大小对孔大小以及哪种分子在纳米孔中敏感。分子可以是被附连到特定核苷酸的特定标记,从而允许检测核酸的特定定位处的核苷酸。可以作为测量分子的电阻的方式来测量(例如在积分电容器处)包括纳米孔的电路中的电压,从而允许检测哪种分子在纳米孔中。

基于纳米孔的测序传感器芯片可以用于DNA测序。基于纳米孔的测序传感器芯片可以并入大量传感器单元,其被配置为用于并行测序的阵列。例如,基于纳米孔的测序传感器芯片可以包括被布置在二维阵列中的100,000或更多(例如一百万或更多)单元,用于并行地为100,000或更多DNA分子测序。因而,在多个时间段中的每个时间段期间可以通过传感器芯片生成大量数据,其包括来自100,000或更多单元的测量信号。



技术实现要素:

本公开内容一般涉及基于纳米孔的DNA测序,并且更具体地涉及通过基于纳米孔的测序传感器芯片所生成的压缩数据,所述基于纳米孔的测序传感器芯片包括大量并行测序传感器单元。代替于发送测序传感器单元所生成的所有数据以供处理,使用预处理电路来从测序传感器单元所生成的数据提取相关信息,并且仅仅转发所提取的信息以供进一步处理,从而减小被传递的数据的量。

在一些实施例中,预处理电路可以用于从传感器芯片所生成的数据中提取用于在测序传感器单元的形成期间检查和校准测序传感器单元的相关信息,以及用于确定DNA分子中的碱基的相关信息。仅有所提取的信息被发送到处理器,所述处理器可以基于所提取的信息来检查和校准测序传感器单元和/或确定DNA分子中的碱基。预处理电路可以被配置成在单元形成、校准和测序的不同阶段期间从传感器芯片所生成的数据中提取不同的信息。在一些实施例中,预处理电路可以自适应性地在不同的时间、基于来自测序系统中其他组件的请求来从传感器芯片所生成的数据中提取不同的信息。

在一些实施例中,公开了一种操作测序系统的方法,所述测序系统被配置成并行地对至少100,000个DNA分子进行测序。所述方法可以包括通过预处理电路从包括多个单元的传感器芯片接收数据帧的集合,其中每个数据帧可以包括来自所述多个单元的检测信号,并且可以对应于不同的时间。所述方法还可以包括从所述数据帧的集合提取信息,以获得摘要信息(digested information),以供用在确定所述多个单元的状态中。所述方法可以此外包括:生成摘要帧的群组,所述摘要帧的群组包括从所述数据帧的集合提取的摘要信息;以及将所述摘要帧的群组发送到处理器以供用在确定所述多个单元的状态中。

在一些实施例中,公开了用于处理来自包括多个单元的传感器芯片的输出数据的设备。所述设备可以包括预处理电路以及被耦合到所述预处理电路的存储器。所述预处理电路可以被配置成从所述传感器芯片接收数据帧的集合,其中每个数据帧可以包括来自所述多个单元的检测信号,并且可以对应于不同的时间。所述设备可以将所述数据帧的集合中的至少一些存储在存储器中。所述设备可以从所述数据帧的集合中的所述多个单元的检测信号提取信息以获得摘要信息用于确定所述多个单元的状态;生成摘要帧的群组,所述摘要帧的群组包括从所述数据帧的集合提取的摘要信息;以及将所述摘要帧的群组发送到处理器以供用在确定所述多个单元的状态中。

因而,本发明提供一种操作被配置成并行地对至少100,000个DNA分子进行测序的测序系统的方法,所述方法包括在预处理电路处执行:

从包括多个单元的传感器芯片接收数据帧的第一集合,其中所述多个单元中的每个单元被配置成生成检测信号以用于确定随时间的单元的状态,并且其中每个数据帧包括来自所述多个单元的检测信号并且对应于不同的时间;从所述数据帧的第一集合中的所述多个单元的检测信号提取信息以获得第一摘要信息,所述第一摘要信息用于用在确定所述多个单元的状态中;生成一个或多个摘要帧的第一群组,其包括从所述数据帧的第一集合提取的第一摘要信息,其中所述一个或多个摘要帧的第一群组中的摘要帧的数目小于所述数据帧的第一集合中的数据帧的数目;以及将所述一个或多个摘要帧的第一群组发送到处理器以供用在确定所述多个单元的状态中。所述一个或多个摘要帧的第一群组可以包括来自所述数据帧的第一集合的一个或多个数据帧。单元的状态选择自:单元的断开状态或短路状态、单元中双层的存在或不存在;单元中纳米孔的存在或不存在;与单元相关联的碱基;或其任何组合。所述数据帧的第一集合可以包括来自传感器芯片的数据帧,其在所述多个单元的形成期间被生成。所述数据帧的第一集合可以可替换地包括来自传感器芯片的数据帧,其在所述多个单元的校准期间被生成。所述数据帧的第一集合还可以包括来自传感器芯片的数据帧,其在测序循环中被生成。所述数据帧的第一集合仍可以可替换地包括来自传感器芯片的数据帧,其在多个测序循环中被生成。所述方法可以此外包括生成帧图(frame map)的步骤,所述帧图标识所述一个或多个摘要帧的第一群组的特性。所述帧图可以标识针对一个或多个测序循环所生成的摘要帧。所述方法还可以包括如下步骤:接收对于以下的请求:通过使用来自传感器芯片的数据帧的第二集合来生成一个或多个摘要帧的第二群组;基于所述请求来从所述数据帧的第二集合中的所述多个单元的检测信号提取信息以获得第二摘要信息,所述第二摘要信息用于用在确定所述多个单元的状态中;生成所述一个或多个摘要帧的第二群组,其包括从所述数据帧的第二集合提取的第二摘要信息;以及将所述一个或多个摘要帧的第二群组发送到处理器。所述一个或多个摘要帧的第二群组中的摘要帧的数目可以大于或小于所述一个或多个摘要帧的第一群组中的摘要帧的数目。所述请求可以标识一个或多个所期望的摘要帧。

本发明还提供一种用于处理来自传感器芯片的输出数据的设备,所述设备包括预处理电路;以及耦合到所述预处理电路的存储器,其中所述预处理电路被配置成从传感器芯片接收数据帧的第一集合,所述传感器芯片包括多个单元,其中所述多个单元中的每个单元被配置成生成检测信号以用于确定随时间的单元的状态,并且其中每个数据帧包括来自所述多个单元的检测信号并且对应于不同的时间;将所述数据帧的第一集合中的至少一些存储在存储器中;从所述数据帧的第一集合中的所述多个单元的检测信号提取信息以获得第一摘要信息,所述第一摘要信息用于确定所述多个单元的状态;生成一个或多个摘要帧的第一群组,其包括从所述数据帧的第一集合提取的第一摘要信息,其中所述一个或多个摘要帧的第一群组中的摘要帧的数目小于所述数据帧的第一集合中的数据帧的数目;以及将所述一个或多个摘要帧的第一群组发送到处理器以供用在确定所述多个单元的状态中。所述预处理电路可以包括现场可编程门阵列(FPGA)、片上系统(SoC)、专用集成电路(ASIC)、可编程阵列逻辑(PAL)、或复杂可编程逻辑器件(CPLD),并且可以此外被配置成生成帧图,所述帧图标识所述一个或多个摘要帧的第一群组的特性。单元的状态可以选择自:单元的断开状态或短路状态;单元中的双层的存在或不存在;单元中纳米孔的存在或不存在;与单元相关联的碱基;或其任何组合。所述数据帧的第一集合可以包括来自传感器芯片的数据帧,其在所述多个单元的形成期间或在一个或多个测序循环期间被生成。所述检测信号可以包括一个或多个AC信号循环中的数据点,每个AC信号循环包括亮时段和暗时段,其中所述检测信号包括在所述一个或多个AC信号循环中每一个的亮时段中的一个或多个数据点以及在所述一个或多个AC信号循环中的每一个的暗时段中的一个或多个数据点;并且所述一个或多个摘要帧中的每一个可以包括:针对所述多个单元中的每一个,在AC信号循环的亮时段中的第一数据点与AC信号循环的暗时段中的第一数据点之间的差异;在AC信号循环的亮时段中的最后的数据点与AC信号循环的暗时段中的最后的数据点之间的差异;在亮时段中的最后的数据点与下一个暗时段中的第一数据点之间的差异;在暗时段中的最后的数据点与下一个亮时段中的第一数据点之间的差异;或在AC信号循环的暗时段中的两个数据点之间的差异。

附图说明

图1图示了基于纳米孔的测序芯片中的单元的实施例。

图2图示了基于纳米孔的测序芯片中的单元的实施例。

图3图示了利用Nano-SBS技术来执行核苷酸测序的单元的实施例。

图4图示了即将利用预加载的标记来执行核苷酸测序的单元的实施例。

图5图示了用于利用预加载的标记来进行核酸测序的过程的实施例。

图6A图示了在基于纳米孔的测序芯片的单元中的电路的实施例,其中所述电路可以被配置成检测在不使得已经形成的脂质双层分解的情况下是否在单元中形成脂质双层。

图6B图示了与图6A中所示的那个相同的在基于纳米孔的测序芯片的单元中的电路。与图6A相比,代替于示出了在工作电极与对电极之间的脂质膜/双层,示出了对工作电极与脂质膜/双层的电气性质进行表示的电气模型。

图7示出了在AC循环的亮时段和暗时段期间从纳米孔单元捕获的示例数据点。

图8示出了一流程图,其图示了根据某些实施例的形成并且校准纳米孔测序单元的示例方法。

图9示出了一流程图,其图示了根据某些实施例的对测序芯片的纳米孔测序单元进行校准的示例方法。

图10示出了一流程图,其图示了根据某些实施例的对测序芯片的单元中的纳米孔数目进行表征的示例方法。

图11A-11C示出了根据某些实施例的针对单元的不同状态的样本开放通道电压数据。

图12示出了根据某些实施例的样本直方图数据。

图13图示了根据某些实施例的用于处理由示例基于纳米孔的测序芯片捕获的数据的示例系统的框图。

图14图示了根据某些实施例的由示例基于纳米孔的测序芯片捕获的原始数据帧的示例。

图15图示了根据某些实施例的通过对由示例基于纳米孔的测序芯片捕获的原始数据帧进行预处理而生成的示例摘要数据帧。

图16图示了根据某些实施例的示例帧图。

图17是一流程图,其图示了根据某些实施例的操作测序系统的示例方法,所述测序系统被配置成并行地对多个(例如100,000或更多)DNA分子进行测序。

图18是一流程图,其图示了根据某些实施例的自适应数据处理的示例方法。

图19示出了根据某些实施例的可与系统和方法一起使用的示例计算机系统的框图。

定义

“核酸”可以是指以单链或双链形式的脱氧核苷酸或核糖核苷酸及其聚合物。该术语可以包括核酸,其包含已知的核苷酸类似物或经修改的主干残余或链接,其是合成的、自然出现的以及非自然出现的,其具有与参考核酸类似的结合性质,并且以与参考核苷酸类似的方式被新陈代谢。这样的类似物的示例可以无限制地包括硫代磷酸、亚磷酰胺、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸、肽核酸(PNA)。

除非另行指示,否则特定核酸序列还隐式地包括其谨慎修改的变体(例如简并密码子替换)和补充序列,以及显式指示的序列。具体地,简并密码子替换可以通过生成如下序列而被实现:在所述序列中一个或多个所选(或全部)密码子的第三定位被混合基和/或脱氧肌苷残余所替代(Batzer等人,Nucleic Acid Res. 19:5081 (1991);Ohtsuka 等人,J. Biol. Chem.260:2605-2608 (1985);Rossolini等人,Mol.Cell.Probes 8:91-98 (1994))。术语核酸与基因、cDNA、mRNA、寡核苷酸和多核苷酸互换地使用。

术语“核苷酸”,除了指代自然出现的核糖核苷酸或脱氧核苷酸单体之外,还可以被理解成指代其有关的结构变体,包括衍生物和类似物,其相对于在其中使用核苷酸的特定上下文(例如与互补碱基杂交)是功能上等同的,除非上下文清楚地另行指示。

“纳米孔”是指被形成或以其他方式被提供在膜中的孔、通道或通路。膜可以是有机膜,诸如脂质双层,或合成膜,诸如由聚合材料所形成的膜。纳米孔可以被布置成与感测电路或耦合到感测电路的电极相邻或邻近,所述感测电路诸如例如互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路。在一些示例中,纳米孔具有大约0.1纳米(nm)到大约1000nm的特征宽度或直径。一些纳米孔是蛋白质。

术语“亮时段”可以一般指代当经标记的核苷酸的标记通过经由AC信号所施加的电场而被强制进入纳米孔中的时间段。术语“暗时段”可以一般指代当经标记的核苷酸的标记通过经由AC信号所施加的电场而从纳米孔中被推出的时间段。AC循环可以包括亮时段和暗时段。在不同的实施例中,被施加到纳米孔单元以将纳米孔单元置于亮时段(或暗时段)中的电压信号的极性可以是不同的。亮时段和暗时段可以对应于交变信号相对于参考电压的不同部分。

术语“信号值”可以是指从测序单元输出的测序信号的值。根据某些实施例,测序信号可以是电信号,其从一个或多个测序单元的电路中的一点被测量和/或输出,例如信号值可以是(或表示)电压或电流。信号值可以表示电压和/或电流的直接的测量结果,和/或可以表示间接的测量结果,例如信号值可以是电压或电流抵达所指定的值所花费的测量持续时间。信号值可以表示与纳米孔的电阻率相关的任何可测量的量,并且从其中可以得到(被穿过和/或未被穿过的)纳米孔的电阻率和/或电导。作为另一示例,信号值可以对应于光强度,例如从被附连到被催化的核苷酸的荧光团到具有聚合酶的核酸。

术语“帧”或“数据帧”是指如下数据集:所述数据集包括针对传感器芯片上的每个操作单元的至少一个数据点。帧可以是原始帧,其包括在给定时间时来自传感器芯片的每个操作单元的原始数据。帧还可以是摘要帧,其包括来自一个或多个原始帧的经处理的数据。术语“帧图”或“记录帧图”是指用于对被发送到处理器以用于处理的帧流进行描述的帧的序列。“帧图”可以周期性地重复,除非另行被指定。例如,“R1R2MDR1M”记录帧图可以指示如下序列:来自循环的亮时段的第一和第二原始帧(R1和R2),继之以针对亮时段的中间(M)帧,衰减(D)帧,来自循环的暗时段的第一原始帧(R1),以及针对暗时段的中间(M)帧。帧图可以标识针对一个测序循环或多个测序循环而生成的摘要帧。

术语“最后点增量(LPD)”可以是指在循环的亮时段中的最后的样本与循环的暗时段中的最后的样本之间的差异。术语“第一点增量(FPD)”可以是指在循环的亮时段中的第一样本与循环的暗时段中的第一样本之间的差异。术语“步进点增量(SPD)正/负或负/正”可以是指在亮时段中的最后的样本与下一个暗时段中的第一样本之间的差异(正/负)或在暗时段中的最后的样本与下一个亮时段中的第一样本之间的差异(负/正)。术语“暗衰减增量(DDD)”可以是指在循环的暗时段中的两个样本之间的差异。术语“摆动点增量(WPD)”可以是指当应用摆动波形的时候在亮时段中的最后的样本与下一个暗时段中的第一样本之间的差异。术语“X点增量(XPD)”可以是指在任何样本之间的差异(通常排除LPD)。术语“铺轨(railed)”可以是指ADC输出的最小或最大值。例如,对于8位ADC,铺轨值可以是0或255。

如本文中所使用的,波形可以对应于信号,并且可以包括与信号相关联的水平(幅度)、定时、和数据。波形可以是周期性的或非周期性的。波形可以表示模拟信号或数字信号。

具体实施方式

本文中所公开的技术涉及基于纳米孔的DNA测序,并且更具体地涉及通过基于纳米孔的测序传感器芯片生成的压缩数据,所述基于纳米孔的测序传感器芯片包括大量并行测序传感器单元。

在一些实施例中,预处理电路用于从传感器芯片所生成的数据中提取用于在测序传感器单元的形成期间检查和校准测序传感器单元的相关信息,以及用于确定DNA分子中的碱基的相关信息。仅有所提取的信息被发送到处理器,所述处理器可以基于所提取的信息来检查和校准测序传感器单元或确定DNA分子中的碱基。预处理电路可以被配置成在单元形成、校准和测序的不同阶段期间从传感器芯片所生成的数据中提取不同的信息。

在一些实施例中,预处理电路可以自适应性地在不同的时间、基于来自测序系统中其他组件的请求来从传感器芯片所生成的数据中提取不同的信息。

I.纳米孔系统

纳米孔传感器芯片中的纳米孔单元可以用许多不同的方式被实现。例如,在一些实施例中,不同大小和/或化学结构的标记可以被附连到待测序的核酸分子中的不同核苷酸。在一些实施例中,待测序的核酸分子的模板的互补链可以通过利用模板来杂交不同地经聚合物标记的核苷酸而被合成。在一些实现方式中,核酸分子和所附连的标记可以二者都移动通过纳米孔,并且通过纳米孔的离子电流由于附连到核苷酸的标记的特定大小和/或结构而可以指示处于纳米孔中的核苷酸。在一些实现方式中,仅仅标记可以被移动到纳米孔中。还可以存在用于检测纳米孔中的不同标记的许多不同方式。

A.纳米孔测序单元

图1是一简化的结构,其图示了根据某些实施例的基于纳米孔的测序芯片中的纳米孔单元100的实施例。纳米孔单元100可以包括由介电材料、诸如氧化物106形成的井。可以在井的表面之上形成膜102以覆盖井。在一些实施例中,膜102可以是脂质双层。可包含例如可溶性蛋白质纳米孔跨膜分子复合物(PNTMC)以及感兴趣的分析物的大块(bulk)电解质114被安置到单元的表面上。可以通过电穿孔将单个PNTMC 104插入到膜102中。阵列中的单独膜既不化学地也不电气地连接到彼此。因而,阵列中的每个单元是独立的测序机器,其产生对于与PNTMC相关联的单个聚合物分子而言唯一的数据。PNTMC 104对分析物进行操作并且对通过以其他方式不可渗透的双层的离子电流进行调制。

模拟测量电路112连接到被电解质的薄膜108覆盖的金属工作电极110。电解质的薄膜108通过离子不可渗透的膜102而与大块电解质114隔离。PNTMC 104跨膜102,并且提供用于离子电流从大块液体流到工作电极110的仅有路径。单元还包括对电极(CE)116,所述对电极(CE)116是电化学电势传感器。所述单元还包括参考电极117。

图2图示了根据某些实施例的可以用于表征多核苷酸或多肽的纳米孔传感器芯片中的示例纳米孔单元200的实施例。纳米孔单元200可以包括由介电层201和204所形成的井205;膜,诸如在井205之上形成的脂质双层214;以及在脂质双层214上并且通过脂质双层214而与井205分离的样本腔室215。井205可以包含电解质体积206,并且样本腔室215可以持有包含纳米孔的大块电解质208(例如可溶性蛋白质纳米孔跨膜分子复合物(PNTMC))以及感兴趣的分析物(例如待测序的核酸分子)。

纳米孔单元200可以包括在井205底部的工作电极202,以及被布置在样本腔室215中的对电极210。信号源228可以在工作电极202与对电极210之间施加电压信号。单个纳米孔(例如PNTMC)可以通过由电压信号所引起的电穿孔过程而被插入到脂质双层214中,从而在脂质双层214中形成纳米孔216。阵列中的单独的膜(例如脂质双层214或其他膜结构)可以既不化学地也不电气地连接到彼此。因而,阵列中的每个纳米孔单元可以是独立的测序机器,其产生对于与纳米孔相关联的单个聚合物分子而言唯一的数据,所述纳米孔在感兴趣的分析物上操作,并且对通过以其他方式不可渗透的脂质双层的离子电流进行调制。

如图2中所示,纳米孔单元200可以被形成在衬底230(诸如硅衬底)上。可以在衬底230上形成介电层201。用于形成介电层201的介电材料可以包括例如玻璃、氧化物、氮化物等等。用于控制电激励并且用于处理自纳米孔单元200所检测的信号的电路222可以被形成在衬底230上和/或介电层201内。例如,多个经图案化的金属层(例如金属1至金属6)可以被形成在介电层201中,并且多个有源器件(例如晶体管)可以被制造在衬底230上。在一些实施例中,信号源228被包括作为电路222的一部分。电路222可以包括例如放大器、积分器、模拟到数字转换器、噪声滤波器、反馈控制逻辑和/或各种其他组件。电路222可以此外被耦合到处理器224,所述处理器224被耦合到存储器226,其中处理器224可以分析测序数据以确定已经在阵列中被测序的聚合物分子的序列。

工作电极202可以被形成在介电层201上,并且可以形成井205的底部的至少一部分。在一些实施例中,工作电极202是金属电极。对于非法拉第传导,工作电极202可以由金属或抗腐蚀和氧化的其他材料(诸如例如铂、金、氮化钛和石墨)制成。例如,工作电极202可以是具有经电镀的铂的铂电极。在另一示例中,工作电极202可以是氮化钛(TiN)工作电极。工作电极202可以是多孔的,从而增大其表面面积以及与工作电极202相关联的结果得到的电容。由于纳米孔单元的工作电极可以独立于另一纳米孔单元的工作电极,所以在本公开内容中工作电极可以被称为单元电极。

可以在介电层201上方形成介电层204。介电层204形成围绕井205的壁。用于形成介电层204的介电材料可以包括例如玻璃、氧化物、氮化硅(SiN)、聚酰亚胺或其他合适的疏水绝缘材料。介电层204的顶表面可以被硅烷化。硅烷化可以在介电层204的顶表面上方形成疏水层220。在一些实施例中,疏水层220具有大约1.5纳米(nm)的厚度。

由介电层204形成的井205包括在工作电极202上方的电解质206的体积。电解质206的体积可以被缓冲并且可以包括以下中的一个或多个:氯化锂(LiCl)、氯化钠(NaCl)、氯化钾(KCl)、谷氨酸锂、谷氨酸钠、谷氨酸钾、醋酸锂、醋酸钠、醋酸钾、氯化钙(CaCl2)、氯化锶(SrCl2)、氯化锰(MnCl2)、以及氯化镁(MgCl2)。在一些实施例中,电解质206的体积具有大约三微米(μm)的厚度。

还如图2中所示,膜可以被形成在介电层204顶部并且跨越过井205。在一些实施例中,膜可以包括被形成在疏水层220顶部的脂质单层218。在膜抵达井205的开口时,脂质单层218可以转变成脂质双层214,所述脂质双层214跨越过井205的开口。脂质双层可以包括磷脂或由磷脂组成,所述磷脂例如选自二植烷酰-卵磷脂(DPhPC)、1,2-二植烷酰-sn-丙三基-3-胆碱磷酸、1,2-二-O-植烷酰-sn-丙三基-3-胆碱磷酸(DoPhPC)、棕榈酰-油酰-卵磷脂(POPC)、二油酰-磷脂酰-甲酯(DOPME)、二棕榈酰卵磷脂(DPPC)、卵磷脂、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酸、磷脂酰肌醇、磷脂酰甘油、鞘磷脂、1,2-二-O-植烷酰-sn-丙三基;1,2-二棕榈酰-sn-丙三基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-350];1,2-二油酰-sn-丙三基-3-磷酸乙醇胺-N-乳糖基;GM1 神经节苷脂、溶血卵磷脂(LPC)或其任何组合。

如所示的,脂质双层214被嵌入有单个纳米孔216,其例如由单个PNTMC形成。如上所述,可以通过如下来形成纳米孔216:通过电穿孔而将单个PNTMC插入到脂质双层214中。纳米孔216可以足够大以用于在脂质双层214的两侧之间传递感兴趣的分析物和/或小离子(例如Na+、K+、Ca2+、CI-)中的至少一部分。

样本腔室215在脂质双层214之上,并且可以持有感兴趣的分析物的溶液以用于表征。溶液可以是水溶液,其包含大块电解质208并且被缓冲成最优离子浓度,并且被维持在最优PH处,以保持纳米孔216打开。纳米孔216跨脂质双层214,并且提供用于离子流从大块电解质208到工作电极202的仅有路径。除了纳米孔(例如PNTMC)和感兴趣的分析物之外,大块电解质208可以此外包括以下中的一个或多个:氯化锂(LiCl)、氯化钠(NaCl)、氯化钾(KCl)、谷氨酸锂、谷氨酸钠、谷氨酸钾、醋酸锂、醋酸钠、醋酸钾、氯化钙(CaCl2)、氯化锶(SrCl2)、氯化锰(MnCl2)、以及氯化镁(MgCl2)。

对电极(CE)210可以是电化学电势传感器。在一些实施例中,对电极210可以在多个纳米孔单元之间被共享,并且可以因此被称为公共电极。在一些情况中,公共电势和公共电极可以对于所有纳米孔单元、或至少特定群组内的所有纳米孔单元而言是公共的。公共电极可以被配置成将公共电势施加到与纳米孔216接触的大块电解质208。对电极210和工作电极202可以被耦合到信号源228,以用于跨脂质双层214而提供电激励(例如偏压),并且可以用于感测脂质双层214的电特性(例如电阻、电容和离子电流流动)。在一些实施例中,纳米孔单元200还可以包括参考电极212。

在一些实施例中,可以在创建纳米孔单元期间、作为验证或品质控制的部分而做出各种检查。一旦创建了纳米孔单元,就可以执行此外的验证步骤,例如用于标识如期望的那样执行的纳米孔单元(例如每个单元中一个纳米孔)。这样的验证检查可以包括物理检查、电压校准、开放通道校准以及标识具有单个纳米孔的单元。

B.通过合成的基于纳米孔的测序

纳米孔传感器芯片中的纳米孔单元可以使能实现并行测序,其使用通过合成(纳米-SBS)技术的基于单分子纳米孔的测序。

图3图示了通过使用纳米-SBS技术来执行核苷酸测序的纳米孔单元300的实施例。在纳米-SBS技术中,待测序的模板332(例如核苷酸分子或另一感兴趣的分析物)以及引物可以被引入到纳米孔单元300的样本腔室中的大块电解质308中。例如,模板332可以是圆形或线性的。核酸引物可以被与模板332的一部分杂交,向所述模板332的一部分可以添加四个不同地经聚合物标记的核苷酸338。

在一些实施例中,酶(例如聚合酶334,诸如DNA聚合酶)可以相关联于纳米孔316,以用于在将互补链合成到模板332中使用。例如,聚合酶334可以共价地附连到纳米孔316。聚合酶334可以通过使用单链核酸分子作为模板而催化核苷酸338往引物上的并入。核苷酸338可以包括标记种类(“多个标记”),其中核苷酸是四个不同的类型A、T、G或C之一。当经标记的核苷酸与聚合酶334恰当地复合的时候,可以通过电力而将标记拉入(加载)到纳米孔中,所述电力诸如在电场存在的情况下所生成的力,所述电场通过跨脂质双层314和/或纳米孔316所施加的电压而被生成。标记的尾部可以定位在纳米孔316的桶管(barrel)中。在纳米孔316的桶管中所保持的标记由于标记的独特的化学结构和/或大小而可以生成唯一的离子阻塞信号340,从而电子地标识标记所附连到的所增添的碱基。

如本文中所使用的,“被加载”或“穿过的”的标记可以是如下一个:其被定位在纳米孔中和/或保持在纳米孔中或其近旁达相当可观量的时间(例如0.1毫秒(ms)到10,000ms)。在一些情况中,标记在从核苷酸释放之前被加载到纳米孔中。在一些实例中,在被释放之后、在核苷酸并入事件时所加载的标记通过纳米孔(和/或被纳米孔检测到)的概率适当地高,例如90%到99%。

在一些实施例中,在聚合酶334被连接到纳米孔316之前,纳米孔316的电导可以很高,诸如例如大约300皮西门子(300pS)。在标记被加载到纳米孔中时,由于标记的独特的化学结构和/或大小而生成唯一的电导信号(例如信号340)。例如,纳米孔的电导可以是大约60 pS、80 pS、100 pS或120 pS,其各自对应于四种类型的经标记的核苷酸中之一。聚合酶然后可以经历异构化和转磷酸反应,以将核苷酸并入到增长的核酸分子中并且释放标记分子。

在一些情况中,经标记的核苷酸中的一些可能不与核酸分子(模板)的当前定位匹配(互补碱基)。不与核酸分子碱基配对的经标记的核苷酸也可通过纳米孔。这些不配对的核苷酸可以在如下时标内被聚合酶拒绝:所述时标短于恰当配对的核苷酸保持与聚合酶相关联的时标。被结合到不配对的核苷酸的标记可以快速通过纳米孔,并且在短的时间段(例如小于10ms)内被检测到,而被结合到配对核苷酸的标记可以被加载到纳米孔中,并且在长的时间段(例如至少10ms)内被检测到。因此,可以由下游处理器至少部分地基于在纳米孔中检测到核苷酸的时间而标识不配对的核苷酸。

包括被加载(穿过)的标记的纳米孔的电导(或等效地电阻)可以经由通过纳米孔的电流而被测量,从而提供标记种类以及因而在当前定位处的核苷酸的标识。在一些实施例中,直流(DC)信号可以被施加到纳米孔单元(例如,使得标记移动通过纳米孔所按的方向不被反转)。然而,通过使用直流而在长的时间段内操作纳米孔传感器可改变电极的组成,使跨纳米孔的离子浓度不平衡,并且具有能影响纳米孔单元寿命的其他不合期望的效应。施加交流(AC)波形可减少电迁移,以避免这些不合期望的效应并且具有如下所述的某些优点。利用经标记的核苷酸的本文中所述的核酸测序方法与所施加的AC电压完全兼容,并且因此AC波形可以用于实现这些优点。

在使用牺牲电极、在载流反应中改变分子特性的电极(例如包括银的电极)、或在载流反应中改变分子特性的电极的时候,在AC检测循环期间为电极再充电的能力可以是有利的。当使用直流信号的时候,在检测循环期间,电极可耗尽。再充电可防止电极达到耗尽限制,诸如变得完全耗尽,这在电极很小的时候可能是个问题(例如当电极足够小以提供具有每平方毫米至少500个电极的电极阵列的时候)。在一些情况中的电极寿命随着电极的宽度和总面积而缩放,并且至少部分地取决于电极的宽度。

用于测量通过纳米孔的离子电流的合适条件在本领域中是已知的,并且在本文中提供了示例。可以利用跨膜和孔所施加的电压来实施测量。在一些实施例中,所使用的电压范围可以从-400 mV到+400 mV。所使用的电压优选地在具有下限和上限的范围中,所述下限选自-400 mV、-300 mV、-200 mV、-150 mV、-100 mV、-50 mV、-20 mV和0 mV,所述上限独立地选自+10 mV、+20 mV、+50 mV、+100 mV、+150 mV、+200 mV、+300 mV和+400 mV。所使用的电压可以更优选地在100mV到240mV的范围中,并且最优选地在160mV到240mV的范围中。可能的是通过使用增大的所施加电势而按纳米孔增大在不同核苷酸之间的区别。通过使用AC波形和经标记的核苷酸来为核酸测序在2013年11月6日提交的、题为“Nucleic Acid Sequencing Using Tags”、专利公布号为US 2014/0134616的美国专利中被描述,所述美国专利通过引用以其全部被并入本文中。除了在US 2014/0134616中所描述的经标记的核苷酸之外,可以通过使用核苷酸类似物来执行测序,所述核苷酸类似物缺乏糖或非循环半部,例如以下五个常见核酸碱基的(S)-甘油核苷三磷酸(gNTP):腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和胸腺嘧啶(Horhota等人,Organic Letters, 8:5345-5347 [2006])。

在一些实现方式中,附加地或可替换地,其他信号值、诸如电流值可以被测量并且用于标识穿过纳米孔中的核苷酸。

图4图示了即将利用预加载的标记来执行核苷酸测序的单元的实施例。纳米孔401被形成在膜402中。酶(例如聚合酶403、诸如DNA聚合酶)与纳米孔相关联。在一些情况中,聚合酶403共价地附连到纳米孔401。聚合酶403与待测序的核酸分子404相关联。在一些实施例中,核酸分子404是圆形的。在一些情况中,核酸分子404是线性的。在一些实施例中,核酸引物405被与核酸分子404的一部分杂交。聚合酶403通过使用单链核酸分子404作为模板而催化核苷酸406往引物405上的并入。核苷酸406包括标记种类(“多个标记”)407。

图5图示了用于利用预加载的标记来进行核酸测序的过程500的实施例。阶段A图示了如在图4中所描述的组件。阶段C示出了被加载到纳米孔中的标记。“被加载”的标记可以是如下的一个:其被定位在纳米孔中和/或保持在纳米孔中或其近旁达相当可观量的时间,例如0.1毫秒(ms)到10000ms。在一些情况中,预加载的标记在从核苷酸释放之前被加载到纳米孔中。在一些实例中,如果在被释放之后、在核苷酸并入事件时标记通过纳米孔(和/或被纳米孔检测到)的概率适当地高,例如90%到99%,则标记被预加载。

在阶段A处,经标记的核苷酸(四个不同类型:A、T、G或C中之一)不与聚合酶相关联。在阶段B处,经标记的核苷酸与聚合酶相关联。在阶段C处,聚合酶坞接到纳米孔。在坞接期间通过电力将标记拉入到纳米孔中,所述电力诸如在电场存在情况下所生成的力,所述电场通过跨膜和/或纳米孔所施加的电压被生成。

相关联的经标记的核苷酸中的一些不是与核酸分子配对的碱基。这些不配对的核苷酸典型地在如下时标内被聚合酶拒绝:所述时标短于恰当配对的核苷酸保持与聚合酶相关联的时标。由于不配对的核苷酸仅瞬时地与聚合酶相关联,所以如图5中所示的过程500典型地不继续进行超过阶段D。例如,在阶段B或在过程进入阶段C之后不久由聚合酶拒绝不配对的核苷酸。

在各种实施例中,在聚合酶被坞接到纳米孔之前,纳米孔的电导可以是~300皮西门子(300 pS)。作为其他示例,在阶段C处,纳米孔的电导可以是大约60 pS、80 pS、100 pS或120 pS,其相应地对应于四种类型的经标记的核苷酸中之一。聚合酶经历异构化和转磷酸反应,以将核苷酸并入到增长的核酸分子中并且释放标记分子。特别地,在标记被持有在纳米孔中时,由于标记的独特化学结构而生成唯一的电导信号(例如参见图3中的信号310),从而电子地标识所添加的碱基。重复循环(即阶段A直到E或阶段A直到F)允许对核酸分子进行测序。在阶段D处,被释放的标记通过纳米孔。

在一些情况中,没有被并入到增长的核酸分子中的经标记的核苷酸将也通过纳米孔,如图5的阶段F中所见。在一些实例中未被并入的核苷酸可以通过纳米孔被检测到,但是所述方法提供用于至少部分地基于在纳米孔中检测到核苷酸的时间来在被并入的核苷酸与未被并入的核苷酸之间进行区分的手段。结合到未被并入的核苷酸的标记快速通过纳米孔,并且在短的时间段(例如小于10ms)内被检测到,而被结合到并入的核苷酸的标记被加载到纳米孔中,并且在长的时间段(例如至少10ms)内被检测到。

关于基于纳米孔的测序的另外的细节可以例如在以下中找到:题为“Nanopore-Based Sequencing With Varying Voltage Stimulus”的申请号为14/577,511的美国专利申请,题为“Nanopore-Based Sequencing With Varying Voltage Stimulus”的申请号为14/971,667的美国专利申请,题为“Non-Destructive Bilayer Monitoring Using Measurement Of Bilayer Response To Electrical Stimulus”的申请号为15/085,700的美国专利申请,以及题为“Electrical Enhancement Of Bilayer Formation”的申请号为15/085,713的美国专利申请。

II.测量电路

图6A示出了脂质膜或脂质双层612,其位于单元工作电极614与对电极616之间,使得跨脂质膜/双层612而施加电压。脂质双层是由两层脂质分子所构成的薄膜。脂质膜是具有若干分子(多于两个)的脂质分子的厚度的膜。脂质膜/双层612还与大块液体/电解质618接触。注意到,相比于图1中的工作电极、脂质双层和对电极,工作电极614、脂质膜/双层612、与对电极616倒置地被绘制。在一些实施例中,对电极在多个单元之间被共享,并且因此还被称为公共电极。所述公共电极可以被配置成通过将公共电极连接到电压源Vliq 620而将公共电势施加到与测量单元中的脂质膜/双层接触的大块液体。公共电势与公共电极对于所有测量单元而言是公共的。在每个测量单元内存在工作单元电极;与公共电极形成对比,工作单元工作电极614可配置成施加独立于其他测量单元中的工作单元电极的不同电势。

图6B图示了与图6A中所示的那个相同的在基于纳米孔的测序芯片的单元中的电路600。与图6A相比,代替于示出在工作电极与对电极之间的脂质膜/双层,而示出对工作电极与脂质膜/双层的电气性质进行表示的电气模型。

图6B图示了对纳米孔单元、诸如纳米孔单元200中的电气模型进行表示的电路600(其可以包括图2中的电路222的部分)。如上所述,在一些实施例中,电路600包括对电极640(例如对电极210),所述对电极640可以在纳米孔传感器芯片中的多个纳米孔单元或所有纳米孔单元之间被共享,并且因此还可以被称为公共电极。所述公共电极可以被配置成通过连接到电压源Vliq 620而将公共电势施加到与纳米孔单元中的脂质双层(例如脂质双层214)接触的大块电解质(例如大块电解质208)。在一些实施例中,AC非法拉第模式可以用于利用AC信号(例如方波)来调制电压Vliq,并且将它施加到与纳米孔单元中的脂质双层接触的大块电解质。在一些实施例中,Vliq是方波,其具有±200-250 mV的量值,以及例如在25与600 Hz之间的频率。在对电极640与脂质双层之间的大块电解质可以通过大的电容器(未示出)来被建模,所述大的电容器诸如100μF或更大。

图6B还示出了电气模型622,其表示工作电极602(例如工作电极202)和脂质双层(例如脂质双层214)的电气性质。电气模型622包括对与脂质双层相关联的电容进行建模的电容器Cbilayer 626以及对与纳米孔相关联的可变电阻进行建模的电阻器Rpore 628,其可基于纳米孔中特定标记的存在而改变。电气模型622还包括电容器Cdbl 624,所述电容器Cdbl 624具有双层电容cdbl并且表示工作电极602和单元的井(例如井205)的电气性质。工作电极602可以被配置成施加独立于其他纳米孔单元中的工作电极的不同电势。

传通设备606可以是一开关,其可以用于从电路600连接或断开脂质双层和工作电极。传通设备606可以由存储器位控制,以启用或禁用将跨纳米孔单元中的脂质双层来施加的电压激励。在脂质被沉积以形成脂质双层之前,在两个电极之间的阻抗可以非常低,因为纳米孔单元的井没有被密封,并且因此传通设备606可以被保持断开以避免短路状况。在脂质溶剂已经被沉积到纳米孔单元以密封纳米孔单元的井之后,可以闭合传通设备606。

电路600可以此外包括芯片上积分电容器Cint 608(ncap)。积分电容器Cint 608可以通过使用预设信号603来闭合开关601而被预充电,使得积分电容器Cint 608被连接到电压源Vpre 605。在一些实施例中,电压源Vpre 605提供具有例如900mV量值的恒定正电压。当开关601闭合的时候,积分电容器Cint 608可以被预充电到电压源Vpre 605的正电压水平。

在积分电容器Cint 608被预充电之后,预设信号603可以用于断开开关601,使得积分电容器Cint 608从电压源Vpre 605断开。在该点处,取决于电压源Vliq的水平,对电极640的电势可以处于比工作电极602(以及积分电容器Cint 608)的电势更高的水平处,或反之亦然。例如,在来自电压源Vliq的方波的正相位(例如AC电压源信号循环的亮或暗时段)期间,对电极640的电势处于比工作电极602的电势更高的水平处。在来自电压源Vliq的方波的负相位(例如AC电压源信号循环的暗或亮时段)期间,对电极640的电势处于比工作电极602的电势更低的水平处。因而,在一些实施例中,积分电容器Cint 608可以此外在来自电压源Vpre605的预充电的电压水平的亮时段期间被充电到较高水平,并且在暗时段期间被放电到较低水平,其由于在对电极640和工作电极602之间的电势差所致。在其他实施例中,充电和放电可以相应地发生在暗时段和亮时段中。

积分电容器Cint 608可以在固定时间段内被充电或放电,所述固定时间段取决于模拟到数字转换器(ADC) 610的采样速率,其可以高于1 kHz、5 kHz、10 kHz、100 kHz或更多。例如,利用1 kHz的采样速率,积分电容器Cint 608可以在大约1ms的时段内被充电/放电,然后电压水平可以在积分时段结束时被ADC 610采样并且转换。特定的电压水平将会对应于纳米孔中的特定标记种类,并且因而对应于模板上的当前定位处的核苷酸。

在通过ADC 610被采样之后,积分电容器Cint 608可以通过使用预设信号603来闭合开关601而被再次预充电,使得积分电容器Cint 608再次被连接到电压源Vpre 605。贯穿测序过程可以在循环中重复如下步骤:为积分电容器Cint 608预充电,等待固定的时间段以用于积分电容器Cint 608充电或放电,并且通过ADC 610来对积分电容器的电压水平进行采样和转换。

数字处理器630可以处理ADC输出数据,例如用于归一化、数据缓冲、数据过滤、数据压缩、数据缩减、事件提取、或将来自纳米孔单元的阵列的ADC输出数据组装成各种数据帧。在一些实施例中,数字处理器630可以执行进一步的下游处理,诸如碱基确定。数字处理器630可以被实现为硬件(例如以GPU、FPGA、ASIC等等来实现),或被实现为硬件和软件的组合。

因此,跨纳米孔所施加的电压信号可以用于检测纳米孔的特定状态。纳米孔的可能的状态之一是当标记附连的多磷酸盐从纳米孔的桶管中缺席的时候的开放通道状态。纳米孔的另四个可能的状态各自对应于当四个不同类型的经标记附连的多磷酸盐核苷酸(A、T、G或C)中的一个被保持在纳米孔的桶管中的时候的状态。纳米孔的又一可能的状态是当磷脂双层破裂的时候。

当在固定时间段之后测量积分电容器Cint 608上的电压水平的时候,纳米孔的不同状态可导致不同电压水平的测量。这是因为积分电容器Cint 608上的电压衰减(通过放电减小或通过充电增大)的速率(即积分电容器Cint 608上的电压相对于时间的曲线的斜率的陡度)取决于纳米孔电阻(例如电阻器Rpore 628的电阻)。更具体地,在与不同状态中的纳米孔相关联的电阻由于分子的(标记的)不同化学结构而不同时,电压衰减的不同的对应速率可以被观察并且可以被用于标识纳米孔的不同状态。电压衰减曲线可以是具有RC时间常量τ = RC的指数曲线,其中R是与纳米孔相关联的电阻(即Rpore 628),并且C是与R并联的、与膜(即电容器Cbilayer 626)相关联的电容。纳米孔单元的时间常量可以是例如大约200-500 ms。衰减曲线可能不确切地拟合到指数曲线,这是由于双层的详细实现方式所致,但是衰减曲线可以类似于指数曲线并且是单调的,因而允许对标记的检测。

在一些实施例中,与开放通道状态中的纳米孔相关联的电阻可以是在100 MOhm到20 GOhm的范围中。在一些实施例中,与处于其中标记在纳米孔桶管内部的状态中的纳米孔相关联的电阻可以是在200 MOhm到40 GOhm的范围内。在其他实施例中,积分电容器Cint608可以被省略,因为由于电气模型622中的电压衰减,通向ADC 610的电压将仍变化。

积分电容器Cint 608上的电压的衰减速率可以用不同的方式被确定。如以上所解释的,可以通过测量在固定时间间隔期间的电压衰减来确定电压衰减的速率。例如,积分电容器Cint 608上的电压可以首先通过ADC 610在时间t1处被测量,然后电压再次通过ADC 610在时间t2处被测量。当积分电容器Cint 608上的电压相对于时间的曲线的斜率更陡的时候,电压差更大,并且当电压曲线的斜率不太陡的时候,电压差更小。因而,电压差可以被用作用于确定积分电容器Cint 608上的电压衰减速率以及因而纳米孔单元的状态的度量。

在其他实施例中,可以通过如下来确定电压衰减的速率:测量对于所选量的电压衰减所需要的持续时间。例如,对于电压从第一电压水平V1降落或增大到第二电压水平V2所需要的时间可以被测量。当电压相对于时间的曲线的斜率更陡的时候,所需时间更少,并且当电压相对于时间的斜率不太陡的时候,所需的时间更大。因而,被测量的所需时间可以被用作用于确定积分电容器Cint608上的电压Vncap的衰减速率以及因而纳米孔单元的状态的度量。本领域技术人员将领会到可以用于测量纳米孔电阻的各种电路,例如包括电流测量技术。

在一些实施例中,电路600可以不包括被制造在芯片上的传通设备(例如传通设备606)和额外电容器(例如积分电容器Cint 608),从而促进在基于纳米孔的测序芯片的尺寸方面的缩减。由于膜(脂质双层)的薄性质,与单独的膜(例如电容器Cbilayer 626)相关联的电容可足以创建所需的RC时间常量,而无需附加的芯片上电容。因此,电容器Cbilayer 626可以被用作积分电容器,并且可以通过电压信号Vpre被预充电,并且随后通过电压信号Vliq被放电或充电。消除否则在电路中被制造在芯片上的额外电容器和传通设备可以显著减小纳米孔测序芯片中的单个纳米孔单元的占用空间,从而促进纳米孔测序芯片的缩放以包括越来越多的单元(例如在纳米孔测序芯片中具有数百万单元)。

图7示出了在AC循环的亮时段和暗时段期间从纳米孔单元所捕获的示例数据点。在图7中,为了图示的目的而夸大数据点中的改变。被施加到工作电极或积分电容器的电压(VPRE)处于恒定水平,诸如例如900mV。被施加到纳米孔单元的对电极的电压信号510(VLIQ)是被示出为矩形波的AC信号,其中占空比可以是任何合适的值,诸如小于或等于50%,例如大约40%。

在亮时段720期间,通过电压源Vliq 620被施加到对电极的电压信号低于被施加到工作电极的电压VPRE,使得可以通过电场而强制标记进入到纳米孔的桶管中,所述电场由在工作电极和对电极处所施加的不同的电压水平(其例如由于标记上的电荷和/或离子流所致)引起。当开关601断开的时候,在ADC之前的节点处(例如在积分电容器处)的电压将减小。在(例如在所指定的时间段之后)捕获了电压数据点之后,开关601可以闭合,并且测量节点处的电压将再次增大回到VPRE。所述过程可以重复以测量多个电压数据点。以此方式,在亮时段期间可以捕获多个数据点。

如图7中所示,在VLIQ信号的符号中的改变之后在亮时段中的第一数据点722可以低于后续数据点724。这可以是因为在纳米孔(开放通道)中没有任何标记,并且因而它具有低电阻和高放电速率。在一些实例中,第一数据点722可超过如图7中所示的VLIQ水平。这可以是由将信号耦合到芯片上电容器的双层的电容所引起的。在已经发生穿过事件、即标记被强制进入到纳米孔的桶管中之后可以捕获数据点724,其中纳米孔的电阻以及因而积分电容器的放电速率取决于被强制进入到纳米孔的桶管中的标记的特定类型。由于在Cdbl624处所积聚的电荷,针对每个测量,数据点724可稍微减小,如以下所提及的。

在暗时段730期间,被施加到对电极的电压信号710(VLIQ)高于被施加到工作电极的电压(VPRE),使得任何标记将会从纳米孔的桶管中被推出。当开关601断开的时候,测量节点处的电压增大,因为电压信号710(VLIQ)的电压水平高于VPRE。在(例如在所指定的时间段之后)捕获了电压数据点之后,开关601可以闭合,并且测量节点处的电压将再次减小回到VPRE。所述过程可以重复以测量多个电压数据点。因而,在暗时段期间可以捕获多个数据点,包括第一点增量732和后续数据点734。如上所述,在暗时段期间,任何核苷酸标记从纳米孔中被推出,并且因而除了用于使用在归一化中之外,获得关于任何核苷酸标记的最小限度信息。

图7还示出了在亮时段740期间,尽管被施加到对电极的电压信号710(VLIQ)低于被施加到工作电极的电压(VPRE),但是没有任何穿过事件发生(开放通道)。因而,纳米孔的电阻很低,并且积分电容器的放电速率很高。作为结果,所捕获的数据点、包括第一数据点742和后续数据点744示出低电压水平。

可预期在亮或暗时段期间所测量的电压对于纳米孔的恒定电阻的每个测量(其例如当一个标记在纳米孔中的时候在给定AC循环的亮模式期间进行)是大约相同的,但是当电荷在双层电容器Cdbl 624处积聚的时候可能不是这种情况。该电荷积聚可使得纳米孔单元的时间常量变得更长。作为结果,电压水平可移位,从而使得对于循环中的每个数据点,所测量的值减小。因而,在循环内,数据点可从数据点到另一数据点而稍微改变,如图7中所示。

III.单元形成和校准

图8是一流程图,其图示了根据某些实施例的形成并且校准纳米孔测序单元的示例方法。作为校准的部分,可以在测序单元的创建期间做出各种检查。一旦创建了单元,就可以执行此外的校准步骤,例如用于标识如期望的那样执行的测序单元(例如单元中一个纳米孔)。一旦校准步骤完成,就可以执行归一化和测序。

在步骤810中,执行对单元电路的物理检查。在施加任何缓冲或脂质溶液之前可以执行某些“干法检查”,并且在施加缓冲和或脂质溶液之后可以执行某些“湿法检查”。例如,测序芯片的每个单元可以针对开路(即断开状态)或短路(即短路状态)来被检查。可以在以下参考本章节的子章节A来找到根据某些实施例的对物理检查的另外的描述。

在步骤820中,在每个单元之上形成脂质层。根据某些实施例,在形成过程期间监控脂质层的厚度,并且各种反馈过程可运作以确保脂质层的最终状态是脂质双层的状态。例如,如果在将脂质溶液施加到单元的第一迭代之后确定了脂质层太厚并且不是双层,则可以发起薄化(thin)过程。可以在以下参考本章节的子章节A来找到根据某些实施例的对与脂质双层相关联的物理检查的另外的描述。

在步骤830中,针对测序芯片的每个单元来执行零点电压校准。由于每个单元的电子性质中的变化,每个单元可具有被施加到单元的关于零伏特的不同DC偏移。DC偏移在本文中被称为“零点”电压,并且可替换地被称为VMzero。例如,在芯片中的不同单元的模拟电路之间可存在制造瑕疵或变化。因而,针对一个单元的ADC可具有与针对另一单元的ADC不同的偏压。实施例可执行校准以计及这样的变化。可以在以下参考本章节的子章节B来找到根据某些实施例的对零点电压校准的另外的描述。

在步骤840中,纳米孔被添加到每个单元,并且单元被表征以确定每单元已经添加了多少纳米孔。在该步骤处,如果太多(多于一个)或太少(零个)纳米孔已经被添加到单元,则可以发起反馈过程以添加或从单元移除(多个)纳米孔。根据某些实施例,被发现具有多于或少于一个纳米孔的单元可以被停用,并且不在测序过程期间使用。可以在以下参考本章节的子章节C和E来找到根据某些实施例的对纳米孔表征的另外的描述。

在步骤850处,执行测序操作,从而从单元生成输出信号,例如,如以上参考图3-7所描述的。例如,标记的尾部可以被定位在纳米孔的桶管中,从而由于标记的独特化学结构和/或大小而生成唯一的输出信号。根据某些实施例,可以经由通过纳米孔的电流来测量输出信号,从而提供对标记种类以及因而核酸中当前定位处的核苷酸的标识。在一些实施例中,可以通过积分电容器来测量电流或电压,例如,如以上参考图6A-7所描述的。可以在以下参考章节IV来找到根据某些实施例的对测序操作的另外的描述。

在步骤860中,输出信号(例如电压和/或电流信号)被归一化。该归一化过程的部分可涉及测量和或推断(其通过使用单元的模拟电路模型)亮模式开放通道电压,并且使用该亮模式开放通道电压作为用于输出信号的归一化因子。可以在以下参考子章节D来找到根据某些实施例的对归一化过程的另外的描述。根据某些实施例,可以通过如以上参考图6描述的数字处理器来执行归一化方法。

在步骤870中,一个或多个处理器可以通过使用经归一化的输出信号来确定碱基。如以下在章节IV中所描述的,实施例可以通过使用经归一化的输出信号来确定针对经穿过的通道的电压簇,并且使用所述簇来确定截止电压以用于在不同的碱基之间进行区分。

根据某些实施例,校准和归一化检查的次序可以不同于在图8的流程图中所示的那个。例如,根据某些实施例,可以执行校准和归一化步骤一次,例如在初始制造处理步骤完成了之后(例如在形成脂质双层之前,在形成脂质双层之后,在形成纳米孔之前,在形成纳米孔之后等等)。根据某些实施例,在芯片的寿命上可以进行校准许多次(例如以经调度的间隔和/或在每个测序操作之前)。根据某些实施例,可以用“在线”方式、即对于所获取的每个原始数据点或每当获取了原始数据点的群组的时候进行校准和归一化。

尽管测序、校准和归一化在此处被示出为分离的步骤,但是这些步骤可以作为测序操作的部分一起被执行,即在测序期间获取的每个点或点的群组可经受校准和归一化步骤,而不偏离本公开内容的范围。例如,测序芯片的校准可以在测序开始之前和/或之后被校准。校准可以被执行以确保没有任何临界误差存在,其中这样的临界误差可阻止在一个或多个单元中执行测序。校准还可以用于获得校准值(例如以确定零点电压),所述校准值在对值(例如电压或电流)进行测量中被使用或在分析所测量的值中被使用以获得经校正或归一化的电压值,其可以最终被用于确定核酸的序列。

A.物理检查

干法检查可发生在任何缓冲剂(例如电解质溶液)流到测序芯片中之前以及在井之上形成了膜(例如脂质双层)之前。在干法检查中,序列芯片(例如针对每个测序单元)的电气组件被检查以确认它们恰当地运转,例如从每个井接收到具有预期值(例如在特定范围内)的信号。在该点处,在电极(例如电极202和210)之间应当不存在任何连接,因为在井或样本腔室中不存在电解质溶液。因而,将预期“断开”状态。如果存在连接(即短路状态),那么所测量的电压将会在预期范围之外(例如电压测量与参考电压相同),从而指示了单元有些问题。在一些实施例中,可以通过使用摆动点增量(WPD)或步进点增量(SPD)来执行干法检查。如以上所定义的,步进点增量(SPD)可以是在亮时段中的最后的日期点与下一个暗时段中的第一数据点之间的差异(即SPD正/负)或在暗时段中的最后的时间点与下一个亮时段中的第一数据点之间的差异(SPD负/正)。摆动点增量(WPD)可以是当应用摆动波形的时候在亮时段中的最后的数据点与下一个暗时段中的第一数据点之间的差异。因而,大于阈值的WPD或SPD可指示单元处于短路状态中,其中两个电极被电气地连接,尽管在两个电极之间不存在电解质溶液,并且因而单元的某些电气组件可能是有缺陷的(例如短路的)。在一些实施例中,其他参数、诸如第一点增量(FPD)或最后点增量(LPD)可以用于干法检查。

在湿法检查中,缓冲剂在芯片的表面之上流动。该检查可确保在电极之间存在通过缓冲剂的连接(例如短接)。断开状态(即在电极之间无连接)可指示对应的单元可具有某些缺陷。在一些实施例中,如在干法检查中,可以通过使用摆动点增量(WPD)或步进点增量(SPD)来执行湿法检查。例如,低于阈值的WPD或SPD可指示单元处于断开状态中,其中两个电极电气地断开,尽管在两个电极之间已经施加了电解质溶液,并且因而单元的某些电气组件可能是有缺陷的(例如断开的)。在一些实施例中,其他参数、诸如第一点增量(FPD)或最后点增量(LPD)可以用于干法检查。

在脂质(覆盖)层检查中,溶液可以在芯片之上流动。所述溶液可以是有机溶剂,其具有溶解在其中的脂质。在该过程的结束时,每个井应具有溶剂和脂质的塞子(plug)。在该点处在电极之间应不存在任何(或存在最小限度的)电气连接,因为脂质层将会非常厚,使得阻断溶液中离子的流动。

单元可开始于相对厚的脂质层,其被薄化以形成脂质双层。在薄化过程中,可以针对每个单元而测量ADC值,用于确定其中脂质层太厚的单元,并且双层可以被薄化。申请号为15/085,713的美国专利申请描述了用于使脂质层薄化的电气脂质薄化激励。

在薄化之后,可存在两分子厚的脂质双层,其充当用于覆盖井的膜。在实践中,可以使用任何水可渗透的膜。在脂质双层的边缘上是环形物,溶剂的锚定环。所述环形物可充当用于双层的脂质的储库。

可以通过使用第一点增量(FPD)来测量脂质层的厚度,所述第一点增量(FPD)对应于在循环的亮时段中的第一所测量的电压水平与循环的暗时段中的第一所测量的电压水平之间的差异。例如,FPD可以是在图7中所示的高的第一点之间的差异。第一点增量与双层的电容成比例,并且双层厚度与电容成比例。当脂质层厚(例如数微米)的时候,电容是小的。到厚度向下缩小到大约4nm的时候,电容是可测量的某物,例如大约100毫微微法拉。双层具有确定性的厚度,其基于所使用的分子,其中某些小差异基于双层的分子如何被布置以及剩下多少溶剂。根据某些实施例,脂质双层的厚度可以是从4.2到4.3nm。双层(或其他膜)的电容与横向面积成比例,所述横向面积取决于存在多少环形物。因而,FPD可提供:是否存在双层,以及已以何种程度靠近于边缘地形成了双层。在一些实施例中,可以根据所测量的数据点来确定其他参数、诸如WPD,以执行脂质(覆盖)层检查。

在一些实施例中,系统中的反馈机制可以用于使脂质层进一步薄化。为了使脂质层薄化,可以施加横向压力(例如以高速跨脂质层顶部流动的缓冲剂)。作为另一示例,人员可开启AC信号以施加AC偏置,其可有效地来回摇动所述层,直到它实现双层的积极(energetically)稳定状态为止。这样的过程可移除在脂质双层的形成过程中的任何局部最小值。

反馈可通过如下而起作用:测量随时间的FPD,并且调节反馈。具有足够小的FPD(例如在阈值以下)的单元可具有被执行以使该特定单元薄化的动作。这样的过程可继续,直到至少所指定的百分比(例如70%)的单元具有可用双层为止。在一些实施例中,可以根据所测量的数据点来确定WPD,以提供反馈。

B.电压校准

为了针对不同的电压来校准系统,可以确定每个单元的零点电压(在本文中还被称为VMzero)。出于电子原因,每个单元可具有不同的DC偏移。例如,在芯片中的不同单元的模拟电路之间可存在制造瑕疵或变化。而且,出于电化学原因,偏置可以被构建到系统中。由于这样的制造可变性,一个电极可稍微不同于另一个。这可引入从单元到单元的偏移。另外,电极的表面化学可使得它们充当电池,并且因而每个单元可具有稍微不同的电势,其可贡献于每个单元的VMzero。根据某些实施例,净效应是所测量的ADC信号被上推或下推的信号,其取决于VMzero的值。实施例可执行校准以计及在单元之间的这样的变化。

图9是一流程图,其图示了根据某些实施例的用于对测序芯片的纳米孔测序单元进行校准的示例方法900。方法900可以在各种时间被执行,例如在膜已经形成之前,在膜已经形成之后(但是在孔被插入之前),和/或在孔已经被插入到单元中之后。该校准可以在校准过程中的多个时间被执行,其中VMzero的不同值被获得并且用于给定阶段。

在步骤910中,针对测序芯片的每个单元获得零点电压(其在本文中也被称为VMzero)。在一些实施例中,通过ADC来测量VMzero,其中零电压被施加到单元(例如没有用于电流流动的路径)。这样的零施加电压的状态可以用各种方式来被实现,例如通过断开工作电极和/或对电极或通过使两个电极处于相同电压。以此方式,每个ADC可接收不同的浮动电压。此外,从模拟值到数字的转换可以随ADC而变化。根据某些实施例,VMzero的所测量的集合——每个单元一个——可以被存储在存储器中。这些所存储的值可以用于校准每个单元(即从每个单元移除偏移),从而确保亮和/或暗时段电压二者的ADC测量从单元到单元是可比较的。如上所述,可以通过ADC来测量每个单元的零点电压,所述ADC例如图6中所示的ADC 610。

测序芯片可包括数千或甚至数百万单元,并且因而可测量数千或甚至数百万的零点电压。根据某些实施例,在纳米孔被插入到每个单元的脂质双层中之前,零点电压可以被测量并且被存储在存储器中。在一些实施例中,存储器可以被集成到测序芯片上,或可以是操作地连接到测序芯片的外部存储器存储,例如诸如任何形式的计算机存储器,如以下参考图13所描述的。可替换地或附加地,在纳米孔被插入到每个单元的脂质双层中之后,零点电压可以被测量。作为另外的示例,零点电压可以作为表征或校准步骤的部分而针对每个芯片被测量一次,或可以在芯片的寿命之内被测量多次。例如,VMzero可以在双层电容器的电容改变时随时间改变,并且因而可以在测序运行之前和/或之后被测量以确保系统恰当地被校准。

在步骤920中,在纳米孔已经被插入到脂质双层中之后,可以执行测序操作并且可以获得(例如通过测序芯片的ADC)多个所测量电压。可以在跨芯片的每个单元施加交变信号期间执行测序。以上参考图3-5描述了以此方式获得电压数据的过程。

在步骤930中,通过使用所存储的VMzero值来校正所获得的电压值。例如,根据某些实施例,在单元的测量值与其VMzero值之间的差异可以被计算,例如通过图4中的数字处理器430。更具体地,可以通过如下而为每个单元获得经校正或校准的电压值的集合:从所测量的电压值中减去该单元的VMzero。

因此,零点电压值(例如,如VMzero)可以针对每个单元被确定,并且用于优化ADC的动态范围。例如,ADC可以提供所指定的数据范围,例如8位无符号范围(0到255)。在数字值之间的差异通过ADC的制造来被控制,但是特定的模拟范围可变化(例如,如受ADC参考电压控制)以对应于测序单元的模拟电压的预期范围,其计及单元特定的VMzero。针对ADC的零值不需要对应于零伏特,因为相对电压是所使用的电压。

在一个实施例中,存在两个参考电压,其设置ADC电压范围的底部和顶部。两个电压可具有不同的符号。可以在外部设置参考电压。在使用不同的生物化学时,参考电压可改变。实际信号应在参考范围内,并且理想地占据该参考范围中的大部分。根据某些实施例,针对每个单元的所测量的VMzero的知识能可以用于独立地为每个单元设置参考电压。这可以确保正在使用ADC的全动态范围,从而最小化量化噪声。

作为经由图6的开关601被注入到电路600的电荷的结果,还可发生偏移。开关601用于重设积分电容器Cint 608上的电压以便通过使用ADC来取得新测量结果。每当开关闭合的时候,某个量的电荷被注入到该单元的电路中。对于电荷注入,存在某个数量的电子从源极到漏极的转移,从而将某个量的电荷倾倒入系统中。电荷分布在电容器之间,这创建偏移。如果偏移是常量,则它将会是可接受的,但是它不是常量。

对于为什么这样的电荷注入偏移可变化的示例如下。随着时间,双层的表面区域可变成更大或更小的双层(例如,由于向内和向外慢慢移动的边缘处的环状物)。该改变可使得双层的电容的比例相对于积分电容(例如608)的电容而改变。该比例影响电路的时间常量,并且因而影响在特定量的时间之后所测量的电压是什么,如可以通过ADC被测量。如果该比例被确定仅一次,在该比例值可变得过时,并且因而不正确。实施例可以使用电荷注入的量值、双层的电容、以及它如何改变来确定用于补偿电荷注入偏移的归一化。

通过使用图6作为示例,开关601重设系统的电压,在此之后,在开关601断开之后的所指定量的时间处测量ADC值。重设和测量被重复。由于开关是非理想的,所以每当开关601闭合的时候,一些电荷被注入到电路中。电荷在Cbilayer 626上积聚,从而使得当电荷在Cbilayer上积聚时基线电压改变。

当电荷被注入的时候,电荷分布在电路中。主要地方是Cbilayer 626以及积分电容器Cint 608。在两个电容器之间的电荷的比例取决于双层的尺寸。特定单元的偏移随时间改变,因为电压在积分电容器Cint 608上改变。如果该比例保持相同,那么它将不改变所测量的偏移,因为它将会随时间保持相同。但是在Cbilayer 626改变时,不同量的电荷将被注入到Cbilayer 626和积分电容器Cint 608,从而改变偏移。如果电容不随时间改变,则这样的问题将不存在,如对于半导体电容器而言典型的那样,但是对于充当电容器的生物化学元件而言并非如此。

作为解决方案,可随时间测量Cbilayer 626。积分电容器Cint 608的电容将不典型地随时间改变,因为它可能是半导体元件。电荷可以在测序运行的开始时被量化,并且对于每个单元而言可以是不同的。该电荷可以作为校准的部分、例如作为确定VMzero的部分而被确定。可以通过使用第一点增量来测量Cbilayer 626,所述第一点增量是在循环在极性(例如方波的极性)方面切换之后针对亮和暗模式所测量的第一电压中的差异。在第一点增量(FPD)与Cbilayer 626之间存在关系。这样的关系在单元和单元之间可以是恒定的。

因此,FPD中的改变可以用于确定VMzero的偏移中的改变。所述关系基于如针对开始的循环所测量的被注入到系统中的电荷的量,针对单元的积分电容器Cint 608的值,Cbilayer 626的初始测量结果,以及开始的循环的FPD中的改变。

在一些实施例中,以下技术可以用于确定作为电荷注入的结果而对VMzero的改变。电荷q = C * V,其中q是电荷,C是电容,并且V是电压。C = Cbilayer 626 + Cncap(积分电容器Cint 608)。V = q / (Cbilayer + Cncap),并且由于改变的双层电容所致的电压中的改变是:dV = q ( 1 / (Cbl_new + Cncap) - 1 / (Cbl_old + Cncap) )。该电压中的改变可以用于在其他归一化之前修改ADC值,例如用于补偿增益漂移或基线移位。

C.纳米孔插入

纳米孔可以用多种不同的方式被插入到脂质双层中。例如,如果依赖于芯片中的压力来随机地将孔扩散到膜中,那么比率将会受二项分布管控。在这样的情形中,许多单元将会具有零个纳米孔,一些将会具有一个,一些将会具有两个,并且大多数将不会仅有一个。然而,根据某些实施例,每单元仅一个纳米孔对于测序而言是最好的。如果每单元存在多于一个纳米孔,例如每单元两个纳米孔,那么来自该孔的信号将是来自两个孔的两个信号的某种组合,其可使得水平有误差,因而系统具有与单孔单元不同的等效电路。此外,经组合的信号将会起因于标记在不同时间进入纳米孔,从而使得难以知道在给定时间要调用哪个碱基。

根据某些实施例,电穿孔可以用于将纳米孔插入到双层中。电穿孔跨双层而施加方波以给它加压力。太高的电压将会使脂质层爆裂。但是合适的电压可提供裂缝,在该处纳米孔可以更容易地被插入。

如以上所提及的,对于每个单元而言有益的是具有确切一个纳米孔。为了实现这,根据某些实施例,可以在施加电穿孔信号之前、期间以及之后为每个单元取得诊断测量结果,例如类似于以上参考图6A-7所描述的开放通道测量结果的电压值可以被测量。所测量的值于是然后可以被分析以确定所测量的值是否对应于针对具有仅一个纳米孔的单元将会预期的值。可以通过追踪在电穿孔过程期间的电压改变来检测单个纳米孔,并且如果电压显著改变,那么假定穿孔已成功地完成。在一些实施例中,在循环的暗时段中的两个点之间的差异(即暗衰减增量(DDD))和/或LPD可以用于在电穿孔过程期间执行检查。

当观察到纳米孔已经被添加到单元的时候,可针对该井而停止电穿孔过程。这可以针对每个井独立地进行。以上过程可以结合诊断技术被使用,所述诊断技术采用针对跨测序芯片的所有单元的开放通道电压的电压直方图/分布来标识指示单个纳米孔单元的开放通道电压或开放通道电压范围。对于在第一电穿孔步骤之后没有任何孔的那些单元,可以重复电穿孔。

D.开放通道校准

在电穿孔之后,在适当位置没有标记的单元的输出电压可以被测量以确定单元的初始电压。如以上参考图6A-7所描述的,所测量的该ADC值被称为开放通道电压。开放通道电压的值可以被使用在归一化中,如稍后所描述的。另外,开放通道的值可以用于标识具有单个纳米孔的单元,如在下一章节中所描述的。

根据某些实施例,作为开放通道校准过程的部分,还可以确定循环衰减形状,如以上参考图6A-7所描述的。例如,响应于被提供到对电极的交变信号(VLIQ),ADC可测量积分电容器、例如图6B的积分电容器Cint 608上的输出电压。如图7中所示,由ADC所测量的电压不确切地追踪方波驱动信号,而是相反地可示出作为Cdbl上电荷的积聚的结果在驱动信号VLIQ的每个循环内的亮或暗时段之上的衰减。根据某些实施例,作为开放通道校准过程的部分,可以测量一个AC循环内的每个时段的结果得到的衰减形状。开放通道的初始值可以有助于确定与不同的分子(例如四个不同的碱基)对应的通道的预期值。

在一些实施例中,紧接在穿孔过程完成之后,可以为测序芯片的每个单元执行开放通道校准。开放通道校准过程还可以利用在测序操作期间开放通道数据的存在,并且因而可以作为在以下详细描述的数据归一化过程期间的预处理步骤的部分而被执行。

在测序期间所测量的ADC值可以被归一化以提供更大的准确性。在一些实施例中,在AC驱动电压的亮时段(其在本文中被称为“亮模式电压”或可替换地被称为“亮时段电压”)期间所获取的电压水平数据被归一化。例如,亮模式电压可以通过如下被归一化:将每个所测量的亮模式数据点除以当纳米孔处于未被穿过的状态中的时候单元的亮模式电压,所述亮模式电压在本文中被称为“开放通道电压”或“亮模式开放通道电压”。通过使亮模式电压水平数据归一化,原始ADC测量结果的动态范围被重缩放到经归一化的范围,一般地提供在0与1之间的范围,尽管取决于用于亮模式开放通道电压的特定值,大于1的值是可能的。

归一化可允许补偿对系统的改变,例如测序单元的电气性质中的改变。例如,电路600的电容可随时间改变。例如,电容器Cbilayer 626的电容是由于在双层面积或厚度中的物理改变、例如在井的边缘处,其中这样的改变被称为增益漂移。作为另一示例,作为在亮时段和暗时段之间的电荷转移方面的差异的结果,电荷可在单元中积聚,其被称为基线移位(并且有时为快速基线移位)。缓慢的基线移位可由测量电路中的可变性以及双层膜的电气性质中的改变引起。在以下更详细地描述这些示例。

这样的改变可影响针对确切相同的状态所测量的值,从而引起不稳定性。然而,归一化可补偿这样的改变以提供随时间稳定的经归一化的值(例如电压或电流),从而允许在确定核酸序列方面的更大准确性。

E.对具有单个纳米孔的井的标识

如以上所提及的,所期望的是测序芯片的每个单元具有仅一个纳米孔。根据某些实施例,可以通过对开放通道电压的量值(例如,在没有标记存在于纳米孔中的情况下在亮或暗模式期间所测量的ADC值)的统计分析来标识具有一个纳米孔的单元。可以通过如下来计算所测量的电压的直方图(或分布):将所测量的电压装仓(bin)并且对具有落在特定电压仓内的电压的单元的数目进行计数。可以分析所述直方图以确定最大幅度峰值,即在芯片的单元之中的最常见的电压可以被确定。最大幅度峰值可以被约束成在某个预期的范围内,这可以通过排除直方图的最后一仓来进行,所述最后一仓包括比所指定的值更高的所有所测量电压。

根据某些实施例,最常见的电压应对应于单个纳米孔单元,特别是当电穿孔过程被监控并且经受反馈机制的时候。通常,穿孔过程的参数可以在先前被调谐使得对于大多数单元,将形成仅仅单个孔,其中相对小的群体形成多于一个孔或根本没有任何孔。在另一实施例中,第二最大幅度峰值可以被用作与具有仅一个纳米孔的单元相对应的峰值,而最大幅度峰值可对应于具有裸露双层、即零个纳米孔的单元。

图10是一流程图,其图示了根据某些实施例的用于对测序芯片的单元中的纳米孔数目进行表征的示例方法1000。可以在孔插入过程之后(或至少在孔插入的初始阶段之后)执行方法1000。可以通过例如以下各项来执行方法1000:数字处理器630、以下在图13和图19中所描述的处理单元或处理器,和/或与测序单元的电路耦合的任何控制逻辑,包括用于控制逻辑提供控制信号(例如以控制另外的穿孔步骤)的前向连接。

在步骤1010中,获得针对测序芯片中的单元的开放通道电压。例如,可以用与以上参考图7以及在本公开内容中别处所描述的电压类似的方式来获得开放通道电压。可以通过在逻辑系统、例如FPGA、ASIC或可编程处理器处接收来自测序芯片的电压来实现开放通道电压的获得。

图11A-11C示出了针对单元的不同状态的样本开放通道电压数据。图11A示出了针对具有单个纳米孔的单元——其被称为单纳米孔单元——的开放通道电压数据1110(亮和暗时段二者)。图11B示出了针对具有零个纳米孔的单元——其被称为零单元双层——的开放通道电压数据1120(亮和暗时段二者)。图11C示出了针对具有短路的单元——其被称为短路单元——的开放通道电压数据1130(亮和暗时段二者)。

根据某些实施例,在步骤1010中所获得的开放通道电压可以是单点测量结果或多点测量结果。例如,单个亮通道数据点(例如,如在图11B中所示)可以针对每个单元被测量;并且用于对单元进行表征,即单元是否是单个纳米孔、零个纳米孔、短路等等。针对Vmzero的值可以从针对给定单元的数据点中被减去。对于多点测量结果,亮模式电压的集合可以在一起被求平均,其中在求平均之前或之后减去Vmzero。多点方法可涉及计算差异数据,例如在一个循环的亮和暗时段之间的逐点差异,或在AC循环的时段内的逐点差异(例如在亮时段或暗时段内的第一和最后的点之间的差异)。

图11A-11C示出了“最后点增量”(“LPD”)方法,其涉及从暗时段的对应的最后的点中减去亮时段的最后的点,或反之亦然。在图11A中,LPD 1115是大约80 ADC最低有效位(LSB),并且表示单个纳米孔单元的LPD。在图11B中,LPD 1125非常接近0 ADC LSB,并且表示零纳米孔单元(即具有裸露双层的单元)的LPD。在图11C中,LPD 1135是大约190 ADC LSB,并且表示短路单元的LPD,所述短路单元可对应于没有膜或多个孔的单元。虽然针对每个双层状态的ADC LSB的精确值可随单元变化,如以下进一步详细描述的,但是图11A-11C示出了原则上LPD可以用于在单元的双层上的不同纳米孔配置之间进行区分。因而,根据某些实施例,作为步骤1010的部分,测量每个单元的LPD。作为其他示例,可以使用第一点增量或平均点增量(在针对亮和暗时段的平均值之间的差异)。在其他示例中,可以通过使用相同时段内的点来得到增量测量结果,在所述情况中,测量结果被称为“衰减增量”,因为所述增量对循环时段内的电压衰减的量进行测量,例如可以通过减去在暗时段期间所测量的第5和第10个点来计算暗衰减增量。在仍还有其他示例中,可以相对于在正常亮或暗时段外部所测量的均值来测量增量,例如可以使用“零增量”,其中在亮时段值和偏移值之间测量零增量,例如在跨单元所施加的零伏特的情况下所测量的均值偏移。

在步骤1020中,通过使用在步骤1010中所获得的电压值来计算直方图(其在本文中还被称为电压分布)。所述直方图可取任何类型的所测量电压、包括单点和/或多点测量结果二者作为输入。对于上述LPD的示例,为了计算直方图,所测量的LPD值的全范围可被拆分成仓。例如,如果所测量的ADC LSB范围从0到255,则数据可以被装仓,其中一个仓具有一个ADC LSB的宽度,从而具有带256个仓的直方图。在不偏离本公开内容的范围的情况下,其他仓宽度(例如2、3等等)是可能的。一旦选择了仓宽度,具有该特定ADC值的单元的数目就被计数并且被添加到直方图。

图12示出了根据某些实施例的样本直方图数据。相对大的单个纳米孔峰1210在数据中可见。直方图的最左部分示出了针对具有零个纳米孔(低电压)的单元以及还针对具有伪孔的单元的计数,所述伪孔例如类似于孔的表现。直方图的最右部分示出了针对具有多于一个孔的单元以及还针对具有短路(例如无膜)的单元的计数。

参考回到图10,在步骤1030中,标识了与具有单个纳米孔的单元(其在本文中还被称为单孔单元)相对应的直方图峰。根据某些实施例,在步骤1010中获得所测量的电压数据之前,既不需要知道峰值、也不需要知道峰值宽度。例如,峰检测例程可检测峰的边界和特性,例如用于标识单个纳米孔峰。例如,在电压值的预定范围内的最大幅度峰的中心可以被标识为单个纳米孔峰。在一些实施例中,在初始峰检测例程期间可忽略在电压范围的结尾处或其近旁的仓,例如,在图12中,峰1210是在2和250的仓之间的最大幅度峰。可经由来自其他测序芯片的经验数据来确立用于标识峰的电压范围。

在步骤1040中,确定位于单个纳米孔峰内的单元的第一集合。根据某些实施例,步骤1040可将具有在最大幅度峰的所标识的宽度内的电压的所有单元标识为单个纳米孔单元的集合。宽度参数可以是例如半极大处全宽度,其可以被用作用于标准偏差的代理。在一些实施例中,宽度可以被取为标准偏差的所指定数目,例如2、3、4等等。还可以使用直方图中局部极小值的测量结果。例如,在零峰与单个纳米孔峰之间的局部最小值可以用于确定用于标识单个纳米孔峰的宽度的基线。因此,实施例可以确定在何处局部最大值和最小值在直方图数据内。在直方图下在各个局部最小值之间的积分、即整合面积可以用于标识具有最大面积的峰,所述峰将会对应于单个纳米孔峰,这在如下假定之下:即这是针对作为整体的芯片的最大群体。

应当理解到,与具有单个纳米孔的单元相对应的直方图峰不需要仅仅包括单个纳米孔单元以排除其他类型的单元。如图12中所示,峰不是极其窄,并且照此理解的是:虽然在峰内的单元的群体将被单个纳米孔单元主导,但是一些非单个纳米孔单元可能碰巧具有落在峰内的电压,这取决于如何限定峰的宽度。根据某些实施例,峰的宽度可以相对于峰值被限定,例如电压截止可以被选择成是在该处直方图的水平是直方图峰的最大值的某个所指定的分数(例如半极大处全宽度、1/e2 、119.9%水平等等)。可以基于上述最小值和最大值检测来确定电压截止。截止内的电压值限定将被视为单个纳米孔单元的单元的集合,其中非单个纳米孔单元的数目随着宽度减小而减小。截止的安置将涉及在以下之间的权衡:捕获可用单个纳米孔单元中的大部分而同时还排除具有与单个纳米孔不同的某事物(例如零纳米孔单元、短路、两个或更多纳米孔单元、伪孔单元等等)的单元中的大多数。

在图12中所示的示例中,截止1220被安置在29 ADC LSB处,并且截止1230被安置在115 ADC LSB处。在该示例中,截止1220消除大部分伪孔和零孔单元(其具有小于29 ADC LSB的开放通道电压),并且同样地,截止1230消除大部分多孔和短路单元(其具有大于115 ADC LSB的开放通道电压)。根据某些实施例,为了改善芯片的准确性,具有在截止外的电压的单元可以被停用,或者其输出可以被选择性地移除或忽略。例如,在表征之后,具有单个纳米孔的单元可以通过如下被有效地加标签:将针对这些单元中每一个的唯一标识符存储在存储器中。在测序操作期间,处理器于是可以仅仅激活与所存储的标识符相关联的那些孔。逆向也是可能的,其中利用被存储在存储器中的唯一标识符来为待停用的单元加标签。

在步骤1050中,可以通过仅仅使用所标识的单个纳米孔单元来执行测序操作。测序操作可以如以上参考图3、5和7所述的那样继续进行。

根据所测量的开放通道电压数据的直方图(或分布)来确定单个纳米孔单元的集合可以是用于标识具有单个纳米孔的单元的鲁棒过程,因为可以做出最小假定,如与使用固定截止值相对的那样。由于单元可随芯片而变化并且可涉及不同的生物化学,所以这样的鲁棒过程是合期望的。例如,人员可能不知道每个单纳米孔峰的电压的确切值,并且各种纳米孔可以用于不同的芯片。此外,脂质双层可随时间改变。由于单元的增益取决于Rpore和Cbilayer二者,所以较大的井或不同的溶剂(或不同的环形物)可改变增益,并且因此改变开放通道和穿过电压。

IV.测序操作

一旦芯片的可用单元被标识,就可以运行生产模式来为核酸测序,每个可用单元一个。为了执行测序,积分电容器(例如积分电容器Cint 608 (ncap)或电容器Cbilayer 626)的电压水平可以通过ADC(例如ADC 610)被采样和转换,而同时经标记的核苷酸被添加到核酸。核苷酸的标记可以通过经由对电极和工作电极而被施加的跨纳米孔的电场来被推送到纳米孔的桶管中,例如当所施加的电场是使得Vliq高于Vpre那样的时候。

A. 穿过

穿过事件是当经标记的核苷酸被附连到模板(例如核酸片段)并且标记进和出纳米孔的桶管的时候。这在穿过事件期间可发生多次。当标记处于纳米孔的桶管中的时候,纳米孔的电阻可以较高,并且较低的电流可以流过纳米孔。

在测序期间,在一些AC循环中标记可不处于纳米孔中(被称为开放通道状态),其中由于纳米孔的较低电阻,电流是最高的。当标记被吸引到纳米孔的桶管中的时候,纳米孔处于亮模式(或时段)中。当标记从纳米孔的桶管中被推出的时候,纳米孔处于暗模式(时段)中。

B.亮和暗时段

在AC循环期间,在积分电容器上的电压可以被ADC采样多次。例如,在一个实施例中,AC电压信号跨系统以例如大约100Hz被施加,并且ADC的获取速率可以是大约每单元2000Hz。因而,可存在每AC循环(AC波形的循环)所捕获的大约20个数据点(电压测量结果)。与AC波形的一个循环相对应的数据点可以被称为集合。在针对AC循环的数据点的集合中,可存在当例如Vliq低于Vpre的时候所捕获的子集,其可以对应于亮模式(时段),其中标记被强制进入到纳米孔的桶管中。另一子集可以对应于暗模式(时段),其中当例如Vliq高于Vpre的时候,通过所施加的电场而将标记从纳米孔的桶管中推出。

C. 所测量的电压

对于每个数据点,当开关601断开的时候,在积分电容器(例如积分电容器Cint 608(ncap)或电容器Cbilayer 626)处的电压将作为通过Vliq充电/放电的结果而以衰减方式改变,例如,如当Vliq高于Vpre的时候从Vpre到Vliq的增大,或当Vliq低于Vpre的时候从Vpre到Vliq的减小。在工作电极充电时,最终电压值可从Vliq偏离。积分电容器上的电压水平的改变速率可以通过双层的电阻值来被管控,所述双层可以包括纳米孔,其进而可以包括在纳米孔中的分子(例如经标记的核苷酸的标记)。可以在开关601断开之后的预定时间处测量电压水平。

开关601可以按数据获取速率而运作。在两个数据获取之间、典型地正好在通过ADC的测量之后可以闭合开关601达相对短的时间段。所述开关允许针对每个循环收集多个数据点。如果开关601保持断开,则积分电容器上的电压水平,以及因而ADC的输出值将会完全衰减并且停留在那里。这样的多个测量可以允许在固定ADC情况下的较高分辨率(例如由于较大数目的测量的8位到14位,所述测量可以被求平均)。所述多个测量还可以提供关于穿过进入纳米孔中的分子的动力学信息。定时信息可以允许确定穿过发生了多长时间。这还可以用于有助于确定被添加到核酸链的多个核苷酸是否正被测序。

在章节II中可找到测量电路以及用于意指在ncap处的电压的测量电路的操作的更多细节,所述电压可以用于确定纳米孔单元的状态。

D.归一化

在测序期间所捕获的ADC输出数据可以被归一化以提供更大的准确性。归一化可计及偏移效应,诸如循环内衰减循环形状、增益漂移以及基线移位。如上所述,可以通过使用所测量的开放通道电压来执行归一化。例如,在一些情形中,亮模式开放通道电压可以是恒定的,并且因而所有亮模式数据可以除以相同的归一化因子来执行归一化。

通常,每个测序单元具有电压增益,所述电压增益取决于脂质双层电容。电压增益对应于电压差,所述电压差在电极对(例如对电极210与工作电极202)之间被实现。例如,考虑到针对电容器的C=q/V方程,随着电容增大,当存在相同量的电荷的时候,电压将会减小。因此,如果脂质双层电容随时间改变,那么电压增益随时间改变。如果电压增益随时间改变,那么亮模式和暗模式(开放通道和被穿过的二者)可随时间改变。在任何现实系统中,双层电容可随时间改变,例如在双层变形时。这样的改变典型地在数百或数千秒的时标上发生,并且尽管比典型的穿过事件更缓慢,但是在期望高准确性测量结果的情况下仍应当被计及。

由于电压增益可随时间改变,所以亮模式中的开放通道电压随时间可能不是恒定的,并且因而上述单值归一化(即将每个事物除以相同的归一化因子)可能未能使随时间的整个信号归一化。代替于恒定归一化,可以应用更复杂的可变归一化,例如可以通过将每个原始亮模式的所测量的ADC值除以该点的开放通道值的估计来实现归一化。对于每个未被穿过的区,开放通道电压的估计可以通过任何数目的方式来被做出,例如通过取局部均值或通过使用更复杂的信号处理技术、诸如卡尔曼滤波器,如以下更详细地描述的。因而,可以为亮模式的开放通道值获得局部估计,使得通过使用对于数据点而言为局部的所估计的电压来归一化该数据点。

另一方面,信号的穿过区可提供挑战。对于一些穿过事件,如果穿过速率足够缓慢,则可存在可得到的开放通道数据。当穿过速率相对缓慢的时候,在标记被穿过之前可测量开放通道值。可以针对每个循环来测量这样的开放通道值。在这些情况中,有限的开放通道数据可以用于估计穿过事件期间的真实开放通道值。该有限的开放通道数据(即相对于没有任何穿过发生的时候)可以用于获得开放通道值的局部估计(例如在时间内局部,以便计及增益漂移)。

然而,可以是如下情况:即穿过足够快使得在亮模式中没有捕获到任何开放通道数据。当穿过速率足够快的时候,标记立即被穿过,并且没有测量到任何开放通道值。当尝试确定开放通道的局部估计的时候,开放通道电压的这种缺乏可能是有问题的;如果针对给定的时间间隔不存在开放通道值,则针对该时间间隔没有任何局部估计可以被确定。在这些情况中,有可能通过使用暗模式数据来为亮模式中的开放通道数据确定局部估计,如以下进一步详细描述的。

基线移位是与在测量过程期间发生的充电和放电循环期间在单元中的某些元件(例如Cdbl 624)上积聚的电荷不平衡有关的现象。例如,在测量过程期间,在通过图6B中的Cdbl 624所表示的单元的工作电极上可积聚过量电荷。在一个示例中,由以下事实引起电荷不平衡:即纳米孔和标记二者都具有非线性I-V特性。作为该非线性的结果,充电和放电循环可以不向电容元件添加或移除相同量的电荷。例如,负离子和正离子可以不经由孔、以随时间的相同速率从一个电极向另一电极移动,例如使得正电荷在井中积聚。注意到,占空比可以是60%的暗模式以及40%的亮模式,以解决在正离子和负离子的传输速率中的典型差异,但是当速率改变的时候,占空比将必须改变,其可能难以进行。

作为该累积的电荷不平衡的结果,单元中的电压测量结果将会增大(例如当正电荷在井中积聚的时候)。基线电压中的该移位可以增大,直到它产生足够高的电压来平衡作为电荷不平衡的结果而原始设置的反向电压为止。在该点处,电荷能重平衡。在暗模式和亮模式开放通道状态二者中以及在四个穿过状态中的每一个中可发生基线移位,其中针对移位的量值和时间常量在开放通道以及四个穿过状态中的每一个中是不同的。作为结果,基线移位可以用一般随机的方式改变,所述方式反映标记在孔处的随机结合事件。

如增益移位现象一样,为了补偿基线移位,可以应用可变的逐点归一化,例如可以通过将每个原始亮模式的所测量的ADC值除以该点的开放通道值的估计来实现归一化,如以下进一步详细描述的。这样的估计可以被视为局部估计,因为它对于单个点或在一时间间隔内的点的某个集合是有效的。

循环内衰减是图6B中的电容器Cdbl 624在循环期间从一个测量到另一个测量改变的结果。Cdbl 624中的该改变影响积分电容器处的电压的衰减速率,使得对于接连的测量而言衰减是更缓慢的,从而导致所测量的ADC值中的轻微改变。

为了补偿这样的改变,人员可以取仅仅单个电压读数,但是那可能不如多个测量那么准确。一些实现方式可以通过如下而有效地得到单个测量结果:取给定循环之上的电压的平均值(均值)。这样的平均值可以基于针对循环内衰减速率的所计算的或预期的值来被加权。这样的平均值可以被用作所测量的ADC值,潜在地其中循环中的穿过电压可以被给予平均的值。

在一些情形中,开放通道亮电压可能不总是可得到。在这样的情形中,可以使用开放通道暗电压。关于归一化的进一步的细节可以在美国专利申请15/632,190和15/628,353中找到,所述专利申请通过引用以其全部被并入。

E. 确定碱基

在归一化之后,实施例可以确定所穿过的通道的电压簇,其中每个簇对应于不同的标记种类,并且因而对应于不同的核苷酸(或碱基)。簇可以用于确定与给定核苷酸对应的给定电压的概率。作为另一示例,簇可以用于确定截止电压,以用于在不同的核苷酸(碱基)之间进行区分。在一些实施例中,可以根据经归一化的数据、或在测序单元的操作随时间充分稳定的情况下的原始数据来创建直方图。基于直方图,拉普拉斯混合模型(LMM)于是可以用于确定截止电压,以用于在不同的核苷酸(碱基)之间进行区分。可以作为拟合过程的部分来确定拉普拉斯算子的宽度。可存在5个拉普拉斯函数,一个针对正开放通道,并且一个针对四个核苷酸中的每一个。可以每单元地确定簇。

在一些实施例中,可以通过使用例如隐马尔可夫模型(HMM)解码器、基于概率函数和经归一化的信号值来确定核苷酸结合状态和对应碱基的序列。在HMM解码器中,可以基于直方图和/或混合模型来将与特定碱基对应的发射概率指派给经归一化的(或未经归一化的)信号值。对于四个单元状态(A、T、C和G)中的每个单元状态,概率函数(或混合状态)可以将处于单元状态中的概率指派给不同的数值。

在一些实施例中,可以通过使用针对直方图的仓的多个计数来确定概率函数。可以例如基于截止值、与直方图中的峰相对应的信号值、或混合模型来确定各种类型的概率函数。一旦确定了概率函数,就可以通过使用与该单元状态相对应的概率函数来确定在给定时间所测量的、对应于特定穿过事件或单元状态(例如对应于C)的特定信号值的概率。可以针对每个信号值来确定四个概率,每个概率函数提供一个概率。与最高概率相对应的单元状态可以被确定为是与信号值相关联的单元状态。

关于测序操作的另外的细节可以例如在以下中找到:题为“Nanopore-Based Sequencing With Varying Voltage Stimulus”的申请号为14/577,511的美国专利申请,题为“Nanopore-Based Sequencing With Varying Voltage Stimulus”的申请号为14/971,667的美国专利申请,题为“Non-Destructive Bilayer Monitoring Using Measurement Of Bilayer Response To Electrical Stimulus”的申请号为15/085,700的美国专利申请,以及题为“Electrical Enhancement Of Bilayer Formation”的申请号为15/085,713的美国专利申请。

V.数据处理系统

图13图示了根据本发明的实施例的用于处理由基于纳米孔的测序传感器芯片1310所捕获的数据的示例系统的框图。传感器芯片1310可以包括数千或数百万或更多的单元。如上所述,可以通过传感器芯片1310的单元、在单元形成和测序的各种阶段期间来捕获数据,所述各种阶段包括例如在形成脂质层(例如用于检查电路的断开/短路)之前、在形成厚脂质层之后、在脂质层薄化期间、在形成双层之后、在形成纳米孔(例如用于确定每个单元的纳米孔的数目或测量开放通道数据以用于归一化)之后、以及在样本测序(例如用于归一化)期间。

传感器芯片可以包括数千或数百万单元,诸如100,000或更多单元、1百万或更多单元、2百万或更多单元、4百万或更多单元、或8百万或更多单元。在示例系统中,传感器芯片1310可以包括1百万单元,其中1百万单元中的每个单元可以是如以上关于图1-4和6所描述的基于纳米孔的传感器单元,并且可以在AC信号的一个循环中以100Hz捕获例如十个数据样本点。因而,在给定时间,1百万单元中的每个单元可以捕获通过一个字节(例如8位)所表示的一个数据点,并且可以生成一个原始数据帧,其包括来自1百万单元的1百万字节(MB)数据。在一些实现方式中,数据点可以是来自ADC输出(ADC值)的原始数据点。在一些实现方式中,数据点可以是在来自ADC输出的两个相继原始数据点之间的差异,而不是输出实际ADC值。在一些实现方式中,局部事件检测器可以用于确定在单元处是否已发生事件并且输出数据点可指示在单元上是否已发生事件。例如,如果在新的ADC值与先前的ADC值(或其他参考值)之间的差异大于阈值保持,则局部事件检测器可检测到事件。数据帧可指示在一些单元上无事件或状态改变,并且在一些其他单元上有事件或状态改变。因而,数据帧包括在给定时间跨单元的所有数据点。关于数据点的另外的细节可以在例如题为“Encoding State Change of Nanopore to Reduce Data Size”的申请号为14/864,400的美国专利申请中找到。

原始数据帧可以由例如包括8百万像素的图像文件来表示,其中来自每个单元的数据点可以由图像文件的像素的灰度、或颜色和/或强度来表示。在每个AC循环中,可以生成10个原始数据帧,每个样本点处一个。例如,可以在亮时段中取4个样本点,并且可以在暗时段中取6个样本点,或反之亦然。因而,在一秒中,可以生成1000个(100循环×每循环10个原始数据帧)原始数据帧,其可以包括来自1百万单元的1千兆字节(GB)(每帧1MB×1000帧)数据。换言之,传感器芯片1310的输出数据速率针对具有1百万单元的传感器芯片可以是每秒1GB(GBPS)。

如图13中所示,由传感器芯片1310捕获的数据可以被发送到FPGA 1320以用于预处理。FPGA 1320可以用例如12GBPS的数据速率来将所接收的数据存储到本地存储器1325。可替换地,由传感器芯片1310捕获的数据可以被直接发送到本地存储器1325。FPGA 1320可以通过例如快速外围组件互连(PCIe)接口来将所接收的数据直接发送到PCIe总线1380(或处理所接收的数据,然后通过例如快速外围组件互连(PCIe)接口来发送经预处理的数据),所述PCIe总线1380可以具有例如8GBPS的最大数据传递速率。

每个原始数据帧仅仅包括来自单元的一个数据样本点,而每个碱基如上所述那样基于多个样本数据点来被确定。此外,数据处理器可能没有足够的资源来实时地处理原始数据帧。因此,原始数据帧可以首先被存储,然后当足够用于确定碱基的原始数据帧可用的时候一起被处理。例如,来自FPGA 1320的数据可以被存储在一个或多个标准盘驱动器1360或者一个或多个快速捕获驱动器1350中。每个标准盘驱动器1360可具有0.2 GBPS的最大写入速度,而每个快速捕获驱动器1350可具有1 GBPS的最大写入速度。附加地或可替换地,来自FPGA 1320的数据可以通过网络接口1370被发送到网络存储设备,所述网络接口1370可具有0.1 GBPS的最大数据速率。因而,为了以例如1 GBPS来保存数据,可能需要多个驱动器或网络接口,这可显著增大系统成本。此外,PCIe总线1380的可用带宽可小于8 GBPS的全带宽,诸如例如6 GBPS(全带宽的75%),这由于总线上的其他数据输送所致。因而,在一些情况中,来自FPGA 1320的数据可能没有足够快地被保存到存储驱动器。可能需要大缓冲器来用于暂时性存储数据,或者可能需要丢弃一些数据。

在通过传感器芯片1310的数据采样完成之后,图形处理单元(GPU)1330或主机处理器1340可以用于处理所存储的数据。主机处理器1340可以包括通信接口,所述通信接口具有例如大约22 GBPS的最大带宽,其可能由于PCIe总线1380的带宽限制而没有被充分利用。主机处理器1340可以用例如12 GBPS的最大数据速率来访问主存储器1345(例如DRAM)。在各种实现方式中,主机处理器1340可以直接地或通过例如北桥来访问主存储器1345。GPU 1330可以包括数百或数千个并行处理核,并且可以用例如200 GBPS的最大数据速率来访问GPU存储器1335。GPU 1330可以通过PCIe总线1380、以不大于8 GBPS、诸如大约1 GBPS的数据速率来与其他组件、诸如标准盘驱动器1360或快速捕获驱动器1350通信。GPU 1330可以更适合用于并行处理来自传感器芯片1310的数千或数百万个单元的数据。

为了处理所存储的数据,GPU 1330可能需要从存储设备读回数据,并且数据处理速度可能受数据读回的速度限制。因而,如果传感器芯片1310用于对数据进行采样,例如达2小时或更多以用于试验,则可能需要2小时或更多来读回所存储的数据。因而,数据处理时间可能非常长。

因此,为了减小数据处理系统的成本并且改善系统的数据处理效率,可能合期望的是实时地处理由传感器芯片1310捕获的数据,并且减小在系统的不同功能块之间的数据传递量。

VI.数据帧和帧图

图14图示了根据本发明的一些实施例的由示例基于纳米孔的测序芯片、诸如图13的传感器芯片1310所捕获的原始数据帧的示例。如图14中所示,来自第一纳米孔单元的检测信号可以通过波形1410来图示。波形1410可以包括多个AC循环,并且每个AC循环可以包括如以上关于图7所描述的暗时段1412与亮时段1418。如所示出的,当没有任何标记在纳米孔中、例如无穿过的时候,1412和1414处的信号是开放通道值。亮时段1418可以包括插入时段1416,在其期间,作为在该时间期间标记被穿过到纳米孔中的结果,检测信号的值可以不同。尽管图14示出了暗时段1412处的检测信号高于亮时段1418处的检测信号,但是暗时段处的检测信号可以低于亮时段处的检测信号,这取决于如何配置单元电压参考(例如电压源Vpre 605)。

在每个AC循环中,可以通过每个纳米孔单元来捕获多个数据样本、诸如8个、10个、16个或24个样本。一些数据样本、例如在暗时段期间通过纳米孔单元所捕获的那些可以相同或粗略地相似。图14中的数据是理想化的,因为线完美地平坦。如以上所提及的,在亮时段和暗时段期间可得到测量结果(例如电压或电流)多次。每次的值可稍微变化,其例如取决于测量结果的分辨率;ADC输出可具有一系列256个值,并且因而开放通道的不同的不同ADC输出值可在彼此的几个ADC最低有效位(LSB)内变化。

如图14中所示,在时间t1处,测序芯片的每个单元可例如从图6的ADC 610捕获一个样本。例如,第一纳米孔单元可捕获一个样本1422,所述样本1422可包括单个ADC值。由测序芯片中的纳米孔单元所捕获的样本可以形成原始数据帧1420-1。类似地,在时间t2处,测序芯片的每个单元可以捕获一个样本,并且由测序芯片中的纳米孔单元所捕获的样本可以形成原始数据帧1420-2,以此类推。在时间tn处,测序芯片的每个单元可以捕获一个样本,并且由测序芯片中的纳米孔单元所捕获的样本可以形成原始数据帧1420-n。

在单元形成、单元校准和测序的各种阶段期间,可以生成不同的原始数据帧。在一些实施例中,不同的原始数据帧可包括与单元相关联的不同参数。待生成的原始数据帧可以通过如下来被动态地选择或调节:改变例如ADC参考信号的波形(例如时间、水平和形状)、被施加到工作电极和/或对电极的信号的波形等等。

A.丢弃帧

为了减小待被传递和存储的数据的量,预处理器、诸如图13的FPGA 1320可丢弃一些帧。例如,AC循环中的7个原始数据帧可以被丢弃,并且其余的3个原始数据帧可以被发送,而不是发送AC循环中的全部10个原始数据帧(例如亮时段的6个和暗时段的4个)。在一个实现方式中,3个原始数据帧可以包括在暗时段期间所捕获的一个,以及在亮时段期间所捕获的两个(包括在插入时段期间所捕获的一个)。照此,待传递的数据的量可以被减少到由测序芯片所捕获的原始数据的大约30%。

在各种实施例中,待丢弃的帧的数量和待丢弃的帧的位置可以不同。例如,在一些实施例中,暗时段中的第一帧可以被保持并且暗时段中的其他帧可以被丢弃。在一些实施例中,暗时段中间的帧可以被保持并且暗时段中的其他帧可以被丢弃。在一些实施例中,暗时段中的最后的帧可以被保持并且暗时段中的其他帧可以被丢弃。在一些实施例中,暗时段中的两个或更多帧可以被保持,并且暗时段中的其他帧可以被丢弃,其中所述两个或更多帧可以包括暗时段中的第一帧、中间帧或最后的帧中的至少一个。亮时段或亮时段内的插入时段中的帧可以被类似地处置。在一些情况中,没有任何来自每隔N-1个循环(例如每隔九个循环)的数据帧被丢弃,其中每隔N-1个循环中的数据帧可以用于归一化或校准目的。

如以下详细描述的,帧图可以用于标识对应的原始数据帧。例如,帧图可以指定循环中的2个亮原始数据帧以及一个暗原始数据帧。原始数据帧的缩减集合然后可以由处理器基于帧图来处理。

尽管上述方法可以减少被传递和存储的数据的量,但是当简单地丢弃一些原始数据帧的时候、例如如果纳米孔单元的检测信号的波形在至少一些循环中不可预期或不规则,所述方法可能丢失有用的信息。可能合期望的是减少数据传递和存储的量,而不丢失通过基于纳米孔的测序芯片所捕获的数据样本中的某些有用信息。

B.预处理

根据本公开内容的某些方面,预处理器(例如FPGA 1320)可以处理通过基于纳米孔的测序芯片(例如传感器芯片1310)所捕获的原始数据以提取各种相关信息,并且将相关信息发送到处理器(例如GPU 1330)以用于实时地确定待测序的核酸分子中的碱基。

在一些示例中,预处理器可以从原始数据帧中提取用于确定碱基的相关信息,并且生成包括所提取的信息的摘要数据帧,其中摘要数据帧的数目显著低于原始数据帧的数目。例如,可以在一秒中生成1000个原始数据帧(100个循环×每循环10个原始数据帧),其可导致8GB的数据(即8GBPS)。原始数据帧可以被直接发送到缓冲器、诸如本地存储器1325,其可暂时性存储原始数据帧直到在数据帧中存在充足的信息以用于处理器(例如GPU 1330)标识一个或多个碱基为止。对于标识一个或多个碱基而言所需要的原始数据帧的数目可取决于测序过程的动力学。例如,在其中一秒中可以标识一个或两个碱基的示例中,缓冲器可以存储通过基于纳米孔的测序芯片所捕获的1000个原始数据帧(例如8GB)。缓冲器可以是例如16 GB或更大,使得8 GB可以用于接收新数据,并且另8 GB可以用于存储先前捕获的、正由预处理器处理的数据。

在一些实施例中,预处理器可以比较相继帧,丢弃大体上类似的大多数数据帧,并且仅仅保持针对类似帧的代表性帧,如上所述。例如,预处理器可以保持暗时段中的第一帧、亮时段中的第一帧、以及插入时段中的第一帧,并且丢弃暗时段、亮时段和插入时段中每一个中的与对应时段中的第一帧类似的后续帧。在一些实施例中,预处理器可以生成摘要数据帧,所述摘要数据帧是暗时段、亮时段或插入时段中的数据帧的平均。在一些实施例中,预处理器可以生成摘要数据帧,所述摘要数据帧包括针对每个单元的暗时段、亮时段或插入时段中的数据帧中的数据的中值。以此方式,摘要数据帧的数目可以被减少到例如原始数据帧的数目的大约30%。

在一些实施例中,预处理器可以根据原始数据帧来确定事件。例如,预处理器可以确定在针对单元的两个相继原始数据帧中的数据之间的差异(或一阶导数),并且如果差异大于阈值,则可检测到事件。基于数据改变的极性和/或幅度,可以确定例如是否已发生穿过事件。包括所检测到的事件的信息的摘要数据帧可以被生成并且被发送到处理器以用于确定碱基,而可以丢弃原始数据帧。可以根据原始数据帧来生成摘要数据帧的其他示例,如以下详细描述的。

因而,在一些循环中,可以在每个循环中生成多个摘要数据帧,而在一些循环中,可以跨多个循环而生成一个摘要数据帧(例如包括事件信息的帧)。以此方式,被发送到数据处理系统的其余部分的数据帧可显著减少,并且因而数据处理系统的其余部分可能不需要高带宽数据通信。例如,处理器可以能够实时地接收并且处理摘要数据帧,并且可能仅需要通过例如网络接口1370来将DNA分子中的所确定的碱基发送到本地存储设备、诸如标准盘驱动器1360或快速捕获驱动器1350或网络存储设备。作为示例,如果基于纳米孔的测序芯片包括8百万个纳米孔单元,并且每个纳米孔单元可以用于每秒标识两个碱基,则一秒中可以标识一千六百万个碱基。如果每个碱基的信息通过例如4个字节来被表示,则待存储在存储设备中的数据是一秒中64MB。因而,仅仅64 MBPS的带宽可以用于将数据写入到存储设备中。单个标准盘驱动器、诸如标准盘驱动器1360可以足以用于存储所标识的碱基的信息。

预处理器可以从所捕获的数据中提取各种信息。例如,在一些情况中,预处理器可以从每个纳米孔单元的检测信号中提取第一点增量,所述第一点增量对应于在循环中的第一帧和另一帧的数据之间的差异,并且生成摘要数据帧F,所述摘要数据帧F包括针对纳米孔单元中每一个的循环中的第一点增量。帧F可以每几个循环地被生成,并且可以在双层形成(操作的一个示例阶段)期间被使用。例如,第一点增量值可以与双层的电容成比例,所述双层的电容与双层的厚度成比例。摘要帧图因而可以用于确定是否已经实现了双层的合期望的厚度。

这样的帧F在操作的其他阶段中、例如在双层形成之后可以不太经常被使用或完全不被使用。因此,在操作的某些阶段中可以仅仅使用一些摘要帧。在不同的阶段期间,不同的帧图可以被提供给预处理器,以便控制在特定阶段期间预处理器的操作。

在一些情况中,预处理器可以从每个纳米孔单元的检测信号中提取最后点增量,所述最后点增量对应于在循环中的两个帧的数据之间的差异,并且生成摘要数据帧L,所述摘要数据帧L包括针对纳米孔单元中每一个的循环中的最后点增量。帧L可以每几个循环地被生成,并且可以在双层形成期间被使用。

在一些情况中,预处理器可以从每个纳米孔单元的检测信号中提取循环中的中值数据点,并且生成摘要数据帧M,所述摘要数据帧M包括针对操作纳米孔单元中每一个的循环中的中值数据点。帧M可以在每个循环中被生成,并且被使用在例如卡尔曼滤波中以用于测序。

在一些情况中,预处理器可以从每个纳米孔单元的检测信号中提取关于一个或多个循环中的检测信号的衰减的信息,并且生成摘要数据帧D,所述摘要数据帧D包括针对纳米孔单元中每一个的所述一个或多个循环中的衰减信息。所述衰减信息可以包括在一时段内的两个帧之间的差异,并且可以指示ADC值的波形如何在该时段期间改变。帧D可以每几个循环地、例如在暗时段期间被生成,并且可以在双层形成期间以及在测序期间被使用。例如,暗时段中的帧D可以用于标识纳米孔。在一些实施例中,衰减信息可以包括ADC值的波形的改变速率。

在一些情况中,预处理器可以从每个纳米孔单元的检测信号中提取一个或多个循环中的检测信号的事件信息,并且生成摘要数据帧E,所述摘要数据帧E包括针对所有纳米孔单元的所述一个或多个循环中的事件信息。当例如在通过例如亮时段期间的标记插入或标记删除所引起的检测信号中存在跳跃的时候,可以检测到事件。例如,事件信息可以指示是否已发生穿过事件。在一些实施例中,帧E可以包括对是否已发生事件的“真”或“假”指示(例如“0”或“1”)。例如,如果来自单元的ADC值从一个帧到下一个帧改变得多于某个百分比,则可发生穿过事件,并且帧E可以包括针对单元的“真”或“1”。没有检测到事件的单元可以在帧中具有“假”或“0”的对应值。

在一些情况中,预处理器可以从每个纳米孔单元的检测信号中提取一个或多个循环中的定时信息,诸如当事件发生时的时间或某个时间长度,并且生成时间帧。时间帧可以包括在单元中检测到的(多个)事件的定时信息。例如,如果单元的事件发生在具有10个亮帧的循环中的帧6和7之间,那么时间帧中针对该单元的值可以是6。在一些实现方式中,可以不生成时间帧,并且处理器可以基于其他帧的标头中的定时信息来提取定时信息。

以上示例仅仅用于说明目的,并且本领域技术人员将领会到可存在可以由预处理器提取并且被包括在摘要数据帧中的其他专门信息。

在一些实施例中,每个摘要数据帧可以包括标头,所述标头可以包括摘要数据帧的时间戳、摘要数据帧的类型、或关于摘要数据帧的其他信息。在一些情况中,可以在循环中生成多个摘要数据帧,例如,在一个循环中可以生成第一点数据帧F、中值数据点帧M、和衰减帧D。在一些情况中,可以在循环中不生成任何摘要数据帧。在一些情况中,可以在多个循环中生成一个摘要数据帧。

C.帧图

如上所述,在各种实施例中,帧图可以用于标识对应的摘要数据帧和/或原始数据帧,并且通过预处理器被发送到处理器,使得处理器可以知道它已经接收到什么数据帧,并且相应地通过使用数据帧来确定碱基。例如,在一些实施例中,可以针对每个循环而生成帧图,其中所述帧图可以包括关于每个循环中所包括的帧的信息。在一些实施例中,可以针对多个循环而生成帧图,其中所述帧图可以包括关于跨多个循环而生成的帧的信息。在一些实施例中,可以例如每隔99个循环、每1秒地或针对原始数据帧而生成帧图,所述原始数据帧包括用于确定碱基的充足信息。

在一些示例中,可以由测序系统的用户或操作者来预定帧图。在一些示例中,可以由预处理器动态地确定帧图。在一些示例中,可以由处理器来确定帧图,所述处理器可以将帧图发送到预处理器,用于请求在帧图中所标识的数据帧。

D. 示例结果

图15图示了根据本发明的一些实施例的通过对由示例基于纳米孔的测序芯片所捕获的原始数据帧进行预处理而生成的示例摘要数据帧。如图15中所示,在测序试验中所捕获的多个原始数据帧1510可以被预处理,并且被转换成小得多的数目的摘要数据帧1520。摘要数据帧1520然后可以连同对一个或多个循环中的摘要数据帧的类型进行标识的帧图一起被发送到具有多个核的处理器、诸如GPU,用于实时并行处理,从而标识核酸分子中的碱基。例如,如图15中所示,循环1中的原始数据帧可以被预处理并且被转换成三个摘要数据帧,包括第一点数据帧F、中值数据点帧M和衰减信息帧D,而不是例如如上所述的15个或更多原始数据帧。

在循环2中,所述15个或更多的原始数据帧可以被处理并且被转换成两个摘要数据帧,其可以包括中值数据点帧M和衰减信息帧D。如上所述,在一些情况中,一些原始数据帧(例如每隔N-1个循环中的所有原始数据帧)可以由预处理器发送到处理器,例如用于归一化或校准目的。对经转换的摘要数据帧进行标识的帧图也可以被生成并且被发送到处理器。帧图中的信息然后可以由处理器用于基于摘要数据帧来确定碱基。

图16图示了针对图15中所示的示例所生成的示例帧图1600。如图16中所示,帧图1600标识在序列中被发送到处理器的摘要数据帧的列表。例如,第一摘要数据帧是第一点数据帧F,继之以中值数据点帧M和衰减信息帧D,其根据图15中所示的循环1中的原始数据帧来被生成。帧图1600还标识根据图15中所示的循环2中的原始数据帧所生成的中值数据点帧M和衰减信息帧D。帧图1600还可以标识:摘要数据帧中的一个是事件帧E,并且接下来的摘要数据帧是时间帧T,其包括在帧E中所标识的事件的时间信息。

作为另一示例,示例帧图可以被描述为针对每隔15个循环的×10{2MD}×1{RMD}。示例帧图可以指示前15个循环中每一个中的3个帧(针对亮时段的帧M、针对暗时段的帧M、以及暗时段中的帧D),以及每隔十个循环中的3个帧(帧R(例如第一原始帧)、帧M和帧D)。

尽管以上关于图14-16所示出的示例是用于压缩在测序时段期间所收集的数据,但是本领域技术人员将会理解到所述技术可以用于压缩如在以上在章节III中所描述的传感器单元的形成期间或之后来自传感器芯片的输出数据。例如,可以通过传感器单元、在形成脂质层(例如用于检查电路的断开/短路)之前、在形成双层(例如脂质层的薄化)期间、在形成双层之后、在形成纳米孔(例如用于确定每个单元的纳米孔的数目或测量开放通道数据以用于归一化)之后、以及在样本测序(例如用于归一化)期间测量数据点。这些数据点可以在原始数据帧的集合中被发送到预处理器。原始数据帧然后可以被预处理器压缩或过滤以生成摘要数据帧,所述摘要数据帧可以用于确定在单元形成和测序过程的不同阶段处的单元状态,使得仅有摘要数据帧可以被发送到处理器(例如GPU 1330)以用于确定单元的状态。不可以用于确定单元的状态的其他数据点可能不需要被转发到处理器。

在一个示例中,在干法检查期间,预处理器可以取得来自每个单元的两个数据点(被包括在两个不同的原始数据帧中)之间的差异以生成摘要数据帧,所述摘要数据帧包括针对每个单元的WPD(或SPD、LPD、FPD和XPD中的任一个)。在另一示例中,在干法检查期间,预处理器可以取得来自每个单元的两个数据点之间的差异以生成摘要数据帧,所述摘要数据帧包括针对每个单元的SPD(或WPD、LPD、FPD和XPD中的任一个)。在又一示例中,在电穿孔期间,预处理器可以取得来自每个单元的两个数据点之间的差异以生成摘要数据帧,所述摘要数据帧包括针对每个单元的DDD(或LPD)。摘要数据帧可以用于确定单元的状态。

在单元形成和测序过程期间的各种阶段处,针对每个单元的待确定的状态可以包括例如在干法或湿法检查阶段期间的断开状态或短路状态、单元中双层的存在或不存在、单元中纳米孔的存在或不存在、或其相关联的标记正穿过通过单元的纳米孔的碱基(A、T、C或G)。本领域技术人员将会理解到可以按需要生成许多不同的可替换的摘要数据帧以及不同摘要数据帧的任何组合,以用于确定在单元形成和测序过程期间的不同阶段处的单元的状态。

VII.示例方法

图17是一流程图1700,其图示了根据某些实施例的操作测序系统的示例方法,所述测序系统被配置成并行地对多个(例如100,000或更多)DNA分子进行测序。所述方法可以由预处理器、诸如图13的FPGA 1320执行。

在框1710处,测序系统的预处理器(例如FPGA 1320)可以从包括多个单元的传感器芯片接收数据帧的集合。所述多个单元中的每个单元可以被配置成生成检测信号以用于确定随时间的单元的状态。数据帧的集合的每个数据帧可以包括来自所述多个单元的检测信号,并且对应于不同的时间。在一些实施例中,数据帧的集合可以包括在所述多个单元的形成期间所生成的数据帧。在一些实施例中,数据帧的集合可以包括在所述多个单元的校准或测序循环期间所生成的数据帧。单元的状态可以包括例如单元的断开状态或短路状态、单元中双层的存在或不存在、单元中纳米孔的存在或不存在、与单元相关联的碱基、或其任何组合。

在框1720处,预处理器可以从所述数据帧的集合中的所述多个单元的检测信号提取信息以获得摘要信息。所述摘要信息可以在确定所述多个单元的状态中被使用。在一些实施例中,所述摘要信息可以包括针对所述多个单元中的每一个的、在AC信号循环的亮时段中的第一数据点与AC信号循环的暗时段中的第一数据点之间的差异(即FPD)。在一些实施例中,所述摘要信息可以包括针对所述多个单元中的每一个的、在AC信号循环的亮时段中的最后数据点与AC信号循环的暗时段中的最后数据点之间的差异(即LPD)。在一些实施例中,所述摘要信息可以包括针对所述多个单元中的每一个的、在亮时段中的最后数据点与下一个暗时段中的第一数据点之间的差异(即SPD正/负)。在一些实施例中,所述摘要信息可以包括针对所述多个单元中的每一个的、在暗时段中的最后数据点与下一个亮时段中的第一数据点之间的差异(即SPD负/正)。在一些实施例中,所述摘要信息可以包括针对所述多个单元中的每一个的、在AC信号循环的暗时段中的两个数据点之间的差异(即DDD)。

在框1730处,所述预处理器可以生成摘要帧的群组,所述摘要帧的群组包括从所述数据帧的集合提取的摘要信息。所述摘要帧的群组中的摘要帧的数目可以小于所述数据帧的集合中的数据帧的数目。在一些实施例中,所述摘要帧的群组可以包括来自所述数据帧的集合的一个或多个数据帧。在一些实施例中,所述预处理器还可以生成帧图,所述帧图标识摘要帧的群组的特性。在一些实施例中,所述帧图可以标识针对一个或多个测序循环所生成的摘要帧。

在框1740处,所述预处理器可以将一个或多个摘要帧的群组和/或帧图发送到处理器以供用在确定所述多个单元的状态中。

尽管图17将操作描述为顺序过程,但是操作中的许多可以并行或同时被执行。另外,操作的次序可以被重布置。操作可具有没有被包括在图中的附加步骤。一些操作可以是可选的,并且因而在各种实施例中可以被省略。在一个框中所描述的一些操作可以连同在另一框处的操作一起被执行。例如,可以并行地执行一些操作。此外,方法的实施例可以用硬件、软件、固件、中间件、微代码、硬件描述语言或其任何组合来被实现。

VIII.自适应数据预处理/转换

如以上所描述的,数据处理系统的预处理器可以将原始数据帧转换成摘要数据帧,用以显著减少将通过系统中的各种总线被发送的数据的量。数据量的减少可允许实时的进一步处理,从而使得能够实时地确定在测试下的核酸分子中的碱基。因而,所述系统至少在某些时候可具有额外的带宽和/或处理能力。

在一些情况中,所述系统可确定:可能需要来自所捕获的数据的更好的准确性以及因而更多的信息。所述系统可向预处理器提供系统的各种组件的反馈或状态,使得预处理器可基于系统的各种组件的反馈和/或状态来改变其操作。例如,假定标记插入是缓慢的,并且系统正在使用包括针对每个循环的一个原始帧的帧图,所述每个循环包括在亮时段期间的4个原始帧以及在暗时段期间的6个原始帧(即每循环10个原始帧)。其他9个原始帧可以被忽略或丢弃。如果系统确定了标记停延时间是短的,其可能由于例如聚合酶的插入速率已经增大而发生,则系统可以改变帧图以包括多于每个循环中的10个原始帧中的一个原始帧(例如3个或更多)(即可丢弃更少的原始帧),使得它可以用更好的准确性来检测标记。在一些实施例中,所述系统可以改变帧图以包括例如每循环多于10个原始帧,使得在每个循环中可以生成并且保持(而不是丢弃)更多的原始帧。所述停延时间可取决于生物化学过程。例如,对于可以用于每秒标识一个碱基并且具有针对10%停延的阈值的系统,停延时间将会在100ms和1秒之间。

在一些实施例中,所述预处理器可以基于例如可用带宽、所接收的数据的品质或所期望的准确性来被动态地编程,以改变原始数据帧被处理的方式以及待被发送到处理器、诸如图13的GPU 1330以用于确定在测试下的样本中的碱基的数据帧。例如,如果处理器检测到非常少的事件、诸如穿过事件,则它可以将请求发送到预处理器以请求包括更多摘要数据帧和/或原始数据帧的更多数据。例如,如果预处理器先前每循环仅仅发送两个或三个数据帧,则可以请求预处理器在每个循环中发送四个帧、六个帧或更多帧,其可以包括摘要数据帧、原始数据帧、或摘要数据帧和原始数据帧的任何组合。可以请求预处理器以发送例如循环的亮时段中的四个数据点和暗时段中的两个数据点。在一些情况中,所述系统可以确定:确定样本中的碱基的速率下降,并且可以从预处理器请求更多的数据。在一些情况中,处理器可以确定它具有额外的能力并且可以能够取得更多数据,并且可以请求预处理器发送更多数据以用于更好的准确性。

在一些情况中,当系统的处理器或其他组件确定了以系统的处理器或其他组件没有足够能力处置的速率来提供数据的时候,所述系统的处理器或其他组件可以向预处理器发送请求以减少由预处理器发出的数据的量,其中例外是可致使更高的误差率并且可降低测序的质量。

图18是一流程图1800,其图示了根据本发明的一些实施例的自适应数据处理的示例方法。所述自适应数据处理可发生在如以上所述的传感器单元的形成期间或之后的不同阶段处。在框1810处,预处理器、诸如图13的FPGA 1320可以从传感器芯片、诸如传感器芯片1310接收多个原始数据帧。在一些实施例中,所述多个原始数据帧可包括用于确定一个或多个碱基的充足信息。例如,所述多个原始数据帧可以包括每秒所接收的原始数据帧,诸如例如1000个原始数据帧。在一些实施例中,所述多个原始数据帧可以包括用于确定以下各项的充足信息:单元的断开状态或短路状态、单元中双层的存在或不存在、单元中纳米孔的存在或不存在、或一时间段期间与单元相关联的碱基。

在框1820处,所述预处理器可以基于所接收的所述多个原始数据帧来生成摘要数据帧和/或对应帧图,如以上所描述的。待生成的摘要数据帧可以由系统的用户或操作者、由预处理器基于所接收的原始数据帧动态地、或由处理器(例如图13的GPU 1330或主机处理器1340)来确定,所述处理器通过使用摘要数据帧来确定碱基,其中所述处理器可以向预处理器发送请求以请求特定类型的数据帧。摘要数据帧的示例可以包括一摘要数据帧,其包括针对每个单元的FDP、LDP、SPD、WPD、DDD、铺轨值、中值数据点(例如在中值数据点帧M中)、衰减信息(例如在衰减信息帧D中)、第一点数据(例如在第一点数据帧F中)、或事件信息(例如在事件帧E中),如以上所描述的。

在框1830处,所述预处理器可以经由总线、诸如PCIe总线来向处理器发送所生成的摘要数据帧和/或对应的帧图。总线可具有用于输送摘要数据帧的充足带宽,诸如不小于1 GBPS、2 GBPS、4 GBPS、或8 GBPS。

在框1840处,所述处理器可以处理所接收的摘要数据帧以确定单元的状态,其例如通过使用帧图。所述处理器可以包括例如1×103、1×104、1×105或更多处理核,其可以并行地处理与1×103、1×104、1×105或更多传感器单元相关联的摘要数据。例如,如上所述,其相关联的标记在测序期间通过单元中的纳米孔穿过和排斥的碱基可以被确定,其例如基于所测量的电压水平和截止电压水平以用于区分与不同聚合酶复合的不同标记。还可以通过使用根据在单元形成过程的不同阶段期间所捕获的原始数据帧所生成的(多个)摘要数据帧来确定其他状态,诸如在干法或湿法检查阶段期间的断开状态或短路状态,单元中双层的存在或不存在,或单元中纳米孔的存在或不存在。

在框1850处,所述处理器可以确定是否需要不同的数据帧。例如,如以上所述,所述处理器可以基于在框1840处的处理的结果来确定是否需要更多或更少的数据帧和/或需要什么数据帧。在一些实施例中,所述处理器可以确定所期望的帧图。

在框1860处,如果所述处理器确定了所接收的数据帧是适当的,并且可能不需要任何对预处理器生成摘要数据帧的方式的任何改变,则处理器可以向存储设备、诸如盘驱动器发送关于所确定的碱基的信息。

在框1870处,如果所述处理器确定了可能需要不同的数据帧,则所述处理器可以向预处理器发送请求,其中所述请求可以包括关于所期望的数据帧或所期望的帧图的信息。例如,所述请求可以索求更多或更少的数据帧,标识待生成的特定数据帧,或包括所期望的帧图。

在框1860或1870之后,所述过程可以继续以接收原始数据帧,并且预处理所接收的原始数据帧以生成摘要数据帧,其基于请求(如果有的话)。注意到,尽管图18将数据处理描述为顺序过程,但是操作中的许多可以并行或同时被执行。另外,操作的次序可以被重布置。操作可具有没有被包括在图中的附加步骤。一些操作可以是可选的,并且因而在各种实施例中可以被省略。在一个框中所描述的一些操作可以连同在另一框处的操作一起被执行。例如,可以并行地执行一些操作。此外,方法的实施例可以用硬件、软件、固件、中间件、微代码、硬件描述语言或其任何组合来被实现。

IX. 计算机系统

本文中所提及的计算机系统中的任一个可以利用任何合适数目的子系统。这样的子系统的示例在图19中被示出在计算机系统10中。在一些实施例中,计算机系统包括单个计算机装置,其中子系统可以是计算机装置的组件。在其他实施例中,计算机系统可以包括多个计算机装置,各自是子系统,具有内部组件。计算机系统可以包括台式和膝上型计算机、平板设备、移动电话和其他移动设备。

图19中所示的子系统经由系统总线75而被互连。示出了附加的子系统、诸如打印机74、键盘78、(多个)存储设备79、被耦合到显示适配器82的监控器76,以及测序。耦合到I/O控制器71的外设和输入/输出(I/O)设备可以被连接到计算机系统,其通过本领域中已知的任何数目的手段,诸如输入/输出(I/O)端口77(例如USB、FireWire®)。例如,I/O端口77或外部接口81(例如以太网、Wi-Fi等等)可以用于将计算机系统10连接到广域网,诸如因特网、鼠标输入设备或扫描仪。经由系统总线75的互连允许中央处理器73与每个子系统通信,并且控制来自系统存储器72或(多个)存储设备79(例如固定盘、诸如硬驱动器或光盘)的多个指令的执行,以及信息在子系统之间的交换。系统存储器72和/或(多个)存储设备79可以具体化计算机可读介质。另一子系统是数据收集设备85,诸如相机、麦克风、加速计等等。本文中所提及的任何数据可以从一个组件被输出到另一组件,并且可以被输出给用户。

计算机系统可以包括多个相同的组件或子系统,其例如通过外部接口81、通过内部接口、或经由可移除的存储设备而被连接在一起,所述可移除的存储设备可以从一个组件到另一组件地被连接和移除。在一些实施例中,计算机系统、子系统或装置可以通过网络而通信。在这样的实例中,一个计算机可以被视为客户端,并且另一计算机是服务器,其中每一个都可以是相同的计算机系统的部分。客户端和服务器可以各自包括多个系统、子系统或组件。

实施例的各方面可以如下被实现:以控制逻辑的形式,使用硬件(例如专用集成电路或现场可编程门阵列),和/或使用计算机软件,其利用以模块化或集成方式的一般可编程处理器。如本文中所使用的,处理器包括相同集成芯片上的单核处理器、多核处理器、或者单个电路板上或联网的多个处理单元。基于本文中所提供的公开内容和教导,本领域普通技术人员将知道并且领会用于通过使用硬件以及硬件与软件的组合来实现本发明实施例的其他方式和/或方法。

本申请中所描述的软件组件或功能中的任一个可以被实现为将由处理器执行的、使用任何合适的计算机语言的软件代码,所述计算机语言诸如例如Java、 C、C++、C#、对象-C, Swift、或脚本语言,诸如Perl或Python,其使用例如常规或面向对象的技术。软件代码可以作为一系列指令或命令而被存储在计算机可读介质上以供存储和/或传输。合适的非暂时性计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、磁性介质、诸如硬驱动器或软盘、或者光学介质、诸如光盘(CD)或DVD(数字通用盘)、闪速存储器等等。计算机可读介质可以是这样的存储或传输设备的任何组合。

这样的程序还可以被编码并且通过使用载波信号被传输,所述载波信号被适配用于经由符合各种协议的有线、光学和/或无线网络、包括因特网来被传输。因而,可以通过使用利用这样的程序被编码的数据信号来创建计算机可读介质。被编码有程序代码的计算机可读介质可以与兼容设备一起被封装或与其他设备分离地被提供(例如经由因特网下载)。任何这样的计算机可读介质可以驻留在单个计算机产品(例如硬驱动器、CD、或整个计算机系统)上或其内,并且可以存在于系统或网络内的不同的计算机产品上或其内。计算机系统可以包括监控器、打印机、或用于将本文中所提及的任何结果提供给用户的其他合适的显示器。

本文中所述的任何方法可以完全或部分地利用计算机系统来被执行,所述计算机系统包括一个或多个处理器,其可以被配置成执行步骤。因而,实施例可以针对被配置成执行本文中所述的任何方法的步骤的计算机系统,其潜在地具有执行相应的步骤或相应的步骤组的不同组件。尽管被呈现为经编号的步骤,但是本文中的方法的步骤可以同时或以不同次序被执行。另外,这些步骤的部分可以与来自其他方法的其他步骤的部分一起使用。而且,步骤的全部或部分可以是可选的。另外,任何方法的任何步骤可以利用用于执行这些步骤的模块、单元、电路或其他构件来被执行。

特定实施例的具体细节可以用任何合适的方式被组合,而不偏离本发明的实施例的精神和范围。然而,本发明的其他实施例可以针对与每个单独方面或这些单独方面的特定组合有关的特定实施例。

对“一”、“一个”或“该”的记载意图意指“一个或多个”,除非特别相反地指示。对“或”的使用意图意指“包含的或”,而不是“排外的或”,除非特别相反地指示。对“第一”组件的提及不一定要求提供第二组件。对“第一”或“第二”组件的此外的提及不将所提及的组件限制到特定的位置,除非明确声明。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1