确定核苷酸序列的方法和装置以及由该装置执行的计算机程序产品的制作方法

文档序号:6042309阅读:472来源:国知局
专利名称:确定核苷酸序列的方法和装置以及由该装置执行的计算机程序产品的制作方法
技术领域
本发明涉及用于确定核酸的核苷酸序列(碱基序列)的核苷酸序 列确定方法、便利核苷酸序列确定方法的装置(核苷酸序列确定系 统)、以及用于自动控制该装置以便自动分析所测量的信号从而能够 确定核酸的核苷酸序列的计算机程序产品。
背景技术
人类基因组由大约三十亿个遗传密码(碱基)构成。目前正在进 行的"人类基因组工程"是要解决整个遗传密码(核苷酸序列)。随着 事情的进展,各个人的遗传密码(核苷酸序列)存在很多差异的事实 变得清晰。人类基因组核苷酸序列的差异(多态性)被分类为一个碱
基被另一个碱基替换的SNP和由于一个与几千个碱基之间的缺少或 插入而引起的可变数目串联重复(VNTR或微卫星多态性)等,但现 在SNP在这些类型的多态性中特别引起注意。SNP是DNA核苷酸序 列中的一个碱基的差异,是包括处理酒精的能力和药物是否具有强效 在内的人类性格特征的最小单位。在人类基因组中的三十亿个碱基对 中,存在大约三百万(1比500 ~ 1000个碱基对的比例)到一千万个 SNP碱基,这带来了人们之间的差异(身体特征),例如制造特定蛋 白质的无能或者与其它人不同的蛋白质的生产、种族差异等。关于人 类的基因个体差异的研究,据说SNP的分析以及疾病易感性和药物反 映的调查会使定制的医疗成为可能,其中适合患者并且副作用少的药 物被管理,并且对SNP分析的研究正在进行。对于植物,可以识别对 植物通常具有的疾病和有害物的抵抗机制,并且强化这些功能。
可以给出的人们关注SNP的原因是,通过分析技术的提高,各种SNP的分析成为可能,从而人们对疾病与SNP之间的关系的兴趣 增加。研究的对象范围很宽,包括与疾病有关的基因、药物代谢中的 个体差异的分析以及慢性病。对于药物代谢和脂肪代谢的 一些情形, 与SNP的关系已经得到解释。关于这些话题和SNP,希望会逐渐得 以澄清。
例如SNP分析等分子生物工程包括对极大数量的样本的大量处 理。这些处理经常是复杂和耗时的,并且通常要求很高的精度水平。 对于很多技术,敏感性、特异性和可复制性的缺失限制了它们的应用。
例如,伴随敏感性和特异性的问题至今限制着核酸杂交的实践应 用。"杂交"是指核酸的形成和核酸杂种分子的形成,被用作研究作为 核苷酸序列的同源的核酸的主要结构、以及删除具有同源核苷酸序列 的核酸的方法。氢键可以在具有互补性的、其核酸形成链的碱基对之 间形成,即,在腺嘌呤(A)和胸腺嘧啶(T)之间、以及在鸟嘌呤(G) 和胞核嘧啶(C)之间形成,并且核酸形成两个双螺旋链的特性是通 常被使用的,核酸杂交分析包括使用探针从大量的非对象核酸检测极 少数量的特定对象核酸(DNA或RNA)。为了维持高的特异性,在 最严格的条件下进行杂交,通常利用各种组合温度、盐、清洁剂、溶 剂、离液剂和变性剂来实现。大量的样本、特别是人类基因组DNA 样本中的DNA与极度的复杂性相关。当从非常类似于特定对象序列 的大量序列中制成样本时,即使利用最专一的探针,也会与非对象序 列产生大量的部分杂交。还有在探针DNA与其特定对象(样本DNA) 之间涉及不希望的杂交动力学的情况。即使在最有利的条件下,大量 的杂交反应在较低的探针DNA和对象分子(样本DNA)浓度下进行。 另夕卜,探针DNA经常与样本DNA的补充序列竟争。还存在由于探针 DNA具有对几乎任何物质的亲和力而产生高电平的非特定背景信号 的问题。无论是单独还是组合起来,这些问题在核酸杂交中都会导致 灵敏度和特异性的损失。
在上述情况下,本发明的发明人已经提出一种为了进行SNP的 (碱基的同型或异型的)确定而例如使用对信号大小的t测试来进行显著性差异确定的方法(参照专利文献1),或者分析相应信号的大
小之比的方法(参照专利文献2)。在专利文献1记载的方法中,除 非两个类型的信号值几乎完全匹配,否则不能作出异型确定。但是, 在实际测量中,这样的条件是不可能的。并且,专利文献2记载的方 法为了解决上述问题而提出根据信号之比来进行分析的方法。但是, 存在当 一个信号增量是"负"或极小时,判断精度很差的问题。
这样,在以往技术中存在用于确定核酸的核苷酸序列的基因分型 (genotyping)算法,但是在确定精度上存在问题。
专利文献1: JP-A 2004-125777 (公开)
专利文献2: JP-A 2006-258702 ( 7>开)

发明内容
鉴于上述情况,本发明的目的是提供一种用于确定核苷酸序列 (碱基序列)的方法和装置以及一种由用于确定核苷酸序列的装置执 行的计算机程序产品,它们在核苷酸序列的确定中具有高精度,并且 在实践上建立了即时确定。
本发明的一个方面是一种用于确定核苷酸序列的方法,包括(a) 向芯片盒注入含有样本核酸的溶液,其中,该芯片盒具有多个分别固 定有第一探针核酸的第 一检测电极、多个分别固定有具有与第 一探针 核酸不同的核普酸序列的第二探针核酸的第二检测电极、以及多个分 別固定有具有与第一和第二探针核酸不同的核苷酸序列的控制核酸 的控制电极;(b)通过第一检测电极检测第一检测信号,通过第二 检测电极检测第二检测信号,通过控制电极检测控制信号;(c)计 算通过从第一检测信号的平均值减去控制信号的平均值而得到的第 一差值,并且用控制信号的平均值来除第一差值,从而定义X坐标的 值;(d)计算通过从第二检测信号的平均值减去控制信号的平均值 而得到的第二差值,并且用控制信号的平均值来除第二差值,从而定 义Y坐标的值;(e)计算正X轴与从原点到由X坐标和Y坐标定义 的点的向量之间的角度;以及(f)将该角度与角度判断标准进行比较,从而按照该角度与角度判断标准之间的大小关系来识别样本核酸的 基因型。
本发明的另一个方面是一种用于确定核苦酸序列的装置,包括
(a) 芯片盒,具有多个分别固定有第一探针核酸的第一检测电极、 多个分别固定有具有与第 一探针核酸不同的核苷酸序列的第二探针 核酸的第二检测电极、以及多个分别固定有具有与第 一和第二探针核 酸不同的核苷酸序列的控制核酸的控制电极;(b)检测系统,构成 为通过第一检测电极检测第 一检测信号,通过第二检测电极检测第二 检测信号,通过控制电极检测控制信号;(c)流体输送系统,构成 为向芯片盒注入试剂溶液;以及(d)包括分型模块的计算机,该分 型模块构成为计算通过从第一检测信号的平均值减去控制信号的平 均值而得到的第一差值,并且用控制信号的平均值来除第一差值,从 而定义X坐标的值;计算通过从第二检测信号的平均值减去控制信号 的平均值而得到的第二差值,并且用控制信号的平均值来除第二差 值,从而定义Y坐标的值;计算正X轴与从原点到由X坐标和Y坐 标定义的点的向量之间的角度;将该角度与角度判断标准进行比较, 从而识别样本核酸的基因型。
本发明的又一个方面是一种由用于确定核苷酸序列的装置执行 的计算机程序产品,该计算机程序产品包括(a)构成为向芯片盒
注入试剂溶液的指令,其中,该芯片盒具有多个分别固定有第一探针 核酸的第 一检测电极、多个分别固定有具有与第 一探针核酸不同的核 苷酸序列的第二探针核酸的第二检测电极、以及多个分别固定有具有 与第一和第二探针核酸不同的核苷酸序列的控制核酸的控制电极;
(b) 构成为通过第一检测电极检测第一检测信号,通过第二检测电 极检测第二检测信号,通过控制电极检测控制信号的指令;(c)构 成为计算通过从第一检测信号的平均值减去控制信号的平均值而得 到的第一差值,并且用控制信号的平均值来除第一差值,从而定义X 坐标的值的指令;(d)构成为计算通过从第二检测信号的平均值减 去控制信号的平均值而得到的第二差值,并且用控制信号的平均值来
10除第二差值,从而定义Y坐标的值的指令;(e)构成为计算正X轴 与从原点到由X坐标和Y坐标定义的点的向量之间的角度的指令; 以及(f)构成为将该角度与角度判断标准进行比较,从而识别样本核 酸的基因型的指令。


图1是说明实现一个实施方式的核苷酸序列确定系统的检测系 统的一个例子的示意图。
图2是说明实现图1中的检测系统的 一 部分的检测芯片的结构的 代表性平面图。
图3A是示出固定到SNP-"G"检测电极的顶面上的、被赋予核 苷酸序列GACTC......的三个探针DNA链的示意图。
图3B是示出固定到SNP-"T"检测电极的顶面上的、被赋予核 苷酸序列GAATC......的三个探针DNA链的示意图。
图3C是示出固定到控制电极的顶面上的、被赋予核苷酸序列 CAGTG......的三个探针DNA (负控制DNA)链的示意图。
图4是说明本实施方式的核苷酸序列确定系统中使用的芯片盒 结构的一个例子的代表性结构的俯视图。
图5是图4中的芯片盒结构的反转俯视图。
图6是示出实现本实施方式的核苷酸序列确定系统的流体输送 系统的阀单元的整体结构的示意图。
图7是说明本实施方式的核苷酸序列确定系统的示例的逻辑框
图8是说明实现本实施方式的核苷酸序列确定系统的计算机系 统的构成示例的逻辑框图。
图9A是示出固定到SNP-"G"检测电极的顶面上的两个探针 DNA链和由于核苷酸序列与探针DNA完全匹配而与探针DNA成对 为双链的两个SNP = "G"的样本DNA链的示意图。
图9B是示出固定到SNP-"T"检测电极的顶面上的两个探针
iiDNA链的示意图,示出SNP-"G"的样本DNA不能与探针DNA形 成双链。
图9C是示出固定到控制电极的顶面上的两个探针DNA (负控 制DNA)链的示意图,示出SNP-"G"的样本DNA不能与探针DNA 形成双链。
图IOA是示出固定到SNP-"T"检测电极的顶面上的两个探针 DNA链的示意图,示出SNP-"T"的样本DNA不能与探针DNA形 成双链。
图10B是示出固定到SNP-"T"检测电极的顶面上的两个探针 DNA链和由于核苷酸序列与探针DNA完全匹配而与探针DNA成对 为双链的两个SNP = "T"的样本DNA链的示意图。
图IOC是示出固定到控制电极的顶面上的两个探针DNA (负控 制DNA)链的示意图,示出SNP-"T"的样本DNA不能与探针DNA 形成双链。
图IIA是示出固定到SNP-"G/T"检测电极的顶面上的两个探 针DNA链和由于核苷酸序列与探针DNA匹配而与探针DNA成对为 双链的两个SNP = "G/T"的异质样本DNA链的示意图。
图11B是示出固定到SNP-"G/T,,检测电极的顶面上的两个探 针DNA链和由于核普酸序列与探针DNA匹配而与探针DNA成对为 双链的两个SNP = "G/T,,的异质样本DNA链的示意图。
图IIC是示出固定到控制电极的顶面上的两个探针DNA (负控 制DNA)链的示意图,示出SNP-"G/T"的异质样本DNA不能与探 针DNA形成双链。
图12A是示出固定到SNP1检测电极(SNP = "G"检测电极)的
了插层剂的两个SNP = "G"的样本DNA链的示意图。
图12B是示出固定到SNP2检测电极(SNP = "T"检测电极)的 顶面上的两个探针DNA链的示意图,示出不能插入插层剂,因为SNP - "G"的样本DNA不能与纟笨针DNA形成双链。图12C是示出固定到控制电极的顶面上的两个探针DNA (负控 制DNA)链的示意图,示出不能插入插层剂,因为SNP-"G"的样本 DNA不能与探针DNA形成双链。
图13示出对应于图12A、 12B和12C的三个电4匕学电流-电压特性。
图14是说明本实施方式的核苦酸序列确定方法的整体处理的流程图。
图15是说明基于简单移动平均方法的平滑的示意图。
图16是说明使用分别通过多个电极测量的电化学电流并根据电 流波形的尾线(特性基线)的斜率来确定电流波形(电流-电压特性) 中的正常或异常的方法的例子的流程图。
图17示出在芯片盒中测量的电化学电流的两个例子,其中,用 数据2标记的电流-电压特性的尾线(特性基线)的斜率大于用数据 1标记的电流-电压特性的尾线的斜率。
图18A是说明在本实施方式的核苷酸序列确定方法中,从分别 通过每个电极测量的电化学电流(电流-电压特性)的波形中减去每 种情况下的背景电流,得到检测信号的净峰值(峰电流值)的方法的 例子的流程图。
图18B是说明接着图18A中的流程图所示的过程,从分别通过 每个电极测量的电化学电流(电流-电压特性)的波形得到检测信号 的净峰值(峰电流值)的方法的过程的流程图。
图19是说明在本实施方式的核普酸序列确定方法中,使用电化 学电流的微分曲线(di/dv )得到"零交叉"点的方法的示意图,其中"零 交叉,,点用作从分别通过每个电极测量的电化学电流(电流-电压特 性)的波形中减去背景电流的点。
图20是说明在本实施方式的核苷酸序列确定方法中,将直线近 似成电流-电压特性的曲线的方法的示意图,其中近似直线应用于从 分别通过每个电极测量的电化学电流(电流-电压特性)的波形中减 去背景电流的计算步骤序列。图21是图20的放大图。
图22是说明在本实施方式的核苷酸序列确定方法中,通过从零 交叉电压的峰电流中减去对应的背景电流而从峰电流得到净检测信 号的方法的示意图。
图23A是示出分别通过多个控制电极、多个SNP2检测电极(SNP ="T"检测电极)和多个SNP1检测电极(SNP - "G"检测电极)测量 的峰电流值的条形图,其中通过SNP2检测电极测量的峰电流值表现 出稀疏异常性。
图23B是示出分别通过多个控制电极、多个SNP2检测电极(SNP ="T"检测电极)和多个SNP1检测电极(SNP = "G"检测电极)测量 的峰电流值的条形图,其中通过SNP2检测电极测量的峰电流值表现 出分散异常性。
图23C是将正控制电流值、负控制电流值与上限设定参数NCUL 和负控制下限设定参数NCLL进行比较的条形图。
图24是说明在本实施方式的核苷酸序列确定方法中,判断对象
散异常性的方法的例子的流程图。
图25A是说明在本实施方式的核苷酸序列确定方法中,决定是 前进到确定特定核酸是否存在的第一算法、还是前进到确定是野生 型、异型还是突变型的第二算法的方法的流程图。
图25B是说明在本实施方式的核苷酸序列确定方法中,确定是 否存在特定核酸的第一算法的例子的流程图。
图25C是说明在本实施方式的核苷酸序列确定方法中,确定SNP 类型是野生型、异型还是突变型的第二算法的例子的流程图。
图26是说明极坐标(R, A)系统中的向量长度"R"和角度"A" 的定义的图。
图27是示出将本实施方式的核苷酸序列确定方法应用于血清淀 粉样蛋白A (SAA) l基因多态性的例子的图。
图28是示出在本实施方式的核苷酸序列确定方法中,用于识别是野生同型、异型还是突变同型的各种角度判断标准的概念视图。
图29A是示出在本实施方式的核苷酸序列确定方法中,用于测 试有效性判断的算法的例子的流程图。
图29B是示出在本实施方式的核苷酸序列确定方法中,当在步 骤S403中负控制电流值的平均值位于负控制下限设定参数NCLL和 负控制上限设定参数NCUL之间的范围之外时的处理步骤序列的流 程图。
图30是示出在本实施方式的核苷酸序列确定方法中,用于判断 核苷酸是否存在的、用于"-(小于检测灵敏度)"判断的上信号增量 标准SL(-)和用于"+ "判断的下信号增量标准SL(+)的概念视图。
具体实施例方式
以下将参照

本发明的各种实施方式。要注意的是,在所 有附图中,将相同或类似的附图标记应用于相同或类似的部分和部 件,并且省略或筒化对相同或类似部分和部件的说明。 一般地,象以 往那样,在核苷酸序列确定系统的表示中,不是从一幅图到另一幅图 成比例地绘制各种附图,也不是在一幅给定的图中成比例地绘制,特 别是,为了便利附图的阅读,层的厚度是任意绘制的。
为了提供对于本发明的充分理解,在下述说明中将阐述具体细 节,例如具体材料、处理和装置。但是,对于本领域技术人员而言, 本发明显然可以在没有这些具体细节的情况下实施。另外,为了不使 本发明不必要地变得模糊,而没有详细阐述已知的制造材料、处理和 装置。不管基片被实际保持的方位如何,相对于基片的平面定义了 "上"、"上方"、"下"、"下方,,、"垂直"等词。即使存在插 入层, 一个层也是在另一个层上。 (核苷酸序列确定系统)
如图7所示, 一个实施方式的核苷酸序列确定系统包括芯片盒 11、与该芯片盒11电连接的检测系统12、通过接口部分与设置在芯 片盒11中的流道物理连接的流体输送系统13、用于控制芯片盒11的温度的温度控制器14等。如图1所示,图7的检测系统12是三电极 结构的恒电势器,它将参考电极561、 562的电压反馈(负返回)到 相对电极502的输入,从而不管在电极和溶液等各种条件下在细胞内 的分散如何,都将期望的电压提供给溶液,并且连接到检测芯片21 的端子C、 R和W。图1的检测芯片21包含在图7的芯片盒11中。 如图2所示,检测芯片21使用如下的电极单元用作SNP1检 测电极的有源电极551;用作SNP2检测电极的有源电极552;用作控 制电极的有源电极553;用于这些有源电极551、 552和553的参考电 极561、 562,并且相对电极502设置在检测芯片上。即,检测系统 12改变相对电极502的电压,从而将用于有源电极551、 552和553 的参考电极561、 562的电压设定到某预定的特性,并且以电化学的 方式测量由于插层剂的电化学反应而产生的电流(以下称为"电化学 电流")。
在本发明的实施方式的核苷酸序列确定方法中,与图9A、 9B、 9C、 IOA、 IOB、 IOC、 IIA、 IIB和IIC所示的对象核苷酸序列(样 本DNA) 581、 582和583具有互补核苷酸序列的第一探针DNA (第 一探针核酸)571和第二探针DNA (第二探针核酸)572首先被分别 固定到有源电极551和552上,样本DNA581、 582和583是核苷酸 序列确定的对象。更具体地,如图3A所示,有源电极551是构成为 固定探针DNA (第一探针核酸)571的电极,该探针DNA 571具有 与图9A所示的用作对象核苷酸序列并且具有核苷酸序列CTGAG… 的样本核酸(样本DNA) 581的核苷酸序列互补的核苷酸序列 GACTC...。另外,在该实施方式中,尽管说明的是样本DNA和探针 DNA,也可以将PNA、 RNA等DNA以外的不同核酸用作样本或探 针核酸。在图3A中,SNP位置的碱基被指定在从底部起第三个的C, 因此,将检测电极规定为SNP = "G"检测电极。
而且,如图3B所示,有源电极552是固定有第二探针DNA572 的电极,该第二探针DNA572具有与图IO所示的用作对象核苷酸序 列并且具有核苷酸序列CTTAG…的样本核酸(样本DNA) 582的核苷酸序列互补的核苷酸序列GAATC...。并且,图3B示出SNP位置 的碱基被指定在从底部起第三个的"A,,的SNP = "T"检测电极。
而如图3C所示,有源电极553是固定有控制核酸(控制DNA) 573的控制电极,该控制DNA573具有与用作对象核苷酸序列的样本 核苷酸序列(样本DNA) 581、 582不具有任何互补关系的核苷酸序 列CAGTG...。这些有源电极551、 552和553用作检测细胞内的反应 电流的电极。另外,固定在有源电极551、 552和553上的探针DNA 571、 572和控制DNA 573被设计成检测具有彼此不同的核苷酸序列 的样本DNA,尽管固定在各个有源电极上的探针DNA和控制DNA 的类型不要求是单一的。
在相对电极502与有源电极551之间、相对电极502与有源电极 552之间、以及相对电极502与有源电极553之间,分别施加预定电 压以便在细胞内建立对应的电流。尽管参考电极561和562、参考电 极561和有源电极551之间的电压、参考电极561和有源电极552之 间的电压、参考电极562和有源电极552之间的电压、以及参考电极 562和有源电极553之间的电压被反馈到相对电极502,以便将参考 电极561、 562和有源电极551、 552、 553之间的每个电压调节在预 定的电压特性,从而电压由相对电极502控制,因此可以在不受细胞 中各种检测条件影响的情况下,以高精度水平来检测电化学电流。
如图1所示,本发明的实施方式的核苷酸序列确定系统中的检测 系统12包括电压模式产生器510,构成为产生用于检测在电极之间流 动的电流的电压模式。电压模式产生器510与反转放大器(OPc) 512 的反转输入端连接,该反转放大器(OPc)512构成为通过输入线512b 调节参考电极561与562的参考电压。电压模式产生器510包括DA 转换器,从而电压模式产生器510能够在产生电压模式的同时,将从 图7所示的控制机构15发送的数字信号转换成模拟信号。在端子"I" 与反转放大器(OPc) 512的反转输入端之间,电阻Rs被连接到输入 线512b上。反转放大器512的非反转输入端接地,并且输出线502a 连接在反转放大器512的输出端与端子"C"之间。在反转放大器512
17的反转输入端一侧的输入线512b和在输出端一侧的输出线502a由分别从输入线512b和输出线502a分支的旁路反馈线512a连接。在反馈线512a上设置有包括反馈电阻Rff和开关SWf的保护电路500。输出线502a连接到检测芯片21的端子"C"。端子"C"连接到检测芯片21上的相对电极502。如果设置有多个相对电极502,则并行地设置对应于多个相对电极502的多个端子C。由此能够以一个电压模式将电压同时施加到多个相对电极502上。输出线502a设置有用于将端子"C"的电压接通和断开的开关SWo。
在反转放大器512的输入和输出之间分路的保护电路500形成防止过量的电压被施加到相对电极502的电路。因此,在测量过程中不会施加过量电压,并且溶液不会被电溶解,从而可以在不对期望的插层剂的电化学检测产生影响的情况下进行稳定的测量。
检测芯片21的端子"R,,通过输入线503a连接到电压跟随放大器(OPr) 513的非反转输入端。电压跟随放大器513的反转输入端与输出端之间被线513a短路。在电压跟随放大器513的输出端与输入线512b上的节点之间,通过设置在输出线513b上的电阻Rf连接输出线513b,输入线512b上的该节点被指定为电阻Rs的输出侧与输入线512b之间的连接点,用作反馈线512a和输入线512b的分支点。即,电阻Rf设置在电压跟随放大器513的输出端与输入线512b上的该节点之间。根据从反转放大器512提供的反转放大电压的输出,通过将从参考电极561和562传送的反馈电压传递到反转放大器512的反转输入端,来对电压模式产生电路510产生的电压模式进行反馈控制,从而向相对电极502提供受控电压。
检测芯片21的端子"W"通过输入线501a与跨阻》文大器(OPw)511的反转输入端连接。跨阻放大器511的非反转输入端接地。反馈线511a从与跨阻放大器511的输出端连接的输出线511b分支,从而与输入线501a连接。在反馈线511a上设置有反馈电阻RW,从而在跨阻放大器(OPw) 511的输入侧和输出侧之间旁路。如果跨阻放大器511的输出侧的端子"O"的电压为Vw、电流为Iw,则Vw = Iw*Rw …(1)
从端子"O"得到的电化学信号被传送到图7所示的调节机构。由于设置了多組有源电极(551、 552和553),因此对应于有源电极(551、552和553 )的组的数量设置多个端子"W"和端子"O"。来自多个端子"O"的各个输出被后述的信号切换部分顺序切换,来自多组有源电极(551、 552和553)的电化学信号可以通过AD转换几乎同时地作为一组数字值得到。设置在端子"W"与端子"O"之间的跨阻放大器511等共用电路可以共享该多组有源电极(551、 552和553)。在这样的共用共享结构中,可以设置信号切换部分来将来自多个端子"W"的多条线中的每一条切换为单一的输入线501a。
如图4和5所示,实现图7的核苷酸序列确定系统的芯片盒11包括由盒子顶盖711、盒子底盖712、垫板713 (密封部件)和基片714构成的盒子。盒子顶盖711和盒子底盖712的内表面相对置并且固定成包围垫板713和基片714。两个喷嘴插入孔722和723从盒子顶盖711的外表面贯通到内表面,垂直于沿着盒子顶盖711的外表面到内表面的方向切出的喷嘴插入孔722和723的截面基本上为圓形。圆形的喷嘴插入孔722和723的内径i殳定为约3.2mm,例如略大于图6的喷嘴707和708以及出入口 752和753的外径。如图4所示,两个窗口或电连接器口 724和725从盒子顶盖711的外表面贯通到内表面,垂直于沿着盒子顶盖711的外表面到内表面的方向切出的电连接器口 724和725的截面基本上为圆形。电连接器口 724和725是构成为插入后述的电连接器的窗口。另外,封条检测孔726形成为从外表面贯通到内表面。封条检测孔726用于检测封条的存在。更具体地,将封条从盒子(检测芯片)21的外表面上的封条检测孔726的表面粘贴至电连接器口 724和725的表面,将溶液(样本)注入到盒子(检测芯片)21中,在将溶液(样本)注入到盒子(检测芯片21)中后,去掉该封条,并且检测该封条的存在。通过在粘贴了封条的情况下将溶液(样本)注入到盒子(检测芯片)21中,即使溶液(样本)错误地滴到电连接器口 724或725上,液体也不会实际进入电连接器口 724或725,因为它们被封条覆盖,因此就不会发生电短路等故障。
如图5所示,在盒子顶盖711的内表面侧设置有具有预定深度并且截面形状与基片714的截面形状基本相同的基片对准槽,该基片对准槽被内表面包围,截面形状对应于垂直于沿着盒子顶盖711的外表面到内表面的方向切出的截面。基片对准槽形成为占据与设置有喷嘴插入孔722和723以及电连接器口 724和725的位置相重合的区域。通过将基片714插入并与该基片对准槽配合,基片714能够被设置成与盒子顶盖711的位置一致。基片对准槽形成为使得其深度与基片714的厚度基本相同。
如图5所示,设置比基片对准槽还要深的垫板引导槽,使其与基片对准槽在盒子顶盖711的内表面侧的区域重合,并且垫板引导槽的周围被基片对准槽包围。垫板引导槽的侧面区域形成为与喷嘴插入孔722和723所在的区域重合。垫板713可与垫板引导槽对齐地插入,以便定位于盒子顶盖711上。相对于基片对准槽的水平高度,将垫板引导槽的深度选择成具有与下述的垫板713的厚度基本相同的厚度。因此,相对于盒子底盖712的内表面的水平高度,将垫板引导槽的深度决定成与垫板713的厚度和基片714的厚度之和基本相同。
在盒子顶盖711的内表面的周边i殳置有四个螺孔727a、 727b、727c和727d。盒子顶盖711和盒子底盖712可以与这些螺孔727a、727b、 727c和727d柠在一起。在盒子顶盖711的内表面的周边设置有两个盒子定位孔728a和728b。通过将盒子(检测芯片)21配置成与设置在核苷酸序列确定系统的滑动平台上的两个定位销对齐,可以将盒子(检测芯片)21定位,并且相对于滑动平台对齐。
封条检测孔746形成为贯通盒子底盖712的外表面。盒子底盖712的封条检测孔746形成在当盒子顶盖711与盒子底盖712 —起关闭时与盒子顶盖711的封条检测孔726连通的位置上。由此,从盒子顶盖711到盒子底盖712设置贯通的封条检测孔726,从而当盒子顶盖711与盒子底盖712 —起关闭时,检测光能够照射到封条检测孔726上,由此能够确定封条的存在。在盒子底盖712的外表面的周边部分上设置有四个螺孔747a、747b、 747c和747d。通过将螺钉柠入设置在盒子顶盖711上的对应的螺孔727a 727d,可以将盒子底盖712固定到盒子顶盖711上。在盒子底盖712的外表面的周边上设置有两个盒子定位孔748a和748b。盒子顶盖711的盒子定位孔728a和728b分别贯通盒子定位孔748a和748b。盒子(检测芯片)21相对于滑动平台的定位由设置在核苷酸序列确定系统的滑动平台上的两个定位销和贯通盒子底盖712的盒子定位孔748a和748b的盒子顶盖711的两个定位孔728b和728b建立和调节。并且,在盒子底盖712上设置有盒子类型识别孔749,盒子(检测芯片)21的类型可以根据盒子类型识别孔749的有无来识别。可以通过判断是否进行了盒子类型识别销(省略图示)的下降来自动地进行类型识别。盒子类型识别销(省略图示)的下降状态由控制机构15来检测。
即使在不设置盒子类型识别孔749的情况下使用盒子(检测芯片)21,也能够以与仅识别盒子(检测芯片)21的类型的差异的方式同样的方式进行测量。替代地,可以设计成由控制机构15将盒子(检测芯片)21的类型的差异显示在显示单元(省略图示)上,发出警告并在测量前停止处理。另外替代地,可以将锚定的锚定销用于盒子类型识别销(省略图示),并且将结构设计成使得没有设置盒子类型识别孔749的盒子(检测芯片)21不能安装,从而防止错误的盒子(检测芯片)21被放置在适当的位置上。
如图4所示,垫板713包括具有规定厚度并形成有4个凹角的基本为矩形的板部分、以及位于板部分的主面上的两个长端附近并且设置在短端的中心附近的圆柱形入口 752和出口 753。在入口 752和出口 753的端部设置开口。在入口 752和出口 753的轴中心,沿着垂直于板部分的主面的方向设置有流道。如图5所示,板部分的背面具有从入口 752的配置位置到出口 753的配置位置以曲折的方式形成的弯曲槽。弯曲槽形成弯曲的流道。弯曲槽形成为多次地来回前行,弯曲槽的每个折点具有预定的曲率,以抑制当在折点上设置尖角等时会发生的溶液或空气的积聚。
如图4所示,在基片714的主面上排列多个电极单元761、多个焊接点762和多个焊接点763。如图2所示,每个电极单元761由三电极结构来实现,该三电极结构由相对电极502、有源电极551、 552、553和参考电极561、 562的组合形成。第一探针DNA (第一探针核酸)571、第二探针DNA (第二探针核酸)572和控制DNA (控制核酸)573被固定到多个电极单元761中的每一个的有源电极551、 552和553上。多个电极单元761中的每一个通过未图示的导线连接到对应的焊接点762和焊接点763上。图4例示出用于固定多个探针DNA的多个电极单元761、多个焊接点762和多个焊接点763形成在基片714的同一表面上的情况,但如果多个焊接点762和多个焊接点763形成在基片714的、形成有多个电极单元761的一侧的相反侧上,则阀单元705可以配置在盒子(检测芯片)21上方,探头单元710可以配置在盒子(检测芯片)21下方。在这种情况下,阀单元705和探头单元710不必集成为一个单元。
进行多个电极单元761的排列以便与垫板的位置处的弯曲流道的配置路线配合。当在由盒子顶盖711和盒子底盖712固定的状态下锚定垫板713和基片714时,弯曲槽和基片714的表面由此形成弯曲流道,多个电极单元761向弯曲流道的表面突出。更具体地,由弯曲槽相对多个电极单元761提供弯曲间隙,由弯曲间隙形成弯曲流道。在该状态下,在垫板713与基片714之间设置封条。
U)首先,垫板713通过插入一起安装在垫板引导槽中,以便与盒子顶盖711的内表面的垫板引导槽配合,从而入口 752和出口 753容纳喷嘴插入孔722和723 。
(b) 然后,将基片714设置在基片对齐槽中,从而基片714的一个主面、即排列有多个电极单元761、多个焊接点762和多个焊接点763的面与盒子顶盖711面对。
(c) 然后,将盒子底盖712放在盒子顶盖711上,从而盒子底盖712的内表面742面对盒子顶盖711,并且螺孔747a ~ 747d和螺孔
22727a 727d的位置对齐。
(d )然后,通过将螺钉770a ~ 770d拧入螺孔747a ~ 747d和螺孔727a 727d,来将它们插入。由此用螺钉紧固盒子顶盖711和盒子底盖712,并且将垫板713和基片714固定在盒子顶盖711与盒子底盖712之间,由此完成盒子(检测芯片)21。在该完成状态下,弯曲流道形成为其路线从喷嘴插入孔722到喷嘴插入孔723。
在图4和5中,示出多个螺钉紧固盒子顶盖711和盒子底盖712的例子,但本发明不限于螺钉紧固结构。还可以使用锁定方法,在该方法中,例如使凹凸构件相互接纳以便用凸构件来紧固凹构件。
图6示出设置在流体输送系统13中以便实现本发明的实施方式的核苷酸序列确定系统的阀单元705的整体结构。在图6中,省略了探头单元的结构,探头单元与阀单元705集成为一个单元,阀单元和探头单元由阀单元探头单元驱动机构同时驱动。例如,两个电连接器以预定间隔配置在包括玻璃环氧基片等的探头单元上。多个凸电极以矩阵形式排列在电连接器的端部,其排列与基片714上的焊接点的排列相同,这些凸电极与图4所示的基片714的多个焊接点762和多个焊接点763接触,由此确保基片714与探头单元之间的电连接。在电连接器中设置多条导线,电连接凸电极和控制机构15。
阀单元探头单元驱动机构由来自控制机构15的指令自动驱动。阀单元探头单元驱动机构具有垂直驱动方向。当喷嘴707和708以及电连接器703的束由此相对于盒(检测芯片)21在滑动平台侧的上部下降时,喷嘴707和708由此位于喷嘴插入孔722和723上,两束电连接器703分别位于图6所示的电连接器口 724和725上。盒子(检测芯片)21内的弯曲流道和流体输送系统13彼此连通,从而液体溶液可以自动运送。并且,电连接器位于盒子(检测芯片)21的多个焊接点762和多个焊接点763处,利用电连接器束来电连接多个焊接点762和多个焊接点763。
尽管为了简化绘图而在图6中示出两个阀体781和782,但阀单元705包含多个阀体781和782并且建立彼此的连接。两通电磁阀403和三通电》兹阀413、 423、 433设置在阀体781上,三通电磁阀441和445设置在阀体782上。阀体781例如可以用聚醚醚酮(PEEKTM )树脂来制造。对于阀体781和阀体782分开制造的情况,如果将两者接合,则例如将聚四氟乙烯(PTFE)树脂用作接合部分的包装材料。因此,两个阀体781和782与溶液4妄触的部分的材料可以用PEEKTM或PTFE制造。在每个阀体781和782中设置具有基本恒定的截面的空腔。该空腔用作提供下述的电磁阀、垫板713等之间的连接的管道。喷嘴707和708在阀体782中设置的空腔处连通。喷嘴707和喷嘴708可以用PEEKTM树脂制造。
三通电磁阀413在空气与纯水之间切换,将它们提供给下游的三通电磁阀423。三通电磁阀423在緩沖溶液、空气和来自三通电/P兹阀413的纯水之间切换,将它们提供给下游的三通电磁阀433。三通电磁阀433在插层剂、空气和纯水、以及从三通电磁阀423提供的緩冲溶液之间切换,将它们提供给下游的阀体782。三通电磁阀441在从阀体781向喷嘴707提供空气和溶液、和通过旁通管向三通电磁阀445提供之间进行切换。三通电磁阀445在从三通电》兹阀441提供空气和溶液、和通过喷嘴708从盒子(检测芯片)21运送溶液和空气之间进行切换。
在图6所示的阀单元705中,为了将緩冲溶液运送到盒子(检测芯片)21中,打开三通电磁阀423、 441、 445和液体运送泵454。这使得緩冲溶液被向上吸引,緩冲溶液被切换到喷嘴707,然后从喷嘴707吸引到盒子(检测芯片)21,并从盒子(检测芯片)21吸引到喷嘴708,然后通过三通电磁阀445释放。为了将纯水运送到盒子(检测芯片)21中,不打开三通电^兹阀423,而是打开三通电石兹阀413。为了将插层剂运送到盒子(检测芯片)21中,不打开三通电磁阀423,而是打开三通电磁阀433。为了将空气提供到盒子(检测芯片)21中,打开三通电》兹阀403,关闭三通电》兹阀412、 423或433中的任何一个。设置在阀单元705的阀体781中的空腔部分的管道的内部容积大约为100微升,包括阀中的容积在内。如果与本发明不同,利用管子连接三通阀来实现同样的流动,则尽管可以极大减少样本溶液体积,但需
要大约500微升的内部容积。与本实施方式相比较,在该例子中,阀单元705与盒子(检测芯片)21之间的内部容积大于100微升,但在本实施方式中,可以大大减少10微升。利用这样的结构,在切换到样本溶液后,在盒子(检测芯片)21中流动的样本溶液或空气的体积可以相反地极大减少。结果,可以减少反应和测量中的波动,从而极大地提高结果的可再现性。
由于设置了 一种没有图示的溶液摇动设备,因此样本溶液可以在芯片盒子中自动摇动。摇动样本溶液在以下处理中有效(a )样本DNA和纟笨针DNA的杂交处理;
(b) 清洗处理;和
(c) 插层剂提供处理等。
如项目(a)所指出的那样在杂交处理中摇动样本DNA提高了杂交的效率,减少了所使用的时间。如项目(b)所指出的那样在清洗处理中摇动緩冲液提高了去掉非特性吸附DNA的效率,从而缩短了清洗时间。如项目(c)所指出的那样在插层剂提供处理中摇动插层剂提高了插层剂浓度的均匀性和插层剂吸附的均匀性,从而改善了信号波动和S/N比。溶液摇动的效果可以通过将自动溶液摇动处理应用到项目(a) 、 (b) 、 (c)所指出的所有三个处理、或者三个处理中的一部分来获得。
图7所示的计算机(基因分型系统)16包括输入单元304,用于如图8所示从操作者接收数据和命令等输入信息;中央处理单元(CPU) 300,用于确定对象核酸是否存在,核酸是两个SNP类型中的哪一个,是同型的还是异型的;输出单元305或显示单元306,用于输出确定结果;数据存储部分(省略图示),用于存储核苷酸序列
的确定所需的预定数据等;以及程序存储部分(省略图示),用于存
储核苷酸序列确定程序等。
CPU 300包括去噪模块301、电流波形判断模块302、净电流计算模块310、组正常性判断模块320、测试有效性判断模块325、存在
25判断模块330和分型模块340。
去噪模块301根据"简单移动平均方法"对通过图2所示的SNPl检测电极551、 SNP2检测电极552和控制电极553测量的电流进行平滑,由此来去掉噪声。该平滑可以应用例如图15所示的简单移动平均方法。确切地,"简单移动平均方法"着眼于其规则性,对例如图15(a)所示的时序数据等几个实际值进行简单平均。在图15中,将移动平均的间隔设为m = 5,通过用5来除来自连续的5个点的数据而得到的数字
y[n=(x[n+ x[n+l] + x[n+2+ x[n+3+ x[n+4)/5...... ( 2 )
成为图15 (b)中的移动平均。如图15 (b)所示,移动平均使图15U)中的分散变得平滑,从而便于总趋势的分析。
电流波形判断模块302计算分别由图2所示的SNP1检测电极551、 SNP2检测电极552和控制电极553测量的电流波形(电流-电压特性)的尾线(特性基线)的斜率。根据尾线(特性基线)的每个斜率来确定各个检测信号(电流波形)是正常的还是异常的,并且将异常的检测信号从计算中排除。
净电流计算模块310包括电压计算单元311、基线近似单元312和净电流值计算单元313。按照图18A和图18B的流程图中描述的过程来计算通过从SNP1检测电极551 、 SNP2检测电极552和控制电极553所测量的电流(检测信号)中减去背景电流而从插层剂591得到的真实电化学电流(真实检测信号)的峰值(电流峰值)。
电压计算单元311按照图18A的步骤S221 - S223中描述的过程,相对于电压值(v)对表示由芯片盒11测量的电流(i)-电压(v)特性的波形的电化学电流(i)进行微分。然后,在预定的下限值VI和上限值V2之间的范围内,电压计算单元311确定针对分别由多个电极单元761测量的每个电流-电压特性,微分曲线(di/dv)"零交叉"的点处的电压值Vp^和电流值Ipkl (参见图19)。"零交叉"的点是指电化学电流的微分曲线(di/dv)从正到负或从负到正变化的点,对应于给出电流峰值的电压值Vpw和电流值Ipkl。图19示出微分曲线(di/dv)的分散随着电压值变化,示出微分曲线(di/dv)随着电压值增大而从负变化到正的点处的电压值V一和电流值Ipkl。当存在奇数个"零交叉值"时,采纳中心值作为电压值Vpkl。为了使"零交叉值"不受噪声的影响和由峰值检测范围(下限值VI和上限值V2之间)的设定条件所引起的坏影响,当作为从负值变化到正值后的点的连续3个点保持正值时第一个表现出正值的点的电压值被指定为电压值Vpkl。
组正常性判断模块320按照图24的流程图所示的处理步骤序列从净电流计算模块310计算的真实电化学电流(真实检测信号)的峰值(峰电流值)的数据组中除去异常数据,然后判断该数据组是否是适合执行序列类型判断的数据组。即,组正常性判断模块320从分别通过分别在图4所示的基片714上排列的多个电极单元761中分布的多个SNP1检测电才及551、多个SNP2检测电才及552和多个控制电核^553测量的电流值Ipk2的数据组中除去不满足预定标准的数据作为异常值(步骤S31中的稀疏异常性判断),如果在组单元中不满足预定标准,则该組被判断为异常,并将其从其后的判断模块中的计算对象中除去(步骤S32中的分散异常性判断)。
测试有效性判断模块325按照图29A和图29B所示的流程图所示的处理步骤序列判断测试是否有效。即,针对大小关系,将由多个分别排列在图4所示的基片714上的多个电极单元761中分布的正控制电极(反应电极)554检测的正控制电流和由负控制电极(反应电极)555检测的负控制电流与预定的标准值进行比较。然后,如果一組负控制电流小于预定标准并且一组正控制电流大于预定标准,则该测试被判定为有效。然后,操作流前进到其后的判断模块中的计算步
存在判断模块330按照图25B的流程图所示的处理步骤序列,确定是否存在对象核酸。图25B所示的处理步骤的细节将后述。
分型模块340按照图25C的流程图所示的处理步骤序列,将SNP类型确定为SNP-"G"或SNP="T"。而且,分型才莫块340将SNP类型分类成G/G同型、G/T异型或T/T同型等。图25C所示的处理步骤的细节将后述。
如图8所示,电压范围存储单元(用于波形判断)351、允许斜率范围存储单元352、电压范围存储单元(用于峰电流搜索)353、零交叉值存储器354、拐点存储器355、交点电压存储器356、偏移电压存储器357、基线电流值存储器358、平均值/标准偏差存储器360、组正常性判断存储器361、信号限制电平(SLL)存储器362、有效信号下限(ESLL)存储器363、最小增加率(MIR)存储器364、归一化坐标存储器365、向量长度存储器366、角度存储器367、角度参数存储器368和分类结果存储单元369通过总线303与CPU 300连接。
电压范围存储单元(用于波形判断)351存储"低限电压VLo"和"高限电压VHi ( VLo<VHi)",作为用于计算分别由多个SNP1检测电极551、多个SNP2检测电极552和多个控制电极553测量的电流(检测信号)的尾线(特性基线)的斜率的范围。允许斜率范围存储单元352存储"低限斜率值(Coef Lo )"和"高限斜率值(Coef Hi)"作为电流波形判断模块302用以确定检测信号的尾线(特性基线)的斜率的允许值的参数。
电压范围存储单元(用于峰电流搜索)353存储预定的峰电流搜索电压范围[V1、 V2作为预定参数,便于电压计算单元311读出峰电流搜索电压范围[V1、 V2。如果测量条件固定,则由电化学电流的电流-电压特性指示的电流峰值的位置将出现在基本恒定的电压范围内。因此,峰电流搜索电压范围[V1、 V2]被确定为预定参数。零交叉值存储器354对图4所示的基片714上的所有电极单元761中的每一个中的"零交叉值(零交叉电压值Vpkl、零交叉电流值Ipkl)"进行分类存储。
拐点存储器355存储基线近似单元312的计算所需的拐点电压Vifp。图20所示的"拐点电压Vifp"是通过从给出电流峰值的零交叉电压值Vpw开始沿负方向(通过减小电压)来回溯电压而使微分曲线最小化的电压。交点电压存储器356存储交点电压Vcrs。如图21所示,"交点电压Vm"是电化学电流的电流-电压特性曲线的近似线性表达式与该电流-电压特性曲线的交点所给出的电压。如图21所示,偏移电压存储器357存储通过从交点电压值V s开始沿负方向(通过减小电压)将电压回溯被定义为预定参数的偏移值而得到的偏移电压Vofs。
基线电流值存储器358存储净电流值计算单元313的计算所需的多个基线(背景)电流值Ibg。如图21所示,每个"基线(背景)电流值Ibg,,是用作背景的电流值,可以通过将由电压计算单元311计算的零交叉电压值Vpkl代入由基线近似单元312计算的基线的近似线性表达式来得到。
平均值/标准偏差存储器360存储从多个正控制电极554的测量得到的平均值Xp、从多个负控制电极555的测量得到的平均值Xn、从多个存在检测电极551的测量得到的平均值X (这里,图2所示的SNP1检测电极551被指定为有源电极,分别用于检测对象核酸)、从对应于存在检测电极551的多个控制电极(C) 553的测量得到的平均值Xe、从多个SNP1检测电极551的测量得到的平均值Xp从对应于SNP1检测电极551的多个控制电极(Cl) 553的测量得到的平均值Xd、从多个SNP2检测电极552的测量得到的平均值X2、从对应于SNP2检测电极552的多个控制电极(C2) 553的测量得到的平均值Xc2、从多个正控制电极554的测量得到的峰电流值的标准偏差tTp、从多个负控制电极555的测量得到的峰电流值的标准偏差on、从多个存在检测电极551的测量得到的峰电流值的标准偏差o、从多个对应的控制电极553的测量得到的峰电流值的标准偏差(Jc、从多个SNP1检测电极551的测量得到的峰电流值的标准偏差q、从多个对应的控制电极553的测量得到的峰电流值的标准偏差C7el、从多个SNP2检测电极552的测量得到的峰电流值的标准偏差o2、从多个对
应的控制电极553的测量得到的峰电流值的标准偏差Oe2等,它们分
别由组正常性判断模块320、测试有效性判断模块325、存在判断模块330和分型模块340计算。这些平均值X、 Xp、 Xn、 Xp Xel、 X2、Xc2和标准偏差CT、 (Tp、 CTn、 、<Tcl、 CT2、 Oc2等在任意时间响应于组正
常性判断模块320、测试有效性判断模块325、存在判断模块330和 分型模块340的每个请求而被读出。
组正常性判断存储器361存储会导致稀疏异常性的不足电流的 各种个数Nrs、组正常性判断模块320计算的方差(CV)值CV的各 种系数、用于判断不足电流的最小信号标准MS、组正常性判断模块 320的计算所需的允许稀疏率P和标准CV值CVO ( % )等。"CV" 值是指用对应的平均值来除对象数据组的标准偏差、然后将得到的值 乘以100而得到的值,并且用百分数来表示。由于离差或方差具有样 本单位,因此不能比较两个样本组的分散程度。因此,用各个平均值 来除该值而给出绝对数。信号限制电平(SLL)存储器362存储测试 有效性判断模块325的计算所需的负控制下限(NCLL)设定参数 NCLL和负控制上限(NCUL)设定参数NCUL,并且存储存在判断 模块330的计算所需的正控制下限(PCLL)、信号增量标准SL(+) 和SL(-)(参见图30 )。存储在SLL存储器362中的各个参数是给出 用于控制电极553的信号增量的判断算法的判断标准的设定参数。有 效信号下限(ESLL)存储器363存储测试有效性判断模块325的计 算所需的正控制有效信号下限(PESL)的设定参数、以及存在判断 模块330的计算所需的有效信号下限(ESLL)的设定参数。设定参 数PESL和ESLL是提供确定与标准偏差o相比信号增加是多少倍的 下限的预定参数。即,这些参数用作表示信号增加的可靠性的指标。
最小增加率(MIR)存储器364存储分型模块340的计算所需的 电流增加率标准MIR。电流增加率标准MIR是给出类型判断所需的 电流增量与控制电流值之比的下限值的设定参数。在表示作为标准的 各种参数的图28的概念视图中,作为从原点的距离示出MIR。这意 味着,当通过SNP1检测电极551得到的平均值&从通过对应于SNP1 检测电极551的控制电极(Cl) 553得到的平均值Xd的增量、以及 通过SNP2检测电极552得到的平均值X2从通过对应于SNP2检测电 极552的控制电极(C2) 553得到的平均值\2的增量小时(当数据点位于比半径MIR的圆更接近原点的位置时),没有得到系统所需 的电流值,从而无法执行类型判断(这种情形被标记为"未确定")。 角度参数存储器368存储野生型下限角度Wmin、野生型上限角
度W咖x、异型下限角度Hmi"异型上限角度Hmax、突变型下限角度
M^和突变型上限角度M咖x,它们是分型模块340中的计算所需的。 在示出各种角度判断标准的图28的概念视图中,当从原点到数据点
的向量与正X轴之间的角度位于野生型下限角度Wmin与野生型上限 角度Wn^之间的区域时,该数据点被判断为野生型。当该向量与正
X轴之间的角度位于异型下限角度H^与异型上限角度H,x之间的 区域时,该数据点被判断为异型,当角度位于突变型下限角度Mmin 与突变型上限角度M,x之间的区域时,该数据点被判断为是突变型。 在图28中的角度"A"所示的例子中,数据点被判断为异型。
分类结果存储单元369存储由存在判断模块330和分型模块340 分类的各种分类结果。
尽管省略了图示,但接口经由总线303与CPU 300连接,可以 经由该接口并通过本地总线(未示出)与图7所示的控制机构15之
间发送/接收数据。
在图8中,键盘、鼠标、光笔或软盘驱动器等可以实现输入单元 304。使用输入单元304,执行核苷酸序列确定的操作者可以指定输入 /输出数据,确定多个所需的预定参数、允许误差值和误差水平。而且, 使用输入单元304,可以确定输出的形式等,并且可以接收用于进行 或取消计算的指令。输出单元305和显示单元306例如可以由打印机 单元和显示器单元等实现。显示单元306显示输入/输出数据、确定结 果和确定参数等项目。数据存储器(未示出)存储输入/输出数据、确 定参数和确定参数的历史以及计算中的数据等项目。
如上所述,本发明的实施方式的核苷酸序列确定系统按照实际条 件以高精度方便核酸存在的确定和同/异型SNP的分类。 (核苷酸序列确定方法)
参照图14所示的流程图来说明本发明实施方式的核苷酸序列确定方法。下述的核苷酸序列确定方法是一个例子。包括变形在内,其 它各种核苷酸序列确定方法当然都是可行的。无论如何,使用检测系
统12并通过如下的电化学反应得到图13所示的电化学电流的电流-电压特性是基础将包含样本DNA581、 582和583的化学品(样本 溶液)注入到固定有图3所示的探针DNA571、 572和573的芯片盒 11中,以引起杂交反应,用緩冲溶液进行洗涤并引入插层剂。从电化 学电流的电流-电压特性,来确定定量地对应于每个探针DNA571、 572、 573的杂交反应的峰电流值。然后,对所计算的峰电流值数据进 行统计处理,从而确定核酸的存在或核酸的SNP的类型。
在说明图14所示的流程图之前,参照图9A-9C、图10A-10C和 图11A-11C说明探针DNA和样本DNA的杂交。图4和图5所示的 芯片盒ll可以用于杂交处理。
图9A-9C示出将样本DNA 581指定为具有核苷酸序列 CTGAG......( SNP="G,,的样本DNA )的对象核苷酸序列的三种情形。
如图9A所示,固定有具有核苷酸序列GACTC......的第一探针DNA
571的有源电极(SNP1检测电极)551与对象核苷酸序列(SNP-"G" 的样本DNA) 581形成双链,因为它们的序列完全匹配。但是,即使 序列包含一个不同的碱基,也不能形成双链。因此,如图9B所示, 固定有具有核苷酸序列GAATC......的第二探针DNA 572的有源电极
(SNP2检观'J电极)552与对象核苷酸序列(SNpy'G"的样本DNA) 581不能形成双链。如果序列完全不同,则自然不能形成双链。因此, 如图9C所示,固定有具有核苷酸序列CAGTG......的探针DNA (负
控制DNA) 573的有源电极(控制电极)553与对象核苷酸序列
(SNP-"G"的样本DNA)不能形成双链。
图10A-10C示出样本DNA 582是具有核苷酸序列CTTAG......
(样本DNA的SNP="T,,)的对象核苷酸序列的三种情形。同样,通 过芯片盒ll的杂交处理,如图IOB所示,有源电极(SNP2检测电极) 552能够形成双链,因为序列与具有核苷酸序列CTTAG......
(SNP-"T"的样本DNA)的对象核苷酸序列完全匹配。但是,即使序列包含一个不同的碱基,也不能形成双链。因此,如图10A所示, 固定有具有核苷酸序列GACTC......的第一探针DNA571的有源电极
(SNP1检测电极)551与对象核苷酸序列(SNP-"T"的样本DNA) 582不能形成双链。如果序列完全不同,则当然不能形成双链。因此, 如图IOC所示,固定有具有核苷酸序列CAGTG......的探针DNA(负
控制DNA) 573的有源电极(控制电极)553与对象核苷酸序列
(SNP-"T"的样本DNA ) 582不能形成双链。
图11A-11C示出样本DNA 583是具有核苷酸序列CTGAG......
的对象核苷酸序列(SNP-"G,,的样本DNA)的三种情形。同样,通 过芯片盒11的杂交处理,如图11A所示,固定有具有GACTC......
的第一探针DNA 571的有源电极(SNP1检测电极)551能够形成双 链,因为序列与具有核苷酸序列CTGAG......和CTTAG......的"G/T"
异质对象核苷酸序列583 (SNP-"G/T"异型的样本DNA)完全匹配。 如图IIB所示,固定有具有核苷酸序列GAATC......的第二探针DNA
572的有源电极(SNP2检测电极)552能够形成双链,因为序列与对 象核苷酸序列(SNP-"G/T"异型的样本DNA)完全匹配。但是,如 果序列完全不同,则当然不能形成双链。因此,如图11C所示,固定 有具有核苷酸序列CAGTG......的探针DNA (负控制DNA) 573的有
源电极(控制电极)553与"G/T"异质对象核苷酸序列(SNP="G/T,, 异型的样本DNA) 583不能形成双链。
当采用与图4和图5所示结构不同的另一结构时,即,当采用在 基片(芯片)上安装平面垫板并且在盒子(芯片盒)内形成流路时, 盒子(检测芯片)21内的流路被延伸,从而增加了不必要的试剂量。 另外,当利用图6所示的流体输送系统13中设置的阀单元705将化 学品(试剂溶液)自动地注入到盒子(检测芯片)21中时,流路不仅 在基片上而且在盒子(检测芯片)21内仍然很长。因此,化学品(样 本溶液)流入基片外的不希望部分,从而导致浪费。另外,作为盒子
(检测芯片)21向垫板的不充分附着的结果,在垫板与盒子(检测芯 片)21之间发生泄漏,导致溶液传递的失败。本实施方式的结构降低了不必要的试剂量,改善了垫板、基片和盒子(检测芯片)21的附着 并且增加了溶液输送的稳定性。
在上述图9A-9C同样,图12A-12C示出将插层剂591引入由具 有核苷酸序列CTGAG......的对象核苷酸序列(样本DNA) 581杂交
的每个有源电极551、 552、 553中的三种情况。如图12A所示,对于 固定有具有核苷酸序列GACTC......的第 一探针DNA 571的有源电极
(SNP1检测电极)551,序列与具有核苷酸序列CTGAG......的对象
核苷酸序列(样本DNA) 581完全匹配,因此,插层剂591键合成双 链DNA。但是,如图12B所示,固定有具有核苷酸序列GAATC......
的第二探针DNA 572的有源电极(SNP2检测电极)552与对象核苷 酸序列(样本DNA)581不能形成双链,因此插层剂591不能被插入。 如图12C所示,插层剂591不能被插入固定有具有核苷酸序列
CAGTG......的探针DNA (负控制DNA ) 573的有源电极(控制电极)
553,因为它与对象核苷酸序列(样本DNA) 581不能形成双链。
图13示出来自插入到与固定在每个有源电极551、 552、 553上 的探针DNA571、 572、 573杂交的双链DNA的插层剂591的电化学 电流,或者当插层剂591不能被插入到双链DNA时电流与电压之间 的关系。在图13中,用(a)标记的曲线对应于图12A。简单地说, 用U)标记的曲线是指当第一探针DNA571序列与对象核苷酸序列
(样本DNA) 581完全匹配、形成双链并且将插层剂591插入双链时 的电化学电流的电流-电压特性,并且示出高电流值的峰值。但是, 在图13中,对应于图12B的、用(b)标记的曲线是指当第二探针 DNA572与对象核苷酸序列(样本DNA) 581不能形成双链、插层剂 591不能插入时的电化学电流的电流-电压特性,示出与用U)标记 的曲线相比较低电流值的峰值。另外,在图13中,对应于图12C的、 用(c)标记的曲线是指当负控制DNA 573与对象核苷酸序列(样本 DNA)581不能形成双链、插层剂591不能插入时的电流-电压特性, 示出与用(b)标记的曲线相比较低电流值的峰值。用(a)和(c) 标记的曲线中观察到的低电流值峰值是如图12B和12C所示从被电极552和553的表面轻微吸收的插层剂591得到的电流。
在较长的介绍之后,以下参照图14所示的流程图说明本发明的 实施方式的核苷酸序列确定方法。
(i) 首先,将包含样本DNA的化学品(样本溶液)注入到芯片 盒11中,以便引起杂交反应。在杂交反应之后,使用如图6所示设 置在液体输送系统13中的阀单元705,将化学品(试剂溶液)自动注 入到芯片盒ll中。使用检测系统12,针对每个电极测量通过引入插 层剂而得到的电化学反应的电流-电压特性。图4示出基片714上的 多个电极单元761的简图。对应于多个电极单元761,有很多分别固 定了探针DNA 571 、572和573的作为等效电极的SNP1检测电极551 、 SNP2检测电极552和控制电极553。对应于这些电极,可以得到大量 数据。在步骤S101中,去噪模块301通过对针对固定了探针DNA 571 、 572和573的每个电极测量的每个数据集进行平滑,来去除噪声。如 上所述,该平滑可以应用图15所示的简单移动平均方法。在以下处 理中,对所有平滑处理后的数据执行计算。
(ii) 接着,在步骤S102中,电流波形判断模块302确定针对 每个电极测量的电流波形(电流-电压特性)中的尾线(特性基线) 的各个斜率。根据每个基线斜率,确定每个检测信号(电流波形)的 正常和异常。从计算中排除异常检测信号。以下将参照图16的流程 图详细说明步骤S102中的电流波形判断模块302的处理。
(iii) 在步骤S103中,净电流计算模块310检测分别针对每个 电极测量的检测信号的峰值(峰电流值)。以下将参照图18A和图 18B的流程图详细说明步骤S103中的净电流计算模块310的处理。 利用步骤S103中的处理,通过从自图12A-12C所示的插层剂591得 到的电化学电流中减去其它背景电流,可以得到检测信号的净峰值
(峰电流值),作为各个电极的数据集。
(iv) 在步骤S103中除去了背景电流分量后,通过步骤S104中 的信号处理对每个数据集进行处理。简单地说,在步骤S104中,组 正常性判断模块320判断对象数据组是否是正常的。以下将参照图24的流程图详细说明步骤S104中的组正常性判断模块320的处理。
(v) 然后,在步骤S105中,测试有效性判断模块325判断测试 是有效的还是无效的。随后将使用图29A和29B所示的流程图详细说 明步骤S105中的测试有效性判断模块325的处理。
(vi) 在步骤S106中,存在判断模块330确定核酸的存在,或 者分型模块340确定核酸的SNP的类型。以下将参照图25A-25C的 流程图详细说明步骤S106中的存在判断模块330和分型模块340的 每个处理。
根据图14的流程图所示的本发明的实施方式的核苷酸序列确定 方法,即使当在芯片盒11和检测系统12中存在异常时,以及当数据 存在分散时,也能够精确地确定是否存在特定的核酸、SNP类型是什 么以及该类型是同型的还是异型的。以下将详细说明图14的流程图 中的每个步骤。
一步骤S102:电流波形的正常/异常的确定一
由图1的检测系统12测量的芯片盒11中的电化学电流信号(电 流波形)表现出图17所示的电流-电压特性的波形。对于发出电信 号的物质(插层剂)所特有的电压,其电流-电压特性的波形具有图 17所示的峰形状。图17示出两种电流-电压特性,用"数据l"和"数 据2"标记。与用"数据l"标记的电流-电压特性所指示的尾线(特性 基线)的斜率相比,用"数据2"标记的电流-电压特性所指示的尾线 (特性基线)的斜率较大。在用"数据2"标记的电流-电压特性中, 峰形状不清晰,显示出肩状分散。
理想地,电化学电流的电流-电压特性对于比产生峰电流的电压 低的电压显示出基本为"O"的电流值。但是,当在基片714上发生任 何故障时,例如象用"数据2,,标记的电流-电压特性那样,电流-电 压特性中的尾线(特性基线)的斜率变得较大。通过用"数据2"标记 的电流-电压特性,无法准确地检测峰电流值。因此,在图14的步 骤S102中,必须将具有较大的尾线(特性基线)斜率的电流-电压 特性作为"异常"来排除。步骤S102中的电流波形判断模块302的处理过程的详情在图16 的流程图中示出。
(a) 首先,在步骤S201中,提取并确定用于计算针对每个电极 测量的电流波形(电流-电压特性)的尾线(特性基线)的斜率。在 电压范围中提取的情况下,使用输入单元304将低限电压VLo和高限 电压VHi ( VLo<VHi)确定为预定参数,并将其存储在电压范围存储 单元(用于波形判断)351中。另外,作为用于指定尾线(特性基线) 的允许斜率范围的参数,确定"系数低限值(Coef Lo)"和"系数 高限值(CoefHi),,并将其存储在允许斜率范围存储单元352中。
(b) 接着,在步骤S202中,电流波形判断模块302读出存储 在电压范围存储单元(用于波形判断)351中的低限电压VLo和高限 电压VHi,并推导出所确定的电压范围中的尾线(特性基线)的斜率 的近似表达式。低限电压VLo和高限电压VHi是指定用于计算尾线
(特性基线)的斜率的电压范围的参数。通过使用低限电压VLo和高 限电压VHi之间的电压范围对针对每个电极测量的电流-电压特性 波形进行最小平方近似,得到直线(初步基线)。
(c) 在步骤S203中,电流波形判断模块302通过将所读出的低 限电压VLo和高限电压VHi分别设定为针对每个电极测量的每个电 流波形(电流-电压特性)的开始点和结束点,来计算针对每个电极 测量的电流波形(电流-电压特性)的尾线(特性基线)的斜率(b)。
(d) 然后,在步骤S204中,电流波形判断模块302从允许斜 率范围存储单元352中读出"系数低限值(CoefLo)"和"系数高限值
(Coef Hi)",并且确定针对每个电极计算的尾线(特性基线)的斜 率是否分别存在于"系数低限值(Coef Lo )"和"系数高限值(Coef Hi)" 之间。
(e) 在步骤S204中,当由特定电极测量的电流波形(电流- 电 压特性)的尾线(特性基线)的斜率存在于"系数低限值(CoefLo )" 和"系数高限值(CoefHi),,之间时,将其确定为"正常波形"。然后, 前进到图14所示的步骤S103。在步骤S204中,当由特定电极测量的电流波形(电流-电压特性)被确定为在"系数低限值(Coef Lo)" 和"系数高限值(CoefHi)"之间的斜率范围之外时,将由该电极测量 的电流波形(电流-电压特性)确定为"异常波形"。在步骤S205中, 电流波形判断模块302对由该电极测量的电流波形(电流-电压特性) 发出"错误确定",并且根据需要使显示单元306显示"错误"或者使输 出单元305将"错误确定"传送给外部设备。
图16所示的处理步骤序列针对图4所示的基片714上的所有电 极单元761执行。
一步骤S103:峰电流值的检测一
参照图18A和图18B的流程图说明步骤S103中的净电流计算模 块310的处理过程的详情。在步骤S103中,从由检测系统12测量的 每个电极单元761的电流-电压特性的波形中检测相应的净峰电流值 的过程是针对由多个电极单元761测量的各个电流-电压特性并通过 以下序列实现的在步骤S221-S223中计算给出电流峰值的电压值 (参见图19所示的微分电流值-电压特性);在步骤S224 - S228中 对基线(背景基线)进行近似(参见图20和图21所示的微分电流值 -电压特性和电流-电压特性);在步骤S229-S230中计算峰电流 值(参见图22所示的电流-电压特性)。
(a)由芯片盒ll测量的电化学电流的电流-电压特性所指示的 电流峰值出现在基本恒定的电压范围中。因此,在步骤S221中,使 用图8所示的输入单元304,将峰电流搜索电压范围[V1、 V2作为预 定参数初步存储在电压范围存储单元(用于峰电流搜索)353中。简 单地说,如图19所示,在下限值VI和上限值V2之间的电压范围中 进行电化学电流的峰电流搜索。首先,在步骤S222中,净电流计算 模块310的电压计算单元311相对于电压值(v)对表示电化学电流 的电流(i)-电压(v)特性的波形的电流(i)进行微分,以得到每 个电流-电压特性的微分曲线。然后,在步骤S223中,电压计算单 元311在下限值VI和上限值V2之间的电压范围中得到电化学电流 的微分曲线(di/dv)"零交叉"(参见图19)的点处的电压值(零交叉电压值)Vpw和电流值(零交叉电流值)Ipkl。"零交叉"点是指电化
化的点,对应于给出电流峰值的电压值Vp!a和电流值Ipw。图19示出 代表性的一条微分曲线(di/dv)随着电压值增大而从负变化到正的点 处的电压值Vp^和电流值Ipkl。为了使"零交叉值"不受噪声的影响和 由(下限值VI和上限值V2之间的)峰检测范围的设定条件引起的 坏影响,当作为从负值变化到正值后的点的连续3个点保持正值时第 一个表现出正值的点的电压值被指定为电压值Vpkl。零交叉值存储器 354将图4所示的基片714上的每个电极单元761中的"零交叉值(零 交叉电压值Vpkl、零交叉电流值Ipkl )"以规定的顺序进行排序和存储。 (b)在步骤S224中,净电流计算模块310的基线近似单元312 定义图20所示的拐点电压Vifp。"拐点电压Vifp"是通过从给出电流峰 值的零交叉电压值Vpja开始沿负方向(通过减小电压)来回溯电压而 使每个微分曲线最小化的电压。拐点电压Vjfp被排序并存储在拐点存 储器355中。然后,在步骤S225中,基线近似单元312分别从零交 叉值存储器354和拐点存储器355中读出零交叉电压Vpkl和拐点电压 Vifp。而且,在步骤S225中,基线近似单元312在零交叉电压值Vpkl 和拐点电压Vifp之间近似每个电流-电压特性曲线的以下线性表达 式
y=ax+b...... (3)
以得到基线(背景基线)的原点。由方程式(3)表示的线性表达式 近似的是图20和21所示的电流-电压特性曲线的峰值部分的肩部的 斜率。例如,零交叉电压值Vp^和拐点电压V昨之间的电流-电压特 性的波形数据用最小平方近似来近似。在图20的例子中,线性表达 式的结果系数"a"和常数"b"分别是
a = -1.397xl010;
b = 3.396xl0'8。
在图21所示的例子中,线性表达式的结果系数"a"和常数"b"分
别是a、2.899xl(ru; b = 4.504xl(T9。
而且,在步骤226中,基线近似单元312计算每个电流 一 电压特 性波形与对应的图21所示的方程式(3)的近似线的交点处的交点电 压Vers,并将每个交点电压Vm排序并存储在交点电压存储器356中。 在步骤S227中,基线近似单元312通过将从对应的交点电压值Vcrs 开始的电压沿负方向(通过减小电压)回溯被定义为预定参数的偏移 值来在每个电流-电压特性波形中定义每个偏移电压V。fs。所得到的 偏移电压V。fs被分类并存储在偏移电压存储器357中。另外,基线近 似单元312从偏移电压存储器357读出偏移电压V fs,并从交点电压 存储器356读出交点电压Vers。在步骤S228中,通过图22所示的最
小平方方法得到用作偏移电压V。fs与交点电压Vers之间的、电流- 电
该近似线性表达式可以与方程式(3)相同的格式来表达。在图22所 示的线性近似中,线性表达式的结果系数"a"和常数"b"分别是
a = -6.072xl012;
b- 5.902xl09。
(c)然后,净电流计算模块310的净电流值计算单元313从零 交叉值存储器354读出零交叉电压值Vpkl。然后,在步骤S229中, 净电流值计算单元313将对应的零交叉电压值Vpw代入在步骤S228 中得到的基线(背景基线)的每个近似线性表达式中,得到用作参考 背景的基线(背景基线)上的多个背景电流值Ibg。基线(背景基线) 上的背景电流值Ibg被排序并存储在基线电流值存储器358中。而且, 净电流值计算单元313从零交叉值存储器354中读出表示电流-电压 特性波形的峰值的零交叉电流值Ip^。在步骤S230中,通过应用方程 式(4):
Ipk2 = abs (Ipki - Ibg) ...... ( 4 )
如方程式(4)所示,从对应的零交叉电流值Ipkl中减去用作参考背景 的基线(背景基线)的每个电流值Ibg。方程式(4)的减法针对由每个电极单元761中的对应的SNP1检测电极(SNP-"G,,检测电极) 551、对应的SNP2检测电极(SNP-"T"检测电极)552和对应的控 制电极553测量的每个电流-电压特性来执行。然后,针对多个电极 单元761中的每一个中的多个电极551、 552和553计算多个净电流
值Ipk2。
—步骤S104:组正常性判断一
如上所述,在图14的步骤S103中,净电流计算模块310从表示 检测系统12测量的、从每个电极单元761得到的各个电流-电压特 性的峰值的零交叉电流值Ipw中,减去基线(背景基线)的背景电流 值Ibg。结果,利用各种确定模式,针对每个电极单元761计算出多个 SNP1检测电极(SNP = "G"检测电极)551、多个SNP2检测电极(SNP - "T"检测电极)552和多个控制电极553的各自的净电流值Ipk2并进 行排序。
但是,例如当多个等效SNP1检测电极(SNP - "G"检测电极) 551中只有一个电极的特定值异常地高或低,或者当多个等效SNP2 检测电极(SNP = "T"检测电极)552中只有一个电极的特定值异常地 高或低时,除非这些异常值被排除,否则会干扰确定算法。简单地说, 在图14所示的处理步骤S105中,当通过排列在图4所示的基片714 上的多个等效电极单元761测量的所有峰电流值1一2被用来确定是否 存在特定的核酸、SNP类型是两个当中的哪一个、是同型还是异型时, 会产生问题。
因此,在图14的步骤S104中,在进入步骤S105之前,組正常 性判断模块320执行图24所示的流程图所规定的处理步骤序列,该 处理步骤序列在从排列在图4所示的基片714上的所有电极单元761 得到的电流值Ipk2的每个组中分别执行。在图24所示的流程图中,在 步骤S31中,如图23A所示判断稀疏异常性。然后,在步骤S32中, 如图23B所示判断分散异常性。步骤S31中的稀疏异常性的判断和步 骤S32中的分散异常性的判断按照以下的预定标准,针对每个数据组 单元是否值得进行后续的判断处理来判断组单元的有效性。(a) 在步骤S301中,选择是否由组正常性判断模块320执行稀 疏异常性判断。如果选择了稀疏异常性判断的步骤,则处理步骤序列 前进到步骤S31中的步骤S302。如果没有选择稀疏异常性判断的步 骤,则处理步骤序列跳到步骤S32中的步骤S305,以^更判断分散异常 性。
(b) 在步骤S302中,为了对会导致稀疏异常性的不足电流的 个数Nr进行计数,将"O,,设定为个数Nr的初始值,处理步骤序列前 进到下一步骤S303。
(c) 在步骤S303中,读出用于判断存储在组正常性判断存储器 361中的用于判断不足电流的最小信号标准MS,并针对大小关系将 每个电流值Ipk2与最小信号标准MS进行比较。在电流值Ipk2的大小 等于或大于最小信号标准MS的情况下,确定该数据不是会导致稀疏 异常性的不足电流,并且处理步骤序列前进到步骤S304。在电流值 Ipk2的大小小于最小信号标准MS的情况下,确定该数据是会导致稀 疏异常性的不足电流,在步骤S311中,显示"错误(判断对象以外的 数据)"并将该数据从判断对象中除去。而且,在步骤S312中,对会 导致稀疏异常性的不足电流的个数Nr向上计数,处理步骤序列返回 到步骤S303。针对组中的所有数据重复该过程,从而计出组中的会导 致稀疏异常性的不足电流的最终个数Nr。在步骤S303中,将被判断 为不在稀疏数据内的数据定义为判断对象数据。
(d) 在步骤S304中,读出存储在组正常性判断存储器361中 的允许稀疏率P。然后,在NO个电极被分配给该组的情况下,将会 导致稀疏异常性的不足电流的累计个数Nr与以下的值进行比较
丽P
如果个数Nr小于NO/P的大小,则处理步骤序列前进到用于判 断分散异常性的步骤S32中的步骤S305。如果个数Nr等于或大于 NO/P的大小,则该组由于"大丢失数据"而被确定为不值得进行基因 分型,并且被判断为"组异常"。
(e) 在步骤S305中,估计用于判断的对象数据组中的电流值Ipk2的平均值是否为"0"。如果估计为"O"值,则在步骤S314中判断用 于判断的对象数据组为"组异常",并且不在步骤S32中进一步判断对 象数据组的分散异常性。这里,如果在步骤S305之前已经执行了稀 疏异常性判断,则平均值一定不会变成"O"。但是,如果在步骤S301 中选择了不执行稀疏异常性判断的程序,则在步骤S305中对象数据 组可能被判断为"组异常"。如果平均值不是"O",则处理步骤序列前 进到用于判断分析异常性的步骤S32的下一步骤S306。
(f )在步骤S306中,计算用于判断的对象数据组中的电流值Ipk2 的平均值和标准偏差,用平均值来除标准偏差,从而提供对象数据组 的CV值。然后,处理步骤序列前进到下一步骤S307。
(g)在步骤S307中,从组正常性判断存储器361读出被定义为 设定参数的标准CV值CVO,并将在步骤S306中计算的CV值与标 准CV值CVO进行比较。如果所计算的对象数据组的CV值小于标准 CV值CVO,则在下一步骤S308中判断对象数据组为正常数据组。而 且,处理步骤序列前进到图14所示的流程图中的步骤S105的测试有 效性判断。如果所计算的对象数据组的CV值等于或大于标准CV值 CVO,则在图24的流程图中的步骤S315中,由于对象数据组中的"大 分散数据",该对象数据组被判断为"组异常"。
上述过程针对所有数据组重复执行,分别判断数据组是否正常, 从而可以除去异常数据组。
当从电极得到的电流值Ipk2的特定数据组被确定为判断对象以 外的数据时,组正常性判断模块320执行"组异常性判断",并且显示 单元306显示"错误",输出单元305向外部设备提供"错误"信息。因 此,在后续的步骤中,计算可以针对净电流值(真实电流值)Ipk2。
然后,如果没有特别说明,则以下将"净电流值Ipk2"称为"电流值"。
并且,在将来的计算中,由于除去了稀疏异常性的数据组,因此基本 上仅针对判断对象的正常数据组来处理。 一步骤S105:测试有效性判断一
以下使用图29A和29B所示的流程图来说明步骤S105中的测试有效性判断模块325的处理详情。这里,判断通过分别分布在图4所 示的基片714上排列的多个电极单元761中的多个正控制电极554和 负控制电极555分别测量的电流值Ipk2的数据组。
(a) 在步骤S401中,首先选择是否在测试有效性判断中执行针 对负控制的数据的判断。如果不执行针对负控制的数据的判断,则在 步骤S435中,在测试有效性判断中将针对电流值Ipk2的数据组的测试 判断为"有效",测试有效性判断模块325中的处理步骤序列结束。如 果选择了针对负控制的数据的判断,则处理步骤序列前进到下一步骤 S402。
(b) 在步骤S402中,如果分别从负控制电极555得到的电流 值lpk2的数据组在前面的图14所示的流程图的步骤S104中的组正常 性判断中被判断为"正常",则处理步骤序列前进到下一步骤S443。如 果电流值Ipk2的数据组在图14所示的流程图的步骤S104中的组正常 性判断中被判断为"组异常",则显示单元306显示"未确定(N.D.52 )", 并且输出单元305在步骤S441中向外部设备提供"未确定"信息。
(c) 在步骤S443中,分别计算分别从负控制电极555得到的电
流值Ipk2的数据组的平均值Xn和标准偏差(Tn,并且存储在平均值/标
准偏差存储器360中。
(d )在步骤S403中,从SLL存储器362中读出所存储的负控 制上限设定参数NCUL和负控制下限设定参数NCLL,并且从平均值 /标准偏差存储器360中读出在步骤S443中计算的负控制电流的平均 值Xn。然后,针对大小关系,对上限设定参数NCUL、下限设定参数 NCLL和负控制电流值的平均值Xn进行比较。如果负控制电流值的 平均值Xn等于或大于下限设定参数NCLL并且等于或小于上限设定 参数NCUL,则在步骤S404中,将负控制视为是合理的。然后,处 理步骤序列前进到下一步骤S405。如果负控制电流值的平均值XJ立 于下限设定参数NCLL与上限设定参数NCUL之间的范围之外,则 在步骤S421中,将负控制视为异常。然后,处理步骤序列前进到步 骤S422 (图23C概念性地示出负控制电流值的平均值Xn超过上限设定参数NCUL的情况)。
(e )在步骤S405中,选择是否执行正控制判断。如果不执行针 对正控制的数据的判断,则在步骤S412中,测试有效性判断模块325
将针对电流值Ipk2的数据组的测试判断为"测试有效",测试有效性判
断模块325中的处理步骤序列结束。当将要执行针对正控制的数据的 判断时,处理步骤序列前进到下一步骤S406。
(f) 在步骤S406中,针对正控制的数据执行与在步骤S402中 对负控制执行的处理步骤序列相同的处理步骤序列。在前面的图14 所示的流程图中的步骤S104中的组正常性判断中,如果电流值Ipk2 的数据组被判断为"正常",则处理步骤序列前进到下一步骤S444。在 图14所示的流程图中的步骤S104中的組正常性判断中,如果电流值 Ipk2的数据组被判断为"组异常",则在步骤S442中将电流值1^的数 据组处理为"未确定(N.D.51 )",将判断结果在分类结果存储单元369 中分类,显示单元306显示"未确定(N.D.51)",并且输出单元305 向外部设备提供"未确定"信息。
(g) 在步骤S444中,分别计算分别从正控制电极554得到的电
流值Ipk2的数据组的平均值Xp和标准偏差Op,并且存储在平均值/标
准偏差存储器360中。
(h) 在步骤S407中,从SLL存储器362中读出所存储的正控 制下限设定参数PCLL和正控制有效分散系数PESL,并且从平均值/ 标准偏差存储器360中读出在步骤S443中计算的负控制电流的平均 值Xn和标准偏差 以及在步骤S444中计算的正控制电流的平均值
Xp和标准偏差(Tp。针对大小关系将从正控制电流值的平均值Xp中减
去了负控制电流值的平均值Xn后的值(Xp-Xn)与下限设定参数 PCLL进行比较。而且,将从正控制电流值平均值Xp中减去了有效分 散系数PESL与正控制电流的标准偏差(Tp相乘后的值(PESL*op)而 得到的值
Xp- (PESL、)
与将有效分散系数PESL与负控制电流的标准偏差CTn相乘后的值(PE SL * on)加到负控制电流值的平均值Xn上而得到的值 Xn+ (PESL*on)
进行比较。如果从正控制电流值的平均值Xp中减去了负控制电流值 的平均值Xn而得到的值(Xp-Xn)等于或大于下限设定参数PCLL, 并且如果从正控制电流值平均值Xp中减去了有效分散系数PESL与 正控制电流的标准偏差Op相乘后的值(PESL*op)而得到的值(Xp -(PESL*<tp))等于或大于将有效分散系数PESL与负控制电流的 标准偏差 相乘后的值(PESL*<rn)加到负控制电流值平均值Xn上 而得到的值(乂11+ (PESL*on))(步骤S408),则在步骤S409中,
将针对电流值Ipk2的数据组的测试判断为"测试有效",测试有效性判
断模块325中的处理步骤序列结束。如果任意一者都不满足(步骤 S410),则在步骤S411中,将针对电流值Ipk2的数据組的测试判断 为"测试无效"。
(i)在图29A所示的步骤S403中,如果如图23C所示负控制 电流值的平均值位于负控制下限设定参数NCLL与负控制上限设定 参数NCUL之间的范围之外,则在图29B所示的步骤S421中,将电 流值Ipk2的数据组判断为"负控制异常",处理步骤序列前进到图29B 所示的步骤S422。在步骤S422中,与图29A的步骤S405同样,选 择是否执行正控制判断。如果不执行针对正控制的数据的判断,则在 图29B所示的步骤S434中,测试有效性判断模块325将针对电流值
IPk2的数据组的测试判断为"测试无效"。然后,测试有效性判断模块 325中的处理步骤序列结束。如果要执行针对正控制的数据的判断, 则处理步骤序列前进到下一步骤S423。
(j)在图29B所示的步骤S423中,与图29A所示的步骤S406 中的处理同样,针对正控制,在前面的图14所示的流程图中的步骤 S104中的组正常性判断中,如果电流值Ipk2的数据组被判断为"正常,,, 则处理步骤序列前进到下一步骤S445。在图14所示的流程图中的步 骤S104中的组正常性判断中,如果电流值Ipk2的数据組被判断为"组 异常",则测试有效性判断模块325在步骤S431中将针对电流值Ipk2的数据组的测试判断为"测试无效"。然后,测试有效性判断模块325 中的处理步骤序列结束。
(k)在步骤S445中,执行与步骤S444同样的处理。即,分别 计算分别从正控制电极554得到的电流值Ipk2的数据组的平均值Xp 和标准偏差Op,并且存储在平均值/标准偏差存储器360中。
(I)在步骤S424中,从SLL存储器362中读出所存储的正控 制下限设定参数PCLL和正控制有效分散系数PESL,并且从平均值/ 标准偏差存储器360中读出在步骤S443中计算的负控制电流的平均 值X。和标准偏差^以及在步骤S445中计算的正控制电流的平均值 Xp和标准偏差(Tp。针对大小关系将从正控制电流值的平均值Xp中减 去了负控制电流值的平均值Xn后的值(Xp-Xn)与下限设定参数 PCLL进行比较。而且,将从正控制电流值平均值Xp中减去了有效分 散系数PESL与正控制电流的标准偏差Op相乘后的值(PESL*op)而 得到的值
Xp- (PESL* yp)
与将有效分散系数PESL与负控制电流的标准偏差On相乘后的值
(PESL*<yn)加到负控制电流值的平均值Xn上而得到的值 Xn+ (PESL*on)
进行比较。如果从正控制电流值的平均值Xp中减去了负控制电流值 的平均值Xn而得到的值(Xp-Xn)等于或大于下限设定参数PCLL, 并且如果从正控制电流值平均值Xp中减去了有效分散系数PESL与 正控制电流的标准偏差Op相乘后的值(PESL*0p)而得到的值(Xp 一 (PESL*op))等于或大于将有效分散系数PESL与负控制电流的
标准偏差(Tn相乘后的值(PESL*(Jn)加到负控制电流值平均值Xn上
而得到的值(乂11+ (PESL*on))(步骤S425),则在步骤S426中,
将针对电流值Ipk2的数据组的测试判断为"测试无效",测试有效性判
断模块325中的处理步骤序列結束。在步骤S424中,如果上述条件 中的任意一个都不满足(步骤S432),则在步骤S433中,将针对电
流值Ipk2的数据组的测试判断为"测试无效",结束该处理。一步骤S106:两个基因分型算法一
在图14的步骤S106中,如图25A所示,在步骤S332的测试有
效性判断中,如果对电流值Ipk2的数据组的测试被判断为有效,则处
理步骤序列前进到步骤S333,并且进行两个基因分型算法之间的选 择。在步骤S332的测试有效性判断中,如果对电流值Ipk2的数据组的 测试被判断为无效,则显示单元306在步骤S334中显示"测试无效", 并且将判断结果分类存储在分类结果存储单元369中。而且,输出单 元305将"测试无效"的信息传递到外部设备,结束信号处理。 在步骤S333中,确定处理步骤序列是否前进到
(a) 用于确定是否存在特定核酸的存在判断算法流程,或
(b) 用于判断SNP类型是野生同型、异型还是突变同型的SNP 类型判断算法流程,即,判断例如G/G同型、G/T异型、T/T同型等。
一步骤S106-1:核酸的存在确定一
在图25A的步骤S333中,当决定应用用于确定特定核酸的存在 的基因分型算法流程时,存在判断模块330按照图25B所示的流程图 的过程来进行确定。
图2示出在检测芯片上排列了 SNP1检测电极551、 SNP2检观寸 电极552、控制电极553、参考电极561、 562和相对电极502的电极 单元。但是,在用于判断是否存在特定核酸的算法的情况下,可以排 列SNP1检测电极551和SNP2检测电极552中的任意一者。即,在 图4所示的基片714上,在多个电极单元761上,SNP1检测电极551 的组和SNP2检测电极552的组中的任意一者作为检测电极(有源电 极)分布。这里,假定图2所示的SNP1检测电极551的组分别是用 于检测对象核酸的有源电极组来进行说明。
U)在图25B所示的流程图的步骤S341中,存在判断模块330 判断作为組正常性判断模块320中的处理的结果,分别从控制电极553 得到的电流值Ipk2的数据組是否是"组正常"。在步骤S341中,如果电
流值IpK2的数据组被判断为"组正常",则处理步骤序列前进到下一步
骤S342。作为组正常性判断模块320中的处理的结果,如果电流值
48Ipk2的数据组被判断为"组异常",则将该数据组处理为"未确定
(N.D.21)",将判断结果分类存储在分类结果存储单元369中。在 步骤S348中,显示单元306显示"未确定(N.D.21),,,输出单元305 向外部设备提供"未确定"的信息。
(b) 而且,在步骤S342中,存在判断模块330判断作为组正 常性判断模块320中的处理的结果,分别通过多个存在检测电极(有 源电极)551测量的、作为判断对象的电流值Ipk2的数据组是否是"组 正常"。在步骤S342中,如果该数据组被判断为"组正常",则处理步 骤序列前进到下一步骤S343。作为组正常性判断模块320中的处理的 结果,如果该数据组被判断为"组异常",则将该数据组处理为"未确 定(N.D.22)",并将判断结果分类存储在分类结果存储单元369中。 然后,在步骤S349中,显示单元306显示"未确定(N.D.22)",输 出单元305向外部设备提供"未确定"的信息。
(c) 接着,计算通过多个存在检测电极(有源电极)551得到 的、作为步骤S343中的判断对象的目标电流值的平均值(X)和标准 偏差(o)以及通过对应的控制电极553得到的电流值的平均值(Xc) 和标准偏差((Te),然后存储在平均值/标准偏差存储器360中。
(d) 在步骤S344中,存在判断模块330从平均值/标准偏差存 储器360中读出通过存在检测电极(有源电极)551得到的电流值的 平均值(X )和通过对应的控制电极553得到的电流值的平均值(Xc), 计算平均值X与Xe之间的差(X-Xe)。而且,从SLL存储器362 读出用于"-"判断的上信号增量标准SL(-)。然后,在步骤S344中, 将平均值X与Xe之间的差(X-Xe)的大小与上信号增量标准SL(-) 的大小进行比较。在步骤S344中,如果判断为差(X-Xe)的大小等 于或小于上信号增量标准SL(-),则判断为对象核酸的电化学电流的 电流值不是从存在检测电极(有源电极)551得到的,并且将判断结 果分类存储在分类结果存储单元369中。然后,在步骤S344中,在 显示单元306上显示"-(小于检测灵敏度)"的判断。另一方面,在 步骤S344中,如果差(X-Xc)的大小大于上信号增量标准SL(-),则处理步骤序列前进到步骤S345。
(e )在步骤S345中,存在判断模块330从平均值/标准偏差存 储器360中读出通过存在检测电极(有源电极)551得到的电流值的 平均值(X)和通过对应的控制电极553得到的电流值的平均值(Xc), 计算平均值X与Xe之间的差(X-Xe)。而且,从SLL存储器362 读出用于"+ "判断的下信号增量标准SL(+)。然后,将平均值X与Xc 之间的差(X-Xe)的大小与下信号增量标准SL(+)的大小进行比较。 在步骤S345中,如果判断为差(X-Xe)的大小小于下信号增量标准 SL(+),则将电流值Ipk2的数据组处理为"未确定(N.D.01)",并将判 断结果分类存储在分类结果存储单元369中。然后,在步骤S351中, 显示单元306显示"未确定(N.D.01),,,输出单元305向外部设备提 供"未确定"的信息。如图30所示,"未确定(N.D.01)"的决定表示 电流值Ipk2的数据组位于上信号增量标准SL(-)与下信号增量标准 SL(+)之间的中途,表明通过存在检测电极(有源电极)551得到的电 化学信号的增量(该增量是通过控制电极得到的电化学信号与通过存 在检测电极(有源电极)551得到的电化学信号之间的差)不足够大 以决定"+ "判断并且不足够小以决定"-,,判断,并且表示不能决定+ /-判断的状况。另一方面,在步骤S345中,如果差(X-Xc)的大 小等于或大于下信号增量标准SL(+),则处理步骤序列前进到步骤 S346。
(f)在步骤S346中,存在判断模块330从平均值/标准偏差存 储器360中读出通过存在检测电极(有源电极)551得到的电流值的 平均值(X)和标准偏差(o)以及通过对应的控制电极553得到的电 流值的平均值(Xj和标准偏差(oe),并且从SLL存储器362读出 有效分散系数ESLL。将值比来自存在检测电极551的电流的平均值 X小有效分散系数ESLL与标准偏差<y的乘积的下述值的大小 X - ESLL*o
与值比来自控制电极的电流的平均值Xe大有效分散系数ESLL与标
准偏差Oe的乘积的下述值的大小Xc + ESLL*oc
进行比较。如果(X 一 ESLL*o )的值的大小等于或大于(Xe + ESLL*oc) 的大小,即,如果不等式(5)
X - ESLL*ct> = Xc + ESLL*oc... ( 5 ) 成立,则认为得到了足够的信号增量,并且执行"+ "判断。然后,将 判断结果分类存储在分类结果存储单元369中。然后,在步骤S347 中,向显示单元306和输出单元305输出"+ "。另一方面,如果不等 式(5)不满足,则判断信号增量相对于信号分散不足够大。然后, 将其处理为"未确定(N.D.02)",并将判断结果分类存储在分类结果 存储单元369中。然后,在步骤S352中,显示单元306显示"未确定 (N.D.02)",输出单元305向外部设备提供"未确定"的信息。
即,在步骤S345中,即使平均值X与Xc之间的差(X-Xc)等 于或大于下信号增量标准SL(+),也不立即显示"+ "。因此,在步骤 S346中,判断电流增量与分散相比是否足够大。这里,关于图30所 示的下信号增量标准SL(+)和上信号增量标准SL(-),最好测量多个样 本并且按照上述过程计算信号增量,然后分别针对"+ "样本和"-"样 本从各自的统计值计算和确定下信号增量标准SL(+)和上信号增量标 准SL(-)的值。优选地,最好从每个"+ "样本和"-"样本的信号增量 的平均值和标准偏差来确定。更优选地,对于"+ "样本,将下信号增 量标准SL(+)确定为"平均值-3A (标准偏差)",对于"-"样本,将 上信号增量标准81^(-)确定为"平均值+ 3* (标准偏差)"。另外,用 于确定下信号增量标准SL(+)和上信号增量标准SL(-)的样本数最好 分别是30个样本或更多。
一步骤S106-2: SNP类型的确定一
在图25A的步骤S333中,如果确定为前进到用于确定SNP类 型是野生同型、异型还是突变同型的基因分型算法流程,则分型模块 340按照图25C所示的流程图的过程来执行确定处理。这里,假定在 SNP1检测电极551中检测到SNP = "G"、在SNP2检测电极552中检 测到SNP-"T"来进行说明。并且,假定用于检测野生型SNP的探针DNA被固定在SNPl检测电极551上、用于检测突变型SNP的探针 DNA被固定在SNP2检测电极552上来进行说明。当然,在SNPl检 测电极被指定用于检测突变型SNP、 SNP2检测电极被指定用于检测 野生型SNP的情况下也没有问题。但是,应当注意判断标准参数之间 的大小关系。
以下按照图25C所示的流程图来说明分型模块340针对样本 DNA确定例如特定SNP位置的碱基是G/G同型、G/T异型还是T/T 同型的过程。
(a) 首先,分型模块340在步骤S361中确定对象个数是否为2 个。在这种情况下,因为要在SNP-"G"和SNP-"T"这两个类型之 间进行确定,因此,如果对象个数是O、 1、 3等,则初始设定本身是 错误的。这样,将判断结果分类存储在分类结果存储单元369中。然 后,在步骤S381中,显示单元306显示"设定错误",输出单元305 向外部设备提供"设定错误,,的信息。
(b) 在步骤S361中,如果确定对象个数为2个,则分型模块 340前进到步骤S362。在步骤S362中,如果作为组正常性判断模块 320中的处理的结果,通过对应于SNP1检测电极551的控制电极(Cl) 553和对应于SNP2检测电极552的控制电极(C2 ) 553得到的电流 值都被判断为"组正常"(图2示出对应于SNP1检测电极551和SNP2 检测电极552两者的共用控制电极553。但可以分别设定对应于SNP1 检测电极551的控制电极(NC1)和对应于SNP2检测电极552的控 制电极(NC2)),则分型模块340使处理步骤序列前进到下一步骤 S363。作为组正常性判断模块320中的处理的结果,如果通过控制电 极Cl和C2得到的电流值中的任意一者被确定为"组异常",则将电 流值处理为"未确定(N.D.31)"。然后,将判断结果分类存储在分类 结果存储单元369中,在步骤S382中,显示单元306显示"未确定
(N.D.31),,,输出单元305向外部设备提供"未确定"的信息。
(c) 而且,在步骤S363中,如果作为组正常性判断模块320 中的处理的结果,通过SNP1检测电才及551和SNP2检测电极552得到的、作为判断对象的电流值都被判断为"组正常",则分型模块340 前进到下一步骤S364。作为组正常性判断模块320中的处理的结果, 如果通过SNP1检测电极551和SNP2检测电极552得到的电流值中 的任意一者被判断为"组异常",则将该电流值处理为"未确定 (N.D.32)",并将判断结果分类存储在分类结果存储单元369中。 然后,在步骤S383中,显示单元306显示"未确定(N.D.32)",输 出单元305向外部设备提供"未确定"的信息。
(d) 接着,在步骤S364中,分型模块340计算 从通过多个SNP1检测电极(SNP-"G"检测电极)551测量的
电流值计算的平均值X"
从通过对应于SNP1检测电极551的控制电极(Cl) 553测量的 电流值计算的平均值Xd;
从通过多个SNP2检测电极(SNP-"T"检测电极)552测量的 电流值计算的平均值X2;
从通过对应于SNP2检测电极552的控制(C2 )电极556测量的
电流值计算的平均值XC2。
所计算的从通过SNP1检测电极551测量的电流值得到的平均值 X"所计算的从通过对应于SNP1检测电极551的控制电极(C1)553 测量的电流值得到的平均值XCl、所计算的从通过SNP2检测电极552 测量的电流值得到的平均值X2、所计算的从通过对应于SNP2检观'J电 极552的控制(C2 )电极556测量的电流值得到的平均值Xc2被存储 在平均值/标准偏差存储器360中。
(e) 接着,在步骤S365中,分型模块340从平均值/标准偏差 存储器360中读出从通过SNP1检测电极551测量的电流值得到的平 均值Xi和从通过多个对应的控制电极(Cl) 553测量的电流值得到 的平均值XCl,并且计算用从通过控制电极(Cl) 553测量的电流值 得到的平均值Xd来除从通过SNP1检测电极551测量的电流值得到 的平均值X,与从通过控制电极(Cl) 553测量的电流值得到的平均 值Xd之间的差(Xi-Xd)而得到的值& (归一化的SNPl电流增量)
(X广Xd) /Xd...... (6)
同样,分型模块340从平均值/标准偏差存储器360中读出从通 过SNP2检测电极552测量的电流值得到的平均值X2和从通过多个对 应的控制电极(C2) 556测量的电流值得到的平均值Xc2,并且计算 用从通过控制电极(C2) 556测量的电流值得到的平均值Xc2来除从 通过SNP2检测电极552测量的电流值得到的平均值X2与从通过控制 电极(C2) 556测量的电流值得到的平均值XC2之间的差(X2-Xc2) 而得到的值Z2 (归一化的SNP2电流增量)
Z2- (X2-Xc2) /Xc2...... (7)。
然后,将计算出的Zi和Z2存储在规一化坐标存储器365中,并 且处理步骤序列前进到步骤S366。
(f) 在步骤S366中,分型模块340从规一化坐标存储器365中 读出规一化SNP1电流增量&和规一化SNP2电流增量Z2。而且,在 步骤S366中,如果规一化SNP1电流增量&和规一化SNP2电流增 量Zz都是"负,,,则从通过SNP1检测电极551和SNP2检测电极552 两者测量的电流值计算的数据不能确立电流增加。这样,将对象电流 值处理为"未确定(N.D.16)",并将判断结果分类存储在分类结果存 储单元369中。然后,在步骤S384中,显示单元306显示"未确定
(N.D.16),,,输出单元305向外部设备提供"未确定"的信息。如果 规一化SNP1电流增量&和规一化SNP2电流增量Z2中的任意一个 "等于或大于0",则处理步骤序列前进到下一步骤S367。
(g) 在步骤S367中,分型模块340从规一化坐标存储器365 中读出规一化SNP1电流增量A和规一化SNP2电流增量Z2。而且, 在步骤S367中,将沿X坐标定义了规一化SNP1电流增量&并且沿 Y坐标定义了规一化SNP2电流增量Z2的点的坐标(Z" Z2)转换成 极坐标(R, A)。即,如图26所示,对于由X坐标Zi和Y坐标Z2 表示的点P, "R,,表示原点与点P (Zn Z2)之间的向量的距离(向量 长度),"A"表示正X轴与从原点到点P (Zn Z2)的向量之间的角
54度。这里,在步骤S366中,如果X坐标(Zi)和Y坐标(Z2)都为 负,则作为不能判断而将从通过SNP1检测电极551和SNP2检测电 极552两者测量的电流值计算的数据除去。这样,角度"A"具有-pi/2 和pi之间的值。然后,将在步骤S367中计算的向量长度"R"存储在 向量长度存储器366中,将角度"A"存储在角度存储器367中,并且 处理步骤序列前进到步骤S368。
(h) 在步骤S368中,分型模块340从向量长度存储器366中读 出在步骤S367中计算的向量长度"R"。而且,分型模块340从MIR 存储器364中读出电流增加率标准MIR,并针对大小关系对向量长度 "R,,和电流增加率标准MIR进行比较(电流增加率标准MIR是给出 电流增加率的下限的设定参数)。如果向量长度"R"小于电流增加率 标准MIR,则确定电流增量过小。然后,将从通过SNP1检测电极551 和SNP2检测电极552两者测量的电流值计算的数据识别为"未确定
(N.D.15)",并将判断结果分类存储在分类结果存储单元369中。 在步骤S385中,显示单元306显示"未确定(N.D.15)",输出单元 305向外部设备提供"未确定,,的信息。如果向量长度"R"等于或大于 电流增加率标准MIR,则处理步骤序列前进到下一步骤S369。在步 骤S369及其以后,确定判断对象的SNP类型是野生同型、异型还是 突变同型。这里,如上所述,假定用于检测野生型SNP的探针DNA 被固定在SNP1检测电极上、用于检测突变型SNP的探针DNA被固 定在SNP2检测电极上来进行说明。
(i) 在步骤S370中,分型模块340从角度存储器367中读出在 步骤S367中计算的角度"A",并且从角度参数存储器368中读出野生 型下限角度W^,然后比较大小关系。如果角度"A"小于野生型下限 角度Wmin,则将从通过SNP1检测电极551和SNP2检测电极552两 者测量的电流值计算的数据识别为"未确定(N.D.ll)",并将判断结 果分类存储在分类结果存储单元369中。然后,在步骤S391中,显 示单元306显示"未确定(N.D.ll)",输出单元305向外部设备提供
"未确定"的信息。如果角度"A"等于或大于野生型下限角度Wmin,则处理步骤序列前进到下一步骤S370。
(j)在步骤S370中,分型模块340从角度存储器367中读出在 步骤S367中计算的角度"A",并且从角度参数存储器368中读出野生 型下限角度Wmin和野生型上限角度Wmax,然后比较大小关系。如果
角度"A"在野生型下限角度Wmin和野生型上限角度W^x之间,则将
从通过SNP1检测电极551和SNP2检测电极552两者测量的电流值 计算的数据识别为"SNP1类型"(这里是G/G同型,即野生同型), 并将判断结果分类存储在分类结果存储单元369中。然后,在步骤 S392中,显示单元306显示"G/G型",输出单元305向外部设备提供 "G/G型"的信息。如果角度"A,,大于野生型上限角度Wmax,则处理步 骤序列前进到下一步骤S371。
(k)在步骤S371中,分型模块340从角度存储器367中读出在 步骤S367中计算的角度"A",并且从角度参数存储器368中读出野生 型上限角度W咖x和异型下限角度Hmin,然后比较大小关系。如果角 度"A,,大于野生型上限角度Wmax并且小于异型下限角度Hmin,则将从 通过SNP1检测电才及551和SNP2检测电才及552两者测量的电流值计 算的数据识别为"未确定(N.D.12)",并将判断结果分类存储在分类 结果存储单元369中。然后,在步骤S393中,显示单元306显示"未 确定(N.D.12)",输出单元305向外部设备提供"未确定"的信息。 如果角度"A,,等于或大于异型下限角度Hmin,则处理步骤序列前进到 下一步骤S372。
(1)在步骤S372中,分型模块340从角度存储器367中读出在 步骤S367中计算的角度"A",并且从角度参数存储器368中读出异型 下限角度Hmin和异型上限角度Hmax,然后比较大小关系。如果角度"A" 在异型下限角度H^和异型上限角度Hmax之间,则将从通过SNP1 检测电极551和SNP2检测电极552两者测量的电流值计算的数据识 别为"SNP1/SNP2类型"(这里是G/T异型,即异型),并将判断结 果分类存储在分类结果存储单元369中。然后,在步骤S394中,显 示单元306显示"G/T型",输出单元305向外部设备提供"G/T型"的信息。如果角度"A"大于异型上限角度H咖x,则处理步骤序列前进到 下一步骤S373。
(m)在步骤S373中,分型模块340从角度存储器367中读出 在步骤S367中计算的角度"A",并且从角度参数存储器368中读出异 型上限角度H^和突变型下限角度Mmin,然后比较大小关系。如果 角度"A"大于异型上限角度H皿并且小于突变型下限角度Mmin,则将 从通过SNP1检测电极551和SNP2检测电极552两者测量的电流值 计算的数据识别为"未确定(N.D.13)",并将判断结果分类存储在分 类结果存储单元369中。然后,在步骤S395中,显示单元306显示"未 确定(N.D.13)",输出单元305向外部设备提供"未确定"的信息。 如果角度"A"等于或大于突变型下限角度Mmin,则处理步骤序列前进 到下一步骤S374。
(n)在步骤S374中,分型模块340从角度存储器367中读出在 步骤S367中计算的角度"A",并且从角度参数存储器368中读出突变
型下限角度Mmin和突变型上限角度M咖x,然后比较大小关系。如果 角度"A"在突变型下限角度Mmin和突变型上限角度M,x之间,则将
从通过SNP1检测电极551和SNP2检测电极552两者测量的电流值 计算的数据识别为"SNP2类型"(这里是T/T同型,即突变同型), 并将判断结果分类存储在分类结果存储单元369中。然后,在步骤 S396中,显示单元306显示"T/T型",输出单元305向外部设备提供 "T/T型"的信息。如果角度"A"大于突变型上限角度M咖x,则处理步 骤序列前进到下一步骤S375。
(0)在步骤S375中,分型模块340从角度存储器367中读出在 步骤S367中计算的角度"A",并且从角度参数存储器368中读出突变 型上限角度M皿x,然后比较大小关系。如果角度"A"大于突变型上限 角度Mmax,则将从通过SNP1检测电极551和SNP2检测电极552两 者测量的电流值计算的数据识别为"未确定(N.D.14)",并将判断结 果分类存储在分类结果存储单元369中。然后,在步骤S397中,显 示单元306显示"未确定(N.D.14)",输出单元305向外部设备提供"未确定"的信息。另外,步骤S375中的角度"A"与突变型上限角度 Mmax之间的大小关系比较不总是必须的。当处理步骤序列已经前进到 步骤S375时,从通过SNP1检测电极551和SNP2检测电极552两者 测量的电流值计算的数据可以无条件地被处理为"未确定(N.D.14)"。 这里,针对多个样本测量了角度判断标准,即野生型下限角度
Wmin、野生型上限角度W腿、异型下限角度H柚、异型上限角度H隨、 突变型下限角度Mmin和突变型上限角度M咖x。然后,计算正X轴与
从原点到点(z,, zj的向量之间的角度,其中,沿x坐标定义了规
一化SNP1电流增量Zp沿Y坐标定义了规一化SNP2电流增量Z2, 并且,角度判断标准优选通过从各个类型(野生型、异型和突变型) 的统计值的计算来确定。优选地,角度判断标准最好是按照针对每个 类型计算的角度的平均值和标准偏差来确定。更优选地,将"平均值 -3* (标准偏差)"定义为下限角度,将"平均值+ 3* (标准偏差)" 定义为上限角度。另外,用于确定角度判断标准的样本数最好是每个 类型为30个样本或更多。
并且,电流增加率标准MIR同样优选通过多个样本的数据的统 计计算来确定。并且,与角度判断标准同样,电流增加率标准MIR
优选使用按照多个样本的测量而确定的向量长度的平均值和标准偏 差来确定。电流增加率标准MIR更优选地被定义为"平均值-3* (标 准偏差)"。另外,用于确定电流增加率标准MIR的样本数最好为30 个样本或更多。
从图28可以容易地理解分型模块340中的类型判断过程。尽管 用于识别SNP类型的基因分型算法的细节如上所述,但从示意图看, 如果角度"A"位于野生型角度判断标准的范围(野生型下限角度Wmin 与野生型上限角度Wmax之间的范围)内,则从电流值计算的对象数 据被识別为"野生型",如果角度"A"位于异型角度判断标准的范围(异 型下限角度H^与异型上限角度H,之间的范围)内,则从电流值 计算的对象数据被识别为"异型",如果角度"A"位于突变型角度判断
标准的范围(突变型下限角度Mn^和突变型上限角度Mmax之间的范围)内,则从电流值计算的对象数据被识别为"突变型"。
反之亦然,当第一探针核酸是构成为检测突变型基因型的探针
DNA、第二探针核酸是构成为检测野生型基因型的探针DNA时,尽 管图中未示出,但角度判断标准包括由与正X轴的角度定义的突变型 下限角度M一;大于野生型下限角度的、由与正X轴的角度定义的 突变型上限角度M,x;具有大于野生型上限角度的角度的异型下限角 度H^n;具有大于异型下限角度的角度的异型上限角度H咖x;具有大 于异型上限角度的角度的野生型下限角度Wmin;和具有大于突变型下 限角度的角度的野生型上限角度Wmax。
另外,图27示出当本基因分型算法被应用到血清淀粉样蛋白A
(SAA) 1基因多态性时从电流值计算的数据的频率分布,横坐标以 弧度单位表示角度"A",代表A/G信号比。如图27所示,随着角度 沿着横坐标从左开始增加,频率分布被分离为野生同型、异型和突变 同型。图27证明,可以将角度判断标准设定成野生型下限角度Wmin 是-0.28孤度,野生型上限角度W,x是0.28弧度,异型下限角度H她 是0.74弧度,异型上限角度H脆是1.09弧度,突变型下限角度M^ 是1.39弧度,突变型上限角度M自是1.85弧度。
从上述说明可知,根据本发明的实施方式的核苷酸序列确定方 法,即使当在芯片盒11和检测系统12中存在异常时,并且当在数据 中存在分散时,通过排除这样的异常数据也可以高精度地确定是否存 在特定的核酸。另外,根据本发明的实施方式的核苷酸序列确定方法, 如果初始设定有错误,则确定为"设定错误"。如果芯片或样本(生物 样本)有异常,则确定为"未确定(生物样本错误)"。如果有设备(硬 件)故障,则可以通过处理除去这些异常数据,例如确定为"未确定
(硬件错误)"。上述处理可以除去异常数据。而且,即使在信号中 的分散使得不能进行判断的情况下,或者在信号大小弱的情况下,也 可以实现对应于工作状况的判断。因此,根据本发明的实施方式的核 苷酸序列确定方法,适当地响应于各种测量环境或状况(实际条件), 能够高精度地识别SNP类型所属的类型,例如"野生同型"、"突变同型"、"异型"等,或者判断是同型还是异型。这里,由"野生同型"、"异
型"、"突变同型"代表的类型可以使用具体的碱基名,例如"A"、 "T"、 "G"、 "C"等来描述。
(核苷酸序列确定程序)
通过与图14、图16、图18A-18B、图24、图25A-25C以及图 29A-29B等效的基因分型算法的程序执行的图14、图16、图18A-18B、 图24、图25A-25C以及图29A-29B所示的确定操作序列,可以控制 和执行图8所示的核苷酸序列确定系统。该程序可以存储在实现本发 明的核苷酸序列确定系统的计算机系统的程序存储器(未示出)中。 另外,该程序可以执行本发明的确定操作序列。其中,"计算机可读 记录介质"是指计算机外部存储器、半导体存储器、磁盘、光盘、磁 光(MO)盘、磁带等能够记录程序的介质。更具体地,"计算机可读 记录介质"包括软盘、高密度盘(CD)只读存储器(ROM)、盒式磁 带、开盘式磁带、存储卡、硬盘、可拆卸盘等。
例如,核苷酸序列确定系统的主体可以由软盘驱动器和光盘驱动 器实现,或者与它们外部连接。软盘驱动器的软盘和光盘驱动器的 CD-ROM从插入口插入。通过执行特定的读出操作,可以将存储在 这些记录介质中的程序安装到实现核苷酸序列确定系统的程序存储 器中。另外,通过连接特定的驱动器单元,可以使用ROM作为已经 应用于游戏软件包等的存储器,或者使用盒式磁带作为磁带设备。而 且,经由包括互联网等在内的信息处理网络,可以将程序存储在程序 存储器中。
(其它实施方式)
对于本领域技术人员而言,在受到本发明公开的教导后,在不脱 离其范围的情况下,可以进行各种变更。
上述实施方式的说明是用于确定G型、T型或G/T型中的一种 类型的过程。但是,可以应用于确定它们当中的两种类型或者确定它 们是否是两种类型的异型。另外,从上述实施方式的说明可以理解, 不必获得A型、G型、C型、T型组的4种类型的测量数据。仅得到SNP的两个可能碱基的两个组就足够了 。
这样,本发明当然包括以上未详述的各种实施方式和变更。因此, 本发明的范围将在后附权利要求书中限定。
工业实用性
本发明可以应用于针对与疾病有关的基因的分子生物工程、药物 代谢的个体差异分析和慢性病的宽范围。特别是,本发明可以在实践 上应用于核酸杂交。
权利要求
1.一种用于确定核苷酸序列的方法,包括向芯片盒注入含有样本核酸的溶液,其中,该芯片盒具有多个分别固定有第一探针核酸的第一检测电极、多个分别固定有具有与第一探针核酸不同的核苷酸序列的第二探针核酸的第二检测电极、以及多个分别固定有具有与第一和第二探针核酸不同的核苷酸序列的控制核酸的控制电极;通过第一检测电极检测第一检测信号,通过第二检测电极检测第二检测信号,通过控制电极检测控制信号;计算通过从第一检测信号的平均值减去控制信号的平均值而得到的第一差值,并且用控制信号的平均值来除第一差值,从而定义X坐标的值;计算通过从第二检测信号的平均值减去控制信号的平均值而得到的第二差值,并且用控制信号的平均值来除第二差值,从而定义Y坐标的值;计算正X轴与从原点到由X坐标和Y坐标定义的点的向量之间的角度;以及将该角度与角度判断标准进行比较,从而按照该角度与角度判断标准之间的大小关系来识别样本核酸的基因型。
2. 如权利要求l所述的方法,还包括得到由第 一检测信号、第二检测信号和控制信号建立的每个电流 -电压特性曲线中的尾线的斜率;以及从尾线的斜率指定电流-电压特性曲线的正常或异常,并且在计 算第一和第二差值之前从计算对象中排除异常检测信号。
3. 如权利要求2所述的方法,还包括从分别由第一检测信号、第二检测信号和控制信号建立的电流-电压特性曲线中的对应的峰电流中,减去由第一检测信号、第二检测 信号和控制信号建立的电流-电压特性曲线中定义的对应的基线电流值;以及在计算第一和第二差值之前,得到第一检测信号、第二检测信号 和控制信号的净电流。
4. 如权利要求3所述的方法,还包括从由净电流构成的多个数据组中确定正常数据组和异常数据组, 从而在计算第一和第二差值之前除去异常数据组。
5. 如权利要求l所述的方法,其中,当第一探针核酸是构成为检测野生型基因型的探针dna、第二 探针核酸是构成为检测突变型基因型的探针dna时,角度判断标准 包括由与正x轴的角度定义的野生型下限角度; 大于野生型下限角度的、由与正x轴的角度定义的野生型上限角度;具有大于野生型上限角度的角度的异型下限角度; 具有大于异型下限角度的角度的异型上限角度; 具有大于异型上限角度的角度的突变型下限角度;和 具有大于突变型下限角度的角度的突变型上限角度, 当第一探针核酸是构成为检测突变型基因型的探针dna、第二探针核酸是构成为检测野生型基因型的探针dna时,角度判断标准 包括由与正x轴的角度定义的突变型下限角度; 大于野生型下限角度的、由与正x轴的角度定义的突变型上限角度;具有大于野生型上限角度的角度的异型下限角度; 具有大于异型下限角度的角度的异型上限角度; 具有大于异型上限角度的角度的野生型下限角度;和 具有大于突变型下限角度的角度的野生型上限角度。
6. 如权利要求5所述的方法,其中,当从样本得到的角度位于野生型下限角度和野生型上限角度之间的区域时,样本核酸被识别为野生型。
7. 如权利要求5所述的方法,其中,当从样本得到的角度位于异型下限角度和异型上限角度之间的 区域时,样本核酸被识别为异型。
8. 如权利要求5所述的方法,其中,当从样本得到的角度位于突变型下限角度和突变型上限角度之 间的区域时,样本核酸被识别为突变型。
9. 如权利要求l所述的方法,其中,当向量长度短于向量长度判断标准时,样本核酸的基因型被判断 为"未确定"。
10. 如权利要求5所述的方法,其中,角度判断标准由具有已知核苷酸序列的样本核酸的多个测量数 据的平均值和标准偏差定义。
11. 一种用于确定样本核酸溶液中的核苷酸序列的装置,包括 芯片盒,具有多个分别固定有第一探针核酸的第一检测电极、多个分别固定有具有与第 一探针核酸不同的核苷酸序列的第二探针核 酸的第二检测电极、以及多个分别固定有具有与第一和第二探针核酸 不同的核苷酸序列的控制核酸的控制电极;检测系统,构成为通过第一检测电极检测第一检测信号,通过第 二检测电极检测第二检测信号,通过控制电极检测控制信号; 流体输送系统,构成为向芯片盒注入试剂溶液;以及 包括分型模块的计算机,该分型模块构成为:计算通过从第一检 测信号的平均值减去控制信号的平均值而得到的第一差值,并且用控 制信号的平均值来除第一差值,从而定义X坐标的值;计算通过从第 二检测信号的平均值减去控制信号的平均值而得到的第二差值,并且 用控制信号的平均值来除第二差值,从而定义Y坐标的值;计算正X 轴与从原点到由X坐标和Y坐标定义的点的向量之间的角度;将该 角度与角度判断标准进行比较,从而识别样本核酸的基因型。
12. 如权利要求11所述的系统,其中,计算机还包括电流波形判断模块,该电流波形判断模块构成为通 过检测系统接收第一检测信号、第二检测信号和控制信号作为电流— 电压特性曲线,得到每个电流-电压特性曲线中的尾线的斜率,从尾 线的斜率指定电流—电压特性曲线的正常或异常,并且从计算对象中排除异常检测信号。
13.如权利要求12所述的系统,其中,计算机还包括净电流计算模块,该净电流计算模块构成为从分别 由第一检测信号、第二检测信号和控制信号建立的电流-电压特性曲 线中的对应的峰电流中,减去由第一检测信号、第二检测信号和控制 信号建立的电流-电压特性曲线中定义的对应的基线电流值,从而得 到第 一检测信号、第二检测信号和控制信号的净电流。
14,如权利要求13所述的系统,其中,计算机还包括组正常性判断模块,该组正常性判断模块构成为从 由净电流计算模块得到的净电流构成的多个数据组中确定正常数据 组和异常数据组,从而除去异常数据组。
15. 如权利要求14所述的系统,其中,计算机还包括存在判断模块,该存在判断模块构成为利用净电流 的正常数据组判断在样本核酸溶液中是否存在对象序列。
16. —种由用于确定核苷酸序列的装置执行的计算机程序产品, 该计算机程序产品包括构成为向芯片盒注入试剂溶液的指令,其中,该芯片盒具有多个 分别固定有第 一探针核酸的第 一检测电极、多个分别固定有具有与第 一探针核酸不同的核苷酸序列的第二探针核酸的第二检测电极、以及 多个分别固定有具有与第一和第二探针核酸不同的核苷酸序列的控 制核酸的控制电极;构成为通过第一检测电极检测第一检测信号,通过第二检测电极 检测第二检测信号,通过控制电极检测控制信号的指令;构成为计算通过从第一检测信号的平均值减去控制信号的平均 值而得到的第一差值,并且用控制信号的平均值来除第一差值,从而定义X坐标的值的指令;构成为计算通过从第二检测信号的平均值减去控制信号的平均 值而得到的第二差值,并且用控制信号的平均值来除第二差值,从而 定义Y坐标的值的指令;构成为计算正X轴与从原点到由X坐标和Y坐标定义的点的向 量之间的角度的指令;以及构成为将该角度与角度判断标准进行比较,从而识别样本核酸的 基因型的指令。
全文摘要
一种用于确定核苷酸序列的方法,包括(a)向芯片盒注入含有样本核酸的溶液;(b)通过芯片盒上的电极检测第一检测信号、第二检测信号和控制信号;(c)计算控制信号的平均值与第一检测信号的平均值之间的第一差,用控制信号的平均值来除第一差,从而定义X;(d)计算控制信号的平均值与第二检测信号的平均值之间的第二差,用控制信号的平均值来除第二差值,从而定义Y;(e)计算正X轴与从原点到点(X,Y)的向量之间的角度;以及(f)将该角度与角度判断标准进行比较,从而识别样本核酸的基因型。
文档编号G01N27/327GK101558155SQ20088000042
公开日2009年10月14日 申请日期2008年9月26日 优先权日2007年12月19日
发明者本乡祯人 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1