制造用于检测靶碱基的含rna探针的方法

文档序号:5939106阅读:119来源:国知局
专利名称:制造用于检测靶碱基的含rna探针的方法
技术领域
本发明在第一方面涉及用于处理核苷酸序列信息的方法、用于处理核苷酸序列信息的装置、用于处理核苷酸序列信息的系统、用于制造用于检测靶核苷酸的含RNA的探针的方法及用于检测靶核苷酸的方法。本发明在第二方面涉及用于设计可用于检测靶核酸的含RNA探针的方法、用于处理在设计中使用的核苷酸序列的方法和使计算机可执行所述核苷酸序列处理方法的程序和记录介质。另外,本发明涉及用于实施所述核苷酸序列处理方法的装置。
背景技术
核酸的扩增或检测技术在医学、药学、农业、林业、渔业和食品领域已是不可缺少的,例如,其不但在遗传工程和分子生物学中,而且亦在疾病的诊断、遗传改良食品的检查和微生物、病毒以及病原菌的检测中作为实验工具。已知有这样ー组基因,不管其生物种类如何,其在编码物质、酶和具有相似功能的其它物质的基因上具有高度同源性。亦已知属于同一物种的生物的个体基因组不完全相同,在其核苷酸序列上具有差异,这叫做多态性。已知多态性表现出一至数十个核苷酸的缺失或插入、特定核苷酸序列的重复等等。一种核苷酸用另ー种核苷酸进行取代,叫做单核苷酸多态性(SNP,本文中可阐述为单核苷酸取代),其作为在搜索疾病相关的基因、測定疾病的易感性或了解药物的敏感性差异(作用和副作用)方面的指示物已引起关注。用于检测所述取代的方法研究亦正在进行中。用于检测具有高度同源性的基因群中特定基因并用于检测SNP的方法包括这样的方法,其中让通过含RNA探针和靶DNA杂交形成的RNA-DNA杂交体经受核糖核酸酶的切割(例如专利文件I)。在该方法中,设计含RNA探针以便当探针和靶DNA之间存在错配吋,核糖核酸酶不能切割杂交体,从而可确认靶DNA中特定核苷酸或核苷酸取代的存在或不存在。一直通过以下方法设计用于基因检测的常规探针以靶核酸的核苷酸序列为基础,选择在探针和靶核酸之间发生特异杂交的这样的核苷酸序列,将待形成的杂交体的Tm值或探针的自我互补性用作指示物。亦提供了用于设计合适探针的多种软件。然而,可仅在包括或不包括特定核苷酸、或包括导致或可能导致核苷酸取代的特定核苷酸的区域中,来设计如上所述的用于检测靶核酸的含RNA探针,因此,与设计常规探针的情况相比,在区域的选择上具有限制。此外,需要探针中含有的RNA部分对核糖核酸酶H的敏感性有很大程度的变化,所述变化程度取决于特定核苷酸或SNP的存在/不存在。迄今为止,这些限制使得研究者们没有选择,只能在其经验或反复试验的基础上设计含RNA探针。现有技术文献
专利文件
专利文件1:美国专利No. 5,660, 988 发明概述
本发明要解决的问题
在第一方面,本发明的目的是提供制造用于检测靶核苷酸的含RNA探针的简单有用的方法,提供用于处理核苷酸序列信息的简单有用的方法、装置和系统,和提供用于检测靶核苷酸的简单有用的方法。在第二方面,本发明的目的是提供设计用于检测靶核酸的含RNA探针的简单有用的方法,提供用于处理核苷酸序列的简单有用的方法、装置和系统。解决问题的手段
为了解决上述问题,本发明人致カ于研究设计用于检测靶核酸的含RNA探针,先前研究者们一直是通过针对待检测的靶核酸中每ー特定核苷酸或单个核苷酸取代的反复试验来设计所述探针。本发明人已检查了大量的以组合-組合为基础的条件组合,结果发现,当与核糖核酸酶H组合使用吋,设计成满足特定条件的序列的含RNA探针能够有效检测特定核苷酸或SNP,从而导致了本发明的完成。本发明人亦开发出用于设计上述含RNA探针的核苷酸序列处理方法;开发出使计算机能执行所述处理方法的程序;开发出核苷酸序列的处理装置;以及还开发出用于处理核苷酸序列的系统,其设计用于检测靶核苷酸的含RNA探针,另外仅通过输入来自与核苷酸序列处理装置连接的客户端(client)装置的靶核酸的核苷酸序列信息,提供关于能够有效检测特定核苷酸或单个核苷酸取代的引物对的信息,所述客户端以可与所述核苷酸序列处理装置经由网络进行通信的状态连接。藉此,本发明人完成了本发明。因此,本发明第一方面概述为涉及
[I]用于处理核苷酸序列信息的方法,其通过用于处理核苷酸序列信息的装置来实施,该方法包括以下步骤
将革G核苷酸的位置信息输入到待输入的核苷酸序列中,藉此输出包含输入的祀核苷酸位置信息的核苷酸序列,所述待输入的核苷酸序列包含靶核苷酸、邻近靶核苷酸5’侧的核苷酸和邻近靶核苷酸3’侧的核苷酸;
产生包含靶核苷酸位置信息的核苷酸序列,其与包含靶核苷酸位置信息的待输出的核苷酸序列互补;
产生核苷酸序列及其互补核苷酸序列,其通过将核苷酸序列中的靶核苷酸或邻近靶核苷酸的核苷酸变换为RNA来获得,在核苷酸序列中包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息;和
自通过RNA核苷酸变换获得的核苷酸序列及其互补核苷酸序列产生部分核苷酸序列,其包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息,
其中
(d)部分核苷酸序列中的核苷酸数量为7-14,
(e)部分核苷酸序列的Tm值为25-40°C,和
(f)核苷酸序列中靶核苷酸或邻近靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置。[2]用于处理核苷酸序列信息的方法,其通过用于处理核苷酸序列信息的装置来实施,该方法包括以下步骤 将革G核苷酸的位置信息输入到待输入的核苷酸序列中,藉此输出包含输入的祀核苷酸位置信息的核苷酸序列,所述待输入的核苷酸序列包含靶核苷酸、邻近靶核苷酸5’侧的核苷酸和邻近靶核苷酸3’侧的核苷酸;
产生包含靶核苷酸位置信息的核苷酸序列,其与包含靶核苷酸位置信息的待输出的核苷酸序列互补;
自输出的核苷酸序列和所产生的互补核苷酸序列产生部分核苷酸序列,其包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息,
其中
(d)部分核苷酸序列中的核苷酸数量为7-14,
(e)部分核苷酸序列的Tm值为25-40°C,和
(f)核苷酸序列中靶核苷酸或邻近靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置;和
产生部分核苷酸序列,其通过将核苷酸序列中的靶核苷酸或邻近靶核苷酸的核苷酸变换为RNA来获得,在部分核苷酸序列中包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息。[3]用于处理核苷酸序列信息的方法,其通过用于处理核苷酸序列信息的装置来实施,该方法包括以下步骤
将革G核苷酸的位置信息输入待输入的核苷酸序列中,藉此输出包含输入的祀核苷酸位置信息的核苷酸序列,所述待输入的核苷酸序列包含靶核苷酸、邻近靶核苷酸5’侧的核苷酸和邻近靶核苷酸3’侧的核苷酸;
产生包含靶核苷酸位置信息的核苷酸序列,其与包含靶核苷酸位置信息的待输出的核苷酸序列互补;
对输出的核苷酸序列和产生的互补核苷酸序列进行下列判定(determination)中的至少ー项判定
(a)判定靶核苷酸是否为嘌呤核苷酸,
(b)判定邻近靶核苷酸3’侧的核苷酸是否为嘌呤核苷酸,和
(c)判定邻近靶核苷酸5’侧的核苷酸是否为嘌呤核苷酸,
藉此从输出的核苷酸序列和所产生的互补核苷酸序列将为嘌呤核苷酸的一个核苷酸确定为RNA位置,藉此输出包含RNA位置信息的核苷酸序列;
自包含RNA位置信息的待输出核苷酸序列产生包含RNA位置信息的部分核苷酸序列, 其中
(d)部分核苷酸序列中的核苷酸数量为7-14,
(e)部分核苷酸序列的Tm值为25-40°C,和
(f)表明为RNA位置的一个核苷酸位于距3’或5’端3-5个核苷酸的位置;和
产生部分核苷酸序列,其通过将确定为RNA位置的核苷酸变换为RNA来获得,在核苷酸序列中包含RNA位置信息或在部分核苷酸序列中包含RNA位置信息。[4]用于处理[3]的核苷酸序列信息的方法,其中输出包含RNA位置信息的核苷酸序列的步骤包含基于靶核苷酸和所确定的RNA位置之间的相对位置,自通过RNA核苷酸变换获得的所产生的部分核苷酸序列中,确定用于选择作为用于检测靶核苷酸的含RNA探针优良的部分核苷酸序列的优先级(priority);和输出包含所确定优先级的核苷酸序列或部分核苷酸序列。[5]通过计算机实施的程序,其包含[I] _[4]中任何一项的用于处理核苷酸序列信息的方法的步骤。[6]计算机可读取的记录介质,其特征为该介质储存[5]的程序。[7]用于处理核苷酸序列信息的装置,其包含
用于将祀核苷酸的位置信息输入待输入的核苷酸序列中藉此输出包含输入的祀核苷酸位置信息的核苷酸序列的组件(means),所述待输入的核苷酸序列包含靶核苷酸、邻近靶核苷酸5’侧的核苷酸和邻近靶核苷酸3’侧的核苷酸;
用于产生包含祀核苷酸位置信息的核苷酸序列的组件,所述核苷酸序列与包含祀核苷酸位置信息的待输出的核苷酸序列互补;
用于产生核苷酸序列及其互补核苷酸序列的组件,所述核苷酸序列通过将核苷酸序列中的靶核苷酸或邻近靶核苷酸的核苷酸变换为RNA来获得,在核苷酸序列中包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息;和
用于自通过RNA核苷酸变换获得的核苷酸序列及其互补核苷酸序列,产生部分核苷酸序列的组件,所述部分核苷酸序列包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息,
其中
(d)部分核苷酸序列中的核苷酸数量为7-14,
(e)部分核苷酸序列的Tm值为25-40°C,和
(f)核苷酸序列中靶核苷酸或邻近靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置。[8]用于处理核苷酸序列信息的装置,其包含
用于将祀核苷酸的位置信息输入待输入的核苷酸序列中藉此输出包含输入的祀核苷酸位置信息的核苷酸序列的组件,所述待输入的核苷酸序列包含靶核苷酸、邻近靶核苷酸5’侧的核苷酸和邻近靶核苷酸3’侧的核苷酸;
用于产生包含祀核苷酸位置信息的核苷酸序列的组件,所述序列与包含祀核苷酸位置信息的待输出的核苷酸序列互补;
用于自输出的核苷酸序列和产生的互补核苷酸序列产生部分核苷酸序列的组件,所述部分核苷酸序列包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息,
其中
(d)部分核苷酸序列中的核苷酸数量为7-14,
(e)部分核苷酸序列的Tm值为25-40°C,和
(f)核苷酸序列中靶核苷酸或邻近靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置;和
用于产生部分核苷酸序列的组件,所述部分核苷酸序列通过将核苷酸序列中的靶核苷酸或邻近靶核苷酸的核苷酸变换为RNA来获得,在部分核苷酸序列中包含靶核苷酸或邻近靶核苷酸的每个核苷酸的位置信息。[9]用于处理核苷酸序列信息的装置,其包含 用于将祀核苷酸的位置信息输入待输入的核苷酸序列中藉此输出包含输入的祀核苷酸位置信息的核苷酸序列的组件,所述待输入的核苷酸序列包含靶核苷酸、邻近靶核苷酸5’侧的核苷酸和邻近靶核苷酸3’侧的核苷酸;
用于产生包含祀核苷酸位置信息的核苷酸序列的组件,所述序列与包含祀核苷酸位置信息的待输出的核苷酸序列互补;
用于对输出的核苷酸序列或产生的互补核苷酸序列进行下列判定中的至少ー项判定的组件
(a)判定靶核苷酸是否为嘌呤核苷酸,
(b)判定邻近靶核苷酸3’侧的核苷酸是否为嘌呤核苷酸,和
(c)判定邻近靶核苷酸5’侧的核苷酸是否为嘌呤核苷酸,
藉此自输出的核苷酸序列或所产生的互补核苷酸序列将为嘌呤核苷酸的一个核苷酸确定为RNA位置,藉此输出含有RNA位置信息的核苷酸序列;
用于自包含RNA位置信息的输出核苷酸序列中产生包含RNA位置信息的部分核苷酸序列的组件,其中
(d)部分核苷酸序列中的核苷酸数量为7-14,
(e)部分核苷酸序列的Tm值为25-40°C,和
(f)表明为RNA位置的一个核苷酸位于距3’或5’端3-5个核苷酸的位置;和
用于产生部分核苷酸序列的组件,所述部分核苷酸序列通过将确定RNA位置的核苷酸变换为RNA来获得,在核苷酸序列中包含RNA位置信息,或在部分核苷酸序列中包含RNA位
置信息。[10]用于处理[9]的核苷酸序列信息的装置,其中用于输出包含RNA位置信息的核苷酸序列的组件包含基于靶核苷酸和所确定的RNA位置之间的相对位置,自通过RNA核苷酸变换获得的所产生的部分核苷酸序列中,确定用于选择作为用于检测靶核苷酸的含RNA探针优良的部分核苷酸序列的优先级;和输出包含所确定优先级的核苷酸序列或部分核苷酸序列。[11]用于处理核苷酸序列信息的系统,其包含[7]_[10]中任何一项的用于处理核苷酸序列信息的装置和经由网络连接的客户端装置,其中
客户端装置包含用于经由网络将包含输入的核苷酸序列的信息传输至用于处理核苷酸序列信息的装置的传输组件,和
用于处理核苷酸序列信息的装置包含用于基于包含核苷酸序列的传输信息产生和输出所产生的部分核苷酸序列的组件,所述所产生的部分核苷酸序列通过RNA核苷酸变换获得。[12]用于制造用于检测靶核苷酸的含RNA探针的方法,其包括制备与部分核苷酸序列具有相同序列的含RNA和DNA的核酸片段的步骤,所述部分核苷酸序列通过RNA核苷酸变换来获得,其通过[1]_[4]的用于处理核苷酸序列信息的方法来产生。[13]用于检测靶核苷酸的方法,其包括以下步骤让样品中的核酸与用于检测靶核苷酸的含RNA的探针杂交,所述探针通过[12]的方法制造;在杂交步骤之后,将核糖核酸酶H处理施用至用于检测靶核苷酸的含RNA探针;和检测用于检测靶核苷酸的含RNA探针是否被核糖核酸酶H切割。
此外,本发明在第二方面涉及[1]用于设计用于检测靶核苷酸的含RNA探针的方法,其包括制造满足以下条件的核 苷酸序列的步骤(a)一个嘌呤核苷酸为RNA,其它的为DNA,(b)衍生自待检测的靶核酸的核苷酸序列或其互补链具有7-14个核苷酸,(c)(a)中提出的RNA核苷酸位于距3’或5’端3_5个核苷酸的位置,和(d)Tm值在25-40°C范围之内;[2][I]的设计方法,其中步骤(a)中的RNA核苷酸为对应于选自以下的核苷酸的核 苷酸其中可能导致靶核酸中单核苷酸取代的核苷酸、邻近核苷酸的3’侧的核苷酸、互补 链中对应于可能导致靶核酸中单核苷酸取代的核苷酸的核苷酸和互补链中邻近核苷酸的 3’侧的核苷酸;[3]用于检测靶核酸的方法,其包括以下步骤通过[I]或[2]的方法来设计用于检测 靶核苷酸的含RNA探针;合成探针;让合成的含RNA探针与样品中的核酸杂交;和施用核糖 核酸酶H处理来检查探针是否被核糖核酸酶切割;[4]用于处理靶核酸的核苷酸序列的方法,所述方法用于设计用于检测靶核苷酸的含 RNA探针,所述方法包括获得核苷酸序列信息的步骤,其中获得待检测的靶核酸的核苷酸序列信息;对核苷酸进行判定的步骤,其中进行判定以确定选自以下的核苷酸是否为嘌呤核苷 酸靶核酸的核苷酸序列的一个核苷酸、邻近所述一个核苷酸3’侧的核苷酸、靶核酸的互 补链核苷酸序列中对应于所述一个核苷酸的核苷酸和互补链的核苷酸序列中邻近所述核 苷酸3’侧的核苷酸;产生核苷酸信息的步骤,其中将嘌呤核苷酸中的一个设置为RNA,将其它的设置为DNA ;产生部分核苷酸序列的步骤,其中将衍生自待检测的靶核酸或其互补链的核苷酸序列 中的核苷酸数量设定为7-14,藉此产生关于部分核苷酸序列的信息;选择核苷酸序列的步骤,其中基于部分核苷酸序列的信息选择其RNA核苷酸位于距3’ 端或5’端3-5个核苷酸的位置的核苷酸序列;和选择含特定核苷酸的序列的步骤,其中选择含特定核苷酸的序列,其中通过核苷酸序 列选择步骤获得的核苷酸序列的Tm值在25-40°C范围之内;[5][4]的用于处理核苷酸序列的方法,所述方法进一步包括设计用于扩增靶核酸的 引物的步骤,其中基于靶核酸的核苷酸序列信息,设计用于扩增靶核酸的片段的引物对,所 述靶核酸包含对应所设计的含RNA探针的区域;[6][4]的用于处理核苷酸序列的方法,其中核苷酸序列信息中的所述一个核苷酸为 其中可能导致单核苷酸取代的核苷酸;[7]特征为可使计算机执行[4]或[5]的核苷酸序列处理方法的程序;[8]在其上记录[7]的程序的计算机可读取的记录介质;[9]用于处理靶核酸的装置,所述装置用于设计用于检测靶核酸的含RNA探针,所述装 置包含用于获得核苷酸序列信息的组件,其中获得待检测的靶核酸的核苷酸序列信息;用于对核苷酸进行判定的组件,其中进行判定以确定选自以下的核苷酸是否为嘌呤核 苷酸靶核酸的核苷酸序列的一个核苷酸、邻近所述一个核苷酸3’侧的核苷酸、靶核酸的 互补链核苷酸序列中对应于所述一个核苷酸的核苷酸和互补链核苷酸序列中邻近所述核 苷酸3’侧的核苷酸;用于产生核苷酸信息的组件,其中将嘌呤核苷酸中的一个设定为RNA,将其它的设置为DNA ;用于产生部分核苷酸序列的组件,其中将衍生自待检测的靶核酸或其互补链的核苷酸 序列中的核苷酸数量设定为7-14,藉此产生关于部分核苷酸序列的信息;用于选择核苷酸序列的组件,其中基于关于部分核苷酸序列的信息,选择其中RNA核 苷酸位于距3’端或5’端3-5个核苷酸的位置的核苷酸序列;和用于选择含特定核苷酸的序列的组件,其中通过核苷酸序列选择步骤获得的核苷酸序 列的Tm值在25-40°C范围之内;[10][9]的用于处理核苷酸序列的装置,其进一步包含设计用于扩增靶核酸的引物的 组件,其中基于靶核酸的核苷酸序列信息,设计用于扩增靶核酸的片段的引物对,所述靶核 酸包含对应所设计的含RNA探针的区域;[11][9]的用于处理核苷酸序列的装置,其中核苷酸序列信息中的所述一个核苷酸为 其中可能导致单核苷酸取代的核苷酸;和[12]用于处理核苷酸序列的系统,其包含[9]或[10]的核苷酸序列处理装置和经由网 络以能够与之通信的状态与核苷酸序列处理装置连接的客户端装置,其特征在于客户端装置包含用于将靶核酸的核苷酸序列信息传输至核苷酸序列处理装置的传输 组件,和用于获得以下信息的组件自核苷酸序列处理装置传输的靶核酸中关于用于检测 靶核酸的含RNA探针的信息,或探针信息,和关于用于扩增靶核酸的引物的信息。
发明效果根据本发明,研究者可简单地设计用于检测靶核酸的含RNA探针,而以前是基于他们 的经验或感觉来设计所述探针,这使得可有效检测靶核酸以及靶核酸中的特定核苷酸(本 文中可称为靶核苷酸)或SNP。亦提供了关于能够有效检测靶核酸中特定核苷酸或单核苷 酸取代的引物对的信息,因此,可由在检测靶核酸方面具有很少经验或没有经验的研究者 来容易地设计用于检测靶核酸的含RNA探针,这使得可有效检测感兴趣的靶核酸中的特定 核苷酸或SNP。
附图简述

图1表示流程图,其显示本发明用于处理核苷酸序列的方法的步骤。
图2表示流程图,其显示本发明用于处理核苷酸序列的方法的步骤的实例。
图3表示流程图,其显示本发明用于处理核苷酸序列的方法的步骤的实例。
图4表示多个图示,其各自显示因根据本发明的方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图5表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而致 的特异性结果的实例。
图6表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而致 的特异性结果的实例。
图7表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而致 的特异性结果的实例。
图8表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而致 的特异性结果的实例。
图9表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而致 的特异性结果的实例。
图10表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图11表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图12表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图13表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图14表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图15表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图16表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图17表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图18表示多个图示,其各自显示因根据本发明方法设计的含RNA探针的Tm值而 致的特异性结果的实例。
图19表示本发明装置的框图的实例。
图20为显示数据存储器23的内部结构的图示。
图21表示本发明用于处理核苷酸序列的方法的流程图的实例。
图22表示ST3的流程图。
图23表示ST4的流程图。
图24表示ST31的流程图。
图25表示ST32的流程图。
图26表不概括ST1-ST4中输入或产生的数据形式的表格。
图27表示在处理步骤ST2中所参考的表格。
图28表示显示在处理步骤ST18-ST25中产生的串(string) N的表格。
图29表示在判定步骤ST11-ST17中所参考的表格。
图30表示在处理步骤ST33中所参考的表格。
图31表示在判定步骤ST5中所参考的表格。
图32表示在处理步骤STlO中输出的数据的表格。
用于实施本发明的实施方案下面将具体阐述本发明。
本发明提供在检测靶核酸的方法中使用的含RNA探针,其基于探针与靶核酸杂交 后是否被核糖核酸酶H切割。关于按照本发明设计的含RNA探针的特征,下面以实例方式 给出了关于含RNA探针的解释,所述探针用于在靶核酸中特定位置检测核苷酸X。本文中核 苷酸X可为靶核酸中的任何核苷酸,例如,因单核苷酸取代而被正常核苷酸取代的核苷酸, 或通常存在但可能被另外的核苷酸取代的核苷酸。上述核苷酸X在本文中亦可称为靶核苷 酸。
本发明的含RNA探针具有能够与包含上述靶核酸中的核苷酸X的区域或与该区域 互补的区域杂交的序列。因此,探针具有以下序列其为选自靶核酸或其互补链的核苷酸 序列的一部分并且其与包含核苷酸X或与靶核酸互补链中核苷酸X互补的核苷酸(称作核 苷酸Y)的区域杂交。所述序列的链长不受特别限制,优选为7-14个核苷酸。核苷酸X、核 苷酸Y或邻近核苷酸X和核苷酸Y各自3’侧的核苷酸中的至少一个为嘌呤核苷酸(腺嘌 呤或鸟嘌呤),由此选择这些嘌呤核苷酸的任何一个,以使当设计本发明的含RNA探针时, 仅该核苷酸被设定为RNA,其它的被设定为DNA。例如,在核苷酸X和邻近核苷酸X 3’侧 的核苷酸为嘧啶核苷酸(胞嘧啶或胸腺嘧啶)的情况下,可通过从靶核酸的互补链序列设 计含RNA探针(将核苷酸Y或邻近核苷酸Y 3’侧的核苷酸设定为RNA)来满足这一条件。 对于DNA核苷酸,除dATP、dCTP、dGTP和dTTP外,还可使用例如dUTP、肌苷、7-DEAZA-GTP、 7-DEAZA-ATP和LNA-修饰的DNA核苷酸。RNA核苷酸位于距探针3’或5’末端3_5个核苷 酸的位置。在优选方面,RNA核苷酸位于自探针3’或5’末端的任一端第三或第四个核苷 酸的位置。探针的Tm值在25-40°C范围之内,优选25-32°C。本文中在具有500 nM DNA浓 度和50 mM盐浓度的条件下,使用最近紙邻法并进一步使用Biochemistry,第36卷,No. 34,第10581-10594页(1997)中所述的方法来计算Tm值。
当探针与包含核苷酸X的靶核酸(DNA)或其互补链杂交并用核糖核酸酶H进行处 理时,与不满足上述任何一个条件的探针相比,核糖核酸酶H能更有效地切割满足上述条 件的含RNA探针。因此,满足上述条件的含RNA探针能够以高灵敏度检测靶核酸中核苷酸 X的存在情况。
在本发明设计用于检测靶核酸的含RNA探针的方法中,首先获得靶核酸的核苷酸 序列信息。本文中“靶核酸的核苷酸序列信息”指靶核酸的核苷酸序列和核苷酸序列中一个 核苷酸的位置。“一个核苷酸的位置”指期需被检测的靶核酸中的一个核苷酸的位置。当设 计含RNA探针以检测一组基因(其与靶核酸表现出高度同源性)中的特定基因时,用常规 方法对该组中这些基因的核苷酸序列实施同源性分析,以在其保守区域或高度同源区域中 找出在靶基因和其它基因之间表现出低度同源性或不同的核苷酸,藉此可将该核苷酸的位 置设定为所述一个核苷酸的位置。当设计含RNA探针来检测SNP时,可通过以下方式来设 计含RNA探针用通过基因组分析等估计可能导致SNP的核苷酸作为上述一个核苷酸,或用 在公开的数据库中描述的SNP的位置的核苷酸作为上述一个核苷酸。核苷酸序列不受特别 限制,如果其为核酸序列,优选为DNA序列。另外,核苷酸序列中的所述核苷酸的位置可为 一个或多于一个位置。在所述核苷酸多于一个位置的情况下,将多于一个位置的每个位置 都用作设计用于检测靶核酸的含RNA探针的本发明方法中所述一个核苷酸的位置。此外, 靶核酸的核苷酸序列信息可为任何核苷酸序列和核苷酸序列中一个核苷酸的位置,或从各种开放数据库中获得的核苷酸序列和核苷酸序列中一个核苷酸的位置。
基于靶核酸的核苷酸序列信息来产生满足下列条件的序列组(a)一个嘌呤核苷酸为RNA,其它的为DNA ;(b)衍生自待检测的靶核酸或其互补链的核苷酸序列具有7-14个核苷酸;(c)(a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置,或备选地位于距5’端 3-5个核苷酸的位置;和(d)Tm值在25-40°C范围之内;在核苷酸位置多于一个位置的情况下,对于位于多于一个位置的每个核苷酸位置,产 生序列组。
当产生上述序列组时,优选应用以下设置的另外条件(e)在条件(a)中,如果探针中存在与介于设定为RNA的嘌呤核苷酸至5’侧2个核苷 酸(即共有3个核苷酸)范围的序列互补的序列,或存在与介于5’侧I个核苷酸至设定为 RNA的嘌呤核苷酸的3’侧I个核苷酸(即共有3个核苷酸)范围内的序列互补的序列时, 则将所述序列排除在序列组之外;和(f)将包含具有四个或更多个核苷酸的互补部分的反向重复核苷酸序列(回文序列) 的序列排除在序列组之外。
另外,当产生序列组时,优选根据以下设置的标准来排列探针,这取决于在上述条 件中的条件(a)和(C)是否如以下条件组的任一个中所述。在如下所述的优先级1-6中, 数值越小,意味着优先次序越高。如下所述的“靶核酸中的一个核苷酸”指靶核苷酸,在以 下优先级中亦称作“所述一个核苷酸”。
1.在靶核酸中的一个核苷酸为嘌呤核苷酸并且邻近所述一个核苷酸的3’和5’ 侧每一侧的核苷酸皆为嘌呤核苷酸的情况下优先级1: (a)所述一个核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级2 (a)邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和 (c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级3 (a)所述一个核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
优先级4 (a)邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和 (c) (a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
2.在靶核酸中的一个核苷酸为嘌呤核苷酸、邻近所述一个核苷酸的3’侧的核苷 酸为嘌呤核苷酸并且邻近所述一个核苷酸的5’侧的核苷酸为嘧啶核苷酸的情况下优先级1: (a)所述一个核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级2 (a)邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和 (c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级3 (a)邻近互补链(反义链)中对应于所述一个核苷酸的核苷酸的3’侧 的核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级4 (a)(C)(a)中提出的
优先级5 (a)(C)(a)中提出的
优先级6 (a)RNA,其它的为DNA ;和(C)(a)中提出的
3.在靶核酸中的一个核苷酸为嘌呤核苷酸、邻近所述一个核苷酸的3’侧的核苷 酸为嘧啶核苷酸并且邻近所述一个核苷酸的5’侧的核苷酸为嘌呤核苷酸的情况下优先级1: (a)所述一个核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级2 (a)所述一个核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
4.在靶核酸中的一个核苷酸为嘌呤核苷酸、邻近所述一个核苷酸的3’和5’侧的 每一侧的核苷酸皆为嘧啶核苷酸的情况下优先级1: (a)所述一个核苷酸为RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。邻近反义链中对应于所述一个核苷酸的核苷酸的3’侧的核苷酸为RNA核苷酸位于距3’端3-5个核苷酸的位置。 所述一个核苷酸为RNA,其它的为DNA ;和 RNA核苷酸位于距5’端3-5个核苷酸的位置。 邻近反义链中对应于所述一个核苷酸的核苷酸的3’侧的核苷酸为
优先级2 (a)RNA,其它的为DNA ;和 (c) (a)中提出的
优先级3 (a)(c) (a)中提出的
优先级4: (a)RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
5.在靶核酸中的一个核苷酸为嘧啶核苷酸、邻近所述一个核苷酸的3’和5’侧每 一侧的核苷酸皆为嘌呤核苷酸的情况下优先级1: (a)反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和 (c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。优先级2 (a)邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和 (a)中提出的RNA核苷酸位于距3’端3-5个核苷酸的位置。优先级3 (a)反义链中对应于所述一个核苷酸的核苷酸的为RNA,其它的为DNA ;
(C)
和(C)
(C)
(a)中提出的RNA核苷酸位于距5’端3-5个核苷酸的位置。优先级4 (a)邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和(a)中提出的RNA核苷酸位于距5’端3-5个核苷酸的位置。6.在祀核酸中的一个核苷酸为喃唳核苷酸、邻近所述一个核苷酸的3’侧的核苷 酸为嘌呤核苷酸并且邻近所述一个核苷酸的5’侧的核苷酸为嘧啶核苷酸的情况下 优先级1: (a)反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和RNA核苷酸位于距3’端3-5个核苷酸的位置。邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和 RNA核苷酸位于距3’端3-5个核苷酸的位置。邻近反义链中对应于所述一个核苷酸的核苷酸的3’侧的核苷酸为RNA核苷酸位于距3’端3-5个核苷酸的位置。反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和 RNA核苷酸位于距5’端3-5个核苷酸的位置。邻近所述一个核苷酸的3’侧的核苷酸为RNA,其它的为DNA ;和 RNA核苷酸位于距5’端3-5个核苷酸的位置。邻近反义链中对应于所述一个核苷酸的核苷酸的3’侧的核苷酸为(c) (a)中提出的
优先级2 (a)(c) (a)中提出的
优先级3 (a)RNA,其它的为DNA ;和 (c) (a)中提出的
优先级4 (a)(c) (a)中提出的
优先级5 (a)(c) (a)中提出的
优先级6: (a)RNA,其它的为DNA ;和(c) (a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
7.在靶核酸中的一个核苷酸为嘧啶核苷酸、邻近所述一个核苷酸的3’侧的核苷 酸为嘧啶核苷酸并且邻近所述一个核苷酸的5’侧的核苷酸为嘌呤核苷酸的情况下优先级1: (a)反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和 (c) (a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级2 (a)反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和 (c) (a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
8.在靶核酸中的一个核苷酸为嘧啶核苷酸、邻近所述一个核苷酸的3’和5’侧每 一侧的核苷酸皆为嘧啶核苷酸的情况下优先级1: (a)反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和(c)(a)中提出的RNA核苷酸位于距3’端3_5个核苷酸的位置。
优先级2 (a)邻近反义链中对应于所述一个核苷酸的核苷酸的3’侧的核苷酸为 RNA,其它的为DNA ;和(c) (a)中提出的
优先级3 (a)(c) (a)中提出的
优先级4 (a)RNA,其它的为DNA ;和(c)(a)中提出的RNA核苷酸位于距5’端3_5个核苷酸的位置。
亦包括在本申请中的是使用通过如上所述的设计方法获得的含RNA探针来检测 靶核酸的方法。例如,通过已知的方法来合成经上述方法设计的具有高优先级的含RNA探 针的序列。可让合成的含RNA探针与样品中的核酸进行杂交,接着用核糖核酸酶H处理来 检查探针是否被核糖核酸酶H切割,藉此检测样品中的靶核酸。用于检查探针是否已被切 割的程序不受特别限制,可使用用于核酸分析的已知程序。例如,可使用电泳或高效液相色 谱法从其链长度的变化来检测探针的切割。特别优选的方面包括,例如,一个方面为用两种 物质标记含RNA探针,所述两种物质为荧光物质和对由荧光物质发出的荧光具有淬灭作用 的物质,其中这些物质在探针内的RNA核苷酸的每一侧的适当距离处放置。在探针完整的RNA核苷酸位于距3’端3-5个核苷酸的位置。反义链中对应于所述一个核苷酸的核苷酸为RNA,其它的为DNA ;和 RNA核苷酸位于距5’端3-5个核苷酸的位置。邻近反义链中对应于所述一个核苷酸的核苷酸的3’侧的核苷酸为条件下,所述含RNA的探针几乎不发出荧光,但当探针被切割及荧光物质与淬灭物质之间 的距离变大的时候则将产生荧光。设计所述含RNA探针使得可能通过观测反应时从反应溶 液发出的荧光来检测靶核酸。已知有各种荧光剂和淬灭物质,其很多已可市购。在本发明 中,可使用通过本发明设计的含RNA探针实施靶核酸检测,作为用于检测以下的方法检测 特定核苷酸或是否存在特定核苷酸,特别是检测由于导致单核苷酸取代所致的在靶核酸中 出现的核苷酸的存在情况,或检测通常存在但在导致单核苷酸取代的情况下已被另一核苷 酸取代的核苷酸的不存在情况。
基于上述设计用于检测靶核苷酸的含RNA探针的方法,本发明用于处理核苷酸序 列的方法(亦称作核苷酸序列处理方法)包括步骤(SI),首先获得靶核酸的核苷酸序列 信息;步骤(S2),检查获得的核苷酸序列信息;和步骤(S3),设计含RNA探针(图1)。设计 所述探针的步骤(S3)包括序贯处理上述条件(a)-(d)的步骤。此外,优选包括处理上述条 件(e)-(f)的步骤。
如将更详细阐述的那样,设计含RNA探针的步骤由以下组成对核苷酸进行判定的步骤,其中基于核苷酸序列信息判定选自以下的核苷酸是否为嘌 呤核苷酸核苷酸序列信息中的一个核苷酸、邻近所述一个核苷酸3’侧的核苷酸、互补链 中对应于核苷酸序列信息中所述一个核苷酸的核苷酸和邻近互补链中的核苷酸3’侧的核 苷酸;产生核苷酸信息的步骤,其中将嘌呤核苷酸中的一个设定为RNA,将其它的设定为DNA ;产生部分核苷酸序列的步骤,其中将衍生自待检测的靶核酸或其互补链的核苷酸序列 中的核苷酸数量设定为7-14,藉此产生关于部分核苷酸序列的信息;选择核苷酸序列的步骤,其中基于关于部分核苷酸序列的信息,选择其中RNA核苷酸 位于距3’端或5’端3-5个核苷酸的位置的核苷酸序列;选择含特定核苷酸的序列的步骤,其中选择含特定核苷酸的序列,其中通过核苷酸序 列选择步骤获得的核苷酸序列的Tm值在25-40°C范围之内。
获得靶核酸的核苷酸序列信息的步骤可包括基于获得的核苷酸序列信息从开放 的公共数据库获得更多的详细信息的另外步骤。而且,检查获得的核苷酸序列信息的步骤 可包括用从开放的公共数据库获得的信息来比较和检查获得的核苷酸序列信息的另外步 骤。
另外,可增加步骤(S4):设计能够扩增与通过本发明设计的含RNA探针杂交的靶 核酸中区域的引物对(图2或3)。此外,亦可增加步骤(S5):制作在上述步骤中提供的含 RNA探针和针对各个探针设计的引物对的组的清单。用于在设计所述引物对的步骤中设计 引物对的方法不受特别限制,并且可使用已知方法来设计所述引物对,使得可扩增与靶核 酸中含RNA探针序列杂交的区域。所述引物对可为在核酸扩增中的已知方法例如PCR、ICAN 和LAMP法中使用的任何一种。可将用由此设计的引物来对衍生自样品中靶核酸的DNA片 段的扩增与用于检测靶核酸的本发明方法联合,以便在小量样品情况下高度灵敏地检测目 的基因中特定核苷酸或单核苷酸取代的存在或不存在情况。
在本发明中,亦可将含RNA探针设计在DNA序列中,所述DNA序列用已经设计的弓I 物对扩增,所述引物对可在用于核酸扩增的已知方法中使用。在这种情况下,可将所扩增的DNA序列中的一个核苷酸设定为本发明的“一个核苷酸”,藉此通过本发明方法来设计含 RNA的探针,以便可使用该探针来以高灵敏度检测扩增的序列。
允许计算机执行本发明的核苷酸序列处理方法的程序可为能够实施上述核苷酸 序列处理方法的步骤中的任何一个,包括用例如Ruby、Perl、Python、C、C++、Java 等等编 写的程序。
在其上记录有程序的计算机可读取记录介质包括但不限于例如光盘,例如压缩 光盘(CD)、数字多功能光盘(DVD)、蓝光光盘(BD)等等;闪存、硬盘和其它。可使用计算机 可读取的任何介质。
基于上述设计用于检测靶核苷酸的含RNA探针的方法,本发明用于处理核苷酸序 列的装置(亦称作核苷酸序列处理装置)包括用于首先获得待检测的靶核酸的核苷酸序 列信息的组件,用于检查获得的核苷酸序列信息的组件和用于设计含RNA探针的组件。用 于设计所述探针的组件包括用于序贯处理上述条件(a)-(d)的组件。此外,优选包括处理 上述条件(e)-(f)的组件。
如将要更详细地阐述的那样,用于设计含RNA探针的组件由以下组成用于对核苷酸进行判定的组件,其中基于核苷酸序列信息判定以下核苷酸中的至少一 种是否为嘌呤核苷酸靶核酸的核苷酸序列中的一个核苷酸、邻近所述一个核苷酸3’侧的 核苷酸、靶核酸的互补链核苷酸序列中对应于所述一个核苷酸的核苷酸和互补链核苷酸序 列中邻近核苷酸3’侧的核苷酸;用于产生核苷酸信息的组件,其中将嘌呤核苷酸中的一个设定为RNA,将其它的设定为DNA ;用于产生部分核苷酸序列的组件,其中将衍生自待检测的靶核酸或其互补链的核苷酸 序列中的核苷酸数量设定为7-14,藉此产生关于部分核苷酸序列的信息;用于选择核苷酸序列的组件,其中基于关于部分核苷酸序列的信息选择其中RNA核苷 酸位于距3’端或5’端3-5个核苷酸的位置的核苷酸序列;选择含特定核苷酸的序列的组件,其中选择含特定核苷酸的序列,其中通过核苷酸序 列选择步骤获得的核苷酸序列的Tm值在25-40°C范围之内。
用于获得靶核酸的核苷酸序列信息的组件,可包括基于所获得的核苷酸序列信息 从开放的公共数据库获得更多的详细信息的另外组件。而且,用于检查获得的核苷酸序列 信息的组件,可包括用于将所获得的核苷酸序列信息与从开放的公共数据库获得的信息进 行比较和检查的另外组件。另外,上述组件可包括用于评估所设计的含RNA探针与非靶核 酸杂交的可能性的另外组件。
另外,可增加用于设计引物对的组件,所述引物对能够扩增与通过本发明设计的 含RNA探针杂交的靶核酸中的区域。此外,亦可增加用于制作上述组件中提供的含RNA探 针和针对各个探针设计的引物对的组的清单的组件。本文中所述引物可为可在用于核酸扩 增的已知方法中使用的任何一种引物,所述方法例如PCR、ICAN和LAMP方法。可将用由此 设计的引物来对衍生自样品中的靶核酸的DNA片段的扩增和用于检测靶核酸的本发明方 法联合,以便高度灵敏地检测小量样品中的目的基因中特定核苷酸或单核苷酸取代的存在 或不存在情况。
本发明用于处理核苷酸序列的装置可为以独立方式实施整个处理的装置,或用于处理核苷酸序列的系统,其中信息在核苷酸序列处理装置与客户端装置之间通信,所述客 户端装置经由网络以能够与其通信的状态连接到核苷酸序列处理装置。例如,在前者中,可 将本发明的程序记录或安装在处于能够执行该程序的状态的计算机硬盘上,藉此将计算机 用作本发明的核苷酸序列处理装置。而且,可将本发明的程序记录或安装在处于能够执行 该程序的状态的外部介质例如光盘或闪存上,并且可将外部介质连接到计算上,藉此配置 可实施本发明的核苷酸序列处理的装置而不必将程序记录或安装在计算机硬盘上。例如, 在后者中,可通过客户端装置将靶核酸的核苷酸序列信息传输到本发明的核苷酸序列处理 装置,并且可经由PC通信或经由网络例如内联网或互联网通过客户端装置来接收通过核 苷酸序列处理装置获得的以下信息关于用于检测靶核酸的含RNA探针的信息和供设计引 物对用的信息。或者,可根据客户端装置的要求来选择和接收这些信息碎片。该系统使得 人们可使用本发明的核苷酸序列处理装置,而不管该装置位于何处等类似情况,因此可为 有用的。另外,明显的是,为了使核苷酸序列处理装置通过客户端装置而可容易地利用,将 系统配置以便信息可通过Web屏幕来传输和接收。
可将本发明设计的含RNA探针和核糖核酸酶H加入到扩增核酸的反应溶液中,这 使得可能在单一反应中实行靶核酸的扩增和检测。本发明设计的含RNA探针特别适于检测 系统,其中通过PCR扩增靶核酸片段的反应和用热稳定的核糖核酸酶H切割探针的反应同 时进行。在这一方面,标记含RNA探针使得通过上述对探针的切割而产生的信号(例如荧 光)是合适的,并且所述探针可用于构建供快速检测靶核酸或单核苷酸取代的系统,所述 系统与装备有信号检测系统的核酸扩增装置联合在一起。
根据本发明,可制造可用于检测靶核酸或靶核酸中的SNP的含RNA探针,亦提供可 与探针联合的用于扩增靶核酸片段的引物对。如上所述的含RNA探针和引物可为用于以良 好灵敏度检测靶核酸或SNP的试剂或试剂盒的组分。因此,根据本发明,亦提供用于检测靶 核酸或单核苷酸取代的灵敏系统。
将基于图19-32阐述本发明的具体实施方案。
图19表示用于处理本发明的核苷酸序列的装置10。核苷酸序列处理装置10包 含(a)计算机CPU(中央处理器)20,其用于计算和控制核苷酸序列处理装置10的操作 和处理;(b)ROM(只读存储器)21,其用于存储基本计算机程序例如操作系统和运行程序必需 的数据;(C)RAM (随机存储器)22,其用作CPU 20和暂时存储参数以及图像处理中必需的数 据的工作存储器;(d)数据存储器23,将其配置例如作为硬盘存储器并用于存储图20中所示的各种数据;(e)程序存储器24,将其配置例如作为硬盘存储器并用于存储图21-25中所示处理用 的程序,其用⑶-ROM驱动装置45读取;(f)通信接口36,其与通信终端装置46连接,并用于经由互联网50使基因数据库数据 传输到基因数据库服务器单元60并自基因数据库服务器单元60接受基因数据库数据;(g)连接到键盘41的键盘接口31,用所述键盘输入给定数据和指令命令,并且键盘接口 31用于接收通过键盘41输入的数据和指令命令,用于实施接口处理,例如规定的信号转换,并将它们转移至CPU 20 ;(h)连接到鼠标42的鼠标接口32,用所述鼠标42在CRT显示器43上输入指令命令, 并且鼠标接口 32用于接收通过鼠标42输入的数据和指令命令,用于实施接口处理,例如规定的信号转换,并将它们转移至CPU 20;(i)连接到CRT显示器43的显示器接口33,所述显示器43显示通过CPU 20处理的输出数据、设置和指示屏幕以及其它等等,并且显示器接口 33用于将待显示的图像数据转换成CRT显示器43的图像信号,并在CRT显示器43上输出和显示图像信号;(j)连接到打印机44的打印机接口 34,所述打印机44打印通过CPU 20处理的输出数据以及其它等等,并且打印机接口 34用于执行待打印的打印数据的规定的信号转换等等, 并将数据输出到打印机44上以将其打印;和(k)连接到⑶-ROM驱动装置45的驱动装置接口 35,所述⑶-ROM驱动装置45读出来自 ⑶-ROM 45a(在其上记录有程序)的用于上述处理的程序的程序数据,并且驱动装置接口 35用于执行规定的信号转换,并将读出的图像处理程序等等的程序数据转移到程序存储器 24;其中经由总线30连接这些电路20-24和31-36。
图20表示显示图19中所示的数据存储器23的内部结构的框图。如图20所示, 数据存储器23存储以下表格(1)用于产生互补核苷酸序列的参考表71;(2)用于判定RNA位置的参考表72;(3)用于对嘌呤核苷酸进行判定的参考表73;(4)用于判定优先级的参考表74-76;(5)用于对是否25°C≤Tm值≤40°C作判定的参考表77;和(6)关于部分核苷酸序列和引物序列的输出信息的表78。
在图27-32中显示了表71-78。
图19中所示的装置执行图21的流程图中指出的处理步骤。图21的STl为输入靶核酸的核苷酸序列和阐述靶核酸的信息的处理步骤。待输入的串为串K (数字X、串J、 符号i)(见图26中所示的表70)。串J为由A、T、G或C的任何字母组成的一维串。串J 对应于靶核酸的核苷酸序列。串J的左侧代表核苷酸序列的5’侧,右侧代表核苷酸序列的 3M则。数字X为自然数字。数字X代表靶核苷酸。位于自串J左端第X个位置的字母代表革巴核苷酸。符号i表明串K为已经输入的核苷酸序列。符号i用于区分由来自ST2中产生的核苷酸序列的串K代表的核苷酸序列。
ST2是产生靶核酸的互补核苷酸序列的处理步骤。ST2产生串M (数字X、串L、符号c)(见图26中所示的表70)。数字X与串K中的数字X相同。基于图27中的表71从串J产生串L。构成串L的每一个字母具有图27中的表71指出的对应关系,且通过从右到右阅读串J和从左到右重排阅读串J来获得构成串的字母中的每一个。符号c表明串L是互补核苷酸序列。
ST3是判定RNA位置和优先次序的处理步骤。根据图22中所示的流程图来执行ST3。图22中所示的流程图由进行判定的处理步骤ST11-ST17和产生信息的处理步骤ST18-ST25 组成。
根据图29中的表73来实施用于进行判定的处理步骤ST11-ST17。在STll中,当串J左侧的第X位字母为A或G时,则作出判定是(Yes)。另一方面,当串J中相同位置的字母为T或C时,则作出判定否(No)。在ST12和ST13中,对于串J左侧的第(χ+l)位的字母,作出相似的判定。在ST14-ST17中,对于串J左侧的第(x-1)位的字母,作出相似的判定。
依赖于ST11-ST17的判定结果,执行处理步骤ST18-ST25。在处理步骤ST18-ST25 中,产生由三个字母(符号i或C、数字y、符号z)组成的串N (见图26所示的表70)。具体地,依赖于ST18-ST25中的处理hl-h8,分别产生图28的表72中标明的串N。
符号i或c (其是自串N左边的第一个字母),是表明RNA位置所处核苷酸序列的符号。符号i表明RNA位置位于STl中已经输入的核苷酸序列。符号c表明RNA位置位于 ST2中已经产生的核苷酸序列。
数字y(其是自串N左边的第二个字母),是数字X或(χ+l)并且是用于鉴定RNA 位置的数字。数字y表明从左端的第y位为RNA位置。
符号z(其是自串N左边的第三个字母),选自α、β和Y。符号ζ是表明优先次序的字母。字母α表明优先级的最高级,接下来是降序的β和Y。在数据存储器23中暂时存储所产生的串N。
ST4是产生阐述具有7-14个核苷酸的部分核苷酸序列的信息的处理步骤,其中距末端3-5个核苷酸的位置为RNA位置。根据图23所示的流程图来进行该处理。
图23中所示的流程图由处理步骤ST31、ST32和ST33组成。
处理步骤ST31是产生阐述部分核苷酸序列的信息的处理步骤,其中距5’端3-5 个核苷酸的位置为RNA位置。根据图24所示的流程图来执行处理步骤ST31。
图24所示的流程图中的ST41是读出串K、串M和串N的处理步骤。
在ST42、ST43、ST45、ST46、ST47和ST48中,探针5,-末端位置、探针大小和RNA 位置各自为自然数。RMA位置用串N中的数字y表示。将探针5’-末端位置定义为数字a, 探针大小定义为数字b。
ST44是产生串P (串O、数字y、符号ζ、符号ST31)的处理步骤。在ST44中的产生处理中,首先参考自串N中左边的第一个字母,在ST42中提及的数字y由其衍生。当第一个符号为i时,读出字母,其介于串J中从左端第a个字母到第(a+b-Ι)个字母之间的范围。通过从左到右重排读出的字母的串所产生的串为串O。当自串N左边第一个字母为符号c时,用相似的方式来进行处理,不同之处在于用串L替代串J。串P中的数字y和符号 ζ与已 参考的串N中的数字y和符号ζ相同。串P中的符号ST31用于产生ST33(其在随后实施)中优先次序的处理步骤的目的。在数据存储器23中暂时存储所产生的串P。
图23所示的流程图中的处理步骤ST32是产生阐述部分核苷酸序列的信息的处理步骤,其中距3’端3-5个核苷酸的位置为RNA位置。根据图25所示的流程图来执行处理步骤ST32。除使用了代表探针3’末端位置的数字外,图25所示的流程图与图24所示的流程图相似。处理步骤ST32以类似于处理步骤ST31 (见图26中所示的表70)的方式来产生串Q (串O、数字y、符号ζ、符号ST32)。串Q中的符号ST32用于产生关于在其后实施的 ST33中的优先次序的信息。
图23中所示的流程图中的处理步骤ST33是产生关于部分核苷酸序列的优先次序的信息的处理步骤。首先,通过ST31和ST32读出串P (串O、数字y、符号ζ、符号ST31)和串Q (串O、数字y、符号ζ、符号ST32),其暂时储存在数据存储器23中。基于已读出的串P 和串Q中的符号ζ和符号ST31或符号ST32,根据图30中的表74-76来确定符号r。因此, 基于符号ζ是否为α、β或Y中的任何一个及符号是否为ST31或ST32,将图30中的表 74-76中表明的数字1-6中的任何数字作为符号r产生。符号r为表明已产生的部分核苷酸序列的优先次序的符号。符号r为自然数1-6中的任何一个。本文中I意味着最高的优先次序,接下来按优先级降序是2、3、4、5和6。使用符号r和读出的串P和串Q来产生串R (串O、数字y、符号r)(见图26所示的表70)。将产生的串R暂时储存在数据存储器23 中。
ST5是基于Tm值作出判定的处理步骤。对于数据存储器23中暂时储存的所有串 R,计算其各自的Tm值。本文中在具有500 nM DNA浓度和50 mM盐浓度的条件下,使用最近田比邻法及进一步使用Biochemistry,第36卷,No. 34,第10581-10594页(1997)中所述的方法来计算Tm值。使用计算出的Tm值,基于图31中的表77来作出判定。如果作出的判定为否,则删除暂时储存在数据存储器23中的相应串R。
ST6是这样的处理步骤,其中当相同的序列包括在由ST4产生的串中时,从数据存储器23中删除包含串O的串R。读出自串O左侧第(y - 2)位到第y位范围内的串和自串O左侧第(y -1)位到第(y + I)位范围内的串,并对串O中是否包括这些读出的串进行搜索。如果这些串包括在串O中,则从数据存储器23中删除包含该串O的串R。
ST7是这样的处理步骤,其中当串O包括4个字母或更多的反向重复核苷酸序列 (回文序列)时,从数据存储器23中删除包含该串O的串R。按以下方法对所包括的回文序列进行判定首先,将探针序列定义为seq,探针的链长定义为η。从5’端到3’端对核苷酸编号如0、 1、2、……、(η-l)。在这些定义下实施如下所述的方法。因此,部分序列的开始位置i在第O位至第{(η-l)-(最小靶标大小X 2 -1)}位之间变化,从而产生部分序列各自的互补序列,其中部分序列的大小介于4 bp (其为最小靶标大小)至(n -1)/2 (将其四舍五入为最接近的整数)范围。如果所产生的互补序列与介于部分序列的开始位置第i至第(i +部分序列大小)位范围的序列相同,则判定其为回文序列。下面是将本方法表示为程序的实例。
权利要求
1.用于处理核苷酸序列信息的方法,其通过用于处理所述核苷酸序列信息的装置来实施,所述方法包括以下步骤 将革G核苷酸的位置信息输入待输入的核苷酸序列中,藉此输出包含所述输入的祀核苷酸位置信息的核苷酸序列,所述待输入的核苷酸序列包含所述靶核苷酸、邻近所述靶核苷酸5’侧的核苷酸和邻近所述靶核苷酸3’侧的核苷酸; 产生包含所述靶核苷酸位置信息的核苷酸序列,其与包含所述靶核苷酸位置信息的所述待输出的核苷酸序列互补; 产生核苷酸序列及其互补核苷酸序列,其通过将核苷酸序列中的所述靶核苷酸或邻近所述靶核苷酸的核苷酸变换为RNA来获得,在所述核苷酸序列中包含所述靶核苷酸或邻近所述祀核苷酸的每个核苷酸的位置信息;和 自通过所述RNA核苷酸变换获得的核苷酸序列及其互补核苷酸序列产生部分核苷酸序列,其包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息, 其中 (d)所述部分核苷酸序列中的核苷酸数量为7-14, (e)所述部分核苷酸序列的Tm值为25-40°C,和 (f)所述核苷酸序列中的靶核苷酸或邻近靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置。
2.用于处理核苷酸序列信息的方法,其通过用于处理所述核苷酸序列信息的装置来实施,所述方法包括以下步骤 将革G核苷酸的位置信息输入待输入的核苷酸序列中,藉此输出包含所述输入的祀核苷酸位置信息的核苷酸序列,所述待输入的核苷酸序列包含所述靶核苷酸、邻近所述靶核苷酸5’侧的核苷酸和邻近所述靶核苷酸3’侧的核苷酸; 产生包含所述靶核苷酸位置信息的核苷酸序列,其与包含所述靶核苷酸位置信息的待输出的核苷酸序列互补; 自所述输出的核苷酸序列及所产生的互补核苷酸序列产生部分核苷酸序列,其包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息, 其中 (d)所述部分核苷酸序列中的核苷酸数量为7-14, (e)所述部分核苷酸序列的Tm值为25-40°C,和 (f)所述核苷酸序列中所述靶核苷酸或邻近所述靶核苷酸的核苷酸位于距所述3’或5’端3-5个核苷酸的位置;和 产生部分核苷酸序列,其通过将所述核苷酸序列中的所述靶核苷酸或邻近所述靶核苷酸的核苷酸变换为RNA来获得,在所述部分核苷酸序列中包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息。
3.用于处理核苷酸序列信息的方法,其通过用于处理所述核苷酸序列信息的装置来实施,所述方法包括以下步骤 将革G核苷酸的位置信息输入待输入的核苷酸序列中,藉此输出包含所述输入的祀核苷酸位置信息的核苷酸序列,所述待输入的核苷酸序列包含所述靶核苷酸、邻近所述靶核苷酸5’侧的核苷酸和邻近所述靶核苷酸3’侧的核苷酸;产生包含所述靶核苷酸位置信息的核苷酸序列,其与包含所述靶核苷酸位置信息的待输出的核苷酸序列互补; 对 于所输出的核苷酸序列和所产生的互补核苷酸序列进行下列判定中的至少一项判定: (a)判定所述靶核苷酸是否为嘌呤核苷酸, (b)判定邻近所述靶核苷酸3’侧的核苷酸是否为嘌呤核苷酸,和 (c)判定邻近所述靶核苷酸5’侧的核苷酸是否为嘌呤核苷酸, 藉此从所输出的核苷酸序列和所产生的互补核苷酸序列中将为嘌呤核苷酸的一个核苷酸确定为RNA位置,藉此输出包含所述RNA位置信息的核苷酸序列; 从包含RNA位置信息的待输出的核苷酸序列中产生包含RNA位置信息的部分核苷酸序列, 其中 (d)所述部分核苷酸序列中的核苷酸数量为7-14, (e)所述部分核苷酸序列的Tm值为25-40°C,和 (f)所述表明为RNA位置的一个核苷酸位于距3’或5’端3-5个核苷酸的位置;和 产生部分核苷酸序列,其通过将确定为RNA位置的所述核苷酸变换为RNA来获得,在所述核苷酸序列中包含RNA位置信息,或在所述部分核苷酸序列中包含RNA位置信息。
4.权利要求3的用于处理核苷酸序列信息的方法,其中输出包含RNA位置信息的核苷酸序列的步骤包括基于所述靶核苷酸和所确定的RNA位置之间的相对位置,自通过所述RNA核苷酸变换获得的所产生的部分核苷酸序列,确定用于选择作为用于检测靶核苷酸的含RNA探针优良的部分核苷酸序列的优先级;并输出包含所确定优先级的核苷酸序列或部分核苷酸序列。
5.通过计算机实施的程序,其包含权利要求1-4中任一项的用于处理核苷酸序列信息的方法的步骤。
6.计算机可读取的记录介质,其特征在于所述介质储存权利要求5的程序。
7.用于处理核苷酸序列信息的装置,其包含 用于将祀核苷酸的位置信息输入待输入的核苷酸序列中藉此输出包含输入的祀核苷酸位置信息的核苷酸序列的组件,所述待输入的核苷酸序列包含所述靶核苷酸、邻近所述靶核苷酸5’侧的核苷酸和邻近所述靶核苷酸3’侧的核苷酸; 用于产生包含所述靶核苷酸位置信息的核苷酸序列的组件,所述核苷酸序列与包含所述靶核苷酸位置信息的待输出的核苷酸序列互补; 用于产生核苷酸序列及其互补核苷酸序列的组件,所述核苷酸序列通过将核苷酸序列中的所述靶核苷酸或邻近所述靶核苷酸的核苷酸变换为RNA来获得,在所述核苷酸序列中包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息;和 用于自所述核苷酸序列及其互补核苷酸序列产生部分核苷酸序列的组件,所述部分核苷酸序列包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息,所述核苷酸序列通过所述RNA核苷酸变换获得, 其中 (d)所述部分核苷酸序列中的核苷酸数量为7-14,(e)所述部分核苷酸序列的Tm值为25-40°C,和 (f)所述核苷酸序列中的所述靶核苷酸或邻近所述靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置。
8.用于处理核苷酸序列信息的装置,其包含 用于将祀核苷酸的位置信息输入待输入的核苷酸序列中藉此输出包含所输入的革巴核苷酸位置信息的核苷酸序列的组件,所述待输入的核苷酸序列包含所述靶核苷酸、邻近所述靶核苷酸5’侧的核苷酸和邻近所述靶核苷酸3’侧的核苷酸; 用于产生包含所述靶核苷酸位置信息的核苷酸序列的组件,所述核苷酸序列与包含所述靶核苷酸位置信息的待输出的核苷酸序列互补; 用于自所输出的核苷酸序列和所产生的互补核苷酸序列产生部分核苷酸序列的组件,所述部分核苷酸序列包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息,其中 (d)所述部分核苷酸序列中的核苷酸数量为7-14, (e)所述部分核苷酸序列的Tm值为25-40°C,和 (f)所述核苷酸序列中靶核苷酸或邻近靶核苷酸的核苷酸位于距3’或5’端3-5个核苷酸的位置;和 用于产生部分核苷酸序列的组件,所述部分核苷酸序列通过将所述核苷酸序列中的靶核苷酸或邻近靶核苷酸的核苷酸变换为RNA来获得,在所述部分核苷酸序列中包含所述靶核苷酸或邻近所述靶核苷酸的每个核苷酸的位置信息。
9.用于处理核苷酸序列信息的装置,其包含 用于将祀核苷酸的位置信息输入待输入的核苷酸序列中藉此输出包含所输入的革巴核苷酸位置信息的核苷酸序列的组件,所述待输入的核苷酸序列包含所述靶核苷酸、邻近所述靶核苷酸5’侧的核苷酸和邻近所述靶核苷酸3’侧的核苷酸; 用于产生包含所述靶核苷酸位置信息的核苷酸序列的组件,所述核苷酸序列与包含所述靶核苷酸位置信息的待输出的核苷酸序列互补; 用于对所输出的核苷酸序列和所产生的互补核苷酸序列进行下列判定中的至少一项判定的组件 (a)判定所述靶核苷酸是否为嘌呤核苷酸, (b)判定邻近所述靶核苷酸3’侧的核苷酸是否为嘌呤核苷酸,和 (c)判定邻近所述靶核苷酸5’侧的核苷酸是否为嘌呤核苷酸, 其中从所输出的核苷酸序列和所产生的互补核苷酸序列中将为嘌呤核苷酸的一个核苷酸确定为RNA位置,藉此输出包含RNA位置信息的核苷酸序列; 用于从包含RNA位置信息的输出的核苷酸序列中产生包含RNA位置信息的部分核苷酸序列的组件,其中 (d)所述部分核苷酸序列中的核苷酸数量为7-14, (e)所述部分核苷酸序列的Tm值为25-40°C,和 (f)所述表明为RNA位置的一个核苷酸位于距所述3’或5’端3-5个核苷酸的位置;和 用于产生部分核苷酸序列的组件,所述部分核苷酸序列通过将确定为RNA位置的核苷酸变换为RNA来获得,在所述核苷酸序列中包含RNA位置信息,或在所述部分核苷酸序列中包含RNA位置信息。
10.权利要求9的用于处理核苷酸序列信息的装置,其中所述用于输出包含所述RNA位置信息的核苷酸序列的组件包含基于所述靶核苷酸和所确定的RNA位置之间的相对位置,自通过所述RNA核苷酸变换获得的所产生的部分核苷酸序列,确定用于选择作为用于检测靶核苷酸的含RNA探针优良的部分核苷酸序列的优先级;和输出包含所确定优先级的核苷酸序列或部分核苷酸序列。
11.用于处理核苷酸序列信息的系统,其包含经由网络连接的权利要求7-10中任一项的用于处理核苷酸序列信息的装置和客户端装置,其中 所述客户端装置包含用于经由网络将包含所输入的核苷酸序列的信息传输至用于处理所述核苷酸序列信息的装置的传输组件,和 用于处理核苷酸序列信息的装置包含用于基于包含所述核苷酸序列的传输信息,产生和输出通过所述RNA核苷酸变换获得的所产生的部分核苷酸序列的组件。
12.用于制造用于检测靶核苷酸的含RNA探针的方法,所述方法包括制备与部分核苷酸序列具有相同序列的含RNA和DNA的核酸片段的步骤,所述部分核苷酸序列通过所述RNA核苷酸变换来获得,其通过权利要求1-4的用于处理核苷酸序列信息的方法来产生。
13.用于检测靶核苷酸的方法,所述方法包括以下步骤让通过权利要求12的方法制造的用于检测靶核苷酸的含RNA探针与样品中的核酸杂交;杂交步骤之后,将核糖核酸酶H处理施用至用于检测靶核苷酸的含RNA探针;和检测所述用于检测靶核苷酸的含RNA探针是否被所述核糖核酸酶H切割。
全文摘要
公开了制造用于检测靶碱基的含RNA探针的简单而有用的方法;碱基序列信息处理方法;碱基序列信息处理装置;碱基序列信息处理系统;和用于检测碱基的方法。所公开的碱基序列信息处理方法包含这样的步骤,其中产生含有7-14个碱基和具有25-40℃的Tm值的部分碱基序列,且靶碱基或邻近靶碱基的碱基为自所述部分碱基序列3’或5’端的第3、第4、第5个碱基。当关于在未基于研究者角色的直觉或经验的情况下,简单而有效地制造用于检测靶碱基的含RNA探针时,所公开的方法是有用的。所述方法不仅在遗传工程领域而且在医学研究领域中极为有用。
文档编号G01N33/53GK103026362SQ20118003731
公开日2013年4月3日 申请日期2011年7月28日 优先权日2010年7月29日
发明者山本纯子, 印田智雄, 大场利治, 铃木彻, 向井博之, 浅田起代蔵 申请人:宝生物工程株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1