表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法

文档序号:407160阅读:793来源:国知局
专利名称:表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法
技术领域
本发明涉及表达基因鉴定用cDNA标记物的制备方法、该cDNA标记物库和基因表达分析方法。更详细地说,涉及制备对应于属于表达基因产物的mRNA、与此mRNA相对的cDNA或其cDNA片段的特定区域的鉴定用cDNA标记物的方法,以及利用该cDNA片段的基因表达分析方法。该基因表达分析方法包括直接使用该cDNA标记物的直接法和使用该cDNA标记物的连接物的间接法。
背景技术
已知,各生物种基于各自的基因组序列具有固有的基因表达模式,此外,即使物种相同,由于细胞分化程度、增殖、老化等生理状态和癌化、感染症、免疫病等各种病态等,而与正常状态相比具有不同的基因表达模式。因此,如果可以建立这种基因表达模式,对细胞间的基因表达模式进行相互比较,则可以实现基因表达模式的广泛应用,如适当的治疗靶的鉴定、基因治疗用的候补基因的鉴定、组织分型、法律上的基因确定、疾病相关基因的位置确定、诊断·预诊用的指示基因的鉴定等。
为了评价基因表达,以往开发出Northern印迹法、RN酶保护法和逆转录酶-聚合酶链反应(RT-PCR)分析法(Alwine等,Proc.Natl.Acad.Sci.U.S.A.,745550、1977;Zinn等,Cell,34865、1983;Veres等,Science、237415、1987)以及用于检索基因的有用的表达·基因·标记(expressed sequence tagEST)法(Adams等,Science 2521656、1991;Adams等、Nature、355632、1992;Okubo等、Nature Genetics、2173、1992)等,然而一次只能评价有限数量的基因。例如,Okubo等开发了下述方法,即用4碱基识别酶Sau3AI切断双链cDNA,得到只由mRNA的3’末端部分构成的cDNA库,将其克隆,随机进行碱基序列确定,得到基因表达分布图(profile)的方法[Nature Genet.2、173(1992)],但由该方法得到的各克隆的长度平均为约300个碱基,序列确定必须对每一个克隆进行,因此,最终经序列确定的mRNA的总数每一个细胞种仅为1000个左右,其与细胞中真正的基因表达模式相距甚远。还有,由于这些方法必需大量的原材料(例如,人的组织)、因重复聚合酶链反应(PCR)而产生偏离、结果没有重现性等理由,所以目前只不过是在研究室使用。
近年来,通过对对应于被表达的基因领域的转录产物的限定区域进行鉴定,开发出可以分析多个转录产物的基因表达的依次分析(serial analysis of gene expressionSAGE)法(国际公开公报WO97/10363、美国专利申请第5,695,937号和第5,866,330号)。这些方法中,制备对应于试样中各cDNA的短核苷酸序列被二聚体化的称为“二标记物”(ditag)的标记物,对此二标记物进行链状连接,作为单一连接物(多联体)进行克隆,通过确定标记物的序列,可以明确基因表达模式。这种SAGE法不能得到对应于试样中各cDNA的单一表达基因鉴定用cDNA标记物,此外,由于连接物可以含有的二标记物有限,所以一次可以鉴定的表达基因数为1000以下,通常为400以下。

发明内容
本发明提供制备表达基因鉴定用cDNA标记物的方法,该标记物可以有效分析各生物种固有的基因表达模式和在细胞生理状态、产生阶段、各种病理状态等所特有的基因表达模式,还提供使用该鉴定用标记物的基因表达分析方法。与以往技术相比,本发明的方法分析基因表达所需的细胞试样量少,效率高且可信度高。另外,根据需要将表达基因鉴定用标记物(Expressed Gene Identification cDNA Tag)简写为EGI cDNA标记物或EGI标记物。
本发明提供制备表达基因鉴定用cDNA标记物的方法准备互补的脱氧核糖核酸(cDNA);将该cDNA用II型限制酶切断,得到cDNA片段;将接头X连接在该cDNA片段上,得到接头X-cDNA片段连接物,该接头X含有第1IIS型限制酶的识别序列、且在与前述II型限制酶的切断末端的连接部分产生第2IIS型限制酶的识别序列;将该接头X-cDNA片段连接物用第2IIS型限制酶切断,得到接头X-cDNA标记物连接物;
将含有第1IIS型限制酶的识别序列的接头Y连接在接头X-cDNA标记物经第2IIS型限制酶切断的末端处,得到接头X-cDNA标记物-接头Y连接物;对该接头X-cDNA标记物-接头Y连接物进行扩增;且将所得扩增产物用第1IIS型限制酶切断,得到表达基因鉴定用cDNA标记物。
此外,本发明提供接头X,其含有第1IIS型限制酶的识别序列,并且,在与经II型限制酶切断的cDNA片段的连接部分形成第2IIS型限制酶的识别序列。
而且,本发明还提供基因表达分析方法,其特征在于,使通过前述表达基因鉴定用cDNA标记物的制备方法得到的cDNA标记物库与固定有待检测核酸的检测装置接触。
而且,本发明还提供表达基因分析方法,其包括将通过前述表达基因鉴定用cDNA标记物的制备方法得到的标记物互相连接的工序,以及确定该连接物的碱基序列的工序。该分析方法包括确定该连接物的序列,由该序列求出各自的cDNA标记物序列的定性分析方法,以及由该序列求出各自的cDNA标记物序列和出现频率的表达基因定量分析方法。
而且,本发明还提供制备表达基因鉴定用cDNA标记物的试剂盒,其中含有II型限制酶、第1IIS型限制酶、第2IIS型限制酶、接头X和接头Y,其中,接头X含有第1IIS型限制酶的识别序列且在与前述II型限制酶的切断末端的连接部分形成第2IIS型限制酶的识别序列,接头Y含有第1IIS型限制酶的识别序列。
本发明基于几个基本的原理。
第一,从基因转录产物内的一定位置分离出来的短核苷酸序列的标记物,其含有用以鉴定该转录产物的充分的信息量。例如,9bp的序列标记物可以有4的9次幂即262,144种序列,可以识别与此相对应的相同数量的转录产物。另外,有报道指出人基因组编码约80,000~200,000的转录产物(Fields等,Nature Genetics,7345、1994)。因此,理论上说,如果得到9bp的序列标记物则可以鉴定全部的人基因转录产物。低等的真核生物和原核生物的场合,经基因组编码的转录产物数量更少,所以可以进一步缩短标记物的尺寸。例如,对于酵母来说,识别转录产物只需要6~7bp的短标记物就足够了。本发明方法提供单一的表达基因鉴定用cDNA标记物,其分别对应于基因转录产物,具有不同的核苷酸长度,所以对于分析基因表达模式有益。
第二,因为对其上游和下游被接头夹持的单一的短cDNA标记物只进行1次扩增处理,就可以进行表达基因的分析,所以难以发生扩增和/或克隆引起的偏离。
第三,利用通过本发明方法得到的EGIcDNA库,可以定性或定量地测定对应于EGIcDNA标记物序列的cDNA,考察对应的表达基因的模式。
第四,由用本发明方法制得的鉴定用cDNA标记物,制备没有或有间隔序列的连接物(多联体),根据需要使用载体等进行克隆化,可以连续并有效地进行分析。特别是,因为该cDNA标记物为分别独立的序列,所以既可以很容易地分析连接物的序列,也可很容易地从连接物中分离出单独的cDNA标记物。
另外,本发明和前述SAGE法在应用第一原理方面是相同的,即短核苷酸序列的标记物含有鉴定转录产物所需的充分的信息量。但是,SAGE法利用被称为“二标记物”(ditag)的经二聚体化的标记物,而不能制备本发明所制备的单一的鉴定用cDNA标记物、其库、含单一的鉴定用cDNA标记物的连接物,在这一点上与本发明是不同的。


图1为表示本发明制备表达基因鉴定用cDNA标记物的方法的一个实施方式中(1)~(6)工序的示意图。图1中“N”为选自A、T、C或G中的任意碱基。
图2为表示本发明制备表达基因鉴定用cDNA标记物的方法的一个实施方式中(7)~(10)工序的示意图。
发明的优选实施方式基于图1和图2流程图所示的制备表达基因鉴定用cDNA标记物(以下称为EGIcDNA标记物)的方法来说明本发明的优选实施方式。由该方法,可以容易地得到对例如在特定的产生阶段或特定的疾病状态的特定细胞、组织或细胞提取物的基因表达进行表示的EGIcDNA标记物和其库。
图1和图2所示的为制备表达基因鉴定用cDNA标记物的方法,其包括(1)准备互补的脱氧核糖核酸(cDNA),(2)将该cDNA用II型限制酶切断,得到cDNA片段;(3)将接头X连接在该cDNA片段上,得到接头X-cDNA片段连接物,该接头X含有第1IIS型限制酶的识别序列、且在与前述II型限制酶的切断末端的连接部分产生第2IIS型限制酶的识别序列;(4)将该接头X-cDNA片段连接物用第2IIS型限制酶切断,得到接头X-cDNA标记物连接物;(5)根据需要,对该接头X-cDNA标记物连接物进行纯化;(6)根据需要,将该接头X-cDNA标记物连接物的cDNA标记物末端处理成含第1IIS型限制酶的识别序列的接头Y可结合的状态;(7)将含有第1IIS型限制酶的识别序列的接头Y连接在接头X-cDNA标记物经第2IIS型限制酶切断的末端处,得到接头X-cDNA标记物-接头Y连接物;(8)对该接头X-cDNA标记物-接头Y连接物进行扩增;且(9)将所得扩增产物用第1IIS型限制酶切断,得到表达基因鉴定用cDNA标记物;(10)根据需要,将所得表达基因鉴定用cDNA标记物分离。
(1)工序中,准备作为试样的cDNA。通常,首先由被检细胞调制mRNA,使用逆转录酶制备cDNA。该cDNA可以为对应mRNA全长的DNA,也可为其片段。该被检细胞只要是产生3’末端具有聚A尾部的mRNA的细胞即可,没有限制,其包括动物细胞、植物细胞、微生物细胞等所有细胞。还可使用病毒感染的动物细胞、植物细胞、微生物细胞作为被检细胞。
本发明中,如果有1μg的mRNA就可以进行分析。1μg的mRNA通常可以由1mg细胞得到,所以本发明在处理由穿刺活检等得到的贵重的人体组织样品等时特别有效。
从被检细胞中分离mRNA可以使用通常的方法进行。例如,用胍试剂、酚试剂等处理被检细胞,分离出全体RNA后,由使用以寡dT-纤维素和琼脂糖2B为载体的聚U-琼脂糖等的亲和性柱层析法或分批法等得到mRNA。
接着,以所得mRNA为模板,使用寡dT引物和逆转录酶合成第1链cDNA(单链cDNA)后,以该第1链cDNA为模板,合成第2链cDNA(双链cDNA)。作为这里的寡dT引物,可以举出固相固定化寡dT引物、辅酶标识寡dT引物等,从重现性和目标DNA片段的回收率方面考虑,优选固相固定化寡dT引物。该固相固定化寡dT引物包括胶乳珠固定化寡dT引物、磁性珠固定化寡dT引物等,优选磁性珠固定化寡dT引物。
(2)工序中,用II型限制酶切断试样中的该cDNA,制得cDNA片段。
试样中该cDNA可以做成与固相固定化寡dT引物结合的双链cDNA。本说明书中所使用的术语“II型限制酶”是指,识别给定的识别序列,在该识别序列的内侧或其邻接的特异性位置切断DNA的限制酶。作为本发明所用的II型限制酶,优选被认为在分析的mRNA中至少一个具有识别序列的酶,例如,具有由4、5或6个碱基构成的识别序列的II型限制酶。特别是从mRNA的平均链长为2000个碱基方面考虑,优选可以对于4的4次幂=256个碱基以1个的比例出现限制位点的具有4碱基识别序列的II型限制酶。
作为本发明所用II型限制酶的例子,可举出,AfaI、AluI、CviRI、DpnI、HpyCH4V、HpyF44III、RsaI、BfaI、Csp6I、HpyCH4IV、MaeI、MaeII、TaqA1phaI、TaqI、TthHB8I、XspI、Bsp143I、DpnII、MboI、NdeII、Sau3AI、NIaIII、AccII、Bsh1236I、BstUI、BsuRI、FnuDII、HaeIII、MvnI、AciI、BsiSI、HapII、Hin6I、HinP1I、HpaII、MspI、SciNI、CfoI、HhaI、MseI、Tru1I、Tru9I、TasI、Tsp509I和TspEI。
这些II型限制酶中,有识别序列包含4碱基ATCG全部的,也有只包含CG的和只包含AT的。
识别序列包含全部ATCG的II型限制酶的例子可举出AfaI、AluI、CviRI、DpnI、HpyCH4V、HpyF44III、RsaI、BfaI、Csp6I、HpyCH4IV、MaeI、MaeII、TaqA1phaI、TaqI、TthHB8I、XspI、Bsp143I、DpnII、MboI、NdeII、Sau3AI和NIaIII。识别序列只含CG的II型限制酶的例子可举出AccII、Bsh1236I、BstUI、BsuRI、FnuDII、HaeIII、MvnI、AciI、BsiSI、HapII、Hin6I、HinPII、HpaII、MspI、SciNI、CfoI和HhaI。此外,识别序列只含AT的II型限制酶的例子可举出MseI、TrulI、Tru9I、TasI、Tsp509I和TspEI。从这些识别序列的特征和需分析IIS型限制酶的表达因子的特性考虑,优选II型限制酶。
另外,对于前述II型限制酶,如图1所示,在(3)工序中将接头X与(2)工序中所得的cDNA片段相连时,选择II型限制酶,以使该cDNA片段与接头X的连接部分形成作为所希望的第2IIS型限制酶识别序列的切断末端。例如,选择识别序列“5’-GGGAC-3’”的BsmFI作为第2IIS型限制酶时,为了cDNA片段和接头X的连接部分与其识别序列一致,可以使用3’末端为“5’-GGG-3’”的接头X和5’切断末端为“5’-AC-3’”的cDNA片段。因此,该(2)工序中,可以使用识别序列为“5’-GTAC-3’”,切断T和A之间的磷酸二酯键的II型限制酶RsaI或AfaI。
(3)工序中,使该cDNA片段与接头X连接,得到接头X-cDNA片段连接物,该接头X含有第1IIS型限制酶的识别序列、且在与前述II型限制酶的切断末端的连接部分产生第2IIS型限制酶的识别序列。
首先,从(2)工序所得cDNA片段组中分离出含有寡dT引物序列的cDNA片段。分离可以利用寡dT引物的标识进行。例如,将胶乳珠固定化寡dT引物用于前述cDNA的调制时,用II型限制酶处理后,通过离心分离可以使含有固定在该珠上的寡dT引物序列的cDNA片段沉降、分离。这里所得cDNA片段含有mRNA的聚A尾部和由该聚A尾部向5’上游侧最初出现的前述II型限制酶的切断末端部位。接着,使用DNA连接酶(例如,T4DNA连接酶),将该cDNA片段与接头X连接。
本说明书中使用的术语“接头X”是指,含有第1IIS型限制酶的识别序列、且在与前述cDNA片段的II型限制酶的切断末端的连接部分可以形成第2IIS型限制酶的识别序列的接头。此外,该识别序列优选位于第1IIS型限制酶不残留间隔序列地切断该cDNA标记物的位置,或者优选位于残留有希望的间隔序列的适当位置。
例如,与作为第1IIS型限制酶的识别序列含有BseRI的识别序列,且使用RsaI作为II型限制酶时所得cDNA片段连接的接头X,为具有下述结构的双链DNA片段。
5’-…GAGGAGNNNNNGGG-3’(序列号1)3’-…CTCCTCNNNNNCCC-5’(序列号2)
该接头X中的序列“5’-GAGGAG-3’”为第1IIS型限制酶BseRI的识别序列。此外,该接头X中的3’末端序列“5’-GGG-3’”是为了通过与cDNA片段的RsaI的切断末端“5’-AC-3’”的连接形成BsmFI的识别序列“5’-GGGAC-3’”而设计的序列。另外,本说明书中碱基序列中所使用的N或n代表任意的碱基。
本说明书中所用的术语“第1IIS型限制酶”原则上包括识别接头X和接头Y上共同的识别序列并可以形成所希望的EGIcDNA标记物的IIS型限制酶,和发挥同样功能的I型以及III型限制酶。
作为该第1IIS型限制酶的例子可举出MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI、HgaI、LweI、SfaNI、AprI、BspMI、HphI、MboII、MnlI、BbsI、BciVI、BbvII、BpiI、BplI、BpuAI和FauI。
其中,作为从识别序列到最长末端的距离为10个碱基以上的第1IIS型限制酶有MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI和HgaI。此外,该距离为16个碱基以上的第1IIS型限制酶有MmeI、BpmI、BsgI、BspGI、Eco57I和GsuI。
本说明书中使用的术语“第2IIS型限制酶”原则上包括识别形成于接头X和cDNA片段之间的连接部分的识别序列并切断cDNA片段的适当位置的IIS型限制酶,和发挥同样功能的I型以及III型限制酶。经该第2IIS型限制酶的切断,可以得到接头X与cDNA标记物的连接物。
作为该第2IIS型限制酶的例子可举出MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI、HgaI、LweI、SfaNI、AprI、BspMI、HphI、MboII、MnlI、BbsI、BciVI、BbvII、BpiI、BplI、BpuAI和FauI。
其中,作为从识别序列到最长末端的距离为10个碱基以上的第2IIS型限制酶有MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI和HgaI。此外,该距离为16个碱基以上的第2IIS型限制酶有MmeI、BpmI、BsgI、BspGI、Eco57I和GsuI。
另外,第1IIS型限制酶无需限定切断部位的序列,所以对第1和第2IIS型限制酶的组合不作限定。另一方面,II型限制酶必须选择在接头X和cDNA片段的连接物上可以形成第2IIS型限制酶的识别序列的酶。例如下列II型限制酶和第2IIS型限制酶的组合。
II型第2IIS型 标记物长AfaIMmeI 20+4bp*2RsaIMmeI 20+4bp*2AfaIBsmFI 14+4bpRsaIBsmFI 14+4bpCviRI RleAI 12+4bp*3HpyCH4V RleAI 12+4bp*3HpyF44III RleAI 12+4bp*3AciIHgaI 10+4bpHhaIHgaI 10+4bpHin6I HgaI 10+4bpSciNI HgaI 10+4bpHinPI HgaI 10+4bpDpnILweI 9+4bpDpnISfaNI 9+4bpDpnIMnlI 7+4bp*1AfaIBbsI 6+4bpRsaIBbsI 6+4bpAfaIBbvII 6+4bpRsaIBbvII 6+4bpAfaIBpiI 6+4bpRsaIBpiI 6+4bpAfaIBplI 6+4bpRsaIBplI 6+4bpAfaIBpuAI 6+4bpRsaIBpuAI 6+4bpAciIFauI 6+4bpCfoIFauI 6+4bpHhaIFauI 6+4bpHin6I FauI 6+4bpHinP1I FauI 6+4bpSciNI FauI 6+4bp
另外,对于上表中右端记号*,由于正链的切断位置远离互补链的切断位置,所以在接头Y必须为随机序列的组合中,*右侧的数字表示其碱基数。
(4)工序中,用第2IIS型限制酶切断该接头X-cDNA片段连接物,制得接头X-cDNA标记物连接物。例如,使用BsmFI作为第2IIS型限制酶时,该酶识别由该接头X-cDNA片段连接物所形成的识别序列“5’-GGGAC-3’”和其互补链构成的双链DNA,切断“5’-GGGAC-3’(10/14)”的位置。也就是说,BsmFI切断从识别序列“5’-GGGAC-3’”的3’末端的碱基C开始的3’下游侧第10个碱基和第11个碱基之间的磷酸二酯键、以及从识别序列“5’-GGGAC-3’”的互补链“3’-CCCTG-5’”的5’末端的碱基G开始的5’上游侧的第14个碱基和第15个碱基之间的磷酸二酯键,生成具有有以下结构的切断末端的DNA片段。
5’-…GGGACNNNNNNNNNN-3’(序列号3)3’-…CCCTGNNNNNNNNNNNNNN-5’(序列号4)(5)工序中,根据需要对(4)工序中用第2IIS型限制酶切断该接头X-cDNA片段连接物所得的该接头X-cDNA标记物连接物进行纯化。此纯化可以如下进行,即,象(3)工序所述的那样,利用标识寡dT引物的标识除去切除了前述cDNA标记物的cDNA片段残余部分。例如,将胶乳珠固定化寡dT引物用于前述cDNA的调制时,利用胶乳珠的沉淀性,对限制酶处理液进行离心分离,由此可以沉淀、除去含有标识寡dT引物序列的cDNA片段残余部分。这里,离心上清液中含有接头X-cDNA标记物连接物。
(6)工序中,根据需要将该接头X-cDNA标记物连接物的cDNA标记物的末端处理为含第1IIS型限制酶的识别序列的接头Y可以结合的状态。
作为该处理方法,有向除去了含有标识寡dT引物序列的cDNA片段残余部分的溶液中加入DNA聚合酶和dNTP,掩埋突出末端的方法。而且,加入Taq聚合酶和dATP,则在3’末端增加1个碱基腺嘌呤。例如,经IIS型限制酶BsmFI处理得到的上述切断末端经Taq聚合酶处理,具有以下的末端结构。另外,该序列中下划线部分为新合成的序列。
5’-…GGGACNNNNNNNNNNNNNNA-3’(序列号5)3’-…CCCTGNNNNNNNNNNNNNN-5’ (序列号4)(7)工序中,在该接头X-cDNA标记物连接物的经第2IIS型限制酶切断的末端连接接头Y,制得接头X-cDNA标记物-接头Y连接物。
根据需要,用DNA连接酶(例如,T4DNA连接酶)将接头Y与进行了末端处理的该接头X-cDNA标记物连接物连接。本说明书中所用的术语“接头Y”是指,含有第1IIS型限制酶(例如BseRI)的识别序列的接头。此外,该识别序列优选位于第1IIS型限制酶不残留间隔序列地切断该cDNA标记物的位置,或者优选位于残留有所希望的间隔序列的适当位置。例如,作为与(6)工序中所得的3’末端增加1个碱基腺嘌呤的DNA片段相连接的接头Y,是具有下述结构的DNA片段。
5’-…GAGGAGNNNNNNNNGT-3’(序列号6)3’-…CTCCTCNNNNNNNNC-5’ (序列号7)由该工序,可以得到具有“5’-[接头X]-[cDNA标记物(EGIcDNA标记物)]-[接头Y]-3’”结构的连接物。
(8)工序中,对该接头X-cDNA标记物-接头Y连接物进行扩增。
(7)工序中所得的连接物,接头X和Y分别具有引物X和Y杂交的序列,很容易用聚合酶链反应(PCR)进行扩增。该PCR法可以为标准的聚合酶链反应法,例如美国专利第4,683,195号中所记载的方法。此外,还可以通过将该连接物组装到适合原核生物的载体中的克隆或本领域技术人员公知的其它扩增方法进行扩增。
另外,使用包含在末端连接有引物退火用接头的多种长度不同的DNA的模板混合物进行PCR时,扩增效率因各模板DNA的链长而不同。通常,链长越长扩增效率越低、链长越短扩增效率越高。因此,所得扩增产物中对应于各模板DNA的扩增DNA片段的出现比率并不反映模板DNA混合物中各DNA片段的存在比例。但是,在本发明方法中,作为模板使用的DNA的混合物链长相等且短,所以所得的扩增产物中对应于各模板DNA的扩增DNA片段的出现比率反映出模板DNA混合物中各DNA片段的存在比例。因此,本发明中,因PCR的扩增效率不同而引起的影响理论上讲完全没有,而且所得扩增产物中的各cDNA片段的出现比率反映出被检细胞中被表达的各mRNA的比率。
该PCR的时间、温度等条件可以按标准的设定进行。另外,本发明扩增的接头X-cDNA标记物-接头Y,序列长度短、长度均一且扩增效率高,所以可以减少退火/序列延长循环数。此外,改变接头的序列则PCR的效率会变化,所以可以通过所用接头达到退火/序列延长循环所希望的效率。
本说明书中的术语“引物X”是指,与接头X的核酸链互补,并在聚合酶链反应被诱导的条件下可以作为反应开始点进行作用的天然存在或合成的寡核苷酸。另外,引物X必须为在接头X上可以残留第1IIS型限制酶的识别序列的位置进行杂交,且具有在聚合剂存在下可以开始扩增的足够长度的引物。该引物X必需的长度由温度、pH、所用连接酶等多种因素决定。还有,同样地,本说明书中所用术语“引物Y”是指,与接头Y的核酸链互补,并在聚合酶链反应被诱导的条件下可以作为反应开始点进行作用的天然存在或合成的寡核苷酸。
另外,只要是本领域技术人员,即使不进行过多的试验,在考虑第1IIS型限制酶等的基础上,基于接头的核苷酸序列就可以很容易地制备出该扩增用引物。
(9)工序中,用第1IIS型限制酶切断所得扩增产物,制得表达基因鉴定用cDNA标记物。例如使用BseRI作为第1IIS型限制酶时,该酶识别由接头X上的序列“5’-GAGGAG-3’”及其互补链构成的双链DNA,切断“5’-GAGGAG-3’(10/8)”。也就是说,BseRI切断从识别序列“5’-GAGGAG-3’”的3’末端的碱基G开始的3’下游侧第10个碱基和第11个碱基之间的磷酸二酯键,以及从识别序列“5’-GAGGAG-3’”的互补链“3’-CTCCTC-5’”的5’末端的碱基C开始的5’上游侧第8个碱基和第9个碱基之间的磷酸二酯键,得到具有下述结构切断末端的接头X的DNA片段。
5’-…GAGGAGNNNNNNNNNN-3’(序列号8)3’-…CTCCTCNNNNNNNN-5’(序列号9)
同样地,第1IIS型限制酶BseRI识别由接头Y上的序列“5’-GAGGAG-3’”及其互补链构成的双链DNA,切断“5’-GAGGAG-3’(10/8)”。也就是说,BseRI切断从识别序列“5’-GAGGAG-3’”的3’末端的碱基G开始的3’下游侧第10个碱基和第11个碱基之间的磷酸二酯键,以及从识别序列“5’-GAGGAG-3’”的互补链“3’-CTCCTC-5’”的5’末端的碱基C开始的5’上游侧第8个碱基和第9个碱基之间的磷酸二酯键。结果,从含有接头X和Y的DNA片段中切出EGIcDNA标记物。
也就是说,通过在(2)工序中使用RseI作为II型限制酶,在(3)工序中使用含有由序列号1所示碱基序列构成的核苷酸链的接头X,在(4)工序中使用BsmFI作为第2IIS型限制酶,在(7)工序中使用含有由序列号6所示碱基序列构成的核苷酸链的接头Y,在(9)工序中使用BseRI作为第1IIS型限制酶,可以得到下述EGIcDNA标记物,其包含源自cDNA的连续14个碱基的核苷酸链,该碱基与源自被检细胞的RsaI切断部位(5’-AC-3’)相邻接。
5’-NNNNNNNNNNNNNNAC-3’(序列号10)3’-TGNNNNNNNNNNNNNN-5’(序列号11)使用由源自细胞的mRNA得到的cDNA库来实施本发明方法时,在(9)工序中得到EGIcDNA标记物的库。
本发明中,利用所得该EGIcDNA标记物库,可以定性或定量地测定对应于EGIcDNA标记物序列的cDNA,从而考察对应的表达基因的模式。
例如,预先制得与待检cDNA相对应的EGIcDNA标记物库,放入对其进行定位的检测装置中,使经与其不同的标识等标记的被检测试样与标准试样接触,比较相对信号强度,可以进行靶的选择等。可以广泛使用荧光标识、同位素等公知的标识物作为此标识。
此外,例如通过使该EGIcDNA标记物库与固定有待检测cDNA等的检测装置相接触,可以检出该EGIcDNA标记物库所含的cDNA,考察对应的表达基因的模式。
本发明中可用的检测装置有DNA芯片等微阵列和点杂交等巨阵列。用于该检测装置的支撑体有尼龙膜、硝基纤维素过滤器、玻璃板、硅片等。此外,该检测装置是指,例如将所得EGIcDNA标记物固定在支撑体上,使待检测DNA、RNA和其它片段等杂交,可以进行检测的装置。
另外,优选进行能检测mRNA或cDNA的标识。例如,可以使用放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合剂或酶等作为标识。
例如,将经标识的待检测cDNA分离成单链分子,根据需要进行梯度稀释,然后,例如在硅片的各载网中,使其与保持有与待检测基因相对应的EGIcDNA标记物的固相支撑体相接触。将所得基因表达模式与作为基准的基因表达模式相比较,可以很容易地知道试样细胞等的状态。此外,如果固定未知基因的EGIcDNA标记物,记录其模式,则在将来此基因被认知后,可再进行分析。
本发明中,通过II型限制酶和第2IIS型限制酶的组合,可以调整EGIcDNA标记物的长度,还可根据分析基因的生物种类等改变所希望的长度,但是,通常EGIcDNA标记物的长度优选6~25个碱基对,更优选10~25个碱基对,特别优选10~16个碱基对。
(10)工序中,根据需要对所得表达基因鉴定用cDNA标记物进行分离。对于此分离,可以使用本领域技术人员通常使用的方法,例如聚丙烯酰胺凝胶电泳法进行。
还有,将EGIcDNA标记物互相连接,确定该连接物的碱基序列,由此可以分析表达基因。例如,(9)工序中所得EGIcDNA标记物3’和5’的连接末端是互补的,所以可以使用T4连接酶等进行连接。然后,可以将所得EGIcDNA标记物的连接物(多联体)通过本领域技术人员公知的方法,例如组装到载体中进行克隆,或者使用序列分析仪读出序列的方法进行分析。
在本发明中,该多联体通常优选含有3~200EGIcDNA标记物,更优选含有3~80EGIcDNA标记物,特别优选含有16~40EGIcDNA标记物。另外,因EGIcDNA标记物的形成方法不同,所得多联体可以有在EGIcDNA标记物之间没有间隔序列的多联体和有间隔序列的多联体。
本发明的EGIcDNA标记物连接物可以用例如插入质粒或噬菌体等载体中扩增的标准方法进行克隆。
本说明书中的术语“重组载体”是指,插入EGIcDNA标记物连接物,或通过组装制得的质粒、病毒或其它运载体。这样的载体为包含复制起点、启动子和特定基因的载体,该特定基因可以对性状转化细胞作表达型选择。本发明中,可以使用公知的适于序列分析的多种克隆载体。作为其例子可举出pUC18、其修饰载体pUC118、pUC19、其修饰载体pUC119、M13mp18RFI、M13mp19RFI、pBR322、pCR3.1、pBAD-TOPO及其修饰载体和pBluescript(R)II等。
接着,将该重组载体移入适当的宿主细胞中。本说明书中的“宿主细胞”是指,在其细胞内载体可繁殖且可以表达其DNA的细胞,以及宿主细胞本身的后代。另外,因为复制过程中有时会引起突变,所以并不是所有的后代都与母细胞相同。
另外,本发明中可使用诸如外来DNA在宿主内连续维持的公知的稳定移入法。例如,使用诸如大肠杆菌的原核细胞等作为宿主时,在指数繁殖期后收获,接着由经公知方法RbCl法、CaCl2法处理的细胞调制具有摄取DNA能力的感受态细胞。另外,还可通过电穿孔或常规方法进行性状转化。
另外,本发明中,将EGIcDNA标记物连接物组装到载体上,进行碱基序列确定时,一次操作可简单地考察20个以上、20个~100个、优选约20~30个左右的EGIcDNA标记物的序列。
可以明确的是,这里虽然对本发明的优选实施方式作了说明,但本领域技术人员基于这些说明,在不脱离本发明技术思想的基础上可以进行各种改变。还有,下面举出本发明的实施例进行具体说明,但这些实施例并不构成对本发明保护范围的限制。因此,本发明只受权利要求范围的限定。
(实施例)[实施例1]外周血淋巴细胞的基因表达分析首先,使用NycoPrep1.077A(Nyco Med Pharma公司制),由源自健康正常人的外周血中收集外周血单核细胞(PBMC)。在10μg/ml脂多糖(LPS)存在或不存在下,在37℃下对所得外周血单核细胞培养3小时,然后使用Isogen(ニツポンジ-ン公司制),从各培养细胞中提取全RNA。将所得的全RNA提取物用DnaseI(宝酒造公司制)在37℃下处理30分钟,然后使用RNeasy(QIAGEN公司制)进行纯化。接着,使用Oligotex-MAG纯化试剂盒(宝酒造公司制),通过吸附从全RNA中分离出mRNA,然后使用cDNA合成试剂盒(宝酒造公司制)由mRNA调制双链cDNA。
将所得双链cDNA用限制酶RsaI(New England Biolabs公司制)在37℃下处理2小时,由此切断后,通过磁铁使磁性珠部分聚集在壁面上,回收,由此得到存在cDNA片段的级分,该cDNA片段含有在前述mRNA中聚A尾部和从该聚A尾部开始向5’上游侧最初出现的前述RsaI识别切断部位之间的碱基序列。接着,使用T4DNA连接酶,按下列3种方法,使该cDNA片段级分与含有第1IIS型限制酶BseRI的识别序列的接头X连接。无论那种方法,都可以很好地进行接头X的连接。
(1)直接将接头X连接在RsaI切断末端的方法在由RsaI切断而产生的平滑末端,直接连接具有以下结构的接头X。
5’-TGCAGCTGAGGAGTCCATGGG-3’(序列号12)3’-ACGTCGACTCCTCAGGTACCC-5’(序列号13)(2)通过增加1个碱基对RsaI切断末端进行结合末端化,再连接接头X的方法。
在dCTP存在下进行TaqDNA聚合酶处理,由此在由RsaI切断而产生的平滑末端的3’末端如下所示(下划线)地导入1个碱基C。
5’-AC····-3’3’-CTG····-5’接着,在上述结合末端连接具有下述结构的接头X。
5’-TGCAGCTGAGGAGTCCATGGG-3’(序列号12)3’-ACGTCGACTCCTCAGGTACC-5’(序列号14)(3)对RsaI切断末端通过除去1个碱基进行结合末端化,再连接接头X的方法。
在dATP、dGTP和dCTP的存在下,进行T4 DNA聚合酶处理,由此,从经RsaI切断而产生的平滑末端的3’末端如下所示(下划线)地去掉1个碱基T。
5’-AC····-3’3’-G····-5’接着,在16℃进行2小时的T4 DNA连接酶处理,使具有以下结构的接头X连接在上述结合末端上。
5’-TGCAGCTGAGGAGTCCATGGG-3’(序列号12)3’-ACGTCGACTCCTCAGGTACCCT-5’(序列号15)接着,利用经接头X的连接而产生的限制酶BsmFI的识别序列5’-GGGAC-3’,进行使用BsmFI(New England Biolabs公司制)的65℃的切断2小时,这次与上次相反,回收没有磁性珠的部分,即回收离心上清液。因为该酶的切断部位为5’-GGGAC-3’(10/14)的位置,所以被回收的部分中含有由连有接头的cDNA来源的14个碱基(除去源自RsaI部位的相同的AC2残基)。
对于此上清液部分,在dATP、dCTP、dGTP以及dTTP的存在下,进行16℃的T4 DNA聚合酶处理2小时,然后,在dATP的存在下,70℃进行30分钟的Z-Taq(宝酒造公司制)处理,然后回收该片段,在dATP存在下进行处理。通过上述处理,在3’末端产生插有一个A的突出末端,所以对其进行16℃的T4 DNA连接酶处理2小时,连接具有下述结构的第二接头Y。
5’-CATGTGTCGCTCCTCACTAGAC-3’(序列号16)3’-TGTACACAGCGAGGAGTGATCTG-5’(序列号17)通过上述接头Y的连接,得到总长60个碱基对的一组DNA“接头X-AC-源自cDNA的14个碱基对(EGIcDNA标记物)-AC-接头Y”的小片段cDNA连接物库,其中包含源自两端被已知接头夹持的cDNA的14个碱基对。该小片段由以下碱基序列和其互补链构成。
5’-TGCAGCTGAGGAGTCCATGGGACNNNNNNNNNNNNNNACATGTGTCGCTCCTCACTAGAC-3’(序列号18)接着,使用在接头X部分进行杂交的引物X“5’-TGCAGCTGAGGAGTCCATGGG-3’”(序列号12)和在接头Y部分进行杂交的引物Y“5’-GTCTAGTGAGGAGCGACACATGT-3’”(序列号17),用TaqDNA聚合酶通过PCR对此小片段cDNA连接物库进行扩增。PCR通过以在96℃下变性30秒、在50℃下退火1分钟、在72℃下伸长一分钟作为一个循环共计25个循环的扩增反应、和在72℃下2分钟的最终伸长反应进行。
将所得PCR产物用IIS型限制酶BseRI(New England Biolabs公司制)处理。此酶的切断部位为“5’-GAGGAG-3’(10/8)”的位置,所以使DNA片段产生如下结构。
5’-NNNNNNNNNNNNNNAC-3’(序列号10)3’-TGNNNNNNNNNNNNNN-5’(序列号11)接着,将处理物提供给12%聚丙烯酰胺电泳中,与接头片段分离,回收上述小片段DNA。
将所得cDNA标记物再次用T4连接酶连接后,提供给4.5%聚丙烯酰胺电泳中,由此回收500~1000bp的结合片段。回收的结合片段具有以下结构,与(N)14邻接的“5’-AC-3’”也是源自cDNA上的RsaI识别序列的碱基,所以不含人为增加的间隔序列,得到完全源自cDNA的cDNA标记物连接物库。以下碱基序列中,(N)14表示源自cDNA的14个碱基5’-NNNNNNNNNNNNNN-3’(序列号19)。
5’-…AC(N)14AC(N)14AC(N)14AC(N)14AC(N)14AC(N)14AC…-3’(序列号20)3’-…TG(N)14TG(N)14TG(N)14TG(N)14TG(N)14TG(N)14TG…-5’(序列号21)将上述结合片段组装到质粒pUC118中,使用ABI377型DNA序列分析仪确定碱基序列,结果,可以分析在PBMC细胞和该细胞经LPS刺激后的细胞进行特异性表达的基因片段。经一次碱基序列确定操作可以明确约20个左右的EGIcDNA标记物的序列,所以,通过进行约500个样品的碱基序列确定,可以确定1万个序列,这些序列被认为可以大致确定经细胞表达的mRNA的种类及各自的数量。
表1和2中示出了几个用此方法鉴定的基因。将这些EGIcDNA标记物的碱基序列对照已知的数据库,进行同源性检索。表1表示经LPS刺激表达增加的基因,表2相反表示经LPS刺激表达受到抑制的基因。
表1经LPS刺激表达被活化的基因

表2经LPS刺激表达被抑制的基因

表1和表2中,作为mfID在碱基序列前所示的数字,为了进行计算机处理而将14个碱基以10进制数字表示。也就是说,mfID为将碱基序列的各碱基分别按a为0、c为1、g为2、t为3的方法读出的4进制数转换成10进制数,然后再加1而得到的数。根据此ID,无论长短如何都可以用数字来处理碱基序列。例如,处理碱基数14的碱基序列时,可以如下所述用数值特定。
5’-aaaaaaaaaaaaaa-3’(序列号42)000000001(或简单表示为1)5’-aaaaaaaaaaaaac-3’(序列号43)000000002(或简单表示为2)5’-aaaaaaaaaaaaag-3’(序列号44)000000003(或简单表示为3)5’-aaaaaaaaaaaaat-3’(序列号45)000000004(或简单表示为4)5’-aaaaaaaaaaaaca-3’(序列号46)000000005(或简单表示为5)5’-ttttttttttttgt-3’(序列号47)2684354525’-ttttttttttttta-3’(序列号48)2684354535’-tttttttttttttc-3’(序列号49)2684354545’-tttttttttttttg-3’(序列号50)2684354555’-tttttttttttttt-3’(序列号51)268435456如此,通过该ID,即使出现由任何14个碱基构成的序列,也都可以分配给这些9位数字中的一个。这些数字称为小片段ID(minifragment IDmf ID)[实施例2]将实施例1所得EGIcDNA标记物库用下述检测装置检出,可以进行基因表达的分析。
合成低聚DNA,其包含表1所述的经LPS刺激活化的基因中mfID为261849128、220597775、69402230、232235060、110001478以及196314601的mf碱基序列的对应序列,采用常规方法在载玻片上点样,制成DNA芯片。
以实施例1中得到的源自LPS刺激外周血单核细胞(PBMC)的mRNA为模板,用荧光性化合物Cy3-dUTP(*1)(アマシヤム·フアルマシア公司制)进行荧光标记,且以源自LPS未刺激的PBMC的mRNA为模板,用荧光性化合物Cy5-dUTP(*2)(アマシヤム·フアルマシア公司制)进行荧光标记,得到探针溶液。
混合该探针溶液,在6×SET
中与前述DNA芯片在45℃下杂交一夜。
用洗涤液[6×SSC、0.1%SDS]在52℃下洗涤后,使用扫描分析仪扫描各荧光物质,得到荧光强度数据,对此数据进行分析。对于各点的Cy3与Cy5的信号强度的分散图(Scatter Plot)的结果,在所有点中,由源自受LPS刺激的PBMC的mRNA而得来的探针产生的荧光与未受LPS刺激的相比,信号强度要强2倍以上。
*1 CAS RN Cy3 CAS RN146368-16-3CN 3H-Indolium,2-[3-[1-[6-[(2,5-dioxo-1-pyrrolidinyl)oxy]-6-oxohexyl]-1,3-dihydro-3,3-dimethyl-5-sulfo-2H-indol-2-ylidene]-1-propenyl]-1-ethyl-3,3-dimethyl-5-sulfo-,inner salt(9CI)(CA INDEX NAME)*2 CAS RN Cy5 CAS RN146368-14-1CN 3H-Indolium,2-[5-[1-[6-[(2,5-dioxo-1-pyrrolidinyl)oxy]-6-oxohexyl]-1,3-dihydro-3,3-dimethyl-5-sulfo-2H-indol-2-ylidene]-1,3-pentadienyl]-1-ethyl-3,3-dimethyl-5-sulfo-,inner salt(9CI)(CA INDEX NAME)[实施例3]使用实施例1所得的各EGIcDNA标记物库的任意标记物,可以分析一组被测试样中该基因表达的不同。
分别以源自LPS刺激外周血单核细胞(PBMC)的mRNA、源自LPS未刺激PBMC的mRNA作为模板,用逆转录酶调制cDNA,将所得cDNA分别点样到尼龙膜上,然后在80℃下处理2小时。
合成低聚DNA,其包含表1所述的经LPS刺激而诱导表达的基因中mfID为261849128的碱基序列,在T4多核苷酸激酶的存在下,使用[γ-32P]ATP(アマシヤム·フアルマシア公司制),通过32P(放射性同位素)标记该DNA,得到探针溶液。
将该探针溶液在6×SET中与前述尼龙膜一起,在45℃下杂交一夜。用洗涤液[6×SSC、0.1%SDS]在52℃下洗涤后,进行放射自显影。对于X射线膜上的信号,源自LPS刺激PBMC的mRNA的cDNA与LPS未刺激PBMC的相比,要强2倍以上。
用HpyCH4V代替II型限制酶RsaI,使用RleAI代替第2IIS型限制酶BsmFI,除此以外,按照与实施例1相同的方法实施,制得EGIcDNA标记物库。首先,用下述(1)~(3)中任一方法制备接头X-cDNA片段连接物。
(1)用II型限制酶HpyCH4V切断试样中的cDNA,在由此产生的平滑末端直接连接具有下述结构的接头X。
5’-TGCAGCTGAGGAGTCATCCCA-3’(序列号52)3’-ACGTCGACTCCTCAGTAGGGT-5’(序列号53)(2)用II型限制酶HpyCH4V切断试样中的cDNA,在由此产生的平滑末端,在dTTP存在下如下所示导入1个碱基T。
5’-CA····-33’-TGT····-5’接着,在上述结合末端连接具有下述结构的接头X。
5’-TGCAGCTGAGGAGTCATCCCA-3’(序列号52)3’-ACGTCGACTCCTCAGTAGGG-5’(序列号54)(3)用II型限制酶HpyCH4V切断试样中的cDNA,从由此产生的平滑末端,在dATP、dTTP和dCTP存在下,如下所示除去一个碱基G。
5’-CA····-3’3’-T····-5’接着,在上述结合末端连接具有下述结构的接头X。
5’-TGCAGCTGAGGAGTCATCCCA-3’(序列号52)3’-ACGTCGACTCCTCAGTAGGGTG-5’(序列号55)接着,利用由接头X的连接而产生的限制酶RleAI的识别序列5’-CCCACA-3’,用RleAI进行切断,回收离心上清液。因为该酶的切断部位为5’-CCCACA-3’(12/9)的位置,所以回收部分中含有由与接头X连接的cDNA来源的12个碱基的标记物。
接着,连接具有下述结构的接头Y。接着用与实施例1相同的方法扩增,用第1IIS型限制酶消化,由此得到所希望的EGIcDNA标记物库。
5’-CACTGTGTCGCTCCTCACTAGAC-3’(序列号56)3’-NNNGTGACACAGCGAGGAGTGATCTG-5’(序列号57)[实施例5]将实施例4所得EGIcDNA标记物库用下述检测装置检出,可以进行基因表达的分析。
合成低聚DNA,其包含与表1所述的经LPS刺激而活化且与mfID为261849128、220597775、69402230、232235060、110001478以及196314601的基因相对应,且实施例3所得EGIcDNA标记物的对应序列,根据常规方法在载玻片上点样,制成DNA芯片。
以实施例3中得到的源自LPS刺激外周血单核细胞(PBMC)的mRNA为模板,用荧光性化合物Cy3-dUTP(*1)(アマシヤム·フアルマシア公司制)进行荧光标记,且以源自LPS未刺激PBMC的mRNA为模板,用荧光性化合物Cy5-dUTP(*2) (アマシヤム·フアルマシア公司制)进行荧光标记,得到探针溶液。
混合该探针溶液,在6×SET
中与前述DNA芯片在45℃下杂交一夜。
用洗涤液[6×SSC、0.1%SDS]在52℃下洗涤后,使用扫描分析仪扫描各荧光物质,得到荧光强度数据,对此数据进行分析。对于各点的Cy3与Cy5的信号强度的分散图(Scatter Plot)的结果,在所有点中,由源自受LPS刺激的PBMC的mRNA而得来的探针产生的荧光与未受LPS刺激的相比,信号强度要强2倍以上。
工业实用性根据本发明,可以以较好的重现性正确检测、分析被检cDNA或在被检细胞中特异性表达的基因。按照本发明的方法,作为基因表达状态的不同,可以明确任意两个细胞在功能、形态上的不同,所以可以广泛用于生理条件下或病理状态下的所有生物现象的分析。
序列表SEQUENCE LISTING<110>吴羽化学工业株式会社山本三毅夫山本直树广濑国孝酒井润<120>表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法<130>0701002WO1<150>JP2001/073959<151>2001-03-15<160>57<170>PatentIn version 2.1<210>1<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>7..11<223>任选<400>1gaggagnnnn nggg 14<210>2<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>4..8<223>任选<400>2cccnnnnnct cctc 14<210>3<211>15<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>6..15<223>任选<400>3gggacnnnnn nnnnn 15<210>4<211>19<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>1..14<223>任选<400>4nnnnnnnnnn nnnngtccc 19
<210>5<211>20<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>6..19<223>任选<400>5gggacnnnnn nnnnnnnnna 20<210>6<211>16<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>7..14<223>任选<400>6gaggagnnnn nnnngt 16<210>7<211>15<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>2..9<223>任选<400>7cnnnnnnnnc tcctc 15<210>8<211>16<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>7..16<223>任选<400>8gaggagnnnn nnnnnn 16<210>9<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>1..8<223>任选<400>9nnnnnnnnct cctc 14<210>10<211>16
<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>1..14<223>任选<400>10nnnnnnnnnn nnnnac 16<210>11<211>16<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>1..14<223>任选<400>11nnnnnnnnnn nnnngt 16<210>12<211>21<212>DNA<213>人工序列<220>
<223>合成DNA<400>12tgcagctgag gagtccatgg g 21
<210>13<211>21<212>DNA<213>人工序列<220>
<223>合成DNA<400>13cccatggact cctcagctgc a 21<210>14<211>20<212>DNA<213>人工序列<220>
<223>合成DNA<400>14ccatggactc ctcagctgca 20<210>15<211>22<212>DNA<213>人工序列<220>
<223>合成DNA<400>15tcccatggac tcctcagctg ca 22<210>16<211>22<212>DNA<213>人工序列<220>
<223>合成DNA
<400>16catgtgtcgc tcctcactag ac 22<210>17<211>23<212>DNA<213>人工序列<220>
<223>合成DNA<400>17gtctagtgag gagcgacaca tgt 23<210>18<211>60<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>24..37<223>任选<400>18tgcagctgag gagtccatgg gacnnnnnnn nnnnnnnaca tgtgtcgctc ctcactagac 60<210>19<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>1..14
<223>任选<400>19nnnnnnnnnn nnnn 14<210>20<211>98<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>3..16<223>任选<220>
<221>n<222>19..32<223>任选<220>
<221>n<222>35..48<223>任选<220>
<221>n<222>51..64<223>任选<220>
<221>n<222>67..80<223>任选<220>
<221>n<222>83..96<223>任选
<400>20acnnnnnnnn nnnnnnacnn nnnnnnnnnn nnacnnnnnn nnnnnnnnac nnnnnnnnnn 60nnnnacnnnn nnnnnnnnnn acnnnnnnnn nnnnnnac 98<210>21<211>98<212>DNA<213>人工序列<220>
<223>合成DNA<220>
<221>n<222>3..16<223>任选<220>
<221>n<222>19..32<223>任选<220>
<221>n<222>35..48<223>任选<220>
<221>n<222>51..64<223>任选<220>
<221>n<222>67..80<223>任选<220>
<221>n<222>83..96<223>任选<400>21
gtnnnnnnnn nnnnnngtnn nnnnnnnnnn nngtnnnnnn nnnnnnnngt nnnnnnnnnn 60nnnngtnnnn nnnnnnnnnn gtnnnnnnnn nnnnnngt 98<210>22<211>14<212>DNA<213>人<400>22agggtccttt tgca 14<210>23<211>14<212>DNA<213>人<400>23ttgcgtgaaa agct 14<210>24<211>14<212>DNA<213>人<400>24cccactttct gctg 14<210>25<211>14<212>DNA<213>人<400>25tcagcgaatg aatg 14<210>26<211>14<212>DNA<213>人
<400>26caagagtttg ctcc 14<210>27<211>14<212>DNA<213>人<400>27tctcctggaa atat 14<210>28<211>14<212>DNA<213>人<400>28cggatgcttc cacc 14<210>29<211>14<212>DNA<213>人<400>29tgtaattgag catc 14<210>30<211>14<212>DNA<213>人<400>30gtgtatgacc tgga 14<210>31<211>14<212>DNA
<213>人<400>31cctccccggc ctgg 14<210>32<211>14<212>DNA<213>人<400>32ctccctcact tctc 14<210>33<211>14<212>DNA<213>人<400>33ctgtgaacca agtg 14<210>34<211>14<212>DNA<213>人<400>34cccggaacgc actg 14<210>35<211>14<212>DNA<213>人<400>35caatacgagt tccc 14<210>36<211>14
<212>DNA<213>人<400>36tctgcttgcg gagg 14<210>37<211>14<212>DNA<213>人<400>37ccccttctgg gcat 14<210>38<211>14<212>DNA<213>人<400>38caggcagtgc gggc 14<210>39<211>14<212>DNA<213>人<400>39tacgttgtag ctca 14<210>40<211>14<212>DNA<213>人<400>40caacagcagc catg 14<210>41
<211>14<212>DNA<213>人<400>41tgagacctag agtc 14<210>42<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>42aaaaaaaaaa aaaa 14<210>43<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>43aaaaaaaaaa aaac 14<210>44<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>44aaaaaaaaaa aaag 14
<210>45<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>45aaaaaaaaaa aaat 14<210>46<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>46aaaaaaaaaa aaca 14<210>47<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>47tttttttttt ttgt 14<210>48<211>14<212>DNA<213>人工序列<220>
<223>合成DNA
<400>48tttttttttt ttta 14<210>49<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>49tttttttttt tttc 14<210>50<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>50tttttttttt tttg 14<210>51<211>14<212>DNA<213>人工序列<220>
<223>合成DNA<400>51tttttttttt tttt 14<210>52<211>21<212>DNA<213>人工序列
<220>
<223>合成DNA<400>52tgcagctgag gagtcatccc a 21<210>53<211>21<212>DNA<213>人工序列<220>
<223>合成DNA<400>53tgggatgact cctcagctgc a 21<210>54<211>20<212>DNA<213>人工序列<220>
<223>合成DNA<400>54gggatgactc ctcagctgca 20<210>55<211>22<212>DNA<213>人工序列<220>
<223>合成DNA<400>55gtgggatgac tcctcagctg ca 22
<210>56<211>23<212>DNA<213>人工序列<220>
<223>合成DNA<400>56cactgtgtcg ctcctcacta gac 23<210>57<211>26<212>DNA<213>人工序列<220>
<221>任选<222>24..26<223>n<400>57gtctagtgag gagcgacaca gtgnnn 2权利要求
1.表达基因鉴定用cDNA标记物的制备方法,其中,准备互补的脱氧核糖核酸(cDNA),将该cDNA用II型限制酶切断,得到cDNA片段;将接头X连接在该cDNA片段上,得到接头X-cDNA片段连接物,该接头X含有第1IIS型限制酶的识别序列,且在与前述II型限制酶的切断末端的连接部分产生第2IIS型限制酶的识别序列;将该接头X-cDNA片段连接物用第2IIS型限制酶切断,得到接头X-cDNA标记物连接物;将含有第1IIS型限制酶的识别序列的接头Y连接在接头X-cDNA标记物经第2IIS型限制酶切断的末端处,得到接头X-cDNA标记物-接头Y连接物;对该接头X-cDNA标记物-接头Y连接物进行扩增;且将所得扩增产物用第1IIS型限制酶切断,得到表达基因鉴定用cDNA标记物。
2.根据权利要求1的方法,其中还包括对所述接头X-cDNA片段连接物进行纯化的工序。
3.根据权利要求1的方法,其中还包括下述工序,即,将所述接头X-cDNA片段连接物的cDNA片段的末端处理成含有第1IIS型限制酶的识别序列的接头Y可以连接的状态。
4.根据权利要求2的方法,其中还包括下述工序,即,将所述接头X-cDNA片段连接物的cDNA片段的末端处理成含有第1IIS型限制酶的识别序列的接头Y可以连接的状态。
5.根据权利要求1、2、3或4中任一所述的方法,其中包括对所得表达基因鉴定用cDNA标记物进行分离的工序。
6.根据权利要求1的方法,其中由源自被检细胞的mRNA调制cDNA。
7.根据权利要求1的方法,其中使用固相固定化寡dT引物作为寡dT引物,由源自被检细胞的mRNA调制cDNA。
8.根据权利要求7的方法,其中固相固定化寡dT引物为胶乳珠或磁性珠固定化寡dT引物。
9.根据权利要求1的方法,其中所述II型限制酶具有4个碱基对的识别位点。
10.根据权利要求1的方法,其中所述II型限制酶选自AfaI、AluI、CviRI、DpnI、HpyCH4V、HpyF44III、RsaI、BfaI、Csp6I、HpyCH4IV、MaeI、MaeII、TaqAlphaI、TaqI、TthHB8I、XspI、Bsp143I、DpnII、MboI、NdeII、Sau3AI、NIaIII、AccII、Bsh1236I、BstUI、BsuRI、FnuDII、HaeIII、MvnI、AciI、BsiSI、HapII、Hin6I、HinPII、HpaII、MspI、SciNI、CfoI、HhaI、MseI、Tru1I、Tru9I、TasI、Tsp509I和TspEI。
11.根据权利要求1的方法,其中所述第1IIS型限制酶选自MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI、HgaI、LweI、SfaNI、AprI、BspMI、HphI、MboII、MnlI、BbsI、BciVI、BbvII、BpiI、BplI、BpuAI和FauI。
12.根据权利要求1的方法,其中所述第1IIS型限制酶选自MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI和HgaI。
13.根据权利要求1的方法,其中所述第1IIS型限制酶选自MmeI、BpmI、BsgI、BspGI、Eco57I和GsuI。
14.根据权利要求1的方法,其中所述第2IIS型限制酶选自MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI、HgaI、LweI、SfaNI、AprI、BspMI、HphI、MboII、MnlI、BbsI、BciVI、BbvII、BpiI、BplI、BpuAI和FauI。
15.根据权利要求1的方法,其中所述第2IIS型限制酶选自MmeI、BpmI、BsgI、BspGI、Eco57I、GsuI、BsmFI、BcefI、FokI、BbvI、Bsp423I、Bst71I、RleAI、EciI、BseMII、BseRI和HgaI。
16.根据权利要求1的方法,其中所述第2IIS型限制酶选自MmeI、BpmI、BsgI、BspGI、Eco57I和GsuI。
17.根据权利要求1的方法,其中所述II型限制酶选自AfaI、RsaI、CviRI、HpyCH4V、HpyF44III、AciI、HhaI、Hinp1I、Hin6I、SciNI、DpnI和CfoI,所述第2IIS型限制酶选自MmeI、BsmFI、RleAI、HgaI、LweI、SfaNI、MnlI、BbsI、BbvII、BpiI、BplI、BpuAI和FauI。
18.根据权利要求1的方法,其中所述II型限制酶为HpyCH4V,所述第2IIS型限制酶为RleAI。
19.根据权利要求1的方法,其中所述II型限制酶为AfaI,所述第2IIS型限制酶为BsmFI。
20.根据权利要求1的方法,其中所述II型限制酶为RsaI,所述第2IIS型限制酶为BsmFI。
21.根据权利要求1的方法,其中所述II型限制酶为HinP1I,所述第2IIS型限制酶为HgaI。
22.根据权利要求1的方法,其中所述II型限制酶为Afa1,所述第2IIS型限制酶为Mme1。
23.根据权利要求1的方法,其中所述II型限制酶为Rsa1,所述第2IIS型限制酶为Mme1。
24.根据权利要求1的方法,其中表达基因鉴定用标记物的长度为6~25个碱基对。
25.根据权利要求1的方法,其中表达基因鉴定用标记物的长度为10~25个碱基对。
26.根据权利要求1的方法,其中表达基因鉴定用标记物的长度为10~16个碱基对。
27.接头X,其含有第1IIS型限制酶的识别序列,并且,在与经II型限制酶切断的cDNA片段的连接部分形成第2IIS型限制酶的识别序列。
28.根据权利要求27的接头X,其具有序列号12和13的碱基序列。
29.接头X-cDNA片段连接物,其含有经II型限制酶切断的cDNA片段和接头X,该接头X含有第1IIS型限制酶的识别序列,且在与前述II型限制酶的切断末端的连接部分形成第2IIS型限制酶的识别序列。
30.接头X-cDNA标记物-接头Y连接物,其在权利要求29所述的接头X-cDNA片段连接物的切断末端连接含有第1IIS型限制酶的识别序列的接头Y。
31.根据权利要求29的接头X-cDNA标记物-接头Y连接物,其中含有序列号18的碱基序列及其互补链。
32.通过权利要求1、2、3或4中任一方法所得的表达基因鉴定用cDNA标记物库。
33.基因表达分析方法,其特征在于,使权利要求31的鉴定用cDNA标记物库与固定有待检测核酸的检测装置相接触。
34.根据权利要求33的基因表达分析方法,其中该检测装置为DNA芯片,该DNA芯片在各点具有待鉴定的一组核酸。
35.表达基因分析方法,包括将按权利要求1~4中任一方法所得的表达基因鉴定用标记物互相连接的工序,以及确定该连接物的碱基序列的工序。
36.根据权利要求35的方法,该连接物含有3~200的表达基因鉴定用标记物。
37.根据权利要求35的方法,该连接物含有3~80的表达基因鉴定用标记物。
38.根据权利要求35的方法,该连接物含有16~40的表达基因鉴定用标记物。
39.根据权利要求36的表达基因定性分析方法,其中,确定该连接物的序列,由该序列确定各自的cDNA标记物的序列。
40.根据权利要求36的表达基因定量分析方法,其中,确定该连接物的序列,由该序列求出各自的cDNA标记物的序列和出现频率。
41.按权利要求1~4中任一方法所得的cDNA标记物的连接物,其中在该cDNA标记物之间没有间隔序列。
42.根据权利要求41的连接物,其中含有3~200个cDNA标记物。
43.根据权利要求41的连接物,其中含有3~80个该cDNA标记物。
44.根据权利要求41的连接物,其中含有16~40个该cDNA标记物。
45.按权利要求1~4中任一方法所得的cDNA标记物的连接物,其中在该cDNA标记物之间有间隔序列。
46.根据权利要求45的连接物,其中含有3~200个cDNA标记物。
47.根据权利要求45的连接物,其中含有3~80个该cDNA标记物。
48.根据权利要求45的连接物,其中含有16~40个该cDNA标记物。
49.制备表达基因鉴定用cDNA标记物的试剂盒,含有II型限制酶、第1IIS型限制酶、第2IIS型限制酶、接头X和接头Y,其中,接头X含有第1IIS型限制酶的识别序列且在与前述II型限制酶的切断末端的连接部分形成第2IIS型限制酶的识别序列,接头Y含有第1IIS型限制酶的识别序列。
50.根据权利要求49的试剂盒,其中还含有对接头X进行杂交的引物X和对接头Y进行杂交的引物Y。
全文摘要
本发明提供表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法。通过将1种II型限制酶、2种IIS型限制酶和2种接头X和Y组合,制备表达基因鉴定用cDNA标记物,其中,所述接头含有所述2种IIS型限制酶中一种酶的识别序列。将该cDNA标记物直接或实施连接工序等得到连接物,可以进行表达基因的分析。
文档编号C12Q1/68GK1496402SQ0280662
公开日2004年5月12日 申请日期2002年3月13日 优先权日2001年3月15日
发明者山本三毅夫, 山本直树, 广濑国孝, 酒井润, 孝, 树 申请人:吴羽化学工业株式会社, 山本三毅夫, 山本直树
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1