内标准基因

文档序号:29802828发布日期:2022-04-23 20:44阅读:448来源:国知局
内标准基因

1.本发明涉及一种内标准基因。特别是涉及一种在测定目标基因的表达量或表达水平时使用的内标准基因,目标基因存在于来自乳腺癌患者的生物试样(包括乳腺癌组织和正常乳腺组织)。


背景技术:

2.比较不同的2个以上生物试样并检测它们差异的方法之一有基因表达分析。基因表达分析是提取各个生物试样所含的rna,从其中测定特定基因的表达量或表达水平并进行对比的方法。在利用northern印迹杂交法、rt-pcr法、实时pcr法等进行基因表达分析的情况下,仅对比特定基因的表达量或表达水平是不够的,需要将它们的表达量或表达水平作为被称为内标准基因的基因的表达量或表达水平的相对值来进行对比。这是因为(1)很难准确地使要对比的生物试样量为相同量,假设即使使用相同量的生物试样,rna提取效率也会因生物试样而异;(2)即使rna的量为相同量的情况下,其中所含的mrna比率也因生物试样而异,等等,基于这些理由,一直以来需要与内标准基因的相对地比较。内标准基因中,传统上一直使用作为所谓的持家基因(house-keeping genes)而知的3-磷酸甘油醛脱氢酶(gapdh)基因、β-肌动蛋白(actb)基因等。这些持家基因表达恒定以维持细胞本身的生命活动,无论细胞或组织的类型如何,均以恒定水平表达,因此可以在假设即使经过实验处理也没有变化的情况下使用。
3.然而,逐渐已知事实上内标准基因的表达因细胞或组织种类而异,表达受实验条件、发育阶段等调节。实际上,在基因表达分析时,由于选择了会因其实验条件等使表达量发生变动的内标准基因,因此基因表达分析存在被错误解释的风险,很多研究者也指出了该担忧。现在已经在进行了以下内标准基因的探索:所述内标准基因与特定组织或实验条件无关而能够普遍有效用于基因表达分析的标准化(专利文献1)。但是这些研究多是利用现存的公共数据库中登记的基因表达数据来探索,此外公共数据库中由于不同的多个机构中混合了用不同平台所测定的数据,因此可以说简单地并排对比在实际上是困难的。另一方面,也有在特定实验中定制的封闭体系中想要探索合适的内标准基因的研究(专利文献2)。这些进行探索得到的内标准基因在大多数情况下,以在同一机构内用同一平台测定的数据为基础进行验证的结果而被选择,因此认为只要在该系统中使用则可靠性高。
4.乳腺癌具有多样性,被分类为具有各种特征的多种亚型。该亚型分类原本通过全面基因表达分析而完成的(非专利文献1)。因该分类,预后和药物敏感性不同,因此该分类成为药物疗法选择的指标。在实际的临床实践中,通常使用简单的免疫组织化学方法进行诊断,但也有很多病例与利用遗传表达分析的分类不同。因此,一直期望利用基因表达分析的高精度检查方法。此外,乳腺癌研究历史悠久,进行的很多研究也基于使用来自乳腺癌的细胞株的基因表达分析。支撑这些检查方法和研究的可靠性的是内标准基因。
5.现有技术文献
6.专利文献
7.专利文献1:日本专利第5934036号公报
8.专利文献2:日本特开2012-105614号公报
9.非专利文献
10.非专利文献3:perou cm,sorlie t,eisen mb,et al.molecular portraits of human breast tumours.nature 406:747-752,2000


技术实现要素:

11.发明所要解决的问题
12.本发明的目的在于提供一种在基因表达分析中的新型内标准基因和利用该内标准基因的基因表达分析方法。特别是,提供一种在来自乳腺癌的试样的对比分析时,能够作为内标准基因的基因和利用该基因的来自乳腺癌试样的基因表达分析方法。
13.解决问题的技术方案
14.为了解决上述问题,本发明人从乳腺癌组织(453个病例)和正常乳腺组织(17个病例)合计470个病例的各样本中获得了14,400种基因的基因表达谱,成功筛选出在来自乳腺癌的生物体组织(包括正常乳腺组织)的基因表达分析时的内标准基因,从而完成了本发明。
15.即,本发明包括以下方式:
16.本发明在一个方式中,
17.〔1〕涉及一种基因表达分析方法,其是被测试样的基因表达分析方法,该方法包括以下步骤:
18.(a)测定所需基因表达水平的步骤;
19.(b)测定内标准基因的步骤,所述内标准基因是选自由abcf3、fbxw5、mllt1、fam234a、pitpnm1、wdr1、ndufs7和ap2a1组成的组中的至少一种;
20.(c)利用所述内标准基因表达水平对所述所需基因表达水平进行标准化的步骤。
21.此处,本发明的基因表达分析方法在一个实施方式中,
22.〔2〕根据上述〔1〕所述的基因表达分析方法,其特征在于,
23.所述被测试样是来自乳腺癌患者的试样。
24.另外,本发明的基因分析方法在一个实施方式中,
25.〔3〕根据上述〔2〕所述的基因表达分析方法,其特征在于,
26.所述所需基因是用于对乳腺癌亚型进行鉴别或分类的基因。
27.另外,本发明在其他方式中,
28.〔4〕涉及一种用于基因表达分析的内标准基因,其由选自由fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1组成的组中的至少一种基因组成。
29.此处,本发明的内标准基因在一个实施方式中,
30.〔5〕根据上述〔4〕所述的内标准基因,其特征在于,
31.所述的内标准基因是用于来自乳腺癌患者的被测试样中的基因表达分析的内标准基因。
32.另外,本发明的内标准基因在一个实施方式中,
33.〔6〕根据上述〔5〕所述的内标准基因,其特征在于,
34.所述来自乳腺癌患者的被测试样中的基因表达分析是用于鉴别乳腺癌亚型的基因表达分析。
35.另外,本发明在其他方式中,
36.〔7〕涉及一种内标准基因的表达分析用组合物,其包括上述〔4〕所述的测定内标准基因表达水平的工具。
37.此处,本发明的内标准基因的表达分析用组合物在一个实施方式中,
38.〔8〕涉及一种用于对乳腺癌进行鉴别或分类的内标准基因的基因表达分析用组合物,其包括上述〔5〕或〔6〕所述的测定内标准基因表达水平的工具。
39.此处,本发明的用于对乳腺癌进行鉴别或分类的内标准基因的基因表达分析用组合物在一个实施方式中,
40.〔9〕根据上述〔8〕所述的用于对乳腺癌进行鉴别或分类的内标准基因的基因表达分析用组合物,其特征在于,
41.测定所述基因表达水平的工具是选自由针对所述基因的引物、探针、抗体、或它们的标记物组成的组中的至少一种工具。
42.另外,本发明的用于对乳腺癌进行鉴别或分类的内标准基因的基因表达分析用组合物在一个实施方式中,
43.〔10〕根据上述〔8〕或〔9〕所述的用于对乳腺癌进行鉴别或分类的内标准基因的基因表达分析用组合物,其特征在于,
44.所述基因表达分析用组合物用于pcr、微阵列或rna测序。
45.发明效果
46.本发明的内标准基因提供一种可用于基因表达分析的新型内标准基因。此外,能够提供一种利用该内标准基因的基因表达分析方法。另外,本发明的内标准基因在来自乳腺癌患者的试样中不受乳腺癌亚型影响,表达水平的变动幅度窄,并且与人通用参考物的表达水平相比,表达水平的差异相对很小。因此,本发明的内标准基因特别是在来自乳腺癌的试样的基因表达分析中很有用。
附图说明
47.图1是表示在下述实施例3中测定的470个样品的基因表达谱中4种基因(abcf3、mllt1、fbxw5、fam234a)的表达水平分布的图表。
48.图2是表示在下述实施例3中测定的470个样品的基因表达谱中4种基因(pitpnm1、ndufs7、wdr1、ap2a1)的表达水平分布的图表。
49.图3是表示在下述实施例3中测定的470个样品的基因表达谱中gapdh基因表达水平分布的图表。
50.图4表示对于使用下述实施例4所示的包括内标准基因在内的207种鉴别标志物基因组合的470个病例,进行利用欧几里得距离的组平均法的聚类分析的结果热图。
具体实施方式
51.1.内标准基因
52.1-1.概要
53.本发明的第一个方式是可用于基因表达分析的内标准基因。
54.本发明的内标准基因由选自由fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1组成的组中的至少一种基因组成。
55.1-2.定义
[0056]“内标准基因”是指用于在基因表达分析中相对表示特定基因量的标准化的基因。如上所述,本发明的内标准基因是fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1这8种基因。下表中示出了该内标准基因的基因简称(symbol)、基因名称(name)和在ncbi数据库中登记的参考序列编号(reference sequence id)(refseq id)。
[0057]
[表1]
[0058][0059]
本发明的内标准基因(fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1)可以确定为分别具有seq id no:1~seq id no:8所示的碱基序列的基因(或多核苷酸)。
[0060]
本发明的内标准基因在一个实施方式中,是选自由以下基因组成的组中的至少一种基因:由seq id no:1所示的碱基序列组成的基因、由seq id no:2所示的碱基序列组成的基因、由seq id no:3所示的碱基序列组成的基因、由seq id no:4所示的碱基序列组成的基因、由seq id no:5所示的碱基序列组成的基因、由seq id no:6所示的碱基序列组成的基因、由seq id no:7所示的碱基序列组成的基因和由seq id no:8所示的碱基序列组成的基因。
[0061]
本说明书中,fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1基因中也包含由含有编码同一氨基酸序列的简并密码子的碱基序列组成的基因、各基因的各种变异体(变体)和点突变基因等变异基因和黑猩猩等其他物种生物的直系同源基因等。作为这样的基因,包含由碱基序列组成的多核苷酸且由保持对象基因功能的多核苷酸组成的基因,所述碱基序列与seq id no:1~seq id no:8所确定的碱基序列具有70%以上(优选为75%以上、80%以上、85%以上,更优选为90%以上、95%以上、96%以上、97%以上、98%以上或99%以上)的碱基一致性。
[0062]
例如,在一个实施方式中,本发明中使用的abcf3基因可以确定为由seq id no:1所示的碱基序列组成的基因(或多核苷酸),这时abcf3基因中包含由以下碱基序列组成的多核苷酸且由保持abcf3基因功能的多核苷酸组成的基因,所述碱基序列与由seq id no:1所示的碱基序列具有70%以上(优选为75%以上、80%以上、85%以上,更优选为90%以上、95%以上、96%以上、97%以上、98%以上或99%以上)的碱基一致性。予以说明,本说明书中“碱基一致性”是指将两个碱基序列进行排列(比对),并根据需要导入空位(gap),使两个碱基序列的碱基一致程度达到最高时,要对比的核苷酸的碱基序列中的相同碱基数相对于基因的碱基总数的比例(%)。
[0063]
另外,本说明书中在称为由特定的seq id no.所示的碱基序列组成的基因时,也包含在严格条件下与以下碱基序列组成的核苷酸片段进行杂交的核苷酸且保持对象基因功能的多核苷酸,所述碱基序列与所述基因的部分碱基序列互补。“严格条件”是指不形成非特异性杂交的条件。通常盐浓度越低且温度越高,则越是高严格条件。低严格条件是指例如在杂交后的洗涤中,以1
×
ssc、0.1%sds、37℃左右进行洗涤的条件,更严格的是以0.5
×
ssc、0.1%sds、42℃~50℃左右进行洗涤的条件。更加严格的高严格条件是指在杂交后的洗涤中,例如在50℃~70℃、55℃~68℃或65℃~68℃下,用0.1
×
ssc和0.1%sds进行洗涤的条件。通常优选高严格条件。上述ssc、sds与温度的组合仅为例示。除了上述ssc、sds和温度之外,本领域技术人员也可以适当地组合探针浓度、探针碱基长度、杂交时间等其他条件来确定杂交的严格程度。此外,在严格条件下与由以下碱基序列组成的核苷酸片段进行杂交的多核苷酸,所述碱基序列与由特定的seq id no.所示的碱基序列组成的基因的部分碱基序列互补,在优选的实施方式中,所述多核苷酸是由以下碱基序列组成的多核苷酸,所述碱基序列与由该特定的seq id no.所示的碱基序列具有70%以上(优选为75%以上、80%以上、85%以上,更优选为90%以上、95%以上、96%以上、97%以上、98%以上或99%以上)的碱基一致性。
[0064]
本说明书中,称为“内标准基因”时,除了由dna序列确定的基因之外,还包括基于该基因转录产物(mrna、cdna)等的基因产物和翻译产物(蛋白质)。
[0065]
本发明的内标准基因可以选择使用至少一个,也可以组合使用两个以上的内标准基因。在组合两个以上的内标准基因的情况下,可以从由fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1组成的组中选择内标准基因,也可以组合使用上述组之外的内标准基因。
[0066]
作为由fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1组成的组之外的内标准基因,可举出市售的通用参考物、公知的持家基因(例如,3-磷酸甘油醛脱氢酶(gapdh)基因、β-肌动蛋白(actb)基因)或它们的组合。此外,本领域技术人员可以通过试验来选择适于各基因表达分析条件的内标准基因,也可以将该选择的内标准基因与本发明的内标准基因一起使用。
[0067]
另外,本发明的内标准基因在一个实施方式中,是经分离的基因(或基因产物)。本说明书中“经分离”在广义上指从生物体分离的基因(或基因产物),在狭义上包括基因(或基因产物)中实质上去除天然相关的因子而成的。
[0068]
本发明的内标准基因即使在来自健康者和患有乳腺癌任一亚型的患者的被测试样中,基因表达水平的变动也很小。
[0069]
因此,本发明的内标准基因在一个实施方式中,可用于来自乳腺癌患者的被测试样中的基因表达分析。此处,来自乳腺癌患者的被测试样中的基因表达分析是指例如包括用于鉴别是否患有乳腺癌的基因表达分析、用于对乳腺癌亚型进行鉴别或分类的基因表达分析。此处,“鉴别或分类”是指对于来自有乳腺癌病史的被测者的试样,进行鉴别存在乳腺癌,或者鉴别存在乳腺癌可能性的高低,或者对乳腺癌属于何种亚型进行鉴别或分类,或者对属于何种组织学分型可能性的高低进行鉴别或分类。
[0070]
通过在来自乳腺癌患者的被测试样中的基因表达分析中使用本发明的内标准基因,与公知的内标准基因(例如,gapdh)等相比,能够提供更准确的基因表达的相对值。
[0071]
本说明书中“被测试样”是指用于基因表达分析的试样。可用于本发明的被测试样、只要是表达本发明的内标准基因的试样,就没有特别限制。作为被测试样的来源动物,例如可举出人、猴、黑猩猩,优选人。此外,“试样”是指例如可举出组织、细胞、体液(血液(包括血清、血浆和间质液)、脊髓液(脑脊液)、尿、淋巴液、消化液、腹水、胸水、神经根周围液、各组织或细胞的提取液等)或腹腔冲洗液等从生物体采集的试样、培养细胞或它们的纯化物和制备物。
[0072]
予以说明,在将本发明的内标准基因用于利用基因表达分析的乳腺癌鉴别的情况下,“被测试样”是从人的受试者采集的试样,优选包含乳腺癌组织或疑似乳腺癌组织的组织或其一部分。此处提及的“组织”和“细胞”可以是来自受试者的任一部位,优选为通过活检采集或经手术切除的样本,更具体地是乳腺组织或乳腺细胞。特别优选为通过活检采集的乳腺癌细胞或疑似患有乳腺癌的乳腺癌组织或乳腺癌细胞。予以说明,这些组织或细胞可以是经福尔马林固定后包埋于石蜡中而形成的(ffpe:formalin-fixed paraffin embedded,福尔马林固定石蜡包埋)。
[0073]
予以说明,“乳腺癌”是指通常从乳腺管和乳腺小叶的乳腺管内组织发生的癌。乳腺癌包括癌和肉瘤,是指乳腺组织的所有恶性肿瘤。此外,乳腺癌是不均匀的疾病,被分类为具有各种特征的多种亚型。
[0074]
乳腺癌亚型主要分类为11种类型:luminal a、luminal b(her2阳性)、luminal b(her2阴性)、her2阳性、her2阳性样、三阴性、叶状肿瘤、扁平上皮癌、不能判定、正常样和正常。
[0075]
此处,“luminal a”是指在临床病理学上全部满足以下各项的病例:1)er阳性且pgr阴性;2)her2阴性;3)ki67为低值;4)mgea(multi-gene-expression assay,多基因表达检测)为复发风险低,但在本说明书中,也包括以下病例,所述病例的基因表达谱与很多在临床病理学上被诊断为luminal a的病例相似。
[0076]
予以说明,临床病理学的亚型诊断主要是通过免疫组织化学染色确认er、pgr、her2、ki67的表达而做出的,但不限于此,也包括通过基因表达分析得到确认的。
[0077]“luminal b(her2阳性)”是指在临床病理学上为er阳性且her2阳性的病例,但在本说明书中,也包括以下病例,所述病例的基因表达谱与很多在临床病理学上被诊断为luminal b(her2阳性)的病例相似。
[0078]“luminal b(her2阴性)”是指在临床病理学上符合以下任一项的病例:1)er阳性且her2阴性,并且2)ki67为高值;3)pgr为阴性或低值;4)mgea为复发风险高,但在本说明书中,也包括在luminal a中细胞周期相关基因群表达高于其他病例的病例。
[0079]“her2阳性”是指在临床病理学上为her2阳性,er阴性且pgr阴性的病例,但在本说明书中,也包括以下病例,所述病例的基因表达谱与很多在临床病理学上被诊断为her2阳性的病例相似。
[0080]“her2阳性样”是指her2为阴性,但病例的其他基因表达谱与很多在临床病理学上被诊断为her2阳性的病例相似。
[0081]“三阴性”是指在临床病理学上为er阴性、pgr阴性和her2阴性的病例,但在本说明书中,也包括以下病例,所述病例的基因表达谱与很多在临床病理学上被诊断为三阴性的病例相似。
[0082]“扁平上皮癌”是指称为存在于表皮的表皮角化细胞的细胞发生恶性增殖而形成的癌,在本说明书中,是指乳腺原发的癌。
[0083]“叶状肿瘤”是指在临床病理学上与乳腺纤维腺瘤相似,但相对于乳腺的乳腺小叶内的结缔组织增生的纤维肿瘤,纤维性间质和乳腺管上皮快速增生而形成的。
[0084]“不能判定”是指基因表达谱与以下任一项均不相似:luminal a、luminal b(her2阳性)、luminal b(her2阴性)、her2阳性、her2阳性样、三阴性、正常样、正常、扁平上皮癌和叶状肿瘤。
[0085]“正常样”是指在临床病理学上被诊断为“癌”,但病例的基因表达谱与正常乳腺组织相似。
[0086]“正常”是指正常组织。
[0087]
本发明的内标准基因可适用于基因表达分析,所述基因表达分析用于鉴别上述中所列举的乳腺癌亚型。
[0088]
2.基因表达分析用组合物
[0089]
2-1.概要
[0090]
本发明的其他方式涉及一种内标准基因的基因表达分析用组合物,所述组合物包含测定内标准基因表达水平的工具。
[0091]
2-2.定义
[0092]
本说明书中“基因表达水平”是指基因转录产物量、表达强度或表达频率。此处提及的基因表达水平并不限于基因的野生型基因表达水平,也可包括点突变基因等变异基因表达水平。此外,在显示基因表达的转录产物中,也可包括如剪接变异体这样的异型转录产物(变异体)及它们的片段。这是因为即便是基于变异基因、转录产物或其片段的信息,也能够作为本发明的内标准基因而被利用。基因表达水平可以通过测定基因转录产物即mrna量、cdna量等作为测定值而得到。予以说明,在优选的实施方式中,基因表达水平的测定是mrna的测定。
[0093]
本说明书中“测定表达水平的工具”是指能够与基因转录产物结合的化合物,是能够显示该转录产物是否存在和转录产物量的化合物。在一个实施方式中,测定表达水平的工具是选自由针对作为测定对象的基因的引物、探针或它们的标记物组成的组中的至少一种化合物。
[0094]
可用于本发明的引物或探针通常由dna、rna等天然核酸构成。特别优选稳定性高、合成容易且廉价的dna。此外,根据需要也可以将天然核酸与化学修饰核酸、假核酸组合。化学修饰核酸、假核酸中,例如可举出pna(peptide nucleic acid,肽核酸)、lna(locked nucleic acid,锁核酸;注册商标)、膦酸甲酯型dna、硫代磷酸酯型dna、2'-o-甲基型rna等。此外,引物和探针可以使用荧光物质和/或淬灭物质;或放射性同位素(例如,32p、33p、35s)等标记物质;或生物素或(链霉)抗生物素蛋白;或磁珠等修饰物质作为标记或修饰的标记物来使用。标记物质没有限定,可以使用市售品。例如,如果是荧光物质,则可以使用fitc、texas、cy3、cy5、cy7、cyanine3、cyanine5、cyanine7、fam、hex、vic、荧光胺及其衍生物和罗丹明及其衍生物等。如果是淬灭物质,则可以使用amra、dabcyl、bhq-1、bhq-2或bhq-3等。引物和探针中标记物质的标记位置可以根据其修饰物质的特性、使用目的而适当确定即可。一般而言,大多在5’或3’末端部修饰。此外,一个引物和探针分子也可以用一个以上的标记
物质标记。这些物质对核苷酸的标记可以用公知的方法来进行。
[0095]
用作引物或探针的核苷酸可以是由测定对象的基因的正义链或反义链组成的核苷酸中的任一种。在优选的实施方式中,用作引物或探针的核苷酸是用于pcr、微阵列或rna测序的引物或探针。
[0096]
引物或探针的碱基长度没有特别限定,只要能够测定目的基因表达水平即可。探针的情况下,如果在后述的杂交法中使用,则是至少10个碱基长度以上至基因全长,优选为15个碱基长度以上至基因全长,更优选为30个碱基长度以上至基因全长,进一步优选为50个碱基长度以上至基因全长,如果在微阵列中使用,则是10~200个碱基长度,优选为20~150个碱基长度,更优选为30~100个碱基长度。通常探针越长,则杂交效率越高,灵敏度越高。另一方面,探针越短,则灵敏度越低,但特异性反而提高。另一方面,引物的情况下,正向引物和反向引物分别可为10~50bp,优选为15~30bp即可。
[0097]
在本发明的内标准基因表达水平是通过核酸扩增法等进行测定的情况下,不限定于以下,但例如可以使用针对fbxw5、pitpnm1、mllt1、wdr1、abcf3、ndufs7、fam234a和ap2a1分别由seq id no:9~seq id no:16表示的探针(表2)。各基因表达分析的方法中,所使用的引物或探针的制备对于本领域技术人员而言是已知的,例如,可以按照前述的格林和萨姆布鲁克编著的《分子克隆实验指南》(2012)(green&sambrook,molecular cloning(2012))中所述的方法进行制备。此外,也可以向核酸合成受委托制造商提供序列信息来进行委托制造。
[0098]
[表2]
[0099][0100]
另外,在测定表达水平的工具是如上述的探针的情况下,也可以以将各探针固定在基板上的dna微阵列或dna微芯片的状态来提供。固定各探针的基板材质没有限定,通常可使用玻璃板、石英板、硅晶片等。基板大小例如可举出3.5mm
×
5.5mm、18mm
×
18mm、22mm
×
75mm等,但这可以根据探针的光点数和其光点的大小等进行各种设定。探针的每个光点通常使用0.1μg~0.5μg的核苷酸。核苷酸的固定方法中可举出以下方法:利用核苷酸的电荷将其将其静电键合于经聚赖氨酸、聚-l-赖氨酸、聚乙烯亚胺、聚烷基胺等聚阳离子表面处理的固相载体的方法、使引入了氨基、醛基、巯基(sh基)、生物素等官能团的核苷酸通过共价结合于引入了氨基、醛基、环氧基等官能团的固相表面的方法。
[0101]
另外,本发明的内标准基因的表达分析用组合物也可以作为试剂盒来提供,该试
剂盒包含:基因的表达的测定或检测所需的其他试剂(例如,针对其他基因的探针、引物或它们的标记物、缓冲液等)、仪器(培养皿等)、用于乳腺癌鉴别的说明书。
[0102]
3.使用内标准基因的遗传表达分析方法
[0103]
3-1.概要
[0104]
本发明的其他方式涉及一种使用本发明内标准基因的被测试样的基因表达分析方法,该基因表达分析方法包括以下步骤:
[0105]
(a)测定所需基因表达水平的步骤、
[0106]
(b)测定内标准基因的步骤,所述内标准基因是选自由abcf3、fbxw5、mllt1、fam234a、pitpnm1、wdr1、ndufs7和ap2a1组成的组中的至少一种、
[0107]
(c)利用上述内标准基因表达水平对上述所需基因表达水平进行标准化的步骤。
[0108]
3-2.定义
[0109]
本发明的基因表达分析方法包括(a)测定所需基因表达水平的步骤。
[0110]“基因表达水平的测定步骤”是测定被测试样中基因表达水平并获得其测定值的步骤。
[0111]
予以说明,基因表达水平的测定优选测定每单位量的表达水平。本说明书中“单位量”是指可任意规定的试样量。例如,容量(用μl、ml表示)或重量(用μg、mg、g表示)均相符该定义。单位量没有特别指定,但在一系列的基因表达分析方法中所测定的单位量优选为固定不变。
[0112]
本说明书中“所需基因”是指使用本发明的内标准基因来要研究基因表达水平的相对值的基因。所需基因只要是在与表达本发明的内标准基因的细胞为相同的细胞内表达的基因,就没有特别限制。如果是本领域技术人员,则可以根据基因表达分析的目的而适当选择所需基因。予以说明,在一个实施方式中,所需基因是用于鉴别乳腺癌的基因。用于鉴别乳腺癌的基因是指在乳腺癌中表达水平发生特异性变动的基因。因此,在该实施方式中,所需基因可以采用已知在乳腺癌中显示表达水平发生特异性变动的基因。此外,在更优选的实施方式中,所需基因是用于对乳腺癌亚型进行鉴别或分类的基因。
[0113]
作为用于对乳腺癌亚型进行鉴别或分类的基因,并不限制于以下,例如可举出:abcf3基因、fbxw5基因、mllt1基因、fam234a基因、pitpnm1基因、wdr1基因、ndufs7基因、ap2a1基因、krtdap基因、serpinb3基因、sprr2a基因、sprr1b基因、klk13基因、krt1基因、lgals7基因、pi3基因、serpinh1基因、snai2基因、gpr173基因、has2基因、pth1r基因、page5基因、itln1基因、sh3pxd2b基因、tap1基因、fn1基因、cthrc1基因、mmp9基因、adipoq基因、cd36基因、g0s2基因、gpd1基因、lep基因、lipe基因、plin1基因、sdpr基因、lifr基因、tgfbr3基因、capn6基因、pigr基因、krt15基因、krt5基因、krt14基因、dst基因、wif1基因、synm基因、kit基因、gabrp基因、sfrp1基因、elf5基因、mia基因、mmp7基因、fdcsp基因、crabp1基因、prom1基因、krt23基因、s100a1基因、wipf3基因、cyyr1基因、tfcp2l1基因、dsc2基因、mfge8基因、klk7基因、klk5基因、dsg3基因、ttyh1基因、scrg1基因、s100b基因、etv6基因、ogfrl1基因、meltf基因、hormad1基因、pkp1基因、foxc1基因、itgb8基因、vgll1基因、art3基因、en1基因、sphk1基因、trim47基因、col27a1基因、rflna基因、rasd2基因、a2ml1基因、marco基因、tspyl5基因、tm4sf1基因、fabp5基因、spib基因、bcl2a1基因、mzb1基因、kcnk5基因、lmo4基因、rnf150基因、lyz基因、c21orf58基因、atp13a5基因、nudt8基
因、hsd17b2基因、abca12基因、enpp3基因、wnt5a基因、mpp3基因、vps13d基因、pxmp4基因、ggt1基因、trpv6基因、c2orf54基因、cldn8基因、lbp基因、srd5a3基因、papss2基因、tmem45b基因、clca2基因、fasn基因、mphosph6基因、nxph4基因、hpgd基因、kynu基因、glyatl2基因、kmo基因、srpk3基因、thrsp基因、pla2g2a基因、tfap2b基因、fabp7基因、slpi基因、serhl2基因、s100a9基因、krt7基因、tmem86a基因、mboat1基因、pgap3基因、stard3基因、erbb2基因、mien1基因、grb7基因、gsdmb基因、ormdl3基因、med24基因、msl1基因、casc3基因、wipf2基因、thsd4基因、mapt基因、lonrf2基因、tceal3基因、dbndd2基因、fgd3基因、gfra1基因、pard6b基因、stc2基因、slc39a6基因、enpp5基因、znf703基因、evl基因、tbc1d9基因、chad基因、greb1基因、hpn基因、il6st基因、fam198b基因、ca12基因、kcne4基因、nat1基因、cyp2b6(cyp2b7p)基因、armt1基因、maged2基因、celsr1基因、inpp5j基因、padi2基因、ppp1r1b基因、esr1基因、mlph基因、foxa1基因、xbp1基因、gata3基因、zg16b基因、kiaa0040基因、tmc4基因、agr2基因、tff3基因、scgb2a2基因、mucl1基因、ddx11基因、atad2基因、ggh基因、cdca3基因、ccna2基因、ccnb2基因、anln基因、ube2c基因、cks2基因、mki67基因、foxm1基因、ube2t基因、mcm4基因、ckap2基因、hn1基因、kpna2基因、h2afx基因、h2afz基因、cdk1基因、pttg1基因、cdc20基因、mybl2基因和rrm2基因。
[0114]
基因表达的测定可以通过转录产物的测定来实施。下面,对基因转录产物的测定方法进行具体地说明。予以说明,基因转录产物的测定方法是公知的。下面,参照或引用并记载日本特开2016-13081号公报中关于基因转录产物或翻译产物的测定方法的记载。此外,下面说明代表性基因转录产物的测定方法,但并不限于这些方法,可以使用公知的测定方法。
[0115]
予以说明,鉴别基因转录产物的测定可以是mrna量的测定,此外也可以是由mrna逆转录而得到的cdna量的测定。通常基因转录产物的测定中可采用以下方法:引物或探针中使用含有上述基因的碱基序列全部或一部分的核苷酸,以绝对值或相对值来测定基因表达水平。
[0116]
基因转录产物的测定只要是公知的核酸检测/定量方法即可,没有特别限定。例如可举出杂交法、核酸扩增法或rna测序(rna-seq)分析法。
[0117]“杂交法”是指将具有与待检测的靶核酸的碱基序列的全部或一部分互补的碱基序列的核酸片段用作探针,利用该核酸与该探针间的碱基配,从而对靶核酸或其片段进行检测并定量的方法。本方式中构成鉴别标志物的各基因的mrna或cdna或其片段符合靶核酸。通常,杂交法为了排除非特异性杂交的目标之外的核酸而优选在严格条件下进行。更优选前述的低盐浓度且高温下的高严格条件。杂交法中,已知有检测工具不同的几种方法,例如,优选northern印迹杂交法(northern杂交法)、微阵列法、表面等离子共振法或石英晶体微天平法。
[0118]“northern印迹杂交法”是分析基因表达的最常用的方法,将由试样制备的总rna或mrna在变性条件下通过利用琼脂糖凝胶或聚丙烯酰胺凝胶等的电泳进行分离,转印(印迹)到膜上,然后具有对靶rna为特异性碱基序列的探针来检测靶核酸的方法。也可以通过用荧光色素或放射性同位素这样的适当标志物标记探针,例如使用chemilumi(化学发光)成像分析装置(例如,lightcapture,atto株式会社)、闪烁计数器、成像分析仪(例如,fujifilm株式会社,bas系列)等测定装置来定量靶核酸。northern印迹杂交法在本领域是
公知的著名技术,例如,可以参照前述的格林和萨姆布鲁克(2012)(green,m.r.and sambrook,j.(2012))。
[0119]“微阵列法”是将与靶核酸的碱基序列的全部或一部分互补的核酸片段作为探针,并以高密度小斑点状配置在基板上,使含靶核酸试样与固相化的微阵列或微芯片反应,利用荧光等对与基板斑点杂交的核酸进行检测的方法。靶核酸可以是如mrna这样的rna或如cdna这样的dna中的任一种。对于检测、定量,可以通过利用微孔板读数仪或扫描仪对基于靶核酸等杂交的荧光等进行检测/测定来实现。可以通过测定的荧光强度来确定它们相对于mrna量或cdna量或参考mrna(reference rna)的存在比。微阵列法在本领域中也是公知的技术。例如,可以参照dna微阵列法(《dna微阵列与最新pcr法》(日语原文:《dna
マイクロアレイと
最新pcr法》)(2000年)村松正明、那波宏之主编,秀润社出版)等。
[0120]“表面等离子共振(spr:surface plasmon resonance)法”是利用表面等离子共振现象以极高灵敏度对金属薄膜表面上的吸附物进行检测并定量方法,所述表面等离子共振现象是指使向金属薄膜照射的激光的入射角度发生变化时,在特定的入射角度(共振角)反射光强度明显衰减的现象。在本发明中,例如,将具有与靶核酸的碱基序列互补的序列的探针固定于金属薄膜表面,并对其他的金属薄膜表面部分进行封闭处理,然后通过使从受试体或健康者或健康者组采集的试样在金属薄膜表面流通,使形成靶核酸与探针的碱基配对,从而由样品流通前后测定值的差异来对靶核酸进行检测并定量。利用表面等离子共振法的检测、定量例如可以利用biacore公司销售的spr传感器来进行。本技术在本领域中是公知的。例如,可以参照永田和弘、和半田宏的《生物体物质相互作用的实时分析实验法》(日语原文:《生体物質相互作用
のリアルタイム
解析実験法》),springer-verlag东京出版社,东京,2000。
[0121]“石英晶体微天平(qcm:quarts crystal microbalance)法”是指是利用当物质吸附在安装在石英晶体谐振器的电极表面时,石英晶体谐振器的共振频率会随物质的质量而降低的现象,从而通过共振频率的变化量定量地捕获极微量的吸附物的质量测定法。利用本方法的检测与定量也与spr法同样地利用市售的qcm传感器,例如,可以通过固定于电极表面的探针与从受试体或健康者或健康者组采集的试样中的靶核酸的碱基配对,从而对靶核酸进行检测并定量,所述探针具有与靶核酸的碱基序列互补的序列。本技术在本领域是公知的,例如,可以参照christopher j.et al.,2005,self-assembled monolayers of a form of nanotechnology,chemical review,105:1103-1169和森泉丰荣,中本高道,(1997)传感器工学(日语原文:
センサ
工学),昭晃堂出版社。
[0122]“核酸扩增法”是指使用正向/反向引物,利用核酸核酸聚合酶对靶核酸的特定区域进行扩增的方法。例如可举出pcr法(包括rt-pcr法)、nasba法、ican法、lamp(注册商标)法(包括rt-lamp法)。优选为pcr法。使用核酸扩增法的基因转录产物的测定方法中可使用如实时rt-pcr法这样的定量的核酸扩增法。实时rt-pcr法中已知还有使用sybr(注册商标)green等的嵌入剂法、taqman(注册商标)探针法、数字pcr法和循环探针法,任一方法均可。这些方法都是公知的方法,也记载于该技术领域的适当的操作步骤说明书中,可以参照这些说明。
[0123]“rna测序(rna-seq)分析法”是指通过逆转录反应使rna转换成cdna,并将cdna使用下一代测序仪(例如有hiseq系列(illumina公司)或ion proton系统(thermo fisher公
司),但不限于这些)对读数进行记数来测定基因的表达量的工具。这些方法都是公知的方法,也记载于该技术领域的适当的操作步骤说明书中,可以参照这些说明。
[0124]
对于用实时rt-pcr法对基因转录产物进行定量的方法,下面可举出一例进行简单的说明。实时rt-pcr法是将由试样中的mrna通过逆转录反应制备的cdna作为模板,在pcr扩增产物被特异性荧光标记的反应体系中,使用温度循环装置进行pcr的核酸定量方法,所述温度循环装置具备检测来自扩增产物的荧光强度的功能。实时监测反应中的靶核酸扩增产物量,并用计算机对其结果进行回归分析。作为标记扩增产物的方法,有使用经荧光标记的探针的方法(例如,taqman(注册商标)pcr法)和使用与双链dna特异性结合的试剂的嵌入剂方法。taqman(注册商标)pcr法使用5’末端部被淬灭物质且3’末端部被荧光色素修饰的探针。通常5’末端部的淬灭物质抑制3’末端部的荧光色素,但当进行pcr时,则taq核酸聚合酶所具有的5
’→3’
核酸外切酶活性将该探针分解,由此解除了淬灭物质的抑制,所以发出荧光。其荧光量反映扩增产物的量。由于扩增产物达到检测限时的循环次数(ct)和初始模板量存在逆相关的关系,所以在实时测定法中通过测定ct来定量初始模板量。使用数阶段的已知量的模板测定ct,绘制校正曲线,则能够计算出未知样本的初始模板量的绝对值。rt-pcr中使用的逆转录酶例如可以使用m-mlv rtase、exscript rtase(takara公司)、super script ii rt(赛默飞世尔科技公司)等。
[0125]
实时pcr的反应条件通常基于公知的pcr法,由于根据要扩增核酸片段的碱基长度和模板用核酸的量,以及使用的引物的碱基长度和tm值、所使用的核酸核酸聚合酶的最适反应温度和最适ph等而发生变动,因此可随这些条件进行适当设定。作为一例,通常变性反应在94℃~95℃进行5秒~5分钟、退火反应在50℃~70℃进行10秒~1分钟、延伸反应在68℃~72℃进行30秒~3分钟,将其作为1个循环,可以重复15~40个循环程度再进行延伸反应。在使用上述厂商市售的试剂盒的情况下,原则上按照试剂盒附带的操作步骤说明书进行即可。
[0126]
实时pcr中使用的核酸核酸聚合酶是dna核酸聚合酶,特别是耐热性dna核酸聚合酶。这样的核酸核酸聚合酶有各种各样的市售品,也可以利用这些市售品。例如可举出上述applied biosystems taqman microrna检测试剂盒(赛默飞世尔科技公司)中附带的taq dna核酸聚合酶。特别是这样的市售的试剂盒中附带有使附带的dna核酸聚合酶活性的活性达到最佳的缓冲液等,因此很有用。
[0127]
另外,本发明的基因表达分析方法除了上述步骤(a)之外,还包括(b)测定内标准基因的步骤,所述内标准基因是选自由abcf3、fbxw5、mllt1、fam234a、pitpnm1、wdr1、ndufs7和ap2a1组成的组中的至少一种。
[0128]
步骤(a)和步骤(b)可以同时进行或前后分别进行任一步骤。优选步骤(a)和(b)同时进行的实施方式。
[0129]
本发明的基因表达分析方法在步骤(a)和步骤(b)之后,包括(c)利用上述内标准基因表达水平对上述所需基因表达水平进行标准化的步骤。
[0130]
本说明书中,“标准化”是指能够将在特定条件下测得的被测试样中所需基因表达水平与在不同条件下测得的被测试样中所需基因表达水平进行对比。更具体地是指通过将在特定条件下测得的相对于被测试样的所需基因表达水平与在相同条件下测得的相对于被测试样的内标准基因表达水平进行对比,由此将该被测试样中所需基因表达水平计算为
相对于该内标准基因表达水平的相对值。
[0131]
在标准化步骤中,将所需基因表达水平计算为相对值的方法,只要能够与在不同条件下测得的被测试样中所需基因表达水平进行对比,就没有限制。例如,可以通过将在特定条件下测得的相对于被测试样的所需基因表达水平值除以在相同条件下测得的相对于被测试样的内标准基因表达水平值,由此以相对值来表示。
[0132]
通过上述步骤(c)进行标准化的所需基因表达水平可以在不同的条件下测定,并且可以与通过同样的方法进行标准化的基因表达水平进行相对地进行对比。
[0133]
实施例
[0134]
(实施例1.rna制备)
[0135]
外科手术采集的乳腺癌组织使用isogen(株式会社日本基因,日本东京)提取了总rna。此外,从海外经营者购入正常乳腺组织和一部分乳腺癌组织,同样地提取了总rna。可获得125μg以上总rna的样品接着使用micropoly(a)purist试剂盒(ambion公司,美国得克萨斯州首府奥斯汀)对poly(a)+rna进行纯化。
[0136]
人通用参考rna使用了人通用参考rna i型(human universal reference rna type i)(microdiagnostic公司,日本东京)或人通用参考rna ii型(human universal reference rna type ii)(microdiagnostic公司)。
[0137]
(实施例2.全面基因表达分析)
[0138]
在使用poly(a)+rna获得基因表达谱(称为“系统1”)中使用的dna微阵列使用了将人来源的转录产物所对应的31,797种合成dna(80mers)(microdiagnostic公司)用堆积式阵列器在载玻片上阵列化而成的。另一方面,用于使用总rna的获得基因表达谱(称为“系统2”)的dna微阵列使用了将人来源的转录产物所对应的14,400种合成dna(80mers)(microdiagnostic公司)用堆积式阵列器在载玻片上阵列化而成的。
[0139]
来自样本的rna在系统1的情况下,从2μg的poly(a)+rna,在系统2的情况下,从5μg的总rna,使用superscript ii(invitrogen life technologies公司,美国加利福尼亚州卡尔斯巴德)和cyanine 5-dutp(perkin-elmer公司)合成了标记cdna。同样地,人通用参考rna从2μg的poly(a)+rna或从5μg的总rna,使用suprescript ii和cyanine 3-dutp(perkin-elmer公司)合成了标记cdna。
[0140]
与dna微阵列的杂交使用标记及杂交检测试剂盒(labeling and hybridization kit)(microdiagnostic公司)来进行。
[0141]
与dna微阵列杂交后的荧光强度使用genepix 4000b scanner(axon instruments公司,美国加利福尼亚州联合市)进行测定。此外,通过将样本来源cyanine-5标记cdna的荧光强度除以人通用参考物来源cyanine-3标记cdna的荧光强度来计算表达比(样本来源cyanine-5标记cdna的荧光强度/人通用参考物来源cyanine-3标记cdna的荧光强度)。而且,使用genepix pro 3.0软件(axon instruments公司),对计算的表达比乘以标准化因子进行归一化。接着,将表达比转换为log2,转换的值称为log2比(log2 ratio)。予以说明,表达比的转换使用excel软件(微软公司,美国华盛顿州贝尔维尤)和mdi基因表达分析软件包(microdiagnostic公司)来进行。
[0142]
(实施例3.乳腺癌亚型鉴别中有用的内标准基因)
[0143]
本实施例中,确定表达模式对于乳腺癌任一亚型均不变动的基因。
[0144]
通过上述实施例1和2所述的rna制备方法和全面基因表达分析方法,对于乳腺癌组织(453个病例)和正常乳腺组织(17个病例)合计的470个病例的各样本,获得了14,400种基因的基因表达谱。
[0145]
在获得的基因表达谱中,选取在任一乳腺癌亚型中均表达比的变动少的基因。具体地,未检测到信号的样本为3以下,表达比的绝对值小于0.45、标准偏差小于0.35、最大值-最小值的值小于2.2,并且,从“中位数之和”的平均值大于400的基因中,选择内标准基因。其结果成功地选择了abcf3、fbxw5、mllt1、fam234a、pitpnm1、wdr1、ndufs7和ap2a1这8种基因作为内标准基因。
[0146]
下表中示出了abcf3、fbxw5、mllt1、fam234a、pitpnm1、wdr1、ndufs7和ap2a1在上述基因表达谱中的标准偏差、最大值、最小值。
[0147]
[表3]
[0148]
symbolabcf3fbxw5mllt1fam234apitpnm1wdr1ndufs7ap2a1标准偏差0.2530.2470.2920.2960.2690.3290.2730.282最大值1.6471.2131.0521.2401.1320.7390.6370.602最小值-0.425-0.951-1.132-0.501-1.053-2.250-1.305-1.232
[0149]
另外,在上述8种内标准基因的基因表达谱中,将表达比按每1.0划分的各数据区间中的分布示于下表4和图1~3。予以说明,表4和图1~3中,作为上述8种内标准基因的对比,以往作为持家基因使用的gapdh(登录号:nm_002046)的分布也一并示出。
[0150]
[表4]
[0151][0152]
如表4和图1~3所示,上述8种内标准基因与gapdh的基因相比,样品间的表达比的变动幅度更少。而且,表达比分布多数收敛于-0.5~0.5的中间数据区间。
[0153]
(实施例4.利用基因表达分析鉴别乳腺癌亚型)
[0154]
本发明人通过在实施例3中得到的基因表达谱,成功地确定了扁平上皮癌中显示出特征性表达模式的基因群(以下称为“a群”)、叶状肿瘤中显示出特征性表达模式的基因群(以下称为“b群”)、癌中显示出特征性表达模式的基因群(以下称为“c群”)、正常组织中显示出特征性表达模式的基因群(以下称为“d群”)、正常样中显示出特征性表达模式的基因群(以下称为“e群”)、三阴性群中显示出特征性表达模式且正常组织或正常样中显示出特征性表达模式的基因(以下称为“tnbc1”)群(以下称为“f群”)、三阴性中显示出特征性表达模式的基因(以下称为“tnbc2”)群(以下称为“g群”)、三阴性中显示出特征性表达模式且与规定缺乏特征的癌(不能判定)的基因的表达模式也相似的基因(以下称为“tnbc3”)群(以下称为“h群”)、her2+样中显示出特征性表达模式的基因群(以下称为“i群”)、与her2扩
增相关且存在于her2基因与染色体上附近位置上的基因(以下称为“her2扩增-1”)群(以下称为“j群”)、与her2扩增相关且除了j群之外的基因(以下称为“her2扩增-2”)群(以下称为“k群”)、激素敏感性相关基因群(以下称为“l群”)、esr1(以下称为“m群”)、分化相关基因群(以下称为“n群”)和细胞周期相关基因群(以下称为“o群”)。作为这些a~o群所含的基因确定了199种基因(用于鉴别乳腺癌亚型的鉴别标志物基因组合)。鉴别标志物基因组合所含的基因示于下表中。
[0155]
[表5a]
[0156][0157]
[表5b]
[0158][0159]
[表5c]
[0160][0161]
[表5d]
[0162][0163]
[表5e]
[0164][0165]
[表5f]
[0166][0167]
[表5g]
[0168][0169]
对于由上述8种内标准基因与上述199种基因组成的鉴别标志物基因组合合计的207种基因,测定各基因的基因表达水平(数据未示出)并进行聚类分析。此外,聚类分析使
用expressionview pro软件(microdiagnostic公司),利用欧几里得距离的组平均法进行分析。聚类分析的结果记于图4中。如图4所示,根据提取的207种基因的表达谱进行分层聚类分析时,a~o群所含的基因在每个亚型中显示出特征性的表达比,而对照组的基因在任一亚型中也未观察到表达的变动。此外,通过该分层聚类分析,可以将乳癌亚型分类为正常样组、不能判定组、正常组、luminal a组、her2+样组、luminal b组、her2+组、三阴性组、其他组的聚类。
[0170]
针对实施例3和实施例4中使用的207种基因的探针的序列信息示于下表中。
[0171]
[表6a]
[0172][0173]
[表6b]
[0174][0175]
[表6c]
[0176][0177]
[表6d]
[0178]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1