预测肺癌发生风险的dna甲基化标志物与其检测方法和试剂盒的制作方法

文档序号:10506048阅读:226来源:国知局
预测肺癌发生风险的dna甲基化标志物与其检测方法和试剂盒的制作方法
【专利摘要】本发明公开了预测肺癌发生的DNA甲基化标志物,所述标志物选自F2RL3基因的如下DNA甲基化位点1594、1604、1628、1671,1682,1723,1758,1773,1791,1802、1806、1822和1835。本发明还公开了检测所述DNA甲基化标志物的探针、方法和试剂盒,以及利用上述DNA甲基化位点的数据预测肺癌发生风险的计算机模块。
【专利说明】
预测肺癌发生风险的DNA甲基化标志物与其检测方法和试 剂盒
技术领域
[0001] 本发明设及疾病检测领域;更具体而言,本发明设及肺癌发生风险的预测。
【背景技术】
[0002] 2013年,世界卫生组织下属国际癌症研究机构发布报告,指认大气污染对人类致 癌,并视其为普遍和主要的环境致癌物。表观遗传学是不改变DNA序列情况下,基因功能的 可逆的、可遗传的变化。DNA甲基化表观遗传学的主要研究对象。DNA甲基化是DNA序列上特 定序列(连续的胞喀晚和鸟嚷岭)上的胞喀晚有可能被甲基化。甲基化程度的变化会通过改 变染色质结构及稳定性、改变转录因子结合活性等方式改变基因的表达情况。一般来说,低 甲基化有利于基因的表达,高甲基化会抑制基因的表达。目前有研究证实DNA甲基化的状态 与某些肿瘤的发生具有高度的相关性。可通过DNA甲基化来评价肿瘤是否发生,W及治疗措 施对肿瘤的疗效。
[0003] 本领域中有多种方法检测DNA的甲基化。甲基化敏感限制性内切酶-PCR/Southern 法(Methylation-Sensitive Restriction Endonuclease-PCR/Southern,MSRE-PCR/ Southern)是利用甲基化敏感限制性内切酶将DNA切割为大小不同的片段,并进行PCR/ Southern分析的方法。该方法是基于限制性内切酶的甲基化分析方法。另还有基于经重亚 硫酸盐处理的,W及在此基础上衍生出的一些甲基化分析方法,例如重亚硫酸盐测序法 (Bisulphite Sequencing)、甲基化特异性PCR(Methylation-Specif ic PCR,MS-PCR)、焦憐 酸测序(P y r O S e q U e n C i n g )、结合重亚硫酸盐的限制性内切酶法(C 0 m b i n e d Bisulf iteRestriction Analysis ,COBRA)等等。近年来涌现出不少基于全基因组的甲基化 分析方法,也称为甲基化图谱分析(MethyIation Prof i 1 ing),该方法检测样本量大,可检 测多个位点。例如,基于MassARRAY技术的飞行质谱分析方法可实现多重CpG的检测;基于高 通量测序的分析方法;W及基于忍片的甲基化图谱分析:安捷伦的化man CpG Island Microarray Kit、Illumina的Infinium Human Methylation27 BeadChip忍片和Infinium Human Methylation450 BeadQiip忍片等等多种甲基化分析方法。
[0004] 如果能够利用DNA甲基化位点对肺癌的发生风险进行评估,无疑是一种简便可行 的方法。

【发明内容】

[0005] 发明人经过努力,发现了人的体液中F2化3基因中的多个DNA甲基化位点的甲基化 程度与肺癌发生显著相关。
[0006] 因此,在第一方面,本发明提供了预测肺癌发生的DNA甲基化标志物,所述标志物 是F2化3基因 1586-1836位之间的CpG位点,更优选是1666-1804位之间的CpG位点,所述DNA 甲基化标记物的甲基化程度预示受试者肺癌发生的情况。
[0007] 在一个实施方案中,所述DNA甲基化标记物的甲基化程度为检测阔值,待测受试者 的CpG位点的甲基化程度高于和低于检测阔值分别检测所述待测受试者为正常W及为肺癌 发生风险。
[000引在一个优选的实施方案中,所述标志物是选自F2化3基因1586-1836位之间的CpG 位点发生甲基化,所述甲基化程度的检测阔值M=(曰1 X Xi+a2 X拉+......+ai2 XXi2+ai3 XXi3)/ (X1+X2+……+Xi2+Xi3),ai为0.59-0.71,优选0.64 ;日2为0.66-0.79,优选0.72 ;日3为0.61-0.73,优选0.67;所述日4为 0.65-0.85,优选0.75; Ei日为0.64-0.84,优选0.74;日6为0.52-0.73, 优选0.61;日7为0.4-0.8,优选0.60;日8为 0.78-0.86,优选0.84;朋为0.55-0.67,优选0.62; aio 为0.54-0.69,优选 0.62; an 为0.71-0.85,优选 0.81; ai2 为0.58-0.71,优选 0.63; ai3 为0.59-0.71,优选0.65; Xi、拉、……、Xi2、Xi3为0或1 (参与检测阔值比较的CpG位点的X值取0,不参与 比较的CpG位点的X值取0)。优选地,所述标志物选自F2化3基因的如下位置起始的CpG位点 的 DNA 甲基化:1594、1604、1628、1671、1682、1723、1758、1773、1791、1802、1806、1822 和 1835。
[0009] 在另一个优选的实施方案中,所述标志物是选自F2化3基因1666-1804位之间的 CpG位点发生甲基化,所述甲基化程度的检测阔值M =(曰4 X X4+a日X Xs+……+aio X Xio) /他+ Xs+……巧1日),所述日4为0.65-0.85,优选0.75巧日为,优选;日6为0.52-0.73,优选0.61;日7为 0.4-0.8,优选0.60;日8为 0.78-0.86,优选0.84;朋为0.55-0.67,优选0.62; aio为0.54-0.69, 优选0.62; X4、Xs、……、Xi〇为0或1 (参与检测阔值比较的CpG位点的X值取0,不参与比较的 CpG位点的X值取0)。优选地,所述标志物选自F2化3基因的如下位置起始的CpG位点的DNA甲 基化:1671、1682、1723、1758、1773、1791 和 1802。
[0010] 在一个实施方案中,所述DNA甲基化标记物的甲基化程度为本发明的检测阔值。 [OCm]在一个实施方案中,所述F2RL3基因的核巧酸序列参见http:// WWW.neb i.nlm.nih.gov/nuccore/AF384819.2。
[0012] 在本发明中,所述DNA甲基化标志物所在的核巧酸区段在基因中的位置为1586-1836位,具体序列如SEQ ID NO. 1所示;优选为1666-1804,具体序列如SEQ ID NO.2所示。
[0013] 因此,在第二方面,本发明提供了检测本发明的DNA甲基化标志物的引物对,所述 引物对扩增含有本发明的DNA甲基化标志物的所述F2化3基因的一段序列。
[0014] 在一个实施方案中,所述引物对的序列如SEQ ID NO.3和SEQ ID NO.4;SEQ ID NO.5和沈Q ID NO.6;SEQ ID NO.7和SEQ ID NO.8;SEQ ID NO.9和沈Q ID NO. 10;或者沈Q ID NO. 11 和沈Q ID NO. 12所示。
[0015] 在第S方面,本发明还提供了检测本发明的DNA甲基化标志物的方法,所述方法包 括:
[0016] 1)提取DNA样品,
[0017] 2)对所述DNA样品进行亚硫酸盐处理,
[0018] 3)用本发明的引物对扩增所述亚硫酸盐处理的样品,获得扩增产物,
[0019] 4)对所述扩增产物进行消化(例如采用SAP酶),
[0020] 5)对所述消化后的扩增产物进行转录和酶切,
[0021] 6)采用质谱方法对所述转录和酶切产物进行检测,获得样品序列中本发明的DNA 甲基化标志物的甲基化程度。
[0022] 在一个实施方案中,在步骤5)后包括纯化步骤,对所述转录和酶切产物进行纯化。
[0023] 在一个实施方案中,在步骤6)后包括步骤7),将所获得的DM甲基化标志物的甲基 化程度与本发明的CpG甲基化值的检测阔值进行比较,所述DNA甲基化标记物的甲基化程度 高于和低于检测阔值分别检测受试者为正常W及为肺癌发生。
[0024] 在一个优选的实施方案中,所述标志物是F2化3基因1586-1836位之间的CpG位点 发生甲基化,CpG甲基化值的检测阔值为M=(曰1 X Xi+a2 X X2+……+ai2 X Xi2+ai3 X Xu)/化巧2 +……+Xi2+Xi3),ai为0.59-0.71,优选0.64;日2为0.66-0.79,优选0.72;日3为0.61-0.73,优选 0.67;所述日4为0.65-0.85,优选0.75; a 日为 0.64-0.84,优选0.74;日6为0.52-0.73,优选0.61; 日7为0.4-0.8,优选0.60;日8为0.78-0.86,优选0.84;日9为0.55-0.67,优选0.62; aio为0.54-0.69,优选 0.62 ;aii 为 0.71-0.85,优选 0.81 ;ai2 为 0.58-0.71,优选 0.63 ;ai3 为 0.59-0.71,优 选0.65;Xi、X2、……、Xi2、Xi3为0或1(参与检测阔值比较的CpG位点的X值取0,不参与比较的 CpG位点的X值取0)。优选地,所述标志物是F2化3基因的如下位置起始的CpG位点的DNA甲基 化:1594、1604、1628、1671、1682、1723、1758、1773、1791、1802、1806、1822和1835。
[0025] 在另一个优选的实施方案中,所述标志物是F2化3基因1666-1804位之间的CpG位 点发生甲基化,CpG甲基化值的检测阔值为M=(曰4 X X4+as X Xs+……+aio X Xio)/他巧5+…… 巧10),所述日4为0.65-0.85,优选0.75;Ei日为,优选;日6为0.52-0.73,优选0.61;日7为0.4-0.8, 优选0.60 ;日8为0.78-0.86,优选0.84;刖为0.55-0.67,优选0.62; ai日为0.54-0.69,优选 0.62; X4、Xs、……、Xio为0或1 (参与检测阔值比较的CpG位点的X值取0,不参与比较的CpG位 点的X值取0)。优选地,所述标志物是F2化3基因的如下位置起始的CpG位点的DNA甲基化: 1671、1682、1723、1758、1773、1791和1802。
[00%]在一个实施方案中,所述质谱方法是飞行质谱方法,例如来自Sequenom公司。
[0027] 在第四方面,本发明提供了一种DNA甲基化标志物检测试剂盒,所述试剂盒包括涵 盖本发明的DNA甲基化标志物的探针序列,其中本发明的CpG位点中的C保持不变或者被T替 换。
[0028] 在第五方面,本发明还提供了一种利用本发明的DNA甲基化标志物数据预测肺癌 发生风险的计算机模块,所述计算机模块包括:DNA甲基化值数据接收模块、数据存储模块、 用于预测肺癌发生风险的处理器模块和用于输出结果的输出模块;其中,所述数据存储模 块存储接收的到数据、本发明公开的CpG甲基化值的检测阔值和计算结果,所述用于预测肺 癌发生风险的处理模块将所接收的DNA甲基化值与本发明公开的CpG甲基化值的检测阔值 进行比较。
[0029] 在一个优选的实施方案中,所述标志物是F2化3基因1586-1836位之间的CpG位点 发生甲基化,CpG甲基化值的检测阔值为M=(曰1 X Xi+a2 X X2+……+ai2 X Xi2+ai3 X Xu)/化巧2 +……+Xi2+Xi3),ai为0.59-0.71,优选0.64;日2为0.66-0.79,优选0.72;日3为0.61-0.73,优选 0.67;所述日4为0.65-0.85,优选0.75; a 日为 0.64-0.84,优选0.74;日6为0.52-0.73,优选0.61; 日7为0.4-0.8,优选0.60;日8为0.78-0.86,优选0.84;日9为0.55-0.67,优选0.62; aio为0.54-0.69,优选 0.62 ;aii 为 0.71-0.85,优选 0.81 ;ai2 为 0.58-0.71,优选 0.63 ;ai3 为 0.59-0.71,优 选0.65;Xi、X2、……、Xi2、Xi3为0或1(参与检测阔值比较的CpG位点的X值取0,不参与比较的 CpG位点的X值取0)。优选地,所述标志物是F2化3基因的如下位置起始的CpG位点的DNA甲基 化:1594、1604、1628、1671、1682、1723、1758、1773、1791、1802、1806、1822和1835。
[0030] 在另一个优选的实施方案中,所述标志物是F2化3基因1666-1804位之间的CpG位 点发生甲基化,CpG甲基化值的检测阔值为M=(曰4 X X4+as X Xs+……+aio X Xio)/他巧5+…… 巧10),所述日4为0.65-0.85,优选0.75;Ei日为,优选;日6为0.52-0.73,优选0.61;日7为0.4-0.8, 优选0.60 ;日8为0.78-0.86,优选0.84;刖为0.55-0.67,优选0.62; ai日为0.54-0.69,优选 0.62; X4、Xs、……、Xio为0或1 (参与检测阔值比较的CpG位点的X值取0,不参与比较的CpG位 点的X值取0)。优选地,所述标志物是F2化3基因的如下位置起始的CpG位点的DNA甲基化: 1671、1682、1723、1758、1773、1791和1802。
[0031] 在一个实施方案中,所述预测肺癌发生风险的计算机模可W是硬件模块,也可W 是利用软件实现的软件模块。
[0032] 在一个实施方案中,所述预测肺癌发生风险的计算模块为电脑软件或手机应用程 序(app)。
[0033] 在一个实施方案中,所述计算模块可W直接安装在检测设备上、手机app上、电脑 软件上。例如,安装在便携设备中(例如可穿戴设备),通过无线接收或者手动输入DNA甲基 化位点的数据,通过计算从而实现远端预测肺癌发生风险。
[0034] 在一个实施方案中,所述计算模块也可作为app组成部分安装在移动电话中,通过 无线接收或者手动输入DNA甲基化位点的数据,通过计算从而实现远端预测肺癌发生风险。
[0035] 在一个实施方案中,所述计算机模块也可作为软件的组成部分安装在计算机上, 输入数据后通过计算得到肺癌发生风险。
[0036] 本发明的方法有如下优点:1)本发明选择检测的甲基化位点分布于F2化3基因上, 与肺癌发生显著相关,可对人体发生肺癌的风险进行预测。2)本方法具有检测方便,成本低 廉、高通量的特点,适合推广。
【附图说明】
[0037] 图1为6个示例性甲基化位点(A-F分别对应于F2化3基因1671、1723、1758、1773、 1791和1802位)的甲基化状态癌症人群和正常人群中的分布状态。每个子图中左右两图分 别是癌症患者和正常受试者的数据值统计,右边刻度为DNA甲基化程度。N为32;癌症患者和 正常受试者的数据值统计比较的P值A-F分别是0.0054112、0.0047116、0.0015671、 0.00040326、0.0015671和0.0027144。
[003引图2为唾液DNA中6个示例性甲基化位点的甲基化平均值的ROC曲线图。横坐标是假 阴性率,纵坐标是真阴性率。N为32; AUC为0.79688。
[0039] 图3为血细胞DNA中6个示例性甲基化位点的甲基化平均值的ROC曲线图。横坐标是 假阴性率,纵坐标是真阴性率。N为32; AUC为0.79688。
【具体实施方式】
[0040] 本发明人发现了肺癌与F2化3基因的甲基化有关。发明人推测,F2RL3可能是通过 DNA甲基化调控基因表达,而运是导致肺癌发生的重要因素之一。
[0041 ] 本发明人发现,F2RL3基因1586-1836位之间的CpG位点发生甲基化,特别是1666-1804位之间的CpG位点发生甲基化与肺癌发生有关,因此运些序列的甲基化水平可W作为 预测肺癌发生的DNA甲基化标志物。
[0042] 本发明提供了预测肺癌发生的DNA甲基化标志物,所述标志物是F2化3基因1586- 1836位之间的CpG位点,更优选是1666-1804位之间的CpG位点,所述DNA甲基化标记物的甲 基化程度预示受试者肺癌发生风险。在本发明中对各个CpG位点提供了阔值,对于受试者来 说,对于某个CpG位点,如果测定的甲基化程度小于所述阔值,意味着所述受试者有肺癌发 生风险;如果测定的甲基化程度大于所述阔值,意味着所述受试者是正常人。
[0043] 在本发明中,沿至Xi3分别对于F2化3基因的如下位置起始的CpG位点:1594、1604、 1628、1671、1682、1723、1758、1773、1791、1802、1806、1822 和 1835,ai 至 ai3 分别是运些 CpG 位 点的甲基化程度检测阔值。在本发明的检测中,对于本发明的CpG位点,可W对其全部或者 一部分测量甲基化程度,测量了哪些CpG位点的甲基化程度,在检测时通过选取适当的M值 调节相应的阔值即可。具体是,如果测量了该CpG位点甲基化程度并将其用于检测,则在计 算检测阔值M时,对应的X取1;否则,对应的X取0。
[0044] 本发明的优点是,不必利用本发明的全部的CpG位点的甲基化程度就可W完成检 。运样优势很明显,因为我们经常只能得到一部分CpG位点甲基化程度的数据,而且我们 可W将质量不高数据的直接去除,而不显著改变我们的检测结果。
[0045] 不希望拘圓于任何理论,但发明人认为,F2RL3基因上运段序列的表达活跃程度决 定了肺癌的发生。通过F2化3基因上运段序列的甲基化,恰当地降低了基因的表达,从而避 免正常个体的肺癌发生;而肺癌患者F2化3基因上运段序列的甲基化低,基因表达活跃。因 此,F2RL3基因上运段序列的甲基化状态可W反应肺癌的情况。发明人通过实验数据证实了 运一点,并且通过对实验数据的统计学分析找到了合适的CpG甲基化值的检测阔值。
[0046] 在本发明中,甲基化值是指某一CpG发生甲基化的比例。例如,甲基化值0.75是该 CpG位点75%发生甲基化,或者75%的几率发生甲基化。在本领域中,根据质谱峰图判断甲 基化程度。
[0047] 在本发明中,由于甲基化的CpG在经亚硫酸盐处理后C会变成U,所W利用其中本发 明的CpG位点中的C保持不变或者被T替换的两种探针序列的杂交情况可W得出该CpG位点 的甲基化情况。
[0048] 在本发明中,所述计算模块可W直接安装在检测设备上、手机app上、电脑软件上。 例如,安装在便携设备中(例如可穿戴设备),通过无线接收或者手动输入DNA甲基化位点的 数据,通过计算从而实现远端预测肺癌发生风险。
[0049] 所述计算模块也可作为app组成部分安装在移动电话中,通过无线接收或者手动 输入DNA甲基化位点的数据,通过计算从而实现远端预测肺癌发生风险。
[0050] 所述计算机模块也可作为软件的组成部分安装在计算机上,输入数据后通过计算 得到肺癌发生风险。
[0051 ]在本发明中,预测肺癌发生风险的计算机模块是按如下方式工作的:
[0化2] CpGl甲基化值的检测阔值为0.59-0.71,优选0.64; CpG2甲基化值的检测阔值为 0.66-0.79,优选0.72; CpG3甲基化值的检测阔值为0.61-0.73,优选0.67 ;CpG4甲基化值的 检测阔值为0.65-0.85,优选0.75; CpG5甲基化值的检测阔值为,优选;CpG6甲基化值的检测 阔值为0.52-0.73,优选0.61; CpG7甲基化值的检测阔值为0.4-0.8,优选0.60; CpGS甲基化 值的检测阔值为0.78-0.86,优选0.84; CpG9甲基化值的检测阔值为0.55-0.67,优选0.62; CpGlO甲基化值的检测阔值为0.54-0.69,优选0.62 ; CpGl 1甲基化值的检测阔值为0.71-0.85,优选0.81; CpG12甲基化值的检测阔值为0.58-0.71,优选0.63; CpG13甲基化值的检测 阔值为0.59-0.71,优选0.65。针对各个位点的甲基化值阔值,若该位点的DNA甲基化值高于 检测阔值则为肺癌低风险人群(即正常人),若低于检测阔值则为高风险人群。
[0053] 对于本发明的CpG甲基化值的检测阔值,WCpGl为例,在甲基化值0.65-0.85运个 范围内都可W作为检测阔值,居中的0.75是综合考虑敏感性和特异性后优选出来的值。检 测阔值越低,特异性越好,但是敏感度越差(即检测阔值越低,检测出来的样本的假阳性率 越低,但是漏检率高)。阔值越高,敏感度越好,但是特异性越差(阔值越高,漏检率低,但是 假阳性率会升高)。
[0054] 因此,在本发明中,为了增加检测的准确性,优选地,在排除肺癌发生风险时,将检 测阔值定在较大值,例如对于CpGl,0.75至0.85;在确认肺癌发生风险时,将检测阔值定在 较小值,例如对于CpGl,0.65至0.75。对于CpG2-CpG13,也是相同策略。在怕漏检的情况下, 恰恰相反,优选地,在确认肺癌发生风险时,将检测阔值定在较大值,例如对于CpGl, 0.75至 0.85;在排除肺癌发生风险时,将检测阔值定在较小值,例如对于CpGl,0.65至0.75。对于 CpG2-CpG13,也是相同策略。
[0055] 对于一个个体来说,所述DNA甲基化标记物的甲基化程度小于检测阔值越多,表明 其肺癌的发生风险越大,被错检的概率越小。同样,如果一个人的DNA甲基化标记物的甲基 化程度大于检测阔值越多,表明其为正常受试者的几率越大,被错检的概率也越小。
[0056] 本发明对F2化3基因甲基化与肺癌之间的相关性进行评估,设计了一些引物对,运 些引物扩增的DNA序列中覆盖了DNA甲基化位点,利用此引物可对其中的DNA甲基化位点进 行检测,评估肺癌的发生风险。
[0057] 列举W下实例,说明本发明检测甲基化的实施方式,但运些描述不限制本发明的 适用范围。
[005引1、受试者选取和取样
[0059] 随机选取16名肺癌患者,16名无肺癌志愿者,采集两组志愿者的血液样品和唾液 样品。
[0060] 2、SEQUEN0M甲基化检测实验流程与方法
[0061] 主要仪器与试剂
[0062] 基因扩增:ABI GeneAmp9700 384 Dual;
[0063] 质谱点样:MassARRAY Nanodispenser RSlOOO;
[0064] 质谱分析:MassARRAY Compact System;
[00化]试剂:EpiTY阳RRT Complete Reagent Set。
[0066] 步骤阐述:
[0067] 1)引物合成
[0068] 利用HPLC方法合成引物对:SEQ ID NO.3和沈Q ID NO.4。
[00例 2)DNA样品提取和DNA样品质检
[0070] (I)DNA样品提取
[0071] 使用武汉昌美生物技术有限公司"唾液DNA提取纯化试剂盒(一管法r (产品货号: QT-275)提取唾液DNA;
[0072] 使用QIAGEN血细胞DNA提取试剂盒(货号:51104)提取血细胞DNA;
[0073] 详细操作步骤见相应试剂盒说明书。
[0074] (2)DNA 质检
[0075] 通过琼脂糖凝胶电泳检测DM纯度及是否降解;
[0076] 通过NAN0DR0P检测DNA浓度及纯度。
[0077] 3)亚硫酸盐处理DNA样品
[007引使用ZYMO公司的EZ DNA Methylation-Kit试剂盒(货号:D5001)对DNA样品进行转 换处理;
[0079] 具体操作步骤见相应试剂盒说明书。
[0080] 4)PCR 反应
[0081] (1)反应体系:
[0091] 6)转录和酶切反应[0092] (1)反应体系:
[0082]
[0083]
[0084]
[0085]
[0086]
[0087]
[008引
[0089]
[0090]
[0093]
[0094] 反应条件:37 r溫育3小时
[00M] 7)树脂纯化
[0096] (1)将反应产物的384孔板中加入蒸水,在离屯、机中离屯、2000转/分钟离屯、3 分钟,加入树脂,在反转摇匀仪上做树脂纯化反应15min,脱盐;反应完成后在离屯、机中离屯、 2000转/分钟,离屯、3分钟;
[0097] (2)将脱盐处理后的样品点在样品祀上,自然结晶。
[009引8)质谱检测,收集数据
[0099] (1 )MALDI-T0F-MS (基质辅助激光解析电离飞行时间质谱)反应;
[0100] (2化Pityper软件检测质谱峰,根据质谱峰图判断甲基化程度。
[0101] 嫂妇g分析
[0102] 经过分析,发明人发现在正常人和肺癌患者之间F2化3基因的一些CpG位点的DNA 甲基化水平存在显著性差异。
[0103] 为了便于说明,发明人WF2RL3基因的如下位置起始的CpG位点的DNA甲基化为例 进行分析:1671、1723、1758、1773、1791 和 1802。
[0104] 图1中示例性显示了6个单DNA甲基化位点(1671、1723、1758、1773、1791和1802)的 甲基化程度对肺癌患者和无肺癌人群的区分图。从图1可W看到,肺癌病人和正常人群在6 个DNA甲基化位点的甲基化状态均有显著差异(P值均小于0.01),该6个位点均能很好地区 分肺癌病人和正常人群。发明人综合考虑敏感性和特异性后确定了 DNA甲基化水平的检测 阔值越低,结果见表1。
[0105] W上述确定检测阔值,使用单个DNA甲基化位点或多个DNA甲基化位点对肺癌发生 风险进行预测的分析如图2和图3所示。从图2和图3可W看到,运6个DNA甲基化位点(1671、 1723、1758、1773、1791和1802)的甲基化平均值对肺癌的预测可达到较高的准确性,AUC (Area化der化rve)约为0.8。并且唾液和血细胞的DNA甲基化得到的结果一致,说明该预 测效果十分稳定。
[0106] 16名患者中,13个CpG位点在肺癌患者中的甲基化值平均值均显著高于10-40 %, 平均高25% W上,而且是统计学显著的。类似地,发明人确定了F2化3基因的正常人和肺癌 患者之间DNA甲基化水平存在显著性差异所有13个CpG位点甲基化检测阔值,见W下表1中。
[0107] 表1
[010 引
[0109] 依据相同步骤,Wl3个位点(1594、1604、1628、1671、1682、1723、1758、1773、1791、 1802、1806、1822和 1835)得到类似的结果,AUC是0.8左右;W7个位点(1671、1682、1723、 1758、1773、1791和1802)也得到类似的结果,AUC是0.8左右。
[0110] 序列信息
[0111] 沈Q ID N0.1:F2RL3基因序列 1586-1836位
[0112] ccaga cagcacgccc tcaatcctgc ctgccccccg cggctaccca ggccaagtct gtgcc曰曰tg曰C曰gtg曰C曰CC
[0113] ctggagctcc cggacagctc acgggcactg cttctgggct gggtgcccac caggctggtg cccgccctct
[0114] 曰t邑邑邑Ctggt CCtggtggtg邑邑邑Ct邑C写邑邑CC曰曰t邑邑邑Ct邑邑弓邑Ctgtgg邑t邑Ct邑邑CC曰 ^gCSggCSCC
[011己] t写ggctgccc tccaccatgc tgctgatgaa cctcgc
[0116] 沈Q ID N0.2:F2RL3基因序列 1666-1804位
[0117] getCC cggacagctc acgggcactg cttctgggct gggtgcccac caggctggtg cccgccctct atgggctggt
[0118] CCtggtggtg邑邑邑Ct邑C写邑邑CC曰曰t邑邑邑Ct邑邑写邑Ctgtgg邑t邑Ct邑邑CC曰写邑c曰邑邑c曰cc t谷g邑
[0119] 引物对1:
[0120] F:GGTTTATTAGTAGTATGGTGGAGGG(SEQ ID NO.3)
[01別]R:ACCCAAACCAAATCTATACCAATAAC(沈Q ID N0.4)
[0122]引物对2:
[0123] F:TTTGTGTTAATGATAGTGATATTTTGGA(SEQ ID NO.5)
[0124] R:TCATCAACAACATAATAAAAAACAACC(SEQ ID NO.6)
[0125] 引物对3:
[0126] F:GGTTTATTAGTAGTATGGTGGAGGG(SEQ ID NO.7)
[0127] R:CCCAAAVVAAATCTATACCAATAAC(沈Q ID N0.8)
[012引引物对4:
[0129] F:GGTTTATTAGTAGTATGGTGGAGGGT(沈Q ID N0.9)
[0130] R:CCCAAACCAAATCTATACCAATAAC(沈Q ID NO.IO)
[0131] 引物对5:
[01;32] F:AGGAAGAGAGGGTTTATTAGTAGTATGGTGGAGGG(SEQ ID NO.ll)
[0133] R;
[0134] CAGTAATACGACTCACTATAGGGAGAAGGCTCCCAAACCAAATCTATACCAAT AAC(SEQ ID NO.12)
【主权项】
1. 预测肺癌发生的DNA甲基化标志物,所述标志物是F2RL3基因1586-1836位之间的CpG 位点,更优选是1666-1804位之间的CpG位点,所述DNA甲基化标记物的甲基化程度预示受试 者肺癌发生的情况。2. 根据权利要求1的DNA甲基化标志物,所述DNA甲基化标记物的甲基化程度为检测阈 值,待测受试者的CpG位点的甲基化程度高于和低于检测阈值分别检测所述待测受试者为 正常以及为肺癌发生风险, 所述标志物是选自F2RL3基因1586-1836位之间的CpG位点发生甲基化,所述甲基化程 度的检测阈值M= (ai X Xi+a2 X X2+......+ai2 X Xi2+ai3 X Xi3)/ (X1+X2+......+X12+X13),ai为 0 · 59-0 · 71,优选 0 · 64; a2 为0 · 66-0 · 79,优选 0 · 72; a3 为0 · 61-0 · 73,优选0 · 67;所述 a4 为0 · 65- 0.85,优选0.75 ;a5为0.64-0.84,优选0.74 ;a6为0.52-0.73,优选0.61 ;a7为0.4-0.8,优选 0 · 60; as为 0 · 78-0 · 86,优选 0 · 84; a9为0 · 55-0 · 67,优选0 · 62; aio为 0 · 54-0 · 69,优选0 · 62; an 为0 · 71-0 · 85,优选 0 · 81; ai2 为0 · 58-0 · 71,优选 0 · 63; ai3为0 · 59-0 · 71,优选 0 · 65;或者, 所述甲基化程度的检测阈值M=(a4XX4+a5XX5+……+a 1() XX1())/(X4+X5+……+Χιο),所 述a4为0 · 65-0 · 85,优选0 · 75 ; a5为0 · 64-0 · 84,优选0 · 74; a6为0 · 52-0 · 73,优选0 · 61; a7为 0 · 4-0 · 8,优选0 · 60; as为 0 · 78-0 · 86,优选0 · 84; a9为0 · 55-0 · 67,优选0 · 62; aio为0 · 54-0 · 69, 优选0.62;或者 所述甲基化程度的检测阈值M = (a4 X X4+a6 X X6+a7 X X7+a8 X Xs+ag X X9+aio X Xio) / (X4+X5 +X6+X7+X8+X9+X10),所述a4为0 · 65-0 · 85,优选0 · 75; a6为0 · 52-0 · 73,优选0 · 61; a7为0 · 4-0 · 8, 优选0 · 60 ; as为0 · 78-0 · 86,优选0 · 84; a9为0 · 55-0 · 67,优选0 · 62; aio为0 · 54-0 · 69,优选 0.62, Xl、X2、……、Xl2、Xl3为0或 1。3. 根据权利要求2的DNA甲基化标志物,所述标志物选自F2RL3基因的如下位置起始的 CpG 位点的 DNA 甲基化:1594、1604、1628、1671、1682、1723、1758、1773、1791、1802、1806、 1822 和 1835;优选 1671、1682、1723、1758、1773、1791 和 1802;更优选 1671、1723、1758、1773、 1791和1802。4. 用于检测权利要求1的DNA甲基化标志物的引物对,所述引物对扩增含有权利要求1 的DNA甲基化标志物的一段序列。5. 根据权利要求4的引物对,所述引物对选自 SEQ ID N0.3和SEQ ID N0.4; SEQ ID N0.5和SEQ ID N0.6; SEQ ID NO.7和SEQ ID NO.8; SEQ ID NO .9和SEQ ID NO .10;或者 SEQ ID NO.11和SEQ ID NO.12。6. 检测上述DNA甲基化标志物的方法,所述方法包括 1) 提取DNA样品, 2) 对所述DNA样品进行亚硫酸盐处理, 3) 用权利要求5的引物对扩增所述亚硫酸盐处理的样品,获得扩增产物, 4) 对所述扩增产物进行消化(例如采用SAP酶), 5) 对所述消化后的扩增产物进行转录和酶切, 6)采用质谱方法对所述转录和酶切产物进行检测,获得样品序列中的甲基化情况。7. 根据权利要求6的方法,在步骤5)后包括纯化步骤,对所述转录和酶切产物进行纯 化。8. 根据权利要求6或7的方法,所述质谱方法是飞行质谱方法。9. 一种DNA甲基化标志物检测试剂盒,所述试剂盒包括权利要求5的引物对;所述试剂 盒或者包括涵盖权利要求3中所述的甲基化位点的探针序列,其中权利要求1的CpG位点中 的C保持不变或者被T替换。10. -种利用上述DNA甲基化位点的数据预测肺癌发生风险的计算机模块,所述计算机 模块包括:DNA甲基化值数据接收模块、数据存储模块、用于预测肺癌发生风险的处理器模 块和用于输出结果的输出模块,其中,所述数据存储模块存储接收的到数据、CpG甲基化值 的检测阈值和计算结果,所述用于预测肺癌发生风险的处理模块将所接收的DNA甲基化值 与如下的CpG甲基化值的检测阈值进行比较: CpG甲基化值的检测阈值为M= (ai XXi+a2 XX2+……+ai2 XXi2+ai3 ΧΧι3)/(Χι+Χ2+……+ X12+X13),ai为0 · 59-0 · 71,优选0 · 64; a2为0 · 66-0 · 79,优选0 · 72; a3为0 · 61-0 · 73,优选0 · 67; 所述a4为0 · 65-0 · 85,优选0 · 75; a5为0 · 64-0 · 84,优选0 · 74; a6为0 · 52-0 · 73,优选0 · 61; a7为 0 · 4-0 · 8,优选0 · 60; as为 0 · 78-0 · 86,优选0 · 84; a9为0 · 55-0 · 67,优选0 · 62; aio为0 · 54-0 · 69, 优选0 · 62; an为0 · 71-0 · 85,优选0 · 81; ai2为0 · 58-0 · 71,优选0 · 63 ; ai3为0 · 59-0 · 71,优选 0.65;或者, CpG甲基化值的检测阈值为M= (a4 X X4+a5 X X5+……+a1() X Χ1())/(Χ4+Χ5+……+Χιο),所述 a4为0 · 65-0 · 85,优选0 · 75; a5为0 · 64-0 · 84,优选0 · 74; a6为0 · 52-0 · 73,优选0 · 61; a7为0 · 4-0 · 8,优选0 · 60; as为 0 · 78-0 · 86,优选0 · 84; a9为 0 · 55-0 · 67,优选0 · 62; aio为0 · 54-0 · 69,优选 0.62;或者 CpG 甲基化值的检测阈值为M = (a4 X X4+a6 X X6+a7 X X7+a8 X Xs+a9 X X9+ai〇 X Xio) / (X4+X5+ X6+X7+X8+X9+X1Q),所述a4为0 · 65-0 · 85,优选0 · 75;a6为0 · 52-0 · 73,优选0 · 61;a7为0 · 4-0 · 8, 优选0 · 60 ; as为0 · 78-0 · 86,优选0 · 84; a9为0 · 55-0 · 67,优选0 · 62; aio为0 · 54-0 · 69,优选 0.62, Xl、X2、……、Xl2、Xl3为0或 1。
【文档编号】C12Q1/68GK105861644SQ201610074758
【公开日】2016年8月17日
【申请日】2016年2月2日
【发明人】熊江辉, 吴安东, 梁峰吉, 元艳宏, 唐智莉, 朱镜蓉
【申请人】深圳市太空科技南方研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1