乳腺癌局部复发模型的建构方法和风险预测方法与流程

文档序号:35966966发布日期:2023-11-09 07:12阅读:53来源:国知局
乳腺癌局部复发模型的建构方法和风险预测方法与流程

本发明关于一种乳腺癌局部复发的检测方法,尤其是一种利用特定基因表达值而建构基因模型以预测乳腺癌局部复发的方法。


背景技术:

1、乳腺癌为全球最常见的女性癌症,占女性癌症比例的1/3,占所有癌症比例的1/10,其同时也是45~55岁女性最常见死因之一,每年每38名女性中,就有1例乳腺癌死亡案例(6.8%)。乳腺癌是一种多基因疾病,遗传因素的复杂相互作用决定乳腺癌成因。这导致乳腺癌成为高度异质性的疾病,有多变的特征、型态、病程、治疗反应和预后。许多研究指称,乳腺癌并非单一种癌细胞组成,在同一个人身上也可能会由多种亚型肿瘤组成,导致治疗难以完全根治。

2、虽然早期发现乳腺癌可有效提高存活率达90%,然而,仍有约略五成的病患在手术之后的5~10年内产生乳腺癌复发。乳腺癌复发可分为局部复发和远端转移两类,区域淋巴结复发(locoreginal)是癌细胞进入乳房淋巴;远端转移则是癌细胞由血管扩散至内脏,如肺脏、肝脏或脑部。减少远端转移的对策则是为患者进行全身性的辅助性化学治疗(systemic adjuvant chemotherapy)以及荷尔蒙治疗(hormonal therapy),而降低乳腺癌局部区域复发的对策是为患者进行术后放射性治疗。

3、大约60%的早期乳腺癌患者选择接受辅助化疗,其中只有很小的一部分(2-15%)的患者确实受到化疗的助益,但所有患者都处于化疗中毒风险的副作用下。

4、现阶段中,仅能依据定期追踪来评估复发的可能性,而经常发生过度治疗(overtreatment)或不足治疗(undertreatment)。若给予每个患者相同强度的治疗,常导致有些患者承受了不必要的治疗副作用,或未得到应有的治疗效果。造成社会、家庭负担及医疗资源浪费。对术后患者来说,复发的不确定性更是一种折磨与煎熬。

5、就目前而言,大多的乳腺癌复发、生存率、肿瘤亚型的研究对象为高加索人(caucasians)。近年来,利用基因体分析,已在不同地区人群中观察到乳腺癌的肿瘤型态、癌症亚型具有明显差异。例如,高加索人地区重视的高通透性乳腺癌易感基因(如brca1和brca2),在亚洲族群的基因突变率却较低。因此,brca1和brca2突变仅是小部分亚洲族群中乳腺癌罹患或复发成因。大多数已被识别的乳腺癌相关遗传基因,也被认为影响亚洲族群罹癌程度有限。考虑族群之间的基本流行病学和遗传风险因数,种族基因差异可能是导致族群乳腺癌风险不同的潜在原因。藉由建构出种族差异的影响,可以更深入了解患者预后,从而制定更适当的治疗决策。因此,针对亚洲女性进行乳腺癌研究及建立评估复发机率极具有意义。


技术实现思路

1、本发明提供一种乳腺癌局部复发风险预测基因模型的建构方法,用以建构一乳腺癌局部复发风险预测基因模型,包含有以下步骤:提供数个训练样本,且训练样本系根据每一训练样本的临床预后结果,选择性地被设定一局部复发标记,根据局部复发标记将训练样本分群;测定每一训练样本中至少十个基因的表达值,至少十个基因系选自于一基因群组中的至少任意十者,基因群组系由bub1b、ccr1、ckap5、ddx39、dtx2、erbb2、esr1、obsl1、phactr2、pim1、pti1、rchy1和stil所组成,基因群组的任一基因可被其同源基因、其变异基因或其衍生基因取代;透过回归分析设定至少十个基因的加权分数,并根据至少十个基因及加权分数,分别产出每一训练样本的一预测值;产生对应各训练样本的预测值的一第一阈值,其中第一阈值系用于乳腺癌局部复发风险预测基因模型中以与一检体样本的一检体样本预测值比对而判断检体样本是否为一乳腺癌局部复发低风险样本。

2、其中于设定至少十个基因的加权分数的步骤中,进一步包含以下步骤:透过回归分析设定基因群组中每一基因的加权分数;计算基因群组中每一基因的表达值在标准化后乘上加权分数后的总合,以分别产出每一训练样本的预测值。

3、其中于设定至少十个基因的加权分数的步骤中,进一步包含以下步骤:透过回归分析设定基因群组中每一基因的加权分数以产生一计算公式;将基因群组中每一基因在标准化后的表达值代入计算公式,以获得一基因表达值,该基因表达值用于计算每一训练样本的预测值;其中,该计算公式为:基因表达值=-(0.2~0.8)*bub1b-(0.000008~0.000032)*ccr1-(0.0002~0.0008)*ckap5-(0.0003~0.0012)*ddx39-(0.13~0.52)*dtx2+(5~20)*erbb2-(0.12~0.48)*esr1-(0.06~0.24)*obsl1+(0.18~0.72)*phactr2-(0.010~0.040)*pim1-(0.0014~0.0056)*pti1+(0.00006~0.00024)*rchy1-(0.03~0.12)*stil。

4、其中于设定至少十个基因的加权分数的步骤中,进一步包含以下步骤:透过回归分析设定基因群组中每一基因的加权分数以产生一计算公式;将基因群组中每一基因在标准化后的表达值代入计算公式,以获得一基因表达值,基因表达值用于计算每一训练样本的预测值;其中,计算公式为:基因表达值=-0.409159393*bub1b-0.0000162421*ccr1-0.000398718*ckap5-0.000609539*ddx39-0.262806195*dtx2+10.000531936*erbb2-0.240144629*esr1-0.119104402*obsl1+0.363568099*phactr2-0.019640093*pim1-0.002815787*pti1+0.000122952*rchy1-0.061283904*stil。

5、其中,于产生对应各训练样本的预测值的第一阈值的步骤中,进一步包含以下步骤:导入cox比例风险模式,建构预测值与五年内局部复发风险百分比的关联,以产生对应训练样本的各预测值的第一阈值;比对检体样本的预测值和第一阈值,当检体样本的预测值小于第一阈值,而判断检体样本为乳腺癌局部复发低风险样本时,检体样本的复发率小于8%。

6、其中,于设定该至少十个基因的加权分数的步骤中,进一步包含以下步骤:透过回归分析设定至少十个基因的加权分数;根据训练样本的来源的一临床因子,计算一临床观测值;根据至少十个基因及加权分数和临床观测值,分别产出每一训练样本的预测值;其中,临床因子包含有初次确诊时年龄、原发性肿瘤大小、淋巴结转移数量、淋巴血管侵犯状态、肿瘤分级、和雌激素受体状态。

7、本发明还提供一种乳腺癌局部复发风险预测基因模型的建构方法,用以建构一乳腺癌局部复发风险预测基因模型,包含有以下步骤:提供数个训练样本,且训练样本系根据每一训练样本的临床预后结果,选择性地被设定一局部复发标记,并根据局部复发标记将训练样本分群;测定每一训练样本中数个基因的表达值,数个基因包含有bub1b、ccr1、ckap5、ddx39、dtx2、erbb2、esr1、obsl1、phactr2、pim1、pti1、rchy1和stil,上述任一基因可被其同源基因、其变异基因或其衍生基因取代;透过回归分析设定数个基因的加权分数,并根据数个基因及加权分数,分别产出每一训练样本的一预测值;产生对应各训练样本的预测值的一第一阈值,其中该第一阈值系用于该乳腺癌局部复发风险预测基因模型中以与一检体样本的一检体样本预测值比对而判断该检体样本是否为一乳腺癌局部复发低风险样本。

8、其中于设定基因的加权分数的步骤中,进一步包含以下步骤:设定数个基因中每一基因的加权分数;计算数个基因中每一基因的表达值在标准化后乘上加权分数后的总合;根据训练样本的来源的一临床因子,计算一临床观测值;根据基因的加权分数和临床观测值,分别计算出每一训练样本的该预测值;其中,临床因子包含有初次确诊时年龄、原发性肿瘤大小、淋巴结转移数量、淋巴血管侵犯状态、肿瘤分级、和雌激素受体状态。

9、其中,于设定基因的加权分数的步骤中,进一步包含以下步骤:设定基因群组中每一基因的加权分数以产生一计算公式;根据训练样本的来源的一临床因子,计算一临床观测值;将基因群组中每一基因在标准化后的表达值代入计算公式,以获得一基因表达值;加总临床观测值和基因表达值,计算获得预测值;其中,临床因子包含有初次确诊时年龄、原发性肿瘤大小、淋巴结转移数量、淋巴血管侵犯状态、肿瘤分级、和雌激素受体状态;其中,该计算公式为:基因表达值=-0.409159393*bub1b-0.0000162421*ccr1-0.000398718*ckap5-0.000609539*ddx39-0.262806195*dtx2+10.000531936*erbb2-0.240144629*esr1-0.119104402*obsl1+0.363568099*phactr2-0.019640093*pim1-0.002815787*pti1+0.000122952*rchy1-0.061283904*stil。

10、其中,于产生对应各训练样本的预测值的第一阈值的步骤中,进一步包含以下步骤:导入cox比例风险模式,建构预测值与五年内局部复发风险百分比的关联,以产生对应训练样本的各预测值的第一阈值;比对检体样本的预测值和第一阈值,当检体样本的预测值小于第一阈值,而判断检体样本为乳腺癌局部复发低风险样本时,检体样本的复发率小于8%。

11、其中训练样本系属于亚洲女性乳腺癌患者进行乳房切除手术或乳房保留手术后的组织样本。

12、本发明还提供一种乳腺癌局部复发的风险预测方法,包含有以下步骤:提供一检体样本;测定检体样本中至少十个基因的表达值,至少十个基因系选自于一基因群组的任意组合,基因群组系由bub1b、ccr1、ckap5、ddx39、dtx2、erbb2、esr1、obsl1、phactr2、pim1、pti1、rchy1和stil所组成,基因群组的任一基因可被其同源基因、其变异基因或其衍生基因取代;比较检体样本中至少十个基因的表达值和一非乳腺癌局部复发样本中至少十个基因的表达值,当检体样本中至少十个基因的表达值低于非乳腺癌局部复发样本中至少十个基因的表达值,则判断检体样本为该乳腺癌局部复发低风险样本。

13、本发明还提供一种基于乳腺癌局部复发风险预测基因模型的风险预测方法,包含有以下步骤:提供一检体样本;测定检体样本中至少十个基因的表达值,至少十个基因系选自于一基因群组的任意组合,基因群组系由bub1b、ccr1、ckap5、ddx39、dtx2、erbb2、esr1、obsl1、phactr2、pim1、pti1、rchy1和stil所组成,基因群组的任一基因可被其同源基因、其变异基因或其衍生基因取代;将至少十个基因在标准化后的表达值代入一计算公式而获得一预测值,预测值呈现检体样本为乳腺癌局部复发的风险。

14、其中,于将至少十个基因代入计算公式的步骤中,进一步包含以下步骤:将至少十个基因在标准化后的表达值代入计算公式,计算公式为:基因表达值=-0.409159393*bub1b-0.0000162421*ccr1-0.000398718*ckap5-0.000609539*ddx39-0.262806195*dtx2+10.000531936*erbb2-0.240144629*esr1-0.119104402*obsl1+0.363568099*phactr2-0.019640093*pim1-0.002815787*pti1+0.000122952*rchy1-0.061283904*stil;根据检体样本的来源的一临床因子,计算一临床观测值,该临床因子包含有初次确诊时年龄、原发性肿瘤大小、淋巴结转移数量、淋巴血管侵犯状态、肿瘤分级、和雌激素受体状态;加总临床观测值和基因表达值,计算获得预测值;若预测值小于一第一阈值,则判断检体样本为该乳腺癌局部复发低风险样本,第一阈值为35.0。

15、本发明还提供一种基于乳腺癌局部复发风险预测基因模型的风险预测方法,包含有以下步骤:提供一检体样本;测定检体样本中数个基因的表达值,数个基因包含有bub1b、ccr1、ckap5、ddx39、dtx2、erbb2、esr1、obsl1、phactr2、pim1、pti1、rchy1和stil,上述任一基因可被其同源基因、其变异基因或其衍生基因取代;以及将每一基因在标准化后的表达值代入一计算公式而获得一预测值,预测值呈现检体样本为乳腺癌局部复发的风险。

16、其中,于将每一基因代入计算公式的步骤中,进一步包含以下步骤:将每一基因在标准化后的表达值代入计算公式,计算公式为:基因表达值=-0.409159393*bub1b-0.0000162421*ccr1-0.000398718*ckap5-0.000609539*ddx39-0.262806195*dtx2+10.000531936*erbb2-0.240144629*esr1-0.119104402*obsl1+0.363568099*phactr2-0.019640093*pim1-0.002815787*pti1+0.000122952*rchy1-0.061283904*stil;根据检体样本的来源的一临床因子,计算一临床观测值,临床因子包含有初次确诊时年龄、原发性肿瘤大小、淋巴结转移数量、淋巴血管侵犯状态、肿瘤分级、和雌激素受体状态;加总临床观测值和基因表达值,计算获得预测值;若预测值小于一第一阈值,则判断检体样本为乳腺癌局部复发低风险样本,第一阈值为35.0。

17、和现有的技术相比,本发明提供乳腺癌局部复发风险预测基因模型的建构方法,有助于建立亚洲女性族群特有的风险预测模型。本发明的预测模型、基因群和计算公式并未被报导过,有效的实现了供乳腺癌局部复发的风险预测并且有优异的准确度。本发明有助于医疗人员在临床上协助乳腺癌患者决定所需的治疗类型,减少医疗费用、健保给付或保险资源的负担与浪费。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1