基于基因拷贝数改变的模式的恶性黑色素瘤的基因组分类的制作方法

文档序号：6408320阅读：699来源：国知局

专利名称：基于基因拷贝数改变的模式的恶性黑色素瘤的基因组分类的制作方法
技术领域：
本发明涉及用于限定与恶性黑色素瘤(MM)相关的肿瘤、癌细胞系和受试者样品的基因组亚组的方法。本发明还涉及按照基因组亚组装配(assembling)成小组(panels) 的肿瘤、癌细胞系和受试者样品以用于测试一种或多种用于给受试者施用的治疗性干预的功效的方法。相关领域的描述癌症是特征在于临床过程、结果和治疗反应性的相当大变异性的基因组的疾病。该变异性背后的主要因素是癌症所固有的遗传异质性。相同组织病理学亚型的个别肿瘤在细胞DNA中具有不同的畸变。皮肤恶性黑色素瘤是在西方国家发病率日益升高的极具侵袭性的皮肤癌类型 (Tucker和Goldstein，200 。黑色素瘤是具有不可预测的临床过程和具有侵袭性生长及对现有化疗方案的抗性的潜能的异质性疾病(heterogeneous disease)。由于临床、形态学和细胞学改变的谱(spectrum)和缺乏分离病期(discrete stage)，难以预测个别黑色素瘤患者的临床结果(Onken等人，2004 ；Weyers等人，1999)。癌症分类的改进对于抗癌药物的发现是至关重要的。目前，基于其可用性 (availability)、对小鼠中肿瘤形成的适应性以及培养中的生长和其他参数选择临床前模型，但它们不代表亲本肿瘤的遗传异质性。这导致临床试验中对在临床前模型中已显示卓越反应的试剂的差的反应。黑色素瘤肿瘤的表型多样性伴随相应的基因拷贝数反常模式的多样性。染色体畸变是与许多发育疾病和癌症关联的有害事件。体细胞中发生的染色体区域的扩增和缺失被认为是导致癌症的主要因素之一。因此恶性黑色素瘤中基因拷贝数模式的系统性检查可能用作恶性黑色素瘤的基于基因组学的分子分类学的基础。可通过经典细胞遗传学分析或荧光原位杂交(FISH)个别地检测具有预后意义的反复染色体畸变(Recurrent chromosomal aberration) (Levsky和Singer，2003)。然而，FISH分析不能检测整个遗传学异常谱，因为其只查询有限组的由应用的探针小组限定的染色体基因座。更有利的诊断工具将基于疾病的精确分类。其将使得能够进行合理的患者选择以进行基于受试者的MM的遗传状态的治疗。发明概述在第一方面，本发明涉及用于获得恶性黑色素瘤(MM)基因组亚组的数据库的方法，所述方法包括步骤(a)获得多个，m个，包含至少一个MM细胞的样品，其中所述样品包含细胞系或肿瘤；(b)获得包括步骤(a)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息的数据集；(c)鉴定数据集中被正常细胞污染的样品并且从数据集消除所述被污染的样品，其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法(machine learning algorithm)；(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数；(3)从数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据；(d)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法 (unsupervised clustering algorithm)估计数据集中亚组的数巨 r ；(e)利用改进的基因组非负矩阵因子分解(modified genomic Non-negative Matrix Factorization) (gNMF)算法将数据集中的每一个样品分配至至少一个簇，其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新(multiplicative updating)后算法的
散度
权利要求
1.用于获得恶性黑色素瘤基因组亚组的数据库的方法，所述方法包括步骤(a)获得多个，m个，包含至少一个匪细胞的样品；(b)获得包括步骤(a)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息的数据集；(c)鉴定数据集中被正常细胞污染的样品并且从数据集消除所述被污染的样品，其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法；(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数；(3)从数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据；(d)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(e)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇，其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度
2.分类MM肿瘤或细胞系的方法，包括(a)提供通过方法开发的数据库，所述方法包括(i)获得多个，m个，包含至少一个MM肿瘤或细胞系的样品；( )获得第一数据集，所述数据集包括步骤(i)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息；(iii)鉴定第一数据集中被正常细胞污染的样品并且从第一数据集消除所述被污染的样品，其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法；(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数；(3)从第一数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据；(iv)通过对数据集应用使用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(ν)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇，其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度
3.权利要求1或2的方法，其中所述无监督聚类算法是等级聚类。
4.权利要求1或2的方法，其中将同表象相关用于提供来自数据集的簇的终数目。
5.权利要求1或2的方法，其中将贝叶斯信息准则用于提供来自数据集的簇的终数目。
6.权利要求1或2的方法，其中将同表象相关和贝叶斯信息准则用于提供来自数据集的簇的终数目。
7.权利要求1或2的方法，其中多个样品，m，包含第一、第二、第三、第四、第五和第六细胞系，其中所述第一细胞系选自SKMEL119、HS944、WM 1366和WM88 ；所述第二细胞系是WM3248 ；所述第三细胞系是1205LU ；所述第四细胞系选自 451LU、SKMEL19、SKMEL28、SKMEL30、SKMEL63、WM35, WM983 和 WM983C ；所述第五细胞系选自 WM3211、M14、MEffO, SKMEL2、SKMEL5、UACC257、UACC62、WM122、 WM13662, WM239A, WM32112, WM32482, WM793B 和 501MEL，及所述第六细胞系是MALME3M或WM882。
8.权利要求1或2的方法，其中多个样品，m,由SKMEL119、HS944、WM1366、丽88； WM3248；1205LU ；451LU、SKMEL19, SKMEL28、SKMEL30、SKMEL63 ；WM35、WM983、WM983C、 WM3211、M14、MEffO, SKMEL2、SKMEL5、UACC257、UACC62、WM122、WM13662、WM239A、WM32112、 WM32482、WM793B、50IMEL, MALME3M 和 WM882 组成。
9.分类用于抑制或杀伤恶性黑色素瘤(MM)细胞的治疗性干预的方法，其包括(a)从一小组按照基因组亚组分类的MM细胞，从每一个亚组选择至少一个MM细胞系，其中根据下述方法装配小组，所述方法包括(i)获得多个，m个，包含匪细胞的样品；( )获得第一数据集，所述数据集包括步骤(i)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息；(iii)鉴定第一数据集中被正常细胞污染的样品并且从第一数据集消除所述被污染的样品，其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法；(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数；(3)从第一数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据；(iv)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(ν)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇，其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度
10.权利要求9的方法，其中所述无监督聚类算法是等级聚类。
11.权利要求9的方法，其中同表象相关用于提供来自数据集的簇的终数目。
12.权利要求9的方法，其中贝叶斯信息准则用于提供来自数据集的簇的终数目。
13.权利要求9的方法，其中同表象相关和贝叶斯信息准则用于提供来自数据集的簇的终数目。
14.权利要求9的方法，其中所述MM细胞来自细胞系。
15.权利要求9的方法，其中多个样品，m，包含第一、第二、第三、第四、第五和第六细胞系，其中所述第一细胞系选自SKMEL119、HS944、WM1366和WM88 ；所述第二细胞系是WM3248;所述第三细胞系是1205LU ；所述第四细胞系选自 451LU、SKMEL19、SKMEL28、SKMEL30、SKMEL63、WM35, WM983 和 WM983C ；所述第五细胞系选自 WM3211、M14、MEffO, SKMEL2、SKMEL5、UACC257、UACC62、WM122、 WM13662, WM239A, WM32112, WM32482, WM793B 和 501MEL，以及所述第六细胞系是MALME3M或WM882。
16.权利要求9的方法，其中多个样品，m，由SKMEL119、HS944、WM1366、WM88；WM3248 ；1205LU ；451LU、SKMEL19、SKMEL28、SKMEL30、SKMEL63 ；WM35、WM983、WM983C、WM3211、M14、 MEffO, SKMEL2、SKMEL5、UACC257、UACC62、WM122、WM13662、WM239A、WM32112、WM32482、 WM793B.501MEL.MALME3M 和 WM882 组成。
17.权利要求9的方法，其中治疗性干预包含化学疗法、生物反应调节物、疫苗免疫治疗或生物化学疗法。
18.权利要求17的方法，其中所述治疗性干预是生物反应调节物，并且所述生物反应调节物包括施用至少一种药物组合物，所述药物组合物包含选自干扰素、白细胞介素-2、单克隆抗体和肿瘤坏死因子-α的活性剂。
19.权利要求18的方法，其中所述生物反应调节物包括施用两种或更多种活性剂。
20.装配用于分类来自样品的MM细胞的探针小组的方法，包括(a)装配数据库，包括(i)获得多个，m个，包括至少一个匪细胞的样品；( )获得包括步骤(i)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息的第一数据集；(iii)鉴定第一数据集中被正常细胞污染的样品并且从第一数据集消除所述被污染的样品，其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法；(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数；(3)从第一数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据；(iv)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法估计数据集中的亚组的数目r;(ν)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇，其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度
21.包括权利要求20的探针小组的试剂盒。
22.权利要求21的试剂盒，其中每一个探针是FISH探针。
23.用于分类MM肿瘤样品或细胞系的试剂盒，其包括(a)装配数据库的说明书，其包括用于如下方面的说明书(i)获得多个，m个，包含至少一个匪细胞的样品；( )获得第一数据集，所述数据集包括步骤(i)中获得的每一个样品的每一条染色体的至少一个基因座的拷贝数改变信息；(iii)鉴定第一数据集中被正常细胞污染的样品并且从第一数据集消除所述被污染的样品，其中鉴定和消除包括(1)对数据应用与代表肿瘤和正常样品之间的差异的参数一致的机器学习算法；(2)赋予每一个样品如通过机器学习算法测定的正常细胞污染的概率分数；(3)从第一数据集中消除每一个得分50%或更大的含正常细胞的概率的样品的数据；(iv)通过对数据集应用利用Pearson线性相异性算法的无监督聚类算法估计数据集中亚组的数目r;(ν)利用改进的基因组非负矩阵因子分解(gNMF)算法将数据集中的每一个样品分配至至少一个簇，其中所述改进的gNMF算法包括(1)利用如下公式计算每100步乘性更新后算法的散度
全文摘要
本发明涉及允许按照基因组概况分类恶性黑色素瘤细胞的方法和试剂盒，以及诊断、预测临床结果和使患者群体分层以使用所述方法进行临床试验和治疗的方法。
文档编号G06F19/24GK102203789SQ200980143554
公开日2011年9月28日申请日期2009年10月28日优先权日2008年10月31日
发明者D·塞米扎罗夫, K·张, R·R·列斯尼夫斯基, X·卢申请人:雅培制药有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｄ·塞米扎罗夫
技术所有人：雅培制药有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。