检测癌相关变化的方法和系统的制作方法

文档序号:6022402阅读:332来源:国知局
专利名称:检测癌相关变化的方法和系统的制作方法
背景技术
生物材料数字图象的计算机分析被称作图象细胞计量。在图象细胞计量中,计算机控制的照相机拍摄细胞材料的放大图象,然后对数字图象进行分析,以定位目标物,并随后鉴别(分类)某些作为细胞的目标物。然后,为了各种目的对细胞进行检验,如确定细胞是健康的还是癌化的。通常,首先将生物材料染色以增加细胞结构或化学组分的可视性。某些染料或蛋白质可与细胞的特定部分或其组分如表面蛋白或DNA特异而成比例地结合。其中一个例子是福尔根染色,其成比例地将染料与DNA结合,这意味着存在的DNA越多,染色就越深。一旦DNA被成比例的染色,这在某些情况下可以称作化学计量的染色,即可以测定细胞核中DNA的总量和相对分布。
图象细胞计量可以用来扫描并分析DNA染色的细胞,举例来说,以确定细胞是否具有癌相关变化(malignancy-associated changes,MAC);MAC是与非癌变细胞中DNA的空间分布相关的变化,当其他细胞中存在癌症时MAC变化会显得更为常见。例如,在Finch,et al.,Malignancy Associated Changes in Buccal Smears,Acta Cytologica1546-49(1971);Klawe et al.,Malignancy Associated changes(MAC)in Cells of BuccalSmears detected by means of Objective Image Analysis,Acta Cytologica 1830-33(1974);US patent no.5,889,881;US patent no.6,026,174中讨论了MAC。然而,这难以可靠评价MAC的存在。举例来说,使用福尔根法进行的DNA染色虽然在完全黑暗中会由于温度、化学试剂浓度、水解时间、染色质压缩程度或其他因素的较小变化导致批与批之间发生差异,但仍是成比例的。
因此,仍未解决对适用于图象细胞计量的改进计算机执行程序的需要,所述图象细胞计量能校正或减小染色所致的差异。也仍未解决对检测细胞MAC的可靠方法的需要。本发明提供了这些和其他优点。
发明概述计算机执行的或自动化的图象细胞计量是复杂而有用的分析工具。如上所述,样品之间的染色差异使得难以直接将一个样品和另一个样品进行比较,或将样品和标准品进行比较。克服这种染色差异能够增加检测细胞核中DNA分布的细微变化、从而检测MAC的能力。MAC提供了检测患者体内癌症可能性的潜力,而不必专门依赖于样品中癌细胞的存在。这使得癌症诊断或筛选更为现实,伤害性更小,疼痛更少,更廉价,且更快捷。本发明提供了用来增强图象分析、从而提高MAC检测的计算机、方法、系统等。而其会增加癌症在早期即更易治疗阶段得以检测的可能性,并减少癌症患者和正在接受癌症筛选的患者的负担。
一方面,提供了以光度法校正数字图象的计算机执行方法,用来分析细胞特征,从而确定癌相关变化(MAC)。所述方法包括a)提供DNA染色细胞样品的至少一个数字图象,所述样品包含足够的细胞,以确定具有特定DNA含量的参照细胞群体;b)确定光度校正因子,其将特定DNA含量细胞的光学测量值基本调节至预定目标值,所述预定目标值对应于参照数据集内的光学测量值,参照数据集可以包括指示MAC存在与否的光学测量值;c)将光度校正因子应用于数字图象的所需像素,以提供标准化的数字图象;d)从标准化的数字图象计算光学特征;和e)将从标准化图象确定的光学特征和参照数据集相比较,以确定样品是否包含MAC。
在这一实施方案和其他的实施方案中(除非上下文中声明或明显可以看出,本发明的所有实施方案、方面、特征等可以以任意所需方式混合与匹配、组合与排列),特定DNA含量的细胞可以是二倍体细胞,确定光度校正因子以使样品中二倍体细胞和参照数据集中的二倍体细胞的校正DNA含量测定值具有约为1的相对值,四倍体细胞的校正DNA含量测定值具有约为2的相对值。所述方法还可以包括确定样品是否含有MAC。光学测量可以包括测量积分光密度(IOD),并且参照数据集可包括目标IOD,光度校正因子可以确定为目标IOD/测量IOD,数字图象可以包括光强度信息,光强度可以通过将光强度乘以光度校正因子来校正。
所述方法还可包括至少一个下述步骤将光度校正因子应用于图象目标物中的至少所需像素;和为光密度和积分光密度中的至少一个提供调节后的像素值。可通过重复至少b)和c)至少一次,以提供改进的校正系数,因为这样可以分析样品中显著更多的细胞,例如约200个以上细胞的额外群体。也可以使用改进的校正系数来重复至少d)和e),以提供改进的调节后像素值和至少一个光学特征的改进的测定值。染色的DNA可以用福尔根染色法染色,也可以用光吸收染料、荧光染料等进行染色。
所述方法还可包括提供至少一个对照,例如提供具有已知光密度的已知物质的至少一个数字图象。如果对照是可染色的,则可以与组织样品基本同时进行染色。所述方法还可包括从调节的像素值确定多个光学特征,使用线性或非线性函数确定多个光学特征中的至少一个。参照数据集还可包括参照细胞的数字图象。所述方法还可包括将光度校正因子应用于图象目标物中的基本所有像素。
样品可以来自可能患有选定癌的患者,也可来自非相关组织,患者可以患有内在性癌症,非相关组织可以是可获得组织或非可获得组织。例如,选定的癌可以是肺癌,非相关组织包括颊黏膜;或者选定的癌可以是乳腺癌,非相关组织包括颊黏膜、乳头吸出物和管洗液中的至少一种。患者和基本非癌变组织样品可以是人类。
在另一个方面中,提供了一种制作数据集的方法,所述数据集包括与MAC相关的判别图象细胞计量特征。该方法包括a)提供包含成比例染色DNA的细胞样品的数字细胞计量图象,所述样品包括足够的细胞,以提供具有特定DNA含量的细胞的DNA含量测定值;b)分析具有特定DNA含量的细胞,以确定DNA含量的光强度、光密度(OD)和积分光密度(IOD)值中的至少一个,以提供初始DNA含量测定值;c)确定调节初始DNA含量测定值的光度校正因子,以提供特定DNA含量细胞的校正DNA含量测定值,其中校正DNA含量测定值具有与参照数据集中基本等量DNA含量的细胞的参照DNA含量测定值基本相等的相对值,所述参照数据集包括与MAC相关的判别图象细胞计量特征;d)将光度校正因子应用于图象的至少所需像素来标准化图象,从而在至少光密度标度上提供调节后的像素值;e)将从调节后的像素值确定的光学特征和参照数据集相比较,从而确定包含MAC的样品;和f)将从调节后的像素值获得的光学特征与参照数据集合并,以提供改进的参照数据集。
所述方法还可包括预先选择样品,从而所述样品可已知包含MAC。所述方法还可包括确定细胞群体值中的至少一个位移(shift),其测定细胞群体内细胞核中的染色质分布。
还提供了一种制作数据集的方法,所述数据集包括与MAC相关的判别图象细胞计量特征。该方法可包括a)提供表现出MAC的组织样品的数字细胞计量图象;b)分析样品中具有特定DNA含量的细胞,以测定DNA含量的光强度、光密度(OD)和积分光密度(IOD)值中的至少一个,以提供初始DNA含量测定值;c)确定调节初始DNA含量测定值的光度校正因子,以提供特定DNA含量细胞的校正DNA含量测定值,其中校正DNA含量测定值具有与参照数据集中基本等量DNA含量的细胞的参照DNA含量测定值基本相等的相对值,所述参照数据集包括与MAC相关的判别图象细胞计量特征;d)将光度校正因子应用于图象的至少所需像素,以在至少光密度标度上提供调节后的像素值,从而提供包括调节数据的调节图象,所述调节数据代表与MAC相关的判别图象细胞计量特征;和e)将调节数据与参照数据集合并,以提供改进的参照数据集。
在另一个方面中,提供了计算机控制系统。所述系统包括提供细胞数字图象的图象细胞计量仪,和可操作连接的控制器,其包括执行本文所述方法的计算机执行程序。还提供了包括计算机执行程序的计算机,以及计算机可读存储器、如本文所讨论的执行方法或包含的数据集或其他信息。还提供了根据该方法的数据集。
在包括以下详述和附图的申请中说明了本发明的这些和其他方面、特征与实施方案。另外,本文还列出了更详细讨论特定系统、设备、方法和其他信息的各参考文献;所有这些参考文献的整体内容、所有教导和公开内容都通过引用并入本文,无论这些参考文献出现在本申请的何处。


图1说明确定MAC的流程图。
图2说明从图象细胞计量仪调节图象像素的流程图。
图3a说明来自颊黏膜细胞的DNA含量柱形图。
图3b说明图3a中DNA含量柱形图的光度校正。
图4以程式化方式说明细胞的细胞计量图象和由图象产生的光密度扫描。
图5a和图5b每一个说明计算机执行的图象和特征标准化之前(图5a)和之后(图5b)所示的细胞程式化数字图象。
图6说明确定细胞样品中MAC的分层次决策流程图。
发明详述对于某些癌症如黑素瘤(皮肤癌)来说,直接从癌症患者获得细胞既不困难,也不对患者具有伤害性。但是对于其他癌症来说,直接从癌症患者获得细胞是困难的,且具有伤害性,例如对于内在性癌症如乳腺癌、肺癌、胃癌和脑癌来说就是如此。因此,提供能够通过检测相关或非相关组织中的MAC来间接检测癌症的计算机执行系统将是有利的。本发明提供了测定相关或非相关组织中MAC并发现数字图象中其他特征的计算机执行方法和计算机系统。
本文所用的相关组织指通常含有受试组织中细胞的生物样品。例如,肺痰中通常含有来自肺的片状脱落的细胞。当测试肺癌时,痰样品将认为是相关组织。相关组织的另一个例子是当用于检测乳腺癌时,相关组织是乳腺吸出物或乳腺管洗液。
本文所用的非相关组织指通常不含有受试组织中细胞的生物样品。例如,如果将痰用来检测乳腺癌,将乳腺吸出物用来检测肺癌或将颊黏膜(唇、面颊或口的内衬层)用来检测肺癌,这些都将认为是非相关组织。
图1说明了获得用于分析MAC的样品的流程图的一个实施方案。首先,从怀疑患有癌症的患者获得细胞样品102,如颊黏膜细胞。然后将细胞在悬液中进行固定104,接着,例如以分散或大致单层的方式沉积在接受表面如显微镜载玻片上106。如果需要也可以使用其他制备方案。本文所用的染色的DNA指成比例染色的DNA,例如通过结合可见的荧光染料或其他染料、抗体、标记或其他标志物,使DNA的总量以及通常是细胞核中DNA的空间分布得以测定。这种染料的一个例子是福尔根染色方法中所用的染料硫堇(thionin)。通常,DNA的染色使得能在光与样品相互作用的基础上测定DNA的量,和通常为其空间分布以及各种细胞特征,如大小、形状、结构等。这种相互作用可以采用透射(例如,DNA光吸收染料)、发射(例如,荧光染料,如碘化丙啶等或发光的染料)、反射或其他放射形式以评价细胞特征。
然后,以化学计量方式或其他成比例的方式对DNA进行染色108,使通过诸如图象细胞计量仪的仪器、在逐个细胞的基础上扫描并分析染料,从而确定DNA量和DNA的空间分布。样品可以是任何细胞样品,通常是体外细胞,但也可以是体内或原位细胞。
本文所用的对照样品指具有已知特征的生物样品或人造材料,如细胞系、正常上皮细胞、之前已分析的样品或标准化小珠。对照样品可用于对所述方法提供某些方面的质量控制,包括测量系统的控制。例如,对照样品可以是已知含有MAC的细胞或已知不含有MAC的细胞。这种生物对照可以含有生长的细胞。在这种情况下,虽然占优势的细胞群体通常为二倍体,但一些细胞也可以进行有丝分裂,有丝分裂过程中发生DNA的合成。在有丝分裂完成之前,可存在四倍体细胞,其具有双份的DNA。这些四倍体细胞通常分裂成两个子细胞。可将特定的对照样品加以染色110,和受试样品一起加工,用于指示方法误差,如总体染色。同样,对照样品还可以用于指示测定系统中的问题,例如细胞特征测定中的问题。然后使样品和对照样品在足以能从数字图象中分辨细胞特征如大小、形状、结构、DNA含量和DNA分布的光度和空间分辨率下成像。
举例来说,在某些实施例中,图象细胞计量仪提供了细胞的数字或像素化的图象,其中每个像素约为0.36微米宽,其提供了0.36×0.36μm的面积,约为0.1μm2。正常细胞的大小相差很大,因此数字图象中与细胞核或细胞相对应的像素数也不同。例如,正常上皮细胞的直径约为8-10μm,因此这种分辨率下典型细胞核的数字图象约为900像素(30×30)。如果需要,还可以使用更大或更小的细胞,以及更大或更小的像素。
然后计算光度校正因子114。该因子可对每个受试样品、样品群体进行独立的计算,或根据需要用不同的方法计算。
本文所用的光强度(OI)指样品通过例如透射、反射、荧光、发光或其他方法所发出的源光量的测定值。OI说明对目标物的数字图象在逐个像素的基础上测定的源光(raw light)。
本文所用的光密度(OD)指OD测定值,计算为局部背景的OI(通常是较大值)除以目标物图象像素的OI(小于背景的值)所得比例的对数。OD=log(OI背景/OI目标物像素)本文所用的积分光密度(IOD)指目标物图象的两个或多个像素的OD总和。例如,IOD可以计算为沿图象像素线的OD总和,或诸如DNA染色细胞核的图象部分的所有像素OD值的总和。
细胞核中的DNA量通过测定透过染色细胞核的光的比例来测定(如果需要,也可以使用诸如反射或荧光的其他系统)。然后提供样品中多个细胞中DNA含量,如光密度的柱形图或其他表示方式。在某些实施方案中,采集并分析每个样品中200至数千个细胞。然后,举例来说,使用柱形图来分析样品,以鉴定不同DNA量的细胞,更具体地说,鉴定二倍体峰或具有已知或预期DNA量的其他目标群体的积分光密度(IOD)。
本文所用的参照群体指样品中通过至少一个细胞特征测定的细胞亚群。例如,单独的大小、形状或结构或其组合可以鉴定正常上皮细胞的群体。这种参照群体可以用于测定参照量,如参照IOD。用于测定参照群体的样品还可以包括对照样品,如故意加入到样品中的细胞,如具有已知特征的细胞系、其他细胞或材料。
本文所用的参照IOD指来自参照群体的IOD值。参照IOD值可以从来自参照群体的平均值、众数、中值或其他值来测定。为了便于说明,这种参照IOD可以表示在柱形图上,如IOD或DNA染色的细胞对频率所作的柱形图。
通常,样品的二倍体峰是最占优势的细胞群体,但是,也可以使用来自参照群体的其他参照点,如四倍体峰。如本文所述,由于各种原因,样品与样品之间或各批样品之间会发生染色差异。因此需要使用调节这些样品中细胞图象的标准化或其他方法来调节这些染色差异,从而可以直接比较其DNA含量、DNA分布或其他细胞特征。
本文所用的目标IOD指实验常数,如为了方便、计算简单或其他实际考虑而选择的IOD值,例如为100的IOD。目标IOD也可以来自对照样品、参照群体或具有已知或预期特征的其他有用材料。其他目标参照也是合适的,如目标OI或目标OD。
为了完成图象标准化,计算每个所需样品的光度校正因子。例如,假设在受试样品(参照群体)二倍体峰处测得的IOD为120,光度校正因子计算为参照群体的目标IOD/测量IOD。这种情况下,算法为100/120,生成该受试样品的光度校正因子约为0.833。该光度校正值提供了标准化数字图象的方法,从而校正由例如染色差异所致的DNA含量和其他细胞特征(本文所用的细胞特征指从细胞图象确定的光学特征)。
本文所用的参照数据集指任意已知的数据集,包括下列信息,如细胞核图象,或从细胞核图象计算的特征,如大小、形状、结构等,其单独或组合来指示MAC的存在。这种参照数据集可以存储在计算机存储器、磁盘或任意其他有用的数据存储介质中。例如,参照数据集可以是细胞特征的集合,或细胞特征的组合,或者是在取自非癌变个体的各样品上测得的判别函数分析结果。举例来说,这种参照数据集可以用于比较受试样品的MAC值。
使参照数据集的光密度或其他光学强度测定值与待检验样品相关联。
适于判别MAC的光学特征可以在实验室中测定,或者参考如上文所引用的论文或专利,如Finch,et al.;Klawe et al.;US Patent no.5,889,881;US Patent no.6,026,174加以确定。
然后,通过将光度校正因子应用于受试样品中每个所需细胞的数字图象的每个所需像素或像素组的OD,进行数字图象标准化116。这样,数字图象得以标准化116,接着,从标准化数字图象计算的每个所需细胞特征得以自动标准化。这些标准化的细胞特征可以用来对细胞进行分析和分类118,和用来比较以参照数据集和受试样品代表的非癌变个体间MAC的存在。光度校正因子可应用于从其余图象分割或以其他方式分离的细胞,或应用在图象中的所有目标物上,或应用于所需的图象。对于光密度来说,目标物由测量上比背景大的像素或像素组表示在图象中。目标物还包括本身不具有这种光密度、但位于诸如细胞核周的结构或建立的边界中的像素。例如,对应于细胞中基本为空的胞浆的像素可以具有低光密度,因此与背景光密度基本相似,但仍属于目标物的范围,因为它们位于细胞膜中,所述膜可以通过常规分割技术(routinesegmentation techniques)鉴定。虽然以一定详细的方式讨论了OD,但可以使用所述类似方法来校正数字图象,使表示为OI或IOD的数字图象标准化。同样,虽然特定的例子讨论了OD和光吸收染料、光度校正因子偏差(例如可以使用数字图象标准化来校正福尔根法染色差异的校正因子),本文所述计算方法提供了减小方法变量,如染色的一般方法和算法,更具体的提供了DNA和MAC的改进评价方法(例如诊断性地用于检测癌症、评价良好性等)。
将还称为调节系数的光度校正因子应用于图象目标物中的所需像素,在至少光密度标度上提供调节后的像素值,从而提供调节的图象。然后,将来自调节后的像素值的数据或光学特征与参照数据集中的光学特征相比较,判别样品中的光学特征,从中确定样品是否包含MAC。如果需要,还可以测定和/或应用光度校正因子,以在光强度标度上提供调节后的像素值,其为图1中的总体特征标准化116。然后对图象进行分类118,在样品细胞上测定MAC 120。如果需要,还可以对照群体统计值来比较并二值化(thresholded)MAC表达数据,以校正细胞中的正常表达模式。
图2说明了本发明标准化或校正方面特征的一个实施方案的流程图。首先,提供在适于进行有目的分析的足够光度和空间分辨率条件下记录的细胞材料的至少一个数字图象202。图象可以是任意适当的可疑性组织的图象。本发明方法和系统的某些方面可以应用于癌变或非癌变组织的其一或二者,虽然对于MAC的测定来说,组织通常选自基本非癌变的组织。样品包含具有成比例染色DNA的足够细胞,以测定细胞特征,如大小、形状、结构、DNA含量等,并鉴定特定的参照细胞群体。
根据一个或多个细胞特征或细胞特征的组合(如限定参照群体)分析细胞,将目标图象进行分组204。然后分析参照群体,例如二倍体细胞206,以确定从参照群体的诸如平均值、众数、IOD峰值或中值的群体值中测得的参照IOD。
然后,确定调节系数,如光度校正因子208。在该实例中,光度校正因子从目标IOD/参照IOD计算得到。接着,将该光度校正因子应用于来自样品的每一个所需数字图象的所需像素210。这种情况下,这一调节系数(光度校正因子)将标准化所需的数字图象,从而校正由于染色差异或其他人为因素所致的光密度或染色深度上的差异,这种差异不同于细胞中DNA量所致的光密度差异。所需的像素通常是目标物边界中的所有像素或所需像素组,如细胞核的数字图象,但如果需要的话,也可以选择较大或较小的亚组。
然后,从调节的像素计算细胞特征212(标准化的图象)。作为图象标准化的结果,计算自标准化图象的所有细胞特征都得以自动校正。单独或组合使用这些校正特征以形成进一步识别细胞或细胞群的分类器(classifier)。将通过分类器从细胞或细胞群中得到的值与参照数据集相比较214,以确定诊断信息,如样品中一个或多个细胞中MAC存在与否。MAC的确定可以包括分析细胞个体或细胞群体的细胞特征或细胞特征的组合,其可以与参照数据集进行比较。然后,MAC的确定用来确定患者是否患有癌;如果患者表现出较高的MAC特征,则患者具有患癌症如肺癌、乳腺癌、皮肤癌、脑癌或其他癌症的较大可能性。
图3a和图3b提供了说明校正前后积分光密度(DNA含量)柱形图的图。如图3和4所示,光学评估可以基于细胞的积分光密度。在替代的实施方案中,光学评估可以基于所需像素的光密度、光强度或积分光密度,如以线、柱或其他有用组合形式的这些数据。
在图3a中,细胞的DNA含量柱形图301具有二倍体区302,其在二倍体峰305的每一侧延伸有两个肩区(SD)。在所述样品中,大多数细胞落在二倍体区302。一些细胞处于DNA合成阶段303,还有一些细胞已完成了DNA合成,落在四倍体区304。根据化学计量,(并假设测量仪具有线性),群体IOD峰304的峰值是二倍体峰305的峰值IOD的二倍;如果需要也可以建立非线性关系,因此本文采用各种方法。对照样品(参照)的峰IOD表示为306。
图3b说明了通过光度校正因子对图3a的DNA柱形图进行校正、从而使DNA二倍体峰305向下校正20%以与目标IOD值306相匹配。因此,该受试样品需要约为0.833(即100/120)的光度校正因子,其可随之应用于柱形图301中每个所需细胞的IOD测定值,从而提供受试样品中所有所需细胞的校正IOD,表示为307。
因而,使样品的参照群体和目标IOD的相对强度值与基于细胞中DNA量的细胞光密度基本相等。
柱形图的统计精确度将随所采集的其他数据而变化。因此,在某些实施方案中,样品IOD可以迭代校正。如果需要的话,这种迭代可以持续到满足特定的条件。例如,可以在200个细胞的群体在二倍体区或峰中积累之后进行,一直持续到来自样品的2000个细胞位于该区域。这种动态(on-the-fly)过程的一个优点是可以更改图象的获得和二值化,从而减少碎片的获得,和/或相反改善数据采集和分析的效率。
图4说明了确定细胞结构特征的一个例子。沿着细胞核的数字图象402测定光密度(OD),并沿着线404对像素OD进行求和。以406所指的箭头方向穿越图象从左到右移动所述积分线404,以建立图谱408,当结束时,所述积分线404显示为完成的图谱410。
图5a和5b提供了DNA染色的细胞核的程式化数字图象502、516的相应视图,如图4中所扫描的。
在图5a的代表性数字图象502中,所有的图象像素都具有光密度(OD)。显示具有相同OD的代表性像素组506分布在整个数字图象中。分析线504表示为要求和的像素柱,从而从该柱生成积分光密度(IOD)。当分析线504穿越数字图象502移动时,对每个柱计算IOD值,并表示在柱形图508中。下面的表510示出了从数字图象502获得并由柱形图508表示的这些IOD值的数值表达。
可以从数字图象计算各种细胞特征。在该实施例中,对相邻IOD值柱之间的数值差进行求和,并求每一个这些值的平方值。计算柱形图510中相邻柱之间的IOD差(如A与B之间的差为120-72=48)。然后,在这种代表性的细胞特征计算中,对这些差值平方并求和,以产生单个代表性的特征值512,在本例中,它是具有值为12,056的细胞特征。
如果校正因子,如得自图4的0.833,乘以这一平方和的值(12,056),则得到值为10,043的一个新特征值514。
图5b所示为通过标准化或光度测定所校正的数字图象502而获得的调节数字图象516。通过在特征计算之前用光度校正因子(0.833)调节像素OD和求和的IOD来校正图象。
图5b所示为数字图象502中的每一个所需像素OD乘以0.833校正因子以产生的标准化数字图象516。该方法还可见于具有待校正OD 520的代表性像素值,以生成在加工数字图象516中的OD值518。一旦校正因子被应用于数字图象502的每一个所需像素,(称作总体图象标准化的过程)所得的数字图象516即为标准化的。
如图5a所示,对图5b标准化数字图象516中的每个像素柱的OD值进行求和,以生成各柱的IOD。其还进一步通过数字图象下方出现的IOD柱形图520表示。然后将图5a中所用的算法应用于来自标准化数字图象516的、在IOD柱形图520中表示且在表522中以数字形式表示的IOD值。在本例中,对于相同代表性细胞特征生成为8,400的值524,其与为12056的值512或值为10043的直接校正特征514不同,且更具代表性。对图象标准化之后计算的细胞特征进行自动标准化,因此,更贴切地表示不受染色差异影响的图象光学特征。这些标准化(或校正的)细胞特征保持使测量样品之间的差异得以更好判别的能力。当试图测定细微的细胞特征如癌相关的变化时,这种光度校正和数字图象标准化具有独特的适用性,所述癌相关的变化部分地由细胞核中DNA空间分布的测定值所指出。同样,除了校正染色差异之外,一般的方法还提供了计算调节系数以有助于校正其他与方法相关的变量的手段。
与图象数据的调节类似,当从正常或MAC细胞(或待研究的其他特征)获得其他信息时,参照数据集可以含有可随后离散或连续被标准化、调节、更新(updated)的图象或特征。因此,如果需要,参照数据集和样品图象都可以离散或连续地动态更新,或根据需要以其他方式更新。
图6说明包括测定MAC的计算步骤的流程图,例如在颊黏膜中检测肺癌。该图说明了一种类型的细胞特征计算,通常计算并分组其他许多细胞特征,以形成能够得出结果的判别函数(例如细胞分类器),例如可以使用形状、尺寸和所示细胞结构特征来鉴定细胞类型,如上皮细胞。在图6中,进行图象数据收集602,然后确定参照群体603,计算光度校正因子604,在本文其他地方进行更全面的讨论,例如参考图1和2,还参照下文。判定点(decision point)606确定是否满足至少一个选定标准。如果满足,则在所述实施方案中,将图象进行总体图象标准化608,然后进行特征计算610。判定点612确定目标物是细胞还是人造材料,如果其是细胞,则在判定点614处对细胞进行分析,以确定其是否是要寻找的细胞类型,如具有二倍体特征的正常上皮细胞。在所示的实施方案中,然后在群体统计学的基础上,逐个细胞616地、逐个载玻片618地计算MAC分值。可以将对于载玻片计算的统计值如MAC分值与步骤619所示的参照数据集相比较,得到结果620,以指示样品中MAC的存在与否,或得到其他的诊断信息。
对于某些实施方案的其他讨论,本发明针对计算机执行的方法,以确定在图象识别或其他目的中有用的细胞特征或更常用的光学特征。在某些实施方案中,该方法包括对基本非癌变组织样品的数字细胞计量图象进行分析,如果需要的话,还包括记录。举例来说,所述组织样品可以通过活组织检查从切除组织、细针吸出物;从痰、组织刮取物、乳头吸出物中获得,或者根据需要以其他方式获得。样品可以取自潜在的癌症患者,取自作为跟踪监视治疗的部分患者,取自检测残留疾病或评价康复程度的患者,或筛选高危群体,如吸烟者,或者根据需要以其他方式获得。该方法还可应用于所有组织和其他各物种。
样品包含足够的细胞,以确定具有特定DNA含量的参照细胞群体。细胞通常成比例地染色,使染色量与细胞中的DNA量成比例。这种化学计量方式染料的例子包括福尔根染料和其他染料、标记物、标志物等。
在特定方面中,本发明提供了包含MAC指示性特征的参照数据集,其中所述参照数据集通过从表现MAC的细胞积累数据而随时间生成。根据本文所讨论的方法在细胞的数字化图象并入到参照数据集时或之前进行标准化,以提供改进的数据设定值。因此,除了确定MAC的方法,本发明还提供了计算机执行程序、计算机可读存储器和包含这类程序和存储器的计算机(本文所用的计算机或控制器包括单独的计算机、作为网络一部分的计算机、具有外围设备的计算机或适合用于本发明的任意其他逻辑执行设备)。因而,参照数据集包括与MAC相关的判别成像细胞计量特征。
光度校正因子调节光学测量值,从而使二倍体细胞具有相对参照数据集相等的DNA含量值,例如所述参照数据集每个设定为1或100,对于具有四倍体峰的二倍体细胞设定为2或200。因此,特定DNA含量细胞的光学测量值基本调节至对应于参照数据集中的预定目标值,所述参照数据测定值包括指示MAC存在与否的光学测定值。另外,参照数据集还可含有MAC的判别特征,直接或参照和这些特征相关的数据设定值(例如,光度校正因子可以直接应用于包含MAC的参照数据集本身,或通过与其对照的中介数据集,标准化样品和MAC数据组)。这使新样品的染色水平和样品数据设定值中观察或平均或其他方式获得的染色水平相一致。
然后将光度校正因子应用于图象中任意所需的像素,以在至少光密度标度上提供调节后的像素值,以提供标准化的数字图象。通常,所需的像素位于目标物中,所述目标物指图象中具有低于背景的强度水平(即比背景发射少)的任意物体,或在诸如细胞膜或其他部分或完全圆周的任意区域中的任意物体。例如,在细胞核、核仁或细胞质的图象中,有些图象具有与背景基本相同的强度水平或光密度,但像素位于目标物中,因此实际为细胞的一部分。通常,首先在光密度标度上计算调节的像素值,然后,如果需要的话,在光强度标度上计算调节的像素值。这提供了调节的图象。接着,将得自调节像素值或图象的数据或光学特征与参照数据集相比较,以判别样品中的光学特征。从这些光学特征可以确定样品包含MAC的可能性。换言之,光学特征计算自标准化的数字图象,然后将从标准化图象确定的光学特征与参照数据集相比较,以确定样品是否包含MAC。
通常,可以通过将给定的测定量或值乘以光度校正因子来校正光强度、IOD、校正的DNA含量测定值等。光学测量值可以包含测定积分光密度(IOD),参照数据集可以包含目标IOD,光度校正因子可以确定为目标IOD/测量IOD。数字图象可以包含光强度信息,光强度可以通过将光强度乘以光度校正因子来校正。
在某些实施方案中,该方法的各特征可以迭代应用。例如,分析DNA含量细胞以确定初始DNA含量测定值,当所需数目的其他细胞进行扫描或成像时,光度校正因子的确定可以重复至少一次,从而准备用来分析。例如,成像样品中这种细胞群体可包括约50、100、200、500或1000个以上细胞。
如果需要,还可以伴随每次迭代,重复将光度校正因子应用于目标物中所需像素和将得自调节像素值的数据与参照数据集相比较的特征。如果需要,该方法各特征的迭代重复可以以一比一的比例迭代,或者某些特征比其他特征迭代得更多或更少。这种迭代可以提供改进的调节像素值,与MAC相关的至少一个光学特征的改进的测定值,优选多个与MAC相关的光学特征。
通常,所述调节为将光度校正因子应用到图象中目标物的基本上所有像素,进一步优选该目标物中的所有像素。如果需要,可以将光度校正因子应用于图象中的所有像素,不论其是否在目标物中。
在某些实施方案中,提供了一个或多个对照。对照提供具有已知光密度的已知物质的至少一个像素化细胞计量图象。对照可以和样品相分离,或和样品同时或先后染色。对照可以是或不是可染色的物质。可以使用非线性函数或线性函数来确定与MAC相关的光学特征。如果需要,还可以使用其他函数。MAC的确定可以包括测定细胞群体的细胞核中染色质分布的细胞群体值的至少一个位移。
在某些实施方案中,患者怀疑患有选定的特定癌,样品可以来自相关组织或非相关组织。例如,选定的癌可以是内在性癌,即位于人体内、不由外科医生采取伤害性行动就不易接近的癌。示例性的内在性癌症包括肺癌和乳腺癌,但不包括皮肤癌或唇癌(除非黑素瘤或唇癌位于皮肤的深处,获得癌症样品需要破坏重要的健康组织或导致明显不适)。可获得的组织是指外科医生容易得到的组织,例如皮肤、颊黏膜、乳头吸出物和管洗液。在某些实施方案中,共同的(collective)癌是肺癌,非相关组织是颊黏膜;而在其他的实施方案中,选定的癌是乳腺癌,非相关组织是颊黏膜、乳头吸出物和管洗液中的任意一种。患者可以是任意合适的动物,通常是人类。
另外,本发明还提供了计算机控制的系统,包括提供细胞的像素化图象的图象细胞计量仪和可操作连接的控制器,控制器包括执行本文所述方法的计算机执行程序。还提供了计算机或控制器本身,以及包含并执行本文所述程序和/或包含或执行本文所述参照数据集的计算机存储器。
本文所用的术语都根据其常规含义使用,除非上下文或定义指示有其他含义。除非指明,除在权利要求书中之外,“或”的使用包括“和”,反之亦然。除非声明,非限制性的术语不应理解为限制性的(例如,除非声明,“包括”、“具有”和“包含”指“非限制性地包括”)。
本发明的范围包括装置加功能和步骤加功能。但是,本申请中提到的术语在权利要求中不能解释为“装置加功能”关系,除非权利要求中具体引用了“装置”一词;只有在权利要求中具体引用了“装置”一词,才能在权利要求中解释为“装置加功能”关系。同样,本申请中提到的术语在方法或工艺权利要求中不能解释为“步骤加功能”关系,除非权利要求中具体引用了“步骤”一词;只有在权利要求中具体引用了“步骤”一词,才能在权利要求中解释为“步骤加功能”关系。
从上文可以理解,虽然本文中示例性地讨论了本发明的特定实施方案,但在不背离本发明实质和范围的情况下可以进行各种改动。因此,本发明包括这类改动和本文所提出的主题的所有排列与组合,本发明只受到附加的权利要求的限制。
权利要求
1.一种光度校正数字图象的计算机执行方法,用于分析细胞特征,以确定癌相关的变化(MAC),该方法包括a)提供DNA染色细胞样品的至少一个数字图象,所述样品包含足够的细胞,以确定具有特定DNA含量的参照细胞群体;b)确定光度校正因子,其将特定DNA含量细胞的光学测量值基本调节至预定目标值,所述预定目标值对应于参照数据集内的光学测量值,参照数据集包括指示MAC存在与否的光学测量值;c)将光度校正因子应用于数字图象的所需像素,以提供标准化的数字图象;d)从标准化的数字图象计算光学特征;和e)将从标准化图象确定的光学特征和参照数据集相比较,以确定样品是否包含MAC。
2.权利要求1的方法,其中所述特定DNA含量细胞是二倍体细胞,并且确定所述光度校正因子,从而使样品中二倍体细胞和参照数据集中二倍体细胞的校正DNA含量测定值具有约为1的相对值,四倍体细胞的校正DNA含量测定值具有约为2的相对值。
3.权利要求1的方法,其中所述方法还包括确定样品是否确实包含MAC。
4.权利要求1的方法,其中所述光学测量值包括测量积分光密度(IOD),参照数据集包括目标IOD,并且光度校正因子为目标IOD/测量IOD。
5.权利要求1的方法,其中所述数字图象包含光强度信息,所述光强度通过将光强度乘以光度校正因子得以校正。
6.权利要求1的方法,其中所述方法还包括至少一个下述步骤将光度校正因子应用于图象目标物中的至少所需像素;和为光密度和积分光密度中的至少一个提供调节后的像素值。
7.权利要求1的方法,其中所述方法还包括当对样品中明显较多的细胞进行分析时,通过重复至少b)和c)至少一次来提供改进的校正系数。
8.权利要求7的方法,其中所述方法还包括当提供样品中约200个以上细胞的额外群体时,重复至少b)和c)至少两次,以提供改进的校正系数。
9.权利要求7的方法,其中所述方法还包括使用改进的校正系数重复至少d)和e),以提供改进的调节后的像素值和改进的至少一个光学特征的确定值。
10.权利要求1的方法,其中所述染色DNA通过福尔根染色法染色。
11.权利要求1的方法,其中所述染色DNA用光吸收染料染色。
12.权利要求1的方法,其中所述方法还包括提供至少一个对照物,包括提供具有已知光密度的已知物质的至少一个数字图象。
13.权利要求12的方法,其中所述方法还包括与组织样品基本同时对对照物进行染色。
14.权利要求1的方法,其中所述方法还包括从调节的像素值中确定多个光学特征,多个光学特征中的至少一个使用非线性函数确定。
15.权利要求1的方法,其中所述参照数据集还包括参照细胞的数字图象。
16.权利要求1的方法,其中所述方法还包括将光度校正因子应用于图象目标物中的基本所有像素。
17.权利要求1的方法,其中所述样品得自可能患有选定癌的患者,所述样品来自非相关组织。
18.权利要求17的方法,其中所述选定癌是内在性癌症,所述非相关组织是可得到的组织。
19.权利要求18的方法,其中所述选定癌是肺癌,所述非相关组织包括颊黏膜。
20.权利要求18的方法,其中所述选定癌是乳腺癌,所述非相关组织包括颊黏膜、乳头吸出物和管洗液中的至少一种。
21.权利要求1的方法,其中所述基本非癌变组织样品是人类样品。
22.一种计算机控制的系统,包括提供细胞的数字图象的图象细胞计量仪,和可操作连接的控制器,所述控制器包括执行权利要求1中所述方法的计算机执行程序。
23.一种计算机,其包括执行权利要求1中所述方法的计算机执行程序。
24.一种制作数据集的方法,所述数据集包括与MAC相关的判别图象细胞计量特征,所述方法包括a)提供包含成比例染色DNA的细胞样品的数字细胞计量图象,所述样品包括足够的细胞,以提供具有特定DNA含量的细胞的DNA含量测定值;b)分析具有特定DNA含量的细胞,以确定DNA含量的光强度、光密度(OD)和积分光密度(IOD)值中的至少一个,以提供初始DNA含量测定值;c)确定调节初始DNA含量测定值的光度校正因子,以提供特定DNA含量细胞的校正DNA含量测定值,其中校正DNA含量测定值具有与参照数据集中基本等量DNA含量的细胞的参照DNA含量测定值基本相等的相对值,所述参照数据集包括与MAC相关的判别图象细胞计量特征;d)将光度校正因子应用于图象的至少所需像素来标准化图象,从而在至少光密度标度上提供调节后的像素值;e)将从调节后的像素值确定的光学特征和参照数据集相比较,从而确定包含MAC的样品;和f)将从调节后的像素值获得的光学特征与参照数据集合并,以提供改进的参照数据集。
25.权利要求24的方法,其中所述方法还包括预先选定样品以使样品已知包含MAC。
26.权利要求24的方法,其中所述特定DNA含量细胞是二倍体细胞,并且确定所述光度校正因子,从而使样品中二倍体细胞和参照数据集中二倍体细胞的校正DNA含量测定值具有约为1的相对值,四倍体细胞的校正DNA含量测定值具有约为2的相对值。
27.权利要求24的方法,其中所述方法还包括将光度校正因子应用于图象目标物中的至少所需像素。
28.权利要求24的方法,其中所述方法还包括当对样品中明显较多的细胞进行分析时,通过重复至少b)和c)至少一次来提供改进的校正系数。
29.权利要求28的方法,其中所述方法还包括使用改进的校正系数重复至少d)和e),以提供改进的调节后的像素值和改进的至少一个光学特征的确定值。
30.权利要求24的方法,其中所述成比例染色的DNA通过福尔根染料染色。
31.权利要求24的方法,其中所述方法还包括从调节的像素值中确定多个光学特征,多个光学特征中的至少一个使用非线性函数确定。
32.权利要求24的方法,其中所述方法还包括从调节的像素值中确定多个光学特征,多个光学特征中的至少一个使用线性函数确定。
33.权利要求24的方法,其中所述方法还包括确定细胞群体值中的至少一个位移,其测定细胞群体内细胞核中的染色质分布。
34.一种制作数据集的方法,所述数据集包括与MAC相关的判别图象细胞计量特征,所述方法包括a)提供表现出MAC的组织样品的数字细胞计量图象;b)分析样品中具有特定DNA含量的细胞,以测定DNA含量的光强度、光密度(OD)和积分光密度(IOD)值中的至少一个,以提供初始DNA含量测定值;c)确定调节初始DNA含量测定值的光度校正因子,以提供特定DNA含量细胞的校正DNA含量测定值,其中校正DNA含量测定值具有与参照数据集中基本等量DNA含量的细胞的参照DNA含量测定值基本相等的相对值,所述参照数据集包括与MAC相关的判别图象细胞计量特征;d)将光度校正因子应用于图象的至少所需像素,以在至少光密度标度上提供调节后的像素值,从而提供包括调节数据的调节图象,所述调节数据代表与MAC相关的判别图象细胞计量特征;和e)将调节数据与参照数据集合并,以提供改进的参照数据集。
35.一种计算机,包括执行权利要求24所述方法的计算机执行程序。
36.一种计算机,包括执行权利要求34所述方法的计算机执行程序。
37.一种计算机可读存储器,包括执行权利要求24所述方法的计算机执行程序。
38.一种计算机可读存储器,包括执行权利要求34所述方法的计算机执行程序。
39.根据权利要求24所述方法生成的数据集。
40.根据权利要求34所述方法生成的数据集。
41.一种计算机,包括具有权利要求39所述数据集的计算机可读存储器。
42.一种计算机,包括具有权利要求40所述数据集的计算机可读存储器。
43.一种计算机可读存储器,包括权利要求39所述数据集。
44.一种计算机可读存储器,包括权利要求40所述数据集。
全文摘要
涉及处理、分割和特征标准化数字图象的计算机程序、系统等。所述图象是细胞图象,所述方法用于检测细胞中的癌相关变化(MAC),其可被用来检测癌症。所述程序和方法通过检测另一组织,如相关组织或非相关组织中的MAC来检测癌症。相关组织的例子包括可检测乳腺癌的乳头吸出物和检测肺癌的痰或支气管灌洗液。非相关组织的例子包括检测肺癌或乳腺癌的颊黏膜。
文档编号G01N33/483GK1679047SQ03820647
公开日2005年10月5日 申请日期2003年8月22日 优先权日2002年8月29日
发明者卡卢姆·E·麦考莱, 阿列克谢·K·杜德凯恩, 大卫·M·加纳, 马丽亚·Us-克拉绍韦茨, 玛格丽塔·弗莱萨尔, 马里奥·日加内茨, 亚卡·拉夫连恰克, 布兰科·M·帕尔西克, 加里·W·弗格森 申请人:加拿大英属哥伦比亚癌症研究所, 普塞普托尼克斯医疗有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1