采用多种单一标记探针使单个mRNA分子成像方法

文档序号:580965阅读:447来源:国知局
专利名称:采用多种单一标记探针使单个mRNA分子成像方法
技术领域
本发明通常涉及核酸序列的检测方法。
背景技术
人们越来越清晰地认识到,基因在个体细胞中的表达可明显偏离细胞群体的平均 水平,非常需要能提供个体细胞mRNA精确计数拷贝数目的新方法。更理想的方法同时还能 揭示mRNA的细胞内的定位,因为mRNA的位置也常被细胞用来从空间上限制基因活性。显微镜分析之后的原位杂交是一种已为人们认可的研究基因表达的方法。第一代 原位杂交是用放射活性探针实现的。早期的改进涉及将探针连接到催化显色反应或荧光反 应的酶上。然而,由于这些反应的产物是小分子或沉淀物,可从探针弥散出去,因此不能准 确定位靶分子。相反,直接用数个荧光分子标记的探针保持了空间分辨率,但所能实现的敏 感性相对较差。罗伯特·森格(Robert Singer)及其同事开发了一种原位杂交方法,该方法不仅 具有足以检测单链mRNA分子的灵敏度,而且将信号限制在离靶分子很近的位置。他们用5 个寡核苷酸探针同时杂交到一个靶mRNA分子,每个探针的长度约为50个核苷酸并用5个 荧光分子配基标记。虽然作者令人信服地证明单分子的灵敏度,其他团体也已成功地使用 这些探针,但该系统还没有被广泛采纳。其中一个原因是合成和纯化这种多标记寡核苷酸 是很困难的。通常情况下,荧光分子配基是通过在合成过程中掺入到核苷酸中的一级氨基 基团引入的。把多个氨基基团引入到同一个寡核苷酸时,有些氨基基团会因为侧链反应如 转酰氨基作用而丢失。荧光分子和剩余氨基基团的耦合是低效的,需要连续数个偶联反应, 另外,把所有设计位点都耦合的寡核苷酸从那些只有部分耦合的荧光分子中纯化出来时非 常困难的。此外,当一些荧光分子以多拷贝出现在同一寡核苷酸上时会相互作用,改变寡核 苷酸的杂交特性,并且表现出严重的自淬灭。如果每个探针仅有一个氨基末端基团作为附 加位点就可以避免这些问题。大量使用多标记的探针的另一个问题是,对于每个未与靶分子结合的探针,相当 部分的荧光都丧失了,而所有的非特异性结合事件都会增加背景。这导致结合到每一靶 mRNA上的探针的数目的分布宽泛。例如,!^mino等人估计,当使用5个针对单个基因的荧 光探针时,所观察到的大部分的荧光点的强度却显示只有1或2个探针存在。Science 280, 585-590(1998).这使得它很难明确地确定这些荧光点是mRNA分子,因为它无法确定所检 测到探针来自和靶mRNA的真正结合还是非特异性结合。“阈值”问题限制了这种方法提供 单细胞中mRNA可靠数目的能力。因此,仍有需要能提供单个细胞中的mRNA可靠数目的改进的方法,以及易于合成和纯化的探针。

发明内容
本发明提供了一种使用多种单一荧光标记(即用相同的荧光分子标记)的核酸杂 交探针,检测在固定化、透性化的细胞中单个核酸分子诸如以RNA分子为例(如mRNA分子) 的方法。发明人惊奇地发现,如果至少30种,优选40-60种,最优选48种用同种荧光分子 标记的不同探针,同时和mRNA分子的靶序列进行杂交,多种探针的累加荧光就可以产生可 检测的荧光斑点。这些探针是非重叠的,即,和每种探针杂交的靶序列区是独一无二的(或 非重叠的)。针对选定靶序列的一组探针(30种或更多),可以设计成彼此相邻杂交或不相 邻杂交;而靶序列延伸区的(从一个到一百个或更多的核苷酸)与任何探针都不互补。因 此,一方面,本发明提供了一种探测在固定化的、通透化的细胞中核酸分子诸如以RNA分子 为例(如mRNA分子)靶序列的方法,所述靶序列包括具有15-100个核苷酸的非重叠的至 少30个探针结合区,包括将所述细胞浸入过量的至少30种核酸杂交探针中,每种探针都 用相同的荧光分子单一标记,并且每种探针都含有与靶序列的不同探针结合区互补的核酸 序列;清洗所述固定化细胞以去除非结合探针;和检测所述探针发出的荧光。本发明所用的探针可以是DNA、RNA或DNA和RNA的混合物。所述探针可以包括非 天然核苷酸,也可以包括非天然的核苷酸间连键。能增加探针结合亲和力的非天然核苷酸 包括2' -0-甲基核苷酸。对于具有一般结合亲和力的典型的DNA或RNA,本发明所用的探 针的长度为15-40个核苷酸。优选的DNA探针或RNA探针的长度在15-20个核苷酸范围, 更优选为17-25个核苷酸,最优选为17-22个核苷酸。本发明构建了约20个核苷酸长度的 探针。如果探针中包括增加其结合亲和力的方式,正如本领域技术人员所理解的,该探针可 以更短至仅有7个核苷酸。荧光分子可以连接到探针的任何位置,包括但不限于,将荧光分 子连接到探针的一端,优选3'端。探针可以包含在含有过量的多种探针的杂交液中,通常 在0. 2-1纳克/微升范围。加入足量的杂交液覆盖并湿润细胞,使细胞浸浴在含有探针的 溶液中。可以同时对一个细胞探测多个mRNA靶序列,既可以是一个mRNA分子中的一个以 上的靶序列,也可以是不同的mRNA分子中的一个或多个靶序列。另外,mRNA分子的一个靶 序列可以用一组以上的探针探测,其中每组探针用不同的荧光分子标记,并且荧光分子是 可区分的。例如,在探测一种基因序列时,可以使用至少30种绿色荧光标记探针把该基因 序列的一部分作为靶序列来探测,并且也可以使用至少30种红色荧光标记探针把该基因 序列的不同区域作为靶序列来探测。根据本发明,多个靶位中的每一个使用一种以上颜色, 在高度多元探测方法中允许使用颜色编码策略。本发明的方法可以包括简单观察代表靶序列的一个或多个斑点是否存在。根据本 发明的方法还包括计数与给定mRNA相对应的给定颜色的斑点。如果想要检测一种以上的 mRNA,可以在同一杂交混合体中使用用不同的荧光分子标记的不同的探针组。通过计数不 同颜色的斑点构建每种mRNA的基因表达谱。斑点可以用显微方法检测。因为宽视场荧光显微镜已经足够,所以没必要使用共 聚焦显微镜。为了区分正面地反映靶序列的斑点和反映背景荧光或非特异性结合的暗斑 点,根据本发明的方法还包括检测步骤。在一种实施方案中,该检测步骤包括用三维线性拉普拉斯高斯滤波器过滤图像,并使用检测阈值。如果用三维空间的所有斑点数目对从0到 该滤波图像的最大强度的所有阈值作图,则存在一个很宽的平台区,代表该区域内斑点数 对阈值不敏感。因此,该方法还进一步包括绘制斑点的数目、确定平台区的边界,以及在该 区域内选择最佳阈值。在另一个方面,本发明包括原位杂交的探针组,用于检测细胞中的单个mRNA分 子。这些探针使得每个分子的荧光足够强,在荧光显微镜下作为小的荧光斑点可以被看到。可以用电脑程序来鉴定和计数来自显微图像的细胞中的所有mRNA分子。使用上 述探针组进行原位杂交,允许精确、简便的基因表达分析,检测病原和致病状态,如癌。因此,在另一个方面,本发明提供了一种筛选能改变靶序列亚细胞分布的量的化 合物的方法。该方法包括将细胞用.测试化合物孵育足够时间诱发反应,检测靶序列分布 模式的量,并用该靶mRNA的量或分布与对照细胞(采取相同处理但未用测试化合物孵育的 细胞)靶mRNA的量或分布进行比较。另一个方面,本发明提供了一种计算机可读介质,该介质包括以下指令获取二维 荧光图像的三维堆叠(3-D stack);使用三维滤波器过滤所述三维堆叠;计算所述过滤的 三维堆叠中多个不同强度阈值下的三维斑点总数;在用三维斑点总数对强度阈值的所绘的 平面图上获得代表平台区的最佳强度阈,并在此强度阈值上计算总数;以及用在所述最佳 强度阈值上获得的三维斑点总数作为代表在所述三维堆叠中检测到的荧光粒子的总数。本发明还提供了一种试剂盒,该试剂盒通常包括如上所述的探针组和计算机可读 介质。


图1显示的是同时检测单个mRNA分子上的独特序列和重复序列。图IA是所用的 构建体示意图。用于检测绿色荧光蛋白(GFP)编码序列的48种探针用Alexa-594标记,用 于检测3'-非编码区(3' -UTO)中串联重复序列的4种不同探针用四甲基罗丹明(TMR) 标记。图IB显示进入Alexa-594通道(左)和TMR通道(右)(分别对应GFP编码区探针 和UTR探针)的CHO细胞的一对Z-堆叠(Z-Mack)荧光图像的最大强度合并。图IC显示 图IB中用红色(GFP)方框和绿色(UTR)方框框住的图像的假性颜色合并,红色圆环代表计 算鉴定的GFP的mRNA颗粒,绿色圆环代表UTR颗粒,黄色圆环代表共定位颗粒。所有比例 尺的长度都是5微米。图2显示共定位斑点的强度分析。通过计算鉴定的该斑点区的最大强度减去该斑 点周围环形区的平均强度来计算与GFP靶探针(Alexa-594通道,y轴)相应的斑点强度和 与UTR靶探针(TMR通道,χ轴)相应的斑点强度。边缘的柱形图显示了 GFP斑点强度(右) 和UTR斑点强度(上)的分布。图3显示当使用不同数量的探针时本方法的灵敏度。图3A显示斑点强度(斑点 区的最大强度减去该斑点周围环形区的平均强度来定义)作为选择的探针数目函数。12种 探针和M种探针的强度是人为的,因为那些情况中斑点不容易鉴定,所以所鉴定的斑点偏 亮。图:3B显示用阈值处理后的滤过图像的斑点数目(即连通分量)作为阈值数值(对于不 同数量的探针,阈值数值的范围是从0到滤波图像的最大强度(归为1))的函数绘图。灰 色短线显示对图3A进行分析时所用的阈值。
图4显示了本方法与!^emino等的mRNA检测方法(Science 1998)的比较情况。图 4A是本发明所描述方法(48种单一标记探针)(左)和!^mino等的方法(其中每种具有 45个碱基对的探针都含有5种荧光分子,靶分子是中华仓鼠卵巢细胞转基因表达的靶mRNA 的3' UTR中的32次重复的序列单元)的示意图。图4B比较了采用48种单一标记探针的 斑点强度和采用5种荧光分子标记的具有45个碱基对的探针的斑点强度。误差条代表一 个标准偏差。图5显示mRNA斑点的计算鉴定。图5A显示从用地塞米松诱导的A549细胞中的 FKBP5 mRNA颗粒成像中获得的原始图像数据(最大强度归并)。图5B显示原始数据通过 拉普拉斯高斯过滤处理加强斑点后获得的图像(最大强度归并)。图5C显示用阈值处理后 的图5B的滤过图像的斑点数目(即连通分量)作为阈值数值(对于不同数量的探针,阈值 数值的范围是从O到滤波图像的最大强度(归为1))的函数绘图。图5D显示采用图5C中 的灰线表示的阈值的结果,每个不同的斑点被分配为随机颜色。所有比例尺的长度是5微 米。图6显示哺乳动物细胞中三种不同的mRNA单分子同时成像。图6A-图6C显示 未用地塞米松处理的同组A549细胞中的FLJ11127、Cox-2和FKBP5 mRNA颗粒的图像。图 6D-图6F显示用MnM的地塞米松处理8小时的细胞中的FLJ11127、Cox_2和FKBP5mRNA颗 粒的图像。图6G显示用FISH和实时RT-PCR测量的这三种基因双重诱导结果;FISH的误 差条通过自举(bootstrapping)获得,实时RT-PCR的误差条通过参考文献所描述的重复方 法获得。所有图像都是跨越细胞的荧光图像ζ-堆叠(z-stack)的最大归并,细胞核用4', 6-二脒基-2-苯基吲哚(DAPI)复染成紫色。所有比例尺的长度是5微米。图7显示荧光斑点渗漏的检验结果。图7A显示通过TMR、Alexa 594和Cy5滤波 通道看到的用TMR标记的FLJ11127 mRNA斑点的图像。以下给出了与通过图像的线相应的 荧光强度的线扫描曲线,不同的线扫描曲线与所取的上升的ζ (间隔0. 25 μ m)的数值相对 应。与ζ片层(z-slice)相应的绿色荧光自身显示图像。用Alexa 594标记的Cox_2mRNA 斑点(图7B)和用Cy5标记的FKBP5 mRNA颗粒(图7C)也进行了类似的分析。线扫描曲 线强度的测量都减掉了相机背景,在0到200任意荧光单位范围。图8显示氧清除剂可以增加Cy5的光稳定性。图8A显示把用TMR偶联探针标记 的大量FLJ11127 mRNA的最强斑点荧光的均值作为使用TMR特异性滤波器进行2秒曝光的 次数的函数作图。使用氧清除系统的图像(蓝色)和未使用氧清除系统的图像(红色)生 成曲线。用Alexa 594偶联标记探针标记Cox-2mRNA,曝光2秒(图8B)和用Cy5偶联标记 探针标记FKBP5 mRNA,曝光2. 5秒(图8C)进行了类似的分析。图8D显示TMR、Alexa_594 和Cy5偶联探针在具有和不具有氧气消除抗漂白系统(图8A-图8C)中的每次曝光漂白率 (单位是每次曝光损失的荧光分数)。漂白率用指数函数拟合每个粒子的衰变曲线计算,取 拟合的衰减常数的平均值。误差条相当于标准偏差。每个条件下至少选择6个颗粒。图9显示了线虫(C. elegans)和果蠅(D. melanogaster)mRNA定位图像。图9A显 示线虫早期胚胎(约100细胞期)中的elt-2mRNA分子(红色);细胞核使用DAPI复染色 (蓝色)。图9B显示线虫LI幼虫中的elt-2mRNA分子。蓝色方块内显示有一个焦点平面, 其中可见肠道。图9C是dpp和engrailed在果蝇三龄幼虫成虫翅原基中表达的示意图。图 9D显示了计算鉴定的dpp mRNA分子(浅蓝色圆环)和免疫荧光法检测到的Engrailed表达(深蓝色)的图像。图9E是含有增强dpp mRNA分子信号(浅蓝色)和免疫荧光法检测 到的Engrailed蛋白(深蓝色)的图像。除了图9B方框内部分,所有图像都是z-stack的 最大归并。所有比例尺的长度都是5微米。图10显示酵母和神经元中单个mRNA分子的图像。图10A和图10B显示未冲击的 细胞中的STLl mRNA颗粒(图10A)和用0. 4M氯化钠冲击10分钟的细胞中STLl mRNA颗 粒,细胞核用DAPI复染色成紫色(图10B)。图10C显示大鼠海马神经元分离的神经元培养 物中β -肌动蛋白(绿色)和Map2 (红色)mRNA的表达。图10D显示图10C中红框框起的 树突部分的放大图像和对照图像。所有比例尺的长度都是5微米。图11是本发明所用的靶序列和探针。
具体实施例方式本发明部分涉及一种使用原则化阈值策略(principled thresholding strategy)的图像分析算法的开发,并表明可以准确地和明确地鉴定并计算细胞中存在的 所有靶mRNA分子。本方法简单、可靠、可自动化操作,能检测相同的细胞内的三种不同的 mRNA。发明人采用了一套严谨的准则,证明本发明的方法允许在各种不同类型的细胞和模 式生物中非常特异的单个mRNA成像。发明人利用现成的96孔DNA合成仪合成同一靶分子的多种不同末端标记的小分 子探针。得到的结果表明,当一组至少30种,优选是至少40种,更优选,大约48种(用于 高通量DNA合成的96孔板的一半)以上单一标记探针结合到相同的mRNA分子时,它们能 提供足够的荧光使之成为一个在宽视场显微镜下可见的受限衍射斑点。非特异性位点仅与 一种或几种探针结合,产生弥散信号,而真实靶点则与全部或大部分探针结合,使每个mRNA 分子都能产生一个清晰可测的斑点。发明人还开发了一种使用原则化阈值策略的图像分析算法的开发,该算法表明可 以准确地和明确地鉴定并计算细胞中存在的所有靶mRNA分子。本方法简单、可靠、可自动 化操作,能检测相同细胞内的三种不同的mRNA。发明人采用了一套严谨的准则,证明本发明 的方法允许在各种不同类型的细胞和模式生物中非常特异的单个mRNA成像。因此,48种或更多的单一标记的寡核苷酸探针可以检测单个mRNA分子。mRNA分 子可视化为受限衍射斑点,在标准宽视场显微镜中很容易检测到。斑点具有足够的亮度,用 本发明的斑点检测图像处理算法可以精确计数。发明人获得了单个细胞内三种不同的mRNA 分子的数量总量。这种分析有利于精确描绘模式宿主生物中低表达基因的多基因表达谱。本发明公开的系统,其特异性的基础是,全部或大部分探针结合到预定的靶mRNA, 产生特异性信号;而细胞内其他地方的非特异性结合位点,只与更少的探针分子结合,产生 弥散的信号将被斑点计数算法忽略。这突出显示了和其他使用多标记探针如树状聚物的原 位杂交方法相比本发明的方法的关键优势所在。如果每个探针分子都可以检测到,每个非 特异性结合事件会导致假阳性,而任何没有结合探针的mRNA都会导致假阴性。然而随着探 针数量增加,假阴性和阳性的可能性会减小。一般情况,在一定的杂交效率下,增加了不同 探针的数量将缩窄每个分子结合探针的分布。根据本发明的图像分析显示,增加探针的数 量将使斑点检测更稳定,不会依赖任意选择的阈值。这是对于准确计数每个细胞中mRNA的 数量是至关重要的,是本发明的方法的关键特征。
一个相关的问题是在设计探针组时,一个重要的因素是杂交亲和力的一致性。由 于寡核苷酸的亲和力在很大程度上是由其相对GC含量决定的,发明人创造了一种计算机 程序来设计具有最适均一 GC含量的探针组。本计算机程序已经公开。从实践的角度来看,和以前的单分子mRNA荧光原位杂交(FISH)法相比,本发明的 方法无论在时间和成本方面都具有巨大优势。由于合成方面的进展,研究人员可以很容易 地购买大量廉价的3'-胺修饰的寡核苷酸。可以批量混合、耦合并纯化这些寡核苷酸,大 大降低了生产多标记探针相关的大量耦合和纯化工作所需要的劳动。本发明的方法简单、 节约成本,这将推动包括多种不同mRNA检测的基因组学水平的研究。此外,杂交程序的灵 活性也为它与其他标准技术(如免疫荧光法)的结合留出了余地。在另一个实施方案中,荧光分子可以在DNA自动合成过程中加入到探针中。其它单细胞中mRNA定量的方法包括单细胞RT-PCR和数字RT-PCR。这些方法存在 的问题就是整合大量的单个反应的实践很困难,需使用的微流体或自动化装置。此外,当投 入的靶分子仅仅是几个分子时,采用这些方法还需要顾虑指数扩增时的随机差异。这种随 机行为增加了单细胞基因表达分析的复杂性,而分析本身就受到随机力量的影响。此外,这 些方法也不能提供任何有关mRNA空间位置信息。鉴于本发明的单分子mRNA检测方法操作简单、适用广泛,这种方法适用于多种研 究。通过获得的单个细胞中mRNA的准确计数,不仅可以精确确定不同条件下的表达差异, 也可以精确确定细胞和细胞之间基因的表达差异。通过对单个细胞中单个mRNA的定量测 量和空间测量,这种方法在系统生物学、细胞生物学、神经生物学和发育生物学等多种研究 中都有重要价值。因此,本方法可以用于多种试验,包括但不限于筛选试验。在一种实施方案中,筛 选试验确定测试化合物是否会影响信使核糖核酸分子(mRNA)靶序列分布的量,所述靶序 列在单细胞中至少包括30个具有15-100核苷酸的非重叠探针结合区。该方法通常包括以 下步骤用测试化合物孵育细胞一段足以激发反应的时间;将所述细胞浸入过量的至少30 种核酸杂交探针中,每种探针都用相同的荧光分子单一标记,并且每种探针都含有与靶序 列不同的探针结合区互补的核酸序列;清洗固定化细胞以去除非结合探针;检测所述探针 发出的荧光的分布量;把所述的量或所述的分布情况分别与从对照细胞得到的量或分布情 况进行对比,对照细胞也按上述方法处理,只是没有用测试化合物孵育。合适的候选测试化合物包括但不限于肽基化合物(如抗体或纳米抗体),RNA干 扰剂(即小干扰(siRNA)、短发夹shRNA(短发夹RNA)、微小RNA(miRNA)等)和小分子。所 有这些化合物都可以根据现有技术制备。例如Naito(US 20080113351)和Khvorova(US 20070031844)提供的选择活性RNA干扰剂的方法。抗体也可以根据已知技术制备,包括杂 交瘤的使用、单克隆抗体的选择、噬菌体展示库的使用和人源化抗体技术等。小分子化合物可以通过从适当的库中筛选来选择。一方面,小分子库可以根据 本领域众所周知以及常规方法合成。参见,例如Hiompson and ElIman, Chem. Rev. 1996, 96,555-600,Shipps,et al, Proc. Natl.Acad. Sci. USA, Vol. 94,pp.11833—11838,October 1997,禾口 Combinatorial Library Design and Evaluation-Principles, Software Tools and Applications in Drug Discovery, Ghose and Viswanadhan(eds), Marcel Dekker 2001。另外,小分子库也可以来自任何其它若干来源,包括,例如,美国国立卫生研究院分子库小分子库。其它的来源包括AnalytiConDiscovery GmbH(波茨坦,德国),它能提供可 用的MEGAbolite 、纯天然产品的小分子库和NatDiverse 、半合成天然产物类似物小分 子库;量子制药有限公司(莫斯科,俄罗斯联邦)和I^raecis制药公司(沃尔瑟姆,美国麻 省)。另一方面,本发明还提供了一种采用上述的阈值算法软件。因此,在一种实施方案 中,本发明提供了一种计算机可读介质,该介质包括以下指令获取二维荧光图像的三维堆 叠(3-D stack);使用三维滤波器过滤所述三维堆叠;计算所述的过滤的三维堆叠中多个 不同强度阈值下的三维斑点总数;在用三维斑点总数对强度阈值的所绘的平面图上获得代 表平台区的最佳强度阈,并在此强度阈值上计算总数;以及用在所述最佳强度阈值上获得 的三维斑点总数代表在所述三维堆叠中检测到的荧光粒子的总数。在一种实施方案中,阈值是采用三维线性拉普拉斯高斯滤波器获得的。在另一种实施方案中,本发明还提供了一种试剂盒。该试剂盒包括能实施上述阈 值算法的计算机可读介质和针对预选靶序列的探针组。在本发明的方法所描述的探针也适 用于本发明的试剂盒。根据本发明的方法的具体实施方案将在下面的实施例中说明。这些例子只是进行 说明,不以任何方式限制本发明的其余部分。实施例实施例1 材料和方法如无特殊说明,本部分描述的方法适用于所有实施例。探针设计设计的探针组由至少48个3'-胺修饰的寡核苷酸组成,每个寡核苷酸的长度从 17到22个核苷酸不等(FKBP5、FLJl 1127和Map2 mRNA分别使用63个、53个和72个寡核 苷酸)。另外,如有可能,寡核苷酸的GC含量尽量控制在45%左右。寡核苷酸混合并在一 个反应中偶联荧光分子,之后采用HPLC纯化去除未耦合寡核苷酸和剩余的游离荧光分子。荧光原位杂交在准备FISH时,所有的样品都用3. 7%甲醛固定化并用乙醇通透化。采用类似 Femino等给出的条件和缓冲液杂交,关键区别在通过将所用的甲酰胺的量减少到10%降 低杂交的严格性。凭经验确定能发出适当信号的探针的浓度。成像和数据分析用标准宽视场荧光显微镜获取所有的图像。计算机辅助检测和颗粒计数用提高微 粒信号的线性滤波器完成。实施例2 探测同一个mRNA分子中的重复序列和独特序列发明人采用单一荧光配基标记的小分子寡核苷酸探针,表明设计成含有32-96种 探针结合序列串联拷贝的单个mRNA分子可通过原位杂交检测。发明人还利用大量不同的 方法表明单个斑点代表单个mRNA分子,这些方法包括将由直接计数受限衍射斑点获得的 平均mRNA拷贝数和通过实时RT-PCR获得的靶分子数目的数值相关联。因此,如果使用许 多不同的探针,每种探针都以天然mRNA的不同区域的作为靶点,不必依赖工程基因的使用 就可以获得单分子敏感度。为了初步检验这种假设,发明人构建一种脱氧土霉素调控基因,它能产生编码绿色荧光蛋白的mRNA,并且在其3' -UTR区含有32个长度为80个核苷酸的串联重复序列, 然后将该工程基因稳定地整合到中华仓鼠卵巢细胞系。该基因表达的mRNA同时和编码序 列特异区互补的48种不同的寡核苷酸以及一组具有重复摩基互补序列的4种寡核苷酸 探测(共结合1 种探针)(图1A)。编码序列特异区的探针组的每种寡核苷酸用单一的 Alexa-594荧光分子标记,重复序列特异的探针组的每种寡核苷酸用单一的TMR荧光标记。 使用合适的滤波器组件确保TMR荧光分子发射的荧光不会被Alexa-594通道检测到,反之 亦然,如下所述。发明人发现,用这些探针进行FISH之后,在TMR通道和Alexa-594通道都可以见 到直径约0. 25微米的“颗粒”(图1B)。这些颗粒经计算鉴别,采用图像处理程序(如下文 所述)分为三类用GFP编码序列探针(TMR)标记的颗粒、用UTR特异性探针(Alexa-594) 标记的颗粒或用上述两种探针标记的颗粒(图1C)。通过在与图IC类似的4个视场鉴定和 定位这些颗粒,经计数与GFP编码序列探针相应的颗粒共有599个、与用UTR特异性序列相 应的颗粒共有565个。在这些颗粒中,85%的“UTR颗粒”和81 %的“GFP颗粒”共定位,而 81 %的“GFP颗粒”与85%的“UTR颗粒”共定位。用以前认可的串联重复序列检测方法检 测到的两种颗粒的高度共定位性以及用48种不同的单一标记寡核苷酸探测的颗粒,表明 采用多种单一标记探针检测内源性转录子是有效的。没有显示共定位的那部分颗粒,可能 和在mRNA天然降解过程中丧失了编码区或3 ‘ -UTR的mRNA相对应。发明人同时还分析了 TMR通道和Alexa-594通道的共定位斑点的荧光强度,发现 荧光强度显示单峰分布(图2),认为所发现的粒子不是许多mRNA的团块,而是单个分子。 两个通道之间的斑点强度显示很强的相关性(图幻。由于没有两个通道之间的交叉,这表 明在斑点强度的变化并非主要归因于探针杂交中的随机变化(该变化在两组不同的探针 间不具有相关性),而是其他同样影响两种探针的因素,如mRNA的完整或可获取性。发明人还通过使用该组中的前12种、M种、36或全部48种探针进行原位杂交探 索了信号强度如何随探针数目变化。对于这种特定的靶mRNA,发现数目较少的探针也可以 检测到颗粒,尽管强度降低(图3A)。然而,自动斑点检测算法(详见下文)在48种探针的 情况下进行得特别好,在很宽的阈值上都可以检测到相同数目的斑点(图3B,见下文进一 步讨论)。虽然发明人用少至30种探针也能得到清晰的mRNA信号,但是要得到稳定信号所 需的探针的数目可能由靶序列决定。本发明的方法和i^emino等人的方法(使用45个碱基 对长度的用5个个荧光分子标记的寡核苷酸探针,与3' UTR中一个重复32次的基因序列 互补,每个mRNA能产生160个荧光分子)进行比较(图4A),结果发现两种方法的信噪比大 致相同(图4B),表明本发明的方法虽然使用了较少的荧光分子至少同样敏感。另外,缺乏报告基因的CHO细胞不会产生信号,而具有由于加入脱氧土霉素而报 告基因被关闭的CHO细胞只在少数几个细胞中产生mRNA颗粒,这表明所观察到的信号是特 异性的。实施例3斑点检测的计算算法为了准确鉴定大量的mRNA分子,发明人开发了一种在荧光图像三维堆叠中发现 斑点的半自动计算算法。斑点检测中的一个难题是由于细胞的自荧光和低浓度的非特异性 杂交引起的背景不均一。为了避免这些问题,发明人采用用来消除慢变背景和增强校正大 小和形状的斑点样信号的三维线形拉普拉斯高斯滤波器过滤图像(图5A和图5B)。在算法的下一步,为了确定斑点,发明人使用了阈值来过滤图像。为了合理选择阈值,采用从0到 过滤图像最大像素强度的不同阈值来计算三维空间的斑点数目。当发明人把颗粒数作为阈 值的函数作图时,发现了一个很宽的平台区,表明存在一个范围,在此范围内,检测到的颗 粒的数目对所选择的特定的阈值相当不敏感(图5C)。当在此范围选择阈值时,检测到的斑 点数和肉眼所鉴定的斑点数能够很好吻合,表明该斑点检测算法是有效的(图5D)。实施例4三种不同mRNA的基因表达谱本发明方法的一个潜在用途就是同时检测单细胞中的多种mRNA的单分子。为了 表明这种能力,发明人设计了分别编码人类癌细胞系A549中Π(506结合蛋白5 (FKBP5)、 Cox-2和FLJ11127基因的三种mRNA的特异性探针。这些探针分别与光谱不同的荧光分子 Cy5, Alexa 594和TMR耦合。同时使用这三种探针进行FISH,在三个不同的荧光通道中可 以看到单个的斑点(图6A-图6F),强度分析显示荧光斑点没有渗漏到其他通道(图7)。为了证明本发明的mRNA检测方法是特异的和定量的,该细胞用细胞渗透性糖 皮质激素地塞米松孵育,从而上调该特定细胞系中FKBP5和FLJ11127的表达,中度下 调了 Cox-2的表达。发明人发现采用FISH结合本发明的斑点检测算法测定,FKBP5和 FLJl 127mRNA的平均数增加了,而Cox-^nRNA的平均数减少了(比较图6A-图6C和图6D-图 6F)。这些数和在相同样本上进行的基因双重诱导和抑制的RT-PCR测量结果能够很好吻 合,表明荧光斑点是适当的mRNA,以及采用本发明的方法可以检测到大多数的mRNA分子 (图6G)。另外,这也进一步表明,斑点检测方法对于基因表达精确定量是有效性。在多个mRNA同时成像时产生的一个技术挑战就是荧光的光不稳定性,特别是Cy5 的光不稳定性。为了使一个单细胞内所有的mRNA分子成像,每个图像曝光一到三秒,采用 高数值孔径透镜物镜在每个视野获得了 10个至30个“Z区”图像。只有TMR和Alexa-594 (在 较小程度上)能承受这种强光和相对较长的曝光时间;而例如Cy5,则证明在这种条件下对 光极其不稳定(图8)。为了克服这个问题,发明人采用了防荧光萃灭封片剂,在其中荧光 分子具有更好的光稳定性。这种方法改编自Yildiz等(只作了少许修改)。在这种介质 中,过氧化氢酶、葡萄糖氧化酶和葡萄糖的混合物从介质中酶催化去除了分子氧,从而抑制 了摧毁荧光分子的氧依赖性光启动通路。这些酶的使用导致Cy5的光稳定性剧增10倍,而 对TMR和Alexa-594成像没有什么负面影响,因此在进行三色成像时有助于获得多个ζ区。实施例5模式生物和细胞类型中mRNA的检测原位杂交的典型用途之一就是发育过程中的mRNA的定位检测。发明人在两种研 究中常用的发育系统中测试了本发明方法有效性线虫(Caenorhabditis elegans)和果 蝇(Drosophila melanogaster)。在线虫中,发明人构建了从基因elt_2检测mRNA分子的 探针,elt-2是一种转录因子,只在线虫肠道表达,并且只有线虫胚胎发育到45个细胞的阶 段才表达。探针组与胚胎和幼虫杂交,结果发现elt-2mRNA分子仅在胚胎和成虫(图9B) 的肠道区域(图9A)出现。然而,与已知的表达启动时间一致,elt-2基因只在晚于45个 细胞期的胚胎可以检测到,再次凸显了本发明的方法的特异性。此外,在早期阶段,只检测 到少数几个转录子,表明该方法的敏感度足以检测复杂组织中甚至很少量的转录子。在果蝇中,研究最充分的一个例子是成虫翅原基发育过程中的基因表达的定位。 果蝇幼虫的翅原基表现一组显著的基因表达模式,其中之一对Hedgehog蛋白和Engrailed 蛋白梯度反应中形成dpp基因表达带。特别是,Engrailed蛋白负调控dpp mRNA合成,在
13翅原基后区室(posterior compartment)高而前区室(anterior compartment)低。同样, 正调控dpp mRNA合成的Hedgehog蛋白在翅原基后区室高而前区室低。然而,在前后部之 间有一个区,在该区Hedgehog的浓度足以激活dpp基因但不足以激活engrailed基因,致 使dpp mRNA在一个狭纹区内合成(图9C)。为了检查否这条dpp mRNA合成狭纹区是否可以成像,发明人构建了一组dpp mRNA 的单一标记探针,在从第三龄幼虫分离出来的成虫翅原基上进行原位杂交。另外,原位杂交 方法是和Engrailed蛋白的免疫荧光技术(显示为蓝色)联用的。图9D显示全景图,在图 中用本发明的算法鉴定的mRNA分子的位置显示为蓝色圆环。图9E显示采用增强的mRNA 信号的图像的放大部分。这些图像表明仅在Engrailed表达区的前缘能够发现mRNA分子, 又一次证实了本检测方法的特异性。发明人设计了一组STLl基因转录子的,在酿酒酵母(Saccharomyces cerevisae) 中测试本发明的方法。STLl基因是一种酵母基因,其表达可以通过在生长培养基中添加盐 显著上调。已经发现,非盐冲击细胞几乎不含STLl mRNA分子(图10A),而用0. 4M盐冲击 10分钟之后的细胞则含有大量的STLl mRNA分子(图10B)。另一种在mRNA定位中广为研究的细胞类型是神经元。为了表明本发明的方法在 该系统中的有效性,发明人对培养的海马神经元中的β -肌动蛋白mRNA和Map2 mRNA进 行成像。图10C显示β-肌动蛋白探针组(用TMR标记)和不同颜色的Map2探针组(用 Alexa-594标记)可用于靶分子成像及用单分子的分辨率鉴定靶分子。一部分这些mRNA分 子迁移到树状突的远端(图10D)。颗粒计数表明791个β-肌动蛋白mRNA分子中的14% 定位在树状突,而140个Map2 mRNA分子中的37%定位在树状突,这和以前报道的分布情况 是一致的。本说明书所引用的全部出版物,无论专利出版物和非专利出版物,均显示本发明 相关的本领域技术人员的技术水平。所有这些出版物全部纳入本文作为参考,其程度相当 于每一篇出版物都特别地、单独地列入本文作为参考。参考文献1.Kaufmann, B.B. & van Oudenaarden, A. Stochastic gene expression :from single molecules to the proteome. Curr Opin Genet Dev 17,107-112 (2007).2.St Johnston, D. Moving messages :the intracellular localization of mRNAs. Nat Rev MoI Cell Biol 6,363-375(2005).3. Gall,J. G. Differential synthesis of the genes for ribosomal RNA during amphibian oogenesis. Proc Natl Acad Sci USA 60,553-560 (1968).4.Levsky, J. M. & Singer, R. H. Fluorescence in situ hybridization :past, present and future. J Ce//Sci 116,2833-2838(2003).5. Tautz, D. & Pfeifle, C. A non-radioactive in situ hybridization method for the localization of specific RNAs in Drosophila embryos reveals translational control of the segmentation gene hunchback. Chromosoma 98, 81-85(1989).6. Raap, A. K. et al. Ultra-sensitive FISH using peroxidase-mediated deposition of biotin—or fluorochrome tyramides. Hum MoI Genet 4,529-534(1995).
7. Femino, A. M. , Fay, F. S. , Fogarty, K. & Singer, R. H. Visualization of single RNA transcripts in situ.Science 280,585-590 (1998).8. Tsokas, P. et al. Local protein synthesis mediates a rapid increase in dendritic elongation factor IA after induction of late long-term potentiation. J Neurosci 25,5833-5843(2005).9. Maamar,H.,Raj,A. & Dubnau, D. Noise in gene expression determines cell fate in Bacillus subtilis.Science 317,526-529 (2007) ·10. Femino, A. M.,Fogarty, K.,Lifshitz, L. Μ.,Carrington,W. & Singer, R. H. Visualization of single molecules of mRNA in situ.Methods Enzymol 361, 245-304(2003).11. Randolph, J. B. & Waggoner, A. S. Stability, specificity and fluorescence brightness of multiply-labeled fluorescent DNA probes. Nucleic Acids Res 25, 2923-2929(1997).12. Sindelar, L. E. &Jaklevic, J. M. High-throughput DNA synthesis in a multichannel format. Nucleic Acids Res 23,982-987(1995).13. Vargas, D. Y.,Raj,Α.,Marras, S. Α.,Kramer,F. R. & Tyagi,S. Mechanism of mRNA transport in the nucleus.Proc Natl Acad Sci U S A 102,17008-17013(2005).14. Raj, A.,Peskin,CS.,Tranchina,D. , Vargas,D. Y. & Tyagi,S. Stochastic mRNA synthesis in mammalian cells.PLoS Biol 4,e309 (2006)·15. Garneau,NX.,Wilusz, J. & Wilusz, CJ. The highways and byways of mRNA decay. Nat Rev MoI Cell Biol 8,113-126 (2007). 16. Gonzalez, R. C. , Woods, R. E. & Eddins, S. L. Digital Image Processing Using Matlab. (Pearson Prentice Hall, Upper Saddle River, NJ ;2004).17. Wang, J. C et al. Chromatin immunoprecipi tat ion (ChIP) scanning identifies primary glucocorticoid receptor target genes. Proc Natl Acad Sci U S A 101,15603-15608(2004).18.Yildiz,A. et al. Myosin V walks hand-over-hand :single fluorophore imaging with 1. 5-nmlocalization. Science 300,2061-2065 (2003) ·19. Benson, D. M. ,Bryan, J. ,Plant, A. L. ,Gotto,A. M. ,Jr. & Smith, L. C. Digital imaging fluorescence microscopy :spatial heterogeneity of photob leaching rate constants in individual cells. J Cell Biol 100,1309-1323 (1985).20. Lecuyer, E. et al. Global analysis of mRNA localization reveals a prominent role in organizing cellular architecture and function.Cell 131, 174-187(2007).21. Fukushige, Τ. , Hawkins, M. G. & McGhee, J. D. The GATA-factor elt-2 is essential for formation of the Caenorhabditis elegans intestine. Dev Biol 198, 286-302(1998).22. Sanicola,M.,Sekelsky, J.,Elson,S. & Gelbart,W. M. Drawing a stripe in Drosophila imaginal disks :negative regulation of decapentaplegic and patchedexpression by engrailed. Geneticsl39,745-756(1995).23. Rep, Μ.,Krantz, Μ.,Thevelein,J. Μ. & Hohmann, S. The transcriptional response of Saccharomyces cerevisiae to osmotic shock. Hotlp and Msn2p/ Msn4p are required for the induction of subsets of high osmolarity glycerol pathwaydependent genes. J Biol Chem 275,8290-8300 (2000) ·24. Tiruchinapalli,D. M. et al. Activity-dependent trafficking and dynamic localization of zipcode binding protein 1 and beta-actin mRNA in dendrites and spines of hippocampal neurons. JNeurosci 23,3251-3261 (2003) ·25. Blichenberg,A. et al. Identification of a cis-acting dendritic targeting element in MAP2 mRNAs. JNeurosci 19,8818—8829 (1999) ·26. Warren,L,Bryder, D.,Weissman,LL & Quake,S. R. Transcription factor profiling in individual hematopoietic progenitors by digital RT-PCR. Proc Natl Acad Sci USA 103,17807-17812(2006).
权利要求
1.一种在固定化、通透化的细胞中探测信使核糖核酸分子的靶序列的方法,其中所述 的靶序列包括至少30个具有15-100个核苷酸的非重叠探针结合区,所述方法包括以下步 骤将所述细胞浸入在过量的、核酸杂交的至少30种探针中,每种探针都用相同的荧光标 记物单一标记,并且每种探针含有与靶序列的不同探针结合区互补的核酸序列;清洗固定 化的细胞以去除非结合探针;检测所述探针发出的荧光。
2.如权利要求1的方法,其中探针结合区和探针的数目是40到60。
3.如权利要求1或2的方法,其中所述的至少30种探针具有长度为7-40个核苷酸的 靶互补序列。
4.如权利要求1-3的任一权利要求所述的方法,其中所述的至少30种探针具有长度为 15-30个核苷酸的靶互补序列。
5.如权利要求1-4的任一权利要求所述的方法,其中所述的至少30种探针具有长度为 17-25个核苷酸的靶互补序列。
6.如权利要求1-5的任一权利要求所述的方法,其中所述的至少30种探针具有长度为 17-22个核苷酸的靶互补序列。
7.如权利要求1-6的任一权利要求所述的方法,其中所述探针的3’端用荧光分子标记。
8.如权利要求1-7的任一权利要求所述的方法,其中所述加入到所述细胞的每种探针 的浓度是0. 2-1.0纳克/微升。
9.如权利要求1-8的任一权利要求所述的方法,其中所述探针包括脱氧核糖核苷酸、 核糖核苷酸或其混合物。
10.如权利要求1-9的任一权利要求所述的方法,其中至少一些所述探针包括非天然 核苷酸如2' -0-甲基核糖核苷酸。
11.如权利要求1-10的任一权利要求所述的方法,其中固定化的细胞是用甲醛固定制 备的。
12.如权利要求1-11的任一权利要求所述的方法,其中检测包括用宽视场荧光显微镜 成像。
13.如权利要求1-12的任一权利要求所述的方法,其中检测包括用三维线性拉普拉斯 高斯滤波器过滤图像,以及使用某一区域的检测阈值,在所述区域范围内,检测对所选阈值 不敏感。
14.如权利要求1-13的任一权利要求所述的方法,其中所述的至少30种探针包括用第 一荧光标记物单一标记的至少30种探针和用第二荧光标记物标记的至少30种探针。
15.如权利要求1-14的任一权利要求所述的方法,其中所述的靶序列包括同一mRNA分 子中的至少两个靶序列,并且每个靶序列的荧光标记物是可区别的。
16.如权利要求1-15的任一权利要求所述的方法,包括计数与mRNA的单分子相应的荧 光斑点以得到基因表达谱。
17.如权利要求1-16的任一权利要求所述的方法,其中所述靶序列包括不同mRNA分子 中的至少两个靶序列,并且每个靶序列的荧光标记物是可区别的。
18.一种确定测试化合物是否影响信使核糖核酸分子靶序列分布量的方法,其中所述 的靶序列在细胞中包括至少30个具有15-100个核苷酸的非重叠探针结合区,所述方法包括a)用测试化合物孵育细胞一段足以激发反应的时间;b)通透化所述细胞;c)将所述细胞浸入过量的核酸杂交的至少30种探针中,每种探针都用相同的荧光分 子单一标记,并且每种探针都含有与所述靶序列的不同探针结合区互补的核酸序列;d)清洗所述固定化细胞以去除非结合探针;e)检测所述探针发出的荧光的分布量;f)把所述的量或所述的分布情况分别与按照步骤(b)到(e)处理的对照细胞得到的量 或分布情况进行对比。
19.如权利要求18的方法,其中探针结合区和探针的数目是40到60。
20.如权利要求18或19的方法,其中所述的至少30种探针具有长度为7-40个核苷酸 的靶互补序列。
21.如权利要求18-20的任一权利要求所述的方法,其中所述的至少30种探针具有长 度为15-30个核苷酸的靶互补序列。
22.如权利要求18-21的任一权利要求所述的方法,其中所述的至少30种探针具有长 度为17-25个核苷酸的靶互补序列。
23.如权利要求18-22的任一权利要求所述的方法,其中所述的至少30种探针具有长 度为17-22个核苷酸的靶互补序列。
24.如权利要求18-23的任一权利要求所述的方法,其中所述探针的3’端用荧光分子 标记。
25.如权利要求18-24的任一权利要求所述的方法,其中加入到所述细胞的所述每种 探针的浓度是0. 2-1. 0纳克/微升。
26.如权利要求18-25的任一权利要求所述的方法,其中所述探针包括脱氧核糖核苷 酸、核糖核苷酸或其混合物。
27.如权利要求18-26的任一权利要求所述的方法,其中至少一些所述探针包括非天 然核苷酸如2' -0-甲基核糖核苷酸。
28.如权利要求18-27的任一权利要求所述的方法,其中固定化的细胞是用甲醛固定 制备的。
29.如权利要求18-28的任一权利要求所述的方法,其中检测包括用宽视场荧光显微镜成像。
30.如权利要求18-29的任一权利要求所述的方法,其中检测包括用三维线性拉普拉 斯高斯滤波器过滤图像,以及使用某一区域的检测阈值,在所述区域范围内,检测对所选阈 值不敏感。
31.权利要求18-30的任一权利要求所述的方法,其中所述的至少30种探针包括用第 一荧光标记物单一标记的至少30种探针和用第二荧光标记物标记的至少30种探针。
32.如权利要求18-31的任一权利要求所述的方法,其中所述靶序列包括同一mRNA分 子中的至少两个靶序列,并且每个靶序列的荧光标记物是可区别的。
33.如权利要求18-32的任一权利要求所述的方法,其包括计数和单分子mRNA相应的 荧光斑点以得到基因表达谱。
34.如权利要求18-33的任一权利要求所述的方法,其中所述靶序列包括不同mRNA分 子中的至少两个靶序列,并且每个靶序列的荧光标记物是可区别的。
35.如权利要求1-34的任一权利要求所述的方法,其中所述细胞是哺乳动物细胞、无 脊椎动物细胞、酵母细胞或细菌。
36.如权利要求35的方法,其中所述细胞是神经元。
37.一种计算机可读介质,该介质包括以下指令获取二维荧光图像的三维堆叠;使用三维滤波器过滤所述三维堆叠;计算所述的过滤的三维堆叠中多个不同强度阈值下的三维斑点总数;在三维斑点总数对强度阈值的平面图上获得代表平台区的最佳强度阈值,并在此强度 阈值上计算所述总数;以及用在所述最佳强度阈值获得的三维斑点总数作为在所述三维堆叠中检测到的荧 光粒子的总数。
38.如权利要求37的计算机可读介质,其中阈值设定包括采用三维线性拉普拉斯高斯 滤波器。
39.一种试剂盒,包括a)一种计算机可读介质,该介质包括以下指令获取二维荧光图像的三维堆叠;使用三维滤波器过滤所述三维堆叠;计算所述的过滤的三维堆叠中多个不同强度阈值下的三维斑点总数;在三维斑点总数对强度阈值的平面图上获得代表平台区的最佳强度阈值,并在此强度 阈值上计算总数;以及使用在所述最佳强度阈值上获得的三维斑点总数作为在所述三维堆叠中检测到 的荧光粒子的总数;b)至少30个具有15-100个核苷酸的非重叠探针结合区,包括将所述细胞浸入在过量 的至少30种核酸杂交探针中,每种探针都用相同的荧光分子单一标记,并且每种探针都含 有与预先确定的靶序列的不同探针结合区互补的核酸序列。
40.如权利要求39所述的试剂盒,其中所述至少30种探针包括用第一荧光标记物单一 标记的至少30种探针和用第二荧光标记物标记的至少30种探针。
41.如权利要求39或40所述的试剂盒,其中所述靶序列包括同一mRNA分子中的至少 两个靶序列,并且每个靶序列的荧光标记物是可区别的。
全文摘要
本发明提供了一种在固定化、通透化的细胞中探测信使核糖核酸(mRNA)分子的靶序列的方法,所述的靶序列包括至少30个具有15-100个核苷酸的非重叠探针结合区,该方法包括将所述细胞浸入在过量的、核酸杂交的至少30种探针中,每种探针都用相同的荧光标记物单一标记,并且每种探针都含有与靶序列的不同探针结合区互补的核酸序列;清洗所述固定化细胞以去除非结合探针;检测所述探针发出的荧光。
文档编号C12Q1/68GK102149829SQ200980135364
公开日2011年8月10日 申请日期2009年9月10日 优先权日2008年9月10日
发明者桑杰·泰尔吉, 阿均·拉吉 申请人:新泽西医科和牙科大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1