产生和筛选dna编码的库的方法

文档序号:3410629阅读:257来源:国知局
专利名称:产生和筛选dna编码的库的方法
产生和筛选DNA编码的库的方法
背景技术
药物开发的迅速增长的成本已导致持续探索尽可能廉价地筛选更大化学空间的新方法以发现具有更高效能以及很少毒性至没有毒性的分子。在二十世纪八十年代组合化学方式最初被誉为是超越药物开发范式的方法,但在很大程度上是失败的,这是由于库大小不足以及不适当的去卷积方法。最近,小分子的DNA显示组合库的使用已产生用于筛选治疗性前导化合物的新范式转变。Morgan等人(美国专利申请公开号2007/0224607,以引用方式结合于本文)确定了在药物开发中使用DNA-显示组合方式的主要挑战(1)足够复杂性的库的合成以及(2) 在所使用的筛选中具有活性的分子的鉴定。另外,Morgan等人说明了,库的复杂性程度越高,即,存在于库中的不同结构的数目越高,则库包含具有感兴趣活性的分子的可能性就越大。因此,在库合成中采用的化学性能必须能够在合理的时间框架内产生大量化合物。在识别具有不同化学型和高亲和力的分子时,这种方式通常是成功的。然而,关于产生巨大复杂性的库以及在已描述的规模上评估测序输出,则已显露许多问题。例如,在多重化学转化 (例如,通常为3个或4个步骤)和生物转化(例如,DNA标记的酶促连接)以后库的纯化是麻烦的并且导致在库中的大量的“噪声”,这是由于分子的不完全合成或由于在连接步骤期间的错标记。此外,为查询所选择群体所需要的测序量是惊人的,通常需要“下一代”测序方法。后者是由于以下事实需要嵌入库的DNA部分中的复杂的遗传标记方案、以及用于分析“下一代”测序输出的生物信息学算法以通过噪声筛选和确定库中的击中(采样,hits)。 因此,甚至使用这些方法,仍然没有足够推进测序以从给定筛选中完全捕获序列的多样性 (表示真正击中和“噪声”两者)。组合小分子库的DNA显示依赖于库的多步的、分离-和-合并合成,其结合(偶联, 偶合)于DNA标记的酶加成,其中上述DNA标记编码所使用的合成步骤和结构单元(标准部件,building block)。通常进行和编码许多(例如,3个或4个)合成步骤,并且这些合成步骤包括多样性位置(本文描述为A、B、以及C (图1)),如那些通过将具有例如胺或羧酸酯官能团的结构单元结合到化学骨架上所形成的多样性位置,其中化学骨架显示在限定方向上的连接的结构单元。经常用于组合库中的骨架(S)的一个实例是三嗪部分,其可以在它的环状结构周围的三个位置中正交衍生。库形成过程可以是费时的,产物经常被未有效纯化,以及结果是可以发生未知反应,其会产生连接于DNA的不想要的和/或未知的分子。此外,库的不完全纯化可以导致在连接步骤期间的标记交叉污染,从而导致错标记。用于从库中筛选和测序击中的最终结果是,必须采用大规模并行测序,这是由于连接于意外的分子(例如,未反应的或副产物)的 DNA或错标记的DNA固有的“噪声”。因此,会损失测序的效率。在一些情况下,从其构建小分子库的起始寡核苷酸(initiator oligonucleotide),包含以共价封闭、双链寡核苷酸形式的用于聚合酶扩增(例如,PCR)的引物结合区。对于进行聚合酶反应来说,这种构建物是很成问题的,这是由于难以解链双链体以及难以使引物寡核苷酸结合和引发聚合作用,其导致无效反应,从而降低产率10至1000倍或更大。需要更多分步方式以筛选和识别具有更高效能以及很少毒性至没有毒性的小分子。

发明内容
本发明的特征在于一种用于产生和筛选简化的DNA编码库的方法,由于更少合成步骤(例如,没有酶促连接或没有共价封闭的起始双链寡核苷酸),因此,在编码低聚物(此处被称为“标识区”)的分析期间,显著更少的“噪声”。因此,考虑到可以混淆数据的解释的固有偏误,其中数据可以通过编码区的扩增来引入,测序变得更加有效,或可替换地,微阵列分析变得可能。我们还已确定了用于产生更多化学反应多样性而不是那些简单限于含水条件的化学反应的方法以使得DNA编码的库更加疏水的和可溶于用于随后库合成步骤的有机溶剂中。以这种方式,可以用潜在更高的产率、更多结构单元多样性来进行化学反应, 并改善化学反应的保真度。因此,本发明的特征在于一种通过使双功能接头的第一官能团在起始寡核苷酸的5’端结合于起始寡核苷酸而标记DNA编码的化合物库(化学库,化学物库,chemical library)的方法,其中起始寡核苷酸形成发夹结构;以及使双功能接头的第二官能团结合于化合物库的成分(组分,component)。起始寡核苷酸可以包括第一标识区(first identifier region)和第二标识区,使得第二标识区杂交于起始寡核苷酸的第一标识区。 第二标识区可以包括荧光标记(例如,荧光团或GFP)或生物素标记。此外,在选择步骤以后的分析以前并没有扩增第二标识区。在另一个实施方式中,本发明的特征在于一种产生DNA编码的库的方法,其中通过(a)产生第一多样性节点(first diversity node), (b)在分开的容器(vessel)中编码第一多样性节点,(c)合并第一多样性节点,以及(d)将合并的第一多样性节点分离(分开,分割,split)到第二组分开的容器中,其中第一多样性节点进行反应以形成第二多样性节点。在一些实施方式中,并没有编码和合并第二多样性节点。在另一个实施方式中,本发明的特征在于一种用于产生库的方法,该方法使用具有更高产率的半含水或非水(例如,有机)化学反应、更多结构单元多样性、以及更多数目的化学反应,其可以用来产生比先前达到的更多DNA标记的组合库。通常,本发明的方法提供了一组库,该库包含,例如,在化学骨架(化合物骨架, chemical scaffold)上的一个或两个多样性位置,该位置可以以高产率有效地产生,被筛选以确定优选的个别结构单元或结构单元的组合,上述个别结构单元或结构单元的组合存在于,例如,一个或两个多样性位置,并且在例如,第二、第三、和/或第四多样性位置反复地多样化,以产生具有改善性能的分子。另外,本文描述的方法便于具有期望生物性能的选择化合物的广泛盒详尽的分析,其又便于确定具有家族结构关系(例如,结构-活性关系) 的有关化合物。“骨架”是指以特定的专门几何形状显示一个或多个多样性节点的化学部分。一个或多个多样性节点通常在库合成期间连接于骨架,但在一些情况下在库合成(例如,标识区的添加)以前可以将一个多样性节点连接于骨架。在一些实施方式中,使骨架衍生,使得它在库合成期间可以被正交去保护并且随后与不同多样性节点进行反应(例如,在每个步骤中,使用标识标记)。“标识区”是指库的DNA标记部分,该DNA标记部分编码加入库中的结构单元。“起始寡核苷酸”是指用于库合成的开始寡核苷酸,该开始寡核苷酸还包含共价连接接头和用于添加多样性节点或骨架的功能部分。寡核苷酸可以是单链或双链的。寡核苷酸可以由天然或修饰碱基构成。“功能部分”是指包含一个或多个结构单元的化学部分,其可以选自任何小分子, 或基于所期望的特性,例如,溶解度、氢键给体和受体的可用性、键的旋转自由度、正电荷、 负电荷等,加以设计和构建。功能部分必须与化学修饰相容,使得它与头段(headpiece)进行反应。在一些实施方式中,可以使功能部分进一步反应为双功能或三功能(或更多功能) 本体。功能部分还可以包括用在任何多样性节点或位置的结构单元。结构单元和编码DNA 标记的实例参见表1和2。参见,例如,美国专利申请公开号2007/0224607,其以引用方式结合于本文。“结构单元”是指这样的化学结构单元,该化学结构单元连接于其它化学结构单元或可以连接于其它这样的单元。当功能部分为多聚合或低聚合的时,结构单元是多聚体或低聚体的单体单元。结构单元还可以包括骨架结构(例如,骨架结构单元),其被连接于或者可以被连接于一个或多个另外的结构(例如,外周结构单元)。结构单元可以是互补的任何化合物(即,结构单元必须能够一起反应以形成包含两个或更多个结构单元的结构)。 通常,所有使用的结构单元会具有至少两个活性基团,虽然使用的一些结构单元会各自仅具有一个活性基团。在两个不同结构单元上的活性基团应该是互补的,即,能够一起反应以形成共价键。“接头”是指将库的核酸部分连接于功能显示物质的一种分子。这样的接头在本领域是已知的,并且在库合成期间可以使用的那些接头包括但不限于5’ -0-二甲氧基三苯甲基-1,,2,- 二脱氧核糖-3,- [ (2-氰乙基)-(N, N- 二异丙基)]-亚磷酰胺;9-0- 二甲氧基三苯甲基-三乙二醇、1-[(2_氰乙基)-(N,N-二异丙基)]-亚磷酰胺;3-(4,4,_ 二甲氧基三苯甲基氧基)丙基-1- [ (2-氰乙基)-(N,N- 二异丙基)]-亚磷酰胺;以及18-0- 二甲氧基三苯甲基六乙二醇、1-[(2_氰乙基)-(N,N-二异丙基)]-亚磷酰胺。可以以不同组合彼此串联地添加上述接头以产生不同的期望长度的接头。“分支接头”是指将库的核酸位置连接于库的两个或更多个相同的功能物质的一种分子。分支接头在本领域中是众所周知的并且实例可以由对称或不对称倍加子(doubler) (1)和( 或对称三倍子(trebler) (3)组成。参见,例如,Newcome et al. ,Dendritic Molecules :Concepts,Synthesis,Perspectives,VCH Publishers (1996) ;Boussif et al.,Proc. Natl. Acad. Sci. USA 92:7297-7301 (1995);以及 Jansen et al.,Science 266:1226(1994)。如在本文中所使用的,术语“寡核苷酸”是指核苷酸的多聚体。寡核苷酸可以包括本领域已知的可以被合成并用于碱基对识别的DNA或其任何衍生物。寡核苷酸并不必须具有邻接碱基,但可以散布有接头部分。寡核苷酸多聚体可以包括天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷、以及脱氧胞苷)、核苷类似物(例如, 2-氨基腺苷、2-硫胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、C5-丙炔基胞苷、C5-丙炔基尿苷、 C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-甲基胞苷、7-脱氮杂腺苷、7-脱氮杂鸟苷、8-氧腺苷、8-氧鸟苷、0(6)-甲基鸟嘌呤、以及2-硫胞苷)、化学修饰碱基、生物修饰碱基(例如,甲基化碱基)、插入碱基、修饰糖(例如,2’_氟核糖、核糖、2’_脱氧核糖、阿拉伯糖、以及己醣)、和/或修饰磷酸酯基团(例如,硫代磷酸酯(磷硫酰)和5’ -N-亚磷酰胺键)。“可操作地连接”是指,以这样的方式将两个化学结构连接在一起以便通过它们预计经受的各种操作仍然保持连接。通常,经由适当的连接基团来共价连接功能部分和编码寡核苷酸。例如,连接基团可以是双功能部分,其具有用于编码寡核苷酸的连接位点以及用于功能部分的连接位点。“小分子”是指具有低于约1000道尔顿分子量的分子。小分子可以是有机或无机的,并且可以从例如化合物库或天然来源中分离,或可以通过已知化合物的衍生作用来获得。根据以下详细描述、附图、实施例、以及权利要求,本发明的其它特点和优点会是显而易见的。


图1是示出了多样性位置A、B、以及C的示意图。图2是部分示出了起始寡核苷酸的模式1的DNA编码化合物库成员的示意图,该起始寡核苷酸包括在标识区处互补的发夹结构,其已经与A和B多样性节点反应。添加用于B的标识区。在此附图中,“C”多样性节点是在添加B标识区以后用于待添加的另外的多样性位置的潜在位置。图3是部分示出了起始寡核苷酸的模式1的DNA编码化合物库成员的示意图,该起始寡核苷酸包括在发夹结构的环区中的序列,其可以用作用于扩增的引物结合区。图4是部分示出了起始寡核苷酸的模式1的DNA编码化合物库成员的示意图,该起始寡核苷酸包括在分子的3’端的非互补序列,其可以用来结合用于聚合或用于酶促连接的第二标识区。图5是部分示出了起始寡核苷酸的模式1的DNA编码化合物库成员的示意图,其中起始寡核苷酸的环区和在环区的3’侧的至少标识区可以用来杂交于还包含第二标识区的互补寡核苷酸。图6是如图5示出的发夹模型的PCR扩增的示意图。图7是示出了发夹形寡核苷酸的模式2的DNA编码化合物库成员的示意图,该发夹形寡核苷酸在远端共价闭合(例如,经由发夹结构或化学方式)于接头。图8是模式2的DNA编码化合物库成员的示意图,其示出了另外多样性节点的包含物。图9是模式2的DNA编码化合物库成员的示意图,其示出了用于库筛选的步骤以及用于去卷积标识区的方法。图10是示出了库合成中所使用的寡核苷酸的示意图。头段(HP)通过IDT DNA来合成并通过HPLC加以纯化。箭头指出用于rn^vCI限制(下划线)或Nb. BbvCI或Nt. BbvCI 切口消化的位点。还示出了 DNA标记Al、Bi、以及Cl (顶部和底部链)、5’和3’ PCR引物、 以及HP的3,端的序列。图11是在它的合成的不同步骤中头段的电泳凝胶(TBE-脲(15% )凝胶电泳; 在 TLC 板上的 UV 影像)。用 Fmoc-氨基-PEG2000-NHS(JenKem Technology USA)来酰化头段HP(IDT DNA)。泳道1是HP(IDT DNA)寡核苷酸(42nts)。泳道2是用Fmoc-氨基-PEG2000-NHS酰化的HP。在1Tris-HCl添加以后,观测到Fmoc的一些脱保护。泳道3是与哌啶的粗反应(crude reaction),示出了 Fmoc的完全脱保护。在NAP-5柱上脱盐以及冷冻干燥以后,泳道4与泳道3相同。(XC 二甲苯蓝(迁移为60ntDNA) ;BPB 溴酚蓝(迁移为 15nt DNA)。图12是示出了在模型库合成中的步骤的示意图。在第一步骤中,将DTAF共轭于氨基-PEG修饰头段(HP-I)。在此步骤以后,用戊基氨基-生物素进一步酰化HP-I-DTAF的一部分。图13A是DNA标记的连接的图解。图1 示出了在DNA标记连接的不同步骤中 HP-I-DTAF-生物素库的4%琼脂糖凝胶。M 标记;泳道1 :HP-1_DTAF-生物素;泳道2 :1+ 仅标记A ;泳道3 1+标记A、B、以及C、以及连接的3’ -端寡核苷酸。箭头指示明亮的绿色荧光(DTAF)。在凝胶上没有观测到显著分离。图13C示出了连接反应的PCR扩增(M个周期)。M 标记(最低条带是100);泳道1 来自图14B的泳道1 (HP-1-DTAF-生物素+标记A) 的绿色荧光条带的PCR扩增;泳道2 来自图13B的泳道2(HP-1-DTAF-生物素+所有3种标记以及3’ -端寡核苷酸)的绿色荧光条带的PCR扩增;泳道3 粗连接反应HP-I-DTAF-生物素+所有3种标记的PCR扩增;泳道4 无模板对照。图14是一组电泳凝胶,其示出了 XChem模型化合物的纯化和模型选择(经由 XChem模型化合物的生物素部分和链霉亲和素之间的结合相互作用)。凝胶是4-12% SDS Nul^age凝胶连同MES电泳缓冲液(running buffer)。利用450-nm激光器,扫描凝胶的绿色荧光。图14A是示出了合成和纯化步骤的凝胶。使样品与加载缓冲液混合并沸腾。M:标记;泳道1 :HP-1+DTAF ;泳道2和加=HP-I-DTAF+生物素(两个独立反应);泳道3_6 (纯化/模型选择的步骤,其中使用链霉亲和素Dynal珠);泳道3 流过;泳道4 最后的洗涤 (在80°C下用水洗涤10分钟);泳道5和5,在90°C下用25mM EDTA洗脱(第一和第二); 泳道6和6,在90°C下用25mM EDTA和5mM NaOH洗脱(第一和第二)。图14B是示出了 HP-I-DTAF-生物素(“1的库”)与链霉亲和素的结合的凝胶。将样品与凝胶加载缓冲液混合并直接加载到凝胶上而没有沸腾。在50mM NaCl/lOmM Tris HCl (pH 7.0)中,用过量链霉亲和素温育如在图14A的凝胶中的样品10分钟。“S”表示添加链霉亲和素。将样品5和6 合并在一起。泳道1 :HP-1-DTAF ;泳道IS =HP-I-DTAF+链霉亲和素;泳道2 =HP-I-DTAF-生物素(脱盐);泳道2S =HP-I-DTAF-生物素+链霉亲和素;泳道4 最后的洗涤(在80°C下用水洗涤10分钟);泳道4S 最后的洗涤样品+链霉亲和素;泳道5+6 合并的样品5、5’、6 以及6’(来自链霉亲和素珠的洗脱馏分,纯化和选择的HP-I-DTAF-生物素);泳道5+6S’ 纯化和选择的HP-I-DTAF-生物素+链霉亲和素。注意,在“1的库”合成的不同步骤之间,迁移并没有明显区别。图14C是与DTAF反应的头段(Trilink)HP-T的4%琼脂糖凝胶。泳道
1标记;泳道2 :DTAF ;泳道3 =HP-T-DTAF0左图凝胶的UV可视化(溴化乙锭染色);右图 在激发波长450nm处扫描荧光(绿色,荧光素)的相同凝胶。图14D是具有MES电泳缓冲液的4-12 % SDS NuPage凝胶,其示出了 HP-T-DTAF-生物素与链霉亲和素的结合。将样品与凝胶加载缓冲液混合并直接加载到凝胶上而没有沸腾。使用在50mM NaCl/lOmM Tris HCl (pH 7. 0)中的过量链霉亲和素温育如在图14A中的凝胶中的样品10分钟。泳道1 :DTAF ;泳道
2=HP-T-DTAF ;泳道3 =HP-T-DTAF+链霉亲和素;泳道4 =HP-T-DTAF-生物素(脱盐);泳道5 =HP-T-DTAF-生物素+链霉亲和素;泳道6 合并的样品5、5’、6以及6’(来自链霉亲和素珠的洗脱馏分,纯化和选择的HP-I-DTAF-生物素);泳道7 纯化和选择的HP-I-DTAF-生物
素+链霉亲和素。图15A是用于T7RNAP细胞内传递实验的构建物的合成图解。PCR扩增Vh dsDNA 克隆以在T7启动子的5’端上游添加BsmI位点。在限制酶切消化和纯化以后,将构建物连接于HP-1-DTAF-R7 (用DTAF和(-Arg- ε Ahx) 6_Arg肽修饰的头段)。图15B是连接反应的电泳凝胶。泳道1和2示出了连接于Vh的不同HP-I样品;泳道3示出了未连接Vh PCR产物;以及M是标记。图15C是示出了 T7启动子活性确认的电泳凝胶。凝胶示出了使用来自图 15B 的泳道 1-3 的样品的 T7 Megascript (Ambion,Inc.)反应。图16是在库IOX 10合成中步骤的琼脂糖凝胶电泳。图16A是用标记A连接的头段(Trilink)HP-T的4%琼脂糖凝胶。泳道1 标记;泳道2 =HP-T ;泳道3 退火的标记A ; 泳道4 连接有标记A的HP-T ;泳道5 连接有标记A并在kh柱上脱盐的HP-T。图16B是连接有12种不同标记B的HP-T-A的2%琼脂糖凝胶。泳道M 标记;泳道1和9 =HP-T-A ; 泳道3、4、5、6、7、8、11、12、13、14、15 以及 16 连接有标记 B1-B12 的 HP-T-A。图 16C 是在与三聚氯氰(氰尿酰氯)以及胺B1-B12反应以后,合并库(库B)的4%琼脂糖凝胶,带有连接的标记A和B1-B12。泳道1 标记;泳道2 =HP-T-A ;泳道3 合并的并在kki柱上脱盐的库B。
具体实施例方式本发明的特征在于用于识别结合于生物靶的一种或多种化合物的许多方法。该方法包括合成化合物的库,其中化合物包含具有一个或多个多样性位置的功能部分。化合物的功能部分可操作地连接于起始寡核苷酸,该起始寡核苷酸识别功能部分的结构。总之,模式1提供了许多方法以在库合成期间保持dsDNA的双链特性,其在化学反应步骤期间是重要的,并且可以用于(如图2-6所示)产生可达两个多样性节点。模式2(图7-9)预测一个多样性节点并使用发夹形寡核苷酸,该发夹形寡核苷酸共价闭合(例如,经由发夹结构或化学方式)于接头的远端。模式3提供了产生具有一个、两个、三个、或更多个多样性节点的库的方法。以下详细描述模式1、2、以及3。模式1本发明的特征在于一种用于识别结合于生物靶的一种或多种化合物的方法。该方法包括合成化合物的库,其中化合物包含具有不大于两个多样性位置的功能部分。化合物的功能部分可操作地连接于起始寡核苷酸,该起始寡核苷酸通过提供包含A起始化合物的溶液而识别功能部分的结构。 起始寡核苷酸包括具有1或更大整数的接头L (例如,聚乙二醇),其中起始寡核苷酸包含功能部分,该功能部分包括连接于L并分离到A反应容器(reaction vessels)中的 A结构单元,其中A是2或更大的整数,该功能部分可操作地连接于识别A结构单元的起始寡核苷酸。 在一些实施方式中,可以通过常用节点(共有节点,common node) S进一步衍生A 结构单元。在其它实施方式中,随后用S转化A,S是骨架分子,该骨架分子便于另外的多样性节点的引入。在一些实施方式中,可以直接筛选A-S,从而展现单个多样性节点。在其它实施方式中,将A-S反应容器(例如,其可以首先包括来自原始材料的A-S的纯化)混合在一起并等分到B反应容器中(其中B是1或更大的整数),并与B结构单元之一反应。仍然在B反应容器中的A-S-B在一些情况下与C结构单元反应(其中C是1的整数),被纯化, 并经受使用B引物的聚合或连接反应,其中B引物的序列不同并且B引物确定B结构单元。在一些实施方式中,A-S可以是1的整数。在一个实施方式中,A-S可以直接连接于B起始寡核苷酸,并在B结构单元的反应以后,混合B反应。在一些实施方式中,直接筛选A-S-B混合物,其中B表示仅有的多样性节点,从而展现单个多样性节点。在其它实施方式中,A-S-B混合物(其中B表示仅有的多样性节点),随后被等分到C反应容器中,与C结构单元进行反应,并经受使用C引物的第二链聚合或连接反应,其中C引物的序列不同并且 C引物确定C结构单元。在一些实施方式中,B可以1的整数以及A-S大于1,在这种情况下,将现在用B衍生的A-S等分到C反应容器中,与C结构单元进行反应,然后经受使用C引物的第二链聚合反应,其中C引物的序列不同并且C引物确定C结构单元。这种一般策略可以扩展成包括另外的多样性节点(例如,D、E、F等),使得第一多样性节点与结构单元和/或S进行反应, 并通过起始寡核苷酸加以编码,混合,再等分到容器中,然后通过结构单元衍生随后的多样性节点,其由用于聚合或连接反应的引物加以编码。在一些实施方式中,A可以是1的整数,B可以是1的整数,以及使用C起始寡核苷酸。连接于C起始寡核苷酸的A-S-B形成在C反应容器中,与C结构单元进行反应,并直接蹄选。在一些实施方式中,S首先与起始寡核苷酸进行反应,随后使A、B和/或C(例如, 或D、E、F等)进行反应。在一些实施方式中,A、B、或C(例如,或D、E、F等)可以包含用于另外多样性节点的位点。如果这是这种情况,那么可以或不可以使用或需要S以引入另外的多样性节点。在一个实施方式中,起始寡核苷酸包括在标识区互补的发夹结构(图2)。标识区的长度可以是,例如,2至100个碱基对,优选长度为5至20个碱基对,以及最优选长度为6 至12个碱基对。起始寡核苷酸进一步包括在发夹结构的环区中的序列,其可以用作用于扩增的引物结合区(图3),使得单独与标识区相比,引物结合区对于其互补引物(例如,其可以包括旁侧标识区)具有更高的解链温度。在一个实施方式中,环区可以包括修饰碱基,该修饰碱基与未修饰碱基相比可以形成更高亲和力的双链体,这样的修饰碱基在本领域是已知的(图幻。起始寡核苷酸可以进一步包括在分子的3’端的非互补序列,其可以用来结合用于聚合或用于酶促连接的第二标识区(图4)。在一个实施方式中,可以随后交联链,例如,使用补骨脂素。在另一个实施方式中,环区和至少在环区的3’侧的标识区可以用来杂交于还包含第二标识区的互补寡核苷酸(图5)。在其中使用许多结构单元和相应标记(例如,100种标记)的情况下,在寡核苷酸合成步骤期间可以采用混合和分离策略以产生必要数目的标记。上述用于DNA合成的混合和分离策略在本领域中是已知的。在一个实施方式中,可以随后交联链,例如,使用补骨脂素。可以在选择结合本体与感兴趣的一个或多个靶以后,通过PCR来扩增获得的库成员(图6)。例如,包括起始寡核苷酸的头段,可以与接头和A进行反应,A包括,例如,1000种不同的变体。对于每种A结构单元,可以连接DNA标记A或将引物延伸到头段。可以在例如1000孔板或10X100孔板中进行这些反应。可以合并所有反应,可选地加以纯化,并分开到第二组孔板中。接着,可以使用B结构单元进行相同的程序,该B结构单元同样包括, 例如,1000种不同变体。可以将DNA标记B连接于头段,并可以合并所有的反应。A与B的 1000X 1000个组合的库(即,1,000,000种化合物),由标记的1,000,000种不同组合来标记。可以延伸相同的方式以添加变体C、D、E等。然后可以使用产生的库以确定结合于目标的化合物。可以通过PCR和DNA标记的测序来估计结合于库的化合物的组成,从而确定富集的化合物。模式2在另一个实施方式中(图7),该方法包括合成化合物的库,其中化合物包含具有不多于两个多样性位置的功能部分。化合物的功能部分可操作地连接于起始寡核苷酸,该起始寡核苷酸包含独特的基因序列,该独特的基因序列通过提供包含A起始化合物的溶液识别功能部分的结构,其中L是1或更大的整数,其中起始化合物包括分离到A反应容器中的具有A结构单元的功能部分(其中,例如,A是2或更大的整数),该功能部分可操作地连接于识别A结构单元的起始寡核苷酸。在一些实施方式中,用常见S来预衍生A结构单元。 在其它实施方式中,随后用S转化A,S是便于另外的多样性节点引入的骨架分子。接着,将 A-S反应容器(其可以首先包括来自原始材料的A-S的纯化)混合在一起并等分到B反应容器中(其中B是1或更大的整数),然后与B结构单元之一进行反应。仍然在B反应容器中的A-S-B,在一些实施方式中,与C结构单元进行反应(其中C是1的整数),加以纯化, 并分开保持在B容器中供筛选。在一些实施方式中,A-S是1的整数。在一个实施方式中, A-S可以直接连接于B起始寡核苷酸,并且在B结构单元的反应以后,将B反应混合并等分到C反应容器中,与C结构单元进行反应,然后分开保持在C容器中供筛选。在其它实施方式中,B可以是1的整数以及A-S大于1,在这种情况下,将现在用B衍生的A-S等分到C反应容器中,与C结构单元进行反应,并分开保持在C容器中供筛选。这种一般策略可以扩展成包括另外的多样性节点(例如,D、E、F等),使得第一多样性节点与结构单元和/或S进行反应并通过起始寡核苷酸加以编码,混合,再等分到容器中,然后通过结构单元来衍生随后的多样性节点并保持在它们各自的容器中供筛选(图8)。例如,如在模式1中所描述的,包括起始寡核苷酸的头段可以与接头和A结构单元进行反应,A结构单元包括,例如,1000种不同变体。对于每种A结构单元,可以连接DNA标记A或将引物延伸到头段。可以合并反应。接着,可以使用B结构单元进行相同的程序,但对于B未添加DNA标记。由于未编码B,所以可以合并所有“B”反应(例如,1000种反应) 并可以进行选择步骤以确定所有A结构单元,该所有A结构单元与未知B结构单元一起产生所期望的结合效应。然后在选择步骤中确定的A结构单元的库(例如,10个A结构单元) 可以与相同的1000个B结构单元进行反应,导致10,000种或更少化合物的筛选。在此轮中,可以添加用于B的DNA标记并且可以确定产生所期望结合效应的B结构单元连同例如 10个A结构单元,导致例如1,000,000种化合物的初始库的逐步卷积。可以单独测试一组这些最终的化合物以确定最好的,例如,粘合剂、激活剂、或抑制剂。为了在B合成以后避免合并所有反应,可以例如使用BIND阅读器(SRU生物系统 (Biosystems)),以监测在传感器表面上以高通量格式的结合(例如,384孔板和1536孔板)。例如,可以用DNA标记来编码A结构单元以及可以位置编码B结构单元。然后可以利用BIND传感器、测序、以及A标记的微阵列分析或限制酶切消化分析,来确定粘合剂。此分析便于鉴定产生所期望分子的A和B结构单元的组合。可以使用本领域技术人员已知的用于监测结合的其它方法,包括,例如,ELISA。模式1和模式2模式1和模式2的起始寡核苷酸可以包含在标识区的互补的发夹结构。起始寡核苷酸进一步包含在发夹结构的环区中的序列,其可以用作用于扩增的引物结合区,使得引物结合区单独与标识区相比具有对于它的互补引物(其可以包括旁侧标识区)更高的解链温度。在一个实施方式中,起始寡核苷酸包括能够与结构单元功能上进行反应的接头分子。可以通过本领域已知的方法将接头分子直接连接于寡核苷酸的5’端,或可以将接头分子包埋在分子内,例如,离开衍生碱基(例如,尿苷的C5位置),或可以利用本领域已知的标准技术将接头放置在寡核苷酸的中部。起始寡核苷酸可以是单链或双链的。可以通过由寡核苷酸形成的发夹结构或通过使用例如补骨脂素部分的交联,来实现双链寡核苷酸的形成(如本领域已知的)。起始寡核苷酸可以在编码结构单元的标识区的任何一侧包含两个引物结合区 (例如,以能够进行PCR反应)。可替换地,起始寡核苷酸可以包含在5’端的一个引物结合位点。在其它实施方式中,起始寡核苷酸是发夹结构,以及环区形成引物结合位点,或通过寡核苷酸杂交于在环的3’侧的标识区来引入引物结合位点。包含同源于起始寡核苷酸的 3’端的区以及携带在它的5’端的引物结合区(例如,以能够进行PCR反应)的引物寡核苷酸可以杂交于起始寡核苷酸,以及可以包含标识区,该标识区编码在多样性位置之一处所使用的结构单元。引物寡核苷酸可以包含另外的信息,如随机核苷酸的区,例如,长度为 2至16个核苷酸,其被包括用于生物信息分析。在一个实施方式中,起始寡核苷酸并不包含PCR引物结合位点。在另一个实施方式中,在适合于化合物库的至少一种成员结合于靶的条件下使化合物的库、或其部分与生物靶接触,接着除去并不结合于靶的库成员,然后分析一个或多个标识区。示例性的生物靶包括,例如,酶(例如,激酶、磷酸酶、甲基化酶、脱甲基酶、蛋白酶、 以及DNA修复酶)、与蛋白质蛋白质相互作用有关的蛋白质(例如,用于受体的配体)、受体靶(例如,GPCR和RTK)、离子通道、细菌、病毒、寄生物、DNA、RNA、朊病毒、或碳水化合物)。在一个实施方式中,在适合于化合物库的至少一种成员结合于靶的条件下使化合物的库、或其部分与生物靶接触,接着除去并不结合于靶的库成员,接着通过本领域已知的方法来扩增标识区,随后通过本领域已知的方法来分析一个或多个标识区。在一个实施方式中,标识区的扩增方法可以包括,例如,聚合酶链反应(PCR)、线性链扩增(LCR)、滚环扩增(RCA)、或本领域已知的用来扩增核酸序列的任何其它方法。在进一步的实施方式中,在结构单元添加的最后步骤以后并不合并化合物的库, 并对池(pool)进行单独筛选以确定结合于靶的一种或多种化合物。在另一个实施方式中,结合于靶的分子并不经受扩增,而是被直接分析。分析方法包括,例如,用于去卷积标识区的微阵列分析或基于珠的方法(图9)。还可以通过无标记光子晶体生物传感器来检测在筛选步骤期间结合的分子。
11
在一个实施方式中,起始寡核苷酸和/或引物寡核苷酸包含功能部分,该功能部分提供了例如通过荧光标记、Q点、或生物素的它的检测。在一个实施方式中,微阵列分析使用先进的检测能力,如,例如,瞬逝共振光子晶体。在一个实施方式中,扩增的方法包括形成油包水乳剂以产生多个含水微反应器, 其中微反应器中的至少一个具有结合于靶的化合物库的至少一种成员,能够与结合于靶的化合物库的至少一种成员的编码寡核苷酸结合的单珠,以及包含为进行核酸扩增所必需的试剂的扩增反应溶液;在微反应器中扩增编码寡核苷酸以形成编码寡核苷酸的扩增拷贝; 以及在微反应器中使编码寡核苷酸的扩增拷贝结合于珠。在已确定结合于感兴趣的靶的来自第一库的结构单元以后,可以以重复方式制备第二库,其中添加一个或两个另外的多样性节点,以及产生库并对多样性进行取样(如本文描述的)。可以重复此过程必需的一样多的次数以产生具有所期望的分子和药物性能的分子。示例性的A结构单元包括,例如,氨基酸(并不限于α-氨基酸)、具有胺的点击化学反应物(click-chemistry reactants)(例如,叠氮化物或炔烃链)、或硫羟反应物。A结构单元的选择取决于,例如,在接头中所使用的活性基团的特性、骨架部分的特性、以及用于化学合成的溶剂。参见,例如,表1。表1.示例性的位置A结构单元
权利要求
1.一种标记DNA编码的化合物库的方法,所述方法包括将双功能接头的第一官能团在起始寡核苷酸的5’端结合于所述起始寡核苷酸,其中,结合于所述双功能接头的所述起始寡核苷酸形成发夹结构;以及将所述双功能接头的第二官能团结合于所述化合物库的成分。
2.根据权利要求1所述的方法,其中,所述起始寡核苷酸包含第一标识区。
3.根据权利要求2所述的方法,其中,所述起始寡核苷酸包含杂交于所述起始寡核苷酸的所述第一标识区的第二标识区。
4.根据权利要求3所述的方法,其中,所述第二标识区包含荧光标记或生物素标记。
5.根据权利要求4所述的方法,其中,在选择步骤以后的分析以前,所述第二标识区未被扩增。
6.根据权利要求1-5中任一项所述的方法,其中,所述双功能接头、起始寡核苷酸、第一标识区、或第二标识区被修饰以增加所述DNA编码的化合物库的成员在有机条件下的溶解度。
7.—种产生DNA编码的库的方法,所述方法包括(a)产生第一多样性节点;(b)在分开的容器中编码所述第一多样性节点;(c)合并所述第一多样性节点;以及(d)将所述合并的第一多样性节点分离到第二组分开的容器中,其中,所述第一多样性节点进行反应以形成第二多样性节点。
8.根据权利要求7所述的方法,其中,并没有编码和合并所述第二多样性节点。
全文摘要
本发明的特征在于用于识别结合于生物靶的一种或多种化合物的许多方法。该方法包括合成化合物的库,其中化合物包含具有一个或多个多样性位置的功能部分。化合物的功能部分可操作地连接于识别功能部分结构的起始寡核苷酸。
文档编号C40B70/00GK102317513SQ201080007813
公开日2012年1月11日 申请日期2010年2月16日 优先权日2009年2月13日
发明者理查德·W·瓦格纳 申请人:X-化学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1