用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法

文档序号:467269阅读:713来源:国知局
用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
【专利摘要】本发明描述了用于使一组高度异质的寡核苷酸引物的DNA扩增效率标准化的组合物和方法,所述寡核苷酸引物通常可用于扩增一组异质的DNA模板,所述DNA模板含有编码T细胞受体(TCR)或免疫球蛋白(IG)的重排淋巴样细胞DNA。本发明所公开的实施例可用于克服在利用扩增引物亚组过程中的非期望的偏倚,所述非期望的偏倚导致对扩增产物进行多重高通量测序以定量样品中的独特TCR或Ig编码基因组时的不精确。本发明提供了供用作扩增引物组的校准用标准品的组合物,所述组合物包含基本上等摩尔量的多种多样性的模板寡核苷酸。本发明还提供了用于在扩增期间识别和修正偏倚引物效率的方法。
【专利说明】用于测量和校准多重PCR反应中的扩增偏倚的组合物和方 法
[0001] 相关申请的交叉引用
[0002] 本申请要求2012年11月14日提交的美国临时申请No. 61/726, 489和2012年5 月8日提交的美国临时申请No.61/644, 294的权益,所述申请的全部公开内容据此全文以 引用方式并入以用于所有目的。 【背景技术】 【技术领域】
[0003]
[0004] 本公开整体涉及多重核酸扩增反应中的适应性免疫受体编码DNA (例如,编码T细 胞受体(TCR)和免疫球蛋白(IG)的DNA)的定量高通量测序。具体地讲,本文所述的组合 物和方法克服了适应性免疫受体编码序列的定量过程中的不期望失真,所述失真可由多重 DNA扩增中的特异性寡核苷酸引物的过度利用和/或利用不足偏倚所造成。
[0005] 相关领域的描沭
[0006] 适应性免疫系统采用若干策略生成T-和B-细胞抗原受体(即适应性免疫受体) 的组库,其具有足够的多样性以识别众多的潜在病原体。T细胞识别与各种癌症或传染性 生物体相关的众多抗原的能力由其T细胞抗原受体(TCR)赋予,所述受体是来自TCRA基因 座的a (alpha)链与来自TCRB基因座的0 (beta)链的异二聚体,或来自TCRG基因座的 Y (gamma)链与来自TCRD基因座的S (delta)链的异二聚体。构成这些链的蛋白质由DNA 编码,所述DNA在淋巴样细胞中采用独特的重排机制以便生成极其多样的TCR。该多亚基免 疫识别受体与⑶3复合体相连并结合于由主要组织相容性复合体(MHC)类别I或MHC类别 II蛋白质递呈在抗原递呈细胞(APC)表面上的肽。TCR结合于APC上的抗原肽是T细胞活 化过程的中心事件,T细胞活化在免疫突触处T细胞与APC之间的接触点处发生。
[0007] 每个TCR肽均含有可变互补决定区(⑶R)以及骨架区(FR)和恒定区。a PT细胞 的序列多样性主要由a和0链可变结构域的第三互补决定区(CDR3)环的氨基酸序列决 定,所述多样性分别是0链基因座中的可变(V e)基因区段、多样性(De)基因区段与连接 (Je)基因区段之间重组以及a链基因座中的类似V a基因区段与Ja基因区段之间重组的 结果。TCRa和0链基因座中的多个此类基因区段的存在使得能够编码大量不同的CDR3 序列。TCR基因重排过程期间V e-De、〇0-%和V a-Ja接合部处核苷酸的独立添加和缺失 进一步增加了 CDR3序列多样性。在这方面,免疫能力源于TCR的多样性。
[0008] YSTCR异二聚体与a0TCR不同之处在于其编码的受体与先天免疫系统紧密相 互作用并以非HLA依赖性方式识别抗原。TCRyS在发育早期表达,并具有特化的解剖分 布、独特的病原体和小分子特异性,以及广谱的先天和适应性细胞相互作用。TCRyV和J区 段表达的偏倚模式在个体发生早期建立。因此,成体组织中的多样TCRy组库是在环境暴 露于病原体和有毒分子造成的刺激之后大量外周扩增的结果。
[0009] 免疫球蛋白(Ig或IG),本文也称为B细胞受体(BCR),是由B细胞表达的蛋白质, 所述蛋白质由四条多肽链组成,即来自IGH基因座的两条重链(H链)以及来自IGK或IGL 基因座的两条轻链(L链),从而形成H 2L2结构。H和L链各自包含三个涉及抗原识别的互 补决定区(CDR),以及骨架区和恒定结构域,这与TCR类似。Ig的H链最初使用IGM或IGD 恒定区外显子表达为膜结合同工型,但在抗原识别后恒定区可类别转换为若干另外的同种 型,包括IGG、IGE和IGA。与TCR-样,个体内的初始Ig的多样性主要由高变互补决定区 (CDR)决定。与TCRB类似,H链的⑶R3结构域由V H、D#P JHS因区段的组合连接所形成。 Ig基因重排过程期间¥11-011、0 11-义和¥11-1接合部处核苷酸的独立添加和缺失进一步增加了 高变结构域序列多样性。与TCR不同,在初始B细胞最初识别抗原后整个重排IG基因的体 细胞高频突变(SHM)进一步提高了 Ig序列多样性。SHM的过程不受限于⑶R3,因此可将变 化引入骨架区、⑶R1和⑶R2、以及体细胞重排的⑶R3的生殖系序列中。
[0010] 由于适应性免疫系统部分地通过表达独特TCR或BCR的细胞的克隆性扩增来起 作用,准确测量每个T细胞或B细胞克隆的总丰度的变化对于理解适应性免疫应答的动态 是重要的。例如,健康人体具有数百万独特的重排TCRP链,每条链在健康个体的大致万 亿T细胞中的数百至数千克隆T细胞中携带。利用高通量测序方面的进步,最近出现了分 子免疫学的新领域以对巨大TCR和BCR组库进行谱图分析。用于对重排的适应性免疫受体 基因序列测序并用于适应性免疫受体克隆型确定的组合物和方法在U. S. A. N. 13/217, 126、 U. S. A. N. 12/794, 507、PCT/US2011/026373 和 PCT/US2011/049012 中有所描述,它们全部以 引用方式并入本文。
[0011] 到目前为止,已采用了若干不同策略来对编码适应性免疫受体的核酸以高通量方 式定量地测序,并且这些策略的区别可在于例如用于扩增CDR3编码区的方法以及对基因 组DNA(gDNA)或信使RNA(mRNA)测序的选择。
[0012] 对mRNA测序是比对gDNA测序更可能简便的方法,因为mRNA剪接事件去除了 J与 C区段之间的内含子。这允许在C区使用通用3' PCR引物扩增具有不同V区和J区的适应 性免疫受体(例如,TCR或Ig)。对于每种TCRP而言,例如十三个J区段均小于60个碱基 对(bp)长。因此,剪接事件导致编码TCRP恒定区的相同多核苷酸序列(不论使用的是哪 些V和J序列)在小于l〇〇bp重排VDJ接合部内。然后可使用与mRNA的多聚A尾互补的 多聚dT引物、随机小引物(通常为六聚物或九聚物)或C区段特异性寡核苷酸,将剪接的 mRNA逆转录为互补DNA(cDNA)。这应产生TCR cDNA的无偏文库(因为所有cDNA均用相同 寡核苷酸引发,不论是多聚dT、随机六聚物,还是C区段特异性寡核苷酸),然后可对所述无 偏文库测序以获得有关每种重排中使用的V和J区段以及CDR3特异性序列的信息。此类 测序可使用单种、跨CDR3的长读段("长读段")技术,或者可替代地涉及使用片段库和较 高通量较短序列读段进行的较长序列的鸟枪法拼接。
[0013] 然而,基于mRNA测序来对表达特定重排TCR(或Ig)的样品中的细胞数量定量的 尝试难以说明,因为每个细胞潜在地表达不同数量的TCR mRNA。例如,体外活化的T细胞 每个细胞拥有的mRNA数量是静止期T细胞的10-100倍。到目前为止,有关不同功能状态 的T细胞的TCR mRNA的相对量的信息非常有限,因此大量mRNA的定量不一定能准确测量 携带每种克隆TCR重排的细胞的数量。
[0014] 另一方面,大多数T细胞具有一个有效重排的TCRa和一个有效重排的TCR3基 因(或两个重排的TCRY和TCRS),并且大多数B细胞具有一个有效重排的Ig重链基因 和一个有效重排的Ig轻链基因(IGK或IGL),因此样品中的编码TCR或BCR的基因组DNA 的定量应分别与样品中的T或B细胞的数量直接关联。编码适应性免疫受体链中的任何一 种或多种的多核苷酸的基因组测序有利地需要以等同效率扩增取自受试者淋巴样细胞的 含DNA样品中存在的许多可能重排CDR3序列的所有序列,然后进行定量测序,使得可获得 每个重排CDR3克隆型的相对丰度的定量量度。
[0015] 然而,采用此类方法遇到了困难,因为使用多重PCR时不易对每个重排克隆实现 等同的扩增和测序效率。例如,在TCRB处每个克隆采用54个可能的生殖系V区编码基因 中的一个和13个可能的J区编码基因中的一个。V和J区段的DNA序列必需具有多样性, 以生成多样性适应性免疫组库。该序列多样性使得不可能设计出将以等同亲和力退火至所 有V区段(或J区段)的单个通用引物序列,并会产生复杂DNA样品,其中使用多重扩增和 高通量测序同时定量多种分子物质的能力受到技术限制,而阻碍了所述样品中所含的多种 不同序列的准确测定。
[0016] 一种或多种因素可引起使测序数据输出与输入克隆型拷贝数之间的关联出现偏 态的伪差,从而削弱了从基于TCRP基因模板的高度多样集合的多重扩增的测序策略获 得可靠定量数据的能力。这些伪差通常是多重扩增步骤过程中多样引物的不等同使用所 引起。在使用多样扩增模板的多重反应中可出现随示差退火动力学而变的一种或多种寡 核苷酸引物的此类偏倚利用,原因在于如下的一者或多者:模板和/或寡核苷酸引物的核 苷酸碱基组成的差异、模板和/或引物长度的差异、所使用的具体聚合酶、扩增反应温度 (例如,退火、延伸和/或变性温度)和/或其他因素(例如,Kanagawa,2003J.Bi 〇SCi. Bioeng. 96:317 (Kanagawa,2003年,《生物学与生物工程杂志》,第96卷,第317页);Day et al.,1996Hum. Mol. Genet. 5:2039 (Day 等人,1996 年,《人分子遗传学》,第 5 卷,第 2039 页); Ogino et al.,2002J. Mol. Diagnost. 4:185 (Ogino 等人,2002 年,《分子诊断学杂志》,第 4 卷,第185页);1^1'仙1(16七31.,199813;[0七6(31111191168 25:684(1^1'仙1(1等人,1998 年,《生 物技术》,第 25 卷,第 684 页);Aird et al.,2011Genome Biol.l2:R18(Aird 等人,2011 年, 《基因组生物学》,第12卷,第R18页))。
[0017] 很明显,仍然需要改善的组合物和方法,其将允许以避免偏态结果的方式准确定 量复杂样品中的适应性免疫受体编码DNA序列多样性,所述偏态结果诸如单独序列失实的 过高占比或过低占比,原因在于在用于复杂模板DNA群体的多重扩增的寡核苷酸引物组中 扩增特异性模板过程中的偏倚。本发明所述的实施例解决了该需求并提供了其他相关优 点。
【发明内容】

[0018] 本发明公开了一种用于使寡核苷酸引物组的扩增效率标准化的组合物,所述寡核 苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生 物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应性免疫受体包含 可变区和连接区,所述组合物包含多种模板寡核苷酸,所述模板寡核苷酸具有多种由如下 通式表示的寡核苷酸序列:5'-Ul-Bl-V-B2-R-B3-J-B4-U2-3' [I],其中:(a)V是包含适应 性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷 酸的多核苷酸,并且每种V多核苷酸包含独特的寡核苷酸序列;(b) J是包含适应性免疫受 体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的多核 苷酸,并且每种J多核苷酸包含独特的寡核苷酸序列;(c)Ul要么不存在,要么包含选自如 下的寡核苷酸序列:(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸 序列并位于其5'端的第一测序平台特异性寡核苷酸序列;(d)U2要么不存在,要么包含选 自如下的寡核苷酸序列:(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核 苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列;(e)Bl、B2、B3和B4各自独 立地要么不存在,要么各自包含具有3-25个连续核苷酸的条形码序列的寡核苷酸B,其中 B1、B2、B3和B4各包含一寡核苷酸序列,所述寡核苷酸序列独特地识别作为成对组合的(i) (a)的独特V寡核苷酸序列和(ii)(b)的独特J寡核苷酸序列;(f)R要么不存在,要么包 含限制性酶识别位点,所述限制性酶识别位点包含不存在于(a)-(e)中的寡核苷酸序列, 并且其中:(g)所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列,以较大 者为准,其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试 者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对 每种独特V多核苷酸的模板寡核苷酸以及至少一种针对每种独特J多核苷酸的模板寡核苷 酸。
[0019] 在一个实施例中,a为1至受试者的哺乳动物基因组中V基因区段的最大数量的 数。在另一个实施例中,b为1至受试者的哺乳动物基因组中J基因区段的最大数量的数。 在其他实施例中,a为1或者b为1。
[0020] 在一些实施例中,所述多种模板寡核苷酸包含至少(aXb)种独特的寡核苷酸序 列,其中a是哺乳动物受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是 哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含 至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。在 一个实施例中,J包含适应性免疫受体J区编码基因序列的恒定区。
[0021] 在另一个实施例中,适应性免疫受体选自1'0?、1'0?、1'0^、1'0?、1611、161(和161。 在一些实施例中,(a)的V多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体V区 多肽。在其他实施例中,(b)的J多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受 体J区多肽。
[0022] 在一些实施例中,终止密码子介于V与B2之间。
[0023] 在一个实施例中,所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔 量存在。在另一个实施例中,所述多种模板寡核苷酸具有选自如下的多种由通式(I)表示 的序列:(1)所述多种由通式(I)表示的寡核苷酸序列,其中V和J多核苷酸具有在图5a_51 中作为 TCRB V/J 组 1、TCRB V/J 组 2、TCRB V/J 组 3、TCRB V/J 组 4、TCRB V/J 组 5、TCRB V/J 组 6、TCRB V/J 组 7、TCRB V/J 组 8、TCRB V/J 组 9、TCRB V/J 组 10、TCRB V/J 组 11、 TCRB V/J组12和TCRB V/J组13的68组TCRB V和J SEQ ID N0中的至少一组中示出的 TCRB V和J序列;(2)所述多种由通式(I)表示的寡核苷酸序列,其中V和J多核苷酸具有 在图 6a 和 6b 中作为 TCRG V/J 组 1、TCRG V/J 组 2、TCRG V/J 组 3、TCRG V/J 组 4 和 TCRG V/J组5的14组TCRG V和J SEQ ID N0中的至少一组中示出的TCRG V和J序列;(3)所 述多种由通式(I)表示的寡核苷酸序列,其中V和J多核苷酸具有在图7a-7m中作为IGH V/J 组 1、IGH V/J 组 2、IGH V/J 组 3、IGH V/J 组 4、IGH V/J 组 5、IGH V/J 组 6、IGH V/J 组7、IGH V/J组8和IGH V/J组9的127组IGH V和J SEQ ID NO中的至少一组中示出 的IGH V和J序列;(4)如SEQ ID NO: 3157-4014中所示的所述多种由通式⑴表示的寡 核苷酸序列;(5)如SEQ ID N0:4015-4084中所示的所述多种由通式(I)表示的寡核苷酸 序列;(6)如SEQ ID N0:4085-5200中所示的所述多种由通式(I)表示的寡核苷酸序列; (7)如SEQ ID N0:5579-5821中所示的所述多种由通式(I)表示的寡核苷酸序列;(8)如 SEQ ID NO: 5822-6066所示的所述多种由通式(I)表示的寡核苷酸序列;以及(9)如SEQ ID NO:6067-6191中所不的所述多种由通式(I)表不的寡核苷酸序列。
[0024] 在一些实施例中,V是包含适应性免疫受体V区编码基因序列或其互补序列的至 少30、60、90、120、150、180或210个连续核苷酸的多核苷酸。在另一个实施例中,V是包含 适应性免疫受体V区编码基因序列或其互补序列的不超过900、800、700、600或500个连续 核苷酸的多核苷酸。
[0025] 在其他实施例中,J是包含适应性免疫受体J区编码基因序列或其互补序列的至 少16-30、31-60、61-90、91-120或120-150个连续核苷酸的多核苷酸。在另一个实施例中, J是包含适应性免疫受体J区编码基因序列或其互补序列的不超过500、400、300或200个 连续核苷酸的多核苷酸。
[0026] 在一些实施例中,每种模板寡核苷酸的长度小于1000、900、800、700、600、500、 400、300或200个核苷酸。
[0027]在其他实施例中,所述组合物包含能够扩增编码一种或多种适应性免疫受体的重 排核酸分子的一组寡核苷酸引物,所述寡核苷酸引物组包含复数a'种独特的V区段寡核苷 酸引物和复数b'种独特的J区段寡核苷酸引物。在一些实施例中,a'为1至哺乳动物基 因组中V基因区段的最大数量的数,并且b'为1至哺乳动物基因组中J基因区段的最大数 量的数。在一个实施例中,a'为a。在另一个实施例中,b'为b。
[0028] 在又一个实施例中,寡核苷酸引物组中的每种V区段寡核苷酸引物和每种J区段 寡核苷酸引物能够特异性杂交至所述多种模板寡核苷酸中的至少一种模板寡核苷酸。在其 他实施例中,每种V区段寡核苷酸引物包含与至少一种适应性免疫受体V区编码基因区段 互补的至少15个连续核苷酸的核苷酸序列。在另一个实施例中,每种J区段寡核苷酸引物 包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸 序列。
[0029] 在其他实施例中,所述组合物包含至少一种具有每种V区段寡核苷酸引物可与之 特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸,以及至少一种具有每种J 区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。
[0030] 本发明包括用于测定一组寡核苷酸引物的成员间的非均一核酸扩增潜能的方法, 所述一组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸 分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。所述方法包 括用于如下目的步骤:(a)在多重PCR反应中扩增如本文所述的组合物以获得多种扩增的 模板寡核苷酸;(b)对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种 独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率; 以及(c)将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较,其中所述预期分 布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷 酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员 间的非均一核酸扩增潜能。
[0031] 在一个实施例中,预定摩尔比是等摩尔的。在另一个实施例中,预期分布包括由所 述寡核苷酸引物组扩增的所述模板寡核苷酸组的均一扩增水平。在又一个实施例中,每种 扩增的模板核酸分子的长度小于 1000、900、800、700、600、500、400、300、200、100、90、80 或 70个核苷酸。
[0032] 所述方法包括这样的步骤,所述步骤包括:对于相对于预期分布呈现非均一扩增 潜能的所述寡核苷酸引物组的每个成员,调节所述寡核苷酸扩增引物组中的所述寡核苷酸 引物成员的相对占比。在一个实施例中,调节包括增加所述寡核苷酸引物组中的所述成员 的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。在另一个实 施例中,调节包括减小所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核 苷酸引物组的成员间的非均一核酸扩增潜能。
[0033] 在其他实施例中,所述寡核苷酸引物组不包括特异性杂交至V区假基因或孤独基 因或者J区假基因或孤独基因的寡核苷酸引物。
[0034]所述方法还包括这样的步骤,所述步骤包括:对于相对于预期分布呈现非均一扩 增潜能的所述寡核苷酸扩增引物组的每个成员,计算所扩增的模板核酸分子(所述成员促 进其扩增)的成比例增加或减小的出现频率,从而修正所述寡核苷酸引物组的成员间的非 均一核酸扩增潜能。
[0035] 本发明包括用于定量多种重排核酸分子的方法,所述重排核酸分子编码生物样品 中的一种或多种适应性免疫受体,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的 重排核酸分子,每种适应性免疫受体包含可变(V)区和连接(J)区,所述方法包括:(A)在 多重聚合酶链式反应(PCR)中扩增重排核酸分子,所述反应包含:(1)来自包含哺乳动物受 试者的淋巴样细胞的生物样品的重排核酸分子;(2)如本文所述的组合物,其中存在已知 数量的具有独特寡核苷酸序列的所述多种模板寡核苷酸的每一者;(3)寡核苷酸扩增引物 组,其能够扩增编码来自生物样品的一种或多种适应性免疫受体的重排核酸分子。
[0036] 在一些实施例中,所述引物组包含:(a)基本上等摩尔量的多种V区段寡核苷酸引 物,其各自独立地能够特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或 特异性杂交至其互补序列,其中每种V区段引物包含与至少一种功能性适应性免疫受体V 区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种V区段引物 特异性杂交至组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段,以及 (b)基本上等摩尔量的多种J区段寡核苷酸引物,其各自独立地能够特异性杂交至至少一 种编码适应性免疫受体J区多肽的多核苷酸或特异性杂交至其互补序列,其中每种J区段 引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷 酸的核苷酸序列,并且其中所述多种J区段引物特异性杂交至组合物中存在的基本上所有 功能性适应性免疫受体J区编码基因区段。
[0037] 在另一个实施例中,V区段寡核苷酸引物和J区段寡核苷酸引物能够在所述多重 聚合酶链式反应(PCR)中促进如下的扩增:(i)组合物中的基本上所有模板寡核苷酸以产 生大量扩增的模板寡核苷酸,所述大量扩增的模板核酸分子足以定量组合物中的模板寡核 苷酸的多样性,以及(ii)生物样品中的基本上所有编码适应性免疫受体的重排核酸分子 以产生大量扩增的重排DNA分子,所述大量扩增的重排核酸分子足以定量来自生物样品的 DNA中的重排核酸分子的多样性。
[0038] 在一个实施例中,所述多种扩增的模板寡核苷酸中和所述多种扩增的重排核酸分 子中的每种扩增核酸分子的长度小于1〇〇〇个核苷酸;(B)对所述扩增的模板寡核苷酸和所 述扩增的重排核酸分子进行定量测序以定量(i)含有至少一种寡核苷酸条形码序列的扩 增模板寡核苷酸的模板产物数量,以及(ii)缺少寡核苷酸条形码序列的扩增重排核酸分 子的重排产物数量;(C)将(B) (i)的模板产物数量除以(A) (2)的具有独特寡核苷酸序列 的所述多种模板寡核苷酸中的每一者的已知数量,来计算扩增因子;以及(D)将(B) (ii)的 重排产物数量除以(C)中计算的扩增因子以定量样品中的独特适应性免疫受体编码重排 核酸分子的数量。
[0039] 在其他实施例中,样品中的独特适应性免疫受体编码重排核酸分子的定量数量是 样品中的独特B细胞或独特T细胞基因组模板的数量。
[0040] 本发明包括用于计算多重PCR测定法中的平均扩增因子的方法,所述方法包括: 获得生物样品,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子;使 所述样品与构成如本文所述的组合物的已知量的模板寡核苷酸接触;在多重PCR反应中扩 增模板寡核苷酸和来自哺乳动物受试者的淋巴样细胞的重排核酸分子,以获得多种扩增的 模板寡核苷酸和多种扩增的重排核酸分子;对所述多种扩增的模板寡核苷酸进行测序,以 对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡 核苷酸序列的出现频率;以及基于所述多种扩增的模板寡核苷酸的平均拷贝数和所述模板 寡核苷酸的所述已知量,测定所述多重PCR反应的平均扩增因子。
[0041] 所述方法还包括对来自哺乳动物受试者的淋巴样细胞的所述多种扩增的重排核 酸分子进行测序,以对构成所述多种的每种独特重排核酸分子测定i)重排核酸分子序列 和(ii)所述重排核酸分子序列的出现次数;以及基于所述多重PCR反应的平均扩增因子和 所述重排核酸分子的所述出现次数,测定所述样品中的淋巴样细胞的数量。
[0042] 在其他实施例中,所述方法包括测定所述样品中的淋巴样细胞的数量,其包括生 成所述扩增重排核酸序列每一者的出现次数的总和并将所述总和除以所述平均扩增因 子。在一些实施例中,所述已知量是每种所述模板寡核苷酸一个拷贝。在一个实施例中, 100 < a < 500。在另一个实施例中,100 < b < 500。
[0043] 提供了用于修正多重PCR扩增反应中的扩增偏倚的方法以定量生物样品中编码 一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋 巴样细胞的重排核酸分子,所述方法包括:(a)使所述样品与本文所述的组合物接触以生 成模板加标样品,其中所述模板和所述重排核酸分子包含对应的V和J区序列;(b)在多重 PCR反应中扩增所述模板加标样品,以获得多种扩增的模板寡核苷酸和多种扩增的编码多 种适应性免疫受体的重排核酸分子;(c)对所述多种扩增的模板寡核苷酸测序,以对构成 所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸 序列的出现频率;(d)对编码一种或多种适应性免疫受体的所述多种扩增的重排核酸分子 进行测序,以对构成所述多种的编码所述多种适应性免疫受体的每种独特重排核酸分子测 定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现频率;(e)将所述模板寡核 苷酸序列的出现频率与预期分布进行比较,其中所述预期分布基于构成所述组合物的所述 多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷酸序列的所述出现频率与所述 预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能;(f) 生成由具有所述指示的非均一核酸扩增潜能的所述寡核苷酸扩增引物组的所述成员扩增 的一组模板分子和重排核酸分子序列的一组修正值,其中所述修正值组修正所述多重PCR 反应中的扩增偏倚;以及( g)任选地将所述修正值组应用于所述重排核酸分子序列的所述 出现频率以修正所述多重PCR反应中的扩增偏倚。
[0044] 本发明包括试剂盒,所述试剂盒包含:包含如下的试剂:包含如本文所述的多种 模板寡核苷酸和一组寡核苷酸引物的组合物;用于测定能够扩增生物样品中编码一种或多 种适应性免疫受体的重排核酸分子的所述寡核苷酸引物组的成员间的非均一核酸扩增潜 能的使用说明,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。
[0045] 在另一个实施例中,所述试剂盒包含用于修正具有非均一核酸扩增潜能的所述寡 核苷酸引物组的一个或多个成员的使用说明。
[0046] 在其他实施例中,所述试剂盒包含用于定量样品中独特适应性免疫受体编码重排 核酸分子的数量的使用说明。
[0047] 在参考下列【具体实施方式】和附图后,本文所述的发明实施例的这些和其他方面将 显而易见。本说明书中提及的和/或申请资料表中列出的所有美国专利、美国专利申请公 布、美国专利申请、国外专利、国外专利申请和非专利出版物均全文以引用方式并入本文, 就如同每一篇被单独地并入一样。可根据需要修改本发明的各方面和实施例以采用各种专 利、申请和出版物的概念以提供另外的实施例。
[0048] 附图简述
[0049] 参照下列描述和附图,本发明的这些和其他特征、方面和优点将变得更好理解,其 中:
[0050] 图1示出了供用于使能够扩增编码适应性免疫受体(TCR或BCR)的重排DNA的寡 核苷酸引物组的扩增效率标准化的示例性模板寡核苷酸的示意图。U1、U2为通用接头寡核 苷酸;B1-4为条形码寡核苷酸;V为可变区寡核苷酸;J为连接区寡核苷酸;R为限制性酶识 别位点;S为任选的终止密码子。
[0051] 图2示出了使用等摩尔(未调节)的一组52种PCR引物(SEQ ID N0:1753-1804) 从标准化寡核苷酸模板组合物(以SEQ ID N0:872-1560示出的等摩尔的一组模板)扩增 并在Illumina HiSeq? DNA测序仪上定量地测序的单独TCRB V基因区段序列的扩增后频 率。不存在偏倚的频率计算为0.0188。
[0052] 图3示出了使用TCRBV区特异性引物交叉扩增模板寡核苷酸后的定量测序结果。 Y轴指示以来自相同引物组的其他引物的摩尔浓度的两倍(2X)存在于每个独立扩增反应 中的单独扩增引物(SEQ IDN0:1753-1804),所述引物组用于扩增标准化寡核苷酸模板组 合物(以SEQ IDN0:872-1560示出的等摩尔的一组模板);X轴未标记,但数据点以与Y 轴相同的顺序提供,其中X轴代表由定量测序所识别的对应的扩增V基因模板。黑色方块 指示在使用以相对于等摩尔浓度的所有其他引物的2X存在的相应引物时扩增水平没有变 化;白色方块指示扩增的10倍增加;灰色方块指示〇与10倍之间的扩增的中间程度(呈现 灰度级梯度)。白色方块的对角线指示给定引物的2X浓度导致大多数引物的相应模板的扩 增的约10倍增加。非对角白色方块指示某些引物能够对其退火和扩增的非对应模板。
[0053] 图4示出了在调节引物利用偏倚之前使用等摩尔浓度的TCRB扩增引物组(SEQ ID NO: 1753-1804)的所有成员(黑条,所有V区引物以等摩尔浓度存在)以及在调节多个单 独引物浓度以补偿偏倚之后使用相同引物组(SEQ ID N0:1753-1804)(灰条,减小了高效引 物的浓度并增加了低效引物的浓度,参见表6)从标准化寡核苷酸模板组合物(以SEQ ID N0:872-1560示出的等摩尔的一组模板)扩增的单独TCRB V基因区段序列的扩增后频率。 通过在Illumina HiSeq? DNA测序仪上定量测序来测定扩增后频率。
[0054]图 5a-51 示出了供在包含多种由通式 5' -U1-B1-V-B2-R-B3-J-B4-U2-3' [I]表示 的寡核苷酸序列的模板组合物中使用的TCRB V/J组(68V+13J),其用于使寡核苷酸引物组 的扩增效率标准化,所述寡核苷酸引物组能够扩增编码一种或多种人T细胞受体3 (TCRB) 链多肽的重排DNA。
[0055]图 6a 和 6b 示出了供在包含多种由通式 5' -U1-B1-V-B2-R-B3-J-B4-U2-3' [I] 表示的寡核苷酸序列的模板组合物中使用的TCRG V/J组(14V+5J),其用于使寡核苷酸 引物组的扩增效率标准化,所述寡核苷酸引物组能够扩增编码一种或多种人T细胞受体 Y (TCRG)链多肽的重排DNA。
[0056]图 7a-7m 示出了供在包含多种由通式 5' -U1-B1-V-B2-R-B3-J-B4-U2-3' [I]表示 的寡核苷酸序列的模板组合物中使用的IGH V/J组(127V+9J),其用于使寡核苷酸引物组 的扩增效率标准化,所述寡核苷酸引物组能够扩增编码一种或多种人免疫球蛋白重(IGH) 链多肽的重排DNA。
[0057] 图8示出了如下的结果:计算添加到IGH序列的多重PCR扩增的模板组合物中的 每个VJ对的扩增因子,然后取所有合成模板的扩增因子的平均值以估算所有合成模板分 子的序列覆盖倍数。
[0058] 图9示出了使用如本文所述的合成模板组合物和扩增因子估算的B细胞数量相对 于用作天然DNA模板来源的B细胞的已知数量的图。
[0059] 图10示出了 1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子中的每 一者的PCR扩增前测序计数。
[0060] 图11示出了针对相对扩增偏倚作图的合成TCRB VJ模板的TCRB引物迭代。
[0061] 图12示出了针对相对扩增偏倚作图的合成IGH VJ模板的IGH引物迭代。
[0062] 图13示出了 V基因的27种合成IGH DJ模板的相对扩增偏倚。
[0063] 图14a_d示出了 55种合成TCRG VJ模板的TCRG引物迭代。在化学偏倚控制修正 之前(图14a)、化学修正的第一次迭代(图14b)、化学修正的第二次迭代(图14c)和化学 修正的最后迭代(图14d)测定TCRG VJ引物的相对扩增偏倚。 【具体实施方式】
[0064] 在某些实施例中及如本文所述,本发明提供了组合物和方法,所述组合物和方法 可用于对编码适应性免疫受体如免疫球蛋白(Ig)和/或T细胞受体(TCR)的重排基因的庞 大且结构多样的群体进行可靠定量。这些重排基因可存在于含有来自受试者或生物源(包 括人受试者)的淋巴样细胞的DNA的生物样品中。
[0065] 如本文所用,"重排核酸分子"可包括从包含编码重排适应性免疫受体的序列的淋 巴样细胞系直接或间接获得的任何基因组DNA、cDNA或mRNA。
[0066] 本文公开了用于使复杂寡核苷酸引物组标准化和校准的出乎意料有利的方 法,所述引物组用于多重核酸扩增反应,以由含有编码适应性免疫受体的重排基因的 生物样品生成扩增重排DNA分子的群组,之后再对此类扩增的产物进行定量高通量测 序。重排TCR和BCR(IG)编码DNA序列的多重扩增和高通量测序例如在如下文献中 有所描述:Robins et al.,2009Blood 114,4099(Robins 等人,2009 年,《血液》,第 114 卷,第 4099 页);Robins et al.,2010Sci.Translat.Med.2:47ra64(Robins 等人,2010 年,《科学转化医学》,第 2 卷,第 47ra64 页);Robins et al.,2011J. Immunol. Meth. doi:10. 1016/j. jim.2011.09.001(Robins 等人,2011 年,《免疫法杂志》,doi:10. 1016/ j.jim. 2011. 09. 001) ;Sherwood et al.2011Sci. Translat. Med. 3:90ra61 (Sherwood 等 人,2011年,《科学转化医学》,第3卷,第90ra61页);U. S.A.N. 13/217, 126(美国公布 No. 2012/0058902)、U. S. A. N. 12/794, 507 (美国公布 No. 2010/0330571)、W0/2010/151416、 W0/2011/106738 (PCT/US2011/026373)、W02012/027503 (PCT/US2011/049012)、 U. S. A. N. 61/550, 311和U. S. A. N. 61/569, 118 ;因此这些公开内容以引用方式并入并且可 进行修改以根据本文所述的实施例使用。
[0067] 简而言之及根据非限制性理论,本发明的组合物和方法克服了在通过对多重核酸 扩增产物测序来定量TCR和BCR基因多样性的当前方法中可出现的不准确性。为了适应生 物样品中可存在的TCR和BCR基因模板序列的广泛多样性,多重扩增反应中使用的寡核苷 酸引物组通常包含多种多样的序列长度和核苷酸组成(例如,GC含量)。因此,在给定的一 组扩增反应条件下,不同引物退火至其同源模板序列并支持其同源模板序列的扩增的效率 可明显不同,从而导致不同引物的非均一利用,从而不同扩增产物的相对定量占比中产生 伪差偏倚。
[0068]例如,一些高效引物的相对过度利用导致某些扩增产物的过高占比,并且一些其 他低效引物的相对过低利用导致某些其他扩增产物的过低占比。存在于含淋巴样细胞DNA 的样品中的每种模板物质的相对量的定量测定(通过对扩增产物测序获得)可进而得出对 于扩增前样品中的不同模板物质的实际相对占比而言失实的信息。在初步研究中,例如,观 察到使用一组寡核苷酸引物的多重PCR未均一扩增TCRB V基因区段,所述寡核苷酸引物组 被设计成能够从人淋巴样细胞DNA模板扩增每种可能的人TCRB可变(V)区基因的序列。相 反,一些V基因区段被相对过度扩增(占总序列的约10% )并且其他V基因区段被相对过 低扩增(占总序列的约4X 1(T3% );还可参见例如图2。
[0069] 为了克服扩增引物亚群的此类偏倚利用的问题,本公开首次提供了用于使寡核苷 酸引物组的成员的扩增效率标准化的模板组合物和方法,其中所述引物组能够扩增生物样 品中编码多种适应性免疫受体(TCR或Ig)的重排DNA,所述生物样品包含来自淋巴样细胞 的DNA。所述模板组合物包含多种如本文更详细描述的由通式(I)表示的多样性模板寡核 苷酸:
[0070] 5,-U1-B1-V-B2-R-B3-J-B4-U2-3, (I)
[0071] 构成模板组合物的组成性模板寡核苷酸相对于单独模板寡核苷酸的核苷酸序列 具有多样性。单独模板寡核苷酸从而可随大量可能的TCR或BCR可变(V)和连接(J)区多 核苷酸间的显著序列变异,而彼此在核苷酸序列中大幅变化。单独模板寡核苷酸物质的序 列也可随多样的多种模板内的特定模板中所包含的U1、U2、B(B1、B2、B3和B4)和R寡核苷 酸的序列差异而彼此变化。
[0072] 在某些实施例中,条形码寡核苷酸8出1、82、83和财)可独立地和任选地包含 寡核苷酸条形码序列,其中所述条形码序列被选择为独特地识别特定的独特V寡核苷酸 序列与特定的独特J寡核苷酸序列的特定成对组合。条形码寡核苷酸B1和B4及通用接 头的相对定位有利地允许通过短序列读段和自动DNA测序仪(例如,Illumina HiSeq? 或 Illumina MiSEQ'或GeneAnalyzer?-2,加利福尼亚州圣地亚哥的亿明达公司 (Illumina Corp.,San Diego, CA))上的末端配对测序进行给定独特模板寡核苷酸的扩增 产物的快速鉴定和定量。具体地讲,这些和相关实施例允许存在于扩增产物中的V和J序 列的特异性组合的快速高通量测定,从而表征可存在于引物组中的每种V特异性引物和每 种J特异性引物的相对扩增效率,所述引物组能够扩增样品中的重排TCR或BCR编码DNA。 可通过较长的序列读段(任选包括延伸至B2的序列读段)实现扩增产物的种类和/或数 量的验证。
[0073] 在使用中,所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存 在,其在某些优选实施例中包括制备物,其中所有寡核苷酸的摩尔浓度彼此相差1、2、3、4、 5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24 或 25% 以内。在如本文所 提供的某些其他优选实施例中,当所有寡核苷酸的摩尔浓度彼此在一个数量级内时,模板 寡核苷酸被认为以基本上等摩尔量存在,其包括制备物,其中任何给定的独特模板寡核苷 酸物质可具有的最大摩尔浓度大于组合物中具有最低浓度的独特模板寡核苷酸物质所存 在的摩尔浓度不超过 1000、900、800、700、600、500、440、400、350、300、250、200、150、100、 90、80、70、60、50、40 或 30%。
[0074] 以类似的方式,本文所公开的某些实施例设想了用于扩增的寡核苷酸引物组,在 所述引物组中,组分引物可以基本上等摩尔量提供。也如本文所述,根据某些其他实施例, 可有意调节引物组中的一种或多种引物的浓度以便某些引物不以等摩尔量存在或不以基 本上等摩尔量存在。
[0075] 在优选实施例中本文所述的模板组合物可用作核酸扩增(例如,PCR)模板 以表征寡核苷酸引物组,如复杂的可用于重排TCR或Ig基因的多重扩增的V区段和 J区段寡核苷酸引物组,例如,如本文所提供的引物组,或如下文献中所述的任何引物 组:1?〇1^118 6七31.,200981〇〇(1 114,4099(1?〇1^118等人,2009 年,《血液》,第114卷, 第 4099 页);Robinsetal.,2010Sci.Translat.Med.2:47ra64(Robins等人,2010 年,《科学转化医学》,第 2 卷,第 47ra64 页);Robinsetal.,2011J.Immunol.Meth. doi:10. 1016/j.jim.2011.09.001(Robins等人,2011 年,《免疫法杂志》,doi:10. 1016/ j.jim. 2011. 09. 001);Sherwoodetal.2011Sci.Translat.Med. 3:90ra61(Sherwood等 人,2011年,《科学转化医学》,第3卷,第90ra61页);U.S.A.N. 13/217, 126(美国公布 No. 2012/0058902)、U.S.A.N. 12/794, 507 (美国公布No. 2010/0330571)、W0/2010/151416、 W0/2011/106738 (PCT/US2011/026373)、W02012/027503 (PCT/US2011/049012)、 U.S.A.N. 61/550, 311 和U.S.A.N. 61/569, 118 ;等等。
[0076] 优选地,用于使扩增效率标准化的模板组合物中的所有模板均为基本上相同长度 的寡核苷酸,所述模板组合物在本文有所描述并且包含具有多样性序列和通式(I)通用结 构的多种模板寡核苷酸。不希望受理论的束缚,一般认为在核酸扩增反应如聚合酶链式反 应(PCR)中,模板DNA长度可通过影响引物与模板DNA分子之间的相互作用的动力学来影 响寡核苷酸引物的扩增效率,引物可通过核苷酸碱基互补性经特异性核苷酸序列引导的杂 交而退火至模板DNA分子。一般认为较长模板的操作效率低于相对较短的模板。在某些 实施例中,本发明所公开的用于使寡核苷酸引物组的扩增效率标准化的模板组合物包含多 种如本文所提供的由通式(I)表示的模板寡核苷酸,所述寡核苷酸引物组能够扩增编码多 种TCR或BCR的重排DNA,其中所述模板寡核苷酸具有长度不超过1000、950、900、850、800、 750、700、650、600、550、500、450、400、350、300、250、200、150 或 100 个核苷酸(包括其间的 所有整数值)的相同长度或基本上相同长度。
[0077] 因此,为了使对多重扩增期间寡核苷酸引物利用的非期望偏倚的潜在贡献降低、 消除或最小化,本文公开的优选实施例可采用多种模板寡核苷酸,其中具有序列多样性的 多种模板寡核苷酸中的所有模板寡核苷酸具有基本上相同长度。当模板组合物中的所有 (例如,100%)或大多数(例如,大于50%)此类寡核苷酸为各自具有完全相同数量的核苷 酸的寡核苷酸,或其中模板组合物中的一种或多种模板寡核苷酸彼此长度差异不超过1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90 或 100 个核苷酸的情况下,多种模板寡核苷酸可具有基本上相同长度。根据本公开可以理解,即使 在并非所有模板寡核苷酸具有完全相同长度的情况下,本文所述的组合物和方法仍然可用 于测定以及任选用于修正一组寡核苷酸扩增引物各成员间的非均一核酸扩增潜能。
[0078] 根据某些本发明所公开的实施例,(i)本发明所述的模板组合物的每种模板寡核 苷酸以基本上等摩尔量提供,(ii)能够扩增编码多种适应性免疫受体的重排DNA的寡核苷 酸引物组包含以基本上等摩尔量提供的多种V区段寡核苷酸引物,(iii)能够扩增编码多 种适应性免疫受体的重排DNA的寡核苷酸引物组包含以基本上等摩尔量提供的多种J区段 寡核苷酸引物,以及(iv)扩增随给定序列的起始模板的数量呈线性变化。
[0079] 因此,可计算每种模板的扩增产物的预期产率并任意赋给100%的理论均一扩增 水平值。在允许引物组在扩增反应中扩增模板寡核苷酸的序列之后,在不同扩增产物的相 对比例间观察到的与基本等同的任何统计学显著偏差指示扩增期间存在引物利用的偏倚 (即,不同效率)。换句话讲,所获得的不同扩增产物的相对量的定量差异指示并非引物组 中的所有引物都以相当的效率扩增其各自的模板。某些实施例设想赋给高于和低于理论 100%产率的容差范围,使得容差范围内的任何扩增水平值均可视为基本等同。
[0080] 在某些此类实施例中,当产物产率全部处于相同数量级内(如,相差小于十倍) 时,扩增产物产率的范围可视为基本上等同。在某些其他此类实施例中,当产物产率彼此相 差不超过九倍、八倍、七倍、六倍、五倍、四倍或三倍时,扩增产物产率的范围可视为基本上 等同。在某些其他实施例中,可视为处于可接受容差范围内的产物产率可比所计算的100 % 产率多或少多达 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、 100 或 200%。
[0081] 因为所述方法涉及使用已知技术测定每种扩增产物的核苷酸序列作为定量过程 的一部分,因此可以鉴定负责扩增每种独特(如由序列所定义)产物的引物并且可相应调 节(如,以统计学显著的方式增加或减少)其在引物组中的相对量。可相对于其他引物的浓 度减少引物组中极其高效的引物的浓度,使得此类引物对本文所述模板组合物中的模板的 特异性扩增的水平基本上等同于大多数引物所实现的扩增水平,所述大多数引物实现理论 均一扩增水平,或实现处于可接受容差范围内的水平。可相对于其他引物的浓度增加引物 组中低效的引物的浓度,使得此类引物对本文所述模板组合物中的模板的特异性扩增的水 平基本上等同于大多数引物所实现的扩增水平,所述大多数引物实现理论均一扩增水平, 或实现处于可接受容差范围内的水平。
[0082] 因此及如本文所述,本发明从而提供了用于使被设计为扩增给定TCR或Ig链的完 整组库的编码序列的寡核苷酸引物组的扩增效率标准化的模板组合物,用于测定此类引物 组的成员间的非均一扩增效率("非均一扩增潜能")的方法,以及用于修正此类非均一扩增 潜能的方法。通过提供本文所述的模板组合物作为可用来校准寡核苷酸引物组的标准品, 并且在特定实施例中,在每种模板寡核苷酸以基本上等摩尔量存在使得可调节单独的引物 浓度以产生结构多样的一系列扩增产物的基本上均一的扩增的情况下,本公开从而有利地 克服了上述与单独引物效率偏倚相关的问题。
[0083] 使用本文提供的组合物和方法,可将单独的引物鉴定为具有非均一扩增潜能,原 因在于其促进非均一扩增,如相对于均一扩增水平而言特异性模板寡核苷酸的增加(如, 以统计学显著的方式更大)或减少(如,以统计学显著的方式更低)扩增所证实的那样,尽 管扩增反应中存在(i)彼此基本上等摩尔量的所有模板寡核苷酸、(ii)彼此基本上等摩尔 量的所有V区段引物、以及(iii)彼此基本上等摩尔量的所有J区段引物。
[0084] 然后可减少或增加此类引物的相对浓度以获得改良的完整引物组,其中所有引物 不以相对于彼此基本上等摩尔量存在,以分别补偿相对于均一扩增水平增加或减少的扩增 水平。然后可重新测试引物组其以均一扩增水平或在可接受容差范围内扩增本文所公开的 模板组合物中的所有序列的能力。
[0085] 可迭代地重复测试改良的引物组其扩增本文所公开的模板组合物的能力的过程 直到所有产物均以均一扩增水平或在可接受容差范围内扩增为止,其中所有模板寡核苷酸 均以彼此基本上等摩尔量提供。通过使用本文所公开的模板组合物的此类过程,可使寡核 苷酸引物组的扩增效率标准化,其中所述引物组能够扩增生物样品中编码一种或多种适应 性免疫受体的有效重排DNA,所述生物样品包含来自受试者淋巴样细胞的DNA。
[0086] 此外或作为另外一种选择,根据本公开,可测定任何特定对的寡核苷酸扩增引物 是否呈现非均一扩增潜能,如相对于大多数寡核苷酸扩增引物呈现的均一扩增水平所增加 或减少的模板组合物扩增,然后可使用归一化调节因子分别计算每种此类扩增引物对所促 进的扩增产物的成比例减少或增加的出现频率。本发明模板组合物从而在某些实施例中提 供修正一组寡核苷酸扩增引物的成员间的非均一核酸扩增潜能的方法。
[0087] 某些此类实施例可有利地允许对作为非均一扩增事件的结果所获得的数据进行 修正、校准、标准化、归一化等。从而,本发明实施例允许对数据不准确性(如可由偏倚的寡 核苷酸引物利用所引起)进行修正,而无需迭代地调节一种或多种扩增引物的浓度以及重 复扩增本文所述的模板组合物的步骤。在可避免对扩增产物定量测序的步骤的重复的情况 下,可从而获得有利的效率。然而,某些其他设想的实施例可采用此类迭代方法。
[0088]因此及如本文所述,本发明提供了用于使寡核苷酸引物组的扩增效率标准化的模 板组合物,以及使用此类模板组合物测定寡核苷酸引物组的单独成员间的非均一核酸扩增 潜能(如,偏倚)的方法。本文还描述了用于修正寡核苷酸引物组的各成员间的此类非均 一核酸扩增潜能(如,偏倚)的方法。这些和相关实施例利用通过校准复杂寡核苷酸引物 组所获得的之前未认识到的有益效果以使用具有本文所述特征的用于使扩增效率标准化 的模板组合物补偿不期望的扩增偏倚,并且相对于之前所述的方法,可用于提高特异性克 隆型TCR和/或Ig编码DNA序列可定量的准确性。
[0089] 另外如上文指出及本文其他地方所述,在本公开之前,存在如下两者之间不令人 满意且难以分辨的差异:(i)在含有来自受试者的淋巴样细胞DNA的生物样品中,具有独特 序列的重排适应性免疫受体编码DNA模板的实际定量分布,以及(ii)在使用被设计用于扩 增样品中的基本上所有有效重排适应性免疫受体基因的一组复杂的寡核苷酸扩增引物进 行多重扩增后,此类模板的核酸扩增产物的相对占比。由于例如模板群体和扩增引物组两 者的异质性,并且如本文所示,不同扩增引物的扩增效率的显著差异可为常见的,从而导致 扩增反应后所获得和定量测序的扩增产物的相对比例呈明显偏态。
[0090]樽板和引物
[0091] 根据某些优选实施例,从而提供了用于使寡核苷酸引物组的扩增效率标准化的模 板组合物,所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重 排DNA (其在某些实施例中可以指有效重排DNA,但在某些其他实施例中不必如此限制),所 述生物样品包含来自受试者的淋巴样细胞的DNA,所述模板组合物包含多种由通式(I)表 示的模板寡核苷酸:
[0092] 5,-U1-B1-V-B2-R-B3-J-B4-U2-3, (I)
[0093] 如本文所提供的。在某些优选实施例中,所述多种模板寡核苷酸中的每种模板寡 核苷酸以基本上等摩尔量存在,其在某些实施例中及如上文所指出,可以指模板寡核苷酸 中的每一者均以等摩尔浓度存在或以摩尔浓度计与等摩尔偏差不超过1、2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90、100 或 200 % 的摩尔浓度存在的组合物,并且在某些其他实施例中,可以指所有模板寡核苷酸均以彼此 处于一个数量级内的摩尔浓度存在的组合物。所述多种模板可包含至少100、200、300、400、 500、600、700、800、900、1000、1100或更多种分立的寡核苷酸物质(每一者均具有不同的核 苷酸序列),包括其间的每个中间整数值。
[0094] 本文所公开的模板组合物从而包含多种由如下通式表示的模板寡核苷酸:
[0095] 5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I]
[0096] 其中,简而言之及如本文其他地方更详细阐述,根据某些优选实施例:
[0097] V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20、30、 60、90、120、150、180或210个且不超过1000、900、800、700、600或500个连续核苷酸的多核 苷酸,并且在所述多种模板寡核苷酸序列的每一者中,V包含独特的寡核苷酸序列;
[0098] J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15-30、 31-60、61-90、91-120或120-150个且不超过600、500、400、300或200个连续核苷酸的多核 苷酸,并且在所述多种模板寡核苷酸序列的每一者中,J包含独特的寡核苷酸序列;
[0099] U1和U2要么各自不存在,要么各自包含独立地具有选自如下的序列的寡核苷酸 : (i)通用接头寡核苷酸序列和(ii)连接至通用接头寡核苷酸序列并位于其5'端的测序平 台特异性寡核苷酸序列;
[0100] B1、B2、B3和B4各自独立地要么不存在,要么各自包含寡核苷酸B,寡核苷酸B包 含 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、 90、100、200、300、400、500、600、700、800、900或1000个连续核苷酸(包括其间的所有整数 值)的寡核苷酸条形码序列,其中在所述多种模板寡核苷酸序列的每一者中,B包含一独特 的寡核苷酸序列,所述独特的寡核苷酸序列独特地识别(i)模板寡核苷酸的独特V寡核苷 酸序列和(ii)模板寡核苷酸的独特J寡核苷酸序列,或者识别作为成对组合的这二者;并 且
[0101] R要么不存在,要么包含一限制性酶识别位点,所述限制性酶识别位点包含不存在 于V、J、Ul、U2、Bl、B2、B3和B4中的寡核苷酸序列。
[0102] 在一些实施例中,模板寡核苷酸组合物包含另外的非编码寡核苷酸或随机寡核苷 酸。这些寡核苷酸可插入在通式I(5'-U1-B1-V-B2-R-B3-J-B4-U2_3')中的组分之间或之 内的各个部分中,并且具有各种长度的大小。
[0103] 在一个实施例中,a为1至受试者的哺乳动物基因组中V基因区段的最大数量的 数。在另一个实施例中,b为1至受试者的哺乳动物基因组中J基因区段的最大数量的数。 在其他实施例中,a为1或者b为1。在一些实施例中,a可在对于TCRA而言的1个V基 因区段至54个V基因区段的范围内,对于TCRB而言的1-76个V基因区段的范围内,对于 TCRG而言的1-15个V基因区段的范围内,对于TCRD而言的1-7个V基因区段的范围内, 对于IGH而言的1-165个V基因区段的范围内,对于IGK而言的1-111个的范围内,或对于 IGL而言的1-79个V基因区段的范围内。在其他实施例中,b可在对于TCRA而言的1个J 个基因区段至61个J基因区段的范围内,对于TCRB而言的1-14个J基因区段的范围内, 对于TCRG而言的1-5个J基因区段的范围内,对于TCRD而言的1-4个基因区段的范围内, 对于IGH而言的1-9个J基因区段的范围内,对于IGK而言的1-5个J基因区段的范围内, 或对于IGL而言的1-11个J基因区段的范围内。
[0104] 下表列出了每个人适应性免疫受体基因座的V基因区段(a)和J基因区段(b)的 数量,包括功能性V和J区段。
[0105]
【权利要求】
1. 一种用于使寡核苷酸引物组的扩增效率标准化的组合物,所述寡核苷酸引物组能 够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来 自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应性免疫受体包含可变区和连接 区,所述组合物包含: 多种模板寡核苷酸,其具有多种由如下通式表示的寡核苷酸序列: 5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I] 其中: (a) V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不 超过1000个连续核苷酸的多核苷酸,并且每种V多核苷酸包含独特的寡核苷酸序列; (b) J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不 超过600个连续核苷酸的多核苷酸,并且每种J多核苷酸包含独特的寡核苷酸序列; (c) Ul要么不存在,要么包含选自如下的寡核苷酸序列:(i)第一通用接头寡核苷酸序 列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷 酸序列; (d) U2要么不存在,要么包含选自如下的寡核苷酸序列:(i)第二通用接头寡核苷酸序 列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷 酸序列; (e) Bl、B2、B3和M各自独立地要么不存在,要么各自包含具有3-25个连续核苷酸的 条形码序列的寡核苷酸B,其中BI、B2、B3和M各包含一寡核苷酸序列,所述寡核苷酸序列 独特地识别作为成对组合的(i) (a)的独特V寡核苷酸序列和(ii) (b)的独特J寡核苷酸 序列; (f) R要么不存在,要么包含具有不存在于(a)-(e)中的寡核苷酸序列的限制性酶识别 位点, 并且其中: (g) 所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列,以较大者为 准,其中a是所述受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述 受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种 针对每种独特V多核苷酸的模板寡核苷酸和至少一种针对每种独特J多核苷酸的模板寡核 苷酸。
2. 根据权利要求1所述的组合物,其中a的范围为1至所述受试者的哺乳动物基因组 中V基因区段的最大数量的数。
3. 根据权利要求1或2中任一项所述的组合物,其中b的范围为1至所述受试者的哺 乳动物基因组中J基因区段的最大数量的数。
4. 根据权利要求1-3中任一项所述的组合物,其中a为1或b为1。
5. 根据权利要求1所述的组合物,其中所述多种模板寡核苷酸包含至少(aXb)种独 特的寡核苷酸序列,其中a是所述哺乳动物受试者中的独特适应性免疫受体V区编码基因 区段的数量并且b是所述哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数 量,并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能 组合的模板寡核苷酸。
6. 根据权利要求1-5中任一项所述的组合物,其中J包含所述适应性免疫受体J区编 码基因序列的恒定区。
7. 根据权利要求1-6中任一项所述的组合物,其中所述适应性免疫受体选自TCRB、 TCRG、TCRA、TCRD、IGH、IGK 和 IGL。
8. 根据权利要求1-7中任一项所述的组合物,其中所述(a)的V多核苷酸编码TCRB、 TCRG、TCRA、TCRD、IGH、IGK 或 IGL 受体 V 区多肽。
9. 根据权利要求1-8中任一项所述的组合物,其中所述(b)的J多核苷酸编码TCRB、 TCRG、TCRA、TCRD、IGH、IGK 或 IGL 受体 J 区多肽。
10. 根据权利要求1-9中任一项所述的组合物,还包含V与B2之间的终止密码子。
11. 根据权利要求1-10中任一项所述的组合物,其中所述多种模板寡核苷酸中的每种 模板寡核苷酸以基本上等摩尔量存在。
12. 根据权利要求1-11中任一项所述的组合物,其中所述多种模板寡核苷酸具有选自 如下的多种由通式(I)表示的序列: (1) 所述多种由通式(I)表示的寡核苷酸序列,其中所述V和J多核苷酸具有在图 5a-51 中作为 TCRB V/J 组 1、TCRB V/J 组 2、TCRB V/J 组 3、TCRB V/J 组 4、TCRB V/J 组 5、 TCRB V/J 组 6、TCRB V/J 组 7、TCRB V/J 组 8、TCRB V/J 组 9、TCRB V/J 组 10、TCRB V/J 组 11、TCRB V/J组12和TCRB V/J组13的68组TCRB V和J SEQ ID NO中的至少一组中示 出的TCRB V和J序列; (2) 所述多种由通式(I)表示的寡核苷酸序列,其中所述V和J多核苷酸具有在图6a 和 6b 中作为 TCRG V/J 组 1、TCRG V/J 组 2、TCRG V/J 组 3、TCRG V/J 组 4 和 TCRG V/J 组 5 的14组TCRG V和J SEQ ID NO中的至少一组中示出的TCRG V和J序列; (3) 所述多种由通式(I)表示的寡核苷酸序列,其中所述V和J多核苷酸具有在图 7a-7m 中作为 IGH V/J 组 1、IGH V/J 组 2、IGH V/J 组 3、IGH V/J 组 4、IGH V/J 组 5、IGH V/J 组 6、IGH V/J 组 7、IGH V/J 组 8 和 IGH V/J 组 9 的 127 组 IGH V 和 J SEQ ID NO 中的 至少一组中示出的IGH V和J序列; (4) 如SEQ ID N0:3157-4014中所示的所述多种由通式(I)表示的寡核苷酸序列; (5) 如SEQ ID N0:4015-4084中所示的所述多种由通式(I)表示的寡核苷酸序列; (6) 如SEQ ID N0:4085-5200中所示的所述多种由通式(I)表示的寡核苷酸序列; (7) 如SEQ ID N0:5579-5821中所示的所述多种由通式(I)表示的寡核苷酸序列; (8) 如SEQ ID N0:5822-6066中所示的所述多种由通式(I)表示的寡核苷酸序列;以 及 (9) 如SEQ ID N0:6067-6191中所示的所述多种由通式⑴表示的寡核苷酸序列。
13. 根据权利要求1-12中任一项所述的组合物,其中V是包含所述适应性免疫受体V 区编码基因序列或其互补序列的至少30、60、90、120、150、180或210个连续核苷酸的多核 苷酸。
14. 根据权利要求1-13中任一项所述的组合物,其中V是包含适应性免疫受体V区编 码基因序列或其互补序列的不超过900、800、700、600或500个连续核苷酸的多核苷酸。
15. 根据权利要求1-14中任一项所述的组合物,其中J是包含适应性免疫受体J区编 码基因序列或其互补序列的至少16-30、31-60、61-90、91-120或120-150个连续核苷酸的 多核苷酸。
16. 根据权利要求1-15中任一项所述的组合物,其中J是包含适应性免疫受体J区编 码基因序列或其互补序列的不超过500、400、300或200个连续核苷酸的多核苷酸。
17. 根据权利要求1-16中任一项所述的组合物,其中每种模板寡核苷酸的长度小于 1000、900、800、700、600、500、400、300 或 200 个核苷酸。
18. 根据权利要求1-17中任一项所述的组合物,还包含:能够扩增编码一种或多种适 应性免疫受体的重排核酸分子的一组寡核苷酸引物,所述寡核苷酸引物组包含复数a'种 独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。
19. 根据权利要求18所述的组合物,其中a'的范围为1至所述哺乳动物基因组中V基 因区段的最大数量的数,并且b'的范围为1至所述哺乳动物基因组中J基因区段的最大数 量的数。
20. 根据权利要求19所述的组合物,其中a'为a。
21. 根据权利要求19所述的组合物,其中b'为b。
22. 根据权利要求18-21中任一项所述的组合物,其中所述寡核苷酸引物组中的每种 V区段寡核苷酸引物和每种J区段寡核苷酸引物能够特异性杂交至所述多种模板寡核苷酸 中的至少一种模板寡核苷酸。
23. 根据权利要求18-22中任一项所述的组合物,其中每种V区段寡核苷酸引物包含与 至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。
24. 根据权利要求18-23中任一项所述的组合物,其中每种J区段寡核苷酸引物包含与 至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。
25. 根据权利要求18-24中任一项所述的组合物,其中所述组合物包含至少一种具有 每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核 苷酸,以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的 寡核苷酸序列的模板寡核苷酸。
26. -种用于测定一组寡核苷酸引物的成员中的非均一核酸扩增潜能的方法,所述一 组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所 述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,所述方法包括: (a) 在多重PCR反应中扩增根据权利要求18-25中任一项所述的组合物,以获得多种扩 增的模板寡核苷酸; (b) 对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡 核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;以及 (c) 将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较,其中所述预期分 布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷 酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员 间的非均一核酸扩增潜能。
27. 根据权利要求26所述的方法,其中所述预定摩尔比是等摩尔。
28. 根据权利要求27所述的方法,其中所述预期分布包括由所述寡核苷酸引物组扩增 的所述模板寡核苷酸组的均一扩增水平。
29. 根据权利要求26所述的方法,其中每种扩增的模板核酸分子的长度小于1000、 900、800、700、600、500、400、300、200、100、90、80 或 70 个核苷酸。
30. 根据权利要求26-29中任一项所述的方法,还包括:对于相对于所述预期分布呈现 非均一扩增潜能的所述寡核苷酸引物组的每个成员,调节所述寡核苷酸扩增引物组中的所 述寡核苷酸引物成员的相对占比。
31. 根据权利要求30所述的方法,其中调节包括增加所述寡核苷酸引物组中的所述成 员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
32. 根据权利要求30所述的方法,其中调节包括降低所述寡核苷酸引物组中的所述成 员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
33. 根据权利要求26-32中任一项所述的方法,其中所述寡核苷酸引物组不包括特异 性杂交至V区假基因或孤独基因或者杂交至J区假基因或孤独基因的寡核苷酸引物。
34. 根据权利要求26-33中任一项所述的方法,还包括:对于相对于所述预期分布呈现 非均一扩增潜能的所述寡核苷酸扩增引物组的每个成员,计算由所述成员促进其扩增的所 述扩增的模板核酸分子的成比例增加或减小的出现频率,从而修正所述寡核苷酸引物组的 成员间的非均一核酸扩增潜能。
35. -种用于定量生物样品中的编码一种或多种适应性免疫受体的多种重排核酸分子 的方法,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应 性免疫受体包含可变(V)区和连接(J)区,所述方法包括: (A)在多重聚合酶链式反应(PCR)中扩增重排核酸分子,所述反应包含: (1) 来自所述生物样品的重排核酸分子,所述生物样品包含所述哺乳动物受试者的淋 巴样细胞, (2) 如权利要求1-17中任一项所述的组合物,其中存在已知数量的所述多种具有独特 寡核苷酸序列的模板寡核苷酸中的每一种, (3) 寡核苷酸扩增引物组,所述寡核苷酸扩增引物组能够扩增来自所述生物样品的编 码一种或多种适应性免疫受体的重排核酸分子,所述引物组包含: (a) 基本上等摩尔量的多种V区段寡核苷酸引物,所述引物各自独立地能够特异性杂 交至编码适应性免疫受体V区多肽的至少一种多核苷酸或特异性杂交至其互补序列,其中 每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15 个连续核苷酸的核苷酸序列,并且其中所述多种V区段引物特异性杂交至所述组合物中存 在的基本上所有功能性适应性免疫受体V区编码基因区段,以及 (b) 基本上等摩尔量的多种J区段寡核苷酸引物,所述引物各自独立地能够特异性杂 交至编码适应性免疫受体J区多肽的至少一种多核苷酸或特异性杂交至其互补序列,其中 每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15 个连续核苷酸的核苷酸序列,并且其中所述多种J区段引物特异性杂交至所述组合物中存 在的基本上所有功能性适应性免疫受体J区编码基因区段, 其中所述V区段和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促 进:(i)所述组合物中的基本上所有模板寡核苷酸的扩增,以产生大量的扩增模板寡核苷 酸,所述大量的扩增模板核酸分子足以定量所述组合物中的所述模板寡核苷酸的多样性, 以及(ii)所述生物样品中的基本上所有编码适应性免疫受体的重排核酸分子的扩增,以 产生大量的扩增重排DNA分子,所述大量的扩增重排核酸分子足以定量来自所述生物样品 的所述DNA中的所述重排核酸分子的多样性, 并且其中所述多种扩增模板寡核苷酸中和所述多种扩增重排核酸分子中的每种扩增 核酸分子的长度小于1000个核苷酸; (B) 对所述扩增模板寡核苷酸和所述扩增重排核酸分子进行定量测序以定量(i)含有 至少一种寡核苷酸条形码序列的扩增模板寡核苷酸的模板产物数量,以及(ii)缺少寡核 苷酸条形码序列的扩增重排核酸分子的重排产物数量; (C) 将(B) (i)的所述模板产物数量除以(A) (2)的所述多种具有独特寡核苷酸序列的 模板寡核苷酸中的每一种的已知数量,来计算扩增系数;以及 (D) 将⑶(ii)的所述重排产物数量除以(C)中计算的所述扩增系数以定量所述样品 中的独特适应性免疫受体编码重排核酸分子的数量。
36. 根据权利要求35所述的方法,其中所述样品中的独特适应性免疫受体编码重排核 酸分子的所述定量数量是所述样品中的独特B细胞或独特T细胞基因组模板的数量。
37. -种用于计算多重PCR测定中的平均扩增系数的方法,包括: 获得生物样品,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分 子; 将所述样品与已知量的构成如权利要求18-25中任一项所述的组合物的模板寡核苷 酸接触; 在多重PCR反应中扩增所述模板寡核苷酸和来自所述哺乳动物受试者的淋巴样细胞 的所述重排核酸分子,以获得多种扩增的模板寡核苷酸和多种扩增的重排核酸分子; 对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷 酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;以及 基于所述多种扩增的模板寡核苷酸的平均拷贝数和所述模板寡核苷酸的所述已知量, 测定所述多重PCR反应的所述平均扩增系数。
38. 根据权利要求37所述的方法,还包括: 对来自所述哺乳动物受试者的淋巴样细胞的所述多种扩增的重排核酸分子进行测序, 以对构成所述多种的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核 酸分子序列的出现次数;以及 基于所述多重PCR反应的所述平均扩增系数和所述重排核酸分子的所述出现次数,测 定所述样品中的淋巴样细胞的数量。
39. 根据权利要求38所述的方法,其中测定所述样品中的淋巴样细胞的数量包括生成 每种所述扩增重排核酸序列的所述出现次数的总和并将所述总和除以所述平均扩增系数。
40. 根据权利要求37所述的方法,其中所述已知量是每种所述模板寡核苷酸一个拷 贝。
41. 根据权利要求40所述的方法,其中100 < a < 500。
42. 根据权利要求40所述的方法,其中100 < b < 500。
43. -种用于修正多重PCR扩增反应中的扩增偏倚以定量生物样品中编码一种或多种 适应性免疫受体的重排核酸分子的方法,所述生物样品包含来自哺乳动物受试者的淋巴样 细胞的重排核酸分子,所述方法包括: (a)将所述样品与根据权利要求18-25中任一项所述的组合物接触,以生成模板加标 样品,其中所述模板和所述重排核酸分子包含对应的V和J区序列; (b) 在多重PCR反应中扩增所述模板加标样品,以获得多种扩增的模板寡核苷酸和多 种扩增的编码多种适应性免疫受体的重排核酸分子; (c) 对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡 核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率; (d) 对编码一种或多种适应性免疫受体的所述多种扩增重排核酸分子进行测序,以对 构成所述多种的编码所述多种适应性免疫受体的每种独特重排核酸分子测定i)重排核酸 分子序列和(ii)所述重排核酸分子序列的出现频率; (e) 将所述模板寡核苷酸序列的所述出现频率与预期分布进行比较,其中所述预期分 布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷 酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员 间的非均一核酸扩增潜能; (f) 生成由具有所述指示的非均一核酸扩增潜能的所述寡核苷酸扩增引物组的所述成 员扩增的一组模板分子和重排核酸分子序列的一组修正值,其中所述一组修正值修正所述 多重PCR反应中的扩增偏倚;以及 (g) 任选地将所述一组修正值应用于所述重排核酸分子序列的所述出现频率以修正所 述多重PCR反应中的扩增偏倚。
44. 一种试剂盒,包括: 试剂,所述试剂包含:如权利要求18-25中任一项所述的包含多种模板寡核苷酸和一 组寡核苷酸引物的组合物; 测定所述寡核苷酸引物组的成员间的非均一核酸扩增潜能的操作指南,所述寡核苷酸 引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样 品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。
45. 根据权利要求44所述的试剂盒,还包括修正具有非均一核酸扩增潜能的所述寡核 苷酸引物组的一个或多个成员的操作指南。
46. 根据权利要求44所述的试剂盒,还包括定量所述样品中独特适应性免疫受体编码 重排核酸分子的数量的操作指南。
【文档编号】C12Q1/68GK104520440SQ201380022986
【公开日】2015年4月15日 申请日期:2013年5月8日 优先权日:2012年5月8日
【发明者】H·S·罗宾斯, C·S·卡尔森, R·J·利文斯顿, R·O·埃默森, A·谢伍德 申请人:适应生物技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1