用于固定化的修饰型生物素结合蛋白的制作方法

文档序号:22557080发布日期:2020-10-17 02:41阅读:233来源:国知局
相关申请的交叉引用本申请是要求satwikkamtekar等于2017年12月22日提交题为“用于固定化的修饰型生物素结合蛋白(modifiedbiotin-bindingproteinsforimmobilization)”的美国临时专利申请ussn62/609,680的优先权以及权益的美国非临时实用专利申请,上述美国临时专利申请通过引用纳入本文用于所有目的。联邦资助的研究与开发下作出发明的权利声明无。
背景技术
::分子生物学和分子医学中的技术通常依赖于单生物分子的分析。这类技术包括dna和rna测序,多态性检测,感兴趣蛋白质的检测,蛋白质-核酸复合物的检测等。单分子分析中涉及的高灵敏度、高通量和低试剂成本使得这种类型的分析成为一种越来越有吸引力的方法,用于分子医学中的多种检测以及分析问题,从低成本基因组学到高灵敏度标志物分析。用于单分子分析的许多技术都依赖于将感兴趣的分子或复合物固定在固体支持物上,通常在光学限制反应/观察区域如零模波导内。给定分子的固定必须牢固,因为解离意味着分子会丢失,无法进一步分析。生物分子的固定通常通过捕获来完成,所述捕获通过诸如生物素的部分进行。生物素是一种辅因子,其共价连接于活化羧基的转移中所涉及的几种酶。生物素标记通常未被生物素化的分子可以用于标记、检测、纯化和/或固定这类分子。这些方法还依赖于蛋白质,诸如亲和素或链霉亲和素,其非常紧密且特异性地结合生物素。然而,因为单分子分析依赖于(多个)个体分子而非这类分子群体的牢固固定,因此这带来了在批量样品的分析中未曾遇见的挑战。因此,需要用于固定(多个)单分子和复合物的改进方法。通过阅读下述内容将显而易见的是,本文所述发明满足了这些需求和其他需求。发明概述一个一般类别的实施方式提供了包含经修饰的生物素结合蛋白的组合物,所述经修饰的生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分(sulfonatemoiety),例如,三个或更多个,12个或更多个,24个或更多个,30个或更多个,45个或更多个或60个或更多个共价连接的磺酸盐/酯部分例如,生物素结合蛋白可以包含一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基,3,5-二磺基苯甲酰基,2-磺基苯甲酰基和/或聚乙二醇(peg)部分,例如,四个或更多个,10个或更多个,15个或更多个,20个或更多个或45个或更多个。在一些实施方式中,生物素结合蛋白是四价生物素结合蛋白,例如,链霉亲和素。在一个示例性类别的实施方式中,生物素结合蛋白是四价生物素结合蛋白(例如,链霉亲和素),其包含15个或更多个共价连接的3,4,5-三(3-磺丙氧基)苯甲酰基部分。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,所述氨基酸取代降低所述生物素结合蛋白相对于亲本(parental)生物素结合蛋白的计算净电荷。在一些实施方式中,生物素结合蛋白在ph7.4的计算净电荷为-20或更低。任选地,生物素结合蛋白与核酸聚合酶结合,例如,与核酸复合的核酸聚合酶。在一些实施方式中,生物素结合蛋白固定于固体支持物上。在一些实施方式中,生物素结合蛋白固定于纳米级孔(nanoscalewell)的底部上。任选地,组合物存在于核酸测序系统中。一个一般类别的实施方式提供了产生经修饰的生物素结合蛋白的方法,所述方法包括提供亲本生物素结合蛋白和共价修饰亲本生物素结合蛋白中的一个或多个氨基酸残基以产生经修饰的生物素结合蛋白,所述经修饰的生物素结合蛋白包含相对于亲本生物素结合蛋白降低其计算净电荷的一个或多个共价修饰。在一些实施方式中,经修饰的生物素结合蛋白在ph7.4的计算净电荷为-20或更低。共价修饰亲本生物素结合蛋白中一个或多个氨基酸残基可以包括共价修饰亲本生物素结合蛋白中的一个或多个带正电荷的残基。例如,共价修饰亲本生物素结合蛋白中一个或多个氨基酸残基可以包括共价修饰亲本生物素结合蛋白中的一个或多个赖氨酸残基,例如,通过与3,4,5-三(3-磺基丙氧基)苯甲酸的n-羟基琥珀酰亚胺酯,4-(6-叠氮基己氧基)-3,5-双(3-磺基丙氧基)苯甲酸的n-羟基琥珀酰亚胺酯,3,5-二磺基苯甲酸的n-羟基琥珀酰亚胺酯或2-磺基苯甲酸环酐反应。在一些实施方式中,一种或多种共价修饰包括一个或多个带负电荷的基团。例如,一个或多个共价修饰可以包括一个或多个共价连接的磺酸盐/酯部分(例如,3,4,5-三(3-磺基丙氧基)苯甲酰基部分,3,5-二磺基苯甲酰基部分,或2-磺基苯甲酰基部分),羧酸基团,亚磺酸基团,磷酸盐/酯基团,次膦酸基团,或膦酸基团。在一些实施方式中,亲本和经修饰的生物素结合蛋白是四价生物素结合蛋白,例如,链霉亲和素。一个一般类别的实施方式提供了包含至少一个纳米级孔的基材(substrate),所述纳米孔中固定了生物素结合蛋白,其中生物素结合蛋白在ph7.4的计算净电荷为-20或更低,例如,-40或更低,-60或更低,或-80或更低。任选地,聚合酶核酸复合物与生物素结合蛋白相结合。在一类实施方式中,生物素结合蛋白是四价生物素结合蛋白,例如,链霉亲和素。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。例如,生物素结合蛋白可以包含一个或多个共价连接的磺酸盐/酯部分,例如,一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。在一些实施方式中,生物素结合蛋白包含聚谷氨酸盐/酯标签(polyglutamatetag)。在一些实施方式中,基材包含至少500,000个纳米级孔,多个纳米级孔包含固定的生物素结合蛋白。任选地,基材存在于核酸测序系统中。另一个一般类别的实施方式提供了包含生物素结合蛋白和核酸的复合物。生物素结合蛋白在ph7.4的计算净电荷为-20或更低,例如,-44或更低,-60或更低,或-80或更低。在一些实施方式中,核酸的长度为至少约100个核苷酸。在一些实施方式中,核酸是这样的dna,其包含长度为至少1kb的双链区域。任选地,复合物包含与核酸结合的核酸聚合酶。聚合酶可以包含双生物素标签,聚合酶通过该双生物素标签结合生物素结合蛋白。在一类实施方式中,生物素结合蛋白是四价生物素结合蛋白,例如,链霉亲和素。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。在一些实施方式中,生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。在一些实施方式中,生物素结合蛋白包含聚谷氨酸盐/酯标签。在一些实施方式中,生物素结合蛋白固定于固体支持物上。在一些实施方式中,生物素结合蛋白固定于纳米级孔的底部上。任选地,复合物存在于核酸测序系统中。另一个一般类别的实施方式提供了包含生物素结合蛋白和核酸聚合酶的复合物。生物素结合蛋白在ph7.4的计算净电荷为-20或更低,例如,-44或更低,-60或更低,或-80或更低。任选地,聚合酶包含双生物素标签,聚合酶通过该双生物素标签结合生物素结合蛋白。在一类实施方式中,生物素结合蛋白是四价生物素结合蛋白,例如,链霉亲和素。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。在一些实施方式中,生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。在一些实施方式中,生物素结合蛋白包含聚谷氨酸盐/酯标签。在一些实施方式中,生物素结合蛋白固定于固体支持物上。在一些实施方式中,生物素结合蛋白固定于纳米级孔的底部上。任选地,复合物存在于核酸测序系统中。一个一般类别的实施方式提供了固定核酸的方法,所述方法包括提供包含多个阵列区域的表面,所述阵列区域包含生物素或生物素类似物,和将所述表面暴露于包含核酸和生物素结合蛋白的复合物,从而使生物素结合蛋白结合生物素或生物素类似物,并且从而使复合物固定于阵列区域中。生物素结合蛋白在ph7.4的计算净电荷为-20或更低,例如,-44或更低,-60或更低,或-80或更低。任选地,阵列区域包含纳米级孔(nanoscalewell)或纳米孔(nanopore)。在一些实施方式中,核酸的长度为至少约100个核苷酸。在一些实施方式中,核酸是这样的dna,其包含长度为至少1kb的双链区域。任选地,复合物包含与核酸结合的核酸聚合酶。聚合酶可以包含双生物素标签,聚合酶通过该双生物素标签结合生物素结合蛋白。在一类实施方式中,生物素结合蛋白是四价生物素结合蛋白,例如,链霉亲和素。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。在一些实施方式中,生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。在一些实施方式中,生物素结合蛋白包含聚谷氨酸盐/酯标签。方法可以包括,暴露步骤后,使表面与游离生物素结合蛋白接触,例如,其在ph7.4的计算净电荷为-20或更低。在一些实施方式中,方法包括,暴露步骤后,确定核酸的核苷酸序列。另一个一般类别的实施方式提供了对核酸模板进行测序的方法,所述方法包括a)提供反应混合物,所述反应混合物包含模板、复制起始部分(replicationinitiatingmoiety)、核酸聚合酶、和一种或多种核苷酸和/或核苷酸类似物,所述复制起始部分与所述模板复合或整合于所述模板,所述核酸聚合酶能够利用所述部分(moiety)在模板依赖性聚合反应中复制所述模板的至少部分,其中所述模板、所述复制起始部分和所述聚合酶中的至少一种通过与生物素结合蛋白结合而被固定于固体支持物上,其中生物素结合蛋白在ph7.4的计算净电荷为-20或更低;b)使所述反应混合物进行聚合反应,其中所述聚合酶以模板依赖性方式复制所述模板的至少部分,从而使所述一种或多种核苷酸和/或核苷酸类似物被纳入所得核酸中;和c)鉴定将所述一种或多种核苷酸和/或核苷酸类似物纳入所得核酸的时间顺序。在一些实施方式中,聚合反应和鉴定步骤在纳米级反应区域中进行,例如,纳米级孔中。任选地,模板是dna模板。任选地,聚合酶是dna聚合酶。另一个一般类别的实施方式提供了制备核酸的方法,所述方法包括a)提供反应混合物,所述反应混合物包含:模板、复制起始部分、核酸聚合酶,和一种或多种核苷酸和/或核苷酸类似物,所述复制起始部分与所述模板复合或整合于所述模板,所述核酸聚合酶能够利用所述部分在模板依赖性聚合反应中复制所述模板的至少部分,其中所述模板、所述复制起始部分和所述聚合酶中的至少一种通过与生物素结合蛋白结合而被固定于固体支持物上,其中生物素结合蛋白在ph7.4的计算净电荷为-20或更低;和b)使所述混合物反应,从而使所述聚合酶以模板依赖性方式复制所述模板的至少部分,从而使所述一种或多种核苷酸和/或核苷酸类似物被纳入所得核酸中。在一些实施方式中,混合物在纳米级孔中反应。该方法可以包括检测核苷酸和/或核苷酸类似物中至少一种的纳入。任选地,模板是dna模板。任选地,聚合酶是dna聚合酶。一个一般类别的实施方式提供了包含重组链霉亲和素的组合物,所述重组链霉亲和素包含至少一个单体,所述单体包含这样的氨基酸序列,所述氨基酸序列与seqidno:1至少70%相同并包含选自下组的一个或多个突变:位置a2处的氨基酸取代、位置g3处的氨基酸取代、位置t15处的氨基酸取代、位置t19处的氨基酸取代、位置g21处的氨基酸取代、位置a22处的氨基酸取代、位置t29处的氨基酸取代、位置y47处的氨基酸取代、位置a50处的氨基酸取代、位置t53处的氨基酸取代、位置n92处的氨基酸取代、位置a104处的氨基酸取代、位置a106处的氨基酸取代、位置t116处的氨基酸取代和位置t118处的氨基酸取代,其中相对于seqidno:1鉴定位置。在一类实施方式中,所述至少一个单体包含选自下组的一个或多个突变:a2d取代、a2e取代、g3d取代、g3e取代、t15e取代、t15d取代、t19e取代、t19d取代、a22e取代、a22d取代、y47d取代、y47e取代、t53d取代、t53e取代、n92e取代、n92d取代、a104e取代、a104d取代、a106e取代、a106d取代、t116d取代、t116e取代、t118d取代和t118e取代,其中相对于seqidno:1鉴定位置。在一些实施方式中,至少一个单体包含选自下组的突变的组合:a)a2d、a22e、t53d、n69d、a104e和k121e;b)a2d、t15e、a22e、t53d、n69d、a87e、a89d、n92e、a104e、t116d、t118d和k121e;c)a2d、t53d和n69d;d)a22e、a104e和k121e;e)a2d、a22e、t53d、n69d、a87e、n92e、a104e、t118d和k121e;和f)a2d、t15e、a22e、t53d、n69d、a87e、a89d、n92e、a104e、t116d、t118d和k121e。在一类实施方式中,至少一个单体包含选自下组的一个或多个突变:a2k取代、t15k取代、g21k取代、t29k取代、a50k取代、n92k和t116k取代,其中相对于seqidno:1鉴定位置。在一些实施方式中,至少一个单体包含选自下组的突变的组合:a)g21k和y70k;b)a2k、r40k和a50k;c)a2k、g21k、r40k、a50k和y70k;d)a2k、g21k、r40k、a50k、y70k、r90k、n92k和t116k;和e)a2k、t15k、g21k、t29k、r40k、a50k、y70k、r90k、n92k和t116k。在一类实施方式中,所述至少一个单体包含选自下组的一个或突变:位置k67处的氨基酸取代、位置k108处的氨基酸取代,位置k119处的氨基酸取代和位置k121处的氨基酸取代。在一些实施方式中,所述至少一个单体包含选自下组的一个或多个突变:k67r取代、k108r取代、k119r取代和k121r取代。在一些实施方式中,至少一个单体包含与seqidno:1至少80%相同的氨基酸序列,例如,与seqidno:1至少90%相同。任选地,重组链霉亲和素包含氨基酸序列相同的四个单体。在一些实施方式中,至少一个单体在单体的c末端和/或n末端区域处包含一个或多个外源性特征,例如,聚谷氨酸标签、聚天冬氨酸标签或聚赖氨酸标签。在一些实施方式中,重组链霉亲和素包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本链霉亲和素,所述共价修饰降低所述重组链霉亲和素的计算净电荷。任选地,重组链霉亲和素与核酸聚合酶结合,例如,与核酸复合的核酸聚合酶。在一些实施方式中,重组链霉亲和素固定于固体支持物上。组合物可以存在于核酸测序系统中,例如,包含纳米级孔的测序系统。任选地,重组链霉亲和素固定于纳米级孔的表面上。在一些实施方式中,重组链霉亲和素对生物素的kd不超过亲本链霉亲和素对生物素的kd的10倍,所述亲本链霉亲和素的四个单体包含seqidno:1。一类实施方式提供了用于对核酸进行测序的系统,所述系统包括:芯片,所述芯片包括与其结合的多个聚合酶复合物,各聚合酶复合物各自是可光学解析的(opticallyresolvable),各聚合酶复合物包含聚合酶,模板核酸,和任选地,与所述模板核酸杂交的引物,其中所述聚合酶复合物与所述芯片通过如上所述的重组链霉亲和素结合;与表面接触的测序试剂,其包含用于进行核酸合成的试剂,包括一个或多个经标记的核苷酸类似物;照明系统,用于对所述聚合酶复合物进行照明;光学检测系统,用于检测来自所述经标记的核苷酸类似物与所述聚合酶复合物相互作用时的荧光;和计算机,用于分析通过所述检测系统所检测的信号,以确定核苷酸向与所述模板核酸链互补的核酸链的顺序添加。一个一般类别的实施方式提供了用于对核酸进行测序的系统,所述系统包括:芯片,所述芯片包括与其结合的多个聚合酶复合物,各聚合酶复合物各自是可光学解析的,各聚合酶复合物包含聚合酶,模板核酸,和任选地,与所述模板核酸杂交的引物,其中所述聚合酶复合物与所述芯片通过生物素结合蛋白结合,所述生物素结合蛋白在ph7.4的计算净电荷为-20或更低;与表面接触的测序试剂,其包含用于进行核酸合成的试剂,包括一个或多个经标记的核苷酸类似物;照明系统,用于对所述聚合酶复合物进行照明;光学检测系统,用于检测来自所述经标记的核苷酸类似物与所述聚合酶复合物相互作用时的荧光;和计算机,用于分析通过所述检测系统所检测的信号,以确定核苷酸向与所述模板核酸链互补的核酸链的顺序添加。任选地,芯片包括多个纳米级反应区域(例如,纳米级孔),其包含聚合酶复合物。另一个一般类别的实施方式提供了用于对核酸进行测序的系统,所述系统包括:芯片,所述芯片包括与其结合的多个聚合酶复合物,各聚合酶复合物各自是可光学解析的,各聚合酶复合物包含聚合酶,模板核酸,和任选地,与所述模板核酸杂交的引物,其中所述聚合酶复合物与所述芯片通过经修饰的生物素结合蛋白结合,所述经修饰的生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分(sulfonatemoiety);与表面接触的测序试剂,其包含用于进行核酸合成的试剂,包括一个或多个经标记的核苷酸类似物;照明系统,用于对所述聚合酶复合物进行照明;光学检测系统,用于检测来自所述经标记的核苷酸类似物与所述聚合酶复合物相互作用时的荧光;和计算机,用于分析通过所述检测系统所检测的信号,以确定核苷酸向与所述模板核酸链互补的核酸链的顺序添加。任选地,芯片包括多个纳米级反应区域(例如,纳米级孔),其包含聚合酶复合物。附图简要说明图1a示意性地显示了链霉亲和素中的游离伯胺基团与3,4,5-三(3-磺基丙氧基)苯甲酸的n-羟基琥珀酰亚胺酯(sg1-nhs)的反应。图1b显示了链霉亲和素(灰色)的模型,其中赖氨酸残基经过sg1修饰(深灰色)。图2示意性地显示了链霉亲和素中的游离伯胺基团与琥珀酸酐的反应。图3示意性地显示了通过首先与4-(6-叠氮基己氧基)-3,5-双(3-磺基丙氧基)苯甲酸的n-羟基琥珀酰亚胺酯(sgc-nhs)反应然后与sg1-bcn反应来对链霉亲和素中的游离伯胺基团进行的两步修饰。图4示意性地显示了经sg1修饰的链霉亲和素与固定于固体支持物上的聚合酶的共价连接。图5示意性地显示了链霉亲和素中的游离伯胺基团与甲氧基peg9(mpeg9)的n-羟基琥珀酰亚胺酯的反应。图6示意性地显示了通过首先与sgc-nhs反应然后与炔丙基-peg9-oh反应来对链霉亲和素中的游离伯胺基团进行的两步修饰。图7示意性地显示了通过首先与炔丙基-peg8-nhs反应然后与sg1-peg8-n3反应来对链霉亲和素中的游离伯胺基团进行的两步修饰。图8示意性地显示了通过首先与叠氮基-peg8-nhs反应然后与bcn-sg1反应来对链霉亲和素中的游离伯胺基团进行的两步修饰。图9a示意性地显示了3,5-二磺基苯甲酸的n-羟基琥珀酰亚胺酯的合成。图9b示意性地显示了链霉亲和素中的游离伯胺基团与3,5-二磺基苯甲酸的n-羟基琥珀酰亚胺酯的反应。图10a示意性地显示了sg1-sga的n-羟基琥珀酰亚胺酯的合成。图10b示意性地显示了链霉亲和素中的游离伯胺基团与sg1-sga的n-羟基琥珀酰亚胺酯的反应。图11示意性地显示了链霉亲和素中的游离伯胺基团与2-磺基苯甲酸环酐的反应。示意图不必按比例绘制。定义除非另外定义,否则,本文中所使用的所有技术和科学术语都具有本发明所属领域普通技术人员通常所理解的含义。下述定义对本领域所述定义进行补充并涉及当前申请,并且不得归因于任何相关或不相关情况,例如,任何共同拥有的专利或申请。虽然可采用与本文所述类似或等同的任何方法和材料实施测试本发明,但本文描述优选的方法和材料。银川,本文所用的术语仅仅用来描述特定实施方式的目的,而不旨在具有限制性。在下文描述中,阐述了许多具体细节以提供对本发明的更透彻的理解。然而,对于本领域的技术人员显而易见的是,可以在没有一个或多个这些具体细节的情况下实践本发明。在其它情况中,未赘述本领域技术人员公知的众所周知的特征和操作,以避免使本发明晦涩难懂。需指出的是本文和所附权利要求书所用的单数形式“一个”、“一种”和“所述”包括复数指示物,除非上下文另有明确说明。因此,例如,述及“蛋白质/蛋白”包括多种蛋白质/蛋白;述及“细胞”包括细胞的混合物,诸如此类。本文所用术语“约/大约”表示给定数量的值在该值的+/-10%变动,或者任选地,该值的+/-5%,或者在一些实施方式中,所述值的+/-1%。当提供一个数值范围时,应理解在本发明的范围内包括该范围上下限之间的每一个中间值,以及在该提到的范围内的任何其它所提到的或中间的数值。所述较小范围内可独立地包含这些较小范围的上下限,它们也属于本发明范围,受到所述范围明确排除的限值制约。设定范围包含一个或两个限值时,本发明也包括排除所述限值之一个或两个的范围。表述的范围通常包含一个或两个极限,除非文中另有明确说明。术语“核酸”涵盖可以对应于核苷酸串的任何物理单体单元串,包括核苷酸的聚合物(例如,典型的dna或rna聚合物),pna(肽核酸),经修饰的寡核苷酸(例如,包含这样核苷酸的寡核苷酸,所述核苷酸对于生物rna或dna不是典型的,例如2'-o-甲基化的寡核苷酸)等。核酸可以是,例如,单链的或双链的。本发明的核酸一般将包含磷酸二酯键,尽管在某些情况中,包括可能具有替代主链的核酸类似物,包括例如磷酰胺、硫代磷酸酯、二硫代磷酸酯或其他主链和连接。核酸还可具有其它修饰,诸如包含杂原子、附连标记物(如染料)或被官能团取代,它们将仍允许碱基配对以及通过聚合酶识别核酸,其中所述核酸被用作模板。“千碱基”或“kb”是用于指定核酸序列长度的单位。1kb等于1000个碱基或核苷酸的序列。显而易见地是对于双链核酸而言,1kb可以因此还表示1000个碱基对的序列。“多肽”是包含两个或多个氨基酸残基的聚合物(例如,肽或蛋白质)。聚合物可以另包含非氨基酸元件,诸如标记物、淬灭剂、封闭基团等,并且可以任选地包含修饰,诸如糖基化、生物素化等。多肽的氨基酸残基可以是天然的或非天然的,并且可以是未经取代的、未经修饰的、取代的或修饰的。取决于上下文,“氨基酸序列”是氨基酸残基的聚合物(蛋白质、多肽等)或者是代表氨基酸聚合物的字符串。当通过参照选定氨基酸或核苷酸聚合物中相同残基位置而非通过给定聚合物中组分的实际位置指定任何给定聚合物组分(氨基酸残基,纳入的核苷酸等)的位置时,给定氨基酸或核苷酸聚合物的编号“对应于”或“相对于”选定氨基酸聚合物或核酸的编号。相似地,当通过参照选定氨基酸或核苷酸聚合物中残基名称和位置而非通过给定聚合物中组分的实际名称和位置指定任何给定聚合物组分(氨基酸残基,纳入的核苷酸等)的位置时,给定氨基酸或核苷酸聚合物内给定位置的鉴定“相对于”选定氨基酸或核苷酸聚合物。位置的对应通常通过对相关氨基酸或多核苷酸序列进行比对来确定。例如,将部分处理的链霉亲和素(seqidno:2)的残基a15鉴定为相对于核心处理的链霉亲和素序列(seqidno:1)的位置a2。除非另外明确指出,否则通常相对于seqidno:1鉴定本文所述氨基酸位置。“聚合酶”或“核酸聚合酶”是合成核苷酸的聚合物的酶。聚合酶可以是,例如,rna导向的聚合酶,其利用碱基配对相互作用产生与rna模板链互补的多核苷酸;dna导向的聚合酶,其利用碱基配对相互作用产生与dna模板链互补的多核苷酸;rna聚合酶,其产生rna产物链;和/或dna聚合酶,其产生dna产物链(例如,dna导向的dna聚合酶,rna导向dna聚合酶等)。术语“重组”表明经人工干预通过人工或合成方式(即,非天然地)改变的物料(例如,核酸或蛋白质)。这一改变可以在处于其天然环境或状态内或从其天然环境或状态内分离的物料上进行。例如,“重组核酸”是通过例如在克隆、dna改组或其他过程期间重组核酸而制成的;“重组多肽”或“重组蛋白”是通过表达重组核酸而产生的多肽或蛋白质。术语“双生物素”、“双生物素标签”和“双生物素部分”可以互换使用,并且通常是指与感兴趣的反应物连接(通常是共价连接)的两个共价连接的生物素。在某些实施方式中,感兴趣的反应物包含被生物素连接酶识别的序列,其催化该序列与生物素分子之间的共价连接。这类序列通常称之为生物素连接酶识别序列。感兴趣的反应物中的各生物素连接酶识别序列可以与生物素部分共价连接,因此具有多个生物素连接酶识别序列的反应物可以与多个生物素共价连接。具有一个或多个生物素连接酶识别序列的反应物的区域通常被称为反应物的生物素化区域。因此,例如,双生物素标签可以指与融合蛋白反应物内两个生物素化肽结合的两个生物素。本文定义或以其他方式表征了各种其它术语。具体实施方式生物素结合蛋白如链霉亲和素通常用于使感兴趣的生物素化分子与其他生物素化分子、与固体支持物的生物素化表面等相联(associate)。野生型链霉亲和素对生物素表现出极高的亲和力,kd约为10-14m。但是,在用于相联或固定时,改变链霉亲和素的其他性质,特别是可以或确实接触感兴趣分子、固体支持物等的链霉亲和素的表面,可以改善链霉亲和素的性能。并不局限于任何特定机制,改变链霉亲和素的表面电荷可以影响其与固体支持物的表面和/或与待被固定的分子的相互作用。例如,向链霉亲和素的表面引入附加电荷,特别是附加负电荷,将改善用于固定核酸(包括聚合酶/核酸复合物)的链霉亲和素的性能——尽管预计会在带负电荷的核酸和带负电荷的链霉亲和素之间发生静电排斥。链霉亲和素的表面电荷可以被改变,例如,通过化学修饰和/或突变,如下文更详细地描述。可以类似地改变其他生物素结合蛋白以改善其性能。生物素结合蛋白和生物素类似物生物素-链霉亲和素连接是迄今为止表征的最强非共价相互作用之一。四个链霉亲和素单体排列成二聚体的二聚体。因此,多达四个生物素标记的实体(例如,蛋白质、核酸、小分子、固体支持物表面等)可以通过它们各自的生物素标签与单个链霉亲和素四链体的相互作用而连接在一起。在一些特别有用的实施方式中,两个生物素标记的实体通过各实体上的双生物素标签与单个四价链霉亲和素的相互作用连接在一起。链霉亲和素已被克隆和广泛地研究。参见例如,等(1986)nucleicacidsres.14(4):1871-1882;aslan,等(2007)journalofbiotechnology128:213-225;aslan,等(2005)j.proc.natl.acad.sci.usa102(24):8507-8512;baugh,等(2010)biochemistry49:4568–4570;gitlin,等(1988)biochem.j.256:279-282;hendrickson,等(1989)proc.natl.acad.sci.usa86:2190-2194;hyster,等(2012)science338:500-503;klumb,等(1998)biochemistry37(21):7657-63;kurzban,等(1991)j.biol.chem.266(22):14470-14477;matsumoto,等(2011)j.biotechnology152:37-42;sano,等(1996)annalsofthenewyorkacademyofsciences799(酶工程xiii)第383-390页;schmidt,等(1994)journalofchromatographya676:337-345;srisawat,等(2001)rna7:632-641;tahiri-alaoui,等(2002)nucleicacidsres.30(10):e45;voss,等(1997)proteinengineering10(8):975–982;和wilbur,等(2004)bioconjugatechem.15:1454-1463,其全部通过引用纳入本文用于所有目的。已经描述了包含活性和无活性亚基的异聚(heteromeric)生物素结合蛋白的产生,例如,在fairhead等(2014)j.am.chem.soc.136:12355–12363和howarth等(2006)natmethods3:267–273。链霉亲和素单体的核心序列如表1中的seqidno:1所示。在抗生物素蛋白链霉菌(streptomycesavidii)中,链霉亲和素单体最初被翻译成较大的多肽,从中去除抑制生物素结合的n端和c端片段;链霉亲和素的较少处理形式的序列表示为seqidno:2。虽然本文中主要针对与生物素化(或双生物素化)试剂结合的链霉亲和素四聚体进行了描述,但是对于本领域普通技术人员而言将清楚的是,可以用各种生物素结合蛋白中的任一种替代链霉亲和素和/或可以用生物素类似物替代生物素。因此,在本文所述发明的各个方面中,本文各个实施方式中对链霉亲和素和生物素的叙述仅仅是示例性的,并且绝不排除使用其他生物素-或链霉亲和素-结合反应物或者其他生物素形式或类似物来代替链霉亲和素和/或生物素或与链霉亲和素和/或生物素组合,例如,方法、组合物、系统和试剂盒。通常,用于本发明的生物素结合蛋白是结合生物素的生物素结合蛋白,优选以高亲和力(例如,与其他已知生物素结合蛋白(如链霉亲和素和本文列其他示例)所证明的亲和力相当)发生结合。通常,生物素结合蛋白对于生物素的kd为10-7m或更少,优选10-9m或更少或10-10m或更少,更优选10-11m或更少,10-12m或更少,10-13m或更少,10-14m或更少,或甚至10-15m或更少。合适的生物素结合蛋白为本领域所熟知。示例性的合适的四聚体生物素结合蛋白包括但不限于,链霉亲和素,亲和素(avidin),去糖基化亲和素(中性亲和素(neutravidin)),川氏亲和素(traptavidin),谭氏亲和素(tamavidin),爪蟾亲和素(xenavidin),布氏亲和素(bradavidin),avr2(亲和素相关蛋白2),avr4(亲和素相关蛋白4)和其变体、突变体、衍生物或同源物;参见例如,livnah等(1993)“亲和素和亲和素-生物素复合物的三维结构(three-dimensionalstructuresofavidinandtheavidin-biotincomplex)”美国国家科学院院刊(proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica)90(11):5076–80,bayer等(1995)“去糖基化蛋清亲和素的制备(preparationofdeglycosylatedeggwhiteavidin)”applbiochembiotechnol53(1):1-9,marttila等(2000)“重组中心亲和素:鸡亲和素的非糖基化酸性突变体展现出对生物素的高亲和力和低非特异性结合特性(recombinantneutraliteavidin:anon-glycosylated,acidicmutantofchickenavidinthatexhibitshighaffinityforbiotinandlownon-specificbindingproperties)”febslett467(1):31-6,chivers等(2010)“链霉亲和素变体具有较慢的生物素解离和增加的机械稳定性(astreptavidinvariantwithslowerbiotindissociationandincreasedmechanostability)”natmethods7(5):391–393,chivers等(2011)“如何使生物素链霉亲和素相互作用更强:通过晶体学和嵌合四聚体进行研究(howthebiotin-streptavidininteractionwasmadeevenstronger:investigationviacrystallographyandachimaerictetramer)”biochemj.435(1):55-63,takakura等(2009)“谭氏亲和素——来自tamogitake蘑菇的新型亲和素生物素结合蛋白(tamavidins-novelavidin-likebiotin-bindingproteinsfromthetamogitakemushroom)”febsjournal276:1383-1397,等(2009)“来自热带爪蟾的第一种青蛙亲和素——爪蟾亲和素的结构和功能特性(structuralandfunctionalcharacteristicsofxenavidin,thefirstfrogavidinfromxenopustropicalis)”bmcstructuralbiology9:63,agrawal等(2017)“与生物素复合的核心布氏亲和素的结构表征(structuralcharacterizationofcore-bradavidinincomplexwithbiotin)”plosone12(4):e0176086,helppolainen等(2008)“来自日本根瘤菌的布式亲和素ii:新型亲和素样结合蛋白(bradavidiniifrombradyrhizobiumjaponicum:anewavidin-likebiotin-bindingprotein)”biochimbiophysacta1784(7-8):1002-10,hytonen等(2005)“亲和素相关蛋白2在亲和素蛋白家族中显示出独特的结构和功能特征(avidinrelatedprotein2showsuniquestructuralandfunctionalfeaturesamongtheavidinproteinfamily)”bmcbiotechnology5:28,taskinen等(2014)“使用dna改组具有更高的热稳定性的新型嵌合亲和素(anovelchimericavidinwithincreasedthermalstabilityusingdnashuffling)”plosone.2014;9(3):e92058,和hytonen等(2004)“鸡亲和素相关蛋白4/5在与亲和素比较时显示出优越的热稳定性并保持对生物素的高亲和力(chickenavidin-relatedprotein4/5showssuperiorthermalstabilitywhencomparedwithavidinwhileretaininghighaffinitytobiotin)”thejournalofbiologicalchemistry279:9337-9343。示例性的合适的二聚体亲和素蛋白包括但不限于,瑞氏亲和素(rhizavidin)及其变体、突变体、衍生物或同源物;残基例如,helpploainen等(2007)biochem.j.405:397–405。美国专利号7,981,632描述了“strep-标签”肽,其结合修饰型链霉亲和素,streptactin。任选地,四聚生物素结合蛋白为四价的,具有四个活性生物素结合位点。在其他实施方式中,四聚生物素结合蛋白具有三个、两个或一个活性生物素结合位点(并分别具有一个、两个或三个无活性位点)。相似地,二聚生物素结合蛋白通常是二价的,具有两个活性生物素结合位点,但是在其他实施方式中,二聚生物素结合蛋白具有一个活性生物素结合位点(和一个无活性位点)。多聚生物素结合蛋白可以是同聚体或异聚体(例如,链霉亲和素四聚体,或包含三个链霉亲和素亚基和一个川氏亲和素((traptavidin)亚基的四聚体)。相似地,可以使用能够结合链霉亲和素、亲和素或另一种生物素结合剂的生物素的类似物或修饰形式,例如,单独方式或以多标签或双标签方式。“生物素类似物”是这样的化合物,其在特定应用中(例如,在与链霉亲和素、亲和素等的结合中)以与天然产生的生物素相似或类似的方式起作用,并且不另外表示任何特定结构。合适的生物素类似物包括但不限于,生物素亚砜(参见,例如,garlick和giese(1990)“生物素酰氨基乙基-3-(4-羟基-3-[125i]碘苯基)丙酰胺的α-和β-亚砜与亲和素的解离结合(dissociativebindingofalpha-andbeta-sulphoxidesofbiotinylamidoethyl-3-(4-hydroxy-3-[125i]iodophenyl)propionamidetoavidin)”biochemicaljournal268(3):611–613),亚氨基生物素,脱硫生物素(desthiobiotin)(也称为去硫生物素(dethiobiotin)),加氧生物素,碳生物素(参见例如,wormser等(1972)“合成和促进生长的活性dl-顺式-六氢-4-(4-羧基丁基)-2-环戊咪唑啉酮:碳生物素(synthesisandgrowth-promotingactivityofdl-cis-hexahydro-4-(4-carboxybutyl)-2-cyclopentimidazolone:carbobiotin)”《药学科学杂志》(journalofpharmaceuticalsciences)61(7):1168-1170),硒基生物素,羧基生物素,高生物素,降生物素,二氨基生物素,生物素砜,表生物素(epibiotin),5-羟基生物素,2-硫代生物素,氮杂生物素(azabiotin),生物素的甲基化衍生物(例如,生物素甲酯),和/或酮生物素。对于各种生物素类似物和修饰形式的晶体结构,参见例如,detitta等(1980)“通过生物素及其类维生素的衍射研究提出的羧基生物素易位机制(carboxybiotintranslocationmechanismssuggestedbydiffractionstudiesofbiotinanditsvitamers)”procnatlacadsciusa.77(1):333-7和stallings和detitta(1985)“生物素和羧基生物素衍生物的晶体学研究(crystallographicinvestigationsofbiotinandcarboxybiotinderivatives)”annnyacadsci.447:152-68。如上所述,感兴趣的单一生物素化分子可以通过与链霉亲和素或另一种多价生物素结合蛋白结合来连接(至彼此,至生物素化支持物等)。可以通过在感兴趣的分子上和/或在其他分子或表面上包含双生物素标签来实现更稳定的结合。对于示例性合适的双生物素部分,参见美国专利申请公开号2017-0184580,将其通过引用其全部内容纳入本文用于所有目的。通常,双生物素部分结合单一生物素结合蛋白上的两个生物素结合位点。在一类实施方式中,两个实体(例如,固体支持物表面和聚合酶或核酸)各自包含双生物素部分,所述双生物素部分结合单一四价生物素结合蛋白上的两个生物素结合位点。在其他实施方式中,一个实体通过双生物素部分结合生物素结合蛋白,而一个或多个其他实体各自通过生物素部分结合。在其他实施方式中,各实体包含单一生物素部分。在其他实施方式中,生物素化或双生物素化的实体结合生物素结合蛋白(单价或多价),所述生物素结合蛋白与另一分子或表面连接,例如,通过共价修饰(例如,通过共价交联剂等)连接。生物素结合蛋白的化学修饰如上所述,改变生物素结合蛋白的电荷,特别是表面电荷,可以改善其在应用诸如联合或固定化中的性能。因此,一个一般类别的实施方式提供了通过共价修饰亲本生物素结合蛋白中的一个或多个氨基酸残基来产生经修饰的生物素结合蛋白的方法。所得经修饰的生物素结合蛋白包含一个或多个共价修饰。通常,相对于亲本生物素结合蛋白,这些共价修饰改变经修饰的生物素结合蛋白的电荷(例如,计算的净电荷)。优选地,相对于亲本生物素结合蛋白,一个或多个共价修饰降低经修饰的生物素结合蛋白的计算净电荷。上文已经描述了适合用作亲本生物素结合蛋白的示例性生物素结合蛋白,并且包括例如四价和二价生物素结合蛋白,如链霉亲和素,亲和素,去糖基化亲和素(中性亲和素(neutravidin)),川氏亲和素,谭氏亲和素(tamavidin),爪蟾亲和素(xenavidin),布氏亲和素(bradavidin),avr2,avr4,瑞氏亲和素(rhizavidin),及其变体,突变体,衍生物或同源物。在一类实施方式中,经修饰的生物素结合蛋白包含至少一种单体,其包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一个实施方式中,亲本生物素结合蛋白包含四个单体,其各自包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。本文所述修饰策略可以与下文详述的突变策略组合。因此,在一类实施方式中,相对于亲本生物素结合蛋白,生物素结合蛋白包含一个或多个氨基酸取代,例如,一个或多个氨基酸取代,其相对于亲本生物素结合降低其计算净电荷,通过经修饰的蛋白质改善生物素结合,引入其他修饰位点等。相似地,生物素结合蛋白可以包括一个或多个外源性特征,例如,聚谷氨酸,聚天冬氨酸,聚赖氨酸或如下所述的其他标签。修饰可以增加或者优选减少计算净电荷。例如,相对于亲本生物素结合蛋白,修饰可以降低经修饰的生物素结合蛋白的净电荷,例如,使计算净电荷改变-4或更低,例如,-8或更低,-10或更低,-12或更低,-16或更低,-20或更低,-30或更低,-40或更低,-50或更低,-60或更低,-70或更低,甚至-80或更低,例如,在ph7.4。在一些实施方式中,经修饰的生物素结合蛋白在ph7.4具有-20或更低的计算净电荷,例如,-30或更低,-40或更低,-50或更低,-60或更低,-70或更低,或甚至-80或更低。在一些实施方式中,修饰不改变计算净电荷而是改变局部表面电荷,例如,蛋白质一个区域中的降低被另一区域的等同增加所平衡,所以表面电荷被改变,但是净电荷为不变。基本上任何带电荷的基团都可以添加到亲本生物素结合蛋白。例如,为了降低净电荷,可以共价连接一个或多个带负电荷的基团(例如,羧酸基,磺酸基,亚磺酸基,磷酸基,次膦酸基或膦酸基)。在一类实施方式中,一个或多个共价修饰包括一个或多个共价连接的磺酸盐/酯部分(例如,三个或更多个,12或更多个,24或更多个,30或更多个,45或更多个,甚至60或更多个的共价连接的磺酸盐/酯部分)。例如,一个或多个共价修饰可以包含一个或多个共价连接的3,4,5-三(3-磺丙氧基)苯甲酰基部分(参见,例如图1a),3,5-二磺基苯甲酰基部分(参见,例如图9b)或2-磺基苯甲酰基部分(参见,例如图11),例如,四个或更多个,10个或更多个,15个或更多个,甚至20个或更多个的共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基,3,5-二磺基苯甲酰基或2-磺基苯甲酰基部分。基本上任何不带电荷的基团都可以类似方式添加到亲本生物素结合蛋白。注意,在生物素结合蛋白是多聚体的情况中,按所需或方便程度,共价连接的部分的总数(例如,四价生物素结合蛋白上的45个或更多个的磺酸盐/酯部分)可以均等或不均等地分布在单体之间。共价连接部分/蛋白质的数量也可以是针对该蛋白质群体确定的平均值。可以如本领域已知通过实验确定所得经修饰的蛋白质的净电荷。例如,可以例如通过测量离子交换柱上的保留时间来评估相对净电荷。也可以在所需ph下计算净电荷,例如,鉴于蛋白质的已知氨基酸序列,采用的修饰,和各种可电离基团的平均pka。通过假设精氨酸侧链、赖氨酸侧链和游离n端氨基各自的电荷为+1并假设天冬氨酸侧链、谷氨酸侧链和c端羧酸基团各自的电荷为-1,可以方便地确定在ph7.4的计算净电荷。组氨酸的侧链通常在ph7.4几乎不带正电荷,因此被算为带零电荷。磺酸根基团的电荷为-1。本领域技术人员可以容易地确定其他可电离基团的电荷(例如,对于磷酸盐/酯为-2等)。seqidno:1的计算净电荷因此为-1(四个精氨酸,四个赖氨酸,n端胺,四个天冬氨酸,五个谷氨酸和c端羧酸:+4+4+1-4-5-1=-1);包括seqidno:1四个拷贝的链霉亲和素四聚体的计算净电荷将为-4。部分与蛋白质的共价连接为本领域所周知。各种氨基酸上的反应性基团可用于提供特定的连接位点,例如,用于带电荷的部分。用于将部分连接蛋白质的反应性基团包括赖氨酸或精氨酸上的胺基团,半胱氨酸上的硫醇基,天冬氨酸或谷氨酸上的羧酸基,丝氨酸、苏氨酸或酪氨酸上的羟基基团和色氨酸上的吲哚基,以及游离的n-末端胺和c-末端羧酸基团。在一些情况中,可用的蛋白质将具有适当的残基以连接各部分。在其他情况中,可以将适当的残基工程改造为蛋白质。使用基因工程改造产生去除或添加多个氨基酸的所需蛋白质是一种常见且众所周知的实践。蛋白质上不同基团的不同反应性可以用于将特定部分引导至蛋白质上不同的连接点。例如,带负电的部分可以在一个所需连接点处连接赖氨酸,并且另一部分(例如,不同的带负电的基团,荧光部分等)可以在第二个连接点处连接特定的半胱氨酸。在一些情况中,相同类型的残基会因其位于蛋白质上的位置而具有不同的反应性,从而允许选择性连接。例如,蛋白质可以具有三个赖氨酸部分,其中它们各自具有不同的反应性。可以进行连接,从而只对反应性最强的赖氨酸进行修饰,或者可以通过这样进行连接:保护两个反应性最强的赖氨酸,然后使感兴趣的部分与第三,反应性最低的赖氨酸反应。在一些情况中,可以修饰相同类型的所有可用残基。许多类型的化学反应可用于与蛋白质上特定氨基酸残基反应。例如,通过半胱氨酸硫醇的偶联可以使用与马来酰亚胺的反应来完成。半胱氨酸基团也可以与烯丙基卤化物,苯基甲基卤化物,烷基卤化物或α-卤代羰基基团偶联。胺基可以与活化的羧酸盐/酯或活化的磺酸偶联。蛋白质上的胺或羧酸盐/酯官能团可用于产生酰胺键。可以使用这样的连接,所述连接包含氮双键,如肟或腙。可以使用环加成化学方法,诸如huisgen1,3-偶极叠氮化物-炔烃环加成,形成高度选择性的连接。参见例如,kalia和raines(2010)“生物偶联中的进展(advancesinbioconjugation)”currorgchem.14(2):138–147,besanceney-webler等(2011)“增加生物正交点击反应对生物偶联的功效(increasingtheefficacyofbioorthogonalclickreactionsforbioconjugation)”angew.chem.int.编著50:8051-8056,和dimarco等(2010)“用于结合蛋白质与纳米系统的主要方法概述:吸收、生物偶联和封装(overviewofthemainmethodsusedtocombineproteinswithnanosystems:absorption,bioconjugation,andencapsulation)”internationaljournalofnanomedicine5:37-49。这些部分可以通过引入蛋白质中的非天然氨基酸与蛋白质连接,从而实现特定的连接化学。参见例如,peterschultz的工作,例如,noren等,“用于将非天然氨基酸位点特异性纳入蛋白质的一般方法(ageneralmethodforsite-specificincorporationofunnaturalaminoacidsintoproteins)”,science,244:182-188,1989,和ellman等“用于将非天然氨基酸位点特异性地引入蛋白质的生物合成方法(biosyntheticmethodforintroducingunnaturalaminoacidssite-specificallyintoproteins)”,methodsinenzymology,第202卷,1991,第301-336页。本领域已知化学修饰蛋白质的许多其他方法。参见例如,“化学修饰半胱氨酸处的蛋白质:化学和生物学中的机会(chemicalmodificationofproteinsatcysteine:opportunitiesinchemistryandbiology)”chalkerjm,bernardesgj,linya,davisbg,chemasianj.2009年5月4日;4(5):630-40,“多肽和蛋白质的化学选择性连接和修饰策略(chemoselectiveligationandmodificationstrategiesforpeptidesandproteins)”hackenbergercp,schwarzerd.angewchemintedengl.2008;47(52):10030-74,“蛋白质的化学选择性修饰:命中目标(chemoselectivemodificationofproteins:hittingthetarget)”,carricois,chemsocrev.2008年7月;37(7):1423-31,“通过活性氮物质修饰蛋白质中的色氨酸和色氨酸残基(modificationoftryptophanandtryptophanresiduesinproteinsbyreactivenitrogenspecies)”,yamakuraf,ikedak,nitricoxide.2006年3月;14(2):152-61,蛋白质的化学修饰(chemicalmodificationofproteins),carneaf,methodsmolbiol.1994;32:311-20,蛋白质的选择性化学修饰(selectivechemicalmodificationofproteins),shawe,physiolrev.1970年4月;50(2):244-96,和“蛋白质修饰的化学试剂(chemicalreagentsforproteinmodification)”rogerl.lundblad,crc出版社(crcpress),2004。用于将官能团与蛋白质连接的反应和其他有用的反应讨论于例如,march,《高等有机化学》(advancedorganicchemistry),第三版.,约翰韦利父子公司(johnwiley&sons),纽约,1985;hermanson,《生物偶联技术》(bioconjugatetechniques),学术出版社(academicpress),圣地亚哥,1996;和feeney等.,《蛋白质修饰》(modificationofproteins);高等化学系列(advancesinchemistryseries),第198卷,美国化学协会(americanchemicalsociety),华盛顿特区,1982。有用的反应性官能团包括,例如(a)羧基基团及其衍生物,包括但不限于,活化的酯,例如,n-羟基琥珀酰亚胺酯,n-羟基邻苯二甲酰亚胺,n-羟基苯并三唑酯,酸性卤化物,酰基咪唑,硫酯,对硝基苯基酯,烷基,烯基,炔基和芳族酯,用于肽合成和酸性卤化物的活化基团;(b)羟基基团,可以转化为酯,磺酸盐/酯,氨基磷酸酯,醚,醛等;(c)卤代烷基基团,其中卤化物可以被亲核基团置换,例如,胺,羧酸阴离子,硫醇阴离子,碳负离子或醇盐离子,从而导致卤素原子的位点处新基团的共价连接;(d)亲二烯基团,其能够参与狄尔斯-阿尔德(diels-alder)反应,例如,马来酰亚胺基团;(e)醛或酮基团,其允许通过形成羰基衍生物(例如,亚胺,腙,缩氨基脲(semicarbazone)或肟)或通过诸如格氏加成(grignardaddition)或烷基锂加成(alkyllithiumaddition)的机理进行衍生化;(f)磺酰卤化物基团,用于与胺反应,例如,以形成磺酰胺;(g)硫醇基团,例如,其可以被转化为二硫化物或与酰基卤化物反应;(h)胺或硫氢基基团,例如,其可以被酰化,烷基化或氧化;(i)烯烃,例如,其可以经历环加成,酰化,迈克尔加成(michaeladdition)等;和(j)环氧化物,例如,其可以与胺和羟基化合物反应。共价修饰可以多种方式改变(例如,增加或减少)蛋白质的电荷。例如,蛋白质上带正电荷的基团与不带电荷的基团的反应将减少净电荷。蛋白质上带正电荷的基团发生反应以引入带负电荷的共价修饰会在更大程度上降低净电荷。因此,在一类实施方式中,亲本生物素结合蛋白中的一个或多个带正电荷的残基被共价修饰,例如,一个或多个赖氨酸残基和/或游离的n-末端胺。例如,赖氨酸侧链和/或游离的n-末端胺可以与3,4,5-三(3-磺基丙氧基)苯甲酸的n-羟基琥珀酰亚胺酯(sg1-nhs)反应。游离的伯氨基基团(例如,在赖氨酸侧链上或游离的n端)与sg1-nhs的反应如图1a所示。图1b显示了链霉亲和素的模型,其中赖氨酸残基经过sg1修饰。为了清楚起见,虽然在图1a中仅显示了单个氨基的修饰,但是应该理解的是,链霉亲和素的多个氨基基团(对于各单体和/或在不同单体中)可以在单一反应中被修饰。可以对一至全部可用的伯氨基进行修饰。使用sg1修饰的各赖氨酸或n末端胺(例如,通过去除n-甲酰基甲硫氨酸,蛋白酶去除n末端标签等产生)导致ph7.4的计算净电荷的-4变化。因此,使用sg1修饰包括四个拷贝的seqidno:1的链霉亲和素四聚体中所有可用的伯胺将使ph7.4的计算净电荷的变化-80(每个单体四个赖氨酸和一个n末端胺x四个单体x-4/经sg1修饰的胺)。另一个示例是,赖氨酸侧链和/或n-末端的伯氨基可以与琥珀酸酐反应,如图2所示。(虽然酪氨酸,组氨酸,半胱氨酸,丝氨酸和苏氨酸侧链也可与琥珀酸酐反应,但是这些修饰在高ph下不稳定)。同样,可以对一个到所有可用的伯氨基进行修饰。经琥珀酰化的各个伯胺导致ph7.4的计算净电荷的-2变化。使用琥珀酸酐修饰包括四个拷贝的seqidno:1的链霉亲和素四聚体中的所有可用的伯胺将导致ph7.4的计算净电荷的改变-40。另一个示例是,链霉亲和素的游离n-末端胺和/或赖氨酸侧链中的伯氨基基团可以与3,5-二磺基苯甲酸的n-羟基琥珀酰亚胺酯反应,如在图9b中示意性示出。另一个示例是,链霉亲和素的游离n-末端胺和/或赖氨酸侧链中的伯氨基基团可以与sg1-sga(其中sga是4-(2-氨基乙氧基)-3,5-双(3-磺基丙氧基)苯甲酸)的n-羟基琥珀酰亚胺酯反应,如在图10b中示意性示出。另一个示例是,链霉亲和素的游离n-末端胺和/或赖氨酸侧链中的伯氨基基团可以与2-磺基苯甲酸环酐(cas号81-08-3)反应,如在图11中示意性示出。如果需要,共价修饰可以多个步骤完成。例如,n-末端和/或赖氨酸侧链中的伯氨基基团可以与4-(6-叠氮基己氧基)-3,5-双(3-磺基丙氧基)苯甲酸(sgc-nhs)的n-羟基琥珀酰亚胺酯反应以产生经sgc修饰的蛋白质,例如,经sgc修饰的链霉亲和素如图3所示。sgc基团包括可点击的叠氮基。因此,在第二步骤中,可以用乙炔改性剂对经sgc修饰的蛋白质进行非常有效的点击反应修饰(铜催化或无铜),以连接各种所需基团。在图3所示的示例中,第二步将sg1-bcn组单击到sgc组;所得产物在各经修饰的位置上具有五个磺酸盐/酯基团,导致在ph7.4的净电荷计算值的-6变化/修饰。使用sgc-bcn-sg1修饰包括四个拷贝的seqidno:1的链霉亲和素四聚体中的所有可用的伯胺将导致ph7.4的计算净电荷的-120改变。同样,可以对一至全部可用的伯氨基进行修饰。关于“点击”化学的其他信息在本领域中是容易获得的。参见,例如,kalia和raines(2010)“生物偶联的进展(advancesinbioconjugation)”currorgchem.14(2):138–147和besanceney-webler等(2011)“增加生物正交点击反应对生物偶联的功效(increasingtheefficacyofbioorthogonalclickreactionsforbioconjugation)”angew.chem.int.编著50:8051-8056。在一些实施方式中,使用包含聚乙二醇(peg)或另一亲水基团例如柔性亲水性接头的部分共价修饰生物素结合蛋白。合适的亲水性连接基团包括但不限于,peg,寡肽和甘氨酸寡聚物,β-丙氨酸,4-氨基丁酸,(2-氨基乙氧基)乙酸,5-氨基戊酸,和6-氨基己酸,任选包括,1-50个单体单元,例如,2-30个或5-10个。这类部分可以但是并不必包括带电荷的基团,例如,一个或多个带负电荷的基团。在一类实施方式中,使用peg部分例如磺化的peg部分共价修饰生物素结合蛋白。任选地,peg包含1-50个单体单元,例如,2-30个或5-10个。例如,链霉亲和素的游离n-末端胺和/或赖氨酸侧链中的伯氨基基团可以与甲氧基peg的n-羟基琥珀酰亚胺酯反应,例如,mpeg9-nhs,如在图5中示意性示出。同样,可以对一个到所有可用的伯氨基进行修饰。经mpeg化的各个伯胺导致ph7.4的计算净电荷的-1变化。使用mpeg9修饰包括四个拷贝的seqidno:1的链霉亲和素四聚体中的所有可用的伯胺将导致ph7.4的计算净电荷的-20改变。又例如,链霉亲和素中的游离伯氨基团可以经sgc修饰,然后使用炔丙基-peg-醇,例如,炔丙基peg9-oh,进行点击反应修饰,如图6所示意性地示出。又例如,链霉亲和素中的游离伯胺基团可以与炔丙基-peg的n-羟基琥珀酰亚胺酯(例如,炔丙基peg8-nhs,如图7示意性示出);然后,可以用叠氮基-peg(例如,sg1-peg8-n3,如图7所示意性地示出)对炔丙基-peg-修饰的链霉亲和素进行点击反应修饰。又例如,链霉亲和素中的游离伯胺基团可以与叠氮基-peg(例如,叠氮基-peg8-nhs,如图8所示意性地示出);然后,可以用乙炔修饰剂,例如,bcn-sg1(如图8所示意性地示出)对所得叠氮基-peg-修饰的链霉亲和素进行点击反应修饰。可以使用本领域已知的纯化技术从未经修饰的(或未完全经修饰的)蛋白质中分离经修饰的蛋白质。例如,可以使用阴离子交换色谱法容易地从亲本蛋白质中分离出其净电荷已经通过共价添加代负电荷的基团而减少的生物素结合蛋白。相似地,可以使用阴离子交换色谱法分离具有所需修饰程度(或范围)的那些蛋白。可以在不干扰生物素结合活性或干扰最小化的情况下完成修饰。因此,在一些实施方式中,在相同反应条件下,经修饰的生物素结合蛋白对生物素(或类似物)表现出的kd不超过100倍或不超过10倍于经修饰的亲本蛋白质所表现出的kd。例如,通过其四个单体包含seqidno:1的亲本链霉亲和素的反应所产生的经修饰的链霉亲和素对亲和素(或类似物)可以表现出这样的kd,所述kd不超过100倍或不超过10倍于亲本链酶亲和素所表现出的kd。通过该方法产生的经修饰的生物素结合蛋白也是本发明的特征。相应地,一类实施方式提供了包含经修饰的生物素结合蛋白的组合物,所述经修饰的生物素结合蛋白包含一个或多个共价连接的磺酸基团(例如,甲基磺酸基团),羧酸基团(例如,除了存在于蛋白质一级结构中c-末端、谷氨酸残基和天冬氨酸残基上的羧酸盐/酯之外),亚磺酸基团,磷酸盐/酯基团,次膦酸基团,膦酸基团和/或其他带负电荷的基团。任选地,生物素结合蛋白是四价或二价生物素结合蛋白,例如,链霉亲和素,亲和素,去糖基化亲和素(中性亲和素),川氏亲和素,谭氏亲和素,爪蟾亲和素,布氏亲和素,avr2,avr4,瑞氏亲和素及其变体、突变体、衍生物或同系物。在一类实施方式中,经修饰的生物素结合蛋白包含至少一种单体,其包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一个实施方式中,亲本生物素结合蛋白包含四个单体,其各自包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一类实施方式中,经修饰的生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,三个或更多个,12或更多个,24或更多个,30或更多个,45或更多个,甚至60或更多个的共价连接的磺酸盐/酯部分)。例如,生物素结合蛋白可以包含一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基(sg1)部分,例如,四个或更多个,10个或更多个,15个或更多个,16或更多个,17或更多个,18或更多个,19或更多个或甚至20个或更多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。注意,在生物素结合蛋白是多聚体的情况中,按所需或方便程度,共价连接的部分的总数(例如,四价生物素结合蛋白上的45个或更多的磺酸盐/酯部分)可以均等或不均等地分布在单体之间。共价连接部分/蛋白质的数量也可以是针对该蛋白质群体确定的平均值。在一些实施方式中,经修饰的生物素结合蛋白在ph7.4具有-20或更低的计算净电荷,例如,-30或更低,-40或更低,-50或更低,-60或更低,-70或更低,或甚至-80或更低。本文所述修饰策略可以与下文详述的突变策略组合。因此,在一类实施方式中,相对于亲本生物素结合蛋白,生物素结合蛋白包含一个或多个氨基酸取代,例如,一个或多个氨基酸取代,相对于亲本生物素结合,所述氨基酸取代降低其计算净电荷,通过经修饰的蛋白质改善生物素结合,引入其他修饰位点等。相似地,生物素结合蛋白可以包括一个或多个外源性特征,例如,聚谷氨酸,聚天冬氨酸,聚赖氨酸或如下所述的其他标签。经修饰的生物素结合蛋白可以用于基本上任何所需应用。例如,生物素结合蛋白可用于固定核酸,例如,生物素化核酸或包含该核酸的复合物。在一个示例性类别的实施方式中,生物素结合蛋白结合核酸聚合酶,例如,生物素化(例如,双生物素化)聚合酶。任选地,核酸聚合酶与核酸复合。例如,生物素结合蛋白可以结合与dna模板复合的dna聚合酶。任选地,生物素结合蛋白固定于固体支持物上,例如,其表面被生物素(例如,双生物素)被覆。在对单分子应用特别有用的一类实施方式中,生物素结合蛋白固定于纳米级孔的基础上,例如,零模波导(zmw)。任选地,组合物存在于核酸测序系统中,例如,如下所述的dna测序系统中.生物素结合蛋白的突变如上所详述,可以通过共价修饰来改变蛋白质净电荷。可替代地或另外地,可以通过诱变蛋白质来改变生物素结合蛋白的电荷。如一些示例所示,可以通过用带负电的残基代替不带电的残基或通过用不带电或带负电的残基代替带正电的残基来降低生物素结合蛋白的净电荷。还可以采用诱变以引入其他位点用于共价修饰和/或去除不需要的位点。选择用于突变的残基通常是表面暴露的残基。除非需要改变活性,否则可以避免活性例如高亲和力的生物素结合所需的残基。生物素结合蛋白的结构数据可用于方便地鉴定氨基酸残基作为诱变候选物,以产生重组生物素结合蛋白,例如,不在生物素结合位点内的表面残基。许多生物素结合蛋白的三维结构已通过x射线晶体学和核磁共振(nmr)光谱确定,包括具有结合的生物素或生物素类似物的结构。许多这样的结构可从蛋白质数据库(proteindatabank)免费下载,网址为www.rcsb.org/pdb。也可以从国家生物技术信息中心分子建模数据库(nationalcenterforbiotechnologyinformation’smolecularmodelingdatabase)中免费搜索和下载结构,以及结构域和同源性信息,网址为www.ncbi.nlm.nih.gov/structure/mmdb/mmdb(dot)shtml。例如,可以获得与生物素复合的链霉亲和素的结构;参见例如,weber等(1989)“高亲和力生物素结合链霉亲和素的结构起源(structuraloriginsofhigh-affinitybiotinbindingtostreptavidin)”science243:85-88以及相应的蛋白质数据库条目pdbid1stp。例如,可以基于蛋白质与已经确定其结构的生物素结合蛋白的同源性来对其他生物素结合蛋白或复合物的结构进行建模。或者,可以确定给定的生物素结合蛋白的结构,任选地,与生物素或类似物复合。确定晶体结构的技术是众所周知的。参见例如,mcpherson(1999)《生物大分子结晶结晶》(crystallizationofbiologicalmacromolecules)冷泉港实验室出版社(coldspringharborlaboratory);bergfors(1999)《蛋白质结晶学》(proteincrystallization)internationaluniversityline出版社;mullin(1993)《结晶学》(crystallization)butterwoth-heinemann出版社;stout和jensen(1989)《x射线结构确定:实用指南,第二版》(x-raystructuredetermination:apracticalguide,2ndedition)威利出版社(wileypublishers),纽约;ladd和palmer(1993)《通过x射线晶体学确定结构,第3版》(structuredeterminationbyx-raycrystallography,3rdedition)plenum出版社,纽约;blundell和johnson(1976)《蛋白质晶体学》(proteincrystallography)学术出版社,纽约;glusker和trueblood(1985)《晶体结构分析:初级,第二版》(crystalstructureanalysis:aprimer,2nded.)牛津大学出版社(oxforduniversitypress),纽约;国际晶体学表,卷f.生物大分子的晶体学(internationaltablesforcrystallography,vol.f.crystallographyofbiologicalmacromolecules);mcpherson(2002)《大分子晶体学概论》(introductiontomacromolecularcrystallography)wiley-liss;mcree和david(1999)《实用蛋白质晶体学,第二版》(practicalproteincrystallography,secondedition)学术出版社;drenth(1999)《蛋白质x射线晶体学原理》(principlesofproteinx-raycrystallography)(施普林格高级化学课本(springeradvancedtextsinchemistry)施普林格出版社(springer-verlag);fanchon和hendrickson(1991)《晶体学计算》(crystallographiccomputing)第5卷的第15章iucr/牛津大学出版社;murthy(1996)《晶体学方法和方案》(crystallographicmethodsandprotocols)的第5章胡玛纳出版社(humanapress);dauter等(2000)“定相蛋白质的新型方法:通过与卤化物的短时间冷冻浸渍而衍生(novelapproachtophasingproteins:derivatizationbyshortcryo-soakingwithhalides)”actacryst.d56:232-237;dauter(2002)“高通量相位调整的新方法(newapproachestohigh-throughputphasing)”curr.opin.structuralbiol.12:674–678;chen等(1991)“从结合的碘原子的单波长反常散射信号确定的的后叶激素运载蛋白-ii二肽复合物的晶体结构(crystalstructureofabovineneurophysin-iidipeptidecomplexatdeterminedfromthesingle-wavelengthanomalousscatteringsignalofanincorporatediodineatom)”proc.natlacad.sci.usa,88:4240–4244;和gavira等(2002)“不进行晶体处理从头开始晶体学结构确定胰岛素从蛋白质到电子密度((abinitiocrystallographicstructuredeterminationofinsulinfromproteintoelectrondensitywithoutcrystalhandling)”actacryst.d58:1147-1154。此外,促进数据收集、阶段确定、模型建立和完善等的各种程序为公众所及。示例包括但不限于,hkl2000软件包(otwinowski和minor(1997)“处理在振荡模式中收集的x射线衍射数据(processingofx-raydiffractiondatacollectedinoscillationmode)”methodsinenzymology276:307-326),ccp4软件包(协作计算项目(collaborativecomputationalproject)(1994)“ccp4套件:用于蛋白质晶体学的程序(theccp4suite:programsforproteincrystallography)”actacrystallogrd50:760-763),solve和resolve(terwilliger和berendzen(1999)actacrystallogrd55(pt4):849-861),shelxs和shelxd(schneider和sheldrick(2002)“使用shelxd的子结构解决方案(substructuresolutionwithshelxd)”actacrystallogrdbiolcrystallogr58:1772-1779),refmac5(murshudov等(1997)“通过最大似然方法完善大分子结构(refinementofmacromolecularstructuresbythemaximum-likelihoodmethod)”actacrystallogrd53:240-255),prodrg(vanaalten等(1996)“prodrg,一种由小分子的坐标生成分子拓扑和独特分子描述符的程序(prodrg,aprogramforgeneratingmoleculartopologiesanduniquemoleculardescriptorsfromcoordinatesofsmallmolecules)”jcomputaidedmoldes10:255-262),和coot(elmsley等(2010)“coot的特征和发展(featuresanddevelopmentofcoot)”actacrystd66:486-501。相似地,在文献中很好地描述了通过nmr光谱确定结构的技术。参见例如,cavanagh等(1995)《蛋白质核磁共振光谱:原理与实践》(proteinnmrspectroscopy:principlesandpractice),academicpress;levitt(2001)《自旋动力学:核磁共振基础》(spindynamics:basicsofnuclearmagneticresonance),约翰威利父子出版公司(johnwiley&sons);evans(1995)《生物分子nmr光谱》biomolecularnmrspectroscopy,牛津大学出版社;wüthrich(1986)《蛋白质和核酸的nmr》(nmrofproteinsandnucleicacids)(贝克系列讲座(bakerlectureseries)),kurtwiley-interscience出版社;neuhaus和williamson(2000)《结构和构象分析中的奥佛豪塞效应》(thenuclearoverhausereffectinstructuralandconformationalanalysis),第2版,wiley-vch出版社;macomber(1998)《现代nmr光谱学概论》(acompleteintroductiontomodernnmrspectroscopy),wiley-interscience出版社;downing(2004)《蛋白质nmr技术》(proteinnmrtechniques)(分子生物技术(methodsinmolecularbiology),第二版,胡玛纳出版社;clore和gronenborn(1994)《蛋白质的nmr》(nmrofproteins)(分子和结构生物学的主题(topicsinmolecularandstructuralbiology),crc出版社;reid(1997)《蛋白质nmr技术》(proteinnmrtechniques),胡玛纳出版社;krishnaandberliner(2003)《千禧年蛋白质核磁共振》(proteinnmrforthemillenium)(生物磁共振(biologicalmagneticresonance),克吕韦尔学术出版社(kluweracademicpublishers);kiihne和degroot(2001)《生物学中固态nmr的观点》(perspectivesonsolidstatenmrinbiology(结构生物学的关注点(focusonstructuralbiology),1),克吕韦尔学术出版社(kluweracademicpublishers);jones等(1993)《光谱学方法和分析:nmr,质谱法和相关技术》(spectroscopicmethodsandanalyses:nmr,massspectrometry,andrelatedtechniques)(分子生物学方法(methodsinmolecularbiology),第17卷),胡玛纳出版社;goto和kay(2000)curr.opin.struct.biol.10:585;gardner(1998)annu.rev.biophys.biomol.struct.27:357;wüthrich(2003)angew.chem.int.ed.42:3340;bax(1994)curr.opin.struct.biol.4:738;pervushin等(1997)proc.natl.acad.sci.u.s.a.94:12366;fiaux等(2002)nature418:207;fernandez和wider(2003)curr.opin.struct.biol.13:570;ellman等(1992)j.am.chem.soc.114:7959;wider(2000)biotechniques29:1278-1294;pellecchia等(2002)naturerev.drugdiscov.(2002)1:211-219;arora和tamm(2001)curr.opin.struct.biol.11:540-547;flaux等(2002)nature418:207-211;pellecchia等(2001)j.am.chem.soc.123:4633-4634;和pervushin等(1997)proc.natl.acad.sci.usa94:12366-12371。如本文所述,与生物素或生物素类似物结合的生物素结合蛋白或生物素结合蛋白的结构可以直接确定,例如,通过x射线晶体学或nmr光谱,或者可以基于生物素结合蛋白的结构对其结构进行建模。可以鉴定蛋白质的生物素结合位点或其他相关结构域,例如通过与其他生物素结合蛋白的同源性,蛋白质-生物素共复合物的研究,突变生物素结合蛋白的生化分析等。这类建模可以涉及对聚合酶模型的简单视检,例如,使用分子图形软件,诸如rosetta(可在上www.rosettacommons.org获得),pymol查看器(开源,可于万维网上免费获得,网址为www.pymol.org),insightii或discoverystudio2.1(可商购自accelrys,网址为www.accelrys.com/products/discovery-studio)。或者,例如,对生物素结合蛋白或推定的突变蛋白的结合位点复合物进行建模可以涉及计算机辅助对接、分子动力学、自由能最小化和/或类似的计算。在文献中已经很好地描述了这类建模技术;参见,例如,babine和abdel-meguid(编著)(2004)《药物设计中的蛋白质晶体学》(proteincrystallographyindrugdesign),wiley-vch,weinheim;lyne(2002)“基于结构的虚拟筛选概述(structure-basedvirtualscreening:anoverview)”drugdiscov.today7:1047-1055;面向初学者的分子建模,网址为www.usm.maine.edu/~rhodes/spvtut/index.html;以及用于蛋白质模拟和药物设计的方法和方法,网址为www.dddc.ac.cn/embo04;以及本文是参考文献。存在广泛支持这类建模的软件,例如,rosetta,charmm模拟软件包,可以从哈佛大学以学术地方式获得或者商购自accelrys(网址为www.accelrys.com),discover模拟软件包(包括在insightii中,同上)和dynama(可以在网址www.cs.gsu.edu/~cscrwh/progs/progs.html处获得)。另请参见www.dots.netsci.com.org/resources/software/modeling/mmmd/top.html处建模软件的详细列表。蛋白质模型的视检和/或计算分析(包括对处于不同状态的蛋白质模型的可选比较)可以识别生物素结合蛋白的相关特征,包括例如,可以经突变以改变表面电荷的残基。例如,对链霉亲和素模型进行分析鉴定了不与其它链酶亲和素相互作用、未经文献报道提示为影响蛋白质表达、稳定性或生物素亲和力、可经突变以减少净电荷的暴露于溶剂的(solvent-exposed)残基。鉴定为用于减少净电荷的残基包括例如,a2,a22,t53,n69,a104和k121。通过相似标准鉴定为不表现出较小侧链相互作用的残基包括例如,t15,a87,a89,n92,t116和t118。可以经突变以改变净电荷的其他残基包括例如,g3,t19,r40,v42,y47,r90,a106和k119。示例性的取代包括,例如,a2d,a2e,g3d,g3e,t15e,t15d,t19e,t19d,a22e,a22d,r40y,r40e,r40d,v42d,v42e,y47d,y47e,t53d,t53e,n69d,n69e,a87e,a87d,a89d,a89e,r90t,n92e,n92d,a104e,a104d,a106e,a106d,t116d,t116e,t118d,t118e,k119t,k121e和k121d。还可以对这些位置处所有可能的残基进行位点饱和诱变。显而易见的是,通过组合这类突变(以及任选地,共价修饰和/或外源序列,如本文所详述),可以将计算净电荷减少至基本上任何所需水平。作为一些示例,可以在链霉亲和素中采用诸如下述的突变的组合:a2d、a22e、t53d、n69d、a104e和k121e;a2d、t15e、a22e、t53d、n69d、a87e、a89d、n92e、a104e、t116d、t118d和k121e;a2d、t53d和n69d;a22e、a104e和k121e;a2d、a22e、t53d、n69d、a87e、n92e、a104e、t118d和k121e;或a2d、t15e、a22e、t53d、n69d、a87e、a89d、n92e、a104e、t116d、t118d和k121e。还可以采用诱变以引入用于共价修饰的位点。具有反应性侧链的残基(例如,如上所述的赖氨酸、半胱氨酸等)可以在基本上任何期望的位置处引入,例如通过结构分析来鉴定。例如,可以突变为赖氨酸以将修饰位点引入链霉亲和素的残基包括,例如,a2、t15、g21、t29、r40、a50、y70、r90、n92和t116。这类突变的组合允许控制最大数量的可用修饰位点。作为一些示例,可以将诸如下述的突变的组合引入链霉亲和素:g21k和y70k;a2k、r40k和a50k;a2k、g21k、r40k、a50k和y70k;a2k、g21k、r40k、a50k、y70k、r90k、n92k和t116k;和a2k、t15k、g21k、t29k、r40k、a50k、y70k、r90k、n92k和t116k。任选地,使用这样的试剂修饰这类突变链霉亲和素,所述试剂与如上所详述的伯胺反应,例如以引入一个或多个带负电荷的基团。相似地,诱变可以用于去除不需要的修饰位点。例如,在使用与伯胺反应的试剂修饰链霉亲和素的情况中,一个或多个赖氨酸残基可经突变以减少可用于修饰的位点总数。因此,重组链霉亲和素可以在位置k67、k108、k119和/或k121处包括氨基酸取代。示例性的取代包括,例如,k67r、k108r、k119r和k121r。改变电荷并去除修饰位点的其他可能的取代包括,例如,k67e、k67d、k108e、k108d、k119e、k119d、k121d和k121e,以及将赖氨酸突变为不带电荷的残基。位置108处的赖氨酸靠近生物素结合位点。在一些情况中,在不限于任何特定机制的情况下,该残基的共价修饰可以干扰经修饰的链霉亲和素的生物素结合;因此可能需要通过诱变(例如,成为精氨酸)来替代该赖氨酸(k108)。如上所述,在诱变过程中可以避开生物素高亲和力结合所需的残基。然而,在一些应用中,需要较弱的生物素结合(例如,以促进后续从表面或其他实体中去除生物素结合蛋白,其中二价或多价生物素与两个生物素部分(例如,与两个相邻的生物素或双生物素部分)的同时结合可以补偿各个结合事件的亲和力降低等)。在需要较弱的生物素结合的实施方式中,重组链霉亲和素可以包括例如n10、s14、s32、r40、r71、r90和/或d115位置处的氨基酸取代。示例性的取代包括,例如,n10a、n10d、n10e、s14d、s14a、s32a、r40d、r71d、r90d、d115a和d115n。包括n10a、s14d和s32a突变的组合的示例性链霉亲和素展现出非常弱的生物素结合(其kd的量级为mm)。任选地,重组生物素结合蛋白包括对于生物素结合蛋白为外源性或异源性的其他特征。例如,重组生物素任选地包括一个或多个标签,例如,纯化、基材结合或其他标签,诸如聚谷氨酸标签,glu10标签,聚天冬氨酸标签,asp10标签,聚赖氨酸标签,lys10标签,包含天冬氨酸和谷氨酸残基的混合物的标签,多组氨酸标签,his10标签,his6标签,丙氨酸标签,ala10标签,ala16标签,tat融合肽(例如,ygrkkrrqrrr标签;seqidno:27),spytag,spycatcher结构域,snooptag,snoopcatcher结构域,生物素标签,生物素连接酶识别序列或其他生物素连接位点(例如,bitag或btag或其变体,例如,btagv1-11;参见例如,美国专利申请公开号2012-0034602),gst标签,s标签,snap-标签,ha标签,dsb(sso7d)标签,赖氨酸标签,nanotag,cmyc标签,包含氨基酸甘氨酸和丝氨酸的标签或接头,包含氨基酸甘氨酸、丝氨酸、丙氨酸和组氨酸的标签或接头,包含氨基酸甘氨酸、精氨酸、赖氨酸、谷氨酰胺和脯氨酸的标签或接头,多个聚组氨酸标签,多个his10标签,多个his6标签,多个丙氨酸标签,多个ala10标签,多个ala16标签,多个生物素标签,多个gst标签,多个bitag,多个s标签,多个snap-标签,多个ha标签,多个dsb(sso7d)标签,多个赖氨酸标签,多个nanotag,多个cmyc标签,包含氨基酸甘氨酸和丝氨酸的多个标签或接头,包含氨基酸甘氨酸、丝氨酸、丙氨酸和组氨酸的多个标签或接头,包含氨基酸甘氨酸、精氨酸、赖氨酸、谷氨酰胺和脯氨酸的多个标签或接头,生物素,亲和素,抗体或抗体结构域,抗体片段,抗原,受体,受体结构域,受体片段或配体,一个或多个蛋白酶位点(例如,tev蛋白酶)(例如,enlyfqg;seqidno:28),因子xa,肠激酶或凝血酶(例如,lvprgs;seqidno:29)位点),染料,受体,猝灭剂,dna结合结构域(例如,来自拓扑异构酶v的螺旋-发夹-螺旋结构域)或其组合。可以添加初始甲硫氨酸残基以方便重组蛋白的表达。一个或多个外源性或异源性特征不仅可以用于纯化目的等用途,而且还可用于改变生物素结合蛋白的一种或多种性质。例如,引入聚谷氨酸或聚天冬氨酸标签会减少净电荷。又例如,聚赖氨酸标签的引入提供了用于共价修饰的其他位点。一个或多个外源性或异源性特征可以被包括在生物素结合蛋白的内部(例如,其至少一种单体内部,例如,插入到环区域中),在生物素结合蛋白的n-末端区域(例如,其至少一种单体)和/或在生物素结合蛋白的c-末端区域(例如,其至少一种单体)。仅举几个示例,外源性特征可以包括在生物素结合蛋白(例如,其至少一种单体)的n末端和c末端区域,多个内部位点,或单体的末端区域或内部。当生物素结合蛋白在两个或更多个区域(例如,在n-和c-末端区域)包括外源性或异源性特征时,外源性或异源性特征可以相同或不同。任选地,本发明生物素结合蛋白的内部和/或末端区域(例如,n-或c-末端区域)可以包含相同或不同的两个或更多个外源性或异源性特征。本文所述或本领域已知的各种突变、外源性特征和/或共价修饰可以组合在本发明的重组链霉亲和素或其他生物素结合蛋白中。例如,重组链霉亲和素可以包含相对于缺少共价修饰的亲本链霉亲和素使其计算净电荷降低的一个或多个共价修饰,使其净电荷降低的一个或多个突变,和c末端聚谷氨酸尾。又例如,重组链霉亲和素可以包含相对于缺少共价修饰的亲本链霉亲和素使其计算净电荷降低的一个或多个共价修饰,使其净电荷降低的一种或多种突变,引入共价共价位点用于修饰的一个或多个突变,去除不需要的修饰位点的一个或多个突变,影响生物素亲和力的一个或多个突变,和c端聚谷氨酸尾。在一类实施方式中,本发明的重组链霉亲和素包含至少一种单体,其包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一个实施方式中,重组链霉亲和素包含四个单体,其各自包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。任选地,重组链霉亲和素包含氨基酸序列相同的四个单体。在大多数实施方式中,引入生物素结合蛋白的突变不干扰生物素结合活性或使干扰最小化。因此,在一些实施方式中,在相同反应条件下,重组生物素结合蛋白对生物素(或类似物)表现出的kd不超过100倍或不超过10倍于缺少一个或多个突变的亲本蛋白质所表现出的kd。例如,源自seqidno:1的重组链霉亲和素对亲和素(或类似物)可以表现出这样的kd,上述kd不超过100倍或不超过10倍于其四个单体包含seqidno:1的亲本蛋白质所表现出的kd。重组突变的生物素结合蛋白可以用于基本上任何所需应用。例如,重组生物素结合蛋白可用于固定核酸,例如,生物素化核酸或包含该核酸的复合物。在一个示例性类别的实施方式中,重组生物素结合蛋白结合核酸聚合酶,例如,生物素化(例如,双生物素化)聚合酶。任选地,核酸聚合酶与核酸复合。例如,重组生物素结合蛋白可以结合与dna模板复合的dna聚合酶。任选地,重组生物素结合蛋白固定于固体支持物上,例如,其表面被生物素(例如,双生物素)被覆。在对单分子应用特别有用的一类实施方式中,重组生物素结合蛋白固定于纳米级孔的基础上,例如,零模波导(zmw)。任选地,组合物存在于核酸测序系统中,例如,如下所述的dna测序系统中.野生型核心链霉亲和素单体的氨基酸序列以表1中的seqidno:1提供。较少处理的链霉亲和素的序列以seqidno:2提供。表1中还提供了示例性重组链霉亲和素的氨基酸序列以及n-和/或c-末端区域处任选的外源性特征。相对于野生型链霉亲和素(seqidno:1)鉴定了氨基酸取代的位置。本发明的链霉亲和素(包括表1中提供的那些)可以在n-和/或c-末端区域处或单体的内部包含任意外源性或异源性特征(或这些特征的组合)。例如,将理解的是,表1中不包括例如c末端聚谷氨酸标签的链霉亲和素突变体可以经修饰,以在c末端区域处包括聚谷氨酸标签,单独地或与本文所述任何外源性或异源性特征组合。相似地,可以省略表1中所列的一些或全部外源性特征,并且仍然获得本发明的链霉亲和素。表1:示例性链霉亲和素单体的氨基酸序列经修饰的和突变生物素结合蛋白的应用本文所述经修饰和/或突变的生物素结合蛋白特别适合用于诸如连接或固定生物素化组分的应用。本发明的一个方面提供了固体支持物,所述固体支持物上固定了本文所述的生物素结合蛋白,例如,经突变和/或共价经修饰的生物素结合蛋白。可以采用本领域已知的各种固体载体中的任何一种,例如,包含反应区域,任选地纳米级反应区域的基材。表面通常被覆有蛋白质所结合的生物素(例如,双生物素)或生物素类似物。因此,一类实施方式提供了包含至少一个纳米级孔的基材,其中固定了生物素结合蛋白。可以采用本文所述任何经突变和/或修饰的生物素结合蛋白。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。任选地,生物素结合蛋白是四价或二价生物素结合蛋白,例如,链霉亲和素,亲和素,去糖基化亲和素(中性亲和素),川氏亲和素,谭氏亲和素,爪蟾亲和素,布氏亲和素,avr2,avr4,瑞氏亲和素及其变体、突变体、衍生物或同系物。在一类实施方式中,经修饰的生物素结合蛋白包含至少一种单体,其包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一个实施方式中,亲本生物素结合蛋白包含四个单体,其各自包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。例如,生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,三个或多个,12或更多个,24或更多个,30或更多个,45或更多个,甚至60或更多个的共价连接的磺酸盐/酯部分)。例如,生物素结合蛋白可以包含一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分,例如,四个或更多个,10个或更多个,15个或更多个,16或更多个,17或更多个,18或更多个,19或更多个或甚至20个或更多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。上文已经描述了其他示例性修饰。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。上文已经描述了其他示例性突变。任选地,生物素结合蛋白单独包含一个或多个外源性特征,或者除了一个或多个共价修饰和/或突变之外还包含一个或多个外源性特征。例如,在一类实施方式中,生物素结合蛋白在例如至少一个单体的n-或c-末端包含聚谷氨酸、聚天冬氨酸或聚赖氨酸标签。生物素结合蛋白可以用于基本上任何所需感兴趣的分子。例如,生物素结合蛋白可用于固定核酸,例如,生物素化核酸或包含该核酸的复合物。在一个示例性类别的实施方式中,生物素结合蛋白结合核酸聚合酶,例如,生物素化(例如,双生物素化)聚合酶。任选地,聚合酶核酸复合物与生物素结合蛋白结合。例如,生物素结合蛋白可以结合与dna模板复合的生物素化(例如,双生物素化)dna聚合酶。合适的基材在下文描述并且为本领域所已知。示例性的纳米级孔包括例如零模式波导。对于单分子分析,生物素结合蛋白通常固定于纳米级孔的底部上。任选地,仅将孔的底表面生物素化。在一些实施方式中,基材包含至少500,000个纳米级孔,多个纳米级孔包含固定的生物素结合蛋白,例如,至少1,000,000、2,000,000、3,000,000、4,000,000、5,000,000、6,000,000、7,000,000、8,000,000、9,000,000或10,000,000个孔。任选地,基材存在于核酸测序系统中。本发明的相关方面提供了复合物,其包含与至少一个感兴趣的分子,例如生物素化(例如,双生物素化)分子、多肽、核酸、核苷酸、标记物或其他部分结合的本文所述的生物素结合蛋白,例如,经突变和/或共价经修饰的生物素结合蛋白。对于其中可以纳入本发明的任何生物素结合蛋白的包含生物素结合蛋白的示例性核苷酸类似物,参见例如,美国专利号9,062,091和美国专利申请公开号2017/0145495、2017/0145496和2017/0145502(其各自通过引用其全部内容纳入本文)。一个一般类别的实施方式提供了包含生物素结合蛋白和核酸的复合物。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。如上所述,这类带负电的生物素结合蛋白可有利地用于结合并任选地固定核酸(及其复合物),即便预期带高负电的核酸和带负电的生物素结合蛋白之间将会产生显著的静电排斥。核酸可以是例如dna或rna,并且可以是例如单链的或双链的或其组合。核酸可以具有基本上任何所需长度。例如,核酸的长度可以为至少约100个核苷酸,例如,至少500,至少1,000,至少5,000,至少10,000,至少50,000或至少100,000个核苷酸。在一些实施方式中,核酸是这样的dna,其包含长度为至少1kb的双链区域,例如,至少5kb,至少10kb,至少50kb,或至少100kb。任选地,复合物还包含与核酸结合的蛋白质,诸如核酸聚合酶,螺旋酶或外切核酸酶。任选地,蛋白质包含生物素或双生物素标签,蛋白质(并以此使核酸)通过它们结合生物素结合蛋白。在其他实施方式中,核酸经生物素化并直接结合生物素结合蛋白。任选地,生物素结合蛋白是四价或二价生物素结合蛋白,例如,链霉亲和素,亲和素,去糖基化亲和素(中性亲和素),川氏亲和素,谭氏亲和素,爪蟾亲和素,布氏亲和素,avr2,avr4,瑞氏亲和素及其变体、突变体、衍生物或同系物。在一类实施方式中,经修饰的生物素结合蛋白包含至少一种单体,其包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一个实施方式中,亲本生物素结合蛋白包含四个单体,其各自包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。例如,生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,三个或更多个,12或更多个,24或更多个,30或更多个,45或更多个,甚至60或更多个的共价连接的磺酸盐/酯部分)。例如,生物素结合蛋白可以包含一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分,例如,四个或更多个,10个或更多个,15个或更多个,16或更多个,17或更多个,18或更多个,19或更多个或甚至20个或更多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。上文已经描述了其他示例性修饰。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。上文已经描述了其他示例性突变。任选地,生物素结合蛋白单独包含一个或多个外源性特征,或者除了一个或多个共价修饰和/或突变之外还包含一个或多个外源性特征,如上所述。例如,在一类实施方式中,生物素结合蛋白在例如至少一个单体的n-或c-末端包含聚谷氨酸、聚天冬氨酸或聚赖氨酸标签。可以将生物素结合蛋白固定于固体支持物上,例如,纳米级孔的底部上,邻近纳米孔,nanofet上或其附近,阵列内,微球体、珠或其他颗粒上等。通常,将固体支持物的表面生物素化(或被覆有生物素类似物)以方便捕获生物素结合蛋白。任选地,复合物存在于核酸测序系统中。一个一般类别的实施方式提供了包含生物素结合蛋白和核酸聚合酶的复合物。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。在一些实施方式中,聚合酶包含双生物素标签,聚合酶通过该双生物素标签结合生物素结合蛋白。在一些实施方式中,聚合酶包含单个生物素部分,聚合酶通过该单个生物素部分结合生物素结合蛋白。基本上所有上述特征也同样适用于相关的这些实施方式,例如,关于生物素结合蛋白的类型,生物素结合蛋白的共价修饰,生物素结合蛋白中的氨基酸取代,生物素结合蛋白上的外源性特征,固定于固体支持物上,在核酸测序系统中的应用等。本发明的另一个相关方面提供了使用本文所述生物素结合蛋白(例如经突变和/或共价经修饰的生物素结合蛋白)以固定感兴趣的分子(例如,蛋白质、核酸、复合物等)的方法。一个一般类别的实施方式提供了固定核酸的方法。在这些方法中,提供了这样的表面,其包括多个阵列区域,所述阵列区域包含生物素或生物素类似物。该表面暴露于包含核酸和生物素结合蛋白的复合物,其中生物素结合蛋白与生物素或生物素类似物结合,并且因此将复合物固定在阵列区域中。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。合适的阵列区域包括,例如,纳米级孔(例如,zmw),纳米孔和nanofet,例如,如本文所述关于核酸序列确定。在一类实施方式中,复合物固定于纳米级孔的底部。显而易见的是,本文所述各种技术可以彼此分开和/或组合使用和/或与用于将分子加载到本领域已知的阵列区域中的技术中组合使用,例如在美国专利号8,715,930和美国专利申请公开号2017/0136433中所述的那些。核酸可以是例如dna或rna,并且可以是例如单链的或双链的或其组合。核酸可以具有基本上任何所需长度。例如,核酸的长度可以为至少约100个核苷酸,例如,至少500,至少1,000,至少5,000,至少10,000,至少50,000或至少100,000个核苷酸。在一些实施方式中,核酸是这样的dna,其包含长度为至少1kb的双链区域,例如,至少5kb,至少10kb,至少50kb,或至少100kb。任选地,复合物还包含与核酸结合的蛋白质,诸如核酸聚合酶,螺旋酶或外切核酸酶。任选地,蛋白质包含生物素或双生物素标签,蛋白质(并以此使核酸)通过它们结合生物素结合蛋白。在其他实施方式中,核酸经生物素化并直接结合生物素结合蛋白。任选地,生物素结合蛋白是四价或二价生物素结合蛋白,例如,链霉亲和素,亲和素,去糖基化亲和素(中性亲和素),川氏亲和素,谭氏亲和素,爪蟾亲和素,布氏亲和素,avr2,avr4,瑞氏亲和素及其变体、突变体、衍生物或同系物。在一类实施方式中,经修饰的生物素结合蛋白包含至少一种单体,其包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一个实施方式中,亲本生物素结合蛋白包含四个单体,其各自包含与seqidno:1至少70%相同的氨基酸序列,例如至少80%,至少85%,至少90%,至少95%,至少97%或至少98%相同。在一些实施方式中,生物素结合蛋白包含一个或多个共价修饰,相对于缺少所述共价修饰的亲本生物素结合蛋白,所述共价修饰降低所述生物素结合蛋白的计算净电荷。例如,生物素结合蛋白包含一个或多个共价连接的磺酸盐/酯部分,例如,三个或多个,12或更多个,24或更多个,30或更多个,45或更多个,甚至60或更多个的共价连接的磺酸盐/酯部分)。例如,生物素结合蛋白可以包含一个或多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分,例如,四个或更多个,10个或更多个,15个或更多个,16或更多个,17或更多个,18或更多个,19或更多个或甚至20个或更多个共价连接的3,4,5-三(3-磺基丙氧基)苯甲酰基部分。上文已经描述了其他示例性修饰。在一些实施方式中,生物素结合蛋白包含一个或多个氨基酸取代,相对于亲本生物素结合蛋白,所述氨基酸取代降低所述生物素结合蛋白的计算净电荷,例如,用带负电荷的残基替代亲本生物素结合蛋白中带正电荷或不带电荷的残基的一个或多个氨基酸取代。上文已经描述了其他示例性突变。任选地,生物素结合蛋白单独包含一个或多个外源性特征,或者除了一个或多个共价修饰和/或突变之外还包含一个或多个外源性特征,如上所述。例如,在一类实施方式中,生物素结合蛋白在例如至少一个单体的n-或c-末端包含聚谷氨酸、聚天冬氨酸或聚赖氨酸标签。在一类特别有用的实施方式中,将核酸固定以用于确定核苷酸序列(或作为其中的步骤),例如,在本文所述的单分子测序方法中。生物素化的表面可以包含比核酸/生物素结合蛋白复合物理想上所需占据的生物素基团更多的生物素基团。(例如,在一些实施方式中,单一复合物占据单个纳米级孔,例如,阵列中的多个孔。在这类实施方式中,孔的基底的表面上仅一个或两个生物素基团可以结合核酸/生物素结合蛋白复合物)。任选地封闭表面上的任何剩余生物素,例如,通过使表面与游离生物素结合蛋白接触,例如,在将表面暴露与复合物后,和任选地,洗涤或以其他方式去除任何多余的未结合的复合体。在本文中,“游离生物素结合蛋白”指不与核酸复合的生物素结合蛋白;该生物素结合蛋白任选地具有与其结合的不同部分(例如,生物素类似物,淬灭剂,标记物等)。游离生物素结合蛋白可以与复合物中使用的生物素结合蛋白相同或不同。在一些实施方式中,游离生物素结合蛋白比复合物中使用的生物素结合蛋白更紧密地结合生物素。在其他实施方式中,相比复合物中使用的生物素结合蛋白,游离生物素结合蛋白较弱地结合生物素。例如,包含n10a、s14d和s32a突变的链霉亲和素非常弱地结合生物素,并且可以用作游离生物素结合蛋白。本文描述了对生物素亲和力降低的其他生物素结合蛋白(例如,突变链霉亲和素);可以在本领域中找到其他示例。在一类实施方式中,本发明的生物素结合蛋白(例如,经突变和/或共价经修饰的生物素结合蛋白)用于将生物素化的核酸(或其他感兴趣的分子)固定于生物素化的表面上;然后通过游离生物素结合蛋白(例如,本发明的相同生物素结合蛋白,本发明的不同生物素结合蛋白,或本领域已知的野生型或其他生物素结合蛋白)的结合来封闭表面上任何未被占用的生物素基团。在相关方面,基本上任何生物素结合蛋白(例如,本领域已知的多种生物素结合蛋白中的任何一种)可用于将生物素化的核酸(或其他感兴趣的分子)固定于生物素化的表面上;然后通过结合本发明的生物素结合蛋白来封闭表面上任何未被占用的生物素。在另一方面中,本发明的生物素结合蛋白可以用作固定感兴趣分子的辅助物。一个一般类别的实施方式提供了固定感兴趣分子例如聚合酶或核酸(包括聚合酶-核酸复合物)的方法。在这些方法中,感兴趣的分子被固定于表面上(例如,包括多个阵列区域的表面,其中分子被固定于阵列区域中)。基本上可以通过本领域已知的任何技术将分子固定。例如,可以通过与依次固定于表面上的生物素结合蛋白(例如,除了本发明所述那些中的一种)结合将其生物素化和固定,或者可以将其共价连接于表面。本发明的生物素结合蛋白(例如,经突变和/或共价经修饰的生物素结合蛋白)也固定于表面上。任选地,本发明的生物素结合蛋白共价连接感兴趣的分子或与其结合的另一分子(直接或间接地)。在一个示例性实施方式中,如图4所示,与spycatcher结构域融合并带有双生物素标签的聚合酶通过双生物素标签与本发明的生物素结合蛋白(例如,经sg1修饰的链霉亲和素)结合。通过添加生物素可以封闭生物素结合蛋白上的任何其他生物素结合位点。spycatcher结构域与融合另一生物素结合蛋白(例如,或者是野生型链霉亲和素)的spytag反应,上述另一生物素结合蛋白与表面上(例如,在阵列区域中)的生物素结合。核酸可以在基本上任何方便的步骤与聚合酶复合,例如,在添加生物素结合蛋白之前,固定之前,或固定之后。(对于关于spytag/spycatcher和相似的有用的系统如snooptag/snoopcatcher的其他信息,参见例如,zakeri等(2012)“通过工程改造细菌粘附素肽标签形成与蛋白质的快速共价键(peptidetagformingarapidcovalentbondtoaprotein,throughengineeringabacterialadhesin)”procnatlacadsciusa109(12):e690-7,veggiani等(2016)“使用双肽超强胶构建的可编程多聚蛋白质组(programmablepolyproteamsbuiltusingtwinpeptidesuperglues)”procnatlacadsciusa113(5):1202-7,brune等(2017)“dual使用正交反应蛋白进行双抗原免疫的即插即用合成装配(dualplug-and-displaysyntheticassemblyusingorthogonalreactiveproteinsfortwinantigenimmunization)”bioconjugatechem.28:1544-1551,和uspn9,547,003)。在其他实施方式中,本发明的生物素结合蛋白被固定于表面上,其独立于感兴趣的分子。例如,生物素化聚合酶可以通过未修饰的链霉亲和素固定于生物素化表面上,而本发明的生物素结合蛋白(例如,sg1修饰链霉亲和素)也结合生物素化表面(例如,在阵列区域中)。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。基本上所有上述特征也同样适用于相关的这些实施方式,例如,关于表面和阵列区域的类型,生物素结合蛋白的类型,生物素结合蛋白的共价修饰,生物素结合蛋白中的氨基酸取代,生物素结合蛋白上的外源性特征等。一方面中,本发明提供了对核酸模板进行测序的方法。在该方法中,提供了这样的反应混合物,其包含模板,与模板复合或与模板整合的复制起始部分,能够利用所述部分在模板依赖性聚合反应中复制所述模板的至少部分的核酸聚合酶,和一种或多种核苷酸和/或核苷酸类似物。所述模板、复制起始部分和聚合酶中的至少一种通过与本文所述的生物素结合蛋白(例如,经突变和/或共价经修饰的生物素结合蛋白)结合而固定于固体支持物上。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。使反应混合物进行聚合反应,其中聚合酶以模板依赖性方式复制所述模板的至少部分,其中一种或多种核苷酸和/或核苷酸类似物被纳入所得核酸中。鉴定了将一种或多种核苷酸和/或核苷酸类似物纳入所得核酸的时间顺序。该方法中使用的核苷酸类似物可以包含第一类似物和第二类似物(和任选地,第三、第四类似物等),其各自包含不同的荧光标记物。任选地,在鉴定纳入的时间顺序的步骤中,不同的荧光标记物可以彼此区分。任选地,使反应混合物进行聚合反应并鉴定纳入的时间顺序在纳米级反应区域中进行,例如,纳米级孔(例如,zmw)或其他光学可分辨区域(例如,阵列中的膜片(patch)等)或nanofet。任选地,模板是dna模板和/或聚合酶是dna聚合酶。基本上所有上述特征也同样适用于相关的这些实施方式,例如,关于生物素结合蛋白的类型,生物素结合蛋白的共价修饰,生物素结合蛋白中的氨基酸取代,生物素结合蛋白上的外源性特征等。在相关方面中,本发明提供了对制备核酸的方法。在该方法中,提供了这样的反应混合物,其包含模板,与模板复合或与模板整合的复制起始部分,能够利用所述部分在模板依赖性聚合反应中复制所述模板的至少部分的核酸聚合酶,和一种或多种核苷酸和/或核苷酸类似物。所述模板、复制起始部分和聚合酶中的至少一种通过与本文所述的生物素结合蛋白(例如,经突变和/或共价经修饰的生物素结合蛋白)结合而固定于固体支持物上。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。混合物进行反应,因而使聚合酶以模板依赖性方式复制所述模板的至少部分,其中一种或多种核苷酸和/或核苷酸类似物被纳入所得核酸中。任选地,反应混合物在纳米级孔(例如,zmv)中反应。任选地,该方法包括检测核苷酸和/或核苷酸类似物中至少一种的纳入。任选地,模板是dna模板,聚合酶是dna聚合酶,和/或所得核酸是dna。基本上所有上述特征也同样适用于相关的这些实施方式,例如,关于生物素结合蛋白的类型,生物素结合蛋白的共价修饰,生物素结合蛋白中的氨基酸取代,生物素结合蛋白上的外源性特征等。本发明的另一方面提供了用于对使用本文所述生物素结合蛋白的核酸进行测序的系统。一类实施方式提供了用于对核酸进行测序的系统,所述系统包括:芯片,所述芯片包括与其结合的多个聚合酶复合物,其中各聚合酶复合物各自是可光学解析的,并且其中各聚合酶复合物包含聚合酶,模板核酸,和任选地,与所述模板核酸杂交的引物;与表面接触的测序试剂,其包含用于进行核酸合成的试剂,包括一个或多个经标记的核苷酸类似物;照明系统,用于对所述聚合酶复合物进行照明;光学检测系统,用于检测来自所述经标记的核苷酸类似物与所述聚合酶复合物相互作用时的荧光;和计算机,用于分析通过所述检测系统所检测的信号,以确定核苷酸向与所述模板核酸链互补的核酸链的顺序添加。聚合酶复合物通过本文所述的生物素结合蛋白结合芯片,例如,经突变和/或共价经修饰的生物素结合蛋白。在一类实施方式中,生物素结合蛋白在ph7.4具有-10或更低的计算净电荷,例如,-15或更低、-20或更低、-30或更低、-40或更低、-44或更低、-50或更低、-60或更低、-70或更低、或者甚至-80或更低。在一类实施方式中,生物素结合蛋白是重组链霉亲和素,其包含本文是所述的一个或多个氨基酸取代。在一类实施方式中,生物素结合蛋白是经修饰的生物素结合蛋白,其包含一个或多个共价连接的磺酸盐/酯部分。在一类实施方式中,芯片包括多个纳米级反应区域,其包含聚合酶复合物。例如,芯片可以包括多个纳米级反应区域(例如,zmw),其包含聚合酶复合物。任选地,多个纳米级孔包括固定于孔的基底的单一活性聚合酶复合物。任选地,孔的基底经选择性生物素化以方便固定。基本上所有上述特征也同样适用于相关的这些实施方式,例如,关于生物素结合蛋白的类型,生物素结合蛋白的共价修饰,生物素结合蛋白中的氨基酸取代,生物素结合蛋白上的外源性特征等。制备、分离和表征生物素结合蛋白通常,可以通过克隆、重组、体外合成、体外扩增和/或其他可用方法来制备编码本发明生物素结合蛋白的核酸。多种重组方法可以用于表达编码本发明生物素结合蛋白的表达载体。用于制备重组核酸和用于表达和分离表达的产物的方法是为本领域众所周知且描述的。本文描述了许多示例性突变和突变的组合,以及用于设计所需突变的策略。对于突变、重组和体外核酸操纵方法(包括克隆、表达、pcr等)而言其他有用的参考文献包括:sambrook等,《分子克隆-实验室手册》(molecularcloning-alaboratorymanual)(第3版),第1-3卷,冷泉港实验室(coldspringharborlaboratory),纽约州冷泉港,2000(“sambrook”);《分子生物学实验指南》(currentprotocolsinmolecularbiology),f.m.ausubel等编著,实验室指南(currentprotocols),格林出版协会有限公司(greenepublishingassociates,inc.)和约翰韦利父子有限公司(johnwiley&sons,inc.)的合资企业,(增补到2017年)(“ausubel”));《pcr方案:方法和应用指南》(pcrprotocolsaguidetomethodsandapplications)(innis等编著)学术出版社有限公司,加利福尼亚州圣地亚哥(1990)(“innis”);berger和kimmel,《分子克隆技术指南,酶学方法》(guidetomolecularcloningtechniques,methodsinenzymology)第152卷学术出版社有限公司,加利福尼亚州圣地亚哥(berger);kaufman等(2003)生物学和医学分子和细胞方法手册(handbookofmolecularandcellularmethodsinbiologyandmedicine)第二版ceske(编著)crc出版社(kaufman);和《核酸方法手册》(thenucleicacidprotocolshandbook)ralphrapley(编著)(2000)冷泉港,胡玛纳出版社有限公司(rapley);chen等(编著)《pcr克隆方法(第二版)》(pcrcloningprotocols,secondedition)(分子生物学方法(methodsinmolecularbiology),第192卷)胡玛纳出版社;和viljoen等(2005)《分子诊断pcr手册》(moleculardiagnosticpcrhandbook)施普林格出版社(springer),isbn1402034032。此外,可商购获得多种试剂盒用于由细胞纯化质粒或其他相关核酸(参见例如,来自法玛西亚生物技术公司(pharmaciabiotech)的easypreptm和flexipreptm;来自司查塔基公司(stratagene)的stratacleantm;和来自凯杰公司(qiagen)的qiapreptm)。可以进一步操纵任何分离和/或纯化的核酸以产生其他核酸,用于转染细胞,纳入相关载体以感染生物体用于表达等。典型的克隆载体包含转录和翻译终止子,转录和翻译起始序列,和用于调控特定核酸表达的启动子。任选地,载体包含通用表达盒,所述通用表达盒包含至少一个独立的终止子序列,允许该盒在真核生物或原核生物或两者中复制的序列(例如,穿梭载体),和用于原核和真核系统的选择标志物。载体适合在原核生物、真核生物或两者中复制和整合。其他有用的参考文献,例如,用于细胞分离和培养(例如,用于后续核酸分离)包括:freshney(1994)《动物细胞培养:基础技术手册》(cultureofanimalcells,amanualofbasictechnique),第三版,wiley-liss,纽约以及本文所引用的参考文献;payne等(1992)《液体系统中的植物细胞和组织培养》(plantcellandtissuecultureinliquidsystems)约翰韦利父子有限公司,纽约州纽约市;gamborg和phillips(编著)(1995)《植物细胞、组织和器官培养》(plantcell,tissueandorganculture);基本方法施普林格实验室手册(fundamentalmethodsspringerlabmanual),施普林格(springer-verlag)(柏林海德堡纽约(berlinheidelbergnewyork))和atlas和parks(编著)《微生物培养基手册》(thehandbookofmicrobiologicalmedia)(1993)crc出版社,佛罗里达州波卡拉顿。编码本发明重组生物素结合蛋白的核酸也是本发明的特征。特定氨基酸可以通过多个密码子编码,并且某些翻译系统(例如,原核或真核细胞)通常表现出密码子偏倚,例如,不同的生物体通常更喜欢编码相同氨基酸的几种同义密码子之一。因此,本发明的核酸任选地是“密码子优化的”,这表示核酸被合成以包含用于表达生物素结合蛋白的特定翻译系统所优选的密码子。例如,当希望在细菌细胞(或者甚至是细菌的特定菌株)中表达生物素结合蛋白时,为了有效表达蛋白质,可以合成核酸以包含在该细菌细胞的基因组中最常出现的密码子。当希望在真核细胞中表达生物素结合蛋白时,可以采用相似的策略,例如,核酸可以包括该真核细胞优选的密码子。多种蛋白质分离和检测方法是已知的,并且可以用于分离生物素结合蛋白,例如,由表达本发明重组生物素结合蛋白的细胞的重组培养物。多种蛋白质分离和检查方法为本领域所熟知并包括例如,下述参考文献中所示的那些:r.scopes,《蛋白质纯化》(proteinpurification),施普林格出版社,纽约.(1982);deutscher,《酶学方法第182卷:蛋白质纯化指南》(methodsinenzymologyvol.182:guidetoproteinpurification),学术出版社有限公司纽约(1990);sandana(1997)《蛋白质的生物分离》(bioseparationofproteins),学术出版社有限公司;bollag等(1996)《蛋白质方法》(proteinmethods),第二版wiley-liss出版社;walker(1996)《蛋白质方案手册》(theproteinprotocolshandbook)胡玛纳出版社,新泽西州,harris和angal(1990)《蛋白质纯化应用:实用方法》(proteinpurificationapplications:apracticalapproach)位于牛津的irl出版社,英格兰牛津;harris和angal《蛋白质纯化应用:实用方法》(proteinpurificationmethods:apracticalapproach)位于牛津的irl出版社,英格兰牛津;scopes(1993)《蛋白质纯化:原理与实践(第三版)》(proteinpurification:principlesandpractice3rdedition)施普林格出版社,纽约;janson和ryden(1998)《蛋白质纯化:原理、高分辨率方法和应用(第二版)》(proteinpurification:principles,highresolutionmethodsandapplications,secondedition)wiley-vch出版社,纽约;和walker(1998)《cd-rom蛋白质方案》(proteinprotocolsoncd-rom)胡玛纳出版社,新泽西州;以及本文所引用的参考文献。关于蛋白质纯化和检测方法的其他细节可以在satinderahuja编著,《生物分离手册》(handbookofbioseparations),学术出版社(2000)中找到。各种生物素结合蛋白的表达、分离和多聚体形成已经在文献中描述。例如,对于表达链霉亲和素以及对于形成混合的多聚体,参见例如,“在大肠杆菌中表达克隆的链霉亲和素基因(expressionofaclonedstreptavidingeneinescherichiacoli)”procnatlacadsciusa87:142-6和fairhead等(2014)“spyavidin中心能够实现精确且超稳定的正交纳米组装(spyavidinhubsenablepreciseandultrastableorthogonalnanoassembly)”j.am.chem.soc.136:12355–12363。使生物素结合蛋白突变任选地,将各种类型的诱变用于本发明中,例如,以修饰生物素结合蛋白以产生变体,例如,根据如上所述的结构模型和模型预测,或使用随机或半随机突变方法。通常,可以实用任何可用的诱变方法制备生物素结合蛋白突变体。任选地,这类诱变过程包括针对一种或多种感兴趣的活性(例如,生物素结合,固定核酸的能力等)选择突变核酸和多肽。可以使用的操作包括但不限于:定点诱变,随机点诱变,体外或体内同源重组(dna改组和组合重叠pcr),使用含尿嘧啶的模板的诱变,寡核苷酸定向诱变,硫代磷酸修饰的dna诱变,使用代缺口的双链dna的诱变,点错配修复,使用修复缺陷型宿主菌株的诱变,限制性选择和限制纯化,缺失诱变,通过全基因合成的诱变,简并pcr,双链断裂修复,以及本领域技术人员所熟知的许多其他过程。用于突变的起始生物素结合蛋白可以是本文所述或本领域已知的任何生物素结合蛋白,包括可用的链霉亲和素突变,诸如在下述中鉴定的那些:lawrence等(2007)“机械增压蛋白质可以赋予异常的弹性(superchargedproteinscanimpartunusualresilience)”jamchemsoc129:10110-10112和美国专利申请公开号2017/0088592。任选地,可以通过来自天然存在的生物素结合蛋白分子或已知改变或突变的生物素结合蛋白(例如,使用如前述参考文献中所提到的已有突变生物素结合蛋白)的已知信息来指导诱变,例如,如上所讨论的序列、序列比较、物理性质、晶体结构等。然而,在另一类实施方式中,修饰可以基本上是随机的(例如,如在经典或“家族”dna改组中,参见例如,crameri等(1998)“来自不同物种的基因家族的dna改组加速定向进化(dnashufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution)”nature391:288–291)。关于突变形式的其他信息述于sambrook,ausubel和innis,全部引用如上。下述引用的出版物和参考文献内提供了关于突变形式的更多详细信息:arnold,用于异常环境的蛋白质工程改造(proteinengineeringforunusualenvironments),currentopinioninbiotechnology4:450-455(1993);bass等,具有新dna结合特异性的突变trp阻遏物(mutanttrprepressorswithnewdna-bindingspecificities),science242:240-245(1988);bordo和argos(1991)关于定点诱变中“安全”残基取代的建议(suggestionsfor“safe”residuesubstitutionsinsite-directedmutagenesis)217:721-729;botstein和shortle,体外诱变的策略和应用(strategiesandapplicationsofinvitromutagenesis),science229:1193-1201(1985);carter等,使用m13载体的改进寡核苷酸定点诱变(improvedoligonucleotidesite-directedmutagenesisusingm13vectors),nucl.acidsres.13:4431-4443(1985);carter,定点诱变(site-directedmutagenesis),biochem.j.237:1-7(1986);carter,使用m13载体的改进寡核苷酸定向诱变(improvedoligonucleotide-directedmutagenesisusingm13vectors),methodsinenzymol.154:382-403(1987);dale等,使用硫代磷酸方法的寡核苷酸定向随机诱变(oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod),methodsmol.biol.57:369-374(1996);eghtedarzadeh和henikoff,使用寡核苷酸以产生大缺失(useofoligonucleotidestogeneratelargedeletions),nucl.acidsres.14:5115(1986);fritz等,突变的寡核苷酸定向构建:不存在体外酶促反应的带间隔的双链dna过程(oligonucleotide-directedconstructionofmutations:agappedduplexdnaprocedurewithoutenzymaticreactionsinvitro),nucl.acidsres.16:6987-6999(1988);等,通过微型“鸟枪法”基因合成进行寡核苷酸定向诱变(oligonucleotide-directedmutagenesisbymicroscale'shot-gun'genesynthesis),nucl.acidsres.13:3305-3316(1985);hayes(2002)将计算和实验筛选相结合以快速优化蛋白质特性((combiningcomputationalandexperimentalscreeningforrapidoptimizationofproteinproperties)pnas99(25)15926-15931;kunkel,寡核苷酸定向诱变的效率(theefficiencyofoligonucleotidedirectedmutagenesis),载于nucleicacids&molecularbiology(eckstein,f.和lilley,d.m.j.编著,施普林格公司,柏林))(1987);kunkel,无需表型选择的快速且有效的位点特异性诱变(rapidandefficientsite-specificmutagenesiswithoutphenotypicselection),proc.natl.acad.sci.usa82:488-492(1985);kunkel等,无需表型选择的快速有效的位点特异性诱变(rapidandefficientsite-specificmutagenesiswithoutphenotypicselection),methodsinenzymol.154,367-382(1987);kramer等,用于寡核苷酸定向突变构建的带缺口双链dna方法(thegappedduplexdnaapproachtooligonucleotide-directedmutationconstruction),nucl.acidsres.12:9441-9456(1984);kramer和fritz通过带缺口的双链dna寡核苷酸定向构建突变(oligonucleotide-directedconstructionofmutationsviagappedduplexdna),methodsinenzymol.154:350-367(1987);kramer等,点错配修复(pointmismatchrepair),cell38:879-887(1984);kramer等,带缺口的双dna方法中改进的酶促体外反应以寡核苷酸定向构建突变(improvedenzymaticinvitroreactionsinthegappedduplexdnaapproachtooligonucleotide-directedconstructionofmutations),nucl.acidsres.16:7207(1988);ling等,dna诱变方法概述((approachestodnamutagenesis:anoverview),analbiochem.254(2):157-178(1997);lorimer和pastannucleicacidsres.23,3067-8(1995);mandecki,大肠杆菌质粒中寡核苷酸定向双链断裂修复:一种位点特异性诱变的方法(oligonucleotide-directeddouble-strandbreakrepairinplasmidsofescherichiacoli:amethodforsite-specificmutagenesis),proc.natl.acad.sci.usa,83:7177-7181(1986);nakamaye和eckstein,硫代磷酸基团抑制限制性内切酶ncii裂解及其在寡核苷酸定向诱变中的应用(inhibitionofrestrictionendonucleasenciicleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis),nucl.acidsres.14:9679-9698(1986);nambiar等,核糖核酸酶s蛋白编码基因的全合成和克隆(totalsynthesisandcloningofagenecodingfortheribonucleasesprotein),science223:1299-1301(1984);sakamar和khorana,牛杆外段鸟嘌呤核苷酸结合蛋白(转导蛋白)的α-亚基基因的总合成和表达(totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein(transducin)),nucl.acidsres.14:6361-6372(1988);sayers等,基于硫代磷酸的寡核苷酸定向诱变中的y-t外切核酸酶在(y-texonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis),nucl.acidsres.16:791-802(1988);sayers等,溴化乙锭存在下通过与限制性核酸内切酶反应对含硫代磷酸的dna进行链特异性切割(strandspecificcleavageofphosphorothioate-containingdnabyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide),(1988)nucl.acidsres.16:803-814;sieber,等,naturebiotechnology,19:456-460(2001);smith,体外诱变(invitromutagenesis),ann.rev.genet.19:423-462(1985);methodsinenzymol.100:468-500(1983);methodsinenzymol.154:329-350(1987);stemmer,nature370,389-91(1994);taylor等,在限制酶反应中使用硫代磷酸修饰的dna来制备带切口的dna(theuseofphosphorothioate-modifieddnainrestrictionenzymereactionstopreparenickeddna),nucl.acidsres.13:8749-8764(1985);taylor等,使用硫代磷酸酯修饰的dna在高频下快速产生寡核苷酸定向的突变(therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifieddna),nucl.acidsres.13:8765-8787(1985);wells等,氢键形成对稳定枯草杆菌蛋白酶过渡态的重要性(importanceofhydrogen-bondformationinstabilizingthetransitionstateofsubtilisin),phil.trans.r.soc.lond.a317:415-423(1986);wells等,盒诱变:在确定位点产生多重突变的有效方法(cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites),gene34:315-323(1985);zoller和smith,使用m13衍生载体进行寡核苷酸定向诱变:在任何dna片段中产生点突变的高效通用方法(oligonucleotide-directedmutagenesisusingm13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanydnafragment),nucleicacidsres.10:6487-6500(1982);zoller和smith,dna片段的寡核苷酸定向诱变克隆到m13载体中的(oligonucleotide-directedmutagenesisofdnafragmentsclonedintom13vectors),methodsinenzymol.100:468-500(1983);zoller和smith,寡核苷酸定向诱变:一种使用两个寡核苷酸引物和一个单链dna模板的简单方法(oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotideprimersandasingle-strandeddnatemplate),methodsinenzymol.154:329-350(1987);clackson等(1991)“使用噬菌体展示文库制备抗体片段(makingantibodyfragmentsusingphagedisplaylibraries)”nature352:624-628;gibbs等(2001)“简并寡核苷酸基因改组(dogs):一种增强与家族改组的重组频率的方法(degenerateoligonucleotidegeneshuffling(dogs):amethodforenhancingthefrequencyofrecombinationwithfamilyshuffling)”gene271:13-20;和hiraga和arnold(2003)“非序列依赖性定点嵌合发生的一般方法(generalmethodforsequence-independentsite-directedchimeragenesis):j.mol.biol.330:287-296。关于上述方法中多种方法的其他详细信息记载于《酶学第154卷》(enzymologyvolume154)的“方法”中,其还介绍了使用各种诱变方法解决问题的有用对照。确定动力学参数可以筛选或测试本发明的生物素结合蛋白,以确定相较于亲本生物素结合蛋白(例如,由其衍生本发明的重组或经修饰的生物素结合蛋白的相应的野生型或可用的突变生物素结合蛋白),所述生物素结合蛋白是否显示出对生物素或生物素类似物的活性或具有活性。例如,可以确定重组或经修饰的生物素结合蛋白针对生物素(或类似物)的koff、kon和/或kd。在许多实施方式中,对于经修饰的或重组生物素结合蛋白,希望具有高生物素亲和力。在这类实施方式中,在相同反应条件下,经修饰的或重组生物素结合蛋白表现出的kd可以不超过100倍(例如,不超过10倍)于亲本蛋白质所表现出的kd。然而,在其他所述方法中,可以需要较弱的生物素结合亲和力(例如,在需要更容易的可逆生物素结合的情况中)。相似地,在相同反应条件下,经修饰的或重组生物素结合蛋白任选地表现出的koff不超过100倍(例如,不超过10倍)于亲本蛋白质所表现出的koff或者表现出的kon不小于0.01倍(例如,不小于0.1倍)于亲本蛋白质所表现出的kon。可以使用本领域已知的技术例如结合或竞争性结合实验来确定kd、koff和kon。对于结合动力学更详尽的讨论,参见例如berg,tymoczko和stryer(2002)《生物化学(第五版)》(biochemistry,fifthedition),w.h.弗里曼公司(w.h.freeman);克赖顿(1984)《蛋白质结合和分子原则》(proteins:structuresandmolecularprinciples),w.h.弗里曼公司(w.h.freeman);和fersht(1985)《酶结构和机制(第二版)》(enzymestructureandmechanism,secondedition),w.h.弗里曼公司(w.h.freeman)。一方面,将本发明蛋白质的活性与给定的亲本生物素结合蛋白进行比较。例如,在重组链霉亲和素衍生自亲本野生型链霉亲和素的情况中,重组链霉亲和素的生物素结合亲和力(例如,kd、koff或kon)将与野生型链霉亲和素的亲和力进行比较。这类比较是在相同反应条件下进行的,例如,相同浓度的亲本和重组(或经修饰的)生物素结合蛋白,相同生物素浓度,相同溶液条件(ph、盐浓度、二价阳离子的存在等),温度等。虽然前述内容可以用作表征工具,但是绝不旨在将其作为本发明的特定限制反应。筛选生物素结合蛋白筛选或其他方案可用于确定生物素结合蛋白是否显示出所需活性,例如,核酸固定,生物素结合等,任选地,相较于亲本dna生物素结合蛋白。可以检查测序反应(例如,单分子测序反应)中重组或经修饰的生物素结合蛋白的性质,以测试特性,诸如速度、脉冲宽度、脉冲间距离、准确性、读取长度等。在一个所需方面,可以制备重组或经修饰的生物素结合蛋白文库并对这些性质进行筛选。例如,可以制备文库的多个成员以包括一个或多个突变,所述突变改变(例如,降低)净电荷(例如,其中不同成员包括不同的突变或者突变的不同组合),然后可以筛选文库感兴趣的特性(例如,生物素结合,感兴趣的分子固定化的性能,测序性能等)。通常,可以筛选该文库以鉴定至少一个包含感兴趣活性的成员。生物素结合蛋白的文库可以是物理的也可以是逻辑的。而且,可以使用多种文库形式中的任何一种。例如,生物素结合蛋白可以固定于蛋白质阵列中的固体表面上。相似地,可以构建生物素结合蛋白的液相阵列(例如,在微孔板中),用于方便地对包含生物素结合蛋白的溶液进行高通量流体操纵。还可以例如,在微孔板中,或在琼脂板上构建表达重组生物素结合蛋白的细胞的液体、乳液或凝胶相文库。可以产生生物素结合蛋白或生物素结合蛋白结构域(例如,包括活性位点区域或结构域间稳定区域)的噬菌体展示文库。同样,可以使用酵母展示文库。可以在例如本文所引用的sambrook,ausubel和berger中找到制作和使用库的说明。为了生成涉及流体向微量滴定板转移或从微量滴定板转移的文库,任选地使用流体处理站(fluidhandlingstation)。用于进行这类转移的“现成的”几种流体处理站是可商购的,包括例如,来自卡钳生命科学公司(caliperlifesciences)(马萨诸塞州霍浦金顿)的zymate系统,以及利用自动移液器的其他处理站,例如,结合机器人进行板移动(例如,机器人,其可用于各种实验室系统,例如,可获自贝克曼库尔特有限公司(beckmancoulter)(加利福尼亚州富勒顿)。在另一实施方式中,流体处理在微芯片中执行,例如,涉及通过芯片上的微通道将材料从微孔板或其他孔转移到目的地位置(微通道区域、孔、腔室等)。市售可及的微流体系统包括来自下述的那些:惠普/安捷伦科技公司(hewlett-packard/agilenttechnologies)(例如,hp2100生物分析仪)和caliper高通量筛选系统(caliperhighthroughputscreeningsystem)。caliper高通量筛选系统提供了标准微孔文库形式和labchip技术(labchiptechnologies)之间的一个示例接口(interface)。raindancetechnologies的纳米液滴(nanodroplet)平台提供了处理大量空间分离反应的另一种方法。此外,专利和技术文献包括可以与微孔板直接对接以进行流体处理的微流体系统的多个示例。核酸和多肽序列和变体本领域技术人员将理解的是所公开序列的许多变体包括在本发明中。例如,本发明包括产生功能相似序列的公开的序列的保守变异。编码公开的多肽序列的多核苷酸序列被认为包括在本发明中。本发明还包括通过例如标准序列比较技术确定的本文所公开的序列的独特子序列。保守变异由于遗传密码的简并性,“沉默取代”(即,在核酸序列中的取代不导致编码的多肽改变)是编码氨基酸序列的每个核酸序列的隐含特征。相似地,也容易将“保守氨基酸取代”鉴定为与所公开的构建体高度相似的,其中氨基酸序列中的一个或有限数量的氨基酸(除了标明(例如,在表1或本文的其他地方)与该序列感兴趣的特征或特性相关的残基)被具有高度相似性质的不同氨基酸取代。各个公开的序列的这类保守变异是本发明的特征。特定核酸序列的“保守变异”指编码相同或基本相同的氨基酸序列的那些核酸,或者当核酸不编码氨基酸序列时,指基本相同的序列。本领域技术人员将认识到的是使编码的序列中的单个氨基酸或少量氨基酸比例(通常小于5%,更通常小于4%、2%或1%)改变、添加或缺失的各个取代、缺失或添加是“经保守修饰的变异”,其中改变导致氨基酸缺失、氨基酸添加或取代具有化学相似性氨基酸的氨基酸,同时保留相关突变特征(例如,保守取代可以是远离活性位点区域的残基,或者可以是远离域间稳定性区域的残基。因此,本发明所列出的多肽序列的“保守变异”包括使用相同保守取代基团的氨基酸取代多肽序列氨基酸的小百分比,通常小于5%、更通常小于2%或1%。最后,添加不改变核酸分子编码活性的序列是基础核酸或多肽的保守变异,诸如添加非功能性或加标签序列(核酸中的内含子,编码的多肽中的聚his或相似序列等)。提供功能上相似氨基酸的保守取代表为本领域所熟知,其中一个氨基酸残基被具有相似化学性质的另一个氨基酸残基(例如,芳族侧链或带正电的侧链)取代,并因此基本上不改变多肽分子的功能特性。下文列出了包含具有相似化学性质的天然氨基酸的示例性基团,其中基团内的取代是“保守取代”。表2:保守氨基酸取代序列比较、相同性和同源性在述及两个或更多个核酸或多肽序列的上下文中,术语“相同性”或“百分比相同性”指当进行比较并以最大对应性比对时,相同的或具有特定百分比相同氨基酸残基或核苷酸的两个或更多个序列或子序列,如使用下述的序列比较算法之一(或本领域技术人员可用的其他算法)或通过视觉检查所测量。在两个核酸或多肽(例如,编码生物素结合蛋白的dna,或生物素结合蛋白的氨基酸序列)的上下文中,短语“基本相同”指当以最大对应性进行比较和比对时,具有至少约60%、约80%、约85%、约90%、约95%、约98%、约99%或更高核苷酸或氨基酸残基相似性的两个或多个序列或子序列,如使用序列比较算法之或通过视觉检查所测量。这类“基本相同”的序列通常被认为是“同源的”,而没有参考实际祖先。优选地,“基本相同”存在于长度为至少约50个残基的区域,更优选地存在于至少约100个残基的区域,最优选地,序列在至少约150个残基上基本相同的序列,或者待比较的两个序列的全长。当蛋白质和/或蛋白质序列是从共同的祖先蛋白质或蛋白质序列通过天然或人工方式衍生时,它们是“同源的”。相似地,当核酸和/或核酸序列从共同的祖先核酸或核酸序列通过天然或人工方式衍生时,它们是同源的。同源性通常从两个或多个核酸或蛋白质(或其序列)之间的序列相似性推导。用于建立同源性的序列之间的相似性的确切百分比随着所涉及的核酸和蛋白质而变化,但在50、100、150或更多个残基上通常使用少至25%的序列相似性来建立同源性。更高水平的序列相似性,例如,30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、97%、98%或99%或更高,也可用于建立同源性。用于确定序列相似性百分比的方法(例如,使用默认参数的blastp和blastn)在本文中描述并且通常是可用的。对于序列比较和同源性确定,一般将一条序列作为参比序列,测试序列则与之比较。使用序列比较算法时,将测试序列和参比序列输入计算机,视必要指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法根据指定的程序参数计算测试序列相对于参比序列的序列相同性百分数。可以通过例如下述内容进行最优序列比对以便比较,例如smith和waterman的局部同源性算法,adv.appl.math.2:482(1981),通过needleman和wunsch的同源性比对算法,j.mol.biol.48:443(1970),通过pearson和lipman的相似性搜索法,proc.nat’l.acad.sci.usa85:2444(1988),通过计算机执行这些算法(遗传学计算组(geneticscomputergroup)的威斯康星遗传学软件包(wisconsingeneticssoftwarepackage)中的gap、bestfit、fasta和tfasta,威斯康星州麦迪逊科学大道第575号,或通过目测(通常参见,《新编分子生物学实验指南》(currentprotocolsinmolecularbiology),ausubel等编,《实验室指南》(currentprotocols),格林出版协会有限公司和约翰韦利父子有限公司的合资企业,增补到2012年)。适用于确定序列相同性百分比和序列相似性的算法的一个实例是blast算法,其在altschul等,j.mol.biol.215:403-410(1990)中描述。进行blast分析的软件可从国家生物技术信息中心(nationalcenterforbiotechnologyinformation)公开获得。此算法包括:首先通过鉴定查询序列中长度为w的短字来鉴定高评分序列对(hsp),与数据库序列中长度相同的字比对时它们能匹配或满足一些正值的阈值评分t。t称为相邻字评分阈值(altschul等,同上)。这些初始相邻字命中(wordhit)用作启动搜索的种子,以便找到含有它们的较长hsp。然后,沿各序列在两个方向上延伸该字命中,直到提高累积的比对评分。就核苷酸序列而言,采用参数m(一对匹配残基的奖励评分;总是>0)和n(错配残基的罚分;总是<0)计算累积评分。就氨基酸序列而言,用评分矩阵计算累积评分。出现以下情况时中止字命中在各个方向上的延伸:累积比对评分比其最大获得值降低x;由于一个或多个负评分残基比对的累积,累积评分变为零或零以下;或者达到任一序列的末端。blast算法参数w、t和x确定该比对的灵敏度和速度。blastn程序(用于核苷酸序列)采用的默认值如下:字长(w)11,期望值(e)10,截止值100,m=5,n=-4,以及比较两条链。对氨基酸序列而言,blastp程序使用的默认值为:字长3,期望值(e)10,blosum62评分矩阵(参见henikoff和henikoff,(1989)proc.natl.acad.sci.usa89:10915)。除了计算序列相同性百分比,blast算法也对两条序列间的相似性进行统计学分析(参见例如,karlin和altschul(1993)proc.nat’l.acad.sci.usa90:5873-5787)。blast算法提供的一种相似性度量是最小概率和(p(n)),它表明两条核苷酸或氨基酸序列之间偶尔发生匹配的概率。例如,如果测试核酸与参比核酸比较时的最小概率和小于约0.1,更优选小于约0.01,最优选小于约0.001,那么认为该核酸与参比序列相似。模板和其他核酸除非另有说明,否则本公开中描述的本发明的实施可采用有机化学、聚合物技术、分子生物学(包括重组技术)、细胞生物学、生物化学和免疫学的常规技术和描述,其在本领域技术范围内。这类常规技术包括核酸合成、分离和/或操纵,聚合物阵列合成、杂交、连接、噬菌体展示以及使用标记物的杂交检测。合适的技术的具体说明可以参考下文实施例。然而,当然也可使用其它等效的常规操作。可以在标准实验室手册中找到此类常规技术和说明,诸如sambrook等,《分子克隆实验室手册(第3版)》(molecularcloning-alaboratorymanual(3rded.)),卷1-3,冷泉港实验室,纽约州冷泉港,2000,《分子生物学实验指南》(currentprotocolsinmolecularbiology),f.m.ausubel等编著,《实验室指南》(currentprotocols),格林出版协会有限公司和约翰韦利父子有限公司的合资企业(增补到2017年),《基因组分析实验手册系列》(genomeanalysis:alaboratorymanualseries)(第i-iv卷),《使用抗体:实验室手册》(usingantibodies:alaboratorymanual),《细胞:实验室手册》(cells:alaboratorymanual),《pcr引物:实验室手册》(pcrprimer:alaboratorymanual),和《分子克隆:实验手册》(molecularcloning:alaboratorymanual)(均来自冷泉港实验室出版社),stryer,l.(1995)《生物化学》(biochemistry)(第4版)费曼出版社(freeman),纽约,gait,“《寡核苷酸合成:实用方法》(oligonucleotidesynthesis:apracticalapproach)”1984,irl出版社,伦敦,nelson和cox(2000),lehninger,《生物化学原理(第3版)》(principlesofbiochemistry3rded.),wh弗里曼出版社(w.h.freemanpub.),纽约州纽约,和berg等(2002)《生物化学(第5版)》(biochemistry,5thed.),wh弗里曼出版社,纽约州纽约,上述文献均通过引用其全文的方式纳入本文用于所有目的。用于实施本发明的核酸可以是完全或部分双链的或可以是单链的。合适的核酸包括但不限于,smrtbellstm(具有双链中心区和单链发夹末端的环状核酸),双链环状dna分子(例如,带切口或缺口的双链环状dna分子,例如,带切口或带缺口的质粒),长发夹和线性分子(例如,基因组dna片段)。可以使用本领域众所周知的技术由基本上任何所需的样品制备核酸,包括模板核酸。对于环状模板的进一步讨论,包括例如,简单的圆圈和smrtbellstm(具有双链中心区域和单链发夹末端的环形核酸),参见例如,uspn8,236,499“用于核酸样品制备的方法和组合物(methodsandcompositionsfornucleicacidsamplepreparation),”uspn8,153,375“核酸测序的组成和方法(compositionsandmethodsfornucleicacidsequencing),”和travers等(2010)nucl.acidsres.38(15):e159,其各自通过引用纳入本文用于所有目的。本文所述任何方法、组合物、统和复合物都可以包括模板核酸分子,通常作为本文所述聚合酶复合物的部分。通常,模板核酸是(或可以是)在聚合酶反应中合成互补序列的分子。将理解的是,模板序列可以具有任何长度或结构。在一些情况中,模板核酸是线性的;在一些情况中,模板核酸是环形的。模板核酸可以是dna、rna和/或非天然rna或dna类似物。适用于通过聚合酶复制的任何核酸都可以在本文所述的方法和系统中用作模板。在一些实施方式中,用于本发明的方法和组合物中的核酸包含获自样品的核酸。样品可以包含许多物料,包括但不限于,体液(包括但不限于,血液,尿液,血清,淋巴液,唾液,肛门和阴道分泌物,汗液和精液)和几乎任何生物体的细胞,优选哺乳动物样品,并且特别优选人样品;环境样品(包括但不限于,空气,农产品,水和土壤样品);生物战剂样品;研究样品(例如,在核酸的情况中,样品可以是扩增反应的产物,包括靶标和信号扩增,诸如pcr扩增反应;纯化的样品,诸如纯化的基因组dna,rna制剂,原始样品(细菌,病毒,基因组dna等);本领域技术人员将意识到的是实际上可以对样品进行任何实验操作。在其它实施方式中,核酸分子获自样品并经片段化,用于本发明的方法(或在用于本发明的方法之前),例如,作为模板核酸。片段可以是单链的或双链的,并且可以根据本领域已知和本文所述的任何方法进一步修饰。可通过使用本领域已知的任何方法通过对源核酸诸如基因组dna进行片段化来产生核酸片段。在一个实施方式中,在裂解和提取基因组dna期间的剪切力产生所需范围内的片段。本公开还包括利用限制性核酸内切酶进行片段化的方法。将理解的是,可以通过片段化以产生特定大小的片段由源核酸诸如基因组dna生成核酸。例如,核酸的长度可以为约10-约50,000个核苷酸,例如,长度为10-20,000、50-1000、10-100、50-100、50-300、100-200、200-300、50-400、50-600、100-400、200-400、400-500、300-600、400-600、500-600、50-1000、100-1000、200-1000、300-1000、400-1000、500-1000、600-1000、700-1000、700-900、700-800、800-1000、900-1000、200-2000、1500-2000、1750-2000、50-2000、100-25000、200-24000、300-23000、400-22000、500-21000、600-20000、700-19000、800-18000、900-17000、1000-16000、1100-15000、1200-14000、1300-13000、1400-12000、1500-11000、1600-10000、1700-9000、1800-8000、1900-7000、2000-6000、2100-5000、2200-4000、2300-3000、5000-20000、10000-30000、12000-28000、14000-26000、16000-24000、18000-22000或19000-20000个核苷酸。在一些实施方式中,核酸的长度为至少5000、10000、15000、20000、25000、30000、40000、50000、60000、70000、80000、90000、100,000、120,000、130,000、140,000、150,000、200,000、500,000或1,000,000个核苷酸。在一些实施方式中,核酸是聚合酶模板复合物的部分。在一些实施方式中,核酸模板自身与引物进一步杂交。在一些情况中,模板序列可以是线性单链或双链核酸序列。在其他实施方式中,可以提供这样的模板,所述模板为环状或功能性环状构建体,其允许通过合成复合物对相同核酸序列进行冗余处理。在例如2008年7月25日提交的美国专利号7,315,019和美国专利申请号12/220674中已经描述了这类环状构建体的使用,并且替代性功能环状构建体也在美国专利号5,235,300中描述,其各自的全部公开内容通过引用其全部内容纳入本文用于所有目的,并且特别是对于与模板核酸构建体相关的教导。简言之,这类替代性构建体包括模板序列,所述模板序列处理在各末端通过适当的连接寡核苷酸诸如发夹环区段(smrtbellstm)连接的中央双链部分。这样的结构不仅提供重复复制单一分子(并因此对该分子进行测序)的能力,而且还通过复制双链部分的有义和反义部分来提供附加冗余。在测序应用中,这种冗余测序在序列准确性方面提供了很大的优势。在一些方面中,用于本发明的组合物的模板核酸包括:具有第一和第二末端的双链核酸片段;第一发夹寡核苷酸,其在第一末端连接单个模板核酸的每条链;和第二个发夹寡核苷酸,其在第二末端连接单个模板核酸的每条链。在一些实施方式中,第一发夹和第二发夹寡核苷酸是相同的。在其他实施方式中,第一发夹和第二发夹寡核苷酸是不相同的,换言之,尽管模板核酸是备选的环状构建体,但还是不对称的。在其他实施方式中,第一发夹寡核苷酸包括引物结合位点,而第二发夹寡核苷酸包括捕获接头(反之亦然)。捕获衔接子通常是这样的序列,其可以用于富集所选发夹群体,例如,在一些实施方式中,捕获衔接子包含多聚a序列,从而允许使用珠或利用多聚t序列的柱色谱进行捕获。在一些实施方式中,捕获衔接子包含至少一个甲氧基残基。在一些实施方式中,捕获衔接子与连接珠的寡核苷酸互补,其在其他实施方式中可以是磁珠,所述磁珠可以用于富集含有捕获衔接子的模板核酸的群体。在其中模板的群体包括具有不同衔接子的模板或其中各模板在各末端包括不同衔接子的一些实施方式中,可以使用包含与不同衔接子互补的寡核苷酸的不同珠。因此,对于具有两个不同衔接子的模板,可以使用两个不同的珠。对于包含多个不同衔接子的群体,可以使用针对这些衔接子的多种不同类型的珠。在其他实施方式中,同一珠可以包含与模板群体中的不同衔接子互补的不同寡核苷酸,从而使同一珠子可以捕获不同衔接子(及其相关模板)。在一些实施方式中,第一或第二发夹包含自引发(self-primed)衔接子序列,其中引物是衔接子的部分。在这类实施方式中,不需要其他寡核苷酸引物以允许聚合酶分子开始复制模板。在一些实施方式中,核酸模板在一端或另一端仅包含单个发夹。用于本文所述方法和组合物中的聚合酶通常需要引物。虽然在大多数情况中使用寡核苷酸引物,但在某些情况中,蛋白质诸如末端蛋白质可以充当引物。寡核苷酸引物通常与模板核酸的部分互补。引物可包含天然存在的rna或dna寡核苷酸。引物也可以是合成的类似物。引物可具有如上所述的替代性主链。引物还可具有其它修饰,例如包含杂原子、附连标记物(例如染料),或被官能团取代,其将仍允许碱基配对和酶的识别。引物可以选择更紧密的结合引物序列,例如,富含gc序列,也可以采用在其结构内包含可以显示与模板更高亲和力配对的非天然核苷酸或核苷酸类似物(例如,肽核酸(pna)或锁核酸(lna))的引物。还可以通过使用长度、核苷酸含量和/或以上讨论的任何修饰来选择引物以影响聚合酶反应的动力学。在其它实施方式中,采用自引发模板。例如,可以采用包含自引发衔接子的smrtbelltm,如上所述。又例如,可以采用包含至少一个切口或缺口的双链模板(例如,带切口或带缺口的双链质粒)。核酸聚合酶本公开的许多方法和组合物利用聚合酶(在本文中也称为“聚合酶”)。本文所公开的系统和方法可以使用任何合适的聚合酶。合适的聚合酶包括dna依赖性dna聚合酶,dna依赖性rna聚合酶,rna依赖性dna聚合酶(逆转录酶)和rna依赖性rna聚合酶。在某些实施方式中,用于本发明方法和组合物的聚合酶是链置换聚合酶。如本文所进一步详述,当前公开的方法中使用的聚合酶可以包括改善酶的某些特性的修饰,包括持续合成能力(processivity),抗光损伤性和对固定的促进。在某些方面中,用于本文所公开的方法和系统的聚合酶包括接头,基序(例如,生物素连接酶识别序列)或结构域,通过它们,聚合酶(以及与之复合的任何其他分子,诸如模板核酸)可以固定于表面,例如,通过与本发明的生物素结合蛋白的结合。dna聚合酶有时会根据与各种系统的发生关系分为六个主要类别,例如与大肠杆菌poli(a类),大肠杆菌polii(b类),大肠杆菌poliii(c类),真细菌polii(d类),人polβ(x类)和大肠杆菌umuc/dinb和真核rad30/着色性干皮病变体(y类)。对于最近命名的综述,参见例如,burgers等(2001)“真核dna聚合酶:修订命名法的提案(eukaryoticdnapolymerases:proposalforarevisednomenclature)”jbiolchem.276(47):43487-90。对于聚合酶的综述,参见例如,hübscher等(2002)“真核dna聚合酶(eukaryoticdnapolymerases)”annualreviewofbiochemistry第71卷:133-163;alba(2001)“蛋白质家族综述:复制性dna聚合酶(proteinfamilyreview:replicativednapolymerases)”genomebiology2(1):reviews3002.1-3002.4;和steitz(1999)“dna聚合酶:结构多样性和共同机制(dnapolymerases:structuraldiversityandcommonmechanisms)”jbiolchem274:17395-17398。已经确定了许多聚合酶的基本作用机理。数百种聚合酶的序列为公众所及,并且已经确定了许多聚合酶的晶体结构,或者可以基于与同源聚合酶已解析的晶体结构的相似性来推断。例如,可以获得φ29聚合酶的晶体结构。除野生型聚合酶外,还可使用由不同来源的嵌合物(mosaic)制得的嵌合聚合酶。例如,通过考虑来自超过一种亲本聚合酶的序列而制得的φ29聚合酶可以用作突变的起点,以产生本文所述方法中使用的聚合酶。可以制得嵌合体(chimera),例如,使用聚合酶之间的相似性区域的考量来确定用于嵌合体的共有序列,或使用基因改组技术,其中通过可用的基因改组技术对多个φ29相关聚合酶进行随机或半随机改组(例如,经由“家族基因改组(familygeneshuffling)”;参见crameri等(1998)“对来自不同物种的基因家族进行dna改组加速定向进化(dnashufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution)”nature391:288–291;clackson等(1991)“使用噬菌体展示文库制造抗体片段(makingantibodyfragmentsusingphagedisplaylibraries)”nature352:624-628;gibbs等(2001)“简并寡核苷酸基因改组(dogs):提高与家庭改组重组频率的方法(degenerateoligonucleotidegeneshuffling(dogs):amethodforenhancingthefrequencyofrecombinationwithfamilyshuffling)”gene271:13-20;和hiraga和arnold(2003)“非序列依赖性定点嵌合发生的一般方法(generalmethodforsequence-independentsite-directedchimeragenesis)j.mol.biol.330:287-296)。在这些方法中,可以预先确定重组点,以使基因片段以正确的顺序组装。然而,可以随机形成组合,例如嵌合体。例如,使用clarkson等中所述的方法,可以生成5个基因嵌合体,例如,包含phi29聚合酶、pza聚合酶、m2聚合酶、b103聚合酶和ga-1聚合酶的片段。可以将适当的突变引入嵌合体,以改善支化分数,增加闭合复合物稳定性,或改变反应速率常数。已经以各种方式修饰了可用的dna聚合酶,例如,以减少或消除外切核酸酶活性(许多天然dna聚合酶具有校正性(proof-reading)外切核酸酶功能,其会干扰,例如测序应用),从而通过制备蛋白酶消化的酶片段(如klenow片段重组体等)来简化产生。例如,已经修饰了聚合酶,以赋予聚合酶-dna-核苷酸复合物中标记的核苷酸在特异性、持续合成能力和改善的保留时间方面的改善(例如,hanzel等的wo2007/076057用于核苷酸类似物掺入的聚合酶(polymerasesfornucleotideanalogueincorporation)和rank等的wo2008/051530用于增强核酸测序的聚合酶和试剂(polymeraseenzymesandreagentsforenhancednucleicacidsequencing)),以改变分支分数和易位性(美国专利公开号20100075332,题为“工程改造聚合酶以及针对经修饰纳入特征的反应条件(engineeringpolymerasesandreactionconditionsformodifiedincorporationproperties)”),以增加光稳定性(例如,美国专利公开号20100093555,题为“抗光损伤的酶(enzymesresistanttophotodamage)”),并且以改善表面固定化的酶活性(例如,hanzel等的wo2007/075987活性表面偶联的聚合酶(activesurfacecoupledpolymerases)和hanzel等的wo2007/076057用于优化连接表面的蛋白质的活性的蛋白质工程改造策略(proteinengineeringstrategiestooptimizeactivityofsurfaceattachedproteins)。在一些情况中,聚合酶经修饰,从而更有效地纳入所需核苷酸类似物,例如,在其磷酸链中具有四个或更多个磷酸的类似物。突变为更容易接受具有这种性质的核苷酸类似物的酶,例如,描述于上述申请和在us20120034602用于改善单分子测序的重组聚合酶(recombinantpolymerasesforimprovedsinglemoleculesequencing);us20100093555抗光损伤的酶(enzymesresistanttophotodamage);us20110189659产生经修饰的聚合酶用于改善单分子测序的准确性(generationofmodifiedpolymerasesforimprovedaccuracyinsinglemoleculesequencing);us20100112645产生经修饰的聚合酶用于改善单分子测序的准确性(generationofmodifiedpolymerasesforimprovedaccuracyinsinglemoleculesequencing);us2008/0108082用于增强核酸测序的聚合酶和试剂(polymeraseenzymesandreagentsforenhancednucleicacidsequencing);和us20110059505用于核苷酸类似物纳入的聚合酶(polymerasesfornucleotideanalogueincorporation)中。这些参考文献各自通过引用纳入本文用于所有目的。存在许多合适的聚合酶,例如,用于测序、标记和扩增技术。例如,人dna聚合酶β可从r&d系统公司(r&dsystems)获得。dna聚合酶i可从epicenter公司,ge健康护理公司(gehealthcare),英杰公司(invitrogen),新英格兰实验室公司(newenglandbiolabs),普洛麦格公司(promega),罗氏应用科技公司(rocheappliedscience),西格玛奥里奇公司(sigmaaldrich)等获得。dna聚合酶i的klenow片段可以是重组或经蛋白酶消化的信使,来自例如,安碧公司(ambion),chimerx公司,eenzyme有限责任公司,ge健康护理公司(gehealthcare),英杰公司(invitrogen),新英格兰实验室公司(newenglandbiolabs),普洛麦格公司(promega),罗氏应用科技公司(rocheappliedscience),西格玛奥里奇公司(sigmaaldrich)等获得。φ29dna聚合酶可从例如epicentre公司获得。可从这些和其他来源获得多聚a聚合酶,逆转录酶,测序酶(sequenase),sp6dna聚合酶,t4dna聚合酶,t7dna聚合酶和各种热稳定性dna聚合酶(taq、热启动,钛taq等)。当前的商业dna聚合酶包括:获自新英格兰实验室公司的phusiontm高保真dna聚合酶polymerase;获自普洛麦格公司的flexidna聚合酶;获自epicentre生物技术公司(epicentrebiotechnologies)的repliphitmφ29dna聚合酶;获自司查塔基公司(stratagene)的pfuultratm热启动dna聚合酶;获自诺瓦基公司(novagen)的kodhifidna聚合酶;和许多其他商业dna聚合酶。biocompare.com提供了许多不同的商业可及的聚合酶。可以采用的dna聚合酶,例如,在单分子测序或与本发明的方法和组合物联用的其他技术中可以采用的dna聚合酶,包括,例如,taq聚合酶,外切核酸酶缺陷型taq聚合酶,大肠杆菌dna聚合酶1,klenow片段,逆转录酶,φ29相关聚合酶,包括野生型φ29聚合酶和这类聚合酶的衍生物诸如外切核酸酶缺陷型形式,t7dna聚合酶,t5dna聚合酶,rb69聚合酶等。在一个方面中,用于本文所述方法和组合物中的聚合酶是经修饰的φ29型dna聚合酶。例如,经修饰的dna聚合酶可以与野生型或外切核酸酶缺陷型φ29dna聚合酶同源,例如,如美国专利号5,001,050、5,198,543或5,576,204所述。或者,经修饰的重组dna聚合酶可与其它φ29dna聚合酶同源,诸如,b103、ga-1、pza、φ15、bs32、m2y、nf、g1、cp-1、prd1、pze、sf5、cp-5、cp-7、pr4、pr5、pr722、l17、φ21等。关于命名,还参见meijer等.(2001)"φ29噬菌体家族(φ29familyofphages)"microbiologyandmolecularbiologyreviews,65(2):261-287。合适的聚合酶(包括具有构成双生物素标签的两个生物素化位点的聚合酶)描述于例如美国专利申请公开号2007-0196846、2008-0108082、2010-0075332、2010-0093555、2010-0112645、2011-0189659、2012-0034602、2013-0217007、2014-0094374和2014-0094375,其各自通过引用纳入本文用于所有目的。在其他实施方式中,本文所述方法中使用的聚合酶包括rna依赖性dna聚合酶或逆转录酶。合适的逆转录酶包括hiv-1,m-mlv,amv和端粒逆转录酶。逆转录酶还允许对rna底物进行直接测序,诸如信使rna,转移rna,非编码rna,核糖体rna,微小rna或催化rna。许多天然dna聚合酶具有校正性外切核酸酶功能,其可能在利用纳入事件实时观测作为鉴定序列信息的方法(例如单分子测序应用)的过程中产生大量的数据分析问题。即使外切核酸酶活性未在单分子测序中引入这类问题,也可能希望降低外切核酸酶活性,因为这样可以提高准确性(在某些情况下会以读取长度为代价)。因此,用于上述技术的聚合酶任选地包括相对于亲本聚合酶的一个或多个突变(例如,取代,插入和/或缺失),其减少或消除内源性外切核酸酶活性。例如,相对于野生型φ29dna聚合酶,位置n62、d12、e14、t15、h61、d66、d169、k143、y148和h149中的一个或多个任选地突变,以降低重组φ29聚合酶中的外切核酸酶活性。可以降低重组φ29聚合酶中外切核酸酶活性的示例性突变包括,例如,n62d,n62h,d12a,t15i,e14i,e14a,d66a,k143d,d145a和d169a取代,以及在c末端添加外源性特征(例如,多组氨酸标签)。关于野生型φ29聚合酶的序列,参见例如美国专利申请公开号2014/0094375,通过引用其全部内容纳入本文用于所有目的。核苷酸类似物如本文所讨论的,各种聚合酶可以将一个或多个核苷酸类似物纳入正在生长的寡核苷酸链中。纳入后,类似物可在生长的寡核苷酸中留下与天然核苷酸相同或不同的残基(聚合酶可纳入类似物的任何非标准部分,或可在纳入寡核苷酸的过程中将其切割掉)。本文中的“核苷酸类似物”是这样的化合物,所述化合物在特定应用中以与天然存在的三磷酸核苷(“核苷酸”)相似或类似的方式起作用,否则不表示任何特定结构。核苷酸类似物是不同于标准天然存在的核苷酸(即不同于a、g、c、t或u)的类似物,尽管在纳入寡核苷酸后,寡核苷酸中所得残基可以与a、g、c、t或u残基相同(或不同)。许多核苷酸类似物是可用的,并且可以通过聚合酶纳入。这些包括与天然存在的核苷酸具有核心相似性的类似物结构,诸如相对于天然存在的核苷或核苷酸,在核苷或核苷酸的磷酸、糖或碱基部分上包含一个或多个取代基的那些类似物。在一个实施方式中,核苷酸类似物包括三个含磷酸基团;例如,类似物可以是经标记的核苷三磷酸类似物和/或具有三个磷酸基团的α-硫代磷酸核苷酸类似物。在一个实施方式中,相对于核苷三磷酸,核苷酸类似物可包含一个或多个其它含磷酸基团。例如,美国专利申请公开号2007-0072196中详细描述了多种核苷酸类似物,其包含,例如,4-6个或更多个磷酸,通过引用其全部内容将其纳入本文用于所有目的。美国专利7,041,812中描述了其他示例性的有用的类似物,包括四磷酸和五磷酸类似物,通过引用其全部内容将其纳入本文用于所有目的。例如,类似物可包括下式的经标记的化合物:其中b是核碱基(并且任选地包括标记物);s选自糖部分,无环部分或碳环部分(并且任选地包括标记物);l是任选的可检测标签;r1选自o和s;r2、r3和r4独立地选自o,nh,s,亚甲基,取代的亚甲基,c(o),c(ch2),cnh2,ch2ch2和c(oh)ch2r,其中r是4-吡啶或1-咪唑,条件是r4可以另外选自当存在r5、r6、r7、r8、r11和r13时,其各自自独立地选自o、bh3和s;r9、r10和r12独立地选自o,nh,s,亚甲基,取代的亚甲基,cnh2,ch2ch2和c(oh)ch2r,其中r为4-吡啶或1-咪唑。在某些情况中,可以使用膦酸类似物作为类似物,例如,其中r2、r3、r4、r9、r10或r12之一不是o,例如,它们是甲基等。参见,美国专利申请公开号2007-0072196,之前通过引用纳入本文用于所有目的。纳入类似物中的碱基部分通常选自任何天然或非天然核碱基或核碱基类似物,包括例如在核酸中通常发现的嘌呤或嘧啶碱基以及可用的核酸类似物,包括腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶、尿嘧啶,在某些情况中,还包括肌苷。如上所述,碱基任选地包括标记物部分。为了方便起见,通常基于核苷酸和核苷酸类似物与天然存在的核苷酸的相对相似性来表示核苷酸和核苷酸类似物。因此,在功能上起作用的类似物,如三磷酸腺苷,在本文中通常可以用速记字母a来指代。同样,t、g、c、u和i的标准缩写可以用于指代通常以相同方式缩写的天然存在的核苷和核苷酸的类似物。在一些情况下,碱基可以以更通用的方式起作用,例如,像能够与任何嘧啶碱基杂交的任何嘌呤碱基一样起作用,反之亦然。用于本发明的碱基部分可包括本文所述常规碱基,或者它们可包括在一个或多个侧基上取代的这类碱基,或其他荧光碱基或碱基类似物,例如1,n6乙烯腺苷(ethenoadenosine)或吡咯并c,其中其他环结构使b基团既不是嘌呤也不是嘧啶。例如,在某些情况中,可能希望用标记基团或标记基团的组分诸如供体或受体荧光团或其他标记基团取代碱基部分的一个或多个侧基。标记的核碱基和标记这类基团的方法的示例在例如美国专利号5,328,824和5,476,928中有所描述,其各自通过引用其全部内容纳入本文用于所有目的。在类似物中,s基团任选地是糖部分,其提供用于合成核酸链的合适主链。例如,糖基部分任选由一个选定的d-核糖基,2'或3'd-脱氧核糖基,2',3'-d-双脱氧核糖基,2',3'-d-双脱氧核糖基,2'或3'烷氧基核糖基,2'或3'氨基核糖基,2'或3'巯基核糖基,2'或3'烷硫基核糖基,无环,碳环或其他经修饰的糖部分。各种碳环或无环部分可以代替糖部分作为“s”基团纳入,包括例如在美国专利申请公开号2003/0124576中描述的那些,该文献通过引用纳入本文用于所有目的。在大多数情况下,与天然核苷三磷酸一样,类似物中的含磷链,例如常规ntp中的三磷酸,优选与5'羟基偶联。然而,在某些情况中,含磷链通过3'羟基与s基团连接l通常指经由r4(或r10或r12等)基团连接至末端磷原子的可检测标记基团。在本发明的类似物中使用的标记基团可以包含多种可检测标记物中的任何一种。可检测标记物通常表示化学部分,该化学部分提供了用于检测与缺少这类标记基团的相同化合物分开和分离的类似化合物的基础。标记物的示例包括,例如光学标记物,例如,赋予类似物可检测光学性质的标记物,电化学标记物,例如,赋予类似物可检测电或电化学性质标记物,以及物理标记物,例如,赋予类似物不同物理或空间特性的标记物,例如质量标签或分子体积标签。在某些情况中,可以使用赋予本发明类似物多于一种上述性质的单独标记物或组合任选地,纳入类似物中的标记基团包括光学可检测部分,诸如发光,化学发光,荧光,荧光性,发色和/或生色部分,其中荧光和/或荧光性标记物是优选的。容易在核苷酸类似物中采用多种不同的标记物部分。这类基团包括,例如荧光素标记物,若丹明标记,花青标记物(即,通常可从ge健康医疗公司(gehealthcare)的安玛西亚生物科学公司(amershambiosciences)部门购得的cy3、cy5等),以及alexa家族荧光染料以及其他荧光和荧光性染料可以从分子探针公司(molecularprobes)/英杰有限公司(invitrogen,inc.)获得并在“《荧光探针和标记技术指南手册》(thehandbook—aguidetofluorescentprobesandlabelingtechnologies),第11版”(2010)中进行了描述(可从英杰有限公司/分子探针公司获得)。例如,美国专利申请公开号2003/0124576中描述了与核苷多磷酸联用并适用于通过聚合酶纳入的核苷酸类似物的多种其他荧光和荧光性标记物,其先前通过引用其全部内容纳入本文用于所有目的。关于标记物、类似物以及制备这类类似物的方法的其他细节可以在下述内容中找到:美国专利申请公开号2007-0072196,wo2007/041342标记的核苷酸类似物及其用途,wo2009/114182标记的反应物及其用途,美国专利申请公开号2009-0208957单分子测序的替代性标记策略,美国专利申请号13/218412功能化花青染料,美国专利申请号13/218395功能化的花青染料,美国专利申请13/218428花青染料,美国专利申请号13/218382基于支架的聚合酶酶底物,美国专利申请公开号2010-0167299测序应用的磷酸链核苷酸,美国专利申请公开号2010-0152424模块化核苷酸组合物及其用途,美国专利申请号61/599,149具有蛋白屏蔽的聚合酶底物,美国专利申请号13/767,619“具有蛋白质屏蔽的聚合酶底物”,美国专利申请号14/452,497“受保护的荧光试剂化合物”,美国专利号7,968,702和9,062,091,以及美国专利申请公开号2017/0145495、2017/0145496和2017/0145502,将其各自通过引用其全部内容纳入本文用于所有目的。核酸测序本发明的方法、系统和组合物特别适用于单分子测序方法,并且特别是通过实时纳入进行单分子测序,因为本公开内容的方法和组合物提供了在这类方法中增加表面相关核酸/聚合酶复合物存活率的方法。使用本发明的生物素结合蛋白可以将核酸固定到反应区的高密度阵列中。在特定实施方式中,该方法导致加载反应区域的阵列,从而使单个核酸(或与核酸模板和任选的引物复合的单一聚合酶)占据多个反应区域的每一个,从而允许由这些反应区域进行单分子测序。在将核酸分布到阵列区域并固定于阵列区域中之后可以进行序列分析。在一些方面中,本发明包括分析模板核酸的序列的方法。在这类方面中,序列分析在鉴定模板核酸的核酸序列中通常采用模板依赖性合成。采用模板依赖性合成的核酸序列分析鉴定单个碱基或碱基组,因为它们是在模板介导的合成反应(诸如引物延伸反应)中添加的,其中碱基的相同性要求与这样的模板序列互补,该模板序列在合成期间与引物序列杂交。其他这类过程包括连接驱动过程,其中寡核苷酸或多核苷酸与基础模板序列复合,从而鉴定该序列中的核苷酸序列。通常,这类过程使用核酸聚合酶介导,诸如dna聚合酶,rna聚合酶,逆转录酶等,或其他酶,诸如在连接驱动过程的情况下,例如,连接酶。使用模板依赖性合成的序列分析可以包括许多不同的过程。例如,在通过合成过程利用序列的实施方式中,个体核苷酸或核苷酸类似物迭代地被鉴定,因为他们被添加到生长的引物延伸产物中。对于依赖于监测核苷酸向由复合物合成的正在生长的新生链中的纳入的测序过程中,通过这些步骤进行反应的过程可能非常重要。具体地,对于某些“实时”核苷酸纳入监测过程,基于在核苷酸最终纳入引物延伸产物期间将核苷酸纳入并保留在合成复合物中的时间量,改善了纳入事件的可检测性。举例来说,在某些示例性过程中,在核苷酸处于合成复合物中时通过使用利用产生特征信号的交互式标记技术,或通过对合成复合物的集中观察,来检测合成复合物中核苷酸的存在。参见,例如,levene等,science299:682-686,2003年1月,和eid,j。等,science,323(5910),133-138(2009),其公开内容通过引用其全文的方式纳入本文用于所有目的。在一些方面,本发明的方法包括来自本领域已知的任何单分子测序方法的步骤。参见,例如,rigler等,“单分子水平的dna测序(dna-sequencingatthesinglemoleculelevel)”,journalofbiotechnology,86(3):161(2001);goodwin,p.m.,等,单分子检测在dna测序中的应用(applicationofsinglemoleculedetectiontodnasequencing).nucleosides&nucleotides,16(5-6):543-550(1997);howorka,s.,等,使用工程改造的纳米孔对单个dna链进行序列特异性检测(sequence-specificdetectionofindividualdnastrandsusingengineerednanopores,naturebiotechnology,19(7):636-639(2001);meller,a.,等,单多核苷酸分子之间的快速纳米孔鉴别(rapidnanoporediscriminationbetweensinglepolynucleotidemolecules,proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica,97(3):1079-1084(2000);driscoll,r.j.,等,使用扫描隧道显微镜对dna进行原子尺度成像(atomic-scaleimagingofdnausingscanningtunnelingmicroscopy).nature,346(6281):294-296(1990)。在一些实施方式中,本领域已知的单分子测序方法包括在将个体核苷酸纳入引发的模板中时检测个体核苷酸,即通过合成测序。这类方法通常利用外切核酸酶顺序释放单个荧光标记的碱基,作为dna聚合酶形成完整互补链后的第二步。参见nucleos,goodwin等,“单分子检测在dna测序中的应用(applicationofsinglemoleculedetectiontodnasequencing)”,nucleos.nucleot.16:543-550(1997)。通常,对于利用本发明的组合物的测序方法,在支持物分开的离散区域内提供了个体聚合酶组合物。例如,在某些情况中,可以在个体限制结构内提供个体复合物,包括纳米级结构,例如纳米级孔。在另外的示例中,零模波导核心或本文讨论的任何反应区域用作利用本发明的组合物的测序方法的反应区域。在例如公开的国际专利申请号wo2007/123763中描述了用于将单个复合物固定在其中的方法和波导的示例,将其全部公开内容通过引用七千全部内容纳入本文用于所有目的,特别是对于与将个体复合物提供给个体约束结构所有相关的教导。在一些情况中,可以将核酸(例如,聚合酶/模板复合物)提供于允许电子单分子测序的结构或区域上或附近。这类结构可以包括纳米级电子结构,如电极、电容器或场效应换能器(nanofet)。纳米fet包括具有碳纳米管门控的那些。这类结构及其在单分子测序中的用途描述于例如美国专利申请公开号2015/0065353中,通过引用其全部内容将其纳入本文用于所有目的,并且特别是对于与用于单分子测序中的结构相关的教导。通过聚合酶纳入经标记的核苷酸类似物能够用于各种不同的核酸分析中,包括实时监测dna聚合。标记物本身可以被纳入,或更优选地,可以在纳入类似物的过程中释放。例如,可以通过在由聚合酶纳入类似物的过程期间监测标记物释放来实时监测类似物的纳入。纳入的类似物部分可以与天然核苷酸相同,或可以包括与天然核苷酸不同的类似物的特征。通常,标记物纳入或释放可用于指示正在生长的核酸链的存在和组成,例如,提供模板复制/扩增和/或模板序列的证据。来自纳入的信号转导可以是检测由纳入的类似物释放的标记基团的结果,例如,在固相分析中,或者可以在纳入反应中产生。例如,在其中结合的标记物被淬灭而游离的标记没有被淬灭的fret标记物的情况中,由纳入的类似物释放标记物基团可以产生荧光信号。或者,可以用邻近活性位点的fret对中的一个成员标记酶,并且纳入带有另一成员的类似物将在纳入时允许能量转移。描述了在核酸测序应用中使用的酶结合的fret组件,例如,在美国专利申请公开号2003/0044781中,其通过引用纳入本文在一个感兴趣的示例反应中,可以在非常小的观察体积内单独进行聚合酶反应,所述非常小的观察体积可以有效地观察单个聚合酶分子。因此,纳入事件提供了易于与非纳入的核苷酸类似物区分开的纳入核苷酸类似物的观察。在一个优选的方面中,通过将聚合酶固定在光学装置诸如零模波导(zmw)内来提供这类小观察体积。对于zmw及其在单分子分析中应用的描述,特别是核酸测序,参见,例如,美国专利申请公开号2003/0044781和美国专利号6,917,726,其各自通过引用其全部内容纳入本文用于所有目的。另见levene等。(2003)“用于以高浓度单分子分析的零模式波导(zero-modewaveguidesforsingle-moleculeanalysisathighconcentrations)”,science299:682-686,eid等(2009)“来自单聚合酶分子的实时dna测序(real-timednasequencingfromsinglepolymerasemolecules)”science323:133-138,和美国专利号7,056,676、7,056,661、7,052,847和7,033,764,其全部公开内容通过引用其全部内容纳入本文用于所有目的。通常,在一个或多个核苷酸和/或一个或多个核苷酸类似物存在的情况下,聚合酶与模板链复合。例如,在某些实施方式中,存在经标记的类似物,其代表四个天然核苷酸a、t、g和c中各自的类似化合物,例如在分开的聚合酶反应中,如在经典的桑格测序中,或将其多重化,例如,在单一反应中,如在多重测序方法中。当模板酶链中的特定碱基在聚合反应期间遇到聚合酶,其与可用的类似物复合,所述可用的类似物与这类核苷酸互补,并且将该类似物纳入新生和生长中的核酸链中。在一个方面中,纳入可以导致例如在多磷酸类似物中释放标记物,类似物中α和β磷原子之间裂解,并因此释放标记基团(或其部分)。可以通过在复合物中较长时间存在类似物和因此所得的标记物来检测纳入事件,或者可以通过将标记物基团释放到周围介质中来检测纳入事件。在对各种类型的类似物使用不同的标记基团(例如a、t、g或c)的情况下,鉴定纳入的类似物的标记物能够鉴定该类似物,并因此确定模板链中的互补核苷酸在当时已被处理。顺序反应(sequentialreaction)和监测允许实时监测聚合反应并确定模板核酸的序列。如上所述,在特别优选的方面,聚合酶/模板复合物以固定在光学限制区域内的方式提供,该光学限制区域允许观察个体复合物,例如,零模波导。有关实时进行单分子测序监测磷酸标记的类似物纳入的其他信息,参见例如,eid等(2009)“从单个聚合酶分子进行实时dna测序(real-timednasequencingfromsinglepolymerasemolecules)”science323:133-138。在第一示例性技术中,提供了固定在观察区域内的核酸合成复合物,其包括聚合酶、模板序列和互补引物序列,该观察区域允许光照和观测包含复合物的小体积,而无需对周围体积进行过度光照。通过仅照亮并观察复合物周围的体积,可以很容易地鉴定出在合成过程中纳入的荧光标记核苷酸,因为这类核苷酸被聚合酶保留在该观察体积内的时间比那些简单随机扩散进行并离开该体积的核苷酸更长。具体地,核苷酸通过聚合酶纳入dna时,其在观察体积内保留了较长的时间,并且在持续的光照下产生了延长的荧光信号。相比之下,随机扩散且未纳入的核苷酸会在观察体积内保留更短的时间,并因此仅产生瞬态信号,它们中的许多因持续时间极短而未被检测到。在特别优选的示例性系统中,通过使用称为零模波导(zmw)的光学限制孔径的阵列来提供限制性光照体积。参见例如,美国专利号6,917,726,通过引用其全部内容纳入本文用于所有目的。对于测序应用,通常将dna聚合酶固定在zmw的底部,虽然复合物的另一种组分(例如,引物或模板)任选地固定在zmw的底部以定位复合物。参见例如,korlach等(2008)pnasu.s.a.105(4):1176-1181和美国专利申请公开号2008/0081670,其各自通过引用其全部内容纳入本文用于所有目的。在操作中,荧光标记的核苷酸(例如,对应于a、c、g和t的类似物)在末端磷酸部分上带有一个或多个荧光染料基团,所述末端磷酸部分在纳入时从核苷酸被切割。因此,合成的核酸不带有荧光标记物的积累,因为在纳入相关核苷酸后,标记的多磷酸基团从复合物中扩散开,这样的标记物也不干扰纳入事件。参见,例如,korlach等(2008)nucleosides,nucleotides和nucleicacids27:1072-1083。在第二种示例性技术中,固定化的复合物和待纳入的核苷酸各自以具有相互作用的标记组分的形式提供。在纳入后,使核苷酸携带的标记组分与复杂携带的(或复杂的近端的)标记组分充分接近,以使这些组分产生特征性信号事件。例如,可以向聚合酶提供荧光团,所述荧光团向适当的受体荧光团提供荧光共振能量转移(fret)。这些受体荧光团提供在待纳入的核苷酸上,其中各种类型的核苷酸带有不同的受体荧光团,例如,提供不同的荧光信号。纳入后,使得供体和受体充分接近以产生能量转移信号。通过在不同类型的核苷酸上提供不同的受体标记物,可以在纳入发生时获得针对各类核苷酸纳入的基于特征性fret的荧光信号。在相关方面中,核苷酸类似物可以包括以供体/猝灭剂对起作用的两个相互作用的荧光团,其中一个成员存在于核苷酸的核碱基或其他保留部分上,而另一成员存在于磷酸基团或在纳入后释放的核苷酸的其他部分,例如,末端磷酸基团。在纳入前,供体和猝灭剂在相同的类似物上足够近以提供特征性信号猝灭。在纳入和切割末端磷酸基团后,例如,带有供体荧光团,将淬灭去除,并且可以观测所得特征性荧光信号。在利用前述过程中,在纳入反应发生得太快的情况下,可能导致未经检测的纳入事件,即事件速度超过监视系统的检测速度。纳入的核苷酸的漏检可能导致序列确定中错误比率增加,如在真实序列中的遗漏。为了减小由于短反应或产物释放次数(productreleasetimes)而导致的错过脉冲的可能性,在一方面中,本发明可能会导致纳入循环期间的反应和/或产物释放次数增加。相似地,非常短的脉冲间距离有时会导致脉冲合并。采用反应速率降低的聚合酶的优点是较长的、可检测的结合事件频率的增加,所述聚合酶例如是表现出速率降低和/或两步动力学的那些,如美国专利申请公开2009-0286245和2010-0112645中所述。该优点也可以看作是更长、可检测脉冲与较短、不可检测脉冲的比率增加,其中脉冲表示结合事件。测序方法,例如,使用上述底物和本发明的组合物的测序方法通常是在荧光光学系统的背景下开发的,该荧光光学系统能够照亮底物上的各种复合物,并获得、检测和分别记录来自这些复合物的荧光信号。这类系统通常采用一个或多个光照源,其为使用的标记物提供适当波长的激发光。光学系统(opticaltrain)将激发光引导至一个或多个反应区域,并收集发出的荧光信号并将其定向至适当的一个或多个检测器。光学系统的其他组件可以提供:分离光谱不同的信号,例如由不同的荧光标记物,以及将这些分离的信号的方向定向至单个检测器的不同部分或不同检测器。其他组件可以提供光信号的空间过滤,将激发光和/发射光与底物之间的聚焦和方向。在lundquist等的美国专利申请就no.2007-0036511、opticsletters,第1卷,第2期,中也描述了示例性系统。33,第9期,第1026-1028页,其全部公开内容通过引用纳入本文用于所有目的。荧光反射光学系统可以用于本发明的系统的应用中。关于这类系统的优势的讨论,参见例如,美国专利申请号11/704,689(2007年2月9日提交),11/483,413(2006年7月7日提交)和11/704,733(2007年2月9日提交),其全部公开内容通过引用其全部内容纳入本文用于所有目的。在本文描述的核酸测序方法的上下文中,将理解的是,信号源各自代表测序反应,并且特别是聚合酶介导的模板依赖性引物延伸反应,其中在优选方面,各碱基纳入事件导致纳入的四个差异性标记的核苷酸之一的光照(或定位)延长,从而产生带有可分辨光谱图或颜色的可识别脉冲(峰值)。在其他实施方式中,本发明的方法和组合物被用于利用纳米孔的测序方法中。在示例性的实施方式中,将单个核酸加载到多个纳米孔的每一个中。在某些实施方式中,核酸链接在纳米孔附近。应当理解的是,解旋酶和/或外切核酸酶以及聚合酶可用于纳米孔测序。这些酶与核酸的复合物可如本文所详述的加载到纳米孔,并且复合物的核酸或酶组分可以连接到纳米孔或邻近纳米孔。纳米孔测序的方法是本领域已知的,并且述于美国专利公开号2013/0327644和2014/0051068,因此将其通过引用纳入本文用于所有目的,特别与纳米孔测序有关的所有教导、书面说明、附图和图例。本文所述的方法可以进一步包括计算机实施的处理,和/或并入到计算机可读介质中指导这类处理的软件,如下述所更详细地阐述。因此,由上述反应和光学系统所产生的信号数据输入或以其他方式接收到计算机或其他数据处理器中,并进行下述各种处理步骤或组件中的一个或多个。一旦执行这些处理,可以以实体或可观察形式产生计算机实施的处理的结果输出,例如,以用户可读报告的形式打印,在计算机显示器上显示,或者可以将其存储在一个或多个数据库中用于后续评估、处理、报告等,或者可以将其保留在计算机中或传输到其他计算机以用于配置后续反应或数据处理。用于进行本发明过程的计算机可以包括从个人计算机,诸如运行intel四核处理器的pc或类型的计算机,到运行unix、linux、或其他操作系统的工作站、实验室设备或高速服务器。本发明的逻辑处理可以完全由执行软件和/或固件逻辑指令的通用逻辑处理器(例如,cpu)执行;或完全由并入实验室或诊断系统或照相机系统中的专用逻辑处理电路(例如asic)组成,其中还可以包括软件或固件元素;或通过通用逻辑电路和专用逻辑电路的组合。信号数据的数据形式可以包括任何方便的格式,包括基于数字图像的数据格式,例如jpeg,gif,bmp,tiff或其他方便的格式,也可以采用基于视频的格式,如avi,mpeg,mov,rmv或其他视频格式。本发明的软件过程通常可以以各种编程语言来编程,包括例如matlab,c,c++,c#,net,visualbasic,python,java,cgi等。在一些情况中,本发明的组合物、方法和系统可以用作集成测序系统下的一部分,例如,如us20120014837集成光照分析系统(illuminationofintegratedanalyticalsystems),us20120021525光学收集和检测系统和方法(opticscollectionanddetectionsystemandmethod),us20120019828集成分析系统和方法(integratedanalyticalsystemandmethod),2012年6月17日提交的61/660776用于生产集成分析装置的阵列和方法(arraysofintegratedanalyticaldevicesandmethodsforproduction),us20130338010和us20120085894基材和光学系统及其使用方法(substratesandopticalsystemsandmethodsofusethereof),将其通过引用纳入本文所有目的。在某些实施方式中,本文所述的测序组合物将全部或部分以试剂盒形式提供,使得人们能够进行本文所述的方法。这类试剂盒通常将包含反应复合物的一种或多种组分,如聚合酶和引物序列。这类试剂盒通常还将包括生物素结合蛋白,缓冲液和用于加载聚合酶和/或模板的试剂,如在本文所述的方法中。试剂盒还将任选地包括用于根据本文所述的那些方法进行测序应用的其他组分。具体地,这类试剂盒可以包括用于观测本文所述个体反应复合物的zmw阵列基材。在其他示例性实施方式中,本公开的试剂盒包括(单独的或与试剂盒的上述组分组合)用于本文所述加载方法的组分。这类组分可以包括下述一种或多种的任何组合:至少一种本文所述的生物素结合蛋白,核酸浓缩剂(例如,在制备好的溶液中),用于覆盖表面的标准缓冲液,聚合酶,核酸酸模板,引物序列,磁珠或用于加载核酸的其他颗粒,和与将聚合酶组合物加载至表面和/或进行测序反应相关的本文所述的任何其他组合物。试剂盒通常将包括用于进行所需方法的说明书,如本文中也描述或引用的,例如,用于固定核酸和/或通过纳入反应进行序列。基材和表面在本发明的方法中使用的基材是本领域已知的并且在本文中讨论,并且应当理解的是,本文讨论的任何基材可以以任何组合用于本文讨论的任何实施方式。在示例性实施方式中,本发明的方法利用这样的基材,所述基材包括以阵列或插入基材物质的形式排列的一个或多个反应区域(在本文中也称为“阵列区域”),其在本文中也称为“固体支持物”或“表面”,其允许在限定的空间内(例如,在测序反应,结合反应等中)组合反应物。阵列可以是规则的或不规则的,例如随机的。基材和阵列区域还可以允许检测,例如测序反应事件的检测。如上所述,可以将核酸或聚合酶复合物沉积在反应区域中,从而可以独立地光学观察单个核酸(或聚合酶反应)。反应区域可以是基材材料上的局部区域,其促进反应物的相互作用,例如在核酸测序反应中。在某些实施方式中,反应区域可以是纳米级孔(在本文中也称为纳米孔),并且在其他实施方式中,纳米孔是zmw。纳米级孔通常具有纳米范围内的尺寸,即小于1微米。在一些实施方式中,纳米级孔的横截面直径小于1000、900、800、700、600或500nm,例如小于400、350、300、250或200nm。在一些实施例中,纳米级孔的深度小于1000、900、800、700、600或500nm,例如小于400、350、300、250或200nm。如本文中所讨论的,在一些实施方式中,本发明所考虑的测序反应可以串联形式在许多单个核酸样品上发生,特别是对许多核酸样品同时进行测序,例如衍生自基因组和染色体dna。因此,本发明的装置可以包括具有足够数量的阵列区域/反应区域的阵列,以进行如此众多的单独测序反应。在一实施方式中,阵列包括至少1,000个反应区域。在其他实施方式中,阵列包括超过400,000个反应区域,优选在400,000至20,000,000个反应区域。在一个更优选的实施方式中,阵列包含1,000,000至16,000,000个反应区域,例如,1,000,000、2,000,000、3,000,000、4,000,000、5,000,000、6,000,000、7,000,000、8,000,000、9,000,000或10,000,000个反应区域。阵列上的反应区域在基材材料中可以采取腔室或孔的形式,具有宽度和深度,可以在其中沉积反应物。一种或多种反应物通常结合反应区域中的基材材料上,而其余的反应物在介质中,其促进反应并流过或接触反应区域。当形成为腔室或孔时,腔室优选具有足够的尺寸和顺序,以允许(i)将必要的反应物引入到腔室中,(ii)在腔室内发生反应,和(iii)抑制腔室之间反应物的混合。孔或腔室的形状优选地是圆形或圆柱形,但是可以是多边的,从而近似圆形或圆柱形。在另一个实施方式中,孔或腔室的形状基本为六边形。腔室可以具有光滑的壁表面。在另一实施方式中,腔室可具有至少一个不规则的壁表面。腔室可以具有例如平坦的底部或凹入的底部。在某些情况中,反应区域可以采取纳米孔的形式。这类反应区域包括纳米孔阵列在本领域中是已知的,并且在例如在美国专利公开号2013/0327644和2014/0051068号中描述,将其通过引用纳入本文用于所有目的,特别是对于与纳米孔阵列有关的所有教导。只要表面允许核酸或聚合酶复合物的稳定连接并任选地检测核苷酸纳入,任何材料都可用作固体支持材料。固体载体材料可以是平面的或可以是空化的,例如,在光纤的空化末端,或经蚀刻、模制或以其他方式微加工到平坦表面的微孔,例如,使用在微机电系统的构造中通常使用的技术。参见,例如,rai-choudhury,《显微成像、显微加工和微细加工手册第一卷:显微成像》(handbookofmicrolithography,micromachining,andmicrofabrication,volume1:microlithography),第pm39卷,spie出版社(1997);madou,crc出版社(1997),aoki,biotech.histochem.67:98-9(1992);kane等,biomaterials.20:2363-76(1999);zhu等,nat.genet.26:283-9(2000)。在一些实施方式中,固体支持物是光学透明的,例如玻璃。合适的基材包括具有纳米级孔或零模波导阵列的芯片。示例性基材包括在基于二氧化硅的层上具有金属或金属氧化物层的基材,其中纳米级孔设置成穿过金属或金属氧化物层到达或进入基于二氧化硅的层。这类基材述于,例如,美国专利申请号10/259,268,14/187,198,14/107,730,13/920,037,和美国专利号8,994,946,8,906,670,8,993,307,8,802,600,7,907,800和7,302,146,将其通过引用纳入本文用于所有目的,特别是对于与基材有关的所有教导。描述了这类基材(例如,空的底物)的生物素化,例如,美国专利号7,763,423和8,802,600以及美国专利申请公开号2017-0184580(将其通过引用纳入本文用于所有目的),核酸、聚合酶和其他分子在这类底物上的加载和固定也是如此。实施例应理解,本文所述的实施例和实施方式仅用于说明目的,本领域技术人员应了解据此作出的各种修饰或改变,且它们包括在本申请的主旨和权益以及所附权利要求书的范围内。因此,提供以下实施例以说明而非限制所要求的发明。实施例1:链霉亲和素的sg1修饰用sg1修饰的链霉亲和素(例如,野生型或突变型)如图1a所示。将sg1-nhs在二甲基乙酰胺中(100mm,75-100当量)的冰冷溶液添加到链霉亲和素(0.5-1mm,1当量)在0.2m碳酸氢钠中的冰冷溶液中,目标为最终有机/水性比为约0.5。将该混合物在0℃下保持3-7天。通过使用5-20mlgeqsepharosehp柱的阴离子交换色谱法纯化产物。使用膜过滤浓缩包含所需的sg1修饰的链霉亲和素的级分。实施例2:链霉亲和素的琥珀酰化链霉亲和素经琥珀酰化如图2所示。将琥珀酸酐在二甲基乙酰胺中的冰冷溶液(200mm,100当量)添加到在链霉亲和素(1.4mm,1当量)在0.2m碳酸氢钠中的冰冷溶液中,目标为最终有机/水性比约为0.7。将混合物在0℃保持过夜。通过使用5-20mlgeqsepharosehp柱的阴离子交换色谱法纯化产物。使用膜过滤浓缩包含所需的琥珀酰化链霉亲和素的级分。实施例3:链霉亲和素的两步点击修饰如图3所示,使用实施例1中所述的操作制备sgc修饰的链霉亲和素,但是由链霉亲和素和sgc-nhs开始,而不是sg1-nhs。所得经sgc修饰的链霉亲和素(0.6mm,1当量)的叠氮基在室温下与sg1-bcn(73.5当量)进一步反应过夜。通过使用5mlgeqsepharosehp柱的阴离子交换色谱法纯化产物。使用膜过滤浓缩包含所需的sg1点击的sgc-链霉亲和素的级分。实施例4:使用经修饰的链霉亲和素固定聚合酶/核酸复合物用于单分子测序以下陈述了一系列实验,这些实验证明了使用经修饰的和/或突变的链霉亲和素固定聚合酶-核酸复合物可以在单分子测序中带来优势,包括阅读长度增加。在不限于任何特定机制的情况下,认为经修饰和/或突变的链霉亲和素的使用改善了表面相关聚合酶的存活。用链霉亲和素配制聚合酶克隆和纯化包含两个生物素标签序列的突变φ29聚合酶(例如,基本上如美国专利号9399766所描述)。用链霉亲和素以1∶10的聚合酶:四聚链霉亲和素摩尔比配制聚合酶的等分试样。(大幅过量链霉亲和素用于防止2聚合酶:1链霉亲和素四聚体复合物的形成。)该步骤的最终盐浓度为约150mmnacl,以允许通过聚合酶与肝素柱的结合进行下游纯化。例如,可以使用biomek机器人平台通过肝素填充的针尖对链霉亲和素配制的聚合酶进行高通量纯化,以去除过量的链霉亲和素(基于聚合酶将在低盐下结合肝素的原理操作,并可用1mnacl洗脱)。添加甘油至55%,以允许-20℃下长期保存。链霉亲和素配制的样品在变性凝胶上电泳,并与已知的浓度标准进行比较以进行定量和质量控制。然后将配制的聚合酶与适当的核酸引物/模板一起孵育,并与可商购的试剂一起用于按照商业文献中所述的方案在来自加利福尼亚的太平洋生物科学公司(pacificbiosciences)的rsii或sequeltm系统上进行测序。使用sg1修饰的链霉亲和素配制的聚合酶的性能在单分子测序反应中评估经由链霉亲和素或sg1修饰的链霉亲和素固定的突变φ29聚合酶的性能。表3显示了在单个sequeltm芯片上用以未修饰的链霉亲和素(sa)或经sg1修饰的链霉亲和素配制的聚合酶进行的8小时影像的数据。聚合酶制剂多重化(multiplexed)于差异可辨的模板上,所述模板具有相似特征(即,长度和碱基组成)。sg1修饰的制剂显示出阅读长度优势。表3:表4显示了三种不同的φ29突变聚合酶(聚合酶1-3)的数据,其各自使用未经修饰的链霉亲和素(sa)或经sg1修饰的链霉亲和素的不同样品配制。数据来自单个sequeltm芯片上的8小时影像。聚合酶制剂多重化于差异可辨的模板上,所述模板具有相似特征(即长度和碱基组成)。经sg1修饰的制剂再次显示出阅读长度优势。表4:*相对于指定样品,针对各种不同聚合酶变体计算的的比率链霉亲和素上的电荷与阅读长度相关联在单分子测序中评估经由具有不同净电荷的链霉亲和素固定的突变φ29聚合酶的性能。表5显示了在单个sequeltm芯片上使用聚合酶的8小时影像的数据,所述聚合酶使用未经修饰的链霉亲和素(sa)、琥珀酰化的链霉亲和素、sgc修饰的链霉亲和素或sg1修饰的链霉亲和素配制。链霉亲和素包含野生型序列seqidno:1(sa),生物素结合位点附近的赖氨酸的赖氨酸至精氨酸突变(sa-k108r),所有四个赖氨酸的赖氨酸至精氨酸突变(k67r,k108r,k119r,和k121r;sa-4ktor)或聚谷氨酸尾(sa-10e)。聚合酶制剂多重化于差异可辨的模板上,所述模板具有相似特征(即长度和碱基组成)。对链霉亲和素添加负电荷的好处显而易见。表5:实施例5:亲和素和中性亲和素的sg1修饰以及用于单分子测序的聚合酶/核酸复合物的固定使用sg1修饰亲和素(赛默飞世尔科技公司(thermofisherscientific))和中性亲和素(emd)。将亲和素或中性亲和素(0.5-1mm,1当量)在0.5m碳酸氢钠中的冰冷溶液添加到冰冷的固体sg1-nhs(100当量)中。将该混合物在0℃保持3-7天。产物通过阴离子交换色谱法纯化。使用膜过滤浓缩包含所需的sg1修饰的亲和素或中性亲和素的级分。基本上如上所述,使用突变φ29聚合酶配制sg1修饰的亲和素、中性亲和素和链霉亲和素,未经修饰的亲和素、中性亲和素和链霉亲和素也是如此。然后将配制的聚合酶与适当的核酸引物/模板一起孵育,并与可商购的试剂一起用于按照商业文献中所述的方案在来自加利福尼亚的太平洋生物科学公司(pacificbiosciences)的sequeltm系统上进行测序。表6显示了单个sequeltm芯片上使用聚合酶的8小时影像的数据,所述聚合酶由未经修饰的链霉亲和素,亲和素或中性亲和素或经sg1修饰的链霉亲和素,亲和素或中性亲和素配制。聚合酶制剂多重化于差异可辨的模板上,所述模板具有相似特征(即长度和碱基组成)。相较于经修饰和未经修饰的链霉亲和素和中性亲和素,亲和素和经sg1修饰的亲和素显示出加载缺陷。与相应的未经修饰的制剂相比,亲和素、中性亲和素和链霉亲和素的经sg1修饰的制剂显示出速率和阅读长度优势。表6.实施例6:使用peg和磺酸化的peg的链酶亲和素修饰以及聚合酶/核酸复合物的用于单分子测序的固定如图5-8所示,用mpeg9、sgc-peg9-oh、炔丙基-peg8、peg8-peg8-sg1、叠氮基-peg8和peg8-bcn-sg1修饰链霉亲和素。mpeg9-nhs,炔丙基-peg9-oh,炔丙基-peg8-nhs和叠氮基-peg8-nhs购自broadpharm(加利福尼亚州圣迭戈)。如图5、7和8所示,将相应的peg-nhs酯(200当量)添加到链霉亲和素(1-2mm,1当量)在0.5m碳酸氢钠中的冰冷溶液中。将该混合物在0℃保持3-7天。使用膜过滤将聚乙二醇化的链霉亲和素产物与试剂分离。如图6所示,在cu(i)催化的“点击”反应下,将经sgc修饰的链霉亲和素中的叠氮基与炔丙基-peg9-醇反应。将炔丙基-peg9-醇(300当量)添加到经sgc修饰的链霉亲和素(0.6mm,1当量)在制剂缓冲液(20mmtrishcl,ph7.5,100mmkoac)中的溶液中,然后是用硫酸铜(ii)(100mm,2当量)、tpta配体(三((1-peg3-1,2,3-三唑-4-基)甲基)胺,200mm,6当量)和抗坏血酸钠(1m,10当量)的水性溶液配制的cu(i)溶液。该混合物在室温保持10小时。使用膜过滤将链霉亲和素-(sgc-peg9-oh)n产物与试剂分离。如图7示意性所示,使炔丙基-peg8修饰的链霉亲和素中的炔丙基与sg1-peg8-叠氮化物反应。将sg1-peg8-叠氮化物(257当量)添加到炔丙基-peg8修饰的链霉亲和素(0.95mm,1当量)在制剂缓冲液(20mmtrishcl,ph7.5,100mmkoac)中的溶液中,然后是由硫酸铜(ii)(100mm,2当量),tpta配体(200mm,6当量)和抗坏血酸钠(1m,10当量)的水性溶液制备的cu(i)溶液。该混合物在室温保持10小时。链霉亲和素-(peg8-peg8-sg1)n产物通过阴离子交换色谱法纯化。使用膜过滤浓缩产物的级分。如图8示意性所示,使经叠氮基-peg8-修饰的链霉亲和素中的叠氮基与sg1-bcn反应。将sg1-bcn(109当)添加到经叠氮基-peg8-修饰的链霉亲和素(0.97mm,1当量)在制剂缓冲液(20mmtrishcl,ph7.5,100mmkoac)中的溶液。该混合物在室温下保持24小时。链霉亲和素-(peg8-bcn-sg1)n产物通过阴离子交换色谱法纯化。使用膜过滤浓缩产物的级分。基本上如上所述,用突变φ29聚合酶配制经修饰的链霉亲和素。配制的聚合酶随后与适当的核酸引物/模板一起孵育,并与可商购的试剂一起用于按照商业文献中所述的方案在来自加利福尼亚的太平洋生物科学公司的sequeltm系统上进行的测序。表7显示了单个sequeltm芯片上8小时影像的数据。聚合酶制剂多重化于差异可辨的模板上,所述模板具有相似特征(即长度和碱基组成)。表7:对链霉亲和素的修饰n读数阅读长度(中值)pol比例准确性(中值)无9849338042.1487.1%sg126860553442.3787.3%mpeg932147357182.2787.1%peg8-炔丙基28632491012.2487.3%peg8-n328933431102.3887.2%sgc-peg9-oh16603586192.2787.3%经mpeg9修饰的链霉亲和素的性能与未经修饰的链霉亲和素相似。经叠氮基和炔丙基修饰的链霉亲和素显示出阅读长度增加。经sgc-peg9-oh修饰的链霉亲和素的性能与经sg1修饰的链霉亲和素相似。在随后的测序运行中,经peg8-bcn-sg1修饰的链霉亲和素和经peg8-peg8-sg1修饰的链霉亲和素的性能也与sg1修饰的链霉亲和素相似。通常,添加peg部分似乎对测序性能几乎没有影响,因为用包含带电荷的部分和peg的基团进行的修饰与使用不含peg的带电荷部分的基团的修饰相似。实施例7:sg1-sga-nhs酯的合成图10a示意性地显示了sg1-sga的合成和nhs酯活化。在步骤1中,将sg1-nhs(100mm,1当量)在dma中的溶液加入4-(2-氨基乙氧基)-3,5-双(3-磺基丙氧基)苯甲酸(sga)的dma溶液中,然后是nahco3水性溶液(0.4n),目标为最终有机/水性比为约0.5。混合物在室温保持过夜。使用watersc18反相19x100柱,通过制备型hplc纯化产物,得到无色胶状物。在步骤2中,向sg1-sga-cooh的dma溶液(30mm)中添加cdi(4,1当量)。在室温下搅拌1小时后,加入nhs(6,1当量)。反应混合物在室温搅拌过夜。加入乙酸乙酯以沉淀产物,将其通过离心分离并在高真空下干燥。使用sg1-sga-nhs修饰链霉亲和素,使用突变φ29聚合酶配制经修饰的链霉亲和素,基本上如上所述进行单分子测序。实施例8:3,5-二磺基苯甲酸nhs酯的合成图9a显示了3,5-二磺基苯甲酸nhs酯的合成。将在发烟硫酸中的苯甲酸溶液(浓度为约2.0m)在160℃加热3天。将所得混合物缓慢加入冷的naoh水性溶液中。产物首先通过使用5-20mlgeqsepharosehp色谱柱的阴离子交换色谱法纯化,然后通过使用watersc18反相30x100色谱柱的反相制备型hplc纯化。获得白色固体的产物(3tea盐)。1hnmr(d2o):δ8.41(s,2h),8.30(s,1h),8.20(q,18h),1.28(t,30h).基本上如上所述进行nhs酯活化。使用3,5-二磺基苯甲酸nhs酯修饰链霉亲和素,使用突变φ29聚合酶配制经修饰的链霉亲和素,基本上如上所述进行单分子测序。虽然处于清楚和便于理解的目的描述了前述发明,本领域技术人员阅读本说明书后应理解可进行许多形式和细节的改变,而不超出本发明的真实范围。例如,上述的全部技术和装置可以各种组合使用。全部出版物、专利、专利申请和/或其他本申请所引用的文献在此完整引入以供参考,其程度相当于每一出版物、专利、专利申请和/或其他本申请所引用的文献都单独说明对于所有目的引入以供参考。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1