基因组测序选择系统的制作方法

文档序号:26003862发布日期:2021-07-23 21:21阅读:91来源:国知局
基因组测序选择系统的制作方法

相关申请的交叉引用

本申请要求于2018年10月17日提交的标题为“基因组测序选择系统[genomicsequencingselectionsystem]”的美国临时专利申请号62/766,432的优先权和权益,所述申请通过引用以其全文结合在此用于所有目的。



背景技术:

包括新一代测序(ngs)系统(有时被称为大规模平行测序系统或类似的术语)的基因组测序系统可以产生大量可变质量的测序数据。具体地,在许多实现方式中,ngs系统可以将基因组分割成多个小片段。这些小片段可以平行测序,相对于将整个基因组作为整体进行测序降低了处理要求,并且然后可以重组以产生全序列。可以对测序数据计算序列度量。

与第一代测序技术(诸如,sanger测序)相比,ngs系统提供了更快且更便宜的测序。然而,ngs系统遭受由于碱基序列的识别或碱基判读的错误或在样品制备过程中引入的错误而引起的不准确性或噪声。碱基读取中的错误率可以是10%或更多,有时高达25%或更多。鉴于可由ngs系统在短时间内获得的大量数据,即使中等错误率也可能导致具有数以万计或甚至数以百万计的不正确碱基对的数据。



技术实现要素:

本文公开的系统和方法提供基于逐个读取的错误率和读取质量的测量,并且在一些实现方式中可以过滤或排除低质量读取或提取高质量读取并提供详细度量。与分析包括低质量或错误数据的整个数据集相比,这可降低处理要求,并且可以通过减少花费在可能提供不准确结果的数据上的计算时间量来增加确定序列度量的计算速度。在许多实现方式中,这些系统和方法还可以相对于处理或传输具有高错误率的数据集来减少存储器和带宽消耗。

在一些实现方式中,本解决方案可以计算测序统计,诸如,覆盖深度。本解决方案可以确定读取统计(诸如,变异频率)并且识别临床相关变异。本解决方案可以读取bam和vcf输入文件以及phred缩放质量得分。本解决方案可以基于所述质量得分来选择相对高质量的读取,并且可以计算单核苷酸多态性(snp)、插入和缺失(indel)以及结构变异的参照和替代等位基因计数。本解决方案可以计算不同链的测序度量以测量链偏向性。本解决方案还可以确定序列数据的每个区域的最小、最大和均值深度。

根据本公开文本的至少一个方面,一种用于过滤测序数据的方法可以包括由数据处理系统接收可以包括多个基因序列的数据。所述多个基因序列中的每一个基因序列可以包括染色体的指示、位置的指示、碱基值和质量得分。所述方法可以包括由所述数据处理系统选择所述多个基因序列的子集。所述多个基因序列的所述子集中的每一个基因序列可以具有相同的染色体的指示。所述方法可以包括由所述数据处理系统从所述多个基因序列的所述子集中过滤包括具有高于预定阈值的质量得分的碱基值的基因序列。所述方法可以包括由所述数据处理系统确定经过滤的基因序列的每个位置的聚合计数。所述方法可以包括由所述数据处理系统确定经过滤的基因序列的每个位置的替代碱基计数。所述方法可以包括由所述数据处理系统基于每个位置的替代碱基计数与每个位置的聚合计数的比率超过阈值来生成基因序列变异的标识。

在一些实现方式中,所述方法可以包括确定所述多个基因序列的经过滤的子集中的缺失序列的替代计数,其中所述碱基值具有高于所述预定阈值的质量得分。所述缺失序列可以开始于邻近所述位置的索引处。

所述方法可以包括确定所述多个基因序列的经过滤的子集中的插入序列的替代计数,其中所述碱基值具有高于所述预定阈值的质量得分。所述方法可以包括进一步通过识别替代序列匹配来确定所述插入序列的替代计数。所述方法可以包括识别经过滤的多个基因序列中的结构变异。

在一些实现方式中,所述替代碱基计数可以基于所述多个基因序列中识别的所述结构变异来确定。确定所述聚合计数可以包括对所述多个基因序列中的经过滤的子集中的每一个基因序列与cigar字符串的匹配进行计数。

在一些实现方式中,确定所述聚合计数可以包括对所述多个基因序列的经过滤的子集的每一个基因序列中的缺失、插入、参照跳跃(referenceskip)、软剪切(softclip)或硬剪切(hardclip)进行计数。所述方法可以包括基于所述聚合计数和所述替代碱基计数来计算经过滤的多个基因序列的均值读取覆盖、最大值读取覆盖或最大读取覆盖中的至少一项。

在一些实现方式中,所述方法可以包括基于所述聚合计数和所述替代碱基计数来计算所述多个基因序列的链偏向性。

根据本公开文本的至少一个方面,一种用于过滤测序数据的系统可以包括数据处理系统。所述系统可以接收可以包括多个基因序列的数据。所述多个基因序列中的每一个基因序列可以包括染色体的指示、位置的指示、碱基值和质量得分。所述系统可以选择所述多个基因序列的子集。所述多个基因序列的所述子集中的每一个基因序列可以具有相同的染色体的指示。所述系统可以从所述多个基因序列的所述子集中过滤其中所述碱基值具有高于预定阈值的质量得分的基因序列。所述系统可以确定所述多个基因序列的经过滤的子集的每个位置的聚合计数,其中所述碱基值具有高于所述预定阈值的质量得分。所述系统可以确定经过滤的多个基因序列的每个位置的替代碱基计数,其中所述碱基值具有高于所述预定阈值的质量得分。所述系统可以基于每个位置的替代碱基计数与每个位置的聚合计数的比率来识别基因序列变异,并且可以生成所述基因序列变异的标识符。

在一些实现方式中,所述系统可以确定所述多个基因序列的所述子集中的缺失序列的替代计数,其中所述碱基值具有高于所述预定阈值的质量得分。所述系统可以确定所述多个基因序列的经过滤的子集中的插入序列的替代计数,其中所述碱基值具有高于所述预定阈值的质量得分。

在一些实现方式中,所述系统可以通过识别替代序列匹配来确定所述插入序列的替代计数。所述系统可以识别所述多个基因序列中的结构变异。

所述系统可以通过对所述多个基因序列中的经过滤的子集中的每一个基因序列与cigar字符串的匹配进行计数来确定所述聚合计数。所述系统可以通过对所述多个基因序列的所述子集中的每一个基因序列中的缺失、插入、参照跳跃、软剪切或硬剪切进行计数来确定所述聚合计数。

所述系统可以基于所述聚合计数和所述替代碱基计数来计算所述多个基因序列的均值读取覆盖、最大值读取覆盖或最大读取覆盖中的至少一项。所述系统可以基于所述聚合计数和所述替代碱基计数来计算所述多个基因序列的链偏向性。

前述总体描述以及以下附图描述和详细描述是示例性和解释性的,并且旨在提供对所要求保护的本发明的进一步解释。从以下附图简要描述和详细描述中,其他的目的、优点和新颖特征对于本领域技术人员将是显而易见的。

附图说明

附图不旨在按比例绘制。在各个附图中相同的附图标记和名称指示相同的元件。为了清楚起见,并非每个组件都可以在每个附图中被标记。在附图中:

图1展示了用于计算ngs读取深度统计的示例系统的框图。

图2展示了使用图1中所展示的系统确定测序数据的覆盖度量的示例方法的框图。

图3展示了给定染色体的示例序列表。

图4展示了示例计算机系统的框图。

具体实施方式

以上介绍和以下更详细讨论的各种概念可以用许多方式中的任何方式来实现,因为所描述的概念不限于任何特定的实现方式。特定实现方式和应用的例子主要出于说明性目的而提供。

本解决方案可以计算测序统计,诸如,覆盖深度。本解决方案可以确定变异频率并且基于变异频率来识别临床相关变异。本解决方案可以读取bam和vcf输入文件以及phred缩放质量得分。本解决方案可以基于质量得分从输入的文件中选择相对高质量的读取,并且可以计算snp、插入和缺失(indel)以及结构变异的参照和替代等位基因计数。本解决方案可以计算不同链的测序度量以测量链偏向性。本解决方案还可以确定序列数据的每个区域的最小、最大和均值深度。本解决方案可以使用质量得分来仅选择和分析相对高质量的读取,这可以通过减少花费在可能提供不准确结果的数据上的计算时间量来增加确定序列度量的计算速度。

图1展示了用于计算ngs读取深度统计的示例系统100的框图。系统100可以包括测序系统102。测序系统102可以包括从数据储存库116中读取数据文件114的数据解析器110。数据解析器110可以将数据加载到缓冲器106中。测序系统102可以包括报告引擎104、过滤引擎108和分析引擎112。系统100可以包括ngs测序仪118,所述ngs测序仪可以将数据文件114提供给测序系统102。

系统100可以包括测序系统102。测序系统102可以包括具有至少一个处理器的至少一个服务器或计算机。例如,测序系统102可以包括位于至少一个数据中心或服务器群中的多个服务器,或者测序系统102可以是台式计算机。处理器可以包括微处理器、专用集成电路(asic)、现场可编程门阵列(fpga)、其他专用逻辑电路或其组合。测序系统102可以是如关于图4所描述的数据处理系统。例如,测序系统102可以包括一个或多个处理器和存储器。测序系统102可以包括用户界面(例如,图形用户界面),所述用户界面经由与测序系统102耦接的显示器被呈现并显示给用户。一个或多个输入/输出(i/o)设备可以与测序系统102耦接。

测序系统102可以包括数据储存库116。数据储存库116可以包括一个或多个本地或分布式数据库。数据储存库116可以包括计算机数据存储装置或存储器,并且可以存储一个或多个数据文件114。数据储存库116可以包括非易失性存储器,诸如,一个或多个硬盘驱动器(hdd)或其他磁性或光学存储介质、一个或多个固态驱动器(ssd)(诸如,闪存驱动器或其他固态存储介质)、一个或多个混合磁性和固态驱动器、一个或多个虚拟存储卷(诸如,云存储装置)、或其组合。

测序系统102可以将一个或多个数据文件114存储在数据储存库116中。数据文件114中的每一个数据文件可以包括多个基因序列数据。基因序列数据可以包括染色体的指示、位置的指示、碱基值和质量得分。

数据文件114可以是呈生物信息学中使用的其他文件数据文件格式中的变异判读格式(vcf)、序列比对映射(sam)格式、二进制序列比对映射(bam)的数据文件。例如,数据文件114可以包括文本数据或二进制数据。在一些实现方式中,数据文件114可以包括测序数据的字符串。在一些实现方式中,数据文件114可以包括识别参照序列与样品序列之间的差异的测序数据。

例如,vcf文件格式可以用于存储序列变异。vcf文件格式可以用于存储单核苷酸多态性(snp)、短(例如,少于10个碱基对)的插入和缺失、以及大结构变异。vcf文件格式(和其他文件格式)可以包括报头区段和主体区段。报头区段可以包括进一步描述vcf文件格式的主体内的数据的元数据。vcf文件格式的主体可以包括多个列。每一行可以指示变异。所述列可以识别其上判读变异的染色体;变异在序列中的位置;变异的标识符;位置的参考碱基值;位置的替代碱基值(例如,在所述位置处读取除了参照碱基之外的哪个碱基);得分;以及指示变异通过给定过滤器集中的哪一者的标志。

测序系统102可以包括ngs测序仪118。ngs测序仪118可以生成数据文件114。系统100可以包括多个ngs测序仪118。ngs测序仪118可以被提供样品,ngs测序仪118从所述样品生成测序数据。ngs测序仪118可以将数据保存为上述文件格式之一。在一些实现方式中,ngs测序仪118可以经由网络将数据文件114传送至测序系统102。在一些实现方式中,ngs测序仪118可以将数据文件114传送至中间设备,诸如,基于云的存储装置或可移除式硬盘驱动器。数据文件114可以从中间设备传输到测序系统102。

测序系统102可以包括数据解析器110。数据解析器110可以是被配置成使得在其上执行数据解析器110的计算设备能够从数据储存库116中读取和提取数据的任何脚本、文件、程序、应用、指令集、或计算机可执行代码。数据解析器110可以从数据储存库116中读取数据文件114。在一些实现方式中,数据文件114可以压缩格式存储在数据储存库116中。数据解析器110可以在从数据文件114中提取测序数据之前解压缩数据文件114。数据解析器110可以从数据储存库116中读取数据文件114,所述数据文件可以被存储在测序系统102的硬盘驱动器上。数据解析器110可以加载数据文件114并且将来自数据文件114的数据存储在缓冲器106中。

在一些实现方式中,数据解析器110可以将一个或多个数据文件114加载到缓冲器106中。数据解析器110可以在数据解析器110将数据加载到缓冲器106中之前解析或处理数据。例如,数据解析器110可以将vcf文件格式的主体解析成一个或多个字典或其他文件结构格式。

测序系统102可以包括缓冲器106。缓冲器可以被存储在随机存取存储器(ram)或其他高速缓冲存储器中。缓冲器可以被存储在易失性存储器上。在一些实现方式中,对缓冲器106的读取和写入可以比对数据储存库116的读取或写入更快。数据解析器110可以将数据文件114加载到缓冲器106中以减少在数据储存库116上执行的读取和写入的数量,从而提高测序系统102的总体计算速度。

测序系统102可以包括过滤引擎108。过滤引擎108可以是被配置成使在其上执行过滤引擎108的计算设备能够从加载到缓冲器106中的测序数据中选择变异的任何脚本、文件、程序、应用、指令集、或计算机可执行代码。如上所述,每个变异可以包括得分。得分可以是质量得分。质量得分可以是phred质量得分。质量得分可以是在测序过程中识别的碱基的质量的指示。例如,质量得分可以是在给定位置处的碱基被正确识别并且不是测序错误的可能性的指示。

过滤引擎108可以仅选择具有高于预定阈值的质量得分的变异。例如,过滤引擎108可以从缓冲器106或从进一步分析中丢弃具有低于预定阈值的质量得分的变异。在一些实现方式中,过滤引擎108不使用phred质量得分小于60、小于50、小于40、小于30或小于20的任何变异。在一些实现方式中,质量得分可以基于测序数据中每个碱基的平均读取。例如,质量得分阈值可以初始地被设置为30,并且如果每个碱基的平均读取高于100,则可以降低所述质量得分阈值。

测序系统102可以包括分析引擎112。分析引擎112可以是被配置成使在其上执行分析引擎112的计算设备能够计算测序统计的任何脚本、文件、程序、应用、指令集、或计算机可执行代码。

分析引擎112可以计算数据文件114中所指示的位置(p)中的每个位置处的替代碱基频率。替代碱基频率可以基于给定位置处的所有读取的计数。例如,分析引擎112可以确定每个碱基出现在基因序列(或其部分)中的每个位置处的次数,这可以被称为给定碱基的alt碱基计数。分析引擎112可以确定基因序列(或其部分)中的每个位置的聚合计数。在一些实现方式中,在确定alt碱基计数和聚合碱基计数时,分析引擎112可以仅包括或计数具有高于预定阈值的质量得分的碱基。

分析引擎112可以计算插入和缺失的替代碱基频率。在一些实现方式中,插入或缺失的长度小于10个碱基对。对于缺失,分析引擎112可以通过识别开始于位置p+1的给定长度k的每个缺失来确定alt计数。对于插入,分析引擎112可以通过对匹配cigar字符串的给定长度的插入的发生次数进行计数来确定alt计数。对于大结构变异,分析引擎112可以确定参照(ref)计数、alt计数、以及聚合计数或总计数。分析引擎112可以将ref计数确定为分析引擎112识别出的跨事件边界匹配cigar字符串的出现次数。分析引擎112可以将alt计数确定为跨事件边界的cigar中的缺失、插入、参照跳跃、软剪切或硬剪切的数量。总计数可以是ref计数和alt计数的总和。基于由分析引擎112确定的统计和其他数据,分析引擎112可以从常见变异中识别临床相关变异。

测序系统102可以包括报告引擎104。报告引擎104可以是被配置成使在其上执行报告引擎104的计算设备能够基于由分析引擎112生成的数据来生成报告的任何脚本、文件、程序、应用、指令集、或计算机可执行代码。报告引擎104可以接收由分析引擎112生成的数据,诸如,alt计数、ref计数和alt频率。报告引擎104可以基于所述数据生成报告。报告引擎104可以确定并包括报告中的覆盖频率:链偏向性;以及均值、最大值和平均覆盖。

图2展示了用于确定测序数据的覆盖度量的示例方法200的框图。方法200可以包括接收数据(框202)。还参考图1,测序系统102可以接收数据。测序系统102可以从ngs测序仪118接收数据,或者测序系统102可以从数据储存库116中检索数据。测序系统102可以将数据接收为bam、vcf、txt、或可以包含测序数据的其他文件格式。测序系统102还可以接收所接收的数据的phred缩放质量得分。数据可以包括多个基因序列。数据可以指示基因序列的染色体、位置数据、每个位置处的碱基值和碱基值的质量得分。在一些实现方式中,测序系统102可以接收并打开数据文件。测序系统102可以将数据文件读取到缓冲器106中。将数据文件读取到缓冲器106中可以减少对数据储存库116进行的读取的数量。

方法200可以包括选择基因序列(框204)。测序系统102可以选择属于同一染色体的一个或多个基因序列。在一些实现方式中,测序系统102可以选择也属于染色体上相同的一般位置或相同的特定位置的一个或多个基因序列。例如,基因序列可以被接收在包括多个列的数据文件中。所述多个列中的一列可以指示数据文件的另一列中包含的序列数据的染色体。测序系统102可以过滤数据以选择低于预定染色体的基因序列。

方法200可以包括确定每个碱基值是否具有高于阈值的阈值(框206)。测序系统102可以识别序列数据中的碱基值,所述碱基值包括在给定位置处低于质量阈值的碱基值。测序系统102可以丢弃其中碱基值具有低于预定阈值的质量得分的给定位置的加载数据。测序系统102可以将具有高于预定阈值的质量得分的给定位置的碱基值保存到数据结构(诸如,保存到缓冲器106的字典)。

方法200可以包括识别序列数据中的变异类型(框208)。测序系统102可以确定变异是单核苷酸多态性(snp)并继续至框210、是插入或缺失并继续至框212、还是大结构变异并继续至框226。在一些实现方式中,插入或缺失小于10个碱基对(bp),并且大结构变异大于10个碱基对。

如果测序系统102确定变异是snp,则方法200可以包括确定位置的聚合计数(框216)。还参考图3,除其他之外,图3展示了给定染色体的四个序列表300(1)-300(4)(总体上被称为序列表300)。序列表300中的每一个序列表可以包括多个碱基对302。所选择的序列表300中的每一个序列表可以与给定碱基对位置304重叠。一般地,可以用变量p描述碱基对302的位置,其中下一个碱基对302具有位置p+1,并且前一个碱基对302具有位置p-1。在这个例子中,数据文件可以指示snp出现在碱基对位置304处,这可以被称为p。例如,序列表300(1)和序列表300(2)指示在碱基对位置304处的碱基对应是g,并且序列表300(3)和序列表300(4)指示在碱基对位置304处的碱基对应是c。在碱基对位置304处的每一个碱基对302可以具有相关联的质量得分。

位置p的聚合计数可以是包括具有高于预定阈值的质量得分的位置p的序列表300的数量。例如,并且继续图3中所展示的以上例子,如果在碱基对位置304处的序列表300(4)中的碱基对302具有低于预定阈值的质量得分,则碱基对位置304的聚合计数可以是3。

方法200可以包括确定位置的替代(alt)计数(框218)。测序系统102可以确定每个碱基对(例如,c、g、g和t)的alt计数。每个碱基对位置304的alt计数可以是在碱基对位置304处的碱基对的聚合计数或出现次数。测序系统102可以在alt计数中仅包括具有高于预定阈值的质量得分的碱基对302。例如,并且参见图3中所示的例子,测序系统102可以确定在碱基对位置304处的g的alt计数是2并且在碱基对位置304处的c的alt计数是1。在碱基对位置304处的c的alt计数不是2,因为如上所讨论的,在这个例子中,序列表300(4)中的碱基对位置304处的碱基对302具有低于预定质量得分阈值的质量得分,并且在由测序系统102做出的计算中不被考虑。

如果在框208处,测序系统102确定变异类型是插入或缺失,则方法200可以继续到框212。方法200可以包括确定每个位置的聚合计数(框220)。如关于框216和框218所描述的,在确定每个位置的聚合计数时,测序系统102可以仅对具有高于预定阈值的质量得分的碱基对进行计数。

方法200可以包括确定alt计数(框222)。对于缺失,可以对p+1的位置确定alt计数。例如,alt计数可以是在cigar位置p+1处具有缺失长度k的缺失的数量。对于插入,alt计数可以是在cigar起始位置p+1处具有长度l的读取的数量和匹配p+1处的碱基对读取的替代序列匹配的计数。

如果在框208处,测序系统102确定变异类型是结构变异,则方法200可以继续到框226。方法200然后可以包括确定参照(ref)计数(框228)。在确定ref计数时,测序系统102可以仅对具有高于预定阈值的质量得分的碱基对读取进行计数。结构变异可以跨越在基因序列中的事件起点开始并在基因序列中的事件终点结束的事件边界。测序系统102可以将ref计数确定为在cigar中在事件边界上匹配的读取的数量。

方法200可以包括确定alt计数(框230)。当变异类型是结构变异时,测序系统102可以将alt计数确定为cigar中跨事件边界的缺失、插入、参照跳跃、软剪切或硬剪切的出现。

方法200可以包括确定聚合计数(框232)。当变异类型是结构变异时,测序系统102可以将ref计数与alt计数求和以确定聚合计数。

方法200可以包括确定基因序列度量(框234)。基因序列度量可以包括确定alt频率。测序系统102可以将alt频率确定为alt计数除以位置的聚合计数。在一些实现方式中,基因序列度量可以包括确定序列的均值、最大、最小或平均覆盖深度。测序度量可以包括针对每个碱基确定每个核苷酸计数的计数以及插入和缺失计数。还参考图3,测序系统102可以确定每个序列表300上的每个碱基对302的均值、最大值或平均覆盖或读取深度。测序系统102可以仅对具有高于预定阈值的质量得分的碱基对302进行计数。在一些实现方式中,测序系统102可以识别每个链计数以识别链偏向性。测序系统102还可以通过在碱基对位置处识别以预定alt频率发生的替代判读来识别临床相关变异。

在一些实现方式中,方法200可以包括测序系统102将基因序列度量传送至客户端设备。例如,测序系统102可以将基因测序度量传送至用户的膝上型计算机或其他计算设备。在一些实现方式中,测序系统102可以作为用户的计算设备(例如,膝上型计算机)的组件运行,并且测序系统102可以向用户呈现或显示基因序列度量。

图4展示了示例计算机系统400的框图。计算机系统或计算设备400可以包括或被用来实现系统100或其组件,诸如,测序系统102。例如,数据解析器110、分析引擎112、报告引擎104、过滤引擎108可以是存储在主存储器415上的组件。计算系统400包括用于传送信息的总线405或其他通信组件以及耦接至总线405以用于处理信息的处理器410或处理电路。计算系统400还可以包括耦接至总线以用于处理信息的一个或多个处理器410或处理电路。计算系统400还包括耦接至总线405以用于存储信息和要由处理器410执行的指令的主存储器415(诸如,随机存取存储器(ram)或其他动态存储设备)。主存储器415可以是或包括数据储存库116。主存储器415还可以用于在由处理器410执行指令的过程中存储位置信息、临时变量或其他中间信息。计算系统400可以进一步包括耦接至总线405以用于存储用于处理器410的静态信息和指令的只读存储器(rom)420或其他静态存储设备。存储设备425(诸如,固态设备、磁盘或光盘)可以耦接至总线405以持久地存储信息和指令。存储设备425可以包括或是数据储存库116的一部分。

计算系统400可以经由总线405耦接至显示器435(诸如,液晶显示器或有源矩阵显示器)以用于向用户显示信息。输入设备430(诸如,包括字母数字和其他键的键盘)可以耦接至总线405以用于向处理器410传送信息和命令选择。输入设备430可以包括触摸屏显示器435。输入设备430还可以包括光标控制(诸如,鼠标、轨迹球或光标方向键)以用于将方向信息和命令选择传送到处理器410并且用于控制显示器435上的光标移动。例如,显示器435可以是测序系统102或图1的其他组件的一部分。

本文描述的过程、系统和方法可以由计算系统400响应于处理器410执行主存储器415中包含的指令布置来实现。此类指令可以从另一计算机可读介质(诸如,存储设备425)中读取到主存储器415中。主存储器415中包含的指令布置的执行使得计算系统400执行本文描述的说明性过程。还可以采用多处理布置中的一个或多个处理器来执行主存储器415中包含的指令。硬连线电路系统可以代替或结合软件指令以及本文描述的系统和方法一起使用。本文描述的系统和方法不限于硬件电路系统和软件的任何特定组合。

尽管图4中已经描述了示例计算系统,但本说明书中描述的包括操作的主题可以在其他类型的数字电子电路系统中或在计算机软件、固件、或硬件(包括本说明书中公开的结构及其结构等同物)、或它们中的一个或多个的组合中实现。

本说明书中描述的主题和操作可以在数字电子电路系统中或在计算机软件、固件、或硬件(包括本说明书中公开的结构及其结构等同物)、或它们中的一个或多个的组合中实现。本说明书中描述的主题可以被实现为一个或多个计算机程序,例如,在一种或多种计算机存储介质上编码的以用于由数据处理装置执行或者用以控制所述数据处理装置的操作的计算机程序指令的一个或多个电路。可替代地或另外,程序指令可以被编码在人工生成的传播信号(例如,机器生成的电、光或电磁信号)上,所述传播信号被生成以编码信息以供传输到合适的接收器装置以用于由数据处理装置执行。计算机存储介质可以是或包括在计算机可读存储设备、计算机可读存储基板、随机或串行存取存储器阵列或设备、或它们中的一个或多个的组合中。当计算机存储介质不是传播信号时,计算机存储介质可以是在人工生成的传播信号中编码的计算机程序指令的源或目的地。计算机存储介质还可以是或包括在一个或多个单独的组件或介质(例如,多个cd、磁盘或其他存储设备)中。本说明书中描述的操作可以被实现为由数据处理装置对存储在一个或多个计算机可读存储设备上的或从其他资源接收的数据执行的操作。

术语“数据处理系统”、“计算设备”、“组件”或“数据处理装置”涵盖用于处理数据的各种装置、设备和机器,举例来讲,包括可编程处理器、计算机、片上系统或前述中的多个或组合。装置可以包括专用逻辑电路系统,例如,fpga(现场可编程门阵列)或asic(专用集成电路)。除了硬件之外,装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、跨平台运行时环境、虚拟机或它们中的一个或多个的组合的代码。装置和执行环境可以实现各种不同的计算模型基础结构,诸如,web服务、分布式计算和网格计算基础结构。系统100的组件可以包括或共享一个或多个数据处理装置、系统、计算设备或处理器。

计算机程序(也称为程序、软件、软件应用、app、脚本或代码)可以用任何形式的编程语言(包括编译型语言或解释型语言、声明型语言或程序语言)编写,并且可以用任何形式(包括作为独立式程序或作为模块、组件、子例程、对象、或适合于在计算环境中使用的其他单元)部署。计算机程序可以对应于文件系统中的文件。计算机程序可以存储在存放其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中、在专用于所讨论的程序的单个文件中、或者在多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以被部署成在一个计算机上、或者在位于一个站点处或跨多个站点分布且通过通信网络互连的多个计算机上执行。

本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序(例如,测序系统102的组件)的一个或多个可编程处理器执行以便通过对输入数据进行操作并生成输出来执行动作。所述过程和逻辑流程也可以由专用逻辑电路系统(例如,fpga(现场可编程门阵列)或asic(专用集成电路))来执行,并且装置也可以被实现为所述专用逻辑电路系统。适用于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质和存储器设备,举例来讲,包括半导体存储器设备(例如,eprom、eeprom、以及闪存存储器设备)、磁盘(例如,内置硬盘或可移除式盘)、磁光盘、以及cdrom和dvd-rom盘。处理器和存储器可以由专用逻辑电路系统补充或合并在其中。

虽然在附图中以特定顺序描绘了操作,但是此类操作不需要按所示特定顺序或相继顺序执行,并且所有展示的操作不要求被执行。本文描述的动作可以按不同的顺序执行。

各种系统组件的分离并不要求在所有实现方式中分离,并且所描述的程序组件可以被包括在单个硬件或软件产品中。

现在已经描述了一些说明性实现方式,显然前述是说明性的而不是限制性的,已经通过举例的方式呈现。具体地,尽管本文中呈现的许多例子涉及方法动作或系统元件的特定组合,但是这些动作和这些元件可以其他方式组合以实现相同的目的。结合一个实现方式讨论的动作、元件和特征不旨在排除在其他实现方式中的类似作用或实现方式之外。

本文使用的措辞和术语是为了描述的目的,并且不应被视为是限制性的。本文使用的“包括”、“包含”、“具有”、“含有”、“涉及”、“其特征为”、“其特征在于”及其变体意在涵盖其后列出的项目、其等同物和附加项目、以及由其后排他地列出的项目组成的替代实现方式。在一个实现方式中,本文描述的系统和方法由所描述的元件、动作或组件中的一个、多于一个的每个组合、或全部来组成。

如本文使用的,术语“约”和“基本上”将被本领域普通技术人员理解,并且将在某种程度上取决于使用它的上下文而变化。如果在给定使用所述术语的上下文的情况下所述术语的使用对本领域普通技术人员而言是不清楚的,则“约”将意指高达所述特定术语的正负10%。

对本文以单数形式提及的系统和方法的实现方式或元件或动作的任何引用还可以涵盖包括多个这些元件的实现方式,并且对本文的任何实现方式或元件或动作的复数形式的任何引用还可以涵盖仅包括单个元件的实现方式。以单数或复数形式的引用不旨在将本公开的系统或方法、其组件、动作、或元件限制为单数或复数配置。对基于任何信息、动作或元件的任何动作或元件的引用可以包括其中动作或元件至少部分地基于任何信息、动作或元件的实现方式。

本文公开的任何实现方式可以与任何其他实现方式或实施方案组合,并且对“实现方式”、“一些实现方式”、“一个实现方式”等的引用不一定相互排斥并且旨在指示结合所述实现方式描述的特定特征、结构或特性可以被包括在至少一个实现方式或实施方案中。如本文使用的此类术语不一定全部指代同一实现方式。任何实现方式可以与本文公开的方面和实现方式一致的任何方式包括地或排他地与任何其他实现方式组合。

除非明确地作相反指示,否则在本说明书和权利要求中,如本文使用的不定冠词“一”和“一个”应被理解为意指“至少一个”。

对“或”的引用可以被解释为包括性的,使得使用“或”描述的任何术语可以指示所描述的术语中的单个、多于一个、以及全部中的任一项。例如,对“‘a’和‘b’中的至少一个”的引用可以包括仅‘a’、仅‘b’、以及‘a’和‘b’两者。与“包括”或其他开放性术语结合使用的此类引用可以包括附加项目。

在附图、详细描述或任何权利要求中的技术特征之后有参考符号的情况下,已经包括了参考符号来增加附图、详细描述和权利要求的可理解性。因此,参考符号的存在与否对任何权利要求元素的范围不具有任何限制作用。

本文描述的系统和方法在不脱离其特性的情况下可以被实施为其他特定形式。前述实现方式是说明性的,而不是限制所描述的系统和方法。本文描述的系统和方法的范围因此由所附权利要求而不是前述描述指示,并且在权利要求的等同物的意义和范围内的变化被包含在其中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1