用于序列对齐的系统、方法、和装置与流程

文档序号:11450625阅读:400来源:国知局
用于序列对齐的系统、方法、和装置与流程



背景技术:

败血症是可能造成血管渗漏、血液凝块、器官衰竭、和死亡的严重免疫反应。估计在美国超过百万的患者变得有败血症,并且死亡率在28-50%之间,(hallmj,williamssn,defrancescj,golosinskiya.inpatientcareforsepticemiaorsepsis:achallengeforpatientsandhospitals.nchsdatabrief,no62.hyattsville,md:nationalcenterforhealthstatistics.2011以及woodka,angusdc.pharmacoeconomicimplicationsofnewtherapiesinsepsis.pharmacoeconomics2004;22(14):895-906)。败血症由身体中的感染触发。一旦败血症反应已经被感染触发,患者的状况可能迅速恶化。快速消除感染源可能是关键的。第一处置措施通常是广谱抗生素,然而,感染可能由真菌、病毒、或病原体的组合、而不仅仅是细菌造成。此外,许多感染可能由对广谱抗生素有抵抗力的细菌菌株造成。识别病原体允许临床医生选择针对病原体最有效的药物。病原体越快地被识别,患者可以越快接收最有效的治疗。这可以改进遭受败血症的患者的结果。

将未知的基因序列与已知的序列对齐可以是一种识别病原体的准确方法。随着基因测序技术变得更广泛地可用,从患者收集样本以对基因信息进行测序变得更加可行。例如,下一代测序技术已经指数地减小了对生物体进行测序的成本。这种基因信息可能来自造成感染的病原体、患者组织、或其它源。可以将样本的序列与参考序列的数据库进行比较,以试图识别病原体。迄今为止,成千上万的微生物已经被测序用作为参考序列,并且期望在接下来的几年中该数量增长到数十万。随着已知序列的数量增加,搜索参考序列的数据库所需要的时间和计算能力增加。尽管对样本测序的成本已经降低,但是将样本序列与参考序列对齐的增加的计算成本可能减小病原体识别的这种方法的实际性。其还可能降低用于诸如分子生物学研究、食品安全、和药物发现的其它应用的序列对齐的可用性。



技术实现要素:

一种用于提供对数据库的较快搜索的示例方法可以包括:针对存储在所述数据库中的参考序列集生成搜索索引,其中,所述搜索索引可以指向所述参考序列集中的每个序列;针对所述参考序列集生成系统发生树(phylogenetictree);针对所述系统发生树的分枝(sector)生成搜索索引的子索引,其中,所述子索引中的每个可以指向包括在所述系统发生树的对应分枝中的所述参考序列集中的序列,其中,所述子索引中的每个可以比所述搜索索引指向更少的序列;并且将所述子索引存储在存储器中。

一种用于减少将种类(species)分配到多个序列读取的计算时间的示例的方法可以包括:接收多个序列读取;选择所述多个序列读取的测试集,其中,所述测试集可以包括多个序列读取中的所选择的读取;选择索引的多个子索引,其中,所述索引可以指向与多个种类相对应的序列的集合中的所有序列,其中,所述子索引可以指向所述序列的集合中的所选择的序列,其中,所述子索引中的每个可以对应于所述序列的集合的系统发生树的分枝;将测试集与多个子索引进行对齐,其中,对齐可以由一个或多个处理单元并行地执行;利用所述一个或多个处理单元,基于所述对齐来识别所述多个子索引中的特定子索引;利用所述一个或多个处理单元将所述多个序列读取与所述特定子索引对齐;并且基于所述对齐来将所述种类分配到所述多个序列读取。

一种用于减少与生物体的识别相关联的计算时间的示例的方法可以包括:接收与所述生物体相关联的多个序列读取,其中,所述序列读取中的每个可以与所述生物体的基因序列的部分相对应;访问可以包括已知测序基因组的数据库,其中,所述数据库可以包括与已知测序基因组相关联的至少一个系统发生树、与所述至少一个系统发生树相关联的至少一个索引、以及与所述至少一个索引中的每个相关联的多个子索引,其中,所述子索引可以小于所述至少一个索引;并行地将序列读取中的所选择的读取与子索引中的所选择的子索引进行第一对齐;基于所述第一对齐的结果来选择所述子索引中的所选择的子索引中的最佳子索引;并且将所述多个序列读取与和所述子索引中的所选择的子索引中的所述最佳子索引相关联的索引进一步对齐;并且基于所述进一步对齐来识别所述生物体。

一种用于确定感染分离物的种类的示例系统可以包括处理单元、可由所述处理单元访问的存储器、可由所述处理单元访问的数据库、以及耦合到所述处理单元的显示器。所述处理单元可以被配置为:将存储在存储器中的所述感染分离物的多个序列读取与存储在数据库中的索引的至少一个子索引进行对齐以确定所述感染分离物的种类,其中,所述索引可以指向与多个种类相对应的参考序列的集合中的序列,其中,所述子索引可以指向所述序列的集合中的所选择的序列,其中,所述子索引可以对应于所述参考序列的集合的系统发生树的分枝;并且向显示器提供对所述感染分离物的所述种类的确定结果。

附图说明

图1是根据本公开内容的实施例的系统的示意性图示。

图2是根据本公开内容的实施例的方法的流程图。

图3a是根据本公开内容的实施例的方法的示意性图示。

图3b是根据本公开内容的实施例的方法的示意性图示。

图4是示例系统发生树的图示。

图5是根据公开内容的实施例的方法的流程图。

图6是根据公开内容的实施例的方法的示意性图示。

图7是根据公开内容的实施例的方法的示意性图示。

具体实施方式

对特定示例性实施例的以下描述在本质上仅仅是示例性的而不旨在以任何方式限制本发明或者其应用或用途。在本系统和方法的实施例的以下具体实施方式中,参照了附图,附图形成本文的一部分,并且在附图中,通过例示的方式示出了其中可以实施所描述的系统和方法的具体实施例。足够详细描述了这些实施例以使得本领域技术人员能够实施当前公开的系统和方法,并且应当理解的是,在不脱离本系统的精神和范围的情况下可以利用其它实施例并且可以做出结构和逻辑改变。

因此,以下具体实施方式不应在限制性的意义上理解,并且本系统的范围仅由所附权利要求来限定。本文中在附图中的附图标记的前面的数位通常对应于附图号,例外是出现在多个图中的相同组件用相同的附图标记来识别。此外,为了清楚起见,当特定特征的详细描述对于本领域技术人员来说将显而易见时,将不会讨论这些详细描述,以便不会混淆本系统的描述。

尽管描述了对病原体的识别,但是本申请仅被提供用于示例性的目的。本文中所描述的方法、系统和装置可以用于各种各样的应用,而不限于病原体识别。其它应用可以包括但不限于系谱学、法医学、以及植物学。

感染可能由诸如细菌、病毒、真菌、寄生虫、或其它微生物的病原体引起。某些感染可能由同时出现的多种类型的微生物引起。

当检测到感染时,可以由医护人员从患者收集样本。样本可以包括组织、血液、和/或体液。样本随后可以被处理以将造成感染的病原体与样本中的其它材料分离。感染分离物随后可以通过各种方法来进行分析。分析可以确定病原体类型、种类、抗药性、和/或其它属性。

可以对感染分离物的基因材料进行测序。测序方法的示例包括单分子实时测序、焦磷酸测序、以及聚合酶克隆测序。也可以使用其它测序方法。使用高通量测序(也被已知为下一代测序),基因材料并行地被测序,这可以生成数千到数百万序列片段。通过测序方法生成的序列片段通常被称为“序列读取”或简单来说“读取”。读取可以从几十到数以万计碱基对长度中的任意。在一些测序方法中,读取可以是感染分离物序列的整个长度。感染分离物的读取随后可以被分析以找到与参考序列的匹配。一个或多个读取与已知序列的匹配的过程通常被称为对齐。

已经开发了用于对齐序列和/或读取的若干算法。可以使用某些算法(例如,smith-waterman和needleman-wunsch算法)来找到读取与参考序列之间的最佳对齐。即使在最佳对准的情况下,在读取与参考序列之间可能存在失配和/或间隙。间隙可能由于行中的失配碱基的串和/或参考序列与读取之间的长度上的差别。可以提供读取和参考序列在最佳对齐处对齐地多好的分数或其它量度(例如,匹配的核酸的总数量、最长间隙的长度等等)。最佳对齐算法可以提供最准确的结果,但是当大量读取和/或参考序列要被对齐时,这些算法中的大多数算法的计算强度使得它们难以实施。

已经开发了可以增加序列对齐的速度的概率算法,但是以不保证最佳对齐为代价。这些算法可以提供已经发现最佳对齐的概率和/或已经从数据库中的参考序列的集合中发现读取与参考序列之间的最佳匹配的概率的量度。

一族概率算法将读取和序列分割成k-mer,或者包括若干(k个)碱基对的“词语”。算法随后搜索读取k-mer与参考序列k-mer中的匹配。这种算法的示例是局部序列对齐基本搜索工具(blast)。另一族概率算法向读取和序列应用诸如borrows-wheeler变换(bwt)的变换。变换可以减少序列的部分的相同副本的数量,这减少了对齐时间。这种类型的对齐算法的示例是bowtie算法。可以使用其它概率算法的族(lih,homern,“asurveyofsequencealignmentalgorithmsfornext-generationsequencing,”briefingsinbioinformatics,2(5),472-483,2010.)

许多概率算法生成指向初级数据结构中的元素的被称为搜索索引的次级数据结构。例如,在书中,搜索索引提供指向页面主要主题和点的列表,在该页面上主要主题被讨论。在该应用中,主要数据结构中的元素是序列。这些索引可以针对参考序列和/或来自样本的序列读取而被被生成。搜索索引可以提供针对则所选择的算法进行的搜索而被优化的数据结构,用于找到匹配序列和/或序列段。搜索索引可以允许算法更迅速地和/或更准确地对齐语段和序列。针对这种提高的在性能上的折衷可以是额外的数据库和存储器中的存储空间以存储搜索索引。搜索索引结构的示例包括但不限于哈希表、后缀/前缀树、分箱、和线性索引。对齐算法可以利用一个或多个搜索索引。

根据本公开内容的实施例的用于将读取与一个或多个参考序列对齐的系统100的示例被示出为图1中的框图。以数字形式来自感染分离物样本的序列读取可以被包括在存储器105中。存储器105对处理单元115是可获取的。处理单元115可以包括一个或多个处理单元。处理单元115可以被配置为执行一个或多个对齐算法。处理单元115可以访问包括一个或多个参考序列和/或索引的数据库110。数据库110可以包括一个或多个数据库。处理单元115可以将其对齐的结果提供给显示器120和/或数据库110。显示器120可以是用户可见的电子显示器。任选地,处理单元115还可以访问计算机系统125。计算机系统125可以包括另外的数据库、存储器、和/或处理单元。计算机系统125可以是系统100的部分或者可以由系统100远程访问。在一些实施例中,系统100还可以包括测序单元130。测序单元130可以处理感染分离物以生成序列读取并且产生读取的数字形式。

图2是用于将读取与一个或多个参考序列对齐的示例方法200的流程图,其可以由系统执行,例如图1中示出的系统100。首先,可以在步骤205处接收序列读取。序列读取可以被加载到存储器中,例如存储器105。在步骤205处,随后可以将读取相对于搜索索引对齐。搜索索引可以指向存储在数据库(例如,数据库110)中的一个或多个参考序列。搜索索引也可以被存储在数据库中。处理单元(例如,处理单元115)可以使用对齐算法将读取与搜索索引对齐。对齐算法可以是先前描述的对齐算法中的一个。在对齐之后,在步骤215处,系统可以提供与读取最佳对齐的一个或多个参考序列。系统可以经由显示器(例如,显示器120)和/或另一计算机系统(例如计算机系统125)向用户提供这些结果。计算机系统可以允许结果对于其它系统可访问,例如,全医院感染跟踪系统或疾病控制中心(cdc)报告系统。也可以使用提供与读取最佳地对齐的参考序列的其它方法。其它结果也可以由系统提供。其它结果可以包括但不限于序列之间的匹配百分比、已经发现最佳对齐的百分比可能性、以及误差。

参考序列、读取、和/或索引可以存储在不同的数据库中。数据库可以存储在可由一个或多个处理单元访问的不同存储器中。在一些情形下,数据库中的一个或多个数据库可以跨多个存储器划分。例如,参考序列的数据库的部分可以存储在一个存储器中,而参考序列的数据库的第二部分可以存储在另一存储器中。每个存储器可以包含数据库的独特部分或者每个存储器可以包含也被存储在另一存储器中的数据库的部分。这可以在硬件故障的情形下提供备份保护和/或针对通常使用的数据的更快访问。

将数据隔开到多个数据库和/或多个存储器中可以允许一个或多个处理单元并行执行读取的对齐。这可以缩短计算时间。例如,指向1000个参考序列的搜索索引可以被划分成十个子索引,每个子索引指向100个参考序列。一个或多个处理单元可以访问存储器中的5000个读取,并且并行地将读取与每个索引进行对齐。与如果将5000个读取与整个搜索索引对齐相比,这可以得到较少时间的对齐。

图3a-图3b是以上描述的两种方法300a-300b的示意性例示。图3a例示了相对于整个搜索索引310对齐的读取的集合305以提供结果315。图3b例示了相对于子索引310a-f的集合对齐的读取的集合305以提供结果315。子索引310a-f可以存储在单个数据库或多个数据库中。数据库可以存储在可由一个或多个处理单元访问的一个或多个存储器上。读取的集合305可以与子索引310a-f存储在相同或不同的存储器中,子索引可以通过将搜索索引310随机地划分成段来生成。子索引310a-f也可以根据由子索引指向的参考序列之间的共性来生成。例如,第一子索引可以指向从agc开始的搜索索引的所有参考序列,第二子索引可以指向从cgc开始的所有参考序列。子索引可以根据系统发生度量来生成。

系统发生学是对生物体之间的进化关系的研究。这种关系通常被表示为加权的图,例如树。在图4中示出了系统发生树400的示例。可以在系统发生树中图示数据的不同等级的粒度。例如,代表子种类的分支可以被一起链接到单个种类。在另一示例中,树的每个分支可以代表单个种类。分支之间的链路可以将若干种类分组成诸如属之类的较大类别。两个或更多个属可以被链接到科中,等等。诸如突变率之类的另外的信息、生物体之间的进化距离也可以在系统发生树中传达。例如,分支的长度可以对应于两个生物体之间的进化距离。系统发生方法对生物体的基因序列的全部或一部分进行分析。通过确定参考序列的集合的进化历史,对参考序列、搜索索引、和/或子索引进行组织以减少将来自感染分离的读取与参考序列对齐所需要的时间是可能的。通过进化历史组织数据也可以提供对来自样本的感染分离体的病原体如何与其它病原体相关的理解。

存在多种系统发生方法,包括基于进化距离、约化、和最大似然性的方法。基于距离的方法是对每个生物体之间进化距离进行计算的方法。进化距离基于生物体的基因序列之间的相似性程度来计算。一种用于确定进化距离的这样方法被称为jukes-cantor(evolutionofproteinmoleculesinmammalianproteinmetabolism,vol.iii(1969),pp.21-132,t.h.jukes,c.r.canter,由m.n.munro编辑)方法,其中,从基因组中的任何特定核苷酸到另一个核苷酸的转变能够以相同的可能性发生:

上面在等式1中,瞬时速率矩阵q表示每个时间瞬间一对核苷酸之间的改变速率。p—概率变换矩阵被给出为:

p(t)=eqt公式2

因此,在该模型下任何两个生物体之间的进化距离简单地为:

其中,p是在序列之间不同的沿着单个核苷酸多态(snp)/dna的位点数量。当p接近平衡值时(75%的位点不同),距离变为无穷大。然而,该简单的模型并未考虑转变(嘌呤至嘌呤(a-g)或嘧啶到嘧啶(t-c))和颠换(嘌呤到嘧啶或反之亦然)以不同速率发生的生物考虑。另一距离模型,kimura2-参数模型(kimura,motoo.“asimplemethodforestimatingevolutionaryratesofbasesubstitutionsthroughcomparativestudiesofnucleotidesequences.”journalofmolecularevolution16.2(1980):111-120)尝试校正它。在这种情形下:

对于p(转变比率)和q(颠换比率)。

一旦已经比较了参考序列以确定它们的进化距离,就可以确定进化率。参考序列之间的进化距离和关系随后可以以图形形式绘制,例如,树图。邻接法(saiton,neim.“theneighbor-joiningmethod:anewmethodforreconstructingphylogenetictrees.”molecularbiologyandevolution,第4卷,第4期,第406-425页,1987年7月)是一种用于构建无根树的方法。该方法通过首先找出具有相同的父节点k的一对相邻的叶i和j来校正序列之间的不相等的进化速率。也就是说,叶i和j可以是从共同的病原体k进化的病原体。叶i和j随后可以从叶节点的列表去除,并且k被添加到当前的节点列表,并且重新计算节点距离。该算法是贪婪“最小进化”算法的示例。

构建系统发生树的另一种方法是利用算术平均数的未加权的组配对方法(upgma)(sokalr.,michenerc.“astatisticalmethodforevaluatingsystematicrelationships.”unversityofkansassciencebulletin38:1409-1438,1958)。upgma算法是凝聚的并且生成有根树。最初,每个序列定义单个聚类。在每次迭代中,聚类被组合以形成较大的聚类。这会继续直到所有的序列被包括在单个聚类中。在每次迭代中,被发现具有最短进化距离的序列的两个聚类被组合成更高等级的聚类。聚类之间的进化距离是每个聚类中的对应的序列对之间的所有进化距离的平均。算法反复迭代,直到所有的参考序列被置于树中。

单联聚类是与upgma类似的用于构建有根树的方法。然而,代替使用聚类之间的所有对应的序列对之间的平均进化距离,聚类之间的进化距离通过第一聚类中的序列与第二聚类中的序列之间的最小距离来定义。也就是说,单对序列的距离定义聚类之间的距离。

全联聚类也是与upgma和单联聚类类似的用于构建有根树的方法。与单联聚类相同,单对序列之间的进化距离(每个包括在不同聚类中)定义两个聚类之间的进化距离。然而,在全联聚类中,具有最大进化距离的序列对定义两个聚类之间的进化距离。

与邻接法不同,upgma算法和相关的聚类算法假定了恒定的进化速率。以上生成系统发生树的方法仅被提供用于示例的目的。在不脱离本公开的范围的情况下,可以使用其它生成系统发生树的方法。

图5是根据本公开内容的实施例的用于生成搜索索引和子索引的方法500的流程图。首先,在步骤505处,针对参考序列的集合生成搜索索引。例如,哈希表索引。第二,在步骤510处,生成参考序列的集合的系统发生树。系统发生树可以通过先前所描述的方法中的一种或多种方法和/或另一种方法来生成。在一些实施例中,步骤510可以前进到步骤505。在已经生成系统发生树之后,在步骤515处,搜索索引被划分成子索引。搜索索引可以按系统发生树的分枝来划分成子索引。分枝的示例包括但不限于属、进化枝、分枝、和门。也可以使用其它系统发生度量来约束分枝。例如,在设定的彼此之间的进化距离内的种类和/或具有相同的突变率的种类。子索引随后可以被存储在一个或多个数据库和/或存储器中。一旦生成,子索引可以被重复用于读取的对齐。然而,如果参考序列的集合被更改,则方法500可以重复。例如,新的参考序列可以添加到集合中或从集合中去除。

如先前提及的,下一代测序方法可以针对单个感染分离物生成数千到数百万读取。即使索引已经被划分成子索引,并行地将所有读取与每个子索引对齐可能花费很长的一段时间。图6是根据本公开的实施例的将读取划分成用于对齐的子集的示例的方法600的示意性例示。读取的集合605可用于生成测试集606。测试集606可以包括从读取的集合605中随机选择的读取。测试集606随后可以并行地与子索引610a-f中的全部进行对齐。这可以用于生成对齐的结果615。结果615可以是最可能与测试集606具有最佳对齐的参考序列。结果615可能不如利用所有读取605的结果(例如,结果315)那么准确。或者,结果615可以指示哪个子索引610a-f指向具有最佳对齐的参考序列,例如,子索引610b。如图6中示出的,所有读取605随后可以与子索引610b进行对齐,并且该对齐的最终结果617随后可以是最可能具有与读取的最佳对齐的参考序列。这减少了读取的整个组605与其对齐的参考序列的数量,这可以减少计算时间。

对读取的集合进行细分的其它变更是可能的。例如,读取的集合可以被划分成任何数量的测试集,并且每个测试集可以与一个或多个子索引对齐。测试集可以被存储在可由一个或多个处理单元访问的一个或多个存储器中。测试集可以被存储在与搜索索引和/或子索引相同或不同的存储器中。测试集如果被组合的话可以包括整个读取的集合。然而,测试集如果被组合的话可以仅包括整个读取的集合的子集。这可以减少对齐测试集所需要的计算时间。被发现具有与一个或多个测试集的最佳对齐的子索引随后可以与读取的整个集合进行对齐。如果较不准确的结果就足够的话,则该步骤可以被省略。

当子索引是从由索引指向的参考序列生成的系统发生树的分枝时,对齐可以返回系统发生信息作为结果的至少一部分。例如,在已经将从对感染分离样本进行测序生成的读取的集合与一个或多个子索引进行对齐之后,结果可以包括感染分离物的最可能的种类。也可以提供其它系统发生信息。

图7是根据本公开内容的实施例的将种类与多个序列读取700进行对齐的示意性例示。方法可以由系统(例如图1中示出的系统100)来实施。已经从样本获得感染分离物。感染分离物随后可以已经由生成多个读取的测序技术来进行测序。多个读取随后可以以电子形式被提供给存储器。存储器然后可以包含读取的集合705。读取的集合然后可以被划分成一个或多个测试集706a-706e。尽管示出了六个测试集,但是可以从读取705的集合生成任意数量的测试集。

参考序列的数据库710也可以被存储在存储器中或存储在单独的存储器中。参考序列可以是针对所有生物体的已知参考序列的完整集合或者可以是已知参考序列的完整集合的子集,例如,仅来自细菌的参考序列。可以针对数据库710中的参考序列生成搜索索引。搜索索引也可以被存储在数据库710中。在一些实施例中,数据库710可以包括多个数据库。可以针对参考序列生成系统发生树。基于系统发生树,可以生成一个或多个子索引710a-e。每个子索引710a-e都可以指向系统发生树的对应分枝中的参考序列。例如,每个子索引710a-e都可以表示参考序列的系统发生树的进化枝。尽管示出了五个子索引,但是可以从搜索索引生成任意数量的子索引。搜索索引和子索引的生成可以在接收读取的集合之前执行。搜索索引和子索引的生成可能仅需要被执行一次,并且得到的搜索索引和子索引可以针对任意数量的读取的集合使用多次。

一个或多个处理单元可以访问测试集706a-e并且将每个测试集706a-e与对应的子索引710a-e进行对齐。每个测试集与每个子索引的对齐可以并行地执行。在一些实施例中,测试集706a-e可以仅与子索引710a-e中的某些子索引对齐。例如,某些子索引可以对应于已知不包含病原菌种类的系统发生树的分枝。当搜索感染分离物的种类时,这些子索引随后可以从对齐中排除。处理单元可以分析对齐的结果715并且识别具有最佳对齐的子索引或包含最佳对齐的最高可能性的子索引。在图7中示出的示例中,子索引710c是最佳子索引。

读取的集合705随后可以被划分成一个或多个子集707a-e。尽管示出了五个子集,但是可以根据读取的集合705生成任何数量的子集。子集707a-e在被组合时可以包括读取705的完整集合。子集707a-e可以与测试集706a-e相同或不同。例如,如果组合的测试集706a-e仅包括读取的集合705中的读取的部分,则子集707a-e可以不同。在另一示例中,可以生成比测试集更多或更少的子集。

一个或多个处理单元可以访问子集707a-e并且可以将每个子集707a-e与最佳索引710c并行对齐。在一些实施例中,可以生成最佳索引710c的多个副本来促进对齐的并行处理。也可以使用促进并行处理的其它方法。处理单元可以分析子集707a-e与最佳子索引710c的对齐的结果。处理单元随后可以返回感染分离物的最可能的种类的结果717。如先前描述的概率统计方法可以用于最可能的种类的对齐。也可以与结果717一起提供其它信息。例如,可以包括已经识别了正确种类的可能性、最可能的种类的参考序列与感染分离物的序列读取之间的相似性程度、和/或其它可能的种类。结果717可以在电子显示器上被提供给用户、被发送到外部计算机系统、和/或存储在存储器中。

以上所描述的系统、方法、和装置可以通过减少将种类与来自感染分离物的序列读取进行对齐的计算时间而改进患者结果。当患者被确定为具有感染时,可以从患者收集样本。样本可以被处理以获得感染分离。感染分离物随后可以通过生成多个序列读取的测序设备来进行测序。根据本公开内容的实施例,序列读取可以被转换成电子形式并被提供给系统,以将序列读取与参考序列进行比较来确定感染分离物的种类。系统可以使用以上所描述的读取和/或搜索索引的细分的一种或多种方法,这可以减少将种类分配给感染分离物所需要的计算时间。感染分离物的种类对齐可以允许临床医生针对感染患者的特定病原体实施最有效的处置。这可以减少感染与开始最有效的处置之间的时间。这也可以减少利用可能具有不期望的副作用的无效或不那么有效的处置来处置患者。例如,如果确定感染由对广谱抗生素有抵抗力的细菌造成,则可以避免广谱抗生素处置。

以上所描述的系统、方法、和装置可以允许较低成本的存储器、数据库、和/或处理单元用于实施方式。这可以增加对测序和对齐能力的访问。

应该领会,根据本系统、设备和方法,以上实施例或过程中的任何一个实施例或过程可以与一个或多个其它实施例和/或过程组合或者在单独的设备或设备部分中分开和/或执行。

最后,以上讨论旨在仅仅例示了本系统并且不应当被解释为将所附权利要求限制到任何特定的实施例或实施例的组。因此,尽管已经参照示例的实施例经特定细节描述了本系统,但是应该领会,在不脱离如所附权利要求中阐述的本系统的较宽的和旨在的精神和范围的情况下,本领域普通技术人员可以设计出许多修改和替代的实施例。因此,说明书和附图就被视为例示性的方式,而不旨在限制所附权利要求的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1