健康护理分析流的管理的制作方法

文档序号:8531913阅读:242来源:国知局
健康护理分析流的管理的制作方法
【专利说明】
[0001] 此申请获得了美国临时申请,申请号为61 /668941,申请日为2012/07/06的申请 优先权;美国临时申请,申请号为61/673943,申请日为2012/07/20的申请优先权;以及美 国临时申请,申请号为61/842316,61/842323和61/842325,申请日为2013/07/02的申请优 先权。这些和此中讨论的其它所有外部材料都互相合并成一整体被引用。
技术领域
[0002] 本发明涉及基因组分析技术。
【背景技术】
[0003] 随着基因组分析技术的提高,需要处理大量原始序列数据用于提供信息,以便快 速的为一保健对象,病人,或健康护理提供者提供预检,诊断,并且其它的基于基因组的分 析的能力并没有随之提高。研宄者曾付出了一些努力以产生更有效的基因组分析,但所有 这些努力都失败了,这些努力包括提供这种覆盖大量的与个体和种群相关的数据集的分 析。
[0004] Hytopoulos的国际申请,No. PCT/US2002/014665讨论了一种装置和方法,用于在 一数据网络中主从式环境下执行基因分析。然而,Hytopoulos未能利用大规模或遍及大陆 的光纤网络的优势,以并行地解析基因组信息片段,并用于分析。
[0005] Sanborn的美国专利公开号为No. 2012/0066001 Al的专利讨论了一种方法,用于 相对于一参考基因组序列,使用已知的子串位置,通过递增的序列串的同步,以获得基于子 串的队列的不同基因序列对象。然而,Sanborn看起来并没有讨论利用多个连接至一分析 网络的分析节点,以并行地从多个病人中处理序列数据。
[0006] Steward的国际申请,No. PCT/US1999/020449讨论了一种方法,用于基因组的数 据发现,这种发现过程如下:提供一基因数据库,从中至少选择10个基因,从所选的基因中 加以了解,对多个基因重复这些步骤,重复这些步骤直到所有选择的基因基本上并行地被 了解了。然而,steward看起来并没有讨论利用一分析网络和多个分析节点,以便对一保健 对象,一病人,或健康护理提供者提供快速和有效的检测结果。
[0007] Dyer的国际申请,No. PCT/US2000/042469讨论了一计算机搜索工具及支持的数 据库,以用于分析基因组。然而,Dyer看起来并没有讨论从多个序列设备中获得序列数据, 也没有利用连接至一分析网络的多个分析节点,以并行地从病人处处理序列数据。
[0008] 这些和此中讨论的其它所有外部材料都互相引用合并成一整体。其中在一引用合 并中,一定义或一术语的使用对此中提供的术语的定义是不一致或相反的,此中提供的术 语的定义同引用术语的定义不同。
[0009] 除非文中特意否认,此中提出的所有范围应当解释为包括它们的端点,并且两端 未封闭的范围应当解释为包括商业上的实际价值。类似的,所有可能的值应当认为包括中 间值,除非文中特意否认。
[0010] 至今为止,从基因组分析中获取有用信息的能力已经被如下方式的受挫所阻碍: (1)快速的传送大基因数据至位于集中的数据中心的计算机,以用于处理和存储;(2)精确 的评估所有在病人的癌症组织的DNA中发现的不同;(3)在一异质的疾病,比如癌症中识别 许多克隆体;(4)预测在细胞的信号通路上每个克隆体的不同的系统性影响。
[0011] 因而,仍需要利用大规模的网络,以及遍及大陆的光纤网络,以提供基因组分析流 的管理。

【发明内容】

[0012] 本发明的主旨是,提供一装置,系统和方法,可使人们使用一计算机/基于服务器 的系统分析基因组数据,此类分析是通过贯穿一网络的分布式分析系统完成的。本发明包 括一基因组分析系统,以通过使用一序列设备接口,一分析网络和多个通过分析网络连接 的分析节点,并行地处理从许多病人处得来的基因组序列。这个序列设备接口可以设置成 从许多序列设备,从图像识别程序或设备,和/或一或多个存储序列信息的数据库中,并行 地获得序列数据,基因组分析系统的分析节点可包括引擎管理节点,网络交换机,高性能计 算设备(HPCs),或基因组的流管理节点,以交换一些序列数据和基因组数据。基因组的流管 理节点可以设置成基于流管理功能管理分析引擎。此分析网络和多个分析节点包括基因组 分析引擎,和一或多个来源于之前的序列流量,参考序列中,需要的存储序列信息的数据库 等。此分析引擎可以处理序列数据,以产生单个病人或病人的统计的基因组数据,并把数据 同一来自病人种群的标准的基因组序列或统计样本进行比较。此分析引擎也可以处理序列 数据图像识别程序或图像识别设备。此分析网络可以包含一光纤数据链路,一地理分布的 光纤网络,或甚至一横跨大陆的网络。
[0013] 基于基因组数据,处理或分析状态,警报或告警,序列设备指令,分析推荐规范,预 检或诊断,或进一步分析的需求,基因组分析系统产生了通知。通知系统可以在分析网络中 建立一路由,以允许将通知发送至一保健对象,一序列设备,一病人,一健康护理提供者,或 者是其中的组合。分析引擎也可以在分析节点中建立处理路由,以便于每个节点可以进行 不同的分析。处理路由(例如,一数据流路由,一分析路由,一通知路由等)可以设置成具 有预期的诊断,优先级,紧急情况,序列注释,或其它种类的功能,以平衡网络负载。基因组 分析系统可以包括一管理接口,以允许用户提供反馈和序列设备说明。
[0014] 本发明也包括一添加在序列系统的扩展模块,以预分析原始数据,以产生一序列 注释,并根据这些序列注释汇编和前移预分析的数据至一序列分析设备,比如一高性能计 算设备。原始的序列数据可包括基因组序列数据,蛋白质组序列数据,RNA和小型RNA序列 数据,以及后生的序列数据。序列注释可包括不同的处理参数,序列信息,或病人信息。扩 展模块可设置成把预分析的序列数据打包成分析设备可接收的格式。扩展模块也可包括一 许可证管理器,它管理者分析设备和控制模块间的通讯。扩展模块可进一步的包括一序列 设备控制器,以便基于来自分析设备的指令,发送命令至序列设备。扩展模块也可包括一存 储设备控制器,以便基于预分析的序列数据,发送命令中存储设备。扩展模块可以是一硬件 模块,用于连接一遗留的序列设备。在其它的实施例中,序列设备或分析设备本身可以作为 扩展模块。
[0015] 本发明进一步包括一种方法,用于预处理原始数据,以提供至一先验知识库的接 口,以及一预处理的引擎,以接收和预处理原始数据,并联合原始序列数据与序列注释,以 产生预处理的序列数据,并转移预处理的序列数据至一序列基因组分析设备。预处理方法 也可包括一步骤,以便基于一相对于或在染色体之内的位置,从一先验知识库中,粗略的使 原始数据读数相对于一已知的基因组图排成一排;并与一已知的等位基因,标记,或突变; 或其中的组合有关。此步骤产生一粗略的队列,可成为序列注释的一部分。序列注释也可 包括已知的基因或疾病标记,管理代码,路由信息,病人信息,一人口统计,一地理坐标,一 监管链,一疑似诊断,一分析优先次序,或一告警促发。预处理原始序列数据的方法可进一 步包括分析设备的带内预处理,这基本上是同原始序列数据的接收同时发生的。
[0016] 本发明也额外的包括一交互式序列分析系统,其中一或多个序列设备适配器连接 了一或多个分析引擎,以至少同一分析引擎和目标序列设备双向交换数据。序列数据可被 预处理。序列设备适配器可包含多个适配器,其中每个适配器瞄准了一不同类型的序列机, 以便于一混合的程序装置可以和一单个,普通的核心分析引擎工作。分析引擎可包括一分 布式的分析引擎,具有多个分析节点,其中节点自身可以在地理上广泛分布。分析引擎通过 网络,或通过光纤网络,依靠排序设备适配器,提交排序指令至目标排序设备。基于病人或 疾病信息,序列指令包括送至目标排序设备和分析引擎的指令或命令,以重复,开始或停止 排序;删除,发送或转移数据;区分或安排排序指令,或给出许可证管理指令。
[0017] 本发明包括一基因组存储设备,带有一分布式基因组数据库和一基因组搜索引 擎。基因组数据库可存储基因组数据记录,数据记录同病人的种群相关,并可以被许多种独 特的,人口统计的,或医学的标识所索引。基因组数据可包括基于时间,人口统计,标准化序 列,基病,或外部因素,在病人序列和参考序列间的不同点。基因组数据库可存储与存储器 中,存储器分布在网络或光纤网络中的基因组分析节点,例如高速计算机设备。基因组搜索 引擎可从数据库中返回记录,以响应一自然语言或机器问询。
[0018] 本发明不同的对象,功能,范围和优点将会由下列的优选的实施例的描述而变得 显而易见,并连同带有数字以表明部件的附图一同显示。
【附图说明】
[0019] 图1是National LambdaRail?的示意图,可以作为基因组分析系统的主干网; 图2是基因组分析引擎的示意图,能够通过一或多个排序设备与之相连; 图3是一扩展模块的示意图,能够配置一排序设备,以与一基因组分析设备互相联系; 图4是一种用于预分析基因组序列数据方法的示意图; 图5是一交互式排序系统的示意图,其中一分析设备可向一排序设备提供排序指令; 图6是一基因组存储设备的示意图; 图7是一健康护理分析流管理生态系统的示意图。
【具体实施方式】
[0020] 应当注意,当以下内容描述了一基于基因组分析系统的计算机/服务器时,不同 的配置也被视为合适的,并可以使用不同的计算设备,包括服务器,接口,系统,数据库,代 理点,对端,引擎,模块,控制器,或其它类型的独立运行或集中运行的计算设备。计算设备 包括至少一处理器,可能为多核处理器,用于执行存储在一有形的,永久的计算机可读存储 媒介(例如,硬盘,固态硬盘,RAM,闪存,R0M,存储器,分布式存储器等)上的软件指令。优 选的,软件指令配置或程序化计算设备,以提供下述公开的装置相关的作用,职责或其它功 能。在特别优选的实施例中,不同的服务器,系统,数据库,或接口,使用标准协议或算法, 协议或算法可能基于HTTP,HTTPS,AES,公有-私有密匙交换,网络服务API,已知的金融 业务协议,或其它的电子信息交换方法,以交换数据。优选的,数据交换在一包交换网络, Internet,LAN,WAN,VPN,或其它类型的包交换网络中进行。
[0021] 公开的技术提供了许多有利的技术效果,包括产生一或多个信号,用于配置基因 组分析设备,以参与一基因组分析。信号可以根据从一基因序列中获得的信息产生。进一步 的,信号可以代表配置参数,可能包括参数影响分析,路由,存储,通知,许可证管理,管理, 告警,目录,日志,报告,安全,元数据,仪表盘,分析数据流,或其它的基因组分析。
[0022] 下述讨论提供了本发明的许多实施例。虽然每个实施例代表了发明元素的结合, 本发明被认为包括了所有公开元素的可能结合。因而如果一实施例包含元素 A,B和C,而 另一实施例包含元素 B和D,那么本发明也被认为包含了剩余其它的A,B,C和D的结合,即 使没有明确的公开。
[0023] 由于在描述中使用的和贯穿权利要求中使用的下列术语,"一","一"和"所述"的 含义包括复数的引用,除非文中清楚的另有所指。并且,由于在描述中使用的下列术语,"之 内"的含义包括"在内部"和"在上面",除非文中清楚的另有所指。
[0024] 本发明另一元素或实施例的分组并没有被理解为受限的。每个组成员可以被单个 的,或与其它组成员一起,或由其它发现的元素来解释和声明。一或多个的组成员可以由于 便利和/或专利性的原因从一组中加入或删除。当任何加入或删除发生时,说明书被认为 是包含修改的组,因而充实到所有Markush组的权利要求中去。
[0025] 除非本文中另有所指,术语"连接"的意思是包括直接连接(其中两个元素互相连 接,互相接触),以及间接连接(其中至少一附加元素位于两个元素之间)。因而,术语"连 接"和"结合"意义相同。而且,术语"连接"和"结合"婉转的表达了"通信连接"的含义, 其中网络设备可以通过网络互相
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1