用于传送并且预处理测序数据的系统和方法与流程

文档序号:19422514发布日期:2019-12-14 01:42阅读:来源:国知局

技术特征:

1.一种传递多个组学序列的方法,所述方法包括:

提供对第一计算机的访问,第一计算机与第二计算机耦接;

通过第一计算机从多个相应测序装置接收多个组学输出文件,其中,组学输出文件中的每个包括序列数据和机器专用注释;

其中,组学输出文件是基因组输出文件、rna-组学输出文件、或蛋白质组输出文件;

通过第一计算机使用从用户输入的注释来注释所述多个组学输出文件,从而形成带注释的组学输出文件;

通过第一计算机将所述带注释的组学输出文件分组成传输组,其中,基于所述机器专用注释和从用户输入的所述注释进行分组;以及

通过第一计算机将所述传输组传递到第二计算机。

2.根据权利要求1所述的方法,还包括如下步骤:通过第一计算机或第二计算机分别向第二计算机或第一计算机发送反馈信号,以修改第一计算机、第二计算机和测序装置中的至少一个的操作。

3.根据权利要求1所述的方法,其中,操作包括将所述多个组学输出文件从原始格式转换成sam格式或bam格式。

4.根据权利要求1所述的方法,其中,操作包括在通过第一计算机接收所述多个组学输出文件的步骤之前将所述多个组学输出文件暂时存储在存储器中。

5.根据权利要求1所述的方法,其中,操作包括改变操作参数或使测序装置离线。

6.根据权利要求1所述的方法,其中,操作包括传递额外的组学数据。

7.根据权利要求1所述的方法,其中,操作包括停止从第一计算机传递所述传输组。

8.根据权利要求1所述的方法,其中,操作包括在测序装置中重复特定的组学分析。

9.根据权利要求1所述的方法,其中,操作包括从第二计算机发送指示特定数据的存在或不存在的信号。

10.根据权利要求1所述的方法,其中,所述多个测序装置中的至少一个从第一计算机或第二计算机接收另一反馈信号。

11.根据权利要求1所述的方法,其中,所述多个测序装置中的至少一个从第一计算机和第二计算机接收另一反馈信号。

12.根据权利要求1所述的方法,其中,所述机器专用注释包括选自由日期和/或时间标识符、测序装置标识符、通道标识符、质量分数和配对成员标识符组成的组的注释。

13.根据权利要求1所述的方法,其中,从用户输入的注释包括选自由分析类型注释和患者专用注释组成的组的注释。

14.根据权利要求11所述的方法,其中,所述分析类型注释选自由整体基因组分析、外显子组富集分析、转录组分析和蛋白质组分析组成的组。

15.根据权利要求1所述的方法,其中,实时执行分组的步骤。

16.根据权利要求1所述的方法,其中,在完成形成所述传输组时,执行传递所述传输组的步骤。

17.根据权利要求1所述的方法,其中,分组的步骤独立于实际序列内容执行。

18.一种用于传递多个组学序列的计算机系统,包括:

第一计算机,与第二计算机耦接,其中,第一计算机包括与存储软件指令的存储器耦接的处理器;

其中,软件指令将处理器配置为:

从多个相应测序装置接收多个组学输出文件,其中,组学输出文件中的每个包括序列数据和机器专用注释;

其中,组学输出文件是基因组输出文件、rna-组学输出文件、或蛋白质组输出文件;

使用从用户输入的注释来注释所述多个组学输出文件,从而形成带注释的组学输出文件;

将所述带注释的组学输出文件分组成传输组,其中,基于所述机器专用注释和从用户输入的所述注释进行分组;以及

将所述传输组传递到第二计算机。

19.根据权利要求18所述的计算机系统,其中,所述软件指令还将所述处理器配置为:通过第一计算机或第二计算机分别向第二计算机或第一计算机发送反馈信号,以修改第一计算机、第二计算机和测序装置中的至少一个的操作。

20.根据权利要求18所述的计算机系统,其中,操作还包括将所述多个组学输出文件从原始格式转换成sam格式或bam格式。

21.根据权利要求18所述的计算机系统,其中,操作包括在通过第一计算机接收所述多个组学输出文件的步骤之前将所述多个组学输出文件暂时存储在存储器中。

22.根据权利要求18所述的计算机系统,其中,操作包括改变操作参数或使测序装置离线。

23.根据权利要求18所述的计算机系统,其中,操作包括传递额外的组学数据。

24.根据权利要求18所述的计算机系统,其中,操作包括停止从第一计算机传递所述传输组。

25.根据权利要求18所述的计算机系统,其中,操作包括在测序装置中重复特定的组学分析。

26.根据权利要求18所述的计算机系统,其中,操作包括从第二计算机发送指示特定数据的存在或不存在的信号。

27.根据权利要求18所述的计算机系统,其中,所述多个测序装置中的至少一个从第一计算机或第二计算机接收另一反馈信号。

28.根据权利要求18所述的计算机系统,其中,所述多个测序装置中的至少一个从第一计算机和第二计算机接收另一反馈信号。

29.根据权利要求18所述的计算机系统,其中,所述机器专用注释包括选自由日期和/或时间标识符、测序装置标识符、通道标识符、质量分数和配对成员标识符组成的组的注释。

30.根据权利要求18所述的计算机系统,其中,从用户输入的注释包括选自由分析类型注释和患者专用注释组成的组的注释。

31.根据权利要求30所述的计算机系统,其中,所述分析类型注释选自由整体基因组分析、外显子组富集分析、转录组分析和蛋白质组分析组成的组。

32.根据权利要求18所述的计算机系统,其中,实时执行分组的步骤。

33.根据权利要求18所述的计算机系统,其中,在完成形成所述传输组时,执行传递所述传输组的步骤。

34.根据权利要求18所述的计算机系统,其中,分组的步骤独立于实际序列内容执行。

35.一种包含程序指令的非暂时计算机可读介质,所述程序指令用于使包括第一计算机和第二计算机的计算机系统执行包括以下步骤的方法:

提供对第一计算机的访问,第一计算机与第二计算机耦接;

通过第一计算机从多个相应测序装置接收多个组学输出文件,其中,组学输出文件中的每个包括序列数据和机器专用注释;

其中,组学输出文件是基因组输出文件、rna-组学输出文件、或蛋白质组输出文件;

通过第一计算机使用从用户输入的注释来注释所述多个组学输出文件,从而形成带注释的组学输出文件;

通过第一计算机将所述带注释的组学输出文件分组成传输组,其中,基于所述机器专用注释和从用户输入的所述注释进行分组;以及

通过第一计算机将所述传输组传递到第二计算机。

36.根据权利要求35所述的计算机可读介质,其中所述程序指令使所述计算机系统执行进一步的步骤:通过第一计算机或第二计算机分别向第二计算机或第一计算机发送反馈信号,以修改第一计算机、第二计算机和测序装置中的至少一个的操作。

37.根据权利要求35所述的计算机可读介质,其中,操作还包括将所述多个组学输出文件从原始格式转换成sam格式或bam格式。

38.根据权利要求35所述的计算机可读介质,其中,操作包括在通过第一计算机接收所述多个组学输出文件的步骤之前将所述多个组学输出文件暂时存储在存储器中。

39.根据权利要求35所述的计算机可读介质,其中,操作包括改变操作参数或使测序装置离线。

40.根据权利要求35所述的计算机可读介质,其中,操作包括传递额外的组学数据。

41.根据权利要求35所述的计算机可读介质,其中,操作包括停止从第一计算机传递所述传输组。

42.根据权利要求35所述的计算机可读介质,其中,操作包括在测序装置中重复特定的组学分析。

43.根据权利要求35所述的计算机可读介质,其中,操作包括从第二计算机发送指示特定数据的存在或不存在的信号。

44.根据权利要求35所述的计算机可读介质,其中,所述多个测序装置中的至少一个从第一计算机或第二计算机接收另一反馈信号。

45.根据权利要求35所述的计算机可读介质,其中,所述多个测序装置中的至少一个从第一计算机和第二计算机接收另一反馈信号。

46.根据权利要求35所述的计算机可读介质,其中,所述机器专用注释包括选自由日期和/或时间标识符、测序装置标识符、通道标识符、质量分数和配对成员标识符组成的组的注释。

47.根据权利要求35所述的计算机可读介质,其中,从用户输入的注释包括选自由分析类型注释和患者专用注释组成的组的注释。

48.根据权利要求47所述的计算机可读介质,其中,所述分析类型注释选自由整体基因组分析、外显子组富集分析、转录组分析和蛋白质组分析组成的组。

49.根据权利要求35所述的计算机可读介质,其中,实时执行分组的步骤。

50.根据权利要求35所述的计算机可读介质,其中,在完成形成所述传输组时,执行传递所述传输组的步骤。

51.根据权利要求35所述的计算机可读介质,其中,分组的步骤独立于实际序列内容执行。


技术总结
本公开涉及用于传送并且预处理测序数据的系统和方法。公开了“组学”数字数据传输系统和方法。公开的系统和方法采用传输服务器,该传输服务器基于来自一个或多个测序装置的机器专用注释和与组学输出文件的一种或多种属性相关的用户输入来聚集较大量的组学输出文件的传输组。

技术研发人员:S·C·本茨;J·Z·萨伯恩;C·J·瓦斯凯
受保护的技术使用者:凡弗3基因组有限公司
技术研发日:2014.11.13
技术公布日:2019.12.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1