本公开涉及数据处理,尤其涉及一种基因文库的混合方法及装置、电子设备和存储介质。
背景技术:
1、在全基因组测序(whole genome sequencing,wgs)、全外显子组测序(whole-exome sequencing,wes)、全转录组测序(total rna-seq)等产品的脱氧核糖核酸(deoxyribonucleic acid,dna)测序过程中,通常文库混合(pooling)是测序文库上机前的最后一步,文库pool ing指的是将不同物种的样本或数据量不相同的样本在一次上机中混合在同一条流通槽(lane)。
2、相关技术中,pooling实验通常需要根据pooling任务单转换为将pool ing方案中样品名称、文库编号、标准品、稀释倍数、混合体积、混合后文库号和补eb体积等信息粘贴至pooling操作表格,再由操作者协作,根据表单信息将文库归一化到一定浓度,将需要合并测序的文库混合,耗时耗力。这种人工操作的文库混合实验需要满足两个条件:条件一:在同一条流通槽中样本不能重复。条件二:样本总数据量足够多。
3、因此,采用传统的人工混合方法进行文库混合实验时,由于文库混合过程中的样本数据量较大,不仅会造成对样本进行组合排序和对样本进行混匀离心的工作量巨大,不仅耗费大量的人力资源,并且速度较慢、易出错。
技术实现思路
1、本公开提供了一种基因文库的混合方法、装置、电子设备和存储介质。其主要目的在于解决传统的人工混合方法由于样本数据量大导致的工作量巨大,从而造成耗费大量的人力资源、速度较慢、易出错的问题。
2、根据本公开的第一方面,提供了一种基因文库的混合方法,其中,包括:
3、根据目标排单表将目标基因文库放置于对应的目标取样孔内,其中,所述目标排单表中包含基因文库号、取样孔标识、基因文库的取用体积、混合后文库号、目的孔标识、保存缓冲液体积之间的映射关系,所述基因文库存在唯一的基因文库号;
4、基于同一混合后文库号,从所述目标取样孔内按照多个目标基因文库分别对应的基因文库的取用体积,分别吸取对应的多个目标基因文库;其中,同一混合后文库号对应多个目标基因文库;
5、将吸取的多个目标基因文库放置于所述目的孔标识对应的目的孔内,并在所述目的孔内添加多个目标基因文库分别对应的保存缓冲液体积,得到混合后的基因文库。
6、可选地,在根据目标排单表将目标基因文库放置于对应的目标取样孔内之前,所述方法还包括:
7、响应于原始基因文库的属性信息的输入指令,从所述属性信息中获取与预设的表头信息对应的待写入数据,写入至所述预设的表头信息对应的目标列中,得到第一排单表;所述预设的表头信息至少包含基因文库号、取样孔标识、基因文库的取用体积、混合后文库号、目的孔标识、保存缓冲液体积;
8、对所述第一排单表中的预设的表头信息对应的目标列中记录的数据进行校验;
9、将校验出错的数据进行反馈,待修正后输出校验后的所述第一排单表。
10、可选地,在根据目标排单表将目标基因文库放置于对应的目标取样孔内之前,所述方法还包括:
11、响应于原始基因文库的属性信息的输入指令,从所述属性信息中查找基因文库号对应的取样孔,将所述取样孔转换为机器可识别的取样孔标识;
12、配置所述基因文库号对应的目的孔,并根据所述混合后文库号将所述目的孔转换为机器可识别的目的孔标识;
13、建立所述基因文库号、所述取样孔标识、所述目的孔标识以及混合后文库号之间的映射关系;
14、基于所述映射关系,从所述属性信息获取基因文库号对应的基因文库的取用体积,得到第二排单表。
15、可选地,在基于所述映射关系,从所述属性信息获取基因文库号对应的基因文库的取用体积,得到第二排单表之后,所述方法还包括:
16、从所述原始基因文库的属性信息中,获取所述基因文库号对应的保存缓冲液体积;
17、将获取的所述基因文库号对应的保存缓冲液体积写入所述第二排单表。
18、可选地,在基于所述映射关系,从所述属性信息获取基因文库号对应的基因文库的取用体积,得到第二排单表之后,所述方法还包括:
19、根据取样板的数量对所述第二排单表中基因文库的数量进行划分,得到多个第三排单表,每个取样板对应多个取样孔。
20、可选地,所述方法还包括:
21、分别将所述多个第三排单表转换为机器可识别的目标排单表。
22、根据本公开的第二方面,提供了一种基因文库的混合装置,包括:
23、第一放置单元,用于根据目标排单表将目标基因文库放置于对应的目标取样孔内,其中,所述目标排单表中包含基因文库号、取样孔标识、基因文库的取用体积、混合后文库号、目的孔标识、保存缓冲液体积之间的映射关系,所述基因文库存在唯一的基因文库号;
24、吸取单元,用于基于同一混合后文库号,从所述目标取样孔内按照多个目标基因文库分别对应的基因文库的取用体积,分别吸取对应的多个目标基因文库;其中,同一混合后文库号对应多个目标基因文库;
25、第二放置单元,用于将吸取的多个目标基因文库放置于所述目的孔标识对应的目的孔内;
26、添加单元,用于并在所述目的孔内添加多个目标基因文库分别对应的保存缓冲液体积,得到混合后的基因文库。
27、在本公开提供的一个实施例中,所述装置还包括校验单元,所述校验单元包括:
28、写入模块,用于在根据目标排单表将目标基因文库放置于对应的目标取样孔内之前,响应于原始基因文库的属性信息的输入指令,从所述属性信息中获取与预设的表头信息对应的待写入数据,写入至所述预设的表头信息对应的目标列中,得到第一排单表;所述预设的表头信息至少包含基因文库号、取样孔标识、基因文库的取用体积、混合后文库号、目的孔标识、保存缓冲液体积;
29、校验模块,用于对所述第一排单表中的预设的表头信息对应的目标列中记录的数据进行校验;
30、输出模块,用于将校验出错的数据进行反馈,待修正后输出校验后的所述第一排单表。
31、在本公开提供的一个实施例中,所述装置还包括配置单元,所述配置单元包括:
32、查找模块,用于在根据目标排单表将目标基因文库放置于对应的目标取样孔内之前,响应于原始基因文库的属性信息的输入指令,从所述属性信息中查找基因文库号对应的取样孔,将所述取样孔转换为机器可识别的取样孔标识;
33、配置模块,用于配置所述基因文库号对应的目的孔,并根据所述混合后文库号将所述目的孔转换为机器可识别的目的孔标识;
34、建立模块,用于建立所述基因文库号、所述取样孔标识、所述目的孔标识以及混合后文库号之间的映射关系;
35、第一获取模块,用于基于所述映射关系,从所述属性信息获取基因文库号对应的基因文库的取用体积,得到第二排单表。
36、在本公开提供的一个实施例中,所述配置单元还包括写入模块,用于:
37、在基于所述映射关系,从所述属性信息获取基因文库号对应的基因文库的取用体积,得到第二排单表之后,从所述原始基因文库的属性信息中,获取所述基因文库号对应的保存缓冲液体积;
38、将获取的所述基因文库号对应的保存缓冲液体积写入所述第二排单表。
39、在本公开提供的一个实施例中,所述配置单元还包括划分模块,用于:
40、在基于所述映射关系,从所述属性信息获取基因文库号对应的基因文库的取用体积,得到第二排单表之后,根据取样板的数量对所述第二排单表中基因文库的数量进行划分,得到多个第三排单表,每个取样板对应多个取样孔。
41、在本公开提供的一个实施例中,所述配置单元还包括转换模块,用于:
42、分别将所述多个第三排单表转换为机器可识别的目标排单表。
43、根据本公开的第三方面,提供了一种电子设备,包括:
44、至少一个处理器;以及
45、与所述至少一个处理器通信连接的存储器;其中,
46、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面所述的方法。
47、根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述第一方面所述的方法。
48、根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如前述第一方面所述的方法。
49、本公开提供的基因文库的混合方法及装置、电子设备和存储介质,根据目标排单表将目标基因文库放置于对应的目标取样孔内,其中,所述目标排单表中包含基因文库号、取样孔标识、基因文库的取用体积、混合后文库号、目的孔标识、保存缓冲液体积之间的映射关系,所述基因文库存在唯一的基因文库号;基于同一混合后文库号,从所述目标取样孔内按照多个目标基因文库分别对应的基因文库的取用体积,分别吸取对应的多个目标基因文库;其中,同一混合后文库号对应多个目标基因文库;将吸取的多个目标基因文库放置于所述目的孔标识对应的目的孔内,并在所述目的孔内添加多个目标基因文库分别对应的保存缓冲液体积,得到混合后的基因文库。与相关技术相比,通过自动生成目标排单表,并根据目标排单表实现机器混合基因文库的方法,替代了人工操作完成基因文库的混合,可解决人工混合基因文库耗费大量人力资源、速度慢、转化效率低,易出错等问题。
50、应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。