载体生产周期的预估方法、计算机存储介质及电子设备与流程

文档序号:25816780发布日期:2021-07-09 14:07阅读:104来源:国知局
载体生产周期的预估方法、计算机存储介质及电子设备与流程

1.本发明涉及载体构建领域,更具体地,涉及一种载体生产周期的预估方法、计算机存储介质以及电子设备。


背景技术:

2.随着生物技术的不断进步,带来载体的极大市场需求。目前载体都是通过gateway,gibson,退火连接等构建方法把一个载体分解成不同的步骤,然后把完成这些步骤的所有周期加起来就是这个载体的构建周期。但是因为载体种类很多、基因毒性、序列的复杂程度、载体拼接的效率等不同,导致很难实现载体生成周期的预估,影响了技术人员对载体的构建周期的时间安排和规划,存在改进需要。


技术实现要素:

3.为解决上述技术问题,本发明提供一种载体生产周期的预估方法、计算机存储介质和电子设备,可以准确估算出载体生产周期,方便技术人员对载体生产过程中的操作进行合理的时间分配。
4.根据本发明第一方面实施例的载体生产周期的预估方法,包括以下步骤:s1、获取需要插入载体的基因序列的序列信息;s2、判断所述基因序列的长度是否大于第一设定值,当所述基因序列的长度小于等于所述第一设定值时,所述载体的生产周期为第一时间,当所述基因序列的长度大于所述第一设定值时,执行步骤s3;s3、计算所述基因序列的长度与所述第一设定值的差值,所述差值n为大于0的整数,所述差值n每增加1kb,所述载体的生产周期在所述第一时间的基础上增加第一时间段,所述载体的生产周期为第二时间,所述第二时间为所述第一时间与n个所述第一时间段之和;s4、判断所述基因序列的长度是否大于第二设定值,所述第二设定值大于所述第一设定值,当所述基因序列的长度小于等于所述第二设定值时,所述载体的生产周期为第二时间,当所述基因序列的长度大于所述第二设定值时,执行步骤s5;s5、判断所述基因序列是否符合第一条件和第二条件,当所述基因序列不符合所述第一条件和所述第二条件时,所述载体的生产周期为第三时间,所述第三时间为在所述第二时间的基础上增加第二时间段,当所述基因序列符合所述第一条件和所述第二条件中的至少一个时,所述载体的生产周期为在所述第二时间的基础上增加不超过两个所述第二时间段,其中,所述第一条件为所述基因序列中gc含量大于设定比例,所述第二条件为所述基因序列中存在重复序列。
5.根据本发明实施例的载体生产周期的预估方法,通过对插入载体的基因序列的特征进行分析,结合基因序列的长度、gc含量、是否存在重复序列等特征进行综合判断,进而估算出载体生产周期的具体时间,便于技术人员对于载体生产周期内其他操作的时间进行合理安排,从而整体提高载体生产的效率。
6.根据本发明的一个实施例,所述重复序列包括:连续超过15个单一碱基的序列。
7.根据本发明的一个实施例,所述重复序列还包括:多个碱基段连续重复8次以上的
序列,每个所述碱基段包括2

10个碱基。
8.根据本发明的一个实施例,所述重复序列还包括:连续30个及30个以上的不同碱基出现超过两次及两次以上的序列。
9.根据本发明的一个实施例,还包括以下步骤:s6、判断所述载体的培养温度是否处于设定温度范围,若所述培养温度处于所述设定温度范围,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述培养温度低于所述设定温度范围,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第三时间段。
10.根据本发明的一个实施例,还包括以下步骤:s7、判断所述基因序列是否具有毒性,若所述基因序列没有毒性,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述基因序列具有毒性,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第四时间段。
11.根据本发明的一个实施例,所述第一设定值为3kb,所述第一时间为15天

16天,所述第一时间段为2天。
12.根据本发明的一个实施例,所述第二设定值为7kb,所述第二时间段为10天。
13.第二方面,本发明实施例提供一种计算机存储介质,包括一条或多条计算机指令,所述一条或多条计算机指令在执行时实现如上述实施例所述的方法。
14.根据本发明第三方面实施例的电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令;所述处理器用于调用并执行所述一条或多条计算机指令,从而实现如上述任一实施例所述的方法。
15.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
16.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
17.图1为本发明实施例的电子设备的示意图。
18.附图标记:
19.电子设备300;
20.存储器310;操作系统311;应用程序312;
21.处理器320;网络接口330;输入设备340;硬盘350;显示设备360。
具体实施方式
22.下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
23.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或
位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
24.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
25.下面首先对本申请中所提到的专有名词进行解释。
26.载体:指在基因工程重组dna技术中将dna片段(目的基因)转移至受体细胞的一种能自我复制的dna分子。三种最常用的载体是细菌质粒、噬菌体和动植物病毒。在实际生活中,胰岛素就可以通过使用载体将已插入胰岛素基因片段的质粒放入大肠杆菌内。经过插入基因片段的质粒就称作载体。该质粒在细菌内可以进行自我复制,并且不会影响到生物原来的活动。
27.载体生产周期:通过gateway,gibson,退火连接等构建方法把一个载体分解成不同的步骤,然后把完成这些步骤的所有周期加起来就是这个载体的构建周期。
28.下面具体描述根据本发明实施例的载体生产周期的预估方法。
29.根据本发明实施例的载体生产周期的预估方法包括以下步骤:
30.s1、获取需要插入载体的基因序列的序列信息。
31.s2、判断所述基因序列的长度是否大于第一设定值,当所述基因序列的长度小于等于所述第一设定值时,所述载体的生产周期为第一时间,当所述基因序列的长度大于所述第一设定值时,执行步骤s3。
32.s3、计算所述基因序列的长度与所述第一设定值的差值,所述差值n为大于0的整数,所述差值n每增加1kb,所述载体的生产周期在所述第一时间的基础上增加第一时间段,所述载体的生产周期为第二时间,所述第二时间为所述第一时间与n个所述第一时间段之和。
33.s4、判断所述基因序列的长度是否大于第二设定值,所述第二设定值大于所述第一设定值,当所述基因序列的长度小于等于所述第二设定值时,所述载体的生产周期为第二时间,当所述基因序列的长度大于所述第二设定值时,执行步骤s5。
34.s5、判断所述基因序列是否符合第一条件和第二条件,当所述基因序列不符合所述第一条件和所述第二条件时,所述载体的生产周期为第三时间,所述第三时间为在所述第二时间的基础上增加第二时间段,
35.当所述基因序列符合所述第一条件和所述第二条件中的至少一个时,所述载体的生产周期为在所述第二时间的基础上增加不超过两个所述第二时间段,
36.其中,所述第一条件为所述基因序列中gc含量大于设定比例,所述第二条件为所述基因序列中存在重复序列。
37.换句话说,根据本发明实施例的载体生产周期的预估方法在估算载体的生产周期时,首先确定需要插入该载体的基因序列,然后根据该基因序列的序列信息,例如长度信
息,gc含量信息,是否有重复序列等信息,结合特定的设定条件,综合判断该载体的生产周期。
38.其中,对于基因序列的长度信息,当基因序列的长度较小时,例如小于等于第一设定值时,则载体的生产周期为载体进行培养的基础时间,例如基于复制子为puc ori的载体的生产周期为15天

16天。当基因序列的长度较大时,例如大于第一设定值时,载体的生产周期则会根据基因序列的长度进行相应的变化,例如可以是:基因序列的长度每增加1kb,对应的,载体的生产周期就会增加第一时间段。
39.例如,所述第一设定值为3kb,所述第一时间为15天

16天,所述第一时间段为2天。
40.也就是说,当插入的基因序列的长度小于或等于3kb时,该载体的生产周期为15天

16天;当插入的基因序列的长度为4kb时,基因序列的长度与第一设定值的差值为1,则载体的生产周期在15天

16天的基础上增加2天,为17天

18天;当插入的基因序列的长度为5kb时,基因序列的长度与第一设定值的差值为2,则载体的生产周期在15天

16天的基础上增加4天,为19天

20天,其他时间以此类推。
41.当基因序列的长度很大时,判断基因序列的长度是否大于第二设定值,如果不大于第二设定值,则依然按照步骤s3估算载体的生产周期,即第二时间。如果基因序列的长度大于第二设定值,则需要判断该基因序列是否符合第一条件或者第二条件。
42.其中,第一条件是指基因序列中gc含量大于设定比例,例如gc含量大于80%,判断基因序列是否符合第一条件则是判断基因序列中gc含量是否大于80%,若gc含量大于80%,则说明符合第一条件,若不大于80%,则说明不符合第一条件。第二条件是指基因序列中含有重复序列,如果基因序列中含有重复序列,则说明符合第二条件,如果基因序列中不含有重复序列,则说明不符合第二条件。
43.当基因序列既不符合第一条件,也不符合第二条件时,在该情况下,则在第二时间的基础上,再增加一个第二时间段作为载体的生产周期。
44.当基因序列符合第一条件和第二条件中的任何一个时,则在第二时间的基础上,增加一个第二时间段之后,再增加一个第二时间段,即增加两个第二时间段作为载体的生产周期。
45.当基因序列同时符合第一条件和第二条件时,依然按照基因序列符合第一条件和第二条件中的任何一个的方式估算载体的生产周期,即根据基因序列的长度特征,在第二时间的基础上,最多增加两个第二时间段作为载体的生产周期。
46.例如,所述第二设定值为7kb,所述第二时间段为10天。
47.也就是说,当插入的基因序列的长度为4kb

7kb之间时,如果基因序列的长度与第一设定值的差值为1,则载体的生产周期在15天

16天的基础上增加2天,为17天

18天;当基因序列的长度与第一设定值的差值为2,则载体的生产周期在15天

16天的基础上增加4天,为19天

20天,其他时间以此类推。
48.当基因序列的长度大于7kb时,则继续判断基因序列中gc含量是否大于80%,以及基因序列中是否含有重复序列。如果基因序列的gc含量既不大于80%,基因序列中也不存在重复序列,则载体的生产周期=第一时间+2n+10天。如果基因序列符合第一条件和第二条件中的任意一个或两个,则载体的生产周期=第一时间+2n+10天+10天。
49.由此,根据本发明实施例的载体生产周期的预估方法,通过对插入载体的基因序
列的特征进行分析,结合基因序列的长度、gc含量、是否存在重复序列等特征进行综合判断,进而估算出载体生产周期的具体时间,便于技术人员对于载体生产周期内其他操作的时间进行合理安排,从而整体提高载体生产的效率。
50.根据本发明的一个实施例,所述重复序列包括:连续超过15个单一碱基的序列。
51.也就是说,当基因序列中有连续超过(包括15)15个单一碱基的重复序列,例如20个连续的a重复,出现一次即判定基因序列中存在重复序列。
52.在本发明的另一个具体实施方式中,所述重复序列还包括:多个碱基段连续重复8次以上的序列,每个所述碱基段包括2

10个碱基。
53.具体地,当基因序列中具有连续的2个或者3个或者4或者5个或者6个或者7个或者8个或者9个或者10个碱基连续重复8次以上,即判断该基因序列中存在重复序列,例如基因序列中含有如下基因片段时即判断存在重复序列:cacacacacaca,cagcagcagcagcag,cagtcagtcagtcagtcagt等。
54.可选地,根据本发明的一个实施例,所述重复序列还可以包括:连续30个及30个以上的不同碱基出现超过两次及两次以上的序列。其中需要说明的是,popular promoters和popular orf序列不包含在上述判断重复序列的情况。
55.在本发明的一些优选实施方式中,载体生产周期的预估方法还包括以下步骤:
56.s6、判断所述载体的培养温度是否处于设定温度范围,若所述培养温度处于所述设定温度范围,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述培养温度低于所述设定温度范围,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第三时间段。
57.换句话说,在对基因序列的长度、gc含量以及是否存在重复序列的特征进行分析的基础上,本申请还对载体的培养环境进行了考虑,尤其是培养温度。当载体的培养温度处于设定的温度范围之内时,例如35℃

38℃之间,此时,载体的生产周期则是以基因序列的长度、gc含量以及是否存在重复序列的特征所估算得到的时间;当载体的培养温度低于该设定温度范围时,则需要在以基因序列的长度、gc含量以及是否存在重复序列的特征所估算得到的时间的基础上增加第三时间段,例如增加10天。
58.可选地,根据本发明的一个实施例,载体生产周期的预估方法还包括以下步骤:s7、判断所述基因序列是否具有毒性,若所述基因序列没有毒性,则所述载体的生产周期为所述第一时间、所述第二时间或所述第三时间,若所述基因序列具有毒性,则所述载体的生产周期在所述第一时间、所述第二时间和所述第三时间的基础上增加第四时间段。
59.也就是说,在对基因序列的长度、gc含量以及是否存在重复序列的特征进行分析的基础上,本申请还对基因序列是否存在毒性进行分析,如果基因没有毒性,此时,载体的生产周期则是以基因序列的长度、gc含量以及是否存在重复序列的特征所估算得到的时间;如果基因序列具有毒性,则需要在以基因序列的长度、gc含量以及是否存在重复序列的特征所估算得到的时间的基础上增加第四时间段,例如增加10天。
60.其中,判断基因序列是否有毒性的方法为:
61.毒性主要会在克隆生长,序列复制上面出现一些现象,比如菌落生长很慢,甚至不生长,或者复制出来的序列对比原序列有碱基突变,缺失,插入等,而且这种现象是在多数克隆中出现,如果仅仅只是个别克隆出现这种情况的可能由于序列复制自身的一些错误。
62.目前判断基因序列是否具有毒性的范围很广,但目前经验判定有毒性基因居多的是通过比对原基因是否出现缺失、突变以及插入等情况,假如有上述情况出现,很大几率就是基因有毒性。
63.由此,通过对载体培养的环境,以及基因序列是否有毒性,可以进一步提高判断载体的生产周期的准确性。
64.此外,本发明还提供一种计算机存储介质,计算机存储介质包括一条或多条计算机指令,一条或多条计算机指令在执行时实现上述任一的载体生产周期的预估方法。
65.也就是说,计算机存储介质存储有计算机程序,计算机程序被处理器运行时,使得处理器执行上述任一的载体生产周期的预估方法。
66.如图1所示,本发明实施例提供了一种电子设备300,包括存储器310和处理器320,所述存储器310用于存储一条或多条计算机指令,所述处理器320用于调用并执行所述一条或多条计算机指令,从而实现上述任一所述的方法。
67.也就是说,电子设备300包括:处理器320和存储器310,在所述存储器310中存储有计算机程序指令,其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器320执行上述任一所述的方法。
68.进一步地,如图1所示,电子设备300还包括网络接口330、输入设备340、硬盘350、和显示设备360。
69.上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器320代表的一个或者多个中央处理器(cpu),以及由存储器310代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
70.所述网络接口330,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,并可以保存在硬盘350中。
71.所述输入设备340,可以接收操作人员输入的各种指令,并发送给处理器320以供执行。所述输入设备340可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
72.所述显示设备360,可以将处理器320执行指令获得的结果进行显示。
73.所述存储器310,用于存储操作系统运行所必须的程序和数据,以及处理器320计算过程中的中间结果等数据。
74.可以理解,本发明实施例中的存储器310可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom)、可编程只读存储器(prom)、可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)或闪存。易失性存储器可以是随机存取存储器(ram),其用作外部高速缓存。本文描述的装置和方法的存储器310旨在包括但不限于这些和任意其它适合类型的存储器。
75.在一些实施方式中,存储器310存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统311和应用程序312。
76.其中,操作系统311,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实
现各种基础业务以及处理基于硬件的任务。应用程序312,包含各种应用程序,例如浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序312中。
77.本发明上述实施例揭示的方法可以应用于处理器320中,或者由处理器320实现。处理器320可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器320中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器320可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器310,处理器320读取存储器310中的信息,结合其硬件完成上述方法的步骤。
78.可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(asic)、数字信号处理器dsp)、数字信号处理设备(dspd)、可编程逻辑设备(pld)、现场可编程门阵列(fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
79.对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
80.具体地,处理器320还用于读取所述计算机程序,执行上述任一所述的方法。
81.在本申请所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
82.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
83.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
84.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员
来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1