用于多核苷酸构建体设计、可视化和交易以对其进行生产的系统的制作方法

文档序号:6496986阅读:188来源:国知局
用于多核苷酸构建体设计、可视化和交易以对其进行生产的系统的制作方法
【专利摘要】本发明公开用于设计用于基因表达的核酸序列的计算机化系统,其包含:(a)用于容纳数据库[106]的服务器[103](b)网络连接[102]以及(c)包含功能模块的计算机可读介质[101],所述功能模块包括:(i)用于使核酸构建体的设计能够进行的设计模块;(ii)用于可视化与设计操作相关的生物学信息的互动用户界面模块;(iii)用于购买用户设计的或预存的核酸构建体的交易模块;(iv)用于检测包含不良序列的核酸序列的检测模块;该系统以下述方法操作:(a)可视化生物学信息;(b)设计核酸序列;(c)当设计了不良序列时检测并通知;(d)提供用于关于订购和购买所述合成的核酸的交易的方法。
【专利说明】用于多核苷酸构建体设计、可视化和交易以对其进行生产的系统
发明领域
[0001]本发明通常涉及用于多核苷酸构建体设计、可视化和交易以对其进行生产的系统。
[0002]发明背景
[0003]合成的核酸构建体用于关键应用的用途前所未有的大。合成的核酸用于从生命科学研究到包括其它能量来源及更多的各个领域。
[0004]例如,几乎我们的文明所需要或创造的每样东西以有限的能力来源例如油、煤和天然气开始,需求不断增长而供应不断减少。大多数上品的价格在上涨。作为能量来源的可再生的生物量来源的需要不断扩大。合成的核酸用于设计用于例如能力和食物来源的活生物体的用途在未来将是广泛的。
[0005]为强调问题和机遇的重要,能量部发布了 2004年的报告,显示120种可以生物生产的高价值化学品,每种都有超过10亿美元的市场规模。用于生命来源密码的合成核酸的市场如今超过5亿美元。
[0006]国立卫生研究院2008年在操作DNA上开支了超过15亿美元,这个市场计划在2015年增长到30亿美元,而估计同年合成生物学产品的市场在45亿美元。
[0007]有用的活生物体的产生很强地依靠合成的核酸。传统地,核酸的设计和操作包括使用分子生物学,已知其速度慢且易于出错。设计核酸以类似在文字处理机上输入的方式进行,这将使编辑、产生和合成大如基因组的核酸序列更容易并提高速度。
[0008]需要探讨核酸序列的设计和合成、利用信息技术的工具。而且,需要更低开支、更容易、更可靠且更快速的合成的核酸的有效率的设计和生产。进一步,需要可以进行核酸构建体的容易的设计和除错的核酸工具。更进一步,需要使不同技术层面的用户,包括具有很少分子生物学知识的用户,可以设计用于期望的结果的核酸构建体。本文描述的方法和系统有益于解决这些需要。
[0009]发明概述
[0010]本发明目的在于公开用于设计用于基因表达的核酸序列的计算机化系统,其包含:(A)用于容纳(hosting)数据库[106]的服务器[103] (B)网络连接[102]以及(C)包含功能模块的计算机可读介质[101],所述功能模块包括:(i)用于使核酸构建体的设计能够进行的设计模块;(ii)用于将与设计操作相关的生物学信息可视化的互动用户界面模块;
(iii)用于购买用户设计的或预存的核酸构建体的交易模块;(iv)用于检测包含不良序列的所设计的核酸序列的检测模块;该系统以下述方法操作:(a)可视化生物学信息;(b)设计核酸序列;(c)当设计了不良序列时检测并通知;(D)提供用于关于订购和购买所述合成的核酸的交易装置。
[0011]本发明进一步的目的在于公开上述系统,其中设置所述计算机化系统作为在计算机设备上运行的软件应用和/或网站。
[0012]本发明进一步的目的在于公开上述系统,其中所述应用安装在选自电话、手提设备以及任何合适的本领域已知计算机设备的计算机设备上。
[0013]本发明进一步的目的在于公开上述系统,其中所述核酸是DNA和/或RNA。
[0014]本发明进一步的目的在于公开上述系统,其中所述计算机可读介质进一步包含存取模块,其使得用户可以在模块中以不同级别存取、在模块内以不同的功能级别存取及其任意组合,所述存取由预先确定的变量定义。
[0015]本发明进一步的目的在于公开上述系统,其中所述预先确定的变量选自:不同的支付等级、用户类型和用户技术等级及其任意组合。
[0016]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计模块以使用户可以编辑所述核酸序列并在所述设计中使用不同的预先确定的对照。
[0017]本发明进一步的目的在于公开上述系统,其中所述对照选自:甲基化位点的改变、蛋白质水平的改变、代谢水平的改变及其任意组合。
[0018]本发明进一步的目的在于公开上述系统,其中所述核酸序列编辑包括在相关翻译系统中编辑非天然氨基酸和其它常规的分子编码序列的合并,所述常规分子选自:重金属、标记、编码的数据、其它任何本领域已知的合适分子及其任何组合。
[0019]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计模块以使用户可以从遗传学元件创建核酸设计,所述遗传学元件选自:转录启动子、核糖体结合位点、基因、终止子、任何其它本领域已知的常规遗传学元件及其任何组合。
[0020]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计模块以使用户可以从通过所述互动用户界面模块可获得的构件组建所述核酸构建体。
[0021]本发明进一步的目的在于公开上述系统,其中所述构件是选自:启动子、开放阅读框、终止子、Shine-Dalgarno序列以及其表达系统等价物的至少一个。
[0022]本发明进一步的目的在于公开上述系统,其中进一步使所述设计模块适合于根据各种要求优化所述设计的核酸构建体。
[0023]本发明进一步的目的在于公开上述系统,其中所述各种要求选自:优化密码子使用、优化GC含量、优化CpG含量、避免DNA基序相关的问题、避免序列重复相关的问题、避免反向互补序列重复相关的问题及其任何组合。
[0024]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计模块以利用各种计算机辅助的方法来确定最佳的密码子序列。
[0025]本发明进一步的目的在于公开上述系统,其中所述最佳的密码子序列与相关表达系统中蛋白质表达水平相关。
[0026]本发明进一步的目的在于公开上述系统,其中所述基于用户输入的核酸序列确定表达系统。
[0027]本发明进一步的目的在于公开上述系统,其中基于识别tRNA序列确定所述表达系统。
[0028]本发明进一步的目的在于公开上述系统,其中所述表达系统选自:细胞、无细胞系统、体外系统、原核表达系统以及真核表达系统。
[0029]本发明进一步的目的在于公开上述系统,其中所述表达系统进一步选自:细菌细胞、昆虫细胞、SF9细胞、果蝇-施耐德细胞、植物细胞、酵母、藻类、植物表达系统以及本领域已知的任何其它常规系统。[0030]本发明进一步的目的在于公开上述系统,其中所述表达系统包括低甲基化水平的系统和/或细胞。
[0031]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计模块使所述最佳的密码子与所需的表达系统中最常或次最常采用的密码子相匹配,以保证RNA大体上的稳定和最佳的密码子选择。
[0032]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计模块以利用各种合适的基因优化技术。
[0033]本发明进一步的目的在于公开上述系统,其中进一步设置所述设计的核酸以克隆到载体,从而其可操作地与合适的转录控制序列和调控元件连接。
[0034]本发明进一步的目的在于公开上述系统,其中所述转录控制序列包括合适的组成型或诱导型启动子。
[0035]权利要求1的系统,其中所述数据库[106]进一步包含每个遗传学对象的相关信
肩、O
[0036]本发明进一步的目的在于公开上述系统,其中所述计算机可读介质进一步包含适合于检测核酸构建体中错误的除错模块。
[0037]本发明进一步的目的在于公开上述系统,其中进一步设置所述除错模块以通过序列比对比较设计的核酸构建体与所述数据库[106]条目。
[0038]本发明进一步的目的在于公开上述系统,其中进一步使所述除错模块适合于比较设计模块中的所述核酸构建体与用于评估成功的核酸序列和基因表达兼容性的处方(recipe)。
[0039]本发明进一步的目的在于公开上述系统,其中进一步使所述除错模块适合于用以上预先确定的所述核酸构建体中的阈值确定错误的存在。
[0040]本发明进一步的目的在于公开上述系统,其中基于与所述数据库条目和相关信息的序列比对确定错误的存在。
[0041]本发明进一步的目的在于公开上述系统,其中所述除错模块向输出端提供所述设计的核酸构建体的可选改变。
[0042]本发明进一步的目的在于公开上述系统,其中设置所述改变以修正所述设计的核酸构建体中确定的错误。
[0043]本发明进一步的目的在于公开上述系统,其中设置所述改变以使其被所述系统自动接受并更新所述核酸构建体。
[0044]本发明进一步的目的在于公开上述系统,其中进一步设置所述改变以便作为选择给予用户,用于其决定是否接受所述改变。
[0045]本发明进一步的目的在于公开上述系统,其中所述除错模块评估用于预测基因表达水平的必要构件的存在。
[0046]本发明进一步的目的在于公开上述系统,其中所述除错模块评估所述构件的所述核酸序列的正确性。
[0047]本发明进一步的目的在于公开上述系统,其中所述除错模块评估所述构件中的密码子使用,以便预测给定表达系统中的表达兼容性。
[0048]本发明进一步的目的在于公开上述系统,其中所述评估基因表达兼容性包括成功阈值。
[0049]本发明进一步的目的在于公开上述系统,其中所述成功阈值由用户设定。
[0050]本发明进一步的目的在于公开上述系统,其中所述成功阈值与预期表达水平相关。
[0051]本发明进一步的目的在于公开上述系统,其中所述计算机可读介质进一步包含用于给核酸构建体指定代谢途径的模块。
[0052]本发明进一步的目的在于公开上述系统,其中设置所述指定代谢途径模块以将代谢途径的描述注释到所述设计的核酸构建体。
[0053]本发明进一步的目的在于公开上述系统,其中所述注释代谢途径从包含关于遗传学对象的E.C.编号的代谢数据库获得。
[0054]本发明进一步的目的在于公开上述系统,其中进一步设置所述指定代谢途径的模块以比较所述核酸构建体的部分和/或全部与代谢数据库中的遗传学对象。
[0055]本发明进一步的目的在于公开上述系统,其中所述遗传学对象包含与用代谢途径注释的核酸构建体具有阈值水平的百分比相似性或相同性,其可以用相同和/或相似的代谢途径注释。
[0056]本发明进一步的目的在于公开上述系统,其中进一步设置所述指定代谢途径的模块以利用各种合适的比对模块。
[0057]本发明进一步的目的在于公开上述系统,其中所述合适的比对模块包含NCBIBlast工具。
[0058]本发明进一步的目的在于公开上述系统,其中进一步设置所述指定代谢途径的模块以将核酸比对算法应用于所述提交的核酸构建体,以便从所述代谢数据库中找到具有预先确定的最高比对得分的序列。
[0059]本发明进一步的目的在于公开上述系统,其中可以将与与从所述代谢数据库挑选或选择的遗传学对象相关的所述E.C.编号分配到所述提交的核酸构建体。
[0060]本发明进一步的目的在于公开上述系统,其中进一步设置所述E.C.编号以自动分配。
[0061]本发明进一步的目的在于公开上述系统,其中进一步设置所述分配的E.C.编号以便将其储存在与所述遗传学对象有关的相关文档中打分。
[0062]本发明进一步的目的在于公开上述系统,其中进一步设置所述指定代谢途径的模块以便通过与所述设计的核酸构建体的最终和/或中间产物有关的加工途径将代谢途径指定给所述设计的核酸构建体。
[0063]本发明进一步的目的在于公开上述系统,其中进一步设置所述指定代谢途径的模块以确定选定的酶在多个代谢途径中的功能,和/或作为选择,提供包括一个或多个基因和/或基因产物的替代可能性。
[0064]本发明进一步的目的在于公开上述系统,其中进一步设置所述指定代谢途径的模块以展示用各种与基因/遗传学对象相关的可视图标分组的催化活性。
[0065]本发明进一步的目的在于公开上述系统,其中进一步设置所述代谢途径以自动地和/或经用户查询而展示。
[0066]本发明进一步的目的在于公开上述系统其中所述用户询问包括人与指针的互动。[0067]本发明进一步的目的在于公开上述系统,其中所述人的互动包括选自虚拟按压、保持、杠杆、拉、推、开、关、捕获、掌握、滑动、滚动、转动、刮、擦、射击、刺、穿透、钉、指出、打字、指向或其他所述指针操控的活动。
[0068]本发明进一步的目的在于公开上述系统,其中所述数据库[106]适合储存序列和/或之前订购的序列。
[0069]本发明进一步的目的在于公开上述系统,其中所述数据库可操作地与计算机化系统连接。
[0070]本发明进一步的目的在于公开上述系统,其中设置所述核酸构建体以针对所述数据库对其进行检查来确定所述构建体的部分或全部是否在上述预先确定的阈值相同性水平与所述数据库的条目匹配。
[0071]本发明进一步的目的在于公开上述系统,其中所述计算机可读介质进一步包含用于优化核酸构建体的所述合成的模块。
[0072]本发明进一步的目的在于公开上述系统,其中设置所述优化合成模块以基于开支、难易和/或速度优化所述核酸序列构建体的所述合成。
[0073]本发明进一步的目的在于公开上述系统,其中所述计算机可读介质进一步包含用于产生核酸构建体的合成方案的模块。
[0074]本发明进一步的目的在于公开上述系统,其中设置所述算法以产生具有包括速度和/或难易的各种标准的构建方案。
[0075]本发明进一步的目的在于公开上述系统,其中进一步设置所述用于产生合成方案的模块以将所述设计的核酸插入生物体并在所述选定的生物体内功能性表达所述设计的构建体。
[0076]本发明进一步的目的在于公开上述系统,其中进一步设置所述互动的用户界面以用相关功能展示本发明的各种模块。
[0077]本发明进一步的目的在于公开上述系统,其中所述各种模块选自核酸设计、错误检查、密码子优化、代谢产物设计、具有动态缩放的生物学信息的可视表现、核酸合成、关于订购和/或购买合成的核酸的交易、用户评述、核酸构建体分级和/或任何具有本领域已知功能的常规模块。
[0078]本发明进一步的目的在于公开上述系统,其中所述互动的用户界面模块包含多个分辨率层。
[0079]本发明进一步的目的在于公开上述系统,其中设置所述分辨率层以便按照与预先确定的选定“缩放”水平相应的方式展示生物学信息。
[0080]本发明进一步的目的在于公开上述系统,其中进一步设置所述分辨率层以对应所述生物学信息的差异性可视表现。
[0081]本发明进一步的目的在于公开上述系统,其中进一步设置所述互动用户界面模块以动态地转换与“缩放”水平相关的所述生物学信息的所述可视表现。
[0082]本发明进一步的目的在于公开上述系统,其中所述生物学信息源于所述数据库
[106]ο
[0083]本发明进一步的目的在于公开上述系统,其中所述生物学信息包含所述设计的核酸构建体的遗传学元件。[0084]本发明进一步的目的在于公开上述系统,其中所述生物学信息的所述可视表现与抽象水平相关。
[0085]本发明进一步的目的在于公开上述系统,其中预先选择所述抽象水平以便最佳地以所需的充分性表现所述生物学信息。
[0086]本发明进一步的目的在于公开上述系统,其中设置所述各种抽象水平以对应选自生物体、基因组、系统、代谢途径、蛋白质、遗传学位点、氨基酸或核酸水平细节的不同水平。
[0087]本发明进一步的目的在于公开上述系统,其中所述互动用户界面模块包含用于使用户可以转换到所需的抽象水平的可视图标,从而相应地,在所述用户界面上展示对应的“缩放”水平。
[0088]本发明进一步的目的在于公开上述系统,其中设置所述生物学信息以使其在缩放水平间“拖动”。
[0089]本发明进一步的目的在于公开上述系统,其中设置适合于执行动态缩放功能的所述拖动操作以转换具有适合的分辨率、细节和/或信息的遗传学界面的可视化。
[0090]本发明进一步的目的在于公开上述系统,其中所述动态缩放功能适合于在各种视野之间转换展示设计的核酸构建体,所述视野选自基因视野、代谢模拟视野、蛋白质视野、细胞视野、生物体视野、器官视野、复杂生物体视野(例如,酵母、植物、动物、人)、性别特异性视野或任何其它本领域已知的合适的视野。
[0091]本发明进一步的目的在于公开上述系统,其中进一步设置所述互动用户界面模块以对比于平均或最普通的物种序列展示所述核酸序列构建体。
[0092]本发明进一步的目的在于公开上述系统,其中所述互动用户界面模块进一步包含代表性图标。
[0093]本发明进一步的目的在于公开上述系统,其中所述生物学信息进一步适合于被选择并移动到所述代表性图标上以表现所需的缩放水平。
[0094]本发明进一步的目的在于公开上述系统,其中进一步设置所述互动用户界面模块以展示所述核酸序列在物种内的序列变异。
[0095]本发明进一步的目的在于公开上述系统,其中设置所述序列变异以将其展示为表型。
[0096]本发明进一步的目的在于公开上述系统,其中进一步设置所述互动用户界面模块以展示所述特异性核酸序列的各种视野,所述展示是相比于目标家族、品系、性别、种族、特征群和任何其它本领域已知的合适的比较目标进行的。
[0097]本发明进一步的目的在于公开上述系统,其中设置所述代表性图标以使其被拖和/或掉(dripped)入设计画面(canvas)。
[0098]本发明进一步的目的在于公开上述系统,其中所述互动用户界面模块进一步包含用于分子建模和/或模拟蛋白质结构的各种模块。
[0099]本发明进一步的目的在于公开上述系统,其中所述分子建模和/或模拟蛋白质结构包括选自移动、注释、突变和/或删除操作的操作。
[0100]本发明进一步的目的在于公开上述系统,其中所述订购和/或购买的核酸构建体产品包括包含分离的设计的核酸构建体的合成制备物,和用于在所需的生物体内插入和/或表达该设计的构建体目的的任何其它试剂以及实验方法的试剂盒。[0101]本发明进一步的目的在于公开上述系统,其中所述交易模块包含可购买的核酸构建体的市场。
[0102]本发明进一步的目的在于公开上述系统,其中所述市场由核酸合成商和/或个人用户构成。
[0103]本发明进一步的目的在于公开上述系统,其中所述交易模块基于选自序列可获得性、生产核酸构建体要求的合成方法、核酸构建体的使用的各种标准。
[0104]本发明进一步的目的在于公开上述系统,其中进一步设置所述交易模块以使用户可以提交具有序列信息的构建体,和选自基因产物、生物体偏爱、代谢途径或任何其它本领域已知的合适的信息的任何其它相关信息。
[0105]本发明进一步的目的在于公开上述系统,其中进一步设置所述交易模块以使用户可以在所述市场中对构建体进行评述和/或分级。
[0106]本发明进一步的目的在于公开上述系统,其中所述交易模块进一步适合于通过激励鼓励用户参与。
[0107]本发明进一步的目的在于公开上述系统,其中所述激励包括提供来自订购的构建体的收益分享。
[0108]本发明进一步的目的在于公开上述系统,其中进一步设置所述交易模块以确定使用所述设计模块和/或合成的产物的价格。
[0109]本发明进一步的目的在于公开上述系统,其中所述价格的确定在考虑所述核酸构建体设计的目的的情况下执行。
[0110]本发明进一步的目的在于公开上述系统,其中所述交易模块进一步适合于使得可以通过使用市场给DNA合成商提供巨大且可预期的订购量。
[0111]本发明进一步的目的在于公开上述系统,其中所述不良序列包含能够编码病毒或毒素的部分的核酸构建体。
[0112]本发明进一步的目的在于公开上述系统,其中所述检测模块包含报警机制。
[0113]本发明进一步的目的在于公开上述系统,其中设置所述报警机制以在设计、订购和/或购买了所述不良序列时,使一或多个经授权的系统用户警觉。
[0114]本发明进一步的目的在于公开上述系统,其中进一步设置所述检测模块以使用汇编的数据库[107]。
[0115]本发明进一步的目的在于公开上述系统,其中所述检测模块进一步包含用于检查所述指定序列与所述数据库[107]中一或多个条目的比对水平的序列比对算法模块。
[0116]本发明进一步的目的在于公开上述系统,其中所述汇编的数据库适合于描绘选自毒素、病毒、细菌、病原体的一系列不良产物。
[0117]本发明进一步的目的在于公开上述系统,其中所述汇编的数据库适合于含有与不良产物强烈相关的核酸序列。
[0118]本发明进一步的目的在于公开上述系统,其中进一步设置所述汇编的数据库以储存不良产物和/或序列的部分或全部条目的风险水平。
[0119]本发明进一步的目的在于公开上述系统,其中进一步设置所述检测模块以便当设计的核酸的部分与不良产物数据库的一或多个条目的比对高于阈值水平时标记用于警报。
[0120]本发明进一步的目的在于公开上述系统,其中所述比对包括百分比相似性、相同性或二者兼具。
[0121]本发明进一步的目的在于公开上述系统,其中所述阈值水平包括选自低、中或高警报的几种不同水平。
[0122]本发明进一步的目的在于公开上述系统,其中所述警报进一步包括自动化的警报。
[0123]本发明进一步的目的在于公开上述系统,其中所述警报进一步包括要求人操作员另外复核的警报。
[0124]本发明进一步的目的在于公开上述系统,其中所述服务器[103]包含通知模块,其用于当设计、订购和/或购买了不良序列时通知官方机构。
[0125]本发明进一步的目的在于公开上述系统,其中所述不良序列是指其风险级别超过与所述数据库中的一或多个条目比对的阈值水平。
[0126]本发明进一步的目的在于公开上述系统,其中所设的所述阈值水平对数据库的所有成员是相同的。
[0127]本发明进一步的目的在于公开上述系统,其中根据与特定数据库条目相关的风险级别调节所述阈值水平。
[0128]本发明进一步的目的在于公开上述系统,其中进一步设置所述检测模块以便给与更闻不良条目相关的核酸构建体确定更闻的价格。
[0129]本发明进一步的目的在于公开上述系统,其中进一步设置所述汇编的数据库以重新构建和/或汇编公共或私有信息。
[0130]本发明进一步的目的在于公开上述系统,其中所述检测模块进一步包括来自专门机构的实施方法。
[0131]本发明进一步的目的在于公开上述系统,其中所述计算机可读介质进一步包含汇编模块,其适合于根据一系列预先确定的规则检测设计的核酸序列。
[0132]本发明进一步的目的在于公开上述系统,其中进一步设置所述汇编模块以在客户
[101]和/或服务器[103]中内部执行。
[0133]本发明进一步的目的在于公开上述系统,其中所述汇编模块包含一系列设计规则。
[0134]本发明进一步的目的在于公开上述系统,其中所述设计规则基于客户规则和/或系统规则。
[0135]本发明进一步的目的在于公开上述系统,其中进一步设置所述汇编模块以使用户可以对所述列表添加他自己定义的规则。
[0136]本发明进一步的目的在于公开上述系统,其中进一步设置所述汇编模块以将一系列在其设计的构建体中找到的可能的问题与关于可能的问题的位置和类型的可视警告一起发送给用户。
[0137]本发明进一步的目的在于公开上述系统,其中进一步设置所述汇编模块以使用户可以复核并直接连接到所述可能问题的位置。
[0138]本发明进一步的目的在于公开上述系统,其中所述汇编模块适合于使用户可以改变所述问题和/或忽略所述警报。
[0139]本发明进一步的目的在于公开上述系统,其中用于检测所述设计的核酸构建体中的不良序列的所述介质包含:(a)不良序列的数据库;(b)与用户订购的序列的序列比对;以及(C)用于标记不良序列的智能阈值。
[0140]本发明进一步的目的在于公开上述系统,用于评估核苷酸序列质量的计算机化方法,其包括:(a)接收核苷酸序列;(b)将序列与之前接收的序列的数据库比较;以及(C)对序列进行质量分级,其中高质量分级与序列先前出现在数据库中的次数相关。
[0141]本发明进一步的目的在于公开上述系统,用于设计多核苷酸构建体的计算机化方法,其包括下述步骤:(a)提供构件;(b)允许用户设计多核苷酸,其中设计包括组合所提供的构件;(C)接收设计的多核苷酸;以及(d)对设计的多核苷酸进行质量分级,其中质量分级基于先前组装的设计的多核苷酸,其中高的分级基于先前接收的设计的多核苷酸的高数量。
[0142]本发明进一步的目的在于公开上述系统,用于可视化生物学信息的计算机化系统,其包含:(a)在网络环境中的虚拟的计算机平台,所述网络环境能够在可动态缩放的用户界面上的多个分辨率层中呈现生物学信息;(b)可操作地连接到虚拟计算机平台的数据库,其中数据库提供生物学信息,其中所述多个分辨率层中的至少一个采用与所述多个分辨率层中的至少另一个不同的生物学信息的可视表现。
【专利附图】

【附图说明】
[0143]提供以下描述以使任何本领域技术人员可以使用本发明,并阐明发明人预期的实施本发明的最佳方式。然而,由于对本发明的遗传学原理进行了特别定义以提供用于设计用于基因表达的核酸序列的计算机化系统及其方法,各种修饰对本领域技术人员是明显的。
[0144]现在将参考以下附图以仅用非限制性实施例的方式描述一些优选的实施方式:
[0145]图1描述用于检测包括不良序列的指定序列的检测模块;
[0146]图2表示用于检测包括不良序列的指定序列的检测模块的流程图;以及
[0147]图3描述适合于根据一系列预先确定的规则功能性检查设计的核酸序列的汇编模块。
[0148]发明详述
[0149]本发明涉及用于设计、合成、购买、销售和/或运输核酸构建体及相关材料的系统和方法。一方面,本发明涉及可以安装在计算机化系统、电话、手持设备或可以用常规的相似方法遥控评估的软件应用。
[0150]软件应用使用户可以根据用户标准/规则生成核酸构建体,所述用户标准/规则包括例如表达系统、代谢途径、突变信息等。软件应用可以有各种模块。
[0151]模块根据软件打包标准例如支付级别、用户熟练度、用户评估水平或任何其它合适的打包标准提供给用户。
[0152]本文描述的系统和方法进一步涉及核酸构建体中的错误识别和错误改正。本发明的各实施方式进一步涉及集中的或分散的分级、评价和/或评述核酸构建体。
[0153]描述了用于购买用户设计的或预存的核酸构建体的交易和定价方法,且其可以基于各种标准,例如序列的可得性、生产核酸构建体要求的合成方法、核酸构建体的用途(例如产生任何代谢产物)或任何其它合适的标准。[0154]各种实施方式涉及核酸构建体的合成方法,例如重新合成、从构建体的已有的部分合成或任何其它合适的合成方法。已有的部分可以位于一或多个设备,基于核酸构建体来合成。核酸构建体的合成可以用挑选联合合成策略来优化。
[0155]在各种实施方式中,本发明的方法和系统允许在例如单独的开放阅读框(ORF)、移动的遗传学元件(例如质粒)、全基因组和/或任何合适的本领域已知的背景的背景下读、写和设计核酸。
[0156]在一些实施方式中,软件工具允许从包含来自各种物种的已知序列的基因的数据库生成遗传学元件组件。可以评估相关数据库的存储和遗传学元件的相关功能以使遗传学元件与一或多个功能配对。可以用本领域已知的合适的可得的数据库进一步评估其它相关信息,例如生物体信息、同源、直系同源或任何其它合适的信息。
[0157]在一些实施方式中,本文描述的与系统可操作连接的可视用户界面表现核酸设计的相关信息。
[0158]在一些实施方式中,可以用用户界面选择、拖动和/或掉落代表相关信息和功能的可视图标以促进核酸编辑和/或设计期间的效果。例如,可以选择代表选定的代谢产物的图标,并将其拖入代表所需的生物体的图标以发起设计最近似于所需的代谢效果的核酸构建体(例如基因组和/或质粒)的算法。
[0159]在一些实施方式中,软件可以进一步输出将设计的核酸插入生物体和/或在选定的生物体内功能性表达设计的构建体的方案,例如诱导方案。
[0160]在一些实施方式中,产生的核酸构建体包含用于影响编码所需的基因产物的功能基因的表达的序列。
[0161]在一些实施方式中,本发明的方法和系统涉及使用户可以定制基因组特征的软件和/或服务。
[0162]在一些实施方式中,通过因特网评估软件和/或服务。
[0163]在一些实施方式中,根据设计核酸构建体,用户可以订购和/或购买涉及设计的核酸的产物。
[0164]在一些实施方式中,订购和/或购买的产物包括包含设计的核酸构建体的分离的合成制备物,例如质粒,和任何其它用于将设计的构建体插入所需的生物体和/或在其中表达的试剂和方案的试剂盒。
[0165]示例模块1:应用的用户界面和各种模块
[0166]在各种实施方式中,本发明的方法和系统用用户界面实施。用户界面可以用其相关的功能展示本发明的各种模块,例如核酸设计、错误检查、密码子优化、代谢产物设计、动态缩放的生物学信息的可视表现、核酸合成、关于订购和/或购买合成的核酸的交易、核酸构建体的用户评述和分级或任何其它合适的具有本文描述的或其它本领域已知的功能的模块。
[0167]在一些实施方式中,本发明的方法和系统可以提供不同的版本。例如,不同的支付等级可以使用不同的模块和/或模块内的功能水平。在一些实施方式中,使用水平依靠用户类型。
[0168]在一些实施方式中,用户可以与技术水平匹配。用户的技术水平可以导致其使用本发明系统和方法的不同版本。[0169]不例I旲块2:检测包含不良或有毒的序列的设计的序列
[0170]在各种实施方式中,本发明涉及用于检测不良序列(例如能编码部分病毒和毒素的核酸构建体)的算法。
[0171]可以配置报警机制以在设计、订购和/或购买了此类序列时,使系统的一或多个授权的用户警觉。
[0172]在一些实施方式中,汇编数据库以表现一系列不良产物,例如毒素、病毒、细菌、病原体及其它。数据库可以含有与不良产物强烈相关的核酸序列。
[0173]在一些实施方式中,风险等级储存于数据库中,用于部分或全部条目。
[0174]在一些实施方式中,如果核酸的部分高于与数据库中一或多个条目比对的阈值水平,可以标记核酸构建体用于警报。
[0175]在一些实施方式中,阈值水平设为对数据库所有成员皆相同。
[0176]在一些实施方式中,可以调节阈值水平,例如根据与特定数据库条目相关的风险等级。
[0177]在一些实施方式中,可以调节核酸构建体的价格,例如,与更加不利的条目相关的核酸构建体可以分配一个更高的价格。
[0178]在一些实施方式中,各种警报等级引起核酸构建体价格上升。例如,线性的、指数的或任何其它合适的功能关系可以用于价格上升与核酸构建体和一或多个不良序列数据库中的条目之间的百分比相似性和/或相同性之间。
[0179]在一些实施方式中,只在百分比相似性和/或相同性的基础水平之后引起价格上升。可以重新或通过汇编公共或私人信息构建数据库。例如,可以汇编来自国家选择代理注册(National Select Agent Registry (CDC ;http:// www.selectagents.gov/Select % 20Agents% 20and% 20Toxins% 20List.html))、澳大利亚集团(The AustraliaGroup (http://www.australiagroup.net/enlbiological_agents.html))、世界卫生组织(http://www.wh0.1nt/csr/disease/smallpox/SummaryrecommendationsMay08.pd f)、国际基因合成联盟(International Gene Synthesis Consortium, IGSC)的摘要网页(http://www.genesynthesisconsortium.0rg/Harmonized_Screening_Protocol.htm I)或任何其它合适的存储处的信息以构建数据库。
[0180]在各种实施方式中,部分或全部设计的核酸构建体可以与不良序列数据库中的条目进行比对。
[0181]在一些实施方式中,设计的核酸构建体中的一或多个注释的序列元件与不良序列数据库中的条目进行比对。
[0182]当由某一事件例如购买订单引起时,全部核酸构建体可以另外与数据库条目进行比对。
[0183]在一些实施方式中,比对包括百分比相似性、相同性或二者兼具。
[0184]在一些实施方式中,与一或多个不良序列数据库中的条目的大于50%、60%、70%、80%、90%、95%或更大的相似性或相同性导致核酸构建体的标记。
[0185]在一些实施方式中,可以配置一些阈值用于警报的更高等级,例如:低、中或高级警报。
[0186]某一警报等级能够导致配置自动警报,而其它的等级可能首先要求人的关注。例如,高的警报等级可以产生自动警报,而中等警报等级可能由技术员根据初步复核来进一步处理。
[0187]警报可以通过各种方法设计。
[0188]在一些实施方式中,可以遵循来自专门的公共机构最好的实施方法,例如可以执行来自IGSC的最好的实施方法。
[0189]在一些实施方式中,本发明的方法和系统包括用于检测不良序列(病毒、毒素)的算法,其包括:(a)不良序列数据库,(b)与用户订购的序列的序列比对以及(C)用于以其对应的价格上升和官方机构的通知标记不良序列的智能阈值。
[0190]示例模块3:优化用于各种用途的核酸构建体
[0191]在一些实施方式中,本发明的方法和系统涉及核酸构建体的设计,其通过允许编辑核酸序列和使用对照例如甲基化位点的变更、蛋白质水平改变或代谢水平改变进行。
[0192]在一些实施方式中,编辑核酸包括编辑以并入非天然氨基酸或本领域已知的相关翻译系统中的其它代替分子的编码序列。
[0193]在一些实施方式中,代替分子包括重金属、标记、编码数据或任何其它合适的本领域已知分子。
[0194]根据本发明的系统和方法,用户可以从遗传学元件创建核酸设计,所述遗传学元件是本领域众所周知的,例如转录启动子、核糖体结合位点、基因和终止子。可以用本文描述的工具和系统来储存和定购设计的核酸构建体。一种用于制备和合成蛋白质的技术是克隆和在异源系统(例如,大肠杆菌(Esherichia coli)和酵母)中表达对应该蛋白的基因序列。然而,天然存在的基因对这一目的而言是次优选的。由于在每个DNA序列表达蛋白质的个案中,一个碱基三联体(密码子)表达一个氨基酸,可以合成用于表达所需的蛋白质的人工DNA序列,并将其用于克隆和表达该蛋白质。这种方法存在一个问题,即预先确定的氨基酸序列并不对应单一的核苷酸序列。这被称为遗传学密码的简并。不同生物体使用密码子来表达氨基酸的频率是不同的(称为密码子使用)。通常地,在给定的生物体内有一个主要使用的密码子和一或多个该生物体以相对低的频率用来表达对应的氨基酸的密码子。由于合成的核苷酸序列将用于特定的生物体内,密码子的选择应该适合于适当的生物体的密码子使用。
[0195]更重要的可变因素是GC含量(序列中鸟嘌呤和胞嘧啶碱基的含量)。
[0196]可以影响表达结果的进一步的因素是DNA基序和碱基序列中的重复或反向互补重复。
[0197]在给定的生物体内,某些碱基序列产生某些功能,其可能不是编码序列中所需的。例如顺式活性序列基序诸如接合位点或转录终止子。特定的基序的无意出现降低或完全抑制表达或甚至对宿主生物体具有毒性作用。
[0198]序列重复可以导致更低的遗传稳定性,并且由于不正确杂交的风险而阻碍重复区段的合成。
[0199]反向互补重复可以导致形成不需要的RNA水平二级结构或DNA水平十字结构,其阻碍转录并导致遗传不稳定性,或可以具有对翻译效率不利的作用。
[0200]可以优化合成基因的密码子使用和GC含量,以及另一方面,基本上避免与DNA基序和序列重复以及反向互补序列重复相关的问题。[0201]然而,这些要求通常不能同时以最佳的方式得到满足。例如,最佳密码子使用的优化可以导致高度重复序列和与所需的GC含量的相当大的差异。
[0202]因此,目标是达到在满足各种要求之间尽可能最佳的折中方案。然而,蛋白质中的大量氨基酸导致原则上可以表达所需的蛋白质的可能的DNA序列的数量组合激增。
[0203]可以利用各种计算机辅助方法来确定最佳的密码子序列。例如,可以在生物体(例如,病毒,尤其是牛痘病毒;原核生物,尤其是大肠杆菌、新月柄杆菌(Caulobactercresentus)、枯草芽抱杆菌(Bacillus subtilis)、分枝杆菌(Mycobacterium spec.);酵母,尤其是酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomycespombe)、毕赤酵母(Pichia pastoris)、安格斯毕赤酵母(Pichia angusta);昆虫,尤其是草地贪夜蛾(Sprodoptera frugiperda)、果蚬(Drosophila spec.);哺乳动物,尤其是智人(Homo sapiens)、野捕恒河猴(Macaca mulata)、小家鼠(Mus musculus)、牛(Bos taurus)、山羊(Capra hircus)、绵羊(Ovis aries)、兔(Oryctolagus cuniculus)、大鼠(Rattusnorvegicus)、中国仓鼠卵巢(Chinese hamster ovary);单子叶植物,尤其是水稻(Oryzasativa)、玉米(Zea mays)、小麦(Triticum aestivum);双子叶植物,尤其是大豆(Glycinmax)、棉花(Gossypium hirsutum)、烟草(Nicotiana tabacum)、拟南芥(Arabidopsisthaliana)、马铃薯(Solanum tuberosum))中用核酸优化方法来优化核苷酸序列以表达蛋白质。
[0204]表达某些蛋白质可以特别地从核酸优化其编码序列获得益处。
[0205]一般来说,许多各种不同的蛋白质是核酸优化其编码序列的靶标,例如,酶,尤其是聚合酶、内切酶、连接酶、脂肪酶、蛋白酶、激酶、磷酸酶、拓扑异构酶;细胞因子、趋化因子、转录因子、致癌基因;来自喜温生物体、嗜寒生物体、嗜盐生物体、嗜酸生物体、嗜碱生物体的蛋白质;具有重复序列元件的蛋白质,尤其是结构蛋白;人抗原,尤其是肿瘤抗原、肿瘤标记、自身免疫抗原、诊断标记;病毒抗原,尤其来自HAV、HBV、HCV、HIV、SIV、FIV、HPV、鼻病毒、流感病毒、疱疫病毒、多发瘤病毒、亨德拉病毒、登革热病毒、AAV、腺病毒、HTLV> RSV ;原生动物和/或致病寄生虫,尤其是导致疟疾的、利什曼虫抗原;锥体虫、弓浆虫、变形虫;致病细菌或细菌病原体抗原,尤其是下述属:衣原体、葡萄球菌、克雷伯氏杆菌、链球菌、沙门氏菌、李斯特氏菌、包柔氏螺旋体、大肠杆菌;安全等级L4的生物体的抗原,尤其是炭疽杆菌(Bacillus anthracis)、埃博拉病毒、马尔堡病毒、痘病毒。
[0206]给定这些标准,各种用于优化核酸构建体的算法是本领域众所周知的,并在USPat.Pub.2007/0141557中进一步描述,其以参照方式全文并入本文。
[0207]可以进一步优化核酸构建体以通过控制CpG含量调节基因表达。在各中实施方式中,优化涉及改变CpG 二核苷酸的比例,其与所编码的基因产物的表达水平的改变有关。
[0208]表达系统可以是细胞或无细胞系统或体外系统。可以使用原核或真核表达系统,不过优选地采用真核表达系统。合适的表达系统包括例如细菌细胞、昆虫细胞(例如杆状病毒表达系统、SF9细胞、果蝇-施耐德细胞)、植物细胞、酵母(例如酿酒酵母、安格斯毕赤酵母、毕赤酵母等);还包括藻类,例如衣藻。可能的植物表达系统的例子包括拟南芥、玉米、烟草、水稻、大麦(Hordeum vulgare)、大豆、卷心菜(Brassca sp.)等。优选地,使用脊椎动物细胞,特别是哺乳动物细胞,尤其是人细胞,特别是体细胞和非生殖细胞。
[0209]表达系统可以是具有低甲基化水平的系统或细胞,即基本上不会有重新甲基化发生。另一方面,还可以使用核酸优化方法,例如那些涉及改变CpG 二核苷酸比例,用于生产转基因非人生物体,特别是植物和动物的方法。
[0210]在一些实施方式中,相应基因的表达可以通过选择合适的CpG 二核苷酸数量进行负影响(较少的CpG)或正影响(数量增加的CpG),甚至可以超过密码子优化的基因锁能达到的表达率。表达甚至可以在某些环境下提高,例如,如果CpG 二核苷酸数量的增加在RNA损失和密码子优化的情况下发生。
[0211]在一些实施方式中,在目标核酸序列修饰中没有引入CpG岛。
[0212]在一些实施方式中,修饰的目标核酸序列与CpG岛无关。表达水平和CpG 二核苷酸数量之间的相互关系通常可以指示核酸优化。
[0213]对于基因的表达,优选地,引入这些修饰,以使编码的氨基酸序列不改变。
[0214]在理想情况下,只有相应基因的核酸序列影响其表达水平。由于遗传密码简并,对于特定氨基酸序列,有选择复数个相应核酸序列的可能性。
[0215]与要表达的目标核酸序列的序列相比,依据所需的表达水平,可以将其CpG 二核苷酸数量增加或减少至少2倍,优选至少3倍,更优选至少5倍,更优选至少8倍,更优选至少10倍,更优选至少15倍,以及达到20倍或更多,尤其是30-50倍或甚至达到100倍或更多,这取决于要表达的目标核酸序列的长度。
[0216]在一些实施方式中,与要表达的目标核酸序列的序列相比,可以将其CpG 二核苷酸数量增加或减少至少10%、20%、50%、100%,或200%,或按系数至少3、5、5、10、20或更多。
[0217]可以利用遗传密码的简并,以便优选地,引入或消除最大量的CpG 二核苷酸,而不用改变要表达的目标核酸序列的氨基酸序列。要引入的最大量的CpG 二核苷酸受预先确定的氨基酸序列的简并密码子的变异可能性限制。另一方面,如果所需的CpG 二核苷酸数量可以进一步增加,即使这样会改变对应的氨基酸序列。在这些情况下,另外的合适的方案能够确保小心地保证基因产物(例如肽或蛋白质)的功能不受干扰。
[0218]除了增加或减少CpG 二核苷酸的数量,可以实施其它类型的核酸优化,以促进或抑制或减少基因表达。例如,插入或移除基序能够影响记忆表达,例如二级结构稳定化序列、具有上升的自身同源性的区域、具有与天然基因的上升的同源性的区域、RNA不稳定性基序、拼接活化基序、多腺苷基序、富腺嘌呤序列(sequence steps)、核酸内切酶识别位点
坐寸ο
[0219]在一些实施方式中,核酸优化包括各种情况下优化用于所需的表达系统的密码子选择。
[0220]为提高或降低基因产物的表达水平,利用除插入CpG 二核苷酸之外的核酸优化方法,例如修饰密码子选择,是在本发明范围之内的。根据本发明,可以通过例如选择与所用表达系统中相同的密码子分布产生表达优化的构建体。
[0221]在一些实施方式中,真核表达系统是哺乳动物系统,例如人系统。密码子优化可以匹配人基因的密码子选择。可以使用哺乳动物中最常用或次常用的密码子选择(Ausubelet al., 1994)以保证RNA的大体稳定和最佳的密码子选择。
[0222]可以使用合适的基因优化技术,例如公开的专利DE10260805.9和PCT/EP03/14850中所描述的那些,修饰核酸序列以进行最佳表达。上述专利以参照方式全文并入本文。
[0223]在本发明范围内,可以利用任何合适的本领域已知载体。
[0224]在一些实施方式中,优选地,载体适合于真核细胞中的表达。
[0225]可以将要表达的修饰的目标核酸序列克隆到载体中,以使其与合适的转录控制序列和,可能进一步,调控元件可操作评述地连接。
[0226]这样的转录控制序列可以是合适的启动子,其可以是组成型或诱导型的。组成型活性启动子选自但不限于CMV(巨细胞病毒)启动子和后病毒40(SV40)。诱导型启动子包括但不限于四环素依赖启动子。进一步,合适的本领域已知的启动子可以根据应用选择,例如特定细胞起源的启动子。
[0227]可以利用现有技术中已知的任何诱导型启动子系统。例如,可以使用天然或人工的诱导型启动子,例如四环素诱导的启动子(Tet开(on)/Tet关(off)系统)。还可以使用诱导型病毒启动子。
[0228]诱导型启动子可以由反式活性因子诱导。病毒诱导型启动子可以起源于任意病毒,其可以由病毒反式活性因子诱导。逆转录病毒、HCV(丙型肝炎病毒)、HBV(乙型肝炎病毒)、HSV(单纯性疱疹病毒)、EBV(艾巴氏病毒,Epstein-Barr virus)、SV40 (猴病毒40)、AAV (腺相关病毒)、腺病毒、乳头瘤病毒或埃博拉病毒可以用于来源目的。
[0229]反式活性因子选自但不限于例如下列病毒因子:NS5A (HCV)、HB X(HBV), VP16/ICP4 (EBV)、EBNAI/Rta (EBV)、ART (HHV8)、巨大 T 抗原(SV40)、R印78/68 (AAV)、ElA (腺病毒)、E2 (乳头瘤病毒)以及VP30 (埃博拉病毒)。
[0230]可以利用能够由病毒反式活性因子诱导的诱导型启动子。例如,可以使用逆转录病毒LTR启动子或其功能部分序列。反式活性因子可以是逆转录病毒Tat或Tax蛋白。LTR启动子可以选自HIV-1、HIV-2、SIV、HTLV以及其他相关的具有LTR启动子的逆转录病毒的LTR0特别地,可以利用慢病毒启动子,例如HIV的那些慢病毒启动子。
[0231 ] 在一些实施方式中,本发明范围内使用的转录控制序列,即例如启动子和/或增强子等,与CpG岛无关。
[0232]除了增加要表达的目标核酸中CpG 二核苷酸的数量,要减少剩余序列或其部分中CpG 二核苷酸的数量,以降低其在核酸或载体整体上的数量。例如,剩余序列或其部分中的CpG 二核苷酸可以部分地完全消除。
[0233]在一些实施方式中,当通过利用遗传密码的简并在基因产物中保留氨基酸序列时,再次实施消除。
[0234]在一些实施方式中,可能只进行这些序列中的CpG 二核苷酸的部分消除,例如至少5 %,优选至少10 %,更优选至少15 %,更优选至少25 %,更优选50 %以及最优选75 %或更多。在一些实施方式中,在可能的情况下移除所有CpG。根据应用(沉默或增加表达),CpG 二核苷酸的数量可以不依赖于选择密码子优化而改变。在许多情况下从读框中完全消除CpG是可能的。编码的氨基酸序列可以有上限,即关于增加CpG的数量。
[0235]优化核算中CpG 二核苷酸含量的方法在US Pat.Pub.2009/0324546中进一步详细描述,其以参照方式全文并入本文。
[0236]示例模块4:检测核酸构建体中的错误
[0237]在各种实施方式中,本发明的方法和系统允许在设计的核算构建体中进行错误检查。
[0238]在一些实施方式中,本发明涉及一或多个成长数据库,其包含关于单一遗传学对象的数据和/或元数据。
[0239]在一些实施方式中,数据库包含关于遗传学对象的相关信息。
[0240]本发明的系统和方法可以通过序列比对将设计的核酸构建体与数据库条目进行比较。
[0241]确定具有上述阈值可能性的错误的存在可以基于与数据库条目的序列比对,也可以基于相关信息。
[0242]本发明的各种实施方式涉及当比较构建体与数据库的条目的算法输出上述阈值可能性的错误时,标记设计的核酸构建体的部分或全部。
[0243]在一些实施方式中,本发明的系统和方法提供设计的核酸构建体改变的输出。
[0244]在一些实施方式中,改变会在设计的核酸构建体中安放(fix) —个确定的错误。
[0245]在一些实施方式中,本发明的方法和系统自动接受改变并更新核酸构建体。
[0246]在一些实施方式中,给予用户接受改变的选项。
[0247]在一些实施方式中,本发明的方法和系统包含用于设计的DNA序列除错的模块。基于元数据成长数据库,对于每个遗传学“对象”-元数据和序列比对中的相关领域+对于每个对象的相关检查+标记和可能的“安放(fix) ”建议。
[0248]示例模块5:给核酸构建体指定代谢标记
[0249]通常地,代谢途径包括通过酶连接的分子网络,所述酶催化一个分子从其相邻的分子形成。
[0250]生产特定分子(药物、燃料等)的细胞代谢工程是合成生物学的一般用途。
[0251]细胞和/或生物体中一些或全部代谢途径的定位信息和可视化,或将代谢途径与酶和/或其编码核酸相连,将是人们在合成生物学领域中极其有用的工具。
[0252]在各种实施方式中,一或多个代谢途径的描述以核酸构建体注释。
[0253]在一些实施方式中,注释通过包含与遗传学对象相关的(E.C.)编号的代谢数据库添加。
[0254]E.C.编号是酶的数字分类体制,其基于酶催化的化学反应。在这种酶命名系统中,每个EC编号与某个酶催化的反应的推荐名称相关。因此,E.C.编号明确了酶催化反应。催化相同反应的两个不同的酶(例如来自不同的生物体)可以收到相同的E.C.编号。
[0255]在一些实施方式中,E.C.编号获得自与遗传对象相关的基因组档案。
[0256]核酸构建体的部分或全部可以与代谢数据库中的遗传学对象进行比对。
[0257]具有上述根据比对的与注释有代谢途径的序列的百分比相似性或相同性的指定阈值水平的遗传学对象可以用相同或相似的代谢途径描述进行注释。
[0258]通常地,可以将核酸构建体中的一些或所有基因和/或遗传学对象,例如目标基因组,发送到比对模块,例如 NCBI Blast 工具(http://www.ncb1.nlm.nih.gov/Blast.cgi)。
[0259]核算比对算法,例如Megablast算法,可以应用于提交的序列以找到来自具有高比对分数的数据库的序列,例如大于95%相似性或相同性。
[0260]可以将注释的与挑选的序列相关的E.C.编号分配于提交的基因或遗传学对象。[0261]在一些实施方式中,E.C.编号的分配是自动化的。
[0262]任何分配于设计的核酸构建体的E.C.编号可以储存在相关的档案中,例如项目档案和/或数据库。
[0263]核酸构建体项目中具有列举的E.C.编号的代谢途径可以以各种方式展示。例如,途径的图像/动画可以自动展示或根据用户查询。
[0264]在一些实施方式中,用户查询包括鼠标悬停在用户界面对象上或用鼠标点击用户界面对象。
[0265]在另一实施例中,催化活性可以分为组。催化活性组可以用各种与基因/遗传学对象相关的可视图标展示。
[0266]在一些实施方式中,本发明的系统和方法通过与途径的最终或中间产物相关的途径加工影响代谢途径。
[0267]例如,用户可以选择代谢产物和/或途径中的酶。
[0268]算法可以确定各种代谢途径产生所选的代谢产物的可能性。
[0269]算法可以进一步提供包括一或多个基因和/或遗传学元件的选项以增加或减少生产,延迟和/或积累所选的代谢产物。
[0270]在另一实施例中,所选的酶的功能可以跨越多个代谢途径来确定,并且可以提供替换可能性作为包括一或多个基因和/或基因产物的选项。
[0271]在一些实施方式中,本发明的系统和方法包括用于构建每个“匆忙地(on thefly)”设计的可汇编的代谢途径描述的算法。从基因组档案或每个遗传学“对象”获得E.C.编号元数据的工作与设计中所有的基因/对象与gen bank数据库的序列比对相结合,并自动地给未注释的基因分配E.C.编号。
[0272]示例模块6:优化核酸构建体的合成,最小化开支
[0273]本发明的各种实施方式涉及核酸构建体的合成,例如用本发明的系统和方法设计的核酸构建体。
[0274]在一些实施方式中,本发明的系统和方法包括用于储存序列和/或之前订购的序列的数据库。
[0275]可以根据数据库检查核酸构建体,以确定是否构建体的部分或全部与数据库的条目比对处于上述相同性水平阈值。
[0276]例如,构建体和数据库条目之间一个碱基对的差异可以导致通过用所需的碱基对替换该单碱基对,从而容易地生产所需的构建体。在另一实施例中,所需的构建体的许多部分可以定位于数据库内,因此使构建体的合成可以通过集合较短的序列来进行。
[0277]在一些实施方式中,构建体的优化的合成可以基于开支、难易和/或速度。
[0278]在一些实施方式中,合成的价格可以基于所选的合成方法调整。
[0279]合成优化可以通过用户适应于不同的标准,例如,选出更昂贵的合成方法是基于其所需的速度。
[0280]在一些实施方式中,本发明的系统和方法包括用于以对用户最廉价和/或给我们更高利润的方式编辑设计的算法。检查我们关于已订购部分和较短的DNA的数据库并设计可能的性价比最高的订单。
[0281]示例模块7:产生核酸构建体的合成方案[0282]在各种实施方式中,本发明涉及产生用于核酸(例如使用本发明的系统和方法产生的设计的核酸构建体)的核酸合成方案的系统和方法。
[0283]在一些实施方式中,算法自动产生用于核酸(例如基因组或质粒)的自动化的构建方案。例如,算法能产生具有各种标准(诸如开支、速度和/或难易)的构建方案。
[0284]在一些实施方式中,本发明的系统和方法包括用于基于可能的最廉价/最快速/最容易的构建方法(取决于用户的偏爱和部分编辑结果)创建自动化的基因组/质粒构建方案。
[0285]示例模块8:互动用户界面的特征
[0286]本发明的各种实施方式涉及互动用户界面以可视化与设计操作相关的生物学信
肩、O
[0287]在一些实施方式中,用户界面包含复数个分辨率层。
[0288]分辨率层可以根据选择的“缩放”水平以中肯的方式展示信息。
[0289]在一些实施方式中,分辨率层对应生物学信息的差异可视表现。
[0290]在一些实施方式中,用户界面可以动态变换可视表现,这与“缩放”水平相关。
[0291]在各种实施方式中,生物学信息来源于可操作连接于本发明系统的数据库。
[0292]在一些实施方式中,生物学信息的各种可视表现与抽象水平有关。可以选择抽象水平以最佳地以所需的充分性表现生物学信息,例如本发明的各种抽象水平可以对应生物体、基因组、系统、代谢途径、蛋白质、遗传学位点、氨基酸或核酸水平。
[0293]在各种实施方式中,用户界面包含可视图标,用户可以对其进行选择以变换所需的抽象水平。因此,相应的“缩放”水平可以在用户界面上展示。
[0294]在一些实施方式中,可以将遗传学元件,例如设计的核酸构建体的元件,拖到缩放水平之间。例如,可以用计算机鼠标选择遗传学元件并将其移动到用户界面上代表所需的缩放水平的图标上。
[0295]这样的操作能够以合适的分辨率、细节和信息变换遗传学界面的可视化。例如,根据变换到代谢视野,如果相关基因产物参与代谢途径,用户界面可以将遗传学对象展示为代谢途径的元件。
[0296]在各种实施方式中,本发明的系统和方法的动态缩放功能使用户界面上的展示在各种视野之间变换,例如基因视野、代谢模拟视野、蛋白质视野、细胞视野、生物体视野、器官视野、复杂生物体视野(例如酵母、植物、动物、人)、性别特异性视野或任何其它合适的本领域已知视野。
[0297]在一些实施方式中,用户界面可以以与平均或最普通物种序列相比较的方式展示核酸构建体。
[0298]在一些实施方式中,可以展示物种中核酸序列中的个别序列变异。可以指定“标准”序列,例如当多数时间都发现特异性序列变异时。与“标准”序列相比,可以展示个别序列、突变,例如癌相关突变。
[0299]序列变异可以展示为表型;例如可以用生物体水平或活培养物水平的“缩小”的样子展示作为结果的表型,诸如展示一种受活培养物影响的啤酒或面包。各种视野可以展示相比于家族、品系、性别、种族、特征群和任何其它本领域已知的合适的比较目标的特定的个体。[0300]在一个非限制性实施例中,用户可以从最高缩放水平开始,在那里生物学信息只使用代表性图标展示。
[0301]在一些实施方式中,系统包括每个抽象水平都具有缩放功能的GU.1,抽象水平包括:生物体、基因组、系统、位点、氨基酸和DNA。能够将遗传学元件拖入或使其落入不同缩放水平之间。缩放水平描述自动改变以反映聚焦的对象(生物体、基因、代谢途径和蛋白质/DNA结构)。
[0302]缩放分子/序列密码到基因视野、代谢模拟视野、蛋白质视野、细胞视野、生物体视野、器官视野、复杂生物体视野酵母、植物、动物、人、性别、一般物种/比较个别序列视野、比较标准/修饰视野(突变/癌/其他版本)。
[0303]缩小到植物、动物、带有活培养物的食物(啤酒、面包)、特定个体、家族、品系、性另1J、种族、特征群等。
[0304]代表基因或基因组的图标可以拖或掉入设计画面。
[0305]例如,当大肠杆菌基因组被导入设计画面时,软件工具可以读取基因组并展示基因组性质和数据可视化工具,例如代谢途径工具,使用户可以容易地根据生产不同生化物质的途径设计特征。
[0306]各种模块可以使分子建模和/或模拟蛋白质结构能够进行。当我们放大到基因组时,基因和/或遗传学元件可以容易地且准确地进行移动、注释、突变和/或删除。
[0307]示例模块9:交易模块
[0308]在一些实施方式中,核酸构建体可以使用本发明的方法和系统进行订购、购买。
[0309]在一些实施方式中,核酸构建体使用本发明的方法和系统进行设计。
[0310]在一些实施方式中,核酸构建体市场中聚集了可购买的构建体。
[0311]用户可以提交具有序列信息的构建体,该构建体还具有其他相关信息,例如任何基因产物、生物体偏爱、代谢途径或任何其它合适的本领域已知信息。
[0312]在一些实施方式中,用户可以对市场中的构建体进行评述和/或评级。
[0313]可以通过激励来鼓励用户参与,例如提供来自订购的构建体的收益分享。
[0314]可以调整重复订购的构建体的价格,例如以从降低的生产开支获益而保护利润空间的方式。
[0315]设计的构建体的目的可以在于确定使用设计工具和/或合成的产物的价格。例如,使用设计软件以产生有可能在癌途径中有用的构建体可以比农业相关用途更昂贵或更廉价。
[0316]市场中的构建体可以由用户行为连接,例如,分享的用户订购的构建体提高了构建体的相关性。
[0317]基于用户对特定构建体的兴趣,可以将与特定构建体的相关性超过阈值水平的构建体建议给系统的用户。
[0318]在一些实施方式中,本发明的方法和系统允许创建核酸构建体市场。例如,用户可以容易地设计DNA源密码并订购相关产物,从一系列价格中做选择以使其可以选择最好的价格。
[0319]再如,通过使用市场可以给DNA合成商提供巨大且可预期的订单量。
[0320]在一些实施方式中,本发明的方法和系统允许在各种用户和/或价格水平使用软件工具。例如,可以要求强化的用户(诸如学术职业的用户或工业用户)支付在软件的较低费用版本中不可得的高级功能的定金。
[0321]在一些实施方式中,不同版本的涉及工具提供给多层次的用户。例如,四层用户模型可以包含“开放”用户、注册用户、学术职业用户和工业用户。
[0322]“开放”用户层可以设为不要求任何登录信息,但是提供储存和/或订购设计的选项。
[0323]注册用户层的用户可以通过系统订购设计。可以要求注册用户的现实生活信息,例如地址和/或信用卡号。可以允许注册用户储存更多的设计并在市场中公布订购的设计。可以给学术职业用户,例如在研究实验室中工作的用户,提供高端的客户支持,例如具有高级学位(诸如相关科学的Ph.D.)的客户支持代理。可以给学术职业用户职业的桌面应用的使用权,任选地,该应用具有额外的特征和/或其设计的无限储存空间。可以以中肯的价格水平给工业用户提供私人且保密的数据储存。
[0324]在一些实施方式中,本发明的系统和方法涉及产生本文描述的生物学应用商店。例如,通常地,第一次合成DNA是昂贵的,但是一旦合成了特定的构建体,DNA可以复制并保存,从而便宜几个数量级。
[0325]可以激励用户以组织其在我们的商店中公布他们订购的设计。可以给用户提供来自订购其涉及的收入来源。公布的设计越能使用户更廉价、更容易、以及更可能奏效地利用该设计,其被订购的可能性越高,这样就鼓励设计的公布者提供相关信息以允许更多的订购。在各种实施方式中,受激励的用户公布的设计使得重复订购增长以及进一步,产生更高的利润空间。
[0326]虽然本文显示和描述了本发明优选的实施方式,但对本领域技术人员来说显而易见的是这些实施方式只以实例的方式提供。很多变化、改变和替换对本领域技术人员而言是不脱离本发明的。应该理解本文描述的本发明的实施方式的各种代替可以用来实施本发明。意指下列权利要求定义本发明的范围,且这些权利要求范围内的方法和结构及其等同因此被覆盖。
[0327]在一些实施方式中,本发明的系统和方法产生生物学应用商店,从而订购了设计的用户可以提交该设计到应用商店。来自再次订购同一设计或在设计中有小改变的更高利润使我们可以在来自商店的部分上提供更好的价格+与提交者分享利润以激励提交、注释和使用商店。
[0328]在一些实施方式中,系统为DNA买家和卖家提供市场。未来将促进其它下游服务例如涉及的蛋白质产物、设计的生物生长、小分子纯化和其它服务+拍卖设计项目和生物学设计招聘服务。
[0329]示例模块10:编辑模块
[0330]在一些实施方式中,本发明涉及包含编辑模块的系统,所述编辑模块适合于根据一系列预先确定的规则检查设计的核酸序列。
[0331 ] 在一些实施方式中,进一步设置编辑模块以在客户和/或服务器中内部执行。
[0332]在一些实施方式中,编辑模块包含一系列设计规则。
[0333]在本发明的一些实施方式中,设计规则基于客户规则和/或系统规则。
[0334]在本发明的一些实施方式中,进一步设置所述编辑模块以使用户可以对所述列表添加他自己定义的规则。
[0335]在本发明的一些实施方式中,进一步设置所述编辑模块以将一系列在其设计的构建体中找到的可能的问题与关于可能的问题的位置和类型的可视警告一起发送给用户。
[0336]在本发明的一些实施方式中,进一步设置编辑模块以使用户可以复核并直接连接到所述可能问题的位置。
[0337]在本发明的一些实施方式中,编辑模块适合于使用户可以改变所述问题和/或忽略警报。
[0338]在本发明的一些实施方式中,该系列规则由基因组汇编器(Genome Compiler)编辑。
[0339]在本发明的一些实施方式中,该系列规则基于客户规则从而,用户可以对列表添加他自己定义的规则。
[0340]现对图1进行说明,图1以非限制方式阐明用于检测包括不良序列的指定序列的如上述系统中的检测模块。
[0341]在本发明的一些实施方式中,每次用户存储、输入或编辑其计算机[101]上的DNA记录,档案和用户记录通过网络[102]发送到基因组汇编器服务器-GCC服务器[103],且该序列通过序列比对模块[104]由序列比对算法模块(既包括可能的蛋白质/读框也包括DNA)与不良生物体和毒素数据库[107]进行比对。
[0342]每当来自特定1.P地址的用户(如果用户登录-还包括用户是谁)正在设计危险的毒素,服务器[103]使用通知模块[105]通知基因组汇编器系统。
[0343]然后人操作者仔细检查记录和构建他以理解其是恶意的还是来自卓越的研究所的可接受的研究。如果发现问题,基因组汇编器将通知官方机构。
[0344]现对图2进行说明,图2以非限制方式阐明以一种方法操作上述检查模块,该方法包括以下步骤:
[0345]步骤201:用户存储、输入或编辑其计算机[101]上的DNA记录;步骤202档案和用户记录通过网络发送到基因组汇编器服务器-GCC服务器;步骤203序列通过序列比对算法模块(既包括可能的蛋白质/读框也包括DNA)与不良生物体和毒素数据库进行比对;步骤204每当来自特定1.P地址的用户(如果用户登录-还包括用户是谁)正在设计危险的毒素,通知基因组汇编器系统。
[0346]步骤205然后人操作者仔细检查记录和构建他以理解其是恶意的还是来自卓越的研究所的可接受的研究。步骤206如果发现问题,基因组汇编器将通知官方机构。
[0347]现对图3进行说明,图3以非限制方式阐明包含适合于根据一系列预先确定的规则功能性检查设计的核酸序列的编辑模块[501]的计算机可读介质[101]。
[0348]在本发明的一些实施方式中,每次用户改变和或编辑项目,根据一系列设计规则检查序列档案(在客户[101]中和或通过网络在服务其中内部地)并将一系列在其设计的构建体中找到的可能的问题与关于可能的问题的位置和类型的可视警告一起发送给用户。
[0349]然后用户可以复核并直接连接到所述可能问题的位置,在该位置用户可以改变和/或忽略警报。
[0350]在本发明的一些实施方式中,该系列规则基因组汇编器编辑。
[0351]在本发明的一些实施方式中,该系列规则基于客户规则从而,用户可以对列表添 加他自己定义的规则。
【权利要求】
1.用于设计用于基因表达的核酸序列的计算机化系统,其包含: a.用于容纳数据库[106]的服务器[103]; b.网络连接[102]; c.包含功能模块的计算机可读介质[101],所述功能模块包括: i.用于使核酸构建体的设计能够进行的设计模块; ii.用于将与设计操作相关的生物学信息可视化的互动用户界面模块; iii.用于购买用户设计的或预存的核酸构建体的交易模块; iv.用于检测包含不良序列的所设计的核酸序列的检测模块; 其中该系统以下述方法操作: a)可视化生物学信息; b)设计核酸序列; c)当设计了不良序列时检测并通知; d)提供用于订购和购买所述合成的核酸的交易装置。
2.权利要求1的系统,其中设置所述计算机化系统作为在计算机设备上运行的软件应用和/或网站。
3.权利要求2的系统,其中所述应用安装在选自电话、手提设备以及任何合适的本领域已知计算机设备的计算机设备上。
4.权利要求1的系统,其中所述核酸选自DNA、RNA及其任意组合。
5.权利要求1的系统,其中所述计算机可读介质进一步包含存取模块,其使得用户可以在模块中以不同级别存取、在模块内以不同的功能级别存取及其任意组合,所述存取由预先确定的变量定义。
6.权利要求5的系统,其中所述预先确定的变量选自:不同的支付等级、用户类型和用户技术等级及其任意组合。
7.权利要求1的系统,其中进一步设置所述设计模块以使用户可以编辑所述核酸序列并在所述设计中使用不同的预先确定的对照。
8.权利要求7的系统,其中所述对照选自:甲基化位点的改变、蛋白质水平的改变和/或代谢水平的改变。
9.权利要求7的系统,其中所述核酸序列编辑包括在相关翻译系统中编辑非天然氨基酸和其它常规分子编码序列的合并,所述常规分子选自:重金属、标记、编码的数据和/或任何其它本领域已知的合适分子。
10.权利要求1的系统,其中进一步设置所述设计模块以使用户可以从遗传元件创建核酸设计,所述遗传元件选自:转录启动子、核糖体结合位点、基因、终止子和任何其它本领域已知的常规遗传元件。
11.权利要求1的系统,其中进一步设置所述设计模块以使用户可以从通过所述互动用户界面模块可获得的构件组建所述核酸构建体。
12.权利要求11的系统,其中所述构件是选自:启动子、开放阅读框、终止子、Shine-Dalgarno序列或其表达系统等价物。
13.权利要求1的系统,其 中进一步使所述设计模块适合于根据各种要求优化所述设计的核酸构建体。
14.权利要求13的系统,其中所述各种要求涉及密码子使用、GC含量和CpG含量,另一方面,基本上避免与DNA基序、序列重复和反向互补序列重复相关的问题。
15.权利要求1的系统,其中进一步设置所述设计模块以利用各种计算机辅助的方法来确定最佳的密码子序列。
16.权利要求15的系统,其中所述最佳的密码子序列与相关表达系统中蛋白质表达水平相关。
17.权利要求16的系统,其中基于用户输入的核酸序列确定所述表达系统。
18.权利要求17的系统,其中基于识别tRNA序列确定所述表达系统。
19.权利要求16的系统,其中所述表达系统选自:细胞、无细胞系统、体外系统、原核表达系统以及真核表达系统。
20.权利要求16的系统,其中所述表达系统进一步选自:细菌细胞、昆虫细胞例如杆状病毒表达系统、SF9细胞、果蝇-施耐德细胞、植物细胞、酵母例如酿酒酵母、安格斯毕赤酵母、毕赤酵母等;还包括藻类例如衣藻。可能的植物表达系统的例子包括拟南芥、玉米、烟草、水稻、大麦、大豆、卷心菜以及任何其它本领域已知的常规系统。
21.权利要求16的系统,其中所述表达系统包括低甲基化水平的系统和/或细胞。
22.权利要求1的系 统,其中进一步设置所述设计模块使所述最佳的密码子与所需的表达系统中最常采用或次最常采用的密码子相匹配,以保证RNA大体上的稳定和最佳的密码子选择。
23.权利要求1的系统,其中进一步设置所述设计模块以利用各种合适的基因优化技术。
24.权利要求1的系统,其中设置所述设计的核酸以克隆到载体,从而其可操作地与合适的转录控制序列和调控元件连接。
25.权利要求24的系统,其中所述转录控制序列包括合适的组成型或诱导型启动子。
26.权利要求1的系统,其中所述数据库[106]进一步包含每个遗传学对象的相关信肩。
27.权利要求1的系统,其中所述计算机可读介质进一步包含适合于检测核酸构建体中错误的除错模块。
28.权利要求27的系统,其中进一步设置所述除错模块以通过序列比对比较设计的核酸构建体与所述数据库[106]条目。
29.权利要求27的系统,其中进一步使所述除错模块适合于比较设计模块中的所述核酸构建体与用于评估成功的核酸序列和基因表达兼容性的处方。
30.权利要求27的系统,其中进一步使所述除错模块适合于用以上预先确定的所述核酸构建体中的阈值确定错误的存在。
31.权利要求30的系统,其中基于与所述数据库条目和相关信息的序列比对确定错误的存在。
32.权利要求27的系统,其中所述除错模块向输出端提供所述设计的核酸构建体的可选改变。
33.权利要求32的系统,其中设置所述改变以修正所述设计的核酸构建体中确定的错误。
34.权利要求32的系统,其中设置所述改变以使其被所述系统自动接受并更新所述核酸构建体。
35.权利要求32的系统,其中进一步设置所述改变以便作为选择给予用户,用于其决定是否接受所述改变。
36.权利要求27的系统,其中设置所述除错模块以便评估用于预测基因表达水平的必要构件的存在。
37.权利要求36的系统,其中所述除错模块评估所述构件的所述核酸序列的正确性。
38.权利要求36的系统,其中所述除错模块评估所述构件中的密码子使用,以便预测给定表达系统中的表达兼容性。
39.权利要求29的系统,其中所述评估基因表达兼容性包括成功阈值。
40.权利要求39的系统,其中所述成功阈值由用户设定。
41.权利要求39的系统,其中所述成功阈值与预期表达水平相关。
42.权利要求1的系统,其中所述计算机可读介质进一步包含用于给核酸构建体指定代谢途径的模块。
43.权利要求42的系统,其中设置所述指定代谢途径模块以将代谢途径的描述注释到所述设计的核酸构建体。
44.权利要求43的系统,其中所述注释代谢途径从包含关于遗传学对象的E.C.编号的代谢数据库获得。
45.权利要求44的系统,其中所述E.C.编号获得自与遗传对象相关的基因组档案。
46.权利要求42和45的系统,其中进一步设置所述指定代谢途径的模块以比较所述核酸构建体的部分和/或全部与代谢数据库中的遗传学对象。
47.权利要求46的系统,其中所述遗传学对象包含与用代谢途径注释的核酸构建体具有阈值水平的百分比相似性或相同性,其可以用相同和/或相似的代谢途径注释。
48.权利要求42的系统,其中进一步设置所述指定代谢途径的模块以利用各种合适的比对模块。
49.权利要求48的系统,其中所述合适的比对模块包含NCBIBlast工具。
50.权利要求43和44的系统,其中进一步设置所述指定代谢途径的模块以将核酸比对算法应用于所述提交的核酸构建体,以便从所述代谢数据库中找到具有预先确定的最高比对得分的序列。
51.权利要求50的系统,其中可以将与从所述代谢数据库挑选的遗传学对象相关的所述E.C.编号分配到所述提交的核酸构建体。
52.权利要求51的系统,其中进一步设置所述E.C.编号以自动分配。
53.权利要求52的系统,其中进一步设置所述分配的E.C.编号以便将其储存在与所述遗传学对象有关的相关文档中。
54.权利要求42的系统,其中进一步设置所述指定代谢途径的模块以便通过与所述设计的核酸构建体的最终和/或中间产物有关的加工途径将代谢途径指定给所述设计的核酸构建体。
55.权利要求42的系统,其中进一步设置所述指定代谢途径的模块以确定选定的酶在多个代谢途径中的功能和/或作为选择,提供包括一个或多个基因和/或基因产物的替代可能性。
56.权利要求42的系统,其中进一步设置所述指定代谢途径的模块以展示用各种与基因/遗传学对象相关的可视图标分组的催化活性。
57.权利要求45的系统,其中进一步设置所述代谢途径以自动地和/或经用户查询而展示。
58.权利要求57的系统,其中所述用户询问包括人与指针的互动。
59.权利要求58的系统,其中所述人的互动包括选自虚拟按压、保持、杠杆、拉、推、开、关、捕获、掌握、滑动、滚动、转动、刮、擦、射击、刺、穿透、钉、指出、打字、指向或其他所述指针操控的活动。
60.权利要求1的系统,其中所述数据库[106]适合储存序列和/或之前订购的序列。
61.权利要求1的系统,其中所述数据库可操作地与计算机化系统连接。
62.权利要求1的系统,其中设置所述核酸构建体以针对所述数据库对其进行检查来确定所述构建体的部分或全部是否在上述预先确定的阈值相同性水平与所述数据库的条目匹配。
63.权利要求1的系统,其中所述计算机可读介质进一步包含用于优化核酸构建体的所述合成的模块。
64.权利要求63的系统,其中设置所述优化合成模块以基于花费、难易和/或速度优化所述核酸序列构建体的所述合成。
65.权利要求1的系统,其中所述计算机可读介质进一步包含用于产生核酸构建体的合成方案的模块。
66.权利要求65的系统,其中用于产生合成方案的模块包含为所述核酸构建体自动产生构建方案的算法。
67.权利要求66的系统,其中设置所述算法以产生具有包括速度和/或难易的各种标准的构建方案。
68.权利要求66的系统,其中进一步设置所述用于产生合成方案的模块以将所述设计的核酸插入生物体并在所述选定的生物体内功能性表达所述设计的构建体。
69.权利要求1的系统,其中进一步设置所述互动的用户界面以用相关功能展示本发明的各种模块。
70.权利要求69的系统,其中所述各种模块选自核酸设计、错误检查、密码子优化、代谢产物设计、具有动态缩放的生物学信息的可视表现、核酸合成、关于订购和/或购买合成的核酸的交易、用户评述、核酸构建体分级和/或任何具有本领域已知功能的常规模块。
71.权利要求1的系统,其中所述互动的用户界面模块包含多个分辨率层。
72.权利要求71的计算机化系统,其中设置所述分辨率层以便按照与预先确定的选定“缩放”水平相应的方式展示生物学信息。
73.权利要求72的系统,其中进一步设置所述分辨率层以对应所述生物学信息的差异性可视表现。
74.权利要求1和73的系统,其中进一步设置所述互动用户界面模块以动态地转换与“缩放”水平相关的所述生物学信息的所述可视表现。
75.权利要求74的系统,其中所述生物学信息源于所述数据库[106]。
76.权利要求75的计算机化系统,其中所述生物学信息包含所述设计的核酸构建体的遗传学元件。
77.权利要求74的系统,其中所述生物学信息的所述可视表现与抽象水平相关。
78.权利要求77的系统,其中预先选择所述抽象水平以便最佳地以所需的充分性表现所述生物学信息。
79.权利要求77的系统,其中设置所述各种抽象水平以对应选自生物体、基因组、系统、代谢途径、蛋白质、遗传学位点、氨基酸或核酸水平细节的不同水平。
80.权利要求1的系统,其中所述互动用户界面模块包含用于使用户可以转换到所需的抽象水平的可视图标。从而相应地,在所述用户界面上展示对应的“缩放”水平。
81.权利要求76的系统,其中设置所述生物学信息以使其在缩放水平间“拖动”。
82.权利要求81的计算机化系统,其中设置适合于执行动态缩放功能的所述拖动操作以转换具有适合的分辨率、细节和/或信息的遗传学界面的可视化。
83.权利要求82的计算机化系统,其中所述动态缩放功能适合于在各种视野之间转换展示设计的核酸构建体,所述视野选自基因视野、代谢模拟视野、蛋白质视野、细胞视野、生物体视野、器官视野、复杂生物体视野例如,酵母、植物、动物、人、性别特异性视野或任何其它本领域已知的合适的视野。
84.权利要求1 的计算机化系统,其中进一步设置所述互动用户界面模块以对比于平均或最普通的物种序列展示所述核酸序列构建体。
85.权利要求68的系统,其中所述互动用户界面模块进一步包含代表性图标。
86.权利要求74的计算机化系统,其中所述生物学信息进一步适合于被选择并移动到所述代表性图标上以表现所需的缩放水平。
87.权利要求1的计算机化系统,其中进一步设置所述互动用户界面模块以展示所述核酸序列在物种内的序列变异。
88.权利要求88的系统,其中设置所述序列变异以将其展示为表型。
89.权利要求1的计算机化系统,其中进一步设置所述互动用户界面模块以展示所述特异性核酸序列的各种视野,所述展示是相比于目标家族、品系、性别、种族、特征群和任何其它本领域已知的合适的比较目标进行的。
90.权利要求86的计算机化系统,其中设置所述代表性图标以使其被拖和/或掉入设计画面。
91.权利要求1的计算机化系统,其中所述互动用户界面模块进一步包含用于分子建模和/或模拟蛋白质结构的各种模块。
92.权利要求91的计算机化系统,其中所述分子建模和/或模拟蛋白质结构包括选自移动、注释、突变和/或删除操作的操作。
93.权利要求1的计算机化系统,其中所述订购和/或购买的核酸构建体产品包括包含分离的设计的核酸构建体的合成制备物,和用于在所需的生物体内插入和/或表达该设计的构建体目的的任何其它试剂以及实验方法的试剂盒。
94.权利要求1的计算机化系统,其中所述交易模块包含可购买的核酸构建体的市场。
95.权利要求94的计算机化系统,其中所述市场由核酸合成商和/或个人用户构成。
96.权利要求1的计算机化系统,其中所述交易模炔基于选自序列可获得性、生产核酸构建体要求的合成方法、核酸构建体的使用的各种标准。
97.权利要求1的计算机化系统,其中进一步设置所述交易模块以使用户可以提交具有序列信息的构建体,和选自基因产物、生物体偏爱、代谢途径或任何其它本领域已知的合适的信息的任何其它相关信息。
98.权利要求1的计算机化系统,其中进一步设置所述交易模块以使用户可以在所述市场中对构建体进行评述和/或分级。
99.权利要求1的计算机化系统,其中所述交易模块进一步适合于通过激励鼓励用户参与。
100.权利要求99的计算机化系统,其中所述激励包括提供来自订购的构建体的收益分享。
101.权利要求1的计算机化系统,其中进一步设置所述交易模块以确定使用所述设计模块和/或合成的产物的价格。
102.权利要求101的系统,其中所述价格的确定在考虑所述核酸构建体设计的目的的情况下执行。
103.权利要求1的计算机化系统,其中所述交易模块进一步适合于使得可以通过使用市场给DNA合成商提供巨大且可预期的订购量。
104.权利要求1的计算机化系统,其中所述不良序列包含能够编码病毒或毒素的部分的核酸构建体。
105.权利要求1的计算机化系统,其中所述检测模块包含报警机制。
106.权利要求105的计算机化系统,其中设置所述报警机制以在设计、订购和/或购买了所述不良序列时,使一或多个经授权的系统用户警觉。
107.权利要求1的计算机化系统,其中进一步设置所述检测模块以使用汇编的数据库[107]。
108.权利要求107的计算机化系统,其中所述检测模块进一步包含用于检查所述指定序列与所述数据库[107]中一或多个条目的比对水平的序列比对算法模块。
109.权利要求107的计算机化系统,其中所述汇编的数据库适合于描绘选自毒素、病毒、细菌、病原体的一系列不良产物。
110.权利要求107的计算机化系统,其中所述汇编的数据库适合于含有与不良产物强烈相关的核酸序列。
111.权利要求107的计算机化系统,其中进一步设置所述汇编的数据库以储存不良产物和/或序列的部分或全部条目的风险水平。
112.权利要求1的计算机化系统,其中进一步设置所述检测模块以便当设计的核酸的部分与不良产物数据库的一或多个条目的比对高于阈值水平时标记用于警报。
113.权利要求112的计算机化系统,其中所述比对包括百分比相似性、相同性或二者兼具。
114.权利要求112的计算机化系统,其中所述阈值水平包括选自低、中或高警报的几种不同水平。
115.权利要求114的计算机化系统,其中所述警报进一步包括自动化的警报。
116.权利要求114的计算机化系统,其中所述警报进一步包括要求人操作员另外复核的警报。
117.权利要求1的计算机化系统,其中所述服务器[103]包含通知模块,其用于当设计、订购和/或购买了不良序列时通知官方机构。
118.权利要求107和117的计算机化系统,其中所述不良序列是指其风险级别超过与所述数据库中的一或多个条目比对的阈值水平。
119.权利要求112的计算机化系统,其中所设的所述阈值水平对数据库的所有成员是相同的。
120.权利要求112的计算机化系统,其中根据与特定数据库条目相关的风险级别调节所述阈值水平。
121.权利要求1的系统,其中进一步设置所述检测模块以便给与更高不良条目相关的核酸构建体确定更高的价格。
122.权利要求107的计算机化系统,其中进一步设置所述汇编的数据库以重新构建和/或汇编公共或私有信息。
123.权利要求1的计算机化系统,其中所述检测模块进一步包括来自专门机构的实施方法。
124.权利要求1的计算机化系统,其中所述计算机可读介质进一步包含汇编模块,其适合于根据一系列预先确定的规则检测设计的核酸序列。
125.权利要求124的计算机化系统,其中进一步设置所述汇编模块以在客户[101]和/或服务器[103]中内部执行。
126.权利要求124的计算机化系统,其中所述汇编模块包含一系列设计规则。
127.权利要求124的计算机化系统,其中所述设计规则基于客户规则和/或系统规则。
128.权利要求124的计算机化系统,其中进一步设置所述汇编模块以使用户可以对所述列表添加他自己定义的规则。
129.权利要求124的计算机化系统,其中进一步设置所述汇编模块以给用户发送一系列在其设计的构建体中发现的可能的问题,发送给用户的是关于所述可能的问题的位置和类型的可视警告。
130.权利要求129的计算机化系统,其中进一步设置所述汇编模块以使用户可以复核并直接连接到所述可能问题的位置。
131.权利要求129的计算机化系统,其中所述汇编模块适合于使用户可以改变所述问题和/或忽略所述警报。
132.权利要求1的计算机化系统,其中用于检测所述设计的核酸构建体中的不良序列的所述介质包含:(a)不良序列的数据库;(b)与用户订购的序列的序列比对;以及(C)用于标记不良序列的智能阈值。
133.用于评估核苷酸序列质量的计算机化方法,其包括: a.接收核苷酸序列; b.将序列与之前接收的序列的数据库比较;以及 c.对序列进行质量分级, 其中高质量分级与序列先前出现在数据库中的次数相关。
134.用于设计多核苷酸构建体的计算机化方法,其包括下述步骤:a.提供构件; b.允许用户设计多核苷酸,其中设计包括组合所提供的构件; c.接收设计的多核苷酸;以及 d.对设计的多核苷酸进行质量分级, 其中质量分级基于先前组装的设计的多核苷酸,其中高的分级基于先前接收的设计的多核苷酸的高数量。
135.用于可视化生物学信息的计算机化系统,其包含: a.在网络环境中的虚拟的计算机平台,所述网络环境能够在可动态缩放的用户界面上的多个分辨率层中呈现生物学信息; b.可操作地连接到虚拟计算机平台的数据库, 其中数据库提供生物学信息,其中所述多个分辨率层中的至少一个采用与所述多个分辨率层中的至少另一个不 同的生物学信息的可视表现。
【文档编号】G06F19/26GK103907117SQ201280053850
【公开日】2014年7月2日 申请日期:2012年8月30日 优先权日:2011年9月1日
【发明者】O·阿米拉夫-德罗里, N·本摩西 申请人:基因组编译器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1