一种基于基因组学以及生物信息学的在线交互云平台的制作方法

文档序号:17317227发布日期:2019-04-05 21:20阅读:228来源:国知局
一种基于基因组学以及生物信息学的在线交互云平台的制作方法

本发明涉及生物信息分析技术领域,特别是涉及一种基于基因组学以及生物信息学的在线交互云平台。



背景技术:

基因测序目前全球市场规模约有200亿美元,高通量测序技术已成为生命科学研究重要工具,对该技术的应用水准直接影响一个国家的生物技术发展水平。数据的检测与挖掘是组学研究的两个核心内容。随着测序技术的进步与发展,数据检测手段不断丰富的同时,其检测的准确性也大大提高。数据的大量形成与累积,带来的下一个烦恼就是数据的挖掘。目前,高通量测序技术产生的数据总量已达eb级,因此如何利用生物信息技术从海量数据中挖掘有价值的核心信息,数据展示便于实时解析和关键报告数据挖掘,已成为该领域科研人员的核心难题。

在生物信息分析平台方面,比较著名的国内外平台包括:国外的galaxy生物信息分析平台、华大基因的bgionline平台。这些平台功能强大,适合专业生物信息用户,但对没有任何生物信息基础的用户使用尚有难度。另外,虽然国内外也有一系列优秀的生物信息交流论坛,例如国外的seqanswers、biostar,以及国内的“生物信息学天空”等。但这些技术论坛主要提供技术交流讨论的平台,而没有同步提供系统在线教育以及生物信息分析功能。

总之,目前在国内外暂没有同时满足理论教育、综合实操和用户互助的生物信息学公共服务平台,因此,若能够提供一种可解决上述问题的在线交互平台,方便用户获得前沿知识技能,提高生物科学研究领域对基因组学技术的应用能力,将会有巨大的行业需求。



技术实现要素:

为克服上述现有技术存在的不足,本发明之目的在于提供一种基于基因组学以及生物信息学的在线交互云平台,以提供用户对生物信息数据的自动分析,并通过在线教育以及知识分享,方便用户获得前沿知识技能,极大提高生物科学研究领域对基因组学技术的应用能力。

为达上述及目的,本发明提出一种基于基因组学及生物信息学的在线交互云平台,包括:

云分析平台,用于获取生物信息数据,并提供对生物信息数据的自动分析,输出分析结果;

在线教育平台,用于提供用户生物信息分析相关的教育视频课程以及远程教学服务;

知识分享论坛,用于通过多个分区以提供用户对生物信息分析相关知识的分享。

优选地,所述云分析平台的自动分析功能模块包括

动态交互分析模块,用于利用统计检验寻找富集go功能,并通过图表交互形式对结果进行动态分析;

序列处理模块,用于对原始序列和目标序列来进行比对,并输出比对结果;

基础绘图模块,用于将表格数据绘制成图形;

功能分析模块,用于应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著富集的go条目;

统计检验模块,用于对两组样本进行两组样本的差异分析;

格式转换模块,用于将当前格式的数据转换成其它常用格式;

数据关系分析模块,用于根据两组样品间的差异基因绘制相应图形,以可视化展示结果;

表格处理模块,用于将多个表格合并成一个表格;

排序分析模块,用于将多个变量通过线性变换,筛选出数个比较重要的变量。

优选地,所述云分析平台还包括:

数据存储及查询模块,用于存储用户数据以及分析后的结果,并提供用户查找。

优选地,所述云分析平台还包括:

任务汇总模块,用于对同一用户的分析任务进行任务汇总统计,以供用户查询自己所有的分析任务。

优选地,所述云分析平台还包括:

注册模块,用于提供用户注册,并根据用户的登录情况给予奖励,以便用户根据奖励获得相应的权限。

优选地,所述在线教育平台不依赖其他视频网站实现在线直播教育。

优选地,所述在线教育平台定时更新其平台教学内容,以适应用户的需求。

优选地,所述知识分享论坛从行业动态、核酸提取建库、dna测序、rna测序、表观测序、编程与软件、实验技术、积分兑换方面对论坛进行分区。

优选地,所述知识分享论坛可及时对热门帖子及板块进行整理。

与现有技术相比,本发明一种基于基因组学及生物信息学的在线交互平台通过搭建了围绕生物信息技术的在线交互平台,通过整合云分析平台、在线教育和知识分享论坛三大模块,可提供用户对生物信息数据的自动分析,并通过在线教育以及知识分享,方便用户获得前沿知识技能,极大提高生物科学研究领域对基因组学技术的应用能力。

附图说明

图1为本发明一种基于基因组学及生物信息学的在线交互云平台的架构示意图;

图2为本发明具体实施例中云分析平台的结构示意图;

图3为本发明具体实施例中云分析平台的硬件开发层级示意图;

图4为本发明具体实施例中在线教育平台的搭建过程图;

图5为本发明具体实施例中知识分享论坛的搭建过程图;

图6为本发明具体实施例之在线交互平台以用户为中心的运营架构图。

具体实施方式

以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。

图1为本发明一种基于基因组学及生物信息学的在线交互云平台的架构示意图。如图1所示,本发明一种基于基因组学及生物信息学的在线交互云平台1,包括:

云分析平台10,用于获取生物信息数据,并提供对生物信息数据的自动分析,输出分析结果。在本发明具体实施例中,如图2所示,云分析平台10包括对生物信息的自动分析功能具体包括:

动态交互分析模块101,用于利用统计检验寻找富集go(geneontology,基因本体)功能,并通过图表交互形式对结果进行动态分析,动态交互分析模块101可包括动态go富集分析,较佳地,其还可以包括动态pcoa(principalcoordinatesanalysis,主坐标分析)分析;

序列处理模块102,用于对原始序列和目标序列来进行比对,并输出比对结果,序列处理模块102可包括blast序列局部比对、muscle多序列比对、截取序列、dna/rna转换器、cds转蛋白、序列格式化、序列长度统计以及序列长度过滤等;

基础绘图模块103,用于将表格数据绘制成图形,例如盒形图,再本发明具体实施例中,基础绘图模块103制成的图形可包括盒形图、散点图、折线图、柱状图、气泡图、频率直方图、面积图、热图、维恩图、小提琴图、分组小提琴图、高级散点图、线性回归图、3d散点图、饼图中的一种或几种;

功能分析模块104,用于应用超几何检验,找出与整个基因组背景相比,在差异表达基因中显著富集的go条目,例如go富集分析,具体地,功能分析模块104还可以包括kegg富集分析、go富集分析、高级气泡图、cog/kog图go分类柱状图;

统计检验模块105,用于对两组样本进行两组样本的差异分析;在本发明具体实施例中,统计检验模块105可采用t检验方法,即,使用r语言进行t检验,也可采用roc检验;

格式转换模块106,用于将当前格式的数据转换成其它常用格式;例如svg转换以及sam转换、fq2fa转换;

数据关系分析模块107,用于根据两组样品间的差异基因绘制相应图形,以可视化展示结果;数据关系分析模块107可包括火山图、分层聚类分析(hca)、趋势分析图、有向网络图、ma图、edger差异分析、权重网络图、组内相关性分析、组间相关性分析、九象限图、circos物种关系图中的一种或几种;

表格处理模块108,用于将多个表格合并成一个表格;其可以为两表格合并、多表格合并、表格转置、表格筛选;

排序分析模块109,用于将多个变量通过线性变换,筛选出数个比较重要的变量,即pca(principalcomponentanalysis,主成分分析),其还可以包括三维pca、(o)pls-da、pcoa、nmds、cca/rda等。

优选地,所述云分析平台10还可以包括:

数据存储及查询模块,用于存储用户数据以及分析后的结果,并提供用户查找,也就是说,用户可以通过数据存储及查询模块查找之前任何上传的数据内容及任务结果。

优选地,所述云分析平台10还可以包括:

任务汇总模块,用于对同一用户的分析任务进行任务汇总统计,以供用户查询自己所有的分析任务,用户也可根据任务编号查询之前运行的内容及下载结果,具有个性化属性。

优选地,所述云分析平台10还可以包括:

注册模块,用于提供用户注册,并根据用户的登录情况给予奖励,以便用户根据奖励获得相应的权限。具体地说,注册模块提供用户输入用户名、手机号、邮箱及工作单位等基本信息注册,当用户完成激活后即可完成个人用户注册,用户每日签到可获取奥币,奥币可用于分析工具的使用和平台书籍的购买。同时,还提供用户可查看自己账户下的用户积分、奥币数量、数据存储空间、云分析软件使用统计情况.

优选地,所述云分析平台10还可以包括:

分享模块,用于提供用户分享功能,在本发明具体实施例中,分享模块实质上为用户自由论坛,用户可通过其分享自己的喜欢的内容,例如分享好用的软件。

优选地,所述云分析平台10还可以包括:

客服模块,用于提供客户与用户沟通,获取用户的反馈信息,例如用户可向os客服留言反馈运行任务中遇到的问题,以帮助用户及时解决问题。

优选地,所述云分析平台10还可以包括:

邀请模块,用于提供用户邀请好友功能,用于复制用户的专属链接,通过qq、微信、短信或者在其他论坛发帖等方式将在线交互平台分享给好友,以便获得更多的用户,邀请模块还可以设置有每月邀请达人榜,用奥币奖励分享达人,获得的奥币则可用于分析工具的使用和平台书籍的购买。

在本发明具体实施例中,如图3所示,所述在线交互云平台在硬件开发上包含三个层级:包括作为底层基础的硬件层,为软件运行和用户交互提供环境的平台架构层,以及为用户提供数据分析的应用软件层,其具体设计如下:

①硬件层:采用多核多线程cpu以满足云生物信息分析高效运算;采用大内存、存储空间和网络带宽,使多用户同步登录使用的情况下,保证平台流畅度的基础,配置交换机、路由器等其他配套硬件,优化与提升服务器运算与存储能力、网络带宽等;

②应用软件层:生物信息云分析软件开发和拓展、云分析软件用户交互界面优化、相关技术说明文档的编辑等。

③云分析平台架构:提供具有安全性、友好易用性和可拓展性的云分析平台。

在线教育平台20,用于提供用户生物信息分析相关教育视频课程以及远程教学服务,包括生物信息操作方面的讲解及各个组学的研究方法及用户会遇到的问题进行教育及培训等。在本发明具体实施例中,在线教育平台20不依赖其他视频网站实现在线直播教育。

由于在大数据分析中,用户经常会遇到各式各样的问题,比如r语言代码撰写、比如生物学重复不好、差异基因太少、富集结果不理想等等,除此之外,有了数据和结果,文章该如何入手等。为了帮助用户解决这些问题,在线教育平台20从软件教程、dna组学、rna组学、微生物组学、表观组学、蛋白组学、医学课程等方面提供在线教育课程。

优选地,在线教育平台20可定时更新其平台教学内容,以适应用户的需求。

图4为本发明具体实施例中在线教育平台的搭建过程图。其分为两个部分:一是直播平台建设,一方面可以利用其他视频网站例如腾讯直播课堂升级,另一方面搭建自主直播平台;二是内容制作,通过制定课程计划,根据课程计划制作课件,并培养讲师队伍,利用直播平台进行直播或录播方式,实现在线教育平台的在线教学。

知识分享论坛30,用于通过多个分区以提供用户对生物信息分析相关知识的分享。在本发明具体实施例中,知识分享论坛30从行业动态、核酸提取建库、dna测序、rna测序、表观测序、编程与软件、实验技术、积分兑换等方面论坛进行分区,用户可于论坛的各分区发表帖子。知识分享论坛30还可及时对热门帖子及板块进行整理,提高云平台在用户群体中的影响力。

图5为本发明具体实施例中知识分享论坛30的搭建过程图。如图5所示,在本发明具体实施例中,知识分享论坛30的搭建分为内测期、试运行期以及正式运转期,于内测期,包括三个过程:论坛框架搭建、素材收集分类以及对内部员工用户维护;于试运行期,包括如下三部分:论坛框架测试优化、内容(素材)积累以及外部种子用户维护;于正式运转期,包括如下三部分:论坛框架确立、内容自我迭代以及涌入的外部用户的维护。

图6为本发明具体实施例之在线交互平台以用户为中心的运营架构图。本发明以用户为中心,综合三个子模块(云分析平台、在线教育平台以及知识分享论坛)满足生物信息学教育的三大需求:实操性(云分析平台)、理论性(在线教育)和互助性(知识分享论坛),同时,通过已有的线上、线下营销渠道,可快速扩大平台影响力,本发明充分利用互联网的优势,将教育资源的价值最大化,以极小的成本实现对大量用户服务。

综上所述,本发明一种基于基因组学及生物信息学的在线交互平台通过搭建了围绕生物信息技术的在线交互平台,通过整合云分析平台、在线教育和知识分享论坛三大模块,可提供用户对生物信息数据的自动分析,并通过在线教育以及知识分享,方便用户获得前沿知识技能,极大提高生物科学研究领域对基因组学技术的应用能力。

上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1