一种基于云平台的大数据分析方法

文档序号:9631710阅读:338来源:国知局
一种基于云平台的大数据分析方法
【技术领域】
[0001]本发明涉及数据分析领域,尤其涉及一种基于云平台的大数据分析方法。
【背景技术】
[0002]随着人类社会的不断发展,生命科技相关各行业越来越受到人们的关注,它包括一系列的重要动植物、人类健康、微生物、海洋生物、生物能源等基因组的研究,基因科技可以造福人类,促进生物经济产业的蓬勃发展。这些主要涉及基因、蛋白质测序等工作,目前的基因、蛋白质测序等工作中,在测序、数据整理等工作完成后,需要对大量的生物数据进行分析,并将分析结果提交给用户,但现有的数据分析方法效率不高,不能看到分析流程框架,得到的分析结果单一,且便于分享。

【发明内容】

[0003]本发明实施例提出一种基于云平台的大数据分析方法,通过该方法将获取的生物数据进行分析归类,并将分析结果和分析流程框架上传至云中心服务器,分析方法效率高,分析结果清晰,易读性好,且便于用户分享。
[0004]本发明实施例提供一种基于云平台的大数据分析方法,包括:
[0005]S1、从基因测序装置中获取生物数据,将获取的生物数据存储到云中心服务器中;
[0006]S2、动态设定关键词,通过网络从所述云中心服务器中采集与设定的关键词相匹配的生物数据;
[0007]S3、对采集的生物数据进行分类,并存储到相应的数据库中;
[0008]S4、将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表;
[0009]S5、调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云中心服务器。
[0010]进一步的,当用户输入关键词时,首先检索输入的关键词是否存在于所述数据索引表中;若存在,则从所述云中心服务器中直接调用与所述输入的关键词相关联的所述分析结果和所述分析流程框架,并显示所述分析结果和所述分析流程框架;若不存在,则重复步骤S2-S5。
[0011]又进一步的,所述分析结果的显示类型为饼状图、柱状图、表格。
[0012]更进一步的,所述分析结果和所述分析流程框架还通过所述云中心服务器导出或定时发送到用户的手机或邮箱中。
[0013]本发明实施例提供的基于云平台的大数据分析方法,通过将获取的生物数据存储到云中心服务器中,从云中心服务器中采集与设定的关键词相匹配的生物数据,对其进行分类后存储到相应的数据库中,然后对其依次进行信息分析、领域分析、关系挖掘分析,并依据分析结果建立数据索引表,显示分析结果和分析流程框架,并将分析结果和分析流程框架上传至云中心服务器。所述的数据分析方法能够有效地对生物数据进行分析归类,分析方法效率高;在给出分析结果的同时给出相关的分析流程框架,使分析结果清晰,易读性好;最终将分析结果和分析流程框架上传到云中心服务器,便于用户在其科研团队内分享,提高协作分析的效率。
【附图说明】
[0014]图1是本发明提供的基于云平台的大数据分析方法的实施例的流程示意图。
【具体实施方式】
[0015]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0016]参见图1,是本发明提供的基于云平台的大数据分析方法的实施例的流程示意图。
[0017]本发明实施例提供一种基于云平台的大数据分析方法,包括:
[0018]S101、从基因测序装置中获取生物数据,将获取的生物数据存储到云中心服务器中;
[0019]有一个或多个生物数据获取设备且每个生物数据获取设备可负责从一个或多个基因测序装置中获取生物数据。
[0020]在具体实施当中,可以直接从基因测序装置中获取生物数据,也可以通过常规的计算机显示器和键盘输入试验样品的数据结果,即获取了生物数据。
[0021]S102、动态设定关键词,通过网络从所述云中心服务器中采集与设定的关键词相匹配的生物数据;
[0022]根据初始设定的关键字,从获取的生物数据中采集与设定的关键词相匹配的生物数据,从大量的原始生物数据中提取出有用的数据,抛弃无用的数据,减少后续分析操作所需处理的数据量,提高数据处理的效率。
[0023]S103、对采集的生物数据进行分类,并存储到相应的数据库中;
[0024]采集相匹配的数据后,对相匹配的数据根据生物数据的分类方法进行分类,并按类别将分类后的生物数据存储到相应的数据库中。
[0025]需要说明的是,数据库需提供某种形式的冗余以在故障的情况下确保数据整体性和系统可靠性。且数据库应确保快速的存储速率,因为当大量数据被传输到数据库中时,数据库需要应对大量的数据存储,数据库的存储速率应大于数据被采集的速率,故数据库应运用高速缓存存储器和闪存系统。
[0026]S104、将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表;
[0027]针对不同类别数据库中的生物数据,分别进行有针对性的信息分析、领域分析、关系挖掘分析,得到对应的分析结果和分析流程框架,并针对相应的分析过程建立数据索引表,以便于用户对分析结果和分析流程框架进行查找,提高查找的效率。
[0028]S105、调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云中心服务器。
[0029]优选的,所述分析结果的显示类型为饼状图、柱状图、表格。
[0030]需要说明的是,本实施例仅以所述分析结果的显示类型是饼状图、柱状图、表格为例进行说明,所述分析结果的显示类型还可以是文字、数字、符号或其他形式。
[0031]优选的,所述分析结果和所述分析流程框架还通过所述云中心服务器导出或定时发送到用户的手机或邮箱中。
[0032]分析过程结束后,需要将分析结果和分析流程框架提交给用户,可以通过在显示器上显示的方式或打印的方式将分析结果和分析流程框架显示出来,并将分析结果和分析流程框架上传至云中心服务器。
[0033]本方法还提供了数据、项目共享的功能,可以通过开通权限的方式,访问云中心服务器用户科研团队的的其他成员获得分析结果和分析流程框架,并控制共享的程度(可读、可写、可执行等),这样更有利于科研团队的协作分析。
[0034]进一步的,当用户输入关键词时,首先检索输入的关键词是否存在于所述数据索引表中;
[0035]若存在,则从所述云中心服务器中直接调用与所述输入的关键词相关联的所述分析结果和所述分析流程框架,并显示所述分析结果和所述分析流程框架;
[0036]若不存在,则重复步骤S102-S105。
[0037]当用户输入关键词对分析结果进行检索,首先在分析过程完成后得到的数据索引表中查找输入的关键字,如果输入的关键字存在于现有的数据索引表中,则从云中心服务器中直接调用与所述关键词相关联的分析结果和分析流程框架,并将相关联的分析结果和分析流程框架显示给用户,还可通过云中心服务器导出或定时发送到用户的手机或邮箱中;如果在现有的数据索引表中找不到输入的关键词,则会重新执行数据分析方法步骤S102-S105,对与输入的关键词相关联的生物数据执行分析过程。
[0038]本发明实施例提供的基于云平台的大数据分析方法,通过将获取的生物数据存储到云中心服务器中,从云中心服务器中采集与设定的关键词相匹配的生物数据,对其进行分类后存储到相应的数据库中,然后对其依次进行信息分析、领域分析、关系挖掘分析,并依据分析结果建立数据索引表,显示分析结果和分析流程框架,并将分析结果和分析流程框架上传至云中心服务器。所述的数据分析方法能够有效地对生物数据进行分析归类,分析方法效率高;在给出分析结果的同时给出相关的分析流程框架,使分析结果清晰,易读性好;最终将分析结果和分析流程框架上传到云中心服务器,便于用户在其科研团队内分享,提高协作分析的效率。
[0039]以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
【主权项】
1.一种基于云平台的大数据分析方法,其特征在于: 51、从基因测序装置中获取生物数据,将获取的生物数据存储到云中心服务器中; 52、动态设定关键词,通过网络从所述云中心服务器中采集与设定的关键词相匹配的生物数据; 53、对采集的生物数据进行分类,并存储到相应的数据库中; 54、将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表; 55、调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云中心服务器。2.如权利要求1所述的基于云平台的大数据分析方法,其特征在于,当用户输入关键词时,首先检索输入的关键词是否存在于所述数据索引表中; 若存在,则从所述云中心服务器中直接调用与所述输入的关键词相关联的所述分析结果和所述分析流程框架,并显示所述分析结果和所述分析流程框架; 若不存在,则重复步骤S2-S5。3.如权利要求1所述的基于云平台的大数据分析方法,其特征在于,所述分析结果的显示类型为饼状图、柱状图、表格。4.如权利要求1所述的基于云平台的大数据分析方法,其特征在于,所述分析结果和所述分析流程框架还通过所述云中心服务器导出或定时发送到用户的手机或邮箱中。
【专利摘要】本发明公开了一种基于云平台的大数据分析方法,包括:S1、从基因测序装置中获取生物数据,将获取的生物数据存储到云中心服务器中;S2、动态设定关键词,通过网络从所述云中心服务器中采集与设定的关键词相匹配的生物数据;S3、对采集的生物数据进行分类,并存储到相应的数据库中;S4、将所述数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据所述分析结果建立数据索引表;S5、调用得到的所述分析结果和所述分析流程框架,显示所述分析结果和所述分析流程框架,并将所述分析结果和所述分析流程框架上传至所述云中心服务器。采用本发明实施例,分析方法效率高,分析结果清晰,易读性好,且便于用户分享。
【IPC分类】G06F19/18, G06F19/24
【公开号】CN105389482
【申请号】CN201510627232
【发明人】李国庆, 陈刚, 芦长欣
【申请人】深圳华大基因科技服务有限公司
【公开日】2016年3月9日
【申请日】2015年9月28日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1