一种查询数据的方法

文档序号:8412632阅读:219来源:国知局
一种查询数据的方法
【技术领域】
[0001] 本发明涉及大数据处理,特别涉及一种大数据文件的调度方法。
【背景技术】
[0002] 随着智慧医疗的迅速发展和海量医学数据的出现,需要相应的大型数据库作为载 体来保存这些数据,但大数据的调度成了一个大问题。由于数据量巨大,要找到自己想要的 数据,除了网络传播时的安全性需要考虑外,数据的调度延时也被医务人员关注。大型数据 库数据文件对网络带宽要求高,持续时间长,传统C/S模式的服务消耗的带宽资源过多,且 系统可扩展差;内容分发网络数据库调度CDN费用太贵而难以推广;IP组播数据调度技术 可靠性差、拥塞严重。上述传统技术均在处理医疗海量数据中展现出局限性。
[0003] 因此,针对相关技术中所存在的上述问题,目前尚未提出有效的解决方案。

【发明内容】

[0004] 为解决上述现有技术所存在的问题,本发明提出了一种查询数据的方法,包括:
[0005] 以采集的数据库数据文件调度时间序列为基础,组成可调节稳定控制集合区;定 义调度时间序列适应度值的方差和数据文件序列表达式;使用负载适应度度量值,选择数 据库文件的最优调度时间序列。
[0006] 优选地,所述方差mf为:
[0007]
【主权项】
1. 一种查询数据的方法,其特征在于,包括: 以采集的数据库数据文件调度时间序列为基础,组成可调节稳定控制集合区;定义调 度时间序列适应度值的方差和数据文件序列表达式;使用负载适应度度量值,选择数据库 文件的最优调度时间序列。
2. 根据权利要求1所述的方法,所述方差mf为:
其中,NP为大型数据库数据文件调度时间序列规模大小,f (Xi)为第i个调度时间序列 的适应度值,/(.?)为平均适应度的值。
3. 根据权利要求1所述的方法,其特征在于,所述数据文件序列表达式表示为: yn+i= y Yn(I-Yn); 其中 n= l,2,3,...y e [〇,1] μ e [〇,4]。
4. 根据权利要求2或3所述的方法,其特征在于,所述选择最优调度时间序列进一步包 括: 计算数据库服务器负载的总调度时间,即数据块大小与节点上行带宽的比值总和的最 小值; 从总调度时间中选择最优粒子作为个体最优解和群体最优解; 利用适应度值的方差和序列表达式更新粒子的速度和位置,并产生新一代群; 若相邻两次群的适应度方差小于预定阈值,则对群的最优位置向量Pg= [P gl,Pg2,… ,Pgd],将最优位置向量映射到Logistic的定义域上: k - at 其中aJP b i分别为粒子位置在Logistic定义域上的最小值和最大值; 对通过Logistic方程zi+1= Uzi(I-Zi)进行多次迭代,得到经历序列(m =1,2,...); 把上述步骤产生的Zi逆映射回原解空间,产生一个变量可解序列:<M) = (pm),…,ρ(;" 其中,=? +(bi -?) α" ; 计算经历混沌处理可行解ΑΓ (m =1,2,...)的适应值,然后保留最优解对应的解向量 P* ; 用P*的位置向量代表随机选择粒子的位置向量。
【专利摘要】本发明提供了一种查询数据的方法,包括:以采集的数据库数据文件调度时间序列为基础,组成可调节稳定控制集合区;定义调度时间序列适应度值的方差和数据文件序列表达式;使用负载适应度度量值,选择数据库文件的最优调度时间序列。本发明使得调度寻优过程考虑数据库服务器负载等因素,保持方法的多样性,防止数据库负载过大出现,提高了大型数据库数据文件调度的效率,增加了系统的吞吐量。
【IPC分类】G06F17-30
【公开号】CN104731973
【申请号】CN201510170650
【发明人】刘颖
【申请人】成都汇智远景科技有限公司
【公开日】2015年6月24日
【申请日】2015年4月13日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1