数据群集管理装置及方法

文档序号:8282333阅读:249来源:国知局
数据群集管理装置及方法
【技术领域】
[0001] 本发明涉及一种可根据情况而适应性地更新数据群集的数据群集管理装置及方 法。
【背景技术】
[0002] 近来,随着数据的容量以几何级数方式增加,将这样的数据群集化(clustering) 而进行管理的方式受到瞩目。在此,群集(cluster)是指通过比较数据的多种属性而将具 有类似特性的项目进行分组化。利用这样的群集概念而正在开发利用大容量的数据的诊断 系统。
[0003] 在这样的利用大容量数据的系统中,输入数据的微小变化(minor change)持续发 生。例如对于数据中心而言,软件补丁(software patch)、设备移动、季节变化等微小变化 持续地发生。
[0004] 由于这样的微小变化,基于群集的诊断系统需要对群集进行移动、删除、生成或者 概率性调整之类的群集重建。然而基于微小变化而重建群集的方法需要大量的成本和时 间。并且,现有技术中的基于群集的诊断系统是利用固定的群集而执行对数据的诊断,因此 存在每当出现系统的变化时需要重新生成群集的缺点。进而,利用固定群集的诊断系统存 在诊断的准确率降低的缺点。
[0005] [现有技术文献]
[0006] [专利文献]
[0007] 韩国授权专利第 10-1182126 号(2012. 09. 06)

【发明内容】

[0008] 本发明的实施例的目的在于提供一种可通过输入数据与群集之间的相似度而更 新群集或者生成新的群集的数据群集管理装置及方法。
[0009] 而且,本发明的实施例的目的在于提供一种可基于输入数据的代表值和群集的代 表值而计算相似度并能够基于临界值而选定要更新的群集的数据群集管理装置及方法。 [0010] 本发明的实施例的目的在于提供一种可通过用户输入而修改、删除、恢复或生成 群集的数据群集管理装置及方法。
[0011] 根据本发明的示例性实施例,提供一种数据群集管理装置,包括:群集选定单元, 计算各个数据群集与输入数据之间的相似度,并基于所述相似度而选定所述数据群集中的 一个数据群集;群集更新单元,基于被选定的所述数据群集和所述输入数据而判断所述输 入数据是否包含于被选定的所述数据群集,并根据所述判断而利用所述输入数据生成新的 数据群集或者更新被选定的所述数据群集。
[0012] 在所述数据群集管理装置中,所述相似度可表示所述输入数据的代表值与各个所 述数据群集的代表值之间的距离。
[0013] 在所述数据群集管理装置中,各个所述数据群集可分别与临界值相关联,所述群 集选定单元可从所述数据群集中抽取所述相似度小于所述临界值的数据群集,并从抽取的 所述数据群集中选定具有值最小的相似度的数据群集。
[0014] 在所述数据群集管理装置中,所述群集更新单元可基于所述输入数据的代表值和 被选定的所述数据群集的代表值而执行所述判断。
[0015] 在所述数据群集管理装置中,所述群集更新单元可利用所述输入数据的代表值和 所述输入数据的元数据而生成所述新的数据群集或者更新被选定的所述数据群集。
[0016] 在所述数据群集管理装置中,所述群集更新单元可在所述判断的结果为所述输入 数据不包含于被选定的所述数据群集的情况下,生成新的数据群集,并可基于与被选定的 所述数据群集相关联的临界值而设定所述新的数据群集的临界值。
[0017] 在所述数据群集管理装置中,可将所述新的数据群集的临界值设定为小于与被选 定的所述数据群集相关联的临界值。
[0018] 所述数据群集管理装置还可以包括:群集存储空间,存储所述数据群集;编辑单 元,接收用于执行针对存储于所述群集存储空间的群集的修改、删除或恢复或者用于生成 附加性的数据群集的用户输入。
[0019] 在所述数据群集管理装置中,所述编辑单元可将与存储的所述数据群集相关联的 临界值作为基准而显示存储的所述数据群集。
[0020] 在所述数据群集管理装置中,存储的所述数据群集可分别与表示删除状态的标识 符相关联,且所述编辑单元可根据所述用户输入而变更为了删除或恢复而选择的数据群集 的所述标识符。
[0021] 根据本发明的另一示例性实施例,提供一种数据群集管理方法,包括如下步骤:计 算各个数据群集与输入数据之间的相似度,并基于所述相似度而选定所述数据群集中的一 个数据群集;基于被选定的所述数据群集和所述输入数据而判断所述输入数据是否包含于 被选定的所述数据群集,并根据所述判断而利用所述输入数据执行生成新的数据群集或者 更新被选定的所述数据群集的操作。
[0022] 在所述数据群集管理方法中,所述相似度可表示所述输入数据的代表值与各个所 述数据群集的代表值之间的距离。
[0023] 在所述数据群集管理方法中,各个所述数据群集可分别与临界值相关联,且选定 所述数据群集的步骤中可包括如下步骤:从所述数据群集中抽取所述相似度小于临界值的 数据群集;从抽取的所述数据群集中选定具有值最小的相似度的数据群集。
[0024] 在所述数据群集管理方法中,所述判断可基于所述输入数据的代表值和被选定的 所述数据群集的代表值而执行。
[0025] 在所述数据群集管理方法中,执行所述操作的步骤中可包括如下步骤:利用所述 输入数据的代表值和所述输入数据的元数据而生成所述新的数据群集或者更新被选定的 所述数据群集。
[0026] 在所述数据群集管理方法中,执行所述操作的步骤中可包括如下步骤:在所述判 断的结果为所述输入数据不包含于被选定的所述数据群集的情况下生成新的数据群集;基 于与被选定的所述数据群集相关联的临界值而设定所述新的数据群集的临界值。
[0027] 在所述数据群集管理方法中,进行所述设定的步骤中可包括如下步骤:将所述新 的数据群集的临界值设定为小于被选定的所述数据群集的临界值。
[0028] 在所述数据群集管理方法中,还可以包括如下步骤:接收用于执行针对所述数据 群集的修改、删除或恢复或者用于生成附加性的数据群集的用户输入。
[0029] 在所述数据群集管理方法中,还可以包括如下步骤:将所述数据群集的临界值作 为基准而显示所述数据群集。
[0030] 在所述数据群集管理方法中,所述数据群集可分别与表示删除状态的标识符相关 联,且所述数据群集管理方法还可以包括如下步骤:根据所述用户输入而变更为了删除或 恢复而选择的数据群集的所述标识符。
[0031] 根据本发明的实施例,可提供一种基于输入数据与群集之间的相似度而更新群集 或者生成新的群集,从而能够反映多种多样的变化的数据群集管理装置及方法。
[0032] 并且,根据本发明的实施例,提供一种基于相似度和临界值而判断新的诊断对象 (输入数据)是否出于软件补丁、设备的位置移动、四季变化等微小变化,并反映判断结果 而更新群集或者生成新的群集的数据群集管理装置及方法。因此,通过运行应用了这种数 据群集管理装置及方法的诊断系统而可以实现微小变化得到适应性反映的系统。
[0033] 根据本发明的实施例,基于输入数据而自动生成并更新群集,从而可在群集管理 方面节约成本。
【附图说明】
[0034] 图1为表示根据本发明的实施例的数据群集管理装置的模块图。
[0035] 图2为表示根据本发明的实施例的数据群集管理装置中数据群集的格式的图。
[0036] 图3为用于说明根据本发明的实施例的被选定群集的更新过程的图。
[0037] 图4为用于说明根据本发明的实施例的新的群集生成过程以及临界值设定过程 的图。
[0038] 图5为表示根据本发明的实施例的群集管理方法的流程图。
[0039] 图6为表示借助于根据本发明的实施例的数据群集管理装置的编辑单元的群集 修改方法的流程图。
[0040] 图7为表示借助于根据本发明的实施例的数据群集管理装置的编辑单元的群集 删除方法的流程图。
[0041] 图8为表示借助于根据本发明的实施例的数据群集管理装置的编辑单元的群集 恢复方法的流程图。
[0042] 图9为表示借助于根据本发明的实施例的数据群集管理装置的编辑单元的群集 生成方法的流程图。
[0043] 符号说明:
[0044] 100:数据群集管理装置 110:群集存储空间
[0045] 120 :诊断单元 130 :群集选定单元
[0046] 140 :群集更新单元 150 :编辑单元
【具体实施方式】
[0047] 以下,参照【附图说明】本发明的【具体实施方式】。以下的详细说明是为了有助于全面 性理解本说明书中记载的方法、装置和/或系统而提供。然而这只不过是示例,本发明并不 局限于此。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1