数据群集管理装置及方法_2

文档序号:8282333阅读:来源:国知局
>[0048] 在说明本发明的实施例时,在认为对有关本发明的公知技术的具体说明有可能对 本发明的主旨造成不必要的混乱的情况下,省略其详细说明。另外,后述的术语为考虑到在 本发明中的功能而定义的术语,其可能因使用者、运用者的意图或惯例等而不同。因此要将 贯穿整个说明书的内容作为基础而对其进行定义。在详细的说明中使用的术语仅仅是用于 阐述本发明的实施例,决不能理解为限定性。除非明确地使用为不同,单数形态的表现包含 复数形态的含义。在本说明中,"包括"或"具有"之类的表述用于表示某种特性、数字、步 骤、操作、要素及这些的一部分或者组合,并不能解释为排除除此之外还存在一个或一个以 上的其他特性、数字、步骤、操作、要素及这些的一部分或组合的必然性或可能性。
[0049] 图1为表示根据本发明的实施例的数据群集管理装置的模块图,图2为表示根据 本发明的实施例的数据群集管理装置中数据群集的格式的图。
[0050] 在详细说明本发明的实施例之前应予说明,在本发明的实施例中使用的数据群集 表示通过比较数据的多种属性而将具有类似特性的项目进行群组化。以下,将数据群集称 为群集。
[0051] 如图1所示,数据群集管理装置100可包括群集存储空间110、诊断单元120、群集 选定单元130、群集更新单元140、以及编辑单元150等。
[0052] 群集存储空间110存储有具有如图2所示的群集格式的多个群集。在此,群集格式 可以由群集ID(cluster ID)、代表值(value)、元数据(metadata)以及临界值(threshold) 构成。在预定的实施例中,按群集ID分别设定多个代表值、元数据以及临界值。而且,元数 据可包括统计资料、在相关群集生成时参考的选定的群集(与相关群集最相近的群集)的 群集ID、群集的生成日期、修改日期、删除标记、计数、比率等。
[0053] 临界值用于比较从外界输入的诊断对象(以下称为"输入数据")与群集之间的相 似度。并且,删除标记为用于表示群集的删除状态的标识符。具体而言,在删除标记取值为 " 1"的情况下可表示相关群集被删除的状态。
[0054] 诊断单元120可接收具有代表值和元数据的输入数据,并通过存储于群集存储空 间110的群集与输入数据之间的比较而执行诊断。而且,诊断单元120可将输入数据提供 给群集选定单元130。
[0055] 另外,在本发明的实施例中输入数据可以是从数据中心和大厦产生的实时数据。
[0056] 群集选定单元130可利用输入数据和存储于群集存储空间110的群集而计算各个 群集与输入数据之间的相似度。在预定的实施例中,群集选定单元130可通过计算输入数 据的代表值与存储于群集存储空间110的各个群集的代表值之间的距离而计算对应于各 个群集的相似度。
[0057] 在此,距离可通过欧几里得距离(Euclidean distance)、曼哈顿距离(Manhattan distance)等而计算,然而并不局限于此。
[0058] 另外,当输入数据的代表值和选定的群集的代表值以二维方式构成时,距离值可 通过如下的数学式1而计算。
[0059] [数学式1]
[0060]
【主权项】
1. 一种数据群集管理装置,包括: 群集选定单元,计算各个数据群集与输入数据之间的相似度,并基于所述相似度而选 定所述数据群集中的一个数据群集; 群集更新单元,基于被选定的所述数据群集和所述输入数据而判断所述输入数据是否 包含于被选定的所述数据群集,并根据所述判断而利用所述输入数据生成新的数据群集或 者更新被选定的所述数据群集。
2. 如权利要求1所述的数据群集管理装置,其中,所述相似度表示所述输入数据的代 表值与各个所述数据群集的代表值之间的距离。
3. 如权利要求1所述的数据群集管理装置,其中,各个所述数据群集分别与临界值相 关联,所述群集选定单元从所述数据群集中抽取所述相似度小于所述临界值的数据群集, 并从抽取的所述数据群集中选定具有值最小的相似度的数据群集。
4. 如权利要求1所述的数据群集管理装置,其中,所述群集更新单元基于所述输入数 据的代表值和被选定的所述数据群集的代表值而执行所述判断。
5. 如权利要求1所述的数据群集管理装置,其中,所述群集更新单元利用所述输入数 据的代表值和所述输入数据的元数据而生成所述新的数据群集或者更新被选定的所述数 据群集。
6. 如权利要求5所述的数据群集管理装置,其中,所述群集更新单元在所述判断的结 果为所述输入数据不包含于被选定的所述数据群集的情况下,生成新的数据群集,并基于 与被选定的所述数据群集相关联的临界值而设定所述新的数据群集的临界值。
7. 如权利要求6所述的数据群集管理装置,其中,所述新的数据群集的临界值被设定 为小于与被选定的所述数据群集相关联的临界值。
8. 如权利要求1所述的数据群集管理装置,其中,还包括: 群集存储空间,存储所述数据群集; 编辑单元,接收用于执行针对存储于所述群集存储空间的群集的修改、删除或恢复或 者用于生成附加性的数据群集的用户输入。
9. 如权利要求8所述的数据群集管理装置,其中,所述编辑单元将与存储的所述数据 群集相关联的临界值作为基准而显示存储的所述数据群集。
10. 如权利要求8所述的数据群集管理装置,其中,存储的所述数据群集分别与表示删 除状态的标识符相关联,且所述编辑单元根据所述用户输入而变更为了删除或恢复而选择 的数据群集的所述标识符。
11. 一种数据群集管理方法,包括如下步骤: 计算各个数据群集与输入数据之间的相似度,并基于所述相似度而选定所述数据群集 中的一个数据群集; 基于被选定的所述数据群集和所述输入数据而判断所述输入数据是否包含于被选定 的所述数据群集,并根据所述判断而利用所述输入数据执行生成新的数据群集或者更新被 选定的所述数据群集的操作。
12. 如权利要求11所述的数据群集管理方法,其中,所述相似度表示所述输入数据的 代表值与各个所述数据群集的代表值之间的距离。
13. 如权利要求11所述的数据群集管理方法,其中,各个所述数据群集分别与临界值 相关联,且选定所述数据群集的步骤中包括如下步骤: 从所述数据群集中抽取所述相似度小于临界值的数据群集; 从抽取的所述数据群集中选定具有值最小的相似度的数据群集。
14. 如权利要求11所述的数据群集管理方法,其中,所述判断基于所述输入数据的代 表值和被选定的所述数据群集的代表值而执行。
15. 如权利要求11所述的数据群集管理方法,其中,执行所述操作的步骤中包括如下 步骤: 利用所述输入数据的代表值和所述输入数据的元数据而生成所述新的数据群集或者 更新被选定的所述数据群集。
16. 如权利要求11所述的数据群集管理方法,其中,执行所述操作的步骤中包括如下 步骤: 在所述判断的结果为所述输入数据不包含于被选定的所述数据群集的情况下,生成新 的数据群集; 基于与被选定的所述数据群集相关联的临界值而设定所述新的数据群集的临界值。
17. 如权利要求16所述的数据群集管理方法,其中,进行所述设定的步骤中包括如下 步骤: 所述新的数据群集的临界值被设定为小于被选定的所述数据群集的临界值。
18. 如权利要求11所述的数据群集管理方法,其中,还包括如下步骤: 接收用于执行针对所述数据群集的修改、删除或恢复或者用于生成附加性的数据群集 的用户输入。
19. 如权利要求18所述的数据群集管理方法,其中,还包括如下步骤: 将所述数据群集的临界值作为基准而显示所述数据群集。
20. 如权利要求18所述的数据群集管理方法,其中,所述数据群集分别与表示删除状 态的标识符相关联,且所述数据群集管理方法还包括如下步骤: 根据所述用户输入而变更为了删除或恢复而选择的数据群集的所述标识符进行变更。
【专利摘要】本发明公开一种数据群集管理装置及方法。根据本发明的一个实施例的数据群集管理装置可包括:群集选定单元,计算各个数据群集与输入数据之间的相似度,并基于所述相似度而选定所述数据群集中的一个数据群集;群集更新单元,基于被选定的所述数据群集和所述输入数据而判断所述输入数据是否包含于被选定的所述数据群集,并根据所述判断而利用所述输入数据生成新的数据群集或者更新被选定的所述数据群集。
【IPC分类】G06F17-30
【公开号】CN104598512
【申请号】CN201410602455
【发明人】权纯焕, 金炯赞, 吴圭三, 徐范准
【申请人】三星Sds株式会社
【公开日】2015年5月6日
【申请日】2014年10月31日
【公告号】US20150120734
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1