一种基于大数据的聚类方法、装置及电子设备与流程

文档序号:29621482发布日期:2022-04-13 13:26阅读:125来源:国知局
一种基于大数据的聚类方法、装置及电子设备与流程

1.本发明属于数据处理技术领域,具体是指一种基于大数据的聚类方法、装置及电子设备。


背景技术:

2.将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。
3.大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
4.现有基于大数据的聚类装置通常无法进行按需散热,散热效果不好,处理效率低,处理准确性低。


技术实现要素:

5.针对上述情况,为克服现有技术的缺陷,本发明提供了一种不需要一个预设定的聚类数量,它还将异常值识别为噪点,还能很好地找到任意大小和任意形状的聚类,处理准确性高,使得不同设备均受到良好散热,图形处理器处于散热最好位置,提高了聚类处理的效率的基于大数据的聚类方法、装置及电子设备。
6.本发明采取的技术方案如下:本发明一种基于大数据的聚类装置及电子设备,包括主箱体、第一辅箱、第二辅箱、散热装置、第一pcb板、第二pcb板以及第三pcb板,所述第一辅箱设于主箱体一侧,所述第二辅箱设于主箱体远离第一辅箱一侧,所述散热装置设于主箱体内,所述第一pcb板设于第一辅箱内,所述第二pcb板设于主箱体内,所述第三pcb板设于第二辅箱内。
7.进一步地,所述第一pcb板上设有中央处理器以及随机存取存储器。
8.进一步地,所述第二pcb板上设有图形处理器。
9.进一步地,所述第三pcb板上设有数据硬盘。
10.在本方案中,第一pcb板、第二pcb板以及第三pcb板实际为一整个主板,第一pcb板、第二pcb板以及第三pcb板为主板上的三个部分。
11.进一步地,所述散热装置包括外降温风扇、外循环管、内循环管、内外分隔板、扰流螺旋、内循环风扇以及循环水泵,所述外降温风扇设于主箱体远离第二pcb板一侧,所述内外分隔板设于主箱体内,所述外循环管设于内外分隔板靠近外降温风扇一侧,所述内循环管设于内外分隔板与第二pcb板之间,所述扰流螺旋设于外循环管内,所述循环水泵一端与
外循环管相连通,所述循环水泵另一端与内循环管相连通,所述内循环风扇设于内循环管与内外分隔板之间。
12.本发明一种基于大数据的聚类方法,具体步骤:
13.s1:获取待聚类的多个数据点以及预设聚类数量;
14.s2:随机选取一个从未访问过的数据点;
15.s3:对数据点依照设定距离ε进行相邻数据点的计数,若该数据点距离小于ε的相邻数据点数量大于等于设定值则将该点以及距离小于ε的相邻数据点设为新聚类的点,若该数据点距离小于ε的相邻数据点数量小于设定值则将该点标记为噪点,并重复步骤s2操作;
16.s4:在新聚类中选取未选取过且距上次选取点距离最近的点重复步骤s3;
17.s5:当没有未访问过的数据点后聚类结束。
18.采用上述结构本发明取得的有益效果如下:本方案一种基于大数据的聚类方法、装置及电子设备,本方案的设计不需要一个预设定的聚类数量,它还将异常值识别为噪点,它还能很好地找到任意大小和任意形状的聚类,处理准确性高,因为主箱体、第一辅箱以及第二辅箱的设置,使得不同设备均受到良好散热,图形处理器处于散热最好位置,提高了聚类处理的效率。
附图说明
19.图1为本发明一种基于大数据的聚类装置及电子设备的整体结构示意图;
20.图2为本发明一种基于大数据的聚类装置及电子设备的结构示意图;
21.图3为本发明一种基于大数据的聚类装置及电子设备的内部结构示意图;。
22.其中,1、主箱体,2、第一辅箱,3、第二辅箱,4、散热装置,5、第一pcb板,6、第二pcb板,7、第三pcb板,8、中央处理器,9、随机存取存储器,10、图形处理器,11、数据硬盘,12、外降温风扇,13、外循环管,14、内循环管,15、内外分隔板,16、扰流螺旋,17、内循环风扇,18、循环水泵。
23.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.如图1-3所示,本发明一种基于大数据的聚类方法、装置及电子设备,包括主箱体1、第一辅箱2、第二辅箱3、散热装置4、第一pcb板5、第二pcb板6以及第三pcb板7,所述第一辅箱2设于主箱体1一侧,所述第二辅箱3设于主箱体1远离第一辅箱2一侧,所述散热装置4设于主箱体1内,所述第一pcb板5设于第一辅箱2内,所述第二pcb板6设于主箱体1内,所述第三pcb板7设于第二辅箱3内。
26.其中,所述第一pcb板5上设有中央处理器8以及随机存取存储器9。所述第二pcb板
6上设有图形处理器10。所述第三pcb板7上设有数据硬盘11。所述散热装置4包括外降温风扇12、外循环管13、内循环管14、内外分隔板15、扰流螺旋16、内循环风扇17以及循环水泵18,所述外降温风扇12设于主箱体1远离第二pcb板6一侧,所述内外分隔板15设于主箱体1内,所述外循环管13设于内外分隔板15靠近外降温风扇12一侧,所述内循环管14设于内外分隔板15与第二pcb板6之间,所述扰流螺旋16设于外循环管13内,所述循环水泵18一端与外循环管13相连通,所述循环水泵18另一端与内循环管14相连通,所述内循环风扇17设于内循环管14与内外分隔板15之间。
27.具体使用时,本设备与一般pc操作方法一致,其聚类运算由图形处理器10进行处理。
28.获取待聚类的多个数据点以及预设聚类数量;随机选取一个从未访问过的数据点;对数据点依照设定距离ε进行相邻数据点的计数,若该数据点距离小于ε的相邻数据点数量大于等于设定值则将该点以及距离小于ε的相邻数据点设为新聚类的点,若该数据点距离小于ε的相邻数据点数量小于设定值则将该点标记为噪点,并重复步骤s2操作;在新聚类中选取未选取过且距上次选取点距离最近的点重复步骤s3;当没有未访问过的数据点后聚类结束。
29.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
30.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
31.以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1