基于优化的复杂网络聚类方法与流程

文档序号:23716909发布日期:2021-01-24 05:58阅读:66来源:国知局
基于优化的复杂网络聚类方法与流程

[0001]
本发明属于云3d打印领域,具体地说,尤其涉及一种用于云3d打印平台的基于优化的复杂网络聚类方法。


背景技术:

[0002]
复杂网络是由数量巨大的节点和节点之间错综复杂的关系共同构成的,因此,复杂网络作为一个复杂拓扑结构特征的网络,岂会出现在简单网络中没有的特殊拓扑特性,这些特性仅仅在真实世界的网络结构中存在,且其基本特征和规律性是不容易辨识的。
[0003]
复杂网络一般具有以下的特性:第一,小世界。它以简单的措辞描述了大多数网络进管规模很大但是任意两个节(顶)点间却有一条相当短的路径的事实。第二、集群即集聚程度(clustering coefficient)的概念。集群程度是网络集团化的程度,这是一种网络的内聚倾向。第三,幂律(power law)的度分布概念。度是指与节点连接的边数;度的相关性是指网络边的两节点之间关系的关联程度;度分布是指从图中随机选取一个节点其度为的概率,可记为p(k)。
[0004]
具体到云3d打印平台中,在云计算任务和虚拟计算机资源数量不相等的情况下,如何实现订单分类任务的分配,在考虑到云3d打印服务成本以及确保云3d打印服务提供商能够在规定时间段内完成某项打印订单服务的情形下,如何指定订单分类任务的分配策略,就需要用到基于优化的复杂网络聚类方法。


技术实现要素:

[0005]
本发明的目的在于提供一种基于优化的复杂网络聚类方法,其能够将订单视为复杂网络节点,将订单与订单之间的关联关系视为复杂网络的边,通过优化复杂网络的聚类方法实现云3d打印平台中订单任务分类任务分配策略的优化与提高,保证云3d打印服务成本的同时又能够保证3d打印服务提供商在规定的时间段内完成某项订单任务。
[0006]
为达到上述目的,本发明是通过以下技术方案实现的:
[0007]
本发明中所述的基于优化的复杂网络聚类方法,包括以下步骤:首先需要输入待聚类的文档、复杂网络、已知must-link约束集合及cnnot-link约束集合的阈值,并进行如下步骤;
[0008]
第一步:网络初始化。
[0009]
网络初始化是将复杂网络中的数据抽象成无向图,并将无向图转化成n阶矩阵a,并随机选择簇的数目k,并赋予网络的初始值。网络的初始值即为节点和边的基本信息和属性。
[0010]
第二步:抽取特征向量权值。
[0011]
假设特征词的权重为f
t
,则计算文档各关键词的特征向量权重w
i
为w
i
=σ
×
μ
×
f
t
×
log(l+1),其中σ是特征词位置的加权系数,μ是语义分析加权系数,f
t
是文档中关键词的频率,l是关键词特征之间的长度。
[0012]
第三步:构造节点对集合。
[0013]
根据约束规则,比较must-link节点对集合、cannot-link节点对集合进行比较,并判断关键词之间是否符合服务资源同义词字典集和属性字典的扩展要求,计算得出各种先验知识,先验知识为合理性形式。
[0014]
第四步:构造概念。
[0015]
根据must-link节点对集合与cannot-link节点对集合的约束规则,构建所有的概念c,并选择重要的概念c
i
进行计算,计算如下:∪c
i
g=c
i
∪c
i
m=m,其中m是概念的集合,c
i
是第i个概念,c
i
g是第i个概念的对象,c
i
m表示概念集m所属的属性;将节点对集合进行抽取特征所有概念,并按照对象进行排列。
[0016]
第五步:概念做归一化处理。
[0017]
对所有的概念c=(c
1
,c
2
,

,c
n
)的特征进行归一化处理,并依次输入概念c的数据抽象成无向图,归一化公式计算如下:
[0018]
第六步:计算节点对间的距离度量。
[0019]
对平滑假设距离度量进行计算,具体公式如下:根据获取的先验知识,通过平滑假设距离度量计算出两节点之间的度量,形成样本数据中术语节点的距离范围,由此判断衍生的节点对是否超出范围,并根据矩阵式的数据进行修正以确定衍生的先验知识集合节点对的位置。
[0020]
第七步:计算边界值。
[0021]
若边界值为0,则标记完成后删除所有边界值为0的边,并且同时计算复杂网络中除去边界值为+∞边的剩余边边界值;所述边界值的定义式为:其中σ
st
(m)表示经过节点m的s

t的最短路径数,σ
st
表示s

t的最短路径数。
[0022]
第八步:计算模块复杂度。
[0023]
在计算网络中边的边界值和删除边时,计算网络的模块度q用以确定范围的终止范围,其计算公式如下:q=∑
i=0
(e
ij-a
ij
)
2
,其中e
ij
是k阶对称方阵e的元素,1≤i,j≤k,a
ij
则是复杂网络中社区i节点连接的边数与所有社区的边数的比值。
[0024]
第九步:重复第六步、第七步,直至所有边被删除,得出复杂网络的分类结果。
[0025]
进一步地讲,本发明中所述的第一步中n阶矩阵可通过以下方式定义:假设定义源节点s的距离为d
s
=0,权值是w
s
=1,则n阶矩阵a的表达式为矩阵a中点a
ij
的值表示两节点之间是否有连边,无连边时标记为0,有连边时标记为1。
[0026]
进一步地讲,本发明中所述的must-link节点的约束规则:表示节点对v和v
j
属于同一社区内,将符合约束的节点之间的边介值记作0;所述cannot-link节点的约束规则为:表示节点对v和v
j
不属于同一社区内,将符合约束的节点之间的边介值记作+∞。
[0027]
与现有技术相比,本发明的有益效果是:
[0028]
本发明能够将订单视为复杂网络节点,将订单与订单之间的关联关系视为复杂网络的边,通过优化复杂网络的聚类方法实现云3d打印平台中订单任务分类任务分配策略的优化与提高,保证云3d打印服务成本的同时又能够保证3d打印服务提供商在规定的时间段内完成某项订单任务。
具体实施方式
[0029]
下面结合实施例对本发明所述的技术方案作进一步地描述说明。需要说明的是,在下述段落可能涉及的方位名词,包括但不限于“上、下、左、右、前、后”等,其所依据的方位均为对应说明书附图中所展示的视觉方位,其不应当也不该被视为是对本发明保护范围或技术方案的限定,其目的仅为方便本领域的技术人员更好地理解本发明创造所述的技术方案。
[0030]
在本说明书的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0031]
复杂网络一般具有小世界、集群(即集聚程度)、幂律(power law)的度分布特性,利用上述特性可对复杂网络进行合理的优化。具体到本发明中,可将3d打印服务网络中的订单抽象成复杂网络中的节点s,将订单与订单之间的关联关系抽象成节点的连接边d,将节点与节点之间的关联关系的紧密度定义为权值w。实际中可以将上述的样本数据输入到matlab软件中,将样本中的数据抽象成无向图,并将其转化为n阶矩阵a。同时计算并提取每一篇文档中的各个关键词的特征向量权值,再根据girvan-newman(gn)聚类算法的广度优先遍历迭代计算must-link节点对集合、cannot-link节点中各节点连接边的边介值,进一步做归一化处理,并计算剩余边对应的源节点的边介值,重复此过程至所有边都被删除,给出分类的结果。
[0032]
在本发明中,首先需要对网络进行初始化,网络初始化是通过matlab软件或其余相近功能的软件将构成复杂网络的样本数据抽象成无向图,样本数据包括待聚类的文档、复杂网络、已知must-link约束集合及cannot-link约束集合的预制。在将复杂网络的样本数据抽象成无向图后生成n阶矩阵a,并随机选择簇的数目为k,以赋予网络的初始值。
[0033]
具体来讲,在本发明中,需要先假定源节点s的距离为d
s
=0,权值为w
s
=1,则n阶矩
阵a的表达式为矩阵a中点a
ij
的值表示两节点之间是否有连边,无连边时标记为0,有连边时标记为1。
[0034]
其次,假设特征词的权重为f
t
,则计算文档中各个关键词的特征向量权重值wi为:w
i
=σ
×
μ
×
f
t
×
log(l+1),其中σ是特征词位置的加权系数,μ是语义分析加权系数,f
t
是文档中关键词的频率,l是关键词特征之间的长度。
[0035]
第三,需要构造节点对集合,根据约束条件,对must-link节点对集合、cannot-link节点对结合进行比较,并判断是否符合扩展的条件,计算得出扩充先验知识。其中must-link节点对集合的规则条件为:表示节点对v和v
j
属于同一社区内,将符合约束的节点之间的边介值记作0;所述cannot-link节点对集合的约束规则为:表示节点对v和v
j
不属于同一社区内,将符合约束的节点之间的边介值记作+∞。
[0036]
第四,根据上述步骤中的节点对集合的约束规则,构件所有的概念c,并选择重要的概念c
i
进行计算,计算如下:u
i
g=c
i
∪c
i
m=m,其中m是概念的集合,c
i
是第i个概念,c
i
g是第i个概念的对象,c
i
m表示概念集m所属的属性;将节点对集合进行抽取特征所有概念,并按照对象进行排列。需要说明的是,对节点对集合进行抽取特征所有概念,并按照对象数量进行排列,假设概念则进行以下运算:
[0037]
for(i=1;i≤n;i++)
[0038]
{if(c
i
g+cg<g&&c
i
m+cm<m){cg=cg+c
i
g;cm=cm+c
i
m};i++}else if(c
i
g+cg<g‖c
i
m+cm<m){i++}else(c
i
g+cg<g&&c
i
m+cm<m){exit;}
[0039]
第五步,对所有概念c=(c
1
,c
2
,

,c
n
)做归一化处理,并依次输入概念c的数据(即3d打印服务)抽象成无向图,归一化公式计算如下:
[0040]
第六步,计算节点对间的距离度量。对平滑假设距离度量进行计算,具体公式如下:下:根据获取的先验知识,通过平滑假设距离度量计算出两节点之间的度量,形成样本数据中术语节点的距离范围,由此判断衍生的节点对是否超出范围,并根据矩阵式的数据进行修正以确定衍生的先验知识集合节点对的位置;
[0041]
第七步:计算边界值。若边界值为0,则标记完成后删除所有边界值为0的边,并且同时计算复杂网络中除去边界值为+∞边的剩余边边界值;所述边界值的定义式为:同时计算复杂网络中除去边界值为+∞边的剩余边边界值;所述边界值的定义式为:其中σ
st
(m)表示经过节点m的s

t的最短路径数,σ
st
表示s

t的
最短路径数;
[0042]
第八步:计算模块复杂度。在计算网络中边的边界值和删除边时,计算网络的模块度q用以确定范围的终止范围,其计算公式如下:q=∑
i=0
(e
ij-a
ij
)
2
,其中e
ij
是k阶对称方阵e的元素,1≤i,j≤k,a
ij
则是复杂网络中社区i节点连接的边数与所有社区的边数的比值;
[0043]
第九步:重复第六步、第七步,直至所有边被删除,得出复杂网络的分类结果。
[0044]
最后,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1