挑选任务网络的方法、基于感测决定动作的系统及方法与流程

文档序号:30171662发布日期:2022-05-26 10:39阅读:63来源:国知局
挑选任务网络的方法、基于感测决定动作的系统及方法与流程

1.本发明涉及一种神经网络技术,且特别涉及一种基于共同演化机制训练并挑选任务网络的方法,以及基于感测数据决定动作的系统及方法。


背景技术:

2.地球上的演化是一个开放性的过程,而属于不同种群的个体之间时常出现共同演化(coevolution)的情形。以“长颈鹿”和“树木”这两个种群为例,为了不被长颈鹿吃光身上的树叶及接收到更多的阳光,树木中具有更高树冠的子代会在演化的过程中倾向被保留下来。相对地,为了吃到更高树冠处的树叶,长颈鹿中具有更长颈部的子代也会在演化的过程中倾向被保留下来。
3.然而,在目前的第五代通信系统(下称5g)中,虽有类似于上述“长颈鹿”与“树木”概念的角色,但这些角色之间并未有上述共同演化的概念,因此并无法藉由共同演化的过程来让上述角色产生更佳的表现。
4.举例而言,5g中的“闭环控制”(例如开放无线接入网(open radio access network,o-ran)中的近即时网络智能控制(near-rt ran intelligent controller))及“开环控制”(例如o-ran中的非即时网络智能控制(non-rt ran intelligent controller))彼此虽有一定程度的相关性,但此二者的相关参数/配置值彼此之间并未有共同演化的特性,故无法藉由共同演化的过程来让“闭环控制”与“开环控制”产生更佳的表现(例如更低的运作费用(operational expenditure,opex)及更佳的运作网络功能(operational network functions,opnf))。
5.另外,5g中的“用户行为”与“网络拓朴”之间亦具有类似的情形。例如,一般用户行为可包括流量、带宽、延迟、功耗、覆盖、连接等参数/配置值,而用户多半希望这些参数/配置值能够朝向流量大、带宽高、延迟低、功耗小、覆盖大、连接稳的方向发展。另外,网络拓朴则可包括节点数、用电量、链路数、发热量等参数/配置值,而对于运营商而言,多半倾向采用具有节点数少、用电量低、链路数少、发热量低的网络拓朴。然而,虽然“用户行为”与“网络拓朴”彼此虽有一定程度的相关性,但此二者的相关参数/配置值彼此之间并未有共同演化的特性,故无法藉由共同演化的过程来让“用户行为”与“网络拓朴”朝更佳的方向发展。


技术实现要素:

6.有鉴于此,本发明实施例提供一种基于共同演化机制训练并挑选任务网络的方法及基于感测数据决定动作的系统及方法,其可用于解决上述技术问题。
7.本发明实施例提供一种基于共同演化机制训练并挑选任务网络的方法,包括:取得属于一第一种群的多个第一个体以及属于一第二种群的多个第二个体,其中前述第一个体及前述第二个体经由一共同演化过程演化而得;取得多个模式生成网络产生的多个任务网络;基于一多目标函数以前述第一个体及前述第二个体训练各任务网络,并评估训练后的各任务网络的一准确度,其中多目标函数包括各任务网络的多个特性;基于各任务网络
的准确度决定对应的模式生成网络的一适应度分数,且各模式生成网络的适应度分数正相关于对应模式生成网络的任务网络的准确度;基于各模式生成网络的适应度分数从前述模式生成网络中找出一特定模式生成网络,并在前述任务网络中挑选对应于特定模式生成网络的一特定任务网络。
8.本发明实施例提供一种基于感测数据决定动作的方法,包括:取得一感测数据,并将感测数据映射为一输入特征向量,其中感测数据包括属于一第一特定个体的多个感测属性,第一个体属于一第一种群;将输入特征向量馈入一特定任务网络,以由特定任务网络产生一输出特征向量,其中特定任务网络基于多个第一个体及多个第二个体训练,前述第一个体属于第一种群,前述第二个体属于一第二种群,且前述第一个体及前述第二个体经由一共同演化过程演化而得;依据输出特征向量决定一输出动作,并基于输出动作设定一第二特定个体,其中第二特定个体属于第二种群。
9.本发明实施例提供一种基于感测数据决定动作的系统,包括感测电路、通信电路、存储电路及处理器。存储电路记录多个模块。处理器耦接存储电路,存取前述模块以执行下列步骤:从感测电路取得一感测数据,并将感测数据映射为一输入特征向量,其中感测数据包括属于一第一特定个体的多个感测属性,第一个体属于一第一种群;将输入特征向量馈入一特定任务网络,以由特定任务网络产生一输出特征向量,其中特定任务网络是基于多个第一个体及多个第二个体所训练,前述第一个体属于第一种群,前述第二个体属于一第二种群,且前述第一个体及前述第二个体经由一共同演化过程演化而得;依据输出特征向量决定一输出动作,并控制通信电路将输出动作发送至属于第二种群的一第二特定个体,其中输出动作用于设定第二特定个体。
附图说明
10.图1是依据本发明的一实施例绘示的服务器示意图。
11.图2是依据本发明的一实施例绘示的基于共同演化机制训练并挑选任务网络的方法流程图。
12.图3是依据本发明的一实施例绘示的取得第一个体及第二个体的流程图。
13.图4是依据本发明的一实施例绘示的具不同形态的演化图谱。
14.图5是依据本发明的一实施例绘示的在第一演化图谱中进行繁衍的示意图。
15.图6是依据本发明的一实施例绘示的训练任务网络的示意图。
16.图7是依据本发明的一实施例绘示的基于感测数据决定动作的系统示意图。
17.图8是依据本发明的一实施例绘示的基于感测数据决定动作的方法流程图。
18.图9是依据本发明的一实施例绘示的基于感测数据决定动作的示意图。
19.图10是依据本发明的一实施例绘示的演化符号计算示意图。
20.【符号说明】
21.100:服务器
22.102,703:存储电路
23.104,704:处理器
24.410,420,430,440:演化图谱
25.500:第一演化图谱
26.511,512:节点
27.510a:枢纽
28.601:neat网络
29.602:cppn
30.603:任务网络
31.611,911:输入特征向量
32.700:系统
33.701:感测电路
34.702:通信电路
35.912:特定任务网络
36.913:输出特征向量
37.914:分类器
38.a1~an:预设动作
39.s1~s6:阶段
40.s210~s250,s311~s321,s810~s830:步骤
41.sp1~sp4:空间
具体实施方式
42.请参照图1,其是依据本发明的一实施例绘示的服务器示意图。在图1中,服务器100可包括存储电路102及处理器104。存储电路102例如是任意型式的固定式或可移动式随机存取存储器(random access memory,ram)、只读存储器(read-only memory,rom)、快闪存储器(flash memory)、硬盘或其他类似装置或这些装置的组合,而可用以记录多个程序代码或模块。
43.处理器104耦接于存储电路102,并可为一般用途处理器、特殊用途处理器、传统的处理器、数字信号处理器、多个微处理器(microprocessor)、一个或多个结合数字信号处理器核心的微处理器、控制器、微控制器、特殊应用集成电路(application specific integrated circuit,asic)、现场可编程门阵列电路(field programmable gate array,fpga)、任何其他种类的集成电路、状态机、基于进阶精简指令集机器(advanced risc machine,arm)的处理器以及类似品。
44.在本发明的实施例中,处理器104可存取存储电路102中记录的模块、程序代码来实现本发明提出的基于共同演化机制训练并挑选任务网络的方法,其细节详述如下。
45.请参照图2,其是依据本发明的一实施例绘示的基于共同演化机制训练并挑选任务网络的方法流程图。本实施例的方法可由图1的服务器100执行,以下即搭配图1所示的元件说明图2各步骤的细节。
46.首先,在步骤s210中,处理器104可取得属于第一种群的多个第一个体以及属于第二种群的多个第二个体。
47.在本发明的第一实施例中,所述第一种群及第二种群分别例如是5g中的“闭环控制”及“开环控制”。在此情况下,属于第一种群的上述第一个体分别可以是控制功能(control functions)或经训练模型(trained model),且各第一个体可具有不同的第一基
因。
48.以属于控制功能的第一个体为例,其第一基因例如包括服务质量管理(qos management)、连接性管理(connectivity management)、无缝换手控制(seamless handover control)等,但不限于此。
49.在上述服务质量管理中,可包括例如吞吐量(throughput)、端对端延迟(end-to-end latency)、网络可用性(network availability)、可靠度参数(reliability parameters)等参数/配置值,但不限于此。在上述连接性管理中,可包括上/下行数据率、上/下行区域流量容量(area traffic capacity)、整体用户密度(overall user density)等参数/配置值,但不限于此。在上述无缝换手控制中,可包括换手速度上限(maximum speed for handover)等参数/配置值,但不限于此。
50.另外,以属于经训练模型的第一个体为例,其所包括的基因例如是人工智能/机器学习模型,但不限于此。
51.在第一实施例中,第一个体的各第一基因例如可以特定数据结构的形式(例如阵列)存储于数据库中。举例而言,对于属于控制功能的第一个体而言,其对应的数据结构可包括对应于服务质量管理、连接性管理及无缝换手控制等基因的多个字段,而这些字段例如可用于记录上述各种参数/配置值,但可不限于此。
52.此外,属于第二种群的第二个体分别可以是策略(policy)、意图(intent)或ran分析(analytic),且各第二个体可具有不同的第二基因。
53.以属于策略的第二个体为例,其第二基因例如包括次策略(sub-policy)。以属于意图的第二个体为例,其第二基因例如包括动作(actions)及参数改变(parameter changes)。以属于ran分析的第二个体为例,其第二基因例如包括分析(analytics)及学习任务(learning tasks)。
54.在第一实施例中,第二个体的各第二基因例如可以特定数据结构的形式存储于数据库中。举例而言,对于属于策略的第二个体而言,其对应的数据结构可包括对应于次策略等基因的多个字段,而这些字段例如可用于记录有关于次策略的各种参数/配置值,但可不限于此。
55.对于本领域技术人员而言,第一实施例中第一个体的第一基因及第二个体的第二基因的相关说明可参照5g的相关规格书,在此不另赘述。
56.在第二实施例中,所述第一种群及第二种群分别例如是5g中的“用户行为”及“网络拓朴”。在此情况下,属于第一种群的第一个体分别可包括多种与用户行为相关的第一基因,而属于第二种群的第二个体分别可包括多种与网络拓朴相关的第二基因。
57.举例而言,属于第一种群的第一个体可包括用户体验、用户习惯、用户类型、用户密度及用户情境等参数/配置值,但可不限于此。另外,属于第二种群的第二个体可包括无线电单元(radio unit,ru)、分布式单元(distributed unit,du)和集中单元(central unit,cu)、移动边缘计算(mobile edge computing,mec)服务器等参数/配置值,但可不限于此。
58.在第二实施例中,第一个体的各第一基因及第二个体的各第二基因例如可以特定数据结构的形式存储于数据库中,而相关说明可参照先前于第一实施例中提及的相关说明,在此不另赘述。
59.在一实施例中,属于第一种群的上述第一个体以及属于第二种群的上述第二个体可经由一共同演化过程演化而得,以下将辅以图3作进一步说明。请参照图3,其是依据本发明的一实施例绘示的取得第一个体及第二个体的流程图。
60.首先,在步骤s311中,处理器104可随机产生属于第一种群的多个第一初始个体,以及随机产生属于第二种群的多个第二初始个体,其中各第一初始个体亦如同上述第一个体而具有第一基因,且各第二初始个体亦如同上述第二个体而具有第二基因。在此情况下,在上述第一初始个体及第二初始个体中的各个第一/第二基因的参数/配置值例如是一随机值,但可不限于此。
61.之后,在步骤s312中,处理器104可基于新颖性搜寻(novelty search)算法在上述第一初始个体中找出多个第一参考个体,其中各第一参考个体的第一基因可满足第一最小准则(minimal criterion,mc)。在一实施例中,处理器104可基于k近邻算法(k nearest neighbors,knn)而在上述第一初始个体中找出所述第一参考个体。在此情况下,所找出的各个第一参考个体彼此之间都将具备一定程度的差异性,而新颖性搜寻及knn的相关细节可参照相关的现有技术文献,在此不另赘述。
62.另外,如上所述,各个第一参考个体还将满足对应的第一mc。以第一实施例为例,属于第一种群的第一参考个体(例如是控制功能或经训练模型)所需满足的第一mc例如是需能够用于进行对应的闭环控制(例如各基因具有合理的参数/配置值),但可不限于此。
63.再以第二实施例为例,属于第一种群的第一参考个体(例如是用户行为)所需满足的第一mc例如是具有合理的用户体验(例如要求反应时间短)、用户习惯(例如习惯白天使用)、用户类型(例如年轻人)、用户密度(例如高密度)及用户情境(例如增强现实(augmented reality,ar))等参数/配置值,但可不限于此。
64.基于相似的概念,在步骤s313中,处理器104还可基于新颖性搜寻算法在第二初始个体中找出多个第二参考个体。亦即,处理器104可基于knn而在上述第二初始个体中找出所述第二参考个体,藉以让所找出的各个第二参考个体彼此之间具备一定程度的差异性。
65.并且,各第二参考个体的第二基因可满足第二mc。以第一实施例为例,属于第二种群的第二参考个体(例如是策略、意图或ran分析)所需满足的第二mc例如是需能够用于进行对应的开环控制(例如各基因具有合理的参数/配置值),但可不限于此。
66.再以第二实施例为例,属于第二种群的第二参考个体(例如是网络拓朴)所需满足的第二mc例如是具有合理的ru(例如大量的ru)、du(例如低耗能)、cu(例如高计算量)及mec服务器(例如大量的mec服务器)等参数/配置值,但可不限于此。
67.在基于以上教示取得属于第一种群的多个第一参考个体及属于第二种群的多个第二参考个体之后,所述多个第一参考个体及第二参考个体即可用于进行本发明实施例提出的共同演化过程,以下将作进一步说明。
68.接着,在步骤s314中,处理器104可基于各第一参考个体的所述多个第一基因决定各第一参考个体的第一适应度,以及在步骤s315中基于各第二参考个体的所述多个第二基因决定各第二参考个体的第二适应度。
69.一般而言,共同演化过程可大致分为合作式共同演化(例如“兰花”与“蛾类”)及竞争式共同演化(例如“长颈鹿”与“树木”)。在本发明第一实施例中,由于第一种群及第二种群的共同目标皆为提高opnf及降低opex,因此可视为是合作式共同演化。
70.在此情况下,对于可提高opnf及降低opex的第一参考个体及第二参考个体而言,其对应的第一/第二适应度可越高。
71.另一方面,在本发明第二实施例中,由于第一种群的目标(例如流量大、带宽高、延迟低、功耗小、覆盖大、连接稳)大致冲突于及第二种群的目标(例如节点数较少、用电量较低、链路数较少、发热量较低),因此可视为是一种竞争式共同演化。
72.在此情况下,对于流量大、带宽高、延迟低、功耗小、覆盖大、连接稳的第一参考个体而言,其对应的第一适应度可越高。相对地,对于节点数较少、用电量较低、链路数较少、发热量较低的第二参考个体而言,其对应的第二适应度可越高。
73.在决定各第一参考个体的第一适应度之后,在步骤s316中,处理器104可将上述第一参考个体分配于一第一演化图谱(evolutionary graph)中。在不同的实施例中,设计者可依需求而选定合适的演化图谱作为上述第一演化图谱。
74.请参照图4,其是依据本发明的一实施例绘示的具不同形态的演化图谱。在图4中,共示出4种不同的演化图谱410~440,而在各个演化图谱410~440中,每个节点(绘示为圆圈)代表属于同一种群的个体,且各节点可通过边线(edge)而与相邻的节点连接。在图4中,各个边线可经指派有对应的边权重(edge weight),而具有越高边权重的边线可绘示为越粗的态样。并且,各演化图谱410~440可包括枢纽(hub)(例如各演化图谱410~440中以虚线框起的区域)及分支(branch)。与演化图谱410~440有关的细节可参照“pavlogiannis,a.,tkadlec,j.,chatterjee,k.et al.construction of arbitrarily strong amplifiers of natural selection using evolutionary graph theory.commun biol 1,71(2018)”,在此不另赘述。在不同的实施例中,各演化图谱410~440可依设计者的需求而以各种可能的形式存在,例如某些特定的数据结构、样板等,但可不限于此。
75.在一实施例中,在选定所需的第一演化图谱之后,处理器104可将先前所取得的所述多个第一参考个体作为第一演化图谱中的第一节点而分配至第一演化图谱中。举例而言,假设第一演化图谱中的每个分支都对应于一个特定的应用领域(应用领域例如为智能制造、自驾车、物联网、智能医疗、智能交通等,应用领域可存于参数/配置值中,或是设计者自行定义),则处理器104可将与特定应用领域有关的第一参考个体分配至第一演化图谱中对应的分支中,并将与特定应用领域无关的第一参考个体分配至第一演化图谱的枢纽中。在其他实施例中,设计者也可依设计上的需求而调整将上述第一参考个体分配在第一演化图谱中的方式,但可不限于此。在另一实施例中,处理器104依照上述第一参考个体的参数/配置值将其分配在第一演化图谱中。
76.相似地,在决定各第二参考个体的第二适应度之后,处理器104可在步骤s317中将上述第二参考个体分配于第二演化图谱中。在不同的实施例中,设计者也可依需求而选定合适的演化图谱作为上述第二演化图谱。并且,处理器104将上述第二参考个体分配于第二演化图谱的方式可参照将第一参考个体分配在第一演化图谱中的相关说明,在此不另赘述。
77.之后,在步骤s318中,处理器104可在第一演化图谱中繁衍多个第一子代个体。并且,处理器104可执行步骤s319中以在第二演化图谱中繁衍多个第二子代个体。在本发明的实施例中,上述第一子代个体属于多个第一世代,上述第二子代个体属于多个第二世代,且各第一子代个体与各第二子代个体经历共同演化过程繁衍而得。
78.以第一演化图谱为例,其可理解为包括多个第一节点,而各个第一节点可视为对应于当下属于第一种群的一个个体(例如是某个第一参考个体或其子代,并可具有对应的第一适应度)。详细而言,第一种群中的个体将随着演化的过程而出现新的子代,而年纪较大的个体也会在演化的过程中被淘汰。在此情况下,第一演化图谱中的各个第一节点假设为对应于尚未被淘汰的个体。
79.在一实施例中,在基于第一演化图谱进行繁衍时,处理器104可经配置以执行:(a)在属于第一种群的上述个体中选择第一候选个体(例如是某个第一参考个体或其后代之一),并在上述第一节点中找出对应于此第一候选个体的第一特定节点;(b)繁衍此第一候选个体以产生至少一第二候选个体(即,第一候选个体的子代),并基于此第一特定节点的各边线的边权重而以对应于上述第二候选个体的至少一第二特定节点取代相邻于第一特定节点的至少一相邻节点;(c)响应于判定累计演化时间(例如是处理器104从取得第一参考个体起算的累计时间)已到达一时间门限值(其可由设计者依需求而定),以第一种群当下包括的个体作为上述第一子代个体,反之则返回步骤(a)。
80.请参照图5,其是依据本发明的一实施例绘示的在第一演化图谱中进行繁衍的示意图。在图5中,假设所考虑的第一演化图谱500具有所示态样(其包括数个分支及一个枢纽510a),而其中的每个节点(绘示为圆圈)皆为第一种群所包括的一个个体。在本实施例中,第一种群中的各个体被选作为第一候选个体的机率可正相关于各个体的第一适应度。
81.如图5所示,在演化阶段s1中,假设某第一候选个体被选定,而其对应于节点511(即,第一特定节点),且节点511下方边线的边权重较大。在此情况下,对应于第二候选个体(即,第一候选个体的子代)的节点512(即,第二特定节点)较容易取代原本位于节点511下方的节点(即,节点511朝下方蔓延)。同样地,节点512也可基于相似方式朝下方的节点进一步蔓延,从而形成阶段s2的状况。
82.在阶段s3中,当节点511的子代蔓延至枢纽510中时,可随着后续的繁衍而逐渐取代枢纽510a中的每个节点,如阶段s4所示。之后,枢纽510a可再往其他的分支持续蔓延(如阶段s5所示),直至节点511的子代完全取代整个第一演化图谱500。
83.在本发明的实施例中,处理器104在第一演化图谱500中以第二特定节点取代相邻节点的细节可参照“pavlogiannis,a.,tkadlec,j.,chatterjee,k.et al.construction of arbitrarily strong amplifiers of natural selection using evolutionary graph theory.commun biol 1,71(2018)”中关于强放大器(strong amplifier)的说明,其细节于此不另赘述。
84.相似地,在基于第二演化图谱(其可包括对应于当下属于第二种群的一个个体)时,处理器104也可执行与步骤(a)~(c)相似的操作。举例而言,处理器104可经配置以执行:(d)在属于第二种群的上述个体中选择第三候选个体(例如是某个第二参考个体或其后代之一),并在上述第二节点中找出对应于此第三候选个体的第三特定节点;(e)繁衍此第三候选个体以产生至少一第四候选个体(即,第三候选个体的子代),并基于此第三特定节点的各边线的边权重而以对应于上述第四候选个体的至少一第四特定节点取代相邻于第三特定节点的至少一相邻节点;(f)响应于判定累计演化时间(例如是处理器104从取得第二参考个体起算的累计时间)已到达一时间门限值(其可由设计者依需求而定),以第二种群当下包括的个体作为上述第二子代个体,反之则返回步骤(d)。
of arbitrarily strong amplifiers of natural selection using evolutionary graph theory.commun biol 1,71(2018)”中关于强放大器的说明,其细节于此不另赘述。
94.在依上述教示繁衍而得到第一种群的多个第一子代个体之后,处理器104可执行步骤s320以将所述多个第一子代个体定义为所述多个第一个体。亦即,在第一种群已持续繁衍达到对应的时间门限值时,处理器104可将当下属于第一种群的个体视为步骤s210中提及的第一个体。相似地,在依上述教示繁衍而得到第二种群的多个第二子代个体之后,处理器104可执行步骤s321以将所述多个第二子代个体定义为所述多个第二个体。亦即,在第二种群已持续繁衍达到对应的时间门限值时,处理器104可将当下属于第二种群的个体视为步骤s210中提及的第二个体。
95.请再次参照图2,在依上述教示取得步骤s210中的第一个体及第二个体之后,处理器104可执行步骤s220以取得多个模式生成网络产生的多个任务网络。
96.在一些实施例中,由于上述第一个体及第二个体需在之后的操作中作为训练数据来使用,故在执行步骤s220之前,处理器104还可额外进行一些预处理,以将第一/第二个体中不适合作为训练数据的一部分滤除,以改进之后的训练效果,但可不限于此。
97.在一实施例中,上述各模式生成网络例如是复合模式生成网络(compositional pattern-producing network,cppn),而处理器104可使用一扩增拓扑神经(neuroevolution of augmenting topologies,neat)网络产生上述模式生成网络。在一些实施例中,上述neat可基于hyperneat算法演化而得到上述模式生成网络。另外,由neat演化而得的多个模式生成网络可分别用于产生一任务网络(task network),而neat经演化而得到上述模式生成网络的细节,以及模式生成网络分别产生任务网络的细节可参照hyperneat的相关文献,在此不另赘述。
98.之后,在步骤s230中,处理器104可基于一多目标函数以前述第一个体及前述第二个体训练各任务网络,并评估训练后的各任务网络的准确度。
99.在一实施例中,所述多个第一个体及所述第二个体可由相关人员基于最佳实务(best practice)做人工对应(标注),或者使用算法做自动对应(标注)。上述最佳实务可以来自意图(intent)、历史经验或者理论推导,但可不限于此。
100.举例而言,对于“用户行为”(即,第一种群)中某个用户行为a(即,第一个体)而言,处理器104可在“网络拓朴”(即,第二种群)中找出某个设计者认为应相应于用户行为a所采用的网络拓朴b作为对应的第二个体,并加以标注,但可不限于此。在一些实施例中,所述多个第一个体与所述多个第二个体之间可以是一对一(例如,一个用户行为对应于一个网络拓朴)或多对一(例如,多个用户行为对应于同一个网络拓朴)的对应关系,但可不限于此。
101.之后,处理器104即可基于彼此对应的第一个体及第二个体训练各个cppn所产生的任务网络。
102.请参照图6,其是依据本发明的一实施例绘示的训练任务网络的示意图。如图6所示,对于neat网络601所演化的其中一个cppn 602而言,其可产生任务网络603。
103.在本实施例中,任务网络603可为一双层网络,各层可包括多个神经元,而一层的神经元仅会与另一层的神经元建立连线,不会与同层的神经元建立连线。对于不同cppn所产生的任务网络而言,主要的差别在于所述双层网络的连线方式不同,而神经元连线的权重将在任务网络的训练过程中而被更新。
104.在图6中,任务网络603可基于(xi,yi)和(xj,yj)等共4个输入值定义任二神经元的位置,而cppn输出的则是任务网络中任意两神经元间连线的权重值。权重值若为0相当于(xi,yi)未连接于(xj,yj)。
105.在训练任务网络603时,对于彼此对应的某个第一个体c及第二个体d而言,处理器104可将第一个体c转换为对应的输入特征向量611并输入至任务网络603,以对任务网络603进行训练。在一实施例中,在任务网络603接收输入特征向量611之后,可相应地产生一输出向量,而处理器104可藉由调整任务网络603内神经元的权重来让上述输出向量趋近于对应于第二个体d的特征向量,但可不限于此。对于本领域技术人员而言,如何基于彼此对应的第一个体及第二个体对任务网络603进行训练可参照相关的现有技术文献,在此不另赘述。
106.应了解的是,在不同的实施例中,处理器104在训练任务网络603时所采用的多目标函数可包括各任务网络603的多个特性。
107.以第一实施例而言,处理器104所采用的多目标函数例如是f(x)=m(f1(x),f2(x))=norm(f1(x))+(1-norm(f2(x)))),其中f1(x)对应于目标的opnf,f2(x)可对应于目标的opex。另外,norm(x)运算子可用于把x进行正规化,并将其限制于0与1之间。
108.由第一实施例的多目标函数可看出,处理器104训练任务网络603的方向朝向较高的opnf及较低的opex,但可不限于此。
109.再以第二实施例而言,处理器104所采用的多目标函数例如是f(x)=m(f1(x),f2(x),...,fm(x))=(1-norm(f1(x)))+(1-norm(f2(x)))+(1-norm(f3(x)))+(1-norm(f4(x))),其中f1(x)可对应于节点数、f2(x)可对应于用电量、f3(x)可对应于链路数、f4(x)可对应于发热量。由第二实施例的多目标函数可看出,处理器104训练任务网络603的方向是朝向较少的节点数、较小的用电量、较少的链路数及较小的发热量,但可不限于此。
110.对于每个cppn所产生的任务网络而言,处理器104皆可依据以上教示对各个任务网络进行训练。并且,在完成每个任务网络的训练之后,处理器104可评估各个任务网络的准确度(accuracy)。在一实施例中,任务网络的准确度例如可理解为其与多目标函数中所期望的目标的贴近程度。亦即,任务网络越贴近于多目标函数中设定的目标,其准确度即越高。在不同的实施例中,上述准确度例如是训练准确度(training accuracy)或是测试准确度(testing accuracy),但可不限于此。
111.在评估各任务网络的准确度之后,在步骤s240中,处理器104可基于各任务网络的准确度决定对应的模式生成网络的适应度分数。再以图6为例,在评估任务网络603的准确度之后,处理器104可相应地决定cppn 602的适应度分数。在一实施例中,cppn 602的适应度分数可正相关于对应cppn602的任务网络603的准确度。亦即,任务网络603的准确度越高,cppn 602的适应度分数越高,反之亦反。在另一实施例中,依需求将准确度转换为适应度分数,例如将评估任务网络603的准确度加总转换为cppn 602的适应度分数,或者将准确度赋予权重、赋予相关系数或添加预设的数值后相加,视设计需求而定,可不限于此。
112.之后,在步骤s250中,处理器104可基于各模式生成网络的适应度分数从前述模式生成网络中找出特定模式生成网络,并在前述任务网络中挑选对应于特定模式生成网络的特定任务网络。在一实施例中,处理器104可在上述模式生成网络中找出具有最高适应度分数的一个作为所述特定模式生成网络。举例而言,假设cppn 602在neat网络601所演化出的
模式生成网络中具有最高适应度分数,则处理器104可相应地将挑选任务网络603作为上述特定任务网络,但可不限于此。
113.之后,处理器104可仅保留所找到的特定模式生成网络及其所产生的任务网络,并汰除其余的cppn及任务网络。为便于说明,以下将分别以cppn602及任务网络603作为所述特定模式生成网络及所述特定任务网络的例子,但本发明可不限于此。
114.之后,在不同的实施例中,所述特定任务网络即可用于基于所取得的第一种群的感测数据(例如第一实施例中的闭环控制的参数/配置值及第二实施例中的用户行为的参数/配置值)而相应地推理应如何设定第二种群的实例(instance)的动作。
115.请参照图7,其是依据本发明的一实施例绘示的基于感测数据决定动作的系统示意图。在图7中,系统700可包括感测电路701、通信电路702、存储电路703及处理器704。在一实施例中,感测电路701可用于取得第一实施例中闭环控制的某个实例的相关参数值/配置值,或是第二实施例中用户行为的某个实例的相关参数值/配置值。另外,通信电路702例如是各式无线收发器,并可依处理器704的控制而将信号/命令发送至指定的装置。
116.存储电路703及处理器704的各种可能的实施方式可参照存储电路102及处理器104的说明,在此不另赘述。
117.请参照图8,其是依据本发明的一实施例绘示的基于感测数据决定动作的方法流程图。本实施例的方法可由图7所示的处理器704执行,但可不限于此。此外,为便于理解图8的内容,以下另辅以图9作进一步说明,其中图9是依据本发明的一实施例绘示的基于感测数据决定动作的示意图。
118.首先,在步骤s810中,处理器704可取得感测数据,并将感测数据映射为输入特征向量911,其中所述感测数据可包括属于第一特定个体的多个感测属性,且第一特定个体可属于第一种群(例如第一实施例中的“闭环控制”或第二实施例中的“用户行为”)。
119.举例而言,在第一实施例中,所述感测数据可以是某个闭环控制实例的控制功能或经训练模型的相关参数/配置值。另外,在第二实施例中,所述感测数据例如是某个用户行为实例的相关参数/配置值(例如某个特定的用户体验、用户习惯、用户类型、用户密度及用户情境)。
120.在不同的实施例中,上述感测数据也可以由连接于系统700的其他装置所提供,但可不限于此。在取得感测数据之后,处理器104可将感测数据映射为可用于输入至特定任务网络912(例如任务网络603)的输入特征向量911,而相关的映射细节可参照相关的现有技术文献,在此不另赘述。
121.之后,在步骤s820中,处理器704可将输入特征向量911馈入特定任务网络912(例如,任务网络603,其可由处理器104提供给系统700),以由特定任务网络912产生输出特征向量913。
122.在第一实施例中,输出特征向量913例如是对应于某个开环控制的相关参数/配置值的组合的特征向量。另外,在第二实施例中,输出特征向量913例如是对应于某个网络拓朴的相关参数/配置值的组合的特征向量(例如是图形卷积网络(graph convolutional network,gcn)特征)。
123.之后,在步骤s830中,处理器704可依据输出特征向量913决定输出动作,并基于输出动作设定第二特定个体,其中所述第二特定个体可属于第二种群(例如第一实施例中的“开环控制”或第二实施例中的“网络拓朴”)。
124.在一实施例中,处理器704可直接以完全对应于输出特征向量913的输出动作来设定上述第二特定个体。例如,在第一实施例中,处理器704可在产生对应于某个开环控制的参数/配置值组合的输出特征向量913之后,以所述开环控制的参数/配置值组合执行对应的开环控制。举另一例而言,在第二实施例中,处理器704可在产生对应于某个网络拓朴的参数/配置值组合的输出特征向量913之后,以所述网络拓朴的参数/配置值组合对网络拓朴进行设定或基于转换后的特征向量架构网络拓朴。
125.然而,上述以完全对应于输出特征向量913的输出动作来设定上述第二特定个体在某种程度上可谓缺少一定的弹性,因此本发明实施例另提出使用分类器914以基于输出特征向量913决定输出动作的手段,以期提高执行上的弹性。
126.在一实施例中,处理器704可将输出特征向量913输入至分类器914,以由分类器914在多个预设动作a1~an中找出对应于输出特征向量913的特定动作。之后,处理器704可再将所找出的特定动作定义为上述输出动作。
127.在一些实施例中,分类器914(例如是支持向量机(support vector machine,svm)),而其可经由一定的训练过程训练而得。举例而言,对于由特定任务网络912所产生的各式输出特征向量而言,设计者可预先决定(即,标注)各个输出特征向量应对应于预设动作a1~an中的哪个,而各个预设动作a1~an除了可包括完全对应于某个输出特征向量的动作之外,还可额外加入设计者所欲执行的其他动作。
128.藉此,在完成分类器914的训练之后,当分类器914接收到输出特征向量913时,便可相应地在预设动作a1~an中找出对应于输出特征向量913的特定动作,而此特定动作除了可包括完全对应于输出特征向量913的动作之外,还可包括其他额外的动作。藉此,可增加执行上的弹性。
129.例如,在第一实施例中,处理器704可在产生对应于某个开环控制的参数/配置值组合的输出特征向量913之后,由分类器914在预设动作a1~an中找出对应于输出特征向量913的特定动作。在第一实施例中,所述特定动作除了包括以所述开环控制的参数/配置值组合执行对应的开环控制的相关动作之外,还可包括其他设计者认为可一并执行的动作,但可不限于此。
130.举另一例而言,在第二实施例中,处理器704可在产生对应于某个网络拓朴的参数/配置值组合的输出特征向量913之后,由分类器914在预设动作a1~an中找出对应于输出特征向量913的特定动作。在第二实施例中,所述特定动作除了包括以所述网络拓朴的参数/配置值组合对网络拓朴进行设定的相关动作之外,还可包括其他设计者认为可一并执行的动作,但可不限于此。
131.在一实施例中,在决定输出动作之后,处理器704可控制通信电路702将此输出动作发送至属于第二种群的第二特定个体,以相应地设定第二特定个体。例如,在第二实施例中,所述第二特定个体例如是一个网络拓扑实例,而其可依据上述输出动作调整成gcn转换后的特征所形成的向量所描述的网络。相应地,新的5g网络拓扑将再度影响用户行为。
132.请参照图10,其是依据本发明的一实施例绘示的演化符号计算(evolutionary symbolic computation)示意图。在一实施例中,本发明实施例所进行的操作可概略地理解为利用符号函数f以基于属于空间sp1的情况(例如输入特征向量911)而决定属于空间sp4
中的动作(例如上述输出动作)。然而,本质上而言,本发明实施例所进行的操作实质上依序将属于空间sp1的情况转换为空间sp2中的第一向量,将此第一向量转换为属于空间sp3的第二向量,再将此第二向量转换为属于空间sp4的动作。在一实施例中,图10所示的函数f可理解为对应于上述实施例提及的特定任务网络,而对于属于空间sp2的第一向量而言,函数f可将其转换为属于空间sp3的第二向量,但可不限于此。
133.从另一观点而言,现有技术中多半通过规则引擎(rule engine)来做规划或推理,而在本技术中是基于大数据进行训练以完成规划(planning)或推理(reasoning),不需要人为设定规则(rule)。
134.综上所述,本发明实施例的基于共同演化机制训练并挑选任务网络的方法大致可理解为包括两个阶段:(1)藉由开放式共同演化的过程来产生属于第一种群的多个第一个体以及属于第二种群的多个第二个体;(2)藉由上述第一/第二个体训练各个模式生成网络的任务网络,并进而找出具最高适应度分数的特定模式生成网络及其所产生的特定任务网络。
135.在第一个阶段中,本发明实施例引入了演化图谱及强放大器的概念,藉以让种群中具有较高适应度的个体的子代较有机会蔓延至整个演化图谱而达到定型(fixation)的效果。藉此,可让经繁衍而得的第一/第二个体具有较有利的基因,进而提升第二个阶段中各任务网络的训练效果。
136.另外,在第二个阶段中,由于各个模式生成网络的适应度分数依据对应的任务网络的准确度而定,而所挑选到的特定模式生成网络例如是具最高适应度分数的一个,进而可让其对应的任务网络作为后续基于感测数据决定动作的特定任务网络。
137.藉此,在取得对应于第一种群的感测数据时,所述特定任务网络及分类器即可相应地决定适合的输出动作,进而在第一实施例中达到提升opnf/降低opex的效果,以及在第二实施例中达到让网络拓朴的相关参数/配置值能够因应于用户行为进行调整的效果。
138.虽然本发明已以实施例公开如上,然其并非用以限定本发明,本领域技术人员在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视所附权利要求书界定范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1