一种模型训练方法及相关装置与流程

文档序号:34226357发布日期:2023-05-24 08:55阅读:56来源:国知局
一种模型训练方法及相关装置与流程

本技术涉及神经网络领域,尤其涉及一种模型训练方法及相关装置。


背景技术:

1、3gpp在第五代移动通信(5th generation mobile communication,5g)网络中通过新增网络数据分析功能(network data analysis function,nwdaf),引入了人工智能(artificial intelligence,ai)能力。nwdaf负责ai模型的训练。nwdaf训练的ai模型可应用于移动性管理、会话管理和网络自动化等网络自身领域。

2、目前常采用联邦学习(federated learning,fl)进行ai模型的训练。fl中,各分布节点参与中心节点的每轮训练时,需将上一轮更新的本地神经网络模型发送至中心节点。然后,中心节点将各分布节点的神经网络模型进行融合,获得全局神经网络模型。若全局神经网络模型不收敛,则中心节点将全局神经网络模型广播给各分布节点。各分布节点根据全局神经网络模型更新本地神经网络模型,再采用更新后的本地神经网络模型参与下一轮中心节点的神经网络模型的训练。

3、然而,经过多轮训练后,某些分布节点的本地神经网络模型对全局神经网络模型收敛的贡献逐渐降低,此时若这些分布节点的神经网络模型仍继续参与中心节点的神经网络模型的训练,将会造成信令开销的浪费。


技术实现思路

1、本技术实施例提供了一种模型训练方法及相关装置,可减少信令开销。

2、第一方面,本技术实施例提供一种模型训练方法。该方法中,第二通信装置接收第一通信装置的第一神经网络参数,并在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时,向第一通信装置发送第一指示信息。该第一指示信息用于指示第二通信装置参与第一通信装置的第一神经网络模型的训练。

3、本技术实施例中,第一神经网络参数与第二神经网络参数之间的相关系数小于第一阈值,表明第二神经网络参数对第一神经网络模型收敛的贡献较大。从而第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小,确定是否参与第一神经网络模型的训练,可避免第二通信装置在第二神经网络参数对第一神经网络模型收敛贡献较小时,仍参与第一神经网络模型的训练,进而可减少第二通信装置的信令开销。

4、一种可选的实施方式中,第一神经网络参数是第一神经网络的模型参数或第一神经网络的梯度;第二神经网络参数是第二神经网络的模型参数或第二神经网络的梯度。

5、也就是说,第一神经网络参数是第一神经网络的模型参数,第二神经网络参数是第二神经网络的模型参数。可选的,第一神经网络参数是第一通信装置的神经网络的梯度,第二神经网络参数是第二通信装置的神经网络的梯度。从而第二通信装置根据接收的第一神经网络参数所属的类型,确定第一神经网络参数与第二神经网络参数之间的相关系数。

6、一种可选的实施方式中,第一神经网络参数是在协作发现资源上接收的,该协作发现资源是在侧行链路配置信息中配置的。也就是说,第二通信装置采用侧行链路配置信息中的协作发现资源接收来自第一通信装置的第一神经网络参数。

7、一种可选的实施方式中,在上述相关系数小于第一阈值时,第二通信装置还可向第一通信装置发送第二神经网络参数,以使得第一通信装置根据该第二神经网络参数更新第一神经网络模型,从而第一通信装置是采用对第一神经网络模型收敛贡献度较高的第二神经网络参数更新第一神经网络模型的,有利于加快第一神经网络模型的收敛。

8、一种可选的实施方式中,第二通信装置还可接收来自第一通信装置的控制信号,该控制信号用于指示时频资源,且指示的时频资源用于第二通信装置发送第二神经网络参数。可见,第二通信装置通过接收来自第一通信装置的控制信号,获知到向第一通信装置发送第二神经网络参数的时频资源,进而第二通信装置可在该时频资源上发送第二神经网络参数。

9、一种可选的实施方式中,接收该控制信号的资源是协作控制资源,协作控制资源是在上述侧行链路配置信息中配置的。也就是说,第二通信装置采用侧行链路配置信息中的协作控制资源接收上述控制信号。

10、一种可选的实施方式中,第二通信装置还可在协作同步资源上接收同步信号,并根据该同步信号,与第一通信装置进行同步。从而第二通信装置与第一通信装置同步后,可与第一通信装置通信。其中,协作同步资源可是在上述侧行链路配置信息中配置的。

11、一种可选的实施方式中,上述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源可是预先配置的,或是动态指示的,或是非授权频谱资源。

12、一种可选的实施方式中,第一神经网络参数是第一神经网络的模型参数,第二神经网络参数是第二神经网络的模型参数时,上述第一神经网络参数与第二神经网络参数之间的相关系数是根据第一参数和第二参数确定的。

13、其中,第一参数是第二通信装置对第一神经网络模型输入训练数据时,第一神经网络模型输出的参数;所述第一神经网络模型是根据所述第一神经网络的模型参数确定的;第二参数是第二通信装置对第二通信装置的第二神经网络模型输入该训练数据时,第二神经网络模型输出的参数。也就是说,第一参数和第二参数是第二通信装置分别对第一神经网络模型和第二神经网络模型输入相同的训练数据时,第一神经网络模型和第二神经网络模型分别输出的参数。

14、另一种可选的实施方式中,第一神经网络参数是第一神经网络的梯度,第二神经网络参数是第二神经网络的梯度时,第一神经网络参数与第二神经网络参数之间的相关系数是根据第一神经网络参数的概率密度分布和第二神经网络参数的概率密度分布确定的。

15、可见,第二通信装置可根据接收的第一神经网络参数所属的类型,灵活采用相应的方式确定第一神经网络参数与第二神经网络参数之间的相关系数。

16、第二方面,本技术还提供了一种模型训练方法。该方面的模型训练方法与第一方面所述的模型训练方法相对应,该方面的模型训练方法是从第一通信装置侧进行阐述的。该方法中,第一通信装置发送该第一通信装置的第一神经网络参数。第一通信装置接收来自第二通信装置的第一指示信息,第一指示信息是第二通信装置在第一神经网络参数与第二通信装置的第二神经网络参数之间的相关系数小于第一阈值时发送的,第一指示信息用于指示第二通信装置参与第一通信装置的第一神经网络模型的训练。

17、可见,本技术实施例中,第一通信装置接收的第一指示信息是第二通信装置在第一神经网络参数与第二神经网络参数的相关系数小于第一阈值时发送的,从而第二通信装置是根据第二神经网络参数对第一神经网络模型收敛的贡献大小,确定是否参与第一神经网络模型的训练,进而使得第一通信装置后续不是根据所有第二通信装置的第二神经网络参数更新第一神经网络模型,而是根据对第一神经网络模型收敛贡献较大的第二神经网络参数更新第一神经网络模型,可减少第一通信装置的信令开销。

18、一种可选的实施方式中,第一神经网络参数是第一神经网络的模型参数或所述第一神经网络的梯度;所述第二神经网络参数是第二神经网络的模型参数或所述第二神经网络的梯度。

19、第一神经网络参数是第一神经网络的模型参数,第二神经网络参数是第二神经网络的模型参数。可选的,第一神经网络参数是第一通信装置的神经网络的梯度,第二神经网络参数是第二通信装置的神经网络的梯度。

20、一种可选的实施方式中,第一神经网络参数是在协作发现资源上发送的,该协作发现资源是在侧行链路配置信息中配置的。也就是说,第一通信装置采用侧行链路配置信息中的协作发现资源向第一通信装置发送第一神经网络参数。

21、一种可选的实施方式中,第一通信装置还可接收来自第二通信装置的第二神经网络参数,并根据第二神经网络参数,更新第一神经网络模型。可见,第一通信装置是根据反馈了第一指示信息的第二通信装置的第二神经网络参数,更新第一神经网络模型的,从而可节省第一通信装置的信令开销。

22、一种可选的实施方式中,第一通信装置还可向第二通信装置发送控制信号,该控制信号用于指示时频资源,指示的时频资源用于第二通信装置发送第二神经网络参数。可见,第一通信装置通过控制信号,向第二通信装置指示了发送第二神经网络参数的时频资源,有利于第二通信装置采用该时频资源发送第二神经网络参数。

23、一种可选的实施方式中,发送控制信号的资源是协作控制资源,协作控制资源是在上述侧行链路配置信息中配置的。也就是说,第一通信装置采用侧行链路配置信息中的协作控制资源发送上述控制信号。

24、一种可选的实施方式中,第一通信装置还可在协作同步资源上发送同步信号,以使得第二通信装置根据该同步信号与第一通信装置进行同步。另外,该协作同步资源可是在上述侧行链路配置信息中配置的。

25、一种可选的实施方式中,上述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源可是预先配置的,或是动态指示的,或是非授权频谱资源。

26、第三方面,本技术还提供了一种模型训练方法。该方法中,第一通信装置发送协作请求信息,协作请求信息包括多个训练任务,多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的。第一通信装置接收来自第二通信装置的第二指示信息,第二指示信息用于指示第二通信装置参与第一训练任务的训练,第一训练任务是多个训练任务中的其中一个或多个。

27、可见,本技术实施例中,第一通信装置将待训练的神经网络模型拆分为了多个训练任务,并通过协作请求信息将多个训练任务广播给周边的各第二通信装置,以请求各第二通信装置参与多个训练任务的训练。第一通信装置通过接收第二指示信息获知第二通信装置自身可参与的训练任务。该方式中,第一通信装置获知到周边的第二通信装置协助参与待训练的神经网络模型的训练,从而可降低对第一通信装置能力的需求。

28、一种可选的实施方式中,上述协作请求信息在协作发现资源上发送的,协作发现资源是在侧行链路配置信息中配置的。可见,第一通信装置采用侧行链路配置信息中的协作发现资源发送协作请求信息。

29、一种可选的实施方式中,第二通信装置发送的第二指示信息指示的第一训练任务包括多个训练任务,此时第一通信装置还可发送第三指示信息,第三指示信息用于指示第一训练任务中的其中一个训练任务。

30、可理解的,第一通信装置是根据接收的各第二指示信息指示的训练任务,确定的该第三指示信息,以保证每个参与训练的第二通信装置训练的训练任务不重复。

31、另一种可选的实施方式中,多个第二通信装置发送的第二指示信息指示的第一训练任务是多个训练任务中的相同训练任务,此时第一通信装置也可通过第三指示信息,向其中的一个第二通信装置指示参与训练的训练任务。从而接收到第三指示信息的第二通信装置获知到需进行训练的训练任务,而未接收到第三指示信息的第二通信装置不参与训练。

32、一种可选的实施方式中,第一通信装置还可向第二通信装置发送第四指示信息,第四指示信息用于指示第二通信装置需接收的第一输出、第一输出对应的时频资源位置,和/或需发送的第二输出、第二输出对应的时频资源位置。第一输出是第一通信装置训练的神经网络模型的输出,或者是除第二通信装置外的其他第二通信装置训练的神经网络模型的输出;第二输出是第二通信装置训练的神经网络模型的输出。

33、可见,第一通信装置通过第四指示信息告知了参与训练的第二通信装置需接收的参数、需接收的参数对应的时频资源位置,和/或,需发送的参数、需发送的参数对应的时频资源位置,从而有利于参与训练的任一第二通信装置在进行训练任务的训练过程中,进行相应输出的接收和/或发送,以保障其他各第二通信装置的协作训练。

34、一种可选的实施方式中,发送第四指示信息的资源是协作控制资源,协作控制资源是在侧行链路配置信息中配置的。可见,第一通信装置是采用侧行链路配置信息中的协作控制资源发送第四指示信息的。

35、一种可选的实施方式中,第一通信装置还可在协作同步资源上发送同步信号,以使得第二通信装置根据该同步信号与第一通信装置进行同步。另外,该协作同步资源是在侧行链路配置信息中配置的。

36、一种可选的实施方式中,上述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源可是预先配置的,或是动态指示的,或是非授权频谱资源。

37、第四方面,本技术还提供了一种模型训练方法,该方面的模型训练方法与第三方面所述的模型训练方法相对应,该方面的模型训练方法是从第二通信装置侧进行阐述的。该方法中,第二通信装置接收协作请求信息,协作请求信息包括多个训练任务,多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的。第二通信装置确定参与第一训练任务的训练时,发送第二指示信息,第二指示信息用于指示第二通信装置参与第一训练任务的训练,第一训练任务是多个训练任务中的其中一个或多个。

38、可见,本技术实施例中,第二通信装置在确定参与第一通信装置请求的多个训练任务中的第一训练任务的训练时,发送指示参与该第一训练任务的指示信息,以告知第一通信装置自身可协助第一通信装置参与第一训练任务的训练,从而有利于降低对第一通信装置能力的需求。

39、一种可选的实施方式中,协作请求信息在协作发现资源上接收的,协作发现资源是在侧行链路配置信息中配置的。可见,第二通信装置采用侧行链路配置信息中的协作发现资源接收协作请求信息。

40、一种可选的实施方式中,第二通信装置还可接收第三指示信息,第三指示信息用于指示第一训练任务中的其中一个训练任务,从而第二通信装置获知参与训练的训练任务。

41、一种可选的实施方式中,第二通信装置还可接收第四指示信息,第四指示信息用于指示第二通信装置接收的第一输出、第一输出对应的时频资源位置,和/或发送的第二输出、第二输出对应的时频资源位置。第一输出是第一通信装置训练的神经网络模型的输出,或者是除第二通信装置外的其他第二通信装置训练的神经网络模型的输出;第二输出是第二通信装置训练的神经网络模型的输出。从而,第二通信装置在进行训练任务的训练过程中,进行相应输出的接收和/或发送,以保障其他各第二通信装置的协作训练。

42、一种可选的实施方式中,接收第四指示信息的资源是协作控制资源,协作控制资源是在侧行链路配置信息中配置的。可见,第二通信装置是采用侧行链路配置信息中的协作控制资源接收第四指示信息的。

43、一种可选的实施方式中,第二通信装置还可在协作同步资源上接收同步信号,并根据同步信号,与第一通信装置进行同步。从而第二通信装置与第一通信装置同步后,可与第一通信装置通信。另外,协作同步资源是在上述侧行链路配置信息中配置的。

44、一种可选的实施方式中,上述侧行链路配置信息所配置的协作发现资源、协作控制资源、协作同步资源可是预先配置的,或是动态指示的,或是非授权频谱资源。

45、第五方面,本技术还提供一种通信装置。该通信装置具有实现上述第一方面所述的第二通信装置的部分或全部功能,或者具有实现上述第二方面所述的第一通信装置的部分或全部功能,或者具有实现上述第三方面所述的第一通信装置的部分或全部功能,或者具有实现上述第四方面所述的第二通信装置的部分或全部功能。比如,该通信装置的功能可具备本技术中第一方面所述的第二通信装置的部分或全部实施例中的功能,也可以具备单独实施本技术中的任一个实施例的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的单元或模块。

46、在一种可能的设计中,该通信装置的结构中可包括处理单元和通信单元,所述处理单元被配置为支持通信装置执行上述方法中相应的功能。所述通信单元用于支持该通信装置与其他通信装置之间的通信。所述通信装置还可以包括存储单元,所述存储单元用于与处理单元和通信单元耦合,其保存通信装置必要的程序指令和数据。

47、一种实施方式中,所述通信装置包括:处理单元和通信单元,处理单元用于控制通信单元进行数据/信令收发;通信单元,用于接收第一通信装置的第一神经网络参数;通信单元,还用于在第一神经网络参数与通信装置的第二神经网络参数之间的相关系数小于第一阈值时,向第一通信装置发送第一指示信息;第一指示信息用于指示该通信装置参与第一通信装置的第一神经网络模型的训练。

48、另外,该方面中,通信装置其他可选的实施方式可参见上述第一方面的相关内容,此处不再详述。

49、另一种实施方式中,所述通信装置包括:处理单元和通信单元,处理单元用于控制通信单元进行数据/信令收发;该通信单元,用于发送该通信装置的第一神经网络参数;该通信单元,还用于接收来自第二通信装置的第一指示信息;第一指示信息是第二通信装置在第一神经网络参数与第二装置的第二神经网络参数之间的相关系数小于第一阈值时发送的;第一指示信息用于指示第二通信装置参与该通信装置的第一神经网络模型的训练。

50、另外,该方面中,通信装置其他可选的实施方式可参见上述第二方面的相关内容,此处不再详述。

51、又一种实施方式中,所述通信装置包括:处理单元和通信单元,处理单元用于控制通信单元进行数据/信令收发;该通信单元,用于发送协作请求信息,协作请求信息包括多个训练任务,多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的;该通信单元,还用于接收来自第二通信装置的第二指示信息,第二指示信息用于指示第二通信装置参与第一训练任务的训练,第一训练任务是多个训练任务中的其中一个或多个。

52、另外,该方面中,通信装置其他可选的实施方式可参见上述第三方面的相关内容,此处不再详述。

53、又一种实施方式中,所述通信装置包括:处理单元和通信单元,处理单元用于控制通信单元进行数据/信令收发;该通信单元,用于接收协作请求信息,协作请求信息包括多个训练任务,多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的;该通信单元,还用于确定参与第一训练任务的训练时,发送第二指示信息,第二指示信息用于指示第二通信装置参与第一训练任务的训练,第一训练任务是多个训练任务中的其中一个或多个。

54、另外,该方面中,通信装置其他可选的实施方式可参见上述第四方面的相关内容,此处不再详述。

55、作为示例,通信单元可以为收发器或通信接口,存储单元可以为存储器,处理单元可以为处理器。

56、一种实施方式中,所述通信装置包括:处理器和收发器,处理器用于控制收发器进行数据/信令收发;收发器,用于接收第一通信装置的第一神经网络参数;收发器,还用于在第一神经网络参数与通信装置的第二神经网络参数之间的相关系数小于第一阈值时,向第一通信装置发送第一指示信息;第一指示信息用于指示该通信装置参与第一通信装置的第一神经网络模型的训练。

57、另外,该方面中,上行通信装置其他可选的实施方式可参见上述第一方面的相关内容,此处不再详述。

58、另一种实施方式中,所述通信装置包括:处理器和收发器,处理器用于控制收发器进行数据/信令收发;该收发器,用于发送该通信装置的第一神经网络参数;收发器,还用于接收来自第二通信装置的第一指示信息;第一指示信息是第二通信装置在第一神经网络参数与第二装置的第二神经网络参数之间的相关系数小于第一阈值时发送的;第一指示信息用于指示第二通信装置参与该通信装置的第一神经网络模型的训练。

59、另外,该方面中,通信装置其他可选的实施方式可参见上述第二方面的相关内容,此处不再详述。

60、又一种实施方式中,所述通信装置包括:处理器和收发器,处理器用于控制收发器进行数据/信令收发;收发器,用于发送协作请求信息,协作请求信息包括多个训练任务,多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的;收发器,还用于接收来自第二通信装置的第二指示信息,第二指示信息用于指示第二通信装置参与第一训练任务的训练,第一训练任务是多个训练任务中的其中一个或多个。

61、另外,该方面中,通信装置其他可选的实施方式可参见上述第三方面的相关内容,此处不再详述。

62、又一种实施方式中,所述通信装置包括:处理器和收发器,处理器用于控制收发器进行数据/信令收发;该收发器,用于接收协作请求信息,协作请求信息包括多个训练任务,多个训练任务是第一通信装置将待训练的神经网络模型进行拆分获得的;收发器,还用于确定参与第一训练任务的训练时,发送第二指示信息,第二指示信息用于指示第二通信装置参与第一训练任务的训练,第一训练任务是多个训练任务中的其中一个或多个。

63、另外,该方面中,通信装置其他可选的实施方式可参见上述第四方面的相关内容,此处不再详述。

64、另一种实施方式中,该通信装置为芯片或芯片系统。所述处理单元也可以体现为处理电路或逻辑电路;所述收发单元可以是该芯片或芯片系统上的输入/输出接口、接口电路、输出电路、输入电路、管脚或相关电路等。

65、在实现过程中,处理器可用于进行,例如但不限于,基带相关处理,收发器可用于进行,例如但不限于,射频收发。上述器件可以分别设置在彼此独立的芯片上,也可以至少部分的或者全部的设置在同一块芯片上。例如,处理器可以进一步划分为模拟基带处理器和数字基带处理器。其中,模拟基带处理器可以与收发器集成在同一块芯片上,数字基带处理器可以设置在独立的芯片上。随着集成电路技术的不断发展,可以在同一块芯片上集成的器件越来越多。例如,数字基带处理器可以与多种应用处理器(例如但不限于图形处理器,多媒体处理器等)集成在同一块芯片之上。这样的芯片可以称为系统芯片(system on achip,soc)。将各个器件独立设置在不同的芯片上,还是整合设置在一个或者多个芯片上,往往取决于产品设计的需要。本技术实施例对上述器件的实现形式不做限定。

66、第六方面,本技术还提供一种处理器,用于执行上述各种方法。在执行这些方法的过程中,上述方法中有关发送上述信息和接收上述信息的过程,可以理解为由处理器输出上述信息的过程,以及处理器接收输入的上述信息的过程。在输出上述信息时,处理器将该上述信息输出给收发器,以便由收发器进行发射。该上述信息在由处理器输出之后,还可能需要进行其他的处理,然后才到达收发器。类似的,处理器接收输入的上述信息时,收发器接收该上述信息,并将其输入处理器。更进一步的,在收发器收到该上述信息之后,该上述信息可能需要进行其他的处理,然后才输入处理器。

67、基于上述原理,举例来说,前述方法中提及的接收第一通信装置的第一神经网络参数可以理解为处理器输入第一通信装置的第一神经网络参数。

68、对于处理器所涉及的发送和接收等操作,如果没有特殊说明,或者,如果未与其在相关描述中的实际作用或者内在逻辑相抵触,则均可以更加一般性的理解为处理器输出和接收、输入等操作,而不是直接由射频电路和天线所进行的发送和接收操作。

69、在实现过程中,上述处理器可以是专门用于执行这些方法的处理器,也可以是执行存储器中的计算机指令来执行这些方法的处理器,例如通用处理器。上述存储器可以为非瞬时性(non-transitory)存储器,例如只读存储器(read only memory,rom),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本技术实施例对存储器的类型以及存储器与处理器的设置方式不做限定。

70、第七方面,本技术还提供了一种通信系统,该系统包括上述方面的至少一个第一通信装置、至少两个第二通信装置。在另一种可能的设计中,该系统还可以包括本技术提供的方案中与第一通信装置、第二通信装置进行交互的其他设备。

71、第八方面,本技术提供了一种计算机可读存储介质,用于储存指令,当所述指令被计算机运行时,实现上述第一方面至第四方面任一项所述的方法。

72、第九方面,本技术还提供了一种包括指令的计算机程序产品,当其在计算机上运行时,实现上述第一方面至第四方面任一项所述的方法。

73、第十方面,本技术提供了一种芯片系统,该芯片系统包括处理器和接口,所述接口用于获取程序或指令,所述处理器用于调用所述程序或指令以实现或者支持第二通信装置实现第一方面所涉及的功能,或者用于调用所述程序或指令以实现或者支持第一通信装置备实现第二方面所涉及的功能,用于调用所述程序或指令以实现或者支持第一通信装置实现第三方面所涉及的功能,用于调用所述程序或指令以实现或者支持第二通信装置实现第四方面所涉及的功能。例如,确定或处理上述方法中所涉及的数据和信息中的至少一种。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存终端必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1