人工智能模型训练方法、装置、网络侧设备、终端及介质与流程

文档序号:36795868发布日期:2024-01-23 12:18阅读:15来源:国知局
人工智能模型训练方法、装置、网络侧设备、终端及介质与流程

本申请属于通信,具体涉及一种人工智能模型训练方法、装置、网络侧设备、终端及介质。


背景技术:

1、随着计算机技术的快速发展,人工智能(artificial intelligence,ai)技术也逐渐发展起来,在各领域得到了广泛应用,并起到了较好作用。比如将人工智能技术应用到无线通信网络中,有助于提升网络吞吐量、减小时延、扩大用户容量等。

2、人工智能技术是一种数据驱动技术,可以利用有标签的训练数据对人工智能模型进行训练,然后将训练得到的人工智能模型应用到实际场景中,进行相应业务的处理。人工智能模型的精度依赖于训练数据的数据量的大小,训练数据的数据量越大,人工智能模型的精度越高,反之,训练数据的数据量越小,人工智能模型的精度越低。

3、但在很多情况下,训练数据的真实标签可能难以获取,或者在训练数据中难以进行标签标注,这样将使得可对人工智能模型进行训练的训练数据的数据量较少,无法对人工智能模型进行有效训练,导致训练后得到的人工智能模型的精度较低。


技术实现思路

1、本申请实施例提供一种人工智能模型训练方法、装置、网络侧设备、终端及介质,能够解决无法对人工智能模型进行有效训练,导致训练后得到的人工智能模型的精度较低的问题。

2、第一方面,提供一种人工智能模型训练方法,包括:

3、网络侧设备确定待训练的第一模型;

4、所述网络侧设备基于目标业务的有标签数据集和第二模型的模型参数,对所述第一模型进行训练,训练终止后得到目标模型;其中,所述第二模型的模型参数是基于所述目标业务的无标签数据集和所述第一模型的模型参数对所述第二模型进行训练后得到的,所述目标模型用于对所述目标业务进行处理;

5、其中,所述第一模型和所述第二模型为同种类型的人工智能模型,所述第二模型的模型结构至少包括所述第一模型的模型结构。

6、第二方面,提供一种人工智能模型训练装置,包括:

7、第一确定模块,用于确定待训练的第一模型;

8、获得模块,用于基于目标业务的有标签数据集和第二模型的模型参数,对所述第一模型进行训练,训练终止后得到目标模型;其中,所述第二模型的模型参数是基于所述目标业务的无标签数据集和所述第一模型的模型参数对所述第二模型进行训练后得到的,所述目标模型用于对所述目标业务进行处理;

9、其中,所述第一模型和所述第二模型为同种类型的人工智能模型,所述第二模型的模型结构至少包括所述第一模型的模型结构。

10、第三方面,提供一种人工智能模型训练方法,其特征在于,包括:

11、终端确定待训练的第二模型;

12、所述终端基于目标业务的无标签数据集和第一模型的模型参数,对所述第二模型进行训练;其中,所述第一模型的模型参数是网络侧设备基于所述目标业务的有标签数据集和所述第二模型的模型参数对所述第一模型进行训练后得到的;

13、所述终端在确定达到第二训练终止条件时,终止对所述第二模型的训练,所述第二训练终止条件是基于所述网络侧设备对所述第一模型的训练是否终止设定的,对所述第一模型的训练终止后得到的目标模型用于对所述目标业务进行处理;

14、其中,所述第一模型和所述第二模型为同种类型的人工智能模型,所述第二模型的模型结构至少包括所述第一模型的模型结构。

15、第四方面,提供一种人工智能模型训练装置,包括:

16、第二确定模块,用于确定待训练的第二模型;

17、训练模块,用于基于目标业务的无标签数据集和第一模型的模型参数,对所述第二模型进行训练;其中,所述第一模型的模型参数是网络侧设备基于所述目标业务的有标签数据集和所述第二模型的模型参数对所述第一模型进行训练后得到的;

18、终止模块,用于在确定达到第二训练终止条件时,终止对所述第二模型的训练,所述第二训练终止条件是基于所述网络侧设备对所述第一模型的训练是否终止设定的,对所述第一模型的训练终止后得到的目标模型用于对所述目标业务进行处理;

19、其中,所述第一模型和所述第二模型为同种类型的人工智能模型,所述第二模型的模型结构至少包括所述第一模型的模型结构。

20、第五方面,提供一种网络侧设备,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的人工智能模型训练方法的步骤。

21、第六方面,提供一种终端,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第三方面所述的人工智能模型训练方法的步骤。

22、第七方面,提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的人工智能模型训练方法,或者实现如第三方面所述的人工智能模型训练方法的步骤。

23、第八方面,提供了一种无线通信系统,包括:网络侧设备及终端,所述网络侧设备可用于执行如第一方面所述的人工智能模型训练方法的步骤,所述终端可用于执行如第三方面所述的人工智能模型训练方法的步骤。

24、第九方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的人工智能模型训练方法,或者实现如第三方面所述的人工智能模型训练方法的步骤。

25、在本申请实施例中,基于目标业务的有标签数据集和第二模型的模型参数,对第一模型进行训练,训练终止后得到目标模型,第二模型的模型参数是基于目标业务的无标签数据集和第一模型的模型参数对第二模型进行训练后得到的,使得对第一模型的训练加入了利用目标业务的无标签数据集对第二模型进行训练后得到的第二模型的模型参数的影响,相当于通过半监督学习方式,同时利用有标签数据集和无标签数据集对第一模型进行训练,实现了对人工智能模型的有效训练,而且,在有标签数据集基础上,补充无标签数据集,增加了训练数据的数据量,可以提高训练后得到的人工智能模型的精度。



技术特征:

1.一种人工智能模型训练方法,其特征在于,包括:

2.根据权利要求1所述的人工智能模型训练方法,其特征在于,在所述网络侧设备基于目标业务的有标签数据集和第二模型的模型参数,对所述第一模型进行训练之前,还包括:

3.根据权利要求2所述的人工智能模型训练方法,其特征在于,所述模型部署信息包括模型结构信息、模型参数信息和模型优化配置信息。

4.根据权利要求2所述的人工智能模型训练方法,其特征在于,所述模型训练信息包括模型训练方式信息、模型更新方式信息、模型训练终止条件信息、模型训练数据集构成信息。

5.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述目标业务包括定位业务,所述有标签数据集包括至少一个有标签训练数据,所述有标签训练数据包含无线测量信息和位置表征真实标签;所述无标签数据集包括至少两个无标签训练数据,所述无标签训练数据包含所述无线测量信息;

6.根据权利要求5所述的人工智能模型训练方法,其特征在于,所述无线测量信息包括信道状态信息、多径信息和参考信号质量信息中的至少一种信息。

7.根据权利要求5所述的人工智能模型训练方法,其特征在于,所述位置表征真实标签包括真实位置标签,或者真实中间特征量标签;在所述位置表征真实标签包括真实位置标签的情况下,所述位置表征预测信息包括预测的位置信息;在所述位置表征真实标签包括真实中间特征量标签的情况下,所述位置表征预测信息包括预测的中间特征量信息,所述预测的中间特征量信息用于辅助估计所述目标数据对应的位置。

8.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述网络侧设备基于目标业务的有标签数据集和第二模型的模型参数,对所述第一模型进行训练,训练终止后得到目标模型,包括:

9.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述网络侧设备基于目标业务的有标签数据集和第二模型的模型参数,对所述第一模型进行训练,训练终止后得到目标模型,包括:

10.根据权利要求8或9所述的人工智能模型训练方法,其特征在于,所述第一训练终止条件包括:

11.根据权利要求8或9所述的人工智能模型训练方法,其特征在于,所述网络侧设备通过以下步骤基于获取的所述第二模型的模型参数和所述目标业务的有标签数据集,对所述第一模型进行所述第一迭代训练:

12.根据权利要求8或9所述的人工智能模型训练方法,其特征在于,所述第二模型部署在所述网络侧设备,所述网络侧设备通过以下步骤基于所述目标业务的无标签数据集和传递的所述第一模型的模型参数,对所述第二模型进行所述第二迭代训练:

13.根据权利要求1至9之中任一项所述的人工智能模型训练方法,其特征在于,对所述第二模型的训练由终端或者其他网络侧设备执行。

14.一种人工智能模型训练装置,其特征在于,包括:

15.一种人工智能模型训练方法,其特征在于,包括:

16.根据权利要求15所述的人工智能模型训练方法,其特征在于,所述终端确定待训练的第二模型,包括:

17.根据权利要求16所述的人工智能模型训练方法,其特征在于,所述模型部署信息包括模型结构信息、模型参数信息和模型优化配置信息。

18.根据权利要求16所述的人工智能模型训练方法,其特征在于,所述第二模型的模型信息还包括模型训练信息,所述终端基于目标业务的无标签数据集和第一模型的模型参数,对所述第二模型进行训练,包括:

19.根据权利要求18所述的人工智能模型训练方法,其特征在于,所述模型训练信息包括模型训练方式信息、模型更新方式信息、模型训练终止条件信息、模型训练数据集构成信息。

20.根据权利要求15所述的人工智能模型训练方法,其特征在于,所述目标业务包括定位业务,所述有标签数据集包括至少一个有标签训练数据,所述有标签训练数据包含无线测量信息和位置表征真实标签;所述无标签数据集包括至少两个无标签训练数据,所述无标签训练数据包含所述无线测量信息;

21.根据权利要求20所述的人工智能模型训练方法,其特征在于,所述无线测量信息包括信道状态信息、多径信息和参考信号质量信息中的至少一种信息。

22.根据权利要求20所述的人工智能模型训练方法,其特征在于,所述位置表征真实标签包括真实位置标签,或者真实中间特征量标签;在所述位置表征真实标签包括真实位置标签的情况下,所述位置表征预测信息包括预测的位置信息;在所述位置表征真实标签包括真实中间特征量标签的情况下,所述位置表征预测信息包括预测的中间特征量信息,所述预测的中间特征量信息用于辅助估计所述目标数据对应的位置。

23.根据权利要求15所述的人工智能模型训练方法,其特征在于,所述终端基于目标业务的无标签数据集和第一模型的模型参数,对所述第二模型进行训练,包括:

24.根据权利要求15所述的人工智能模型训练方法,其特征在于,所述终端基于目标业务的无标签数据集和第一模型的模型参数,对所述第二模型进行训练,包括:

25.根据权利要求23或24所述的人工智能模型训练方法,其特征在于,所述终端通过以下步骤基于获取的所述第一模型的模型参数和所述目标业务的无标签数据集,对所述第二模型进行所述第二迭代训练:

26.根据权利要求15至24之中任一项所述的人工智能模型训练方法,其特征在于,所述第二训练终止条件包括:

27.一种人工智能模型训练装置,其特征在于,包括:

28.一种网络侧设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至13之中任一项所述的人工智能模型训练方法的步骤。

29.一种终端,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求15至26之中任一项所述的人工智能模型训练方法的步骤。

30.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至13之中任一项所述的人工智能模型训练方法,或者实现如权利要求15至26之中任一项所述的人工智能模型训练方法的步骤。


技术总结
本申请公开了一种人工智能模型训练方法、装置、网络侧设备、终端及介质,属于通信技术领域,本申请实施例的一种人工智能模型训练方法包括:网络侧设备确定待训练的第一模型;基于目标业务的有标签数据集和第二模型的模型参数,对第一模型进行训练,训练终止后得到目标模型;其中,第二模型的模型参数是基于目标业务的无标签数据集和第一模型的模型参数对第二模型进行训练后得到的,目标模型用于对目标业务进行处理。本申请实施例的另一种人工智能模型训练方法包括:终端确定待训练的第二模型;基于目标业务的无标签数据集和第一模型的模型参数,对第二模型进行训练;终端在确定达到第二训练终止条件时,终止对第二模型的训练。

技术研发人员:贾承璐
受保护的技术使用者:维沃移动通信有限公司
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1