基于云边协同的集成学习方法、系统及存储介质与流程

文档序号:28530685发布日期:2022-01-19 12:39阅读:114来源:国知局
基于云边协同的集成学习方法、系统及存储介质与流程

1.本发明涉及人工智能技术领域,尤其涉及一种基于云边协同的集成学习方法、系统及存储介质。


背景技术:

2.集成学习是采用一系列决策规则对分类器进行组合学习的方法,他们主要的思想是针对新的样本进行分类时,将若干个分类器采用一系列规则集成起来,从而通过对多个分类器的分类结果进行加权组合得到最终分类结果。如果把单个分类器比作一个决策者的话,集成学习的方法就相当于多个决策者共同进行一项决策。因此,集成学习往往能够获得较单个分类器更好的分类性能。
3.经典的集成学习方法主要有:bagging和boosting算法。其中,bagging方法是一种在原始数据集上通过有放回抽样训练分类器的方法;boosting是在分类问题中,通过改变训练样本的权重,串行地学习多个分类器,并组合提高分类性能的方法。
4.同时,在经典的集成算法基础之上,也衍生出各种集成性能更佳的改进算法,包括随机森林(random forest,rf)、adaboost、多核增强学习(multiple kernel boosting,mkb)等算法。
5.rf是基于bagging的集成学习算法,它利用随机重采样技术bootstrap和节点随机分裂技术构建多棵决策树,通过投票得到最终分类结果。rf具有分析复杂相互作用分类特征的能力,对于噪声数据和存在缺失值的数据具有很好的鲁棒性,并且具有较快的学习速度,其变量重要性度量可以作为高维数据的特征选择工具,近年来已经被广泛应用于各种分类、预测、特征选择以及异常点检测问题中。
6.adaboost基于boosting的一种迭代集成算法,每轮迭代过程中会在训练数据集上产生一个新的分类器。在训练过程中,通过改变权值,重视那些上一轮被错分的样本。这样越难区分的样本在训练过程中会变得越来越重要,从而提升最终分类效果的方法。
7.mkb是基于boosting的集成学习算法,它构建了一组支持向量机(support vector machines,svm)分类器,每个分类器都由不同的核函数以及特征组成,将每个svm分类器视为弱分类器,然后采用boosting算法对每个分类器的权重进行迭代更新计算,最终将所有弱分类器加权合成更具识别能力的强分类器,最终提升模型分类性能。
8.传统的云计算是集中式大数据处理,不管是资源还是算力,都比较强大,但是受限于行业数据安全保护,人工智能在行业场景下的应用变得日益局限。边缘计算则可以理解为边缘式大数据处理,相较于云计算,边缘计算不用将各行业数据传到外部的云端平台,而在边缘侧平台就能对数据进行智能分析、计算与处理,并得到相应的结果,因此边缘计算相较于云计算更加高效、安全。但是,由于资源的限制,边缘计算只能对较为简单的场景类型进行智能分析与处理,针对复杂场景,算力不足。


技术实现要素:

9.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于云边协同的集成学习方法、系统及存储介质,能够提高数据的安全性,提高计算效率,扩大人工智能的场景类型。
10.一方面,本发明实施例提供了一种基于云边协同的集成学习方法,包括以下步骤:
11.获取来自边缘侧平台的样例数据;
12.根据所述样例数据判断场景类型;
13.根据所述场景类型获取场景化基础模型;
14.将所述场景化基础模型发送至边缘侧平台以训练所述场景化基础模型得到场景化子模型;
15.根据场景化子模型进行集成学习训练得到场景化集成模型并将所述场景化集成模型下发至边缘侧平台。
16.根据本发明一些实施例,所述根据场景化子模型进行集成学习训练得到场景化集成模型包括以下步骤:
17.确定多个场景化子模型的场景类型;
18.选择场景类型相似度高于预设相似度的场景化子模型进行集成学习训练得到场景化集成模型。
19.根据本发明一些实施例,所述基于云边协同的集成学习方法还包括以下步骤:
20.根据所述场景类型获取场景化数据基本格式并将所述场景化数据基本格式下发至边缘侧平台。
21.根据本发明一些实施例,所述基于云边协同的集成学习方法还包括以下步骤:
22.根据所述场景类型获取场景化特征处理算法并将所述特征处理算法下发至边缘侧平台。
23.另一方面,本发明实施例还提供一种基于云边协同的集成学习方法,包括以下步骤:
24.发送样例数据至云平台以获取场景化基础模型;
25.获取训练数据;
26.采用所述训练数据对所述场景化基础模型进行训练得到场景化子模型;
27.发送所述场景化子模型至云平台以获取场景化集成模型。
28.根据本发明一些实施例,所述获取训练数据包括以下步骤:
29.获取来自云平台的场景化数据基本格式;
30.获取边缘侧数据;
31.根据所述场景化数据基本格式对边缘侧数据进行格式调整得到所述训练数据。
32.根据本发明一些实施例,所述获取训练数据包括以下步骤:
33.获取来自云平台的场景化特征处理算法;
34.获取边缘侧数据;
35.根据所述场景化特征处理算法对所述边缘侧数据进行特征提取得到所述训练数据。
36.根据本发明一些实施例,所述基于云边协同的集成学习方法还包括以下步骤:
37.获取测试数据;
38.采用所述测试数据对所述场景化集成模型进行测试得到测试结果;
39.获取来自云平台的场景化评估方法;
40.根据所述场景化评估方法对所述测试结果进行评估。
41.另一方面,本发明实施例还提供一种基于云边协同的集成学习系统,包括云平台和边缘侧平台,所述边缘侧平台接入所述云平台;
42.所述云平台用于获取来自边缘侧平台的样例数据,根据所述样例数据判断场景类型,根据所述场景类型获取场景化基础模型,将所述场景化基础模型发送至边缘侧平台以训练所述场景化基础模型得到场景化子模型,根据场景化子模型进行集成学习训练得到场景化集成模型并将所述场景化集成模型下发至边缘侧平台;
43.所述边缘侧平台用于发送样例数据至云平台以获取场景化基础模型,获取训练数据,采用所述训练数据对所述场景化基础模型进行训练得到场景化子模型,发送所述场景化子模型至云平台以获取场景化集成模型。
44.另一方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如前面所述的基于云边协同的集成学习方法。
45.本发明上述的技术方案至少具有如下优点或有益效果之一:边缘侧平台将样例数据发送至云平台。云平台根据样例数据判断边缘侧平台的场景类型,然后根据场景类型获取场景化基础模型,并将场景化基础模型下发至边缘侧平台。边缘侧平台对场景化基础模型进行训练的得到场景化子模型,并发送至云平台。云平台对获取到的多个场景化子模型进行集成学习训练得到场景化集成模型,并发送至边缘侧平台使用。通过利用边缘侧平台对场景化基础模型进行训练得到场景化子模型,能够提高数据的安全性。利用云平台对多个场景化子模型进行集成学习训练能够减少边缘侧平台的计算负担,从而扩大了人工智能的场景类型。
附图说明
46.图1是本发明实施例提供的一种基于云边协同的集成学习方法流程图;
47.图2是本发明另一实施例提供的一种基于云边协同的集成学习方法流程图;
48.图3是本发明实施例提供的一种基于云边协同的集成学习系统示意图。
具体实施方式
49.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或者类似的标号表示相同或者类似的原件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
50.在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、左、右等指示的方位或者位置关系为基于附图所示的方位或者位置关系,仅是为了便于描述本发明和简化描述,而不是指示或者暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
51.本发明的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不
能理解为指示或者暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
52.参照图3,本发明实施例的基于云边协同的集成学习方法应用于基于云边协同的集成学习系统中,云边协同的集成学习系统包括云平台和边缘侧平台。云平台和边缘侧平台之间可用过行业用户边缘网关进行通信。
53.云平台包括场景识别模块、集成模型训练模块、场景化特征库、场景化基础模型库和场景化集成模型库。场景识别模块用于根据样例数据识别样例数据的场景类型,场景类型包括但不限于图像、语音、语义和文本等不同的场景类型。集成模型训练模块用于对多个场景化子模型进行集成学习训练。场景化特征库用于存储多种场景化数据基本格式和多种场景化特征处理算法,例如,场景化特征库存储有归一化处理、pca(principal components analysis,主成分分析)处理、svd(singular value decomposition,奇异值分解)处理以及各类数据基础特征处理等。场景化基础模型库用于存储多种场景化基础模型,例如,场景化基础模型库存储有通用图像模型、通用语音模型、通用语义模型以及通用文本处理模型等。场景化集成模型库用于存储多种集成学习训练算法,例如,场景化集成模型库存储有随机森林算法、adaboost算法以及mkb算法等。
54.边缘侧平台包括数据处理模块、场景化基础模型训练模块和场景化集成模型验证评估模块。数据处理模块用于对边缘侧数据进行预处理。场景化基础模型训练模块用于训练场景化基础模型得到场景化子模型。场景化集成模型验证评估模块用于对场景化集成模型进行验证和评估。
55.本发明实施例提供了基于云边协同的集成学习方法,可应用于上述实施例的云平台,参照图1所示,本发明实施例的基于云边协同的集成学习方法包括但不限于步骤s110、步骤s120、步骤s130、步骤s140和步骤s150。
56.步骤s110,获取来自边缘侧平台的样例数据。
57.步骤s120,根据样例数据判断场景类型。
58.步骤s130,根据场景类型获取场景化基础模型。
59.步骤s140,将场景化基础模型发送至边缘侧平台以训练场景化基础模型得到场景化子模型。
60.步骤s150,根据场景化子模型进行集成学习训练得到场景化集成模型并将场景化集成模型下发至边缘侧平台。
61.在一些实施例中,一个云平台可以多个边缘侧平台进行数据交互。云平台获取来自边缘侧平台的样例数据,在场景识别模块中根据样例数据判断场景类型,例如,样例数据为图片,则根据数据格式可以判断出场景类型为图像。然后云平台根据场景类型从场景化基础模型库中获取场景化基础模型,例如,场景类型为图像获取到的场景化基础模型为通用图像模型。然后将场景化基础模型下发至边缘侧平台进行模型训练以得到场景化子模型,例如,该场景化子模型可以是图像识别的弱分类器。云平台获取到场景化子模型后,从场景化集成模型库中选取合适的集成学习训练算法对多个场景化子模型进行集成学习得到场景化集成模型,例如,采用adaboost算法对获取到的多个弱分类器进行加权集成得到一个强分类器。云平台将场景化集成模型下发至边缘侧平台使用。
62.需要说明的是,场景化基础模型库中可以分为通用图像模型、通用语音模型和通
用文本处理模型,也可以进一步分别为人像识别模型、地点识别模型、中文语音模型或者英文语音模型等。
63.根据本发明一些具体实施例,步骤s140包括但不限于步骤s141和步骤s142。
64.步骤s141,确定多个场景化子模型的场景类型。
65.步骤s142,选择场景类型相似度高于预设相似度的场景化子模型进行集成学习训练得到场景化集成模型。
66.在一些实施例中,云平台获取到来自多个边缘侧平台的场景化模型后,确定多个场景化子模型的场景类型,然后选择场景类型相似度高的场景化子模型进行集成学习训练得到场景化集成模型。例如,云平台获取到人脸分类子模型、指纹识别子模型、景点分类子模型、商店分类子模型、语音识别子模型,云平台识别各个场景化子模型的场景类型,确定人脸分类子模型和指纹识别子模型的相似度高于预设相似度0.8,均属于人体图像识别,从而将人脸分类子模型和指纹识别子模型进行集成学习训练,得到场景化集成模型,从而扩大了场景化集成模型的应用范围。
67.在一些实施例中,云平台获取来自多个边缘侧平台的人脸分类子模型,多个人脸分类子模型之间的相似度高于0.9的预设相似度,因此,将多个人脸分类子模型进行集成学习训练得到人脸识别模型,从而提高了人脸识别模型的准确度。
68.根据本发明一些具体实施例,基于云边协同的集成学习方法还包括步骤s160,步骤s160执行于步骤s150之前。
69.步骤s160,根据场景类型获取场景化数据基本格式并将场景化数据基本格式下发至边缘侧平台。
70.在一些实施例中,以场景类型为图像为例,则获取到的场景化数据基本格式可以对图像的长宽和像素等规格进行限定。云平台将场景化数据基本格式下发至边缘侧平台,使得边缘侧平台能够根据场景化数据基本格式对图像进行调整,使得用于训练的图像能够符合场景化基础模型的要求。将场景化数据基本格式存储于云平台中,能够减少边缘侧平台的存储资源。
71.根据本发明一些具体实施例,基于云边协同的集成学习方法还包括步骤s170,步骤s170执行于步骤s150之前。
72.步骤s170,根据场景类型获取场景化特征处理算法并将特征处理算法下发至边缘侧平台。
73.在一些实施例中,以场景类型为图像为例,则获取到的场景化特征处理算法可以对图像中的一些眼睛、嘴巴等要素进行提取。云平台将场景化特征处理算法下发至边缘侧平台,使得边缘侧平台能够根据场景化特征处理算法对图像进行特征提取,从而得到用于训练场景化基础模型的训练数据。将场景化数据基本格式存储于云平台中,能够减少边缘侧平台的存储资源。
74.本发明另一个实施例提供了基于云边协同的集成学习方法,可应用于上述实施例的边缘侧平台,参照图2所示,本发明实施例的基于云边协同的集成学习方法包括但不限于步骤s210、步骤s220、步骤s230和步骤s240。
75.步骤s210,发送样例数据至云平台以获取场景化基础模型。
76.步骤s220,获取训练数据。
77.步骤s230,采用训练数据对场景化基础模型进行训练得到场景化子模型。
78.步骤s240,发送场景化子模型至云平台以获取场景化集成模型。
79.在一些实施例中,在边缘侧平台发送样例数据之前,可以先对样例数据进行脱敏处理。例如,在医疗领域,需要根据病人病历进行智能问诊模型的训练,由于病历中包含了病人的个人隐私,因此,需要对病历进行数据清洗等脱敏操作,从而提高数据的安全性。
80.在一些实施例中,边缘侧发送样例数据至云平台以获取场景化基础模型。然后获取训练数据,该训练数据为用户的边缘侧平台产生的数据,例如,某医院的病历数据。采用训练数据对场景化基础模型进行训练得到场景化子模型,发送场景化子模型至云平台以获取准确度更高的场景化集成模型。将场景化子模型发给云平台完成集成学习训练,减轻了边缘侧平台的运算负担,从而减少了对边缘侧平台的硬件资源要求。
81.根据本发明一些具体实施例,步骤s220包括但不限于步骤s310、步骤s320和步骤s330。
82.步骤s310,获取来自云平台的场景化数据基本格式。
83.步骤s320,获取边缘侧数据。
84.步骤s330,根据场景化数据基本格式对边缘侧数据进行格式调整得到训练数据。
85.在一些实施例中,边缘侧数据可以为某医院的病历数据,数据处理模块根据场景化数据基本格式对病历数据进行格式上的调整得到训练数据,使得输入到场景化子模型的训练数据满足格式要求。
86.根据本发明一些具体实施例,步骤s220包括但不限于步骤s410、步骤s420和步骤s430。
87.步骤s410,获取来自云平台的场景化特征处理算法。
88.步骤s420,获取边缘侧数据。
89.步骤s430,根据场景化特征处理算法对边缘侧数据进行特征提取得到训练数据。
90.在一些实施例中,边缘侧数据可以为某医院的病历数据,数据处理模块根据场景化特征处理算法对病历数据进行特征提取得到所需要的数据,从而得到训练数据。
91.根据本发明一些具体实施例,基于云边协同的集成学习方法还包括步骤s250、步骤s260、步骤s270和步骤s280。
92.步骤s250,获取测试数据。
93.步骤s260,采用测试数据对场景化集成模型进行测试得到测试结果。
94.步骤s270,获取来自云平台的场景化评估方法。
95.步骤s280,根据场景化评估方法对测试结果进行评估。
96.在一些实施例中,可以根据边缘侧数据进行预处理之后分为训练数据和测试数据,采用训练数据对场景化基础模型进行训练得到场景化子模型。将场景化子模型发送至云平台得到场景化集成模型,然后采用测试数据对场景化集成模型进行测试得到测试结果。利用来自云平台的场景化评估方法对测试结果进行评估,以评估场景化集成模型是否满足应用行业的准确度等要求。进一步地,若满足要求,则直接应用该场景化集成模型。若不满足要求,则反馈至云平台,以使云平台重新对场景化子模型进行集成学习训练得到新的场景化集成模型。
97.本发明的另一个实施例还提供了基于云边协同的集成学习系统,如图3所示,包括
云平台和边缘侧平台,边缘侧平台接入云平台。
98.云平台用于获取来自边缘侧平台的样例数据,根据样例数据判断场景类型,根据场景类型获取场景化基础模型,将场景化基础模型发送至边缘侧平台以训练场景化基础模型得到场景化子模型,根据场景化子模型进行集成学习训练得到场景化集成模型并将场景化集成模型下发至边缘侧平台。
99.边缘侧平台用于发送样例数据至云平台以获取场景化基础模型,获取训练数据,采用训练数据对场景化基础模型进行训练得到场景化子模型,发送场景化子模型至云平台以获取场景化集成模型。
100.实施例1
101.在智慧零售的业务场景中,可以使用本发明实施例的基于云边协同的集成学习系统对多业务方数据进行联合建模。利用边缘侧平台和云平台的集成学习特性,企业不需要导出企业数据,即能够联合多方企业构建机器学习模型,既充分保护了用户隐私和数据安全,又能根据机器学习模型为用户提供了个性化的产品服务。
102.实施例2
103.在智慧医疗场景中,可以针对同一病患在不同医院就诊的病历信息,将多个医院的边缘侧平台与云平台结合的进行集成学习,为辅助诊断病患的病症提供依据。
104.本发明实施例至少能够解决目前人工智能技术面向边缘侧场景时存在的问题之一,包括:
105.1)受限于硬件资源,大规模训练模型很难在边缘侧平台实现;
106.2)边缘侧应用上的行业企业的数据安全问题,即具体应用场景,所需数据在企业侧,一般不会开放给云平台进行模型训练;
107.3)目前的人工智能应用场景偏向于人工干预少,如数据标注、调参等,人工基本只评价最终结果;
108.4)边缘侧平台训练的模型场景适应能力不强,边缘侧的人工智能应用越来越趋于应用聚焦、目标明确,导致模型的应用场景单一。
109.本发明实施例通过云边结合的集成学习系统,能够突破数据孤岛,解决各行业数据信息无法共享和边缘侧平台硬件资源受限的问题。通过在云平台进行集成学习训练,能够扩大边缘侧平台模型的应用范围。通过云平台下发针对不同模型的评估方法,能够对边缘侧平台的模型评估方法进行优化。
110.此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,可使得上述一个或多个控制处理器执行上述方法实施例中的控制方法。
111.本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和
不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
112.上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1