预测模型搭建方法、系统及计算机存储介质与流程

文档序号：32480183发布日期：2022-12-09 21:53阅读：46来源：国知局

1.本技术实施例涉及模型训练技术领域，特别涉及一种预测模型搭建方法、装置及计算机存储介质。

背景技术：

2.在许多实际应用场景中，训练模型需要大量的有标签数据，这需要人工事先标注大量数据，费时费力。因此，如何摒弃标签信息，提供预测模型直接从大量的无标签图片中学习到提取特征，成为当前模型训练亟需克服的问题。
3.对于无标签的样本数据，目前的模型训练方法是通过对比学习，使得模型能够简单区分不同样本的能力，但是此方法所训练的模型没有区分类别和类别之间的能力。
4.有鉴于此，亟需一种改善的模型搭建技术，以提高训练效率并降低训练成本。

技术实现要素：

5.鉴于上述问题，本技术提供一种预测模型搭建方法、装置及计算机存储介质，可至少部分地解决现有技术中存在的技术问题。
6.本技术实施例的第一方面，提供一种预测模型搭建方法，包括：利用训练好的特征提取模型，针对每一个训练样本执行特征提取，获得每一个训练样本的样本特征；根据多个不同的特征粒度，分别针对所有样本特征执行聚类分析，获得每一个特征粒度的特征聚类结果；根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果，训练每一个特征粒度的分类器，获得每一个特征粒度的训练好的分类器；根据预测需求，利用训练好的各分类器中的至少一个，搭建满足所述预测需求的预测模型。
7.本技术实施例的第二方面，提供一种预测模型搭建装置，包括：特征提取模块，用于利用训练好的特征提取模型针对每一个训练样本执行特征提取，获得每一个训练样本的样本特征；聚类模块，用于根据多个不同的特征粒度，分别针对所有样本特征执行聚类分析，获得每一个特征粒度的特征聚类结果；训练模块，用于根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果，训练每一个特征粒度的分类器，获得每一个特征粒度的训练好的分类器；模型搭建模块，用于根据预测需求，利用训练好的各分类器中的至少一个，搭建满足所述预测需求的预测模型。
8.本技术实施例的第三方面，提供一种计算机存储介质，所述计算机存储介质中存储有用于执行上述第一方面所述的方法中各步骤的各指令。
9.综上所述，本技术各方面提供的预测模型搭建方案，通过多粒度表征无监督学习方法执行分类器训练，不仅可节省样本标注的人工成本和时间成本，且可提供较高的模型预测精度。此外，还可基于实际的预测需求，任意组合训练好的各个分类器，搭建满足实际预测需求的预测模型，可灵活满足不同的预测场景。
附图说明
10.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
11.图1为本技术示例性实施例的预测模型搭建方法的处理流程图。
12.图2为本技术另一示例性实施例的预测模型搭建方法的处理流程图。
13.图3为本技术示例性实施例的预测模型搭建装置的结构框图。
具体实施方式
14.为了使本领域的人员更好地理解本技术实施例中的技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术实施例一部分实施例，而不是全部的实施例。基于本技术实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本技术实施例保护的范围。
15.模型训练主要包括有监督方式和无监督方式，其中，有监督方式需要预先准备大量的有标签数据，会耗费大量的样本标注的人力成本和时间成本，而无监督方式所训练的预测模型，仅能够简单区分不同样本的能力，无法区分不同类别之间的能力，存在模型预测效果不佳的问题。
16.有鉴于此，本技术提供一种模型搭建技术，不仅可实现无监督方式的模型训练，且可确保模型预测精度。
17.以下将结合各附图详细描述本技术的各具体实施例。
18.图1为本技术示例性实施例的预测模型搭建方法的处理流程图，其主要包括以下步骤：
19.步骤s102，利用训练好的特征提取模型，针对每一个训练样本执行特征提取，获得每一个训练样本的样本特征。
20.可选地，训练样本包括无标签的图像样本。
21.于本实施例中，特征提取模型可利用任意一种现有模型训练方案训练获得，本技术对此不作限制。
22.步骤s104，根据多个不同的特征粒度，分别针对所有样本特征执行聚类分析，获得每一个特征粒度的特征聚类结果。
23.可选地，可利用预设聚类算法，根据每一个特征粒度，分别针对所有样本特征执行聚类分析，获得每一个特征粒度的特征聚类结果。
24.于本实施例中，每一个特征粒度的特征聚类结果包括有至少两个聚类特征集。
25.示例性地，若待预测目标为超市贩售商品，可将特征粒度设定为三个层级，其中，第一层级可将超市贩售商品分为“素食”和“荤食”两大类别；第二层级可将超市贩售商品分为“蔬菜”、“水果”、“肉禽蛋”三大类别；第三层级可将超市贩售商品分为“芹菜”、“菠菜”、“白菜”、“西瓜”、“橘子”、“牛肉”、“鸡肉”、“猪肉”等更多类别。
26.根据上述示例可以看出，当层级越低时，其相应的特征粒度越为粗糙(例如超市贩售商品的第一层级仅包含两个聚类特征集)，当层级越高时，其相应的特征粒度则越为精细
(例如超市贩售商品的第三层级包含有七个聚类特征集)，据以满足不同应用场景下的预测需求。
27.可选地，预设聚类算法包括但不限于：基于距离的聚类方法(如k-means)、基于层次的聚类算法(如agnes)、基于密度的聚类算法等。
28.步骤s106，根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果，训练每一个特征粒度的分类器，获得每一个特征粒度的训练好的分类器。
29.可选地，可利用深度学习方法，根据每一个特征粒度的特征聚类结果，执行分类器的训练，获得每一个特征粒度的训练好的分类器。但并不以此为限，也可利用其它方式执行分类器的训练，本技术对此不作限制。
30.步骤s108，根据预测需求，利用训练好的各分类器中的至少一个，搭建满足预测需求的预测模型。
31.可选地，可根据预测需求，从各特征粒度中确定满足预测需求的至少一个目标粒度，并利用每一个目标粒度的训练好的分类器，搭建满足预测需求的预测模型。
32.于本实施例中，可根据待预测目标以及待预测目标的粗细度层级，确定预测需求，据以确定各特征粒度中的目标粒度。
33.示例性地，可根据待预测目标(例如，超市贩售商品)以及待预测目标的粗细度层级(例如，第二层级)，确定满足于所述待预测目标及其粗细度层级的至少一个分类器，据以搭建相应的预测模型。
34.综上所述，本实施例的预测模型搭建方法，可通过对无标签的训练样本执行特征提取及特征聚类分析，以训练对应于不同特征粒度的分类器，并据以搭建满足不同应用场景的预测模型。借此，本技术可通过无监督方式执行分类器训练，以减少分类器训练的人力成本和时间成本。
35.再者，可根据实际预测需求，任意组合不同特征粒度的分类器，以搭建满足实际预测需求的预测模型，因此，本技术提供的预测模型搭建方案，可灵活满足不同应用场景的预测需求，具有使用范围广泛，且预测精度高的优点。
36.图2示出了本技术另一示例性实施例的预测模型搭建方法的处理流程图，本实施例示出了上述步骤s106的具体实施方案，其主要包括以下步骤：
37.步骤s202，将一个特征粒度确定为当前粒度。
38.具体地，可依序获取各特征粒度中的一个，并将当前获取的特征粒度确定为当前粒度。
39.步骤s204，根据当前粒度的当前特征聚类结果，生成当前粒度的训练标签组。
40.于本实施例中，训练标签组包含有多个训练标签，各训练标签与当前特征聚类结果中的各聚类特征集一一对应。
41.例如，若当前特征聚类结果包含有“素食”和“荤食”两个聚类特征集，则训练标签组中相应设置有“素食”和“荤食”两个训练标签。
42.步骤s206，根据当前特征聚类结果中的每一个聚类特征集、每一个聚类特征集的训练标签，训练当前粒度的分类器，获得当前粒度的训练好的分类器。
43.可选地，分类器可包括但不限于：贝叶斯分类器、知识向量机分类器等。
44.可选地，利用深度学习方法，根据当前特征聚类结果中的每一个聚类特征集、每一
个聚类特征集的训练标签，训练当前粒度的分类器。
45.步骤s208，判断是否所有特征粒度均被确定为当前粒度，若是，结束本流程，若否，返回步骤s202。
46.综上所述，本实施例的预测模型搭建方法，可基于特征聚类分析结果，可在无监督条件下执行分类器的训练，以降低分类器的训练成本。
47.图3示出了本技术示例性实施例的预测模型搭建装置的结构框图。如图所示，本实施例的预测模型搭建装置200主要包括特征提取模块302、聚类模型304、训练模块306、模型搭建模块308。
48.特征提取模块302，用于利用训练好的特征提取模型针对每一个训练样本执行特征提取，获得每一个训练样本的样本特征。
49.聚类模块304，用于根据多个不同的特征粒度，分别针对所有样本特征执行聚类分析，获得每一个特征粒度的特征聚类结果。
50.训练模块306，用于根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果，训练每一个特征粒度的分类器，获得每一个特征粒度的训练好的分类器。
51.模型搭建模块308，用于根据预测需求，利用训练好的各分类器中的至少一个，搭建满足所述预测需求的预测模型。
52.可选地，聚类模块304还用于：利用预设聚类算法，根据每一个特征粒度，分别针对所有样本特征执行聚类分析，获得每一个特征粒度的特征聚类结果。
53.于本实施例中，每一个特征粒度的特征聚类结果包括有至少两个聚类特征集。
54.可选地，所述预设聚类算法至少包括：基于距离的聚类方法、基于层次的聚类算法、基于密度的聚类算法中的一个。
55.可选地，训练模块306还用于：针对各特征粒度中的任意一个当前粒度，根据所述当前粒度的当前特征聚类结果，生成所述当前粒度的训练标签组；并训练步骤，根据所述当前特征聚类结果中的每一个聚类特征集、每一个聚类特征集的训练标签，训练所述当前粒度的分类器，获得所述当前粒度的训练好的分类器。
56.于本实施例中，所述训练标签组包含有多个训练标签，各训练标签与所述当前特征聚类结果中的各聚类特征集一一对应
57.可选地，所述分类器至少包括：贝叶斯分类器、知识向量机分类器中的一个。
58.可选地，训练模块306还用于：利用深度学习方法，根据所述当前特征聚类结果中的每一个聚类特征集、每一个聚类特征集的训练标签，训练所述当前粒度的分类器。
59.可选地，模型搭建模块308还用于：根据所述预测需求，从各特征粒度中确定满足所述预测需求的至少一个目标粒度；利用每一个目标粒度的训练好的分类器，搭建满足所述预测需求的预测模型。
60.本技术另一实施例还提供一种计算机存储介质，所述计算机存储介质中存储有用于执行上述各实施例所述的方法中各步骤的各指令。
61.综上所述，本技术各实施例提供的预测模型搭建方案，可实现无监督方式下的分类器训练，以节省样本标签的人工标注成本。
62.此外，本技术各实施例提供的预测模型搭建方案，可基于特征聚类结果，训练对应于不同特征粒度的分类器，不仅可灵活搭建满足不同应用场景的预测模型，且可提高预测
模型的预测精度。
63.最后应说明的是：以上实施例仅用以说明本技术实施例的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱蕾
技术所有人：北京云从科技有限公司
我是此专利的发明人

上一篇：一种基于非线性调频模态分解的时变交叉模态识别方法
上一篇：显示设备及检查显示设备的方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。