电子装置、多模型样本训练方法和计算机可读存储介质与流程

文档序号:14404109阅读:139来源:国知局
电子装置、多模型样本训练方法和计算机可读存储介质与流程

本发明涉及机器学习模型训练领域,特别涉及一种电子装置、多模型样本训练方法和计算机可读存储介质。



背景技术:

目前,业内在使用机器学习训练样本时,需要手动选择一些机器学习模型,然后用选择的机器学习模型对样本数据进行训练,得到一个分类器。然而,这种需要自行选择模型的方式对初级或基础不扎实的用户而言,难度比较大,很容易发生因为模型选择错误而导致得到的分类器的效果较差,不符合要求,需要重新选择模型进行训练,而重复训练花费太多时间,严重影响用户的工作进度。



技术实现要素:

本发明提供一种电子装置、多模型样本训练方法和计算机可读存储介质,旨在解决经验不足的用户花费太多时间重复训练模型而对工作进度的影响。

为实现上述目的,本发明提出的电子装置,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的多模型样本训练系统,所述多模型样本训练系统被所述处理器执行时实现如下步骤:

a、接收用户上传的样本数据,确定所述样本数据的数据属性,所述数据属性包括类型和数量;

b、根据预先确定的机器学习模型与样本数据的数据属性的映射关系,确定所述样本数据的数据属性对应的机器学习模型;

c、将所述确定的机器学习模型分别对所述样本数据进行训练;

d、分析训练完成后得到的各个机器学习模型的训练结果,将符合预设条件的训练结果在显示界面上展示。

优选地,所述步骤c替换为:

c1、将所述确定的机器学习模型在操作界面上展示,以供用户选择待训练的机器学习模型;

c2、在接收到用户基于所述操作界面选择的待训练的机器学习模型后,将所述待训练的机器学习模型分别对所述样本数据进行训练。

优选地,所述步骤c2包括:

在接收到用户基于所述操作界面选择的待训练的机器学习模型后,在操作界面上显示各个待训练的机器学习模型的参数设置界面;

在各个带训练的机器学习模型完成参数设置后,采用所述待训练的机器学习模型分别对所述样本数据进行训练。

优选地,所述训练结果包括机器学习模型训练的准确率和损失函数曲线;所述预设条件为:准确率大于预设值,或准确率降序排名的前预设名。

本发明还提出一种多模型样本训练方法,该方法包括步骤:

e、接收用户上传的样本数据,确定所述样本数据的数据属性,所述数据属性包括类型和数量;

f、根据预先确定的机器学习模型与样本数据的数据属性的映射关系,确定所述样本数据的数据属性对应的机器学习模型;

g、将所述确定的机器学习模型分别对所述样本数据进行训练;

h、分析训练完成后得到的各个机器学习模型的训练结果,将符合预设条件的训练结果在显示界面上展示。

优选地,所述步骤g替换为:

g1、将所述确定的机器学习模型在操作界面上展示,以供用户选择待训练的机器学习模型;

g2、在接收到用户基于所述操作界面选择的待训练的机器学习模型后,将所述待训练的机器学习模型分别对所述样本数据进行训练。

优选地,所述步骤g2包括:

在接收到用户基于所述操作界面选择的待训练的机器学习模型后,在操作界面上显示各个待训练的机器学习模型的参数设置界面;

在各个带训练的机器学习模型完成参数设置后,采用所述待训练的机器学习模型分别对所述样本数据进行训练。

优选地,所述训练结果包括机器学习模型训练的准确率和损失函数曲线;所述预设条件为:准确率大于预设值,或准确率降序排名的前预设名。

本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有多模型样本训练系统,所述多模型样本训练系统可被至少一个处理器执行,以使所述至少一个处理器执行以下步骤:

接收用户上传的样本数据,确定所述样本数据的数据属性,所述数据属性包括类型和数量;

根据预先确定的机器学习模型与样本数据的数据属性的映射关系,确定所述样本数据的数据属性对应的机器学习模型;

将所述确定的机器学习模型分别对所述样本数据进行训练;

分析训练完成后得到的各个机器学习模型的训练结果,将符合预设条件的训练结果在显示界面上展示。

优选地,所述将所述确定的机器学习模型分别对所述样本数据进行训练的步骤替换为:

将所述确定的机器学习模型在操作界面上展示,以供用户选择待训练的机器学习模型;

在接收到用户基于所述操作界面选择的待训练的机器学习模型后,将所述待训练的机器学习模型分别对所述样本数据进行训练。

本发明技术方案,在系统中预先设置机器学习模型与样本数据的数据属性的映射关系,当接收到用户上传的样本数据后,先对样本数据的数据属性进行分析确定,在根据系统中机器学习模型与样本数据的数据属性的映射关系,确定出针对当前样本数据训练效果较佳的机器学习模型(可能是一个,也可能是多个),将确定的机器学习模型分别对该样本数据进行训练,训练完成后,将各个机器学习模型的训练结果中,符合预设条件的训练结果在显示界面上进行展示,以供用户查看并挑选最佳的机器学习模型。即本方案采用系统根据用户上传的样本数据自动确定合适且训练效果好的一个或多个机器学习模型,对样本数据进行训练,并在训练结束后将较好的训练结果展示给用户,让用户可以一次性准确的挑选到最佳的模型,且整个过程无需花费;与现有技术的用户自行选择模型对样本数据训练的方式相比,本方案避免了经验不足的用户由于模型的选择错误而导致训练结果很差的情况发生,解决了用户花费太多时间重复训练模型而对工作进度的影响的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1为本发明多模型样本训练方法一实施例的流程示意图;

图2为本发明多模型样本训练方法二实施例的流程示意图;

图3为本发明多模型样本训练方法三实施例的流程示意图;

图4为本发明多模型样本训练系统较佳实施例的运行环境示意图;

图5为本发明多模型样本训练系统一实施例的程序模块图;

图6为本发明多模型样本训练系统二实施例的程序模块图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

如图1所示,图1为本发明多模型样本训练方法一实施例的流程示意图。

本实施例中,该多模型样本训练方法包括:

步骤s10,接收用户上传的样本数据,确定所述样本数据的数据属性,所述数据属性包括类型和数量;

当用户上传样本数据后,系统接收该样本数据对其数据属性进行分析,以确定该样本数据的类型及数量。其中,样本数据的类型主要包括图像数据及预测连续数值的数据(例如股市行情),另外,图像数据也可能为预测连续数值的数据(例如,人脸姿态校正的视频是时间序列的图像数据)。

步骤s20,根据预先确定的机器学习模型与样本数据的数据属性的映射关系,确定所述样本数据的数据属性对应的机器学习模型;

系统中具有各种机器学习模型,其中包括传统机器学习模型:随机森林、svm、朴素贝叶斯、knn、gbdt、xgboost、lr等,以及深度学习模型:lenet、alexnet、vggnet、resnet、inception-v1、inception-resnet、sgd、fast-rcnn等。系统中预先设置了机器学习模型与样本数据的数据属性的映射关系,即针对样本数据的不同数据属性(即不同类型及/或不同数量),系统中均设置了相应的适合且训练效果较好的机器学习模型与之关联对应。例如,在所述样本数据的类型为图像数据且数量大于a(例如10000张)时,确定与该样本数据的样本属性(类型和数量)相对应的为一个或多个卷积神经网络(cnn)模型(各个卷积神经网络模型为层数不同);在所述样本数据的类型为图像数据且数量不超过a(例如10000张)时,确定与该样本数据的样本属性(类型和数量)相对应的为支持向量机(svm)模型(或还包括其它多个类型的模型);在所述样本数据的类型为预测连续数值的数据时,确定对应的模型为选择回归模型或者更多其它类型模型。因此,当确定了接收到的样本数据的类型和数量后,则根据系统中的预先确定的机器学习模型与样本数据的数据属性的映射关系,确定当前样本数据对应的合适且训练效果好的一个或多个机器学习模型。

步骤s30,将所述确定的机器学习模型分别对所述样本数据进行训练;

系统在确定机器学习模型后,将确定的各个机器学习模型分别对该样本数据进行训练,系统在确定的各个机器学习模型训练完成后,得到各个机器学习模型的训练结果。

步骤s40,分析训练完成后得到的各个机器学习模型的训练结果,将符合预设条件的训练结果在显示界面上展示。

本实施例中,所述训练结果包括训练完成后的机器学习模型的准确率和损失函数曲线;所述预设条件优选为:准确率大于预设值(例如95%),或准确率降序排名的前预设名(例如前3名);当然,在其它实施例中,所述预设条件还可为其它方案。系统在得到各个机器学习模型的训练结果后,根据所述预设条件筛选训练结果,将筛选后得到的训练结果在显示界面上展示,以将较佳的训练结果展示给用户看,用户则可根据挑选训练结果最优的机器学习模型进行使用。

本实施例技术方案,在系统中预先设置机器学习模型与样本数据的数据属性的映射关系,当接收到用户上传的样本数据后,先对样本数据的数据属性进行分析确定,在根据系统中机器学习模型与样本数据的数据属性的映射关系,确定出针对当前样本数据训练效果较佳的机器学习模型(可能是一个,也可能是多个),将确定的机器学习模型分别对该样本数据进行训练,训练完成后,将各个机器学习模型的训练结果中,符合预设条件的训练结果在显示界面上进行展示,以供用户查看并挑选最佳的机器学习模型。即本方案采用系统根据用户上传的样本数据自动确定合适且训练效果好的一个或多个机器学习模型,对样本数据进行训练,并在训练结束后将较好的训练结果展示给用户,让用户可以一次性准确的挑选到最佳的模型,且整个过程无需花费;与现有技术的用户自行选择模型对样本数据训练的方式相比,本方案避免了经验不足的用户由于模型的选择错误而导致训练结果很差的情况发生,解决了用户花费太多时间重复训练模型而对工作进度的影响的问题。

如图2所示,图2为本发明多模型样本训练方法二实施例流程示意图;本实施例多模型样本训练方法将所述步骤s30替换为:

步骤s31,将所述确定的机器学习模型在操作界面上展示,以供用户选择待训练的机器学习模型;

系统在确定当前样本数据对应的机器学习模型后,将确定的机器学习模型展示在一个操作界面上,以供用户在操作界面上选择待训练的机器学习模型,用户可以在所述操作界面上只选择一个机器学习模型待训练,也可以选择多个或全部机器学习模型待训练。

步骤s32,在接收到用户基于所述操作界面选择的待训练的机器学习模型后,将所述待训练的机器学习模型分别对所述样本数据进行训练。

系统在接收到用户在所述操作界面上选择的待训练的机器学习模型后,将这些待训练的机器学习模型分别对所述样本数据进行训练。

本实施例的方案,使用户在系统根据当前样本数据确定的对应的机器学习模型中,可以自行选择哪个或哪几个机器学习模型对样本数据进行训练。

另外,在其它实施例中,还可在步骤s32之前,增加实现用户可在操作界面上自行添加机器学习模型的步骤,以使专业的研发人员可根据自己的计划增加更多的机器学习模型进行样本训练。

如图3所示,为本发明多模型样本训练方法三实施例的流程示意图,本实施例基于二实施例,在本实施例中,所述步骤s32包括:

步骤s321,在接收到用户基于所述操作界面选择的待训练的机器学习模型后,在操作界面上显示各个待训练的机器学习模型的参数设置界面;

系统在接收到用户选择的待训练的机器学习模型后,在操作界面上弹出各个待训练机器学习模型的参数设置界面,以供用户对各个待训练机器学习模型的参数进行调节;对于模型训练方面的资深用户来说,用户可根据自己的经验在参数设置界面上自行调整相应参数;当然,各个机器学习模型都有默认的参数,这些默认参数通常是能达到较好的训练效果,因此,对于对模型训练的初级用户,则可以不对参数设置界面中的参数进行调节,直接使用默认的参数。

步骤s322,在各个带训练的机器学习模型完成参数设置后,采用所述待训练的机器学习模型分别对所述样本数据进行训练。

当系统检测到各个待训练的机器学习模型完成参数设置(例如,所述操作界面上有“完成设置”控件,用户点击该“完成设置”控件,系统则确定到用户完成参数设置),系统则将各个待训练的机器学习模型分别对所述样本数据进行训练。

本实施例方案,通过在用户选择待训练的机器学习模型后,对应弹出各个待训练机器学习模型的参数设置界面,可供比较专业的用户可根据自己的经验自行对调节较佳的参数,并且对于不太专业的用户来说,则可以直接使用机器学习模型默认的参数,无需进行参数调节;这样更加的符合不同专业级别的用户的使用需求。

此外,本发明还提出一种多模型样本训练系统。

请参阅图4,是本发明多模型样本训练系统10较佳实施例的运行环境示意图。

在本实施例中,多模型样本训练系统10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括,但不仅限于,存储器11、处理器12及显示器13。图4仅示出了具有组件11-13的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

存储器11在一些实施例中可以是电子装置1的内部存储单元,例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据,例如多模型样本训练系统10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行多模型样本训练系统10等。

显示器13在一些实施例中可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面,例如业务定制界面等。电子装置1的部件11-13通过系统总线相互通信。

请参阅图5,是本发明多模型样本训练系统10一实施例的程序模块图。在本实施例中,多模型样本训练系统10可以被分割成一个或多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明。例如,在图5中,多模型样本训练系统10可以被分割成第一确定模块101、第二确定模块102、第一训练模块103及分析模块104。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述多模型样本训练系统10在电子装置1中的执行过程,其中:

第一确定模块101,用于接收用户上传的样本数据,确定所述样本数据的数据属性,所述数据属性包括类型和数量;

当用户上传样本数据后,系统接收该样本数据对其数据属性进行分析,以确定该样本数据的类型及数量。其中,样本数据的类型主要包括图像数据及预测连续数值的数据(例如股市行情),另外,图像数据也可能为预测连续数值的数据(例如,人脸姿态校正的视频是时间序列的图像数据)。

第二确定模块102,用于根据预先确定的机器学习模型与样本数据的数据属性的映射关系,确定所述样本数据的数据属性对应的机器学习模型;

系统中具有各种机器学习模型,其中包括传统机器学习模型:随机森林、svm、朴素贝叶斯、knn、gbdt、xgboost、lr等,以及深度学习模型:lenet、alexnet、vggnet、resnet、inception-v1、inception-resnet、sgd、fast-rcnn等。系统中预先设置了机器学习模型与样本数据的数据属性的映射关系,即针对样本数据的不同数据属性(即不同类型及/或不同数量),系统中均设置了相应的适合且训练效果较好的机器学习模型与之关联对应。例如,在所述样本数据的类型为图像数据且数量大于a(例如10000张)时,确定与该样本数据的样本属性(类型和数量)相对应的为一个或多个卷积神经网络(cnn)模型(各个卷积神经网络模型为层数不同);在所述样本数据的类型为图像数据且数量不超过a(例如10000张)时,确定与该样本数据的样本属性(类型和数量)相对应的为支持向量机(svm)模型(或还包括其它多个类型的模型);在所述样本数据的类型为预测连续数值的数据时,确定对应的模型为选择回归模型或者更多其它类型模型。因此,当确定了接收到的样本数据的类型和数量后,则根据系统中的预先确定的机器学习模型与样本数据的数据属性的映射关系,确定当前样本数据对应的合适且训练效果好的一个或多个机器学习模型。

第一训练模块103,用于将所述确定的机器学习模型分别对所述样本数据进行训练;

系统在确定机器学习模型后,将确定的各个机器学习模型分别对该样本数据进行训练,系统在确定的各个机器学习模型训练完成后,得到各个机器学习模型的训练结果。

分析模块104,用于分析训练完成后得到的各个机器学习模型的训练结果,将符合预设条件的训练结果在显示界面上展示。

本实施例中,所述训练结果包括训练完成后的机器学习模型的准确率和损失函数曲线;所述预设条件优选为:准确率大于预设值(例如95%),或准确率降序排名的前预设名(例如前3名);当然,在其它实施例中,所述预设条件还可为其它方案。系统在得到各个机器学习模型的训练结果后,根据所述预设条件筛选训练结果,将筛选后得到的训练结果在显示界面上展示,以将较佳的训练结果展示给用户看,用户则可根据挑选训练结果最优的机器学习模型进行使用。

本实施例技术方案,在系统中预先设置机器学习模型与样本数据的数据属性的映射关系,当接收到用户上传的样本数据后,先对样本数据的数据属性进行分析确定,在根据系统中机器学习模型与样本数据的数据属性的映射关系,确定出针对当前样本数据训练效果较佳的机器学习模型(可能是一个,也可能是多个),将确定的机器学习模型分别对该样本数据进行训练,训练完成后,将各个机器学习模型的训练结果中,符合预设条件的训练结果在显示界面上进行展示,以供用户查看并挑选最佳的机器学习模型。即本方案采用系统根据用户上传的样本数据自动确定合适且训练效果好的一个或多个机器学习模型,对样本数据进行训练,并在训练结束后将较好的训练结果展示给用户,让用户可以一次性准确的挑选到最佳的模型,且整个过程无需花费;与现有技术的用户自行选择模型对样本数据训练的方式相比,本方案避免了经验不足的用户由于模型的选择错误而导致训练结果很差的情况发生,解决了用户花费太多时间重复训练模型而对工作进度的影响的问题。

参阅图6,本实施例多模型样本训练系统,将所述第一训练模块103替换为第二训练模块105,该第二训练模块包括:

展示子模块1051,用于将所述确定的机器学习模型在操作界面上展示,以供用户选择待训练的机器学习模型;

系统在确定当前样本数据对应的机器学习模型后,将确定的机器学习模型展示在一个操作界面上,以供用户在操作界面上选择待训练的机器学习模型,用户可以在所述操作界面上只选择一个机器学习模型待训练,也可以选择多个或全部机器学习模型待训练。

训练子模块1052,用于在接收到用户基于所述操作界面选择的待训练的机器学习模型后,将所述待训练的机器学习模型分别对所述样本数据进行训练。

系统在接收到用户在所述操作界面上选择的待训练的机器学习模型后,将这些待训练的机器学习模型分别对所述样本数据进行训练。

本实施例的方案,使用户在系统根据当前样本数据确定的对应的机器学习模型中,可以自行选择哪个或哪几个机器学习模型对样本数据进行训练。

另外,在其它实施例中,还可在增加用于添加机器学习模型的程序模块,以实现用户可在操作界面上自行添加机器学习模型的步骤,使专业的研发人员可根据自己的计划增加更多的机器学习模型进行样本训练。

进一步地,本实施例中,所述训练子模块1052包括:

显示单元,用于用于在接收到用户基于所述操作界面选择的待训练的机器学习模型后,在操作界面上显示各个待训练的机器学习模型的参数设置界面;

系统在接收到用户选择的待训练的机器学习模型后,在操作界面上弹出各个待训练机器学习模型的参数设置界面,以供用户对各个待训练机器学习模型的参数进行调节;对于模型训练方面的资深用户来说,用户可根据自己的经验在参数设置界面上自行调整相应参数;当然,各个机器学习模型都有默认的参数,这些默认参数通常是能达到较好的训练效果,因此,对于对模型训练的初级用户,则可以不对参数设置界面中的参数进行调节,直接使用默认的参数。

训练单元,用于在各个带训练的机器学习模型完成参数设置后,采用所述待训练的机器学习模型分别对所述样本数据进行训练。

当系统检测到各个待训练的机器学习模型完成参数设置(例如,所述操作界面上有“完成设置”控件,用户点击该“完成设置”控件,系统则确定到用户完成参数设置),系统则将各个待训练的机器学习模型分别对所述样本数据进行训练。

本实施例方案,通过在用户选择待训练的机器学习模型后,对应弹出各个待训练机器学习模型的参数设置界面,可供比较专业的用户可根据自己的经验自行对调节较佳的参数,并且对于不太专业的用户来说,则可以直接使用机器学习模型默认的参数,无需进行参数调节;这样更加的符合不同专业级别的用户的使用需求。

进一步地,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有多模型样本训练系统,所述多模型样本训练系统可被至少一个处理器执行,以使所述至少一个处理器执行上述任一实施例中的多模型样本训练方法。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1