组件发布及基于图形化机器学习算法平台的组件构建方法、图形化机器学习算法平台与流程

文档序号：14940694发布日期：2018-07-13 20:39阅读：281来源：国知局

本申请涉及电子信息领域，尤其涉及一种组件发布及基于图形化机器学习算法平台的组件构建方法、图形化机器学习算法平台。

背景技术：

图形化机器学习算法平台为一种用户交互性平台，能够向用户提供建模功能，组件是图形化机器学习算法平台的基本单位。用户将组件组成有序的流程，从而建立具有一定功能的模型。例如，图1所示为用户建立的一个分析用户流失数据功能的模型，其中，椭圆形图标表示组件，椭圆形图标的名称例如拆分-1以及随机森林等表示组件运行的算法。用户将这些组件使用箭头连接组成有序的流程，即建立起一个分析用户流失数据的模型。

然而，如果用户需要再次使用该功能，还需要重新建立该功能模型。

技术实现要素：

申请人在研究的过程中发现，如果能将建立的功能模型在图形化机器学习算法平台发布或构建为新组件，则再次需要该功能的情况下，可以直接选择该新组件，而无需重复建立该功能模型。

本申请提供了一种组件发布方法及基于图形化机器学习算法平台的组件构建方法、图形化机器学习算法平台，目的在于解决如何在图形化机器学习算法平台发布或构建新组件的问题。

为了实现上述目的，本申请提供了以下技术方案：

一种组件发布方法，包括：

在接收到将功能模型发布为新组件的指令后，依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端；

确定所述功能模型中的组件的必选参数的唯一标识，所述唯一标识用于所述新组件在运行过程中识别所述必选参数的值；

将所述功能模型发布为所述新组件。

可选的，所述确定所述功能模型中组件的必选参数的唯一标识包括：

在接收到选择所述功能模型中的组件的指令后，显示该组件的可视化界面；

通过所述可视化界面接收所述组件的必选参数的唯一标识。

可选的，所述可视化界面包括：

所述该组件的必选参数配置控件的配置界面，所述必选参数配置控件用于在所述新组件运行的过程中，接收对所述必选参数的配置指令。

可选的，所述可视化界面还包括：

可选参数配置控件的配置界面，所述可选参数配置控件用于在所述新组件运行的过程中，接收对所述可选参数的配置指令。

可选的，所述将所述功能模型发布为所述新组件包括：

向所述新组件输入测试数据，并运行所述新组件；

向所述功能模型输入所述测试数据，并运行所述功能模型；

如果所述新组件在运行后输出的数据与所述功能模型在运行后输出的数据相同，则将所述功能模型发布为所述新组件。

一种基于图形化机器学习平台的组件创建方法，包括：

图形化机器学习平台在接收到新组件创建指令后，依据已建立的功能模型创建新组件，所述新组件中的各个组件的必选参数具有唯一标示，所述唯一标识用于所述新组件在运行过程中识别所述必选参数的值。

可选的，所述依据已建立的功能模型创建新组件包括：

确定所述功能模型中的组件的必选参数的唯一标识，并依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端，以创建所述新组件。

一种图形化机器学习算法平台，包括：

输入输出确定模块，用于在接收到将功能模型发布为新组件的指令后，依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端；

标识确定模块，用于确定所述功能模型中的组件的必选参数的唯一标识，所述唯一标识用于所述新组件在运行过程中识别所述必选参数的值；

发布模块，用于将所述功能模型发布为所述新组件。

可选的，所述标识确定模块用于确定所述功能模型中组件的必选参数的唯一标识包括：

所述标识确定模块具体用于，在接收到选择所述功能模型中的组件的指令后，显示该组件的可视化界面；并通过所述可视化界面接收所述组件的必选参数的唯一标识。

可选的，所述标识确定模块用于显示该组件的可视化界面包括：

所述标识确定模块具体用于，显示所述该组件的必选参数配置控件的配置界面，所述必选参数配置控件用于在所述新组件运行的过程中，接收对所述必选参数的配置指令。

可选的，所述可视化界面还包括：

可选参数配置控件的配置界面，所述可选参数配置控件用于在所述新组件运行的过程中，接收对所述可选参数的配置指令。

可选的，所述发布模块用于将所述功能模型发布为所述新组件包括：

所述发布模块具体用于，向所述新组件输入测试数据，并运行所述新组件；向所述功能模型输入所述测试数据，并运行所述功能模型；如果所述新组件在运行后输出的数据与所述功能模型在运行后输出的数据相同，则将所述功能模型发布为所述新组件。

一种图形化机器学习算法平台，包括：

组件创建模块，用于在接收到新组件创建指令后，依据已建立的功能模型创建新组件，所述新组件中的各个组件的必选参数具有唯一标示，所述唯一标识用于所述新组件在运行过程中识别所述必选参数的值。

可选的，所述组件创建模块用于依据已建立的功能模型创建新组件包括：

所述组件创建模块具体用于，确定所述功能模型中的组件的必选参数的唯一标识，并依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端，以创建所述新组件。

本申请所述的方法及图形化机器学习算法平台，通过将功能模型发布或构建为新组件，在用户需要重复使用某一项功能的情况下，可以直接使用新的组件，而无需再重复建立功能模型，从而方便用户的使用。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为用户建立的一个分析用户流失数据功能的模型的示意图；

图2为本申请实施例公开的一种组件发布方法的流程图；

图3为本申请实施例公开的图形化机器学习算法平台接收将功能模型发布为新组件的指令的示意图；

图4为本申请实施例公开的超级组件的配置过程与运行过程的对照示意图；

图5为本申请实施例公开的基础组件的可视化界面的示意图；

图6为本申请实施例公开的必选参数配置控件的配置界面的示意图；

图7为本申请实施例公开的组件发布方法的流程示例图；

图8为本申请实施例公开的超级组件的使用示意图；

图9为本申请实施例公开的图形化机器学习算法平台的结构示意图。

具体实施方式

本申请提供的一种组件发布或构建方法，可以应用在图形化机器学习算法平台，目的在于，将由图形化机器学习算法平台原有的组件构建的功能模型，发布或构建为新的组件。为了便于区分，本申请的实施例中，将图形化机器学习算法平台原有的组件称为基础组件，将由基础组件发布或构建而成的新组件称为超级组件。其中，基础组件可以为实现单一算法的组件，也可以为由多个实现单一算法的组件组合而成的组件。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图2为本申请实施例公开的一种组件发布方法，包括以下步骤：

s201：图形化机器学习算法平台基于用户的操作指令，得到待构建为超级组件的功能模型。

s201的具体实现方式可以参见现有技术，这里不再赘述。

s202：图形化机器学习算法平台接收将功能模型发布为新组件的指令。

举例说明，图3所示为用户在图形化机器学习算法平台已经建立好的流程，框选部分为待构建为超级组件的功能模型。用户可以在功能模型上点击右键，在弹出的菜单中选择“合并”，则图形化机器学习算法平台确定接收到将框选部分的功能模型发布为新组件的指令。

进一步的，如图3所示，图形化机器学习算法平台还可以接收用户为超级组件输入的名称。例如，在用户选择“合并”后，图形化机器学习算法平台弹出对话框，并接收用户在对话框中输入的名称“逻辑回归&随机森林评估”。

s203：图形化机器学习算法平台依据功能模型中组件的连接关系，确定超级组件的输入端和输出端。

具体的，连接关系为功能模型中的箭头指示的连接关系，图形化机器学习算法平台将功能模型与上游组件的连接端作为超级组件的输入端，将功能模型与下游组件的连接端作为超级组件的输出端。

接上例，图3中，功能模型与上游组件的连接端为组件“缺失值填充-1”箭头指向的端口，图形化机器学习算法平台将该端口作为超级组件的输入端。功能模型与下游组件的连接端分别为组件“二分类评估-1”和组件“二分类评估-2”连接箭头的端口，图形化机器学习算法平台将这两个端口作为超级组件的输出端。

需要说明的是，在功能模型有多个与上游组件连接的端口的情况下，将这多个与上游组件连接的端口均作为超级组件的输入端。在功能模型有多个与下游组件连接的端口的情况下，将这多个与下游组件连接的端口均作为超级组件的输出端。

s204：图形化机器学习算法平台确定所述功能模型中的组件的必选参数的唯一标识。

唯一标识用于所述新组件在运行过程中识别必选参数的值。

具体的，图形化机器学习算法平台在接收到选择功能模型中的组件的指令后，显示该组件的可视化界面，并通过可视化界面接收该组件的必选参数的唯一标识。举例说明，如图4中的配置过程所示，在接收到用户双击功能模型中的组件“随机森林”的指令后，图形化机器学习算法平台弹出组件“随机森林”的可视化界面，用户可以在该可视化界面上输入组件“随机森林”的必选参数的唯一标识。

进一步的，如图5所示，基础组件的可视化界面包括必选参数配置控件的配置界面以及可选参数的配置控件的配置界面(图4中未画出可选参数的配置控件的配置界面)。其中，必选参数配置控件用于在超级组件运行的过程中，接收对必选参数的配置指令。可选参数配置控件用于在超级组件运行的过程中，接收对可选参数的配置指令。如图4所示，在超级组件运行的过程中，用户通过必选参数配置控件对必选参数进行配置，例如，输入必选参数的数值。图4中的必选参数配置控件的配置界面正是用于对必选参数配置控件进行配置。而现有的图形化机器学习算法平台，参数配置控件均为系统自动设置，用户无法进行配置。

如图6所示，必选参数配置控件的配置界面至少包括唯一标识配置项，唯一标识配置项用于接收用户为该必选参数设置的标识。用户可以通过该标识配置项输入为该必选参数设置的标识，则图形化机器学习算法平台将此超级组件识别(包括接收或者内部传递)带有该标识的数据作为该必选参数的值。换句话说，只要运行此超级组件时识别到带有该标识的数据，则图形化机器学习算法平台将数据作为该必选参数的值。无论超级组件中的哪个基础组件识别到此数据，均作为该必选参数的值。除了唯一标识配置项之外，必选参数配置控件的配置界面还可以包括但不限于：控件类型配置项、控件名称配置项以及控件提示(包括提示和长提示)文本配置项。

举例说明，图6为必选参数“训练特征列”的配置项，包括：

控件类型，图6中，用户通过下来选项选择控件类型为“多字段选择控件(下游继承所有字段)”。

唯一标识，图6中用户输入“$feature”作为“训练特征列”参数的唯一标识。

控件名称，图6中用户输入“训练特征列”作为控件的名称。

提示文本，图6中用户输入“必选”作为控件的提示文本。

长提示文本，图6中长提示文本为空。

可选参数配置控件的配置界面包括该可选参数的名称以及图形化机器学习算法平台为该参数设置的默认值，比如图5中的“并发计算量”是一个可选参数的名称，该参数默认值为100。用户可以采纳默认值，也可以在参数栏中对默认值进行修改。

s205：对完成配置后的超级组件输入测试数据，并将相同的测试数据输入超级组件对应的功能模型(即构建此超级组件的功能模型)，如果超级组件的输出结果与功能模型的输出结果相同，则执行s206，否则，执行s203～s204的至少一项。

s206：发布超级组件。

图2中，s202～s204的顺序可以互换，s205为可选步骤。

下面对图2所示的流程进行举例说明：

如图7所示，用户在图形化机器学习算法平台上将基础组件拖拽到画布上，并使用箭头将基础组件组成流程。用户从流程中框选一部分，并且，用户还可以点击右键，在弹出的菜单中选择“合并”项，合并框选的组件，称为建模流程子集，并输入名称“逻辑回归&随机森林评估”。

图形化机器学习算法平台将建模流程子集的起始基础组件“缺失值填充-1”连接上有组件的端口作为超级组件“逻辑回归&随机森林评估”的输入端，将建模流程子集的末端基础组件“二分类评估-1”和“二分类评估-2”连接下游组件的端口作为超级组件“逻辑回归&随机森林评估”的输出端。

用户点击建模流程子集中的基础组件“随机森林”，图形化机器学习算法平台响应用户的点击指令，弹出图5所示的可视化界面。

用户在可视化界面上完成对参数配置控件的配置。

图形化机器学习算法平台接收用户对于完成设置的超级组件的输入参数，运行超级组件，得到超级组件的输出数据。

图形化机器学习算法平台接收用户对于建模流程子集的输入参数，运行建模流程子集，得到建模流程子集的输出数据。

如果超级组件的输出数据和建模流程子集的输出数据相同，则图形化机器学习算法平台发布超级组件。

至此，图形化机器学习算法平台发布了新的超级组件，用户如果需要建模流程子集的功能，无需再搭建一次建模流程子集，而直接使用超级组件即可。

超级组件的使用方式与基础组件的使用方式相同，如图8所示的超级组件使用过程：用户在图形化机器学习算法平台将超级组件“逻辑回归&随机森林评估”拖拽到画布上，与其它基础组件和/或超级组件构建流程。

若用户点击“逻辑回归&随机森林评估”超级组件，如图4所示，图形化机器学习算法平台弹出参数配置控件，例如“训练特征列配置控件”。用户在“训练特征列配置控件”中选择字段，以输入作为训练特征列的数据。用户配置好各个参数的数据后，在超级组件的运行过程中，从输入端输入数据并传递，这些数据中包括超级组件中的每个组件的必选参数的数值，各个组件从这些数据中识别出哪些数据是自己需要的，识别的依据就是在组件的发布过程中为必选参数设定的唯一标识。

另外，在超级组件的运行过程中，图形化机器学习算法平台依据超级组件中的箭头方向建立mysql临时表，用于记录每一个基础组件的输入组件和输出组件，以向每一个基础组件传递其各自的输入组件和输出组件的信息。mysql临时表的内容为组件的四要素:输入，输出，字段设置，参数设置，当箭头所指向的组件被运行时，会从mysql表中提取四要素。在超级组件结束运行后，图形化机器学习算法平台清除mysql表。

从上述说明可以看出，图2所示的组件发布过程，通过对功能模型中的基础组件的参数配置控件的配置，为基础组件的必选参数设置唯一标识，使得必选参数具备了“全局参数”的性质，即在超级组件运行过程中，超级组件中的基础组件能够识别哪些数据为自身需要的必选参数的值。因此，图2发布的超级组件能够被重复使用，方便用户的使用。

本申请实施例还公开了一种基于图形化机器学习平台的组件创建方法，包括以下步骤：

本实施例中，依据已建立的功能模型创建新组件的具体方式为：确定所述功能模型中的组件的必选参数的唯一标识，并依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端，以创建所述新组件。每一步骤具体的实现过程可以参见图2。

在创建新组件后，图形化机器学习平台可以依据用户的指令，发布新组件。

可见，本实施例中，图形化机器学习平台具备了创建新组件的功能。

图9为本申请实施例公开的图形化机器学习算法平台，包括：输入输出确定模块、标识确定模块和发布模块。

其中，输入输出确定模块用于在接收到将功能模型发布为新组件的指令后，依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端。标识确定模块用于确定所述功能模型中的组件的必选参数的唯一标识，所述唯一标识用于所述新组件在运行过程中识别所述必选参数的值。发布模块用于将所述功能模型发布为所述新组件。

各个模块具体的功能实现过程可以参见图2，这里不再赘述。

本实施例所述的图形化机器学习算法平台，具有将功能模型发布为新组件的功能，因此能够方便用户的使用。

本申请实施例还公开了一种图形化机器学习算法平台，包括组件创建模块，用于在接收到新组件创建指令后，依据已建立的功能模型创建新组件，所述新组件中的各个组件的必选参数具有唯一标示，所述唯一标识用于所述新组件在运行过程中识别所述必选参数的值。其中，依据已建立的功能模型创建新组件的具体实现方式为：确定所述功能模型中的组件的必选参数的唯一标识，并依据所述功能模型中组件的连接关系，确定所述新组件的输入端和输出端，以创建所述新组件。

可见，本实施例所述的图形化机器学习算法平台，具有创建新组件的功能。

本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算设备可读取存储介质中。基于这样的理解，本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算设备(可以是个人计算机，服务器，移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：雷宗雄;李博
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种树形结构图像算法的处理方法及系统与流程
上一篇：时钟树代码生成方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。