基于深度学习平台的模型训练方法、数据处理方法和装置与流程

文档序号：33115327发布日期：2023-02-01 02:47阅读：48来源：国知局

1.本公开涉及人工智能技术领域，尤其涉及深度学习技术领域和分布式计算技术领域。更具体地，本公开提供了一种深度学习平台的模型训练方法、数据处理方法、装置、电子设备和存储介质。

背景技术：

2.随着人工智能技术的发展，深度学习技术的应用场景不断增加。通过编写代码的方式，开发人员可以将深度学习平台应用于多种场景。

技术实现要素：

3.本公开提供了一种深度学习平台的模型训练方法、数据处理方法、装置、电子设备和存储介质。
4.根据本公开的一方面，提供了一种基于深度学习平台的模型训练方法，该方法包括：深度学习平台包括多个应用套件，多个应用套件包括核心框架，核心框架包括多个预设处理单元，方法包括：响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件；响应于接收到来自目标对象的第二操作信息，根据多个预设处理单元，确定至少一个目标处理单元，其中，第二操作信息与目标应用套件相关；根据至少一个目标处理单元，得到目标深度学习模型；将来自目标对象的样本数据输入目标深度学习模型，得到输出结果；以及根据输出结果，训练目标深度学习模型。
5.根据本公开的另一方面，提供了一种基于深度学习平台的数据处理方法，该方法包括：将来自目标对象的目标数据输入深度学习模型，得到目标输出结果，其中，深度学习模型部署于至少一个目标设备，目标设备与深度学习平台相关，深度学习模型是利用本公开提供的方法训练的。
6.根据本公开的另一方面，提供了一种基于深度学习平台的模型训练装置，该装置包括：深度学习平台包括多个应用套件，多个应用套件包括核心框架，核心框架包括多个预设处理单元，装置包括：第一确定模块，用于响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件；第二确定模块，用于响应于接收到来自目标对象的第二操作信息，根据多个预设处理单元，确定至少一个目标处理单元，其中，第二操作信息与目标应用套件相关；第一获得模块，用于根据至少一个目标处理单元，得到目标深度学习模型；第二获得模块，用于将来自目标对象的样本数据输入目标深度学习模型，得到输出结果；以及训练模块，用于根据输出结果，训练目标深度学习模型。
7.根据本公开的另一方面，提供了一种基于深度学习平台的数据处理装置，该装置包括：第三获得模块，用于将来自目标对象的目标数据输入深度学习模型，得到目标输出结果，其中，深度学习模型部署于至少一个目标设备，目标设备与深度学习平台相关，深度学习模型是利用本公开提供的装置训练的。
8.根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与至
少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开提供的方法。
9.根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。
10.根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现根据本公开提供的方法。
11.应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.附图用于更好地理解本方案，不构成对本公开的限定。其中：
13.图1是根据本公开一个实施例的深度学习平台的示例性系统架构示意图；
14.图2是根据本公开的一个实施例的基于深度学习平台的模型训练方法的流程图；
15.图3a是根据本公开的一个实施例的基于深度学习平台的模型训练和推理的流程图；
16.图3b是根据本公开的一个实施例的第一控件和第二控件的示意图；
17.图3c是根据本公开的一个实施例的核心框架的示意图；
18.图4是根据本公开的另一个实施例的基于深度学习平台的数据处理方法的流程图；
19.图5是根据本公开的一个实施例的基于深度学习平台的模型训练装置的框图；
20.图6是根据本公开的另一个实施例的基于深度学习平台的数据处理装置的框图；以及
21.图7是根据本公开的一个实施例的可以应用基于深度学习平台的模型训练方法和/或基于深度学习平台的数据处理方法的电子设备的框图。
具体实施方式
22.以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
23.近年来，深度学习技术已经在各行各业取得了巨大的成功。然而，使用深度学习技术需要掌握一定的数学知识和编程技能，这对不同行业、不同技术背景的开发人员提出了巨大的挑战。
24.例如，一些开发人员具备人工智能算法的研发能力，有一定的科研创新需求。这类开发人员通常来自于具备人工智能技术沉淀的大型机构，拥有研发最新模型算法的能力。这些开发人员对开发框架或平台的灵活性要求较高，可以使用平台核心架构进行自主研发，可以完成模型自研和技术创新的工作。
25.例如，一些开发人员具备编程能力和人工智能应用研发能力，可以使用成熟的算法进行应用开发。这类开发人员可以将业务场景的问题拆解成人工智能模型的应用方案。
他们希望可以模块化地复用高性能的模型，或者基于已有模型代码进行二次研发，构建更加贴合实际业务的解决方案。
26.例如，一些开发人员具备编程能力，但无人工智能开发经验，通常是传统的软件研发团队。这类开发人员具有编程能力，例如掌握python、c++等编程语言。这类开发人员可以使用熟悉的编程语言复用经过产业实践的方案，也可以使用少量代码高效地解决业务难题。
27.例如，一些开发人员无编程能力，也无人工智能开发经验，通常是业务人员。这些开发人员追求极高开发效率。他们希望零代码应用人工智能技术，也希望能够尽可能降低人工智能学习成本，以便专注于业务本身，解决业务难点。
28.现有的深度学习框架或者平台功能单一。例如，一些深度学习框架产品只提供了深度学习框架，这要求开发人员有一定的编程知识积累和较为丰富的人工智能开发经验。
29.图1是根据本公开一个实施例的深度学习平台的示例性系统架构示意图。需要注意的是，图1所示仅为可以应用本公开实施例的系统架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
30.如图1所示，根据该实施例的深度学习平台100可以包括多个应用套件。例如，多个应用套件可以包括核心框架(core framework)110。又例如，多个应用套件还可以包括算法套件(algorithm suites)120、场景套件(scene suite)130和可视界面(visual interface)140中的至少一个。
31.在本公开实施例中，核心框架可以包括多个预设处理单元。例如，多个预设处理单元可以包括二维卷积处理(conv2d)单元、线性处理(linear)单元、拼接处理(concat)单元等。核心框架可以提供数据处理、模型组网、模型训练和模型部署等基础技术能力。深度学习平台的用户也可以基于核心框架自行开发处理单元，也可以调用预设处理单元完成期望的模型开发任务。在一个示例中，核心框架也可以被称为代码库。处理单元可以为代码库中的一段代码。在一个示例中，二维卷积处理单元可以实现为深度学习模型中的一个二维卷积层。可以理解，核心框架也可以被称为核心框架套件。
32.在本公开实施例中，算法套件可以包括多个预设深度学习模块。预设深度学习模块可以与至少一个预设处理单元对应。例如，算法套件可以包括多个算法子套件。算法子套件包括至少一个预设深度学习模块。又例如，多个算法子套件可以包括分类算法子套件和检测算法子套件。分类算法子套件可以包括轻量级中央处理器网络(lightweight cpu network，lcnet)模块。检测算法子套件可以包括微检测模块(picodet)。通过算法套件，深度学习平台的用户可以调用主流的模型或者深度学习平台提供的模型，以便将模型应用于具体的业务场景。在一个示例中，算法套件也可以被称为模型库。预设深度学习模块可以是由核心框架中的至少一个预设处理单元实现的。可以理解，预设深度学习模块与大量的代码对应，可以实现为深度学习模型。
33.在本公开实施例中，场景套件可以包括至少一个场景子套件。场景子套件可以对应多个深度学习模块。例如，至少一个场景子套件可以包括计算机视觉场景子套件、自然语言处理场景子套件和语音识别场景子套件等。计算机视觉场景子套件可以与分类算法子套件和检测算法子套件对应。由此，计算机视觉场景子套件可以与轻量级中央处理器网络模
块对应，也可以与微检测模块对应。可以理解，场景套件在算法套件的基础上进行了封装处理，使得相关深度学习模块的应用更加简单，用户使用简单的应用程序编码接口(application programming interface，api)即可完成模型的训练和部署。
34.在本公开实施例中，可视界面展示有第一控件和第二控件，第一控件与一个场景子套件对应，第二控件与一个预设深度学习模块对应。例如，一个第一控件可以与计算机视觉场景子套件对应。一个第一控件可以与自然语言处理场景子套件对应。又例如，一个第二控件可以与轻量级中央处理器网络模块对应。可以理解，可视化界面套件的使用门槛较低，用户通过点选可视界面中的控件，既可完成模型的训练或部署等开发流程。
35.通过本公开实施例，深度学习平台提供了不同类型的应用套件，适用于不同类型的用户。此外，多个应用套件之间相互兼容、层层递减。用户可以基于自身编程能力，选择所需套件。此外，用户可以不断地熟悉并掌握深度学习技术的开发方式，不断提升自身编程能力，有助于降低相关机构培养开发人员的成本。此外，随着用户开发能力的提升，用户可以使用其他的应用套件。
36.可以理解，上文对本公开的深度学习平台进行了描述，下面将结合相关实施例对基于深度学习平台的模型训练方法进行说明。
37.图2是根据本公开的一个实施例的基于深度学习平台的模型训练方法的流程图。
38.如图2所示，该方法200可以包括操作s210至操作s250。
39.在操作s210，响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件。
40.在本公开实施例中，目标对象可以是深度学习平台的用户。例如，目标对象可以是上述的深度学习平台100的用户。
41.在本公开实施例中，第一操作信息可以实现为各种形式。例如，第一操作信息可以实现为大量代码。这些代码可以调用多个应用程序编码接口。
42.在本公开实施例中，第一操作信息可以指示用户选择或触发的应用套件。根据第一操作信息，可以将用户选择或触发的应用套件作为目标应用套件。例如，若确定用户选择的应用套件为核心框架，可以将核心框架作为目标应用套件。
43.在操作s220，响应于接收到来自目标对象的第二操作信息，根据多个预设处理单元，确定至少一个目标处理单元。
44.在本公开实施例中，第二操作信息与目标应用套件相关。
45.在本公开实施例中，第二操作信息可以实现为各种信息。例如，第二操作信息可以实现为大量的代码。这些代码用于调用至少一个预设处理单元。可以将被调用的预设处理单元作为目标处理单元。
46.在操作s230，根据至少一个目标处理单元，得到目标深度学习模型。
47.例如，可以继续接收来自用户的模型结构信息。按照模型结构信息，将多个目标处理单元按照用户指定的数量和顺序级联，得到一个目标深度学习模型。
48.在操作s240，将来自目标对象的样本数据输入目标深度学习模型，得到输出结果。
49.例如，用户可以将样本图像数据上传至深度学习平台。在获得目标深度学习模型之后，可以将样本图像数据输入目标深度学习模型，得到图像的类别，作为输出结果。在一个示例中，样本图像数据可以为一个海鸟的图像。图像类别可以为动物图像。
50.在操作s250，根据输出结果，训练目标深度学习模型。
51.在本公开实施例中，基于有监督训练和无监督训练中的至少一种训练方法，可以根据输出结果，训练目标深度学习模型。例如，用户也可以将样本图像数据的标签上传至深度学习平台。基于此，可以基于有监督的训练方式，根据输出结果和标签，训练目标深度学习模型。
52.通过本公开实施例，可以根据来自用户的操作信息，快速地调用一个或多个处理单元，进而可以快速地构建深度学习模型，有助于开发人员的工作量，提高了开发效率，提升了用户体验。此外，通过本公开实施例，可以降低编程能力和人工智能开发能力均较强的开发人员的工作量，有助于实现新的模型的快速搭建和部署。
53.此外，通过本公开实施例，基于核心框架，具有人工智能算法研发能力的用户可以快速地根据已有的处理单元搭建新的深度学习模型，也可以快速的建立新的处理单元以搭建新的深度学习模型。可以理解，核心框架组件提高了人工智能算法研发的灵活性，有助于提高模型研发效率。
54.可以理解，上文以目标应用套件为核心框架为示例，对本公开进行了说明。下面继续以目标应用套件为核心框架为示例，对本公开的方法进行进一步详细说明。
55.在一些实施例中，至少一个目标处理单元可以包括第一目标处理单元和第二目标处理单元中的至少一个。
56.在本公开实施例中，在上述的操作s220的一些实施方式中，根据多个预设处理单元，确定至少一个目标处理单元包括：根据第二操作信息，得到至少一个第一目标代码数据。根据第一目标代码数据，调整与第一目标代码数据对应的预设处理单元，得到第一目标处理单元。例如，第一目的代码数据可以与一个预设处理单元对应。又例如，第二操作信息可以实现为大量代码。这些代码中可以包括分别针对一个或多个预设处理单元的几行代码。将针对一个预设处理单元的几行代码作为一个第一目标代码数据。又例如，根据第一目标代码数据，可以对预设处理单元进行调整。调整后的预设处理单元可以作为第一目标处理单元。
57.在本公开实施例中，在上述的操作s220的另一些实施方式中，根据多个预设处理单元，确定至少一个目标处理单元还包括：根据第二操作信息，得到至少一个第二目标代码数据。根据第二目标代码数据，得到第二目标处理单元。例如，第二目标代码数据可以不与预设处理单元对应。又例如，根据第二目标代码数据，可以获得一个新的处理单元。该新的处理单元可以作为第二目标处理单元。
58.在本公开实施例中，在上述的操作s230的一些实施方式中，根据至少一个目标处理单元，得到目标深度学习模型包括：根据第一目标处理单元和第二目标处理单元中的至少一个，得到目标深度学习模型。例如，可以根据多个第一目标处理单元和多个预设处理单元，得到一个目标深度学习模型。又例如，也可以根据多个第二目标处理单元和多个预设处理单元，得到另一个目标深度学习模型。
59.在本公开实施例中，在上述的操作s250的一些实施方式中，核心框架支持两种网络编程范式：促进性能的静态图和优化调试的动态图。基于此，可以使用动态图进行程序调试，并转向使用静态图进行训练和部署。预设处理单元可以实现为高性能算子。核心框架可以涵盖深度学习框架的主要计算逻辑，如卷积(convolution)、全连接(full connection)
和激活(activation)。例如，为了优化框架性能和模型转换，基于图像中间表示技术，可以将目标深度学习模型转换为计算图。又例如，为了调度相关深度学习模型和更新相关参数，深度学习平台可以执行多线程调度，并在不同服务器芯片之间执行混合调度。又例如，基于异步数据读取技术，可以有效读取训练数据，也可以通过出色的数据读取技术和预处理技术来加速深度学习计算。
60.可以理解，上文以目标应用套件为核心框架为示例，对本公开进行了说明，但本公开不限于此。下面以目标应用套件为算法套件为示例，对本公开的方法进行进一步详细说明。
61.在本公开实施例中，在上述的操作s210的另一些实施方式中，响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件。例如，第一操作信息可以实现为多行代码，可以调用多个应用程序编码接口。可以理解，目标应用套件可以是用户选择的。用户选择算法套件所需的代码量可以少于选择核心框架所需的代码量。
62.在本公开实施例中，在上述的操作s220的另一些实施方式中，根据多个预设处理单元，确定至少一个目标处理单元包括：根据与第二操作信息相关的至少一个预设深度学习模块，从多个预设处理单元中确定至少一个目标处理单元。例如，算法套件中包括多个算法子套件。又例如，算法子套件可以包括至少一个预设深度学习模块。预设深度学习模块可以对应一个深度学习模型。例如，第二操作信息可以实现为多行代码。该多行代码可以用于调用至少一个深度学习模型。在一个示例中，该多行代码可以用于调用两个深度学习模型，这两个深度学习模型可以对应上述的轻量级中央处理器网络模块和上述的微检测模块。轻量级中央处理器网络模块可以与预设处理单元p1、预设处理单元p2和预设处理单元p3对应。微检测模块可以与预设处理单元p3、预设处理单元p4和预设处理单元p5对应。可以将预设处理单元p1、预设处理单元p2和预设处理单元p3分别作为与轻量级中央处理器网络模块对应的目标处理单元。可以将预设处理单元p3、预设处理单元p4和预设处理单元p5分别作为与微检测模块对应的目标处理单元。可以理解，预设深度学习模块可以与主流的深度学习模型对应。预设深度学习模块可以与主流的深度学习模型对应也可以与平台提供的兼具性能和效率的模型对应。也可以理解，预设深度学习模块对应多个预设处理单元的标识以及这些预设处理单元之间的关联关系。
63.在本公开实施例中，在上述的操作s230的一些实施方式中，根据至少一个目标处理单元，得到目标深度学习模型包括：根据至少一个目标处理单元，得到至少一个目标深度学习模型。例如，目标深度学习模型对应一个与第二操作信息相关的预设深度学习模块。例如，可以根据预设处理单元p1、预设处理单元p2和预设处理单元p3，得到一个目标深度学习模型。又例如，可以根据预设处理单元p3、预设处理单元p4和预设处理单元p5，得到一个目标深度学习模型。
64.接下来，在本公开实施例中，在上述的操作s240的一些实施方式中，将来自目标对象的样本数据输入目标深度学习模型，得到输出结果。例如，以样本图像数据为示例，样本数据的格式可以是深度学习平台支持的数据格式。在一个示例中，深度学习平台可以支持以下数据集的格式：上下文通用目标(common objects in context，coco)数据集、视觉对象类(visual object class，voc)、宽面(widerface)数据集、多目标追踪(multi object tracking，mot)数据集。用户可以参照这些数据的格式或者按照平台提供的数据格式文档
来提供样本数据。在一个示例中，可以接收来自用户的数据配置文件，根据数据配置文件中的数据路径来获取样本数据。接下来，可以将样本数据输入目标深度学习模型。
65.在本公开实施例中，在上述的操作s250的一些实施方式中，根据输出结果，可以训练目标深度学习模型。例如，在训练目标深度学习模型的过程中，可以使用深度学习平台中不同的预设优化策略。这些预设优化策略可以支持整个训练流程的优化。在一个示例中，响应于接收到的来自目标对象的训练配置文件，从训练配置文件中确定优化策略。
66.通过本公开实施例，用户可以通过算法套件调用一个或多个深度学习模型。这些深度学习模型可以是主流的深度学习模型，也可以是深度学习平台提供的兼具性能与准确率的深度学习模型。基于算法套件，具有编程能力且具有人工智能应用研发能力的用户可以快速地将深度学习模型应用于实际的业务场景。由此，通过本公开实施例，可以进一步降低将深度学习模型在业务场景中应用的门槛，有助于提高深度学习模型的进一步推广。此外，也在一定程度上降低了用户的使用深度学习平台的难度。
67.此外，通过本公开实施例，基于算法套件，用户可以获得模型应用过程中全链条的功能支持。例如，基于上述的操作s210至s230，可以实现模型选择。基于上述的操作s240和操作s250，可以实现模型训练环境的选择和模型训练。在完成对深度学习模型的训练之后，通过深度学习平台，用户还可以进行模型压缩策略的选择、部署工具的选择和部署环境的选择。深度学习平台提供的功能与将人工智能应用于工业实践的过程可以一致。
68.可以理解，上文以目标应用套件为算法套件为示例，对本公开进行了说明。下面以目标应用套件为场景套件为示例，对本公开的方法进行进一步详细说明。
69.在本公开实施例中，在上述的操作s210的另一些实施方式中，响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件。例如，第一操作信息可以实现为几行代码，可以调用多个应用程序编码接口。可以理解，目标应用套件可以是用户选择的。用户选择场景套件所需的代码量可以少于选择算法套件所需的代码量。
70.在本公开实施例中，在上述的操作s220的另一些实施方式中，根据多个预设处理单元，确定至少一个目标处理单元包括：根据第二操作信息和至少一个场景子套件，确定至少一个目标场景子套件。确定与至少一个目标场景子套件对应的i个预设深度学习模块。
71.例如，i为不小于1的整数。又例如，算法套件中包括多个算法子套件。场景子套件可以与至少一个算法子套件对应。由此，场景子套件可以对应至少一个深度学习模块。在一个示例中，计算机视觉场景子套件可以与分类算法子套件、检测算法子套件和分割算法子套件对应。计算机视觉场景子套件可以与这几个算法子套件包括的预设深度学习模块对应。
72.例如，第二操作信息可以实现为几行代码。这些代码可以用于调用至少一个算法子套件，以及调用每个算法子套件中的预设深度学习模块。在一个示例中，基于第二操作信息，可以调用分类算法子套件、检测算法子套件。分类算法子套件可以包括轻量级中央处理器网络模块和层级图网络(hierarchical graph network，hgnet)模块。检测算法子套件可以包括微检测模块和只看一次(you only look once，yolo)模块。可以将这些模块确定为与计算机视觉场景子套件对应的i个预设深度学习模块。可以理解，i可以为4。
73.此外，在本公开实施例中，根据多个预设处理单元，确定至少一个目标处理单元包括：响应于接收到来自目标对象的第三操作信息，从i个预设深度学习模块中确定j个目标
深度学习模块。从多个预设处理单元中，确定与j个目标深度学习模块各自对应的至少一个目标处理单元。
74.例如，第三操作信息也可以是几行代码。基于第三操作信息，可以调用分类算法子套件中的层级图网络(hierarchical graph network，hgnet)模块，也可以调用检测算法子套件中的只看一次模块。可以理解，j可以为2。
75.又例如，层级图网络模块可以与预设处理单元p6、预设处理单元p7和预设处理单元p8对应。微检测模块可以与预设处理单元p7、预设处理单元p9和预设处理单元p10对应。可以将预设处理单元p6、预设处理单元p7和预设处理单元p8分别作为与层级图网络模块对应的目标处理单元。可以将预设处理单元p7、预设处理单元p9和预设处理单元p10分别作为与只看一次模块对应的目标处理单元。
76.在本公开实施例中，在上述的操作s230的另一些实施例中，根据至少一个目标处理单元，得到目标深度学习模型包括：根据与j个目标深度学习模块各自对应的至少一个目标处理单元，得到j个目标深度学习模型。例如，根据预设处理单元p6、预设处理单元p7和预设处理单元p8，可以得到一个目标深度学习模块。又例如，根据预设处理单元p7、预设处理单元p9和预设处理单元p10，可以得到一个目标深度学习模型。
77.在本公开实施例中，在上述的操作s240的一些实施方式中，可以将样本数据分别输入j个目标深度学习模型，得到j个输出结果。
78.在本公开实施例中，在上述的操作s250的一些实施方式中，可以根据j个输出结果，分别训练j个目标深度学习模型。
79.通过本公开实施例，用户可以通过场景套件调用一个或多个算法子套件，再从算子套件中调用深度学习模型。基于场景套件，具有编程能力但人工智能应用研发能力较弱的用户可以快速地将深度学习模型应用于实际的业务场景。由此，通过本公开实施例，可以更进一步降低将深度学习模型在业务场景中应用的门槛，有助于提高深度学习模型的进一步推广。此外，也在很大程度上降低了用户的使用深度学习平台的难度。
80.可以理解，上文以目标应用套件为场景套件为示例，对本公开进行了说明。下面以目标应用套件为可视界面框架套件为示例，对本公开的方法进行进一步详细说明。
81.在本公开实施例中，在上述的操作s210的一些实施方式中，响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件。例如，第一操作信息可以实现为可视界面被启动的信号。可以理解，目标应用套件可以是用户选择的。用户可以启动与可视界面相关的图形化可视界面，以选择可视界面。
82.在本公开实施例中，在上述的操作s220的一些实施方式中，根据第二操作信息和多个预设处理单元，确定至少一个目标处理单元还包括：根据第二操作信息，确定与被触发的n个第一控件各自对应的n个场景子套件。例如，n个第一控件与m个第二控件对应。例如，n为不小于1的整数，m为不小于1的整数。例如，可视界面包括一个图形化可视界面。可视界面展示有多个第一控件。第一控件的数量可以与场景子套件的数量一致。例如，第二操作信息可以实现为第一控件被触发产生的信号。例如，n可以为1。在一个示例中，被触发的第一控件可以与计算机视觉场景子套件对应。计算机视觉场景子套件可以与分类算法子套件、检测算法子套件和分割算法子套件等对应。以每个算法子套件包括3个深度学习模块为示例，m个第二控件可以为9个第二控件。
83.在本公开实施例中，根据第二操作信息和多个预设处理单元，确定至少一个目标处理单元还可以包括：展示m个第二控件。响应于接收到来自目标对象的第四操作信息，确定与被触发的k个第二控件各自对应的k个预设深度学习模块。例如，k为不小于1且不大于m的整数。例如，第四操作信息可以实现为第二控件被触发产生的信号。又例如，k可以为2。在一个示例中，在可视界面上，可以触发两个第二控件，这两个第二控件可以分别与轻量级中央处理器网络模块和微检测模块对应。
84.在本公开实施例中，从多个预设处理单元中，确定与k个预设深度学习模块各自对应的至少一个目标处理单元。轻量级中央处理器网络模块可以与预设处理单元p1、预设处理单元p2和预设处理单元p3对应。微检测模块可以与预设处理单元p3、预设处理单元p4和预设处理单元p5对应。可以将预设处理单元p1、预设处理单元p2和预设处理单元p3作为与轻量级中央处理器网络模块对应的目标处理单元。可以将预设处理单元p3、预设处理单元p4和预设处理单元p5作为与微检测模块对应的目标处理单元。可以理解，预设深度学习模块可以与主流的深度学习模型对应。也可以理解，预设深度学习模块对应多个预设处理单元的标识以及这些预设处理单元之间的关联关系。
85.在本公开实施例中，在上述的操作s230的另一些实施方式中，根据至少一个目标处理单元，得到目标深度学习模型包括：根据与k个预设深度学习模块各自对应的至少一个目标处理单元，得到k个目标深度学习模型。例如，以k＝2为示例，可以根据预设处理单元p1、预设处理单元p2和预设处理单元p3，得到一个目标深度学习模型。可以根据预设处理单元p3、预设处理单元p4和预设处理单元p5，得到一个目标深度学习模型。
86.在本公开实施例中，在上述的操作s240的一些实施方式中，可以将样本数据分别输入k个目标深度学习模型，得到k个输出结果。
87.在本公开实施例中，在上述的操作s250的一些实施方式中，可以根据k个输出结果，分别训练k个目标深度学习模型。
88.通过本公开实施例，用户可以触发可视界面展示一个或多个第一控件，以调用场景子套件。用户也可以触发多个第二控件，以调用算法子套件中的预设深度学习模块。基于可视界面，编程能力较弱且人工智能应用研发能力较弱的用户可以快速地将深度学习模型应用于实际的业务场景。由此，通过本公开实施例，可以充分降低将深度学习模型在业务场景中应用的门槛，有助于提高深度学习模型的充分推广。此外，也充分降低了用户的使用深度学习平台的难度。
89.可以理解，上文以目标应用套件为可视界面为示例，对本公开进行了说明。下面将继续以目标应用套件为可视界面框架套件为示例，对本公开的方法进行进一步详细说明。
90.图3a是根据本公开的一个实施例的基于深度学习平台的模型训练和推理的流程图。
91.图3b是根据本公开的一个实施例的第一控件和第二控件的示意图。
92.图3c是根据本公开的一个实施例的核心框架的示意图。
93.如图3a所示，方法300可以包括操作s301至操作s303。
94.在操作s301，获取用户上传的样本数据和标签。
95.例如，样本数据可以是样本图像数据。样本数据的标签可以是人工确定的。样本数据的标签可以指示样本中对象的类别。
96.在操作s302，训练深度学习模型。
97.例如，在接收到用户启动图形化可视界面的信号后，可以在可视界面展示多个第一控件。又例如，可以展示与计算机视觉场景子套件对应的第一控件3411。也可以展示与自然语言处理场景子套件对应的第一控件。
98.如图3a所示，响应于检测到第一控件3411被触发，可以展示多个第二控件。例如，第一控件3411可以与计算机视觉场景子套件对应。又例如，第二控件3421可以与轻量级中央处理器网络模块对应。第二控件3423可以与微检测模块对应。第二控件3422可以与层级图网络模块对应。第二控件3424可以与只看一次模块对应。可以理解，第一控件310被触发产生的信号可以作为第二操作信息。
99.如图3a所示，响应于检测到第二控件321和第二控件323被触发，可以确定与第二控件321和第二控件323对应的多个预设深度学习模块。例如，可以确定与第二控件321对应的预设深度学习模块为轻量级中央处理器网络模块。可以确定与第二控件323对应的预设深度学习模块为微检测模块。
100.如图3b所示，可以将与轻量级中央处理器网络模块和微检测模块分别对应的预设处理单元，作为目标处理单元。例如，轻量级中央处理器网络模块和微检测模块至少可以与以下预设处理单元对应：二维卷积处理单元311、批量归一化处理(batchnorm)单元312、线性处理单元313、自适应平均池化处理(adaptive avg pooling)单元314、拼接处理单元315和挤压处理(squeeze)单元316。可以理解，图3b中核心框架还可以包括其他处理单元。
101.这些处理单元可以作为目标处理单元。根据这些处理单元，可以得到两个目标深度学习模型。接下来，可以将操作s301中获取的样本数据分别输入这两个目标深度学习模型，得到两个输出结果。根据这两个输出结果，可以分别训练两个目标深度学习模型。
102.在操作s303，利用经训练的深度学习模型进行推理。
103.例如，可以利用经训练的两个目标深度学习模型进行推理。
104.可以理解，上文对本公开的模型训练方法进行了说明，下面将结合相关实施例对本公开的数据处理方法进行说明
105.图4是根据本公开的另一个实施例的基于深度学习平台的数据处理方法的流程图。
106.如图4所示，该方法400可以包括操作s410。
107.在操作s410，将来自目标对象的目标数据输入深度学习模型，得到目标输出结果。
108.在本公开实施例中，深度学习模型部署于至少一个目标设备，目标设备与深度学习平台相关。例如，在完成对深度学习模型的训练之后，可以接收来自目标对象的第五操作信息，根据第五操作信息，可以确定模型压缩工具、部署工具和部署环境。由此，通过深度学习平台，可以进行模型压缩选择、部署工具选择和部署环境选择，与将人工智能应用于工业实践的过程相一致。
109.在本公开实施例中，深度学习模型是利用本公开提供的方法训练的。例如，可以利用上述的方法200训练深度学习模型。
110.图5是根据本公开的一个实施例的基于深度学习平台的模型训练装置的框图。
111.深度学习平台包括多个应用套件，多个应用套件包括核心框架，核心框架包括多个预设处理单元。
112.如图5所示，该装置500可以包括第一确定模块510、第二确定模块520、第一获得模块530、第二获得模块540和训练模块550。
113.第一确定模块510，用于响应于接收到来自目标对象的第一操作信息，确定与目标对象对应的目标应用套件；
114.第二确定模块520，用于响应于接收到来自目标对象的第二操作信息，根据多个预设处理单元，确定至少一个目标处理单元。例如，第二操作信息与目标应用套件相关。
115.第一获得模块530，用于根据至少一个目标处理单元，得到目标深度学习模型。
116.第二获得模块540，用于将来自目标对象的样本数据输入目标深度学习模型，得到输出结果。
117.训练模块550，用于根据输出结果，训练目标深度学习模型。
118.在一些实施例中，目标应用套件为核心框架，至少一个目标处理单元包括第一目标处理单元和第二目标处理单元中的至少一个，第二确定模块包括：第一获得单元，用于根据第二操作信息，得到至少一个第一目标代码数据。调整单元，用于根据第一目标代码数据，调整与第一目标代码数据对应的预设处理单元，得到第一目标处理单元。
119.在一些实施例中，第二确定模块还包括：第二获得单元，用于根据第二操作信息，得到至少一个第二目标代码数据。第三获得单元，用于根据第二目标代码数据，得到第二目标处理单元。
120.在一些实施例中，第一获得模块包括：第四获得单元，用于根据第一目标处理单元和第二目标处理单元中的至少一个，得到目标深度学习模型。
121.在一些实施例中，多个应用套件还包括算法套件、场景套件和可视界面中的至少一个。算法套件包括多个预设深度学习模块，预设深度学习模块与至少一个预设处理单元对应。场景套件包括至少一个场景子套件，场景子套件对应多个预设深度学习模块。可视界面展示有第一控件和第二控件，第一控件与一个场景子套件对应，第二控件与一个预设深度学习模块对应。
122.在一些实施例中，目标应用套件为算法套件，第二确定模块包括：第一确定单元，用于根据与第二操作信息相关的至少一个预设深度学习模块，从多个预设处理单元中确定至少一个目标处理单元。
123.在一些实施例中，第一获得模块包括：第五获得单元，用于根据至少一个目标处理单元，得到至少一个目标深度学习模型，其中，目标深度学习模型对应一个与第二操作信息相关的预设深度学习模块。
124.在一些实施例中，目标应用套件为场景套件，第二确定模块包括：第二确定单元，用于根据第二操作信息和至少一个场景子套件，确定至少一个目标场景子套件。第三确定单元，用于确定与至少一个目标场景子套件对应的i个预设深度学习模块，其中，i为不小于1的整数。第四确定单元，用于响应于接收到来自目标对象的第三操作信息，从i个预设深度学习模块中确定j个目标深度学习模块，其中，j为不小于1且不大于i的整数，第三操作信息与至少一个目标场景子套件相关。第五确定单元，用于从多个预设处理单元中，确定与j个目标深度学习模块各自对应的至少一个目标处理单元。
125.在一些实施例中，第一获得模块包括：第六获得单元，用于根据与j个目标深度学习模块各自对应的至少一个目标处理单元，得到j个目标深度学习模型。
126.在一些实施例中，目标应用套件为可视界面，第一操作信息用于指示可视界面被触发，第二确定模块还包括：第六确定单元，用于根据第二操作信息，确定与被触发的n个第一控件各自对应的n个场景子套件，其中，n个第一控件与m个第二控件对应，n为不小于1的整数。展示单元，用于展示m个第二控件，其中，m为不小于1的整数。第七确定单元，用于响应于接收到来自目标对象的第四操作信息，确定与被触发的k个第二控件各自对应的k个预设深度学习模块。第八确定单元，用于从多个预设处理单元中，确定与k个预设深度学习模块各自对应的至少一个目标处理单元，其中，k为不小于1且不大于m的整数。
127.在一些实施例中，第一获得模块包括：第七获得单元，用于根据与k个预设深度学习模块各自对应的至少一个目标处理单元，得到k个目标深度学习模型。
128.在一些实施例中，目标对象包括深度学习平台的用户。
129.图6是根据本公开的另一个实施例的基于深度学习平台的数据处理装置的框图。
130.如图6所示，该装置600可以包括第三获得模块610。
131.第三获得模块610，用于将来自目标对象的目标数据输入深度学习模型，得到目标输出结果。
132.例如，深度学习模型部署于至少一个目标设备，目标设备与深度学习平台相关，
133.例如，深度学习模型是利用本公开提供的装置训练的。
134.本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。
135.根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
136.图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。
137.如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(rom)702中的计算机程序或者从存储单元708加载到随机访问存储器(ram)703中的计算机程序，来执行各种适当的动作和处理。在ram 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
138.设备700中的多个部件连接至i/o接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
139.计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，
例如基于深度学习平台的模型训练方法和/或基于深度学习平台的数据处理方法。例如，在一些实施例中，基于深度学习平台的模型训练方法和/或基于深度学习平台的数据处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由rom 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到ram 703并由计算单元701执行时，可以执行上文描述的基于深度学习平台的模型训练方法和/或基于深度学习平台的数据处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行基于深度学习平台的模型训练方法和/或基于深度学习平台的数据处理方法。
140.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
141.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
142.在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
143.为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)显示器或者lcd(液晶显示器))；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
144.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界
面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
145.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
146.应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。
147.上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：毕然徐彤彤
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。