大规模机器学习性能优化指导装置、方法、设备及介质与流程

文档序号:37456029发布日期:2024-03-28 18:39阅读:15来源:国知局
大规模机器学习性能优化指导装置、方法、设备及介质与流程

本发明涉及机器学习,尤其涉及一种大规模机器学习性能优化指导装置、方法、设备及介质。


背景技术:

1、在机器学习技术领域,性能分析工具主要用于分析软件运行时的各项指标。常见的性能分析工具包括:pytorch kineto和进一步优化完善张量使用信息和数据带宽信息的pytorch kineto,pytorch kineto是一种常见的性能分析工具,虽然pytorch kineto能够展现性能总览视图、操作人员(operator)视图、时间线(timeline)视图、内存视图和通信性能视图等多种视图,但是展现的颗粒度层次太少,小颗粒的信息过于零散。基于pytorchkineto进一步优化的性能分析工具,虽然完善了张量使用信息和数据带宽信息,但仅仅是提供了更多的分析数据,完全没有进行多维度多层次的整合分析,不利于用户往更细粒度的方向分析性能。


技术实现思路

1、本发明提供一种大规模机器学习性能优化指导装置、方法、设备及介质,用以实现通过多维度多层次的整合分析给出性能优化指导,有助于用户往更细粒度的方向分析性能的目的。

2、第一方面,本发明提供一种大规模机器学习性能优化指导装置,包括:

3、基础任务层,用于提供基础任务组件库,基于从所述基础任务组件库中预先选中的多个基础任务组件,对原始数据库中的原始性能数据进行数据处理,得到基础数据,并将所述基础数据存储到基础数据库中;

4、高级任务层,用于对所述基础数据进行统计浓缩处理,得到第一多层次数据,并将所述第一多层次数据存储到多层次数据库中;

5、业务功能层,用于对所述第一多层次数据进行交叉整合、性能指标计算和性能异常检测,得到第二多层次数据,并将所述第二多层次数据存储到所述多层次数据库中;基于所述第二多层次数据确定性能分析链、优化建议和性能报告,并将所述性能分析链、所述优化建议和所述性能报告存储到业务数据库中;

6、网络服务层,用于响应用户操作,基于所述多层次数据库和所述业务数据库确定操作结果,并对所述操作结果进行可视化展示;所述操作结果包括查询结果和/或自定义分析结果。

7、根据本发明提供的一种大规模机器学习性能优化指导装置,所述基础任务层具体用于:

8、提供所述基础任务组件库,所述基础任务组件库中包括若干个细粒度的所述基础任务组件;

9、基于所述高级任务层的性能优化目标,从所述基础任务组件库中预先选中多个所述基础任务组件;

10、基于多个所述基础任务组件和所述多个基础任务组件之间的依赖关系,构建至少一个基础任务图;

11、将所述原始数据库中的所述原始性能数据输入所述至少一个基础任务图中进行数据处理,得到所述基础数据;

12、将所述基础数据存储到所述基础数据库中。

13、根据本发明提供的一种大规模机器学习性能优化指导装置,所述高级任务层包括:

14、性能统计模块,用于对所述基础数据进行空间维度和时间维度的浓缩处理,得到第一浓缩数据;采用至少一个统计指标对所述第一浓缩数据进行性能统计,得到性能统计数据,并将所述性能统计数据存储到所述多层次数据库中;

15、算子信息统计模块,用于对所述基础数据进行空间维度和时间维度的浓缩处理,得到第二浓缩数据;采用至少一个统计指标对所述第二浓缩数据进行算子信息统计,得到算子信息统计数据,并将所述算子信息统计数据存储到所述多层次数据库中;

16、显存信息统计模块,用于对所述基础数据进行空间维度和时间维度的浓缩处理,得到第三浓缩数据;采用至少一个统计指标对所述第三浓缩数据进行显存信息统计,得到显存信息统计数据,并将所述显存信息统计数据存储到所述多层次数据库中;

17、其中,所述第一多层次数据包括所述性能统计数据、所述算子信息统计数据和所述显存信息统计数据。

18、根据本发明提供的一种大规模机器学习性能优化指导装置,所述业务功能层包括:

19、交叉整合模块,用于对所述第一多层次数据进行交叉整合,得到所述第一多层次数据之间的关联信息,并将所述关联信息存储到所述多层次数据库中;

20、性能指标计算模块,用于对所述多层次数据库中的所述第一多层次数据和所述关联信息进行性能指标计算,得到目标指标数据,并将所述目标指标数据存储到所述多层次数据库中;所述目标指标数据包括每张卡的多个指标数据、各所述卡的综合指标数据和各所述卡之间的性能对比结果;

21、性能异常检测模块,用于对所述多层次数据库中的所述第一多层次数据和所述关联信息进行性能异常检测,得到异常指标数据,并将所述异常指标数据存储到所述多层次数据库中;所述第二多层次数据包括所述关联信息、所述目标指标数据和所述异常指标数据;

22、调优导图分析模块,用于对所述第二多层次数据进行调优导图分析,得到所述性能分析链和所述优化建议,并将所述性能分析链和所述优化建议存储到所述业务数据库中;

23、性能报告生成模块,用于基于所述第二多层次数据生成所述性能报告,并将所述性能报告存储到所述业务数据库中。

24、根据本发明提供的一种大规模机器学习性能优化指导装置,所述业务功能层还包括:

25、性能模拟器,用于将所述原始性能数据作为输入,模拟大规模机器学习的部分训练过程,得到补充性能报告;所述补充性能报告和所述性能报告互补,将所述补充性能报告存储到所述业务数据库中。

26、根据本发明提供的一种大规模机器学习性能优化指导装置,所述网络服务层包括:

27、数据可视化平台,用于基于用户输入的查询条件从所述多层次数据库和所述业务数据库中查询得到所述查询结果;基于所述用户选择的可视化方法在可视化网络界面展示所述查询结果;

28、自定义分析平台,用于基于所述用户配置的自定义分析方法对所述多层次数据库和所述业务数据库进行性能分析,得到所述自定义分析结果。

29、根据本发明提供的一种大规模机器学习性能优化指导装置,所述网络服务层还包括:

30、数据监控平台,用于实时监控所述多层次数据库,得到实时监控结果。

31、根据本发明提供的一种大规模机器学习性能优化指导装置,所述网络服务层还包括:

32、性能分析机器人,用于利用自然语言处理技术引导所述用户完成多轮对话,从而完成针对未覆盖的分析死角的性能分析。

33、第二方面,本发明还提供一种大规模机器学习性能优化指导方法,包括:

34、提供基础任务组件库,基于从所述基础任务组件库中预先选中的多个基础任务组件,对原始数据库中的原始性能数据进行数据处理,得到基础数据,并将所述基础数据存储到基础数据库中;

35、对所述基础数据进行统计浓缩处理,得到第一多层次数据,并将所述第一多层次数据存储到多层次数据库中;

36、对所述第一多层次数据进行交叉整合、性能指标计算和性能异常检测,得到第二多层次数据,并将所述第二多层次数据存储到所述多层次数据库中;基于所述第二多层次数据确定性能分析链、优化建议和性能报告,并将所述性能分析链、所述优化建议和所述性能报告存储到业务数据库中;

37、响应用户操作,基于所述多层次数据库和所述业务数据库确定操作结果,并对所述操作结果进行可视化展示;所述操作结果包括查询结果和/或自定义分析结果。

38、第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第二方面所述的大规模机器学习性能优化指导方法。

39、第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第二方面所述的大规模机器学习性能优化指导方法。

40、第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第二方面所述的大规模机器学习性能优化指导方法。

41、本发明提供的大规模机器学习性能优化指导装置、方法、设备及介质,该装置包括:基础任务层、高级任务层、业务功能层和网络服务层;其中,基础任务层,用于提供基础任务组件库,基于从基础任务组件库中预先选中的多个基础任务组件,可以对原始数据库中的海量原始性能数据做初步的浓缩处理,得到基础数据,并将基础数据存储到基础数据库中;高级任务层,用于对基础数据库中的海量基础数据做进一步的统计浓缩处理,得到第一多层次数据,并将第一多层次数据存储到多层次数据库中;业务功能层,用于对第一多层次数据进行交叉整合、性能指标计算和性能异常检测,得到第二多层次数据,并将第二多层次数据存储到多层次数据库中,可以对第一多层次数据进行多维度多层次的挖掘整合,大大增加了数据的颗粒度层次;基于第二多层次数据可以提炼出性能分析链、优化建议和性能报告,并将性能分析链、优化建议和性能报告存储到业务数据库中;网络服务层,用于响应用户操作,基于多层次数据库和业务数据库确定操作结果,并对操作结果进行可视化展示;操作结果包括查询结果和/或自定义分析结果;可以从性能报告和优化建议出发,通过性能分析链引导用户逐层往更细粒度的方向分析性能。因此,本发明通过多维度多层次的整合分析给出性能优化指导,有助于用户往更细粒度的方向分析性能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1