资源调度分配装置、方法及计算机可读存储介质与流程

文档序号：20874772发布日期：2020-05-26 16:20阅读：103来源：国知局

本申请涉及性能参数设置技术领域，具体涉及一种资源调度分配方法，一种应用所述资源调度分配方法的资源调度分配装置，以及一种计算机可读存储介质。

背景技术：

随着以智能手机、平板电脑为首的资源调度分配装置的使用日益频繁，功耗问题也日益突出。降低终端的功耗，延长电池的使用时间，对于提高用户体验，有着非常重要的意义。

目前，资源调度分配装置上的应用程序(app)数量巨大，质量参差不齐，通常情况下资源调度分配装置很大部分的功耗都消耗在app上面。app的功耗分为前台和后台两部分：前台负责直接与用户交互，后台则运行各种服务等。部分app后台活动频繁，很多情况下完全没有必要，但却浪费了大量的功耗，缩短了电池使用时间。同时，很多app的更新也很频繁，部分版本会在前台使用的时候出现功耗明显增高的异常情况。

但是，目前手机的功耗，其大部分功耗参数，都是在手机里面，固定了某个场景的功耗参数，或者缺少针对某个场景的功耗参数，不难看出，这种参数情况远远没有实现智能化，而且准确度不高，尤其是很多参数只是在实验室里面进行了测试，就直接写到用户的手机里面执行运行，很明显无法达到用户的需求，没有给用户带来最优的运行状态。

不难看出，现有技术存在诸多缺陷，比如如果是提前分配资源，具体分配多少合适比较难确定；如果是实时资源分配，时效性不能把握，一些游戏可能需要低延时性；而且，资源利用效率不高，因为别的应用某些时刻也需要占用资源。

针对现有技术的多方面不足，本申请的发明人经过深入研究，提出一种资源调度分配装置、方法及计算机可读存储介质。

技术实现要素：

本申请的目的在于，提供一种资源调度分配装置、方法及计算机可读存储介质，能够采用深度强化学习模型对应用程序的资源使用情况进行建模分析，根据分析结果进行预估，从而提前对资源进行分配，避免应用程序之间互相占用过多资源，协调应用程序和系统之间的资源分配问题，实现资源的优化配置。

为解决上述技术问题，本申请提供一种资源调度分配方法，作为其中一种实施方式，所述资源调度分配方法包括步骤：

s100，获取目标应用程序的当前资源使用状态；

s200，采用预置的深度强化学习dql模型根据所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置；

s300，在进入所述目标时间段时根据所述预估资源使用配置对所述目标应用程序进行资源调度分配动作。

作为其中一种实施方式，所述获取目标应用程序的当前资源使用状态的步骤之前，还包括：

获取所述目标应用程序的场景使用资源数据；

根据所述场景使用资源数据建立与所述目标应用程序对应的dql模型。

作为其中一种实施方式，所述获取所述目标应用程序的场景使用资源数据的步骤，具体包括：

通过卷积神经网络提取所述目标应用程序的场景资源特征；

根据所述场景资源特征获取得到场景使用资源数据。

作为其中一种实施方式，所述目标应用程序包括游戏软件、多媒体播放软件、交友聊天软件、网页冲浪软件和/或网络直播软件；所述通过卷积神经网络提取所述目标应用程序的场景资源特征的步骤，具体包括：

将所述目标应用程序的场景页面分解成帧图片；

通过卷积神经网络从所述帧图片提取得到所述目标应用程序的场景资源特征。

作为其中一种实施方式，所述根据所述场景使用资源数据建立与所述目标应用程序对应的dql模型的步骤，还包括：

对所述dql模型进行q函数拟合，以训练得到优化的dql模型。

作为其中一种实施方式，所述对所述dql模型进行q函数拟合的步骤，具体包括：

通过卷积神经网络采集并提取所述目标应用程序、类似应用程序、设备自身资源使用状况的场景资源综合特征；

利用所述场景资源综合特征对所述dql模型进行q函数拟合训练。

作为其中一种实施方式，所述步骤s200还包括：

获取所述目标应用程序的历史使用数据；

根据所述历史使用数据和所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置。

作为其中一种实施方式，所述历史使用数据包括：

使用时间段、使用频率、操作频率中的至少一个。

为解决上述技术问题，本申请还提供一种资源调度分配装置，作为其中一种实施方式，其配置有处理器，所述处理器用于执行资源调度分配程序，以实现包括如上所述的资源调度分配方法。

为解决上述技术问题，本申请还提供一种计算机可读存储介质，作为其中一种实施方式，其用于存储资源调度分配程序，所述资源调度分配程序在被处理器执行时，以实现包括如上所述的资源调度分配方法。

本申请提供的资源调度分配装置、方法及计算机可读存储介质，所述资源调度分配方法包括步骤：获取目标应用程序的当前资源使用状态，采用预置的深度强化学习dql模型根据所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置，在进入所述目标时间段时根据所述预估资源使用配置对所述目标应用程序进行资源调度分配动作。通过上述方式，本申请能够采用深度强化学习模型对应用程序的资源使用情况进行建模分析，根据分析结果进行预估，从而提前对资源进行分配，避免应用程序之间互相占用过多资源，协调应用程序和系统之间的资源分配问题，实现资源的优化配置。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图,详细说明如下。

附图说明

图1a为本申请资源调度分配方法一实施方式的流程示意图。

图1b为图1a所示步骤s100一实施方式的流程示意图。

图1c为图1a所示步骤s200一实施方式的流程示意图。

图2为本申请资源调度分配装置一实施方式的功能模块示意图。

具体实施方式

为更进一步阐述本申请为达成预定申请目的所采取的技术手段及功效,以下结合附图及较佳实施例，对本申请详细说明如下。

通过具体实施方式的说明,当可对本申请为达成预定目的所采取的技术手段及效果得以更加深入且具体的了解，然而所附图式仅是提供参考与说明之用,并非用来对本申请加以限制。

请参阅图1a，图1a为本申请资源调度分配方法一实施方式的流程示意图。

需要说明的是，本实施方式所述资源调度分配方法可以包括但不限于如下几个步骤。

步骤s100，获取目标应用程序的当前资源使用状态。

步骤s200，采用预置的深度强化学习dql模型根据所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置。

步骤s300，在进入所述目标时间段时根据所述预估资源使用配置对所述目标应用程序进行资源调度分配动作。

需要特别指出的是，本实施方式所述目标时间段，可以指的是延续的某个时间段，也可以是某个时间节点，或者是目标应用程序进入某个运行状态时的时间段。

此外，在本实施方式中，可以周期地、或不定时地、或实时地对目标应用程序在目标时间段的预估资源使用配置，当然，还可以根据应用程序的运行状态进行智能触发执行本方法的步骤。

在本实施方式中，所述获取目标应用程序的当前资源使用状态的步骤之前，还包括：获取所述目标应用程序的场景使用资源数据；根据所述场景使用资源数据建立与所述目标应用程序对应的dql模型。

进一步而言，请参阅图1b，本实施方式所述获取所述目标应用程序的场景使用资源数据的步骤，具体可以包括：s110，通过卷积神经网络提取所述目标应用程序的场景资源特征；s120，根据所述场景资源特征获取得到场景使用资源数据。

此外，请参阅图1c所示，本实施方式所述步骤s200还可以包括：

s210，获取所述目标应用程序的历史使用数据；

s220，根据所述历史使用数据和所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置。

应明白的是，除了第一次安装使用的特殊情况，一般应用程序会在设备中被用户偶尔、经常地使用，针对这些使用记录，本实施方式可以进行统计并预估使用趋势，而得到与实际情况差别不大的预估资源使用配置的结果。

举例而言，本实施方式所述历史使用数据可以包括：使用时间段、使用频率、操作频率中的至少一个。

比如，目标应用程序为“英语口语练习”，其使用时间段为早上7-8点，晚上19-20点，基本上误差不会超过±5分钟，以及每天都坚持这个时间段使用，那么，作为其中之一的历史使用数据，可以作为判断在这个时间段需要确保“英语口语练习”的资源使用配置，并可以适当地关掉其他明显冲突的应用程序资源配置，而保证“英语口语练习”的正常使用。

比如，目标应用程序为“时事新闻”，其使用频率为基本上在白天时间内每小时刷新三次，其中每次刷新可能会浏览5分钟，那么，作为其中之一的历史使用数据，可以作为判断需要确保“时事新闻”的这个使用频率的资源使用配置，并可以适当地在预计的使用周期(或频率)到来时关掉其他明显冲突的应用程序资源配置，而保证“时事新闻”的正常使用。

比如，目标应用程序为“围棋”，其操作频率为在启动应用程序后每3分钟操作一次，其中每次刷新可能会浏览5分钟，那么，作为其中之一的历史使用数据，可以作为判断需要确保“围棋”的这个操作频率的资源使用配置，并可以适当地在预计的操作频率到来时关掉其他明显冲突的应用程序资源配置，而保证“围棋”的正常使用。

进一步而言，针对上述三个或更多的本领域技术人员所理解的历史使用数据，可以进行任意组合，比如目标应用程序“围棋”的使用时间段为晚上20-22点，操作频率为在启动应用程序后每3分钟操作一次，使用频率为每周一、三、五三天使用，则可以针对这些综合的历史使用数据，关掉其他明显冲突的应用程序资源配置，确保“围棋”的这个操作频率的资源使用配置以及正常使用。

具体而言，本实施方式所述通过卷积神经网络提取所述目标应用程序的场景资源特征的步骤，具体可以包括：将所述目标应用程序的场景页面分解成帧图片；通过卷积神经网络从所述帧图片提取得到所述目标应用程序的场景资源特征。

需要补充说明的是，所述帧图片，可以指的是一帧一帧分解的图片，可以将目标应用程序，比如游戏界面，进行逐帧分解处理。

值得说明的是，本实施方式所述根据所述场景使用资源数据建立与所述目标应用程序对应的dql模型的步骤，还可以包括：对所述dql模型进行q函数拟合，以训练得到优化的dql模型。

同理，本实施方式所述对所述dql模型进行q函数拟合的步骤，具体包括：通过卷积神经网络采集并提取所述目标应用程序、类似应用程序、设备自身资源使用状况的场景资源综合特征；利用所述场景资源综合特征对所述dql模型进行q函数拟合训练。

在本实施方式的一具体实施例中，所述对所述dql模型进行q函数拟合的步骤中，所述q函数包括：

其中，式1中，s为资源分配量的当前状态，a为增加或减少资源的资源调度分配动作，π是当前的动态资源分配策略，为回报函数，且当t时刻运行异常时rt为负数、否则为0，γ是常数，是在状态s时采取资源调度分配动作a时状态转移到s’的概率函数，vπ(s’)＝∑aπ(a|s’)qπ(s’,a)表示状态s’时采用资源调度分配动作a的状态值函数的总合。

进一步而言，本实施方式所述对所述dql模型进行q函数拟合，包括：

训练目标函数其中，q是通过定义求出的动作值函数，是通过神经网络模型学习出来的动作值函数的拟合值，θ是模型参数。

在本实施方式中，所述采用预置的深度强化学习dql模型根据所述当前资源使用状态判断所述目标应用程序在目标时间段的资源调度分配动作的步骤中，所述资源调度分配动作a的预估函数包括：

a＝argmax(q(s,a’))-式2

其中，在式2中，q是动作值函数，s是当前状态空间，a’是动作空间，a是通过该函数选出的最优动作。

容易理解的是，本实施方式可以通过预估资源使用配置，调整比如gpu、cpu以及ram等的资源使用情况。

具体而言，本实施方式可以设置资源调度分配装置上app相关的运行数据，可以为网络状态、蓝牙状态、gps状态、位置信息、cpu/ddr/gpu频点、前台功耗、后台功耗、前台运行资源、后台运行资源、前台运行时间、后台运行时间等。

本申请能够采用深度强化学习模型对应用程序的资源使用情况进行建模分析，根据分析结果进行预估，从而提前对资源进行分配，避免应用程序之间互相占用过多资源，协调应用程序和系统之间的资源分配问题，实现资源的优化配置。

请参阅图2，本申请还提供一种资源调度分配装置，作为其中一种实施方式，其配置有处理器21，所述处理器21用于执行资源调度分配程序，以实现包括如上所述的资源调度分配方法。

在本实施方式中，所述资源调度分配装置包括手机、平板电脑、可穿戴设备和笔记本电脑的其中之一。

在具体工作过程中，所述目标应用程序包括游戏软件、多媒体播放软件、交友聊天软件、网页冲浪软件和/或网络直播软件。

具体而言，本实施方式所述处理器21用于获取目标应用程序的当前资源使用状态。

所述处理器21用于采用预置的深度强化学习dql模型根据所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置。

所述处理器21用于在进入所述目标时间段时根据所述预估资源使用配置对所述目标应用程序进行资源调度分配动作。

此外，本实施方式所述处理器21用于获取所述目标应用程序的历史使用数据；所述处理器21用于根据所述历史使用数据和所述当前资源使用状态判断所述目标应用程序在目标时间段的预估资源使用配置。

举例而言，本实施方式所述历史使用数据可以包括：使用时间段、使用频率、操作频率中的至少一个。

在本实施方式中，所述处理器21用于获取所述目标应用程序的场景使用资源数据；根据所述场景使用资源数据建立与所述目标应用程序对应的dql模型。

进一步而言，本实施方式所述处理器21用于通过卷积神经网络提取所述目标应用程序的场景资源特征；所述处理器21用于根据所述场景资源特征获取得到场景使用资源数据。

具体而言，本实施方式所述处理器21用于通过卷积神经网络提取所述目标应用程序的场景资源特征，具体可以包括：所述处理器21用于将所述目标应用程序的场景页面分解成帧图片；所述处理器21用于通过卷积神经网络从所述帧图片提取得到所述目标应用程序的场景资源特征。

需要补充说明的是，所述帧图片，可以指的是一帧一帧分解的图片，可以将目标应用程序，比如游戏界面，进行逐帧分解处理。

值得说明的是，本实施方式所述处理器21用于根据所述场景使用资源数据建立与所述目标应用程序对应的dql模型，还可以包括：所述处理器21用于对所述dql模型进行q函数拟合，以训练得到优化的dql模型。

同理，本实施方式所述处理器21用于对所述dql模型进行q函数拟合，具体可以包括：所述处理器21用于通过卷积神经网络采集并提取所述目标应用程序、类似应用程序、设备自身资源使用状况的场景资源综合特征；利用所述场景资源综合特征对所述dql模型进行q函数拟合训练。

在本实施方式的一具体实施例中，所述处理器21用于对所述dql模型进行q函数拟合，所述q函数包括：

其中，式3中，s为资源分配量的当前状态，a为增加或减少资源的资源调度分配动作，π是当前的动态资源分配策略，为回报函数，且当t时刻运行异常时rt为负数、否则为0，γ是常数，是在状态s时采取资源调度分配动作a时状态转移到s’的概率函数，vπ(s’)＝∑aπ(a|s’)qπ(s’,a)表示状态s’时采用资源调度分配动作a的状态值函数的总合。

进一步而言，本实施方式所述对所述dql模型进行q函数拟合，包括：

训练目标函数其中，q是通过定义求出的动作值函数，是通过神经网络模型学习出来的动作值函数的拟合值，θ是模型参数。

在本实施方式中，所述处理器21采用预置的深度强化学习dql模型根据所述当前资源使用状态判断所述目标应用程序在目标时间段的资源调度分配动作，所述资源调度分配动作a的预估函数包括：

a＝argmax(q(s,a’))-式4

其中，在式4中，q是动作值函数，s是当前状态空间，a’是动作空间，a是通过该函数选出的最优动作。

容易理解的是，本实施方式可以通过预估资源使用配置，调整比如gpu、cpu以及ram等的资源使用情况。

此外，本申请还可以提供一种计算机可读存储介质，其用于存储资源调度分配程序，所述资源调度分配程序在被处理器执行时，以实现包括如图1a及其实施方式所述的资源调度分配方法。

需要说明的是，本申请所描述的方法实施方式至少可以部分地是机器或计算机实现的。一些示例可以包括用指令编码的计算机可读存储介质或机器可读存储介质，所述指令可用于配置电子设备以执行以上实施方式中所述的方法。这些方法的实现可以包括代码，例如微码、汇编语言代码或更高级别的语言代码等。这种代码可以包括用于执行各种方法的计算机可读指令。该代码可以形成资源调度分配程序产品的一部分。该代码可以有形地存储在一个或多个易失性、非暂时性或非易失性有形计算机可读介质上，例如在执行期间或在其它时间。这些有形计算机可读存储介质的示例可以包括但不限于硬盘、可移动磁盘、可移动光盘(例如，压缩磁盘和数字视频盘)、磁带盒、存储卡或棒、随机存取存储器(randomaccessmemory，简称ram)和只读存储器(readonlymemory，简称rom)等。

以上所述，仅是本申请的较佳实施例而已，并非对本申请作任何形式上的限制，虽然本申请已以较佳实施例揭露如上，然而并非用以限定本申请,任何熟悉本专业的技术人员，在不脱离本申请技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本申请技术方案内容，依据本申请的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本申请技术方案的范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：段德昀
技术所有人：深圳传音控股股份有限公司
我是此专利的发明人

上一篇：自发光牙科手机的制作方法
上一篇：一种脑部手术定位用导向装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。