一种资源分配方法、装置、设备和计算机存储介质与流程

文档序号：29462958发布日期：2022-04-02 02:12阅读：82来源：国知局

1.本技术涉及直播技术领域，尤其涉及一种资源分配方法、装置、电子设备和计算机存储介质。

背景技术：

2.互联网直播场景的直播间中，主要包括两类用户，即主播用户与观众用户。主播用户与观众用户之间的互动，多通过文字、语音、视频及控件等方式进行人际的沟通和指令的交互。因此，现今在直播间内利用主播用户与观众用户之间的交互，向观众用户线上推荐一些商品，使得观众用户可通过主播用户的推荐而在线购买该商品，从而创造经济效益。
3.然而，在直播过程中，一件商品的售出是受到多种因素综合影响的，例如，主播名气、商品质量、商品价格等；相应地，在计算机底层资源系统中，需要针对商品直播过程中的每个影响因素分配对应的计算机资源；由于有些影响因素对于商品销量的影响是很小的，若对该影响因素分配较多的计算机资源，会导致计算机资源的浪费；因此，为了减少计算机资源的浪费，需要一种能够合理进行资源分配的方法。

技术实现要素：

4.本技术提供一种资源分配方法、装置、电子设备和计算机存储介质，能够减少计算机资源浪费的风险。
5.本技术的技术方案是这样实现的：
6.本技术实施例提供了一种资源分配方法，所述方法包括：
7.根据商品直播的历史数据，确定影响所述商品直播的多个核心因素；
8.对获取到的历史直播数据中的异常直播数据进行清洗操作，得到目标数据，从所述目标数据中提取满足设定条件的全量数据集，确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果；所述设定条件是根据所述每个核心因素确定的；
9.根据所述预测影响结果，生成所述每个核心因素的资源分配结果。
10.在一些实施例中，所述确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果，包括：
11.从所述全量数据集中选取部分数据集作为训练数据集，根据所述训练数据集以及所述训练数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素影响的标注结果训练回归模型，得到训练完成的回归模型；
12.利用所述训练完成的回归模型确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果。
13.在一些实施例中，所述根据所述预测影响结果，生成所述每个核心因素的资源分配结果，包括：
14.在根据所述预测影响结果，确定所述全量数据集中每场直播的销量数据受到所述
多个核心因素中至少一个核心因素的影响时，确定所述全量数据集中每场直播的销量距离；所述销量距离表示所述每场直播的销量数据与平均销量数据的差值；
15.根据所述全量数据集中每场直播的销量距离以及每个核心因素对应的直播场次数，生成所述每个核心因素的资源分配结果。
16.在一些实施例中，所述根据所述全量数据集中每场直播的销量距离以及每个核心因素对应的直播场次数，生成所述每个核心因素的资源分配结果，包括：
17.以所述每个核心因素为维度，根据所述全量数据集中每场直播的销量距离，确定所述每个核心因素的总销量距离；所述每个核心因素的总销量距离表示受到所述每个核心因素影响的至少一场直播的销量距离之和；
18.对所述每个核心因素的总销量距离进行校正，得到所述每个核心因素的校正后总销量距离；所述校正后总销量距离为大于零的整数；
19.根据所述每个核心因素的校正后总销量距离和所述直播场次数的比值，确定所述每个核心因素对应的平均销量距离；
20.基于所述每个核心因素对应的平均销量距离，生成所述每个核心因素的资源分配结果。
21.在一些实施例中，所述方法还包括：
22.在生成所述每个核心因素的资源分配结果后，基于所述每个核心因素的资源分配结果，对当前的直播预算进行分配。
23.在一些实施例中，所述多个核心因素包括：主播因素、商品因素、渠道因素。
24.本技术实施例还提出了一种资源分配装置，所述装置包括第一确定模块、得到模块和第二确定模块，其中，
25.第一确定模块，用于根据商品直播的历史数据，确定影响所述商品直播的多个核心因素；
26.得到模块，用于对获取到的历史直播数据中的异常直播数据进行清洗操作，得到目标数据，从所述目标数据中提取满足设定条件的全量数据集，确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果；所述设定条件是根据所述每个核心因素确定的；
27.第二确定模块，用于根据所述预测影响结果，生成所述每个核心因素的资源分配结果。
28.本技术实施例提供一种电子设备，所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现前述一个或多个技术方案提供的资源分配方法。
29.本技术实施例提供一种计算机存储介质，所述计算机存储介质存储有计算机程序；所述计算机程序被执行后能够实现前述一个或多个技术方案提供的资源分配方法。
30.本技术实施例提出了一种资源分配方法、装置、电子设备和计算机存储介质，所述方法包括：根据商品直播的历史数据，确定影响所述商品直播的多个核心因素；对获取到的历史直播数据中的异常直播数据进行清洗操作，得到目标数据，从所述目标数据中提取满足设定条件的全量数据集，确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果；所述设定条件是根据所述每个
核心因素确定的；根据所述预测影响结果，生成所述每个核心因素的资源分配结果。
31.可以看出，本技术实施例在根据商品直播的历史数据，得到影响商品直播的每个核心因素后，对从历史直播数据中提取的全量数据集中每场直播的销量数据受到至少一个核心因素的影响情况进行确定，并利用确定结果(即预测影响结果)生成每个核心因素的资源分配结果；由于在提取全量数据集之前，会对历史直播数据中的异常直播数据进行清洗操作，以确保全量数据集的有效性，进而，提高确定资源分配结果的准确性；另外，本技术实施例可以根据历史直播数据，确定商品的销量数据受到各个核心因素的影响情况，进而，可以根据各个核心因素的影响情况有针对性地生成每个核心因素的资源分配结果，如此，对于计算机底层资源系统，可以根据该资源分配结果实现较为精准的计算机资源分配，进而减少计算机资源浪费的风险。
附图说明
32.图1a是本技术实施例中的一种资源分配方法的流程示意图；
33.图1b为本技术实施例中的一种确定全量数据集的流程示意图；
34.图1c是本技术实施例中的一种logistic回归模型的曲线示意图；
35.图2a为本技术实施例的一种预算分配的流程图；
36.图2b为本技术实施例的另一种资源分配方法的流程图；
37.图2c为本技术实施例的一种距离计算方法的流程图；
38.图3是本技术实施例的资源分配装置的组成结构示意图；
39.图4是本技术实施例提供的电子设备的结构示意图。
具体实施方式
40.以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处所提供的实施例仅仅用以解释本技术，并不用于限定本技术。另外，以下所提供的实施例是用于实施本技术的部分实施例，而非提供实施本技术的全部实施例，在不冲突的情况下，本技术实施例记载的技术方案可以任意组合的方式实施。
41.需要说明的是，在本技术实施例中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素，而且还包括没有明确列出的其它要素，或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元，例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。
42.本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，i和/或j，可以表示：单独存在i，同时存在i和j，单独存在j这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括i、j、r中的至少一种，可以表示包括从i、j和r构成的集合中选择的任意一个或多个元素。
43.例如，本技术实施例提供的资源分配方法包含了一系列的步骤，但是本技术实施例提供的资源分配方法不限于所记载的步骤，同样地，本技术实施例提供的资源分配装置包括了一系列模块，但是本技术实施例提供的资源分配装置不限于包括所明确记载的模
块，还可以包括为获取相关任务数据、或基于任务数据进行处理时所需要设置的模块。
44.本技术可以基于电子设备实现，这里，电子设备可以是瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统，等等。
45.电子设备可以通过程序模块的执行实现相应的功能。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施，分布式云计算环境中，任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
46.相关技术中，对于当前直播，以及按销量付费(cost per sales，cps)或按每次行动成本(cost per action，cpa)的广告业务都面临一个问题，没有合适的贡献率确定方案；为了不出现木桶效应，商家一般采用市场定价策略，通过覆盖式投入(即满足每个可能性的最大投入)来保证效果；例如，按市场价高价签约某个著名主播、按市场推广价找合作媒体并且商品大额让利，综合起来得到一个好的售卖效果；但背后却挤占了利润空间，于是商家只能靠缩水商品质量或虚标商品价格等方式损害消费者利益以保证自己的利润，最终导致的效果是消费者利益受损，且主播和商家信用全无。
47.针对上述技术问题，提出以下各实施例。
48.在本技术的一些实施例中，资源分配方法可以利用资源分配装置中的处理器实现，上述处理器可以为特定用途集成电路(application specific integrated circuit，asic)、数字信号处理器(digital signal processor，dsp)、数字信号处理装置(digital signal processing device，dspd)、可编程逻辑装置(programmable logic device，pld)、现场可编程逻辑门阵列(field programmable gate array，fpga)、中央处理器(central processing unit，cpu)、控制器、微控制器、微处理器中的至少一种。
49.图1a是本技术实施例中的一种资源分配方法的流程示意图，如图1a所示，该方法包括如下步骤：
50.步骤100：根据商品直播的历史数据，确定影响商品直播的多个核心因素。
51.本技术实施例中，首先引入与商品直播相关的历史数据，根据历史数据确定影响商品直播的各个因素；例如，一场商品直播的影响因素从头至尾可以包括平台流量、平台排序推荐、主播名气、主播直播效果、主播流量、商品质量、商品口碑、商品价格、商品让利、外部媒体流量、外部媒体口碑、外部媒体流量筛选等超过20个因素；接着，根据业务逻辑对这些因素进行后验总结，确定影响商品直播的多个归因分类；这里，业务逻辑用于表征商家预算分配的范畴，通常情况下，预算分配的范畴可以包括直播平台费用、主播费用、商品让利、渠道推广费。
52.示例性地，在直播平台已知的情况下，上述多个归因分类可以包括：主播因素、商品因素、渠道因素；这里，可以将每个归因分类作为一个核心因素，即，可以得到主播因素、商品因素、渠道因素这三个影响商品直播的核心因素。
53.示例性地，还可以在确定影响商品直播的多个归因分类后，分别对多个归因分类中的每个归因分类进行细分，得到每个归因分类对应的多个子类；这里，也可以将多个子类中的每个子类作为核心因素。
54.表1列举了对主播因素、商品因素和渠道因素这三个归因分类进行细分后的多个子类，参照表1，在归因分类为主播因素的情况下，对主播因素进行细分后的子类包括主播流量、主播转化率和主播商品溢价；在归因分类为商品因素的情况下，对商品因素进行细分后的子类包括商品质量、商品口碑、商品分类和商品价格让利；在归因分类为渠道因素的情况下，对渠道因素进行细分后的子类包括渠道流量、渠道流量质量和垂类媒体加成。
[0055][0056][0057]
表1
[0058]
可见，本技术实施例通过商品直播的历史数据，预先划定贡献率影响因素范围，再基于业务逻辑进行大类划分，得到每个归因分类，接着对每个归因分类进行细分，得到各个子类；以表1为例，可以形成3大类10小类(3个归因分类10个子类)的直播转化归因分类。
[0059]
示例性地，在归因分类确定的情况下，该归因分类对应的子类是可以灵活变动的，具体可以根据实际场景进行确定，本技术实施例对此不作限定，例如，在归因分类为商品因素的情况下，商品因素对应的子类除了表1所示外，还可以包括商品品牌和商品季节性，或仅包括商品质量和商品口碑。
[0060]
步骤101：对获取到的历史直播数据中的异常直播数据进行清洗操作，得到目标数据，从目标数据中提取满足设定条件的全量数据集，确定全量数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素的影响情况，得到预测影响结果；设定条件是根据每个核心因素确定的。
[0061]
示例性地，历史直播数据可以包括在当前时刻之前的每场商品直播对应的直播数据，其中，每场商品直播对应的直播数据会预先存储在与其对应的每个日志文件中；这里，可以先采用数据采集工具从每个日志文件中采集每场商品直播对应的直播数据，并将采集到的直播数据存储在消息队列中，这样，便可以从消息队列中获取到历史直播数据，以进行后续处理操作。
[0062]
示例性地，数据采集工具可以是flume，也可以是其它类型的数据采集工具；消息队列可以是kafka，也可以是mq(message queue)，具体可以根据实际场景进行设置，本技术
实施例对此不作限定。
[0063]
图1b为本技术实施例中的一种确定全量数据集的流程示意图，参照图1b，在使用数据采集工具从每个日志文件中采集每场商品直播对应的直播数据后，将采集到的直播数据依次放入到kafka集群中进行存储；这里，将kafka集群作为流处理工具flink的数据源；进一步地，通过流处理工具flink的数据输入模块source从kafka集群中消费历史直播数据，并将历史直播数据传输至数据处理模块transform中，通过数据处理模块transform对历史直播数据中的异常直播数据进行清洗操作，得到目标数据；接着，从目标数据中提取满足设定条件的数据集，然后将所有满足设定条件的数据集进行整合，得到全量数据集；将该全量数据集存放到流处理工具flink的数据输出模块sink中；将数据输出模块sink输出的全量数据集放入到kafka集群中进行存储，之后，从该kafka集群输出的数据中获取全量数据集。
[0064]
示例性地，异常直播数据可以是发生异常中断的某场直播对应的直播数据以及其它异常情况下的直播数据。
[0065]
示例性地，上述流处理工具除了可以是flink外，也可以是其它类型的流处理工具，例如storm等，本技术实施例对此不作限定。
[0066]
示例性地，在提取到满足设定条件的全量数据集后，确定全量数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素的影响情况，得到预测影响结果，可以包括：从全量数据集中选取部分数据集作为训练数据集，根据训练数据集以及训练数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素影响的标注结果训练回归模型，得到训练完成的回归模型；利用训练完成的回归模型确定全量数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素的影响情况，得到预测影响结果。
[0067]
本技术实施例中，设定条件是根据每个核心因素确定的；例如，在核心因素为主播因素的情况下，设定条件可以为无渠道合作且商品品类单一的直播数据，即，无商品因素和渠道因素影响的直播数据，记为第一设定条件；在核心因素为商品因素的情况下，设定条件可以为无渠道合作且无主播合作的直播数据，即，无主播因素和渠道因素影响的直播数据，记为第二设定条件；在核心因素为渠道因素的情况下，设定条件可以为商品品类单一且无主播合作的直播数据，即，无主播因素和商品因素影响的直播数据，记为第三设定条件。
[0068]
示例性地，分别从满足上述第一设定条件、第二设定条件和第三设定条件的全量数据集中选取部分数据集作为训练数据集；表2列举了满足第一设定条件的部分训练数据集，参照表2，该训练数据集包括主播张三和主播李四对相同品类商品在不同直播场次的直播数据(包括直播场次、直播场观、直播商品品类、直播商品数量和销量)以及销量数据是否受主播因素影响的标注结果。
[0069][0070]
表2
[0071]
表3列举了满足第二设定条件的部分训练数据集，参照表3，该训练数据集包括商
品id1和商品id2在不同直播场次的直播数据(包括商品id、直播场次、直播场观、原价、直播时价格、销量)以及销量数据是否受商品因素影响的标注结果。
[0072][0073]
表3
[0074]
表4列举了满足第三设定条件的部分训练数据集，参照表4，该训练数据集包括相同品类商品在渠道id1和渠道id2的直播数据(包括渠道id、直播场次、直播场观、渠道引流数、引流转化率和销量)以及销量数据是否受渠道因素影响的标注结果。
[0075][0076]
表4
[0077]
示例性地，表2至表4中所示的直播数据仅仅是一种示例，本技术实施例对此不作限定；需要说明的是，全量数据集与训练数据集的数据格式相同。
[0078]
示例性地，对于上述确定训练数据集中销量数据是否受主播因素、商品因素或渠道因素影响的标注方式不作限定。
[0079]
本技术实施例中，在利用训练数据以及训练数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素影响的标注结果训练回归模型，得到训练完成的回归模型；即，每个核心因素对应一个训练完成的回归模型；再使用训练完成的回归模型对每个核心因素对应的全量数据集中每场直播的销量数据进行“是否判断”(是否受到核心因素影响)的结果预测，得到预测影响结果。
[0080]
示例性地，在核心因素为上述表1所示的10个子类的情况下，分别根据每个子类对应的训练数据集进行回归模型训练，再使用训练完成的回归模型对每个子类对应的全量数据集进行10个子类的“是否判断”。
[0081]
这里，回归模型可以是logistic回归模型，也可以是其它类型的回归模型。其中，logistic回归模型是机器学习最常用的模型之一，主要思路为：通过分析历史直播数据，判断在某些条件确定的情况下，一些自变量变化时引起是否型因变量变化的θ值，并将调好的参数用于后续结果预测，其对应的公式(1)如下所示：
[0082][0083]
其中，e为自然底数，t为转置符号，θ为logistic回归模型中自变量x的权重；从公式(1)可以看出，分子为1，分母为1加正数，因此，自变量对应的函数值h
θ
(x)，即因变量的取值范围为0～1。
[0084]
示例性地，以表3所示的与商品因素相关的训练数据集为例，将直播场次、直播场观、原价、直播时价格作为x轴，以销量为y轴，即可构建“商品价格让利(原价及让利幅度)”这个核心因素对应的回归模型；其中直播场观(直播场观固定时，代表主播因素和渠道因素相对稳定)作为定量数据直接放入，原价和直播时价格作为对比参照项，代入公式(1)进行二元logistic回归。显而易见的，其分布符合logistic的s型函数曲线，参照图1c，以(0，0.5)为对称中心，随着自变量x不断增大，其函数值h
θ
(x)不断增大接近1；随着自变量x不断变小，其函数值不断降低接近0，且函数曲线在中间位置变化速度最快，在两端的变化速率较慢。应用在商品价格让利这个核心因素上，则说明少量降价不会引起大量购买，大量降价时会引起销量上升，超量降价时会重新导致销量下降；如果将0.5值定义为分界线，当一场直播的销量数据分布在0.5以下时，则认为结果为否(即上述核心因素未影响销量数据)；反之，当一场直播的销量数据分布在0.5以上时，则认为结果为是(即上述核心因素影响了销量数据)。
[0085]
其中，表5分别列举了全量数据集中四场直播的销量数据是否受到10个子类(核心因素)影响的预测影响结果。
[0086][0087]
表5
[0088]
示例性地，预测影响结果是用于后续确定核心因素的资源分配结果，为了确保资源分配结果的有效性，可以每隔设定时间对训练数据集和全量数据集进行更新，进而，利用更新后的训练数据集重新训练回归模型，并使用训练完成的回归模型对更新后的全量数据集中每场直播的销量数据进行“是否判断”的结果预测，重新得到预测影响结果。
[0089]
这里，对于设定时间的设置可以根据实际情况进行设置，本技术实施例对此不作限定，例如，可以是三个月、半年等。
[0090]
步骤102：根据预测影响结果，生成每个核心因素的资源分配结果。
[0091]
本技术实施例中，在根据步骤101得到全量数据集中每场直播对应的预测影响结果后，可以进一步生成每个核心因素的资源分配结果；示例性地，根据预测影响结果，生成每个核心因素的资源分配结果，可以为：在根据预测影响结果，确定全量数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素的影响时，确定全量数据集中每场直播的销量距离；销量距离表示每场直播的销量数据与平均销量数据的差值；根据全量数据集
中每场直播的销量距离以及每个核心因素对应的直播场次数，生成每个核心因素的资源分配结果。
[0092]
示例性地，根据预测影响结果，可以确定至少被一个核心因素影响时的全量数据集中每场直播的销量距离；也就是说，如果某场直播的销量数据均未受到任何一个核心因素的影响，则丢弃本场直播的直播数据；反之，如果某场直播的销量数据受到至少一个核心因素的影响，则保留本场直播的直播数据。接着，统计保留的每场直播的销量数据，确定总销量数据；根据总销量数据与直播场次数的比值，确定平均销量数据；进而，根据每场直播的销量数据与平均销量数据的差值，确定全量数据集中每场直播的销量距离。
[0093]
示例性地，以表5所示的四场直播的预测影响结果为例，由于四场直播均受到至少一个核心因素的影响，则保留这四场直播的直播数据，并确定这四场直播的总销量数据为：30+40+50+60＝180万；用总销量数据除以直播场次数，得出平均销量数据：180/4＝45万；再用每场直播的销量数据减去平均销量数据，可以得到这四场直播的销量距离，参见表6。
[0094][0095]
表6
[0096]
在一些实施例中，根据全量数据集中每场直播的销量距离以及每个核心因素对应的直播场次数，生成每个核心因素的资源分配结果，可以包括：以每个核心因素为维度，根据全量数据集中每场直播的销量距离，确定每个核心因素的总销量距离；每个核心因素的总销量距离表示受到每个核心因素影响的至少一场直播的销量距离之和；对每个核心因素的总销量距离进行校正，得到每个核心因素的校正后总销量距离；校正后总销量距离为大于零的整数；根据每个核心因素的校正后总销量距离和直播场次数的比值，确定每个核心因素对应的平均销量距离；基于每个核心因素对应的平均销量距离，生成每个核心因素的资源分配结果。
[0097]
示例性地，针对每个核心因素，确定销量数据受到每个核心因素影响的至少一场直播的销量距离之和，得到每个核心因素的总销量距离；例如，以表5所示的预测影响结果以及表6所示的直播距离为例，受到主播流量这个核心因素影响到的直播id为：直播id1、直播id3和直播id4，即，主播流量对应的直播场次数为3；且主播流量这个核心因素的总销量距离为-15+5+15＝5。
[0098]
下面以表7为例进行说明，示例性地，表7列举了表5所示的10个子类(核心因素)对应的总销量距离以及直播场次数。
[0099][0100]
表7
[0101]
本技术实施例中，在得到每个核心因素的总销量距离以及直播场次数后，为避免总销量距离有正有负的问题，可以对总销量距离进行校正，使得校正后的每个核心因素的总销量距离均为大于零的整数；示例性地，可以以最大正数和最小负数绝对值之和的相反数为0点；例如，以表7所示的总销量距离为例，正数最大值为15，负数最小值为-20，则0点为：-(15+|-20|)＝-35。再将每个核心因素的总销量距离依次减去该0点，可以得到每个核心因素的校正后总销量距离，参见表8。
[0102][0103]
表8
[0104]
示例性地，在得到每个核心因素的校正后总销量距离和直播场次数后，依次用每个核心因素的校正后总销量距离除以直播场次数，可以得到每个核心因素对应的平均销量距离；参见表9，其列举了表8所示的10个核心因素对应的平均销量距离。
[0105][0106]
表9
[0107]
示例性地，基于每个核心因素对应的平均销量距离，生成每个核心因素的资源分配结果的实现方式，可以为：首先将每个核心因素对应的平均销量距离进行累加，例如，表9所示的10个核心因素对应的平均销量距离累加值为：13.3+7.5+12.5+50+40+22.5+22.5+12.5+17.5+12.5＝210.8；接着，依次计算每个核心因素对应的平均销量距离与平均销量距离累加值的比值，该比值即为每个核心因素的资源分配结果，参见表10。
[0108][0109]
表10
[0110]
示例性地，在根据上述步骤得到资源分配结果后，可以将该资源分配结果发送到系统前端，通过页面展示的方式进行展示，便于为运营人员提供资源分匹配的参考依据；或者，也可以在下次进行商品直播时，根据资源分配结果自动化分配底层的计算机资源。
[0111]
在一些实施例中，上述方法还可以包括：在生成每个核心因素的资源分配结果后，基于每个核心因素的资源分配结果，对当前的直播预算进行分配。
[0112]
本技术实施例中，可以将每个核心因素的资源分配结果与当前的直播预算的乘积
值，作为每个核心因素的预算分配值；示例性地，假设当前的直播预算有100万，且基于表10可知主播流量的资源分配结果为6.3％，则可以确定主播流量的预算分配值为6.3万；进一步地，若将主播因素作为核心因素，则可以确定主播因素的资源分配结果为6.3％+3.6％+5.9％＝15.8％，则可以确定主播因素的预算分配值为15.8万；以此类推。
[0113]
可见，本技术实施例中，通过将每个核心因素的资源分配结果作为预算分配的参考，可以解决预算分配没有依据导致成本浪费的问题。
[0114]
本技术实施例提出了一种资源分配方法、装置、电子设备和计算机存储介质，所述方法包括：根据商品直播的历史数据，确定影响所述商品直播的多个核心因素；对获取到的历史直播数据中的异常直播数据进行清洗操作，得到目标数据，从所述目标数据中提取满足设定条件的全量数据集，确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果；所述设定条件是根据所述每个核心因素确定的；根据所述预测影响结果，生成所述每个核心因素的资源分配结果。可以看出，本技术实施例在提取全量数据集之前，会对历史直播数据中的异常直播数据进行清洗操作，以确保全量数据集的有效性，进而，提高资源分配结果的准确性；；另外，本技术实施例可以根据历史直播数据，确定商品的销量数据受到各个核心因素的影响情况，进而，可以根据各个核心因素的影响情况有针对性地生成每个核心因素的资源分配结果，如此，对于计算机底层资源系统，可以根据该资源分配结果实现较为精准的计算机资源分配，进而减少计算机资源浪费的风险。
[0115]
为了能够更加体现本技术的目的，在本技术上述实施例的基础上，进行进一步的说明。
[0116]
图2a为本技术实施例的一种预算分配的流程图，如图2a所示，该流程可以包括四个阶段：影响因素归因分类、数据准备、贡献率确定和预算分配；具体流程为：首先，根据商品直播的历史数据，分析总结影响直播转化率的各个因素，基于业务逻辑对各个因素进行归因分类，得到多个核心因素；然后，基于多个核心因素中的每个核心因素，从历史直播数据中提取满足设定条件的数据集(包括上述全量数据集和训练数据集)；接着，基于每个核心因素对应的数据集，确定每个核心因素的平均贡献率，即，上述资源分配结果；最后，参照该平均贡献率，进行后续直播预算的分配。
[0117]
图2b为本技术实施例的另一种资源分配方法的流程图，如图2b所示，该流程可以包括四个阶段：模型训练、结果预测、距离计算和结果输出；其中，模型训练表示对图2a所示的数据准备阶段的训练数据集进行logistic回归模型训练；再使用训练完成的logistic回归模型，对数据准备阶段的全量数据集中每场直播的销量数据受到多个核心因素中至少一个核心因素的影响进行判断，得到预测影响结果(即结果预测)。然后通过上述距离计算确定每个核心因素的平均贡献率并进行结果输出。
[0118]
可见，本技术实施例使用logistic回归模型对全量数据集中每场直播的各个核心因素进行是非判断，再根据是非判断结果(预测影响结果)计算销量距离和平均销量距离，通过平均销量距离确定每个核心因素的平均贡献率；而平均贡献率可作为后续直播预算投入的指导。
[0119]
这里，可以通过图2c对图2b中的距离计算流程进行说明，参照图2c，该流程可以包括四个阶段：计算直播差值、计算分类差值、计算分类平均差值和计算平均贡献率；这里，直
播差值对应上述每场直播的销量距离；计算分类差值对应上述每个核心因素的总销量距离以及直播场次数；计算分类平均差值对应上述每个核心因素对应的平均销量距离；计算平均贡献率对应上述每个核心因素的平均贡献率；由于上述实施例已经对距离计算流程进行说明，此处不再赘述。
[0120]
图3是本技术实施例的资源分配装置的组成结构示意图，如图3所示，该装置包括：第一确定模块300、得到模块301和第二确定模块302，其中：
[0121]
第一确定模块300，用于根据商品直播的历史数据，确定影响所述商品直播的多个核心因素；
[0122]
得到模块301，用于对获取到的历史直播数据中的异常直播数据进行清洗操作，得到目标数据，从所述目标数据中提取满足设定条件的全量数据集，确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果；所述设定条件是根据所述每个核心因素确定的；
[0123]
第二确定模块302，用于根据所述预测影响结果，生成所述每个核心因素的资源分配结果。
[0124]
在一些实施例中，所述得到模块301，用于确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果，包括：
[0125]
从所述全量数据集中选取部分数据集作为训练数据集，根据所述训练数据集以及所述训练数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素影响的标注结果训练回归模型，得到训练完成的回归模型；
[0126]
利用所述训练完成的回归模型确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响情况，得到预测影响结果。
[0127]
在一些实施例中，所述第二确定模块302，用于根据所述预测影响结果，生成所述每个核心因素的资源分配结果，包括：
[0128]
在根据所述预测影响结果，确定所述全量数据集中每场直播的销量数据受到所述多个核心因素中至少一个核心因素的影响时，确定所述全量数据集中每场直播的销量距离；所述销量距离表示所述每场直播的销量数据与平均销量数据的差值；
[0129]
根据所述全量数据集中每场直播的销量距离以及每个核心因素对应的直播场次数，生成所述每个核心因素的资源分配结果。
[0130]
在一些实施例中，所述第二确定模块302，用于根据所述全量数据集中每场直播的销量距离以及每个核心因素对应的直播场次数，生成所述每个核心因素的资源分配结果，包括：
[0131]
以所述每个核心因素为维度，根据所述全量数据集中每场直播的销量距离，确定所述每个核心因素的总销量距离；所述每个核心因素的总销量距离表示受到所述每个核心因素影响的至少一场直播的销量距离之和；
[0132]
对所述每个核心因素的总销量距离进行校正，得到所述每个核心因素的校正后总销量距离；所述校正后总销量距离为大于零的整数；
[0133]
根据所述每个核心因素的校正后总销量距离和所述直播场次数的比值，确定所述每个核心因素对应的平均销量距离；
[0134]
基于所述每个核心因素对应的平均销量距离，生成所述每个核心因素的资源分配
结果。
[0135]
在一些实施例中，上述装置还包括分配模块，所述分配模块，用于：
[0136]
在生成所述每个核心因素的资源分配结果后，基于所述每个核心因素的资源分配结果，对当前的直播预算进行分配。
[0137]
在一些实施例中，所述多个核心因素包括：主播因素、商品因素、渠道因素。
[0138]
在实际应用中，上述第一确定模块300、得到模块301、第二确定模块302和分配模块均可以由位于电子设备中的处理器实现，该处理器可以为asic、dsp、dspd、pld、fpga、cpu、控制器、微控制器、微处理器中的至少一种。
[0139]
另外，在本实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。
[0140]
集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)或processor(处理器)执行本实施例方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0141]
具体来讲，本实施例中的一种资源分配方法对应的计算机程序指令可以被存储在光盘、硬盘、u盘等存储介质上，当存储介质中的与一种资源分配方法对应的计算机程序指令被一电子设备读取或被执行时，实现前述实施例的任意一种资源分配方法。
[0142]
基于前述实施例相同的技术构思，参见图4，其示出了本技术实施例提供的电子设备400，可以包括：存储器401和处理器402；其中，
[0143]
存储器401，用于存储计算机程序和数据；
[0144]
处理器402，用于执行存储器中存储的计算机程序，以实现前述实施例的任意一种资源分配方法。
[0145]
在实际应用中，上述存储器401可以是易失性存储器(volatile memory)，例如ram；或者非易失性存储器(non-volatile memory)，例如rom、快闪存储器(flash memory)、硬盘(hard disk drive，hdd)或固态硬盘(solid-state drive，ssd)；或者上述种类的存储器的组合，并向处理器402提供指令和数据。
[0146]
上述处理器402可以为asic、dsp、dspd、pld、fpga、cpu、控制器、微控制器、微处理器中的至少一种。可以理解地，对于不同的审计管理平台，用于实现上述处理器功能的电子器件还可以为其它，本技术实施例不作具体限定。
[0147]
在一些实施例中，本技术实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。
[0148]
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处，其相同或相似之处可以互相参考，为了简洁，本文不再赘述。
[0149]
本技术所提供的各方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。
[0150]
本技术所提供的各产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。
[0151]
本技术所提供的各方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。
[0152]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0153]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0154]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0155]
以上，仅为本技术的较佳实施例而已，并非用于限定本技术的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘伟科韩卫召沈俊杰
技术所有人：北京沃东天骏信息技术有限公司
我是此专利的发明人

上一篇：运载工具、装置和方法与流程
上一篇：一种用于钢材输送平台的联动式淬火装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。