主播稳定留存率的预测方法、装置、设备及存储介质与流程

文档序号:18250673发布日期:2019-07-24 09:42阅读:570来源:国知局
主播稳定留存率的预测方法、装置、设备及存储介质与流程
本发明实施例涉及直播技术,尤其涉及一种主播稳定留存率的预测方法、装置、设备及存储介质。
背景技术
:在直播领域,用户在直播平台的稳定留存率能够有效地衡量主播的新用户稳定粘性,是经过验证的、有参考价值且已有效沉淀的用于评估主播的核心指标。目前,t日的稳定留存率的计算公式为:主播t日的新用户在接下来的t+6日中,进入主播直播间3日以上的独立访客数(UV)与进入主播直播间2日以上的独立访客数的比值。显然,t日的稳定留存率需要等到6日后才能统计出来,计算存在滞后性,难以尽早地得到t日的稳定留存率,不利于及时进行运营策略的调整以及主播资源再分配。技术实现要素:本发明实施例提供一种主播稳定留存率的预测方法、装置、设备及存储介质,以尽早地得到t日的稳定留存率。第一方面,本发明实施例提供了一种主播稳定留存率的预测方法,包括:获取主播的直播数据和用户的行为数据;根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,所述计算指标包括:计算日内,主播的直播指标和所述用户的行为指标;将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。第二方面,本发明实施例还提供了一种主播稳定留存率的预测装置,包括:获取模块,用于获取主播的直播数据和用户的行为数据;统计模块,用于根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,所述计算指标包括:计算日内,主播的直播指标和所述用户的行为指标;获得模块,用于将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现任一实施例所述的主播稳定留存率的预测方法。第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如任一实施例所述的主播稳定留存率的预测方法。本发明实施例中,通过获取主播的直播数据和用户的行为数据,并根据主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,从而采用计算日内,能够影响稳定留存率的直播指标和行为指标,预测稳定留存率,有利于提高稳定留存率的准确性,从而更全面地对主播进行评估;通过将计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率,从而通过预测模型得到与计算指标对应的稳定留存率,无需等到计算日6天后才得到,计算日当日就可以有效预测稳定留存率,能够及时进行运营策略的调整以及主播资源再分配。附图说明图1是本发明实施例一提供的一种主播稳定留存率的预测方法的流程图;图2是本发明实施例二提供的一种主播稳定留存率的预测方法的流程图;图3是本发明实施例三提供的一种主播稳定留存率的预测方法的流程图;图4是本发明实施例四提供的一种主播稳定留存率的预测装置的结构示意图;图5是本发明实施例五提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。实施例一图1是本发明实施例一提供的一种主播稳定留存率的预测方法的流程图,本实施例可适用于在稳定留存率的计算日,预测主播稳定留存率的情况,该方法可以由主播稳定留存率的预测装置来执行,该装置可以由硬件和/或软件构成,并一般集成在电子设备中。结合图1,本实施例提供的方法具体包括如下操作:S110、获取主播的直播数据和用户的行为数据。在一可选实施方式中,电子设备拉取一主播的直播视频流,直播视频流除了包括直播图像,还包括直播间用户数、弹幕、礼物、评论等各种数据。基于此,从直播图像中获取主播的直播数据,例如直播时间,直播间用户数;还可以从直播图像中获取直播间内用户的行为数据,例如用户发送的弹幕、礼物等。在另一可选实施方式中,主播侧设备上播、下播,用户侧设备发送弹幕、礼物等均会向直播服务器发送相应的数据,则电子设备从直播服务器获取主播的直播数据和用户的行为数据。S120、根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标。本实施例中,计算指标包括:计算日内,主播的直播指标和所述用户的行为指标。值得说明的是,由于计算指标为稳定留存率的计算日的指标,在获取主播的直播数据和用户的行为数据时,可以仅获取计算日的直播数据的行为数据即可。可选地,主播的直播指标至少包括:开播时长和预设时长转化率中的一种;所述用户的行为指标至少包括:弹幕率、人均发弹幕数和订阅率中的一种。其中,开播时长为主播在计算日的开播总时长。预设时长包括5分钟、10分钟、30分钟、60分钟等,预设时长转化率为直播观看时长达到预设时长以上的用户数与用户总数的比值。弹幕率为发送弹幕的用户数与用户总数的比值。人均发弹幕率为发送弹幕总数与用户总数的比值。订阅率为计算日新增订阅数与新增用户的比值。S130、将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。从上述统计指标中可以看出,主播的直播指标和用户的行为指标能够一定程度上反映用户对主播的喜爱程度,进而直接影响了新增用户的粘性,在接下来的几天中,如果新用户粘性大,则会频繁进入该主播的直播间,如果新用户粘性小,则会较少进入该主播的直播间,从而影响到主播对新用户的稳定留存率。本实施例中,为了尽快得到稳定留存率,获取能够影响稳定留存率的计算指标,在计算日当日就预测稳定留存率。具体地,预先训练一预测模型,用于输入计算指标,并输出计算日的稳定留存率。基于此,将S120统计的计算指标输入至预测模型中,得到计算日的稳定留存率。可选地,预测模型包括但不限于回归预测模型、卡尔曼滤波预测模型和神经网络预测模型。本发明实施例中,通过获取主播的直播数据和用户的行为数据,并根据主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,从而采用计算日内,能够影响稳定留存率的直播指标和行为指标,预测稳定留存率,有利于提高稳定留存率的准确性,从而更全面地对主播进行评估;通过将计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率,从而通过预测模型得到与计算指标对应的稳定留存率,无需等到计算日6天后才得到,计算日当日就可以得到稳定留存率,能够及时进行运营策略的调整以及主播资源再分配。实施例二本实施例对上述实施例的各可选实施方式进一步优化,具体地,在计算指标中加入增长率指标和/或历史指标。图2是本发明实施例二提供的一种主播稳定留存率的预测方法的流程图,包括以下操作:S210、获取主播的直播数据和用户的行为数据。S220、根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标。所述计算指标包括:计算日内,主播的直播指标和所述用户的行为指标;还包括:增长率指标和/或历史指标。对于增长率指标:计算日的历史时段内主播的直播指标相对于计算日的增长率,以及所述历史时段内所述用户的行为指标相对于计算日的增长率。其中,历史时段可以是计算日之前的任意长度的时段。现有的稳定留存率的计算公式为:主播t日(计算日)的新用户在接下来的t+6日中,进入主播直播间3日以上的独立访客数(UV)与进入主播直播间2日以上的独立访客数的比值。可见,t-5~t-1的稳定留存率会受到t日之后计算指标的影响,而t-5~t-1的计算指标会影响到t-10~t-6的稳定留存率。因此,为了保证所有指标在t日和t日之前均能获取到,将历史时段应在t-5的基础上往前推一个周期,确定历史时间段为t-10~t-6。对于历史指标:所述历史时段内,主播的综合直播指标和所述用户的综合行为指标,和/或,所述历史时段内的综合稳定留存率。可选地,主播的综合直播指标包括历史时段内主播的直播指标均值、最大值或者最小值。用户的综合行为指标包括历史时段内用户的行为指标均值、最大值或者最小值。综合稳定留存率包括历史时段内稳定留存率的均值、最大值或者最小值。S230、将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。将上述至少两种计算指标输入至预设的预设模型中,得到计算日的稳定留存率。本实施例中,在计算日的指标基础上,增加了增长率指标和/或历史指标。增长率指标能够反映直播指标和行为指标的横向增长情况,历史指标能够囊括影响计算日指标的因素,从而采用增加的指标预测稳定留存率,能够显著提高计算准确性。实施例三本实施例对上述实施例的各可选实施方式进一步优化,具体地,本实施例提供了预测模型的训练操作,以便根据预测模型直接预测稳定留存率。图3是本发明实施例三提供的一种主播稳定留存率的预测方法的流程图,具体包括以下操作:S310、获取历史计算日的稳定留存率样本和所述稳定留存率样本的计算指标样本。为了方便描述和区分,将训练预测模型需要的稳定留存率和计算指标,分别称为稳定留存率样本和计算指标样本。具体地,获取多个历史计算日,例如t-10、t-11、t-20等,并获取每个历史计算日的稳定留存率样本和计算指标样本。其中,稳定留存率样本可以根据
背景技术
提供的方法得到。计算指标样本包括历史计算日内,主播的直播指标和所述用户的行为指标;还可以包括以历史计算日为起算点的增长率指标和/或历史指标。在一具体应用场景中,直播平台包括多个品类,例如美食、户外、歌舞等,主播会在某个品类下直播。因此,考虑到稳定留存率可能会受到品类的影响,在获取计算指标样本时,可以获取某一品类下主播的直播指标和用户的行为指标参与模型训练。当然,如果忽略掉品类对稳定留存率的影响,可以获取多个品类下主播的直播指标和用户的行为指标参与模型训练。可选地,为了提高模型训练质量,对样本数据进行筛选。在S310之后,还包括:获取所述稳定留存率样本和计算指标样本对应的主播信息;去除不满足预设要求的主播信息对应的稳定留存率样本以及计算指标样本。在一示例中,主播信息包括主播月活跃用户数排名、历史稳定留存率均值、新用户7日内留存2天的用户数量、周开播天数中的至少一种。如果主播月活跃用户数排名大于1000,则去除该主播月活跃用户数对应的稳定留存率样本以及计算指标样本;如果历史稳定留存率均值小于等于0,去除该历史稳定留存率对应的稳定留存率样本以及计算指标样本;如果新用户7日内留存2天的用户数量小于等于50,去除对应的稳定留存率样本以及计算指标样本;如果周开播天数小于4天,去除该周开播天数对应的稳定留存率样本以及计算指标样本。S320、根据所述计算指标样本和所述稳定留存率样本,训练预测模型。在对计算指标样本和稳定留存率样本进行筛选后,将筛选后的数据分为训练数据集和测试数据集。通过训练数据集对预设模型进行训练,再通过测试数据集对训练后的预设模型进行测试。可选地,预测模型为多元线性回归模型;S320包括:采用计算指标构建多元线性回归模型的自变量,并采用稳定留存率构建多元线性回归模型的因变量;根据所述计算指标样本和所述稳定留存率样本,训练所述多元线性回归模型的截距和自变量的系数。在一示例中,使用PythonSklearn中的LinearRegression构建并训练多元线性回归模型。其中,Sklearn使用最小二乘法进行线性回归,sklearn对DataMining的各类算法已经有了较好的封装,其中的LinearRegression使用最小二乘法进行线性回归,支持多元线性回归。基本可以使用fit、predict、score来训练、评价模型,并使用模型进行预测。表1示出了训练后的多元线性回归模型中各自变量的系数和截距。表1自变量系数开播时长5e-05订阅率0.215328弹幕率0.000345人均弹幕数0.000518……截距0.16366得到训练后的预测模型后,可以进一步进行模型评估。本实施例一方面通过回归评价指标进行模型评估,另一方面通过预测数据集进行模型评估。以多元线性回归模型为例,回归评价指标包括均方误差根(RMSE)和R平方(R2)。RMSE是预测值与真实值的误差平方根的均值,R2又称为模型的确定性系数(coefficientofdetermination)。具体的模型评估方法详见现有技术,此处不再赘述。本实施例中,通过对表1示出的模型进行R2评估,得到相关系数约0.634,中等偏强相关,模型符合要求。根据表1示出的多元线性回归模型对测试数据集进行稳定留存率的预测,预测结果如表2所示。表2可见,预测值与真实值的差值在-10%~+10%以内的数量达到70%以上,预测效果良好,预测模型符合要求。S330、获取主播的直播数据和用户的行为数据。S340、根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标。其中,计算指标包括计算日内,主播的直播指标和所述用户的行为指标;还可以包括上述增长率指标和/或历史指标。S350、将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。本实施例中,通过构建多元线性回归模型,将直播指标、行为指标等核心指标作为模型的因变量,从而全面对主播的稳定留存率进行评估,有利于提高稳定留存率计算的准确性。后续可使用该预测模型对主播进行排序、潜力主播挖掘、差异化主播管理、短期核心数据监控;而且,该预测模型可分品类、分地区进行训练,从而得到适用于不同品类和地区的预测模型。实施例四图4是本发明实施例四提供的一种主播稳定留存率的预测装置的结构示意图。本实施例可适用于在稳定留存率的计算日,预测主播稳定留存率的情况。结合图4,本实施例提供的装置包括:获取模块41、统计模块42和获得模块43。获取模块41,用于获取主播的直播数据和用户的行为数据;统计模块42,用于根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,所述计算指标包括:计算日内,主播的直播指标和所述用户的行为指标;获得模块43,用于将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。本发明实施例中,通过获取主播的直播数据和用户的行为数据,并根据主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,从而采用计算日内,能够影响稳定留存率的直播指标和行为指标,预测稳定留存率,有利于提高稳定留存率的准确性,从而更全面地对主播进行评估;通过将计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率,从而通过预测模型得到与计算指标对应的稳定留存率,无需等到计算日6天后才得到,计算日当日就可以得到稳定留存率,能够及时进行运营策略的调整以及主播资源再分配。可选地,所述主播的直播指标至少包括:开播时长和预设时长转化率中的一种;所述用户的行为指标至少包括:弹幕率、人均发弹幕数和订阅率中的一种。可选地,所述计算指标还包括:所述计算日的历史时段内主播的直播指标相对于计算日的增长率,以及所述历史时段内所述用户的行为指标相对于计算日的增长率。可选地,所述计算指标还包括:所述历史时段内,主播的综合直播指标和所述用户的综合行为指标,和/或,所述历史时段内的综合稳定留存率。可选地,该装置还包括训练模块,用于在所述将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率之前,获取历史计算日的稳定留存率样本和所述稳定留存率样本的计算指标样本;根据所述计算指标样本和所述稳定留存率样本,训练预测模型。可选地,该装置还包括筛选模块,用于在获取历史计算日的稳定留存率样本和所述稳定留存率样本的计算指标样本之后,获取所述稳定留存率样本和计算指标样本对应的主播信息;去除不满足预设要求的主播信息对应的稳定留存率样本以及计算指标样本。可选地,预测模型为多元线性回归模型;训练模块在根据所述计算指标样本和所述稳定留存率样本,训练预测模型时,具体用于:采用计算指标构建多元线性回归模型的自变量,并采用稳定留存率构建多元线性回归模型的因变量;根据所述计算指标样本和所述稳定留存率样本,训练所述多元线性回归模型的截距和自变量的系数。本发明实施例所提供的主播稳定留存率的预测装置可执行本发明任意实施例所提供的主播稳定留存率的预测方法,具备执行方法相应的功能模块和有益效果。实施例五图5是本发明实施例五提供的一种电子设备的结构示意图,如图5所示,该电子设备包括处理器50、存储器51;电子设备中处理器50的数量可以是一个或多个,图5中以一个处理器50为例;电子设备中的处理器50、存储器51可以通过总线或其他方式连接,图5中以通过总线连接为例。存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的主播稳定留存率的预测方法对应的程序指令/模块(例如,主播稳定留存率的预测装置中的获取模块41、统计模块42和获得模块43)。处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的主播稳定留存率的预测方法。存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。实施例六本发明实施例六还提供一种其上存储有计算机程序的计算机可读存储介质,该计算机程序在由计算机处理器执行时用于执行一种主播稳定留存率的预测方法,该方法包括:获取主播的直播数据和用户的行为数据;根据所述主播的直播数据和用户的行为数据,统计稳定留存率的计算指标,所述计算指标包括:计算日内,主播的直播指标和所述用户的行为指标;将所述计算指标输入至预设的预测模型中,得到所述计算日的稳定留存率。当然,本发明实施例所提供的一种其上存储有计算机程序的计算机可读存储介质,该计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的主播稳定留存率的预测方法中的相关操作。通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。值得注意的是,上述主播稳定留存率的预测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1