一种基于随机森林模型的微信公众号ROI预估方法及装置与流程

文档序号:20876746发布日期:2020-05-26 16:39阅读:686来源:国知局
一种基于随机森林模型的微信公众号ROI预估方法及装置与流程

本发明属于微信公众号广告投放技术领域,尤其涉及一种基于随机森林模型的微信公众号roi预估方法及装置。



背景技术:

微信公众平台主要面向名人、政府、媒体、企业等机构推出的合作推广业务。在这里可以通过渠道将品牌推广给线上平台作用。在微信公众号上进行广告推广是一种常见的广告推广方式。

但是企业在进行广告投放时需要考虑的投资回报率,投资回报率是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报,因此需要一种能够对微信公众号进行投资回报估计的技术。



技术实现要素:

本发明提供一种基于随机森林模型的微信公众号roi预估方法及装置,旨在解决不能对微信公众号的投资回报率进行预估的问题。

本发明是这样实现的,一种基于随机森林模型的微信公众号roi预估方法及装置,包括以下步骤:

s1、分别提取多个微信公众号的用户活跃数据和文本数据;

s2、将所述文本数据与预设文本词库相比较,以获取文本数据是否为广告、情感是否积极的特征信息;

s3、将所述用户活跃数据、步骤s2获得的所述特征信息输入和其对应微信公众号的roi是否高于预设值的特征信息到所述随机森林,从而训练所述随机森林模型;

s4、预估时,输入待预测公众号的特征信息到训练完成的随机森林模型,输出roi符合预设要求的概率值。

优选的,所述用户活跃数据包括阅读数、点赞数和留言数。

优选的,所述文本词库包括积极情感词库、消极情感词库和广告词库。

优选的,步骤s3中,所述训练所述随机森林模型具体为:

根据所述阅读数是否高于预设阅读数,将多个微信公众号分为a1类和a2类;

根据所述点赞数是否高于预设点赞数,将多个微信公众号分为b1类和b2类;

根据比较所述文本信息中的积极情感词的数量是否高于消极情感词的数量,将多个微信公众号分为c1类和c2类;

根据所述文本信息中广告词是否多于预设数量,将多个微信公众号分为d1类和d2类;

根据微信公众号的roi是否高于预设值,将多个微信公众号分为e1类和e2类,同时检测e1类或e2类中的微信公众号在分别满足a1类、a2类、b1类、b2类、c1类、c2类、d1类和d2类中任意1~8种条件的比例是否高于50%;

当e1类公众号高于50%时,将roi高于预设值作为输入待测试公众号的用户活跃数据和文本数据时的满足对应条件时roi输出结果;

当e2类公众号高于50%时,将roi低于预设值作为输入待测试公众号的用户活跃数据和文本数据时的满足对应条件时roi输出结果。

优选的,步骤s3中,所述预设值为2。

本发明的一种基于随机森林模型的微信公众号roi预估装置,包括:

数据采集模块,其用于分别提取多个微信公众号的用户活跃数据和文本数据;

数据处理模块,其用于将所述文本数据与预设文本词库相比较,以获取文本数据是否为广告、情感是否积极的特征信息;

随机森林预估模型,其用于通过将所述用户活跃数据、所述特征信息和其对应微信公众号的roi是否高于预设值的特征信息输入到所述随机森林模型进行模型训练,并且在训练完成后对待预估微信公众号进行roi是否高于预设值的预估结果。

优选的,所述用户活跃数据包括阅读数、点赞数和留言数。

优选的,所述文本词库包括积极情感词库、消极情感词库和广告词库。

优选的,所述训练所述随机森林模型具体为:

根据所述阅读数是否高于预设阅读数,将多个微信公众号分为a1类和a2类;

根据所述点赞数是否高于预设点赞数,将多个微信公众号分为b1类和b2类;

根据比较所述文本信息中的积极情感词的数量是否高于消极情感词的数量,将多个微信公众号分为c1类和c2类;

根据所述文本信息中广告词是否多于预设数量,将多个微信公众号分为d1类和d2类;

根据微信公众号的roi是否高于预设值,将多个微信公众号分为e1类和e2类,同时检测e1类中的微信公众号在分别满足a1类、a2类、b1类、b2类、c1类、c2类、d1类和d2类中任意1~8种条件的百分比,并将其作为输入待测试公众号的用户活跃数据和文本数据时的满足对应条件时roi输出结果。

优选的,所述预设值为2。

与现有技术相比,本发明的有益效果是:本发明的一种基于随机森林模型的微信公众号roi预估方法及装置,通过依次分别提取多个微信公众号的用户活跃数据和文本数据,将文本数据与预设文本词库相比较,以获取文本数据是否为广告、情感是否积极的特征信息,将用户活跃数据、特征信息和其对应微信公众号的roi是否高于预设值的特征信息输入到随机森林模型,从而训练随机森林模型,预估时,输入待预测公众号的特征信息到训练完成的随机森林模型,输出roi符合预设要求的概率值,从而能够为广告投放提供数据上的参考,智能化的规避不好的投放任务。

附图说明

图1为本发明的一种基于随机森林模型的微信公众号roi预估方法的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

请参阅图1,本发明提供一种技术方案:一种基于随机森林模型的微信公众号roi预估方法及装置,微信公众号roi预估方法,其特征在于:包括以下步骤:

s1、分别提取多个微信公众号的用户活跃数据和文本数据。用户活跃数据包括阅读数、点赞数和留言数,文本词库包括积极情感词库、消极情感词库和广告词库。

s2、将文本数据与预设文本词库相比较,以获取文本数据是否为广告、情感是否积极的特征信息。

s3、将用户活跃数据、步骤s2获得的特征信息输入和其对应微信公众号的roi是否高于2的特征信息到随机森林模型,从而训练随机森林模型。

根据阅读数是否高于预设阅读数,将多个微信公众号分为a1类和a2类。

根据点赞数是否高于预设点赞数,将多个微信公众号分为b1类和b2类。

根据比较文本信息中的积极情感词的数量是否高于消极情感词的数量,将多个微信公众号分为c1类和c2类。

根据文本信息中广告词是否多于预设数量,将多个微信公众号分为d1类和d2类。

根据微信公众号的roi是否高于预设值2,将多个微信公众号分为e1类和e2类,同时检测e1类中的微信公众号在分别满足a1类、a2类、b1类、b2类、c1类、c2类、d1类和d2类中任意1~8种条件的百分比,并将其作为输入待测试公众号的用户活跃数据和文本数据时的满足对应条件时roi输出结果。

s4、预估时,输入待预测公众号的特征信息到训练完成的随机森林模型,输出roi符合预设要求的概率值。

本发明的一种基于随机森林模型的微信公众号roi预估装置包括:数据采集模块、数据处理模块和随机森林预估模型。

数据采集模块用于分别提取多个微信公众号的用户活跃数据和文本数据。用户活跃数据包括阅读数、点赞数和留言数。文本词库包括积极情感词库、消极情感词库和广告词库。

数据处理模块用于将文本数据与预设文本词库相比较,以获取文本数据是否为广告、情感是否积极的特征信息。

随机森林预估模型用于通过将用户活跃数据、特征信息和其对应微信公众号的roi是否高于预设值的特征信息输入到随机森林进行模型训练。根据阅读数是否高于预设阅读数,将多个微信公众号分为a1类和a2类。根据点赞数是否高于预设点赞数,将多个微信公众号分为b1类和b2类。根据比较文本信息中的积极情感词的数量是否高于消极情感词的数量,将多个微信公众号分为c1类和c2类。根据文本信息中广告词是否多于预设数量,将多个微信公众号分为d1类和d2类。根据微信公众号的roi是否高于预设值2,将多个微信公众号分为e1类和e2类,同时检测e1类中的微信公众号在分别满足a1类、a2类、b1类、b2类、c1类、c2类、d1类和d2类中任意1~8种条件的百分比,并将其作为输入待测试公众号的用户活跃数据和文本数据时的满足对应条件时roi输出结果。并且在训练完成后对待预估微信公众号进行roi是否高于预设值的概率。

本发明的一种基于随机森林模型的微信公众号roi预估方法及装置,通过依次分别提取多个微信公众号的用户活跃数据和文本数据,将文本数据与预设文本词库相比较,以获取文本数据是否为广告、情感是否积极的特征信息,将用户活跃数据、特征信息和其对应微信公众号的roi是否高于预设值的特征信息输入到随机森林模型,从而训练随机森林模型,预估时,输入待预测公众号的特征信息到训练完成的随机森林模型,输出roi符合预设要求的概率值,从而能够为广告投放提供数据上的参考,智能化的规避不好的投放任务。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1