一种基于用户画像体系的营销系统的制作方法

文档序号:20758392发布日期:2020-05-15 17:42阅读:323来源:国知局
一种基于用户画像体系的营销系统的制作方法

本发明涉及用户画像搭建领域,具体而言,涉及一种基于用户画像体系的营销系统及方法。



背景技术:

在移动互联网时代,随着电子商务企业的服务和产品日渐丰富,精细化营销与个性化服务成为了企业重要竞争力,用户画像的概念应运而生,依托企业自身的数据积累,从海量数据中抽象出各类标签,将用户形象具体化,形成画像。如今的电子商务早已步入了大数据时代,每天都会产生大量客户访问行为数据和消费记录,日积月累,各个来源的客户数据不再只是孤岛数据,通过用户规则多源联合,可将电脑端的网站用户形象化的描述出来,形成了人物原型,帮助企业充分了解用户,及时掌握其当前状态、行为偏好和潜在需求等信息,对企业整体业务发展尤为重要。

现有机器预测算法与模型已经比较常用,如gbdt(gradientboostingdecisiontree)梯度提升迭代决策树。gbdt也是boosting算法的一种,但是和adaboost算法不同;区别如下:adaboost算法是利用前一轮的弱学习器的误差来更新样本权重值,然后一轮一轮的迭代;gbdt也是迭代,但是gbdt要求弱学习器必须是cart模型,而且gbdt在模型训练的时候,是要求模型预测的样本损失尽可能的小。gbdt机理是:每一轮预测和实际值有残差,下一轮根据残差再进行预测,最后将所有预测相加,就是结果。支持向量机方法svm针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能。svm基于结构风险最小化理论之上在特征空间中构建最优超平面,使得学习器得到全局最优化,并且在整个样本空间的期望以某个概率满足一定上界。

决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树的典型算法有id3,c4.5,cart等;决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪技:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数扼集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除。

随机森林的构建过程:从原始训练集中使用bootstraping方法随机有放回采样选出m个样本,共进行n_tree次采样,生成n_tree个训练集;对于n_tree个训练集,我们分别训练n_tree个决策树模型;对于单个决策树模型,假设训练样本特征的个数为n,那么每次分裂时根据信息增益/信息增益比/基尼指数选择最好的特征进行分裂;每棵树都一直这样分裂下去,直到该节点的所有训练样例都属于同一类。在决策树的分裂过程中不需要剪枝;将生成的多棵决策树组成随机森林。对于分类问题,按多棵树分类器投票决定最终分类结果;对于回归问题,由多棵树预测值的均值决定最终预测结果。

在企业客户管理中,了解客户,可以更好地服务客户。通过标签的属性值刻画用户,对市场营销方面,如制定方案、推广渠道、营销内容、网站页面的个性化推荐等,有一定的指导意义,同时对客服与用户沟通过程中,及时展示用户的信息,可用针对性的提供咨询服务,为企业销售和服务赋能,提升客户在网站的体验感,给企业带来持续性的稳定效益。因此提出一种基于用户画像体系的营销系统,通过海量的客户数据,勾画目标用户,将用户的每个具体信息抽象成标签,利用这些标签将用户具体化,辅助精细化营销,为用户提供有针对性的服务很有必要。



技术实现要素:

本发明目的是,在现有技术的背景下,提出一种基于用户画像体系的营销系统,基于用户访问行为数据、购买记录以及线下记录等数据,搭建一个适合企业核心业务特色的用户画像体系,同时借助业务逻辑策略的制定或者一些数据模型和算法对用户不完善的标签尽可能全面的推测出来,将用户画像体系应用到销售系统、运营系统中,及时提供有价值的参考信息,快速且准确的响应网站的用户需求,提高企业精细化营销的效果。

本发明的技术方案是,一种基于用户画像体系的营销方法,基于用户画像体系的营销系统包括:数据源模块、制定用户标签体系模块、标签开发模块和应用模块。

所述数据源模块,搜集多源数据,存储在数据仓库中最原始的数据源层,主要用户在完整注册的基本信息、购买记录、访问行为和线下咨询和第三方数据等。

所述制定用户标签体系模块,大数据产品人员与业务方共同制定适合当前核心业务特色的用户标签体系。

所述标签开发模块,包含建立用户oneid、用户全数据整合和统计与数据建模三个子模块。

所述应用模块,包含标签管理、新建用户群和筛选营销目标用户群三个子模块,主要应用在精细化营销方面。

包括如下步骤:

步骤1:对网站客户数据收集,包括用户在完整注册的基本信息、购买记录、访问行为和线下咨询和第三方数据等,存储在数据仓库中最原始的数据源层。

步骤2:大数据产品人员与业务方共同制定适合当前业务特色的用户标签体系,确定标签层级和类别。

步骤3:建立用户身份识别唯一的oneid,一个用户在画像体系中只能有一个身份识别,需要借助业务上规则,尽可能识别出同一个人在不同位置产生的数据。从而可以在oneid之后,则用户数据进行整合,同一个用户的数据集中清洗与处理,将用户数据按主题联合成宽表存储在数据仓库的明细层。

步骤4:根据步骤2制定的标签体系逻辑规则,借助统计方法和模型实现各类标签的计算,输出到数据仓库的集市层。

步骤5:开发标签管理页面,展示当前一级标签下面一共有多少子标签,以及各类子标签对应的用户覆盖量,监测标签制定是否合理。同时可以通过多个标签联动,形成新的用户群,观察这部分用户的其他特征。

步骤6:开发用户分群详情页面,运营可以筛选指定分群用于精细化营销,直接输出目标用户,通过接口传到运维人员,统一进行短信或者邮件等方式推广;或者连接到客服后台系统,支持客服自主搜索或者直接关联到指定用户画像,展示用户信息,辅助客服用针对性服务客户。

根据步骤4制定的标签体系逻辑规则,借助统计方法和模型实现各类标签的计算,输出到数据仓库中的集市层;预测类的标签基于统计的数据进行模型训练,先利用采样算法解决数据不平衡问题,对特征进行归一化处理后,进行变量选择,可以通过lasso算法,与因变量相关性强的自变量选出来,消除自变量的多重共线性,从而训练集只保留相关性高的重要变量,随后可选择不同算法进行预测模型的训练,决策树,svm,随机森林,gdbt,根据模型效果选择最优算法。

有益效果:基于多源数据、勾画目标用户,将用户的每个具体信息抽象成标签,利用这些标签将用户具体化,搭建一个适合企业核心业务特色的用户画像体系,同时借助业务逻辑策略的制定或者一些数据模型和算法对用户不完善的标签尽可能全面的推测出来,将用户画像体系应用到销售系统、运营系统中,及时提供有价值的参考信息,快速且准确的响应网站的用户需求,提高企业精细化营销的效果。

附图说明

图1是本发明实施例中基于用户画像体系的营销系统的流程示意图。

图2是本发明实施例中基于用户画像体系的营销系统的结构示意图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。

参阅图1所示,本发明实施例为一种基于用户画像体系的营销系统的方法流程,具体步骤为:

步骤11:对网站客户数据收集,包括用户在完整注册的基本信息、购买记录、访问行为和线下咨询和第三方数据等,存储在数据仓库中最原始的数据源层。

步骤12:大数据产品人员与业务方共同制定适合当前业务特色的用户标签体系,大数据方向的人员梳理用户画像体系偏战略和技术实现,业务方则偏管理和应用方向,双方的意见最终融合,从层级和类别上建立标签,可以保证画像体系全面但不散乱,维度不孤立,且标签之间有关联;制定标签属性必须遵循能覆盖所有用户但又不交叉的原则,例如用户婚育状态,属性可以为已婚未育、已婚已育、单身三个属性值之间没有交叉,但是如果已婚和已育两个状态,则存在交叉,标签设计不合理。不同业务对应的标签分类也不一样,需要围绕核心业务制定,例如保险业务一级分类可以分为基本属性、社交关系、投保行为、风险信息、保障偏好、保障情况、用户价值、服务信息等。

步骤13:建立用户身份识别唯一的oneid,搜集的数据有的标记用户身份的是网站注册账号,有的是手机号,有的是邮箱,有的是访客cookie,等等,但是一个用户在画像体系中只能有一个身份识别,需要借助业务上规则,尽可能识别出同一个人在不同位置产生的数据,这样才能保证画像的准确性。从而可以在oneid之后,则用户数据进行整合,同一个用户的数据集中清洗与处理,将数据按主题联合成宽表存储在数据仓库的明细层。

步骤14:根据步骤12制定的标签体系逻辑规则,借助统计方法和模型实现各类标签的计算,输出到数据仓库的集市层。其中基础信息可以通过用户的注册信息获得,但像是否有孩子,是否有车,用户消费能力等级,不能直接从用户的数据取到,需要建立数据模型才能计算出来或者推测出来。例如用户所在地,优先取用户注册时填写的地区,如果没有填写,则取手机号匹配的地区,如果手机号匹配仍为空,则取身份证匹配地区,尽可能覆盖到全部用户;例如是否有孩子,通过筛选出决定是否有孩子的用户行为特征,访问儿童相关产品次数,固定时间段访问次数,年龄,地区,搜索关键词次数等,进行模型训练,不断调试,当准确率达到95%以上,即可预测用户是否有孩子。对于活跃度、某产品兴趣得分等一系列的标签,使用变异系数法进行加权得分,可以简单又能保证效果不错的输出标签。

如果是是否有孩子,是否有车等这一类标签,优先选准确率高的模型,准确率差不多的情况,依据召回率再做选择;对于购买意向险种这一类标签应当首选召回率,其次准确率作为模型的评估依据,在召回率达到80%,准确率达到95%以上,则模型效果达到最优,经过测试,gdbt模型效果优于其他模型,具体应用根据模型效果选择,再利用训练好的模型预测输出标签;对于活跃度、某产品兴趣得分等一系列的标签,使用变异系数法进行加权得分,活跃度根据业务数据特征,选择最近一次登录时间、登录周期和近13个月登录天数作为指标,具体实施方法,第一步进行三个指标的计算,第二步根据公式

vi=σi/μi

其中σi为标准偏差,μi是均值,计算出每个指标的变异系数,第三步计算各指标的权重

第四步根据y=w1x1+w2x2+w3x3,计算每个用户的指标得分,且利用拉依达准则法,即对于y大于μ+3σ或小于μ-3σ的实验数据值作为异常值,其中大于μ+3σ的取最高值,小于μ-3σ的取最小值,第五步将指标得分标准化,每个用户输出0-100以内的分值。x1、x2、x3是第一步的三个指标(登录时间、登录周期和近13个月登录天数作为指标);

步骤15:编写标签管理页面,展示当前一级标签下面一共有多少子标签,以及各类子标签对应的用户覆盖量,监测标签制定是否合理;同时通过多个标签联动,形成新的用户群,标签根据目前已生成的用户标签选择,新建分群时设置的分群有效期,根据筛选的标签自定义用户群名称,例如地区南京且平台偏好使用app的男性,显示覆盖用户总数,观察这部分用户的其他标签特征,辅助运营和客服等人员保留自己需要持续观察的用户群。有权限的人可以对用户群进行修改,待有效期终止,则用户群自动删除,运营人员需要重新定义。做推广活动时,直接点击相关的用户群,提取出用户明细,后续即可对他们进行营销短信或者邮件的推送。

例如,用户活跃度标签,有80%以上的用户是活跃性高的,则显然这个标签逻辑不合理,需要调整。同时可以通过多个标签联动,形成新的用户群,观察这部分用户的其他特征,辅助运营和客服等人员保留自己需要持续观察的用户群。

步骤16:开发用户分群详情页面,运营可以筛选指定分群用于精细化营销,直接输出目标用户,通过接口传到运维人员,统一进行短信或者邮件等方式推广,例如节假日前三天,筛选出偏好旅游的客户推送旅游险;或者连接到客服后台系统,支持客服自主搜索或者直接关联到指定用户画像,展示用户信息,辅助客服用针对性服务客户,例如在线客服在答复客户咨询问题的同时,用户分群详情页面快速通过客户id匹配上,展示出该用户的一系列标签,客服能够更好地与客户沟通,精准知道客户当前诉求,为其推荐适合的产品或者服务,提升用户体验感。

参阅图2所示,本发明实施例的系统结构,包括:

数据源模块21、制定用户标签体系模块22、标签开发模块23、应用模块24。

数据源模块21,根据用户规则获取用户访问网站或者线下咨询等留下的基础数据,以及用户基本信息和购买行为数据,可能来自于业务系统、文本文件或者其他数据源。

制定用户标签体系模块22,大数据产品人员和业务方共同围绕核心业务制定适合业务方向的标签体系,全面的刻画网站用户。

标签开发模块23,包括三个子模块:建立用户oneid子模块231、用户全数据整合子模块232和统计与数据建模子模块233,借助业务逻辑与统计模型实现一站式开发出用户标签体系。

建立用户oneid子模块231,搜集的数据有的标记用户身份整合为一个统一的身份识别id。

用户全数据整合子模块232,对同一个id在不同位置产生的数据,对用户数据进行整合、清洗、存储。

统计与数据建模子模块233,画像标签规则结合算法建模,两者缺一不可,在实际的应用中,算法难以解决的问题,利用简单的规则也可以达到很好的效果。

应用模块24,包括标签管理子模块、新建用户群子模块和筛选营销目标用户群子模块。标签管理子模块,在实际的应用中,用户画像会产生一定的波动,为了解决这个问题,建设了相应的管理与监控系统,对画像的质量进行监控,及时发现异常或者设计不合理的标签;新增用户群子模块,运营、客服等人员可以个性化通过多个标签联动,形成新的用户群,观察这部分用户的其他特征,保留用户群的定义,可以持续观察;筛选营销目标用户群子模块实现用户画像体系接入销售系统、客服系统和运营系统的后台,通过接口对接运维,辅助制定促销计划与提供客服针对性的服务,提高营销转化率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1