定位种子用户的方法、装置、电子设备和存储介质与流程

文档序号:18108544发布日期:2019-07-06 11:50阅读:140来源:国知局
定位种子用户的方法、装置、电子设备和存储介质与流程

本发明实施例涉及通信技术领域,特别是一种定位种子用户的方法、装置、电子设备和存储介质。



背景技术:

种子用户是指除自己反复消费外,还能为企业带来新用户的特殊常客,是在一个社交圈中具有影响力的用户。

若可以确定一个社交圈中种子用户,则企业可以有针对性对种子用户展开产品的营销活动,利用种子用户自身的影响力在社交圈推广产品,以达到事半功倍的效果。

可见,如何挖掘出种子用户对于营销活动是非常重要的。

简单介绍现有技术中挖掘具有影响力的用户的方式:

将每一用户视为一个节点,根据各用户在社会网络有向图中的关注-粉丝关系,以及leaderrank(领导地位)算法,确定有影响力的节点(用户)。

现有技术的缺陷在于:只能得到具有影响力的用户,但无法确定具有影响力的用户会利用其影响力对某个产品进行推广,也就是说,无法确定该用户是否为种子用户。



技术实现要素:

针对现有技术的缺陷,本发明实施例提供一种定位种子用户的方法、装置、电子设备和存储介质。

一方面,本发明实施例提供一种定位种子用户的方法,所述方法包括:

根据目标社群,构建相似度矩阵,所述目标社群包括多个用户,至少一个用户为推荐者;

采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心,其中,所述聚类算法的初始影响力系数是根据推荐者的nps评分得到的;

若所述聚类中心是推荐者,则将所述聚类中心定位为种子用户。

另一方面,本发明实施例提供一种定位种子用户的装置,所述装置包括:

构建模块,用于根据目标社群,构建相似度矩阵,所述目标社群包括多个用户,至少一个用户为推荐者;

聚类模块,用于采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心,其中,所述聚类算法的初始影响力系数是根据推荐者的nps评分得到的;

定位模块,用于若所述聚类中心是推荐者,则将所述聚类中心定位为种子用户。

另一方面,本发明实施例还提供一种电子设备,包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上方法的步骤。

另一方面,本发明实施例还提供一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上方法的步骤。

由上述技术方案可知,本发明实施例提供的定位种子用户的方法、装置、电子设备和存储介质,所述方法通过根据推荐者的nps评分,得到影响力系数的初始值,使得到的集群可能尽可能的以推荐者为聚类中心,若得到的聚类中心是推荐者,将该推荐者作为种子用户,从而实现精准的定位种子用户。

附图说明

图1为本发明实施例提供的一种定位种子用户的方法的流程示意图;

图2为本发明实施例提供的社会网络有向图的示意图;

图3为本发明又一实施例提供的分类模型的构建和应用示意图;

图4为本发明又一实施例提供的一种定位种子用户的装置的结构示意图;

图5为本发明又一实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明实施例一部分实施例,而不是全部的实施例。

图1示出了本发明实施例提供的一种定位种子用户的方法的流程示意图。

如图1所示,本发明实施例提供的方法具体包括以下步骤:

步骤11、根据目标社群,构建相似度矩阵,所述目标社群包括多个用户,至少一个用户为推荐者;

可选地,本发明实施例的方法在挖掘定位种子用户的装置上实现,挖掘定位种子用户的装置可为计算机。

可选地,对目标社群进行分析,所述目标社群包括多个用户,获取每一用户的nps(netpromoterscore,净促进者得分,又称净推荐值)评分。

可选地,nps是一种衡量某个用户是否会向其他人推荐某个企业或产品的指数。

可选地,根据现有技术的方式确定每一用户的nps评分,根据愿意推荐的程度让用户在0-10之间来打分,然后根据nps评分来对用户分类:

推荐者(得分在9-10之间):会继续购买并引见给其他人。被动者(得分在7-8之间):总体满意,也会考虑其他竞争对手的产品。贬损者(得分在0-6之间):不满意。

可选地,若该目标社群中包括至少一个推荐者,则针对该目标社群,构造相似度矩阵。

可选地,相似度矩阵包括每两个用户的相似度。

可选地,两用户的相似度表示两个用户的距离,也就是亲疏关系。

步骤12、采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心,其中,所述聚类算法的初始影响力系数是根据推荐者的nps评分得到的;

可选地,聚类是指对目标群体进行分析,找到目标群体的聚类中心,该聚类中心是该目标群体中影响力最大的用户。

可选地,根据至少一个推荐者的nps评分,得到所述聚类算法的初始影响力系数,所述聚类算法的初始影响力系数代表着该用户的潜在影响力,表示该用户可能是聚类中心。

可选地,若得到该目标群体的聚类中心,将目标群体中的其他的用户视为该聚类中心下的点。一个目标群体只有一个用户可以作为聚类中心。

可选地,采用现有技术的方式进行聚类,例如ap(affinitypropagation,吸引力传播)聚类算法。

可选地,每两用户的相似度,很大程度上可以影响聚类效果。若相似度高,表示这两个用户距离近,连接得很紧密,这两个用户很可能向同一个方向,同一个用户聚集。

因此,通过聚类算法,可以得到各用户聚集的趋势,从而得到聚类中心。

步骤13、若所述聚类中心是推荐者,则将所述聚类中心定位为种子用户。

可选地,得到可作为聚类中心的用户后,判断该用户是否为调查问卷中的产品的推荐者。

若所述聚类中心是推荐者,则认为该用户是种子用户,种子用户是指除自己反复消费外,还能为企业带来新用户的特殊常客。也就是说,该用户可能会利用自身的影响力向目标群体中的用户推荐该产品。

在此基础上,可针对种子用户这一个用户进行营销活动,例如为种子用户推送最高优先级的优惠,可不向目标群体的其他用户推送最高优先级的优惠。最高优先级的优惠是指最大力度的优惠。

可选地,种子用户收到最高优先级的优惠后,使得种子用户有理由向目标群体的其他用户推广该产品。

由于种子用户是群体中最有影响力的用户,种子用户下的其他用户使用该产品的可能性大,营销活动的效果比较好,且有针对性的对一个种子用户给予最大力度的优惠,能够最大限度的减少产品营销的盲目性,营销效果好,且可以降低营销的成本。

若聚类中心的用户不是产品的推荐者,则该用户不是种子用户,若是被动者,若还有资源,为种子用户推送次高优先级的优惠,若是贬损者,不向该用户推送优惠。

在本发明实施例中,根据包括推荐者的目标社群,构建社会网络有向图,使得一个社会网络有向图中至少具有一个推荐者,后续针对包括推荐者的社会网络有向图进行聚类,通过将推荐者的nps评分,得到影响力系数的初始值,使得到的集群可能尽可能的以推荐者为聚类中心。

若聚类中心确实是推荐者,应用本发明实施例实现了精准的定位种子用户,可以确定具有影响力的聚类中心会利用其影响力对产品进行推广。

可以理解的是,若不确定目标社群中是否包括推荐者,就进行聚类,得到一个具有影响力的聚类中心,有可能出现这种情况:实际上该聚类中心的用户是贬损者,向聚类中心下的用户散播产品的负面消息。本发明实施例中,不仅可以定位得到具有影响力的用户,更可定位得到种子用户,可以确定种子用户会利用其影响力对某个产品进行推广。

本实施例提供的定位种子用户的方法,通过根据推荐者的nps评分,得到影响力系数的初始值,使得到的集群可能尽可能的以推荐者为聚类中心,若得到的聚类中心是推荐者,将该推荐者作为种子用户,从而实现精准的定位种子用户。

在上述实施例的基础上,本发明又一实施例提供的定位种子用户的方法,采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心,其中,所述聚类算法的初始影响力系数是根据推荐者的nps评分得到的的步骤具体为:

根据所述目标社群,构建社会网络有向图;

根据所述社会网络有向图,构建邻接矩阵,所述邻接矩阵包括每个用户的相邻关系;

根据所述邻接矩阵,构建网络影响矩阵,所述网络影响矩阵包括每个用户的影响力;

根据所述网络影响矩阵,构建相似度矩阵;

根据所述相似度矩阵,进行聚类,得到聚类中心。

可选地,社会网络有向图是指用户之间因为互动形成的相对稳定的关系体系,社会网络有向图将用户的社交圈抽象成图,图中的顶点表示社会网络有向图中的用户,边则表示用户之间的关系。

可选地,在本发明实施例中为了更简洁直观的呈现社会网络有向图,以5位用户为例进行说明。

图2为本发明实施例提供的社会网络有向图的示意图。

如图2所示,选取目标社群中三个月内有联系记录(通话或短信)的用户,构建社会网络有向图g<v,e>,其中,顶点v={v1,v2,v3,…vn},vi为目标社群中的用户,n表示用户的数量,e为目标社群的社会网络有向图的边的集合,<vi,vj>为其中一条连接顶点i和j的边,例如,<v0,v1>有两条边,一条表示一个联系记录:用户v0向v1发起联系,以及v1向v0发起联系。

可选地,根据社会网络有向图g构建g的邻接矩阵(adjacencymatrix)a,a是表示顶点之间相邻关系的矩阵。

可选地,邻接矩阵a包括多个元素,ai,j是邻接矩阵a的第i行,第j列的元素,每一元素表示用户i和用户j是否有通话记录。

若用户i和用户j有联系记录,则用户i和用户j边存在,ai,j=1,否则ai,j=0。

可选地,根据邻接矩阵a,得到网络影响矩阵f,网络影响矩阵f表示各顶点(用户)经过时间t后,每一个用户的影响力。

可选地,根据邻接矩阵,得到网络影响矩阵的方式有多种,本发明实施例以其中一种为例进行说明。

可选地,根据邻接矩阵,得到网络影响矩阵的步骤具体为:

根据以下公式得到网络影响矩阵:

f=(a+i)t

其中,a为邻接矩阵,i为单位矩阵,t为单位时间,t={1,2,3…t},t为正整数n。

可选地,t为1表示1个单位时间,在经过1个单位时间后,f中每一元素表示经过1个单位时间后,一个用户的影响力。

经过t个单位时间,f为一个t维矩阵,每一用户为一个行向量fi:

fi={fi1,fi2,fi3…fit}

可选地,根据所述网络影响矩阵,构建相似度矩阵的方式有多种,本发明实施例以其中一种为例进行说明。

可选地,根据欧氏距离,得到网络影响矩阵中每两个用户的相似度,得到相似度矩阵。

可选地,根据所述网络影响矩阵,构建相似度矩阵的步骤具体为:

s(i,k)=-‖fi-fk‖2(i,k=1,2,…n;i≠k)

式中,s(i,k)为用户i和用户k的相似度,fi和fk分别为用户i和用户k的影响力。

对于i=k的情况,s(k,k)为ap算法的初始影响力系数,需要小于0,影响力越大越接近0。以nps评分结果为依据,对评分进行一个负值化处理(实质为坐标平移):

p′k=pk-(max(p)+1)(k=1,2,3…n)

其中,k代表用户编号,p为用户nps评分序列,pk代表客户k的nps分数,p′k代表负值化之后分数,变换之后评分越高,越接近0,那么客户间的按分数得出的影响力关系不变。此数代表着该数据点的潜在影响力,以及以此点为中心可能产生的聚类大小。

本实施例其他步骤与前述实施例步骤相似,本实施例不再赘述。

本实施例提供的定位种子用户的方法,社会网络有向图构建邻接矩阵,根据邻接矩阵构建网络影响矩阵,根据网络影响矩阵构建相似度矩阵,根据相似度矩阵进行聚类,可以快速准确的得到聚类中心。

在上述实施例的基础上,本发明又一实施例提供的定位种子用户的方法,根据所述相似度矩阵,进行聚类,得到聚类中心的步骤具体为:

根据所述相似度矩阵,通过吸引力传播ap聚类算法进行聚类,得到聚类中心。

可选地,ap聚类算法是基于节点在目标社群中的影响力,来选择目标社群中合适的聚类中心。

可选地,ap聚类算法在开始时,将所有节点(用户)都当作潜在的聚类中心,然后通过节点之间的通信,找出最合适作聚类中心的节点,并将其他节点划分到这个聚类中心之下,使用ap聚类算法可以快速发现一个集群的聚类中心。

可选地,ap聚类算法能通过节点之间的消息传递发现聚类的方法,能在较短时间内发现低误差聚类,也不需要像k-means算法在运行算法之前确定聚类的用户的数量。

本实施例其他步骤与前述实施例步骤相似,本实施例不再赘述。

本实施例提供的定位种子用户的方法,采用ap聚类算法计算量小,可以简单精确的得到聚类中心。

在上述实施例的基础上,本发明又一实施例提供的定位种子用户的方法,根据所述相似度矩阵,通过吸引力传播ap聚类算法进行聚类,得到聚类中心的步骤具体为:

初始化吸引信息矩阵以及归属信息矩阵;

根据所述相似度矩阵,更新吸引信息矩阵以及归属信息矩阵;

根据更新后的吸引信息矩阵以及归属信息矩阵,确定每一用户作为聚类中心的适合程度;

根据每一用户作为聚类中心的适合程度,得到聚类中心。

可选地,基于所述相似度矩阵,通过ap聚类算法来进行聚类,实现的步骤如下:

ap聚类算法的输入是一个节点间的相似度矩阵s,s(i,k)表示节点i和节点k之间的相似度。

ap聚类算法节点间传递的消息有两类:吸引度和归属度。将吸引信息矩阵以及归属信息矩阵初始化为0。

利用影响相似度矩阵s更新r和a:

其中,r(i,k)表示客户k对与客户i的吸引程度的积累,a(i,k′)表示除客户k外其他客户对客户i的归属度,s(i,k)为客户i与k的相似度,s(i,k′)为客户i与除k外其他客户的相似度。

其中a(i,k)表示客户i以客户k作为聚类中心的适合程度,a(k,k)表示客户k作为聚类中心的能力,r(k,k)表示客户k有多不适合被划分到其他聚类中心,r(i′,k)客户k对对其他节点的吸引度。

c)对于得到的r(i,k)与a(i,k)的结果,找到k使得r(i,k)+a(i,k)结果最大,便保留这条边,若k=i,则表示i为本次迭代中的聚类中心,无须添加边。不断迭代,直到r(i,k)+a(i,k)的结果经再经历10次迭代后不再改变,则认为聚类完成。对于每次迭代,还增加了衰减系数λ避免震荡:(t为本次迭代)

rt+1(i,k)←(1-λ)rt+1(i,k)+λrt(i,k)

at+1(i,k)←(1-λ)at+1(i,k)+λat(i,k)

本实施例其他步骤与前述实施例步骤相似,本实施例不再赘述。

本实施例提供的定位种子用户的方法,通过采用ap聚类算法,根据所述相似度矩阵,更新吸引信息矩阵以及归属信息矩阵,可以高效准确的得到聚类中心。

在上述实施例的基础上,本发明又一实施例提供的定位种子用户的方法,根据目标社群,构建相似度矩阵的步骤之前,所述方法包括:

收集目标社群中每一用户的行为特征;

将所述行为特征输入至预先建立的分类模型,输出每一用户的净推荐值nps评分;

根据每一用户的nps评分,确定目标社群中是否包括推荐者。

虽然通过调查问卷的方式可以得到目标社群中每一用户的nps评分,但这种方式需要等待用户反馈后才能进行,效率不高,且用户打分可能受心情影响,不能精确的反映用户对该产品的评分。

因此,在本发明实施例中,采用分类模型,对目标社群中的用户进行分类,以实现高效、准确的得到用户的评分。

可选地,收集目标社群中的用户的行为特征,例如消费习惯、应用的业务和使用的套餐等。

可选地,将用户的行为特征输入至预先建立分类模型,输出该用户的nps评分。

可选地,分类模型是根据已知的行为特征和已知的nps评分进行训练得到的,根据分类模型可以确定影响用户nps评分的关键特征,从而实现输入用户的行为特征,输出该用户的nps评分。

可选地,构建分类模型的方式可有多种,本发明实施例以其中一种方式为例进行说明。

可选地,根据多个样本用户的行为特征,以及每一样本用户的nps评分,采用多分类逻辑回归模型进行学习训练,得到所述分类模型。

可选地,根据4c(customer顾客、cost成本、convenience便利和communication沟通)营销理论,确定具有消费能力的样本目标社群。

对样本目标社群中的三个月内有联系记录的用户派发调查问卷,进行nps调研,以获取nps调研结果,并结合用户行为特征作为模型的样本。

可选地,用户行为特征可能是高维数据,利用主成分分析法对高维数据进行降维,去除冗余的用户行为特征,得到降维后的行为特征。

可选地,主成分分析法是利用降维的思想,把多个变量(行为特征)转化为少数几个综合变量(即主成分),其中,每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。引进多高维变量的同时,将复杂变量归结为几个主成分,使问题简单化,同时得到的结果是科学有效的数据信息。

可选地,以降维后的样本用户的行为特征作为自变量,以得到的nps评分作为因变量,使用多分类逻辑回归模型进行建模,以得到分类模型。

可选地,多分类逻辑回归模型针对因变量有多个取值而且无大小顺序的情况,一般的线性回归分析无法准确地刻画变量之间的因果关系,采用多分类逻辑回归模型可以很好的解决这类问题。

可选地,在得到nps评分后根据分类规则对用户分类:推荐者(得分在9-10之间),被动者(得分在7-8之间),贬损者(得分在0-6之间):不满意。

可选地,若包括至少一个推荐者,则执行步骤11,若该目标社群中没有推荐者,可不应用本发明实施例的方法。

本实施例其他步骤与前述实施例步骤相似,本实施例不再赘述。

本实施例提供的定位种子用户的方法,采用分类模型,对目标社群中的用户进行分类,以实现高效、准确的得到用户的评分。

为了更充分理解本发明的技术内容,在上述实施例的基础上,详细说明本实施例提供的定位种子用户的方法。

现有技术中利用leaderrank等算法在大规模稀疏网络下很容易造成计算量过大的情况,而且直接利用rank类算法,没有针对性,不能保证筛选出来的客户有较高的选择该产品的倾向。

本方案设计的数据挖掘算法流程是基于nps客户评分来聚类。nps评分是作为客户对移动产品评价好坏的依据,评分越高表示对产品越满意,也越愿意推荐给周围的人。而选择的ap聚类算法(affinitypropagationclusteringalgorithm,以下简称ap算法)是基于数据点在数据集合中的影响力来选择合适的社群,将nps评分作为ap算法影响力系数的初始值,使得到的集群可能尽可能的以nps高分用户为中心,最大化nps高分用户的影响力和传播力。把这类用户为种子客户,帮助产品在该集群中的传播,可以加强种子营销的效果,使得种子营销的目标更加合理,使利润最大化。

方案概述

本方案是通过ap聚类算法为客户进行社区分群,利用多分类逻辑回归得到客户在群体中的nps分类情况,并针对产品推荐者(通过nps模型输出)的客户和社交影响力算法,发掘出社交群体中的具有高影响力及高响应力的客户进行精准营销。整个方案的主要流程是:a、nps分类阶段:对客户样本通过市场营销4c理论圈定样本特征,通过因子分析除去冗余特征指标,然后建立多分类逻辑回归模型,保证模型学习到分类准确率最高且最稳定的模型系数,并利用其求得客户的nps分类。b、客户分群阶段:先圈定客户样本,利用客户的交往圈信息构造邻接矩阵,然后通过ap算法以a中得到的nps评分为推荐者的客户为高影响力客户,为所有客户样本划分社会区,最后得到的聚类中心便为种子客户。

图3为本发明又一实施例提供的分类模型的构建和应用示意图。

如图3所示,nps方法通过简洁直接地提问,能够反映客户对企业的整体体验感知。本方案从客户行为特征出发,找出影响深圳移动客户nps感知的关键因素,提炼nps指标体系,以用于发现社群中对移动产品感到满意并乐于推荐的客户。

1、对三个月内的客户进行nps调研,以获取前期nps调研结果,并结合客户行为特征作为模型的样本。

2、通过市场营销的4c理论,梳理客户对产品的喜爱推荐意愿,得到初步的分析维度,再利用主成分分析法得到降维后的客户特征,提炼业务指标。主要方法为:

a)变量相关性检验:检验变量间是否适合做因子分析,利用kmo值作为检验标准,一般地,kmo值越接近1,sig.值越接近0,说明变量间相关性越强,适合做因子分析。

b)主成分分析提取因子:根据变量相关系数矩阵,采用主成分分析法提取因子并选取特征根(一般要求大于1).

c)因子解释并输出因子得分:结合业务,对提取到的因子进行命名并计算因子得分。

3、将提炼后的指标作为自变量,客户nps调研结果作为因变量,使用多分类逻辑回归建模。多分类logistic回归方法研究多个因变量与自变量之间的关系,如因变量y有j个分类,以其中一个类别作为参考类别,其它类别与其相比可生成j-1个logit模型,其模型参数可根据自变量设定。

4、从模型结果,归纳nps感知指标体系,得到能够产生nps分类的模型,对社群中客户的nps进行分类,记录下评分为推荐者的客户群体。

(3)客户分群

为了找到客户群体中的种子客户,对全体群体搜索并不现实,需要对客户构建交往圈网络,基于nps评分,为其分成多个交往群,在交往群中挖掘种子用户。

本技术方案首先需利用客户交往圈数据构造邻接矩阵,再根据ap算法为客户分群。ap算法因为其能通过数据点之间的消息传递发现聚类的方法,能在较短时间内发现低误差聚类,也不需要在运行算法之前确定聚类的个数,加上以客户nps评分为基准,尽可能以推荐者客户聚类,将社群中影响力大的,也愿意推荐移动产品的客户作为种子客户。具体步骤如下:

选取客户三个月内的交往圈对象,即在三个月内有通话记录的客户号码及对方号码,统计通话的次数,形成交往圈有向图网络g,以此构造邻接矩阵a。这里令图为g<v,e>,其中顶点v={v1,v2,v3,…vn},vi为交往圈中的客户,n表示客户的数量。e为交往圈图边的集合,<vi,vj>为其中一条连接顶点i和j的边,若此边存在,令ai,j=1,否则ai,j=0,。

为计算出在一定间隔时间内客户对整个网络可能产生的影响,利用矩阵乘法计算g中顶点经过时间t后的网络影响矩阵f,f=(a+i)t,其中s为邻接矩阵,i为单位矩阵,得出f后其行向量fi={fi1,fi2,fi3…fit}。

代表了节点i经过t时间后对整个网络的影响,这里t={1,2,3}。

为求出所有客户对网络的影响的相似度,利用欧氏距离,计算方法如下:

s(i,k)=-‖fi-fk‖2(i,k=1,2,…n;i≠k)

其中i,k为任意两个客户节点,fi,fk为任意两个影响向量。对于i=k的情况,s(k,k)为ap算法的初始影响力系数,需要小于0,影响力越大越接近0。以nps评分结果为依据,对评分进行一个负值化处理(实质为坐标平移):p′k=pk-(max(p)+1)(k=1,2,3…n)其中k代表客户编号,p为客户nps评分序列,pk代表客户k的nps分数,p′k代表负值化之后分数,变换之后评分越高,越接近0,那么客户间的按分数得出的影响力关系不变。此数代表着该数据点的潜在影响力,以及以此点为中心可能产生的聚类大小。

基于相似度,通过ap算法来进行聚类,ap算法的实现如下:

初始化吸引信息矩阵r,归属信息矩阵a为0

利用影响相似度矩阵s更新r和a:

其中r(i,k)表示客户k对与客户i的吸引程度的积累,a(i,k′)表示除客户k外其他客户对客户i的归属度,s(i,k)为客户i与k的相似度,s(i,k′)为客户i与除k外其他客户的相似度。

其中a(i,k)表示客户i以客户k作为聚类中心的适合程度,a(k,k)表示客户k作为聚类中心的能力,r(k,k)表示客户k有多不适合被划分到其他聚类中心,r(i′,k)客户k对对其他节点的吸引度。

c)对于得到的r(i,k)与a(i,k)的结果,找到k使得r(i,k)+a(i,k)结果最大,便保留这条边,若k=i,则表示i为本次迭代中的聚类中心,无须添加边。不断迭代,直到r(i,k)+a(i,k)的结果经再经历10次迭代后不再改变,则认为聚类完成。对于每次迭代,还增加了衰减系数λ避免震荡:(t为本次迭代)

rt+1(i,k)←(1-λ)rt+1(i,k)+λrt(i,k)

at+1(i,k)←(1-λ)at+1(i,k)+λat(i,k)

对比于现有的挖掘种子用户的方法,本发明实施例的有益效果对比如下表:

本发明实施例,基于客户nps评分,绘制客户的交往圈,使用ap算法得到聚类中心,若聚类中心是nps高分用户,则可作为种子用户。

利用了客户交往圈数据,使用多分类逻辑回归学习出nps高分客户,加上ap算法更加精准的定位了种子客户,证了筛选出来的客户是有产品使用和推荐欲望的客户,而现有技术只是考虑了影响力的排序,而没有考虑到高影响力客户是否愿意推荐和使用移动产品,相比之下本方法提高了精准营销的目性与效率。

本实施例提供的定位种子用户的方法,通过根据推荐者的nps评分,得到影响力系数的初始值,使得到的集群可能尽可能的以推荐者为聚类中心,若得到的聚类中心是推荐者,将该推荐者作为种子用户,从而实现精准的定位种子用户。

图4为本发明又一实施例提供的一种定位种子用户的装置的结构示意图。

参照图4,在上述实施例的基础上,本实施例提供的定位种子用户的装置,所述装置包括构建模块41、聚类模块42和定位模块43,其中:

构建模块41用于根据目标社群,构建相似度矩阵,所述目标社群包括多个用户,至少一个用户为推荐者;聚类模块42用于采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心,其中,所述聚类算法的初始影响力系数是根据推荐者的nps评分得到的;定位模块43用于若所述聚类中心是推荐者,则将所述聚类中心定位为种子用户。

本实施例提供的定位种子用户的装置,可用于执行上述方法实施例的方法,本实施不再赘述。

本实施例提供的定位种子用户的装置,聚类模块针对包括推荐者的社会网络有向图进行聚类,若得到的聚类中心是推荐者,定位模块将该推荐者作为种子用户,从而实现精准的定位种子用户。

图5示出了本发明又一实施例提供的一种电子设备的结构示意图。

参阅图5,本发明实施例提供的电子设备,所述电子设备包括存储器(memory)51、处理器(processor)52、总线53以及存储在存储器51上并可在处理器上运行的计算机程序。其中,所述存储器51、处理器52通过所述总线53完成相互间的通信。

所述处理器52用于调用所述存储器51中的程序指令,以执行所述程序时实现如图1的方法。

在另一种实施方式中,所述处理器执行所述程序时实现如下方法:

采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心的步骤具体为:

根据所述目标社群,构建社会网络有向图;

根据所述社会网络有向图,构建邻接矩阵,所述邻接矩阵包括每个用户的相邻关系;

根据所述邻接矩阵,构建网络影响矩阵,所述网络影响矩阵包括每个用户的影响力;

根据所述网络影响矩阵,构建相似度矩阵;

根据所述相似度矩阵,进行聚类,得到聚类中心。

在另一种实施方式中,所述处理器执行所述程序时实现如下方法:

根据所述网络影响矩阵,构建相似度矩阵的步骤具体为:

根据欧氏距离,得到网络影响矩阵中每两个用户的相似度,得到相似度矩阵。

在另一种实施方式中,所述处理器执行所述程序时实现如下方法:

根据所述相似度矩阵,进行聚类,得到聚类中心的步骤具体为:

根据所述相似度矩阵,通过吸引力传播ap聚类算法进行聚类,得到聚类中心。

在另一种实施方式中,所述处理器执行所述程序时实现如下方法:

根据所述相似度矩阵,通过吸引力传播ap聚类算法进行聚类,得到聚类中心的步骤具体为:

初始化吸引信息矩阵以及归属信息矩阵;

根据所述相似度矩阵,更新吸引信息矩阵以及归属信息矩阵;

根据更新后的吸引信息矩阵以及归属信息矩阵,确定每一用户作为聚类中心的适合程度;

根据每一用户作为聚类中心的适合程度,得到聚类中心。

在另一种实施方式中,所述处理器执行所述程序时实现如下方法:

根据目标社群,构建相似度矩阵的步骤之前,所述方法包括:

收集目标社群中每一用户的行为特征;

将所述行为特征输入至预先建立的分类模型,输出每一用户的净推荐值nps评分;

根据每一用户的nps评分,确定目标社群中是否包括推荐者。

在另一种实施方式中,所述处理器执行所述程序时实现如下方法:

将所述行为特征输入至预先建立的分类模型,输出每一用户的净推荐值nps评分的步骤之前,所述方法还包括:

根据多个样本用户的行为特征,以及每一样本用户的nps评分,采用多分类逻辑回归模型进行学习训练,得到所述分类模型。

本实施例提供的电子设备,可用于执行上述方法实施例的方法对应的程序,本实施不再赘述。

本实施例提供的电子设备,通过所述处理器执行所述程序时实现通过根据推荐者的nps评分,得到影响力系数的初始值,使得到的集群可能尽可能的以推荐者为聚类中心,若得到的聚类中心是推荐者,将该推荐者作为种子用户,从而实现精准的定位种子用户。

本发明又一实施例提供的一种存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现如图1的步骤。

在另一种实施方式中,所述程序被处理器执行时实现如下方法:

采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心的步骤具体为:

根据所述目标社群,构建社会网络有向图;

根据所述社会网络有向图,构建邻接矩阵,所述邻接矩阵包括每个用户的相邻关系;

根据所述邻接矩阵,构建网络影响矩阵,所述网络影响矩阵包括每个用户的影响力;

根据所述网络影响矩阵,构建相似度矩阵;

根据所述相似度矩阵,进行聚类,得到聚类中心。

在另一种实施方式中,所述程序被处理器执行时实现如下方法:

根据所述网络影响矩阵,构建相似度矩阵的步骤具体为:

根据欧氏距离,得到网络影响矩阵中每两个用户的相似度,得到相似度矩阵。

在另一种实施方式中,所述程序被处理器执行时实现如下方法:

根据所述相似度矩阵,进行聚类,得到聚类中心的步骤具体为:

根据所述相似度矩阵,通过吸引力传播ap聚类算法进行聚类,得到聚类中心。

在另一种实施方式中,所述程序被处理器执行时实现如下方法:

根据所述相似度矩阵,通过吸引力传播ap聚类算法进行聚类,得到聚类中心的步骤具体为:

吸引信息矩阵以及归属信息矩阵;

根据所述相似度矩阵,更新吸引信息矩阵以及归属信息矩阵;

根据更新后的吸引信息矩阵以及归属信息矩阵,确定每一用户作为聚类中心的适合程度;

根据每一用户作为聚类中心的适合程度,得到聚类中心。

在另一种实施方式中,所述程序被处理器执行时实现如下方法:

根据目标社群,构建相似度矩阵的步骤之前,所述方法包括:

收集目标社群中每一用户的行为特征;

将所述行为特征输入至预先建立的分类模型,输出每一用户的净推荐值nps评分;

根据每一用户的nps评分,确定目标社群中是否包括推荐者。

在另一种实施方式中,所述程序被处理器执行时实现如下方法:

将所述行为特征输入至预先建立的分类模型,输出每一用户的净推荐值nps评分的步骤之前,所述方法还包括:

根据多个样本用户的行为特征,以及每一样本用户的nps评分,采用多分类逻辑回归模型进行学习训练,得到所述分类模型。

本实施例提供的存储介质,所述程序被处理器执行时实现上述方法实施例的方法,本实施不再赘述。

本实施例提供的存储介质,通过根据推荐者的nps评分,得到影响力系数的初始值,使得到的集群可能尽可能的以推荐者为聚类中心,若得到的聚类中心是推荐者,将该推荐者作为种子用户,从而实现精准的定位种子用户。

本发明又一实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:

根据目标社群,构建相似度矩阵,所述目标社群包括多个用户,至少一个用户为推荐者;

采用预设的聚类算法,对所述相似度矩阵的用户进行聚类,得到聚类中心,其中,所述聚类算法的初始影响力系数是根据推荐者的nps评分得到的;

若所述聚类中心是推荐者,则将所述聚类中心定位为种子用户。

本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。

本领域技术人员可以理解,实施例中的各步骤可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。

虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1