一种集装箱运输行业客户价值的评价方法与流程

文档序号:36427220发布日期:2023-12-20 22:45阅读:47来源:国知局
一种集装箱运输行业客户价值的评价方法与流程

本发明涉及集装箱运输行业领域,特别涉及一种集装箱运输行业客户价值的评价方法。


背景技术:

1、对于当下的很多企业,由于客户规模、利润贡献度等不同,不同的客户对企业贡献的价值具有较大的差异性,往往80%的利润是由20%的客户提供的;而如果企业对待客户一视同仁,可能会造成客户流失、丢失潜在客户等风险。所以企业有必要对客户进行分类,针对不同类型的客户以采取不同的服务政策与管理策略,使企业有限的资源进行优化配置,以实现高产出。而对于拥有几十、上百万客户的企业,远远超过了人工手段进行价值和分类管理的极限。因此,为了实现对海量客户分类管理,使企业有限资源合理分配使用,建立一个量化的价值和分类体系成为本领域技术人员待解决的技术问题。


技术实现思路

1、为了解决海量客户分类管理实现企业有限资源合理分配使用的问题,本发明提出了一种集装箱运输行业客户价值的评价方法,通过业务数据加工整合、设计客户价值模型、聚类分析、合理分配资源几个步骤形成客户价值分类体系,通过利用机器学习的聚类算法不断优化,可以有效的加强企业对客户的分类和管理,帮助企业合理使用有限的市场营销资源。

2、本发明提供具体方案如下:

3、一种集装箱运输行业客户价值的评价方法,包括如下步骤:

4、s1、业务数据加工整合:从异构数据源采集业务数据并分类为客户资料数据、销售模型数据、运输路径数据和港口航程数据;对分类后的数据合并数据格式,完成后将合并数据格式后的数据同步至clickhouse高性能列式数据库,分别对应存储在客户资料数据表、销售模型数据表、运输路径数据表和港口航程数据表中;

5、s2、设计客户价值模型并计算客户模型指标:将客户资历l、平均运价系数c引入客户价值通用模型rfm,并将集装箱周转量m的指标计算方式设定为集装箱周转量=订单中集装箱数×海里,从而构成新的客户价值模型即lrfmc模型,所述lrfmc模型包括指标为:客户资历l、最近订单间隔r、订单次数f、集装箱周转量m、平均运价系数c,然后根据s1中数据表中的数据计算每个客户的lrfmc模型指标;

6、s3、聚类分析:对s2中计算所得的lrfmc模型指标使用标准差标准化的方法处理后得到标准化的指标数据zl、zr、zf、zm、zc,利用k-means聚类算法做聚类分析,得到不同客户价值的分类;

7、s4、根据客户分级结果分配资源:根据s3得到的客户价值分类结果对客户进行分级,针对不同级别客户分配不同的资源。

8、优选的,实现s1中所述业务数据同步至clickhouse高性能列式数据库方法为:

9、s11:同步客户资料数据:使用开源的异构数据整合产品datax同步数据,编写json格式的配置文件,启动datax同步任务,由所述datax的采集模块从源数据库采集所述客户数据,所述客户数据包括:客户名、客户id、区域、省州和创建日期,经过所述datax的中间件模块的格式合并、数据转换,最后由所述datax的写入模块同步至clickhouse数据库,并存储到相应数据表中;

10、s12:同步销售模型数据:使用开源的异构数据整合产品datax同步数据,编写json格式的配置文件,启动datax同步任务,由所述datax的采集模块从源数据库采集所述销售模型数据,所述销售模型数据包括:客户id、订单编号、出运日期、主航次、箱号、箱型尺寸、订单到箱金额、订单到箱成本,经过所述datax的中间件模块的格式合并、数据转换,最后由所述datax的写入模块同步至clickhouse数据库,并存储到相应数据表中;

11、s13:同步运输路径数据:使用开源的异构数据整合产品datax同步数据,编写json格式的配置文件,启动datax同步任务,由所述datax的采集模块从源数据库采集所述运输路径数据,所述运输路径数据包括:订单编号、路径序号、装港、卸港,经过所述datax的中间件模块的格式合并、数据转换,最后由所述datax的写入模块同步至clickhouse数据库,并存储到相应数据表中;

12、s14:同步港口航程数据:使用开源的异构数据整合产品datax,编写json格式的配置文件,启动datax同步任务,由所述datax的采集模块从csv文件中采集所述港口航程数据,所述csv文件是包含三种来源的港口航程数据的文件,所述港口航程数据是从一个港口到另一个港口的航行距离,经过所述datax的中间件模块的格式合并、数据转换,最后由所述datax的写入模块同步至clickhouse数据库,并存储到相应数据表中。

13、优选的,获取s14中csv文件的具体步骤为:

14、s141、将船舶运营信息管理系统voi的港到港航程配置,抽取形成包含港口航程数据的csv文件;

15、s142、对于voi系统中没有覆盖的港口航程数据,结合internet上的数据资料予以补充,完善s141中所述csv文件;

16、s143、由于中转运输情况,s141和s142中均未覆盖的港口航程数据,可结合所述业务数据中多程航次运输路径的实际航程为基准,以及航行经营中存在的年度性调整,形成具有现实意义的多程港口航程数据,并补充到s142中所述csv文件,所述多程港口航程数据包含年度、始发港、目的港、航程数据,计算所述多程港口航程数据的具体步骤如下:

17、s1431、按年度归结始发港到目的港且所述始发港到所述目的港的港口航程数据不在s141和s142所述csv文件中的订单集orders,对于订单p∈orders,记sp为该订单实际运输路径中多个航次的航程之和;

18、s1432、对s1431中所述所有sp进行递增排序,取20%分位值作为多程港口航程数据。

19、优选的,计算s2中lrfmc模型指标逻辑为:

20、s21、计算客户资历l:由所述客户资料中当前客户创建日期到当前日期的差值,以月为单位计算;

21、s22、计算最近订单间隔r:由所述销售模型数据中当前客户最近的订单出运日期到当前日期的差值,以天为单位计算;

22、s23、计算订单次数f:统计所述销售模型数据中唯一订单号的总数量;

23、s24、计算集装箱周转量m:∑订单集装箱周转量,其中:

24、订单集装箱周转量=订单的标准箱量*订单的航程所述订单的标准箱量取自销售模型数据中的箱型尺寸进行折算,20尺箱及以下计1teu,40尺箱及以上计2teu;所述订单的航程是根据订单的始发港、目的港为条件在所述港口航程数据中获取的航程;

25、s25、计算平均运价系数c,计算步骤如下:

26、s251、基于当前客户所有订单按月度、始发港、目的港计算平均成本覆盖率avgc,

27、avgc=soa/soc

28、其中soa为订单金额,soc为订单成本;

29、s252、计算单个订单成本覆盖率orderc:

30、orderc=oa/oc

31、其中oa为当前订单金额,oc为当前订单成本;

32、s253、计算订单成本覆盖率系数ordercindex:

33、ordercindex=orderc/oavgc

34、其中oavgc为根据当前订单的出运日期、始发港、目的港计算得到的平均成本覆盖率;

35、s254、计算平均运价系数c,

36、c=[∑(ordercindex*orderm)]/∑orderm

37、其中orderm为每个订单的订单航程。

38、优选的,实现s3中利用k-means聚类算法做聚类分析的步骤为:

39、s31、指标标准化:使用标准差标准化的方法,对lrfmc模型指标l、r、f、m、c进行处理,得到对应的标准化的指标数据zl、zr、zf、zm、zc;

40、s32、执行聚类算法:将s31中得到的标准化的指标数据执行k-means聚类算法,得到各个指标的聚类结果;

41、s33、聚类结果分析:将s32中的聚类结果的各项特征中心值进行分值离散转化,得到聚类分析结果。

42、优选的,s32中k-means聚类算法实现步骤为:

43、s321、随机选取k个聚类质心点为μ1,μ2,...,μk∈rn;

44、s322、对于每一个样例i,计算其应该属于的聚类

45、

46、其中,c(i)代表样例i与k个聚类中距离最近的那个聚类,j表示k个聚类中的一个聚类;

47、s323、对于每一个聚类j,重新计算该聚类的质心

48、

49、其中,μj为当前聚类的质心;

50、s324、重复迭代s322和s323直到质心不变或者变化很小。

51、优选的,s321中确定k的值的方法为:任一指标数据集的误差平方和sse计算公式如下,

52、

53、当k值小于真实聚类数时,k的增加对聚类效果产生影响较大,sse下降幅度很大,当k值大于真实聚类数时,k的增加对聚类效果产生影响较小,sse下降幅度将会趋于平缓;整个sse-k图为一个手肘型,根据手肘法,将sse-k图上的拐点作为k的最佳值;确定k=8作为聚类数。

54、优选的,实现s4中将客户分级的方法为:依据s3中聚类分析结果,将客户分为五个级别,依次为:

55、vvip客户:r高、f高、m高、c低,优先将资源投放到级别客户,维系稳定关系;

56、区域vip客户:r较高、f较高、m较高、c较低,维持客户的满意度,提高忠诚度;

57、重要发展客户:l不高、r较高、c高,加强客户满意度,发展为忠实客户;

58、一般客户:f低、m低,在资源支持的情况下强化与客户的联系;

59、低价值客户:f低、m低、r低,对品牌无忠诚度。

60、本发明提供了一种集装箱运输行业客户价值的评价方法,s1中将业务数据加工整合,同步至clickhouse高性能列式数据库中,s2中根据集装箱运输行业的特点设计了客户价值模型lrfmc,依据整合后数据计算客户的lrfmc模型指标,特别是将周转箱量作为该模型中的m指标:订单的累积箱*海里,更真实反应了客户的运输需求;s3中对计算得到的lrfmc模型指标进行标准化处理,再利用k-means算法做聚类分析得到不同客户价值的分类,s4中依据客户价值分类对客户进行分级,针对不同级别合理分配有限资源。本发明引入开源的异构数据整合产品datax:使sybase、oracle、文本、hdfs等同构、异构数据源的数据得到有效整合。在使用单节点的clickhouse数据库情况下,其olap的性能相较于oracle12c数据库有着数十倍的提升,与商业的olap产品sybase iq相比,在某些简单场景中亦有数倍提升;同时利用机器学习不断优化,建立一个量化的价值和分类体系,按lrfmc模型下的分类结果,在30%的抽样情况下,抽样精确率能达到84.2%,与传统的业务认知具有一致性,可以有效的加强企业对海量客户的分类和管理,帮助企业合理使用有限的市场营销资源。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1