一种判断用户级别的方法和装置的制造方法

文档序号:9274927阅读:181来源:国知局
一种判断用户级别的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及计算机网络领域,具体地,涉及一种判断用户级别的方法和装置。
【背景技术】
[0002] 目前,越来越多的人使用电子商务。因此,需要客户关系中心(CRC)来判断需要进 行CRC客户关怀的用户级别,从而按照不同级别提供差异化服务。CRC主要通过对客户详细 资料的深入分析,来提高客户满意程度,从而提高企业的竞争力。
[0003] 现有技术中,客户关系中心往往通过客户发起的投诉和索赔数量、客户购买频率、 客户购买金额中的一个或多个因素来判断需要进行CRC客户关怀的用户级别。这种方法判 断标准相对单一,降低所得结果的准确性和完整性。附加地,该方法是被动型的方法,必须 在客户已经发起投诉后才能处理客户关系,导致客户对企业形象留下不良印象。此外,该方 法无法识别等级较高而消费较低的客户,从而造成客户流失。
[0004] 为了解决上述问题中的至少一部分,需要一种判断用户级别的方法和装置,能够 先验性地判断用户级别以便按照不同级别提供差异化服务。

【发明内容】

[0005] 为解决现有技术中的至少一个问题而提出了本发明。下文中,尽管参考示例实施 例详细描述了本发明,但本发明并不局限于所描述的实施例。
[0006] 本发明涉及一种判断用户级别的方法,所述方法可以包括:收集要判断的用户数 据集;获取与每个用户级别相对应的用户样本数据集;计算对应用户样本数据集的质心, 其中不同的质心与不同的用户级别相对应;计算所述用户数据集中的用户数据与每个质心 之间的距离;以及将到所述用户数据的距离最小的质心所对应的用户级别判断为所述用户 数据的用户级别。
[0007] 所述方法还可以包括:在所述判断步骤之后,更新与所述用户级别相对应的用户 样本数据集,并重新计算所述用户样本数据集的质心;以及针对用户数据集中的下一用户 数据,重复所述计算用户数据与每个质心距离的步骤以及所述判断步骤,直到判断了用户 数据集中的所有待判断的用户数据。
[0008] 所述更新与所述用户级别相对应的用户样本数据集可以包括:将用户数据集中已 确定用户级别的用户数据添加到与所述用户级别相对应的用户样本数据集中。
[0009] 所述方法还可以包括:使用Hadoop构架中的hive工具编写脚本,以便根据订单明 细表、自营大家电商品订单评价基础汇总表、自营中小件商品订单评价基础汇总表、客服时 间主表数据中的一个或多个,生成包括用户数据集的用户数据记录样表和包括用户样本数 据集的用户样本数据记录样表。
[0010] 所述方法还可以包括:在RStudio开发平台上,通过导入存储在数据仓库中的包 括用户数据集的用户数据记录样表以及包括用户样本数据集的用户样本数据记录样表,判 断所述用户样本数据记录样表所包括的用户数据集中的每个用户数据的用户级别,从而生 成用户级别判断记录样表。
[0011] 本发明还涉及一种判断用户级别的装置,所述装置可以包括:数据预处理模块,配 置为收集要判断的用户数据集;样本数据数据录入模块,配置为获取与每个用户级别相对 应的用户样本数据集;以及用户级别计算模块,配置为计算对应用户样本数据集的质心,其 中不同的质心与不同的用户级别相对应;计算所述用户数据集中的用户数据与每个质心之 间的距离;以及将到所述用户数据的距离最小的质心所对应的用户级别判断为所述用户数 据的用户级别。
[0012] 所述用户级别计算模块还可以配置为:在所述判断步骤之后,更新与所述用户级 别相对应的用户样本数据集,并重新计算所述用户样本数据集的质心;以及针对用户数据 集中的下一用户数据,重复所述计算用户数据与每个质心距离的步骤以及所述判断步骤, 直到判断了用户数据集中的所有待判断的用户数据。
[0013] 所述更新与所述用户级别相对应的用户样本数据集可以包括:将用户数据集中已 确定用户级别的用户数据添加到与所述用户级别相对应的用户样本数据集中。
[0014] 所述数据预处理模块还可以配置为:使用Hadoop构架中的hive工具编写脚本,以 便根据订单明细表、自营大家电商品订单评价基础汇总表、自营中小件商品订单评价基础 汇总表、客服时间主表数据中的一个或多个,生成包括用户数据集的用户数据记录样表和 包括用户样本数据集的用户样本数据记录样表。
[0015] 所述用户级别计算模块还可以配置为:在RStudio开发平台上,通过导入存储在 数据仓库中的包括用户数据集的用户数据记录样表以及包括用户样本数据集的用户样本 数据记录样表,判断所述用户样本数据记录样表所包括的用户数据集中的每个用户数据的 用户级别,从而生成用户级别判断记录样表。
【附图说明】
[0016] 结合附图,根据以下详细描述,本发明的特定示例实施例的上述和其它方面、特征 以及优点将更清楚,附图中:
[0017] 图1示出了根据本发明示例实施例的用于判断用户级别的方法的流程图。
【具体实施方式】
[0018] 以下参考附图描述了本发明的示例实施。本发明涉及一种判断用户级别的方法和 装置,能够先验性地判断用户级别以便按照不同级别提供差异化服务。
[0019] 图1示出了根据本发明示例实施例的用于判断用户级别的方法的流程图。
[0020] 首先,在步骤101,收集要判断的用户数据集N。可以使用X86构架Linux操作系统 服务器,以Hadoop构建分布式数据仓库系统,抽取并存储电商平台的订单明细表,自营大 家电商品订单评价基础汇总表,自营中小件商品订单评价基础汇总表,客服时间主表数据, 并按照用户账号汇总相应字段生成用户判断条件表。用户判断条件可以是由用户定义的, 例如,包括:用户的中小件包装平均给分、中小件时效平均给分、中小件商品平均给分、大家 电包装平均给分、大家电时效平均给分、大家电商品平均给分、电话呼入量、呼入订单量、即 时通信系统(M)订单量、M会话量。
[0021] 使用Hadoop构架中的hive工具编写脚本根据如下规则计算生成相应字段,并在 数据仓库中存储为记录样表:
[0022] 表 1
[0023]
[0024] 其中所述中小件包装平均给分、中小件时效平均给分、中小件商品平均给分、是由 存储的自营中小件商品订单评价基础汇总表中的中小件包装给分、中小件时效给分、中小 件商品给分字段按照用户账号维度汇总求平均数得出;大家电包装平均给分、大家电时效 平均给分、大家电商品平均给分是由存储的自营大家电商品订单评价基础汇总表中的大家 电包装给分、大家电时效给分、大家电商品给分按照用户账号维度汇总求平均数得出;电话 呼入量、呼入订单量、IM订单量、IM会话量则由订单明细表、客服时间主表的用户订单,用 户电话呼入,頂订单,頂会话记录汇总计数得出。因此,在数据仓库中形成并存储用户数据 记录样表。
[0025] 在步骤S102,获取与每个用户级别相对应的用户样本数据集,并在步骤S103,计 算对应用户样本数据集的质心。分别针对被分为A、B、C、D的用户级别,获取与其相对应的 用户样本数据集,使用Hadoop构架中的hive工具生成用户样本数据记录样表,其中A、B、 C、D的用户等级分别与高、中、低和零等级的关注度相对应。
[0026] 例如,可以使用RStudio开发平台,建立数学模型并导入数据仓库中的用户样本 数据记录样表和用户数据记录样表,生成用户数据向量的集合以及用户样本数据向量的集 合,即,用户数据集和用户样本数据集。假定A类用户样本数据集中的用户个数为〇,B类用 户样本数据集中的用户个数为P,C类用户样本数据集中的用户个数为k,D类用户样本数据 集中的用户个数为m,则使用向量集表示各类用户样本数据集,例如10维向量表示用户,向 量的坐标值依次为用户的属性值。
[0027] {at, a2, . . . , ajaj G R n (i = 1,2, ? ? ?,o)
[0028] {bp b2, ? ? ?,bp} bjG R n (i = 1,2, ? ? ?,p)
[0029] c2, . . . , cj CjG R n (i = 1,2, ? ? ?,k)
[0030] {屯,d2, ? ? ?,dm} djE R n (i = 1,2, ? ? ?,m)
[0031] 那么,可以得到与每个用户级别相对应的每个用户样本数据集的质心y:
[0036] 在步骤S104,计算所述用户数据集N中的用户数据叫与每个质心之间的距离,其 中不同的质心与不同的用户级别相对应。用户数据叫是一个向量,该向量的坐标值依次为 用户的属性值(例如,表示用户的中小件包装平均给分、中小件时效平均给分、中小件商品 平均给分、大家电包装平均给分、大家电时效平均给分、大家电商品平均给
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1