一种海量数据下的呼叫中心客服人员的特征细分方法

文档序号：10569923阅读：514来源：国知局

一种海量数据下的呼叫中心客服人员的特征细分方法
【专利摘要】本发明公开了一种海量数据下的呼叫中心客服工作人员特征细分方法，包括：获取预设量的工作人员；确定聚类指标，并确定呼叫中心每个工作人员与聚类指标对应的数据为该工作人员的聚类指标数据；根据每个工作人员的聚类指标数据利用并行K?Means算法进行聚类，得到聚类结果；根据聚类结果将工作人员分成不同的类，得到分群结果。本申请公开的一种呼叫中心工作人员管理方法能够自动适应海量数据下的工作人员细分工作，准确度较高，避免了工作人员的依靠主观经验分类不符合工作人员的实际工作表现的情况发生。
【专利说明】
一种海量数据下的呼叫中心客服人员的特征细分方法
技术领域
[0001 ]本发明涉及呼叫中心管理技术领域，更具体地说，涉及一种海量数据下的呼叫中心客服人员的特征细分方法。
【背景技术】
[0002] 在对呼叫中心的话务员的管理中，通常由呼叫中心的管理者或者班组管理者主观决定将话务员粗略地分成几类。但是，鉴于呼叫中心坐席人员数量达到上万的规模，这就会管理层对某些话务员的主观认识和其实际工作表现差别较大，从而不能很好的根据话务员的工作能力去合理地安排相关工作。因此，需要一种技术能帮助管理者更好地认识其下属的坐席人员的综合表现，更好地开展诸如运营效能提升、坐席排班、技能培训等相关管理工作。

【发明内容】

[0003] 本发明的目的是提供一种海量数据下的呼叫中心工作人员特征细分方法，以解决现有技术中存在的对工作人员的认知偏差问题，协助管理人员进行辅助决策。
[0004] 为了实现上述目的，本发明提供如下技术方案：
[0005] -种海量数据下的呼叫中心工作人员特征细分的管理方法，包括：
[0006] 获取M列S行若干班组的工作人员在若干年度内考核的KPI指标数据；
[0007] 针对所述KPI指标数据的预处理，所述预处理方式包括缺失值的补充、异常值的替换以及最后将数据归一化处理得到聚类指标数据；
[0008] 将处理完的聚类指标数据利用分布式K-Means算法，进行客户特征分群，得到客户的细分结果。
[0009] 优选的，所述获取每个所述若干年度内工作人员考核KPI指标对应的数据，包括：接通率、呼入项目占有率、呼出项目工作效率、平均处理时间、平均排队时间、一次性解决问题率、平均单呼成本、出勤率、业务考核成绩及满意率；
[0010] 其中，所述接通率指IVR(Interactive Voice Response)终级服务单元的接通量与人工座席的接通量之和与进入呼叫中心的呼叫总量之比；
[0011] 所述呼入项目占有率是指某段统计时间内，座席员处理多通电话的总时长与实际登录系统时长的比率；
[0012] 所述呼出项目工作效率指某段统计时间内，总处理时长与登录系统时长的比率；
[0013] 所述平均处理时间：一次联络所需的平均时间；
[0014] 所述平均排队时间指在某段统计时间内，呼叫者列入名单后等待人工座席回答的等待的平均等待时长；
[0015] 所述一次性解决问题率是在某段统计时间内，不需要顾客再次拨入呼叫中心也不需要座席员将电话回拨或转接就可以解决的电话量占座席员接起电话总量的百分比；
[0016] 所述出勤率指在某个统计时段内，某个班组实际出勤的人数与计划出勤的人数的百分率；
[0017] 所述平均单呼成本指某段统计时间内，呼叫中心的全部费用除以电话处理量；
[0018] 所述业务考核成绩指呼叫中心座席对业务知识的掌握程度以及所述满意度指客户对呼叫中心提供的服务满意程度。
[0019] 优选的，所述对上述KPI考核指标数据进行预处理的缺失值的补充，包括：
[0020]确定总观测数据S行，对应若干班组的工作人员在若干年度内考核的KPI指标，这些指标为聚类输入属性字段；
[0021] 如果存在L行观测数据，其属性字段具有缺失值或所有输入都具有缺失值的记录或观测值字段不具有与属性指标对应的数据，则确定该L行数据需要进行缺失值处理；
[0022] 确定剩余S-L行数据为参照数据，统计这些观测数据M个属性字段中每个属性Xdi <M)出现次数最多的值，即众数；
[0023] 对于上述L行观测M个属性字段中缺失数据进行填充，用众数进行替换，完成对应属性Xi(i<M)的缺失值处理。
[0024]优选的，所述对上述KPI考核指标数据进行预处理的异常数据的替换，包括：
[0025] 原始样本数据S行，每个属性Xdi彡M)的均值为；;，，标准差为I，若存在 |不-，:则此观测值是一个异常点。
[0026] 对于异常数据，若 ^，完成异常数据的替换。 X,. < /，.
[0027]优选的，所述对上述KPI考核指标数据进行归一化处理，包括：
[0028]对属性指标进行规范化处理，可以将属性指标数据按比例缩放，使之落入一个小的特定区间;通过min-max归一化方法，利用下列函数变换公式：
[0030] Xmax，Xmin为原始样本集中属性字段的最大值和最小值，Xi，Yi分别为输入样本归一化前后的值;将每个聚类指标数据的数值X映射到对应的区间[0，1 ]，以实现不同聚类指标的统一化，得到具有统一度量单位的聚类指标数据。
[0031] 优选的，所述根据每个所述工作人员的聚类指标数据利用并行K-Means算法进行聚类，得到聚类结果，包括：
[0032]初始化阶段:首先确定聚类个数k，随机从原始数据集中选取k条数据作为初始类中心，同时将原始数据集分成若干个数据块;随机确定类中心，比如原始有10个点，随机确定其中K = 2个点作为类中心。
[0033] MAP阶段:将每一个数据块(包含多条数据)对应分配给一个map函数，针对该数据块，计算其中每条数据所属类别；
[0034] REDUCE阶段:该阶段通过归并各块聚类结果得到完整的聚类结果，具体是计算属于同一类别数据的均值作为新的类中心，并将其作为下一次迭代的输入，直至算法收敛;新的类中心是由同一类别数据的均值计算得到的。比如某一类下包含10个点，计算这10个点的均值，得到类中心点；
[0035] 结果确认阶段:根据所述聚类结果将所述工作人员分成不同的类，得到特征细分结果；
[0036] 结果应用阶段:根据每个类的工作人员的特征确定该类的工作人员的管理方式。
[0037] 优选的，所述结果确认阶段，需要根据所述工作人员的聚类结果进行聚类最佳个数的确定，包括：
[0038] 初始范围选取:预设一定的聚类个数范围[k^ks]，且聚类个数为这个区间内的整数；
[0039]类内距离计算:对[k^ks]内的任意k，计算当前聚类结果下同一个类内的距离为 =其卖丨卜-Hiy々，其中Xi为聚类j中的数据点；为聚类j的类中心点；
[0040] 类间距离计算:对[lu，k2]内的任意k，计算当前聚类结果下不同的类之间的距离为士 j- / t /C/，其中匕为聚类i中的数据点，&为聚类j的类中心点； m m /
[0041] 最佳聚类个数确定:建立聚类有效性函数
，进行聚类结果评价，当L(k) 最小时对应得到最佳的聚类个数k，从而避免了聚类数目在选取上存在的主观性。
[0042]本发明提供的一种海量数据下的呼叫中心工作人员特征细分的管理方法，包括：获取M列S行若干班组的工作人员在若干年度内考核的KPI指标数据;进行上述数据的预处理，包括缺失值的补充、异常值的替换、数据归一化处理等;利用分布式K-Means算法，进行客户特征分群，得到客户的细分结果；
[0043]与现有技术相比，本申请并不简单地设置指标权重而进行KPI打分考核，而是通过并行的K-Means算法根据每个工作人员的考核KPI指标数据对其进行分群，得到关于坐席人员工作效能的综合认知。而并行K-Means算法是针对海量数据下进行聚类，可以更快速地完成计算过程的迭代，可以有效地完成相关特征细分工作，因此，本申请公开的一种海量数据下呼叫中心工作人员特征细分的管理方法，分析性能较高，避免了管理者因工作人员数量突增而导致对工作人员的实际工作表现认知出现偏差的情况发生。
【附图说明】
[0044] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
[0045] 图1为本发明实施例提供的一种海量数据下呼叫中心工作人员特征细分的管理方法的流程图；
[0046]图2为本发明实施例提供的一种的考核KPI数据预处理的缺失值填充的流程图； [0047]图3为本发明实施例提供的一种的考核KPI数据预处理的异常值的替换的流程图； [0048]图4为本发明实施例提供的一种的考核KPI数据预处理的数据归一化的流程图；
[0049]图5为本发明实施例提供的利用并行K-Means聚类算法进行工作人员特征细分，得到聚类结果的流程图；
[0050] 图6为本发明实施例提供的根据聚类有效性函数确定最佳聚类个数的流程图；
【具体实施方式】
[0051] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0052] 请参阅图1，其示出了本发明实施例提供的一种工作人员管理方法的流程图，可以包括：
[0053] S11:获取M列S行若干班组的工作人员在若干年度内考核的KPI指标数据;包括接通率、呼入项目占有率、呼出项目工作效率、平均处理时间、平均排队时间、一次性解决问题率、平均单呼成本、出勤率业务考核成绩及满意率；
[0054]表1KPI指标及其含义
[0056]选取呼叫中心若干员工在特定时长内的工作绩效数据，进行特征聚类。具体的样本数据示例如下表：
[0057]表2KPI指标的样本数据
[0060] 预设量可以根据实际需要进行确定，在此不做具体限定。
[0061] S12:进行上述数据的预处理，包括缺失值的补充、异常值的替换、数据归一化处理得到聚类指标数据；
[0062]其中，聚类指标是工作人员的工作表现方面的指标，其具体含义根据工作人员的职位不同而有所区别。另外，聚类指标的数量可以为1个，也可以为多个，根据实际需要进行确定，在此不做具体限定。
[0063] S13:利用分布式K-Means算法，进行客户特征分群，得到客户的细分结果；
[0064] 其中，聚类就是将集合中的对象分成若干个类的数据分析方法，它使得每个类中的对象之间尽可能地相似，不同的类中的对象尽可能相异，本申请中的对象即为工作人员。
[0065] 本申请通过并行K-means聚类算法根据每个工作人员的聚类指标数据对其进行分类，利用聚类算法得到的聚类结果对工作人员进行分类，实现每个类内的工作人员可最大化的相似。因此，本申请公开的一种工作人员管理方法能够避免因上级主管的主观印象而造成的工作人员认知不符合实际情况发生。
[0066] 另外，本发明将并行K-Means聚类算法应用于对于工作人员的分类，有利于实现工作人员的精益化管理，便于呼叫中心的领导及时了解中心的运营效率和服务过程中存在的问题，并通过修正策略来跟踪行动计划和绩效结果，从而保证发展战略的实现。
[0067]请参阅图2,其示出了本发明实施例提供的一种的考核KPI数据预处理的缺失值填充的流程图，可以包括：
[0068] S21:获取单元。获取总观测数据S行，对应若干班组的工作人员在若干年度内考核的KPI指标，确定这些指标为聚类输入属性字段；
[0069] S22:检测单元。如果存在L行观测数据，其属性字段Xi(i<M)具有缺失值或所有输入都具有缺失值的记录或观测值字段不具有与属性指标对应的数据，则检测并确定该L行数据需要进行缺失值处理；
[0070] S23:计算单元。确定剩余S-L行数据为参照数据，统计这些观测数据M个属性字段中每个属性Xi (i )出现次数最多的值，即众数；
[0071] S24:填充单元。对于上述L行观测M个属性字段中缺失数据进行填充，用众数进行替换，完成对应属性Xi(i<M)的缺失值处理。
[0072]请参阅图3,其示出了本发明实施例提供的一种的考核KPI数据预处理的异常值的替换的流程图，可以包括：
[0073] S31:确认单元。原始样本数据S行，每个属性Xi(i<M)的均值为//,,标准差为心，若存在|X -又| > 3$，则确认此观测值是一个异常点。
[0074] S32:替换单元。对于异常数据，若，完成异常数据的替 A,. < 换。
[0075]请参阅图4,其示出了本发明实施例提供的一种的考核KPI数据预处理的数据归一化的流程图；
[0076] S41:计算单元。计算原始样本集中每个属性字段的最大值和最小值Xmax，Xmin;
[0077] S42:归一化单元。通过min-max归一化方法，利用下列函数变换公式：
[0079]其中Xht分别为输入样本归一化前后的值。将每个聚类指标数据的数值x映射到对应的区间[0，1]。
[0080] 通过对属性指标进行规范化处理，可以将属性指标数据按比例缩放，使之落入一个小的特定区间。以实现不同聚类指标的统一化，得到具有统一度量单位的聚类指标数据。
[0081] 请参阅图5,其示出了本发明实施例提供的利用并行K-Means聚类算法进行工作人员特征细分，得到聚类结果的流程图；
[0082] S51:初始化单元。首先确定聚类个数，随机确定初始的各类中心，同时将原始数据集分成若干个数据块。
[0083] S52: MAP单元。将每一个数据子集对应分配给一个map函数，针对每个数据块，计算每个数据项所属类别。
[0084] S53:REDUCE单元。归并各块聚类结果得到完整的聚类结果，重新计算类中心作为下一次迭代的输入，直至算法收敛。
[0085] S54:结果确认单元。根据所述聚类结果将所述工作人员分成不同的类，得到特征细分结果。
[0086]举例说明上述步骤。如可将话务员分为以下3类：
[0087]聚类1(标杆型）：涉及的话务员其KPI等指标表现出色，接通率、呼入项目占有率、呼出项目工作效率、一次性解决问题率、出勤率、业务考核成绩及满意率最高，但平均处理时间、平均排队时间和平均单呼成本都较低，说明这类人工作质量最高，同时说明工作效率尚。
[0088]聚类2(待关注型）：涉及的话务员其KPI等指标表现出色，接通率、呼入项目占有率、呼出项目工作效率、一次性解决问题率、出勤率、业务考核成绩及满意率最低，说明工作效率低。平均处理时间、平均排队时间和平均单呼成本都最高，说明工作质量也最低。
[0089]聚类3(中间型）：这类话务员的接通率、呼入项目占有率、呼出项目工作效率、一次性解决问题率、出勤率、业务考核成绩及满意率处于中间水平，平均处理时间、平均排队时间和平均单呼成本处于中间水平。
[0090] S55:结果应用单元。根据每个类的工作人员的特征确定该类的工作人员的管理方式。
[0091] 上述实施例提供的一种工作人员管理方法中，根据聚类结果将工作人员分成不同的类，得到分类结果之后，根据分类结果确定每个类的工作人员的特征进行精细化管理，提升呼叫中心的运营效率；
[0092] 举例进行上述步骤说明。
[0093] -是根据每个类的工作人员的特征确定该类的工作人员的工作内容及工作时间。针对"标杆型"、"中间型"和"待关注型"的话务员，采取对应的激励惩罚制度，进行工作内容及工作时间的安排，其中，工作内容和工作时间具体可以包括排班时长和服务客户的差异性安排等，如"问题型"人员夜班的排班时间较长，"标杆型"人员服务电力客户服务中心的集团客户及VIP客户。由此，根据不同工作人员的特征，合理调整班次，并且对应不同的需求 (如客户需求等），分配不同的特征的工作人员，有利于对于工作人员的管理，以及提高工作人员的工作效率。
[0094]二是根据每个类的工作人员的特征确定该类的工作人员的工作缺陷，并针对每个类的工作人员，尤其是"待关注型"类下的工作人员，根据其工作缺陷对该类的工作人员进行培训。基于分群结果确定每个类的工作人员的工作缺陷，有利于管理者根据每个类的工作人员的工作缺陷不同为期安排不同的培训，有利于工作人员水平的提高。在此基础上，建立长效培训机制，形成自主学习的工作氛围。
[0095]请参阅图6,其示出了本发明实施例提供的根据聚类有效性函数确定最佳聚类个数的流程图；
[0096] S61:初始范围选取。预设一定的聚类个数范围[lu，k2]，且聚类个数为这个区间内的整数；
[0097] S62:类内距离计算。对[lu，k2]内的任意k，计算当前聚类结果下同一个类内的距离为4=zih -Lf >，其中X:为聚类j中的数据点，t为聚类j的类中心点； .7=1 7 = 1 j
[0098] S63:类间距离计算。对[lu，k2]内的任意k，计算当前聚类结果下不同的类之间的距离为客拿『卢，其中5为聚类i中的数据点；为聚类j的类中心点；
[0099] S64:最佳聚类个数确定。建立聚类有效性函数
，进行聚类结果评价，当 L(k)最小时对应得到最佳的聚类个数k，从而避免了聚类数目在选取上存在的主观性。
[0100] 对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1. 一种海量数据下呼叫中心客服人员的特征细分的方法，其特征在于，包括：获取Μ列S行若干班组的工作人员在若干年度内考核的KPI指标数据；针对所述ΚΡΙ指标数据的预处理，所述预处理方式包括缺失值的补充、异常值的替换以及最后将数据归一化处理得到聚类指标数据；将处理完的聚类指标数据利用分布式K-Means算法，进行客户特征分群，得到客户的细分结果。2. 根据权利要求1所述的方法，其特征在于，所述获取每个所述若干年度内工作人员考核KPI指标对应的数据，包括:接通率、呼入项目占有率、呼出项目工作效率、平均处理时间、平均排队时间、一次性解决问题率、平均单呼成本、出勤率、业务考核成绩及满意率；其中，所述接通率指IVR终级服务单元的接通量与人工座席的接通量之和与进入呼叫中心的呼叫总量之比；所述呼入项目占有率是指某段统计时间内，座席员处理多通电话的总时长与实际登录系统时长的比率;所述呼出项目工作效率指某段统计时间内，总处理时长与登录系统时长的比率。所述平均处理时间：一次联络所需的平均时间;所述平均排队时间指在某段统计时间内，呼叫者列入名单后等待人工座席回答的等待的平均等待时长;所述一次性解决问题率是在某段统计时间内，不需要顾客再次拨入呼叫中心也不需要座席员将电话回拨或转接就可以解决的电话量占座席员接起电话总量的百分比;所述出勤率指在某个统计时段内，某个班组实际出勤的人数与计划出勤的人数的百分率;所述平均单呼成本指某段统计时间内，呼叫中心的全部费用除以电话处理量;所述业务考核成绩指呼叫中心座席对业务知识的掌握程度;所述满意度指客户对呼叫中心提供的服务满意程度。3. 根据权利要1所述的方法，其特征在于，对于缺失值的补充，包括：确定总观测数据S行，对应若干班组的工作人员在若干年度内考核的KPI指标，这些指标为聚类输入属性字段；如果存在L行观测数据，其属性字段XKiSM)具有缺失值或所有输入都具有缺失值的记录或观测值字段不具有与属性指标对应的数据，则确定该L行数据需要进行缺失值处理；确定剩余S-L行数据为参照数据，统计这些观测数据Μ个属性字段中每个属性出现次数最多的值，即众数；对于上述L行观测Μ个属性字段中缺失数据进行填充，用众数进行替换，完成对应属性t (i<M)的缺失值处理。4. 根据权利要求1所述的方法，其特征在于，对于异常数据的替换，包括：原始样本数据S行，每个属性Xd i<M)的均值为&，标准差为δ,，若存在|χ;. - > 3$，则此观测值是一个异常点；5. 根据权利要求1至4任一所述的方法，其特征在于，对于上述KPI指标数据均进行归一化处理，包括：对属性指标进行规范化处理，可以将属性指标数据按比例缩放，使之落入一个小的特定区间，通过min-max归一化方法，利用下列函数变换公式：xmax，xmin为原始样本集中属性字段的最大值和最小值，Xi，Yi分别为输入样本归一化前后的值。将每个聚类指标数据的数值X映射到对应的区间[〇，1]，以实现不同聚类指标的统一化，得到具有统一度量单位的聚类指标数据。6. 根据权利要求5所述的方法，其特征在于，所述根据每个所述工作人员的聚类指标数据利用并行K-Means算法进行聚类，得到聚类结果，包括：初始化阶段:首先确定聚类个数，随机确定初始的各类中心，同时将原始数据集分成若干个数据块； MAP阶段:将每一个数据块对应分配给一个map函数，针对该数据块，计算其中每条数据所属类别，上述数据库包含多条数据； REDUCE阶段:该阶段通过归并各块聚类结果得到完整的聚类结果，具体是计算属于同一类别数据的均值作为新的类中心，并将其作为下一次迭代的输入，直至算法收敛；结果确认阶段:根据所述聚类结果将所述工作人员分成不同的类，得到特征细分结果；结果应用阶段:根据每个类的工作人员的特征确定该类的工作人员的管理方式。7. 根据权利要求6所述的方法，其特征在于，所述结果确认阶段，需要根据所述工作人员的聚类结果进行聚类最佳个数的确定，包括：预设一定的聚类个数范围[lu，k2]，且聚类个数为这个区间内的整数；对[lu，k2]内的任意k，计算当前聚类结果下同一个类内的距离；对[lu，k2]内的任意k，计算当前聚类结果下不同的类之间的距离；确定聚类有效性函数，进行聚类结果评价，得到最佳的聚类个数，从而避免了聚类数目在选取上存在的主观性。8. 根据权利要求7所述的方法，其特征在于，所述结果确认阶段，需要根据所述工作人员的聚类结果进行聚类最佳个数的确定，包括：初始范围选取:预设一定的聚类个数范围[lu，k2]，且聚类个数为这个区间内的整数；类内距离计算：对[k^ks]内的任意k，计算当前聚类结果下同一个类内的距离为，其中Xl为聚类j中的数据点，为聚类j的类中心点；类间距离计算：对[k^ks]内的任意k，计算当前聚类结果下不同的类之间的距离为，其中k为聚类i中的数据点，^为聚类j的类中心点；最佳聚类个数确定:建立聚类有效性函数，进行聚类结果评价，当L(k)最小时对应得到最佳的聚类个数k，从而避免了聚类数目在选取上存在的主观性。
【文档编号】G06K9/62GK105930353SQ201610216835
【公开日】2016年9月7日
【申请日】2016年4月8日
【发明人】程宏亮, 卢耀宗, 强劲, 黄蓉
【申请人】西安美林数据技术股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程宏亮;卢耀宗;强劲;黄蓉;
技术所有人：西安美林数据技术股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。