基于决策树的呼叫数据处理方法、装置、设备及存储介质与流程

文档序号:23852923发布日期:2021-02-05 14:41阅读:60来源:国知局
基于决策树的呼叫数据处理方法、装置、设备及存储介质与流程

[0001]
本发明涉及数据处理技术领域,尤其涉及一种基于决策树的呼叫数据处理方法、装置、设备及存储介质。


背景技术:

[0002]
语音呼叫系统是采用人工智能技术实现语音呼叫的系统,是采用机器人替代人工向客户拨打呼叫电话所形成的系统。一般来说,语音呼叫系统安排呼叫任务时,需对历史呼叫数据进行特征分析处理,确定何时呼叫接通率最高,以便制定合理的呼叫策略。现有技术中,一般采用统计分析方法(如透视表分析),通过人工调整特征的特征分箱阈值进行统计,对统计结果进行数据可视化,从而确定黄金分割点,再利用黄金分割点调整呼叫策略。该黄金分割点为呼叫接通率最高的特征分箱阈值。这种统计分析方法存在灵活性不高,耗时长,效率低,且容易出现在一定范围内寻找局部最优解,导致其确定的黄金分割点不是全局最优解的情况,即所确定的黄金分割点准确性低的问题。


技术实现要素:

[0003]
本发明实施例提供一种基于决策树的呼叫数据处理方法、装置、计算机设备及存储介质,以解决采用统计分析方法分析确定呼叫策略存在的灵活性不高、耗时长、效率低和准确性低的问题。
[0004]
一种基于决策树的呼叫数据处理方法,包括:
[0005]
获取历史呼叫数据,所述历史呼叫数据包括呼叫结果标识和k个原始特征对应的历史特征值,所述原始特征包括呼叫时机特征,其中,k≧2;
[0006]
对k个所述原始特征对应的历史特征值进行可控性分析,从k个所述原始特征中确定l个可控特征,其中,2≦l≦k;
[0007]
采用所述呼叫结果标识对l个所述可控特征对应的历史特征值进行关联性分析,从l个所述可控特征中确定n个目标特征,所述目标特征包括所述呼叫时机特征,其中,2≦n≦l;
[0008]
基于所述呼叫结果标识和n个所述目标特征对应的历史特征值,形成训练呼叫数据;
[0009]
采用决策树模型对所述训练呼叫数据进行处理,获取目标决策树,获取所述目标决策树中每一节点对应的节点属性信息,所述节点属性信息包括节点类别信息、节点熵值和节点样本信息。
[0010]
一种基于决策树的呼叫数据处理装置,包括:
[0011]
历史呼叫数据获取模块,用于获取历史呼叫数据,所述历史呼叫数据包括呼叫结果标识和k个原始特征对应的历史特征值,所述原始特征包括呼叫时机特征,其中,k≧2;
[0012]
可控特征确定模块,用于对k个所述原始特征对应的历史特征值进行可控性分析,从k个所述原始特征中确定l个可控特征,其中,2≦l≦k;
[0013]
目标特征确定模块,用于采用所述呼叫结果标识对l个所述可控特征对应的历史特征值进行关联性分析,从l个所述可控特征中确定n个目标特征,所述目标特征包括所述呼叫时机特征,其中,2≦n≦l;
[0014]
训练呼叫数据获取模块,用于基于所述呼叫结果标识和n个所述目标特征对应的历史特征值,形成训练呼叫数据;
[0015]
目标决策树获取模块,用于采用决策树模型对所述训练呼叫数据进行处理,获取目标决策树,获取所述目标决策树中每一节点对应的节点属性信息,所述节点属性信息包括节点类别信息、节点熵值和节点样本信息。
[0016]
一种基于决策树的呼叫数据处理方法,包括:
[0017]
获取待呼叫客户对应的至少一个待呼叫数据,所述待呼叫数据包括n个目标特征对应的待呼特征值,所述目标特征包括呼叫时机特征,所述呼叫时机特征对应的待呼特征值为配置呼叫时段;
[0018]
将所述待呼叫数据输入上述目标决策树,确定所述待呼叫数据在所述目标决策树上所属的目标节点,获取所述目标节点的节点属性信息;
[0019]
基于同一所述待呼叫客户对应的至少一个所述目标节点的节点属性信息,确定所述待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级;
[0020]
基于所有所述待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,对所有所述待呼叫客户进行呼叫策略调整,确定所述待呼叫客户对应的目标呼叫时段。
[0021]
一种基于决策树的呼叫数据处理装置,包括:
[0022]
待呼叫数据获取模块,用于获取待呼叫客户对应的至少一个待呼叫数据,所述待呼叫数据包括n个目标特征对应的待呼特征值,所述目标特征包括呼叫时机特征,所述呼叫时机特征对应的待呼特征值为配置呼叫时段;
[0023]
目标节点确定模块,用于将所述待呼叫数据输入上述实施例所获取的目标决策树,确定所述待呼叫数据在所述目标决策树上所属的目标节点,获取所述目标节点的节点属性信息;
[0024]
时段优先级确定模块,用于基于同一所述待呼叫客户对应的至少一个所述目标节点的节点属性信息,确定所述待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级;
[0025]
目标呼叫时段确定模块,用于基于所有所述待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,对所有所述待呼叫客户进行呼叫策略调整,确定所述待呼叫客户对应的目标呼叫时段。
[0026]
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于决策树的呼叫数据处理方法。
[0027]
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于决策树的呼叫数据处理方法。
[0028]
上述基于决策树的呼叫数据处理方法、装置、计算机设备及存储介质,对原始特征对应的历史特征值进行可控性分析,以确定可控特征,以排除不可控特征的干扰,从而保障后续生成的目标决策树的处理效率;对所有可控特征对应的历史特征值和呼叫结果标识进
行关联性分析,获取与呼叫结果标识关联性较强的目标特征,有助于保障后续生成的目标决策树的处理效率和结果关联性,以保证后续进行呼叫策略调整的准确性;基于n个目标特征形成目标特征,对训练呼叫数据进行处理,以形成目标决策树和每一节点对应的节点属性信息,通过节点属性信息中的节点熵值快速确定最优的节点类别信息,进而进行呼叫策略调整,使得呼叫策略调整具有灵活性、缩短呼叫策略制定的耗时,提高呼叫策略调整处理效率和准确性。
[0029]
上述基于决策树的呼叫数据处理方法、装置、计算机设备及存储介质,将待呼叫客户对应的至少一个待呼叫数据输入到目标决策树中,以确定每一待呼叫数据对应的目标节点,从而确定待呼叫数据中配置呼叫时段对应的时段优先级,以根据时段优先级对所有待呼叫客户进行呼叫策略调整,以实现利用目标决策树进行快速准确的呼叫策略调整,确定待呼叫客户对应的目标呼叫时段,以保障对待呼叫客户进行呼叫的成功率,使得呼叫策略调整具有灵活性、缩短呼叫策略制定的耗时,提高呼叫策略调整处理效率和准确性。
附图说明
[0030]
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0031]
图1是本发明一实施例中基于决策树的呼叫数据处理方法的一应用环境示意图;
[0032]
图2是本发明一实施例中基于决策树的呼叫数据处理方法的一流程图;
[0033]
图3是本发明一实施例中基于决策树的呼叫数据处理方法的另一流程图;
[0034]
图4是本发明一实施例中基于决策树的呼叫数据处理方法的另一流程图;
[0035]
图5是本发明一实施例中基于决策树的呼叫数据处理方法的另一流程图;
[0036]
图6是本发明一实施例中基于决策树的呼叫数据处理方法的另一流程图;
[0037]
图7是本发明一实施例中基于决策树的呼叫数据处理装置的一示意图;
[0038]
图8是本发明一实施例中基于决策树的呼叫数据处理装置的另一示意图;
[0039]
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
[0040]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0041]
本发明实施例提供的基于决策树的呼叫数据处理方法,该基于决策树的呼叫数据处理方法可应用如图1所示的应用环境中。具体地,该基于决策树的呼叫数据处理方法应用在语音呼叫系统中,该语音呼叫系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于实现基于决策树模型对历史呼叫数据进行分析和可视化处理,获取目标决策树,以便基于目标决策树进行快速准确地进行呼叫策略调整。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种
个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0042]
在一实施例中,如图2所示,提供一种基于决策树的呼叫数据处理方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0043]
s201:获取历史呼叫数据,历史呼叫数据包括呼叫结果标识和k个原始特征对应的历史特征值,原始特征包括呼叫时机特征,其中,k≧2。
[0044]
历史呼叫数据是与历史呼叫相关的信息,即系统当前时间之前,通过语音呼叫系统向任一客户呼叫所形成的数据。每一历史呼叫数据与一数据标识相关联。
[0045]
呼叫结果标识是呼叫结果相对应的标识,该呼叫结果用于反映历史呼叫是否接通。该呼叫结果标识包括呼叫成功标识和呼叫失败标识,顾名思义,呼叫成功标识是指通过语音呼叫系统向客户呼叫成功时生成的标识;相应地,呼叫失败标识是指通过语音呼叫系统向客户呼叫失败时生成的标识。
[0046]
原始特征是用于对历史呼叫数据进行分类的特征,可以理解为原始特征名称的缩写。k为原始特征的数量,其中,k≧2。原始特征对应的历史特征值是指历史呼叫数据中与原始特征相对应的具体数值。
[0047]
由于呼叫策略调整过程中,主要考虑呼叫时机与呼叫资源调度等情况,因此,历史呼叫数据应当包括与呼叫时机相关的信息,即原始特征至少包括呼叫时机特征,该呼叫时机特征对应的历史特征值为呼叫时间戳。该呼叫时间戳是历史呼叫对应的时间戳,具体为通过语音呼叫系统向客户呼叫时的时间戳,由语音呼叫系统自动记录。
[0048]
本示例中,原始特征除了包括呼叫时机特征外,还可以包括用户画像特征和呼叫目的特征中的至少一个。该用户画像特征是与被呼叫客户的用户画像相关的特征,包括但不限于年龄、性别、学历、职业和收入等特征。该呼叫目的特征是与历史呼叫对应的呼叫目的相关的特征。例如,若历史呼叫是为了进行保单催收,则其呼叫目的为保单,与呼叫目的相关的特征包括但不限于保单保费、保单险种类型、保单自保件类型和缴费期限等特征。
[0049]
作为一示例,服务器可从语音呼叫系统对应的系统数据库中,获取系统当前时间之前所有历史呼叫所形成的历史呼叫数据,以便基于决策树模型对所有历史呼叫数据进行分析处理,利用决策树模型的自我学习和修正能力,不断迭代训练,以使对历史呼叫数据的分析过程耗时较小,效率快且结果较准确。一般来说,服务器获取的历史呼叫数据的数量需大于预设数量阈值,以保证训练所得的目标决策树对呼叫策略调整的有效性。该预设数量阈值是预先设置的用于评估历史呼叫数据的数量是否达到可以训练决策树所需数量的阈值。
[0050]
s202:对k个原始特征对应的历史特征值进行可控性分析,从k个原始特征中确定l个可控特征,其中,2≦l≦k。
[0051]
其中,可控性分析是用于分析所有历史呼叫数据对应的原始特征是否具有可控性,以实现保留可控特征,去除不可控特征的过程。可控特征是具有可控性的原始特征;相应地,不可控特征是不具有可控性的原始特征。l为可控特征的数量,其中,2≦l≦k。
[0052]
本示例中的可控性是指所有历史呼叫数据中,同一原始特征对应的历史特征值具有可控性,即所有历史呼叫数据中同一原始特征对应的历史特征值的完整度达标且不存在频繁变动的情况。例如,服务器获取的历史呼叫数据的数量为10000,若10000个历史呼叫数
据中的原始特征a对应的历史特征值不为空值的非空数量大于第一预设数量,则认定所有历史呼叫数据中原始特征a对应的完整度达标;若所有原始特征a对应的历史特征值在预设评估周期内发生变动的变动数量小于第二预设数量,则认定不存在频繁变动情况;因此,认定原始特征a具有可控性,为可控特征。又例如,若10000个历史呼叫数据中的原始特征b对应的历史特征值不为空值的非空数量不大于第一预设数量,则认定所有历史呼叫数据中原始特征b对应的完整度不达标,即有大于第一预设数量的历史呼叫数据中原始特征b对应的历史特征值为空值,若后续利用原始特征b作为决策树训练的目标特征时,会导致无法顺利分类或者分类结果不准确,因此,认定原始特征b不具有可控性,为不可控特征。又例如,若所有原始特征c对应的历史特征值在预设评估周期内发生变动的变动数量不小于第二预设数量,即在预设评估周期内,有大于第二预设数量的历史呼叫数据中,原始特征c对应的历史特征值发生变动,因此,认定原始特征c对应的历史特征值存在频繁变动情况,即原始特征c不具有可控性,为不可控特征。
[0053]
作为一示例,服务器采用可控性分析逻辑对所有历史呼叫数据中,k个原始特征对应的历史特征值进行分析,获取每一原始特征对应的可控性分析结果;若原始特征对应的可控性分析结果为具有可控性,则将原始特征确定为可控特征;若原始特征对应的可控性分析结果为不具有可控性,则将原始特征确定为不可控特征,以实现从k个原始特征中确定l个可控特征的目的,以排除不可控特征的干扰,有助于保障训练所得的目标决策树的可按性和准确性。该可控性分析逻辑为预先设置的用于进行可控性分析的处理逻辑。
[0054]
s203:采用呼叫结果标识对l个可控特征对应的历史特征值进行关联性分析,从l个可控特征中确定n个目标特征,目标特征包括呼叫时机特征,其中,2≦n≦l。
[0055]
其中,关联性分析是用于分析所有历史呼叫数据对应的原始特征与呼叫结果的关联性,以保留关联性较强的目标特征的目的。该目标特征可以理解为关联性达标的可控特征。n为目标特征的数量,其中,2≦n≦l。
[0056]
本示例中的关联性是指所有历史呼叫数据中,同一原始特征对应的历史特征值与呼叫结果正相关或者负相关的相关程度。例如,若某一原始特征对应的历史特征值越大,则其呼叫成功的概率越大,则正相关的关联性越强;相应地,若某一原始特征对应的历史特征值越大,则其呼叫成功的概率越小,则负相关的关联性越强。
[0057]
作为一示例,服务器采用关联性分析逻辑对所有历史呼叫数据中,k个原始特征对应的历史特征值及其呼叫结果标识进行关联性分析,获取每一原始特征对应的特征关联性;从l个可控特征中选取特征关联性较高的前n个可控特征,确定为目标特征,该目标特征为后续用于作为决策树训练中分类条件对应的特征。
[0058]
s204:基于呼叫结果标识和n个目标特征对应的历史特征值,形成训练呼叫数据。
[0059]
其中,训练呼叫数据是用于输入决策树模型进行模型训练的数据。
[0060]
本示例中,服务器将呼叫结果标识和n个目标特征对应的历史特征值,形成训练呼叫数据,以剔除不可控特征和特征关联性不高的可控特征,使得训练呼叫数据的数据量较小且与呼叫结果具有较强的关联性,有助于保障后续决策树模型训练的效率和有效性。
[0061]
s205:采用决策树模型对训练呼叫数据进行处理,获取目标决策树,获取目标决策树中每一节点对应的节点属性信息,节点属性信息包括节点类别信息、节点熵值和节点样本信息。
[0062]
其中,决策树模型是一种简单易用的非参数分类器,不需要对数据有任何的先验假设,具有计算速度较快,结果容易解释且稳健性强的特点。该决策树模型可以采用但不限于lightgbm、gbdt和xgboost等模型。
[0063]
其中,节点类别信息是用于反映将所有训练呼叫数据划分到不同节点的分类条件对应的信息,节点类别信息包括目标特征和与目标特征相对应的特征分类区间。该目标特征是为分类条件对应的特征,即用于实现将所有历史呼叫数据划分到不同集合的特征。与目标特征相对应的特征分类区间为分类条件对应的特征分类区间,即用于将训练呼叫数据中与目标特征对应的历史特征值划分到不同类别对应的特征分类区间。在目标特征为呼叫时机特征时,其与呼叫时机特征相对应的特征分类区间为配置呼叫时段,为系统预先配置用于划分呼叫时机的时段,该配置呼叫时段的数量为至少一个,以便依据不同配置呼叫时段对历史呼叫数据进行统计,并有助于后续利用配置呼叫时段进行呼叫策略调整。
[0064]
例如,对任一目标特征d对应的历史特征值d,特征值下限为d
min
,特征值下限为d
max
,设有m个特征分裂点d1、d2……
d
m
,则基于m个特征分裂点形成m+1个特征分类区间,分别为d
min-d1、d
1-d2、
……
d
m-1-d
m
、d
m-d
max
,以便基于特征分类区间对所有历史呼叫数据进行分类划分,以确定不同特征集合。例如,若特征分裂点的数量x为1,则形成2个特征分类区间。由于目标特征至少包括一个呼叫时机特征,可以采用m个特征分裂点将可呼叫区间划分为m+1个特征分类区间,每一训练呼叫数据均包括与呼叫时机特征相对应的呼叫时间戳,在决策树训练过程,可基于呼叫时机特征相对应的呼叫时间戳将训练呼叫数据划分到相应的特征分类区间对应的节点中。
[0065]
其中,节点熵值为节点的熵,熵是统计学上统计一个节点纯度的指标,假设随机变量x的可能取值有x1、x2……
x
n
;对于每一个可能的取值,其概率p(x=x
i
)=p
i
,(i=1,2,...,n),此时,随机变量x的熵为
[0066]
可以理解为节点的不纯度。在以是用于反映任一节点中所有训练呼叫数据相对于接通率的熵。
[0067]
本示例中,假设每个节点对应的特征集合t是包含t个训练呼叫数据的样本集合,设特征集合t在类属性s上有n个不同的值,则在类属性上的值相同的被划分为同一类别,即特征集合t被划分为n个类别{s1、s2……
s
n
},s
i
(1≦i≦n)表示s
i
的数量,则特征集合t对应的节点熵值为其中,pi=s
i
/t为类别s
i
的特征集合t中所占的比例。本示例中,节点熵值h(t)反映节点对应的特征集合t的节点纯度,节点熵值h(t)越大,则节点所蕴含的不确定信息越大,节点纯度越低;节点熵值h(t)在所有类别的概率都相等时达到最大值,节点纯度最不纯。相应地,节点熵值h(t)越小,则节点所蕴含的不确定信息越低,节点纯度越高,在节点纯度越高时,由该节点中与目标特征相对应的特征分裂点所确定的特征分类区间对呼叫结果标识这一目标值的区分度越高,即反映呼叫成功标识和呼叫失败标识的区分度越高,以便利用节点熵值h(t)进行呼叫策略调整。本示例中,节点熵值越小的节点为呼喊成功与呼叫失败越不平衡的节点,即呼叫成功率远大于呼叫失败率的节点,因此,利用节点熵值h(t)进行呼叫策略调整。
[0068]
其中,节点样本信息是用于划分到同一节点对应的特征集合中的所有训练呼叫数
据的数量相关的信息,该节点样本信息包括样本总数、呼叫成功数量和呼叫失败数量,样本总数为呼叫成功数量和呼叫失败数量之和。其中,呼叫成功数量为携带呼叫成功标识的训练样本数据的数量。呼叫失败数量是携带呼叫失败标识的训练样本数据的数量。
[0069]
例如,若一节点对应的节点纯度越高,则该节点中所有训练呼叫数据中,携带呼叫成功标识和呼叫失败标识的训练呼叫数据越不平衡,即携带呼叫成功标识的训练呼叫数据对应的呼叫成功数量、与携带呼叫失败标识的训练呼叫数据对应的呼叫失败数量越不平衡,即为呼叫成功数量与呼叫失败数量的差值对应的绝对值,占样本总数的占比越大,因此,可根据节点熵值快速确定呼叫接通率最高的特征分裂点,即选择节点熵值最小的节点对应的节点类别信息确定为确定呼叫接通率最高的特征分裂点,以便进行呼叫策略调整。该呼叫接通率可以理解为呼叫成功数量与样本总数的比例。
[0070]
作为一示例,服务器采用决策树模型对所有训练呼叫数据进行处理,以将所有训练呼叫数据依据n个目标特征对应的至少两个特征分类区间进行分类,形成目标决策树,该目标决策树中的每一节点均对应一节点属性信息,用于反映该节点对应的特征集合对应的信息。
[0071]
例如,针对保单催收这一应用场景,可将呼叫时机特征和保单保费特征作为两个目标特征,每个目标特征可设置多个特征分裂点,以将所有训练呼叫数据划分到不同特征集合对应的节点中,每一节点对应一节点类别信息;再对同一节点中的训练呼叫数据进行统计分析,以确定该节点的节点熵值h(t)和节点样本信息,以获取目标决策树中每一节点对应的节点属性信息。该节点属性信息包括节点类别信息、节点熵值和节点样本信息,以便后续根据节点属性信息进行呼叫策略调整。本示例中,呼叫策略的多样性反映在拥有不同保单性质的保单集合上,即符合n个目标特征对应的特征分类区间所形成的特征集合中;呼叫接通与否的分布均匀,意味着大部分保单性质的保单集合中,呼叫成功与呼叫失败的保单数量较均匀,可通过每一节点的节点熵值,将节点熵值最小的节点确定为呼喊成功与呼叫失败最不平衡的节点,即确定呼叫成功率远大于呼叫失败率的节点,以便利用该呼叫的节点类别信息进行信息调整。
[0072]
本实施例所提供的基于决策树的呼叫数据处理方法,对原始特征对应的历史特征值进行可控性分析,以确定可控特征,以排除不可控特征的干扰,从而保障后续生成的目标决策树的处理效率;对所有可控特征对应的历史特征值和呼叫结果标识进行关联性分析,获取与呼叫结果标识关联性较强的目标特征,有助于保障后续生成的目标决策树的处理效率和结果关联性,以保证后续进行呼叫策略调整的准确性;基于n个目标特征形成目标特征,对训练呼叫数据进行处理,以形成目标决策树和每一节点对应的节点属性信息,通过节点属性信息中的节点熵值快速确定最优的节点类别信息,进而进行呼叫策略调整,使得呼叫策略调整具有灵活性、缩短呼叫策略制定的耗时,提高呼叫策略调整处理效率和准确性。
[0073]
在一实施例中,在步骤s205之后,即在采用决策树模型对训练呼叫数据进行处理,获取目标决策树,获取目标决策树中每一节点对应的节点属性信息之后,基于决策树的呼叫数据处理方法还包括:采用可视化工具对目标决策树进行可视化处理,获取可视化决策树,在可视化决策树对应的节点显示区域显示节点属性信息。
[0074]
其中,可视化工具是用于实现可视化处理的工具。
[0075]
作为一示例,服务器可采用graphviz这一可视化工具对目标决策树进行可视化处
理,以获取可视化决策树,并在客户端上显示可视化决策树对应的节点显示区域中显示节点属性信息,具体显示节点类别信息、节点熵值和与呼叫结果标识相关的节点样本信息,以便基于可视化决策树进行呼叫策略调整。例如,将节点熵值最小的节点确定呼喊成功与呼叫失败最不平衡的节点,即确定呼叫成功率远大于呼叫失败率的节点,以便利用该呼叫的节点类别信息进行信息调整。
[0076]
本实施例所提供的基于决策树的呼叫数据处理方法中,在采用决策树模型训练确定目标决策树之后,采用graphviz这一可视化工具对目标决策树分裂过程进行可视化,以使用户可以清晰找出区分度最高的目标节点,即节点熵值最小的目标节点,从该目标节点向上回溯得到目标节点的全部分裂过程,直观反映所有目标特征对应的特征分类区间,可解释性强大且易于表达。本示例中,可根据可视化决策树中的每一节点的节点类别信息、节点熵值和节点样本信息等节点属性信息调整呼叫策略,根据保证呼叫策略调整的灵活性、缩短呼叫策略制定的耗时,提高呼叫策略调整处理效率和准确性。
[0077]
在一实施例中,如图3所示,步骤s202,即对k个原始特征对应的历史特征值进行可控性分析,从k个原始特征中确定l个可控特征,包括:
[0078]
s301:对所有历史呼叫数据中同一原始特征对应的历史特征值进行完整度统计,获取原始特征对应的特征完整度。
[0079]
其中,原始特征对应的特征完整度是用于反映所有历史呼叫数据中同一原始特征中包含非空特征值的概率。非空特征值是指不为空的特征值。
[0080]
作为一示例,服务器获取所有历史呼叫数据对应的历史样本数量,对所有历史呼叫数据中同一原始特征对应的非空特征值进行统计,将原始特征对应的非空特征值的数量确定所原始特征对应的非空数量;将原始特征对应的非空数量与历史样本数量的商值,确定为原始特征对应的特征完整度,以避免后续基于特征完整度较小的历史呼叫数据训练目标决策树存在过拟合和泛化能力不足的问题,从而保证训练所得的目标决策树的准确性。例如,服务器获取的历史呼叫数据的历史样本数量为10000,若原始特征a对应的非空数量为9000,则原始特征a的特征完整度为90%,说明有90%的历史呼叫数据均包含原始特征a对应的非空特征值。
[0081]
s302:对所有历史呼叫数据中同一原始特征对应的历史特征值在预设评估周期内的变动概率进行统计,获取原始特征对应的特征变动概率。
[0082]
其中,预设评估周期是用于评估原始特征对应的历史特征值是否频繁变动的周期,该预设评估周期可根据实际情况自主确定,例如,可设置为1个月。特征变动概率是用于反映所有历史呼叫数据中同一原始特征对应的历史特征值发生变动的概率。
[0083]
作为一示例,服务器获取所有历史呼叫数据对应的历史样本数量,对所有历史呼叫数据中同一原始特征对应的历史特征值发生变动的数量进行统计,获取每一原始特征对应的变动数量,该原始特征对应的变动数量为原始特征对应的历史特征值在预设评估周期内存在变动的数量;将原始特征对应的变动数量与历史样本数量的商值,确定为原始特征对应的特征变动概率。例如,服务器获取的历史呼叫数据的历史样本数量为10000,预设评估周期为1个月,若在系统当前时间之前的1个月内,若原始特征a对应的历史特征值发生变动的变动数量为100,则该原始特征对应的特征变动概率为1%。可以理解地,原始特征对应的历史特征值是否变动,可基于历史呼叫数据对应的数据标识查询系统数据库中与历史呼
叫数据相关的历史记录,以确定原始特征对应的历史特征值在预设评估周期内存在变动,以避免后续基于频繁变动的历史呼叫数据进行决策树训练,从而保证训练所得的目标决策树的准确性。
[0084]
s303:若特征完整度大于完整度阈值,且特征变动概率小于变动概率阈值,则将原始特征确定为可控特征。
[0085]
其中,完整度阈值是用于评估完整度是否达标的阈值。变动概率是用于评估变动概率是否达标的阈值。
[0086]
作为一示例,若特征完整度大于完整度阈值,且特征变动概率小于变动概率阈值,则认定原始特征具有可控性,将原始特征确定为可控特征。相应地,若特征完整度不大于完整度阈值,或者特征变动概率不小于变动概率阈值,则认定原始特征不具有可控性,将原始特征确定为不可控特征。
[0087]
本实施例所提供的基于决策树的呼叫数据处理方法中,将特征完整度大于完整度阈值且特征变动概率小于变动概率阈值的原始特征确定为可控特征,以避免将特征完整度不达标而导致训练所得的目标决策树过拟合,泛化能力不足;或者避免将特征变动概率过高的原始特征确定为可控特征,导致用于训练目标决策树的训练呼叫数据存在不确定性,影响目标决策树训练和后续呼叫策略调整的准确性。
[0088]
作为一示例,如图4所示,采用呼叫结果标识对l个可控特征对应的历史特征值进行关联性分析,从l个可控特征中确定n个目标特征,包括:
[0089]
s401:采用呼叫结果标识对所有历史呼叫数据中同一可控特征对应的历史特征值进行处理,获取可控特征对应的信息增益。
[0090]
作为一示例,步骤s401具体包括:(1)服务器先采用呼叫结果标识对所有历史呼叫数据中同一可控特征对应的历史特征值进行处理,确定每一可控特征对应的经验熵。例如,对于所有历史呼叫数据所形成的样本集合d中,可基于每一可控特征对应的特征分类区间,将其划分为k个类别{c1、c2……
c
k
},每个类别对应的概率为其中,|c
k
|为类别c
k
的样本个数,|d|为样本集合d的样本总数,则每个可控特征对应的经验熵为(2)服务器根据每一可控特征的经验熵,确定可控特征对应的信息增益。服务器利用每一可控特征对应的特征分类区间对所有历史呼叫数据进行划分分类,基于划分前后的经验熵的差值确定该可控特征对应的信息增益,即g(d,a)=h(d)-h(d|a),其中,g(d,a)为信息增益,h(d)为划分前的经验熵,h(d|a)为划分后的经验熵,以便利用该信息增益g(d,a)衡量该可控特征对整个历史呼叫数据所形成的样本集合d的划分效果好坏。可以理解地,对于由历史呼叫数据形成的样本集合d而言,其划分前的经验熵h(d)是一定的,但划分后的经验熵h(da)不确定,经验熵h(da)越大,说明使用此可控特征划分得到的子集的不确定性越小,与呼叫结果的关联性越强。
[0091]
s402:对l个可控特征对应的信息增益进行排序,将信息增益较大的前n个可控特征确定为目标特征。
[0092]
作为一示例,服务器对对l个可控特征对应的信息增益进行排序,将信息增益较大
的前n个可控特征确定为目标特征,以实现将与呼叫结果关联性较大的前n个可控特征确定为目标特征,以排除与呼叫结果关联性较弱的其他可控特征,从而保障后续训练所得的目标决策树相对呼叫策略调整进行效率和准确性。
[0093]
在一实施例中,如图5所示,步骤205,即采用决策树模型对训练呼叫数据进行处理,获取目标决策树,获取目标决策树中每一节点对应的节点属性信息,包括:
[0094]
s501:采用决策树模型,构建与n个目标特征和每一目标特征对应的特征分类区间相关的原始决策树。
[0095]
作为一示例,根据n个目标特征中,根据每一目标特征对应的历史特征值下限、特征分裂点和特征值上限,确定目标特征对应的所有特征分类区间;再采用决策树模型对所有目标特征及其特征分类区间进行处理,以确定原始决策树。例如,可以对n个目标特征所形成的特征集合对应的经验熵、信息增益、信息增益比或者基尼系数等评价指标进行计算,以根据评价指标的高低,确定各个目标特征的划分先后顺序,从而确定原始决策树。
[0096]
s502:将所有训练呼叫数据输入原始决策树,获取原始决策树中每一节点对应的节点属性信息,节点属性信息包括节点类别信息、节点熵值和节点样本信息,节点样本信息包括样本总数。
[0097]
作为一示例,服务器将所有训练呼叫数据输入原始决策树进行分类,以确定原始决策树中每一节点对应的样本总数,该样本总数可以理解为满足目标特征对应的特征分类区间的训练呼叫数据的数量。本示例中,每一原始决策树中的节点包括根节点、叶子节点和设置在根节点和叶子节点之间的中间节点,将所有训练呼叫数据输入原始决策树,以确定每一训练呼叫数据对应的叶子节点,统计所有叶子节点对应的样本总数,由于原始决策树中父节点的样本总数为所有叶子节点的样本总数之和,因此,可确定原始决策树中每一节点对应的样本总数。
[0098]
s503:将样本总数小于预设样本阈值的节点确定为待删节点,采用待删节点对原始决策树进行截枝,获取目标决策树。
[0099]
其中,预设样本阈值是预先设置的用于评估样本总数是否达到保留标准的数量阈值。
[0100]
作为一示例,服务器将每一节点的样本总数与预设样本阈值进行比较,将样本总数小于预设样本阈值的节点确定为待删节点,即需要删除的节点;采用待删节点对原始决策树进行截枝,以使截枝后的目标决策树中每一节点的样本总数均不小于预设样本阈值,以避免部分节点对应的样本总数过少而导致过拟合,泛化能力不足的问题,影响后续基于目标决策树进行呼叫策略调整的准确性。
[0101]
本发明实施例还提供一种基于决策树的呼叫数据处理方法,用于实现利用上述实施例训练所得的目标决策树进行对待呼叫数据进行处理,以实现呼叫策略调整,基于决策树的呼叫数据处理方法包括:
[0102]
s601:获取待呼叫客户对应的至少一个待呼叫数据,待呼叫数据包括n个目标特征对应的待呼特征值,目标特征包括呼叫时机特征,呼叫时机特征对应的待呼特征值为配置呼叫时段。
[0103]
其中,待呼叫数据是指需要呼叫的数据,即需要进行呼叫策略调整以确定呼叫时段的数据。
[0104]
其中,目标特征是预先构建目标决策树所采用的分类条件对应的特征。该目标特征包括呼叫时机特征,还包括具有可控性且与呼叫结果关联性较强的用户画像特征和呼叫目的特征中的至少一个。
[0105]
其中,待呼特征值是指待呼叫数据中与目标特征相对应的具体数值。在目标特征为呼叫时机特征时,可采用训练目标决策树过程采用的与呼叫时机特征相对应的特征分类区间作为其默认的待呼特征值,该呼叫时机特征相对应的特征分类区间为配置呼叫时段;在目标特征为用户画像特征和呼叫目的特征中的至少一个时,将其具体数值确定为待呼特征值。一般来说,同一待呼叫客户对应的待呼叫数据中,呼叫时机特征对应的待呼特征值采用默认的配置呼叫时段,配置呼叫时段的数量为至少一个,因此,呼叫时机特征对应的待呼特征值的数量为至少一个;而用户画像特征和呼叫目的特征对应的待呼特征值的数量只有唯一性。因此,同一待呼叫客户对应的待呼叫数据的数量为至少一个,其呼叫时机特征对应的配置呼叫时段不相同。
[0106]
s602:将待呼叫数据输入目标决策树,确定待呼叫数据在目标决策树上所属的目标节点,获取所述目标节点的节点属性信息。
[0107]
其中,目标节点是指将待呼叫数据输入目标决策树进行分类,以确定与n个目标特征对应的待呼特征值相匹配的节点类别信息相对应的叶子。
[0108]
作为一示例,服务器将每一待呼叫数据输入到目标决策树,依据“根节点-中间节点-叶子节点”的节点遍历顺序,将n个目标特征对应的待呼特征值与每一节点对应的节点类别信息进行匹配,即将n个目标特征对应的待呼特征值,与该节点对应的节点类别信息中同一目标特征对应的特征分类区间进行对比,若所有目标特征对应的待呼特征值是否均在相应的特征分类区间内,则该节点为待选节点;依据节点遍历顺序,将遍历到的最后一个待选节点确定为待呼叫数据所属的目标节点,获取所述目标节点的节点属性信息,基于目标节点和遍历到的所有待选节点确定为节点遍历路径。
[0109]
s603:基于同一待呼叫客户对应的至少一个目标节点的节点属性信息,确定待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级。
[0110]
由于呼叫时机特征对应的待呼特征值为配置呼叫时段为至少一个,基于每一个配置呼叫时段形成一个待呼叫数据,则同一待呼叫客户对应的待呼叫数据的数量为至少一个,每一待呼叫数据确定一个目标节点,且目标节点与配置呼叫时段相对应。
[0111]
本实施例中,服务器可基于同一待呼叫客户对应的至少一个待呼叫数据分别确定目标节点,每一目标节点与待呼叫数据中的配置呼叫时段相关联;获取同一待呼叫客户对应的至少一个目标节点对应的节点熵值和节点样本信息等节点属性信息,确定待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,该时段优先级可与配置呼叫时段在历史呼叫中的呼叫成功概率相关,以便基于时段优先级确定对待呼叫客户进行呼叫策略调整,以提高对待呼叫客户进行呼叫的成功率。
[0112]
在一实施例中,步骤s603,即基于同一待呼叫客户对应的至少一个目标节点的节点属性信息,确定待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,具体包括:
[0113]
s6031:基于同一待呼叫客户对应的至少一个目标节点的节点熵值和节点样本信息。
[0114]
该节点熵值和节点样本信息为目标决策树中目标节点对应的节点属性信息的具
体内容。
[0115]
s6032:基于至少一个目标节点的节点熵值和节点样本信息,获取至少一个目标节点对应的呼叫优先级。
[0116]
由于目标节点的节点样本信息包括样本总数、呼叫成功数量和呼叫失败数量,若呼叫成功数量大于呼叫失败数量,则说明在相应的配置呼叫时段中呼叫成功的概率大于呼叫失败的概率;反之,若呼叫成功数量不大于呼叫失败数量,则说明在相应的配置呼叫时段中呼叫成功的概率不大于呼叫失败的概率。而目标节点的节点熵值反映呼叫成功与呼叫失败分布是否均衡,节点熵值越小,其呼叫成功与呼叫失败越不平衡,因此,服务器可基于至少一个目标节点对应的节点熵值和节点样本信息等节点属性信息,确定至少一个目标节点对应的呼叫优先级,该至少一个目标节点的呼叫优先级可以为依据呼叫成功概率由大到小排序,基于至少一个目标节点的呼叫优先级,确定时段优先级。
[0117]
作为一示例,步骤s6032具体包括:(1)将呼叫成功数量大于呼叫失败数量的目标节点划分到第一节点集合,将呼叫成功数量不大于呼叫失败数量的目标节点划分到第二节点集合。(2)将第一节点集合中的所有目标节点,依据节点熵值由小到大的顺序,形成第一优先序列;将第二节点集合中的所有目标节点,依据节点熵值由大到小的顺序,形成第二优先序列。(3)基于第一优先序列和第二优先序列,获取至少一个目标节点对应的呼叫优先级。
[0118]
例如,基于呼叫成功数量大于呼叫失败数量,且节点熵值由小到大的顺序所形成的目标节点的第一优先序列,可将呼叫成功概率更大且呼叫成功与呼叫失败最不均衡的目标节点放在第一优先序列的第一个,并依据呼叫成功与呼叫失败的不均衡程度(即节点熵值)排序确定其他目标节点在第一优先序列的位置。相应地,呼叫成功数量不大于呼叫失败数量,且节点熵值由大到小的顺序所形成的目标节点的第二优先序列,可将呼叫失败概率更大且呼叫成功与呼叫失败最不均衡的目标节点放在第二优先序列的最后一个,并依据呼叫成功与呼叫失败的不均衡程度(即节点熵值)排序确定其他目标节点在第二优先序列的位置,以使所形成的所有目标节点的呼叫优先级的呼叫成功概率由大到小排序。
[0119]
s6033:基于至少一个目标节点对应的呼叫优先级,确定待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级。
[0120]
本示例中,由于同一待呼叫客户对应的至少一个待呼叫数据分别确定一个目标节点,每一目标节点对应一配置呼叫时段,即同一待呼叫客户对应至少一个目标节点,可基于至少一个目标节点对应的呼叫优先级,确定与至少一个目标节点相对应的配置呼叫时段对应的时段优先级。
[0121]
例如,若同一待呼叫客户对应的至少一个待呼叫数据对应的目标节点分别为p1、p2、p3、p4和p5,其对应的配置呼叫时段分别为t1、t2、t3、t4和t5;若至少一个目标节点对应的呼叫优先级为p1>p4>p5>p2>p3;则待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级为t1>t4>t5>t2>t3,即优先在配置呼叫时段t1,对待呼叫客户进行呼叫,可使其呼叫成功率更高,以实现利用待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级进行呼叫策略配置,从而保障后续呼叫成功率。
[0122]
s604:基于所有待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,对所有待呼叫客户进行呼叫策略调整,确定待呼叫客户对应的目标呼叫时段。
[0123]
作为一示例,服务器可基于每一待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,选取时段优先级最高的配置呼叫时段,确定为该待呼叫客户对应的目标呼叫时段;依据类推,确定所有待呼叫客户对应的目标呼叫时段,利用语音呼叫系统在目标呼叫时段,对所有待呼叫客户进行语音呼叫,有助于提高呼叫成功率。
[0124]
作为另一示例,在考虑语音呼叫系统的系统资源有限的情况下,即在任一配置呼叫时段的时段可用资源有限的情况下,步骤s604,具体包括:
[0125]
s6041:基于每一待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,依据时段优先级的先后顺序,确定该待呼叫客户对应的待选呼叫时段。
[0126]
例如,待呼叫客户u1的时段优先级为t1>t4>t5>t2>t3时,可先将t1确定为待选呼叫时段;若t1无法被确定为目标呼叫时段时,依次将t4、t5、t2和t3确定为待选呼叫时段。
[0127]
s6042:获取待选呼叫时段对应的时段可用资源,并获取待选呼叫时段对应的所有待呼叫客户对应的待分配资源。
[0128]
该时段可用资源为语音呼叫系统在每一待选呼叫时段可进行呼叫的系统资源,为该待选呼叫时段能否呼叫的最大资源。该待分配资源是指给每一待呼叫客户分配的呼叫资源,与所有待呼叫客户对应的数量相关,数量越多,待分配资源越大。
[0129]
s6043:若待选呼叫时段对应的时段可用资源大于或者等于待分配资源,则将待呼叫客户对应的待选呼叫时段,确定为该待呼叫客户对应的目标呼叫时段。
[0130]
可理解地,若时段可用资源大于或者等于待分配资源,说明同一待选呼叫时段对应的时段可用资源能够给所有待呼叫客户分配相应的呼叫资源,因此,可直接将时段可用资源大于或等于待分配资源的待选呼叫时段确定为待呼叫客户对应的目标呼叫时段。
[0131]
s6044:若待选呼叫时段对应的时段可用资源小于待分配资源,则对同一待选呼叫时段对应的所有待呼叫客户进行客户优先级分析,获取待呼叫客户对应的客户优先级;依据客户优先级的先后顺序,将与时段可用资源数量相匹配的待呼叫客户确定为目标呼叫客户,将待选呼叫时段确定为目标呼叫客户对应的目标呼叫时段;对与时段可用资源数量不匹配的待呼叫客户,依据时段优先级的先后顺序,更新确定待呼叫客户对应的待选呼叫时段。
[0132]
例如,待呼叫客户u1的时段优先级为t1>t4>t5>t2>t3时,可先将t1确定为待选呼叫时段;若待选呼叫时段对应的时段可用资源为1000个呼叫资源。在一示例中,若对所有待呼叫客户进行分析,确定待选呼叫时段t1对应的所有待呼叫客户对应的待分配资源为900个,即900个待呼叫客户想在待选呼叫时段t1呼叫,由于待选呼叫时段对应的时段可用资源1000大于待分配资源900,因此,可将这900个待呼叫客户确定在待选呼叫时段t1呼叫,则t1为这900个待呼叫客户对应的目标呼叫时段。在另一示例中,若对所有待呼叫客户进行分析,确定待选呼叫时段t1对应的所有待呼叫客户对应的待分配资源为1100个,即1100个待呼叫客户想在待选呼叫时段t1呼叫,由于待选呼叫时段对应的时段可用资源1000小于待分配资源1100,因此,需对1100个待呼叫客户进行客户优先级分析,获取1100个待呼叫客户对应的客户优先级,可依据1100个待呼叫客户对应的客户优先级的先后顺序,将客户优先级在先的1000个待呼叫客户确定为待选呼叫时段t1对应的目标呼叫客户,将待选呼叫时段t1确定为目标呼叫客户对应的目标呼叫时段;对与时段可用资源数量不匹配的待呼叫客户,即客户优先级在后的100个待呼叫客户,需重新确定其待选呼叫时段,待呼叫客户u1为客户
优先级在后的100个待呼叫客户,则依据时段优先级的优先顺序,将t4确定为待选呼叫时段,并执行执行步骤s6041-s6044,以实现对所有待呼叫客户进行呼叫策略调整,有助于保障各个呼叫时段对待呼叫客户进行呼叫的成功率。
[0133]
本实施例所提供的基于决策树的呼叫数据处理方法中,将待呼叫客户对应的至少一个待呼叫数据输入到目标决策树中,以确定每一待呼叫数据对应的目标节点,从而确定待呼叫数据中配置呼叫时段对应的时段优先级,以根据时段优先级对所有待呼叫客户进行呼叫策略调整,以实现利用目标决策树进行快速准确的呼叫策略调整,确定待呼叫客户对应的目标呼叫时段,以保障对待呼叫客户进行呼叫的成功率,使得呼叫策略调整具有灵活性、缩短呼叫策略制定的耗时,提高呼叫策略调整处理效率和准确性。
[0134]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0135]
在一实施例中,提供一种基于决策树的呼叫数据处理装置,该基于决策树的呼叫数据处理装置与上述实施例中基于决策树的呼叫数据处理方法一一对应。如图7所示,该基于决策树的呼叫数据处理装置包括历史呼叫数据获取模块701、可控特征确定模块702、目标特征确定模块703、训练呼叫数据获取模块704和目标决策树获取模块705。各功能模块详细说明如下:
[0136]
历史呼叫数据获取模块701,用于获取历史呼叫数据,历史呼叫数据包括呼叫结果标识和k个原始特征对应的历史特征值,原始特征包括呼叫时机特征,其中,k≧2。
[0137]
可控特征确定模块702,用于对k个原始特征对应的历史特征值进行可控性分析,从k个原始特征中确定l个可控特征,其中,2≦l≦k。
[0138]
目标特征确定模块703,用于采用呼叫结果标识对l个可控特征对应的历史特征值进行关联性分析,从l个可控特征中确定n个目标特征,目标特征包括呼叫时机特征,其中,2≦n≦l。
[0139]
训练呼叫数据获取模块704,用于基于呼叫结果标识和n个目标特征对应的历史特征值,形成训练呼叫数据。
[0140]
目标决策树获取模块705,用于采用决策树模型对训练呼叫数据进行处理,获取目标决策树,获取目标决策树中每一节点对应的节点属性信息,节点属性信息包括节点类别信息、节点熵值和节点样本信息。
[0141]
优选地,可控特征确定模块702,包括:
[0142]
特征完整度获取单元,用于对所有历史呼叫数据中同一原始特征对应的历史特征值进行完整度统计,获取原始特征对应的特征完整度。
[0143]
特征变动概率获取单元,用于对所有历史呼叫数据中同一原始特征对应的历史特征值在预设评估周期内的变动概率进行统计,获取原始特征对应的特征变动概率。
[0144]
可控特征判定单元,用于若特征完整度大于完整度阈值,且特征变动概率小于变动概率阈值,则将原始特征确定为可控特征。
[0145]
优选地,目标特征确定模块703,包括:
[0146]
信息增益获取单元,用于采用呼叫结果标识对所有历史呼叫数据中同一可控特征对应的历史特征值进行处理,获取可控特征对应的信息增益。
[0147]
目标特征确定单元,用于对l个可控特征对应的信息增益进行排序,将信息增益较大的前n个可控特征确定为目标特征。
[0148]
在一实施例中,提供一种基于决策树的呼叫数据处理装置,该基于决策树的呼叫数据处理装置与上述实施例中基于决策树的呼叫数据处理方法一一对应。如图8所示,该基于决策树的呼叫数据处理装置包括待呼叫数据获取模块801、目标节点确定模块802、时段优先级确定模块803和目标呼叫时段确定模块804。各功能模块详细说明如下:
[0149]
待呼叫数据获取模块801,用于获取待呼叫客户对应的至少一个待呼叫数据,待呼叫数据包括n个目标特征对应的待呼特征值,目标特征包括呼叫时机特征,呼叫时机特征对应的待呼特征值为配置呼叫时段。
[0150]
目标节点确定模块802,用于将待呼叫数据输入上述实施例所获取的目标决策树,确定待呼叫数据在目标决策树上所属的目标节点,获取所述目标节点的节点属性信息。
[0151]
时段优先级确定模块803,用于基于同一待呼叫客户对应的至少一个目标节点的节点属性信息,确定待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级。
[0152]
目标呼叫时段确定模块804,用于基于所有待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,对所有待呼叫客户进行呼叫策略调整,确定待呼叫客户对应的目标呼叫时段。
[0153]
优选地,时段优先级确定模块803,包括:
[0154]
节点信息获取单元,胜用于基于同一待呼叫客户对应的至少一个目标节点的节点熵值和节点样本信息。
[0155]
呼叫优先级获取单元,用于基于至少一个目标节点的节点熵值和节点样本信息,获取至少一个目标节点对应的呼叫优先级。
[0156]
时段优先级获取单元,用于基于至少一个目标节点对应的呼叫优先级,确定待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级。
[0157]
优选地,目标呼叫时段确定模块804,包括:
[0158]
待选呼叫时段确定单元,用于基于每一待呼叫客户对应的至少一个配置呼叫时段对应的时段优先级,依据时段优先级的先后顺序,确定该待呼叫客户对应的待选呼叫时段。
[0159]
资源确定模块,用于获取待选呼叫时段对应的时段可用资源,并获取待选呼叫时段对应的所有待呼叫客户对应的待分配资源。
[0160]
第一目标时段确定模块,用于若待选呼叫时段对应的时段可用资源大于或者等于待分配资源,则将待呼叫客户对应的待选呼叫时段,确定为该待呼叫客户对应的目标呼叫时段。
[0161]
第二目标时段确定模块,用于若待选呼叫时段对应的时段可用资源小于待分配资源,则对同一待选呼叫时段对应的所有待呼叫客户进行客户优先级分析,获取待呼叫客户对应的客户优先级;依据客户优先级的先后顺序,将与时段可用资源数量相匹配的待呼叫客户确定为目标呼叫客户,将待选呼叫时段确定为目标呼叫客户对应的目标呼叫时段;对与时段可用资源数量不匹配的待呼叫客户,依据时段优先级的先后顺序,更新确定待呼叫客户对应的待选呼叫时段。
[0162]
关于基于决策树的呼叫数据处理装置的具体限定可以参见上文中对于基于决策树的呼叫数据处理方法的限定,在此不再赘述。上述基于决策树的呼叫数据处理装置中的
各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0163]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于执行基于决策树的呼叫数据处理方法过程采用或者生成的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于决策树的呼叫数据处理方法。
[0164]
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于决策树的呼叫数据处理方法,例如,图2至图6中所示,为避免重复,这里不再赘述。或者,处理器执行计算机程序时实现基于决策树的呼叫数据处理装置这一实施例中的各模块/单元的功能,例如图7至图6所示的各模块/单元的功能,为避免重复,这里不再赘述。
[0165]
在一实施例中,提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中基于决策树的呼叫数据处理方法,例如,图2至图6中所示,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述基于决策树的呼叫数据处理装置这一实施例中的各模块/单元的功能,例如图7至图6所示的各模块/单元的功能,为避免重复,这里不再赘述。
[0166]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0167]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0168]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应
包含在本发明的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1