基于大数据处理用户语音呼叫的方法、装置和系统与流程

文档序号：11236911阅读：438来源：国知局

本发明涉及数据处理技术领域，具体地说，涉及一种基于大数据处理用户语音呼叫的方法、装置和系统。

背景技术：

呼叫中心(callcenter)，也被称为客户服务中心或客服系统。早期的呼叫中心涉及到的设备通常就是一个电话机、一个笔再加一个本子。用户播打呼叫中心提供的热线电话或咨询电话，由受过训练的话务员专门接听、处理用户提出的各类问题，如咨询、投诉或建议等。

随着通讯、计算机和网络技术的发展，现代呼叫中心已经涉及到了计算机(软硬件)技术、网络技术、计算机电话集成技术(cti)、数据仓库(商业智能bi)技术、客户关系管理(crm)技术、交换机(pbx)通讯技术和企业管理、项目管理、团队管理等诸多方面的内容。现代的呼叫中心已经成为一个统一、高效的服务工作平台，将企业内分属各职能部门集中在一个统一的对外联系的窗口，集中化地安置坐席，采用统一的标准服务模式，为用户提供系统化、智能化、人性化的服务。呼叫中心已经成为与企业连为一体的一个完整的综合信息服务系统，是现代企业运营不可或缺的一部分，同时也成为企业间竞争的有力工具。

具体地，呼叫中心涉及到的功能基本包括以下部分：

通话录音。实时硬件语音解压缩，自动增益去噪，完整记录用户来电或外拨的通话内容，超长时间数字化地保存。

自动呼叫分配(automaticcalldistribution，简称acd)。acd系统可以成批的处理来电，过多的来电可转入排队或留言，按用户自助选择的服务方式或按预先设定路由规则将来电转给座席。acd系统的工作方式可以通过平台软件的管理界面灵活进行设置。

交互式语音应答(interactivevoiceresponse，简称ivr)。呼叫中心通过ivr可以和用户进行全程自动应答，这种菜单式的导航功能可以做得非常复杂和智能化。这也是呼叫中心区别于普通电话交换机集团电话的显著标志。

座席管理。呼叫中心的工作人员被称为座席或业务代表，座席组成的小组被称为座席组(业务组)。一个呼叫中心小到一两个坐席，多到成百上千个坐席，而小企业和大企业的小部门也可以根据需要，非常经济地建立一个只有几个业务组的小型呼叫中心。坐席分技能组可以和ivr及acd功能进行有机结合。呼叫中心可以对这些座席进行有效的权限管理，比如数据访问权限、功能操作权限或分级管理。

呼叫中心涉及到庞大的数据，例如：用户信息，如用户的个人信息、帐户信息和订单信息等；业务信息，如各种订单及由此订单产生的新的数据，订单信息包括订单的类型、内容和配送信息，并由此可产生出配送信息。为了使用户或工作人员可以掌握订单的流程，在每一个订单的每一个处理流程，均会产生对应的新的数据。因此，一个规模较大的呼叫中心每天要处理大量的数据。

在通常的呼叫中心或电话客服系统的模式中，如图1所示，用户a播打客服热线，cti电话客服系统a1接通该热线后，通过ivr系统a2向用户a提供语音选项提示，当用户a按照提示选择了相应的服务项时，cti电话客服系统a1将该用户接入到crm系统a3，并接通相应的坐席a4，由坐席人员接听该热线。而当用户在听取ivr系统的语音提示、选择相应按键的过程中，需要用户根据知识及经验进行按键选择。这是因为，对应特定数字键，系统定义了不同的功能，例如，不同的服务类型，如京东商城的热线中，将服务类型分为pop服务(由第三方在京东提供的平台上进行售卖而提供的服务)或自营服务(为京东自己售卖的商品提供的服务)；不同的服务进程，如售前、售中或售后；不同的商品类别，如一级、二级或三级品类别。当用户播打客服热线时，通过ivr引导用户人工选取特定数字键，而后cti根据数字键转到不同的人工坐席组。但是，在此过程中，用户在听取ivr时，由于对语音导航的理解会有偏差，在按键时，错键率高达20％以上。由于选错数字键，不能得到期望的服务，用户或者只好重新开始，或者选择由系统内部的人工进行转达。不但用户在ivr的停留时长过长，效率较低，影响了用户的体验，而且也占用呼叫中心的资源，呼叫中心需要提供足够的人力及硬件设备来满足用户的需要，导致呼叫中心的运营成本较高。

技术实现要素：

本发明要解决的技术问题在于，针对现有技术的不足，提供一种基于大数据处理用户语音呼叫的方法、装置和系统，根据用户的语音呼叫，预测用户问题类型，可以准确、快速地将用户语音呼叫自动分流到相应的坐席。

为了解决上述的技术问题，根据本发明的一个方面，本发明提供了一种基于大数据处理用户语音呼叫的数据处理方法，其中，包括以下步骤：

根据用户信息采集及用户历史行为数据；

根据采集到的历史行为数据，对用户指标进行分布式汇总计算和分析，得到多个场景的多个描述数据；其中，所述用户指标为用户具体行为的数据化描述；和

根据所述多个场景的多个描述数据，并依据相应的算法得到用于处理用户语音呼叫的预测模块。

优选地，上述依据相应的算法得到用于处理语音呼叫的预测模块包括以下步骤：

依据多个场景的多个描述数据，通过对描述数据中的基础指标进行运算得到针对每一场景的至少一条规则；

将所述规则转换为与预设算法对应的算法特征，并将每一条规则的预测结果作为特征值，其中，所述预设算法至少为一种；

选取预设算法中的一种算法及与其相对应的算法特征及特征值，应用训练样本得到预测模块；

根据预定验证规则验证所述预测模块是否符合验证规则的规定，如果不符合，更换所述算法及与其相对应的算法特征与特征值及训练样本，重新训练得到预测模块，直到所得到的预测模块得到符合验证规则的规定为止。

优选地，得到符合验证规则规定的预测模块后，还包括对所述预测模块的优化步骤：

选取不同日期的训练数据，按照训练得到多个预测模块；

从每一个预测模块中转换得到一个包括多个规则的规则集；

从所述多个规则集中抽取出符合相似度要求的规则；

将抽取到的规则转换成算法特征；

应用算法特征、特征值和训练样本得到稳定预测模块。

优选地，在得到稳定预测模块之后还包括：按照预定处理周期，计算与用户最新行为数据相对应的算法特征值。

优选地，对描述数据中的基础指标进行运算得到针对每一场景的至少一条规则，具体包括：

依据场景的描述数据，从与所述场景对应的多个数据源之一中选取至少一个数据；

依据设定的过滤规则，对所述至少一个数据进行过滤；

确定过滤后的数据的周期；

基于所述过滤后的数据及其周期，根据预定的判断逻辑形成所述场景的一条规则。

优选地，所述基础指标包括：

用户最近15天内只下过自营订单或pop订单；购买商品的退换货率、购买商品的取消购买率；最近一周未完成售后服务单类型；或/和最近一周未完成事件类型。

优选地，所述预定验证规则包括准确度：

使用测试数据对预测结果进行评估，正确预测的用户数与已预测用户数的比值，可以转换为百分比数值；

所述预定验证规则还包括可解释性：

即业务方对所述预测模块的理解程度，由业务方评价，包括不同的级别，例如分为高、中和低三个级别；或/和

所述预定验证规则还包括业务合理性：

即通过数据分析，保证不仅预测的结果是正确的，而且需要产生正确结果的过程也是正确的，通过数据分析结果来判定预测的过程与业务逻辑是否相符合，如果符合，则合理，如果不符合，则不合理。

优选地，所述算法流程包括decisiontree(决策树，机器学习中一种分类算法)、logisticregression(逻辑回归，机器学习中一种分类算法)、naivebayesian(朴素贝叶斯，机器学习中一种分类算法)、randomforests(随机森林，机器学习中一种分类算法)或svm(支持向量机，机器学习中一种分类算法)中的任意一种或多种。

优选地，所述预测模块输出多维、具有递进关系的预测结果；其中，所述预测结果对应于用户问题类型；在所述预测结果中，一维预测结果对应的用户问题类型具体为自营或pop；二维预测结果对应的用户问题类型为：售前或售中或售后；三维预测结果对应的用户问题类型为：一级品类或二级品类或三级品类；其中，递进关系为：当一维预测结果具体为自营时，具有二维预测结果，当二维预测结果为售后时，具有三维预测结果。

优选地，所述用户信息包括用户帐号信息；所述用户历史行为数据包括订单信息数据和咨询记录信息数据。

为了解决上述的技术问题，根据本发明的一个方面，本发明提供了一种基于大数据处理用户语音呼叫的数据处理装置，包括：

信息采集模块，用于根据用户信息采集用户历史行为数据；

数据分析模块，用于根据采集到的历史行为数据，对用户指标进行分布式汇总计算和分析，从而得到多个场景的多个描述数据；和

预测模块生成模块，用于根据所述多个场景的多个描述数据，依据相应的算法流程训练得到预测模块。

优选地，所述预测模块生成模块包括：

规则生成子模块，用于依据多个场景的多个描述数据，通过对描述数据中的基础指标进行运算得到针对每一场景的至少一条规则；

特征转换子模块，用于将所述规则转换为算法特征；

标注样本映射子模块，用于根据事件主表中的概要描述一级进行映射标注，得到训练样本；

预测模块生成子模块，用于选取预设算法中的一种，从所述特征转换子模块中选择相应的算法特征及特征值，从标注样本映射子模块中选取相应的训练样本生成预测模块；和

验证子模块，根据预定验证规则验证所述预测模块是否符合验证规则。

优选地，所述预测模块生成模块还包括预设算法集，包括decisiontree、logisticregression、naivebayesian、randomforests或svm算法。

优选地，所述规则生成子模块包括：

数据选取单元，用于根据场景的描述数据，从与所述场景对应的多个数据源之一中选取至少一个数据；

数据过滤单元，用于根据预定的过滤规则，对选取的数据进行过滤；

数据周期确定单元，用于确定过滤后的数据周期；和

规则生成单元，基于所述过滤后的数据及其周期，根据预定的判断逻辑，形成所述场景的一条规则。

优选地，所述预测模块生成模块还包括：

规则转换子模块，用于从每一个预测模块中转换得到一个包括多个规则的规则集；

规则抽取子模块，用于从所述多个规则集中抽取出符合相似度要求的规则。

通过前述的数据处理方法和装置，通过大数据挖掘算法，根据用户语音呼叫信息，预测用户的咨询问题类型，如用户咨询的问题是属于自营，还是属于pop等。

为了解决上述的技术问题，根据本发明的一个方面，本发明提供了一种基于大数据的用户语音呼叫分流方法，其中，包括：

根据用户的语音呼叫信息，获得用户电话号码信息；

根据所述用户电话号码信息按照预定匹配逻辑获得匹配的用户帐号信息；

根据所述匹配的用户帐号信息，由前述的数据处理装置，按照前述的数据处理方法，预测与当前语音呼叫对应的用户问题类型；

根据所述用户问题类型，将语音呼叫转入相应的坐席，或由ivr系统按照第一导航模式引导用户，将语音呼叫转入相应的坐席。

优选地，所述预定匹配逻辑具体包括：

如果与所述用户电话号码信息对应的帐号信息为多个，且有绑定帐号，则所述的绑定帐号为匹配的用户帐号信息；或

如果与所述用户电话号码对应的帐号为一个，则所述的帐号为匹配的用户帐号信息；或

如果与所述用户电话号码对应的帐号为多个，且没有绑定帐号，则匹配为空，由ivr系统按照第二导航模式引导用户，将语音呼叫转入相应的坐席；或

如果与所述用户电话号码对应的帐号为0个，则匹配为空，由ivr系统按照第二导航模式引导用户，将语音呼叫转入相应的坐席。

优选地，当预测得到的所述用户问题类型为一维预测结果时，所述ivr系统的第一导航模式包括对二维预测结果的选择提示和/或对三维预测结果的选择提示；或

当预测得到的所述用户问题类型为二维预测结果中的“售后”时，所述ivr系统的第一导航模式包括对三维预测结果的选择提示。

为了解决上述的技术问题，根据本发明的一个方面，本发明提供了一种基于大数据的用户语音呼叫分流系统，其中，包括：

cti电话系统，用于接收用户的电话语音呼入信息，并解析出对应的用户电话号码，并根据预测结果将用户的电话呼入转入相应的坐席；

帐号匹配模块，与所述cti电话系统连接，根据解析出的用户电话号码信息，按照匹配逻辑获得匹配的用户帐号信息；

如前所述的数据处理装置，用于按照如前述的数据处理方法根据所述用户帐号测预出相应的用户问题类型；和

ivr系统，用于根据用户问题类型提供第一或/和第二导航模式。

以上基于大数据的语音呼叫分流方法和系统根据呼入的语音信息，进行用户账号匹配，并根据匹配的用户账号预测用户咨询自营/pop、售前/售中/售后、一级品类/二级品类/三级品类等问题，与传统的采用ivr系统的语音呼叫分流方法相比，本发明减少了用户在ivr系统的停留时间，节省了用户的时间，改善了用户体验，并且提高了沟通效率，同时也减少了呼叫中心在人力和设备上的投入，降低了成本。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其他目的、特征和优点将更为清楚，在附图中：

图1为本发明所述传统电话客服系统的结构原理示意图；

图2为本发明所述数据处理装置的结构原理示意图；

图3为本发明所述数据处理方法流程示意图；

图4为本发明所述预测模块生成模块的结构原理示意图；

图5为本发明所述的规则生成子模块的结构原理示意图；

图6为本发明所述生成规则的流程示意图；

图7为本发明所述预测模块生成模块的另一结构原理示意图；

图8为本发明所述基于大数据的语音呼叫分流方法的流程示意图；和

图9为本发明所述基于大数据的语音呼叫分流系统的结构原理示意图。

具体实施方式

以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质，公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。

附图中的流程图、框图图示了本发明实施例的系统、方法、装置的可能的体系框架、功能和操作，流程图和框图上的方框可以代表一个模块、程序段或仅仅是一段代码，所述模块、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意，所述实现规定逻辑功能的可执行指令可以重新组合，从而生成新的模块和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤，而不应以此作为对发明本身的限制。

在电话客服系统中，具有提供不同服务的坐席或坐席组，当有用户来电时，电话客服系统需要根据针对此次来电用户要解决的问题类型或内容，将用户来电分流到相应的坐席，从而为用户提供相应的服务。在传统方案中，在对用户语音呼叫进行分流时，用户根据ivr系统的菜单式语音提示做出一步步选择，客服系统根据用户的选择将此次用户的语音呼叫分流到某一坐席。在用户问题类型的确定上，完全依赖于用户本人，电话客服系统不做任何判断，只是按照预定的导航模式(为与以下本发明涉及到的导航模式相区别，在此称为第二导航模式)向用户提供菜单式的选项。而本发明提供的方法和系统，基于客服系统，主要是基于电话客服系统，可以预测每一次用户语音呼叫涉及到的用户问题类型，不需要或仅向用户提供极其简单的语音提示，便可将用户的语音呼叫分流到相应的坐席。以下将对本发明所述的方法和系统进行详细地说明。

为了预测基于用户语音呼叫的用户问题类型，本发明提供了一种数据处理方法和装置，对来源于，包括但不限于hadoop平台、关系型数据库、业务文档、客服标注等的数据，根据数据挖掘流程和业务需要，采用大数据挖掘算法来预测用户问题类型。

如图2所示，为本发明所述数据处理装置的结构原理示意图。所述数据处理装置包括信息采集模块1、数据分析模块2和预测模块生成模块3。图3为本发明所述数据处理方法流程示意图；结合图2和图3进行详细说明。

步骤s1，通过信息采集模块1根据用户信息采集用户历史行为数据。其中，所述用户信息包括用户帐号信息，用户历史行为数据包括来自于各种数据源中的、与用户行为相关的数据。例如：来自于订单详情表的订单信息，包括时间、订单内容、配送方式、配送地址等数据。从云计算平台获取咨询记录信息数据。所述咨询记录信息数据主要来自于用户咨询的事件概要描述，此事件概要描述是客服人员根据用户描述进行的自主分类等等。

步骤s2，由数据分析模块2根据采集到的用户信息及历史行为数据，对用户指标进行分布式汇总计算和分析，从而得到多个场景的多个不同角度的描述数据。其中，所述用户指标为用户具体行为的数据化描述。例如：用户最近n天内是否只下过自营订单或pop订单，通过数据化的 “1”代表“只下过自营订单”，“0”代表“只下过pop订单”。此处的对用户指标进行的计算是基于分布式的云计算环境中进行的，并且，由于同一用户的相同指标不一定是用户的一次行为，因而需要对数据进行汇总、分析，再进行计算。比如：获取用户一个账户n天内所下订单及其详情，分析这些订单的类型，根据订单类型进行一致性汇总判断。如果所下订单都为自营订单，那么计算的值最终为1；如果所下订单都为pop订单，那么计算的值最终为0；如果既有自营订单又有pop订单，则无计算的值。

多个场景指多个不同的应用场景，如下单场景、配送场景、售后场景、特定商品场景等，不同的应用场景应用不同的描述数据，例如：均以最近一周的数据为例：

下单场景1，对应于用户只下过一个订单的场景。如果此订单为自营订单，描述数据为自营订单(从而为后续的预测提供判断依据，即从该描述数据可知用户问题类型为自营订单)；如果此订单为pop订单，描述数据为pop订单。

下单场景2对应于用户下过多个订单的场景。如果多个订单都为同一类型且为自营订单，描述数据为自营订单；如果多个订单都为同一类型且为pop订单，描述数据为pop订单。

售后场景1对应于用户创建过售后服务单并且截止到目前此售后服务单仍未完成且未关闭的场景。如果此售后服务单为自营类型，描述数据为自营；如果此售后服务单为pop类型，则描述数据为pop。

售后场景2对应于用户创建过事件并且截止到目前此事件仍未完成且未关闭的场景。如果此事件为自营类型，描述数据为自营；如果此事件为pop类型，则描述数据为pop。这里所述的事件对应于每一个用户的咨询，在本系统中，每个用户的咨询都对应一个事件，客服人员在解决用户问题的时候会同步记录用户咨询问题的种类，如自营类型或pop类型。

步骤s3，预测模块生成模块3根据所述多个场景的多个描述数据，依据相应的算法流程训练得到预测模块。

如图4所示，为本发明所述预测模块生成模块的结构原理示意图；所述预测模块生成模块包括规则生成子模块31、特征转换子模块32、标注样本映射子模块33、预设的算法集34、预测模块生成子模块35和验证子模块36。

其中，规则生成子模块31用于依据多个场景的多个描述数据，通过对描述数据中的基础指标进行运算得到针对每一场景的至少一条规则；特征转换子模块32将所述规则转换为算法特征；标注样本映射子模块33用于根据事件主表中的概要描述一级进行映射标注，得到训练样本；算法集34提供多种不同的算法，如decisiontree、logisticregression、naivebayesian、randomforests或svm；预测模块生成子模块35从算法集34中选取一种预设算法，从所述特征转换子模块32中选择与所述算法相应的算法特征及其特征值，并从标注样本映射子模块33中选取对应的训练样本生成预测模块；验证子模块36用于根据预定验证规则验证所述预测模块是否符合验证规则。

在本发明中，为了可以应用于不同的场景，并能对相应的场景进行预测，需要获得各个不同场景的规则。

具体地，规则生成子模块的结构原理示意图如图5所示，规则生成子模块包括数据选取单元310、数据过滤单元311、数据周期确定单元312和规则生成单元313。图6为规则生成子模块生成一条规则的流程示意图。结合图5和图6，在步骤s31，数据选取单元310依据场景的描述数据与所述场景对应的数据源，如订单详情表，数据源可能为多个，选择一个数据源；

步骤s32，从选定的数据源中选取一个以上的数据，如某一订单。

步骤s33，数据过滤单元311依据设定的过滤规则，对所述至少一个数据进行过滤。所述的过滤规则例如：去掉无法确定自营或pop的订单。

步骤s34，数据周期确定单元312从过滤后的数据中选择设定周期的数据，例如使用最近15天内的订单而不是最近一周或一个月的。

步骤s35，规则生成单元313基于所述符合设定周期的数据，根据预定的判断逻辑形成所述场景的一条规则。所述判断逻辑例如为：如果此订单为自营订单，则设定用户问题类型为自营；如果此订单为pop订单，则用户问题类型为pop。因而规则便是：如果此订单为自营订单，则设定用户问题类型为自营；如果此订单为pop订单，则用户问题类型为pop。

对于同一个场景，如果选取不同的数据源、设定不同的过滤规则、以及使用不同的数据周期，则会产生多个不同规则。因而每个场景对应有多个规则，从而在系统内形成一个规则集，存储有各类规则。

前述是以用户最近15天内只下过自营订单或pop订单为作基础指标。基础指标还可以包括：购买商品的退换货率；购买商品的取消购买率；最近一周未完成售后服务单类型或最近一周未完成事件类型。

基于同样的处理方法，生成下单规则、配送规则、售后规则、商品规则和用户规则，根据这些规则，预测模块可以从不同的角度锁定问题订单，从而预测用户语音呼叫对应的用户问题类型。例如，从用户最近一次下单锁定问题订单，或从配送时长、签收异常、能否联系到用户等维度锁定问题订单，或从创建售后服务单后的催退款、状态咨询等维度锁定问题订单，或从退换货、安装、评价、取消购买等维度锁定问题商品，或从下单时用户级别、是否首单等维度锁定问题订单，保证本发明可以从多角度，多层次来预测用户问题的类型，进而进行准确地分流。

特征转换子模块32将前述的各种规则转换为算法特征；即每一条规则对应一个算法特征，针对该规则预测的结果作为特征值。例如，针对规则“如果此订单为自营订单，则设定用户问题类型为自营；如果此订单为pop订单，则用户问题类型为pop”，对应算法特征的特征值为“1”或“0”。其中，“1”代表“自营”，“0”代表“pop”。

所以，对应于规则集，本发明还有一个对应的特征集，用于在预测模块生成子模块35选择算法进行训练时使用。

标注样本映射子模块33用于根据事件主表中的概要描述一级，进行映射标注，从而得到训练样本，供生成预测模块时使用。

关于事件主表，所述事件主表用于记录发生的事件。每一次的用户呼叫都会被作为一个事件记录下来。例如，当用户打电话进行咨询时，“咨询”会在系统中对应一个“事件”，客服人员在解决用户问题的时候会同步记录用户咨询问题的种类(包括订单类、配送类、pop订单类等等，这些信息对应于事件主表中的概要描述一级)，通过该信息可以映射为“自营或pop”。所述标注，指客服人员对用户类别(自营/pop)的划分。如：用户a标注的结果是(a,1),其中1表示自营。经过标注后，得到一个样本集，存储起来以便供生成预测模块时使用。

在本发明的系统中存储中多种算法流程，其可作为一段应用程序存储起来，供本发明的数据处理方法调用。例如decisiontree、logisticregression、naivebayesian、randomforests或svm。这些算法均是机器学习中的经典算法，因而在此不再展开说明。

本发明中所述的预测模块生成子模块35生成预测模块后，验证子模块36根据预定验证规则验证所述预测模块是否符合要求。如果不符合，预测模块生成子模块35更换所述算法流程及与其相对应的算法特征与特征值，重新训练得到预测模块，再由验证子模块36进行验证，直到所得到的预测模块符合验证规则的规定为止。

其中，所述预定验证规则包括“准确度”、“可解释性”和“业务合理性”.其中，准确度可以为百分比数值，当使用生成的预测模块利用测试数据得到预测结果后，对预测结果进行评估，正确预测的用户数量与全部测试的用户数量的比值。可解释性指业务方对所述预测模块的理解程度，由业务方评价，可以分为多个级别，如高、中、低三个级别。业务合理性指通过数据分析，保证不仅预测的结果是正确的，而且需要产生正确结果的过程也是正确的。具体通过数据分析的结果来判定，判断预测的过程与业务逻辑是否相符合，如果符合，则合理，如果不符合，则不合理。

通过以上步骤，确定了预测模块使用的合适的算法。为了使所述算法在预测时更加准确、合理，还可以进行多次优化。具体的，如图7所示，预测模块生成模块3还包括：规则转换子模块37和规则抽取子模块38。预测模块生成模块3选取不同日期的训练数据，按照训练得到多个预测模块。规则转换子模块37从每一个预测模块中转换得到一个包括多个规则的规则集；这里所述的每个规则对应前述多个场景的组合，例如：用户最近15天只下过自营订单(此为场景1)；用户最近7天曾打电话进行pop咨询，并且此咨询到目前为止并未被解决(此为场景2)；那么这里抽取的一个规则为：如果用户最近15天只下过一个自营订单(此为场景1)，且最近7天发生过用户打电话进行pop咨询、并且此咨询到目前为止并未被解决的事件(此为场景2)；那么，此用户现在打电话咨询则预测咨询问题类型为pop。

规则抽取子模块3从所述多个规则集中抽取出符合相似度要求的规则，然后将抽取到的规则发送给所述特征转换子模块32，由所述特征转换子模块32转换成算法特征。预测模块生成子模块36反复应用该算法特征、特征值和训练样本，直到得到稳定预测模块。

通过以上的数据处理方法和装置，最终可以输出多维、具有递进关系的预测结果。如果所述预测结果对应于用户问题类型，在所述预测结果中，一维预测结果对应的用户问题类型具体为自营或pop；二维预测结果对应的用户问题类型为：售前或售中或售后；三维预测结果对应的用户问题类型为：一级品类或二级品类或三级品类；其中，递进关系为：当一维预测结果具体为自营时，具有二维预测结果，当二维预测结果为售后时，具有三维预测结果。

为了确保采用上述方法进行预测的准确性，需要按时更新进行预测时所用的数据，具体地，定期(如一天)采用用户最新的行为数据更新本数据处理装置中的数据，按照特定要求进行指标计算，得到各个算法特征值。所述的特定要求为指依据不同的规则，使用相应的指标得到该算法特征值。

基于上述方法和装置，本发明提供了一种基于大数据的语音呼叫分流方法，如图8所示，和一种基于大数据的语音呼叫分流系统，如图9所示。其中，所述系统包括：cti电话系统b1，用于接收用户b的电话语音呼入信息，并解析出对应的用户电话号码，将该用户b接入到crm系统b5，并接通相应的坐席b6；帐号匹配模块b2，与所述cti电话系统b1连接，根据解析出的用户电话号码，按照匹配逻辑获得匹配的用户帐号；如前面所述的数据处理装置b3，用于根据所述用户帐号测预出相应的用户问题类型；和ivr系统b4，用于根据用户问题类型提供第一或第二导航模式。

具体的流程如下：

步骤sb1，根据用户的语音呼叫信息，获得用户电话号码；

步骤sb2，根据所述用户电话号码按照预定匹配逻辑获得匹配的用户帐号；

步骤sb3，根据所述匹配的用户帐号，由前述的数据处理装置b3，按照前述的方法，预测与当前语音呼叫对应的用户问题类型。例如，所述预测模块根据所述用户帐号采集该用户历史行为数据，根据用户历史行为数据，对用户指标进行分布式汇总计算和分析，根据不同场景计算出不同的算法特征值。例如：用户最近15天只下过自营订单，则第一个特征对应的数值为1；客户最近7天曾打电话进行pop咨询，并且此咨询到目前为止并未被解决，则第二个特征对应的数值为0。然后把特征值带入算法中进行预测。其中，这里所述的算法可以认为是一个对应的规则集。其中一条规则就是：第一个特征为1，第二个特征为0，那么对此用户的最终预测结果为0。因而得到对用户此次语音呼叫所对应的咨询问题的类型为pop。

步骤sb4，根据所述用户问题类型，判断是否需要ivr系统的导航，如果不需要，则在步骤sb6,直接将语音呼叫转入相应的坐席b6；如果需要，则在步骤sb5,由ivr系统b4按照第一导航模式引导用户，将语音呼叫转入相应的坐席b6。

其中，所述预定匹配逻辑具体包括：判断与所述用户电话号码对应的帐号的个数，如是只有一个，则所述的帐号为匹配的用户帐号。

如果与所述用户电话号码对应的帐号为0个，则匹配为空，由ivr系统b4按照第二导航模式引导用户，将语音呼叫转入相应的坐席b6。

如果与所述用户电话号码对应的帐号为多个，且有绑定帐号，则所述的绑定帐号为匹配的用户帐号；如果与所述用户电话号码对应的帐号为多个，且没有绑定帐号，则匹配为空，由ivr系统按照第二导航模式引导用户，将语音呼叫转入相应的坐席b6。

如果预测得到的所述用户问题类型为一维预测结果中pop时，不需要导航，但是如果预测得到的所述用户问题类型为一维预测结果中自营时，需要ivr系统b4采用第一导航模式，所述ivr系统b4的第一导航模式语音提示用户选择二维预测结果中的售前或售中或售后，如果用户选择了售前或售中，则会将用户的语音呼叫接入相应的坐席。如果用户选择了售后，则ivr系统的第一导航模式语音提示用户选择与三维预测结果对应的一级品类或二级品类或三级品类。

当坐席客服人员接通用户呼叫后，坐席的crm系统弹屏，由客服人员处理本次用户呼叫。在此过程中，客服人员记录下本次预测结果的匹配度和正确率等信息，以便系统不断对预测模块进行优化。

依照本发明的实施例如上文所述，这些实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施例。显然，根据以上描述，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明的保护范围应当以本发明权利要求所界定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵志雄
技术所有人：北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。