互动应答系统接入用户的方法和装置与流程

文档序号：11524459阅读：155来源：国知局

本申请涉及数据处理技术领域，尤其涉及一种互动应答系统接入用户的方法和装置。

背景技术：

随着互联网的发展，基于人工智能技术的自助服务在企业客户服务领域的应用越来越广泛。自助服务可以7×24小时在线，可以更加快速和标准化的响应用户的问题，以语音对话或文字聊天的形式与用户进行沟通，将人工客服从大量重复性问答中解放出来。

现有技术中，按照所服务的应用系统的业务特点，ivr(interactivevoiceresponse，交互式语音应答)系统包括多个自助交互服务业务场景入口，每个自助交互服务业务场景入口通常代表一个业务分支，在访问ivr系统的用户进入某个自助交互服务业务场景入口后，ivr系统会通过与用户的交互问答来逐步明确用户的问题所在，并解答用户的疑难。

ivr系统借助于用户的首次输入信息来决定将用户分流到哪个自助交互服务业务场景入口。具体而言，当用户访问ivr系统时，ivr系统通常会播放欢迎语，并提示用户输入需要怎样的帮助，然后等待用户的首次输入。在得到用户的首次输入信息后，将用户的首次输入信息应用于匹配模型(一种机器学习模型)，根据匹配模型的输出决定该用户进入的自助交互服务业务场景入口。但是，如果用户没有进行语音输入，或者用户的首次输入信息没有与业务相关的内容，匹配模型无法就进入哪个自助交互服务业务场景入口给出有效建议。这种情况下，只能将用户分流到人工服务的入口，增加了人工客服的工作量，降低了用户获得服务的效率。

技术实现要素：

有鉴于此，本申请提供一种互动应答系统接入用户的方法，所述互动应答系统包括至少两个自助交互服务业务场景入口，所述方法包括：

当来访用户的首次输入信息满足预定无效条件时，获取来访用户的识别因子值；所述识别因子包括若干个用来描述用户历史行为、和/或当前状态的参量；

将来访用户的识别因子值输入识别模型，得到来访用户具有最大概率的类别评估值；所述识别模型以样本中用户的所有识别因子作为输入，以样本中用户进入的自助交互服务业务场景入口作为目标类别进行训练得到；

当所述类别评估值的概率值满足预定自助条件时，将来访用户分流至所述类别评估值对应的自助交互服务业务场景入口。

本申请还提供了一种互动应答系统接入用户的装置，所述互动应答系统包括至少两个自助交互服务业务场景入口，所述装置包括：

识别因子值获取单元，用于当来访用户的首次输入信息满足预定无效条件时，获取来访用户的识别因子值；所述识别因子包括若干个用来描述用户历史行为、和/或当前状态的参量；

类别评估单元，用于将来访用户的识别因子值输入识别模型，得到来访用户具有最大概率的类别评估值；所述识别模型以样本中用户的所有识别因子作为输入，以样本中用户进入的自助交互服务业务场景入口作为目标类别进行训练得到；

交互服务分流单元，用于当所述类别评估值的概率值满足预定自助条件时，将来访用户分流至所述类别评估值对应的自助交互服务业务场景入口。

由以上技术方案可见，本申请的实施例中，采用与用户输入信息无关的识别因子和用户进入的自助交互服务业务场景入口来训练识别模型，当来访用户的首次输入信息满足预定无效条件时，根据来访用户的识别因子值、利用识别模型来决定将用户分流到哪个自助交互服务业务场景入口，从而减少了分流到人工客服的用户数量，在减轻人工客服工作量的同时，提高了用户获得服务的效率。

附图说明

图1是本申请实施例中一种互动应答系统接入用户的方法的流程图；

图2是本申请应用示例中互动应答系统接入来访用户的处理流程图；

图3是本申请实施例运行的设备的一种硬件结构图；

图4是本申请实施例中一种互动应答系统接入用户的装置的逻辑结构图。

具体实施方式

对包括多个自助交互服务业务场景入口的互动应答系统而言，通常能够了解来访用户的基本意图，即可将其分流至对应的自助交互服务业务场景入口。除来访用户的首次输入信息外，在互动应答系统服务的业务系统中，还有其他无需用户输入即可获得的信息能够为确定用户的来访意图提供帮助。例如，用户通常会在碰到问题或者疑难之后才会访问互动应答系统，而用户碰到的问题或者疑难则往往会与用户最近的业务操作、用户账户出现的情况、或者即将需要用户处理的事项等因素有关。

因此，本申请的实施例提出一种新的互动应答系统接入用户的方法，在与用户输入信息无关、用户的各种可知信息中选择与其访问互动应答系统的意图有一定程度关联的信息作为识别因子，来生成目标类别为各个自助服务入口的识别模型；当来访用户未能提供可用来判断其意图的首次输入信息时，采用识别模型具有最大概率的类别评估值来将用户分流到对应的自助交互服务业务场景入口，从而减少因首次输入信息无效被分流到人工客服的用户数量，以解决现有技术中存在的问题。

本申请的实施例应用在提供客户服务的互动应答系统中，该互动应答系统的可以是采用文字应答系统，也可以是语音应答系统，还可以是其他形式互动的系统，本申请的实施例不做限定。本申请的实施例可以运行在任何具有计算和存储功能的设备上，例如，移动终端、pc(personalcomputer，个人电脑)、笔记本、服务器等设备。

如前所述，在互动应答系统服务的业务系统中，记录有用户的各种信息，这些信息常常与用户对互动应答系统的访问目的有着不同程度的关联，可以选择这些信息中能够反映用户访问意图的参量作为识别因子，来构建识别模型。

具体而言，可以将用来描述用户历史行为、和/或当前状态的若干个参量作为识别因子。用户的历史行为可以包括用户在业务系统中已经进行的操作，可以包括用户已使用的客户服务(即用户对本互动应答系统的访问及操作、或者对其他客户服务系统的访问及操作)，还可以包括用户在其他与业务相关的系统中已经进行的操作。用户的当前状态可以包括业务系统中用户账户的当前状态。也就是说，识别因子中可以包括以下三种参量中的一种到多种：若干个用来描述用户已进行操作的参量、若干个用来描述用户已使用的客户服务的参量、以及若干个用来描述用户账户状态的参量。

此外，还可以将一些与业务特征相关联的参量作为识别因子，这些参量通常与用户无关，但是由互动应答系统服务的业务系统的具体业务流程决定了这些参量的值会影响用户的行为。

以服务于第三方支付业务系统的互动应答系统为例，可以采用这些参量来描述用户已进行的操作：“最近24小时是否有创建提现记录”、“最近一笔缴费的支付时间”、“最近一笔转账到卡的操作时间”、“最近一笔转账到卡的收款渠道”、“当天提现次数”等等；可以采用这些参量来描述用户已使用的客户服务：“2小时内ivr来电次数”，“72小时内用户是否通过自助渠道提问”等等；可以采用这些参量来描述用户账户的当前状态：“是否存在身份证冒用”、“会员等级”、“注册时间”、“认证级别”、“是否投资用户”等等；还可以将这些与支付平台还款时间相关的参量作为识别因子：“当日是星期几”、“当日是几号”等。

从上述例子可见，在一些应用场景中，有的识别因子的可能取值是固定的几个值，如识别因子“最近24小时是否有创建提现记录”的可能取值为“是”(假设以1表示)和“否”(假设以0表示)；再如识别因子“会员等级”的可能取值为固定的几个会员等级(可以对应于不同的几个预定数值)。而有的识别因子的可能取值则可能是连续型数据，如识别因子“注册时间”的可能取值是有最大值的一个连续区间。当这些识别因子用于同一个识别模型时，取值的差异可能会影响识别模型的准确程度。

在这些应用场景中，可以将可能取值为连续区间的识别因子的值离散化，如将其取值区间划分为两个或两个以上的子区间，每个子区间对应于一个预定的离散性数据；另外，还可以将可能取值虽然为离散型数据，但是可能取值的个数太多的识别因子的值也按照划分取值区间的方式对应于少数几个预定的离散性数据；从而使得所有识别因子的值域范围都是预定的两个或两个以上的离散型数据，以加快识别模型的训练和提高识别模型的准确度。

本申请的实施例中，识别模型以用户的所有识别因子值为输入，以每个自助交互服务业务场景入口作为目标类别，识别模型的输出为每个目标类别(即每个自助交互服务业务场景入口)的概率值。可以将曾经访问互动应答系统、并且确认被分流到正确的自助交互服务业务场景入口的用户当时的识别因子值、以及该用户进入的自助交互服务业务场景入口作为训练识别模型的一个样本数据，用一定数量的样本来对识别模型进行训练。换言之，识别模型以样本中用户的所有识别因子作为输入，以样本中用户进入的自助交互服务业务场景入口作为目标类别进行训练后得到。在识别模型训练完成后，将来访用户的识别因子值输入到识别模型中，即可得到每个自助交互服务业务场景入口的概率值。

各种分类机器学习算法都可以用来作为识别模型所采用的算法，本申请的实施例不做限定。作为例子，以下给出采用dnn(deepneuralnetwork，深度神经网络)算法的一种识别模型。

设共有m个识别因子ai(i∈[1,m])，t个自助交互服务业务场景入口pj(j∈[1,t])，m个识别因子在dnn模型中各自的权重分别为xi(i∈[1,m])。设dnn识别模型的样本数量为n，每个样本数据中包括m个确定的识别因子值ai,k(i∈[1,m],k∈[1,n])和一个确定的自助交互服务业务场景入口pk∈pj(k∈[1,n],j∈[1,t])。在模型训练中采用式1所示的计算过程，可以得到m个权重xi(i∈[1,m])：

在dnn识别模型训练完成后，可以将来访用户的m个识别因子值输入到dnn识别模型，得到每个pj(j∈[1,t])的概率值。

本申请的实施例中，互动应答系统接入用户的方法的流程如图1所示，该方法应用于包括至少两个自助交互服务业务场景入口的互动应答系统中。

步骤110，当来访用户的首次输入信息满足预定无效条件时，获取来访用户的识别因子值。

预定无效条件用来区分是根据来访用户的首次输入信息，还是根据来访用户的识别因子值来判断来访用户的访问意图。当来访用户的首次输入信息不满足预定无效条件时，互动应答系统按照现有技术中流程对首次输入信息进行处理，即将首次输入信息输入匹配模型，以确定将该来访用户分流的自助交互服务业务场景入口或人工服务；如果从匹配模型输出的某个自助交互服务业务场景入口具有最高的匹配度并且匹配程度足够高，则将该来访用户分流到该自助交互服务业务场景入口，否则将该来访用户分流到人工服务。

当来访用户的首次输入信息不满足预定无效条件时，互动应答系统获取该来访用户的识别因子值。互动应答系统可以从本系统、业务系统和其他存储有用户信息的服务系统查询来访与用户的所有识别因子有关的当前信息，并从这些信息中计算出每个识别因子的值。对需要进行离散数值处理的识别因子，计算过程也包括将该识别因子的原始值转换为预定的若干个离散型数据。本申请的实施例对识别因子值的来源、计算方式均不做限定。

可以根据实际应用场景中用户访问互动应答系统时的行为特征、确定自助交互服务业务场景入口所需的业务信息量等因素来确定预定无效条件，例如，可以将满足一个到多个如下条件的首次输入信息作为无效信息：

来访用户在预定等待时间内未进行首次输入：当来访用户没有给出首次输入信息或来访用户的首次输入信息为空时，由来访用户的识别因子来判断用户的意图；

来访用户的首次输入信息的长度未达到预定字数下限：来访用户的首次输入信息过短，包含的信息量太小时，很难根据首次输入信息判断来访用户的意图；预定字数下限可以根据互动应答系统所服务业务系统的业务特点来确定，例如，4个中文字符。

来访用户的首次输入信息中不包含预定的业务词汇：可以预设一个业务词汇表，其中包含采用匹配模型判定用户意图所需的各种业务词汇，当来访用户的首次输入信息中不包含词汇表里的预定业务词汇时，即认为无法采用匹配模型来判定用户的意图。

步骤120，将来访用户的识别因子值输入识别模型，得到来访用户具有最大概率的类别评估值。

在得到来访用户所有识别因子的值后，互动应答系统将这些值输入到训练完成的识别模型中，识别模型的输出为各个自助交互服务业务场景入口的概率值。互动应答系统将具有最大概率值的自助交互服务业务场景入口作为类别评估值。

步骤130，当类别评估值的概率值满足预定自助条件时，将来访用户分流至该类别评估值对应的自助交互服务业务场景入口。

预定自助条件可以根据实际应用场景中人工服务的坐席忙碌程度、对用户满意程度的要求等因素来确定。例如，预定自助条件可以是所得的类别评估值的概率值高于某个既定阈值，也可以是所得的类别评估值的概率高于一个阈值并且与其他自助交互服务业务场景入口概率值的差值大于另一个阈值，本申请的实施例不做限定。

如果类别评估值的概率值满足预定自助条件，互动应答系统将来访用户分流至该类别评估值对应的(或者说是代表的)自助交互服务业务场景入口；当类别评估值的概率值不满足预定自助条件时，互动应答系统将来访用户分流至人工服务。

在一些应用场景中，互动应答系统所服务的业务系统的业务细节、业务流程等可能发生一些变化，用户访问互动应答系统的意图也往往会随之有所变化。在这种情况下，可以以一定的周期更新识别模型的样本，并用更新后的样本重新训练识别模型。对样本的更新可以是重新筛选和组织识别模型的样本；也可以是对现有的样本数据进行样本数据的添加和/或删除，包括删除已经不再适应于识别模型的样本数据，和/或将新近对用户意图判断正确的用户数据添加得到样本中。例如，将原样本中样本数据的识别因子值输入识别模型，如果识别模型输出的具有最大概率的类别评估值不同于样本数据中用户进入的自助交互服务业务场景入口，则认为该样本数据不再适用于识别模型，删除该样本数据；再如，可以将上一周期中被确认为进入正确自助交互服务业务场景入口的用户数据，作为新的样本数据添加到样本中。这样，识别模型将不断适应业务系统、用户以及互动应答系统的变化，保持对用户意图辨别的准确度。

可见，本申请的实施例中，在与用户输入信息无关、用户的各种可知信息中选择与其访问互动应答系统的意图有一定程度关联的信息作为识别因子，采用识别因子和用户进入的自助交互服务业务场景入口来训练识别模型，当来访用户未能提供可用来判断其意图的首次输入信息时，采用识别模型来决定将用户分流到哪个自助交互服务业务场景入口，从而减少因首次输入信息无效被分流到人工客服的用户数量，在减轻人工客服工作量的同时，提高了用户获得服务的效率。

在本申请的一个应用示例中，服务于第三方支付平台的ivr系统包括数个自助交互服务业务场景入口，在用户进入某一个自助交互服务业务场景入口后，ivr系统通过与用户的语音交互，确认用户访问ivr系统的问题所在，并给出针对性的答案。ivr系统维护有业务词汇表，其中包括采用匹配模型判定用户意图所需的所有业务词汇。

本应用示例中，ivr系统使用两个机器学习模型来进行用户的接入。一个是匹配模型，其输入为用户的首次输入信息，输出为各个自助交互服务业务场景入口的概率值，匹配模型的构建和训练可参照现有技术实现。另一个模型是识别模型，其输入为用户的识别因子，输出为各个自助交互服务业务场景入口的概率值。

识别模型采用的识别因子包括：若干个描述用户近期已进行操作的参量(如“最近一笔缴费的支付时间”等)、若干个描述用户近期已使用的客户服务的参量(如“2小时内ivr来电次数”等)、若干个描述用户账户的当前状态的参量(如“会员等级”、“注册时间”等)、以及若干个与业务特征相关联的参量(如“当日是否还款日”等)。所有识别因子的取值范围均为预定的数个离散型数据。

识别模型采用dnn算法构建。通过历史记录分析，得到批量的历史用户数据，以访问ivr系统时用户的识别因子值以及被证明正确的自助交互服务业务场景入口作为样本数据，按照式1来对识别模型进行训练。训练完成后，即可确定dnn算法中每个识别因子的权重。

本应用示例中，ivr系统采用图2所示的流程来进行来访用户的接入。

步骤201，在接到来访用户的语音呼叫后，ivr系统提示来访用户描述自己遇到的问题。

步骤202，ivr系统接收来访用户的首次语音输入。

步骤203，判断来访用户在预定时间内是否有语音输入，如果有，执行步骤204；如果没有，转步骤206。

步骤204，将来访用户的语音输入通过语音识别转换为文字，判断来访用户的首次输入是否为无效输入，如果首次输入信息不足4个字、并且不包含业务词汇表中的业务词汇的话，则首次输入为无效输入，转步骤206；否则执行步骤205。

步骤205，将来访用户的首次输入信息输入匹配模型，根据匹配模型的输出将来访用户分流至某个自助交互服务业务场景入口或人工服务。接入流程结束。

步骤206，ivr系统获取来访用户的所有识别因子值。

步骤207，ivr系统将来访用户的识别因子值输入到识别模型中，得到各个自助交互服务业务场景入口的概率值，以具有最大概率值的自助交互服务业务场景入口作为类别评估值。

步骤208，判断类别评估值是否高于既定阈值，如果高于，则执行步骤209；否则转步骤210。

步骤209，将来访用户按照类别评估值分流到对应的自助交互服务业务场景入口，来访用户进入交互确认环节，接入流程结束。

步骤210，将来访用户转人工服务。

对一个服务与第三方支付平台、实际运行的ivr系统的统计表明，近50％的来访用户的首次输入属于无输入或无效输入，在现有技术中这些用户将全部进入人工服务。在对应用本申请实施例的ivr系统进行的模拟运行中，这些来访用户确认进入正确的自助交互服务业务场景入口的比例是35％，也就是说，在应用本申请实施例后，有17.5％的来访用户由识别模型处理后进入自助交互服务渠道，极大的降低了进入人工服务的用户数量。

与上述流程实现对应，本申请的实施例还提供了一种互动应答系统接入用户的装置。该装置可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为逻辑意义上的装置，是通过所在设备的cpu(centralprocessunit，中央处理器)将对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言，除了图3所示的cpu、内存以及非易失性存储器之外，互动应答系统接入用户的装置所在的设备通常还包括用于进行无线信号收发的芯片等其他硬件，和/或用于实现网络通信功能的板卡等其他硬件。

图4所示为本申请实施例提供的一种互动应答系统接入用户的装置，所述互动应答系统包括至少两个自助交互服务业务场景入口，所述装置包括识别因子值获取单元、类别评估单元和交互服务分流单元，其中：识别因子值获取单元用于当来访用户的首次输入信息满足预定无效条件时，获取来访用户的识别因子值；所述识别因子包括若干个用来描述用户历史行为、和/或当前状态的参量；类别评估单元用于将来访用户的识别因子值输入识别模型，得到来访用户具有最大概率的类别评估值；所述识别模型以样本中用户的所有识别因子作为输入，以样本中用户进入的自助交互服务业务场景入口作为目标类别进行训练得到；交互服务分流单元用于当所述类别评估值的概率值满足预定自助条件时，将来访用户分流至所述类别评估值对应的自助交互服务业务场景入口。

一个例子中，所述若干个用来描述用户历史行为、和或当前状态/的参量包括以下的一种到多种：若干个用来描述用户已进行操作的参量、若干个用来描述用户已使用的客户服务的参量、以及若干个用来描述用户账户状态的参量。

上述例子中，所述识别因子还可以包括：若干个与业务特征相关联的参量。

可选的，所述识别因子的值域范围为预定的两个或两个以上离散型数据。

可选的，所述识别模型采用深度神经网络dnn算法。

可选的，所述预定无效条件包括：来访用户在预定等待时间内未进行首次输入、来访用户首次输入信息的长度未达到预定字数下限、或来访用户的首次输入信息中不包含预定的业务词汇。

可选的，所述预定自助条件包括：所述类别评估值的概率值高于既定阈值。

一种实现方式中，所述装置还包括模型重新训练单元，用于以预定周期更新识别模型的样本，并用更新后的样本重新训练识别模型。

上述实现方式中，所述模型重新训练单元以预定周期更新识别模型的样本，包括：将原样本中样本数据的识别因子值输入识别模型，如果识别模型输出的具有最大概率的类别评估值不同于样本数据中用户进入的自助交互服务业务场景入口，则删除所述样本数据；和/或；将上一周期中被确认为进入正确自助交互服务业务场景入口的用户数据添加到样本中。

可选的，所述装置还包括匹配模型输入单元和人工服务分流单元，其中：匹配模型输入单元用于当来访用户的首次输入信息不满足预定无效条件时，将所述首次输入信息输入匹配模型以确定将所述来访用户分流的自助交互服务业务场景入口或人工服务；人工服务分流单元用于当所述类别评估值的概率值不满足预定自助条件时，将来访用户分流至人工服务。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张懿;周韫文;毛佩瑶;赖晓虎;董泽伟
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种基于IOS系统的通讯系统的制造方法与工艺
上一篇：通话过程中的定位方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。