一种电话录音未接通原因识别方法与流程

文档序号：17473031发布日期：2019-04-20 05:56阅读：1747来源：国知局

本发明属于语音处理领域，涉及音频指纹识别领域和电话外呼业务，具体涉及一种电话未接通原因识别方法。

背景技术：

主动电话外呼是电信行业中一类重要的增值服务业务，承载着诸如公共信息推送，业务推广，客户沟通与服务跟进等诸多重要的服务内容。

在主动电话外呼业务中，客户码号是最重要的业务资源，业务的效益会显著地受到码号资源利用率的制约，特别是对于未能呼叫成功的号码，其处理策略更是直接影响到业务的运营水平。例如：如果对未接通呼叫的码号采取简单的放弃策略，一方面会浪费宝贵的码号资源，另一方面，对于一些关键性的外呼业务（如客户沟通、投诉反馈与服务跟进），更可能导致重大的沟通失误甚至业务事故；与之相对，如果对未接通号码粗暴地采取反复呼叫的策略，则不但会导致宝贵的线路资源被无效地重复占用，更会带来负面的用户体验，甚至进一步导致用户的拒绝、抵制甚至投诉。因此，对于未接通的呼叫分析失败原因，根据原因采取不同的处理策略，是外呼行业的一个基本需求，而获得呼叫的未接通原因，则是实现这个需求的基础。

获取未接通最直接的方式是在线进行电话信令分析，即在呼叫过程中跟踪表示呼叫状态的信令，并根据电话未接通情况下由接入电信网关返回的状态信令来判断未接通原因，这种方式准确率高，基本不需要额外的软硬件资源，在组网复杂度不高，组网交换设备设置比较单一的情况下有着较好的效果。然而，由于当前电信行业的业务千差万别，组网方式多种多样，同时还需要往往兼顾多种业务需求。在这种情况下，呼叫中心的组网环境往往异常复杂，组网信令协议也会有不同程度的扩充和变更，导致呼叫方在很多情况下无法稳定准确地获得呼叫中的信令，而只能在媒体交换中获取以音频方式提供的未接通提示音。在这种情况下，基于未接通提示音判别未接通原因成为唯一的选择。

在传统的规模较小的呼叫中心，外呼的操作都是通过呼叫中心坐席人员完成，在操作的同时，坐席人员可以听辩电话中的回铃音、忙音以及语音提示，据此对未接通原因进行直接标注。然而，对于较大规模的呼叫中心，为了更有效地实现管理，通常会采用将呼叫和服务切分的呼叫策略，即由外呼平台统一拨号，待电话接通后再将电话转接给空闲的坐席人员，在这种情况下，未接通的电话不会传递给坐席人员，因而只能由专门的工作人员通过听辨离线录音的方式标注未接通原因，造成人力的极大浪费。更重要的是，随着人工智能水平的不断进步，目前已出现了由计算机代替人工的智能外呼系统，通过计算机系统自动对未接通电话进行未接通原因分类，可以极大节省人力消耗，降低呼叫中心运营成本，提高呼叫中心的工作效率。

在我国大陆地区，在电话未接通的情况下，交换机返回的电话提示音通常分为以下两种情况：一种是在国标gb3380-82标准中定义的单频电话自动交换网信号音，另一种则是由运营商指定的语音播报录音，如“您拨叫的电话正忙”，“您拨打的电话不在服务区”等。此外，在更多的情况则是两种提示音的混合，比如响铃音后语音提示。对于符合国标的单频交换网信号音，可以通过简单的频谱分析方法进行识别，对于后者，最常见的手段是通过人工标注，也就是由人工根据录音中的忙音，响铃音和语音提示，对未接通原因加以标注。由于这种方法需要人工聆听完整的未接通电话录音，而且每人同一时间内只能处理一通电话，因此效率极低。当呼叫中心业务扩张和通信量增长到一定规模时，这种人工的方式会严重降低业务运行的效率和可靠性。在这种情况下，通过计算机系统高效处理未接通录音音频，并检测未接通原因成为必然的选择。以此为契机，基于人工智能技术的外呼未接通原因检测成为一项有着重要应用价值的技术。

技术实现要素：

为提供准确的电话未接通原因，本发明提供了一种针对未接通电话原因分析的数据库构建方法，包括如下步骤：

获取一定数量的未接通电话录音；

对未接通电话录音进行未接通原因标注，得到未接通电话录音-未接通原因标注数据库；

从未接通电话录音中提取音频指纹特征序列，并以对应的未接通原因作为键值，得到未接通电话录音-音频指纹特征数据库。

如上所述的一种针对未接通电话原因分析的数据库构建方法，其中：对未接通电话录音进行语音识别得到文本信息，再对文本信息进行未接通原因文本分类建模，得到未接通提示音文本分类模型并存入数据库。

如上所述的一种针对未接通电话原因分析的数据库构建方法，其中：根据在线信令或语音内容标注未接通原因。

如上所述的一种针对未接通电话原因分析的数据库构建方法，其中：所述音频指纹特征序列以定长的时频域差分符号编码作为单帧语音信号的音频指纹。

如上所述的一种针对未接通电话原因分析的数据库构建方法，其中：对于单个录音文件，以各帧音频指纹联合各帧时间信息构成整个录音文件的指纹特征序列。

如上所述的一种针对未接通电话原因分析的数据库构建方法，其中：所述数据库基于哈希表索引结构，所述哈希表索引结构的索引键值为音频指纹特征，所述哈希表索引结构的被索引单元内容为键值所对应的音频帧信息，所述音频帧信息包括所在未接通录音的文本信息和对应音频帧在录音中的位置。

本发明还包括一种电话未接通原因识别方法，包括：

通过信令标注未接通原因；

若未能通过信令分类得到原因，则从待识别电话录音中提取音频指纹特征序列,并利用所述序列在音频指纹数据库中进行检索；如找到匹配的指纹，则根据指纹键值中的未接通原因标签，为待识别电话进行未接通原因标注；

若未能找到匹配的指纹，通过自动语音识别将音频内容识别为文本内容，基于所述文本内容利用文本分类方法，在未接通原因文档分类模型中进行分类，用分类得到的未接通原因分类结果标注所述待识别电话录音。

本发明还包括另一种电话未接通原因识别方法，包括：

对未接通电话录音逐帧提取音频指纹，得到待识别电话录音音频指纹序列;

对所述待识别电话录音音频指纹序列，在音频指纹数据库中进行单帧模糊检索，得到候选原始录音音频指纹特征的特征帧；

对所述候选原始录音音频指纹特征的特征帧进行整合,并与待识别电话录音音频指纹序列进行序列匹配，得到候选原始录音匹配序列集合;

将所述有序的候选原始录音匹配序列集合在未接通电话录音-未接通原因数据库中进行检索，选择出多个未接通原因候选；

对所述多个未接通原因候选进行筛选，得到最可能的电话未接通原因。

如上所述的一种电话未接通原因识别方法，其中：进行所述单帧模糊检索时，根据频带能量确定可能被干扰而出现失配的若干指纹位数，通过对位数组合取反生成一系列扩充候选指纹，联合原始指纹一起进行检索。

如上所述的一种电话未接通原因识别方法，其中：在进行所述音频指纹特征整合与序列匹配时，首先计算所述候选原始录音音频指纹特征的特征帧与待匹配电话录音的特征帧在各自序列中的相对位移，当在相同相对位移下的匹配数量在原始电话录音中的占比满足阈值要求时，将具有相同相对位移的特征帧整合为数据库中原始电话录音中的片段，即为候选原始录音匹配序列，并将所述匹配数量在原始电话录音中的占比作为所述候选原始录音匹配序列的匹配命中率得分。

如上所述的一种电话未接通原因识别方法，其中：对所述多个未接通原因候选进行筛选时，利用所述候选原始录音匹配序列的匹配命中率得分和各候选未接通原因的累积得分得到匹配得分，用所述匹配得分对候选未接通原因进行排序，如得分最高者高于预先设定的决策阈值，则选择为最终的未接通原因结果；所述累积得分是指将所述有序的候选原始录音匹配序列集合在数据库中进行检索时，对匹配上的部分的相似度评价。

如上所述的一种电话未接通原因识别方法，其中：所述决策阈值的设定方法为：通过一组独立于训练数据的测试数据，计算所述测试数据在音频指纹数据库中实际未接通原因和其他未接通原因的匹配得分分布，按照最优区分性原则计算阈值。

本发明还包括一种电话未接通原因识别方法，包括一种针对未接通电话原因分析的数据库构建步骤；以及基于所述数据库的对未接通电话录音的识别步骤。

如上所述的一种电话未接通原因识别方法，其中：还包括数据库更新方法，具体包括如下步骤：

用新增的未接通电话录音和未接通电话原因，来更新未接通电话录音-未接通原因标注数据库；

用新增的未接通电话录音及其音频指纹，来更新未接通电话录音-音频指纹特征数据库；

用新增的未接通电话录音及其文本信息，来更新未接通原因的文本分类模型；

用新增的未接通电话录音及其信令信息，来更新未接通原因的信令表；

所述新增的未接通电话录音指能够识别出未接通原因的未接通电话录音。

如上所述的一种电话未接通原因识别方法，其中：

若所述新增的未接通电话录音中存在未被匹配的片段，取出所述片段作为对应未接通原因的训练特征序列更新未接通电话录音-音频指纹特征数据库。

与现有方法相比，本发明具有以下优点:

本发明基于音频指纹技术建立未接通原因音频数据库，综合利用语音识别技术与音频指纹技术，采用初期少量人工标注生成初始判别模型和音频特征库，后期迭代更新模型的策略；一方面利用高效准确的音频指纹技术，对在音频特征库中匹配成功的未接通录音直接给出判决结果，另一方面利用语音识别关键词提取并结合人工矫正的方法，对未能匹配到的未接通提示音进行分类，并将分类后的音频加入音频特征库。通过这种方法，可在极少人工干预的条件下高效准确地实现外呼电话未接通原因的自动判别。

通过利用单帧模糊检索方法，可以将疑似或类似的音频从未接通原因音频数据库中筛选出来，在此基础上进行后续的整合和长序列的匹配，最大限度的减少漏检，提高系统的召回率。该方法将待测音频拆分为帧层次特征进行模糊匹配，无时序上先后的约束，具有并发操作性质，提高了系统检索速度，为实时音频检索提供技术基础。

通过利用整合与序列匹配方法，可以集成多层次的线索，从单帧匹配扩展到较长帧序列匹配。一方面可提高系统的容错性，对有噪音干扰或信道影响的音频也有较好的适配性；另一方面采用较小的标注单元可降低数据标注成本，增大系统的适用范围。

节省人工，降低运营成本：本系统在运营过程中只需人工进行极少量的听辩标注，并且可以24小时不间断进行处理。

快速高效：本方法采用语音识别与音频指纹相结合的自动判别技术，在单台普通配置的计算机上可以同时处理多通未接通电话，且每通电话的判别速度远远高于人工听辩的速度。

该方法可对录音文件进行离线识别，也可对流式电话语音进行识别，具有较高的通用性，可适用呼叫中心的不同应用场景。

附图说明

图1是本发明提供的一种针对未接通电话原因分析的数据库构建方法的一种实施例的流程图；

图2是本发明提供的一种针对未接通电话原因分析的数据库构建方法的另一种实施例的流程图；

图3是本发明提供的一种电话未接通原因识别方法的一种实施例的流程图；

图4是本发明提供的一种电话未接通原因识别方法的另一种实施例的流程图。

具体实施方式

下面结合实施例对本发明进行具体说明。

首先，对本发明相关的专业术语解释如下：

1、“音频指纹技术”

音频指纹技术（audiofingerprintingtechnology）是指通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来，用于识别海量的声音样本或跟踪定位样本在数据库中的位置。音频指纹作为内容自动识别技术的的核心算法，已广泛应用于音乐识别，版权内容监播，内容库去重和电视第二屏互动等领域。

音频指纹技术通过提取声音中的数据特征将需要被识别的内容与建立的音频指纹数据库进行比对完成的。识别过程不受音频本身的储存格式，编码方式，码率和压缩技术影响。音频指纹的匹配是高度精确的匹配，不依赖于文件meta信息，加水印和文件哈希值。音频指纹特征的具体实现包括多种方法，例如：哈希方法、复倒谱、小波分析等。

2、“自动语音识别”：

近几年来，特别是2009年以来，借助机器学习领域深度学习研究的发展，以及大数据语料的积累，语音识别技术得到突飞猛进的发展。一方面，随着机器学习领域深度学习研究被引入到语音识别声学模型训练，使声学模型的准确率得到了大幅度的提高，成为近20年来语音识别技术方面最快的进步。

另一方面，目前大多主流的语音识别解码器已经采用基于有限状态机（wfst）的解码网络，该解码网络可以把语言模型、词典和声学共享音字集统一集成为一个大的解码网络，大大提高了解码的速度，为语音识别的实时应用提供了基础。

此外，随着互联网的快速发展，以及手机等移动终端的普及应用，目前可以从多个渠道获取大量文本或语音方面的语料，这为语音识别中的语言模型和声学模型的训练提供了丰富的资源，使得构建通用大规模语言模型和声学模型成为可能。

3、文本分类技术

文本分类问题的定义是根据一篇文档的内容，从预定义的类别标号里选择相应的类别。中文文本分类的基本步骤是中文分词、特征提取、训练模型、预测类别等步骤，基于统计的文本分类一般都需要有比较好的标注好的语料作为训练集，训练出模型，利用模型对未分类的文本进行分类。常用的统计学特征，主要有卡方统计、信息增益、互信息、几率比、交叉熵等方法。

图1为本发明提供的一种针对未接通电话原因分析的数据库构建方法，包括如下步骤：

步骤s11：获取一定数量的未接通电话录音；

步骤s12：对未接通电话录音进行未接通原因标注，得到未接通电话录音-未接通原因标注数据库。标注时，可由电话接入平台通过信令判别未接通电话的原因，也可根据未接通提示音（例如,“已关机”、“线路忙”等内容）判别未接通电话的原因。

步骤s13:从未接通电话录音中提取音频指纹特征序列，并以对应的未接通原因作为键值，得到未接通电话录音-音频指纹特征数据库。

未接通电话录音可以包括未接通提示音以及振铃音、彩铃等信息，为获得更优的效果，可以去除彩铃等信息，只保留未接通提示音作为未接通电话录音。

其中，音频指纹特征序列可以以定长的时频域差分符号编码作为单帧语音信号的音频指纹。

对于单个录音文件，还可以以各帧音频指纹联合各帧时间信息构成整个录音文件的指纹特征序列。

更优的，如图2所示，还可以进行步骤s24：对未接通电话或未接通提示音进行语音识别得到对应的文本信息，将文本信息存入数据库。还可利用电话录音对应的未接听原因对文本信息进行文本分类。文本分类时，基于识别文本为每一类未接通原因提取文本分类特征，形成未接通提示音文本分类模型。

更优的，将数据库基于哈希表索引结构建立。哈希表索引结构的索引键值为音频指纹特征，被索引单元内容为键值所对应的音频帧信息；其中音频帧信息包括所在未接通录音的文本信息和对应音频帧在录音中的位置。

如图3所示，一种电话未接通原因识别方法，具体包括如下步骤：

步骤s31：对于待识别的未接通电话录音，通过信令标注未接通原因；

步骤s32：对于未能通过信令分类的待识别的未接通电话录音，从待识别的未接通电话录音中提取音频指纹特征序列,在音频指纹数据库中进行检索；如找到匹配的指纹，则根据指纹键值中的未接通原因标签，为待识别的未接通电话录音进行未接通原因标注；

步骤s33:如未找到匹配的指纹，通过自动语音识别将音频内容识别为文本内容，基于该文本内容利用文本分类方法，在未接通原因文档分类模型中进行分类，用分类得到的未接通原因分类结果标注该待识别的未接通电话录音。

文本分类方法可以是贝叶斯方法、决策树方法、神经网络方法等。若电话录音的文本篇幅较短，则采用朴素贝叶斯分类方法即可取得较好的效果。

图3中还给出了一种针对未接通电话原因分析的数据库更新方法，具体包括如下步骤：

步骤s34：用新增的未接通电话录音和未接通电话原因，来更新未接通电话录音-未接通原因标注数据库；

步骤s35：用新增的未接通电话录音及其音频指纹，来更新未接通电话录音-音频指纹特征数据库；

步骤s36：用新增的未接通电话录音及其文本信息，来更新未接通原因的文本分类模型；

步骤s37:用新增的未接通电话录音及其信令信息，来更新未接通原因的信令表。

其中，新增的未接通电话录音指能够识别出未接通原因的未接通电话录音。

若新增的未接通电话录音中存在未被匹配的片段，取出该片段作为对应未接通原因的训练特征序列更新未接通电话录音-音频指纹特征数据库。

图4为一种电话未接通原因识别方法，具体包括如下步骤：

步骤s41:对未接通电话录音逐帧提取音频指纹，得到待识别电话录音音频指纹序列。

步骤s42:对生成的待识别电话录音音频指纹序列，逐帧在音频指纹数据库中进行检索，得到候选原始录音音频指纹特征的特征帧。

检索可以是模糊检索，例如根据频带能量确定可能被干扰而出现失配的若干指纹位数，通过对位数组合取反生成一系列扩充候选指纹，联合原始指纹一起进行检索，以降低因局部干扰造成的失配。

步骤s43：对得到的候选原始录音音频指纹特征的特征帧进行整合,并与待识别电话录音音频指纹序列进行序列匹配，得到候选原始录音匹配序列集合。

更优的，在进行所述音频指纹特征整合与序列匹配时，首先计算候选原始录音音频指纹特征的特征帧与待匹配电话录音的特征帧在各自序列中的相对位移，当在相同相对位移下的匹配数量在原始电话录音中的占比满足阈值要求时，将具有相同相对位移的特征帧整合为数据库中原始电话录音中的片段,即候选原始录音匹配序列，并将所述匹配数量在原始电话录音中的占比作为所述候选原始录音匹配序列的匹配命中率得分。

步骤s44：将得到的有序的候选原始录音匹配序列集合在未接通电话录音-未接通原因数据库中进行检索，选择出多个未接通原因候选。

步骤s45：对得到的多个未接通原因候选进行筛选，得到最可能的电话未接通原因。

对多个未接通原因候选进行筛选时，利用各个候选原始录音匹配序列的匹配命中率得分和各候选未接通原因的累积得分得到匹配得分，对候选未接通原因进行排序（可以用匹配命中率得分与累积得分相加、相乘、加权求和等方法得到用于排序的匹配得分），如得分最高者高于预先设定的决策阈值，则选择为最终的未接通原因结果。

其中，累积得分是指将所述有序的候选原始录音匹配序列集合在数据库中进行检索时，对能够匹配上的部分的相似度评价。

预先设定的决策阈值可以是经验值，也可以采用下述设定方法：通过一组独立于训练数据的测试数据，计算所述测试数据在音频指纹数据库中实际未接通原因和其他未接通原因的匹配得分分布，按照最优区分性原则计算阈值。

一种电话未接通原因识别方法，可以包括一种针对未接通电话原因分析的数据库构建步骤；以及基于该数据库的对未接通电话录音的识别步骤。

其中，数据库构建步骤，包括：获取一定数量的未接通电话录音；对未接通电话录音进行未接通原因标注，得到未接通电话录音-未接通原因标注数据库；从未接通电话录音中提取音频指纹特征序列，并以对应的未接通原因作为键值，得到未接通电话录音-音频指纹特征数据库；

其中，识别步骤，包括：通过信令标注未接通原因；若未能通过信令分类得到原因，则从电话录音中提取音频指纹特征序列,在音频指纹数据库中进行检索；如找到匹配的指纹，则根据指纹键值中的未接通原因标签，为电话进行未接通原因标注；若未能找到匹配的指纹，通过自动语音识别得到分词的识别内容文本，并利用文本分类方法，在未接通原因文档分类模型中进行检索，用检索得到的未接通原因分类标注所述电话录音。

此外，还包括对数据库的更新步骤。

本发明虽然以较佳实施例公开如上，但其并不是用来限定本发明，任何本领域技术人员在不脱离本发明的精神和范围内，都可以做出可能的变动和修改，因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴昊;庞在虎;朱风云;陈博
技术所有人：北京灵伴即时智能科技有限公司
我是此专利的发明人