外呼结果确定方法、装置及系统与流程

文档序号：12478814阅读：654来源：国知局

本发明涉及通信技术领域，具体而言，涉及一种外呼结果确定方法、装置及系统。

背景技术：

随着近年来呼叫中心的快速发展，外呼服务的重要性逐渐凸显出来。外呼服务是在主动服务、数据库营销的原则下，有计划、有针对性地与目标客户联系，从而通过自动外呼系统与客户建立良好的沟通。

外呼系统的呼出服务可大致分为三种类型：预览式外呼服务、预约式外呼服务及预测式外呼服务。其中预测式外呼服务通过系统自动化地选择要拨的号码，仅当电话被接通即客户应答时，才将呼叫迅速转给一个话务员；对于无效的呼叫：如忙音、无应答、机器接听等都将被跳过而不接通话务员，从而可为话务员节省大量的查号、拨号、等待振铃等时间、提高工作效率。因此预测式外呼服务已逐渐成为一种重要的外呼方式。但是对于外呼结果判断的准确性始终是制约预测式外呼服务发展的最重要因素。

目前针对外呼结果的判断有两种方式，一种是人工判断，如在预览式外呼中话务员根据运营商播放语音进行选择判断，这种方式虽然准确，但是会浪费大量人力成本和时间，不适用于预测式外呼服务；另一种是需要与不同地区的运营商及对应网关厂商配合进行协议分析，判断外呼结果，这种方式需要定制化的开发、更换网关设备或增强其他重复开发工作，并且联合调试的难度非常大。

在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

有鉴于此，本发明提供一种外呼结果确定方法、装置及系统，能够有效提升外呼结果判断的准确率。

本发明的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本发明的一方面，提供一种外呼结果确定方法，包括：获取外呼的语音数据；通过自动语音识别，对语音数据进行处理，以将语音数据转换为文本数据；以及将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。

根据本发明的一实施方式，将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果包括：从文本数据中提取关键词信息中的一个或多个关键词；以及根据一个或多个关键词与外呼结果映射表，确定外呼的外呼结果。

根据本发明的一实施方式，上述方法还包括：确定获取语音数据的时间。

根据本发明的一实施方式，确定提取语音通话的时间包括：从语音网关获取外呼的SIP协议数据包；解析SIP协议数据包，以获取外呼的通话ID及确定SIP协议数据包承载的消息的类型；以及当SIP协议数据包承载的消息的类型为响铃消息时，确定开始获取语音数据。

根据本发明的一实施方式，外呼通过通话ID被唯一标识。

根据本发明的一实施方式，语音数据被封装为RTP协议数据包。

根据本发明的一实施方式，上述方法还包括：将外呼的外呼结果存储到一存储装置中，以更新外呼的通话记录的外呼结果状态。

根据本发明的一实施方式，通过自动语音识别，对语音数据进行处理，以将语音数据转换为文本数据包括：对语音数据进行解码；对解码后的语音数据进行预处理；对预处理后的语音数据进行特征提取，以提取出语音数据的特征参数；以及基于已建立的声学模型、语音模型及字典，对特征参数进行语音解码和搜索，以将获取的语音数据转换为文本数据。

根据本发明的另一个方面，提供一种外呼结果确定装置，包括：语音获取模块，用于获取外呼的语音数据；语音识别模块，用于通过自动语音识别，对语音数据进行处理，以将语音数据转换为文本数据；以及结果确定模块，用于将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。

根据本发明的一实施方式，结果确定模块包括：关键词提取子模块，用于从文本数据中提取关键词信息中的一个或多个关键词；以及外呼结果匹配子模块，用于根据一个或多个关键词与外呼结果映射表，确定外呼的外呼结果。

根据本发明的一实施方式，上述装置还包括：时间确定模块，用于确定获取语音数据的时间。

根据本发明的一实施方式，时间确定模块包括：SIP包获取子模块，用于从语音网关获取外呼的SIP协议数据包；SIP包解析子模块，用于解析SIP协议数据包，以获取外呼的通话ID及确定SIP协议数据包承载的消息的类型；以及时间确定子模块，用于当SIP协议数据包承载的消息的类型为响铃消息时，确定开始获取语音数据。

根据本发明的一实施方式，外呼通过通话ID被唯一标识。

根据本发明的一实施方式，语音数据被封装为RTP协议数据包。

根据本发明的一实施方式，上述装置还包括：结果存储模块，用于将外呼的外呼结果存储到一存储装置中，以更新外呼的通话记录的外呼结果状态。

根据本发明的一实施方式，语音识别模块包括：语音解码子模块，用于对语音数据进行解码；预处理子模块，用于对解码后的语音数据进行预处理；特征提取子模块，用于对预处理后的语音数据进行特征提取，以提取出语音数据的特征参数；以及数据转换子模块，用于基于已建立的声学模型、语音模型及字典，对特征参数进行语音解码和搜索，以将获取的语音数据转换为文本数据。

根据本发明的再一个方面，提供一种外呼结果确定系统，包括：处理器；以及存储器，用于存储处理器的可执行指令；其中处理器配置为经由执行可执行指令来执行以下操作：获取外呼的语音数据；通过自动语音识别，对语音数据进行处理，以将语音数据转换为文本数据；以及将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。

根据本发明的本发明实施方式的外呼结果确定方法，对语音进行自动识别，转换为文本数据，并将文本与预设的关键词信息进行匹配，确定外呼结果，可有效提升外呼结果的判断准确率。并且该方法无需人工判断，极大地减少了人工判断的成本，提高了工作效率；此外，该方法也无需更换相应设备，开发和联调的难度与成本都很低。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本发明。

附图说明

通过参照附图详细描述其示例实施例，本发明的上述和其它目标、特征及优点将变得更加显而易见。

图1是根据一示例性实施方式示出的一种外呼结果确定方法的流程图。

图2是根据一示例性实施方式示出的另一种外呼结果确定方法的流程图。

图3是根据一示例性实施方式示出的自动语音识别的示意图。

图4是根据一示例性实施方式示出的一种外呼结果确定装置的框图。

图5是根据一示例性实施方式示出的另一种外呼结果确定装置的框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本发明将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本发明的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本发明的各方面变得模糊。

图1是根据一示例性实施方式示出的一种外呼结果确定方法的流程图。如图1所示，该方法10包括：

在步骤S102中，获取外呼的语音数据。

获取本次外呼的语音数据，例如可以抓取承载语音数据的封包，获得语音数据。

在步骤S104中，通过自动语音识别，对语音数据进行处理，以将所述语音数据转换为文本数据。

自动语音识别(Automated Speech Recognition，ASR)技术是一种将人的语音转换为文本的技术，可以使计算机等设备“听写”出不同人说出的连续语音，从而将语音转换为计算机可识别的文本。

在步骤S106中，将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。

通过ASR技术将语音数据转换为文本数据后，将该文本数据与预存的关键词信息进行匹配，从而确定本次外呼的外呼结果。

关键词信息例如可以包括：用户忙、正在通话中、不在服务区、持机等待等。外呼结果例如可以包括：成功接通、用户拒接、无人接听、占线、错误号码、关机、停机、无法接通、呼叫转移等。

每个外呼结果均可以与多种语言和一个或多个关键词相对应，并且可以添加逻辑条件，例如用户拒接可以与英文：busy now OR中文：用户忙OR(中文：正在通话and不包含中文：持机等待)匹配。

本发明实施方式的外呼结果确定方法，对语音进行自动识别，转换为文本数据，并将文本与预设的关键词信息进行匹配，确定外呼结果，可有效提升外呼结果的判断准确率。并且该方法无需人工判断，极大地减少了人工判断的成本，提高了工作效率；此外，该方法也无需更换相应设备，开发和联调的难度与成本都很低。

应清楚地理解，本发明描述了如何形成和使用特定示例，但本发明的原理不限于这些示例的任何细节。相反，基于本发明公开的内容的教导，这些原理能够应用于许多其它实施方式。

图2是根据一示例性实施方式示出的另一种外呼结果确定方法的流程图。如图2所示，该方法20包括：

在步骤S202中，确定获取语音数据的时间。

例如，可以从语音网关中抓取本次外呼通话的SIP(Session Initiation Protocol，会话初始协议)协议数据包，对抓取的SIP协议数据包进行解析，获取如通话开始时间、结束时间、通话ID(call_ID)等信息。其中通话ID用于唯一地标识一次外呼通话。

此外，通过解析SIP协议数据包，确定其承载的消息的类型。当发现一个SIP协议数据包所承载的SIP消息的类型为：180Ringing消息，即响铃消息时，确定开始获取语音数据。

在步骤S204中，获取外呼的语音数据。

语音数据例如可以承载在RTP(Real-time Transport Protocol，实时传送协议)协议数据包中。例如，当于上一步中确定收到SIP响铃消息后，开始抓取RTP包，并对其进行解析，以获取本次外呼的语音数据。

在步骤S206中，通过自动语音识别，对语音数据进行处理，以将所述语音数据转换为文本数据。

图3是根据一示例性实施方式示出的自动语音识别的示意图。如图3所示，自动语音识别例如可以包括如下步骤：

步骤S1，建立声学模型。

对从语音训练库中获取的语音进行特征提取；根据所提取的特征参数进行大数据声学模型训练，从而建立声学模型。声学模型用于在语音识别时，为待识别语音匹配相应的声学模型，以得到识别结果。

主要可以采用隐马尔可夫模型HMM进行声学模型建模。声学模型的建模单元，可以是音素，音节，词等各个层次。对于小词汇量的语音识别系统，可以直接采用音节进行建模；而对于词汇量偏大的识别系统，一般选取音素，即声母、韵母等进行建模。识别规模越大，其识别单元选取的越小。

步骤S2，建立语言模型。

基于语言文本训练库，进行大数据语音模型训练，从而建立语言模型。

语言模型是用来计算一个句子出现概率的概率模型。它主要用于决定哪个词序列的可能性更大，或者在出现了几个词的情况下预测下一个即将出现的词语的内容。语言模型是用来约束单词搜索的。它定义了哪些词能跟在上一个已经识别的词的后面(匹配是一个顺序的处理过程)，这样就可以为匹配过程排除一些不可能的单词。

其中N-Gram模型基于这样一种假设，第n个词的出现只与前面N至1个词相关，而与其它任何词都不相关，整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。

步骤S3，对获取的语音数据进行解码。

对获取的语音数据进行解码，还原成语间信号数据，将解码后的语音数据做为语音识别的输入数据。

步骤S4，对解码后的语音数据进行预处理。

对解码后的语音信号进行处理，滤除掉其中不重要的信息以及背景噪声，并进行语音信号的端点检测(如找出语音信号的始末)、语音分帧(近似认为在10～30ms内是语音信号是短时平稳的，将语音信号分割为一帧一帧地进行分析)以及预加重(提升高频部分)等处理。

步骤S5，对预处理后的语音数据进行特征提取，以提取出语音数据的特征参数。

特征提取的作用是去除语音信号中对于语音识别无用的冗余信息，保留能够反映语音本质特征的信息，并用一定的形式表示出来。也就是提取出反映语音信号特征的关键特征参数形成特征矢量序列，以便用于后续处理。

步骤S6，基于建立的声学模型、语音模型及字典，对特征参数进行语音解码和搜索，以将获取的语音数据转换为文本数据。

其中字典用于记录每个单词由哪些个音素组成，也即为每个词的发音进行标注。

语音解码和搜索算法：连续语音识别中的搜索，就是寻找一个词模型序列以描述输入语音信号，从而得到词解码序列。搜索所依据的是对公式中的声学模型打分和语言模型打分。在实际使用中，往往要依据经验给语言模型加上一个高权重，并设置一个长词惩罚分数。当今的主流解码技术都是基于Viterbi搜索算法或Sphinx搜索算法。

基于动态规划的Viterbi算法在每个时间点上的各个状态，计算解码状态序列对观察序列的后验概率，保留概率最大的路径，并在每个节点记录下相应的状态信息以便最后反向获取词解码序列。Viterbi算法本质上是一种动态规划算法，该算法遍历HMM状态网络并保留每一帧语音在某个状态的最优路径得分。

连续语音识别系统的识别结果是一个词序列。解码实际上是对词表的所有词反复搜索。词表中词的排列方式会影响搜索的速度，而词的排列方式就是字典的表示形式。Sphinx系统中采用音素作为声学训练单元，通常字典就用来记录每个单词由哪些个音素组成，也可以理解为对每个词的发音进行标注。

在步骤S208中，将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。

从文本数据中提取预存的关键词信息中的一个或多个关键词。关键词信息例如可以包括：用户忙、正在通话中、不在服务区、持机等待等。外呼结果例如可以包括：成功接通、用户拒接、无人接听、占线、错误号码、关机、停机、无法接通、呼叫转移等。

根据提取的一个或多个关键词与一外呼结果映射表，确定外呼的外呼结果。外呼结果映射表用于存储外呼结果与关键词之间的对应关系。每个外呼结果均可以与多种语言和一个或多个关键词相对应，并且可以添加逻辑条件，例如用户拒接可以与英文：busy now OR中文：用户忙OR(中文：正在通话and不包含中文：持机等待)匹配。

在步骤S210中，将本次外呼的外呼结果存储到一存储装置中，以更新本次外呼的通话记录的外呼结果状态。

该存储装置例如可以为redis缓存队列或其他内存数据库队列或数据库表等。将本次外呼(以通话ID标识)的外呼结果存储到存储装置中。从而可以检测该存储装置是否有数据，当有数据时，则更新通话ID所标识的外呼的通话记录的外呼结果状态。

本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时，执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中，该存储介质可以是只读存储器，磁盘或光盘等。

此外，需要注意的是，上述附图仅是根据本发明示例性实施方式的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

下述为本发明装置实施例，可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节，请参照本发明方法实施例。

图4是根据一示例性实施方式示出的一种外呼结果确定装置的框图。如图4所示，该装置30包括：语音获取模块302、语音识别模块304及结果确定模块306。

其中，语音获取模块302用于获取外呼的语音数据。

在一些实施例中，语音数据被封装为RTP协议数据包。

语音识别模块304用于通过自动语音识别，对语音数据进行处理，以将语音数据转换为文本数据。

结果确定模块306用于将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。

本发明实施方式的外呼结果确定装置，对语音进行自动识别，转换为文本数据，并将文本与预设的关键词信息进行匹配，确定外呼结果，可有效提升外呼结果的判断准确率。并且该方法无需人工判断，极大地减少了人工判断的成本，提高了工作效率；此外，该方法也无需更换相应设备，开发和联调的难度与成本都很低。

图5是根据一示例性实施方式示出的另一种外呼结果确定装置的框图。如图5所示，装置40包括：时间确定模块400、语音获取模块402、语音识别模块404、结果确定模块406及结果存储模块408。

其中，时间确定模块400用于确定获取语音数据的时间。时间确定模块400包括：SIP包获取子模块4002、SIP包解析子模块4004及时间确定子模块4006。

SIP包获取子模块4002用于从语音网关获取外呼的SIP协议数据包。

SIP包解析子模块4004用于解析SIP协议数据包，以获取外呼的通话ID及确定SIP协议数据包承载的消息的类型。

在一些实施例中，外呼通过通话ID被唯一标识。

时间确定子模块4006用于当SIP协议数据包承载的消息的类型为响铃消息时，确定开始获取语音数据。

语音获取模块402用于获取外呼的语音数据。

在一些实施例中，语音数据被封装为RTP协议数据包。

语音识别模块404用于通过自动语音识别，对语音数据进行处理，以将语音数据转换为文本数据。语音识别模块404包括：语音解码子模块4042、预处理子模块4044、特征提取子模块4046及数据转换子模块4048。

语音解码子模块4042用于对语音数据进行解码。

预处理子模块4044用于对解码后的语音数据进行预处理。

特征提取子模块4046用于对预处理后的语音数据进行特征提取，以提取出语音数据的特征参数。

数据转换子模块4048用于基于已建立的声学模型、语音模型及字典，对特征参数进行语音解码和搜索，以将获取的语音数据转换为文本数据。

结果确定模块406用于将文本数据与预存的关键词信息进行匹配，以确定外呼的外呼结果。结果确定模块406包括：关键词提取子模块4062及外呼结果匹配子模块4064。

关键词提取子模块4062用于从文本数据中提取关键词信息中的一个或多个关键词。

外呼结果匹配子模块4064用于根据一个或多个关键词与外呼结果映射表，确定外呼的外呼结果。

结果存储模块408用于将外呼的外呼结果存储到一存储装置中，以更新外呼的通话记录的外呼结果状态。

需要注意的是，上述附图中所示的框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施方式的方法。

以上具体地示出和描述了本发明的示例性实施方式。应可理解的是，本发明不限于这里描述的详细结构、设置方式或实现方法；相反，本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李贯士;姜晟;王灿;王青山;杨玉蕊;
技术所有人：北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。