语音信息处理方法及装置与流程

文档序号:13736137阅读:152来源:国知局
【技术领域】本申请涉及语音处理技术领域,尤其涉及一种语音信息处理方法及装置。

背景技术:
随着互联网和通信技术的发展,用户可以通过网络或电话进行通信,在通信过程中咨询一些问题并获得相关答案。例如,越来越多的客服系统采用互动式语音应答热线服务(InteractiveVoiceResponse,IVR)方式,与用户进行通信,以便用户咨询一些问题,并向用户提供相关答案。使用IVR的过程包括:用户通过电话接入IVR的服务中心,根据服务中心的语音提示选择一种服务通道,并使用所选择的服务通道进行问题咨询,所选择的服务通道可以是人工服务通道或智能服务通道。目前,IVR的服务模式比较单一,服务方式不够灵活,导致IVR的服务质量较低。

技术实现要素:
本申请的多个方面提供一种语音信息处理方法及装置,用以提高IVR的服务质量。本申请的一方面,提供一种语音信息处理方法,包括:获取用于描述用户所咨询的问题的语音数据;对所述语音数据进行情感分析,以确定所述用户的优先级;根据所述用户的优先级,将所述用户接入对应的服务通道。本申请的另一方面,提供一种语音信息处理装置,包括:获取模块,用于获取用于描述用户所咨询的问题的语音数据;分析模块,用于对所述语音数据进行情感分析,以确定所述用户的优先级;服务接入模块,用于根据所述用户的优先级,将所述用户接入对应的服务通道。在本申请中,获取用户的语音数据,对该语音数据进行情感分析,以确定语音数据的优先级,根据语音数据的优先级,将用户接入对应的服务通道。与现有技术相比,本申请可以根据语音数据的优先级,将用户接入对应的服务通道,这样就可以灵活及时的将用户接入不同的服务通道,例如可以将语音数据的优先级较高的用户接入高优先级的服务通道,有利于提高用户体验和问题解决速率,同时扩展了IVR的服务模式,提高了服务的灵活性,有利于提高IVR的服务质量。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的语音信息处理方法的流程示意图;图2为本申请一实施例提供的步骤101的实施方式的流程示意图;图3为本申请一实施例提供的步骤102的实施方式的流程示意图;图4为本申请另一实施例提供的语音信息处理方法的流程示意图;图5为本申请另一实施例提供的语音信息处理装置的结构示意图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的语音信息处理方法的流程示意图。如图1所示,该方法包括:101、获取用户的语音数据。102、对上述语音数据进行情感分析,以确定所述语音数据的优先级。103、根据上述语音数据的优先级,将用户接入对应的服务通道。本实施例提供一种语音信息处理方法,可由语音信息处理装置来执行。在具体实现上,语音信息处理装置可以是任何具有一定处理能力的装置或设备,并可应用于提供语音服务的客服系统,如IVR中。具体的,语音信息处理装置获取用户的语音数据,对语音数据进行情感分析,以确定语音数据的优先级,进而根据语音数据的优先级,将用户接入对应的服务通道。值得说明的是,语音数据的优先级一定程度上可以表示或反映用户的优先级。本实施例通过对语音数据进行情感分析,确定语音数据的优先级,可以根据语音数据的优先级灵活及时的将用户接入不同的服务通道,例如可以将语音数据的优先级较高的用户接入高优先级的服务通道,不再像现有技术那样根据语音提示由用户选择服务通道,扩展IVR的服务模式,提高了IVR的服务质量。在一可选实施方式中,用户的语音数据可以是用于描述用户所咨询的问题的语音数据。在实际应用中,各种应用一般都会提供客服系统,用于向使用该应用的用户提供一种交流平台,以供用户进行问题咨询、相关信息的了解、以及意见反馈等。在本实施例中,客服系统提供至少一种服务通道(或服务方式),例如可以包括人工通道和智能通道,人工通道主要是指由客服人员以语音方式向用户提供服务的方式;智能通道是指非人工的服务方式,例如可包括在线聊天服务和在线自助服务等。在本实施例中,对服务通道进行优先级划分。人工通道的优先级要高于智能通道的优先级。另外,人工通道进一步可以分为普通人工通道、专家人工通道等。专家人工通道的优先级高于普通人工通道的优先级。优先级越高的服务通道所提供的服务质量越好,例如专家人工通道所能提供的服务质量要高于普通人工通道。不同服务通道的服务质量可由所能解决问题的难以程度、服务态度、解决问题的速度以及解决问题的灵活性等多方面因素来确定。一种在客服系统中应用本实施例提供的方法的具体过程包括:当有用户需要咨询问题时,获取用于描述该用户所咨询的问题的语音数据,对该语音数据进行情感分析,获得用户在描述所咨询的问题时的情感,根据用户咨询问题时的情感确定语音数据的优先级,进而根据语音数据的优先级,将用户接入对应的服务通道。由此可见,本实施例通过对用户咨询问题的语音数据进行情感分析,可通过语音数据的优先级体现用户的优先级,实现对用户的区分,进而将不同优先级的用户接入不同的服务渠道,有利于提高用户体验和问题解决速率,有利于提高客服系统的服务质量。另外,与现有技术相比,本实施例提供的方法可以通过语音数据的优先级体现用户的优先级,相当于对用户进行了区分,例如可以将诉求比较迫切的用户优先接入人工通道,不再像现有技术那样统一对待所有用户,扩展了客服系统的服务模式,提高了服务的灵活性。在一可选实施方式中,步骤101的一种实现方式如图2所示,具体包括:1011、接收用户的通话请求,以与用户进行语音通话。1012、向用户播放语音提示音。1013、接收用户在语音提示音的提示下发出的语音数据。在一可选实施方式中,上述语音提示音可以是问题描述提示音,用于指示用户对所咨询的问题进行描述。相应的,用户可以在问题描述提示音的提示下发出用于描述所咨询的问题的语音数据。详细来说,对于一些向用户提供语音服务的客服系统,例如IVR,当用户向这些客服系统咨询问题时,一般会通过手机、固话等通信终端拨打相应的客服热线,向客服系统中的语音信息处理装置发送通话请求,语音信息处理装置接收通话请求,以与用户建立语音通话。之后,语音信息处理装置向用户播放问题描述提示音,以提示用户对所咨询的问题进行描述。例如,问题描述提示音可以是“请用一句话描述所咨询的问题”、“请问所要咨询的问题是什么”等类似语音。用户根据问题描述提示音,对所咨询的问题进行描述,形成描述所咨询的问题的语音数据。例如,语音数据可以是“我忘记密码了”、“输入账号和密码后无法正常登录”等类似语音。值得说明的是,语音信息处理装置除了可以采用上述方式获得用于描述用户所咨询的问题的语音数据之外,还可以采用其他方式。例如,语音信息处理装置可以从其他设备(例如用户终端)上获取用于描述用户所咨询的问题的语音数据。当语音信息处理装置获取到语音数据后,可以对语音数据进行情感分析,以确定语音数据的优先级。在一可选实施方式中,步骤102的一种实现方式如图3所示,具体包括:1021、对语音数据进行情感分析,确定用户在发出语音数据时的音量和/或语速。1022、根据上述音量和/或语速,获得用户的情感值。1023、根据用户的情感值和预设的情感值与优先级映射关系,获得用户的优先级。其中,情感分析属于语义分析中的一种,属于现有技术,各种可以分析出音量和语速的方法均适用于本实施例。举例说明,对语速的分析过程可以是:在获取到语音数据后,计算语音数据的短时平均振幅,然后根据短时平均振幅分析语音数据的起止点,计算出语音数据的语速。声音是由若干(或无限多个)频率分量组成的。为了检测和描述声音的特性,一般使用频谱。因此对音量的分析过程可以是:把语音数据由时域信号转换为频域信号,划分倍频程,并把频域信号从绝对量值转换为相对量值,即分贝(DB),获得语音数据的音量。语音信息处理装置通过对语音数据进行情感分析,获得用户描述所咨询的问题时的语速和/或音量。语速和音量可以反映用户的情感,例如着急、生气、平静等。对于音量来说,当音量在0-20分贝之间时,很静、几乎感觉不到;当音量在20-40分贝之间时,安静、犹如轻声絮语,说明用户情绪比较平和;当音量在40-60分贝之间时,一般、普通室内谈话,说明用户情绪比较正常;当音量在60-70分贝之间时,吵闹、有损神经,说明用户情绪比较着急或生气。对于语速来说,正常人在一般语境中每分钟的语速是70-90个字,若按照用一句话描述所咨询问题的时间是15秒钟计算,则应该在18个-23个字左右。若用户在咨询问题时的语速小于或在18-23个字左右,说明用户情感较为平和,可能所咨询问题不太着急;反之,若用户在咨询问题时的语速大于23个字,例如咨询问题时的语速在25个-32个字左右,说明用户情绪较为急躁,可能所咨询问题比较迫切。基于此,语音信息处理装置在获得用户在描述所咨询的问题时的音量和/或语速之后,进一步根据音量和/或语速,获得用户的情感值。可选的,可以对音量和/或语速进行数值处理,将数值处理的结果作为用户的情感值。数值处理的方式可以是加权平均或加权重等。例如,一种实施方式包括:语音信息处理装置将音量与权重的乘积作为用户的情感值。当权重为1时,即可以直接将音量作为用户的情感值。又例如,一种实施方式包括:语音信息处理装置将语速与权重的乘积作为用户的情感值。当权重为1时,即可以直接将语速作为用户的情感值。又例如,一种实施方式包括:语音信息处理装置对音量和语速进行数值处理,将数值处理的结果作为用户的情感值。例如,语音信息处理装置将音量和语速相乘,将相乘的结果作为用户的情感值;或者,语音信息处理装置可以对音量和语速进行加权平均,将结果作为用户的情感值。数值处理方式并不限于相乘和加权平均。得到用户的情感值之后,语音信息处理装置将用户的情感值在预设的情感值与优先级映射关系中进行匹配,将匹配中的优先级作为用户的优先级。值得说明的是,情感值与优先级映射关系具体可以是:情感值范围与优先级的对应关系,例如情感值范围0-10对应优先级-1,情感值范围10-20对应优先级0,情感值范围20-30对应优先级1,情感值范围30以上对应优先级2。或者,情感值与优先级映射关系具体也可以是:情感值阈值与优先级的对应关系,例如情感值阈值10对应优先级-1,情感值阈值20对应优先级0,情感值阈值30对应优先级1,关于优先级2对应的情感值阈值不做限定。在一可选实施方式中,语音信息处理装置预先设定了优先级与服务通道的映射关系,且服务通道包括人工通道和智能通道。进一步可选的,人工通道又可分为普通人工通道和专家人工通道。语音信息处理装置具体将用户的优先级在预设的优先级与服务通道的映射关系中进行匹配;当匹配到人工通道时,将用户接入人工通道,具体是将用户的呼叫请求转接到人工通道中某个客服人员的客户端上。当匹配到智能通道时,将用户接入智能通道,具体可由语音信息处理装置以语音播报的方式指导用户解决问题。举例说明,优先级2对应专家人工通道;优先级1对应普通人工通道;优先级0和优先级-1对应智能通道。假设用户的优先级为2,则语音信息处理装置需要将用户接入专家人工通道。进一步,语音信息处理装置还可以根据语音数据,生成解答用户所咨询的问题的参考信息,将该参考信息提供给人工通道对应的客服人员,以便于客服人员根据该参考信息向用户解答问题,提高解答问题的效率和质量。上述生成参考信息的方式包括但不限于:语义信息处理装置对语音数据进行文本转换,对文本信息进行识别确定用户所咨询的问题所属的类别,并获取用户的账户信息,将用户所咨询问题所属的类别以及用户的账户信息进行动态组装生成参考信息。该参考信息可以语音形式的,也可以是文本形式的。值得说明的是,虽然上述实施例重点说明了如何使用用户的优先级确定用户应该接入的服务通道,但本申请实施例并不限于单独使用用户的优先级确定用户应该接入的服务通道,用户的优先级还可以与其他信息相结合使用。举例说明,用户的优先级可以与现有IVR中已经实现的用于确定用户接入服务通道的方法(例如基于用户所咨询问题所属的类别确定用户应该接入的服务通道)相结合。具体结合方式可以包括:优先考虑用户的优先级,再考虑用户所咨询问题所属的类别;或者,可以优先考虑用户所咨询问题所属的类别,再考虑用户的优先级;或者,同时考虑用户所咨询问题所属的类别和用户的优先级。下面图4所示实施例提供一种使用用户的优先级为用户确定服务通道的详细流程。图4所示实施例中的各模块具体可构成上述语音信息处理装置。图4为本申请一实施例提供的语音信息处理方法的流程示意图。如图4所示,该方法包括:21、互动式语音应答(InteractiveVoiceResponse,IVR)模块接收用户发送的通话请求,以与用户建立语音通话。22、IVR模块向用户播放问题描述提示音,以提示用户对所咨询的问题进行描述。23、IVR模块接收用户描述所咨询的问题产生的语音数据。24、IVR模块将语音数据发送给支付宝算法平台(AlipayGeneralAlgorithmPlatform,AGAP)模块。25、AGAP模块对语音数据进行情感分析,获得用户的音量和/或语速,并根据音量和/或语速获得用户的优先级,并将用户的优先级返回给IVR模块。26、IVR模块将语音数据发送给自动语音识别技术(AutomaticSpeechRecognition,ASR)模块。27、ASR模块对语音数据进行文本转换,获得文本信息,并将文本信息返回给IVR模块。28、IVR模块将文本信息和用户的优先级提供给客服语音交互响应(CustomerServiceInteractiveVoiceResponse,CSIVR)模块。29、CSIVR模块将文本信息发送给文本分析平台(AlipayTextAnalyze,ALITA)模块。30、ALITA模块对文本信息进行语义分析,确定问题类别,并将所确定的问题类别返回给CSIVR模块。31、CSIVR模块将用户的来电号码、身份证号等信息提供给用户信息文件(CustomerInformationFile,CIF)模块。32、CIF模块根据用户的来电号码、身份证号码获取用户的账号信息,并将用户的账号信息返回给CSIVR模块。33、CSIVR模块将用户的账户信息、问题类别和用户的优先级发送给精准服务平台(CustomerServiceAccurate,CSACCURATE)模块。34、CSACCURATE模块根据用户的账户信息、问题类别和用户的优先级,确定用户对应的服务通道,并将所确定的服务通道的标识信息返回给CSIVR模块。在该实施方式中,CSACCURATE模块同时考虑问题类别和用户的优先级,来决定用户应该接入的服务通道。举例说明,假设根据用户所咨询问题所属的类别判定用户属于无效用户,且根据用户咨询问题时的音量和语速确定用户的优先级为-1,则可以将用户接入智能通道。假设根据用户所咨询问题所属的类别判定用户属于咨询类用户,且根据用户咨询问题时的音量和语速确定用户的优先级为0,则可以将用户接入智能通道。假设根据用户所咨询问题所属的类别判定用户属于业务诉求类用户,且根据用户咨询问题时的音量和语速确定用户的优先级为1,则可以将用户接入普通人工通道。假设根据用户所咨询问题所属的类别判定用户属于紧急诉求类用户,且根据用户咨询问题时的音量和语速确定用户的优先级为2,则可以将用户接入专家人工通道。35、若服务通道是智能通道,则CSIVR模块根据用户的账户信息、问题类别和用户的优先级生成对应的语音播放资料,返回给IVR模块,以供IVR模块指导用户解决问题。36、若服务通道是人工通道,则CSIVR模块根据用户的账户信息、问题类别和用户的优先级生成参考信息,将用户接入人工通道,同时将参考信息提供给人工通道中的客服人员。在本实施例中,可以根据用户咨询问题时的情感,确定用户的优先级,基于优先级将用户接入对应的服务通道,这样就可以灵活及时的将不同优先级的用户接入不同的服务通道,例如可以将优先级较高的用户接入高优先级的服务通道,有利于提高用户体验和问题解决速率,同时扩展了IVR的服务模式,提高了服务的灵活性,有利于提高IVR的服务质量。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。图5为本申请一实施例提供的语音信息处理装置的结构示意图。如图5所示,该装置包括:获取模块51、分析模块52和服务接入模块53。获取模块51,用于获取用户的语音数据。分析模块52,与获取模块51连接,用于对获取模块51获取的语音数据进行情感分析,以确定语音数据的优先级。服务接入模块53,与分析模块52连接,用于根据分析模块52确定的语音数据的优先级,将用户接入对应的服务通道。值得说明的是,语音数据的优先级一定程度上可以表示或反映用户的优先级。在一可选实施方式中,用户的语音数据可以是用于描述用户所咨询的问题的语音数据。在一可选实施方式中,获取模块51具体用于:接收用户的通话请求,以与用户进行语音通话;向用户播放语音提示音;接收用户在语音提示音的提示下发出的语音数据。在一可选实施方式中,上述语音提示音可以是问题描述提示音,用于指示用户对所咨询的问题进行描述。相应的,用户可以在问题描述提示音的提示下发出用于描述所咨询的问题的语音数据。在一可选实施方式中,分析模块52具体用于:对语音数据进行情感分析,确定用户在发出语音数据时的音量和/或语速;根据音量和/或语速,获得用户的情感值;根据用户的情感值和预设的情感值与优先级映射关系,获得语音数据的优先级。分析模块52具体用于:对语音数据进行情感分析,确定用户在发出语音数据时的音量和/或语速;对音量和/或语速进行数值处理,将数值处理的结果作为用户的情感值;根据用户的情感值和预设的情感值与优先级映射关系,获得语音数据的优先级。在一可选实施方式中,服务接入模块具体用于:将语音数据的优先级在预设的优先级与服务通道的映射关系中进行匹配;当匹配到人工通道时,将用户接入人工通道。在一可选实施方式中,该语音信息处理装置还包括:参考处理模块,用于根据语音数据,生成参考信息,并将参考信息提供给人工通道对应的客服人员。值得说明的是,语音信息处理装置除了可以采用图5所示实现结构之外,还可以采用图2所示实施例中的实现结构,形成一个IVR系统。本实施例提供的语音信息处理装置,可以根据语音数据的优先级,将用户接入对应的服务通道,这样就可以灵活及时的将用户接入不同的服务通道,例如可以将语音数据的优先级较高的用户接入高优先级的服务通道,有利于提高用户体验和问题解决速率,同时扩展了IVR的服务模式,提高了服务的灵活性,有利于提高IVR的服务质量。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1