远程审批方法、装置、设备及可读存储介质与流程

文档序号:14195867研发日期:2017年阅读:221来源:国知局
技术简介:
本专利针对传统远程审批中难以及时识别欺诈风险的问题,提出基于语音情绪识别的解决方案。通过分析客户语音信号的特征参数,结合高斯混合模型等算法,实时识别客户情绪状态,辅助审批人员判断潜在风险,提升反欺诈能力。同时扩展至坐席端情绪监测,实现双向风险管控,降低业务损失。
关键词:语音情绪识别,远程审批系统

本发明涉及数据处理技术领域,尤其涉及一种远程审批方法、装置、设备及计算机可读存储介质。



背景技术:

现有的信贷审批通常需要工作人员对客户进行人工面谈审核,通过面谈对话,提问与信贷无关或者相关的问题,进而通过客户的答复表现判断客户是否存在欺诈行为,如果没有则可批准放贷。

对于判断客户是否存在欺诈行为,通常需要工作人员具备很强的观察识别能力,而这并能保证不会存在误判,而若存在误判,则将使得存在欺诈行为客户的贷款通过审批,继而对贷款方造成信贷损失。



技术实现要素:

本发明的主要目的在于提供一种远程审批方法、装置、设备及计算机可读存储介质,旨在解决如何在审核面谈过程中准确辨别客户欺诈行为的技术问题。

为实现上述目的,本发明提供一种远程审批方法,所述远程审批方法包括以下步骤:

与客户端建立远程视频通信连接;

接收客户端发送的视频数据流并进行音频解码,得到客户语音信号;

对所述客户语音信号进行语音情绪识别,得到客户情绪识别结果并输出,以供坐席人员基于所述客户情绪识别结果对客户申请进行远程审批。

可选地,所述对所述客户语音信号进行语音情绪识别,得到客户情绪识别结果并输出包括:

提取所述客户语音信号的语音特征参数;

基于提取的所述语音特征参数、预置的语音情绪训练模型与语音情绪识别匹配算法,进行语音情绪识别,得到客户情绪识别结果并输出。

可选地,所述语音特征参数至少包括:语音持续时间、基音频率、语音信号能量、语音信号振幅、语音共振峰;所述语音情绪训练模型中包含有多种语音情绪模型,且一种语音情绪模型对应一种情绪,每一种语音情绪模型中都保存有多种训练语音信号及其语音特征参数。

可选地,所述基于提取的所述语音特征参数、预置的语音情绪训练模型与语音情绪识别匹配算法,进行语音情绪识别包括:

基于所述训练语音信号的语音特征参数与所述客户语音信号的语音特征参数,采用语音情绪识别匹配算法,计算所述训练语音信号与所述客户语音信号的匹配度;

将匹配度最高的训练语音信号对应的情绪作为客户情绪识别结果。

可选地,采用的语音情绪识别匹配算法如下:

其中,m表示混合高阶模型的阶数,表示语音信号中情绪的特征参数向量,表示语音信号中表达情绪的第i维特征参数的高斯分布概念密度,pi表示第i维特征参数的权重,λ表示一个高斯模型,表示高斯混合模型的概率分布,μi表示第i组情绪状态参数的均值向量,∑i表示第i组情绪状态参数的协方差矩阵,|∑i|表示协方差矩阵∑i的行列式值,∑i-1表示协方差矩阵∑i的逆矩阵。

可选地,所述远程审批方法还包括:

在远程审批过程中,获取坐席端输入的坐席语音信号;

对所述坐席语音信号进行语音情绪识别,得到坐席情绪识别结果并输出,以供坐席管理员基于所述坐席情绪识别结果检测坐席人员的服务态度。

可选地,所述远程审批方法还包括:

在进行语音情绪识别之前,对所述客户语音信号或所述坐席语音信号进行预处理,其中,所述预处理包括采样处理、信号幅度离散化处理以及加窗分帧处理。

可选地,在得到客户语音信号之后,所述远程审批方法还包括:

对所述客户语音信号、所述坐席语音信号分别进行语音识别,得到文字;

对所述文字进行语义解析,得到语义解析结果,所述语义解析至少包括词性划分、情绪关键词提取;

基于所述语义解析结果,分析客户的潜在情绪,并将分析结果显示给坐席人员。

可选地,所述远程审批方法还包括:

在远程审批过程中,录制并保存客户语音信号以及坐席语音信号。

进一步可选的,为实现上述目的,本发明还提供一种远程审批装置,所述远程审批装置包括:

连接模块,用于与客户端建立远程视频通信连接;

预处理模块,用于接收客户端发送的视频数据流并进行音频解码,得到客户语音信号;

情绪识别模块,用于对所述客户语音信号进行语音情绪识别,得到客户情绪识别结果并输出,以供坐席人员基于所述客户情绪识别结果对客户申请进行远程审批。

进一步可选的,为实现上述目的,本发明还提供一种远程审批设备,所述远程审批设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的远程审批程序,所述远程审批程序被所述处理器执行时实现如上述任一项所述的远程审批方法的步骤。

进一步可选的,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有远程审批程序,所述远程审批程序被处理器执行时实现如上述任一项所述的远程审批方法的步骤。

本发明中,采用远程视频面谈的方式进行人工审核,为客户节约了时间,从而提升了业务服务水平。同时在面谈审核过程中,从客户端发送的视频数据流中提取客户语音信号,并对客户语音信号进行语音情绪识别,得到客户面谈过程中的情绪以及情绪变化情况,从而辅助坐席审核人员辨别客户存在的潜在欺诈行为,避免了客户骗贷行为对贷款方造成的损失。

附图说明

图1是本发明实施例方案涉及的设备硬件运行环境的结构示意图;

图2为本发明远程审批方法第一实施例的流程示意图;

图3为图2中步骤s30的细化流程示意图;

图4为本发明远程审批方法第二实施例的流程示意图;

图5为本发明远程审批装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的设备硬件运行环境的结构示意图。

本发明实施例远程审批设备可以是pc机、服务器,也可以是智能手机、平板电脑、便携计算机等具有显示功能的设备。

如图1所示,该远程审批设备可以包括:处理器1001,例如cpu,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地,远程审批设备还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块等等。

本领域技术人员可以理解,图1中示出的远程审批设备的硬件结构并不构成对远程审批设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及远程审批程序。其中,操作系统是管理和控制远程审批设备与软件资源的程序,支持网络通信模块、用户接口模块、远程审批程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。

在图1所示的远程审批设备硬件结构中,网络接口1004主要用于连接系统后台,与系统后台进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,并执行以下步骤:

与客户端建立远程视频通信连接;

接收客户端发送的视频数据流并进行音频解码,得到客户语音信号;

对所述客户语音信号进行语音情绪识别,得到客户情绪识别结果并输出,以供坐席人员基于所述客户情绪识别结果对客户申请进行远程审批。

进一步地,所述远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,以执行以下操作:

提取所述客户语音信号的语音特征参数;

基于提取的所述语音特征参数、预置的语音情绪训练模型与语音情绪识别匹配算法,进行语音情绪识别,得到客户情绪识别结果并输出。

进一步地,所述远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,以执行以下操作:

基于所述训练语音信号的语音特征参数与所述客户语音信号的语音特征参数,采用语音情绪识别匹配算法,计算所述训练语音信号与所述客户语音信号的匹配度;

将匹配度最高的训练语音信号对应的情绪作为客户情绪识别结果。

进一步地,所述远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,以执行以下操作:

在远程审批过程中,获取坐席端输入的坐席语音信号;

对所述坐席语音信号进行语音情绪识别,得到坐席情绪识别结果并输出,以供坐席管理员基于所述坐席情绪识别结果检测坐席人员的服务态度。

进一步地,所述远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,以执行以下操作:

在进行语音情绪识别之前,对所述客户语音信号或所述坐席语音信号进行预处理,其中,所述预处理包括采样处理、信号幅度离散化处理以及加窗分帧处理。

进一步地,所述远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,以执行以下操作:

对所述客户语音信号进行语音识别,得到文字;

对所述文字进行语义解析,得到语义解析结果,所述语义解析至少包括词性划分、情绪关键词提取;

基于所述语义解析结果,分析客户的潜在情绪,并将分析结果显示给坐席人员。

进一步地,所述远程审批设备通过处理器1001调用存储器1005中存储的远程审批程序,以执行以下操作:

在远程审批过程中,录制并保存客户语音信号以及坐席语音信号。

基于上述远程审批设备硬件结构,提出本发明远程审批方法的各个实施例。

参照图2,图2为本发明远程审批方法第一实施例的流程示意图。本实施例中,远程审批方法包括以下步骤:

步骤s10,与客户端建立远程视频通信连接;

本实施例中,远程审批设备需要与客户端建立远程视频通信连接,进而通过远程视频通话的方式,对客户申请进行远程审批。

本实施例对于视频通信连接的建立方式不限,具体根据实际需要进行设置。比如,需要客户端先登录后台服务器,然后再通过后台服务器而与远程审批设备建立通信连接。

步骤s20,接收客户端发送的视频数据流并进行音频解码,得到客户语音信号;

当与客户端建立远程视频通信连接后,远程审批设备接收客户端发送的视频数据流,并进行音视频解析,分别得到客户语音信号与客户视频信号,并进行播放。

远程审批设备所在的坐席人员(也即审批人员)根据设备上播放的客户语音及视频,从而可从人的主观意识上对客户申请进行人工审核。比如基于客户的面部表情变化、客户的对话流利程度等,判断客户是否有隐瞒或者欺诈行为。

人工审核方式虽然操作起来简便,但这与审批人员察言观色的经验有着重要关联,人工审核过程中容易存在遗漏以及人为主观判断而导致误判,比如,信息真实的客户申请判断为存在欺诈,而信息造假的客户申请则审批通过。因此,为进一步科学地、全面地对客户申请进行审核,本实施例中,远程审批设备引入了语音情绪识别,也即从语音样本中,了解客户的情绪变化,进而辅助审批人员对客户申请进行科学审批。

步骤s30,对客户语音信号进行语音情绪识别,得到客户情绪识别结果并输出,以供坐席人员基于客户情绪识别结果对客户申请进行远程审批。

本实施例中,远程审批设备对解码得到的客户语音信号进行语音情绪识别,然后将得到的识别结果输出,以供在进行远程审批时辅助坐席人员了解客户情绪所反映出来的潜在信息,并基于该潜在信息对客户申请进行远程审批。

本实施例中,采用远程视频面谈的方式进行人工审核,为客户节约了时间,从而提升了业务服务水平。同时在面谈审核过程中,从客户端发送的视频数据流中提取客户语音信号,并对客户语音信号进行语音情绪识别,得到客户面谈过程中的情绪以及情绪变化情况,从而辅助坐席审核人员辨别客户存在的潜在欺诈行为,避免了客户骗贷行为对贷款方造成的损失。

参照图3,图3为图2中步骤s30的细化流程示意图。基于上述第一实施例,本实施例中,上述步骤s30进一步包括:

步骤s301,提取客户语音信号的语音特征参数;

步骤s302,基于提取的语音特征参数、预置的语音情绪训练模型与语音情绪识别匹配算法,进行语音情绪识别,得到客户情绪识别结果并输出。

与平静语音相比,带情感的语音在语音质量、音调和说话速度三组参数存在变化,而在这三组特征参数中,语音质量和语速带有较多的主观色彩,相比之下音调更具客观性,更能用于准确衡量用户的情绪。因此,本实施例中,远程审批设备具体提取客户语音信号的语音特征参数,并根据各语音特征参数对应的韵律特征来识别情感。

可选的,提取的语音特征参数至少包括:语音持续时间、基音频率、语音信号能量、语音信号振幅、语音共振峰;

(1)语音持续时间

每一情感语音从开始到结束的持续时间,提取持续时间时应包括无声部分,因为无声部分对情感是有贡献的。

(2)基音频率

基音是指物体振动时所发出频率最低的音,利用倒谱法逐帧计算出基音频率,考虑到可能产生检测错误,因此对结果进行中值滤波和线性平滑处理。可以选取平均基音频率,最大基音频率、基音频率的平均变化率等参数用于情感识别。

(3)语音信号的短时能量

由于语音信号的能量随时间变化,清音和浊音间的能量差别相当显著,因此对短时能量进行分析,可以描述语音的清浊音变化情况,还可用于区分声母和韵母、无声与有声的分界等。

(4)语音信号的振幅

信号的振幅特征与各种情感信息具有较强的相关性,比如愤怒、高兴时的信号的振幅特征较明显。

(5)语音信号的共振峰

共振峰是反映声道特性的一个重要参数,因为不同情感的发音可能使声道有不同的变化,所以能够预料到不同情感发音的共振峰的位置不同。

对于人类的情感变化,计算机并不能识别,只能通过摸索出来的数学客观规律来进行辨别,也即需要通过大量、重复地统计,确定人的情绪与语音特征参数之间的对应关系,因此,本实施例中,采用语音情绪训练模型用以进行语音情绪识别。

可选的,语音情绪训练模型中包含有多种语音情绪模型且每一种语音情绪模型对应一种情绪,比如高兴情绪的语音情绪模型、伤心情绪的语音情绪模型等。此外,每一种语音情绪模型都包含有多种训练语音信号及其语音特征参数。

本可选实施例中,预先采用机器学习方式生成语音情绪训练模型。例如,预先设置一些有关审批的训练语料,并请多位不同性别的人士进行多种情绪模拟,并录制训练语音信号;对训练语音信号进行分析,抽取其中的语音特征参数,最后再保存为一语音情绪模型。

远程审批设备基于提取的语音特征参数、预置的语音情绪训练模型与语音情绪识别匹配算法,进行语音情绪识别。

进一步可选的,在一实施例中,远程审批设备基于训练语音信号的语音特征参数与客户语音信号的语音特征参数,采用语音情绪识别匹配算法,计算训练语音信号与客户语音信号的匹配度;并将匹配度最高的训练语音信号对应的情绪作为客户情绪识别结果。

本可选实施例中,对于语音情绪识别匹配算法的设置不限。比如主成分分析法、人工神经网络法、隐马尔科夫模型法、高斯混合模型法。

例如,高斯混合模型就是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。具体指对样本的概率密度分布进行估计,而估计采用的模型是几个高斯模型的加权和。每个高斯模型就代表了一个类。对样本中的数据分别在几个高斯模型上投影,就会分别得到在各个类上的概率,最后选取概率最大的类作为判决结果。

本实施例中采用的语音情绪识别匹配算法如下:

其中,m表示混合高阶模型的阶数,表示语音信号中情绪的特征参数向量,表示语音信号中表达情绪的第i维特征参数的高斯分布概念密度,pi表示第i维特征参数的权重,λ表示一个高斯模型,表示高斯混合模型的概率分布。μi表示第i组情绪状态参数的均值向量,∑i表示第i组情绪状态参数的协方差矩阵,|∑i|表示协方差矩阵∑i的行列式值,∑i-1表示协方差矩阵∑i的逆矩阵。

参照图4,图4为本发明远程审批方法第二实施例的流程示意图。基于上述方法第一实施例,本实施例中,远程审批方法还包括:

步骤s210,在远程审批过程中,获取坐席端输入的坐席语音信号;

步骤s220,对坐席语音信号进行语音情绪识别,得到坐席情绪识别结果并输出,以供坐席管理员基于坐席情绪识别结果检测坐席人员的服务态度。

本实施例中,远程审批设备具体安装在坐席侧,并集成有坐席端的相关功能,比如麦克风录音、喇叭播放音频、显示屏显示客户头像等。在远程审批过程中,远程审批设备不仅获取客户端的语音信号,还同时获取坐席端的语音信号,并对坐席语音信号进行语音情绪识别。

本实施例中,坐席端的语音情绪识别方式与客户端的可以相同,也可以不同,具体根据实际需要进行设置。通过语音情绪识别,坐席管理员可以检测坐席人员在审批过程中的服务态度。

可选的,在远程审批过程中,远程审批设备录制并保存客户语音信号以及坐席语音信号,以供后续二次审核留底。

进一步可选的,在进行语音情绪识别之前,对客户语音信号或坐席语音信号进行预处理,其中,预处理包括采样处理、信号幅度离散化处理以及加窗分帧处理。

通常,人的语音信号无论是在时间上还是在幅度上,都是连续的模拟信号,而计算机智能处理时间和幅值都是离散化的数字信号,因而,需要将语音信号通过采样和量化变成数字化信号。

本可选实施例中,对于语音信号的采样频率优选为8khz。采样信号由于采样时刻是间隔开的、不连续地采样,因此在时间上是离散信号,但采样过程中并没有改变信号的幅值,因此,采样信号的幅值仍然是连续的,所以要对采样信号进行量化,也即将语音信号的幅值离散化。

通常语音信号的参数在一段时间内是基本稳定的,这一段时间即为一帧,在一帧之内,语音信号是保持短时稳定的,将语音信号分为一帧一帧的操作即为对语音信号的加窗分帧处理。

进一步可选的,在一实施例中,在得到客户语音信号之后,远程审批方法还包括:

s1、对客户语音信号、坐席语音信号分别进行语音识别,得到文字;

s2、对文字进行语义解析,得到语义解析结果,所述语义解析至少包括词性划分、情绪关键词提取;

s3、基于语义解析结果,分析客户的潜在情绪,并将分析结果显示给坐席人员。

本实施例中,考虑到有些情绪变化并不一定是通过语音特征表现出来的,因此,为进一步分析客户的情绪变化,采用文字情绪识别方式,分析客户的潜在情绪。

本实施例中,远程审批设备先对客户语音信号进行语音识别而得到文字,然后再进行语义解析,比如词性划分,例如,主语、动词、形容词等划分;情绪关键词提取,比如“啊”、“嗯”、“干嘛”、“不要”、“不行”等等。

本实施例中,预先设置文字情绪训练模型,每一种训练模型对应一种客户情绪,每一种训练模型中包含有一个对话场景,对话场景包含:一个坐席提问与对应的多个客户回答。如果语义解析结果中的情绪关键词与对话场景中的情绪关键词匹配,则可确定对应的客户情绪。

本发明还提供一种远程审批装置。

参照图5,图5为本发明远程审批装置一实施例的功能模块示意图。本实施例中,远程审批装置具体设置在远程审批设备中,包括以下功能模块:

连接模块10,用于与客户端建立远程视频通信连接;

预处理模块20,用于接收客户端发送的视频数据流并进行音频解码,得到客户语音信号;

情绪识别模块30,用于对所述客户语音信号进行语音情绪识别,得到客户情绪识别结果并输出,以供坐席人员基于所述客户情绪识别结果对客户申请进行远程审批。

本实施例中,采用远程视频面谈的方式进行人工审核,为客户节约了时间,从而提升了业务服务水平。同时在面谈审核过程中,从客户端发送的视频数据流中提取客户语音信号,并对客户语音信号进行语音情绪识别,得到客户面谈过程中的情绪以及情绪变化情况,从而辅助坐席审核人员辨别客户存在的潜在欺诈行为,避免了客户骗贷行为对贷款方造成的损失。

可选的,情绪识别模块30具体用于:提取所述客户语音信号的语音特征参数;基于提取的所述语音特征参数、预置的语音情绪训练模型与语音情绪识别匹配算法,进行语音情绪识别,得到客户情绪识别结果并输出。

可选的,情绪识别模块30进一步用于:基于所述训练语音信号的语音特征参数与所述客户语音信号的语音特征参数,采用语音情绪识别匹配算法,计算所述训练语音信号与所述客户语音信号的匹配度;将匹配度最高的训练语音信号对应的情绪作为客户情绪识别结果。

本发明还提供一种应用于远程审批设备的计算机可读存储介质。

计算机可读存储介质上存储有远程审批程序,远程审批程序被处理器执行时实现上述远程审批方法任一实施例中的步骤。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!