一种语音处理方法、装置及服务器与流程

文档序号:13878817阅读:206来源:国知局
一种语音处理方法、装置及服务器与流程

本发明涉及金融领域,更具体的说,涉及一种语音处理方法、装置及服务器。



背景技术:

语音技术能够使计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。

随着语音技术的不断发展,越来越多的应用都加入了语音服务,如导航地图已经实现了语音地图导航,输入法已经可以实现语音输入。其中,语音服务是使用了语音技术的服务。

虽然很多应用中已经融入了语音服务,但是在办理银行业务时,还未使用语音服务。



技术实现要素:

有鉴于此,本发明提供一种语音处理方法、装置及服务器,以解决在办理银行业务时,还未使用语音服务的问题。

为解决上述技术问题,本发明采用了如下技术方案:

一种语音处理方法,应用于交互模块,包括:

当用户终端显示与待办理的银行业务相对应的功能页面时,接收所述用户终端发送的待翻译文本;其中,所述待翻译文本依据与所述银行业务的业务账号id对应的预设业务流程中的待处理节点的信息获取得到;

将所述待翻译文本发送至语音合成模块;

接收所述语音合成模块反馈的语音消息;

将所述语音消息发送至所述用户终端,以使所述用户终端播放所述语音消息。

优选地,当用户终端显示与待办理的银行业务相对应的功能页面时,接收所述用户终端发送的待翻译文本之前,还包括:

接收所述用户终端发送的语音指令;其中,所述语音指令中携带有用户语音和票信息;

当所述票信息为合法的票信息时,获取与所述用户语音对应的业务类型;

查找所述业务类型对应的功能入口信息以及所述业务id;

将所述功能入口信息以及所述业务id发送至所述用户终端,以使所述用户终端根据所述功能入口信息渲染页面得到所述功能页面,以及根据与所述业务id对应的预设业务流程获取得到所述待翻译文本。

优选地,将所述语音消息发送至所述用户终端,以使所述用户终端播放所述语音消息后,还包括:

接收所述用户终端发送的用户输入语音;其中,所述用户输入语音为所述用户终端根据所述预设业务流程中的下一待处理节点提示用户输入的语音;

将所述用户输入语音发送至所述语音识别模块;

接收所述语音识别模块发送的识别结果;

将所述识别结果发送至所述用户终端,以使所述用户终端根据所述识别结果渲染所述功能页面。

优选地,判断所述票信息是否为合法的票信息,包括:

将所述票信息发送至外接服务系统;

判断是否接收到所述外接服务系统发送的验证通过消息。

优选地,获取与所述用户语音对应的业务类型,包括:

将所述用户语音发送至语音识别模块;

接收所述语音识别模块发送的语音识别结果;

将所述语音识别结果发送至意图识别模块;

接收所述意图识别模块反馈的与所述语音识别结果对应的业务类型。

一种语音处理装置,应用于交互模块,包括:

第一接收模块,用于当用户终端显示与待办理的银行业务相对应的功能页面时,接收所述用户终端发送的待翻译文本;其中,所述待翻译文本依据与所述银行业务的业务账号id对应的预设业务流程中的待处理节点的信息获取得到;

第一发送模块,用于将所述待翻译文本发送至语音合成模块;

第二接收模块,用于接收所述语音合成模块反馈的语音消息;

第二发送模块,用于将所述语音消息发送至所述用户终端,以使所述用户终端播放所述语音消息。

优选地,还包括:

第三接收模块,用于当用户终端显示与待办理的银行业务相对应的功能页面时,第一接收模块接收所述用户终端发送的待翻译文本之前,接收所述用户终端发送的语音指令;其中,所述语音指令中携带有用户语音和票信息;

获取模块,用于当所述票信息为合法的票信息时,获取与所述用户语音对应的业务类型;

查找模块,用于查找所述业务类型对应的功能入口信息以及所述业务id;

第三发送模块,用于将所述功能入口信息以及所述业务id发送至所述用户终端,以使所述用户终端根据所述功能入口信息渲染页面得到所述功能页面,以及根据与所述业务id对应的预设业务流程获取得到所述待翻译文本。

优选地,还包括:

输入语音接收模块,用于第二发送模块将所述语音消息发送至所述用户终端,以使所述用户终端播放所述语音消息后,接收所述用户终端发送的用户输入语音;其中,所述用户输入语音为所述用户终端根据所述预设业务流程中的下一待处理节点提示用户输入的语音;

语音发送模块,用于将所述用户输入语音发送至所述语音识别模块;

结果接收模块,用于接收所述语音识别模块发送的识别结果;

结果发送模块,用于将所述识别结果发送至所述用户终端,以使所述用户终端根据所述识别结果渲染所述功能页面。

优选地,所述语音处理装置还包括判断模块,所述判断模块用于判断所述票信息是否为合法的票信息时,具体用于:

将所述票信息发送至外接服务系统;

判断是否接收到所述外接服务系统发送的验证通过消息。

优选地,所述获取模块用于获取与所述用户语音对应的业务类型时,具体用于:

将所述用户语音发送至语音识别模块;

接收所述语音识别模块发送的语音识别结果;

将所述语音识别结果发送至意图识别模块;

接收所述意图识别模块反馈的与所述语音识别结果对应的业务类型。

一种服务器,包括发送端口和接收端口;

所述接收端口,用于当用户终端显示与待办理的银行业务相对应的功能页面时,接收所述用户终端发送的待翻译文本,以及接收语音合成模块反馈的语音消息;其中,所述待翻译文本依据与所述银行业务的业务账号id对应的预设业务流程中的待处理节点的信息获取得到;

所述发送端口,用于将所述待翻译文本发送至所述语音合成模块,以及将所述语音消息发送至所述用户终端,以使所述用户终端播放所述语音消息。

优选地,还包括:处理器;

所述接收端口,还用于当用户终端显示与待办理的银行业务相对应的功能页面时,接收所述用户终端发送的待翻译文本之前,接收所述用户终端发送的语音指令;其中,所述语音指令中携带有用户语音和票信息;

所述处理器,用于当所述票信息为合法的票信息时,获取与所述用户语音对应的业务类型,查找所述业务类型对应的功能入口信息以及所述业务id;

所述发送端口,还用于将所述功能入口信息以及所述业务id发送至所述用户终端,以使所述用户终端根据所述功能入口信息渲染页面得到所述功能页面,以及根据与所述业务id对应的预设业务流程获取得到所述待翻译文本。

相较于现有技术,本发明具有以下有益效果:

本发明提供了一种语音处理方法、装置及服务器,本发明中,能够在用户终端显示与待办理的银行业务相对应的功能页面时,语音提示用户以帮助用户办理业务,进而能够实现将语音服务应用在银行业务中。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明提供的一种语音处理方法的方法流程图;

图2为本发明提供的另一种语音处理方法的方法流程图;

图3为本发明提供的一种语音处理装置的结构示意图;

图4为本发明提供的另一种语音处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种语音处理方法,应用于交互模块,其中,交互模块与用户终端、语音合成模块、外接服务系统和语音识别模块通信。

其中,语音处理方法包括以下步骤:

s11、当用户终端显示与待办理的银行业务相对应的功能页面时,接收用户终端发送的待翻译文本;

其中,待翻译文本依据与银行业务的业务账号id对应的预设业务流程中的待处理节点的信息获取得到。

具体的,当用户想要办理转账业务时,功能页面是指转账页面,当用户想要办理取款业务时,功能页面为取款页面。

待翻译文本为中文字符串,需要将中文字符串翻译成语音并输出。待翻译文本可以是“请告诉我您的收款人是我行账户还是他行账户”。

s12、将待翻译文本发送至语音合成模块;

其中,语音合成模块将待翻译文本翻译成语音。语音合成模块包括文本分析模块,韵律生成模块和语音生成模块。语音合成模块接收到待翻译文本后,对待翻译文本进行文本分析、韵律生成和语音生成操作,最终得到与待翻译文本对应的语音消息。

s13、接收语音合成模块反馈的语音消息;

s14、将语音消息发送至用户终端,以使用户终端播放语音消息。

当用户终端接收到语音消息之后,通过用户终端的扬声器播放语音消息。如扬声器播放“请告诉我您的收款人是我行账户还是他行账户”的语音,提示用户进行下一步操作。

可选的,在本实施例的基础上,步骤s14后,还包括:

1)接收所述用户终端发送的用户输入语音;其中,所述用户输入语音为所述用户终端根据所述预设业务流程中的下一待处理节点提示用户输入的语音;

具体的,当预设业务流程中显示应该在文本框中输入信息时,如需要在转账对应的功能页面输入转账金额时,该转账金额的文本框为空白的,此时需要用户输入转账金额,此时用户输入用户输入语音。用户输入语音可以是200元。

2)将所述用户输入语音发送至所述语音识别模块;

交互模块将用户输入语音发送至语音识别模块,语音识别模块对用户输入语音进行识别,得到识别结果,如识别结果为200元对应的字符串。

3)接收所述语音识别模块发送的识别结果;

4)将所述识别结果发送至所述用户终端,以使所述用户终端根据所述识别结果渲染所述功能页面。

具体的,用户终端接收到识别结果后,根据识别结果渲染功能页面,如即在转账金额对应的对话框中输入200。

需要说明的是,用户按照本实施例中的方法在每个文本框中输入信息,当所有的文本框中均输入信息后,用户在用户终端上点击确认按钮,用户终端将输入的所有的信息发送至目标系统,目标系统在进行后续操作,如,判断用户输入的数据是否正确等操作。

本实施例中,能够在用户终端显示与待办理的银行业务相对应的功能页面时,语音提示用户以帮助用户办理业务,进而能够实现将语音服务应用在银行业务中。

此外,本发明提供的语音处理方法,不需要对银行后台处理系统进行改进,设置的交互模块独立于银行后台处理系统,交互模块仅与用户终端进行交互,保证系统之间的低耦合性及后续的扩展。

可选的,在上述实施例的基础上,参照图2,当用户终端显示与待办理的银行业务相对应的功能页面时,接收用户终端发送的待翻译文本之前,还包括:

s21、接收用户终端发送的语音指令;

其中,语音指令中携带有用户语音和票信息。

为了本领域的技术人员能够清楚明白的了解本步骤,先介绍下用户请求票的过程。

用户终端发送票申请请求到目标系统,其中,票申请请求中包括用户id,目标系统可以是后台网银系统、后台转账等系统。

目标系统在票申请请求中添加上预设字符串,得到新的票申请请求,并将新的票申请请求发送至外接服务系统,其中,外接服务系统可以是互信支持系统。外接服务系统根据新的票申请请求,生成票,并将票通过目标系统发送至用户终端。

当用户想要通过用户终端执行某一银行业务时,会发送语音指令到交互模块,其中,语音指令包括用户语音和票信息,用户语音是指用户输入的语音,如可以是:“我要跨行转账”。

票信息中包括票原始信息和用户终端请求得到的票。票原始信息是指用户id和预设字符串,用户终端请求得到的票即为外接服务系统发送的票。

s22、当票信息为合法的票信息时,获取与用户语音对应的业务类型;

可选的,在本实施例的基础上,判断票信息是否为合法的票信息,包括:

将票信息发送至外接服务系统,判断是否接收到外接服务系统发送的验证通过消息。

具体的,外接服务系统用于验证票是否是合法的票信息,所以交互模块需要将票信息发送至外接服务系统,外接服务系统验证票信息是否是合法的票信息,如果是合法的票信息,则发送验证通过消息到交互模块,如果不是合法的票信息,则发送验证不通过消息到交互模块。

交互模块将票信息发送至外接服务系统之后,可以通过判断是否收到外接服务系统发送的验证通过消息来确定票信息是否是合法的票信息。

需要说明的是,本实施例中,采用的票机制,来对用户终端的身份进行验证,此外,还可以采用白名单等机制对用户的身份进行验证。

可选的,在本实施例的基础上,获取与用户语音对应的业务类型,包括:

1)将用户语音发送至语音识别模块;

2)接收语音识别模块发送的语音识别结果;

发送至语音识别模块之后,语音识别模块通过将语音转化成文本,得到语音识别结果。如,用户发出“我要跨行转账”语音后,语音识别模块识别出“我要跨行转账”文本。

3)将语音识别结果发送至意图识别模块;

4)接收意图识别模块反馈的与语音识别结果对应的业务类型。

意图识别模块接收到语音识别结果后,通过分词、词性标注、语音依赖分析、深层语音分类等方式分析得到业务类型,如,意图识别模块接收到“我要跨行转账”文本,分析得到的业务类型为“跨行转账”。

s23、查找业务类型对应的功能入口信息以及业务id;

具体的,交互模块的数据库中保存有不同的业务类型对应的功能入口信息以及业务id,当确定了业务类型后,就能够查找出业务类型对应的功能入口信息以及业务id。其中,功能入口信息可以是统一资源定位符url。

s24、将功能入口信息以及业务id发送至用户终端。

用户终端接收到功能入口信息以及业务id后,能够根据功能入口信息进行页面渲染得到功能页面,以及根据与业务id对应的预设业务流程获取得到待翻译文本。

具体的,用户终端设置有预设业务流程,预设业务流程为以可扩展标记语言xml形式定义的交互流程。预设业务流程中包含多个业务节点,每个业务节点中有需处理的任务,当用户终端获取得到业务id后,查找该业务id对应的预设业务流程,从预设业务流程中查找得到待处理节点的信息,该信息中包括待翻译文本。

需要说明的是,用户终端根据功能入口信息进行页面渲染得到功能页面时,采用的是提供表述性状态转移rest风格的超文本传输协议http服务。

本实施例中,能够根据用户输入的语音指令,获取得到用户语音对应的业务类型,进而查找业务类型对应的功能入口信息以及业务id,将功能入口信息以及业务id发送至用户终端,以使用户终端渲染页面和获取待翻译文本。

可选的,本发明的另一实施例中提供了一种语音处理装置,应用于交互模块,参照图3,语音处理装置包括:

第一接收模块101,用于当用户终端显示与待办理的银行业务相对应的功能页面时,接收用户终端发送的待翻译文本;其中,待翻译文本依据与银行业务的业务账号id对应的预设业务流程中的待处理节点的信息获取得到;

第一发送模块102,用于将待翻译文本发送至语音合成模块;

第二接收模块103,用于接收语音合成模块反馈的语音消息;

第二发送模块104,用于将语音消息发送至用户终端,以使用户终端播放语音消息。

可选的,在本实施例的基础上,还包括:

输入语音接收模块,用于第二发送模块将所述语音消息发送至所述用户终端,以使所述用户终端播放所述语音消息后,接收所述用户终端发送的用户输入语音;其中,所述用户输入语音为所述用户终端根据所述预设业务流程中的下一待处理节点提示用户输入的语音;

语音发送模块,用于将所述用户输入语音发送至所述语音识别模块;

结果接收模块,用于接收所述语音识别模块发送的识别结果;

结果发送模块,用于将所述识别结果发送至所述用户终端,以使所述用户终端根据所述识别结果渲染所述功能页面。

本实施例中,能够在用户终端显示与待办理的银行业务相对应的功能页面时,语音提示用户以帮助用户办理业务,进而能够实现将语音服务应用在银行业务中。

需要说明的是,本实施例中的各个模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。

可选的,在上述语音处理装置的实施例的基础上,参照图4,还包括:

第三接收模块105,用于当用户终端显示与待办理的银行业务相对应的功能页面时,第一接收模块101接收用户终端发送的待翻译文本之前,接收用户终端发送的语音指令;其中,语音指令中携带有用户语音和票信息;

获取模块106,用于当票信息为合法的票信息时,获取与用户语音对应的业务类型;

查找模块107,用于查找业务类型对应的功能入口信息以及业务id;

第三发送模块108,用于将功能入口信息以及业务id发送至用户终端,以使用户终端根据功能入口信息渲染页面得到功能页面,以及根据与业务id对应的预设业务流程获取得到待翻译文本。

可选的,进一步,语音处理装置还包括判断模块,判断模块用于判断票信息是否为合法的票信息时,具体用于:

将票信息发送至外接服务系统;

判断是否接收到外接服务系统发送的验证通过消息。

可选的,进一步,获取模块106用于获取与用户语音对应的业务类型时,具体用于:

将用户语音发送至语音识别模块;

接收语音识别模块发送的语音识别结果;

将语音识别结果发送至意图识别模块;

接收意图识别模块反馈的与语音识别结果对应的业务类型。

本实施例中,能够根据用户输入的语音指令,获取得到用户语音对应的业务类型,进而查找业务类型对应的功能入口信息以及业务id,将功能入口信息以及业务id发送至用户终端,以使用户终端渲染页面和获取待翻译文本。

需要说明的是,本实施例中的各个模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。

可选的,本发明的另一实施例提供了一种服务器,包括发送端口和接收端口;

接收端口,用于当用户终端显示与待办理的银行业务相对应的功能页面时,接收用户终端发送的待翻译文本,以及接收语音合成模块反馈的语音消息;其中,待翻译文本依据与银行业务的业务账号id对应的预设业务流程中的待处理节点的信息获取得到;

发送端口,用于将待翻译文本发送至语音合成模块,以及将语音消息发送至用户终端,以使用户终端播放语音消息。

本实施例中,能够在用户终端显示与待办理的银行业务相对应的功能页面时,语音提示用户以帮助用户办理业务,进而能够实现将语音服务应用在银行业务中。

可选的,在上述服务器的实施例的基础上,还包括:

根据权利要求9的服务器,其特征在于,还包括:处理器;

接收端口,还用于当用户终端显示与待办理的银行业务相对应的功能页面时,接收用户终端发送的待翻译文本之前,接收用户终端发送的语音指令;其中,语音指令中携带有用户语音和票信息;

处理器,用于当票信息为合法的票信息时,获取与用户语音对应的业务类型,查找业务类型对应的功能入口信息以及业务id;

发送端口,还用于将功能入口信息以及业务id发送至用户终端,以使用户终端根据功能入口信息渲染页面得到功能页面,以及根据与业务id对应的预设业务流程获取得到待翻译文本。

本实施例中,能够根据用户输入的语音指令,获取得到用户语音对应的业务类型,进而查找业务类型对应的功能入口信息以及业务id,将功能入口信息以及业务id发送至用户终端,以使用户终端渲染页面和获取待翻译文本。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1