一种基于输电移动应用的语音处理方法及装置与流程

文档序号:19531983发布日期:2019-12-27 15:28阅读:189来源:国知局
一种基于输电移动应用的语音处理方法及装置与流程

本发明涉及输电移动应用技术领域,特别涉及一种基于输电移动应用的语音处理方法及装置。



背景技术:

目前,语音识别技术在互联网内的代表有:科大讯飞、百度语音、siri、微软小娜等,但是各大厂商的语音识别前提要求是必须接入互联网,通过外网在线处理。语音识别系统对环境敏感,采集到的语音数据只能应用于与之对应的环境,而且当输入的语音数据错误时将不能得到正确的响应。当前电力行业业务系统为保证数据的安全性均部署在内网,现场作业环境类型多样,因此传统的语音识别技术在电力行业存在一定的局限性。



技术实现要素:

根据本发明实施例提供的方案解决的技术问题是在复杂的作业场景中,现场作业的便捷度和专业度较低。

根据本发明实施例提供的一种基于输电移动应用的语音处理方法,包括:

服务器通过虚拟专用网络vpn专网接收移动终端发送的用户语音信息;

所述服务器利用预先存储的专业术语语音库查找与所述用户语音信息相匹配的语音业务操作信息;

所述服务器将所述语音业务操作信息通过vpn专网发送给所述移动终端,以便所述移动终端通过播放所述语音业务操作信息,对相应的业务模块进行控制。

优选地,所述专业术语语音库包括:各地市方言库、业务流程专业术语库以及业务流程操作指令库。

优选地,所述各地市方言库包括:地市方言语音以及标准语音;所述业务流程专业术语库包括:业务流程关键词语音和业务流程专业术语语音;所述业务流程操作指令库包括业务流程专业术语语音和业务流程操作指令语音。

优选地,所述服务器利用预先存储的专业术语语音库查找与所述用户语音信息相匹配的语音业务操作信息包括:

所述服务器利用所述各地市方言库,识别出与所述用户语音信息相匹配的标准语音;

所述服务器从所述标准语音中识别出与业务流程相关的关键词语音,并利用所述业务流程专业术语库查找与所述关键词相对应的业务流程专业术语语音;

所述服务器利用所述业务流程操作指令库,确定与所述业务流程专业术语语音相对应的业务流程操作指令语音。

优选地,还包括:

所述服务器通过vpn专网接收所述移动终端发送的用于业务流程提示性的文本信息,并通过对所述文本信息进行语音合成处理,得到语音信息;

所述服务器将所述语音信息通过vpn专网发送给所述移动终端,以便所述移动终端播放所述用于业务流程提示性的语音信息。

根据本发明实施例提供的一种基于输电移动应用的语音处理装置,包括:

接收模块,用于通过虚拟专用网络vpn专网接收移动终端发送的用户语音信息;

查找模块,用于利用预先存储的专业术语语音库查找与所述用户语音信息相匹配的语音业务操作信息;

发送模块,用于将所述语音业务操作信息通过vpn专网发送给所述移动终端,以便所述移动终端通过播放所述语音业务操作信息,对相应的业务模块进行控制。

优选地,所述专业术语语音库包括:各地市方言库、业务流程专业术语库以及业务流程操作指令库。

优选地,所述各地市方言库包括:地市方言语音以及标准语音;所述业务流程专业术语库包括:业务流程关键词语音和业务流程专业术语语音;所述业务流程操作指令库包括业务流程专业术语语音和业务流程操作指令语音。

优选地,所述查找模块包括:

第一查找单元,用于利用所述各地市方言库,识别出与所述用户语音信息相匹配的标准语音;

第二查找单元,用于从所述标准语音中识别出与业务流程相关的关键词语音,并利用所述业务流程专业术语库查找与所述关键词相对应的业务流程专业术语语音;

第三查找单元,用于利用所述业务流程操作指令库,确定与所述业务流程专业术语语音相对应的业务流程操作指令语音。

优选地,还包括:

处理模块,用于通过vpn专网接收所述移动终端发送的用于业务流程提示性的文本信息,并通过对所述文本信息进行语音合成处理,得到语音信息,以及将所述语音信息通过vpn专网发送给所述移动终端,以便所述移动终端播放所述用于业务流程提示性的语音信息。

根据本发明实施例提供的方案,通过建立输电移动应用业务功能和电力专业术语库,各地市方言库,并基于内网私有云语音库进行常用术语维护和训练,实现输电现场移动应用的智能化操作和语音录入,为语音识别合成技术在移动终端中的应用奠定基础。通过研发语义识别系统,完成复杂作业场景的语义分析及场景控制,从而提高现场作业便捷度和专业度。

附图说明

图1是本发明实施例提供的一种基于输电移动应用的语音处理方法的流程图;

图2是本发明实施例提供的一种基于输电移动应用的语音处理装置的示意图;

图3是本发明实施例提供的基于输电移动应用的语音识别交互技术架构示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1是本发明实施例提供的一种基于输电移动应用的语音处理方法的流程图,如图1所示,包括:

步骤s101:服务器通过虚拟专用网络vpn专网接收移动终端发送的用户语音信息;

步骤s102:所述服务器利用预先存储的专业术语语音库查找与所述用户语音信息相匹配的语音业务操作信息;

其中,所述专业术语语音库包括:各地市方言库、业务流程专业术语库以及业务流程操作指令库。具体地说,所述各地市方言库包括:地市方言语音以及标准语音;所述业务流程专业术语库包括:业务流程关键词语音和业务流程专业术语语音;所述业务流程操作指令库包括业务流程专业术语语音和业务流程操作指令语音。

其中,所述服务器利用预先存储的专业术语语音库查找与所述用户语音信息相匹配的语音业务操作信息包括:所述服务器利用所述各地市方言库,确定与所述用户语音信息相匹配的标准语音;所述服务器从所述标准语音中识别出与业务流程相关的关键词语音,并利用所述业务流程专业术语库查找与所述关键词相对应的业务流程专业术语语音;所述服务器利用所述业务流程操作指令库,确定与所述业务流程专业术语语音相对应的业务流程操作指令语音。

步骤s103:所述服务器将所述语音业务操作信息通过vpn专网发送给所述移动终端,以便所述移动终端通过播放所述语音业务操作信息,对相应的业务模块进行控制。

本发明实施例还包括:所述服务器通过vpn专网接收所述移动终端发送的用于业务流程提示性的文本信息,并通过对所述文本信息进行语音合成处理,得到语音信息;所述服务器将所述语音信息通过vpn专网发送给所述移动终端,以便所述移动终端播放所述用于业务流程提示性的语音信息。

图2是本发明实施例提供的一种基于输电移动应用的语音处理装置的示意图,如图2所示,包括:接收模块201、查找模块202以及发送模块203。所述接收模块201,用于通过虚拟专用网络vpn专网接收移动终端发送的用户语音信息;所述查找模块202,用于利用预先存储的专业术语语音库查找与所述用户语音信息相匹配的语音业务操作信息;所述发送模块203,用于将所述语音业务操作信息通过vpn专网发送给所述移动终端,以便所述移动终端通过播放所述语音业务操作信息,对相应的业务模块进行控制。

其中,所述专业术语语音库包括:各地市方言库、业务流程专业术语库以及业务流程操作指令库。进一步的,所述各地市方言库包括:地市方言语音以及标准语音;所述业务流程专业术语库包括:业务流程关键词语音和业务流程专业术语语音;所述业务流程操作指令库包括业务流程专业术语语音和业务流程操作指令语音。

其中,所述查找模块202包括:第一查找单元,用于利用所述各地市方言库,确定与所述用户语音信息相匹配的标准语音;第二查找单元,用于从所述标准语音中识别出与业务流程相关的关键词语音,并利用所述业务流程专业术语库查找与所述关键词相对应的业务流程专业术语语音;第三查找单元,用于利用所述业务流程操作指令库,确定与所述业务流程专业术语语音相对应的业务流程操作指令语音。

本发明实施例还包括:处理模块(图中未显示),用于通过vpn专网接收所述移动终端发送的用于业务流程提示性的文本信息,并通过对所述文本信息进行语音合成处理,得到语音信息,以及将所述语音信息通过vpn专网发送给所述移动终端,以便所述移动终端播放所述用于业务流程提示性的语音信息。

图3是本发明实施例提供的基于输电移动应用的语音识别交互技术架构示意图,如图3所示,由移动终端语音录入模块、专业术语语音库、语音播放模块、业务流程控制模块以及服务器端内网私有云服务构成。

移动终端语音录入模块,语音采集器视图通过自定义view与对声波图片的绘制、添加遮罩等操作,结合实时采集的音量大小,根据特定算法将声波大小绘制在采集器视图中。实现了自定义的语音采集器,可根据声波变化情况监听用户正在说话、停顿、完成说话等状态。

专业术语语音库,用于识别地方方言、专业术语及操作指令,通过把功能函数映射到带语义变量的正则表达式,可以准确智能的识别用户操作、合成录入内容,从而使得移动应用能表现出更多的人性化特点。即后台服务器端提供配置专业术语与移动终端操作流程(功能函数)的映射关系,配置完成后移动终端通过服务端接口自动更新最新语音库版本。语音识别之后通过语义过滤引擎,在语音库中匹配对应的业务操作。

语音播放模块,用于播放内网私有云合成完毕的语音。同时提供多种状态机,用于监听准备播放、正在播放、播放暂停、恢复播放及播放完毕各种状态。通过移动终端媒体播放引擎,下载并播放私有云服务上合成完毕的语音文件,根据不同状态机回调不同的业务场景。

业务流程控制模块,把不同业务场景的不同表单组合注入到语音处理逻辑框架中,移动应用在使用过程中可自动判断表单类型以及事件处理类型,控制表单相关的语音导航、表单数据录入、业务函数调用以及表单焦点移动等操作。作为业务逻辑与语音处理能力之间的桥梁,提供快速简洁的集成方式。实现了对多种复杂表单以及表单组的语音导航、数据回填、业务函数绑定等功能。

内网私有云,部署在linux系统下的企业云服务器,提供内网的语音识别以及语音合成调用能力。通过多路授权以及分布式部署,有效的提高了语音识别及合成速度。用于提供基于内网的语音识别以及语音合成api,通过多路授权及分布式部署,有效的提高了语音识别及合成速度。

根据本发明实施例提供的方案,具有以下有益效果:

1、使输电现场作业人员能够解放双手,通过语音命令进行移动应用操作,显著提高信息输入的效率,特别是在电网发生紧急情况时更能快速有效的及时应对,保障电网运行安全。同时,极大提高生产效率和服务质量,推动智能电网朝着“动用各种感官,实现人机全面沟通”的人工智能方向发展;

2、基于专业术语语音库所收集的涵盖不同方言和不同类型背景噪声的海量语音数据,通过先进的区分性训练方式进行语音建模,使语音识别器在复杂应用环境下均有良好的效果;

3、通过内网私有云服务多路授权及分布式部署,有效的提高了语音识别及合成速度。通过内置了大量的电力行业专业术语及名词,使电力设备名称等专业词汇识别率达到90%以上。

尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1