语音识别方法、装置及系统的制作方法

文档序号:8396667阅读:473来源:国知局
语音识别方法、装置及系统的制作方法
【技术领域】
[0001]本发明涉及信息技术领域,特别涉及一种语音识别方法、一种语音识别装置及一种语音识别系统。
【背景技术】
[0002]随着信息技术的发展,语音识别的技术应用的越来越广泛,例如,越来越多的智能终端(例如智能手机、智能平板)的厂家把语音助理作为一种标准配置,逐渐开启拟人化的人机界面,但目前的语音识别准确率还无法做到100%,即使采用比较标准的发音也只能做到90%左右,如果采用日常口语式发音或带有方言口音时,准确率更会大幅下降,大大影响用户体验。随着机器人技术的发展,机器人的应用会越来越广泛,将来人与机器人之间的接口必然是以拟人化的语音交流为主,另外智能家居最近发展迅猛,将来人与智能家居设备的接口也一定会有语音交流接口,这些都必需依赖语音识别技术,将来语音一定会代替键盘、触摸屏成为人机交互的主要接口,所以提升语音识别的准确率具有极其重要的意义。
[0003]现有语音识别的基本模式是:通过话筒拾取语音,提取语音特征,将提取的语音特征与语音特征库比对找到合适的文字输出。为了提升识别的准确率,目前改进的语音识别技术已增加学习功能,通过学习修正语音特征库,以改善对个人语音不标准或方言口音导致的识别率低的问题,但因增加了学习过程,与正常的用户习惯不一致,对用户体验造成很大影响,同时仍然只能将识别率提升到接近标准发音时的识别率,在实际应用中仍然存在问题,准确率仍然不是很高。

【发明内容】

[0004]基于此,本发明实施例的目的在于提供一种语音识别方法、一种语音识别装置及一种语音识别系统,其可以大幅提升语音识别的准确率,用户语音识别使用体验可达到理想状态。
[0005]为达到上述目的,本发明实施例采用以下技术方案:
[0006]一种语音识别方法,包括步骤:
[0007]对拾取的语音数据进行预处理,得到预处理后的语音数据;
[0008]提取所述预处理后的语音数据中的特征信息,获得语音特征;
[0009]将所述语音特征与智能终端本地语音特征数据库进行匹配,判断所述智能终端本地语音特征数据库中是否有与所述语音特征匹配的语音识别结果;
[0010]若没有,向目标服务器发送第一语音识别请求,所述目标服务器为与所述语音特征所属语系对应的地域语音特征库服务器,所述第一语音识别请求中包括所述语音特征;[0011 ] 接收所述目标服务器返回的第一语音识别响应,所述第一语音识别响应包括所述目标服务器将所述语音特征与所述目标服务器本地语音特征数据库进行匹配获得的匹配结果;
[0012]在所述匹配结果为匹配不成功时,向所述目标服务器发送第二语音识别请求,所述第二语音识别请求中包括所述预处理后的语音数据;
[0013]接收所述目标服务器返回的第二语音识别响应,所述第二语音识别响应包括所述目标服务器将所述预处理后的语音数据发送给人工翻译终端设备进行人工翻译后得到的语音识别结果。
[0014]一种语音识别方法,包括步骤:
[0015]接收智能终端发送的第一语音识别请求,所述第一语音识别请求中包括语音特征;
[0016]将所述语音特征与服务器本地语音特征数据库进行匹配,获得匹配结果;
[0017]向所述智能终端发送第一语音识别响应,所述第一语音识别响应包括所述匹配结果;
[0018]接收所述智能终端在所述匹配结果为匹配不成功时发送的第二语音识别请求,所述第二语音识别请求中包括预处理后的语音数据,所述语音特征从所述预处理后的语音数据中提取;
[0019]将所述预处理后的语音数据发送给人工翻译终端设备进行人工翻译;
[0020]接收所述人工翻译终端设备返回的语音识别结果;
[0021]向所述智能终端发送第二语音识别响应,所述第二语音识别响应包括所述人工翻译终端设备返回的语音识别结果。
[0022]一种语音识别装置,包括:
[0023]预处理模块,用于对拾取的语音数据进行预处理,得到预处理后的语音数据;
[0024]特征提取模块,用于提取所述预处理后的语音数据中的特征信息,获得语音特征;
[0025]终端匹配模块,用于将所述语音特征与智能终端本地语音特征数据库进行匹配,判断所述智能终端本地语音特征信息数据库中是否有与所述语音特征匹配的语音识别结果;
[0026]终端信息交互模块,用于在所述终端匹配模块的判断结果为否时,向目标服务器发送第一语音识别请求,所述目标服务器为与所述语音特征所属语系对应的地域语音特征库服务器,所述第一语音识别请求中包括所述语音特征;并接收所述目标服务器返回的第一语音识别响应,所述第一语音识别响应包括所述目标服务器将所述语音特征与所述目标服务器本地语音特征数据库进行匹配获得的匹配结果,并在所述匹配结果为匹配不成功时,向所述目标服务器发送第二语音识别请求,所述第二语音识别请求中包括所述预处理后的语音数据;并接收所述目标服务器返回的第二语音识别响应,所述第二语音识别响应包括所述目标服务器将所述预处理后的语音数据发送给人工翻译终端设备进行人工翻译后得到的语音识别结果。
[0027]一种语音识别装置,包括:
[0028]服务端第一信息交互模块,用于接收智能终端发送的第一语音识别请求,所述第一语音识别请求中包括语音特征,并向所述智能终端发送第一语音识别响应,所述第一语音识别响应包括服务端匹配模块的匹配结果,并接收所述智能终端在所述匹配结果为匹配不成功时发送的第二语音识别请求,所述第二语音识别请求中包括预处理后的语音数据,所述语音特征从所述预处理后的语音数据中提取;并向所述智能终端发送第二语音识别响应,所述第二语音识别响应包括服务端第二信息交互模块接收的人工翻译终端设备返回的语音识别结果;
[0029]服务端匹配模块,用于将所述语音特征与服务器本地语音特征数据库进行匹配,获得匹配结果;
[0030]所述服务端第二信息交互模块,用于将所述预处理后的语音数据发送给人工翻译终端设备进行人工翻译,并接收所述人工翻译终端设备返回的语音识别结果。
[0031]一种语音识别系统,包括一个以上的地域语音特征库服务器,各地域语音特征库服务器分别与相应地域的各智能终端对应,为相应地域的智能终端提供语音识别服务,各地域语音特征库服务器分别包括如上所述的语音识别装置。
[0032]根据如上所述的本发明实施例的方案,其在智能终端无法对提取的语音特征进行匹配时,基于语音特征所属语系将该语音特征发送给与该语系对应的目标服务器,由目标服务器基于服务器语音特征数据库对该语音特征进行匹配,并将该匹配结果返回给智能终端,在目标服务器也匹配不成功的情况下,将预处理后的语音数据经由目标服务器发送至人工翻译终端设备进行人工翻译,从而可以获得接近100%准确率的语音识别。而且,在此情况下,目标服务器是与语音所属语系对应的,因而可以按照语言差异为各地域设置不同的语音特征库服务器分布在各地,实现海量语音特征数据的收集、存储和检索,可以建立无穷容量、包罗万象的语音特征库,极大地提高智能终端的语音识别率。
【附图说明】
[0033]图1是本发明一个实施例中的语音识别方法的流程示意图;
[0034]图2是本发明另一个实施例中的语音识别方法的流程示意图;
[0035]图3是一个具体示例的语音识别过程中智能终端与服务器之间的交互过程的流程不意图;
[0036]图4是一个实施例中的语音识别装置的结构示意图;
[0037]图5是本发明一个实施例中的语音识别系统的架构示意图。
【具体实施方式】
[0038]为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的【具体实施方式】仅仅用以解释本发明,并不限定本发明的保护范围。
[0039]图1中示出了本发明一个实施例的语音识别方法的流程示意图,该实施例是以各智能终端的处理过程为例进行说明,这些智能终端包括但不限于智能手机、平板电脑、智能家居设备、机器人、个人计算机等等。
[0040]如图1所示,本实施例中的方法包括步骤:
[0041]步骤SlOl:对拾取的语音数据进行预处理,得到预处理后的语音数据;
[0042]步骤S102:提取所述预处理后的语音数据中的特征信息,获得语音特征;
[0043]步骤S103:将所述语音特征与智能终端本地语音特征数据库进行匹配,判
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1