一种网络语音输入转换控制方法

文档序号:9709477阅读:502来源:国知局
一种网络语音输入转换控制方法
【技术领域】
[0001 ]本发明涉及一种语音转换控制方法,尤其涉及一种网络语音输入转换控制方法。
【背景技术】
[0002]随着社会的发展及语音技术的提高,语音控制越来越来广泛应用。现有语音控制大多在设备上设置嵌入语音识别芯片,存储的语音指令及内容,通过语音识别后调用存储的指令和内容,从而进行语音控制。现有技术基于网络进行语音识别,则通常采用与电脑或智能设备直接通过网络连接进行语音输入和识别,并不具备外部开启控制的网络语音转换控制系统和方法。现有技术的语音识别转换适用于专门的电脑或智能设备,不具备通用性,不能充分利用网络语音转换的功能,需要开发专门的语音输入及控制系统。同时,现有语音输入识别多需要标准的语音,对于自然语音则难以准确执行。

【发明内容】

[0003]本发明解决的技术问题是:构建一种网络语音输入转换控制方法,克服现有技术语音识别转换不具备通用性及不能充分利用网络语音转换的功能以及不能使用自然语音进行转换执行的技术问题。
[0004]本发明的技术方案是:一种网络语音输入转换控制方法,包括输入语音的语音输入单元、传送语音信息的终端、进行语音识别转换的网络服务器,所述终端包括网络连接模块,所述语音输入单元包括开启所述网络连接模块建立网络连接的开启模块,所述网络语音转换控制方法包括如下步骤:
[0005]开启终端并输入语音:由所述开启模块开启所述网络连接模块,使所述终端与所述网络服务器建立网络连接,由所述语音输入单元输入语音;
[0006]接收并上传语音:所述终端接收所述语音输入单元输入的语音并上传到网络服务器;
[0007]语音识别转换:所述终端与所述网络服务器并行对所述语音信息进行识别转换;
[0008]执行识别转换结果:所述网络服务器和所述终端共同执行或由所述终端传送或单独执行语音识别转换结果。
[0009]本发明的进一步技术方案是:还包括根据识别场景构建语义知识库,所述语义知识库包括字词的语义属性,在语音识别转换步骤中,还包括进行语义识别转换,具体包括如下步骤:
[0010]分词及语义消歧:根据知识库字词的语义属性对语音识别结果进行分词并进行语义消歧;
[0011]意图分类及参数提取:对分词及语义消歧的结果进行意图分类,并进行参数提取。
[0012]本发明的进一步技术方案是:在输入不能识别语音信息或不能执行的语音信息时,通过所述终端输入语音与所述网络服务器进行交互语音,以获取所述网络服务器能执行的语音信息。
[0013]本发明的进一步技术方案是:语音识别转换结果包括指令或指令和参数,所述参数包括语音转换的文字内容。
[0014]本发明的技术效果是:本发明一种基于外部开启控制语音输入的网络语音转换控制方法,由所述开启模块开启所述网络连接模块,使所述终端与所述网络服务器建立网络连接,由所述语音输入单元输入语音;所述终端接收所述语音输入单元输入的语音并上传到网络服务器;所述终端与所述网络服务器并行对所述语音信息进行识别转换;所述网络服务器和所述终端共同执行或由所述终端传送或单独执行语音识别转换结果。本发明通过外部开启终端与所述网络服务器建立网络连接,然后输入语音,通过网络进行转换从而获取语音信息,本发明利用了网络语音转换的功能强大,效果好,同时,采用外部开启控制,通用性强。
【附图说明】
[0015]图1为本发明实施例中网络语音输入转换控制系统的结构示意图;
[0016]图2为本发明的流程图。
【具体实施方式】
[0017]下面结合具体实施例,对本发明技术方案进一步说明。
[0018]如图1所示,本发明的【具体实施方式】是:构建一种基于外部开启控制语音输入的网络语音转换控制系统,包括输入语音的语音输入单元1、传送语音信息的终端2、进行语音识别转换的网络服务器3,所述终端2包括连接所述网络服务器3的网络连接模块21、进行语音识别的第一语音转换单元24,所述语音输入单元1连接所述终端2,所述语音输入单元1包括开启所述网络连接模块建立网络连接的开启模块11,所述网络服务器3包括对接收的所述终端2传送的语音信息进行识别转换的第二语音转换单元31,所述开启模块11开启所述终端2的所述网络连接模块21建立网络连接,所述语音输入单元1输入语音,所述终端2将语音信息上传到的所述网络服务器3,所述网络服务器3的第二语音转换单元31将上传的语音信息进行识别转换,所述网络服务器3的第二语音转换单元31和所述终端2的第一语音转换单元24将语音信息并行进行识别转换,该语音识别转换结果由所述网络服务器3和所述终端2共同执行或由所述终端2单独执行。
[0019]如图1所示,本发明的具体实施过程是:所述语音输入单元1连接所述终端2,所述语音输入单元1输入语音信息,所述开启模块11开启所述终端2的网络连接模块21,所述终端2通过所述网络连接模块21与所述网络服务器3建立连接,所述终端2接收所述语音输入单元1输入的语音信息并传送到所述网络服务器3,所述网络服务器3接收所述终端2传送的语音信息,所述第二语音转换单元31与第一语音转换单元24将语音信息的并行进行识别转换,该识别转换结果包括指令或指令和参数,所述网络服务器3执行所述语音转换结果并将执行结果传送到所述终端2,同所述终端2执行或者将该执行结果再进行传送以完成所述网络服务器3和所述终端2共同执行该语音识别转换结果;所述网络服务器3将所述语音转换结果传送到所述终端2由所述终端2单独执行或者传送出去,具体来说,所述终端2对获取的语音转换结果进行执行实现控制,或者传送到其它设备进行执行实现控制。本发明具体实施例中,所述第二语音转换单元31包括进行语音识别的语音识别模块32,所述语音转换过程包括对接收的语音信息进行语音识别转换。所述语音输入单元1与所述终端2通过USB接口进行连接,所述语音输入单元1具备声卡的功能,将输入的语音信号转换后通过USB接收口传送到所述终端2。所述终端2为电脑、移动通讯终端、电子玩具终端、家用电器中的一种或多种。
[0020]如图1所示,本发明的优选实施方式是:所述终端2和所述网络服务器3的语音识别转换结果均包括语音识别转换的置信度。所谓置信度,也叫置信水平。它是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度.概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。语音识别转换的置信度即对语音识别转换结果真实性的相信程度。所述网络服务器3与所述终端2并行对语音信息进行识别转换时,所述终端2设置语音识别转换结果的置信度阈值,当所述终端2语音识别转换结果的置信度大于等于该置信度阈值时,取该语音识别转换结果,若所述网络服务器语音识别转换结果的置信度小于该置信度阈值时,取所述终端2语音识别转换结果的置信度和所述网络服务器3语音识别转换结果的置信度中较大值的语音识别转换结果。
[0021]如图1所示,本发明的优选实施方式是:在输入不能识别语音信息或不能执行的语音信息时,通过所述终端2输入语音进行交互语音,以获取所述网络服务器能执行的语音信息。比如,在输入“开机”语音信息时,若可能由于语音不清楚或者与标准语音差别过大,导致不能识别时,可以调用交互语音信息库进行提示再输入语音。再比如,在输入“现在打开故事吧”,此时,可能网络服务器3不能将该语音指令转换为控制指令,此时,需要补充输入语音信息,比如,调用交互信息库“您是想听故事吗?”这样语音交互提示,完成语音指令信息的补充,实现以自然语音即可控制终端。
[002
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1