基于网络的语音提醒的方法和系统的制作方法

文档序号:7898810阅读:434来源:国知局
专利名称:基于网络的语音提醒的方法和系统的制作方法
技术领域
本发明涉及一种语音提醒技木,尤其涉及一种在网络的云端服务器进行语音识别并在终端进行语音提醒的方法和系统。
背景技术
在一些电子设备上通常有备忘录的功能(或称为提醒功能),用户输入需要提醒的信息并设置提醒的时间点。在设置的时间点到达时,电子设备会通过某种提醒方式(例如闹铃)来提醒用户有提醒事件发生,具体的内容会在电子设备的屏幕上显示出来。这种提醒方式存在以下的不便之处1、这种方式需要用户在电子设备的软件中文字输入提醒内容和选择提醒的时间点,输入方式繁琐。如果应用环境是在车辆的行驶过程中,则车主进行提醒设置会带来行车安全上的问题。2、这种方式的提醒方式不够直接,当提醒闹铃开启吋,用户无法直接获知提醒的内容,而需要按下相应的按键,进入到当前提醒条目中来查看提醒的内容。同样的,如果应用环境是在车辆的行驶过程中,则车主进入提醒软件查看提醒内容也会带来行车安全上的问题。此外,大多数电子设备的语音识别的引擎通常都设计在设备内部,如果需要识别率较高的语音技术,则需要电子设备耗费大量的资源。通常终端处理器的处理能力有限,无法满足需要耗费大量资源的语音识別。

发明内容
本发明的目的在于解决上述问题,提供了ー种基于网络的语音提醒的方法,方便了用户输入提醒的方式,在不增加终端负担的情况下提升了语音识别的识别率,还增强了提醒用户的直观感受。本发明的另一目的在于提供了ー种基于网络的语音提醒的系统。本发明的技术方案为本发明掲示了ー种基于网络的语音提醒的方法,包括终端接收用户的语音输入,并将语音输入的数据传输给云端; 云端根据语音输入识别其中的内容信息并将识别出的内容信息传输到终端;终端存储传输来的内容信息,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。根据本发明的基于网络的语音提醒的方法的ー实施例,存储在终端的语音输入的内容信息导出到电脑端。根据本发明的基于网络的语音提醒的方法的ー实施例,在接收用户的语音输入之后且在传输到云端之前,还包括对语音输入进行降噪处理。根据本发明的基于网络的语音提醒的方法的ー实施例,提醒的方式是通过终端的扬声器进行音频播放的方式来实现。
根据本发明的基于网络的语音提醒的方法的ー实施例,终端是车载终端,云端是云端服务器。本发明还掲示了ー种基于网络的语音提醒的系统,包括终端系统和云端系统,终端系统包括语音输入装置、终端数据传输模块、存储模块、提醒模块,云端系统包括云端数据传输模块、语音引擎语音输入装置,接收用户输入的语音资料;终端数据传输模块,将用户输入的语音资料上传到云端系统,并接收云端系统传来的识别出的内容信息;存储模块,存储识别出的内容信息; 提醒模块,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息;云端数据传输模块,接收终端上传的用户输入的语音资料,并将语音引擎识别出的内容信息传输给终端系统;语音引擎,根据语音输入识别其中的内容信息。根据本发明的基于网络的语音提醒的系统的ー实施例,该终端系统还包括数据传输接ロ,耦接存储模块,将存储模块中的资料传输到外部设备。根据本发明的基于网络的语音提醒的系统的ー实施例,该终端系统还包括降噪模块,耦接语音输入装置和终端数据传输模块,对语音输入进行降噪处理。根据本发明的基于网络的语音提醒的系统的ー实施例,该终端系统是车载终端系统。本发明对比现有技术有如下的有益效果本发明的技术方案是先由终端接收用户的语音输入,将语音输入传输到云端,云端对语音输入进行语音识别,并将识别出的内容信息传输回终端,在终端对识别出的内容信息进行存储。终端根据识别出的内容信息,借助音频播放设备进行提醒,提醒的内容就是识别出的内容信息。对比现有技木,本发明一方面用语音输入替代了传统的文字输入,一方面用语音提醒替代了传统的需要用户浏览的提醒方式,一方面减轻了终端的处理负担,将语音识别的任务交给云端去处理。


图1示例性的示出了本发明的基于网络的语音提醒的方法的第一实施例的流程图。图2示例性的示出了本发明的基于网络的语音提醒的方法的第二实施例的流程图。图3示例性的示出了本发明的基于网络的语音提醒的方法的第三实施例的流程图。图4示例性的示出了本发明的基于网络的语音提醒的系统的第一实施例的流程图。图5示例性的示出了本发明的基于网络的语音提醒的系统的第二实施例的流程图。图6示例性的示出了本发明的基于网络的语音提醒的系统的第三实施例的流程图。
具体实施例方式下面结合附图和实施例对本发明作进ー步的描述。基于网络的语咅提醒的方法的第一实施例图1示出了本发明的基于网络的语音提醒的方法的第一实施例。请參见图1,本实施例的基于网络的语音提醒的方法包括如下的步骤。步骤SlOO 终端接收用户的语音输入。在车载端,用户通过车载端上的音频输入接ロ输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这ー输入语音。步骤SlOl 终端将语音输入的数据传输给云端。终端通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云兄而。步骤S102 云端根据语音输入的数据识别其中的内容信息。在云端安装一个语音引擎,语音引擎接收上传的输入语音,识别出语音中包含的内容信息。语音引擎的语音识别技术是现有的技木。例如,语音引擎包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下对训练模块输入ー个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为単位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行捜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型參数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征, Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的捜索算法,产生拼音格形式的识别結果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行捜索,得到最后的理解结果。例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是ー 个提醒事件,提醒的内容是“今日下午3点有会议”。步骤S103 云端将识别出的内容信息传输到终端。步骤S104 终端存储传输来的内容信息。步骤S105 终端根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。云端识别出了这是ー个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发ー个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。基于网络的语咅提醒的方法的第二实施例图2示出了本发明的基于网络的语音提醒的方法的第二实施例。请參见图2,本实施例的基于网络的语音提醒的方法包括如下的步骤。步骤S200 终端接收用户的语音输入。在车载端,用户通过车载端上的音频输入接ロ输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这ー输入语音。步骤S201 终端将语音输入的数据传输给云端。终端通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云立面。步骤S202 云端根据语音输入的数据识别其中的内容信息。在云端安装一个语音引擎,语音引擎接收上传的输入语音,识别出语音中包含的内容信息。语音引擎的语音识别技术是现有的技木。例如,语音引擎包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下对训练模块输入ー个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为単位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行捜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型參数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征, Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的捜索算法,产生拼音格形式的识别結果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行捜索,得到最后的理解结果。例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是ー 个提醒事件,提醒的内容是“今日下午3点有会议”。步骤S203 云端将识别出的内容信息传输到终端。
步骤S204 终端存储传输来的内容信息。步骤S205 终端根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。云端识别出了这是ー个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发ー个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。步骤S206 终端将已存储的语音输入的内容信息导出到电脑端。提供给用户在电脑上进行备份和编辑的功能。基于网络的语咅提醒的方法的第三实施例图3示出了本发明的基于网络的语音提醒的方法的第三实施例。请參见图3,本实施例的基于网络的语音提醒的方法包括如下的步骤。步骤S300 终端接收用户的语音输入。在车载端,用户通过车载端上的音频输入接ロ输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这ー输入语音。步骤S301 终端对用户的语音输入进行降噪处理。步骤S302 终端将语音输入的数据传输给云端。终端通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云立面。步骤S303 云端根据语音输入的数据识别其中的内容信息。在云端安装一个语音引擎,语音引擎接收上传的输入语音,识别出语音中包含的内容信息。语音引擎的语音识别技术是现有的技木。例如,语音引擎包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下对训练模块输入ー个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为単位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行捜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型參数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征, Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的捜索算法,产生拼音格形式的识别結果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行捜索,得到最后的理解结果。例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是ー 个提醒事件,提醒的内容是“今日下午3点有会议”。步骤S304 云端将识别出的内容信息传输到终端。步骤S305 终端存储传输来的内容信息。步骤S306 终端根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。云端识别出了这是ー个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发ー个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。基于网络的语咅提醒的系统的第一实施例图4示出了本发明的基于网络的语音提醒的系统的第一实施例的原理。请參见图 4,本实施例的基于网络的语音提醒的系统包括终端系统10和云端系统12。终端系统10包括语音输入装置100、终端数据传输模块102、存储模块104以及提醒模块106。云端系统 12包括云端数据传输模块120和语音引擎122。终端系统10内部各个模块的连接关系是语音输入装置100耦接终端数据传输模块102、终端数据传输模块102耦接存储模块104、存储模块104耦接提醒模块106。云端系统12内部各个模块的连接关系是云端数据传输模块120耦接语音引擎 122。系统的运行过程如下。终端系统10的语音输入装置100接收用户的语音输入。在车载端,用户通过车载端上的音频输入接ロ输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这ー输入语音。终端系统10的终端数据传输模块102负责将语音输入的数据传输给云端。即,通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云端。云端系统12的云端数据传输模块120负责接收来自终端的语音输入数据,并由语音引擎122根据语音输入的数据识别其中的内容信息。语音引擎122的语音识别技术是现有的技木。例如,语音引擎122包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音単元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下对训练模块输入ー个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为単位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行捜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征, Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是一个提醒事件,提醒的内容是“今日下午3点有会议”。云端数据传输模块120负责将识别出的内容信息传输到终端系统10。终端系统10的存储模块104存储传输来的内容信息。提醒模块106根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。云端系统12识别出了这是一个提醒事件,且是提醒在今日下午3点有会议。因此, 在今日下午3点的时刻,车载端触发一个提醒事件,并且通过语音提醒的方式来告知用户, 即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。基于网络的语音提醒的系统的第二实施例图5示出了本发明的基于网络的语音提醒的系统的第二实施例的原理。请参见图 5,本实施例的基于网络的语音提醒的系统包括终端系统20和云端系统22。终端系统20包括语音输入装置200、终端数据传输模块202、存储模块204、提醒模块206和数据传输接口 208。云端系统22包括云端数据传输模块220和语音引擎222。终端系统20内部各个模块的连接关系是语音输入装置200耦接终端数据传输模块202、终端数据传输模块202耦接存储模块204、存储模块204耦接提醒模块206、存储模块204耦接数据传输接口 208。云端系统22内部各个模块的连接关系是云端数据传输模块220耦接语音引擎 222。系统的运行过程如下。终端系统20的语音输入装置200接收用户的语音输入。在车载端,用户通过车载端上的音频输入接口输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这一输入语音。终端系统20的终端数据传输模块202负责将语音输入的数据传输给云端。即,通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云端。云端系统22的云端数据传输模块220负责接收来自终端的语音输入数据,并由语音引擎222根据语音输入的数据识别其中的内容信息。语音引擎222的语音识别技术是现有的技术。例如,语音引擎222包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下对训练模块输入一个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为单位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行搜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征, Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是一个提醒事件,提醒的内容是“今日下午3点有会议”。云端数据传输模块220负责将识别出的内容信息传输到终端系统20。终端系统20的存储模块204存储传输来的内容信息。提醒模块206根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。云端系统22识别出了这是一个提醒事件,且是提醒在今日下午3点有会议。因此, 在今日下午3点的时刻,车载端触发一个提醒事件,并且通过语音提醒的方式来告知用户, 即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。终端系统20的数据传输接口 208将存储模块104中的数据导出到外部设备(例如电脑),由用户进行编辑处理。从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。基于网络的语音提醒的系统的第三实施例图6示出了本发明的基于网络的语音提醒的系统的第三实施例的原理。请参见图 6,本实施例的基于网络的语音提醒的系统包括终端系统30和云端系统32。终端系统30包括语音输入装置300、终端数据传输模块302、存储模块304、提醒模块306和降噪模块308。 云端系统32包括云端数据传输模块320和语音引擎322。终端系统30内部各个模块的连接关系是语音输入装置300耦接降噪模块308, 降噪模块308耦接终端数据传输模块302、终端数据传输模块302耦接存储模块304、存储模块304耦接提醒模块206。云端系统32内部各个模块的连接关系是云端数据传输模块320耦接语音引擎322。系统的运行过程如下。终端系统30的语音输入装置300接收用户的语音输入。在车载端,用户通过车载端上的音频输入接口输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这一输入语音。降噪模块308用于对输入的语音进行降噪处理。终端系统30的终端数据传输模块302负责将语音输入且经过降噪处理的数据传输给云端。即,通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云端。云端系统32的云端数据传输模块320负责接收来自终端的语音输入数据,并由语音引擎322根据语音输入的数据识别其中的内容信息。语音引擎322的语音识别技术是现有的技术。例如,语音引擎322包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下对训练模块输入一个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为单位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行搜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征,Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是一个提醒事件,提醒的内容是“今日下午3点有会议”。云端数据传输模块320负责将识别出的内容信息传输到终端系统30。终端系统30的存储模块304存储传输来的内容信息。提醒模块306根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。云端系统32识别出了这是一个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发一个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。 上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
权利要求
1.ー种基于网络的语音提醒的方法,包括终端接收用户的语音输入,并将语音输入的数据传输给云端; 云端根据语音输入识别其中的内容信息并将识别出的内容信息传输到终端; 终端存储传输来的内容信息,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。
2.根据权利要求1所述的基于网络的语音提醒的方法,其特征在于,存储在终端的语音输入的内容信息导出到电脑端。
3.根据权利要求1所述的基于网络的语音提醒的方法,其特征在干,在接收用户的语音输入之后且在传输到云端之前,还包括对语音输入进行降噪处理。
4.根据权利要求1所述的基于网络的语音提醒的方法,其特征在干,提醒的方式是通过终端的扬声器进行音频播放的方式来实现。
5.根据权利要求1-4中任一项所述的基于网络的语音提醒的方法,其特征在于,终端是车载终端,云端是云端服务器。
6.ー种基于网络的语音提醒的系统,包括终端系统和云端系统,终端系统包括语音输入装置、终端数据传输模块、存储模块、提醒模块,云端系统包括云端数据传输模块、语音引擎语音输入装置,接收用户输入的语音资料;终端数据传输模块,将用户输入的语音资料上传到云端系统,并接收云端系统传来的识别出的内容信息;存储模块,存储识别出的内容信息;提醒模块,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息;云端数据传输模块,接收终端上传的用户输入的语音资料,并将语音引擎识别出的内容信息传输给终端系统;语音引擎,根据语音输入识别其中的内容信息。
7.根据权利要求6所述的基于网络的语音提醒的系统,其特征在干,该终端系统还包括数据传输接ロ,耦接存储模块,将存储模块中的资料传输到外部设备。
8.根据权利要求6所述的基于网络的语音提醒的系统,其特征在干,该终端系统还包括降噪模块,耦接语音输入装置和终端数据传输模块,对语音输入进行降噪处理。
9.根据权利要求6-8中任一项所述的基于网络的语音提醒的系统,其特征在干,该终端系统是车载终端系统。
全文摘要
本发明公开了基于网络的语音提醒的方法和系统,方便了用户输入提醒的方式,在不增加终端负担的情况下提升了语音识别的识别率,还增强了提醒用户的直观感受。其技术方案为方法包括终端接收用户的语音输入,并将语音输入的数据传输给云端;云端根据语音输入识别其中的内容信息并将识别出的内容信息传输到终端;终端存储传输来的内容信息,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。
文档编号H04L29/08GK102571882SQ20101062202
公开日2012年7月11日 申请日期2010年12月31日 优先权日2010年12月31日
发明者张晔晖 申请人:上海博泰悦臻电子设备制造有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1