一种语音识别的咨询的方法

文档序号：2827826阅读：355来源：国知局

一种语音识别的咨询的方法
【专利摘要】本发明公开了一种语音识别的咨询的方法，包括：第一步：对语音查询信息进行录音，并生成音频文件；第二步：根据音频文件进行语音识别，识别后生成文本文件；第三步：利用所述文本文件生成标准的SQL数据库查询语句并提交到数据库进行查询，并生成查询结果的文本文件；第四步：将所述查询结果的文本文件转换成可供语音卡播放的音频文件，并播放。该语音识别的咨询的方法，直接对语音进行识别及转换，减少了人工干预的操作，实现了语音信息查询的自动化，通过关键词查询，可以快速定位所需信息，提高了语音服务系统效率，减少了收听冗余提示音的时间，节省人工坐席时间及通话费用。
【专利说明】一种语音识别的咨询的方法

【技术领域】
[0001]本发明涉及信息技术【技术领域】，具体为一种语音识别的咨询的方法。

【背景技术】
[0002]随着我国信息化建设的快速发展，目前识别咨询在很多领域都有运用，但在实际的使用过程中存在如下问题:
1、语音服务系统有较多的操作需人工干预，系统的自动化程度较低；2、等待提示音时间较长，系统使用费用较昂贵；
3、数据量过多时，不能快速定位到用户所需信息，为此我们提出一种语音识别的咨询的方法。

【发明内容】

[0003]一种语音识别的咨询的方法，包括以下步骤:
第一步:对语音查询信息进行录音，并生成音频文件；
第二步:根据音频文件进行语音识别，识别后生成文本文件；
第三步:利用所述文本文件生成标准的SQL数据库查询语句并提交到数据库进行查询，并生成查询结果的文本文件；
第四步:将所述查询结果的文本文件转换成可供语音卡播放的音频文件，并播放。
[0004]优选的，所述第二步中进行语音识别的方式为:根据语音识别字库对音频文件进行全字符识别。
[0005]优选的，所述第二步中进行语音识别的方式为:自定义含关键词的语法文件对音频文件中的关键词进行识别。
[0006]优选的，所述音频文件为WAV格式文件。
[0007]优选的，所述语音识别后生成的文本文件为TXT格式文件。
[0008]优选的，所述含关键词的语法文件为XML格式文件。
[0009]与现有技术相比，本发明的有益效果是:该语音识别的咨询的方法，直接对语音进行识别及转换，减少了人工干预的操作，实现了语音信息查询的自动化，通过关键词查询，可以快速定位所需信息，提高了语音服务系统效率，减少了收听冗余提示音的时间，节省人工坐席时间及通话费用。

【专利附图】

【附图说明】
[0010]图1为本发明的流程图。

【具体实施方式】
[0011]本语音识别的咨询的方法的流程步骤如下:
第一步，对客户端语音查询信息进行录音，并生成音频文件，其中音频文件为WAV格式或其它常见的音频格式文件。
[0012]第二部，根据录音的音频文件进行语音识别，识别后生成文本文件。本实施例中调用微软的SAPI (The Microsoft Speech API)接口进行语音识别。有以下两种识别方式:1、听写模式，根据语音识别字库对音频文件进行全字符识别，但准确率较低，将识别结果按识别语言的编码存入新建的TXT文件；2、自定义关键词语法文件对音频文件中关键词进行识别，关键词语法文件一般为XML格式文件，内部第一层结构为定义识别的语言，例如:〈GRAMMAR LANGID = " 804" >，LANGID为识别语言的ID号，804代表中文；第二层结构为Rule Name,定义识别的关键词,基于关键词语首识别的识别率可达85%以上。在进行关键词识别前，关键词XML语法文件需调用SAPI中的IspeechRecoGra_ar接口进行初始化，语音识别时将录音的音频文件和XML语法文件作为上述SAPI接口参数(WAV录音音频文件路径和关键词XML语法文件路径)，如果识别次数超过3次仍不能匹配语法文件中的关键字，则自动放弃此次识别，返回空字符串，如果成功识别则返回识别结果并按识别语言的编码存入新建的TXT文件。
[0013]第三部，利用所述TXT文件生成标准的SQL数据库查询语句并提交到数据库进行查询，并生成查询结果文本文件。在语音信息服务业务中对预先设定好的数据库进行连接和对数据库进行必要的库操作。在操作前需先进行数据库的参数进行配置，配置参数有数据库的网络地址(IP Address),数据库名(DataBase Name),数据库连接端口(Port),数据库用户名(UserName)和密码(Password)等,配置好后自动连接设定的数据库进行查询，并生成查询结果的文本文件。
[0014]第四步:将所述查询结果的文本文件转换成可供语音卡播放的音频文件，本实施例中利用微软提供的DotNetSpeech类库中的SpFileStream函数，以所述查询结果的文本文件为参数，生成可供语音卡播放的音频文件，并向客户端播放。转换时的参数为需要生成语音文件的字符串(查询结果文本文件的内容)，以及存放路径，转换后便生成单声道8位的WAV格式的音频文件，通过语音卡向客户端播放。
【权利要求】
1.一种语音识别的咨询的方法，包括以下步骤: 第一步:对语音查询信息进行录音，并生成音频文件；第二步:根据音频文件进行语音识别，识别后生成文本文件；第三步:利用所述文本文件生成标准的SQL数据库查询语句并提交到数据库进行查询，并生成查询结果的文本文件；第四步:将所述查询结果的文本文件转换成可供语音卡播放的音频文件，并播放，优选的，所述第二步中进行语音识别的方式为:根据语音识别字库对音频文件进行全字符识别。
2.根据权利要求1所述的一种语音识别的咨询的方法，其特征在于:所述第二步中进行语音识别的方式为:根据语音识别字库对音频文件进行全字符识别。
3.根据权利要求1所述的一种语音识别的咨询的方法，其特征在于:所述第二步中进行语音识别的方式为:自定义含关键词的语法文件对音频文件中的关键词进行识别。
4.根据权利要求1-3所述的一种语音识别的咨询的方法，其特征在于:所述音频文件为WAV格式文件。
5.根据权利要求1-3所述的一种语音识别的咨询的方法，其特征在于:所述语音识别后生成的文本文件为TXT格式文件。
6.根据权利要求3所述的一种语音识别的咨询的方法，其特征在于:所述含关键词的语法文件为XML格式文件。
【文档编号】G10L15/26GK104269171SQ201410492217
【公开日】2015年1月7日申请日期:2014年9月24日优先权日:2014年9月24日
【发明者】朱龙腾申请人:上海伯释信息科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱龙腾;
技术所有人：上海伯释信息科技有限公司;
我是此专利的发明人