数字双向智能语音讲解系统及其方法

文档序号：2835991阅读：314来源：国知局

专利名称：数字双向智能语音讲解系统及其方法
技术领域：
本发明涉及语音讲解系统，主要应用于各种场馆，对产品、展品的智能语音讲解和智能人机语音交互。
背景技术：
随着电子技术和信息技术的不断发展，特别是语音识别算法和语音合成算法的发展，用其取代重复的人力劳动，并能体现其人性化的操作。市面上也有类似的讲解系统，但大多是基于语音存储与调用的方式，这种架构，语音发音是预先存放在存储器中的语音数据文件的调用，发音也比较死板，系统人性化和可维护性差。也有系统基于TTS，但算法必须依托与PC完成，在具体应用中，系统成本高，特别是上一定规模的系统，稳定性也无法保证。

发明内容
本发明要解决的技术问题是提供一种数字双向智能语音讲解系统，其各终端装
置可独立工作。本发明为解决上述技术问题所采取的技术方案为数字双向智能语音讲解系统，包括PC服务器和终端装置，其特征在于所述的PC服务器包括网络接口单元，用于PC服务器与各终端装置间的通讯；发音文本库，用于预先存放需要播放的文本文件及其对应的终端号；语音识别关键字库，用于预先存放各终端装置语音识别关键字及其对应的终端号；终端监控管理单元，用于监控和管理各终端装置的在线状态和运行状态；终端设备数据库，用于存放各终端号、状态信息、当前发音文本编号和当前识别关键字编号；所述的终端装置包括网络通讯单元，用于与PC服务器之间的通讯；存储单元，用于存放由网络通讯单元传递过来的发音文本和语音识别关键字；TTS发音单元，用于将发音文本进行语音合成，输出数字语音信号；拾音单元，用于等待用户发出的语音命令并进行本地语音采集；语音识别单元，用于将拾音单元采集到的语音信息进行建模识别，将识别后的结果与识别项进行对比，然后触发TTS发音单元进行语音合成；触发接收单元，用于本地触发控制音频切换单元，选择由机器自动讲解和人工讲解两种方式；D/A转换单元，用于将 TTS发音单元输出的数字语音信号转换成模拟语音信号；音频切换单元，用于切换机器合成的模拟语音信号和人工麦克风的模拟语音信号；功放单元，用于将音频切换单元输出的模拟语音信号进行功率放大，并传送给喇叭。所述的各终端装置的运行状态包括异常状态、讲解状态、识别状态和待机状态。数字双向智能语音讲解方法，其特征在于它包括以下步骤步骤1、从配置好的发音文本库和语音识别关键字库选择需要发音的发音文本、语音识别关键字和相应终端号进行绑定；步骤2、终端装置的网络通讯单元与PC服务器的网络接口单元通信，从PC服务器下载其对应终端号的语音识别关键字和发音文本，并存放在存储单元；
步骤3、拾音单元接收讲解员的语音控制命令；步骤4、语音识别单元对接收的语音控制命令识别后，在存储单元中根据识别结果找到对应的发音文本，并将发音文本储存地址传递给TTS发音单元；步骤5、TTS发音单元将对应的发音文本转换成数字语音信号并传递给D/A转换单元转换为模拟语音信号；步骤6、判断触发接收单元是否接收到触发信号若有则由音频切换单元将拾音单元接收到的语音控制命令直接传送到功放单元进行本地扩声；若无则由D/A转换单元将已转换的模拟语音信号传给功放单元进行功率放大，并传送给喇叭进行播放；步骤7、PC服务器的终端监控单元时刻监测所有终端装置，定时发送查询命令给每一个终端装置，然后等待对应终端装置的返回命令，并将对应终端的在线状态和运行状态保存在终端设备数据库中；本发明的有益效果为1、本系统基于TTS，其中PC服务器仅供管理和配置相应文件，各终端装置可独立工作，具备更好的稳定性。2、与现有讲解系统只能按照预存的发音文本进行发音讲解不同，本系统各终端装置可选择按预存发音文本发音，或者直接将讲解员的现场声音进行扩音，不受机器干扰，以满足需求最大化和在设备出现故障时的应急措施。3、发音文件以文本的形式存放和管理，占用资源小，应用灵活性强，可维护性强；可以通过修改文本即可改变发声内容。4、语音识别关键字以文本形式存放和管理，可根据场馆不同需求进行配置修改，甚至当场管中展品有所变动时，同样能通过服务器快速配置，灵活性非常大。

图1为终端装置结构框图。图2为PC服务器结构框图。图3为PC服务器系统流程图。图4为终端装置系统流程图。
具体实施例方式本实施例包括如图2所示的PC服务器和如图1所示的终端装置，终端装置可根据需要设置多个，每个终端装置设有一个终端号。PC服务器包括网络接口单元，用于PC服务器与各终端装置间的通讯；发音文本库，用于预先存放需要播放的文本文件及其对应的终端号；语音识别关键字库，用于预先存放各终端装置语音识别关键字及其对应的终端号；终端监控管理单元，用于监控和管理各终端装置的在线状态和运行状态；终端设备数据库，用于存放各终端号、状态信息、当前发音文本编号和当前识别关键字编号。终端装置包括网络通讯单元，用于与PC服务器之间的通讯；存储单元，用于存放由网络通讯单元传递过来的发音文本和语音识别关键字；TTS发音单元，用于将发音文本进行语音合成，输出数字语音信号；拾音单元，用于等待用户发出的语音命令并进行本地语音采集；语音识别单元，用于将拾音单元采集到的语音信息进行建模识别，将识别后的结果与识别项进行对比，然后触发TTS发音单元进行语音合成；触发接收单元，用于本地触发控制音频切换单元，选择由机器自动讲解和人工讲解两种方式；D/A转换单元，用于将TTS发音单元输出的数字语音信号转换成模拟语音信号；音频切换单元，用于切换机器合成的模拟语音信号和人工麦克风的模拟语音信号；功放单元，用于将音频切换单元输出的模拟语音信号进行功率放大，并传送给喇叭。图3为PC服务器系统流程图，图4为终端装置系统流程图，将二者流程相结合构成数字双向智能语音讲解方法，包括以下步骤步骤1、从配置好的发音文本库和语音识别关键字库选择需要发音的发音文本、语音识别关键字和相应终端号进行绑定；步骤2、终端装置的网络通讯单元与PC服务器的网络接口单元通信，从PC服务器下载其对应终端号的语音识别关键字和发音文本，并存放在存储单元；步骤3、拾音单元接收讲解员的语音控制命令；步骤4、语音识别单元对接收的语音控制命令识别后，在存储单元中根据识别结果找到对应的发音文本，并将发音文本储存地址传递给TTS发音单元；步骤5、TTS发音单元将对应的发音文本转换成数字语音信号并传递给D/A转换单元转换为模拟语音信号；步骤6、判断触发接收单元是否接收到触发信号若有则由音频切换单元将拾音单元接收到的语音控制命令直接传送到功放单元进行本地扩声；若无则由D/A转换单元将已转换的模拟语音信号传给功放单元进行功率放大，并传送给喇叭进行播放；步骤7、PC服务器的终端监控单元时刻监测所有终端装置，定时发送查询命令给每一个终端装置，然后等待对应终端装置的返回命令，并将对应终端装置的在线状态和运行状态保存在终端设备数据库中；以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改，等同替换，改进等均应包含在本发明的保护范围之内。
权利要求
1.数字双向智能语音讲解系统，包括PC服务器和终端装置，其特征在于所述的PC服务器包括网络接口单元，用于PC服务器与各终端装置间的通讯；发音文本库，用于预先存放需要播放的文本文件及其对应的终端号；语音识别关键字库，用于预先存放各终端装置语音识别关键字及其对应的终端号；终端监控管理单元，用于监控和管理各终端装置的在线状态和运行状态；终端设备数据库，用于存放各终端号、状态信息、当前发音文本编号和当前识别关键字编号；所述的终端装置包括网络通讯单元，用于与PC服务器之间的通讯；存储单元，用于存放由网络通讯单元传递过来的发音文本和语音识别关键字；TTS发音单元，用于将发音文本进行语音合成，输出数字语音信号；拾音单元，用于等待用户发出的语音命令并进行本地语音采集；语音识别单元，用于将拾音单元采集到的语音信息进行建模识别，将识别后的结果与识别项进行对比，然后触发TTS发音单元进行语音合成；触发接收单元，用于本地触发控制音频切换单元，选择由机器自动讲解和人工讲解两种方式；D/A转换单元，用于将TTS 发音单元输出的数字语音信号转换成模拟语音信号；音频切换单元，用于切换机器合成的模拟语音信号和人工麦克风的模拟语音信号；功放单元，用于将音频切换单元输出的模拟语音信号进行功率放大，并传送给喇叭。
2.根据权利要求1所述的数字双向智能语音讲解系统，其特征在于所述的各终端装置的运行状态包括异常状态、讲解状态、识别状态和待机状态。
3.数字双向智能语音讲解方法，其特征在于它包括以下步骤步骤1、从配置好的发音文本库和语音识别关键字库选择需要发音的发音文本、语音识别关键字和相应终端号进行绑定；步骤2、终端装置的网络通讯单元与PC服务器的网络接口单元通信，从PC服务器下载其对应终端号的语音识别关键字和发音文本，并存放在存储单元；步骤3、拾音单元接收讲解员的语音控制命令；步骤4、语音识别单元对接收的语音控制命令识别后，在存储单元中根据识别结果找到对应的发音文本，并将发音文本储存地址传递给TTS发音单元；步骤5、TTS发音单元将对应的发音文本转换成数字语音信号并传递给D/A转换单元转换为模拟语音信号；步骤6、判断触发接收单元是否接收到触发信号若有则由音频切换单元将拾音单元接收到的语音控制命令直接传送到功放单元进行本地扩声；若无则由D/A转换单元将已转换的模拟语音信号传给功放单元进行功率放大，并传送给喇叭进行播放；步骤7、PC服务器的终端监控单元时刻监测所有终端装置，定时发送查询命令给每一个终端装置，然后等待对应终端装置的返回命令，并将对应终端的在线状态和运行状态保存在终端设备数据库中。
全文摘要
本发明提供一种数字双向智能语音讲解系统，包括PC服务器和终端装置，基于TTS，其中PC服务器仅供管理和配置相应文件，各终端装置可独立工作，具备更好的稳定性。与现有讲解系统只能按照预存的发音文本进行发音讲解不同，本系统各终端装置可选择按预存发音文本发音，或者直接将讲解员的现场声音进行扩音，不受机器干扰，以满足需求最大化和在设备出现故障时的应急措施。发音文件以文本的形式存放和管理，占用资源小，应用灵活性强，可维护性强；可以通过修改文本即可改变发声内容。语音识别关键字以文本形式存放和管理，可根据场馆不同需求进行配置修改，甚至当场管中展品有所变动时，同样能通过服务器快速配置，灵活性非常大。
文档编号G10L13/08GK102436808SQ20111035317
公开日2012年5月2日申请日期2011年11月9日优先权日2011年11月9日
发明者吕杰, 吴海涛, 陆德宝申请人:武汉安通科技产业发展有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陆德宝;吕杰;吴海涛
技术所有人：武汉安通科技产业发展有限公司
我是此专利的发明人

上一篇：电动滚刷拉弦器的制作方法
上一篇：用于钢琴辅助教学仪的外壳组件的制作方法