一种捕捉关键词的中文语音应用于浏览器的方法

文档序号：2827736阅读：359来源：国知局

一种捕捉关键词的中文语音应用于浏览器的方法
【专利摘要】本发明公开了一种捕捉关键词的中文语音应用于浏览器的方法，该方法应用关键词捕捉模块，将用户输入的语音信号中包含入关键词即可达成，同时这种浏览器还能够有效去除无关的语音和背景噪声，提高语音浏览器系统的捕捉准确率。与连续语音识别相比，从连续语音信号中提取关键词相对来说较容易，能够达到很好的识别效果。
【专利说明】—种捕捉关键词的中文语音应用于浏览器的方法

【技术领域】
[0001]本发明涉及互联网通信【技术领域】，具体涉及一种捕捉关键词的中文语音应用于浏览器的方法。

【背景技术】
[0002]随着语音识别技术的不断发展，采用语音作为人机交互的手段已经越渐成俗，语音作为一种最自然的人机交互手段，收到越来越多的关注。
[0003]语音识别技术是实现人机交互的基础，语音识别是利用计算机从人的语音数据中提取信息，进而确定语音含义的过程。
[0004]语音识别可以应用在语音网页浏览器上，传统的网页浏览器采用鼠标作为交互手段，通过鼠标点击网页中的超级链接，跳转到相应的网页。使用鼠标作为交互式手段具有简单、快捷、直接的特点，但是却不是对任何人都适用的，比如双手不方便或者不太认识字的人。本发明针对这种双手不方便或者不太认识字的人，通过语音浏览器的设计解决了他们的用电脑的烦恼。
[0005]另外中文语音网页浏览器虽然也有发展，但是语音信号质量较低，连续语音识别比较困难。

【发明内容】

[0006]本发明针对以上的问题提供了一种捕捉关键词的中文语音应用于浏览器的方法，该方法应用关键词捕捉模块，将用户输入的语音信号中包含入关键词即可达成，同时这种浏览器还能够有效去除无关的语音和背景噪声，提高语音浏览器系统的捕捉准确率。与连续语音识别相比，从连续语音信号中提取关键词相对来说较容易，能够达到很好的识别效果O
[0007]本发明的目的通过以下技术方案来达到:
一种捕捉关键词的中文语音应用于浏览器的方法，采集语音信号，用计算机安装的声卡、麦克风将语音信号处理后传入缓冲区形成连续的语音信号待用，同时通过网络接口设备实现网页浏览器的内容浏览、并完成页面中超级链接的分析得到链接文字进而整理成链接子典以及网页定向功能；
将连续的语音信号从缓冲区传入端点检测模块进行处理并传输给关键词捕捉模块或者将语音信号交给门限检测模块进行消除杂音处理；所述端点检测模块负责将连续的语音信号进行切分成语音段存储再将语音段交给关键词捕捉模块进行处理；所述关键词捕捉模块输入包括关键词词表和切分出来的语音段，关键词捕捉模块的输出是捕捉到的关键词，将关键词词表和语音段进行信息对比即可捕捉到关键词；
关键词捕捉模块捕捉完成后，将捕捉到的关键词进行链接处理，再将链接处理的结果送至网页浏览器进行网页连接，实现关键词捕捉的语音浏览器的应用。
[0008]所述关键词捕捉模块包括特征提取子模块、连续语音识别子模块、关键词捕捉子模块。
[0009]所述特征提取子模块对语音信号进行特征提取，获得语音的特征矢量。
[0010]所述连续语音识别子模块能够识别拼音。
[0011]所述关键词捕捉子模块根据拼音和关键词词表进行关键词的捕捉。
[0012]本发明与现有技术相比，所具有以下的优点和有益效果:
本发明应用关键词捕捉模块，将用户输入的语音信号中包含入关键词即可达成，同时这种浏览器还能够有效去除无关的语音和背景噪声，提高语音浏览器系统的捕捉准确率。与连续语音识别相比，从连续语音信号中提取关键词相对来说较容易，能够达到很好的识别效果。

【具体实施方式】
[0013]下面结合实施例对本发明作进一步的详细说明，但本发明的实施方式不限于此。
[0014]实施例1
一种捕捉关键词的中文语音应用于浏览器的方法，采集语音信号，用计算机安装的声卡、麦克风将语音信号处理后传入缓冲区形成连续的语音信号待用，同时通过网络接口设备实现网页浏览器的内容浏览、并完成页面中超级链接的分析得到链接文字进而整理成链接子典以及网页定向功能；
将连续的语音信号从缓冲区传入端点检测模块进行处理并传输给关键词捕捉模块或者将语音信号交给门限检测模块进行消除杂音处理；所述端点检测模块负责将连续的语音信号进行切分成语音段存储再将语音段交给关键词捕捉模块进行处理；所述关键词捕捉模块输入包括关键词词表和切分出来的语音段，关键词捕捉模块的输出是捕捉到的关键词，将关键词词表和语音段进行信息对比即可捕捉到关键词；
关键词捕捉模块捕捉完成后，将捕捉到的关键词进行链接处理，再将链接处理的结果送至网页浏览器进行网页连接，实现关键词捕捉的语音浏览器的应用。
[0015]关键词捕捉模块包括特征提取子模块、连续语音识别子模块、关键词捕捉子模块。
[0016]特征提取子模块对语音信号进行特征提取，获得语音的特征矢量。
[0017]连续语音识别子模块能够识别拼音。
[0018]关键词捕捉子模块根据拼音和关键词词表进行关键词的捕捉。
【权利要求】
1.一种捕捉关键词的中文语音应用于浏览器的方法，其特征在于:采集语音信号，用计算机安装的声卡、麦克风将语音信号处理后传入缓冲区形成连续的语音信号待用，同时通过网络接口设备实现网页浏览器的内容浏览、并完成页面中超级链接的分析得到链接文字进而整理成链接字典以及网页定向功能；将连续的语音信号从缓冲区传入端点检测模块进行处理并传输给关键词捕捉模块或者将语音信号交给门限检测模块进行消除杂音处理；所述端点检测模块负责将连续的语音信号进行切分成语音段存储再将语音段交给关键词捕捉模块进行处理；所述关键词捕捉模块输入包括关键词词表和切分出来的语音段，关键词捕捉模块的输出是捕捉到的关键词，将关键词词表和语音段进行信息对比即可捕捉到关键词；关键词捕捉模块捕捉完成后，将捕捉到的关键词进行链接处理，再将链接处理的结果送至网页浏览器进行网页连接，实现关键词捕捉的语音浏览器的应用。
2.根据权利要求1所述的一种捕捉关键词的中文语音应用于浏览器的方法，其特征在于:所述关键词捕捉模块包括特征提取子模块、连续语音识别子模块、关键词捕捉子模块。
3.根据权利要求2所述的一种捕捉关键词的中文语音应用于浏览器的方法，其特征在于:所述特征提取子模块对语音信号进行特征提取，获得语音的特征矢量。
4.根据权利要求3所述的一种捕捉关键词的中文语音应用于浏览器的方法，其特征在于:所述连续语音识别子模块能够识别拼音。
5.根据权利要求4所述的一种捕捉关键词的中文语音应用于浏览器的方法，其特征在于:所述关键词捕捉子模块根据拼音和关键词词表进行关键词的捕捉。
【文档编号】G10L15/26GK104166724SQ201410422240
【公开日】2014年11月26日申请日期:2014年8月26日优先权日:2014年8月26日
【发明者】黄其申请人:四川亿信信用评估有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄其
技术所有人：四川亿信信用评估有限公司
我是此专利的发明人