耳机全语音手机拨号交互应用的方法

文档序号:2831319阅读:595来源:国知局
专利名称:耳机全语音手机拨号交互应用的方法
技术领域
本发明涉及无线通信技术领域,特别是一种耳机全语音手机拨号交互应用的方法。
背景技术
近年来语音识别技术得到了巨大的发展,并且在手机等嵌入式领域大量普及,其中语音拨号程序更是逐渐成为高端智能手机的必备功能之一。使用语音拨号方便,快捷,不需记忆繁琐的电话号码,也不需要从屏幕上一页页的查找联系人,极大的提高了人们的沟通效率。
在很多特殊环境中,我们甚至希望彻底解放我们的双手,在不拿出手机,不看手机屏幕的情况下,也能实现这一功能,例如在驾驶过程中。因此,在现在大部分手机都配备数字耳机或者蓝牙耳机等无线耳机的情况下,全语音手机拨号功能能够利用ASR和TTS等高科技技术给手机使用者带来最大的灵活性。

发明内容
本发明的目的在于提出一种新的手机拨号解决方案,使得在不依靠屏幕,只在耳机的配合下,实现完整的手机拨号流程。
该发明的技术要点是,首先通过耳机上的按键触发整个流程,然后通过语音和手机进行交互,直到完成拨号功能。在交互的开始,手机播放提示音,请用户说出要拨打的人名,用户说出人名之后手机开始进行语音识别,然后用TTS反馈刚才用户所说人名,并询问是否拨号,拨打手机,办公室,家中的哪一个号码,根据用户的语音选择完成整个拨号功能。
本发明提出来一种通过使用ASR(Automation Speech Recognition)自动语音识别和TTS TTS(Text To Speech)语音合成技术实现只使用耳机拨打任意手机联系人的操作方式,属于嵌入式手机语音应用领域。发明的基本特征是在不看手机屏幕的前提下,通过耳机按键以及语音提示交互实现完整的手机拨号功能,拨打任意SIM卡上和手机地址本中的联系人。
一种耳机全语音手机拨号交互应用的方法,其特征是,完全依靠语音来实现的流程,集成语音识别以及合成技术,无缝支持无线耳机,支持打断功能。
根据对背景噪音评估自动选择播放音大小(支持用户自定义)。
通过使用耳机上的按键触发语音交互流程,以后的操作可以全部利用语音。
该解决方案还包括以下一些技术要点1.集成ASR和TTS技术ASR技术是全耳机拨号解决方案的核心技术,通过语音识别技术理解用户所说的话,并直接完成拨号功能。TTS技术用来完成手机到人的反馈提示等,也是交互不可或缺的。在该方案中,ASR和TTS直接取代了手机按键以及手机屏幕,实现全语音交互。
2.和无耳机模式无缝集成当用户把耳机插入到耳机插孔时,自动切换到全语音拨号模式,此时意味着用户只通过耳机就能完成拨打电话和接听电话。当用户拔出耳机时,自动切换到非耳机模式,此时意味着用户可以通过屏幕和手机按键进行更多的操作。用户连接接或者断开无线耳机也能达到同样的效果。
3.支持无线耳机只要耳机带有录音功能和一个按键,就能够使用全耳机拨号功能。因此该方案支持蓝牙耳机等无线耳机。
4.支持打断功能在手机播放提示的过程中,用户可以随时说话,此时手机将停止播放,对刚才用户所说的话进行语音识别,并作相应的处理。打断功能能够使熟练使用的用户更加快速完成任务。


图1是本发明的耳机全语音手机拨号交互应用的方法流程图。
具体实施例方式
图1的耳机全语音手机拨号交互应用的方法,其步骤如下(1)触发流程用户按耳机上的键时,语音提示“请问你找谁?”,此时用户开始说话,如果用户在一定时间内不说话,语音提示“超时退出”,并退出整个交互流程;(2)用户开始说话并进行语音识别;(3)识别出人名以后的处理流程如果系统中存在同名或者发音相同的人名,此时用语音无法完全判断是哪个人,系统将语音提示“某某某,存在发音相同人名,请用手机选择”,然后退出耳机模式;(4)在步骤(3)中不存在同名的情况下,根据此人电话号码进行如下提示,(假设识别结果为小王)只有一个电话号码,提示为“小王,拨号或者退出”,有两个号码,提示为以下之一“小王,手机,办公室或者退出”、“小王,手机,家里或者退出”、“小王,办公室,家里或者退出”,有三个号码,提示为“小王,手机,家里,办公室或者退出”;(5)在步骤(4)播放提示的同时,如果用户按耳机上的键,将直接拨号,有多个号码时拨第一个号码;(6)在步骤(4)播放提示的同时,如果用户开始说话,将停止剩下的播放,直接进行语音识别,并进入后面的流程。和提示播放完全结束以后说话效果相同;(7)在步骤(6)完成之后,根据识别结果进行不同的处理,如果为拨号,手机,家里,办公室之一,将进行拨号,并退出流程,如果识别结果为“退出”,播放提示“退出”,并退出流程;(8)如果用户在一定时间内没有说话,将播放提示音“超时退出”,并退出整个流程。
权利要求
1.一种耳机全语音手机拨号交互应用的方法,其特征是,完全依靠语音来实现的流程,集成语音识别以及合成技术,无缝支持无线耳机,支持打断功能。
2.根据权利要求1所述的耳机全语音手机拨号交互应用的方法,其特征在于,根据对背景噪音评估自动选择播放音大小。
3.根据权利要求1所述的耳机全语音手机拨号交互应用的方法,其特征在于,通过使用耳机上的按键触发语音交互流程,以后的操作可以全部利用语音。
4.根据权利要求1所述的耳机全语音手机拨号交互应用的方法,其步骤如下(1)触发流程用户按耳机上的键时,语音提示“请问你找谁?”,此时用户开始说话,如果用户在一定时间内不说话,语音提示“超时退出”,并退出整个交互流程;(2)用户开始说话并进行语音识别;(3)识别出人名以后的处理流程如果系统中存在同名或者发音相同的人名,此时用语音无法完全判断是哪个人,系统将语音提示“某某某,存在发音相同人名,请用手机选择”,然后退出耳机模式;(4)在步骤(3)中不存在同名的情况下,根据此人电话号码进行如下提示,(假设识别结果为小王)只有一个电话号码,提示为“小王,拨号或者退出”,有两个号码,提示为以下之一“小王,手机,办公室或者退出”、“小王,手机,家里或者退出”、“小王,办公室,家里或者退出”,有三个号码,提示为“小王,手机,家里,办公室或者退出”;(5)在步骤(4)播放提示的同时,如果用户按耳机上的键,将直接拨号,有多个号码时拨第一个号码;(6)在步骤(4)播放提示的同时,如果用户开始说话,将停止剩下的播放,直接进行语音识别,并进入后面的流程。和提示播放完全结束以后说话效果相同;(7)在步骤(6)完成之后,根据识别结果进行不同的处理,如果为拨号,手机,家里,办公室之一,将进行拨号,并退出流程,如果识别结果为“退出”,播放提示“退出”,并退出流程;(8)如果用户在一定时间内没有说话,将播放提示音“超时退出”,并退出整个流程。
全文摘要
本发明涉及无线通信技术领域,特别是一种耳机全语音手机拨号交互应用的方法。完全依靠语音来实现的流程,集成语音识别以及合成技术,无缝支持无线耳机,支持打断功能。步骤包括(1)触发流程;(2)用户开始说话并进行语音识别;(3)识别出人名以后的处理流程;(4)在不存在同名的情况下,根据此人电话号码进行如下提示拨号;(5)在播放提示的同时,将直接拨号;(6)在播放提示的同时,如果用户开始说话,将停止剩下的播放;(7)在完成之后,根据识别结果进行不同的处理,将进行拨号,并退出流程;(8)如果用户在一定时间内没有说话,将播放提示音“超时退出”,并退出整个流程。
文档编号G10L15/00GK1801846SQ20041010187
公开日2006年7月12日 申请日期2004年12月30日 优先权日2004年12月30日
发明者徐波, 谢传泉, 张东泉, 普剑涛, 张亮, 张建 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1