一种语音控制方法、装置及移动终端的制作方法

文档序号:2837318阅读:265来源:国知局
专利名称:一种语音控制方法、装置及移动终端的制作方法
技术领域
本发明属于语音控制技术领域,尤其涉及一种语音控制方法、装置及移动 终端。
背景技术
现有技术中,由于语音识別技术尚无法识別整个语句,匹配多个音节的键 元素非常困难,如"设置周边检索的范围"等多个音节的键元素无法识別。且 匹配的目标键元素越多,识别率越低,故复杂功能的软件和硬件设备无法设置 很多的目标键元素,所以只能将有限的几个功能设置成语音识别的功能,导致 无法完全用语音进行所有功能的控制。
在接收到用户的语音输入后,计算机精确斥企索到用户语音输入的目标命令, 将这些目标命令作为指令词库内的键元素,查找出相关指令词集并通过专有界 面输出这些最终相关的指令词集供用户选择或确认,然后匹配、响应用户进一 步选择或确认的指令词,实现交互控制。
譬如用户语音输入"目的地",现有技术将"目的地"作为键元素,搜 索与其有关的、已预先建立关联并存储的关联命令,此时,专有界面将可能展 示"快拼检索"、"周边,,,"地址簿,,,"家,,,"办公室,,等关联指令条 目。由于现有语音识别无法识別很多音节的元素,且存在由于个人发音特点而 导致的语音识别匹配度差,需要通过专有界面再一次展现最终相关的指令词, 等待用户进一步精确指定,因此导致了4喿作过程烦瑣。
另一方面,现有技术中,由于存在很多的关联指令条目,但用户在同一枯 燥的专有界面下,根本无法记忆、联想到如此众多的关联指令条目。
综上所述,现有技术中,能够进行语音识别的功能非常有限,无法完全实 现语音对复杂软件和硬件的控制,且语音控制的方法匹配度差,以及需要用户 进一步确认,因而操作效率很低,适用性极差,容易导致误操作,在导航系统 中使用时会造成沿错误路径导航和导航到错误的目的地,甚至诱发交通事故。

发明内容
本发明实施例的目的在于提供一种语音控制方法,旨在解决现有技术中无 法完全实现语音对复杂软件和硬件的控制,且语音控制的方法匹配度差,以及 需要用户进一步确认,操作效率很低,适用性极差,容易导致误操作的问题。
本发明实施例是这样实现的, 一种语音控制方法,其特征在于,所述方法
包括以下步骤
将控制符号和与其关联的编号进行显示,其中,所述编号对应有语音指令;
接收并识别语音指令;
根据所述语音指令查找相应的编号;
根据所述编号查找相应的控制符号;
根据所述控制符号执行相应操作。
本发明实施例的另一目的在于提供一种语音控制装置,其包括语音识别模 块,用于接收语音输入,根据该语音输入匹配相应的语音指令,所述装置还包 括
编号显示模块,用于将控制符号和与其关联的编号进行显示,其中,所述 编号对应有语音指令;
编号查找^t块,用于根据接收到的语音指令查找相应的编号;
控制符号查找才莫块,用于才艮据所述编号查找相应的控制符号;
操作执行才莫块,用于根据所述控制符号执行相应操作。
本发明实施例的另一目的在于提供一种移动终端,所述移动终端还包括有 一种语音控制装置,其包括语音识别模块,用于接收语音输入,根据该语音输
入匹配相应的语音指令,所述装置还包括
编号显示模块,用于将控制符号和与其关联的编号进行显示,其中,所述
编号对应有语音指令;
编号查找模块,用于根据接收到的语音指令查找相应的编号;
控制符号查找模块,用于一艮据所述编号查找相应的控制符号;
操作执行模块,用于根据所述控制符号执行相应操作。
本发明实施例通过将控制符号和与其关联的编号进行显示,在用户进行语 音输入后,接收并识别语音指令,根据该语音指令查找相应的编号,根据查找 到的编号查找相应的控制符号,并根据查找到的控制符号执行相应操作,实现 了语音完全对复杂的多界面多按键功能的软件和硬件的控制,且将复杂的语音 《建元素转化为有限的几个符号,增加了匹配度,不再需用户进一步确认,节约 了使用的时间成本,增加了语音控制的适用性。


图1是本发明实施例提供的语音控制方法的流程图; 图2是本发明实施例提供的实质功能界面图A; 图3是本发明实施例提供的实质功能界面图B; 图4是本发明实施例提供的移动终端的结构图。
具体实施例方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅 仅用以解释本发明,并不用于限定本发明。
本发明实施例为一运行在Window CE上的导航软件,通过将控制符号和与 其关联的编号进行显示,在用户进行语音输入后,接收并识别语音指令,根据 该语音指令查找相应的编号,根据查找到的编号查找相应的控制符号,并根据
查找到的控制符号执行相应操作。
图1示出了本发明实施例提供的移动终端控制方法的流程,详述如下。
在步骤S101中,将实施例的控制符号与语音指令建立关联,并将建立的
关联关系进行存储。其中,实施例的控制符号包括软件和硬件的按钮和按键。 在具体实施过程中,需要确立按钮类型及按键类型的控制符号的编号方案,
并建立各编号和语音指令的关联关系。
本发明实施例也充许采用多个编号方案,并根据交互界面的需要进行动态
切换激活,譬如编号方案可以为阿拉伯数字,希腊数字,或者适合界面的"上
一步、下一步,,"春、夏、秋、冬,,,"东、南、西、北,,,以及针对按键的
"上,下,左,右,确定","Up, Down, Left, Down, OK"等。
各方案中编号也可以有对应多个语音指令的对应关系。譬如,编号方案同 时面向普通话用户及英语用户,那么编号为"2"的按4丑,母语为普通话的用户 发出"二(6r)"的语音指令可以操控,而母语为英文的用户发出"two[tu:]"的 语音指令也可以控制。
由于采用本发明实施例的编号方案较为简单明了 ,使用语音识别功能的失 误率大为减小,用户接受该方案也是轻而易举。
在控制符号的编号方案确定之后,再根据各界面上的按钮个数以及位置等 信息,对各界面上的按钮进行编号并进行存储,同时根据各界面的特点,对按 键进行编号并进行存储。
当然,如果某些界面釆用一些有规律性的编号方案,实施例可以在运行时 自动确立按钮与编号的对应关系。例如,本实施例中某些界面通过使用Windows 编程接口 EnumChildWindows ()枚举采用这种自动编号方案的界面上的所有 按钮,通过Windows编程接口 GetWindowRect ()获取该界面上所有按钮的中 心坐标按从左到右,从上到下排列,分列与阿拉伯自然数字1, 2,...依次关联。
在具体的实施过程中,同样的按键针对不同的界面,实现的功能可以有所 不同。例如按4建"取消",请参阅图2及图3, 在图2的主功能界面A中,该
按键的功能相当于点击界面A上的"后退"按钮;而在图3的主功能界面B中, 该按键的功能相当于点击界面B上的"取消"按钮。针对这个情况,在图2界 面A中分配给"取消"按键的的编号为"后退",其语音命令为"后退(h6utu i)",在图3界面B中分配给"取消"按键的的编号为"取消",其语音命令 为"取消(qC xUo)"。
在图2界面A及图3界面B中,由于"左","右,,,"上,,,"下", "确定"五个4务i的功能一致,因此,在这两个界面中,这些4^建分配到的编 号分别为"左","右,,,"上","下","确定",这此编号的语音指令 分别是"左(zu6)","右(y")","上(sh"g)","下(x"),,,"确 定(qu 6 d i ng),,。
在步骤S102中,在进入语音指令识别状态后,将控制符号与语音指令建 立的关联进行显示,引导用户进行相应的语音输入。
譬如,附图2界面A的按钮"后退","退出,,,"目的地","浏览地 图,,,"回家,,编号分别编号为1, 2, 3, 4, 5;附图3界面B的按钮"确定,,, "取消"编号编号分别为l, 2。
再如,上方向键,下方向键,左方向键,右方向键,确定键,取消键,这 些键(控制符号)在附图2界面A中的编号情况显示为""T (上)丄(下)—(左)— (右,(确定)Esc(后退)",在附图3界面B中的编号情况显示为"T (上)i (下) —(左)—(右)B(确定)Esc(取消)"。
这时,因编号和语音指令已确定对应关系,从而也就确定了各按钮的语音 指令。
譬如,附图2中的"目的地,,4姿钮,它的编号为"3",因此,用户输入语 音指令"三(san)"就可以触发"目的地"按钮的功能。
在步骤S103中,判断用户的输入是否为语音输入,当用户的输入为语音 输入时,进行步骤S104;当用户的输入不是语音输入时,按照用户的输入的其 它命令形式进行控制。
在步骤S104中,接收语音输入,才艮据接收到的语音输入匹配相应的语音 指令。
该步骤有两类数据的输入 一是语音接收器所输入的语音指令数据;二是 和具体界面相关的待选语音指令集。譬如附图2的界面A下,待选的语音指令 集为一(yl), 二Or), 三(san), 四(s i ), 五(wti),左(zu6),右(y 6 u),上(sh & ng),下(xi & ),确定(qu 6 d i ng),后退(h 6 u tu i ),语音识 别模块利用用户输入的语音指令数据,在待选语音指令集中搜寻最接近的语音 指令。
在步骤S105中,判断匹配到的语音指令对应的为按钮或者4务建。
由于语音指令已经确定因此可以找到该语音指令对应的控制符号,通过判
断控制符号的属性就可辨别语音指令对应的为按钮或者按键。
当判断接收到的语音指令为按钮编号对应的语音指令,进行步骤S106;当
语音指令对应的是控制符号的按一睫时,进行步骤S107。
步骤S106,触发该编号所对应按^組的点击,响应该4务組功能。 在步骤S107中,触发该编号所对应"fe^:的点击,响应该4要一睫功能。 当语音指令对应的不是控制符号时,显示提示,并继续对接收到的语音指
令进行判断。
本发明实施例还提供了一种移动终端,包括有一种语音控制装置,请参阅图3。
编号方案确定模块11确定编号方案。
编号模块12对系统交互界面上的控制符号进行编号,其中,该控制符号包 括有设备的按键和功能界面的按钮。
关联建立模块13按照确定的编号方案将编号与相应的语音指令建立关联, 当然,在具体实施过程中,针对不同软件交互界面,对电子设备的按键和语音 指令进行关联,具体的建立关联的过程在前文已述,此处就不再赘述。
关联关系存储模块14将建立的关联关系进行存储。
在进入语音控制模式后,编号显示模块15将控制符号和与其关联的编号进 行显示,其中,所述编号对应有语音指令。
语音识别才莫块16接收语音输入,根据该语音输入匹配相应的语音指令。 编号查找模块17根据接收到的语音指令查找相应的编号。 控制符号查找模块18根据查找到的编号根据关联关系存储模块14存储的 关联关系查找相应的控制符号。
操作执行模块19根据查找到的控制符号执行相应操作。 本发明实施例通过将将控制符号和与其关联的编号进行显示,在用户进行 语音输入后,接收并识别语音指令,根据该语音指令查找相应的编号,根据查 找到的编号查找相应的控制符号,并根据查找到的控制符号执行相应操作,实 现了语音完全对复杂的多界面多4^t功能的软件和硬件的控制,且将复杂的语 音键元素转化为有限的几个符号,增加了匹配度,不再需用户进一步确认,节 约了使用的时间成本,增加了语音控制的适用性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发 明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明 的保护范围之内。
权利要求
1、一种语音控制方法,其特征在于,所述方法包括以下步骤将控制符号和与其关联的编号进行显示,其中,所述编号对应有语音指令;接收并识别语音指令;根据所述语音指令查找相应的编号;根据所述编号查找相应的控制符号;根据所述控制符号执行相应操作。
2、 如权利要求1所述的移动终端控制方法,其特征在于,所述控制符号包 括有设备的按键和功能界面的按钮。
3、 如权利要求1或2所述的移动终端控制方法,其特征在于,所述编号是 通过以下步骤建立关联确定编号方案;对系统交互界面上的控制符号进行编号; 按照确定的编号方案将编号与相应的语音指令建立关联; 将建立的关联关系进行存储。
4、 如权利要求1所述的移动终端控制方法,其特征在于,针对不同软件交 互界面,对电子设备的按键和语音指令进行关联。
5、 一种语音控制装置,其包括语音识别模块,用于接收语音输入,根据该 语音输入匹配相应的语音指令,其特征在于,所述装置还包括编号显示4莫块,用于将控制符号和与其关联的编号进行显示,其中,所述 编号对应有语音指令;编号查找才莫块,用于根据接收到的语音指令查找相应的编号; 控制符号查找;漠块,用于才艮据所述编号查找相应的控制符号; 操作执行模块,用于根据所述控制符号执行相应操作。
6、 如权利要求5所述的语音控制装置,其特征在于,所述控制符号包括有 设备的按键和功能界面的按钮。
7、 如权利要求5或6所述的语音控制装置,其特征在于,所述装置还包括 编号方案确定模块,用于确定编号方案;编号模块,用于对系统交互界面上的控制符号进行编号;关联建立模块,用于按照确定的编号方案将编号与相应的语音指令建立关联;关联关系存储模块,用于将建立的关联关、系进行存储。
8、 如权利要求5所述的语音控制装置,其特征在于,针对不同软件交互界 面,对电子设备的按键和语音指令进行关联。
9、 一种移动终端,,其特征在于,所述移动终端还包括有一种语音控制装 置,其包括语音识别才莫块,用于接收语音输入,根据该语音输入匹配相应的语 音指令,所述装置还包括编号显示4莫块,用于将控制符号和与其关联的编号进^f亍显示,其中,所述 编号对应有语音指令;编号查找才莫块,用于根据接收到的语音指令查找相应的编号; 控制符号查找才莫块,用于才艮据所述编号查找相应的控制符号; 操作执行才莫块,用于根据所述控制符号执行相应操作。
10、 如权利要求9所述的移动终端,其特征在于,所述控制符号包括有设 备的按键和功能界面的按钮。
11、 如权利要求9或IO所述的移动终端,其特征在于,所述装置还包括 编号方案确定^^块,用于确定编号方案编号模块,用于对系统交互界面上的控制符号进行编号;关联建立才莫块,用于按照确定的编号方案将编号与相应的语音指令建立关联;关联关系存储模块,用于将建立的关联关系进行存储。
12、 如权利要求9所述的移动终端,其特征在于,针对不同软件交互界面, 对电子设备的按键和语音指令进行关联。
全文摘要
本发明适用于语音控制技术领域,提供了一种语音控制方法、装置及移动终端,所述方法包括以下步骤将控制符号和与其关联的编号进行显示,其中,所述编号对应有语音指令;接收并识别语音指令;根据所述语音指令查找相应的编号;根据所述编号查找相应的控制符号;根据所述控制符号执行相应操作。本发明解决了现有技术中语音控制方法匹配度差,以及需要用户进一步确认,增加了使用时间成本的问题,从而提高了语音控制的适用性。
文档编号G10L15/00GK101188108SQ20071012504
公开日2008年5月28日 申请日期2007年12月17日 优先权日2007年12月17日
发明者张文星 申请人:凯立德欣技术(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1