一种可视电话控制方法及设备的制作方法

文档序号:2829340阅读:245来源:国知局
专利名称:一种可视电话控制方法及设备的制作方法
技术领域
本发明涉及通信领域,特别是涉及一种可视电话语音识别控制方法及通过语音识别控制的可视电话。
背景技术
电话作为人们日常生活、工作中不可缺少的通信工具,以其方便、快捷等特点被广泛应用,但普通电话机只能提供语音通信服务。可视电话使人们在通话时不仅能够听到对方的声音,而且还能够看到对方的图像。它不仅适用于家庭生活,而且还可以广泛应用于各项商务活动、远程教学、保密监控、医院护理、医疗诊断、科学考察等不同行业的多种领域,因而有着广阔的市场前景。
可视电话是利用电话线路实时传送人的语音和图像(用户的半身像、照片、物品等)的一种通信方式。
可视电话设备是由电话机、摄像设备、电视接收显示设备及控制器组成的。可视电话的话机和普通电话机一样是用来通话的;摄像设备的功能,是摄取本方用户的图像传送给对方;电视接收显示设备,其作用是接收对方的图像信号并在荧光屏上显示对方的图像。
在使用可视电话的时候,人们需要一种方便快捷的对可视电话进行控制的方法。当前一般对可视电话控制都是靠对键盘的操作来实现,但是这种方法有诸多限制,使用可视电话的时候需要通过使用可视电话的键盘,也就是需要可视电话在伸手可及的地方,但是很多时候人们可能和要使用的可视电话相隔有一定的距离,这样就会造成很多的不便。

发明内容
本发明的目的在于克服上述缺陷而提供的一种可视电话控制方法和设备。其通过语音识别远程控制可视电话,从而做到在离可视电话有一定距离时能够方便进行控制使用。
为实现本发明目的而提供的一种可视电话控制方法,包括下列步骤步骤A)当用户使用可视电话时,可视电话接收用户的语音指令;步骤B)可视电话判断当前语音输入模式为语音指令输入模式,将该语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码;步骤C)可视电话根据指令代码控制当前语音输入模式由语音指令输入模式转变为语音数据输入模式,用户按通常的通话方式进行通话。
本发明的控制方法还可以包括下列步骤可视电话在默认情况下,设定当前语音输入模式为语音指令输入模式;本发明的控制方法也还可以包括下列步骤步骤D)在语音指令输入模式下当输入的语音指令为无效语音指令时,丢弃所输入的无效语音指令。
所述步骤D)还包括下列步骤步骤D1)在无法识别语音指令的情况下,通过可视电话键盘操作输入指令使可视电话根据指令控制当前语音输入状态由指令输入模式变为语音数据输入模式。
本发明的可视电话控制方法,还可以包括下列步骤在通话过程中,可以通过键盘操作利用可视电话控制模块将语音数据输入模式转换为语音指令输入模式。
在通话过程结束挂机时可视电话将语音数据输入模式自动或者通过键盘操作转换为语音指令输入模式。
所述步骤B)包括下列步骤当输入指令“免提”时,语音识别及指令转换模块处理指令输入后向可视电话控制模块发送命令CMD_SPEARER_ON,可视电话控制模块接收到CMD_SPEARER_ON命令后将喇叭置成免提状态。
当输入指令“拨号+号码”时,语音识别及指令转换模块处理指令输入后向可视电话控制模块发送命令CMD_DIAL,可视电话控制模块接收到CMD_DIAL命令后控制可视电话通讯模块进行呼叫。
当输入指令“接听通话”时,语音识别及指令转换模块处理指令输入后向可视电话控制模块发送命令CMD_TALK_START,可视电话控制模块接收到CMD_TALK_START命令后控制可视电话通讯模块开始进行通话。
本发明还提供一种语音识别控制的可视电话,包括语音输入接收端,语音处理模块,可视电话通讯模块,可视电话显示模块,当前语音输入状态判断模块,语音识别及指令转换模块和可视电话控制模块;当前语音输入状态判断模块,用于判断当前语音输入模式状态,并根据判断结果将语音信号传送给语音识别及指令转换模块或者语音处理模块;语音识别及指令转换模块,用于当当前语音输入模式为语音指令输入模式时,将输入语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码,传送给可视电话控制模块;可视电话控制模块,用于控制可视电话进行通话,并在接收到当前语音转换指令时将当语音输入模式转变为语音指令输入模式或者语音数据输入模式。
本发明的可视电话,还可以包括键盘输入模块;键盘输入模块,用于输入控制可视电话的指令,并在输入语音转换指令时,传输给可视电话控制模块控制当前语音输入模式。
本发明使用语音识别对可视电话进行控制,从而达到和键盘控制等同的共同实现方便快捷的对可视电话进行控制的方法和设备,其通过语音识别判断用户语音输入为语音指令输入或者语音数据输入,分别控制可视电话或者接收语音数据,实现简单的远距离控制可视电话,从而做到在离可视电话有一定距离时也能顺利实现控制可视电话,用户更方便的远距离使用可视电话。


图1为本发明语音识别控制可视电话系统结构图;图2为本发明可视电话控制方法流程图。
具体实施例方式
下面结合附图1、2进一步详细说明本发明的可视电话控制方法和设备。
如图1所示,为本实施例中语音识别可视电话的系统结构图,包括语音输入接收端1、当前语音输入状态判断模块2、语音处理模块5、语音识别及指令转换模块3、可视电话控制模块4、可视电话显示模块7、可视电话通讯模块6、键盘输入模块8。
语音输入接收端1用于接收用户的语音,并将语音传输给当前语音输入状态判断模块2。
用户的语音,一般由拾音设备,如麦克风,拾取周围环境中的用户发出的声音,该声音信号一般为模拟信号,或者模拟信号转换为数字信号后传递给当前语音输入状态判断模块2。
较佳地,本实施例中的语音输入接收端1接收到用户的语音后,将语音模拟信号转换为数字信号,然后才传递给当前语音输入状态判断模块2。
语音模拟信号转换为数字信号,可以采用公知的模/数转换器实现。
当前语音输入状态判断模块2,用于判断当前语音输入模式状态,并根据判断结果将语音信号传送给语音识别及指令转换模块3或者语音处理模块5。
当前语音输入状态判断模块2通过对当前语音输入状态判断来决定当前输入语音是作为指令输入,还是作为简单语音数据输入。
当作为语音指令输入时,那么通过语音识别及指令模块3转换为控制指令后,将该指令传递给可视电话控制模块4实现对可视电话的控制;当作为语音数据输入时,如作为通话过程中的语音输入或者录音输入,那么语音数据将输送到可视电话的语音处理模块5进行处理。
语音识别及指令转换模块3,用于当当前语音输入模式为语音指令输入模式时,将输入语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码,传送给可视电话控制模块4。
可视电话控制模块4,用于控制可视电话进行通话,并在接收到当前语音转换指令时将当语音输入模式转变为语音指令输入模式或者语音数据输入模式。
为了达到语音到指令的转换,本实施例中,定义了各种命令的文字表达,当进行语音到指令的转换时,先进行语音识别,得到用户想表达的文字意思,然后和定义的各种命令的文字表达进行比较判断出用户想使用的命令,通过可视电话控制模块4对命令进行处理达到控制可视电话的目的。
如图2所示,下面进一步详细说明本发明的可视电话语音控制方法
1)可视电话在默认情况下,可视电话控制模块4设定当前语音输入状态为指令输入模式。
2)当用户通过语音指令或者键盘操作使用可视电话进行通话、录音或者环回时,由语音输入接收端将用户的语音指令接收。
本发明中的语音指令一般是一段不超过10个字符(汉字或者英文单词)的语句,用户可以设置语音指令的内容,通过语音识别及指令转换模块3解析指令;当用户通过语音指令或者键盘操作使可视电话进行通话(或者录音、环回)时,相应地,语音识别及指令转换模块3或者键盘输入模块8会向可视电话控制模块4发送相应命令,可视电话控制模块4通过对相应命令处理完成从语音指令输入状态到语音数据输入状态的转换。
环回即将可视电话音频输入的声音从音频输出口输出。
语音格式是16比特的PCM音频数据格式。
3)通过当前语音输入状态判断模块2判断当前语音输入模式为语音指令输入模式,将该语音指令转给语音识别及指令转换模块3,语音识别及指令转换模块3将语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码,传送给可视电话控制模块4。
各种命令的文字表达可以根据用户的需要进行设置,但需要对提供的命令设置预定义语音。
如“拨号+号码”代表打电话到某个呼叫号码,“免提”代表启用免提电话,“接听通话”代表开始通话等等。
通过语音识别将语音指令输入转换成文字,然后和预先存储的语音指令文字比较得到相应的指令代码。
在指令输入模式下,当输入指令“免提”时,语音识别及指令转换模块3处理指令输入后向可视电话控制模块4发送命令CMD_SPEARER_ON,可视电话控制模块4接收到CMD_SPEARER_ON命令后将喇叭置成免提状态。
即语音输入“免提”--》文字“免提”--》CMD_SPEARER_ON(参数为空)在指令输入模式下,当输入指令“拨号+号码”时,语音识别及指令转换模块3通过处理指令输入后向可视电话控制模块4发送命令CMD_DIAL,可视电话控制模块4接收到CMD_DIAL命令后控制可视电话通讯模块6进行呼叫。
即语音输入“拨号+号码”--》文字“拨号+号码”--》CMD_DIAL(参数为号码)在指令输入模式下,当输入指令“接听通话”时,语音识别及指令转换模块3通过处理指令输入后向可视电话控制模块4发送命令CMD_TALK_START,可视电话控制模块4接收到CMD_TALK_START命令后控制可视电话通讯模块6开始进行通话。
即语音输入“接听通话”--》文字“接听通话”--》CMD_TALK_START(参数为空)语音识别及指令转换模块3发送到可视电话控制模块4的相应命令是CMD_TALK_START、CMD_SPEARER_ON、CMD_DIAL,可视电话根据相应的指令利用可视电话通讯模块6通讯,并将图像通过可视电话显示模块7显示给用户。
4)可视电话控制模块4根据指令代码控制当前语音输入模式由语音指令输入模式转变为语音数据输入模式,用户按通常的通话方式通过语音处理模块5进行通话。
可视电话的语音输入状态从指令输入模式转变为语音数据输入模式后,用户利用可视电话开始通话并传输可视图像,语音输入接收端接收到用户输入的语音数据后,当前语音输入状态判断模块判断当前语音输入的状态为语音数据输入模式,将语音输入数据传送给语音处理模块5,用户进行正常的通话。
当用户使用视电话进行正常的通话(或者录音、环回)时,将无法通过通过语音识别对可视电话进行控制,这时所有的语音输入数据都是作为非语音指令的语音数据输入。
5)在语音指令输入模式下当输入无效指令时,语音识别及指令转换模块3会丢弃输入无效指令。
较佳地,考虑到语音控制是作为键盘控制的一种补充控制方法,所以键盘控制的优先级比语音控制的优先级高。
当无法识别语音的情况下可以通过键盘输入模块8的键盘操作输入指令使可视电话控制模块根4据指令控制当前语音输入状态由指令输入模式变为语音数据输入模式;6)在通话过程中,可以通过键盘操作利用可视电话控制模块4将语音数据输入模式转换为语音指令输入模式,如按下键盘上的特殊功能键实现;或者在通话过程结束挂机时可视电话由可视电话控制模块4将语音数据输入模式自动或者通过键盘操作转换为语音指令输入模式。
在通话过程中,通过键盘操作利用可视电话控制模块4将语音数据输入模式转换为语音指令输入模式,如按下键盘上的特殊功能键实现。
在这一可视电话工作方式下,键盘模块8需要设置特定键完成语音输入模式到语音指令模式的转换,通过特定键完成语音输入模式到语音指令模式的转换。
也可以在通话过程结束挂机时,可视电话控制模块4收到挂机响应,将当前语音数据输入模式自动或者通过键盘操作转换为语音指令输入模式。
本发明的可视电话在使用时,在默认的情况下,当前语音输入模式为语音指令输入模式;当用户通过语音指令或者键盘操作使可视电话进行通话、录音或者环回时,当前语音输入模式由语音指令输入模式转变为语音数据输入模式;当用户使用可视电话进行通话、录音或者环回时,将无法通过语音识别对可视电话进行控制,这时所有的语音输入数据都是作为非语音指令语音数据输入,要想重新进入到语音识别指令控制可视电话状态,需要通过键盘操作来实现。在通话结束挂掉电话时将当前语音输入模式自动或者通过键盘操作将语音数据输入模式变为语音指令输入模式。
本发明利用成熟的现有公知语音识别技术实现对可视电话进行控制,从而达到和键盘控制、遥控器控制等共同实现方便快捷的对可视电话进行控制的目的,其通过语语音识别远程控制可视电话,从而做到在离可视电话有一定距离,一般在0~5米时也能方便顺利使用可视电话进行工作。
本实施例是使本领域普通技术人员理解本发明,而对本发明所进行的详细描述,但可以想到,在不脱离本发明的权利要求所涵盖的范围内还可以做出其它的变化和修改,这些变化和修改均在本发明的保护范围内。
权利要求
1.一种可视电话控制方法,其特征在于,包括下列步骤步骤A)当用户使用可视电话时,可视电话接收用户的语音;步骤B)可视电话判断当前语音输入模式为语音指令输入模式,将该语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码;步骤C)可视电话根据指令代码控制当前语音输入模式由语音指令输入模式转变为语音数据输入模式,用户进行通话。
2.根据权利要求1所述的可视电话控制方法,其特征在于,还包括下列步骤可视电话在默认情况下,设定当前语音输入模式为语音指令输入模式。
3.根据权利要求1所述的可视电话控制方法,其特征在于,还包括下列步骤步骤D)在语音指令输入模式下当输入的语音指令为无效语音指令时,丢弃所输入的无效语音指令。
4.根据权利要求3所述的可视电话控制方法,其特征在于,所述步骤D)还包括下列步骤步骤D1)在无法识别语音指令的情况下,通过可视电话键盘操作输入指令使可视电话根据指令控制当前语音输入状态由指令输入模式变为语音数据输入模式。
5.根据权利要求1至4任一项所述的可视电话控制方法,其特征在于,还包括下列步骤在通话过程中,通过键盘操作利用可视电话控制模块将语音数据输入模式转换为语音指令输入模式。
6.根据权利要求1至4任一项所述的可视电话控制方法,其特征在于,还包括下列步骤在通话过程结束挂机时可视电话将语音数据输入模式自动或者通过键盘操作转换为语音指令输入模式。
7.根据权利要求1至4任一项所述的可视电话控制方法,其特征在于,所述步骤B)包括下列步骤当输入指令“免提”时,语音识别及指令转换模块(3)处理指令输入后向可视电话控制模块(4)发送命令,可视电话控制模块(4)接收到所述命令后将可视电话喇叭置成免提状态。
8.根据权利要求1至4任一项所述的可视电话控制方法,其特征在于,所述步骤B)包括下列步骤当输入指令“拨号+号码”时,语音识别及指令转换模块(3)处理指令输入后向可视电话控制模块(4)发送命令,可视电话控制模块(4)接收到所述命令后控制可视电话通讯模块(6)进行呼叫。
9.根据权利要求1至4任一项所述的可视电话控制方法,其特征在于,所述步骤B)包括下列步骤当输入指令“接听通话”时,语音识别及指令转换模块(3)处理指令输入后向可视电话控制模块(4)发送命令,可视电话控制模块(4)接收到所述命令后控制可视电话通讯模块(6)开始进行通话。
10.一种语音识别控制的可视电话,包括语音输入接收端(1),语音处理模块(5),可视电话通讯模块(6)和可视电话显示模块(7),其特征在于,还包括当前语音输入状态判断模块(2),语音识别及指令转换模块(3)和可视电话控制模块(4);当前语音输入状态判断模块(2),用于判断当前语音输入模式状态,并根据判断结果将语音信号传送给语音识别及指令转换模块(3)或者语音处理模块(5);语音识别及指令转换模块(3),用于当当前语音输入模式为语音指令输入模式时,将输入语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码,传送给可视电话控制模块(4);可视电话控制模块(4),用于控制可视电话进行通话,并在接收到当前语音转换指令时,将当语音输入模式转变为语音指令输入模式或者语音数据输入模式。
11.根据权利要求10所述的可视电话,其特征在于,还包括键盘输入模块(8);键盘输入模块(8),用于输入控制可视电话的指令,并在输入语音转换指令时,传输给可视电话控制模块(4)控制当前语音输入模式。
全文摘要
一种可视电话控制方法及设备,其方法包括可视电话在默认情况下,设定当前语音输入模式为语音指令输入模式;当用户使用可视电话时,可视电话接收用户的语音指令;可视电话判断当前语音输入模式为语音指令输入模式,将该语音指令转换成文字,然后和预先设定的语音指令文字比较得到相应的指令代码;可视电话根据指令代码控制当前语音输入模式由语音指令输入模式转变为语音数据输入模式,用户按通常的通话方式进行通话。本发明还提供一种语音识别控制的可视电话。其通过语音识别远程控制可视电话,从而做到在离可视电话有一定距离时能够方便进行控制使用。
文档编号G10L15/00GK1859557SQ20061000821
公开日2006年11月8日 申请日期2006年2月16日 优先权日2006年2月16日
发明者黄克荣 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1