语音识别装置、具有语音识别装置的车辆及其控制方法_3

文档序号:9598804阅读:来源:国知局
本公开的实施方式的进一步包括模型创建器的语音识别装置100的控制框图。
[0095]参考图3,语音识别装置100可进一步包括模型创建器160。模型创建器160可对预定上下文信息进行建模以创建上下文模型150。上下文信息可包括作为用户讲话识别的目标的至少一个字串。
[0096]例如,上下文信息可以是通过用户语音进行控制所需的信息(诸如,用户的各种控制命令)、对应于电话簿中的各个电话号码的名称、或者包括音乐或者视频的至少一个多媒体的名称。
[0097]模型创建器160可将上下文信息转换成音素并且连接各个音素,以将上下文信息建模成语音网格形式。如上所述,通过与声学模型140所识别的音素串进行模式(pattern)匹配可搜索模型化的上下文信息。
[0098]此外,模型创建器160可根据各种方法将上下文信息转换场音素。例如,模型创建器160可根据T2P转换或者G2P转换将上下文信息中包括的字串转换成音素。
[0099]此外,模型创建器160可根据字串长度对上下文信息进行分类以创建多个上下文模型。
[0100]根据实施方式,如图3所示,模型创建器160可从一个上下文信息创建三个上下文模型(即,第一上下文模型151、第二上下文模型152、以及第三上下文模型153)。第一上下文模型151可存储比阈值长度更长的字串,并且第二上下文模型152可存储比阈值长度更短的字串。
[0101]此外,模型创建器160可将字串划分成具有更小长度的字串以创建第三上下文模型153。例如,模型创建器160可将由两个字组成的字串划分成两个字,并且对这两个字中的至少一个字进行建模以创建第三上下文模型153。
[0102]上述描述涉及一种其中模型创建器160根据字串的长度对上下文信息进行分类并且存储上下文信息的实例;然而,模型创建器160可基于其他标准对上下文信息进行分类。
[0103]例如,模型创建器160可根据字串的音节长度对上下文信息进行分类。下面将对此进行更为详细的描述。
[0104]语音识别装置100可被设置在各种电子装置中,以使得根据用户的声音驱动电子装置。更具体地,语音识别装置100可应用于便携式电子设备,诸如,智能电话、便携式媒体播放器(PMP)、个人数字助理(PDA)、或者平板个人计算机(PC),或者语音识别装置100可应用于车辆1。
[0105]在下文中,将参考图4至图17详细描述包括语音识别装置100的车辆。
[0106]图4是示意性示出了根据本公开的实施方式的车辆的外形的立体图,并且图5示意性示出了根据本公开的实施方式的车辆的内部。
[0107]参考图4和图5,车辆1可包括构成车辆1的外形的车身以及使车辆1移动的车轮21 和 22。
[0108]车身可包括机罩11、前防护板12、顶盖13、车门14、后备箱15、以及后侧围板16。
[0109]此外,车身可包括前窗17,前窗17被安装在车身的前部上以提供车辆1的前方视野;侧窗18,侧窗18被安装在车门14内以提供车辆1的后方和侧方视野;以及后窗19,后窗19被安装在车身的后部上以提供车辆1的后方视野。
[0110]车轮21和22可包括设置在车辆1前部上的前车轮21和设置在车辆1的后部上的后车轮22,并且车身可通过前车轮21的转动而向前或者向后移动。
[0111]乘客乘坐的座位DS和PS、改变车辆1的方向的方向盘30、控制车辆1的操作并且显示车辆1的驾驶信息的各种仪表安装在其上的仪表板40、以及设置在仪表板40下方的齿轮箱50可被设置在车身内部。
[0112]座位DS和PS可包括驾驶员乘坐的驾驶员座位DS、同乘的乘客乘坐的乘客座位PS、以及设置在车辆1内的后部的后座(未不出)。
[0113]方向盘30可包括驾驶员紧握的轮缘31和将轮缘31连接至车辆1的转向装置的轮毂的方向盘轮辐32,其中该论毂定位在用于转向的转动轴上。驾驶员可操纵轮缘31以使轮辐32转动,以改变车轮21和22的前进方向,从而调整车辆1的驾驶方向。
[0114]此外,方向盘30可进一步包括第一输入单元211。驾驶员可通过第一输入单元211输入控制命令。第一输入单元211可被配置有滚动轮(scroll wheel)、按钮、旋钮、触摸屏、触摸板、控制杆、跟踪球、操作传感器、或者语音识别传感器。
[0115]仪表板40可包括显示车辆1的速度(每分钟转数(RPM))和燃油表的仪表盘41、其中安装用于控制音频系统的操纵单元、空调、或者加热器、通风设备、点烟器插座等的中央仪表盘42、以及使空气流入车辆1中的通风设备43。
[0116]其中安装了齿轮装置的齿轮箱50可被设置在中央仪表盘42下方。用于改变齿轮的齿轮手柄51可从齿轮箱50伸出。
[0117]此外,齿轮箱50可包括第二输入单元212,以使驾驶员能够输入用于操纵车辆1的各种功能的各种命令。第二输入单元212可包括旋钮、物理按钮、驾驶盘、控制杆、跟踪球、操纵轮、操作传感器、对象检测传感器、以及触摸传感器中的至少一种。此外,第二输入单元212可包括本领域普通技术人员可想到的各种输入装置。
[0118]扩音器111可被设置在驾驶员座位上方。可以使用能够接收语音并且将接收的语音作为电信号输出的任何其他设备替代扩音器111。
[0119]此外,扩音器111可用作语音接收器110 (见图1)并且在拨打电话时可用于收集驾驶员的语音。
[0120]另一方面,扩音器111的位置并不局限于位于驾驶员座位上方。例如,扩音器111可被设置在容易收集驾驶员语音的任何位置处,诸如方向盘30。
[0121]图6是根据本公开的实施方式的包括语音识别装置100的车辆1的控制框图。
[0122]如图6所示,车辆1可包括语音识别装置100。此外,车辆1可包括输入单元210、显示单元220、声音单元230、存储单元240、语音激活拨号(VAD)装置250、以及控制车辆1的整体操作的控制器260。
[0123]语音识别装置100可识别驾驶员的语音并且将识别的语音传输至控制器260,使得驾驶员可通过语音控制车辆1的各种功能。
[0124]S卩,驾驶员可使用语音识别装置100控制车辆1的各种功能,例如,导航系统、音频系统以及VAD装置。
[0125]在下文中,为便于描述,将详细描述使用语音识别装置100进行的VAD装置的操作。然而,语音识别装置100可用于控制车辆1的各种设备。
[0126]输入单元210可从驾驶员接收用于控制车辆1的各种功能的命令。驾驶员可通过输入单元210开启或者关闭语音识别装置100,或者可使用VAD装置250向特定的电话号码拨打电话或者应答电话。例如,输入单元210可以是第一输入单元211、第二输入单元212、或者显示单元220的触摸板。
[0127]显示单元220可提供与车辆1有关的各种信息或者用于控制车辆1的控制画面。如图5所示,显示单元220可被设置在中央仪表盘42的中央以将各种信息提供给驾驶员。
[0128]显示单元220可被实施成液晶显示器(IXD)面板、发光二极管(LED)面板或者有机发光二极管(0LED)面板。此外,显示单元220可包括触摸板以接收用户的触摸输入。
[0129]声音单元230可将与车辆1有关的各种信息作为声音输出。例如,声音单元230可输出声音识别的结果或者输出拨打电话时的另一方的语音。
[0130]此外,声音单元230可输出从用户终端UT传输的音乐。声音单元230可以是扬声器并且可设置在车辆1内部的前部区域或者后部区域。
[0131]存储单元240可存储操作车辆1的各种功能所需的数据。例如,存储单元240可存储图1中所示的语音识别装置100的声学模型140或者上下文模型150,或者存储从用户终端UT接收的电话簿。
[0132]存储单元240可以是诸如磁盘和固态磁盘等非易失性存储器或者诸如动态随机存取存储器(D-RAM)和静态随机存取存储器(S-RAM)等易失性存储器以临时存储在控制车辆1的操作时所创建的临时数据。
[0133]VAD装置250可控制车辆1的内部设备以能够使驾驶员在无需操纵用户终端UT的情况下拨打电话。为了能够使驾驶员在无需操纵用户终端UT的情况下拨打电话,VAD装置250可连接至用户终端UT,并且根据通过语音识别装置100所识别的语音拨打电话或者应答电话。
[0134]VAD装置150可通过无线通信协议连接至用户终端UT。例如,VAD装置250可使用短程通信协议连接至用户终端UT,诸如,蓝牙、蓝牙低功耗、红外数据组织(IrDA)、Zigbee、W1-F1、W1-Fi直接连接、超带宽(UWB)、或者近场通信(NFC)。在下文中,将详细描述VAD装置250的操作。
[0135]图7是用于描述根据本公开的实施方式的车辆1的VAD装置250的操作的流程图,并且图8示出了用于认证用户终端UT的画面的实例。
[0136]如图7所示,在操作S501中,VAD装置250可确定是否接收来自用户终端UT的访问请求。VAD装置250可根据短程通信协议连接至用户终端UT,然而,将VAD装置250连接至用户终端UT的方法并不局限于短程通信协议。
[0137]如果VAD装置150从用户终端UT接收访问请求(在操作S501中,“是”),则在操作S503中,VA
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1