车辆语音命令的消歧的制作方法

文档序号:12916607阅读:270来源:国知局
车辆语音命令的消歧的制作方法与工艺

本发明涉及话音识别系统,具体涉及车辆中的话音识别系统。



背景技术:

话音识别技术在近几年已日益频繁地用在车辆中,以允许驾驶员能在尽可能地睁大眼睛注意车辆周围并且将手保持在车辆控制上的同时,与车辆系统进行交互。许多车辆子系统现经由话音识别来提供至少一定程度的用户交互。因此,这些系统的准确性对于确保用户满意度而言已变得日益重要。

语音识别系统可允许基于关于人的指令采取动作,例如,从车辆中呼叫该人。此外,当多个联系人号码可用于给定联系人时,可由用户发出指令来呼叫“工作中”的或者其它具体位置处的联系人。包含通用指令(例如,呼叫具体人而不指定是否应以住宅电话、工作电话等呼叫该联系人)的语音可被周期性地误解为呼叫在多个位置中的具体位置处的该人的命令。系统的不准确性可能对用户造成麻烦,尤其是当具体位置并非用户所期望的位置时。

因此,需要一种解决上述缺点的改进的话音识别系统。



技术实现要素:

识别车辆中语音的示例性方法可包括经由车辆中的麦克风接收车辆处的话音命令,以及从对接收的话音命令执行识别的语音识别处获得识别结果。识别结果可表示话音命令,并且可指示两个或多个可用车辆命令中的任意车辆命令。该方法还可包括基于二次特征和车辆命令中的所选车辆命令的属性,选择两个或多个可用车辆命令中的一个车辆命令。

识别车辆中语音的另一个示例性方法包括经由车辆中的麦克风从用户处接收车辆处的话音命令,对车辆处的话音命令执行语音识别,以及从表示话音命令的语音识别处获得识别结果。识别结果可对应于两个或多个可用车辆命令中的任意车辆命令。该方法还可包括通过基于当前日期和/或当日时间,确定两个或多个可用车辆命令中的哪一个车辆命令是预期命令,来实施车辆处的识别结果的消歧,以及将消歧的识别结果呈现给用户。

下文还公开了示例性车辆。车辆可包括安装在车辆中的车辆电子设备。车辆电子设备可包括麦克风,以及与麦克风通信的控制器。麦克风位于车辆内并配置为从位于车辆内的用户处接收话音命令。控制器可配置为对话音命令执行语音识别,以及从表示话音命令的语音识别处获得识别结果,所述识别结果对应于两个或多个可用车辆命令中的任意车辆命令。控制器可配置为至少基于当前日期和/或当日时间,确定两个或多个可用车辆命令中的哪一个车辆命令是预期命令。

附图说明

下文将结合附图描述本发明的一个或多个实施例,其中相同附图标记表示相同元件,以及其中:

图1是描绘能使用本文所公开的示例性方法的通信系统的实施例的框图;以及

图2是识别语音的示例性方法的方法流程图。

具体实施方式

本文描述了车辆的示例性说明以及识别车辆中语音的相关方法。各种示例性方法通常可提高预期话音命令的识别,例如,当话音命令可被解释为两个或多个不同可用命令时。仅以实例的方式,车辆命令可包括用于车辆启动电话呼叫的指令,例如,“呼叫戴夫”。在另一实例中,车辆命令可指示车辆提供驾驶方向,例如,“给我市中心伯明翰的方向”。在另一实例中,话音命令可启动其他类型的通信,例如,“给克里斯发短信”。

如下文将进一步描述,可用车辆命令可提供在话音菜单中,所述话音菜单可由用户来激活,例如,通过按压车辆中的按钮,大声说出车辆听得到的特定短语,或任何其他方便的方法。话音菜单中可有多个车辆命令,并且每个车辆命令可具有相关短语,例如,“呼叫”、“发短信”、“给我到某地的方向”等,当用户大声说出这些短语连同操作元时,车辆系统或子系统就会经由话音识别系统启动动作。车辆从而可识别话音菜单命令,允许相对于所说操作元启动话音菜单命令中的一个命令。仅用作实例,示例性操作元可包括联系人姓名、地点,或话音菜单命令的任何其他可适用对象。

基于话音指令的属性,二次特征可用于提高话音识别结果的准确性。例如,当用户说“呼叫戴夫”并且系统已知一个以上的电话号码时,二次特征可用于确定哪个号码适合车辆进行呼叫。仅作为一个实例,话音命令的周几和/或当日时间可指示是否使用住宅或工作电话号码。更具体地,如果是在周内的晚间,或在周末或假期,用户很有可能打算呼叫“戴夫”的住宅号码。或者,如果在正常办公时间发出命令,那么用户很有可能打算呼叫“戴夫”的工作或办公室号码。

其他示例性二次特征可以是用户与操作元的接近性。例如,如果基于位置的操作元具有多个潜在匹配项,那么可基于与用户更加接近来选择一个潜在匹配项。例如,如果当前位于密歇根的用户要求车辆提供到“市中心伯明翰”的驾驶方向,那么车辆可提供到密歇根州的伯明翰的驾驶方向,而非到阿拉巴马州的伯明翰的驾驶方向。其他二次特征(比如用户近期使用、用户与联系人的从属关系(例如,配偶))可用于帮助话音识别系统到最适当电话号码或其他联系人信息的路由动作。

二次特征的其他实例可包括话音命令的首因或近因。例如,呼叫给定联系人而未具体指明是否应以住宅电话、工作电话或以移动电话号码联系给定联系人的话音命令可以解释为以最近号码或用户最常呼叫该联系人的号码呼叫该联系人。

尽管以上二次特征的实例涉及未典型地包括在用户所说的话音命令中的信息,但是其他二次特征的实例可以是包括在话音命令中的信息。例如,如果用户要求车辆“给戴夫发短信”,那么用户希望经由文本发送通信的事实可用于确定应将文本发送到与联系人相关联的移动电话号码,而非住宅或工作电话号码。

如上所指出,二次特征可用于将话音命令与特定车辆命令相匹配。例如,基于车辆命令属性,用户正发出指令的当日时间可用于匹配话音命令。因此,用于将话音命令与车辆命令相匹配的属性的一个实例可以是在正常办公时间车辆命令与使用的联合,例如,商务电话号码。换言之,在正常办公时间令车辆命令更有可能是预期命令的车辆命令属性可用于在适当时间将话音命令与该车辆命令相匹配。或者,在周末、假期或在非办公时间之时,在这种日子/时间令车辆命令更有可能是预期命令的车辆命令属性(例如,住宅或移动电话号码)可用于将车辆命令与话音命令相匹配。

通信系统-

参照图1,示出了包括移动车辆通信系统10且可用于实施本文所公开的方法的操作环境。通信系统10通常包括车辆12、一个或多个无线载波系统14、陆地通信网络16、计算机18以及呼叫中心20。应该理解的是,所公开的方法可与任意数量的不同系统一起使用且不具体限于本文所示的操作环境。此外,系统10的结构、构造、设置以及操作及其各个部件通常是本领域已知的。因此,以下段落简单地提供了一个此类通信系统10的简要概述;然而,本文未示出的其他系统也可采用所公开的方法。

车辆12在图示实施例中被描绘成客车,但是应该理解的是,通信系统也可用于包括自行车、载重汽车、运动型多功能车(suv)、娱乐车辆(rv)、海上船只、飞机等在内的任何其他车辆。通常在图1中示出了一些车辆电子设备28,以及车辆电子设备28包括远程信息处理单元30、麦克风32、一个或多个按钮或其他控制输入34、音频系统36、视频显示器38,和gps模块40以及多个车辆系统模块(vsm)42。这些设备中的一些设备可直接连接到远程信息处理单元,比如,例如,麦克风32和按钮34,然而其他设备是使用一个或多个网络连接(比如,通信总线44或娱乐总线46)进行间接连接。合适的网络连接的实例包括控制器局域网(can)、媒介取向系统传递(most)、本地互连网络(lin)、局域网(lan)以及其他适当连接,比如以太网或符合已知iso、sae和ieee标准和规范的其他连接等。

远程信息处理单元30可以是oem安装(嵌入)或售后市场设备,其安装在车辆中且通过无线载波系统14并经由无线联网允许无线话音和/或数据通信。这使车辆能够与呼叫中心20、能进行远程信息处理的其他车辆,或一些其他实体或设备通信。远程信息处理单元优选地使用无线电传输来建立与无线载波系统14之间的通信信道(话音信道和/或数据信道),从而可在该信道上发送并接收话音传输和/或数据传输。通过提供话音通信和数据通信,远程信息处理单元30使车辆能提供多个不同服务,包括与导航、电话、紧急救援、诊断、信息娱乐等相关联的服务。可经由数据连接(比如在数据信道上经由分组数据传输)或经由使用本领域已知技术的话音信道来发送数据。对于涉及话音通信(例如,在呼叫中心20具有现场顾问或话音应答单元)和数据通信(例如,为呼叫中心20提供gps位置数据或车辆诊断数据)的组合服务,系统可在话音信道上使用单个呼叫并根据需要在话音信道上在话音传输和数据传输之间切换,这可使用本领域技术人员已知的技术来实现。

根据一个实施例,远程信息处理单元30根据gsm、cdma或lte标准使用蜂窝通信,并因此包括用于诸如免提呼叫的话音通信的标准蜂窝芯片组50、用于数据传输的无线调制解调器、电子处理设备52、一个或多个数字存储设备54和双天线56。应该理解的是,可通过储存在远程信息处理单元中的软件实施调制解调器并且由处理器52执行调制解调器,或调制解调器可以是位于远程信息处理单元30的内部或外部的单独硬件部件。可使用任意数量的不同标准或协议来操作调制解调器,比如lte、evdo、cdma、gprs和edge。也可使用远程信息处理单元30实施车辆和其他联网设备之间的无线联网。为此,根据一个或多个无线协议,包括短程无线通信(srwc)(比如ieee802.11协议、wimax、zigbeetm、wi-fi直连、蓝牙中的任意一个)或近场通信(nfc),远程信息处理单元30可配置为无线通信。当用于分组交换数据通信(比如tcp/ip)时,远程信息处理单元可配置成具有静态ip地址或可设置成自动接收来自网络上另一个设备(比如路由器或来自网络地址服务器)的分配的ip地址。

处理器52可以是能够处理电子指令的任何类型的设备,包括微处理器、微控制器、主机处理器、控制器、车辆通信处理器以及专用集成电路(asic)。这可以是仅用于远程信息处理单元30的专用处理器,或可以共享给其他车辆系统。处理器52执行各种类型的数字储存指令,比如储存在存储器54中的软件或固件程序,所述指令令远程信息处理单元提供多种服务。例如,处理器52可执行程序或处理数据以至少实施一部分本文所讨论的方法。

远程信息处理单元30可用于提供各种车辆服务,该车辆服务涉及与车辆的无线通信和/或来自车辆的无线通信。此类服务包括:逐个转弯导航和连同基于gps车辆导航模块40一起提供的其他导航相关服务;安全气囊展开通知和结合一个或多个碰撞传感器接口模块(比如车身控制模块(未示出))提供的其他紧急或路边救援相关服务;使用一个或多个诊断模块的诊断报告;以及信息娱乐相关服务,其中音乐、网页、电影、电视节目、视频游戏和/或其他信息由信息娱乐模块(未示出)所下载并储存以供当前或以后回放。以上所列服务绝不是远程信息处理单元30全部能力的穷举列表,而是远程信息处理单元能提供的一些服务的列举。另外,应该理解的是,可以储存在远程信息处理单元30的内部或外部的软件指令的形式实施至少上述模块中的一些模块,这些模块可以是位于远程信息处理单元30内部或外部的硬件部件或可以相互集成和/或共享或可以与遍布车辆的其他系统集成和/或共享等。如果当vsm42位于远程信息处理单元30的外部时实施模块,那么模块可使用车辆总线44来与远程信息处理单元交换数据和命令。

gps模块40接收来自gps卫星的星座60的无线电信号。从这些信号中,模块40可确定车辆位置,其用于为车辆驾驶员提供导航和其他位置相关服务。导航信息可呈现在显示器38上(或车辆内的其他显示器)或可以口头形式进行呈现,比如当提供逐个转弯导航时可以口头形式呈现导航信息。可使用专用车载导航模块(这可以是gps模块40的一部分)提供导航服务,或可经由远程信息处理单元30进行一些或全部导航服务,其中将位置信息发送到远程位置用于向车辆提供导航地图、地图注释(兴趣点、餐馆等)、路线计算等。可将位置信息供应给呼叫中心20或其他远程计算机系统,比如计算机18,以用于其他目的,比如车队管理。此外,可经由远程信息处理单元30从呼叫中心20将新地图数据或更新的地图数据下载到gps模块40。

除了音频系统36和gps模块40以外,车辆12可包括电子硬件部件形式的其他车辆系统模块(vsm)42,其遍布车辆且通常接收来自一个或多个传感器的输入且使用所感测的输入来执行诊断、监测、控制、报告和/或其他功能。每个vsm42优选地由通信总线44连接到其他vsm,以及连接到远程信息处理单元30,并可被编程为运行车辆系统和子系统诊断测试。作为实例,一个vsm42可以是控制发动机操作的各个方面(比如燃料点火和点火定时)的发动机控制模块(ecm),另一个vsm42可以是调节车辆动力系统的一个或多个部件的操作的动力系统控制模块,以及另一个vsm42可以是支配遍布车辆的各种电气部件(诸如车辆的电动遥控锁和前照灯)的车身控制模块。根据一个实施例,发动机控制模块配备有车载诊断(obd)特征件,所述特征件提供无数实时数据(比如接收自包括车辆排放传感器在内的各种传感器的数据),并提供允许技师在车辆内迅速识别并修补故障的一系列标准化诊断故障代码(dtc)。如本领域技术人员所理解,上述vsm仅仅是一些可用于车辆12的模块的实例,也可以是许多其他的模块。

车辆电子设备28还包括多个车辆用户接口,所述接口为车辆乘坐者提供一种提供和/或接收信息的装置,包括麦克风32、按钮34、音频系统36和视频显示器38。如本文中所使用,术语“车辆用户接口”广泛地包括任何合适形式的电子设备(包括硬件和软件部件),所述电子设备位于车辆上并令车辆用户能与车辆的部件通信或通过车辆的部件通信。麦克风32向远程信息处理单元提供音频输入以令驾驶员或其他乘坐者能经由无线载波系统14提供话音命令并实施免提呼叫。为此,可使用本领域已知的人机接口(hmi)技术将麦克风32连接到车载自动话音处理单元。按钮34允许手动用户输入到远程信息处理单元30以启动无线电话呼叫并提供其他数据、应答或控制输入。单独按钮可用于向呼叫中心20启动与常规服务救援呼叫相对的紧急呼叫。音频系统36向车辆乘坐者提供音频输出并可以是专用、独立系统或主要的车辆音频系统的一部分。根据本文所示的特定实施例,音频系统36可操作地耦接到车辆总线44和娱乐总线46并可提供am、fm和卫星无线电广播、cd、dvd和其他多媒体功能性。可连同上述信息娱乐模块一起提供该功能性或独立于上述信息娱乐模块来提供该功能性。视频显示器38优选地是图形显示器,比如仪表板上的触摸屏或被挡风玻璃反射出去的抬头显示器,并且可以用于提供大量输入和输出功能。由于图1的接口仅仅是一个特定实施方式的实例,所以也可使用各种其他车辆用户接口。

无线载波系统14优选地是蜂窝电话系统,其包括多个蜂窝塔70(仅示出一个)、一个或多个移动交换中心(msc)72,以及所需的任何其他联网部件以将无线载波系统14与陆地网络16相连接。每个蜂窝塔70包括发送并接收天线和基站,来自不同蜂窝塔的基站直接或经由中间设备(比如基站控制器)连接到msc72。蜂窝系统14可实施任何合适的通信技术,包括例如,模拟技术(比如amps)或最新的数字技术(比如cdma(例如,cdma2000)或gsm/gprs)。如本领域技术人员将理解,可以有各种蜂窝塔/基站/msc布置并且这些布置可以与无线系统14一起使用。例如,基站和蜂窝塔可以共同位于相同地点或它们可以彼此远离地定位,每个基站可以负责单个蜂窝塔或单个基站可服务于各种蜂窝塔,以及各种基站可以耦接到单个msc,仅列举几个可能的布置。

除了使用无线载波系统14以外,卫星通信形式的不同无线载波系统可用于提供与车辆的单向或双向通信。这可使用一个或多个通信卫星62以及上行链路发射站64来完成。例如,单向通信可以是卫星无线电服务,其中节目内容(新闻、音乐等)由发射站64接收、打包上传,然后发送到卫星62,卫星62将节目广播给订户。例如,双向通信可以是卫星电话服务,其使用卫星62来中继车辆12和发射站64之间的电话通信。如果使用的话,那么除了无线载波系统14以外或代替无线载波系统14,可使用该卫星电话。

陆地网络16可以是连接到一个或多个陆线电话的常规陆基电信网络并将无线载波系统14连接到呼叫中心20。例如,陆地网络16可包括公共交换电话网(pstn),比如其用于提供硬接线电话、分组交换数据通信和互联网基础设施。可通过使用标准有线网络、光纤或其他光学网络、电缆网络、电源线、其他无线网络(比如无线局域网(wlan),或提供宽带无线接入(bwa)的网络,或其任何组合来实施陆地网络16的一个或多个分段。另外,呼叫中心20不需要经由陆地网络16来连接,但可包括无线电话设备,从而呼叫中心20可与无线网络(比如无线载波系统14)直接通信。

计算机18可以是可经由私人或公共网络(比如互联网)访问的多个计算机中的一个。每个此类计算机18可用于一个或多个目的,比如车辆经由远程信息处理单元30和无线载波14可访问的网络服务器。其他此类可访问计算机18可以是,例如:服务中心计算机,其中可经由远程信息处理单元30从车辆上传诊断信息和其他车辆数据;车辆所有者或其他订户使用的客户机计算机,用于此类目的比如访问或接收车辆数据或设置或配置订户偏好或控制车辆功能;或第三方储存库,无论是通过与车辆12或呼叫中心20通信还是与两者均通信,向所述第三方储存库提供车辆数据或其他信息或车辆数据或其他信息来自于所述第三方储存库。计算机18也可用于提供互联网连接性(比如dns服务)或用作网络地址服务器,其使用dhcp或其他合适的协议给车辆12分配ip地址。

呼叫中心12设计为提供具有多个不同系统后端功能的车辆电子设备28,以及根据本文所示的示例性实施例,呼叫中心12通常包括一个或多个交换机80、服务器82、数据库84、现场顾问86以及自动话音应答系统(vrs)88,这些都是本领域已知的部件。这些各种呼叫中心部件经由有线或无线局域网90优选地彼此耦接。交换机80,可以是专用交换分机(pbx),其路由流入信号,从而使得话音传输由常规电话使用voip通常将其发送到现场顾问86或自动话音应答系统88。如图1中的虚线所示,现场顾问电话也可使用voip。经由交换机80和网络90之间的调制解调器(未示出)来实施通过交换机80进行的voip和其他数据通信。数据传输经由调制解调器被传送到服务器82和/或数据库84。数据库84可储存账户信息,比如订户验证信息、车辆识别符、简档记录、行为模式以及其他相关订户信息。也可由无线系统进行数据传输,比如802.11x、gprs等。虽然已对图示实施例如其结合使用现场顾问86的人工呼叫中心20使用来进行描述,但是应当理解的是,相反呼叫中心可将vrs88用作自动顾问或可使用vrs88和现场顾问86的组合。

方法-

现转向图2,示出了示例性流程图,下面将结合识别车辆中语音的方法的示例性说明对其进行进一步描述。过程200可开始于方框202,其中可接收到话音命令。例如,话音命令可由车辆的驾驶员或乘坐者说出,话音命令经由麦克风32在车辆12处被接收。仅用于说明目的,接收的话音命令可包括呼叫联系人的指令,例如,“呼叫戴夫”。过程200接着可前进到方框204。

在方框204,可在车辆处对话音命令执行语音识别。例如,可由车辆电子设备(例如,远程信息处理单元30或处理器52)对在方框202接收到的话音命令执行语音识别。因此,车辆通常可确定用户说出的话语。

前进到方框206,可从语音识别处获得识别结果。例如,可从对接收的话音命令执行的语音识别获得识别结果,或可表示话音命令。识别结果可对应于或表示话音命令并指示两个或多个可用车辆命令中的任意车辆命令。例如,当用户说“呼叫戴夫”且已知“戴夫”有两个或多个电话号码时,关于用户打算呼叫哪个号码可能就存在歧义性。

通常,话音命令可包括与特定车辆子系统或功能相关联的话音菜单命令,以及识别话音命令的目标或对象的操作元。仅用作实例,示例性话音菜单命令可包括短语,比如“呼叫”、“给我到某地的方向”、“发短信”。操作元可包括与联系人相关联的名牌、城市或感兴趣的地点,例如,“戴夫”、“克里斯”、“伯明翰”等。名牌也可指示关于联系人、目的地等的信息储存于其中的数据库字段,例如在车辆12上。在一些示例性方法中,可帮助确定名牌是否适合于话音命令的给定二次特征的识别可储存在数据库字段中。例如,如果名牌是“戴夫在家里”,那么这可指示与该名牌相关辆的电话号码储存在与联系人相关联的“住宅”数据库字段中。因此,操作元可包括不同的名牌,每个名牌表示与联系人相关联的不同电话号码,例如,“住宅”、“办公室”、“移动”等。过程200接着可前进到方框208。

在方框208,可基于二次特征和车辆命令中的所选车辆命令的属性,选择两个或多个可用车辆命令中的一个车辆命令。因此,当话音命令指向两个或多个不同操作元而有歧义时,过程200可确定两个或多个不同操作元中哪个操作元是预期目标。可生成修改的识别结果,其包括话音菜单命令和预期目标。仅作为一个实例,当话音命令的二次特征是话音命令的时间/日期时,可选择具有与该时间/日期的关联的车辆命令并且该车辆命令因此成为修改的识别结果的一部分。因此,在一个实例中,选择两个或多个可用车辆命令中的一个车辆命令包括将话音命令的日期/时间(例如,在正常办公时间)与和车辆命令中的所选车辆命令(例如,工作电话号码)相关联的期望可用时间段相匹配。在其他实例中,二次特征可以是具有包含在话音命令中的操作元的用户的从属关系,例如,作为用户的配偶或亲属。在其他实例中,车辆与操作元(单独或与具有操作元的用户的从属关系相结合)识别的位置的接近性可用作二次特征。因此,过程200通常可通过基于当前日期和/或当日时间,确定两个或多个可用车辆命令中的哪一个车辆命令是预期命令,来实施车辆处的识别结果的消歧。选择可能可应用于话音命令的两个或多个可用车辆命令中的一个车辆命令可包括基于至少二次特征,确定对应于话音命令的多个车辆命令中的每个车辆命令的相对可能性。按照这种方式,过程200可确定两个或多个不同操作元中的哪一个操作元包含预期目标。基于该确定,可生成修改的识别结果,其包括话音菜单命令和预期目标。

方便的是,作为话音命令的一部分,不需要说出属性和/或二次特征。例如,如以上在使用话音命令的日期/时间的实例中所指出,由于车辆12可访问日期/时间的独立指示,所以用户不需要大声说出此类信息。因此,可出现话音命令的消歧和语音识别系统的更高准确性,而通常无需来自用户的额外信息。

前进到方框210,可将修改的识别结果或消歧结果呈现给用户。在一些示例性方法中,可向用户提供确认(例如,播放的可听指示),那么用户可通过车辆12的音频系统36听到可听指示。在其他实例中,可启动预期车辆命令或消歧的车辆命令,而无需用户的进一步确认或动作。

可以理解的是,以上是对本发明的一个或多个实施例的描述。本发明不限于本文所公开的特定实施例,而是由下面的权利要求书来进行唯一限定。另外,包含在上述描述中的声明涉及特定实施例并且不能解释为对本发明范围或权利要求书中使用的术语定义的限制,除非术语或短语在上面进行了明确限定。各种其他实施例以及对所公开实施例的各种改变和修改对本领域的技术人员而言是显而易见的。所有此类其他实施例、改变和修改都拟落入所附权利要求书的范围内。

如在本说明书和权利要求书中所使用,当与一个或多个部件或其他项目列表结合使用时,术语“如”、“例如”、“诸如”、“比如”和“等”,以及动词“包含”、“具有”、“包括”,及其其他动词形式每个都要解释为开放式的,即该列表不应被视为排除其他、额外的部件或项目。其他术语采用其最广泛的合理含义来解释,除非其用于要求有不同解释的上下文中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1