具有多个输入模式的移动设备的制作方法

文档序号:7848441阅读:402来源:国知局
专利名称:具有多个输入模式的移动设备的制作方法
具有多个输入模式的移动设备相关申请的交叉引用本申请要求2010年2月10日提交的美国专利申请No. 12/703,592的权益,通过引用将该申请全部合并于此。
背景技术
移动电话的用户有时在不拿着电话时使用电话。例如,用户可能想在驾驶汽车时使用电话。此时,用户难以与电话交互,这是因为传统上用户必须触摸电话的输入设备来提供指令。另外,有时用户可能想使用掌上电脑的多个应用程序,但观看掌上电脑的显示器对于用户来说是不方便的,或者是不可能的。例如,用户可能是盲人。用户可能想听音乐、查看天气、接收并回复电子邮件以及获取最新的股票报价,所有这些均无需观看掌上电脑。

发明内容
一个示例性实施例涉及移动设备。所述移动设备包括外壳、被配置为检测声音的语音传感器以及扬声器。所述移动设备还包括被配置为在第一模式和第二模式两种模式下操作的处理电路。在所述第一模式下时,所述处理电路被配置为通过检测用户触摸所述设备或所述设备的附件来接收来自所述用户的指令。在所述第二模式下时,所述处理电路被配置为通过所述语音传感器接收来自所述用户的语音的指令。当预定要求被满足时,所述处理电路被配置为从第一模式切换到第二模式,而无需在切换时从所述用户接收特定指令来切换所述模式。另一7]^例性实施例涉及一种将设备从第一模式切换到第二模式的方法。所述方法包括基于所述设备的环境和/或状态,在预定要求被满足时,将所述设备从所述第一模式切换到所述第二模式。在所述第一模式下,一个或多个处理电路被配置为通过检测用户触摸所述设备或所述设备的附件来接收来自所述用户的指令。在所述第二模式下,所述一个或多个处理电路被配置为接收来自所述用户的语音的指令。又一示例性实施例涉及一种移动计算设备,所述移动计算设备包括外壳,被配置为在使用过程中被握在手中;用户输入设备,被配置为检测用户触摸所述移动设备或所述设备的附件,并将所述触摸转换为第一数字指令;语音传感器,被配置为检测声音;话音转换模块,被配置为将所述声音转换为第二数字指令;以及处理模块。所述处理模块被配置为在第一模式下将所述第一数字指令提供给多个不同程序或应用程序中的任意一种,而在第二模式下,将所述第二数字指令提供给所述多个不同程序或应用程序中的任意一种。


图I是根据示例性实施例的移动设备的透视图。图2是根据示例性实施例的、在展开配置下图I的移动设备的正视图。图3是根据示例性实施例的、在展开配置下图I的移动设备的后视图。
图4是根据示例性实施例的、在展开配置下图I的移动设备的侧视图。图5是根据示例性实施例的图I的移动设备的框图。图6是根据示例性实施例的移动设备的框图。图7是根据示例性实施例的确定移动设备的模式的过程的流程图。图8是根据示例性实施例的移动设备在模式间切换的过程的流程图。图9. I是根据示例性实施例的在移动设备中来自语音的指令到达应用程序或程序的过程的流程图。图9. 2是根据另一示例性实施例的在移动设备中来自语音的指令到达应用程序 或程序的过程的流程图。图10是根据示例性实施例的用户在移动设备的两种模式下发送电子邮件的过程的流程图。图11是根据示例性实施例的用户在移动设备的两种模式下播放音乐的过程的流程图。图12是根据示例性实施例的应用程序的接口的框图。
具体实施例方式在这里描述的某些实施例可使移动设备能够自动地从一种操作模式/操作配置(operating profile)切换到另一种操作模式/操作配置。在这里描述的某些实施例可使移动设备能够具有语音用户接口。在这里描述的某些实施例可为移动设备提供对于多个程序/应用程序中的任意一个是透明的语音模式/语音配置。某些实施例可允许用户通过触摸和观看以及通过听和说均能够与电话或掌上电脑交互。某些实施例可允许用户在不同环境和条件(例如,用户和/或电话的情境)下在该两种交互方式之间进行切换,以指示用户可能想以语音模式与电话交互。在这里描述的某些实施例可提供移动设备、或提供能够使用户通过语音指令使用电话的所有或大部分应用程序的方法。某些实施例可提供具有语音模式的掌上电脑或系统,其中,给掌上电脑的所有指令以及来自掌上电脑的所有反馈和信息均通过语音传送。在这里描述的某些实施例可提供具有两种模式(一种是传统模式,一种是语音模式)的移动设备或系统。当处于语音模式时,电话可接收来自用户的语音的指令。在这里描述的某些实施例可提供在切换时无需用户的指令即可在两种模式之间进行自动切换的电话或方法。模式的切换可基于设备的内部状态、外部环境和/或其它情境自动发生。参照图I至图4,不出移动设备10。这里的教导可应用于设备10或其它的电子设备(例如台式电脑)、移动计算设备(例如笔记本电脑)或诸如个人数字助理(PDA)、智能手机、移动电话、个人导航设备等的手持计算设备。根据一个实施例,设备10可为移动电话与具有PDA功能的掌上电脑的结合的智能手机。PDA功能可包括一个或更多个人信息管理(例如,包括诸如电子邮件、日历、联系人等的个人数据应用程序)、数据库功能、文字处理、电子表格、语音备忘录记录、全球定位系统(GPS)功能,等等。设备10可被配置为使来自这些应用程序的个人信息与计算机(例如,台式机、笔记本电脑、服务器等)同步。设备10可进一步被配置为接收并操作在制造之后例如通过有线或无线下载、安全数字卡等提供给设备10的其它应用程序。如图I至图4所示,设备10包括外壳12和正面14及背面16。设备10进一步包括显示器18和用户输入设备20 (例如QWERTY或字母数字键盘、按钮、触摸屏、话音识别引擎等等)。显示器18可包括触摸屏显示器,以便将用户输入提供给处理器102 (参见图4)来控制功能,例如来选择在显示器18上显示的选项、将文本输入输入到设备10、或输入其它类型的输入。显示器18还提供被显示并可由设备10的用户查看的图像(参见例如图5)。用户输入设备20可提供与触摸屏显示器18的输入类似的输入。输入按钮40可设置在正面14上,并且可被配置为执行预编程功能。设备10可进一步包括扬声器26、用于帮助用户在显示器18上做选择的指示笔(未示出)、相机28、相机闪光灯32、麦克风34、光传感器以及听筒36。显示器18可包括电容式触摸屏、互电容式触摸屏、自电容式触摸屏、电阻式触摸屏、利用相机和光的诸如表面多点触摸屏的触摸屏、近似传感器或其它的触摸屏技术,等等。显示器18可被配置为同时接收来自显示器18上的多个位置的手指触摸的输入。显示器18可被配置为接收手指滑动或其它的定向输入,这可以由用于控制与单一触摸输入不同的某些功能的处理电路来解释。此外,手势区30可设置在显示器18附近(例如,下方、上方或者 一侧等),或者可并入到显示器18中,以接收作为输入的各种手势,包括拍、挥、拖、抛、拧等等。一个或多个指示区38 (例如灯等)可被提供,以指示已从用户接收到手势。根据示例性实施例,外壳12被配置为在基本平行或相同的平面上以固定关系将例如显示器18的屏幕维持在用户输入设备(例如用户输入设备20)上方。在固定的实施例中,这种固定关系不包括屏幕和用户输入设备(例如多个键)之间的铰接或可移动关系。设备10可为掌上电脑,掌上电脑是小的足以放在用户手中的电脑,包括诸如典型的移动电话和个人数字助理之类的设备,但不包括典型的笔记本电脑和平板电脑。设备10的如下面描述的各种输入设备和其它组件可放置在设备10上的任何地方(例如图2所示的正表面、图3所示的后表面、图4所示的侧表面,等等)。此外,例如键盘等的各种组件可以能伸缩地沿设备10的任一侧面从设备10的待露出的一部分滑进和滑出。例如,如图2至图4所示,正面14可相对于背面16可滑动调节,以露出输入设备20,使得在缩进配置(参见图I)下输入设备20不可见,而在展开配置(参见图2至图4)下输入设备20可见。根据不同示例性实施例,外壳12可以是任何尺寸或形状,并且可具有多种长度、宽度、厚度以及体积大小。例如,宽度13可以不大于约200毫米(mm)、100mm、85mm或65mm,或者可替代地,可以为至少大约30mm、50mm或55mm。长度15可以不大于约200mm、150mm、135mm或125mm,或者可替代地,可为至少大约70mm或100mm。厚度17可以不大于约150mm、50mm、25mm或15mm,或者可替代地,可为至少大约10mm、15mm或50mm。外壳12的体积可以不大于约2500立方厘米(cc)或1500cc,或者可替代地,可以为至少大约IOOOcc或600cc。根据不同类型的蜂窝无线电话系统,设备10可提供语音通信功能。蜂窝无线电话系统的示例可包括码分多址(CDMA)蜂窝无线电话通信系统、全球移动通信系统(GSM)蜂窝无线电话系统,等等。除了提供语音通信功能之外,设备10可被配置为根据不同类型的蜂窝无线电话系统提供数据通信功能。提供数据通信业务的蜂窝无线电话系统的示例可包括具有通用分组无线业务(GPRS)的GSM系统(GSM/GPRS)、CDMA/lxRTT系统、增强型全球数据速率演进(EDGE)系统、只演进数据或优化演进数据(EV-DO)系统、长期演进(LTE)系统,等等。
设备10可被配置为根据不同类型的无线网络系统提供语音和/或数据通信功能。无线网络系统的示例可进一步包括无线局域网(WLAN)系统、无线城域网(WMAN)系统、无线广域网(WffAN)系统,等等。提供数据通信业务的合适无线网络系统的示例可包括电气和电子工程师协会(IEEE) 802. XX系列协议,如IEEE802. lla/b/g/n系列标准协议及其变体(也称为“WiFi”)、IEEE802. 16系列标准协议及其变体(也称为“WiMAX”)、IEEE802. 20系列标准协议及其变体,等等。设备10可被配置为根据不同类型的短距离无线系统(例如无线个人局域网(PAN)系统)执行数据通信。提供数据通信业务的合适无线PAN系统的一个示例可包括按照蓝牙专业组(SIG)系列协议操作的蓝牙系统,蓝牙专业组(SIG)系列协议包括蓝牙规范版本vl. O,vl. Uvl. 2、v2. O、具有增强型数据速率(EDR)的v2. O,以及一个或多个蓝牙配置文件(Bluetooth Profile),等等。如图5的实施例所示,设备10可包括双处理器架构,双处理器架构包括主处理器102和无线处理器104 (例如基带处理器)。主处理器102和无线处理器104可被配置为利
用接口 106互相通信,接口 106例如为一个或多个通用串行总线(USB)接口、微-USB接口、通用异步收发报机(UART)接口、通用输入输出(GPIO)接口、控制线/状态线、控制线/数据线、共孚存储器,等等。主处理器102可负责执行诸如应用程序和系统程序的各种软件程序,以提供设备10的计算操作和处理操作。无线处理器104可负责执行设备10的各种语音和数据通信操作,例如经由一个或多个无线通信信道发送和接收语音和数据信息。虽然为图示的目的,双处理器架构的实施例可被描述为包括主处理器102和无线处理器104,但设备10的双处理器架构可包括另外的处理器,可被实现为在单个芯片上既有主处理器102又有无线处理器104的双核芯片或多核芯片,等等。在不同实施例中,主处理器102可利用诸如通用处理器的任意合适的处理器或逻辑设备而实现为主中央处理单元(CPU)。在可替代实施例中,主处理器102可包括,或被实现为芯片多处理器(CMP)、专用处理器、嵌入式处理器、介质处理器、输入/输出(I/O)处理器、协处理器、现场可编程门阵列(FPGA)、可编程逻辑设备(PLD)或者其它处理设备。在示例性实施例中,主处理器102是0MAP2,例如由德州仪器有限公司(TexasInstruments, Inc.)制造的 0MAP2431 处理器。主处理器102可被配置为向设备10提供处理或计算资源。例如,主处理器102可负责执行例如应用程序和系统程序的各种软件程序,以为设备10提供计算操作和处理操作。应用程序的示例可包括例如电话应用程序、语音邮件应用程序、电子邮件应用程序、即时消息(頂)应用程序、短信息业务(SMS)应用程序、多媒体消息业务(MMS)应用程序、网页浏览器应用程序、个人信息管理(PM)应用程序、联系人管理应用程序、日历应用程序、行程安排应用程序、任务管理应用程序、文字处理应用程序、电子表格应用程序、数据库应用程序、视频播放器应用程序、音频播放器应用程序、多媒体播放器应用程序、数码相机应用程序、摄像机应用程序、媒体管理应用程序、游戏应用程序,等等。应用程序可提供图形用户界面(⑶I),以在设备10和用户之间传递信息。系统程序有助于计算机系统的运行。系统程序可直接负责控制、集成以及管理计算机系统的独立硬件组件。系统程序的示例可包括例如操作系统(OS)、设备驱动器、编程工具、实用程序、软件库、应用编程接口(API)、图形用户界面(GUI),等等。设备10可根据所描述的实施例利用任意适合的OS,例如Palm webOS、Palm OS 、Palm OS Cobalt、微软⑧视窗 OS、微软视窗 CE、微软 Pocket PC、微软移动、Symbian 0S >Embedix 0S、Linux、无线二进制运行时环境(BREW) OS、JavaOS、无线应用协议(WAP) OS,等等。设备10可包括联接到主处理器102的存储器108。在不同实施例中,存储器108可被配置为存储将由主处理器102执行的一个或多个软件程序。存储器108可利用能够存储数据的任意机器可读或计算机可读介质实现,该介质例如为易失性存储器或非易失性存储器、可移动或不可移动存储器、可擦除或不可擦除存储器、可写入或者可再写入存储器,等等。机器可读存储介质的示例可包括但不限于随机存取存储器(RAM)、动态RAM (DRaM),双倍数据速率DRAM (DDRAM)、同步DRAM (SDRAM)、静态RAM (SRAM)、只读存储器(ROM)、可编程ROM (PR0M)、可擦除可编程ROM (EPROM)、电可擦除可编程ROM (EEPROM)、闪存(例如NOR闪存或NAND闪存)、或适于存储信息的任意其它类型的介质。虽然为了图示的目的,存储器108可示出为与主处理器102分离,但在不同实施例 中,某个部分或整个存储器108可包括在与主处理器102相同的集成电路上。可替代地,某个部分或整个存储器108可被布置在主处理器102的集成电路之外的集成电路或其它介质(例如硬磁盘驱动器)上。在不同实施例中,设备10可包括扩展槽,以支持例如多媒体和/或存储卡。设备10可包括联接到主处理器102的用户输入设备110。用户输入设备110可例如包括QWERTY键布局和集成数字拨号键盘。设备10还可包括各种键、按钮和开关,例如输入键、预置和可编程热键、左右操作按钮、导航按钮(例如多方位导航按钮)、电话/发送和电源/结束按钮、预置和可编程快捷按钮、音量摇杆开关、具有振动模式的铃声打开/关闭开关、键盘、字母数字式键盘,等等。主处理器102可联接到显示器112。显示器112可包括用于向设备10的用户显示内容的任意适合的视觉界面。例如,显示器112可通过例如触控式彩色(例如16位彩色)薄膜晶体管(TFT)液晶显示器(IXD)屏的IXD来实现。在某些实施例中,触控式IXD可与指示笔和/或手写识别程序一起使用。设备10可包括联接到主处理器102的输入/输出(I/O)接口 114。I/O接口 114可包括一个或多个I/o设备,例如串行连接端口、红外端口、集成蓝牙 无线能力和/或集成802. Ilx (WiFi)无线能力,来实现到本地计算机系统(例如本地个人计算机(PC))的有线(例如,USB电缆)和/或无线连接。在不同实施中,设备10可被配置为与本地计算机系统传递和/或同步信息。主处理器102可联接到支持设备10的音频/视频能力的各个音频/视频(A/V)设备116。A/V设备116的示例可包括例如麦克风、耳机、汽车扬声器、一个或多个其它扬声器、连接音频耳机的音频端口、音频编码器/译码器(编码译码器)、音频播放器、数码相机、摄像机、视频编码译码器、视频播放器,等等。主处理器102可联接到被配置为给设备10的元件供电并管理电的电源118。在不同实施例,电源118可通过可充电电池(例如用于提供直流(DC)电的可更换和可充电锂离子电池)和/或用于从标准交流(AC)主电源获得电的AC适配器来实现。如上所述,无线处理器104可执行设备10的语音和/或数据通信操作。例如,无线处理器104可被配置为经由无线通信信道中的一个或多个指定的频带传递语音信息和/或数据信息。在不同实施例中,无线处理器104可利用诸如调制解调器处理器或基带处理器的任意合适的处理器或逻辑设备而实现为通信处理器。虽然采用示例的方式描述了其中无线处理器104被实现为调制解调器处理器或基带处理器的某些实施例,但可以理解的是,在该情境下,实施例并不限于此。例如,无线处理器104根据所描述的实施例可包括或被实现为数字信号处理器(DSP)、介质存取控制(MAC)处理器或任意其它类型的通信处理器。无线处理器104可以是由高通公司(Qualcomm,Inc.)或其它制造商制造的多种调制解调器中的任意一种。在不同实施例中,无线处理器104可执行设备10的模拟和/或数字基带操作。例如,无线处理器104可执行数模转换(DAC)、模数转换(ADC)、调制、解调、编码、译码、加密、
解密,等等。设备10可包括联接到无线处理器104的收发器模块120。收发器模块120可包 括被配置为利用不同类型的协议、通信范围、运行功率要求、RF子波段、信息类型(例如语音或数据)、使用场景、应用等来进行通信的一个或多个收发器。在不同实施例中,收发器模块120可包括被配置为支持诸如GSM、UMTS, CDMAjP /或LTE系统之类的蜂窝无线电话系统的语音通信的一个或多个收发器。收发器120根据一个或多个无线通信协议还可包括被配置为执行数据通信的一个或多个收发器,无线通信协议例如为WWAN协议(例如,GSM/GPRS协议、CDMA/IxRTT协议、EDGE协议、EV-DO协议、EV-DV协议、HSDPA协议,等等)、WLAN协议(例如,IEEE 802. lla/b/g/n、IEEE 802. 16、IEEE 802. 20,等等)、PAN 协议、红外协议、蓝牙协议、包括被动或主动RFID协议的EMI协议,等等。收发器模块120根据特定实施的需要可利用一个或多个芯片实现。虽然为图示的目的,收发器模块120可被示出为与无线处理器104分离并位于无线处理器104之外,但在不同实施例中,某个部分或整个收发器模块120可包括在与无线处理器104相同的集成电路上。设备10可包括用于发送和/或接收电信号的天线系统122。如图所示,天线系统122可通过收发器模块120联接到无线处理器104。天线系统122可包括或被实现为一个或多个内部天线和/或外部天线。设备10可包括联接到无线处理器104的存储器124。存储器124可利用能够存储数据的一种或多种类型的机器可读介质或计算机可读介质实现,该介质例如为易失性存储器或非易失性存储器、可移动或不可移动存储器、可擦除或不可擦除存储器、可写入或者可再写入存储器,等等。存储器124可包括例如闪存和安全数字(SD) RAM。虽然为图示的目的,存储器124可被示出为与无线处理器104分离并位于无线处理器104之外,但在不同实施例中,某个部分或整个存储器124可包括在与无线处理器104相同的集成电路上。设备10可包括联接到无线处理器104的客户识别模块(SM) 126。SIM 126可包括例如可更换或不可更换智能卡,智能卡被配置为对语音传输和数据传输进行加密并存储用户特定数据,以允许语音通信或数据通信网络对用户进行识别和验证。SM 126还可存储例如用户特定的个人设置的数据。设备10可包括联接到无线处理器104的I/O接口 128。I/O接口 128可包括一个或多个I/o设备,来实现设备10和一个或多个外部计算机系统之间的有线(例如,串行、电缆,等等)和/或无线(例如,WiFi、短距离,等等)通信。在不同实施例中,设备10可包括地点或位置确定能力。设备10可采用一个或多个位置确定技术,包括例如全球定位系统(GPS)技术、全球小区识别(CGI)技术、包括定时提前量(TA)技术的CGI技术、增强前向链路三角测量(EFLT)技术、到达时间差(TDOA)技术、到达角(AOA )技术、先进前向链路三角测量(AFLT )技术、到达观察时间差(OTDOA )技术、增强观察时间差(EOTD)技术、辅助GPS (AGPS)技术、混合技术(hybrid technique)(例如用于 CDMA 网络的 GPS/CGI、AGPS/CGI、GPS/AFTL 或 AGPS/AFTL、用于 GSM/GPRS 网络的 GPS/EOTD 或 AGPS/E0TD、用于 UMTS 网络的 GPS/0TD0A 或 AGPS/0TD0A),等等。
设备10可被配置为在一种或多种位置确定模式下操作,位置确定模式包括例如单一模式、移动台(MS)辅助模式和/或基于MS模式。在单一模式(例如单一 GPS模式)下,设备10可被配置为无需从网络接收无线导航数据即可确定其位置,不过其可能接收某些类型的位置辅助数据,例如年历、星历以及粗略数据。在一个实施例中,设备10可包括可集成在外壳12 (图I)内的本地位置确定电路134 (例如,GPS接收器),本地位置确定电路134被配置为通过天线135接收卫星数据并计算定位。可替代地,本地位置确定电路可包括位于与外壳12分开但在设备10附近的第二外壳中的GPS接收器,该GPS接收器被配置为以无线方式(例如,通过诸如蓝牙的PAN)与设备10通信。然而,当在MS辅助模式或基于MS模式下操作时,设备10可被配置为经由无线接入网络130 (例如,UMTS无线接入网络)与远程计算机132 (例如,位置确定实体(PDE)、位置代理服务器(LPS)和/或移动定位中心(MPC),等等)通信。在MS辅助模式(例如MS辅助AGPS模式)下,远程计算机132可被配置为确定移动计算设备的位置并提供包括定位的无线数据。在辅助移动计算设备10时,远程计算机132可负责各种处理操作,还可提供信息以便辅助位置确定。在不同实施例中,设备10可包括专用硬件电路或结构或者专用硬件和相关软件的结合,来支持置确定。例如,收发器模块120和天线系统122可包括联接到无线处理器104的GPS接收器或收发器硬件和一个或多个相关的天线,来支持位置确定。参照图6,在一个示例性实施例中,设备10包括在处理器上被执行的操作系统,操作系统601。操作系统601被配置为从用户输入设备621和麦克风622接收信号,并向应用程序和程序631提供命令信号或数字指令。操作系统601还被配置为从应用程序和程序631接收数据信号和/或信息信号,并向显不器18和扬声器提供信号。操作系统601可在两种不同的操作模式下运行,一种是传统模式/配置611,一种是语音模式/配置612。操作系统601可进一步包括话音到文本模块641和文本到话音模块642。话音到文本模块641是被配置为将音频信号转换为文本(例如文字、音素、ASCII字符等)的话音转换模块。文本到话音模块642是被配置为将文本转换为音频信号的文本转换模块。在一个示例性实施例中,操作系统601是由加利福尼亚州森尼维耳市(Sunnyvale)的帕姆公司(Palm, Inc.)推出的升级版本的webOS或安装有语音模式软件的webOS。webOS是基于LINUX的操作系统,其使用用于管理多任务的“卡”系统。在另一实施例中,操作系统601是专门管理手机或掌上电脑上的应用程序的应用管理软件。在另一示例性实施例中,操作系统601提供给使用设备10的用户,使得用户具有关于语音模式/配置612的端到端解决方案。从而,用户无需寻求除设备10之外的软件或硬件来实施在不同实施例中描述的功能。
在传统模式611下,用户通过用户输入设备621提供指令,用户输入设备621可包括键盘、触摸屏、触摸板、按钮、鼠标、指示笔或用户可以接触以提供其意图或指令的任意输入设备。用户对用户输入设备621之一的接触可包括不止一种动作,例如,推、拉、敲、击、抓、或者通过使用户身体的一部分接触用户输入设备621之一而以信号告知用户意图的任何动作。当操作系统601接收指令时,其将相应的命令或数字指令发送到用户想使用或正在使用的应用程序和程序631。在语音模式612下,用户通过语音经由语音传感器(例如,麦克风622)提供指令。麦克风622将语音转换为语音信号。然后话音到文本模块641将语音信号转换为文本。操作系统601识别该文本,并将该文本转换为指令。可替代地,操作系统601还可直接将语音信号转换为指令。然后,操作系统601将相应的命令或 数字指令发送给应用程序和程序631。该设备可被配置为在附加模式下操作,附加模式可结合来自传统模式和语音模式的特征、或可具有其它的用户输入特征。当应用程序和程序631中的任意一个具有用户的信息或数据时,其可将文本信息发送给操作系统601。在传统模式611下,操作系统601可将文本显不于显不器18上。在语音模式612下,操作系统601可利用文本到话音模块642将文本转换为语音,并通过扬声器将语音提供给用户。在一个示例性实施例中,文本到话音模块642与其它应用程序共享处理器。在另一示例性实施例中,具有专用于将文本转换为话音的处理器。应用程序和程序631可包括电子邮件、电话、SMS、互联网搜索、网页浏览器、文本处理、音乐播放、天气、股票报价、游戏或移动设备可提供的任何应用程序、程序、功能或服务。根据一个示例性实施例,操作系统601的操作模式对于应用程序和程序631是透明的。在该示例性实施例中,对于相同的指令,发送给应用程序和程序631的命令或数字指令是相同的,而不管相应的指令是从用户输入设备621接收还是从麦克风622接收。在另一实施例中,对于相同的指令,发送给应用程序和程序631的命令或数字指令的一部分是相同的。在一个示例性实施例中,应用程序和程序631以相同的方式(例如,以相同的数据格式和/或数据内容)接收命令或数字指令,而不管相应的指令是从用户输入设备621接收还是从麦克风622接收。在另一示例性实施例中,应用程序和程序631以非常相似的方式接收并处理命令或数字指令。这种不可知结构可减少修改或升级应用程序和程序631的需要,这是因为与传统模式611相兼容的应用程序和程序631将与语音模式612相兼容。参照图7,当打开设备10 (步骤700)时,其检查预定要求是否被满足,以决定其应在哪一种模式下操作(步骤710)。如果预定要求被满足,则设备10将进入语音模式612(步骤721)。(否则,设备10将进入传统模式611 (步骤722))。预定要求(例如,确定设备10与免提汽车电话通信)可包括任何自动的要求,任何自动的要求可包括在确定或切换模式时不需要用户输入来确定模式的任何要求。参照图8,设备10可在两种模式之间进行切换。在一个示例性模式下,当设备10正在传统模式611下操作时,用户可接触用户输入设备621,以变为语音模式612(步骤811)。可替代地,当预定要求被满足时,设备10将自动变为语音模式612,而无需来自用户的进一步指令(步骤812)。当设备10处于语音模式612时,用户或者可以例如说“切换模式”(步骤821)或者可以接触用户输入设备621 (步骤822)来将设备10切换到传统模式611。
在不同示例性实施例中,预定要求包括设备的环境和/状态。在一个实施例中,当设备10检测到其周围的环境满足特定条件时,设备10可从传统模式611切换到语音模式612。在另一示例性实施例中,当设备10的内部状态以特定方式改变时,其可从传统模式611切换到语音模式612。在一个示例性实施例中,预定要求包括设备10与汽车通信(例如,以有线或无线方式连接)。例如,当设备10连接到汽车配套设备时,设备10将自动切换到语音模式612。因此,在用户正在驾驶并接收提供给用户的电子邮件或其它数据时,用户不需要手动将设备10切换到语音模式612。在另一示例性实施例中,设备10具有位置确定电路134,并且用户可将特定位置,例如停车场、家庭车道或上班的路上,设置作为预定要求的其中一个要求。当设备10检测到其位于预定位置的经度和纬度范围内时,设备10将切换到语音模式612。在另一示例性实施例中,设备10具有位置确定电路134,并且预定要求包括设备10运动速度快于特定速度。例如,如果设备10检测到其运动速度快于每小时20英里,这表 示用户可能正在驾驶,则设备10将切换到语音模式612,而无需用户输入。在另一示例性实施例中,预定要求包括已到达特定时间。例如,用户可设置日历事件,并知道在事件发生时用户将不能拿着手机。用户可以以当日历事件被激发时设备10在没有进一步指令的情况下即可切换到语音模式612的方式设置设备10。在另一示例性实施例中,设备10装配有被配置为检测光强度的光传感器。预定要求包括光处于预定强度范围内。例如,如果光非常暗(例如,低于预定强度阈值),则设备10将自动切换到语音模式612。在另一示例性实施例中,预定要求包括设备10检测到特定附件的存在。例如,当将附件麦克风插入到设备10时,设备10可自动切换到语音模式612。在不同实施例中,用户可选择是否以及如何开启预定要求。用户可基于他/她的喜好不时改变设置,该设置可以以表格的形式存储在处理电路可访问的存储器中以确定在传统模式611、语音模式612或另一模式中的哪一个模式下操作。参照图9. I和图9. 2,图示了用于将语音转换或转变为文本的两种系统,不过其它系统也是可想到的。参照图9. 1,语音到文本模块641可在处理电路内将语音转换为文本。在接收到来自麦克风的语音信号(步骤910)之后,语音到文本模块可识别出语音信号并将其转换为文本信号(步骤911)。语音到文本模块641可采用易于利用的话音识别技术。参照图9. 2,在接收到语音信号(步骤921)之后,语音到文本模块641可通过天线系统122将语音信号发送到另一计算机,计算机132 (步骤922)。在一个实施例中,计算机132是由远离设备10的服务提供商维护的服务器。服务器向设备10提供语音到文本服务、接收来自设备10的语音信号,并将文本信号发送给设备10 (步骤923)。在一个示例性实施例中,语音到文本模块可以是独立的软件程序。在另一示例性实施例中,语音到文本模块可被嵌入到操作系统601内。在又一示例性实施例中,语音到文本模块可具有专门的处理电路(例如,包括处理器)。参照图10,示出了在传统模式611和语音模式612两种模式下发送电子邮件的过程的一个示例性实施例。在步骤1000,打开或开启设备10。在步骤1010,例如利用上述方法中的一种方法确定模式。在设备10进入传统模式611 (步骤1021)之后,用户可通过使用用户输入设备621打开或操作电子邮件服务、功能或程序(步骤1031)。在设备10进入语音模式612 (步骤1022)之后,一旦处理电路检测到用户说出“电子邮件”(步骤1032),则打开或操作电子邮件服务、功能或程序。一旦打开或启动电子邮件(步骤1040),则在传统模式611下,设备10被配置为从用户输入设备621 (例如键盘)接收文本(步骤1051)。在语音模式612下,撰写电子邮件的步骤包括接收来自用户的文本口述(步骤1052)、语音到文本模块将语音转换为文本(步骤1062)、文本到语音模块642向用户读转换后的文本(步骤1072)以及用户修改或确认文本(步骤1082)。用户可通过说出由设备10接收的“确认”或“发送”或其它响应来表示确认。用户可通过说出“修改”来表示文本需要进一步的修改。设备10可被配置为在用户最终确认在任一操作模式下的电子邮件的文本时发送电子邮件(步骤1090)。关于电子邮件的其它指令可通过语音提供。例如,用户可说出收件人的名字或电子邮件地址、电子邮件的主题,并且电子邮件可被标识为高度重要,等等。当用户想撰写电子邮件正文的文本时,用户可以说“电子邮件正文”。如果用户不想立即发送,则用户可以说“存储为草稿”。此外,在语音模式612下,当接收到电子邮件时,操作系统601可将设备10从睡眠状态(例如,低功耗状态)唤醒,并向用户提供语音,例如“接收到电子邮件”。然后,用户可提供关于新电子邮件的一系列指令,例如,“读电子邮件”、“答复”、“转发”、“答 复所有”、“下一封电子邮件”。根据该实施例,设备10被配置为通过语音接收来自用户的请求、处理该请求、通过音频输出提供一个或多个响应、以及通过语音(或输入键)接收来自用户的附加请求以进一步处理相同应用程序中的相关任务(例如电子邮件、日历约会、网页浏览,等等)。参照图11,图示了播放音乐文件的过程的示例性实施例。当打开设备10 (步骤1100)时,通过用户输入或通过设备10的环境/内部状态来确定操作模式(步骤1110)。如果设备10进入传统模式611 (步骤1121),则设备10被配置为从用户输入设备621 (例如键盘)接收指令(步骤1131)。可替代地,如果设备10进入语音模式612 (步骤1122),则设备10被配置为从麦克风622接收指令(例如用户说“音乐”)(步骤1132)。当启用音乐程序或打开音乐播放器(步骤1140)时,在传统模式611下,设备10被配置为从用户输入设备621接收用户的音乐文件选择(步骤1151)。在语音模式612下,设备10被配置为从麦克风622接收用户的音乐文件选择(步骤1152)。然后,如果需要,设备10可播放或读出与所选择的音乐文件对应的一个或多个歌曲选(步骤1153)。然后,设备10将在任一操作模式下播放接收的所选择的音乐文件(步骤1160)。用户也可通过语音提供其它指令,例如“停”、“转向下一首歌曲”、“音量调高”、“音量调低”。在一个示例性实施例中,用户可在语音模式612下打开网页浏览器。在设备处于语音模式612时,用户可以说“互联网浏览”。操作系统601被配置为通过语音传感器(例如麦克风)检测语音“互联网浏览”。然后系统10打开网页浏览器。操作系统601被配置为检测用户想要浏览的互联网地址。在一个示例性实施例中,该互联网地址涉及理想地具有专门指定的用途或仅具有几个选择的网站,使得设备10可通过扬声器读出网站的内容。在另一示例性实施例中,网站是专门为在访问其互联网地址和信息时无法看、观看或读的用户创建的,并且已经通过语音给出了选择。在一个示例性实施例中,用户可在语音模式612下拨打电话。操作系统601被配置为检测用户说“打电话”,并启用电话程序。然后操作系统601被配置为检测用户说出用户想与其通话的人的名字或用户想拨的号码。确认之后,设备10自动(例如,无需手动或身体活动的用户输入)向所指示的人或号码拨打电话。当有来电时,电话程序也可被启用。用户可以说出针对该来电的指令,例如“接听”、“拒绝”或“转到语音信箱”。当用户试图拨打或应答电话,且耳机或听筒并未连接时,操作系统601可指示设备10进入扬声器模式,并通过扬声器26提供语音。在一个示例性实施例中,用户可在语音模式612下发送文本消息。操作系统601被配置为检测用户说“消息”,并启用消息程序。操作系统601被配置为接收用户口述消息内容。设备10可通过文本到话音模块601和扬声器向用户读消息的文本。在确认文本是正确的之后,用户然后可说出他/她想将消息发送给的那个人的名字或号码。在一个示例性实施例中,用户可在语音模式612下搜索互联网。用户可以说“互联网搜索”,以便打开“互联网搜索”服务/功能/程序。用户然后可说出搜索项,设备10将自动搜索所说的搜索项。在一个实施例中,设备10将通过文本到话音模块642读出搜索结 果O 应注意,在一个示例性实施例中,在语音模式612下可以打开的应用程序和程序的全部或大部分可在传统模式611下打开,反之亦然。在一个示例性实施例中,操作系统601具有两个用户接口,即传统接口和语音接口。在语音接口下,用户可通过向设备IO说话来给出每条指令,并从扬声器接收来自设备10的响应。用户和设备10之间的所有交互均可通过语音来处理。用户无需触摸任何事物来给出指令、或无需观看显示器18来获取反馈或信息。关于图12,图示了对应用程序的接口的示例性实施例。在一个示例性实施例中,可通过两个触发器开始与设备的会话。一个触发器是设备到用户(设备驱动触发器,DDT),例如,当用户接听电话时、或当用户接收SMS、电子邮件或任意通知时。另一个触发器是用户到设备(用户驱动触发器,UDT),例如,当用户发送新电子邮件/SMS、浏览网页、检索导航信息时。在另一示例性实施例中,对于每个会话,均具有语境。例如,对于DDT,触发器是电话、SMS或任意通知,而语境将为电话应用程序、SMS应用程序以及经识别的与通知有关的应用程序。因此,语境是与触发器有关的应用程序。对于UDT,触发器是用户发送电子邮件/SMS、浏览网页、获取导航,等等,而语境被识别为例如电子邮件/SMS、网页浏览器、导航工具等的应用程序。如此,话音/应用程序接口管理器(SAM)1205被配置为识别用于与语境的状态交互并监控语境的状态的应用程序。一旦选择语境,则SAM 1205被配置为识别动作。在一个示例性实施例中,SAIM 1205利用动态语法识别动作。例如,如果语音由处理电路接收,则SAIM 1205被配置为识别用于调用语境应用程序的功能需要。SAIM 1205还被配置为辨认需要口述,并进入其中可将语音转换为文本的自由文本模式。在SAIM 1205识别语境、动作和自由文本之后,其利用语音到命令转换器1203将语境和动作映射到正确的应用程序插件1202和应用程序编程接口 1201 (API)。利用被应用程序暴露的API 1201,应用程序插件1202将与应用程序交互。利用API 1201,应用程序将完全意识不到语音模式/配置和话音接口。具有本领域普通技能的人员会辨认出在话音辨认方面具有至少三种语法。具有固定语法,其中语法被预输入到话音引擎1204。例如,将城市或国家的编码和名字预输入到话音引擎1204。具有动态语法,其在运行时基于语境被输入到话音引擎1204。例如,在动态语法下,运行时将地址簿中的所有名字均输入到话音引擎1204,并请用户“说出名字”,并且处理电路将从输入的名字中搜索联系人。在动态语法的另一示例中,处理电路被配置为将几个选项(例如,读、答复、转发、撰写)输入到话音引擎1204,并请用户说出这些其中之一,以及将用户话语与这四个中的一个进行匹配。在又一示例中,处理电路被配置为输入在最近AMC上播放的电影的名字,并请用户“说出名字”。具有自由话音语法,例如,处理电路处理口述或记录。具有本领域普通技能的人员会认识到话音到文本引擎/模块641可使用这些语法中的任意一种或组合以及任意其它可适用的语法。在一个示例性实施例中,SAIM1205被集成在操作系统601内。在另一示例性实施例中,SAIM 1205为安装在操作系统601上的附加软件。这里公开的各个实施例可包括被配置为在其中存储机器可执行指令的计算机可读介质,和/或一个或多个模块、电路、单元或其它元件(其可包括被配置或布置为执行这里记载的一个或多个步骤的模拟和/或数字电路组件(例如,处理器或其它处理电路)),或者结合这些被实现。作为示例,计算机可读介质可包括RAM、ROM、CD-ROM或者其它的光盘存储、磁盘存储、闪存,或者能够存储期望的机器可执行指令并提供对其的访问的任意其它介质。在这里电路或模块的使用意味着广泛地包括分立的电路组件、模拟和/或数字电路 组件、集成电路、固态器件和/或上述中任意一个的编程部分(包括微处理器、微控制器、ASIC、可编程逻辑或其它的电子设备)中的任意一个或多个。尽管详细的附图、特定示例以及给出的具体表述描述了优选和示例性实施例,但它们仅用于例证的目的。所公开的发明不限于所示的具体形式。例如,可以按照步骤的多种顺序中的任意一种顺序来执行这些方法。所示和所描述的硬件和软件配置可根据计算设备的选定性能特性和物理特性而不同。例如,计算设备、通信总线或所使用的处理器的类型可以不同。所示和所描述的系统和方法不限于所公开的精确的细节和条件。此外,在不背离如所附权利要求所表达的本发明的范围的情况下,可对示例性实施例的设计、操作条件和配置进行其它置换、修改、改变和省略。
权利要求
1.一种移动计算设备,包括 夕卜壳; 被配置为检测声音的语音传感器; 扬声器;以及 被配置为在第一模式和第二模式两种模式下操作的处理电路,其中在所述第一模式下,所述处理电路被配置为通过检测用户触摸所述设备或所述设备的附件来接收来自所述用户的指令,而在所述第二模式下,所述处理电路被配置为通过所述语音传感器来接收来自所述用户的语音的指令; 其中当预定要求被满足时,所述处理电路被配置为从第一模式切换到第二模式,而无需在切换时从所述用户接收特定指令来切换所述模式。
2.根据权利要求I所述的移动设备,其中所述预定要求包括所述移动设备直接或通过汽车的附件连接到所述汽车。
3.根据权利要求I所述的移动设备,其中所述预定要求包括所述移动设备检测到附件的存在。
4.根据权利要求I所述的移动设备,其中所述移动设备包括位置确定电路,并且所述预定要求包括所述移动设备处于预定位置。
5.根据权利要求I所述的移动设备,其中所述预定要求包括到达预定时间。
6.根据权利要求I所述的移动设备,其中所述移动设备包括位置确定电路,并且所述预定要求包括所述移动设备正在以高于预定速度的速度移动。
7.根据权利要求I所述的移动设备,其中所述移动设备具有光传感器,并且所述预定要求包括由所述光传感器检测的光强度大于或小于预定光强度。
8.一种其中存储有指令的机器可读介质,所述指令在由设备内的一个或多个处理电路执行时促使所述一个或多个处理电路执行将所述设备从第一模式切换到第二模式的方法,所述方法包括 基于所述设备的环境和/或状态,在预定要求被满足时,将所述设备从所述第一模式切换到所述第二模式,其中在所述第一模式下,所述一个或多个处理电路被配置为通过检测用户触摸所述设备或所述设备的附件来接收来自所述用户的指令,而在所述第二模式下,所述一个或多个处理电路被配置为接收来自所述用户的语音的指令。
9.根据权利要求8所述的方法,其中在语音配置下接收的指令包括拨打电话号码,其中所述电话号码或与所述电话号码相关的名字是从所述用户的语音中检测得到。
10.根据权利要求8所述的方法,其中在语音配置下接收的指令包括将检测到的语音转换为文本。
11.根据权利要求10所述的方法,其中所述一个或多个处理电路被配置为将检测到的语音转换为文本。
12.根据权利要求10所述的方法,其中所述一个或多个处理电路被配置为将检测到的语音发送到用于将所述语音转换为文本的远程计算机,并从所述远程计算机接收转换后的文本。
13.根据权利要求10所述的方法,其中所述移动设备包括被配置为将所述文本转换为语音的文本到话音模块,并且所述移动设备被配置为将所述语音提供给所述用户,并询问从语音到文本的转换是否正确。
14.根据权利要求10所述的方法,其中在语音模式下接收的指令包括撰写电子邮件,所述电子邮件的文本是从所述用户的语音转换而来。
15.根据权利要求9所述的方法,其中在语音模式下接收的指令包括浏览因特网,待浏览的因特网地址是从所述用户的语音转换而来。
16.一种移动计算设备,包括 外壳,被配置为在使用过程中被握在手中; 用户输入设备,被配置为检测用户触摸所述移动设备或所述设备的附件,并将所述触摸转换为第一数字指令; 被配置为检测声音的语音传感器; 话音转换模块,被配置为将所述声音转换为第二数字指令; 以及处理模块,被配置为在第一模式下将所述第一数字指令提供给多个不同程序或应用程序中的任意一个,而在第二模式下将所述第二数字指令提供给所述多个不同程序或应用程序中的任意一个。
17.根据权利要求16所述的移动设备,其中对于经由所述用户输入设备或语音传感器提供的相同用户指令,所述第一数字指令和所述第二数字指令包括共同的数字指令部分。
18.根据权利要求16所述的移动设备,其中对于经由所述用户输入设备或语音传感器提供的相同用户指令,所述第一数字指令和所述第二数字指令以相同的方式由所述多个不同程序或应用程序中的任意一个接收。
19.根据权利要求16所述的移动设备,其中由所述多个不同程序或应用程序中的任意一个接收的数字指令包括播放在所述设备中存储的声音文件。
20.根据权利要求16所述的移动设备,其中由所述多个不同程序或应用程序中的任意一个接收的数字指令操纵文件或文档。
全文摘要
一种移动设备或系统,包括外壳;被配置为检测声音的语音传感器;扬声器;以及被配置为在第一模式和第二模式两种模式下操作的处理电路。处理电路在处于第一模式时通过检测用户触摸设备或设备的附件来接收来自用户的指令,而在处于第二模式时通过语音传感器接收来自用户的语音的指令。当预定要求被满足时,处理电路被配置为从第一模式切换到第二模式,而无需在切换时从用户接收特定指令来切换模式。
文档编号H04W88/02GK102792764SQ201180012880
公开日2012年11月21日 申请日期2011年2月1日 优先权日2010年2月10日
发明者尼拉杰·巴里, 施莱德·Y·什里达尔 申请人:惠普发展公司,有限责任合伙企业
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1