用于提供语音-言语服务的方法和实现该方法的移动终端的制作方法

文档序号：6538456阅读：221来源：国知局

用于提供语音-言语服务的方法和实现该方法的移动终端的制作方法
【专利摘要】本发明提供了一种用于提供语音-言语服务的方法和实现所述方法的移动终端。所述方法包括：从传感器单元接收感测信息；根据感测信息来确定是否将语音-言语服务的操作模式设置为驾驶模式；当语音-言语服务的操作模式被设置为驾驶模式时，根据预存储的驾驶模式设置信息来提供可听反馈。
【专利说明】用于提供语音-言语服务的方法和实现该方法的移动终端
【技术领域】
[0001]本公开涉及一种用于提供语音-言语(voice-speech)服务的方法和实现所述方法的移动终端，在所述方法中，在移动终端中对用户的语音进行识别，使用语音将与用户的语音相应的反馈提供给用户。
【背景技术】
[0002]现有技术语音-言语服务由用户和移动终端(其可以是智能电话或任何合适的便携式电子装置)的语音代理之间的言语、说话或语音交互(诸如语音或言语交谈)以及用于示出与言语相关的内容(其包括言语历史记录)的图形用户界面(GUI)组成。现有技术语音-言语服务基本上是基于观看屏幕的状况而设计的服务。也就是说，当为了选择、更正和编辑内容而观看屏幕时，用户与语音代理频繁进行交互(即，交谈)。
[0003]如果用户的语音被输入到麦克风，则语音被通过例如进行言语到文本(STT)转换而转换为文本，并随后被输出在屏幕上。文本的含义被处理，且处理结果被提供为GUI反馈和文本到言语(TTS)反馈。也就是说，GUI反馈是在屏幕上显示的视觉信息，且TTS反馈是在文本被转换为语音后可通过扬声器输出的听觉信息。当存在许多结果时，通常只有摘要信息被提供为TTS反馈，且详细信息被提供为GUI反馈。同样地，详细信息被可视地提供，或者换句话说，被输出为用于观看的可视信息而不是用于倾听的可听信息。
[0004]然而，根据现有技术语音-言语服务，当用户的状况明显受到限制，使得用户无法观看移动终端时，用户难以使用语音-言语服务。具体地，当用户正在驾驶时，GUI反馈会干扰驾驶并且威胁到用户的安全。
[0005]以上信息仅作为背景信息被呈现以帮助对本公开的理解。至于上述内容中的任何内容是否可应用为针对本公开的现有技术，未做出确定，也未做出断定。

【发明内容】

[0006]本公开的各方面在于解决至少一个上述问题和/或缺点，并提供至少下述优点。因此，本公开的一方面可提供一种提供针对用户的状况而优化的语音-言语服务的方法以及实现所述方法的移动终端。具体地，本公开可提供一种提供针对驾驶或操作车辆的状况而优化的语音-言语服务的方法以及实现所述方法的移动终端。
[0007]根据本公开的一方面，提供了一种移动终端中的语音-言语服务的方法。所述方法包括:从传感器单元接收感测信息；根据感测信息来确定是否将语音-言语服务的操作模式设置为驾驶模式；当语音-言语服务的操作模式被设置为驾驶模式时，根据预存储的驾驶模式设置信息来提供可听反馈。
[0008]根据本公开的另一方面，提供了一种移动终端中的语音-言语服务的方法。所述方法包括:接收消息；将消息转换为可听反馈；当语音-言语服务的操作模式是驾驶模式时，根据预存储的驾驶模式设置信息来提供可听反馈。
[0009]根据本公开的另一方面，提供了一种移动终端中的语音-言语服务的方法。所述方法包括:从麦克风检测语音数据；执行与语音数据相应的功能；将执行功能的结果转换为可听反馈；如果语音-言语服务的操作模式是驾驶模式，则根据预存储的驾驶模式设置信息来提供可听反馈。
[0010]根据本公开的另一方面，提供了一种用于提供语音-言语服务的移动终端。所述移动终端包括:麦克风；扬声器；音频处理单元，被配置为处理从麦克风和扬声器中的至少一个接收到的信号；存储单元，被配置为存储驾驶模式设置信息；传感器单元，被配置为感测物理量；控制器，被配置为控制麦克风、扬声器、存储单元、音频处理单元和传感器单元中的至少一个，其中，控制器被配置为接收感测信息，以根据感测信息确定是否将语音-言语服务的操作模式设置为驾驶模式，并且如果语音-言语服务的操作模式被设置为驾驶模式，则根据驾驶模式设置信息来提供可听反馈。
[0011]通过以下公开了本公开的各个实施例的结合附图的详细描述，本公开的其它方面、优点和显著特征对于本领域技术人员而言将变得清楚。
【专利附图】

【附图说明】
[0012]通过以下结合附图的描述，本公开的特定实施例的以上和其它方面、特征和优点将更加清楚，其中:
[0013]图1是根据本公开的实施例的移动终端的框图；
[0014]图2是示出根据本公开的实施例的设置驾驶模式的方法的流程图；
[0015]图3A和图3B是根据本公开的实施例的设置驾驶模式的屏幕的示例；
[0016]图4是示出根据本公开的实施例的提供语音-言语服务的方法的流程图；
[0017]图5A是根据本公开的实施例的当语音-言语服务被设置为非驾驶模式时播放的消息的示例；
[0018]图5B是根据本公开的实施例的当语音-言语服务被设置为驾驶模式时显示的消息的示例；
[0019]图6是示出根据本公开的另一实施例的提供语音-言语服务的方法的流程图；
[0020]图7A是根据本公开的实施例的当语音-言语服务被设置为非驾驶模式时显示的图形用户界面(GUI)反馈的示例；
[0021]图7B是根据本公开的实施例的当语音-言语服务被设置为驾驶模式时显示的⑶I反馈的示例。
[0022]贯穿附图，应该注意到的是，使用相同的标号来示出相同或相似的元件、特征和结构。
【具体实施方式】
[0023]提供以下参照附图的描述来帮助对由权利要求及其等同物限定的本公开的各个实施例的全面理解。虽然以下描述包括用于协助所述理解的各种特定细节，但是这些特定细节将被认为仅仅是示例性的。因此，本领域普通技术人员将认识到的是，在不脱离本公开的范围和精神的情况下，可对在此描述的各个实施例做出各种改变和修改。此外，为了清楚和简洁，可省略对公知的功能和构造的描述。
[0024]在以下描述和权利要求中使用的术语和词语不限于字面含义，而仅被发明人用于实现对本公开的清楚和一致的理解。因此，本领域的技术人员应该清楚的是，提供以下对本公开的各种实施例的描述，仅用于说明目的而并非用于限制由权利要求及其等同物所限定的本公开的目的。
[0025]将理解的是，除非上下文清晰地另有指示，否则单数形式包括复数的指示物。因此，例如，参考“组件表面”包括参考这样的表面中的一个或更多个。
[0026]在下文中，将描述一种提供语音-言语服务的方法和实现所述方法的移动终端。
[0027]根据本公开的移动终端可以是便携式终端、便携式电子装置或者被安装在车辆中且可移动的终端或电子装置。例如，移动终端可以是智能电话、平板个人计算机(PC)、PC、笔记本计算机、数码相机、个人数字助理(PDA)、便携式多媒体播放器(PMP)、媒体播放器(诸如运动图像专家组(MPEG)音频层3 (MP3)播放器)、导航终端或任何其它相似的和/或合适的电子装置。
[0028]根据本公开的移动终端提供可听反馈(例如，从扬声器输出的语音)、可视反馈(例如，显示在显示单元的屏幕上的图像)和触觉反馈(例如，包括在移动终端中的振动马达的振动)，以及任何其它相似的和/或合适的反馈。可听反馈可被称作文本到言语(TTS)反馈、可听信息、可听内容、可听反馈，且词语“可听”可与“音频”和“听觉”可替换地使用。可视反馈可被称为图形用户界面(GUI)反馈、可视信息、可视内容、可视反馈，且词语“可视”可与“视频”可替换地使用。具体地，当用户正在驾驶时，与本公开的移动终端被使用的环境相应的模式被设置为驾驶模式。例如，在驾驶模式下，扬声器的语音设置值被设置为最大值，语音的重放速度的设置值被根据信息量而自动设置为最大值，且GUI反馈的字体大小的设置值被设置为最大值。此外，参照驾驶模式的设置信息来提供TTS反馈和CTI反馈。这样，在不干扰由用户执行的驾驶的情况下，可向用户提供语音-言语服务。
[0029]图1是根据本公开的实施例的移动终端的框图。
[0030]参照图1，根据本公开的实施例的移动终端包括显示单元110、键输入单元120、存储单元130、无线通信单元140、音频处理单元150、扬声器SPK、麦克风MIC、耳机插孔160、传感器单元170、GPS接收单元180和控制器190。
[0031]在控制器190的控制下，显示单元110在屏幕上显示数据。也就是说，如果控制器190处理数据(例如，对数据进行解码)并在缓冲器中存储经处理的数据，则显示单元110将存储在缓冲器中的数据转换为模拟信号，并在屏幕上显示所述模拟信号。如果显示单元110被供电，则显示单元110可根据移动终端100的状态在屏幕上显示锁定图像。如果在锁定图像正被显示的情况下检测到解锁信息，则控制器190解除锁定并停止显示锁定图像。在控制器190的控制下,显示单元110还显示例如起始图像以代替锁定图像。起始图像可包括背景图像(例如，由用户设置的照片)、被显示在背景图像上的多个图标或者可在显示单元110上显示的任何其它相似的和/或合适的图像。在此，图标分别指示应用、内容或者任何相似的和/或合适的元素，诸如照片文件、视频文件、录音文件、文档和消息。如果所述图标之一(例如，应用图标)被用户选择，则控制器190执行相应的应用。显示单元110从控制器190接收应用的运行图像，将所述运行图像转换为模拟信号，并输出所述模拟信号以显示在显示单元Iio上。
[0032]在控制器190的控制下，显示单元110可以以多层结构在屏幕上显示图像。例如，显示单元110在其上显示语音-言语服务的运行图像并显示⑶I反馈。[0033]显示单元110可由液晶显示器(IXD)、有机发光二极管(OLED)显示器、有源矩阵OLED (AMOLED)显示器、柔性显示器、透明显示器或者任何其它相似的和/或合适的类型的显示器构成。
[0034]触摸面板111被安装在显示单元110上。具体地，触摸面板111被实现为位于显示单元110上的附加(add-on)型元件或单元，并且可以是被插入到显示单元110中的外挂(on-cell)型或者内嵌(in-cell)型。
[0035]触摸面板111响应于用户在屏幕上的手势而产生触摸事件，通过执行模拟到数字(AD)转换将触摸事件转换为数字数据，并将数字数据发送到控制器190。在此，触摸事件包括一个或更多个触摸坐标(x，y)。例如，触摸面板111的触摸集成电路(IC)检测用户的触摸，响应于触摸而确定触摸区域的触摸坐标(X，y)，并将触摸区域的触摸坐标(X，y)发送到控制器190。在此，触摸坐标(x，y)可以在像素单元中。例如，当屏幕的分辨率是640X480(其中，640是水平像素的数量，480是垂直像素的数量)时，X轴坐标在(0,640)的范围内，且y轴坐标在(0,480)的范围内。
[0036]当从触摸面板111接收到触摸坐标时，控制器190确定触摸输入工具(例如，手指或笔)已经触摸到触摸面板111，并且当未从触摸面板111接收到触摸坐标时，控制器190确定触摸输入工具的触摸已经被释放。此外，当触摸坐标从(Xtl, y0)改变为(X1, Y1)且变化(例如，D (D2= (Xtl-X1)2+(yQ-yi)2))超出预设的移动阈值(例如，Imm)时，控制器190确定触摸输入工具已经移动。响应于触摸输入工具的移动，控制器190计算触摸输入工具的位置变化(dx，dy)(或者换句话说，移动量)和触摸输入工具的移动速度。控制器190基于触摸坐标将用户在屏幕上的手势确定为触摸、多触摸、敲击、双重敲击、长按、敲击及触摸、拖动、轻弹、按压、捏合(pinch-1n)、张开(pinch-out)以及任何其它相似的和/或合适的触摸手势中的一个触摸手势，确定触摸输入工具的触摸是否已经被释放、触摸输入工具是否已经移动，确定触摸输入工具的位置变化或移动量以及触摸输入工具的移动速度。
[0037]触摸是用户使触摸输入工具接触屏幕的手势，多触摸是多个触摸输入工具(例如，拇指和食指，或者多于一个的触控笔)触摸屏幕的手势，敲击是触摸输入工具触摸屏幕的一点并随后从该点释放的手势，双重敲击是连续两次敲击一点的手势，长按是相对长时间地触摸一点的手势并随后释放对该点的触摸的手势，敲击和触摸是敲击屏幕的一点并随后在预定时间(例如，0.5秒)内再次触摸该点的手势，拖动是在一点被触摸的状态下在预定方向上移动触摸输入工具的手势，轻弹是与拖动相比较而言快速地移动触摸输入工具并释放触摸的手势，按压是触摸一点并保持触摸而超过预定时间(例如，2秒)不移动的手势，捏合是使用两个触摸输入工具同时多触摸两点并随后缩小触摸输入工具之间的间隙的手势，张开是扩大触摸输入工具之间的间隙或距离的手势。也就是说，触摸是至少一个触摸输入工具与触摸面板111的接触，并且其它手势是触摸的改变。
[0038]触摸面板111可包括对手部手势(hand gesture)进行感测的手部触摸面板和对笔式手势(pen gesture)进行感测的笔式触摸面板。这里，手部触摸面板被实现为电容型。手部触摸面板可被实现为电阻型、红外线型或超声波型。此外，手部触摸面板不仅通过手部手势产生触摸事件，还可通过另一对象(例如，可改变电容的导电材料的对象)产生触摸事件。笔式触摸面板可被形成为电磁感应型。因此，笔式触摸面板通过来自形成或产生磁场的笔的触摸来产生触摸事件。具体地，在笔式触摸面板中产生的触摸事件包括指示触摸类型以及触摸坐标的值。例如，当从笔式触摸面板接收到第一电压电平值时，控制器190确定触摸输入工具的触摸是否是间接触摸，诸如悬停触摸手势。当从触摸面板111接收到大于第一电压电平值的第二电压电平值时，控制器190确定触摸输入工具的触摸是直接触摸。此夕卜，由笔式触摸面板产生的触摸事件还可包括指示安装在笔中的键是否已经被按压的值。例如，如果安装在笔中的键被按压，则在笔的线圈中产生的磁场被改变，并且笔式触摸面板响应于磁场的改变而产生第三电压电平值，并将第三电压电平值发送到控制器190。
[0039]键输入单元120可包括至少一个触摸键。触摸键被实现为电容型或电阻型，用于对用户的触摸进行感测。触摸键响应于用户的触摸而产生事件，并将事件发送到控制器190。此外，触摸键可被安装为与屏幕邻近，例如，屏幕的下方。此外，除了触摸键之外，键输入单元120可包括另一种类型的键。例如，可包括圆顶键类型、起始键类型或者任何其它相似的和/或合适的类型的键。如果用户按压起始键，则起始键转而接触印刷电路板，并且因此在印刷电路板中产生键事件，且键事件被发送到控制器190。此外，如果用户按压起始键两次，则可根据本公开来执行语音-言语服务应用131。
[0040]存储单元130可以是作为非易失性计算机可读存储介质的盘、随机存取存储器(RAM)、只读存储器(ROM)、闪存或任何其它相似的和/或合适的硬件元件。在控制器190的控制下，存储单元130存储在移动终端100中产生的数据或者通过无线通信单元140从外部装置(诸如，服务器、台式个人计算机(PC)、平板PC或任何其它相似和/或合适的外部装置)接收到的数据。此外，针对复制和粘贴或者其它相似的和/或合适的动作，存储单元130暂时存储由用户从消息、照片、web页、文档或其它相似的和/或合适的数据源复制和/或产生的数据。
[0041]此外，存储单元130存储驾驶模式设置信息132。在此，驾驶模式设置信息132可包括音量设置值、重放速度设置值、字体大小设置值或任何其它相似的和/或合适的设置值。音量设置值指示从扬声器SPK输出的声音的音量。例如，当语音-言语服务的操作模式被设置为驾驶模式时，音量设置值可被设置为指示最大音量的值。重放速度设置值指示从扬声器SPK输出的声音的速度。例如，在非驾驶模式的情况下，重放速度设置值可被设置为单倍速率，并且在驾驶模式的情况下，重放速度设置值可被设置为双倍速率。字体大小设置值是指示GUI反馈中的文本的大小的值。例如，在非驾驶模式下，字体大小设置值可被设置为字体大小12，并且在驾驶模式下，字体大小设置值可被设置为字体大小20。此外，驾驶模式设置信息132还可包括屏幕的颜色设置值和屏幕的亮度设置值。例如，当语音-言语服务的操作模式被设置为驾驶模式时，屏幕的亮度设置值可被设置为指示最大亮度的值。此外，当语音-言语服务的操作模式被设置为驾驶模式时，屏幕的颜色设置值可被设置为改变成白色。
[0042]此外，除了驾驶模式设置信息132之外，存储单元130存储用于操作移动终端100各种设置值，例如，屏幕亮度、当触摸发送时是否振动、是否自动旋转屏幕以及其它相似的和/或合适的设置值。
[0043]存储单元130存储用于启动移动终端100的启动程序、一个或更多个操作系统和应用。操作系统作为硬件与应用之间以及应用之间的接口，并且管理诸如中央处理单元(CPU)、图形处理单元(GPU)、主存储器和存储单元130的计算机资源。应用可以是嵌入式应用和第三方应用中的至少一个。嵌入式应用的一些示例是web浏览器、电子邮件程序和即时消息器。具体地，存储单元130存储语音-言语服务应用131。语音-言语服务应用131可包括:确定用户是否正在驾驶或操作车辆的例程、将语音数据(诸如用户针对信息的请求)转换为文本的言语到文本(STT)例程、推断文本的含义的例程、执行与推断出的文本的含义相应的功能的例程、根据功能的执行提供响应信息作为TTS反馈的例程，以及提供响应信息作为GUI反馈的例程。
[0044]具体地，根据用户是否正在驾驶或操作车辆来不同地提供TTS反馈和⑶I反馈。也就是说，如果用户正在驾驶或操作车辆，则GUI反馈的量被最小化，并且TTS反馈的量被最大化。例如，如果用户不在驾驶，则详细信息被提供为GUI反馈，并且与详细信息相应的简单的摘要信息被提供为TTS反馈。相反地，当正在驾驶或操作车辆时，摘要信息被提供为GUI反馈，并且详细信息被提供为TTS反馈。此外，当用户正在驾驶或操作车辆时，GUI反馈的可读性被提高，使得用户可在短时间内直观地意识到含义。例如，当用户不在驾驶或操作车辆时，文本大小可被设置为字体大小12，并且当用户正在驾驶或操作车辆时，文本大小可被设置为字体大小20。如果用户不在驾驶，则文本的粗度可以是1，并且当用户在驾驶时，则文本的粗度可以是3。然而，本公开不限于此，并且可使用任何合适的和/或相似的字体大小和文本粗度。
[0045]此外，语音-言语服务应用131的例程当中的特定例程可被包括在与移动终端100分离的服务器中。例如，推断文本的含义的例程可被包括在服务器中。在这种情况下，移动终端100将文本发送到服务器。服务器响应于此对文本的含义进行推断，并将结果发送到移动终端100。
[0046]在控制器190的控制下，无线通信单元140通过网络利用外部装置执行语音呼叫、视频呼叫、数据通信以及任何其它相似的和/或合适的通信服务。无线通信单元140包括对发送信号的频率进行上变换和放大的发送单元(未示出)以及对接收信号的频率进行低噪声放大和下变换的无线频率接收单元(未示出)。此外，无线通信单元130可包括移动通信模块(未示出)(例如，第3代移动通信模块、第3.5代移动通信模块、第4代移动通信模块或者任何其它相似的和/或合适的通信模块)、数字广播模块(例如，数字媒体广播(DMB)模块)和短距离通信模块(例如，W1-Fi模块、蓝牙模块和近场通信(NFC)模块)。
[0047]音频处理单兀150与扬声器SPK和麦克风MIC组合，并且输入和输出音频信号(例如，用于可使用语音信号的语音识别、语音记录、数字记录、呼叫以及任何其它相似的和/或合适的操作、应用和功能的语音数据)。音频处理单元150可从控制器190接收音频信号，可将接收到的音频信号数模(D/A)转换为模拟信号，可放大模拟信号，并且可通过扬声器SPK输出放大的信号。扬声器SPK将从音频处理单元150接收到的音频信号转换为声波，并输出声波。此外，移动终端可包括多个扬声器。例如，在这种情况下，当进行呼叫时使用第一扬声器，并且第一扬声器被称为接收器。也就是说，当用户将移动终端100放置得接近耳朵并进行呼叫时，第一扬声器被使用。第二扬声器用于重放诸如音乐和视频的数据以及呼叫，并且被称为外放扬声器(loud speaker)。
[0048]此外，在控制器190的控制下，音频处理单元150可将音频信号输出到耳机插孔160。也就是说，当耳机的插头连接到耳机插孔160时，音频信号可通过耳机插孔160被输出到耳机。此外，在控制器190的控制下，音频处理单元150可将音频信号输出到无线通信单元140的蓝牙模块(未示出)。也就是说，当移动终端100通过蓝牙模块连接到无线耳机时，音频信号可通过蓝牙模块被输出到无线耳机。
[0049]麦克风MIC将从人或其它声音源发送的声波转换为音频信号。音频处理单元150通过执行A/D转换将从麦克风MIC接收到的音频信号转换为数字信号，并将数字信号发送到控制器190。
[0050]如果耳机(其可以是耳麦、头戴式耳机或者任何其它相似的和/或合适的音频收听装置)被连接，则耳机插孔160将指示连接的信号发送到控制器190。此外，如果耳机被分离，则耳机插孔将指示分离的信号发送到控制器190。因此，控制器190可控制音频处理单元150识别耳机的连接状态，并且当耳机连接到耳机插孔160时，可将音频信号的输出单元设置为耳机插孔160。
[0051]耳机插孔160将从音频处理单元150接收到的音频信号发送到连接的耳机，并且将从包括在耳机中的麦克风接收的音频信号发送到音频处理单元150。此外，耳机插孔160从包括在耳机中的键接收键事件，并将键事件发送到控制器190。例如，如果用户按压耳机键两次，则可根据本公开来执行语音-言语服务应用131。
[0052]传感器单元170对可被电子地感测的物理量(诸如光量、速度、加速度、高度、重力量或者任何其它相似的和/或合适的物理量)进行感测，并且可对物理量的改变进行感测，产生感测信息，并将感测信息发送到控制器190。例如，传感器170可包括加速度传感器、陀螺仪传感器、亮度传感器、方位传感器、接近传感器、压力传感器、图像传感器或者任何其它相似的和/或合适的传感器。
[0053]GPS接收单元190接收由GPS卫星(诸如三个或更多个GPS卫星)发送的包括传输时间的至少一个GPS信号，使用发送时间和指示何时接收到GPS信号的接收时间之间的时间差来计算包括在移动终端100中的GPS接收单元190和各个卫星之间的距离，使用计算出的距离信息来计算移动终端100的位置(即，计算诸如纬度和/或经度的二维坐标值)，并将计算出的位置信息发送到控制器190。可在例如应用处理器(AP)(未示出)中执行计算出的功能。
[0054]控制器190控制移动终端100的整体操作并控制移动终端的内部组件之间的信号流，对数据进行处理，并且控制从电池到组件的供电。控制器可以是任何合适的硬件元件，诸如1C、专用IC (ASIC)和处理器、微处理器、可擦除可编程只读存储器(EPROM)或者任何其它相似的和/或合适的硬件元件。
[0055]控制器190包括一个或更多个中央处理单元(CPU)(未示出)。CPU是计算机系统的内核控制单元，其计算和比较数据并分析和执行命令。CPU包括暂时存储数据或命令的各种寄存器。控制器190还可包括一个或更多个GPU (未示出)。GPU是图形控制单元，其处理、计算和比较图形相关的数据，并分析和执行图形相关的命令。CPU和GPU可被整合为由单片IC组成的一个套件，其中，所述单片IC由至少一个独立核心形成(例如，四核处理器)。也就是说，CPU可被整合为一个多核处理器。此外，多个GPU可被整合为一个多核处理器。此外，CPU和GPU可被整合为一个芯片，例如，片上系统(SoC)。此外，CPU和GPU可被打包为多层单元。此外，AP可包括CPU和GPU。此外，AP可包括ISP。
[0056]控制器190包括主存储器，例如，RAM或任何其它相似的和/或合适的硬件元件。主存储器存储从存储单元130加载的各种程序，例如，启动程序、操作系统和应用。如果电池的电力被供应到控制器190，则启动程序可被加载到主存储器。所述启动程序将操作系统加载到主存储器。操作系统将应用加载到主存储器。控制器190 (例如AP)访问这样的程序，以对程序的命令进行解码，并根据解码结果执行功能(例如，语音-言语服务)。此外，控制器190包括暂时存储将被写入存储单元130的数据并暂时存储从存储单元130读取的数据的高速缓冲存储器。
[0057]如果检测到针对语音-言语服务的请求，则控制器190可执行语音-言语服务应用131，并将问候消息提供为可听反馈和可视反馈。此外，当语音-言语服务的操作模式被设置为驾驶模式时，控制器190可收集另外的信息(诸如交通信息和天气信息)。例如，控制器190控制无线通信单元140连接到提供信息的服务器，并从服务器接收信息。控制器190可将从无线通信单元140接收到的另外的信息与基本问候一起提供，例如，“正在下雨。请安全驾驶！ ”
[0058]控制器190确定用户是否正在驾驶或操作车辆。例如，控制器190确定被存储在存储单元130中的操作模式信息。其结果是，如果操作模式信息被设置为“驾驶模式”，则控制器190确定用户正在驾驶。也就是说，用户可直接将语音-言语服务的操作模式设置为驾驶模式。
[0059]作为另一示例，如果语音-言语服务应用131正被执行，则控制器190控制传感器单元170产生感测信息。控制器190从传感器单元170接收感测信息，并使用感测信息来计算速度、移动方向、加速度或其它相似的值。控制器190使用计算出的值来确定用户是否正在驾驶或操作车辆。例如，如果在预定的时间段(例如，3秒或任何合适的时间量)内移动方向不变且速度大于40km/h，则控制器190确定用户正在驾驶。
[0060]作为另一示例，控制器190使用地图信息和二维坐标(诸如维度和/或经度)来确定用户是否正在驾驶或操作车辆。控制器190通过地图信息和二维坐标来确定用户的位置，或者换句话说，确定移动终端100的位置。如果确定用户正在乘坐地铁而非驾驶或操作车辆，则无论移动终端100的速度如何，控制器190都确定用户不在驾驶。
[0061]作为另一示例，控制器190使用无线连接的外部装置的识别信息确定用户是否正在驾驶或操作车辆。例如，当连接到蓝牙模块的外部装置的识别信息指示“车辆”，则控制器190确定用户正在驾驶车辆。在此，如果速度大于或等于40km/h，则控制器190确定用户正在驾驶或操作车辆。
[0062]如果确定移动终端100的用户正在驾驶，则控制器190将语音-言语服务的操作模式设置为驾驶模式。如果语音-言语服务的操作模式被设置为驾驶模式，则控制器190可将从扬声器SPK输出的声音的音量设置为最大值。这样，TTS反馈被输出为最大音量。即使在嘈杂的环境中，用户也可听到TTS反馈。然而，当音频系统的输出单元不是扬声器而是耳机(例如，连接到耳机插孔160的耳机或连接到蓝牙模块的无线耳机)时，可保持音量不向上增大，或者可根据用户输入调整音量。
[0063]在语音-言语服务的操作模式被设置为驾驶模式的情况下，如果TTS反馈的量超出预定阈值，则控制器190可将重放速度设置为双倍速率。这样，如果TTS反馈的量是100字符或更多，则TTS反馈被以双倍速率重放。因此，用户可在较短的时间内快速地收听TTS反馈。此外，控制器190将TTS反馈的重要性设置为“高”。这样，详细信息被提供为TTS反馈，并且摘要信息被提供为GUI反馈。此时，例如，如果速度是100km/h，则即使摘要信息也可不被提供为⑶I反馈。[0064]移动终端100还可包括以上未提及的组件，诸如振动马达和配件。在此，配件是移动终端100的可与移动终端100分离的配件，例如，触屏笔、电源适配器或者可附加或连接到移动终端100的外部或外围装置。
[0065]图2是示出根据本公开的实施例的设置驾驶模式的方法的流程图。图3A和图3B是根据本公开的实施例的设置驾驶模式的屏幕的示例。
[0066]参照图2，在操作210，控制器190确定是否检测到针对语音-言语服务的请求。在此，请求可以是按压起始键两次、按压耳机键两次或者任何其它相似的和/或合适的用户输入。如果检测到语音-言语服务的请求，则控制器190执行语音-言语服务应用131。也就是说，控制器190将语音-言语服务应用131加载到主存储器，通过访问加载到主存储器的语音-言语服务应用131对程序的命令进行解码，并根据解码结果来执行功能。例如，在控制器190的控制下，显示单元110显示包括麦克风形状的图标的服务图像。在控制器190的控制下，音频处理单元150将问候消息输出到扬声器SPK、耳机插孔160或蓝牙模块。
[0067]此外，如果检测到针对语音-言语服务的请求，则控制器190激活传感器单元170。这样，传感器单元170产生感测信息，并将感测信息发送到控制器190。传感器单元170可被预先激活。
[0068]在操作220，控制器190确定用户是否正在驾驶，或者换句话说，确定用户是否正在操作车辆。例如，参照图3A和图3B，在控制器190的控制下，显示单元110显示语音-言语服务的环境设置菜单。如果用户触摸环境设置菜单中的处于未激活状态(例如，如图3A中所示的浅色)的“开启”按钮310，则控制器190从触摸面板111检测所述触摸。同样地，如果检测到对处于未激活状态的“开启”按钮310的触摸，则控制器190确定用户正在驾驶或操作车辆。
[0069]如果确定用户正在驾驶，则在操作230，控制器190将语音-言语服务的操作模式设置为驾驶模式。例如，响应于对“开启”按钮310的触摸，控制器190控制显示单元110显示处于激活状态(例如，如图3B中所示的深色)的“开启”按钮310。此外，响应于对“开启”按钮310的触摸，控制器190将语音-言语服务的操作模式设置为驾驶模式。
[0070]如果确定用户没有正在驾驶或操作车辆，则在操作240，控制器190将语音-言语服务的操作模式设置为非驾驶模式。例如，如果“关闭”按钮320处于激活状态，则控制器可确定用户不在驾驶，并可将语音-言语服务的操作模式设置为非驾驶模式。
[0071]此外，语音-言语服务的操作模式可被自动地设置。例如，在控制器190的控制下，显示单元110可显示“自动改变”按钮(未示出)。如果用户触摸处于未激活状态(例如，勾选框未被勾选的状态)的“自动改变”按钮，则控制器190从触摸面板111检测所述触摸，并控制显示单元Iio显示处于激活状态(例如,勾选框被勾选的状态)的“自动改变”按钮。
[0072]同样地，在操作220，如果自动改变按钮处于激活状态，则控制器190可使用从GPS接收单元180接收到的GPS信息、从无线通信单元140接收到的或存储在存储单元130中的地图信息或者根据任何其它合适的和/或相似的信息来确定用户是否正在驾驶。例如，如果在预定时间内移动方向不变且计算出的速度是40km/h或更高，则控制器190确定用户正在驾驶或操作车辆，并且移动至操作230，以便将语音-言语服务的操作模式设置为驾驶模式。相反地，如果计算出的速度是40km/h或更低，则控制器190可确定用户不在驾驶或者操作车辆，并且可移动至操作240，以便将语音-言语服务的操作模式设置为非驾驶模式。[0073]图4是示出根据本公开的实施例的提供语音-言语服务的方法的流程图。图5A是根据本公开的实施例的当语音-言语服务被设置为非驾驶模式时播放的消息的示例，且图5B是根据本公开的实施例的当语音-言语服务被设置为驾驶模式时播放的消息的示例。
[0074]参照图4，在操作410，控制器190执行语音-言语服务并将操作模式设置为驾驶模式。
[0075]在语音-言语服务正被操作且操作模式已经被设置为驾驶模式的情况下，在操作420，控制器190可从无线通信单元140接收消息。所述消息的一些示例是呼叫连接请求消息、文本消息、社交网络服务(SNS)消息、应用更新通知消息或者任何其它相似的和/或合适的类型的消息。
[0076]如果接收到所述消息，则在操作430，控制器190参照驾驶模式设置信息132将接收到的消息提供为TTS反馈和GUI反馈。具体地，控制器190控制音频处理单元150，以便将接收到的消息转换为语音消息，并将语音消息输出到扬声器SPK。此时，控制器190可控制语音处理单元150，以便增加扬声器SPK的音量。然而，当音频信号被输出到耳机插孔160时，控制器190可不增加音量。当连接到蓝牙模块的外部装置被识别为无线耳机且音频信号被输出到无线耳机时，控制器190可不增大音量。此外，当TTS反馈的量超出阈值(例如，TTS反馈多于100个字符或者任何其它相似的和/或合适数量的字符)时，控制器190可控制音频处理单元150将TTS反馈的重放速度设置为双倍速率。如果TTS反馈的重放被延长，则用户会无法专心驾驶或操作车辆。此外，用户会对反馈感到无聊。此外，用户会不记得听到的信息。因此，当用户正在驾驶或操作车辆时，在不太长的时间内以合适的速度提供反馈有助于安全驾驶。
[0077]此外，如果在语音-言语服务正被执行且操作模式已经被设置为驾驶模式的状态下接收到消息，则控制器190将接收消息摘要为摘要消息。例如，控制器190从接收到的消息提取与时间、地点、姓名或者任何其它相似的和/或合适的信息相关的词语。控制器190将提取出的词语(例如，“詹姆斯”)与预定的通知(例如，“消息”、“接收”)进行组合，以产生摘要信息。控制器190控制显示单元110显示如图5A中所示的摘要信息510。此外，控制器190可控制显示单元110将摘要信息510显示在屏幕的中央、屏幕的任何合适的部分中或者整个屏幕上。控制器190可控制显示单元110使摘要信息510的字符大小最大化。此夕卜，控制器190可控制显示单元110，以使字符变粗。图5B是与在非驾驶模式下显示的接收到的消息相关的信息。图5A中的可读性比图5B中的可读性高。因此，基于摘要信息510，用户可直观地、容易地和/或快速地在短时间内确定接收到的消息的含义。这样的GUI反馈可被省略。
[0078]图6是示出根据本公开的另一实施例的提供语音-言语服务的方法的流程图。图7A是根据本公开的实施例的当语音-言语服务被设置为非驾驶模式时显示的CTI反馈的示例，且图7B是根据本公开的实施例的当语音-言语服务被设置为驾驶模式时显示的GUI反馈的示例。
[0079]参照图6，在操作610，控制器190执行语音-言语服务，并且将操作模式设置为驾驶模式。
[0080]在语音-言语服务被执行且操作模式已经被设置为驾驶模式的状态下，在操作620，控制器190可通过音频处理单元160从麦克风MIC或从耳机的麦克风检测语音数据(例如，“让我知道明天的日程”)。
[0081]如果语音数据被检测到，则在操作630，控制器190可执行与语音数据相应的功能。具体地，控制器190首先将语音数据转换为文本。控制器190可推断或确定文本的含义。此外，控制器190可将文本发送到服务器，以推断或确定文本的含义。如果推断或确定成功，则控制器190执行与文本的含义相应的功能。例如，控制器190可从存储在可由控制器190搜索的存储单元130中或者存储在数据库服务器中或者在任何其它相似的和/或合适的位置的日历信息搜索2月25日的日程。
[0082]在操作640，参照驾驶模式设置信息132，控制器190将执行结果(例如，2月25日的日程)提供为TTS反馈和⑶I反馈。具体地，控制器190控制音频处理单元150，以将执行结果转换为语音消息，并将语音消息输出到扬声器SPK。此时，控制器190可控制音频处理单元150增大扬声器SPK的音量。此外，当TTS反馈的量超出阈值时，控制器190可控制音频处理单元150将TTS反馈的重放速度设置为双倍速率。
[0083]此外，如果语音-言语服务正被执行且操作模式被设置为驾驶模式，则控制器190将执行结果摘要为摘要信息。例如，控制器190从执行结果提取与时间、地点、姓名或者任何其它相似的和/或合适的类型的信息相应的相关词语。控制器190将提取到的词语(例如，上午10点，Gaugam区，研讨会)与预定的通知词语(例如，日程信息)进行组合，以产生摘要信息710。如图7A中所示，控制器190控制显示单元110显示摘要信息710。此外，控制器190可控制显示单元110以最大字符大小显示摘要信息710。图7B是在非驾驶模式下显示的与日程信息相关的信息。尽管未详细显示，但是图7A中的可读性比图7B中的可读性高。因此，基于摘要信息710，接收到的消息的含义可在短时间内被直观地、快速地和/或容易地识别。此外，⑶I反馈可被省略。
[0084]本公开的前述方法可被实现为由各种计算机工具形成的且记录在非易失性计算机可读记录介质中的可执行的程序指令。在这种情况下，非易失性计算机可读记录介质可包括单独的程序指令、数据文件和数据结构或其组合。同时，记录在非易失性计算机可读记录介质中的程序命令可以是针对本公开专门设计或配置的或者将使用的计算机软件领域中的普通技术人员已知的。非易失性计算机可读记录介质包括磁介质(诸如硬盘、软盘、磁带或任何其它相似的和/或合适的磁介质)、光介质(诸如致密盘只读存储器(CD-ROM)、数字多功能盘(DVD)或者任何其它相似的和/或合适的光介质)、磁光介质(诸如软盘或者任何其它相似的和/或合适的磁光介质)和硬件装置(诸如ROM、RAM、闪存或者任何其它相似的和/或合适的硬件装置)。此外，程序指令包括由编译器创建的机器语言代码和可由计算机使用编译器执行的高级语言代码。前述硬件装置可被配置为作为至少一个软件模块而进行操作，以执行本公开的操作。
[0085]如上所述，一种提供语音-言语服务的方法和实现所述方法的移动终端可提供针对驾驶状况而优化的语音-言语服务。
[0086]虽然已经参照各种实施例示出并描述了本公开，但是本领域技术人员将理解的是，在不脱离由权利要求及其等同物所限定的本公开的精神和范围的情况下，可做出形式和细节上的各种改变。
【权利要求】
1.一种在移动终端中提供语音-言语服务的方法，所述方法包括: 从传感器单元接收感测信息；根据感测信息来确定是否将语音-言语服务的操作模式设置为驾驶模式；当语音-言语服务的操作模式被设置为驾驶模式时，根据预存储的驾驶模式设置信息来提供可听反馈。
2.如权利要求1所述的方法，其中，提供可听反馈的步骤包括:当语音-言语服务被设置为驾驶模式时，将可听反馈的音量增大至高于当语音-言语服务被设置为非驾驶模式时的可听反馈的音量。
3.如权利要求1所述的方法，其中，提供可听反馈的步骤包括:如果可听反馈的量大于预定阈值，则将可听反馈的重放速度增大至高于当语音-言语服务被设置为非驾驶模式时的可听反馈的重放速度。
4.如权利要求1所述的方法，还包括:如果语音-言语服务的操作模式被设置为驾驶模式，则参照驾驶模式设置信息来提供可视反馈。
5.如权利要求4所述的方法，其中，提供可视反馈的步骤包括: 对将被提供为反馈的信息进行摘要；将摘要信息提供为可视反馈。
6.如权利要求4所述的方法，其中，提供可视反馈的步骤包括:当语音-言语服务在驾驶模式下被操作时，以大于当语音-言语服务在非驾驶模式下被操作时的字体大小的字体大小提供可视反馈。
7.一种在移动终端中提供语音-言语服务的方法，所述方法包括: 接收消息；将消息转换为可听反馈；当语音-言语服务的操作模式是驾驶模式时，根据预存储的驾驶模式设置信息来提供可听反馈。
8.如权利要求7所述的方法，其中，驾驶模式设置信息包括扬声器的音量设置值、屏幕的色彩设置值、屏幕的亮度设置值和可听反馈的重放速度设置值中的至少一个。
9.一种在移动终端中提供语音-言语服务的方法，所述方法包括: 从麦克风检测语音数据；执行与语音数据相应的功能；将执行功能的结果转换为可听反馈；如果语音-言语服务的操作模式是驾驶模式，则根据预存储的驾驶模式设置信息来提供可听反馈。
10.如权利要求9所述的方法，其中，驾驶模式设置信息包括扬声器的音量设置值、屏幕的色彩设置值、屏幕的亮度设置值和可听反馈的重放速度设置值中的至少一个。
11.一种用于提供语音-言语服务的移动终端，所述移动终端包括: 麦克风；扬声器; 音频处理单元，被配置为处理从麦克风和扬声器中的至少一个接收到的信号；存储单元，被配置为存储驾驶模式设置信息；传感器单元，被配置为感测物理量；控制器，被配置为控制麦克风、扬声器、存储单元、音频处理单元和传感器单元中的至少一个，其中，控制器被配置为接收感测信息，以根据感测信息确定是否将语音-言语服务的操作模式设置为驾驶模式，并且如果语音-言语服务的操作模式被设置为驾驶模式，则根据驾驶模式设置信息来提供可听反馈。
12.如权利要求11所述的移动终端，其中，控制器被配置为:当语音-言语服务被设置为驾驶模式时，将可听反馈的音量增大至高于当语音-言语服务被设置为非驾驶模式时可听反馈的音量。
13.如权利要求11所述的移动终端，其中，控制器被配置为:当语音-言语服务被设置为驾驶模式时，将可听反馈的重放速度增大至高于当语音-言语服务被设置为非驾驶模式时的重放速度。
14.如权利要求11所述的移动终端，其中，控制器被配置为:当语音-言语服务的操作模式被设置为驾驶模式时，根据驾驶模式设置信息来提供可视反馈。
15.如权利要求14所述的移动终端，其中，控制器被配置为:对将被提供为反馈的信息进行摘要，并将摘要信息提供为可视反馈。
16.如权利要求14所述的移动终端，其中，控制器被配置为:当语音-言语服务被设置为驾驶模式时，以大于当语音-言语服务被设置为非驾驶模式时的字体大小的字体大小提供可视反馈。
【文档编号】G06F3/01GK104007816SQ201410060454
【公开日】2014年8月27日申请日期:2014年2月21日优先权日:2013年2月22日
【发明者】全贺英, 金少拉, 金凞云, 安由美, 安智贤申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：全贺英;金少拉;金凞云;安由美;安智贤
技术所有人：三星电子株式会社
我是此专利的发明人

上一篇：一种可定制式模型一体化同步维护方法
上一篇：一种电容式触摸屏及其制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。