语音交互方法、装置和终端与流程

文档序号：16989400发布日期：2019-03-02 00:50阅读：192来源：国知局

本发明涉及智能交互技术领域，具体涉及一种语音交互方法、装置和终端。

背景技术：

电视机等智能家电，通常利用近场模式的语音交互方式作为交互方式，例如，利用蓝牙语音交互器对电视机进行交互。虽然给用户提供了一定的方便性，但是，还需要人工连接蓝牙，无法真正做到解放双手。目前，优化的交互方法是利用远场模式的交互方式来控制智能家电，依然适用于电视机或远场电视盒子设备。

然而，目前的语音交互要求必须先让用户唤醒，再说搜索需求，尤其在搜索影视资源播放过程中，用户往往需要多次补充信息才能找到最想收看的内容，而每次交互都需要说唤醒词，非常不方便，且搜索效率低下。

技术实现要素：

本发明实施例提供语音交互方法、装置和终端，以至少解决现有技术中的以上技术问题。

第一方面，本发明实施例提供了一种语音交互方法，包括：

接收唤醒语音；

根据所述唤醒语音启动交互模式；

在启动所述交互模式的情况下显示对话提示标识；

根据对话提示标识获取需求语音；

根据所述需求语音显示需求内容。

在一种实施方式中，多次获取所述需求语音，且每次获取到所述需求语音时，均显示所述对话提示标识，直至退出所述交互模式。

在一种实施方式中，所述对话提示标识包括搜索提示标识，所述搜索提示标识显示有通用的搜索开始提示语以及预设的固定对话时间。

在一种实施方式中，所述对话提示标识包括内容引导标识，所述内容引导标识用于提示用户提供对应的需求内容。

在一种实施方式中，根据所述唤醒语音启动交互模式之前，还包括：

判断所述唤醒语音的内容是否符合预设交互场景，若符合，则根据所述唤醒语音启动交互模式。

在一种实施方式中，根据对话提示标识获取需求语音之后，还包括：

判断所述需求语音是否符合所述预设交互场景中的搜索需求，若不符合，则退出所述交互模式。

第二方面，本发明还提供了一种语音交互装置，包括：

唤醒语音接收模块，用于接收唤醒语音；

交互模式启动模块，用于根据所述唤醒语音启动交互模式；

提示标识显示模块，用于在启动所述交互模式的情况下显示对话提示标识；

需求语音获取模块，用于根据对话提示标识获取需求语音；

需求内容显示模块，用于根据所述需求语音显示需求内容。

在一种实施方式中，还包括：

交互场景判断模块，用于判断所述唤醒语音的内容是否符合预设交互场景，若符合，则根据所述唤醒语音启动交互模式。

在一种实施方式中，还包括：

需求判断模块，用于判断所述需求语音是否符合所述预设交互场景中的搜索需求，若不符合，则退出所述交互模式。

第三方面，本发明实施例提供了一种语音交互终端，所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，语音交互终端的结构中包括处理器和存储器，所述存储器用于存储支持语音交互终端执行上述第一方面中语音交互方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。所述语音交互终端还可以包括通信接口，用于语音交互终端与其他设备或通信网络通信。

第四方面，本发明实施例提供了一种计算机可读存储介质，用于存储语音交互装置所用的计算机软件指令，其包括用于执行上述第一方面中语音交互方法为语音交互装置所涉及的程序。

上述技术方案中的一个技术方案具有如下优点或有益效果：针对智能家电等多种交互场景，能够在启动交互模式的情况下，让用户连续说出需求语音，无需多次重复唤醒交互模式，从而提升用户体验。

上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本发明公开的一些实施方式，而不应将其视为是对本发明范围的限制。

图1为本发明实施例提供的一种语音交互方法流程图；

图2为本发明实施例提供的另一种语音交互方法示意图；

图3为本发明实施例提供的一种语音交互装置框图；

图4为本发明实施例提供的另一种语音交互装置框图；

图5为本发明实施例提供的一种语音交互终端示意图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。

实施例一

在一种具体实施方式中，如图1所示，提供的一种语音交互方法流程图，所述方法包括：

步骤s10：获取唤醒语音。

步骤s20：根据唤醒语音启动交互模式。

步骤s30：在启动交互模式的情况下显示对话提示标识。

步骤s40：根据对话提示标识获取需求语音。

步骤s50：根据需求语音显示需求内容。

本实施例适用于电视机、空调等智能家电。在一种示例中，以智能电视为例进行说明。获取唤醒语音，例如，“小度，小度，开启电视”。之后对唤醒语音的内容可以进行解析，如果解析结果是乱码等，并未得到清晰的唤醒语音含义，则无法进入交互模式，提示用户重新说出唤醒智能家电的唤醒词等。提示重新获取唤醒语音的方法还可以根据智能家电的硬件进行适应性设计。以智能电视为例，灯光蓝色微弱闪烁，亮度逐渐减弱至无，则返回重新获取唤醒语音，再次唤醒。

唤醒语音解析符合要求之后，启动交互模式，电视机屏幕上可现实进入交互模式的界面。此界面可根据需要进行适应性的设计。在交互模式的界面中显示对话提示标识，功能是可以提醒用户对话时间、需求内容以及搜索开始提示语等。对话提示标识可以采用多种实现方式，可根据需要对对话提示标识进行适应性的设计，且设计的位置也做适应性调整，均在本实施方式的保护范围内。例如，在界面中显示的动态圈来表示用户对话时间，或者是设计成两个卡通人物和电视机对话的动图来表示需求内容的提示，或者是一个喇叭形状的标识，并附上“小度”类似的关键词，来提醒用户搜索开始之前，先要说出此关键词，才能开始搜索。

用户看到对话提示标识之后，可以与智能家电交互，通过说话的方式提供需求语音。例如，用户提供的需求语音是“小度小度，我想看电影”，电视机收到本次的需求语音后，进行语音识别，得到其中的关键词“电影”。这时，电视机可以利用与关键词“电影”进行搜索，或者用“电影”相关的关键词“热门电影”进行搜索。搜索后在界面中显示出搜索【热门电影】的搜索结果，可以同时显示对话提示标识。如果搜索完成，则直接退出交互模式，若未完成，继续获取需求语音，直至最后播放需求内容，自动退出交互模式。

当然，本实施例提供的语音交互方法包括但不限于智能电视机的交互方法，还可以应用于空调等其它智能家电，交互过程与上述相似，在此不再赘述，均在本实施方式的保护范围内。

在一种实施方式中，多次获取需求语音，且每次获取到需求语音时，均显示对话提示标识，直至退出交互模式。

在一种示例中，“电影”的需求内容显示之后，用户看到对话提示标识，通过说话的方式提供另一需求语音。例如用户提供的需求语音是“香港的电影”。电视机收到本次的需求语音后，进行语音识别，得到其中的关键词“香港”。这时，电视机可以利用与关键词“香港”进行搜索，或者用“香港”相关的关键词“hongkong”进行搜索。电视机的界面搜索出【香港的、热门电影】的搜索结果，再次呈现对话提示标识。

用户通过说话的方式提供需求语音“警匪片”，电视机收到本次的需求语音后，进行语音识别，得到其中的关键词“警匪”。这时，电视机可以利用与关键词“警匪”进行搜索，或者用“警匪”相关的关键词“警察”、“黑帮”以及“土匪”等进行搜索。电视机的界面搜索出【香港的、热门、警匪片】的搜索结果，再次呈现对话提示标识。

用户说通过说话的方式提供需求语音“刘xx演的”，电视机收到本次的需求语音后，进行语音识别，得到其中的关键词“刘xx”。这时，电视机可以利用与关键词“刘xx”进行搜索。电视机界面搜索出【香港的、热门、警匪片、刘xx】，再次呈现对话提示标识。

用户通过说话的方式提供需求语音“下一页”，电视机收到本次的需求语音后，进行语音识别，根据识别结果控制电视机界面切换到下一页电影搜索页面，再次呈现对话提示标识。用户说“播放第一个”，节目开始播放，自动退出交互模式。

在一种实施方式中，对话提示标识包括搜索提示标识，搜索提示标识显示有通用的搜索开始提示语以及预设的固定对话时间。

通用的搜索开始提示语包括了搜索开始提示语，例如“小度、小度”，在整个搜索过程中，搜索开始提示语可以一直显示，或者只是在第一次进入搜索状态时显示。搜索提示标识还可以显示预设的固定对话时间，例如可以是时间进度条。在固定的对话时间内，用户提供需求语音，若在固定的对话时间内，用户并未提供需求语音，则退出交互模式。或者当搜索提示标识消失后，自动退出当前的交互模式，避免误操作。固定对话时间的时长可以预先设置，1分钟或者若干分钟，根据产品类型做适应性的调整，均在本实施例的保护范围内。

在一种实施方式中，对话提示标识包括内容引导标识，内容引导标识用于提示用户提供对应的需求内容。

内容引导标识是指在多次交互过程中，每次都获取需求语音时，用来提示用户应该提供相关的需求内容。以智能电视为例，当电视机界面搜索出【香港的、热门、警匪片、刘xx】的若干部电影时，内容引导标识可以显示排名第一的热门影片“无间道”，提示用户可以直接提供需求语音“小度、小度，我要看无间道”。或者用户还可以根据当前页面展示的内容，提供需求语音“小度、小度，我要看第三个影片寒战”。

在一种实施方式中，如图2所示，步骤s20之前，还包括：

步骤s21：判断唤醒语音的内容是否符合预设交互场景，若符合，则根据唤醒语音启动交互模式。

各种智能家电都有对应的唤醒词。例如，智能电视的唤醒词是“打开电视机”，智能空调的唤醒词是“打开空调”等。针对智能电视，用“打开空调”的唤醒词就不符合预设交互场景。因此，判断唤醒语音的内容是否符合预设交互场景是重要且必要的，避免了启动错误。

在一种实施方式中，如图2所示，步骤s40之后，还包括：

步骤s60：判断需求语音是否符合预设交互场景中的搜索需求，若不符合，则退出交互模式。

在一种示例中，在各个场景的交互模式中，可以分别存储对应的符合预设交互场景的搜索需求。例如，智能电视的预设交互场景中存储有“小度小度，我想看电影”、“香港的电影”、“我想看新闻联播”等。智能空调的预设交互场景中存储有“小度小度，热风”等。如果在智能电视的交互模式中，用户说“请将温度调至10度”或者“请开中级风”等并不符合电视机的交互场景的搜索需求，则自动退出当前的交互模式。

实施例二

在一种具体的实施方式中，如图3所示，提供了一种语音交互装置，包括：

唤醒语音获取模块10，用于获取唤醒语音；

交互模式启动模块20，用于根据唤醒语音启动交互模式；

提示标识显示模块30，用于在启动交互模式的情况下显示对话提示标识；

需求语音获取模块40，用于根据对话提示标识获取需求语音；

需求内容显示模块50，用于根据需求语音显示需求内容。

在一种实施方式中，如图4所示，还包括：

交互场景判断模块21，用于判断唤醒语音的内容是否符合预设交互场景，若符合，则根据唤醒语音启动交互模式。

在一种实施方式中，如图4所示，还包括：

需求判断模块60，用于判断需求语音是否符合预设交互场景中的搜索需求，若不符合，则退出交互模式。

本发明实施例针对智能家电等多种交互场景，能够在启动交互模式的情况下，让用户连续说出需求语音，无需多次重复唤醒交互模式，从而提升用户体验。

实施例三

本发明实施例提供了一种语音交互终端，如图5所示，包括：

存储器400和处理器500，存储器400内存储有可在处理器500上运行的计算机程序。处理器500执行所述计算机程序时实现上述实施例中的语音交互方法。存储器400和处理器500的数量可以为一个或多个。

通信接口600，用于存储器400和处理器500与外部进行通信。

存储器400可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

如果存储器400、处理器500以及通信接口600独立实现，则存储器400、处理器500以及通信接口600可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(isa，industrystandardarchitecture)总线、外部设备互连(pci，peripheralcomponent)总线或扩展工业标准体系结构(eisa，extendedindustrystandardcomponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器400、处理器500以及通信接口600集成在一块芯片上，则存储器400、处理器500及通信接口600可以通过内部接口完成相互间的通信。

实施例四

一种计算机可读存储介质，其存储有计算机程序，所述程序被处理器执行时实现如实施例一包括的任一所述的语音交互方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器，磁盘或光盘等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：范冰冰;梁浩
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

上一篇：冷板的制作方法
上一篇：以锂长石和蓝晶石为组元的陶瓷增强铁基复合材料及其制备方法、机械零件与流程