语音技能命令引导方法、装置、存储介质及电子设备与流程

文档序号：17584928发布日期：2019-05-03 21:13阅读：233来源：国知局

本发明涉及语音技术领域，尤其涉及一种语音技能命令引导方法、装置、存储介质及电子设备。

背景技术：

随着科学技术的不断发展，车载设备越来越智能化，为人们的生活带来了极大的便利。其中，在车载设备控制方面，现在普遍也都搭载了智能化的操作系统，并且对该操作系统的控制也大多实现了语音控制。

在现有车载语音控制系统中，都是把语音控制作为普通应用，并将语音触屏入口放在应用中心中，在该种设计方式中，用户在进行触屏触发语音时，需要进入应用中心进行触发，交互过程麻烦。而为了进一步提升用户使用语音效率，会定义许多快捷唤醒词，以使得用户不唤醒语音即可使用语音触发功能。

但是，由于多个快捷唤醒词的设置，容易导致用户忘记具体场景下具体有哪些快捷唤醒词，进而使得很多快捷唤醒词完全不被用户所知。

技术实现要素：

本发明提供一种语音技能命令引导方法、装置、存储介质及电子设备，以根据当前的具体应用场景对用户进行语音技能命令的引导，从而增加用户对语音系统中的语音技能命令的熟悉程度，进而大大提高了用户的语音操作效率。

第一方面，本发明提供一种语音技能命令引导方法，包括：

根据用户输入的第一指令以及预设语音场景数据确定第一触发场景；

根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令；

根据所述第一语音技能命令生成第一悬浮窗气泡图形，并在当前图形界面中叠加显示所述第一悬浮窗气泡图形。

在一种可能的设计中，在所述根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令之后，还包括：

统计用户输入所述第一语音技能命令的第一次数；

判断所述第一次数是否大于第一阈值，判断结果为否。

在一种可能的设计中，在所述根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令之后，还包括：

统计显示所述第一悬浮窗气泡图形的第二次数；

判断所述第二次数是否小于第二阈值，判断结果为否。

在一种可能的设计中，在所述根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令之后，还包括：

统计在第一预设时长范围内显示所述第一悬浮窗气泡图形的第三次数；

判断所述第三次数是否小于第三阈值，判断结果为否。

在一种可能的设计中，在所述根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令之后，还包括：

判断在第二预设时长范围内是否显示过第二悬浮窗气泡图形，其中，所述第二悬浮窗气泡图形对应第二语音技能命令，判断结果为否。

在一种可能的设计中，在所述根据所述第一语音技能命令生成第一悬浮窗气泡图形，并在当前图形界面中叠加显示所述第一悬浮窗气泡图形之后，还包括：

判断在第三时长范围内是否接收到所述第一语音技能命令；

若判断结果为是，则在第三时长范围内，在当前图形界面中取消显示所述第一悬浮窗气泡图形；

若判断结果为否，则在所述第三时长之后，在当前图形界面中取消显示所述第一悬浮窗气泡图形。

在一种可能的设计中，所述第一触发场景为以下任意一种：

多媒体场景、地图导航场景、拍照场景以及设置场景。

第二方面，本发明还提供一种语音技能命令引导装置，包括：

处理模块，用于根据用户输入的第一指令以及预设语音场景数据确定第一触发场景；

所述处理模块，还用于根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令；

显示模块，用于根据所述第一语音技能命令生成第一悬浮窗气泡图形，并在当前图形界面中叠加显示所述第一悬浮窗气泡图形。

在一种可能的设计中，所述处理模块，还用于统计用户输入所述第一语音技能命令的第一次数；

所述处理模块，还用于判断所述第一次数是否大于第一阈值。

在一种可能的设计中，所述处理模块，还用于统计显示所述第一悬浮窗气泡图形的第二次数；

所述处理模块，还用于判断所述第二次数是否小于第二阈值。

在一种可能的设计中，所述处理模块，还用于统计在第一预设时长范围内显示所述第一悬浮窗气泡图形的第三次数；

所述处理模块，还用于判断所述第三次数是否小于第三阈值。

在一种可能的设计中，所述处理模块，还用于判断在第二预设时长范围内是否显示过第二悬浮窗气泡图形，其中，所述第二悬浮窗气泡图形对应第二语音技能命令。

在一种可能的设计中，所述处理模块，还用于判断在第三时长范围内是否接收到所述第一语音技能命令；

所述处理模块，还用于在第三时长范围内，在当前图形界面中取消显示所述第一悬浮窗气泡图形；

所述处理模块，还用于在所述第三时长之后，在当前图形界面中取消显示所述第一悬浮窗气泡图形。

在一种可能的设计中，所述第一触发场景为以下任意一种：

多媒体场景、地图导航场景、拍照场景以及设置场景。

第三方面，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面中任意一种可能的语音技能命令引导方法。

第四方面，本发明还提供一种电子设备，包括：

处理器；以及，

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行第一方面中任意一种可能的语音技能命令引导方法。

本发明提供的一种语音技能命令引导方法、装置、存储介质及电子设备，通过根据用户输入的第一指令以及预设语音场景数据确定第一触发场景，然后利用第一触发场景以及预设的语音技能命令列表确定第一语音技能命令，再根据第一语音技能命令生成第一悬浮窗气泡图形，并在当前图形界面中叠加显示第一悬浮窗气泡图形，以根据当前的具体触发场景对用户进行语音技能命令的引导，从而增加用户对语音系统中的语音技能命令的熟悉程度，进而大大提高了用户的语音操作效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的语音技能命令引导方法的应用场景图；

图2是根据一示例性实施例示出的语音技能命令引导方法的流程示意图；

图3是图2所示实施例中的界面显示图；

图4是根据另一示例性实施例示出的语音技能命令引导方法的流程示意图；

图5是根据一示例性实施例示出的车辆的语音技能命令引导装置的结构示意图；

图6是根据一示例性实施例示出的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是根据一示例性实施例示出的语音技能命令引导方法的应用场景图。如图1所示，本实施例的语音技能命令引导方法可以应用在车辆1上，其中车辆1上设置有终端2，该终端2可以是车机设备。

图2是根据一示例性实施例示出的语音技能命令引导方法的流程示意图。如图2所示，本实施例提供的语音技能命令引导方法，包括：

步骤101、根据用户输入的第一指令以及预设语音场景数据确定第一触发场景。

用户在使用车载语音系统时，会存在人机之间的语音交互，用户通过发出语音指令来对系统进行控制。值得说明地，上述的第一指令可以是语音指令，也可以是触摸指令，在本实施例中并不对上述的第一指令的具体形式进行限定。

可以以第一指令为语音指令为例进行详细说明，具体地，当用户需要控制系统进行音乐播放时，就会输入“播放音乐”语音指令；而当需要进行行驶路线规划时，就会输入“地图导航”语音指令；当需要进行拍照时，就会输入“相机”语音指令；当需要进行设置时，就会输入“设置”语音指令。可见，对于每个语音指令，都对应一个实际的语音触发场景。值得理解地，在上述的预设语音场景数据中就包括了语音指令与语音触发场景之间的映射关系。因此，当接收到用户输入的第一指令时，就会根据预设语音场景数据中的映射关系确定第一指令对应的第一触发场景。

可选地，上述的第一触发场景为以下任意一种：多媒体场景、地图导航场景、拍照场景以及设置场景。

步骤102、根据第一触发场景以及预设的语音技能命令列表确定第一语音技能命令。

在确定了当前用户输入的第一指令所对应的第一触发场景之后，根据第一触发场景以及预设的语音技能命令列表确定第一语音技能命令。值得理解地，上述的第一语音技能命令为快捷唤醒词命令，无需实现唤醒语音系统，即可通过输入第一语音技能命令以使语音系统进行相应。

其中，值得理解地，语音技能命令列表中包括了各个触发场景与语音技能命令之间的映射关系。例如，当触发场景为“多媒体场景”时，对应的是“暂停播放”、“单曲循环”、“列表循环”、“随机模式”、“上一首”以及“下一首”等；当触发场景为“地图导航场景”时，对应的是“放大地图”、“缩小地图”以及“立即导航”等；当触发场景为“拍照场景”时，对应的是“拍照拍照”；而当触发场景为“设置场景”时，对应的是“增大音量”以及“缩小音量”等。

还可以以第一触发场景为触摸指令触发为例进行详细说明，具体地，当用户触发播放多媒体时，对应的是“暂停播放”；当用户触发播放音乐时，对应的是“单曲循环”、“列表循环”、“随机模式”、“上一首”以及“下一首”等；当用户触发导航时，对应的是“放大地图”以及“缩小地图”；当用户在唤起语音后说立即导航时，对应的是“立即导航”；当用户在唤醒语音后执行拍照指令，对应的是“拍照拍照”；而当用户在唤醒语音后执行调整音量指令时，对应的是“增大音量”以及“缩小音量”等。

其中，第一语音技能命令可以是语音技能命令列表中第一触发场景对应的具体列表中的任意一个，具体地，可以是按照语音技能命令列表中的顺序可以是顺序排序确定，也可以是循环排序确定，还可以是随机确定，在本实施例中并不对其顺序进行具体限定。

步骤103、根据第一语音技能命令生成第一悬浮窗气泡图。

在根据第一触发场景以及预设的语音技能命令列表确定第一语音技能命令之后，根据第一语音技能命令生成第一悬浮窗气泡图。

步骤104、在当前图形界面中叠加显示第一悬浮窗气泡图形。

在根据第一语音技能命令生成第一悬浮窗气泡图之后，在第一悬浮窗气泡图中包含了第一语音技能命令，以对用户进行语音技能引导。

其中，图3是图2所示实施例中的界面显示图。如图3所示，当触发场景为“地图导航场景”时，显示的第一悬浮窗气泡图中显示的语音技能命令为“放大地图”以及“缩小地图”。

在本市实施例中，通过根据用户输入的第一指令以及预设语音场景数据确定第一触发场景，然后利用第一触发场景以及预设的语音技能命令列表确定第一语音技能命令，再根据第一语音技能命令生成第一悬浮窗气泡图形，并在当前图形界面中叠加显示第一悬浮窗气泡图形，以根据当前的具体触发场景对用户进行语音技能命令的引导，从而增加用户对语音系统中的语音技能命令的熟悉程度，进而大大提高了用户的语音操作效率。

图4是根据另一示例性实施例示出的语音技能命令引导方法的流程示意图。如图4所示，本实施例提供的语音技能命令引导方法，包括：

步骤201、根据用户输入的第一指令以及预设语音场景数据确定第一触发场景。

步骤202、根据第一触发场景以及预设的语音技能命令列表确定第一语音技能命令。

值得说明地，步骤201-202的具体实现方式参照图2所示实施例中步骤101-102的描述，这里不再赘述。

步骤2031、统计用户输入第一语音技能命令的第一次数。

具体地，先统计用户输入第一语音技能命令的第一次数。例如，统计用户语音输入“放大地图”以及“缩小地图”的次数。

步骤2032、判断第一次数是否大于第一阈值。若判断结果为否，则执行步骤207，若判断结果为是，则流程结束。

在统计用户输入第一语音技能命令的第一次数之后，判断第一次数是否大于第一阈值，其中，第一阈值可以为3次。在一个具体的实施例中，当用户语音输入“放大地图”以及“缩小地图”的次数大于3次时，则认为该用户已经学会了该第一语音技能命令，后续不再进行引导，而当用户语音输入“放大地图”以及“缩小地图”的次数小于或等于3次时，则认为该用户仍未学会了该第一语音技能命令，后续继续通过悬浮窗的形式进行引导。

步骤2041、统计显示第一悬浮窗气泡图形的第二次数。

具体地，统计显示第一悬浮窗气泡图形的第二次数。例如，统计第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”的显示次数。

步骤2042、判断第二次数是否小于第二阈值。若判断结果为否，则执行步骤207，若判断结果为是，则流程结束。

在统计显示第一悬浮窗气泡图形的第二次数之后，判断第二次数是否小于第二阈值，其中，第二阈值可以为5次。在一个具体的实施例中，当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”的显示次数小于5次时，则后续继续通过悬浮窗的形式进行引导；而若当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”的显示次数大于或等于5次时，则认为已经达到最多引导次数，第一语音技能命令对于该用户的语音系统控制过程中实际用处不大，因此，后续不再进行引导，以提高用户的体验，有效地避免了一些对于用户作用不大的语音技能命令反复出现而使得用户反感引导过程。

步骤2051、统计在第一预设时长范围内显示第一悬浮窗气泡图形的第三次数。

具体地，统计在第一预设时长范围内显示第一悬浮窗气泡图形的第三次数。例如，统计在一天内第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”的显示次数。

步骤2052、判断第三次数是否小于第三阈值。若判断结果为否，则执行步骤207，若判断结果为是，则流程结束。

在统计在第一预设时长范围内显示第一悬浮窗气泡图形的第三次数之后，判断第三次数是否小于第三阈值，其中，第三阈值可以为3次。在一个具体的实施例中，当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”在一天之内的显示次数小于3次时，则当天后续继续通过悬浮窗的形式进行引导；而若当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”的显示次数大于或等于3次时，则认为已经达到当天最多引导次数，因此，后续不再进行引导，以提高用户的体验，有效地避免了短时间内同一语音技能命令反复出现给用户带来的反感。

步骤206、判断在第二预设时长范围内是否显示过第二悬浮窗气泡图形。若判断结果为否，则执行步骤207，若判断结果为是，则流程结束。

具体地，判断在第二预设时长范围内是否显示过第二悬浮窗气泡图形，其中，第二预设时长可以为1个小时。即在一个小时之内只对用户进行一次语音技能命令的引导，以提高用户的体验，有效地避免了短时间内频繁的引导行为给用户带来的反感。

步骤207、根据第一语音技能命令生成第一悬浮窗气泡图。

步骤208、在当前图形界面中叠加显示第一悬浮窗气泡图形。

值得说明地，步骤207-208的具体实现方式参照图2所示实施例中步骤103-104的描述，这里不再赘述。

步骤209、判断在第三时长范围内是否接收到第一语音技能命令。若判断结果为是，则执行步骤2101，若判断结果为否，则执行步骤2102。

在当前图形界面中叠加显示第一悬浮窗气泡图形之后，判断在第三时长范围内是否接收到第一语音技能命令，其中，第三时长可以设定为5秒。可选地，当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”时，判断在5秒之内是否接受到用户输入的“放大地图”或“缩小地图”语音指令。

步骤2101、在第三时长范围内，在当前图形界面中取消显示第一悬浮窗气泡图形。

具体地，在第三时长范围内，在当前图形界面中取消显示第一悬浮窗气泡图形。可选地，当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”时，并且在5秒之内接受到用户输入的“放大地图”或“缩小地图”语音指令，此时，在接收到用户输入的第一语音技能命令之后，立即在当前图形界面中取消显示第一悬浮窗气泡图形。

步骤2102、在第三时长之后，在当前图形界面中取消显示第一悬浮窗气泡图形。

具体地，在第三时长之后，在当前图形界面中取消显示第一悬浮窗气泡图形。可选地，当第一悬浮窗气泡图形内容为“放大地图”以及“缩小地图”时，并且在5秒之内未接受到用户输入的“放大地图”或“缩小地图”语音指令，则在5秒之后，在当前图形界面中取消显示第一悬浮窗气泡图形。

图5是根据一示例性实施例示出的车辆的语音技能命令引导装置的结构示意图。如图5所示，本实施例提供的语音技能命令引导装置，包括：

处理模块301，用于根据用户输入的第一指令以及预设语音场景数据确定第一触发场景；

所述处理模块301，还用于根据所述第一触发场景以及预设的语音技能命令列表确定第一语音技能命令；

显示模块302，用于根据所述第一语音技能命令生成第一悬浮窗气泡图形，并在当前图形界面中叠加显示所述第一悬浮窗气泡图形。

在一种可能的设计中，所述处理模块301，还用于统计用户输入所述第一语音技能命令的第一次数；

所述处理模块301，还用于判断所述第一次数是否大于第一阈值。

在一种可能的设计中，所述处理模块301，还用于统计显示所述第一悬浮窗气泡图形的第二次数；

所述处理模块301，还用于判断所述第二次数是否小于第二阈值。

在一种可能的设计中，所述处理模块301，还用于统计在第一预设时长范围内显示所述第一悬浮窗气泡图形的第三次数；

所述处理模块301，还用于判断所述第三次数是否小于第三阈值。

在一种可能的设计中，所述处理模块301，还用于判断在第二预设时长范围内是否显示过第二悬浮窗气泡图形，其中，所述第二悬浮窗气泡图形对应第二语音技能命令。

在一种可能的设计中，所述处理模块301，还用于判断在第三时长范围内是否接收到所述第一语音技能命令；

所述处理模块301，还用于在第三时长范围内，在当前图形界面中取消显示所述第一悬浮窗气泡图形；

所述处理模块301，还用于在所述第三时长之后，在当前图形界面中取消显示所述第一悬浮窗气泡图形。

在一种可能的设计中，所述第一触发场景为以下任意一种：

多媒体场景、地图导航场景、拍照场景以及设置场景。

以上处理模块303可以被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(applicationspecificintegratedcircuit，简称asic)，或，一个或多个微处理器(digitalsingnalprocessor，简称dsp)，或，一个或者多个现场可编程门阵列(fieldprogrammablegatearray，简称fpga)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(centralprocessingunit，简称cpu)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，简称soc)的形式实现。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

值得说明地，图5所示实施例中的语音技能命令引导装置，可用于执行上述方法实施例中的步骤，具体实现方式和技术效果类似，这里不再进行赘述。

本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述任一项方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图6是根据一示例性实施例示出的电子设备的结构示意图。如图6示，本实施例提供的电子设备，包括：

处理器401；

存储器402，用于存储所述处理器的计算机程序；

其中，所述处理器401被配置为通过执行所述计算机程序来实现前述方法实施例中任一实现方式提供的自动驾驶控制方法。

其中，所述处理器401配置为经由执行所述可执行指令来执行前述任一项方法实施例所述的技术方案，其实现原理和技术效果类似，此处不再赘述。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或对其中部分或全部技术特征进行等同替换；而这些修改或替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宁悦
技术所有人：斑马网络技术有限公司
我是此专利的发明人

上一篇：一种便于矫骨的多功能支架的制作方法
上一篇：环保节能型颜料永固黄13的制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。