唤醒处理方法、装置及电子设备与流程

文档序号:16888368发布日期:2019-02-15 22:50阅读:179来源:国知局
唤醒处理方法、装置及电子设备与流程

本发明实施例涉及语音处理技术领域,特别是涉及一种唤醒处理方法、装置及电子设备。



背景技术:

语音唤醒,也被称为关键词检测(keywordspotting),指的是在连续不断的语音中将目标关键词检测出来。语音唤醒的应用领域非常广泛,例如机器人、手机、可穿戴设备、智能家居、车载等。当用户需要唤醒设备时需要说出特定的唤醒词。

相关技术中,唤醒设备一般是通过检测用户是否说出特定的唤醒词来实现的,在检测到用户说出特定的唤醒词后唤醒设备,否则不唤醒。因此,这种唤醒方式存在用户误说出特定的唤醒词唤醒设备的技术缺陷,并无法考虑用户所处的场景,因而导致用户体验性差。



技术实现要素:

有鉴于此,本发明实施例提供了一种唤醒处理方法、装置及电子设备,能够实现上述技术问题。

为了解决上述问题,本发明实施例主要提供如下技术方案:

第一方面,本发明实施例提供了一种唤醒处理方法,该方法包括:

当采集到语音信息时,确定终端设备当前所处的场景;

确定与终端设备当前所处的场景对应的唤醒置信度阈值;

计算语音信息包括预设的唤醒词的置信度;

将计算得到的置信度与唤醒置信度阈值比较,并根据比较结果确定是否执行相应的唤醒操作。

第二方面,本发明实施例还提供一种唤醒处理装置,该装置包括:

场景确定模块,用于当采集到语音信息时,确定终端设备当前所处的场景;

阈值确定模块,用于确定与终端设备当前所处的场景对应的唤醒置信度阈值;

置信度计算模块,用于计算语音信息包括预设的唤醒词的置信度;

唤醒处理模块,用于将计算得到的置信度与唤醒置信度阈值比较,并根据比较结果确定是否执行相应的唤醒操作。

第三方面,本发明实施例还提供一种电子设备,包括:

至少一个处理器;

以及与处理器连接的至少一个存储器、总线;其中,

处理器、存储器通过总线完成相互间的通信;

处理器用于调用存储器中的程序指令,以执行唤醒处理方法。

第四方面,本发明实施例还提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行唤醒处理方法。

借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:

本发明实施例提供的唤醒处理方法、装置及电子设备,在采集到语音信息时,确定终端设备当前所处的场景,以确定的终端设备当前所处的场景确定唤醒置信度阈值,并在计算出语音信息包括预设的唤醒词的置信度后与确定的唤醒置信度阈值进行比较,从而确定是否执行相应的唤醒操作,实现了根据场景调整唤醒终端设备的置信度目的,降低了在特定场景下误唤醒的几率,提高了用户体验。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种唤醒处理方法的流程示意图;

图2示出了本发明实施例提供的确定终端设备场景的流程示意图;

图3示出了本发明实施例提供的确定终端设备的场景与时间段的对应关系的流程示意图;

图4示出了本发明实施例提供的一种唤醒处理装置的结构示意图;

图5示出了本发明实施例提供的另一种唤醒处理装置的结构示意图;

图6示出了本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

现有技术中在唤醒处理是需要检测到用户的语音信息中包括预设的唤醒词时,无差别的唤醒设备,但由于存在误唤醒的可能性,若在不合适的场景下误唤醒,会严重影响用户的生活。例如,音箱在凌晨误唤醒,音箱被唤醒后开始播放音乐,直接影响已入睡的用户睡眠,用户体验性差。

本发明实施例提供的唤醒处理方法、装置及电子设备,旨在解决现有技术的如上技术问题。

实施例一

如图1所示,本发明提供了一种唤醒处理方法,包括如下步骤:

步骤s101、当采集到语音信息时,确定终端设备当前所处的场景。

本发明实施例中,本发明提供的方法运行在终端设备上,当终端设备处于工作状态时,在采集到语音信息时,确定终端设备当前所处的场景。

具体地,终端设备可以是手机、pad、笔记本、可穿戴设备以及如智能手表、智能音箱等智能设备。

步骤s102、确定与终端设备当前所处的场景对应的唤醒置信度阈值。

本发明实施例,不同的场景对应的唤醒置信度阈值不同,因而在确定终端设备当前所处的场景后,可以确定终端设备当前所处的场景对应的唤醒置信度阈值。

例如,终端设备可处于的场景包括场景1、场景2和场景3,且场景1、场景2和场景3对应的唤醒置信度阈值分别为阈值1、阈值2和阈值3。例如,确定终端设备当前所处的场景为场景1,则终端设备当前所处的场景对应的唤醒置信度阈值为阈值1。

步骤s103、计算语音信息包括预设的唤醒词的置信度。

本发明实施例,置信度用于表征语音信息中包括唤醒终端设备的唤醒词的概率。

步骤s104、将计算得到的置信度与唤醒置信度阈值比较,并根据比较结果确定是否执行相应的唤醒操作。

本发明实施例中,通过将计算得到的置信度与唤醒置信度阈值比较,实现根据比较结果确定是否执行相应的唤醒操作的目的。

本发明提供的唤醒处理方法,在当采集到语音信息时,确定终端设备当前所处的场景,实现了根据终端设备当前所处的场景确定唤醒置信度阈值的目的,为终端设备的唤醒提供了唤醒置信度阈值基础,并在计算得到语音信息包括的预设的唤醒词的置信度时,将计算得到的置信度与唤醒置信度阈值比较,从而确定是否执行相应的唤醒操作,实现了根据场景调整唤醒终端设备的置信度的目的,降低了在特定场景下误唤醒的机率,提高了用户体验。

进一步,在一些实施例中,确定终端设备当前所处的场景,如图2所示,包括:步骤s201和步骤s202。

步骤s201、获取当前时间点。

本发明实施例中,终端设备的时间可以是与云端时间同步的,也可以是在用户在终端设备上自定义调整时间后确定的当前时间点。

例如,云端的时间是北京时间13点28分56秒,终端设备的时间也是13点28分56秒;或者云端的时间是北京时间13点28分56秒,终端设备的时间在用户重新设置后,可能与云端的时间是北京时间13点28分56秒不同,用户重新设置后的时间可能比北京时间13点28分56秒提前,也可能靠后,如可能设置为北京时间13点30分10秒,也可能设置为北京时间13点25分10秒。

步骤s202、根据预设的场景与时间段的对应关系,确定当前时间点所属时间段对应的场景,作为终端设备当前所处的场景。

本发明实施例中,确定当前时间点后,查询预设的场景与时间段的对应关系,以确定当前时间点所属的时间段,从而根据当前时间点所属的时间段对应的场景。

例如,预设的场景与时间段的对应关系中包括场景1及场景1对应的时间段为时间段1;场景2及场景2对应的时间段为时间段2,假设场景1为工作场景,对应的时间段为8:00至18:00,场景2为睡眠场景,对应的时间段为24:00至7:00。若当前时间为13点28分56秒,13点28分56秒对应的时间段为8:00至18:00,那么确定当前时间点对应的场景为场景1,即工作场景。

本发明实施例通过确定终端设备当前时间点,实现了确定终端设备的当前所处场景的目的,从而为确定终端设备当前所处的场景对应的唤醒置信度阈值提供的判断基础。

在预设有场景与时间段的对应关系的本发明实施例中,如图3所示,该方法还包括:

步骤s301、获取终端设备的历史唤醒记录;

步骤s302、根据历史唤醒记录生成用户的作息表;

步骤s303、根据用户的作息表,对场景与时间段的对应关系进行调整。

本发明实施例中,实现了根据终端设备的历史唤醒记录生成用户的作息表,实现根据用户作息表调整场景与时间段的对应关系的目的,保证场景与时间段的对应关系适合当事人,防止预设的场景与时间段的对应关系不适合终端用户,防止唤醒不适时情形的出现,提高用户体验。

例如,预设的场景与时间段的对应关系中包括工作场景和睡眠场景,其中,工作场景对应的时间段为8:00至18:00;睡眠场景对应的时间段为24:00至7:00。假设根据终端设备的历史唤醒记录生成的用户的作息表可以确定,用户的睡眠时间为2:00至9:00,工作时间为10:00至21:00。因此需要调整预设的场景与时间段的对应关系,如调整预设场景中睡眠场景的时间段为2:00至9:00,工作场景对应的时间段为10:00至21:00。

具体地,步骤s104包括步骤s1041(图中未示出)和步骤s1042(图中未示出)。

其中,步骤s1041、若计算得到的置信度不小于唤醒置信度阈值,执行触发与语音信息包括的唤醒词对应的唤醒操作;

步骤s1042、若计算得到的置信度小于唤醒置信度阈值,不执行触发与语音信息包括的唤醒词对应的唤醒操作。

本发明实施例通过判断计算得到的置信度是否不小于唤醒置信度阈值,确定是否执行触发与语音信息包括的唤醒词对应的唤醒操作,实现将终端设备不同的场景确定的唤醒置信度阈值作为唤醒终端设备的标准之一,起到根据不同场景确定不同的唤醒置信度阈值的目的,提高唤醒终端设备的用户体验。

具体地,在确定执行步骤s1041的实施例中,在执行触发与语音信息包括的唤醒词对应的唤醒操作前,该方法还包括:

根据终端设备当前所处的场景确定终端设备的当前运行模式,并根据终端设备的当前运行模式判断是否触发执行触发唤醒操作;

步骤s1041中执行触发与语音信息包括的唤醒词对应的唤醒操作,包括:

若终端设备的当前运行模式确定为允许唤醒,执行触发与语音信息包括的唤醒词对应的唤醒操作;

若终端设备的当前运行模式确定为不允许唤醒,不执行触发与语音信息包括的唤醒词对应的唤醒操作。

本发明实施例中,在执行触发与语音信息包括的唤醒词对应的唤醒操作时,通过终端设备当前所处的场景确定当前的运行模式,以确定是否执行触发唤醒操作。

本发明实施例中,运行模式指的是终端设备的运行状态,可包括工作模式、飞行模式等。实际应用时,可以设置为飞行模式时,不执行触发唤醒操作。

例如,假设终端设备的运行模式为飞行模式,不执行触发与语音信息包括的唤醒词对应的唤醒操作;假设终端设备的运行模式为工作模式,执行触发与语音信息包括的唤醒词对应的唤醒操作。

本发明实施例通过在执行触发与语音信息包括的唤醒词对应的唤醒操作前,确定终端设备的运行模式,以根据终端设备的运行模式确定是否执行触发与语音信息包括的唤醒词对应的唤醒操作,实现根据不同场景的唤醒置信度阈值唤醒终端设备时,通过增加终端设备的运行模式最终确定是否唤醒的目的,进而提高用户体验。

实施例二

为了详细说明本发明实施例提供的唤醒处理方法,下面以音箱为例对本发明提供的唤醒处理方法进行进一步说明。

启动音箱后,音箱利用麦克风实时采集语音信息。例如,凌晨音箱采集到语音信息后,确定音箱当前时间点为凌晨2:00,凌晨2:00对应的场景为睡眠场景(因睡眠场景对应的时间段为24:00至7:00)。若睡眠场景下唤醒置信度阈值为a1,工作场景下唤醒置信度阈值为a2,a1大于a2,也就是说,睡眠场景下的唤醒置信度阈值高于工作模式下的唤醒置信度阈值,计算得到采集的语音信息中包括预设的唤醒词的置信度为a3,也就是说,若a1>a3>a2,因此,在工作模式下,可以唤醒音箱,而睡眠模式下不唤醒音箱;当前的场景为睡眠场景下,则不唤醒音箱。因此,本发明实施例为不同的场景设置了不同的唤醒置信度阈值,解决了不同场景采用同一唤醒置信度阈值时,只要采集到的语音信息包括的预设的唤醒词的置信度达到唤醒置信度阈值时,不论白天还是晚上休息时间都会唤醒,若存在误唤醒的情形时,即会影响用户的生活。由于不同用户的作息不同,因而预设的场景与时间段的对应关系可能不同,为了解决这种问题,本发明实施例根据音箱的历史唤醒记录生成用户的作息表,进而根据用户的作息表对预设的场景与时间段的对应关系进行调整,使预设的场景与时间段的对应关系适合用户,从而保证唤醒音箱时不会影响用户,进而提高用户体验。

实施例三

本发明实施例提供的一种唤醒处理装置结构示意图,如图4所示,该装置40包括:场景确定模块401、阈值确定模块402、置信度计算模块403和唤醒处理模块404。

其中,场景确定模块401,用于当采集到语音信息时,确定终端设备当前所处的场景;

阈值确定模块402,用于确定与终端设备当前所处的场景对应的唤醒置信度阈值;

置信度计算模块403,用于计算语音信息包括预设的唤醒词的置信度;

唤醒处理模块404,用于将计算得到的置信度与唤醒置信度阈值比较,并根据比较结果确定是否执行相应的唤醒操作

本发明提供的唤醒处理装置,在当采集到语音信息时,确定终端设备当前所处的场景,实现了根据终端设备当前所处的场景确定唤醒置信度阈值的目的,为终端设备的唤醒提供了唤醒置信度阈值基础,并在计算得到语音信息包括的预设的唤醒词的置信度时,将计算得到的置信度与唤醒置信度阈值比较,从而确定是否执行相应的唤醒操作,实现了根据场景调整唤醒终端设备的置信度的目的,降低了在特定场景下误唤醒的机率,提高了用户体验。

例如,进一步,该装置中场景确定模块401还包括:时间确定单元4011(图中未示出)和场景确定单元4012(图中未示出)。

其中,时间确定单元4011,用于获取当前时间点;

场景确定单元4012,用于根据预设的场景与时间段的对应关系,确定当前时间点所属时间段对应的场景,作为终端设备当前所处的场景。

例如,进一步,如图5所示,该装置40还包括:历史记录模块405、作息生成模块406和场景调整模块407。

其中,历史记录模块405,用于获取终端设备的历史唤醒记录;

作息生成模块406,用于根据历史唤醒记录生成用户的作息表;

场景调整模块407,用于根据用户的作息表,对场景确定单元中场景与时间段的对应关系进行调整。

进一步,唤醒处理模块404用于若计算得到的置信度不小于唤醒置信度阈值,执行触发与语音信息包括的唤醒词对应的唤醒操作;若计算得到的置信度小于唤醒置信度阈值,不执行触发与语音信息包括的唤醒词对应的唤醒操作。

进一步,如图5所示,该装置40还包括运行模式确定模块408,其中,

运行模式确定模块408,用于在执行触发与语音信息包括的唤醒词对应的唤醒操作前,根据终端设备当前所处的场景确定终端设备的当前运行模式,并根据终端设备的当前运行模式判断是否触发执行触发唤醒操作;更进一步,唤醒处理模块404还用于:若终端设备的当前运行模式确定为允许唤醒,执行触发与语音信息包括的唤醒词对应的唤醒操作;若终端设备的当前运行模式确定为不允许唤醒,不执行触发与语音信息包括的唤醒词对应的唤醒操作。

本实施例的唤醒处理装置可执行本发明实施例一提供的唤醒处理方法,其实现原理相类似,此处不再赘述。

实施例四

本发明实施例提供了一种电子设备,如图6所示,图6所示的电子设备600包括:处理器6001和存储器6003。其中,处理器6001和存储器6003相连,如通过总线6002相连。进一步地,电子设备600还可以包括收发器6006。需要说明的是,实际应用中收发器6006不限于一个,该电子设备600的结构并不构成对本发明实施例的限定。

处理器6001可以是cpu,通用处理器,dsp,asic,fpga或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器6001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。

总线6002可包括一通路,在上述组件之间传送信息。总线6002可以是pci总线或eisa总线等。总线6002可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器6003可以是rom或可存储静态信息和指令的其他类型的静态存储设备,ram或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom、cd-rom或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

存储器6003用于存储执行本发明方案的应用程序代码,并由处理器6001来控制执行。处理器6001用于执行存储器6003中存储的应用程序代码,以实现图4及图5所示实施例提供的唤醒处理装置。

本发明实施例提供了的电子设备,与现有技术相比较,在当采集到语音信息时,确定终端设备当前所处的场景,实现了根据终端设备当前所处的场景确定唤醒置信度阈值的目的,为终端设备的唤醒提供了唤醒置信度阈值基础,并在计算得到语音信息包括的预设的唤醒词的置信度时,将计算得到的置信度与唤醒置信度阈值比较,从而确定是否执行相应的唤醒操作,实现了根据场景调整唤醒终端设备的置信度的目的,降低了在特定场景下误唤醒的机率,提高了用户体验。实施例五

本发明实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例一及实施例二中任一实施例所示的唤醒处理方法。

本发明实施例提供的一种非暂态计算机可读存储介质,与现有技术相比较,通过在当采集到语音信息时,确定终端设备当前所处的场景,实现了根据终端设备当前所处的场景确定唤醒置信度阈值的目的,为终端设备的唤醒提供了唤醒置信度阈值基础,并在计算得到语音信息包括的预设的唤醒词的置信度时,将计算得到的置信度与唤醒置信度阈值比较,从而确定是否执行相应的唤醒操作,实现了根据场景调整唤醒终端设备的置信度的目的,降低了在特定场景下误唤醒的机率,提高了用户体验。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1