语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法与流程

文档序号:17630195发布日期:2019-05-11 00:03阅读:527来源:国知局
语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法与流程
本发明涉及语音唤醒词
技术领域
,尤其涉及一种语音唤醒词阈值管理装置及管理语音唤醒词阈值的方法。
背景技术
:现有技术中,语音交互过程中往往涉及语音唤醒词,通过语音唤醒词进行各种功能的语音交互为人们提供了很多便利,但是,为了保证语音唤醒词可用或利用率高,需要对其进行阈值计算,在对语音唤醒词进行阈值确定的流程中,计算和测试一个唤醒词的阈值需要大量的时间和人力成本,使得处理过程效率过低。技术实现要素:发明人在实践过程中,经过长期的经验总结发现实际应用中的产品虽然多种多样,但不同的产品可能会存在具有相同或相似唤醒词的情况,这就造成了重复计算,而由于计算和测试一个唤醒词的阈值需要大量的时间和人力成本,重复计算如果能够避免就能大幅提高处理效率,节约时间和人力成本。基于此,发明人根据唤醒词阈值计算的规则,从不同产品可能存在相同或相似语音唤醒词的角度出发,提出了一种解决方案,以解决现有技术中存在的唤醒词的阈值计算过程复杂、处理效率低的问题。第一方面,本发明实施例提供一种语音唤醒词阈值管理装置,包括:第一存储模块,用于存储产品的语音唤醒词及其测试阈值;阈值分配模块,用于接收新立项唤醒词参数,根据新立项唤醒词参数和第一存储模块中存储的产品的语音唤醒词及其测试阈值,为新立项唤醒词分配参考阈值。第二方面,本发明实施例提供一种管理语音唤醒词阈值的方法,包括:配置第一存储模块;接收第一用户指令,根据第一用户指令获取输入的产品的语音唤醒词及其测试阈值存储至第一存储模块;接收第二用户指令,根据第二用户指令获取新立项唤醒词参数;根据新立项唤醒词参数和存储的产品的语音唤醒词及其测试阈值,为新立项唤醒词分配参考阈值。第三方面,本发明提供了一种电子设备,其包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法的步骤。第四方面,本发明提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。本发明实施例的有益效果在于:根据本发明提供的语音唤醒词阈值管理装置和方法,通过第一存储模块,可以存储有市面现有的已测试的不同产品的不同语音唤醒词及其测试阈值(已经经过测试的阈值),这样在进行产品立项时,就可以根据新立项唤醒词参数和第一存储模块中预存的唤醒词信息迅速得出参考阈值。由此,如果第一存储模块中有近似的唤醒词参数,就可以直接通过简单计算得出该新立项产品的唤醒词的阈值,避免了还要重新计算的多余步骤。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明一实施方式的语音唤醒词阈值管理装置原理框图;图2为本发明另一实施方式的语音唤醒词阈值管理装置原理框图;图3为本发明一实施方式的管理语音唤醒词阈值的方法流程图;图4为本发明又一实施方式的管理语音唤醒词阈值的方法流程图;图5为本发明又一实施方式的管理语音唤醒词阈值的方法流程图;图6为本发明的电子设备的一实施例的结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本发明中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明实施例中的管理语音唤醒词阈值的方法及装置可以用于新立项产品的唤醒词的生成,其可以配置于终端设备上,该终端设备上配置有显示屏或者该终端设备能够投影出显示界面用于用户进行交互操作,例如,智能电视、智能手机、平板电脑、pc、智能家居、投影仪等任何智能硬件,新立项产品可以是具有语音交互功能的任何终端设备,例如智能电视、智能手机、平板电脑、pc、智能家居、投影仪等,本发明对此不作限定。图1示意性地显示了根据本发明一实施方式的语音唤醒词阈值管理装置,如图1所示,该语音唤醒词阈值管理装置1包括:第一存储模块2、阈值分配模块3、产品阈值管理模块4和初始阈值管理模块5。其中,第一存储模块2用于存储产品的语音唤醒词及其测试阈值,示例性地其可以实现为数据库,其中存储的语音唤醒词对应的测试阈值可以为市面上各产品的不同语音唤醒词的已经计算好并经过测试的阈值,由于不同产品的同一语音唤醒词的阈值可能不同(即唤醒词相同或相似,但这些唤醒词是用于不同产品的,因而阈值有所差异),将同一产品的唤醒词、其对应的唤醒词拼音以及其对应的测试阈值存储在同一表格中,如下所示:产品语音唤醒词语音唤醒词拼音测试阈值并且,该表格的内容随着科技的进步、新产品的研发、产品的改进等原因会进行实时更新。通过该存储模块2可以存储大量的产品语音唤醒词阈值数据,直接通过查表就可以获取到,还可以进行不同的应用,作为大数据基础,具有重要应用价值。阈值分配模块3用于接收新立项唤醒词参数,根据新立项唤醒词参数和第一存储模块2中存储的产品的语音唤醒词及其测试阈值,为新立项唤醒词分配参考阈值。其中,新立项唤醒词参数为用户研制或使用过程中,自定义的语音唤醒词,其参数包括语音唤醒词的汉字和拼音,将其输入至本发明的语音唤醒词阈值管理装置1中,可以通过手动打字输入实现,将输入的语音唤醒词与第一存储模块2中的语音唤醒词一列进行匹配,为了确定更准确的检索结果,还根据语音唤醒词的拼音一列进行二次匹配,将匹配成功的不同产品的测试阈值参数提取出来,根据提取结果,对不同产品的同一语音唤醒词的测试阈值做平均值计算,得出可供用户参考的参考阈值,该参考阈值即可作为新立项唤醒词的初始阈值投入使用。这样的计算方式简单快捷,并且由于通过大数据的测试阈值进行计算,所以准确率较高,可以使用户得到满意的新立项唤醒词的参考阈值。产品阈值管理模块4用于响应于接收到的用户指令,将接收到的产品的语音唤醒词及其测试阈值存储至第一存储模块2或从第一存储模块2中获取符合指令条件的产品的语音唤醒词及其测试阈值呈现给用户。当用户只是想要查看自己为产品定义的语音唤醒词及其阈值情况时,可以输入产品类型、语音唤醒词或其拼音,根据产品阈值管理模块4调用第一存储模块2,就可以准确的获取同类型产品的语音唤醒词及其测试阈值,或获取到不同产品的同一语音唤醒词的阈值。并且,在具体应用中,还可以查看同类型的产品各语音唤醒词的阈值分布,以及不同类型的产品中同一语音唤醒词的阈值分布,查询方式都可以参考前文叙述,在此不进行赘述。并且,当用户以管理员的身份使用该装置时,还可以将用户输入的语音唤醒词和测试阈值添加到第一存储模块2,完成了更新扩展存储模块2中的数据基础的作用,动态的对存储模块2进行更新可以使得获取的计算基础数据即阈值数据范围更大,数值更加准确。初始阈值管理模块5用于响应于接收到的用户指令,该指令实现为查询或存储语音唤醒词的阈值,将接收到的产品的语音唤醒词及其初始阈值存储或获取符合指令条件的产品的语音唤醒词及其初始阈值呈现给用户。除了可以通过产品阈值管理模块4对产品的语音唤醒词及其测试阈值进行管理之外,作为优选实施例,本实施例还包括初始阈值管理模块5,以对产品的语音唤醒词及其初始阈值进行管理,其具体实现方式可以参照产品阈值管理模块4进行实现,可以接收用于输入的查询指令进行语音唤醒词及其初始阈值的查询,还可以接收新增的产品语音唤醒词及其初始阈值进行存储,以方便查看。其中,产品语音唤醒词及其初始阈值可以同时存储在第一存储模块中,也可以单独存储在第二存储模块中。第二存储模块的实现可以参照第一存储模块,当同时存储在第一存储模块中时,只需要增加一个新的列即可。根据本实施例的语音唤醒词阈值管理装置就可以实现通过简单计算得出新立项产品的唤醒词阈值,从避免重复计算的角度提升了阈值计算的效率,降低计算的成本消耗。并且本发明实施例的实现方案中,计算参考阈值是基于实际使用的测试阈值进行计算的,得到的参考阈值更符合实际使用情况,可用性更高。并且上述装置还可以供用户实时查询产品的语音唤醒词及其阈值分布,方便进行唤醒词管理。在其他实施例中,也可以不设置上述的初始阈值管理模块5,或对上述各模块进行自由组合,根据需求进行相应设置及实现即可,本发明实施例不视为对具体实现形式的限制。图2示意性地显示了根据本发明又一实施方式的语音唤醒词阈值管理装置,如图2所示,该装置还包括:版本管理模块6,用于配置与产品的版本信息匹配的存储空间。其中,配置与产品的版本信息匹配的存储空间的具体实现方式,可以是在第一存储模块2的基础上又添加了产品的版本信息,形成了如下表格:也可以是以产品版本为基础,将第一存储模块2划分为不同的存储空间,例如划分为不同的数据存储表,每个数据存储表对应一个版本。本发明实施例对具体实现方式不进行限制,只要能够满足版本管理需求即可。这样当一些产品更新和改进后,其对应的语音唤醒词的测试阈值也随之改变的情况下,通过版本管理也可以查询到准确的阈值信息,而且能够基于不同的版本进行统计计算,进一步保证计算结果的精准性。在该实施例中,用户指令中可以包括版本参数,这样产品阈值管理模块4就可以实现为还用于根据用户指令中的版本参数,即用户的查询指令中可以包含有产品的具体版本参数,将接收到的产品的语音唤醒词及其测试阈值存储至相应的存储空间中,这样可以形成更为精准、覆盖范围更大的数据库方便后续的阈值查询、计算等。同样,初始阈值管理模块5还用于根据用户指令中的版本参数,将接收到的产品的语音唤醒词及其初始阈值存储至相应的存储空间。对于初始阈值同样可以结合产品的版本参数信息进行存储和查询,以实现版本管理。根据本实施例的语音唤醒词阈值管理装置不仅能快速查找产品的唤醒词阈值,还可以结合实际产品阈值计算得出平均值作为新立项产品的唤醒词参考阈值,且得出的唤醒词参考阈值更符合实际情况。另外,还可避免重复计算唤醒词阈值,节约生成唤醒词阈值的时间。同时基于版本管理,还可以查询特定版本阈值,更具有针对性。图3示意性地显示了根据本发明一实施方式的装置语音唤醒词阈值的方法流程图,如图3所示,本实施例包括如下步骤:步骤s301:配置第一存储模块,具体实现为表格或者其它方式,用于存储有已经计算出并测试过的产品的测试阈值。步骤s302:接收第一用户指令,根据第一用户指令获取输入的产品的语音唤醒词及其测试阈值存储至第一存储模块。该第一用户指令可以为管理员为第一存储模块加入新的语音唤醒词和测试阈值,这样就可以扩大第一存储模块的范围,使得测试结果更加精准。步骤s303:接收第二用户指令,根据第二用户指令获取新立项唤醒词参数,根据新立项唤醒词参数确定新立项唤醒词内容。第二用户指令实现为用户想要获取其新立项的语音唤醒词的阈值的指令,具体实现为:将用户输入的新立项唤醒词内容转换为对应的拼音序列,该拼音序列为新立项唤醒词的参数,根据该参数可以确定多组具有同样拼音序列的唤醒词,可以以列表的形式展现多组拼音序列的唤醒词内容,由用户手动去确认符合其标准的内容。步骤s304:根据新立项唤醒词参数和存储的产品的语音唤醒词及其测试阈值,为新立项唤醒词分配参考阈值。根据拼音序列确定唤醒词内容后,会从存储的产品的语音唤醒词中匹配出相同拼音序列的参考唤醒词,即根据第一存储模块中存储的语音唤醒词及其拼音等查询出相同拼音序列的参考唤醒词,对查询出的参考唤醒词的测试阈值进行平均值计算,得到参考阈值,将参考阈值作为新立项唤醒词的阈值输出。其中,查询出的匹配的参考唤醒词为多组,所以根据平均值计算可以得出较为准确的测试阈值。根据本实施例的方法可以实现快速简单的获取自定义的语音唤醒词阈值,并且得出的结果由于是参考于大数据即第一存储模块中的数据,所以准确率很高,并且免于重复计算。而且该第一存储模块可以实时更新,可以提供与时俱进的数据给予参考。图4示意性地显示了根据本发明又一实施方式的装置语音唤醒词阈值的方法流程图,如图4所示,本实施例包括如下步骤:步骤s401至步骤s402的实现方式可以参照步骤s301至步骤s302。步骤s403:根据第一用户指令获取查询指令条件,从第一存储模块符合指令条件的产品的语音唤醒词及其测试阈值呈现给用户。用户可以通过下发查询指令条件,该指令条件包括:语音唤醒词内容、产品,根据不同的查询条件组合,可以从第一存储模块中获取不同的信息。将获取信息以表格获列表等形式呈现给用户。由此,可以供用户实时查询不同类型产品的语音唤醒词及其阈值分布,方便管理,且还可以根据查询结果确定其自定义的语音唤醒词的利用率等信息。图5示意性地显示了根据本发明又一实施方式的装置语音唤醒词阈值的方法流程图,如图5所示,在本实施例中包括如下步骤:步骤501:配置第一存储模块。具体实现方式可以参照步骤s301。步骤s502:配置第二存储模块。第二存储模块用于存储产品的语音唤醒词及其初始阈值,如下表格所示:产品语音唤醒词初始阈值步骤s503:接收第三用户指令,根据第三用户指令获取输入的产品的语音唤醒词及其初始阈值存储至第二存储模块。该步骤的具体实现方式与步骤s302基本相容。这样可以实现迅速查看各产品的语音唤醒词阈值情况。步骤s504:根据第三用户指令获取查询指令条件,从第二存储模块符合指令条件的产品的语音唤醒词及其初始阈值呈现给用户。其具体实现方式与步骤s403基本相同,不同之处在于加入了产品的版本信息参数,可以获取更多的查询结果,更加针对性的获取语音唤醒词的阈值。在优选实施方式中,还可以通过第一存储模块和第二存储模块进行版本管理,具体实现可以是根据版本信息构建存储空间,这种情况下,产品的唤醒词及其阈值还分别对应相应的版本,此时接收到的用户指令即第二用户指令中还包括产品版本参数,而根据用户的指令获取新立项唤醒词参数和存储的产品的语音唤醒词及其测试阈值则实现为:根据新立项唤醒词参数确定新立项唤醒词内容和产品版本参数,将新立项唤醒词内容转换为对应的拼音序列,根据拼音序列和产品版本参数从存储的相应版本的产品的语音唤醒词中匹配出相同拼音序列的参考唤醒词,根据参考唤醒词的测试阈值计算得到参考阈值,将参考阈值作为新立项唤醒词的阈值输出。具体实现方式可以参考上述。其中,在另一优选实现方式中,在匹配出相同拼音序列的参考唤醒词之后,还可以根据产品特性对参考唤醒词进行筛选,该筛选过程可以通过用户手动筛选。上文的根据参考唤醒词的测试阈值计算得到参考阈值,是根据筛选后的参考唤醒词的测试阈值计算得到参考阈值。这样,可以保证得出的参考阈值更加准确。产品特性例如为固件型号不同因而无法适用,如使用的喇叭型号差异太大,导致匹配出的某些特定型号的产品无法进行等同适用,此时就将这些产品的记录删除,对剩余的即筛选后的记录进行平均值计算,以保证计算的话逇参考阈值的准确性。在一些实施例中,本发明实施例提供一种非易失性计算机可读存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项装置语音唤醒词阈值的方法。在一些实施例中,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项装置语音唤醒词阈值的方法。在一些实施例中,本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行装置语音唤醒词阈值的方法。在一些实施例中,本发明实施例还提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时装置语音唤醒词阈值的方法。上述本发明实施例的语音唤醒词阈值管理装置可用于执行本发明实施例的管理语音唤醒词阈值的方法,并相应的达到上述本发明实施例的实现管理语音唤醒词阈值的方法所达到的技术效果,这里不再赘述。本发明实施例中可以通过硬件处理器(hardwareprocessor)来实现相关功能模块。图6是为本发明一实施例提供的执行管理语音唤醒词阈值的方法的电子设备的硬件结构示意图,如图6所示,该设备包括:一个或多个处理器610以及存储器620,图6中以一个处理器610为例。执行装置语音唤醒词阈值的方法的设备还可以包括:输入装置630和输出装置640。处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。存储器620作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的装置语音唤醒词阈值的方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例装置语音唤醒词阈值的方法。存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据语音控制装置的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至语音唤醒词阈值管理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。输入装置630可接收输入的数字或字符信息,以及产生与语音唤醒词阈值管理装置的用户设置以及功能控制有关的信号。输出装置640可包括显示屏等显示设备。所述一个或者多个模块存储在所述存储器620中,当被所述一个或者多个处理器610执行时,执行上述任意方法实施例中的装置语音唤醒词阈值的方法。上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。本申请实施例的电子设备以多种形式存在,包括但不限于:(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iphone)、多媒体手机、功能性手机,以及低端手机等。(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:pda、mid和umpc设备等,例如ipad。(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如ipod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。(5)其他具有数据交互功能的电子装置。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1