一种基于声纹识别的智能冰箱信息流推送方法及装置与流程

文档序号:17473036发布日期:2019-04-20 05:56阅读:306来源:国知局
一种基于声纹识别的智能冰箱信息流推送方法及装置与流程

本发明涉及智能冰箱技术领域,特别涉及一种基于声纹识别的智能冰箱信息流推送方法及装置。



背景技术:

随着冰箱技术的发展和人民生活水平的提高,人们日常生活中开始普遍使用智能冰箱,智能冰箱不仅仅能控制冰箱内部温度和模式,亦可提供音乐以及视频播放等多媒体应用供用户娱乐。智能冰箱的功能远不止这些,因为智能系统的关系,创造了更多的可能让用户体验新的智能功能,其中推送新闻信息流就是其中的一种,用户可以在智能冰箱上浏览相关新闻信息,或者,智能冰箱为用户语音播报相关新闻信息。但是新闻的种类繁多,甚至有的新闻并不是用户所喜好看的,因此一种可以快捷过滤无用信息流的方法成为当前智能冰箱的一种需求。



技术实现要素:

本发明实施例提供了一种基于声纹识别的智能冰箱信息流推送方法及装置,以解决现有技术存在的问题。

为实现上述目的,本发明提供了一种基于声纹识别的智能冰箱信息流推送方法,包括:

接收目标用户的语音,利用声纹模型根据所述目标用户的语音提取待识别声纹特征信息;

在注册声纹库中逐一选择注册声纹特征信息,并计算选择的注册声纹特征信息与待识别声纹特征信息的相似度;

根据所述相似度判断该选择的注册声纹特征信息是否为所述目标用户预先注册的;

若是,则获取与该选择的注册声纹特征信息对应的目标信息流类型,并将所述目标信息流类型的信息推送给所述目标用户;其中,所述目标信息流类型为所述目标用户注册时预先设置的。

优选地,所述计算选择的注册声纹特征信息与待识别声纹特征信息的相似度,包括:利用下述公式计算选择的注册声纹特征信息与待识别声纹特征信息的相似度:

其中,q(t,si)∈[0,1],且t=|t1,t2……tn|,si=|si1,si2……sim|;

其中,q(t,si)是待识别声纹特征信息t与注册声纹库中选择的注册声纹特征信息si的相似度,i表示不同注册声纹特征信息的标识,当注册声纹库中的注册声纹特征信息包括多个时,记为s1、s2……si,si集合中每个元素用于表征一个声纹特征参数;t集合中每个元素用于表征一个声纹特征参数。

优选地,参数n与参数m的值相等,且t集合中与si集合中包括的声纹特征参数相同。

优选地,所述根据所述相似度判断该选择的注册声纹特征信息是否为所述目标用户预先注册的,包括:在所述相似度不小于设定阈值时,则确定该选择的注册声纹特征信息是所述目标用户预先注册的,否则,确定该选择的注册声纹特征信息不是所述目标用户预先注册的。

优选地,在所述接收目标用户的语音之前,还包括:

接收注册用户的语音,利用所述声纹模型根据所述注册用户的语音提取注册声纹特征信息,将所述注册用户的注册声纹特征信息存储到注册声纹库中;

获取所述注册用户设置的信息流类型,将所述注册用户的注册声纹特征信息与其设置的信息流类型绑定,并存储绑定关系。。

为实现上述目的,本发明还提供了一种基于声纹识别的智能冰箱信息流推送装置,包括:

接收模块,用于接收目标用户的语音;

提取模块,用于利用声纹模型根据所述目标用户的语音提取待识别声纹特征信息;

计算模块,用于在注册声纹库中逐一选择注册声纹特征信息,并计算选择的注册声纹特征信息与待识别声纹特征信息的相似度;

判断模块,用于根据所述相似度判断该选择的注册声纹特征信息是否为所述目标用户预先注册的;

获取模块,在所述判断模块判断结果为是时,则获取与该选择的注册声纹特征信息对应的目标信息流类型;其中,所述目标信息流类型为所述目标用户注册时预先设置的;

推送模块,用于将所述目标信息流类型的信息推送给所述目标用户。

优选地,所述计算模块,具体用于利用下述公式计算选择的注册声纹特征信息与待识别声纹特征信息的相似度:

其中,q(t,si)∈[0,1],且t=|t1,t2……tn|,si=|si1,si2……sim|;

其中,q(t,si)是待识别声纹特征信息t与注册声纹库中选择的注册声纹特征信息si的相似度,i表示不同注册声纹特征信息的标识,当注册声纹库中的注册声纹特征信息包括多个时,记为s1、s2……si,si集合中每个元素用于表征一个声纹特征参数;t集合中每个元素用于表征一个声纹特征参数。

优选地,参数n与参数m的值相等,且t集合中与si集合中包括的声纹特征参数相同。

优选地,所述判断模块,具体用于在所述相似度不小于设定阈值时,则确定该选择的注册声纹特征信息是所述目标用户预先注册的,否则,确定该选择的注册声纹特征信息不是所述目标用户预先注册的。

优选地,还包括:注册模块,用于接收注册用户的语音,利用所述声纹模型根据所述注册用户的语音提取注册声纹特征信息,将所述注册用户的注册声纹特征信息存储到注册声纹库中;获取所述注册用户设置的信息流类型,将所述注册用户的注册声纹特征信息与其设置的信息流类型绑定,并存储绑定关系。

本发明实施例提供了一种基于声纹识别的智能冰箱信息流推送方法及装置,利用声纹模型提取目标用户的待识别声纹特征信息,在注册声纹库中逐一选择注册声纹特征信息,计算选择的注册声纹特征信息与待识别声纹特征信息的相似度,根据相似度判断该选择的注册声纹特征信息是否为目标用户预先注册的,若是,则获取与该选择的注册声纹特征信息对应的目标信息流类型,将目标信息流类型的信息推送给目标用户。本发明,用户通过在智能冰箱内预先注册自身的声纹特征信息并设定偏好的信息流类型,智能冰箱在接收到用户的语音后,与注册声纹库内预先注册好的声纹特征信息进行相似度计算,从而可以确定出设定的信息流类型,进而更加快捷的过滤掉无用信息流,进行推送偏好信息流类型的信息。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的基于声纹识别的智能冰箱信息流推送方法流程图;

图2是本发明一个实施例提供的基于声纹识别的智能冰箱信息流推送装置的结构示意图;

图3是本发明一个实施例提供的基于声纹识别的智能冰箱信息流推送装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

请参考图1,本发明实施例提供了一种基于声纹识别的智能冰箱信息流推送方法,包括:

步骤101:接收目标用户的语音,利用声纹模型根据所述目标用户的语音提取待识别声纹特征信息。

在本实施例中,智能冰箱可以根据用户语音为其推送偏好的信息流,具体地,目标用户在智能冰箱可采集语音的范围内发出语音,智能冰箱可以采集到目标用户的语音,利用声纹模型根据目标用户的语音提取待识别声纹特征信息。

其中,待识别声纹特征信息至少可以包括:倒频谱、共振峰。例如,提取的待识别声纹特征信息可以用一个集合t来表示,该集合t=|t1,t2……tn|,其中,t集合中每个元素用于表征一个声纹特征参数,例如,t1为倒频谱,t2为共振峰,……。n为不小于1的整数。

声纹模型是预先构建的,针对不同用户的语音,提取出的声纹特征信息的参数相同。

其中,用户发出的语音可以是任意一句话,也可以是指定的话,语音的具体内容根据智能冰箱的设定来确定。

步骤102:在注册声纹库中逐一选择注册声纹特征信息,并计算选择的注册声纹特征信息与待识别声纹特征信息的相似度。

在本实施例中,可以预先构建一个注册声纹库,不同用户可以预先将自己的语音进行注册,具体地:注册用户通过智能冰箱的设置界面进行语音注册,在智能冰箱可采集语音的范围内发出语音,智能冰箱可以采集到注册用户的语音,利用声纹模型根据注册用户的语音提取注册声纹特征信息,并将注册用户的注册声纹特征信息存储到注册声纹库中。例如,每一个注册用户的注册声纹特征信息用一个集合si来表示,该集合si=|si1,si2……sim|,其中,si集合中每个元素用于表征一个声纹特征参数,i表示不同注册声纹特征信息的标识,当注册声纹库中的注册声纹特征信息包括多个时,记为s1、s2……si,每一个注册声纹特征信息包括m个声纹特征参数。

在注册过程中,为了智能冰箱能够采集到语音,以及在利用声纹模型提取声纹特征信息时更加准确,可以设定用户发出语音的时长,可以根据智能冰箱的设定来确定发出语音的时长,例如,发出语音时长为10s。

其中,在将注册用户的注册声纹特征信息存储到注册声纹库中之后,智能冰箱可以为该注册用户分配一个唯一的标识id。

进一步地,为了后续过程中能够为用户推送偏好类型的信息流,注册用户可以在智能冰箱中设置偏好的信息流类型,智能冰箱可以将所有信息流类型展示给注册用户,注册用户在展示的信息流类型中进行选择,智能冰箱将注册用户的注册声纹特征信息与其设置的信息流类型进行绑定,也可以是将注册用户的id与其设置的信息流类型进行绑定,并存储绑定关系。

由于在注册声纹库中注册有不同用户的注册声纹特征信息,因此,为了确定步骤101中目标用户是否在注册声纹库中预先注册过,需要逐一在注册声纹库中选择一个注册声纹特征信息,与目标用户的待识别声纹特征信息进行比对,直到确定出与该目标用户的待识别声纹特征信息相同的注册声纹特征信息为止,或者,直到注册声纹库中所有注册声纹特征信息均比对完为止。

在计算选择的注册声纹特征信息与待识别声纹特征信息的相似度时,可以采用欧式距离、余弦相似度等方式,但是,当两个集合中的元素数量非常大时,同时又有很多集合需要分别判断两两之间的相似度时,采用欧式距离、余弦相似度计算相似度将十分耗时,计算效率低。

在本实施例中,可以采用如下公式计算选择的注册声纹特征信息与待识别声纹特征信息的相似度:

其中,q(t,si)∈[0,1],q(t,si)是待识别声纹特征信息t与注册声纹库中选择的注册声纹特征信息si的相似度。

在本发明一个实施例中,集合t与集合si内的元素个数相同,即参数n与参数m的值相等,且t集合中与si集合中包括的声纹特征参数相同。例如,si1为倒频谱,si2为共振峰。

步骤103:根据所述相似度判断该选择的注册声纹特征信息是否为所述目标用户预先注册的。

在本实施例中,相似度值越大,两个集合的相似度越高。

本实施例中,可以设定一个阈值,在相似度大于该设定阈值时,则确定该选择的注册声纹特征信息是所述目标用户预先注册的,否则,确定该选择的注册声纹特征信息不是所述目标用户预先注册的。例如,该设定阈值为0.9。

步骤104:若是,则获取与该选择的注册声纹特征信息对应的目标信息流类型,并将所述信息流类型的信息推送给所述目标用户;其中,所述目标信息流类型为所述目标用户注册时预先设置的。

在本实施例中,由于预先存储有注册声纹特征信息与信息流类型的绑定关系,或者,预先存储有注册用户id与信息流类型的绑定关系,可以根据注册该绑定关系确定与该目标用户对应的目标信息流类型。

在确定了目标信息流类型之后,智能冰箱向信息流服务器请求该目标信息流类型的信息流,并将请求到的信息流推送给目标用户,从而对无用信息流进行过滤,为目标用户推送偏好类型的信息流。

本发明实施例中,利用声纹模型提取目标用户的待识别声纹特征信息,在注册声纹库中逐一选择注册声纹特征信息,计算选择的注册声纹特征信息与待识别声纹特征信息的相似度,根据相似度判断该选择的注册声纹特征信息是否为目标用户预先注册的,若是,则获取与该选择的注册声纹特征信息对应的目标信息流类型,将目标信息流类型的信息推送给目标用户。本发明,用户通过在智能冰箱内预先注册自身的声纹特征信息并设定偏好的信息流类型,智能冰箱在接收到用户的语音后,与注册声纹库内预先注册好的声纹特征信息进行相似度计算,从而可以确定出设定的信息流类型,进而更加快捷的过滤掉无用信息流,进行推送偏好信息流类型的信息。

请参考图2,示出了一种基于声纹识别的智能冰箱信息流推送装置,在本实施例中,基于声纹识别的智能冰箱信息流推送装置可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述基于声纹识别的智能冰箱信息流推送方法。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述基于声纹识别的智能冰箱信息流推送装置在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:

接收模块201,用于接收目标用户的语音;

提取模块202,用于利用声纹模型根据所述目标用户的语音提取待识别声纹特征信息;

计算模块203,用于在注册声纹库中逐一选择注册声纹特征信息,并计算选择的注册声纹特征信息与待识别声纹特征信息的相似度;

判断模块204,用于根据所述相似度判断该选择的注册声纹特征信息是否为所述目标用户预先注册的;

获取模块205,在所述判断模块判断结果为是时,则获取与该选择的注册声纹特征信息对应的目标信息流类型;其中,所述目标信息流类型为所述目标用户注册时预先设置的;

推送模块206,用于将所述目标信息流类型的信息推送给所述目标用户。

在本发明一个实施例中,所述计算模块203,具体用于利用下述公式计算选择的注册声纹特征信息与待识别声纹特征信息的相似度:

其中,q(t,si)∈[0,1],且t=|t1,t2……tn|,si=|si1,si2……sim|;

其中,q(t,si)是待识别声纹特征信息t与注册声纹库中选择的注册声纹特征信息si的相似度,i表示不同注册声纹特征信息的标识,当注册声纹库中的注册声纹特征信息包括多个时,记为s1、s2……si,si集合中每个元素用于表征一个声纹特征参数;t集合中每个元素用于表征一个声纹特征参数。

在本发明一个实施例中,参数n与参数m的值相等,且t集合中与si集合中包括的声纹特征参数相同。

在本发明一个实施例中,所述判断模块204,具体用于在所述相似度不小于设定阈值时,则确定该选择的注册声纹特征信息是所述目标用户预先注册的,否则,确定该选择的注册声纹特征信息不是所述目标用户预先注册的。

在本发明一个实施例中,请参考图3,该基于声纹识别的智能冰箱信息流推送装置还包括:注册模块207,用于接收注册用户的语音,利用所述声纹模型根据所述注册用户的语音提取注册声纹特征信息,将所述注册用户的注册声纹特征信息存储到注册声纹库中;获取所述注册用户设置的信息流类型,将所述注册用户的注册声纹特征信息与其设置的信息流类型绑定,并存储绑定关系。

综上,本发明各个实施例至少可以实现如下有益效果:

1、在本发明实施例中,利用声纹模型提取目标用户的待识别声纹特征信息,在注册声纹库中逐一选择注册声纹特征信息,计算选择的注册声纹特征信息与待识别声纹特征信息的相似度,根据相似度判断该选择的注册声纹特征信息是否为目标用户预先注册的,若是,则获取与该选择的注册声纹特征信息对应的目标信息流类型,将目标信息流类型的信息推送给目标用户。本发明,用户通过在智能冰箱内预先注册自身的声纹特征信息并设定偏好的信息流类型,智能冰箱在接收到用户的语音后,与注册声纹库内预先注册好的声纹特征信息进行相似度计算,从而可以确定出设定的信息流类型,进而更加快捷的过滤掉无用信息流,进行推送偏好信息流类型的信息。

上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1