本申请涉及信号处理技术领域,更具体地说,涉及一种耳机降噪方法、装置、设备及可读存储介质。
背景技术:
根据科学研究表明,环境声音的干扰会让人无法专心工作或休息,产生焦躁情绪,甚至对身体造成损伤。因此,降噪耳机的应用越来越广泛。
现有的耳机降噪方法通常在检测到外界环境声音后,直接通过降噪模块产生与外界环境声音相反的音波,把全部的外界环境声音消除掉,由此屏蔽外界环境声音的干扰,使得耳机佩戴对象能够体验到安静的环境。但是,这种降噪方法会使耳机佩戴对象听不到任何外界环境声音,导致耳机佩戴对象遗漏掉外界环境声音中对自己有用的信息,给耳机佩戴对象带来极大的不便。例如,在嘈杂的公共场合下,用户为了屏蔽噪声干扰而佩戴降噪耳机时,会错过外界环境声音中的重要提示广播,或在不连续的对话场景下,用户为了屏蔽噪声干扰佩戴降噪耳机很可能会错过谈话中的重要信息。
技术实现要素:
有鉴于此,本申请提供了一种耳机降噪方法、装置、设备及可读存储介质。能够解决现有耳机降噪方法消除全部的外界环境声音,给耳机佩戴对象带来极大的不便的缺点。
为了实现上述目的,现提出的方案如下:
一种耳机降噪方法,包括:
获取环境声音数据;
确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容;
若是,则将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉,且播放所述耳机佩戴对象感兴趣的内容。
优选地,所述确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容,包括:
根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据。
优选地,所述感兴趣信息为兴趣词,所述根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据,包括:
将所述环境声音数据转换成识别文本;
在所述识别文本中查找是否存在预先配置的与所述耳机佩戴对象对应的兴趣词,若存在,则确定所述环境声音数据中包含与所述感兴趣信息对应的声音数据,若不存在,则确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据。
优选地,所述感兴趣信息为兴趣声纹,所述根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据,包括:
确定所述环境声音数据中,是否存在所述兴趣声纹对应的声音数据;
若存在,则确定所述环境声音数据中包含与所述感兴趣信息对应的声音数据,若不存在,则确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据。
优选地,所述确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容,包括:
获取所述耳机佩戴对象的特征信息,所述特征信息与所述耳机佩戴对象感兴趣内容相关;
确定所述环境声音数据是否与所述特征信息相匹配,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,若否,则确定所述环境声音数据中不包含耳机佩戴对象感兴趣的内容。
优选地,若根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据,则该方法还包括:
获取所述耳机佩戴对象的特征信息,所述特征信息与所述耳机佩戴对象感兴趣内容相关;
确定所述环境声音数据是否与所述特征信息相匹配,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,若否,则确定所述环境声音数据中不包含耳机佩戴对象感兴趣的内容。
优选地,所述获取所述耳机佩戴对象的特征信息,包括:
获取预先设置的所述耳机佩戴对象的个人信息,作为特征信息;
所述确定所述环境声音数据是否与所述特征信息相匹配,包括:
获取与所述个人信息对应的标签;
确定所述环境声音数据对应的识别文本中是否包含所述标签,若是则确定匹配,若否,则确定不匹配。
优选地,所述获取所述耳机佩戴对象的特征信息,包括:
获取所述耳机佩戴对象历史讲话内容中包含的关键时间点和事件信息,作为特征信息;
所述确定所述环境声音数据是否与所述特征信息相匹配,包括:
确定所述环境声音数据对应的识别文本中是否包含所述关键时间点和/或所述事件信息,若是则确定匹配,若否,则确定不匹配。
优选地,所述获取所述耳机佩戴对象的特征信息,包括:
获取依据所述耳机佩戴对象历史讲话内容所确定的兴趣内容与兴趣度的对应关系,作为特征信息;
所述确定所述环境声音数据是否与所述特征信息相匹配,包括:
确定所述环境声音数据对应的识别文本中是否包含目标兴趣内容;
若确定包含目标兴趣内容,则依据所述兴趣内容与兴趣度的对应关系,查询所述目标兴趣内容对应的目标兴趣度;
根据所述目标兴趣度与预设兴趣度阈值的大小关系,确定所述环境声音数据与所述特征信息的匹配情况。
优选地,所述播放所述耳机佩戴对象感兴趣的内容,包括:
识别所述环境声音数据中所述耳机佩戴对象感兴趣的内容对应的目标声纹;
进入与所述目标声纹对应对象的对话模式,所述对话模式包括:将所述环境声音数据中所述目标声纹对应的声音数据播放。
优选地,所述播放所述耳机佩戴对象感兴趣的内容,还包括:
记录开始获取所述目标声纹对应的声音数据的起始时间;
检测自所述起始时间后的设定时间长度内,是否获取到所述目标声纹对应的声音数据;
若否,则退出与所述目标声纹对应对象的对话模式。
一种耳机降噪装置,包括:
环境声音数据获取单元,用于获取环境声音数据;
感兴趣内容判断单元,用于确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容;
噪声消除单元,用于在确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容时,将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉;
感兴趣内容播放单元,用于在确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容时,播放所述耳机佩戴对象感兴趣的内容。
优选地,所述感兴趣内容判断单元包括:
第一感兴趣内容判断子单元,用于根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据。
优选地,所述感兴趣信息为兴趣词,所述第一感兴趣内容判断子单元包括:
识别文本获取单元,用于将所述环境声音数据转换成识别文本;
兴趣词查找单元,用于在所述识别文本中查找是否存在预先配置的与所述耳机佩戴对象对应的兴趣词,若存在,则确定所述环境声音数据中包含与所述感兴趣信息对应的声音数据,若不存在,则确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据。
优选地,所述感兴趣信息为兴趣声纹,所述第一感兴趣内容判断子单元包括:
兴趣声纹确定单元,确定所述环境声音数据中,是否存在所述兴趣声纹对应的声音数据;若存在,则确定所述环境声音数据中包含与所述感兴趣信息对应的声音数据,若不存在,则确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据。
优选地,上述感兴趣内容判断单元包括:
第二感兴趣内容判断子单元,用于获取所述耳机佩戴对象的特征信息,所述特征信息与所述耳机佩戴对象感兴趣内容相关;
第三感兴趣内容判断子单元,用于确定所述环境声音数据是否与所述特征信息相匹配,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,若否,则确定所述环境声音数据中不包含耳机佩戴对象感兴趣的内容。
优选地,上述感兴趣内容判断单元还包括:
第二感兴趣内容判断子单元,用于在所述第一感兴趣内容判断子单元确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据时,获取所述耳机佩戴对象的特征信息,所述特征信息与所述耳机佩戴对象感兴趣内容相关;
第三感兴趣内容判断子单元,确定所述环境声音数据是否与所述特征信息相匹配,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,若否,则确定所述环境声音数据中不包含耳机佩戴对象感兴趣的内容。
优选地,第二感兴趣内容判断子单元,包括:
第一特征信息获取单元,用于获取预先设置的所述耳机佩戴对象的个人信息,作为特征信息;
所述第三感兴趣内容判断子单元,包括:
标签获取单元,用于获取与所述个人信息对应的标签;
标签查找单元,用于确定所述环境声音数据对应的识别文本中是否包含所述标签,若是则确定匹配,若否,则确定不匹配。
优选地,第二感兴趣内容判断子单元,包括:
第二特征信息获取单元,用于获取所述耳机佩戴对象历史讲话内容中包含的关键时间点和事件信息,作为特征信息;
所述第三感兴趣内容判断子单元,包括:
识别文本参考单元,用于确定所述环境声音数据对应的识别文本中是否包含所述关键时间点和/或所述事件信息,若是则确定匹配,若否,则确定不匹配。
优选地,第二感兴趣内容判断子单元,包括:
第三特征信息获取单元,用于获取依据所述耳机佩戴对象历史讲话内容所确定的兴趣内容与兴趣度的对应关系,作为特征信息;
所述第三感兴趣内容判断子单元,包括:
兴趣内容判断单元,用于确定所述环境声音数据对应的识别文本中是否包含目标兴趣内容;
目标兴趣度查询单元,用于若上述兴趣内容判断单元判断结果为是,则依据所述兴趣内容与兴趣度的对应关系,查询所述目标兴趣内容对应的目标兴趣度;
兴趣度比较单元,用于根据所述目标兴趣度与预设兴趣度阈值的大小关系,确定所述环境声音数据与所述特征信息的匹配情况。
优选地,所述感兴趣内容播放单元,包括:
目标声纹识别单元,用于识别所述环境声音数据中所述耳机佩戴对象感兴趣的内容对应的目标声纹;
对话模式进入单元,用于进入与所述目标声纹对应对象的对话模式,所述对话模式包括:将所述环境声音数据中所述目标声纹对应的声音数据播放。
优选地,所述感兴趣内容播放单元,还包括:
起始时间记录单元,用于记录开始获取所述目标声纹对应的声音数据的起始时间;
设定时长检测单元,用于检测自所述起始时间后的设定时间长度内,是否获取到所述目标声纹对应的声音数据;
对话模式退出单元,用于在所述目标声纹检测单元检测结果为否时,退出与所述目标声纹对应对象的对话模式。
一种耳机降噪设备,包括存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上所述的任一项耳机降噪方法的各个步骤。
一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的任一项耳机降噪方法的各个步骤。
从上述的技术方案可以看出,本申请实施例提供的耳机降噪方法,获取耳机佩戴对象所处环境中的外界环境声音数据,确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容,这里,感兴趣的内容指的是耳机佩戴对象想要听到的内容,进一步,当确定环境声音数据中包含耳机佩戴对象感兴趣的内容后,将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉,且播放所述耳机佩戴对象感兴趣的内容。由上可知,本方法播放耳机佩戴对象感兴趣的内容,并将除耳机佩戴对象感兴趣的内容之外的内容消除掉,由此,既使耳机佩戴对象避免环境噪声的干扰,能够处于安静的状态,又能避免耳机佩戴对象错过想要听到的声音内容,提高了耳机佩戴对象的便利性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的一种耳机降噪方法的流程图;
图2为本申请实施例公开的一种耳机降噪装置的结构图;
图3为本申请实施例公开的一种耳机降噪设备的硬件结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供的耳机降噪方法,可以应用于降噪耳机,适用于用户需要佩戴降噪耳机对环境声音进行降噪处理的场景下,例如当用户处于嘈杂的公共场所时,需要佩戴降噪耳机以体验安静的休息环境。此时,现有的耳机降噪方法是将全部环境声音进行降噪处理,但是,这种方法会将耳机佩戴对象感兴趣的环境声音一并消除,比如,与他人的交谈对话内容,或者是广播内容。故本申请在对环境声音数据中的噪声进行降噪处理的过程中,将耳机佩戴对象感兴趣的内容播放,能够保证耳机佩戴对象处于安静状态的同时,也能够听到环境声音中感兴趣的内容。
接下来,结合附图1对本申请耳机降噪方法进行介绍,如图1示例了一种耳机降噪方法流程图,该方法详细包括:
步骤s100、获取环境声音数据。
具体地,获取耳机佩戴对象所处环境中的外界环境声音数据,一种可选的实现途径为设置录音模块,当检测到外界环境的声音时,启动录音模块,对外界环境声音信号进行采集。
步骤s110、确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容,若是,执行步骤s120。
具体地,耳机佩戴对象感兴趣的内容指的是环境声音数据中耳机佩戴对象想要听到的内容,比如,候车大厅的广播内容,或者他人与自己的对话内容等,本步骤在获取环境声音数据后,进一步确定环境声音数据中是否包含耳机佩戴对象想要听到的内容。
步骤s120、将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉,且播放所述耳机佩戴对象感兴趣的内容。
具体地,当步骤s110中确定环境声音数据中包含耳机佩戴对象感兴趣的内容后,将环境声音数据中除耳机佩戴对象感兴趣的内容之外的内容作为噪声进行消除,消除方法的原理可以与现有降噪方法相同,即通过产生与噪声相反的声波将噪声声音数据内容中和掉,进一步,播放耳机佩戴对象感兴趣的内容,使用户能够听到想要听到的声音数据内容。
从上述的技术方案可以看出,本申请实施例提供的耳机降噪方法,获取耳机佩戴对象所处环境中的外界环境声音数据,确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容,这里,感兴趣的内容指的是耳机佩戴对象想要听到的声音内容,进一步,当确定环境声音数据中包含耳机佩戴对象感兴趣的内容后,将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉,且播放所述耳机佩戴对象感兴趣的内容。由上可知,本方法播放耳机佩戴对象感兴趣的内容,并将除耳机佩戴对象感兴趣的内容之外的内容消除掉,由此,既使耳机佩戴对象避免环境噪声的干扰,能够处于安静的状态,又能避免耳机佩戴对象错过想要听到的声音内容,提高了耳机佩戴对象的便利性。
接下来提出本申请的一个实施例,对步骤s110中的确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容进行介绍。
前述已经说明,耳机佩戴对象感兴趣的内容指的是耳机佩戴对象想要听到的声音数据内容,确定环境声音数据中是否包含耳机佩戴对象感兴趣的内容的实施方式有多种,本实施例介绍其中一种可选的实施方式。
具体地,本实施例介绍的实施方式基于感兴趣信息,这里,感兴趣信息是预先配置的与耳机佩戴对象对应的感兴趣信息,显然,这些感兴趣信息是提前设置的与耳机佩戴对象想要听到的声音内容对应的信息,可以通过确定环境声音数据中是否包含与感兴趣信息对应的声音数据,确定环境声音数据中是否包含耳机佩戴对象感兴趣的内容。
根据预先配置的与耳机佩戴对象对应的感兴趣信息的类型不同,确定环境声音数据中是否包含与感兴趣信息对应的声音数据的方法包括多种,接下来分别介绍其中可选的两种实施方式。
第一种、感兴趣信息为兴趣词。
这里,兴趣词是由耳机佩戴对象预先配置的一个或多个词语,可以包括时间、事件、人物、地点等,可以理解的是,兴趣词是耳机佩戴对象想要听到的声音数据内容包含的词语,例如,将耳机佩戴对象的名字、同伴的名字预先配置为兴趣词,或者在候车室场景中,若想要听到广播内容,可以提前将“旅客”、“广播”、“车次”等关键词预先配置为兴趣词。
基于此,确定环境声音数据中是否包含与感兴趣信息对应的声音数据的过程,可以包括:
首先,将所述环境声音数据转换成识别文本。
具体地,通过语音识别技术将获取的环境声音数据转换成识别文本。这里语音识别技术可以选择现有技术,本实施例不做赘述。
进一步,在所述识别文本中查找是否存在预先配置的与所述耳机佩戴对象对应的兴趣词。
具体地,在环境声音数据的识别文本中查找上述预先配置的兴趣词,由于兴趣词是感兴趣信息,所以当查找结果为存在时,则确定环境声音数据中包含与感兴趣信息对应的声音数据,若查找结果为不存在,则确定环境声音数据中不包含与感兴趣信息对应的声音数据。
示例如,耳机佩戴对象想要听到包含自己姓名的声音内容,故将耳机佩戴对象的姓名“李明”预先配置为兴趣词,在耳机开始使用后,持续获取环境声音数据,并将环境声音数据转换为识别文本,进一步查找其中是否存在耳机佩戴对象预先配置的兴趣词“李明”,若存在,则确定环境声音数据中包含与耳机佩戴对象姓名对应的声音数据,即,确定环境声音数据中包含与感兴趣信息对应的声音数据。
第二种、感兴趣信息为兴趣声纹。
这里,兴趣声纹指的是耳机佩戴对象想要听到的声音对应的声纹,例如,耳机佩戴对象想要听到同伴与自己的谈话内容的时候,可以将同伴声音的声纹预先配置为兴趣声纹。
此时,确定环境声音数据中是否包含与感兴趣信息对应的声音数据的过程,可以包括:
确定所述环境声音数据中,是否存在所述兴趣声纹对应的声音数据。
具体地,查找环境声音数据,确定其中是否存在预先配置的兴趣声纹对应的声音数据。可以理解的是,兴趣声纹是耳机佩戴对象预先配置的感兴趣信息,所以当查找环境声音数据,确定其中存在兴趣声纹对应的声音数据时,则确定环境声音数据中包含与感兴趣信息对应的声音数据,若查找结果为不存在,则确定环境声音数据中不包含与感兴趣信息对应的声音数据。
示例如,耳机佩戴对象想要听到同伴对自己说话时的声音内容,所以将同伴的声音预先配置为兴趣声纹,在耳机开始使用后,持续获取环境声音数据,确定其中是否存在耳机佩戴对象预先配置的兴趣声纹,若存在,则确定环境声音数据中包含同伴的声纹对应的声音数据,即,确定环境声音数据中包含与感兴趣信息对应的声音数据。
需要说明的是,上述两种确定环境声音数据中是否包含与感兴趣信息对应的声音数据的方法,可以包括在线或离线两种实现过程。
其中在线实现过程中,后台服务器获取预先配置的感兴趣信息并储存。耳机在获取环境声音数据之后发送至服务器,由服务器进行确定环境声音数据中是否包含与感兴趣信息对应的声音数据的过程,并将确定结果发送至耳机。
离线过程是耳机获取预先配置的感兴趣信息并储存在本地,基于此,在本地进行确定环境声音数据中是否包含与感兴趣信息对应的声音数据的过程。
基于上述两种方法,将预先配置的兴趣词或兴趣声纹作为感兴趣信息,通过确定环境声音数据中是否存在兴趣词或者兴趣声纹,确定环境声音数据中是否包含与感兴趣信息对应的声音数据,因为感兴趣信息是预先配置的与耳机佩戴对象想要听到的内容有关的兴趣词或兴趣声纹,所以根据上述确定结果,可以进一步确定环境声音数据中是否包含耳机佩戴对象感兴趣的内容,即若确定环境声音数据中包含与感兴趣信息对应的声音数据,则可以确定环境声音数据中包含耳机佩戴对象感兴趣的内容,若确定环境声音数据中不包含与感兴趣信息对应的声音数据,则可以确定环境声音数据中不包含耳机佩戴对象感兴趣的内容。
接下来,本实施例介绍步骤s110,确定环境声音数据中是否包含耳机佩戴对象感兴趣的内容的另一种可选的实施方式,可以包括:
a1、获取所述耳机佩戴对象的特征信息。
具体地,特征信息与耳机佩戴对象感兴趣内容相关。例如,耳机佩戴对象平时喜欢看电影,喜欢运动,可以认为环境声音数据中的与电影或者运动有关的话题是耳机佩戴对象想要听到的内容。则可以将与耳机佩戴对象的爱好有关的信息作为特征信息,比如电影以及电影的名称或者运动以及运动项目。显然,特征信息是与耳机佩戴对象感兴趣内容相关的。
a2、确定所述环境声音数据是否与所述特征信息相匹配。
具体地,由于特征信息与耳机佩戴对象感兴趣的内容相关,所以若确定环境声音数据与特征信息相匹配,则确定环境声音数据中包含耳机佩戴对象感兴趣的内容,若确定环境声音数据与特征信息不匹配,则确定环境声音数据中不包含耳机佩戴对象感兴趣的内容。
需要说明的是,当确定环境声音数据与特征信息相匹配时,可以进一步增加二次确认的过程:设置语音提示或震动提示,由耳机佩戴对象确认环境声音数据中是否包含感兴趣的内容。显然增加的二次确认过程能够使判断结果更加准确。
上述两个实施例介绍了两种不同的确定环境声音数据中是否包含耳机佩戴对象感兴趣的内容的实施方式,本实施例中还可以将上述两种实施方式相结合,具体过程可以包括:
b1、根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据。
具体地,与耳机佩戴对象对应的感兴趣信息可以包括预先配置的兴趣词或兴趣声纹,当确定环境声音数据中包含与感兴趣信息对应的声音数据,则确定环境声音数据中包含耳机佩戴对象感兴趣的内容。
若确定环境声音数据中不包含与所述感兴趣信息对应的声音数据,则执行b2。若确定环境声音数据中包含与所述感兴趣信息对应的声音数据,则可以确定环境声音数据中包含耳机佩戴对象感兴趣的内容。
b2、获取所述耳机佩戴对象的特征信息。
其中,特征信息与耳机佩戴对象感兴趣内容相关。本步骤可以参照上述a1的实施过程,在此不做赘述。
b3、确定所述环境声音数据是否与所述特征信息相匹配。
可以理解的是,若b3的确定结果为是,则可以确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,否则,可以确定环境声音数据中不包含耳机佩戴对象感兴趣的内容。
b3步骤的实施过程可以参照上述a2步骤,详细过程在此不做赘述。
可以理解的是,特征信息可以有多种可选的获取方式,例如,可以根据耳机佩戴对象的个人信息确定特征信息,或者根据耳机佩戴对象历史讲话内容确定特征信息。根据特征信息获取方式不同,本实施例中确定环境声音数据是否与特征信息相匹配的实施方式可以包括多种,接下来对可选的三种实施方式进行介绍。
第一种、
获取预先设置的耳机佩戴对象的个人信息,作为特征信息。
这里,个人信息是指预先设置的一些个人信息,比如职业、年龄、家庭住址等。可以理解的是,与这些个人信息相关的环境声音数据可能是耳机佩戴对象感兴趣的内容。比如,将预先设置的职业“程序员”作为特征信息,则与程序员有关的环境声音数据可能是耳机佩戴对象想要听到内容。
基于此,上述a2或b3确定所述环境声音数据是否与所述特征信息相匹配的过程,可以包括:
首先,获取与所述个人信息对应的标签。
具体地,获取预设的个人信息对应的标签,这些标签都是与个人信息内容相关的词语,每条个人信息可以对应于一个或多个标签。例如,耳机佩戴对象的职业是程序员,则获取到“程序员”相关的标签,如“码农”、“程序猿”、“编程”等。
进一步,确定所述环境声音数据对应的识别文本中是否包含所述标签,若是则确定匹配,若否,则确定不匹配。
具体地,在环境声音数据对应的识别文本中查找是否包含个人信息对应的标签,当环境声音数据对应的识别文本中包含一个或多个标签时,确定环境声音数据与特征信息相匹配,进一步确定环境声音数据中包含耳机佩戴对象感兴趣的内容。例如,耳机佩戴对象的职业是程序员,当环境声音数据对应的识别文本中包含标签“程序猿”,那么确定环境声音数据与特征信息相匹配,进一步确定环境声音数据中包含耳机佩戴对象感兴趣的与自己职业相关的内容。
当环境声音数据对应的识别文本中不包含标签时,确定环境声音数据与特征信息不匹配。
第二种、
获取所述耳机佩戴对象历史讲话内容中包含的关键时间点和事件信息,作为特征信息。这里,历史讲话内容可以包括收集的历史讲话音频转换成的识别文本。
具体地,关键时间点和事件信息指的是在一段时间内的耳机佩戴对象的历史讲话内容中包含的时间点和事件,可以理解的是,关键时间点和事件信息是和耳机佩戴对象感兴趣的内容相关的信息,所以可以将获取的关键时间点和时间信息作为特征信息。一般的,关键时间点或事件信息可以单独作为特征信息,也可以是将关键时间点和与其对应的事件信息一起作为一组特征信息,比如,耳机佩戴对象在一周前和别人讨论过“下周四下午两点开会”的相关内容,则可以将“下周四下午两点”作为关键时间点,并将“会议”作为与此关键时间点对应的事件信息。
进一步地,在依据耳机佩戴对象历史讲话内容确定出关键时间点和事件信息之后,可以设置提示语音提示耳机佩戴对象,是否要将该关键时间点设定为一个定时闹钟。在得到耳机佩戴对象的确认之后,可以将该关键时间点设置为一个定时闹钟,并且当系统时间达到定时闹钟时刻时,耳机会播放对应的提示音提醒耳机佩戴对象处理该关键时间点对应的事件。
在特征信息包含关键时间点和事件信息时,上述a2或b3确定所述环境声音数据是否与所述特征信息相匹配的过程,可以包括:
确定环境声音数据对应的识别文本中是否包含关键时间点和/或事件信息。
一种可选的方式,只要环境声音数据对应的识别文本中包含关键时间点或事件信息中至少一项时,则可以确定环境声音数据与特征信息相匹配。比如,环境声音数据对应的识别文本中包括关键时间点“下周四下午两点”,则可以确定环境声音数据与特征信息相匹配。
另一种可选的方式,当环境声音数据对应的识别文本中同时包含关键时间点和与之对应的事件信息时,才确定环境声音数据与特征信息相匹配。比如环境声音数据对应的识别文本中包括关键时间点“下周四下午两点”以及,时间点对应的事件信息“会议”,则可以确定环境声音数据与特征信息相匹配。
由于特征信息是根据耳机佩戴对象历史讲话内容确定的,所以当确定环境声音数据与特征信息相匹配时,可以进一步确定环境声音数据中包含耳机佩戴对象感兴趣的内容。
需要说明的是,由于关键时间点和事件信息具有时效性,因此可以为关键时间点和事件信息设置时间标签,该时间标签的时效性由关键时间点和事件信息的时效性确定。
则确定环境声音数据是否与特征信息相匹配的过程可以包括:
确定环境声音数据对应的识别文本中,是否包含时间标签处于有效期内的关键时间点和事件信息,若确定包含,则可以认为匹配成功,否则,认为匹配不成功。
第三种、
获取依据所述耳机佩戴对象历史讲话内容所确定的兴趣内容与兴趣度的对应关系,作为特征信息。这里,历史讲话内容可以包括收集的历史讲话音频转换成的识别文本。
具体地,兴趣内容包括兴趣类别下的兴趣项目,其中兴趣类别可以包括电影、音乐、书籍等,兴趣项目可以包括电影名称、书籍名称以及音乐名称等,可以通过对耳机佩戴对象历史讲话内容进行分析,确定其包含的兴趣类型集合,以及兴趣项目集合。由兴趣类型集合中任一兴趣类型,与兴趣项目集合中任一兴趣项目组成一条兴趣内容。
可以理解的是,耳机佩戴对象对于每一兴趣内容的感兴趣程度可能不同,所以进一步根据耳机佩戴对象历史讲话内容确定每一兴趣内容的兴趣度,确定兴趣度的方法可以有多种,比如可以计算兴趣内容在历史讲话内容中出现的次数或者频率,本实施例介绍可选的一种计算兴趣度的方法,如下:
1)计算兴趣内容的支持度。
兴趣内容的支持度是指:在耳机佩戴对象历史讲话内容中兴趣内容包括的兴趣类型和兴趣项目同时出现在一句话中的频率。即针对一条兴趣内容,若该兴趣内容的支持度高,则表示该兴趣内容出现频率高,比如,“程序员”和“java”的支持度,高于“程序员”和“茶叶”的支持度,表示“程序员”和“java”同时出现在一句话中的频率大于“程序员”和“茶叶”。将兴趣类型和兴趣项目分别表示为x和y,支持度的具体计算公式如下所示:
其中,总词数是指耳机佩戴对象历史讲话内容中包含的词的总数量。例如,获取的历史讲话内容共包括100个词,其中“程序员”和“java”在一句话中同时出现的次数为8次,则确定包括“程序员”和“java”的兴趣内容的支持度为:support(程序员,java)=8/100=0.08。
2)计算兴趣内容的置信度。
具体地,兴趣内容的置信度是指:在耳机佩戴对象历史讲话内容中出现该兴趣内容的兴趣类型的基础上,该兴趣内容的兴趣项目也出现的概率。将兴趣类型表示为x,将兴趣项目表示为y,置信度的具体计算公式如下所示:
其中,出现x的总次数指的是耳机佩戴对象在历史讲话内容中x出现的总次数。例如,获取的历史讲话内容共包括100个词,其中“程序员”的出现的次数为20次,“程序员”和“java”在一句话中同时出现的次数为8次,则确定包括“程序员”和“java”的兴趣内容的置信度为:confidence(程序员,java)=8/20=0.4。
基于上述方法,将每一条兴趣内容的支持度与置信度计算出来。如下表1示例了一种兴趣内容支持度和置信度的对应表格。
表1
3)计算兴趣内容的兴趣度
上述确定了每条兴趣内容的支持度和置信度,将每一兴趣内容对应的支持度和置信度储存。计算兴趣度的过程可以直接选择兴趣内容的支持度或置信度表示,或者,本方法同时考虑支持度和置信度的影响,根据支持度和置信度确定兴趣内容与兴趣度的对应关系。
具体地,兴趣度是指耳机佩戴对象对兴趣内容感兴趣的程度,将兴趣类型和兴趣项目分别表示为x和y,兴趣度通常用i(x,y)表示,具体的计算公式可以如下所示:
示例如,上述“程序员”和“java”的兴趣内容的支持度为0.08,置信度为0.4,则其兴趣度可以由上式计算得:
利用上述方法得到每一兴趣内容与其兴趣度的对应关系,将该对应关系作为特征信息。可以理解的是,兴趣内容与兴趣度的对应关系反映了耳机佩戴对象对兴趣内容的感兴趣程度,且对应关系是随着历史讲话内容的增加而不断更新的。
基于此,上述a2或b3确定所述环境声音数据是否与所述特征信息相匹配的过程,可以包括:
c1、确定所述环境声音数据对应的识别文本中是否包含目标兴趣内容。
具体地,在环境声音数据对应的识别文本中查找,是否包含由上述确定的目标兴趣内容。这里,只要确定环境声音数据对应的识别文本中包含目标兴趣类型集合或目标兴趣项目集合中任一项或多项,则确定环境声音数据对应的识别文本中包含目标兴趣内容。比如,当在环境声音数据对应的识别文本中查找,确定环境声音数据对应的识别文本中包含目标兴趣项目集合中的“复仇者联盟”,则可以确定环境声音数据对应的识别文本中包含目标兴趣内容。或者当在环境声音数据对应的识别文本中查找,确定环境声音数据对应的识别文本中包含目标兴趣类型集合中的“好莱坞电影”,则可以确定环境声音数据对应的识别文本中包含目标兴趣内容。
可以理解的是,若环境声音数据对应的识别文本中仅包含目标兴趣类型,则可以将包含目标兴趣类型的兴趣内容作为识别文本所包含的目标兴趣内容;若环境声音数据对应的识别文本中仅包含目标兴趣项目,则可以将包含目标兴趣项目的兴趣内容作为识别文本所包含的目标兴趣内容;若环境声音数据对应的识别文本中同时包含目标兴趣类型和目标兴趣项目,则可以将包含目标兴趣类型和目标兴趣项目的兴趣内容作为识别文本所包含的目标兴趣内容。
c2、若确定包含目标兴趣内容,则依据所述兴趣内容与兴趣度的对应关系,查询所述目标兴趣内容对应的目标兴趣度。
可以理解的是上述确定的目标兴趣内容可以包括多条,例如确定环境声音数据对应的识别文本中包含目标兴趣项目集合中的“复仇者联盟”,由表1可以确定包含目标兴趣项目“复仇者联盟”的目标兴趣内容有两条,该两条目标兴趣内容的目标兴趣类型分别为“好莱坞电影”和“漫威”。
进一步可以通过查询得到每一目标兴趣内容对应的目标兴趣度,当目标兴趣内容包括多条时,则目标兴趣内容对应的目标兴趣度可以根据多个目标兴趣度得到,比如可以将多个目标兴趣度相加或者加权求和。例如,当前环境声音数据对应的识别文本中包含“复仇者联盟”,则查询包含“复仇者联盟”的目标兴趣内容,发现一项为“漫威”兴趣类型下的“复仇者联盟”,另一项为“好莱坞电影”兴趣类型下的“复仇者联盟”,此时,查询目标兴趣内容对应的目标兴趣度是将两项目标兴趣内容的兴趣度相加,得到“复仇者联盟”对应的目标兴趣度。
c3、根据所述目标兴趣度与预设兴趣度阈值的大小关系,确定所述环境声音数据与所述特征信息的匹配情况。
具体地,可以根据耳机佩戴对象的使用习惯预设兴趣度阈值,当目标兴趣内容对应的目标兴趣度大于等于预设兴趣度阈值时,可以确定环境声音数据与特征信息相匹配,否则,可以确定环境声音数据与特征信息不匹配。由于目标兴趣内容与目标兴趣度的对应关系是根据耳机佩戴对象历史讲话内容确定的,所以可以进一步确定环境声音数据中包含耳机佩戴对象感兴趣的内容。
上述介绍了确定环境声音数据是否与特征信息相匹配的三种方式,由于特征信息是根据耳机佩戴对象预设的个人信息或者历史讲话内容确定的,所以特征信息与耳机佩戴对象感兴趣的内容是相关的,当通过上述任一种方法确定环境声音数据与特征信息相匹配时,则可以确定环境声音数据中包含耳机佩戴对象感兴趣的内容。
需要说明的是,上述三种特征信息的匹配过程都可以有在线或离线两种实现过程。
其中在线实现过程中,后台服务器调用开放的应用程序api(applicationprograminterface)接口获取预设的个人信息或历史讲话内容,得到特征信息并储存,进行匹配时,由耳机发送环境声音数据对应的识别文本至后台服务器,由后台服务器进行上述确定环境声音数据是否与特征信息相匹配的过程,并将匹配结果发送至耳机。
离线过程是耳机预先将后台服务器储存的特征信息下载至本地,并基于此,在本地进行上述确定环境声音数据是否与特征信息相匹配的过程。
接下来提出本申请实施例,对步骤s120中播放所述耳机佩戴对象感兴趣的内容的过程进行介绍,该过程可以包括:
d1、识别所述环境声音数据中所述耳机佩戴对象感兴趣的内容对应的目标声纹。
具体地,耳机佩戴对象感兴趣的内容对应的目标声纹可以包括一个或多个,依次识别目标声纹,并对不同的目标声纹做标记。比如在多人交谈的场景,a和b同时对耳机佩戴对象说话,环境声音数据中的耳机佩戴对象感兴趣的内容分别来自a和b,则通过声纹识别技术分别识别a和b的声纹,依次确定目标声纹为目标声纹1和目标声纹2。
特殊地,当感兴趣信息为兴趣声纹时,若确定环境声音数据中存在兴趣声纹对应的声音数据,直接将兴趣声纹作为耳机佩戴对象感兴趣的内容对应的目标声纹。
d2、进入与所述目标声纹对应对象的对话模式。
具体地,目标声纹对应的声音数据包含耳机佩戴对象感兴趣的内容,故对话模式是将环境声音数据中每个目标声纹对应的声音数据播放。
在上述基础上,进入与目标声纹对应对象的对话模式后,耳机佩戴对象可以听到目标声纹对应对象的声音,可以理解的是,随着时间推移,环境声音数据中可能不再包含目标声纹对应的声音数据,比如在对话场景下,耳机佩戴对象与对象a交谈结束后,对象a离开,此时环境声音数据中不包含对象a对应的声音数据,所以步骤s120中播放所述耳机佩戴对象感兴趣的内容的过程,还可以包括:
首先,记录获取每个目标声纹对应的声音数据的起始时间。进一步,针对每一目标声纹,检测自起始时间后的设定时间长度内,是否获取到该目标声纹对应的声音数据,若确定设定时间长度内没有获取到目标声纹对应的声音数据,则退出与该目标声纹对应对象的对话模式,但是不影响其他目标声纹的对话模式。
例如,环境声音数据中的耳机佩戴对象感兴趣的内容来自对象a,则通过声纹识别技术识别a的声纹为目标声纹,获取该目标声纹对应的声音数据的起始时间是10:00,假设设定时间长度为5分钟,则自起始时间10:00开始,5分钟内没有获取到目标声纹对应的声音数据,则退出与目标声纹对应对象a的对话模式。
下面对本申请实施例提供的耳机降噪装置进行描述,下文描述的耳机降噪装置与上文描述的耳机降噪方法可相互对应参照。
参见图2,图2为本申请实施例公开的一种耳机降噪装置结构示意图。
如图2所示,该装置可以包括:
环境声音数据获取单元11,用于获取环境声音数据;
感兴趣内容判断单元12,用于确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容;
噪声消除单元13,用于在确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容时,将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉;
感兴趣内容播放单元14,用于在确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容时,播放所述耳机佩戴对象感兴趣的内容。
可选的,本申请实施例对所述感兴趣内容判断单元12可以包括的多种结构中的第一种进行介绍:
所述感兴趣内容判断单元可以包括:
第一感兴趣内容判断子单元,用于根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据。
可选的,当所述感兴趣信息为兴趣词,所述第一感兴趣内容判断子单元可以包括:
识别文本获取单元,用于将所述环境声音数据转换成识别文本;
兴趣词查找单元,用于在所述识别文本中查找是否存在预先配置的与所述耳机佩戴对象对应的兴趣词,若存在,则确定所述环境声音数据中包含与所述感兴趣信息对应的声音数据,若不存在,则确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据。
可选的,当所述感兴趣信息为兴趣声纹时,所述第一感兴趣内容判断子单元可以包括:
兴趣声纹确定单元,确定所述环境声音数据中,是否存在所述兴趣声纹对应的声音数据;若存在,则确定所述环境声音数据中包含与所述感兴趣信息对应的声音数据,若不存在,则确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据。
可选的,本申请实施例对所述感兴趣内容判断单元可以包括的多种结构中的第二种进行介绍:
所述感兴趣内容判断单元可以包括:
第二感兴趣内容判断子单元,用于获取所述耳机佩戴对象的特征信息,所述特征信息与所述耳机佩戴对象感兴趣内容相关;
第三感兴趣内容判断子单元,确定所述环境声音数据是否与所述特征信息相匹配,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,若否,则确定所述环境声音数据中不包含耳机佩戴对象感兴趣的内容。
可选的,上述介绍了感兴趣内容判断单元的两种不同结构,本实施例中还可以将所述两种结构相结合,提出感兴趣内容判断单元的第三种可选结构,如下:
感兴趣内容判断单元可以包括:
第一感兴趣内容判断子单元,用于根据预先配置的与所述耳机佩戴对象对应的感兴趣信息,确定所述环境声音数据中是否包含与所述感兴趣信息对应的声音数据,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容;
第二感兴趣内容判断子单元,用于在所述第一感兴趣内容判断子单元确定所述环境声音数据中不包含与所述感兴趣信息对应的声音数据时,获取所述耳机佩戴对象的特征信息,所述特征信息与所述耳机佩戴对象感兴趣内容相关;
第三感兴趣内容判断子单元,用于确定所述环境声音数据是否与所述特征信息相匹配,若是,则确定所述环境声音数据中包含耳机佩戴对象感兴趣的内容,若否,则确定所述环境声音数据中不包含耳机佩戴对象感兴趣的内容。
可选的,本申请实施例对上述第三感兴趣内容判断子单元可以包括的多种结构进行介绍:
第一种、
第二感兴趣内容判断子单元可以包括:
第一特征信息获取单元,用于获取预先设置的所述耳机佩戴对象的个人信息,作为特征信息。
基于此,所述第三感兴趣内容判断子单元可以包括:
标签获取单元,用于获取与所述个人信息对应的标签;
标签查找单元,用于确定所述环境声音数据对应的识别文本中是否包含所述标签,若是则确定匹配,若否,则确定不匹配。
第二种、
第二感兴趣内容判断子单元可以包括:
第二特征信息获取单元,用于获取所述耳机佩戴对象历史讲话内容中包含的关键时间点和事件信息,作为特征信息。
基于此,所述第三感兴趣内容判断子单元可以包括:
识别文本参考单元,用于确定所述环境声音数据对应的识别文本中是否包含所述关键时间点和/或所述事件信息,若是则确定匹配,若否,则确定不匹配。
第三种、
第二感兴趣内容判断子单元可以包括:
第三特征信息获取单元,用于获取依据所述耳机佩戴对象历史讲话内容所确定的兴趣内容与兴趣度的对应关系,作为特征信息。
基于此,所述第三感兴趣内容判断子单元可以包括:
兴趣内容判断单元,用于确定所述环境声音数据对应的识别文本中是否包含目标兴趣内容;
目标兴趣度查询单元,用于若所述兴趣内容判断单元判断结果为是,则依据所述兴趣内容与兴趣度的对应关系,查询所述目标兴趣内容对应的目标兴趣度;
兴趣度比较单元,用于根据所述目标兴趣度与预设兴趣度阈值的大小关系,确定所述环境声音数据与所述特征信息的匹配情况。
可选的,本申请实施例对上述感兴趣内容播放单元进行介绍,其可以包括:
目标声纹识别单元,用于识别所述环境声音数据中所述耳机佩戴对象感兴趣的内容对应的目标声纹;
对话模式进入单元,用于进入与所述目标声纹对应对象的对话模式,所述对话模式包括:将所述环境声音数据中所述目标声纹对应的声音数据播放。
可选的,上述感兴趣内容播放单元,还可以包括:
起始时间记录单元,用于记录开始获取所述目标声纹对应的声音数据的起始时间;
设定时间检测单元,用于检测自所述起始时间后的设定时间长度内,是否获取到所述目标声纹对应的声音数据;
对话模式退出单元,用于在所述目标声纹检测单元检测结果为否时,退出与所述目标声纹对应对象的对话模式。
本申请实施例提供的耳机降噪装置可应用于耳机降噪设备,如pc终端、云平台、服务器及服务器集群等。可选的,图3示出了耳机降噪设备的硬件结构框图,参照图3,耳机降噪设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本申请实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理器1可能是一个中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器3可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取环境声音数据;
确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容;
若是,则将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉,且播放所述耳机佩戴对象感兴趣的内容。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取环境声音数据;
确定所述环境声音数据中是否包含耳机佩戴对象感兴趣的内容;
若是,则将所述环境声音数据中除所述耳机佩戴对象感兴趣的内容之外的内容消除掉,且播放所述耳机佩戴对象感兴趣的内容。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。