用于环境噪声检测、识别及管理的系统和方法与流程

文档序号:31003502发布日期:2022-08-03 06:14阅读:308来源:国知局
用于环境噪声检测、识别及管理的系统和方法与流程

1.本发明总体上涉及用于对环境令人厌恶的声音(ambient aversive sound)进行检测、识别/分类、以及管理的系统和方法,尤其是用于环境令人厌恶的声音减弱和抑制的智能系统和方法。


背景技术:

2.有几种令人厌恶的声音,例如被称为对耳朵有害的工业噪声和建筑噪声(noise),当这些噪声太大声时,可能是有害的,即使持续很短时间也是如此。每天,世界上都有很多人遭受到这些噪声。在谈话期间嘈杂的环境可能会令人烦躁,使人们难以集中注意力在另一个人的讲话上,并且可能错过讲话中的重要信息。此外,有些人对日常噪声的忍耐力降低(听觉过敏),并对非常特定的噪声产生负面反应。声音敏感性影响公众,并且在自闭症谱系障碍(asd)的人群中非常常见。对声音的负面反应可能会使人极度衰弱、干扰社交互动以及日常活动的参与。因此,处理这个议题对每个人来说都是重要的问题,尤其是对于对一般声音和/或特定声音敏感的人。
3.存在通过使用信号处理方法和/或机械装置来解决这个问题的已知系统和设备。一些这样的已知系统通过如下方式来专注于耳朵保护:如美国专利申请2014/0010378a1中所教导的,通过控制声音的音量和对语音进行去噪,或者如美国专利申请20200312294中所公开的,通过经由播放音乐或其他特定声音来掩蔽噪声。诸如美国专利申请us9524731b2和us9648436b2等多篇文献正在通过如下方式解决这个议题:通过从用户的数字化环境声音中提取特定特征并且提供适当的信息来帮助听众的听力或保护他们免受危险声音的影响。
4.在一些已知的设备中,实施主动噪声消除技术以解决这个问题,使得来自耳戴设备的传入声音被检测并且具有令人厌恶的信号的异相信号被生成以消除令人厌恶的声音。这些主动噪声消除技术对50hz至1khz之间的较低频率和持续声音最有效。
5.现有系统和设备的主要缺点是它们被设计成减弱或去除所有环境噪声,而不管声音的性质如何。例如,人们可能希望注意孩子玩耍的声音而抑制令人厌恶的街道噪声。另一限制是减弱或消除环境噪声的设备可能会限制社交交流,因为用户听不到语音。能够在嘈杂环境中对语音进行去噪的已知设备被设计成工人佩戴相同设备并通过电信传输链路进行通信的工业设置(例如,us20160126914a1)。
6.还存在使用位于设备的不同空间位置的多麦克风技术来抑制令人厌恶的声音的已知系统和设备(如epo专利申请ep3096318a1中所教导的)。然而,这些系统并不实用,因为在大多数情况下,这些多麦克风技术无法成功抑制目标噪声,尤其是当麦克风从周围环境中捕获相同的信号时,或者在用户进行活动时它们会移动和摇晃。此外,基于耳塞(earbud)和耳筒(headphone)的声学设计,多通道麦克风和智能算法的实现方式相当困难和昂贵。另一方面,较新的方法使用单通道音频来识别和抑制噪声(如epo专利申请ep3175456b1中所公开的)。基于单通道音频识别和噪声抑制的实际应用中的系统和方法是有效实用的,但是这样的系统具有质量和准确性的限制。
7.因此,需要一种能够感知噪声内容以对特定用户定义的环境噪声进行过滤的系统和方法,而不是同等对待所有环境噪声的系统。


技术实现要素:

8.在一个方面,提供了一种用于环境令人厌恶的声音检测、识别和管理的系统。该系统包括:耳机设备,该耳机设备具有麦克风和扬声器,该麦克风被配置为捕获用户周围的环境声音作为环境声音的小片段的样本;界面,该界面具有硬件处理器,该硬件处理器被编程有用于获得输入数据、传输数据、以及提供输出数据的可执行指令;存储器单元,该存储器单元存储输入信息、令人厌恶的环境声音信号的库、令人厌恶的声音特征图、识别预测模型、令人厌恶的声音识别类别、以及令人厌恶的声音抑制预测模型;以及处理单元,该处理单元与耳机设备、存储器单元和界面进行通信。处理单元包括:识别单元,该识别单元耦合到耳机设备和存储器单元;以及过滤处理单元,该过滤处理单元耦合到识别单元和存储器单元。识别单元被编程有可执行指令以通过提取环境声音片段中的声音的至少一个特征来识别声音片段中的令人厌恶的环境声音信号并且创建这种声音片段的特征图。使用被存储在存储器单元中的识别预测模型来处理声音片段的特征图,以将特征图中的至少一个特征与被存储在存储器单元中的令人厌恶的声音信号的特征图进行比较,并且当识别出令人厌恶的环境声音时,识别单元用识别类别对令人厌恶的声音信号进行分类。过滤处理单元被编程有可执行指令以接收环境声音片段与令人厌恶的声音信号的混合信号,并且处理混合信号,计算混合信号的幅度和相位以生成混合信号的特征图,使用至少一个令人厌恶的声音抑制模型将特征图与所存储的特征图进行比较,以及提供推荐动作来管理此类令人厌恶的声音信号。耳机设备还包括用于调节传输给用户的环境声音片段的阀。
9.在一个方面,推荐的动作是去除令人厌恶的声音,并且过滤处理单元还被编程有可执行指令,以使用所生成的特征图从混合信号中自动去除所识别的令人厌恶的信号,以获得混合信号中的从频域到时域进行重构的干净声音,并且将混合信号的相位与最后片段的干净声音的幅度进行结合,以创建用于传输到扬声器的干净声音信号。
10.在另一方面,推荐的动作是减弱令人厌恶的声音,并且过滤处理单元还包括具有增益的旁路,以创建减弱的令人厌恶的声音。过滤处理单元被编程有可执行指令,以将减弱的令人厌恶的声音信号自动添加到干净声音信号。
11.在又一方面,过滤处理单元被编程有可执行指令,以自动将预先记录的声音添加到混合信号之上以掩蔽令人厌恶的环境声音信号。
12.在一个方面,该系统包括第一激活设备和第二激活设备,该第一激活设备与耳机设备进行通信,以手动触发阀来抑制或减弱令人厌恶的环境声音信号,第二激活设备与耳机设备和存储器单元进行通信以手动访问所存储的预先记录的声音并在混合信号之上播放它们来掩蔽令人厌恶的环境声音信号。
13.在一个方面,该系统包括告警系统,该告警系统与界面和/或耳机设备进行通信,以生成告警信号来向用户告警推荐动作,该告警信号选自视觉信号、触觉信号、声音信号、或它们的任意组合中的一种。
14.在另一方面,该系统包括与处理单元进行通信的至少一个生理传感器,该至少一个生理传感器被配置为检测用户的至少一个生理参数。如果检测到的参数在检测到的生理
参数中的至少一个生理参数的预定范围之外,则处理单元识别环境声音片段中的令人厌恶的环境声音信号。
15.在一个方面,提供了一种用于环境令人厌恶的声音检测、识别和管理的方法。该方法包括:使用耳机设备中的麦克风捕获环境声音片段流;将输入信息、令人厌恶的环境声音信号库、令人厌恶的声音特征图、识别预测模型、令人厌恶的声音识别类别、以及令人厌恶的声音抑制预测模型存储在存储器单元上;由处理单元处理所捕获的声音片段。处理步骤包括:提取声音片段中的声音信号的至少一个特征,创建声音片段的特征图,将特征图中的至少一个特征与被存储在存储器单元中的识别预测模型中的令人厌恶的声音信号的特征图进行比较,使用识别预测模型识别所捕获的声音片段中的令人厌恶的声音信号,以及用识别类别对所识别的令人厌恶的声音信号进行分类;以及对包括环境声音片段和令人厌恶的环境声音信号的混合信号进行过滤处理,计算混合信号的幅度和相位以生成混合信号的特征图,使用至少一个令人厌恶的声音抑制模型将特征图与所存储的特征进行比较,以及提供推荐动作来管理令人厌恶的声音信号。
16.除了上述方面和实施方式之外,通过参考附图和研究以下详细描述,其他方面和实施方式将变得显而易见。
附图说明
17.图1示出了用于对环境令人厌恶的声音进行检测、识别和管理的系统的示例性示意图。
18.图2示出了根据本发明的一个实施方式的用于对环境令人厌恶的声音进行检测、识别/分类、以及管理的方法的示例的简化框图。
19.图3示出了根据本发明的一个实施方式的识别/分类方法的示例的简化框图。
20.图4示出了根据本发明的一个实施方式的实时令人厌恶的声音过滤和处理方法的示例的简化框图。
21.图5示出了根据用于对环境令人厌恶的声音进行检测、识别和管理的系统的一个实施方式的图形用户界面的示例。
具体实施方式
22.本发明的实施方式提供了用于环境令人厌恶的声音检测和识别/分类的设备细节、特征、系统和方法,以及用于环境令人厌恶的声音隔离和抑制的系统和方法。
23.图1示出了用于对环境令人厌恶的声音进行检测、识别/分类、以及管理的系统100的示意性示例。系统100包括具有麦克风104的耳机(earpiece)设备101,诸如一组耳塞或耳罩。在一些实施方式中,系统100还可以配备有扬声器105和/或阀102。阀102可以抑制或隔离环境声音。阀102可以打开或关闭,使得当阀处于“打开模式”时,环境声音可以由于耳塞或耳罩中的材料的被动噪声隔离而略微减弱地穿过系统100,而当阀102处于“关闭模式”时,环境声音可以被减弱或隔离。在一个实施方式中,阀102可以使用螺线管、音圈等被电子地激活/去激活。例如,激活按钮103可以被用于操作阀102。按钮103可以被放置在耳机设备101上的某处或被定位在可穿戴设备或手持设备108、110上,并且电子触发信号可以通过有线或无线方式传送到激活设备103。激活设备103可以是任何已知的机械或电子激活机构。
在另一个实施方式中,该设备不包含阀,并且设备101可以包括标准的入耳式塞(bud)或耳挂式耳筒,标准的入耳式塞或耳挂式耳筒各自配备有麦克风和扬声器,并且系统100可以执行如下所述的分类和声音管理操作。
24.系统100还包括处理单元107。处理单元107可以被定位在耳机设备101中,或者可以位于耳机设备101的外部。例如,处理单元107可以在智能穿戴设备110、或手持设备108(例如,移动电话、平板电脑、膝上型电脑)、或任何其他合适的智能设备中。在一种实现方式中,处理单元107可以在使用互联网通信与耳机设备101进行通信的硬件服务器或虚拟服务器(云服务器)中。在一个实施方式中,处理单元107的一部分可以在耳机设备101中,而另一部分在智能可穿戴/设备、或任何其他计算机、或服务器中。处理单元107可以包括诸如非暂态存储器等的存储器单元,用于存储数据、标识符或分类器模型和指令(图3)、以及过滤处理模型和指令(图4)。系统100还可以包括图5中详细示出的用户界面500。用户可以通过界面500向系统100提供输入数据。存储器单元存储输入数据、捕获的环境声音数据、已知的环境声音的库、声音特征图、以及由分类器300和过滤处理器400使用的预测模型。
25.图2图示了由系统100执行以对令人厌恶的环境声音进行检测、分类和管理的总体步骤200。耳机设备101的麦克风104捕获周围声音201并且可以将这些声音播放给扬声器105。当设备在“正常”模式下操作时(阀102处于“打开模式”,或扬声器播放由麦克风捕获的未失真的环境声音),用户可以听到环境声音。当检测到令人厌恶的环境声音时,系统100被激活,并且系统100可以做出推荐动作,诸如(1)通过激活阀102来抑制检测到的包括令人厌恶的环境声音的声音,使得设备在“关闭模式”下操作,并且阀/塞阻止环境令人厌恶的声音进入耳道,独立于其他操作;(2)通过停止将周围声音从麦克风传送到扬声器105来抑制信号;(3)通过降低音量来使环境声音减弱,使得耳机的听筒(earphone)以降低的音量播放声音(用户选择音量或存在预定义的较低音量);(4)使用如下所述的系统100去除周围声音的令人厌恶的部分,或(5)通过向扬声器105播放预先记录的声音作为额外的掩蔽特征(例如,播放音乐、白噪声或用户喜欢的任何声音)来掩蔽环境声音。通过在关闭模式期间播放音乐、白噪声或其他喜欢的声音,系统100可以最大程度地掩蔽环境声音,超出被动隔离(选项1和2)能够提供的范围。当不再检测到令人厌恶的声音时,系统的操作将返回“正常”模式。麦克风104可以被安装在耳机设备101的外部并且可以捕获环境声音。麦克风104被配置为捕获被认为是帧选择202的声音流的小片段的样本。帧大小被选择为使得人类听觉系统不能理解每个声音片段/帧的处理、决策、以及令人厌恶的声音抑制的相关延迟。人类耳朵可以容忍20至40ms之间的延时(latency),并且系统100被配置为具有在该范围内的延时以实时流畅地工作。例如,可以使用24ms的帧大小,并且麦克风104可以以8khz的采样率每次捕获24ms的声音帧。在该设置中,信号201的片段包括192个数据样本。
26.环境声音片段作为输入进入处理单元107,在处理单元中对该环境声音片段进行处理以识别信号片段是否包括令人厌恶的声音。如前所述,处理可以在耳机设备101中完成,或者在使用互联网通信与耳机设备101进行通信的智能可穿戴设备110、或手持设备108(例如,移动电话、平板电脑、膝上型电脑)、或任何其他合适的硬件服务器或虚拟服务器(云服务器)中远程地完成。处理单元107包括具有预测模型的标识符/分类器203,该预测模型被训练或将被训练以检测和识别可以由用户预定义的令人厌恶的声音或者可以是用户之前未听到的令人厌恶的声音。分类器203可以使用分类预测模型和令人厌恶的声音库来确
定环境声音片段是否包括令人厌恶的环境声音。如果分类器203在声音片段中没有识别出任何令人厌恶的声音,则这种信号被传送到扬声器105并且用户可以听到它。如果分类器203识别出环境音频片段包括令人厌恶的声音204,则环境音频片段与令人厌恶的声音的混合信号由过滤处理器205处理,其中使用令人厌恶的声音抑制预测模型来确定混合信号的特定特征以用于令人厌恶的声音抑制目的。在系统100的一种实现方式中,处理单元107可以使用过滤处理器205的结果来自动地从混合信号中去除或抑制令人厌恶的声音信号,从而产生干净声音206作为输出。然后可以在扬声器105中播放干净声音206,扬声器被定位在耳机设备101(例如耳筒或听筒)中。
27.在一种实现方式中,处理单元107可以向用户提供推荐动作。例如,处理单元107可以使用界面500发送带有推荐动作的告警。推荐动作可以是,例如,(1)通过关闭阀102来抑制声音信号,或(2)通过停止信号从麦克风到扬声器的传送来抑制信号,或(3)通过降低音量来使环境声音减弱,或(4)从混合信号中去除令人厌恶的声音信号,或(5)通过播放预先记录的声音来掩蔽环境声音。然后,用户可以使用界面500、或激活设备103、或在一些实现方式中的塞来决定并手动地执行推荐的动作。在另一实现方式中,系统可以自动触发阀或激活设备以对信号进行抑制或减弱,或激活存储预先记录的掩蔽声音的播放器,或向处理单元107提供指令以从信号中去除令人厌恶的声音。
28.掩蔽声音可以被预先记录并存储在存储器单元中,或者可以提供存储预先记录的声音的单独播放器与可以由用户手动触发或由系统100自动触发的耳机设备101进行通信。在一个实施方式中,掩蔽声音可以被存储在应用程序诸如例如spotify
tm
中,并且由用户手动访问或由系统100自动访问。在系统100自动抑制、减弱、去除或掩蔽令人厌恶的环境声音的实施方式中,用户可以具有通过使用例如界面500手动去激活和激活系统100来否决系统的推荐动作的能力。系统100可以连续监测周围的声音并对新的声音片段进行采样以及处理此类片段以识别令人厌恶的环境声音并相应地抑制、减弱、去除或掩蔽令人厌恶的声音,如上文所述。
29.图形用户界面500(图5)可以与智能可穿戴设备或手持设备108、110上运行的每个操作系统兼容。界面500具有硬件处理器,硬件处理器被编程有用于获取输入数据、传输数据、以及提供输出数据的可执行指令。例如,图形用户界面500可以负责所有通信、设置、定制、以及用户定义的操作。包括人工智能预测模型、模型训练、数据采样、数据处理的计算程序由处理器107执行,该处理器可以在耳机设备101或设备108、110中的任何设备中、或在通过互联网网络连接到系统的服务器上、或它们的任意组合。系统100还可以包括为耳机设备101提供所需电力的可充电电池106。可以使用赠送的充电器单元对电池进行充电。
30.在一种实现方式中,系统100还可以包括一组生理传感器以捕获身体反应,例如皮肤电导、心率、脑电图(eeg)、心电图(ecg)、肌电图(emg)、或其他信号。这些传感器可以被嵌入在可穿戴设备110或任何其他智能设备108上、或附接到用户的衣物或身体上。所提供的传感器数据将使用无线或有线连接109被传送到系统100以确定身体反应。例如,心率监测器可以被用于检测用户的心率,并且处理单元107可以处理这样的信号以确定用户的压力状态,诸如例如,增大的心率可以是用户的压力水平增大的信号,或者皮肤电导监测器可以检测到增大的用户生理唤醒的水平。这样的身体反应可能是令人厌恶的环境声音的结果,因此系统100可以自动推荐正确的动作被相应地执行,如本文所述。
31.在一些实施方式中,系统100被编程并且包括可以区分并抑制一些令人厌恶的声音的算法/模型。这些模型可以基于机器学习、深度学习或其他声音检测/识别和抑制的技术。
32.图3示出了标识符/分类器203和由分类器203执行的方法300的示例。分类器接收从麦克风104获得的分段的环境声音信号301作为输入。然后在步骤302中对信号301进行预处理,以通过使用信号的快速傅里叶变换(fft)来展平或创建频域中的信号表示。例如,预处理步骤还可以包括信号处理操作(例如,归一化、转换采样率、加窗、fft、展平)以向分类器预测模型(例如,深度神经网络、支持向量机(svm)、线性回归、感知器等)提供输入,用于令人厌恶的声音检测/识别。然后在步骤303中使用例如梅尔频率倒谱系数(mfcc)、短时能量(ste)等来计算/提取预定特征。例如,提取信号301的强度和功率(即,幅度和频率),并创建特征图303并将其输入到分类器预测模型304中。分类预测模型是预训练模型,在一个示例中,该预训练模型是用于对程序进行学习的人工神经网络,所述人工神经网络包括多个隐藏层(例如,密集层、gru层等)。分类预测模型在令人厌恶的声音类别的综合集上进行训练,并且因此每个令人厌恶的声音类别都具有对应的类别编号。特征图303被馈送到模型304并且输出305是基于信号301与库中声音模式之间的相似性的类别编号。所识别的类别可以是识别特定的令人厌恶的声音的编号。例如,类别编号2可以是空调声音,而类别编号7可以是例如汽笛等。在一种实现方式中,识别类别305可以是非书面(verbal)文本。
33.在一个实施方式中,如果识别器/分类器识别环境声音中的令人厌恶的声音,则使用图形界面通知用户,并且他/她可以选择使用系统100来自动关闭阀,抑制、减弱或去除令人厌恶的声音并将其余的环境声音播放到听筒中,或者播放音乐、白噪声或任何喜欢的声音,或者甚至是音乐和被抑制的环境声音的组合。用户可以定制设备以执行任何上述操作,并且这些操作也可以在基于用户对声音厌恶的决定来识别令人厌恶的声音时改变。然后将包括用所识别的类别305识别的环境令人厌恶的声音的混合信号输入到过滤处理器204中。
34.图4示出了过滤处理器204和由过滤处理器204执行的方法400的示例。在一个实施方式中,当分类器识别出周围声音环境中的令人厌恶的声音时,过滤处理器被激活。因此,输入301是环境声音的混合信号,其中包括令人厌恶的声音。过滤处理器204将混合信号的片段作为输入帧并且计算信号的幅度和相位。然后如步骤401所示对幅度进行预处理以构建特征图402,该特征图随后被用作令人厌恶的声音抑制预测模型的输入。对于一个示例,预处理包括获取信号的fft、频谱分析以及数学运算,以在频域中创建混合信号的表示作为特征图。过滤过程中的预处理步骤可能因目的不同而与识别过程不同。在一个实施方式中,过滤处理器204可以获取混合信号的几个重叠的分块帧并执行预处理以计算混合信号中的功率和频率并构建特征图。例如,预处理可以包括信号处理操作以给令人厌恶的声音抑制模型403(例如,深度神经网络、svm、线性回归、感知器)提供输入,以用于令人厌恶的声音抑制。令人厌恶的声音抑制模型403可以被训练以获取展平的(预处理的)特征图并且去除所识别的输入混合信号301的令人厌恶的成分。这产生输入混合信号中的干净声音。干净声音在频域中,因此需要通过使用例如逆快速傅里叶变换(ifft)404被重构为时域中的干净声音,并且将从原始混合信号301中提取的混合信号的相位405与干净声音的幅度进行结合以创建干净信号。在一个实施方式中,包括提供动力(powering)和展平的后处理工具406可以被应用于干净信号以形成顺畅的干净信号。例如,在一个实施方式中,后处理工具406可以
使用可以被实时执行的重叠添加方法来生成干净声音的时域。如前所述,捕获的环境信号的帧大小被选择为使得人类感知能力不能理解针对每个声音帧的处理、决策和令人厌恶的声音抑制的相关延迟。人类耳朵可以容忍20至40ms之间的延时,并且系统100可以具有该范围内的延时以实时流畅地工作。例如,麦克风104以8khz的采样率每次捕获24ms的帧,使得信号的片段包括192个数据样本。考虑到重叠添加方法的50%重叠,后处理工具406添加12ms重叠的干净信号,该干净信号被播放到扬声器105。重叠技术提供了顺畅连续组帧的优点,并将信息保持在帧的边缘处,以生成干净、顺畅和连续的声音,而不会损失声音质量。因此,后处理406的输出可以是估计的干净信号407。
35.可以关于令人厌恶的声音的固有结构和模式以三个基本种类(图3中识别的类别305)来考虑令人厌恶的声音。这些种类包括如空调、发动机等静态噪声;如火车、风等非静态噪声;以及如狗叫声、汽笛和婴儿哭声等高动态噪声。在一个实施方式中,根据所识别的令人厌恶的声音种类,系统和方法可以对混合信号410执行不同的预处理和后处理。例如,像自适应过滤器等数字信号处理过滤辅助被应用于非静态类别噪声。对于一个实施方式,过滤处理器204可以包括多个不同的令人厌恶的声音抑制模型,以基于所识别的令人厌恶的声音的种类/类别在它们之间进行选择,以便生成干净声音。用于令人厌恶的声音抑制的模型在致使准确、高性能的综合数据集上进行训练,并使用可靠的深度神经网络模型或其他机器学习模型进行训练。
36.在一个实施方式中,过滤处理器204包括令人厌恶的信号旁路408,该信号旁路被配置为减弱令人厌恶的声音并且将减弱的令人厌恶的声音添加到干净声音。例如,用户可以使用界面500中的设置506来选择令人厌恶的声音的减弱水平。在一些实现方式中,用户可以使用界面500中的滑块505来手动减弱令人厌恶的声音水平。具有增益的旁路408被考虑并乘以为混合信号与估计的干净信号之间的减法的估计的令人厌恶的信号,以创建减弱的令人厌恶的信号。之后,将该信号添加到干净信号,使得用户可以通过扬声器105听到具有干净声音的减弱的令人厌恶的声音。在旁路增益408中从零到最大减弱的减弱水平可以在设置中被设置或在用户界面500中使用被设计的旋钮、滑块或按钮来设置。
37.图5图示了系统100的图形用户界面500的示例。图形用户界面500可以被安装在任何智能设备上,包括智能手机、智能手表、任何合适操作系统诸如ios、windows、android等上的个人计算机。被安装的用户界面可以使用有线或无线连接与耳机设备101进行交互。在图5所示的图示示例中,屏幕501可以指示系统操作模式。例如,操作模式可以是“正常模式”,指的是不存在被系统和方法识别的令人厌恶的声音,以及“令人厌恶的模式”,指的是被系统和方法识别的令人厌恶的声音。此外,屏幕501可以用于告警用户由处理单元107推荐的动作,诸如例如抑制、减弱或掩蔽声音。激活滑块502被配置为手动打开和关闭系统100。用户可以使用滑块503来激活记录器或访问音乐存储设备。用户可以基于周围情况或他们的喜好来播放和暂停音乐、白噪声或任何喜欢的声音。此外,用户可以使用滑块504来控制传入听筒的声音的音量。当识别出令人厌恶的声音并且通知用户时,用户可以使用滑块505来选择性地减弱所识别的令人厌恶的声音。设置506被配置用于用户的定制,使得用户可以输入他们的预设喜好,诸如例如,选择并上传喜欢的音乐/声音以存储在存储器单元或单独的记录单元中,选择告警设置(例如,声音告警或任何告警信号,诸如光、或振动、或文本),选择告警声音,指定在识别出令人厌恶的声音时要执行的动作(例如,自动令人厌恶
的声音管理或手动令人厌恶的声音管理),要抑制和/或通知的令人厌恶的声音的清单,激活单次学习过程的按钮。界面500还可以包括退出按钮507以关闭整个程序。对于没有图5中的设置的实施方式,定制的过程可以使用个人计算机、膝上型电脑、智能手机等发生。用户可以通过登录网站或提供给他们的专用界面来完成如前所述的定制过程,并且在完成之后,最终设置可以传送在耳机的存储器、云服务器等中,以用于处理单元的实现。
38.在一个实施方式中,告警系统用于通知用户令人厌恶的声音的存在,而系统100自动抑制、减弱或掩蔽这种令人厌恶的声音。当系统100识别出附近的令人厌恶的声音(例如,用户定义为令人厌恶的声音)时,经由告警系统通过播放一段特定的音乐、白噪声、告警语音、或灯光告警(例如,彩色led)、或文本消息、耳机设备中的哔哔声、振动等、或这些告警的任何组合来通知他/她此类令人厌恶的声音。还可以通知用户令人厌恶的声音的性质和强度以及推荐的动作,诸如例如,抑制、减弱、或掩蔽、或它们的任意组合。用户可以使用界面500或耳机上的否决按钮来否决任何推荐动作。告警系统可以被设置在界面500中,并且可以使用任何智能可穿戴设备、手持设备、或耳机设备与用户进行通信。告警系统可以是用户定制的。该系统还可以通知用户令人厌恶的声音的清除。
39.在一个实施方式中,用户可以添加用户定制的令人厌恶的声音以供系统检测和管理。在这样的实施方式中,系统100可以从令人厌恶的声音的预定义的列表开始,但是当用户听到未预定义的令人厌恶的声音时,他/她可以激活系统100以记录环境声音和情况(获取声音和情况的适当样本),处理声音以识别各个部件(离线或在线),与用户交流调查结果,以及要求用户指定所识别的声音中的哪一种是令人厌恶的,并且最后将令人厌恶的声音添加到用户的令人厌恶的声音列表的定制库。在一个实施方式中,学习部件可以是基于一次性(one-shot)或少量(few-shot)学习方法、或其他基于智能的算法,如机器学习和深度学习等。例如,系统可以记录周围的声音和时间标记事件。然后,用户将被实时或离线通知所记录的声音,并被要求通过记住事件发生时的声音/情况或通过听到样本来令人识别厌恶的声音。如果用户将这种声音识别为令人厌恶的,则它将被添加到令人厌恶的声音库中。
40.在一个实施方式中,生理传感器可以被用于从用户的生理信号(例如,皮肤电导、心率、eeg、ecg、emg或其他信号)中检测令人厌恶的情况。这些信号(独立的或融合的)可以被用于识别令人厌恶的声音/情况的发生,并且前面说明的方法可以被用于识别混合信号中的令人厌恶的声音成分。在检测到这种令人厌恶的声音时,可以将其添加到令人厌恶的声音库中,并且系统可以采取推荐动作来减弱/过滤/掩蔽/阻止这种令人厌恶的声音。如上所述,将通知用户,并且他/她可以手动否决推荐的动作。可以检测到声音的令人厌恶的成分并将其报告给用户进行验证,之后将其添加到库和/或实现推荐的动作。
41.尽管已经示出和描述了本公开的特定元件、实施方式和应用,但是应当理解,本公开的范围不限于此,因为本领域技术人员可以在不脱离本公开范围的情况下进行修改,尤其是鉴于前述教导。因此,例如,在本文公开的任何方法或过程中,构成该方法/过程的动作或操作可以以任何合适的顺序执行并且不必限于任何特定的公开顺序。在各种实施方式中,元件和部件可以被不同地配置或布置、组合和/或消除。上述各种特征和过程可以彼此独立地使用,或者可以以各种方式组合。所有可能的组合和子组合旨在落入本公开的范围内。在整个本公开中对“一些实施方式”、“一个实施方式”等的提及意味着结合实施方式描
述的特定特征、结构、步骤、过程或特性被包括在至少一个实施方式中。因此,贯穿本公开的短语“在一些实施方式中”、“在一个实施方式中”等的出现不一定都指代相同的实施方式并且可以指代相同或不同实施方式中的一个或更多个。
42.已经在适当的地方描述了实施方式的各个方面和优点。应当理解,不一定所有这些方面或优点都可以根据任何特定实施方式来实现。因此,例如,应当认识到,可以以实现或优化如本文所教导的一个优点或一组优点的方式来执行各种实施方式,而不必实现如本文所教导或建议的其他方面或优点。
43.本文使用的条件性语言,诸如“能够”、“可能”、“会”、“可以”、“例如”等,除非另有明确说明,或在所使用的上下文中以其他方式理解,否则通常旨在传达某些实施方式包括某些特征、元件和/或步骤,而其他实施方式不包括某些特征、元件和/或步骤。因此,这样的条件性语言通常不旨在暗示特征、元素和/或步骤以任何方式对于一个或多个实施方式是必需的,或者一个或多个实施方式必须包括用于在具有或没有操作员输入或提示的情况下决定是否这些特征、元素和/或步骤被包括或将在任何特定实施方式中执行。任何特定实施方式都不需要或不可缺少单个特征或特征组。术语“包括”、“包含”、“具有”等是同义词,并且以开放式的方式包容性地使用,并且不排除其他元素、特征、动作、操作等。此外,术语“或”以其包容性(而不是排他性)使用,例如,当用于连接元件的列表时,术语“或”表示在列表中的一个、一些或全部元件。
44.本文描述的实施方式的示例结果和参数旨在举例说明而非限制所公开的实施方式。其他实施方式可以与本文描述的说明性示例不同地配置和/或操作。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1