语音的听觉增强的制作方法

文档序号:38799921发布日期:2024-07-26 20:16阅读:103来源:国知局

本发明主要涉及音频处理技术,并且更具体地,涉及用于利用音频内容动态地增强话音内容的技术。


背景技术:

1、在当今的媒体驱动型社会中,用户访问视频和音频的方式越来越多,其中大量的设备在家庭、汽车或几乎任何其他环境中产生声音。产生音频的便携式设备(诸如电话、平板计算机、膝上型计算机、耳机、便携式扬声器、音箱和许多其他设备)无处不在。由这些设备产生的声音可以包括各种各样的音频,诸如音乐、语音、播客、声音效果以及与视频内容相关联的音频。

2、另外,现今许多设备采用语音识别技术以允许用户使用其话音与设备交互。例如,语音识别技术通常涉及将话音内容转换为文本内容。使用语音与设备交互的能力比使用鼠标、键盘、触摸屏和其他输入设备更容易且更直观。


技术实现思路

1、本文描述的一个实施例是一种计算机实现的方法。所述计算机实现的方法包括:经由至少一个麦克风获得环境内的话音内容,以及确定与所述话音内容相对应的文本内容。所述计算机实现的方法还包括:在检测到所述文本内容内的至少一个关键字时,至少部分地基于所述至少一个关键字确定第一音频内容。所述计算机实现的方法还包括:基于利用机器学习算法评估所述文本内容中的一组单词,预测与所述文本内容相关联的至少一种情绪。所述计算机实现的方法还包括:至少部分地基于利用程序性音频引擎评估所述至少一种情绪,确定第二音频内容。所述计算机实现的方法还包括:基于所述话音内容的一个或多个声学参数,确定针对所述第一音频内容或所述第二音频内容中的至少一者的一个或多个输出参数。所述计算机实现的方法还包括:当在所述环境中输出所述话音内容时,根据所述一个或多个输出参数,控制所述环境内的一个或多个换能器以输出所述第一音频内容或所述第二音频内容中的至少一者。

2、本文描述的另一个实施例是一种计算机实现的方法。所述计算机实现的方法包括:经由通信地耦接到扬声器设备的至少一个麦克风获得环境内的话音内容。所述计算机实现的方法还包括:确定与所述话音内容相对应的文本内容,以及至少部分地基于所述文本内容确定至少一个音频内容。所述计算机实现的方法还包括:利用所述至少一个音频内容动态地增强所述环境内的所述话音内容,包括当在所述环境中输出所述话音内容时,经由所述扬声器设备的换能器,在所述环境中输出所述至少一个音频内容。

3、本文描述的另一个实施例是一种系统。所述系统包括至少一个麦克风以及通信地耦接到所述至少一个麦克风的扬声器。所述扬声器包括处理器和存储器。所述存储器存储指令,所述指令当在所述处理器上执行时执行操作。所述操作包括:经由所述至少一个麦克风获得环境内的话音内容。所述操作还包括:确定与所述话音内容相对应的文本内容,以及至少部分地基于所述文本内容确定至少一个音频内容。所述操作还包括:利用所述至少一个音频内容动态地增强所述环境内的所述话音内容,包括当在所述环境中输出所述话音内容时,经由所述扬声器的换能器,在所述环境中输出所述至少一个音频内容。

4、其他实施例提供了:一种可操作设备,被配置为或以其他方式适配于执行上述方法和/或本文别处描述的方法中的任意一种或多种;一种包括指令的非暂时性计算机可读介质,当所述设备的处理器执行所述指令时,使所述设备执行上述方法以及本文别处描述的方法;一种在计算机可读存储介质上具体实施的计算机程序产品,包括用于执行上述方法以及本文别处描述的方法的代码;和/或一种设备,包括用于执行前述方法以及本文别处描述的方法的装置。举例而言,设备可以包括处理系统、具有处理系统的设备、或者在一个或多个经由网络协作的处理系统。

5、以下描述和附图出于说明性的目的阐述了某些特征。



技术特征:

1.一种计算机实现的方法,包括:

2.根据权利要求1所述的计算机实现的方法,其中,确定所述第一音频内容包括从多个音频片段中选择与所述至少一个关键字相关联的音频片段作为所述第一音频内容。

3.根据权利要求1所述的计算机实现的方法,其中确定所述第二音频内容包括经由所述程序性音频引擎,从多个音频片段中选择与所述至少一种情绪相关联的一个或多个音频片段。

4.根据权利要求1所述的计算机实现的方法,其中确定所述第二音频内容包括:

5.一种计算机实现的方法,包括:

6.根据权利要求5所述的计算机实现的方法,其中所述话音内容与当前在所述环境中说话的用户相关联。

7.根据权利要求5所述的计算机实现的方法,其中所述话音内容包括预先记录的用户的话音内容。

8.根据权利要求5所述的计算机实现的方法,其中确定所述至少一个音频内容包括:

9.根据权利要求8所述的计算机实现的方法,进一步包括:

10.根据权利要求5所述的计算机实现的方法,进一步包括:

11.根据权利要求10所述的计算机实现的方法,其中,确定所述至少一个音频内容包括:

12.根据权利要求10所述的计算机实现的方法,其中,确定所述至少一个音频内容包括:

13.根据权利要求5所述的计算机实现的方法,进一步包括至少部分地基于所述话音内容的声学参数确定针对所述扬声器设备的所述换能器的至少一个输出参数,其中经由所述扬声器设备的所述换能器,根据所述至少一个输出参数输出所述至少一个音频内容。

14.根据权利要求13所述的计算机实现的方法,其中所述至少一个输出参数是输出级别。

15.一种系统,包括:


技术总结
描述了用于利用音频内容动态地增强话音内容的系统和技术。示例技术包括经由通信地耦接到扬声器设备的至少一个麦克风获得环境内的话音内容。确定与话音内容相对应的文本内容。至少部分地基于文本内容确定至少一个音频内容。利用至少一个音频内容动态地增强环境内的话音内容。增强话音内容包括:当在环境中输出话音内容时,经由扬声器设备的换能器,在环境中输出至少一个音频内容。

技术研发人员:奥利弗·舍雷格尔,卡罗琳·玛丽安娜·罗辛,西恩·Q·特兰
受保护的技术使用者:班安欧股份公司
技术研发日:
技术公布日:2024/7/25
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!