使用环境音频分析来控制音频播放器的制作方法

文档序号：6772531阅读：162来源：国知局

专利名称：使用环境音频分析来控制音频播放器的制作方法
技术领域：
本公开总体上涉及音频设备的操作。
背景技术：
便携式音乐播放器已经成为当今社会的泛在部分。人们在通勤、工作和运动时随处听音乐成为了日常生活的一部分。将便携式音乐播放器集成到另一种泛在设备(移动电话)中延长了人们在日常的一天中配戴耳机的时间长度。与音频设备的这种联系将人们与周围环境中的其他人隔离开。为了取得配戴耳机的人的注意，其他人可以提高语音来试图足够大声地讲话以在音乐播放时被听到，或者可以用身体姿势来吸引配戴耳机的人的注意。一旦取得他或她的注意，配戴耳机的人在能够开始交谈之前通常必须暂停音乐或者降低音乐音量。

图1是描绘适合的数据处理环境的框图，在该数据处理环境中可以实现本发明的示例性实施例的某些方案。图2是现有技术的音频播放器的图。图3是根据本发明的一个实施例配置的音频环境管理器的图。图4是根据本发明的另一个实施例配置的音频环境管理器的图。
具体实施例方式本发明的实施例包括使用环境音频分析来控制音频播放器的方案。音频环境管理器识别周围环境中关注的音频事件，并且响应于这些环境音频事件来控制音频播放器。例如，音频环境管理器可以辨识系统被预先配置来辨识的音频设备的用户姓名的话音、其它词语或短语的话音、语音，和/或特定类型的声音。音频环境管理器可以使用到音频设备的声音的接近度(proximity)来评估周围环境中的声音是否受到足够关注而影响音频播放器的控制。响应于识别出预定音频事件类型的音频事件，音频环境管理器使得音频输出的播放器调整音频输出。例如，音频环境管理器可以使得音频播放器暂停音频输出或降低音频输出的音量。在一个实施例中，音频环境管理器记录音频接收机在周围环境中的音频输入。响应于识别出关注的音频事件，音频环境管理器使得音频播放器播放音频输入的记录部分。
5例如，消息的在识别出音频事件之前已记录的部分可以被播放，因为该消息的在音频播放器的控制之前发生的该部分可能受到影响。这个特征使得用户能够在被音频播放器的音乐或其它音频输出模糊的声音发生时听到该声音。图1是描绘适合的数据处理环境10的框图，在该数据处理环境10中可以实现本发明的示例性实施例的某些方案。数据处理环境10包括处理系统100，其包括一个或多个处理器或中央处理单元(CPU)，这里示出为处理器IlOA和110B。本领域技术人员将认识到，虽然示出了两个处理器，但是单个处理器或任意数量的多个处理器可以为处理系统100提供处理器功能。处理器IlOA和IlOB中的每一个可以是单核处理器或多核处理器。处理器 IlOA和IlOB被示出为经由一个或多个系统总线140或其它通信路径或介质通信地耦合到各种其它部件(包括存储器120)。处理器IlOA和IlOB还被示出为经由点对点处理器互连 111 (例如，超传输链路或Intel的快速通道互连(QPI))进行连接。音频环境管理器160管理处理系统100提供的音频环境。音频环境管理器160可以被实现为存储器120内由处理器IlOA和/或处理器IlOB运行的指令。如本文所使用的，术语“处理系统”和“数据处理系统”旨在宽泛地包括单个机器，或通信地耦合来一起工作的多个机器或多个设备的系统。示例性处理系统包括但不限于分布式计算系统、超级计算机、高性能计算系统、计算集群、大型计算机、小型计算机、客户端-服务器系统、个人计算机、工作站、服务器、便携式计算机、膝上型计算机、平板计算机、电话、个人数字助理(PDA)、手持设备、娱乐设备(例如音频和/或视频设备)、移动互联网设备(MID)，以及用于处理或传输信息的其它设备。可以至少部分地通过来自传统输入设备(例如，键盘、鼠标等)的输入和/或通过从其它机器、生物测定反馈或其它输入源或信号接收到的指示，来控制处理系统100。处理系统100可以通过网络接口控制器(NIC)(例如，网络接口 150、调制解调器、或其它通信端口或耦合)，来使用数据处理环境10中到一个或多个远程数据处理系统(没有示出)的一个或多个连接。处理系统100可以通过物理和/或逻辑网络12(例如，局域网(LAN)、广域网(WAN)、内联网、互联网等)互连到这种远程数据处理系统。涉及网络12的通信可以使用各种有线和/或无线短距离或长距离载波和协议，包括射频(RF)、卫星、微波、电子电气工程师协会(IEEE)802. 11、蓝牙、光、红外线、电缆、激光等。在处理系统100内，处理器IlOA和IlOB可以通信地耦合到一个或多个易失性或非易失性数据存储设备，例如存储器120。存储器120可以包括随机存取存储器(RAM)、只读存储器(ROM)、大容量存储设备(例如集成设备电路(IDE)硬盘驱动器)，和/或其它设备或介质(例如软盘、光存储设备、磁带、闪速存储器、记忆棒、数字视频盘、生物存储设备等)。针对本公开的目的，术语“ROM”可以用来总体上指代非易失性存储器设备，例如可擦除可编程ROM (EPROM)、电可擦除可编程ROM (EEPROM)、闪速ROM、闪速存储器等。处理器110A和 110B还可以通信地耦合到附加的部件，例如视频控制器、小型计算机系统接口(SCSI)控制器、网络控制器、通用串行总线(USB)控制器、输入设备(例如键盘和鼠标等)。处理系统 100还可以包括一个或多个桥或中心(例如，存储器控制器中心、输入/输出(1/0)控制器中心、PCI根桥等)，用于通信地耦合各种系统部件。如本文所使用的，术语“总线”可以用于指代共享通信路径以及点对点路径。一些部件(例如AIC)可以被实现为具有用于与总线进行通信的接口(例如，PCI
6连接器)的适配器卡。在一个实施例中，可以使用例如可编程或不可编程逻辑器件或阵列、专用集成电路(ASIC)、嵌入式计算机、智能卡等的部件将一个或多个设备实现为嵌入式控制器。系统100包括处理器IlOA和IlOB以及存储器120。存储器120可以被操作系统或其它软件虚拟地分成处理地址空间。处理器IlOA和IlOB经由系统总线140和互连141a、 141b与141m连接到存储器120。系统总线140还经由互连141η提供对网络接口 150的访问。图2是现有技术的音频播放器的图。音频播放器210接收音频内容202，例如音乐文件或其它音频内容文件。音频播放器210处理音频内容202以产生音频数据信号204并且向音频输出设备220 (例如，耳机和/或扬声器)发送音频数据信号204。音频输出设备 220提供音频输出206，例如音乐。图3是根据本发明的一个实施例配置的音频环境管理器360的图。在该实施例中，音频环境管理器360被示出为音频设备300的一部分，所述音频设备300还包括音频播放器310，但是音频播放器310可以在音频设备300外部并且通信地耦合到音频设备300。类似地，音频设备300被示出为包括音频输出设备320 (例如耳机和/或扬声器)，但是音频输出设备320可以在音频设备300外部。音频环境管理器360被配置来识别周围环境中的音频事件，并且响应于这些环境音频事件来控制音频播放器310。音频环境管理器360是图1的音频环境管理器160的一个实施例的示例，并且可以被实现为加载到图1的存储器120中、并在图1的处理器IlOA 和/或IlOB上运行的指令。音频播放器310类似于图2的现有技术的音频播放器210，但是其被配置来与环境音频管理器360的音频输出控制器364部件一起工作。音频输出控制器364发送控制信号312以控制音频播放器310的操作。在控制信号312的控制下，音频播放器310接收音频内容302并且向产生音频输出306的音频输出设备320提供音频数据信号304。音频环境管理器360还被配置来与音频接收机330 —起工作，所述音频接收机330 从音频播放器310的工作环境中接收环境音频信号308。如图3所示，音频接收机330可以是麦克风或者其它音频接收设备，其在音频设备300外部但是通信地耦合到音频设备300。可替代地，音频接收机330可以是音频设备300的一部分，例如，内建在音频设备300中的麦克风。音频接收机330可以经由网络(例如，图1的网络12)或者经由直接物理连接(例如，图1的系统总线140)与音频环境管理器360进行通信。音频接收机330将环境音频信号308传递到音频环境管理器360的音频输入分析器362。音频输入分析器362分析环境音频信号308以识别周围环境中关注的音频事件。音频输入分析器362可以被配置，以使得仅周围环境中选择的、预定类型的声音影响音频播放器310的控制。音频输入分析器362识别的音频事件是一组预定音频事件类型中的一种。例如，如果周围环境中的某个人呼唤设备的用户姓名，那么音频输入分析器362可以被配置来辨识作为一组预定词语之一的用户姓名。所以，音频输入分析器362可以包括话音辨识部件，用于辨识预定词语、姓名和/或短语。其它类型的音频事件类型包括使用话音生物测定进行的语音辨识，或使用声音辨识技术进行的预定声音(例如，汽笛、门铃或电话铃)的辨识。与音频设备有关的声音的接近度也可以用于评估声音是否受到关注；例如，可以使用先进三角测量技术确定声源位置。响应于识别出作为预定音频事件类型之一的音频事件，音频输入分析器362可以被配置来向音频输出控制器364发送音频事件通知314。响应于特定类型的音频事件的通知，音频输出控制器364可以被配置来向音频播放器310发送合适的控制信号312。例如，音频输出控制器364可以被配置来通过以下操作来响应用户姓名辨识事件使音频播放器 310通过暂停向音频输出设备320发送音频数据信号304来调整音频输出，由此使得用户听到讲话者。可替代地，音频输出控制器可以被配置来通过以下操作来响应用户姓名辨识事件使音频播放器310通过降低音频输出的音量来调整音频输出，从而可以更容易听到讲话者。音频环境管理器360识别周围环境中的音频事件并且响应于这些环境音频事件来调整音频输出的新颖途径不同于当今使用的大多数音频播放器的操作。例如，具有音乐播放器的蜂窝电话可以在来电到达时暂停音乐。但是，这种控制不是通过识别周围环境中的音频事件来触发的，而是通过在音频设备本身内生成的信号来触发的。类似地，当全球定位系统导航设备向车辆的驾驶者提供言语引导时，汽车立体声可以降低其音量。这种协调是经由到立体声系统本身的输入通道来发生的，并不是识别周围环境中外部音频事件的结^ ο图4是根据本发明的另一个实施例配置的音频环境管理器460的图。在该实施例中，音频环境管理器460被配置来处理需要大量时间来识别音频事件的情形。例如，音频输入分析器(例如，图3的音频输入分析器362)的话音辨识部件可以仅在词语已经被完全说出之后才对词语进行辨识。如果某人说“Hello，John，how are you ？ ”，那么音频输入分析器362可以仅在词语“John”已经被完全说出并且被辨识为关注的预定词语中的一个之后，才发送音频事件通知314。为了使音频播放器的用户听到整个消息，不能及时发送控制信号 312，因为正在讲出的语音可能还未被辨识为关注的音频事件。为了使用户听到消息的“how are you ？ ”部分，音频播放器只能及时暂停音频输出。在图4所示的实施例中，环境音频信号408不仅被音频接收机430提供给音频输入分析器462，还提供给音频环境管理器460的音频记录器466部件。虽然音频记录器466 被示出在音频环境管理器460内，但是音频记录器466可以是在音频环境管理器460外部但与其进行通信的独立部件。音频记录器466记录音频接收机430的音频输入并且向音频输出控制器464提供记录的环境音频信号416。响应于接收到音频事件通知414，除了控制信号412之外，音频输出控制器464还可以向音频播放器410发送记录的环境音频信号的一部分418。一旦识别出音频事件，音频输出控制器464可以控制音频播放器410重放音频输入的记录部分。例如，音频输出控制器464可以将所述记录的环境音频信号的一部分418 配置为包括音频输入的在识别出音频事件之前已记录的部分。所述环境音频信号418的在识别出音频事件之前已记录的该部分不一定已经被用户听到，因为在音频播放器的控制之前出现的声音可能受到影响，并因此可能已经被音频播放器410的音频输出模糊。所述环境音频信号418的在识别出音频事件之前已记录的该部分在此被称为前部或音频事件之前的部分。在上面提供的示例性消息“Hello，John, how areyou ？ ”中，音频输入的前部 “Hello，John”可以被包括在要被重放的所述记录的环境音频信号的一部分418中。然后，音频播放器410可以被配置来播放整个消息“Hello，John，how are you ？ ”，而不是仅播放在识别出音频事件之后记录的部分“how are you ”。音频输出控制器464可以使得音频播放器410在重放音频输入的记录部分期间暂停播放初始音频输出，例如音乐。可替代地，音频输出控制器464可以使得音频播放器在重放音频输入的记录部分时降低初始音频输出(例如，音乐)的音量。这种实现将允许音频输入的记录部分与原始音频输入被同时播放。可以以硬件、软件、固件或这些实现途径的组合来实现本文公开的机制的实施例。本发明的实施例可以被实现为在可编程系统上执行的计算机程序，所述可编程系统包括至少一个处理器、数据存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备，以及至少一个输出设备。可以将程序代码应用于输入数据，以执行本文描述的功能并且生成输出信息。本发明的实施例还包括机器可访问介质，其包含用于执行本发明的操作的指令，或者包含诸如HDL这样的设计数据，所述设计数据定义了本文描述的结构、电路、装置、处理器和/或系统的特征。这些实施例也可以被称为程序产品。这种机器可访问存储介质可以包括但不限于机器或设备制造或形成的粒子的有形排列，例如包括以下存储介质硬盘、任何其它类型的盘(包括软盘、光盘、致密盘只读存储器(CD-ROM)、可重写致密盘(CD-RW)和磁光盘)、半导体器件(例如，只读存储器(ROM)、诸如动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)这样的随机存取存储器 (RAM)、可擦除可编程只读存储器(EI3ROM)、闪速可编程存储器(FLASH)、电可擦除可编程只读存储器(EEPROM))、磁卡或光卡，或者适合存储电子指令的任何其它类型的介质。输出信息可以以已知的方式应用到一个或多个输出设备。针对本应用的目的，处理系统包括具有处理器的任何系统，所述处理器例如数字信号处理器(DSP)、微控制器、专用集成电路(ASIC)或微处理器。程序可以以高级的过程或面向对象编程语言来实现，以与处理系统通信。如果需要，程序可以以汇编或机器语言来实现。事实上，本文描述的机制并不限于任何具体编程语言的范围。在任何情况下，所述语言可以是编译性或解释性语言。本文阐述了用于使用环境音频分析来控制音频播放器的输出的方法和系统的实施例。虽然已经示出并描述了本发明的特定实施例，但是对本领域技术人员将显而易见的是，可以在不脱离所附权利要求的范围的情况下，进行变型和修改。因此，本领域技术人员将认识到，就本发明较宽方面而言，可以在不脱离本发明的情况下，进行改变和修改。所附权利要求在其范围内涵盖落入本发明的实质范围和精神内的所有此类改变、变型和修改。
权利要求
一种由处理器所运行的音频环境管理器来执行的方法，所述方法包括分析耦合到音频播放器的接收机的音频输入，以识别作为多种预定音频事件类型之一的音频事件；以及响应于识别出所述音频事件，使得所述音频播放器调整音频输出。
2.根据权利要求1所述的方法，还包括记录所述接收机的所述音频输入；以及使得所述音频播放器重放所述音频输入的记录部分，其中，所述记录部分的所述重放是响应于识别出所述音频事件而执行的。
3.根据权利要求2所述的方法，其中使得所述音频播放器调整所述音频输出包括在所述音频输入的所述记录部分的所述重放期间，使得所述音频播放器暂停播放初始音频输出。
4.根据权利要求2所述的方法，其中使得所述音频播放器调整所述音频输出包括在所述音频输入的所述记录部分的所述重放期间，使得所述音频播放器降低初始音频输出的音量。
5.根据权利要求2所述的方法，其中所述音频输入的所述记录部分包括前部，并且所述前部在识别出所述音频事件之前被记录。
6.根据权利要求1所述的方法，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定词语之一的词语。
7.根据权利要求1所述的方法，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定语音之一的语音。
8.根据权利要求1所述的方法，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定声音之一的声音。
9.根据权利要求1所述的方法，其中所述接收机经由无线网络连接耦合到所述音频播放器。
10.根据权利要求1所述的方法，其中分析所述接收机的所述音频输入以识别所述音频事件包括使用三角测量来确定所述音频播放器的所述音频输入的源的接近度。
11.一种系统，包括至少一个处理器；以及存储器，其包括用于音频环境管理器的指令，其中，所述音频环境管理器被配置来执行以下操作，包括分析耦合到音频播放器的接收机的音频输入，以识别作为多种预定音频事件类型之一的音频事件；以及响应于识别出所述音频事件，使得所述音频播放器调整音频输出。
12.根据权利要求11所述的系统，其中，所述指令还被配置来执行以下操作，包括记录所述接收机的所述音频输入；以及使得所述音频播放器重放所述音频输入的记录部分，其中，所述记录部分的所述重放是响应于识别出所述音频事件而执行的。
13.根据权利要求12所述的系统，其中使得所述音频播放器调整所述音频输出包括在所述音频输入的所述记录部分的所述重放期间，使得所述音频播放器暂停播放初始音频输出。
14.根据权利要求12所述的系统，其中使得所述音频播放器调整所述音频输出包括在所述音频输入的所述记录部分的所述重放期间，使得所述音频播放器降低初始音频输出的音量。
15.根据权利要求12所述的系统，其中所述音频输入的所述记录部分包括前部，并且所述前部在识别出所述音频事件之前被记录。
16.根据权利要求11所述的系统，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定词语之一的词语。
17.根据权利要求11所述的系统，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定语音之一的语音。
18.根据权利要求11所述的系统，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定声音之一的声音。
19.根据权利要求11所述的系统，其中所述接收机经由无线网络连接耦合到所述音频播放器。
20.根据权利要求11所述的系统，其中分析所述接收机的所述音频输入以识别所述音频事件包括使用三角测量来确定所述系统的所述音频输入的源的接近度。
21.一种计算机程序产品，包括计算机可读存储介质；以及所述计算机可读存储介质中的指令，其中，当在处理系统中被运行时，所述指令使得所述处理系统执行以下操作，包括分析耦合到音频播放器的接收机的音频输入，以识别作为多种预定音频事件类型之一的音频事件；以及响应于识别出所述音频事件，使得所述音频播放器调整音频输出。
22.根据权利要求21所述的计算机程序产品，其中，所述指令还被配置来执行以下操作，包括记录所述接收机的所述音频输入；以及使得所述音频播放器重放所述音频输入的记录部分，其中，所述记录部分的所述重放是响应于识别出所述音频事件而执行的。
23.根据权利要求22所述的计算机程序产品，其中使得所述音频播放器调整所述音频输出包括在所述音频输入的所述记录部分的所述重放期间，使得所述音频播放器暂停播放初始音频输出。
24.根据权利要求22所述的计算机程序产品，其中使得所述音频播放器调整所述音频输出包括在所述音频输入的所述记录部分的所述重放期间，使得所述音频播放器降低初始音频输出的音量。
25.根据权利要求22所述的计算机程序产品，其中所述音频输入的所述记录部分包括前部，并且所述前部在识别出所述音频事件之前被记录。
26.根据权利要求21所述的计算机程序产品，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定词语之一的词语。
27.根据权利要求21所述的计算机程序产品，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定语音之一的语音。
28.根据权利要求21所述的计算机程序产品，其中分析所述音频输入以识别所述音频事件包括辨识作为多个预定声音之一的声音。
29.根据权利要求21所述的计算机程序产品，其中所述接收机经由无线网络连接耦合到所述音频播放器。
30.根据权利要求21所述的计算机程序产品，其中分析所述接收机的所述音频输入以识别所述音频事件包括使用三角测量来确定所述音频播放器的所述音频输入的源的接近度。
全文摘要
本发明涉及用于进行以下操作的方法、系统和包含指令的计算机程序产品分析耦合到音频播放器的接收机的音频输入以识别作为多种预定音频事件类型之一的音频事件。响应于识别出所述音频事件，使得所述音频播放器调整音频输出。调整所述音频输出可以包括使得所述音频播放器暂停播放音频输出或者降低所述音频输出的音量。可以记录所述接收机的所述音频输入。响应于识别出所述音频事件，可以使得所述音频播放器重放所述音频输入的记录部分。所述音频输入的所述记录部分可以包括在识别出所述音频事件之前记录的部分。
文档编号G11C7/16GK101930789SQ20101018549
公开日2010年12月29日申请日期2010年5月19日优先权日2009年6月26日
发明者G·D·多明戈亚格斯申请人:英特尔公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｇ.Ｄ.多明戈亚格斯
技术所有人：英特尔公司
我是此专利的发明人

上一篇：用于图案化介质的电沉积的钝化涂层的制作方法
上一篇：多接口固态硬盘及其处理方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。