用于移动装置的智能音频记录的系统和方法_6

文档序号：9601015阅读：来源：国知局

终具有不同的期满时间设置。
[0135]图34为智能音频记录系统内的块的逐阶段加电的实施例的图，其中可根据每一状态来动态地控制活动块的数目及其总功率消耗。在被动音频监视状态S1期间，一个或一个以上数目的麦克风可经配置以周期性地唤醒以便接收音频输入S270。为了执行此接收操作，所述系统可经配置以唤醒系统的一部分，且进而所述系统的活动块的数目或(可互换地说)加电块的数目在图34中增加到Ν1。在主动音频监视状态S2期间，除了 Ν1之外，一个或一个以上额外块也可经配置以唤醒，这使得在一个或一个以上麦克风活动3420的周期期间活动块的总数目为Ν2。举例来说，上下文识别器560和上下文评估逻辑950可经配置以唤醒，如其已在图9B中例示。在活动音频记录状态S3期间，可能的是除了 N2之外，至少一些其它块也可需要唤醒，这又使得在活动音频记录状态S3状态期间的活动块的总数目为N3。在图34中将在主动音频监视状态S2状态期间的活动块的基线数目3425设置为N1，其恰巧与在被动音频监视状态S1状态期间的活动块的数目相同，但对于所属领域的技术人员来说应明显的是，这可经配置以在本发明的范围内在另一实施例中为不同的。用于音频监视状态S4或活动音频记录状态S5的活动块的数目可实施为分别类似于被动音频监视状态S1或活动音频记录状态S3。
[0136]图35为A/D转换器精确度控制的实施例的图，其中精确度可根据每一预定状态来配置或关于上下文信息S600来动态地控制。在被动音频监视状态S1状态期间的A/D转换器单元可经配置以具有低分辨率设置，其在图35中经标记为“低”，而其可经配置以分别针对主动音频监视状态S2或活动音频记录状态S3状态具有中分辨率设置(“中等”设置)或较高分辨率设置(“高”设置)。此机制可有助于通过针对每一状态允许优化设置来节省功率消耗或存储器使用。在另一实施例中，在被动音频监视状态S1和主动音频监视状态S2阶段期间的A/D转换器设置可经配置以具有相同分辨率。或者，在主动音频监视状态S2和活动音频记录状态S3阶段期间的A/D转换器设置可经配置以具有相同分辨率。
[0137]用于A/D转换器单元的精确度设置可经配置以在活动音频记录状态S3期间基于上下文信息S600来动态地改变。图35展示所述动态改变可经配置以在活动音频记录过程期间对于全部或部分持续时间3540有效。假设用于活动音频记录状态S3的默认精确度设置为“高”3520。当在上下文信息S600的优先级方面存在显著改变时，精确度设置可降低至IJ“中等”3535或“低”设置3525。举例来说，精确度设置的改变可由内容分类从“音乐”改变为“语音”或从“语音”改变为“音乐”起始，所述内容分类为上下文信息S600的子集。或者，其可由音频输入S270的背景噪声等级或噪声类型的改变起始。在另一实施例中，其可由本地存储装置中的可用存储器大小或移动装置与远程服务器之间的信道的质量起始。
[0138]图36为音频输入信号增强控制的实施例的图，其中所述增强可根据上下文信息S600来动态地配置。出于示范性目的，已假设存在若干信号增强等级，即不增强、低等级、中等等级和高等级增强。在活动音频记录状态S3、S5期间，音频信号增强等级可经配置以根据上下文信息S600来动态地调整。举例来说，背景噪声的特性或等级可用以触发音频信号增强等级的改变。当背景噪声等级显著较高或背景噪声等级的特性大致上从平稳类型噪声改变为不平稳类型噪声时，音频信号增强设置可经配置以从低等级增强或不增强改变为中等等级增强或甚至高等级增强。举例来说，当智能音频记录系统可能处于音频记录状态S3、S5中活动地记录音频输入S270时，用户可在地铁站内等待他的或她的列车到达。当列车正到达或离开站台时，噪声等级时常超过特定阈值，在超出所述阈值时会难以理解正常的会话语音。在检测到显著的背景噪声等级或类型改变后或在检测到主要听觉场景改变后，智能音频记录系统可即刻因此重新配置音频信号增强设置。音频信号增强设置改变可在麦克风的活动数目之前或之后。
[0139]图37为音频压缩参数控制的实施例的图，其中压缩可根据上下文信息S600来动态地配置。出于示范性目的，已假设存在若干压缩等级，即不压缩、“低”、“中等”和“高”压缩。在活动音频记录状态S3、S5期间，音频信号压缩等级可经配置以根据上下文信息S600来动态地调整。举例来说，压缩模式的改变可由内容分类从“音乐”改变为“语音”或从“语音”改变为“音乐”起始，所述内容分类为上下文信息S600的子集。可需要针对“音乐”内容使用较高位率，而可需要针对“语音”内容使用较低位率，在“语音”内容中待编码信号的带宽通常比典型的“音乐”内容窄得多。或者，其可由本地存储装置中的可用存储器大小或移动装置与远程服务器之间的信道的质量起始。
[0140]译码格式可经配置以同样根据上下文信息S600来改变。图38为压缩译码格式选择的实施例的图，其中压缩译码格式选择或其缺乏可根据上下文信息S600来动态地配置。出于示范性目的，在图38中已展示音频编解码器#1和语音编解码器#1，但通常，译码格式还可经配置以在音频编解码器之间或在语音编解码器之间改变。
[0141]举例来说，当前音频编解码器#13810可经配置以改变为语音编解码器#13820。在检测到主要信号分类从“音乐”改变为“语音”后。在另一实施例中，译码格式改变(如果有的话)可仅在“不压缩模式”3830之后触发，或者其可无论何时在检测到预定义的上下文信息S600改变后即刻触发而在中间没有“不压缩模式”3830。
[0142]提供各种示范性配置以使得所属领域的技术人员能够制作或使用本文中所揭示的方法和其它结构。本文中所展示和描述的流程图、框图和其它结构仅为实例，且这些结构的其它变型也在本发明的范围内。对这些配置的各种修改均为可能的，且本文中所呈现的一般原理还可应用于其它配置。举例来说，应强调本发明的范围不限于所说明的配置。而是，明确地涵盖且特此揭示，如本文中所描述的不同特定配置的特征可针对其中此些特征彼此不矛盾的任何情况经组合以产生包括在本发明的范围内的其它配置。还明确地涵盖且特此揭示，在描述设备的两个或两个以上元件之间的连接的情况下，可存在一个或一个以上介入元件(例如滤波器)，且在描述方法的两个或两个以上任务之间的连接的情况下，可存在一个或一个以上介入任务或操作(例如滤波操作)。
[0143]本文中所描述的配置可部分地或整体地实施为硬连线电路，实施为制造到专用集成电路中的电路配置，或实施为加载到非易失性存储装置中的固件程序或作为机器可读代码从计算机可读媒体加载或加载到计算机可读媒体中的软件程序，所述代码是可由例如微处理器或其它数字信号处理单元等逻辑元件阵列执行的指令。计算机可读媒体可为:存储元件阵列，例如半导体存储器(其可包括而不限于动态或静态RAM(随机存取存储器)、R0M(只读存储器)和/或快闪RAM)或铁电、聚合或相变存储器；磁盘媒体，例如磁盘或光盘；或任何其它用于数据存储的计算机可读媒体。术语“软件”应理解为包括源代码、汇编语言代码、机器代码、二进制代码、固件、宏码、微码、可由逻辑元件阵列执行的任何一个或一个以上指令集或序列以及此类实例的任何组合。
[0144]本文中所揭示的方法中的每一者还可有形地体现(例如，在如上文列举的一个或一个以上计算机可读媒体中)为一个或一个以上可由包括逻辑元件阵列的机器(例如，处理器、微处理器、微控制器或其它有限状态机)读取且/或执行的指令集。因此，本发明不希望限于上文所展示的配置，而是应被赋予与在本文中(包括在申请的所附权利要求书中)以任何方式揭示的原理及新颖特征一致的最广范围，所述权利要求书形成原始揭示内容的一部分。
【主权项】
1.一种用于移动装置的方法，所述方法包含: 响应于自动检测到开始事件指示符，处理音频输入信号的第一部分以获得第一信息；基于所述第一信息来确定至少一个录入参数；以及基于所确定的所述至少一个录入参数来重新配置所述移动装置的音频俘获单元。2.根据权利要求1所述的方法，其中所述至少一个录入参数包括指示用于所述移动装置的A/D转换器的取样频率或数据宽度的信息。3.根据权利要求1所述的方法，其中所述至少一个录入参数包括指示所述移动装置的活动麦克风的数目的信息。4.根据权利要求1所述的方法，其中所述至少一个录入参数包括指示至少一个麦克风的唤醒时间间隔或活动持续时间的定时信息。5.根据权利要求1所述的方法，其中所述第一信息为描述其中所述移动装置正在进行录入的环境的上下文信息。6.根据权利要求1所述的方法，其中所述第一信息为描述所述音频输入信号的特性的上下文信息。7.根据权利要求1所述的方法，其中所述开始事件指示符基于经由无线信道发射的信号。8.一种用于移动装置的设备，所述设备包含: 音频记录处理器，其经配置以: 自动检测开始事件指示符；响应于检测到所述开始事件指示符，处理音频输入信号的第一部分以获得第一信息；以及基于所述第一信息来确定至少一个录入参数；以及音频俘获单元，其经配置以基于所确定的至少一个录入参数来重新配置其自身。9.根据权利要求8所述的设备，其中所述至少一个录入参数包括指示用于所述音频俘获单元的A/D转换器的取样频率或数据宽度的信息。10.根据权利要求8所述的设备，其中所述至少一个录入参数包括指示所述移动装置的活动麦克风的数目的信息。11.根据权利要求8所述的设备，其中所述至少一个录入参数包括指示至少一个麦克风的唤醒时间间隔或活动持续时间的定时信息。12.根据权利要求8所述的设备，其中所述第一信息为指示其中所述移动装置正在进行录入的环境的上下文信息。13.根据权利要求8所述的设备，其中所述第一信息为指示所述音频输入信号的特性的上下文信息。14.根据权利要求8所述的设备，其中所述开始事件指示符基于经由无线信道发射的信号。15.一种用于移动装置的设备，所述设备包含: 用于自动检测开始事件指示符的装置；用于响应于检测到所述开始事件指示符来处理音频输入信号的第一部分以获得第一信息的装置；用于基于所述第一信息来确定至少一个录入参数的装置；以及用于基于所确定的所述至少一个录入参数来重新配置所述移动装置的音频俘获单元的装置。16.根据权利要求15所述的设备，其中所述至少一个录入参数包括指示用于所述音频俘获单元的A/D转换器的取样频率或数据宽度的信息。17.根据权利要求15所述的设备，其中所述至少一个录入参数包括指示所述移动装置的活动麦克风的数目的信息。18.根据权利要求15所述的设备，其中所述至少一个录入参数包括指示至少一个麦克风的唤醒时间间隔或活动持续时间的定时信息。19.根据权利要求15所述的设备，其中所述第一信息为指示其中所述移动装置正在进行录入的环境的上下文信息。20.根据权利要求15所述的设备，其中所述第一信息为指示所述音频输入信号的特性的上下文信息。21.根据权利要求15所述的设备，其中所述开始事件指示符基于经由无线信道发射的信号。22.—种非暂时性计算机可读媒体，其包含在由处理器执行时致使所述处理器进行以下操作的指令: 自动检测开始事件指示符；响应于检测到所述开始事件指示符而处理音频输入信号的第一部分以获得第一信息; 基于所述第一信息来确定至少一个录入参数；以及基于所确定的所述至少一个录入参数来重新配置所述移动装置的音频俘获单元。23.根据权利要求22所述的计算机可读媒体，其中所述至少一个录入参数包括指示用于所述音频俘获单元的A/D转换器的取样频率或数据宽度的信息。24.根据权利要求22所述的计算机可读媒体，其中所述至少一个录入参数包括指示所述移动装置的活动麦克风的数目的信息。25.根据权利要求22所述的计算机可读媒体，其中所述至少一个录入参数包括指示至少一个麦克风的唤醒时间间隔或活动持续时间的定时信息。26.根据权利要求22所述的计算机可读媒体，其中所述第一信息为指示其中所述移动装置正在进行录入的环境的上下文信息。27.根据权利要求22所述的计算机可读媒体，其中所述第一信息为指示所述音频输入信号的特性的上下文信息。28.根据权利要求22所述的计算机可读媒体，其中所述开始事件指示符基于经由无线信道发射的信号。
【专利摘要】本发明涉及用于移动装置的智能音频记录的系统和方法。本发明呈现一种能够自动开始和结束通过至少一个麦克风俘获的音频信号的录入的移动装置。所述移动装置能够基于所述音频输入信号的上下文信息来调整与音频记录相关的多个参数。
【IPC分类】G10L17/00, G10L25/78, H04M1/725
【公开号】CN105357371
【申请号】CN201510645020
【发明人】太元·李, 哈立德·埃尔-马勒, 柳熙钟, 辛钟元
【申请人】高通股份有限公司
【公开日】2016年2月24日
【申请日】2011年4月8日
【公告号】CN102907077A, CN102907077B, EP2556652A1, EP2556652B1, EP3035655A1, US9112989, US20120078397, US20150325267, WO2011127457A1

完整全部详细技术资料下载

当前第6页1 2 3 4 5 6