音频重放时间估计设备及方法

文档序号:6781577阅读:192来源:国知局
专利名称:音频重放时间估计设备及方法
技术领域
本发明的各方面涉及一种估计音频数据的重放时间的设备及方法,更具 体地讲,涉及一种能够有效估计以可变比特率方式压缩的音频数据的平均比 特率的音频重放时间估计设备及方法。
背景技术
目前有多种音频压缩技术,包括WMA(Windows媒体音频)、AAC(先进 音频编码)、OGG(Ogg Vorbis)、 MP3(MPEG音频第3层)等。MP3是由MPEG-1 规范规定的高音频质量音频压缩技术,这种技术按照具有独立比特率的帧来 压缩音频数据。当以MP3格式压缩音频数据时,相同压缩率(在下文中称为 恒定比特率(CBR))或不同压缩率(在下文中称为可变比特率(VBR))可应用于 音频数据的不同帧。因为MP3音频格式相对于CD音频数据将音频数据压缩 50倍并同时保持CD质量音频,所以MP3音频才各式广泛用于互联网。数字音频播放器(诸如MP3播放器)在重放音频数据时向用户提供关于音 频数据的信息,例如,平均比特率、重放时间等。通常,构成音频数据的所 有帧被扫描,以获得每帧的比特率、重放时间、平均比特率等。但是,如果 过大的音频数据被扫描或低性能的播放器用于扫描,则扫描时间被不期望地 延长。为了解决该问题,已经提出了一种技术,在该技术中,仅对出现在音频 数据的开始处的K帧获得比特率和重放时间,并估计它们的平均值作为音频 数据的平均比特率和重放时间。根据这种提出的技术,尽管以恒定比特率压 缩的音频数据的重放时间的估计相对准确,但是不能确保以可变比特率压缩 的音频数据的准确重放时间的估计。发明内容本发明的各方面在于提供一种能够有效估计以可变比特率压缩的音频数 据的平均比特率的音频重放时间估计设备及方法。本发明的另外方面和/或优点将在下面的描述中部分地阐明,并且从描述 中部分是明显的,或者通过本发明的实施可以被理解。根据本发明的一方面,提供一种估计音频数据的重放时间的设备。所述设备包括采样单元,使用准随机采样方法从包括ID3标签和多个帧的音频 数据对所述音频数据的多个样本帧进行采样;平均比特率计算单元,基于从 所述多个样本帧获得的比特率来计算音频数据的平均比特率;重放时间计算 单元,基于平均比特率计算音频数据的重放时间。根据本发明的另一方面,提供一种估计音频数据的重放时间的方法。所 述方法包括使用准随机采样方法从包括ID3标签和多个帧的音频数据对所 述音频数据的多个样本帧进行采样;基于从所述多个样本帧获得的比特率来 计算音频数据的平均比特率;基于平均比特率估计音频数据的重放时间;将估计的重》文时间通知用户。除了如上所述的示例的实施例以及各方面之外,通过参照附图并研究下 面的描述,另外的方面和实施例将是清楚的。


当结合附图(所有附图构成本发明公开的一部分)进行阅读时,从下面示 例的实施例的详细描述以及权利要求来看,本发明的更好的理解将变得明显。 尽管下面所撰写和示出的公开集中于公开本发明的示例的实施例,但是应该 清楚地理解,这些示例的实施例仅仅是说明和示例,本发明不限于此。本发 明的精神和范围仅由权利要求限定。下面是附图的简要描述,其中图1是根据本发明示例的实施例的用于估计音频数据的重放时间的设备 的详细示图;图2显示了以MP3格式压缩的音频数据;图3显示了通过准随机釆样方法对1024个准随机点采样的处理及其结果;图4是示出根据本发明示例的实施例的在Huber估计器中使用的权值函 数的曲线图;图5是示出才艮据本发明示例的实施例的在Cauchy估计器中使用的权值函 数的曲线图;图6是示出根据本发明示例的实施例的在Welch估计器中使用的权值函 数的曲线图;以及图7是显示根据本发明示例的实施例的用于估计音频数据的重放时间的 方法的流程图。
具体实施方式
现在将详细描述本发明的实施例,其示例在附图中示出,其中,相同的 标号始终表示相同的部件。下面通过参照附图来描述这些实施例以解释本发 明。现在将参照图1至图6来描述根据本发明示例的实施例的用于估计音频 数据的重放时间的设备。具体地讲,图1是根据本发明示例的实施例的用于 估计音频数据的重放时间的设备100的详细示图。如图1所示,音频重放时 间估计设备100包括存储单元120、输入单元110、采样单元130、平均比特 率计算单元140、重放时间计算单元150和显示单元160。根据本发明的其它 方面,音频重放时间估计设备100可包括另外或不同的单元。类似地, 一个 或多个单元的功能可被组合为单个组件。该音频重放时间估计设备可包括台 式计算机、便携式计算机、个人娱乐装置、家庭娱乐装置、机顶盒、个人数 字助理、移动电话等。存储单元120存储以MP3格式压缩的音频数据。音频数据具有多个帧。 将参照图2简要描述以MP3格式压缩的音频数据的结构。图2显示了以MP3 格式压缩的音频数据的格式。音频数据具有ID3标签和多个帧。ID3标签包 括用于音频数据的元数据。多个帧中的每一帧包括头区和数据区。数据区包 括用于音频数据的预定块的音频信号,头区包括关于记录在数据区上的音频 信号的信息,例如,比特率、采样率等。参照图1,存储单元120不仅存储以MP3格式压缩的音频数据,还存储 用于估计音频数据的平均比特率和音频数据的重^:时间的算法。存储单元120 可由(但不限于)非易失性存储器、易失性存储器和/或存储介质实现,非易失 性存储器诸如只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程 只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪速存储器,易失性存储器诸如随机存取存储器(RAM),存储介质诸如硬盘驱动器(HDD)。 输入单元110接收用户命令作为输入。例如,输入单元110接收用于重 放预存储的音频数据的命令、用于中断音频数据的重放的命令、用于删除预 存储的音频数据的命令等。为此,输入单元110可包括用于产生相应4建信号 的多个键。多个键能够以硬件或软件来实现。输入单元还可以是鼠标、触摸 屏、触控盘、麦克风或其它能够接收用户输入的装置。采样单元130从预存储的音频数据对代表音频数据的多个帧采样。在下 面的描述中,这些帧将被称为"样本帧"。采样单元130可使用准随机采样方 法从音频数据对多个样本帧采样。与通过随机或伪随机采样方法采样的样本展示出规则特性。图3显示了通过准随机采样方法对1024个准随机点采样的处理及其结 果。图3的左上图显示了 128 (1至128)个准随机点的采样结果。右上图显示 了 384 (129至512)个准随机点的采样结果。右下图显示了 512 (513至1024) 个准随机点的采样结果。左下图显示了 1024(1至1024)个点的采样结果。通过准随机采样方法采样的128个样本、384个样本和512个样本按照 特定模式占据了二维(2D)空间。如图3的左下图所示,1024个样本没有集中 在2D空间的特定区域,相反,这些样本均匀地分布在整个2D空间。与随机 或伪随机采样方法相比,准随机采样方法允许在整个总体上对样本进行更均 匀的釆样,由此^R高采样精度。参照图1,采样单元130通过准随机采样方法对多个样本帧采样。采样 单元130产生K个准随机数。假设音频数据的长度为N字节(通过从音频数 据的所有帧的总长度(L)减去ID3标签的长度(D)来获得音频数据的长度),则 K可远小于N,即,K N。采样单元130按照升序排列产生的K个准随机数。如果K个准随机数排 列之后获得的结果被表示为等式(1),则满足等式(2)中表示的条件。<formula>formula see original document page 8</formula>,…(l)<formula>formula see original document page 8</formula>…②其中,tt是准随机数,i是l和N之间的整数。在准随机数被排列之后,采样单元130对构成音频数据的多个帧中的第t,帧采样。平均比特率计算单元140通过读取由采样单元130采样的样本帧的头区来计算平均值,以获得每个样本帧的比特率。优选的是,平均比特率计算单元140使用M估计器来计算平均值。平均比特率计算单元140可根据从各个 样本帧获得的比特率应用不同的权值,来计算平均值。计算的平均值可以是 音频数据的平均比特率的估计值。M估计器的示例包括Cauchy估计器、Welch 估计器、Tukey估计器和Huber估计器。图4至图6示出了应用于本发明示例的实施例的权值函数。图4是示出 在Huber估计器中使用的权值函数的曲线图。图5是示出在Cauchy估计器中 使用的权值函数的曲线图。图6是示出在Welch估计器中使用的权值函数的 曲线图。在每个曲线图中,x轴表示比特率,y轴表示应用于相关比特率的权 值。参照图4,随着比特率朝着第一阈值增大,权值急剧地增大。随着比特 率在第一阔值和第二阈值之间增大,权值保持在最大值。如果比特率在达到 第二阈值之后继续增大,则权值急剧地减小。相反,在图5中,比特率朝着 第三阈值线性地增大,并且从第三阈值线性地减小。参照图6,与图5所示的权值函数相似,比特率朝着第三阈值增大,并 且从第三阈值减小。但是,与图5所示的情况不同,图6所示的权值函数是 弯曲的。图6的曲线图中所示的第三阈值可以与图5的曲线图中所示的第三 阈值相同或不同。再次参照图1,重放时间计算单元150基于构成音频数据的所有帧的长 度以及由平均比特率计算单元140计算的平均比特率,来计算重放时间。重 放时间计算单元150可将平均比特率转换为字节单位比特率,并且将构成音 频数据的所有帧的长度除以转换的值,以计算音频数据的重放时间,如表达 式(3)所示r丄5x8…(3)其中,T表示音频数据的重放时间,B表示平均比特率计算单元140计 算的音频数据的平均比特率,N表示构成音频数据的所有帧的长度(通过从音 频数据的总长度(L)减去ID3标签的长度(D)来获得构成音频数据的所有帧的长度)。显示单元160以可视格式显示命令处理结果。例如,显示单元160显示 将被播放的音频数据的列表、音频数据的重放时间等。显示单元160可由各 种显示装置(诸如LCD、 PDP、 LED、 OLED或柔性显示器)实现。显示单元 160可独立于输入单元110而实现,或者可如同触4莫屏那样与输入单元110 结合。图7是显示根据本发明示例的实施例的估计音频数据的重放时间的处理 的流程图。参照图7和图1,在方框S710,当通过l命入单元IIO接收到用户 命令时,则在方框S720,采样单元130对代表音频数据的多个帧进行采样。 对多个帧的采样可包括产生K个准随机数;对多个帧中的与这些准随机数 相应的帧进行采样。一旦样本帧被采样,则在方框S730,平均比特率计算单元140使用M 估计器,通过读取由采样单元130采样的样本帧的头区来计算平均值,以获 得每个样本帧的比特率。比特率的平均值的计算可包括通过分析从多个样 本帧获得的比特率,根据比特率应用不同的权值;使用应用于比特率的权值 计算比特率的平均值。不同的权值可应用于从各个样本帧获得的比特率,以 防止平均值;故各个样本帧的比特率中的一个或两个异常值(outlier)所影响。计 算的平均值被当作音频数据的平均比特率。在方框S740,重放时间计算单元150基于构成音频数据的所有帧的长度 (以字节为单位)以及由平均比特率计算单元140计算的平均比特率,来计算重 放时间。音频数据的重放时间的计算可包括通过从音频数据的总长度(L)(以 字节为单位)减去ID3标签的长度(D)(以字节为单位)来获得构成音频数据的所 有帧的长度(N)(以字节为单位);将平均比特率转换为字节单位比特率;将N 除以转换的平均比特率,以获得音频数据的重放时间(T)。在完成了重放时间 (T)的计算之后,在方框S750,将计算的重放时间(T)与关于音频数据的其它 信息(例如,记录在ID3标签上的信息)一起显示。如上所述,根据本发明各方面的音频数据重放时间估计设备和方法提供 一些优点和益处。可通过仅扫描音频数据的一部分来估计音频数据的平均比 特率和重放时间。在对样本帧进行釆样的过程中,通过采用准随机釆样方法, 可提高采样精度,并易于获得音频数据的平均比特率和重放时间。各个采样 的帧的比特率和重放时间被分析,并且不同的权值应用于这些帧,以估计平200810001512.4说明书第7/7页均比特率和重放时间,由此提高估计精度。即使在传统硬件配置中,也可有 效估计音频数据的平均比特率和重放时间。另外,本发明也可实施为计算机可读记录介质上的计算^L可读代码。计 算机可读记录介质是任何能够存储其后由计算机系统读取的数据的数据记录装置。计算机可读记录介质的例子还包括只读存储器(ROM)、随机存储器 (RAM)、 CD-ROM、 DVD、磁带、软盘、光学数据存储装置和载波(诸如通过 互联网的数据传输)。计算机可读记录介质也可以分布在连接计算机系统的网 络上,从而计算机可读代码按照分布式方式被存储和执行。另外,本发明所 属领域的程序员可容易地解释实现本发明的功能程序、代码和代码段。虽然已经示出和描述了本发明示例的实施例,但是本领域的普通技术人 员应该理解,随着技术的发展,在不脱离本发明的真实范围的情况下,可进 行各种改变和修改,并且可对本发明的组件进行等同物替换。在不脱离本发 明的范围的情况下,可进行多种修改、变换、补充和子组合,以使本发明的 教导适合于特定情形。例如,尽管针对MP3音频格式进行了描述,但是本发 明的各方面也可用于另外的音频格式,诸如WMA、 Ogg Vorbis、 AAC、MPEG-4 和/或RealAudio。类似地,除了音频数据以外,本发明的各方面还可用于估 计视频数据的重放时间。因此,本发明旨在不限于所公开的各种示例的实施 例,相反,本发明包括落入到权利要求的范围内的所有实施例。
权利要求
1、一种估计音频数据的重放时间的设备,所述设备包括采样单元,使用准随机采样方法从包括ID3标签和多个帧的音频数据对所述音频数据的多个样本帧进行采样;平均比特率计算单元,基于从所述多个样本帧获得的比特率来计算音频数据的平均比特率;重放时间计算单元,基于平均比特率估计音频数据的重放时间。
2、 根据权利要求1所述的设备,其中,采样单元产生多个准随机数,按 照升序排列所述多个准随机数,并且对音频数据的与所述多个准随机数相应 的帧进行采样。
3、 根据权利要求1所述的设备,其中,平均比特率计算单元将不同的权 值应用于从所述多个样本帧获得的比特率,并且使用应用于比特率的所述权 值来计算比特率的平均值。
4、 根据权利要求3所述的设备,其中,随着比特率从最小值增大到第一 阈值,平均比特率计算单元将增大的权值应用于比特率,随着比特率从第一 阈值增大到第二阈值,平均比特率计算单元将与第 一 阈值相应的权值应用于 比特率,随着比特率从第二阈值增大到最大值,平均比特率计算单元将减小 的权值应用于比特率。
5、 根据权利要求3所述的设备,其中,随着比特率从最小值增大到阈值, 平均比特率计算单元将增大的权值应用于比特率,随着比特率从所述阈值增 大到最大值,平均比特率计算单元将减小的权值应用于比特率。
6、 根据权利要求3所述的设备,其中,所述平均值是音频数据的平均比 特率。
7、 根据权利要求1所述的设备,其中,重放时间计算单元将从音频数据得的转^:,来计算重放时l':。
、 '、、 、 ' , " ^ 、
8、 根据权利要求1所述的设备,还包括显示单元,显示音频数据的重 放时间。
9、 一种估计音频数据的重放时间的方法,所述方法包括使用准随机采样方法从包括ID3标签和多个帧的音频数据对所述音频数据的多个样本帧进行采样;基于从所述多个样本帧获得的比特率来计算音频数据的平均比特率;基于平均比特率估计音频数据的重放时间;将估计的重》丈时间通知用户。
10、 根据权利要求9所述的方法,其中,对多个样本帧进行采样的步骤包括产生多个准随机数,并按照升序排列所述多个准随机数; 对与所述多个准随机数相应的位置的帧进行采样。
11、 根据权利要求9所述的方法,其中,计算平均比特率的步骤包括 将不同的权值应用于从所述多个样本帧获得的比特率;使用应用于比特率的所述权值来计算比特率的平均值。
12、 根据权利要求11所述的方法,其中,将不同的权值应用于比特率的 步骤包括随着比特率从最小值增大到第 一阈值,将增大的权值应用于比特率; 随着比特率从第 一 阈值增大到第二阈值,将与第 一 阈值相应的权值应用 于比特率;随着比特率从第二阈值增大到最大值,将减小的权值应用于比特率。
13、 根据权利要求11所述的方法,其中,将不同的权值应用于比特率的 步骤包括随着比特率从最小值增大到阈值,将增大的权值应用于比特率; 随着比特率从所述阈值增大到最大值,将减小的权值应用于比特率。
14、 根据权利要求11所述的方法,其中,所述平均值是音频数据的平均 比特率。
15、 根据权利要求11所述的方法,其中,估计重放时间的步骤包括将 从音频数据的总长度减去ID3标签的长度获得的值除以将平均比特率转换为 字节单位获得的转换值,来计算重放时间。
16、 根据权利要求9所述的方法,其中,通知用户的步骤包括显示音 频数据的重放时间。
17、 一种包括指令的计算机可读介质,当计算机执行所述指令时,所述 指令使得计算机执行一种方法,所述方法包括对音频数据的多个帧进行随机采样,使得所述采样的多个帧几乎均匀地分布在整个音频数据上;基于所述采样的多个帧的比特率来计算音频数据的平均比特率; 基于平均比特率估计音频数据的重放时间; 将估计的重力丈时间通知用户。
18、 根据权利要求17所述的计算机可读介质,还包括音频数据。
19、 根据权利要求17所述的计算机可读介质,其中,通知用户的步骤包 括在显示器上显示估计的重放时间。
20、 一种准确地估计音频数据的重放时间的设备,所述设备包括 采样单元,对音频数据的多个帧进行随机采样,使得所述采样的多个帧几乎均勻地分布在整个音频数据上;计算器单元,计算所述采样的多个帧的平均比特率,并使用所述平均比 特率估计音频数据的重^:时间。
21、 根据权利要求20所述的设备,还包括 存储单元,存储音频数据和估计的重放时间。
22、 根据权利要求20所述的设备,其中,计算器单元包括 平均比特率计算器,计算所述采样的多个帧的平均比特率; 重放时间计算器,使用所述平均比特率估计音频数据的重放时间。
23、 根据权利要求20所述的设备,其中,音频数据是MP3格式、WMA 格式或Ogg格式中的一种。
24、 根据权利要求20所述的设备,其中,音频数据具有ID3标签。
25、 根据权利要求20所述的设备,其中,采样单元按照升序产生多个准 随机数,并且对音频数据的与所述多个准随机数相应的帧进行采样。
26、 根据权利要求22所述的设备,其中,平均比特率计算器读取所述采 样的多个帧中的每一帧的头,以确定所述采样的多个帧中的每一帧的比特率。
27、 根据权利要求22所述的设备,其中,平均比特率计算器使用M估 计器计算平均值。
全文摘要
提供一种音频重放时间估计设备及方法。所述设备包括采样单元,使用准随机采样方法从包括ID3标签和多个帧的音频数据对所述音频数据的多个样本帧进行采样;平均比特率计算单元,基于从所述多个样本帧获得的比特率来计算音频数据的平均比特率;重放时间计算单元,基于平均比特率估计音频数据的重放时间。
文档编号G11B27/10GK101221802SQ20081000151
公开日2008年7月16日 申请日期2008年1月4日 优先权日2007年1月12日
发明者金容圣, 金泰勋 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1