音频处理方法、装置及非暂时性电脑可读媒体与流程

文档序号:18221478发布日期:2019-07-19 23:02阅读:209来源:国知局
音频处理方法、装置及非暂时性电脑可读媒体与流程

本公开涉及一种音频处理方法、装置及非暂时性电脑可读媒体,且特别涉及用以压缩音频文件的音频处理方法、装置及非暂时性电脑可读媒体。



背景技术:

传统上,若欲将音频文件通过例如蓝牙等仅支援低频宽的无线传输协定发送至音频播放装置,则需使用例如mp3格式等失真/有损的压缩方式来大幅降低数据量,然而较大的压缩率容易造成音频失真,产生杂音或爆音。

此外,一般压缩技术通常牵涉将音频档于时域及频域间进行转换等大量运算,因此可将连续的音频数据流分成一个个固定大小的音频区段(frame)以便进行运算与压缩,接收端再把一个个音频区段解压后还原成音频数据流。通常大一点的音频区段会有较佳的压缩效率,但是太大的音频区域会加大声音的延迟并且需要较大的存储器。然小型播放装置例如蓝牙耳机、蓝牙喇叭等,通常仅具有低处理能力的微处理器以及较小的存储空间,因此在执行解压缩音频文件时,这些小型播方装置将耗费较长的处理时间,而无法实时播放。



技术实现要素:

本公开的一实施方式是在提供一种音频处理方法。此音频处理方法包含以下步骤:由处理器分割音频文件为多个音频区段;以及由处理器压缩多个音频区段以产生多个压缩音频区段,包含:降取样多个音频区段中的第一音频区段以产生多个压缩音频区段的第一压缩音频区段,其中第一音频区段的第一目标频宽小于一频宽阈值;以及取样多个音频区段中的第二音频区段以产生多个压缩音频区段的第二压缩音频区段,并于第二压缩音频区段加入延迟时间,其中第二音频区段的第二目标频宽不小于频宽阈值。

于部分实施例中,其中由该处理器压缩该些音频区段以产生该些压缩音频区段还包含:分别计算以一第一演算法压缩该些音频区段中之一者的一第一压缩率以及以一第二演算法压缩该些音频区段中之该者的一第二压缩率;以及响应于高于该第二压缩率的该第一压缩率,以该第一演算法压缩该些音频区段中之该者。

于部分实施例中,其中该些音频区段中之该者包含一标头,且该标头包含用于指示该第一演算法的一标签。

于部分实施例中,其中由该处理器压缩该些音频区段以产生该些压缩音频区段还包含:分割该些压缩音频区段中每一者为复数个音频区域。

于部分实施例中,还包含:将该些压缩音频区段传送至一音频播放装置,以通过该音频播放装置根据该些压缩音频区域解压缩该些压缩音频区段。

于部分实施例中,其中该延迟时间相等于该处理器的一低通滤波器的延迟时间。

于部分实施例中,还包含根据一第一指令,设定该第一目标频宽;以及根据一第二指令,设定该第二目标频宽。

本公开的另一实施方式是在提供一种装置,包含存储器以及处理器。存储器用以存储音频文件。处理器用以分割音频文件为多个音频区段,并降取样多个音频区段中的第一音频区段以产生第一压缩音频区段,其中处理器取样多个音频区段中的第二音频区段以产生第二压缩音频区段,并于第二压缩音频区段加入延迟时间。其中第一音频区段的第一目标频宽小于频宽阈值,其中第二音频区段的第二目标频宽不小于频宽阈值。

于部分实施例中,其中该处理器更用以分割该些压缩音频区段中每一者为复数个音频区域。

本公开的另一实施方式是在提供一种非暂时性电脑可读媒体,存储有复数指令,当复数指令被处理器执行时,执行以下步骤:分割音频文件为多个音频区段;降取样多个音频区段中的第一音频区段以产生第一压缩音频区段,其中第一音频区段的第一目标频宽小于频宽阈值;以及取样多个音频区段中的第二音频区段以产生第二压缩音频区段,并于第二压缩音频区段加入延迟时间,其中第二音频区段的第二目标频宽不小于频宽阈值。

因此,根据本公开的技术实施方式,本公开的实施例通过提供一种音频处理方法、装置及非暂时性电脑可读媒体,且特别涉及用以压缩音频文件的音频处理方法、装置及非暂时性电脑可读媒体,通过动态的降取样以及升取样,借此于频宽变动时更有效的压缩音频数据流,并防止音频不连续而产生爆音。此外,本公开的实施例于压缩时同时执行二或多个不同的压缩演算法,以达到更佳的压缩效率。再者,本公开的实施例于压缩时,将一个音频区段分为多个音频区域(chunk),于解压缩时,接收端仅需较小的空间即可对音频数据进行解压缩。

附图说明

为让本发明的上述和其他目的、特征、优点与实施例能更明显易懂,附图的说明如下:

图1是根据本公开的一些实施例所示出的一种装置的示意图;

图2是根据本公开的一些实施例所示出的一种音频区段的波形图;

图3是根据本公开的一些实施例所示出的一种音频区段的波形图;

图4是根据本公开的一些实施例所示出的一种音频区段的示意图;以及

图5是根据本公开的一些实施例所示出的一种音频处理方法的流程图。

附图标记说明:

100:装置

110:存储器

130:处理器

200:波形图

300:波形图

400:音频区段

900:音频播放装置

500:音频处理方法

s510、s530、s550:步骤

具体实施方式

以下公开提供许多不同实施例或例证用以实施本发明的不同特征。特殊例证中的元件及配置在以下讨论中被用来简化本公开。所讨论的任何例证只用来作解说的用途,并不会以任何方式限制本发明或其例证的范围和意义。此外,本公开在不同例证中可能重复引用数字符号且/或字母,这些重复皆为了简化及阐述,其本身并未指定以下讨论中不同实施例且/或配置之间的关系。

在全篇说明书与权利要求所使用的用词(terms),除有特别注明外,通常具有每个用词使用在此领域中、在此公开的内容中与特殊内容中的平常意义。某些用以描述本公开的用词将于下或在此说明书的别处讨论,以提供本领域技术人员在有关本公开的描述上额外的引导。

关于本文中所使用的『耦接』或『连接』,均可指二或多个元件相互直接作实体或电性接触,或是相互间接作实体或电性接触,而『耦接』或『连接』还可指二或多个元件相互操作或动作。

在本文中,使用第一、第二与第三等等的词汇,是用于描述各种元件、组件、区域、层与/或区域是可以被理解的。但是这些元件、组件、区域、层与/或区域不应该被这些术语所限制。这些词汇只限于用来辨别单一元件、组件、区域、层与/或区域。因此,在下文中的一第一元件、组件、区域、层与/或区域也可被称为第二元件、组件、区域、层与/或区域,而不脱离本发明的本意。如本文所用,词汇『与/或』包含了列出的关联项目中的一个或多个的任何组合。本公开文件中提到的「及/或」是指表列元件的任一者、全部或至少一者的任意组合。

请参阅图1。图1是根据本公开的一些实施例所示出的一种装置100的示意图。装置100用以与音频播放装置900通信连接。于一些实施例中,装置100将音频文件进行处理后,通过无线通信传输方式,将处理后的音频数据传送至音频播放装置900。音频播放装置900再解压缩处理后的音频数据,以快速且实时的播放音频。

于连接关系上,装置100包含存储器110以及处理器130。处理器130与存储器110相耦接。于操作关系上,处理器将音频文件分割为多个音频区段,并针对每个音频区段作个别处理。音频文件可根据任何规则作分割,例如时间长度、取样点数量及/或文件大小等。其中,音频处理方法100是依据音频内容的时间先后顺序来处理每一音频区段,而每一音频区段的内容具有相同或不相同的时间长度、取样点数量及/或文件大小,本公开文件并不加以限制。

处理器130将多个音频区段进行压缩处理。由于音频数据传送的频宽为可变动的,同一音频文件的多个音频区段可分别包含不同的目标频宽。举例而言,使用者可于音频播放时调整音频数据传送的频宽,而各个音频区段的目标频宽因应使用者所设定的音频数据传送的频宽而改变。

音频文件中的多个音频区段的第一音频区段将首先进行压缩处理。待第一音频区段经压缩处理完毕后,第二音频区段紧接着进行压缩处理,而待第二音频区段处理完毕后,继续处理下一音频区段,直至整个音频文件被处理完成。

于一些实施例中,若于处理器130压缩第一音频区段前,使用者设定音频数据传送的频宽为400kbps,处理器130接收包含音频数据传送的频宽为400kbps的信息的指令,并依据此指令设定第一音频区段的目标频宽为400kbps。若于处理器130压缩第二音频区段前,使用者设定音频数据传送的频宽为1mbps,处理器130接收包含音频数据传送的频宽为1mbps的信息的指令,并依据此指令设定第一音频区段的目标频宽为1mbps。

处理器130依据各个音频区段的目标频宽对音频区段进行压缩处理。若音频区段的目标频宽小于频宽阈值,降取样音频区段以产生压缩音频区段。而若音频区段的目标频宽不小于频宽阈值,取样音频区段以产生压缩音频区段,并于压缩音频区段加入延迟时间。

请参阅图2以及图3。图2是根据本公开的一些实施例所示出的一种音频区段的波形图200。图3是根据本公开的一些实施例所示出的一种音频区段的波形图300。如图2所示出,处理器130对音频区段进行取样,以取得多个取样点。假设于一般取样的情况下,处理器130以96khz的频率进行取样。当音频区段的目标频宽小于频宽阈值时,处理器130对音频区段进行降取样。也就是说,处理器130以较低的频率进行取样,例如48khz、32khz等,以产生压缩音频区段。另一方面,当音频区段的目标频宽不小于频宽阈值时,处理器130以一般取样的取样频率对音频区段进行取样以产生压缩音频区段,并于压缩音频区段加入延迟时间。举例而言,如图3所示出,于压缩音频区段中加入延迟时间td。

由上可知,于本公开中,于目标频宽较低的情况下,对音频区段进行降取样,可达到较佳的压缩率。此外,由于降取样时声音会产生延迟,而不做降取样时声音不会产生延迟。因此,于不做降取样的情况下,即目标频宽不小于频宽阈值时,于压缩音频区段加入延迟时间,如此当目标频宽动态改变时,播放音频即不会因为音频不连续而产生爆音。

于部分实施例中,当处理器130对音频区段进行降取样时,音频区段会经过处理器130的低通滤波器(未示出)。于部分实施例中,低通滤波器可为sinc滤波器。而当音频区段经过处理器130的低通滤波器处理后,处理器130所产生的压缩音频区段会受到低通滤波器的影响而产生延迟时间。于部分实施例中,此延迟时间可为16取样数至256取样数中的一者。举例而言,若是取样频率为96khz,则延迟时间即为介于16/96000秒至256/96000秒之间的时间长度。对于降取样处理的音频区段,处理器130会于压缩音频区段中加入与低通滤波器的延迟时间相同的延迟时间,以使音频播放时连续。以上所述的延迟时间仅作为例示,本公开不以此为限。

于部分实施例中,处理器130更用以分割压缩音频区段为多个音频区域。请参阅图4。图4是根据本公开的一些实施例所示出的一种音频区段400的示意图。如图4所示出,每个音频区段包含一个标头(header),且处理器130将压缩音频区段400的音频数据分割为多个音频区域c1至c8。当装置100将压缩音频区段400传送至音频播放装置900时,音频播放装置900依据音频区域为单位进行解压缩。即处理器130先解压缩音频区域c1的数据、再解压缩音频区域c2的数据,依此类推。如此一来,音频播放装置900于进行解压缩时的运算量可降低,且音频播放装置900可以较小的存储器空间进行解压缩。

举例而言,假设一个压缩音频区段400包含1024个取样点数据,且音频播放装置900需6kbyte的存储器空间以进行解压缩处理。而若是音频播放装置900依据音频区域为单位进行解压缩,假设压缩音频区段400被分割为8个音频区域,每个音频区域包含仅128个取样点数据,则音频播放装置900仅需750byte的存储器空间以进行解压缩处理。

由上可知,通过将压缩音频区段分割为多个音频区段,音频播放装置900可以较小的存储器空间以进行解压缩处理,并可降低运算量。

于部分实施例中,于处理器130对一个音频区段进行压缩处理之前,处理器130分别计算以第一演算法压缩此音频区段的第一压缩率以及以第二演算法压缩此音频区段的第二压缩率,并且处理器130响应于高于第二压缩率的第一压缩率,以第一演算法压缩此音频区段。举例而言,处理器130于压缩第一音频区段之前,处理器130先计算以格伦布编码演算法(ricecoding)压缩第一音频区段的第一压缩率,再计算以lz演算法压缩第一音频区段的第二压缩率。若是第一压缩率高于第二压缩率,处理器130以格伦布编码演算法压缩第一音频区段以产生第一压缩音频区段。而若是第一压缩率不高于第二压缩率,处理器130以lz演算法压缩第一音频区段以产生第一压缩音频区段。此外,同一音频文件的不同音频区段可以不同的演算法进行压缩处理。以上所列举的压缩演算法仅作为例示,本公开不以此为限制。

于部分实施例中,音频区段的标头中包含用于指示此音频区段进行压缩时所使用的演算法的标签。举例而言,若是第一音频区段是以格伦布编码演算法进行压缩,于第一音频区段的标头中将包含用以指示第一音频区段是以格伦布编码演算法进行压缩的标签。反之,若是第二音频区段是以lz演算法进行压缩,于第二音频区段的标头中将包含用以指示第二音频区段是以lz演算法进行压缩的标签。

由上可知,本公开的实施例中可针对同一音频文件中的不同的音频区段,选用较佳的演算法对不同的音频区段进行压缩。因此,本公开的实施例中可达到较佳的压缩效率。

请参阅图5。图5是根据本公开的一些实施例所示出的一种音频处理方法500的流程图。如图5所示,音频处理方法500包含步骤s510至步骤s550。

于步骤s510中,分割音频文件为多个音频区段。于部分实施例中,步骤s510可由图1中的处理器130执行。举例来说,处理器130将音频文件分割为多个音频区段,并针对每个音频区段作个别处理。

举例来说,音频文件中的多个音频区段的第一音频区段将首先进行步骤s530至步骤s550。待第一音频区段经压缩处理完毕后,第二音频区段紧接着进行步骤s530至步骤s550,而待第二音频区段处理完毕后,继续处理下一音频区段,直至整个音频文件被处理完成。如上所述的第一、第二仅作为例示说明顺序之用。

于步骤s530中,压缩多个音频区段以产生多个压缩音频区段。于部分实施例中,步骤s530可由图1中的处理器130执行。详细而言,于执行步骤s530时,若音频区段的目标频宽小于频宽阈值,降取样音频区段以产生压缩音频区段。而若音频区段的目标频宽不小于频宽阈值,取样音频区段以产生压缩音频区段,并于压缩音频区段加入延迟时间。

于部分实施例中,步骤s530还包含分别计算以第一演算法压缩此音频区段的第一压缩率以及以第二演算法压缩此音频区段的第二压缩率,并且处理器130响应于高于第二压缩率的第一压缩率,以第一演算法压缩此音频区段。此外,压缩音频区段的标头包含指示对音频区段进行压缩处理时所使用的压缩演算法的标签,以使音频播放装置190于执行解压缩时识别处理器130于压缩此音频区段时所使用的演算法。

于步骤s550中,将多个压缩音频区段传送至音频播放装置。于部分实施例中,步骤s550可由图1中的处理器130执行,以将多个压缩音频区段传送至图1中的音频播放装置190。于音频播放装置190接收到压缩音频区段后,音频播放装置190对压缩音频区段进行解压缩,以实时播放音频文件。

于部分实施例中,步骤s530还包含分割多个压缩音频区段中每一者为多个音频区域,以使音频播放装置190于步骤s550时可依据音频区域为单位进行解压缩处理。

于部分实施例中,上述音频处理方法500可通过非暂时性电脑可读媒体实现。其中,非暂时性电脑可读媒体存储有复数程序码指令,当复数程序码指令被处理器执行时,可执行音频处理方法500中步骤s510至步骤s550或此等步骤的整合方法。非暂时性电脑可读媒体可为电脑、手机或独立的音频编码器,而处理器可为处理器或系统芯片等。

在本公开的一些实施例中,处理器130可以是具有存储、运算、数据读取、接收信号或信息、传送信号或信息等功能的服务器、电路、中央处理器(centralprocessorunit,cpu)、微处理器(mcu)或其他具有同等功能的装置。

在本公开的一些实施例中,存储器110可以是具有数据存储功能的电路或其他具有同等功能的装置或电路。在本公开的一些实施例中,装置100可为电脑等较高运算处理能力的装置,而音频播放装置900可为蓝牙装置等较低运算处理能力的装置。上述运算处理能力是指处理器的时钟速率、处理器的效能、浮点计算能力、位元频宽、存储器的容量等运算参数,例如较高运算处理能力的装置可以包含音响系统、智能手机、平板电脑、随身音乐拨放器等,较低运算处理能力的装置可以包含蓝牙耳机、蓝牙喇叭等。

由上述本公开的实施方式可知,本公开的实施例通过提供一种音频处理方法、装置及非暂时性电脑可读媒体,且特别涉及用以压缩音频文件的音频处理方法、装置及非暂时性电脑可读媒体,通过动态的降取样以及升取样,借此于频宽变动时更有效的压缩音频数据流,并防止音频不连续而产生爆音。此外,本公开的实施例于压缩音频区段时可同时执行二或多个不同的压缩演算法,以达到更佳的压缩效率。再者,本公开的实施例于压缩时,将一个音频区段分为多个音频区域,于解压缩时,接收端(例如音频播放装置)仅需较小的空间以及较低的运算处理能力即可对音频数据进行解压缩。

另外,上述例示包含按序的示范步骤,但该些步骤不必依所显示的顺序被执行。以不同顺序执行该些步骤皆在本公开内容的考量范围内。在本公开内容的实施例的构思与范围内,可视情况增加、取代、变更顺序及/或省略该些步骤。

虽然本公开已以实施方式公开如上,然其并非用以限定本公开,任何本领域技术人员,在不脱离本公开的构思和范围内,当可作各种的变动与润饰,因此本公开的保护范围当视权利要求所界定者为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1