一种音频数据处理方法及装置与流程

文档序号：12036205阅读：274来源：国知局

本发明涉及信息处理技术领域，尤其涉及一种音频数据处理方法及装置。

背景技术：

随着电子技术的不断发展，现有的电视、电脑、移动终端(如手机、pad等)都具有播放音频数据的功能，而为了实现对音频数据的实时播放，需要不断地捕获音频数据，并同时进行读取和播放。

在现有技术中，终端通过wdma捕获音频数据，采用第一缓冲区对捕获的音频数据进行存储，该环形缓冲区包括写指针和读指针；终端采用第二缓冲区对捕获的音频数据进行管理，该第二缓冲区也包括写指针和读指针。终端通过rdma读取第二缓冲区中的音频数据进而实现音频数据的播放。具体的过程参照图1所示，终端通过wdma中的写指针将捕获的音频数据写入到第一缓冲区，然后读指针从起始位置开始读取数据(图中wdma对应的数据1)，当wdma中的写指针和读指针之间有阈值时，则触发阈值中断，rdma的写指针将wdma的第一缓存区中的数据1对应的起始地址和数据长度写入到第二缓存区的item0(图中虚线箭头所指区域)，rdma的读指针读取item0进而实现音频数据的播放。

但是，当wdma中的写指针和读指针都移动到图中位置(虚线箭头)，这时，写指针与读指针之间有阈值但还未产生中断，如果此时有外界中断产生，虽然终端已通过wdma获取数据2，但由于上述的阈值中断未产生，rdma的写指针未将该数据对应的地址和数据长度写入到第二缓存区的item1(item1中无数据)，因此rdma的读指针无数据可读，从而造成音频数据播放出现卡顿的现象(例如在播放音乐时，出现的播放滞帧，也就是通常人们所说的“卡”)。

技术实现要素：

本发明的实施例提供一种音频数据处理方法及装置，解决了终端在播放音频数据时出现卡顿现象的问题。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，提供一种音频数据处理方法，包括：

将音频数据存储至直接内存写入wdma的第一缓冲区中；

检测所述第一缓冲区中的写指针与读指针的差值是否满足预定条件；

若所述第一缓冲区中的写指针与读指针的差值满足所述预定条件，则触发阈值中断，根据所述阈值中断读取所述读指针和所述写指针之间的音频数据，将所述音频数据写入直接内存读取rdma的第二缓冲区；

当确定所述阈值中断的触发次数等于第一预定阈值时，启动rdma，读取所述rdma的第二缓冲区中的音频数据，所述第一预定阈值大于等于2。

第二方面，提供一种音频数据处理装置，所述装置包括：

存储模块，用于将音频数据存储至直接内存写入wdma的第一缓冲区中；

检测模块，用于检测所述第一缓冲区中的写指针与读指针的差值是否满足预定条件；

处理模块，用于若所述检测模块检测到所述第一缓冲区中的写指针与读指针的差值满足所述预定条件，触发阈值中断，根据所述阈值中断读取所述读指针和所述写指针之间的音频数据，将所述音频数据写入直接内存读取rdma的第二缓冲区；

启动模块，用于当确定所述阈值中断的触发次数等于第一预定阈值时，启动rdma，读取所述rdma的第二缓冲区中的音频数据，所述第一预定阈值大于等于2。

本发明实施例提供了一种音频数据处理方法及装置，通过检测第一缓冲区中的写指针与读指针的差值是否满足预定条件；若第一缓冲区中的写指针与读指针的差值满足所述预定条件，则触发阈值中断，根据阈值中断读取读指针和写指针之间的音频数据，将音频数据写入rdma的第二缓冲区；当确定阈值中断的触发次数等于第一预定阈值时，启动 rdma，读取rdma的第二缓冲区中的音频数据，第一预定阈值大于等于2。

相比于现有技术，本发明实施例中当确定阈值中断的触发次数等于第一预定阈值的情况下，启动rdma，即rdma中的读指针开始读取音频数据。由于在启动rdma之前，写指针已将音频数据至少一次写入第二缓冲区，因此rdma中的写指针与读指针之间有一定的音频数据间隔，可以保证读指针一直有音频数据可读，从而避免了现有技术中出现音频数据卡顿的现象。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的现有技术中存在音频数据播放卡顿的示意图；

图2为本发明实施例提供的一种音频数据处理方法的方法流程示意图；

图3为本发明实施例提供的wdma的wpt、rpt及其维护的ringbuffer的逻辑关系示意图；

图4为本发明实施例提供的rdma的wpt、rpt及其维护的ringbuffer的逻辑关系示意图；

图5为本发明实施例提供的初始化wdma的示意图；

图6为本发明实施例提供的初始化rdma的示意图；

图7为本发明实施例提供的一种音频数据处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的音频数据处理方法的执行主体可以为音频数据处理装置，或者用于执行上述音频数据处理方法的终端。具体的，该终端可以为智能电视、智能电视终端、高清机顶盒、平板电脑、笔记本电脑、超级移动个人计算机(英文：ultra-mobilepersonalcomputer，简称：umpc)、上网本、个人数字助理(英文：personaldigitalassistant，简称：pda)等终端。其中，音频数据处理装置可以为上述终端中的中央处理器(英文：centralprocessingunit，简称：cpu)或者可以为上述终端的中的控制单元或者功能模块。示例性的，该音频数据处理装置可以是高清终端中用于处理画质的后端画质处理芯片(例如，frc(英文：framerateconversion，帧频转换)芯片)，且相对于该高清终端中的主soc(英文：systemonchip，片上系统)芯片，该音频数据处理装置可以称为该高清终端的从芯片。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

为了便于清楚描述本发明实施例的技术方案，在本发明的实施例中，采用了“第一”、“第二”等字样对功能或作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。

本发明的实施例提供一种音频数据处理方法，如图2所示，该方法包括如下步骤：

101、音频数据处理装置将音频数据存储至直接内存写入wdma的第一缓冲区中。

示例性的，在步骤101之前，还包括：音频数据处理装置获取音频数据。

本发明实施例以应用于电视系统领域为例，由于现有的电视通路包括模拟通路、数字通路和多媒体通路，模拟通路包括atvdemod通路、av通路、分量通路、vga(英文全称：videographicsarray，中文：视频图形阵列)通路，数字通路包括hdmi(英文全称：highdefinitionmultimediainterface，中文：高清晰度多媒体接口)通路等；多媒体通路包括dmp(英文全称：digitalmediaplayer，中文：数字媒体播放器)等，因此，该音频数据可以为来源于多个电视通路的脉冲编码调制(英文全称：pulsecodemodulation，简称：pcm)的音频数据。

具体的，本发明实施例采用直接内存写入(英文全称：writedirectmemoryaccess，简称：wdma)来捕获音频数据，其中，wdma会管理一段物理上连续的内存区域，该内存区域用于暂存wdma实时捕获到的所在电视通路的音频数据。在电视系统领域中，音频数据会通过axi(advancedextensibleinterface)总线存储在与wdma对应的第一缓冲区中。其中，axi是一种总线协议，是一种面向高性能、高宽带、低延迟的片内总线。

示例性的上述的第一缓冲区中包括写指针(英文：writepointer，简称：wpt)和读指针(英文：readpointer，简称：rpt)，该第一缓冲区可以为第一环形缓冲区(简称：ringbuffer)。其中，wpt表示捕获到的音频数据在ringbuffer的存储位置，rpt表示读取的音频数据在ringbuffer的存储位置。因此，wdma的音频捕获及处理工作主要是依靠其写指针和读指针来完成的。其中，wpt主要由wdma自己维护，rpt主要由cpu控制。

具体的，参照图3所示，为wdma的wpt、rpt及其维护的ringbuffer的逻辑关系示意图。其中，st_addr(startaddress)表示ringbuffer的起始地址(或首地址)，end表示ringbuffer的尾地址。初始化时，wpt和rpt均为0，即相当于对应ringbuffer的起始地址。当wdma捕获到音频数据时，捕获到的音频数据会从wpt的起始地址进行存储，另外，由于第一缓冲区为ringbuffer，因此，当wpt到达该ringbuffer的尾地址时，会自动跳转到ringbuffer的首地址，继续从ringbuffer的起始位置开始存储音频数据，如此以ringbuffer式管理捕获到的音频数据的存储空间，可以有效解决用于捕获的内存空间浪费的问题，同时，也取消了音频捕获的时间限制，支持无限时间长度的音频捕获。

102、音频数据处理装置检测第一缓冲区中的写指针与读指针的差值是否满足预定条件。

示例性的，上述的预定条件为第一缓冲区中的写指针与读指针的差值大于等于第二预设阈值。其中，该第二预设阈值小于第一缓冲区的长度。可选的，第二预设阈值的大小可以根据第一缓冲区的长度进行设定。示例的，若第一缓冲区的长度为m，则可以将第二预设阈值设置为第一缓冲区的长度的1/m。

103、若第一缓冲区中的写指针与读指针的差值满足预定条件，则触发阈值中断；根据阈值中断读取读指针和所述写指针之间的音频数据，将音频数据写入rdma的第二缓冲区。

示例性的，本发明实施例通过直接内存读取(英文：readdirectmemoryaccess，简称：rdma)来进行音频数据的播放，上述的rdma的第二缓冲区中包括wpt和rpt，该第二缓冲区可以为ringbuffer。其中，wpt表示将读取音频数据写入ringbuffer的位置，rpt表示读取音频数据在ringbuffer的存储位置。因此，rdma的音频数据读取工作主要是依靠其wpt和rpt来完成的。其中，wpt主要由cpu(或软件)控制，rpt由rdma自己维护。另外，ringbuffer是一段可以存储音频数据的数据结构，该数据结构是由item控制节点组成的。

具体的，rdma的item、wpt、rpt及其ringbuffer的关系如图4所示。该item主要是用来控制rdma读取音频数据的，其中，每个item由64bit组成，第一个32bit，即第一个字，为st_addr(startaddress)，指向rdma要读取的音频数据存储于内存的物理地址(上述wdma的wpt所指向的第一缓冲区的存储音频数据位置的地址)。第二个32bit，即第二个字，主要包括length成员，该length表示该要读取的音频数据的长度(上述wdma的wpt与rpt之间的音频数据)。另外，item的个数由cpu决定，每个item的startaddress以及lengh等信息，也由cpu实时更新。另外，由于第二缓冲区为ringbuffer，因此，需要cpu进行一下判断：假设ringbuffer中共20个item，则位置1对应第一个item(记为item0)，位置2对应第二个item(记为item1)，位置20对应第二十个item(记为item19)。若wpt之前所处的位置为item19所在的位置，那么，此时需要cpu配置rdma的wpt为ringbuffer的第一个 item(item0)所在位置。如果wpt之前所处的位置并非item19所在的位置，则cpu只需简单的配置rdma的wpt为其更新之前紧接着的下一个item所处的位置。

示例性的，当第一缓冲区中的写指针与读指针的差值大于等于第二预设阈值，则触发阈值中断，第一缓冲区的读指针读取第一缓冲区中的写指针写入的音频数据，同时rdma中的写指针将该音频数据写入rdma的第二缓冲区内，以使的当启动rdma时，rdma中的读指针可以读取该音频数据进而可以实现音频数据的播放。

104、当确定阈值中断的触发次数等于第一预定阈值时，启动rdma，读取rdma的第二缓冲区中的音频数据。

本实施例中的第一预定阈值大于等于2，当第一预定阈值大于2时，使得rdma的写指针已经将音频数据写入一次到rdma的第二缓冲区中，从而保证rdma的读指针与写指针之间有一定的音频数据间隔。示例性的，上述阈值中断的触发次数的初始值设为0，每执行一次中断该阈值中断的触发次数加1。

示例性的，本实施例中的rdma中包括启动标志位，该启动标志位为0，表示未启动rdma；该启动标志位为1，表示启动rdma。在初始化的过程中将该启动标志位设为0，当上述确定阈值中断的触发次数等于第一预定阈值，将rdma中的启动标志位设为1。

示例性的，上述步骤103之后，还包括如下具体步骤：

103a、当确定阈值中断的触发次数不等于第一预定阈值时，重新检测第一缓冲区中的写指针与读指针的差值是否满足预定条件。

示例性的，当上述确定的阈值中断的触发次数不等于第一预定阈值时，可以根据阈值中断读取读指针和写指针之间的音频数据，通过rdma的写指针将音频数据写入rdma的第二缓冲区，重新检测第一缓冲区中的写指针与读指针的差值是否大于等于预设阈值，直到上述的阈值中断的触发次数等于第一预定阈值时，才可停止检测第一缓冲区中的写指针与读指针的差值是否大于等于第一预设阈值。

本发明实施例提供了一种音频数据处理方法，通过检测第一缓冲区中的写指针与读指针的差值是否满足预定条件；若第一缓冲区中的写指针与读指针的差值满足所述预定条件，则触发阈值中断，根据阈值中断读取读指针和写指针之间的音频数据，将音频数据写入rdma的第二缓冲区；当确定阈值中断的触发次数等于第一预定阈值时，启动rdma，读取rdma的第二缓冲区中的音频数据，第一预定阈值大于等于2。

本实施例中音频数据处理装置依据wdma实现对音频数据捕获，依据rdma实现对捕获的音频数据进行读取，进而实现音频播放。因此，在使用wdma和rdma时，需要对二者进行初始化。具体的，在上述步骤101之前，还包括初始化wdma和rdma，其初始化的具体步骤如下：

如图5所示，初始化wdma具体包括：

101a1、设定wdma对应的第一缓冲区的起始地址。

其中，wdma捕获到的音频数据将暂存于该第一缓冲区的起始地址的内存空间中。

101a2、设定第一缓冲区的长度。

通常，将第一缓冲区的长度配置为1152的倍数，待捕获的音频数据的单位大小设置为1152*2*2(即一帧mpeg2音频数据的大小)个字节。其中，1152为采样的点数，第一个2表示每个采样点2字节大小，第二个2表示每个音频采样点包括2个声道(左声道和右声道)。示例的，可以将第一缓冲区的长度设置为80*(1152*2*2)个字节。

101a3、设定wdma的第二预设阈值。

当wdma的wpt与rpt的差值为该第二预设阈值时，即触发阈值中断。cpu响应该中断后，可以实时地将该笔音频数据拷贝到文件中存储，也可以调用音频读取模块将该笔音频数据读取，进行一系列音频后处理动作后再调用音频播放模块，实现播放。通常，将第二预设阈值的大小设置为wdma对应的第一缓冲区的n等分。根据步骤102中所示例的，可以将第二预设阈值设置为10*(1152*2*2)个字节，即第一缓冲区长度的八分之一。

101a4、设定第一缓冲区的读指针。

具体的，设置wdma对应的第一缓冲区的rpt，初始化时，该rpt会自动关联到设定的第一缓冲区的起始地址。其中，wpt由wdma自己维护，无需cpu配置，初始化从其起始地址开始捕获音频数据。

101a5、将wdma的阈值中断次数重置为0。

101a6、启动wdma。

最后，重置wdma，启动wdma，使wdma开始工作

如图6所示，初始化rdma具体包括：

101b1、关闭rdma的阈值中断。

其中，上述阈值中断表示rdma的读、写指针的差值为几个item时触发的中断，以提醒软件音频数据不够播了，需要软件及时的配置新的item以指向新的待播音频数据，以免出现由于暂时无数据可读而出现的声音卡顿，甚至无声等问题。

101b2、设定rdma对应的第二缓冲区的起始地址。

其中，第二缓冲区的起始地址为将音频数据存储于内存中的位置。

101b3、设定rdma的预设阈值。

具体的，若预设阈值为1，则表示开启中断；若预设阈值为0，则表示关闭中断。当将预设阈值设为1且rdma的wpt与其rpt的差值大于等于1时，则会触发该阈值中断，执行该阈值中断的处理程序，比如及时配置新的item给rdma。

101b4、设定第二缓冲区的写指针。

其中，该第二缓冲区的写指针为rdma本身所在内存位置，同时，该位置也是item0的位置。

101b5、设定第二缓冲区的长度。

其中，该第二缓冲区的长度为item的个数，例如，可以将tem的个数设为20。

101b6、设置rdma的启动标识为0。

将rdma的启动标识设为0，表示在初始化的过程中不启动rdma。

下面将基于上述的一种音频数据处理方法的相关描述对本发明实施例提供的一种音频数据处理装置进行介绍。以下实施例中与上述实施例相关的技术术语、概念等的说明可以参照上述的实施例，这里不再赘述。

本发明实施例提供一种音频数据处理装置，如图7所示，该音频数据处理装置2包括存储模块21、检测模块22、处理模块23以及启动模块24，其中：

存储模块21用于将音频数据存储至直接内存写入wdma的第一缓冲区中；

检测模块22用于检测第一缓冲区中的写指针与读指针的差值是否满足预定条件；

处理模块23用于若检测模块22检测到第一缓冲区中的写指针与读指针的差值满足所述预定条件，则触发阈值中断，根据阈值中断读取读指针和写指针之间的音频数据，将音频数据写入rdma的第二缓冲区；

启动模块24用于当确定阈值中断的触发次数等于第一预定阈值时，启动rdma，读取rdma的第二缓冲区中的音频数据，第一预定阈值大于等于2。

可选的，上述检测模块22还用于当确定阈值中断的触发次数不等于第一预定阈值时，重新检测第一缓冲区中的写指针与读指针的差值是否满足预定条件。

示例性的，上述检测模块22具体用于：

检测第一缓冲区中的写指针与读指针的差值大于等于第二预定阈值，第二预设阈值小于第一缓冲区的长度。

如图7所示，该音频数据处理装置2还包括：初始化模块25

初始化模块25用于初始化wdma，初始化wdma过程至少包括如下步骤：

设定wdma对应的第一缓冲区的起始地址；

设定第一缓冲区的长度；

设定wdma的第二预定阈值；

设定第一缓冲区的读指针；

将wdma的阈值中断次数重置为0；

启动wdma。

初始化模块25还用于初始化rdma，初始化rdma至少包括如下步骤：

关闭rdma的阈值中断；

设定rdma对应的第二缓冲区的起始地址；

设定rdma的第二预定阈值；

设定第二缓冲区的写指针；

设定第二缓冲区的长度；

设置rdma的启动标识为0。

本发明实施例提供了一种音频数据处理装置，通过检测第一缓冲区中的写指针与读指针的差值是否满足预定条件；若第一缓冲区中的写指针与读指针的差值满足所述预定条件，则触发阈值中断，根据阈值中断读取读指针和写指针之间的音频数据，将音频数据写入rdma的第二缓冲区；当确定阈值中断的触发次数等于第一预定阈值时，启动rdma，读取rdma的第二缓冲区中的音频数据，第一预定阈值大于等于2。

在本申请所提供的几个实施例中，应该理解到，所揭露的终端和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理包括，也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-onlymemory，简称rom)、随机存取存储器(randomaccessmemory，简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄昉
技术所有人：青岛海信电器股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。