音频缩混及波形生成方法和设备与流程

文档序号：13576055阅读：221来源：国知局

本发明涉及计算机技术，具体涉及音频缩混及波形生成方法和设备。

背景技术：

音频编辑是复杂的，常涉及多段音频文件，而在编辑过程中，为了可视化的编辑声音，而不是仅依靠听力编辑声音，常将声音在编辑器上显示为对应的波形。因此对声音的编辑，可以转化为对声音波形的编辑，例如通过连接多个预先提取的声音波形来生成指定为声音合成目标的声音，等等操作，但是由于编辑时常使用时的无损音质的声音，因此将声音文件解析为声音波形显示，需要占用很大的内存和计算时间；

因此现有技术中需要减少声音波形显示所要消耗内存和计算时间的技术方案。

技术实现要素：

鉴于上述问题，本发明提出了克服上述问题或者至少部分地解决上述问题的音频缩混及波形生成方法和设备。

为此目的，第一方面，本发明提出一种音频编辑方法，包括：

获取第一声音波形数据，将第一音频波形数据根据预设的时间段连续切分为片段；

获取每一片段的最大值a；

将所有的最大值a按照片段的顺序形成第二声音波形数据。

可选的，所述将所有的最大值按照片段的顺序形成第二声音波形数据之后，包括：

将第二声音波形数据作为第一声音波形数据显示；

根据对第二声音波形数据的编辑对应的编辑第一声音波形数据。

可选的，所述预设的时间段为144个采样点。

可选的，还包括：

将第二声音波形数据根据预设的时间段连续切分为片段；

获取每一片段的最大值b；

将所有的最大值b按照片段的顺序形成第三声音波形数据。

可选的，根据由第二波形数据生成第三声音波形数据的方法，将第三声音波形数据生成第四波形数据，将第四波形数据生成第五波形数据。

可选的，包括：根据缩放的级别，显示对应的声音波形数据。

可选的，将第二声音波形数据传输至第一设备；

将第二声音波形数据作为第一声音波形数据显示；

根据第一设备上对第二声音波形数据的编辑对应的在第二设备上编辑第一声音波形数据；

其中第一声音波形数据存储于第二设备上。

可选的，根据不同采样率第一音频波形数据，分别形成第二音频数据，混合编辑这两个第二音频数据。

第三方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上任一所述方法的步骤。

第四方面，本发明提供一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上执行的计算机程序，所述处理器执行所述程序时实现如上任一所述方法的步骤。

由上述技术方案可知，上述方法将第一声音波形数据压缩为第二声音波形数据，减少了显示和编辑第一声音波形数据时需要解析的数据量，从而加快了对声音波形数据的处理。

前面是提供对本发明一些方面的理解的简要发明内容。这个部分既不是本发明及其各种实施例的详尽表述也不是穷举的表述。它既不用于识别本发明的重要或关键特征也不限定本发明的范围，而是以一种简化形式给出本发明的所选原理，作为对下面给出的更具体的描述的简介。应当理解，单独地或者组合地利用上面阐述或下面具体描述的一个或多个特征，本发明的其它实施例也是可能的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的一个实施例中执行方法流程的示意图。

具体实施方式

下面将结合示例性的实施例描述本发明。

如图所示，在一个实施例中，音频缩混及波形生成方法，包括：

s101、获取第一声音波形数据，将第一音频波形数据根据预设的时间段连续切分为片段；

s102、获取每一片段的最大值a；

s103、将所有的最大值a按照片段的顺序形成第二声音波形数据。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

声音就是振动。当声音改变了鼓膜上空气的压力时，我们就感觉到了声音。麦克风可以感应这些振动，并且将它们转换为电流。同样，电流再经过放大器和扩音器，就又变成了声音。传统上，声音以模拟方式储存(例如录音磁带和唱片)，这些振动储存在磁气脉冲或者轮廓凹槽中。当声音转换为电流时，就可以用随时间振动的波形来表示。振动最自然的形式可以用正弦波表示。正弦波有两个参数－振幅(也就是一个周期中的最大振幅)和频率。

利用脉冲编码调制，声音波形可以按固定的周期频率取样，其频率通常是每秒几万次。对于每个样本都测量其波形的振幅。完成将振幅转换成数字信号工作的硬件是模拟数字转换器(adc：analog-to-digitalconverter)。声音波形数据是指由模拟数字转换器录制声音波形形成的数据，录制时常采用固定的采样率录制声音波形。脉冲编码调制有两个参数：取样频率，即每秒内测量波形振幅的次数；声音cd中使用的取样频率是每秒44,100个样本，或者称为44.1khz

所述预设的时间段的长度对应切分后的片段的长度。可以理解的是预设的时间段长度与取样频率并无关系，预设的时间段的长度越长，第二声音波形数据就越小于第一声音波形数据的大小。

本实施例中的切分并非指物理上的切分，而是虚拟的切分片段，例如在程序运行过程中读取预设时间段的声音波形数据可以作为切分片段和获得片段的具体实施方式。

在每一个片段中获取该片段中声音波形数据的信号最大值a，将所有的最大值a按照片段在第一声音波形数据中的顺序，将所有的最大值a形成第二声音波形数据，可以理解的是第二声音波形数据相当于在时间轴方向上压缩的第一声音波形数据。可以理解的是，这里的声音波形数据的信号最大值a，指的是该片段对应的波形的振幅的最大值。

上述方法将第一声音波形数据压缩为第二声音波形数据，减少了显示和编辑第一声音波形数据时需要解析的数据量，从而加快了对声音波形数据的处理。

所述将所有的最大值按照片段的顺序形成第二声音波形数据之后，包括：

将第二声音波形数据作为第一声音波形数据显示；

根据对第二声音波形数据的编辑对应的编辑第一声音波形数据。

所述预设的时间段为144个采样点。即在144个采样点中选取对应的波形的振幅的最大值。所述144个采样点与波形数据的采样频率并无关，即任何采样频率的声音波形数据，均可以以144个采样点作为片段的长度。还包括：

将第二声音波形数据根据预设的时间段连续切分为片段；

获取每一片段的最大值b；

将所有的最大值b按照片段的顺序形成第三声音波形数据。

上述最大值b与最大值a一样，指的是片段对应的波形的振幅的最大值。第三声音波形数据是对第二声音波形数据的进一步压缩，其压缩方式与第二声音波形数据的压缩方式的原理是一样的，但压缩比可以是不一样的，即在获得第三声音波形数据时所述的预设的时间段是8个采样点，而获得第二声音波形数据所述的预设的时间段是144个采样点。第一缩放级别和第二缩放级别分别与第二声音波形数据或第三声音波形数据对应。即在接收到第一缩放级别指令时，显示第二声音波形数据，在收到第二缩放级别指令时，显示第三声音波形数据。

上述第二声音波形数据和第三声音波形数据可以是存储于缓存中，在需要显示对应缩放级别的声音波形数据时，从缓存直接读取数据用于波形显示，以提高显示效率，达到显示画面快速缩放。在上述方法中，由多级缩放对应多级声音波形数据，克服了现有技术中只有一个声音波形数据，在缩放时只能过度拉伸这仅有的一个声音波形数据而导致波形在放大到一定程度后波形显示不够准确，会成长条形块状显示的问题。本方法中缩放可以精确到样点级，粒度更细，显示更清晰准确。根据由第二波形数据生成第三声音波形数据的方法，将第三声音波形数据生成第四波形数据，将第四声音波形数据生成第五声音波形数据。

本文中声音文件可以是存在于缓存中，指的是声音波形数据可以是存储于缓存中，也可以是存储于其他存储设备上，例如存储在磁盘上。

相比于构建较少缩放级别波形数据缓存，构建越多级的波形数据更有利于更细化的显示和编辑。上述第一到第五声音波形数据存储于缓存中，在需要显示对应缩放级别的声音波形数据时，从缓存直接读取数据用于波形显示，以提高显示效率，达到显示画面快速缩放。

包括：根据缩放的级别，显示对应的声音波形数据。

将第二声音波形数据传输至第一设备；

将第二声音波形数据作为第一声音波形数据显示；

根据第一设备上对第二声音波形数据的编辑对应的在第二设备上编辑第一声音波形数据；

其中第一声音波形数据存储于第二设备上。

由于第二声音波形数据的数据量大小小于第一声音波形数据，且第二声音波形数据对应第一声音波形数据，因此可以脱离第一声音波形数据单独进行波形显示、编辑第二声音波形数据，从而在网络编辑时我们只需要传递第二声音波形数据而不需要第一声音波形数据，这样大大减少文件传输内容，提高传输效率。

在网络编辑声音波形数据时，第一设备与第二设备不是同一设备。本文的网络编辑指的是，通过网络远程编辑，可以是通过网页远程编辑，也可以是通过自主开发的应用程序远程操作声音波形数据。

在一些实施例中，第一声音波形数据也称为原始文件，第二声音波形数据称为一级能量文件，第三声音波形数据称为二级能量文件。在通过互联网在线编辑第一声音波形数据时，可以通过与显示于网页上的能量文件进行交互，从而在服务器上对应的编辑原始文件。这样只需要传递能量文件，而不需要原始音频文件，大大减少了文件传输量，减少了用户操作之后的等待时间，提高了在线编辑声音波形数据的用户体验。

根据不同采样率第一声音波形数据，分别形成第二声音波形数据，混合编辑这两个第二声音波形数据。上述方法不需要将两个采样率不同的声音波形数据转换为采用频率一样的声音波形数据，才能混合编辑这两个声音波形数据。混合编辑不限于包括对声音波形文件进行裁剪并对结尾部分施加淡出效果，或增大原音乐音量，允许将其和其他音乐进行混音处理等。

一种计算机可读存储介质，其上存储有计算机程序该程序被处理器执行时实现如上任一所述方法的步骤。

一种计算机设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上执行的计算机程序，所述处理器执行所述程序时实现如上任一所述方法的步骤。

本文中使用的“监视”包括与用仪器来观察、记录或检测有关的任何类型的功能，这些仪器对被监视的元件或元件组的操作或状态没有任何影响。

本文中使用的“至少一个”、“一个或多个”以及“和/或”是开放式的表述，在使用时可以是联合的和分离的。例如，“a、b和c中的至少一个”，“a、b或c中的至少一个”，“a、b和c中的一个或多个”以及“a、b或c中的一个或多个”指仅有a、仅有b、仅有c、a和b一起、a和c一起、b和c一起或a、b和c一起。

术语“一个”实体是指一个或多个所述实体。由此术语“一个”、“一个或多个”和“至少一个”在本文中是可以互换使用的。还应注意到术语“包括”、“包含”和“具有”也是可以互换使用的。

本文中使用的术语“自动的”及其变型是指在执行处理或操作时没有实质的人为输入的情况下完成的任何处理或操作。然而，即使在执行处理或操作时使用了执行所述处理或操作前接收到的实质的或非实质的人为输入，所述处理或操作也可以是自动的。如果输入影响所述处理或操作将怎样进行，则视该人为输入是实质的。不影响所述处理或操作进行的人为输入不视为是实质的。

本文中使用的术语“计算机可读介质”是指参与将指令提供给处理器执行的任何有形存储设备和/或传输介质。计算机可读介质可以是在ip网络上的网络传输(如soap)中编码的串行指令集。这样的介质可以采取很多形式，包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如nvram或者磁或光盘。易失性介质包括诸如主存储器的动态存储器(如ram)。计算机可读介质的常见形式包括例如软盘、柔性盘、硬盘、磁带或任何其它磁介质、磁光介质、cd-rom、任何其它光介质、穿孔卡、纸带、任何其它具有孔形图案的物理介质、ram、prom、eprom、flash-eprom、诸如存储卡的固态介质、任何其它存储芯片或磁带盒、后面描述的载波、或计算机可以读取的任何其它介质。电子邮件的数字文件附件或其它自含信息档案或档案集被认为是相当于有形存储介质的分发介质。当计算机可读介质被配置为数据库时，应该理解该数据库可以是任何类型的数据库，例如关系数据库、层级数据库、面向对象的数据库等等。相应地，认为本发明包括有形存储介质或分发介质和现有技术公知的等同物以及未来开发的介质，在这些介质中存储本发明的软件实施。

本文中使用的术语“确定”、“运算”和“计算”及其变型可以互换使用，并且包括任何类型的方法、处理、数学运算或技术。更具体地，这样的术语可以包括诸如bpel的解释规则或规则语言，其中逻辑不是硬编码的而是在可以被读、解释、编译和执行的规则文件中表示。

本文中使用的术语“模块”或“工具”是指任何已知的或以后发展的硬件、软件、固件、人工智能、模糊逻辑或能够执行与该元件相关的功能的硬件和软件的组合。另外，虽然用示例性实施方式来描述本发明，但应当理解本发明的各方面可以单独要求保护。

术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括……”或“包含……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外，在本文中，“大于”、“小于”、“超过”等理解为不包括本数；“以上”、“以下”、“以内”等理解为包括本数。

尽管已经对上述各实施例进行了描述，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改，所以以上所述仅为本发明的实施例，并非因此限制本发明的专利保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周南;刘旭川;吕宁;李龙刚
技术所有人：北京英夫美迪科技股份有限公司
我是此专利的发明人

上一篇：一种能协调刀具磨损的五金产品精准冲孔机的制作方法
上一篇：一种铜排专用加工机的制作方法