一种音频处理方法及装置的制造方法

文档序号：9549001阅读：494来源：国知局

一种音频处理方法及装置的制造方法
【技术领域】
[0001]本发明属于音频处理技术领域，尤其涉及一种音频处理方法及装置。
【背景技术】
[0002]现在技术在对音频数据进行快读和慢读处理时，是将整段音频数据平均作拖长或变短处理，会造成音频声音变形和失真。
[0003]另外，英语连读是地道口语的常见现象，用户通常遇到有两个问题:1)连读时，听不出是由哪几个单词组成的；2)当语音逐个读时，不知道如何用连读的方式，更地道地说出来。
[0004]在英语音频中，遇到连读的句子，即使放慢整段音频的速度，用户还是无法听清楚。例如:原音频为“pu'ti'ton”,现有的变慢方式是“pu…ti…ton”,而用户还是无法知道，这是“put it on”的连读方式。另外，遇到可连读的句子而没有连读时，就算加快了音频的速度，用户还是无法听到地道的连读音频。

【发明内容】

[0005]本发明实施例在于提供一种音频处理方法及装置，以实现对音频的慢读、快读、连读及分读处理。
[0006]本发明实施例是这样实现的，一种音频处理方法，所述方法包括:
[0007]获取音频数据；
[0008]在接收到用户对所述音频数据的操作指令后，根据所述操作指令对所述音频数据进行相应处理后播放；
[0009]其中，所述操作指令包括用于指示分读、慢读、连读或快读的指令。
[0010]本发明实施例的另一目的在于提供一种音频处理装置，所述装置包括:
[0011]音频获取单元，用于获取音频数据；
[0012]音频处理单元，用于在接收到用户对所述音频数据的操作指令后，根据所述操作指令对所述音频数据进行相应处理后播放；
[0013]其中，所述操作指令包括用于指示分读、慢读、连读或快读的指令。
[0014]本发明实施例与现有技术相比存在的有益效果是:本发明实施例可以根据用户发出的操作指令，实现对音频的分读、慢读、连读或快读处理，操作方便、快捷。而且，本发明实施例实现简单，不需要增加额外的硬件，可有效节省产品成本，具有较强的易用性和实用性。
【附图说明】
[0015]为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0016]图1是本发明第一实施例提供的音频处理方法的实现流程图；
[0017]图2是本发明第二实施例提供的音频处理装置的组成结构图。
【具体实施方式】
[0018]为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0019]为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。
[0020]实施例一:
[0021]图1示出了本发明实施例一提供的音频处理方法的实现流程，该方法过程详述如下:
[0022]在步骤S101中，获取音频数据。
[0023]在本实施例中，获取的音频数据可以是终端设备预先存储的音频数据或者终端设备通过音频输入装置或者音频输入接口采集的音频数据。其中，所述音频输入装置包括但不限于麦克风，所述音频输入接口包括但不限于DVD、⑶、USB、蓝牙、WIFI以及3G等接口。
[0024]较佳的，本实施例在获取音频数据之后，还包括:
[0025]将所述音频数据转换成文本文件(示例性的，可以通过音频相似度比较从预设数据库中获取与所述音频数据相对应的文本文件，所述数据库中预先存储有多份音频数据以及与所述音频数据对应的文本文件)，并显示所述文本文件的内容，以便于用户根据显示的所述文本文件的内容发出相应的操作指令。
[0026]其中，所述操作指令包括但不限于用于指示分读、慢读、连读或快读的指令。
[0027]进一步的，本实施例所述操作指令还包括对显示的所述文本文件的内容进行选择的指令，即用户可先选择所述文本文件中全部或部分的内容，再对选择的所述内容进行分读、慢读、连读或快读等操作。
[0028]在步骤S102中，在接收到用户对所述音频数据的操作指令后，根据所述操作指令对所述音频数据进行相应处理后播放。
[0029]在本实施例中,所述操作指令包括但不限于用于指示分读、慢读、连读或快读的指令。
[0030]示例性的，当所述音频数据中包含由多个英文单词组成的句子；
[0031]所述在接收到用户对所述音频数据的操作指令后，根据所述操作指令对所述音频数据进行相应处理后播放包括:
[0032]在接收到用户发出的用于指示慢读的指令后，将所述音频数据中英文单词的播放速度设置为^，且将英文单词间的停顿时间设置为！\后播放，其中Vl= ν。(即保持所述音频数据处理前后英文单词的播放速度不变)，?\ = Τ0+ΔΤ(即增加英文单词间的停顿时间)，ν。表示在接收到所述用于指示慢读的指令前英文单词的播放速度，Τ。表示在接收到所述用于指示慢读的指令前英文单词间的停顿时间，ΛΤ表示增加的停顿时间，ΛΤ为预先设定的第一常数；
[0033]在接收到用户发出的用于指示快读的指令后，将所述音频数据中英文单词的播放速度设置为v2，且将英文单词间的停顿时间设置为1后播放，其中V2= V。(即保持所述音频数据处理前后英文单词的播放速度不变)，τ2 = Το-ΔΤ'(即减少英文单词间的停顿时间)，ν 表示在接收到所述用于指示快读的指令前英文单词的播放速度，T0表示在接收到所述用于指示快读的指令前英文单词间的停顿时间，ΛΤ表示减少的停顿时间，ΛΤ’为预先设定的第二常数。
[0034]本发明实施例与现有技术相比，在进行慢读或快读处理时，保持音频数据处理前后英文单词的播放速度不变，只增加或减少英文单词间的停顿时间，从而不会改变音频的音质，有效避免现有技术将整段音频数据平均作拖长或变短处理，造成音频声音变形和失真的问题。
[0035]进一步的，所述在接收到用户对所述音频数据的操作指令后，根据所述操作指令对所述音频数据进行相应处理后播放还包括:
[0036]在接收到用户发出的用于指示分读的指令后，判断所述音频数据中是否存在连读的句子，若是，对所述连读的句子进行分读处理，并播放分读处理后的句子，同时显示分读标记；
[0037]在接收到用户发出的用于指示连读的指令后，判断所述音频数据中是否存在可连读但未连读的句子，若是，对所述可连读但未连读的句子进行连读处理，并播放连读处理后的句子，同时显示连读标记。
[0038]需要说明的是，连读的判断可采用现有技术实现，即在连读时相邻的两词须同属一个意群，连读所构成的音节不重读。
[0039]示例性的，所述对所述连读的句子进行分读处理，并播放分读处理后的句子，同时显示分读标记包括:
[0040]从预设数据库中获取与所述连读的句子相对应的内容，所述相对应的内容包括该句子(即与所述连读的句子包含相同英文单词的句子)分读的内容以及该句子分读的标记，并播放获取的所述分读的内容，显示所述分读的标记；
[0041]示例性的，所述对所述可连读但未连读的句子进行连读处理，并播放连读处理后的句子，同时显示连读标记包括:
[0042]从预设数据库中获取与所述可连读但未连读的句子相对应

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：简文杰;
技术所有人：广东小天才科技有限公司;
我是此专利的发明人

上一篇：一种新型灭蚊数码相框的制作方法
上一篇：通过侦测人体动作频率来实现与其匹配音乐播放的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。