一种音频文件处理方法及移动终端与流程

文档序号：11155555阅读：249来源：国知局

本发明涉及音频文件处理技术领域，尤其涉及一种音频文件处理方法及移动终端。

背景技术：

随着社会的不断发展，人们每天接触到的信息也越来越多，目前很多信息都是以语音的形式传达，用户可以通过播放音频文件获取信息。音频文件支持用户用耳朵获取信息，可以解放用户的双眼，对视力保护有一定的帮助。

当移动终端上存在多个音频文件时，用户需要逐个点开音频文件并播放一段时间才能找到自己想要查找的那个音频文件，耗时较长。当然，用户也可以通过音频文件的一些特征(例如语音时长或者文件命名)去查找需要的音频文件，然而，对于语音时长相同的音频文件，用户无法区分，并且语音时长给用户的记忆造成一定的困扰；此外，对于通过文件名查找的方式，用户需要预先设置每个音频文件的文件名，操作比较繁琐。可见，现有技术中音频文件不方便用户查找，影响用户体验。

技术实现要素：

本发明实施例提供一种音频文件处理方法及移动终端，以解决现有技术中音频文件不方便用户查找，影响用户体验的问题。

第一方面，本发明实施例提供了一种音频文件处理方法，所述方法包括：

识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容；

将所述目标文字内容添加到所述目标音频文件的文件名中。

第二方面，本发明实施例还提供一种移动终端，所述移动终端包括：

确定模块，用于识别目标音频中的语音，并确定与所述目标音频文件对应的目标文字内容；

添加模块，用于将所述目标文字内容添加到所述目标音频文件的文件名中。

在本发明实施例中，所述音频文件处理方法识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容；将所述目标文字内容添加到所述目标音频文件的文件名中。这样，本发明提供的音频文件处理方法及移动终端能够根据目标音频文件中的语音确定对应的目标文字内容，并将所述目标文字内容添加到所述目标音频文件的文件名中，用户可以根据所述目标文字内容查找所述目标音频文件，提高了用户查找音频文件的效率，增强了用户体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种音频文件处理方法的流程图；

图2是本发明第二实施例提供的另一种音频文件处理方法的流程图；

图3是本发明第三实施例提供的另一种音频文件处理方法的流程图；

图4是本发明第四实施例提供的一种移动终端的结构图；

图5是本发明第四实施例提供的另一种移动终端的结构图；

图6是本发明第四实施例提供的另一种移动终端的结构图；

图7是本发明第四实施例提供的另一种移动终端的结构图；

图8是本发明第四实施例提供的一种第二转换单元的结构图；

图9是本发明第五实施例提供的另一种移动终端的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

第一实施例

参见图1，图1是本发明实施例提供的一种音频文件处理方法的流程图，所述方法应用于一移动终端中，如图1所示，所述音频文件处理方法包括：

步骤101、识别目标音频文件中的语音，并确定与所述目标语音文件对应的目标文字内容。

该步骤中，所述音频文件处理方法对目标音频文件进行语音识别，并根据识别结果确定与所述目标语音对应的目标文字内容。所述目标音频文件可以是包括声音的多媒体文件，也可以是仅仅包括声音的文件，还可以是社交软件中的语音消息，需要说明的是，在本发明的实施例中，对所述目标音频文件的类型不做限定。

所述音频文件处理方法可以识别所述目标音频文件中的所有语音，然后将所述目标音频文件中的所有语音转换成第一文字内容。所述音频文件处理方法可以确定所述第一文字内容为所述目标文字内容，也可以确定所述第一文字内容中的第一关键词为所述目标文字内容。

所述音频文件还可以识别所述目标音频文件中的目标音频段，然后将所述音频段内的语音转换成第二文字内容。所述音频文件处理方法可以确定所述第二文字内容为所述目标文字内容，也可以确定所述第二文字内容中的第二关键词为所述目标文字内容。

步骤102、将所述目标文字内容添加到所述目标音频文件的文件名中。

该步骤中，所述音频文件处理方法将所述目标文字内容添加到所述目标音频文件的文件名中，这样，用户可以根据所述目标文件内容查找所述目标音频文件。

所述音频文件处理方法可以删除所述目标音频文件的原文件名，并将所述目标文字内容作为所述目标音频文件的新文件名；也可以不删除所述目标音频文件的原文件名，而是在所述目标文字内容与原文件名组合形成新的文件名，所述组合方式可以是所述目标文字内容在所述原文件名之前，也可以在所述原文件名之后，还可以穿插在所述原文件名的中间，在此不做限定。

可选地，所述将所述目标文字内容添加到所述目标音频文件的文件名中，包括：

将所述目标文字内容作为所述目标音频文件的新文件名；或者

将所述目标文字内容与原文件名进行组合作为所述目标音频文件的新文件名。

该实施例中，所述音频文件处理方法删除所述目标音频文件的原文件名，并将所述目标文字内容作为所述目标音频文件的新文件名；或者不删除所述目标音频文件的原文件名，而是在所述目标文字内容与原文件名组合形成新的文件名。需要说明的是，所述组合方式可以是所述目标文字内容在所述原文件名之前，也可以在所述原文件名之后，还可以穿插在所述原文件名的中间，在此不做限定。

举例而言，对于原文件名为“A”的目标音频文件，所述音频文件处理方法可以在确定其目标文字内容为“考试”之后，将所述目标文字内容“考试”替代原文件名“A”，即将所述目标音频文件的文件名更新为所述目标文字内容“考试”。可以理解的是，所述音频文件处理方法也可以将所述目标文字内容“考试”与所述原文件名“A”组合之后作为所述目标音频文件的新文件名，例如将所述目标文件的文件名更新为“考试A”或者“A考试”。

本发明实施例中，上述移动终端可以是任何具备拍摄功能的移动终端，例如：手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)、个人数字助理(personal digital assistant，简称PDA)、移动上网装置(Mobile Internet Device，MID)或可穿戴式设备(Wearable Device)等。

本发明第一实施例的音频文件处理方法，识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容；将所述目标文字内容添加到所述目标音频文件的文件名中。这样，用户可以根据所述目标文字内容查找所述目标音频文件，本实施例提供的音频文件处理方法方便用户快速准确地查找音频文件，提高了用户查找音频文件的效率，增强了用户体验。

第二实施例

参见图2，图2是本发明第二实施例提供的另一种音频文件处理方法的流程图，如图2所示，所述音频文件处理方法包括：

步骤201、将目标音频文件中的全部语音转换成第一文字内容。

该步骤中，所述音频文件处理方法识别所述目标音频文件中的全部语音，并将所述目标音频文件中的全部语音转换成第一文字内容。所述识别语音并将语音转换成文字属于现有技术范畴，在此不再赘述。

步骤202、根据第一预设规则确定所述第一文字内容中的第一关键词为目标文字内容。

在本实施例中，所述音频文件处理方法根据第一预设规则确定所述第一文字内容的第一关键词为目标文字内容，所述第一预设规则可以是词语出现的频率，所述第一关键词可以是一个关键词，也可以是多个关键词，在此不做限定。例如，所述音频文件处理方法可以确定所述第一文字内容中出现次数最多的一或多个词语为所述第一关键词，或者可以确定所述第一文字内容中出现次数大于预设次数的一或多个词语为所述第一关键词。这样，当所述目标音频文件内容较长时，通过确定关键词为目标文字内容的方法能够占用较少的空间。

步骤203、将所述目标文字内容添加到所述目标音频文件的文件名中。

该步骤203与本发明第一实施例中的步骤102相同，在此不再赘述。

本发明第二实施例中，所述音频文件处理方法将目标音频文件中的全部语音转换成第一文字内容；确定所述第一文字内容为目标文字内容，或者根据所述第一预设规则确定所述第一文字内容中的第一关键词为目标文字内容；将所述目标文字内容添加到所述目标音频文件的文件名中。这样，用户可以根据所述目标文字内容查找所述目标音频文件，本实施例提供的音频文件处理方法方便用户快速准确地查找音频文件，提高了用户查找音频文件的效率，增强了用户体验。

参见图3，图3是本发明第三实施例提供的另一种音频文件处理方法的流程图，如图3所示，所述音频文件处理方法包括：

步骤301、识别目标音频文件中目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容。

该步骤中，所述音频文件处理方法获取所述目标音频文件中的目标音频段，识别所述目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容。

该实施例中，所述目标音频段可以是预设时长，也可以是随机时长。所述音频文件处理方法可以根据预设规则从所述目标音频文件中获取预设时长的音频段作为目标音频段，也可以随机从所述目标音频文件中获取预设时长的音频段作为所述目标音频段。

需要说明的是，当所述目标音频段内没有语音时，所述音频文件处理方法会从所述目标音频文件重新获取目标音频段并识别语音，例如可以预设时长的另一音频段，也可以通过调整时长获取音频段，在此不做限定，直至识别出目标音频段内的语音。

步骤302、确定所述第二文字内容为目标文字内容，或者根据第二预设规则确定所述第二文字内容中的第二关键词为目标文字内容。

在本实施例中，所述音频文件处理方法可以确定所述第二文字内容为目标文字内容，也可以第二预设规则确定所述第二文字内容的第二关键词为目标文字内容。所述第二预设规则可以与本发明第二实施例中的第一预设规则相同，也可以与所述第一预设规则不同，在此不做限定。同样地，所述第二关键词可以是一个关键词，也可以是多个关键词。

步骤303、将所述目标文字内容添加到所述目标音频文件的文件名中。

该步骤303与本发明第一实施例中的步骤102相同，在此不再赘述。

可选地，所述识别所述目标音频文件中目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容，包括：

识别所述目标音频文件中的第一目标音频段，并判断所述第一目标音频段内是否包括语音；

若所述第一目标音频段内包括语音，将所述第一目标音频段内的语音转换成第二文字内容；

若所述第一目标音频段内不包括语音，识别所述目标音频文件中的第二目标音频段，并将所述第二目标音频段内的语音转换成第二文字内容。

该实施例中，所述音频文件处理方法先识别所述目标音频文件中的第一目标音频段(例如0～a时长的音频段，a表示时间)，并判断所述第一目标音频段内是否包括语音，若所述第一目标音频段内包括语音，将所述第一目标音频段内的语音转换成第二文字内容。相反地，若所述第一目标音频段内不包括语音，所述音频文件处理方法识别所述目标音频文件中的第二目标音频段(例如a～2a时长的音频段或者0～2a时长的音频段)中的语音，并将所述第二目标音频段内的语音转换成第二文字内容。可以理解的是，若所述第二目标音频段内不包括语音，所述音频文件处理方法可以再次调整所述目标音频段(例如2a～3a)，直到识别出目标音频段内的语音。

本发明第三实施例，所述音频文件处理方法识别目标音频文件中目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容；确定所述第二文字内容为目标文字内容，或者根据第二预设规则确定所述第二文字内容中的第二关键词为目标文字内容；将所述目标文字内容添加到所述目标音频文件的文件名中。这样，用户可以根据所述目标文字内容查找所述目标音频文件，本实施例提供的音频文件处理方法方便用户快速准确地查找音频文件，提高了用户查找音频文件的效率，增强了用户体验。

第四实施例

参见图4，是本发明第四实施例提供的一种移动终端的结构图，如图4所示，所述移动终端400包括：

确定模块401，用于识别目标音频中的语音，并确定与所述目标音频文件对应的目标文字内容；

添加模块402，用于将所述目标文字内容添加到所述目标音频文件的文件名中。

可选地，参见图5，图5是本发明第四实施例提供的另一种移动终端的结构图，如图5所示，所述确定模块401包括：

第一转换单元4011，用于将所述目标音频文件中的全部语音转换成第一文字内容；

第一确定单元4012，用于根据第一预设规则确定所述第一文字内容中的第一关键词为所述目标文字内容。

可选地，参见图6，图6是本发明第四实施例提供的另一种移动终端的结构图，如图6所示，所述确定模块401包括：

第二转换单元4013，用于识别所述目标音频文件中目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容；

第二确定单元4014，用于确定所述第二文字内容为所述目标文字内容；或者

参见图7，图7是本发明第四实施例提供的另一种移动终端的结构图，如图7所示，所述确定模块401可以包括：第三确定单元4015，用于根据第二预设规则确定所述第二文字内容中的第二关键字为所述目标文字内容。

可选地，参见图8，图8是本发明第四实施例提供的一种第二转换单元4013的结构图，如图8所示，所述第二转换单元4013包括：

判断子单元40131，用于识别所述目标音频文件中的第一目标音频段，并判断所述第一目标音频段内是否包括语音；

第一转换子单元40132，用于若所述第一目标音频段内包括语音，将所述第一目标音频段内的语音转换成第二文字内容；

第二转换子单元40133，用于若所述第一目标音频段内不包括语音，识别所述目标音频中的第二目标音频段，并将所述第二目标音频段内的语音转换成第二文字内容。

可选地，所述添加模块402用于：

将所述目标文字内容作为所述目标音频文件的新文件名；或者

将所述目标文字内容与原文件名进行组合作为所述目标音频文件的新文件名。

移动终端400能够实现图1至图3的方法实施例中移动终端实现的各个过程，为避免重复，在此不再赘述。

第五实施例

参见图9，图9是本发明提供的另一种移动终端900的结构示意图，如图9所示，移动终端900包括：至少一个处理器901、存储器902、至少一个用户接口903及网络接口904。移动终端900中的各个组件通过总线系统905耦合在一起、可以理解的是，总线系统905用于实现这些组件之间的连接通信。总线系统905除包括数据线之外，还包括电源总线、控制总线及状态信号总线。但是为了清楚说明起见，在图9中将各种总线都标为总线系统905。

其中，用户接口903可以包括显示器、键盘或者点击设备，例如鼠标，轨迹球(trackball)、触感板或者触摸屏等。

可以理解，本发明实施例中的存储器902可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本文描述的系统和方法的存储器902旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中，存储器902存储了如下的元素，可执行模块或者数据结构，或者他们的子集，或者他们的扩展集：操作系统9021和应用程序9022。

其中，操作系统9021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序9022，包含各种应用程序，例如媒体播放器(Media Player)、浏览器(Browser)等，用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序9022中。

在本发明实施例中，通过调用存储器902存储的程序或指令，具体的，可以是应用程序9022中存储的程序或指令，处理器901用于：

识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容；

将所述目标文字内容添加到所述目标音频文件的文件名中。

上述本发明实施例揭示的方法可以应用于处理器901中，或者由处理器901实现。处理器901可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器901中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器901可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器902，处理器901读取存储器902中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

可选地，所述处理器901识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容，包括：

将所述目标音频文件中的全部语音转换成第一文字内容；

根据第一预设规则确定所述第一文字内容中的第一关键词为所述目标文字内容。

可选地，所述处理器901识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容，包括：

识别所述目标音频文件中目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容；

确定所述第二文字内容为所述目标文字内容；或者

根据第二预设规则确定所述第二文字内容中的第二关键字为所述目标文字内容。

所述处理器901识别所述目标音频文件中目标音频段内的语音，并将所述目标音频段内的语音转换成第二文字内容，包括：

识别所述目标音频文件中的第一目标音频段，并判断所述第一目标音频段内是否包括语音；

若所述第一目标音频段内包括语音，将所述第一目标音频段内的语音转换成第二文字内容；

若所述第一目标音频段内不包括语音，识别所述目标音频文件中的第二目标音频段，并将所述第二目标音频段内的语音转换成第二文字内容。

可选地，所述将所述目标文字内容添加到所述目标音频文件的文件名中，包括：

将所述目标文字内容作为所述目标音频文件的新文件名；或者

将所述目标文字内容与原文件名进行组合作为所述目标音频文件的新文件名。

移动终端900能够实现前述实施例中移动终端900实现的各个过程，为避免重复，这里不再赘述。

本发明实施例的移动终端900，识别目标音频文件中的语音，并确定与所述目标音频文件对应的目标文字内容；将所述目标文字内容与所述目标音频文件关联。这样，用户可以根据所述目标文字内容查找所述目标音频文件，本实施例提供的音频文件处理方法方便用户快速准确地查找音频文件，提高了用户查找音频文件的效率，增强了用户体验。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐俊坤;
技术所有人：维沃移动通信有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。