一种实现音频处理的方法及装置与流程

文档序号:11136016阅读:211来源:国知局
一种实现音频处理的方法及装置与制造工艺

本文涉及但不限于音频技术,尤指一种实现音频处理的方法及装置。



背景技术:

音频文件是日常生活中比较常见的文件,人们通过音频文件记录信息、文艺欣赏、知识讲解、娱乐活动等;其中,在工作环境中,例如、多参与者发言的会议(包括、辩论)场合,为了防止要点遗漏、以及方便后期对会议的内容进行回顾,一般需要对会议内容进行音频录制;在娱乐环境中,例如、以组合形式参与的音乐竞赛,一个组合中的多个参赛者为了掌握自身技能的不足,在练习时,一般会对排练过程进行音频录制;一份知识讲解的音频文件中,不同参与者根据自身学识发表不同的见解;另外,日常生活中还存在包含多参与者的音频文件,音频文件中不同参与者表达各自对同一主题的不同见解。

目前,如果是会议录制的音频文件,一般将一个时间段的会议内容存储为一个音频文件;例如、每一次会间休息时,将会间休息之前的会议内容录制为一份音频文件;如果是音乐竞赛录制的音频文件,一般将一次排练的过程录制为一份音频文件;如果是根据主题录制好的音频文件,则一般根据主题的定义及时长,生成一个或一个以上音频文件。

一份音频文件中包含多个参与者的音频信息,如果需要获得其中一个参与者的音频信息时,需要听取整份音频文件,如果一个参与者参与的内容存在于多份音频文件,则需要将多份音频文件都听一遍,费时且效率低。



技术实现要素:

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供一种实现音频处理的方法及装置,能够提高对音频文件的查看效率。

本发明实施例提供了一种实现音频处理的装置,包括:区分单元和存储单元;其中,

所述区分单元用于,获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;

所述存储单元用于,将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。

可选的,所述区分信息包括:硬件区分标识、声纹特征、音频信息的输入方向;

所述区分单元具体用于:

所述区分信息包括硬件区分标识时,预先设置每一个用于输入所述音频信息的硬件相对应的硬件区分标识,并在所述音频文件中添加所述硬件区分标识;根据所述硬件区分标识区分音频文件中每一个参与者输入的所述音频信息;

所述区分信息包括声纹特征时,提取所述音频文件中音频信息的声纹特征,将提取的声纹特征与预先存储的每一个参与者的声纹特征进行匹配;根据声纹特征的匹配结果区分每一个参与者的音频信息;

所述区分信息包括音频信息的输入方向时,确定所述音频文件包含的所述音频信息的输入方向;根据输入方向的不同区分每一个参与者输入的音频信息。

可选的,所述存储单元具体用于:

将区分的每一个参与者的音频信息添加区分标记信息后,分别存储为包含区分标记信息的对应于参与者的参与者音频文件;

所述区分标记信息包括以下任意信息的组合:区分名称、区分编码。

可选的,所述存储单元还用于:

将从所述音频文件中区分并存储的对应于参与者的参与者音频文件分别存储在对应的预设文件夹中;或,

将从所述音频文件中区分并存储的对应于参与者的参与者音频文件通过预设的区分目录进行存储。

可选的,所述装置还包括添加单元,用于在区分的每一个参与者的音频信息中添加时间信息。

另一方面,本发明实施例还提供一种实现音频处理的方法,包括:

获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;

将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。

可选的,所述区分信息包括:硬件区分标识、声纹特征、音频信息的输入方向;

所述区分信息包括硬件区分标识时,所述区分不同参与者的音频信息包括:

预先设置每一个用于输入所述音频信息的硬件相对应的硬件区分标识,并在所述音频文件中添加所述硬件区分标识,根据所述硬件区分标识区分音频文件中每一个参与者输入的所述音频信息;

所述区分信息包括声纹特征时,所述区分不同参与者的音频信息包括:

提取所述音频文件中音频信息的声纹特征,将提取的声纹特征与预先存储的每一个参与者的声纹特征进行匹配,根据声纹特征的匹配结果区分每一个参与者的音频信息;

所述区分信息包括音频信息的输入方向时,所述区分不同参与者的音频信息包括:

确定所述音频文件包含的所述音频信息的输入方向,根据输入方向的不同区分每一个参与者输入的音频信息。

可选的,所述按照参与者的不同分别存储为对应于参与者的参与者音频文件包括:

将区分的每一个参与者的音频信息添加区分标记信息后,分别存储为包含区分标记信息的对应于参与者的参与者音频文件;

所述区分标记信息包括以下任意信息的组合:区分名称、区分编码。

可选的,所述方法还包括:

将从所述音频文件中区分并存储的对应于参与者的参与者音频文件分别存储在对应的预设文件夹中;或,

将从所述音频文件中区分并存储的对应于参与者的参与者音频文件通过预设的区分目录进行存储。

可选的,所述方法还包括:在区分的每一个参与者的音频信息中添加时间信息。

与相关技术相比,本申请技术方案包括:获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。本发明实施例,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的音频信息进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,节省了查看音频文件的时间,提高了对音频文件的查看效率。在阅读并理解了附图和详细描述后,可以明白其他方面。

附图说明

图1为实现本发明各个实施例的移动终端的硬件结构示意图;

图2为本发明实施例实现音频处理的方法的流程图;

图3为本发明实施例基于硬件区分标识区分音频信息的场景示意图;

图4为本发明实施例音频信息输入方向示意图;

图5为本发明实施例采用预设文件夹存储参与者音频文件的示意图;

图6为本发明实施例采用区分目录存储参与者音频文件的示意图;

图7为本发明另一实施例实现音频处理的方法的流程图;

图8为本发明实施例实现音频处理的装置的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。

移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。

图1为实现本发明各个实施例的移动终端的硬件结构示意。

移动终端100可以包括A/V(音频/视频)输入单元120、用户输入单元130、输出单元150、存储器160、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。

A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括麦克风122,麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。

用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。

输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。输出单元150可以包括显示单元151、音频输出模块152等。

显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。

同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。

音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。

存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。

存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。

控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。另外,控制器180可以包括用于再现(或回放)多媒体数据的多媒体模块181,多媒体模块181可以构造在控制器180内,或者可以构造为与控制器180分离。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。

电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。

这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。

至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。

基于上述移动终端硬件结构提出本发明方法各个实施例。

图2为本发明实施例实现音频处理的方法的流程图,如图2所示,本发明实施例可以包括:

步骤200、获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;

可选的,本发明实施例区分信息可以包括:硬件区分标识、声纹特征、音频信息的输入方向;

可选的,本发明实施例区分不同参与者的音频信息的方法可以是以下任意一种方法:

方法一:预先设置每一个用于输入音频信息的硬件相对应的硬件区分标识,并在音频文件中添加硬件区分标识,根据硬件区分标识区分音频文件中每一个参与者输入的音频信息;

需要说明的是,如果输入音频信息的硬件本身具备相对应的物理标识,则可以直接将硬件本身具备的物理标识作为本发明实施例的硬件区分标识。在音频信息中添加硬件区分标识时,本发明实施例陈述的音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过读取音频文件中的硬件区分标识可以区分不同参与者的音频信息;图3为本发明实施例基于硬件区分标识区分音频信息的场景示意图,如图3所示,参与者1到参与者5分别拥有用于发言的麦克(用于输入音频信息的硬件),以参与者1为例,参与者1发言时,通过麦克1输入音频信息,录制音频文件时,在麦克1输入的音频信息中添加麦克1的硬件区分标识。方法一可以适用于不同参与者分别使用独立的麦克的会议或辩论场景,参与者通过麦克发言时,可以直接在音频信息中添加硬件区分标识,直接区分不同参与者输入的音频信息。

方法二:提取音频文件中音频信息的声纹特征,将提取的声纹特征与预先存储的每一个参与者的声纹特征进行匹配,根据声纹特征的匹配结果区分每一个参与者的音频信息;

需要说的是,通过提取声纹特征识别上述音频文件中每一个参与者的音频信息时,本发明实施例音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过提取的音频文件中包含的音频信息的声纹特征,将提取的声纹特征和预先存储的每一个参与者的声纹特征进行匹配,可以区分音频文件中每一个参与者的音频信息;

方法三:确定音频文件包含的音频信息的输入方向,根据输入方向的不同区分每一个参与者输入的音频信息。

需要说的是,本发明实施例通过音频信息的输入方向确定每一个参与者的音频信息时,音频文件可以是正在录制的音频文件,音频信息的输入方向可以通过预先设置的传感器进行区分;图4为本发明实施例音频信息输入方向示意图,如图4所示,设置标准坐标后,设定每隔90度为一个方向后,参会的4个参与者,根据参与者所处位置的不同区分每一个参与者的音频信息;这里,90度只是一个示例角度,根据参与者人数的多少,确定方向的角度可以进行调整,例如、6个参会参与者时,以60度作为每一个方向的角度。

本发明实施例采用上述三种方法中的一种方法区分不同参与者的音频信息后,分割音频文件中不同参与者的音频信息并存储为对应于参与者的参与者音频文件可以采用相关技术中的音频处理方法实现。

本发明实施例可以以手机、平板、电脑、录音机等设备作为硬件执行主体。

步骤201、将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。

需要说明的是,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,提高了对音频文件的查看效率。以会议录制的音频文件为例,假设会议上有5名参会成员发言,且会议进行过程中5名参会人员进行了多轮的意见发表,假设会议结束后,参会人员觉得参会成员A在会议发言的内容对会议要讨论的项目具有积极的意义,因此建议查看参会成员A的发言的内容;如果按照相关技术的处理方法,需要从头到尾的播放录制的音频文件;如果需要多次查看,或者会议包含多个阶段,则查看参会成员A的发言的内容过程十分繁琐,效率低;采用本发明实施例,由于将各参会成员的音频信息区分并存储为对应于参与者的参与者音频文件;查看参与成员A的会议发言时,只需要针对存储的对应于参会成员A的参与者音频文件即可,提高了音频信息的查看效率。

可选的,本发明实施例,按照参与者的不同分别存储为对应于参与者的参与者音频文件包括:

将区分的每一个参与者的音频信息添加区分标记信息后,分别存储为包含区分标记信息的对应于参与者的参与者音频文件;

区分标记信息可以包括以下任意信息的组合:区分名称、区分编码。

需要说明的是,本发明实施例区分标记信息可以仅包含区分名称,或仅包含区分编码;区分名称可以是参与者的账户名、参与者的席位名等;区分编码可以是新建的排序编码、员工编号、及其他可以区分不同参与者的编码。

可选的,本发明实施例方法还包括:

将从音频文件中区分并存储的对应于参与者的参与者音频文件分别存储在对应的预设文件夹中;或,

将从音频文件中区分并存储的对应于参与者的参与者音频文件通过预设的区分目录进行存储。

需要说的是,本发明实施例可以在区分不同参与者的参与者音频文件后,分别存储在对应的预设文件夹中;图5为本发明实施例采用预设文件夹存储参与者音频文件的示意图,如图5所示,假设会议的音频文件经过本发明实施例区分音频信息后,确认包含张三、李四、赵五的参与者音频文件,则可以分别设置张三、李四、赵五的文件夹,并将每一个文件夹路径作为每一个参与者的参与者音频文件的存储路径,分别存储张三、李四、赵五的参与者音频文件。

本发明实施例也可以采用区分目录的方式对不同参与者的参与者音频文件进行存储,依旧以张三、李四、赵五的参与者音频文件为例,图6为本发明实施例采用区分目录存储参与者音频文件的示意图,如图6所示,通过目录名称将张三、李四、赵五的参与者音频文件进行了区分,通过区分目录可以高效的查找指定参与者的参与者音频文件;本发明实施例一个参与者包含多个参与者音频文件时,可以按照时间先后顺序进行排序存储,相应的,可以将排序存储的同一个参与者的多个参与者音频文件进行编号排序;例如、从音频文件中区分出三段张三的音频信息,将三段张三的音频信息存储为三个对应于张三的参与者音频文件,则可以存储为张三音频文件1、张三音频文件2和张三音频文件3。

可选的,本发明实施例方法还可以包括:在区分的每一个参与者的音频信息中添加时间信息。

需要说明的是,本发明实施例时间信息可以是时间戳信息,也可以是排序先后的信息,对于同一个参与者不同时间段的音频信息,可以分别存储为对应于参与者的参与者音频文件,同一参与者的不同时间段的参与者音频文件可以通过时间戳信息或排序先后信息进行区分。在音频信息中添加的是时间戳信息时,可以根据录制音频文件的时间以及音频信息所处时间段进行确定。

本发明实施例,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应特定参与者的参与者音频文件进行查看即可,节省了查看音频文件的时间,提高了对音频文件的查看效率。

图7为本发明实施例实现音频处理的方法的流程图,如图7所示,本发明实施例可以包括:

步骤700、获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;

可选的,本发明实施例区分信息可以包括:硬件区分标识、声纹特征、音频信息的输入方向;

可选的,本发明实施例区分不同参与者的音频信息的方法可以是以下任意一种方法:

方法一:预先设置每一个用于输入音频信息的硬件相对应的硬件区分标识,并在音频文件中添加硬件区分标识,根据硬件区分标识区分音频文件中每一个参与者输入的音频信息;

需要说明的是,如果输入音频信息的硬件本身具备相对应的物理标识,则可以直接将硬件本身具备的物理标识作为本发明实施例的硬件区分标识。在音频信息中添加硬件区分标识时,本发明实施例陈述的音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过读取音频文件中的硬件区分标识可以区分不同参与者的音频信息;方法一可以适用于不同参与者分别使用独立的麦克的会议或辩论场景,参与者通过麦克发言时,可以直接在音频信息中添加硬件区分标识,直接区分不同参与者输入的音频信息。

方法二:提取音频文件中音频信息的声纹特征,将提取的声纹特征与预先存储的每一个参与者的声纹特征进行匹配,根据声纹特征的匹配结果区分每一个参与者的音频信息;

需要说的是,通过提取声纹特征识别上述音频文件中每一个参与者的音频信息时,本发明实施例音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过提取的音频文件中包含的音频信息的声纹特征,将提取的声纹特征和预先存储的每一个参与者的声纹特征进行匹配,可以区分音频文件中每一个参与者的音频信息;

方法三:确定音频文件包含的音频信息的输入方向,根据输入方向的不同区分每一个参与者输入的音频信息。

需要说的是,本发明实施例通过音频信息的输入方向确定每一个参与者的音频信息时,音频文件可以是正在录制的音频文件,音频信息的输入方向可以通过预先设置的传感器进行区分;例如、设置标准坐标后,设定每隔一个预设角度为一个方向,根据预设角度设定方向后,根据参与者所处位置的不同区分不同参与者的音频信息。

本发明实施例采用上述三种方法中的一种方法区分不同参与者的音频信息后,分割音频文件中不同参与者的音频信息并存储为对应于参与者的参与者音频文件可以采用相关技术中的音频处理方法实现。

本发明实施例可以以手机、平板、电脑、录音机等设备作为硬件执行主体。

步骤701、在区分的每一个参与者的音频信息中添加时间信息。

需要说明的是,本发明实施例时间信息可以是时间戳信息,也可以是排序先后的信息,对于同一个参与者不同时间段的音频信息,可以分别存储为对应于参与者的参与者音频文件,同一参与者的不同时间段的参与者音频文件可以通过时间戳信息或排序先后信息进行区分。在音频信息中添加的是时间戳信息时,可以根据录制音频文件的时间以及音频信息所处时间段进行确定。

步骤702、将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。这里的音频信息包括步骤701中添加了时间信息的音频信息。

需要说明的是,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,提高了对音频文件的查看效率。以会议录制的音频文件为例,假设会议上有5名参会成员发言,且会议进行过程中5名参会人员进行了多轮的意见发表,假设会议结束后,参会人员觉得参会成员A在会议发言的内容对会议要讨论的项目具有积极的意义,因此建议查看参会成员A的发言的内容;如果按照相关技术的处理方法,需要从头到尾的播放录制的音频文件;如果需要多次查看,或者会议包含多个阶段,则查看参会成员A的发言的内容过程十分繁琐,效率低;采用本发明实施例,由于将各参会成员的音频信息区分并存储为对应于参与者的参与者音频文件;查看参与成员A的会议发言时,只需要针对存储的对应于参会成员A的参与者音频文件即可,提高了音频信息的查看效率。

可选的,本发明实施例,按照参与者的不同分别存储为对应于参与者的参与者音频文件包括:

将区分的每一个参与者的音频信息添加区分标记信息后,分别存储为包含区分标记信息的对应于参与者的参与者音频文件;

区分标记信息可以包括以下任意信息的组合:区分名称、区分编码。

需要说明的是,本发明实施例区分标记信息可以仅包含区分名称,或仅包含区分编码;区分名称可以是参与者的账户名、参与者的席位名等;区分编码可以是新建的排序编码、员工编号、及其他可以区分不同参与者的编码。

可选的,本发明实施例方法还包括:

将从音频文件中区分并存储的对应于参与者的参与者音频文件分别存储在对应的预设文件夹中;或,

将从音频文件中区分并存储的对应于参与者的参与者音频文件通过预设的区分目录进行存储。

需要说的是,本发明实施例可以在区分不同参与者的参与者音频文件后,分别存储在对应的预设文件夹中;假设会议的音频文件经过本发明实施例区分音频信息后,确认包含张三、李四、赵五的参与者音频文件,则可以分别设置张三、李四、赵五的文件夹,并将每一个文件夹路径作为每一个参与者的参与者音频文件的存储路径,分别存储张三、李四、赵五的参与者音频文件。

本发明实施例也可以采用区分目录的方式对不同参与者的参与者音频文件进行存储,依旧以张三、李四、赵五的参与者音频文件为例,通过目录名称将张三、李四、赵五的参与者音频文件进行了区分,通过区分目录可以高效的查找指定参与者的参与者音频文件;本发明实施例一个参与者包含多个参与者音频文件时,可以按照时间先后顺序进行排序存储,相应的,可以将排序存储的同一个参与者的多个参与者音频文件进行编号排序;例如、从音频文件中区分出三段张三的音频信息,将三段张三的音频信息存储为三个对应于张三的参与者音频文件,则可以存储为张三音频文件1、张三音频文件2和张三音频文件3。

本发明实施例,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,节省了查看音频文件的时间,提高了对音频文件的查看效率。

图8为本发明实施例实现音频处理的装置的结构框图,如图8所示,包括:区分单元和存储单元;其中,

区分单元用于,获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;

可选的,区分信息包括:硬件区分标识、声纹特征、音频信息的输入方向;

区分单元具体用于:

区分信息包括硬件区分标识时,预先设置每一个用于输入音频信息的硬件相对应的硬件区分标识,并在音频文件中添加硬件区分标识;根据硬件区分标识区分音频文件中每一个参与者输入的音频信息;

需要说明的是,如果输入音频信息的硬件本身具备相对应的物理标识,则可以直接将硬件本身具备的物理标识作为本发明实施例的硬件区分标识。在音频信息中添加硬件区分标识时,本发明实施例陈述的音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过读取音频文件中的硬件区分标识可以区分不同参与者的音频信息;方法一可以适用于不同参与者分别使用独立的麦克的会议或辩论场景,参与者通过麦克发言时,可以直接在音频信息中添加硬件区分标识,直接区分不同参与者输入的音频信息。

可选的,区分单元具体用于:

区分信息包括声纹特征时,提取音频文件中音频信息的声纹特征,将提取的声纹特征与预先存储的每一个参与者的声纹特征进行匹配;根据声纹特征的匹配结果区分每一个参与者的音频信息。

需要说的是,通过提取声纹特征识别上述音频文件中每一个参与者的音频信息时,本发明实施例音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过提取的音频文件中包含的音频信息的声纹特征,将提取的声纹特征和预先存储的每一个参与者的声纹特征进行匹配,可以区分音频文件中每一个参与者的音频信息;

可选的,区分单元具体用于:

区分信息包括音频信息的输入方向时,确定音频文件包含的音频信息的输入方向;根据输入方向的不同区分每一个参与者输入的音频信息。

需要说的是,本发明实施例通过音频信息的输入方向确定每一个参与者的音频信息时,音频文件可以是正在录制的音频文件,音频信息的输入方向可以通过预先设置的传感器进行区分;例如、设置标准坐标后,设定每隔一个预设角度为一个方向,根据预设角度设定方向后,根据参与者所处位置的不同区分不同参与者的音频信息。

本发明实施例采用上述三种方法中的一种方法区分不同参与者的音频信息后,分割音频文件中不同参与者的音频信息并存储为对应于参与者的参与者音频文件可以采用相关技术中的音频处理方法实现。

本发明实施例可以以手机、平板、电脑、录音机等设备作为硬件执行主体。

存储单元用于,将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。

需要说明的是,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,提高了对音频文件的查看效率。以会议录制的音频文件为例,假设会议上有5名参会成员发言,且会议进行过程中5名参会人员进行了多轮的意见发表,假设会议结束后,参会人员觉得参会成员A在会议发言的内容对会议要讨论的项目具有积极的意义,因此建议查看参会成员A的发言的内容;如果按照相关技术的处理方法,需要从头到尾的播放录制的音频文件;如果需要多次查看,或者会议包含多个阶段,则查看参会成员A的发言的内容过程十分繁琐,效率低;采用本发明实施例,由于将各参会成员的音频信息区分并存储为对应于参与者的参与者音频文件;查看参与成员A的会议发言时,只需要针对存储的对应于参会成员A的参与者音频文件即可,提高了音频信息的查看效率。

可选的,存储单元具体用于:

将区分的每一个参与者的音频信息添加区分标记信息后,分别存储为包含区分标记信息的对应于参与者的参与者音频文件;

区分标记信息包括以下任意信息的组合:区分名称、区分编码。

需要说明的是,本发明实施例区分标记信息可以仅包含区分名称,或仅包含区分编码;区分名称可以是参与者的账户名、参与者的席位名等;区分编码可以是新建的排序编码、员工编号、及其他可以区分不同参与者的编码。

可选的,本发明实施例存储单元还用于:

将从音频文件中区分并存储的对应于参与者的参与者音频文件分别存储在对应的预设文件夹中;或,

将从音频文件中区分并存储的对应于参与者的参与者音频文件通过预设的区分目录进行存储。

需要说的是,本发明实施例可以在区分不同参与者的参与者音频文件后,分别存储在对应的预设文件夹中;假设会议的音频文件经过本发明实施例区分音频信息后,确认包含张三、李四、赵五的参与者音频文件,则可以分别设置张三、李四、赵五的文件夹,并将每一个文件夹路径作为每一个参与者的参与者音频文件的存储路径,分别存储张三、李四、赵五的参与者音频文件。

本发明实施例也可以采用区分目录的方式对不同参与者的参与者音频文件进行存储,依旧以张三、李四、赵五的参与者音频文件为例,通过目录名称将张三、李四、赵五的参与者音频文件进行了区分,通过区分目录可以高效的查找指定参与者的参与者音频文件;本发明实施例一个参与者包含多个参与者音频文件时,可以按照时间先后顺序进行排序存储,相应的,可以将排序存储的同一个参与者的多个参与者音频文件进行编号排序;例如、从音频文件中区分出三段张三的音频信息,将三段张三的音频信息存储为三个对应于张三的参与者对应的参与者音频文件,则可以存储为张三音频文件1、张三音频文件2和张三音频文件3。

本发明实施例装置还包括添加单元,用于在区分的每一个参与者的音频信息中添加时间信息。

需要说明的是,本发明实施例时间信息可以是时间戳信息,也可以是排序先后的信息,对于同一个参与者不同时间段的音频信息,可以分别存储为对于的参与者音频文件,同一参与者的不同时间段的参与者音频文件可以通过时间戳信息或排序先后信息进行区分。在音频信息中添加的是时间戳信息时,可以根据录制音频文件的时间以及音频信息所处时间段进行确定。

本发明实施例,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,节省了查看音频文件的时间,提高了对音频文件的查看效率。

本发明实施例还提供一种实现音频处理的装置,包括:区分单元、添加单元和存储单元;其中,

区分单元用于,获取音频文件中的区分信息,根据区分信息区分音频文件中不同参与者的音频信息;

可选的,区分信息包括:硬件区分标识、声纹特征、音频信息的输入方向;

可选的,区分单元具体用于:

区分信息包括硬件区分标识时,预先设置每一个用于输入音频信息的硬件相对应的硬件区分标识,并在音频文件中添加硬件区分标识;根据硬件区分标识区分音频文件中每一个参与者输入的音频信息;

需要说明的是,如果输入音频信息的硬件本身具备相对应的物理标识,则可以直接将硬件本身具备的物理标识作为本发明实施例的硬件区分标识。在音频信息中添加硬件区分标识时,本发明实施例陈述的音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过读取音频文件中的硬件区分标识可以区分不同参与者的音频信息;方法一可以适用于不同参与者分别使用独立的麦克的会议或辩论场景,参与者通过麦克发言时,可以直接在音频信息中添加硬件区分标识,直接区分不同参与者输入的音频信息。

可选的,区分单元具体用于:

区分信息包括声纹特征时,提取音频文件中音频信息的声纹特征,将提取的声纹特征与预先存储的每一个参与者的声纹特征进行匹配;根据声纹特征的匹配结果区分每一个参与者的音频信息。

需要说的是,通过提取声纹特征识别上述音频文件中每一个参与者的音频信息时,本发明实施例音频文件可以是正在录制的音频文件,也可以是已经录制完成的音频文件,通过提取的音频文件中包含的音频信息的声纹特征,将提取的声纹特征和预先存储的每一个参与者的声纹特征进行匹配,可以区分音频文件中每一个参与者的音频信息;

可选的,区分单元具体用于:

区分信息包括音频信息的输入方向时,确定音频文件包含的音频信息的输入方向;根据输入方向的不同区分每一个参与者输入的音频信息。

需要说的是,本发明实施例通过音频信息的输入方向确定每一个参与者的音频信息时,音频文件可以是正在录制的音频文件,音频信息的输入方向可以通过预先设置的传感器进行区分;例如、设置标准坐标后,设定每隔一个预设角度为一个方向,根据预设角度设定方向后,根据参与者所处位置的不同区分不同参与者的音频信息。

本发明实施例采用上述三种方法中的一种方法区分不同参与者的音频信息后,分割音频文件中不同参与者的音频信息并存储为对应于参与者的参与者音频文件可以采用相关技术中的音频处理方法实现。

本发明实施例可以以手机、平板、电脑、录音机等设备作为硬件执行主体。

添加单元,用于在区分的每一个参与者的音频信息中添加时间信息。

需要说明的是,本发明实施例时间信息可以是时间戳信息,也可以是排序先后的信息,对于同一个参与者不同时间段的音频信息,可以分别存储为对于的参与者音频文件,同一参与者的不同时间段的参与者音频文件可以通过时间戳信息或排序先后信息进行区分。在音频信息中添加的是时间戳信息时,可以根据录制音频文件的时间以及音频信息所处时间段进行确定。

存储单元用于,将区分出的不同参与者的音频信息,按照参与者的不同分别存储为对应于参与者的参与者音频文件。

需要说明的是,将音频文件中不同参与者的音频信息存储为对应于参与者的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,提高了对音频文件的查看效率。以会议录制的音频文件为例,假设会议上有5名参会成员发言,且会议进行过程中5名参会人员进行了多轮的意见发表,假设会议结束后,参会人员觉得参会成员A在会议发言的内容对会议要讨论的项目具有积极的意义,因此建议查看参会成员A的发言的内容;如果按照相关技术的处理方法,需要从头到尾的播放录制的音频文件;如果需要多次查看,或者会议包含多个阶段,则查看参会成员A的发言的内容过程十分繁琐,效率低;采用本发明实施例,由于将各参会成员的音频信息区分并存储为对应于参与者的参与者音频文件;查看参与成员A的会议发言时,只需要针对存储的对应于参会成员A的参与者音频文件即可,提高了音频信息的查看效率。

可选的,存储单元具体用于:

将区分的每一个参与者的音频信息添加区分标记信息后,分别存储为包含区分标记信息的对应于参与者的参与者音频文件;

区分标记信息包括以下任意信息的组合:区分名称、区分编码。

需要说明的是,本发明实施例区分标记信息可以仅包含区分名称,或仅包含区分编码;区分名称可以是参与者的账户名、参与者的席位名等;区分编码可以是新建的排序编码、员工编号、及其他可以区分不同参与者的编码。

可选的,本发明实施例存储单元还用于:

将从音频文件中区分并存储的对应于参与者的参与者音频文件分别存储在对应的预设文件夹中;或,

将从音频文件中区分并存储的对应于参与者的参与者音频文件通过预设的区分目录进行存储。

需要说的是,本发明实施例可以在区分不同参与者的参与者音频文件后,分别存储在对应的预设文件夹中;假设会议的音频文件经过本发明实施例区分音频信息后,确认包含张三、李四、赵五的参与者音频文件,则可以分别设置张三、李四、赵五的文件夹,并将每一个文件夹路径作为每一个参与者的参与者音频文件的存储路径,分别存储张三、李四、赵五的参与者音频文件。

本发明实施例也可以采用区分目录的方式对不同参与者的参与者音频文件进行存储,依旧以张三、李四、赵五的参与者音频文件为例,通过目录名称将张三、李四、赵五的参与者音频文件进行了区分,通过区分目录可以高效的查找指定参与者的参与者音频文件;本发明实施例一个参与者包含多个参与者音频文件时,可以按照时间先后顺序进行排序存储,相应的,可以将排序存储的同一个参与者的多个参与者音频文件进行编号排序;例如、从音频文件中区分出三段张三的音频信息,将三段张三的音频信息存储为三个对应于张三的参与者音频文件,则可以存储为张三音频文件1、张三音频文件2和张三音频文件3。

本发明实施例,将音频文件中不同参与者的音频信息存储为对应于不同参与者的参与者对应的参与者音频文件,在需要对音频文件中特定参与者的发言进行回顾查看时,仅需要对存储的对应于特定参与者的参与者音频文件进行查看即可,节省了查看音频文件的时间,提高了对音频文件的查看效率。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。

虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1