一种音频处理方法

文档序号:2827822阅读:187来源:国知局
一种音频处理方法
【专利摘要】本发明实施例公开了一种音频处理方法,包括:第一终端获取与第二终端通话过程中采集到的语音信号;第一终端检测语音信号是否满足音频处理条件;若语音信号满足音频处理条件,则第一终端根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整。采用本发明实施例,可根据音频处理条件对语音信号的播放进行调整,音频处理效率较高,可提升通话质量。
【专利说明】一种音频处理方法

【技术领域】
[0001]本发明涉及电子【技术领域】,尤其涉及一种音频处理方法。

【背景技术】
[0002]语音通话是将第一终端发送的语音信号通过传输媒介发送至第二终端的通信方式,例如座机通话,手机通话,对讲机通话,即时通讯软件等。在语音通话的过程中,通常因为终端接收到的网络信号强度较弱、终端播放语音信号的音量较低、终端对应的用户所处的环境中存在噪声源等原因导致通话质量较低,需要用户手动调整终端的音量,即使用户手动调整终端的音量,用户有可能仍然听不清楚对端发送的语音信号,导致通话效率较低。另外,当语音通话过程中的第一终端对应的用户和第二终端对应的用户发生争执时,例如第二终端对应的用户接收到第一终端发送的语音信号的语气较强硬,声音较大,则用户通过第二终端发送的语音信号的语气也较强硬,声音也较大,将加剧双方的争执,导致通话质量较低。


【发明内容】

[0003]本发明实施例提供一种音频处理方法,音频处理效率较高,可提升通话质量。
[0004]本发明实施例提供了一种音频处理方法,包括:
[0005]第一终端获取与第二终端通话过程中采集到的语音信号;
[0006]所述第一终端检测所述语音信号是否满足音频处理条件;
[0007]若所述语音信号满足所述音频处理条件,则所述第一终端根据所述音频处理条件对接收到的所述第二终端发送的第二语音信号的播放进行调整。
[0008]实施本发明实施例,第一终端获取与第二终端通话过程中采集到的语音信号,检测语音信号是否满足音频处理条件,若语音信号满足音频处理条件,则根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整,音频处理效率较高,可提升通话质量。

【专利附图】

【附图说明】
[0009]为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1是本发明第一实施例中提供的一种音频处理方法的流程示意图;
[0011]图2是本发明第二实施例中提供的一种音频处理方法的流程示意图;
[0012]图3是本发明第三实施例中提供的一种音频处理方法的流程示意图;
[0013]图4是本发明第四实施例中提供的一种音频处理方法的流程示意图;
[0014]图5是本发明第一实施例中提供的一种终端的结构示意图;
[0015]图6是本发明实施例中图5的语音信号检测单元的结构示意图;
[0016]图7是本发明实施例中图5的音频处理单元的结构示意图;
[0017]图8是本发明实施例中图7的音频参数调整单元的结构示意图;
[0018]图9是本发明第二实施例中提供的一种终端的结构示意图。

【具体实施方式】
[0019]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0020]本发明实施例提供一种音频处理方法,第一终端可以获取与第二终端通话过程中采集到的语音信号,检测到该语音信号满足音频处理条件时,根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整,针对现有技术中第一终端对应的用户只能手动调整第一终端的音量,本发明实施例音频处理效率较高,可提升通话质量。
[0021]本发明实施例提及到语音信号可以包括第一终端与第二终端通话过程中第一终端向第二终端发送的第一语音信号,也可以包括第一终端与第二终端通话过程中第一终端接收到的第二终端发送的第二语音信号,具体不受本发明实施例限制。
[0022]本发明实施例中第一终端检测到第一语音信号包括第一关键词中的第一关键词数据库、第二语音信号的振幅的幅度大于第一预设幅度阈值、第二语音信号的频率大于预设频率阈值、第二语音信号包括第二关键词数据库中的第二关键词或者第二终端对应用户的心率大于预设心率阈值,则第一终端可以确定检测到语音信号满足音频处理条件,其中第一关键词数据库和第二关键词数据库可以为同一关键词数据库,也可以为不同的关键词数据库,具体不受本发明实施例的限制。
[0023]本发明实施例提及到的终端可以包括手机、平板电脑、?0 (¢161-801181 001111)111:61',个人计算机)或者佩戴式智能设备等。
[0024]请参见图1,图1是本发明第一实施例中提供的一种音频处理方法的流程示意图,如图所示本发明实施例中的音频处理方法可以包括:
[0025]3101,第一终端获取与第二终端通话过程中采集到的语音信号。
[0026]第一终端可以获取与第二终端进行通话过程中采集到的语音信号,其中语音信号可以包括第一终端与第二终端通话过程中第一终端向第二终端发送的第一语音信号,也可以包括第一终端与第二终端通话过程中第一终端接收到的第二终端发送的第二语音信号。
[0027]3102,第一终端检测语音信号是否满足音频处理条件。
[0028]第一终端获取到语音信号之后,可以检测该语音信号是否满足音频处理条件,若该语音信号满足音频处理条件,则进一步执行3103 ;若该语音信号不满足音频处理条件,则进一步执行3104。
[0029]在可选实施例中,第一终端获取到的语音信号包括第一终端向第二终端发送的第一语音信号时,第一终端可以检测第一语音信号是否包括第一关键词数据库中的第一关键词,若第一语音信号包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件;若第一语音信号不包括第一关键词数据库中的任一关键词,则第一终端可以确定检测到第一语音信号不满足音频处理条件。其中第一关键词数据库中的关键词例如可以包括“您能再说一遍吗”、“不好意思没听清楚”或者“您声音能小点吗”等,例如第一终端和第二终端语音通话过程中,第一终端对应用户发送的第一语音信号包括“不好意思没听清楚”,则第一终端可以检测到第一语音信号包括第一关键词数据库中的第一关键词,进而确定检测到第一语音信号满足第一关键词对应的音频处理条件。
[0030]进一步可选的,第一终端获取到第一语音信号之后,可以将第一语音信号转化成字符串,检测上述字符串是否包括第一关键词数据库中的第一关键词,若上述字符串包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词对应的音频处理条件;若上述字符串不包括第一关键词数据库中的任一关键词,则第一终端可以确定检测到第一语音信号不满足音频处理条件。
[0031]作为一种可选的实施方式,若第一终端获取到的语音信号包括与第二终端通话过程中第一终端接收到的第二终端发送的第二语音信号,则第一终端可以检测第二语音信号是否满足音频处理条件。
[0032]进一步可选的,第一终端可以检测第二语音信号的振幅的幅度是否大于第一预设幅度阈值,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端确定检测到第二语音信号满足第二语音信号的振幅的幅度对应的音频处理条件。其中第二语音信号的振幅的幅度可以表示第二终端对应用户的声音响度,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端可以识别到第二终端对应用户的声音较大,进而可以检测到第二语音信号满足音频处理条件。
[0033]进一步可选的,第一终端可以检测第二语音信号的频率是否大于预设频率阈值,若第二语音信号的频率大于预设频率阈值,则第一终端确定检测到第二语音信号满足第二语音信号的频率对应的音频处理条件。其中第二语音信号的频率可以表示第二终端对应用户的语调,若第二语音信号的频率大于预设频率阈值,则第一终端可以识别第二终端对应用户的语气较强硬,进而检测到第二语音信号满足音频处理条件。
[0034]进一步可选的,第一终端可以检测第二语音信号是否包括第二关键词数据库中的第二关键词,若第二语音信号包括第二关键词数据库中的第二关键词,则第一终端确定检测到第二语音信号满足第二关键词数据库中的第二关键词对应的音频处理条件;若第二语音信号不包括第二关键词数据库中的任一关键词,则第一终端确定检测到第二语音信号不满足音频处理条件。其中第二关键词数据库中的关键词例如可以包括“尼玛”、“纳尼”或者“靠”等语气助词。具体的,第一终端和第二终端语音通话过程中,第一终端接收到第二终端发送的第二语音信号之后,可以将第二语音信号转化成字符串,检测上述字符串是否包括第二关键词数据库中的第二关键词,若上述字符串包括第二关键词数据库中的第二关键词,则第一终端检测到第二语音信号满足音频处理条件;若上述字符串不包括第二关键词数据库中的任一关键词,则第一终端检测到第二语音信号不满足音频处理条件,例如上述字符串包括“靠”,则第一终端检测到第二语音信号包括第二关键词数据库中的第二关键词,则第一终端可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二关键词对应的音频处理条件。
[0035]需要指出的是,第二关键词数据库可以为第一关键词数据库,即第一终端检测到第二语音信号包括第一关键词数据库中的第二关键词时,确定检测到第二语音信号满足第二关键词对应的音频处理条件,可选的,第二关键词数据库也可以和第一关键词数据库不是同一关键词数据库,本发明实施例不做限定。
[0036]进一步可选的,第一终端可以检测第二终端对应用户的心率是否大于预设心率阈值,若第二终端对应用户的心率大于预设心率阈值,则第一终端可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二终端对应用户的心率对应的音频处理条件。具体的,第一终端和第二终端语音通话过程中,第二终端对应用户佩戴的智能设备(例如智能手环等)可以采集第二终端对应用户的心率,并将采集到的第二终端对应用户的心率发送给第二终端,第二终端可以将携带了第二终端对应用户的心率的第二语音信号发送至第一终端,则第一终端可以检测第二终端对应用户的心率是否大于预设心率阈值。本发明实施例中包含但不局限于检测第二终端对应用户的心率是否大于预设心率阈值,还可以检测第二终端对应用户的血压或者脉搏等,例如第一终端可以检测第二终端对应用户的血压是否大于预设血压阈值,若第二终端对应用户的血压大于预设血压阈值,则第一终端可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二终端对应用户的血压对应的音频处理条件,具体不受本发明实施例限制。
[0037]进一步可选的,第一终端可以检测第二语音信号的相位是否满足预设相位阈值,若第二语音信号的相位不满足预设相位阈值,则第一终端确定检测到第二语音信号满足第二语音信号的相位对应的音频处理条件。其中第二语音信号的相位可以表示第二终端对应用户的语速,若第二语音信号的相位满足预设相位阈值,则第一终端可以识别第二终端对应用户的语速较快,进而检测到第二语音信号满足音频处理条件。
[0038]需要指出的是,本发明实施例也可以通过检测第二语音信号是否满足音频处理条件的方法流程检测第一语音信号是否满足音频处理条件,具体不受本发明实施例限制。
[0039]3103,第一终端根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整。
[0040]第一终端检测到语音信号满足音频处理条件后,可以根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整。
[0041]作为一种可选的实施方式,第一终端检测到第一语音信号包括第一关键词数据库中的第一关键词,第一终端可以确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件,则第一终端可以根据音频处理条件调整第一终端的音频参数,并播放经过音频参数调整的第二语音信号。例如第一终端对应用户发送的第一语音信号包括第一关键词“不好意思没听清楚”,则第一终端可以根据第一关键词对应的音频处理条件调整第一终端的振幅的幅度,并播放经过幅度调整的第二语音信号,以便于第一终端对应用户在无需手动调整第一终端的音量的情况下,可以听清楚第二终端发送的第二语音信号,提升用户体验。
[0042]进一步可选的,第一终端检测到第一语音信号满足第一关键词对应的音频处理条件之后,可以获取当前振幅的幅度,并根据音频处理条件,将第一终端的振幅的幅度调整为与当前振幅的幅度间隔第二预设幅度阈值的目标幅度,并播放目标幅度对应的第二语音信号,例如第一终端的当前振幅的幅度为30此分贝,第二预设幅度阈值为10此,第一语音信号包括“不好意思没听清楚”,则第一终端可以将第一终端的振幅的幅度调整为40此;若第一语音信号包括“您声音能小点吗”,则第一终端可以将第一终端的振幅的幅度调整为20(1)3,等等。
[0043]作为可选的实施方式,第一终端检测到第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端可以识别到第二终端对应用户的声音较大,第一终端可以调整第一终端的振幅的幅度,并播放经过幅度调整的第二语音信号,其中经过调整的振幅的幅度小于当前振幅的幅度。可选的,第一终端检测到第二语音信号的频率大于预设频率阈值,则第一终端可以识别第二终端对应用户的语气较强硬,第一终端可以调整第一终端的频率,并播放经过频率调整的第二语音信号,其中经过调整的频率小于当前频率。可选的,第一终端检测到第二语音信号包括第二关键词数据库中的第二关键词,则第一终端可以识别第二终端对应用户的情绪处于激动状态,第一终端可以调整第一终端的音频参数,并播放经过音频参数调整的第二语音信号,例如第一终端降低振幅的幅度、减小频率或者调整相位等。
[0044]3104,第一终端播放接收到的第二终端发送的第二语音信号。
[0045]第一终端检测到语音信号不满足音频处理条件,则第一终端可以直接播放接收到的第二终端发送的第二语音信号,无需调整第一终端的音频参数。
[0046]在图1所示的音频处理方法中,第一终端获取与第二终端通话过程中采集到的语音信号,检测到该语音信号满足音频处理条件时,根据该音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整,音频处理效率较高,可提升通话质量。
[0047]请参见图2,图2是本发明第二实施例中提供的一种音频处理方法的流程示意图,如图所示本发明实施例中的音频处理方法可以包括:
[0048]3201,第一终端获取与第二终端通话过程中第一终端向第二终端发送的第一语音信号。
[0049]第一终端可以获取与第二终端进行通话过程中采集到的语音信号,其中语音信号可以包括第一终端与第二终端通话过程中第一终端向第二终端发送的第一语音信号。
[0050]3202,第一终端检测第一语音信号是否包括第一关键词数据库中的第一关键词。
[0051]第一终端可以检测第一语音信号是否包括第一关键词数据库中的第一关键词,若第一语音信号包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件;若第一语音信号不包括第一关键词数据库中的任一关键词,则第一终端可以确定检测到第一语音信号不满足音频处理条件。其中第一关键词数据库中的关键词例如可以包括“您能再说一遍吗”、“不好意思没听清楚”或者“您声音能小点吗”等,例如第一终端和第二终端语音通话过程中,第一终端对应用户发送的第一语音信号包括“不好意思没听清楚”,则第一终端可以检测到第一语音信号包括第一关键词数据库中的第一关键词,进而确定检测到第一语音信号满足第一关键词对应的音频处理条件。
[0052]进一步可选的,第一终端获取到第一语音信号之后,可以将第一语音信号转化成字符串,检测上述字符串是否包括第一关键词数据库中的第一关键词,若上述字符串包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词对应的音频处理条件;若上述字符串不包括第一关键词数据库中的任一关键词,则第一终端可以确定检测到第一语音信号不满足音频处理条件。
[0053]3203,第一终端确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件。
[0054]第一终端检测到第一语音信号包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件。
[0055]3204,第一终端根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整。
[0056]第一终端确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件,则第一终端可以根据音频处理条件调整第一终端的音频参数,并播放经过音频参数调整的第二语音信号。例如第一终端对应用户发送的第一语音信号包括第一关键词“不好意思没听清楚”,则第一终端可以根据第一关键词对应的音频处理条件调整第一终端的振幅的幅度,并播放经过幅度调整的第二语音信号,以便于第一终端对应用户在无需手动调整第一终端的音量的情况下,可以听清楚第二终端发送的第二语音信号,提升用户体验。
[0057]进一步可选的,第一终端检测到第一语音信号满足第一关键词对应的音频处理条件之后,可以获取当前振幅的幅度,并根据音频处理条件,将第一终端的振幅的幅度调整为与当前振幅的幅度间隔第二预设幅度阈值的目标幅度,例如第一终端的当前振幅的幅度为30此分贝,第二预设幅度阈值为10此,第一语音信号包括“不好意思没听清楚”,则第一终端可以将第一终端的振幅的幅度调整为40此;若第一语音信号包括“您声音能小点吗”,则第一终端可以将第一终端的振幅的幅度调整为20此,等等。
[0058]3205,第一终端播放收到的第二终端发送的第二语音信号。
[0059]第一终端检测到第一语音信号不包括第一关键词数据库中的任一关键词,则第一终端可以确定检测到第一语音信号不满足音频处理条件,则第一终端可以直接播放接收到的第二终端发送的第二语音信号,无需调整第一终端的音频参数。
[0060]在图2所示的音频处理方法中,第一终端获取与第二终端通话过程中第一终端向第二终端发送的第一语音信号,检测到第一语音信号包括第一关键词数据库中的第一关键词时,根据第一关键词对应的音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整,音频处理效率较高,可提升通话质量。
[0061]请参见图3,图3是本发明第三实施例中提供的一种音频处理方法的流程示意图,如图所示本发明实施例中的音频处理方法可以包括:
[0062]3301,第一终端获取与第二终端通话过程中接收到的第二终端发送的第二语音信号。
[0063]第一终端可以获取与第二终端进行通话过程中采集到的语音信号,其中语音信号可以包括第一终端与第二终端通话过程中第一终端接收到的第二终端发送的第二语音信号。
[0064]3302,第一终端检测第二语音信号是否满足音频处理条件。
[0065]第一终端获取到第二语音信号之后,可以检测第二语音信号是否满足音频处理条件,若第二语音信号满足音频处理条件,则第一终端可以进一步执行3303 ;若第二语音信号不满足音频处理条件,则第一终端可以进一步执行305。
[0066]作为一种可选的实施方式,第一终端可以检测第二语音信号的振幅的幅度是否大于第一预设幅度阈值,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端确定检测到第二语音信号满足第二语音信号的振幅的幅度对应的音频处理条件。其中第二语音信号的振幅的幅度可以表示第二终端对应用户的声音响度,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端可以识别到第二终端对应用户的声音较大,进而可以检测到第二语音信号满足音频处理条件。
[0067]作为一种可选的实施方式,第一终端可以检测第二语音信号的频率是否大于预设频率阈值,若第二语音信号的频率大于预设频率阈值,则第一终端确定检测到第二语音信号满足第二语音信号的频率对应的音频处理条件。其中第二语音信号的频率可以表示第二终端对应用户的语调,若第二语音信号的频率大于预设频率阈值,则第一终端可以识别第二终端对应用户的语气较强硬,进而检测到第二语音信号满足音频处理条件。
[0068]作为一种可选的实施方式,第一终端可以检测第二语音信号是否包括第二关键词数据库中的第二关键词,若第二语音信号包括第二关键词数据库中的第二关键词,则第一终端确定检测到第二语音信号满足第二关键词数据库中的第二关键词对应的音频处理条件;若第二语音信号不包括第二关键词数据库中的任一关键词,则第一终端确定检测到第二语音信号不满足音频处理条件。其中第二关键词数据库中的关键词例如可以包括“尼玛”、“纳尼”或者“靠”等语气助词。具体的,第一终端和第二终端语音通话过程中,第一终端接收到第二终端发送的第二语音信号之后,可以将第二语音信号转化成字符串,检测上述字符串是否包括第二关键词数据库中的第二关键词,若上述字符串包括第二关键词数据库中的第二关键词,则第一终端检测到第二语音信号满足音频处理条件;若上述字符串不包括第二关键词数据库中的任一关键词,则第一终端检测到第二语音信号不满足音频处理条件,例如上述字符串包括“靠”,则第一终端检测到第二语音信号包括第二关键词数据库中的第二关键词,则第一终端可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二关键词对应的音频处理条件。
[0069]作为一种可选的实施方式,第一终端可以检测第二终端对应用户的心率是否大于预设心率阈值,若第二终端对应用户的心率大于预设心率阈值,则第一终端可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二终端对应用户的心率对应的音频处理条件。具体的,第一终端和第二终端语音通话过程中,第二终端对应用户佩戴的智能设备(例如智能手环等)可以采集第二终端对应用户的心率,并将采集到的第二终端对应用户的心率发送给第二终端,第二终端可以将携带了第二终端对应用户的心率的第二语音信号发送至第一终端,则第一终端可以检测第二终端对应用户的心率是否大于预设心率阈值。本发明实施例中包含但不局限于检测第二终端对应用户的心率是否大于预设心率阈值,还可以检测第二终端对应用户的血压或者脉搏等,例如第一终端可以检测第二终端对应用户的血压是否大于预设血压阈值,若第二终端对应用户的血压大于预设血压阈值,则第一终端可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二终端对应用户的血压对应的音频处理条件,具体不受本发明实施例限制。
[0070]作为一种可选的实施方式,第一终端可以检测第二语音信号的相位是否满足预设相位阈值,若第二语音信号的相位不满足预设相位阈值,则第一终端确定检测到第二语音信号满足第二语音信号的相位对应的音频处理条件。其中第二语音信号的相位可以表示第二终端对应用户的语速,若第二语音信号的相位满足预设相位阈值,则第一终端可以识别第二终端对应用户的语速较快,进而检测到第二语音信号满足音频处理条件。
[0071]3303,第一终端根据音频处理条件,调整第一终端的音频参数。
[0072]第一终端检测到第二语音信号满足音频处理条件之后,可以根据音频处理条件,调整第一终端的音频参数。
[0073]例如,第一终端检测到第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端可以识别到第二终端对应用户的声音较大,第一终端可以调整第一终端的振幅的幅度,其中经过调整的幅度小于当前振幅的幅度。又如,第一终端检测到第二语音信号的频率大于预设频率阈值,则第一终端可以识别第二终端对应用户的语气较强硬,第一终端可以调整第一终端的频率,其中经过调整的频率小于当前频率。再如,第一终端检测到第二语音信号包括第二关键词数据库中的第二关键词,则第一终端可以识别第二终端对应用户的情绪处于激动状态,第一终端可以调整第一终端的音频参数,例如第一终端降低振幅的幅度、减小频率或者调整相位等。
[0074]3304,第一终端播放经过音频参数调整的第二语音信号。
[0075]第一终端调整音频参数之后,可以播放经过音频参数调整的第二语音信号。
[0076]3305,第一终端播放接收到的第二终端发送的第二语音信号。
[0077]第一终端检测到第二语音信号不满足音频处理条件,则第一终端可以直接播放接收到的第二终端发送的第二语音信号,无需调整第一终端的音频参数。
[0078]在图3所示的音频处理方法中,第一终端获取与第二终端通话过程中接收到的第二终端发送的第二语音信号,检测到第二语音信号满足音频处理条件时,根据音频处理条件调整第一终端的音频参数,并播放经过音频参数调整的第二语音信号,音频处理效率较高,可提升通话质量。
[0079]请参见图4,图4是本发明第四实施例中提供的一种音频处理方法的流程示意图,如图所示本发明实施例中的音频处理方法可以包括:
[0080]3401,第一终端获取与第二终端通话过程中采集到的语音信号。
[0081]第一终端可以获取与第二终端进行通话过程中采集到的语音信号,其中语音信号可以包括第一终端与第二终端通话过程中第一终端向第二终端发送的第一语音信号,也可以包括第一终端与第二终端通话过程中第一终端接收到的第二终端发送的第二语音信号。
[0082]3402,第一终端检测语音信号是否满足音频处理条件。
[0083]第一终端获取到语音信号后,可以检测该语音信号是否满足音频处理条件,若该语音信号满足音频处理条件,则进一步执行3403 ;若该语音信号不满足音频处理条件,贝0进一步执行3406。
[0084]在可选实施例中,第一终端获取到的语音信号包括第一终端向第二终端发送的第一语音信号时,第一终端可以检测第一语音信号是否包括第一关键词数据库中的第一关键词,若第一语音信号包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词数据库中的第一关键词对应的音频处理条件;若第一语音信号不包括第一关键词数据库中的任一关键词,则第一终端可以确定检测到第一语音信号不满足音频处理条件。其中第一关键词数据库中的关键词例如可以包括“您能再说一遍吗”、“不好意思没听清楚”或者“您声音能小点吗”等,例如第一终端和第二终端语音通话过程中,第一终端对应用户发送的第一语音信号可以包括“不好意思没听清楚”,则第一终端获取第一语音信号之后,检测到第一语音信号包括第一关键词数据库中的第一关键词,则第一终端可以确定检测到第一语音信号满足第一关键词对应的音频处理条件。
[0085]作为一种可选的实施方式,第一终端可以检测第二语音信号的振幅的幅度是否大于第一预设幅度阈值,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端确定检测到第二语音信号满足第二语音信号的振幅的幅度对应的音频处理条件。其中第二语音信号的振幅的幅度可以表示第二终端对应用户的声音响度,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端可以识别到第二终端对应用户的声音较大,进而可以检测到第二语音信号满足音频处理条件。
[0086]3403,第一终端获取当前振幅的幅度。
[0087]第一终端检测到语音信号满足音频处理条件之后,可以获取当前振幅的幅度。
[0088]3404,第一终端根据音频处理条件,将第一终端的振幅的幅度调整为与当前振幅的幅度间隔第二预设幅度阈值的目标幅度。
[0089]第一终端可以根据音频处理条件,将第一终端的振幅的幅度调整为与当前振幅的幅度间隔第二预设幅度阈值的目标幅度。例如第一终端的当前振幅的幅度为30(?分贝,第二预设幅度阈值为10此,第一语音信号包括“不好意思没听清楚”,则第一终端可以将第一终端的振幅的幅度调整为40此;若第一语音信号包括“您声音能小点吗”,则第一终端可以将第一终端的振幅的幅度调整为20此,等等。又如第一终端的当前振幅的幅度为30此分贝,第二预设幅度阈值为10此,第二语音信号的振幅的幅度大于第一预设幅度阈值,则第一终端可以将第一终端的振幅的幅度调整为20此。
[0090]3405,第一终端播放经过幅度调整的接收到的第二终端发送的第二语音信号。
[0091〕 第一终端将振幅的幅度调整为与当前振幅的幅度间隔第二预设幅度阈值的目标幅度之后,可以播放经过幅度调整的接收到的第二终端发送的第二语音信号。
[0092]3406,第一终端播放接收到的第二终端发送的第二语音信号。
[0093]第一终端检测到语音信号不满足音频处理条件,则第一终端可以直接播放接收到的第二终端发送的第二语音信号,无需调整第一终端的音频参数。
[0094]在图4所示的音频处理方法中,第一终端获取与第二终端通话过程中采集到的语音信号,检测到语音信号满足音频处理条件时,根据音频处理条件,将第一终端的振幅的幅度调整为与当前振幅的幅度间隔第二预设幅度阈值的目标幅度,并播放经过幅度调整的接收到的第二终端发送的第二语音信号,振幅的幅度调整效率较高,可提升通话质量。
[0095]请参见图5,图5是本发明第一实施例中提供的一种终端的结构示意图,如图所示本发明实施例中的终端500至少可以包括语音信号获取单元510、语音信号检测单元520以及音频处理单元530,其中:
[0096]语音信号获取单元510,用于获取与第二终端通话过程中采集到的语音信号。其中语音信号可以包括与第二终端通话过程中向第二终端发送的第一语音信号,也可以包括与第二终端通话过程中接收到的第二终端发送的第二语音信号。
[0097]语音信号检测单元520,用于检测语音信号是否满足音频处理条件。
[0098]音频处理单元530,用于若所述语音信号满足所述音频处理条件,则根据所述音频处理条件对接收到的所述第二终端发送的第二语音信号的播放进行调整。
[0099]作为一种可选的实施方式,语音信号可以包括终端500向第二终端发送的第一语音信号,则语音信号检测单元520,用于检测所述第一语音信号是否包括第一关键词数据库中的第一关键词,若所述第一语音信号包括所述第一关键词数据库中的第一关键词,则确定检测到所述第一语音信号满足所述第一关键词数据库中的第一关键词对应的音频处理条件。其中第一关键词数据库中的关键词例如可以包括“您能再说一遍吗”、“不好意思没听清楚”或者“您声音能小点吗”等。
[0100]进一步可选的,本发明实施例中的语音信号检测单元520可以如图6所示,进一步包括:
[0101]语音信号转化单元610,用于将所述第一语音信号转化成字符串。
[0102]字符串检测单元620,用于检测所述字符串是否包括所述第一关键词数据库中的第一关键词。
[0103]作为一种可选的实施方式,语音信号获取单元510,用于获取与所述第二终端通话过程中接收到的所述第二终端发送的第二语音信号。
[0104]进一步可选的,语音信号检测单元520,用于检测所述第二语音信号的振幅的幅度是否大于第一预设幅度阈值,若所述第二语音信号的振幅的幅度大于所述第一预设幅度阈值,则确定检测到所述第二语音信号满足所述第二语音信号的振幅的幅度对应的音频处理条件。其中第二语音信号的振幅的幅度可以表示第二终端对应用户的声音响度,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则语音信号检测单元520可以识别到第二终端对应用户的声音较大,进而可以检测到第二语音信号满足音频处理条件。
[0105]进一步可选的,语音信号检测单元520,用于检测所述第二语音信号的频率是否大于预设频率阈值,若所述第二语音信号的频率大于所述预设频率阈值,则确定检测到所述第二语音信号满足所述第二语音信号的频率对应的音频处理条件。其中第二语音信号的频率可以表示第二终端对应用户的语调,若第二语音信号的频率大于预设频率阈值,则语音信号检测单元520可以识别第二终端对应用户的语气较强硬,进而检测到第二语音信号满足音频处理条件。
[0106]进一步可选的,语音信号检测单元520,用于检测所述第二语音信号是否包括第二关键词数据库中的第二关键词,若所述第二语音信号包括所述第二关键词数据库中的第二关键词,则确定检测到所述第二语音信号满足所述第二关键词数据库中的第二关键词对应的音频处理条件。其中第二关键词数据库中的关键词例如可以包括“尼玛”、“纳尼”或者“靠”等语气助词。需要指出的是,第二关键词数据库和第一关键词数据库可以为同一关键词数据库,也可以为不同的关键词数据库,本发明实施例不做限定。
[0107]进一步可选的,第二语音信号携带所述第二终端对应用户的心率,则语音信号检测单元520,用于检测所述第二终端对应用户的心率是否大于预设心率阈值,若所述第二终端对应用户的心率大于所述预设心率阈值,则确定检测到所述第二语音信号满足所述第二终端对应用户的心率对应的音频处理条件。例如信号检测单元520检测到第二终端对应用户的心率大于预设心率阈值,则信号检测单元520可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二终端对应用户的心率对应的音频处理条件。
[0108]作为一种可选的实施方式,本发明实施例中的音频处理单元530可以如图7所示,进一步包括:
[0109]音频参数调整单元710,用于根据所述音频处理条件,调整所述第一终端的音频参数。其中音频参数可以包括振幅的幅度、频率或者相位等。
[0110]语音信号播放单元720,用于播放所述经过音频参数调整的所述第二语音信号。
[0111]例如语音信号获取单元510获取到的第一语音信号包括第一关键词“不好意思没听清楚”,则音频参数调整单元710可以根据第一关键词对应的音频处理条件调整第一终端的振幅的幅度,并播放经过幅度调整的第二语音信号,以便于第一终端对应用户在无需手动调整第一终端的音量的情况下,可以听清楚第二终端发送的第二语音信号,提升用户体验。
[0112]进一步可选的,音频参数可以包括所述语音信号的振幅的幅度,则本发明实施例中的音频参数调整单元710可以如图8所示,包括:
[0113]幅度获取单元810,用于获取当前振幅的幅度。
[0114]幅度调整单元820,用于根据所述音频处理条件,将自身的振幅的幅度调整为与所述当前振幅的幅度间隔第二预设幅度阈值的目标幅度。
[0115]例如幅度获取单元810获取到的第一终端的当前振幅的幅度为30此分贝,第二预设幅度阈值为10此,第一语音信号包括“不好意思没听清楚”,则幅度调整单元820可以将第一终端的振幅的幅度调整为40此;若第一语音信号包括“您声音能小点吗”,则幅度调整单元820可以将第一终端的振幅的幅度调整为20此,等等。
[0116]在图5所示的终端中,语音信号获取单元510获取与第二终端通话过程中采集到的语音信号,语音信号检测单元520检测到语音信号满足音频处理条件时,音频处理单元530根据音频处理条件对接收到的第二终端发送的第二语音信号的播放进行调整,音频处理效率较高,可提升通话质量。
[0117]请参见图9,图9是本发明第二实施例中提供的一种终端的结构示意图,如图9所示,该终端900包括:至少一个处理器910,例如0^,至少一个输入装置930,至少一个输出装置940,存储器950,至少一个总线920。其中,通信总线920用于实现这些组件之间的连接通信。例如,输入装置930可以包括触控板,输出装置940可以包括显示屏。存储器950可以是高速狀1存储器,也可以是非不稳定的存储器,例如至少一个磁盘存储器。存储器950可选的还可以是至少一个位于远离前述处理器910的存储终端。其中处理器910可以结合图5?图8所示的终端,其中:
[0118]输入装置930,用于获取与第二终端通话过程中采集到的语音信号。其中语音信号可以包括与第二终端通话过程中向第二终端发送的第一语音信号,也可以包括与第二终端通话过程中接收到的第二终端发送的第二语音信号。
[0119]存储器950中存储一组程序代码,且处理器910调用存储器950中存储的程序代码,用于执行以下操作:
[0120]检测语音信号是否满足音频处理条件。
[0121]若所述语音信号满足所述音频处理条件,则根据所述音频处理条件对接收到的所述第二终端发送的第二语音信号的播放进行调整。
[0122]作为一种可选的实施方式,语音信号可以包括向第二终端发送的第一语音信号,则处理器910可以检测所述第一语音信号是否包括第一关键词数据库中的第一关键词,若所述第一语音信号包括所述第一关键词数据库中的第一关键词,则确定检测到所述第一语音信号满足所述第一关键词数据库中的第一关键词对应的音频处理条件。其中第一关键词数据库中的关键词例如可以包括“您能再说一遍吗”、“不好意思没听清楚”或者“您声音能小点吗”等。
[0123]进一步可选的,处理器910检测所述第一语音信号是否包括第一关键词数据库中的第一关键词具体可以为:
[0124]将所述第一语音信号转化成字符串。
[0125]检测所述字符串是否包括所述第一关键词数据库中的第一关键词。
[0126]作为一种可选的实施方式,输入装置930获取与所述第二终端通话过程中接收到的所述第二终端发送的第二语音信号,则处理器910可以检测所述第二语音信号是否满足音频处理条件。
[0127]进一步可选的,处理器910可以检测所述第二语音信号的振幅的幅度是否大于第一预设幅度阈值,若所述第二语音信号的振幅的幅度大于所述第一预设幅度阈值,则确定检测到所述第二语音信号满足所述第二语音信号的振幅的幅度对应的音频处理条件。其中第二语音信号的振幅的幅度可以表示第二终端对应用户的声音响度,若第二语音信号的振幅的幅度大于第一预设幅度阈值,则处理器910可以识别到第二终端对应用户的声音较大,进而可以检测到第二语音信号满足音频处理条件。
[0128]进一步可选的,处理器910可以检测所述第二语音信号的频率是否大于预设频率阈值,若所述第二语音信号的频率大于所述预设频率阈值,则确定检测到所述第二语音信号满足所述第二语音信号的频率对应的音频处理条件。其中第二语音信号的频率可以表示第二终端对应用户的语调,若第二语音信号的频率大于预设频率阈值,则处理器910可以识别第二终端对应用户的语气较强硬,进而检测到第二语音信号满足音频处理条件。
[0129]进一步可选的,处理器910可以检测所述第二语音信号是否包括第二关键词数据库中的第二关键词,若所述第二语音信号包括所述第二关键词数据库中的第二关键词,贝0确定检测到所述第二语音信号满足所述第二关键词数据库中的第二关键词对应的音频处理条件。其中第二关键词数据库中的关键词例如可以包括“尼玛”、“纳尼”或者“靠”等语气助词。
[0130]进一步可选的,第二语音信号携带所述第二终端对应用户的心率,则处理器910可以检测所述第二终端对应用户的心率是否大于预设心率阈值,若所述第二终端对应用户的心率大于所述预设心率阈值,则确定检测到所述第二语音信号满足所述第二终端对应用户的心率对应的音频处理条件。例如处理器910检测到第二终端对应用户的心率大于预设心率阈值,则可以识别第二终端对应用户的情绪处于激动状态,进而可以确定检测到第二语音信号满足第二终端对应用户的心率对应的音频处理条件。
[0131]作为一种可选的实施方式,处理器910根据所述音频处理条件对接收到的所述第二终端发送的第二语音信号的播放进行调整具体可以为:
[0132]根据所述音频处理条件,调整所述第一终端的音频参数。其中音频参数可以包括振幅的幅度、频率或者相位等。
[0133]输出装置940播放所述经过音频参数调整的所述第二语音信号。
[0134]例如输入装置930获取到的第一语音信号包括第一关键词“不好意思没听清楚”,则处理器910可以根据第一关键词对应的音频处理条件调整第一终端的振幅的幅度,输出装置940播放经过幅度调整的第二语音信号,以便于第一终端对应用户在无需手动调整第一终端的音量的情况下,可以听清楚第二终端发送的第二语音信号,提升用户体验。
[0135]进一步可选的,音频参数可以包括所述语音信号的振幅的幅度,则处理器910调整所述第一终端的音频参数具体可以为:
[0136]获取当前振幅的幅度,并根据所述音频处理条件,将自身的振幅的幅度调整为与所述当前振幅的幅度间隔第二预设幅度阈值的目标幅度。
[0137]例如处理器910获取到的第一终端的当前振幅的幅度为30此分贝,第二预设幅度阈值为10此,第一语音信号包括“不好意思没听清楚”,则处理器910可以将第一终端的振幅的幅度调整为40此;若第一语音信号包括“您声音能小点吗”,则处理器910可以将第一终端的振幅的幅度调整为20(113,等等。
[0138]具体的,本发明实施例中介绍的终端900可以用以实施本发明结合图1、图2、图3或者图4介绍的音频处理方法实施例中的部分或全部流程。
[0139]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(0651(1-01117 1611101*7,^01)或随机存储记忆体^00688161110等。
[0140]需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明实施例所必须的。
[0141]本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
[0142]本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
[0143]本发明实施例中所述单元,可以通过通用集成电路,例如(06111:1-81?1~00688111^ 1)1111:,中央处理器),或通过八 310 0\卯11(331:1011 8^601^0011X1111:,专用集成电路)来实现。
[0144]以上对本发明实施例所提供的音频处理方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【权利要求】
1.一种音频处理方法,其特征在于,包括: 第一终端获取与第二终端通话过程中采集到的语音信号; 所述第一终端检测所述语音信号是否满足音频处理条件; 若所述语音信号满足所述音频处理条件,则所述第一终端根据所述音频处理条件对接收到的所述第二终端发送的第二语音信号的播放进行调整。
2.如权利要求1所述的方法,其特征在于,所述语音信号包括所述第一终端向所述第二终端发送的第一语音信号; 所述第一终端检测所述语音信号是否满足音频处理条件包括: 所述第一终端检测所述第一语音信号是否包括第一关键词数据库中的第一关键词; 若所述第一语音信号包括所述第一关键词数据库中的第一关键词,则所述第一终端确定检测到所述第一语音信号满足所述第一关键词数据库中的第一关键词对应的音频处理条件。
3.如权利要求2所述的方法,其特征在于,所述第一终端检测所述第一语音信号是否包括第一关键词数据库中的第一关键词包括: 所述第一终端将所述第一语音信号转化成字符串; 所述第一终端检测所述字符串是否包括所述第一关键词数据库中的第一关键词。
4.如权利要求1所述的方法,其特征在于,所述第一终端获取与第二终端通话过程中采集到的语音信号包括: 所述第一终端获取与所述第二终端通话过程中接收到的所述第二终端发送的第二语音信号。
5.如权利要求4所述的方法,其特征在于,所述第一终端检测所述语音信号是否满足音频处理条件包括: 所述第一终端检测所述第二语音信号的振幅的幅度是否大于第一预设幅度阈值; 若所述第二语音信号的振幅的幅度大于所述第一预设幅度阈值,则所述第一终端确定检测到所述第二语音信号满足所述第二语音信号的振幅的幅度对应的音频处理条件。
6.如权利要求4所述的方法,其特征在于,所述第一终端检测所述语音信号是否满足音频处理条件包括: 所述第一终端检测所述第二语音信号的频率是否大于预设频率阈值; 若所述第二语音信号的频率大于所述预设频率阈值,则所述第一终端确定检测到所述第二语音信号满足所述第二语音信号的频率对应的音频处理条件。
7.如权利要求4所述的方法,其特征在于,所述第一终端检测所述语音信号是否满足音频处理条件包括: 所述第一终端检测所述第二语音信号是否包括第二关键词数据库中的第二关键词; 若所述第二语音信号包括所述第二关键词数据库中的第二关键词,则所述第一终端确定检测到所述第二语音信号满足所述第二关键词数据库中的第二关键词对应的音频处理条件。
8.如权利要求4所述的方法,其特征在于,所述第二语音信号携带所述第二终端对应用户的心率; 所述第一终端检测所述语音信号是否满足音频处理条件包括: 所述第一终端检测所述第二终端对应用户的心率是否大于预设心率阈值; 若所述第二终端对应用户的心率大于所述预设心率阈值,则所述第一终端确定检测到所述第二语音信号满足所述第二终端对应用户的心率对应的音频处理条件。
9.如权利要求1所述的方法,其特征在于,所述第一终端根据所述音频处理条件对接收到的所述第二终端发送的第二语音信号的播放进行调整包括: 所述第一终端根据所述音频处理条件,调整所述第一终端的音频参数; 所述第一终端播放所述经过音频参数调整的所述第二语音信号。
10.如权利要求9所述的方法,其特征在于,所述音频参数包括所述语音信号的振幅的幅度; 所述第一终端根据所述音频处理条件,调整所述第一终端的音频参数包括: 所述第一终端获取当前振幅的幅度; 所述第一终端根据所述音频处理条件,将所述第一终端的振幅的幅度调整为与所述当前振幅的幅度间隔第二预设幅度阈值的目标幅度。
【文档编号】G10L21/003GK104299622SQ201410489767
【公开日】2015年1月21日 申请日期:2014年9月23日 优先权日:2014年9月23日
【发明者】叶泽钢, 陈强 申请人:深圳市金立通信设备有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1