通话音量自动调节方法及装置的制作方法

文档序号：2822507阅读：659来源：国知局

专利名称：：通话音量自动调节方法及装置的制作方法
技术领域：
：本发明实施例涉及通信
技术领域：
，尤其涉及一种通话音量自动调节方法及装置。
背景技术：
：手机作为一种大众化电子产品，已经成为生活的必需品，其移动性为人们提供了很大的方便。由于手机的移动性，使得用户可以在各种环境中使用手机，例如比较安静的环境或比较嘈杂的环境。然而，当用户在不同的环境中使用手机进行通话时，环境噪音对用户的干扰不同。在比较嘈杂的环境中进行通话时，手机的通话音量可能让用户很难听清楚；而在比较安静的环境中进行通话时，手机的通话音量可能又显得过大。为了实现能够在不同的环境中调节手机的通话音量，现有技术提供了以下方法通过对手机设置不同的模式来对应不同的应用环境或者在手机上设置通话音量调节按钮，使得用户可以在不同的应用环境中，选择不同的通话音量；其中，对手机设置不同的模式例如会议模式、户外模式等。然而，用户在通话时，手机一般是紧贴面部的，很难通过手动选择模式或手动调节音量调节按钮来调节通话音量。为了能够自动调节手机的通话音量，现有技术又提供了以下两种方法。第一种方法为在手机上增加噪音采集器，在通话过程中，通过该噪音采集器采集环境噪音，然后根据采集到的环境噪音自动调节通话音量的大小。然而，在用户通话过程中，由于用户距离噪音采集器的距离远小于环境噪音距离噪音采集器的距离，噪音采集器会把用户自身的语音也当成噪音进行采集，由此会造成不准确的音量调节。第二种方法为利用通信原理，当麦克风(Microphone,以下简称为MIC)采集到的语音能量低于一定阈值时，判断出用户处于静默期(用户没有讲话)，然后通过噪音采集器采集静默期时的环境噪音，再根据该环境噪音自动调节通话音量的大小。然而，在比较嘈杂的环境中，当用户没有讲话时，MIC采集到的语音能量仍然高于阈值，使得无法判断出用户处于静默期，从而无法采集到环境噪音，由此也会造成音量调节的不准确，甚至无法达到调节的目的。
发明内容本发明实施例提供一种通话音量自动调节方法及装置，用以解决现有技术中通话音量自动调节不准确的缺陷，实现准确的自动调节通话音量。本发明实施例提供一种通话音量自动调节方法，包括通过麦克风采集总语音数据，并计算所述总语音数据的能量；所述总语音数据包括用户语音数据和环境噪音数据；根据所述用户语音数据的自相关性，获取所述用户语音数据的能量；将所述总语音数据的能量与所述用户语音数据的能量相减，获得所述环境噪音数据的能量；根据所述环境噪音数据的能量，调节通话音量。本发明实施例提供一种通话音量自动调节装置，包括第一计算模块，用于通过麦克风采集总语音数据，并计算所述总语音数据的能量；所述总语音数据包括用户语音数据和环境噪音数据；获取模块，用于根据所述用户语音数据的自相关性，获取所述用户语音数据的能第二计算模块，用于将所述总语音数据的能量与所述用户语音数据的能量相减，获得所述环境噪音数据的能量；调节模块，用于根据所述环境噪音数据的能量，调节通话音量。本发明实施例的通话音量自动调节方法及装置，通过使用用户终端自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音中获得环境噪音的能量，然后根据该环境噪音的能量自动调节通话音量，实现了准确的自动调节通话音量。为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本发明通话音量自动调节方法实施例一的流程图图2为本发明通话音量自动调节方法实施例二的流程图图3为本发明通话音量自动调节装置实施例一的结构图图4为本发明通话音量自动调节装置实施例二的结构图，具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。图1为本发明通话音量自动调节方法实施例一的流程图，如图1所示，该方法包括步骤101、通过麦克风采集总语音数据，并计算总语音数据的能量；该总语音数据包括用户语音数据和环境噪音数据。本发明实施例提供的方法，可以在用户使用各种手机或其它移动通讯设备进行通话时，自动调节听筒中播放出的通话的音量。本实施例以手机为例进行说明。其中该手机可以为GSM、CDMA、WCDMA、TDS-CDMA等任何制式的手机。在用户使用手机进行通话的过程中，无论用户说话与否，可以一直通过手机的麦克风采集到通话过程中的总语音的音频信号，在用户说话时，采集到的总语音包括用户自身的语音和环境噪音，在用户处于静默期时，采集到的总语音主要包括环境噪音；然后将该总语音的音频信号进行模数转换，转换成PCM(PulseCodeModulation,脉码调制录音)格式的总语音数据，该总语音数据包括用户自身的语音数据和用户所述环境的环境噪音数据；该过程可以利用手机自身的通话功能一起完成。然后，计算出该总语音数据的能量。步骤102、根据用户语音数据的自相关性，获取用户语音数据的能量。每个用户本身的语音频谱具有其独特性，也就是每个用户自身语音数据的相关性较高，并且用户语音距离麦克风通常只有几厘米的距离。而用户在通过过程中所处环境的环境噪音的来源可能有多方面，例如周边的其他人、汽车或机器等其它声音来源。这些环境噪音距离麦克风的距离有近有远，但该距离通常都远远大于用户语音距离麦克风的距离，这些环境噪音和用户自身的语音迭加在一起。迭加之后的总语音是随机的。利用用户语音数据之间的自相关性，把PCM格式的总语音数据通过例如巻积迭加、最大似然、非线性拟合或多阶纬度变换等方法计算，可以计算出用户语音数据的自相关性，从而可以通过计算获取到用户语音数据的能量。步骤103、将总语音数据的能量与用户语音数据的能量相减，获得环境噪音数据的能量。根据步骤101和步骤102中得到的总语音数据的能量和用户语音数据的能量，可以计算得到环境噪音数据的能量。在用户进行通话的过程中，一般情况下，用户是在说话或者是在静默(在听对方说话)，通过本发明实施例提供的方法，无论用户是否正在说话，还是处于静默期间，都可以根据用户语音的自相关性特点，计算出环境噪音的能量。步骤104、根据环境噪音数据的能量，调节通话音量。根据上述计算得到的环境噪音数据的能量，可以调节通话音量的大小。当环境噪音比较大时，将通话音量调节的较大，当环境噪音比较小时，将通话音量调节的较小。具体的，调节通话音量可以使用绝对值或相对值调节，也可以使用更智能的分节调节。其中，绝对值调节可以是调节听筒播放的语音音量大于环境噪音一个固定值，直至达到最大音量限制；相对调整可以是调节听筒播放的语音音量占该语音音量和环境噪音能量之和一个固定的比例；分节调节可以是考虑到用户使用的舒适度，根据环境噪音数据的能量的大小，分节调节听筒播放的语音音量。通过上述方法获得到所需的通话音量的调节值后，将该调节值通知手机中PCM解码器和数模转换器，将PCM格式的语音数据经过数模转换，转换成模拟信号并通过听筒播放出来；其中在进行数模转换时，调节通话音量。本发明实施例的通话音量自动调节方法，通过使用用户终端自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音数据中获得环境噪音数据的能量，然后根据该环境噪音数据的能量自动调节通话音量，实现了准确的自动调节通话音量。图2为本发明通话音量自动调节方法实施例二的流程图，在本发明方法实施例一的基础上，如图2所示，该方法包括步骤201、每隔预设时间间隔通过麦克风采集总语音数据，并计算总语音数据的能量；该总语音数据包括用户语音数据和环境噪音数据。具体的，记录建立通话连接的时间和时间间隔，在建立通话连接后的第一时间段内，每隔第一预设时间间隔通过麦克风采集总语音数据，并计算总语音数据的能量；在建立通话连接后的第二时间段内，每隔第二预设时间间隔通过麦克风采集总语音数据，并计算总语音数据的能量；第二时间段位于第一时间段之后，第二预设时间间隔大于第一预设时间间隔。由于手机用户所处的环境的噪音水平可能是在不停的变化的，为了确保通话音量自动调节的实时性和准确性，可以周期性计算环境噪音水平并周期性的调节通话音量。通常的情况是，在通话刚刚建立的一段时间内，手机用户为了选择一个合适的通话环境，可能会不停的选择新的环境。由此，为了提高用户的舒适度，在通话刚刚建立的一段时间内，计算环境噪音水平并调节通话音量的周期可以短一些，即可以每隔一个较短的预设时间间隔通过麦克风采集总语音数据；在通话建立一段时间之后，计算环境噪音水平并调节通话音量的周期可以长一些，即可以每隔一个较长的预设时间间隔通过麦克风采集总语音数据。步骤202、根据巻积迭加、最大似然、非线性拟合或多阶纬度变换方法，计算用户语音数据的自相关性；根据用户语音数据的自相关性，获取用户语音数据的能量。其中，计算用户语音数据自相关性的时间长度可以是经验值，也可以是通过模拟仿真试验得到。计算用户语音数据自相关性的时间越长，计算的越精确，同时，也会对功耗等影响越大。由此，只需要根据经验值或模拟仿真试验结果选择一个合理的时间长度即可。下面以巻积迭加方法为例，说明本步骤的具体实现过程。用户说话的语速一般为5个/秒，即每个字一般有200ms的时间或者说用户在200ms中说一个字，在这200ms中，用户语音信号除了信号强度有一定的变化以外，频率特性基本保持不变，在此过程中对语音信号进行采样处理，可以在一定程度上对用户语音信号和噪音信号进行某种程度上的区分；其中，该200ms即为上述的计算用户语音数据自相关性的时间长度。本步骤具体可以为假设用户在通话过程中的语音信号为X(t)，(t:时间，单位为秒)；噪声信号为N(t);则通过麦克风采集到的总语音信号为X(t)+N(t)。假设在200ms时间内进行1600次采样(采样率为8khz)，将1600个采样数据分成10组，每组160个采样数据，表示为a[10][160]，每个采样周期内得到数据为a[10]，a[i]=x[i*20+j*t0];i={0，1，2，3，......9}，j={0，1，2，3......159}，t0为采样基本周期，可根据实际采样率情况调整。根据采样值可通过均方根算法计算当前信号的能量。由于需要考虑采样和用户说话的同步问题，在这10组中最少有5组是处于同一发音状态(包括静默状态)，假设在采样过程中、a[2]、a[3]、a[4]、a[5](其中a[l]代表向量(a[l][O]a[l][l]a[l][2]a[l][3]......a[l][159]})是用户的同一发音采样。计算bm^^^^+u+^.^w-"/2，若b[i]〉;^l"wl，则认为a[i]为有效采样数据。通过b[i]可以计算出在这个时间段内用户语音信号的能量。步骤203、将总语音数据的能量与用户语音数据的能量相减，获得环境噪音数据的能量。步骤204、根据环境噪音数据的能量，获取与环境噪音数据的能量对应的第一音其中，根据调节需要，可以预先配置环境噪音数据的能量与音量的对应关系，较高的环境噪音数据的能量对应较大的音量，较低的环境噪音数据的能量对应较小的音量，然后根据该音量调节通话音量。声音的音量和声音的能量在理想状态下为线性关系，可通过简单的计算相互转换，由此本发明实施例也可以通过计算得到环境噪音数据的能量对应的笛——立兽果曰里。步骤205、根据第一音量，调节通话音量。调节通话音量可以使用绝对值或相对值调节，也可以使用更智能的分节调节，具体的调节方法可以采用如下方法绝对值调节根据第一音量，调节通话音量，使通话音量等于第一音量与一预设值之和。通过绝对值调节，使得听筒播放的通话音量始终比当前环境噪音数据的能量对应的音量大一个预设值。相对值调节根据第一音量，调节通话音量，使通话音量与通话音量和第一音量之和的比值为一预设比值。通过相对值调节，使得听筒播放的通话音量始终占该通话音量和当前环境噪音数据的能量对应的音量之和一个预设比值。分节调节可以应用在绝对值或者相对值调节之中，当使用分节调节时，绝对值或相对值调节中的预设值或预设比值就不是一个定值，而是根据预设的调节步长，随着环境噪音数据的能量的增大而增大。具体的分节调节可以为根据环境噪音数据的能量水平等级，选择音量调节的调节步长，当环境噪音数据的能量水平等级较高，也就是当环境噪音较大时，选择调节步长较大，当环境噪音数据的能量水平等级较低时，选择调节步长较小。例如可以把环境噪音数据的能量水平分为5个等级，每个等级对应有其调节步长，如表1所示，其中每个等级对应的调节步长可以预设为固定的值。表1<table>tableseeoriginaldocumentpage8</column></row><table>本发明实施例的通话音量自动调节方法，通过使用用户终端自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音数据中获得环境噪音数据的能量，然后根据该环境噪音数据的能量自动调节通话音量，实现了准确的自动调节通话音量。本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。图3为本发明通话音量自动调节装置实施例一的结构图，如图3所示，该装置包括第一计算模块31、获取模块33、第二计算模块35和调节模块37。第一计算模块31用于通过麦克风采集总语音数据，并计算总语音数据的能量；总语音数据包括用户语音数据和环境噪音数据。获取模块33用于根据用户语音数据的自相关性，获取用户语音数据的能量。第二计算模块35用于将总语音数据的能量与用户语音数据的能量相减，获得环境噪音数据的能量。调节模块37，用于根据环境噪音数据的能量，调节通话音量。本实施例中的各模块的工作原理和工作流程，参见本发明各方法实施例中的描述，在此不再赘述。本发明实施例的通话音量自动调节装置，通过使用用户终端自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音数据中获得环境噪音数据的能量，然后根据该环境噪音数据的能量自动调节通话音量，实现了准确的自动调节通话音量。图4为本发明通话音量自动调节装置实施例二的结构图，在本发明装置实施例一的基础上，如图4所示，第一计算模块31包括计时单元311和第一计算单元313;获取模块33包括第二计算单元331和获取单元333;调节模块37包括音量获取单元371，以及第一调节单元373和/或第二调节单元375。第一计算单元313进一步包括第一子单元和第二子单元。计时单元311用于记录时间间隔。第一计算单元313用于每隔预设时间间隔通过麦克风采集总语音数据，并计算总语音数据的能量。第一子单元用于在建立通话连接后的第一时间段内，每隔第一预设时间间隔通过麦克风采集总语音数据，并计算总语音数据的能量。第二子单元用于在建立通话连接后的第二时间段内，每隔第二预设时间间隔通过麦克风采集总语音数据，并计算总语音数据的能量。第二时间段位于第一时间段之后，第二预设时间间隔大于第一预设时间间隔。第二计算单元331用于根据巻积迭加、最大似然、非线性拟合或多阶纬度变换方法，计算用户语音数据的自相关性。获取单元333用于根据用户语音数据的自相关性，获取用户语音数据的能量。音量获取单元371用于根据环境噪音数据的能量，获取第一音量。第一调节单元373用于根据第一音量，调节通话音量，使通话音量等于第一音量与一预设值之和。第二调节单元375用于根据第一音量，调节通话音量，使通话音量与通话音量和第一音量之和的比值为一预设比值。本实施例中的各模块的工作原理和工作流程，参见本发明各方法实施例中的描述，在此不再赘述。本发明实施例的通话音量自动调节装置，通过使用用户终端自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音数据中获得环境噪音数据的能量，然后根据该环境噪音数据的能量自动调节通话音量，实现了准确的自动调节通话音量。本发明实施例还提供了一种用户终端，该用户终端包括麦克风和本发明实施例提供的任一通话音量自动调节装置。本实施例中的各模块的工作原理和工作流程，参见本发明各方法实施例中的描述，在此不再赘述。本发明实施例提供的用户终端，可以通过其自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音数据中获得环境噪音数据的能量，然后根据该环境噪音数据的能量自动调节通话音量，实现了准确的自动调节通话音量。最后应说明的是以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。权利要求一种通话音量自动调节方法，其特征在于，包括通过麦克风采集总语音数据，并计算所述总语音数据的能量；所述总语音数据包括用户语音数据和环境噪音数据；根据所述用户语音数据的自相关性，获取所述用户语音数据的能量；将所述总语音数据的能量与所述用户语音数据的能量相减，获得所述环境噪音数据的能量；根据所述环境噪音数据的能量，调节通话音量。2.根据权利要求1所述的通话音量自动调节方法，其特征在于，所述根据用户语音数据的自相关性，获取所述用户语音数据的能量包括根据巻积迭加、最大似然、非线性拟合或多阶纬度变换方法，计算所述用户语音数据的自相关性；根据用户语音数据的自相关性，获取所述用户语音数据的能量。3.根据权利要求1所述的通话音量自动调节方法，其特征在于，所述根据所述环境噪音数据的能量，调节通话音量包括根据所述环境噪音数据的能量，获取与所述环境噪音数据的能量对应的第一音量；根据所述第一音量，调节所述通话音量，使所述通话音量等于所述第一音量与一预设值之和；或者，根据所述第一音量，调节所述通话音量，使所述通话音量与所述通话音量和所述第一音量之和的比值为一预设比值。4.根据权利要求3所述的通话音量自动调节方法，其特征在于，所述预设值或所述预设比值随着所述环境噪音数据的能量的增大而增大。5.根据权利要求l-4任一所述的通话音量自动调节方法，其特征在于，所述通过麦克风采集总语音数据，并计算所述总语音数据的能量包括每隔预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量。6.根据权利要求5所述的通话音量自动调节方法，其特征在于，所述每隔预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量包括在建立通话连接后的第一时间段内，每隔第一预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量；在建立通话连接后的第二时间段内，每隔第二预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量；所述第二时间段位于所述第一时间段之后，所述第二预设时间间隔大于所述第一预设时间间隔。7.—种通话音量自动调节装置，其特征在于，包括第一计算模块，用于通过麦克风采集总语音数据，并计算所述总语音数据的能量；所述总语音数据包括用户语音数据和环境噪音数据；获取模块，用于根据所述用户语音数据的自相关性，获取所述用户语音数据的能量；第二计算模块，用于将所述总语音数据的能量与所述用户语音数据的能量相减，获得所述环境噪音数据的能量；调节模块，用于根据所述环境噪音数据的能量，调节通话音量。8.根据权利要求7所述的通话音量自动调节装置，其特征在于，所述获取模块包括第二计算单元，用于根据巻积迭加、最大似然、非线性拟合或多阶纬度变换方法，计算所述用户语音数据的自相关性；获取单元，用于根据用户语音数据的自相关性，获取所述用户语音数据的能量。9.根据权利要求7所述的通话音量自动调节装置，其特征在于，所述调节模块包括音量获取单元，用于根据所述环境噪音数据的能量，获取与所述环境噪音数据的能量对应的第一音量；第一调节单元，用于根据所述第一音量，调节所述通话音量，使所述通话音量等于所述第一音量与一预设值之和；和/或，第二调节单元，用于根据所述第一音量，调节所述通话音量，使所述通话音量与所述通话音量和所述第一音量之和的比值为一预设比值。10.根据权利要求7-9任一所述的通话音量自动调节装置，其特征在于，所述第一计算模块包括计时单元，用于记录时间间隔；第一计算单元，用于每隔预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量。11.根据权利要求io所述的通话音量自动调节装置，其特征在于，所述第一计算单元包括第一子单元，用于在建立通话连接后的第一时间段内，每隔第一预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量；第二子单元，用于在建立通话连接后的第二时间段内，每隔第二预设时间间隔通过麦克风采集总语音数据，并计算所述总语音数据的能量；所述第二时间段位于所述第一时间段之后，所述第二预设时间间隔大于所述第一预设时间间隔。全文摘要本发明提供一种通话音量自动调节方法及装置，该方法包括通过麦克风采集总语音数据，并计算总语音数据的能量；总语音数据包括用户语音数据和环境噪音数据；根据用户语音数据的自相关性，获取用户语音数据的能量；将总语音数据的能量与用户语音数据的能量相减，获得环境噪音数据的能量；根据环境噪音数据的能量，调节通话音量。本发明实施例的通话音量自动调节方法及装置，通过使用用户终端自身的麦克风采集用户的语音和环境噪音，并根据用户语音的自相关性和环境噪音的随机性，从麦克风采集到的总语音中获得环境噪音的能量，然后根据该环境噪音的能量自动调节通话音量，实现了准确的自动调节通话音量。文档编号G10L21/00GK101740036SQ20091025427公开日2010年6月16日申请日期2009年12月14日优先权日2009年12月14日发明者吴开涛,王培雷,韩晓征申请人:深圳华为通信技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩晓征;吴开涛;王培雷
技术所有人：深圳华为通信技术有限公司
我是此专利的发明人

上一篇：声音处理方法及装置的制作方法
上一篇：信息处理设备、声音素材捕获方法和程序的制作方法