一种音频处理方法、装置及移动终端与流程

文档序号：13914531阅读：180来源：国知局

本发明涉及多媒体领域，具体涉及一种音频处理方法、装置及移动终端。

背景技术：

目前，通过手机等移动终端进行的录音/摄像、语音/视频通话等等涉及语音的操作，通常是通过手机本体上已有的音频部件来完成。但是，用户在进行上述操作时，手机与用户之间的位置并不是一成不变的，如用户要进行视频通话时，为了更好的视频显示效果，用户需要与手机之间具有一定的距离，而在这个距离下，手机上的音频部件采集用户的声音就会出现问题，接收到的声音会变小，用户体验不佳。

技术实现要素：

本发明实施例提供了一种音频处理方法、装置及移动终端，解决了现有技术中使用移动终端上的音频部件采集声音导致音量无法保证，通话效果差的问题。

为了解决上述技术问题，本发明实施例提供了一种音频处理方法，包括：

分别通过机上拾音单元和活动拾音单元采集初始音频，所述机上拾音单元设置于移动终端上，所述活动拾音单元设置于所述移动终端之外，与所述移动终端相连；

分析各个所述初始音频，将所述初始音频进行降噪处理后，得到输出音频。

此外，本发明实施例还提供了一种音频处理装置，包括机上拾音单元、活动拾音单元以及处理器，所述机上拾音单元和处理器设置于移动终端上，所述活动拾音单元设置于所述移动终端之外，与所述移动终端相连；所述机上拾音单元和活动拾音单元分别采集初始音频并发送给所述处理器，所述处理器203分析所述初始音频，将所述初始音频进行降噪处理后，得到输出音频。

此外，本发明实施例还提供了一种移动终端，包括机上拾音单元和处理器，所述机上拾音单元用于采集初始音频并发送给所述处理器，所述处理器接收所述机上拾音单元以及活动拾音单元分别发送的初始音频，对所述初始音频进行降噪处理后，得到输出音频；所述活动拾音单元设置于所述移动终端之外，与所述移动终端相连。

此外，本发明实施例还提供了一种计算机存储介质，计算机存储介质中存储有计算机可执行指令，计算机可执行指令用于执行上述的音频处理方法。

有益效果

本发明实施例提供了一种音频处理方法、装置及移动终端，分别通过机上拾音单元和活动拾音单元采集初始音频，机上拾音单元设置于移动终端上，活动拾音单元设置于移动终端之外，与移动终端相连；分析各个初始音频，将初始音频进行降噪处理后，得到输出音频。通过本发明的实施，通过机上拾音单元和活动拾音单元两种途径采集初始音频，可以避免距离的限定而对音量有影响，且进行了降噪处理，用户体验佳。

附图说明

图1为本发明第一实施例提供的一种音频处理方法流程图；

图2为本发明第二实施例提供的一种音频处理装置组成示意图；

图3为本发明第三实施例提供的一种移动终端组成示意图；

图4为本发明第三实施例提供的一种音频处理方法启动流程图；

图5为本发明第三实施例提供的一种音频处理方法流程图。

具体实施方式

本发明的构思在于，分别通过设置于移动终端上的机上拾音单元和设置于移动终端之外的活动拾音单元采集初始音频，然后对音频进行降噪处理，免去了距离对音量的影响，且进行了降噪处理，用户体验佳。

下面结合附图对本发明的具体实施作进一步说明。

第一实施例

请参考图1，图1是本实施例提供的音频处理方法流程图。

s101、分别通过机上拾音单元和活动拾音单元采集初始音频，机上拾音单元设置于移动终端上，活动拾音单元设置于移动终端之外，与移动终端相连；

s102、分析各个初始音频，将初始音频进行降噪处理后，得到输出音频。

在通过移动终端进行录音/摄像、语音通话/视频通话的过程中，声音的质量是至关重要的。声音的质量，在这里主要指的是音量的大小、声音的可辨识度、音高、音色等等。在语音通话/视频通话的过程中，音高、音准等参数用户往往不会关心，主要是为了通话的对象能够听清用户说了什么，影响这点的主要是声音的大小，以及声音的可辨识度。声音的大小，也就是声音的音量，声音过小的话肯定会影响通话的质量，难以被对方听清，特别是当用户与移动终端还保持着一定的距离的时候，如当用户在进行视频通话，需要保持一定的距离来保证视频通话的效果，总之，用户不可能一直与移动终端保持固定且足够近的距离，仅仅靠移动终端上的机上拾音单元采集音频信息则难以保证用户的声音的音量。

s101中，通过机上拾音单元和活动拾音单元，采集初始声音。其中，机上拾音单元是设置在移动终端上的，例如手机一类的移动终端，现在的移动终端，其一般至少包括两个固定拾音单元，即两个麦克风。其中一个，设置于移动终端的底部，通话时靠近用户发声的部位，即嘴部；另一个，设置于移动终端的顶部或者背部，远离设置于移动终端底部的麦克风。这两个麦克风作为机上拾音单元，通常的具有通话功能的移动终端都会配备，有些移动终端会包括更多的麦克风。其中，位于移动终端底部的麦克风是主麦克风，而其他麦克风则是降噪麦克风。

以手机为例，在进行通话时，主麦克风主要用于采集用户的话音，由于其设置于手机的底部，与用户的嘴部更近，可以较好的采集到用户所说的话；但是，不可避免的，在主麦克风采集用户话音时，也会采集到环境中的其他声音，而这些声音在通话过程中最好是不要出现的，因此，手机上其他部分，与主麦克风设置位置较远的降噪麦克风的作用就是如此，降噪麦克风同样采集声音，这个声音则主要是环境中的其他声音，夹杂小音量的用户的话音；在通过主麦克风和降噪麦克风采集声音后，主麦克风和降噪麦克风的声音波形中，显然二者环境波形应该是相同，或者类似的，那么，将降噪麦克风采集到的声音的波形进行反向处理，再和主麦克风采集到的声音进行叠加操作，就可以在很大程度上过滤掉环境声音，而用户的话音则得到的保留，可以提升话音的清晰度，通话体验更好。

而在本实施例中，机上拾音单元可以包括所有位于移动终端上的麦克风，如主麦克风和降噪麦克风；本实施例中的音频处理方法不需要这么多的麦克风，因此，机上拾音单元也可以仅包括一个麦克风，如主麦克风或者降噪麦克风中任取一个。

而活动拾音单元，则不是设置于移动终端上，而是设置于移动终端之外，与移动终端相连。活动拾音单元与移动终端相连，可以通过蓝牙、红外、可见光通讯、无线局域网等等中的至少一种无线通讯方式相连；或，活动拾音单元与移动终端通过有线连接的方式相连。

与机上拾音单元不同，活动拾音单元不是固定的，而是可以随着用户的意愿来改变其位置，用户可以自如的将其放置在想放置的地方，在需要使用时，则可以放置在衣领、耳廓等地方，便于采集用户发出的声音。用户在发声时，通过活动拾音单元和机上拾音单元都可以采集到用户的声音，当然，这两者采集到的声音之间一般是会有区别的，因为用户的发声器官，即嘴部，与活动拾音单元和机上拾音单元之间的距离是不同的。一般而言，在使用过程中，距离更近的拾音单元，能够采集到的声音的音量更大，反之就更小。

各个拾音单元，包括机上拾音单元和活动拾音单元，采集初始音频的过程包括：将声音信号转换为模拟电信号；将模拟电信号转换为数字电信号，然后以数字电信号的形式进行传输。在本实施例中，初始音频指代的可以是声音信号，也可以是模拟电信号，也可以是数字电信号，即初始音频可以表征任何形态下的声音信号，并不限于转换前后的特定的信号。

s102中，分析各个初始音频，将初始音频进行降噪处理后，得到输出音频。通过机上拾音单元和活动拾音单元采集初始音频，那么，至少会有两个初始音频；这两个初始音频通过不同的拾音单元采集，根据拾音单元与声源位置的不同，采集到的声音的大小，或者说音量也不同。分析各个初始音频至少可以包括，分析各个初始音频的音量的大小。分析音量的大小，可以是指分析整个音频的音量的大小，也可以是分析在某个频率范围内的音量的大小，如在人声的发声频率范围内的音量的大小，可以作为判定初始音频的音量大小的标准。而判断音量大小的方式，可以是判断声音曲线的幅度、各拾音单元的振动幅度等等。

在本实施例中，将初始音频进行降噪处理后，得到输出音频包括：将各个初始音频中，音量最大的作为主音频，其他初始音频作为辅音频，对辅音频进行反向处理后，与主音频叠加，形成输出音频。其中，音量最大的初始音频，可以是以总体的音量作为参考，也可以是以人声频率范围内的音量作为参考。此外，在本实施例中，一般而言主音频只有一个，而辅音频则可能有多个，这是由于拾音单元可能不止两个造成的。那么，当辅音频具有两个或以上时，可以先对这些辅音频进行合成处理，或者，只取用其中一个辅音频，将这个辅音频反向后，与主音频进行叠加。

在本实施例中，将初始音频进行降噪处理后，得到输出音频包括：将活动拾音单元采集到的初始音频作为主音频，其他初始音频作为辅音频，对辅音频进行反向处理后，与主音频叠加，形成输出音频。在大部分场景中，当用户使用活动拾音单元时，往往其距离用户嘴部的距离会小于移动终端上的机上拾音单元，因此，活动拾音单元采集到的人声的音量一般会大于机上拾音单元，因此，可以直接将活动拾音单元采集到的初始音频作为主音频，而无需进行哪个初始音频的音量更大的判断。当然，也可以将机上拾音单元采集到的初始音频作为主音频，其处理过程与将活动拾音单元采集到的初始音频作为主音频类似。

此外，可选的，为了更好的通话效果，在本实施例中，在将初始音频作为主音频之后，还可以包括：对主音频进行增益和/或减益处理；其中，增益处理包括：将主音频中处于人声频率范围内的部分进行增益；减益处理包括：将主音频中处于人声频率范围外的部分进行减益。增益处理，就是增大采集到的声音的输出功率，可以在一定程度上提升音量，减益则与增益相反，是减小采集到的声音的输出功率，可以在一定程度上减小音量，体现在声音信号的波形上，增益处理会使得声音信号的波形的幅度变大，而减益处理会使得声音信号的波形的幅度变小。由于主音频的音量大，如果对人声频率范围内的部分进行增益的话，人声的内容就会更加突出，而对人声频率范围外的声音进行减益处理，则会进一步提升人声的辨识度。同时，由于辅音频的音量小，在进行反向，再和主音频叠加之后，增益的人声部分会更加突出，而减益的非人声部分则会在最大程度被抵消，保证了良好的通话/录制效果。

在本实施例中，除了可以以人声为核心进行声音采集之外，还可以以其他声音为核心进行采集，对于其他声音而言，则是距离声源越近的拾音单元所采集到的初始音频作为主音频，其他的初始音频作为辅音频。相应的，采集到的主音频也可以进行增益/减益处理，而增益/减益的对象变为了相应的声源发声的频率范围内/外，这里不再赘述。

本实施例提供了一种音频处理方法，分别通过活动拾音单元和机上拾音单元采集初始音频，然后对初始音频进行分析并进行降噪处理，得到输出音频，通过机上拾音单元和活动拾音单元两种途径采集初始音频，可以避免距离的限定而对音量有影响，且进行了降噪处理，用户体验佳。

第二实施例

请参考图2，图2是本实施例提供的一种音频处理装置组成示意图。

本实施例中的音频处理装置，包括机上拾音单元200、活动拾音单元10以及处理器203，机上拾音单元200和处理器203设置于移动终端20上，活动拾音单元10设置于移动终端20之外，与移动终端20相连；机上拾音单元200和活动拾音单元10分别采集初始音频并发送给处理器203，处理器203分析初始音频，将初始音频进行降噪处理后，得到输出音频。

机上拾音单元200是设置在移动终端20上的，例如手机一类的移动终端20，现在的移动终端20，其一般至少包括两个固定拾音单元，即两个麦克风。其中一个，设置于移动终端20的底部，通话时靠近用户发声的部位，即嘴部；另一个，设置于移动终端20的顶部或者背部，远离设置于移动终端20底部的麦克风。这两个麦克风作为机上拾音单元200，通常的具有通话功能的移动终端20都会配备，有些移动终端20会包括更多的麦克风。其中，位于移动终端20底部的麦克风是主麦克风，而其他麦克风则是降噪麦克风。对应的连接方式中，活动拾音单元10需要具备相应的功能，通常是增加相应的单元，当采用蓝牙的方式连接时，活动拾音单元10则需要具备蓝牙适配器，通过蓝牙适配器与移动终端20连接；当采用红外的方式连接时，活动拾音单元10则需要具备红外收发器，通过红外收发器与移动终端20建立连接。在正常使用之前，活动拾音单元10需要与移动终端20进行配对，配对的过程因连接方式的不同而有所区别。以蓝牙连接为例，首先，需要活动拾音单元10和移动终端20都启用蓝牙通讯功能，然后移动终端20查找蓝牙设备，查找到开启了蓝牙通讯功能的活动拾音单元10后，建立连接，提示配对成功后，活动拾音单元10和移动终端20就具备了蓝牙交互的条件，活动拾音单元10就可以采集初始音频然后通过蓝牙通讯发送给移动终端20。

现在的移动终端20中，往往具备多种无线通讯方式，如蓝牙、红外、可见光通讯、无线局域网连接等等，这些连接方式中，各自只能建立一个连接，即移动终端20只能通过蓝牙连接一个蓝牙设备，只能通过红外连接一个红外设备，只能通过无线局域网连接一个局域网设备，这是因为在移动终端20中，像蓝牙适配器、红外收发器、无线芯片等等无线通讯单元，通常各自只设置了一个，当这一个被占用时，就不能再用同样的方式连接其他的设备了。当然，几个不同的连接方式之间一般是没有冲突的，移动终端20可以同时以蓝牙、红外、无线局域网的方式与一个或多个设备相连。在本实施例中，一个移动终端20可以自如的设置一个或者多个前述的无线通讯单元，以满足多个设备的连接需求。

而在本实施例中，机上拾音单元200可以包括所有位于移动终端20上的麦克风，如主麦克风和降噪麦克风；本实施例中的音频处理方法不需要这么多的麦克风，因此，机上拾音单元200也可以仅包括一个麦克风，如主麦克风或者降噪麦克风中任取一个。

活动拾音单元10，则不是设置于移动终端20上，而是设置于移动终端20之外，与移动终端20相连。活动拾音单元10与移动终端20相连，可以通过蓝牙、红外、可见光通讯等等中的至少一种无线通讯方式相连；或，活动拾音单元10与移动终端20通过有线连接的方式相连。

有线连接的方式则是通过音频连接线，与移动终端20上的音频接口相连；移动终端20上的音频接口一般是输入/输出接口共用，即输入接口和输出接口设置在一个地方；一般的音频连接线则可能是只有输入接头，或者只有输出接头，还可以是输出接头和输入接头设置在一起。活动拾音单元10通过音频连接线与移动终端20连接时，至少应通过具备输入接头的音频连接线相连。由于移动终端20的接口中，国家标准和国际标准有区别，因此可以设置相应的转接器来实现正常连接。

与机上拾音单元200不同，活动拾音单元10不是固定的，而是可以随着用户的意愿来改变其位置，用户可以自如的将其放置在想放置的地方，在需要使用时，则可以放置在衣领、耳廓等地方，便于采集用户发出的声音。用户在发声时，通过活动拾音单元10和机上拾音单元200都可以采集到用户的声音，当然，这两者采集到的声音之间一般是会有区别的，因为用户的发声器官，即嘴部，与活动拾音单元10和机上拾音单元200之间的距离是不同的。一般而言，在使用过程中，距离更近的拾音单元，能够采集到的声音的音量更大，反之就更小。

在其中一个应用场景中，用户将活动拾音单元10置于衣领上，向前伸长手臂将移动终端20持在手中，那么，这种场景下活动拾音单元10距离用户更近，那么活动拾音单元10所采集到的用户的声音较大，而移动终端20上的机上拾音单元200，包括主麦克风或降噪麦克风，所采集到的声音则较小。

在其中一个应用场景中，用户将活动拾音单元10放置于桌面上，用户携带着移动终端20，将移动终端20置于嘴边，那么，这种场景下，机上拾音单元200距离用户更近，那么机上拾音单元200所采集到的用户的声音较大，而活动拾音单元10采集到的用户的声音更小。

处理器203分析各个初始音频，将处理音频进行降噪处理后，得到输出音频。通过机上拾音单元200和活动拾音单元10采集初始音频，那么，至少会有两个初始音频；这两个初始音频通过不同的拾音单元采集，根据拾音单元与声源位置的不同，采集到的声音的大小，或者说音量也不同。分析各个初始音频至少可以包括，分析各个初始音频的音量的大小。分析音量的大小，可以是指分析整个音频的音量的大小，也可以是分析在某个频率范围内的音量的大小，如在人声的发声频率范围内的音量的大小，可以作为判定初始音频的音量大小的标准。而判断音量大小的方式，可以是判断声音曲线的幅度、各拾音单元的振动幅度等等。

在本实施例中，处理器203还可以用于：将各个初始音频中，音量最大的作为主音频，其他初始音频作为辅音频，对辅音频进行反向处理后，与主音频叠加，形成输出音频。其中，音量最大的初始音频，可以是以总体的音量作为参考，也可以是以人声频率范围内的音量作为参考。此外，在本实施例中，一般而言主音频只有一个，而辅音频则可能有多个，这是由于拾音单元可能不止两个造成的。那么，当辅音频具有两个或以上时，可以先对这些辅音频进行合成处理，或者，只取用其中一个辅音频，将这个辅音频反向后，与主音频进行叠加。

在本实施例中，处理器203还可以用于：将活动拾音单元10采集到的初始音频作为主音频，其他初始音频作为辅音频，对辅音频进行反向处理后，与主音频叠加，形成输出音频。在大部分场景中，当用户使用活动拾音单元10时，往往其距离用户嘴部的距离会小于移动终端20上的机上拾音单元200，因此，活动拾音单元10采集到的人声的音量一般会大于机上拾音单元200，因此，可以直接将活动拾音单元10采集到的初始音频作为主音频，而无需进行哪个初始音频的音量更大的判断。

此外，可选的，为了更好的通话/录制效果，处理器203还可以用于：对主音频进行增益和/或减益处理；其中，增益处理包括：将主音频中处于人声频率范围内的部分进行增益；减益处理包括：将主音频中处于人声频率范围外的部分进行减益。

本实施例还提供了一种移动终端20，包括前述的机上拾音单元200和处理器203。

本实施例提供了一种移动终端，分别通过活动拾音单元和机上拾音单元采集初始音频，然后处理器对初始音频进行分析并进行降噪处理，得到输出音频，通过机上拾音单元和活动拾音单元两种途径采集初始音频，可以避免距离的限定而对音量有影响，且进行了降噪处理，用户体验佳。

第三实施例

请参考图3，图3是本实施例提供的一种移动终端的组成示意图。

本实施例中的移动终端20，包括机上拾音单元200和处理器203，其中机上拾音单元200用于采集初始音频，处理器203则用于处理机上拾音单元200和活动拾音单元10采集的初始音频，进行降噪处理后，得到输出音频。其中，活动拾音单元10设置于移动终端20之外，与移动终端20相连。

严格而言，活动拾音单元10可以属于移动终端20，也可以不属于移动终端20，活动拾音单元10可以是一个通用型配件，可以与任何能够交互的移动终端20连接，并进行音频的采集。

为了建立活动拾音单元10和移动终端20之间的连接，在本实施例中，以蓝牙连接为例，活动拾音单元10包括：活动麦克风101，活动麦克风101为模拟或者数字麦克，声电转换器件，将语音信号转换为电信号；活动预处理单元102将语音电信号进行放大，模数转换，调制等处理，转换为数字信号，预处理后，将语音数字信号传输到蓝牙处理器103上，蓝牙处理器103将信号调制上变频通过第一天线104无线方式发送传输出去给移动终端20。本实施例中的活动拾音单元10，可以是无线/有线麦克风。

活动拾音单元10和移动终端20之间通过蓝牙通讯建立连接。

移动终端20包括，第二天线201，蓝牙适配器202，第二天线201接收活动拾音单元10发送的蓝牙信号，蓝牙适配器202将蓝牙信号接收并进行解调处理发送到移动终端20中的处理器203中，处理器203通过识别，确定输入的设备，此处的输入设备是活动拾音单元10。另外，移动终端20中的机上预处理单元连接移动终端20上的机上拾音单元200，机上拾音单元200包括第一麦克205和第二麦克206，机上预处理单元204将第一麦克205和第二麦克206接收到的语音信号进行模数转换，调制并放大等处理，将信号传输到处理器203中，处理器203将通过蓝牙传输来的音频数据和第一第二麦克的音频数据进行降噪处理和优化，得到输出音频。

在本实施例中，音频处理方法的启动过程如下，请参考图4：

s401、活动拾音单元10和移动终端20建立连接；

s402、移动终端20识别接入的是活动拾音单元10；

s403、通过音频处理方法，进行音频的采集处理，得到输出音频。

其中，活动拾音单元10和移动终端20建立连接的过程，就是活动拾音单元10和移动终端20的蓝牙配对的过程；首先，需要活动拾音单元10和移动终端20都启用蓝牙通讯功能，然后移动终端20查找蓝牙设备，查找到开启了蓝牙通讯功能的活动拾音单元10后，建立连接，提示配对成功后，活动拾音单元10和移动终端20就具备了蓝牙交互的条件。

当移动终端20确定所连的设备，是活动拾音单元10时，那么，在移动终端20的通话/录音过程中，启用本发明各实施例中的音频处理方法。

下面，将对音频处理方法做进一步说明，请参考图5：

s501、蓝牙配对成功，监测到蓝牙设备为活动拾音单元10；

s502、启用音频处理系统，采集各个初始音频；

s503、比较第一麦克采集的初始音频，第二麦克采集的初始音频，以及通过蓝牙传输来的活动拾音单元10接收的初始音频，将音量最高的作为主音频(有用音频输入)，音量最弱的作为辅音频(背景噪音)；

s504、将背景噪音进行反向处理；

s505、将反向后的背景噪音与有用音频输入进行叠加，得到输出音频。

显然，本领域的技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储介质(rom/ram、磁碟、光盘)中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以，本发明不限制于任何特定的硬件和软件结合。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：万晓玲
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种CPE智能快速联网设备的制作方法
上一篇：一种车用手机支架的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。