生成下混信号的方法和装置的制造方法

文档序号：10661556阅读：373来源：国知局

生成下混信号的方法和装置的制造方法
【专利摘要】本发明实施例公开了一种生成下混信号的方法和装置。本发明实施例方法包括：获取预置声道集合中各声道的音频信号；对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号；根据所述初始下混信号中的各峰值确定目标峰值；获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限；当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。
【专利说明】
生成下混信号的方法和装置
技术领域
[0001] 本发明涉及音频处理技术领域，尤其涉及一种生成下混信号的方法和装置。
【背景技术】
[0002] 声道是声音在录制或者播放时在不同空间位置采集或者回放的相互独立的音频信号。声道数是声音录制时的音源数量或者回放时相应的扬声器数量。用于将多声道音频信号转换为双声道信号的技术通常被称为下混合技术。利用下混合技术，可由具有两个声道和两个扬声器箱的普通立体声装备再现原始多声道音频信号。
[0003] 目前，广泛运用的多声道音频信号为5.1声道系统，该5.1声道系统中，包括左前方环绕声道L、右前方环绕声道R、中置环绕声道C、左后方环绕声道Ls和右后方环绕声道Rs。在国际电信联盟（英文：International Telecommunication Uni on，缩写：ITU)规定的从5 · 1 声道混合到2.0立体声的过程中，将左前方环绕声道L、中置环绕声道C、左后方环绕声道Ls 该三个声道的音频信号下混从立体声左声道Lo输出，将右前方环绕声道R、中置环绕声道C 和右后方环绕声道Rs该三个声道的音频信号下混从立体声右声道R〇输出。具体的，一般根据以下公式计算出立体声左声道Lo和立体声右声道Ro的音频信号:L〇 = L+0.707*C+0.707* Ls，R〇 = R+0 · 707*C+0 · 707*Rs。
[0004] 音频信号包括每秒钟内对音频的所有采样值，其中每一个采样值为采样周期内声音模拟信号的积分值，用于表示声音的振幅。在双声道立体声音频信号中，一般一个采样值用16位(2字节)记录。可以看出，在上面两个公式中，当L = C = Ls = 32767(也即16位的最大值)时，根据公式计算出的Lo为79099.538,该数值超过了 16位能记录的范围。因此，在无法预知这个发生的情况下，ITU的做法是强制整个运算多除以一个系数1+0.707+0.707，也即 Lo= (L+0 · 707*C+0 · 707*Ls)/( 1+0 · 707+0 · 707)，Ro = (R+0 · 707*C+0 · 707*Rs)/( 1+0 · 707+ 0.707)，以避免溢出的发生。
[0005] 然而，这导致下混合后的音频的响度损失。根据分贝换算公式20*logl0(lAl + 0.7071+0.7071))约等于7.65dB可知，下混合后的音频相比原音频丢失了约7.56dB的响度。

【发明内容】

[0006] 本发明实施例提供了一种生成下混信号的方法和装置，能够在保证下混信号的响度损失减小的同时避免下混信号中数据溢出。
[0007] 第一方面，本发明提供一种生成下混信号的方法，包括：
[0008] 获取预置声道集合中各声道的音频信号；
[0009]对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号；
[0010] 根据所述初始下混信号中的各峰值确定目标峰值；
[0011] 获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限；
[0012] 当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。
[0013] 第二方面，本发明提供一种生成下混信号的装置，包括：
[0014] 第一获取模块，用于获取预置声道集合中各声道的音频信号；
[0015] 下混模块，用于对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号；
[0016] 确定模块，用于根据所述初始下混信号中的各峰值确定目标峰值；
[0017] 第二获取模块，用于获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限；
[0018] 下调模块，用于当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。
[0019] 从以上技术方案可以看出，本发明实施例具有以下优点：
[0020] 本发明中，在根据预置声道集合中的各声道的音频信号下混生成初始下混信号后，并非如现有技术中考虑最坏情况发生(也即预置声道集合中每个声道中的音频均为最大值时得到的初始下混信号中的峰值达到最高值)而强制将初始下混合信号固定除以系数 1+0.707+0.707来避免数据溢出的情况，而是先从初始下混信号的各峰值中确定出目标峰值，若该目标峰值高于下混信号的有效存储最大值（即目标上限），则将所述初始下混信号除以下调系数，该下调系数是根据目标峰值和目标上限确定的；由于一般情况下该目标峰值要小于初始下混信号中峰值所能达到的最高值，因此将初始下混信号除以下调系数后响度的损失要小于现有技术中造成的响度损失，而且能够避免下混信号中数据溢出。
【附图说明】
[0021] 图1为本发明的生成下混信号的方法的一个实施例的流程示意图；
[0022] 图2为本发明的生成下混信号的装置的一个实施例的结构示意图；
[0023] 图3为本发明的终端的一个实施例的结构示意图。
【具体实施方式】
[0024] 请参阅图1，图1为本发明的生成下混信号的方法的一个实施例的流程示意图。本实施例中，生成下混信号的方法包括：
[0025] 101、获取预置声道集合中各声道的音频信号。
[0026] 本实施例中，预置声道集合中包括至少两个声道。具体举例来说，该预置声道集合中包括左前方环绕声道、左后方环绕声道、中置环绕声道和左环绕声道中的至少两个声道。又例如，该预置声道集合中包括右前方环绕声道、右后方环绕声道、中置环绕声道和右环绕声道中的至少两个声道。
[0027] 其中，每个声道的音频信号中包括在每秒内对该声道的声音信号的采样数据。举例来说，音频在每秒钟内对声音模拟信号有44100次采样，那么每秒内的采样数据包括 44100个采样值，其中每一个采样值指每一次采样周期内声音信号的的积分值，该积分值用于表不声音信号的振幅。
[0028] 102、对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号。
[0029] 本实施例中，下混指的是将不同声道中的音频进行混合以从一个声道中输出，该输出的信号称为下混信号。举例来说，预置声道集合中包括左前方环绕声道、左后方环绕声道和中置环绕声道，对该预置声道集合中的三个声道的音频信号进行下混，生成立体声的左声道的初始下混信号。或者，预置声道集合中包括右前方环绕声道、右后方环绕声道和中置环绕声道，对该预置声道集合中的三个声道的音频信号进行下混，生成立体声的右声道的初始下混信号。
[0030] 本实施例中，对各声道的音频信号进行下混的方法为现有技术，在此不再赘述。
[0031] 103、根据所述初始下混信号中的各峰值确定目标峰值。
[0032] 本实施例中，根据初始下混信号中的各峰值确定目标峰值的方法有多种。例如，将初始下混信号中的各峰值中取值最大的峰值作为目标峰值。
[0033] 104、获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限。
[0034] 本实施例中，该目标上限的具体取值取决于用于存储初始下混信号中每一个采样值的位数。例如，每一个采样值用16位(2字节)存储，那么所能存的上限为32767,也即目标上限为32767。当然，每一个采样值也可以用8位、24位、32位、浮点32位、浮点64位等其他位数进行存储，在此不作限制，相应地存储上限也会随之改变。
[0035] 105、当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。
[0036] 确定初始下混信号中的目标峰值后，若该目标峰值高于目标上限，那么可以确定直接存储初始下混信号会导致数据溢出，因此确定下调系数，该下调系数是根据目标峰值和目标上限确定的。具体的，该下调系数为所述目标峰值和所述目标上限的比值，或者，所述目标峰值和所述目标上限的比值为下调系数中的一个因子，在此不作限制。然后将初始下混信号中的所有采样值均除以该下调系数。这样，可避免目标峰值高于目标上限。
[0037] 可选的，在本发明一些可能的实施方式中，由于目标峰值并不一定是初始下混信号中的最大峰值，也即初始下混信号除以下调系数后还可能存在高于目标上限的峰值。因此，在将初始下混信号除以下调系数后，还将该初始下混信号中所有高于目标上限的采样值替换为所述目标上限。这样，可以避免存储初始下混信号时出现数据溢出。
[0038] 在根据预置声道集合中的各声道的音频信号下混生成初始下混信号后，并非如现有技术中考虑最坏情况发生(也即预置声道集合中每个声道中的音频均为最大值时得到的初始下混信号中的峰值达到最高值）而强制将初始下混合信号固定除以系数1+0.707+ 0.707来避免数据溢出的情况，而是先从初始下混信号的各峰值中确定出目标峰值，若该目标峰值高于下混信号的有效存储最大值(即目标上限），则将所述初始下混信号除以下调系数，该下调系数是根据目标峰值和目标上限确定的；由于一般情况下该目标峰值要小于初始下混信号中峰值所能达到的最高值，因此将初始下混信号除以下调系数后响度的损失要小于现有技术中造成的响度损失，而且能够避免下混信号中数据溢出。
[0039] 在本发明的一些可能的实现方式中，还可以采用其他方法根据所述初始下混信号中的各峰值确定目标峰值。例如，获取峰值集合以及所述峰值集合中每个峰值的出现次数，所述峰值集合为所述初始下混信号中出现的所有峰值;根据所述峰值集合中各峰值的出现次数确定所述目标峰值，其中，所述目标峰值的出现次数大于预置阈值。
[0040] 其中，根据所述峰值集合中各峰值的出现次数确定所述目标峰值的方法有多种，下面对其中的几种进行举例描述。
[0041] 举例一:按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序;将排序后序号大于预置阈值的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值的出现次数大于排序在该特定峰值之前的所有峰值的出现次数总和。
[0042]具体来说，假设峰值集合中包括峰值11、12、13^4、15、16、17，按取值从大到小排序后的顺序为12、14、11、13、15、16、17，其中，峰值12的出现次数为〇2，峰值14的出现次数为 c4、峰值xl的出现次数为c 1、峰值x3的出现次数为c3、峰值x5的出现次数为c5、峰值x6的出现次数为c6、峰值x7的出现次数为c7。具体的，所述预置阈值为3。那么，排序后序号大于3的各峰值为排在xl之后的四个峰值。若c5小于c2+c4+cl+c3，c6大于c2+c4+cl+c3+c5，c7大于 c2+ C4+Cl+C3+C5+c6,那么x6为排序后序号大于3的各峰值中的第一个特定峰值，因此将x6 作为所述目标峰值。
[0043] 举例二、按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序;将排序后的各峰值中第一个出现次数大于第一门限值的峰值作为所述目标峰值。
[0044] 具体来说，假设峰值集合中包括峰值11、12、13、14、15、16、17，按取值从大到小排序后的顺序为12、14、11、13、15、16、17，其中，峰值12的出现次数为6，峰值14的出现次数为 4、峰值X1的出现次数为8、峰值x3的出现次数为9、峰值x5的出现次数为15、峰值x6的出现次数为10、峰值x7的出现次数为15。具体的，第一门限值为15,那么第一个出现次数大于15的峰值为x5，将该x5作为所述目标峰值。
[0045] 举例三、按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序;将排序后的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值以及排在所述特定峰值之前的所有特定峰值的出现次数总和第一次大于第二门限值。
[0046] 具体来说，假设峰值集合中包括峰值11、12、13、14、15、16、17，按取值从大到小排序后的顺序为12、14、11、13、15、16、17，其中，峰值12的出现次数为6，峰值14的出现次数为 4、峰值X1的出现次数为8、峰值x3的出现次数为9、峰值x5的出现次数为15、峰值x6的出现次数为1 〇、峰值x7的出现次数为15。具体的，第二门限值为30，由于x2、x4、X1、x3、x5的出现次数综合第一次大于30，因此将x5作为目标峰值。
[0047] 本实施例中，当某个峰值的出现次数或者某几个峰值的出现次数总和低于预置次数时，表示该峰值或者该几个峰值代表的声音总持续时间不超过预置时长，那么即时将该峰值或者该几个峰值代表的声音削弱，也不会对原音频造成很大影响;而且，由于目标峰值的取值要小于初始下混信号中的取值最大的峰值，那么下调系数要小于初始下混信号中的取值最大的峰值/目标上限，因此初始下混信号除以该下调系数后造成的响度损失也随之减小。
[0048]为方面理解本发明，下面结合一个实际应用场景对本发明中的生成下混信号的方法进行举例描述。
[0049] 获取到左前方环绕声道的音频信号L、左后方环绕声道的音频信号Ls、中置环绕声道的音频信号C该三个音频信号后，根据公式Lo = L+0.707*C+0.707*Ls对该三个音频信号进行下混生成左声道Lo的初始下混信号。
[0050] 对左声道Lo的初始下混信号中的峰值进行遍历，并记录每一个峰值。举例来说，遍历到的第一个峰值为35320,那么记录峰值35320,出现次数为1，遍历到的第二个峰值为 34890,那么记录峰值34890,出现次数为1，遍历到的第三个峰值为35320,那么在记录的峰值35320对应的出现次数加1，以此类推。获取到左声道Lo初始下混信号中所有峰值以及每个峰值的出现次数后，获取到左声道Lo初始下混信号中所有峰值以及每个峰值的出现次数后，按峰值的取值从大到小对所有峰值进行依次排序，得到下表所示，下表为左声道Lo初始下混信号中所有峰值的记录表格。
[0052]将排序后序号大于预置阈值(本实施例中具体为4)的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值的出现次数大于排序在前的所有峰值的出现次数总和。具体的，上表中，索引号大于4的各峰值中第一个特定峰值为索引号为6的峰值34890，因此确定目标峰值为34890。
[0053]或者，将第一个持续时间超过预置时间（本实施例中具体为4ms)的峰值作为目标峰值。具体的，假设本实施例中的音频信号中采样率为44100,也即每秒内对声音做44100个采样，那么也即将出现次数第一次大于44100 X 4/1000 = 176时的峰值作为目标峰值，那么，在上表中将索引号为14的峰值31200作为目标峰值。
[0054] 或者，从索引号为1的峰值开始，当前N个峰值的持续时间总和第一次超过预置时间(本实施例中具体为8ms)时，将第N个峰值作为目标峰值。具体的，假设本实施例中的音频信号中采样率为44100,那么持续时间总和第一次超过8ms具体为出现次数总和第一次大于 44100 X 8/1000 = 352。那么，在上表中，前N个峰值的出现次数总和第一次大于352时，由于前13个峰值的出现次数总和为282,前14个峰值的出现次数总和为1513,因此N= 14,那么将索引号为14的峰值31200作为目标峰值。
[0055] 上面对本发明的生成下混信号的方法进行了描述，下面将对本发明的生成下混信号的装置进行描述。
[0056]如图2所示，图2为本发明的生成下混信号的装置的一个实施例的结构示意图。本实施例中，生成下混信号的装置200包括：
[0057]第一获取模块201，用于获取预置声道集合中各声道的音频信号；
[0058]下混模块202,用于对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号；
[0059] 确定模块203，用于根据所述初始下混信号中的各峰值确定目标峰值；
[0060] 第二获取模块204，用于获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限；
[0061] 下调模块205，用于当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。
[0062] 本实施例中，在根据预置声道集合中的各声道的音频信号下混生成初始下混信号后，并非如现有技术中考虑最坏情况发生(也即预置声道集合中每个声道中的音频均为最大值时得到的初始下混信号中的峰值达到最高值)而强制将初始下混合信号固定除以系数 1+0.707+0.707来避免数据溢出的情况，而是先从初始下混信号的各峰值中确定出目标峰值，若该目标峰值高于下混信号的有效存储最大值（即目标上限），则将所述初始下混信号除以下调系数，该下调系数是根据目标峰值和目标上限确定的；由于一般情况下该目标峰值要小于初始下混信号中峰值所能达到的最高值，因此将初始下混信号除以下调系数后响度的损失要小于现有技术中造成的响度损失，而且能够避免下混信号中数据溢出。
[0063] 可选的，所述确定模块203具体用于获取峰值集合以及所述峰值集合中每个峰值的出现次数，其中，所述峰值集合为所述初始下混信号中出现的所有峰值;根据所述峰值集合中各峰值的出现次数确定所述目标峰值，其中，所述目标峰值的出现次数大于预置阈值。
[0064] 可选的，所述确定模块203在根据所述峰值集合中各峰值的出现次数确定所述目标峰值时，具体用于：
[0065] 按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；
[0066] 将排序后序号大于所述预置阈值的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值的出现次数大于排序在所述特定峰值之前的所有峰值的出现次数总和。
[0067] 可选的，所述确定模块203在根据所述峰值集合中各峰值的出现次数确定所述目标峰值时，具体用于：
[0068] 按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；
[0069] 将排序后的各峰值中第一个出现次数大于第一门限值的峰值作为所述目标峰值。
[0070] 可选的，所述确定模块203在根据所述峰值集合中各峰值的出现次数确定所述目标峰值时，具体用于：
[0071] 按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；
[0072] 将排序后的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值以及排在所述特定峰值之前的所有特定峰值的出现次数总和第一次大于第二门限值。 [0073]可选的，所述生成下混信号的装置200还包括：
[0074]替换模块206,用于将所述初始下混信号除以下调系数之后，将所述初始下混信号中高于所述目标上限的采样值替换为所述目标上限。
[0075] 本发明实施例还提供了另一种终端，如图3所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant，个人数字助理）、P0S(Point of Sales，销售终端）、车载电脑等任意终端设备，以终端为手机为例：
[0076] 图3示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图 3,手机包括:射频(Radio Frequency，RF)电路1010、存储器1020、输入单元1030、显示单元 1040、传感器1050、音频电路1060、无线保真(wireless fidelity，WiFi)模块1070、处理器 1080、以及电源1090等部件。本领域技术人员可以理解，图3中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
[0077] 下面结合图3对手机的各个构成部件进行具体的介绍：
[0078] RF电路1010可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1080处理；另外，将设计上行的数据发送给基站。通常，RF电路 1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。此外，RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(Global System of Mobile communication，GSM)、通用分组无线服务（General Packet Radio Service，GPRS)、码分多址（Code Division Multiple Access，CDMA)、宽带码分多址 (Wideband Code Division Multiple Access，WCDMA)、长期演进（Long Term Evolution， LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。
[0079] 存储器1020可用于存储软件程序以及模块，处理器1080通过运行存储在存储器 1020的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据（比如音频数据、电话本等）等。此外，存储器1020可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0080] 输入单元1030可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031，也称为触摸屏，可收集用户在其上或附近的触摸操作（比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作），并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031，输入单元1030还可以包括其他输入设备1032。具体地，其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等）、轨迹球、鼠标、操作杆等中的一种或多种。
[0081]显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041，可选的，可以采用液晶显示器（Liquid Crystal Display，LCD)、有机发光二极管（Organic Light-Emitting Diode，0LED)等形式来配置显示面板1041。进一步的，触控面板1031可覆盖显示面板1041，当触控面板1031检测到在其上或附近的触摸操作后，传送给处理器1080以确定触摸事件的类型，随后处理器 1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图3中，触控面板 1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。
[0082] 手机还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度，接近传感器可在手机移动到耳边时，关闭显示面板 1041和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用（比如横竖屏切换、相关游戏、磁力计姿态校准）、振动识别相关功能（比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。 [0083]音频电路1060、扬声器1061，传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号，传输到扬声器1061，由扬声器1061转换为声音信号输出；另一方面，传声器1062将收集的声音信号转换为电信号，由音频电路1060 接收后转换为音频数据，再将音频数据输出处理器1080处理后，经RF电路1010以发送给比如另一手机，或者将音频数据输出至存储器1020以便进一步处理。
[0084] WiFi属于短距离无线传输技术，手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图3示出了 WiFi模块1070,但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。
[0085]处理器1080是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1020内的软件程序和/或模块，以及调用存储在存储器1020 内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器 1080可包括一个或多个处理单元;优选的，处理器1080可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1080中。
[0086] 手机还包括给各个部件供电的电源1090(比如电池），优选的，电源可以通过电源管理系统与处理器1080逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0087] 尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。
[0088]在本发明实施例中，该终端所包括的处理器1080还具有控制执行以上由生成下混信号的装置执行的方法流程。
[0089] 所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0090] 在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0091] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0092] 另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0093] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0094] 以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制;尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换;而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1. 一种生成下混信号的方法，其特征在于，包括：获取预置声道集合中各声道的音频信号；对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号；根据所述初始下混信号中的各峰值确定目标峰值；获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限；当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。2. 根据权利要求1所述的生成下混信号的方法，其特征在于，所述根据所述初始下混信号中的各峰值确定目标峰值，包括：获取峰值集合以及所述峰值集合中每个峰值的出现次数，其中，所述峰值集合为所述初始下混信号中出现的所有峰值；根据所述峰值集合中各峰值的出现次数确定所述目标峰值，其中，所述目标峰值的出现次数大于预置阈值。3. 根据权利要求2所述的生成下混信号的方法，其特征在于，所述根据所述峰值集合中各峰值的出现次数确定所述目标峰值，包括：按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；将排序后序号大于所述预置阈值的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值的出现次数大于排序在所述特定峰值之前的所有峰值的出现次数总和。4. 根据权利要求2所述的生成下混信号的方法，其特征在于，所述根据所述峰值集合中各峰值的出现次数确定所述目标峰值，包括：按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；将排序后的各峰值中第一个出现次数大于第一门限值的峰值作为所述目标峰值。5. 根据权利要求2所述的生成下混信号的方法，其特征在于，所述根据所述峰值集合中各峰值的出现次数确定所述目标峰值，包括：按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；将排序后的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值以及排在所述特定峰值之前的所有特定峰值的出现次数总和第一次大于第二门限值。6. 根据权利要求2至5任一项所述的生成下混信号的方法，其特征在于，所述将所述初始下混信号除以下调系数之后，所述方法还包括：将所述初始下混信号中高于所述目标上限的采样值替换为所述目标上限。7. -种生成下混信号的装置，其特征在于，包括：第一获取模块，用于获取预置声道集合中各声道的音频信号；下混模块，用于对所述预置声道集合中各声道的音频信号进行下混，生成初始下混信号；确定模块，用于根据所述初始下混信号中的各峰值确定目标峰值；第二获取模块，用于获取目标上限，所述目标上限为所述初始下混信号中采样值的存储上限；下调模块，用于当所述目标峰值高于所述目标上限时，将所述初始下混信号除以下调系数，其中，所述下调系数是根据目标峰值和目标上限确定的。8. 根据权利要求7所述的生成下混信号的装置，其特征在于，所述确定模块具体用于获取峰值集合以及所述峰值集合中每个峰值的出现次数，其中，所述峰值集合为所述初始下混信号中出现的所有峰值;根据所述峰值集合中各峰值的出现次数确定所述目标峰值，其中，所述目标峰值的出现次数大于预置阈值。9. 根据权利要求8所述的生成下混信号的装置，其特征在于，所述确定模块在根据所述峰值集合中各峰值的出现次数确定所述目标峰值时，具体用于：按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；将排序后序号大于所述预置阈值的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值的出现次数大于排序在所述特定峰值之前的所有峰值的出现次数总和。10. 根据权利要求8所述的生成下混信号的装置，其特征在于，所述确定模块在根据所述峰值集合中各峰值的出现次数确定所述目标峰值时，具体用于：按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；将排序后的各峰值中第一个出现次数大于第一门限值的峰值作为所述目标峰值。11. 根据权利要求8所述的生成下混信号的装置，其特征在于，所述确定模块在根据所述峰值集合中各峰值的出现次数确定所述目标峰值时，具体用于：按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序；将排序后的各峰值中的第一个特定峰值作为所述目标峰值，其中，所述特定峰值以及排在所述特定峰值之前的所有特定峰值的出现次数总和第一次大于第二门限值。12. 根据权利要求8至11任一项所述的生成下混信号的装置，其特征在于，所述装置还包括：替换模块，用于将所述初始下混信号除以下调系数之后，将所述初始下混信号中高于所述目标上限的采样值替换为所述目标上限。
【文档编号】H04S3/00GK106028253SQ201610460116
【公开日】2016年10月12日
【申请日】2016年6月22日
【发明人】冯穗豫
【申请人】腾讯科技（深圳）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯穗豫;
技术所有人：腾讯科技（深圳）有限公司;
我是此专利的发明人

上一篇：一种移动终端自动切换左右声道的方法及移动终端的制作方法
上一篇：耳机前盖组装防尘网的装置及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。