信号编码方法及设备的制造方法_2

文档序号：9472492阅读：来源：国知局

噪声的特征参数，其中L为正整数。
[0046] 结合第五方面的第一种可能的实现方式或第二种可能的实现方式或第=种可能的实现方式，在第四种可能的实现方式中，所述第一确定单元具体用于：确定所述当前输入帖的特征参数作为所述实际静音信号的参数；或者，对M个静音帖的特征参数进行统计处理，W确定所述实际静音信号的参数。
[0047] 结合第五方面的第二种可能的实现方式，在第五种可能的实现方式中，所述舒适噪声的特征参数包括所述舒适噪声的码激励线性预测CELP激励能量和所述舒适噪声的线谱频率LSF系数，所述实际静音信号的特征参数包括所述实际静音信号的CELP激励能量和所述实际静音信号的LSF系数；所述第二确定单元具体用于确定所述舒适噪声的CELP激励能量与所述实际静音信号的CELP激励能量之间的距离De，并确定所述舒适噪声的LSF系数与所述实际静音信号的LSF系数之间的距离Dlsf。
[0048] 结合第五方面的第五种可能的实现方式，在第六种可能的实现方式中，所述第= 确定单元具体用于在所述距离De小于第一阔值，且所述距离Dlsf小于第二阔值的情况下，确定所述当前输入帖的编码方式为所述SID帖编码方式；所述第=确定单元具体用于在所述距离De大于或等于第一阔值，或者所述距离Dlsf大于或等于第二阔值的情况下，确定所述当前输入帖的编码方式为所述拖尾帖编码方式。
[0049] 结合第五方面的第六种可能的实现方式，在第屯种可能的实现方式中，还包括：第四确定单元，用于：获取预设的所述第一阔值和预设的所述第二阔值；或者，根据所述当前输入帖之前的N个静音帖的CELP激励能量确定所述第一阔值，并根据所述N个静音帖的 LSF系数确定所述第二阔值，其中N为正整数。
[0050] 结合第五方面或第五方面的第一种可能的实现方式至第屯种可能的实现方式中任一实现方式，在第八种可能的实现方式中，所述第一确定单元具体用于采用第一预测方式，预测所述舒适噪声，其中所述第一预测方式与所述解码器生成所述舒适噪声的方式相同。
[0051] 第六方面，提供了一种信号处理设备，包括：第一确定单元，用于确定P个静音帖中每个静音帖的组加权谱距离，其中所述P个静音帖中每个静音帖的组加权谱距离为所述 P个静音帖中所述每个静音帖与其它（P-1)个静音帖之间的加权谱距离之和，P为正整数；第二确定单元，用于根据所述第一确定单元确定的所述P个静音帖中每个静音帖的组加权谱距离，确定第一谱参数，所述第一谱参数用于生成舒适噪声。
[0052] 结合第六方面，在第一种可能的实现方式中，所述第二确定单元具体用于：从所述 P个静音帖中选择第一静音帖，使得在所述P个静音帖中所述第一静音帖的组加权谱距离最小；将所述第一静音帖的谱参数确定为所述第一谱参数。
[0053] 结合第六方面，在第二种可能的实现方式中，所述第二确定单元具体用于：从所述 P个静音帖中选择至少一个静音帖，使得在所述P个静音帖中所述至少一个静音帖的组加权谱距离均小于第=阔值；根据所述至少一个静音帖的谱参数，确定所述第一谱参数。
[0054] 结合第六方面或第六方面的第一种可能的实现方式或第二种可能的实现方式，在第=种可能的实现方式中，所述P个静音帖包括所述当前输入静音帖W及所述当前输入静音帖之前的（P-1)个静音帖；阳化5] 所述设备还包括：编码单元，用于将当前输入静音帖编码为静音描述SID帖，其中所述SID帖包括所述第二确定单元确定的所述第一谱参数。
[0056] 第屯方面，提供了一种信号处理设备，包括：划分单元，用于将输入信号的频带划分为R个子带，其中R为正整数；第一确定单元，用于在所述划分单元划分的所述R个子带中每个子带上，确定S个静音帖中每个静音帖的子带组谱距离，所述S个静音帖中每个静音帖的子带组谱距离为在所述每个子带上所述S个静音帖中所述每个静音帖与其它（S-1)个静音帖之间的谱距离之和，S为正整数；第二确定单元，用于在所述划分单元划分的所述每个子带上根据所述第一确定单元确定的S个静音帖中每个静音帖的子带组谱距离，确定所述每个子带的第一谱参数，其中所述每个子带的第一谱参数用于生成舒适噪声。
[0057] 结合第屯方面，在第一种可能的实现方式中，所述第二确定单元具体用于：在所述每个子带上，从所述S个静音帖中选择第一静音帖，使得在所述每个子带上的所述S个静音帖中所述第一静音帖的子带组谱距离最小；在所述每个子带上，将所述第一静音帖的谱参数确定为所述每个子带的第一谱参数。
[0058] 结合第屯方面，在第二种可能的实现方式中，所述第二确定单元具体用于：在所述每个子带上，从所述S个静音帖中选择至少一个静音帖，使得所述至少一个静音帖的子带组谱距离均小于第四阔值；在所述每个子带上，根据所述至少一个静音帖的谱参数，确定所述每个子带的第一谱参数。
[0059] 结合第屯方面或第屯方面的第一种可能的实现方式或第二种可能的实现方式，在第=种可能的实现方式中，所述S个静音帖包括当前输入静音帖W及所述当前输入静音帖之前的（S-1)个静音帖；
[0060] 所述设备还包括：编码单元，用于将所述当前输入静音帖编码为静音描述SID帖，其中所述SID帖包括所述每个子带的谱参数。
[0061] 第八方面，提供了一种信号处理设备，包括：第一确定单元，用于确定T个静音帖中每个静音帖的第一参数，所述第一参数用于表征谱赌，T为正整数；第二确定单元，用于根据所述第一确定单元确定的所述T个静音帖中每个静音帖的第一参数，确定第一谱参数，其中所述第一谱参数用于生成舒适噪声。
[0062] 结合第八方面，在第一种可能的实现方式中，所述第二确定单元具体用于：在确定能够按照聚类准则将所述T个静音帖分为所述第一组静音帖和所述第二组静音帖的情况下，根据所述第一组静音帖的谱参数，确定所述第一谱参数，其中所述第一组静音帖的第一参数所表征的谱赌均大于所述第二组静音帖的第一参数所表征的谱赌；在确定不能够按照聚类准则将所述T个静音帖分为所述第一组静音帖和所述第二组静音帖的情况下，对所述 T个静音帖的谱参数进行加权平均处理，W确定所述第一谱参数，其中所述第一组静音帖的第一参数所表征的谱赌均大于所述第二组静音帖的第一参数所表征的谱赌。
[0063] 结合第八方面，在第二种可能的实现方式中，所述第二确定单元具体用于：对所述 T个静音帖的谱参数进行加权平均处理，W确定所述第一谱参数；
[0064] 其中，对于所述T个静音帖中任意不同的第i个静音帖和第j个静音帖，所述第i 个静音帖对应的加权系数大于或等于所述j个静音帖对应的加权系数；在所述第一参数与所述谱赌正相关时，所述第i个静音帖的第一参数大于所述第j个静音帖的第一参数；在所述第一参数与所述谱赌负相关时，所述第i个静音帖的第一参数小于所述第j个静音帖的第一参数，i和j均为正整数，且1《i《T，1《j《T。阳0化]结合第八方面或第八方面的第一种可能的实现方式或第二种可能的实现方式，在第=种可能的实现方式中，所述T个静音帖包括当前输入静音帖W及所述当前输入静音帖之前的灯-1)个静音帖；
[0066] 所述设备还包括：编码单元，用于将所述当前输入静音帖编码为静音描述SID帖，其中所述SID帖包括所述第一谱参数。
[0067] 本发明实施例中，通过在当前输入帖的前一帖的编码方式为连续编码方式的情况下，预测在当前输入帖被编码为SID帖的情况下解码器根据当前输入帖生成的舒适噪声，并确定舒适噪声与实际静音信号的偏离程度，根据该偏离程度确定当前输入帖的编码方式为拖尾帖编码方式或SID帖编码方式，而非简单地根据统计得到的语音活动帖的数量将当前输入帖编码为拖尾帖，从而能够节省通信带宽。
【附图说明】 W側为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可W根据运些附图获得其他的附图。 W例图1是根据本发明一个实施例的语音通信系统的示意框图。
[0070] 图2是根据本发明实施例的信号编码方法的示意性流程图。
[0071] 图3a是根据本发明一个实施例的信号编码方法的过程的示意性流程图。
[0072] 图3b是根据本发明另一实施例的信号编码方法的过程的示意性流程图。
[0073] 图4是根据本发明一个实施例的信号处理方法的示意性流程图。
[0074] 图5是根据本发明另一实施例的信号处理方法的示意性流程图。
[00巧]图6是根据本发明另一实施例的信号处理方法的示意性流程图。
[0076] 图7是根据本发明一个实施例的信号编码设备的示意框图。
[0077] 图8是根据本发明另一实施例的信号处理设备的示意框图。
[0078] 图9是根据本发明另一实施例的信号处理设备的示意框图。
[0079] 图10是根据本发明另一实施例的信号处理设备的示意框图。
[0080] 图11是根据本发明另一实施例的信号编码设备的示意框图。
[0081] 图12是根据本发明另一实施例的信号处理设备的示意框图。
[0082] 图13是根据本发明另一实施例的信号处理设备的示意框图。
[0083] 图14是根据本发明另一实施例的信号处理设备的示意框图。
【具体实施方式】
[0084] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。
[0085] 图1是根据本发明一个实施例的语音通信系统的示意框图。
[0086] 图1的系统100可W是DTX系统。系统100可W包括编码器110和解码器120。
[0087] 编码器110可W将输入的时域语音信号截断为语音帖，并对语音帖进行编码，然后将编码后的语音帖发送给解码器120。解码器120可W从编码器110接收编码后的语音帖，并对编码后的语音帖进行解码，然后输出解码后的时域语音信号。
[0088] 编码器110还可W包括语音活动性检测器（VoiceActivityDetector,VAD) 110曰。 VAD110a可W检测当前输入语音帖为语音活动帖还是静音帖。其中，语音活动帖可W表示含有通话语音信号的帖，静音帖可W表示不含有通话语音信号的帖。此处，静音帖可W包括能量低于静音口限的无声帖，也可W包括背景噪声帖。编码器110可W有两种工作状态，即连续传输状态和非连续传输状态。当编码器110工作在连续传输状态时，编码器110可W 对每个输入语音帖均进行编码并发送。当编码器110工作在非连续传输状态时，编码器110 可W不对输入语音帖编码，或者可W将其编码为SID帖。通常，只有在输入语音帖为静音帖时，编码器110才会工作在非连续传输状态下。
[0089] 如果当前输入的静音帖是语音活动段结束后的第一帖时，此处语音活动段包括可能存在的拖尾区间，那么编码器110可W将该静音帖编码为SID帖，此处可W用SID_FIRST 表示该SID帖。如果当前输入的静音帖为上一个SID帖之后的第n帖，此处n为正整数，且与上一个SID帖之间没有语音活动帖时，那么编码器110可W将该静音帖编码为SID帖，此处可W用SIDJJPDATE表示该SID帖。
[0090] SID帖可W包括一些描述静音信号的特征的信息。解码器根据运些特征信息能够生成舒适噪声。例如SID帖可W包括静音信号的能量信息和谱信息。进一步地，例如，静音信号的能量信息可W包括码激励线性预测（CodeExcitedLinearPrediction，CELP)模型中激励信号的能量，或者静音信号的时域能量。谱信息可W包括线谱频率化ineSpectral Rrequen巧，LSF〇系数、线谱对(XineSpectrumPair,LSF〇系数、导抗谱频率（Immittance SpectralRrequencies，ISF〇系数、导谱对（ImmittanceSpectralF*airs，ISF〇系数、线性预测编码（XinearPredictiveCoding,LPC)系数、快速傅立叶变换（FastFourier Transform,FFT)系数或修正离散余弦变换（ModifiedDiscreteCosineTransform,MDCT) 系数等。
[0091] 编码后的语音帖可W包括S种类型：语音编码帖、SID帖和N0_DATA帖。其中语音编码帖为编码器110在连续传输状态下编码的帖，N0_DATA帖可W表示没有任何编码比特的帖，即物理上并不存在的帖，如SID帖之间的未编码静音帖等。
[0092] 解码器120可W从编码器110接收编码后的语音帖，并对编码后的语音帖进行解码。当接收到语音编码帖时，解码器可W直接解码该帖并输出时域语音帖。当接收到SID 帖时，解码器可W解码SID帖，并获得SID帖中的拖尾长度、能量和谱信息。具体地，当SID 帖为SIDJJPDATE时，解码器可W根据当前SID帖中的信息，或者根据当前SID帖中的信息并结合其它信息，获得静音信号的能量信息和谱信息，也就是获得CN参数，从而根据CN参数生成时域CN帖。当SID帖为SID_FIRST时，解码器根据SID帖中的拖尾长度信息获得该帖之前m帖中能量和谱的统计信息，并结合该SID帖中解码得到的信息获得CN参数，从而生成时域CN帖，其中m为正整数。当解码器的输入为N0_DATA帖时，解码器根据最近接收到的SID帖并结合其它信息，获得CN参数，从而生成时域CN帖。
[0093] 图2是根据本发明实施例的信号编码方法的示意性流程图。图2的方法由编码器执行，例如可W由图1中的编码器110执行。
[0094] 210,在当前输入帖的前一帖的编码方式为连续编码方式的情况下，预测在当前输入帖被编码为SID帖的情况下解码器根据当前输入帖生成的舒适噪声，并确定实际静音信号，其中当前输入帖为静音帖。
[0095] 本发明实施例中，实际静音信号可W是指输入编码器的实际静音信号。
[0096] 220,确定舒适噪声与实际静音信号的偏离程度。
[0097] 230,根据偏离程度，确定当前输入帖的编码方式，当前输入帖的编码方式包括拖尾帖编码方式或SID帖编码方式。
[0098] 具体地，拖尾帖编码方式可W是指连续编码方式。编码器可连续编码方式对处于拖尾区间的静音帖进行编码，编码得到的帖可W称为拖尾帖。
[0099] 240,根据当前输入帖的编码方式，对当前输入帖进行编码。
[0100] 在步骤210中，编码器可W根据不同的因素，确定W连续编码方式对当前输入帖的前一帖进行编码，例如，如果编码器中的VAD确定前一帖处于语音活动段或者编码器确定前一帖处于拖尾区间，那么编码器会W连续编码方式对前一帖进行编码。阳101]由于输入语音信号进入静音段后，编码器可W根据实际情况决定工作在连续传输状态还是非连续传输状态。因此对于作为静音帖的当前输入帖而言，编码器需要确定如何编码当前输入帖。阳102] 当前输入帖可W是输入语音信号进入静音段后的第一个静音帖，也可W是输入语音信号进入静音段后的第n帖，此处n为大于1的正整数。
[0103] 如果当前输入帖为第一个静音帖，那么在步骤230中，编码器确定当前输入帖的编码方式也就是确定是否需要设置拖尾区间，如果需要设置拖尾区间，则编码器可W将当前输入帖编码为拖尾帖；如果不需要设置拖尾区间，则编码器可W将当前输入帖编码为 SID帖。阳104] 如果当前输入帖为第n个静音帖且编码器能够确定当前输入帖正处于拖尾区间，即当前输入帖前面的静音帖被连续地编码，那么在步骤230中，编码器确定当前输入帖的编码方式也就是确定是否结束拖尾区间。如果需要结束拖尾区间，则编码器可W将当前输入帖编码为SID帖；如果需要继续延长拖尾区间，则编码器可W将当前输入帖编码为拖尾帖。
[01化]如果当前输入帖为第n个静音帖，并且也不存在拖尾机制，那么在步骤230中，编码器需要确定当前输入帖的编码方式，使得解码器对编码后的当前输入帖进行解码能够得到优质的舒适噪声信号。
[0106] 可见，本发明实施例既可W应用于拖尾机制的触发场景，也可W应用于拖尾机制的执行场景，还可W应用于不存在拖尾机制的场景中。具体地，本发明实施例既可W确定是否触发拖尾机制，也可W确定是否提前结束拖尾机制。或者对于不存在拖尾机制的场景，本发明实施例可W确定静音帖的编码方式从而达到更好的编码效果和解码效果。阳107] 具体地，编码器可W假设当前输入帖编码为SID帖，如果解码器接收到该SI

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6