对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码...的制作方法

文档序号：2831806阅读：219来源：国知局

专利名称：对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码 ...的制作方法
技术领域：
本申请要求于2007年8月16日提交到韩国知识产权局的第10-2007-82287号韩国专利申请的优先权，其公开完整地包含于此，以资参考。与本发明一致的方法和设备总体涉及处理音频信号，更具体地讲，涉及对根据心理声学模型(psychoacoustic model)巾畐度(magnitude)小于掩蔽值(masking value)的正弦信号进行编码以及对编码的正弦信号进行解码。
背景技术：
参数编码(parametric coding)通过特定参数表示音频信号，参数编码用于运动图像专家组(MPEG)-4标准。在参数编码中，通过执行三种类型的分析(即，瞬态分析、正弦分析和噪声分析) 提取在每个域中的音频分量的参数。将提取的分量格式化为比特流以发送到解码器。
在正弦分析之后，对正弦信号进行跟踪以针对正弦信号进行自适应差分脉冲编码调制(ADPCM)编码或差分脉冲编码调制(DPCM)编码。跟踪是从包括在先前帧和下一帧中的正弦分量中搜索相互连续的正弦分量并设置找到的正弦分量之间的对应关系的过程。
可从先前帧的正弦分量跟踪的当前帧的正弦分量称为连续(conti皿ation)正弦分量。由于可使用与连续正弦分量对应的先前帧的正弦分量对连续正弦分量执行差分编码，所以可有效地对连续正弦分量进行编码。与下一帧的正弦分量不连续并消失的连续正弦分量称作终止(death)正弦分量。另一方面，无法从先前帧的正弦分量跟踪的当前帧的正弦分量称为新生(birth) 正弦分量。无法对新生正弦分量执行使用先前帧的正弦分量的差分编码，并且可对新生正弦分量执行绝对编码。因此，新生正弦分量需要大量比特以进行编码。在对音频数据进行编码中，试图使用心理声学模型减少编码的数据的比特数。图 1A是解释根据心理声学模型的掩蔽效果的示图。如图1A所示，当存在特定音频信号4时，人耳听不见信号幅度小于音频信号4的幅度的声音。在特定音频信号4存在的情况下，表示人耳可听见的信号的最小幅度的线被称作掩蔽曲线2，在特定频率处的掩蔽曲线2的值被称为掩蔽值。参照图1A，正弦信号6的幅度大于掩蔽值，因此人耳可听到正弦信号6。因此，必须对正弦信号6进行编码。另一方面，正弦信号8的幅度小于掩蔽值，因此人耳无法听到正弦信号8。因此，在使用心理声学模型的编码中不对正弦信号8进行编码。换言之，使用心理声学模型的编码将幅度比掩蔽值小的正弦信号处理为不存在。图1B是解释在正弦跟踪中如何处置(treat)根据心理声学模型幅度比掩蔽值小的正弦信号的示图。
6
参照图1B，正弦信号10具有根据心理声学模型小于掩蔽值的幅度。正弦信号10 的幅度小于在与正弦信号10相同帧中的正弦信号18和20的幅度。当不应用心理声学模型时，正弦信号10与先前帧的正弦信号12和下一帧的正弦信号14连接。因此，执行正弦信号12、正弦信号IO和正弦信号14的跟踪，因此可对正弦信号14执行可应用到连续正弦信号的差分编码。然而，当应用心理声学模型时，如在空位置16中视为没有任何信号一样，将幅度小于掩蔽值的信号视为不存在。当应用心理声学模型时，将正弦信号10视为不存在，因此将正弦信号14视为新生正弦信号，需要大量比特以进行编码。如果将根据心理声学模型幅度比掩蔽值小的信号视为不存在，则必须将下一帧的正弦信号作为新生正弦信号进行编码。此外，即使对幅度小于掩蔽值的这些信号进行编码，仍出现问题。图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方法的流程图。首先，在操作S10执行正弦跟踪。假设，作为正弦跟踪的结果，P(n-2)与P(n-l)连接，P(n-l)与P(n)连接。在操作S20，将P(n-l)假设为根据心理声学模型幅度小于掩蔽值的信号。这样的信号可具有较小值或0的振幅(amplitude)。在操作S30，根据应用或不应用心理声学模型的前述两种方法确定是否对P (n-l) 进行编码。当应用心理声学模型并因此将P (n-l)视为不存在时，在操作S40不对P (n_l)进行编码，并在操作50根据用于新生正弦信号的解码方法对作为下一帧的正弦信号的P(n) 进行绝对编码。当确定对P(n-l)进行编码时，在操作S60根据用于连续正弦信号的编码方法执行 P(n-l)与P(n-2)之间的差分编码，并在操作S70执行P(n)与P(n-l)之间的差分编码。
如上所述，当在操作S40中对P(n-l)不进行编码时，由于将用于新生正弦信号的编码方法应用到P (n)，所以需要大量的比特以对振幅、频率和相位分量进行编码。
当在操作S60中对P(n-l)进行编码时，用于对频率或振幅分量进行编码的比特数较少。然而，由于P(n-l)的振幅小或等于O，所以P(n-l)的振幅与P(n-2)的振幅之差很大。此外，P(n-l)的振幅与P(n)的振幅之差很大。因此，大量的比特可被用于对所述差进行编码或者所述差可能在无法表示的范围内。这样，为了使用现有方法对包括根据心理声学模型幅度小于掩蔽值的正弦信号的音频信号进行编码，，需要比一般正弦信号的编码的情况下更多数量的比特，降低编码效率。发明公开
技术方案本发明提供一种对根据心理声学模型幅度小于掩蔽值的正弦信号进行有效编码
的编码方法和设备以及用于对编码的正弦信号进行解码的解码设备和方法。有益效果
7
如上所述，根据本发明示例性实施例，通过使用指示根据心理声学模型第一正弦信号的幅度比掩蔽值小的特定代码(code)对第一正弦信号编码，根据使用特定代码的方法，仅使用与第一正弦信号连接的先前帧的第二正弦信号或者使用第一正弦信号和第二正弦信号，执行对与第一正弦信号连接的下一帧的第三正弦信号的差分编码，解码设备使用根据特定代码的类型选择的一个正弦信号或多个正弦信号对第三正弦信号进行解码。
另一方面，现有方法使用第一正弦信号对第三正弦信号的所有分量执行绝对编码或差分编码，以对第三正弦信号进行编码。因此，与现有方法相比，可减少编码所需的比特的数量，从而可获得有效地编码。

通过参照附图对本发明示例性实施例进行详细描述，本发明的上述和其它方面将会变得更清楚，其中图1A是解释根据心理声学模型的掩蔽(masking)效国的示图；图IB是解释在正弦跟踪中如何处置根据心理声学模型的幅度比掩蔽值小的正弦
信号的示图；图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方法的流程图；图3是示出根据本发明示例性实施例的对正弦信号进行编码的编码方法的流程图；图4是根据本发明示例性实施例的用于对正弦信号进行编码的编码设备的框图；图5示出与仅使用第二正弦信号对第三正弦信号进行编码对应的曲线；图6示出与使用第一正弦信号和第二正弦信号对第三正弦信号进行编码对应的
曲线；图7是根据本发明示例性实施例的用于对正弦信号进行解码的解码设备的框图。
最佳模式根据本发明的一方面，提供了一种对正弦信号进行编码的编码方法。所述编码方法包括对包括第一正弦信号的音频信号执行正弦跟踪，以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号，从当前帧之后的下一帧的正弦信号中确定第三正弦信号，其中，第一正弦信号的幅度根据心理声学模型小于掩蔽值，第二正弦信号和第三正弦信号连接到第一正弦信号；使用特定代码对第一正弦信号进行编码，其中，所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值；通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。根据本发明的另一方面，提供了一种用于对正弦信号进行编码的设备。所述编码设备包括正弦跟踪单元、第一编码单元和第二编码单元。正弦跟踪单元对包括第一正弦信号的音频信号的进行正弦跟踪，以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号，从当前帧之后的下一帧的正弦信号中确定第三正弦信号，其中，第一正弦信号的幅度根据心理声学模型小于掩蔽值，第二正弦信号和第三正弦信号连接到第一正弦信号。第一编码单元使用特定代码对第一正弦信号进行编码，其中，所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值。第二编码单元通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。根据本发明的另一方面，提供了一种对正弦信号进行解码的方法。所述解码方法包括从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码，其中，第一正弦信号连接到包括第三正弦信号的当前帧之前的先前帧的正弦信号中的将被解码的第三正弦信号；根据所述特定代码的类型仅使用第二正弦信号或第一正弦信号和第二正弦信号二者对第三正弦信号进行解码，其中，先前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。根据本发明的另一方面，提供了一种用于对正弦信号进行解码的设备。所述解码设备包括代码提取单元和正弦信号加码单元。代码提取单元从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码，其中，第一正弦信号连接到包括第三正弦信号的当前帧之前的先前帧的正弦信号中的将被解码的第三正弦信号。正弦信号解码单元根据所述特定代码的类型仅使用第二正弦信号或第一正弦信号和第二正弦信号二者对第三正弦信号进行解码，其中，先前前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
具体实施例方式
以下，参照附图对本发明示例性实施例进行详细描述。应该注意，相同的标号指示一个或多个附图中示出的相同的部件。在以下对本发明的描述中，为了简明和清楚，将省略合并于此的已知功能和配置的详细描述。图3是示出根据本发明示例性实施例的对正弦信号进行编码的编码方法的流程图，图4是根据本发明示例性实施例的用于对正弦信号进行编码的编码设备100的框图。
参照图4，编码设备100可包括正弦跟踪单元110、第一编码单元120和第二编码单元130。假设，P(n-l)是根据心理声学模型幅度小于掩蔽值的正弦信号，P(n-2)与P(n-l) 连接，P(n-l)与P(n)连接。在以下描述中，根据心理声学模型幅度小于掩蔽值的正弦信号是当前帧的正弦信号中的第一正弦信号，先前帧的正弦信号中与第一正弦信号连接的一个正弦信号是第二正弦信号，下一帧的正弦信号中与第一正弦信号连接的一个正弦信号是第三正弦信号。在操作SIOO，正弦跟踪单元110执行正弦跟踪，以确定与第一正弦信号连接的第二正弦信号和第三正弦信号。在图3中，第一正弦信号是P(n-l)，第二正弦信号是P(n-2)，第三正弦信号是 P(n)。在操作S110，第一编码单元120通过使用特定代码表示P(n-l)(即，第一正弦信号)来对第一正弦信号进行编码。第一编码单元120使用特定代码，所述特定代码指示第一正弦信号的幅度根据心理声学模型小于掩蔽值。在操作S120，第二编码单元130对P(n) (g卩，第三正弦信号)进行编码。第二编码单元130可根据第一编码单元120使用特定代码的方法，仅使用第二正弦信号P(n-2)或使用第一正弦信号P(n-l)和第二正弦信号P(n-2)来对第三正弦信号P(n)执行差分编码。所述使用特定代码的方法可包括以下示例。然而，所述所述方法不限于示例，只要
第一编码单元120使用指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代
码，所述方法可变化。〈使用特定代码的方法> 1.,先版糾白勺一+粉M旨S糾編马隨玄儲Jl裕,心船，, 軒娜鍾巾g柳勺fefe。控制标志被用于对正弦信号进行编码。通过指定控制标志中的一个，可指示将被编码的正弦信号具有根据心理声学模型小于掩蔽值的幅度。当指定这样的控制标志时，不需要对第一正弦信号的振幅、频率和相位分量进行编码。对于下一帧的第三正弦信号，可使用第二正弦信号执行差分编码。与将第一正弦信号视为不存在的现有方法相比较，可通过执行差分编码以对第三正弦信号进行编码来减少比特的数量。 2. X維^m—lH弓維别衡斜,心鹏對糊、f娜鍾蹄麵对亍舰細窗愤一lH弓維别勺測膽则亍,。对第一正弦信号的频率和相位分量，使用先前帧的第二正弦信号的频率和相位分量执行差分编码。在这一方法中，在第三正弦信号的编码期间，使用第二正弦信号的振幅分量执行用于第三正弦信号的振幅分量的差分编码，使用第一正弦信号的频率分量执行用于第三正弦信号的频率分量的差分编码，使用第一正弦信号的相位分量执行用于第三正弦信号的相位分量的差分编码。通过执行差分编码而非绝对编码来对第三正弦信号进行编码，可减少编码所需的比特数量。此外，与仅使用第一正弦信号执行用于第三正弦信号的差分编码的现有方法相比较，通过使用第二正弦信号的振幅分量执行用于第三正弦信号的振幅分量的差分编码，可解决对差进行编码需要大量的比特，或者所述差在无法表示的范围内的现有技术问题。 3.对指示第一lH弦信号的幅度根据心理声学樽型小于掩蔽倌的特定倌讲行编码, 来取代对第一lH弦信号的频率分量(或相位分量)讲行编码。在这一方法中，不需要对第一正弦信号的振幅和相位分量(或者频率分量)进行编码。在这一方面中，该方法与将控制标志中的一个指定为指示将被编码的正弦信号具有根据心理声学模型小于掩蔽值的幅度的标志的第一方法类似。对于下一帧的第三正弦信号，使用第二正弦信号执行差分编码。与将第一正弦信号视为不存在的现有技术方法相比较，当前方法可通过执行差分编码一对第三正弦信号进行编码来减少比特的数量。当前方法与第一方法相似，可根据实施例选择这两个方法中的一个以进一步减少比特的数量。换言之，可选择在标志中使用特定代码的第一方法和取代第一正弦信号的频率或相位分量对特定值进行编码的当前方法中的一个，其中当前方法导致用于编码的更少数量的比特。在一些实施例中，可难于另外地指定特定标志。在该情况中，可使用当前方法来克服这些困难。〈对第三正弦信号进行编码的方法> A.当第一编码单元120使用第一方法和第三方法中的一个时，第二编码单元130碰,二iH弓維聰亍X愤HiH弓維别條,扁马。图5示出与仅使用第二正弦信号对第三正弦信号进行编码对应的曲线。在图5中， n是5。因此，第一正弦信号是P4、第二正弦信号是P3和第三正弦信号是P5。
为了对第一正弦信号P4进行编码，根据第一方法指定特定标志或者根据第三方法对特定值而非第一正弦信号P4的频率或相位分量进行编码为了对第三正弦信号P5进行编码，仅使用第二正弦信号P3执行差分编码。换言之，对于第三正弦信号P5的振幅分量，获得第三正弦信号P5的振幅分量与第二正弦信号P3 的振幅分量之差，然后对所述差进行编码，对于第三正弦信号P5的频率分量，获得第三正弦信号P5的频率分量与第二正弦信号P3的频率分量之差，然后对所述差进行编码，对于第三正弦信号P5的相位分量，获得第三正弦信号P5的相位分量与第二正弦信号P3的相位分量之差，然后对所述差进行编码。 B.当第一编码单元120使用第二种方法时，第二编码单元130使用第一iH弦信号禾瞎二iH弓維聰亍X愤HiH弓維别條,扁马。图6示出与使用第一正弦信号和第二正弦信号对第三正弦信号进行编码对应的曲线。在图6中，n是5。因此，第一正弦信号是P4、第二正弦信号是P3，第三正弦信号是 P5。为了对第一正弦信号P4进行编码，根据第二方法对特定值进行编码，来取代对第一正弦信号P4的振幅分量进行编码。换言之，对于第一正弦信号P4的频率分量，获得第一正弦信号P4的频率分量与第二正弦信号P3的频率分量之差，然后对所述差进行编码，对于第一正弦信号P4的相位分量，获得第一正弦信号P4的相位分量与第二正弦信号P3的相位分量之差，然后对所述差进行编码。为了对第三正弦信号P5进行编码，使用第二正弦信号P3和第一正弦信号P4执行差分编码。换言之，对于第三正弦信号P5的振幅分量，获得第三正弦信号P5的振幅分量与第二正弦信号P3的振幅分量之差，然后对所述差进行编码，对于第三正弦信号P5的频率分量，获得第三正弦信号P5的频率分量与第一正弦信号P4的频率分量之差，然后对所述差进行编码，对于第三正弦信号P5的相位分量，获得第三正弦信号P5的相位分量与第一正弦信号P4的相位分量之差，然后对所述差进行编码。虽未在图4中示出，但是编码设备100还可包括频率转换单元。频率转换单元转
换第一正弦信号的频率，并将频率转换的第一正弦信号发送至第一编码单元120。当第二正弦信号的频率分量是fp，第三正弦信号的频率分量是fn时，频率转换单
元将第一正弦信号的频率转换为第二正弦信号和第三正弦信号的频率的平均频率值，即，
(fp+fn)/2。将编码的正弦信号格式化为比特流以发送到用于对来自编码设备100的正弦信号进行解码的解码设备。图7是根据本发明示例性实施例的用于对正弦信号进行解码的解码设备200的框图。参照图7，解码设备200可包括代码提取单元210和正弦信号解码单元220。
代码提取单元210从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码。
正弦信号解码单元220如下根据所述特定代码的类型使用第二正弦信号或使用
第一正弦信号和第二正弦信号对第三正弦信号进行解码。〈对第三正弦信号进行解码的方法> A.，石马H 100禾靴石马白條一诚縱二射抓，lH弓維聰鹏亓'220碰,二 iH弓維聰m三iH弓維糊謂石马。换言之，在用于对第一正弦信号编码的控制标志中已指定指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志(第一方法)，或者已对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码来取代对第一正弦信号的频率(或相位) 分量进行编码(第二方法)，并且标志或编码的特定值已包括在输入比特流中。
由于没有对第一正弦信号的振幅(频率或相位)分量进行编码，所以从输入比特流提取用于第三正弦信号的振幅(频率或相位)分量的编码的差，并对所述编码的差进行解码。将解码的差与第二正弦信号的振幅(频率或相位)分量相加，从而获得第三正弦信号的振幅(频率或相位)分量。 B.当编码设备100利用使用特定代码的第二方法时，iH弦信号解码单元220使用 m—iH劍誇禾瞎二iH弓維聰mHiH弓維糊謂石马。换言之，指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值已取代第一正弦信号的振幅分量被编码，并且包括在输入比特流中。由于没有对第一正弦信号的振幅分量进行编码，所以从输入比特流中提取用于第三正弦信号的振幅分量的编码的差，对所述编码的差进行解码。将解码的差与第二正弦信号的振幅分量相加，从而获得第三正弦信号的振幅分量。另一方面，对于第一正弦信号的频率和相位分量，编码设备00使用第二正弦信号的频率和相位执行了差分编码。因此，从输入比特流提取用于第一正弦信号的频率(相位) 分量的编码的差，并对其进行解码。将解码的差与第二正弦信号的频率(相位)分量相加，从而获得第一正弦信号的频率(相位)分量。从输入比特流提取用于第三正弦信号的频率(相位)分量的编码的差，并对所述编码的差进行解码。将解码的差与第一正弦信号的频率(相位)分量相加，从而获得第三正弦信号的频率(相位)分量。
〈第一正弦信号的分量的指定> 第一正弦信号具有根据心理声学模型小于掩蔽值的幅度。由于人耳听不到该信号，所以可不通过解码设备200对其进行解码。然而，虽然人耳听不到，但是由于第一正弦信号的存在，第一正弦信号可改变声音的感受。因此，可指定代替第一正弦信号的特定信号。首先，将根据心理声学模型小于掩蔽值的值指定为第一正弦信号的振幅分量。
将第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值 (fp+fn)/2指定为第一正弦信号的频率分量。通过指定第一正弦信号的振幅和频率分量，可不影响第三正弦信号的解码而产生第一正弦信号。本发明也可实现为可被计算机读取的代码，其中，所述计算机包括对计算机可读记录介质具有信息处理功能的任何装置。所述计算机可读记录介质为任何可存储其后能由
12计算机系统读取的数据的数据存储装置。所述计算机可读记录介质的例子包括只读存储
器(R0M)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置。虽然参照本发明示例性实施例具体示出和描述了本发明，但是本领域普通技术人
员应该理解的是，在不脱离权利要求限定的本发明的精神和范围的情况下，可进行各种形
式和细节的修改。
权利要求
一种对正弦信号进行编码的方法，所述方法包括对包括第一正弦信号的音频信号执行正弦跟踪，以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号，从当前帧之后的下一帧的正弦信号中确定第三正弦信号，其中，第一正弦信号的幅度根据心理声学模型小于掩蔽值，第二正弦信号和第三正弦信号连接到第一正弦信号；使用特定代码对第一正弦信号进行编码，其中，所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值；以及通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。
2. 如权利要求1所述的方法，其中，所述使用特定代码对第一正弦信号进行编码的步骤包括将用于对第一正弦信号进行编码的控制标志中的一个指定为指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志。
3. 如权利要求1所述的方法，其中，所述使用特定代码对第一正弦信号进行编码的步骤包括对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码，来取代对第一正弦信号的振幅分量进行编码；获得并编码第一正弦信号的频率分量与第二正弦信号的频率分量之差；获得并编码第一正弦信号的相位分量与第二正弦信号的相位分量之差。
4. 如权利要求1所述的方法，其中，所述使用特定代码对第一正弦信号进行编码的步骤包括对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码，来取代对第一正弦信号的频率分量或相位分量进行编码。
5. 如权利要求1所述的方法，还包括在使用特定代码对第一正弦信号进行编码之前，将第一正弦信号的频率分量转换为第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值(fp+fn)/2。
6. 如权利要求1所述的方法，其中，所述对第三正弦信号进行编码的步骤包括获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差；获得并编码第三正弦信号的频率分量与第二正弦信号的频率分量之差；获得并编码第三正弦信号的相位分量与第二正弦信号的相位分量之差。
7. 如权利要求1所述的方法，其中，所述对第三正弦信号进行编码的步骤包括获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差；获得并编码第三正弦信号的频率分量与第一正弦信号的频率分量之差；获得并编码第三正弦信号的相位分量与第一正弦信号的相位分量之差。
8. —种用于对正弦信号进行编码的设备，所述设备包括正弦跟踪单元，对包括第一正弦信号的音频信号执行正弦跟踪，以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号，从当前帧之后的下一帧的正弦信号中确定第三正弦信号，其中，第一正弦信号的幅度根据心理声学模型小于掩蔽值的，第二正弦信号和第三正弦信号连接到第一正弦信号；第一编码单元，使用特定代码对第一正弦信号进行编码，其中，所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值；以及第二编码单元，通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行用于第三正弦信号的差分编码来对第三正弦信号进行编码。
9. 如权利要求8所述的设备，其中，第一编码单元将用于对第一正弦信号进行编码的控制标志中的一个指定为指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志。
10. 如权利要求8所述的设备，其中，第一编码单元对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码，来取代对第一正弦信号的振幅分量进行编码，获得并编码第一正弦信号的频率分量与第二正弦信号的频率分量之差，获得并编码第一正弦信号的相位分量与第二正弦信号的相位分量之差。
11. 如权利要求8所述的设备，其中，第一编码单元对指示将被编码的第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行编码，来取代对第一正弦信号的频率分量或相位分量进行编码。
12. 如权利要求8所述的设备，还包括频率转换单元，将第一正弦信号的频率分量转换为第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值(fp+fn)/2，并将频率转换的第一正弦信号发送至第一编码单元。
13. 如权利要求8所述的设备，其中，第二编码单元获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差，获得并编码第三正弦信号的频率分量与第二正弦信号的频率分量之差，获得并编码第三正弦信号的相位分量与第二正弦信号的相位分量之差。
14. 如权利要求8所述的设备，其中，第二编码单元获得并编码第三正弦信号的振幅分量与第二正弦信号的振幅分量之差，获得并编码第三正弦信号的频率分量与第一正弦信号的频率分量之差，获得并编码第三正弦信号的相位分量与第一正弦信号的相位分量之差。
15. —种记录有用于执行编码正弦信号的方法的程序的计算机可读记录介质，所述方法包括对包括第一正弦信号的音频信号执行正弦跟踪，以从包括第一正弦信号的当前帧之前的先前帧的正弦信号中确定第二正弦信号，以及从当前帧之后的下一帧的正弦信号中确定第三正弦信号，其中，第一正弦信号的幅度根据心理声学模型小于掩蔽值，第二正弦信号和第三正弦信号连接到第一正弦信号；使用特定代码对第一正弦信号进行编码，其中，所述特定代码指示第一正弦模型的幅度根据心理声学模型小于掩蔽值；以及通过仅使用第二正弦信号或使用第一正弦信号和第二正弦信号执行对第三正弦信号的差分编码来对第三正弦信号进行编码。
16. —种对正弦信号进行解码的方法，所述方法包括从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码，其中，第一正弦信号连接到包括第一正弦信号的当前帧之后的下一帧的正弦信号中的将被解码的第三正弦信号；根据所述特定代码的类型，仅使用第二正弦信号或使用第一正弦信号和第二正弦信号对第三正弦信号进行解码，其中，当前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
17. 如权利要求16所述的解码方法，其中，所述根据特定代码的类型对第三正弦信号进行解码的步骤包括如果已从用于对第一正弦信号进行编码的控制标志中指定了指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的标志，或者已对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行了编码来取代对第一正弦信号的频率分量或相位分量进行编码，并且所述标志或编码的特定值已被包括在输入比特流中，则通过从输入比特流提取用于第三正弦信号的振幅分量的编码的差，对提取的用于第三正弦信号的振幅分量的差进行解码，将解码的用于第三正弦信号的振幅分量的差与第二正弦信号的振幅分量相加，来获得第三正弦信号的振幅分量；通过从输入比特流提取用于第三正弦信号的频率分量的编码的差，对提取的用于第三正弦信号的频率分量的差进行解码，将解码的用于第三正弦信号的频率分量的差与第二正弦信号的频率分量相加，来获得第三正弦信号的频率分量；通过从输入比特流提取用于第三正弦信号的相位分量的编码的差，对提取的用于第三正弦信号的相位分量的差进行解码，将解码的用于第三正弦信号的相位分量的差与第二正弦信号的相位分量相加，来获得第三正弦信号的相位分量。
18. 如权利要求16所述的解码方法，其中，所述根据特定代码的类型对第三正弦信号进行解码的步骤包括如果已对指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定值进行了编码来取代对第一正弦信号的振幅分量进行编码，并且所述特定值已包括在输入比特流中，则通过从输入比特流提取用于第三正弦信号的振幅分量的编码的差，对提取的用于第三正弦信号的振幅分量的差进行解码，将解码的用于第三正弦信号的振幅分量的差与第二正弦信号的振幅分量相加，来获得第三正弦分量的振幅分量；通过从输入比特流提取用于第三正弦信号的频率分量的编码的差，对提取的用于第三正弦信号的频率分量的差进行解码，将解码的用于第三正弦信号的频率分量的差与第一正弦信号的频率分量相加，来获得第三正弦分量的频率分量；通过从输入比特流提取用于第三正弦信号的相位分量的编码的差，对提取的用于第三正弦信号的相位分量的差进行解码，将解码的用于第三正弦信号的相位分量的差与第一正弦信号的相位分量相加，来获得第三正弦分量的相位分量。
19. 如权利要求18所述的解码方法，还包括在根据特定代码的类型对第三正弦信号进行解码之前，通过从输入比特流提取用于第一正弦信号的频率分量的编码的差，对提取的用于第一正弦信号的频率分量的差进行解码，将解码的用于第一正弦信号的频率分量的差与第二正弦信号的频率分量相加，来获得第一正弦分量的频率分量；通过从输入比特流提取用于第一正弦信号的相位分量的编码的差，对提取的用于第一正弦信号的相位分量的差进行解码，将解码的用于第一正弦信号的相位分量的差与第二正弦信号的相位分量相加，来获得第一正弦分量的相位分量。
20. 如权利要求16所述的解码方法，还包括将根据心理声学模型小于掩蔽值的值指定为第一正弦信号的振幅分量；将第二正弦信号的频率分量fp和第三正弦信号的频率分量fn的平均频率值 (fp+fn)/2指定为第一正弦信号的频率分量。
21. —种用于对正弦信号进行解码的设备，所述设备包括代码提取单元，从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码，其中，第一正弦信号连接到包括第一正弦信号的当前帧之后的下一帧的正弦信号中的将被解码的第三正弦信号；正弦信号解码单元，根据所述特定代码的类型，仅使用第二正弦信号或使用第一正弦信号和第二正弦信号对第三正弦信号进行解码，其中，当前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
22. —种记录有用于执行编码正弦信号的方法的程序的计算机可读记录介质，所述方法包括从输入比特流提取指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码，其中，第一正弦信号连接到包括第一正弦信号的当前帧之后的下一帧的正弦信号中的将被解码的第三正弦信号；根据所述特定代码的类型，仅使用第二正弦信号或使用第一正弦信号和第二正弦信号对第三正弦信号进行解码，其中，当前帧之前的先前帧的正弦信号中的第二正弦信号连接到第一正弦信号。
全文摘要
提供了一种对根据心理声学模型幅度小于掩蔽值的正弦信号进行有效编码的编码方法和设备，用于对编码的正弦信号进行解码的解码设备和方法，以及具有在其上记录有用于执行所述编码方法/解码方法的程序的计算机可读记录介质。通过使用指示第一正弦信号的幅度根据心理声学模型小于掩蔽值的特定代码对第一正弦信号进行编码，使用根据使用特定代码的方法选择的一个正弦信号或者多个正弦信号来执行对与第一正弦信号连接的下一帧的第三正弦信号的差分编码，解码设备使用选择的正弦信号通过发送的差获得和。
文档编号G10L19/08GK101779462SQ200880103403
公开日2010年7月14日申请日期2008年5月27日优先权日2007年8月16日
发明者文瀚吉, 李健炯, 李撤雨, 李男淑申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李男淑;李健炯;李撤雨;文瀚吉
技术所有人：三星电子株式会社
我是此专利的发明人