用于对音频信号进行编码的方法和装置的制造方法_3

文档序号:8460801阅读:来源:国知局
根据本发明的一个实施例的由缺失信号发生器311a执行的操作。图4描绘信号400、402、404和408的图形。图形的垂直轴代表信号的量值而水平轴代表时间。第一信号400是编码器222尝试处理的原始声音信号。第二信号402是从缺乏任何修改地处理第一信号400而产生的信号(即,未修改的信号)。第一时间410是编码器222从第一模式(例如,使用频域编码器,诸如基于谐波的正弦型编码器的音乐模式)切换成第二模式(例如,使用时域或者波形编码器,诸如CELP编码器的语音模式)的时间点。因此,直到第一时间410,编码器222以第一模式来处理音频信号。在第一时间410处或者之后不久,编码器222尝试以第二模式来处理音频信号,但是直至编码器222能够在模式切换(该模式切换在第二时间412出现)之后刷出滤波存储器和缓冲器并且填充先行缓冲器221才能够有效地这样做。正如可见,在第一时间410与第二时间412之间存在时间间隔,在该时间间隔中,在处理的音频信号中存在间隙416(例如,该间隔416可以大约为5毫秒)。在该间隙416期间,在BWE区域中几乎没有声音可用于编码。为了补偿该间隙,缺失信号发生器311a复制信号402的部分406。复制的信号部分406是缺失信号部分(S卩,应当已经在间隙中的信号部分)的估计。复制的信号部分406占用从第二时间412到第三时间414跨越的时间间隔418。将要注意,可以存在第二时间412后的信号的可以被复制的多个部分,但是该示例涉及单个复制的部分。
[0030]编码器222将复制的信号部分406叠加到重新生成的信号估计408上,使得复制的信号部分406的一部分被插入到间隙416中。在一些实施例中,如图4中所示,缺失信号发生器311a在将复制的信号部分406叠加到重新生成的信号估计402上之前对复制的信号部分406进行时间反转。
[0031]在一个实施例中,复制的部分406跨越比间隙416的时间段更长的时间段。因此,除了复制的部分406填充间隙416之外,复制的部分的一部分与超出间隙416之外的信号组合。在其它实施例中,复制的部分跨越与间隙416相同的时间段。
[0032]图5示出另一实施例。在该实施例中,存在已知目标信号500,该已知目标信号500是从由编码器222执行的初始处理产生的信号。在第一时间512之前,编码器222以第一模式(其中,例如,它使用频率编码器,诸如基于谐波的正弦型编码器)来操作。在第一时间512处,编码器222从第一模式切换成第二模式(其中,例如,它使用CELP编码器)。例如,该切换基于从音乐或者类音乐的声音改变成语音或者类语音的声音的向通信设备输入的音频。编码器222直至第二时间514才能够从第一模式向第二模式的切换中恢复。在第二时间514之后,编码器222能够以第二模式对语音输入进行编码。间隙503存在于第一时间与第二时间之间。为了补偿间隙503,缺失信号发生器311a(图3)复制已知目标信号500的与间隙503相同时间长度518的部分504。缺失信号发生器组合复制的部分504的余弦窗口部分502与复制的部分504的时间反转的正弦窗口部分506。余弦窗口部分502和时间反转的正弦窗口部分506 二者均可以取自复制的部分504的相同分段516。时间反转的正弦和余弦部分可以相互异相,并且可以不一定在分段516的相同时间点处开始和结束。余弦窗口和时间反转的正弦窗口的组合将被称为重叠-相加信号510。重叠-相加信号510替换目标信号500的复制的部分504的一部分。复制的信号504的尚未被替换的部分将被称为未替换的信号520。编码器将重叠-相加信号510附加到未替换的信号516,并且使用组合的信号510和516来填充间隙503。
[0033]尽管已经以如下方式描述了本公开内容及其最佳模式,该方式建立了由发明人的占有并且使得本领域普通技术人员能够实现和使用本公开内容,但是将会理解,存在在此公开的示例实施例的等价形式并且可以对其进行修改和变化而不偏离本公开内容的精神和范围,本公开内容的精神和范围将不由示例实施例限制而由所附权利要求限制。
【主权项】
1.一种对音频信号进行编码的方法,所述方法包括: 以第一编码器模式(300A)处理所述音频信号; 在第一时间(410)从所述第一编码器模式(300A)切换到第二编码器模式(300B); 以所述第二编码器模式(300B)处理所述音频信号,其中所述第二编码器模式(300B)的处理延迟造成了所述音频信号中的间隙(416),所述间隙(416)具有在所述第一时间(410)处或者之后开始并且在第二时间(412)处结束的时间跨度; 复制经处理的所述音频信号的部分(406),其中复制的所述部分(406)在所述第二时间(412)处或者之后出现;以及 将信号插入到所述间隙(416)中,其中插入的所述信号基于复制的所述部分(406)。
2.根据权利要求1所述的方法,其中插入的所述信号是复制的所述部分的时间反转的版本。
3.根据权利要求1所述的方法, 其中复制的所述部分的所述时间跨度比所述间隙的所述时间跨度长; 所述方法进一步包括组合复制的所述部分的重叠部分与经处理的所述音频信号的出现在所述第二时间之后的至少一部分。
4.根据权利要求1所述的方法, 其中复制的所述部分包括正弦窗口部分和余弦窗口部分;并且其中插入复制的所述部分包括组合所述正弦窗口部分与所述余弦窗口部分并且将组合的所述正弦窗口部分和所述余弦窗口部分的至少一部分插入到所述间隙部分中。
5.根据权利要求1所述的方法,其中将所述编码器从第一模式切换到第二模式包括将所述编码器从音乐模式切换到语音模式。
6.根据权利要求1所述的方法,进一步包括: 如果所述音频信号被确定为音乐信号,则以所述第一模式对所述音频信号进行编码;确定所述音频信号已经从所述音乐信号切换到语音信号;以及如果确定了所述音频信号已经切换成语音信号,则以所述第二模式对所述音频信号进行编码。
7.根据权利要求6所述的方法,其中所述第一模式是音乐编码模式并且所述第二模式是语音编码模式。
8.根据权利要求1所述的方法,进一步包括在所述第一模式中使用频域编码器并且在所述第二模式中使用CELP编码器。
9.一种用于对音频信号进行编码的装置(200),所述装置(200)包括: 第一编码器(300A); 第二编码器(300B); 语音-音乐检测器(300); 其中当所述语音-音乐检测器(300)确定音频信号已经从音乐改变成语音时,所述音频信号停止由所述第一编码器(300A)处理而由所述第二编码器(300B)处理; 其中所述第二编码器(300B)的处理延迟造成了所述音频信号中的间隙(416),所述间隙(416)具有在第一时间(410)处或者之后开始并且在第二时间(412)处结束的时间跨度;以及 缺失信号发生器(311A),所述缺失信号发生器(311A)复制经处理的所述音频信号的部分(406),其中复制的所述部分(406)在所述第二时间(412)处或者之后出现,并且所述缺失信号发生器(311A)将信号插入到所述间隙(416)中,其中插入的所述信号基于复制的所述部分(406)。
【专利摘要】混合语音编码器(200)检测从类音乐的声音到类语音的声音的改变。当编码器(200)检测到类音乐的声音(例如,音乐)时,它以第一模式操作,在该第一模式中它运用频域编码器(300A)。当编码器(200)检测到类语音的声音(例如,人类语音)时,它以第二模式操作,并且运用时域或者波形编码器(300B)。在切换出现时,编码器(200)使用信号的在间隙(416)之后出现的部分来回填信号中的间隙(416)。
【IPC分类】G10L19-18
【公开号】CN104781879
【申请号】CN201380059616
【发明人】J·A·吉布斯, H·L·弗朗索瓦
【申请人】摩托罗拉移动有限责任公司
【公开日】2015年7月15日
【申请日】2013年9月6日
【公告号】EP2901450A1, US9129600, US20140088973, WO2014051965A1
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1