利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法_6

文档序号:9693330阅读:来源:国知局
例包括存储在机器可读载体上用于进行此处描述的方法中的一个的计 算机程序。
[0647] 换言之,本发明方法的实施例因此是计算机程序,其具有用于当所述计算机程序 在计算机上运行时执行此处说明的方法中的一个的程序代码。
[0648] 因此,本发明方法的进一步实施例是包括记录在其上的用于进行此处描述的方法 中的一个的计算机程序的数据载体(或数字存储介质,或计算机可读介质)。
[0649] 因此,本发明方法的进一步实施例是表示用于进行此处描述的方法中的一个的计 算机程序的数据流或信号序列。数据流或信号序列,例如,可W被配置为通过数据通信连 接,例如通过因特网,进行传递。
[0650] 进一步的实施例包括处理元件,例如,计算机或可编程逻辑装置,其用于或适于执 行此处描述的方法中的一个。
[0651] 进一步的实施例包括计算机,其具有安装在其上用于进行此处说明的方法中的一 个的计算机程序。
[0652] 在一些实施例中,可编程逻辑装置(例如,现场可编程口阵列)可用于进行此处说 明的方法的一些或所有功能。在一些实施例中,现场可编程口阵列可与微处理器协作W便 进行此处说明的方法中的一个。通常,方法优选地由硬件设备执行。
[0653] 上面描述的实施例仅是本发明原理的示例。应理解,此处说明的配置和细节的修 改和变化对于本领域其他技术人员是明显的。因此,本发明仅受所附权利要求的范围的限 审IJ,而不受通过此处的实施例的描述和说明而表示的具体细节的限制。
[0654] 参考文献
[0655] [3GP09]3GPP;技术规范组服务和系统方面,扩展的自适应多速率快带(AMR-WB+) 编解码器,3GPP TS 26.290,第S代合作伙伴计划,2009.
[0656] [3GP12a],自适应多速率(AMR)语音编解码器;丢失帧的误差隐藏(11版),3GPP TS 26.091,第兰代合作伙伴计划,2012年9月.
[0657] [3GP1化],语音编解码器语音处理功能;自适应多速率宽带(AMRWB)语音编解码 器;错误或丢失帧的误差隐藏,3GPP TS 26.191,第兰代合作伙伴计划,2012年9月.
[0658] [Gao]Yang Gao,Pitch prediction for packet loss concealment,欧洲专利2 002 427 Bl.
[0659] [ITU03]ITU-T,Wideband coding of speech at around 16kbit/s using adaptive multi-rate wideband(amr-wb),推荐ITU-T G.722.2,ITU的电信标准化部,2003 年6月.
[0660] [ITU06a],G.722附录III :A high-complexity algorithm for packet loss concealment for G. 722, ITU-T推荐,ITU-T,2006年11 月.
[0661] [ITU06b],G.729.1:G.729-based embedded variable bit-rate coder:An 8-32kbit/s scalable wideband coder bitstream interoperable with g.729,推荐ITU-T G. 729.1,ITU的电信标准化部,2006年5月.
[0662] [ ITU07],G · 722附录IV : A low-complexity algorithm for packet loss concealment with G.722JTU-T推荐,ITU-T,2007年8月.
[0663] [ITUOSa],G.718:Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-3沈bit/s,推荐ITU-T G.718, ITU的电信标准化部,2008年6月.
[0664] [ITUOSb],G·719:Low-complexity,ful1-band audio coding for high-quality,conversational applications,推荐ITU-T G. 719, ITU的电信标准化部,2008年6 月.
[0665] [ITU12],G.729:Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear prediction(cs-acelp),推荐ITU-T G.729, ITU的电信 标准化部,2012年6月.
[0666] [MCZllJXinwen Mu,Hexin Chen,和Yan Zhao ,A frame erasure concealment method based on pitch and gain linear prediction for AM民一WB codec,'/肖费电子 (ICCE),2011IE 邸国际会议,2011年1 月,815-816 页.
[0667] [MTTA90]J.S-Mai^ques,I·Trancoso,J.M.Tribolet,和L.B.Almeida,Improved pitch prediction with fractional delays in celp coding,Acoustics,Speech,and Signal Processing,1990.ICASSP-90. ,1990国际会议,1990,665-668页,卷2.
[0668] [VJGS12] Tommy Vail 1过11(3〇11的,Mi Ian Jelinek, Philippe Gournay,和 Redwan Salami,Method and device for efficient frame erasure concealment in speech codecs,US 8,255,207 B2,2012.
【主权项】
1. 一种用于重建包括语音信号的帧作为重建帧的装置,所述重建帧与一个或多个可用 帧相关联,所述一个或多个可用帧是所述重建帧的一个或多个先前帧以及所述重建帧的一 个或多个后续帧中的至少一个,其中所述一个或多个可用帧包括作为一个或多个可用音调 周期的一个或多个音调周期,其中所述装置包括: 确定单元(210),用于确定样本数量差(△(; ;Δ,; Δ《_+1 ),所述样本数量差(△( ;Δ,; △丨+1)指 示所述一个或多个可用音调周期中的一个的样本数量与待被重建的第一音调周期的样本 数量之间的差,以及 帧重建器(220),用于通过依据所述样本数量差:(舛;; Δ《+1 )以及依据所述一个或多 个可用音调周期中的一个的样本重建待被重建作为第一重建音调周期的所述第一音调周 期,而重建所述重建帧, 其中所述帧重建器(220)用于重建所述重建帧,以使得所述重建帧完全地或部分地包 括所述第一重建音调周期,以使得所述重建帧完全地或部分地包括第二重建音调周期,以 及以使得所述第一重建音调周期的样本数量不同于所述第二重建音调周期的样本数量。2. 根据权利要求1所述的装置, 其中所述确定单元(210)用于对于待被重建的多个音调周期中的每个确定样本数量差 (Δ(,; ; Δ【+1 ),以使得所述音调周期中的每个的所述样本数量差指示所述一个或多个可用 音调周期中的一个的样本数量与待被重建的所述音调周期的样本数量之间的差,并且 其中所述帧重建器(220)用于依据待被重建的所述音调周期的所述样本数量差 (Δ| ;Δ?; Δ?+1 )以及依据所述一个或多个可用音调周期中的一个的样本重建待被重建的所 述多个音调周期的每个音调周期,以重建所述重建帧。3. 根据权利要求1或2所述的装置, 其中所述帧重建器(220)用于依据所述一个或多个可用音调周期中的一个生成中间 帧,并且 其中所述帧重建器(220)用于修改所述中间帧以得到所述重建帧。4. 根据权利要求3所述的装置, 其中所述确定单元(210)用于确定指示多少样本将从所述中间帧被移除或多少样本将 被增加至所述中间帧的帧差值(d; s ),并且 其中所述帧重建器(220)用于当所述帧差值(d;s)指示第一样本应从所述帧移除时,将 所述第一样本从所述中间帧移除以得到所述重建帧,并且 其中所述帧重建器(220)用于当所述帧差值(d;s)指示第二样本应被增加至所述帧时, 将所述第二样本增加至所述中间帧以得到所述重建帧。5. 根据权利要求4所述的装置, 其中所述帧重建器(220)用于当所述帧差值(d;s)指示所述第一样本应从所述帧移除 时,将所述第一样本从所述中间帧移除,以便通过所述帧差值(d;s)指示从所述中间帧移除 的所述第一样本的数量,并且 其中所述帧重建器(220)用于当所述帧差值(d;s)指示所述第二样本应被增加至所述 帧时,将所述第二样本增加至所述中间帧,以便通过所述帧差值(d; s)指示增加至所述中间 帧的所述第二样本的数量。6. 根据权利要求4或5所述的装置, 其中所述确定单元(210)用于确定帧差量s,以便以下公式成立:其中L指示所述重建帧的样本数量, 其中M指示所述重建帧的子帧数量, 其中Tr指示所述一个或多个可用音调周期中的一个的四舍五入的音调周期长度,并且 其中P[i]指示所述重建帧的第i个子帧的重建音调周期的音调周期长度。7. 根据权利要求1或2所述的装置, 其中所述帧重建器(220)适于依据所述一个或多个可用音调周期中的一个生成中间 帧, 其中所述帧重建器(220)适于生成所述中间帧,以便所述中间帧包括第一部分中间音 调周期、一个或多个其他中间音调周期、以及第二部分中间音调周期, 其中所述第一部分中间音调周期取决于所述一个或多个可用音调周期中的一个的样 本中的一个或多个,其中所述一个或多个其他中间音调周期中的每个取决于所述一个或多 个可用音调周期中的一个的所有样本,并且其中所述第二部分中间音调周期取决于所述一 个或多个可用音调周期中的一个的样本中的一个或多个, 其中所述确定单元(210)用于确定指示多少样本将从所述第一部分中间音调周期移除 或多少样本将被增加至所述第一部分中间音调周期的开始部分差量:(△?),并且其中所述帧 重建器(220)用于依据所述开始部分差量(的从人所述第一部分中间音调周期移除一个或多 个第一样本,或增加一个或多个第一样本至所述第一部分中间音调周期, 其中所述确定单元(210)用于对于所述其他中间音调周期中的每个确定音调周期差量 (A 〇,所述音调周期差量(△ 〇指示多少样本将从所述其他中间音调周期中的一个移除或 多少样本将被增加至所述其他中间音调周期中的一个,并且其中所述帧重建器(220)用于 依据所述音调周期差量(A 1),从所述其他中间音调周期中的一个移除一个或多个第二样 本,或增加一个或多个第二样本至所述其他中间音调周期中的一个,并且 其中所述确定单元(210)用于确定指示多少样本将从所述第二部分中间音调周期移除 或多少样本将被增加至所述第二部分中间音调周期的结束部分差量(Δ。),并且其中所述 帧重建器(220)用于依据所述结束部分差量(Δ〗 + ,)从所述第二部分中间音调周期移除一个 或多个第三样本,或增加一个或多个第三样本至所述第二部分中间音调周期。8. 根据权利要求1或2所述的装置, 其中所述帧重建器(220)用于依据所述一个或多个可用音调周期中的一个生成中间 帧,并且 其中所述确定单元(210)适于确定所述中间帧包括的所述语音信号的一个或多个低能 量信号部分,其中所述一个或多个低能量信号部分中的每个是在所述中间帧内的所述语音 信号的第一信号部分,其中所述语音信号的能量低于所述中间帧包括的所述语音信号的第 二信号部分中的能量,并且 其中所述帧重建器(220)用于从所述语音信号的所述一个或多个低能量信号部分的至 少一个移除一个或多个样本,或增加一个或多个样本至所述语音信号的所述一个或多个低 能量信号部分的至少一个,以得到所述重建帧。9. 根据权利要求8所述的装置, 其中所述帧重建器(220)用于生成所述中间帧,以使得所述中间帧包括一个或多个重 建音调周期,以使得所述一个或多个重建音调周期中的每个取决于所述一个或多个可用音 调周期中的一个, 其中所述确定单元(210)用于确定应从所述一个或多个重建音调周期中的每个移除的 样本的数量,并且 其中所述确定单元(210)用于确定所述一个或多个低能量信号部分中的每个,以使得 对于所述一个或多个低能量信号部分中的每个,所述低能量信号部分的样本数量取决于应 从所述一个或多个重建音调周期中的一个移除的样本的数量,其中所述低能量信号部分位 于所述一个或多个重建音调周期的一个中。10. 根据前述权利要求中任一项所述的装置, 其中所述确定单元(210)用于确定待被重建作为重建帧的所述帧的所述语音信号的一 个或多个脉冲的位置,并且 其中所述帧重建器(220)用于依据所述语音信号的所述一个或多个脉冲的所述位置重 建所述重建帧。11. 根据权利要求1至9中任一项所述的装置, 其中所述确定单元(210)用于确定待被重建作为重建帧的所述帧的所述语音信号的两 个或更多个脉冲的位置, 其中T[0]是待被重建作为重建帧的所述帧的所述语音信号的所述两个或更多个脉冲 中的一个的所述位置,以及 其中所述确定单元(210)用于根据以下公式确定所述语音信号的所述两个或更多个脉 冲中的其他脉冲的位置(T[i]): T[i]=T[0]+iTr 其中Tr指示所述一个或多个可用音调周期中的一个的四舍五入长度,并且 其中i是整数。12. 根据权利要求4或5所述的装置, 其中所述确定单元(210)用于确定待被重建作为所述重建帧的所述帧的所述语音信号 的最后脉冲的索引k,以使得其中L指示所述重建帧的样本数量, 其中s指示所述帧差值, 其中T[0]指示待被重建作为所述重建帧的所述帧的所述语音信号的脉冲的位置,其与 所述语音信号的所述最后脉冲不同,并且 其中Tr指示所述一个或多个可用音调周期中的一个的四舍五入长度。13. 根据前述权利要求中任一项所述的装置, 其中所述确定单元(210)用于通过确定参数δ而重建待被重建作为所述重建帧的所述 帧,其中根据以下公式定义所述参数S:其中待被重建作为所述重建帧的所述帧包括M个子帧, 其中!^指示所述一个或多个可用音调周期中的一个的长度,并且 其中Te3xt指示待被重建作为所述重建帧的所述帧的待被重建的音调周期中的一个的长 度。14. 根据前述权利要求中任一项所述的装置, 其中所述确定单元(210)用于通过基于以下公式确定所述一个或多个可用音调周期中 的一个的四舍五入长度Tr以重建所述重建帧:其中Tp指示所述一个或多个可用音调周期中的一个的长度。15. 根据前述权利要求中任一项所述的装置, 其中所述确定单元(210)用于通过应用以下公式而重建所述重建帧:其中Tp指示所述一个或多个可用音调周期中的一个的长度, 其中Tr指示所述一个或多个可用音调周期中的一个的四舍五入长度, 其中待被重建作为所述重建帧的所述帧包括M个子帧, 其中待被重建作为所述重建帧的所述帧包括L个样本,以及 其中δ是实数,其指示所述一个或多个可用音调周期中的一个的样本数量与待被重建 的一个或多个音调周期中的一个的本数量之间的差。16. -种用于重建包括语音信号的帧作为重建帧的方法,所述重建帧与一个或多个可 用帧相关联,所述一个或多个可用帧是所述重建帧的一个或多个先前帧以及所述重建帧的 一个或多个后续帧中的至少一个,其中所述一个或多个可用帧包括作为一个或多个可用音 调周期的一个或多个音调周期,其中所述方法包括: 确定样本数量差; Δ〗+1 ),所述样本数量差(△《;:Α,的+1 ):指示所述一个或多个可 用音调周期中的一个的样本数量与待被重建的第一音调周期的样本数量之间的差,以及 通过依据所述样本数量差(Μ ; Δ, ; Δ|+1)以及依据所述一个或多个可用音调周期中的 一个的样本重建待被重建作为第一重建音调周期的所述第一音调周期,而重建所述重建 帧, 其中重建所述重建帧被进行,以使得所述重建帧完全地或部分地包括所述第一重建音 调周期,以使得所述重建帧完全地或部分地包括第二重建音调周期,以及以使得所述第一 重建音调周期的样本数量不同于所述第二重建音调周期的样本数量。17. -种计算机程序,当其在计算机或信号处理器上被执行时,用于实现如权利要求16 所述的方法。
【专利摘要】提供一种用于重建包括语音信号的帧作为重建帧的装置,所述重建帧与一个或多个可用帧相关联,所述一个或多个可用帧是重建帧的一个或多个先前帧以及重建帧的一个或多个后续帧中的至少一个,其中一个或多个可用帧包括作为一个或多个可用音调周期的一个或多个音调周期。装置包括用于确定指示一个或多个可用音调周期中的一个的样本数量与待被重建的第一音调周期的样本数量之间的差的样本数量差的确定单元(210)。此外,装置包括用于通过依据样本数量差以及依据一个或多个可用音调周期中的一个的样本重建待被重建作为第一重建音调周期的第一音调周期而重建所述重建帧的帧重建器(220)。帧重建器(220)用于重建所述重建帧,以使得重建帧完全地或部分地包括第一重建音调周期,以使得重建帧完全地或部分地包括第二重建音调周期,以及以使得第一重建音调周期的样本数量不同于第二重建音调周期的样本数量。
【IPC分类】G10L19/08, G10L19/107, G10L19/005
【公开号】CN105453173
【申请号】CN201480035474
【发明人】杰雷米·勒孔特, 迈克尔·施那拜尔, 戈兰·马尔科维奇, 马丁·迪茨, 伯恩哈德·诺伊格鲍尔
【申请人】弗朗霍夫应用科学研究促进协会
【公开日】2016年3月30日
【申请日】2014年6月16日
【公告号】CA2915791A1, EP3011555A1, US20160111094, WO2014202535A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1