分层音频编码和传输的制作方法_6

文档序号：9510215阅读：来源：国知局

连接用语一般不旨在暗示一些实施例要求至少一个X、至少一个Y以及至少一个Z中每个都存在。
[0152] 除非另有明确声明，冠词"一"、"一个"一般被解释为包括一个或多个描述项目。因此，诸如"被配置为……的设备"旨在包括一个或多个列出的设备。该一个或多个列出的设备也可以一并被配置为执行所声明的陈述。例如，"被配置为执行陈述A、B和C的处理器" 可以包括被配置为执行陈述A的第一处理器，该第一处理器与被配置为执行陈述B和C的第二处理器相结合地工作。
[0153] 尽管以上的详细描述已经示出、描述和指出了所应用到各种实施例的新颖特征，但是应该理解，可以在不背离本公开的精神的情况下，对所示意的设备或算法进行各种形式和细节上的省略、替换和改变。应认识到，由于一些特征可以与其它特定分开使用或实践，因此本文描述的本发明的一些实施例可以实现为不提供本文所述的全部特征和益处的形式。
【主权项】
1. 一种生成分层音频的方法，所述方法包括：访问第一音频帧和第二音频帧；将第一音频帧与第二音频帧相比较；基于该比较，识别第一音频帧的第一部分和第二音频帧的第二部分之间的相似性；用对与第一部分相对应的第一音频帧中的位置的引用来替换第二音频帧中的第二部分，以创建修改的第二音频帧；基于第一音频帧生成第一音频层；基于修改的第二音频帧生成第二音频层；以及使第一音频层和第二音频层可用于在网络上向客户端设备传输，其中第一音频层在网络上的传输需要第一带宽量，并且第一音频层和第二音频层二者在网络上的传输需要比第一带宽量更大的第二带宽量，从而如果第二带宽量对客户端设备可用，则使客户端设备能够一并接收和输出第一音频层和第二音频层，而如果第一带宽量对客户端设备可用，仍然使客户端设备能够获取和输出第一音频层。2. 根据权利要求1所述的方法，还包括：识别第一音频帧中的第三部分和第二音频帧中的第四部分之间的第二相似性；以及用对与第三部分相对应的第一音频帧中的第二位置的第二引用来替换第二音频帧中的第四部分。3. 根据权利要求1所述的方法，还包括：识别第一音频帧中的第一部分和第二音频帧中的第三部分之间的第二相似性；以及用对与第一部分相对应的第一音频帧中的位置的第二引用来替换第二音频帧中的第三部分。4. 根据权利要求1或2或3所述的方法，其中第一音频层包括核心音频层，并且第二音频层包括对核心音频层进行补充的扩展音频层。5. 根据权利要求4所述的方法，其中扩展音频层包括以下至少一个：对核心音频层的音频声道进行补充的附加音频声道，比核心音频层的比特率更高的比特率，大于核心音频层中的比特个数的比特个数，或者对核心音频层的音频内容进行补充的附加音频内容。6. 根据权利要求1或2或3所述的方法，还包括：访问第三音频帧；将第一音频帧和修改的第二音频帧与第三音频帧相比较；识别修改的第二音频帧中的第三部分和第三音频帧中的第四部分之间的第二相似性；用对与第三部分相对应的修改的第二音频帧中的位置的引用来替换第三音频帧中的第四部分，以创建修改的第三音频帧；以及基于第三音频帧生成第三音频层。7. -种用于生成分层音频的系统，所述系统包括：包括硬件处理器的音频帧比较器，所述硬件处理器被配置为：访问第一音频帧和第二音频帧；将第一音频帧与第二音频帧相比较；基于该比较，识别第一音频帧的第一部分和第二音频帧的第二部分之间的相似性；以及用对与第一音频帧的第一部分相对应的第一音频帧中的位置的引用来替换第二音频帧中的第二部分，以创建修改的第二音频帧；以及层生成器，被配置为基于第一音频帧生成第一音频层并基于修改的第二音频帧生成第二音频层。8. 根据权利要求7所述的系统，还包括被配置为在网络上向客户端设备提供第一音频层和第二音频层的流传输模块。9. 根据权利要求7或8所述的系统，还包括被配置为将第一音频层和第二音频层存储在计算机可读存储介质中的记录模块。10. 根据权利要求7或8所述的系统，其中所述音频帧比较器还被配置为：识别第一音频帧中的第三部分和第二音频帧中的第四部分之间的第二相似性；以及用对与第一音频帧中的第三部分相对应的第一音频帧中的第二位置的第二引用来替换第二音频帧中的第四部分。11. 根据权利要求10所述的系统，其中第二音频帧中的第二部分和第二音频帧中的第四部分不连续。12. 根据权利要求11所述的系统，其中所述第二音频帧包括第一音频帧内所不包括的第五部分，并且修改的第二音频帧中的所述引用和所述第二引用被所述第五部分相分隔。13. 根据权利要求7或8所述的系统，其中所述音频帧比较器还被配置为：识别第一音频帧中的第一部分和第二音频帧中的第三部分之间的第二相似性；以及用对与第一部分相对应的第一音频帧中的位置的第二引用来替换第二音频帧中的第三部分。14. 根据权利要求7或8所述的系统，其中第一音频层包括核心音频层，并且第二音频层包括对核心音频层进行补充的扩展音频层。15. 根据权利要求14所述的系统，其中扩展音频层包括以下至少一个：对核心音频层的音频声道进行补充的附加音频声道，比核心音频层的比特率更高的比特率，大于核心音频层中的比特个数的比特个数，或者对核心音频层的音频内容进行补充的附加音频内容。16. 根据权利要求7或8所述的系统，所述音频帧比较器还被配置为基于第一音频帧和修改的第二音频帧生成散列值。17. 根据权利要求7或8所述的系统，其中所述音频帧比较器还被配置为：访问第三音频帧；将第一音频帧和修改的第二音频帧与第三音频帧相比较；以及识别修改的第二音频帧中的第三部分和第三音频帧中的第四部分之间的第二相似性。18. 根据权利要求17所述的系统，其中所述音频帧比较器还被配置为：用对与第三部分相对应的修改的第二音频帧中的位置的第二引用来替换第三音频帧中的第四部分，以创建修改的第三音频帧。19. 根据权利要求18所述的系统，其中所述层生成器还被配置为基于修改的第三音频帧生成第三音频层。20. 根据权利要求19所述的系统，其中所述流传输模块还被配置为在网络上向客户端设备提供第三音频层，其中第一音频层、第二音频层以及第三音频层在网络上的传输需要第三带宽量。21. -种非瞬态物理计算机存储器，包括存储在其上的可执行指令，所述可执行指令在被硬件处理器执行时被配置为至少：访问第一音频帧和第二音频帧；将第一音频帧与第二音频帧相比较；基于该比较，识别第一音频帧的第一部分和第二音频帧的第二部分之间的相似性；用对与第一部分相对应的第一音频帧中的位置的引用来替换第二音频帧中的第二部分，以创建修改的第二音频帧；基于第一音频帧生成第一音频层；以及基于修改的第二音频帧生成第二音频层。22. 根据权利要求21所述的非瞬态物理计算机存储器，其中所述可执行指令还被配置为至少：识别第一音频帧中的第三部分和第二音频帧中的第四部分之间的第二相似性；以及用对与第三部分相对应的第一音频帧中的第二位置的第二引用来替换第二音频帧中的第四部分。23. 根据权利要求21所述的非瞬态物理计算机存储器，其中所述可执行指令还被配置为至少：识别第一音频帧中的第一部分和第二音频帧中的第三部分之间的第二相似性；以及用对与第一部分相对应的第一音频帧中的位置的第二引用来替换第二音频帧中的第三部分。24. 根据权利要求21或22或23所述的非瞬态物理计算机存储器，其中第一音频层包括核心音频层，并且第二音频层包括对核心音频层进行补充的扩展音频层。25. 根据权利要求24所述的非瞬态物理计算机存储器，其中扩展音频层包括以下至少一个：对核心音频层的音频声道进行补充的附加音频声道，比核心音频层的比特率更高的比特率，大于核心音频层中的比特个数的比特个数，或者对核心音频层的音频内容进行补充的附加音频内容。26. -种重建音频流的方法，所述方法包括：在网络上访问服务器，以获取第一音频层和第二音频层；接收第一音频层和第二音频层，第一和第二音频层中每一个都包括多个音频帧，其中第一音频层包括基层并且第二音频层包括对基层的增强；识别第二音频层的第一音频帧中的引用，其中所述引用指示第一音频层的第二音频帧中的位置，所述引用是音频数据的替换；用与所述引用所指示的位置相对应的第一音频层的第二音频帧中的音频数据的第一部分替换第二音频层的第一音频帧中的引用；以及向解码器或扬声器输出第二音频层，从而替代基层，能够回放对基层的增强。27. 根据权利要求26所述的方法，还包括：在识别引用前，从第一音频帧中提取散列值；以及将所述散列值与第一音频帧中的第二部分和第二音频帧中的第三部分相比较。28. 根据权利要求26或27所述的方法，还包括：如果第一音频帧中的第二部分和第二音频帧中的第三部分与所述散列值不匹配，输出第一音频层。29. 根据权利要求26或27所述的方法，其中第一音频帧包括所述引用和不涉及另一个音频帧的数据。30. 根据权利要求29所述的方法，还包括：基于第二音频帧中的第一部分和第一音频帧中不涉及另一个音频帧的数据，生成第三音频帧。31. -种用于重建音频流的系统，所述系统包括：包括硬件处理器的层构建器，所述硬件处理器被配置为：访问第一音频层和第二音频层；识别第二音频层的第一音频帧中的引用，其中所述引用指示第一音频层的第二音频帧中的位置；用与所述引用所指示的位置相对应的第二音频层中的第一部分替换第一音频帧中的引用；以及输出第二音频层。32. 根据权利要求31所述的系统，其中所述层构建器还被配置为：在识别引用前，从第一音频帧中提取散列值；以及将所述散列值与第一音频帧中的第二部分和第二音频帧中的第三部分相比较。33. 根据权利要求32所述的系统，其中，所述层构建器还被配置为：如果第一音频帧中的第二部分和第二音频帧中的第三部分与所述散列值不匹配，输出第一音频层。34. 根据权利要求31或32所述的系统，还包括被配置为在网络上访问服务器以获取第一音频层和第二音频层的网络通信设备，其中所述处理器还被配置为从所述网络通信设备访问第一音频层和第二音频层。35. 根据权利要求31或32所述的系统，还包括被配置为读取计算机可读存储介质的计算机可读存储介质读取器，其中所述计算机可读存储介质包括第一音频层和第二音频层。36. 根据权利要求35所述的系统，其中所述处理器还被配置为经由计算机可读存储介质读取器从计算机可读存储介质访问第一音频层和第二音频层。37. 根据权利要求31或32所述的系统，其中第一音频帧包括所述引用和不涉及另一个音频帧的数据。38. 根据权利要求37所述的系统，其中所述层构建器还被配置为：基于第二音频帧中的第一部分和第一音频帧中不涉及另一个音频帧的数据，生成第三音频帧。39. 根据权利要求38所述的系统，其中所述层构建器还被配置为：按照引用和第一音频帧中不涉及另一个音频帧的数据在第一音频帧中出现的顺序，生成第三音频帧。40. 根据权利要求39所述的系统，还包括被配置为对第三音频帧进行解码的解码器，其中所述解码器还被配置为向扬声器输出解码的第三音频帧。41. 一种非瞬态物理计算机存储器，包括存储在其上的可执行程序指令，所述可执行程序指令在被硬件处理器执行时被配置为至少：访问第一音频层和第二音频层；识别第二音频层的第一音频帧中的引用，其中所述引用指示第一音频层的第二音频帧中的位置；用与所述引用所指示的位置相对应的第二音频层中的第一部分替换第一音频帧中的引用；以及输出第二音频层。42. 根据权利要求41所述的非瞬态物理计算机存储器，其中所述可执行指令还被配置为至少：在识别引用前，从第一音频帧中提取散列值；以及将所述散列值与第一音频帧中的第二部分和第二音频帧中的第三部分相比较。43. 根据权利要求42所述的非瞬态物理计算机存储器，其中所述可执行指令还被配置为至少：如果第一音频帧中的第二部分和第二音频帧中的第三部分与所述散列值不匹配，输出第一音频层。44. 根据权利要求41或42所述的非瞬态物理计算机存储器，其中所述可执行指令还被配置为至少在网络上访问服务器以获取第一音频层和第二音频层。45. 根据权利要求41或42所述的非瞬态物理计算机存储器，其中所述可执行指令还被配置为至少读取计算机可读存储介质，并且所述计算机可读存储介质包括第一音频层和第二音频层。
【专利摘要】本公开描述用于生成分层音频的系统和方法的实施例，使得计算设备可以基于诸如其可用带宽、设备容量或用户选择的标准来请求可变的数据量。可以生成基层和对前一层进行递进增强的一个或多个增强层。计算设备可以获取基层和/或一个或多个增强层，并且实时或接近实时地基于可用带宽的波动和其他可能标准来调整获取哪些层。
【IPC分类】G10L19/24, H03M7/30
【公开号】CN105264600
【申请号】CN201480032114
【发明人】马克·罗杰斯·约翰逊, 菲利普·L·马内斯
【申请人】Dts有限责任公司
【公开日】2016年1月20日
【申请日】2014年4月4日
【公告号】EP2981955A1, US20140303762, US20140303984, WO2014165806A1

完整全部详细技术资料下载

当前第6页1 2 3 4 5 6