用于对结构化文档进行编码的方法

文档序号:7606063阅读:161来源:国知局
专利名称:用于对结构化文档进行编码的方法
技术领域
本发明涉及一种用于对结构化文档进行编码的方法、 一种解码方法和一种相应的编码或者解码装置,其中结构化文档、尤其是基于XML 的文档(XML-可扩展标记语言)的二进制表示借助于一种方案被编码 和/或被解码。例如在关于MPEG-7标准的文献、尤其是在文档[l]中描述了这种 编码和解码方法。这些方法能够借助于编码数据流中的比特模式来确 定文档的内容、尤其是元素和/或属性和/或数据类型.在此情况下, 编码内容以所谓的FUU (FUU-片段更新单元)的形式被存储,其中在 FUU中不必包含所述元素和/或属性和/或数据类型的全部内容。该元素 和/或属性和/或数据类型的部分可以在随后的FUU中被编码。经常在接收器中对XML文档的内容进行进一步处理,例如准备用 于显示。为此,通常从该XML文档中只滤出确定的元素和/或属性和/ 或数据类型。该过滤过程例如可以在所谓的XSLT (XSLT-XML样式单 语言转换)中被指定。根据现有技术,在用于处理XML文档的应用中已证明是不利的是, 为了滤出内容,整个文档从比特流中被解码,并且然后才被过滤。可 以利用从现有技术中已知的技术通过不对FUU进行解码来加速过滤, 其中基于FUU的所谓的上下文路径中所包含的信息,所述FUU可以不包 含要过滤的内容。当然,借助于该上下文路径不能可靠地确定,哪些 FUU实际包含所寻找的内容.因此,本发明的任务是创建一种用于对结构化文档进行编码的方 法,该方法能够更简单并且更快速地从文档中过滤出内容.该任务通过独立权利要求来解决。本发明的改进方案由从属权利 要求得出。在用于对结构化文档、尤其是XML文档进行编码的本发明方法中, 文档的内容被转换为二进制表示。该二进制表示被分成构成编码数据 流的编码单元,其中可从该编码数据流中读出所述编码单元。在此情 况下,编码数据流包含配置数据,利用所述配置数据在读出一个或者 多个编码单元之前可读出关于把二进制表示分成编码单元的配置信4息。因此,为了从文档中滤出确定的内容,不再需要对整个编码数据 流进行解码,而是已经可以根据该编码数据流确定,单个编码单元包 含哪些内容。因此,可以显著地加速结构化文档的过滤。在本发明的一个优选实施方案中,配置信息尤其是关于预先确定 的编码单元中丢失的内容的信息。因此,根据编码数据流可以确定, 在编码单元中丟失哪些内容,因此如果在过滤时恰恰寻找该丟失的内 容,那么不必对该编码单元进行解码。在本发明的一个优选实施方案中,编码数据流包含对丢失的内容 在编码数据流中所处的位置和/或对包含丢失的内容的编码单元的索引。因此,如果在过滤时得出确定的FUU不包含所寻找的内容,那么 立即对所寻找的内容所处的位置进行索引。由此可以再次显著地加速过滤。在另一优选实施方案中,配置信息本身在编码数据流中被编码, 由此提高编码效率。在本发明的一个实施方案中,所述配置数据是配置信息,其中该 配置信息被添加到编码数据流中。尤其是,所述配置信息可以以XML 文档的形式被文本编码。替代地,所述配置信息可利用MPEG编码方法 来进行编码.在一个实施方案中,所述配置数据是对配置信息的索引,利用该 索引从所存储的配置信息中选出配置信息,因此,不必再传输全部的 配置信息,而是该信息可被存储在解码器可访问的存储区中。优选地,要编码的文档是MPEG描述流、尤其是MPEG-7描述流或 MPEG-21描述流,其中所述编码单元是片段更新单元,该片段更新单 元又构成接入单元,编码标准MPEG-21的说明例如位于文档[2]中。 在此情况下,所存储的配置信息优选地被包含在MPEG标准、尤其是 MPEG-7或者MPEG-21标准的配置文件中。在一个特别优选的实施方案中,所述结构化文档是XML文档,该 XML文档包括元素和/或属性和/或数据类型.在所述配置信息是关于 丟失的内容的信息的情况下,所述丢失的内容尤其是至少包括一个元 素和/或一个属性和/或一个数据类型。除了用于对数据流进行编码的上述方法之外,本发明另外还包括 用于对编码数据流进行解码的方法,其中该方法如此被设计,以致利用本发明编码方法所编码的数据流被解码,在此情况下,所述配置信 息优选地从所述编码数据流中被读出。另外,本发明还涉及用于对数据流进行编码和解码的方法,该方 法包括上述的本发明编码方法和上述的本发明解码方法。本发明另外还包括编码装置和解码装置,其中所述编码装置如此被设计,以致本发明编码方法可被执行,而所述解码装置如此被i殳计, 以致本发明解码方法可被执行。另外,本发明还包括编码和解码装置, 所述编码和解码装置包括本发明编码装置和本发明解码装置。下面,借助于附图对本发明的实施例进行更详细的描述.其中

图1示出编码和解码系统的示意图,在该编码和解码系统中本发 明编码和解码方法被执行;图2示出FUU的结构的示意图;图3示出XML文档的语法的例子,其中应从该XML文档中滤出信息;图4示出用于从图3的XML文档的二进制表示中滤出确定信息的过滤器说明的例子;和图5示出在本发明方法中可使用的被格式化为XML文档的编码配 置的示例性表示。在图1中示例性地示出具有编码器ENC和解码器DEC的编码和解 码系统,其中利用该编码器和解码器对XML文档D0C进行编码或者解 码。不仅编码器而且解码器两者都具有所谓的方案S,在该方案中用于 通信的XML文档的元素和类型被声明并被定义。在编码器和解码器中, 根据该方案S通过相应的方案编译SC产生代码表CT.如果XML文档 D0C被编码,则二进制代码通过代码表被分配给该XML文档的内容。接 下来,在编码器中,代码被分成所谓的片段更新单元FUU,该片段更新 单元将参照图2被进一步描述。将代码分成FUU取决于编码器的配置。 因此,文档DOC被转换为二进制编码格式BDOC,该二进制编码格式接 下来被传输到解码器上,并且在那里又借助于代码表CT被解码,因此 原始文档DOC被重新生成。本发明方法的特征在于,在传输XML文档的二进制表示之前或者 与传输XML文档的二进制表示并行地传输关于由编码器ENC将XML文档的内容分成FUU的信息EC.在图2中示出了片段更新单元FUU的组成部分,该片段更新单元 是MPEG-7描述流的二进制格式。这种单元包含片段更新命令,在该片 段更新命令中指定应该在XML文档描述树的节点中进行哪种操作.另 外,该单元还包含片段更新上下文,该片段更新上下文其中包含所谓 的上下文路径,利用该上下文路径来指定在该文档的描述树中到节点 的路径,其中在该节点上应执行片段更新命令.通过该上下文路径来 确定,在FUU中最大可包含哪些信息.最后,该FUU还包含片段更 新有效负荷,即在相应的节点中要处理的编码信息。为了更准确地描 述FUU的结构,请参阅文档[3]。编码数据流包括大量的这种片段 更新单元,其中这些FUU又被组合成所谓的接入单元,在这里所述的 本发明方法实施方案中,在编码数据流中除了 FUU之外还将说明如何 将XML文档分成了 FUU的配置信息EC也传输到解码器。在图3中再现了要编码的XML文档的内容的例子,该文档其中包 括四个被称作"gBSDUnit"的元素,其中这些元素中的两个包含所谓 的标记属性。在图4中示出了过滤器说明,应根据该过滤器说明对图3 中的利用本发明方法编码的文档进行过滤。该过滤器说明规定,应寻 找包含具有标记属性的元素gBSDUnit的上下文路径。在现有情况 下,该说明对应于比特模式"11010"。为了以尽可能少的解码花费将该信息从编码信息流中滤出,将图5 中以XML格式示出的解码器的配置信息传输到解码器。这里指定,接 入单元只包括gBSDUnit (第四行,d抑type-"gBSDlinim )。另外规定,一个接入单元包含两个片段更新单元,其中第一片段更新单元分别包 含gBSDUnit的标记属性(第八行怖lectorref="./@nwriw"></Mtector> ),而第二片段更新单元分别包含gBSDUnit,其中在gBSDUnit包含标记属性的 情况下,该属性没有被存储在该片段更新单元中(第十六行 <eXceptref="./@marker"/>)。通过将图5中所示的信息传输到解码器DEC,可以显著更快地寻找确定的标记属性,因为-该解码器已知,标记属性不包含在包含gBSDUnit的FUU中,并 且在片段更新有效负荷中所包含的gBSDUnit不必为此被解码,-该解码器只须对FUU进行解码,其中所述FUU的上下文路径(参 见图4)具有到标记属性的上下文路径的比特模式。因为与对片段更新有效负荷进行解码相比可以明显更快地执行比 特模式的比较,所以可以通过传输编码器的配置信息来明显加速过滤。文献目录[1〗 Text of ISO/IECFCD 15938-1 Information Technology-Multimedia Content Description Interface - Partl, Sys tems[2〗Text of ISO/IEC CD 21000-7 Information Technology -Multimedia Framework - Part 7, Digital Item Adaptation[3〗J. Heuer, C. Thienot, M. Wollborn, "Binary Format", in "Introduction to MPEG - 7,,,编者B. S. Manjunath, P. Salembier, T. Sikora, John Wiley & Sons, West Sussex, 2002,第 61 — 80页.
权利要求
1. 用于对结构化文档(DOC)、尤其是XML文档进行编码的方法,其中-所述文档(DOC)的内容被转换成二进制表示;-所述二进制表示被分成编码单元(FUU),所述编码单元构成编码数据流(BDOC)并且可以从该编码数据流(BDOC)中被读出;-所述编码数据流包含配置数据,利用所述配置数据可以在读出一个或者多个编码单元(FUU)之前读出关于将所述二进制表示分成编码单元(FUU)的配置信息(EC)。
2. 按照权利要求l所述的方法,其中所述配置信息(EC)包含关 于预先确定的编码单元(FUU)中丢失的内容的信息,
3. 按照权利要求2所述的方法,其中所述编码数据流(BDOC)包 含对所述丟失的内容在所述编码数据流(BDOC)中所处的位置和/或 对包含所述丢失的内容的编码单元(FUU)的索引。
4. 按照上述权利要求之一所述的方法,其中对所述配置数据进行编码 。
5. 按照上述权利要求之一所述的方法,其中所述配置数据是所述 配置信息(EC),并且被添加到所述编码数据流(BDOC)中。
6. 按照权利要求5所述的方法,其中所述配置信息(EC)以XML 文档的形式被文本编码。
7. 按照权利要求5所述的方法,其中所述配置信息(EC)利用MPEG 编码方法来进行编码,
8. 按照权利要求1至5之一所述的方法,其中所述配置数据是对 配置信息(EC)的索引,利用该索引从所存储的配置信息中选出配置 信息。
9. 按照上述权利要求之一所述的方法,其中所述文档(DOC)是 MPEG描述流、尤其是MPEG7或者MPEG-21描述流,其中所述编码单元(FUU)是片段更新单元,所述片段更新单元又构成接入单元.
10. 按照权利要求8和9所述的方法,其中所存储的配置信息(EC) 被包含在MPEG标准、尤其是MPEG-7或者MPEG-21标准的配置文件中。
11. 按照上述权利要求之一所述的方法,其中所述结构化文档是 XML文档,该XML文档包括元素和/或属性和/或数据类型。
12. 按照权利要求2和11所述的方法,其中所述丟失的内容至少 包括一个元素和/或一个属性和/或一个数据类型。
13. 用于对编码数据流进行解码的方法,其中该方法如此被设计, 以致利用上述权利要求所述的方法所编码的数据流(BD0C)被解码.
14. 按照权利要求13所述的方法,其中所述配置信息(EC)被读出。
15. 用于对数据流进行编码和解码的方法,包括按照权利要求1 至12之一所述的方法和按照权利要求13或者14所述的方法。
16. 编码装置,其如此被设计,以致按照权利要求1至12之一所 述的方法能够被执行.
17. 解码装置,其如此被设计,以致按照权利要求13或者14所 述的方法能够被执行。
18. 编码和解码装置,包括按照权利要求16所述的编码装置和按 照权利要求17所述的解码装置。
全文摘要
本发明涉及用于对结构化文档(DOC)、尤其是XML文档进行解码的方法,其中所述文档(DOC)的内容被转换成二进制表示,所述二进制表示被分成编码单元(FUU),所述编码单元构成编码数据流(BDOC)并且从所述编码数据流中可被读出,并且所述编码数据流包含配置数据,利用该配置数据在读出一个或者多个编码单元(FUU)之前可读出关于将所述二进制表示分成编码单元(FUU)的配置信息(EC)。
文档编号H04N7/24GK101278285SQ200480012117
公开日2008年10月1日 申请日期2004年2月27日 优先权日2003年3月4日
发明者A·哈特尔, A·科夫勒·福格特, J·霍伊尔 申请人:西门子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1