元数据的索引结构、提供元数据索引的方法和使用元数据索引的元数据搜索方法及设备的制作方法

文档序号:6401985阅读:211来源:国知局

专利名称::元数据的索引结构、提供元数据索引的方法和使用元数据索引的元数据搜索方法及设备的制作方法
技术领域
:本发明涉及一种被提供用于搜索关于内容的信息的元数据的索引结构、一种提供元数据索引的方法和一种使用元数据的索引结构来搜索元数据的方法及设备。更具体地说,本发明涉及一种包含关键字(key)信息的元数据的索引结构、提供元数据索引的方法和使用元数据的索引来搜索元数据的方法及设备,其中当在TV-Anytime(TV-任何时间)论坛(以下称为“TVA”)中定义的用于数字内容的XML元数据(以下称为“TVA元数据”)被以独立的单位划分成段(fragment)并且基于段被传送时,至少部分所述关键字信息被编码以便允许关于内容的信息被更有效地搜索。本申请基于韩国专利申请No.2002-43097和No.2002-62913,这些申请以引用方式包含在本文的内容中。
背景技术
:TV-Anytime论坛是成立于1999年9月的民间标准化组织,该组织以制定在例如具有大容量个人存储装置的个人数字记录机(PDR,personaldigitalrecorder)等用户友好的环境下提供视听相关的服务的标准为目的。具体地说,该服务的目标是使所有用户都能够基于大容量个人存储装置、在希望的时间并且以希望的方式,来观看和收听各种类型的节目(例如传统的广播节目、在线交互式服务等)。为了建立标准化,TV-Anytime论坛已经运作了关于商业模型、系统/传输接口/内容引用、描述、元数据、权利管理和保护等的工作组(WorkingGroups)。至于本发明中涉及的元数据,到2002年6月已经公布了“1stDraftofMetadataSpecificationSP003v1.3”。将参照图1简要说明PDR的构造。PDR100经由例如天波、卫星波、互连网等各种网络、从提供视频/音频信号的提供者200接收视频/音频信号和元数据,如果有必要,就收集观看和收听模式以及用户的个人喜好,并且将其发送到提供视频/音频信号的提供者200。PDR100包括大容量存储装置,用于在其中存储所接收的视频/音频信号和元数据。PDR100还包括用于存储和再现视频/音频信号的软件,以及用于检索和显示视频/音频信号的元数据的电子节目指南(EPG,electricalprogramguide)应用程序。用户通过图2所示的EPG应用程序的网格指南屏幕来确定视频/音频信号的元数据,即节目的标题、节目再现时间等,选择希望的节目,并且经由网络实时接收它,或者再现先前存储在大容量存储装置中的视频/音频数据。元数据指描述内容的数据,例如节目的标题和摘要,并且被定义为“关于数据的数据”。在TV-Anytime论坛的TVA元数据规范中,使用W3C(倡导XML标准的联盟)制定的标准XML模式语言来定义其结构(参见W3C的XML1.0),并且还定义了各个元数据元素的语义和属性。有关广播内容的TVA元数据是利用具有根节点,即如图3所示的“TVAMain(300)”的XML文档(document)来构造的。有关节目的TVA元数据是利用例如“节目描述(ProgramDescription)”节点之下的节目信息表(ProgramInformationTable)、组信息表(GroupInformationTable)、节目位置表(ProgramLocationTable)、服务信息表(ServiceInformationTable)等节点来构造的。在TV-Anytime论坛中,基于段作为独立单位来发送TVA元数据,以便以流格式发送大量TVA元数据。将参照图4简要说明段的概念。通过将利用图3所示的XML文档所构造的TVA元数据划分成预定的树结构来获得段。例如,在整个TVA元数据被划分成包含上层节点“TVAMain”和该上层节点之下的预定子节点的树结构(TVAMain段)、包含上层节点节目信息表和该上层节点之下的子节点的树结构(节目信息段(ProgramInformation段))和包含上层节点广播事件信息(BroadcastEventInformation)和该上层节点之下的子节点的树结构(广播事件段(BroadcastEvent段))的情况下,每个所划分的树结构都成为段。段能够独立于其他段被发送,并且段能够被单独地访问。为了对段进行单独地访问,有必要知道在整个元数据树结构中由所发送的TVA元数据段所引用的节点,即与TVA元数据段的上层节点相对应的节点,并且有必要描述包含在所发送的TVA元数据段中的关键字的TVA元数据段中的相对路径。为此,使用XPath,XPath是描述在W3C所定义的XML文档中、到一个或多个节点的路径的语法。术语“关键字”指用于编索引的元数据的特定字段(field),并且还指由段所引用的节点的子节点。由用户输入的字段(用于搜索条件),例如‘服务ID(ServiceID)’和‘出版时间(PublishedTime)’,相当于关键字。为了提供对段的有效搜索和访问,还需要包含在元数据段中的关键字的索引结构,并且关于索引结构的信息,即索引信息,也被独立于元数据段发送。在由TV-Anytime论坛所提供的环境下,如果用户希望检索满足预定的出版时间条件的节目信息,独立于段发送的索引信息用于识别满足所需的出版时间条件的元数据段的位置(标识符),接着基于该位置(标识符)进行对相关元数据段的访问,以便提取满足出版时间条件的元数据。2002年6月在加拿大蒙特利尔召开的TV-Anytime论坛第17次会议中,发表了TV-Anytime规范TV145,J.P.Evain,“1stDraftofMetadataSpecificationSP003v1.3”,以下称作“关键字索引技术文献(Keyindexartreference)”,其中提出了元数据段索引的关键字索引数据流结构。在描述索引结构之前,将描述由TV-Anytime论坛所定义的容器(container)概念。TV-Anytime论坛将容器定义为一种顶层存储器,覆盖上述索引信息和元数据段的所有数据都被发送到该存储器,这被称为顶层传输类型。下面简要描述容器,每个容器包括多个区(section),每个区中存储索引信息或元数据段。根据所承载的信息,容器可被划分成索引容器和数据容器索引容器承载索引信息区,例如关键字索引列表(key_index_list)区、关键字索引(key_index)区、子关键字索引(sub_key_index)区、串仓库(string_repository)区和段数据仓库(fragment_data_repository)区,而数据容器承载元数据段区,例如元素表(elements_table)区、串仓库(string_repository)区和段数据仓库(fragment_data_repository)区。以上分类是基于容器中包含的信息内容进行的。索引容器和数据容器在结构上都是相同的。参照图5所示由TV-Anytime论坛所定义的容器,容器包括容器标识符(container_id)数据字段(未示出)和大量的区。在每个区中,根据‘section_id’中的编码值识别存储在‘section_body’中的内容。例如,其‘section_id’中编码值为‘0X0004’的区10被识别为关键字索引列表(key_index_list)区,其‘section_id’中编码值为‘0X0005’的区20被识别为关键字索引(key_index)区,其‘section_id’中编码值为‘0X0006’的区30被识别为子关键字索引(sub_key_index)区,其‘section_id’中编码值为‘0X0001’的区40被识别为元素表(elements_table)区,其‘section_id’中编码值为‘0X0003’的区50被识别为段数据仓库(fragment_data_repository)区。TVA元数据段被存储在数据容器的段数据仓库(fragment_data_repository)区50中,接着被发送。数据容器中的TVA元数据段的标识符信息(handle_value)被包含在数据容器的元素表区40中。结果,TVA元数据段由包含该TVA元数据段的容器的容器标识符信息(container_id)和元数据段标识符信息(handle_value)来惟一地标识。上述的关键字索引技术文献提出了用于对存储在上述数据容器中的TVA元数据段编索引的关键字索引结构,即由关键字索引列表(key_index_list)区10、关键字索引(key_index)区20和子关键字索引(sub_key_index)区30组成的结构。由于在上述关键字索引技术文献中详细地描述了该结构的语法,这里将省略对其的详细描述。以下,将参照图6描述该结构,图6利用索引信息的段来示出该结构。在关键字索引结构中定义的关键字索引列表(key_index_list)区10提供了所有所发送的关键字的列表。该列表包含定义每个关键字的关键字信息和以下将描述的关键字索引(key_index)区20的标识信息。关键字信息包括(1)与关键字相关的元数据段的位置信息,(2)元数据段之内的关键字的位置信息和以下将描述的关键字索引(key_index)区20的标识信息。元数据段的位置信息用TVA中的XPath(fragment_xpath_ptr)来表示。关键字的位置信息用TVA中用作关键字的节点的相关段之内的相对路径XPath(key_xpath_ptr)来表示。元数据段的XPath是到TVA元数据XML文档的根节点的路径,即绝对路径,而用作关键字的节点的XPath,即关键字的XPath,表示相关元数据段的关键字的相对路径。元数据段的XPath和关键字的XPath分别被存储在‘fragment_xpath_ptr’部分(segment)11和‘key_xpath_ptr’部分12中。而且,关键字索引列表(key_index_list)区10包含以下将描述的每个关键字的关键字索引(key_index)区20的标识信息(即存储关键字索引(key_index)区20的容器的容器标识符信息(container_id)和关键字索引标识符信息)。容器标识符信息和关键字索引标识符信息被分别存储在关键字索引列表(key_index_list)区10的‘index_container’部分和‘key_index_identifier’部分中,接着被发送。在关键字索引结构中定义的关键字索引(key_index)区20提供以下将描述的所有子关键字索引(sub_key_index)区30的列表。该列表包含表示各子关键字索引(sub_key_index)区30中包含的关键字的值范围的信息,即每个子关键字索引(sub_key_index)区30之内的关键字值中的关键字的最高值(以下称为“典型关键字值(representativekeyvalue)”),还包含与每个典型关键字值相关的子关键字索引(sub_key_index)区30的标识信息(即存储子关键字索引(sub_key_index)区的容器的容器标识符信息(cintainer_id)和子关键字索引标识符信息)。相应地,关键字索引(key_index)区20包含用于存储在关键字索引列表(key_index_list)区10中定义的关键字索引标识符信息的‘key_index_identifier’部分、用于存储各子关键字索引(sub_key_index)区30的典型关键字值的‘high_key_value’部分13、存储子关键字索引(sub_key_index)区30的容器的容器标识符信息(container_id)、用于存储各子关键字索引标识符信息的‘sub_index_container’部分和‘sub_index_identifier’部分。在关键字索引结构中定义的子关键字索引(sub_key_index)区30提供包含在相关的子关键字索引(sub_key_index)区30中的关键字的值的列表。该列表包含在相关的子关键字索引(sub_key_index)区30中包含的关键字的值和具有该关键字值的元数据段的标识信息(即存储元数据段的容器的容器标识符信息(container_id)和元数据段的标识符信息(handle_value))。相应地,子关键字索引(sub_key_index)区30包含用于存储在关键字索引(key_index)区20中定义的子关键字索引标识符信息的‘sub_index_identifier’部分、用于存储关键字的值的‘key_value’部分14、用于存储其中存储元数据段的容器的容器标识符信息(container_id)的‘target_container’部分和用于存储段数据标识符信息(handle_value)的‘target_handle’部分。参照示出索引信息的图7,将更容易理解关键字索引结构。图7示出关键字索引列表(key_index_list)区,该区包含与服务ID、出版时间和出版历时(PublishedDuration)相关的关键字。包含与服务ID、出版时间和出版历时相关的关键字的元数据段的上层节点是图3所示的由阴影块标识的‘广播事件(BroadcastEvent)’310。相应地,‘广播事件’段的XPath‘/TVAMain/节目描述(ProgramDescription)/节目位置表(ProgramLocationTable)/广播事件’被存储在‘fragment_xpath_ptr’部分11a中,而到‘广播事件’段的服务ID、出版时间和出版历时的关键字的XPath,即‘@服务ID’(图3中的311a)、‘事件描述(EventDescription)/出版时间’(图3中的311b)和‘事件描述/出版历时’(图3中的311c),被存储在‘key-xpath-ptr’部分12a中。参照示出索引信息的图7,将更容易理解索引结构。图7示出包含服务ID、出版时间和出版历时的关键字的关键字索引列表(key_index_list)区,其中与服务ID、出版时间和出版历时相关的元数据的上层节点是图3阴影部分所表示的‘广播事件’310。因此,‘广播事件’段的XPath‘/TVAMain/节目描述/节目位置表/广播事件’被存储在‘fragment_xpath_ptr’部分中,而到‘广播事件’段的关键字服务ID、出版时间和出版历时的各个XPath,即,‘@服务ID’(参见图3的311a)、‘事件描述/出版时间’(参见图3的311b)和‘事件描述/出版历时’(参见图3的311c),被存储在‘key-xpath-ptr’部分中。而且,图7示出关键字索引列表(key_index_list)区中的服务ID(关键字的XPath@服务ID)的关键字索引(key_index)区20和子关键字索引(sub_key_index)区30。在这种索引结构中,当输入用于搜索元数据的搜索条件时,所输入的搜索条件的字段在元数据中的位置信息被确定,并且所确定的位置信息被与关键字索引列表中的关键字信息进行比较,以便在关键字索引列表中搜索具有所确定的位置信息的关键字,由于必须进行两个XPath的比较,就带来了系统开销。当依据位置信息、对关键字信息中指示来自段的相对路径的关键字进行比较时,也会出现同样的问题。尤其是,当依据位置信息、对比关键字更复杂的段进行比较时,这个问题会更严重。由于关键字信息中表示位置信息的段的XPath描述了XML文档中从根节点到相关节点的路径,传输成本是低效率的,并且终端中XPath的解释成本很高。例如,TV-Anytime段中表示节目位置信息的广播事件段的XPath可以被表示成‘/TVAMain/节目描述/节目位置表/广播事件’。同时,为了在XML文档上表示一个节点,能够以可替换的方式来表示XPath。在广播事件的情况下,除上述通常的表示外,XPath能够可替换地被表示成例如‘/TVAMain//广播事件’或‘//广播事件’等。这里,‘//’指在XML文档结构中的子节点。因此,使用XPath来检查段是否相同的操作,不只是仅仅相互匹配简单串的操作。尤其是,如果以缩写格式表示XPath路径,就会在相关路径的分析/比较中引起系统开销。
发明内容本发明试图解决上述问题。本发明的一个目的是提供一种包含关键字信息的元数据的索引结构,所述关键字信息被编码,以便允许更快地搜索关于内容的信息。本发明的另一个目的是提供一种用于提供能够以快速方式搜索关于内容的信息的元数据的索引的方法、一种使用元数据索引来搜索元数据的方法以及使用上述方法的搜索设备。根据本发明用于完成这些及其他目的的的一个实施例,提供元数据的索引结构,所述索引结构包括由元数据的预定字段组成的关键字的列表,其中所述列表包含字段在元数据中的位置信息,其中至少部分位置信息被以预定的码来表示。最好是,索引结构还包括关键字的值和与关键字的值相对应的元数据的标识信息。而且,最好是,元数据包括在树数据结构中以预定范围划分的段,其中构成关键字的字段对应于构成段的任何一个信息。可取的是,元数据的标识信息包括段的标识信息。可取的是,位置信息包括构成关键字的字段所属于的段在数据结构内的位置信息和字段在段内的位置信息。可取的是,以预定的码来表示数据结构内的位置信息或段内的位置信息。最好是,用XPath来表示至少部分位置信息。最好是,码被预先分配给频繁引用的位置信息。最好是,索引结构还包括表示关键字的值的预定范围的典型关键字值。可取的是,典型关键字值包括相关范围内的值中最大值、最小值或中间值中的至少一个。可取的是,元数据具有TVA中所定义的元数据的结构。根据完成本发明的这些及其他目的的的一个实施例,提供一种用于提供元数据索引的方法,所述索引包含由元数据的预定字段组成的关键字的列表,其中所述列表包含字段在元数据中的位置信息,其中至少部分位置信息被以预定的码来表示。最好是,元数据索引还包括关键字的值和与关键字的值相对应的元数据的标识信息。可取的是,元数据包括在树数据结构中以预定范围划分的段,其中构成关键字的字段对应于构成段的任何一个信息。最好是,元数据的标识信息包括段的标识信息。而且,最好是,位置信息包括构成关键字的字段所属于的段在数据结构内的位置信息和字段在段内的位置信息。最好是,以预定的码来表示数据结构内的位置信息或段内的位置信息。而且,最好是,用XPath来表示至少部分位置信息。最好是,码被预先分配给频繁引用的位置信息。可取的是,元数据索引还包括表示关键字的值的预定范围的典型关键字值。而且,可取的是,典型关键字值包括相关范围内的值中最大值、最小值或中间值中的至少一个。而且,可取的是,元数据具有TVA中所定义的元数据的结构。根据完成本发明的一个实施例,还提供一种用于搜索元数据的方法,包括步骤(i)在元数据中,确定由用户所输入的搜索条件的字段的位置信息;(ii)搜索包含被预定为位置信息的码的关键字,其中至少部分位置信息被定义为预定的码;和(iii)利用所搜索的关键字来提取相关的元数据。可取的是,元数据索引还包括关键字的值和与关键字的值相对应的元数据的标识信息。而且,可取的是,元数据包括在树数据结构中以预定范围划分的段,其中构成关键字的字段对应于构成段的任何一个信息。可取的是,元数据的标识信息包括段的标识信息。而且,可取的是,位置信息包括构成关键字的字段所属于的段在数据结构内的位置信息和字段在段内的位置信息。最好是,以预定的码来表示数据结构内的位置信息或段内的位置信息。而且,最好是,用XPath来表示至少部分位置信息。最好是,码被预先分配给频繁引用的位置信息。而且,最好是,元数据索引还包括关键字的列表。而且,最好是,元数据索引还包括表示关键字的值的预定范围的典型关键字值。最好是,典型关键字值包括相关范围内的值中最大值、最小值或中间值中的至少一个。而且,最好是,元数据具有TVA中所定义的元数据的结构。可取的是,搜索关键字的步骤(ii)包括步骤在关键字列表中搜索包含被定义为位置信息的码的关键字,其中以预定的码来定义(a)数据结构中的位置信息或(b)段中的位置信息。可取的是,提取元数据的步骤(iii)包括步骤(iii-1),在用所搜索的关键字编索引的关键字的值中,搜索满足所输入的搜索条件的关键字的值;和步骤(iii-2),使用所搜索的关键字的值来提取相关的元数据。可取的是,在用所搜索的关键字编索引的关键字的值中,搜索满足所输入的搜索条件的关键字的值的步骤(iii-1)包括步骤搜索满足所输入的搜索条件的典型关键字值,和在由典型关键字值所表示的范围中,搜索关键字的值中满足所输入的搜索条件的关键字的值。根据本发明用于完成这些及其他目的的的一个实施例,提供一种用于搜索元数据的设备,包括输入单元,允许用户输入搜索条件;和控制单元,确定用户所输入的搜索条件的字段在元数据中的位置信息,搜索包含被预定为位置信息的码的关键字,其中至少部分位置信息被定义为预定的码,并且利用所搜索的关键字来提取相关的元数据。最好是,元数据索引还包括关键字的值和与关键字的值相对应的元数据的标识信息。最好是,元数据包括在树数据结构中以预定范围划分的段,其中构成关键字的字段对应于构成段的任何一个信息。最好是,元数据的标识信息包括段的标识信息。最好是,位置信息包括构成关键字的字段所属于的段在数据结构内的位置信息和字段在段内的位置信息。最好是,以预定的码来表示数据结构内的位置信息或段内的位置信息。最好是,用XPath来表示至少部分位置信息。最好是,码被预先分配给频繁引用的位置信息。最好是,元数据索引还包括关键字的列表。最好是,元数据索引还包括表示关键字的值的预定范围的典型关键字值。最好是,典型关键字值包括相关范围内的值中最大值、最小值或中间值中的至少一个。最好是,元数据具有TVA中所定义的元数据的结构。最好是,所述控制单元在关键字列表中搜索包含被定义为位置信息的码的关键字,其中以预定的码来定义(a)数据结构中的位置信息或(b)段中的位置信息。最好是,所述控制单元在用所搜索的关键字编索引的关键字的值中,搜索满足所输入的搜索条件的关键字的值,并且使用所搜索的关键字的值来提取相关的元数据。最好是,所述控制单元搜索满足所输入的搜索条件的典型关键字值,并且在由典型关键字值所表示的范围中,搜索关键字的值中满足所输入的搜索条件的关键字的值。而且最好是,搜索设备还包括接收元数据的接收单元,其中存储所接收的元数据的存储单元,和输出所述控制单元的搜索结果的输出单元。因此,搜索TVA元数据的用于搜索元数据的设备,能够通过使用编码的关键字信息,来更有效地对元数据段执行搜索。通过以下结合附图给出的对优选实施例的详细描述,本发明的上述和其他目的和特征将会变得更加清楚,其中图1是示出一般PDR的概念的示意图;图2示出一般EPG应用程序中的网格指南屏幕;图3示出由TV-Anytime论坛所定义的一般元数据的结构;图4是示出由TV-Anytime论坛所定义的一般段的概念的示意图;图5是示出由TV-Anytime论坛所定义的一般容器的概念的示意图;图6示出使用传统关键字模式的元数据的索引结构;图7示出使用传统关键字模式的元数据索引结构和搜索过程;图8示出根据本发明实施例的元数据的索引结构;图9示出根据本发明实施例的元数据索引结构和搜索过程;图10示出根据本发明实施例的提供元数据索引的方法;图11是示出根据本发明实施例的搜索元数据的方法的简图;和图12是示出根据本发明实施例的用于搜索元数据的设备的示意图。具体实施例方式以下将参照附图详细说明被提供用于搜索关于内容的信息的元数据的索引结构、用于提供元数据索引的方法以及用于使用元数据的索引结构来搜索元数据的方法和设备。为便于说明,在该说明书中将基于TVA元数据来说明实施例;然而,这不应被解释成或理解成对本发明的保护范围的限制。首先,作为关于内容的信息,将说明用于搜索元数据的元数据的索引结构、定义包含编码关键字的信息的索引结构的语法-对关键字编码以便对存储在如上所述的数据容器中的TVA元数据段编索引。也就是说,将说明关键字索引列表(key_index_list)区110、关键字索引(key_index)区120和子关键字索引(sub_key_index)区130,接着将说明包含由语法定义的编码关键字信息的索引结构。定义根据本发明一个实施例的元数据的索引结构的语法,尤其是这种索引结构还包含编码关键字的信息,这种语法在概念上与传统的关键字索引技术文献中所定义的语法的不同之处在于,它包括为关键字信息的编码概念而新引入的结构,例如fragment_descriptor()和key_descriptor(),并且重新组织了关键字索引列表(key_index_list)区110、关键字索引(key_index)区120和子关键字索引(sub_key_index)区130的结构。如上所述的关键字索引列表(key_index_list)区110包括定义各关键字的关键字信息和以下将描述的关键字索引(key_index)区120的标识信息。关键字信息用于定义关键字,即元数据中的位置信息,其是构成关键字的元数据的预定字段所包含的。关键字信息包括构成关键字的字段所属于的元数据段在元数据内的位置信息(以下称为“段的位置信息”,其在TVA中用段的Xpath(fragment_xpath-ptr)来表示),以及构成关键字的字段在每个元数据段内所具有的位置信息(以下称为“关键字的位置信息”,即,TVA中用作关键字的节点的相关段之内的相对路径的Xpath,用关键字的XPath(即,key_xpath-ptr)来表示)。1.关键字索引列表(key_index_list)区关键字索引列表(key_index_list)区提供所有所发送的关键字的列表。指示传统的关键字索引列表(key_index_list)区内的段的位置信息的‘fragment_xpath-ptr’(用TVA中段的Xpath来表示)用fragment_descriptor()来代替。表1key_index_count规定了所有所发送的关键字的数量,即,整个文档的索引数量。fragment_descriptor()描述要编索引的目标段的XPath位置。其中段的位置信息被表示成预定的码,可以描述与后面示出的表3中的标准段类型相同类型的段。段的类型不限于表3的标准段类型,并且可以随意形成段,只要这种形成能够指示用于定义关键字的段的XPath(例如,一部分可以是XPath,而其他部分可以具有编码的码值)。key_descriptor()描述关键字在要编索引的一组目标段的XPath位置之内的XPath。其中关键字的位置信息被表示成预定的码,可以描述与标准关键字类型相同类型的段。如上面参照fragment_descriptor()所述,关键字的类型不限于标准关键字类型。index_container标识指定的关键字索引(key_index)区存在于其中的容器。key_index_identifier标识由index_container所指定的容器内的关键字索引(key_index)区。能够结合index_container和key_index_identifier以惟一的方式来标识关键字索引(key_index)区。2.段描述器(fragment_descriptor)‘fragment_descriptor()’提供编码与频繁使用的标准段类型相关的指定比特(它可以被编码成任意比特,例如8比特、16比特等)的结构,同时提供能够将XPath描述为与用户所定义的元数据段类型相关的附加信息的结构。也就是说,在fragment_descriptor是‘0xFF’的情况下,它指示用户定义的段,于是立即描述相关的用户定义的段的XPath。表2fragment_type表示要编索引的段类型。编码值被分配给频繁使用的标准段类型。如果fragment_type具有编码值0xFF,增加fragment_xpath_ptr作为附加信息。表3示出当TV-Anytime中进行搜索时所频繁使用的段类型(以下称为“标准段”)的位置信息的编码值。然而,本实施例中的标准段类型和编码值不限于表3所示的那些,而是能够根据应用进行扩展的。表33.关键字描述器(key_descriptor)‘key_descriptor()’提供将当进行搜索时具有高使用频率的关键字(以下称为“标准关键字”)的位置信息编码成指定比特的结构,同时还提供描述XPath中由用户定义的关键字类型的结构。例如,如果key_descriptor是‘0xFF’,它指示用户定义的关键字。于是,XPath被描述为用户定义的关键字的附加信息。表4key_type表示要编索引的关键字的类型。在进行搜索时编码值被分配给频繁使用的标准关键字类型的位置信息。如果key_type具有编码值‘0xFF’,增加key_xpath_ptr作为附加信息。key_xpath_ptr指包含在用作关键字的节点的段XPath中的相对路径。在本实施例中,虽然没有指定标准关键字的编码值,也应理解标准关键字类型的编码值具有与编码表3的段类型相似的结构。4.关键字索引(key_index)区由于关键字索引(key_index)区和子关键字索引(sub_key_index)区的定义与关键字索引技术文献中定义的相同,将省略对它们的详细说明。表55.子关键字索引(sub_key_index)区表6以下,将参照图8讨论由上述语法所定义的元数据结构,其中元数据被表示成索引信息的各部分。在索引结构中定义的关键字索引列表(key_index_list)区110提供所有所发送的关键字的列表。该列表包含定义每个关键字的关键字信息(即段的位置信息(fragment_descriptor)和/或关键字的位置信息(key_descriptor);段的位置信息或关键字的位置信息可以被选择性地编码,或者根据本发明的实施例,它们可以被同时编码)和以下将描述的关键字索引(key_index)区120的标识信息。元数据段的XPath是TVA元数据XML文档的根节点的路径,即绝对路径,与传统索引结构的方式相同,并且用作关键字的节点的XPath,即关键字的XPath,表示元数据段的关键字的相对路径。元数据段的XPath和关键字的XPath组合起来表示关于整个XML文档的关键字位置信息。在本发明中,元数据段的XPath的编码值(即段组的位置信息)和关键字的XPath的编码值(即关键字的位置信息)被分别存储在‘fragment_descriptor’部分111和‘key_descriptor’部分112中。如上所述,在关键字信息中的段的位置信息是频繁使用的标准段类型的位置信息的情况下,提供用预定的码表示元数据段的XPath(fragment_xpath_ptr)的编码值(fragment_descriptor)。作为频繁使用的标准段类型,有例如,节目信息(ProgramInformation)、节目组信息(GroupInformation)、字幕信息(CreditsInformation)、节目检查(ProgramReview)、部分信息(SegmentInformation)、广播事件(BroadcastEvent)和服务信息(ServiceInformation)等。如果这些段类型的元数据段的XPath能够被简单地表示成编码值,就能够减少搜索元数据时的系统开销。因此,在根据本发明的索引结构中,标准元数据段的XPath被编码成预定的编码值,然后被存储起来。而且,所有编码值不被分配给段,并且一些编码值(例如‘0xFF’)被分配给用户定义的元数据段,从而允许用户利用XPath来附加地定义元数据段的位置信息。在这方面,例如,提供附加区域(‘fragmentxpathptr’),能够利用该区域来指定元数据段的XPath。在根据表3对段进行编码的实施例中,关键字信息中元数据段的位置信息具有例如‘0x01’、‘0x02’和‘0x03’等编码值。编码成‘0x01’的元数据段的位置信息指示‘节目信息段’的XPath。而且,在元数据段的位置信息是‘0xFF’的情况下,它指由用户定义的元数据段,于是,提供了能够指定元数据段的XPath的附加区域。虽然只关于元数据段描述了上述实施例,可以关于元数据段的关键字应用上述相同的内容。至于频繁使用的关键字,能够指定编码值来使用,但是不能使用传统的关键字XPath。此外,如果编码值包括预定值,用户能够附加指定关键字的XPath。能够同时使用或独立使用上述元数据段的XPath的编码和关键字的XPath的编码。而且,关键字索引列表(key_index_list)区110包括以下将描述的每个关键字的关键字索引(key_index)区120的标识信息(即,其中存储关键字索引(key_index)区120的容器的容器标识符信息(container_id)和关键字索引标识符信息)。容器标识符信息和关键字索引标识符信息被分别存储在关键字索引列表(key_index_list)区110中的‘index_container’部分和‘key_index_identifier’部分。由于关键字索引(key_index)区120和子关键字索引(sub_key_index)区130与在关键字索引技术文献中所述的内容相同,这里将省略对它们的说明。将参照图9详细地说明包含编码的关键字信息的索引结构,图9示出了该索引信息。图9示出了关键字索引列表区110,其中服务ID的‘广播事件’段的XPath被编码成‘0x07’。这里,关键字索引(key_index)区120和子关键字索引(sub_key_index)区130与参照图7所述的内容相同。当使用与频繁使用的段类型相关的关键字时,例如节目信息、组信息和广播事件等,上述索引结构非常有效,从而能够减少搜索元数据的设备中的总系统开销。图10示出了提供元数据索引的方法,该元数据索引具有上述根据本发明的一个实施例的结构。能够由提供例如音频/视频信号的提供者200,来生成根据本发明实施例的元数据索引。首先,基于上述的段来处理关于内容的信息,即元数据(S100)。关于将被包含在元数据索引中的字段的信息的至少一部分(段的位置信息或关键字的位置信息),即关键字信息(例如,段的位置信息和关键字的位置信息),被编码(S200)。换句话说,在构成关键字的字段所属于的元数据段的位置信息或关键字的位置信息是标准段类型或标准关键字类型的情况下,这两者都能够被编码,元数据段的位置信息或关键字的位置信息,即元数据段的XPath或关键字的XPath,被编码成图9中的预定码值(例如,‘广播事件’段被编码成‘0x07’)。在元数据段的位置信息或关键字的位置信息不由编码值标识的情况下,如在传统技术中那样指定利用XPath所表示的关键字信息。通过利用构成段的信息,例如关于‘服务ID’的信息,来提供关键字(S300)。接着,利用如上提供的关键字来提供子关键字索引(sub_key_index)区114(S400)。子关键字索引(sub_key_index)区114其中包含以预定范围划分的关键字的值,而且子关键字索引(sub_key_index)区114其中包含与该关键字的值相对应的元数据段标识信息(即,分别存储在图8的‘target_container’部分和‘target_container’部分中的容器标识符信息(container_id)和段数据标识符信息(handle_value))。提供包含典型关键字值的关键字索引(key_index)区120,其中典型关键字值表示以预定范围划分的关键字的值(S500)。例如,包含指示服务ID的预定范围(例如,500~509)的典型关键字值(例如509)。关键字索引(key_index)区120其中包含子关键字索引(sub_key_index)区114a和114b的标识信息,子关键字索引(sub_key_index)区114a和114b其中存储以预定范围划分的关键字的值,其中标识信息包括其中存储子关键字索引(sub_key_index)区的容器的容器标识符信息(container_id)和子关键字索引标识信息,如图8所示。提供关键字索引列表(key_index_list)区110,该关键字索引列表区110基于关键字来排列如上提供的关键字信息,即段的位置信息和关键字的位置信息(S600)。此时,如果存在步骤S200中的所编码的段的位置信息或所编码的关键字的位置信息,当提供关键字索引列表(key_index_list)区110时,上述位置信息就被表示成所编码的码。换句话说,图9中的‘广播事件’段被编码成‘0x07’。在不能够通过编码值来区分段的位置信息或关键字的位置信息的情况下,插入如传统技术中用XPath所表示的关键字信息。除关键字信息之外,关键字索引列表(key_index_list)区110还包括关键字索引(key_index)区120的标识信息。在其他的实施例中,上述步骤可以以相反的顺序进行,并且根据实施例,可以省略提供其中包含典型关键字值的关键字索引(key_index)区120的步骤S500。以下,将参照图11说明搜索满足搜索条件的元数据的方法,该方法利用具有上述根据本发明的一个实施例的结构的元数据索引。由用户输入搜索条件(S1100),并且确定与所输入的搜索条件的字段相关的元数据中的位置信息(S1200)。在利用预定的码来定义至少部分位置信息-例如段的位置信息或关键字的位置信息-的情况下,在关键字索引列表(key_index_list)区110中搜索其中包含所定义的关键字的关键字(S1300),并且利用搜索到的关键字来提取相关的元数据(S1400)。提取相关的元数据的步骤S1400,包括步骤在关键字索引(key_index)区120中,通过将典型关键字值与搜索条件中的关键字值的范围进行比较,来搜索满足搜索条件的典型关键字值;并且在由搜索到的典型关键字值所表示的范围中,搜索包含该关键字值的子关键字索引(sub_key_index)区114(S1410);在搜索到的子关键字索引(sub_key_index)区114中,搜索满足搜索条件的关键字值;并且利用对应于利用搜索到的关键字值的关键字值的元数据段的标识信息来提取相关的元数据,从而提取出满足搜索条件的元数据。这里,段的位置信息指其关键字如上所述被编索引的元数据段的绝对路径,即元数据段的XPath(fragment_xpath_ptr),并且关键字的位置信息指元数据段的关键字的相对路径(段的XPath位置中的相对路径),即用作关键字的节点的XPath(key_descriptor)。在步骤S1410、S1420和S1430中,分别是如下步骤搜索相关的关键字索引(key_index)区120和子关键字索引(sub_key_index)区114,以及利用关键字索引(key_index)区120、子关键字索引(sub_key_index)区和元数据段的标识信息进行的提取相关的段。图12示出根据本发明一个实施例的用于搜索元数据的设备。该设备执行如上参照图11所述的根据本发明的搜索元数据的方法。该设备包括输入单元1100,允许用户输入搜索条件;用于搜索元数据的设备1200,接收内容、关于内容的元数据或元数据的索引;存储单元1300,其中存储接收到的内容、关于内容的元数据或元数据的索引;控制单元1400,确定与从输入单元1100输入的搜索条件的字段相对应的元数据的位置信息,搜索包含被预定为位置信息的码的关键字,其中至少部分位置信息被定义为预定的码,并且利用搜索到的关键字来提取相关的元数据;和输出单元1500,输出控制单元1400的搜索结果。控制单元1400对从输入单元1100输入的搜索条件与包含在元数据索引中的关键字值进行比较,所述元数据索引被存储在存储单元1300中。在根据本发明一个实施例的搜索元数据的步骤中,在控制单元1400中执行如下步骤确定所输入的搜索条件的字段在元数据中的位置信息的步骤(S1210),搜索包含被预定为位置信息的码的关键字的步骤,其中至少部分位置信息被定义为预定的码(S1300),以及利用搜索到的关键字来提取相关的元数据的步骤(S1400)。已经参照图12描述了这些步骤。本发明提出了一种索引结构、一种搜索索引信息的方法以及搜索索引信息的设备,其中在基于段构造元数据的环境下,所述索引结构提供简化的元数据段的索引方法,以便以快速方式来搜索元数据段。产业上的可利用性根据本发明,对元数据进行快速搜索是可行的,而且能够减少搜索元数据的设备的系统开销,从而缩短搜索时间,并且提高搜索元数据的设备的效率。虽然已参照附图所示的优选实施例描述了本发明,但这仅仅是示例性的。本领域技术人员应该理解,在不脱离本发明的实质和范围的情况下,可以作出各种修改及等效方案。因此,本发明的范围应当只由所附权利要求来限定。权利要求1.一种元数据的索引结构,包括由所述元数据的预定字段组成的关键字的列表,其中,所述列表中包含所述字段在所述元数据中的位置信息,并且其中,至少部分所述位置信息被表示成预定的码。2.如权利要求1所述的索引结构,还包括所述关键字的值和与所述关键字的值相对应的所述元数据的标识信息。3.如权利要求2所述的索引结构,其中所述元数据包括在树数据结构中以预定范围划分的段,其中构成第一关键字的第一字段对应于构成所述段的任何一个信息。4.如权利要求3所述的索引结构,其中所述元数据的标识信息包括所述段的标识信息。5.如权利要求3所述的索引结构,其中所述位置信息包括构成所述第一关键字的第一字段所属于的第一段在所述数据结构内的位置信息和所述第一字段在所述第一段内的位置信息。6.如权利要求5所述的索引结构,其中以预定的码来表示所述数据结构内的位置信息或所述第一段内的位置信息。7.如权利要求5所述的索引结构,其中用XPath来表示至少部分所述位置信息。8.如权利要求1所述的索引结构,其中所述预定的码被预先分配给频繁使用的位置信息。9.如权利要求2所述的索引结构,还包括表示所述关键字的值的预定范围的典型关键字值。10.如权利要求9所述的索引结构,其中所述典型关键字值包括所述预定范围内的所述关键字的值中最大值、最小值或中间值中的至少一个。11.如权利要求1所述的索引结构,其中所述元数据具有TVA中所定义的元数据的结构。12.一种用于提供元数据索引的方法,所述元数据索引包含由所述元数据的预定字段组成的关键字的列表,该方法包括将所述元数据的预定字段提供给所述关键字的列表;其中,所述列表包含所述字段在所述元数据中的位置信息,其中,至少部分所述位置信息被以预定的码来表示。13.如权利要求12所述的方法,其中所述元数据索引还包括所述关键字的值和与所述关键字的值相对应的所述元数据的标识信息。14.如权利要求13所述的方法,其中所述元数据包括在树数据结构中以预定范围划分的段,其中构成第一关键字的第一字段对应于构成所述段的任何一个信息。15.如权利要求14所述的方法,其中所述元数据的标识信息包括所述段的标识信息。16.如权利要求14所述的方法,其中所述位置信息包括构成所述第一关键字的第一字段所属于的第一段在所述数据结构内的位置信息和所述第一字段在所述第一段内的位置信息。17.如权利要求14所述的方法,其中以所述预定的码来表示所述数据结构内的位置信息或所述第一段内的位置信息。18.如权利要求16所述的方法,其中用XPath来表示至少部分所述位置信息。19.如权利要求12所述的方法,其中所述预定的码被预先分配给频繁使用的位置信息。20.如权利要求13所述的方法,其中所述元数据索引还包括表示所述关键字的值的预定范围的典型关键字值。21.如权利要求20所述的方法,其中所述典型关键字值包括所述预定范围内的所述值中最大值、最小值或中间值中的至少一个。22.如权利要求12所述的方法,其中所述元数据具有TVA中所定义的元数据的结构。23.一种用于搜索元数据的方法,包括步骤(i)在所述元数据中,确定由用户所输入的搜索条件的字段的位置信息;(ii)搜索包含预定的码作为位置信息的关键字,其中至少部分所述位置信息被定义为所述预定的码;和(iii)利用所搜索的关键字来提取相关的元数据。24.如权利要求23所述的方法,其中元数据索引包括所述关键字的值和与所述关键字的值相对应的所述元数据的标识信息。25.如权利要求24所述的方法,其中所述元数据包括在树数据结构中以预定范围划分的段,其中所述构成关键字的字段对应于构成所述段的任何一个信息。26.如权利要求25所述的方法,其中所述元数据的标识信息包括所述段的标识信息。27.如权利要求25所述的方法,其中所述位置信息包括构成所述关键字的字段所属于的段在所述数据结构内的位置信息和所述字段在所述段内的位置信息。28.如权利要求27所述的方法,其中以所述预定的码来表示所述数据结构内的位置信息或所述段内的位置信息。29.如权利要求27所述的方法,其中用XPath来表示至少部分所述位置信息。30.如权利要求23所述的方法,其中所述预定的码被预先分配给频繁使用的位置信息。31.如权利要求24所述的方法,其中所述元数据索引还包括关键字的列表。32.如权利要求24所述的方法,其中所述元数据索引还包括表示所述关键字的值的预定范围的典型关键字值。33.如权利要求32所述的方法,所述典型关键字值包括所述预定范围内的所述值中最大值、最小值或中间值中的至少一个。34.如权利要求23所述的方法,其中所述元数据具有TVA中所定义的元数据的结构。35.如权利要求28所述的方法,其中所述搜索关键字的步骤(ii)包括步骤在关键字列表中搜索包含所述预定的码作为位置信息的所述关键字,其中以所述预定的码来定义(a)所述数据结构中的位置信息或(b)所述段中的位置信息。36.如权利要求35所述的方法,其中所述提取元数据的步骤(iii)包括(iii-1)在用所搜索的关键字编索引的关键字的值中,搜索满足所输入的搜索条件的关键字的值;和(iii-2)使用所搜索的关键字的值,来提取所述相关的元数据。37.如权利要求36所述的方法,其中在用所搜索的关键字编索引的关键字的值中,搜索满足所输入的搜索条件的关键字的值的步骤(iii-1)包括步骤搜索满足所输入的搜索条件的典型关键字值;和在由所述典型关键字值所表示的范围中,搜索所述关键字的值中满足所输入的搜索条件的关键字的值。38.一种用于搜索元数据的设备,包括输入单元,允许用户输入搜索条件;和控制单元,用于确定由用户所输入的搜索条件的字段在所述元数据中的位置信息,搜索包含预定的码作为位置信息的关键字,其中至少部分所述位置信息被定义为所述预定的码,并且利用所搜索的关键字来提取相关的元数据。39.如权利要求38所述的设备,其中所述元数据索引包括所述关键字的值和与所述关键字的值相对应的所述元数据的标识信息。40.如权利要求39所述的设备,其中所述元数据包括在树数据结构中以预定范围划分的段,其中所述构成关键字的字段对应于构成所述段的任何一个信息。41.如权利要求40所述的设备,其中所述元数据的标识信息包括所述段的标识信息。42.如权利要求40所述的设备,其中所述位置信息包括所述构成关键字的字段所属于的第一段在所述数据结构内的位置信息和所述字段在所述第一段内的位置信息。43.如权利要求42所述的设备,其中以所述预定的码来表示所述数据结构内的位置信息或所述第一段内的位置信息。44.如权利要求42所述的设备,其中用XPath来表示至少部分所述位置信息。45.如权利要求38所述的设备,其中所述预定的码被预先分配给频繁使用的位置信息。46.如权利要求39所述的设备,其中所述元数据索引还包括关键字的列表。47.如权利要求39所述的设备,其中所述元数据索引还包括表示所述关键字的值的预定范围的典型关键字值。48.如权利要求47所述的设备,其中所述典型关键字值包括所述预定范围内的所述值中最大值、最小值或中间值中的至少一个。49.如权利要求38所述的设备,其中所述元数据具有TVA中所定义的元数据的结构。50.如权利要求43所达的设备,其中所述控制单元在所述关键字列表中搜索包含被定义为位置信息的所述预定的码的关键字,其中以所述预定的码来定义(a)所述数据结构中的位置信息或(b)所述第一段中的位置信息。51.如权利要求50所述的设备,其中所述控制单元在用所搜索的关键字编索引的关键字的值中,搜索满足所输入的搜索条件的关键字的值,并且使用所搜索的关键字的值来提取所述相关的元数据。52.如权利要求51所述的设备,其中所述控制单元搜索满足所输入的搜索条件的典型关键字值,并且在由所述典型关键字值所表示的范围中,搜索所述关键字的值中满足所输入的搜索条件的关键字的值。53.如权利要求38所述的设备,还包括接收单元,用于接收元数据;存储单元,其中存储所接收的元数据;和输出单元,用于输出所述控制单元的搜索结果。全文摘要本发明提供一种被提供用于搜索关于内容的信息的元数据的索引结构、一种提供元数据索引的方法和一种使用元数据的索引结构来搜索元数据的方法及设备。元数据的索引结构包含由元数据的预定字段组成的关键字的列表,其中所述列表中包含所述字段在元数据中的位置信息,其中至少部分位置信息被表示成预定的码。文档编号G06F17/30GK1606743SQ03801751公开日2005年4月13日申请日期2003年7月16日优先权日2002年7月23日发明者申孝燮申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1