一种利用关系数据库对媒体素材进行索引和查询的方法

文档序号:6614027阅读:321来源:国知局

专利名称::一种利用关系数据库对媒体素材进行索引和查询的方法
技术领域
:本发明涉及一种对数据进行索引和查询的方法,尤其是涉及一种利用关系数据库对媒体素材进行索引和查询的方法。
背景技术
:电视台和相关科研机构的媒体资源利用和管理部门需要一套适用于广电行业的媒体资产管理系统,用于建立媒体资源信息库,管理和检索所需的媒体信息。当资源信息入库后,需要一种行之有效的快速的方法,查找出所需要的入库媒体资源素材信息。在现有的媒体资产管理系统中,一般是使用数据表的方式存储编目结构信息,由于使用该系统的用户单位不同,各个单位对编目的需求不同,所以需要考虑增强配置编目信息的灵活性和可扩展性,用来根据用户的不同使用需求,制定不同的编目模型。而采用数据表的存储方式,其增加和减少编目选项比较困难,因此其灵活性和可扩展性较低,对存储空间的要求较高。此外,现有的查询媒体信息的方法,其速度较慢,准确性也较差。为了更好的了解现有技术,现将本发明所涉及的相关技术简要介绍如下。编目是指对音像资料进行著录标引,并组织、制作各种检索目录或检索途径和工具的工作。它是音像资料管理工作中的重要内容。编目管理主要是通过节目资料计算机管理系统实现的,而节目资料的编目工作又是整个节目资料计算机管理系统的核心环节,编目工作的水平直接影响着整个系统的水平,并关系着所藏资料是否能真正充分开发利用。因此做好编目工作,对于建成数字化音像资料馆,提高音像资料管理水平,全面提高音像资料馆现代化信息服务,有着非常重要的意义。关系数据库在关系模型中,实体以及实体间的联系都是用关系表示的。例如,系实体,学生实体,系与学生之间的一对多的联系都可以分别用一个关系来表示。在一个给定的应用领域中,所有实体和实体之间联系的关系模式集合构成一个关系数据库的描述,称作关系数据库的内涵。关系数据库也有型和值之分,关系数据库的型也称为关系数据库模式,是对关系数据库的描述,包括若干域的定义以及在这些域上定义的若干关系模式。关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常称为关系数据库称关系数据库的外涵。关系数据库是支持关系模型的数据库系统。关系模型由关系数据结构、关系操作集合和完整性约束三部分组成。关系操作分为关系代数、关系演算、具有关系代数和关系演算双重特点的语言(SQL语言)。完整性约束提供了丰富的完整性实体完整性、参照完整性和用户定义的完整性。XML:(extensibleMarkupLanguage可扩展才示"i己i吾言)是——种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立。XML与Access,Oracle和SQLServer等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如数据索引、排序、查找、相关一致性等,XML仅仅是展示数据。XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言。XML(可扩展标记语言)是/人称为SGML(标准通用标记语言)的更加古老的语言派生出来的。SGML的主要目的是定义使用标签来表示数据的标记语言的语法。标签由包围在一个小于号(O和一个大于号(〉)之间的文本组成,例如〈tag入起始标签(starttag)表示一个特定区域的开始,例如〈start〉;结束标签(endtag)定义了一个区域的结束,除了在小于号之后紧跟着一个斜线(/)外,和起始标签基本一样,例如〈/end人SGML还定义了标签的特性(attribute),它们是定义在小于号和大于号之间的值,例如〈imgsrc="picture,jpg"〉中的src特性。XPath:它于1999年11月16日成为W3C的推荐标准,是一种能够在XML文档中寻找信息的语言,通过XML文档中的元素和属性来进行导航。
发明内容针对现有技术中存在的缺陷,本发明的目的是提供一种灵活性和可扩展性较高,对存储空间要求较低的利用关系数据库对媒体素材进行索引和快速而精确的查询数据的方法。为达到以上目的,本发明采用的技术方案是一种利用关系数据库对媒体素材进行索引的方法,包括以下步骤(1)生成XML结构的编目模型,所述的编目模型是指编目信息的树状层次结构的模型;(2)将生成的编目模型导入到媒体资产管理系统中,媒体资产管理系统将编目模型存储到关系数据库中,并根据保存到数据库中的编目模型动态生成相应的编目信息操作界面;(3)编目人员在编目信息操作界面中录入素材编目描述信息;(4)编目人员将该素材编目描述信息发布到关系数据库中,在关系数据库的横表中存储该素材编目描述信息,其结构为XML结构,在关系数据库的竖表中存储该素材编目描述信息的索引信息,所述的素材编目描述信息的索引信息记录了相应素材信息的媒体对象编号。进一步,步骤(l)中所述的编目模型是通过编目模型生成工具来生成的,所述的编目模型生成工具用于对编目模型树状层次结构进行展示,或者对编目模型的子选项进行添加、修改或删除。更进一步,步骤(1)中所述的编目模型能够根据用户的需求自行定义。进一步,步骤(4)中所述的素材编目描述信息的索引信息记录了相应素材信息的需要查询字段的xpath路径和字段的编目描述信息。进一步,步骤(4)中在关系数据库的横表中还加入用户需要经常关注的子项列。一种对如上所述的索引后的媒体素材进行查询的方法,包括以下步骤步骤一,用户输入查询条件;步骤二,媒体资产管理系统首先在关系数据库的竖表中,获得与查询条件匹配的媒体对象编号集合;步骤三,如果媒体对象编号集合为空,则在页面中显示没有找到记录的提示信息;步骤四,如果媒体对象编号集合不为空,则根据该媒体对象编号集合在关系数据库的横表中获得素材信息集合,在页面中将素材信息集合以列表的方式显示,供用户进一步操作。进一步,素材编目描述信息的索引信息还记录了相应素材信息的需要查询字段的xpath路径和字段的编目描述信息,所述的媒体对象编号集合是根据需要查询字段的xpath路径和字段查询条件获得。进一步,步骤(5)中所述的查询方式为模糊查询。本发明的效果在于采用本发明所述的方法,可以根据用户的不同使用需求,制定不同的编目模型,并在此基础上提供了一种快速而准确的查询数据的方法,因此其灵活性和可扩展性较高,而且对存储空间的要求较低。图l是构造编目模型操作界面的流程图2是录入素材编目描述信息并将其存储到关系数据库的流程图;图3是搜索素材信息的流程图4是标准编目模型图与A电视台的自定义的编目模型图。具体实施例方式下面结合具体实施方式和说明书附图对本发明作进一步的描述。图1出示了生成编目信息界面的流程,主要包括以下步骤a.首先利用编目模型生成工具生成自定义的XML结构的编目模型,见Sll;7所述的编目模型是指编目信息的树状层次结构的模型,自定义编目模型是指用户不完全遵循《广播电视音像资料编目规范》的要求,而是根据自己实际的编目需要添加、z修改、删除相应的编目选项,〃t人而形成树状结构的编目模型。本实施例中,所述的编目模型是通过编目模型生成工具来生成的,并能够根据用户的需求自行定义。所述的编目模型生成工具是一个应用软件,用于对编目模型树状层次结构展示,添加、修改、删除子选项的一个工具。b.然后将生成的编目模型导入到媒体资产管理系统中,见S12。所述的导入过程如下媒体资产管理系统中的管理配置页面中有一个导入按纽,点击导入按钮,选择编目模型文件的所在路径,选中后确定,即可把编目模型导入到媒体资产管理系统中。c.媒体资产管理系统将该编目模型保存到关系数据库中,见S13。d.媒体资产管理系统根据该编目模型构造相应的编目信息操作界面,即根据该编目模型记录的信息解析其数据结构,动态生成可供用户操作的编目信息界面,见S14。至此,编目信息界面建立完成,接下来用户可以利用该界面输入和发布媒体素材信息,图2便出示了这一过程,主要包括以下步骤a.编目人员在编目信息操作界面中录入素材编目描述信息,见S21。b.编目人员将该素材编目描述信息发布于关系数据库中,见S22。其中,在关系数据库的横表中存储该素材编目描述信息,结构为XML结构,见S23;在关系数据库的竖表中存储该素材编目描述信息的索引信息。素材索引信息主要记录相应素材信息的媒体对象编号、需要查询字段的xpath路径和字段的内容描述,见S24。至此,媒体素材描述信息和索引信息输入和发布完毕,用户可以对关系数据库中的数据进行查询操作,图3出示了查询的过程,主要包括如下步骤a.用户输入查询条件,搜索,见S31。b.媒体资产管理系统首先在关系数据库的竖表中,根据索引判断,获得与查询条件匹配的媒体对象编号集合,见S32;本实施例中,所述的媒体对象编号集合是根据字段的xpath路径和字段的查询条件获得;c.如果媒体对象编号集合不为空,则在关系数据库的横表中根据媒体对象编号集合获得与其一一对应的素材信息集合,见S33;在页面中将素材信息集合以列表的方式显示,供用户进一步操作,见S34。d.如果媒体对象编号集合为空,则在页面中显示没有找到记录的提示信息,见S35。采用本发明所述方法的具体应用实例如图4所示,某县级地方A电视台为了便于存储、管理、查询素材信息,需要一套媒体资产管理系统。在做存储、管理、查询操作之前,需要先将素材进行编目操作。在《广播电视音像资料编目规范》(以下简称《规范》)中规定,素材被分为四层,分别为节目层、片段层、场景层、镜头层,如图4(A)所示。A电视台根据自身的需要,只想对节目层、片段层和场景层进行编目,因此A电视台可以使用编目模型生成工具构造出素材只有三层的编目模型,即只有节目层、片段层和场景层。另外,A电视台节目层子项内容和《规范》中节目层子项内容也不相同,比如《规范》中节目层包括题名、主题、描述、创建者、其他责任者、出版者等,而A电视台中的节目层只包括题名、主题、描述、创建者。首先,A电视台利用本发明所述的编目模型生成工具生成仅有三层结构的编目模型,其中节目层只包括题名、主题、描述、创建者,如图4(B)所示;将生成的编目模型导入到A电视台的媒体资产管理系统中,系统根据导入的编目模型生成编目信息操作界面。该界面的素材只有三层,即节目层、片断层和场景层。编目人员填写相应的信息后将信息发布到关系数据库中。在数据库的横表中存储该素材编目描述信息,在数据库的竖表中存储该素材编目描述信息的索引信息。下面以查询"春节晚会,,为例,说明本发明所述方法的查询过程。9首先,在A电视台的媒体资产管理系统中根据节目层题名输入查询条件"春节晚会,,搜索。系统先根据查询条件"春节晚会"从数据库的竖表中查询,获得与其匹配的媒体对象编号集合{10,23},关系数据库的竖表内容如下表所示表一:<table>tableseeoriginaldocumentpage10</column></row><table>然后,系统根据媒体对象编号集合{10,23}在关系数据库的横表中查询,获得与其一一对应的素材信息。媒体对象编号10所对应的素材信息如下<层次结构><节目层><题名〉2000年春节晚会</题名><主题〉千禧年</主题〉<描述>晚会很精彩</题名><创建者>张三</创建者〉<节目层><片段层〉<节目层><场景层〉<场景层〉<层次结构>媒体对象编号23所对应的素材信息如下<层次结构><节目层〉<题名〉2008年春节晚会</题名〉<主题〉迎奥运</主题〉<描述>期盼08奥运会</题名><创建者>李四</创建者〉<节目层〉<片段层><节目层><场景层><场景层><层次结构>最后,将最后在页面中将素材信息集合以列表的方式显示,其结果如下表所示表二:<table>tableseeoriginaldocumentpage11</column></row><table>本实施例中,在关系数据库的横表中还可以加入用户最需要经常关注的子项列,如题名、创建者等。因查询后,页面展示信息全部从数据库横表中提取,解析复杂xml多少也需要花费时间,所以对实时性要求比较高的系统可以考虑在横表中进行扩展,将最经常关注用到的子项信息在横表中新建一列,备份相应信息,这样,以后关于该列的信息就可以不通过解析xml结构层次提取,而直接从扩展的横表中提取。这样做的优点是在原有基础上,可以进一步提高查询速度;但因为部分信息被存储多份,因而需要更多的存储空间来保存信息。这是用空间来换取时间的做法,更适用于对存储空间要求更低对实时性要求更高的需求。术人员根据本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。权利要求1.一种利用关系数据库对媒体素材进行索引的方法,包括以下步骤(1)生成XML结构的编目模型,所述的编目模型是指编目信息的树状层次结构的模型;(2)将生成的编目模型导入到媒体资产管理系统中,媒体资产管理系统将编目模型存储到关系数据库中,并根据保存到数据库中的编目模型动态生成相应的编目信息操作界面;(3)编目人员在编目信息操作界面中录入素材编目描述信息;(4)编目人员将该素材编目描述信息发布到关系数据库中,在关系数据库的横表中存储该素材编目描述信息,其结构为XML结构,在关系数据库的竖表中存储该素材编目描述信息的索引信息,所述的素材编目描述信息的索引信息记录了相应素材信息的媒体对象编号。2.如权利要求1所述的一种利用关系数据库对媒体素材进行索引的方法,其特征在于步骤(1)中所述的编目模型是通过编目模型生成工具来生成的,所述的编目模型生成工具用于对编目模型树状层次结构进行展示,或者对编目模型的子选项进行添加、修改或删除。3.如权利要求2所述的一种利用关系数据库对媒体素材进行索引的方法,其特征在于步骤(1)中所述的编目模型能够根据用户的需求自行定义。4.如权利要求1至3之一所述的利用关系数据库对媒体素材进行索引的方法,其特征在于步骤(4)中所述的素材编目描述信息的索引信息还记录了相应素材信息的需要查询字段的xpath路径和字段的编目描述信息。5.如权利要求4所述的一种对媒体素材进行索引的方法,其特征在于步骤(4)中在关系数据库的横表中还加入用户需要经常关注的子项列。6.一种对权利要求1中所述的索引后的媒体素材进行查询的方法,包括以下步骤步骤一,用户输入查询条件;步骤二,媒体资产管理系统首先在关系数据库的竖表中,获得与查询条件匹配的媒体对象编号集合;步骤三,如果媒体对象编号集合为空,则在页面中显示没有找到记录的提示信息;步骤四,如果媒体对象编号集合不为空,则根据该媒体对象编号集合在关系数据库的横表中获得素材信息集合,在页面中将素材信息集合以列表的方式显示,供用户进一步操作。7.如权利要求6所述的一种对媒体素材进行查询的方法,其特征在于素材编目描述信息的索引信息还记录了相应素材信息的需要查询字段的xpath路径和字段的编目描述信息,所述的媒体对象编号集合是根据需要查询字段的xpath路径和字段查询条件获得。8.如权利要求6或7所述的一种对媒体素材进行查询的方法,其特征在于所述的查询方式为模糊查询。全文摘要本发明涉及一种利用关系数据库对媒体素材进行索引和查询的方法,属于对数据的索引和查询领域。在现有的技术中,一般采用数据表的方式存储编目结构信息,这种存储方式的灵活性、扩展性较低,对存储空间要求较高。本发明采用编目模型的方式存储编目结构信息,用户可以根据自身的需要生成自定义的编目模型。当用户查询信息时,在关系数据库竖表中获得媒体对象编号集合,在横表中获得素材信息列表,最后将素材信息列表显示到页面供用户进一步操作。采用本发明所述的方法,具有较好的灵活性和可扩展性,对存储空间的要求也较低,可以快速精确的查询出所需要的信息数据。文档编号G06F17/30GK101464864SQ20071017976公开日2009年6月24日申请日期2007年12月18日优先权日2007年12月18日发明者磊刘,夏超军,王弋珵申请人:新奥特(北京)视频技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1