建立内容管理系统的方法

文档序号:6651531阅读:148来源:国知局
专利名称:建立内容管理系统的方法
技术领域
本发明涉及一种建立内容管理系统的方法。
背景技术
内容管理系统需要管理大量的数据,包括结构化数据和非结构化数据。非结构化数据是指不能被映射成关系模型的自然数据,如常见的报纸、传真、声音、图形、图像数据都是非结构化数据,非结构化数据一般称为“对象数据”。结构化数据一般称为“元数据”,是用于描述对象数据,以便以各种方式对对象数据进行组织、分组、关联、检索和管理。内容管理系统大多使用关系数据库存储元数据,而“对象数据”的存储一般都采用文件系统的方式。通过在元数据和对象数据之间建立映射,形成一个完整的内容。简单的说,数据的本身称为对象数据,数据的属性称为元数据,例如文件名称、文件大小、创建者、创建时间等。
对于不同格式的对象数据,其元数据描述也不完全一样,如人们对影视类的视频数据关心的是主要演员、导演、故事情节等;对图像数据,人们更关心的是图象的分辨率、尺寸等;对于文档,人们更关心的是文档的作者、内容摘要等。由于不同格式的对象数据,其元数据千差万别,因此无法提供一个预定义的统一的数据模型来存储所有的元数据,现有的内容管理系统提供了数据建模的能力(API或GUI),让数据建模人员为每一个类型对象数据的元数据建立一个数据模型,以便基于该数据模型提供数据的分组、检索和管理。但这种建模方法忽略了不同类型对象数据的元数据之间的共性,无法基于该数据模型提供跨类型检索。
在现实世界中,内容之间具有内在的关联,关联的双方可能是不同类型的内容,如一个新闻报道的文稿及其照片。关联的形式多种多样,如内容的复合和内容的引用。内容的复合是指将多个内容组合形成新的内容,这就是复合内容,复合内容的元数据和下级内容的元数据结构可能相同,也可能不同;复合内容的下级内容可以来源于不同格式的内容,比如一本书的封面、序言、各个章节、跋、封底等是独立的内容,封面和封底是图象文件,其他是普通文档,将所有这些复合起来,形成书的完整内容,而书的描述就会包括出版社、出版日期等出版相关的元数据描述。内容的引用最常见的例如一篇论文引用的文献。现有内容管理系统忽视了内容之间的关联,无法描述复合内容这样的层次化关系,也无法迅速定位到论文的引用文献等关联内容。
另外,对象数据并不等同于数据文件,它可能是多个数据文件及其所属文件夹构成的有机整体,如一个影片的多个视频文件构成的多文档、一个HTML文件及其内嵌图象等构成的复合文档等。现有的内容管理系统以文件作为内容的管理单位,完全忽略了对象数据的内部组织。对于多文档和复合文档这样的对象数据,无法实现正确的管理。

发明内容
本发明的目的是提出一种建立内容管理系统的方法,使内容管理系统能够标识公共元数据结构,基于该结构实现跨类型检索,同时能够更加快捷的实现内容的复合,并能体现内容之间的关联关系和对象数据的内部组织。
为实现本发明的目的,本发明提出的建立内容管理系统的方法,包括以下步骤将内容的元数据划分为公共元数据和扩展元数据,针对公共元数据和扩展元数据进行数据建模,建立用于存储内容的元数据的数据库;采用递归方式存储对象数据,建立用于存储用户对象数据的存储空间。所述公共元数据为所有类型对象数据都具有的元数据,所述扩展元数据为对象数据特有的元数据。
其中,用于存储内容的元数据的数据库是从关系数据库、面向对象数据库、对象-关系数据库和XML数据库中选择的。
其中,本发明提出的建立内容管理系统的方法,具体步骤为建立用于存储内容的元数据的数据库以及,建立用于存储用户对象数据的存储空间,该方法还包括以下步骤为所有类型的内容建立统一的公共属性表;为不同类型的内容建立各自的扩展属性表将内容的公共元数据的每一个属性映射为公共属性表的一列;将同一类型的内容的扩展元数据的每一个属性映射为该类型的扩展属性表的一列
将每一项内容的公共元数据映射为公共属性表的一行,所述内容的公共元数据的属性值映射到公共属性表的相应列;将每一项内容的扩展元数据映射为本类型的扩展属性表的一行;所述内容的扩展元数据的属性值映射到扩展属性表的相应列;将与所述内容具有关联关系的其他内容的ID,关联到所述内容的关联关系表中的相应行,并标识出关联关系;将与所述内容具有复合关联关系的其他内容的ID,关联到所述内容的复合关系表中的相应行。
其中,所述公共元数据为所有类型对象数据都具有的元数据,所述扩展元数据为对象数据特有的元数据。
其中,为了同一内容公共元数据与扩展元数据的关联,同一对象数据的公共元数据和扩展元数据具有相同的ID。
其中,所述存储区域采用递归结构存储对象数据。
本发明提出了一种建立内容管理系统的方法,依照本发明提出的方法建立的内容管理系统,由于建立了统一的公共元数据表,使内容管理系统能够实现跨类型的检索;由于建立了关联关系表和复合关系表,能够清晰的标明内容之间的关联关系和复合关系,使内容的复合变得更加简便;由于采用递归方式存储对象数据,体现了对象数据之间的内在组织。


图1是内容的对象数据与元数据的关系示意图;图2是本发明优选实施例公共属性表示意图;图3是本发明优选实施例扩展属性表示意图;图4是本发明优选实施例关联关系表示意图;具体实施方式
下面结合附图对本发明作进一步的详细描述如图1所示,所有内容都由对象数据和元数据组成,在元数据和对象数据之间建立映射,从而形成一个完整的内容。对象数据是存储在不同文件夹中的数据本身,元数据就是数据的属性。
在建立内容管理系统时,执行以下步骤
(1)建立公共属性表,公共属性表结构如图2所示,公共属性表用于存储所有类型内容的公共元数据,由于公共元数据是所有内容都共同具有的元数据,首先将所有内容的公共元数据的每一个属性映射为公共属性表的一列,分别为公共属性1、公共属性2、公共属性3......公共属性n,所述的公共属性可以为题名、描述、创建者、创建时间等。然后将每一项内容的公共元数据映射为公共属性表的一行,并为每个内容建立一个ID,并将公共元数据的属性值分别映射到公共属性表的相应列。
(2)建立扩展属性表,扩展属性表结构如图3所示,扩展属性表用于存储不同类型的内容的扩展元数据,由于不同类型的内容的扩展元数据都不相同,因此需要为不同类型的内容建立各自的扩展属性表,将同一类型的内容的扩展元数据的每一个属性映射为扩展属性表的一列,然后将每一项内容的扩展元数据,映射为本类型扩展属性表的一行,并为每一内容建立一个ID,并将每一项内容的扩展元数据的属性值分别映射到所述类型的扩展属性表的相应列。同一个内容的公共元数据和扩展元数据,具有相同的ID。
(3)建立关联关系表,关联关系表的结构如图4所示,关联关系表中的每一行包括源内容ID、目标内容的ID、内容之间的关联关系。在本优选实施例中,由图4可以看出,内容32是由内容30和内容31复合而成,复合顺序为内容30在前,内容31在后。这样就能快速的对内容进行复合。同时,关联关系还包括引用。如图4所示,内容31引用了内容30,这样能够使用户调取关联文件时不需要再进行重复检索,更加快捷也降低了系统的负荷。
(4)将对象数据采用递归结构存储到存储空间中,根据预定义的策略创建(或选择已有)上级文件夹(可选的策略包括同一类型的对象数据存储在同一个文件夹内,按照上载时间选取或建立相应的文件夹,或者是两个策略的组合),在存储对象数据时,如果所述对象数据还包含有其他对象数据,则建立下层文件夹,将包含的对象数据存储在下层文件夹中。例如网页通常是由一个HTML文件以及其中包含图片或动画组成,在存储网页时,将HTML文件存储在相应的文件夹中,将其中包含的图片或动画存储在下层文件夹中。采用这种递归方式存储对象数据,能够更好的体现对象数据的内部组织。
当需要在内容管理系统中的指定类型进行检索时,系统执行以下步骤
(1)用户输入的检索条件,判断用户输入的检索条件的组成,如果只包含公共元数据的检索条件,如果是则进入步骤(2),如果只包含扩展元数据的检索条件,则进入步骤(3),如果同时包含公共元数据和扩展元数据的检索条件,则进入步骤(4)(2)组成公共属性上的检索条件,进入步骤(5);(3)组成扩展属性表上的检索条件,找到属性值与用户输入检索条件匹配的扩展元数据,并读取该扩展元数据的ID,进入步骤(5);(4)组成公共属性表和扩展属性表上的组合条件,进入步骤(5);(5)根据组成的条件,在公共属性表和扩展属性表上进行JOIN查询,输出满足条件的内容的完整元数据。
在基于公共元数据的跨类型检索时,由于检索条件只在公共元数据上,各个类型的扩展元数据并不一致,检索和第一次输出元数据时只局限于公共属性表。在后续的操作中,根据内容的ID,到相应的扩展属性表获取扩展元数据,将获取的扩展元数据和已有的公共元数据合并为完整的元数据。
如果用户需要得到完整的内容,系统根据元数据与对象数据的映射关系得到与元数据对应的对象数据,并将元数据与对象数据合成为完整的内容。
权利要求
1.一种建立内容管理系统的方法,其特征在于将内容的元数据划分为公共元数据和扩展元数据,针对公共元数据和扩展元数据进行数据建模,建立用于存储内容的元数据的数据库;采用递归方式存储对象数据,建立用于存储用户对象数据的存储空间;所述公共元数据为所有类型对象数据都具有的元数据,所述扩展元数据为对象数据特有的元数据。
2.根据权利要求1所述的建立内容管理系统的方法,其中,用于存储内容的元数据的数据库是从关系数据库、面向对象数据库、对象-关系数据库和XML数据库中选择的。
3.根据权利要求1所述的建立内容管理系统的方法,用于存储内容的元数据的数据库包括关系数据库,所述关系数据库以一个或多个关系数据库表管理内容,所述方法包括为内容的公共元数据建立统一的公共属性表;为不同类型内容的扩展元数据建立各自的扩展属性表将内容的公共元数据的每一个属性映射为公共属性表的一列;将同一类型的内容的扩展元数据的每一个属性映射为该类型的扩展属性表的一列;将每一项内容的公共元数据映射为公共属性表的一行,所述内容的公共元数据的属性值映射到公共属性表的相应列;将每一项内容的扩展元数据映射为本类型的扩展属性表的一行;所述内容的扩展元数据的属性值映射到扩展属性表的相应列;将与所述内容具有关联关系的其他内容的ID,关联到所述内容的关联关系表中的相应行,并标识出关联关系;将与所述内容具有复合关联关系的其他内容的ID,关联到所述内容的复合关系表中的相应行。
4.根据权利要求1、2或3所述的建立内容管理系统的方法,其特征在于,同一对象数据的公共元数据和扩展元数据具有相同的ID。
5.根据权利要求1所述的建立内容管理系统的方法,其特征在于,所述存储区域采用递归结构存储对象数据。
全文摘要
本发明公开了一种建立内容管理系统的方法。针对现有内容管理系统无法跨类型检索、无法体现内容之间的关联和包含关系以及数据的内在组织,本发明提出将内容的元数据划分为公共元数据和扩展元数据,针对公共元数据和扩展元数据进行数据建模,建立用于存储内容的元数据的数据库;采用递归方式存储对象数据,建立用于存储用户对象数据的存储空间。所述公共元数据为所有类型对象数据都具有的元数据,所述扩展元数据为对象数据特有的元数据。本发明提出的方法能够实现跨类型检索,提高内容复合效率,体现了内容之间的关联关系和对象数据的内在组织。
文档编号G06F17/30GK1996281SQ200510132590
公开日2007年7月11日 申请日期2005年12月26日 优先权日2005年12月26日
发明者王绪胜, 陈晓鸥, 杨汉强, 王仲, 吴於茜 申请人:北大方正集团有限公司, 北京北大方正技术研究院有限公司, 北京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1