一种超媒体元数据合成与转换系统的制作方法

文档序号:13575075阅读:285来源:国知局
一种超媒体元数据合成与转换系统的制作方法

本发明涉及信息技术领域,尤其涉及媒体内容处理技术领域。



背景技术:

全媒体指媒介信息传播采用文字、声音、影像、动画、网页等多种媒体表现手段,利用不同媒介形态,通过融合的广电网络、电信网络以及互联网络进行传播,最终实现用户以电视、电脑、手机等多种终端均可完成信息的融合接收。传统的富媒体包括流媒体、声音、flash、以及java、javascript、dhtml等程序设计语言的形式之一或者几种的组合,以富媒体进行制作发布的内容,我们称之为富媒体出版物。

富媒体出版物的制作设计是通过编程语言和软件工具进行代码编译后得到,而富媒体出版物的发布和传播则需要依靠另外的软件工具来实现。现有技术中,在富媒体出版物设计制作阶段,通常要对不同格式的元数据进行处理,得到统一格式的数据进行编辑,然后再转换成其他格式输出,因此对于元数据的转换十分重要。现有技术中,对于待制作的电子书,对其元数据的格式有限定,比如通常只能转换常用的电子书格式,word、txt、pdf、excel等,但目前传播播放工具林立,富媒体出版物在设计开发后,很有可能会存在不兼容终端软件,不能播放等问题,并且很容易被反编译,被不法分子窃取内容版权。

因此,现有技术中的技术缺陷是对于电子书(出版物)的输入输出格式,不能实现各个版本的兼容,在通过任意传播播放工具进行播放阅览时,因为版本不兼容的问题导致用户无法正常阅览。



技术实现要素:

本发明要解决的技术问题是提供一种超媒体元数据合成与转换系统,采用基于文档树的文档转换方式实现文档格式的转换,完成了元数据的合成与转换;输出的文档格式可以兼容任意传播播放工具。

为解决上述技术问题,本发明提供的技术方案是:

本发明提供一种超媒体元数据合成与转换系统,包括:

元数据获取模块,用于获取待编辑文档元数据,将所述元数据进行结构化处理,得到结构化元数据,并获取目标文档的结构化数据;

数据解析模块,用于解析所述结构化元数据,得到元数据解析结果,解析所述目标文档的结构化数据,得到目标数据解析结果;

文档树构造模块,用于根据所述元数据解析结果,构造元数据文档树,根据所述目标文档解析结果,构造目标文档树;

规则设定模块,用于根据所述元数据文档树和所述目标文档树,设定映射规则,所述映射规则表示所述待编辑文档和所述目标文档间的对应关系;

元数据合成转换模块,用于遍历所述元数据文档树,根据所述映射规则,将所述待编辑文档格式转换成所述目标文档的格式,实现所述元数据的合成与转换,得到输出文档。

本发明的技术方案为先通过元数据获取模块,获取待编辑文档元数据,将所述元数据进行结构化处理,得到结构化元数据,并获取目标文档的结构化数据;再通过数据解析模块,解析所述结构化元数据,得到元数据解析结果,同时解析所述目标文档的结构化数据,得到目标数据解析结果;再通过文档树构造模块,根据所述元数据解析结果,构造元数据文档树,根据所述目标文档解析结果,构造目标文档树;再通过规则设定模块,根据所述元数据文档树和所述目标文档树,设定映射规则,所述映射规则表示所述待编辑文档和所述目标文档间的对应关系;最后通过元数据合成转换模块,遍历所述元数据文档树,根据所述映射规则,将所述待编辑文档格式转换成所述目标文档的格式,实现所述元数据的合成与转换。同样将目标文档与待编辑文档互换,用同样的方式实现文档格式的转换。

本发明超媒体元数据合成与转换系统采用了基于文档树的文档转换方式实现文档格式的转换,完成了元数据的合成与转换;输出的文档格式可以兼容任意传播播放工具。通过该系统,输入各种格式的文档,系统会将各种格式的文档根据映射规则转换成系统可编辑的文档格式,如xml格式,同时,在系统完成对待编辑文档的编辑时,要将编辑完的文档输出,输出格式要兼容不同版本的文档阅览器,因此还要实现将编辑完的文档格式转换为输出的文档格式,即整个系统要实现待编辑文档格式和目标文档格式的互相转换,解决文档格式版本兼容的问题。

进一步地,所述待编辑文档的格式包括word、txt、pdf、excel,indesign、scorm、cebx、epub、html、xml、gif、swf小样文档和方正排版文档中至少一种。对于待编辑文档的格式,没有过多限定,用户不需要根据系统要求预先将待编辑文档格式进行转换,用户可直接将自己的待编辑文档导入该系统,系统会自动将待编辑文档的格式进行转换,另外,本系统支持xslt、]css3样式、js脚本以及markdown语法,支持scorm、cebx、epub、小样文件、gif、swf等常见出版文件导入并在系统内进行显现、排版和输出,也支持保留以上文件格式中的字符属性、段落样式、图片属性、动画属性、特效属性的展示。对于待编辑文档中包含的图片,视频、音频和公式等对象格式同样可以进行转换。当然,待编辑文档格式不只包括以上的文件格式。

进一步地,所述待编辑文档元数据包括文字、图片、视频、音频、字符、公式和链接中的至少一种。目前一个文档中可以包含多种类型的数据,不只包含文字和图片,还可以包含视频、音频、字符、公式和链接,使文档的内容更丰富。

进一步地,所述结构化元数据通过sdk解析。元数据结构包括数据结构和逻辑结构,通过sdk解析,sdk是指由第三方服务商提供的实现软件产品某项功能的工具包。一般以集合kpi和文档、范例、工具的形式出现;sdk软件工具包运用起来方便,利用这个工具包可以快速对元数据进行解析。

进一步地,所述目标文档为xml文档。由于xml元语言特性及结构化的特点,使其成为了互联网异构环境中不同类型和不同领域数据交换的开放标准。xml文档通过定义标记描述文档的结构与意义,处理数据具有结构化的特点,容易阅读和编写,同时具有强大的可延展性和自我描述性,为实现web文件在网路间的数据交换、处理、存储和信息搜索提供了最方便的载体。因此成为交换语言的首选,本发明中的目标文档可定义为xml语言文档。

进一步地,所述待编辑文档为xml文档,所述xml文档通过xml解析器解析。本发明的超媒体元数据合成与转换系统,可以将其他格式的文档转换为xml文档,也可以将xml文档转换成其他格式输出,实现文档间不同格式的转换。

进一步地,所述输出文档的格式包括zip、epub、xml和html5中至少一种。为了适应文档的web发布和移动终端等不同阅读设备的需要,可以将文档以不同的格式输出。当将目标文档定义为待编辑文档,待编辑文档定义为目标文档时,是将目标文档转换成待编辑文档的格式输出。在以epub格式输出时,还可以增加水印处理,使文档保密性更好。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。

图1示出了本发明第一实施例所提供的一种超媒体元数据合成与转换系统的结构框图;

图2示出了本发明第一实施例所提供的一种超媒体元数据合成与转换系统中文档树的组成示意图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。

实施例一

图1示出了本发明第一实施例所提供的超媒体元数据合成与转换系统10的结构框图。如图1所示,根据本发明第一实施例的超媒体元数据合成与转换系统10包括:

元数据获取模块101,用于获取待编辑文档元数据,将元数据进行结构化处理,得到结构化元数据,并获取目标文档的结构化数据;

数据解析模块102,用于解析结构化元数据,得到元数据解析结果,解析目标文档的结构化数据,得到目标数据解析结果;

文档树构造模块103,用于根据元数据解析结果,构造元数据文档树,根据目标文档解析结果,构造目标文档树;

规则设定模块104,用于根据元数据文档树和目标文档树,设定映射规则,映射规则表示待编辑文档和目标文档间的对应关系;

元数据合成与转换模块105,用于遍历元数据文档树,根据映射规则,将待编辑文档格式转换成目标文档的格式,实现元数据的合成与转换,得到输出文档。

本发明的技术方案为先通过元数据获取模块101,获取待编辑文档元数据,将元数据进行结构化处理,得到结构化元数据,并获取目标文档的结构化数据;再通过数据解析模块102,解析结构化元数据,得到元数据解析结果,同时解析目标文档的结构化数据,得到目标数据解析结果;再通过文档树构造模块103,根据元数据解析结果,构造元数据文档树,根据目标文档解析结果,构造目标文档树;再通过规则设定模块104,根据元数据文档树和目标文档树,设定映射规则,映射规则表示待编辑文档和目标文档间的对应关系;最后通过元数据合成与转换模块105,遍历元数据文档树,根据映射规则,将待编辑文档格式转换成目标文档的格式,实现元数据的合成与转换。

本发明超媒体元数据合成与转换系统10采用了基于文档树的文档转换方式实现文档格式的转换,完成了元数据的合成与转换;输出的文档格式可以兼容任意传播播放工具。通过该系统,输入各种格式的文档,系统会将各种格式的文档根据映射规则转换成系统可编辑的文档格式,如xml格式,同时,在系统完成对待编辑文档的编辑时,要将编辑完的文档输出,输出格式要兼容不同版本的文档阅览器,因此还要实现将编辑完的文档格式转换为输出的文档格式,即整个系统要实现待编辑文档格式和目标文档格式的互相转换,解决文档格式版本兼容的问题。

本发明超媒体元数据合成与转换系统10将待编辑文档转换成xml文档进行编辑,因为xml文档在处理数据时具有结构化、容易阅读和编写的特点,因此本实施例将目标文档定义为xml文档进行具体格式转化的描述。

在实现文档之间的转换时,必须要定义文档结构化规则,才能将非结构化的文档转换为有层次结构的文档,结构化是指待编辑文档中标题与标题之间根据规则定义形成一定的逻辑层次,用户在编辑待编辑文档时需要设置各级标题,根据各级标题的层次关系构造文档树。根据结构化的规则定义,每段正文必须对应一个标题,这个标题可以是用户定义的内容,也可以将正文或整篇文档划分为单元段,每段由系统动态设置标签表示文档结构。

在文档正文中有各种纯文本、图片、表格和公式等对象内容需要分析转换,对于各种类型的专业公式,需要先解析公式中的数据,然后采用专业xml术语表示,如数学公式采用mathml(mathematicalmarkuplanguage)语言在xml文档中完整地描述公式中的各种信息。

文档树是一棵描述文档文本逻辑结构的树,图2示出了本发明第一实施例所提供的超媒体元数据合成与转换系统中文档树的组成示意图。如图2所示,文档树的组成如下:

1)文档树的每一个节点与文本文件层次结构中处于同等位置的节点对应;

2)每个节点包含信息有属性、子标题列表和其他信息;

3)属性包含了数据的所有属性,每个属性包含了属性名、属性值等;

4)子标题列表包含该节点的所有子节点;

5)其他信息包括父节点信息、节点的数据内容等。

通过文档树可以描述待编辑文档的所有信息,根据文档树,可以将非结构化的数据转换为结构化的数据,这种结构化的数据形式与xml数据形成了一一对应的关系,为与xml文档转换的实现提供了基础。基于文档树建立待编辑文档和xml文档之间的映射规则,具体为:

1)元数据文档树与目标文档树的结构一致;

2)文档树的根节点对应于待编辑文档的题目/xml文档元素;

3)文档树的其他节点对应于待编辑文档的某级标题/xml文档元素;

4)元数据文档树与目标文档树的每个节点的属性榆树据内容一一对应。

基于文档树的转换在建立文档树的基础上,根据映射关系制定一系列的执行指令创建目标文档的文档树,从而得到相应的转换后的目标文件;xml文档转换过程可以实现xml文档与待编辑文档之间的互相转换,用户在本地创建需要转换的待编辑文档/xml文档,然后通过转换器执行元数据文档树和目标文档文档树的创建和映射,最后得到需要的xml文档/输出文档。

具体地,待编辑文档的格式包括word、txt、pdf、excel,indesign、scorm、cebx、epub、html、xml、gif、swf小样文档和方正排版文档中至少一种。对于待编辑文档的格式,没有过多限定,用户不需要根据系统要求预先将待编辑文档格式进行转换,用户可直接将自己的待编辑文档导入该系统,系统会自动将待编辑文档的格式进行转换,另外,本系统支持xslt、]css3样式、js脚本以及markdown语法,支持scorm、cebx、epub、小样文件、gif、swf等常见出版文件导入并在系统内进行显现、排版和输出,也支持保留以上文件格式中的字符属性、段落样式、图片属性、动画属性、特效属性的展示。对于待编辑文档中包含的图片,视频、音频和公式等对象格式同样可以进行转换。当然,待编辑文档格式不只包括以上的文件格式。

具体地,待编辑文档数据包括文字、图片、视频、音频、字符、公式和链接中的至少一种。目前一个文档中可以包含多种类型的数据,不只包含文字和图片,还可以包含视频、音频、字符、公式和链接,使文档的内容更丰富。

具体地,结构化元数据通过sdk解析。元数据结构包括数据结构和逻辑结构,通过sdk解析,sdk是指由第三方服务商提供的实现软件产品某项功能的工具包。一般以集合kpi和文档、范例、工具的形式出现;sdk软件工具包运用起来方便,利用这个工具包可以快速对元数据进行解析。

具体地,目标文档为xml文档。由于xml元语言特性及结构化的特点,使其成为了互联网异构环境中不同类型和不同领域数据交换的开放标准。xml文档通过定义标记描述文档的结构与意义,处理数据具有结构化的特点,容易阅读和编写,同时具有强大的可延展性和自我描述性,为实现web文件在网路间的数据交换、处理、存储和信息搜索提供了最方便的载体。因此成为交换语言的首选,本发明中的目标文档可定义为xml语言文档。

实施例二

本发明超媒体元数据合成与转换系统可以将其他格式的文档转换为xml文档输出,也可以通过xml文档,将其他格式的文档转换成文档出版需要的格式,如zip、epub、xml和html5,因此,本系统可以实现文档格式的互相转换,将待编辑文档定义为xml文档,xml文档经过xml解析器解析,与目标文档经解析得到的文档树,通过映射规则,将xml文档转换成目标文档的格式,这时目标文档的输出格式包括zip、epub、xml和html5中至少一种。

待编辑文档为xml文档,所述xml文档通过xml解析器解析。本发明的超媒体元数据合成与转换系统,可以将其他格式的文档转换为xml文档,也可以将xml文档转换成其他格式输出,实现文档间不同格式的转换。

本发明超媒体元数据合成与转换系统可以实现文档格式间的互相转换,通过文档树和映射规则实现,得到的文档格式可以兼容各种文档阅览器。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1