用于对电子文档进行在线编辑的方法和系统的制作方法

文档序号:6586299阅读:233来源:国知局
专利名称:用于对电子文档进行在线编辑的方法和系统的制作方法
技术领域
本发明涉及电子文档处理领域。特别地,本发明涉及一种用于在线编辑电子文档 的方法和系统。
背景技术
电子文档传统的是由各种电子文档编辑软件创建并进行编 辑的。电子文档编辑软件例如可以是Microsoft Office 、 OpenOffice 、Lotus Symphony 、Lotus Notes 等,支持丰富的格式。利
用这些编辑软件能够创建、保存电子文档,并能对电子文档的内容进行增加、删除、修改等 编辑操作。这些编辑操作通常称为电子文档的本地编辑。随着互联网的发展,电子文档可以由各种浏览器进行编辑。例如可以是 Internet Explorer 、Mozilla Firefox 、Apple Safari 等。当利用浏览
器对由现有的电子文档编辑软件产生的电子文档进行编辑操作时,现有的方法是首先利用 格式转换器对电子文档进行文档格式转换,即将电子文档编辑软件产生的电子文档由其对 应的文件格式,例如d0C、0df等格式转换成浏览器可以识别的文件格式,例如html、xhtml、 xml等格式。在进行上述转换之后,由用户利用浏览器创建、保存电子文档,并且直接在浏览 器上对文档进行增加、删除、修改等编辑操作。由于利用浏览器对电子文档进行的编辑操作 通常用于互联网中的web方式对电子文档进行的编辑操作,因而通常称为电子文档的在线 编辑。当用户利用浏览器对电子文档进行编辑之后,现有的方法利用格式转换器再次对 电子文档进行文档格式转换,即将经过浏览器编辑的电子文档由浏览器可以识别的文件格 式,例如html、xhtml、xml等格式转换成电子文档编辑软件对应的文件格式,例如doc、odf 等格式。然而,上述现有的方法在对电子文档进行在线编辑的过程中不可避免的会引起其 格式信息的丢失。这是因为,电子文档编辑软件对应的文件格式有自己定义的格式集合,这 些格式集合往往包含丰富的格式信息,浏览器能够识别的文件格式也有自己的格式集合, 两种格式集合之间通常是不统一的。由于电子文档编辑软件对应的文件格式中有些格式不 包括在浏览器能够识别的文件格式的格式集合之中,在利用格式转换器将电子文档编辑软 件产生的电子文档由电子文档编辑软件对应的文件格式转换成浏览器可以识别的文件格 式时,那些浏览器不能识别的格式信息将会被丢弃。当用户对电子文档进行编辑之后将电 子文档从浏览器可以识别的文件格式转换回电子文档编辑软件对应的文件格式时,这些丢 失的格式信息是不会被恢复的
发明内容
由于经过在线编辑的电子文档会造成格式信息的丢失,因此,需要一种方法和系 统能够有效解决上述问题。
根据本发明的一个方面,提供了一种用于对电子文档进行在线编辑的方法,包括 将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转 换后的电子文档,其中保留电子文档中第二应用程序不能识别的第一应用程序文件格式的 格式信息;将转换后的电子文档发送给第二应用程序;接收经过第二应用程序编辑的电子 文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;基于上述对比 确定电子文档的改变;以及基于电子文档的改变生成第一应用程序能够识别的动作序列。根据本发明的另一方面,电子文档由第一应用程序文件格式转换成第二应用程序 能够识别的文件格式还包括保留电子文档中第二应用程序不能识别的第一应用程序文件 格式的格式信息。进一步地,将生成的动作序列、电子文档中第二应用程序不能识别的第一 应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储;或者将生 成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格式信息以 及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将电子文档的改 变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变更新至原 电子文档。根据本发明的再一方面,提供了一种用于对电子文档进行在线编辑的系统,包括 格式转换器,被配置为将电子文档由第一应用程序文件格式转换成第二应用程序能够识别 的文件格式以形成转换后的电子文档,其中保留电子文档中第二应用程序不能识别的第一 应用程序文件格式的格式信息,并将转换后的电子文档发送给第二应用程序;文档改变比 较器,配置成接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文 档与转换后的电子文档进行对比;并且基于上述对比确定电子文档的改变;以及动作序列 生成器,配置成基于电子文档的改变生成第一应用程序能够识别的动作序列。根据本发明的又一方面,电子文档由第一应用程序文件格式转换成第二应用程序 能够识别的文件格式包括 保留电子文档中第二应用程序不能识别的第一应用程序文件格 式的格式信息。进一步地,动作生成器将生成的动作序列、电子文档中第二应用程序不能识 别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储; 或者将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格 式信息以及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将电子 文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的改变 更新至原电子文档。通过本发明的方法和系统,经过在线编辑的电子文档的格式信息能够得到保留并 得以更新,从而解决了现有方法中格式信息会丢失的问题。


本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所 有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的 详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本 发明的优选实施例和解释本发明的原理和优点。在附图中图1显示了根据本发明一个实施例的用于对电子文档进行在线编辑的方法100 ;图2a-图2c示意性地显示了电子文档编辑软件和浏览器中电子文档的显示结果;图3a和图3b示意性地显示了转换后的电子文档与经过在线编辑的电子文档的DOM 树;图4显示了根据本发明另一个实施例的用于对电子文档进行在线编辑的系统 400。
具体实施例方式在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见, 在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施 例的过程中必须做出很多特定于该实际实施方式的决定,以便实现开发人员的具体目标, 例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的 不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益 于本发明公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中 仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明 关系不大的其他细节。本发明的主要思想是利用操作动作作为两种文档格式沟通的桥梁,只要操作动作 相同,那么格式也就不会丢失。本发明的方法保留格式转换过程中浏览器不能识别的格式 信息,利用电子文档编辑软件支持的操作动作记录在线编辑对电子文档的改变,然后由电 子文档编辑软件执行这些操作动作。这样,经过在线编辑的电子文档的格式信息就不会丢 失。现在参看图1,其中显示了根据本发明一个实施例的用于对电子文档进行在线编 辑的方法100。图1的方法100从步骤102开始。接着,方法进入步骤104,其中,将电子 文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形成转换后的 电子文档;接着,方法进入步骤106,其中将转换后的电子文档发送给第二应用程序;接着, 方法进入步骤108,其中,接收经过第二应用程序编辑的电子文档;接下来,方法进入步骤 110,其中,将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;之后,在步 骤112,基于上述对比确定电子文档的改变;然后,在步骤114,基于电子文档的改变生成第 一应用程序能够识别的动作序列。之后,方法进入步骤116结束。进一步地,根据本发明的方法,电子文档由第一应用程序文件格式转换成第二应 用程序能够识别的文件格式包括保留电子文档中第二应用程序不能识别的第一应用程序 文件格式的格式信息。进一步地,根据本发明的方法,将生成的动作序列、电子文档中第二应用程序不能 识别的第一应用程序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存 储,或者将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式 的格式信息以及转换后的电子文档一并存储。进一步地,第一应用程序执行动作序列来将 电子文档的改变更新至原电子文档,其中第一应用程序利用保留的格式信息将电子文档的 改变更新至原电子文档。由于本发明采取了用电子文档编辑软件能够识别的动作序列来记录浏览器对电子文档的改变,因此,通过电子文档编辑软件执行这些动作序列使得浏览器对电子文档的 改变能够更新至电子文档编辑软件对应文件格式的电子文档,同时,由于原电子文档中浏 览器不能识别的电子文档编辑软件对应文件格式的格式信息被保留,通过执行动作序列, 在浏览器对电子文档的改变能够更新至电子文档编辑软件对应文件格式的电子文档的同 时原电子文档中浏览器不能识别的电子文档编辑软件对应文件格式的格式信息也被更新。 这样,经过在线编辑的电子文档中浏览器不能识别的电子文档编辑软件对应文件格式的格 式信息不会丢失,而且能够得以更新。下面以Microsoft Word 作为电子文档编辑软件,以浏览器作为浏览器并 以html文件格式作为浏览器能够识别的文件格式为例对本发明进行进一步描述。应该理 解,浏览器、html文件格式只是为了说明的目的,不能认为是对本发明要求的保护范围的限 制。对于其他的电子文档编辑软件、其他的浏览器以及其他浏览器能够识别的文件格式,由 于本领域普通技术人员能够在本发明公开的基础上通过其掌握的知识得到,因而同样落在 本发明的保护范围之内。

假设用户I用Microsoft Word 创建了一篇电子文档Α。用户Ii没有电子 文档编辑软件,他希望用浏览器对电子文档A进行在线编辑。这时,用户II用浏览器打开 电子文档A。根据现有的方法,在用户II的后台执行下述操作由格式转换器对电子文档A 进行格式转换,即由doc格式转换为例如html格式,从而使电子文档A能够被用户II的 浏览器识别并能够进行在线编辑。电子文档A可以被划分为两个部分Part I,该电子文档 部分中的格式信息能够被doc格式和html格式识别,能够在两种文档格式之间自由转换; Part II,该电子文档部分中的格式信息只能被doc格式识别而不能被html格式识别。正 如前面描述的,现有的方法中,格式转换器在将电子文档A由doc格式转换成html格式时, doc格式中不能由浏览器识别的格式信息将会丢失,即Part II中的格式信息将会丢失,这 些信息例如是文字闪烁、表格阴影等。根据现有的方法,Part II中不能由浏览器识别的格 式信息将被丢弃。现在以上述例子描述本发明。根据现有的方法,当用户II用浏览器打开电子文档 A时,格式转换器将电子文档A由doc格式转换成html格式,这时,仅将电子文档A的Part I进行转换,得到的转换后的电子文档我们将其记录为电子文档B。很显然,电子文档B仅 包括Part I。根据本发明,在将电子文档A由doc格式转换成html格式时电子文档A中 html格式不能识别的doc格式的格式信息被保留,即Part II中的格式信息。之后,用户 II用浏览器对电子文档B进行在线编辑,这种编辑可能包括对电子文档B内容以及对电子 文档B中格式信息的增加、删除或改变等操作。这里将经过在线编辑的电子文档B记录为 电子文档Bi。我们将用户II对电子文档B的改变记录为Part III,很显然,电子文档Bl 可以表示为 Bl = Part I+PartIII。如果按照现有的方法,电子文档A在经过在线编辑之后得到的是电子文档Bi,即 Part I+Part III。然后,再通过格式转换器将电子文档Bl转换为doc格式时,原电子文档 A中不能被html格式识别的格式信息都会丢失。根据本发明的一个实施例,接收经过浏览器编辑的电子文档,即电子文档Bi,将经 过浏览器编辑的电子文档Bl与转换后的电子文档B进行对比,即,通过对比确定电子文档 的改变,即Part III。根据本发明的一个实施例,通过将电子文档Bl的DOM树Dl与电子文档B的DOM树D对比来确定电子文档的改变。按照DOM树的顺序,从根节点开始,将每个节 点的所有内容和属性进行对比确定Dl和D2的不同之处,确定的不同之处就是电子文档的 改变,即Part III。确定的不同之处可以是节点的增加、删除或节点属性的改变;也可是节 点内容的增加、删除或改变。然后,根据本发明的方法基于电子文档的改变,即Part III生成电子文档编辑软 件(这里是Microsoft Word )能够识别的动作序列。上述处理的原因在于Part III是用户II在浏览器上通过一系列操作在产生的, 如果在电子文档编辑软件(这里是Microsoft Word )上进行相同的操作,那么就会 产生一个完全相同的Part III。也就是说,把Part III转换为电子文档编辑软件可以识别 的一系列动作(即动作序列),然后由电子文档编辑软件去执行该动作序列就会在电子文 档编辑软件上生成Part III。上述动作序列就是宏(Macro),在Microsoft Word 中是用VBA(Visual Basic forApplications)实现的。将上述电子文档的改变转换为宏 语句并发送给电子文档编辑软件,由电子文档编辑软件执行这些宏语句,从而将电子文档 的改变更新至电子文档编辑软件对应文件格式的电子文档A。如前所述,由于Part II中 的格式信息被保留,这样经过上述处理后的电子文档A将包括Part I、Part II以及Part III。即,原电子文档A中的格式信息不会丢失。下面举例来说明动作序列(宏)的生成。假设我们有一个电子文档编辑软件对应文件格式的电子文档,该电子文档有一个 一行一列的表格,表格中有“一个单元”这几个字符,其中“一个单元”这几个字符具有字符 闪烁效果。该电子文档是使用某种文档格式来存储的,例如doc格式或Odf格式。该电子 文档显示如图2a所示(文字闪烁效果用括号中的内容表示)。

当用户II需要用浏览器对该电子文档进行在线编辑时,首先由格式转换器将其 转换为html格式如下
<div class=sld style-position:absolute;top:0px;left:0px; width:554px;height:415px;font-size:16px;background-color:white;clip:rect( 0%, 101%, 101%, 0%); visibility:hidden' id="tbll"> <div v:shape="_x0000—s5125" id="coll"> <div class=Tbl style-mso-margin-left-alt:0;position:absolute;top:21.2%; left: 17.68%;width: 12.45%;height:4.33%', id="celll"〉<span Iang=EN-US style-font-size:71%;
mso-fareast-language:ZH-CN'>一个单元 </s.pan>
权利要求
1.一种用于对电子文档进行在线编辑的方法,包括将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形 成转换后的电子文档;将转换后的电子文档发送给第二应用程序; 接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;基于上述对比确定电子文档的改变;以及基于电子文档的改变生成第一应用程序能够识别的动作序列。
2.根据权利要求1的方法,其中将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形 成转换后的电子文档还包括保留电子文档中第二应用程序不能识别的第一应用程序文件 格式的格式信息。
3.根据权利要求2的方法,还包括将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格 式信息以及转换后的电子文档一并存储。
4.根据权利要求2的方法,还包括将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程序文件格式的格 式信息以及经过第二应用程序编辑的电子文档一并存储。
5.根据权利要求2、3或4的方法,还包括第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程 序利用保留的格式信息将电子文档的改变更新至原电子文档。
6.根据权利要求2、3或4的方法,其中 第一应用程序能够识别的动作序列是宏。
7.根据权利要求2、3或4的方法,其中第二应用程序是浏览器,第二应用程序能够识别的文件格式是标注语言格式。
8.根据权利要求7的方法,其中将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比是通过对比DOM 树的结构进行的。
9.根据权利要求8的方法,其中根据DOM树结构的改变生成第一应用程序能够识别的动作序列。
10.一种用于对电子文档进行在线编辑的系统,包括格式转换器,被配置为将电子文档由第一应用程序文件格式转换成第二应用程序能够 识别的文件格式以形成转换后的电子文档,并将转换后的电子文档发送给第二应用程序;文档改变比较器,配置成接收经过第二应用程序编辑的电子文档;将经过第二应用程 序编辑的电子文档与转换后的电子文档进行对比;并且基于上述对比确定电子文档的改 变;以及动作序列生成器,配置成基于电子文档的改变生成第一应用程序能够识别的动作序列。
11.根据权利要求10的系统,其中将电子文档由第一应用程序文件格式转换成第二应用程序能够识别的文件格式以形 成转换后的电子文档包括保留电子文档中第二应用程序不能识别的第一应用程序文件格 式的格式信息。
12.根据权利要求11的系统,其中动作序列生成器将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程 序文件格式的格式信息以及转换后的电子文档一并存储。
13.根据权利要求11的系统,其中动作序列生成器将生成的动作序列、电子文档中第二应用程序不能识别的第一应用程 序文件格式的格式信息以及经过第二应用程序编辑的电子文档一并存储。
14.根据权利要求11、12或13的系统,其中第一应用程序执行动作序列来将电子文档的改变更新至原电子文档,其中第一应用程 序利用保留的格式信息将电子文档的改变更新至原电子文档。
15.根据权利要求11、12或13的系统,其中第一应用程序能够识别的动作序列是宏。
16.根据权利要求11、12或13的系统,其中第二应用程序是浏览器,第二应用程序能够识别的文件格式是标注语言格式。
17.根据权利要求16的系统,其中文档改变比较器将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比 是通过对比DOM树的结构进行的。
18.根据权利要求17的系统,其中动作序列生成器根据DOM树结构的改变生成第一应用程序能够识别的动作序列。
全文摘要
本发明公开了一种用于对电子文档进行在线编辑的方法,包括将电子文档由第一应用程序格式转换成第二应用程序能够识别的文件格式以形成转换后的电子文档;将转换后的电子文档发送给第二应用程序;接收经过第二应用程序编辑的电子文档;将经过第二应用程序编辑的电子文档与转换后的电子文档进行对比;基于上述对比确定电子文档的改变;以及基于电子文档的改变生成第一应用程序能够识别的动作序列。通过利用动作来记录电子文档的改变,经过在线编辑的包含丰富格式信息的电子文档的格式信息能够得到保留并得以更新,从而解决了现有方法中格式信息会丢失的问题。
文档编号G06F17/24GK102096661SQ200910258339
公开日2011年6月15日 申请日期2009年12月10日 优先权日2009年12月10日
发明者左志波, 王欣孃 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1