基于智能文档平台的多渠道信息采集交换方法

文档序号:6597480阅读:604来源:国知局
专利名称:基于智能文档平台的多渠道信息采集交换方法
技术领域
本发明涉及一种信息采集交换方法,更具体地说,涉及一种基于智能文档平台的 多渠道信息采集交换方法,属于智能文档技术领域。
背景技术
目前,人们最常用的Word/Excel格式文档都属于非结构化文档,它们与结构化的 数据库是完全分开的。随着国内外电子政务建设的不断发展,普遍需要将原本分散于各环 节、不同职能部门之间异构的文档信息和内容进行有效集成。这就要求应用软件系统在处 理各种信息时,必须能够应对大量结构化和非结构化数据混杂的局面。为了解决上述的问题,人们提出了“智能文档(Smart Document) ”的技术理念。所 谓智能文档是将非结构化的文档和结构化的数据结合起来,形成一种统一的应用形式。从 技术角度来看,智能文档是一种基于XML(可扩展标记语言)的电子文档。它除了具备纸张 所有的特性外,还包含有高度结构化的XML信息、程序以及可执行的动作。这种文档在其内 容组织、表现和交互上变得更具柔性,基本上将传统的电子文档与信息系统融合了起来,既 可以处理文档内容也可以处理数据内容,完全可以替代纸质文件,做到完全意义上的“无纸 化办公”。近年来,随着互联网等技术的飞速发展,使得信息量爆炸式增长,传统纸质文档已 经无法满足信息存储的需求。另一方面,电子政务中信息采集渠道日益多样化,采集范围在 各种不确定的环境中的延伸,催生了越来越复杂的信息采集平台。大量数据的存储,数据信 息的快速分析、处理和交换成为各种信息采集平台需要首先解决的问题。然而,一般的信息 采集平台只能以某种单一的渠道获取信息,而信息的格式也通常由生产厂商自己定义,很 难与其他应用软件系统实现信息交换和共享。例如很多软件厂商采用XML格式作为智能文 档的存储格式,但仅仅在自己的系统内使用,没有提供一种使智能文档在不同应用环境中 采集信息的技术方案。在专利号为US 7609650的美国专利中,公开了一种利用数据采集文件进行的无 线终端设备数据采集方法,但是该方法需要首先制定一套标准,建立查询,通过查询生成数 据采集文件,再通过网络系统连接无线采集设备。由于终端设备是固定的,设备的选择也要 依赖查询条件,采集到的信息只能传输服务平台处理,无法再传送到其他设备。因此,该方 法无法实现针对各种环境、多渠道的信息采集交换。另外,在杨逸箫、杨明智和李永强发表在《现代计算机》2008年第7期的论文《基 于智能文档的数据交换模型研究》中,利用智能文档技术在文档内容组织、表现和交互方 面的柔性,提出以智能文档作为数据交换的统一封装载体,为解决异构系统问的集成与整 合.实现异构数据的交换与共享提供了新的方法。该论文提出利用智能文档的数据封装和 传输机制,可以根据交换数据的应用逻辑构建数据传输机制。其XML的数据表示方法解决 异构数据库间的数据映射问题,把业务数据的交换简化为XML文档的交换,实现异构系统 之间流畅的数据交换。但是,该论文中提出的智能文档结构,需要将路由信息、流程信息、文档修改记录与文档本身绑定在一起,既限制了多渠道方式采集的可能性,也破坏了数据的 单纯性、完整性。

发明内容
本发明所要解决的技术问题在于提供一种基于智能文档平台的多渠道信息采集 交换方法。利用该方法可以在统一的平台下,以标准的信息存储格式实现多渠道信息采集, 进而实现信息交换。为了实现上述的发明目的,本发明采用下述的技术方案一种基于智能文档平台的多渠道信息采集交换方法,所述智能文档平台包括服务 器和数据库,在所述服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备 上安装有应用程序,其特征在于所述应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,所 述接口为与终端设备无关的API函数的接口。其中,所述智能文档平台采用XML作为数据存储格式。终端设备将采集到的数据以XML格式传送到所述智能文档平台处理,所述智能文 档平台上存储的信息以XML格式传送到终端设备上,并以表单方式在终端设备上显示。所述智能文档包括模板和数据两部分,其中模板部分用来描述采集数据的界面, 数据部分用来存储终端设备所采集的数据。所述服务器中包括数据管理单元、数据校验单元和数据交换单元,其中数据校验 单元作为多种信息采集渠道的公共数据接口,所述数据管理单元和所述数据交换单元分别 与所述数据校验单元进行连接。当需要添加扩展操作功能时,在所述应用服务和所述应用程序的接口指令集中增 加相应的API函数,将所述API函数提供给终端设备进行调用。用户调用智能文档平台的renderForm函数输入参数,智能文档平台通过网络获 取参数后,将智能文档以表单的形式在网络浏览器中展现出来;用户填写完成后,在提交时 调用processForm函数,将数据传送给智能文档平台。所述renderForm函数和所述processForm函数中的各参数均为具体业务应用的 链接地址,与具体设备无关。本发明所提供的多渠道信息采集交换方法根据不同的终端设备和采集环境,为不 同的采集渠道建立起公共的数据处理中心,从而提高了信息处理和转换的能力。本方法可 以广泛地应用于各种信息采集系统。在采集方式日益繁多,数据量日益庞大,信息交换日益 迫切的情况下,使用本方法进行信息采集,可以大大缩短信息采集和交换的时间,加速信息 流转,减少信息采集处理的周期。


下面结合附图和具体实施方式
对本发明作进一步的详细说明。图1是本发明所提供的信息采集交换方法的整体逻辑示意图;图2为在本信息采集交换方法中,智能文档平台与终端设备之间的通信示意图;图3为在本信息采集交换方法中,在线采集流程的流程示意图4为在本信息采集交换方法中,离线采集流程的流程示意图;图5为在本信息采集交换方法中,通过PDA采集信息的流程示意图;图6为在本信息采集交换方法中,通过OCR采集信息的流程示意图;图7为在本信息采集交换方法中,通过二维条码采集信息的流程示意图。
具体实施例方式本发明所提供的信息采集交换方法主要包括两方面的技术内容智能文档平台和 多渠道采集方式。下面分别进行详细的说明。智能文档平台是一个信息处理中心。通过多种信息采集渠道(即终端设备或采集 方式)获得的信息在智能文档平台下进行统一处理,而用以采集和展现信息的智能文档也 通过该智能文档平台分发到不同的终端设备中。该智能文档平台包括相互连接的服务器和数据库。其中,服务器用于启动应用服 务,数据库用于存储智能文档和数据。各种应用服务部署在服务器上,根据其部署在服务器 上的位置,决定服务器接口参数链接。智能文档平台可通过各种采集渠道从服务器的应用 服务中获取智能文档,同时可以通过各种渠道传送参数给应用服务的提交指令,上传数据 到服务器。同时,该智能文档平台还提供了安装在各种终端设备上的应用程序(客户端软 件),并提供相应的接口。依据信息采集环境的不同,各种终端设备只要安装了应用程序,就 能够调用相应的接口与智能文档平台建立通信,将采集到的数据以XML格式传送到智能文 档平台处理。智能文档平台上存储的信息也能够以XML格式调用相应接口连接,传送到终 端设备,并以表单方式在终端设备上显示,同时能够显示智能文档中存储的数据信息,借此 实现信息在不同终端设备之间的流转。如图1所示,智能文档平台的服务器部分包括数据管理、数据校验和数据交换三 个功能单元,其中数据校验单元作为多种信息采集渠道的公共数据接口,与各种终端设备 建立连接。数据管理单元与数据校验单元进行连接,用于实现智能文档平台内部的数据管 理。数据交换单元也与数据校验单元进行连接,用于指导智能文档平台与外部之间的数据 交换。智能文档平台内的数据是以XML格式进行存储的,这些XML格式的智能文档以智能 文档的形式展现。智能文档平台通过与各种终端设备建立连接,从终端设备处获取到提交 的信息,即终端设备依靠智能文档平台提供的应用软件,根据智能文档提供的信息,展现智 能文档。用户通过智能文档界面填写信息,填写完毕后点击提交,将智能文档连同数据发送 到采集智能文档平台。同时,用户可通过设置查询条件,从智能文档平台查找对应的数据记 录,智能文档平台将该记录返回给用户终端,依然以XML格式,通过智能文档界面展现,供 用户查看、修改。本发明中的智能文档包括模板和数据两部分。其中模板部分用来描述用于采集数 据的界面,一般都是与纸质智能文档类似的表单格式。各终端设备能够根据模板部分的描 述生成数据填写界面,展现给用户。数据部分用来存储终端设备所采集的数据。该数据存 储在基于XML格式的智能文档中。智能文档平台对智能文档的解析、展现、存储等操作都通 过相应的应用服务和客户端软件来完成的。智能文档平台采用XML作为数据存储格式,通过智能文档展现数据采集界面、存
5储数据信息,能够与多种信息采集渠道建立通信连接,发送、获取信息;能够进行数据查询、 校验、存储和入库等操作;同时能够进行加密和签名的安全性管理。由于XML是一种通用 的标记语言,提供了识别、交换和处理各种数据的方法,产生的智能文档可用于各种应用程 序,因此不仅为智能文档平台内信息的交换提供了便利,也为未来与其他应用软件系统的 信息交换奠定了基础。数据部分可以在智能文档内部,同智能文档本身一起传输,也可以从 智能文档中分离出来,形成独立的数据文件,用于信息存储、交换。上述的数据查询、校验、存储和入库等操作是指对于已经传输到智能文档平台的 数据,用户可通过设置查询条件进行检索。智能文档平台本身还提供了对数据的逻辑校验 功能,能够检查收集到的数据是否符合填写要求。数据信息能够以数据文件的格式存储,同 时能够调用接口,保存到数据库中。上述加密和签名的安全性管理是指智能文档本身能够设置加密和数字签名的功 能。在智能文档平台或其他终端、应用系统使用时,必须有相应的解密口令或证书,才能破 解数据信息。如此便能够保证在安全级别要求高的应用场合中,所采集数据的安全性,可靠 性和完整性。如图2所示,智能文档平台和终端设备之间调用统一的接口进行通信。在具体实 施过程中,各个终端设备通过统一的接口实现向智能文档的数据上传或者数据下载。智能 文档平台对智能文档进行管理,并将暂时不使用的数据存储到数据库之中。本发明的一个突出特点在于智能文档平台提供了统一的接口。这种接口中并不包 含终端设备的参数信息,因此是与终端设备无关的,能够实现各种终端设备基于智能文档 平台的数据采集。未来出现新的终端设备时,仍能够通过此接口加入到智能文档平台中,因 此实现了很好的扩展性。具体而言,考虑到智能文档平台能够处理智能文档是应用服务和客户端软件起到 的作用。它们处理智能文档的方式,是提供API函数,不同的采集渠道调用应用服务或客户 端软件的API函数,就能够实现对智能文档的处理。因此对于实现同样的功能,可以调用相 同的API函数来实现对智能文档的操作,而与具体的信息采集方式无关。对智能文档能够 执行的操作,由应用服务或客户端软件的接口指令集决定。当需要添加扩展操作功能时,只 需要丰富应用服务和客户端软件的接口指令集,即增加API函数,将该API函数提供给终端 设备进行调用即可完成对智能文档的处理,而各终端设备本身无需进行改动。上述的接口指令集实际就是应用服务和客户端软件提供的API函数的集合,相应 的接口就是API函数的接口。不同的采集渠道对智能文档进行相同操作时,其使用的接口 是相同的,只是参数内容略有差异。下面的API函数以Java为例进行介绍,其他语言调用 方式基本相同。对于下载展现智能文档,其对应的API为renderForm Public java. io. Serializable renderForm(java. lang. String formurl,java. lang. String dataurl, java. lang. String sTargetURL,java. lang. String sServerURL)参数说明参数类型默认值说明formurlString智能文档在应用服务中的链 接地址dataurlString与智能文档对应的数据文件 在应用服务中的链接地址sTargetURLString采集获取的数据信息需要提 交到的应用服务中的链接地 址sServerURLString应用服务本身的链接地址返回值说明
返回值类型默认值说明FormcontentSerializable解析后的智能文档及数据信 息流调用时状态打开智能文档处理智能文档提交数据,其API为processForm Public java. io. Serializable processForm(java. lang. String formsubmiturl,java. lang. String datasubmiturl,java. lang. String sOptions,java. lang. String sServerURL)参数说明
参数类型默认值说明formsubmiturlString智能文档需要提交到的应用 服务中的链接地址datasubmiturlString填写信息组成的数据文件需 要提交到的应用服务中的链 接地址
权利要求
1.一种基于智能文档平台的多渠道信息采集交换方法,所述智能文档平台包括服务器 和数据库,在所述服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备上 安装有应用程序,其特征在于所述应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,所述接 口为与终端设备无关的API函数的接口。
2.如权利要求1所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 所述智能文档平台采用XML作为数据存储格式。
3.如权利要求2所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 终端设备将采集到的数据以XML格式传送到所述智能文档平台处理,所述智能文档平台上存储的信息以XML格式传送到终端设备上,并以表单方式在终端设备上显示。
4.如权利要求1所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 所述智能文档包括模板和数据两部分,其中模板部分用来描述采集数据的界面,数据部分用来存储终端设备所采集的数据。
5.如权利要求1所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 所述服务器中包括数据管理单元、数据校验单元和数据交换单元,其中数据校验单元作为多种信息采集渠道的公共数据接口,所述数据管理单元和所述数据交换单元分别与所 述数据校验单元进行连接。
6.如权利要求1所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 当需要添加扩展操作功能时,在所述应用服务和所述应用程序的接口指令集中增加相应的API函数,将所述API函数提供给终端设备进行调用。
7.如权利要求1所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 用户调用智能文档平台的renderform函数输入参数,智能文档平台通过网络获取参数后,将智能文档以表单的形式在网络浏览器中展现出来;用户填写完成后,在提交时调用 processForm函数,将数据传送给智能文档平台。
8.如权利要求7所述的基于智能文档平台的多渠道信息采集交换方法,其特征在于 所述renderR)rm函数和所述processForm函数中的各参数均为具体业务应用的链接 地址,与具体终端设备无关。
全文摘要
本发明公开了一种基于智能文档平台的多渠道信息采集交换方法。该智能文档平台包括服务器和数据库,在服务器上部署有各种应用服务,在作为信息采集渠道的各种终端设备上安装有应用程序。应用服务与分布在终端设备上的应用程序之间调用统一的接口进行通信,该接口为与终端设备无关的API函数的接口。本发明所提供的多渠道信息采集交换方法根据不同的终端设备和采集环境,为不同的采集渠道建立起公共的数据处理中心,从而提高了信息处理和转换的能力。使用本方法进行信息采集,可以大大缩短信息采集和交换的时间,加速信息流转,减少信息采集处理的周期。
文档编号G06F17/30GK102130843SQ20101003436
公开日2011年7月20日 申请日期2010年1月20日 优先权日2010年1月20日
发明者刘轩山, 汪敏, 王静, 郑峻 申请人:北京开普互联科技有限公司, 广东开普互联信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1