基于识别抓取技术实现企业应用集成管理的系统及方法

文档序号:8412352阅读:134来源:国知局
基于识别抓取技术实现企业应用集成管理的系统及方法
【技术领域】
[0001] 本发明涉及计算机网络技术领域,尤其涉及企业IT应用的集成管理技术,具体是 指一种基于识别抓取技术实现企业应用集成管理的系统及方法。
【背景技术】
[0002] 目前已经有非常多的技术实现企业IT系统之间的集成,比如ESB(Enterprise Service Bus,企业服务总线)、Web (互联网)服务等,它们都支持通过统一、规范的协议和 框架,通过二次开发的方式,将企业IT应用封装成可访问的服务,从而实现企业IT系统之 间的集成。从企业IT集成现状来看,这些技术的实现过程都有较大的局限性,首先需要对 原有系统的技术架构有很深的了解,才能够对原有应用进行包装,其次需要很多的二次开 发工作量,才能够将这些已有能力包装成其他系统可访问的服务。
[0003] 从企业IT应用的发展趋势来看,B/S(Br〇wser/Server,浏览器/服务器模式)应 用已经成为主流,越来越多的企业应用都是基于B/S架构来构建的,而B/S应用的访问是 可以模拟仿真的,因此,需要寻找一种能够基于页面对象人工智能识别抓取技术实现对B/S 应用的模拟仿真的技术方案,通过针对页面操作的录制与回放,将企业IT应用已经具备的 能力服务化,在不进行二次开发的情况下将企业IT应用已经具备的能力开放为服务,供其 他IT应用访问。

【发明内容】

[0004] 本发明的目的是克服了上述现有技术的缺点,提供了一种能够智能识别抓取页面 对象、对页面对象服务进行编排与组装、实现高并发页面对象访问和服务的基于识别抓取 技术实现企业应用集成管理的系统及方法。
[0005] 为了实现上述目的,本发明的基于识别抓取技术实现企业应用集成管理的系统及 方法具有如下构成:
[0006] 该基于识别抓取技术实现企业IT应用集成管理的系统,其主要特点是,系统包 括:
[0007] 页面总线引擎,基于页面Dom(Document Object Model,文档对象模型)智能解析 (综合了对象标识识别、字符串识别、Dom层次路径xPath识别等相结合的综合解析)记录 用户访问企业IT应用的页面对象、操作数据(包含输入信息或选择项)与操作步骤(键 盘及鼠标操作顺序),并抓取所述的企业IT应用的页面输出数据(返回结果或自动填写内 容),并且通过回放的方式自动化重现应用操作过程,回放中可调整输入参数的取值以实现 页面复用,其中,一组记录下来的页面对象、操作数据、操作步骤和对应抓取的页面输出数 据组合起来叫做一个用例;
[0008] 用例库管理模块,用以组织并管理多个可重复执行的用例;
[0009] 业务流程编排模块,用以将所述的用例按照实际业务流程的要求进行流程编排并 形成可在页面总线引擎中回放的业务流程,该业务流程具备全局参数能力;
[0010] 业务流程执行模块,用以采用分布式执行框架来执行所述的业务流程并IE对浏 览器进行扩展,解决IE浏览器执行业务流程时资源占用率高、多IE浏览器之间鼠标/键盘 焦点的抢占等缺陷,以支持更好的性能和高并发;
[0011] 服务发布模块,用以将所述的业务流程发布成其他IT应用可以访问的服务。
[0012] 更进一步地,所述的对浏览器进行扩展具体为:
[0013] 所述的业务流程执行模块通过扩展浏览器内核屏蔽所述的游览器的所有可视化 页面、弹出框和弹出窗口,并在所述的业务流程执行模块执行所述的业务流程时,将对所 述的页面的访问操作转化为对WebBrowser对象(WebBrowser对象是IE浏览器内核在 Windows内存中的对象实例)中Dom对象的操作,避免直接打开IE浏览器带来的资源消耗, 提升并发数量及性能。
[0014] 更进一步地,所述的业务流程执行模块包括页面总线主控服务单元、消息队列、页 面总线代理服务单元,其中:
[0015] 所述的页面总线主控服务单元用以获取所有要执行的业务流程并将所述的业务 流程发布至所述的消息队列中;
[0016] 所述的消息队列用以将所述的业务流程按照指定的规则分配到相应的页面总线 代理服务单元上;
[0017] 所述的页面总线代理服务单元用以完成企业IT应用的访问并将访问结果通过所 述的消息列队上传至所述的页面总线主控服务单元。
[0018] 此外,本发明还提供一种基于识别抓取技术实现企业IT应用集成管理的方法,其 主要特点是,所述的方法包括以下步骤:
[0019] (1)所述的页面总线引擎记录所述的用户访问所述的企业IT应用的页面对象、操 作数据与操作步骤;
[0020] (2)所述的页面总线引擎抓取页面上的页面输出数据,并且通过回放的方式自动 化重现应用操作过程,回放中可调整输入参数的取值以实现页面复用;
[0021] (3)所述的系统将所述的页面对象、所述的操作数据、所述的操作步骤和所述的页 面输出数据保存至所述的用例库管理模块;
[0022] (4)所述的业务流程编排模块按照实际业务流程的要求对所述的用例进行流程编 排并形成所述的业务流程;
[0023] (5)所述的业务流程执行模块采用分布式执行框架来执行所述的业务流程并对所 述的浏览器进行扩展;
[0024] (6)所述的服务发布模块将业务流程暴露为可以被其它企业IT应用访问的服务;
[0025] (7)所述的页面总线引擎将所述的页面对象、操作数据与操作步骤转化为服务输 入参数并将所述的页面输出数据转化为服务输出参数。
[0026] 进一步地,所述的页面总线引擎记录所述的用户访问所述的企业IT应用的页面 对象、操作数据与操作步骤,包括以下步骤:
[0027] (I. 1)所述的页面总线引擎在所述的企业IT应用的页面中嵌入鼠标钩子和键盘 钩子并记录所述的用户对所述的页面对象的操作过程;
[0028] (1. 2)所述的页面总线引擎识别所述的用户对所述的页面对象的操作过程并得到 所述的操作数据;
[0029] (I. 3)所述的页面总线引擎根据所述的操作数据定位所述的用户访问的页面对象 并以脚本的方式记录;
[0030] (1.4)所述的页面总线引擎以多行脚本的方式识别所述的用户的连续的操作步 骤。
[0031] 进一步地,所述的页面总线引擎抓取页面上的页面输出数据,并且通过回放的方 式自动化重现应用操作过程,回放中可调整输入参数的取值以实现页面复用,包括以下步 骤:
[0032] (2. 1)所述的页面总线引擎获得所述的脚本并定位所述的页面对象;
[0033] (2. 2)所述的页面总线引擎将所述的输入参数填充到页面对象中;
[0034] (2. 3)所述的页面总线引擎抓取页面执行过程中的页面输出数据;
[0035] (2. 4)所述的页面总线引擎将所述的页面输出数据放入自身的上下文中。
[0036] 采用了本发明的基于识别抓取技术实现企业应用集成管理的系统及方法,将企业 IT应用集成方式由原来必须专业软件开发人员开发接口,转换为只需要由业务操作员直接 操作界面,自动生成可执行脚本,然后经过配置、组装、编排就可以直接发布为服务,大大降 低了企业IT应用集成的难度。
[0037] 本发明提供的页面总线技术简便易用,大大缩短了企业IT应用集成的周期,使企 业能够快速的根据市场变化的情况调整IT系统,原来企业内部一个服务的开放可能花费2 周到一个月,现在只需要1周或者更少的时间即可完成。
[0038] 本发明的系统及方法还可以极大的降低客户实施企业IT应用集成项目的成本, 采用了本发明的基于识别抓取技术实现企业应用集成管理的系统及方法,企业IT应用集 成不再依赖于专业软件开发人员,而且实施周期比原来缩短了 50 %或者更多,因此企业IT 应用集成项目的实施成本可以得到极大的缩减。
【附图说明】
[0039] 图1为本发明的基于识别抓取技术实现企业IT应用集成管理
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1