用于生成数据格式描述语言模型的方法和装置的制造方法

文档序号:9687444阅读:265来源:国知局
用于生成数据格式描述语言模型的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及数据格式描述语言值抑L),尤其涉及D抑L模型(Schema)的生成工具。
【背景技术】
[0002] 数据格式描述语言是描述文本(text)数据格式和二进制数据格式的一种规范。
[0003] 目前已经出现了能利用D抑L模型将非结构化数据转换为符合D抑L规范值抑L specification)的结构化数据或将符合DFDL规范的结构化数据转换为非结构化数据的技 术实现,随着D抑L的更多应用,D抑L模型的生成,变得越来越重要。D抑L模型由逻辑模型 和DFDL注释构成。现有技术中存在用于手工生成DFDL模型的工具,送种工具对使用者的 要求较高,例如要求使用者根据样本数据手工地创建逻辑模型,并向逻辑模型添加相应的 D抑L注释,因此要求使用者既要熟悉样本数据的语义,又要熟悉D抑L规范。送对使用者提 出极大的挑战。

【发明内容】

[0004] 本发明的一个目的是提供一种简化D抑L模型的生成的方法和装置。
[0005] -方面,提供一种用于生成数据格式描述语言D抑L模型的方法,包含:
[0006] 获取按照注释规则对样本数据添加的注释;
[0007] 根据所述注释规则和所获取的对样本数据添加的注释,创建逻辑模型和配置文 件,其中,所述逻辑模型表示样本数据中数据元素的树状结构,所述配置文件定义在所述逻 辑模型中添加所述注释对应的DFDL注释的计算机可执行操作;和
[0008] 根据所述逻辑模型和所述配置文件生成样本数据对应的D抑L模型。
[0009] 另一方面,提供一种用于生成数据格式描述语言D抑L模型的装置,包含:
[0010] 注释获取模块,被配置用于获取按照注释规则对样本数据添加的注释;
[0011] 分析工具,被配置用于根据所述注释规则和对样本数据添加的注释,创建逻辑模 型和配置文件,其中,所述逻辑模型表示样本数据中数据元素的树状结构,所述配置文件定 义在所述逻辑模型中添加所述注释对应的DFDL注释的计算机可执行操作;和
[0012] DFLDL模型生成器,被配置用于根据所述逻辑模型和所述配置文件生成样本数据 对应的D抑L模型。
[0013] 采用本发明,用户只需熟悉样本数据的结构和语义,即使不熟悉DFDL规范,也能 自动地生成样本数据对应的D抑L模型。
【附图说明】
[0014] 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述W及其 它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号 通常代表相同部件。
[0015] 图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框 图;
[0016] 图2例示D抑L模型、D抑L文档和非结构化数据之间的关系;
[0017] 图3示意性表示按照发明实施例的用于生成D抑L模型的方法的流程图;
[001引图4A示出一个样本数据的例子;
[0019] 图4B示出一个用于标注样本数据的语义的人机界面的局部;
[0020] 图4C表示按照发明实施例产生的标注了语义的样本数据;
[0021] 图5示意性地表示按照发明实施例的分析标注了语义的样本数据的树状结构的 过程;
[0022] 图6A和6B例示按照发明实施例创建的逻辑模型和配置文件;
[0023] 图6C例示按照发明实施例根据图6A和她所示逻辑模型和配置文件生成的D抑L 模型。
[0024] 图7示意性表示按照发明实施例的用于生成D抑L模型的装置的简略框图。
【具体实施方式】
[00巧]下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开 的优选实施方式,然而应该理解,可W W各种形式实现本公开而不应被送里阐述的实施方 式所限制。相反,提供送些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的 范围完整地传达给本领域的技术人员。
[0026] 图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框 图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使 用范围带来任何限制。
[0027] 如图1所示,计算机系统/服务器12 W通用计算设备的形式表现。计算机系统 /服务器12的组件可W包括但不限于;一个或者多个处理器或者处理单元16,系统存储器 28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0028] 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器, 外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举 例来说,送些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC) 总线,增强型ISA总线、视频电子标准协会(VESA)局域总线W及外围组件互连(PCI)总线。
[0029] 计算机系统/服务器12典型地包括多种计算机系统可读介质。送些介质可W是 任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动 的和不可移动的介质。
[0030] 系统存储器28可W包括易失性存储器形式的计算机系统可读介质,例如随机存 取存储器(RAM) 30和/或高速缓存存储器32。计算机系统/服务器12可W进一步包括其 它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34 可W用于读写不可移动的、非易失性磁介质(图1未显示,通常称为"硬盘驱动器")。尽管 图1中未示出,可W提供用于对可移动非易失性磁盘(例如"软盘")读写的磁盘驱动器, W及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。 在送些情况下,每个驱动器可W通过一个或者多个数据介质接口与总线18相连。存储器28 可W包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,送些程序模 块被配置w执行本发明各实施例的功能。
[0031] 具有一组(至少一个)程序模块42的程序/实用工具40,可W存储在例如存储器 28中,送样的程序模块42包括一但不限于一操作系统、一个或者多个应用程序、其它 程序模块W及程序数据,送些示例中的每一个或某种组合中可能包括网络环境的实现。程 序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0032] 计算机系统/服务器12也可W与一个或多个外部设备14 (例如键盘、指向设备、 显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的 设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信 的任何设备(例如网卡,调制解调器等等)通信。送种通信可W通过输入/输出(I/O)接 口 22进行。并且,计算机系统/服务器12还可W通过网络适配器20与一个或者多个网络 (例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适 配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示 出,可W结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于;微代 码、设备驱动器、兀余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器W及数据备份存 储系统等。
[0033] 图1所示的计算机系统/服务器12,适于用来实现本发明的各种实施方式。
[0034] 首先参看图2,图2例示D抑L模型、D抑L文档和非结构化数据之间的关系。具体 来说,图2中显示了一个非结构化的数据流"Intval = 5 ;fltval = -7. 1E8"210、一个D抑L 处理器220、一个D抑L文档230和一个事先生成的D抑L模型255。
[0035] 如所属技术领域的技术人员知道的郝样,D抑L模型255由逻辑模型和D抑L注释 (annotation)组成。逻辑模型也称"D抑L逻辑"或"逻辑实例",用树状结构的XML文档来 描述非结构化数据流的结构。DFDL注释用于按照DFDL规范描述非结构化数据流中除逻辑 模型之外的数据格式定义的信息。如图所示,DFDL模型255中带下划线的部分表示逻辑模 型,无下划线的部分表示DFDL注释。
[0036] 如在【背景技术】部分所述的郝样,利用DFDL模型可W将非结构化数据转换为结构 化数据或将结构化数据转换为非结构化数据。如图所示,DFDL处理器220根据DFDL模型 255,可W将数据流210转换成D抑L文档230,反之亦然。
[0037] 为了简化DFDL模型的生成,本发明的总体构思是,首先按照预定的注释规则,标 注(mark) -个样本数据的语义(semantics),再自动地根据注释规则和对样本数据的注释 (annotation),分析样本数据,按照D抑L规范创建计算机可读的样本数据的描述,从而可 W自动地生成D抑L模型。
[0038] 参看图3,该图示意性表示按照本发明一个实施例的用于生成D抑L模型的方法 300的流程图。如图所示,该方法包含步骤310、320和330。下面参照其它附图,详细说明 各个步骤。
[0039] 如图所示,方法300可W在收到用户提供的样本数据451时开始。
[0040] 图4A示出一个样本数据451的例子。样本数据451,是一个十六进制的数据 流,表示一个方法调用(method invocation)的消息(message)。样本数据451的结构 是"Start,,(开
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1