层次式数据分析方法

文档序号:8487810阅读:484来源:国知局
层次式数据分析方法
【技术领域】
[0001]本发明涉及一种层次式数据分析方法。更具体地讲,涉及一种在利用基于以可扩展标记语言(XML extensible Markup Language)为基础的结构的数据等具有基于标签的层次式结构的数据来执行数据处理时,用于减少分析标签层次结构所需的运算量及运算时间的层次式数据分析方法。
【背景技术】
[0002]XML文件是广泛用于表示具有层次式结构的数据的文件格式。与超文本标记语言(HTML:HyperText Markup Language)等相比,XML文件的优点在于,具有用户可直接对标签结构进行定义的扩展性。
[0003]包含于XML文件的信息利用标签来表示各个信息之间的连接关系。这些标签具有树形的层次结构。因此,为了对包含于XML文件的信息进行分析,需要预先执行对作为各个标签的层次结构的树形结构进行设置的工作。众所周知,树的节点数量为N时,探索树所需的运算时间为O (log N)。虽然XML文件的树形结构有可能是被很好地分配的树形结构,但是在对具有高DEPTH的XML文件进行分析时,会需要更多的时间。因此,每次重新对具有高DEPTH的大容量XML文件的标签层次结构进行分析会浪费运算量和运算时间。
[0004]【现有技术文献】
[0005]第2013-0101153号韩国公开专利
[0006]第2008-0090647号韩国公开专利

【发明内容】

[0007]本发明要解决的技术问题在于,提供一种通过对XML文件等具有基于标签的层次式结构的数据的标签层次结构分析结果进行记录,从而无需每当需要对记录于XML文件的数据进行处理时都要重新对XML文件的标签层次结构进行分析,而是利用已记录的标签层次结构分析结果来迅速地对记录于XML文件的数据执行处理的方法。
[0008]本发明要解决的另一个技术问题在于,提供一种对分析对象文件的标签层次结构分析结果进行记录,并且分别按包含于分析对象文件的各个标签将从根标签到达相关的标签的路径作为所述标签层次结构分析结果来进行记录的方法。
[0009]本发明要解决的又一个技术问题在于,提供一种通过生成一眼就能够掌握位于分析对象文件的各个标签所适用的区域(即,位于初始标签(〈tag〉)和终止标签(〈/tag〉)之间)的句子结构的形态的数据结构来进行表示和记录的方法。
[0010]本发明的技术问题不限于以上所述的技术问题,本领域技术人员通过以下的记载应该会清楚地理解未提及的其他的技术问题。
[0011]根据用于解决上述问题的本发明的一个实施例的层次式数据分析方法包括如下步骤:加载(load)包含数据的第一分析对象文件,所述数据具有基于标签的层次式结构;对包含于所加载的所述第一分析对象文件的多个标签(tag)的层次结构进行分析;利用所述分析的结果,将包含于所述第一分析对象文件的各个标签的标签路径信息的列表记录到存储单兀。
[0012]根据一个实施例,所述各个标签的标签路径信息可意味着位于从所述第一分析对象文件的根(root)标签到所述各个标签的路径上的多个标签的依次排列。
[0013]根据一个实施例,所述记录的步骤可包括如下步骤:将关于包含于所述第一分析对象文件的第一标签的所述标签路径信息记录到存储单元;将特定的分隔符字符串连接(string concatenat1n)到关于所述第一标签的所述标签路径信息的末尾处;将关于包含于所述第一分析对象文件的第二标签的所述标签路径信息字符串连接到所述分隔符后。此时,所述第二标签可意味着在所述第一分析对象文件内位于紧挨所述第一标签后的初始标签。
[0014]根据一个实施例,所述记录的步骤可包括如下步骤:对将所述标签路径信息的列表作为第一轴且将在所述第一分析对象文件内记载于与所述列表所包含的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据进行显示。
[0015]根据一个实施例,所述层次式数据分析方法还可包括如下步骤:将所述二维数据存储到存储单元。此时,具有所述二维数据结构的数据优选为是能够根据棋盘式数据表(SPREAD SHEET)应用(Applicat1n)而被加载的数据。
[0016]根据一个实施例,所述层次式数据分析方法还可包括如下步骤:加载具有与所述第一分析对象文件相同的标签层次结构的第二分析对象文件;加载记录于所述存储单元的标签路径信息的列表;对将所加载的所述标签路径信息的列表作为第一轴且将在所述第二分析对象文件内记载于与所加载的所述列表所包含的各个标签路径信息对应的标签的区域的句子结构作为第二轴的二维数据进行显示。
[0017]根据一个实施例,所述层次式数据分析方法可包括如下步骤:从所述存储单元上删除记录于所述存储单元的标签路径信息的列表中的至少一部分的标签路径信息;加载未被删除的剩余标签路径信息;以所加载的所述剩余标签路径信息作为对象来检索特定标签的标签路径信息。此时,所述删除的步骤可包括如下步骤:接收关于检索范围指定标签的标签路径信息;删除除所述检索范围指定标签的标签路径信息及所述检索范围指定标签的下级标签的标签路径信息之外的所有标签路径信息。
[0018]根据一个实施例,所述层次式数据分析方法还可包括如下步骤:加载记录于所述存储单元的标签路径信息的整个列表;删除所加载的所述标签路径信息的列表中的至少一部分的标签路径信息;将未被删除的剩余标签路径信息作为对象来检索特定标签的标签路径信息。
[0019]根据如上所述的本发明,带来能够迅速分析XML文件的效果。
[0020]此外,能够带来如下效果:将XML文件的标签结构存储到存储单元,并且在之后需要处理具有相同的标签结构的其他的XML文件的数据时,通过加载存储在所述存储单元中的标签结构来直接掌握标签结构,并能够利用该结果来迅速处理所述其他的XML文件的数据处理。
[0021]此外,利用第一轴配置各自的标签的标签路径信息、第二轴配置各自的标签适用区域内的句子结构的数据结构来显示XML文件的分析结果,从而带来能够一眼掌握XML文件的结构的效果。具有所述第一轴、第二轴的数据结构通过棋盘式数据表(SPREAD SHEET)应用来被加载,从而可提高使用上的便利性。
【附图说明】
[0022]图1是根据本发明的一个实施例的层次式数据分析方法的顺序图。
[0023]图2是XML文件的标签结构示例。
[0024]图3是将图2中示出的文件的标签结构用树形表示的概念图。
[0025]图4是示出根据本发明的一个实施例的层次式数据分析方法来记录的标签路径信息的列表的图。
[0026]图5是可接着图1中示出的顺序图而执行的根据本发明的一个实施例的层次式数据分析方法的顺序图。
[0027]图6是可接着图1中示出的顺序图而执行的根据本发明的一个实施例的层次式数据分析方法的顺序图。
[0028]图7是示出可根据本发明的一个实施例而生成的基于两个轴的数据结构的图。
[0029]图8至图10是可接着图1中示出的顺序图而执行的根据本发明的一个实施例的层次式数据分析方法的顺序图。
[0030]图11是可在执行根据图8至图10的层次式数据分析方法时被显示的图形用户界面(GUI:Graphic User Interface)的不例。
[0031]图12是示出在通过图11中示出的GUI来执行检索时的标签路径信息的列表中的删除对象和检索对象的图。
[0032]图13是根据本发明的另一个实施例的层次式数据分析装置的构成图。
【具体实施方式】
[0033]以下,将参照附图对本发明的优选实施例进行详细描述。本发明的优点及特征以及实现这些的方法通过参照附图和详细描述的实施例将会变得清楚。然而,本发明不限于以下公开的实施例,而是可以以彼此不同的形态实现,本实施例只是为了完整地公开本发明且向本发明所属技术领域中具有通常的知识的技术人员完整地告知本发明的范围而提供的,本发明仅由权利要求书所记载的范围来确定。纵观说明书,相同的标号表示相同的构成要素。
[0034]除非另有定义,否则这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域的普通技术人员所通常理解的意思相同的意思。除非另外明确定义,否则在通用字典中定义的术语不应以理想的或者过于正式的含义来解释。本说明书中所使用的术语仅仅是为了描述实施例而使用,而不意图限制本发明。在本说明书中,除非上下文另外明确指出,否则单数形式包括复数形式。还应理解的是,当在本说明书中使用术语“包含”及/或“包括”时,所提到的构成要素、步骤、操作及/或元件不排除存在或附加一个以上的其它构成要素、步骤、操作及/或元件。
[0035]应该理解的是,尽管在这里可使用术语第一、第二等来描述不同的元件、构成
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1