一种构造和浏览语义链的方法

文档序号:6394964阅读:193来源:国知局
专利名称:一种构造和浏览语义链的方法
技术领域
本发明涉及计算机技术领域,特别是一种构造和浏览语义链的方法,以及互联网资源间语义链(关系)的构建与浏览。
背景技术
自超文本标记语言(HTML)被发明后,网页逐渐成为一种人们进行信息交流的媒介。随着各种网页开发工具的推出,互联网上网页的数量急剧增长。这使得用户获取所需要的信息变得非常困难。造成这种情况的原因是超文本标记语言对语义的表达能力非常有限,它几乎不能表达语义关系。因此当前的互联网(Web)很难对检索的信息进行精确的定位,同时上述情况也使得在互联网上开发智能化的服务变得非常困难。
为了解决上述问题,语义互联网(Semantic Web)被提出。语义互联网的目标是建立一种能被机器理解的文档,使得计算机和人能够很好地协同工作。基于语义互联网的理念,包括XML,RDF,RDF-SCHEMA,Ontology(本体)在内的技术和标准已经被提出和采用。
不同于语义互联网,我们所提出的语义链网络是对当前的超级链接的一个自然而平稳的扩展。它由七种基本类型构成因果链接、实例链接、隐含链接、引用链接、相似链接、顺序链接、子类链接等。大量分布的语义链网络通过语义链相互链接构成了世界范围的语义链网络。在语义链网络中,语义的表达十分简洁,而且语义链网络的传递性和推理规则支持语义链网络进行语义推理和智能应用程序开发。

发明内容
本发明的目的在于提供一种构造和浏览语义链的方法。
本发明的目的是快速构造并浏览语义链网络,解决互联网领域中有关语义链网络的构建和浏览问题。本发明先在一个初始文档的基础上构造语义链网络,并将构造好的语义链网络以扩展标记语言格式存储,然后将此存储文件转换成一个可浏览的超文本标记语言格式的文件。本方法主要包括以下几点根据语义链网络的特点,在表示、构造和存储语义链网络时采用了树型结构,这既解决了语义链网络在计算机中的存储问题,又使得语义链网络的构造变得非常直观;采用校验过程以确保构造的语义链网络的正确性;在构造基于图像的语义链网络时集成了图像预览技术;采用了通用解释模板技术;为了能充分展示语义链网络在显示语义方面的特点,在通用解释模板中加入了语义链网络推理的过程;在浏览语义链网络时既综合了语义链网络推理的结果,同时又采用了树型的浏览结构,使得浏览内容既层次化,又包含丰富的语义信息。
本发明所述的推理规则或推理是一种使用机器推理而非人为的推理。
发明技术方案一种构造和浏览语义链网络的方法,该方法首先在源文件的基础上构造各种类型的语义链网络,然后将构造好的语义链网络以扩展标记语言(XML)格式存储,再将生成的语义链网络转换成以超文本标记语言(HTML)格式存储的网页供用户浏览;在语义链网络的构造和存储过程中采用了树型结构,在构造过程中进行校验,在将语义链网络转换成超文本标记语言格式存储的网页的过程中加入语义链网络的推理机制。该技术方案有以下几个技术特征1)构造语义链网络时采用了树型结构方式逐级构造。
2)构造过程中可以随时校验构造过程是否正确。
3)能构造各种类型的语义链网络。该方法不仅能构造常用类型的语义链网络,还能构造基于图像类型和自定义类型的语义链网络。
4)用该方法构造的语义链网络以扩展标记语言格式存储,并将文档内容和语义链网络分别存储。
5)将存储的语义链网络转换成超文本标记语言格式的过程中采用了通用解释模板技术,该模板对所遇到的所有标记进行分析和解释,并将这些标记转换成相应的超文本标记语言标记。
6)采用了语义链网络矩阵来表示语义链网络。
7)在解释模板中加入了语义链推理,主要包括大粒度推理和小粒度推理两部分,大粒度推理利用语义链网络之间的语义包含关系来进行推理;小粒度推理利用语义链的传递性和推理规则进行推理。
8)在浏览用本方法生成的超文本标记语言所表示的语义链网络时,本方法又将语义链网络以树型的结构表示出来,并融合了语义链的推理结果,使得浏览内容包含了极其丰富的语义信息。


图1是本发明的语义链网络定义和浏览的流程图。
具体实施例方式
首先简单地描述一下本方法的实现流程,具体参见图1。具体实施步骤如下步骤S1,输入一个资源文件,步骤S2,对该文档进行三种标记常用类型语义链网络标记、图像类型语义链网络标记和自定义类型语义链网络标记。步骤S3,本方法对构造好的语义链网络进行校验,校验完成后转到步骤S4。步骤S4,将这些语义链网络以扩展标记语言格式分别保存为文档内容文件和语义链网络文件。步骤S5,在生成的语义链网络文件的基础上对语义链网络所包含的语义信息进行大粒度推理和小粒度推理。步骤S6,综合步骤S5的推理结果,本方法将文档内容文件和语义链网络文件转换成超文本标记语言格式的文件,该类型的文件可以被当前流行的网络浏览器浏览,步骤S7,浏览语义链网络。
本方法支持三种类型的语义链网络的构造常用语义链标记和自定义标记的构造、语义链网络的构造和图像类型的语义链网络的构造。从严格意义上来讲,常用语义链标记并不属于语义链网络的范畴,它们仅仅是一些需要特别处理的语义标记,但是这些标记的定义有助于读者对该文档的理解,因此把它们都放在一起讨论。下面以论文的结构为例来说明本方法所采用的常用语义链标记。主要有文章标题(ArticleTitle),作者(Author),作者地址(AuthorAddress),邮箱(Email),论文摘要(Abstract),论文简介(Introduction),论文引用(References)等等。本方法在实现上面所说的这些语义链标记时是在所选中的文字的前后以扩展标记语言的格式添加上相应的标记。例如,如果我们对一篇论文进行语义链标记,假设论文的作者是“张三”。如果我们想对作者“张三”添加“作者”语义链标记,那么在本方法的作用下添加后的结果就是“<作者>张三</作者>”。
下面介绍本方法中语义链网络的构造机制。从本质上讲,一个语义链网络的构造过程类似一棵多叉树的构造过程。树根就是将要用语义链网络进行描述的一段文本,树枝是各种语义链网络的类型或者是一些语义链的地址信息和语义信息,但是树叶只能由超文本链接组成。具体的结构如下<Entity PredecessorID=string PredecessorText=string>
<SemanticRelation>
<Similar-to>
Link specification</Similar-to>
<Sequential>
Link specification</Sequential>
<Reference>
Link specification</Reference>
<SubType>
Link specification</SubType>
<Instance>
Link specification</Instance>
<Cause-effective>
Link specification</Cause-effective>
<Implication>
Link specification
</Implication>
</SemanticRelation>
</Entity>,其中“Link Specification”定义如下<Link>
<SuccessorID></SuccessorID>
<SuccessorText> </SuccessorText>
</Link>
…<Link>
<SuccessorID></SuccessorID>
<SuccessorText> </SuccessorText>
</Link>
任何一个语义链都存在一个前驱节点和后继节点。在上面的数据结构中,这两个节点分别用“PredecessorID”和“SuccessorID”来表示。在本方法中这两个标记的值是自动维护的。“PredecessorText”和“SuccessorText”指的是前驱节点和后继节点所代表的文本内容。前驱节点和后继节点之间可能存在多种语义关系,这就是上面数据结构中所描述的“Similar-to”、“Cause-effective”、“Instance”和“Subtype”等等。构造语义链网络是遵循着以下的顺序前驱节点的文本——前驱节点和后继节点之间存在的各种语义类型——后继节点的文本。在此基础上后继节点的文本又可能成为下一个前驱节点的文本,这样就形成了一个语义链构造的递归,最终形成一个语义链网络。但是在语义链网络中如果一个语义链的后继节点指向一个超文本链接(既存在文本又存在超文本链接),那么该语义链网络在该语义关系分支上终止。
在本方法中语义链网络的校验是指根据上述数据结构进行的校验和有关语义链标记的校验。在校验过程中如果发现语义链网络不是按照上述数据结构的格式构造的,本方法会提示用户重新构造。对语义链标记的校验主要是校验语义链标记是否交叉嵌套。举例来说,假设我们有两段文本text1和text2,我们分别对text1和text2进行了语义标记Mark1和Mark2。则如下的标记结果就是错误的<Mark1>text1<Mark2></Mark1>text2</Mark2>。因为它们的标记定义存在交叉的地方,这不符合扩展标记语言的语法规则。
本方法在存储语义链网络时,文档的内容(数据文件)和语义链(语义链网络文件)分别存放在两个文件中,并且都是以扩展标记语言的格式来存储的。这样可以方便查找,提高检索的准确性。
对于图像类型的语义链网络的构造,其构造方法和通用类型的语义链网络的构造方法基本相同,但是为了便于选择合适的图片,图像类型的语义链网络构成过程集成了图像的预览方法。
本方法提出了两种推理方法来增强语义链网络的浏览效果,这两种方法分别是大粒度推理和小粒度推理。大粒度推理主要是从一个语义链网络的集合中找出语义信息最丰富的一个,主要采用了图论中的匹配技术。从实现的角度来讲首先把各个语义链网络用语义链网络矩阵表示出来。语义链网络矩阵的行和列代表的是语义链网络中的各个节点,矩阵的每个元素代表的是对应的两个节点之间的所有语义关系。有了语义链网络矩阵,判定各个语义链网络之间的关系问题就转换为判断各个语义链网络矩阵之间的关系问题。下面是判断这两个矩阵之间存在关系的核心算法。假设两个语义链网络为G1=(V1,E1)和G2=(V2,E2),如果V1V2,并且E1中的每一条边都在E2中,那么G1G2。即语义链网络G2中含有比G1更丰富的语义关系。据此,可以把两个语义链网络之间的关系分为五种包含关系(对两个有序语义链网络点对<G1,G2>,G1中的点和边都在G2中)、反向包含关系、相等关系、相交关系和空关系(无交集关系)。当然在具体实现算法时要将上述算法的核心思想用语义链网络矩阵描述出来才能在计算机上使用。小粒度推理意思是在一个语义链网络的集合中根据语义链的推理规则找出与一条语义链相关的所有语义链。下面用一个例子来说明。假设存在一个语义链V1→V2,V1和V2之间存在因果关系(ce)。小粒度推理的目标在一个语义链网络的集合中找出所有以V2为前驱节点并且具有因果关系的语义链或者是以前面所找出的语义链的后继节点作为前驱节点并且具有因果关系的语义链。下面是小粒度推理的算法。首先将 放到一个队列中,然后对该队列进行如下操作。
1)如果该队列为空,返回结果集ResultSet。
2)如果该队列非空,取出队列头部的规则,记为 同时将该规则放入结果集ResultSet。
3)从语义链网络集合中找出所有以Vt为前驱节点且具有因果关系的语义链,然后把这些语义链放到队列的尾部。
在实现语义链网络的浏览方面,本方法提出了通用解释模板技术。具体说来就是生成一个超文本标记语言格式的文件,在这个文件中要对每一个在语义链网络和其它语义标记的构造时可能出现的标记进行分析和解释,然后根据相应标记的含义将其转换为超文本标记语言格式的文件,同时在解释的过程中要加入语义链网络的推理信息。为了在浏览时显示更多的语义信息,在进行转换的过程中采用了树型的浏览结构技术。在超文本标记语言中,树型浏览技术已经非常成熟,具体可参考相关的技术文档。
最后生成的文档可被当前的各种浏览器浏览。
权利要求
1.一种构造和浏览语义链网络的方法,该方法首先在源文件的基础上构造各种类型的语义链网络,然后将构造好的语义链网络以扩展标记语言(XML)格式存储,再将生成的语义链网络文件转换成以超文本标记语言(HTML)格式存储的网页供用户浏览;其特征在于,在语义链网络的构造和存储过程中采用了树型结构,在构造过程中进行校验,在将语义链网络转换成超文本标记语言格式存储的网页的过程中加入了语义链网络的推理机制。
2.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,构造语义链网络时采用了树型结构方式逐级构造。
3.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,构造过程中可以随时校验构造过程是否正确。
4.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,该方法不仅能构造常用类型的语义链网络,还能构造基于图像类型和自定义类型的语义链网络。
5.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,用该方法构造的语义链网络以扩展标记语言格式存储,并将文档内容和语义链网络分别存储。
6.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,将存储的语义链网络转换成超文本标记语言格式的过程中采用了通用解释模板技术,该模板对所遇到的所有标记进行分析和解释,并将这些标记转换成相应的超文本标记语言标记。
7.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,采用了语义链网络矩阵来表示语义链网络。
8.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,在解释模板中加入了语义链推理,主要包括大粒度推理和小粒度推理两部分,大粒度推理利用语义链网络之间的语义包含关系来进行推理;小粒度推理利用语义链的传递性和推理规则进行推理。
9.根据权利要求1所述的构造和浏览语义链网络的方法,其特征在于,在浏览用本方法生成的超文本标记语言所表示的语义链网络时,本方法又将语义链网络以树型的结构表示出来,并融合了语义链的推理结果,使得浏览内容包含了极其丰富的语义信息。
10.根据权利要求1的构造和浏览语义链网络的方法,其具体步骤如下步骤S1,输入一个资源文件;步骤S2,对该文档进行三种标记常用类型语义链网络标记、图像类型语义链网络标记和自定义类型语义链网络标记;步骤S3,对构造好的语义链网络进行校验,通过校验后转步骤S4;步骤S4,将这些语义链网络以扩展标记语言格式分别保存为文档内容文件和语义链网络文件;步骤S5,在生成的语义链网络文件的基础上对语义链网络所包含的语义信息进行大粒度推理和小粒度推理;步骤S6,将文档内容文件和语义链网络文件转换成超文本标记语言格式的文件,该类型的文件可以被当前流行的网络浏览器浏览;步骤S7,浏览语义链网络。
全文摘要
本发明涉及计算机技术领域的构造和浏览语义链网络的方法,在语义链网络构造时采用了树型数据结构并支持多种类型的语义链网络的构造。步骤如下步骤S1,输入一个资源文件;步骤S2,对该文档进行三种标记;步骤S3,对构造好的语义链网络进行校验;步骤S4,将这些语义链网络以扩展标记语言格式分别保存为文档内容文件和语义链网络文件;步骤S5,在生成的语义链网络文件的基础上对语义链网络所包含的语义信息进行大粒度推理和小粒度推理;步骤S6,将文档内容文件和语义链网络文件转换成超文本标记语言格式的文件;步骤S7,浏览语义链网络。该文档可被当前的各种浏览器浏览。
文档编号G06F17/30GK1564161SQ200410030280
公开日2005年1月12日 申请日期2004年3月23日 优先权日2004年3月23日
发明者诸葛海, 贾瑞祥, 刘洁, 李向 申请人:中国科学院计算技术研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1