一种基于互联网的键值数据查询方法

文档序号:6514254阅读:219来源:国知局
一种基于互联网的键值数据查询方法
【专利摘要】本发明涉及一种基于互联网的键值数据查询方法,其特征在于,步骤如下:(1)导航代理创建数据集导航的基础图;(2)用户向导航代理输入路径表达式;(3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作;(4)导航代理将获得的互联数据结果输出给用户。本方法实现了基于互联数据的半自动化的语义导航,并为查询提供了良好的导航能力。用户可以通过给定路径表达式来约束导航的规则和过程。通过导航可以查询获得用户想要的互联数据集,并能做一些推理工作,为互联数据的查询和推理提供了一种新的方法。
【专利说明】一种基于互联网的键值数据查询方法
【技术领域】
[0001]本发明涉及信息检索领域,尤其涉及一种基于互联网的键值数据查询方法。
【背景技术】
[0002]互联数据由大量的互联RDF (资源描述框架)图组成。互联数据有四个规则:(I)用URI作为事物的名字;(2)使用HTTP URI ; (3)在RDF中提供有用的信息;⑷可以包括到其他URI的RDF链接。互联数据被看做是互联网上的一个开放的分布式的数据库。互联数据可以用RDF数据集来表示,RDF数据集是一个RDF命名图的集合。RDF图既可以表示成RDF三元组(S,ρ,ο)的集合,又可以表示成带标签的有向图
[0003]
[0004]要对海量的互联数据进行处理和应用,首先要解决互联数据的查询问题。W3C推荐使用SPARQL进行语义web数据的查询。RDF的数据格式是带标签的有向图,因此SPARQL是一种图匹配查询语言。SPARQL其语法类似于SQL,SPARQL查询由三部分组成。模式匹配部分,结果修正部分和结果输出部分。SPARQL查询的结果类型包括:是与否,匹配模式的变量值以及由这些值组成的新的RDF数据,资源的描述等。
[0005]由于RDF是一种带标签的有向图,人们已经越来越意识到,对以树形和图结构的数据(如XML和RDF),导航能力是非常重要的。然而SPARQL在导航方面提供的支持非常少,这就造成了一些查询的困难。因此我们考虑使用路径表达式来提供查询的导航能力。

【发明内容】

[0006]为解决上述问题,本发明提供一种导航能力强的基于互联网的键值数据查询方法。
[0007]为了达到上述目的,本发明采用的技术方案是:一种基于互联网的键值数据查询方法,其特征在于,步骤如下:
[0008](I)导航代理创建数据集导航的基础图;
[0009](2)用户向导航代理输入路径表达式;
[0010](3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作,具体操作步骤为:
[0011 ] 与数据库代理装置建立连接;
[0012]接收携带多个查询请求信息的键值数据,所述查询请求信息为第一信息;
[0013]根据所述键值数据中携带的所述第一信息查询白名单;
[0014]当确定所述白名单中没有查询到所述第一信息,则将所述第一信息转换为第一标识信息,并确定多个所述第一标识信息的键值服务器;
[0015]将确定为同一个键值服务器的多个所述第一标识信息合并,并向所述键值服务器查询合并的多个所述第一标识信息;
[0016]当确定所述键值服务器中查询到所述第一标识信息,所述第一标识信息对应的信息为第二信息,并且所述第二信息与所述第一信息不同,则将所述第一信息转换为第二标识信息,并将所述第一信息和所述第二标识信息存入白名单,所述第二标识信息为所述第一信息的查询结果信息;[0017]发送携带多个所述查询结果信息的键值数据;
[0018](4)导航代理将获得的互联数据结果输出给用户。
[0019]更进一步,所述的导航代理为编程语言架构的数据管理服务器。
[0020]本发明的发明思想在于:用户根据想要查询的互联数据内容,向导航代理提交用RPath语言描述的路径表达式规则,以及互联数据导航开始的节点等约束条件。
[0021]导航代理,是基于路径表达式的互联数据查询与推理引擎,它能够自动的在互联数据上查询出用户想要的内容,并可以根据用户提供的推理规则进行推理。导航代理根据步骤(2)给定的路径表达式,从给定起点集合开始,在互联网上的数据集导航的基础图寻找匹配的路径,进行导航过程,获取查询和推理结果。
[0022]RPath语言包括如下规则:
[0023]Step:从(g, m)到(g, η)的图内转移,使得对于一些三元组t e g, m, n e Term(t),记作(g, t)。其中g表示图,m, η表示图中的节点,t表示一个三元组,Term(t)表示一条互联数据三元组。Self是一种特殊的Step,它的起始节点是同一个节点,即是自身到自身的跳转;
[0024]Jump:从(g, η)到(g’,η)的跨图转移,表示从图g跳转到图g’,记作(g, (n, JUMP, g’))。其中g和g’表示两个图;
[0025]用5表示反向转移;
[0026]使用标准的正则表达式比如,Union ( ‘ |’),Sequence ( iT ), Star ( ‘*,),来表示复合表达式。
[0027]Fold: folding操作分析路径集合,根据folding规则把一些路径打包形成一个新的路径,记作f=(Pe=>p)。其中Pe是嵌套的路径表达式,P是路径的属性值。
[0028]通过以下模型来描述导航过程:一个位置P和一个以P为起点路径的集合。路径是一个序列路径(Po,t1; P1,…,tn, pn),其中pO, pi,…,pn为位置,ti是从pi I到pi的转移,I < i < η。
[0029]路径表达式Pe用来表述导航过程:(p,Pe)在数据集d中的估值,记作Evald(p, Pe),是从节点ρ开始,由Pe指定的导航过程所产生的路径集合;ρ在Pe规则下,在数据集d内的可到达集合,记作Reachd(ρ, Pe),包含在Evald(p, Pe)中的所有路径的末端点。
[0030]上面关于RPath语言的规则可以改为下面的形式,
[0031](I)Step:是图中一个顶点到另一个顶点的转移,转移可以用
[0032]

S~
[0033]即图中的一条边来表示,其中S,O是图中的顶点,ρ表示从s到O的一条边。s对应于互联数据三元组中的主语,O对应于宾语,P对应于谓语;[0034](2)
[0035]Π
[0036]表不并且关系,
[0037]U
[0038]表示或者关;
[0039](3) Fold:
[0040]t=i>r ,
[0041]表示从规则t可以推出规则r,其中t是用
[0042]η
[0043]和
[0044]U
[0045]链接的多个规则,我们称将规则t fold称规则r。
[0046]本发明的技术优势在于:本方法实现了基于互联数据的半自动化的语义导航,并为查询提供了良好的导航能力。用户可以通过给定路径表达式来约束导航的规则和过程。通过导航可以查询获得用户想要的互联数据集,并能做一些推理工作,为互联数据的查询和推理提供了一种新的方法。
[0047]下面结合附图和【具体实施方式】,对发明做进一步说明。
【专利附图】

【附图说明】
[0048]图1是本实施例的工作流程示意图。
【具体实施方式】
[0049]参考图1,一种基于互联网的键值数据查询方法,步骤如下:
[0050](I)导航代理创建数据集导航的基础图;
[0051](2)用户向导航代理输入路径表达式;
[0052](3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作,具体操作步骤为:
[0053]与数据库代理装置建立连接;
[0054]接收携带多个查询请求信息的键值数据,所述查询请求信息为第一信息;
[0055]根据所述键值数据中携带的所述第一信息查询白名单;
[0056]当确定所述白名单中没有查询到所述第一信息,则将所述第一信息转换为第一标识信息,并确定多个所述第一标识信息的键值服务器;
[0057]将确定为同一个键值服务器的多个所述第一标识信息合并,并向所述键值服务器查询合并的多个所述第一标识信息;
[0058]当确定所述键值服务器中查询到所述第一标识信息,所述第一标识信息对应的信息为第二信息,并且所述第二信息与所述第一信息不同,则将所述第一信息转换为第二标识信息,并将所述第一信息和所述第二标识信息存入白名单,所述第二标识信息为所述第一信息的查询结果信息;
[0059]发送携带多个所述查询结果信息的键值数据;[0060](4)导航代理将获得的互联数据结果输出给用户。
[0061]例如,我们希望根据FOAF信息(朋友关系信息),参考书目信息和书评,推断出谁可能会购买人工智能专业领域的书籍。具体实施步骤如下:
[0062](I)用户查询的范围是互联数据集M上;
[0063](2)用户希望查询Mia可能购买的书。用户将查询推理条件转化为导航约束规则,并设定Mia为导航起点;
[0064]a)我们认为如果一个人写作、评论或者购买了一本书,这本书是领域D的,则我们认为他对这个领域感兴趣,特别到人工智能(Al)领域,转化为导航约束规则为:
[0065]
【权利要求】
1.一种基于互联网的键值数据查询方法,其特征在于,步骤如下: (1)导航代理创建数据集导航的基础图; (2)用户向导航代理输入路径表达式; (3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作,具体包括: 与数据库代理装置建立连接; 接收携带多个查询请求信息的键值数据,所述查询请求信息为第一信息; 根据所述键值数据中携带的所述第一信息查询白名单; 当确定所述白名单中没有查询到所述第一信息,则将所述第一信息转换为第一标识信息,并确定多个所述第一标识信息的键值服务器; 将确定为同一个键值服务器的多个所述第一标识信息合并,并向所述键值服务器查询合并的多个所述第一标识信息; 当确定所述键值服务器中查询到所述第一标识信息,所述第一标识信息对应的信息为第二信息,并且所述第二信息与所述第一信息不同,则将所述第一信息转换为第二标识信息,并将所述第一信息和所述第二标识信息存入白名单,所述第二标识信息为所述第一信息的查询结果信息; 发送携带多个所述查询结果信息的键值数据; (4)导航代理将获得的互联数据结果输出给用户。
2.根据权利要求1所述的基于互联网的键值数据查询方法,其特征在于:所述的导航代理为编程语言架构的数据管理服务器。
【文档编号】G06F17/30GK103577538SQ201310459227
【公开日】2014年2月12日 申请日期:2013年9月29日 优先权日:2013年9月29日
【发明者】王萌, 唐新来, 李健军 申请人:柳州市宏亿科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1