信息查询方法和设备的制造方法

文档序号:8319290阅读:504来源:国知局
信息查询方法和设备的制造方法
【技术领域】
[0001]本发明涉及互联网领域,特别涉及信息查询方法和设备。
【背景技术】
[0002]目前,人们对信息查询的精准度要求越来越高,往往需要得到相对于所请求的查询词最准确的答案。
[0003]而在实际应用中,用户的搜索请求也会是很精确的,其输入的查询词中会包含大量的精确意图,需要在查询时直接返回答案。例如:输入“刘德华的身高”需要返回“174CM”;输入“身高超过180cm的明星”需要返回满足此身高条件的明星列表;输入“唐宋八大家”需要返回“柳宗元”等人。
[0004]但是,传统的信息查询系统多采用存储层、中间查询层和自然语言解析层的分层架构。而现有技术的中间查询层中的查询语言或者过于简单,而不能够对用户输入的请求做出精确的分析和肢解,使得用户查询得到的结果复杂且不够直观;或者过于复杂,而使得自然语言解析层对复杂的查询语言无法解析,对自然语言解析层不够友好,不能够得到用户所需要的查询结果。
[0005]所以,传统的信息查询系统在通过比对用户的查询词和收录网页的文本匹配程度来返回查询结果时,并不能符合用户的查询意图,而不能精确地返回用户所需要的查询结果O
[0006]因此,需要一种能够方便地返回查询结果的信息查询方法和设备。

【发明内容】

[0007]本发明所要解决的一个技术问题是提供了一种信息查询方法和设备,将抽象查询语句转换为基本查询语句或者迭代多个基本查询语句,可以覆盖大多数的查询意图,还能够实现复杂的逻辑和推理查询,这样,可以方便地返回查询结果。
[0008]根据本发明的一个方面,提供了一种信息查询方法,包括:
[0009]将用户输入的自然语言查询文本转换为结构化的抽象查询语言语句;
[0010]将抽象查询语言语句转换为基本查询语句或迭代的多个基本查询语句;
[0011]针对预先准备的数据库,执行根据基本查询语句或迭代的多个基本查询语句的查询操作。
[0012]由此,可以对用户的自然语言查询文本首先进行意图分析,过滤掉无需查询的文本,并对符合意图的查询文本转化成抽象查询语言语句。再将抽象查询语句转换为基本查询语句,可以覆盖大多数的查询意图;或者迭代多个基本查询语句。基本查询语句可以设计为较为简单的查询,例如根据较少的(例如仅一个或两个)输入获得较为明确的(例如单个)输出,输入和输出之间的关系距离可以较近,或者说较为直接。迭代则是重复反馈过程的活动,其目的是为了实现查询目标,每执行一个基本查询语句称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的输入,从而可以实现复杂的逻辑和推理查询。将一个复杂的抽象查询语句转换为若干个简单的基本查询语句的迭代,每一次迭代都根据较少的输入获得较为直接的输出,通过一次次迭代,从原始输入逐步到达最终查询目标。由于基本查询语句都比较简单,所以对于数据库(存储层)的要求较低,不需要以复杂的结构来进行存储。这样,使得有可能方便地得到更符合用户意图和更加精准的查询结果。
[0013]优选地,基本查询语句可以包括:
[0014]实体信息查询语句,用于查询与指定实体相关的信息;
[0015]实体属性查询语句,用于查询指定实体的指定属性;
[0016]实体反向查询语句,用于根据指定属性过滤条件和指定类别来反向查询对应的实体;
[0017]相关实体查询语句,用于查询与指定实体具有指定关系的实体;以及
[0018]实体间关系查询语句,用于查询两个指定实体之间的关系。
[0019]这样,可以预先设定不同的基本查询语句类型,并根据所接收到的抽象查询语言文本,解析出与其对应的基本查询语句的类型,然后以此类型进行查询操作。不同的基本查询语言和满足了用户对不同查询文本的精准查询的需求。这些基本查询语句的输入和输出之间都有直接的关联,容易从数据库或网页中实现其查询目的。
[0020]优选地,数据库包括:实体数据库,实体数据库中针对一个实体的记录包括实体数据字段和可变属性字段,在实体数据字段中存储有表示实体的实体数据,在可变属性字段中存储有描述实体的属性的实体属性数据;
[0021 ] 以及关系数据库,关系数据库中的每条记录包括两个节点和边信息,其中,在两个节点中分别存储有分别表示两个实体的两个实体数据,在边信息中存储有表示两个实体之间的关系的实体间关系数据。
[0022]这样,通过按照基本查询语句的输入数据与输出数据之间的关系来设置数据库的存储结构,使得能够更加方便快捷地执行基本查询语句。可以在数据库中对实体数据字段、可变属性字段、以及两个节点、边信息建立索引,以进一步提高查询的效率。
[0023]优选地,实体数据库中针对一个实体的记录还可以包括元信息字段,在元信息字段中存储有与实体相关的元信息,元信息是使实体区别于其他实体的信息。
[0024]在执行查询操作的步骤中,基于元信息来确定实体数据。
[0025]这样,作为实体数据中的核心信息数据,元信息,就将不同的实体和实体数据进行了区分,特别是相同实体名称的不同实体。以便,在对实体查询的时候可以准确的获得实体的相关信息,避免了其他不属于查询实体的信息出现而造成模糊查询的现象的发生。
[0026]优选地,数据库还可以包括类别数据库,在类别数据库中,对应地存储有多个实体类别数据和类别标签,多个实体类别数据被划分为多个层次,较低层次的实体类别数据从属于与其关联的较高层次的实体类别数据。
[0027]在实体数据库中针对实体的记录中的元信息字段中,存储有与描述实体的类别的实体类别数据对应的类别标签。
[0028]在执行根据实体反向查询语句的查询操作时,在实体数据库中检索满足下述条件的实体数据:
[0029]类别标签为表示指定类别的实体类别数据或者从属于表示指定类别的实体类别数据所对应的类别标签;并且
[0030]相应的实体属性数据满足指定属性过滤条件。
[0031]这样,可以通过识别到类别标签,以及满足过滤条件而执行反向确定实体数据的查询操作。
[0032]优选地,在类别数据库中,可以与每个实体类别数据关联地存储有针对该实体类别数据所表示的实体类别定义的实体属性。
[0033]执行根据实体反向查询语句的查询操作的步骤包括:
[0034]在指定属性过滤条件所涉及的指定属性属于为指定类别定义的实体属性的情况下,针对实体数据库执行根据实体反向查询语句的查询操作。
[0035]这样,在过滤条件和实体类别数据之间设立了判断条件,避免了多余的不适当的查询操作的执行,使得查询更加有针对性,更准确。
[0036]根据本发明的另一个方面,提供了一种信息查询设备,包括:
[0037]第一转换装置,用于将用户输入的自然语言查询文本转换为结构化的抽象查询语言语句;
[0038]第二转换装置,用于将抽象查询语言语句转换为基本查询语句或迭代的多个基本查询语句;
[0039]查询装置,用于针对预先准备的数据库,执行根据基本查询语句或迭代的多个基本查询语句的查询操作。
[0040]优选地,查询装置包括:
[0041]实体信息查询装置,用于执行实体信息查询语句,以查询与指定实体相关的信息;
[0042]实体属性查询装置,用于执行实体属性查询语句,以查询指定实体的指定属性;
[0043]实体反向查询装置,用于执行实体反向查询语句,以根据指定属性过滤条件和指定类别来反向查询对应的实体;
[0044]相关实体查询装置,用于执行相关实体查询语句,以查询与指定实体具有指定关系的实体;以及
[0045]实体间关系查询装置,用于执行实体间关系查询语句,以查询两个指定实体之间的关系。
[0046]优选地,数据库包括:
[0047]实体数据库,实体数据库中针对一个实体的记录包括实体数据字段和可变属性字段、元信息字段,在实体数据字段中存储有表示实体的实体数据,在可变属性字段中存储有描述实体的属性的实体属性数据,在元信息字段中存储有与实体相关的元信息,元信息是使实体区别于其他实体的信息,查询装置基于元信息来确定实体数据;
[0048]关系数据库,关系数据库中的每条记录包括两个节点和边信息,其中,在两个节点中分别存储有分别表示两个实体的两个实体数据,在边信息中存储有表示两个实体之间的关系的实体间关系数据;以及
[0049]数据库还包括类别数据库
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1