基于自然语言的位置查询系统以及基于关键词的位置查询系统的制作方法

文档序号:6610906阅读:208来源:国知局
专利名称:基于自然语言的位置查询系统以及基于关键词的位置查询系统的制作方法
技术领域
本发明通常涉及位置搜索引擎领域,更具体地,本发明涉及一种基于 自然语言的位置查询系统及其查询方法,一种基于关键词的位置査询系统 及其査询方法以及一种基于自然语言和关键词的位置查询系统及其査询 方法。
背景技术
随着移动通信网络的发展,特别是3G在中国开始的前夕,与人们日 常生活密切相关的本地査询服务在不久的未来将具有巨大的市场。此外,随着经济与技术的快速发展,人们的生活或工作越来越全球化。 当到达一个陌生的环境时,人们会需要关于酒店,汽车租赁,或者医疗服 务的信息。更特别地,人们甚至需要在新住处查找例如管道工人,饭店, 会计师或花匠等等。所以位置搜索非常重要。但是在当前的搜索引擎中,用户提交一个查 询请求后,经常不得不从很多结果中选取自己想要的答案。特别是用户利 用手机进行位置信息搜索的话,则因为手机的屏幕太小,手机键盘输入受 限,从而需要花费大量的时间翻页查找合适的结果。当前的搜索引擎并不 能够提供较为准确且高效的查询结果。首先,用户希望使用一种很自由的 査询方式(如格式不受限的自然语言),其次,用户希望系统能返回准确 简明的信息。存在一些向用户提供本地信息服务的已有的搜索引擎。例如,Google 本地搜索允许用户在一个特定的区域内査找商店和商业信息。Yahoo本地 搜索可以用来查找饭店,娱乐场所和商业信息。它们针对移动用户和网络 用户采用了相同的搜索机制,因此针对移动用户的本地搜索结果和利用电 脑进行本地査询的结果相同。
Mobile Info Search能自动从网页内容中收集位置相关的各种信息,如 单位名称,地址等,然后把这些信息与地图进行关联,最后提供给用户用 关键词的方式查询位置信息。
Answers Anywhere是一个中间件平台,通过SMS、 MMS、语音等交 互模式为无线设备的用户提供数据服务的直接访问。它提供了高级的自然 语言和文法辨识技术。
此外, 一些现有的专利专注于在信息服务系统中提供自然语言的处理 方法。
在美国专利US2002161587A1中提出了一种用于在基于位置的服务系 统中提供自然语言处理的方法。此系统能够接收语音请求并根据所述远程 终端的地理位置生成应答。
在中国专利CN1466367A中提出了一种移动的人知交互系统和方法。 用户可以通过手机来查询多领域的知识(比如天气信息,交通信息)。它 有两个优点1此系统允许用户使用自然语言进行查询。2此系统能够识 别并纠正用户査询中的拼写错误。
虽然移动用户偏好自由并准确地查询本地信息,但是不同的用户的搜 索偏好彼此不同。首先, 一个用户可以间接地搜索本地信息(比如用"好 吃"代替查询"饭店");其次,有些用户喜欢用自然语言搜索,另外的用 户喜欢用关键字搜索;第三,用户的查询可以是复合句;第四,用户的查 询可能较模糊。最后,当用户查询的时候,他可能添加或丢失一些字符, 甚至是在查询中存在语义的错误。
由于以上的情况,现有技术中存在着缺点。
Google和yahoo的本地搜索以及Mobile Info Search都是基于关键字 查询的搜索引擎,并不能处理自然语言查询。
尽管Answers Anywhere提供了自然语言查询,但难以处理位置服务 中灵活的间接査询和复合句查询,另外模糊处理和语义错误分析能力也较 弱。
专利US2002161587A1只提供了英语自然语言查询,而且该专利只考 虑了词性而并没有考虑较为丰富的语义信息。因此,在处理模糊查询和带 有语义错误的査询时受到限制。
专利CN1466367A是一个汉语问答系统,该系统并不能处理复合句、 关键词査询以及语义错误的分析。发明内容因此,考虑到上述问题提出本发明。本发明的目的是提供一种利用位 置本体库和位置査询语言库进行位置查询的系统和方法。其中位置本体库提供了丰富的关于位置信息的语义知识。位置查询语言库提供了语言规则 用来分析基于自然语言和基于关键字的査询。根据本发明第一方面,提出了一种基于自然语言查询的位置查询系 统,包括接收装置,用于从用户终端接收自然语言查询请求;访问装置,用于访问系统内部或外部的位置本体库和位置査询语言 库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置查询 语言库包括用于位置服务査询的语言模型; '自然语言査询处理装置,用于通过访问装置查找位置本体库和位置査 询语言库,对接收的自然语言查询请求进行模糊处理和间接处理中的至少 一个并从位置数据库中搜索出对应的位置信息;和发送装置,用于将所述位置信息发送到用户终端。根据本发明第二方面,提出了一种基于自然语言查询的位置查询方 法,包括接收步骤,接收用户通过用户终端发送的自然语言查询请求;自然语言查询处理步骤,通过查找位置本体库和位置查询语言库,对 接收的自然语言査询请求进行模糊处理和间接处理中的至少一个,并从位 置数据库中搜索出对应的位置信息;和发送步骤,将搜索到的位置信息发送到用户终端。根据本发明第三方面,提出了一种基于关键词査询的位置査询系统, 包括-接收装置,用于从用户终端接收关键词查询请求; 访问装置,用于访问系统内部或外部的位置本体库和位置査询语言 库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置查询
语言库包括用于位置服务査询的语言模型;
关键词查询处理装置,用于通过访问装置查找位置本体库和位置查询 语言库,对接收的关键词查询请求进行模糊处理和间接处理中的至少一
个,并从位置数据库中搜索出对应的位置信息;和
发送装置,用于将所述位置信息发送到用户终端。
根据本发明第四方面,提出了一种基于关键词查询的位置查询方法, 包括
接收步骤,用于从用户终端接收用户的关键词查询请求; 关键词查询处理步骤,用于通过查找位置本体库和位置查询语言库,
对接收的关键词查询请求进行模糊处理和间接处理中的至少一个,并从位
置数据库中搜索出对应的位置信息;和
发送步骤,将所述搜索出的位置信息发送到用户终端。 根据本发明第五方面,提供了一种基于自然语言和关键词的位置查询
系统,包括-
判断单元,判断从用户终端接收的查询请求是自然语言查询请求还是 关键词查询请求;
访问装置,用于访问系统内部或外部的位置本体库和位置查询语言 库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置查询 语言库包括用于位置服务查询的语言模型;
自然语言查询处理装置,用于通过访问装置查找位置本体库和位置查 询语言库,对接收的自然语言査询请求进行模糊处理和间接处理中的至少 一个,并从位置数据库中搜索出对应的位置信息;
关键词査询处理装置,用于通过访问装置查找位置本体库和位置查询 语言库,对接收的关键词査询请求进行模糊处理和间接处理中的至少一个 并从位置数据库中搜索出对应的位置信息;
发送装置,用于将所述位置信息发送到用户终端。
根据本发明第六方面,提供了一种基于自然语言和关键词的位置査询 方法,包括
判断步骤,判断从用户终端接收的查询请求是自然语言查询请求还是 关键词查询请求;
在用户的査询请求是自然语言査询请求时,包括
自然语言查询处理步骤,用于通过查找位置本体库和位置查询语言 库,对接收的自然语言査询请求进行模糊处理和间接处理中的至少一个, 并从位置数据库中搜索出对应的位置信息;
第一发送步骤,将所述位置信息发送到用户终端;和
在用户的査询请求是关键词查询请求时,包括-
关键词查询处理步骤,用于通过査找位置本体库和位置查询语言库, 对接收的关键词查询请求进行模糊处理和间接处理中的至少一个,并从位 置数据库中搜索出对应的位置信息;和
第二发送步骤,将所述位置信息发送到用户终端。
此外,根据本发明第一方面的基于自然语言査询的系统还可以进行复 合句分析和对包括有语义错误的査询的错误诊断处理。根据本发明第二方 面基于关键词査询的系统还可以进行错误诊断处理。
因此,根据本发明的基于自然语言的位置查询系统不仅可以执行复合 句查询、间接查询、模糊査询的分析处理,而且还能够实现对有语义错误 的查询的分析处理。根据本发明的基于关键词的位置查询系统不仅可以执 行对间接查询、模糊查询的分析处理,而且还能够实现对有语义错误的查 询的分析处理。根据本发明的基于自然语言和关键词的位置査询系统允许 用户使用自然语言或关键词的方式来访问同一接口,从而可以针对不同用 户的偏好以及需求,更为灵活,准确和简明地提供用户所需的位置信息, 同时提高了用户查询的自由度,并改进了已有的搜索系统中存在的缺点。


通过以下结合附图,对优选实施例的描述,本发明的这些和/或其他 目的和特征将变得更加清楚而且更为容易理解,其中-
图1是根据本发明的基于自然语言查询的位置查询系统的方框图; 图2是根据本发明的基于自然语言査询的位置搜索方法的流程图; 图3是根据本发明的基于关键词查询的位置査询系统的结构图; 图4是根据本发明的基于关键词查询的位置搜索方法的流程图; 图5a示出了根据本发明的位置本体库的示意性结构;
图5b示出了根据本发明的位置本体库的类别表和实体表的一个例
子;
图5c示出了根据本发明的位置本体库的概念部分的一个例子; 图5d示出了根据本发明的位置本体库中的属性部分和关系部分的一 个示例;
图5e示出了根据本发明的位置本体库中的公理部分的一个示例; 图5f示出了根据本发明的位置本体库中的位置概念空间的示意结构
图6示出了根据本发明的位置查询语言库的示意性结构;
图7是根据本发明的答案融合和生成单元融合并生成答案的示意图8是根据本发明的答案模板的结构示意图9a是根据本发明的自然语言查询处理装置对自然语言查询进行处 理的一个示例;
图9b是根据本发明的自然语言查询处理装置对包括复合句的自然语 言查询进行处理的另一个示例;
图10是根据本发明的关键词查询处理装置对关键词查询进行处理的 一个示例;
图lla是基于自然语言的位置查询系统执行的查询的一个示例; 图llb是基于关键词的位置査询系统执行的査询的一个示例; 是12根据本发明另一个实施例的基于自然语言查询的位置查询系统 的方框图13是根据本发明另一个实施例的基于关键词查询的位置查询系统 的结构图14a是根据本发明的基于自然语言和关键词的位置搜索系统的方
框图14b示出了基于自然语言和关键词的位置搜索系统中的处理装置 的另一实施例;
图15是根据本发明的位置本体库生成方法的流程图16是根据本发明的位置查询语言库生成方法的流程图。
具体实施例方式
下面,将参考附图描述本发明的优选实施例。在附图中,相同的元件 将由相同的参考符号或数字表示。此外,在本发明的下列描述中,将省略 对己知功能和配置的具体描述,以避免使本发明的主题不清楚。
图1示出了根据本发明的基于自然语言查询的位置査询系统的方框
图。参考图1,位置查询系统包括用户接口 1,存储单元2,位置数据库3, GIS接口 32和自然语言查询处理装置4。
位置数据库3包含位置服务中所有地理实体的详细数据,其中存放位 置服务中的空间信息及普通信息。空间信息包括地图中所有实体的位置标 签。 一个点由经度和纬度描述。 一条路或者一个^fe区由一序列韵点来描述, 其中每个点由经度和纬度描述。普通信息包括所有实体的静态信息(比如, 地址,电话号码,产品/服务信息等等)。位置数据库3能够从电子地图, 黄页以及一些重要的知识源中产生。
GIS接口 32用来计算位置数据库中的空间信息。GIS接口 32由GIS 函数实现。目前,流行的GIS (地理信息系统)平台包括Supermap, Mapinfo, Arclnfo等。基于空间信息的GIS函数用来计算和获取空间信息(比如, 空间位置,邻近信息)。一个GIS函数定义成FuncName(p1,p2,...pm),其中 FuncName是GIS函数的名字,Pl, p2,...pm为参数。 一些GIS函数的例子 如下-
1. GISLocation(X)用作GIS位置函数,用来查找空间位置X。比如, GISLocation(海龙大厦)的值为"中关村大街西南137米处,海淀中路东北 580米处"。
2. GIS Near(X, Y, Z)用作GIS邻近函数,用来查找目标位置附近信 息。比如,"GISNear(创新大厦,银行,500)是査找创新大厦附近500米内 有哪些银行。
3. GISPath(X, Y, Z, P)用作GIS路径规划函数,基于实时或历史交通 信息和交通规则,用来査找从X点到Y点最近、最快的路线。X点是起 始点,Y点是终止点,Z点是一序列的途经点,P是交通方式"开车"或 者"公交车"。
用户接口 1包括査询接收器11和答案发送器12,用户通过査询接收
器11向位置查询系统发送来自移动终端5的自然语言查询请求,并通过
答案发送器12接收查询结果,移动终端5可以通过SMS、MMS、 WAP,语 音等查询方式来查询位置信息。用户也可以通过WEB方式查询位置信息。 此外,本发明并不限于移动终端5,也可以是可以进行查询的其它的用户 终端。存储单元2存储有位置本体库21和位置査询语言库22。位置本体 库21包括用于处理位置查询的领域知识,如图5a所示。位置查询语言 库22包括用于处理位置査询的语言模型,图6示出了位置查询语言库的 示例结构。
随后将对本发明的位置本体库和位置查询语言库进行详细描述。自然 语言查询处理装置4包括自然语言查询分析装置401 , DB搜索单元46, 答案融合与生成单元47和访问单元(未示出)。该访问单元设置在自然语 言查询分析装置401和存储单元2之间,用于向自然语言查询分析装置 401提供对位置本体库21和位置查询语言库22的访问。自然语言查询分 析装置401用于利用访问单元访问位置本体库21和位置查询语言库22来 处理用户的自然语言查询请求并返回查询动作,其包括分词单元41,模 糊处理单元42,间接处理单元43和语言匹配单元44。自然语言查询处理 装置4对接收到用户的自然语言査询进行处理并向用户接口1发送查询结 果。
在通过用户接口 1接收到用户的自然语言查询请求之后,自然语言查 询分析装置401中的分词单元41通过访问单元查找位置本体库的类别表 (用于描述位置本体库中所有的地理类别)和实体表(用于描述位置本体 库中所有的地理实体)以及位置查询语言库的常量表对用户的自然语言查 询请求进行分词,从而获得查询请求的文法特征。模糊处理单元42基于 句子分词获得的文法特征,对查询请求中出现的包括冗余描述和不完整描 述的模糊描述进行模糊处理。
模糊处理采用的方法包括(1)冗余词的识别和处理(2)补充有用的 字符和词。(3)基于用户的查询历史,利用上下文相关技术,等等。间 接处理单元43在查询请求中包含间接描述时,通过访问单元从位置本体 库的类别表中的同义词中査找与间接描述对应的类别名。语言匹配单元 44用于将用户的査询请求和查询语言库中的查询语言进行匹配,从而得
到査询动作。
之后,DB搜索单元46根据生成的查询动作,或直接搜索位置数据 库3,或利用GIS函数32间接地搜索位置数据库3,从而找到相应的位置 信息。答案融合与生成单元47将搜索到的位置信息进行融合并利用例如 图8所示的答案模板生成文本査询答案并通过用户接口1将其发送到移动 终端5。图7示出了根据本发明的答案融合和生成单元47融合并生成答 案的示例。
虽然图1示出位置本体库21和位置查询语言库22位于位置查询系统 的内部,但是对于本领域的普通技术人员来说显而易见的是位置本体库 21和位置查询语言库22可以位于该位置查询系统的外部。从而该位置查 询系统通过访问单元访问外部的位置本体库21和位置查询语言库22来对 自然语言査询进行分析处理。在图1所示的示例中,自然语言查询分析装 置401可以同时执行模糊处理和间接处理,但是很明显的,自然语言査询 分析装置可以只包括间接处理单元和模糊处理单元之一,从而仅执行模糊 处理和间接处理中的一个。
由于基于本发明的新的位置本体库21和位置查询语言库22,可以实 现对模糊的自然语言查询请求或间接的自然语言查询请求进行处理,所以 下面将分别参考图5a至图5f和图6对本发明的位置本体库和位置査询语 言库进行描述,之后再结合位置本体库和位置查询语言库对本发明的位置 查询系统执行的位置搜索过程进行详细描述。
图5a示出了根据本发明的位置本体库的示意性结构。如图5a所示, 位置本体库由多个领域本体和一个映射本体组成。每个领域对应于一个领 域本体,用来记录该领域的语义知识,例如地图领域对应于地图领域本体, 黄页领域对应于黄页领域本体。映射本体用来记录不同领域本体中的概念 之间的各种关联。
领域本体包含四部分概念部分、属性部分、关系部分和公理部分。 (1)概念部分
概念部分用于描述该领域中所有的地理实体及地理类别,其存储在类 别表和实体表中。图5b示出了类别表和实体表的一个例子。类别提供了 位置信息的一个层次分类结构。如图5b所示,类别表中的每个类别表示 为(名称,类型,父类,同义词)。每个类别的类型按照从粗到细划分为 基础类、扩展类和连锁店。所述三种类型中的基础类是位置信息中最大的 类别(如饭店、学校、大厦等);扩展类是基础类的延伸或细化(如快餐 店属于饭店);连锁店是最细的类别(如肯德基属于快餐店)。类别表中的父类用来描述类别间的隶属关系,例如肯德基的父类是快餐店。另外由于 大量的词具有相同的含义,所以每个类别还总结有一些同义词,例如,对 于饭店这一类别来说,其同义词可以是餐厅,餐馆,酒楼,吃饭,好吃等 等。此外,每个类别的同义词还可以例如是英文同义词。如图5b的实体表所示,实体是一个具体的地点,每个实体表示为(名 称,父类),其中所述"父类"指示了实体和类别之间的层次关系。每个 实体都隶属于一个类别,例如肯德基中关村店(实体)属于肯德基(类别)。 所有的实体被定义在实体表中。(2) 属性部分属性定义了概念的性质,用于描述地理实体的属性。例如,地址、电 话等。每个属性至少有一个项'类型'来表明属性的取值类型,例如电话 的类型为数字。(3) 关系部分关系描述了概念间的各种关联,g卩,定义了概念之间的语义关系和空 间关系。如isa(x, y)用来描述类别和实体之间以及类别和类别之间的隶属 关系,即x隶属于y,例如,"isa(肯德基,快餐店)"表示"肯德基"隶属 于"快餐店";再如geo-part-of(x, y)用来描述x在地理位置上是y的一部 分,举例NEC中国研究院(x)是创新大厦(y)的地理部分(因为NEC中国 研究院位于创新大厦内)。由于每个属性或者关系定义了概念的某个方面, 从而多个属性和关系可以描述一个概念的整体。(4) 公理部分。公理部分是基于概念及关系的规则,可进行进一步的推理。如 geo-part-of(x, y) & south-of(y, z) ■> south-of(x, z),例如NEC中国研究院是 创新大厦的地理部分,并且创新大厦在清华大学的南边,那么能推理出 NEC中国研究院也在清华大学的南边。公理部分中的规则一般是有限的, 可以根据需要进行扩充。公理通常由人工组织并确定。
映射本体只包含关系部分,具体包括同义映射关系、语言映射关系和 空间映射关系。这些关系描述了不同领域本体中的概念之间的关系。同义映射关系在同义词或縮略语之间进行映射,例如"synonymous(银 行,储蓄所)"表示二者是同义词,其中银行和储蓄所分别是地图本体和 黄页本体中的类别。语言映射关系在同一概念的不同语言翻译之间进行映 射,例如"Chinese-English(路,Road)"表示后者是前者的英文翻译,其 中路和Road分别是地图本体和自驾本体中的类别。空间映射关系在空间 相关的概念之间进行映射,例如"near(银谷大厦,保福寺站)"表示二者 距离很近,其中银谷大厦和保福寺站分别是地图本体和公交本体中的实 体。图5c示出了根据本发明的位置本体库的领域本体的概念部分的一个 例子。例如,对于类别"路",其类型是基础类,隶属于类别"路"的实 体为"二环路"。以及,对于类别"大学",其类型是扩展类,隶属于类别 "大学"的实体为"清华大学",而对于类别"家乐福",其类型是"连锁 店",而隶属于类别"家乐福"的实体为"家乐福中关村店"。图5d示出了根据本发明的位置本体库中的领域本体的属性和关系的 一个示例。例如,对于"起点",其类型为路的属性,属性值举例"学知 桥"。对于"电话",其类型为"属性",属性值举例为010-62705962,等 等。以及对于isa(x,y),其类型为关系,关系值举例"isa(中国银行,银行)"。图5e示出了根据本发明的位置本体库中的领域本体的公理部分的示 例。根据图5e中所示的公理部分,就可以进行语义关系和空间关系等的 推理。图5f示出了位置本体库的部分位置概念空间。该位置概念空间是根 据概念部分中的类别表和实体表自动生成的。如图5f所示,位置概念空 间由一组概念(包括类别和实体)和概念间的关系组成,所述箭头指示了 起点(概念)和终点(概念)之间的关系。位置査询语言库由多个领域査询语言和一个公用查询语言组成。每个 领域对应于一个领域查询语言,用来记录该领域的语言模型,如地图领域 对应于地图领域查询语言,自驾领域对应于自驾领域查询语言。公用查询 语言总结了各领域查询语言的共同査询特征,它可以被领域查询语言进行 参数继承。因此位置查询语言库具有层次结构。
图6示出了位置查询语言库的一个示例。领域査询语言和公用査询语 言的表示方法是一样的。查询语言包括两部分文法部分和动作部分。(1)文法部分描述了位置服务中用户所有可能的查询方式,其提供 了一个语法定义系统,文法部分中的文法描述类似于上下文无关文法,它 记录了用于位置查询的所有文法。文法部分包括一个常量表,该常量表包 含文法部分中的常数定义,包括各类名词、动词、疑问词等。 在文法中定义了一些特殊的符号。* T指的是"或"逻辑运算。參"<X>"指X是文法名称,并能够在文法中找到其定义。* "<!X>"指X是一常量,它可以被相应的词代替。在常量表中 能找到X的定义,X由类型,词性和包含的词集组成。* "〈 X^,指X是一概念,它能被在位置本体库中任何的类别或实 体代替。* 〈 X(conSjl…lconsJ〉指X是一概念,conSi(i-l…m)是一约束条 件,并且X只能被位置本体库中满足任意一个约束条件cons; 的概念代替。例如,〈Cl(geo-entity)〉只能被位置本体库中的实体代替。* "[]"指的是在"["和"]"中间的内容在当前文法中可有可无。* "{< 乂>}"是查询变量的集合。它可以匹配多个有并列关系的概 念。* "<#X>"指X是一个参数,可以由其他文法通过该参数的赋值 来继承当前文法。* "<X1>=<X2(Y=Z)>"指XI的文法通过将X2中的参数Y赋值 为Z,来继承X2的文法。(2)动作部分描述了各査询文法对应的查询动作,其定义了一组査询 处理规则,每个规则有一个条件和相应的查询动作, 一般用于指明"当用 户査询符合某文法时,生成什么样的査询动作"。动作部分中的查询动作 是系统对用户查询的理解结果。通常由人工定义每种文法的查询动作。例如,"isSyntax(x)"是最通用 的条件,指的是用户查询是否与文法x匹配。
位置查询语言有四个重要的特征1. 使用较少的文法可以覆盖较大数量的查询。2. 为自然语言查询分析和关键字査询分析提供语言模型。3. 可以表达复合句。"{< X>}"使得文法能够匹配一个查询句子中的 复合概念。4. 可以通过比较用户查询的内容和位置查询语言库中的査询文法,分 析用户査询中的语义错误。下面将结合位置本体库21和位置査询语言库22对本发明的位置查询 系统执行的位置搜索过程进行描述。图2示出了基于自然语言查询的位置 搜索方法的流程图。如图2所示,在S201,在通过用户接口 1接收到用户的自然语言査 询请求之后,自然语言查询分析装置401中的分词单元41用于对用户的 自然语言査询请求进行分词,具体地,通过访问单元查找位置本体库的类 别表和实体表从而识别出自然语言查询请求中的概念并判断其类型,以及 通过访问单元查找位置查询语言库的常量表识别出自然语言査询请求中 的非概念并判断词性和其类型。模糊处理单元42在S202基于句子分词获得的文法特征,对查询请求 中包括冗余描述和不完整描述的模糊描述进行模糊处理,模糊处理采用的 方法包括(1)冗余词的识别和处理,即,基于语法特征删除多余的词(包 括请求词,辅助词,和无意义的副词)。(2)补充有用的字符和词。对于 不完整的实体,基于部分匹配技术提供一种方法。本发明提出了一种部分 匹配的方法来找到全名。首先,从用户查询的分词结果中找到未识别词。 之后,对未识别词基于一个常用词典进行更细粒度的分词,然后,通过访 问单元从位置本体库中找出包含上述词的所有实体。最后,考虑到移动终 端例如手机的屏幕较小,如果存在多个选项实体时可以仅仅选择具有最短 长度的实体。比如在用户查询"创新"时,由于"创新"是一个不完整的未 登录词,所以用"创新大厦"来代替。(3)基于用户的査询历史,使用上下 文相关技术。首先,检查当前的查询是否完整。之后,若发现査询不完整, 则从用户的历史査询中找到最近的记录,并添加丢失的词组。在S203,间接处理单元43在查询请求中包含间接描述时,通过访问单元从位置本体库的类别表中的同义词中查找与间接描述对应的类别名。在S204,语言匹配单元44用于将用户的查询请求和查询语言库中的 文法进行匹配,从而得到查询动作。査询语言匹配包括从位置查询语言 中获得与用户查询完全匹配的文法(不需要严格按照词的顺序)。查询语言的匹配过程可以是自顶向下先匹配公用査询语言的文法,若有匹配的公用查询语言,则根据其中的参数值,再匹配可继承该语言的领域査询语言的文法;若没有可匹配的公用查询语言,则直接匹配各领域査询语言的 文法。査询语言的匹配过程也可以是自底向上先匹配各领域査询语言再 匹配公用查询语言。应该注意到一组并列的概念可以与文法中的"^ X"" 匹配。根据匹配的文法,为用户的査询请求创建动作。此外,在文法的概 念约束判断中,有时需基于位置本体库来推理。例如某文法描述饭店的招 牌菜,若用户查询"肯德基中关村店有啥招牌菜",则需经过推理才能得 知肯德基中关村店是饭店,满足该文法的概念约束。推理中需利用今关系isa(肯德基中关村店,肯德基)今关系isa(肯德基,快餐店)々关 系isa(快餐店,饭店)公理isa(x,y) & isa(y,z)—isa(x,z) 在匹配过程中,如果找到了匹配文法,但不满足匹配文法中的概念约 束,则可以查找位置本体库中的映射本体,对査询中的相关描述进行转换, 使其满足相应的概念约束。例如用户查询"从银谷大厦到中关村怎么坐公交",其匹配文法为"< (^1(公交车站)>;<!到达介词>;< 02(公交车站)>; <!怎么疑问词>;[<!乘坐动词>];<!公交名词>",但"银谷大厦"属于类 别"大厦",不属于"公交车站",则需利用映射本体中的空间映射关系 "near(银谷大厦,保福寺站)",将"银谷大厦"转换为"保福寺站"。在S205, DB搜索单元46根据生成的查询动作,直接搜索位置数据 库3或利用GIS函数间接地搜索位置数据库3,从而找到相应的位置信息。 如果用户查询的是一般的静态信息(比如,地址,电话号码,和企业的产 品/服务信息,等等),可以直接地搜索位置数据库3。如果用户査询空间 信息(比如,位置,邻近或路线信息,等等),则根据查询动作,使用GIS 函数搜索位置数据库3。对于每个查询动作,规定了对应的査询方法。例
如1) QueryLocation(X):如果X的地址值不是空值,获得所述值,此外 还调用GIS函数"GISLocation(X)"给用户提供更多的位置信息。 QueryLocation(X)的值包括 Al=GetValue(X, address) 和 A2=GISLocation(X),其中GetValue(X, A)表示获得X的属性A的 值。比如,QueryLocation(海龙电子大厦)包括Al—'北京市海淀区 中关村大街1号"和A2一'中关村大街西南137米处,海淀中路东 北580米处";2) QueryNear(X, Y):在X附近可能存在多个可选实体,因此仅提供 GISNear(X, Y, 500)函数的值;3) QueiyNearest(X, Y):为了提供给用户更多的位置信息,除提供离X 最近的实体的名称外,还提供其地址信息。QueryNearest(X, Y)的 值包括Al=GISNearest(X)和A2=GetValue(Al, address)。比如, QueryNearest(创新大厦,银行)的值包括了 Al—'中国银行"以及 A2^"海淀区中关村东路,清华科技园1号";4) QueryPath(X, Y):用户想到达Y,此时他也需要Y的空间信息。因 此QueryPath(X, Y)的值包括了 Al=GISPath(X, Y, NULL, driving) 和A2=GISLocation(Y)。执行数据库査询之后,需要融合搜索的结果并产生最终的位置查询答 案。在S206,答案融合与生成单元47将搜索到的位置查询答案进行融合, 融合包括融合多个搜索动作。 一个查询动作可能包括多个搜索动作,从 而需要针对每个查询动作融合搜索动作。例如QueiyNearest(X, Y)包括两 个搜索动作"GISNearest(X)"和"GetValue(A1, address)"。在答案融合与 生成单元47融合搜索动作之后,在S207利用针对每个査询动作定制的多 语言答案模板生成最终的位置查询答案并经用户接口1发送到移动终端5 进行显示。图7示出了融合位置査询答案的示例。图8示出了答案模板的 一个示例。图9a是根据本发明的自然语言査询处理装置对自然语言查询进行处 理的一个示例。下面,以用户输入的自然语言查询请求"请告诉我清华附 近有什么好吃的"为例,对本发明的位置查询系统进行说明。在自然语言
査询分析装置401通过用户接口 1接收到所述査询请求时,由分词单元41通过访问单元访问位置本体库21和位置查询语言库22对该查询请求 进行分词请告诉我(请求词)清华(未识别词)附近(附近副词)有(拥有动 词)什么(什么疑问词)好吃(类别)的(助词)。之后,模糊处理单元42根 据分词后的査询请求进行删词和补词处理,将请求词"请告诉我"和助词"的"删除,并通过访问单元查找位置本体库中的实体表将"清华"一词 补充为"清华大学",从而所述的查询请求变为"清华大学(实体)附近(附 近副词)有(拥有动词)什么(什么疑问词)好吃(类别)"。间接处理单元43 对上述结果进行间接分析,通过访问单元来搜索位置本体库21中的类别 表,从类别表中的同义词一栏中找到"好吃" 一词的同义词是"饭店", 从而向语言匹配单元44输出处理后的査询请求"清华大学(实体)附近 (附近副词)有(拥有动词)什么(什么疑问词)饭店(类别)。语言匹配单元 44将用户的査询语言与位置查询语言库22进行匹配,找到匹配文法"<NearNeighborQuery> =<(20!11111011(^16172(<#副词>=[<!附近副词>])> ", 其中"〈CommonQuery2〉-(〈?Cl(geo-entity)"〈弁副词〉(〈?C2(geo-categoryl geo-entity)"[〈!位于动词l!拥有动词〉]卜!地点疑问词l!什么疑问词y,并 生成査询动作QueryNear(清华大学,饭店)。之后,DB搜索单元46接收 所述的査询动作并基于所述的查询动作直接或间接地搜索位置数据库中 与查询动作相关的信息,并生成搜索结果例如"六道口郭林家常菜饭店, 五道口必胜客餐厅,五道口肯德基快餐店"。答案融合与生成单元47将搜 索结果进行融合,并生成答案"五道口必胜客餐厅和肯德基快餐店,六 道口郭林家常菜"。所生成的答案经过用户接口 1发送到用户的移动终端 上以便显示。图lla示出了基于自然语言的位置查询系统执行的查询的一 个示例。图3示出了根据本发明的基于关键词查询的位置査询系统的示意图。 参考图3,位置査询系统包括用户接口 1,存储单元2,位置信息库3, GIS接口 32和关键词查询处理装置6。位置数据库3用于存放位置服务中 的空间信息及普通信息,GIS接口 32用来计算位置数据库中的空间信息。用户接口 1包括査询接收器11和答案发送器12。存储单元2存储有 位置本体库21和位置查询语言库22。位置本体库21存储了包括用于处
理位置查询的领域知识。位置查询语言库22包括用于定义位置服务的查询语言模型。关键词査询处理装置6包括关键词査询分析装置402, DB 搜索部分46,答案融合与生成单元47和访问单元(未示出)。该访问单 元设置在关键词查询分析装置402和存储单元2之间,用于向关键词查询 分析装置402提供对位置本体库21和位置査询语言库22的访问。自然语 言査询处理装置402通过访问单元查找位置本体库21和位置查询语言库 22处理用户的关键词査询,并返回答案,包括分词单元41,模糊处理单 元42,间接处理单元43,文法部分匹配单元44',答案决策单元45。关键词查询分析装置402中的分词单元41用于将用户的关键词査询 请求进行分词,具体地,通过访问单元检索位置本体库的类别表和实体表 从而识别出关键词查询请求中的概念并判断其类型,以及通过访问单元检 索位置查询语言库中的常量表识别出关键词查询请求中的非概念并判断 词性和其类型。模糊处理单元42对接收的关键词中包括冗余描述和不完整描述的模 糊描述进行模糊处理采用的方法包括(1)冗余词的识别和处理,即,基 于语法特征删除多余的词(包括请求词,辅助词,和无意义的副词)。(2) 补充有用的字符和词。当用户输入了关键词时,可能会丢失若干个汉字。 本发明提出了一种部分匹配的方法来找到全名。首先,如果分词后得到了 未识别词,则在此将关键词基于一个常用词典进行更细粒度的分词,之后, 通过访问单元从位置本体库中找出包含上述词的所有实体。例如当用户查 询"海龙大厦存钱啊",分词单元41得到的结果是"海龙大厦(未识别 词)存钱(类别)啊(语气词)",因为"海龙大厦"是未识别词,所以 对其再度分词得到"海龙大厦",然后通过访问单元检索位置本体库, 发现"海龙电子大厦"包含词"海龙"和"大厦",至此部分匹配成功。 最后,考虑到移动终端例如手机的屏幕较小,如果存在多个选项实体时可 以仅仅选择具有最短长度的实体。间接处理单元43在查询请求中包含间接描述时,通过访问单元从位 置本体库的类别表中的同义词中查找与查询请求对应的类别名。文法部分匹配单元44'用于通过访问单元访问位置查询语言库,得 到与用户查询部分匹配(不是完全匹配)的文法集合。其包括从位置查 询语言库中获得包含用户查询中所有关键词的文法。需要注意一组并列的 概念可以匹配文法中的"{< 乂>}"。答案决策单元45用于根据预定的决策规则,选择最优匹配,生成查询动作或与用户进行交互。当用户利用关键词进行查询时,多个文法可能 被部分匹配,以及多个文法可能存在相同的动作,因此需要删除那些冗余 的文法并确定最终的答案。如果文法和査询完全匹配,选择该文法并且产 生相应的动作。如果文法和查询不能完全匹配,但存在若干个包含查询中 的所有关键词的文法,则需要通过匹配的程度确定最优解(最优答案)。 如果一个文法与其他文法相比较,具有最高的匹配程度,则选择该文法并 且创建相应的动作,否则产生所有可能的查询,之后与用户交互来让用户 自己选择。同自然语言查询系统的语言匹配单元44类似,答案决策单元45在匹 配过程中,如果找到了匹配文法,但不满足匹配文法中的概念约束,则可 以查找位置本体库中的映射本体,对查询中的相关描述进行转换,使其满 足相应的概念约束。虽然图3示出位置本体库21和位置查询语言库22位于位置查询系统 的内部,但是对于本领域的普通技术人员来说显而易见的是位置本体库 21和位置査询语言库22可以位于该位置查询系统的外部。从而位置査询 系统可以通过访问单元访问外部的位置本体库21和位置查询语言库22来 对关键词查询进行分析处理。此外,图3中的实例示出关键词查询分析装 置402可以同时执行模糊处理和间接处理,但是该关键词查询分析装置也 可以仅包括间接处理单元和模糊处理单元之一,从而执行模糊处理和间接 处理中的一个。图4示出了根据本发明的基于关键词查询的位置搜索方法的流程图。 在S401,基于关键词查询的位置査询系统接收用户的移动终端5发送的关 键词查询请求。在S402,分词单元41将接收到的査询请求分词。分词单元41通过 访问单元检索位置本体库21的类别表和实体表识别出概念并判断其类 型;以及通过检索位置査询语言库22中的常量表识别出非概念并判断其 词性和类型。由于利用了位置本体库21和位置查询语言库22,所以可以
分析出更多的文法特征,从而更准确地进行搜索。在查询请求输入的概念模糊时,在S403,模糊处理单元43利用分词 后的句子获得的文法特征,通过访问单元利用位置本体库21对用户的查 询请求中包括冗余描述和不完整描述的模糊描述进行模糊处理,包括冗余 词的识别及处理,不完整词的判断及补全和上下文相关技术等。在S404,间接处理单元43通过访问单元从位置本体库21的类别表 中查找与关键词查询中的间接描述对应的类别名。在S405,文法部分匹配单元44'通过访问单元将査询请求与位置查 询语言进行部分匹配,得到匹配文法集合。在S406,答案决策单元45根据预定的决策规则,从匹配文法集合中 选择最优匹配文法并生成查询动作;或者生成所有可能的查询以便通过与 用户交互来让用户进行选择,并根据用户的选择生成对应查询动作。之后,在S407, DB搜索单元46直接搜索位置数据库3或利用GIS 接口搜索位置数据库3,以查找与用户的查询请求对应的位置信息。在S408,答案融合与生成单元47将搜索到的位置信息进行融合并生 成答案。在S409,答案融合和生成单元47通过用户接口 l将答案发送到移动 终端5进行显示。图10是根据本发明的关键词查询处理装置对关键词査询进行处理的 一个示例。例如,当用户的查询请求为"海龙大厦存钱啊"时,由分词 单元41通过访问单元利用位置本体库21和位置查询语言22将该查询请 求进行分词,得到海龙大厦(未识别词)存钱(类别)啊(语气词)。之后, 模糊处理单元42通过访问单元査找位置本体库21和査询语言库22删除 "啊"并将"海龙大厦" 一词补充为"海龙电子大厦"。间接处理单元43 通过访问单元査找位置本体库21中的类别表将査询请求中的间接描述 "存钱"转换为直接描述"银行",得到海龙电子大厦(实体)银行(类 别)。之后文法部分匹配单元44'从位置查询语言中找出匹配文法,包括〈CommonQuery2>={〈?Cl (geo-entity) 〉} <#副词> {< C2 (geo-category Igeo-entity)"[〈!位于动词l !拥有动词〉][〈!地点疑问词i!什么疑问词 〉]<NearNeighborQuery>=〈CommonQLiery2 (<#副词>=[<!附近副词>]) <NearestNeighborQueir>=<CommonQuery2 (<潮词〉=<!最近副词》 答案决策单元45选择〈NearNeighborQuery〉的文法,因为可以完全匹 配,并生成相应的查询动作QueryNear(海龙电子大厦,银行)。DB搜索单 元46搜索位置数据库3中的位置信息,经答案融合和生成单元47对搜索 到的位置信息进行融合,从而生成最终的答案文本,并通过用户接口 l发 送到移动终端5以便显示。图lib示出了基于关键词的位置査询系统执行 的查询的一个示例。图12是根据本发明另一个实施例的基于自然语言查询的位置查询系 统的方框图,其与图1的区别在于该位置查询系统还包括复合句处理单元 48以及错误诊断单元49。由于图12中其它的单元与图1所示的相同的附 图标记所表示的单元功能相同,所以省略对其的描述。通常,用户输入的 自然语言査询请求可能是复合句,复合句可以是包括多个组合句子的复合 句,例如,"告诉我创新在哪里,存钱哪儿最近?"。复合句也可以是包括 多个并列的概念的复合句,例如,"创新大厦和海龙大厦在那里?"。复合 句处理单元48利用位置查询语言库22对用户输入的自然语言査询请求中 包括的复合句进行分析处理。首先复合句处理单元48根据标点符号及位 置查询语言将复合句拆分为多个单句,再由分词单元41至语言匹配单元 44进行下一步处理。图9b示出了根据本发明的自然语言查询处理装置对 包括复合句的自然语言查询进行处理的一个示例。错误诊断单元49通过访问单元利用位置本体库和位置査询语言依据 预定的规则识别并分析用户查询中的语义错误。语义错误包括l)类别错 误和2)不完全错误。对于l)类别错误,错误诊断单元49检査用户的查 询请求中的每个变量是否满足其约束。对于用户的查询请求,首先查找最 相似的文法,之后将查询请求和文法进行匹配并得到变量和其约束。如果 一个变量不满足其约束,则错误诊断单元49就判定该查询请求是类别错 误。可以向用户提供错误信息和帮助信息来与用户交互。比如,用户査询 请求是"银行在哪里",并且最相似的文法是"K C (geo-entity) 〉} <!位于 动词〉〈!地点疑问词〉",但是"银行"是一个类别,并不满足它的约束 "geo-entity"(地理实体),因此,此查询有语义错误,因为银行不是一
个具体的地理实体。对于2)不完整错误,错误诊断单元49基于位置查询语言检查用户查询请求是否完整。对于用户的查询,首先查找最相似的 文法,如果用户查询是该文法的子集,此査询就不完整。如果在上下文或 者用户的査询历史中或者其他地方都找不到缺少的信息,此査询请求就存 在不完整错误。可以向用户提供错误信息和帮助信息来与用户交互。例如, 用户的查询请求是"怎么去创新大厦",并且最相似的文法是"〈?C1 (geo-entity) 〉 [〈!怎么疑问词〉]〈!到达介词〉〈?C2 (geo-entity) >", 但是此处缺少" C1"。如果无法得到用户当前位置,而且起始点也不在上 下文中,则错误诊断单元49确定此査询有语义错误,其错误信息为缺少 起始点,并将错误信息发送到答案融合与生成单元47,答案融合与生成 单元47将诊断出的错误发送到移动终端5。由于该系统可以对复合句査 询请求进行处理,所以答案融合与生成单元47针对与用户的复合句查询 请求对应的多个查询动作,在为每个查询动作融合搜索动作之后,融合所 有查询动作的査询结果。例如查询请求"创新大厦和海龙大厦最近的饭 店?"包含两个查询动作"QueryNearest(创新大厦,饭店)"和 "QueryNearest(海龙大厦,饭店)"。答案融合与生成单元47需要对上述两 个查询动作的查询结果进行融合。图13示出了根据本发明另一个实施例的基于关键词查询的位置查询 系统的示意图。其与图2的区别在于图13所示的位置查询系统还包括错 误诊断单元49,用于根据预定的规则通过访问单元利用位置本体库和位 置查询语言识别并分析用户的关键词查询中的语义错误。错误诊断单元 49将错误结果发送到答案融合与生成单元47,答案融合与生成单元47将 诊断出的错误发送到移动终端5,以便与用户进行交互。图14a和14b示出了根据本发明的基于自然语言和关键词的位置査 询系统的两个实施例。如图14a所示,所述的系统包括用户接口 1,存储 单元2,位置数据库3, GIS接口32,以及处理装置包括判断装置7,自 然语言查询处理装置4和关键词査询处理装置6。所述存储单元2包括位 置本体库21和位置查询语言库22。此外,由于已经结合图l,图12和图 3,图13分别对自然语言查询处理装置4和关键词查询处理装置6进行了 描述,这里将省略对其的描述。判断装置7用于根据用户问句特点,判断
从用户终端接收的查询请求是自然语言査询请求还是关键词查询请求。如 果是自然语言查询请求,则由自然语言查询处理装置4对该自然语言查询 请求进行处理并生成位置查询的答案,如果是关键词查询请求,则由关键词査询处理装置6对该关键词查询请求进行处理并搜索到位置查询的答 案。之后,将答案通过用户接口 l发送到用户终端5。在判断装置7判断用户查询是基于自然语言还是关键词时需要根据 用户问句特点对用户的査询请求进行分类。 一般来说,自然语言查询和关键词查询的问句特点有(1) 关键词查询可以含有一些逻辑运算符,例如""(空格),"和","或","+ "和";"等:。关键词查询可以.由多个以运算符间隔的字符串 组成,每个字符串包括一个或多个连续的词。(2) 自然语言查询是一个连续的字符串,通常包括多个词。中间也 可能有逻辑运算符,但是做别的意思用,例如"和"可作连词用。此外, 自然语言查询通常包括疑问词(例如,哪里,什么,何时等)。判断装置7所采用的第一种判断方法是基于逻辑运算符的,包括1) 检测用户查询中是否存在任何一个逻辑运算符;2) 如果运算符附近的词可以构成一个完整的词,则删除该运算符;3) 此时,如果在用户査询中仍然不存在逻辑运算符,则判断该用户 查询是自然语言查询,否则判断出该用户查询是关键词查询。例如,用户查询为"创新大厦在哪里"。首先,在"创新"和"大厦" 之间存在空格,但是空格附近的词"创新"和"大厦"可以构成一个完整 的词"创新大厦"。其次,该用户査询是一个疑问句。因此,判断装置判 断出该用户查询是自然语言査询。判断装置7所采用的第二种判断方法是检査用户査询的完整性。自然 语言査询通常是给出明确需求的疑问句,而关键词查询通常并不完整。判断装置7还可以采用的判断方法是同时进行自然语言查询和关键 词查询的处理后选择最优结果。此外,判断装置7还可以采用其它的已知 的判断方法判断从用户终端接收的査询请求是自然语言查询请求还是关 键词查询请求。
以及,由基于自然语言和关键词的位置查询系统执行的方法包括确定 步骤,如图2所示的基于自然语言的位置查询步骤和如图4所示的基于关键词的位置查询步骤。此外,虽然以中文査询为例,示出了位置搜索系统,对于本领域显而 易见的是本发明也可以用于其它语言的査询,例如,英语和日语等等。图14b示出基于自然语言和关键词的位置査询系统中的处理装置的另 一个实施例。由于该系统具有与图14a所示的相同的组件,包括用户接口l, 存储单元2,位置数据库3, GIS接口32和答案发送器12,图14b仅示出了 处理装置142。处理装置142包括分词单元41,通过查找位置本体库中的 类别表、实体表以及位置査询语言库中的常量表,对査询请求进行分词; 模糊处理单元42,用于通过查找位置本体库、位置查询语言库和用户查询 历史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所 述的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理单元 43,通过查找位置本体库中的类别表,将查询请求中的间接描述转化为位 置本体库中的对应类别名称;判断单元7,判断从用户终端接收的査询请 求是自然语言查询请求还是关键词查询请求;査询语言匹配单元44,用于 当查询请求是自然语言查询时,将处理后的查询请求与位置查询语言库进 行匹配,并生成对应的查询动作;文法部分匹配单元44',用于当査询请 求是关键词查询时,将处理后的查询请求与位置查询语言库进行部分匹 配,并获得匹配文法集合;答案决策单元45,用于当查询请求是关键词查 询时,根据预定的决策规则,从匹配文法集合中选择最优匹配文法并生成 对应的查询动作;数据库搜索单元46,用于根据査询动作从位置数据库中 搜索相应的查询结果;以及答案融合与生成单元47,用于融合査询结果以 便生成答案,并将答案发送到用户终端。虽然图14b示出了处理装置142包括模糊处理单元42和间接处理单 元43,其可以仅包括模糊处理单元42或者间接处理单元43。此外,处理 装置还可以包括复合句处理单元48和/或错误诊断单元49。图15是根据本发明的位置本体库生成方法的流程图。位置本体库生 成方法包括领域本体生成步骤233,映射本体生成步骤234和组合步骤 235。
领域本体生成步骤233用于对每个领域生成领域本体,具体包括地理 实体提取、地理类别提取、属性提取和关系提取。首先,领域本体生成步骤233从各领域的信息源中提取地理实体,生 成实体表。具体提取方法因领域而异,例如,生成地图领域本体时利用现 有的GIS函数抽取电子地图上标示的所有地物名,生成黄页领域本体时利 用现有的未识别词识别算法从web上的黄页信息中提取机构名、地名等 词。其次,领域本体生成步骤233提取地理类别。现有的电子地图中提供 了一些粗分类,本发明在此基础上进行了扩充。首先将地图中的地物分类作为基础类;其次利用现有的统计和聚类算 法,对实体表中的所有实体名进行类型特征提取(通常是词频很高的后缀, 如某某快餐店),聚类得到所有扩展类(如快餐店);然后再对所有实体名 进行连锁店特征提取(通常是词频较高的前缀,如肯德基某某店),聚类 得到所有连锁店(如肯德基);最后根据上面的聚类结果和同义词典,得 到各类别的同义词集,并生成类别表。然后领域本体生成步骤233提取属性。具体提取方法因领域而异,例 如,生成地图领域本体时提取地图数据库中的地物描述字段(如经度、纬 度),生成黄页领域本体时查找Web上的结构化描述并利用现有的信息提 取算法找出可能的属性集。最后对每个属性,人工标明属性的类型。领域本体生成步骤233再次提取关系。主要提取类别间的隶属关系、 实体和类别间的隶属关系、实体间的空间关系。类别间的隶属关系主要依 据现有的地物分类法标准,并人工修正和总结。实体与类别间的隶属关系 主要依据地理类别提取中的实体聚类结果来获得。而实体间的空间关系则 可利用GIS函数来计算得到。最后领域本体生成步骤233将抽取到的地理实体、地理类别、属性、 关系以及人工组织的预定公理部分组合,形成最终的领域本体。映射本体生成步骤234用于根据各领域本体生成映射本体,具体包括 同义映射关系提取、语言映射关系提取和空间映射关系提取步骤之一。首先,映射本体生成步骤234根据一个同义词典和一个简称规则库生 成同义映射关系。同义词典包含概念间的同义关系,简称规则库包括各短 语的縮略语,例如"abbreviate(北京大学,北大)"表示"北京大学的简称 是北大"。根据简称规则可以判断两个概念是否同义,例如根据 abbreviate(北京大学,北大)"和"abbreviate(附属小学,附小)",可以得 到"北京大学附属小学"和"北大附小"是同义词。其次,映射本体生成步骤234根据一个多语言词典生成语言映射关系。最后,映射本体生成步骤234根据电子地图的GIS函数生成空间映射 关系。组合步骤235将领域本体和映射本体组合在一起,生成位置本体库21。图16是根据本发明的位置查询语言库生成方法的流程图。参考图16, 位置查询语言库生成方法包括领域查询语言生成步骤241,公用查询语言 生成步骤242和组合步骤243。领域查询语言生成步骤241用于对每个领域生成领域查询语言,具体 包括问句收集、语料建立,问句聚类和文法提取。问句收集用于收集该领 域的用户真实问句集合。语料建立用于利用现有的分词算法对各问句进行 分词和标注(标注分为概念、疑问词、名词、动词等),从而生成问句语 料库。问句聚类用于利用现有的统计和聚类算法,计算问句间的相似度并 按相似度聚类。文法提取用于根据聚类结果来总结文法,具体如下-1) 对每个聚类分类,定义一个文法名2) 根据下列方法,根据当前聚类分类的问句的相似度,提取査询文法令若有多个文法,则中间用"I"隔开々 一个文法可包含一个或多个部分,每一个部分X由"<X>" 来表示今 一组同义词可以归纳为一个常量,表示为<!常量名>。将所有的常量存放在常量表中 今 一组并列的概念可以归纳为一个变量,表示为< 变量名>。若该变量有类型约束,则表示为< 变量名(约束类型集)> 々若文法中的某个部分可有可无,则加"[]"来表示
今若文法中的某个部分可以是一个并列的概念集,则加"{ }" 来表示3)对每种文法,人工定义它的动作。例如isSyntax(<LocationQuery>) ■> QueryLocation( C)描述如果用户查询符合〈LocationQuery〉的文法,则 产生查询动作QueryLocation( C)。公用查询语言生成步骤242计算各领域査询语言的文法的相似度,抽 取出共同的文法,写入公用查询语言中。组合步骤243用于将领域查询语言和公用査询语言组合在一起,生成 位置查询语言库22。尽管已经示出和描述了本发明,本领域的技术人员可以理解的是,在 不偏离本发明的原理和精神的前提下,可以在本实施例中进行改变,本发 明的范围由所附权利要求及其等价物限定。
权利要求
1.一种基于自然语言的位置查询系统,包括接收装置,用于从用户终端接收自然语言查询请求;访问装置,用于访问系统内部或外部的位置本体库和位置查询语言库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置查询语言库包括用于位置服务查询的语言模型;自然语言查询处理装置,用于通过访问装置查找位置本体库和位置查询语言库,对接收的自然语言查询请求进行模糊处理和间接处理中的至少一个并从位置数据库中搜索出对应的位置信息;和发送装置,用于将所述位置信息发送到用户终端。
2. 如权利要求1所述的系统,其中所述自然语言查询处理装置包括-分词单元,通过查找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对自然语言查询请求进行分词;模糊处理单元,用于通过查找位置本体库、位置查询语言库和用户查 询历史,对分词后的査询请求中的模糊描述进行删词或补词的处理,其中 所述的模糊描述包括冗余描述和不完整描述中的至少之一;查询语言匹配单元,将处理后的査询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
3. 如权利要求1所述的系统,其中所述自然语言查询处理装置包括: 分词单元,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对自然语言查询请求进行分词;间接处理单元,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;查询语言匹配单元,将处理后的查询请求与位置査询语言库进行匹配,并生成对应的査询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的査询结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
4. 如权利要求1所述的系统,其中所述自然语言查询处理装置包括:分词单元,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对自然语言查询请求进行分词;模糊处理单元,用于通过查找位置本体库、位置查询语言库和用户查 询历史,对分词后的査询请求中的模糊描述进行删词或补词的处理,其中 所述的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理单元,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;查询语言匹配单元,将处理后的查询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索单元,用于根据査询动作从位置数据库中搜索相应的查询 结果;答案融合与生成单元,用于融合査询结果以便生成答案,并将答案发 送到用户终端。
5. 如权利要求2至4之一所述的系统,其中所述自然语言查询处理 装置还包括复合句处理单元,用于将包括复合句的自然语言查询请求拆分为多个 单一的自然语言査询请求并提供给分词单元。
6. 如权利要求2至4之一所述的系统,其中所述査询语言匹配单元 在查询请求不满足匹配文法中的概念约束时,通过査找位置本体库中的映射本体,将相关描述转换为满足约束的概念。
7. 如权利要求5所述的系统,其中所述自然语言査询处理装置还包括错误诊断单元,用于在查询语言匹配单元匹配失败后按照预定的规则 识别并分析査询请求中的语义错误,并将诊断出的错误信息经过答案融合 与生成单元发送给用户终端。
8. —种基于自然语言的位置査询方法,包括接收步骤,接收用户通过用户终端发送的自然语言查询请求; 自然语言查询处理步骤,通过查找位置本体库和位置査询语言库,对接收的自然语言查询请求进行模糊处理和间接处理中的至少一个,并从位置数据库中搜索出对应的位置信息;和发送步骤,将搜索到的位置信息发送到用户终端。
9. 如权利要求8所述的方法,其中所述自然语言查询处理步骤包括分词步骤,通过查找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对自然语言査询请求进行分词;模糊处理步骤,通过查找位置本体库、位置査询语言库和用户查询历 史,对分词后的査询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;査询语言匹配步骤,将处理后的査询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索步骤,用于根据査询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
10. 如权利要求8所述的方法,其中所述自然语言查询处理步骤包括 分词步骤,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对自然语言查询请求进行分词;间接处理步骤,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;査询语言匹配步骤,将处理后的查询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的査询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案 发送到用户终端。
11. 如权利要求8所述的方法,其中所述自然语言査询处理步骤包括: 分词步骤,通过査找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对自然语言查询请求进行分词;模糊处理步骤,通过查找位置本体库、位置查询语言库和用户查询历 史,对分词后的査询请求中的模糊描述进行删词或补词的处理,其中所述的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理步骤,通过査找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;査询语言匹配步骤,将处理后的查询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
12. 如权利要求9至ll之一所述的方法,其中所述自然语言查询处 理步骤还包括复合句处理步骤,用于将包括复合句的自然语言查询请求拆分为多个 单一的自然语言査询请求并发送到分词步骤。
13. 如权利要求9至11之一所述的方法,其中所述查询语言匹配步 骤还包括若查询请求不满足匹配文法中的概念约束,则通过查找位置本体库中 的映射本体,将相关描述转换为满足约束的概念。
14. 如权利要求12所述的方法,其中所述自然语言查询处理步骤还包括错误诊断步骤,用于在査询语言匹配失败后按照预定的规则识别并分 析査询请求中的语义错误,并将诊断出的错误信息发送给用户终端。
15. 如权利要求8所述的方法,其中还包括位置本体库生成步骤,其包括领域本体生成步骤,用于从电子地图和黄页信息的信息源中提取实体 表与类别表、属性以及关系,并与预定的公理部分进行组合,从而生成针 对每个领域的领域本体;映射本体生成步骤,用于根据同义词典、简称规则库、多语言词典和电子地图,抽取同义映射关系、语言映射关系和空间映射关系中的至少一 个,从而生成映射本体。
16. 如权利要求8所述的方法,其中还包括位置查询语言库生成步骤, 其包括领域查询语言生成步骤,用于收集各个领域的可能的问句,从各领域 的用户问句集合中抽取文法、常量表,并将提取的文法以及文法对应的查 询动作组合为领域査询语言;公用査询语言生成步骤,用于计算各领域查询语言的文法间的相似 度,并抽取公用查询语言。
17. —种基于关键词的位置查询系统,包括 接收装置,用于从用户终端接收关键词查询请求;访问装置,用于访问系统内部或外部的位置本体库和位置査询语言 库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置査询 语言库包括用于位置服务查询的语言模型;关键词査询处理装置,用于通过访问装置查找位置本体库和位置查询 语言库,对接收的关键词査询请求进行模糊处理和间接处理中的至少一 个,并从位置数据库中搜索出对应的位置信息;和发送装置,用于将所述位置信息发送到用户终端。
18. 如权利要求17所述的系统,其中所述关键词查询处理装置包括 分词单元,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对用户的关键词查询请求进行分词;模糊处理单元,通过查找位置本体库、位置查询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;文法部分匹配单元,将处理后的查询请求与位置查询语言库进行部分 匹配,并获得匹配文法集合;答案决策单元,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的查询动作; 数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的查询结果;答案融合与生成单元,用于融合査询结果以便生成答案,并将答案发 送到用户终端。
19. 如权利要求17所述的系统,其中所述关键词查询处理装置包括:分词单元,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对用户的关键词查询请求进行分词;间接处理单元,通过査找位置本体库中的类别表,将査询请求中的间 接描述转化为位置本体库中的对应类别名称;文法部分匹配单元,将处理后的查询请求与位置查询语言库进行部分 匹配,并获得匹配文法集合;答案决策单元,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的查询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的査询 结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
20. 如权利要求17所述的系统,其中所述关键词查询处理装置包括 分词单元,通过查找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对用户的关键词査询请求进行分词;模糊处理单元,通过查找位置本体库、位置査询语言库和用户查询历 史,对分词后的査询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理单元,通过查找位置本体库中的类别表,将査询请求中的间 接描述转化为位置本体库中的对应类别名称;文法部分匹配单元,将处理后的查询请求与位置查询语言库进行部分 匹配,并获得匹配文法集合;答案决策单元,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的査询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的査询 结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
21. 如权利要求18至20之一所述的系统,其中所述关键词查询处理 装置还包括错误诊断单元,用于在文法部分匹配单元匹配失败后按照预定的规则 识别并分析査询请求中的语义错误,并将诊断出的错误信息经过答案融合 与生成单元发送给用户终端。
22. 如权利要求18至20之一所述的系统,其中所述答案决策单元在 查询请求不满足匹配文法中的概念约束时,通过查找位置本体库中的映射 本体,将相关描述转换为满足约束的概念。
23. —种基于关键词的位置査询方法,包括 接收步骤,用于从用户终端接收用户的关键词查询请求; 关键词查询处理步骤,用于通过査找位置本体库和位置査询语言库,对用户终端发送的关键词查询请求进行模糊处理和间接处理中的至少一 个,并从位置数据库中搜索出对应的位置信息;和发送步骤,将所述搜索出的位置信息发送到用户终端。
24. 如权利要求23所述的方法,其中所述关键词査询处理步骤包括 分词步骤,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对用户的关键词查询请求进行分词;模糊处理步骤,通过査找位置本体库、位置查询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;文法部分匹配步骤,将处理后的查询请求与位置查询语言库进行部分 匹配,并获得匹配文法集合;答案决策步骤,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
25. 如权利要求23所述的方法,其中所述关键词查询处理步骤包括: 分词步骤,通过査找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对用户的关键词查询请求进行分词;间接处理步骤,通过査找位置本体库中的类别表,将查询请求中的间接描述转化为位置本体库中的对应类别名称;文法部分匹配步骤,将处理后的査询请求与位置査询语言库进行部分 匹配,并获得匹配文法集合;答案决策步骤,用于根据预定的决策规则,从匹配文法集合中选择最优匹配文法并生成对应的査询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
26. 如权利要求23所述的方法,其中所述关键词査询处理步骤包括 分词步骤,通过査找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对用户的关键词査询请求进行分词;模糊处理步骤,通过查找位置本体库、位置查询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理步骤,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;文法部分匹配步骤,将处理后的查询请求与位置查询语言库进行部分 匹配,并获得匹配文法集合;答案决策步骤,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的査询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
27. 如权利要求24至26之一所述的方法,其中所述关键词查询处理 步骤还包括错误诊断步骤,用于在文法部分匹配失败后按照预定的规则识别并分 析查询请求中的语义错误,并将诊断出的错误信息经过答案融合与生成单 元发送给用户终端。
28. 如权利要求24至26之一所述的方法,其中所述答案决策步骤还 包括若查询请求不满足匹配文法中的概念约束,则通过查找位置本体库中 的映射本体,将相关描述转换为满足约束的概念。
29. 如权利要求23所述的方法,其中还包括位置本体库生成步骤, 其包括领域本体生成步骤,用于从电子地图、黄页信息的信息源中提取实体 表与类别表、属性以及关系,并与预定的公理部分进行组合,从而生成针 对每个领域的领域本体;映射本体生成步骤,用于根据同义词典、简称规则库、多语言词典和 电子地图,抽取同义映射关系、语言映射关系和空间映射关系中的至少一 个,从而生成映射本体。
30. 如权利要求23所述的方法,其中还包括位置查询语言库生成步 骤,其包括领域査询语言生成步骤,用于从各领域的用户问句集合中抽取文法、 常量表,并将提取的文法以及文法对应的查询动作组合为领域查询语言;公用查询语言生成步骤,用于计算各领域查询语言的文法间的相似 度,并抽取公用查询语言。
31. —种基于自然语言和关键词的位置查询系统,包括 访问装置,用于访问系统内部或外部的位置本体库和位置查询语言库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置查询 语言库包括用于位置服务查询的语言模型;自然语言和关键词查询处理装置,用于通过访问装置查找位置本体库 和位置查询语言库,对接收的自然语言和/或关键词查询请求进行模糊处 理和间接处理中的至少一个并从位置数据库中搜索出对应的位置信息; 发送装置,用于将所述位置信息发送到用户终端。
32. 如权利要求31所述的系统,其中所述自然语言和关键词查询处理装置包括分词单元,通过查找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对查询请求进行分词;模糊处理单元,用于通过查找位置本体库、位置查询语言库和用户查 询历史,对分词后的査询请求中的模糊描述进行删词或补词的处理,其中 所述的模糊描述包括冗余描述和不完整描述中的至少之一;判断单元,判断从用户终端接收的查询请求是自然语言查询请求还是 关键词査询请求;查询语言匹配单元,用于当查询请求是自然语言查询时,将处理后的 査询请求与位置査询语言库进行匹配,并生成对应的查询动作;文法部分匹配单元,用于当查询请求是关键词査询时,将处理后的査 询请求与位置查询语言库进行部分匹配,并获得匹配文法集合;答案决策单元,用于当查询请求是关键词查询时,根据预定的决策规 则,从匹配文法集合中选择最优匹配文法并生成对应的査询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的査询 结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
33. 如权利要求31所述的系统,其中所述自然语言和关键词査询处理 装置包括分词单元,通过查找位置本体库中的类别表、实体表以及位置查询语 言库中的常量表,对自然语言查询请求进行分词;间接处理单元,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;判断单元,判断从用户终端接收的查询请求是自然语言查询请求还是 关键词査询请求;査询语言匹配单元,用于当査询请求是自然语言查询时,将处理后的 查询请求与位置查询语言库进行匹配,并生成对应的查询动作; 文法部分匹配单元,用于当査询请求是关键词査询时,将处理后的查 询请求与位置查询语言库进行部分匹配,并获得匹配文法集合;答案决策单元,用于当查询请求是关键词查询时,根据预定的决策规则,从匹配文法集合中选择最优匹配文法并生成对应的查询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
34. 如权利要求31所述的系统,其中所述自然语言和关键词查询处理 装置包括分词单元,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对自然语言査询请求进行分词;模糊处理单元,用于通过査找位置本体库、位置査询语言库和用户查 询历史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中 所述的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理单元,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;判断单元,判断从用户终端接收的查询请求是自然语言查询请求还是 关键词查询请求;查询语言匹配单元,用于当查询请求是自然语言查询时,将处理后的 查询请求与位置查询语言库进行匹配,并生成对应的査询动作;文法部分匹配单元,用于当查询请求是关键词查询时,将处理后的査 询请求与位置査询语言库进行部分匹配,并获得匹配文法集合;答案决策单元,用于当查询请求是关键词查询时,根据预定的决策规则,从匹配文法集合中选择最优匹配文法并生成对应的查询动作;数据库搜索单元,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成单元,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
35. 如权利要求32至34之一所述的系统,其中所述查询语言匹配单元和答案决策单元在查询请求不满足匹配文法中的概念约束时,通过査找 位置本体库中的映射本体,将相关描述转换为满足约束的概念。
36. —种基于自然语言和关键词的位置査询方法,包括 判断步骤,判断从用户终端接收的査询请求是自然语言查询请求还是关键词査询请求;在用户的查询请求是自然语言查询请求时,包括自然语言查询处理步骤,用于通过查找位置本体库和位置査询语言 库,对接收的自然语言查询请求进行模糊处理和间接处理中的至少一个并 从位置数据库中搜索出对应的位置信息;第一发送步骤,将所述位置信息发送到用户终端;和在用户的査询请求是关键词査询请求时,包括:关键词查询处理步骤,用于通过查找位置本体库和位置査询语言库, 对接收的关键词査询请求进行模糊处理和间接处理中的至少一个并从位 置数据库中搜索出对应的位置信息;和第二发送步骤,将所述位置信息发送到用户终端。
37. 如权利要求36所述的方法,其中所述自然语言查询处理步骤包括分词步骤,通过查找位置本体库中的类别表、实体表以及位置查询语 言库中的常量表,对自然语言查询请求进行分词;模糊处理步骤,通过查找位置本体库、位置查询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;查询语言匹配步骤,将处理后的查询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
38. 如权利要求36所述的方法,其中所述自然语言查询处理步骤包括 分词步骤,通过查找位置本体库中的类别表、实体表以及位置查询语 言库中的常量表,对自然语言查询请求进行分词;间接处理步骤,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;查询语言匹配步骤,将处理后的查询请求与位置查询语言库进行匹 配,并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
39. 如权利要求36所述的方法,其中所述自然语言查询处理步骤包括分词步骤,通过查找位置本体库中的类别表、实体表以及位置查询语 言库中的常量表,对自然语言查询请求进行分词;模糊处理步骤,通过査找位置本体库、位置查询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理步骤,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;查询语言匹配步骤,将处理后的查询请求与位置查询语言库进行匹 配,并生成对应的査询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
40. 如权利要求36所述的方法,其中所述关键词查询处理步骤包括-分词步骤,通过查找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对用户的关键词查询请求进行分词;模糊处理步骤,通过査找位置本体库、位置査询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;文法部分匹配步骤,将处理后的查询请求与位置査询语言库进行部分 匹配,并获得匹配文法集合;答案决策步骤,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
41. 如权利要求36所述的方法,其中所述关键词査询处理步骤包括 分词步骤,通过查找位置本体库中的类别表、实体表以及位置査询语言库中的常量表,对用户的关键词査询请求进行分词;间接处理步骤,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;文法部分匹配步骤,将处理后的査询请求与位置査询语言库进行部分 匹配,并获得匹配文法集合;答案决策步骤,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的查询动作;数据库搜索步骤,用于根据査询动作从位置数据库中搜索相应的査询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
42. 如权利要求36所述的方法,其中所述关键词查询处理步骤包括 分词步骤,通过查找位置本体库中的类别表、实体表以及位置查询语言库中的常量表,对用户的关键词查询请求进行分词;模糊处理步骤,通过查找位置本体库、位置查询语言库和用户查询历 史,对分词后的查询请求中的模糊描述进行删词或补词的处理,其中所述 的模糊描述包括冗余描述和不完整描述中的至少之一;间接处理步骤,通过查找位置本体库中的类别表,将查询请求中的间 接描述转化为位置本体库中的对应类别名称;文法部分匹配步骤,将处理后的査询请求与位置査询语言库进行部分匹配,并获得匹配文法集合;答案决策步骤,用于根据预定的决策规则,从匹配文法集合中选择最 优匹配文法并生成对应的查询动作;数据库搜索步骤,用于根据查询动作从位置数据库中搜索相应的查询 结果;答案融合与生成步骤,用于融合查询结果以便生成答案,并将答案发 送到用户终端。
43. 如权利要求37至39之一所述的方法,其中所述查询语言匹配步 骤还包括若查询请求不满足匹配文法中的概念约束,则通过查找位置本体库中 的映射本体,将相关描述转换为满足约束的概念。
44. 如权利要求40至42之一所述的方法,其中所述答案决策步骤还 包括若查询请求不满足匹配文法中的概念约束,则通过查找位置本体库中 的映射本体,将相关描述转换为满足约束的概念。
全文摘要
一种基于自然语言的位置查询系统和方法,所述系统包括接收装置,用于从用户终端接收自然语言查询请求;访问装置,用于访问系统内部或外部的位置本体库和位置查询语言库,其中所述位置本体库包括位置服务中的领域知识描述,所述位置查询语言库包括用于位置服务查询的语言模型;自然语言查询处理装置,用于通过访问装置查找位置本体库和位置查询语言库,对接收的自然语言查询请求进行模糊处理和间接处理中的至少一个并从位置数据库中搜索出对应的位置信息;和发送装置,用于将所述位置信息发送到用户终端。以及一种基于关键词的位置查询系统和方法与一种基于自然语言和关键词的位置查询系统和方法。本发明不但可以处理用户的模糊查询、间接查询,还可以处理复合句查询和有语义错误的查询,从而提高了用户提问的自由度,使位置查询更加灵活、精确。
文档编号G06F17/30GK101136028SQ200710128348
公开日2008年3月5日 申请日期2007年7月10日 优先权日2006年7月10日
发明者丰强泽, 刘宇光, 刘慧峰, 刘晓炜, 王亚波, 福岛俊一, 齐红威 申请人:日电(中国)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1