一种获取缩略词与poi间对应关系的方法和装置制造方法

文档序号:6493248阅读:133来源:国知局
一种获取缩略词与poi间对应关系的方法和装置制造方法
【专利摘要】本发明公开了一种获取缩略词与POI间对应关系的方法和装置,该方法包括:从用户搜索日志中搜集POI查询成功记录,并将搜索到的当前POI查询成功记录中的查询词确定为标准POI查询词;将当前POI查询成功记录与前一次POI查询成功记录之间的POI查询失败记录中的查询词确定为待确定缩略词;在组成该待确定缩略词的单字均包含在所述标准POI查询词且在两词中的先后顺序相同时,将该待确定缩略词确定为缩略词;建立所述缩略词与所述标准POI查询词的对应关系并确定为缩略词与POI间对应关系。通过本发明的技术方案,可以使得获取的对应关系更加准确,从而用户根据该对应关系就可以通过缩略词准确地查找到地图中对应的POI。
【专利说明】一种获取缩略词与POI间对应关系的方法和装置
【技术领域】
[0001]本发明涉及地图搜索领域,特别涉及一种获取缩略词与POI间对应关系的方法和装置。
【背景技术】
[0002]随着地图搜索技术的不断发展,人们可以方便地使用地图查询到所需地点的地理位置以及周边的地理环境。在地图搜素【技术领域】中,用户所需的地点称之为兴趣点,也称POI (Point OfInterest的缩写);在地图信息库中,一个POI点对应的信息包括有地点的全称、类别、经度、纬度等信息。用户在地图中搜索POI时,输入地点的全称,然后服务器查找信息中具有该全称的对应POI,最后将查找结果输出给用户,从而实现通过地图搜索查找POI的功能。
[0003]用户在使用地图搜索POI的时候,为了输入简便,往往输入的地点名称并不是该地点的全称,而是该地点的缩略词。而由于POI信息库中的POI全称基本都是地点的全称,所以在用户输入缩略词时往往查询不到Ρ0Ι。为了解决这一问题,需要在终端或服务器中设置缩略词和POI间的对应关系。用户在输入缩略词时,终端或服务器可以先在对应关系中查找到能够查询到其对应的POI的查询词,再根据该查询词查找得到Ρ0Ι,从而实现通过缩略词查找POI的功能。其中,该查询词可以是POI全称,也可以是通过目前系统能够查询到对应POI的其他词。
[0004]现有技术中,获取缩略词与POI间对应关系的方式是:通过自造或经验而获取的候选语料库,对候选语料库利用缩略词、POI全称的长度及对齐规则进行搜索匹配,或者采用训练学习的方法进行匹配,最后得到缩略词与POI间对应关系。虽然采用这种方式能使用户方便地通过输入缩略词来搜索到Ρ0Ι,但是,由于地图中地理信息的变化较快以及用户所使用的缩略词存在差别,而通过自造或经验的候选语料库难以与之同步更新,所以获取的对应关系往往并不准确,因此,在利用通过这种不准确的对应关系查找POI时,用户就会查找不到POI或者查找到的POI并不是缩略词对应的Ρ0Ι,也即查找的POI不准确。这样,用户就需要不断修改输入的名称来重新查找准确的Ρ0Ι,这不仅增加了用户与终端之间的交互次数,也增加了终端响应用户操作和服务器响应终端的次数,进而影响服务器系统性倉泛。

【发明内容】

[0005]本发明要解决的问题是提供一种获取缩略词与POI间对应关系的方法和装置,以克服现有技术中依据由自造或经验的候选语料库而获取的缩略词与POI间对应关系来查找POI不准确的缺陷,进一步的,克服用户、终端和服务器之间的交互次数过多而造成的影响服务器系统性能的缺陷。
[0006]为达到上述目的,本发明提供了一种获取缩略词与POI间对应关系的方法,所述方法包括以下步骤:[0007]从用户搜索日志中,搜集POI查询成功记录,并将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
[0008]在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
[0009]在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
[0010]建立所述缩略词与所述标准POI查询词的对应关系,并将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
[0011]优选的,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
[0012]对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
[0013]确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
[0014]将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词;将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
[0015]建立所述修正缩略词与所述修正标准POI查询词的对应关系,并以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
[0016]优选的,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
[0017]判断所述缩略词与POI间对应关系是否为已存储的对应关系,如果是,则删除所述缩略词与POI间对应关系,如果否,则存储所述缩略词与所述标准POI查询词间对应关
系O
[0018]优选的,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
[0019]将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
[0020]记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
[0021]判断所述缩略词与POI间对应关系出现次数是否超过预设的频次阈值;
[0022]如果是,则存储所述缩略词与POI间对应关系。
[0023]本发明还提供了一种查询POI的方法,预先存储采用前述任一项所述的方法得到的缩略词与POI间对应关系,所述方法包括:
[0024]接收用户输入的查询词;
[0025]根据所述查询词在POI数据库中查询对应的POI ;
[0026]判断是否查找到POI ;
[0027]如果是,则输出查询得到的POI ;如果否,则从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词,并根据所述标准POI查询词在所述POI数据库中查询对应的POI。[0028]本发明还提供了一种获取缩略词与POI间的对应关系的装置,所述装置包括:
[0029]成功查询日志搜索模块,用于从用户搜索日志中,搜集POI查询成功记录;
[0030]标准POI查询词确定模块,用于将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
[0031]待确定缩略词确定模块,用于在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
[0032]缩略词确定模块,用于在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
[0033]对应关系建立模块,用于建立所述缩略词与所述标准POI查询词的对应关系;
[0034]对应关系确定模块,用于将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
[0035]优选的,所述装置还包括:
[0036]分词集合形成子模块,用于对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
[0037]分词删除模块,用于确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
[0038]修正词生成模块,用于将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词,和,将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
[0039]修正对应关系建立模块,用于建立所述修正缩略词与所述修正标准POI查询词的对应关系;
[0040]对应关系更新模块,用于以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
[0041]优选的,所述装置还包括:
[0042]对应关系判断模块,用于判断所述缩略词与POI间的对应关系是否为已存储的对应关系;
[0043]第一删除对应关系模块,用于在所述对应关系判断模块的判断结果为是的情况下,删除所述缩略词与POI间对应关系;
[0044]第一存储对应关系模块,用于在所述对应关系判断模块的判断结果为否的情况下,存储所述缩略词与POI间对应关系。
[0045]优选的,所述装置还包括:
[0046]预存模块,用于将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
[0047]频次记录模块,用于记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
[0048]频次判断模块,用于判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值;
[0049]第二存储对应关系模块,用于在所述频次判断模块的判断结果为是的情况下,存储所述缩略词与POI间对应关系。
[0050]本发明还提供了一种查询POI的系统,所述系统包括:
[0051]对应关系预先存储单元,用于预先存储采用前述任一项所述的装置获取的缩略词与POI间对应关系;
[0052]查询词接收单元,用于接收用户输入的查询词;
[0053]第一 POI查找单元,根据所述查询词在POI数据库中查询对应的POI ;
[0054]查找判断单元,用于判断是否查找到POI ;
[0055]POI输出单元,用于在查找判断单元的判断结果为是的情况下,输出查询得到的POI ;
[0056]标准POI查询词获取单元,用于在所述查找判断单元的判断结果为否的情况下,从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词;
[0057]第二 POI查找单元,用于根据所述标准POI查询词在所述POI数据库中查询对应的 POI。
[0058]与现有技术相比,本发明具有以下优点:
[0059]采用本发明的技术方案,从用户搜索日志中搜索POI查询成功记录,并将当前搜索到的成功记录中查询词作为标准POI查询词,然后将当前成功记录与前一次成功记录之间的POI查询失败记录中的查询词确定为待确定缩略词,进而在待确定缩略词中的单字都包含在标准POI查询词中且出现顺序相同时将所述待确定缩略词确定为所述标准POI查询词的缩略词,最后建立所述缩略词与所述标准POI查询词的对应关系,并将所述对应关系为缩略词与POI间对应关系。由于大量用户的实际查询能够及时反映地图中地理信息的变化以及用户所使用的缩略词的差别,通过上述技术方案,缩略词与POI间的对应关系通过用户实际搜索POI产生的日志来获取,就可以使得对应关系的更新能够及时的与地图的变化和用户的差别进行同步,因此,获取的缩略词与POI的对应关系更加准确,从而用户根据该对应关系就可以准确地查找到用户想要查找的Ρ0Ι。
【专利附图】

【附图说明】
[0060]图1是本发明获取缩略词与POI间对应关系方法实施例一的基本流程图;
[0061]图2是本发明避免对应关系中缩略词与标准POI查询词繁琐的一实施方式的基本流程图;
[0062]图3是本发明存储对应关系的实施方式一的基本流程图;
[0063]图4是本发明存储对应关系的实施方式二的基本流程图;
[0064]图5是本发明存储对应关系的实施方式三的基本流程图;
[0065]图6是本发明通过缩略词查询POI的方法实施例一的基本流程图;
[0066]图7是本发明获取缩略词与POI间的对应关系的装置实施例一的结构图;
[0067]图8是本发明获取缩略词与POI间的对应关系的装置实施例二的结构图;
[0068]图9是本发明获取缩略词与POI间的对应关系的装置实施例三的结构图;
[0069]图10是本发明获取缩略词与POI间的对应关系的装置实施例四的结构图;[0070]图11是本发明通过缩略词查询POI的系统实施例一的结构图。
【具体实施方式】
[0071]下面我们将结合附图,对本发明的最佳实施方案进行详细描述。首先要指出的是,本发明中用到的术语、字词及权利要求的含义不能仅仅限于其字面和普通的含义去理解,还包括进而与本发明的技术相符的含义和概念,这是因为我们作为
【发明者】,要适当地给出术语的定义,以便对我们的发明进行最恰当的描述。因此,本说明和附图中给出的配置,只是本发明的首选实施方案,而不是要列举本发明的所有技术特性。我们要认识到,还有各种各样的可以取代我们方案的同等方案或修改方案。
[0072]在大多数情况下,用户在输入缩略词查询不到对应的POI时,会再次输入更完整的查询词来查询对应的Ρ0Ι。基于这一应用场景,本发明的基本思想是:搜索用户搜索日志,将搜索日志中查询成功记录中的查询词作为标准POI查询词,与该成功记录之前的一个成功记录之间的失败记录作为缩略词,再依据获取的缩略词与标准POI查询词建立缩略词与标准POI查询词的对应关系;由于大量用户的实际查询能够及时反映地图中地理信息的变化以及用户所使用的缩略词的差别,通过上述技术方案,缩略词与POI间的对应关系通过用户实际搜索POI产生的日志来获取,就可以使得对应关系的更新能够及时的与地图的变化和用户的差别进行同步,因此,获取的缩略词与POI的对应关系更加准确,从而用户根据该对应关系就可以准确地查找到用户想要查找的Ρ0Ι。
[0073]下面结合附图,通过具体实施例详细说明本发明获取缩略词与POI间对应关系的方法和装置的【具体实施方式】。
[0074]图1所示的是本发明获取缩略词与POI间对应关系的方法实施例一的基本流程图,本实施例具体可以包括:
[0075]步骤101、从用户搜索日志中,搜集POI查询成功记录,并将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词。
[0076]本发明实施例可以应用于用户先输入缩略的查询词未查询到对应POI而后再次输入更完整的查询词能够查询到对应POI的应用场景。为了实现对上述场景中用户输入的查询词进行获取,可以从用户搜索日志中进行搜索。而为了便于在日户搜索中查找上述场景,可以先在用户搜索日志中查找所有的查询POI成功记录,并将成功记录中能够查询到POI的查询词作为标准POI查询词。本发明实施例中的标准POI查询词是指在POI数据库中能够查询到POI的查询词。
[0077]步骤102、在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词。
[0078]为了在用户搜索日志中查询到上述应用场景,可以在查找到查询成功记录之后,在当前成功记录与前一次成功记录之间查找POI查询失败记录,如果存在,则可以初步确定满足上述应用场景。具体地,为了使场景查找更准确,可以只将当前成功记录的前一次查询记录为失败记录的情况初步确定为满足上述应用场景。在初步确定满足应用场景后,可以将该POI查询失败记录中的查询词作为待确定缩略词。
[0079]步骤103、在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词。
[0080]由于上述的查询成功记录与查询失败记录可能并不是查找的同一个Ρ0Ι,所以,在获取对应关系之前,需要进一步确定该待确定缩略词是不是该标准POI查询词的缩略词。通过本步骤103,只有在待确定缩略词中的单字都包含在标准POI查询词且各单字在两个词中出现的顺序相同时,才确定该待确定缩略词是标准POI查询词的缩略词。例如,待确定缩略词为“北京市理工大”,标准POI查询词为“北京理工大学”,由于待确定缩略词中具有未包含在标准POI查询词中的单字“市”,因此待确定缩略词将不被确定为标准POI查询词的缩略词。再如,待确定缩略词为“电子二十所”,标准POI查询词为“电子科技十二研究所”,虽然待确定缩略词的所有单字都包含在标准POI查询词中,但是单字“二”和“十”在待确定缩略词与标准POI查询词中的组成顺序是相反的,因此该待确定缩略词将不被确定为标准POI查询词的缩略词。再如待确定缩略词为“北师大”,标准POI查询词为“北京师范大学”,由于缩略词的单字均包含在标准POI查询词中,且单字在缩略词中的先后顺序与在标准POI查询词的先后顺序相同,因此,可以确定“北师大”是“北京师范大学”的缩略词。
[0081]步骤104、建立所述缩略词与所述标准POI查询词的对应关系,并将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
[0082]建立缩略词与标准POI查询词的对应关系的方式,可以是将缩略词与对应的POI全称组成一个映射集合,如{北大,北京大学}。
[0083]由于通过标准POI查询词已经可以在现有的系统中查询到对应的Ρ0Ι,所以,用户实际输入缩略词通过从缩略词与标准POI查询词的对应关系中确定对应的标准POI查询词就可以查询到Ρ0Ι,因此,本实施例中可以将缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
[0084]另外,通过用户搜索日志,采用本实施例的技术方案一般可以获得多个对应关系,在这些对应关系中,一个标准POI查询词可以只与一个缩略词建立对应关系,也可以与多个不同的缩略词分别建立对应关系。由于一个地址的名称会可能有几个不同常用缩略词,而这些缩略词都有用户在使用,因此用户搜索日志都记录了以这些缩略词作为查询词的查询记录,这样一个标准POI查询词就可能会出现在多个对应关系,这时,该标准POI查询词就对应了多个不同的缩略词。
[0085]需要说明的是,在步骤104执行完成之后,缩略词与POI间对应关系已经被获取。由于步骤104中是直接将从用户搜索日志中获取的查询词作为对应关系中的缩略词与标准POI查询词,因此,这两词可能会很繁琐,具有重复的分词,这样不利于节省对应关系的存储空间以及其他用户查找时对对应关系的再次调用。因此,本实施例中为解决上述问题,可以在步骤104之后,包括如图2所示的步骤:
[0086]步骤201、对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
[0087]步骤202、确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
[0088]步骤203、将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词;将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
[0089]步骤204、建立所述修正缩略词与所述修正标准POI查询词的对应关系,并以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
[0090]其中,步骤201中对缩略词和标准POI查询词进行分词时,可以是采用现有的分词器对缩略词和标准POI查询词进行分词,但为了分词更加准确,还需对现有分词器进行调整。例如,对对应关系{九堡客运站,九堡客运中心站}进行分词时,按照现有分词器分成{九堡,客运,站}和{九堡,客运,中心,站}显然不合适,本实施例中需要调整现有分词器,将单字的末尾分词与前一分词合并,从而使分词结果为{九堡,客运站}和{九堡,客运中心站}。再如,对对应关系{北京国航中心,北京国际航运中心}进行分词时,需要调整现有分词器使分词结果为{北京,国航中心}和{北京,国际航运中心}。
[0091]下面以一个实例来说明图2的实施方式。在该实例中,确定的缩略词与对应关系为{昌平中行,昌平中国银行},则图2所示的实施方式具体为:将缩略词“昌平中行”和标准POI查询词“昌平中国银行”分词,形成缩略词分词集合{昌平,中行}和标准POI查询词分词集合{昌平,中国,银行};删除两个集合中都包含有的分词“昌平”;按照标准POI查询词“昌平中国银行”的组词顺序,将两个集合中剩余的分词分别组成修正缩略词“中行”和修正标准POI查询词“中国银行”;将缩略词与POI间对应关系更新为{中行,中国银行}。
[0092]需要说明的是,经过图2所示的实施方式确定缩略词与标准POI查询词间的对应关系之后,实际上是使缩略词和标准POI查询词只保留核心的内容,而具体地点的名称都会被简化或被删除,也即,对应关系中缩略词对应的并不是能查询到对应POI的标准POI查询词,而是标准POI查询词的简化词。而用户在具体查找具体地点的POI时,可以将用户输入的缩略词也做上述的分词处理,利用形成的修正缩略词在对应关系中查找对应的修正标准POI查询词,再将分词简化或删除的分词重新加入查找到的修正标准POI查询词,以此最后得到标准POI查询词再去查找地图中的Ρ0Ι。例如,{昌平中行,昌平中国银行}这一对应关系经过图2所示的实施方式处理之后,被更新为{中行,中国银行},而在用户输入“昌平中行”的时候,先对将输入词分词成{昌平,中行},然后在上述对应关系中获取到“中行”对应的“中国银行”,然后再与“昌平”合并成“昌平中国银行”,再以“昌平中国银行”去查询POI。由于原先获取的不同对应关系在简化以后有些会变成相同的对应关系,所以,通过图2所示实施方式,可以在保证用户准确查找POI的同时,简化和减少需要保存的对应关系,进而用户通过缩略词查找POI全称时搜索的对应关系数量得以减少,从而提高用户搜索POI时的效率。
[0093]在步骤104获取缩略词与POI间对应关系之后,为了以后用户通过缩略词搜索POI时可以利用该对应关系需要对该对应关系存储为用户可用的缩略词与POI间对应关系。
[0094]为了使保存的对应关系不重复,可以在步骤104之后,采用图3所示的方式来完成存储获取的对应关系:
[0095]步骤301、判断所述缩略词与POI间对应关系是否为已存储的对应关系,如果是,进入步骤302,如果否,进入步骤303 ;
[0096]步骤302、删除所述缩略词与POI间对应关系;
[0097]步骤303、存储所述缩略词与POI间对应关系。
[0098]通过上述方式保存对应关系,提供给用户搜索时使用的对应关系中不会存在重复的对应关系,用户在搜索对应关系查找对应POI全称时系统处理时间较短。
[0099]为了使存储的对应关系准确,可以在步骤104之后,采用图4所示的方式来完成存储获取的对应关系:
[0100]步骤401、判断所述缩略词所对应的POI是否为所述标准POI查询词所对应的Ρ0Ι,如果否,进入步骤402,如果是,进入步骤403 ;
[0101]步骤402、删除所述缩略词与POI间对应关系;
[0102]步骤403、存储所述缩略词与POI间对应关系。
[0103]通过上述方式保存对应关系,可以是存储的对应关系中剔除缩略词与标准POI查询词本身并不是指代同一地点POI的对应关系。例如,{42研究所,428研究所},缩略词与标准POI查询词指的是两个不同的研究所,按照上述步骤,该对应关系被获取后会在存储前被剔除。
[0104]为了使存储的对应关系更具有可用性,可以在步骤104之后,采用图5所示的方式来完成存储获取的对应关系:
[0105]步骤501、将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
[0106]步骤502、记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
[0107]步骤503、判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值,如果是,进入步骤504 ;
[0108]步骤504、存储所述缩略词与POI间对应关系。
[0109]需要说明的是,步骤501中预存的对应关系是不提供给用户搜索时使用的对应关系,这里的预存是对应关系在提供给用户使用之前的一个状态。而步骤504中的存储是存储为提供给用户使用的对应关系,具体地,可以是存储到提供给用户使用的可用对应关系数据库或数据表中。而在步骤503中,如果缩略词与POI间对应关系出现的次数未超过预设的频次阈值,一般并不删除该对应关系,而是继续使其预存在待存储对应关系集合中,随着对用户搜索日志不断搜索而获取更多的对应关系预存到带存储对应关系集合中,该对应关系出现的次数可能会逐渐增大,从而在该次数超过频次阈值时,再将该对应关系存储。
[0110]另外,在存储的对应关系中也可以继续保留记录该对应关系在用户搜索日志中被获取的次数,进而在用户搜索POI的时候,输出的POI可以按照对应的对应关系被调用次数的顺序排列。
[0111]通过上述方式存储对应关系,则提供给用户搜索时使用的对应关系均是之前用户搜索次数较多的对应关系,用户使用的频率较大,能够提高系统搜索对应关系的效率。
[0112]下面以一个具体场景来详细说明根据用户搜索的POI日志内容,经过本实施例的技术方案处理之后,获取的缩略词与POI全称间的对应关系。在该场景中,保存对应关系的频次阈值为2。表I为提取自用户日志的用户通过缩略词搜索POI的内容,表2为根据表I的内容获取并保存的对应关系。
[0113]表I
[0114]
【权利要求】
1.一种获取缩略词与POI间对应关系的方法,其特征在于,包括: 从用户搜索日志中,搜集POI查询成功记录,并将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词; 在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词; 在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词; 建立所述缩略词与所述标准POI查询词的对应关系,并将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
2.根据权利要求1所述的方法,其特征在于,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括: 对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合; 确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除; 将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词;将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词; 建立所述修正缩略词与所述修正标准POI查询词的对应关系,并以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
3.根据权利要求1或2所述的方法,其特征在于,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括: 判断所述缩略词与POI间对应关系是否为已存储的对应关系,如果是,则删除所述缩略词与POI间对应关系,如果否,则存储所述缩略词与所述标准POI查询词间对应关系。
4.根据权利要求1或2所述的方法,其特征在于,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括: 将所述缩略词与POI间对应关系预存到待存储对应关系集合中; 记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数; 判断所述缩略词与POI间对应关系出现次数是否超过预设的频次阈值; 如果是,则存储所述缩略词与POI间对应关系。
5.一种查询POI的方法,其特征在于,预先存储采用权利要求f 4任一项所述的方法得到的缩略词与POI间对应关系,所述方法包括: 接收用户输入的查询词; 根据所述查询词在POI数据库中查询对应的POI ; 判断是否查找到POI ; 如果是,则输出查询得到的POI ;如果否,则从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI 查询词,并根据所述标准POI查询词在所述POI数据库中查询对应的POI。
6.一种获取缩略词与POI间的对应关系的装置,其特征在于,所述装置包括: 成功查询日志搜索模块,用于从用户搜索日志中,搜集POI查询成功记录; 标准POI查询词确定模块,用于将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词; 待确定缩略词确定模块,用于在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词; 缩略词确定模块,用于在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词; 对应关系建立模块,用于建立所述缩略词与所述标准POI查询词的对应关系; 对应关系确定模块,用于将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括: 分词集合形成子模块,用于对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合; 分词删除模块,用于确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出 的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除; 修正词生成模块,用于将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词,和,将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;修正对应关系建立模块,用于建立所述修正缩略词与所述修正标准POI查询词的对应关系; 对应关系更新模块,用于以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括: 对应关系判断模块,用于判断所述缩略词与POI间的对应关系是否为已存储的对应关系; 第一删除对应关系模块,用于在所述对应关系判断模块的判断结果为是的情况下,删除所述缩略词与POI间对应关系; 第一存储对应关系模块,用于在所述对应关系判断模块的判断结果为否的情况下,存储所述缩略词与POI间对应关系。
9.根据权利要求6或7所述的装置,其特征在于,所述装置还包括: 预存模块,用于将所述缩略词与POI间对应关系预存到待存储对应关系集合中;频次记录模块,用于记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数; 频次判断模块,用于判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值;第二存储对应关系模块,用于在所述频次判断模块的判断结果为是的情况下,存储所述缩略词与POI间对应关系。
10.一种查询POI的系统,其特征在于,所述系统包括: 对应关系预先存储单元,用于预先存储采用权利要求6、任一项所述的装置获取的缩略词与POI间对应关系; 查询词接收单元,用于接收用户输入的查询词; 第一 POI查找单元,根据所述查询词在POI数据库中查询对应的POI ; 查找判断单元,用于判断是否查找到POI ; POI输出单元,用于在查找判断单元的判断结果为是的情况下,输出查询得到的POI ;标准POI查询词获取单元,用于在所述查找判断单元的判断结果为否的情况下,从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词; 第二 POI查找单元,用 于根据所述标准POI查询词在所述POI数据库中查询对应的POI。
【文档编号】G06F17/27GK103885950SQ201210555427
【公开日】2014年6月25日 申请日期:2012年12月19日 优先权日:2012年12月19日
【发明者】张庆斌 申请人:高德软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1