地图兴趣点查询方法、装置、设备、存储介质及程序产品与流程

文档序号:29632856发布日期:2022-04-13 16:24阅读:88来源:国知局
地图兴趣点查询方法、装置、设备、存储介质及程序产品与流程

1.本公开涉及数据处理技术领域,具体涉及深度学习、自然语言处理、知识图谱、智能地图等人工智能技术领域,尤其涉及一种地图兴趣点查询方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

2.导航电子地图产品,不仅每天为亿万用户提供出行服务同时也作为新基建数字底座,在各个行业发挥着越来越重要,不可或缺的作用。对于地图产品来说,数据是赖以生存的基础设施,准确是地图的生命线,时效则是地图刻画真实世界的必备能力。
3.而除了大量的真实数据,为地图领域涉及的多种知识进行科学的处理,才能够使以地图数据为基础构建的产品更好的满足用户的需求。


技术实现要素:

4.本公开实施例提出了一种地图兴趣点查询方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
5.第一方面,本公开实施例提出了一种地图兴趣点查询方法,包括:接收输入的兴趣点查询请求;从兴趣点查询请求中提取出包含的目标查询词;利用预先确定的查询词与兴趣点之间的语义对应关系,确定与目标查询词对应的目标兴趣点;其中,用于确定语义对应关系的查询词和兴趣点提取自预设的多元地图知识模型,多元地图知识模型记录有兴趣点与多元知识之间的多元对应关系,多元知识包括:地理位置信息、知识图谱信息和输入的查询词。
6.第二方面,本公开实施例提出了一种地图兴趣点查询装置,包括:兴趣点查询请求接收单元,被配置成接收输入的兴趣点查询请求;目标查询词提取单元,被配置成从兴趣点查询请求中提取出包含的目标查询词;目标兴趣点确定单元,被配置成利用预先确定的查询词与兴趣点之间的语义对应关系,确定与目标查询词对应的目标兴趣点;其中,用于确定语义对应关系的查询词和兴趣点提取自预设的多元地图知识模型,多元地图知识模型记录有兴趣点与多元知识之间的多元对应关系,多元知识包括:地理位置信息、知识图谱信息和输入的查询词。
7.第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的地图兴趣点查询方法。
8.第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的地图兴趣点查询方法。
9.第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算
机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的地图兴趣点查询方法。
10.为了向用户提供更好的地图兴趣点查询服务,本公开预先基于兴趣点和对应的多元知识构建了多元地图知识模型,由于多元知识覆盖了地理位置信息、知识图谱信息和输入的查询词,因此经过训练的多元地图知识模型可以更加全面、准确的确定与兴趣点匹配的查询词。而进行语义相关性建模的素材正是从训练好的多元地图知识模型中提取出的兴趣点和匹配的查询词,进而得到能够从语义层面准确体现用户搜索习惯的语义对应关系,最终借助该语义对应关系得以准确的确定出目标兴趣点,提升了兴趣点查询服务的查询结果准确性。
11.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
13.图1是本公开可以应用于其中的示例性系统架构;
14.图2为本公开实施例提供的一种地图兴趣点查询方法的流程图;
15.图3为本公开实施例提供的一种构建多元地图知识模型的方法的流程图;
16.图4为基于图3所提供方案构建出的节点关联示意图;
17.图5为本公开实施例提供的一种节点类别确定方法的流程图;
18.图6为本公开实施例提供的一种节点标注方法的流程图;
19.图7为本公开实施例提供的一种地图兴趣点查询装置的结构框图;
20.图8为本公开实施例提供的一种适用于执行地图兴趣点查询方法的电子设备的结构示意图。
具体实施方式
21.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
22.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
23.图1示出了可以应用本公开的地图兴趣点查询方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
24.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
25.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发
送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如地图导航类应用、模型训练类应用、即时通讯类应用等。
26.终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器;服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
27.服务器105通过内置的各种应用可以提供各种服务,以可以提供地图兴趣点查询服务的地图导航类应用为例,服务器105在运行该地图导航类应用时可实现如下效果:首先,接收终端设备101、102、103通过网络104传入的兴趣点查询请求;然后,从兴趣点查询请求中提取出包含的目标查询词;接下来,利用预先确定的查询词与兴趣点之间的语义对应关系,确定与目标查询词对应的目标兴趣点;最后,将确定出的目标兴趣点通过网络104返回至终端设备101、102、103。
28.其中,用于确定语义对应关系的查询词和兴趣点提取自预设的多元地图知识模型,多元地图知识模型记录有兴趣点与多元知识之间的多元对应关系,多元知识包括:地理位置信息、知识图谱信息和输入的查询词。具体的,多元地图知识模型可以由服务器105预先通过内置的模型训练类应用训练得到。
29.需要指出的是,兴趣点查询请求除可以从终端设备101、102、103通过网络104获取到之外,也可以通过各种方式预先存储在服务器105本地。因此,当服务器105检测到本地已经存储有这些数据时(例如开始处理之前留存的待处理查询任务),可选择直接从本地获取这些数据,在此种情况下,示例性系统架构100也可以不包括终端设备101、102、103和网络104。
30.本公开后续各实施例所提供的地图兴趣点查询方法一般由拥有较强运算能力、较多运算资源的服务器105来执行,相应地,地图兴趣点查询装置一般也设置于服务器105中。但同时也需要指出的是,在终端设备101、102、103也具有满足要求的运算能力和运算资源时,终端设备101、102、103也可以通过其上安装的地图导航类应用完成上述本交由服务器105做的各项运算,进而输出与服务器105同样的结果。尤其是在同时存在多种具有不同运算能力的终端设备的情况下,但地图导航类应用判断所在的终端设备拥有较强的运算能力和剩余较多的运算资源时,可以让终端设备来执行上述运算,从而适当减轻服务器105的运算压力,相应的,地图兴趣点查询装置也可以设置于终端设备101、102、103中。在此种情况下,示例性系统架构100也可以不包括服务器105和网络104。
31.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
32.请参考图2,图2为本公开实施例提供的一种地图兴趣点查询方法的流程图,其中流程200包括以下步骤:
33.步骤201:接收输入的兴趣点查询请求;
34.本步骤旨在由地图兴趣点查询方法的执行主体(例如图1所示的服务器105)接收
用户终端(例如图1所示的终端设备101、102、103)通过网络104传入的兴趣点查询请求。
35.其中,该兴趣点查询请求用于表征某用户对某个兴趣点的查询需求,其中至少包含有用于作为查询基础的目标查询词,该目标查询词可以直接表示为明文的文本信息或未加密的语音信号,也可以表现为密文的字符串或加密的语音信号,以满足安全性需求。
36.当然,除了包含有表征目标查询词的基本信息外,还可以包含用户终端的终端信息、用户发起该请求时的当前位置、以及可能包含的兴趣点查询限缩条件,以结合可能影响查询结果的各种信息来提升所得到的查询结果的准确性,以更好的满足用户的需求。
37.步骤202:从兴趣点查询请求中提取出包含的目标查询词;
38.在步骤201的基础上,本步骤旨在由上述执行主体从兴趣点查询请求中提取出包含的目标查询词。
39.具体的,考虑到目标查询词可能表示为不同的形式,在提取时也需要采用正确、匹配的提取方式,例如在目标查询词是以密文或加密的方式包含于兴趣点查询请求中时,还需要预先确定正确的解密密钥或解密规则,从而得到正确的目标查询词;当目标查询词表现为语音信号时,还需要通过语音识别技术来转换得到便于后续处理的文本形式的目标查询词;当兴趣点查询请求中未直接包含目标查询词,而是包含了能够指导从他处获取到目标查询词的相关信息时,还需要能够按照该相关信息从他处正确的获取到目标查询词。
40.步骤203:利用预先确定的查询词与兴趣点之间的语义对应关系,确定与目标查询词对应的目标兴趣点。
41.在步骤202的基础上,本步骤旨在由上述执行主体利用确定的语义对应关系,确定与目标查询词存在对应关系、且该对应关系与该语义对应关系一致的目标兴趣点。
42.其中,用于确定语义对应关系的查询词和兴趣点提取自预设的多元地图知识模型,而该多元地图知识模型记录有兴趣点与多元知识之间的多元对应关系,多元知识包括:地理位置信息、知识图谱信息和输入的查询词。由于该多元地图知识模型以兴趣点为中心还融合有多种不同维度的知识,不仅能够借助这些多元知识更好的理解兴趣点,其它维度的多元知识也能够帮助确定兴趣点与某个维度的知识的关联性。因此本公开选择从融合有多元知识的模型中提取存在匹配关系的兴趣点和查询词,并基于此来确定其在语义层面上的语义对应关系,继承了多元知识所带来好处的同时,也能够尽可能的精简对应关系。
43.具体的,预先确定描述查询词与兴趣点在语义层面上的对应关系的方式,可以为:从多元地图知识模型中提取出真实兴趣点和对应的历史查询词,然后,利用语义相关性建模技术,确定真实兴趣点和对应的历史查询词在语义层面的对应关系,得到语义对应关系。当然,也可以利用其它能够起到相同或类似效果的技术来得到该语义对应关系。
44.应当理解的是,之所以要确定存在匹配关系的查询词和兴趣点之间的语义对应关系,是为了在融合多元知识的情况下,尽可能解释用户在尝试搜索某个兴趣点时体现其搜索习惯的查询词,即实际情况下,查询词往往与兴趣点的官方文本不同,但两者具有相同的语义,也就说是用户在搜索时往往难以准确的记住兴趣点的官方名称,但往往能够基于所表达的语义来自行“编造或命名”一个查询词。
45.为了向用户提供更好的地图兴趣点查询服务,本公开实施例提供的地图兴趣点查询方法,预先基于兴趣点和对应的多元知识构建了多元地图知识模型,由于多元知识覆盖了地理位置信息、知识图谱信息和输入的查询词,因此经过训练的多元地图知识模型可以
更加全面、准确的确定与兴趣点匹配的查询词。而进行语义相关性建模的素材正是从训练好的多元地图知识模型中提取出的兴趣点和匹配的查询词,进而得到能够从语义层面准确体现用户搜索习惯的语义对应关系,最终借助该语义对应关系得以准确的确定出目标兴趣点,提升了兴趣点查询服务的查询结果准确性。
46.为了更好的理解流程200中所使用的多元地图知识模型,本实施例通过图3示出了一种构建多元地图知识模型的方法的流程图,其中流程300包括以下步骤:
47.步骤301:获取处于目标地图区域内的各兴趣点;
48.步骤302:获取与兴趣点对应的地理位置信息、知识图谱信息和输入的查询词;
49.一种具体的获取地理位置信息、知识图谱信息和输入的查询词的方式,包括:
50.获取与兴趣点对应的地理位置编码;在预设的知识图谱中,获取与由兴趣点作为待查询实体对应的兴趣点实体信息;在记录用户操作信息的操作日志(该操作日志的读取已事先获取相应用户的授权)中,获取兴趣点被选择时刻之前用户输入的查询词。
51.其中,地理位置编码可以具体表现为字符串,例如可以是基于geohash(是一种地址编码方法,能够把二维的空间经纬度数据编码成一个字符串)得到或者基于google-s2得到;知识图谱可以是专用于记载与地图兴趣点的实体相关的各种知识的图谱,例如以代表某个餐饮店铺的兴趣点为例,该图谱中可以记载有:客人的评价、对某道菜的评分、人均消费、推荐菜、所在楼层、排队时长、营业时间等等;用户输入的查询词,则用于建立用户输入的查询词与所实际选择的兴趣点的官方名称之间的对应关系。
52.步骤303:将兴趣点作为主节点,并将地理位置信息、知识图谱信息和输入的查询词分别作为主节点的不同从节点,且做主节点与各从节点之间的连线;
53.步骤304:根据用户行为信息,确定不同兴趣点之间的关联关系,并根据关联关系做相应的主节点间的连线,得到节点图;
54.其中,连线的线特征基于所连接的两个节点之间的置信度确定,例如可以通过线的颜色不同来表征不同的置信度,或者通过线的长短、粗细等。
55.步骤305:基于预设的训练任务目标,将节点图通过图神经网络进行预训练,得到满足训练任务目标要求的多元地图知识模型。
56.即本实施例所提供的将各种知识定义为节点、然后建立节点之间连线的方式,能够构建出用于通过图神经网络进行学习的节点图,使得在预设的训练任务目标指导下,可以从节点中记载的连线关系中学习到所需的多元对应关系,进而得到满足训练任务目标要求的多元地图知识模型。图4为基于图3所提供方案构建出的节点关联示意图。
57.具体的,该训练任务目标可以表现为:对每个主节点进行多分类、且多分类的分类结果精度满足预设要求。多分类所指的分类可以是类别、类型、属性的分类,分类结果精度则用于表示准确性。
58.本实施例采用图神经网络作为模型架构,将兴趣点(通常表现为文本形式的名称)作为主节点,将与该兴趣点对应的地理位置信息、知识图谱信息、输入的查询词分别作为该主节点的不同从节点,并建立表现为主节点与从节点之间、主节点与主节点之间的连线的节点图,将节点图作为训练样本按照图神经网络进行训练,进而得到尽可能的体现兴趣点多元知识关联的多元地图知识模型。
59.应当理解的是,除本实施例所采用的图神经网络外,也可以采用能够起到类似效
果的其它模型作为架构,本实施例仅以图神经网络作为一个优选例子来描述整个过程,其它应用场景可自行根据场景下所有可能存在的限制条件或约束,选择其它模型,此处不做具体限定。
60.在流程300所示实施例的基础上,为了尽可能的提升模型训练效果、缩短模型训练耗时,还可以采用二次预训练技术。具体实现过程可以为:
61.从已训练好的用于自然语言处理的模型中,获取与文本内容相关的网络结构的训练后参数;
62.将训练后参数作为图神经网络中与文本内容相关的网络结构的初始参数,得到待训练图神经网络;
63.将构建出的节点图通过待训练图神经网络进行预训练。
64.之所以将上述实现过程描述为二次预训练,是因为将该模型(例如常用于自然语言处理领域的bert、ernie、gpt-3等模型)从随机参数开始训练的过程称为一次预训练,而由于本实施例继承了该模型的一次预训练结果,无需再重新从随机参数开始预训练,即图神经网络在继承训练后参数后开始的训练被称为二次预训练。由于继承的仅是与文本内容相关的参数,并不影响图神经网络中与非文本内容相关的网络结构,从而在避免带来负面影响的情况下,提升训练效果、缩短训练耗时。
65.考虑到真实世界中的各项实物不断发展、更新,兴趣点不断增加、替换、更换,基于图3所示实施例所提供的多元地图知识模型,还可以用于确定节点类别,以在帮助确定节点类别的情况下,丰富节点信息,从而进一步的提升各节点之间的关联性。
66.请参考图5,图5为本公开实施例提供的一种节点类别确定方法的流程图,其中流程500包括以下步骤:
67.步骤501:针对多元地图知识模型已收录的第一查询词,获取第一查询词的节点向量表示,并根据节点向量表示确定所属不同类别的概率,且将对应概率最大的类别作为第一查询词的实际类别;
68.其中,节点向量表示基于与自身建立有连接或存在相邻关系的其它节点的信息共同确定得到,因此可以结合各方面信息来正确的表示所属的节点。
69.步骤502:针对多元地图知识模型未收录的第二查询词,确定与第二查询词相似的目标第一查询词,并将对应相似度最高的目标第一查询词的类别确定为第二查询词的实际类别。
70.区别于已收录的第一查询词,第二查询词大多数新产生的查询词,本实施例提供了按照相似性来确定相似的目标第一查询词、并继承目标第一查询词的类别的实现方式。
71.由于多元地图知识模型融合了多维度的知识,而多维度的知识所表现出的与兴趣点的关联,又可以用于解决其它问题,例如基于连接于不同主节点的各从节点间的一致性,来根据一致性的结果进行标注补全或标注调整,以实现无标注兴趣点的自动标注。
72.请参考图6,图6为本公开实施例提供的一种节点标注方法的流程图,其中流程600包括以下步骤:
73.步骤601:基于连接于不同主节点的各从节点间的一致性,对未标注或标注量少于预设数量的主节点和/或从节点,执行标注内容补全操作;
74.步骤602:基于连接于不同主节点的各从节点间的一致性,确定存在标注错误的异
常主节点和/或异常从节点,并对异常主节点和/或异常从节点发起错误标注问询或按执行纠正操作。
75.其中,标注内容补全操作是指将具有标注的节点的标注信息补充至具有一致性的不具有标注或具有少量标注的节点上,以此实现标注信息的补全;错误标注问询旨在通过以问询的方式来确定一致性判断是否存在错误。
76.为加深理解,本公开还结合实际情况,给出了一种具体训练得到多元地图知识模型的实现方案:
77.为了在通用领域预训练模型的基础上,训练出包含多元知识的地图领域的预训练模型,本实施例选择融合以下关键信息:1)poi的基础信息(名称、别名、地址、类别);2)poi的地理位置信息;3)poi领域的知识图谱信息;4)poi相关的用户行为数据。
78.其中,poi的基础信息、地理位置信息、知识图谱信息以及用户行为信息可以表示成图的形式,并在图中具体表现为不同的4中节点,分别是poi、query(查询词)、地理位置信息、以及知识图谱中与poi有关联的标签。
79.每个节点具有自己的特征,主要是文本特征。节点之间通过边相连接,图中主要包含以下几种边:1)poi与poi的路径关系,表示有用户曾从一个poi到另一个poi;2)query和poi的点击关系;3)poi和图谱标签的关系;4)poi和地理位置的关系。该构成的节点图可参见图4。
80.为了更好的建模图中节点之间的关系,本实施例提出了一种基于图神经网络的预训练模型。预训练模型在应用到下游任务时,既可以提供一个类似通用领域的预训练模型供下游任务对文本进行建模,也可以为每个类型的节点学习一个包含丰富信息的向量表示,例如poi向量表示可以充分融合poi的基本属性信息,地理位置,poi与poi的关联,以及poi和query的关联。这些向量可用于地图检索的语义召回、query分析、poi检索和poi的个性化推荐等任务。具体的技术方案如下:
81.在图神经网络中,每个节点的向量表示由其本身的特征信息以及其在图中的邻居节点共同决定。节点本身的特征主要是文本信息,例如poi节点的特征主要有名称、别名、地址、类别,query节点的特征主要是查询词,图谱标签节点的特征包括标签类型、内容、以及相关描述文本,地理位置信息可以表现为字符串,例如基于geohash得到或者基于google-s2得到。
82.由于节点的主要特征为文本,而通用领域的预训练模型对于文本的建模有着非常好的效果,所以可以采用已有的预训练模型例如bert、ernie、gpt-3(均是常用于自然语言处理的深度学习模型)等对节点的文本特征进行建模,最简单的可以取输出层cls(英文全称为classification,可理解为用于下游的分类任务)对应的向量作为节点的初始化向量表示。
83.节点向量的更新基于上一次迭代该节点自身的向量表示以及邻居节点的向量表示,可以表示为如下公式:
84.其中n(u)表示u在图中的邻居节点,hu表示节点u的向量表示,表示节点u的初始化向量表示,表示节点u经过k次迭代之后的向量表示。
85.公式中的aggregate函数负责汇聚节点u在图中的邻居节点的表示,在设计aggregate时,需要考虑地图领域异构图的具体特点。由于图中包含了不同类型的节点以及关系,因此在对邻居节点的表示进行聚合时,为了更好的保留不同类型节点的信息,可以分别对每种节点信息进行聚合,然后再将不同类型节点的信息进行汇总。在对每种类型的邻居节点进行信息聚合时,可以将邻居节点的表示相加,取平均,或者引入attention(注意力)机制根据不同节点对当前节点的重要程度进行加权。由于图中的边天然具有置信度,所以也可以根据边的权重对邻居节点的向量表示进行加权求和。update函数根据上一次迭代时节点本身的向量表示以及汇聚的邻居节点的向量表示来对每个节点的向量表示进行更新。该函数的设计可以有多种方案,例如将节点表示和邻居节点的表示分别经过线性层之后进行相加,再经过一层非线性变换得到更新后的向量表示。
86.迭代次数k表示最多用到一个节点的k跳邻居信息。最终图中每个节点的表示可以单独取第k次迭代后的节点表示也可以将与初始的进行结合(例如拼接),或者将到的表示进行结合来作为最终的节点表示,这种方式的优点是可以更多的保留节点自身重要的特征信息,如文本描述信息。
87.本实施例设计的预训练任务为节点预测,目标为预测poi节点属于哪个类别(地图领域对poi进行了类别划分,每个poi都被打上了一个类别)。对于节点预测,可以将其看作一个分类任务,将待预测的节点表示经过一个简单的网络结构,例如线性层,再经过一个softmax(归一化)层,预测所属的类别。模型训练的损失函数可以采用交叉熵损失函数。
88.进一步参考图7,作为对上述各图所示方法的实现,本公开提供了一种地图兴趣点查询装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
89.如图7所示,本实施例的地图兴趣点查询装置700可以包括:兴趣点查询请求接收单元701、目标查询词提取单元702、目标兴趣点确定单元703。其中,兴趣点查询请求接收单元701,被配置成接收输入的兴趣点查询请求;目标查询词提取单元702,被配置成从兴趣点查询请求中提取出包含的目标查询词;目标兴趣点确定单元703,被配置成利用预先确定的查询词与兴趣点之间的语义对应关系,确定与目标查询词对应的目标兴趣点;其中,用于确定语义对应关系的查询词和兴趣点提取自预设的多元地图知识模型,多元地图知识模型记录有兴趣点与多元知识之间的多元对应关系,多元知识包括:地理位置信息、知识图谱信息和输入的查询词。
90.在本实施例中,地图兴趣点查询装置700中:兴趣点查询请求接收单元701、目标查询词提取单元702、目标兴趣点确定单元703的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-203的相关说明,在此不再赘述。
91.在本实施例的一些可选的实现方式中,地图兴趣点查询装置700还可以包括:
92.信息提取单元,被配置成从多元地图知识模型中提取出真实兴趣点和对应的历史查询词;
93.语义相关性建模单元,被配置成利用语义相关性建模技术,确定真实兴趣点和对应的历史查询词在语义层面的对应关系,得到语义对应关系。
94.在本实施例的一些可选的实现方式中,地图兴趣点查询装置700还可以包括:
95.兴趣点文本信息获取单元,被配置成获取处于目标地图区域内的各兴趣点;
96.多元知识获取单元,被配置成获取与兴趣点对应的地理位置信息、知识图谱信息和输入的查询词;
97.主从节点确定及连线单元,被配置成将兴趣点作为主节点、并将地理位置信息、知识图谱信息、输入的查询词分别作为主节点的不同从节点,且做主节点与各从节点之间的连线;
98.主节点间连线单元,被配置成根据用户行为信息,确定不同兴趣点之间的关联关系,并根据关联关系做相应的主节点间的连线,得到节点图;其中,连线的线特征基于所连接的两个节点之间的置信度确定;
99.预训练单元,被配置成基于预设的训练任务目标,将节点图通过图神经网络进行预训练,得到满足训练任务目标要求的多元地图知识模型。
100.在本实施例的一些可选的实现方式中,多元知识获取单元可以被进一步配置成:
101.获取与兴趣点对应的地理位置编码;
102.在预设的知识图谱中,获取与由兴趣点作为待查询实体对应的兴趣点实体信息;
103.在操作日志中,获取兴趣点被选择时刻之前用户输入的查询词。
104.在本实施例的一些可选的实现方式中,训练任务目标包括:对每个主节点进行多分类、且多分类的分类结果精度满足预设要求。
105.在本实施例的一些可选的实现方式中,地图兴趣点查询装置700还可以包括:
106.已收录查询词类别确定单元,被配置成针对多元地图知识模型已收录的第一查询词,获取第一查询词的节点向量表示,并根据节点向量表示确定所属不同类别的概率,且将对应概率最大的类别作为第一查询词的实际类别;其中,节点向量表示基于与自身建立有连接或存在相邻关系的其它节点的信息共同确定得到;
107.未收录查询词类别确定单元,被配置成针对多元地图知识模型未收录的第二查询词,确定与第二查询词相似的目标第一查询词,并将对应相似度最高的目标第一查询词的类别确定为第二查询词的实际类别。
108.在本实施例的一些可选的实现方式中,地图兴趣点查询装置700还可以包括:
109.节点标注内容补全单元,被配置成基于连接于不同主节点的各从节点间的一致性,对未标注或标注量少于预设数量的主节点和/或从节点,执行标注内容补全操作;
110.异常标注内容处理单元,被配置成基于连接于不同主节点的各从节点间的一致性,确定存在标注错误的异常主节点和/或异常从节点,并对异常主节点和/或异常从节点发起错误标注问询或按执行纠正操作。
111.在本实施例的一些可选的实现方式中,预训练单元可以被进一步配置成:
112.从已训练好的用于自然语言处理的模型中,获取与文本内容相关的网络结构的训练后参数;
113.将训练后参数作为图神经网络中与文本内容相关的网络结构的初始参数,得到待训练图神经网络;
114.将构建出的节点图通过待训练图神经网络进行预训练。
115.本实施例作为对应于上述方法实施例的装置实施例存在。
116.为了向用户提供更好的地图兴趣点查询服务,本公开实施例提供的地图兴趣点查
询装置,预先基于兴趣点和对应的多元知识构建了多元地图知识模型,由于多元知识覆盖了地理位置信息、知识图谱信息和输入的查询词,因此经过训练的多元地图知识模型可以更加全面、准确的确定与兴趣点匹配的查询词。而进行语义相关性建模的素材正是从训练好的多元地图知识模型中提取出的兴趣点和匹配的查询词,进而得到能够从语义层面准确体现用户搜索习惯的语义对应关系,最终借助该语义对应关系得以准确的确定出目标兴趣点,提升了兴趣点查询服务的查询结果准确性。
117.根据本公开的实施例,本公开还提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现上述任意实施例所描述的地图兴趣点查询方法。
118.根据本公开的实施例,本公开还提供了一种可读存储介质,该可读存储介质存储有计算机指令,该计算机指令用于使计算机执行时能够实现上述任意实施例所描述的地图兴趣点查询方法。
119.根据本公开的实施例,本公开还提供了一种计算机程序产品,该计算机程序在被处理器执行时能够实现上述任意实施例所描述的地图兴趣点查询方法。
120.图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
121.如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
122.设备800中的多个部件连接至i/o接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
123.计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如地图兴趣点查询方法。例如,在一些实施例中,地图兴趣点查询方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到ram 803并由计算单元801执行时,可以执行上文描述的地图兴趣点查询方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当
的方式(例如,借助于固件)而被配置为执行地图兴趣点查询方法。
124.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
125.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
126.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
127.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
128.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
129.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器
(vps,virtual private server)服务中存在的管理难度大,业务扩展性弱的缺陷。
130.为了向用户提供更好的地图兴趣点查询服务,本公开实施例预先基于兴趣点和对应的多元知识构建了多元地图知识模型,由于多元知识覆盖了地理位置信息、知识图谱信息和输入的查询词,因此经过训练的多元地图知识模型可以更加全面、准确的确定与兴趣点匹配的查询词。而进行语义相关性建模的素材正是从训练好的多元地图知识模型中提取出的兴趣点和匹配的查询词,进而得到能够从语义层面准确体现用户搜索习惯的语义对应关系,最终借助该语义对应关系得以准确的确定出目标兴趣点,提升了兴趣点查询服务的查询结果准确性。
131.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
132.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1