一种地理位置信息点的聚合方法以及装置与流程

文档序号:15445550发布日期:2018-09-14 23:19阅读:297来源:国知局

本发明涉及地理位置信息点领域,具体地,涉及一种地理位置信息点的聚合方法以及装置。



背景技术:

随着互联网的普及与发展,大量服务与应用已经深入渗透到日常生活,基于地理位置信息提供个性化服务已经成为互联网应用的一个重要趋势,基于地理位置信息提供个性化服务能够显著提高用户的服务满意度和粘着度。

在地理位置信息编码的过程中,一般需要政府或图商雇佣专人测绘采集的地理位置坐标数据,或直接向图商购买对方测绘的地理位置信息对应的坐标数据。

然而,现有技术中,自行测绘采集坐标数据或向图商购买坐标数据的成本往往较高,并且坐标数据对应的地点名称比较正式化,不能满足口语化(哩语化)的个性化用户需求。此外,坐标数据的准确度较低。



技术实现要素:

针对现有技术的缺陷,本发明提供一种地理位置信息点的聚合方法,通过获取客户端的订单数据中的地理位置信息点,并对地理位置信息点进行格式化和处理,解决了现有技术中存在的如何为地理位置名称提供较高准确率的经纬度信息,及如何提供满足个性化用户需求的地理位置名称的技术问题。

依据本发明的第一方面,提出了一种地理位置信息点的聚合方法,所述方法包括:

获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;

对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;

采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。

可选地,所述采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,包括:

将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;

对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;

在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;

对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;

在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。

可选地,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:

根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及

将当前数据点的聚合权重加一,得到新的数据点的聚合权重。

可选地,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:

根据以下公式计算得到新的数据点的经纬度信息:

其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。

可选地,所述方法还包括:

在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。

依据本发明的第二方面,提出了一种地理位置信息点的聚合装置,所述装置包括:

获取单元,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;

格式化单元,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;

聚合单元,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。

可选地,所述聚合单元,具体用于:

将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;

对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;

在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;

对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;

在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。

可选地,所述聚合单元,还用于:

根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及

将当前数据点的聚合权重加一,得到新的数据点的聚合权重。

可选地,所述聚合单元,还用于:

根据以下公式计算得到新的数据点的经纬度信息:

其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。

可选地,所述装置还包括:

判断单元,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。

通过上述技术方案,获取订单数据中的多个包含用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息的地理位置信息点;并对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;及采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,不仅可为地理位置名称提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。

图1是本公开一实施例提供的地理位置信息点的聚合方法的流程图;

图2是本公开一实施例提供的地理位置信息点的聚合装置的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

以下对本公开实施例中提及的部分词语进行举例说明。

本公开实施例中提及的用户设备(userequipment,简称ue)是所使用的移动终端或个人计算机(personalcomputer,简称pc)等设备。例如智能手机、个人数码助理(pda)、平板电脑、笔记本电脑、车载电脑(carputer)、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如googleglass、oculusrift、hololens、gearvr)等。

图1是本公开一实施例提供的地理位置信息点的聚合方法的流程图。如图1所示,本公开一实施例提供的地理位置信息点的聚合方法包括:

在步骤s101中,获取订单数据中的多个地理位置信息点。

其中,订单数据是从装载有打车客户端软件的用户设备中获取的,用户设备可为移动终端或pc端等,终端为所持的用于提供运营服务的移动终端或pa端等设备,所述地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息。用户输入的地理位置名称包括订单数据中用户输入的出发地和订单数据中用户输入的目的地。

订单数据中可以产生与用户输入的地理位置名称对应的经纬度信息,由用户在打车行为发生时产生。用户输入地点名称,打车客户端通过gps定位获取经纬度,从而可以得到与用户输入的地理位置名称对应的经纬度信息。

接着,在步骤s102中,对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点。

其中,所述数据点包括用户输入的地理位置名称、与所述地理位置名称对应的经纬度信息和初始聚合权重。具体地,用户输入的地理位置名称包括用户输入的出发地的地点名称和用户输入的目的地的地点名称。对地理位置信息点进行格式化时,会产生聚合权重的初始值。在对数据点进行聚合之前,每个数据点的聚合权重均为初始值1。聚合权重代表了数据点的聚合程度,即用户选择或推荐的程度。具体地,聚合权重代表了聚合后的数据点是由多少个原始数据点聚合成的,没聚合时,即原始数据点,也就是1个点的聚合,2个点聚合其聚合权重就是2,n个点聚合权重就是n。

最后,在步骤s103中,采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。

其中,该步骤具体包括:将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。

具体地,将所述地理位置名称具有相同关键字的数据点放置于待聚合的数据点集合s,对于待聚合的数据点集合s中任意一个数据点,遍历其它数据点,并根据两个数据点的经纬度坐标计算得到与两个数据点分别对应的地理位置信息点的球面距离。在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点。重复上述过程,直到新的数据点无法聚合更多的数据点。也就是说,待聚合的数据点集合s中的剩余的数据点对应的地理位置信息点与该新的数据点对应的地理位置信息点之间的球面距离均大于或等于预设的聚合阈值。在新的数据点无法聚合数据点的情况下,将该新的数据点从待聚合的数据点集合s中移除,并放置于聚合完毕的数据点集合r中,从而得到聚合后的地理位置信息点。其中,待聚合的数据点集合中的各数据点的地理位置名称具有相同的关键字,在将遍历的数据点与当前数据点进行聚合得到新的数据点时,将所述当前数据点的地理位置名称作为所述新的数据点的地理位置名称。此外,对待聚合的数据点集合中的数据点进行聚合之后,根据地理位置名称的相同关键字从聚合完毕的数据点集合中提取地理位置名称具有相同关键字的数据点,并比较各数据点的聚合权重,确定聚合权重最大的数据点作为最终选择的数据点,并根据聚合权重最大的数据点得到与该数据点对应的地理位置信息点。具体地,聚合权重最大的数据点的地理位置名称为与该数据点对应的地理位置信息点的地理位置名称,聚合权重最大的数据点的经纬度信息为与该数据点对应的地理位置信息点的经纬度信息。

在具体的应用中,所述将遍历的数据点与当前数据点进行聚合,得到新的数据点,包括:根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及将当前数据点的聚合权重加一,得到新的数据点的聚合权重。

其中,所述根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息,包括:

根据以下公式计算得到新的数据点的经纬度信息:

其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。需要说明的是,前待聚合数据点即为遍历的数据点。

在本实施例中,所述方法还包括:在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。

随着新的数据点不断从待聚合的数据点集合s中移除,最终待聚合的数据点集合s为空集。在待聚合的数据点集合s为空集后,根据聚合完毕的数据点集合r中所有的新的数据点能够分别得到与之对应的地理位置信息点。由于订单数据是基于用户输入和共同选择的,所以根据聚合后的数据点得到的地理位置信息点不仅可提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地点名称。

本实施例通过获取订单数据中的多个包含用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息的地理位置信息点;并对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;及采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点,不仅可为地理位置名称提供较高准确率的经纬度信息,而且还可提供满足个性化用户需求的地理位置名称。

对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开实施例并不受所描述的动作顺序的限制,因为依据本公开实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开实施例所必须的。

图2是本公开一实施例提供的地理位置信息点的聚合装置的结构示意图。如图2所示,本公开一实施例提供的地理位置信息点的聚合装置包括:

获取单元201,用于获取订单数据中的多个地理位置信息点,地理位置信息点包括用户输入的地理位置名称和与所述地理位置名称对应的经纬度信息;

格式化单元202,用于对每个地理位置信息点进行格式化,得到与所述每个地理位置信息点对应的数据点,所述数据点包括所述地理位置名称、所述经纬度信息和初始聚合权重;

聚合单元203,用于采用类层次聚类算法对所述数据点进行聚合,得到与聚合后的数据点对应的地理位置信息点。

在本公开一可选实施例中,所述聚合单元203,具体用于:

将所述地理位置名称具有相同关键字的数据点放置于第一数据点集合中;

对于所述第一数据点集合中任意一个数据点,遍历所述第一数据点集合中剩余的每一个数据点,并根据两个数据点的经纬度信息计算得到与两个数据点分别对应的地理位置信息点的球面距离;

在所述球面距离小于预设的聚合阈值的情况下,将遍历的数据点与当前数据点进行聚合,得到新的数据点;

对于所述新的数据点,继续遍历所述第一数据点集合中剩余的每一个数据点,并根据所述新的数据点和遍历的数据点的经纬度信息计算得到所述新的数据点对应的地理位置信息点与所述遍历的数据点对应的地理位置信息点的球面距离;

在所述新的数据点对应的地理位置信息点与所述第一数据点集合中剩余的每一个数据点对应的地理位置信息点的球面距离均大于或等于所述预设的聚合阈值的情况下,将所述新的数据点从所述第一数据点集合中移除,并放置于第二数据点集合中,从而得到聚合后的数据点。

在本公开一可选实施例中,所述聚合单元203,还用于:

根据遍历的数据点的经纬度信息和当前数据点的经纬度信息计算得到新的数据点的经纬度信息;以及

将当前数据点的聚合权重加一,得到新的数据点的聚合权重。

在本公开一可选实施例中,所述聚合单元203,还用于:

根据以下公式计算得到新的数据点的经纬度信息:

其中,lati表示当前待聚合数据点的纬度,lngi表示当前待聚合数据点的经度,lats表示当前数据点的纬度,lngs表示当前数据点的经度,w表示当前数据点的聚合权重,latr表示新的数据点的纬度,lngr表示新的数据点的经度。

在本公开一可选实施例中,所述装置还包括:

判断单元204,用于在判断所述第一数据点集合为空的情况下,根据所述第二数据点集合中的新的数据点得到与所述新的数据点分别对应的地理位置信息点。

需要说明的是,对于本公开提供的地理位置信息点的聚合装置还涉及的具体细节已在本公开提供的地理位置信息点的聚合方法中作了详细的说明,在此不在赘述。

应当注意的是,在本公开的系统的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本公开不受限于此,可以根据需要对各个部件进行重新划分或者组合,例如,可以将一些部件组合为单个部件,或者可以将一些部件进一步分解为更多的子部件。

本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本公开实施例的系统中的一些或者全部部件的一些或者全部功能。本公开还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本公开的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本公开进行说明而不是对本公开进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上实施方式仅适于说明本公开,而并非对本公开的限制,有关技术领域的普通技术人员,在不脱离本公开的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本公开的范畴,本公开的专利保护范围应由权利要求限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1