一种地图兴趣点判重的方法、装置及电子设备与流程

文档序号:20918151发布日期:2020-05-29 13:48阅读:来源:国知局

技术特征:

1.一种地图兴趣点判重的方法,其特征在于,所述方法包括:

获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;

获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;

将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。

2.如权利要求1所述的方法,其特征在于,所述在输出判定结果之前,所述方法还包括:

将所述第一地图兴趣点和所述第二地图兴趣点与预设的地图兴趣点白名单和/或黑名单进行对比;

若预设的地图兴趣点白名单和/或黑名单中包含与所述第一地图兴趣点和所述第二地图兴趣点相同的地图兴趣点对,获取预设的地图兴趣点白名单和/或黑名单中所述地图兴趣点对的重复标识;

基于所述重复标识修正所述判定结果;

所述输出判定结果包括:输出修正后的所述判定结果。

3.如权利要求1所述的方法,其特征在于,所述预先训练好的机器学习模型的训练方法包括:

获取参考实例集,所述参考实例集中每个参考实例包括两个地图兴趣点、所述两个地图兴趣点的属性信息以及表征所述两个地图兴趣点是否相同的重复标识;

针对所述每个参考实例,对所述两个地图兴趣点的属性信息进行特征提取并向量化,获得每个地图兴趣点的属性特征;获取所述两个地图兴趣点对应的相同类型的属性特征之间的相似度,并将所述相似度作为所述两个兴趣点之间的交叉特征;

将每个参考实例的两个地图兴趣点对应的所述属性特征、所述交叉特征及所述重复标识作为训练样本进行机器学习模型训练。

4.如权利要求3所述的方法,其特征在于,所述训练样本包括预设比例的正样本和负样本,其中,所述正样本对应的两个地图兴趣点相同,所述负样本对应的两个地图兴趣点不相同。

5.如权利要求1~4任一所述的方法,其特征在于,所述属性特征包括:地图兴趣点的名称、地址、坐标和/或类别;

所述交叉特征包括:名称相似度、地址相似度、坐标之间的距离和/或类别相似度。

6.如权利要求1~4任一所述的方法,其特征在于,所述机器学习模型包括:

线性回归、决策树、随机森林、梯度提升树或者神经网络。

7.一种地图兴趣点判重的装置,其特征在于,所述装置包括:

获取单元,用于获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;

计算单元,用于获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;

判断单元,用于将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,获得判定结果;

输出单元,用于输出所述判定结果。

8.如权利要求7所述的装置,其特征在于,所述装置还包括:

比较单元,用于在输出判定结果之前,将所述第一地图兴趣点和所述第二地图兴趣点与预设的地图兴趣点白名单和/或黑名单进行对比;若预设的地图兴趣点白名单和/或黑名单中包含与所述第一地图兴趣点和所述第二地图兴趣点相同的地图兴趣点对,获取预设的地图兴趣点白名单和/或黑名单中所述地图兴趣点对的重复标识;

所述判断单元,还用于基于所述重复标识修正所述判定结果;

所述输出单元,还用于输出修正后的所述判定结果。

9.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;

获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;

将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:

获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征,所述第一属性特征和所述第二属性特征中均包含n个类型的属性特征,n≥1;

获取所述第一属性特征与所述第二属性特征中相同类型的属性特征之间的相似度,并将所述相似度作为所述第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;

将所述第一属性特征、所述第二属性特征以及所述交叉特征输入预先训练好的机器学习模型中,通过所述机器学习模型对所述第一地图兴趣点和所述第二地图兴趣点是否相同进行判定,并输出判定结果。


技术总结
本发明公开了一种地图兴趣点判重的方法、装置及电子设备,该方法包括:获取待判定的第一地图兴趣点的第一属性特征和第二地图兴趣点的第二属性特征;以及获取第一属性特征与第二属性特征中相同类型的属性特征之间的相似度,并将该相似度作为第一地图兴趣点和所述第二地图兴趣点之间的交叉特征;进而,将第一属性特征、第二属性特征以及交叉特征输入预先训练好的机器学习模型中,通过机器学习模型对第一地图兴趣点和所述第二地图兴趣点是否相同进行判定并输出判定结果,使得兴趣点的判重基于兴趣点的各属性特征、各属性特征之间的相似度等多个维度以全局最优的方式进行判定,解决了现有技术中POI判重存在的准确率差的技术问题,提高了判重准确率。

技术研发人员:高彬;罗京;杨雨然
受保护的技术使用者:北京搜狗科技发展有限公司
技术研发日:2018.11.22
技术公布日:2020.05.29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1