多特征融合的同名小区辨别方法及系统与流程

文档序号:21040583发布日期:2020-06-09 20:39阅读:367来源:国知局
多特征融合的同名小区辨别方法及系统与流程

本发明涉及信息处理技术领域,更具体地,涉及一种多特征融合的同名小区辨别方法。



背景技术:

随着互联网的快速普及和发展,房屋租售平台大量涌现。房产经纪人将房源信息发布在各个租售平台,以便用户通过设置筛选条件的方式,在房源网站上查找到所需的房源信息。

但是,在某些应用场景下,若小区a的别名是小区b,而不同的房产经纪人在发布该房源信息时可能会使用不同的小区名称,这就导致用户在搜索房源信息时,无法辨别二者是否为相同房源;此外,在另一应用场景下,若存在名称相同或相近的两个小区,用户可能会误认为两个小区是同一房源。

为解决上述问题,现有技术中判断两个小区名是否为同一小区的方法是:首先,判断两个小区所在的城市和城区是否均相同;若相同,则进一步计算两个小区名称的文本相似度,如果文本相似度大于等于90%,则判定两个小区为同一小区。

然而,上述同名小区的辨别方法中,当某一小区存在文本相似度小于90%的别名,或是两个不同小区的名称的文本相似度超过90%时,会出现很高的误判频率,大大降低了辨别准确率。



技术实现要素:

本发明提供了一种多特征融合的同名小区辨别方法,能够有效提高同名小区的辨别准确率,降低误判风险。

第一方面,本申请提供一种多特征融合的同名小区辨别方法,所述方法包括:

获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;

根据第一经纬度信息和第二经纬度信息,确定所述第一待辨别小区与所述第二待辨别小区之间的距离;

当所述第一待辨别小区与所述第二待辨别小区之间的距离小于或等于第一预设阈值时,获取所述第一待辨别小区的第一图像和第一名称,以及所述第二待辨别小区的第二图像和第二名称;其中,所述第一图像中包含第一待辨别小区的第一楼体,所述第二图像中包含第二待辨别小区的第二楼体;

计算所述第一图像的第一lbp特征值以及所述第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定所述第一图像与所述第二图像之间的图像相似度值;

计算所述第一名称与所述第二名称之间的文本相似度值;

按照预设权重,对所述图像相似度值和所述文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;

根据所述相似性评分,确定辨别结果。

可选地,所述计算所述第一图像的第一lbp特征值以及所述第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定所述第一图像与所述第二图像之间的图像相似度值的步骤,包括:

将预设窗口在所述第一图像/第二图像上滑动,每次滑动时,以所述预设窗口内当前中心点处的第一像素点/第二像素点的像素值为阈值,将所述当前中心点的各个相邻点处的第一像素点/第二像素点的像素值与所述阈值进行比较,得到所述当前中心点对应的第一无符号二进制数/第二无符号二进制数;

将所述第一无符号二进制数/第二无符号二进制数转化为十进制数,得到当前中心点处的第一像素点/第二像素点的lbp特征值;

滑动遍历所述第一图像中非边界区域的各个第一像素点,以及所述第二图像中非边界区域的各个第二像素点后,将获得的各个第一像素点/第二像素点的lbp特征值,作为所述第一图像/第二图像的第一lbp特征值/第二lbp特征值;

计算所述第一lbp特征值与所述第二lbp特征值之间的余弦相似度,作为所述第一图像与所述第二图像之间的图像相似度值。

可选地,所述预设窗口的大小为3×3;

计算所述当前中心点对应的第一无符号二进制数/第二无符号二进制数的步骤为:

判断所述预设窗口内,所述当前中心点的各个相邻点处的第一像素点/第二像素点的像素值是否大于等于所述阈值;如果是,则将所述相邻点标记为“1”;如果否,则将所述相邻点标记为“0”;

按照预设顺序,将所述预设窗口内的各个所述相邻点的标记依次排列,获得8位的第一无符号二进制数/第二无符号二进制数。

可选地,所述获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息的步骤之前,还包括:

获取所述第一待辨别小区所在的第一城市和第一城区,以及所述第二待辨别小区所在的第二城市和第二城区;

比较所述第一待辨别小区所在的第一城市与所述第二待辨别小区所在的第二城市是否相同;如果否,则辨别结果为所述第一待辨别小区与所述第二待辨别小区不是同一小区;

如果是,则比较所述第一待辨别小区所在的第一城区与所述第二待辨别小区所在的第二城区是否相同:如果否,则辨别结果为所述第一待辨别小区与所述第二待辨别小区不是同一小区;如果是,则执行根据第一经纬度信息和第二经纬度信息,确定所述第一待辨别小区与所述第二待辨别小区之间的距离的步骤。

可选地,第一经纬度信息包括第一待辨别小区的第一经度和第一纬度,第二经纬度信息包括第二待辨别小区的第二经度和第二纬度;

所述第一待辨别小区与第二待辨别小区之间的距离采用如下公式计算获得:

式中,d为第一待辨别小区与第二待辨别小区之间的距离,r为地球半径,分别为第一纬度和第二纬度,δλ表示第一经度与第二经度的差值。

可选地,所述根据第一经纬度信息和第二经纬度信息,确定所述第一待辨别小区与所述第二待辨别小区之间的距离的步骤之后,还包括:

当第一待辨别小区与第二待辨别小区之间的距离大于所述第一预设阈值时,辨别结果为所述第一待辨别小区与所述第二待辨别小区不是同一小区。

可选地,所述计算所述第一名称与所述第二名称的文本相似度值的步骤,包括:

对第一名称对应的文本和第二名称对应的文本进行预处理,分别获得第一文本和第二文本;

对所述第一文本和所述第二文本进行分词处理后,利用预先训练好的词向量模型分别对所述第一文本和所述第二文本进行向量化,并获得第一词向量以及第二词向量;

计算所述第一词向量与所述第二词向量的余弦相似度,作为所述第一名称与所述第二名称的文本相似度。

可选地,所述对第一名称对应的文本和第二名称对应的文本进行预处理,分别获得第一文本和第二文本的步骤,包括:

去除所述第一名称对应的文本以及第二名称对应的文本中的无效尾缀和符号类字符,并将大写英文字符转换为小写英文字符,将数字转换为汉字。

可选地,所述根据所述相似性评分,确定辨别结果的步骤,包括:

判断所述相似性评分是否大于等于第二预设阈值;如果是,则辨别结果为所述第一待辨别小区与所述第二待辨别小区是同一小区;如果否,则辨别结果为所述第一待辨别小区与所述第二待辨别小区不是同一小区。

第二方面,本申请提供一种多特征融合的同名小区辨别系统,所述系统包括:

第一获取模块,用于获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;

距离确定模块,用于根据第一经纬度信息和第二经纬度信息,确定所述第一待辨别小区与所述第二待辨别小区之间的距离;

第二获取模块,用于当所述第一待辨别小区与所述第二待辨别小区之间的距离小于等于第一预设阈值时,获取所述第一待辨别小区的第一图像和第一名称,以及所述第二待辨别小区的第二图像和第二名称;

第一计算模块,用于计算所述第一图像的第一lbp特征值以及所述第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定所述第一图像与所述第二图像之间的图像相似度值;

第二计算模块,用于计算所述第一名称与所述第二名称之间的文本相似度值;

评分获得模块,用于按照预设权重,对所述图像相似度值和所述文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;

结果确定模块,用于根据所述相似性评分,确定辨别结果。

与现有技术相比,本发明提供的一种多特征融合的同名小区辨别方法及系统,至少实现了如下的有益效果:

本申请提供的一种多特征融合的同名小区辨别方法及系统,通过获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离;当第一待辨别小区与第二待辨别小区之间的距离小于等于第一预设阈值时,获取第一待辨别小区的第一图像和第一名称,以及第二待辨别小区的第二图像和第二名称;计算第一图像的第一lbp特征值以及第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定第一图像与第二图像之间的图像相似度值;计算第一名称与第二名称之间的文本相似度值;按照预设权重,对图像相似度值和文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;根据相似性评分,确定辨别结果。由于本申请综合考虑了待辨别小区之间的距离、待辨别小区名称之间的文本相似度以及待辨别小区楼体之间的相似度这三个特征,因而能够避免因待辨别小区存在别名、或待辨别小区名称相同而造成的误判,有效提高了辨别准确率。

当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1所示为本申请实施例所提供的多特征融合的同名小区辨别方法的一种流程图;

图2所示为图1实施例所提供的同名小区辨别方法中lbp特征值的计算示意图;

图3所示为本申请实施例所提供的多特征融合的同名小区辨别系统的一种结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

现有技术提供的同名小区辨别方法中,对于处于同一城市和城区的待辨别小区,仅通过文本相似度是否大于等于预设阈值来判断二者是否为同一小区。可以理解,若某一小区存在名称a和别名b,且a与b的文本相似度小于90%,则会将名称a与别名b判定为不同小区;再例如,名称分别为a和b的两个小区由于名称相同或相近,文本相似度大于等于90%,那么此时又会将名称a与别名b判定为同一小区。可见,现有技术提供的同名小区辨别方法只将文本相似度作为判别依据,会出现很高的误判频率,大大降低了辨别准确率。

有鉴于此,本发明提供了一种基于文本相似度的同名小区辨别方法,能够有效提高同名小区的辨别准确率,降低误判风险。

以下将结合附图和具体实施例进行详细说明。

图1所示为本申请实施例所提供的多特征融合的同名小区辨别方法的一种流程图。请参见图1,该同名小区辨别方法包括:

步骤101、获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;

步骤102、根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离;

步骤103、当第一待辨别小区与第二待辨别小区之间的距离小于等于第一预设阈值时,获取第一待辨别小区的第一图像和第一名称,以及第二待辨别小区的第二图像和第二名称;其中,第一图像中包含第一待辨别小区的第一楼体,第二图像中包含第二待辨别小区的第二楼体;

步骤104、计算第一图像的第一lbp(localbinarypattern,局部二值模式)特征值以及第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定第一图像与第二图像之间的图像相似度值;

步骤105、计算第一名称与第二名称之间的文本相似度值;

步骤106、按照预设权重,对图像相似度值和文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;

步骤107、根据相似性评分,确定辨别结果。

具体地,获取第一待辨别小区的第一经纬度信息和第二待辨别小区的第二经纬度信息之后,可以先计算两小区之间的距离,通过距离限定的方式进行初步辨别;然后,对于可能是同一小区的两个待辨别小区,分别获取第一待辨别小区的第一图像和第一名称,以及第二待辨别小区的第二图像和第二名称,并对计算得到的两个小区名称之间的文本相似度值和两小区楼体之间的图像相似度值加权平均;最后,根据加权平均获得的相似性评分,确定辨别结果。

由于本申请综合考虑了待辨别小区之间的距离、待辨别小区名称之间的文本相似度以及待辨别小区楼体之间的相似度这三个特征,因而能够避免因待辨别小区存在别名、或待辨别小区名称相同而造成的误判,有效提高了辨别准确率。

可选地,在上述步骤104中,计算第一图像的第一lbp特征值以及第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定第一图像与第二图像之间的图像相似度值的步骤,包括:

将预设窗口在第一图像/第二图像上滑动,每次滑动时,以预设窗口内当前中心点处的第一像素点/第二像素点的像素值为阈值,将当前中心点的各个相邻点处的第一像素点/第二像素点的像素值与阈值进行比较,得到当前中心点对应的第一无符号二进制数/第二无符号二进制数;

将第一无符号二进制数/第二无符号二进制数转化为十进制数,得到当前中心点处的第一像素点/第二像素点的lbp特征值;

滑动遍历第一图像中非边界区域的各个第一像素点,以及第二图像中非边界区域的各个第二像素点后,将获得的各个第一像素点/第二像素点的lbp特征值,作为第一图像/第二图像的第一lbp特征值/第二lbp特征值;

计算第一lbp特征值与第二lbp特征值之间的余弦相似度,作为第一图像与第二图像之间的图像相似度值。

具体地,预设窗口的大小可以为3×3。

lbp是计算机视觉中常用的一种描述符,对于单调的灰度变化具有很强的鲁棒性。因此,在计算第一lbp特征值和第二lbp特征值之前,可以先将第一图像和第二图像转化为灰度图。

图2所示为图1实施例所提供的同名小区辨别方法中lbp特征值的计算示意图。请参见图2,以大小为3×3的预设窗口为例,当预设窗口在第一图像/第二图像上滑动时,将预设窗口内当前中心点处的第一像素点/第二像素点的像素值c作为阈值;然后,将当前中心点的各个相邻点处的第一像素点/第二像素点的像素值p0、p1、…、p6、p7与阈值c进行比较,得到当前中心点对应的第一无符号二进制数/第二无符号二进制数。

可选地,计算当前中心点对应的第一无符号二进制数/第二无符号二进制数的步骤为:

s1、判断预设窗口内,当前中心点的各个相邻点处的第一像素点/第二像素点的像素值是否大于等于阈值;如果是,则将相邻点标记为“1”;如果否,则将相邻点标记为“0”;

s2、按照预设顺序,将预设窗口内的各个相邻点的标记依次排列,获得8位的第一无符号二进制数/第二无符号二进制数。

具体地,请结合图2及如下所示的公式:

式中,ai表示当前中心点的相邻点的标记;c表示当前中心点处的第一像素点/第二像素点的像素值,即阈值;pi表示当前中心点的各个相邻点处的第一像素点/第二像素点的像素值。

计算当前中心点对应的第一无符号二进制数/第二无符号二进制数时,如果当前中心点的各个相邻点处的第一像素点/第二像素点的像素值大于等于阈值,则将相邻点标记为“1”;如果当前中心点的各个相邻点处的第一像素点/第二像素点的像素值小于阈值,则将相邻点标记为“0”。

步骤s2中,可以按照顺时针或逆时针的顺序,将预设窗口内的各个相邻点的标记依次排列。可以理解的是,由于预设窗口的大小为3×3,那么当前中心点的相邻点的数量为8个,因而比较后得到的第一无符号二进制数及第二无符号二进制数均为8位。

lbp特征通过对像素点相对灰度的比较,能够精准的描述图像局部的纹理信息。但是,这样的局部化特征缺乏对图像整体信息的粗粒度把握,也使其易受噪声的影响而不够健壮,导致一些特殊的局部结构特征信息丢失。

因此,本实施例中,还可以计算预设窗口对应的所有第一像素点/第二像素点的像素值的平均值,将该平均值作为阈值,并进行后续的比较。这样不仅能够解决局部特征信息丢失的问题,也能够捕捉图像的大尺度结构;同时,对于一定范围内的旋转、光线变化也具有较强的鲁棒性,从而提高了图像相似度值的计算准确性。

可选地,获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息的步骤之前,还包括:

获取第一待辨别小区所在的第一城市和第一城区,以及第二待辨别小区所在的第二城市和第二城区;

比较第一待辨别小区所在的第一城市与第二待辨别小区所在的第二城市是否相同;如果否,则辨别结果为第一待辨别小区与第二待辨别小区不是同一小区;

如果是,则比较第一待辨别小区所在的第一城区与第二待辨别小区所在的第二城区是否相同:如果否,则辨别结果为第一待辨别小区与第二待辨别小区不是同一小区;如果是,则执行根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离的步骤。

显然,若两个待辨别小区是同一小区,那么二者也一定处于相同的城市和城区,即:处于不同城市或城区的两个待辨别小区一定不是同一小区。可见,针对待辨别小区处于不同城市或城区的情况,通过比较第一基本信息和第二基本信息能够快速获得辨别结果,无需再进行后续计算,大大节省了计算资源,提高了算法的实时性。

可选地,第一经纬度信息包括第一待辨别小区的第一经度和第一纬度,第二经纬度信息包括第二待辨别小区的第二经度和第二纬度;

第一待辨别小区与第二待辨别小区之间的距离采用如下公式计算获得:

式中,d为第一待辨别小区与第二待辨别小区之间的距离,r为地球半径,分别为第一纬度和第二纬度,δλ表示第一经度与第二经度的差值。

本实施例中,第一经纬度信息和第二经纬度信息可以通过地图类app获得,地球半径可以取6371km。由于地球是一球体,利用上述公式可以将经纬度转换为地球坐标,从而准确地计算出待辨别小区之间的距离。

可选地,根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离的步骤之后,还包括:

当第一待辨别小区与第二待辨别小区之间的距离大于第一预设阈值时,辨别结果为第一待辨别小区与第二待辨别小区不是同一小区。

其中,预设阈值可以根据待辨别小区的面积来设置。本实施例中,预设阈值可以为1500米。当第一待辨别小区与第二待辨别小区之间的距离大于1500时,可以直接确定二者不是同一小区,大大加快了算法的运算速度。

可选地,计算第一名称与第二名称的文本相似度值的步骤,包括:

对第一名称对应的文本和第二名称对应的文本进行预处理,分别获得第一文本和第二文本;

对第一文本和所述第二文本进行分词处理后,利用预先训练好的词向量模型分别对第一文本和第二文本进行向量化,并获得第一词向量以及第二词向量;

计算第一词向量与第二词向量的余弦相似度,作为第一名称与第二名称的文本相似度。

文本相似度表示了两个或多个文本之间的匹配程度;文本相似度越大,说明文本间的相似程度越高,反之,文本相似度越小,则说明文本间的相似程度越低。具体地,对文本进行向量化时,可以选择不同的向量化粒度。例如,可以以字为单位,也可以以词为单位进行向量化。

可选地,对第一名称对应的文本和第二名称对应的文本进行预处理,分别获得第一文本和第二文本的步骤,包括:

去除第一名称对应的文本以及第二名称对应的文本中的无效尾缀和符号类字符,并将大写英文字符转换为小写英文字符,将数字转换为汉字。

具体地,无效尾缀可以为“小区”、“住宅”、“大厦”等名称中无实际意义的词汇。应当理解,去除第一名称对应的文本和第二名称对应的文本中的无效尾缀,可以避免这些无意义的词汇对计算结果产生不利影响,从而提高计算出的文本相似度的准确性。

此外,去除无效尾缀后,可以进一步将出现在文本中、但对表征文本特征几乎无用的停用词,也从第一名称对应的文本和第二名称对应的文本中剔除。例如,英文中的“a,the,of,and,or”等,中文中的“我,的,是”等。

显然,在计算文本相似度之前,去除停用词不仅可以提高关键词的密度,也能够降低文本的维度,在进一步提高文本相似度的计算准确率的同时,有效提升了算法效率,具备较好的实时性。

可选地,根据相似性评分,确定辨别结果的步骤,包括:

判断相似性评分是否大于等于第二预设阈值;如果是,则辨别结果为第一待辨别小区与第二待辨别小区是同一小区;如果否,则辨别结果为第一待辨别小区与第二待辨别小区不是同一小区。

本发明提供的一种多特征融合的同名小区辨别方法,至少实现了如下的有益效果:

本申请提供的一种多特征融合的同名小区辨别方法,通过获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离;当第一待辨别小区与第二待辨别小区之间的距离小于等于第一预设阈值时,获取第一待辨别小区的第一图像和第一名称,以及第二待辨别小区的第二图像和第二名称;计算第一图像的第一lbp特征值以及第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定第一图像与第二图像之间的图像相似度值;计算第一名称与第二名称之间的文本相似度值;按照预设权重,对图像相似度值和文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;根据相似性评分,确定辨别结果。由于本申请综合考虑了待辨别小区之间的距离、待辨别小区名称之间的文本相似度以及待辨别小区楼体之间的相似度这三个特征,因而能够避免因待辨别小区存在别名、或待辨别小区名称相同而造成的误判,有效提高了辨别准确率。

基于同一发明构思,本申请还提供一种多特征融合的同名小区辨别系统,图3所示为本申请实施例所提供的多特征融合的同名小区辨别系统的一种结构示意图。参见图3,该系统包括:

第一获取模块310,用于获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;

距离确定模块320,用于根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离;

第二获取模块330,用于当第一待辨别小区与第二待辨别小区之间的距离小于等于第一预设阈值时,获取第一待辨别小区的第一图像和第一名称,以及第二待辨别小区的第二图像和第二名称;

第一计算模块340,用于计算第一图像的第一lbp特征值以及第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定第一图像与第二图像之间的图像相似度值;

第二计算模块350,用于计算第一名称与第二名称之间的文本相似度值;

评分获得模块360,用于按照预设权重,对图像相似度值和文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;

结果确定模块370,用于根据相似性评分,确定辨别结果。

由于本申请综合考虑了待辨别小区之间的距离、待辨别小区名称之间的文本相似度以及待辨别小区楼体之间的相似度这三个特征,因而能够避免因待辨别小区存在别名、或待辨别小区名称相同而造成的误判,有效提高了辨别准确率。

本申请提供的一种多特征融合的同名小区辨别方法及系统,通过获取第一待辨别小区的第一经纬度信息,以及第二待辨别小区的第二经纬度信息;根据第一经纬度信息和第二经纬度信息,确定第一待辨别小区与第二待辨别小区之间的距离;当第一待辨别小区与第二待辨别小区之间的距离小于等于第一预设阈值时,获取第一待辨别小区的第一图像和第一名称,以及第二待辨别小区的第二图像和第二名称;计算第一图像的第一lbp特征值以及第二图像的第二lbp特征值,并根据第一lbp特征值和第二lbp特征值,确定第一图像与第二图像之间的图像相似度值;计算第一名称与第二名称之间的文本相似度值;按照预设权重,对图像相似度值和文本相似度值进行加权平均,获得第一待辨别小区与第二待辨别小区之间的相似性评分;根据相似性评分,确定辨别结果。由于本申请综合考虑了待辨别小区之间的距离、待辨别小区名称之间的文本相似度以及待辨别小区楼体之间的相似度这三个特征,因而能够避免因待辨别小区存在别名、或待辨别小区名称相同而造成的误判,有效提高了辨别准确率。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1