一种多边形区域检测方法及装置与流程

文档序号:18454657发布日期:2019-08-17 01:30阅读:175来源:国知局
一种多边形区域检测方法及装置与流程

本申请涉及互联网技术领域,尤其涉及一种多边形区域检测方法、装置及计算机存储介质和电子设备。



背景技术:

随着图像处理技术的不断发展,检测图像中多边形区域的场景也越来越多。例如,在实名制认证过程中,用户可以上传本人与身份证同框的照片,认证系统需要检测该照片中身份证所在的四边形区域,从而进行身份证信息的识别。

在相关技术中,检测图像中多边形区域主要利用lsd算法。通过lsd算法可以计算出图像中的直线段,然后根据这些直线段构建出多边形区域。然而,由于图像中存在大量干扰因素,例如背景噪声、线段微小弯曲、线段相交等,容易将一条完整的线段打断成为很多的短线段。为了提升处理效率,现有技术中,会删除短于与阈值的短线段,由于这些短线段很有可能是多边形区域边长的一部分,因此这样的处理方式会影响多边形区域检测的准确性。



技术实现要素:

有鉴于此,本申请提供一种多边形区域检测方法、装置及计算机存储介质和电子设备,用于解决上述的多边形区域检测准确性不高的问题。

具体地,本申请是通过如下技术方案实现的:

根据本说明书实施例的第一方面,提供一种多边形区域检测方法,所述方法包括:

获取待检测的图像;

基于直线检测算法,计算出所述图像中的线段;

将满足合并条件的线段合并成一条线段;

根据所述合并后的线段,确定出所述合并后的线段之间的交叉点;

在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域。

可选的,所述将满足合并条件的线段合并成一条线段,具体包括:

获取任意相邻的两条线段;

计算所述两条线段位于相同坐标轴上的投影长度;

当所述投影长度短的一条线段的两个端点与所述另一条线段的垂直距离均小于阈值时,将所述两条线段合并成一条线段。

可选的,所述将所述两条线段合并成一条线段,具体包括:

获取所述两条线段的两个相距最远的端点;

连接所述两个端点,得到合并后的线段。

可选的,所述根据所述合并后的线段,确定出所述合并后的线段之间的交叉点,具体包括:

以所述图像中心为原点,以顺时针或者逆时针设置所述合并后的线段方向,得到线段向量;

获取所述线段向量之间相交的点;

在所述相交的点满足交叉点条件时,确定出所述相交的点为交叉点。

可选的,所述多边形区域为四边形区域时,所述在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域,具体包括:

当任意四个所述交叉点满足生成四边形区域条件时,在所述图像中以所述四个交叉点为四边形区域的顶点,生成四边形区域。

可选的,所述生成四边形区域条件,具体包括:

以图像中心点为坐标原点,获取同一坐标轴下坐标值大于0和小于0的两个交叉点,设为a和b;

获取a的入射线段向量和b的出射线段向量构成的交点,设为c;

获取a的出射线段向量和b的入射线段向量构成的交点,设为d;

在所述c和d均满足交叉点条件时,确定所述a、b、c、d满足生成四边形区域条件;

其中,所述入射线段向量为指向交叉点的线段向量;所述出射线段向量为从交叉点出发的线段向量。

可选的,所述交叉点条件包括以下至少一种:

交叉点位于所述图像内;

以交叉点为终点时,线段向量的入射方向与向量方向相同,以及以交叉点为起点时,线段向量的出射方向与向量方向相同;

两条线段向量构成的内角符合设定的角度范围。

可选的,所述方法还包括:

计算所述多边形区域的占空比;

在所述多边形区域的占空比不满足占空比条件时,删除所述多边形区域。

可选的,所述占空比条件,包括以下至少一种:

任意i条边的占空比之和大于第i预设占空比;

n条边的占空比之和大于第n预设占空比;

其中,i为[1,n],n为多边形区域边长数量;所述多边形的每一条边的占为:该边的实际长与该边的边长的比值;第i预设占空比大于第i-1预设占空比;所述占空比为(0,1)。

可选的,所述方法还包括:

当生成多个多边形区域时,计算每个多边形区域的特征参数;

根据所述多边形区域的特征参数,对所述多边形区域进行排序;

将排序最靠前的预设数量的多边形区域确定为最优的多边形区域。

可选的,所述根据所述多边形区域的特征参数,对所述多边形区域进行排序,具体包括:

计算两个多边形区域的特征参数之间的差值;

根据所述差值与排序关系的映射关系,确定所述两个多边形区域的先后顺序。

可选的,在存在多个特征参数时,所述特征参数还对应有系数。

可选的,所述特征参数包括以下至少一种:

第一特征参数;所述第一特征参数表示四边形的总占空比;

第二特征参数;所述第二特征参数表示四边形的每条边在主方向的投影长度和该主方向上图像长度的比值之和;

第三特征参数;所述第三特征参数表示四边形和矩形的相似程度;

第四特征参数;所述第四特征参数表示四边形内外灰度的kl散度。

根据本说明书实施例的第二方面,提供一种多边形区域检测装置,所述装置包括:

获取单元,获取待检测的图像;

计算单元,基于直线检测算法,计算出所述图像中的线段;

合并单元,将满足合并条件的线段合并成一条线段;

确定单元,根据所述合并后的线段,确定所述合并后的线段之间的交叉点;

生成单元,在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域。

根据本说明书实施例的第三方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述实施例中任一所述的多边形区域检测方法。

根据本说明书实施例的第四方面,提供一种电子设备,包括:

处理器;

用于存储处理器可执行指令的存储器;

所述处理器被配置为实现上述实施例中任一所述的多边形区域检测方法。

本申请实施例,提供了一种多边形区域检测方案,可以将大量满足合并条件的短线段合并为一条线段。即减少了线段数量从而提升了后续处理效率,还由于没有删除短线段,因此最大可能的保留了图像中的线段信息,进而可以有效提升多边形区域检测的准确性。

附图说明

图1是本申请一示例性实施例示出的一种多边形区域检测方法的流程图;

图2是本申请一示例性实施例示出的一待检测图像和计算出的线段的示意图;

图3是本申请一示例性实施例示出的投影长度的示意图;

图4是图3中线段a和b合并后的示意图;

图5是本申请一示例性实施例示出的线段设置方向的示意图;

图6是本申请一示例性实施例示出的线段向量相交的示意图;

图7是本申请一示例性实施例示出的四个相交点的示意图;

图8是本申请一示例性实施例示出的另一种四个相交点的示意图;

图9是图2所示待检测图像检测得到的多边形区域的示意图;

图10是图2所示待检测图像经过处理后最终确定的排序第一的多边形区域的示意图;

图11是本申请一示例性实施例示出的一种多边形区域检测装置的硬件结构图;

图12是本申请一示例性实施例示出的一种多边形区域检测装置的模块示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

图1是本申请一示例性实施例示出的一种多边形区域检测的方法流程图,所述方法可以应用在多边形区域检测的服务器(以下简称为服务器)中,该方法具体可以包括如下步骤:

步骤110:获取待检测的图像。

本申请实施例中,服务器可以获取检测的图像。

步骤120:根据直线检测算法,计算出所述图像中的线段。

本申请实施例,提供了一种直线检测算法用于计算出待检测的图像中的线段。所述线段一般可以为直线段。所述直线检测算法是一种可以在线性时间内快速检测图像中直线段的检测方法。所述直线检测算法可以包括但不限于lsd(alinesegmentdetector)算法、hough算法等。

举例说明,图2所示为直线检测算法计算出的线段的示意图。该示例为实名制认证场景下,用户上传的手持身份证(由于涉及到隐私信息,图中以隐去身份证上具体信息)的照片(图2中左侧的示意图);服务器在获取到用户上传的照片后,根据直线检测算法以lsd算法为例,可以计算出图2中右侧所示的线段的示意图。可以看出,计算出的线段中存在非常多的短线段。本申请实施例与现有技术不同之处在于,并不删除其中的短线段,而是根据下述步骤130,合并短线段。

步骤130:将满足合并条件的线段合并成一条线段。

本申请实施例中,提供了一种线段合并方案,可以将大量满足合并条件的短线段合并为一条线段。这样,即减少了线段数量从而提升了后续处理效率,还由于没有删除短线段,因此最大可能的保留了图像中的线段信息,进而可以检测出图像中尽可能多的多边形区域。

在一实施例中,所述步骤130,具体可以包括:

a1:获取任意相邻的两条线段。

a2:计算所述两条线段位于相同坐标轴上的投影长度。

a3:当所述投影长度短的一条线段的两个端点与所述另一条线段的垂直距离均小于阈值时,将所述两条线段合并成一条线段。

a4:当所述投影长度短的一条线段的两个端点与所述另一条线段的垂直距离不都小于阈值时,不做合并处理。

所述投影长度可以是指线段投影在坐标轴上的长度。以直角坐标系为例,所述坐标轴可以是横坐标(x轴),也可以是纵坐标(y轴),可以预先设定。如图3所示的投影长度示意图,相同长度的线段a和b,投影在x轴上的长度分别为a和b。由于a大于b,因此,需要计算投影长度短的线段b的两个端点b1和b2距离线段a的垂直距离,图3中所示b1距离线段a的垂直距离为c;b2距离线段a的垂直距离为d。当c和d均小于阈值时,可以将这两条线段a和b合并成一条线段。

在一实施例中,所述步骤130,具体可以包括:

a5:计算每个线段在极坐标系中的角度,并按照角度值从小到大排序线段。

a6:将排序后第一个线段确定为初始合并线段。

a7:计算所述初始合并线段与其它线段的投影长度。

该步骤与上述步骤a2类似,此处不再赘述。

a3:当所述投影长度短的一条线段的两个端点与所述另一条线段的垂直距离均小于阈值时,将所述两条线段合并成一条线段。

该实施例,通过极坐标系对线段进行排序,将排序后第一个线段作为初始合并线段,令初始合并线段依次与其它线段比较(执行步骤a7),不断合并满足a3的线段;在没有线段可以和初始合并线段合并时,对于剩余的线段,重新执行上述步骤a5、a6、a7、a3;直至没有线段可以合并为止。

在一实施例中,所述步骤a3,具体可以包括:

a31:获取所述两条线段的两个相距最远的端点。

a32:连接所述两个端点,得到合并后的线段。

a33:删除原有的所述两条线段。

如图4所示为图3中线段a和b(虚线表示)合并后的示意图。该图中,合并线段方式即为:连接线段a和b的两个相距最优的端点即a1和b2,得到合并后线段c(实线表示)。再删除原有的线段a和b。

步骤140:根据所述合并后的线段,确定出所述合并后的线段之间的交叉点。

本申请实施例中,还提供了一种线段之间交叉点确定的方案,用于计算得到用于构建多边形区域的交叉点。

在一实施例中,所述步骤140,具体可以包括:

b1:以所述图像中心为原点,以顺时针或者逆时针设置所述合并后的线段方向,得到线段向量。

b2:获取所述线段向量之间相交的点。

b3:在所述相交的点满足交叉点条件时,确定出所述相交的点为交叉点。

如图5所示为线段设置方向的示意图。图5中,首先确定图像中心的原点106,然后以逆时针设置所有线段方向,得到线段向量,所有线段向量都是以逆时针方向围绕原点的。

在一实施例中,所述原点确定的方式可以包括,根据所述图像的4个顶点,确定两条对角线;将所述两条对角线的交点确定为原点。

在一实施例中,所述交叉点条件可以包括以下至少一种:

(1)交叉点位于所述图像内;

(2)以交叉点为终点时,线段向量的入射方向与向量方向相同,以及以交叉点为起点时,线段向量的出射方向与向量方向相同;

(3)两条线段向量构成的内角符合设定的角度范围。

在一个实施例中,在上述交叉点条件(1)、(2)和(3)都满足的情况下,可以将线段向量的相交的点确定为交叉点。

如图6所示的线段向量相交的示意图。图中包括线段向量1、2和3。其中,线段向量1和2相交于a,线段向量2和3也相交于a。线段向量1的起点为b,终点为a。线段向量2和3起点均为a,终点分别为c和d。

以下详细描述a点是否为线段向量1和2的交叉点;以及是否为线段向量2和3的交叉点。

1:对于线段向量1和2的相交的点a:

首先,a位于图像内,满足条件(1);

其次,以a为终点时,由于和线段向量1的方向相同;以及以a为起点时,由于和线段向量2的方向相同,满足条件(2);

最后,假设线段向量1和2的内角α位于设定的角度范围内,满足条件(3);

因此,可以确定线段向量1和2的交点a为所述线段向量1和2的交叉点。

2:对于线段向量2和3的相交的点a:

首先,a位于图像内,满足条件(1);

其次,以a为终点时,由于和线段向量3的方向相反;以及以a为起点时,由于和线段向量2的方向相同,不满足条件(2);

即使,假设线段向量2和3的内角β位于设定的角度范围内,满足条件(3);也由于不满足条件(2),交点a不为所述线段向量2和3的交叉点。

在一实施例中,所述角度范围可以为45度至135度之间。当然,这仅是一个示例,在实际应用中,所述角度范围可以根据需求任意设定。

步骤150:在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域。

在实际应用中,n边形存在n个顶点,因此根据n个交叉点,就可以确定一个n边形区域。

以四边形区域为例加以说明,所述步骤150,可以包括:

当任意四个所述交叉点满足构成四边形条件时,在所述图像中以所述四个交叉点为四边形区域的顶点,生成四边形区域。

在实际应用中,根据4个点就可以生成一个四边形。本申请实施例中,服务器当确定了任意四个所述交叉点满足构成四边形条件时,在所述图像中以所述四个交叉点为四边形区域的顶点,生成四边形区域。

在一个实施例中,所述构成四边形条件,具体包括:

以图像中心点为坐标原点,获取同一坐标轴下坐标值大于0和小于0的两个交叉点,设为a和b;

获取a的入射线段向量和b的出射线段向量的相交点,设为c;

获取a的出射线段向量和b的入射线段向量的相交点,设为d;

在所述c和d均满足交叉点条件时,确定所述a、b、c、d满足构成四边形条件;

其中,所述入射线段向量为指向交叉点的线段向量;所述出射线段向量为从交叉点出发的线段向量。

本实施例中,可以假设图像中心点是待检测四边形区域的一部分,因此在相同坐标下,所述待检测四边形区域必定存在一个顶点的坐标大于0、一个顶点的坐标小于0。例如,以图像中心点为原点构建的直角坐标系中,如果图像中心点位于四边形区域内,则该四边形必定有1个顶点的纵坐标大于0,1个顶点的纵坐标小于0。

举例说明,如图7所示的四个相交点的示意图,以图像中心点为坐标原点,可以获取到纵坐标下一个大于0的交叉点a和一个小于0的交叉点b。所述交叉点a对应有入射线段向量1和出射线段向量2,所述交叉点b对应有入射线段向量3和出射线段向量4。图7中,可以看到交叉点a的入射线段向量1和交叉点b的出射线段向量4的相交点为c;交叉点a的出射线段向量2和交叉点b的入射线段向量3的相交点为d。

由于相交点c均满足上述交叉点条件(1)、(2)和(3),因此,所述相交点c也是一个交叉点;

由于相交点d均满足上述交叉点条件(1)、(2)和(3),因此,所述相交点d也是一个交叉点;

综上所述,由于c和d均满足交叉点条件,因此,可以确定所述a、b、c、d满足构成四边形条件;可以在所述图像中以所述a、b、c、d为四边形区域的顶点,生成四边形区域。

在图8所示的另一四个相交点的示意图,同样以图像中心点为坐标原点,可以获取到纵坐标下一个大于0的交叉点a和一个小于0的交叉点b。所述交叉点a对应有入射线段向量1和出射线段向量2,所述交叉点b对应有入射线段向量3和出射线段向量4。图8中,可以看到交叉点a的入射线段向量1和交叉点b的出射线段向量4的相交点为d(图中未示出);交叉点a的出射线段向量2和交叉点b的入射线段向量3的相交点为c。

由于相交点c和d均超出了图像范围,因此,相交点c和d均不满足交叉点条件,也就是说所述a、b、c、d不满足构成四边形条件。

本申请实施例,提供了一种多边形区域检测方案,通过将大量满足合并条件的短线段合并为一条线段。即减少了线段数量从而提升了后续处理效率,还由于没有删除短线段,因此最大可能的保留了图像中的线段信息,进而可以提升多边形区域检测的准确性。

在实际应用中,由于图像的背景干扰因素的存在,会导致检测出的多边形区域数量较多,图像背景越复杂多边形区域数量也就越多。如图9所示的即为前述图2所示待检测图像检测得到的多边形区域示意图,可以看出存在非常多的多边形区域,在如此多的多边形区域中其实大部分都是无意义的,如何从中筛选出最优的多边形区域是一个难题。

为了解决上述问题,在前述图1所示实施例基础上,还可以包括:

计算所述多边形区域的占空比;

在所述多边形区域的占空比不满足占空比条件时,删除所述多边形区域。

在一实施例中,占空比反应了多边形区域边缘的显著程度。一般的,占空比越高,说明边缘越显著,反之,占空比越低,说明边缘越不显著;因此,对于哪些边缘不显著的,明显属于不合理的多边形区域的,需要进行删除。

在一实施例中,所述占空比条件,包括如下至少一种;

任意i条边的占空比之和大于第i预设占空比;

n条边的占空比之和大于第n预设占空比;

其中,i为[1,n],n为多边形区域边长数量;所述多边形的每一条边的占为:该边的实际长与该边的边长的比值;第i预设占空比大于第i-1预设占空比;所述占空比为(0,1)。

在一实施例中,所述实线长为合并成该边前若干线段的实际长度之和。由于多边形的边可能是由若干短线段合并成的,因此多边形每条边的实线长度通常是小于或者等于边长的。

以下以四边形区域为例加以说明,所述四边形区域的占空比条件,包括如下至少一种;

任意一条边的占空比大于第一预设占空比;

任意两条边的占空比之和大于第二预设占空比;

任意三条边的占空比之和大于第三预设占空比;

四条边的占空比之和大于第四预设占空比;

其中,第四预设占空比大于所述第三预设占空比,所述第三预设占空比大于所述第二预设占空比;所述第二预设占空比大于所述第一预设占空比。

在一示范性的示例中,所述四边形区域的占空比条件为上述4个条件均需满足;假设所述第一预设占空比可以为0.125,所述第二预设占空比可以为0.25,所述第三预设占空比可以为0.333,所述第四预设占空比可以为0.45。也就是说,只有在四边形区域的任意一条边的占空比大于0.125;任意两条边的占空比之和大于0.25;任意三条边的占空比之和大于0.333;四条边的占空比之和大于0.45均满足的情况下,这个四边形区域才可以保留;而任意一个条件没有满足的情况下,这个四边形区域就会被删除。

通过本实施例,服务器可以对检测得到的多边形区域进行一次筛选,删除一些不合理的多边形区域。

由于检测出的多边形区域可能存在多个,而服务器实际需要的多边形区域一般是其中最优的一个或者若干个,因此,还需要对从多个多边形区域中选择出最优的多边形区域。为此,在前述图1所示实施例基础上,还可以包括:

c1:当生成多个多边形区域时,计算每个多边形区域的特征参数;

c2:根据所述多边形区域的特征参数,对所述多边形区域进行排序;

c3:将排序最靠前的预设数量的多边形区域确定为最优的多边形区域。

在一实施例中,所述步骤c2:根据所述多边形区域的特征参数,对所述多边形区域进行排序,具体可以包括:

计算两个多边形区域的特征参数之间的差值;

根据所述差值与排序关系的映射关系,确定所述两个多边形区域的先后顺序。

例如,当多边形区域a的特征参数与多边形区域b的特征参数的差值大于0时;可以确定多边形区域a排序高于多边形区域b;

当多边形区域a的特征参数与多边形区域b的特征参数的差值小于0时;可以确定多边形区域a排序低于多边形区域b。

在一实施例中,可以通过设置合理的函数,结合已有的机器学习技术找出多边形区域的特征参数与排序结果之间的规律或者关系。例如,可以采用ranksvm作为排序的函数,通过人工标注的训练样本集(例如100张图像以及对应的多边形区域、每个多边形区域的特征参数、不同多边形区域的排序结果)进行模型训练,从而得出通过多边形区域的特征参数之间的系数、特征参数与排序结果之间的关系以及函数自带的系数。所述ranksvm适用于解决排序问题,其可以将两个样本表示为一个训练数据,当排序高于是可以输出1,反之输出-1。

在一实施例中,模型本质上是一个公式,上述训练出的模型可以为如下公式:

y=<x1-x2>

其中,x1,x2分别为两个多边形区域的特征参数;当y>0时表示x1排序高于x2;当y<0时表示x2排序高于x1

在一实施例中,在所述特征参数为多个时,每个特征参数还对应有权重系数;相应地,上述训练出的模型可以为如下公式:

y=<x1-x2,ω>

其中,ω为特征参数组合时的权重系数,并且所述权重系数可以由以下公式训练得到的:

ξi≥0

i=1,…,n

其中,yi为训练样本集中标注的n个特征参数,ξ为松弛系数;

是模型的优化目标;其中,ω、ξ需要满足条件:

ξi≥0

i=1,…,n

在一实施例中,所述特征参数包括如下至少一种:

第一特征参数;所述第一特征参数表示四边形的总占空比;

第二特征参数;所述第二特征参数表示四边形的每条边在主方向的投影长度和该主方向上图像长度的比值之和;

第三特征参数;所述第三特征参数表示四边形和矩形的相似程度;

第四特征参数;所述第四特征参数表示四边形内外灰度的kl散度。

在一实施例中,所述第一特征参数,可以用于指示四边形边缘的显著程度,并且所述总占空比可以根据如下公式计算得出:

其中,所述实线长为合并成该边前若干线段的实际长度之和。由于四边形的边可能是由若干短线段合并成的,因此四边形每条边的实线长度通常是小于或者等于边长的。

在一实施例中,所述第二特征参数,可以根据如下公式计算得出:

其中,所述主方向为边长投影到x轴或者y轴上的投影长度较长的方向。四边形的每条边都有主方向(x轴方向或者y轴方向)。通常,x轴方向对应的图像的长度为图像的宽,y轴方向对应的图像长度为图像的高。

在一实施例中,所述第三特征参数,可以根据如下公式计算得出:

该特征参数用于表示四边形和矩形的相似程度。

在一实施例中,所述第四特征参数,可以根据如下公式计算得出:

其中,p为四边形内部的灰度值频率分布,q为四边形外部的灰度值频率分布。所述kl散度可以看做p和q之间的不相似的程度,当两个频率分布相同时,kl散度为0;当两个频率分布的差异增大时,kl散度也随之增加。

假设图像中存在3个四边形区域,最内侧的四边形区域(设为1)、中间的四边形区域(设为2)和最外侧的四边形区域(设为3)。其中,1内部的灰度值频率分布为p,1和2之间的灰度值频率分布为q,2和3之间的灰度值频率分布为r。1、2、3之间相互计算kl散度,得到:

四边形区域1和2的kl散度:dkl(p||q);

四边形区域2和3的kl散度:dkl(q||r);

四边形区域1和3的kl散度:dkl(p||r)。

在一实施例中,基于训练好的模型可以对检测出的若干多边形区域进行排序。只需将多个多边形区域的特征参数输入到模型中,就可以得到排序结果。并且,所述模型还可以根据这些排序结果作为新的训练样本,进一步训练模型,从而不断得出更优的系数,不断提升模型排序准确率。

在一实施例中,服务器在对所述多边形区域进行排序完成之后,就可以将排序最靠前的预设数量的多边形区域确定为最优的多边形区域。

在一实施例中,所述预设数量可以是预先设置的。例如,如果仅需要确定最优的一个多边形区域,则预设数量可以设置为1;如果需要10个最优的多边形区域,则预设数量可以设置为10,以此类推。

图10所示为图2所示待检测图像经过上述处理后最终确定的排序第一的多边形区域的示意图。

本申请实施例,对多边形区域筛选中参考的特征参数,不仅考虑了多边形区域边缘颜色指标(第四特征参数),还考虑了多边形区域边缘显著程度(第一特征参数),多边形区域的形状(第二特征参数)等综合评价多边形区域,从而使得优选出的多边形区域准确度更高。

与前述多边形区域检测方法的实施例相对应,本申请还提供了多边形区域检测装置的实施例。

本申请多边形区域检测装置的实施例可以应用在服务器上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图11所示,为本申请多边形区域检测装置所在的一种硬件结构图,除了图11所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中通常根据该多边形区域检测的实际功能,还可以包括其他硬件,对此不再赘述。

请参考图12,在一种软件实施方式中,该多边形区域检测装置可以包括:

获取单元210,获取待检测的图像;

计算单元220,基于直线检测算法,计算出所述图像中的线段;

合并单元230,将满足合并条件的线段合并成一条线段;

确定单元240,根据所述合并后的线段,确定所述合并后的线段之间的交叉点;

生成单元250,在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域。

可选的,所述合并单元230,具体包括:

第一获取子单元,获取任意相邻的两条线段;

第一计算子单元,计算所述两条线段位于相同坐标轴上的投影长度;

合并子单元,当所述投影长度短的一条线段的两个端点与所述另一条线段的垂直距离均小于阈值时,将所述两条线段合并成一条线段。

可选的,所述合并子单元,具体包括:

第二获取子单元,获取所述两条线段的两个相距最远的端点;

连接子单元,连接所述两个端点,得到合并后的线段。

可选的,所述确定单元240,具体包括:

设置子单元,以所述图像中心为原点,以顺时针或者逆时针设置所述合并后的线段方向,得到线段向量;

第三获取子单元,获取所述线段向量之间相交的点;

第二计算子单元,在所述相交的点满足交叉点条件时,确定出所述相交的点为交叉点。

可选的,所述多边形区域为四边形区域时,所述生成单元250,具体包括:

生成子单元,当任意四个所述交叉点满足生成四边形区域条件时,在所述图像中以所述四个交叉点为四边形区域的顶点,生成四边形区域。

可选的,所述生成四边形区域条件,具体包括:

以图像中心点为坐标原点,获取同一坐标轴下坐标值大于0和小于0的两个交叉点,设为a和b;

获取a的入射线段向量和b的出射线段向量构成的交点,设为c;

获取a的出射线段向量和b的入射线段向量构成的交点,设为d;

在所述c和d均满足交叉点条件时,确定所述a、b、c、d满足生成四边形区域条件;

其中,所述入射线段向量为指向交叉点的线段向量;所述出射线段向量为从交叉点出发的线段向量。

可选的,所述交叉点条件包括以下至少一种:

交叉点位于所述图像内;

以交叉点为终点时,线段向量的入射方向与向量方向相同,以及以交叉点为起点时,线段向量的出射方向与向量方向相同;

两条线段向量构成的内角符合设定的角度范围。

可选的,所述装置还包括:

第三计算单元,计算所述多边形区域的占空比;

删除单元,在所述多边形区域的占空比不满足占空比条件时,删除所述多边形区域。

可选的,所述占空比条件,包括以下至少一种:

任意i条边的占空比之和大于第i预设占空比;

n条边的占空比之和大于第n预设占空比;

其中,i为[1,n],n为多边形区域边长数量;所述多边形的每一条边的占为:该边的实际长与该边的边长的比值;第i预设占空比大于第i-1预设占空比;所述占空比为(0,1)。

可选的,所述装置还包括:

第四计算子单元,当生成多个多边形区域时,计算每个多边形区域的特征参数;

排序子单元,根据所述多边形区域的特征参数,对所述多边形区域进行排序;

确定子单元,将排序最靠前的预设数量的多边形区域确定为最优的多边形区域。

可选的,所述排序子单元,具体包括:

第五计算子单元,计算两个多边形区域的特征参数之间的差值;

第二确定子单元,根据所述差值与排序关系的映射关系,确定所述两个多边形区域的先后顺序。

可选的,在存在多个特征参数时,所述特征参数还对应有系数。

可选的,所述特征参数包括以下至少一种:

第一特征参数;所述第一特征参数表示四边形的总占空比;

第二特征参数;所述第二特征参数表示四边形的每条边在主方向的投影长度和该主方向上图像长度的比值之和;

第三特征参数;所述第三特征参数表示四边形和矩形的相似程度;

第四特征参数;所述第四特征参数表示四边形内外灰度的kl散度。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上图12描述了业务监控装置的内部功能模块和结构示意,其实质上的执行主体可以为一种电子设备,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

获取待检测的图像;

基于直线检测算法,计算出所述图像中的线段;

将满足合并条件的线段合并成一条线段;

根据所述合并后的线段,确定出所述合并后的线段之间的交叉点;

在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域。

可选的,所述将满足合并条件的线段合并成一条线段,具体包括:

获取任意相邻的两条线段;

计算所述两条线段位于相同坐标轴上的投影长度;

当所述投影长度短的一条线段的两个端点与所述另一条线段的垂直距离均小于阈值时,将所述两条线段合并成一条线段。

可选的,所述将所述两条线段合并成一条线段,具体包括:

获取所述两条线段的两个相距最远的端点;

连接所述两个端点,得到合并后的线段。

可选的,所述根据所述合并后的线段,确定出所述合并后的线段之间的交叉点,具体包括:

以所述图像中心为原点,以顺时针或者逆时针设置所述合并后的线段方向,得到线段向量;

获取所述线段向量之间相交的点;

在所述相交的点满足交叉点条件时,确定出所述相交的点为交叉点。

可选的,所述多边形区域为四边形区域时,所述在所述图像中以所述交叉点为多边形区域的顶点,生成多边形区域,具体包括:

当任意四个所述交叉点满足生成四边形区域条件时,在所述图像中以所述四个交叉点为四边形区域的顶点,生成四边形区域。

可选的,所述生成四边形区域条件,具体包括:

以图像中心点为坐标原点,获取同一坐标轴下坐标值大于0和小于0的两个交叉点,设为a和b;

获取a的入射线段向量和b的出射线段向量构成的交点,设为c;

获取a的出射线段向量和b的入射线段向量构成的交点,设为d;

在所述c和d均满足交叉点条件时,确定所述a、b、c、d满足生成四边形区域条件;

其中,所述入射线段向量为指向交叉点的线段向量;所述出射线段向量为从交叉点出发的线段向量。

可选的,所述交叉点条件包括以下至少一种:

交叉点位于所述图像内;

以交叉点为终点时,线段向量的入射方向与向量方向相同,以及以交叉点为起点时,线段向量的出射方向与向量方向相同;

两条线段向量构成的内角符合设定的角度范围。

可选的,还包括:

计算所述多边形区域的占空比;

在所述多边形区域的占空比不满足占空比条件时,删除所述多边形区域。

可选的,所述占空比条件,包括以下至少一种:

任意i条边的占空比之和大于第i预设占空比;

n条边的占空比之和大于第n预设占空比;

其中,i为[1,n],n为多边形区域边长数量;所述多边形的每一条边的占为:该边的实际长与该边的边长的比值;第i预设占空比大于第i-1预设占空比;所述占空比为(0,1)。

可选的,还包括:

当生成多个多边形区域时,计算每个多边形区域的特征参数;

根据所述多边形区域的特征参数,对所述多边形区域进行排序;

将排序最靠前的预设数量的多边形区域确定为最优的多边形区域。

可选的,所述根据所述多边形区域的特征参数,对所述多边形区域进行排序,具体包括:

计算两个多边形区域的特征参数之间的差值;

根据所述差值与排序关系的映射关系,确定所述两个多边形区域的先后顺序。

可选的,在存在多个特征参数时,所述特征参数还对应有系数。

可选的,所述特征参数包括以下至少一种:

第一特征参数;所述第一特征参数表示四边形的总占空比;

第二特征参数;所述第二特征参数表示四边形的每条边在主方向的投影长度和该主方向上图像长度的比值之和;

第三特征参数;所述第三特征参数表示四边形和矩形的相似程度;

第四特征参数;所述第四特征参数表示四边形内外灰度的kl散度。

在上述电子设备的实施例中,应理解,该处理器可以是中央处理单元(英文:centralprocessingunit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digitalsignalprocessor,简称:dsp)、专用集成电路(英文:applicationspecificintegratedcircuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-onlymemory,缩写:rom)、随机存取存储器(英文:randomaccessmemory,简称:ram)、快闪存储器、硬盘或者固态硬盘。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1