一种用以增强文字与背景差异的边缘响应统计变换方法与流程

文档序号:11156327阅读:来源:国知局

技术特征:

1.一种用以增强文字与背景差异的边缘响应统计变换方法,其特征在于:包括以下步骤:

步骤A:对于一副输入的包含文本的自然场景图像,计算该图像中的边缘包围框,其中边缘包围框是指对图像中边缘目标可能存在的位置用矩形包围框标注,而边缘目标既包含文字边缘目标,也可能包含其它物体边缘目标;依据边缘包围框的分数对所有边缘包围框递减排序,其中边缘包围框的分数由包围框内完全包含的轮廓个数来确定;按照文字边缘在所有物体边缘目标中的分布特性对排序后的边缘包围框进行筛选,并对筛选出的边缘包围框集合进行加权求和计算,其中权值由反比例函数确定;得到边缘响应特征图;

步骤B:在边缘响应特征图上按行方向依次累加响应值,得到行方向上的统计边缘响应图,简称行统计图;对行统计图计算梯度,得到梯度图;对梯度图取正,并使其与行统计图量纲统一;对量纲统一后的梯度图执行非极大值抑制操作,得到文本行粗定位结果。

2.根据权利要求1所述的一种用以增强文字与背景差异的边缘响应统计变换方法,其特征在于:所述步骤A的具体步骤如下:

步骤A01:对于一副输入的包含文本的自然场景图像,建立一个大小和输入图像一样的边缘响应特征图e,初始赋值均为0;

步骤A02:对于输入原图进行结构化边缘检测得到边缘图像,其中边缘图像由边缘点组成,边缘点的值代表该点是边缘的概率;将近似处于一条直线上的边缘点集中形成边缘段,得到n个边缘段{s1,s2,...,sn};计算边缘段两两之间的相似度a(si,sj),根据相似度为边缘段赋权值wb(si),i=1,2,...,n;依据边缘段权值为边缘包围框评分,得到m个候选边缘包围框{b1,b2,...,bn}及其相应分数{sb1,sb2,...,sbn};

步骤A03:对于在输入图像上产生的m个候选边缘包围框,按照分数sb对边缘包围框递减排序;依据文字边缘在所有物体边缘目标中的分布特性来对边缘包围框进行筛选,使得筛选出的k个包围框尽可能完整地覆盖输入图像中的文本区域,并能够使引入的虚警区域最小化;

步骤A04:将k个边缘包围框加权求和,其中权值是由一个反比例函数确定,反比例函数是f(i)=64/(8+(i-1)),i=1,2,...,k,并对边缘响应特征图e赋值,赋值公式是以上步骤即为边缘响应统计变换过程。

3.根据权利要求1所述的一种用以增强文字与背景差异的边缘响应统计变换方法,其特征在于:所述步骤B具体步骤如下:

步骤B01:在边缘响应特征图e上按行依次累加响应值,按行累加响应值的公式是其中l表示边缘响应变换图e的长度,w表示e的宽度;得到行方向上的统计边缘响应图,简称行统计图,其中行统计图的横坐标表示输入图像中第i行所处的位置,纵坐标表示在第i行上出现文本行的概率;

步骤B02:对行统计图求梯度值,梯度计算公式是得到梯度图;其中梯度图的横坐标表示输入图像中第i行所处的位置,纵坐标表示在第i行上边缘响应变换的强度;第i行梯度值越大,则该行上下的响应值变化越剧烈,那么第i行是文字与背景间隙的概率越大;

步骤B03:对梯度图取正,接着使梯度图与行统计图量纲统一,量纲统一的公式是其中是统一量纲的处理,以便于梯度图与行统计图的观察以及后续的非极大值抑制操作;通过令各梯度值按其幅度值与最大幅度值的比值来加权,使得文字与背景区域更具有区分度;经实验所得常数值κ=3.5,其作用是避免一些梯度幅度值较小的真值被误删;

步骤B04:对量纲统一后的梯度图,执行非极大值抑制操作;在非极大值抑制过程中,设定滑动窗大小为winSize=l/20,其中l是输入图像的长度;得到文本行粗定位结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1