一种局部色调差异的自然场景文字定位方法

文档序号:6508999阅读:126来源:国知局
一种局部色调差异的自然场景文字定位方法
【专利摘要】本发明提供一种局部色调差异的自然场景文字定位方法。本发明不仅利用了文字的纹理特征,而且利用了文字区域与周围区域色调不同的特点,有效地对场景中的文字进行定位。通过取边缘像素点附近的平均色调差,利用该平均色调差与阈值相比较来判断该区域是否含有文字,这样做可以加入区域文字的局部颜色信息,利用文字的颜色一致性与背景的不同来定位文字。且本发明利用自适应的阈值处理方法来得到阈值,该阈值是由所有候选框的上下左右区域的主色调差的平均值得到的,这样做的目的是利用整幅图的颜色信息来为局部颜色信息做贡献,得到的阈值可以表征场景图的文字区域与背景的色调差。本发明能较快地对自然场景中文字进行准确定位。
【专利说明】一种局部色调差异的自然场景文字定位方法
【技术领域】
[0001]本发明属于图像处理和计算机视觉【技术领域】,特别涉及一种自然场景文字定位方法。
【背景技术】
[0002]将场景图片中文字进行自动的检测,分割,识别出来,将对人们的信息获取提供非常大的帮助,也对图像的语义信息的自动理解以及检索有着非常重要的意义。在车载导航系统中,如果能自动的对前方的路标、商铺名称、交通标志等进行定位,识别,那么将为人们的出行提供安全保障,可以提醒驾驶员减速,以及正确的行车路线。多媒体以及计算机的高速发展中,图片以其形象深刻的特殊形式成为传输的重要介质,基于关键词的检索已经不能满足人们的需求,而基于图片内容的检索,已经成为发展的趋势,检索中,文字的定位,识别成为关键的技术,引来越来越多学者的关注,同时文字定位可以为盲人的阅读提供辅助帮助。
[0003]在对场景中文字定位的现有方法的综合学习中,文字定位的方法大致可以分为两种方法:1、基于纹理的文字定位方法;2、基于区域的文字定位方法。基于纹理的文字定位方法,就是利用纹理特征来区分开文字和非文字,将一个或一块区域中是文字的聚类到一起,这种方法的鲁棒性好,但是也造成了算法的复杂度较高。基于区域的文本定位方法,就是依据一块区域的像素符合某种相似性来区分开文字与非文字,比如,可以根据区域内颜色的一致性作为特征,来分开文本以及背景区域,这种方法简单,但是一种特征往往不能满足所有的分类,鲁棒性不足,在处理复杂背景的场景图片表现中不好的效果。

【发明内容】

[0004]本发明所要解决的技术问题是,提供一种能有效对自然场景中文字进行定位,同时速度较快,实用性较强的文字定位方法。
[0005]本发明为解决上述技术问题所采样的技术方案是,一种局部色调差异的自然场景文字定位方法,包括以下步骤:
[0006]I)通过分类器对场景图片进行扫描,以得到候选文字区域对应的候选框;
[0007]2)将场景图片转化为HSI颜色模型,提取色调H分量,计算所有候选框box(i)与相邻区域的主色调差异hue_aver:
【权利要求】
1.一种局部色调差异的自然场景文字定位方法,其特征在于,包括以下步骤: 1)通过分类器对场景图片进行扫描,以得到候选文字区域对应的候选框; 2)将场景图片转化为HSI颜色模型,提取色调H分量,计算所有候选框box(i)与相邻区域的主色调差异hue_aver:

2.如权利要求1所述一种局部色调差异的自然场景文字定位方法,其特征在于,候选框的相邻区域的提取方法为: 当候选框box(i)未有一边位于场景图片的边界,则在候选框box(i)的上下左右各提取一个框,当候选框box(i)有一边位于场景图片的边界,则不在该边界方向取框;对候选框box(i)提取了相邻框后,将这些框合成一个区域作为该候选框的相邻区域box_neighbour (i)。
3.如权利要求1所述一种局部色调差异的自然场景文字定位方法,其特征在于,各候选框中所有边缘像素点与邻居像素点间的平均色调差local_hue(i)的计算方法为:
4.如权利要求1所述一种局部色调差异的自然场景文字定位方法,其特征在于,步骤3)中通过Canny算子求取的边缘图得到边缘像素点。
5.如权利要求1所述一种局部色调差异的自然场景文字定位方法,其特征在于,所述主色调为H分量直方图中的最大色调值。
【文档编号】G06K9/32GK103440487SQ201310377443
【公开日】2013年12月11日 申请日期:2013年8月27日 优先权日:2013年8月27日
【发明者】李宏亮, 黄自力, 姚源, 许静, 孟凡满, 吴庆波, 黄超 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1