一种快速判断文字微博的方法

文档序号:6594904阅读:213来源:国知局
专利名称:一种快速判断文字微博的方法
技术领域
本发明公开了一种快速判断文字微博的方法,属于计算机视觉技术领域。
背景技术
微博作为一种新型的信息交互平台,已经拥有非常可观的用户群。但凡任何(群体)事件的发生,都伴随着微博信息的快速转发。由于纯文字易于判断和检测,例如使用关键字,很多微博用户将长段文字块转换成图片(俗称长微博)进行转发和传递。由于图片的识别和检测还不及文字检测匹配的精度,因此给信息安全带来一定的考验。现有的采用文字检测的方法,无法检测图片里面的文字。更加无法使用关键字匹配,给信息安全带来了很大的隐患。此外,目前的图片匹配只能应用简单的物体匹配,无法精确到内嵌文字,更加无法提取关键字。

发明内容
本发明所要解决的技术问题是:针对目前技术的不足之处,利用边角检测算法判断出检测的图片是不是长微博。本发明为解决上述技术问题采用以下技术方案:一种快速判断文字微博的方法,具体步骤如下:
步骤1.选取一幅待测图片,检测所述待测图片中的Harris边角点并统计边角点个
数;
步骤2.将待测图片平均分成N个条带,统计每个条带中含有的Harris边角点个数,其中,N的取值为自然 数;
步骤3.判断边角点最多的条带是否包含文字:
(301)如果边角点最多的条带不包含文字,则判断待测图片不包含长段文字;
(302)如果边角点最多的条带包含文字,进入步骤4;
步骤4.判断边角点最多的条带的相邻条带是否包含文字:
(401)如果边角点最多的条带的相邻条带不包含文字,则判断待测图片不包含长段文
字;
(402)如果边角点最多的条带的相邻条带包含文字,则判断待测图片包含长段文字。进一步的,所述步骤3的判断过程,具体如下:
步骤1.统计条带中相邻的2个Harris边角点之间的距离T ;
步骤2.统计条带中最左边的Harris边角点与图片左侧边的距离Tl,以及条带中最右边的边角点与图片右侧边的距离T2 ;
步骤3.设定条带的宽度为A,当同时满足下述条件时,判断条带包含文字,否则判断该条带不包含文字:
权利要求
1.一种快速判断文字微博的方法,其特征在于,具体步骤如下: 步骤1.选取一幅待测图片,检测所述待测图片中的Harris边角点并统计边角点个数; 步骤2.将待测图片平均分成N个条带,统计每个条带中含有的Harris边角点个数,其中,N的取值为自然数; 步骤3.判断边角点最多的条带是否包含文字: (301)如果边角点最多的条带不包含文字,则判断待测图片不包含长段文字; (302)如果边角点最多的条带包含文字,进入步骤4; 步骤4.判断边角 点最多的条带的相邻条带是否包含文字: (401)如果边角点最多的条带的相邻条带不包含文字,则判断待测图片不包含长段文字; (402)如果边角点最多的条带的相邻条带包含文字,则判断待测图片包含长段文字。
2.如权利要求1所述的一种快速判断文字微博的方法,其特征在于:所述步骤3的判断过程,具体如下: 步骤1.统计条带中相邻的2个Harris边角点之间的距离T ; 步骤2.统计条带中最左边的Harris边角点与图片左侧边的距离Tl,以及条带中最右边的边角点与图片右侧边的距离T2 ; 步骤3.设定条带的宽度为A,当同时满足下述条件时,判断条带包含文字,否则判断该条带不包含文字:a.T < —A ; βb.Tl K 一A ;lic.T2 > —A。10
3.如权利要求1所述的一种快速判断文字微博的方法,其特征在于:步骤2中所述的将待测图片平均分成N个条带,N的取值为10。
4.如权利要求1或2或3所述的一种快速判断文字微博的方法,其特征在于:所述步骤2中是将待测图片沿水平方向或竖直方向平均分成N个条带。
全文摘要
本发明公开了一种快速判断文字微博的方法,根据长段文字含有大量边角的原理,利用边角检测算法判断出检测的图片是不是长微博。本发明可以准确的判断所检测的图片是否属于长微博,进而可以利用目前成熟的OCR技术将长微博图片转换为文字,针对文字进行关键字匹配和检索。
文档编号G06K9/00GK103246885SQ20131015228
公开日2013年8月14日 申请日期2013年4月27日 优先权日2013年4月27日
发明者田海, 朱启兵, 陆玉传 申请人:南京讯思雅信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1