一种引入注意力机制的自然场景文本检测方法与流程

文档序号:19157004发布日期:2019-11-16 00:57阅读:来源:国知局

技术特征:

1.一种引入注意力机制的自然场景文本检测方法,其特征在于:该方法为:在利用pvanet网络进行下图像采样的过程中,利用中间的文本特征信息的空间关系生成空间注意力模块,空间注意力模块用来捕捉二维空间中对于目标区判定的重要性信息,每次卷积生成的特征信息为i∈r1×h×w,并经过sgmod函数激活,其表达式为:

ws(i)=σf7×7pool(i)(4)

其中f7×7为卷积操作,卷积核为7×7的卷积层,在图像采样的过程中通过unpool池化的方式提取特征用于对目标位特征的逼近生成通道注意力模块,然后经过共享网络mlp进行调整,其表达式为:

wc(i′)=σmlp(unpool(i))=σw1w0i′(5)

式中σ为singmod激活函数,w0∈rc/r×c和w1∈rc×c/r分别为mlp的权重,最后在特征融合的过程中,将通道注意力权重和空间注意力权重构成整个分支注意力模型,其过程表示为:

i′=(ws(i)+1)⊙i(6)

i″=(wc(i′)+1)⊙i′(7)

式中⊙为对应矩阵元素相乘,使注意力通道每个元素值在[0,1]之间。


技术总结
本发明公开了一种引入注意力机制的自然场景文本检测方法,该方法为:在利用PVANet网络进行下图像采样的过程中,利用中间的文本特征信息的空间关系生成空间注意力模块,空间注意力模块用来捕捉二维空间中对于目标区判定的重要性信息,每次卷积生成的特征信息为I∈R1×H×W,并经过sgmod函数激活;在图像采样的过程中通过unpool池化的方式提取特征用于对目标位特征的逼近生成通道注意力模块,然后经过共享网络MLP进行调整;最后在特征融合的过程中,将通道注意力权重和空间注意力权重构成整个分支注意力模型。本发明在提取文本目标特征时更加关注有用信息和抑制无用信息,有效提升了EAST算法检测长文本的能力,在没有损失检测效率的同时提升了检测精度。

技术研发人员:牛作东;李捍东
受保护的技术使用者:贵州大学
技术研发日:2019.08.14
技术公布日:2019.11.15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1