1.一种引入注意力机制的自然场景文本检测方法,其特征在于:该方法为:在利用pvanet网络进行下图像采样的过程中,利用中间的文本特征信息的空间关系生成空间注意力模块,空间注意力模块用来捕捉二维空间中对于目标区判定的重要性信息,每次卷积生成的特征信息为i∈r1×h×w,并经过sgmod函数激活,其表达式为:
ws(i)=σf7×7pool(i)(4)
其中f7×7为卷积操作,卷积核为7×7的卷积层,在图像采样的过程中通过unpool池化的方式提取特征用于对目标位特征的逼近生成通道注意力模块,然后经过共享网络mlp进行调整,其表达式为:
wc(i′)=σmlp(unpool(i))=σw1w0i′(5)
式中σ为singmod激活函数,w0∈rc/r×c和w1∈rc×c/r分别为mlp的权重,最后在特征融合的过程中,将通道注意力权重和空间注意力权重构成整个分支注意力模型,其过程表示为:
i′=(ws(i)+1)⊙i(6)
i″=(wc(i′)+1)⊙i′(7)
式中⊙为对应矩阵元素相乘,使注意力通道每个元素值在[0,1]之间。