灌装领域标签文字检测方法、装置、设备及可读存储介质与流程

文档序号：37043078发布日期：2024-02-20 20:37阅读：来源：国知局

技术特征：

1.一种灌装领域标签文字检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的灌装领域标签文字检测方法，其特征在于，在所述步骤s30中，通道注意力机制首先对特征进行全局最大池化和全局平均池化并行处理，接着经过一个全连接层，将特征图进行降维，再使用relu函数进行激活，再经过一个全连接层，将特征图进行升维，然后加和，再通过sigmoid函数对加和后的特征图进行处理，得到归一化注意力权重，最后通过乘法逐通道加权到原始输入的特征图上，得到特征图fc；空间注意力机制将得到的特征图fc进行全局最大池化和全局平均池化并行处理，并将各自生成的特征连接，接着通过7×7卷积操作建立高维空间特征的相关性，再使用sigmoid函数进行处理，获得空间注意力权重，最后通过相乘加权到特征图fc上，得到特征图fs。

3.根据权利要求1所述的灌装领域标签文字检测方法，其特征在于，在所述步骤s40中，所述特征融合网络采用双卷积特征尺度模块对上一步骤中提取的特征图分别使用两组1×1卷积将特征数减半，接着在第一组的1×1卷积后加入一组3×3卷积；第组的1×1卷积后加入两组3×3卷积，提取不同感受野的特征；再按通道进行拼接，得到特征图，再对特征图进行1×1卷积操作，得到特征图；再将特征图行全局平均池化，得到输出，最后将输出经过fex得到权重向量；再将权重向量与输入的特征图进行加和得到最终特征图；fex包括两个全连接层、一个relu激活函数和一个sigmoid函数，fex的计算过程为：，其中，表示计算生成的实数，和分别是全连接层中第一层和第二层的权重参数，，，r表示降维的超参数，用于调节隐层神经元个数。

4.根据权利要求1所述的灌装领域标签文字检测方法，其特征在于，所述特征重塑增强网络对输入的特征图依次使用步长为2的1×1卷积和步长为2的3×3卷积进行降维处理，再进行上采样，得到低级语义特征图；然后将经过步长为2的1×1卷积和步长为2的3×3卷积生成的特征与经过一次步长为2的1×1卷积生成的特征进行拼接，生成特征图ftemp，再将特征图ftemp和低级语义特征图进行逐像素相乘，得到高级特征图。

5.根据权利要求1所述的灌装领域标签文字检测方法，其特征在于，在所述步骤s10中还包括：

6.根据权利要求5所述的灌装领域标签文字检测方法，其特征在于，在使用所述工业标签文字数据集训练所述文字检测网络模型时，首先使用synthtext数据集对所述文字检测网络模型进行两个epoch的训练，得到预训练模型，然后在所述工业标签文字数据集上进行一千个epoch的训练。

7.一种灌装领域标签文字检测装置，其特征在于，包括：

8.根据权利要求7所述的灌装领域标签文字检测装置，其特征在于，还包括模型训练模块，用于制作工业标签文字数据集，定义损失函数，并利用所述工业标签文字数据集训练所述文字检测网络模型，训练过程中，首先使用synthtext数据集对所述文字检测网络模型进行两个epoch的训练，得到预训练模型，然后在所述工业标签文字数据集上进行一千个epoch的训练；所述工业标签文字数据集的文本包括中文、英文、罗马字和艺术字，使用多边形裁剪算法vatti生成概率图的训练标签和阈值图的训练标签，在标签制作过程中，概率图和阈值图的训练标签分别是将文本的多边形标签经过一定偏移量d缩小和扩大产生，偏移量d的计算公式为：，其中，k是标注文本框的周长，a是标注文本框的面积，e是预设的缩放因子；损失函数由概率图损失、阈值图损失和二值化图损失加权和得到，计算如公式为：，其中和的取值分别设置为1和10，概率图损失和阈值图损失采用二进制交叉熵损失，计算如公式为：其中，是采样集，正负样本的比例为1:3；为扩展多边形内侧预测值与标签值之间的距离之和，计算如公式为：，其中为扩展多边形内像素的一组索引，是阈值图的标签，是真实标签值。

9.一种灌装领域标签文字检测设备，其特征在于，包括处理器和存储器，所述处理器执行存储器中存储的计算机程序时实现如权利要求1至6任意一项所述方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述方法。

技术总结
本发明涉及灌装技术领域，提供一种灌装领域标签文字检测方法、装置、设备及可读存储介质，基于DBNet网络模型构建一种低对比度工业标签文字检测网络模型，首先将卷积注意力机制应用于特征提取网络，获取更多重要的文本特征图；其次在特征融合金字塔结构中引入特征尺度分支，丰富上下文信息，使网络自适应地学习不同通道特征的重要性；最后在概率图生成阶段，提出特征重塑增强模块，进一步区分文字和文字边界，提高对文本边界区域的灵敏度，增强文字检测的准确率。

技术研发人员：霍箭东,王玲,张静,张超,张宇航,丁满森
受保护的技术使用者：长春融成智能设备制造股份有限公司
技术研发日：
技术公布日：2024/2/19

完整全部详细技术资料下载

当前第2页1 2