一种图像识别方法和相关装置与流程

文档序号：35285631发布日期：2023-09-01 06:13阅读：21来源：国知局

本申请涉及数据处理，特别是涉及一种图像识别方法和相关装置。

背景技术：

1、图像识别技术能够从图像中获取关键信息，以便利用关键信息进行相关服务。比如，对于银行网点来说，每天来来往往的用户较多，大部分用户都是来办理银行业务(例如存取款等)。为了保障安全性，银行网点通常会采用图像识别技术对银行网点的人群进行分析，以便能够及时应对突发情况。

2、在实际应用中，基于图像识别技术的人群分析具体是指从图像中获取用户聚集所在区域，并估计该区域中的用户数量、密度或分布，以便进行行为分析、拥塞分析、异常检测和事件检测等。准确的人群分析有利于及时发现人群拥挤和异常行为并进行预警，以便采取措施进行疏导，尽可能避免悲剧的发生，更好地保障用户的资产财产和人身安全。

3、然而，对于复杂场景中的人群分析，相关技术中的图像识别技术在人群密度识别时存在识别效率低的问题。

技术实现思路

1、为了解决上述技术问题，本申请提供了一种图像识别方法和相关装置，在确定人群密度特征时，可以更关注人群区域，从而提高人群密度识别的识别效率。

2、本申请实施例公开了如下技术方案：

3、一方面，本申请实施例提供了一种图像识别方法，所述方法包括：

4、获取待识别图像；

5、将所述待识别图像输入图像识别模型中的注意力图生成器，利用所述注意力图生成器中依次连接的第一卷积层和第二卷积层对所述待识别图像进行特征提取，得到所述待识别图像的图像区域特征图；所述图像区域特征图的尺寸与所述待识别图像的尺寸相同，所述第一卷积层包括串联连接的五层卷积层，所述第二卷积层包括依次连接的vgg-16模型的前十层和多个扩张卷积层，所述多个扩张卷积层的扩张率各不相同；

6、利用所述注意力图生成器中的区域输出层对所述待识别图像和所述图像区域特征图进行融合处理，得到所述待识别图像的图像区域分布图；所述图像区域分布图包括多个区域，所述多个区域中的每个区域为人群区域或背景区域；

7、将所述图像区域分布图输入所述图像识别模型中的密度图生成器，利用所述密度图生成器对所述图像区域分布图中所包括的人群区域进行密度特征提取，得到所述人群区域的人群密度特征；

8、根据所述人群区域的人群密度特征，通过所述密度图生成器输出所述待识别图像的人群密度图。

9、另一方面，本申请实施例提供了一种图像识别装置，所述装置包括获取单元、提取单元、融合单元和输出单元：

10、所述获取单元，用于获取待识别图像；

11、所述提取单元，用于将所述待识别图像输入图像识别模型中的注意力图生成器，利用所述注意力图生成器中依次连接的第一卷积层和第二卷积层对所述待识别图像进行特征提取，得到所述待识别图像的图像区域特征图；所述图像区域特征图的尺寸与所述待识别图像的尺寸相同，所述第一卷积层包括串联连接的五层卷积层，所述第二卷积层包括依次连接的vgg-16的前十层和多个扩张卷积层，所述多个扩张卷积层的扩张率各不相同；

12、所述融合单元，用于利用所述注意力图生成器中的区域输出层对所述待识别图像和所述图像区域特征图进行融合处理，得到所述待识别图像的图像区域分布图；所述图像区域分布图包括多个区域，所述多个区域中的每个区域为人群区域或背景区域；

13、所述提取单元，还用于将所述图像区域分布图输入所述图像识别模型中的密度图生成器，利用所述密度图生成器对所述图像区域分布图中所包括的人群区域进行密度特征提取，得到所述人群区域的人群密度特征；

14、所述输出单元，用于根据所述人群区域的人群密度特征，通过所述密度图生成器输出所述待识别图像的人群密度图。

15、又一方面，本申请实施例提供了一种计算机设备，所述计算机设备包括处理器以及存储器：

16、所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

17、所述处理器用于根据所述程序代码中的指令执行以上方面所述的图像识别方法。

18、又一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行以上方面所述的图像识别方法。

19、又一方面，本申请实施例提供了一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行以上方面所述的图像识别方法。

20、由上述技术方案可以看出，可以将获取到的待识别图像输入图像识别模型中的注意力图生成器中，利用注意力图生成器中依次连接的第一卷积层和第二卷积层对待识别图像进行特征提取，得到待识别图像的图像区域特征图，在网络结构方面，第一卷积层包括串联连接的五层卷积层，第二卷积层包括依次连接的vgg-16的前十层和多个扩张卷积层，且多个扩张卷积层的扩张率各不相同，如此，在利用第一卷积层进行特征提取时，可以提取更为丰富以及不同层次的区域特征，从而使得图像区域特征图可以更为准确地区分人群区域和背景区域这两类不同区域。由于图像区域特征图中是抽象的区域特征，以及图像区域特征图的尺寸与待识别图像的尺寸相同，故可以利用注意力图生成器中的区域输出层对待识别图像和图像区域特征图进行融合处理，得到待识别图像的图像区域分布图，基于此，使得图像区域分布图能够更准确地反映待识别图像中的人群区域和背景区域，具体的，图像区域分布图包括多个区域，多个区域中的每个区域为人群区域或背景区域。接着，可以将图像区域分布图输入图像识别模型中的密度图生成器，利用密度图生成器对图像区域分布图中所包括的人群区域进行密度特征提取，得到人群区域的人群密度特征，以及根据人群区域的人群密度特征，通过密度图生成器输出待识别图像的人群密度图，人群密度图能够指示待识别图像中的人群密集情况。基于此，正是利用密度图生成器将人群区域与背景区域进行了识别区分，如此使得在利用密度图生成器确定人群密度特征时，可以更关注人群区域，从而提高人群密度识别的识别效率。

技术特征：

1.一种图像识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述密度图生成器包括依次连接的第三卷积层、mcnn卷积列和密度输出层，所述利用所述密度图生成器对所述图像区域分布图中所包括的人群区域进行密度特征提取，得到所述人群区域的人群密度特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述mcnn卷积列包括三列卷积列和预测卷积层，所述三列卷积列具有的滤波器的大小各不相同，所述根据所述低级特征，利用所述mcnn卷积列确定所述人群区域的人群密度特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述预测卷积层具有的滤波器的大小为一乘一。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1-5中任意一项所述的方法，其特征在于，所述利用所述注意力图生成器中的区域输出层对所述待识别图像和所述图像区域特征图进行融合处理，得到所述待识别图像的图像区域分布图，包括：

7.一种图像识别装置，其特征在于，所述装置包括获取单元、提取单元、融合单元和输出单元：

8.一种计算机设备，其特征在于，所述计算机设备包括处理器以及存储器：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1-6中任意一项所述的方法。

10.一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行权利要求1-6中任意一项所述的方法。

技术总结
本申请公开了一种图像识别方法和相关装置，可应用于人工智能领域或金融领域，将获取到的待识别图像输入图像识别模型中的注意力图生成器中，利用注意力图生成器确定待识别图像的图像区域特征图，图像区域特征图可以区分人群区域和背景区域。由于图像区域特征图中是抽象的区域特征，故对待识别图像和图像区域特征图进行融合处理，得到的图像区域分布图能够更准确地反映待识别图像中的人群区域和背景区域。接着将图像区域分布图输入图像识别模型中的密度图生成器，利用密度图生成器输出人群密度图，人群密度图能够指示待识别图像中的人群密集情况。正是利用密度图生成器区分人群区域与背景区域，使得密度图生成器更关注人群区域，以提高识别效率。

技术研发人员：殷素素,汪兰叶,吕雨慧
受保护的技术使用者：中国银行股份有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：殷素素汪兰叶吕雨慧
技术所有人：中国银行股份有限公司
我是此专利的发明人

上一篇：基于环境要素智能识别监测系统的数据分析方法及系统与流程
上一篇：一种整车性能参数测试方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。