一种发言者的识别方法、装置、设备及存储介质与流程

文档序号：37271993发布日期：2024-03-12 21:02阅读：11来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及图像处理，尤其涉及一种发言者的识别方法、装置、设备及存储介质。

背景技术：

1、目前因聋哑人存在不同程度的听力减弱，他们本身具备一定的办公能力，但是在一些大型会议上就会遇到困难，聋哑人即便有手语翻译软件，但仍然没有条件很顺畅的参与到多人的大型会议中。

2、因为手语翻译时无法向聋哑人准确显示具体是谁在发言，聋哑人需要同时关注会议现场人员谁在发言，同时要看翻译内容，容易造成信息的漏失。因此需要一种发言者的识别方法，用于关注弱势群体，使他们更好的融入工作环境。

技术实现思路

1、本公开提供了一种发言者的识别方法、装置、设备及存储介质，以至少解决现有技术中存在的以上技术问题。

2、根据本公开的第一方面，提供了一种发言者的识别方法，该方法包括：

3、获取图像采集装置在目标场所内采集的参会人员的图像，并记录所述参会人员的位置信息；

4、确定与所述位置信息对应的声源序列，组成声源序列数据库；所述声源序列表征所述位置信息的声源传播的路径；

5、获取目标场所内的声源对应的目标声源序列，并从所述声源序列数据库中确定与所述目标声源序列对应的目标位置；

6、基于所述目标位置和所述参会人员的位置信息识别出发言者。

7、在一可实施方式中，所述参会人员的位置信息包括所述参会人员与所述图像采集装置之间的角度。

8、在一可实施方式中，所述确定与所述位置信息对应的声源序列，包括：

9、所述位置信息的声源依次到达多个麦克风的顺序序列为所述位置信息对应的声源序列。

10、在一可实施方式中，所述多个麦克风呈环形阵列设置。

11、在一可实施方式中，所述基于所述目标位置和所述参会人员的位置信息识别出发言者，包括：

12、从所述参会人员的位置信息中确定与所述目标位置相同的位置信息，该位置信息对应的参会人员为发言者。

13、在一可实施方式中，该方法还包括：

14、所述目标场所内参会人员的位置信息变化后，所述图像采集装置重新采集参会人员的图像。

15、在一可实施方式中，识别出发言者后，该方法还包括：

16、显示与所述发言者对应的图像并输出所述发言者的发言内容。

17、根据本公开的第二方面，提供了一种发言者的识别装置，所述装置包括：

18、第一获取模块，用于获取图像采集装置在目标场所内采集的参会人员的图像，并记录所述参会人员的位置信息；

19、声源序列确定模块，用于确定与所述位置信息对应的声源序列，组成声源序列数据库；所述声源序列表征所述位置信息的声源传播的路径；

20、第二获取模块，用于获取目标场所内的声源对应的目标声源序列，并从所述声源序列数据库中确定与所述目标声源序列对应的目标位置；

21、识别模块，用于基于所述目标位置和所述参会人员的位置信息识别出发言者。

22、根据本公开的第三方面，提供了一种电子设备，包括：

23、图像采集装置，用于在目标场所内采集的参会人员的图像；

24、多个麦克风，所述多个麦克风环形阵列设置；

25、至少一个处理器；以及

26、与所述至少一个处理器通信连接的存储器；其中，

27、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开所述的方法。

28、根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开所述的方法。

29、本公开发言者的识别方法、装置、设备及存储介质，通过获取图像采集装置在目标场所内采集的参会人员的图像，并记录参会人员的位置信息；确定与位置信息对应的声源序列，组成声源序列数据库，声源序列表征位置信息的声源传播的路径；再获取目标场所内的声源对应的目标声源序列，并从声源序列数据库中确定与目标声源序列对应的目标位置；最后基于目标位置和参会人员的位置信息识别出发言者，通过该方法，能够使聋哑人群更好的融入工作。

30、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种发言者的识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述参会人员的位置信息包括所述参会人员与所述图像采集装置之间的角度。

3.根据权利要求1所述的方法，其特征在于，所述确定与所述位置信息对应的声源序列，包括：

4.根据权利要求3所述的方法，其特征在于，所述多个麦克风呈环形阵列设置。

5.根据权利要求1所述的方法，其特征在于，所述基于所述目标位置和所述参会人员的位置信息识别出发言者，包括：

6.根据权利要求1所述的方法，其特征在于，该方法还包括：

7.根据权利要求1-6任一项所述的方法，其特征在于，识别出发言者后，该方法还包括：

8.一种发言者的识别装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

技术总结
本公开提供了一种发言者的识别方法、装置、设备及存储介质，所述方法包括：获取图像采集装置在目标场所内采集的参会人员的图像，并记录所述参会人员的位置信息；确定与所述位置信息对应的声源序列，组成声源序列数据库；所述声源序列表征所述位置信息的声源传播的路径；获取目标场所内的声源对应的目标声源序列，并从所述声源序列数据库中确定与所述目标声源序列对应的目标位置；基于所述目标位置和所述参会人员的位置信息识别出发言者。通过本方法，可以使聋哑参会人员快速了解发言者信息和发言内容，使他们更好的融入会议环境，提升参与感。

技术研发人员：刘德智,王文东,田乔,夏勇,许润生,金彦
受保护的技术使用者：合肥联宝信息技术有限公司
技术研发日：
技术公布日：2024/3/11

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘德智,王文东,田乔,夏勇,许润生,金彦
技术所有人：合肥联宝信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。