本申请涉及通信,特别是涉及视频通话的调节方法、装置、设备及存储介质。
背景技术:
1、视频通话是指通过网络将两个或多个地理位置分散的人进行实时视音频交流的一种通信方式。远程视频通话能够让参与者在不同的地点直接交流,从而便于跨地区、跨国际的合作、沟通和互动。
2、随着互联网技术的迅速发展和全球化的推进,远程视频通话的应用范围越来越广泛,比如在企业会议、在线教育、医疗健康等领域。在实际应用中,虽然远程视频通话能够提高沟通效率和便利性,但是远程视频通话也存在一些质量问题,如摄像机拍摄角度不满意等,不仅影响视频通话的质量,还影响用户的交流体验。
技术实现思路
1、本申请提供了视频通话的调节方法、装置、设备及存储介质,能够提高视频通话的质量。
2、第一方面,本申请提供一种视频通话的调节方法,方法包括:
3、获取视频画面中目标对象的面部区域;
4、基于面部区域,将摄像机的拍摄角度调整至面部区域处于视频画面的中心位置。
5、其进一步的技术方案为,面部区域包含目标对象的人脸位置信息,方法还包括:
6、基于人脸位置信息,提取人脸的特征信息;
7、将人脸的特征信息输入到预训练的svm模型中,得到人脸的方向信息;
8、基于人脸位置信息和人脸的方向信息,确定摄像机的最佳拍摄角度;
9、根据最佳拍摄角度调整摄像机的拍摄角度。
10、其进一步的技术方案为,基于人脸位置信息和人脸的方向信息,确定摄像机的最佳拍摄角度,包括:
11、基于人脸位置信息和人脸的方向信息,得到人脸在三维空间中的位置和方向;
12、基于人脸在三维空间中的位置和方向,以及摄像机的预设拍摄范围,确定摄像机的最佳拍摄角度。
13、其进一步的技术方案为,基于人脸在三维空间中的位置和方向,以及摄像机的预设拍摄范围,确定摄像机的最佳拍摄角度,包括:
14、将人脸在三维空间中的位置和方向进行旋转和平移,得到人脸在摄像机坐标系下的位置和方向;
15、基于人脸在摄像机坐标系下的位置和方向,以及摄像机的预设拍摄范围,得到表示摄像机最佳拍摄角度的旋转矩阵和平移向量;
16、基于摄像机最佳拍摄角度的旋转矩阵和平移向量,将人脸在三维空间中的位置和方向转换为人脸在摄像机最佳拍摄角度下的位置和方向。
17、其进一步的技术方案为,摄像机的预设拍摄范围为半球形区域,基于人脸在摄像机坐标系下的位置和方向,以及摄像机的预设拍摄范围,得到表示摄像机最佳拍摄角度的旋转矩阵,包括:
18、基于人脸在摄像机坐标系下的位置和方向,利用预设函数得到半球形区域内摄像机与人脸的俯仰角度和旋转角度;
19、基于俯仰角度和旋转角度,得到表示摄像机最佳拍摄角度的旋转矩阵。
20、其进一步的技术方案为,摄像机坐标系下的位置和方向包括目标对象的人脸三维点在摄像机坐标系下的深度坐标,基于摄像机坐标系下的位置和方向,以及摄像机的预设拍摄范围,得到表示摄像机最佳拍摄角度的平移向量,包括:
21、基于人脸三维点在摄像机坐标系下的深度坐标,以及摄像机在横坐标轴和纵坐标轴上的焦距分量,得到人脸三维点在横坐标轴和纵坐标轴上的投影长度;
22、基于人脸三维点在横坐标轴和纵坐标轴上的投影长度,以及人脸三维点在摄像机坐标系下的深度坐标,得到表示摄像机最佳拍摄角度的平移向量。
23、其进一步的技术方案为,获取视频画面中目标对象的面部区域,包括:
24、获取包含面部图像的数据集;
25、将数据集输入至预训练的卷积神经网络模型,利用预训练的卷积神经网络模型对面部图像进行人脸检测和定位,得到包含目标对象的面部区域。
26、第二方面,本申请提供了一种视频通话的调节装置,调节装置包括用于执行如上述方法的单元。
27、第三方面,本申请提供了一种计算机设备,该计算机设备包括存储器及处理器,该存储器上存储有计算机程序,用于执行如本申请上述任一项方法的步骤。
28、第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序在被处理器执行时,用于实现上述的视频通话的调节方法。
29、本申请的有益效果是:区别于现有技术的情况,本申请通过获取视频画面中目标对象的面部区域,基于面部区域,将摄像机的拍摄角度调整至面部区域处于视频画面的中心位置。即通过实时分析面部区域以自动调整摄像机的拍摄角度,使得面部区域能够一直处于视频画面的中心位置。并将摄像机的焦点放在目标对象的面部区域上,可以使主要的交流对象得到突出,减少背景干扰和不相关内容的呈现,避免因为交流对象视线偏移导致的沟通误解,提高交流的连贯性和顺畅度。
30、并且,将目标对象的面部区域置于画面中心位置,可以使摄像机自动调整曝光,以适应该区域的光照情况,在面部区域接收到适当光线的情况下,能够获得更好的曝光效果,避免因背景过于明亮而造成目标对象面部过度曝光导致出现模糊或阴影的问题。
1.一种视频通话的调节方法,其特征在于,所述方法包括:
2.根据权利要求1所述的调节方法,其特征在于,所述面部区域包含所述目标对象的人脸位置信息,所述方法还包括:
3.根据权利要求2所述的调节方法,其特征在于,所述基于所述人脸位置信息和所述人脸的方向信息,确定所述摄像机的最佳拍摄角度,包括:
4.根据权利要求3所述的调节方法,其特征在于,所述基于所述人脸在三维空间中的位置和方向,以及所述摄像机的预设拍摄范围,确定所述摄像机的最佳拍摄角度,包括:
5.根据权利要求4所述的调节方法,其特征在于,所述摄像机的预设拍摄范围为半球形区域,所述基于所述人脸在所述摄像机坐标系下的位置和方向,以及所述摄像机的预设拍摄范围,得到表示所述摄像机最佳拍摄角度的旋转矩阵,包括:
6.根据权利要求4所述的调节方法,其特征在于,所述摄像机坐标系下的位置和方向包括所述目标对象的人脸三维点在所述摄像机坐标系下的深度坐标,所述基于所述摄像机坐标系下的位置和方向,以及所述摄像机的预设拍摄范围,得到表示所述摄像机最佳拍摄角度的平移向量,包括:
7.根据权利要求1所述的调节方法,其特征在于,所述获取视频画面中目标对象的面部区域,包括:
8.一种视频通话的调节装置,其特征在于,所述调节装置包括用于执行如权利要求1-7任一项所述方法的单元。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1-7中任一项所述的方法。