一种信息处理方法以及信息处理装置的制造方法

文档序号：8459406阅读：394来源：国知局

一种信息处理方法以及信息处理装置的制造方法
【技术领域】
[0001 ] 本发明涉及电子技术领域，尤其涉及一种信息处理方法以及信息处理装置。
【背景技术】
[0002]随着科学技术的不断发展，电子技术也得到了飞速的发展，电子产品的种类也越来越多，人们也享受到了科技发展带来的各种便利。例如，光场相机在主透镜与感光器阵列之间，设置了一个微型透镜阵列，光线集合从主透镜经每个微透镜传送到感光器前，析出聚焦光线及将光线资料转换，以数码方式记下，这个系统可以捕捉相关场景光线的所有方向的信息，因此它在拍摄完成后可以“聚焦”照片中的任何深度，使用者可以更快地完成拍照，即便非专业摄影师也不必担心对焦问题，特别是在摄录视频文件的时候，光场相机具有普通相机无法达到的优点，普通相机拍摄视频的时候，若焦点不正确，则无法对视频文件进行修改，而光场相机由于能够先拍照后进行对焦，所以在视频文件拍摄完成后对视频文件的焦点进行修改，使得该视频文件能够满足用户的需求，因此光场相机因为这种先拍照后对焦的特点在越来越多的场合被使用。
[0003]但是，光场相机摄录获得的视频文件没有焦点，不便于预览，需要用户在为视频文件设置对应的焦点，才能够形成满足用户预览需求的预览视频文件。用户在为视频文件设置对应的焦点时，会耗费一定的时间，在一些实时性要求特别高的场合，例如视频电话会议等等场合，本地会议室的光场相机摄录的视频文件传输给远端会议室的时候没有焦点，远端会议室就无法及时地观看本地会议室的光场相机摄录的视频文件。
[0004]因此，现有技术中存在由于光场相机摄录获得的视频文件没有焦点，不便于预览的技术问题。

【发明内容】

[0005]本发明实施例通过提供一种信息处理方法以及信息处理装置，用以解决现有技术中存在的由于光场相机摄录获得的视频文件没有焦点，不便于预览的技术问题。
[0006]第一方面，本发明实施例提供一种信息处理方法，包括:获取光场摄像单元摄录的视频文件；根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像帧的焦点；基于已确定焦点的光场图像帧，生成所述视频文件的预览视频文件。
[0007]结合第一方面，在第一种可能的实现方式中，所述视频文件为一视频会议的视频文件；所述根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像帧的焦点，具体包括:通过对所述光场图像帧进行人脸识别，确定所述光场图像帧中的参会者所在的位置；根据参会者所在的位置，并通过所述视频文件中的音频信息和/或唇动识别，确定参会者中的讲话者所在的位置；将所述讲话者所在的位置确定为所述视频文件中光场图像帧的焦点。
[0008]结合第一种可能的实现方式，在第二种可能的实现方式中，所述通过所述视频文件中的音频信息，确定参会者中的讲话者所在的位置，具体包括:对所述视频文件中的音频信息进行分析，确定所述讲话者所在的位置，所述音频信息由一麦克风阵列在所述光场摄像单元摄录所述视频文件时同步获得。
[0009]结合第一种可能的实现方式，在第三种可能的实现方式中，所述通过唇动识别，确定参会者中的讲话者所在的位置，具体包括:对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸所在的位置；确定所述唇动的人脸所在的位置为所述讲话者所在的位置。
[0010]结合第一种可能的实现方式，在第四种可能的实现方式中，所述通过所述视频文件中的音频信息和唇动识别，确定参会者中的讲话者所在的位置，具体包括:对所述音频信息进行分析，获得所述光场图像帧对应的最强声音；对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸；匹配所述最强声音与所述唇动的人脸的唇部动作，确定与所述最强声音匹配的唇动的人脸所在的位置为所述讲话者所在的位置。
[0011]第二方面，本发明实施例提供一种信息处理装置，包括:光场摄像单元，用于摄录视频文件；处理单元，用于获取光场摄像单元摄录的视频文件，并根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像帧的焦点，并基于已确定焦点的光场图像帧，生成所述视频文件的预览视频文件。
[0012]结合第二方面，在第一种可能的实现方式中，所述视频文件为一视频会议的视频文件，所述处理单元具体用于通过对所述光场图像帧进行人脸识别，确定所述光场图像帧中的参会者所在的位置，并根据参会者所在的位置，并通过所述视频文件中的音频信息和/或唇动识别，确定参会者中的讲话者所在的位置，并将所述讲话者所在的位置确定为所述视频文件中光场图像帧的焦点。
[0013]结合第一种可能的实现方式，在第二种可能的实现方式中，所述处理单元具体用于对所述视频文件中的音频信息进行分析，确定所述讲话者所在的位置，所述音频信息由一麦克风阵列在所述光场摄像单元摄录所述视频文件时同步获得。
[0014]结合第一种可能的实现方式，在第三种可能的实现方式中，所述处理单元具体用于对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸所在的位置，并确定所述唇动的人脸所在的位置为所述讲话者所在的位置。
[0015]结合第一种可能的实现方式，在第四种可能的实现方式中，所述处理单元具体用于对所述音频信息进行分析，获得所述光场图像帧对应的最强声音，并对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸，并匹配所述最强声音与所述唇动的人脸的唇部动作，确定与所述最强声音匹配的唇动的人脸所在的位置为所述讲话者所在的位置。
[0016]第三方面，本发明实施例还提供一种通信终端，包括:光场摄像单元，用于摄录一通信场景的视频文件；处理单元，与所述光场摄像单元相连，用于确定视频文件中光场图像帧的焦点，并基于已确定焦点的光场图像帧，生成视频文件的预览视频文件。
[0017]本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点:
[0018]由于采用了获取光场摄像单元摄录的视频文件，并确定视频文件中光场图像帧的焦点，并基于已确定焦点的光场图像帧，生成视频文件的预览视频文件的技术方案，所生成的视频文件的预览视频文件中的光场图像帧是具有焦点的，也即该预览视频文件能够方便地供用户预览，所以解决了现有技术中存在的由于光场相机摄录获得的视频文件没有焦点，不便于预览的技术问题，实现了将光场相机摄录的视频文件转换为具有焦点的预览视频文件，从而便于预览的技术效果。
【附图说明】
[0019]图1为本发明实施例提供的信息处理方法的流程图；
[0020]图2为本发明实施例提供的通过视频文件中的音频信息，确定参会者中的讲话者所在的位置的示意图；
[0021]图3为本发明实施例提供的通过唇动识别，确定参会者中的讲话者所在的位置的示意图；
[0022]图4为本发明实施例提供的通过视频文件中的音频信息和唇动识别，确定参会者中的讲话者所在的位置的示意图；
[0023]图5为本发明实施例提供的通信终端的功能模块图；
[0024]图6为本发明实施例提供的信息处理装置的功能模块图。
【具体实施方式】
[0025]本发明实施例通过提供一种信息处理方法以及信息处理装置，用以解决现有技术中存在的由于光场相机摄录获得的视频文件没有焦点，不便于预览的技术问题。
[0026]本发明实施例中的技术方案为解决上述技术问题，总体思路如下:
[0027]本发明实施例提供一种信息处理方

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄茂胜;
技术所有人：华为技术有限公司;
我是此专利的发明人

上一篇：一种视觉数据传输系统的制作方法
上一篇：一种新型的异步共享软件系统装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。