一种信息处理方法以及信息处理装置的制造方法_4

文档序号：8459406阅读：来源：国知局

[0079]本实施例中的信息处理装置与前述实施例中的信息处理方法是基于同一发明构思下的两个方面，在前面已经对方法的实施过程作了详细的描述，所以本领域技术人员可根据前述描述清楚的了解本实施例中的信息处理装置的结构及实施过程，为了说明书的简洁，在此就不再赘述了。
[0080]上述本发明实施例中的技术方案，至少具有如下的技术效果或优点:
[0081]由于采用了获取光场摄像单元摄录的视频文件，并确定视频文件中光场图像帧的焦点，并基于已确定焦点的光场图像帧，生成视频文件的预览视频文件的技术方案，所生成的视频文件的预览视频文件中的光场图像帧是具有焦点的，也即该预览视频文件能够方便地供用户预览，所以解决了现有技术中存在的由于光场相机摄录获得的视频文件没有焦点，不便于预览的技术问题，实现了将光场相机摄录的视频文件转换为具有焦点的预览视频文件，从而便于预览的技术效果。
[0082]本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0083]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0084]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0085]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0086]显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种信息处理方法，其特征在于，包括: 获取光场摄像单元摄录的视频文件；根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像帧的隹占.基于已确定焦点的光场图像帧，生成所述视频文件的预览视频文件。
2.如权利要求1所述的方法，其特征在于，所述视频文件为一视频会议的视频文件；所述根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像中贞的焦点，具体包括: 通过对所述光场图像帧进行人脸识别，确定所述光场图像帧中的参会者所在的位置；根据参会者所在的位置，并通过所述视频文件中的音频信息和/或唇动识别，确定参会者中的讲话者所在的位置；将所述讲话者所在的位置确定为所述视频文件中光场图像帧的焦点。
3.如权利要求2所述的方法，其特征在于，所述通过所述视频文件中的音频信息，确定参会者中的讲话者所在的位置，具体包括: 对所述视频文件中的音频信息进行分析，确定所述讲话者所在的位置，所述音频信息由一麦克风阵列在所述光场摄像单元摄录所述视频文件时同步获得。
4.如权利要求2所述的方法，其特征在于，所述通过唇动识别，确定参会者中的讲话者所在的位置，具体包括: 对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸所在的位置；确定所述唇动的人脸所在的位置为所述讲话者所在的位置。
5.如权利要求2所述的方法，其特征在于，所述通过所述视频文件中的音频信息和唇动识别，确定参会者中的讲话者所在的位置，具体包括: 对所述音频信息进行分析，获得所述光场图像帧对应的最强声音；对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸；匹配所述最强声音与所述唇动的人脸的唇部动作，确定与所述最强声音匹配的唇动的人脸所在的位置为所述讲话者所在的位置。
6.一种信息处理装置，其特征在于，包括: 光场摄像单元，用于摄录视频文件；处理单元，用于获取光场摄像单元摄录的视频文件，并根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像帧的焦点，并基于已确定焦点的光场图像帧，生成所述视频文件的预览视频文件。
7.如权利要求6所述的装置，其特征在于，所述视频文件为一视频会议的视频文件，所述处理单元具体用于通过对所述光场图像帧进行人脸识别，确定所述光场图像帧中的参会者所在的位置，并根据参会者所在的位置，并通过所述视频文件中的音频信息和/或唇动识别，确定参会者中的讲话者所在的位置，并将所述讲话者所在的位置确定为所述视频文件中光场图像帧的焦点。
8.如权利要求7所述的装置，其特征在于，所述处理单元具体用于对所述视频文件中的音频信息进行分析，确定所述讲话者所在的位置，所述音频信息由一麦克风阵列在所述光场摄像单元摄录所述视频文件时同步获得。
9.如权利要求7所述的装置，其特征在于，所述处理单元具体用于对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸所在的位置，并确定所述唇动的人脸所在的位置为所述讲话者所在的位置。
10.如权利要求7所述的装置，其特征在于，所述处理单元具体用于对所述音频信息进行分析，获得所述光场图像帧对应的最强声音，并对所述光场图像帧进行唇动识别，并根据唇动识别的结果，确定所述光场图像帧中唇动的人脸，并匹配所述最强声音与所述唇动的人脸的唇部动作，确定与所述最强声音匹配的唇动的人脸所在的位置为所述讲话者所在的位置。
11.一种通信终端，其特征在于，包括: 光场摄像单元，用于摄录一通信场景的视频文件；处理单元，与所述光场摄像单元相连，用于确定视频文件中光场图像帧的焦点，并基于已确定焦点的光场图像帧，生成视频文件的预览视频文件。
【专利摘要】本发明公开了一种信息处理方法、一种信息处理装置以及通信终端，该信息处理方法包括：获取光场摄像单元摄录的视频文件；根据所述视频文件中的音频信息和/或人脸信息，确定所述视频文件中光场图像帧的焦点；基于已确定焦点的光场图像帧，生成所述视频文件的预览视频文件。本发明实施例中的技术方案解决了现有技术中存在的由于光场相机摄录获得的视频文件没有焦点，不便于预览的技术问题，实现了将光场相机摄录的视频文件转换为具有焦点的预览视频文件，从而便于预览的技术效果。
【IPC分类】H04N5-232, G06K9-00, H04N7-15
【公开号】CN104780341
【申请号】CN201410012753
【发明人】黄茂胜
【申请人】华为技术有限公司
【公开日】2015年7月15日
【申请日】2014年1月10日

完整全部详细技术资料下载

当前第4页1 2 3 4