一种可视电话中图像处理方法和装置的制作方法

文档序号：7898120阅读：118来源：国知局

专利名称：一种可视电话中图像处理方法和装置的制作方法
技术领域：
本发明涉及移动通信领域，尤其是一种可视电话中图像处理方法和装置。
背景技术：
可视电话是通信领域的一种重要的电话业务，特别是随着第三代无线通讯的普及，提供给移动用户终端使用的带宽有了较大提高，可视电话逐渐成为用户最常使用的业
务之一。相较于传统的语音电话，可视电话是一种比较新颖的业务。而年轻人对各种新兴业务的尝试和接纳是最积极的。因此，在世界上，特别是在中国，可视电话的用户主体是年轻人群。年轻人普遍存在思维活跃，热衷娱乐，喜欢开玩笑的特点。但是目前的可视电话业务还仅仅是通话双方终端摄像头所采集影像的直接传递，缺乏娱乐性和可玩性的特点。如果能在这些方面有所改善，将对可视电话业务的主体用户——年轻人有更强的吸引力。

发明内容
本发明要解决的技术问题是提供了一种可视电话中图像处理方法和装置，提高了视频通话的趣味性，能够吸引更多的视频电话用户。为解决上述技术问题，本发明提供了如下技术方案一种可视电话中图像处理方法，包括获取近端用户的视频图像，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，将所述处理后的视频图像发送给远端用户。进一步，所述在视频图像上添加图形和/或文字，得到处理后的视频图像包括获取所述视频图像的人脸区域；在所述人脸区域添加图形和/或文字，得到效果合成图像；将所述效果合成图像与原视频图像进行叠加，得到处理后的视频图像。进一步，在所述人脸区域添加图形和/或文字，得到效果合成图像包括设定待添加的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系；获取人脸区域的位置和大小，根据设定的待添加的图形和/或文字与所述人脸区域的位置和大小关系，将所述图形和/或文字添加在所述人脸区域，得到效果合成图像。进一步，所述方法还包括存储所设定的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系为娱乐效果方案；在后续视频通话过程中，基于已存储的娱乐效果方案生成效果合成图像。进一步，获取所述视频图像后，在所述视频图像上添加图形和/或文字前还包括，判断是否开启图像娱乐增强功能，如果已开启，在所述视频图像上添加图形和/或文字；否则，直接发送视频图像至远端用户。
进一步，所述图形和/或文字为所述近端用户手绘输入或者从预置素材库中选择得到。一种可视电话中图像处理装置，其中，包括图像获取模块，用于获取近端用户的视频图像；图像娱乐增强模块，用于在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块；发送模块，用于将所述处理后的视频图像发送给远端用户。进一步，所述图像娱乐增强模块包括人脸识别模块，娱乐效果合成模块和视频叠加模块，其中所述人脸识别模块，用于获取所述视频图像的人脸区域；所述娱乐效果合成模块，用于在所述人脸区域添加图形和/或文字，得到效果合成图像；所述视频叠加模块，用于将所述效果合成图像与所述图像获取模块获取的所述视频图像进行叠加，得到处理后的视频图像，传输给发送模块。进一步，所述装置还包括可视电话娱乐效果控制模块，用于设定待添加的图形和/ 或文字，以及所述图形和/或文字与人脸区域的位置和大小关系；所述娱乐效果合成模块还用于获取人脸区域的位置和大小，根据所述可视电话娱乐效果控制模块设定的待添加的图形和/或文字与所述人脸区域的位置和大小关系，将所述图形和/或文字添加在所述人脸区域，得到效果合成图像。进一步，所述可视电话娱乐效果控制模块，还用于将已设定的待添加的图形和/ 或文字，以及所述图形和/或文字与人脸区域的位置和大小关系存储为娱乐效果方案；所述娱乐效果合成模块还用于基于已存储的娱乐效果方案生成效果合成图像。进一步，所述装置还包括手绘图形输入和存储模块和/或预置素材库模块，其中所述手绘图形输入和存储模块，用于接收近端用户手绘输入的图形和/或文字，并能够进行存储；所述预置素材库模块，用于存储预置的图形和/或文字；所述可视电话娱乐效果控制模块是用于调用所述手绘图形输入和存储模块和/ 或预置素材库模块设定所述图形和/或文字。进一步，所述可视电话娱乐效果控制模块还用于提供一娱乐增强功能开关；所述图形娱乐增强模块，用于判断是否开启娱乐增强功能，如果已开启，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块，否则，直接将视频图像传输给发送模块。本发明在视频通话的基础上增加了对视频图像的处理功能，增加了视频通话的趣味性、可玩性，与现有技术相比，本发明能够吸引更多的视频电话用户，提高运营商的利润增长点。

图1为可视电话中图像处理装置的系统结构图；图2为现有可视电话的视频截图3为人脸识别模块确定脸部位置的视频截图；图4为预置素材库模块对脸部图像进行编辑的示意图；图5为手绘图形输入和存储模块对脸部图像进行编辑的示意图；图6为图像娱乐增强模块对脸部图像编辑后的效果图；图7为可视电话中图像处理方法设置阶段流程图；图8为可视电话中图像处理方法合成阶段流程图。
具体实施例方式下面结合附图对本发明做进一步详细的说明。为描述方便，以下称可视电话呼叫中本端用户为近端用户，近端用户的终端为近端终端，其摄像头等图像获取模块采集到的本端用户的视频图像为近端视频，称可视电话呼叫对端用户为远端用户，远端用户的终端为远端终端，其摄像头等图像获取模块采集到的对端用户的视频图像为远端视频。本发明的基本思想是获取近端用户的视频图像，在所述视频图像上添加图形和 /或文字，得到处理后的视频图像，将所述处理后的视频图像发送给远端用户。基于上述思想，本发明提供了一种可视电话中图像处理装置，包括图像获取模块，用于获取近端用户的视频图像；图像娱乐增强模块，用于在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块；发送模块，用于将所述处理后的视频图像发送给远端用户。进一步，所述图像娱乐增强模块包括人脸识别模块，娱乐效果合成模块和视频叠加模块，其中所述人脸识别模块，用于获取所述视频图像的人脸区域；所述娱乐效果合成模块，用于在所述人脸区域添加图形和/或文字，得到效果合成图像；所述视频叠加模块，用于将所述效果合成图像与所述图像获取模块获取的所述视频图像进行叠加，得到处理后的视频图像，传输给发送模块。进一步，所述装置还包括可视电话娱乐效果控制模块，用于设定待添加的图形和/ 或文字，以及所述图形和/或文字与人脸区域的位置和大小关系；所述娱乐效果合成模块还用于获取人脸区域的位置和大小，根据所述可视电话娱乐效果控制模块设定的待添加的图形和/或文字与所述人脸区域的位置和大小关系，将所述图形和/或文字添加在所述人脸区域，得到效果合成图像。进一步，所述可视电话娱乐效果控制模块还用于将已设定的待添加的图形和/ 或文字，以及所述图形和/或文字与人脸区域的位置和大小关系存储为娱乐效果方案；所述娱乐效果合成模块还用于基于已存储的娱乐效果方案生成效果合成图像。进一步，所述装置还包括手绘图形输入和存储模块和/或预置素材库模块，其中所述手绘图形输入和存储模块，用于接收近端用户手绘输入的图形和/或文字，并进行存储；所述预置素材库模块，用于存储预置的图形和/或文字；所述可视电话娱乐效果控制模块是用于调用所述手绘图形输入和存储模块和/
6或预置素材库模块设定所述图形和/或文字。进一步，所述可视电话娱乐效果控制模块还用于提供一娱乐增强功能开关；所述图形娱乐增强模块，用于判断是否开启娱乐增强功能，如果已开启，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块，否则，直接将视频图像传输给发送模块。基于以上增加的设备模块，本发明还提供了一种可视电话中图像处理方法，包括，获取近端用户的视频图像，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，将所述处理后的视频图像发送给远端用户。进一步，所述在视频图像上添加图形和/或文字，得到处理后的视频图像包括获取所述视频图像的人脸区域；在所述人脸区域添加图形和/或文字，得到效果合成图像；将所述效果合成图像与原视频图像进行叠加，得到处理后的视频图像。进一步，在所述人脸区域添加图形和/或文字，得到效果合成图像包括设定待添加的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系；获取人脸区域的位置和大小，根据设定的待添加的图形和/或文字与所述人脸区域的位置和大小关系，将所述图形和/或文字添加在所述人脸区域，得到效果合成图像。进一步，所述方法还包括存储所设定的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系为娱乐效果方案；在后续视频通话过程中，基于已存储的娱乐效果方案生成效果合成图像。进一步，获取所述视频图像后，在所述视频图像上添加图形和/或文字前还包括，判断是否开启图像娱乐增强功能，如果已开启，在所述视频图像上添加图形和/或文字；否则，直接发送视频图像至远端用户。进一步，所述图形和/或文字为所述近端用户手绘输入或者从预置素材库中选择得到。下面通过具体实施例进一步说明本发明。如图1所示，在已经具有可视电话功能的近端终端上增加以下设备模块1、人脸识别模块F108 用于在近端视频中识别出人脸，并确定人脸在图像中的位置和大小。2、手绘图形输入和存储模块Fill 用于近端用户绘制各种自定义的图形或文字，并能够将绘制结果存储下来。绘制结果的存储可以是以位图形式存储或者矢量形式存储。3、预置素材库模块F112 用于存储各种预置的图形图像素材。4、娱乐效果合成模块F109 此模块从人脸识别模块F108获取人脸在图像中的位置和范围，根据要求将预置素材库模块F112或手绘图形输入和存储模块Fill中的图形图像素材放置在与已识别人脸相关的位置上并调整大小，最终形成效果合成图像。5、视频叠加模块F105 此模块将娱乐效果合成模块F109生成的效果合成图像与经视频处理和增强的原始视频进行叠加处理，形成最终发送给远端用户的视频。6、可视电话娱乐效果控制模块F113 此模块通过触摸屏等输入设备FllO与近端用户交互，控制上述各模块是否工作和设置工作参数。本发明提供的图像处理方法可分为如下2个处理步骤图像处理功能控制1)娱乐增强功能的开启与关闭可视电话娱乐效果控制模块F113在可视电话的近端终端界面上显示一个娱乐增强功能开关。近端用户可通过触摸屏等输入设备FllO设置此娱乐增强功能的开启与关闭。2)近端视频娱乐效果设置近端用户可选择预置素材库模块F112中的图形图像素材，或者通过手绘图形输入和存储模块Fill绘制自定义的图形图像素材，并设置这些图形图像素材与近端视频中人脸的几何位置关系。3)近端用户可将已设置的近端视频娱乐效果方案进行存储，并可在以后的可视电话中使用，免去重新设置的过程。图像合成阶段1)近端视频的采集和预处理近端终端通过摄像头等视频采集设备F103采集近端原始视频，并经视频处理和增强模块F104进行处理，处理后的近端视频送入视频叠加模块F105和人脸识别模块F108。2)人脸识别处理人脸识别模块F108收到近端视频后，判断近端终端上是否已经开启了可视电话娱乐增强功能。如果未开启，则对收到的视频不进行处理。如果已经开启，则对视频中的每一帧中的人脸进行识别，确定人脸在图像中的位置和大小，并将这些位置和大小信息发送给娱乐效果合成模块F109。3)娱乐效果的合成娱乐效果合成模块F109根据人脸识别处理模块F108识别出的人脸位置和范围，以及可视电话娱乐效果控制模块F113设定的预置图形图像(存储于预置素材库模块F112中)和/或自定义的图形(通过手绘图形输入和存储模块Fill绘制) 与人脸的几何关系，将这些图形图像进行拼合，形成效果合成图像。效果合成图像和经过预处理的原始图像在视频叠加模块(Fl(^)中进行叠加处理，形成最终显示给远端用户的图像并发出。本发明的实施过程可分为两个阶段，一个是可视电话中设置阶段，另一个是可视电话中图像合成阶段，如图7所示，本发明可视电话中图像处理方法设置阶段流程图，具体描述如下(S100)近端用户与远端用户已经建立了视频通话(效果如图2所示)，可视电话娱乐效果控制模块F113在可视电话的近端终端界面上显示一个娱乐增强功能开关，近端用户可通过触摸屏等输入设备FllO设置此娱乐增强功能的开启触发了娱乐效果设置功能；(SlOl)可视电话娱乐效果控制模块F113冻结当前近端视频的一帧；(S102)人脸识别模块F108收到近端视频后，判断近端终端上是否已经开启了可视电话娱乐增强功能，如果未开启，则对收到的视频不进行处理；如果已经开启，则对视频中的每一帧中的人脸进行识别，确定人脸在图像中的位置和大小并显示给近端用户(效果如图3所示)，然后将这些位置和大小信息发送给娱乐效果合成模块F109 ；(S103)近端用户后续可选择是添加预置图形还是添加手绘图形；(S104)添加预置图形(效果如图4)，此设置可反复执行，直到近端用户选择设置结束；(S105)添加手绘图形(效果如图幻的处理，此设置可反复执行，直到近端用户选择设置结束；(S106)近端用户选择设置是否结束；(S107)近端用户选择设置结束后，此时可视电话娱乐效果控制模块F113记录下已添加图形以及其与人脸区域的相对关系；(S108)上述记录工作结束后，整个设置阶段完成，界面回到视频通话状态，进入娱乐效果合成阶段。如图8所示，本发明强可视电话图像合成流程图，具体描述如下(S201)近端用户和远端用户在进行视频通话时，对于本端用户的每一个经过视频采集模块F103和视频增强处理F104的视频帧，原先是直接发给远端用户；(S202)当实施了本发明，每次获取到这种经视频增强处理的视频帧后，都要增加是否系统已经开启娱乐增强处理且已经进入了娱乐效果合成阶段的判断；如果没有开启或者尚未设置娱乐效果，则直接将这个视频帧输出给远端用户(步骤S205)；(S203)当判断娱乐增强处理已经开启且用户已经设置了娱乐效果进入了合成阶段，则首先调用人脸识别模块F108对当前视频帧进行处理，识别出人脸在此视频帧中的范围；(S204)娱乐效果合成模块F109根据人脸识别模块F108识别出的人脸位置和范围，以及可视电话娱乐效果控制模块F113设定的预置图形图像(存储于预置素材库模块 F112中)和/或自定义的图形(通过手绘图形输入模块Fill绘制)与人脸的几何关系，将这些图形图像进行拼合，形成效果合成图像；(S205)将娱乐效果合成模块F109生成的效果合成图像与原始视频帧通过视频叠加模块F105进行叠加处理，形成最终效果视频帧，然后将其发给远端用户，经过上述的处理，近端用户和远端用户实际的视频通话效果如图6所示。本发明在视频通话的基础上增加了用户对视频图像的处理功能，增加了视频通话的趣味性、可玩性，与先有技术相比，本发明能够吸引更多的视频电话用户，提高运营商的利润增长点。上述实施例仅是对本发明的解释而非限制，凡是基于本发明思想对本发明所做的任何变换、等同替换或者改进，都应该包含在本发明的保护范围之内。
权利要求
1.一种可视电话中图像处理方法，其特征在于，包括获取近端用户的视频图像，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，将所述处理后的视频图像发送给远端用户。
2.如权利要求1所述的方法，其特征在于，所述在视频图像上添加图形和/或文字，得到处理后的视频图像包括获取所述视频图像的人脸区域；在所述人脸区域添加图形和/或文字，得到效果合成图像；将所述效果合成图像与原视频图像进行叠加，得到处理后的视频图像。
3.如权利要求2所述的方法，其特征在于，在所述人脸区域添加图形和/或文字，得到效果合成图像包括设定待添加的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系；获取人脸区域的位置和大小，根据设定的待添加的图形和/或文字与所述人脸区域的位置和大小关系，将所述图形和/或文字添加在所述人脸区域，得到效果合成图像。
4.如权利要求3所述的方法，其特征在于，所述方法还包括存储所设定的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系为娱乐效果方案；在后续视频通话过程中，基于已存储的娱乐效果方案生成效果合成图像。
5.如权利要求1所述的方法，其特征在于，获取所述视频图像后，在所述视频图像上添加图形和/或文字前还包括，判断是否开启图像娱乐增强功能，如果已开启，在所述视频图像上添加图形和/或文字；否则，直接发送视频图像至远端用户。
6.如权利要求1至5任一所述的方法，其特征在于，所述图形和/或文字为所述近端用户手绘输入或者从预置素材库中选择得到。
7.—种可视电话中图像处理装置，其特征在于，包括图像获取模块，用于获取近端用户的视频图像；图像娱乐增强模块，用于在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块；发送模块，用于将所述处理后的视频图像发送给远端用户。
8.如权利要求7所述的装置，其特征在于，所述图像娱乐增强模块包括人脸识别模块，娱乐效果合成模块和视频叠加模块，其中所述人脸识别模块，用于获取所述视频图像的人脸区域；所述娱乐效果合成模块，用于在所述人脸区域添加图形和/或文字，得到效果合成图像；所述视频叠加模块，用于将所述效果合成图像与所述图像获取模块获取的所述视频图像进行叠加，得到处理后的视频图像，传输给发送模块。
9.如权利要求8所述的装置，其特征在于，所述装置还包括可视电话娱乐效果控制模块，用于设定待添加的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系；所述娱乐效果合成模块还用于获取人脸区域的位置和大小，根据所述可视电话娱乐效果控制模块设定的待添加的图形和/或文字与所述人脸区域的位置和大小关系，将所述图形和/或文字添加在所述人脸区域，得到效果合成图像。
10.如权利要求9所述的装置，其特征在于，所述可视电话娱乐效果控制模块，还用于将已设定的待添加的图形和/或文字，以及所述图形和/或文字与人脸区域的位置和大小关系存储为娱乐效果方案；所述娱乐效果合成模块还用于基于已存储的娱乐效果方案生成效果合成图像。
11.如权利要求9或10所述的装置，其特征在于，所述装置还包括手绘图形输入和存储模块和/或预置素材库模块，其中所述手绘图形输入和存储模块，用于接收近端用户手绘输入的图形和/或文字，并进行存储；所述预置素材库模块，用于存储预置的图形和/或文字；所述可视电话娱乐效果控制模块是用于调用所述手绘图形输入和存储模块和/或预置素材库模块设定所述图形和/或文字。
12.如权利要求9或10所述的装置，其特征在于，所述可视电话娱乐效果控制模块还用于提供一娱乐增强功能开关；所述图形娱乐增强模块，用于判断是否开启娱乐增强功能，如果已开启，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块，否则，直接将视频图像传输给发送模块。
全文摘要
本发明公开了一种可视电话中图像处理方法和装置，所述方法包括获取近端用户的视频图像，在所述视频图像上添加图形和/或文字，得到处理后的视频图像，将所述处理后的视频图像发送给远端用户。所述装置包括，图像获取模块，用于获取近端用户的视频图像；图像娱乐增强模块，用于在所述视频图像上添加图形和/或文字，得到处理后的视频图像，传输给发送模块；发送模块，用于将所述处理后的视频图像发送给远端用户。本发明在视频通话的基础上增加了对视频图像的处理功能，增加了视频通话的趣味性、可玩性，与现有技术相比，本发明能够吸引更多的视频电话用户，提高运营商的利润增长点。
文档编号H04N7/14GK102075727SQ20101061529
公开日2011年5月25日申请日期2010年12月30日优先权日2010年12月30日
发明者李响申请人:中兴通讯股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李响
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种无线传感器网络的部署方法
上一篇：交通信息发布方法、设备及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。