一种具有同步字幕显示功能的视频通话系统的制作方法

文档序号:36870557发布日期:2024-02-02 20:50阅读:16来源:国知局
一种具有同步字幕显示功能的视频通话系统的制作方法

本发明涉及移动通信领域,具体的,本发明涉及视频电话中同步显示字幕的方法。使用本发明的用户能够在不影响正常通话的情况下,将声音信息转化成字幕数据,与本端图像叠加后传送给远端用户。


背景技术:

1、随着移动通讯技术的发展,视频电话业务凭借其生动直观的用户体验,得到了快速的推广。目前的视频电话功能主要是通过采集通话双方的视频和音频数据,并遵照约定的协议进行传送,从而达到信息交互的目的。但是目前视频电话在通话过程中,交流方式主要还是依靠言语表达,当声音传送不清晰时势必影响通话质量和交流效果,而此时即使有直观的视频感受仍然不能满足通信的需求。


技术实现思路

1、本发明旨在提供一种在视频通话过程中,能够提高通话质量,有效辅助交流的方法,可以实现将用户声音信息转化成字幕,与本端图像叠加后传送给远端用户。

2、为了实现上述目的,本发明的基本思想是在视频电话通话过程中,使用语音识别技术生成字幕文件,再根据用户选定的显示区域、字体、颜色及大小等字幕设置信息,叠加到本端图像,与图像数据融合在一起后传送给远端用户。本端用户和远端用户可以同时在显示屏上看到带字幕的视频显示。上述过程主要使用语音识别模块、字幕处理模块和图像合成模块来完成。

3、所述的视频电话,包括双方通话、多方通话和视频会议。本发明仅以双方通话为例进行说明。

4、所述的语音识别模块将口述语言逐字的转换为相应文字,产生字幕,并存储到字幕处理模块。语音识别技术,可以根据手机的具体要求,采用软件或硬件进行识别。

5、所述的字幕处理模块,根据预置的显示方式,将一定数量的识别好的字传递到图像合成模块。

6、诉述的图像合成模块,按照字幕设置信息的要求,将收到的字幕与背景视频进行叠加,生成带字幕的视频数据流。

7、所述的字幕设置信息,包括文字字体、行数、每行字数、文字颜色、驻留时间、更新时间、字幕显示区域及大小等。

8、在视频电话中,同步显示对用户语言进行文字性说明的字幕,是对视频通话的重要补充,能够提高通话质量,并且能起到辅助交流、改善交流效果的作用。由于字幕显示形式的多样化也增加了视频电话的灵活性和趣味性。另外,本发明对于接收字幕的设备没有特殊要求,因此支持视频电话功能的手机不需要增加额外的软件程序或硬件设备即可看到字幕,方便实用。



技术特征:

1.一种具有同步字幕显示功能的视频通话系统,其特征在于:使用语音识别模块(1)、字幕处理模块(2)和图像合成模块(3),在视频电话通话过程中,首先应用语音识别技术生成字幕,再根据用户预设的字幕显示规则,将字幕叠加到本端图像中,经处理后传送给远端用户。

2.如权利要求1所述的语音识别模块(1),其特征在于将口述语言逐字转换为相应文字,产生字幕,并存储到字幕处理模块(2)。

3.如权利要求1所述的语音识别模块(1),其特征在于可以根据情况,选择使用软件或硬件识别技术。

4.如权利要求1所述的字幕处理模块(2),其特征在于根据预置的显示方式,将一定数量的字幕传递到图像合成模块(3)。

5.如权利要求1所述的图像合成模块(3),其特征在于按照字幕设置信息的要求,将收到的字幕与背景视频进行叠加,生成带字幕的视频数据流。

6.如权利要求5所述的字幕设置信息,其特征在于包括文字字体、行数、每行字数、文字颜色、驻留时间、更新时间、字幕显示区域及大小等。

7.如权利要求4所述的字幕显示方式可以采用以下方法:

8.如权利要求4所述的字幕显示方式可以采用以下方法:


技术总结
本发明涉及一种具有同步字幕显示功能的视频通话系统。本发明主要由语音识别模块、字幕处理模块和图像合成模块来实现。在视频电话通话过程中,应用语音识别技术生成字幕,然后根据用户预设的字幕显示规则,将字幕叠加到本端图像中,经处理后传送给远端用户。在视频电话中增加字幕显示是对视频通话的重要补充,能够提高通话质量并改善交流效果。另外,使用本发明生成的字幕可直接显示在支持视频电话功能的手机上,而不需增加软件程序或硬件设备,方便实用。

技术研发人员:张怀稳,曹芦军,徐尉宁
受保护的技术使用者:南通同洲电子有限责任公司
技术研发日:
技术公布日:2024/2/1
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1