一种WebRTCP2P音视频通话的方法及装置的制造方法

文档序号:8459400阅读:409来源:国知局
一种WebRTC P2P音视频通话的方法及装置的制造方法
【技术领域】
[0001]本发明涉及通讯领域,特别是涉及一种WebRTC P2P音视频通话的方法及WebRTC服务器与WebRTC客户端。
【背景技术】
[0002]随着www万维网和移动互联网的发展,近几年HTML5 (Hyper Text Mark-upLanguage5,超文本标记语言5)逐渐成为市场和标准都追捧的热点。作为一个新的网络技术的发展方向,HTML5的一个重要的核心的技术内容就是WEBRTC技术。WebRTC(WebReal-Time Communicat1n,网页实时通信)实现了基于网页的视频会议,目的是通过浏览器提供简单的javascript就可以达到实时通讯(Real-Time Communicat1ns)能力。
[0003]WebRTC项目的最终目的主要是让Web开发者能够基于浏览器(比如Chrome、FireFox...)轻易快捷开发出丰富的实时多媒体应用,而无需下载安装任何插件,Web开发者也无需关注多媒体的数字信号处理过程,只需编写简单的Javascript程序即可实现,W3C (World Wide Web Consortium,万维网联盟)等组织负责制定Javascript (简称JS)标准 API (Applicat1n Programming Interface,应用程序编程接口),另外 WebRTC 还希望能够建立一个多互联网浏览器间健壮的实时通信的平台,形成开发者与浏览器厂商良好的生态环境。
[0004]WebRTC的技术已成为HTML5标准之一。并且随着WebRTC标准的日渐成熟,市场上也逐渐出现了基于WebRTC技术实现的各类应用。这些应用的特点就是使用WEB (网页)技术来开发,并且因为浏览器厂商已经逐渐支持webrtc技术,所以使用webrtc技术开发的应用也可以运行在各种支持webrtc的浏览器的PC终端或者手机终端上。这样的技术趋势使得开发难度大大降低,同时维护多终端和多版本的开发工作量也大大减少了。
[0005]随着web技术的发展,一些使用HTML5技术开发的应用也越来越多。WEBRTC作为HTML5标准的一个重要组成部分,实现了浏览器之间的实时通讯,以chrome为首的越来越多的浏览器厂家宣布支持webrtc标准。
[0006]其中。Webrtc技术和标准的典型应用场景为点对点通话、多方视频会议、客服中心和远程教育。也就是说,使用webrtc技术来开发的浏览器应用,可以实现实时通讯中的获取话筒、屏幕共享、获取摄像头、流媒体传输等功能,使得用户在浏览器中就可以进行实时通话。但是使用webrtc标准接口所开发的浏览器中的音视频多方通话的会议的效果、使用体验仍然需要进一步的改善,比如多方会议时屏幕窗口都比较小,很难判断是谁在进行发言,会议发言记录只能用录音的方式保存,而无法保存字幕,比如,当参加会议的人员使用不同的语言进行时,沟通的语言障碍需要辅助显示字幕才能更好的提升用户的体验。

【发明内容】

[0007]本发明要解决的技术问题是提供一种WebRTC点对点音视频通话的方法及WebRTC服务器与WebRTC客户端,以实现跨越语言的障碍进行通话。
[0008]为了解决上述技术问题,本发明提供了一种网页实时通信WebRTC点对点音视频通话的方法,包括:
[0009]WebRTC服务器接收到第一 WebRTC客户端的字幕请求消息或翻译字幕请求消息后,将所述字幕请求消息或翻译字幕请求消息发送给一个或多个目标WebRTC客户端;
[0010]所述WebRTC服务器接收到所述目标WebRTC客户端返回的字幕或翻译后的字幕后,实时地将所述字幕或翻译后的字幕发送给所述第一 WebRTC客户端。
[0011]进一步地,上述方法还具有下面特点:
[0012]所述翻译字幕请求消息包括:翻译源语言、翻译目标语言以及翻译返回类型,所述翻译返回类型包括文字翻译和/或语音翻译。
[0013]为了解决上述问题,本发明还提供了一种网页实时通信WebRTC服务器,其中,包括:
[0014]第一传输模块,用于接收到第一 WebRTC客户端的字幕请求消息或翻译字幕请求消息后,将所述字幕请求消息或翻译字幕请求消息发送给一个或多个目标WebRTC客户端;
[0015]第二传输模块,用于接收到所述目标WebRTC客户端返回的字幕或翻译后的字幕后,实时地将所述字幕或翻译后的字幕发送给所述第一 WebRTC客户端。
[0016]进一步地,上述WebRTC服务器还具有下面特点:
[0017]所述翻译字幕请求消息包括:翻译源语言、翻译目标语言以及翻译返回类型,所述翻译返回类型包括文字翻译和/或语音翻译。
[0018]为了解决上述问题,本发明还提供了一种网页实时通信WebRTC点对点音视频通话的方法,包括:
[0019]WebRTC客户端向WebRTC服务器发送请求一个或多个目标WebRTC客户端的字幕请求消息或翻译字幕请求消息;
[0020]所述WebRTC客户端接收到所述WebRTC服务器返回的字幕或翻译字幕后,将所述字幕或翻译字幕显示在对应的目标WebRTC客户端的视频框中。
[0021]进一步地,上述方法还具有下面特点:
[0022]所述翻译字幕请求消息包括:翻译源语言、翻译目标语言以及翻译返回类型,所述翻译返回类型包括文字翻译和/或语音翻译。
[0023]进一步地,上述方法还具有下面特点:还包括:
[0024]所述WebRTC客户端保存所述字幕或所述翻译字幕。
[0025]为了解决上述问题,本发明还提供了一种WebRTC客户端,其中,包括:
[0026]发送模块,用于向WebRTC服务器发送请求一个或多个目标WebRTC客户端的字幕请求消息或翻译字幕请求消息;
[0027]显示模块,用于接收到所述WebRTC服务器返回的字幕或翻译字幕后,将所述字幕或翻译字幕显示在对应的目标WebRTC客户端的视频框中。
[0028]进一步地,上述WebRTC客户端还具有下面特点:还包括:
[0029]保存模块,用于保存所述字幕或所述翻译字幕。
[0030]为了解决上述问题,本发明还提供了一种网页实时通信WebRTC点对点音视频通话的方法,包括:
[0031]WebRTC客户端接收到WebRTC服务器的字幕请求消息后,将自己的音频发送给语音分析字幕服务器;
[0032]所述WebRTC客户端接收到所述语音分析字幕服务器返回的字幕后将所述字幕返回给所述WebRTC服务器。
[0033]进一步地,上述方法具有下面特点:所述WebRTC客户端接收到所述语音分析字幕服务器返回的字幕后将所述字幕返回给所述WebRTC服务器,包括:
[0034]所述WebRTC客户端接收到所述语音分析字幕服务器返回的字幕后,向翻译服务器发送翻译字幕请求,所述翻译字幕请求包括:所述字幕、翻译源语言、翻译目标语言;
[0035]所述WebRTC客户端接收到所述翻译服务器返回的翻译后的字幕后,将翻译后的字幕发送给所述WebRTC服务器。
[0036]进一步地,上述方法具有下面特点:
[0037]所述翻译字幕请求还包括:翻译返回类型,所述翻译返回类型包括语音翻译;所述方法还包括:
[0038]所述WebRTC客户端接收到所述翻译服务器返回的翻译后的音频后,将翻译后的音频放到实时的视频流中,通过预先建立的媒体通道发送给请求翻译字幕的WebRTC客户端。
[0039]为了解决上述问题,本发明还提供了一种WebRTC客户端,其中,包括:
[0040]第一传输模块,用于接收到WebRTC服务器的翻译字幕请求消息后,将自己的音频发送给语音分析字幕服务器;
[0041]第二传输模块,用于接收到所述语音分析字幕服务器返回的字幕后将所述字幕返回给所述WebRTC服务器。
[0042]进一步地,上述WebRTC客户端还具有下面特点:
[0043]所述第二传输模块,具体用于接收到所述语音分析字幕服务器返回的字幕后,向翻译服务器发送翻译字幕请求,所述翻译字幕请求包括:所述字幕、翻译源语言、翻译目标语言;接收到所述翻译服务器返回的翻译后的字幕后,将翻译后的字幕发送给所述WebRTC服务器。
[0044]进一步地,上述WebRTC客户端还具有下面特点:所述翻译字幕请求还包括:翻译返回类型,所述翻译返回类型包括语音翻译;所述WebRTC客户端还包括:
[0045]第三传输模块,用于接收到所述翻译服务器返回的翻译后的音频后,将翻译后的音频放到实时的视频流中,通过预先建立的媒体通道发送给请求翻译字幕的WebRTC客户端。
[0046]综上,本发明提供一种WebRTC点对点音视频通话的方法及WebRTC服务器与WebRTC客户端,使用户可以跨越语言的障碍,更方便的进行通话。在多人视频会议中,发言人将自动解析和显示字幕、翻译字幕或翻译音频,用户可以轻松判断谁正在发言和识别发言内容,而不需要在多个视频窗口中寻找发言人。
【附图说明】
[0047]图1为现有技术的webrtc服务器的功能模块结构图;
[0048]图2为现有的使用webrtc技术建立双方通话的流程图;
[0049]图3为本发明实施例一的webrtc建立P2P (Peer to Peer,点
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1