一种视频会议中的同声传译方法、服务器和可读存储介质与流程

文档序号：32478264发布日期：2022-12-09 19:29阅读：78来源：国知局

1.本发明实施例涉及视频会议领域，特别涉及一种视频会议中的同声传译方法、服务器和可读存储介质。

背景技术：

2.视频会议系统，又称电视会议系统，这是指两个或两个以上不同地方的个人或群体，通过传输线路及多媒体设备，将声音、影像及文件资料互传，实现即时且互动的沟通，以实现远程会议的系统设备。视频会议的使用有点像电话，除了能看到与你通话的人并进行语言交流外，还能看到他们的表情和动作，使处于不同地方的人就像在同一会议室内沟通。
3.视频会议系统中，通过发言人终端接入服务器，可以输出语音及视频数据，通过参会人终端接入服务器，可以接收发言人终端的语音及视频数据，形成会议场景。发明人发现现有技术中至少存在如下问题：当存在翻译需求时，现有视频会议的翻译者也只能通过参会人身份加入会议，那么就无法实现同声传译，只能实现交替传译，或者两路声音重叠。

技术实现要素：

4.本发明实施方式的目的在于提供一种视频会议中的同声传译方法、服务器和可读存储介质，使得在视频会议中实现同声传译。
5.为解决上述技术问题，本发明的实施方式提供了一种视频会议中的同声传译方法，应用于服务器，包括：组建视频会议，连接参会人端和译者端；从所述参会人端中识别出发言人端；获取所述发言人端的第一语音数据；在翻译模式下，将所述第一语音数据发至所述译者端；获取来自所述译者端的第二语音数据，所述第二语音数据为第一语音数据的语音翻译；将所述第二语音数据发给所述发言人端以外的参会人端。
6.本发明的实施方式还提供了一种服务器，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述的视频会议中的同声传译方法。
7.本发明的实施方式还提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现如上述的视频会议中的同声传译方法。
8.本发明实施方式相对于现有技术而言，主要区别及其效果在于：在视频会议组建中，增加译者端，且设立翻译模式，在翻译模式下，参会人端屏蔽发言人端的语音，接收译者端翻译后的语音，实现参会人在翻译模式下，可以直接听到翻译后的语音，实现了在视频会议中进行同声传译。
9.另外，还包括：在非翻译模式下，将所述第一语音数据发送给除所述发言人端以外的参会人端。明确在非翻译模式下，发言人仍然听到发言人原声，便于实现不同语种参会人在会议中的不同需求，同时便于融合无需翻译的场景。
10.另外，所述从参会人端中识别出发言人端，包括：根据从各参会人端检测到的音量
高低，从参会人端中识别出发言人端。通过音量高低，实现自动识别发言人端。
11.另外，所述从参会人端中识别出发言人端，还包括：优先选定上一时段的发言人端作为本时段的发言人端。
12.另外，所述从参会人端中识别出发言人端，包括：根据管理员设置确定所述发言人端。
13.另外，所述从参会人端中识别出发言人端之后，包括：对其他参会人端禁言，直至所述发言人端发出结束发言的信号。
14.另外，所述发言人端对应有语种信息；所述将第一语音数据发至所述译者端，具体为：将所述第一语音数据发至与所述发言人端的语种信息匹配的译者端。通过多种语种的设置，实现多种翻译语种的切换，便于融合不同语种参会人需要不同语种翻译的场景。
15.另外，所述获取来自所述译者端的第二语音数据之后，包括：将所述第二语音数据转换成文字信息，将所述文字信息发送至所述发言人端以外的参会人端，供在视频会议的界面显示。通过语音文字转换，实现视频会议中同声传译。
附图说明
16.一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。
17.图1为实施例1中一种视频会议中的同声传译方法的连接框图；
18.图2为实施例1中一种视频会议中的同声传译方法的流程图；
19.图3为实施例2中一种视频会议中的同声传译方法的流程图；
20.图4为实施例3中一种视频会议中的同声传译方法的流程图；
21.图5为实施例4中一种视频会议中的同声传译方法的流程图；
22.图6为实施例6中一种视频会议中的同声传译方法的流程图；
23.图7为实施例7中一种视频会议中的服务器的示意图。
具体实施方式
24.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的各实施方式进行详细的阐述。然而，本领域的普通技术人员可以理解，在本发明各实施方式中，为了使读者更好地理解本技术而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施方式的种种变化和修改，也可以实现本技术所要求保护的技术方案。以下各个实施例的划分是为了描述方便，不应对本发明的具体实现方式构成任何限定，各个实施例在不矛盾的前提下可以相互结合相互引用。
25.本发明的第一实施方式涉及一种视频会议中的同声传译方法。流程如图1所示，具体如下：应用于服务器，包括：
26.步骤101，组建视频会议，连接参会人端和译者端；
27.步骤102，从参会人端中识别出发言人端；获取发言人端的第一语音数据；
28.步骤103，判断是否为翻译模式，若是，则执行步骤104；若否，则执行步骤105；
29.步骤104，将第一语音数据发至译者端；获取来自译者端的第二语音数据，第二语
音数据为第一语音数据的语音翻译；将第二语音数据发给发言人端以外的参会人端。
30.步骤105，将第一语音数据发送给除发言人端以外的参会人端。
31.本实施方式相对于现有技术而言，在视频会议组建中，增加译者端，且设立翻译模式，在翻译模式下，参会人端屏蔽发言人端的语音，接收译者端翻译后的语音，实现参会人在翻译模式下，可以直接听到翻译后的语音，实现了在视频会议中进行同声传译。此外，本实施方式还明确在非翻译模式下，发言人仍然听到发言人原声，便于实现不同语种参会人在会议中的不同需求，同时便于融合无需翻译的场景。值得一提的是，实际应用中，可以默认选择翻译模式，去除非翻译模式，形成更为灵活多变的方案。
32.本发明的第二实施方式涉及一种视频会议中的同声传译方法。第二实施方式是在第一实施方式的基础上做了进一步改进，主要改进之处在于：在第一实施方式中，从参会人端中识别出发言人端。而在本发明第二实施方式中，进一步根据音量高低确定当前发言人端。
33.步骤201，组建视频会议，连接参会人端和译者端；
34.步骤202，根据从各参会人端检测到的音量高低，从参会人端中识别出发言人端；且优先选定上一时段的发言人端作为本时段的发言人端；
35.举例：上一时段的a发言人端，在下一时段中与b发言人端音量相同，仍由a发言人端发言。
36.步骤203，获取发言人端的第一语音数据
37.步骤204，判断是否为翻译模式，若是，则执行步骤205；若否，则执行步骤206；
38.步骤205，将第一语音数据发至译者端；获取来自译者端的第二语音数据，第二语音数据为第一语音数据的语音翻译；将第二语音数据发给发言人端以外的参会人端。
39.步骤206，将第一语音数据发送给除发言人端以外的参会人端。
40.本实施方式进一步通过音量高低，实现自动识别发言人端。
41.本发明的第三实施方式涉及一种视频会议中的同声传译方法。第三实施方式是在第一实施方式的基础上做了进一步改进，主要改进之处在于：在第一实施方式中，从参会人端中识别出发言人端。而在本发明第三实施方式中，根据管理员设置确定发言人端。
42.步骤301，组建视频会议，连接参会人端和译者端；
43.步骤302，根据管理员设置确定发言人端；
44.步骤303，获取发言人端的第一语音数据；
45.步骤304，判断是否为翻译模式，若是，则执行步骤305；若否，则执行步骤306；
46.步骤305，将第一语音数据发至译者端；获取来自译者端的第二语音数据，第二语音数据为第一语音数据的语音翻译；将第二语音数据发给发言人端以外的参会人端。
47.步骤306，将第一语音数据发送给除发言人端以外的参会人端。
48.本实施方式根据管理员设置确定发言人端。
49.本发明的第四实施方式涉及一种视频会议中的同声传译方法。第四实施方式是在第一实施方式的基础上做了进一步改进，主要改进之处在于：从参会人端中识别出发言人端之后，对其他参会人端禁言，直至发言人端发出结束发言的信号。
50.步骤401，组建视频会议，连接参会人端和译者端；
51.步骤402，从参会人端中识别出发言人端；获取发言人端的第一语音数据；
52.步骤403，判断是否为翻译模式，若是，则执行步骤404；若否，则执行步骤405；
53.步骤404，将第一语音数据发至译者端；获取来自译者端的第二语音数据，第二语音数据为第一语音数据的语音翻译；将第二语音数据发给发言人端以外的参会人端，对其他参会人端禁言。
54.步骤405，将第一语音数据发送给除发言人端以外的参会人端，对其他参会人端禁言。
55.本实施方式从参会人端中识别出发言人端之后，对其他参会人端禁言，直至发言人端发出结束发言的信号。
56.可见，上述第二实施方式至第四实施方式分别提供了不同的发言人端识别方法，实际应用中，多种方法可以同时使用，也可以择一使用，还可以根据需要各种组合使用，在此不再一一列举。
57.本发明的第五实施方式涉及一种视频会议中的同声传译方法。第五实施方式与第一实施方式大致相同，主要区别之处在于：在第一实施方式中，在翻译模式下，将第一语音数据发至译者端；而在本发明第五实施方式中，发言人端对应有语种信息；将第一语音数据发至译者端，具体为：将第一语音数据发至与发言人端的语种信息匹配的译者端。通过多种语种的设置，实现多种翻译语种的切换，便于融合不同语种参会人需要不同语种翻译的场景。
58.本发明的第六实施方式涉及一种视频会议中的同声传译方法。第六实施方式是在第一实施方式的基础上做了进一步改进，主要改进之处在于：在翻译模式下，将第二语音数据转换成文字信息，将文字信息发送至发言人端以外的参会人端，供在视频会议的界面显示。通过语音文字转换，实现视频会议中同声传译。
59.步骤601，组建视频会议，连接参会人端和译者端；
60.步骤602，从参会人端中识别出发言人端；获取发言人端的第一语音数据；
61.步骤603，判断是否翻译，若是，则执行步骤604；若否，则执行步骤606；
62.步骤604，将第一语音数据发至译者端；获取来自译者端的第二语音数据，第二语音数据为第一语音数据的语音翻译；将第二语音数据发给发言人端以外的参会人端。
63.步骤605，将第二语音数据转换成文字信息，将文字信息发送至发言人端以外的参会人端，供在视频会议的界面显示。通过语音文字转换，实现视频会议中同声传译。
64.步骤606，将第一语音数据发送给除发言人端以外的参会人端。
65.本实施方式在翻译模式下，将第二语音数据转换成文字信息，将文字信息发送至发言人端以外的参会人端，供在视频会议的界面显示。通过语音文字转换，实现视频会议中同声传译。
66.本发明第七实施方式涉及一种服务器，具体包括：至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如上述的视频会议中的同声传译方法。
67.其中，存储器和处理器采用总线方式连接，总线可以包括任意数量的互联的总线和桥，总线将一个或多个处理器和存储器的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起，这些都是本领域所公知
的，因此，本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件，也可以是多个元件，比如多个接收器和发送器，提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输，进一步，天线还接收数据并将数据传送给处理器。
68.其中，处理器负责管理总线和通常的处理，还可以提供各种功能，包括定时，外围接口，电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。
69.本发明第八实施方式涉及一种计算机可读存储介质，存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
70.即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
71.本领域的普通技术人员可以理解，上述各实施方式是实现本发明的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本发明的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王洁
技术所有人：苏州译牛智能科技有限公司
我是此专利的发明人

上一篇：一种交换机以及通信系统的制作方法
上一篇：光固化打印方法、相关装置及光固化打印机与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。