一种视频会议主视频自动切换决策算法的制作方法

文档序号：23895441发布日期：2021-02-09 12:03阅读：157来源：国知局

[0001]
本发明涉及主视频自动切换决策算法技术领域，具体为一种视频会议主视频自动切换决策算法。

背景技术：

[0002]
视频会议一般有两种模式，一种是讨论型会议，即个人根据议题及时发表自己的意见，没有发言的先后顺序，发言一般也较为短暂。另一种是发布型的会议，即有一个发言顺序，会议主持或主要人员发布一些事项或文件，然后依一定的顺序其它参会人员依次发言或汇报，且发言的时间一般较长。而一般的视频会议软件，其参会人员的会议视频显示只有两种，一种是多屏同显的“九宫格”模式，另一种即是“主画面”模式，即一个主画面居中，其余画面在主画面侧边以小图模式显示。九宫格模式比较适合发言人不确定的讨论型会议，而主画面模式比较适合有明确发言顺序的发布型会议。但是，在主画面模式下，主画面的切换是需要人工操作的，由会务人员或主持人及时切换到发言人所在的画面。加大了会务人员或主持人的工作负担，分散了注意力，注意力不能集中到会议流程或内容上去，若是参会人员数量较多，还需专门配置人员进行切换，增加了会议成本。

技术实现要素：

[0003]
本发明的目的在于提供一种视频会议主视频自动切换决策算法，充分利用计算机的计算能力，在开发布型视频会议时，通过算法确定当前的主发言人，自动将其画面切换为各参会端的视频主画面，无需人工介入，使与会人员能够更好的集中精力于会议，降低工作量。
[0004]
为实现上述目的，本发明提供如下技术方案：
[0005]
一种视频会议主视频自动切换决策算法，包括以下步骤：首先，视频会议软件设置界面中将嵌入本功能的设置界面，初次使用本功能前，使用者可以自行设定本功能的敏感度要求，后由软件将敏感度指标对应的阙值作为算法参数提供给算法参与算法的运算；算法根据收集到的各参会端的声音，依次和各参数进行比对，剔除不满足阙值的参会端，将最终满足各项参数对比要求的参会端的信息提交给视频会议软件的图像模块，要求图像模块将此参会端的图像置于各参会端的视频主画面上进行放大显示，凸显当前主发言人；若满足各项参数阙值对比要求的参会端不止一个，则优选各项参数均占优势的参会端置于各参会端的视频主画面；完成该流程后，继续监控各参会端的声音数据，进行一轮的判定，并根据判定结果更新视频主画面显示。
[0006]
与现有技术相比，本发明的有益效果是：
[0007]
本发明提供的一种视频会议主视频自动切换决策算法，本算法实施后，即可自动切换视频会议时的视频主画面显示为当前的主发言人，无需人工干预，减轻了会议管理人员的工作量，提高视频会议的质量和效果。
附图说明
[0008]
图1为本发明的算法对应功能的流程图；
[0009]
图2为本发明的算法计算过程流程图。
具体实施方式
[0010]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0011]
本发明实施例中：提供一种视频会议主视频自动切换决策算法，本算法对应功能的流程如附图1所示，其核心在于收集各参会端的音频数据并进行实时比对，根据算法确定当前的主发言人，本算法的计算过程如附图2所示。
[0012]
首先，视频会议软件设置界面中将嵌入本功能的设置界面，初次使用本功能前，使用者可以自行设定本功能的敏感度要求，后由软件将敏感度指标对应的阙值作为算法参数提供给算法参与算法的运算。例如，软件可以提供高中低三个挡位的敏感度设置，或采用百分比形式进行类似无级调速的设置，敏感度高，则只要有参会端的声音略高于其他参会端的声音，或者是参会端的发言市场略长于其他参会端，及只要某一参会端的某一个或某几个参数经算法运算后略高于其他参会端，则立即切换主视频显示的参会端为此参会端，敏感度越高，则视频切换的频率越高，软件可设置默认敏感度为中。比对参数包括但不限于各参会端声音的属性(如是否为人声，是否为噪音，是否杂音过大等)、声音的连续性(人声发言是否连续，是否为断续性人声)和声音的大小(人声的大小)。
[0013]
算法根据收集到的各参会端的声音，依次和各参数进行比对，剔除不满足阙值的参会端，将最终满足各项参数对比要求的参会端的信息提交给视频会议软件的图像模块，要求图像模块将此参会端的图像置于各参会端的视频主画面上进行放大显示，凸显当前主发言人。若满足各项参数阙值对比要求的参会端不止一个，则优选各项参数均占优势的参会端置于各参会端的视频主画面。完成该流程后，继续监控各参会端的声音数据，进行一轮的判定，并根据判定结果更新视频主画面显示。
[0014]
本算法内嵌到视频软件中，作为一个软件功能体现，提供给使用者的包括一个功能开关，一个敏感度设置选项。使用者打开本功能的开关，设置好敏感度后，在召开视频会议时，本算法即可介入，收集各参会端的音频数据，按算法的流程进行计算和对比，确定当前的主发言人，并自动将主发言人参会端的图像置于各参会端的视频主画面上进行放大显示。例，某一视频会议有三个参会端，分别为a、b、c，视频会议开始后，若用户设置了本功能开启，则本算法开始持续的分析a、b、c的语音数据，对比其音量、持续时长、背景噪音、声音清晰度等属性，并对其进行定量分析，给出该属性优质程度的定量值，以此定量值与用户设置的敏感度对应的相关数据阙值进行比对，首先排除掉属性优质程度定量值达不到阙值要求的参会端，后再对满足阙值要求的参会端的具体定量值按各参数的重要程度进行加权运算后得出一个总分数，将总分数最高的参会端提交给视频软件的视频显示模块要求将其做为目前的主发言人进行放大显示。
[0015]
同时，本算法带有自学习功能，如在使用中，因为判断不准确，造成会议管理人员
人工介入切换了参会端的视频主画面的显示内容，如因某个参会端背景噪音过大，干扰了人声，造成了算法判断失误剔除了该参会端的显示，而后由人工介入确定该参会端为主发言人置于各参会端的视频主画面上，算法则会自动记录此次调整，并与之前的各次人工调整会同计算后重新调整算法默认阙值的数值，将该变量计入到算法中，在下次计算中发挥作用。
[0016]
以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴明明
技术所有人：安徽马钢和菱实业有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。