一种显示控制方法及装置的制造方法

文档序号：9420606阅读：217来源：国知局

一种显示控制方法及装置的制造方法
【技术领域】
[0001]本发明主要涉及通信技术领域，更具体说是涉及一种显示控制方法及装置。
【背景技术】
[0002]如今，随着网络技术的快速发展，在工作、生活等方面，很多用户已经开始采用网络视频的方式进行沟通，无需再到固定地方进行面对面沟通，非常方便。
[0003]基于此，目前企业内通常都会采用网络视频会议系统，由于其能够支持多方视频通话，并在每一个参与视频会议成员的客户端上以N宫格的方式显示所有参与视频会议成员，从而方便了位于不同地方的企业人员之间、或者企业人员与客户之间等的沟通，提高了工作效率。
[0004]其中，在实际应用中，参会人员中讲话者所在的显示界面的尺寸通常都会大于其他参会人员的显示界面的尺寸，且该讲话者所在显示界面通常会被放置在中间位置，成为主显示界面，从而使讲话者更加突出。然而，现有技术中，该界面切换过程通常是由每一个其他参会人员手动选择完成，非常麻烦，而且，若参会人员之间并不熟悉，就很难快速判断出当前讲话者，也就无法快速实现主显示界面的切换，大大降低了用户体验。

【发明内容】

[0005]有鉴于此，本发明提供了一种显示控制方法及装置，实现了预设显示位置的主显示界面的自动切换，无需参会人员判断当前讲话者并手动切换主显示界面，提高了用户体验。
[0006]为了实现上述目的，本申请提供了以下技术方案:
[0007]一种显示控制方法，包括:
[0008]获取与当前所有显示界面一一对应的当前播放时间的第一音频流；
[0009]基于获取的所有的第一音频流以及预存的语音活性检测算法，选定所述当前所有显示界面中的目标显示界面；
[0010]按照预设调整规则，将预设主显示位置的当前显示界面调整为所述目标显示界面。
[0011]优选的，所述基于获取的所有的第一音频流以及预存的语音活性检测算法，选定所述当前所有显示界面中的目标显示界面包括:
[0012]对获取的每一路第一音频流进行降采样处理后，截取第一预设时间段内的音频数据；
[0013]利用预存的语音活性检测算法对所述音频数据进行处理，得到N位特征字符串，N为不小于I的正整数；
[0014]基于所述特征字符串，选定所述当前所有显示界面中的目标显示界面。
[0015]优选的，所述利用预存的语音活性检测算法对所述音频数据进行处理，得到N位特征字符串包括:
[0016]将所述音频数据划分成为N个同等时间的音频片段，N为不小于I的正整数；
[0017]对每一个音频片段进行语音活性检测；
[0018]基于检测结果，将所述音频片段判断为语音的标记为1，所述音频片段判断为静音的标记为O ;
[0019]利用所述音频片段的标记结果形成所述音频数据的N位特征字符串。
[0020]优选的，所述基于所述特征字符串，选定所述当前所有显示界面中的目标显示界面包括:
[0021]统计每一路音频数据的特征字符串包含I的个数，并选择所有特征字符串包含I的个数中的最大数值；
[0022]判断所述确定的最大数值是否大于第一阈值；
[0023]若是，将所述最大数值对应的当前显示界面选定为目标显示界面；
[0024]若否，返回所述获取当前播放时间与当前所有显示界面一一对应的第一音频流步骤。
[0025]优选的，所述获取与当前所有显示界面一一对应的当前播放时间的第一音频流包括:
[0026]获取与当前第一显示界面一一对应的音视频流，以及与本地显示界面对应的本地录音流，其中，所述当前第一显示界面是当前所有显示界面中除所述本地显示界面之外的显不界面；
[0027]利用RTP数据协议对获取的所有音视频流进行处理，得到与所述当前第一显示界面对应的远端音频流；
[0028]按照播放时间对所述本地录音流以及解码后的远端音频流进行同步处理，得到与当前所有显示界面一一对应的当前播放时间的第一音频流。
[0029]优选的，还包括:
[0030]当选定的所述目标显示界面为本地显示界面时，返回所述获取与当前所有显示界面一一对应的当前播放时间的第一音频流步骤。
[0031]一种显示控制装置，包括:
[0032]第一获取模块，用于获取与当前所有显示界面一一对应的当前播放时间的第一音频流；
[0033]第一选择模块，用于基于获取的所有的第一音频流以及预存的语音活性检测算法，选定所述当前所有显示界面中的目标显示界面；
[0034]第一调整模块，用于按照预设调整规则，将预设主显示位置的当前显示界面调整为所述目标显示界面。
[0035]优选的，所述第一选择模块包括:
[0036]第一处理单元，用于对获取的每一路第一音频流进行降采样处理后，截取第一预设时间段内的音频数据；
[0037]第二处理单元，用于利用预存的语音活性检测算法对所述音频数据进行处理，得到N位特征字符串，N为不小于I的正整数；
[0038]第一选择单元，用于基于所述特征字符串，选定所述当前所有显示界面中的目标显示界面。
[0039]优选的，所述第二处理单元包括:
[0040]划分单元，用于将所述音频数据划分成为N个同等时间的音频片段，N为不小于I的正整数；
[0041]检测单元，用于对每一个音频片段进行语音活性检测；
[0042]标记构建单元，用于基于检测结果，将所述音频片段判断为语音的标记为1，所述音频片段判断为静音的标记为0，并利用所述音频片段的标记结果形成所述音频数据的N位特征字符串。
[0043]优选的，所述第一选择单元包括:
[0044]统计单元，用于统计每一路音频数据的特征字符串包含I的个数，并选择所有特征字符串包含I的个数中的最大数值；
[0045]判断单元，用于判断所述确定的最大数值是否大于第一阈值，若是，将所述最大数值对应的当前显示界面选定为目标显示界面。
[0046]由此可见，与现有技术相比，本申请提供了一种显示控制方法及装置，在获取当前播放时间与当前所有显示界面一一对应的第一音频信号后，基于该第一音频信号以及预存的语音活性检测算法，选定当前所有显示界面中的目标显示界面即为当前主显示界面，之后，按照预设调整规则，将预设显示位置的当前显示界面调整为该目标显示界面，这样，参会人员只需要关注预设显示位置的显示界面即可，无需再判断当前讲话者，也无需再手动完成主显示界面的切换，大大提高了用户体验。
【附图说明】
[0047]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
[0048]图1为本发明一种显示控制方法实施例的流程示意图；
[0049]图2为本发明另一种显示控制方法实施例的部分流程示意图；
[0050]图3为本发明又一种显示控制方法实施例的部分流程示意图；
[0051]图4为本发明提供的一种音频数据特征字符串提取方法示意图；
[0052]图5为本发明一种显示控制装置实施例的结构示意图；
[0053]图6为本发明另一种显示控制装置实施例的结构示意图。
【具体实施方式】
[0054]下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0055]本申请提供了一种显示控制方法及装置，在获取当前播放时间与当前所有显示界面一一对应的第一音频信号后，基于该第一音频信号以及预存的语音活性检测算法，选定当前所有显示界面中的目标显示界面即为当前主显示界面，之后，按照预设调整规则，将预设显示位置的当前显示界面调整为该目标显示界面，这样，参会人员只需要关注预设显示位置的显示界面即可，无需再判断当前讲话者，也无需再手动完成主显示界面的切换，大大提高了用户体验。
[0056]为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和【具体实施方式】对本发明作进一步详细的说明。
[0057]参照图1所示的本发明提出的一种显示控制方法实施例的流程示意图，该方法具体可以包括以下步骤:
[0058]步骤SllO:获取与当前所有显示界面一一对应的当前播放时间的第一音频流。
[0059]以多方视频会议为例，在实际应用中，每个参会人员

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李晓威;
技术所有人：北京奇艺世纪科技有限公司;
我是此专利的发明人

上一篇：一种桌面共享音频方法及系统的制作方法
上一篇：一种进行视频通话的方法及终端设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。