本技术涉及音视频处理,特别是涉及一种音视频增强方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着视频会议技术的广泛应用,多人视频会议在各行各业都有重要应用。通过对多人会议的音视频进行音视频增强处理,能有效提高音视频的质量。因此,如何高效地进行音视频增强处理,成为了重要的研究方向。
2、传统技术通常是通过人工处理的方式,进行音视频增强处理;但是,通过该方式进行音视频增强处理需要耗费较多的人工处理时间,导致音视频增强处理的效率较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高音视频增强处理的效率的音视频增强方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种音视频增强方法。所述方法包括:
3、获取多个会场的音视频;所述音视频为与金融业务场景相关的音视频;
4、根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场;
5、对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频;
6、将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频。
7、在其中一个实施例中,所述对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频,包括:
8、对所述主会场的音视频中的音频进行特征提取,得到所述主会场的音视频的音频特征;
9、对所述主会场的音视频中的视频进行特征提取,得到所述主会场的音视频的视频特征;
10、根据所述音频特征和所述视频特征,对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频。
11、在其中一个实施例中,所述根据所述音频特征和所述视频特征,对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频,包括:
12、根据所述音频特征和所述视频特征,对所述主会场的所述视频进行掩码提取处理,得到所述主会场的所述视频的掩码信息;
13、根据所述掩码信息,对所述主会场的所述视频进行分割处理,得到所述主会场的所述视频的视频主体信息;
14、对所述视频主体信息和所述音频特征进行通道连接处理,得到所述主会场的音视频的音视频特征;
15、根据所述音视频特征,对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频。
16、在其中一个实施例中,所述根据所述音视频特征,对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频,包括:
17、根据所述主会场的所述视频的光流信息,对所述音视频特征进行特征更新处理,得到更新后的音视频特征;
18、对所述更新后的音视频特征和所述主会场的所述视频的背景信息进行组合处理,得到所述主会场的增强音视频。
19、在其中一个实施例中,在将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频之前,还包括:
20、对所述分会场的音视频进行视频质量信息的降低处理,得到所述分会场的低质量音视频;所述视频质量信息至少包括帧率、码率和分辨率中的一种或者多种;
21、所述将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频,包括:
22、将所述主会场的增强音视频和所述分会场的低质量音视频进行融合处理,得到所述多个会场的融合音视频。
23、在其中一个实施例中,所述根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场,包括:
24、对所述多个会场的音视频进行语音识别,确定出所述多个会场中的发言会场;
25、将所述发言会场作为所述主会场,并将所述多个会场中的非主会场作为所述分会场。
26、在其中一个实施例中,在根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场之前,还包括:
27、获取所述多个会场对应的参会角色;
28、所述根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场,包括:
29、根据所述参会角色和所述多个会场的音视频所处的会议环节,对所述多个会场进行划分处理,确定出所述主会场和所述分会场。
30、第二方面,本技术还提供了一种音视频增强装置。所述装置包括:
31、视频获取模块,用于获取多个会场的音视频;所述音视频为与金融业务场景相关的音视频;
32、会场确定模块,用于根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场;
33、视频处理模块,用于对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频;
34、视频融合模块,用于将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频。
35、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
36、获取多个会场的音视频;所述音视频为与金融业务场景相关的音视频;
37、根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场;
38、对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频;
39、将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频。
40、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
41、获取多个会场的音视频;所述音视频为与金融业务场景相关的音视频;
42、根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场;
43、对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频;
44、将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频。
45、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
46、获取多个会场的音视频;所述音视频为与金融业务场景相关的音视频;
47、根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场;
48、对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频;
49、将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频。
50、上述音视频增强方法、装置、计算机设备、存储介质和计算机程序产品,获取多个会场的音视频;所述音视频为与金融业务场景相关的音视频;根据所述多个会场的音视频,对所述多个会场进行划分处理,确定出所述多个会场中的主会场和分会场;对所述主会场的音视频进行音视频增强处理,得到所述主会场的增强音视频;将所述主会场的增强音视频和所述分会场的音视频进行融合处理,得到所述多个会场的融合音视频。该方案通过获取多个会场的音视频,根据多个音视频对多个会场进行划分,确定出主会场和分会场,对主会场的音视频进行音视频增强处理,将主会场的增强音视频和分会场的音视频进行融合,自动得到融合音视频,从而有利于提高音视频增强处理的效率和准确率。