一种教学视频中的音频调整方法及装置与流程

文档序号：12499692阅读：258来源：国知局

本发明属于计算机技术领域，尤其涉及一种教学视频中的音频调整方法及装置。

背景技术：

随互联网的快速发展，学生学习方式与方法逐渐增多，但大部分均基于视频教学，而视频教学效果的好坏除受限于教师的优秀程度外，还受限于教学视频质量的好坏，目前市面上学习平板等硬件内置的教学视频质量参差不齐，教学视频发布前均需经过人工逐帧、逐秒检测以及修改，以提升教学视频的质量，但此方法耗时费力，还不能对视频的整体质量进行把控。

技术实现要素：

本发明的目的在于提供一种教学视频中的音频调整方法及装置，旨在解决现有技术中教学视频中音频质量较差导致教学效果不佳的情况。

一方面，本发明提供了一种教学视频中的音频调整方法，所述方法包括下述步骤：

录制标准音频段，并获取所述标准音频段的声音频率以及振幅变化区间作为标准值；

提取教学视频中的音频，将所述音频按照预设长度分成若干音频段；

将所述音频段中的声音频率以及振幅变化与所述标准值进行比对，对超出所述标准值的所述音频段进行调整。

另一方面，本发明提供了一种教学视频中的音频调整装置，所述装置包括：

标准值获取单元，用于录制标准音频段，并获取所述标准音频段的声音频率以及振幅变化区间作为标准值；

音频段拆分单元，用于提取教学视频中的音频，将所述音频按照预设长度分成若干音频段；以及

调整单元，用于将所述音频段中的声音频率以及振幅变化与所述标准值进行比对，对超出所述标准值的所述音频段进行调整。

在本发明实施例中，通过录制标准音频段，对教学视频中的音频进行分段后基于标准音频段进行处理，分别对音频段中的声音频率以及振幅变化进行调整，从而得到高质量的教学视频。

附图说明

图1是本发明实施例一提供的教学视频中的音频调整方法的实现流程图；

图2是本发明实施例二提供的教学视频中的音频调整方法的实现流程图；

图3是本发明实施例三提供的教学视频中的音频调整装置的结构示意图；以及

图4是本发明实施例四提供的教学视频中的音频调整装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述：

实施例一：

图1示出了本发明实施例一提供的教学视频中的音频调整方法的实现流程图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在步骤S101中，录制标准音频段，并获取标准音频段的声音频率以及振幅变化区间作为标准值。

在本发明实施例中，由于教学视频中的音频质量较差会影响到教学效果，因此需要对教学视频中的音频进行调整，避免因为音频质量较差影响学生听课。由于每个老师的声音不同，因此声音频率以及振幅也不同，在录制教学视频中受限于录音环境的影响，教学视频中的音频质量较差，需要在录制教学视频之后，对其中的音频进行调整。通常需要录制标准音频段作为音频调整的参照，基于男声与女声的差异，该标准音频段可以是根据男女教师进行区分，例如，在教学视频中，如果出现男教师的声音，录制男教师的声音作为标准音频段；反之，出现女教师的声音，录制女教师的声音作为标准音频段。为了进一步提升音频调整的效果，可以根据教材视频中音频的来源，录制专属标准音频段。对于录制的标准音频段，获取该标准音频段的声音频率以及振幅变化区间，将该声音频率以及振幅变化区间作为标准值，以用于调整音频段，提供有效的调整标准值进行参考，提高调整音频段的调整效果。

进一步地，根据预设的时长，开启麦克风进行录音。

具体地，在录制标准音频段时，为了避免过长的音频段影响调整速率以及过短的音频段影响调整效果，需要录制合理时长的标准音频段，因此根据预设的时长，开启麦克风进行录音，通常预设的时长根据需求设定为30s或者60s。在开启麦克风时，启动计时器开始计时，当到达预设的时长后，自动关闭麦克风结束录音。

另外，为了让用户在录制标准音频段时掌握录音的时长，可以在开启麦克风后，根据预设的时长开启倒计时，从而帮助用户在录制时掌握时间，获取有效地标准音频段。

在步骤S102中，提取教学视频中的音频，将音频按照预设长度分成若干音频段。

在本发明实施例中，对于待调整的教学视频，为了减少调整时的运算量，以提高调整效率，由于只需要对音频进行处理，因此提取教学视频中的音频，单独对教学视频中的音频进行处理，再将调整后的音频替换原教学视频中的音频，提高调整效率。为了进一步地提升音频调整效率以及增加调整效果，将音频按照预设长度分成若干音频段，一方面，将音频分成音频段后对音频段处理可以对音频段中符合参考标准的音频段剔除，留下不符合参考标准的音频段，单独进行调整，避免对符合参考标准的音频段重复调整；另一方面，整体调整音频，由于数据量较大，需要用户等待较长的调整时间，而且运算量过大也会引起宕机的情况，不方便用户操作使用。

在步骤S103中，将音频段中的声音频率以及振幅变化与标准值进行比对，对超出标准值的音频段进行调整。

在本发明实施例中，获取已经进行分段的音频段中的声音频率以及振幅变化，将音频段中的声音频率以及振幅变化与标准值进行比对，从而对超出标准值的音频段进行调整。

进一步地，将音频段中的声音频率以及振幅变化与标准值进行比对；对超出标准值的音频段进行标记；提取被标记的音频段，将被标记的音频段进行批量调整。

具体地，获取音频段中的声音频率以及振幅变化，将该音频段中的声音频率以及振幅变化分别与标准值中的声音频率以及振幅变化区间进行比对，对于超出标准值的音频段进行标记，然后单独提取被标记的音频段，以便于对被标记的音频段进行批量处理，提高音频调整效率。在实际应用中，对教学视频中的音频进行分段后，按照音频的播放时间，对音频段依次从大到小进行编号，编号的方式不局限于数字或者字母编号，然后按照编号顺序，依次将音频段中的声音频率以及振幅变化与标准值进行比对，对于超出标准值的音频段进行标记，在提取被标记的音频段，可以根据编号得知被标记的音频段在音频中所处的位置，以及可以得知被标记的音频段在音频中所占的百分比，为教学视频录制中质量的把控提供数据来源。

实施例二：

图2示出了本发明实施例二提供的教学视频中的音频调整方法的实现流程图，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在步骤S201中，录制标准音频段，并获取标准音频段的声音频率以及振幅变化区间作为标准值。

在步骤S202中，提取教学视频中的音频，将音频按照预设长度分成若干音频段。

在步骤S203中，将音频段中的声音频率以及振幅变化与标准值进行比对，对超出标准值的音频段进行调整。

在本发明实施例中，步骤S201—S203的实施方式可对应参考前述实施例一中步骤S101—S103的描述，在此不再赘述。

在步骤S204中，在调整后，提取设定数量的连续的音频段。

在本发明实施例中，为了使得学生用户在观看教学视频时不会因为老师的在一段时间内没有较大的起伏变化导致注意力下降开小差，在调整音频后，对所有的音频段进行进一步处理。按照设定数量，提取连续的音频段，根据实际需求，该设定数量可以设置为3，比如，对于按照预设长度分成的若干音频段，按照时间顺序提取3段连续编号的音频段。

在步骤S205中，在连续的音频段中，计算相邻音频段之间的声音频率的偏差值以及振幅的偏差值。

在本发明实施例中，对于提取的连续的音频段，计算两两相邻的音频段之间的声音频率的偏差值以及振幅的偏差值，比如，将提取的3段连续的音频段作为子音频段，按照时间顺序该3段连续编号的音频段依次编号为1、2、3，分别计算该子音频段中编号为1和编号为2的音频段的声音频率的偏差值以及振幅的偏差值，以及编号为2和编号为3的音频段的声音频率的偏差值以及振幅的偏差值。通过计算两两相邻的音频段之间的声音频率的偏差值以及振幅的偏差值，可以根据偏差值判断出音频段之间的变化程度。

在步骤S206中，将声音频率的偏差值以及振幅的偏差值分别与第一预设偏差值以及第二预设偏差值进行比对。

在本发明实施例中，第一预设偏差值为预先设定的声音频率的偏差值，以及第二预设偏差值为预先设定的振幅的偏差值，将声音频率的偏差值以及振幅的偏差值分别与第一预设偏差值以及第二预设偏差值进行比对，可以得知两两相邻音频段之间变化程度是否足以吸引学生用户听讲，避免学生用户因为教师保持在一定频率和振幅的声音感到乏味，无法集中注意力。

在步骤S207中，对超出第一预设偏差值以及第二预设偏差值的音频段进行标记。

在本发明实施例中，对超出第一预设偏差值以及第二预设偏差值的音频段进行标记，对于这些标记的音频段可以进一步地调整，或者仅仅进行标记，在实际应用时，根据学生用户的课堂反馈再进行进一步地调整。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，所述的存储介质，如ROM/RAM、磁盘、光盘等。

实施例三：

图3示出了本发明实施例三提供的教学视频中的音频调整装置的结构示意图，为了便于说明，仅示出了与本发明实施例相关的部分。在本发明实施例中，教学视频中的音频调整装置包括：标准值获取单元31、音频段拆分单元32以及调整单元33，其中：

标准值获取单元31，用于录制标准音频段，并获取标准音频段的声音频率以及振幅变化区间作为标准值。

进一步地，该标准值获取单元31包括：计时单元311，用于根据预设的时长，开启麦克风进行录音。

音频段拆分单元32，用于提取教学视频中的音频，将音频按照预设长度分成若干音频段。

调整单元33，用于将音频段中的声音频率以及振幅变化与标准值进行比对，对超出标准值的所述音频段进行调整。

进一步地，该调整单元33包括：

第一比对单元331，用于将音频段中的声音频率以及振幅变化与标准值进行比对；

第一标记单元332，用于对超出标准值的音频段进行标记；以及

批量调整单元333，用于提取被标记的音频段，将被标记的音频段进行批量调整。

实施例四：

图4示出了本发明实施例四提供的教学视频中的音频调整装置的结构示意图，为了便于说明，仅示出了与本发明实施例相关的部分。在本发明实施例中，教学视频中的音频调整装置包括：标准值获取单元41、音频段拆分单元42、调整单元43、音频段提取单元44、偏差值计算单元45、第二比对单元46以及第二标记单元47，其中：

标准值获取单元41，用于录制标准音频段，并获取标准音频段的声音频率以及振幅变化区间作为标准值。

音频段拆分单元42，用于提取教学视频中的音频，将音频按照预设长度分成若干音频段。

调整单元43，用于将音频段中的声音频率以及振幅变化与标准值进行比对，对超出标准值的所述音频段进行调整。

音频段提取单元44，用于在调整后，提取设定数量的连续的音频段。

偏差值计算单元45，用于在所述连续的音频段中，计算相邻音频段之间的声音频率的偏差值以及振幅的偏差值。

第二比对单元46，用于将所述声音频率的偏差值以及振幅的偏差值分别与第一预设偏差值以及第二预设偏差值进行比对。

第二标记单元47，用于对超出第一预设偏差值以及第二预设偏差值的音频段进行标记。

在本发明实施例中，教学视频中的音频调整装置的各单元可由相应的硬件或软件单元实现，各单元可以为独立的软、硬件单元，也可以集成为一个软、硬件单元，在此不用以限制本发明。该装置各单元的实施方式具体可参考前述实施例一的描述，在此不再赘述。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：符莉
技术所有人：广东小天才科技有限公司
我是此专利的发明人

上一篇：一种超声骨刀刀头的制作方法与工艺
上一篇：一种立篦式溢流雨水口的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。