一种直播流的审查干预方法、装置、存储介质及设备与流程

文档序号：29628051发布日期：2022-04-13 15:02阅读：来源：国知局

技术特征：
1.一种直播流的审查干预方法，其特征在于，包括：获取待审查的目标直播数据流，并对所述目标直播数据流进行预处理，分离出所述目标直播数据流中的音频流和视频流进行缓存；对所述音频流进行语音识别，得到敏感词以及所述敏感词对应的标记信息；根据所述敏感词对应的标记信息，确定所述敏感词在所述音频流中出现的目标位置，并利用预设消音方式对所述目标位置上的音频流进行干预，得到审查干预后的音频流；根据所述审查干预后的音频流中音频帧的时间戳信息，从缓存的所述视频流中检索对应的视频帧，并将所述审查干预后的音频帧和视频帧进行同步，以及将同步后的视频流进行播放。2.根据权利要求1所述的方法，其特征在于，所述获取待审查的目标直播数据流，包括：通过预设音视频采集设备获取待审查的目标直播数据流；和/或，根据网络实时消息传输协议rtmp拉流地址获取待审查的目标直播数据流；和/或，从本地视频文件获取待审查的目标直播数据流。3.根据权利要求1所述的方法，其特征在于，所述对所述音频流进行语音识别，得到敏感词以及所述敏感词对应的标记信息，包括：对所述音频流进行语音识别，并将识别结果转换为标准字幕格式的字幕文本；根据预设敏感词库，对所述字幕文本进行敏感词检测，确定所述敏感词并进行标记，得到所述字幕文本中包含的敏感词以及所述敏感词对应的标记信息。4.根据权利要求1所述的方法，其特征在于，所述根据所述敏感词对应的标记信息，确定所述敏感词在所述音频流中出现的目标位置，包括：根据所述敏感词对应的标记信息，确定所述敏感词在所述音频流中出现的开始时间和结束时间；根据所述开始时间和结束时间，标记出所述敏感词在所述音频流中出现的目标位置。5.根据权利要求1所述的方法，其特征在于，所述预设消音方式为静音或哔音；所述利用预设消音方式对所述目标位置上的音频流进行干预，得到审查干预后的音频流，包括：利用静音或哔音覆盖所述目标位置上的敏感词发声的效果，得到审查干预后的音频流。6.根据权利要求1所述的方法，其特征在于，所述根据所述审查干预后的音频流中音频帧的时间戳信息，从缓存的所述视频流中检索对应的视频帧，并将所述审查干预后的音频帧和视频帧进行同步，以及将同步后的视频流进行播放，包括：根据所述审查干预后的音频流中当前时刻音频帧的时间戳信息，从缓存的所述视频流中检索出开始播放时间不大于所述当前时刻音频帧的开始播放时间的视频帧，并将所述当前时刻音频帧和检索出的视频帧编码成预设格式的视频流，作为当前时刻同步后的视频流进行播放。7.根据权利要求3所述的方法，其特征在于，所述根据所述审查干预后的音频流中音频帧的时间戳信息，从缓存的所述视频流中检索对应的视频帧，并将所述审查干预后的音频帧和视频帧进行同步，以及将同步后的视频流进行播放，包括：根据所述审查干预后的音频流中当前时刻音频帧的时间戳信息，从缓存的所述视频流中检索出开始播放时间不大于所述音频帧的开始播放时间的视频帧，以及从脱敏处理后的
字幕文本中检索出开始播放时间不大于所述音频帧的开始播放时间的字幕帧；将所述当前时刻音频帧和检索出的视频帧以及字幕帧编码成预设格式的视频流，作为当前时刻同步后的视频流进行播放。8.根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：记录对所述目标直播数据流进行审查干预所消耗的处理时间；判断所述处理时间是否小于预设审查干预时间，若是，则调小所述预设审查干预时间；如否，则调大所述预设审查干预时间。9.一种直播流的审查干预装置，其特征在于，包括：获取单元，用于获取待审查的目标直播数据流，并对所述目标直播数据流进行预处理，分离出所述目标直播数据流中的音频流和视频流进行缓存；识别单元，用于对所述音频流进行语音识别，得到敏感词以及所述敏感词对应的标记信息；干预单元，用于根据所述敏感词对应的标记信息，确定所述敏感词在所述音频流中出现的目标位置，并利用预设消音方式对所述目标位置上的音频流进行干预，得到审查干预后的音频流；同步单元，用于根据所述审查干预后的音频流中音频帧的时间戳信息，从缓存的所述视频流中检索对应的视频帧，并将所述审查干预后的音频帧和视频帧进行同步，以及将同步后的视频流进行播放。10.一种直播流的审查干预设备，其特征在于，包括：处理器、存储器、系统总线；所述处理器以及所述存储器通过所述系统总线相连；所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行权利要求1-8任一项所述的方法。11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1-8任一项所述的方法。

技术总结
本申请公开了一种直播流的审查干预方法、装置、存储介质及设备，该方法包括：首先对获取到目标直播数据流进行预处理，分离出其中的音频流和视频流并进行缓存，然后对音频流进行语音识别，得到敏感词及其对应的标记信息，接着根据敏感词的标记信息，确定敏感词在音频流中出现的目标位置，并利用预设消音方式对目标位置上的音频流进行干预，得到审查干预后的音频流，进而根据音频流中音频帧的时间戳信息，从缓存的视频流中检索对应的视频帧与音频帧进行同步和播放。本申请是先基于语音识别技术，实时识别目标直播数据流中的敏感词，再利用预设消音方式，实时检测和干预敏感词及音视频的同步和播放，从而能够实现适时的延时播放，保障直播安全性。障直播安全性。障直播安全性。

技术研发人员：王玮杨灿王兆育丁艳燕国丽
受保护的技术使用者：安徽听见科技有限公司
技术研发日：2021.12.31
技术公布日：2022/4/12

完整全部详细技术资料下载

当前第2页1 2