一种基于知识蒸馏的情感分类广播系统及其方法与流程

文档序号：35700835发布日期：2023-10-12 00:14阅读：41来源：国知局

本发明属于智能广播的，具体涉及一种基于知识蒸馏的情感分类广播系统及其方法。

背景技术：

1、目前的广播系统，通过新闻采集器以及网络爬虫程序从安全合规的广播数据来源中进行广播内容汇集，广播系统首先在云端对采集到的播出文本使用文字转语音的方式生成音频节目，然后再使用rtmp等流媒体通信方式将音频节目传输到广播终端上进行音频节目播出。

2、上述方式中存在的主要问题是：

3、(1)播出的节目内容没有感情色彩

4、由于播出节目使用文本语音转换引擎(tts)进行转换，其转换时，没有针对播出的节目文本进行情感分类，所有的节目都是同一个语速，语调，因此播出的节目平淡而无感染力，无法对听众产品产生有效的影响力。

5、(2)节目传输时间过长

6、由于广播终端直接播放转换后的音频文件，相对于直接传输播放文本，音频文件传输的时间可能过长，在网络较差的情况下，甚至可能因为网络传输质量问题，而导致播放失败的情况。

技术实现思路

1、本发明的目的在于针对现有技术中的上述不足，提供一种基于知识蒸馏的情感分类广播系统及其方法，以解决现有广播播出节目无感情色彩，节目传输时间过长的问题。

2、为达到上述目的，本发明采取的技术方案是：

3、第一方面，一种基于知识蒸馏的情感分类广播系统，其包括：

4、节目播控服务子系统，用于将节目文本内容进行内容汇聚，存储到播出节目库，并根据播出需求将节目文本内容发送至智能广播终端子系统；

5、ai服务子系统，用于将情感分类bert预训练大模型进行知识蒸馏，训练得到边缘侧情感分类小模型，并将边缘侧情感分类小模型存储和下发至智能广播终端子系统；

6、智能广播终端子系统，用于接收边缘侧情感分类小模型和节目文本，并对节目文本进行情感分类，将分类所得的情感因子和节目文本传输到文本语音转换引擎，生成有情感因素的音频节目并进行播出。

7、第二方面，一种基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，包括以下步骤：

8、s1、将节目文本内容进行内容汇聚，存储到播出节目库，并根据播出需求将节目文本内容发送至智能广播终端子系统；

9、s2、对情感分类bert预训练大模型进行知识蒸馏，训练得到边缘侧情感分类小模型，并将边缘侧情感分类小模型存储和下发至智能广播终端子系统；

10、s3、采用边缘侧情感分类小模型对节目文本进行情感分类，将分类所得的情感因子和节目文本传输到文本语音转换引擎，生成有情感因素的音频节目并进行播出。

11、进一步地，步骤s1包括：

12、通过新闻采集器和网络爬虫对应急广播、地质灾害信息、其他三方应急发布、指定新闻资讯或者政府公告进行内容采集，对采集的内容进行数据清洗并将汇聚的节目数据保存到播出节目库，播出节目库采用数据和文件分离的方式进行存储，并基于播发服务将播出节目库的节目进行cdn发布。

13、进一步地，步骤s2中对情感分类bert预训练大模型进行知识蒸馏，训练得到边缘侧情感分类小模型，包括：

14、s2.1、初始化温度参数t；

15、s2.2、采用当前的温度参数t和损失函数训练学生模型；

16、s2.3、采用验证集的准确度评估训练学生模型在温度参数t下的性能；

17、s2.4、若验证集上的性能不满足预设条件，则增加温度参数t的值，并返回s2.2继续训练；若验证集上的性能满足预设条件，则保存当前的温度参数t，并缩小温度参数t的值，再返回s2.2继续训练；

18、直至温度参数t的值小于阈值时或训练轮数大于最大训练轮数时，停止训练。

19、进一步地，步骤s2.2包括：

20、引入温度参数t,并使用softmax函数进行温度缩放，缩放后的学生模型输出概率分布qi为：

21、

22、其中，ft(i；)为学生模型在输入文本内容样本xi下的输出概率分布，θ为学生模型的参数；

23、采用损失函数ls,t训练温度缩放后的学生模型：

24、

25、其中，yi为第i个文本内容训练样本的真实标签；n为文本内容训练样本总数；k为标签的类别数，即情感分类的数量。

26、进一步地，步骤s2.3包括：

27、

28、其中，nv为验证样本总数，at为模型准确度。

29、进一步地，步骤s3包括：

30、采用边缘侧情感分类小模型对节目文本进行情感分类，节目文本的情感分类包括急迫、愉悦、平和、悲伤，将四类情感分类概率最大的类别作为广播节目文本的情感因子；

31、将所得到的情感因子和节目文本传输到文本语音转换引擎，对节目文本进行语音转换，生成具有情感因素的音频节目并进行播出。

32、本发明提供的基于知识蒸馏的情感分类广播系统及其方法，具有以下有益效果：

33、本发明采用基于知识蒸馏的情感分类方法在边缘侧对节目文本进行情感分析，将分析得到的情感因子输入到文本语音转换引擎中进行音频节目转换，使得播出音频节目具备情感因素，更具有感染力。同时，由于传输的节目数据由音频变成了文本，大大降低了传输数据量，使得节目传输时间更短，系统应急播出能力更强。

34、本发明不仅使得广播系统具备带有情感色彩的节目播出效果，与此同时，本发明中云端下发的节目类型为文本类型，其经过压缩后的数据大小仅为几kb，现有广电播出系统传输的文件为音频文件，经过编码后其大小也在数百kb以上，两相比较，本发明节目传输数据量相比现有技术减少数百倍以上，其传输时间也将因此大大缩短；与现有广播系统相比，本发明将大大降低传输的数据量与传输时间，增强了广播系统的应急播出能力，同时整个文本情感推理在边缘侧智能终端上进行，大大降低了广播系统云端的计算压力。

35、本发明的核心思想是使用自适应的方式来确定蒸馏小模型时温度参数t的值，具体来说，当验证集上的性能没有得到改善时，可以增加温度参数的值，以扩大模型的搜索空间，从而有更大的可能性找到更好的模型。当验证集上的性能有所改善时，则将当前的温度参数t保存下来，并缩小温度参数t的值，以使模型更加聚焦于原始预训练模型的知识；通过反复迭代训练，并不断调整温度参数t的值，该算法可以自适应地确定最佳的温度参数值，从而提高学生模型的性能。

技术特征：

1.一种基于知识蒸馏的情感分类广播系统，其特征在于，包括：

2.一种采用权利要求1所述的基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，包括以下步骤：

3.根据权利要求2所述的基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，所述步骤s1包括：

4.根据权利要求3所述的基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，所述步骤s2中对情感分类bert预训练大模型进行知识蒸馏，训练得到边缘侧情感分类小模型，包括：

5.根据权利要求4所述的基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，所述步骤s2.2包括：

6.根据权利要求5所述的基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，所述步骤s2.3包括：

7.根据权利要求6所述的基于知识蒸馏的情感分类广播系统的广播方法，其特征在于，所述步骤s3包括：

技术总结
本发明公开了一种基于知识蒸馏的情感分类广播系统及其方法，包括节目播控服务子系统，用于将节目文本内容进行内容汇聚；AI服务子系统，用于将情感分类BERT预训练大模型进行知识蒸馏，训练得到边缘侧情感分类小模型；智能广播终端子系统，用于将分类所得的情感因子和节目文本传输到文本语音转换引擎，生成有情感因素的音频节目并进行播出。本发明不仅使得广播系统具备带有情感色彩的节目播出效果，而且由于传输的节目数据由音频变成了文本，大大降低了传输数据量，使得节目传输时间更短，系统应急播出能力更强。

技术研发人员：刘海章,王祥,张长娟,田才林,黄大池,朱静宁,赵开宇,杜限,黄河,靳晶晶,王佩,邹雪
受保护的技术使用者：四川省广播电视科学技术研究所
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘海章王祥张长娟田才林黄大池朱静宁赵开宇杜限黄河靳晶晶王佩邹雪
技术所有人：四川省广播电视科学技术研究所
我是此专利的发明人

上一篇：一种用于隐覆空区的钻孔巡检装置及方法与流程
上一篇：一种电子检测装置

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。