一种预测社交媒体内容的热度等级的方法和装置与流程

文档序号:26142308发布日期:2021-08-03 14:27阅读:来源:国知局

技术特征:

1.一种预测社交媒体内容的热度等级的方法,其特征在于,包括:

获取待预测的社交媒体内容;

对所述待预测的社交媒体内容进行预处理,获得预处理信息;

对所述预处理信息进行特征提取,获得特征数据;

利用预先训练好的热度预测模型对所述特征数据进行热度等级的预测,以获得所述待预测的社交媒体内容的热度等级;其中,所述热度预测模型包括分类层。

2.根据权利要求1所述的方法,其特征在于,所述热度预测模型具体包括依次连接的第一全连接层、线性融合层、第一基本单元、第二基本单元、第二全连接层和所述分类层;

其中,所述第一基本单元包括依次连接的第三全连接层、第一归一化层和第一激活层,所述第二基本单元包括依次连接的第四全连接层、第二归一化层和第二激活层。

3.根据权利要求1所述的方法,其特征在于,所述特征数据包括文本特征数据;

其中,所述对所述预处理信息进行特征提取,获得特征数据,包括:

利用预先训练好的文本特征提取模型对所述预处理信息中的文字部分进行文本特征提取,以获得所述文本特征数据。

4.根据权利要求1或者3所述的方法,其特征在于,所述特征数据包括数值特征数据;

其中,所述对所述预处理信息进行特征提取,获得特征数据,包括:

采用标准分数算法标准化所述预处理信息中的数值部分,以获得所述数值特征数据。

5.根据权利要求1所述的方法,其特征在于,在所述利用预先训练好的热度预测模型对所述特征数据进行热度等级的预测之前,所述方法还包括:

获取初始热度预测模型的损失函数,其中,所述损失函数包括交叉损失函数和均方误差损失函数;

利用所述损失函数对所述初始热度预测模型进行调整,以获得所述预先训练好的热度预测模型。

6.根据权利要求5所述的方法,其特征在于,所述损失函数为:

l=la+lb;

其中,l为损失函数值,la为交叉损失函数值,lb为均方误差损失函数值,n为所述初始热度预测模型的输入样本的数量,m为所划分的热度等级的数量,yij表示热度等级j是否是所述初始热度预测模型的输入xi的真实热度等级,pij表示所述初始热度预测模型的输入xi属于所述热度等级j的概率,表示从当前样本向前采样第τ条样本对应的热度等级,m为预设条数。

7.根据权利要求1所述的方法,其特征在于,所述预处理信息包括以下信息中的至少一种信息:用户信息、内容信息和话题指标信息。

8.一种预测社交媒体内容的热度等级的装置,其特征在于,包括:

获取模块,用于获取待预测的社交媒体内容;

预处理模块,用于对所述待预测的社交媒体内容进行预处理,获得预处理信息;

特征提取模块,用于对所述预处理信息进行特征提取,获得特征数据;

预测模块,用于利用预先训练好的热度预测模型对所述特征数据进行热度等级的预测,以获得所述待预测的社交媒体内容的热度等级;其中,所述热度预测模型包括分类层。

9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7任一所述的预测社交媒体内容的热度等级的方法。

10.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1-7任一所述的预测社交媒体内容的热度等级的方法。


技术总结
本申请实施例提供一种预测社交媒体内容的热度等级的方法和装置,该方法包括:获取待预测的社交媒体内容;对待预测的社交媒体内容进行预处理,获得预处理信息;对预处理信息进行特征提取,获得特征数据;利用预先训练好的热度预测模型对特征数据进行热度等级的预测,以获得待预测的社交媒体内容的热度等级;其中,热度预测模型包括分类层。借助于上述技术方案,本申请实施例可提高热度等级预测的准确度。

技术研发人员:赵学;张宁;黄福玉;郝新厂
受保护的技术使用者:中库(北京)数据系统有限公司
技术研发日:2021.05.27
技术公布日:2021.08.03
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1