一种信息热度预测方法、信息推荐方法及装置与流程

文档序号:13915587阅读:159来源:国知局

本发明涉及数据处理技术领域,特别涉及一种信息热度预测方法、信息推荐方法及装置。



背景技术:

热门文章预测系统是根据文章发表的各维度特征去预测文章在未来一段时间的流行程度。例如根据文章在发表后的1个小时内的阅读序列特征去预测文章在未来24小时的转发是否会超过一定阈值,对与超过阈值的文章进行后续应用,例如推荐、控制、识别等。

现有技术方案的流程如图1所示,包括(1)收集日志数据,利用收集的数据进行人工特征提取,其中,数据维度可以包括文章历史阅读转发信息、发表公众号的基本信息、转发人数的基础属性等,人工特征提取包含大量的特征工程的工作;(2)利用传统模型预测,即使用上一个步骤产生的训练样本对svm、lr、gbdt等传统机器学习模型进行训练;(3)将模型的预测结果进行输出,对预测结果进行下一步的处理或应用。

在实现上述预测的过程中,发明人发现现有技术至少存在以下问题:现有趋势类预测系统在构建上,大多使用单个模型对样本进行预测,在样本训练过程中没有考虑一个样本在不同时间点的可预测情况。并且对不同时间状态下的同一样本在训练过程没有多次进入训练过程,导致系统不能捕捉到样本在时间上的变化情况。此外,现有预测系统大多根据历史记录去预测,缺少对实时的全局环境的热门主题或事件进行识别,对于实时的热点事件的预测结果往往误差很大。



技术实现要素:

为克服现有技术的缺陷,本发明提供一种信息热度预测方法、信息推荐方法及装置。

本发明采用技术方案如下:

第一方面,本发明提供一种信息热度预测方法,包括:

采集一已发表信息的日志数据;

根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

第二方面,本发明提供一种信息推荐方法,该方法包括:

采集一已发表信息的日志数据;

根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

根据各个预测结果的权重计算得到所述已发表信息的热度预测结果;

按照所述已发表信息的热度预测结果对所述已发表信息进行推荐。

第三方面,本发明提供一种信息热度预测装置,包括:

采集模块,用于采集一已发表信息的日志数据;

提取模块,用于根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

预测模块,用于根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

计算模块,用于根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

第四方面,本发明提供一种信息推荐装置,包括:

采集模块,用于采集一已发表信息的日志数据;

提取模块,用于根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

预测模块,用于根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

计算模块,用于根据各个预测结果的权重计算得到所述已发表信息的热度预测结果;

第一推荐模块,用于按照所述已发表信息的热度预测结果对所述已发表信息进行推荐。

本发明的有益效果是:

本发明预先建立对应不同时段的预测模型,通过实时监测待预测已发表信息的发表时长,一旦发表时长满足任一预设的发表时段,则将已发表信息在该发表时段内的特征数据输入对应的预测模型中,得到与该发表时段对应的一预测结果,由此,在待预测信息发表一段时间后,能够得到对应不同发表时段的多个预测模型输出的多个预测结果,通过获取各个预测结果的权重,计算加权平均值可以得到该已发表信息的热度预测结果。本发明考虑已发表信息在不同时段的趋势变化,采用对应不同时长的预测模型来拟合不同时间状态下信息的特征数据,并考虑发表时长对预测结果的影响,获取不同发表时段对应的预测结果的权重,综合预测信息在未来一段时间的热度,提高了信息热度预测的准确度。

附图说明

为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。

图1是现有的热门文章预测方法的流程示意图;

图2是根据本发明实施例的信息热度预测方法的计算机终端的硬件结构框图;

图3是根据本发明实施例提供的的一种信息热度预测方法的流程图;

图4是根据各预测结果的权重计算已发表信息的热度预测结果的方法流程图;

图5是根据本发明实施例提供的的另一种信息热度预测方法的流程图;

图6是对已发表信息的热度预测结果进行修正的方法流程图;

图7是本发明实施例提供的的一种信息推荐方法的流程图;

图8是本发明实施例提供的另一种信息推荐方法的流程图;

图9是本发明实施例提供的一种信息热度预测装置的示意图;

图10是图9中计算模块的结构示意图;

图11是本发明实施例提供的另一种信息热度预测装置的示意图;

图12是本发明实施例提供的另一种信息热度预测装置的示意图;

图13是图12中修正模块的结构示意图;

图14是本发明实施例提供的一种信息推荐装置的示意图;

图15是本发明实施例提供的另一种信息推荐装置的示意图;

图16是本发明实施例提供的另一种信息推荐装置的示意图;

图17是本发明实施例提供的另一种信息推荐装置的示意图;

图18是本发明实施例的计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

根据本发明实施例,提供了一种信息热度预测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图2是根据本发明实施例的信息热度预测方法的计算机终端的硬件结构框图。如图2所示,计算机终端100可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图2所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的短文本分类方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的信息热度预测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端100的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。

在上述运行环境下,本申请提供了如图3所示的信息热度预测方法。该方法可以应用于智能终端设备中,由智能终端设备中的处理器执行,智能终端设备可以是智能手机、平板电脑等。智能终端设备中安装有至少一个应用程序,本发明实施例并不限定应用程序的种类,可以为系统类应用程序,也可以为软件类应用程序。

图3是根据本发明实施例的信息热度预测方法的流程图。如图3所示,该信息热度预测方法的一种可选的方案包括如下步骤:

s310、采集一已发表信息的日志数据。

其中,已发表信息是通过互联网发布并可查看到的信息,例如可以是已发表的微博信息、微信公众号文章等等。已发表信息的日志数据可以包括:信息发表时间、发表信息的用户的账号信息、发表信息的用户的用户画像、信息阅读时间、阅读信息的用户的账号信息、阅读信息的用户的用户画像、信息转发时间、转发信息的用户的账号信息、转发信息的用户的用户画像;其中,用户画像包括用户的年龄、性别、阅读喜好、关注主题等等。信息的热度一般可以根据信息在一段时间内被阅读和/或转发的多少来衡量,预测信息的热度可以是预测信息在未来一段时间内被阅读和/或转发的数量。可以通过对已经获取到的信息的阅读和转发情况来预测该信息在未来一段时间的热度。

s320、根据所述日志数据提取所述已发表信息在多个发表时段的特征数据。

日志数据是采集的原始数据,其包含一些热度预测不需要的信息,通过对日志数据进行提取归类,可以得到可直接输入预测模型的特征数据。特征数据可以包括:人群特征、信息特征、账号特征,其中,人群特征可以包括阅读或转发所述信息的用户的性别、年龄、阅读喜好,信息特征可以包括所述信息的内容、字数,所述账号特征包括阅读或转发所述信息的用户的账号创建时间、粉丝数量。对于微信公众号,若公众号a的粉丝数量为300,公众号b的粉丝数量为5000,公众号a和公众号b同时发表一文章,由于公众号b的粉丝数量更大,则文章被公众号b的粉丝转发的可能性也更大,粉丝数量的多少对文章的传播广度有较大影响。

可选地,可以通过实时监测已发表信息的发表时段来对对应的特征数据进行整理归类,发表时段是指信息发表后的某个时刻与该信息首次发表时刻之间的差值(即时长),例如一篇文章在微信公众号的首次发表时间为9:00,到当日10:00时,该文章的发表时段为发表后1小时,到当日11:00时,该文章的发表时段为发表后2小时。根据所述日志数据提取所述已发表信息在多个发表时段的特征数据,可以先根据发表时段对日志数据进行划分,然后对各发表时段的日志数据进行特征数据提取;也可以根据日志数据提取特征数据,保留特征数据对应的时间,在已发表信息达到对应的时段时,将对应该时段的特征数据抓取出来。

s330、根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果。

在执行本步骤之前,需要建立发表时段与预测模型的对应关系,具体地,可以获取与各发表时段对应的预测模型,根据各发表时段对应的预测模型,来建立发表时段与预测模型的对应关系。其中,预测模型可以通过以下方法训练得到:

(1)按照发表时段对原始训练集进行划分,得到多个对应不同发表时段的训练集,每个训练集包括样本信息在对应发表时段内的特征数据和与所述特征数据对应的热度数据,

(2)将对应同一发表时段的所有训练集输入到预先建立的神经网络结构中进行多次迭代,计算根据特征数据得到各个热度数据的概率,使迭代之后得到的根据特征数据得到对应的热度数据的概率最大,得到与该发表时段对应的预测模型。

本发明中,预测模型均采用深度神经网络构建,使用tensorflow实现包括lstm(long-shorttermmemory,时间递归神经网络)、cnn(convolutionalneuralnetwork,卷积神经网络)、drn(diagonalrecurrentneuralnetworks,对角递归神经网络)、drl(deepresiduallearning)等一系列模型,这些模型与传统的lr(logisticregression)、svm(supportvectormachine)、gbdt(gradientboostdecisiontree)、rf(randomforests)等模型相比,无需在特征选择、特征构造上有大量的人工参与,而是由多层的网络逐层去学习不同层次的特征,因此在大规模信息预测的问题上比传统浅层模型有更好的效果。

在获得预测模型与发表时段的对应关系后,持续监测已发表信息的发表时长是否达到预测模型对应的发表时段,一旦达到预测模型对应的某一发表时段,则将信息在该发表时段内对应的特征数据输入至与该发表时段对应的预测模型中,得到与该发表时段对应的一个预测结果,继续监测信息的发表时长并执行上述步骤,在信息发表一段时间后,能够得到与多个不同发表时段一一对应的多个预测模型输出的多个预测结果。本发明采用多时间逐级预测方式来得到预测结果,在预测过程中某些特征数据会在不同发表时段进行多次预测。例如,一篇公众号文章在发表后1小时的特征数据会进入对应的1小时预测模型,在发表后2小时的特征数据会进入对应的2小时预测模型,以此类推,完成多时间逐级预测,其中,发表后1小时的特征数据不仅进入1小时预测模型,也将进入2小时预测模型,这样将特征数据多次输入不同的预测模型训练,可以捕捉到特征数据在时间上的变化情况,反映已发表信息的热度发展趋势。

s340、根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

信息的发表越久,则可以用来预测的数据量越多,其预测结果也更准确,因此,可以根据预测结果对应的时长为每个预测结果分配权重,其中,预测结果的权重与时长成正比。例如,对于1小时对应的预测结果q1、2小时对应的预测结果q2,3小时对应的预测结果q3和4小时对应的预测结果q4,可以为q4分配权重为2,为q3分配权重为1.5,为q2分配权重为0.8,为q1分配权重为0.5。

当然,预测结果的权重可以手动分配,也可以定制,还可以由程序动态调整,本发明对预测结果的权重分配方式不作限定。

参见图4,所述根据各个预测结果的权重计算得到所述已发表信息的热度预测结果包括:

s341、获取各个预测结果的权重;

s342、在获取到多个预测结果中每个预测结果的权重后,计算多个预测结果的加权平均值,将加权平均值作为已发表信息的热度预测结果。

本发明考虑已发表信息在不同发表时段的趋势变化,采用对应不同发表时段的预测模型来拟合不同时间状态下信息的特征数据,并考虑发表时长对预测结果的影响,为不同时段下的预测结果分配权重,综合预测信息在未来一段时间的热度,提高了热度预测的准确度。

实施例二

图5是根据本发明实施例的信息热度预测方法的流程图。如图5所示,该信息热度预测方法的另一种可选的方案包括如下步骤:

s510、采集一已发表信息的日志数据。

s520、根据所述日志数据提取所述已发表信息在多个发表时段的特征数据。

s530、根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果。

s540、根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

s550、将所述已发表信息的主题与热门主题进行比对,根据比对结果对所述已发表信息的热度预测结果进行修正。

其中,步骤s510-s540与前述实施例一的s310-s340相同,详见s310-s340,在此不再赘述。与前述方案不同的是,本方案进一步对热度预测结果进行修正。针对现有趋势类预测系统或方法在实时热门事件和主题识别上的缺失,提出通过实时监控全局环境中信息的主题热度,找到热门主题,并根据待预测信息包含的主题与热门主题的匹配度来对热度预测结果进行修正;修正方法为:在匹配度不低于预设值时,对热度预测结果进行正向修正,在匹配度低于预设值时,对热度预测结果进行负向修正,其中,正向修正是指在已发表信息的热度预测结果基础上提高预测预期,负向修正是指在已发表信息的热度预测结果基础上降低预测预期。

在对已发表信息的主题与热门主题进行比对前,可以通过对已发表信息的标题和内容使用lightlda算法提取主题,同时分析当前时刻全局信息(即应用平台的所有信息)的阅读以及转发情况,汇总得到全局的热点事件和主题情况,将全局的热点事件和主题情况采用图标或数值等形式展示在展示界面上,从整体上呈现社交网络上的热点话题及其演化情况;并且,由展示界面实时输出截至当前时间点的排名靠前的n个(n为大于等于1的整数)主题内容及其变化情况,排名靠前的n个主题即可作为当前热门主题。

在获取到信息的主题和热门主题之后,由于已发表信息可能有多个主题,可以将已发表信息的主题和热门主题进行向量化处理,计算已发表信息的每个主题在热门主题上的分布概率,然后计算已发表信息的所有主题在热门主题上的分布概率的平均值,将得到的平均值作为已发表信息的主题与热门主题的匹配度。进一步将匹配度与预先设定的预设值进行比对,根据比对结果对已发表信息的热度预测结果进行修正。

例如设预设值为0.8,文章的热度预测结果为在未来24小时转发量为15000。当前发表文章主题分布的主要类型为{“欧洲杯”、“足球”、“法国”},当前全局主题热度的top3也同时为{“欧洲杯”、“足球”、“法国”},文章主题与热门主题匹配度为(1,1,1),该匹配度大于预设值,那么需要对原本在未来24小时的转发量预测进行正向修正,即提高一定的预期。

可选地,在对所述信息的热度预测结果进行修正后,还包括输出修正后的热度预测结果。具体地,可以将热度预测结果显示在显示界面上。

本发明这种结合全局主题热度来修正预测结果的方法,可以进一步提高信息热度预测的准确性,尤其对热门文章转发量的预测以及爆发事件的预测有良好的效果。

通过对信息热度的准确预测能够有效控制信息的传播。其中,精准预测信息转发趋势对于信息控制有至关重要的作用,例如微信朋友圈爆发的谣言,使用上述预测方法,可以快速地过滤大量关注度低的文章,把热门文章筛选出来,把谣言识别的候选集合缩小到合理范围。又例如,在朋友圈文章推荐使用场景中,使用预测热文的推荐加上原有兴趣标签的方法可以有效提高用户点击率和交互率。

实施例三

图7是根据本发明实施例的信息推荐方法的流程图。如图7所示,该信息推荐方法的一种可选的方案包括如下步骤:

s710、采集一已发表信息的日志数据;

s720、根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

s730、根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

s740、根据各个预测结果的权重计算得到所述已发表信息的热度预测结果;

s750、按照所述已发表信息的热度预测结果对所述已发表信息进行推荐。

其中,步骤s710-s740与实施例一的s310-s340相同,详见s310-s340,在此不再赘述。

在经预测模型预测并对根据预测结果的权重进行计算处理,得到已发表信息的热度预测结果之后,可以按照热度预测结果在应用平台中进行信息推荐。具体的,对应用平台中所有已发表信息使用s710-s740的方法进行预测,可以得到每条信息在所述应用平台中未来一段时间的阅读或转发量,从中可以提取未来阅读或转发量最大的若干条信息,以对这些信息进行推荐,例如,在微信公众号平台中通过推荐页面对这些信息进行显示,也可以结合用户的兴趣标签,向可能感兴趣的用户所在的终端推送这些消息。

本发明通过获取信息在未来一段时间的热度预测结果来对信息进行准确推荐,提高了推荐准确性的同时,也可以为终端查看信息提供便利,提升用户体验。

可选地,在对已发表信息进行推荐时,还可以在所述已发表信息中推荐其他信息,例如广告。

实施例四

图8是根据本发明实施例的信息推荐方法的流程图。如图8所示,该信息推荐方法的一种可选的方案包括如下步骤:

s810、采集一已发表信息的日志数据;

s820、根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

s830、根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

s840、根据各个预测结果的权重计算得到所述已发表信息的热度预测结果;

s850、将所述已发表信息的主题与热门主题进行比对,根据比对结果对所述已发表信息的热度预测结果进行修正;

s860、按照修正后的已发表信息的热度预测结果对所述已发表信息进行推荐。

其中,步骤s810-s850与实施例二的s510-s550相同,详见s510-s550,在此不再赘述。

通过结合全局主题热度修正预测结果,进一步提高了信息热度预测的准确性,也提提高了信息推荐的准确性。还可以将预测热度较高的信息与用户喜好进行结合,进行针对性的推荐,以提高信息点击率和交互率。进一步地,在对已发表信息进行推荐时,还可以在所述已发表信息中推荐其他信息,例如广告,以提高随同已发表信息推荐的其他信息的点击率。

实施例五

根据本发明实施例,还提供了一种实施上述信息热度预测方法的装置。图9所示的信息热度预测装置,可用于实施实施例一所述的信息热度预测方法。如图9所示,该装置包括:采集模块910、提取模块920、预测模块930和计算模块940。

采集模块910,用于采集一已发表信息的日志数据;

提取模块920,用于根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

预测模块930,用于根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

计算模块940,用于根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

该信息热度预测装置中,采集模块910可用于执行本发明实施例一中的步骤s310,提取模块920可用于执行本发明实施例一中的步骤s320,预测模块930可用于执行本发明实施例一中的步骤s330,计算模块940可用于执行本发明实施例一中的步骤s340。

可选地,参见图10,所述计算模块940包括第一获取单元941和计算单元942,其中,

第一获取单元941,用于获取各个预测结果的权重,其中,预测结果的权重与该预测结果对应的发表时段的时长成正比;

计算单元942,用于计算所述多个预测结果的加权平均值,将所述加权平均值作为所述已发表信息的热度预测结果。

参见图11,该信息热度预测装置还包括获取模块950和建立模块960,其中,

获取模块950,用于获取与各发表时段对应的预测模型;

建立模块960,用于根据各发表时段对应的预测模型,建立发表时段与预测模型的对应关系。

实施例六

参见图12,图12所示的信息热度预测装置,可用于实施实施例二所述的信息热度预测方法。如12所示,该装置包括:采集模块910、提取模块920、预测模块930、计算模块940和修正模块1210。

采集模块910,用于采集一已发表信息的日志数据;

提取模块920,用于根据所述日志数据提取所述已发表信息在多个发表时段的特征数据;

预测模块930,用于根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果;

计算模块940,用于根据各个预测结果的权重计算得到所述已发表信息的热度预测结果;

修正模块1210,用于将所述已发表信息的主题与热门主题进行比对,根据比对结果对所述已发表信息的热度预测结果进行修正。

该信息热度预测装置中,采集模块910可用于执行本发明实施例二中的步骤s510,提取模块920可用于执行本发明实施例二中的步骤s520,预测模块930可用于执行本发明实施例二中的步骤s530,计算模块940可用于执行本发明实施例二中的步骤s540,修正模块1210可用于执行本发明实施例二中的步骤s550。

可选地,参见图13,所述修正模块,1210包括提取单元1211、第二获取单元1212、匹配单元1213和修正单元1214。

提取单元1211,用于提取所述已发表信息的主题。

第二获取单元1212,用于获取热门主题,所述热门主题包括热度排名靠前的多个主题。

匹配单元1213,用于计算所述已发表信息的主题与热门主题的匹配度。

修正单元1214,用于当计算单元计算得到的匹配度不低于预设值时,在所述已发表信息的热度预测结果基础上提高预测预期,当计算单元计算得到的匹配度低于预设值时,在所述已发表信息的热度预测结果基础上降低预测预期。

可选地,所述计算模块940包括第一获取单元941和计算单元942,其中,

第一获取单元941,用于获取各个预测结果的权重,其中,预测结果的权重与该预测结果对应的发表时段的时长成正比;

计算单元942,用于计算所述多个预测结果的加权平均值,将所述加权平均值作为所述已发表信息的热度预测结果。

可选地,该信息热度预测装置还包括获取模块950和建立模块960,其中,

获取模块950,用于获取与各发表时段对应的预测模型;

建立模块960,用于根据各发表时段对应的预测模型,建立发表时段与预测模型的对应关系。

本发明提供的信息热度预测装置可以精准预测信息的转发趋势,进而可以根据预测结果对信息传播进行有效控制。例如对于朋友圈爆发的谣言,使用上述预测装置,可以快速把热门文章筛选出来过滤大量关注度低的文章,把谣言识别的候选集合缩小到合理范围。又例如,在朋友圈文章推荐使用场景中,使用预测热文的推荐加上原有兴趣标签的方法可以有效提高用户点击率和交互率。

实施例七

图14是本发明实施例提供的一种信息推荐装置的示意图,可用于实施实施例三所述的信息推荐方法。如14所示,该装置包括:采集模块910、提取模块920、预测模块930、计算模块940和第一推荐模块1410。

采集模块910,用于采集一已发表信息的日志数据。

提取模块920,用于根据所述日志数据提取所述已发表信息在多个发表时段的特征数据。

预测模块930,用于根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果。

计算模块940,用于根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

第一推荐模块1410,用于按照所述已发表信息的热度预测结果对所述已发表信息进行推荐。

可选地,参见图15,该信息推荐装置还包括第二推荐模块1510。

第二推荐模块1510,用于在所述已发表信息中推荐其他信息。

实施例八

图16是本发明实施例提供的另一种信息推荐装置的示意图,可用于实施实施例四所述的信息推荐方法。如16所示,该装置包括:采集模块910、提取模块920、预测模块930、计算模块940、修正模块1210和第一推荐模块1610。

采集模块910,用于采集一已发表信息的日志数据。

提取模块920,用于根据所述日志数据提取所述已发表信息在多个发表时段的特征数据。

预测模块930,用于根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果。

计算模块940,用于根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

修正模块1210,用于将所述已发表信息的主题与热门主题进行比对,根据比对结果对所述已发表信息的热度预测结果进行修正。

第一推荐模块1610,用于按照所述已发表信息的热度预测结果对所述已发表信息进行推荐。

可选地,参见图17,该信息推荐装置还包括第二推荐模块1710。

第二推荐模块1710,用于在所述已发表信息中推荐其他信息。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以包括但不限于:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

实施例九

本发明的实施例还提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。

可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地,图18是根据本发明实施例的计算机终端的结构框图。如图18所示,该计算机终端a可以包括:一个或多个(图中仅示出一个)处理器161、存储器163、以及传输装置165。

其中,存储器163可用于存储软件程序以及模块,如本发明实施例中的短文本分类的方法和装置对应的程序指令/模块,处理器161通过运行存储在存储器163内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的短文本分类。存储器163可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器163可进一步包括相对于处理器161远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端a。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置165用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置165包括一个网络适配器,其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置165为射频模块,其用于通过无线方式与互联网进行通讯。

其中,具体地,存储器163用于存储预设动作条件和预设权限用户的信息、以及应用程序。

处理器161可以通过传输装置调用存储器163存储的信息及应用程序,以执行下述步骤:

第一步:采集一已发表信息的日志数据。

第二步:根据所述日志数据提取所述已发表信息在多个发表时段的特征数据。

第三步:根据预先建立的发表时段与预测模型的对应关系,将所述已发表信息在多个发表时段内的特征数据分别输入至对应的预测模型中,得到与所述多个发表时段一一对应的多个预测结果。

第四步:根据各个预测结果的权重计算得到所述已发表信息的热度预测结果。

可选的,上述处理器161还可以执行如下步骤的程序代码:

按照所述已发表信息的热度预测结果对所述已发表信息进行推荐。

可选地,本实施例中的具体示例可以参考上述实施例一到实施例四中所描述的示例,本实施例在此不再赘述。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1