一种网络热点分析方法及系统与流程

文档序号:20165107发布日期:2020-03-24 21:24阅读:260来源:国知局
一种网络热点分析方法及系统与流程

本发明涉及大数据应用技术领域,尤其涉及一种网络热点分析方法及系统。



背景技术:

随着网络的兴起和网络技术的普及,互联网时代的来临,各种移动设备的出现,为人们的生活增添了更多便捷的入网形式,从最初的qq到现有的微信、微博、博客再到论坛,各类社交网络平台迅猛发展。人们生活日益简便,同时用户亦能方便地从社交网络平台获得所需信息,将自己的观点分享给大家,或者直接参加不同种类话题的研究分析,与其他用户进行沟通,人们对网络事件参与度越来越高。如朋友圈、微博的使用,其中微博信息的使用量达到上亿条,每类微博话题均有上百亿的阅读量,用户活跃量逐渐增加。

而随着数据量的快速增加,传统系统已无法满足网络热点分析要求。而如何在超大数据量面前快速准确地分析网络热点成为一个重要的话题。一方面,如何对大量数据进行有效存储及快速检索是该领域面临的一大挑战;另一方面,从海量数据里面如何快速获取及计算所需的网络热点特征,也是该领域关注的重点。



技术实现要素:

本发明实施例提供一种网络热点分析方法及系统,用以解决现有技术中用于分析网络热点的方法存在不稳定性,且存在输出的分析结果不准确的问题。

第一方面,本发明实施例提供一种网络热点分析方法,包括:

获取网络中的用户属性、网络属性和用户关联性数据;

对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;

将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;

基于所述用户关联性数据,计算得到关键网络行为影响力;

根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。

优选地,所述获取网络中的用户属性、网络属性和用户关联性数据,具体包括:

调用网络平台的api,采用网络爬虫算法采集所述用户属性、所述网络属性和所述用户关联性数据。

优选地,所述对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合,具体包括:

消除无关联的用户属性,结合关联的用户属性,计算用户自身的影响力,得到所述关键网络用户集合。

优选地,所述网络关键词分类模型,通过以下步骤获得:

获取网络话题数据,从所述网络话题数据中提取预定义文件,并基于预设条件从所述预定义文件中提取数据样本;

将所述数据样本进行归一化处理,得到所述网络信息样本集合;

获取关键词预设阈值,根据所述关键词预设阈值得到所述网络热点分类标签;

按照所述网络热点分类标签将所述网络信息样本集合进行分类,生成用于训练的若干个数据集;

获取改进的bp神经网络作为初始模型;

将所述若干个数据集输入所述初始模型进行训练,得到所述网络关键词分类模型。

优选地,所述基于所述用户关联性数据,计算得到关键网络行为影响力,具体包括:

分析用户之间存在的影响概率,以及用户好友之间的联合影响概率,得到所述关键网络行为影响力。

优选地,所述根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果,具体包括:

根据所述关键网络用户集合设置现有网络的社交网络有向图;

根据所述关键网络行为影响力构建现有的用户行为日志表;

基于所述社交网络有向图和所述用户行为日志表,计算所述高频网络关键词分类结果的传播趋势,得到所述网络热点分析结果。

优选地,该方法还包括:

将分析得到的网络热点放入热点资源池;

将分析得到的网络非热点经过预设时间段验证后,若满足网络热点条件,则将所述网络非热点放入所述热点资源池,否则,放入历史数据集。

第二方面,本发明实施例提供一种网络热点分析系统,包括:

获取模块,用于获取网络中的用户属性、网络属性和用户关联性数据;

预处理模块,用于对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;

分类模块,用于将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;

计算模块,用于基于所述用户关联性数据,计算得到关键网络行为影响力;

分析模块,用于根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。

第三方面,本发明实施例提供一种电子设备,包括:

存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述网络热点分析方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现任一项所述网络热点分析方法的步骤。

本发明实施例提供的网络热点分析方法及系统,通过采用改进神经网络算法的智能决策分析方法,实现了分析稳定性较强,达到了减少影响分析结果的目的,并且算法学习速度明显加快,准确性大大提高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种网络热点分析方法流程图;

图2为本发明实施例提供的智能决策分析示意图;

图3为本发明实施例提供的智能决策分析神经网络模型图;

图4为本发明实施例提供的用于微博热点的智能决策分析流程示意图;

图5为本发明实施例提供的网络热点业务验证流程示意图;

图6为本发明实施例提供的传统分析系统稳定性显示结果示意图;

图7为本发明实施例提供的网络热点业务验证示意图;

图8为本发明实施例提供的一种网络热点分析系统结构图:

图9为本发明实施例提供的电子设备的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提出了一种网络热点分析方法,是基于改进的bp神经网络算法的智能决策分析方法,针对传统智能决策分析系统一直存在分析结果不准确、系统稳定性差的问题,提出并设计了基于改进bp神经网络算法的智能决策分析系统,通过改进bp神经网络算法,对原有系统进行了优化,同时对网络信息传播趋势分析模块、网络热点判别模块进行了分析并设计。在后续的实验结果中表明,采用bp神经网络算法智能决策分析的方法对网络热点进行分析时,其稳定性相比传统系统要优越,在相同时间内,出现波动的次数降低了2~4次,具有一定的优势。

图1为本发明实施例提供的一种网络热点分析方法流程图,如图1所示,包括:

s1,获取网络中的用户属性、网络属性和用户关联性数据;

s2,对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;

s3,将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;

s4,基于所述用户关联性数据,计算得到关键网络行为影响力;

s5,根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。

具体地,步骤s1中,通过一系列的技术手段采集网络中的用户属性、用户对应的网络属性以及网络中用户关联性数据;

步骤s2中,对于步骤s1中获取的属性和数据,对其中的用户属性进行预处理,然后结合各种针对用户的影响因素集合,经过计算和筛选得到关键网络用户集合;

步骤s3中,进一步地,将用户属性和网络属性输入至预先训练好的网络关键词分类模型中,输出高频网络关键词分类结果,此处,网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;

步骤s4中,然后基于用户关联性数据,计算得到关键网络行为影响力;

步骤s5中,最后用得到的关键网络用户集合和关键网络行为影响力,对网络关键词分类模型输出的高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果,即预测该高频网络关键词对应的信息在未来一段时间是否会成为热点。

本发明实施例通过针对网络热点对应的一系列属性进行数据采集、关键属性提取和计算,并进行模型分类,得到较为准确的网络热点分析结果,具有分析过程稳定性较高,准确性大幅度增强的特点。

基于上述实施例,所述获取网络中的用户属性、网络属性和用户关联性数据,具体包括:

调用网络平台的api,采用网络爬虫算法采集所述用户属性、所述网络属性和所述用户关联性数据。

具体地,如图2所示,通过调用网络平台的api接口,例如新浪微博的api接口,获取相关话题,建立话题数据库,对于微博搜索,采用网络爬虫算法采集有关的微博用户属性、微博属性、用户之间关联性等数据,建立整体的话题相关数据库。

本发明实施例针对网络中不同的应用场景,尤其是时下与热点紧密相关的微博领域,采用不同的获取属性和数据的方法,提高了数据获取的效率。

基于上述任一实施例,所述对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合,具体包括:

消除无关联的用户属性,结合关联的用户属性,计算用户自身的影响力,得到所述关键网络用户集合。

具体地,在上述实施例的基础上,对于获取的关键用户,例如微博用户,可对微博用户进行预处理,消除无关联的用户属性,如消除僵尸粉用户对微博热点预测的干扰、以及广告用户对微博热点预测的影响,然后结合关联的用户属性,例如用户被关注度、微博转发数、微博评论数,计算用户微博自身的影响力,得到关键网络用户集合。

本发明实施例针对关键用户,进行了进一步地筛选和计算,去除无关影响因素,增加对紧密关联度的计算,提高了数据输入的准确性,便于后续进行热点预测。

基于上述任一实例,所述网络关键词分类模型,通过以下步骤获得:

获取网络话题数据,从所述网络话题数据中提取预定义文件,并基于预设条件从所述预定义文件中提取数据样本;

将所述数据样本进行归一化处理,得到所述网络信息样本集合;

获取关键词预设阈值,根据所述关键词预设阈值得到所述网络热点分类标签;

按照所述网络热点分类标签将所述网络信息样本集合进行分类,生成用于训练的若干个数据集;

获取改进的bp神经网络作为初始模型;

将所述若干个数据集输入所述初始模型进行训练,得到所述网络关键词分类模型。

具体地,本发明实施例中的网络关键词分类模型,是基于改进的bp神经网络模型训练得到的。

可以理解的是,bp神经网络是一种多层前馈模型,它利用误差逆传播算法进行误差校正的神经网络,即利用实际输出与期望输出之差对网络的各层连接权由后向前逐层进行校正的一种计算方法。通常,输入层的神经元不参与计算,只起到信号分配的作用。对于二层或二层以上的多层神经元网络,隐含层中左、右各层之间各个神经元实现全连接,当训练样本数据提供给网络后,其神经元的激活值将从输入层经各中间层向输出层传播,在输出层的各神经元输出对应于输入模式的网络响应。然后,当期望值与实际输出误差值较大时,模型从输出层经各中间层,最后回到输入层逐层修正各连接权。随着误差逆向传播训练的反复迭代,模型的正确率也不断的提高。

如图2所示,基于bp神经网络的智能决策分析流程具体为:提取网络中的话题数据,由于时间有限,其数据来源于模拟的主机日志,从预定义好的文件中读取所需要的数据进行学习,数据样本选取系统活动时间、登录次数,以及两次登录间的最大间隔,以秒(s)为单位。进一步地,从输入数据流中提取特征向量、并转化为神经网络的输入。将数据进行归一化处理后提交给神经网络,数据经过归一化处理后处于(0,1)之间,便于运算,本文所用的公式:xi=(xi-xmin)/(xmax-xmin),对样本数据进行训练学习,动量因子和学习效率的范围大都在(0,1)之间,通常阈值选择0.7,即关键词预设阈值,然后对所获得的数据向量进行分析处理,输出判断结果或者根据结果修改权值。

当系统进行数据分析聚类时,样本的期望输出值为0或1,但由于只有激活函数中的λ=±∞时才为0或l,这有可能将某些权值趋向无穷大。为了避免这种饱和现象,期望输出可适当放宽,如输出大于0.9时就看作1,当输出小于0.1时就认为是0,即每个样本的期望误差定义为ε=(0.1)2=0.01。

基于bp神经网络智能决策分析模型包括输入层、隐含层(中间层)和输出层,模型结构如图3所示:通过反复试验,本发明实施例将输入层设三个结点较为合适,每个结点代表一个数据项,分别表示活动时间段,活动时间内的登录次数,两次登录相隔的最大时间;而输出层设计一个结点,判断是否发现热点话题作为输出结果;隐含层单元数的选择没有具体的判定方法,通常选取三个结点比较理想。

准备好对应的数据集,将数据集分为训练数据集、验证数据集、测试数据集,输入初始模型进行训练,得到网络关键词分类模型。

本发明实施例通过采用改进的bp神经网络构建网络关键词分类模型,克服了传统bp神经网络入侵检测算法学习效率低,收敛速度慢的缺点,具有稳定性强,不易出现波动,算法学习速度能明显加快。

基于上述任一实施例,所述基于所述用户关联性数据,计算得到关键网络行为影响力,具体包括:

分析用户之间存在的影响概率,以及用户好友之间的联合影响概率,得到所述关键网络行为影响力。

具体地,基于网络热点数据的采集,该采集对象以微博用户属性、微博属性、微博用户关系三方面为主;然后经提取微博用户属性、微博属性进行挖掘分析,获取微博关键信息合集;同时采用关键词分类算法,将热点相关的微博信息从海量微博信息中分离出来,对微博信息进行中文分词,运用改进神经网络算法计算出某一段时间内高频微博信息;另一方面,计算各个关键用户行为影响力,确定影响力大小及范围;一句关键用户集合及关键用户行为影响力,对高频微博信息传播趋势进行分析,并进行判断,分析微博热点,进一步地,分析用户间存在的影响概率、好友之间联合影响概率,计算关键微博用户的行为影响力,整体流程如图4所示。

本发明实施例通过对关键用户行为的影响力进行分析和计算,通过关键影响力能较为客观、准确地实现对高频微博信息的热点做出判断。

基于上述任一实施例,所述根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果,具体包括:

根据所述关键网络用户集合设置现有网络的社交网络有向图;

根据所述关键网络行为影响力构建现有的用户行为日志表;

基于所述社交网络有向图和所述用户行为日志表,计算所述高频网络关键词分类结果的传播趋势,得到所述网络热点分析结果。

具体地,对网络信息传播趋势进行分析时,以基于高频网页关键词集合、关键用户集合、各关键用户行为影响力等为前提。若能够解析出网页信息传播的形式,那么就能获得网络信息扩散的详细状况。依据得到的高频率网页关键词,确定是否被大量用户所转发,并确定在以后的某段时期内是否变成网络热点信息。此外,经过解析用户行为传播方式,预测网络信息传播趋势非常接近,如此可知网络信息的传播趋势与预测系统之间的关联性。

在对网络信息传播趋势进行分析的基础上,设置已有网络社交网络有向图[g=v,e,t],[g]为网络社交网络,[v=vi]为用户节点的集合,[e=ei,j]为用户[vi]和用户[vj]间的关联性,[t=ti]为用户[vi]和用户[vj]间构建的关联时间节点。构建已有的用户行为日志表,此表把网络信息中每个用户的行为一一记录。如[action(user,action,time)]元组为[(u,a,t)],即用户u在时间t产生的行为a,a为所有行为全集,[au]表示用户u形成的行为总和,[auθv]表示用户u与v一起形成的行为数量,即:[auv=au+av+auθv],[auv]为用户v散播到用户u的行为总数。

本发明实施例通过高频网络关键词分类结果的传播趋势进行分析计算,采用了构建社交网络向量,将社交网络中各关键信息分别采用关键向量进行表示,并计算向量间的关联度和关联行为,准确地实现了传播趋势的预测,并得到较为精准的网络热点分析结果。

基于上述任一实施例,该方法还包括:

将分析得到的网络热点放入热点资源池;

将分析得到的网络非热点经过预设时间段验证后,若满足网络热点条件,则将所述网络非热点放入所述热点资源池,否则,放入历史数据集。

具体地,在得到网络热点分析结果的基础上,本发明实施例进一步地在分析微博信息发展趋势时,对用户和用户发布的微博分别进行建模处理,并采用离线的形式对每个用户自身存在的影响力指数、发布每条微博的影响力指数,进行计算。系统每隔一个月对用户数据更新一次,对用户影响力指数进行重新计算,然后结合发微博用户的影响力,经过热点微博筛选算法,计算出微博热度指数,判断此微博是否为微博热点,如果“是”,则进入微博热点池等待进一步确定,反之,若无法满足成为热点的条件,则继续跟踪这条微博;维持10天后,即预设时间段,查看其是否成为热点,如果“是”,则进入微博热点池,“不是”,则系统推进历史数据集,验证的整体工作流程图如图5所示。

将高频微博关键词集合中的词汇一一取出,判断其是否在关键用户发的微博内容中出现。若出现,则把关键用户储存到传播此高频词汇的关键用户集合中。此外,把此关键用户能影响的关注者添加到该关键用户集合内。反复此操作,直到遍历完全部关键用户为止,得到该高频词汇在未来一段时间内,传播范围及传播到的用户数量。

为了验证改进设计系统在分析网络热点方面的有效性及可行性,实验采用改进设计系统、传统分析系统为对比,以分析系统的稳定性为指标进行对比验证,实验结果如图6和图7所示。在运行时间不定的情况下,采用传统分析方法对网络热点进行分析时,由于网络热点的不定性,使得分析结果不稳定性很强。在分析时间为100~300s之间,出现了4次波动,且在之后的分析时间也出现了多次波动,稳定性差,对网络热点预测结果不准确。采用改进分析系统时,其分析结果虽然出现了不稳定的现象,但只有在100~200s,500~600s这2个时间段出现3次波动,稳定性较传统分析系统要好,具有一定的优势。

本发明实施例对算法的改进主要从三个方面进行:增加动量因子;增加学习效率自动修改;增加对阈值自动修改。通过仿真实验发现,未改进的算法对神经网络的权值和阈值进行了546次修改,增加动量因子和自动调整学习率优化后,对神经网络进行了40次修改,学习和修改权值和阈值的次数大幅下降,达到了原来的近1/14,因此,算法运算精度提高,学习速度提升,优化效果明显,同时优化项数越多的改进算法,准确率越高。

图8为本发明实施例提供的一种网络热点分析系统结构图,如图8所示,包括:获取模块81、预处理模块82、分类模块83、计算模块84和分析模块85;其中:

获取模块81用于获取网络中的用户属性、网络属性和用户关联性数据;预处理模块82用于对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;分类模块83用于将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;计算模块84用于基于所述用户关联性数据,计算得到关键网络行为影响力;分析模块85用于根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。

本发明实施例提供的系统用于执行上述对应的方法,其具体的实施方式与方法的实施方式一致,涉及的算法流程与对应的方法算法流程相同,此处不再赘述。

本发明实施例通过针对网络热点对应的一系列属性进行数据采集、关键属性提取和计算,并进行模型分类,得到较为准确的网络热点分析结果,具有分析过程稳定性较高,准确性大幅度增强的特点。

基于上述任一实施例,所述获取模块81具体用于调用网络平台的api,采用网络爬虫算法采集所述用户属性、所述网络属性和所述用户关联性数据。

本发明实施例针对网络中不同的应用场景,尤其是时下与热点紧密相关的微博领域,采用不同的获取属性和数据的方法,提高了数据获取的效率。

基于上述任一实施例,预处理模块82具体用于消除无关联的用户属性,结合关联的用户属性,计算用户自身的影响力,得到所述关键网络用户集合。

本发明实施例针对关键用户,进行了进一步地筛选和计算,去除无关影响因素,增加对紧密关联度的计算,提高了数据输入的准确性,便于后续进行热点预测。

基于上述任一实例,所述分类模块83中具体用于获取网络话题数据,从所述网络话题数据中提取预定义文件,并基于预设条件从所述预定义文件中提取数据样本;将所述数据样本进行归一化处理,得到所述网络信息样本集合;获取关键词预设阈值,根据所述关键词预设阈值得到所述网络热点分类标签;按照所述网络热点分类标签将所述网络信息样本集合进行分类,生成用于训练的若干个数据集;获取改进的bp神经网络作为初始模型;将所述若干个数据集输入所述初始模型进行训练,得到所述网络关键词分类模型。

本发明实施例通过采用改进的bp神经网络构建网络关键词分类模型,克服了传统bp神经网络入侵检测算法学习效率低,收敛速度慢的缺点,具有稳定性强,不易出现波动,算法学习速度能明显加快。

基于上述任一实施例,所述计算模块84具体用于分析用户之间存在的影响概率,以及用户好友之间的联合影响概率,得到所述关键网络行为影响力。

本发明实施例通过对关键用户行为的影响力进行分析和计算,通过关键影响力能较为客观、准确地实现对高频微博信息的热点做出判断。

基于上述任一实施例,所述分析模块85具体用于根据所述关键网络用户集合设置现有网络的社交网络有向图;根据所述关键网络行为影响力构建现有的用户行为日志表;基于所述社交网络有向图和所述用户行为日志表,计算所述高频网络关键词分类结果的传播趋势,得到所述网络热点分析结果。

本发明实施例通过高频网络关键词分类结果的传播趋势进行分析计算,采用了构建社交网络向量,将社交网络中各关键信息分别采用关键向量进行表示,并计算向量间的关联度和关联行为,准确地实现了传播趋势的预测,并得到较为精准的网络热点分析结果。

基于上述任一实施例,该系统还包括验证模块86,所述验证模块86用于将分析得到的网络热点放入热点资源池;将分析得到的网络非热点经过预设时间段验证后,若满足网络热点条件,则将所述网络非热点放入所述热点资源池,否则,放入历史数据集。

本发明实施例对算法的改进主要从三个方面进行:增加动量因子;增加学习效率自动修改;增加对阈值自动修改。通过仿真实验发现,未改进的算法对神经网络的权值和阈值进行了546次修改,增加动量因子和自动调整学习率优化后,对神经网络进行了40次修改,学习和修改权值和阈值的次数大幅下降,达到了原来的近1/14,因此,算法运算精度提高,学习速度提升,优化效果明显,同时优化项数越多的改进算法,准确率越高。

图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(communicationsinterface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行如下方法:获取网络中的用户属性、网络属性和用户关联性数据;对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;基于所述用户关联性数据,计算得到关键网络行为影响力;根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。

此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:获取网络中的用户属性、网络属性和用户关联性数据;对所述用户属性进行预处理,结合用户影响因素集合,得到关键网络用户集合;将所述用户属性和所述网络属性输入至预先训练好的网络关键词分类模型中,得到所述网络关键词分类模型输出的高频网络关键词分类结果;其中所述网络关键词分类模型是基于网络信息样本集合,以及按照网络热点分类标签训练得到的;基于所述用户关联性数据,计算得到关键网络行为影响力;根据所述关键网络用户集合和所述关键网络行为影响力,对所述高频网络关键词分类结果的传播趋势进行分析,得到网络热点分析结果。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1