1.一种互联网舆情事件传播指数的获取方法,其特征在于:所述获取方法包括如下步骤:步骤1、输入舆情事件;
步骤2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;
步骤3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;
步骤4、通过文章传播指数提取舆情事件传播轨迹关键信息;
步骤5、通过舆情事件传播轨迹关键信息构建最终模型。
2.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述媒体源包括:新闻、博客、论坛、贴吧、微博、微信、电子报、或者主流新闻APP。
3.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述步骤3中对每一篇文章进行单文章传播指数计算,具体为:
针对不同的媒体源,结合当前媒体源的流行趋势,采取不同的媒体源指数;
不同的媒体源根据不同的传播学要素采用不同的量化方式:
新闻、论坛、贴吧类型计算模型为:
NPI=[30%×r1+70%×c]×m1×g1
其中NPI为单篇文章传播指数:
r1为文章阅读数
c为评论数
m1为媒体源指数,新闻m1取值2,贴吧m1取值1.5,论坛取值1
g1为在同类媒体源下排名权重
博客类型计算模型为:
BPI=[10%×r1+40%c1+50%×r2]×m1×g1
其中BPI为单篇文章传播指数:
r1为文章阅读数
c为评论数
r2为转发数
m1为媒体源指数,博客m1取值1
g1为在同类媒体源下排名权重
微博类计算模型为:
WPI=[10%×r1+40%×c+40%×r2+10%×(40%×c2+60%×r3)]×m1×g1
其中WPI为单篇文章传播指数:
r1为文章阅读数
c为评论数
r2为转发数
c2为转发微博中评论总数
r3为转发微博中转发总数
m1为媒体源指数,微博的m1为3.5
g1为在同类媒体源下排名权重
微信类计算模型为:
WPI=[20%×r+70%×a+10%ln(f+1)]×m1×r1
其中WPI为单篇文章传播指数:
r1为文章阅读数
a为点赞数
f为等价粉丝数
m1为媒体源指数,微信的m1为3
g1为在同类媒体源下排名权重。
4.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述步骤4具体为:取得整个事件中单篇指数最高的文章,此为舆情事件传播指数峰值,记为Smax,该舆情事件,记为Tmiddle;
获得事件的有效传播时间T,定义事件传播衰弱指数为1/10;取发生时间小于Tmiddle,且得分小于Smax/10的最小时间作为事件有效开始传播时间Tstart;同理,取发生时间大于Tmiddle,且得分大于Smax/10的最大时间作为事件有效结束传播时间Tend;得到舆情事件有效传播时间:T=Tend–Tstart,在T时间内的舆情文章总数量记为C。
5.根据权利要求4所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述最终模型为
其中:EPI为事件最终的传播指数;
SMi为舆情事件中单个媒体源单篇最高得分;
Mc为该事件有效传播时间内传播轨迹所跨越的媒体源数量;
T为该事件传播的有效时间;
C为该事件有效时间内的舆情文章总数量;
Si为第i篇文章单篇传播指数得分。
6.一种互联网舆情事件传播指数的获取系统,其特征在于:所述获取系统包括输入模块、采集模块、分析模块、提取模块、以及构建模型模块;
所述输入模块,用于输入舆情事件;
所述采集模块,采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;
所述分析模块,对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;
所述提取模块,通过文章传播指数提取舆情事件传播轨迹关键信息;
所述构建模型模块通过舆情事件传播轨迹关键信息构建最终模型。
7.根据权利要求6所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述媒体源包括:新闻、博客、论坛、贴吧、微博、微信、电子报、或者主流新闻APP。
8.根据权利要求6所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述分析模块中对每一篇文章进行单文章传播指数计算,具体为:
针对不同的媒体源,结合当前媒体源的流行趋势,采取不同的媒体源指数;
不同的媒体源根据不同的传播学要素采用不同的量化方式:
新闻、论坛、贴吧类型计算模型为:
NPI=[30%×r1+70%×c]×m1×g1
其中NPI为单篇文章传播指数:
r1为文章阅读数
c为评论数
m1为媒体源指数,新闻m1取值2,贴吧m1取值1.5,论坛取值1
g1为在同类媒体源下排名权重
博客类型计算模型为:
BPI=[10%×r1+40%c1+50%×r2]×m1×g1
其中BPI为单篇文章传播指数:
r1为文章阅读数
c为评论数
r2为转发数
m1为媒体源指数,博客m1取值1
g1为在同类媒体源下排名权重
微博类计算模型为:
WPI=[10%×r1+40%×c+40%×r2+10%×(40%×c2+60%×r3)]×m1×g1
其中WPI为单篇文章传播指数:
r1为文章阅读数
c为评论数
r2为转发数
c2为转发微博中评论总数
r3为转发微博中转发总数
m1为媒体源指数,微博的m1为3.5
g1为在同类媒体源下排名权重
微信类计算模型为:
WPI=[20%×r+70%×a+10%ln(f+1)]×m1×r1
其中WPI为单篇文章传播指数:
r1为文章阅读数
a为点赞数
f为等价粉丝数
m1为媒体源指数,微信的m1为3
g1为在同类媒体源下排名权重。
9.根据权利要求6所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述提取模块具体为:取得整个事件中单篇指数最高的文章,此为舆情事件传播指数峰值,记为Smax,该舆情事件,记为Tmiddle;
获得事件的有效传播时间T,定义事件传播衰弱指数为1/10;取发生时间小于Tmiddle,且得分小于Smax/10的最小时间作为事件有效开始传播时间Tstart;同理,取发生时间大于Tmiddle,且得分大于Smax/10的最大时间作为事件有效结束传播时间Tend;得到舆情事件有效传播时间:T=Tend–Tstart,在T时间内的舆情文章总数量记为C。
10.根据权利要求9所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述最终模型为
其中:EPI为事件最终的传播指数;
SMi为舆情事件中单个媒体源单篇最高得分;
Mc为该事件有效传播时间内传播轨迹所跨越的媒体源数量;
T为该事件传播的有效时间;
C为该事件有效时间内的舆情文章总数量;
Si为第i篇文章单篇传播指数得分。