一种互联网舆情事件传播指数的获取方法和系统与流程

文档序号:12465168阅读:来源:国知局

技术特征:

1.一种互联网舆情事件传播指数的获取方法,其特征在于:所述获取方法包括如下步骤:步骤1、输入舆情事件;

步骤2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;

步骤3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;

步骤4、通过文章传播指数提取舆情事件传播轨迹关键信息;

步骤5、通过舆情事件传播轨迹关键信息构建最终模型。

2.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述媒体源包括:新闻、博客、论坛、贴吧、微博、微信、电子报、或者主流新闻APP。

3.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述步骤3中对每一篇文章进行单文章传播指数计算,具体为:

针对不同的媒体源,结合当前媒体源的流行趋势,采取不同的媒体源指数;

不同的媒体源根据不同的传播学要素采用不同的量化方式:

新闻、论坛、贴吧类型计算模型为:

NPI=[30%×r1+70%×c]×m1×g1

其中NPI为单篇文章传播指数:

r1为文章阅读数

c为评论数

m1为媒体源指数,新闻m1取值2,贴吧m1取值1.5,论坛取值1

g1为在同类媒体源下排名权重

博客类型计算模型为:

BPI=[10%×r1+40%c1+50%×r2]×m1×g1

其中BPI为单篇文章传播指数:

r1为文章阅读数

c为评论数

r2为转发数

m1为媒体源指数,博客m1取值1

g1为在同类媒体源下排名权重

微博类计算模型为:

WPI=[10%×r1+40%×c+40%×r2+10%×(40%×c2+60%×r3)]×m1×g1

其中WPI为单篇文章传播指数:

r1为文章阅读数

c为评论数

r2为转发数

c2为转发微博中评论总数

r3为转发微博中转发总数

m1为媒体源指数,微博的m1为3.5

g1为在同类媒体源下排名权重

微信类计算模型为:

WPI=[20%×r+70%×a+10%ln(f+1)]×m1×r1

其中WPI为单篇文章传播指数:

r1为文章阅读数

a为点赞数

f为等价粉丝数

m1为媒体源指数,微信的m1为3

g1为在同类媒体源下排名权重。

4.根据权利要求1所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述步骤4具体为:取得整个事件中单篇指数最高的文章,此为舆情事件传播指数峰值,记为Smax,该舆情事件,记为Tmiddle;

获得事件的有效传播时间T,定义事件传播衰弱指数为1/10;取发生时间小于Tmiddle,且得分小于Smax/10的最小时间作为事件有效开始传播时间Tstart;同理,取发生时间大于Tmiddle,且得分大于Smax/10的最大时间作为事件有效结束传播时间Tend;得到舆情事件有效传播时间:T=Tend–Tstart,在T时间内的舆情文章总数量记为C。

5.根据权利要求4所述的一种互联网舆情事件传播指数的获取方法,其特征在于:所述最终模型为

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>E</mi> <mi>P</mi> <mi>I</mi> <mo>=</mo> <mo>&lsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>10</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <msubsup> <mi>&Sigma;</mi> <mn>1</mn> <mrow> <mi>M</mi> <mi>c</mi> </mrow> </msubsup> <mi>S</mi> <mi>M</mi> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>10</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <mi>M</mi> <mi>c</mi> <mo>*</mo> <mn>100</mn> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>10</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <mi>T</mi> <mo>&times;</mo> <mn>100</mn> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>20</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <mi>C</mi> <mo>&times;</mo> <mn>10</mn> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>50</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <munderover> <mi>&Sigma;</mi> <mn>1</mn> <mi>C</mi> </munderover> <mi>S</mi> <mi>i</mi> <mo>/</mo> <mi>T</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mo>&rsqb;</mo> <mn>2</mn> </msup> <mo>&times;</mo> <mn>10</mn> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中:EPI为事件最终的传播指数;

SMi为舆情事件中单个媒体源单篇最高得分;

Mc为该事件有效传播时间内传播轨迹所跨越的媒体源数量;

T为该事件传播的有效时间;

C为该事件有效时间内的舆情文章总数量;

Si为第i篇文章单篇传播指数得分。

6.一种互联网舆情事件传播指数的获取系统,其特征在于:所述获取系统包括输入模块、采集模块、分析模块、提取模块、以及构建模型模块;

所述输入模块,用于输入舆情事件;

所述采集模块,采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;

所述分析模块,对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;

所述提取模块,通过文章传播指数提取舆情事件传播轨迹关键信息;

所述构建模型模块通过舆情事件传播轨迹关键信息构建最终模型。

7.根据权利要求6所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述媒体源包括:新闻、博客、论坛、贴吧、微博、微信、电子报、或者主流新闻APP。

8.根据权利要求6所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述分析模块中对每一篇文章进行单文章传播指数计算,具体为:

针对不同的媒体源,结合当前媒体源的流行趋势,采取不同的媒体源指数;

不同的媒体源根据不同的传播学要素采用不同的量化方式:

新闻、论坛、贴吧类型计算模型为:

NPI=[30%×r1+70%×c]×m1×g1

其中NPI为单篇文章传播指数:

r1为文章阅读数

c为评论数

m1为媒体源指数,新闻m1取值2,贴吧m1取值1.5,论坛取值1

g1为在同类媒体源下排名权重

博客类型计算模型为:

BPI=[10%×r1+40%c1+50%×r2]×m1×g1

其中BPI为单篇文章传播指数:

r1为文章阅读数

c为评论数

r2为转发数

m1为媒体源指数,博客m1取值1

g1为在同类媒体源下排名权重

微博类计算模型为:

WPI=[10%×r1+40%×c+40%×r2+10%×(40%×c2+60%×r3)]×m1×g1

其中WPI为单篇文章传播指数:

r1为文章阅读数

c为评论数

r2为转发数

c2为转发微博中评论总数

r3为转发微博中转发总数

m1为媒体源指数,微博的m1为3.5

g1为在同类媒体源下排名权重

微信类计算模型为:

WPI=[20%×r+70%×a+10%ln(f+1)]×m1×r1

其中WPI为单篇文章传播指数:

r1为文章阅读数

a为点赞数

f为等价粉丝数

m1为媒体源指数,微信的m1为3

g1为在同类媒体源下排名权重。

9.根据权利要求6所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述提取模块具体为:取得整个事件中单篇指数最高的文章,此为舆情事件传播指数峰值,记为Smax,该舆情事件,记为Tmiddle;

获得事件的有效传播时间T,定义事件传播衰弱指数为1/10;取发生时间小于Tmiddle,且得分小于Smax/10的最小时间作为事件有效开始传播时间Tstart;同理,取发生时间大于Tmiddle,且得分大于Smax/10的最大时间作为事件有效结束传播时间Tend;得到舆情事件有效传播时间:T=Tend–Tstart,在T时间内的舆情文章总数量记为C。

10.根据权利要求9所述的一种互联网舆情事件传播指数的获取系统,其特征在于:所述最终模型为

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>E</mi> <mi>P</mi> <mi>I</mi> <mo>=</mo> <mo>&lsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>10</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <msubsup> <mi>&Sigma;</mi> <mn>1</mn> <mrow> <mi>M</mi> <mi>c</mi> </mrow> </msubsup> <mi>S</mi> <mi>M</mi> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>10</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <mi>M</mi> <mi>c</mi> <mo>*</mo> <mn>100</mn> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>10</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <mi>T</mi> <mo>&times;</mo> <mn>100</mn> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>20</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <mi>C</mi> <mo>&times;</mo> <mn>10</mn> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>50</mn> <mi>%</mi> <mo>&times;</mo> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <mrow> <munderover> <mi>&Sigma;</mi> <mn>1</mn> <mi>C</mi> </munderover> <mi>S</mi> <mi>i</mi> <mo>/</mo> <mi>T</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mo>&rsqb;</mo> <mn>2</mn> </msup> <mo>&times;</mo> <mn>10</mn> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中:EPI为事件最终的传播指数;

SMi为舆情事件中单个媒体源单篇最高得分;

Mc为该事件有效传播时间内传播轨迹所跨越的媒体源数量;

T为该事件传播的有效时间;

C为该事件有效时间内的舆情文章总数量;

Si为第i篇文章单篇传播指数得分。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1