一种资讯传播过程的内容溯源的计算方法与流程

文档序号:12176975阅读:832来源:国知局
本发明属于计算方法
技术领域
,尤其涉及一种资讯传播过程的内容溯源的计算方法。
背景技术
:随着互联网中文本内容在传播过程中多次修改和精编,如果对新闻原创的获取以通过对新闻采集回来的基础数据进行匹配,会存在原创获取不准确的问题;这对获取新闻原创过程中制造了很大麻烦。单独只是按照时间排序取最早发布的话,会造成获取到的原创内容既不准确;如果根据采集过来数据对发布媒体及来源媒体进行相同匹配获取到的原创也不够精确。因此需要从时间,媒体,新闻被转载数量等多个维度,不同的权重来判断原创媒体。以解决获取原创的不准确性。技术实现要素:本发明所解决的技术问题采用以下技术方案来实现:一种资讯传播过程的内容溯源的计算方法,具体计算方法如下:第一步;开始获取遍历所有数据得到候选原创集;第二步:得到原创矩阵:包括针对每个候选原创集;第三步:计算候选原创权重比得到原创,结束此方法。所述的第二步中候选原创集包括:获取候选原创媒体类型、获取候选原创发布时间和获取原创转载量。本发明的有益效果为:本发明对媒体传播溯源有较高的准确性:通过针对一条咨询采集回来数据进行原创媒体分析,有利于媒体传播过程中媒体原创点的定位,有利于对负面咨询,谣言等源发点的定位。针对于原创的匹配获取可以通过不同的维度及各个维度不同的权重来比对获取。附图说明图1是本发明的流程图。具体实施方式实施例1、以下结合附图对本发明做进一步描述:一种资讯传播过程的内容溯源的计算方法具体计算方法如下:第一步;开始获取遍历所有数据得到候选原创集;遍历所有数据判断该条咨询的转载媒体是否与该候选原创相同,如果相同,该候选原创转载量+1。第二步:得到原创矩阵:包括针对每个候选原创集;候选原创集包括:获取候选原创媒体类型、获取候选原创发布时间和获取原创转载量。原创候选矩阵媒体名称媒体类型发布时间转载量人民网中央媒体09-1807:00323世界浙商网其他09-1810:1021新华网中央媒体09-1808:21149第三步:计算候选原创权重比得到原创,结束此方法。权重计算方式定义如下:时间权重计算方式:将发布时间转成UTC秒计算时间平均值.转载量权重计算方式:通过遍历所有数据计算出最大转载量,用候选原创转载量/最大转载量,得到的数值则为转载量的权重值.媒体类型权重计算方式:媒体类型权重则对应不同类型媒体区分重要性,针对每个类型设置固定的权重值,如:中央媒体:0.92省级媒体:0.78其他媒体:0.31本发明对媒体传播溯源有较高的准确性:通过针对一条咨询采集回来数据进行原创媒体分析,有利于媒体传播过程中媒体原创点的定位,有利于对负面咨询,谣言等源发点的定位。针对于原创的匹配获取可以通过不同的维度及各个维度不同的权重来比对获取。利用本发明所述的技术方案,或本领域的技术人员在本发明技术方案的启发下,设计出类似的技术方案,而达到上述技术效果的,均是落入本发明的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1