一种网络文章传播影响力的评价系统及方法

文档序号:6340202阅读:414来源:国知局
专利名称:一种网络文章传播影响力的评价系统及方法
技术领域
本发明涉及互联网领域,尤其涉及一种网络文章传播影响力的评价系统及方法。
背景技术
近些年,互联网的迅速发展,网络媒体也相应地发展强劲,而一向作为媒体声音的评论也随之显现出新的特质和发展空间。随着互联网技术的日益普及,越来越多的网友习惯于在网络上表达自己对各种新闻信息的看法和见解。这些看法和见解常常以帖子、留言、 网络日志等方式散见于网络,其中论点明确、论述清楚的文字更是上升为完整的网络评论形式,对新近发生的新闻事件予以自发的评判和评价。当下各新闻网站纷纷设立了专门的网络评论栏目,搜集各路网友的网络评论文字,及时整合之后发出自己的声音,成为重要的舆论导向工具。一篇评论文章的发表后,由于网络的复杂性,如何来观察其传播情况?对于文章的发布者或者管理者,是非常想了解的事情。那么一篇评论文章在互联网上传播影响力如何来评价呢?目前评价网络评论文章影响力的方法是利用传统的人工方法,通过各大搜索引擎观察其转载情况。通过查看每篇转载的点击量、回帖量、是否加精、推荐等数值,做出汇总统计。发明人发现现有这种方法比较普遍,但至少有如下缺点一、耗时较长,效率低。由于全部由人工完成,在检索和统计时消耗时间较长。二、数据统计不准确。因为各大引擎检索结果存在网络延时、收录遗漏等原因,导致检索的结果不完整。

发明内容
本发明的实施例提供一种网络文章传播影响力的评价系统及方法,能够代替人工进行网络文章传播影响力评价,提高了评价效率及评价精度。为达到上述目的,本发明的实施例采用如下技术方案一种网络文章传播影响力的评价系统,包括数据采集单元,用于对预设站点下的栏目进行数据采集,采集项目包括文章正文、文章传播影响力评价相关项;文章录入单元,用于录入待评价的文章;关键词提取单元,用于提取得到所述待评价文章的关键词;评价分析单元,用于根据所述关键词从所述数据采集单元中找出所述待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到所述待评价文章的传播影响力指数。一种网络文章传播影响力的评价方法,包括对预设站点下的栏目进行数据采集,采集项目包括转载文章正文、转载文章传播影响力评价相关项;接收用户录入的待评价的文章;提取出所述待评价的文章的关键词;利用所述关键词从采集的文章中找出所述待评价文章的转载文章;根据各转载文章的传播影响力评价相关项得到所述待评价文章传的传播影响力指数。本发明实施例提供的网络文章传播影响力的评价系统及方法,数据采集单元对预设站点下的栏目进行数据采集;文章录入单元录入待评价的文章;关键词提取单元提取该待评价文章的关键词;评价分析单元根据该关键词从数据采集单元中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。这样一来,本发明实施例提供的评价系统能够代替人工进行网络文章传播影响力评价, 在提高了评价效率的同时也提高了评价精度。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的网络文章传播影响力的评价系统的结构示意框图;图2为本发明另一实施例提供的网络文章传播影响力的评价系统的结构示意框图;图3为本发明实施例提供的网络文章传播影响力的评价方法的流程框图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供的网络文章传播影响力的评价系统,如图1所示,包括数据采集单元101,用于对预设站点下的栏目进行数据采集,采集项目包括文章正文、文章传播影响力评价相关项。文章录入单元102,用于录入待评价的文章。关键词提取单元103,用于提取得到待评价文章的关键词。评价分析单元104,用于根据该关键词从数据采集单元101中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。本发明实施例提供的网络文章传播影响力的评价系统,数据采集单元对预设站点下的栏目进行数据采集;文章录入单元录入待评价的文章;关键词提取单元提取该待评价文章的关键词;评价分析单元根据该关键词从数据采集单元中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。这样一来,本发明实施例提供的评价系统能够代替人工进行网络文章传播影响力评价,在提高了评价效率的同时也提高了评价精度。本发明另一实施例提供的网络文章传播影响力的评价系统,如图2所示,包括数据采集单元101、文章录入单元102、关键词提取单元103、和评价分析单元104。其中,数据采集单元101具体包括采集模块1011,用于对预设站点下的栏目进行数据采集,采集项目可以包括采集站点、采集频道、文章标题、文章正文、链接地址、以及传播影响力评价相关项,如点击数、回帖数、是否加精、是否置顶、是否推荐、是否首页等等。此外,对于已经采集过的信息,如果点击数、回帖数、是否加精、是否置顶、是否推荐、是否首页发生变化,则可以对该信息重新采集,并将最新的值更新到采集数据库1012 中。采集数据库1012,用于存储采集模块1021采集的数据。全文检索模块1013,用于对采集数据库1012中存储的采集数据建立索引。对于数据有更新的数据,则重新建立索引。建立索引后,提供有查询接口,以便于评价分析单元 104调用查询。文章录入单元102具体包括录入模块1021,用于录入待评价的文章。录入待评价的文章时,还可以将该文章的信息一并录入,包括文正标题、链接地址、文章正文等等。录入数据库模块1022,用于存储录入模块1021录入的待评价文章。关键词提取单元103与上一实施例基本类似,可以对一段文字进行关键词的提取,并提供切词接口,以便于评价分析单元104调用。评价分析单元104具体包括文章获取模块1041,用于从录入数据库模块1022中获取待评价文章。并以并获取到该带评价文章的相关信息。关键词获取模块1042,用于将待评价文章发送给关键词提取单元103,并从该关键词提取单元103获取到待评价文章的关键词。检索模块1043,用于利用该关键词向全文检索模块1013发起检索请求,并从全文检索模块1013获取到检索出的相似文章及相似文章的传播影响力评价相关项。比对模块1044,用于从上述相似文章中找出待评价文章的转载文章。具体的,可以从待评价文章中抽出一段文字,在相似文章中逐篇比对,将与待评价文章不匹配的相似文章予以抛除,将链接地址与待评价文章链接地址一致的相似文章标记为原文。将最终的符合条件的相似文章的基本信息存入数据库(图中未表示),确定为待评价文章的转载文章,并跟待评价文章建立数据关联。此外,对于已经统计过的文章,则只把最新的数据,如点击量、回帖量等更新即可。统计模块1045,用于统计各转载文章的传播影响力评价相关项,得到该待评价文章传的传播影响力指数。具体的,可以在数据库(图中未表示)中查找待评价文章的转载文章数据。可以统计的数据如下转载量将待评价文章的转载文章数量求和;总点击数将所有转载文章的点击数求和;总回帖数将所有转载文章的回帖数求和;是否加精原文及转载是否加精;是否推荐原文及转载是否推荐;是否置顶原文及转载是否置顶。是否首页原文及转载是否出现在首页。统计显示单元103,用于将文章的传播影响力情况展示给用户。具体包括文章播影响力指数显示模块1031,用于显示单篇文章的传播影响力指数。如单篇评论文章的总转载量、总点击数、总回帖数、是否加精、是否推荐、是否置顶、是否首页等等。文章播影响力指数显示模块1032,用于显示文章的转载情况。包括每篇转载文章的发布站点、发布频道、点击量、回帖量、是否加精、是否推荐、是否置顶、是否首页。转载网站分布显示模块1033,用于显示文章转载网站的分别情况。可以用图形展示,对于单篇评论文章可以查看其发布的网站分布情况。本发明实施例提供的网络文章传播影响力的评价系统,数据采集单元对预设站点下的栏目进行数据采集;文章录入单元录入待评价的文章;关键词提取单元提取该待评价文章的关键词;评价分析单元根据该关键词从数据采集单元中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。这样一来,本发明实施例提供的评价系统能够代替人工进行网络文章传播影响力评价,在提高了评价效率的同时也提高了评价精度。本发明实施例提供的网络文章传播影响力的评价方法,如图3所示,步骤包括S301、对预设站点下的栏目进行数据采集,采集项目包括转载文章正文、转载文章传播影响力评价相关项。其中,转载文章传播影响力评价相关项可以是点击数、回帖数、是否加精、是否置顶、是否推荐、是否首页等等。S302、接收用户录入的待评价的文章。与此同时,还可以将该待评价的文章的相关信息也一并录入进来,如该待评价文章的链接地址、标题等等。S303、提取出该待评价的文章的关键词。S304、利用该关键词从采集的文章中找出待评价文章的转载文章。具体的,可以是先利用该关键词从采集的文章中找出相似文章。再从待评价文章中抽出一段文字,在相似文章中逐篇比对,找出该待评价文章的转载文章。然后,将转载文章中链接地址与用户录入的待评价文章的链接地址一致的文章标记为原文。S305、根据各转载文章的传播影响力评价相关项得到该待评价文章传的传播影响力指数。具体的,可以统计的文章传的传播影响力指数如下
转载量将待评价文章的转载文章数量求和;总点击数将所有转载文章的点击数求和;总回帖数将所有转载文章的回帖数求和;是否加精原文及转载是否加精;是否推荐原文及转载是否推荐;是否置顶原文及转载是否置顶;是否首页原文及转载是否出现在首页。进一步地,还可以包括S306、将文章的传播影响力情况展示给用户。具体的,可以将单篇文章的传播影响力指数显示给用户,或是将文章的转载情况显示给用户,或是将文章转载网站的分别情况显示给用户。这三种方式可以任意组合,或者根据用户需要单独显示。本发明实施例提供的网络文章传播影响力的评价方法,对预设站点下的栏目进行数据采集;录入待评价的文章;提取该待评价文章的关键词;根据该关键词从数据采集单元中找出待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到该待评价文章的传播影响力指数。这样一来,利用本发明实施例提供的评价方法的系统能够代替人工进行网络文章传播影响力评价,在提高了评价效率的同时也提高了评价精度。本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括R0M、RAM、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
权利要求
1.一种网络文章传播影响力的评价系统,其特征在于,包括数据采集单元,用于对预设站点下的栏目进行数据采集,采集项目包括文章正文、文章传播影响力评价相关项;文章录入单元,用于录入待评价的文章; 关键词提取单元,用于提取得到所述待评价文章的关键词;评价分析单元,用于根据所述关键词从所述数据采集单元中找出所述待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到所述待评价文章的传播影响力指数。
2.根据权利要求1所述的系统,其特征在于,所述数据采集单元包括采集模块,用于对预设站点下的栏目进行数据采集,采集项目包括转载文章正文、转载文章的传播影响力评价相关项;采集数据库,用于存储所述采集模块采集的数据;全文检索模块,用于对所述采集数据库中存储的采集数据建立索引。
3.根据权利要求2所述的系统,其特征在于,所述文章录入单元包括 录入模块,用于录入待评价的文章;录入数据库模块,用于存储录入的待评价文章。
4.根据权利要求3所述的系统,其特征在于,所述评价分析单元包括 文章获取模块,用于从所述录入数据库模块中获取待评价文章;关键词获取模块,用于将所述待评价文章发送给所述关键词提取单元,并从所述关键词提取单元获取到所述待评价文章的关键词;检索模块,用于利用所述关键词向所述全文检索模块发起检索请求,并从所述全文检索模块获取到检索出的相似文章及相似文章的传播影响力评价相关项; 比对模块,用于从所述相似文章中找出所述待评价文章的转载文章; 统计模块,用于统计各转载文章的传播影响力评价相关项,得到所述待评价文章传的传播影响力指数。
5.根据权利要求1所述的系统,其特征在于,所述系统还包括 统计显示单元,用于将文章的传播影响力情况展示给用户。
6.根据权利要求5所述的系统,其特征在于,所述统计显示单元包括 文章播影响力指数显示模块,用于显示单篇文章的传播影响力指数; 文章播影响力指数显示模块,用于显示文章的转载情况;转载网站分布显示模块,用于显示文章转载网站的分别情况。
7.—种网络文章传播影响力的评价方法,其特征在于,包括对预设站点下的栏目进行数据采集,采集项目包括转载文章正文、转载文章传播影响力评价相关项;接收用户录入的待评价的文章; 提取出所述待评价的文章的关键词;利用所述关键词从采集的文章中找出所述待评价文章的转载文章; 根据各转载文章的传播影响力评价相关项得到所述待评价文章传的传播影响力指数。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括接收用户录入的该待评价文章的链接地址。
9.根据权利要求8所述的方法,其特征在于,利用所述关键词从采集的文章中找出所述待评价文章的转载文章包括利用所述关键词从采集的文章中找出相似文章;从所述待评价文章中抽出一段文字,在相似文章中逐篇比对,找出所述待评价文章的转载文章;将转载文章中链接地址与用户录入的待评价文章的链接地址一致的文章标记为原文。
10.根据权利要求7所述的方法,其特征在于,所述方法还包括 将单篇文章的传播影响力指数显示给用户;和/或将文章的转载情况显示给用户;和/或将文章转载网站的分别情况显示给用户。
全文摘要
本发明实施例提供一种网络文章传播影响力的评价系统及方法,涉及互联网领域,能够代替人工进行网络文章传播影响力评价,提高了评价效率及评价精度。其网络文章传播影响力的评价系统,包括数据采集单元,用于对预设站点下的栏目进行数据采集;文章录入单元,用于录入待评价的文章;关键词提取单元,用于提取关键词;评价分析单元,用于根据所述关键词找出所述待评价文章的转载文章,并根据各转载文章的传播影响力评价相关项得到所述待评价文章的传播影响力指数。本发明实施例用于评价网络文章传播影响力。
文档编号G06F17/30GK102541912SQ201010609219
公开日2012年7月4日 申请日期2010年12月17日 优先权日2010年12月17日
发明者杨建武, 梁汝锋, 赵增峰 申请人:北京北大方正电子有限公司, 北京大学, 北大方正集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1