移动新闻App影响力评级方法与流程

文档序号:11234609阅读:390来源:国知局
移动新闻App影响力评级方法与流程
本发明涉及一种评级方法,特别是一种移动新闻app影响力评级方法。
背景技术
:随着移动互联网的快速发展,技术的不断创新,人们的生活也发生着巨大的变化。手机已经成为人们生活中必不可少的必需品,新闻客户端作为移动互联网的入口无疑已成为移动互联网市场竞争最激烈的阵地。新闻的及时性、碎片化、需求个性化等属性,使随时可携带的手机成为最佳的新闻阅读方式。至今,国内主流的新闻类app有:搜狐新闻、腾讯新闻、网易新闻、今日头条、新浪新闻、凤凰新闻等。新闻客户端通过发布、转载等方式对新闻进行报道,随着新闻媒体在政治、经济、文化生活中的作用日益增强,它发挥着越来越重要的作用。网络新闻作为网络舆论和社会舆论形成的主要源泉,准确判断它的影响力从而准确、即时地把握社会舆论的动向变得尤为重要,再加上互联网的虚拟性、隐蔽性、发散性和渗透性等特点,因而确定新闻app影响力对社会安全及其他相关方面具有重要的意义。目前,还没有一种成熟的对移动新闻客户端影响力的评价方法,这就造成用户无法从五花八门的新闻app中挑选出一个适合自己的新闻app。可见利用现在的技术,建立对新闻app影响力的评价方法具有很重要的意义。技术实现要素:针对所提到的问题,本发明提供了一种移动新闻app影响力评级方法,步骤包括:1)采集新闻app上的数据,并将数据聚类入库,所述数据包括:所属网站、评论次数、转载次数、日均访问量(pv)和访问量(uv);2)通过计算模型计算新闻app得分,根据分值的大小,将新闻app进行排序,所述模型如下:nf=ws×(a×trans+b×rep)(1)ws:为新闻影响力因子;trans:为新闻转载率;rep:为新闻回复率;a>0,b>0,a+b=1。优选方案是:所述新闻影响力因子=日均访问量/访问量。优选方案是:利用pagerank算法计算新闻转载率。优选方案是:所述pagerank算法计算公式为:其中mpi是所有pi网页有出链的网页集合;l(pj)是网页pj的出链数目;n是网页总数;a为用户在当前页面并向后页面继续浏览的概率。优选方案是:所述新闻回复率=评论数/点击量。优选方案是:通过大量分析研究表明,所述新闻回复率通过查询回复率参考表获得。优选方案是:通过网络爬虫实时采集新闻app上的数据。本发明有益效果如下:通过该发明可以更直观的看出各类新闻app对于同一事件进行新闻发布的不同效果,统计其发布时间、新闻的点击量和评论量、网民的评论内容(褒贬义)、转发情况在不同时段的变化规律,计算得到相应的新闻app的影响力值,以分数的形式展现给用户,更加直白的显示出不同的新闻app的影响力。这个数值就是新闻app的评价分,分数越高的新闻app,越能满足用户的需求,可以及时的为大众提供实时新闻。附图说明图1为本发明针对浏览网页的用户行为建立抽象模型图;图2为本发明提供的评价方法流程框图。具体实施方式下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。本发明提供了一种移动新闻app影响力评级方法,步骤包括:1)利用网络爬虫程序,从网络中爬取新闻app上的数据,并将数据聚类入库,所述数据包括:所属网站、评论次数、转载次数、日均访问量(pv)和访问量(uv);2)计算新闻影响力因子新闻源网站影响力因子,可以通过中国互联网指数系统中的表现指数中的人气指数确定,人气指数是以alexa的数据为基础进行计算,选取各个行业排名靠前的网站为成分网站,对其访问量及人均页面访问数(pv)进行加权计算得出平均值.其他网站与此值相比,得到各自的人气指数值,再把此指数归一化作为新闻信源网站的质量评估值,即新闻影响力因子。3)计算新闻转载率利用pagerank算法计算新闻转载率的值。pagerank的核心思想:如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是pagerank值会相对较高。算法原理为:(1)在初始阶段:网页通过链接关系构建起web图,每个页面设置相同的pagerank值,通过若干轮的计算,会得到每个页面所获得的最终pagerank值。随着每一轮的计算进行,网页当前的pagerank值会不断得到更新。(2)在一轮中更新页面pagerank得分的计算方法:在一轮更新页面pagerank得分的计算中,每个页面将其当前的pagerank值平均分配到本页面包含的出链上,这样每个链接即获得了相应的权值。而每个页面将所有指向本页面的入链所传入的权值求和,即可得到新的pagerank得分。当每个页面都获得了更新后的pagerank值,就完成了一轮pagerank计算。pagerank算法总的来说就是预先给每个网页一个pr值(下面用pr指代pagerank值),由于pr值物理意义上为一个网页被访问概率,所以一般是1/n,其中n为网页总数。另外,一般情况下,所有的网页的pr值的总和为1。如果不为1的话也不是不行,最后算出来的不同网页之间pr值的大小关系仍然是正确的,只是不能直接地反映概率了。计算公式如下:其中mpi是所有pi网页有出链的网页集合;l(pj)是网页pj的出链数目;n是网页总数;a为用户在当前页面并向后页面继续浏览的概率,一般取0.85。根据上面的公式,我们可以计算每个网页的pr值.即为最终结果:新闻转载率。4)计算新闻的回复率新闻回复率的计算体现了人们对新闻产生的反应,新闻回复率=评论数/点击量。通过大量分析研究表明我们可以通过查询回复率参考表来粗略计算新闻回复率。所述回复率参考表如表1所述。回复数回复率5000~1004500~5000904000~4500803500~4000703000~3500602500~3000502000~2500401500~200030个1000~150020500~1000100~5005表1新闻回复率参考表5)计算新闻app得分通过计算模型计算新闻app得分,根据分值的大小,将新闻app进行排序,所述模型如下:nf=ws×(a×trans+b×rep)(1)ws:为新闻影响力因子;trans:为新闻转载率;rep:为新闻回复率;a>0,b>0,a+b=1。根据得出分数可以判断不同新闻app对社会舆论造成的影响大小,从而使用户从五花八门的新闻app中挑选出一个适合自己的新闻app。实施例1)利用网络爬虫程序,从网络中爬取搜狐新闻app、腾讯新闻app、网易新闻app上的数据,并将数据聚类入库,所述数据包括:所属网站、评论次数、转载次数、日均访问量(pv)和访问量(uv),如表2所示。表22)计算新闻影响力因子搜狐新闻影响力因子ws=pv/uv=701542000/141440000=4.96;腾讯新闻影响力因子ws=pv/uv=830630000/186240000=4.46;网易新闻影响力因子ws=pv/uv=19008000/5760000=3.3。3)计算新闻转载率针对浏览网页的用户行为建立抽象模型如图1所示,转移概率矩阵:其中i行j列的值表示用户从页面j转到页面i的概率新闻网页在网页a上,远程跳转的概率:以1/4的概率进入任意页面:v为abcd当前的rank值,(mv为abcd新的rank值),得到各个页面的pagerank值,这里新闻在网页a上,故转载率为0.25。每个新闻app的转载率都可以按上述方式进行计算,这里为了减少计算复杂度,认为,搜狐新闻、腾讯新闻和网易新闻针对用户浏览页面得到的抽象模型都如图1所示,所以搜狐新闻、腾讯新闻、网易新闻转载率为0.25。4)计算新闻的回复率根据表1的回复率参照表2的采集的新闻app数据,可知:搜狐新闻回复率为100%;腾讯新闻回复率为10%;网易新闻回复率为5%。5)计算新闻app得分通过计算模型计算新闻app得分,根据分值的大小,将新闻app进行排序,所述模型如下:nf=ws×(a×trans+b×rep)(1)ws:为新闻影响力因子;trans:为新闻转载率;rep:为新闻回复率;a>0,b>0,a+b=1。搜狐新闻得分:nf=ws×(a×trans+b×rep)=4.96×(0.8×0.25+0.2×100%=1.984;腾讯新闻得分:nf=ws×(a×trans+b×rep)=4.46×(0.8×0.25+0.2×10%=0.9812;网易新闻得分:nf=ws×(a×trans+b×rep)=3.3×(0.8×0.25+0.2×5%=0.693;可见新闻app的分数排名为:搜狐新闻app>腾信新闻app>网易新闻app。尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1