一种用于社区内容热度排序的估算方法与流程

文档序号:14728953发布日期:2018-06-19 15:45阅读:703来源:国知局

本发明涉及互联网社区发布内容热度排序方法,尤其涉及一种用于社区内容热度排序的估算方法。



背景技术:

现有技术中,社区内容热度排序基本都依赖于点赞数、评论数等简单参数或者人工介入。可大致分为两类:一种方法是简单参数排序,即根据点赞数、评论数或者访问数等简单参数进行评估,将数量较大的社区内容排序在前,此类方法采用参数较为单一,很容易通过刷赞、刷评论等方式,将质量低下的内容恶意刷高排序,无法保证用户体验。另一种方法是人工主观评价,即利用人工主观评价来判定社区内容是否受欢迎,将人工认定的结果排序在前,此类方法中人工成本很高且耗时长,无法实现全自动评价,同时,这类评价方式主观性较强,且无法量化,当需要比较的结果的数量较多时,比较难度增大,人工评价的耗时会大幅增长,评价的可靠性会相应降低。



技术实现要素:

本发明要解决的技术问题在于,针对现有技术的不足,提供一种能够对社区内容热度给出量化评价,并且评价速度快、可靠性高的用于社区内容热度排序的估算方法。

为解决上述技术问题,本发明采用如下技术方案。

一种用于社区内容热度排序的估算方法,其包括有如下步骤:步骤S1,计算社区内容的浏览分数:其中,C为全部社区内容中每篇社区内容被浏览过的平均人数,m为社区内容被每个人浏览过的平均次数,n为浏览过该篇社区内容的人数,xi是浏览过该篇社区内容的n个人中每个人的浏览次数,i=1,2…,n;步骤S2,计算社区内容的点赞分数:Like_score=loge(like_uv+1);其中,like_uv为该篇社区内容的点赞人数;步骤S3,计算社区内容的评论分数:

Comment_score=

(loge(comment_pv+1))a*(loge(comment_uv+1))β

其中,comment_pv是该社区内容被评论的次数,comment_uv是评论该社区内容的人数,0=<α<1,0=<β<1,并且α<β;步骤S4,根据步骤S1~步骤S3的结果计算社区内容热度分数:

其中,w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。

优选地,所述步骤S4中,默认状态下,w1=0.2,w2=0.4,w3=0.4。

本发明公开的用于社区内容热度排序的估算方法中,其综合了社区内容的浏览次数、浏览人数、评论次数、评论人数、点赞人数等参数对社区内容热度进行综合评估,按照热度分数排序的算法,通过这种排序可以在无人工干预的情况下,全自动地根据多重参数得出更受用户欢迎的内容,进而避免仅通过点赞、评论数量排序而造成低质量的内容排序在前的结果。本发明相比现有技术而言的有益效果在于,本发明能够更加全面客观的对社区内容热度进行评价,评价过程全程无需人工干预,同时,本发明能对内容热度给出量化评价,速度快、可靠性高,此外,本发明可用于对社区内容进行快速评价排序,从而起到筛选优质受欢迎的内容,并有效规避存在恶意刷赞刷评论的排序结果。

具体实施方式

下面结合实施例对本发明作更加详细的描述。

本发明公开了一种用于社区内容热度排序的估算方法,其包括有如下步骤:

步骤S1,计算社区内容的浏览分数:

其中,C为全部社区内容中每篇社区内容被浏览过的平均人数,m为社区内容被每个人浏览过的平均次数,n为浏览过该篇社区内容的人数,xi是浏览过该篇社区内容的n个人中每个人的浏览次数,i=1,2…,n;

步骤S2,计算社区内容的点赞分数:

Like_score=loge(like_uv+1);

其中,like_uv为该篇社区内容的点赞人数;

步骤S3,计算社区内容的评论分数:

Comment_score=

(loge(comment_pv+1))a*(loge(comment_uv+1))β

其中,comment_pv是该社区内容被评论的次数,comment_uv是评论该社区内容的人数,0=<α<1,0=<β<1,并且α<β;

步骤S4,根据步骤S1~步骤S3的结果计算社区内容热度分数:

其中,w1、w2和w3分别是Visit_score、Like_score和Comment_score的权重系数。所述步骤S4中,默认状态下,w1=0.2,w2=0.4,w3=0.4。

本发明公开的用于社区内容热度排序的估算方法,其综合了社区内容的浏览次数、浏览人数、评论次数、评论人数、点赞人数等参数对社区内容热度进行综合评估,按照热度分数排序的算法,通过这种排序可以在无人工干预的情况下,全自动地根据多重参数得出更受用户欢迎的内容,进而避免仅通过点赞、评论数量排序而造成低质量的内容排序在前的结果。

本发明在实际应用过程中,可参考如下实施例:

计算Visit_score的过程中,C是每篇社区内容平均被多少人浏览过,m是社区内容被每个人平均浏览过多少次,n是浏览过该篇社区内容的人数,xi代表的是浏览过该篇社区内容的n个人里每个人浏览的次数,i=1,2…,n。公式Visit_score的设计借鉴了贝叶斯推断的思想,在不知道每个用户浏览社区内容次数的情况下,先估计一个值,这个值就是C*m,然后不断用新的信息修正,使得它越来越接近新的值。这个公式主要是解决了给一些只有较少人浏览过的社区内容,以相对公平的排名的问题。假设一篇只被2个人浏览过和一篇被200人浏览过的社区内容,如果按正常算平均的方式,被200人浏览过的社区内容肯定要比只被2个人浏览过的社区内容分数高,但只被2个人浏览过的社区内容很有可能只是它的曝光度比较低,很少人能发现到,所以才造成了浏览它的人数比较少,但社区内容的质量不一定低,在没有曝光度数据情况下,为了让被较少人浏览过的社区内容有相对公平一点的分数,就引入了C和m,C和m是在平均情况下,社区内容会被多少人浏览,平均每人浏览多少次,相当于给了一个默认的得分。

计算Like_score的过程中,like_uv是点赞了社区内容的人数,e是自然数,约为2.71828。本实施例中,对点赞人数取了对数,这样点赞人数的增加对得分增加的影响是越来越弱的,加1是为了避免对数的真数为0。

计算Comment_score的过程中,comment_pv是社区内容被评论的次数,comment_uv是评论了该社区内容的人数,e是自然数,约为2.71828,0=<α<1,0=<β<1,并且α<β。其中,α<β是为了让comment_pv对Comment_score的影响小于comment_uv对Comment_score的影响。

基于上述计算结果,本实施例对visit_score,like_score,comment_score用sigmoid函数进行整合,将最终得分归一化到0到1之间。其中,w1、w2、w3分别是Visit_score、Like_score、Comment_score的权重系数,默认规定w1=0.2,w2=0.4,w3=0.4,当然这些权重系数是可以通过训练取更合适的值的,这就涉及以后建立相关的模型了。w1*visit_score+w2*like_score+w3*comment_score后面加1,是为了防止e的指数是0的情况。

本发明公开的用于社区内容热度排序的估算方法,其能够全自动评估社区中内容热度,能有效提升社区内容排序结果精度,并避免单个参数造成优质内容下沉、劣质内容排序在上的情况。同时,精准的热门内容排序结果可以直接用于社区、资讯等应用,大幅度减少人工交互,进而提升用户体验。

以上所述只是本发明较佳的实施例,并不用于限制本发明,凡在本发明的技术范围内所做的修改、等同替换或者改进等,均应包含在本发明所保护的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1