一种社交网络排名方法与流程

文档序号:11545234阅读:336来源:国知局

本发明涉及互联网社交领域,尤其涉及一种社交网络排名方法。



背景技术:

在互联网领域中,基于用户的浏览习惯,给特定的内容排名是非常普遍的技术方法。谷歌公司在其专利us6285999中公开了所谓的pagerank算法用于推导和度量网页的质量和重要性。pagerank算法是一个链接分析算法,这个算法分配一个数值加权到超链接的文档集,如互联网,用于计算这个文档集内各个文档的相对重要性。

当使用pagerank算法对互联网上的内容进行排名时,pagerank算法不可避免地不能够准确、完全地适用于社交网络,因此,美国专利us9311620公开了一种用于社交网络的排名算法,这个排名算法监控社交网络用户的行动以及至少两个社交网络用户之间的互动,确定基于所述行动的结果的质量和社交网络的用户的内容的重要性。但是这个算法以单一的粉丝关系为影响力评估的基础,对社交网络用户进行排名,过于简单化。实际的社交网络中存在着错综复杂的人到内容、内容到内容、内容到人等通过各种不同的互动手段进行的关联。

因此,本领域的技术人员致力于开发一种社交网络排名方法,充分利用社交网络中每个账号及其内容的各种属性,更准确地评价账号的权重。



技术实现要素:

有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何改进社交网络的排名算法,如何更准确地评价社交账号的权重。

为实现上述目的,本发明提供了一种社交网络排名方法,包括以下步骤:

步骤1、在社交平台上创建社交账号,给每个所述社交账号分配一个主题,根据所属主题类别,建立社交账号之间的关系树;

步骤2、在所述社交平台上搜索所述主题的关键词来获取关联账号,使用爬虫抓取所述关联账号的附属信息;

步骤3、平滑处理所述关联账号的所述附属信息,以百分制标准化处理针对每一种所述附属信息的内部排名;

步骤4、针对不同指数,设置附属信息的类别以及每一种所述附属信息的权重;

步骤5、在不同指数下,计算每个所述关联账号的总权重,根据所述总权重对所述关联账号进行排名;

步骤6、针对不同所述指数下排名靠前的关联账号,让所述社交账号和所述关联账号之间互动;

步骤7、根据所述社交账号在所述互动后的所述附属信息的增长情况,动态调整所述步骤4中的所述附属信息的种类和权重。

进一步地,在步骤1中,所述关系树指多个社交账号属于同一大的主题构成的父子关系,这些账号又分别属于这一大主题下的细分主题构成兄弟关系。

进一步地,在步骤2中,所述附属信息包括粉丝数、发帖数、转发数、获得赞的数量、被提到的次数以及带有所述主题标签的次数。

进一步地,在步骤2中,根据不同社交平台以及平台发展时段来增减或者改变所述附属信息的种类。

进一步地,在步骤2中,所述关联账号的关联包括人与人的关联、人和内容的关联以及内容和内容之间的关联。

进一步地,在步骤3中,所述平滑处理为取对数。

进一步地,在步骤4中,每一种所述附属信息的权重之和为1。

进一步地,在步骤5中,所述指数包括不同种类但相关的所述附属信息。

进一步地,在步骤6中,所述互动包括“@”、关注、转发和私信。

进一步地,在步骤7中,所述动态调整包括增加、删除以及重新设置权重。

和现有的专利技术相比,本发明所述的技术方案对社交网络中的账号和内容等相关元素做了更准确的评价,从而为优化社交互动和媒体传播提供有效的策略支持;显著地降低了媒体传播成本,实际应用中本技术以零广告营销成本获取了千万级别的粉丝用户;本发明所述的技术方案的参数和模型是根据大量的社交网络互动试验,不断训练优化出来的,不是一个静态的模型。本发明所述的技术方案基于准确的权重评价,预测各种社交互动行为可能产生的效果,从而优化社交和媒体传播策略,降低用户获取成本。本发明所述的技术方案根据社交互动行为实际产生的结果,借鉴神经网络深度学习方法,动态调整评价帐号权重方法中的变量和参数。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的一个较佳实施例的方法流程图。

具体实施方式

本发明所述的一种社交网络排名的方法,如图1所示,包括以下步骤:

第一步,批量创建几千个社交媒体账号,每个账号专注一个细分主题。所有微博账号一起可以涵盖广泛的主题。用系统化的办法去尽可能寻找有人气的主题。建立好主题和主题之间的关系。所有几千主题在一起形成一个庞大的网络,他们存在着父子、兄弟等各种关系。这些帐号共同构成一个广大的帐号池。

第二步,对于每个主题,首先在社交平台上搜索对应主题关键字,用网络爬虫爬取结果中帐号的各类信息,包括粉丝数量f(follower),发帖数量c(content),帖子被转发数量r(repost),获得赞的次数l(like),被提到的次数m(mention),发帖带有主题标签的次数t(tag),v={f,c,r,l,m,t}表示这些输入变量的集和,这个集合中的变量根据不同社交平台以及平台发展时段来增减或者改变。

第三步,针对每一种变量首先进行对数化lg(x),这样平滑化处理可以避免单一变量差异太大而导致其他变量失效,然后对每一种变量内部进行排名,以百分制标准化处理,s={sf,sc,sr,sl,sm,st}表示标准化的结果。

第四步,w={wf,wc,wr,wl,wm,wt}表示对应输入变量的权重,需满足wf+wc+wr+wl+wm+wt=1,其初始值可以根据经验设定,在随后的调参的过程中不断地动态调整优化这些参数。

第五步,t=f*wf+c*wc+r*wr+l*wl+m*wm+t*wt表示该帐号总的权重,评价一个帐号的权重可以从不同角度进行,比如帐号的影响力指数,兴趣指数等,不同指数各个变量的权重会有很大的不同,如影响力指数看重的粉丝数量f,转发次数r,点赞次数l,而兴趣指数则更看重发帖数量c,带有主题标签次数t。根据不同的指数,我们采取剔除某些与该指数不相关或者相关度低的参数,设定与指数相关度高的变量最小值等方法来计算不同指数下的权重排名。

第六步,针对不同指数排名下前n个帐号,我们利用第一步建立的帐号池中与主题对应的帐号采取不同的互动策略。比如影响力指数高的帐号一般是名人明星,我们可以转发并‘@’这些帐号,引起这些帐号的关注,将来可能获得这些帐号的转发或者‘@’来获得大量的粉丝。而对于兴趣指数比较高的帐号,我们可以直接加关注并发送一条共同关注内容的私信来直接获取对方的关注。

第七步,采取这些互动策略之后,过一段时间来检验我们帐号粉丝数量增长速度,以粉丝增长速度作为输出来对第四步进行反馈,动态调整第四步的参数,然后循环第四步到第七步,不断地对参数进行调整优化。

实际应用中,本技术以零广告营销成本,成功地为3000多个twitter主题账号在不到两年的时间内发展了累计超过1200万粉丝。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1