基于脚本引擎的微博用户关系采集方法与流程

文档序号:11807961阅读:来源:国知局
技术总结
本发明涉及信息采集技术领域,公开了一种基于脚本引擎的微博用户关系采集方法,该方法包括步骤:S1,采用脚本引擎技术自动登录微博客网站;S2,采用网页采集方式对特定账户信息爬取其对应内容页面信息;S3,元数据解析,获取用户列表、用户行为机制及用户基本信息;S4,实现用户关系抽取;S5,使用广度优先遍历用户列表,丰富用户关联关系。本发明提供的采集方法克服了API访问限制问题,有利于微博客信息的规模化采集,同时也提高了信息采集的精确度。

技术研发人员:都云程
受保护的技术使用者:北京拓尔思信息技术股份有限公司
文档号码:201210114869
技术研发日:2012.04.17
技术公布日:2016.12.07

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1