技术编号:6459260
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明是一种网络信息采集技术,具体涉及一种网页结构化数据提取的系统和方法,属 于网络信息。 背景技术随着网络信息技术的发展,网站、论坛、博克等网页信息越来越大,搜索引擎、内容分 析、舆情分析等技术都是对这些信息进行某种分析处理的,它们都用到了网络爬虫这一种技 术。网络爬虫,又名网络掩蛛,是一种对网页连接进行自动分析,并自动获取信息存储到本 地的数据釆集方法。目前,不仅仅搜索引擎,还有很多的应用将网络爬虫作为数据采集的主 要来源,如网络内容智能化分析;不仅仅...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。