技术总结
本发明公开了一种基于互联网的数据提取方法,本发明包括如下步骤:(1)设置关键词;(2)选择搜索引擎;(3)在各搜索引擎检索设置的关键词,获取检索数据,建立第一数据库;(4)建立重复数据处理模块,利用该模块比较第一数据库的数据,选取第一数据库中第一条数据,将第一条数据与第一数据库中其它数据相比较,删除与第一条数据相同的数据,依该方法遍历第一数据库中所有数据;获得第二数据库;(5)建立数据分类模块,将第二数据库的数据分成多个小类,每个小类数据建立一个第三数据库。本发明所提取的数据能够准确的贴近关键词,数据即全面又不会重复。
技术研发人员:林慧吉
受保护的技术使用者:上海沃月信息科技有限公司
文档号码:201510880796
技术研发日:2015.12.04
技术公布日:2017.06.13