技术编号:9631566
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。随着互联网技术的快速发展,每天各类互联网用户都在网上发布大量的Html (超文本标记语言)文档、图片和视频等文件,各种各样的爬虫引擎不停地从各类网站上抓取、分析和应用这些数据。目前,各类搜索引擎通过对Html文本进行分词等处理来支持网页检索。在政府采购领域,随着各级政府部门进一步加大政府信息公开力度,政府网站发布数据更加频繁、包含信息更加丰富,但由于缺乏特定业务模型和解析方法的支撑,各级部门的政府采购公告缺少统一格式、表述方式各异,现有的搜索引擎只是将这些...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。