技术编号:11627726
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及通信领域,特别涉及一种数据处理方法和设备。背景技术近些年,包括互联网搜索系统、自动导航系统、自动问答系统、机器翻译系统、语音识别系统等在内的智能系统取得了巨大进展,其背后是更深、更广、更新和更加准确的知识库的构建和使用。在构建领域知识库的过程中,往往需要从各种网站抓取数据,并从中过滤掉那些与领域知识库构建无关的页面,进而再从剩下的相关页面中抽取想要的领域对象加入到领域知识库中,从而完成领域知识库的构建。在过滤那些与领域知识库构建无关的页面的过程中,相关技术会通过URL规则进行匹配的方式...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。