技术编号:9810593
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。专利说明网页正文提取比对方法及其系统方法领域 本发明涉及计算机网络技术方法及其系统,特别涉及一种网页正文提取比对方法 及其系统。 背景方法 网页正文提取方法有很多,其中有专门针对评论网页或者新闻网页的方法,但是 本发明所讨论的是针对大部分通用网页的正文提取方法。总的说来,目前主要的网页正文 提取方法有以下几个方向基于D0M的网页正文提取方法、基于统计的网页正文提取方法、 基于分块的网页正文提取方法及其他网页正文提取方法。 文档对象模型(Document O...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。