技术编号:6545599
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明提出,并基于此提出链接块判别和评价指标,同时结合区块树提出正向链接块判别和逆向链接块判别两种基本的区块遍历和判别算法;正向判别法识别速度快,链接块粒度大,可用于对索引类型Web页面的分析及文本抽取应用中;逆向判别法能轻松灵活的控制链接块的粒度大小和数量规模,保障链接块的精细化和完整性,从而最终实现链接块对页面链接覆盖的全面性,该方法既可用于对链接块要求粒度细腻的场合,也可用于页面去噪、文本提取、页面抽取模板自动生成等场合;本发明所提出的区块树作为We...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。