技术编号:11774740
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及网页分割技术领域,具体而言,涉及一种网页分割方法、装置及电子设备。背景技术目前提出了很多网页分割算法,例如微软亚洲研究院提出了一种基于视觉特征的网页分割方法(VIPS)首先将整个网页表示成一棵DOM树,根据颜色大小等网页版面特征,利用横竖线条将DOM树节点所对应的分块在网页中分隔开来,构成网页的标准分块。每个节点通过一致度(DOC)来衡量它与其他节点的语义相关性,从而将相关的分块聚集在一起;利用预先设定的一致度(PDOC)作为阈值控制分割粒度,当所有网页的DOC都不小于PDOC时,网页...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。