基于深度学习的网页正文抽取方法与流程

文档序号：24726821发布日期：2021-04-16 16:16阅读：来源：国知局

技术特征：
list压栈；遇到结束标签，并生成标签路径，同时马上进行判断；如果是正文，就压入keep list，如果不是，就不压入，并从前找到tag.symmetric进行删除，还原正文顺序。