技术编号:13661331
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本申请涉及文本信息抽取技术领域,尤其涉及一种文本段落的抽取方法及装置。
背景技术
文本是书面语言的表现形式,从文学的角度,文本通常是具有完整、系统含义的一个或多个句子的组合。文本结构是一种天然的文本语义信息,可以辅助阅读者理解文本的层次。文本写作者通常使用视觉手段和语义手段相结合的方法来设计文本结构。视觉手段如字体样式、页面布局等,语义手段包括使用多级标题、区分标题和正文、段落顺序安排等。
从文本内容的语义手段来说,文本结构一般包括:文本标题、段落标题、...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。