一种基于文本选取模型的无监督文本定位方法与流程

文档序号：15689047发布日期：2018-10-16 21:39阅读：来源：国知局

技术特征：

技术总结
本发明公开了一种基于文本选取模型的无监督文本定位方法。本发明通过SLIC和DBSCAN图像分割生成若干个超像素，并创新地将超像素区域作为文本候选区域，解决了候选区域在数量和精度上的平衡；其次，本发明利用同一张图中文本对象之间的相似性建立文本选取模型，生成样本参考图，其中，样本参考图包括强文本图和非文本图，并以样本参考图为依据，通过双阈值机制自适应地提取以超像素为单位的文本样本，避免了传统算法对于数据库的依赖性；最后，通过文本样本训练得到文本分类器并对超像素区域进行文本/非文本分类；该方法召回率高，避免了传统算法中依赖数据库、通用性较差、候选区域数量爆炸的问题，实现了无监督的文本定位目标。

技术研发人员：孔军;孙金花;蒋敏;侯健
受保护的技术使用者：江南大学
技术研发日：2018.04.18
技术公布日：2018.10.16

完整全部详细技术资料下载

当前第2页1 2