技术特征:
技术总结
本发明属于破碎文档拼接技术领域,公开了一种基于DFS与改进中心聚类法的破碎文档拼接方法,包括:使用相似度进行拼接,再基于差异度进行纠错;基于改进中心聚类法以及DFS复原拼接算法,并在DFS拼接复原算法中综合相似度、差异度、留黑阈值参数来充分挖掘两张碎片的匹配程度。本发明进一步降低了人为因素,并取得了很好的聚类效果;使用相似度进行拼接,再基于差异度进行纠错;避开遗传算法,增加了算法的正确率。本发明通过推导阈值范围公式使得中心聚类法效果更好,并在DFS拼接复原算法中综合相似度、差异度、留黑阈值等参数来充分挖掘两张碎片的匹配程度,进一步降低了人工干预次数。
技术研发人员:李玲娜;杨丰祥;彭凯巍;唐瑞
受保护的技术使用者:西南石油大学
技术研发日:2017.06.06
技术公布日:2017.10.03