一种古建墙壁题记受污毛笔文字图像聚类分割方法

文档序号:9350712阅读:493来源:国知局
一种古建墙壁题记受污毛笔文字图像聚类分割方法
【技术领域】
[0001] 本发明属于古建数字化修复领域,具体为一种既可滤除污染带来的噪声,又能保 证文字主体完整分割的古建墙壁题记受污毛笔文字图像聚类分割方法。
【背景技术】
[0002] 古建墙壁题记毛笔文字承载着大量历史信息,有很大的书法和历史研究价值。然 而由于自然风化和人为破坏,加之有些墨汁为动植物遗骸分解加工而成,易于霉变,题记文 字受到了不同程度的污染,有些甚至难以辨识,传统的实体去污修复在去除污染的同时容 易造成文字主体的损伤,带来不可逆的副作用。近年来,通过数字处理技术对采集的受污 文字图像进行聚类分割,从而排除污染对文字书法研究的干扰,成为古建文字研究的重点, 该处理技术可逆且具有非接触性,在提取文字、去除污染的同时,充分保证了题记实体的安 全。为书法研究和文字拓本的数字化存储提供了有力的科学支持,也为题记的实体去污修 复过程提供充足的科学指引和实验环境。
[0003] 目前的文字聚类分割方法主要有基于阈值的算法、基于模型的算法和基于划分的 算法等。基于阈值的聚类算法对阈值选取的依赖较强,而阈值的选取受噪声影响较大,算 法鲁棒性较差;基于模型的聚类算法,可充分利用文字的特征信息,但训练模型所需样本数 据量较大,且对先验样本要求较高,不适合小样本古建文字聚类;基于划分的聚类算法,如 k-means算法,能较好的排除差异性噪声对文字分割的影响,但对于灰度相近的块状污染噪 声滤除效果不佳,分割的文字主体不完整。上述方法对于文字区域污染较轻的题记图像聚 类效果较好,但当污染严重影响文字主体时,聚类的文字或存在缺损,或含有较多噪点。

【发明内容】

[0004] 本发明的目的在于提出一种结合区域定位和邻域核函数模糊C均值 (neighborhoodkernelfuzzyc_means,NKFCM)算法的聚类分割方法,以滤除文字周围和 文字区域存在的噪声,保证文字主体分割的完整性。
[0005] 本发明的核心思想是通过去噪、增强预处理和文字区域定位操作滤除文字周围的 噪声;利用邻域信息约束隶属度函数,滤除文字附近和文字内存在的噪声,保证文字主体分 割的完整性;通过构造核函数增大类间差异,更好地区分噪声和文字主体,得到完整的文字 区域。
[0006] 本发明一种古建墙壁题记受污毛笔文字图像聚类分割方法包括以下具体步骤:
[0007] Sl:利用数码相机采集题记毛笔文字图像,相机镜面与墙壁垂直放置,采集图像的 分辨率至少200dpi、尺寸1080X720像素以上;
[0008] S2 :构造偏微分扩散模型:ut=div(g(|G*Du|)*Du),对步骤Sl获得的图像进行去 噪处理,其中,g(x) =l/(l+(x/5)~2)为边缘扩散抑制函数,5为边缘参数,G为高斯函 数,Du为原始图像梯度,div为散度算子;
[0009] S3 :将步骤S2处理后图像进行分块处理,并对每一部分图像块进行灰度拉伸增强 处理,将图像灰度值范围映射到[0, 255],然后将图像块拼接为完整图像;
[0010] S4 :利用最大类间方差法对步骤S3中图像进行阈值分割,并通过形态学算法滤除 小面积噪声,连通文字,形成连通域;
[0011] S5:遍历步骤S4得到的连通域,确定各连通域的上下左右端点,并将端点所围矩 形以白色像素进行填充标记,得到每个文字区域的最小外接矩形;
[0012] S6 :在步骤S3处理后的图像中找到步骤S5定位的文字区域,利用FCM算法对文字 区域进行首次聚类,得到聚类中心矩阵和聚类数;
[0013]S7 :以文字区域每个像素点为中心构造尺寸为wXw像素的窗口,计算窗口内像素 与中心像素的平均灰度相似度以及像素点八邻域到聚类中心点的距离惩罚函数;
[0014]S8:将步骤S6得到的聚类中心和聚类数作为初始参数,通过步骤S7得到的平均灰 度相似度和距离惩罚函数修正隶属度函数,并利用核函数求取像素点到聚类中心的距离, 进行NKFCM聚类和去模糊操作后,得到最终聚类分割图像;
[0015]S9:将最终聚类分割结果保存或输出。
[0016] 进一步地,本发明所述步骤S7中所述的平均灰度相似度和距离惩罚函数的计算 按以下步骤进行:
[0017]S71:以文字区域每个像素点为中心构造尺寸为wXw像素的窗口WD(k),w取2到 10的整数,然后计算窗口内像素与中心像素的灰度相似度其中,k表示中 心像素点标志,j为窗口内像素点标志,i为类别标志,I为像素灰度值,通过求窗口内所有 点的灰度相似度的平均值得到该点的平均灰度相似度uk;
[0018]S72:给定类内距离判定阈值0,取值范围为[0,2552],求取每个像素八邻域点到 聚类中心的欧式距离,记为尤其中P为邻域标志,根据下式计算距离惩罚函数Ylk,num 为统计满足条件的邻域点数量的函数,N为满足条件的邻域点数量;
其中K(XkJ1)为核函数,y' 115为修正后的隶属度函数:#,/(sl ,K(XkJ1) = exp(-|Ixk-ViI|2/2 〇 2)。
[0021] 本发明与现有技术相比具有以下优点:
[0022] 1、本发明构造偏微分模型对图像进行去噪处理,滤除噪声并通过抑制函数减弱文 字边缘的平滑;同时通过分块增强处理,解决了由于背景灰度不均造成的暗区域细节不明 显的问题,利于后续聚类。
[0023] 2、本发明通过区域定位处理,将聚类过程限定在文字区域进行,一方面能有效排 除文字周围噪声的干扰,另一方面可以有效的提升聚类速度。
[0024] 3、本发明从噪点归属和保证文字主体完整的角度提出了NKFCM聚类算法,通过构 造灰度相似度和距离惩罚函数对FCM聚类的隶属度进行修正,利用邻域信息滤除文字附近 噪点,并解决文字中噪点的归属问题,保持分割完整性;并通过高斯核函数增大类间差异, 更好地分割污染和文字主体,得到完整的文字区域。
【附图说明】
[0025] 图1为发明流程图;
[0026] 图2为采集的题记毛笔文字图像;
[0027] 图3为偏微分方程去噪图像;
[0028] 图4为阈值分割后图像;
[0029] 图5为形态学处理图像;
[0030] 图6为文字区域定位图像;
[0031] 图7最终聚类分割图像;
[0032] 图8为文字轻度污染的聚类效果对比,图中(a)为题记文字图像,(b)为k-means 聚类效果图,(c)为传统FCM聚类效果图,(d)为本发明方法聚类效果图;
[0033] 图9为文字一般污染的聚类效果对比,图中(a)为题记文字图像,(b)为k-means 聚类效果图,(c)为传统FCM聚类效果图,(d)为本发明方法聚类效果图;
[0034] 图10为文字重度污染的聚类效果对比,图中(a)为题记文字图像,(b)为k-means 聚类效果图,(c)为传统FCM聚类效果图,(d)为本发明方法聚类效果图。
【具体实施方式】
[0035] 参照图1的流程图,以山西省晋祠博物院内八景题记文字为例,进行实验,具体实 施步骤如下:
[0036]Sl:利用数码相机采集题记毛笔文字图像,相机镜面与墙壁垂直放置,采集图像的 尺寸为1074X720像素,图2为采集的一幅题记图像实例;
[0037]S2:构造偏微分扩散模型,对步骤Sl获得的图像进行去噪处理,本发明构造的偏 微分方程如式(1):
[0038]Ut=div(g(IG*DuI)*Du) (I)
[0039] 式中,g(x) =l/(l+(x/5 ) ~2)为边缘扩散抑制函数,5为边缘参数,取值范围一 般为[0, 10],本例取S= 3,G为高斯函数,Du为原始图像梯度,div为散度算子,通过求解 上述偏微分方模型,得到去噪图像,图3为去噪图像;
[0040]S3:将步骤S2处理后图像进行分块处理,并对每一部分图像块进行灰度拉伸增强 处理,将图像灰度值范围映射到[0, 255],然后将图像块拼接为完整图像;
[0041]S4:利用最大类间方差法对步骤S3中图像进行阈值分割,并通过形态学算法滤除 小面积噪声,连通文字区域,形成连通域,图4为处理后图像;
[0042]S41:利用最大类间方差法对步骤S3中图像进行阈值分割,得到二值图像,阈值通 过类间方差的最大化迭代自适应获得;
[0043]S42:利用形态学算法对步骤S41得到的二值
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1