一种古建墙壁题记受污毛笔文字图像聚类分割方法

文档序号：9350712阅读：493来源：国知局

一种古建墙壁题记受污毛笔文字图像聚类分割方法
【技术领域】
[0001] 本发明属于古建数字化修复领域，具体为一种既可滤除污染带来的噪声，又能保证文字主体完整分割的古建墙壁题记受污毛笔文字图像聚类分割方法。
【背景技术】
[0002] 古建墙壁题记毛笔文字承载着大量历史信息，有很大的书法和历史研究价值。然而由于自然风化和人为破坏，加之有些墨汁为动植物遗骸分解加工而成，易于霉变，题记文字受到了不同程度的污染，有些甚至难以辨识，传统的实体去污修复在去除污染的同时容易造成文字主体的损伤，带来不可逆的副作用。近年来，通过数字处理技术对采集的受污文字图像进行聚类分割，从而排除污染对文字书法研究的干扰，成为古建文字研究的重点，该处理技术可逆且具有非接触性，在提取文字、去除污染的同时，充分保证了题记实体的安全。为书法研究和文字拓本的数字化存储提供了有力的科学支持，也为题记的实体去污修复过程提供充足的科学指引和实验环境。
[0003] 目前的文字聚类分割方法主要有基于阈值的算法、基于模型的算法和基于划分的算法等。基于阈值的聚类算法对阈值选取的依赖较强，而阈值的选取受噪声影响较大，算法鲁棒性较差；基于模型的聚类算法，可充分利用文字的特征信息，但训练模型所需样本数据量较大，且对先验样本要求较高，不适合小样本古建文字聚类；基于划分的聚类算法，如 k-means算法，能较好的排除差异性噪声对文字分割的影响，但对于灰度相近的块状污染噪声滤除效果不佳，分割的文字主体不完整。上述方法对于文字区域污染较轻的题记图像聚类效果较好，但当污染严重影响文字主体时，聚类的文字或存在缺损，或含有较多噪点。

【发明内容】

[0004] 本发明的目的在于提出一种结合区域定位和邻域核函数模糊C均值 (neighborhoodkernelfuzzyc_means，NKFCM)算法的聚类分割方法，以滤除文字周围和文字区域存在的噪声，保证文字主体分割的完整性。
[0005] 本发明的核心思想是通过去噪、增强预处理和文字区域定位操作滤除文字周围的噪声；利用邻域信息约束隶属度函数，滤除文字附近和文字内存在的噪声，保证文字主体分割的完整性；通过构造核函数增大类间差异，更好地区分噪声和文字主体，得到完整的文字区域。
[0006] 本发明一种古建墙壁题记受污毛笔文字图像聚类分割方法包括以下具体步骤：
[0007] Sl:利用数码相机采集题记毛笔文字图像，相机镜面与墙壁垂直放置，采集图像的分辨率至少200dpi、尺寸1080X720像素以上；
[0008] S2 :构造偏微分扩散模型：ut=div(g(|G*Du|)*Du)，对步骤Sl获得的图像进行去噪处理，其中，g(x) =l/(l+(x/5)~2)为边缘扩散抑制函数，5为边缘参数，G为高斯函数，Du为原始图像梯度，div为散度算子；
[0009] S3 :将步骤S2处理后图像进行分块处理，并对每一部分图像块进行灰度拉伸增强处理，将图像灰度值范围映射到[0, 255]，然后将图像块拼接为完整图像；
[0010] S4 :利用最大类间方差法对步骤S3中图像进行阈值分割，并通过形态学算法滤除小面积噪声，连通文字，形成连通域；
[0011] S5:遍历步骤S4得到的连通域，确定各连通域的上下左右端点，并将端点所围矩形以白色像素进行填充标记，得到每个文字区域的最小外接矩形；
[0012] S6 :在步骤S3处理后的图像中找到步骤S5定位的文字区域，利用FCM算法对文字区域进行首次聚类，得到聚类中心矩阵和聚类数；
[0013]S7 :以文字区域每个像素点为中心构造尺寸为wXw像素的窗口，计算窗口内像素与中心像素的平均灰度相似度以及像素点八邻域到聚类中心点的距离惩罚函数；
[0014]S8:将步骤S6得到的聚类中心和聚类数作为初始参数，通过步骤S7得到的平均灰度相似度和距离惩罚函数修正隶属度函数，并利用核函数求取像素点到聚类中心的距离，进行NKFCM聚类和去模糊操作后，得到最终聚类分割图像；
[0015]S9:将最终聚类分割结果保存或输出。
[0016] 进一步地，本发明所述步骤S7中所述的平均灰度相似度和距离惩罚函数的计算按以下步骤进行：
[0017]S71:以文字区域每个像素点为中心构造尺寸为wXw像素的窗口WD(k)，w取2到 10的整数，然后计算窗口内像素与中心像素的灰度相似度其中，k表示中心像素点标志，j为窗口内像素点标志，i为类别标志，I为像素灰度值，通过求窗口内所有点的灰度相似度的平均值得到该点的平均灰度相似度uk;
[0018]S72:给定类内距离判定阈值0，取值范围为[0,2552]，求取每个像素八邻域点到聚类中心的欧式距离，记为尤其中P为邻域标志，根据下式计算距离惩罚函数Ylk，num 为统计满足条件的邻域点数量的函数，N为满足条件的邻域点数量；
其中K(XkJ1)为核函数，y' 115为修正后的隶属度函数：#,/(sl ，K(XkJ1) = exp(-|Ixk-ViI|2/2 〇 2)。
[0021] 本发明与现有技术相比具有以下优点：
[0022] 1、本发明构造偏微分模型对图像进行去噪处理，滤除噪声并通过抑制函数减弱文字边缘的平滑；同时通过分块增强处理，解决了由于背景灰度不均造成的暗区域细节不明显的问题，利于后续聚类。
[0023] 2、本发明通过区域定位处理，将聚类过程限定在文字区域进行，一方面能有效排除文字周围噪声的干扰，另一方面可以有效的提升聚类速度。
[0024] 3、本发明从噪点归属和保证文字主体完整的角度提出了NKFCM聚类算法，通过构造灰度相似度和距离惩罚函数对FCM聚类的隶属度进行修正，利用邻域信息滤除文字附近噪点，并解决文字中噪点的归属问题，保持分割完整性；并通过高斯核函数增大类间差异，更好地分割污染和文字主体，得到完整的文字区域。
【附图说明】
[0025] 图1为发明流程图；
[0026] 图2为采集的题记毛笔文字图像；
[0027] 图3为偏微分方程去噪图像；
[0028] 图4为阈值分割后图像；
[0029] 图5为形态学处理图像；
[0030] 图6为文字区域定位图像；
[0031] 图7最终聚类分割图像；
[0032] 图8为文字轻度污染的聚类效果对比，图中（a)为题记文字图像，（b)为k-means 聚类效果图，（c)为传统FCM聚类效果图，（d)为本发明方法聚类效果图；
[0033] 图9为文字一般污染的聚类效果对比，图中（a)为题记文字图像，（b)为k-means 聚类效果图，（c)为传统FCM聚类效果图，（d)为本发明方法聚类效果图；
[0034] 图10为文字重度污染的聚类效果对比，图中（a)为题记文字图像，（b)为k-means 聚类效果图，（c)为传统FCM聚类效果图，（d)为本发明方法聚类效果图。
【具体实施方式】
[0035] 参照图1的流程图，以山西省晋祠博物院内八景题记文字为例，进行实验，具体实施步骤如下：
[0036]Sl:利用数码相机采集题记毛笔文字图像，相机镜面与墙壁垂直放置，采集图像的尺寸为1074X720像素，图2为采集的一幅题记图像实例；
[0037]S2:构造偏微分扩散模型，对步骤Sl获得的图像进行去噪处理，本发明构造的偏微分方程如式（1):
[0038]Ut=div(g(IG*DuI)*Du) (I)
[0039] 式中，g(x) =l/(l+(x/5 ) ~2)为边缘扩散抑制函数，5为边缘参数，取值范围一般为[0, 10]，本例取S= 3，G为高斯函数，Du为原始图像梯度，div为散度算子，通过求解上述偏微分方模型，得到去噪图像，图3为去噪图像；
[0040]S3:将步骤S2处理后图像进行分块处理，并对每一部分图像块进行灰度拉伸增强处理，将图像灰度值范围映射到[0, 255]，然后将图像块拼接为完整图像；
[0041]S4:利用最大类间方差法对步骤S3中图像进行阈值分割，并通过形态学算法滤除小面积噪声，连通文字区域，形成连通域，图4为处理后图像；
[0042]S41:利用最大类间方差法对步骤S3中图像进行阈值分割，得到二值图像，阈值通过类间方差的最大化迭代自适应获得；
[0043]S42:利用形态学算法对步骤S41得到的二值

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨风暴;吉琳娜;刘英杰;王肖霞;李大威;赵艳霞;
技术所有人：中北大学;
我是此专利的发明人

上一篇：基于编码网格模板的结构光动态场景深度获取方法
上一篇：基于一致性函数空间映射的图像联合分割算法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。