基于数字图像处理的出土简帛字形图像的提取方法

文档序号:6379785阅读:335来源:国知局
专利名称:基于数字图像处理的出土简帛字形图像的提取方法
技术领域
本发明涉及一种属于出土文献研究、古文字研究和书法研究领域的借助Photoshop数字图像处理软件对出土简帛的字形图像进行分析提取的新方法,这里所说的出土简帛主要指战国时期的竹简、木牍以及帛书。
背景技术
出土文献中的简帛文献长期埋藏于地下,由于出土前所处环境的相对稳定,得以保持较为原始的面貌,它们中的大多经历了上千年的藏存,其可贵性不言而喻。近几十年来,随着出土简帛的数量增多,整理研究工作也日益精进。王国维曾说“古来新学问,大都由于新发现。有孔子壁中书出,而后有汉以来古文家之学;有赵宋古器出,而后有宋以来古 器物、古文字之学。”如此运用“地下之新材料”与古文献记载相量印证,以考证古代历史文化,成了一种公认的科学研究方法。同时,作为出土简帛中最为关键的古文字字形,也成为古文字学者、历史文献学者和书法研究者进行研究的基础性资料,为相关研究的重中之重。传统的出土简帛字形处理方法是临摹,即用传统的书写方式(毛笔、墨、宣纸)对出土简帛进行文字摹写。优点可以广泛地适用于出土文献的字形处理,缺点是由于临摹者的学养和书写水平的限制,其制作出的摹本具有很强的主观性和人为性,另外,在宣纸上书写与在简牍帛书上书写其材质肌理上尚有不同,无法有效地保留和表达字形的原始面貌。随着学者们对出土简帛和书法研究的不断深入,对于文字字形图像的要求也在不断提高。字形图像的处理已不仅仅停留在字形轮廓的清晰上,尤其是一些用毛笔书写的文字,更需要保留文字书写的原始细节图像。目前出土简帛资料整理过程主要是通过数字摄影技术获取其原始图像,然后利用图像处理技术,对照片进行裁切处理和简单的对比度调整,使单个文字字形独立,并在其背景中更加显现,增强其可辨性。这种方法无法将文字字形与其背景彻底分离,在处理过程中由于主要依赖对比度调整让一部分字形清楚可辨,对字形本身的原始图像细节以及其拥有的书法现象造成破坏,使文字字形图像大幅度失真。本发明中所利用数字图像处理技术是借助Photoshop数字图像处理软件进行实现的,Photoshop被定位于世界级专业的图像处理软件,是目前市场上以及业界所公认的标准图像处理软件。该图像处理软件系由美国Adobe公司所推出。

发明内容
本发明的目的是提供一种提取出土简帛字形图像的新方法,能够兼顾传统字形处理方法的优势,利用数字图像处理技术,在不损失文字字形图像细节的情况下,将单个文字字形与其背景彻底分离,对出土文献文字字形图像进行客观再现,以解决以往技术处理后的出土文献文字字形缺乏原始细节和书法现象以及字形的失真的问题。本发明的特征在于,I.本发明是在计算机中依次按以下步骤实现的步骤(I),计算机初始化
设置Photoshop数字图像处理软件,利用以下参数磁性套索工具中磁性套索的属性羽化值为0,添加“消除锯齿”功能,磁性套索选界点宽度为5px,对比度为10%,频率为100,构建基本笔划表的图像以及基本部首表的图像,并存储,步骤(2),依次按以下步骤提取出土简帛的字形图像步骤(2. 1),用CXD摄像机或数字式扫描仪获取出土简帛的数字图像,并把图像文件存储为TIFF格式,步骤(2. 2),打开所述Photoshop图像处理软件,并执行“文件——打开”命令打开所要处理的出土简帛图像文件,采取以下两种方法中的任何一种方法对所述出土简帛数字 图像中需要提取的文字字形进行单个裁剪方法一执行“工具栏一矩形选框工具”命令,按照每个不同文字的字形设定矩形选框的长、宽比,把所需要的单个文字图像选在所述矩形选框中,然后再执行图像裁切命令,保留所述矩形选框内的图像同时删掉所述矩形选框外的图像,方法二 执行“工具栏——裁剪工具”命令选择裁剪工具用鼠标生成一个能把单个文字的完整笔画框定的矩形裁剪区域,完成所需的裁剪,步骤(2. 3),在完整保存笔画墨迹的图像信息条件下,按以下步骤实现文字的笔划墨迹与简帛背景之间的层次化,步骤(2. 3. I ),执行“图像一模式一RGB颜色”命令把已裁剪的单个文字图像设置为RGB颜色模式,步骤(2. 3. 2),执行“图像一调整一去色”命令把单个文字的彩色图像转化为相同模式下的灰度图像,步骤(2. 3. 3),执行“图像一调整一色阶”命令调出色阶对话框,选择RGB通道,把其中显示出来的峰值区域下侧的黑色控制点拉动到左侧所述峰值区域起始处,把白色控制点拉动到所述峰值区域右侧起始处,再点击确定按钮重新分布色阶,步骤(2. 3. 4),执行“窗口一信息”命令调出信息面板,使鼠标在画面上笔划墨迹和简帛背景之间移动,观察到笔划墨迹与简帛背景二者间的RGB色彩值在255个色阶亮度内相差50个色阶亮度以上,笔划墨迹层次已经拉开,并且在选定的黑白范围内按原比例作灰度值的重新分布,同时也完整地保留了笔划墨迹在原图中的图像信息,步骤(2. 4),利用Photoshop的磁性套索工具,依据所述的基本笔划表和基本部首表,按以下步骤把一个部首内的文字笔划轮廓与简帛背景进行区分,并删除属于简帛背景区的图像,保留属于该部首选区内的所有笔划图像,步骤(2. 4. 1),执行“工具栏一磁性套索工具”命令,选择所述的磁性套索工具,设置步骤(I)所述的属性栏,选择“添加到选区”功能,所述选区指基本笔划选区和基本部首选区步骤(2. 4. 2),用鼠标点击任何一个基本部首内笔划墨迹与简帛背景的临界点以此作为起点,沿笔划轮廓拖动一周,生成该部首中的笔划的选区,步骤(2. 4. 3),沿着一个文字图形中相邻两个基本部首在同一笔划起点上的笔划重复处衔接起来,形成由各个基本部首组成的单个文字图形,
步骤(2. 4. 4),对一个文字字形图像中的所有基本部首重复步骤(2. 4. 2),得到各个部首中所有笔划的选区,步骤(2. 4. 5),执行“选择一反向”命令,实现图像反选,并删除每个部首选区内的非笔划墨迹图像,保留每个部首选区内的笔划墨迹图像,以供不同用途的需求进行后续处理。2.根据特征I所述的步骤,在步骤(2. 4)中,用“套索工具”或者“多边形套索工具”或者“钢笔工具”或者“自由钢笔工具”代替“磁性套索工具”。本发明的优点和积极效果在于将出土文献文字字形与其背景彻底分离,呈现出既保留原始信息又清晰可辨的字形图像,通过这种新方法处理的文字字形可以为研究者提供更为准确生动的研究资料,也可以使出土文献的文字字形在出版印刷、美术设计等领域得到更为广泛的应用。


图1,系本发明所提的利用Photoshop裁切工具生成包含单个文字的完整笔划的字形图像。图2,系本发明所提的利用Photoshop的色阶工具,在不损失笔划墨迹的图像信息的情况下,实现文字的笔划墨迹与简帛背景之间的层次更加鲜明。图3,系本发明所提的利用Photoshop的套索工具,将文字笔划轮廓与背景通过选区进行区分。图4,系本发明所提的删除属于背景选取内的图像,保留属于笔划选取内的图像。图5,系本发明所提的对保留下来的文字字形图像加入白色背景处理。图6,系本发明所提的文字字形提取前后的图像效果对比。图7,系本发明的程序流程图。
具体实施例方式为实现上述目的,本发明至少包含下列步骤I、通过数字摄影或数字扫描手段获取出土简帛的数字图像。数字摄影手段主要指利用彩色数码相机或者红外线数码相机对出土简帛进行拍照,以获取出土简帛的原始数字图像文件;数字扫描手段主要指利用彩色数码扫描仪或者红外线数码扫描仪对出土简帛进行扫描,以获取出土简帛的原始数字图像文件。将获取的数字图像存储为Photoshop图像处理软件可读取的文件格式。Photoshop可读取的全部文件格式有 Photoshop (*· PSD; *· PDD)3D Studio (*· 3DS)BMP (*· BMP; *· RLE; *· DIB)Camera Raw (*· TIF; *· CRff; *· NEF; *· RAF)Cineon (*· CIN; *· SDPX; *· DPX; *· FIDO)Col Iada (*· DAE)CompuServe Gif (*. GIF)Dicom(*· DCM;*· DC3 ;*· DIC)
Photoshop EPS (*· EPS)Photoshop DCS I. 0 (*· EPS) Photoshop DCS2. 0 (*· EPS)EPS TIFF 预览(*· EPS)Filmstrip (*· FLM)Google Earth4 (*· KMZ)IEF(*. IEF;*. TDI)JPEG (*· JPG; *· JPEG; *· JPE) Open EXR(*.EXR)PCX (*· PCX)Photoshop PDF (*· PDF; *· PDP)Photoshop Raw(*. RAW)PICT (*· PCT ;*· PICT)Pixar (*.PXR)PNG (*· PNG)QuickTime 影片(*· MOV ;*· AVI; *· MPG)Radiance (*· HDR; *· RGBE; *· XYZE)Scitex CT (*· SCT)Targe (*· TGA; *· VDA; *· ICB; *· VST)TIFF (*· TIF ;*· TIFF)U3D (*· U3D)Wavefront OBJ (*· OBJ)便携位图(*·PBM;*. PGM;*· PPM;*· PNM)大型文档格式(*· PSB)通用EPS (*· AI3; *· AI4; *· AI5; *· AI6 ; *· AI7)无线位图(*·WBM;*. WBMP)其中较为常用的图像格式有Photoshop (*· PSD; *· PDD)JPEG (*· JPG; *· JPEG; *· JPE)Photoshop PDF (*· PDF; *· PDP)TIFF (*· TIF ;*· TIFF)2、打开Photoshop图像处理软件,通过执行“文件一打开”命令,打开所要处理的简帛图像文件,对图像中需要提取的文字字形进行单个裁剪。裁剪的具体方法有两种。一种是通过执行“工具栏——矩形选框工具(默认快捷键M)”命令选择矩形选框工具(在矩形选框属性菜单中进行设置点击新选区,羽化值为Ορχ,样式为正常),将要提取的单个文字图像框选在矩形选框中(矩形选框的长宽比例要根据每个不同文字字形而定,操作者根据肉眼观察即可选定,出土简帛中的每个古文字整体构形趋向于矩形,利用这一选框工具可以将单个文字的完整笔画包含在一个矩形的画面中),然后通过执行“图像一裁剪”命令,保留选区内的图像,同时删裁掉其余图像,完成所需裁剪。第二种方法通过执行“工具栏一裁剪工具”选择裁剪工具,在需要提取的文字字形图像附近按住鼠标左键并拖动,裁剪工具会生成一个矩形的裁剪区域(区域四周有8个控制点可以调整该矩形的位置及长宽比例,操作者仍可通过观察,将单个文字的完整笔划利用控制点框选在矩形的裁剪区域内),单击回车键即可完成所需裁剪。3、在不损失笔划墨迹的图像信息的情况下,实现文字的笔划墨迹与简帛背景之间的层次更加鲜明。执行“图像——模式——RGB颜色”命令,将已裁剪的单个文字图像设置为RGB颜色模式。由于出土简帛上的文字绝大部分是用黑色的古墨书写,其笔划墨迹的色彩信息在灰度分辨率上体现得较为充分,通过执行“图像——调整——去色(默认快捷键Ctrl+Shilf+U)”命令,将彩色图像转化为相同模式下的灰度图像(给RGB图像中的每个像素指定相等的红色、绿色和蓝色值,使图像表现为灰度,每个像素的明度值不改变)。执行 “图像一调整一色阶(默认快捷键Ctrl+L)”命令,调出色阶对话框(选择RGB通道),观察并调整输入色阶直方图的分布状况(这里看到的直方图整体呈单个“山峰”或丘陵状,直方图下有3个控制点,分别代表“黑色” “中间色”和“白色”,其中黑色亮度值为0,白色亮度值为255,操作者须将黑色控制点向右拉动至“山峰”左侧初起处,将白色控制点向左拉动至“山峰”右侧初起处,将整个“山峰”夹在黑白控制点中间,若其中一点已在规定位置,则不予调整),点击确定按钮重新分布色阶。此时我们可以通过执行“窗口——信息(默认快捷键F8)”命令,调出信息面板,通过鼠标在画面上笔划墨迹与简帛背景之间的移动,观察二者之间的RGB色彩值相差50个单位以上,层次既已拉开。这种调整主要是将笔划墨迹在选定的黑白范围按原比例作灰度值的重新分布,不会损失原图中笔划墨迹的图像信息。4、利用Photoshop的磁性套索工具,将构成单个文字的各部首内所有笔划轮廓与背景通过选区进行区分,并删除属于背景选区内的图像,保留属于笔划选区内的图像。执行“工具栏——磁性套索工具(默认快捷键L)”命令,选择磁性套索工具(设置磁性套索的属性栏羽化值为0,勾选消除锯齿功能,选界点宽度为5px,对比度为10%,频率为100),勾选“添加到选区”功能。用鼠标点击任何一个基本部首内笔划墨迹与简帛背景的临界点以此作为起点,沿笔划轮廓拖动一周,生成该部首中的笔划的选区。沿着一个文字图形中相邻两个基本部首在同一笔划起点上的笔划重复处衔接起来,形成由各个基本部首组成的单个文字图形。通常一个字形图像由若干个基本部首构成,而每个基本部首又由若干个基本笔划构成,其中每个部首和笔划均可用上述方法进行选区的建立(在累加建立选区之前设置磁性套索的属性栏选择“添加到选区”按钮),直至画面中的所有笔划墨迹都被收入建立的选区中(在建立部首选区过程中可以通过“添加到选区”按钮进而补充未选中的细节,也可通过“从选区中减去”按钮删减多余选区)。关于笔划轮廓选区的建立有两方面内容需要注意。一方面,简帛文字为手写体,拥有复杂的笔划现象,因而操作者须至少了两点简帛文字的基本构形知识,方可完成上述选区的建立。第一点须要掌握出土简帛文字书写的基本笔划(详见表I :基本笔划图表);第二点是出土简帛文字通常由若干个部首独立或组合而成,须要掌握目前所见到基本部首(详见表2:基本部首图表)。另一方面,对photoshop软件掌握熟练的操作者,也可以用“套索工具”或者“多边形套索工具”或者“钢笔工具”或者“自由钢笔工具”代替所述“磁性套索工具”,按照上述方法原理,实现文字笔划选区的建立。通过以上方法使选区建立完成后,执行“选择一反向(默认快捷键Ctrl+Shift+I)”命令,实现图像反选,点击Delete键执行删除命令,这样就保留了笔划墨迹图像,删除了非笔划墨迹图像。5、根据不同的用途需要对保留下来的文字字形图像进一步处理。目前,出土简帛文字字形图像以收录于各种字编为基本用途,可以执行“图层——新建”命令,在已有的文字图像图层下,新建一个白色图层,使该文字处理后的字形图像效果有如写在白色宣纸上
一样清晰。下面将以一个具体实例详细说明本发明的可行性和实施本发明的最好的具体方式。第一步通过数字摄影或数字扫描手段获取出土文献的数字图像,图像存储的文件格式为Photoshop图像处理软件可读取的格式,以下列四种格式为宜Photoshop (*· PSD; *· PDD) JPEG (*· JPG; *· JPEG; *· JPE)Photoshop PDF (*· PDF; *· PDP)TIFF (*· TIF ;*· TIFF)此实例是利用数码相机获取出土竹简照片,将图像文件存储为TIFF格式。第二步打开Photoshop图像处理软件,执行“文件一打开”命令,打开所要处理的图像文件。此实例要提取竹简上的“武”字。执行“工具栏——裁剪工具”选择裁剪工具,在该字形图像附近按住鼠标左键并拖动,裁剪工具旋即生成一个矩形的裁剪区域,用鼠标左键分别选中并拖拉裁切区域四周的8个控制点,调整该矩形的位置及长宽比例,使该字形整体框选在矩形的裁剪区域内,单击回车键完成所需裁剪。参阅图1,裁切后的图像包含该文字的完整笔划墨迹。第三步执行“图像——模式——RGB颜色”命令,将该图像设置为RGB颜色模式。然后,执行“图像一调整一去色(默认快捷键Ctrl+Shilf+U)”命令,将彩色图像转化为相同模式下的灰度图像,接下来执行“图像——调整——色阶(默认快捷键Ctrl+L)”命令,调出色阶对话框(选择RGB通道),观察并调整输入色阶直方图的分布状况,左侧的黑色控制点已处在“山峰”初起点处,故不做调整,将右侧白色控制点向左拉动至横坐标82处,此时整个“山峰”夹在黑白控制点中间,参看图2,点击确定按钮重新分布色阶。我们可以通过执行“窗口一信息(默认快捷键F8)”命令,调出信息面板,可以观察到画面上笔划墨迹的RGB色彩值在绝大部分在40-70色阶亮度范围内,而竹简背景的RGB色彩值在绝大部分在90-180色阶亮度范围内,二者相差50个色阶亮度以上,层次既已拉开。用肉眼观察,这种色彩变化是比较明显的。第四步分析“武”字的字形是由“戈”和“止”两个部首按上下结构组合而成,可参看附录2第0211号和1214号的图样进行笔划选区建立。执行“工具栏——磁性套索工具(默认快捷键L)”命令,选择磁性套索工具(设置磁性套索的属性栏羽化值为0,勾选消除锯齿功能,选界点宽度为5px,对比度为10%,频率为100),点击字形右上方笔划墨迹与简帛背景的临界点为起点,沿笔划轮廓拖动一周,生成该字横划的选区。接着设置磁性套索的属性栏选择“添加到选区”按钮,按照上述方法完成“戈”部首图形的选区建立和“止”部首图像形选区的建立。参看图3,将“武”字的所有笔划墨迹都被收入建立的选区中。第五步执行“选择一反向(默认快捷键Ctrl+Shift+I)”命令,实现图像反选,点击Delete键执行删除命令,参看图4,这样就保留了笔划墨迹图像,删除了非笔划墨迹图像。第六步根据出版出土简帛文字字形编的实际需要,执行“图层一新建”命令,在已有的文字图像图层下,新建一个图层,并将其背景设置为白色。操作完成后,该字形图像效果有如写在白色宣纸上一样清晰。本发明所提取字形的效果参阅图6,虽然以前述的较佳的具体实例揭露如上,然其并非用以限定本发明,故任何熟悉于此技艺者,在不脱离本发明的精神和范围内当可做些相应变更与润饰。同时,本发明所包括的基本笔画图表和基本部首图标亦在发明范围内。利用本发明所提取的文字字形图像得到了业界学者的广泛肯定,可以在出土文献研究和书法研究领域得到广泛地应用。表I :基本笔划图表 "^^1 笔划图样序号笔划图样
权利要求
1.基于数字图像处理的出土简帛字形图像的提取方法,其特征在于,是在计算机中依次按以下步骤实现的 步骤(I),计算机初始化 设置=Photoshop数字图像处理软件, 利用以下参数 磁性套索工具中磁性套索的属性羽化值为0,勾选“消除锯齿”功能,磁性套索选界点宽度为5px,对比度为10%,频率为100, 构建基本笔划表的图像以及基本部首表的图像,并存储, 步骤(2),依次按以下步骤提取出土简帛的字形图像 步骤(2. 1),用CCD摄像机或数字式扫描仪获取出土简帛的数字图像,并把图像文件存储为TIFF格式, 步骤(2. 2),打开所述Photoshop图像处理软件,并执行“文件一打开”命令打开所要处理的出土简帛图像文件,采取以下两种方法中的任何一种方法对所述出土简帛数字图像中需要提取的文字字形进行单个裁剪 方法一执行“工具栏一矩形选框工具”命令,按照每个不同文字的字形设定矩形选框的长、宽比,把所需要的单个文字图像选在所述矩形选框中,然后再执行图像裁切命令,保留所述矩形选框内的图像同时删掉所述矩形选框外的图像, 方法二 执行“工具栏——裁剪工具”命令选择裁剪工具用鼠标生成一个能把单个文字的完整笔画框定的矩形裁剪区域,完成所需的裁剪, 步骤(2. 3),在完整保存笔画墨迹的图像信息条件下,按以下步骤实现文字的笔划墨迹与简帛背景之间的层次化, 步骤(2. 3.1),执行“图像——模式——RGB颜色”命令把已裁剪的单个文字图像设置为RGB颜色模式, 步骤(2. 3. 2),执行“图像一调整一去色”命令把单个文字的彩色图像转化为相同模式下的灰度图像, 步骤(2. 3. 3),执行“图像一调整一色阶”命令调出色阶对话框,选择RGB通道,把其中显示出来的峰值区域下侧的黑色控制点拉动到左侧所述峰值区域起始处,把白色控制点拉动到所述峰值区域右侧起始处,再点击确定按钮重新分布色阶, 步骤(2. 3. 4),执行“窗口一信息”命令调出信息面板,使鼠标在画面上笔划墨迹和简帛背景之间移动,观察到笔划墨迹与简帛背景二者间的RGB色彩值在255个色阶亮度内相差50个色阶亮度以上,笔划墨迹层次已经拉开,并且在选定的黑白范围内按原比例作灰度值的重新分布,同时也完整地保留了笔划墨迹在原图中的图像信息, 步骤(2. 4),利用Photoshop的磁性套索工具,依据所述的基本笔划表和基本部首表,按以下步骤把一个部首内的文字笔划轮廓与简帛背景进行区分,并删除属于简帛背景区的图像,保留属于该部首选区内的所有笔划图像, 步骤(2. 4. 1),执行“工具栏——磁性套索工具”命令,选择所述的磁性套索工具,设置步骤(I)所述的属性栏,选择“添加到选区”功能,所述选区指基本笔划选区和基本部首选区步骤(2. 4. 2),用鼠标点击任何一个基本部首内笔划墨迹与简帛背景的临界点以此作为起点,沿笔划轮廓拖动一周,生成该部首中的笔划的选区,步骤(2. 4. 3),沿着一个文字图形中相邻两个基本部首在同一笔划起点上的笔划重复处衔接起来,形成由各个基本部首组成的单个文字图形, 步骤(2. 4. 4),对一个文字字形图像中的所有基本部首重复步骤(2. 4. 2),得到各个部首中所有笔划的选区, 步骤(2. 4. 5),执行“选择一反向”命令,实现图像反选,并删除每个部首选区内的非笔划墨迹图像,保留每个部首选区内的笔划墨迹图像,以供不同用途的需求进行后续处理。
2.根据权利要求I所述的基于数字图像处理的出土简帛字形图像的提取方法,其特征在于,在步骤(2. 4)中,用“套索工具”或者“多边形套索工具”或者“钢笔工具”或者“自由钢笔工具”代替“磁性套索工具”。
全文摘要
基于数字图像处理的出土简帛字形图像的提取方法属于出土简帛的计算机图像处理技术领域,其特征在于,利用Photoshop数字图像处理软件提取出土简帛的数字图像,依次进行文字字形的单个截取、单个文字的笔划墨迹与简帛背景之间按原比例灰度值的重新分布、利用独到的基本笔划表和基本部首表区分出单个文字的部首选区以及每个部首内的笔划选区并保留每个部首选区内的所有笔划图像、删除非笔划墨迹图像的步骤,实现单个文字图像的提取。本发明以基本部首分离为基础,实现出土简帛文字字形与简帛背景的彻底分离,呈现出既保留文字原始信息又清晰可辨的字形图像,解决了当前利用传统的书写方式对出土简帛进行临摹所带来的大幅度图像失真的技术问题。
文档编号G06T7/00GK102968789SQ201210414370
公开日2013年3月13日 申请日期2012年10月25日 优先权日2012年10月25日
发明者贾连翔 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1