一种汉字视力表视标的选择方法

文档序号:1226989阅读:422来源:国知局
专利名称:一种汉字视力表视标的选择方法
技术领域
本发明涉及汉字视力表视标的选择方法。

背景技术
视力表是眼科诊断中最重要的工具之一。通过视力的测量一方面可以了解眼部的健康状况,另一方面可以了解被检者对日常阅读文字的分辨能力。目前,在眼科临床的视力检查中,作为视力表的视标有文盲E、字母及数字等。在许多以英语为第一语言的国家,英国标准字母和Sloan字母及数字较为通用。在国内则以文盲E为视标的视力表在临床的视力测试中应用最为广泛。这些视标设计的基本原理一致每一个笔画占整个视标高度的1/5,在设计距离,每个笔画所对应的视角为1弧分;视标的增率采用几何级数。由于人们获取信息的最重要方式,是通过阅读来实现的,用被检者熟悉的文字来评估视力,则可以直接而充分地了解被检者阅读该种文字字体大小的阈值。因而,要获得被检者辨认汉字的真正阈值,应该选用汉字作为视标。在以往设计的汉字视力表中,有以下两类一类汉字视力表的特点是将汉字的笔画加粗,使每一笔画占据1/5汉字高度。由于该视标采用了汉字,且包含了撇和捺结构,比文盲E多了斜向笔画,在一定程度上提高了国内检测被检者阅读汉字字体大小的阈值的精确度。但是,这种经过加工后的汉字视标完全不同于日常读物中的汉字,所以其检测结果与实际视力之间不可避免地存在着偏差。另一类是以笔画数、字频、字形等因素作为可视性的主要参考因素,但是,据有关研究可知,即使是具有相同笔画数的汉字,对视觉系统并不一定具有相同的视觉刺激。由于视标之间具有均一的可视性是视力表设计中的重要原则,因此,有必要选择具有均一可视性的汉字作为同一张汉字视力表的视标。


发明内容
本发明的目的在于为克服现有技术的不足而提供一种汉字视力表视标的选择方法,通过该方法选择的汉字视标具有更均一的可视性,使用该方法选择的汉字视标制作的汉字视力表能够更加准确地检测被检者阅读汉字字体大小的阈值。
为了实现上述目的,本发明公开了一种汉字视力表视标的选择方法,其特征在于包含以下步骤 1)从常用的、笔画数段最集中汉字中选取足够个数的汉字; 2)将所选汉字用图像处理软件保存为统一的图片格式; 3)分析每个汉字的空间频率成分,并将其结果表示为不同空间频率成分的二维分布,即频谱能量分布图; 4)对所有被上述初选汉字的各空间频率的频谱能量求均值,以此作为参照值,采用聚类分析将汉字图像进行聚类,从中选取与频谱能量均值相似的一组汉字; 5)从上一步骤选出的汉字中选取同时具备横向、垂直、斜向和弧形的笔画的汉字作为汉字视力表视标。
与现有技术相比较,本发明的有益效果是由于汉字属于表意文字,具有文字和图像双重特性,因而,汉字识别服从图形辨认的一般规律。现代视觉研究表明,人眼视觉系统对视觉图形信息的处理具有空间频率(即视标粗密程度)通道分析特征,这些“通道”具有带通滤波特性,即每个通道只对空间频率中某一特定频段有最佳反应。而通道的选择是自下而上地由图像的信号来决定,并非由观察者自上而下地进行选择。也就是说,图形的空间频率是决定视觉信息处理的重要变量。在应用光学中,空间频率是指每毫米所具有的光栅数,单位为线/毫米。在视觉研究领域中,它是指单位视角内明暗条纹重复出现的周期数,或正弦状浓淡变化的重复次数,单位周/度(cyclesper degree of visual angle,cpd)。一般而言,汉字字体大小相同时,笔画数越多,其空间频率越高;而笔画数相同时,字体大小越小,其空间频率越高,即使是字体大小相同,具有相同笔画数的汉字,其空间频率特性未必相同,因此,具有相同笔画数的汉字对视觉系统并不一定具有相同的视觉刺激,而在本发明的汉字视力表视标的选择方法中,除了考虑笔画数、字频、字形等因素外,还通过对汉字图像进行空间频率成分分析,从中选择出各空间频率的频谱能量均值相似的汉字作为视标,更符合人眼视觉系统对汉字识别、辨认的一般规律,因此较以往汉字视标选择的方法更客观、科学,通过该方法选择汉字字标的汉字视力表能够更加准确地检测被检者辨认汉字大小的阈值。
下面将结合附图及具体实施例对本发明做进一步详细说明。



图1(a)是八画汉字中“杯”字的BMP图片; 图1(b)是“杯”字的频谱能量分布图; 图1(c)是“杯”字的各空间频率成分的一维分布图; 图2是所选的40个中笔画汉字的各空间频率的频谱能量均值图; 图3是汉字图像的相似性及相互关系图(注欧式距离=图中的数字*1013); 图4为4张汉字图像的各空间频率成分的一维分布图; 图5为A组10个汉字视标的字体大小-辨认准确率拟合曲线; 图6为A组频谱能量均值图,误差线代表标准差; 图7为B组10个汉字视标的频谱能量均值图,误差线代表标准差; 图8为A、B两组汉字阈值大小的均值图,误差线代表标准差。
图9为两对比度汉字近视力表(少笔画); 图10为两对比度汉字近视力表(中笔画);
具体实施例方式 根据统计,常用汉字中笔画数绝大部分集中在7-9画,即集中在中笔画范围,本实施例中从2500个常用汉字中选出该笔画数段中所有的汉字共计172个。鉴于每个汉字视标的选择过程相同,在本具体实施例中仅以8画中笔画数汉字“杯”为例。如图1所示,首先将“杯”字保存为统一的图片格式,即同样大小的图片,字面在图片中所占面积的大小相同,可以通过Adobe Photoshop7.1或其他图像处理软件将汉字保存为BMP或其他格式,如jpg格式等,(字的大小为300×300pixels,图片大小为900X900 pixels)(图1a),然后,导入图像,用二维矩阵z=f(x,y)表示图像的灰度,再采用快速傅立叶变换算法对图像进行傅立叶变换,使图像从灰度分布空间变换到频率分布空间,输出图像的频率分布图及数据,并将其结果表示为不同空间频率成分的二维分布,即频谱能量分布图(1b),所谓的“频谱能量”是指在不同空间频率下所含成分强度的相对分布,频谱能量分布图上我们看到的明暗不一的亮点,实际上图像上某一点与邻域点差异的强弱,即梯度的大小,也即该点的频率的大小,可以这么理解,图像中的低频部分指低梯度的点,高频部分相反。图中白色程度代表能量分布,即越白表示能量越强,表明了该汉字在该区空间频率下的成分越多,图1b则表示在水平方向有更多的空间频率成分。上述空间频率成分分析过程可以采用利用傅里叶频谱分析原理开发的MATLAB程序在计算机上进行;接着对所有具有相同空间频率不同方位的成分取均值,并得到各空间频率成分的一维分布图1(c)。图中表示在1.65和1.98cpl频率段具有较高的能量分布。按上述过程和方式对其余的初选汉字进行空间频率成分分析,然后分别对所有的初选汉字的各空间频率的频谱能量求均值,如图2所示,以此作为参照值,采用聚类分析将汉字图像进行聚类。在聚类分析中,最常用的就是距离的相似性,其中,比较常用的是欧式距离平方和欧式距离(Euclidean distance)。因为欧氏距离可以比较好地描述知觉过程中的心理相似性,因此我们把汉字图像灰度矩阵间的欧氏距离作为度量相似性的指标。两个图像灰度矩阵间的欧式距离定义如下 如果xi和yi数值接近,相似程度高,欧氏距离就比较小;如果它们数值相差大,相似程度低,则欧氏距离会比较大。以图3中的4幅汉字图像为例,各图像间的欧式距离如图4所示,“府”、“挥”和“秃”三者之间的欧式距离小,它们各自和“顺”之间的欧式距离大。通过聚类分析后,从中选取与各空间频率的频谱能量均值相似的一组汉字40个。由于理想的视标应该同时具备横向、垂直、斜向和弧形的笔画,因此,在上汉字中选择出尽可能同时包含横、竖、撇、捺和弧形结构(至少包含横、竖、撇和弧形结构或包含横、竖、捺和弧形结构)的汉字作为汉字视力表的备选视标,共20个,即觉、孩、郑、怪、秀、际、构、扰、怎、转、肾、炊、择、染、秋、贺、软、祝、项、保。图10为选用其中十个汉字视标制作的两对比度汉字近视力表(中笔画)。
为了适合少年儿童使用,适应他们的识字水平,可以选用笔画数较少(少笔画)的汉字作为汉字视标,如笔画数段集中在2-4画的汉字,通过上述相同的方法和步骤,最后选出“文、毛、又、五、尺、才、天、长、木、片、卫、不、斤、欠、万、匀、友、刀、父、月”等20个汉字作为汉字视力表的备选视标。图9为选用其中十个汉字视标制作的两对比度汉字近视力表(少笔画)。
下面将用经过本方法选出的汉字视力表视标与现有的汉字阅读视力表视标做比较,对比两组各自视标之间的可视性。其中A组视标是通过经过本方法选出的各空间频率所对应的频谱能量相似的10个汉字(孩、郑、怪、构、肾、择、染、秋、软、祝);B组是从现有的汉字阅读视力表中随机取得的10个汉字(四、九、老、年、你、走、把、我、请、因)。通过比较每组汉字的频谱能量和阈值大小验证组内汉字图像各空间频率所对应的频谱能量的差异对汉字间阈值大小的影响,说明作为同一张汉字视力表的视标具有相似空间频率特性的重要性。
比较方法 分别将A组和B组的10个视标进行傅里叶频谱分析,获取每组汉字各空间频率所对应的频谱能量均值和标准差。
分别以所选的A组和B组的10个汉字视标的平均视敏度阈值为参考值,将每个汉字制作6种字体大小的汉字图片。呈现顺序为从字体小到大呈现,每种字体大小中每个字分别呈现10次。被试者坐在距离显示器3m处,让其尽量辨认屏幕上出现的每个汉字,待被试说出所看到的汉字后即切换到下一张汉字图片,实验中予适当休息。实验结束后统计每个汉字图片在不同字体大小时的辨认准确率,每个汉字辨认准确率=说对的个数×100%/10。
选28名被试者对每个字不同字体大小时的辨认准确率的平均值,并用心理物理学研究常用的韦伯函数(Weibull function)进行拟合,得到字体大小——辨认正确率曲线。其拟合方程为P=1-(1-γ)e-(x/tb)β,P指的是辨认正确率,γ是猜测可能率(因为被试者未被告知被测的字是哪些字,且汉字总体数目庞大,故其猜测可能性近似于0),x代表的是视标的大小(以其整体高度所对应的视角来表示,单位分),β是拟合后所得心理物理学曲线的斜率,tb是指在曲线上临界正确率63.2%(当x=tb时所得的P值)所对应的视标大小。汉字拟合曲线见图5。从tb值的含义可知tb值越大,则欲达到相同的辨认准确率所需要的视标越大,即该字的易读性越小,反之亦然。通过上述拟合函数获取A组和B组的每个汉字的阈值大小,阈值大小定义为每个汉字被辨认的正确率为63.2%时所对应的视标大小,字体大小以point(pt)表示。
A、B两组各空间频率所对应的频谱能量的标准差采用配对t检验。
比较结果如下 1、A组10个汉字各空间频率的频谱能量的标准差见表1和图6; 表1.A组10个汉字的频谱能量均值和标准差
B组10个汉字各空间频率的频谱能量的标准差表见表2和图7。
表2B组10个汉字各空间频率成分所对应的频谱能量均值和标准差
由上两表数据可知,A组的标准差比B组的小,两者之间差异有统计学意义(t(13)=3.194,p<0.01)。
2、A组和B组汉字的阈值大小和标准差见表3; 表3.A组和B组汉字的阈值大小
A、B两组均值和标准差见图8。
由以上图表可知,A组10个汉字间的各空间频率的频谱能量分布相似,说明A组所有汉字对视觉系统具有相似的视觉刺激;而B组10个汉字各空间频率的频谱能量标准差大,说明B组10个汉字对视觉系统具有不同的刺激。通过汉字认知的心理物理学测试发现A组汉字间具有非常相似可视性;而B组汉字间可视性的相似性低。这说明汉字视标间具有相似空间频率特性是保证视标之间具有相似可视性的重要因素。因此,通过汉字图像的傅里叶频谱分析,以汉字图像的各空间频率的频谱能量相似作为筛选视标的主要原则,不仅反映了视觉的生理特点,而且符合了视觉系统具有的傅里叶频谱分析特性。因此,这个方法应用于汉字视标的筛选具有重要的意义。
权利要求
1、一种汉字视力表视标的选择方法,其特征在于包含以下步骤
1)从常用的、笔画数段最集中汉字中选取足够个数的汉字;
2)将所选汉字用图像处理软件保存为统一的图片格式;
3)分析每个汉字的空间频率成分,并将其结果表示为不同空间频率成分的二维分布,即频谱能量分布4)对所有被上述初选汉字的各空间频率的频谱能量求均值,以此作为参照值,采用聚类分析将汉字图像进行聚类,从中选取与频谱能量均值相似的一组汉字;
5)从上一步骤选出的汉字中选取同时具备横向、垂直、斜向和弧形的笔画的汉字作为汉字视力表视标。
全文摘要
本发明涉及汉字视力表视标的选择方法。本方法通过先将汉字转化为图片格式后进行空间频率成分分析,然后对各空间频率的频谱能量求均值,并采用聚类分析将汉字图像进行聚类,选取与频谱能量均值相似的一组汉字,从中选取同时具备横向、垂直、斜向和弧形的笔画的汉字作为汉字视力表视标。在本发明的汉字视力表视标的选择方法中,除了考虑笔画数、字频、字形等因素外,还通过对汉字图像进行空间频率成分分析,从中选择出各空间频率的频谱能量均值相似的汉字作为视标,更符合人眼视觉系统对汉字识别、辨认的一般规律,使用该方法选择的汉字视标制作的汉字视力表能够更加准确地检测被检者阅读汉字字体大小的阈值。
文档编号A61B3/02GK101313843SQ20081006312
公开日2008年12月3日 申请日期2008年7月11日 优先权日2008年7月11日
发明者王晨晓, 贺极苍, 帆 吕, 佳 瞿 申请人:温州医学院眼视光研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1