字符颜色识别处理方法及装置与流程

文档序号:18554827发布日期:2019-08-30 22:27阅读:293来源:国知局
字符颜色识别处理方法及装置与流程

本发明涉及图片处理技术领域,具体涉及一种字符颜色识别处理方法及装置。



背景技术:

ocr等字符识别算法能够对图片中的字符进行自动识别。依据现有的字符识别算法,会按照位置关系将距离较近的字符组合拼接成一段字符,而对于字符的颜色,一般是直接将识别出的字符的颜色设置成黑色等预设颜色或者通过从图片中的字符部分提取颜色的方式确定字符的颜色。例如,申请公布号为cn102737241a的中国专利申请提供了一种信息处理方法,该方法根据来自字符识别处理部分的字符识别处理的结果和字符串区域图像,判定字符串区域中的字符串的字符部分的颜色,根据判定的字符颜色信息生成字符串区域颜色信息。

然而,为了在图片展示时能够获得较好展示效果,大多会对图片进行抗锯齿等处理,上述处理会导致图片中字符部分的颜色值不是一个固定值,尤其是边缘位置通常利用的是差值运算生成的中间值作为颜色值,那么利用现有技术无法准确地对字符的颜色进行识别,存在着字符颜色识别精度较低的问题。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的字符颜色识别处理方法及装置。

根据本发明的一个方面,提供了一种字符颜色识别处理方法,该方法包括:

从图片中提取待识别区域;

对待识别区域进行连通域分析,得到多个字符区域的外接矩形;

针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;

将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。

进一步地,该方法还包括:

按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。

进一步地,对待识别区域进行连通域分析,得到多个字符区域的外接矩形进一步包括:

利用种子填充算法对待识别区域进行连通域分析,得到多个连通域;

根据多个连通域对应的参数信息,确定多个字符区域;

针对每个字符区域,获取该字符区域的外接矩形。

进一步地,针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值进一步包括:

从聚类元素中随机选取k个聚类元素作为k个初始聚类中心,其中k大于1;

根据k个初始聚类中心,对聚类元素进行聚类处理,确定k个最终聚类中心以及与k个最终聚类中心相对应的k个最终聚类集合;

依据k个最终聚类集合,确定k个聚类颜色值。

进一步地,根据k个初始聚类中心,对聚类元素进行聚类处理,确定k个最终聚类中心以及与k个最终聚类中心相对应的k个最终聚类集合进一步包括:

对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离;

从k个初始聚类中心中选择与任一聚类元素之间的距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到k个聚类集合;

计算k个聚类集合的聚类中心,并判断k个聚类中心是否与k个初始聚类中心相同;

若是,则将k个聚类中心确定为k个最终聚类中心,并将k个聚类集合确定为k个最终聚类集合;若否,则根据k个聚类中心更新k个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离。

进一步地,在将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色之前,该方法还包括:

根据外接矩形的位置参数信息,确定外接矩形的外围区域;

统计外接矩形的外围区域内像素颜色值的分布情况;

根据分布情况,提取在外围区域内分布最多的像素颜色值作为外围区域的背景颜色值。

进一步地,将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色进一步包括:

计算每个聚类颜色值与背景颜色值之间的差异度;

将差异度符合预设条件的聚类颜色值确定为字符区域的字符颜色。

根据本发明的另一方面,提供了一种字符颜色识别处理装置,该装置包括:

提取模块,适于从图片中提取待识别区域;

分析模块,适于对待识别区域进行连通域分析,得到多个字符区域的外接矩形;

聚类模块,适于针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值;

比对模块,适于将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。

进一步地,该装置还包括:

划分模块,适于按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。

进一步地,分析模块进一步适于:

利用种子填充算法对待识别区域进行连通域分析,得到多个连通域;

根据多个连通域对应的参数信息,确定多个字符区域;

针对每个字符区域,获取该字符区域的外接矩形。

进一步地,聚类模块进一步适于:

从聚类元素中随机选取k个聚类元素作为k个初始聚类中心,其中k大于1;

根据k个初始聚类中心,对聚类元素进行聚类处理,确定k个最终聚类中心以及与k个最终聚类中心相对应的k个最终聚类集合;

依据k个最终聚类集合,确定k个聚类颜色值。

进一步地,聚类模块进一步适于:

对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离;

从k个初始聚类中心中选择与任一聚类元素之间的距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到k个聚类集合;

计算k个聚类集合的聚类中心,并判断k个聚类中心是否与k个初始聚类中心相同;

若是,则将k个聚类中心确定为k个最终聚类中心,并将k个聚类集合确定为k个最终聚类集合;若否,则根据k个聚类中心更新k个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离。

进一步地,该装置还包括:

外围区域确定模块,适于根据外接矩形的位置参数信息,确定外接矩形的外围区域;

统计模块,适于统计外接矩形的外围区域内像素颜色值的分布情况;

背景色提取模块,适于根据分布情况,提取在外围区域内分布最多的像素颜色值作为外围区域的背景颜色值。

进一步地,比对模块进一步适于:

计算每个聚类颜色值与背景颜色值之间的差异度;

将差异度符合预设条件的聚类颜色值确定为字符区域的字符颜色。

根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;

存储器用于存放至少一可执行指令,可执行指令使处理器执行上述字符颜色识别处理方法对应的操作。

根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述字符颜色识别处理方法对应的操作。

根据本发明提供的技术方案,对图片中的待识别区域进行连通域分析,得到多个字符区域的外接矩形,通过对外接矩形内像素颜色值进行聚类处理,实现了对字符区域中所包括的颜色的快速识别;将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,能够更为准确地从多个聚类颜色值中确定出字符颜色,所确定的字符颜色能够更为准确地反映图片中字符的真实颜色,有效地提高了字符颜色识别精度。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1a示出了根据本发明一个实施例的字符颜色识别处理方法的流程示意图;

图1b示出了待识别区域的示意图;

图1c示出了图1b所示的待识别区域对应的多个字符区域的示意图;

图1d示出了字符区域的外接矩形的外围区域的示意图;

图2示出了根据本发明另一实施例的字符颜色识别处理方法的流程示意图;

图3示出了根据本发明实施例的字符颜色识别处理装置的结构框图;

图4示出了根据本发明实施例的一种计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1a示出了根据本发明一个实施例的字符颜色识别处理方法的流程示意图,如图1a所示,该方法包括如下步骤:

步骤s101,从图片中提取待识别区域。

在许多业务场景中,经常会有一些识别图片中字符颜色的需求,那么可利用现有技术中的ocr等字符识别算法对图片进行字符识别处理,从图片中提取待识别区域,待识别区域为图片中字符所在区域。待识别区域中可包含有一行字符、多行字符或者多段字符等。

步骤s102,对待识别区域进行连通域分析,得到多个字符区域的外接矩形。

在连通域分析过程中可利用种子填充算法对待识别区域进行连通域分析,得到多个连通域,进而确定多个字符区域,每个字符区域对应于一个完整的、独立的字符。其中,种子填充算法的原理是从待识别区域内部的某一个点开始,也就是将该点作为种子,由此向外出发画点直到边界为止,具体地,可通过上、下、左、右四个方向或上、下、左、右、左上、左下、右上和右下八个方向到达待识别区域内的任意像素。在得到多个字符区域之后,针对每个字符区域,获取该字符区域的外接矩形。其中,字符区域的外接矩形是指能够包裹字符区域的最小的矩形框。若从图片中提取出的待识别区域如图1b所示,确定的多个字符区域可如图1c所示,其中,图1c中的边框为字符区域的外接矩形,一个外接矩形对应于一个字符区域,一个字符区域对应于一个完整、独立的字符,外接矩形内的部分即为其对应的字符区域。

步骤s103,针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值。

为了能够准确、快速地识别出字符区域内包含了哪些颜色,在得到多个字符区域的外接矩形之后,针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,然后对聚类元素进行聚类处理,得到多个聚类颜色值。具体地,将外接矩形内每个像素在各个颜色通道的颜色值作为聚类元素,对聚类元素进行聚类处理,得到多个最终聚类集合,然后确定每个最终聚类集合对应的聚类颜色值。

由于字符区域的外接矩形内不仅包含有对应于字符内容(即前景)的像素,还包含有对应于字符背景的像素,以字符背景颜色为单一颜色为例,那么可将聚类元素聚类成2个聚类集合,从而得到2个聚类颜色值。这2个聚类颜色值分别对应于字符颜色和字符背景颜色,但无法确定具体哪个聚类颜色值对应于字符颜色。

本领域技术人员可根据实际需要选择具体的聚类算法,此处不做限定。例如,可采用k-means(k均值)聚类算法、层次聚类算法、som(自组织映射神经网络,self-organizingmaps)聚类算法或者fcm(模糊,fuzzyc-means)聚类算法等对聚类元素进行聚类处理。

步骤s104,将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。

为了能够准确地从多个聚类颜色值中确定出字符颜色,还需要获取字符区域的外接矩形的外围区域的背景颜色值,其中,外接矩形的外围区域可以是距离外接矩形的边缘像素的预设距离的区域,也可以是比外接矩形的轮廓大预设比例的区域。本领域技术人员可根据实际需要对预设距离和预设比例进行设置,例如,可将预设比例设置为5%,那么外围区域的外轮廓在长、宽等方向都比外接矩形的轮廓大5%。针对字符区域为图1c中“5”对应的区域,该外接矩形的外围区域可为图1d中用阴影所标出的部分。

在步骤s104中将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,具体地,与外围区域的背景颜色值相比,可将差异度较小的聚类颜色值作为字符背景颜色,将差异度较大的聚类颜色值作为字符颜色,从而确定出字符颜色。通过这种方式,能够有效地消除因图片经过抗锯齿等处理而给字符颜色识别带来的干扰,所确定的字符颜色能够更为准确地反映图片中字符的真实颜色。

本实施例提供的字符颜色识别处理方法,对图片中的待识别区域进行连通域分析,得到多个字符区域的外接矩形,通过对外接矩形内像素颜色值进行聚类处理,实现了对字符区域中所包括的颜色的快速识别;将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,能够更为准确地从多个聚类颜色值中确定出字符颜色,所确定的字符颜色能够更为准确地反映图片中字符的真实颜色,有效地提高了字符颜色识别精度。

图2示出了根据本发明另一实施例的字符颜色识别处理方法的流程示意图,如图2所示,该方法包括如下步骤:

步骤s201,从图片中提取待识别区域。

可利用现有技术中的ocr等字符识别算法对图片进行字符识别处理得到字符识别结果,其中,字符识别结果可包括:字符位置和字符内容等信息,根据字符识别结果中的字符位置从图片中提取待识别区域,具体地,根据字符识别结果中的字符位置能够得知图片中哪些位置存在字符,那么从图片中提取字符位置对应的区域,将所提取的区域作为待识别区域。

步骤s202,对待识别区域进行连通域分析,得到多个字符区域的外接矩形。

具体地,可利用种子填充算法对待识别区域进行连通域分析,得到多个连通域。由于有些字符会具有多个不连通的独立部分,例如字符“i”具有上、下两个独立部分,字符“%”具有左上、中间和右下三个独立部分,那么在进行连通域分析后,这类字符会被分成若干个连通域,那么还需根据多个连通域对应的内容、位置、大小等参数信息,利用邻近搜索算法等算法进行处理,确定多个字符区域,针对每个字符区域,获取该字符区域的外接矩形。

步骤s203,针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,从聚类元素中随机选取k个聚类元素作为k个初始聚类中心。

在本实施例中,采用的是k-means聚类算法,将外接矩形内每个像素在各个颜色通道的颜色值作为聚类元素,若图片采用的是rgb颜色标准,那么像素颜色值包含有像素在红(r)、绿(g)、蓝(b)三个颜色通道的颜色值。接着从聚类元素中随机选取k个聚类元素作为k个初始聚类中心,其中k大于1。由于字符区域的外接矩形内包含有对应于字符内容的像素和对应于字符背景的像素,以字符区域的外接矩形内的字符背景颜色为单一颜色为例,那么可将k设置为2,从聚类元素中随机选取2个聚类元素作为2个初始聚类中心。

步骤s204,根据k个初始聚类中心,对聚类元素进行聚类处理,确定k个最终聚类中心以及与k个最终聚类中心相对应的k个最终聚类集合。

根据k个初始聚类中心,对聚类元素进行聚类处理,直至符合收敛条件,得到k个最终聚类中心以及相对应的k个最终聚类集合。其中,收敛条件可为k个聚类集合的聚类中心不再发生变化。具体的聚类处理方式可通过下列步骤1至步骤5进行实现。步骤1,对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离;步骤2,从k个初始聚类中心中选择与任一聚类元素之间的距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到k个聚类集合;步骤3,计算k个聚类集合的聚类中心,并判断k个聚类中心是否与k个初始聚类中心相同;若是,则执行步骤4;若否,则执行步骤5;步骤4,将k个聚类中心确定为k个最终聚类中心,并将k个聚类集合确定为k个最终聚类集合;步骤5,根据k个聚类中心更新k个初始聚类中心,并跳转执行步骤1。

其中,在步骤1中可计算任一聚类元素与k个初始聚类中心之间的欧式距离,欧式距离是指欧几里得距离,具体指在m维空间中两个点之间的真实距离,或者向量的自然长度。若步骤3判断得到k个聚类中心与k个初始聚类中心相同,说明k个聚类集合符合收敛条件,则将k个聚类中心确定为k个最终聚类中心,并将k个聚类集合确定为k个最终聚类集合;若步骤3判断得到k个聚类中心与k个初始聚类中心不相同,说明k个聚类集合还不符合收敛条件,仍需进行聚类处理,则根据k个聚类中心更新k个初始聚类中心,也就是将k个聚类中心作为更新后的k个初始聚类中心。在根据k个聚类中心更新了k个初始聚类中心之后,跳转执行步骤1,计算任一聚类元素与更新后的k个初始聚类中心之间的距离,然后根据计算得到的距离重新对聚类元素进行归类处理。

步骤s205,依据k个最终聚类集合,确定k个聚类颜色值。

针对每个最终聚类集合,可将该最终聚类集合的聚类中心的像素颜色值作为该最终聚类集合对应的聚类颜色值;或者,也可计算该最终聚类集合所包含的聚类元素的像素颜色值的平均值,将计算得到的平均值作为该最终聚类集合对应的聚类颜色值。

为了能够准确地从k个聚类颜色值中确定出字符颜色,还需要获取字符区域的外接矩形的外围区域的背景颜色值,那么在步骤s206之前,该方法还可包括:根据外接矩形的位置参数信息,确定外接矩形的外围区域;统计外接矩形的外围区域内像素颜色值的分布情况;根据分布情况,提取在外围区域内分布最多的像素颜色值作为外围区域的背景颜色值。具体地,根据外接矩形的位置参数信息,将距离外接矩形的边缘像素的预设距离的区域或者将比外接矩形的轮廓大预设比例的区域确定为外接矩形的外围区域。需要注意的是,外围区域不宜过大,应避免与其他字符区域出现重叠,以减少干扰像素的引入。

外接矩形的外围区域内具有多个像素,各个像素的像素颜色值可能不完全相同,那么可对外围区域内像素颜色值的分布情况进行统计,统计外围区域内有多少个像素颜色值相同。对于分布最多的像素颜色值,说明该像素颜色值在外围区域的出现频率最高,该像素颜色值为外围区域主要出现的颜色,那么可将该像素颜色值作为外围区域的背景颜色值。与直接随机选取外围区域内某一像素颜色值作为外围区域的背景颜色值相比,本发明结合外围区域内像素颜色值的分布情况所确定的外围区域的背景颜色值能够更为准确地反映外围区域真实的背景色。

步骤s206,将k个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。

在现有技术的图片设计过程中,考虑到字符在图片中的展现效果,一般会将字符颜色设置为与字符背景颜色存在较大差异度的颜色,例如,字符颜色为黑色,字符背景颜色为白色,或者字符颜色为白色,字符背景颜色为黑色等。那么在确定了k个聚类颜色值和外接矩形的外围区域的背景颜色值之后,可计算每个聚类颜色值与外围区域的背景颜色值之间的差异度,然后将差异度符合预设条件的聚类颜色值确定为字符区域的字符颜色。本领域技术人员可根据实际需要设置预设条件,例如预设条件可以为差异度排名最高,即差异度最大。差异度越大的聚类颜色值为字符颜色的几率越大,差异度越小的聚类颜色值为字符背景颜色的几率越大,那么可将差异度最大的聚类颜色值确定为字符区域的字符颜色。通过上述方式,能够有效地消除因图片经过抗锯齿等处理而给字符颜色识别带来的干扰,更为准确地确定出字符颜色,有效地提高了字符颜色识别精度。

步骤s207,按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。

考虑到现有技术中通常会采用不同的字符颜色对属于不同业务属性的字符进行区分,即不同颜色的字符对应于不同的业务属性,那么可按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。具体地,可将字符颜色相同的字符识别结果中的字符内容划分为一组,从而得到多个字符组。同一字符组的字符颜色相同,所对应的业务属性相同。若多个字符区域的示意图如图1c所示,假设经步骤s206确定得到字符区域“今”、“日”、“特”和“价”的字符颜色为红色,字符区域“1”、“5”、“.”、“9”、“0”和“元”的字符颜色为橙色,字符区域“6”和“折”的字符颜色为黑色,那么步骤s207所得到的多个字符组包括:字符组“今日特价”、字符组“15.90元”和字符组“6折”。

本实施例提供的字符颜色识别处理方法,采用k-means聚类算法对连通域分析得到的字符区域的外接矩形内像素颜色值进行聚类处理,依据聚类得到的多个最终聚类集合确定多个聚类颜色值,所得到的多个聚类颜色值能够更为准确地反映出字符区域内包含了哪些颜色,实现了对字符区域中所包括的颜色的快速识别;结合外围区域内像素颜色值的分布情况来确定外围区域的背景颜色值,能够更为准确地反映外围区域真实的背景色,将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对来确定字符颜色,有效地提高了字符颜色识别精度;并且,按照多个字符区域的字符颜色实现了对识别出的字符的有效划分,有效地提高了字符识别处理精度,使得用户能够方便地对多个字符组分别进行存储与使用;另外,该方法充分利用了现有的字符识别算法所识别得到的字符识别结果,无需对现有的字符识别算法进行修改,极大地节约了开发成本,提高了字符识别处理效率。

图3示出了根据本发明实施例的字符颜色识别处理装置的结构框图,如图3所示,该装置包括:提取模块310、分析模块320、聚类模块330和比对模块340。

提取模块310适于:从图片中提取待识别区域。

分析模块320适于:对待识别区域进行连通域分析,得到多个字符区域的外接矩形。

可选地,分析模块320进一步适于:利用种子填充算法对待识别区域进行连通域分析,得到多个连通域;根据多个连通域对应的参数信息,确定多个字符区域;针对每个字符区域,获取该字符区域的外接矩形。

聚类模块330适于:针对每个字符区域的外接矩形,将外接矩形内像素颜色值作为聚类元素,并对聚类元素进行聚类处理,得到多个聚类颜色值。

可选地,聚类模块330进一步适于:从聚类元素中随机选取k个聚类元素作为k个初始聚类中心,其中k大于1;根据k个初始聚类中心,对聚类元素进行聚类处理,确定k个最终聚类中心以及与k个最终聚类中心相对应的k个最终聚类集合;依据k个最终聚类集合,确定k个聚类颜色值。

可选地,聚类模块330进一步适于:对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离;从k个初始聚类中心中选择与任一聚类元素之间的距离最小的初始聚类中心,将任一聚类元素归类到所选择的初始聚类中心对应的集合中,得到k个聚类集合;计算k个聚类集合的聚类中心,并判断k个聚类中心是否与k个初始聚类中心相同;若是,则将k个聚类中心确定为k个最终聚类中心,并将k个聚类集合确定为k个最终聚类集合;若否,则根据k个聚类中心更新k个初始聚类中心,并跳转执行对于任一聚类元素,计算任一聚类元素与k个初始聚类中心之间的距离。

比对模块340适于:将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对,确定字符区域的字符颜色。

可选地,比对模块340进一步适于:计算每个聚类颜色值与背景颜色值之间的差异度;将差异度符合预设条件的聚类颜色值确定为对应的字符颜色。

可选地,该装置还包括:划分模块350,适于按照多个字符区域的字符颜色,对待识别区域内的字符识别结果进行划分,得到多个字符组。

可选地,该装置还包括:外围区域确定模块360,适于根据外接矩形的位置参数信息,确定外接矩形的外围区域;统计模块370,适于统计外接矩形的外围区域内像素颜色值的分布情况;背景色提取模块380,适于根据分布情况,提取在外围区域内分布最多的像素颜色值作为外围区域的背景颜色值。

本实施例提供的字符颜色识别处理装置,采用k-means聚类算法对连通域分析得到的字符区域的外接矩形内像素颜色值进行聚类处理,依据聚类得到的多个最终聚类集合确定多个聚类颜色值,所得到的多个聚类颜色值能够更为准确地反映出字符区域内包含了哪些颜色,实现了对字符区域中所包括的颜色的快速识别;结合外围区域内像素颜色值的分布情况来确定外围区域的背景颜色值,能够更为准确地反映外围区域真实的背景色,将多个聚类颜色值与外接矩形的外围区域的背景颜色值进行比对来确定字符颜色,有效地提高了字符颜色识别精度;并且,按照多个字符区域的字符颜色实现了对识别出的字符的有效划分,有效地提高了字符识别处理精度,使得用户能够方便地对多个字符组分别进行存储与使用;另外,该方法充分利用了现有的字符识别算法所识别得到的字符识别结果,无需对现有的字符识别算法进行修改,极大地节约了开发成本,提高了字符识别处理效率。

本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的字符颜色识别处理方法。

图4示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。

如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(communicationsinterface)404、存储器(memory)406、以及通信总线408。

其中:

处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。

通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。

处理器402,用于执行程序410,具体可以执行上述字符颜色识别处理方法实施例中的相关步骤。

具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。

处理器402可能是中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。

存储器406,用于存放程序410。存储器406可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

程序410具体可以用于使得处理器402执行上述任意方法实施例中的字符颜色识别处理方法。程序410中各步骤的具体实现可以参见上述字符颜色识别处理实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1