一种基于边缘检测的生物芯片样点识别方法

文档序号:6353124阅读:495来源:国知局
专利名称:一种基于边缘检测的生物芯片样点识别方法
技术领域
本发明属于图像识别技术领域,涉及一种生物芯片图像样点的识别方法,特别涉 及一种基于边缘检测的生物芯片图像样点的识别方法。
背景技术
生物芯片是在面积不大的基片表面上有序地点阵排列一系列固定于一定位置的 可寻址的识别分子,而这些样点分子就携带了大量的生物信息。通过筛选与检测分析,人们 可以快速地获取样品中的生物信息。因此生物芯片技术就成了生命科学工作者研究基因表 达分析、疾病诊断、新药物发现等众多领域的重要工具。生物芯片信息处理过程就是对生物芯片的成像结果进行分析其样点的吸光度值、 面积或吸光度比。通过对样点的吸光度进行统计分析提取出重要的生物信息。因此能否准 确地提取出样点的吸光度值也即灰度值将直接影响到芯片检测结果的精确度。目前生物芯 片还没有国际或行业标准,生物芯片的布局并不一致,在点样过程中由于点样仪或探针的 抖动造成的点样飘移,点样误差等导致图像不一致。另外在芯片的制作过程中,反应、清洗 或测定过程中难免会有灰尘或待测样品的碎片等的干扰,严重制约了生物芯片样点的自动 识别,从而影响了生物芯片信息提取的准确性。目前大多数的商业化软件均采取了手动定 位阵列样点的方法,该方法首先选择需要识别的区域,然后输入芯片阵列的行列数、样点半 径和阵列的行列间距,接着由计算机自动产生一个圆圈阵列,调整圆圈阵列,将其套在样点 阵列上,使每个圆圈内包含一个样点。由于样点飘移或者尺寸差别较大,最后需要手动对某 些样点进行调整。这种手动定位的方法具有一定的灵活性,但是由于是手工操作,因此会加 大操作的工作量,而且不利于实现整个芯片应用过程的自动化。多数情况下样点的形状并 非绝对的圆形,如果仍以圆圈去包含每个样点,其计算的样点面积和吸光度值必定有误差, 并且手工定位的随意性较大,数据重复性和可靠性难以得到保证。

发明内容
针对现有技术需要人为的输入芯片阵列的行列数、样点半径和阵列的行列间距, 对样点的定位不精确,其数据重复性和可靠性难以得到保证,且自动化程度不高的缺陷,本 发明的目的是要提出一种基于边缘检测的生物芯片图像样点的识别方法。为实现所述目的,本发明提出基于边缘检测的生物芯片识别方法,该方法解决技 术问题的技术方案包括步骤如下步骤Sl 对生物芯片连续拍摄多幅图,合成取其平均值作为原图;步骤S2 对原图进行样点边缘提取,对样点边缘运用形态学中的膨胀运算进行边 缘连接及对样点边缘内进行区域填充,将原图转化为样点区域为黑色,背景区域为白色的 二值图像,以此来确定样点的真实区域;步骤S3 运用扫描法对生物芯片图像进行网格划分,得到生物芯片的网格,保证 每个网格内只有一个样点,并自动确定样点阵列的行、列数,根据生物芯片的网格对样点按行依次进行编号;步骤S4 记录下二值图像中每个网格内黑色像素点的位置,每个网格内黑色像素 点的位置它与原图中样点区域的位置一一对应;根据这些位置信息,获取并保存原图中样 点的面积及灰度值;步骤S5 将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得 到样点的自动识别结果。本发明的优点在于运用样点边缘来确定样点的实际区域,避免了用圆圈包含非规 则圆形样点时产生的误差,同时排除了背景噪声的干扰,真实的反应了样点的实际面积及 灰度;自动获得样点行列数并对样点进行编号,让编号与样点识别结果一一对应,打印结 果清晰明了,便于医学分析;同时对于大部分生物芯片图像,是可以较好地提取出其样点的 边缘。对于少数图像,由于拍摄环境、光照及芯片样点本身的荧光度的影响,拍出的样点图 像中个别样点可能对比度偏低、颜色偏浅,最终提取的边缘可能有较大的断裂,甚至无法提 取。这时可以人为地描绘这些样点的边缘。虽然少数情况下仍然有人工干预,但相对于传 统圆圈包含样点的方法,本发明大大提高了识别精度。对大部分图像,本发明完全实现了自 动化,无需人为输入任何参数,减小了人为操作可能导致的误差。而且本发明方法的软件实 现较简单、算法时间短,操作方便、快捷。综上所述,基于边缘检测的样点识别算法为生物芯 片图像分析领域提供了一种方便有效地分析手段。


图1是一幅4X5的生物蛋白芯片的扫描图。图2是根据边缘检测方法确定的样点区域。图3是对二值化后图像运用行列扫描法所获得的列投影波形。图4是根据二值化图像的投影结果划分的网格。图5是本发明的总流程图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本发明进一步详细说明。附图5示出采用VC++ 6. 0编程实现整个流程,并在EBS-I型便携式生物芯片检测 系统中实现。其中便携式生物芯片检测系统的主要参数有均勻照明性02CM2,照明面积 2CM2,图像采集速度M帧/秒。同时参照附图,对本发明作进一步详细说明。步骤Sl 对生物芯片连续拍摄多幅图,合成取其平均值作为原图;步骤S2 对原图进行样点边缘提取,对样点边缘运用形态学中的膨胀运算进行边 缘连接及对样点边缘内进行区域填充,将原图转化为样点区域为黑色,背景区域为白色的 二值图像,以此来确定样点的真实区域;步骤S3 运用扫描法对生物芯片图像进行网格划分,得到生物芯片的网格,保证 每个网格内只有一个样点,并自动确定样点阵列的行、列数,根据生物芯片的网格对样点按 行依次进行编号;步骤S4 记录下二值图像中每个网格内黑色像素点的位置,每个网格内黑色像素
5点的位置它与原图中样点区域的位置一一对应;根据这些位置信息,获取并保存原图中样 点的面积及灰度值;步骤S5 将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得 到样点的自动识别结果。所述样点边缘提取的步骤是步骤S21 根据原图像的灰度梯度信息,运用自适应阈值的Carmy算法自动提取原 图中的样点边缘;步骤S22 如果自动提取边缘失败,则转为手工描绘边缘。上述方案中,对自动提取边缘和手工描绘边缘的二值图像进行形态学腐蚀运算, 再进行形态学开运算,最终确定出样点的真实区域。上述方案中,确定所述样点面积及灰度值是将原图与二值图像进行对比,记录下 二值图像中黑色像素点的位置,获取原图中相应位置处样点的面积及灰度值。上述方案中,所述自适应阈值的确定步骤如下步骤S211 将Carmy运算中非极值抑制后的图像像素点划分为D1, D2, D3三个类别, 其中D1包含梯度幅值为{t1;t2,……tk}的像素,代表着原图中的非边缘点;D2包含梯度幅 值为itk+1,tM,……tm}的像素,代表着原图中需要判断是否为边缘点的点;D3包含梯度幅 值为itm+1,t_2,……tj的像素,代表着原图中的边缘点;S212 设原图中总的像素数为N,灰度梯度为、对应的像素数为叫,灰度梯度、出 现的概率为Pi = η,/Ν, i = 1,2……,1,则整个区间的梯度幅值期望为
权利要求
发生在D1, D2, D3类内像素的梯度幅值期望θι (k)、e2 (k,m)、e3 (m)分别为
1.一种基于边缘检测的生物芯片样点识别方法,其特征在于,该方法包括的步骤如下步骤Sl 对生物芯片连续拍摄多幅图,合成取其平均值作为原图;步骤S2 对原图进行样点边缘提取,对样点边缘运用形态学中的膨胀运算进行边缘连 接及对样点边缘内进行区域填充,将原图转化为样点区域为黑色,背景区域为白色的二值 图像,以此来确定样点的真实区域;步骤S3:运用扫描法对生物芯片图像进行网格划分,得到生物芯片的网格,保证每个 网格内只有一个样点,并自动确定样点阵列的行、列数,根据生物芯片的网格对样点按行依 次进行编号;步骤S4:记录下二值图像中每个网格内黑色像素点的位置,每个网格内黑色像素点的 位置它与原图中样点区域的位置一一对应;根据这些位置信息,获取并保存原图中样点的 面积及灰度值;步骤S5:将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得到样 点的自动识别结果。
2.如权利要求1所述的基于边缘检测的生物芯片样点识别方法,其特征在于,所述样 点边缘提取的步骤是步骤S21 根据原图像的灰度梯度信息,运用自适应阈值的Carmy算法自动提取原图中 的样点边缘;步骤S22 如果自动提取边缘失败,则转为手工描绘边缘。
3.如权利要求2所述的基于边缘检测的生物芯片样点识别方法,其特征在于,对自动 提取边缘和手工描绘边缘的二值图像进行形态学腐蚀运算,再进行形态学开运算,最终确 定出样点的真实区域。
4.如权利要求1所述的基于边缘检测的生物芯片样点识别方法,其特征在于,确定所 述样点面积及灰度值是将原图与二值图像进行对比,记录下二值图像中黑色像素点的位 置,获取原图中相应位置处样点的面积及灰度值。
5.如权利要求2所述的基于边缘检测的生物芯片样点识别方法,其特征在于,所述自 适应阈值确定的步骤如下步骤S211 将Carmy运算中非极值抑制后的图像像素点划分为D1, D2, D3三个类别,其 中D1包含梯度幅值为{t1;t2,……tk}的像素,代表着原图中的非边缘点;D2包含梯度幅值 为{tk+1,tM,……tm}的像素,代表着原图中需要判断是否为边缘点的点;D3包含梯度幅值 为{tm+1,t_2,……tj的像素,代表着原图中的边缘点;步骤S212:设原图中总的像素数为N,灰度梯度为、对应的像素数为叫,则灰度梯 度、出现的概率为Pi = ni/N,i = 1,2……,1,则整幅图像素的灰度梯度幅值期望为k T^tl-Plm Σ ^plι Σ t^-Piex (k) = -i^-,e2 (k, m)=i=k+\ m,e3(m)=^f——(2)Σρ, /=1Σ ρ, i=k+\Σ ρ, i=m-\-\并且定义/= Σ Pi 'P(Km) 二 Yj ρ, ,p(m) = ^ Pi⑶/=1i=k+\i=m+\定义评价函数σ 2 (k,m) = (θι (k) -E)2 · ρ (k) + (e2 (k,m) -E)2 · ρ (k,m) + (e3 (m) -E)2 · ρ (m) (4)即kmIHfi-Pi , k Tt--P, , Yh-Pi , , a\k,m) = (^-k——Yjtl-P1Y-Y4P1+^——Zi-'Λ)2" Σ A+(^——Σ',' Ρ, ' Σ P,'Σρ.Σ ρ,Σ ρ, "ι '=m+1/=1i-k+\i=m+)对于一幅已知图,上式中的灰度梯度ti出现的概率Pi通过它的梯度直方图求出,梯度 等级1人为地确定;因此上式即为一个关于k和m的二元二次函数,k在[1,1]之间取值, m在[k+l,l]之间取值;ο 2(k,m)描述了类间方差,而类间方差最大化是数理统计意义上类 间分离性最好的判据之一;因此能搜索o2(k,m)的最大值,其最大值对应的tk,tm的值即 为DpDyD3E间的分界点,也即为所求的Carmy算子的高、低阈值,σ表示三个区间的类间 方差;P表示具体某个梯度出现的概率;Di,D2, D3是根据图像像素的灰度梯度划分的三个类 别;t表示图像像素的灰度梯度;i = l,2-k…πι···1表示梯度等级,N表示图像总的像素; Iii表示灰度梯度为、对应的像素个数;p(k)表示第一类像素点出现的概率,p(k,m)表示第 二类像素点出现的概率,P (m)表示第三类像素点出现的概率;ο 2(k,m)表示三个类别的类 间方差。
全文摘要
本发明提出了一种基于边缘检测的生物芯片样点识别方法,该方法首先通过边缘提取、边缘连接、区域填充确定出样点的真实区域,再运用扫描法划分网格,自动获得样点行、列数及总数。最后将确定出的每个网格内的样点区域位置与原图对应,自动搜索获得原图中样点的面积及灰度均值;将原图中样点的面积、灰度值与标准芯片中样点的相应参数做比较,得到样点的自动识别结果。该方法具有很高的定位精确性,并且其软件实现较简单、算法时间短,操作方便、快捷,使生物芯片信息提取的完全自动化和智能化成为可能。
文档编号G06T5/00GK102073876SQ201110006888
公开日2011年5月25日 申请日期2011年1月10日 优先权日2011年1月10日
发明者严伟, 李艳丽, 胡松 申请人:中国科学院光电技术研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1