基于图像识别的人类染色体分析装置、设备及存储介质的制作方法

文档序号:16682148发布日期:2019-01-19 00:37阅读:152来源:国知局
基于图像识别的人类染色体分析装置、设备及存储介质的制作方法

本发明涉及医学领域,特别涉及一种基于图像识别的人类染色体分析装置、设备及计算机存储介质。



背景技术:

染色体分析是细胞遗传中一个重要的常规检测手段,且是检测染色体疾病的诊断依据。对染色体进行分析检测主要是对染色体中的片段缺失、重复、倒位,置换及染色体数目变化等的检测。

目前对染色体进行分析的传统方法是采用人工的方法对染色体进行分析,以确定染色体以及其相关的疾病,由于人体内包含23对染色体,对每一对染色体逐一的分析,会秏费技术人员大量的时间,且受主观因素影响较大。例如由于技术人员的技术经验和精力有限,遇到无法辨别的染色体异常情况,需要花费更长的时间去分析研究,或因无法辨别染色体异常情况而导致误判,可靠性较低。

因此,如何提高对染色体进行分析的效率和可靠性是本领域的技术瓶颈。



技术实现要素:

本发明的目的在于公开一种基于图像识别的人类染色体分析装置、设备及存储介质,提高了染色体进行分析的效率和可靠性。

为实现上述目的,本发明实施例公开了如下技术方案:

第一,本发明实施例公开了一种基于图像识别的人类染色体分析装置,包括:

获取模块,用于获取与染色体对应的图像;

处理模块,用于对所述图像进行图像处理得到目标图像,并对所述目标图像中的染色体进行分割,得到多条独立染色体;

提取模块,用于对各所述独立染色体进行特征提取,得到与各所述独立染色体对应的染色体特征;

分析模块,用于根据与各所述独立染色体对应的染色体特征,利用训练好的分类器对各所述独立染色体进行分类以对各所述独立染色体进行分析。

优选的,所述处理模块具体包括:

第一处理单元,用于对所述图像进行图像滤波处理以去除所述图像中的噪声;

第二处理单元,用于对经所述第一处理单元处理后的图像进行图像二值化处理以将所述图像转换为黑白图;

第三处理单元,用于基于轮廓线跟踪算法对与所述染色体对应的黑白图进行分割得到包含染色体的目标图像;

第四处理单元,用于基于形态学图像处理对所述目标图像中的染色体进行分割,得到多条所述独立染色体。

优选的,所述第四处理单元具体包括:

处理子单元,用于识别所述目标图像中染色体的边界线,根据所述染色体的边界线将所述染色体分割为多条所述独立染色体。

优选的,所述提取模块具体包括:

第一提取单元,用于对各所述独立染色体的中轴线进行提取;

第二提取单元,用于对各所述独立染色体的染色体长度进行提取;

第三提取单元,用于对各所述独立染色体的着丝粒指标进行提取;

第四提取单元,用于对各所述独立染色体的带型进行提取,其中,所述染色体特征包括所述中轴线、所述染色体长度、所述着丝粒指标和所述带型。

优选的,所述提取模块还包括:

第五提取单元,用于对各所述独立染色体的面积进行提取。

优选的,所述分析模块包括:

分类器训练单元,用于通过输入的与所述染色体对应的样本数据对初始分类器进行训练,得到训练分类器,所述样本数据包括正常染色体及正常染色体多态性特征数据和异常染色体特征数据;

分类单元,用于利用所述训练分类器和所述染色体特征对各所述独立染色体进行分类,输出多个分类结果;

分析单元,用于对所述训练分类器的输出结果进行分析。

第二,本发明实施例公开了一种基于图像识别的人类染色体分析设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述存储器中存储的计算机程序时,实现如下步骤:

获取与染色体对应的图像;

对所述图像进行图像处理得到目标图像,并对所述目标图像中的染色体进行分割,得到多条独立染色体;

对各所述独立染色体进行特征提取,得到与各所述独立染色体对应的染色体特征;

根据与各所述独立染色体对应的染色体特征,利用训练好的分类器对各所述独立染色体进行分类以对各所述独立染色体进行分析。

第三,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如下步骤:

获取与染色体对应的图像;

对所述图像进行图像处理得到目标图像,并对所述目标图像中的染色体进行分割,得到多条独立染色体;

对各所述独立染色体进行特征提取,得到与各所述独立染色体对应的染色体特征;

根据与各所述独立染色体对应的染色体特征,利用训练好的分类器对各所述独立染色体进行分类以对各所述独立染色体进行分析。

可见,本发明实施例公开的一种基于图像识别的人类染色体分析装置,首先由获取模块获取与染色体对应的图像,然后由处理模块对图像进行图像处理得到目标图像,并对目标图像中的染色体进行分割,得到多条独立染色体,提取模块对各独立染色体进行特征提取,得到与各独立染色体对应的染色体特征,最后由分析模块根据与各独立染色体对应的染色体特征,利用训练好的分类器对各独立染色体进行分类以对各独立染色体进行分析。因此,通过本申请公开的分析装置,能够采用自动化的方式对人类染色体进行分析,相比于现有技术中采用人工的方式而言,采用自动化的方式不仅能节省大量的时间,而且也不受技术经验的限制,很大程度上提高了对染色体的分析效率和可靠性。此外,本发明实施例还公开了一种用于染色体的分析设备及存储介质,效果如上。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种基于图像识别的人类染色体分析装置结构示意图;

图2为本发明实施例公开的一种基于图像识别的人类染色体分析设备结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种基于图像识别的人类染色体分析装置、设备及存储介质,提高了染色体进行分析的效率和可靠性。

请参见图1,图1为本发明实施例公开的一种基于图像识别的人类染色体分析装置结构示意图,该分析装置包括:

获取模块101,用于获取与染色体对应的图像。

处理模块102,用于对图像进行图像处理得到目标图像,并对目标图像中的染色体进行分割,得到多条独立染色体。

提取模块103,用于对各独立染色体进行特征提取,得到与各独立染色体对应的染色体特征。

分析模块104,用于根据与各独立染色体对应的染色体特征,利用训练好的分类器对各独立染色体进行分类以对各独立染色体进行分析。

具体的,本实施例中,获取模块101中的图像是由蔡司显微镜或徕卡显微镜扫描的下机图像(该图像是在显微镜下对人体细胞的染色体玻片进行观察、筛选以获得理想的染色体图像,理想的染色体图像指的是在显微镜的视野范围内,染色体组(46条独立染色体)清晰可见),采用摄像头将显微镜视野范围内23对染色体都清晰可见的染色体进行摄影取照,并将拍摄的图片作为本发明实施例中的图像。关于图像是通过何种显微镜或电子器件获得的,本发明实施例并不作限定。

进一步,处理模块102的主要目的是,将23对染色体(46条染色体)进行分割得到46条独立的染色体,处理的过程是:先将图像进行预处理,即将包含染色体的图像区域从图像中提取出来,预处理的主要环节包括:先对图像进行图像滤波、灰度变换、小波变换等将图像进行清晰度处理以得到包含染色体的区域图像与背景图像区分度较大的图像。其次是图像分割部分,图像分割部分主要包括两大过程,第一个阶段是对包含染色体的图像区域与图像背景分开来。得到包含染色体区域的目标图像后,将包含染色体区域的目标图像中的染色体进行分割得到46条独立染色体,图像分割的主要过程是:先对包含46条染色体的原始图像进行梯度二值化,其次再基于轮廓线跟踪算法对进行梯度二值化的原始图像基于轮廓线跟踪算法将染色体区域与背景图像分开来得到包含染色体的目标图像,最后基于形态学图像处理对目标图像中的染色体进行分割,得到多条独立染色体。关于处理模块102的详细过程将在下一实施例进行详细介绍。

其次,关于提取模块103,本实施例中,以46条染色体为例,在得到46条独立染色体之后,每条独立染色体都包含着染色体特征,染色体特征的类型主要包括以下几种:染色体长度、着丝粒指标、面积、中轴线和带型等。需要说明的是,在对每条独立染色体进行特征提取时,可以只提取最能反应染色体信息的特征即可,不必将所有与染色体相关的特征提取,如将染色体长度、着丝粒指标和带型作为各个独立染色体的染色体特征。

对于分析模块104,在得到各个独立染色体的染色体特征后,将其作为分类器的输入,将各个染色体特征对应的染色体的分类结果作为输出,对于该部分,首先需要对初始分类器进行训练,训练时输入的样本数据包括:46条染色体的序号(每一条染色体均有各自对应的序号),每个序号对应的染色体的异常信息(包括染色体长度异常、染色体的带型异常等),每个序号对应的染色体的正常信息(包括染色体的正常长度信息和染色体的正常带型信息等),将样本数据输入至分类器之后,由分类器输出46条染色体的分类结果(正常染色体的分类与排列,异常染色体的分类与排列以及类型和命名(染色体重复、插入、易位、倒位及数目异常)等分类结果)。

可见,本发明实施例公开的一种基于图像识别的人类染色体分析装置,首先由获取模块获取与染色体对应的图像,然后由处理模块对图像进行图像处理得到目标图像,并对目标图像中的染色体进行分割,得到多条独立染色体,提取模块对各独立染色体进行特征提取,得到与各独立染色体对应的染色体特征,最后由分析模块根据与各独立染色体对应的染色体特征,利用训练好的分类器对各独立染色体进行分类及分析。因此,通过本申请公开的分析装置,能够采用智能化的方式对染色体进行分析,相比于现有技术中采用人工的方式而言,采用自动化的方式不仅能节省大量的时间,而且也不受技术经验的限制,从一定程度上提高了对染色体的分析效率和可靠性。

基于上述实施例,作为优选的实施例,处理模块102包括:

第一处理单元,用于对图像进行图像滤波处理以去除图像中的噪声。

第二处理单元,用于对经第一处理单元后的图像进行图像二值化处理以将图像转换为黑白图。

第三处理单元,用于基于轮廓线跟踪算法对于染色体对应的黑白图进行分割得到包含染色体的目标图像。

第四处理单元,用于基于形态学图像处理对目标图像中的染色体进行分割,得到多条独立染色体。

具体的,本实施例中,通过第一处理单元对图像进行图像滤波处理可以参见现有技术,其主要是对包含染色体的图像进行降噪或去噪处理,对于图像的去噪和降噪可以采用以下三种方法:第一种,可以在频域采用低通滤波法去除噪声频段中的高频段;第二种,可以在空域采用领域平均法和中值滤波法进行降噪和去噪。关于低通滤波法去噪、领域平均法去噪和中值滤波法去噪可以参见现有技术。本发明实施例在此不再赘述。

第二处理单元用于对经过去噪后的图像进行二值化处理,二值化处理的目的是将去噪后的图像转换为黑白图(也可以对去噪后的图像进行灰度化),对去噪后的图像进行二值化处理的目的是:增大染色体与背景之间的反差。缩小染色体内部明带和暗带的差异,从而有利于将染色体作为一个整体从背景中分离出来。

第三处理单元用于基于轮廓线跟踪算法对染色体对应的黑白图进行分割得到包含染色体的目标图像。其中,轮廓线跟踪算法可以参见现有技术,应用于本发明实施例中,在得到染色体与背景之间反差较大的黑白图后,染色体与背景之间的边界很清晰,染色体内部的亮带和暗带的交界也很清楚。基于此,利用轮廓线跟踪算法确定整个染色体区域最外围的边界,也就得到染色体区域与背景之间的边界。轮廓线跟踪算法的目的是沿着图形等色区域的边界搜索,将搜索到的边界线(轮廓)上的点记录到点列中。每一个点列就表示一条轮廓线。本发明实施例中,最终得到的染色体的像素为白色,背景色的像素为黑色。则边界搜索的步骤如下:首先是按照图形扫描方向搜索,检查当前图像的像素是白还是黑,将最先检测出的黑像素作为轮廓线追踪的起点,以该起点开始,按照顺序检测各像素是否为黑像素,如果按照顺序检测出的各个像素点均为白色,则停止追踪,将此次跟踪的轮廓线作为追踪完成的第一条轮廓线,依次类推。当然,基于轮廓跟踪算法对黑白图进行轮廓跟踪从而将包含染色体的区域部分和背景部分进行分离得到包含染色体的区域图像。

第四处理单元中,基于形态学图像处理对目标图像中的染色体进行分割,得到多条独立染色体。关于此部分,形态学图像处理的概念可以参见现有技术,应用于本发明实施例中,在得到包含染色体的区域图像后,然后沿着该区域图像的x轴扫描,当发现与背景色不同的像素点时,沿着该像素点的边界进行搜索,得到该条染色体的边界,得到一条染色体后,记录其边界信息,把已得到的该染色体从背景上抹去,然后继续提取其余的染色体,依次提取出46条独立的染色体。

其中,作为优选的实施例,第四处理单元具体包括处理子单元,用于识别目标图像中染色体的边界线,根据染色体的边界线将染色体分割为多条独立染色体。

基于上述实施例,提取模块103具体包括:

第一提取单元,用于对各独立染色体的中轴线进行提取。

第二提取单元,用于对各独立染色体的染色体长度进行提取。

第三提取单元,用于对各独立染色体的着丝粒指标进行提取。

第四提取单元,用于对各独立染色体的带型进行提取,其中,染色体特征包括中轴线、染色体长度、着丝粒指标和带型。

具体的,本实施例中,第一提取单元从各个独立染色体中提取染色体中轴,然后根据提取出的独立染色体中轴指标确定各个独立染色体的长度,着丝粒指标和带型。其中,精确的提取出染色体的中轴对分割交叉染色体、计算染色体长度、寻找着丝粒位置至关重要。其中,对独立染色体中的中轴进行提取包括以下两个方法:内切圆法和细化法,关于内切圆法也称为骨架法,主要步骤如下:对独立染色体中的每一点找出区域边界上的最近邻点,若该条独立染色体的区域内某点有一个以上边界点与其有相同的最小距离,则该点位于对称轴或中轴,然后将找出的相邻的中轴点连接成骨架。如此,该骨架便为找出的独立染色体的中轴。其次是细化法,细化法为连续剥离独立染色体的最外层元素直到获得单位宽度的连通线(即为中轴线),因此细化算法就是重复剥掉二值独立染色体的边界像素。关于细化算法可以参见现有技术,应用于本发明实施例中,细化步骤为:确定独立染色体的最外侧的边界,然后将该边界点赋值为独立染色体的背景值,即相当于将独立染色体缩小了一圈。依次类推,便可以获得每个独立染色体的骨架(即中轴线)。

第二提取单元是对染色体长度的提取,该部分对于染色体长度的提取可以通过中轴线的长度进行表示,因此,染色体长度的获取就是对独立染色体的中轴线长度的测量。独立染色体图像是以位图的方式存放,也就是说独立染色体的中轴线也是由一些相连的点集组成,依靠这些相连的点集测量独立染色体的中轴线过程如下:首先找到染色体中轴线的一个端点,并记录该端点的像素,记此时的长度为0,从该端点开始沿着中轴线前进,取第二个点,记录该端点与第二个点的关系,若第二点位于第一点的邻域内,则记其关系为直线相邻,长度增加1.1,若第二点位于端点的斜方向上,记其关系为斜线相邻,长度增加1.5(根据实际情况,该处的数值可以变化)。重复上述过程,直到推进独立染色体中轴线的另一个端点为止,此时所测量的中轴线的长度即为独立染色体中轴线的长度。

第三单元,关于独立染色体着丝粒指标的提取,通过以上各步骤的处理,已经得到各个独立染色体的轮廓曲线和中轴线,然后对中轴线上的点取垂线,此时,垂线与轮廓线相交得到交点,得到经过该交点和中轴线上的点的垂线段,求出染色体中轴线上每一点的垂线段的长度,对应于最短垂线段所在的中轴线上的点即为着丝粒所在的位置。

第四提取单元是对独立染色体的带型进行提取,染色体的带型表达的是染色体图像沿着中轴线的灰度分布,可以直接将染色体中轴线上各点的灰度值作为染色体带型。本发明实施例中,对染色体中轴线上的各点,取其相对于中轴线的垂线上各目标点的平均灰度值作为该点的带型值。

其中,作为优选的实施例,提取模块103还包括:

第五提取单元,用于对各独立染色体的面积进行提取。

具体的,本实施例中,对独立染色体的面积进行提取即求解独立染色体的各边界所包围的封闭区域的面积。

基于上述实施例,作为优选的实施例,分析模块104包括:分类器训练单元,用于通过输入的与染色体对应的样本数据对初始分类器进行训练,得到训练分类器,样本数据包括正常染色体特征数据和异常染色体特征数据。

分类单元,用于利用训练分类器和染色体特征对各独立染色体进行分类,输出多个分类结果。

分析单元,用于对训练分类器的输出结果进行分析。

具体的,本实施例中,在得到独立染色体的染色体特征后,将染色体特征作为分类器的输入,每一条独立染色体都具有与其对应的染色体序号。将每一个独立染色体的染色体特征输入分类器后,分类器便自动学习得到每一种序号下正常染色体、异常染色体以及异常染色体的类型。本发明实施例中,可以采用几何分类法进行分类,也可以采用手动分类。对于几何分类法,可以先将独立染色体按照长端和短端进行分类,进而将各个独立染色体分为不同长度类别的染色体组。其次,再以着丝粒为依据进行分类将染色体分为不同的着丝粒组,最后再基于带型将独立染色体分为不同的带型组。此后,再对各组类别中的独立染色体再进行重排和分组。从而将分类结果确定为染色体数目异常,染色体易位、染色体倒位以及染色体缺失插入等类别。

下面对本发明实施例公开的一种基于图像识别的人类染色体分析设备进行介绍,请参见图2,图2为本发明实施例公开的一种基于图像识别的人类染色体分析设备结构示意图,包括:

存储器201,用于存储计算机程序;

处理器202,用于执行存储器中存储的计算机程序时,实现如下步骤:

获取与染色体对应的图像;

对图像进行图像处理得到目标图像,并对目标图像中的染色体进行分割,得到多条独立染色体;

对各独立染色体进行特征提取,得到与各独立染色体对应的染色体特征;

根据与各独立染色体对应的染色体特征,利用训练好的分类器对各独立染色体进行分类以对各独立染色体进行分析。

可见,本实施例公开的一种基于图像识别的人类染色体分析设备,由于可以通过处理器调用存储器存储的与用于染色体的分析装置中的计算机程序相同的分析程序,从而实现如上述任一实施例基于图像识别的人类染色体分析装置所具有的分析步骤,所以本分析设备具有同上述分析装置同样的实际效果。

为了更好地理解本方案,本发明实施例公开的一种计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现如下步骤:

获取与染色体对应的图像;

对图像进行图像处理得到目标图像,并对目标图像中的染色体进行分割,得到多条独立染色体;

对各独立染色体进行特征提取,得到与各独立染色体对应的染色体特征;

根据与各独立染色体对应的染色体特征,利用训练好的分类器对各独立染色体进行分类以对各独立染色体进行分析。

可见,本实施例公开的一种计算机可读存储介质,由于可以通过处理器调用计算机可读存储介质存储的与用于染色体的分析装置中的计算机程序相同的分析程序,从而实现如上述任一实施例提到的用于染色体的分析装置所具有的分析步骤,所以本分析设备具有同上述分析装置同样的实际效果。

以上对本申请所公开的一种基于图像识别的人类染色体分析装置、设备及存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1