一种受干扰的测序图像的识别方法、装置、设备及介质与流程

文档序号:32172157发布日期:2022-11-12 07:52阅读:41来源:国知局
一种受干扰的测序图像的识别方法、装置、设备及介质与流程

1.本发明涉及缺陷图像检测技术领域,特别是涉及一种受干扰的测序图像的识别方法、装置、设备及介质。


背景技术:

2.目前,基因测序技术发展大体分为四代,第一代是毛细管电泳测序技术,第二代是高通量测序技术,第三代是单分子测序技术,第四代是纳米孔测序技术。其中高通量测序技术是对毛细管电泳测序技术的一次革命性技术改革,主要特点包括鸟枪法测序、边合成边测序、测序通量高,使快速对一个物种全基因组功能研究成为可能,且相对于一代测序,不仅保持较高的准确度,且大大降低时间成本和金钱成本,使全民测序成为可能。
3.高通量测序的过程主要包括文库制备,测序,序列识别和组装三个阶段。测序阶段包括光学图像采集和处理过程,此过程采集高通量测序荧光图像,荧光图像主要包含碱基簇荧光强度信息,但实际采集到的荧光图像会存在液滴,亮斑,气泡和带状阴影等干扰。如果采集到的高通量测序荧光图像受到的干扰较为严重,会导致图像上碱基簇荧光强度信息缺失,不利于后续的图像处理和序列识别,并且会导致最终的测序质量下降,影响测序的准确度,并增加测序成本。目前高通量测序一次实验会产生几万张荧光图像,在高通量测序领域中从几万荧光图像中识别出受干扰的荧光图像一般是手动查看图像的方法,该方法指的是研究人员通过人眼识别荧光图像是否受到干扰,判断荧光图像是否为受干扰荧光图像,然而该方法需要研究人员实时识别每一张荧光图像,耗费大量时间,也耗费人力,识别干扰图像效率极低,这样既浪费研发人员的人力成本,也浪费了时间成本。
4.因此,如何解决识别受干扰的测序荧光图像时间过长,人力成本高的问题,是本领域技术人员亟待解决的技术问题。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种受干扰的测序图像的识别方法、装置、设备及介质,可以精确快速的识别出受到干扰的荧光图像,且能确定干扰因素,节省时间成本和人力成本。其具体方案如下:
6.一种受干扰的测序图像的识别方法,包括:
7.构建含有不同干扰因素的模板库;
8.采集待识别荧光图像;
9.对所述待识别荧光图像依次进行预处理、形态学处理、几何变换处理和分割处理;
10.对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓;
11.将得到的轮廓与所述模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像。
12.优选地,在本发明实施例提供的上述受干扰的测序图像的识别方法中,构建含有不同干扰因素的模板库,包括:
13.收集高通量测序试验产生的受干扰的荧光图像;
14.基于收集的荧光图像上的干扰因素,得到受不同干扰的模板图像;
15.根据得到的所述模板图像,构建含有不同干扰因素的模板库。
16.优选地,在本发明实施例提供的上述受干扰的测序图像的识别方法中,对所述待识别荧光图像进行预处理,包括:
17.对所述待识别荧光图像进行增加、降噪、拉伸、裁剪、缩放。
18.优选地,在本发明实施例提供的上述受干扰的测序图像的识别方法中,对所述待识别荧光图像进行形态学处理、几何变换处理,包括:
19.对预处理后的图像进行形态学处理,提取干扰因素的边缘,形成边缘梯度图像;
20.对所述边缘梯度图像进行几何变化处理;所述几何变换处理包括反转、裁剪和旋转。
21.优选地,在本发明实施例提供的上述受干扰的测序图像的识别方法中,对所述待识别荧光图像进行分割处理,包括:
22.根据预先确定的最优分割阈值,对几何处理后的图像进行分割处理,分割出图像上的干扰因素,并将干扰因素的灰度值设置为255,背景设置为0,以使干扰因素清晰地显示在图像上。
23.优选地,在本发明实施例提供的上述受干扰的测序图像的识别方法中,对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓,包括:
24.利用边界跟踪算法提取分割处理后的图像上的干扰因素的轮廓信息;
25.根据提取的轮廓信息,绘制得到相应的轮廓。
26.优选地,在本发明实施例提供的上述受干扰的测序图像的识别方法中,将得到的轮廓与所述模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像,包括:
27.对所述模板库中的模板图像进行轮廓的提取和绘制,获取所述模板图像上的轮廓;
28.将得到的干扰因素的轮廓和所述模板图像上的轮廓进行相似度匹配和面积对比;
29.判断相似度匹配和面积对比的结果是否满足阈值条件;所述阈值条件包括预先确定的最佳匹配阈值和最佳面积阈值;
30.若是,则将所述待识别荧光图像标记为受干扰图像;
31.若否,则将所述待识别荧光图像标记为正常图像。
32.本发明实施例还提供了一种受干扰的测序图像的识别装置,包括:
33.模板库构建模块,用于构建含有不同干扰因素的模板库;
34.图像采集模块,用于采集待识别荧光图像;
35.图像处理模块,用于对所述待识别荧光图像依次进行预处理、形态学处理、几何变换处理和分割处理;还用于对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓;
36.轮廓匹配模块,用于将得到的轮廓与所述模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像。
37.本发明实施例还提供了一种电子设备,包括处理器和存储器,其中,所述处理器执行所述存储器中存储的计算机程序时实现如本发明实施例提供的上述受干扰的测序图像
的识别方法。
38.本发明实施例还提供了一种计算机可读存储介质,用于存储计算机程序,其中,所述计算机程序被处理器执行时实现如本发明实施例提供的上述受干扰的测序图像的识别方法。
39.从上述技术方案可以看出,本发明所提供的一种受干扰的测序图像的识别方法,包括:构建含有不同干扰因素的模板库;采集待识别荧光图像;对待识别荧光图像依次进行预处理、形态学处理、几何变换处理和分割处理;对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓;将得到的轮廓与模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像。
40.本发明提供的上述受干扰的测序图像的识别方法,在无人监督的情况下,从轮廓匹配的角度,可以精确快速的识别出受到干扰的荧光图像,且能确定干扰因素,具有很强的鲁棒性,节省时间成本和人力成本。此外,本发明还针对受干扰的测序图像的识别方法提供了相应的装置、设备及计算机可读存储介质,进一步使得上述方法更具有实用性,该装置、设备及计算机可读存储介质具有相应的优点。
附图说明
41.为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
42.图1为本发明实施例提供的受干扰的测序图像的识别方法的流程图;
43.图2为本发明实施例提供的受干扰的测序图像的识别方法的具体流程图;
44.图3为本发明实施例提供的模板库的图像示例之一;
45.图4为本发明实施例提供的模板库的图像示例之二;
46.图5为本发明实施例提供的预处理后的图像;
47.图6为本发明实施例提供的形态学处理后的图像;
48.图7为本发明实施例提供的几何变换处理后的图像;
49.图8为本发明实施例提供的分割处理后的图像;
50.图9为本发明实施例提供的分割阈值为10-240时分割处理后的图像;
51.图10为本发明实施例提供的分割阈值为195-204时分割处理后的图像;
52.图11为本发明实施例提供的受干扰的测序图像的识别装置的结构示意图。
具体实施方式
53.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.本发明提供一种受干扰的测序图像的识别方法,如图1所示,包括以下步骤:
55.s101、构建含有不同干扰因素的模板库;
56.具体地,本发明考虑到荧光图像受到干扰因素的不同,设置了不同的模板,即模板库中存在多种干扰因素的图像模板,利用该模板库可以精度地检测受干扰的荧光图像。
57.s102、采集待识别荧光图像;
58.在实际应用中,从高通量测序试验中可获取尺寸大小一致的所有荧光图形,试验产生2-15万张荧光图像。基于高通量测序拍照命名规则,即一张荧光图像上检测到干扰因素,则与其对应的荧光图像上也有干扰因素。基于高通量测序荧光图像命名规则,根据此次高通量测序试验的荧光图像的存放目录,又图像是对称形成,可以按照其规则抽取一半荧光图像用于后续检测。这样批量处理图像可以节省检测的时间。
59.s103、对待识别荧光图像依次进行预处理、形态学处理、几何变换处理和分割处理;
60.s104、对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓;
61.s105、将得到的轮廓与模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像。
62.可以理解的是,对模型匹配成功的荧光图像可以认为是受干扰荧光图像,最后可以把该受干扰荧光图像进行输出。
63.在本发明实施例提供的上述受干扰的测序图像的识别方法中,在无人监督的情况下,从轮廓匹配的角度,可以精确快速的识别出受到干扰的荧光图像,且能确定干扰因素,如液滴亮斑,气泡和带状阴影等干扰因素,具有很强的鲁棒性,节省时间成本和人力成本。
64.在具体实施时,在本发明实施例提供的上述受干扰的测序图像的识别方法中,步骤s101构建含有不同干扰因素的模板库,如图2所示,具体可以包括:收集高通量测序试验产生的受干扰的荧光图像;基于收集的荧光图像上的干扰因素,得到受不同干扰的模板图像;根据得到的模板图像,构建含有不同干扰因素的模板库。也就是说,根据当前高通量测序试验产生的受干扰的荧光图像,利用已知的受干扰图像样本来构建含有不同干扰因素的模板库,使模板库中图像模板在之后检测荧光图像的过程中可以充分匹配。图3和图4示出了模板库的图像示例。
65.在具体实施时,在本发明实施例提供的上述受干扰的测序图像的识别方法中,步骤s103对待识别荧光图像进行预处理,可以包括:对待识别荧光图像进行增加、降噪、拉伸、裁剪、缩放。其中,图像缩放采用的方法不仅限于双线性插值法,也可以是最近邻插值,使用像素关系重采样以及立方插值。在预处理后可形成图5示出的八位深度图像。
66.在具体实施时,在本发明实施例提供的上述受干扰的测序图像的识别方法中,步骤s103对待识别荧光图像进行形态学处理、几何变换处理,可以包括:对预处理后的图像进行形态学处理,提取干扰因素的边缘,形成边缘梯度图像;对边缘梯度图像进行几何变化处理。
67.需要注意的是,形态学处理的方式不仅限于开运算,闭运算也可以是形态学梯度处理,在提取干扰因素的边缘后,可形成图6示出的边缘梯度图像。对边缘梯度图像做几何变化处理后,可形成图7示出的图像。几何变换处理的方式包括但不限于反转、裁剪和旋转。
68.在具体实施时,在本发明实施例提供的上述受干扰的测序图像的识别方法中,步骤s103对待识别荧光图像进行分割处理,可以包括:根据预先确定的最优分割阈值,对几何处理后的图像进行分割处理,分割出图像上的干扰因素,并将干扰因素的灰度值设置为
255,背景设置为0,以使干扰因素清晰地显示在图像上。
69.需要说明的是,对做过几何变换处理过的图像做图像分割处理(包括但不限于基于阈值分割方法,基于区域的图像分割方法,基于边缘检测的分割方法,基于特征增强的分割方法)。干扰因素的识别依赖于图像分割的质量,阈值法是一种简单有效的图像分割方法,有全局阈值法和局部阈值法两种。利用全局灰度信息对整张图像求出最优分割阈值,图像分割后可形成图8示出的灰度图像,灰度图像仅显示干扰因素。具体地,最优分割阈值的确定方法可以是设置不同的阈值来生成干扰因素轮廓图像(如气泡),通过不同的图像上干扰因素轮廓的完整性和其他区域的影响因素大小来确定的。图9示出了分割阈值为10-240(间隔为10)时分割处理后的24张图像,很明显阈值190到阈值210对应的图像较为完整。图10示出了分割阈值为195-204(间隔为1)时分割处理后的10张图像,这些图像完整且受其他区域的影响因素较小,因此,可以将最优分割阈值的范围设置为195-204。
70.在具体实施时,在本发明实施例提供的上述受干扰的测序图像的识别方法中,步骤s104对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓,可以包括:利用边界跟踪算法提取分割处理后的图像上的干扰因素的轮廓信息;根据提取的轮廓信息,绘制得到相应的轮廓。
71.在具体实施时,在本发明实施例提供的上述受干扰的测序图像的识别方法中,步骤s105将得到的轮廓与模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像,如图2所示,具体可以包括:对模板库中的模板图像进行轮廓的提取和绘制,获取模板图像上的轮廓;将得到的干扰因素的轮廓和模板图像上的轮廓进行相似度匹配和面积对比;判断相似度匹配和面积对比的结果是否满足阈值条件;阈值条件包括预先确定的最佳匹配阈值和最佳面积阈值;若是,则将待识别荧光图像标记为受干扰图像;若否,则将待识别荧光图像标记为正常图像。
72.具体地,上述步骤主要对从荧光图像上提取的轮廓信息与模板库中的轮廓进行相似度匹配。首先利用图像轮廓提取和绘制步骤中同样的方法提取模板库中模板的轮廓和待检测轮廓,进行相似度匹配,匹配方式主要有两种,第一种是对比轮廓的面积,第二种是轮廓相似度匹配。根据轮廓相似度匹配确定待检测图像上是否有干扰因素,匹配相似值越小则表示轮廓越相似。由于受干扰图像上的干扰因素除了主要干扰因素外会有其他微小影响因素。因此为了减少其他微小因素对检测影响,通过结合轮廓面积来确定是待检测图像上是否存在干扰因素。
73.本发明可以预先设置不同的匹配阈值和面积阈值,通过最终的受干扰图像检测率来确定最佳匹配阈值和最佳面积阈值。下面对一批含有受干扰的荧光图像进行测试,设置匹配阈值从0.1-1,匹配面积设置阈值100-1000,测试结果如表一。
74.表一
[0075][0076]
[0077]
从表一中可以看出,同样的匹配阈值条件下,匹配面积阈值越大,受干扰荧光图像检出率越低,而在相同匹配面积阈值条件下,匹配阈值越底,检出率相对越高,从表一可以看出,受干扰图像的检出率最接近真实值的匹配阈值和匹配面积阈值分别是0.1和500。但仍旧由于其他干扰因素,多检出两张荧光图像,基于同匹配面积匹配阈值越小检出率相对越高,对匹配阈值0.01-0.1又做了测试,如表二,当匹配阈值为0.05,匹配面积阈值为500的时候,受干扰荧光图像全部被检测出来。
[0078]
表二
[0079]
[0080][0081]
需要说明的是,本发明不仅可以在五分钟至十分钟内识别一批图像(如3万张图像),而且可以识别出液滴,亮斑,气泡和带状阴影等干扰的荧光图像,明显降低了时间成本和人力成本。在多次试验测试中,检出率是98%以上,证实本发明的可靠性。另外,本发明不仅适用于高通量测序领域,而且适用于其他产生领域受液滴亮斑,气泡和带状阴影等干扰的图像。
[0082]
基于同一发明构思,本发明实施例还提供了一种受干扰的测序图像的识别装置,由于该装置解决问题的原理与前述一种受干扰的测序图像的识别方法相似,因此该装置的实施可以参见受干扰的测序图像的识别方法的实施,重复之处不再赘述。
[0083]
在具体实施时,本发明实施例提供的受干扰的测序图像的识别装置,如图11所示,具体包括:
[0084]
模板库构建模块11,用于构建含有不同干扰因素的模板库;
[0085]
图像采集模块12,用于采集待识别荧光图像;
[0086]
图像处理模块13,用于对待识别荧光图像依次进行预处理、形态学处理、几何变换处理和分割处理;还用于对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓;
[0087]
轮廓匹配模块14,用于将得到的轮廓与模板库中模板图像上的轮廓进行匹配,以
识别出受干扰图像。
[0088]
在本发明实施例提供的上述受干扰的测序图像的识别装置中,可以通过上述四个模块的相互作用,在无人监督的情况下,从轮廓匹配的角度,精确快速的识别出受到干扰的荧光图像,且能确定干扰因素,具有很强的鲁棒性,节省时间成本和人力成本。
[0089]
关于上述各个模块更加具体的工作过程可以参考前述实施例公开的相应内容,在此不再进行赘述。
[0090]
相应地,本发明实施例还公开了一种电子设备,包括处理器和存储器;其中,处理器执行存储器中存储的计算机程序时实现前述实施例公开的受干扰的测序图像的识别方法。
[0091]
关于上述方法更加具体的过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
[0092]
进一步地,本发明还公开了一种计算机可读存储介质,用于存储计算机程序;计算机程序被处理器执行时实现前述公开的受干扰的测序图像的识别方法。
[0093]
关于上述方法更加具体的过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
[0094]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备、存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0095]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0096]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0097]
综上,本发明实施例提供的一种受干扰的测序图像的识别方法,包括:构建含有不同干扰因素的模板库;采集待识别荧光图像;对待识别荧光图像依次进行预处理、形态学处理、几何变换处理和分割处理;对分割处理后的图像进行轮廓的提取和绘制,得到干扰因素的轮廓;将得到的轮廓与模板库中模板图像上的轮廓进行匹配,以识别出受干扰图像。这样在无人监督的情况下,从轮廓匹配的角度,可以精确快速的识别出受到干扰的荧光图像,且能确定干扰因素,具有很强的鲁棒性,节省时间成本和人力成本。此外,本发明还针对受干扰的测序图像的识别方法提供了相应的装置、设备及计算机可读存储介质,进一步使得上述方法更具有实用性,该装置、设备及计算机可读存储介质具有相应的优点。
[0098]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作
之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0099]
以上对本发明所提供的受干扰的测序图像的识别方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1