单分子的识别、计数方法及装置与流程

文档序号：14836172发布日期：2018-06-30 12:29阅读：257来源：国知局

本发明涉及基因测序技术领域，尤其涉及一种单分子的识别、计数方法及识别、计数装置及处理系统。

背景技术：

在相关技术中，第三代测序技术为单分子测序，基于成像光学检测的单分子测序技术为依赖光学信号和依赖电信号的碱基识别技术。其中，依靠荧光识别的碱基团，所带荧光是在特定功率的激光照射下从激发态跃变到基态所发出的光强。但是由于不同荧光团发光的时间长度不同、发出的光强有差别以及背景噪声的存在等都会造成单分子识别的错误。同时DNA链分布不均，碱基团抱团等也会造成有效单分子的减少。

现有方法主要依靠人眼在采集到的荧光图像上进行单分子识别和计数，但这样的方法耗费人力而且速度也慢。而参照语音识别，采用基于HMM和机器学习的方法，不仅需要大量样本的训练，而且运行效率也不高。

技术实现要素：

本发明实施方式旨在至少解决现有技术中存在的技术问题之一。为此，本发明实施方式需要提供一种单分子的识别、计数方法及识别、计数装置。

本发明实施方式的一种单分子的识别方法，包括步骤：输入图像亮点强度的时间序列；根据所述时间序列，形成所述图像亮点的时间与强度的折线图，所述折线图由多条线段组成；对所述折线图进行网格划分以形成阵列排布的多个网格，统计落在每个所述网格的所述线段和/或所述线段的端点的次数；根据每个所述网格所对应的所述次数，对进行网格划分后的所述折线图进行线腐蚀以将进行网格划分后的所述折线图转换为简化图；对所述简化图进行游程编码以标识连通区域；计算每个所述连通区域的面积，判定满足以下条件的一个所述连通区域对应一个单分子：所述连通区域的面积大于第一设定阈值。上述单分子的识别方法，通过对亮点强度的时间序列的折线图转化为图像处理以得到直方图，能够快速地对单分子进行识别，而识别的精度也较高。

本发明实施方式的一种单分子的计数方法，包括步骤:输入图像亮点强度的时间序列；根据所述时间序列，形成所述图像亮点的时间与强度的折线图，所述折线图由多条线段组成；对所述折线图进行网格划分以形成阵列排布的多个网格，统计落在每个所述网格的所述线段和/或所述线段的端点的次数；根据每个所述网格所对应的所述次数，对进行网格划分后的所述折线图进行线腐蚀以将进行网格划分后的所述折线图转换为简化图；对所述简化图进行游程编码以标识连通区域；计算每个所述连通区域的面积，判定满足以下条件的一个所述连通区域对应一个单分子：所述连通区域的面积大于第一设定阈值；计算获得单分子的数目S2。上述单分子的计数方法，通过对亮点强度的时间序列的折线图转化为图像处理以得到直方图，能够快速地对单分子进行计数，而计数的精度也较高。

本发明实施方式的一种单分子的计数方法，包括步骤：输入图像亮点强度的时间序列；根据所述时间序列，形成所述图像亮点的时间与强度的折线图，所述折线图由多条线段组成；对所述折线图进行网格划分以形成阵列排布的多个网格，统计落在每个所述网格的所述线段和/或所述线段的端点的次数；根据每个所述网格所对应的所述次数，对进行网格划分后的所述折线图进行线腐蚀以将进行网格划分后的所述折线图转换为简化图；对所述简化图进行游程编码以标识连通区域；计算每个所述连通区域的面积，并判定满足以下条件时，对单分子的计数加1：所述连通区域的面积大于第一设定阈值。上述单分子的计数方法，通过对亮点强度的时间序列的折线图转化为图像处理以得到直方图，能够快速地对单分子进行计数，而计数的精度也较高。

本发明实施方式的一种单分子的识别装置，用以实施上述本发明一方面的单分子的识别方法的部分或全部步骤，包括：输入单元，用于输入图像亮点强度的时间序列；转化单元，用于根据所述输入单元中的所述时间序列，形成所述图像亮点的时间与强度的折线图，所述折线图由多条线段组成；网格统计单元，用于对来自所述转化单元的所述折线图进行网格划分以形成阵列排布的多个网格，统计落在每个所述网格的所述线段和/或所述线段的端点的次数；简化单元，用于根据每个所述网格所对应的所述次数，对进行网格划分后的所述折线图进行线腐蚀以将进行网格划分后的所述折线图转换为简化图；标识单元，用于对所述简化图进行游程编码以标识连通区域；判定单元，用于计算每个所述连通区域的面积，判定满足以下条件的一个所述连通区域对应一个单分子：所述连通区域的面积大于第一设定阈值。上述单分子的识别装置，通过对亮点强度的时间序列的折线图转化为图像处理以得到直方图，能够快速地对单分子进行识别，而识别的精度也较高。

本发明实施方式的一种单分子的计数装置，用以实施上述本发明一方面的单分子的计数方法的部分或全部步骤，包括：输入单元，用于输入图像亮点强度的时间序列；转化单元，用于根据所述输入单元中的所述时间序列，形成所述图像亮点的时间与强度的折线图，所述折线图由多条线段组成；网格统计单元，用于对来自所述转化单元的所述折线图进行网格划分以形成阵列排布的多个网格，统计落在每个所述网格的所述线段和/或所述线段的端点的次数；简化单元，用于根据每个所述网格所对应的所述次数，对进行网格划分后的所述折线图进行线腐蚀以将进行网格划分后的所述折线图转换为简化图；标识单元，用于对所述简化图进行游程编码以标识连通区域；判定单元，用于计算每个所述连通区域的面积，判定满足以下条件的一个所述连通区域对应一个单分子：所述连通区域的面积大于第一设定阈值；计算单元，用于计算获得单分子的数目S2。上述单分子的计数装置，通过对亮点强度的时间序列的折线图转化为图像处理以得到直方图，能够快速地对单分子进行计数，而计数的精度也较高。

本发明实施方式的一种单分子的计数装置，用以实施上述本发明一方面的单分子的计数方法的部分或全部步骤，包括：输入单元，用于输入图像亮点强度的时间序列；转化单元，用于根据所述输入单元中的所述时间序列，形成所述图像亮点的时间与强度的折线图，所述折线图由多条线段组成；网格统计单元，用于对来自所述转化单元的所述折线图进行网格划分以形成阵列排布的多个网格，统计落在每个所述网格的所述线段和/或所述线段的端点的次数；简化单元，用于根据每个所述网格所对应的所述次数，对进行网格划分后的所述折线图进行线腐蚀以将进行网格划分后的所述折线图转换为简化图；标识单元，用于对所述简化图进行游程编码以标识连通区域；判定单元，用于计算每个所述连通区域的面积，并判定满足以下条件时，对单分子的计数加1：所述连通区域的面积大于第一设定阈值。上述单分子的计数装置，通过对亮点强度的时间序列的折线图转化为图像处理以得到直方图，能够快速地对单分子进行计数，而计数的精度也较高。

本发明实施方式的一种单分子的处理系统，包括：数据输入装置，用于输入数据；数据输出装置，用于输出数据；存储装置，用于存储数据，所述数据包括计算机可执行程序；处理器，用于执行所述计算机可执行程序，执行所述计算机可执行程序包括完成上述任一实施方式的方法。该单分子的处理系统能够实现单分子识别和/或单分子计数。

本发明实施方式的一种计算机可读存储介质，用于存储供计算机执行的程序，执行所述程序包括完成上述任一实施方式的方法。计算机可读存储介质可以包括：只读存储器、随机存储器、磁盘或光盘等。

本发明实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明实施方式的实践了解到。

附图说明

本发明实施方式的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解，其中：

图1是本发明实施方式的单分子的识别方法的流程示意图。

图2是本发明实施方式的单分子的识别方法的另一流程示意图。

图3是本发明实施方式的单分子的识别方法的又一流程示意图。

图4是本发明实施方式的单分子的识别方法的又一流程示意图。

图5是本发明实施方式的单分子的识别方法的又一流程示意图。

图6是本发明实施方式的单分子的识别方法的又一流程示意图。

图7是本发明实施方式的单分子的识别方法的又一流程示意图。

图8是本发明实施方式的单分子的识别方法的又一流程示意图。

图9是本发明实施方式的单分子的识别方法的墨西哥帽滤波的曲线示意图。

图10是本发明实施方式的单分子的识别方法的再一流程示意图。

图11是本发明实施方式的单分子的识别方法中8连通像素的示意图。

图12是本发明实施方式的单分子的识别方法的折线图的示意图。

图13是本发明实施方式的单分子的识别方法中对折线图进行网格划分的示意图。

图14是本发明实施方式的单分子的识别方法中滤波前的折线图的示意图。

图15是本发明实施方式的单分子的识别方法中滤波后的折线图的示意图。

图16是本发明实施方式的单分子的识别方法的折线图的另一示意图。

图17是本发明实施方式的单分子的识别方法中均衡化后的直方图的示意图。

图18是本发明实施方式的单分子的识别方法的另再一流程示意图。

图19是本发明实施方式的单分子的识别方法中线腐蚀的过程示意图。

图20是本发明实施方式的单分子的识别方法中线腐蚀的另一过程示意图。

图21是本发明实施方式的单分子的识别方法中8连通窗口的示意图。

图22是本发明实施方式的单分子的识别方法中标识连通区域的示意图。

图23是本发明实施方式的单分子的计数方法的流程示意图。

图24是本发明实施方式的单分子的计数方法的另一流程示意图。

图25是本发明实施方式的单分子的计数方法的再一流程示意图。

图26是本发明实施方式的单分子的计数方法的又一流程示意图。

图27是本发明实施方式的单分子的识别装置的模块示意图。

图28是本发明实施方式的单分子的识别装置的又一模块示意图。

图29是本发明实施方式的单分子的识别装置的再一模块示意图。

图30是本发明实施方式的单分子的识别装置的另一模块示意图。

图31是本发明实施方式的单分子的识别装置的又再一模块示意图。

图32是本发明实施方式的单分子的识别装置的另一模块示意图。

图33是本发明实施方式的单分子的识别装置的另一模块示意图。

图34是本发明实施方式的单分子的识别装置的另一模块示意图。

图35是本发明实施方式的单分子的识别装置的另一模块示意图。

图36是本发明实施方式的单分子的识别装置的另一模块示意图。

图37是本发明实施方式的单分子的计数装置的模块示意图。

图38是本发明实施方式的单分子的计数装置的再一模块示意图。

图39是本发明实施方式的单分子的计数装置的另一模块示意图。

图40是本发明实施方式的单分子的计数装置的又再一模块示意图。

图41是本发明实施方式的单分子的计数装置的再又一模块示意图。

图42是本发明实施方式的单分子的计数装置的再另一模块示意图。

图43是本发明实施方式的单分子的处理系统的模块示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接或可以相互通信；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

下文的公开提供了许多不同的实施方式或例子用来实现本发明的不同结构。为了简化本发明的公开，下文中对特定例子的部件和设定进行描述。此外，本发明可以在不同例子中重复参考数字和/或参考字母，这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施方式和/或设定之间的关系。

本发明实施方式的单分子的识别方法及计数方法可应用于基因测序中，本发明实施方式所称的“基因测序”同核酸序列测定，包括DNA测序和/或RNA测序，包括长片段测序和/或短片段测序。

请参图1，本发明实施方式的一种单分子的识别方法，包括步骤：S01，输入图像亮点强度的时间序列；S02，根据时间序列，形成图像亮点的时间与强度的折线图，折线图由多条线段组成；S03，对折线图进行网格划分以形成阵列排布的多个网格，统计落在每个网格的线段和/或线段的端点的次数；S04，根据每个网格所对应的次数，对进行网格划分后的折线图进行线腐蚀以将进行网格划分后的折线图转换为简化图；S05，对简化图进行游程编码以标识连通区域；S06，计算每个连通区域的面积，判定满足以下条件的一个连通区域对应一个单分子：连通区域的面积大于第一设定阈值。上述单分子的识别方法，通过对亮点强度的时间序列的折线图转化为图像处理以得到游程编码的连通区域，能够快速地对单分子进行识别，而识别的精度也较高。该基于游程编码的单分子的识别方法能够根据亮点的强度的时间序列数据来准确识别单分子，尤其适用于一个亮点包含的单分子数目不大于3的情况。

具体地，在步骤S01中，在形成图像亮点时，利用特定波长的激光照射测试样品，使测试样品激发出荧光，然后利用相机采集荧光而所形成的图像，图像中存在对应于测试样品发出荧光的部分(核酸分子)的图像亮点。所称的“亮点”，指图像上的发光点，一个发光点占有至少一个像素点。所称“像素点”同“像素”。

在本发明的一个实施例中，图像来自单分子测序平台，例如Helicos、Pacific Biosciences(PacBio)公司的测序平台，输入的原始数据为图像的像素点的参数，对所称的“亮点”的检测为对单分子光学信号的检测。

在某些实施方式中，请参图2，单分子的识别方法，还包括：图像预处理步骤S31，图像预处理步骤分析输入的待处理图像以获得第一图像，待处理图像包含至少一个图像亮点，图像亮点具有至少一个像素点；亮点检测步骤S32，亮点检测步骤S32包括步骤：S321，分析第一图像以计算亮点判定阈值，S322，分析第一图像以获取候选亮点，S323，根据亮点判定阈值判断候选亮点是否为图像亮点，若判断结果为是，S324，则获取图像亮点强度的时间序列，若判断结果为否，S325，丢弃候选亮点。

因此，通过图像预处理步骤对待处理图像进行去噪处理，可减少亮点检测步骤的计算量，同时，通过亮点判断阈值判断候选亮点是否为图像亮点，可提高判断图像亮点的准确性。

具体地，在一个例子中，输入的待处理图像可为512*512或2048*2048的16位tiff格式的图像，tiff格式的图像可为灰度图像。如此，可简化单分子的识别方法的处理过程。

在某些实施方式中，请参图3，图像预处理步骤S31包括：对待处理图像进行减背景处理，以获得第一图像。如此，能够进一步减少待处理图像的噪声，使单分子的计数方法的准确性更高。

在某些实施方式中，请参图4，图像预处理步骤S31包括：对进行减背景处理后的待处理图像进行简化处理，以获得第一图像。如此，可减少后续单分子的识别和/或计数方法的计算量。

在某些实施方式中，请参图5，图像预处理步骤S31包括：对待处理图像进行滤波处理，以获得第一图像。如此，对待处理图像进行滤波可在尽量保留图像细节特征的条件下获取第一图像，进而可提高单分子的识别和/或计数方法的准确性。

在某些实施方式中，请参图6，图像预处理步骤S31包括：对待处理图像进行减背景处理后再进行滤波处理，以获得第一图像。如此，对待处理图像进行减背景后再进行滤波，能够进一步减少待处理图像的噪声，使单分子的识别和/或计数方法的准确性更高。

在某些实施方式中，请参图7，图像预处理步骤S31包括：对进行减背景处理后再进行滤波处理后的待处理图像进行简化处理，以获得第一图像。如此，可减少后续图像处理方法的计算量。

在某些实施方式中，请参图8，图像预处理步骤S31包括：对待处理图像进行简化处理以获得第一图像。如此，可减少后续单分子的识别和/或计数方法的计算量。

在某些实施方式中，对待处理图像进行减背景处理，包括：利用开运算确定待处理图像的背景，根据背景对待处理图像进行减背景处理。如此，利用开运算用来消除小物体、在纤细点处分离物体、平滑较大物体的边界的同时并不明显改变图像面积，可更准确地获取减背景处理后的图像。

具体地，在本发明实施方式中，在待处理图像f(x,y)(如灰度图像)移动a*a窗口(例如15*15窗口)，利用开运算(先腐蚀再膨胀)估计待处理图像的背景，如下公式1及公式2所示：

g(x,y)＝erode[f(x,y),B]＝min{f(x+x',y+y')-B(x',y')|(x',y')∈Db} 公式1，

其中，g(x,y)为腐蚀后的灰度图像，f(x,y)为原灰度图像，B为结构元素。

g(x,y)＝dilate[f(x,y),B]＝max{f(x-x',y-y')-B(x',y')|(x',y')∈Db} 公式2。

其中，g(x,y)为膨胀后的灰度图像，f(x,y)为原灰度图像，B为结构元素。

故可得背景噪声g＝imopen(f(x,y),B)＝dilate[erode(f(x,y),B)] 公式3。

对原图进行减背景：

f＝f-g＝{f(x,y)-g(x,y)|(x,y)∈D} 公式4。

可以理解，本实施方式的对待处理图像进行减背景处理的具体方法可适用于上述任一实施方式中提到的对待处理图像进行减背景处理的步骤。

在某些实施方式中，滤波处理为墨西哥帽滤波处理。墨西哥帽滤波易于实现，降低了单分子的识别和/或计数方法的成本，同时，墨西哥帽滤波能提升前景与背景的对比度，使前景更亮，使背景更暗。

在进行墨西哥帽滤波时，使用m*m窗口对滤波处理前的待处理图像进行高斯滤波，对高斯滤波后的待处理图像进行二维拉普拉斯锐化，m为自然数且为大于1的奇数。如此，通过两步骤实现了墨西哥帽滤波。

具体地，请参图9，墨西哥帽核可表示为：

其中，x和y表示像素点的坐标。

首先使用m*m窗口对待处理图像进行高斯滤波，如下公式6所示：

其中，t1和t2表示滤波窗口的位置，wt1,t2表示高斯滤波的权重。

然后对待处理图像进行二维拉普拉斯锐化，如下公式7所示：

其中，K和k均表示拉普拉斯算子，与锐化目标有关，如果需要加强锐化和减弱锐化，就修改K和k。

在一个例子中，m＝3，因此m*m＝3*3，进行高斯滤波时，公式6变为：

可以理解，本实施方式的墨西哥帽滤波的具体方法可适用于上述任一实施方式中提到的对待处理图像进行滤波处理的步骤。

在某些实施方式中，简化图像为二值化图像。如此二值化图像易于处理，且应用范围广。

具体地，在一个例子中，二值化图像可包含表征像素点不同属性的0和1二个数值，二值化图像可表示为：

在某些实施方式中，在进行简化处理时，根据简化处理前的待处理图像获取信噪比矩阵，并根据信噪比矩阵简化简化处理前的待处理图像以得到第一图像。

在一个具体例子中，可先对待处理图像进行减背景处理，之后再根据减背景处理后的待处理图像获取信噪比矩阵。如此，利于后续从噪声更少的图像获得信息，能够使单分子的识别和/或计数方法获得处理结果的准确性更高。

具体地，在一个例子中，信噪比矩阵可表示为：

其中，x和y表示像素点的坐标，h表示图像的高度，w表示图像的宽度，i∈w,j∈h。

在一个例子中，简化图像为二值化图像，可根据信噪比矩阵得到二值化图像，二值化图像如公式9所示：

在计算信噪比矩阵时，可先对待处理图像进行减背景处理和/或滤波处理，如上实施方式的减背景处理步骤和滤波处理步骤，根据减背景处理后得到公式4，再求得减背景处理后的待处理图像与背景的比值矩阵：

R＝f/g＝{f(x,y)/g(x,y)|(x,y)∈D}公式10，其中，D表示图像f的维度(高*宽)。

由此可以求得SNR矩阵：

在某些实施方式中，分析第一图像以计算亮点判定阈值的步骤，包括：通过大津法处理第一图像以计算亮点判定阈值。如此，通过较成熟及简单的方法实现了亮点判定阈值的查找，进而提高了单分子的识别和/或计数方法的准确性及降低了单分子的识别和/或计数方法的成本。同时，用第一图像进行亮点判定阈值的查找，可提高了单分子的识别和/或计数方法的效率和准确性。

具体地，大津法(OTSU算法)也可称为最大类间方差法，大津法利用类间方差最大来分割图像，意味着错分概率最小，准确性高。假设待处理图像的前景和背景的分割阈值为T，属于前景的像素点数占整幅图像的比例为ω0，其平均灰度为μ0；属于背景的像素点数占整幅图像的比例为ω1，其平均灰度为μ1。待处理图像的总平均灰度记为μ，类间方差记为var，则有：

μ＝ω0*μ0+ω1*μ1 公式11；

var＝ω0(μ0-μ)²+ω1(μ1-μ)² 公式12。

将公式11代入公式12，得到等价公式13：

var＝ω0ω1(μ1-μ0)² 公式13。

采用遍历的方法得到使类间方差最大的分割阈值T，即为所求的亮点判定阈值T。

在某些实施方式中，请参图10，根据亮点判定阈值判断候选亮点是否为图像亮点的步骤，包括：

步骤S41，在第一图像中查找大于(h*h-1)连通的像素点并将查找到的像素点作为候选亮点的中心，h*h与亮点是一一对应的，h*h中的每个值对应一个像素点，h为自然数且为大于1的奇数；

步骤S42，判断候选亮点的中心是否满足条件：Imax*ABI*ceofguass>T，其中，Imax为h*h窗口的中心最强强度，ABI为h*h窗口中第一图像中为设定值所占的比率，ceofguass为h*h窗口的像素和二维高斯分布的相关系数，T为亮点判定阈值。

若满足上述条件，S43，判断候选亮点的中心对应的亮点为待处理图像所包含的图像亮点；

若不满足上述条件，S44，弃去候选亮点的中心对应的亮点。如此，实现了图像亮点的检测。

具体地，Imax可理解为候选亮点的中心最强强度。在一个例子中，h＝3，查找大于8连通的像素点，如图11所示。将查找到的像素点作为候选亮点的像素点。Imax为3*3窗口的中心最强强度，ABI为3*3窗口中第一图像中为设定值所占的比率，ceofguass为3*3窗口的像素和二维高斯分布的相关系数。

第一图像为简化处理后的图像，例如第一图像可为二值化图像，也就是说，二值化图像中的设定值可为像素点满足设定条件时所对应的值。在另一个例子中，二值化图像可包含表征像素点不同属性的0和1二个数值，设定值为1，ABI为h*h窗口中二值化图像中为1所占的比率。例如，请参公式9，当SNR<＝mean(SNR)时，BI＝1。

另外，在某些实施方式中，h的数值可与在进行墨西哥帽滤波时所选取的m的数值相等，即h＝m。

在某些实施方式中，在采集上述图像时，相机会按时间序列依次进行多个视野(Field of View，FOV)的荧光采集。因此，在得到图像数据时，图像数据所包含的图像亮点强度与相机采集的时间序列是对应的。

在步骤S02中，得到所需的图像亮点后，对在相邻的采集时间所对应的图像亮点强度进行点连线，而形成图像亮点的时间与强度的折线图，如图12所示。在图12中，横轴表示采集荧光的时间，单位毫秒(ms)，纵轴表示图像亮点强度。在一个例子中，相邻两次采集荧光的时间间隔为20ms。

纵轴为对应的亮点强度值，在本发明实施方式中，亮点强度值为亮点像素值，对于16位的tiff图像，亮点像素值在0-65535的范围内，对于8位的灰度图像，亮点像素值在0-255范围内。本发明实施方式中采用的是16位的tiff图像。

在步骤S03中，将折线图的波形转化为图像处理以进行后续的游程编码。对折线图进行图像处理包括对折线图进行网格划分。

在某些实施方式中，对折线图进行网格划分是按照采集强度的时间帧数与强度的大小来划分。如此，可对折线图进行较简单的处理而得到网格划分，降低了单分子的识别方法的成本。具体地，可按照时间帧数划分为M和按照强度的大小划分为N，即形成M*N个网格。采集强度的时间帧数为相邻两次采集荧光的时间间隔。在一个实施方式中，可将一个网格沿横轴方向称为长度方向，沿纵轴方向称为高度方向。一个网格的长度可设置为时间帧数的数倍，如1倍、2倍、2.5倍等。一个网格的高度可灵活设置，例如，对于16位的tiff图像，纵轴的值为0-65535，网格划分时，可将纵轴的值归一化后平分成50份，然后一个网格的高度设置为0.02，即N＝50。

在一个例子中，相邻两次采集荧光的时间间隔为20ms，一个网格的长度等于一个时间间隔，高度＝0.02。请参图16，在这样的例子中，落在一个网格的线段的次数可为0次、1次或2次。图16中的黑点代表图像亮点的强度的时间序列。

在一个例子中，请参图13，将折线图划分为8*6的网格，并统计落在每个网格的线段和/或线段的端点的次数。在图13中，统计落在每个网格的线段的次数(即每个网格被线段经过的次数)，网格里的数字代表落在每个网格的线段的次数。图13中的黑点代表图像亮点的强度的时间序列。

在线腐蚀时，可采用以下公式进行形态学的腐蚀操作：g(x,y)＝erode[f(x,y),B]＝min{f(x+x',y+y')-B(x',y')|(x',y')∈Db}。较佳地，可选择直线的结构元素，如W*1的窗口大小，若窗口中网格的次数超过阈值T，则将网格标记为第一值，否则标记为第二值。如此，可将进行网格划分后的折线图转换为包括第一值和第二值的简化图。在某些实施方式中，简化图为二值化图。如可将第一值取值为1，将第二值取值为0。

在一个例子中，请参图19，一个网格的长度为L1，W＝2*L1，T＝2，图19显示沿长度方向排列的5个网格，网格里的数字代表次数，那么在进行线腐蚀时，将窗口与网格对齐，在经线腐蚀后，5个网格分别被标记为0、1、0、0、0。

在另一个例子中，请参图20，一个网格的长度为L1，W＝2*L1，T＝2，图20显示沿长度方向排列的5个网格，网格里的数字代表次数，那么在进行线腐蚀时，将窗口与网格错开，在经线腐蚀后，5个网格分别被标记为0、1、0、0、0。

需要说明的是，W的取值要大于或等于一个网格的长度，较佳地，W是一个网格的长度的整数倍。在例子中，W>＝L1，较佳地，W是L1的整数倍。

在其它例子中，阈值T的取值范围为[6，8]，其选择与折线图的波形的波动有关，波动越小，阈值T的取值越大。

为便于理解，在说明游程编码时，以二值化图中的1和0为例进行以下说明。可以理解，简化图的其它类型及第一值和第二值的其它取值，本领域技术人员可根据以下说明进行变更。

在游程编码时，可采用8连通的方式。根据网格，按照8连通的原则递归连接各自的连通区域，接着利用游程编码标识连通区域。具体地，通过8连通(如采用图21所示的3*3窗口)，从一个非0的网格Q出发，如果网格Q的8个方向的网格均为非0，则将网格Q的8个方向上的网格标识为与网格Q一样的数值，以此类推。在完成整个简化图后，可得到如图22所示的标识图。

在图22中，将不同的连通区域用不同的数值进行标识，在计算每个连通区域的面积时，将相同数字出现的次数记为连通区域的面积，如图22中，数字9出现的次数为9，则数字9对应的连通区域的面积为9，数字7出现的次数为20，则数字7对应的连通区域的面积为20。

上述示例是采用递归算法，在其它示例中，也可采用遍历算法来查找连通区域。

若连通区域的面积大于第一设定阈值P，则一个这样的连通区域对应一个单分子。P的取值大小与单分子荧光的衰变时间相关。在一个例子中，第一设定阈值P的取值范围为[5,10]。

在某些实施方式中，请参图18，单分子的识别方法，还包括步骤：S51，基于强度的大小进行分组，对次数进行频数统计，以获得直方图；S52，查找直方图的极大值点，判定满足以下条件的一个极大值点所在的峰对应一个单分子：极大值点的值大于第二设定阈值且极大值点所在的峰的宽度大于第三设定阈值。

如此，能够使单分子的识别方法应用范围更广。该基于直方统计的单分子的识别方法能够根据亮点的强度的时间序列数据来准确识别单分子，尤其适用于亮点包含的单分子数>3情况。在该实施方式中，结合基于直方图统计和基于游程编码的方法来对单分子进行识别，能够准确识别各种波形的折线图(亮点强度的时间序列)中的单分子。

在某些实施方式中，步骤S51包括步骤：按照强度的大小划分为N个组，统计次数落在N个组里的频数：其中，ni表示落在网格的第i行的次数的频数之和，j表示时间帧数，gij表示落在网格(i,j)的次数的频数，M表示时间帧数的数量。如此，可将次数转换为强度与次数的直方图，使后续单分子的识别方法运算更简单。

具体地，在一个例子中，直方图的横轴表示组数，纵轴表示次数落在对应组数的频数。需要指出的是，N的数值等于上述形成M*N个网格中的N的数值。M的数值等于上述形成M*N个网格中的M的数值。

在某些实施方式中，基于强度的大小进行分组，对次数进行频数统计，以获得直方图的步骤包括步骤：进行按L窗口的直方图均衡化：其中，np表示对ni均衡化，ni'表示ni的均衡化结果之和，p为与窗口L的大小以及所在第i行有关的整数。如此，能够使直方图的分布更均匀，易于识别。L窗口用于直方图均衡化，L的取值与单分子荧光的衰变速度的大小有关，一般地，如果单分子荧光发光淬灭快，则L取值不宜过大。直方统计的精度受L窗口大小的影响，L的取值可灵活设置以选择合适的直方统计的精度。在一个例子中，L取值范围为[5,15]。

请参图17，图17是均衡化后的直方图，直方图的横轴表示组数，纵轴表示次数落在对应组数的频数。

在步骤S52中，可按导数求出直方图的所有极大值点。第二设定阈值Q和第三设定阈值H与折线图的波峰的形状相关，波峰越尖，第二设定阈值Q越大，而第三设定阈值H越小；波峰越胖，第二设定阈值Q越小，而第三设定阈值H越大。在一个例子中，第二设定阈值Q的取值范围为[2,6]，第三设定阈值H的取值范围为[4,10]。

在本发明实施方式中，极大值点即为峰值点，极大值点为波峰的顶点(拐点)，也就是说，判断满足条件的一个极大值点所在的峰对应一个单分子。

在某些实施方式中，在对折线图进行网格划分前，单分子的识别方法还包括步骤：对折线图进行滤波。如此，能够消除光强闪烁和相机采样造成的突变误差，使折线图的波形更加平滑。具体地，波形的修饰可以采用基于L2大小窗口的中值滤波：R＝medium(Zi)。在一个例子中，请结合图14和图15，图14为滤波前的折线图，图15为滤波后的折线图，由图可以看出，滤波后的折线图的波形更加平滑，有利于提高单分子识别的准确性和效率。

请参图23，本发明实施方式的一种单分子的计数方法,包括步骤:S81，输入图像亮点强度的时间序列；S82，根据时间序列，形成图像亮点的时间与强度的折线图，折线图由多条线段组成；S83，对折线图进行网格划分以形成阵列排布的多个网格，统计落在每个网格的线段和/或线段的端点的次数；S84，根据每个网格所对应的次数，对进行网格划分后的折线图进行线腐蚀以将进行网格划分后的折线图转换为简化图；S85，对简化图进行游程编码以标识连通区域；S86，计算每个连通区域的面积，判定满足以下条件的一个连通区域对应一个单分子：连通区域的面积大于第一设定阈值；S87，计算获得单分子的数目S2。上述单分子的计数方法，通过对亮点强度的时间序列的折线图转化为图像处理以得到游程编码的连通区域，能够快速地对单分子进行计数，而计数的精度也较高。需要说明的是，上述任一实施方式和示例中的对单分子的识别和/或计数方法的技术特征和优点的描述，包括步骤、参数设置以及图像预处理亮点检测等的解释和说明，同样也适用于本实施方式的单分子的计数方法，为避免冗余，在此不再详细展开。

例如，在某些实施方式中，在步骤S83对折线图进行网格划分前，单分子的计数方法还包括对折线图进行滤波的步骤。再例如，在某些实施方式中，请参图24，该单分子的计数方法还包括步骤：S91，基于强度的大小进行分组，对次数进行频数统计，以获得直方图；S92，查找直方图的极大值点，判定满足以下条件的一个极大值点所在的峰对应一个单分子：极大值点的值大于第二设定阈值且极大值点所在的峰的宽度大于第三设定阈值；S93，计算获得单分子的数目S1；S94，取S1和S2中的较小者作为最终单分子数。该基于直方统计的单分子的计数方法特别适用于准确查找亮点包含的单分子数>3的情况，而基于游程编码的单分子的计数方法特别适用于准确查找亮点包含的单分子数<＝3的情况。在该实施方式中，结合两种方法，可准确查找及计数各种波形的折线图中的单分子。在某些实施方式中，简化图为二值化图。

请参图25，本发明实施方式的一种单分子的计数方法，包括步骤：S61，输入图像亮点强度的时间序列；S62，根据时间序列，形成图像亮点的时间与强度的折线图，折线图由多条线段组成；S63，对折线图进行网格划分以形成阵列排布的多个网格，统计落在每个网格的线段和/或线段的端点的次数；S64，根据每个网格所对应的次数，对进行网格划分后的折线图进行线腐蚀以将进行网格划分后的折线图转换为简化图；S65，对简化图进行游程编码以标识连通区域；S66，计算每个连通区域的面积，并判定满足以下条件时，对单分子的计数加1：连通区域的面积大于第一设定阈值。

上述单分子的计数方法，通过对亮点强度的时间序列的折线图转化为图像处理以得到游程编码的连通区域，能够快速地对单分子进行计数，而计数的精度也较高。

需要说明的是，上述任一实施方式和示例中的对单分子的识别/计数方法的技术特征和优点的描述，包括对步骤、参数设置以及图像预处理亮点检测等的解释和说明，同样也适用于本实施方式的单分子的计数方法，为避免冗余，在此不再详细展开。

例如，在某些实施方式中，在步骤S63对折线图进行网格划分前，单分子的计数方法还包括对折线图进行滤波的步骤。再例如，在某些实施方式中，请参图26，该单分子的计数方法，还包括步骤：S71，基于强度的大小进行分组，对次数进行频数统计，以获得直方图；S72，查找直方图的极大值点，判定满足以下条件时，对单分子的计数加1：极大值点的值大于第二设定阈值且极大值点所在的峰的宽度大于第三设定阈值；S73，将基于直方图获取的单分子的计数和基于游程编码获取的单分子的计数中的较小者作为最终的单分子数。如此，能够使单分子的计数方法应用范围更广，及能够获取更准确的单分子数。

基于直方统计的单分子的计数方法特别适用于准确查找亮点包含的单分子数>3的情况，而基于游程编码的单分子的计数方法特别适用于准确查找亮点包含的单分子数<＝3的情况。在该实施方式中，结合两种方法，可准确查找及计数各种波形的折线图中的单分子。例如，基于直方图获取的单分子数为S1，基于游程编码获取的单分子数为S2，比较S1和S2的大小，S1和S2中取较小者作为最终的单分子数。

请参图27，本发明实施方式的一种单分子的识别装置200，该单分子的识别装置200用以实施上述任一实施方式或示例中的单分子识别方法的全部或部分步骤，该单分子的识别装置200包括：第一输入单元202，用于输入图像亮点强度的时间序列；第一转化单元204，用于根据第一输入单元202中的时间序列，形成图像亮点的时间与强度的折线图，折线图由多条线段组成；第一网格统计单元206，用于对来自第一转化单元204的折线图进行网格划分以形成阵列排布的多个网格，统计落在每个网格的线段和/或线段的端点的次数；第一简化单元208，用于根据每个网格所对应的次数，对进行网格划分后的折线图进行线腐蚀以将进行网格划分后的折线图转换为简化图；第一标识单元209，用于对简化图进行游程编码以标识连通区域；第一判定单元210，用于计算每个连通区域的面积，判定满足以下条件的一个连通区域对应一个单分子：连通区域的面积大于第一设定阈值。上述单分子的识别装置200，通过对亮点强度的时间序列的折线图转化为图像处理以得到游程编码的连通区域，能够快速地对单分子进行识别，而识别的精度也较高。

在某些实施方式中，简化图为二值化图。

需要说明的是，上述任一实施方式和实施例中的对单分子的识别方法的技术特征和有益效果的解释和说明也适用于本实施方式的单分子的识别装置200，为避免冗余，在此不再详细展开。例如，在某些实施方式中，请参图28，单分子的识别装置200还包括第一滤波单元212，与第一网格统计单元206连接，用于在对折线图进行网格划分前，对来自第一转化单元204的折线图进行滤波。

在某些实施方式中，在第一网格统计单元206中，对折线图进行网格划分是按照采集强度的时间帧数与强度的大小来划分。

在某些实施方式中，请参图29，单分子的识别装置200，还包括：第一直方统计单元214，用于基于强度的大小进行分组，对来自网格统计单元的次数进行频数统计，以获得直方图；在第一判定单元210中，查找来自直方统计单元的直方图的极大值点，并判定满足以下条件的一个极大值点所在的峰对应一个单分子：极大值点的值大于第二设定阈值且极大值点所在的峰的宽度大于第三设定阈值。

在某些实施方式中，在第一直方统计单元214中，基于强度的大小进行分组，对次数进行频数统计，以获得直方图包括：按照强度的大小划分为N个组，统计次数落在N个组里的频数：其中，ni表示落在网格的第i行的次数的频数之和，j表示时间帧数，gij表示落在网格(i,j)的的次数的频数，M表示时间帧数的数量。

在某些实施方式中，在第一直方统计单元214中，基于强度的大小进行分组，对次数进行频数统计，以获得直方图包括：进行按L窗口的直方图均衡化：其中，np表示对ni均衡化，ni'表示ni的均衡化结果之和，p为与窗口L的大小以及所在第i行有关的整数。

在某些实施方式中，请参图30，单分子的识别装置200，还包括：第一图像预处理单元218，第一图像预处理单元218用于分析输入的待处理图像以获得第一图像，待处理图像包含至少一个图像亮点，图像亮点具有至少一个像素点；第一亮点检测单元220，第一亮点检测单元220用于：分析第一图像以计算亮点判定阈值，分析第一图像以获取候选亮点，根据亮点判定阈值判断候选亮点是否为图像亮点，若判断结果为是，则获取图像亮点强度的时间序列，若判断结果为否，丢弃候选亮点。

在某些实施方式中，请参图31，第一图像预处理单元218包括第一减背景单元226，第一减背景单元226用于对待处理图像进行减背景处理，以获得第一图像。

在某些实施方式中，请参图32，第一图像预处理单元218包括第一图像简化单元222，第一图像简化单元222用于对进行减背景处理后的待处理图像进行简化处理，以获得第一图像。

在某些实施方式中，请参图33，第一图像预处理单元218包括第一图像滤波单元224，第一图像滤波单元224用于对待处理图像进行滤波处理，以获得第一图像。

在某些实施方式中，请参图34，第一图像预处理单元218包括第一减背景单元226和第一图像滤波单元224，第一减背景单元226用于对待处理图像进行减背景处理，第一图像滤波单元224用于对进行减背景处理后的待处理图像再进行滤波处理，以获得第一图像。

在某些实施方式中，请参图35，第一图像预处理单元218包括第一图像简化单元222，第一图像简化单元222用于对进行减背景处理后再进行滤波处理后的待处理图像进行简化处理，以获得第一图像。

在某些实施方式中，请参图36，第一图像预处理单元218包括第一图像简化单元222，第一图像简化单元222用于对待处理图像进行简化处理以获得第一图像。

在某些实施方式中，在第一减背景单元226中，对待处理图像进行减背景处理，包括：利用开运算确定待处理图像的背景，根据背景对待处理图像进行减背景处理。在某些实施方式中，滤波处理为墨西哥帽滤波处理。在某些实施方式中，简化处理为二值化处理。

在某些实施方式中，第一图像简化单元222用于，根据简化处理前的待处理图像获取信噪比矩阵，并根据信噪比矩阵简化简化处理前的待处理图像以得到第一图像。

在某些实施方式中，在第一亮点检测单元220中，分析第一图像以计算亮点判定阈值包括：通过大津法处理第一图像以计算亮点判定阈值。

在某些实施方式中，在第一亮点检测单元220中，根据亮点判定阈值判断候选亮点是否为图像亮点，包括：在第一图像中查找大于(h*h-1)连通的像素点并将查找到的像素点作为候选亮点的中心，h为自然数且为大于1的奇数；判断候选亮点的中心是否满足条件：Imax*ABI*ceofguass>T，其中，Imax为h*h窗口的中心最强强度，ABI为h*h窗口中第一图像中为设定值所占的比率，ceofguass为h*h窗口的像素和二维高斯分布的相关系数，T为亮点判定阈值，若满足上述条件，判断候选亮点的中心对应的亮点为图像亮点，若不满足上述条件，弃去候选亮点的中心对应的亮点。

请参图37，本发明实施方式的一种单分子的计数装置400，该单分子的计数装置400用以实施上述本发明任一实施方式和实施例中的单分子的计数方法的全部或部分步骤，该单分子的计数装置400包括：第二输入单元402，用于输入图像亮点强度的时间序列；第二转化单元404，用于根据第二输入单元402中的时间序列，形成图像亮点的时间与强度的折线图，折线图由多条线段组成；第二网格统计单元406，用于对来自第二转化单元404的折线图进行网格划分以形成阵列排布的多个网格，统计落在每个网格的线段和/或线段的端点的次数；第二简化单元408，用于根据每个网格所对应的次数，对进行网格划分后的折线图进行线腐蚀以将进行网格划分后的折线图转换为简化图；第二标识单元409，用于对简化图进行游程编码以标识连通区域；第二判定单元410，用于计算每个连通区域的面积，判定满足以下条件的一个连通区域对应一个单分子：连通区域的面积大于第一设定阈值；计算单元412，用于计算获得单分子的数目S2。上述单分子的计数装置400，通过对亮点强度的时间序列的折线图转化为图像处理以得到游程编码的连通区域，能够快速地对单分子进行计数，而计数的精度也较高。

需要说明的是，上述任一实施方式和实施例中的对单分子的计数方法的技术特征和有益效果的解释和说明也适用于本实施方式的单分子的计数装置400，为避免冗余，在此不再详细展开。

例如，在某些实施方式中，请参图38，单分子的计数装置400还包括第二滤波单元414，与第二网格统计单元406连接，用于在对折线图进行网格划分前，对来自第二转化单元404的折线图进行滤波。

在某些实施方式中，请参图39，单分子的计数装置400，还包括：第二直方统计单元416，用于基于强度的大小进行分组，对来自第二网格统计单元406的次数进行频数统计，以获得直方图；在第二判定单元410中，查找来自第二直方统计单元416的直方图的极大值点，并判定满足以下条件的一个极大值点所在的峰对应一个单分子：极大值点的值大于第二设定阈值且极大值点所在的峰的宽度大于第三设定阈值；在计算单元412中，计算获得单分子的数目S1，取S1和S2中的较小者作为最终单分子数。

请参图40，本发明实施方式的一种单分子的计数装置600，包括：第三输入单元602，用于输入图像亮点强度的时间序列；第三转化单元604，用于根据第三输入单元602中的时间序列，形成图像亮点的时间与强度的折线图，折线图由多条线段组成；第三网格统计单元606，用于对来自第三转化单元604的折线图进行网格划分以形成阵列排布的多个网格，统计落在每个网格的线段和/或线段的端点的次数；第三简化单元608，用于根据每个网格所对应的次数，对进行网格划分后的折线图进行线腐蚀以将进行网格划分后的折线图转换为简化图；第三标识单元609，用于对简化图进行游程编码以标识连通区域；第三判定单元610，用于计算每个连通区域的面积，并判定满足以下条件时，对单分子的计数加1：连通区域的面积大于第一设定阈值。

上述单分子的计数装置600，通过对亮点强度的时间序列的折线图转化为图像处理以得到游程编码的连通区域，能够快速地对单分子进行计数，而计数的精度也较高。

需要说明的是，上述任一实施方式和实施例中的对单分子的计数方法的技术特征和有益效果的解释和说明也适用于本实施方式的单分子的计数装置600，为避免冗余，在此不再详细展开。

例如，在某些实施方式中，请参图41，单分子的计数装置600还包括第三滤波单元612，与第三网格统计单元606连接，用于在对折线图进行网格划分前，对来自第三转化单元604的折线图进行滤波。

在某些实施方式中，请参图42，单分子的计数装置600，还包括：第三直方统计单元614，用于基于强度的大小进行分组，对来自第三网格统计单元606的次数进行频数统计，以获得直方图；在第三判定单元610中，查找来自第三直方统计单元614的直方图的极大值点，并判定满足以下条件时，对单分子的计数加1：极大值点的值大于第二设定阈值且极大值点所在的峰的宽度大于第三设定阈值；及将基于直方图获取的单分子的计数和基于游程编码获取的单分子的计数中的较小者作为最终的单分子数。

请参图43，本发明实施方式的一种单分子的处理系统300，包括：数据输入装置302，用于输入数据；数据输出装置304，用于输出数据；存储装置306，装置存储数据，数据包括计算机可执行程序；处理器308，用于执行计算机可执行程序，执行计算机可执行程序包括完成上述任一实施方式的方法。

本发明实施方式的一种计算机可读存储介质，用于存储供计算机执行的程序，执行程序包括完成上述任一实施方式的方法。计算机可读存储介质可以包括：只读存储器、随机存储器、磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施方式”、“某些实施方式”、“示意性实施方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合所述实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。

此外，在本发明各个实施方式中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

尽管上面已经示出和描述了本发明的实施方式，可以理解的是，上述实施方式是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施方式进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐伟彬;金欢;颜钦;姜泽飞
技术所有人：深圳市瀚海基因生物科技有限公司
我是此专利的发明人

上一篇：数据处理方法、装置、存储介质及处理器与流程
上一篇：单分子的识别、计数方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。