一种基于dna测序峰形图定量分析碱基变异比例的方法

文档序号:6515137阅读:538来源:国知局
一种基于dna测序峰形图定量分析碱基变异比例的方法
【专利摘要】本发明公开了一种基于DNA测序峰形图定量分析碱基变异比例的方法,该方法是根据DNA测序图,对有特定意义的碱基变异点,进行计算该点双峰图形里的每一峰形曲线下的像素点数总和,即为该峰形曲线的面积。再计算出该两个峰形图的面积比值,即为DNA碱基变异的具体比例。
【专利说明】—种基于DNA测序峰形图定量分析碱基变异比例的方法
【技术领域】
[0001]本发明涉及一种定量分析DNA碱基变异比例的方法,具体涉及一种基于DNA测序峰形图定量分析碱基变异比例的方法。
【背景技术】
[0002]目前,关于碱基变异,大多是进行变异的定性分析,尚未报道变异比例的定量分析。如CN101250581B —种检测乙型肝炎病毒P基因YMDD变异的置换扩增法公开了通过置换扩增法检测乙型肝炎病毒(HBV)P基因YMDD的变异,该方法适合单碱基变异的定性分析,虽然可结合SYBR Green染料或荧光分子探针联用,用于单个待测基因的定量分析,但操作流程复杂、实验条件苛刻、精确度不高、成本高等。由于商业化DNA测序技术的进步和普及,价廉物美的DNA测序已经成为基因分析的常用手段。通过DNA测序图,可以直接判读出碱基变异及其位置,而运用本发明,可简便地进行碱基变异比例的定量分析。

【发明内容】

[0003]本发明的目的在于提供一种基于DNA测序峰形图定量分析碱基变异比例的方法。
[0004]本发明所采取的技术方案是:
一种基于DNA测序峰形图定量分析碱基变异比例的方法,包含以下步骤:
O截取图像:在打开的DNA测序峰形图中,找到碱基变异处的双峰形图,然后用GetDC(O)函数获取屏幕对像句柄,用BitBlt ()函数截取双峰图形,并将其传递给图像框控件进行显示,显示的图像保存为BMP图像文件;
2)图像数据读入:读入BMP图像文件,并保存到一个可变长的字节数组变量中;
3)清除噪音线条:用鼠标点击该噪音线条,在鼠标的点击事件里,使用GetDC(O)函数获得屏幕句柄后,用GetPixeU )函数获取鼠标点击处的颜色值,将噪音线条上的像素点的数据,设置为同背景色一样的白色;
4)补齐线条:被清除的线条与其他线有交叉,则它在被清除后,使剩下的线条在交叉处形成断裂,将该处颜色设置为与剩下线条相同的颜色;
5)计算峰形图像面积:计算峰形曲线与下边黑色横线所围成的封闭区域里的像素点数总和,含曲线本身,像素点的总和即可表示峰形图的面积,双峰形图处的两个峰形图面积的比例即为碱基变异的比例。
[0005]进一步的,所述的BMP图像文件为用SavePicture命令保存的24位BMP位图格式的图像文件。
[0006]进一步的,步聚2)中所述的可变长的字节数组变量所包含的数据分为两部分,前一部分称为BMP文件头,后一部分称为数据区。
[0007]进一步的,步聚3)中所述的噪音线条的颜色与峰形曲线颜色不一致时,使用循环语句,在存放图像的字节数组变量里,将所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。[0008]进一步的,步聚3)中所述的噪音线条的颜色与峰形曲线颜色一致时,可按下鼠标左键,并拖动鼠标画出一个小框,将噪音线条圈住,然后在鼠标左键的弹起事件里,使用循环语句,对画出的框内,所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
[0009]进一步的,所有的程序语言是基于Visual Basic6.0进行的。
[0010]本发明的有益效果是:
本发明基于DNA测序峰形图,可直接找出相关碱基的变异及位点,根据突变碱基位点处不同峰形的面积比,可简便、快速得出该碱基变异比例的定量结果。在普通PCR测序的基础上进行碱基变异比例的定量分析,无需额外的设备与试剂,故成本低廉、应用前景好。
[0011]本发明可应用于HBV耐药治疗研究中,定量分析耐药株/野生株的比例,这对临床抗病毒治疗具有重要意义,可指导临床医师及时采取有效措施避免或减轻临床耐药带来的负面影响。本发明也可用于确定丙型肝炎病毒(HCV)的准种数和优势准种,这对临床研究和治疗HCV具有重要意义。
[0012]在本发明中,采用VB (Visual Basic)进行软件开发,其不但具有良好的界面设计能力,而且编程工作量较小,开发周期短,特别适合生物【技术领域】的相关软件研发工作。
【专利附图】

【附图说明】
[0013]图1是DNA测序峰形图;
图2是截图区域示意图;
图3是峰形放大图;
图4是含噪音峰线的双峰图形;
图5是去掉噪音峰线后有断裂的双峰图形;
图6是图像坐标与数组变量下标对应关系示意图;
图7是修补好断裂后的峰形图;
图8是本发明方法的流程图。
【具体实施方式】
[0014]对本发明可的相关控件、变量等的描述是基于Visual Basic6.0进行的。
[0015]下面结合具本实施例对本发明作进一步说明,但并不局限于此。
实施例1
一、打开DNA测序峰形图
慢性乙肝患者长期使用口服核苷酸类似物(如拉米夫定)治疗,HBV会发生碱基突变使其产生耐药性。例如图1中用Chromas软件打开HBV DNA测序峰形图,图1中箭头有一双峰图,所指的碱基C的峰形图下产生了另一个碱基A的峰形图,它就是由碱基C变异产生的。开发碱基变异比例定量识别软件的目的是计算同一碱基位点下,DNA峰形图中不同曲线下的面积比,从而得出该碱基变异比例大小。计算面积的方法是求峰形曲线下的像素点数,在Chromas中不管图像XY方向的显示比例如何调整,每一峰形曲线下的面积虽然会变化,但它们的面积比值是恒定的。
[0016]二、截取图像 找到需要分析的双峰形图后,用GetDC(O)函数获取屏幕对像句柄后,用BitBlt ()函数截取屏幕上处适当区域的图像,如图2所示,所截取区域以恰好显示出双峰图形为准,上边显示出峰顶,下边包含基底黑线,左右恰好在双峰形图与基底黑线交界处,然后将其传递给图像框控件进行显示,显示的图像用SavePicture命令保存为24位BMP位图格式的图像文件。
[0017]三、图像数据读入
读入BMP图像文件,并保存到一个可变长的字节数组变量中,该数组变量里的数据分为两部分,前一部分称为BMP文件头,存放的此图像文件的相关属性信息,如图像宽度、高度、文件大小、数据区偏移量等等;后一部分称为数据区,存放的图像每个像素点三原色的数据,它是由相邻3个字节来表示,分别表示红、绿、篮三种颜色分量。对图像进行处理的时候,实际上是对每个像素三个字节的数据进行赋值,以改变它的颜色。
[0018]在数据区里,图像的每个像素点数据的存放顺序是:图像中,从左到右、从下往上的方向依次读入每个像素点的三个颜色数据到数组里。
[0019]四、图像显示
在处理图像时,需要通过鼠标点击线条,以获取该线条的颜色值。由于线条很细,宽度仅一个像素,很难用鼠标点中。解决方法是采用图像控件显示图像,该控件有“拉伸”属性,使所显示的图像以拉伸的方式放大,将一个像素点放大为足够大的小长方块,便于鼠标点击线条,获取该线条的颜色值,如图3所示。
[0020]五、清除噪音线条
在双峰图形上很可能会混杂入相邻峰形线条,或噪音线条,即峰形基底部的杂乱细小峰线,它是测序过程中出现的微弱背景或本底峰线,如图4所示。为了便于计算峰形曲线下的面积,需要把多余线条清除掉。
[0021]用鼠标点击该噪音线条,在鼠标的点击事件里,使用GetDC(O)函数获得屏幕句柄后,用GetPixeU )函数获取鼠标点击处的颜色值。将噪音线条上的像素点的数据,设置为同背景色一样的白色,即将该线条上每个像素点的三个颜色分量数据设置为255,即获得去掉噪音峰线后有断裂的双峰图形如图5。
[0022]当噪音线条的颜色与峰形曲线颜色不一致时,使用循环语句,在存放图像的字节数组变量里,将所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
[0023]当噪音线条的颜色与峰形曲线颜色一致时,可按下鼠标左键,并拖动鼠标画出一个小框,将噪音线条圈住,然后在鼠标左键的弹起事件里,使用循环语句,对刚才画出的框内,所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
[0024]六、补齐断裂峰线
如果被清除的线条与其他线有交叉,则它在被清除后,会使剩下的线条在交叉处形成断裂,如图5所示,左下部分就形成了线条断裂。为了准确地计算曲线下面积,需要将该断裂处补上,这在程序实现上需要一定的技巧。
[0025]修复断裂峰线时,首先获取要修补线条的颜色,与第4)步中的方法相同。
[0026]修补断裂峰线时,需先得到断裂处的像素点在字节数组变量中对应数据的位置,即数组的下标。由于图像数据是按图像中,从左到右、从下往上的方向依次读入到数组里,因此,图像中某点的坐标U,y)与数组变量中的下标有着如图7所示的对应关系。[0027]图像的读取顺序以及每个像素点的颜色值占3个字节,可得出该点在字节数组中的存放位置为:
该点颜色数据的第I字节下标:
【权利要求】
1.一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:包含以下步骤: O截取图像:在打开的DNA测序峰形图中,找到碱基变异处的双峰形图,然后用GetDC(O)函数获取屏幕对像句柄,用BitBlt ()函数截取双峰图形,并将其传递给图像框控件进行显示,显示的图像保存为BMP图像文件; 2)图像数据读入:读入BMP图像文件,并保存到一个可变长的字节数组变量中; 3)清除噪音线条:用鼠标点击该噪音线条,在鼠标的点击事件里,使用GetDC(O)函数获得屏幕句柄后,用GetPixeU )函数获取鼠标点击处的颜色值,将噪音线条上的像素点的数据,设置为同背景色一样的白色; 4)补齐线条:被清除的线条与其他线有交叉,则它在被清除后,使剩下的线条在交叉处形成断裂,将该处颜色设置为与剩下线条相同的颜色; 5)计算峰形图像面积:计算峰形曲线与下边黑色横线所围成的封闭区域里的像素点数总和,含曲线本身,像素点的总和即可表示峰形图的面积,双峰形图处的两个峰形图面积的比例即为碱基变异的比例。
2.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚I)和2)中所述的BMP图像文件为用SavePicture命令保存的24位BMP位图格式的图像文件。
3.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚2)中所述的可变长的字节数组变量所包含的数据分为两部分,前一部分称为BMP文件头,后一部分称为数据区。
4.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚3)中所述的噪音线条的颜色与峰形曲线颜色不一致时,使用循环语句,在存放图像的字节数组变量里,将所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
5.根据权利要求1所述的一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:步聚3)中所述的噪音线条的颜色与峰形曲线颜色一致时,可按下鼠标左键,并拖动鼠标画出一个小框,将噪音线条圈住,然后在鼠标左键的弹起事件里,使用循环语句,对画出的框内,所有与噪音线条颜色值相同的像素点三个颜色分量数据设置为255。
6.根据权利要求1、2、3、4或5所述一种基于DNA测序峰形图定量分析碱基变异比例的方法,其特征在于:所有的程序语言是基于Visual Basic6.0进行的。
【文档编号】G06F19/22GK103559428SQ201310473434
【公开日】2014年2月5日 申请日期:2013年10月11日 优先权日:2013年10月11日
【发明者】刘国庆, 钱俊 申请人:南方医科大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1