基因芯片用人类白细胞抗原分型探针的筛选及其应用方法

文档序号:418244阅读:246来源:国知局
专利名称:基因芯片用人类白细胞抗原分型探针的筛选及其应用方法
技术领域
本发明涉及一种人类白细胞抗原类型的测试鉴别方法,特别涉及用于基因芯片检测方面的分型探针筛选和应用的方法。
背景技术
人类白细胞抗原(Human leukocyte antigen,简称HLA)就是人类的主要组织相容性复合物(Major HistocompatibilityComplex简称MHC),它在免疫系统中对T细胞发育阶段中的筛选、效应阶段中的活性介导以及对NK细胞的抑制等方面发挥非常重要的作用。
人类白细胞抗原具有非常丰富的多态性,即在一个人群当中,对于同一种白细胞抗原,不同的个体可能携带有不同的等位基因。以2003年4月份IMGT/HLA公布的资料为例,HLA-B有519个等位基因,由于人是双倍染色体,理论上存在的HLA-B种抗原的数目为134,940种。HLA的多态性和其在免疫系统中发挥的重要作用,决定了不同个体的免疫系统可能因具有不同的HLA抗原分子而具有不同的免疫优势和劣势。HLA的多态性还会造成了器官移植和骨髓移植中的排斥反应,若供者和受者具有不同的HLA等位基因,在进行器官移植或骨髓移植后就会有比较强的免疫排斥反应发生,造成移植失败,因此,在移植前,必须对供者和受者进行高精度的HLA分型。
自1958年发现第一个白细胞抗原,人们就开始对白细胞抗原进行分型,其方法也在不断进步。微量淋巴细胞毒试验70年代就发展成熟,并在以后成为实际上的白细胞抗原分型的技术标准,但由于这种方法分型只能对活细胞分型且错误率高,目前正逐渐被基于DNA技术的各种方法所取代。IHWG(International HistocompatabilityWorking Group,国际组织相容性工作组)目前推荐的分型方法主要有三种SSOP,SBT,SSP,其中以SSOP方法最受推崇。SSOP(SequenceSpecific Oligonucleotide Probe)即序列特异性寡核苷酸。这种方法灵敏度,特异性,稳定性都比较好,是目前几种方法中较优的一种,但也存在不少缺点,如操作时间比较长,大概需3个工作日;需昂贵设备等等。NMDP(National Marrow Donor Program)是美国国家骨髓库,其于1992-1993以及1997-1999年期间分别完成了对II白细胞抗原和I白细胞抗原分型方法由血清学技术(微量淋巴细胞毒试验)到基于DNA技术(SSOP)的转换。与血清学技术方法相比,各种基于DNA技术的各种方法确实有诸多优点,但这也带来了分型标准的混乱,世界各国的骨髓库和各地的分型实验室在使用不同的分型试剂与分型方法来进行白细胞抗原分型,各种分型试剂的分辨率稳定性都不相同,给数据的交流带来很多麻烦。
基因芯片技术是最近于生物技术领域内出现的一种新方法,它能高通量平行性的获得待测样本的大量信息,这是传统的生物学方法难以达到的。基因芯片由固相载体(一般为玻璃)和固定于其上的DNA探针组成,目前主要用于表达谱分析和突变检测两个领域。用于检测碱基突变的基因芯片的DNA探针的长度一般为十几个到二十几个碱基,其序列与待检测突变位点及突变位点两侧的序列互补,让待检测位点位于探针的中间位置(或接近中间),根据待检测位点出现的碱基类型,设计几条探针分别与之完全互补,这样,在杂交时,待检测样品中的DNA会与序列与之完全匹配的探针结合,使该点有较强的荧光信号强度。根据各点荧光信号强度的不同,即可读出待检测样品中的DNA序列。由于HLA各等位基因之间的差异本质上是在多态性位点上的核苷酸的差异,可以利用基因芯片技术来对其进行分型,而且利用基因芯片技术对HLA分型有许多传统方法难以比拟的优势,比如操作简单,只需杂交扫描;效率高,杂交扫描能在两个小时内完成,而且可以在同一张芯片上同时分型好几份份样品;自动化程度高,扫描以后的工作都可以由计算机来处理;成本低,合成一次寡核苷酸探针可以点数千张芯片,每张芯片都可以检测几份样品。因此基于基因芯片技术的人类白细胞抗原分型方法很具有成为人类白细胞抗原分型技术标准的潜力。
目前世界上已有不少公司及实验室在研究用基因芯片技术分型人类白细胞抗原的方法,但他们设计出的分型探针及由此生产的分型芯片都只达到中等分辨率水平,而基因芯片用人类白细胞抗原高分辨率分型探针的设计方法尚未有人描述,因为人类白细胞抗原高分辨率分型探针比较难以设计,这主要有两个原因第一,人类白细胞抗原的多态性非常丰富,在所有已发现的人类基因中其多态性最为丰富,如目前登录的HLA-B抗原的等位基因已达519条,而且人是双倍体,由HLA-B抗原的519条等位基因组成的合子与杂合子数目会达134940种之多,要对其设计高分辨率分型探针,是一件很艰巨的工作,需要大量运算。
第二,人类白细胞抗原的多态性位点比较集中,I类白细胞抗原的多态性位点几乎都集中在第二和第三外显子的340bp内,II类白细胞抗原的多态性位点几乎都集中在第二外显子的260bp内。这些多态性位点,由于它们相互临近,在对其中一个多态性位点设计探针时总会受到临近多态性位点的干扰,若按照对孤立多态性位点设计探针的方法来进行设计,很难获得理想的探针,即便设计出了探针,也会对后面的探针调试,判定阀值确定带来诸多麻烦。

发明内容
本专利公开了一种人类白细胞抗原高分辨率、并且探针调试以及确定判定阀值容易的分型探针筛选及其应用方法,很好的解决了上述现有技术存在的问题。
本发明的技术方案如下首先设计一种基因芯片用人类白细胞抗原分型探针的筛选方法,该方法包括如下步骤A.将人类白细胞抗原各等位基因的序列比对结果由网络中下载到计算机的存储器中,建立一个数据库;B.读取数据库中所有白细胞抗原多态性位点的信息;C.检测所有多态性位点,并将所有多态性位点按碱基位置相互临近的原则分为若干位点组;D.检索同一多态性位点组内出现的所有组合,比较每两种组合,找出碱基类型不相同的碱基位置形成新的数据组;E.根据数据组中每个多态性位点出现的情况确定分型探针的检测位点;F.根据探针的检测位点找出探针的序列;上述探针在基因芯片对人类白细胞抗原分型时的应用方法,包括以下步骤
①以上述方法确定探针检测位点以及探针序列;②构建各等位基因对与各条探针匹配关系的判断程序;③合成探针并将探针置于固相载体上;④PCR扩增样品DNA,与芯片杂交并扫描;⑤由步骤②所建立的判断程序判别步骤④扫描出来的结果,将完全匹配的判断结果输出,从而确定待测样品的白细胞抗原型别。
依据本发明中设计的人类白细胞抗原分型探针的筛选方法,提出了对多态性位点进行“分组”的解决方案,依此方法设计出来的分型探针,检测位点定位准确并且包容性较强,分辨率高。本发明的全部筛选过程全部由设计的一套计算机软件来执行,所以,可以快速准确地筛选出理想的分型探针。而且本专利还描述了各种匹配关系表的构建方法及如何根据这些匹配关系表一步步由芯片杂交结果判断出待测样品的白细胞抗原类型,解决了该分型探针在实际工作中的应用问题。


图1是各组合之间的空间位置关系图。
图2是各探针之间的空间位置关系图。
具体实施例方式
本发明的具体实施方式
如下一种基因芯片用人类白细胞抗原分型探针的筛选方法,该方法包括如下步骤A.将人类白细胞抗原各等位基因的序列比对结果由网络中下载到计算机的存储器中,建立一个数据库;B.读取数据库中所有白细胞抗原多态性位点的信息;C.检测所有多态性位点,并将所有多态性位点按碱基位置相互临近的原则分为若干位点组;D.检索同一多态性位点组内出现的所有组合,比较每两种组合,找出碱基类型不相同的碱基位置形成新的数据组;E.根据数据组中每个多态性位点出现的情况确定分型探针的检测位点;F.根据探针的检测位点找出探针的序列;所有人类白细胞抗原各等位基因的序列比对结果都可以从IMGT/HLA的网站上下载。对于I类白细胞抗原HLA-A,HLA-B,HLA-C等,只需下载第二和第三外显子的比对结果,因为I类白细胞抗原的多态性位点几乎都集中在第二和第三外显子;对于II类白细胞抗原HLA-DRBI等,只需下载第二外显子的比对结果,因为II类白细胞抗原的多态性位点几乎都集中在第二外显子。不管I类白细胞抗原还是II类白细胞抗原,在其各自的考察范围内,即I类白细胞抗原的第二和第三外显子与II类白细胞抗原的第二外显子,都存在碱基序列完全相同的等位基因,比如HLA-B抗原的等位基因B*0705和B*0706。在进行设计探针工作之前,要先合并具有相同碱基序列的等位基因,得到具有唯一序列的等位基因比对结果。而且,不管I类白细胞抗原还是II类白细胞抗原都存在包含有序列插入或序列删除变异的等位基因。所以,在步骤A中还设计有合并和删除程序,可以先建立一个二维数组(比如alleleSeq())和一个TextStream变量(比如ts),运用ts访问磁盘上的数据,将每一个等位基因的序列读入alleleSeq()的每一行进行两两比较,合并序列完全相同的等位基因以及删除包含有序列插入或序列删除变异的等位基因,得到具有唯一序列的等位基因比对结果。
所述步骤B中的检测过程是由计算机对步骤A所形成的数据库中的单元位置进行扫描,忽略不具多态性的位点,显示多态性位点的各相关信息,所述相关信息包括,在一致性序列中的碱基类型、变异的碱基类型以及变异碱基出现的次数。多态性位点的各相关信息可以显示在一Word表格内,例如表1所示内容表1(部分) 在表1中,第一列显示的是各个多态性位点的位置,第二列显示的是在该位置处占优势的碱基类型,第三到第六列分别显示A,G,C,T四种碱基类型在各个多态性位点出现的次数。
在设计白细胞抗原分型探针时,经常碰到这样的问题若干个多态性位点相距很近,连在一起或仅间隔两三个碱基,这时对其中任一点设计探针总会受到相邻的多态性位点的干扰,为解决这一问题,可将这些相互临近的多态性位点作为一个整体来看待,即分为一组。步骤C的分组原则是将两个多态性位点之间间隔的碱基数目进行比较,根据实际需要可以将其差数小于3~6范围内的分为一组,如果将其差数值确定为4或5,效果最佳。例如以变量pos1代表一个多态性位点的位置,以变量pos2代表另一个多态性位点的位置,如果(pos2-pos1)的绝对值小于其设定的差数值,则将它们归入一组;表1中的第五列的多态性位点与第六列多态性位点之间间隔的碱基数为1(32-30-1),就应将它们划为一组。根据以上的分组原则,可以将表(2)中的多态性位点分为7组,不同的字体表示不同的组。
所述步骤D是针对每个多态性位点组,从第一条等位基因开始逐个考察其组合的类型,记录下来组合数以及所出现的新的组合类型,并自动形成比照表格,该表格行数为该组内组合数加一,列数为组合数加二;如表1中的多态性位点30,32,33所组成的一组所示,在多态性位点30出现了两种碱基类型,分为G和T;在多态性位点32出现了两种碱基类型,分为C和T;在多态性位点33出现了两种碱基类型,分为A和G,理论上讲这三个多态性位点可以组成8种组合,分为GCA,GCG,GTA,GTG,TCA,TCG,TTA,TTG,我们只以已经发现的四种组合为例,分将其为TCG,GCA,GCG,GTA,列成比照表格,如表2所示表2
该表格的第一行以及第一列中分别填入各组合类型,进一步将上述组合类型进行两两比较,找出碱基类型不相同的位置,填入该两种组合类型相交的单元格内。
一个探针的检测位点就是该条探针所要检测的那个多态性位点,寻找探针检测位点的步骤E是根据上面的比照表格,考察该表格的每一列中的多态性位点,如果存在一个多态性位点在该列的所有有效单元格内是否都出现,如果是则确定该多态性位点作为该探针的检测位点,并填入该列的最下面一格;否则,就要确定多个多态性位点,使该列中的任一有效的单元格至少有选定的一个多态性位点出现,这些被选定的多态性位点就分别是每条探针的检测位点,例如第二列中的多态性位点30在第三,四,五行中都出现,所以多态性位点30即可作为所要探针的检测位点,将30写在该列的最下单元格内。对于某一列,如果不存在一个多态性位点在所有的单元格都出现(处于左上到右下对角线上的那个单元格不在考虑范围内),就要确定2个或更多个多态性位点,使该列中的任一单元格至少有选定的一个多态性位点出现,例如第三列中的多态性位点32和33。统计该组中所设计探针的数量(即检测位点的数目,因为一个检测位点要设计一条探针),并可以写出返回探针数目的probe()函数。
所述步骤E后还有优化分组程序,包括根据每组中多态性位点的数量多少进行优化组合和拆分程序,其中优化组合程序是对于组内多态性位点数量较少、两个多态性位点之间间隔的碱基数目大于3但小于10,暂分为一组,计算该组所需的探针数量,调用函数probe()进行比较,如果前者多则放弃,如果后者多则将它们确定划归入同一组;对于组内大量多态性位点拥挤在一起,其中任意相邻两个多态性位点之间间隔的碱基数都小于3~6,则将其拆分为多组,计算拆分后所需的探针数量,调用函数probe()进行比较,如果前者多则放弃,如果后者多则按新组划分,反复比较,直至找到最佳分组方案后确定;并重新确定探针的检测位点。例如,如果(pos2-pos1)的绝对值大于等于3但小于10,就要调用probe()函数,若probe(pos1)加上probe(pos2)大于probe(pos1,pos2),则将它们分入一组;否则将它们分为两组。
输出探针初步序列在本专利中,用如下的方式表示一条探针(组合类别,检测位点位置)。如表2中的6条探针可以分别表示如下(TCG,30),(GCA,32),(GCA,33),(GCC,30),(GCC,33),(GTA,32)。知道了探针的检测位点后,找出探针的序列就是很简单的事情了,所述步骤F是以确定的探针检测位点为中心向左右各延伸6~13个碱基,确定探针的序列,当然,向左右各延伸的碱基数选择8或9个,则更为理想。在多态性位点处的碱基就是组合中显示的碱基类型,在非多态性位点处的碱基就是一致序列中的碱基类型。例如,表2中六条探针的初步序列显示于表3中。
表3

在表3中,有下划线的表示该位置是所在探针的检测位点;小写字母的表示该位点是多态性位点,但不是所在探针的检测位点;大写的字母表示该位点是非多态性位点。
本专利中对于计算机普通技术人员能够轻易写出的软件程序不再赘述。
一种基因芯片用人类白细胞抗原分型探针的应用方法,包括以下步骤①以上述方法确定探针检测位点以及探针序列;②构建各等位基因对与各条探针匹配关系的判断程序;③合成探针并将探针置于固相载体上;④PCR扩增样品DNA,与芯片杂交并扫描;
表三比较单抗E11C与两种试剂检测G145R HBsAg的灵敏度

注结果以比色后的OD值表示实施例三乙肝表面抗原检测试剂盒的制备以本发明制备的抗突变HBsAg单抗代替常规乙肝表面抗原检测试剂盒中的HBsAb,其余试剂和材料与常规乙肝表面抗原检测试剂盒中的一样。检测方法也与常规的乙肝表面抗原检测试剂盒一样。
b.进一步建立双倍体组合探针匹配关系表,建立双倍体组合探针匹配关系表的方法是将任两个组合类型配在一起并将它们与探针的匹配关系叠加在一起,叠加时遵循如下原则若一种组合在某一探针处显示匹配的信号(P),不管另一种组合在该探针处显示的信号是否匹配(P、N或V),则这两种组合配对后与该探针相匹配(P)。若一种组合在某一探针处显示不确定信号(V),则不管另一种组合在该探针处显示不确定信号还是不匹配信号(N或V),这两种组合配对后都会使该探针显示不确定信号(V);若两种组合在某一探针处均显示不匹配信号(N),则这两种组合配对后会使该探针显示不匹配的信号(N),如此可由表4派生出表5。
表5-30,32,33这一组内的双倍体组合探针匹配表

按照以上原则,对所有的多态性位点组都可以建立起组合与探针的双倍体匹配关系表,这一步的程序实现就是将各组合与各探针依次比较即可。
C.构建等位基因与组合的匹配关系表。比较每一条等位基因与每一组合的序列,判断各条等位基因与各组合的匹配关系,若某一条等位基因的碱基类型与某一组合的碱基类型都一致,则该等位基因与该组合相匹配,用“+”号表示;若某一条等位基因与某一组合在一处或多处碱基类型不相同,则该等位基因与该组合不相匹配。例如HLA-B抗原包含495条等位基因,224种组合,则HLA-B抗原的各等位基因与各组合的匹配关系表就是495条等位基因与224种组合之间的匹配关系表。在程序实现时,应先将各等位基因的序列读入一个二维数组,然后将各组合依次与每条等位基因序列比较,将其结果输出Excel表格。例如表6所示的为部分HLA-B抗原等位基因与组合的匹配关系表,C表示组合(Combination)之意表6


D.构建等位基因对与组合的匹配关系表。等位基因对就是所有的等位基因任意两两组合所形成的配对。本步骤只要在步骤C的基础上,将组成该等位基因对的两种等位基因与该组合的匹配关系叠加起来,即可得到该等位基因对与该组合的匹配关系。在程序实现时,可以用一个二维数组代表整张等位基因与组合的匹配关系表,然后依次将每两条等位基因组成的等位基因对与各组合的匹配关系叠加输出Excel表格。例如考察表6中等位基因B*0721与B*0722组成的等位基因对与组合C14和C15的匹配关系,发现B*0721与组合C14匹配,与组合C15不匹配;B*0722与组合C15匹配,与组合C14不匹配。由它们组成的等位基因对则既与C14匹配又与C15匹配。
E.合并处理。对各等位基因对与各组合的匹配关系做两两比较,合并具有相同组合匹配关系的等位基因对,构建出最终的各等位基因对与各组合的匹配关系表。对于这些等位基因对,由于具有相同的组合匹配关系,根据以上设计的探针将无法把它们区分开,例如HLA-B抗原的等位基因对B*070201+B*0801与等位基因对B*0705+B*0807具有相同的组合匹配关系,因此无法相互区分。
F.由芯片杂交结果判断出各条探针的正负,根据双倍体组合探针匹配关系表由各条探针的正负判断出各组合的正负,根据最终的各等位基因对与各组合的匹配关系表由各组合的正负判断出待测样品的等位基因对,即待测样品的白细胞抗原型别。
由图1和图2中可知,为了更加直观清晰地显示出各组合与各探针在空间位置上的相互关系,对每一种HLA抗原,最好绘制两张图,一张显示各组合之间的空间位置关系,一张显示各探针之间的空间位置关系。在做这两张图时,遵循如下原则对每一组合(或探针),由上到下搜索各条等位基因,直到遇到第一条与该组合(或探针)匹配的等位基因,则在该处显示该组合(或探针)的名字。图1显示的HLA-B抗原各组合空间位置图表的一部分,图2显示的是HLA-B抗原各探针空间位置图表的一部分。图1中对组合的命名有一些本专利的约定,以Combi3-2-8为例,Combi表示Combination,即组合之意;3表示第三个多态性位点组,HLA-B抗原共152个多态性位点,被分为40组;2表示该组合是第三个多态性位点组中的第二种组合,第三个多态性位点组共有4种组合;8表示该组合在HLA-B抗原的所有组合中排在第八位,HLA-B抗原共有224种组合。被一个组合覆盖的各碱基用圆圈,小写字母或方框显示,圆圈或小写字母表示该位点是多态性位点,方框表示该位点是非多态性位点。图2中对探针的命名也有一些本专利的约定,以Probe4-1-13为例,Probe表示探针之意;4表示该探针是第四个多态性位点组所规定的探针;1表示该探针是第四多态性位点组规定的所有探针中的第一条,第四多态性位点组规定的探针共6条;13表示在HLA-B抗原的所有探针中该探针排在第13位,HLA-B抗原共有301条探针。被一个探针覆盖的各碱基用圆圈,小写字母,X字或方框显示,圆圈或小写字母表示该位点是所在探针的检测位点;X字表示该位点是多态性位点,但不是所在探针检测位点;方框表示该位点是非多态性位点。
结果判定分为三步第一步、由各探针位点荧光信号的强弱来判断各探针信号是正还是负,若某一探针位点的荧光信号值大于判定阀值,则该探针位点信号为正;若某一探针位点的荧光信号值小于判定阀值,则该探针位点信号为负。判定阀值应该由试验来确定。第二步、在本专利中,每条探针都是隶属于某一多态性位点组的,要先将隶属于每一组的各探针都找出,根据同一多态性位点组内各组合与各探针的双倍体匹配表,由各条探针信号的正负判定各组合的正负,即该组合在待测样品中的DNA中是否出现。由芯片杂交结果判断出的探针的信号有正负两种状态,在各组合与各探针的双倍体匹配表中各组合与各探针的匹配关系有P,N和V三种情况,它们的对应关系如下“P”与“正”对应;”N”与“负”对应;“V”即可与“正”对应也可与“负”对应。比如在表5中,从Probe1到Probe6都是多态性位点30,32,33这一组所规定的探针,假如在一次杂交结果中它们的信号依次为+,-,-,+,+,-,从第二行到第十一行依次检索表5,发现只有第七行(P,V,N,P,P,N)与此相匹配,所以该检测样品在这个多态性位点组的组合必为TCG+GCG,即这一多态性位点组的四种组合TCG,GCA,GCG,GTA的信号依次为+,-,+,-。按照以上原则,可依次判断出每一种组合的正负信号。第三步、根据最终的经合并处理的各等位基因对与各组合的匹配关系表,由各组合的正负判断出到底哪一对等位基因在待测样品中出现,即白细胞抗原的最终分型结果。知道各个组合的正负信号后,可以从第一行开始依次检索各等位基因对与各组合的匹配关系表,若在各等位基因对与各组合的匹配关系表发现一等位基因对,其与各组合的匹配关系与基因芯片检测出的各组合的正负信号完全一致,则待测样品的白细胞抗原即为该等位基因对的表达产物;若在各等位基因对与各组合的匹配关系表没有发现一等位基因对,其与各组合的匹配关系与基因芯片检测出的各组合的正负信号完全一致,则待测样品的白细胞抗原可能为新的尚未被登记入人类白细胞抗原等位基因库的抗原。
权利要求
1.一种基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于该方法包括如下步骤A.将人类白细胞抗原各等位基因的序列比对结果由网络中下载到计算机的存储器中,建立一个数据库;B.读取数据库中所有白细胞抗原多态性位点的信息;C.检测所有多态性位点,并将所有多态性位点按碱基位置相互临近的原则分为若干位点组;D.检索同一多态性位点组内出现的所有组合,比较每两种组合,找出碱基类型不相同的碱基位置形成新的数据组;E.根据数据组中每个多态性位点出现的情况确定分型探针的检测位点;F.根据探针的检测位点找出探针的序列。
2.根据权利要求1所述的基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于所述步骤A中还包括有合并和删除程序,由数据库中的每个单元数据进行两两比较,删除序列完全相同的等位基因以及包含有序列插入或序列删除变异的等位基因,得到具有唯一序列的等位基因比对结果。
3.根据权利要求1所述的基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于所述步骤B中的检测过程是由计算机对步骤A所形成的数据库中的单元位置进行扫描,忽略不具多态性的位点,显示多态性位点的各相关信息,所述相关信息包括,在一致性序列中的碱基类型、变异的碱基类型以及变异碱基出现的次数;所述步骤C包括预分组程序是将两个多态性位点之间间隔的碱基数目进行比较,其差数小于3~6的分为一组。
4.根据权利要求1所述的基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于所述步骤D是针对每个多态性位点组,从第一条等位基因开始逐个考察其组合的类型,记录下来所出现的新的组合类型,并自动形成比照表格,该表格行数为该组内组合数加一,列数为组合数加二;该表格的第一行以及第一列中分别填入各组合类型,进一步将上述组合类型进行两两比较,找出碱基类型不相同的位置,填入该两种组合类型相交的单元格内。
5.根据权利要求1所述的基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于所述步骤E是根据上面的比照表格,考察该表格的每一列中的多态性位点,判定一个多态性位点在该列的所有有效单元格内是否都出现,如果是则确定该多态性位点作为该探针的检测位点,并填入该列的最下面一格;否则,就要确定多个多态性位点,使该列中的任一有效的单元格至少有选定的一个多态性位点出现,这些被选定的多态性位点就分别是每条探针的检测位点,统计该组中所需探针的数量,并形成函数probe()。
6.根据权利要求1所述的基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于所述步骤E后还有优化分组程序,包括根据每组中多态性位点的数量多少进行优化组合和拆分程序,其中优化组合程序是对于组内多态性位点数量较少、两个多态性位点之间间隔的碱基数目大于3但小于10,暂分为一组,计算该组所需的探针数量,调用函数probe()进行比较,如果前者多则放弃,如果后者多则将它们确定划归入同一组;对于组内大量多态性位点拥挤在一起,其中任意相邻两个多态性位点之间间隔的碱基数都小于3~6,则将其拆分为多组,计算拆分后所需的探针数量,调用函数probe()进行比较,如果前者多则放弃,如果后者多则按新组划分,反复比较,直至找到最佳分组方案后确定;并重新确定探针的检测位点。
7.根据权利要求1所述的基因芯片用人类白细胞抗原分型探针的筛选方法,其特征在于所述步骤F是以确定的探针检测位点为中心向左右各延伸6~13个碱基,确定探针的序列。
8.一种基因芯片用人类白细胞抗原分型探针的应用方法,其特征在于包括以下步骤①以上述方法确定探针检测位点以及探针序列;②构建各等位基因对与各条探针匹配关系的判断程序;③合成探针并将探针置于固相载体上;④PCR扩增样品DNA,与芯片杂交并扫描;⑤由步骤②所建立的判断程序判别步骤④扫描出来的结果,将完全匹配的判断结果输出,从而确定待测样品的白细胞抗原型别。
9.根据权利要求8所述的基因芯片用人类白细胞抗原分型探针的应用方法,其特征在于将步骤④进一步详细分成以下步骤a.首先建立各种组合与各条探针的单倍体匹配关系表,即当某一组合的序列与某一探针的序列相同,则杂交时该组合能使该探针位点亮,确定了该组合与该探针匹配;当某一组合与某一探针存在不相同的碱基且该碱基正好是该探针的检测位点,则杂交时拥有该组合的序列不会使该探针亮,则表示该组合与该探针不相匹配;当某一组合与某一探针存在不相同的碱基且该碱基不是该探针的检测位点,这时分两种情况如果这个不相同的碱基与该探针的检测位点之间的间隔小于该组分组时确定的标准间隔碱基数,那么杂交时拥有该组合的序列会使该探针拥有不确定的信号,即可能使探针亮,也可能使探针不亮;如果这个不相同的碱基与该探针的检测位点之间的间隔大于或等于该组分组时确定的标准间隔碱基数,那么杂交时拥有该组合的序列会使该探针亮;b.进一步建立双倍体组合探针匹配关系表,建立双倍体组合探针匹配关系表的方法是将任两个组合类型配在一起并将它们与探针的匹配关系叠加在一起,叠加时遵循如下原则若一种组合在某一探针处显示匹配的信号,不管另一种组合在该探针处显示的信号是否匹配,则这两种组合配对后与该探针相匹配;若一种组合在某一探针处显示不确定信号,则不管另一种组合在该探针处显示不确定信号还是不匹配信号,这两种组合配对后都会使该探针显示不确定信号;若两种组合在某一探针处的信息均显示不匹配信号,则这两种组合配对后会使该探针显示不匹配的信号;c.比较每一条等位基因与每一组合的序列,判断各条等位基因与各组合的匹配关系,若某一条等位基因的碱基类型与某一组合的碱基类型都一致,则该等位基因与该组合相匹配;若某一条等位基因与某一组合在一处或多处碱基类型不相同,则该等位基因与该组合不相匹配;d.比较每两种等位基因组成的等位基因对与各组合的匹配关系,本步骤只要在步骤C的基础上,将组成该等位基因对的两种等位基因与该组合的匹配关系叠加起来,即可得到该等位基因对与该组合的匹配关系;e.对各等位基因对与各组合的匹配关系做两两比较,合并具有相同组合匹配关系的等位基因对,构建出最终的各等位基因对与各组合的匹配关系表;f.由芯片杂交结果判断出各条探针的正负,根据双倍体组合探针匹配关系表,由各条探针的正负判断出各组合的正负,根据最终的各等位基因对与各组合的匹配关系表,由各组合的正负判断出待测样品的等位基因对,即待测样品的白细胞抗原型别。
全文摘要
本发明公开了一种人类白细胞抗原高分辨率、并且探针调试以及确定判定阀值容易的分型探针筛选及其应用方法,提出了对多态性位点进行“分组”的解决方案,依此方法设计出来的分型探针,检测位点定位准确并且包容性较强,分辨率高。本发明的全部筛选过程全部由设计的一套计算机软件来执行,所以,可以快速准确地筛选出理想的分型探针。而且本专利还描述了各种匹配关系表的构建方法及如何根据这些匹配关系表一步步由芯片杂交结果判断出待测样品的白细胞抗原类型,解决了该分型探针在实际工作中的应用问题。
文档编号C12Q1/68GK1680589SQ0312680
公开日2005年10月12日 申请日期2003年6月6日 优先权日2003年6月6日
发明者李志广 申请人:李志广
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1