遗传标记组合、个体基因身份证及其用图

文档序号:9722661阅读:804来源:国知局
遗传标记组合、个体基因身份证及其用图
【技术领域】
[0001] 本发明涉及生物医学领域,具体的,本发明涉及一种遗传标记组合、一种个体基因 身份证、一种试剂盒及其用途。
【背景技术】
[0002] 遗传信息是由亲代遗传给子代,理论上对个体而言是固定不变的,因此基因检测 (除了肿瘤的突变检测以外)能够用于区分个体,用于认证个体身份信息。
[0003] 基因身份证(Gene Identification Card)主要是利用DNA指纹技术,选取若干个 固定的基因位点进行鉴定。基因是固有的不变的遗传标记,由小孩从父母那里继承而来,只 需选取若干个位点就可以鉴定出来。对应于个人身份证号码,个体基因身份证的号码是由 多个能够表示这些基因位点特征的数据来表示的,这些选出来的基因位点的组合具有唯一 性。

【发明内容】

[0004] 本发明旨在至少解决上述问题至少之一或者提供至少一种可选择的商业手段。
[0005] 依据本发明的一方面,本发明提供一种遗传标记组合,所述遗传标记组合包括表1 所示的SNP位点。
[0006] 表 1
[0007]
[0008] 单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水 平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一 种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基 对中就有1个,估计其总数可达300万个甚至更多。
[0009]需要说明的是,以上表1中的SNP位点是根据GenBank SNP数据库的命名方式来表 示的,该方式是以rs或者ac加数位阿拉伯数字来表示一个确定的SNP位点。本领域技术人员 知道,一个SNP位点还可以有其它表示方式,如以HGVS命名法标注某位点在参考cDNA上的位 置来表示,例如rsl801394与MTRR基因 c.66A>G(A66G)表示同一个位点。采用其它命名方式 比如以该SNP在参考gDNA上的位置来标注指代与本发明一样的SNP或SNP组合也属于本发明 范围。
[0010] 所称的遗传标记组合的确定包括发明人基于对人类基因组里发生频率较高的SNP 进行筛选,并组合成一个对个体而言为唯一的组合,从而与个体信息进行对应,遗传标记组 合的信息能够作为个体的"基因身份证"。表1所示的SNP位点是发明经过筛选组合以及经过 试验验证确定的,能够有效地用于个体遗传信息区分的遗传标记组合。
[0011] 根据本发明的实施例,发明人通过设计以下方法来获得表1的SNP位点:首先,将所 有公开可获取的人类种族基因组信息中超过50个不同的种族的遗传标记信息进行整理、统 计分析和排序,将平均杂合度(Average heterozygosity)大于0.4、固定指数(The Fixation index,FST)小于0.06的SNP筛选出;接着,考虑筛选出的每个SNP在染色体上的位 置,单倍型分布等,筛选出单条染色体上相邻两个SNP的距离超过75cM的位点。这种方法筛 选得的遗传标记组合克服了传统的基于STR组合可能出现的人群分辨率低的问题,并且可 以选择利用的检测平台多、利于在极低的起始DNA的情况下进行检测。
[0012] 根据本发明的实施例,本发明的这一方面的遗传标记组合还可以具有以下附加技 术特征至少之一:
[0013] 与表型相关的基因,主要是与眼睛、皮肤、头发的颜色,以及脸型的基因,目前研究 比较多的基因包括:T YR、TYRP1、0CA2、SLC4 5A2、SLC24A5、MC1R、AS IP、KITLG、SLC24A4、IRF4、 TPCN2等,这些基因上的多态性位点可以预测该测试者的相关表型。遗憾的是,关于亚洲人 的脸型和表型相关的研究较少。根据本发明的实施例,发明人考虑与表1中的SNP的补充以 及对表1中的SNP位点的信息作为个体区分效果的增强,筛选了一些与亚洲人表型相关的 SNP位点作为主要的候选,使所述遗传标记组合还包括以下SNP位点中的至少一个: rs 17822931,rs1800414,rs1800419,rs1805008,rs671,rs3827760,rs11671664和 rsll030104。例如,遗传标记组合还包括所列8个中的任意一个、两个、三个、五个或者较佳 的包含全部八个。
[0014]这8个SNP位点是发明人筛选的、并且经过试验验证的能够进一步增强表1的SNP位 点组合的个体信息区分功能的亚洲人表型相关的位点。例如,r s 17 8 2 2 9 31与耳垢相关, rsl800414与亚洲人的淡肤色相关,rsl800419与皮肤和眼睛颜色相关,rsl805008与皮肤颜 色相关,rs671与喝酒脸红相关,rs3827760与直发、厚发以及铲形齿相关,rsll671664与亚 洲人重体重相关,rsll030104与亚洲人体重增加相关。如此,使得该遗传标记组合更适合对 以亚洲人为主要遗传背景的人群进行区分,不仅提高了传统基于STR标记的对个体区分的 准确度,同时增加了区分疑难样本的准确度。
[0015] 为使遗传标记组合的信息具有更好的个体所属种族的分辨功能,发明人结合遗传 标记组合包含的位点信息以及组合试验验证,筛选出了表2所示的位点。
[0016] 根据本发明的实施例,所述遗传标记组合还包括表3所示的SNP位点中的至少一 个。例如,该遗传标记组合还包括表3所列SNP中的任意一个、两个、三个、五个、十个、二十 个、三十个、四十个、五十个或者较佳的包含表2所示的全部SNP位点。表3展示了发明人筛选 出的、能够增强原来遗传标记组合信息的分辨功能的、能够区分种族的SNP位点组合。
[0017] 表2
[0018]
[0019] 与血统相关的SNP位点一般来自两个方面:母亲的线粒体遗传和来自父亲的Y染色 体遗传,这两个独立的遗传系统将可代表血统或者家系。为使遗传标记组合的信息具有更 好的个体血统或家系来源的分辨功能,发明人结合遗传标记组合已包含的位点信息以及组 合试验验证,筛选出了表3所示的位点。
[0020] 根据本发明的实施例,所述遗传标记组合还包括表3所示的SNP位点中的至少一 个。例如,遗传标记组合还包括表3所列位点中的任意一个、两个、三个、五个、十个、二十个、 三十个、四十个、五十个或者较佳的包含表3所示的全部SNP位点。表3展示发明人筛选出的、 能够增强原来遗传标记组合信息的分辨功能的、更好的增强标记组合的血统信息的Y染色 体上的多态性位点。
[0021] 表3
[0022] muu 乙 ijoi
ivs 乙 υυ 乙 UU4:
[0023] 为使遗传标记组合的信息具有更好的个体血统或家系来源的分辨功能,发明人结 合遗传标记组合已包含的位点信息以及组合试验验证,进一步筛选出了线粒体上的多态性 位点。
[0024] 根据本发明的实施例,所述遗传标记组合还包括以下线粒体位点至少之一:152、 709、3010、3970、5178、8414、%?、9540、10398、10873、12705、13928、14783、15043、16311和 16362;其中的9bp位点指与所述线粒体的第8272位至第8280位上的9个碱基重复的该线粒 体的8281~8289位置的碱基CCCCCTCTA,所述9bp位点存在突变表现为所述线粒体的8281~ 8289位置的碱基CCCCCTCTA整体缺失。例如,遗传标记组合还包括上述所列线粒体位点中的 任意一个、两个、三个、五个、十个、十五个或者较佳的包含全部所列线粒体位点。需要说明 的是,这里以位点在线粒体参考基因组上的位置编号来表示该位点,例如线粒体152位点指 线粒体参考序列上的第152位上的C基因型以及其它可能的基因型,709指线粒体参考序列 上的第709位上的G基因型以及其它可能的基因型,3010指线粒体参考序列上的第3010位上 的G基因型以及其它可能的基因型,3970指线粒体参考序列上的第3970位上的T基因型以及 其它可能的基因型,5178指线粒体参考序列上的第5178位上的A基因型以及其它可能的基 因型,8414指线粒体参考序列上的第8414位上的T基因型以及其它可能的基因型,9540指线 粒体参考序列上的第9540位上的T基因型以及其它可能的基因型,10398指线粒体参考序列 上的第10398位上的C基因型以及其它可能的基因型,10873指线粒体参考序列上的第10873 位上的C基因型以及其它可能的基因型,12705指线粒体参考序列上的第12705位上的T基因 型以及其它可能的基因型,13928指线粒体参考序列上的第13928位上的C基因型以及其它 可能的基因型,14783指线粒体参考序列上的第14783位上的T基因型以及其它可能的基因 型,15043指线粒体参考序列上的第15043位上的C基因型以及其它可能的基因型,16311指 线粒体参考
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1