获得人种特异性位点的方法和人种推断系统及其应用的制作方法

文档序号:585578阅读:258来源:国知局
专利名称:获得人种特异性位点的方法和人种推断系统及其应用的制作方法
技术领域
本发明涉及生物信息学领域,尤其涉及一种利用生物信息学方法获得人种特异性 位点的方法和人种推断系统及其应用。
背景技术
人类基因组拥有大约32亿对碱基。不同的人基因组中碱基对序列的99. 9%都是 一样的,只有不到千分之一左右的序列有所不同。这些差异的主要形态,是被称为“单核苷 酸多态性(Single nucleotidepolymorphism, SNP) ”的由DNA链上单个核苷酸的变异引起 的DNA多态性。这不到千分之一的差异不仅决定了人们是否易于得某些疾病,也决定了他 们在身高、肤色和体型等方面的差异。单核苷酸多态性(Singlenucleotide polymorphism, SNP)是在限制性片段长度多态性(restrictionfragment length polymorphism,RFLP)和 短串联重复序列(short tandemrepeat,STR)两代遗传标记之后的“第三代遗传标记”,是目 前为止人类基因组中分布最广泛、存在数量最多的DNA多态型,至少约IOOObp就有一个SNP 位点,在整个基因组的分布达3 X IO6个,这比STR要高出几个数量级,大约90%的人类遗传 变异是单核苷酸多态性。SNP广泛存在于非编码区和编码区,不仅可以用于个体识别,而且 在人的外形和种族推测方面具有独特的作用。另外SNPs片段较短,更易进行PCR扩增,并 且产物的长度不到lOObp,这与300-400bp的STRs相比能够更好的适用于降解的DNA样本, 而且SNPs弓丨物结合位点间的距离较近,在法医鉴定中有利于对高度降解的DNA进行分析。为充分了解SNP在人类基因组上的分布情况,国际人类基因组单体型图计划(简 称HapMap计划)收集了包括尼日利亚的约鲁巴人、北京的中国汉族人、美国的西北欧后裔 和东京的日本人四个群体的全基因组信息。从这些基因组数据中,科学家们发现了 1.42 百万个常见的SNP位点,并详细描述了这些变异的形式、在DNA上存在的位置,以及在同一 群体内部和不同群体间的分布状况。这些信息对分析SNP与遗传疾病的关系以及个体化用 药提供了良好的指导,同时也为法医学方面的研究提供了良好的数据来源。在通常的情况下或场合,可以根据人的肤色、五官等通过人视觉可辨别的特征对 未知来源个体进行黑、白、黄人种来源判别,但是法医学上,对于在案发或事故现场取得的 难以辨认的严重损毁尸体、残留的人体血液与精液等微量、易降解腐败生物检材,仅凭上述 简单的视觉特征进行黑、白、黄人种来源查找时,存在非常大的局限;另外对于一些正常的 个体检材,比如嫌疑人为混血个体,若必须通过判定祖先背景才能排除,则仅根据其肤色、 五官等特征,显然无法进行准确的人种来源推断。因此通过生物学方法对个体从基因水平 进行人种来源推断显得尤为必要。

发明内容
本发明提供了一种获得黑、白、黄人种特异性位点方法,该方法可从黑、白、黄人种 群体的基因组SNP位点中获得有限个具有高鉴别力的黑、白、黄人种特异性位点,使用上述 人种特异性位点实现高准确性的黑、白、黄人种来源推断,并提供输出形式较为科学、可以被法庭接受的鉴别力数据。本发明还提供了一种建立黑、白、黄人种推断系统的方法和由该方法获得的黑、 白、黄人种推断系统及其应用,利用所建立的黑、白、黄人种推断系统可对未知来源个体进 行准确的黑、白、黄人种来源的推断。本发明所提供的一种获得黑、白、黄人种特异性位点方法,由以下步骤组成选择 黑、白、黄人种群体;获得所述黑、白、黄人种群体的基因组SNP位点;挑选所述黑、白、黄人 种群体的色素沉积类基因和异生质代谢酶类基因内的SNP位点;从上述挑选出的SNP位点中筛出黑、白、黄人种群体的祖先信息标记位点,所述祖 先信息标记位点为至少有一个S值大于0.5的SNP位点,所述δ值为SNP位点的等位基 因(Α或a)在所述黑、白、黄人种人种群体中的基因频率的差值;从上述祖先信息标记位点中筛出黑、白、黄人种特异性位点,所述黑、白、黄人种特 异性位点为有两个δ值大于0.5的祖先信息标记位点;在筛选所述黑、白、黄人种特异性位 点时应尽可能从不同的染色体上的祖先信息标记位点中筛选,减低单倍型对位点的判别准 确性的影响。所述色素沉积类基因和异生质代谢酶类基因由以下基因组成FDPS,SLC45A2, HMGCR, AP3B1, IRF4, ESRl,AHR, EGFR, CYP3A4, TYRPl,CYP2C8, CYP2C9, TPCN2, TYR, DRD2, VDR, HMGA2, KITLG, DCT, SLC24A4, 0CA2, HERC2, SLC24A5, CYP19A1, MY05A, CYPlAl,MC1R, GHl,ASIP 和 CYP2D6。在本发明的一个实施例中,所述黑、白、黄人种群体可以是来自HapMap数据库,分 别为由在美国生活的非洲人和在非洲生活的非洲人组成的黑人群体,由在美国生活的欧洲 人组成的白人群体,由在北京生活的汉族人和在美国生活的汉族人以及在东京生活的日本 人组成的黄人群体。本发明还提供了一种获得黑、白、黄人种推断系统的方法,包括按上述方法获得 所述黑、白、黄人种特异性位点;并将获得的各黑、白、黄人种特异性位点的等位基因组成的 各基因型的对数似然比值进行集合。其中所述对数似然比值为各黑、白、黄人种特异性位点 的等位基因组成的各基因型在所述黑、白、黄人种群体中的基因型频率的对数似然比值。本发明还提供了一种黑、白、黄人种推断系统,由上述获得黑、白、黄人种推断系 统的方法获得。该系统由16个黑、白、黄人种特异性位点以及各黑、白、黄人种特异性位 点的等位基因组成的各基因型的对数似然比值构成,所述16个黑、白、黄人种特异性位点 为:rsll264300、rs28777、rsl2668421、rs4646437、rs7048117、rs686016、rsll018541、 rs2583939、rs3782972、rs8012948、rs7170451、rs728404、rs2470102、rs885479、rsl205357 以及 rs7290134。在上述基础上,本发明还提供了上述黑、白、黄人种推断系统在对未知来源个体进 行黑、白、黄人种来源推断中的应用。利用本发明上述推断系统对未知来源个体进行黑、白、黄人种来源进行推断的方 法,包括获得未知来源个体的SNP位点;获得所述未知来源个体的16个黑、白、黄人种特 异性位点的基因型;从所述黑、白、黄人种推断系统中获得所述未知来源个体的各黑、白、黄 人种特异性位点的对数似然比值;将所述各黑、白、黄人种特异性位点的对数似然比值加和 得到16个黑、白、黄人种特异性位点的对数似然比值;黑、白、黄人种群体两两划分的对数似然比值均为大的群体为未知来源个体的来源群体;上述方法中所述的16个黑、白、黄人种特异性位点为rsll264300、rs28777、 rsl2668421、rs4646437、rs7048117、rs686016、rsll01854U rs2583939、rs3782972、 rs8012948、rs7170451、rs728404、rs2470102、rs885479、rsl205357 和 rs7290134。另外,本发明还提供了一种提高对未知来源个体的黑、白、黄人种来源推断准确性 的方法,该方法包括获得未知来源个体的SNP位点;获得所述未知来源个体的16个黑、白、黄人种特异性位点的基因型;利用上述的黑、白、黄人种推断系统获得所述未知来源个体的各黑、白、黄人种特 异性位点的对数似然比值;将所述各黑、白、黄人种特异性位点的对数似然比值加和得到16个黑、白、黄人种 特异性位点的对数似然比值;所述黑、白、黄人种群体两两划分的对数似然比值均为大的群体为未知来源个体 的来源群体;上述方法中所述的16个黑、白、黄人种特异性位点为rsll264300、rs28777、 rsl2668421、rs4646437、rs7048117、rs686016、rsll01854U rs2583939、rs3782972、 rs8012948、rs7170451、rs728404、rs2470102、rs885479、rsl205357 和 rs7290134。采用本发明的上述方法和系统可以快速、有效地对难以辨认的严重损毁尸体、残 留的人体血液与精液等微量、易降解腐败生物检材,进行人种来源推断,从而扩大犯罪现场 的检材范围,为公安机关刑事执法和行政执法、保障社会公共安全提供有力的技术支撑;另 外,对于一些正常个体检材,如通过其个体的肤色、五官等无法获得准确的人种来源推断的 混血个体等,可进行准确有效的个体来源推断。


图1为16个黑、白、黄人种特异性位点对黑、白、黄人种群体两两划分得到的平均 对数似然比值进行比较的单因素方差分析图。
具体实施例方式为使本发明的目的、技术方案和技术效果更加清楚,下面将结合本发明具体实施 例及相应附图,对本发明实施例中的技术方案进行清楚、完整地描述,但以下实施例不能理 解为对本发明的可实施范围的限定,基于本发明中的实施例,本领域普通技术人员在没有 做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。实施例一通过本实施例来具体说明本发明所提供的一种获得黑、白、黄人种推断系统的方法。一、首先通过以下步骤获得黑、白、黄人种特异性位点1、优选来自HapMap数据库的,由83个在美国生活的非洲人和167个在非洲生活 的非洲人组成的黑人群体、由165个在美国生活的欧洲人组成的白人群体、由84个在北京 生活的汉族人和85个在美国生活的汉族人以及86个在东京生活的日本人组成的黄人群体作为本实施例的黑、白、黄人种群体;上述黑、白、黄人种群体由6个地理区域的人群组成,因其地理学距离大,特征差 异明显,容易获得质量较高的隔离群样本,使用这些群体将获得更具高鉴别力的黑、白、黄 人种特异性位点,另外HapMap数据库提供了对上述黑、白、黄人种群体的SNP位点的变化形 式、在DNA上存在的位置,以及在同一群体内部和不同群体间的分布状况的统计,使用这些 在权威数据库中公开的数据进行黑、白、黄人种特异性位点分析将使分析结果更加准确并 具有说服力;对于其他选自非已知数据库中存在的黑、白、黄人种群体,其SNP位点可以通 过常规的基因组测序方法获得,SNP位点的两个等位基因的基因频率可通过基因组测序结 果进行统计获得。获得SNP位点的两个等位基因的基因频率后可以进一步获得SNP位点的 等位基因所组成的基因型的频率。2、针对上述来自HapMap数据库的黑、白、黄人种群体,从HapMap数据库中获得所 述黑、白、黄人种群体的色素沉积类基因和异生质代谢酶类基因内的SNP位点,以及各SNP 位点的两个等位基因的基因频率,其中所述色素沉积类基因和异生质代谢酶类基因由以 下 30 个基因组成FDPS,SLC45A2, HMGCR, AP3B1, IRF4, ESRl, AHR, EGFR, CYP3A4, TYRP1, CYP2C8, CYP2C9, TPCN2, TYR, DRD2, VDR, HMGA2, KITLG, DCT, SLC24A4, 0CA2, HERC2, SLC24A5, CYP19A1, MY05A, CYPlAl,MC1R, GHl,ASIP, CYP2D6。以上30个基因的组合充分覆盖了在人类进化的漫长历程中经历选择压力依然保 留了下来的具有黑、白、黄人种特异性的色素沉积类基因和异生质代谢酶类基因,这些色素 沉积类基因和异生质代谢酶类基因例如可表达高的黑色素保护非洲人远离紫外线的损伤 的基因,编码异生质代谢酶有益于在饮食中接触特定的生物碱或单宁的黑、白、黄人种祖先 的基因。通过对上述基因区域内的SNP位点的筛选,可获得具有高鉴别力的黑、白、黄人种 特异性位点。3、从上述挑选出的30个色素沉积类基因和异生质代谢酶类基因基因内的SNP位 点中筛出黑、白、黄人种群体的祖先信息标记位点,所述祖先信息标记位点为至少有一个δ 值大于0. 5的SNP位点;其中,δ值代表SNP位点的等位基因(Α或a)在两个群体中的频率分布差异,δ
值计算通用公式为 k
权利要求
获得黑、白、黄人种特异性位点的方法,由以下步骤组成选择黑、白、黄人种群体;获得所述黑、白、黄人种群体的基因组SNP位点;挑选所述黑、白、黄人种群体的色素沉积类基因和异生质代谢酶类基因内的SNP位点;从上述挑选出的SNP位点中筛出黑、白、黄人种群体的祖先信息标记位点,所述祖先信息标记位点为至少有一个δ值大于0.5的SNP位点;从上述祖先信息标记位点中筛出黑、白、黄人种特异性位点,所述黑、白、黄人种特异性位点为有两个δ值大于0.5的祖先信息标记位点。
2.根据权利要求1所述的获得黑、白、黄人种特异性位点的方法,所述色素沉积类基因 和异生质代谢酶类基因由以下基因组成FDPS,SLC45A2,HMGCR, AP3B1, IRF4,ESRl,AHR, EGFR, CYP3A4, TYRPl,CYP2C8, CYP2C9, TPCN2, TYR, DRD2, VDR, HMGA2, KITLG, DCT, SLC24A4, 0CA2, HERC2, SLC24A5, CYP19A1, MY05A, CYPlAl, MC1R, GHl, ASIP 和 CYP2D6。
3.根据权利要求1或2所述的获得黑、白、黄人种特异性位点的方法,所述黑、白、黄人 种群体来自HapMap数据库,分别为由在美国生活的非洲人和在非洲生活的非洲人组成的 黑人群体,由在美国生活的欧洲人组成的白人群体,由在北京生活的汉族人和在美国生活 的汉族人以及在东京生活的日本人组成的黄人群体。
4.一种获得黑、白、黄人种推断系统的方法,包括按照权利要求1-3任一项所述的方 法获得所述黑、白、黄人种特异性位点;并将获得的各黑、白、黄人种特异性位点的等位基因 组成的各基因型的对数似然比值进行集合。
5.一种黑、白、黄人种推断系统,由权利要求4所述的获得黑、白、黄人种推断系统的方 法获得。
6.根据权利要求5所述的黑、白、黄人种推断系统,该系统由16个黑、白、黄人种特异 性位点以及各黑、白、黄人种特异性位点的等位基因组成的各基因型的对数似然比值构成, 所述 16 个黑、白、黄人种特异性位点为rsll264300、rs28777、rsl2668421、rs4646437、 rs7048117、 rs686016、 rsll018541、 rs2583939、 rs3782972、 rs8012948、 rs7170451、 rs728404、rs2470102、rs885479、rsl205357 和 rs7290134。
7.权利要求6所述的黑、白、黄人种推断系统在对未知来源个体进行黑、白、黄人种来 源推断中的应用。
8.对未知来源个体进行黑、白、黄人种来源推断的方法,该方法包括 获得未知来源个体的SNP位点;获得所述未知来源个体的16个黑、白、黄人种特异性位点的基因型; 利用权利要求5或6所述的黑、白、黄人种推断系统获得所述未知来源个体的各黑、白、 黄人种特异性位点的对数似然比值;将所述各黑、白、黄人种特异性位点的对数似然比值加和得到16个黑、白、黄人种特异 性位点的对数似然比值;黑、白、黄人种群体两两划分的对数似然比值均为大的群体为未知来源个体的来源群体;上述方法中所述的16个黑、白、黄人种特异性位点为rsll264300、rs28777、 rsl2668421、 rs4646437、 rs7048117、 rs686016、 rsll018541、 rs2583939、 rs3782972、rs8012948、rs7170451、rs728404、rs2470102、rs885479、rsl205357 和 rs7290134。
9. 一种提高对未知来源个体的黑、白、黄人种来源推断准确性的方法,该方法包括 获得未知来源个体的SNP位点;获得所述未知来源个体的16个黑、白、黄人种特异性位点的基因型; 利用权利要求7所述的黑、白、黄人种推断系统获得所述未知来源个体的各黑、白、黄 人种特异性位点的对数似然比值;将所述各黑、白、黄人种特异性位点的对数似然比值加和得到16个黑、白、黄人种特异 性位点的对数似然比值;所述黑、白、黄人种群体两两划分的对数似然比值均为大的群体为未知来源个体的来 源群体;上述方法中所述的16个黑、白、黄人种特异性位点为rsll264300、rs28777、 rsl2668421、rs4646437、rs7048117、rs686016、rsll018541、rs2583939、rs3782972、 rs8012948、rs7170451、rs728404、rs2470102、rs885479、rsl205357 和 rs7290134。
全文摘要
本发明提供一种获得人种特异性位点的方法和人种推断系统及其应用。所述获得人种特异性位点的方法包括选择黑、白、黄人种群体;获得所述黑、白、黄人种群体的基因组SNP位点;选出所述黑、白、黄人种群体的色素沉积类基因和异生质代谢酶类基因内的SNP位点;从上述挑选出的SNP位点中筛出黑、白、黄人种群体的祖先信息标记位点;从所述祖先信息标记位点中筛出黑、白、黄人种特异性位点。将筛出的黑、白、黄人种特异性位点进行集合得到所述黑、白、黄人种推断系统,可用于对未知来源个体进行准确、高效的黑、白、黄人种来源推断。
文档编号C12Q1/68GK101956006SQ20101026587
公开日2011年1月26日 申请日期2010年8月27日 优先权日2010年8月27日
发明者李彩霞, 胡兰, 魏以梁 申请人:公安部物证鉴定中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1