一种基于生物遗传数据的身高预测方法及系统与流程

文档序号:37015335发布日期:2024-02-09 13:05阅读:来源:国知局

技术特征:

1.一种基于生物遗传数据的身高预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述步骤s1,包括:

3.根据权利要求1所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述对基因组数据在位点层面进行质量控制,包括:

4.根据权利要求1或3所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述对基因组数据和身高相关表型数据在个体层面进行质量控制,包括:

5.根据权利要求1所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述外部公开的身高gwas数据为:世界范围内公开的样本数量最大的身高gwas数据,并且包括欧洲、东亚、非洲、南亚和西班牙裔族群。

6.根据权利要求1所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述跨族群身高的多基因风险评分 prs权重的计算包括:按照族群不同,将每个族群的身高gwas数据进行两两组合,每个组合包括一个亚洲族群的身高gwas数据和一个欧洲族群的身高gwas数据;然后对每个组合的身高gwas数据分别采用prs-csx方法和x-wing方法计算多基因风险评分prs权重。

7.根据权利要求1或6所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述单一族群身高的多基因风险评分prs 权重的计算包括:基于单一族群,将每个族群的身高gwas数据分别采用c+t方法和prs-cs方法计算多基因风险评分prs权重。

8.根据权利要求1所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述多基因风险评分prs值的计算公式如下:

9.根据权利要求1所述的一种基于生物遗传数据的身高预测方法,其特征在于,所述身高预测模型的公式如下:

10.一种基于生物遗传数据的身高预测系统,其特征在于,包括数据录入储存模块、数据预处理模块、模型训练模块、身高预测模块;


技术总结
本发明公开了一种基于生物遗传数据的身高预测方法及系统,包括:S1、构建身高相关基因位点参考数据库;S2、进行质量控制得到样本数据;进行主成分分析得到主成分PC;随机划分为训练集、验证集和测试集;S3、计算每个基因位点对身高的遗传效应值,得到训练集的身高GWAS数据;收集外部公开的身高GWAS数据及其与非公开数据经荟萃分析得到的位点权重数据;S4、计算跨族群身高的多基因风险评分PRS权重,以及单一族群身高的多基因风险评分PRS权重;S5、计算验证集的多基因风险评分PRS值;采用线性回归模型,得到身高预测模型;S6、计算目标集的多基因风险评分PRS值;将目标集代入身高预测模型,得到身高预测值,从而提高了中国人群身高预测的精度。

技术研发人员:李腾,宋洁,唐森威,李哲夫,王理中,陈钢
受保护的技术使用者:深圳市早知道科技有限公司
技术研发日:
技术公布日:2024/2/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1