一种基于基因数据人脸画像和人脸识别方法与流程

文档序号：20912315发布日期：2020-05-29 13:07阅读：1112来源：国知局

本发明涉及基因人脸识别技术领域，具体为一种基于基因数据人脸画像和人脸识别方法。

背景技术：

人类基因组由23对染色体组成，其中包含3万个左右的基因，30亿个碱基对，蕴含丰富的遗传信息。随着基因行业的发展，各种相关基因技术已被运用到多种场合。当前法医dna常规使用的短串联重复序列(shorttandemrepeat，str)遗传标记仅使用了基因组中很少量的遗传信息，基因组中还存在大量与个体表观相关的遗传信息尚未使用。同时，当前法医使用的dna技术多用于对比个体差异，而实际上很多场合多需要更多个体表观信息。人类的外貌特征虽然性状复杂，但却具有高度的遗传保守性，因此用dna技术进行个体表观特征的刻画已成为基因行业的研究热点之一。

单核苷酸多态性位点(singlenucleotidepolymorphisms，snps)是目前使用最广泛的遗传标记物，snp广泛存在于人类基因组中，平均每1000个碱基对中就有一个snp，同时snp大多存在于基因组的非编码区，因此遗传稳定性较高，不易突变。随着测序技术的发展，全基因组关联分析(genome-wideassociationstudy，gwas)已成为联系snp与表观的流行研究方法之一。大量的gwas研究已经挖掘出许多与人类外貌表观相关的snp位点，通过这些位点和相应的计算预测模型，未知dna样本的表观预测已成为可能。其中，机器学习学科快速推动了这一领域的发展。人类外貌相关的snp位点数量多，位点与外貌关联性计算复杂且计算量大，因此机器学习大大加速了相关性分析。

机器学习是一门多领域交叉学科，涉及概率论、统计学、计算机等多领域学科，研究计算机模拟并实现人类的学习行为，有获取新的知识、重新组织已有知识并构建完善的知识系统的性能。机器学习在生物领域的应用从上世纪90年代已经开始了，从癌症亚型分类到人种分类，同时生物组学的发展也为机器学习提供了足够的数据，并与机器学习相互促进发展。

现有基因人脸画像技术侧重于基因间的比较，并不能做到“预测”，即基因数据人脸画像。以基因数据为基础的人脸画像技术目前没有统一的标准流程，更少有商品化的服务，该技术目前仅在刑侦方面应用，处于技术发展初期，在基因数据人脸画像技术少有的基础上，更加缺少基因数据人脸识别相关技术，因此，我们开发了一种用于基因数据的人脸画像方法，操作更加简洁方便。

技术实现要素：

针对背景技术中提出的现有基因数据人脸画像和人脸识别还在技术推广上存在的不足，本发明提供了一种基于基因数据人脸画像和人脸识别方法，具备一键输出预测好的人脸画像/人脸基因数据、操作简便的优点，解决了上述背景技术中提出的问题。

本发明提供如下技术方案：一种基于基因数据人脸画像和人脸识别方法，包括基因数据预测模型的训练、预测模型的使用、识别模型的训练和识别模型的使用，所述预测模型的训练和预测模型的使用用于基因数据人脸画像，所述识别模型的训练和识别模型的使用用于基因数据人脸识别，所述预测模型的训练包括以下步骤：

y1、获取基因数据和平均人脸坐标数据；

y2、根据所述基因数据进行基因组snp分型检测，挑选出与人类面部特征点相关的位点；

y3、根据所述人类面部特征相关的位点计算理论五官坐标；

y4、将平均人脸坐标计算修正所述理论五官坐标得到预测草图；

y5、从已知基因信息个体的人脸识别获取真实人脸坐标信息；

y6、将所述真实人脸坐标信息训练所述预测草图获取预测模型；

所述预测模型的使用包括以下步骤：

y01、获取基因数据；

y02、将步骤y01获取的基因数据代入步骤y6中所述预测模型中运算，并输出预测好的人脸特征点；

y03、将预测好的人脸特征点根据步骤y5中所述真实人脸坐标信息绘制人脸画像。

优选的，所述识别模型的训练包括以下步骤：

s1、由人脸识别获取特征点坐标、获取基因数据；

s2、由步骤s1中基因数据训练获取的特征点坐标获得识别模型；

所述识别模型的使用包括以下步骤：

s01、由人脸识别获取特征点坐标；

s02、将步骤s01中获取的特征点坐标代入步骤s2中获得的识别模型中进行模型运算，并输出预测基因数据。

优选的，步骤y5中，所述真实人脸坐标信息为已知基因信息的68个人脸特征点，该68个人脸特征点包括17个轮廓特征点和51个五官特征点。

优选的，步骤y1中，所述平均人脸坐标数据以七大洲为区域划分。

本发明具备以下有益效果：

1、本发明通过基因预测模型库的建立和通过预测模型库运算基因人脸画像，实现由基因数据输入至可视化人脸图像输出，可根据输入的基因/人脸图像，一键输出预测好的人脸画像/人脸基因数据，操作简便，为基因预测人脸画像提供技术支持，为人脸画像获取基因数据提供技术支持。

2、本发明通过将平均人脸坐标信息按七大洲区域性划分，可向模型库中输入对应的平均人脸信息即可有针对性的进行区域性人脸预测，使得训练出的预测模型更加准确，适用范围广。

附图说明

图1为本发明预测模型的训练框图；

图2为本发明预测模型的使用框图；

图3为本发明基因数据人脸识别模型的训练流程；

图4为本发明基因数据人脸识别模型的使用流程。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-4，一种基于基因数据人脸画像和人脸识别方法，包括基因数据预测模型的训练、预测模型的使用、识别模型的训练和识别模型的使用，预测模型的训练和预测模型的使用用于基因数据人脸画像，识别模型的训练和识别模型的使用用于基因数据人脸识别。基因数据人脸画像和人脸识别指通过人类基因组snp分型检测，挑选出其中与人类面部特征点相关的位点，获取位点与五官特征的关系后，做到用snp位点提供的遗传信息直接预测个体面部长相；反过来，在识别了个体的面部图像后，提取相应五官特征点，也可倒推出个体的基因型，就是基因数据的人脸识别。

具体做法为，基因数据的获取、五官在坐标的计算、已知基因信息的个体的人脸识别并得到真实人脸坐标、平均人脸坐标的获取、预测草图绘制、真实人脸坐标训练预测草图的坐标。使用大量样本进行训练后，模型会越来越准确，即预测人脸会更加贴近真实人脸。

其中，预测模型的训练包括以下步骤：

y1、获取基因数据和平均人脸坐标数据；

基因数据获取部分可使用illumina公司针对亚洲人定制的asamd芯片检测，芯片可检测出66万个有效位点分型结果。平均人脸坐标数据采用已经公布的世界各地人种平均人脸。

y2、根据基因数据进行基因组snp分型检测，挑选出与人类面部特征点相关的位点；

y3、根据人类面部特征相关的位点计算理论五官坐标；

五官的特征点结合后面使用的平均人脸，我们一共使用了68个人脸特征点，其中17个是轮廓特征点，51个是五官特征点，这68个点基本囊括了人类面部的全部基础特征可以满足基因人脸画像的基本要求。

y4、将平均人脸坐标计算修正理论五官坐标得到预测草图；

y5、从已知基因信息个体的人脸识别获取真实人脸坐标信息；

y6、将真实人脸坐标信息训练预测草图获取预测模型；

预测模型的使用包括以下步骤：

y01、获取基因数据；

y02、将步骤y01获取的基因数据代入步骤y6中预测模型中运算，并输出预测好的人脸特征点；

其中基因数据获取步骤和训练模型步骤中一样，将snp分型数据输入预测模型中，会得到预测好的特征点坐标，最后根据68特征点的坐标，绘制人脸画像。

y03、将预测好的人脸特征点根据步骤y5中真实人脸坐标信息绘制人脸画像。

识别模型的训练包括以下步骤：

s1、由人脸识别获取特征点坐标、获取基因数据；

s2、由步骤s1中基因数据训练获取的特征点坐标获得识别模型；

识别模型的使用包括以下步骤：

s01、由人脸识别获取特征点坐标；

s02、将步骤s01中获取的特征点坐标代入步骤s2中获得的识别模型中进行模型运算，并输出预测基因数据。

其中，步骤y5中，真实人脸坐标信息为已知基因信息的68个人脸特征点，该68个人脸特征点包括17个轮廓特征点和51个五官特征点。

使用人脸识别技术，识别出已知基因信息的68个人脸特征点，这68特征点的坐标，将作为标准结果来训练上一步骤中预测草图的68点坐标。训练模型选用了机器学习相关算法，随着训练样本的增加，训练出的预测模型将更加准确。

其中，步骤y1中，平均人脸坐标数据以七大洲为区域划分。

由于所研究的人群并不都是亚洲人群，且亚洲人群的面部特征与欧洲、美洲、非洲等人种相差显著，因此使用了我国人群、黄河流域人群、长江流域人群、珠江流域人群的平均长相来修正计算出来的五官坐标。平均人脸是根据已公布的世界各地人种平均人脸，sinid人种画像作为中国平均人脸、changkiangid为长江流域平均人脸、huanghoid为黄河流域平均人种、chukiangid为珠江流域平均人种，结合平均人脸坐标和计算出的五官坐标，得到预测草图。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗奇斌;申玉林;廖胜光;任毅
技术所有人：北京奇云诺德信息科技有限公司
我是此专利的发明人

上一篇：一种聚丙烯酸钠在改性淀粉或淀粉基食品中的新用途的制作方法
上一篇：一种电力检修的多角度云梯的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。