一种基因检测的检测位点信用评级方法与流程

文档序号：15462736发布日期：2018-09-18 18:33阅读：586来源：国知局

本发明涉及基因检测领域，尤其是一种基因检测的检测位点信用评级方法。

背景技术：

基因检测指通过对人体血液、体液或其他组织中的DNA序列进行测定,发现其中的异常序列,可以帮助个体从遗传角度认识自身遗传特质中存在的健康风险因素和个体特征；并且针对自身DNA序列的变异情况,对受试者的生活习惯、行为方式、用药等各种相关的健康因素进行有针对性的个性化健康管理服务,以降低疾病发生的风险,达到提高生活质量,延长寿命的作用。随着基因组医学和转化医学时代的到来,基因检测技术在诊断和预测疾病发生、发展方面显现出巨大的应用价值,针对易感疾病发病风险预测的基因检测服务也同时得到了较快发展,并且已经成为近年来一项新兴健康服务行业。

通过基因检测来预测疾病的风险，其中一个关键的问题是确定与某一性状发生相关的突变位点，突变位点的选取直接关系结果的准确性；目前各家基因检测公司使用的位点差异较大，位点的选取缺乏严格的、统一的筛选标准，导致检测结果差异较大；因此，如何从大量的科学研究中筛选出需要的、可靠的位点成为关键问题。

技术实现要素：

本发明的发明目的在于：针对上述存在的问题，提供一种基因检测的检测位点信用评级方法，通过文献检索初步筛选出与某一性状相关的突变位点，并收集突变位点相应的参数将其量化，然后通过检测位点评级模型对其进行评分过滤，筛选出需要的、可靠的检测位点。

本发明采用的技术方案如下：

本发明一种基因检测的检测位点信用评级方法，包括以下步骤：

步骤一：检索表型与检测位点相关的参考文献，记录参考文献的JCR分区信息及其所在期刊的影响因子信息，并计算期刊分区和影响因子的权重值ifscore；

步骤二：获取参考文献中研究人群的种群信息，并计算种群的权重值 populationscore；

步骤三：记录实验组和对照组的样本数量，查询是否有重复组，并结合期刊分区信息和影响因子信息，计算样本的权重值samplescore；

步骤四：检索有无重复研究信息，计算重复研究的权重值replicatescore；

步骤五：根据期刊分区和影响因子权重值、种群权重值、样本权重值和重复研究权重值构建检测位点评级模型；

步骤六：基于检测位点评级模型来计算检测位点的评分，并根据评分筛选出可靠位点。

作为优选，所述检测位点评级模型为：

siteweight＝0.4*ifscore+0.3*populationscore+0.2*samplescore+ 0.1*replicatescore，

其中，ifscore是期刊分区和影响因子权重值；populationscore是种群权重值；samplescoee是样本权重值；replicatescore是重复研究权重值；siteweight的值在0～1之间，越接近于1表示该检测位点越可靠。

作为优选，所述步骤一中ifscore的具体计算方法：获取参考文献的JCR分区信息和期刊影响因子信息，JCR分区为1、2、3和4四个等级，选取20、15、 10、8、6、4和3作为分界点，分别赋予权重值为1、0.95、0.9、0.85、0.75、 0.65、0.55和0.2；通过对参考文献的JCR分区等级和期刊影响因子进行判定，得到对应的权重值。

期刊分区可以合理揭示学科内期刊影响力，在一定程度上反映了科学研究结论的可利用性，因此将其作为衡量突变位点可靠性的参数之一。

影响因子现已成为国际上通用的期刊评价指标，它不仅是一种测度期刊有用性和显示度的指标，而且也是测度期刊的学术水平，乃至论文质量的重要指标。因此，将其作为衡量突变位点可靠性的参数之一。

作为优选，所述步骤二中populationscore的具体计算方法：将种群分为中国人群、亚洲人群和其它；若种群为中国人群，种群权重值为1；若种群为亚洲人群，种群权重值为0.8；若种群为其它，种群权重值为0.6。

不同的人群可能具有不同的遗传效应，基于目前可利用的数据以及我们的服务对象，优先选择研究对象为中国人群的研究，以增加结论的可适用性。中国人群的权重高于亚洲人群，亚洲人群高于欧美人群。

作为优选，所述步骤三中samplescore的具体计算方法：将1000、800、500、 300和200作为实验组样本数和对照组样本数的判断分界点；将1、2、3和4 作为期刊分区等级的判断分界点；将10、8、5和其他作为影响因子的判断分界点；通过对参考文献的期刊分区等级、影响因子、实验组样本数、对照组样本数和重复组信息的判断，得到相应的样本权重值。

样本量太小是导致假阳性或假阴性结果出现的重要原因之一，扩大样本量以及进行重复研究可在一定程度上降低此类错误，保证表型与突变位点之间的真关联。因此，样本数量以及是否做了重复研究也被作为衡量突变位点可靠性的参数之一。

作为优选，所述步骤四中replicatescore的具体计算方法：若检索到有重复研究信息，重复研究权重值为1；若没有检索到重复研究信息，重复研究权重值为0.8。

综上所述，由于采用了上述技术方案，本发明的有益效果是：与现有技术相比，本发明通过检索表型与检测位点相关的参考文献，并根据参考文献的期刊分区、期刊影响因子、研究人群、样本数(实验组、对照组和重复组)和重复研究，基于检测位点评级模型来计算检测位点的评分，从而实现对突变位点较为科学、合理的评估；并通过突变位点的得分值对其进行过滤，筛选出需要的、可靠的检测位点，确定最终使用的检测位点。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1是本发明一种基因检测的检测位点信用评级方法流程图。

图2是种群权重值populationscore的具体计算方法流程图。

图3是重复研究权重值replicatescore的具体计算方法流程图。

具体实施方式

本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

本说明书(包括任何附加权利要求、摘要)中公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换。即，除非特别叙述，每个特征只是一系列等效或类似特征中的一个例子而已。

如图1，本发明一种基因检测的检测位点信用评级方法，包括以下步骤：步骤一：检索表型与检测位点相关的参考文献，记录参考文献的JCR分区信息和分区的影响因子信息，并计算期刊分区和影响因子的权重值ifscore；

步骤二：获取参考文献中研究人群的种群信息，并计算种群的权重值 populationscore；

步骤三：记录实验组和对照组的样本数量，查询是否有重复组，并结合期刊分区信息和影响因子信息，计算样本的权重值samplescore；

步骤四：检索有无重复研究信息，计算重复研究的权重值replicatescore；

步骤五：根据期刊分区和影响因子权重值、种群权重值、样本权重值和重复研究权重值构建检测位点评级模型；

步骤六：基于检测位点评级模型来计算检测位点的评分，并根据评分筛选出可靠位点。

以上步骤一，在PubMed、Web of Science、Google等数据库或搜索引擎上检索表型与突变位点相关的文献；参考文献应有表型和位点具有关联的直接结论，且应是显著相关的；通过LetPub查询参考文献的最新影响因子。

检测位点评级模型为：

siteweight＝0.4*ifscore+0.3*populationscore+0.2*samplescore+0.1* replicatescore，其中，ifscore是期刊分区和影响因子权重值；populationscore是种群权重值；samplescore是样本权重值；replicatescore是重复研究权重值； siteweight的值在0～1之间，越接近于1表示该检测位点越可靠。

ifscore的具体计算方法：获取参考文献的JCR分区信息和期刊影响因子信息进行判断；若期刊影响因子大于20，权重值为1；若期刊影响因子小于20，大于15，权重值为0.95；

若期刊影响因子小于15，大于10，并且期刊分区属于1级，权重值为0.9；若期刊分区属于2级，权重值为0.85；若期刊分区属于3级，权重值为0.75；若期刊分区不属于1、2和3级，权重值为0.2；

若期刊影响因子小于10，大于8，并且期刊分区属于1级，权重值为0.85；若期刊分区属于2级，权重值为0.75；若期刊分区属于3级，权重值为0.6；若期刊分区不属于1、2和3级，权重值为0.2；

若期刊影响因子小于8，大于6，并且期刊分区属于1级，权重值为0.75；若期刊分区属于2级，权重值为0.65；若期刊分区属于3级，权重值为0.5；若期刊分区不属于1、2和3级，权重值为0.2；

若期刊影响因子小于6，大于4，并且期刊分区属于1级，权重值为0.65；若期刊分区属于2级，权重值为0.55；若期刊分区属于3级，权重值为0.4；若期刊分区不属于1、2和3级，权重值为0.2；

若期刊影响因子小于4，大于3，并且期刊分区属于1级，权重值为0.55；若期刊分区属于2级，权重值为0.45；若期刊分区属于3级，权重值为0.3；若期刊分区不属于1、2和3级，权重值为0.2。

如图2，populationscore的具体计算方法：将种群population_info分为中国人群、亚洲人群和其它，并分别标记为1、2和3；若种群为中国人群，即 population_info＝1，种群权重值populationscore＝1；若种群为亚洲人群， populationscore＝0.8；若种群为其它，populationscore＝0.6。

samplescore的具体计算方法：

当实验组样本数和对照组样本数都大于等于1000，若期刊分区属于1级，权重值为1；若期刊分区属于2级，并且期刊影响因子大于等于8，有重复组，权重值为0.95；若期刊分区属于2级，并且期刊影响因子小于8大于5，有重复组，权重值为0.8；若期刊分区属于2级，并且期刊影响因子小于8大于5，没有重复组，权重值为0.75；若期刊分区属于3级，并且期刊影响因子大于5，有重复组，权重值为0.75；没有重复组，权重值为0.7；若期刊分区不属于1、 2或3级，权重值为0.5；

当实验组样本数和对照组样本数都小于1000，大于等于500，若期刊分区属于1级，并且有重复组，权重值为0.95，若期刊分区属于1级，并且没有重复组，权重值为0.9；若期刊分区属于2级，并且有重复组，权重值为0.85，若期刊分区属于2级，并且没有重复组，权重值为0.8；若期刊分区不属于1 级或2级，并且有重复组，权重值为0.55；若期刊分区不属于1级或2级，并且没有有重复组，权重值为0.5；

当实验组样本数和对照组样本数都小于500，大于等于200，若期刊分区属于1级，并且有重复组，权重值为0.9，若期刊分区属于1级，并且没有重复组，权重值为0.85；若期刊分区属于2级，并且有重复组，权重值为0.8，若期刊分区属于2级，并且没有重复组，权重值为0.75；若期刊分区不属于1 级或2级，并且有重复组，权重值为0.5；若期刊分区不属于1级或2级，并且没有有重复组，权重值为0.45。

如图3，replicatescore的具体计算方法：检索是否有其它文献也有相同的结论，标记为0或1，有相同结论的文献标记为0，没有相同结论的文献标记为1；若检索到有相同结论的文献，即replicate_info＝0，重复研究权重值 replicatescore＝1；若没有检索到重复研究信息，重复研究权重值 replicatescore＝0.8。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：凌之浩;李炎;魏昌赫;甘怀艳;易炜龙
技术所有人：成都生命基线科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。