用以检测染色体的非整倍性的方法及其非瞬时机器可读介质的制作方法

文档序号:9547449阅读:378来源:国知局
用以检测染色体的非整倍性的方法及其非瞬时机器可读介质的制作方法
【技术领域】
[0001]本发明涉及生物信息。
【背景技术】
[0002]染色体的非整倍性是指染色体数目并非特定物种的染色体数量特征的整倍数。额外或缺失的染色体是导致遗传性疾病的主要原因,其中遗传性疾病包含人类先天缺陷。羊膜穿刺术(也称作羊水测试(amn1tic fluid test ;AFT))是一种用于产前诊断染色体异常与婴儿感染的医疗程序。检测到的最常见的异常为唐氏症(三染色体21症)、艾德华氏症(三染色体18症)、巴陶氏症(三染色体13症)、透纳氏症(单染色体X症)。然而,羊膜穿刺术有多种风险,包含流产、针伤、羊水溢漏、Rh因子激敏反应、感染以及感染传播。

【发明内容】

[0003]根据本发明的部分实施方式,一种用以检测目标核酸区域的染色体的非整倍性的方法,其包含下列步骤。取得参照数据库。参照数据库通过测序平台测序多个参照生物样本而建立。根据参照数据库确定至少一正规化因子。根据该参照数据库确定截止值。通过测序平台测序受试生物样本,以得到受试生物样本的目标序列的数量。受试生物样本从孕妇上取得,且受试生物样本具有孕妇及其胎儿的核酸分子。受试生物样本的目标序列源自于目标核酸区域。以正规化因子正规化受试生物样本的目标序列的数量。比对受试生物样本的目标序列的已正规化的数量与截止值。根据比对,判定胎儿中关于目标核酸区域的染色体的非整倍性是否呈现。
[0004]根据本发明的部分实施方式,一种非瞬时机器可读介质储存程序,当该程序由至少一处理单元执行时,该程序检测关于目标核酸区域的染色体的非整倍性。该程序包含多个指令组用于下列步骤。取得参照数据库。参照数据库通过测序平台测序多个参照生物样本而建立。根据参照数据库确定至少一正规化因子。根据该参照数据库确定截止值。通过测序平台测序受试生物样本,以得到受试生物样本的目标序列的数量。受试生物样本从孕妇上取得,且受试生物样本具有孕妇及其胎儿的核酸分子。受试生物样本的目标序列源自于目标核酸区域。以正规化因子正规化受试生物样本的目标序列的数量。比对受试生物样本的目标序列的已正规化的数量与截止值。根据比对,判定胎儿中关于目标核酸区域的染色体的非整倍性是否呈现。
【附图说明】
[0005]图1为根据本发明的部分实施方式的用以检测染色体的非整倍性的方法的流程图。
[0006]图2A与图2B展示根据本发明的多个工作实施例以相同测序平台测序的多个参照生物样本的染色体序列的图。
[0007]图3为图1的步骤120的流程图。
[0008]图4为图3的步骤123的流程图。
[0009]图5展示根据本发明一实施例的参照生物样本的第21对染色体的总体频率分布。
[0010]图6展示参照生物样本的第22对染色体总体频率与参照生物样本的第21对染色体的43-45Mb的局部频率之间的相关性。
[0011]图7展示参照生物样本的第22对染色体总体频率与参照生物样本的第21对染色体的43-45Mb的总体频率之间的相关性。
[0012]图8展示参照生物样本的第22对染色体总体频率与参照生物样本的已正规化的第21对染色体的43-45Mb的总体频率之间的相关性。
[0013]图9为图1的步骤130的流程图。
[0014]图10展示根据图5-8的工作实施例的参照标准分数分布。
[0015]图11为图1的步骤150的流程图。
[0016]图12展示根据图5-8与图10的工作实施例的测试与参照标准分数分布。
【具体实施方式】
[0017]于以下详细叙述中,为了说明起见,阐述了许多特定的细节以完整地了解在此揭露的实施方式。然而,明显地,仍有一或多个实施方式可在没有这些特定细节下执行。在其它例子中,仅以示意方式绘示普遍为人所知的结构与装置,以简化附图。
[0018]于此,所使用的术语「生物样本」指从主体(例如人类,如孕妇)取出且包含一个或多个有关核酸分子的任何生物样本。
[0019]术语「核酸」指单股或双股螺旋式的脱氧核糖核酸(Deoxyribonucleic Acid ;DNA)、核糖核酸(Ribonucleic Acid ;RNA)或其相关聚合物。除非特别限定,该术语涵盖含有已知天然核苷酸类似物,其具有相似于参照核酸的结合特性,且以相似于天然产生的核苷酸的方式新陈代谢。除非额外叙述,特定的核酸序列也隐含地涵盖其保守修饰后的变形(例如简并密码子替换)、对偶基因、同源基因、单核苷酸多态型(Single NucleotidePolymorphisms ;SNPs)以及互补序列和已经明确提到的序列。于此,术语「核酸」可与基因、由基因或基因座编码的互补脱氧核醣核酸(cDNA)、信使核糖核酸、小型非编码核醣核酸、小型核醋核酸(Micro RNA ;mRNA)、Piwi_interacting RNA以及小发夹核醋核酸(shorthairpin RNA ;shRNA)交换。
[0020]于此,所使用的术语「根据」表示「至少部分根据」,且指使用一数值或结果来判定另一数值或结果,例如方法中发生的输入与输出的关系。
[0021]于此,所使用的术语「染色体的非整倍性」表示染色体的定量与二倍体基因体的数量的差异。此差异可以是增加或减少。此「染色体的非整倍性」可包含一条染色体的全部或局部。
[0022]于此,所使用的术语「截止值」表示用以评断生物样本的分类的二个或更多个状态(例如异常与正常)的数值。举例而言,如果参数大于此截止值,则为此定量数据的第一分类(例如异常);如果参数小于此截止值,则为此定量数据的不同分类(例如正常)。
[0023]图1为根据本发明的部分实施方式的用以检测染色体的非整倍性的方法100的流程图。如同图1所示,用以检测关于目标核酸区域的染色体的非整倍性的方法100包含下列步骤。于步骤110中,取得参照数据库。通过测序平台测序多个参照生物样本,而建立参照数据库。参照生物样本可以是血浆、尿液、血清或其它合适的样本。参照生物样本可分别从多个孕妇上取得。因此,每一参照生物样本包含孕妇及其胎儿的核酸分子。举例而言,核酸分子可以是染色体片段。举例而言,测序平台可以是新一代测序平台,例如Roche公司的454 平台、Illumina 公司的 HiSeq、NextSeg 以及 MiSeq System、Life Technologies 公司的 1n Torrent PGM 以及 Proton System 或 Oxford Nanopore 公司的 Min1n。
[0024]图2A与图2B展示根据本发明多个工作实施例以相同测序平台测序的多个参照生物样本的染色体序列的图。在图2A与图2B中,X轴为染色体数,Y轴为每个染色体序列的数量与其平均的差值。如同图2A与图2B所示,每个染色体序列的数量有一个起伏变化。此起伏变化可能由样本的特性、系统的特性或环境因素而造成。因此,由于此起伏变化的关系,不能仅以每个染色体序列的数量,而判定胎儿的染色体的非整倍性是否呈现。
[0025]再回到图1。在步骤120中,根据参照数据库,确定至少一正规化因子。如同图2A与图2B所示,染色体序列的数量彼此互相关联。换句话说,某一染色体序列的数量增加会降低另一染色体序列的数量。由于图2A与图2B的参照生物样本大致上以相同方式取得,且以相同的测序平台测序,因此,不同的参照生物样本的起伏变化大致相同。如此一来,可以使用关联染色体而正规化有关染色体,以消除此起伏变化。
[0026]由于女胎儿不具有Y染色体,相较于男胎儿样本,从女胎儿的生物样本会具有不同的染色体序列谱。因此,步骤110中的参照数据库可以是性别区分的。换句话说,如果受试生物样本是来自于男胎儿,则会采用男胎儿参照数据库。如果受试生物样本是来自于女胎儿,则会采用女胎儿参照数据库。
[0027]图3为图1的步骤120的流程图。步骤120包含下列步骤。在步骤121中,确定每一参照生物样品的目标序列的数量。每一参照生物样本的目标序列源自于目标核酸区域。在步骤122中,确定每一参照生物样本的关联序列的数量。参照生物样品的关联序列的数量与参照生物样品的目标序列的数量有关。举例而言,参照生物样品的关联序列的数量与参照生物样品的目标序列的数量呈线性相关。参照生物样品的关联序列的数量与参照生物样品的目标序列的数量可具有大约0.7至大约0.99的关联系数。每一参照生物样品的关联序列源自于关联核酸区域。在步骤123中,根据参照生物样本的目标序列的数量以及参照生物样本的关联序
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1