一种细胞染色体分析方法

文档序号:585228阅读:494来源:国知局
专利名称:一种细胞染色体分析方法
技术领域
本发明涉及一种细胞染色体的分析方法,特别是涉及通过测序方法分析羊水细胞 染色体的方法。
背景技术
随着测序技术的不断发展,测序技术在细胞学研究,特别是在细胞染色体分析中 得到了越来越广泛的应用(Y.M. Dennis Lo,et al. Quantitative Analysis of Fetal DNA in Maternal Plasma and Serum :Implications for Noninvasive Prenatal Diagnosis. Am. J. Hum. Genet. 62 :768_775,1998)。本发明人采用测序技术直接对羊水细胞,包括未经培 养的羊水细胞进行染色体分析,成功实现了对21、18、13号染色体及其他染色体的分析,进 一步拓宽了测序技术在细胞学研究领域中应用。

发明内容
本发明的一个方面,涉及一种用测序方法分析受试者细胞染色体信息的方法,其 包括以下步骤a.将获自细胞的基因组DNA分子随机打断,得到一定大小的DNA片段并测序;b.将步骤a中测定的DNA序列与人类基因组参考序列进行严格比对,得到所测 DNA序列定位于具体染色体的信息;c.对应于特定染色体N,确定所测DNA序列中定位于该染色体上的唯一位置的序 列的数量总和,进而得出对应于该染色体N的ChrN%,即所测DNA序列中定位于该染色体N 上的唯一位置的序列的数量总和(S1)占所测DNA序列中定位于所有染色体上的唯一位置 的序列的数量总和(S2)的比例:ChrN%= S1/S2 ;d.将该染色体的ChrN%与来自标准细胞中对应染色体的01州%进行比较,确定 所述细胞的该条染色体与标准细胞是否存在差异。本发明中,所述的细胞可以是例如羊水细胞,其中所述的羊水细胞可以为未培养 的羊水细胞或培养过的羊水细胞。在本发明的一个实施方案中,为避免培养羊水细胞,羊水 细胞为未培养的羊水细胞。本发明中,细胞基因组DNA的获取可以采用盐析法、柱层析法、SDS法等常规DNA提 取方法,优选采用柱层析法。所谓柱层析法,是指羊水细胞或组织经过细胞裂解液和蛋白酶 K的作用后露出裸露的DNA分子,其经过能与带负电的DNA分子结合的硅胶膜柱时,体系中 的基因组DNA被可逆吸附,经漂洗液清洗除去蛋白质、脂质等杂质后,用纯化液洗脱获得羊 水细胞DNA(具体原理和方法参见Qiagen公司货号为56304的产品说明书和Tiangen公司 货号为DP316的产品说明书)。本发明中,所述DNA分子的随机打断处理可以采用酶切、雾化、超声、或者 HydroShear法。优选地,采用HydroShear法(当含有DNA的溶液通过较小面积的通道时, 流体加速,产生的力使DNA突然断裂,流速和通道大小决定DNA片段的大小,具体原理和方法请参见Life Sciences ffiki公司的HydroShear说明书),将DNA分子打断为比较集中的 一定大小的片段,通常经过随机打断的主带分布在200 300bp范围。本发明中,所采用的测序方法可以为第二代测序方法Illumina/Solexa或ABI/ SOLiD。在本发明的一个实施方案中,所述的测序方法为Illumina/Solexa,测序得到的结果 为35bp大小的片段。当待测的DNA分子来自多个受试样本时,每个样本可以被加上不同的标签序列 index,以用于在测序过程中进行区分(Micah Hamady, Jeffrey J Walker, J Kirk Harris et al. Error-correcting barcoded primers forpyrosequencing hundreds of samples in multiplex. Nature Methods, 2008, March, Vol.5No.3)。本发明中,所述的人类基因组参考序列是人类基因组序列经过屏蔽掉重复序列 后所得到的参考序列,例如NCBI数据库中最新版本的人类基因组参考序列。在本发明的一 个实施方案中,所述人类基因组序列是NCBI数据库中版本36 (NCBI Build 36)的人类基因 组参考序列。在本发明中,其中所述与人类基因组参考序列进行严格比对,是指采用的比对方 法为不容错的、定位于人类基因组参考序列上的唯一位置的比对。在本发明的一个实施方 案中,采用的是Eland比对软件(Illumina提供的软件包),采用的方法为完全不容错比对。本发明中,当所述的DNA序列是能够定位于人类基因组参考序列的唯一位置上的 DNA序列时,将其定义为唯一序列,以Unique reads表示。在本发明中,为了避免重复序列 的干扰,需要去除那些定位于人类基因组参考序列中的串联重复及转座重复位置的DNA序 列,只统计那些可以定位到基因组唯一位置的DNA序列,即唯一序列。通常,在所有测序的 DNA序列中,大约有四分之一到三分之一的DNA序列可以定位于基因组唯一位置,即唯一序 列。而这个统计所得的唯一序列的数量代表分布在基因组染色体上的DNA序列的情况。因此,唯一序列能够将来自羊水细胞的DNA分子经打断并测序后的各DNA序列定 位于特定染色体。而ChrN%则是将不同染色体上得到的唯一序列进行标准化后得到的数 值,该数值只与特定染色体大小有关,而与测序数据量无关,从而可以用0!州%对46条染 色体各自的情况进行分析。因而,所述ChrN%是本发明中进行染色体分析的基础数值。在本发明中,所述细胞样本中特定染色体数量与标准细胞是否存在差异可以通过 绘制箱式图方法确定,其中将细胞样本中0!州%位于超出四分位数差1. 5倍-3倍或者3倍 以上的四分位数差之间的异常值对应的样本,认定为其染色体数量与标准细胞存在差异。在本发明中,所述细胞的特定染色体与标准细胞是否存在差异还可以用反映受检 细胞样本标准细胞样本ChrN%的偏离程度z score_ChrN来确定的。具体的,所述z score_ChrN =(受检样本特定染色体的ChrN%-特定染色体 ChrN% 平均值(mean_ChrN% ))/ChrN% 标准差(S. D. _ChrN% )。z SCOre_ChrN极大或极小,说明该待检细胞样品中染色体数量偏离正常值非常显 著,当达到一定显著性水平时,可认为其染色体数量与标准细胞存在明显差异。本发明中,所述来自标准细胞样本的特定染色体ChrN%平均值(mean_ChrN% )可 根据来自例如至少10个,例如至少20个,例如至少30个,例如至少50个,例如至少100个 标准细胞样本的该染色体ChrN%确定。在本发明中,标准细胞样本是指细胞中染色体数量为单倍体二倍的人类细胞样条常染色体和两条不同的性染色体,记为(46,XY),而正常女性 细胞中,有44条常染色体和两条一样的性染色体,记为(46,XX)。本发明中,所述来自标准细胞样本的特定染色体标准差(S.D._ChrN% )可根据来 自例如至少10个,例如至少20个,例如至少30个,例如至少50个,例如至少100个标准细 胞样本的该染色体ChrN%平均值确定。在本发明的一个实施方案中,标准细胞样本的个数为20个正常男性和10个正常 女性,按顺序编号为1、2. . . 30,其中1 20为正常男性受试样本,21 30为正常女性受试 样本,则标准细胞样本的ChrN%平均值(mean_ChrN% )计算如下
1 30Mean_ChrN%=;Zc/^r_似)(其中n为1号 22号常染色体,M为1
m=l
30号正常样本))
1 20Mean_ChrX%(男性X ChrX_M (m为1 20号男性正常样本)
m = l
1 20Mean_ChrY%(男性)=—^ ChrY_M (m为1 20号男性正常样本)
m = l
1 30Mean_ChrX%(女性)=—J] ChrX_M (m 为 21 30 号女性正常样本)
10 m=2i
1 30Mean—ChrY%(女性)=—ChrY_M (m 为 21 30 号女性正常样本)
10 m = 21(注由于测序的波动性以及参考序列的y染色体存在大量的缺口,导致即使是 正常的女性样本也会有少数DNA序列比对到Y染色体上,但与男性相比,女性的ChY%比男 性要小很多,如实施例中女性的0. 004左右,而男性的0. 114左右)对根据上述方法获得的每一个标准细胞样本ChrN%平均值(mean_ChrN% )计算 ChrN%标准差(S. D. _ChrN% ),计算公式为
1 30S.D._ChrN%=— Y^ChrN.M -(其中 N 为 1 号 22 号常染
30 m=i
色体)
1 20
—Y, ( Chr\_M - meanSMD2 (M 为 1 20 号男 20 m=i
1 20
—X (ChrX—M - mean_av"02 (M 为 1 20 号男
m = l 1 30
—X ^ Chr\_U - meanChrl)2 (M 为 21 30 号女
10 m = 21
1 30
—Y (ChrX M - mean Qhrl)2 (M 为 21 30 号女 io tix ‘‘
6S.D.—ChrX%(男性)=
性正常样本)S.D._ChrY%(男性)=
性正常样本)S.D._ChrX%(女性)=
性正常样本) S.D._ChrY%(女性)=
性正常样本)
由于男性比女性的染色体中缺少一条染色体X,取而代之的是染色体Y,而X染色 体全长约155M,而染色体Y仅为59M,因此在对性染色体进行检测时必须建立一套不同性别 的ChrX%或ChrY%正态分布曲线,才能根据不同的性别正态分布曲线对性染色体的情况 得出最准确的分析结果。在本发明的一个实施例中,取30例标准细胞样本进行染色体分析,根据模拟的染 色体数量与标准细胞存在差异情况下达到正态分布的显著性要求(例如0. 1% )建立正态 分布曲线图,从而将z score_ChrN的绝对值确定在小于3的情形,定义为染色体数量相对 于标准细胞而言相同。根据上述结果对待检样本进行染色体分析具体如下当z score的绝对值=3时,则该样本99. 9%的可能性被拒绝在一个正态分布的 群体中,即为离群样本,即所检测的细胞其染色体数量相对于标准细胞而言存在差异;若z score的绝对值< 3,则该样本99. 9%的可能性是正常样本,即所检测的细 胞其染色体数量与标准细胞相同;若z score的绝对值> 3,则该样本99. 9%的可能性是异常样本,即所检测的细 胞其染色体数量相对于标准细胞而言存在差异;进一步的,在本发明中,当z score的绝对值> 3时,对于所述细胞中染色体数量 异常的具体情况,可以使用参考值Z(cut0fT值)进行判断,参考值Z计算公式如下Z = (mean_ChrN% X0. 5XX% )/S. D. _ChrN%其中,当N为常染色体时,mean_ChrN%* S. D. _ChrN%分别为所有标准细胞受试 样本的平均值,当N为性染色体时,mean_ChrN%* S. D. _ChrN%分别为各自性别的标准细 胞受试样本的平均值;其中X可以为负整数100 (即-100)至正整数100之间的任意整数,例如_100、-90 、-80、-70、-60、-50、-40、-30、-20、_10、0、10、20、30、40、50、60、70、80、90、100。在本发明的一个实施方案中,当X为100时,表示待测细胞样本比标准细胞的染色 体多一条染色体;在本发明的一个实施方案中,当X为-100时,表示待测细胞样本比标准细 胞的染色体少一条染色体;当X为50时,表示待测细胞样本比标准细胞的染色体多半条染 色体;在本发明的一个实施方案中,当X为-50时,表示待测细胞样本比标准细胞的染色体 少半条染色体;在本发明中,当计算性染色体的参考值Z时,其中mean_ChrN%* S. D. 值为男性和女性样本分开计算的平均值,即对于男性样本可以达到的参考值Z为(mean_ChrN% (男性)X0. 5XX% )/S. D. _ ChrN% (男性);对于女性样本可以达到的参考值Z为(mean_ChrN% (女性)X0. 5XX%)/S. D. _ ChrN% (女性)。当所述的z sc0re_ChrN的绝对值大于等于3且达到参考值Z的绝对值时,所述 细胞的特定染色体数量与标准细胞相比存在的差异,例如X为50时,所述细胞的特定染 色体比标准细胞多半条,X为100时,所述细胞的特定染色体比标准细胞多一条。在本发明的一个实施方案中,针对羊水细胞进行染色体分析的具体方法包括以下 步骤1). DNA提取及测序
7
根据Tiangen Micro Kit操作手册提取羊水细胞DNA后,按照修改过的Illumina/ Solexa标准建库流程进行建库,在随机打断的DNA分子两端加上测序用的接头。在这个过 程中,每个样本被加上不同的标签序列(index),这样多个样本可以在一次测序得到的数据 中可以区分开。2).比对和统计利用第二代测序方法Illumina/Solexa测序(用其它测序方法如ABI/SOLiD能达 到相同或相近的效果)后每个样本得到一定大小片段的DNA序列,将其与人类基因组参考 序列进行严格比对,得到所测序列定位于基因组相应位置的信息。这样严格的比对条件是因为容错比对或能比对到多个位置的DNA序列不能确定 该DNA来源于哪条染色体,不利于后续的数据分析。以每条染色体为单位,计算出定位到每条染色体上的唯一序列的数量总和,由此 得出每条染色体的ChrN%,即所测DNA序列中定位于该染色体N上的唯一位置的序列的数 量总和(S1)占所测DNA序列中定位于所有染色体上的唯一位置的序列的数量总和(S2)的 比例:ChrN%= S1/S2。这是一个将不同样本测序总量不同时的一个均一化的方法,由于羊水细胞包含46 条染色体全部的信息,因此理论上定位到某条染色体上的序列的总数与该染色体长度成正 比。举例来说,1号染色体是人类基因组中最大的染色体(约247M),而21号染色体是 人类基因组中最小的染色体(约47M),因此对于正常的二倍型羊水细胞得到的测序结果在 一定的测序总量下近似是一个定值。尽管在一定的测序条件和实验条件下,ChrN%并不完 全与染色体大小成正比,但基本上是定值。3) 数据分析通过箱式图分析,可能直接判定所述待测细胞样本是否有可能是染色体数量与标 准细胞存在差异的样本,将出现异常值的样本直接作为可疑样本,其余的样本则作为标准 细胞样本。具体过程如下在本发明中,为了方便进行数据分析,对于根据上述方法计算获得的数据ChrN%, 采用绘制箱式图(数理统计中用于区分异常值)的方法,确定可疑样本,具体绘制过程如 下1)计算上四分位数(75% ),中位数(50% ),下四分位数(25% )2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)3)绘制箱式图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中 位数的位置绘制横线。4)大于上四分位数1. 5倍四分位数差的值,或者小于下四分位数1. 5倍四分位数 差的值,划为异常值(outliers)。5)异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱式图的触须。6)极端异常值,即超出四分位数差3倍距离的异常值,用星点表示;较为温和的异 常值,即处于1. 5倍-3倍四分位数差之间的异常值,用空心点表示。箱式图箱子中间的粗线代表中值,上下边界代表上下四分位数。而异常点是指与上下边界相比,偏离上下分位数之差1. 5倍距的点。例如,当检测的样本为标准细胞样 本,其染色体对应的ChrN%为一定值,例如为1时,则当某个检测样本其相应染色体对应的 1.5,则可以直接认定差异非常显著,为可疑样本,即有可能是染色体数量与标准 细胞存在差异的样本。如需要,可以根据标准细胞样本对应的特定染色体别确定ChrN%平均 值(mean_ChrN% )和标准差(S. D. _ChrN% ),计算可疑样本对应的染色体的z score_ChrN, 公式如下Z score_ChrN =(可疑样本特定染色体的 ChrN% _mean_ChrN% )/S. D. _ChrN%。如果z score_ChrN绝对值大于等于3,所述细胞样本对应的特定染色体的数量与 标准细胞相比存在差异。进一步的,在本发明中,对于所述细胞中染色体数量异常的具体情况,可以使用参 考值Z (cutoff值)进行判断,具体计算公式如下Z = (mean_ChrN% X0. 5XX% )/S. D. _ChrN%其中,当N为常染色体时,mean_ChrN%* S. D. _ChrN%分别为所有标准细胞受试 样本的平均值,当N为性染色体时,mean_ChrN%* S. D. _ChrN%分别为各自性别的标准细 胞受试样本的平均值;其中X选定为50或100。相应的,当X为100时,表示待测细胞样本比标准细胞 的染色体多一条染色体;当X为50时,表示待测细胞样本比标准细胞的染色体多半条染色 体;在本发明中,当计算性染色体的参考值Z时,其中mean_ChrN%* S. D. 值为男性和女性样本分开计算的平均值,即对于男性样本可以达到的参考值Z为(mean_ChrN% (男性)X0. 5XX% )/S. D. _ ChrN% (男性);对于女性样本可以达到的参考值Z为(mean_ChrN% (女性)X0. 5XX%)/S. D. _ ChrN% (女性)。当z score_ChrN的绝对值大于等于3且达到参考值Z的绝对值时,所述细胞的特 定染色体数量与标准细胞相比存在的差异。发明的有益效果本发明可以用于细胞,例如羊水细胞的染色体分析。在本发明中,由于待测的羊水 细胞可不进行传代培养,直接提取DNA经测序后分析,大大降低了因羊水细胞培养造成的 例如羊水细胞难贴壁、羊水细胞数量不够或培养失败等困难。利用羊水细胞含有胎儿完整基因组信息的特点,本发明所述方法能对细胞中所有 染色体的非整倍性进行分析,而不是只针对21、18、13、号染色体和性染色体X、Y进行检 测。此外,尽管本发明的判定方法同样依赖于标准细胞样本建立的近似正态分布,但 相对于血浆样本来说,对标准细胞样本的依赖程度大大降低,且当数据量足够时,可直接从 数据异常中判断出异常样本。采用本发明的方法,可以对大量待测细胞样本进行批量分析,能一次对成百上千 个待测细胞样本进行检测,大大节省人力物力。


图1根据53个待测细胞样本的ChrN%绘制的箱式图,其中横坐标为染色体号,纵坐标为01州%值;图1A为1-6号染色体,图1B为7-12号染色体,图1C为13-17号染色体,图1D为 18-22号染色体。
具体实施例方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会 理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体 条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为 可以通过市购获得的常规产品。所使用的测序用的接头和标签序列index来源于Illumina 公司的 Multiplexing Sample Preparation Oligonutide Kit。以下括号内为各个试剂或试剂盒的厂家货号。实施例1对未培养的羊水细胞进行染色体分析1.DNA提取及测序按照Tiangen Micro Kit (DP316)微量基因组操作流程提取羊水细胞DNA,用 Qubit(Invitrogen,the Quant-iT dsDNA HS Assay Kit)定量,所提取的DNA总量为 100 500ng不等。提取的羊水细胞DNA是完整的基因组DNA或有部分降解呈smear状DNA,按照修 改后的Illumina/Solexa标准建库流程进行建库,在随机打断的DNA分子两端加上测序用 的接头,并被加上不同的标签序列index,然后与flowcell表面互补接头杂交,在一定条件 下使核酸分子成簇生长,然后在Illumina Genome Analyzer II上通过36轮测序循环,得到 长度为35-bp的DNA片段序列。具体的,将获自羊水细胞的DNA约100 500ng使用Diagenode Bioruptor 随机 打断至300bp片段,以起始打断DNA量为100 500ng,进行Illumina/Solexa标准建库,具 体流程参照现有技术(参见http://www. illumina. com/提供的Illumina/Solexa标准建 库说明书)。经2100Bioanalyzer (Agilent)确定DNA文库大小及插入片段为300bp,QPCR
精确定量后可上机测序。本实施例中,对于获自羊水细胞的53例DNA样本分批按照Illumina/Solexa官方 公布的Cluster Station和GA II x(SE sequencing)说明书进行上机测序操作。2.比对和统计参照现有技术(参见http //www, i 1 lumina. com/提供的Pipeline方法说明书), 将步骤1中测得的序列信息经过一个Pipeline过程,去掉测序质量低的序列,最终可以获 得针对NCBI版本36的人类基因组参考序列的ELAND比对结果,对所有定位到染色体上的 唯一序列数量进行数据统计。计算53个样本在22条染色体和X/Y染色体上的ChrN%,做箱式图(见图1),其 中计算针对特定样本M中特定染色体N的式如下测试样本M中特定染色体的百分比ChrN% =该样本M中比对到参考序列相应染色
10体上的唯一序列的总数(S1)/该样本M中比对到参考序列所有染色体上的唯一序列的总数 (S2)。3.数据分析根据步骤2中获得的箱式图,首先确定是否存在异常点,即是指与上下边界相比, 偏离上下分位数之差1. 5倍距的点较大偏离的可疑样本,有可能其染色体数量与标准细胞 样本存在差异。具体的,观察箱式图分布,检出可疑样本8例(样本编号为P1-P8)。将剔除可疑 样本后剩余的45例标准细胞样本中随机挑出20个正常男性和10个正常女性的数据作 为标准样本建立正态分布,计算每条染色体的ChrN%均值mean(mean_ChrN% )和标准差 S. D.值(S. D. _ChrN% )(见表 1)。表1、标准细胞中每条染色体的ChrN%,以及均值(mean)和标准差(S. D.)。
进一步的,为考察所得可疑样本中是否存在多半条或多一条染色体的情形,选定X 为50或100,计算出对应的染色体参考值Z (cutoff值)(参见表2)Z = (mean_ChrN% X 0. 5 XX% )/S. D. _ChrN%,其中 N 为常染色体 1 22 号,X 为 50 或 100。表2、判定待测细胞中染色体数量为三体的参考值Z (cutoff值)。 根据计算公式,计算所测可疑样本中每条染色体的z SCOre_ChrN。计算公式如 下z score_ChrN =(受检样本某染色体的 ChrN% -mean_ChrN% ) /S. D. _ChrN%。表3可疑样本中对应于每条染色体的z score_ChrN值 由上述分析可知,53例受检羊水细胞样本中可疑样本共8个,其中对于每个可疑 样本的染色体,共捡出z score_ChrN值绝对值> 3的染色体数量异常合计8个(参见表 3),具体为1)P1 的 Chr21,P2 的 Chr21,P3 的 Chr21 和 P4 的 Chr21 ;2)P5 的 Chrl8,P6 的 Chrl8 和 P7 的 Chrl8 ;
3)P8 的 Chrl3。通过查对表2中根据多一条染色体(X= 100)计算获得的Z值,可以确定其中 P1-P4样本中染色体21的数量和P5-P7中染色体18的数量比标准细胞中的相应染色体数 量多一条,P8中染色体13的数量比标准细胞中的相应染色体数量多半条,与传统染色体核 型分析结果完全一致。实施例2另有6例羊水细胞样本(Q1-Q6)在经过同样的处理方法和测序过程后获得上机数 据,以实施例1中30例标准细胞样本计算出来的mean_ChrN%* S. D. _01州%予以计算z score_ChrN0 6例样本中检出阳性样本3例(参见表4和表5)。表4六例待测样本(Q1-Q6)的ChrN% 表5以实施例1中30例标准细胞样本的mean和S. D.计算得出的6例样本的z score_ChrN 从结果可以看出,Q5的染色体21的数量比标准细胞相应染色体数量多一条,Q3 和Q4的性染色体X的数量比标准细胞相应染色体数量少一条,与临床核型分析结果完全一致。尽管本发明的具体实施方式
已经得到详细的描述,本领域技术人员将会理解。根 据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保 护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
权利要求
一种通过测序分析细胞染色体的方法,其包括以下步骤a.将获自细胞的DNA分子随机打断,得到一定大小的DNA片段并测序;b.将步骤a中测定的DNA序列与人类基因组参考序列进行严格比对,得到所测DNA序列定位于具体染色体的信息;c.对应于特定染色体N,确定所测DNA序列中定位于该染色体上的唯一位置的序列的数量总和,进而得出对应于该染色体N的ChrN%,即所测DNA序列中定位于该染色体N上的唯一位置的序列的数量总和占所测DNA序列中定位于所有染色体上的唯一位置的序列的数量总和的比例ChrN%=定位于特定染色体N上的唯一位置的序列的数量总和/定位于所有染色体上的唯一位置的序列的数量总和;d.将该染色体的ChrN%与来自标准细胞中对应染色体的ChrN%进行比较,确定所述细胞的该条染色体数量与标准细胞是否存在差异。
2.权利要求1所述的方法,其中步骤b中所述严格比对是指不容错的、定位于人类基因 组参考序列上的唯一位置的比对;其中所述的人类基因组序列参考序列是人类基因组中经 过屏蔽掉重复序列后所得到的序列。
3.权利要求1所述的方法,其中步骤d中所述细胞样本中特定染色体数量与标准细胞 是否存在差异是通过绘制箱式图方法确定的,其中将位于超出四分位数差1. 5倍-3倍或者 3倍以上的四分位数差之间的异常值对应的样本,认定为其染色体数量与标准细胞存在差升。
4.权利要求1所述的方法,其中步骤d中所述细胞的特定染色体数量与标准细胞是否 存在差异是用反映受检细胞样本ChrN%与标准细胞样本ChrN%的偏离程度z score_ChrN 来确定的,如果ZSCOre_ChrN绝对值大于等于3,所述细胞样本对应的特定染色体的数量与 标准细胞相比存在差异。
5.权利要求4所述的方法,其中所述z score_ChrN =(受检样本特定染色体的ChrN% -特定染色体ChrN%平均值 (mean_ChrN% ))/ChrN% 平均值标准差(S. D. _ChrN% );其中所述特定染色体0!1^%平均值可根据来自至少10个,例如至少20个标准细胞样 本的该染色体ChrN%确定;其中所述特定染色体0!1^%平均值标准差可根据来自至少10个,例如至少20个标准 细胞样本的该染色体ChrN%平均值确定。
6.权利要求4所述的方法,其中步骤d中所述细胞的特定染色体数量与标准细胞是否 存在差异是用z sc0re_ChrN与参考值Z进行比较加以确定,其中参考值Z根据如下方法确 定Z = (mean_ChrN% ) X0. 5XX% /(S. D. _ChrN% )其中X可以为负整数100 (即-100)至正整数100之间的任意整数,例如_100、-90、-80 、-70、-60、-50、-40、-30、-20、_10、0、10、20、30、40、50、60、70、80、90、100 ;当z score_ChrN的绝对值大于等于3且达到参考值Z的绝对值时,所述细胞的特定染 色体数量与标准细胞相比存在的差异。
7.权利要求1所述的方法,其中所述细胞为人羊水细胞,例如未培养的羊水细胞或培养过的羊水细胞,优选为未培养的羊水细胞。
全文摘要
本发明涉及一种细胞染色体的分析方法,特别是涉及通过测序方法分析羊水细胞染色体数量与标准细胞是否存在差异的方法。
文档编号C12Q1/68GK101928775SQ201010252849
公开日2010年12月29日 申请日期2010年8月13日 优先权日2010年8月13日
发明者张秀清, 李培培, 林静蓉, 玄兆伶, 蒋馥蔓, 陈芳 申请人:深圳华大基因科技有限公司;深圳华大基因研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1