1.一种基于状态转移模型的新一代测序拷贝数变异仿真方法,其特征在于,所述基于状态转移模型的新一代测序拷贝数变异仿真方法采用拷贝数变异仿真算法,在仿真算法的基础上增加状态转移模型和序列生成部分;
所述拷贝数变异包括生殖细胞拷贝数变异和体细胞拷贝数变异;
基于Illumina测序平台的Profile文件的生成,核心步骤是将fq文件的reads说明部分的ASCii码转换成碱基的quality value,相应方法是对应字符的ASCii码减去33;
将变异仿真后的fa文件和生成的profile文件作为输入,设置read length,利用多线程和序列生成算法,生成并输出最终的fq文件。
2.如权利要求1所述的基于状态转移模型的新一代测序拷贝数变异仿真方法,其特征在于,所述生殖细胞拷贝数变异仿真算法和包括:
(a)确定发生生殖细胞拷贝数变异的位置、尺寸、类型;
(b)根据a中确定的生殖细胞拷贝数变异的参数执行生殖细胞拷贝数变异,并打印变异参数的记录文件和变异后的fa文件。
3.如权利要求1所述的基于状态转移模型的新一代测序拷贝数变异仿真方法,其特征在于,所述生殖细胞拷贝数变异状态转移模型为:
Normal:
Paa=Pa Pnn=Pn Pdd=Pd
Pa=Paa*Pnn*Pdd/(2-Paa*Pnn*Pdd)
Pd=(1-Pa)*Pnn
Pn=1-Pa-Pd
Insertion:
Paa=Pa Pnn=Pn Pdd=Pd
Pd=Paa*Pnn*Pdd/(2-Paa*Pnn*Pdd)
Pd=(1-Pd)*Paa
Pa=1-Pn-Pd
Deletion:
Paa=Pa Pnn=Pn Pdd=Pd
Pn=Paa*Pnn*Pdd/(2-Paa*Pnn*Pdd)
Pd=(1-Pn)*Pdd
Pd=1-Pa-Pn。
4.如权利要求1所述的基于状态转移模型的新一代测序拷贝数变异仿真方法,其特征在于,所述体细胞拷贝数变异仿真算法包括:
(a)确定发生体细胞拷贝数变异的位置、尺寸、类型;
(b)根据a中确定的体细胞拷贝数变异的参数,执行体细胞拷贝数变异,并打印变异参数的记录文件和变异后的fa文件。
5.如权利要求1所述的基于状态转移模型的新一代测序拷贝数变异仿真方法,其特征在于,所述体细胞拷贝数变异状态转移模型为:
Normal:
Paa=Pa Pnn=Pn Pdd=Pd
Pa=Paa*Pnn*Pdd/(2-Paa*Pnn*Pdd)
Pd=(1-Pa)*Pnn
Pn=1-Pa-Pd
Insertion:
Paa=Pa Pnn=Pn Pdd=Pd
Pd=Paa*Pnn*Pdd/(2-Paa*Pnn*Pdd)
Pd=(1-Pd)*Paa
Pa=1-Pn-Pd
Deletion:
Paa=Pa Pnn=Pn Pdd=Pd
Pn=Paa*Pnn*Pdd/(2-Paa*Pnn*Pdd)
Pd=(1-Pn)*Pdd
Pd=1-Pa-Pn。
6.一种应用权利要求1~5任意一项所述基于状态转移模型的新一代测序拷贝数变异仿真方法的生殖细胞拷贝数变异和体细胞拷贝数变异模拟器。
7.一种应用权利要求1~5任意一项所述基于状态转移模型的新一代测序拷贝数变异仿真方法的生殖细胞拷贝数变异和体细胞拷贝数变异序列生成器。