1.一种针对单细胞转录组数据的降噪声算法,其特征在于,包括:
步骤1、计算每一个基因的平均表达水平μ和方差σ2;
步骤2、μ和σ2被配置为有以下关系:σ2=a0μ2+a1μ;
步骤3、通过使用回归模型建立μ和σ2之间的关系,从而估计a0,a1的值。基于估计的a0,a1和每一个基因的平均表达水平μ,噪声的方差水平σ02用a0μ2+a1μ来估计;
步骤4、建立数据读数筛选准则;
步骤5、输出的结果中只包含高可靠的基因表达数值。
2.如权利要求1所述的针对单细胞转录组数据的降噪声算法,其特征在于,所述步骤2中,使用GLM回归模型来计算公式中的系数a0和a1。
3.如权利要求1所述的针对单细胞转录组数据的降噪声算法,其特征在于,所述数据读数筛选准则包括:
(1)对于一个基因,基于μ和σ02计算95%置信区间,如果该区间包括零点,则该基因被认为噪声污染基因;
(2)如果一个基因,其表达水平方差σ2<σ02,则该基因被认为噪声污染基因;
(3)对于一个基因在某一个细胞中的表达量读数x,如果x<σ0,则认为该数值的信号噪声比<1,此时x被设为0。