1.一种面向妇科疾病智能化诊断的数据预处理技术,其特征在于包括以下步骤:
步骤一,对采集到的数据进行缺失值处理;
步骤二,对经过缺失值处理的数据进行异常值处理;
步骤三,对经过异常值处理过的数据进行数据变换,使得数据都要归一化,避免误差。
2.根据权利要求1所述的一种面向妇科疾病智能化诊断的数据预处理技术,其特征在于所述缺失值处理为指标值缺失的情况下指标值的设置依以下8个规则:
规则1.1,“妊娠”与“产后”两项指标都缺失的情况下,“妊娠”指标的缺失值设置为“13~27周”,“产后”指标的缺失值设置为“否”;
规则1.2,“生殖道既往感染史”的缺失值设置为“患有阴道炎、宫颈炎、盆腔炎”;
规则1.3,“患者主诉”的缺失值设置为“异味,外阴瘙痒,白带量多”;
规则1.4,“外阴检查”的缺失值设置为“红肿”;
规则1.5,“阴道壁检查”的缺失值设置为“粘膜出血”;
规则1.6,“宫颈壁检查”的缺失值设置为“重度糜烂”;
规则1.7,“白带检查”的缺失值设置为“异味、异常黄色”;
规则1.8,血液检测各项指标的缺失值设置为参考值上限的1.2倍。
3.根据权利要求1所述的一种面向妇科疾病智能化诊断的数据预处理技术,其特征在于所述异常值处理包含以下两个规则:
规则2.1,当“妊娠”与“产后”两项指标互斥时,保留“妊娠”指标的值,将“产后”指标的值设置为“否”;
规则2.2,对于血液检测各项指标,如果指标值大于参考值上限的2倍,则将该指标的值设置为参考值上限的2倍。
4.根据权利要求1所述的一种面向妇科疾病智能化诊断的数据预处理技术,其特征在于所述数据变换包含以下两个规则:
规则3.1,对于“妊娠”、“产后”、“生殖道既往感染史”、“患者主诉”、“外阴检查”、“阴道壁检查”、“宫颈壁检查”和“白带检查”中的各项指标,设置布尔型变量用以表示各个指标的取值;如果指标成立,则该指标对应的布尔型变量的值为1,否则为0;
规则3.2,对于血液检测中的各项指标,将其指标值与下限的差除以参考值的上限与下限的差得到的商作为变换后的值。