1.一种数据特征选择和预测方法,该方法包括步骤:
步骤S1、采集用户信息和对应的血压观测数据,形成数据集,并从所述数据集中剔除异常值点;
步骤S2、从所述数据集中的用户信息中提取用户特征;
步骤S3、从所述数据集中的血压观测数据提取血压特征;
步骤S4、将所提取的用户特征和血压特征进行归一化处理,处理结果作为训练样本形成训练集,利用所述训练集中的训练样本输入至支持向量机模型和/或梯度迭代决策树模型之中,训练得到预测模型。
2.根据权利要求1所述的方法,其特征在于,所述用户特征包括用户的年龄、性别和身体质量指数;所述血压特征包括高压、低压、心率和服药情况。
3.根据权利要求2所述的方法,其特征在于,步骤S3中所述血压特征的提取包括:提取不同预测任务下的血压特征;所述不同预测任务包括长周期、短周期、粗粒度和细粒度预测任务。
4.如权利要求2所述的方法,其特征在于,步骤S4中所述利用所述训练集中的训练样本输入至支持向量机和/或梯度迭代决策树模型之中,训练得到预测模型,包括:
从所述训练集中提取同一用户的用户特征、单月的血压特征的平均值、半月的血压特征的平均值和第一预定采集时间内的血压特征的平均值,输入至支持向量机模型中,所述支持向量机模型采用回归模型,所述回归模型的核函数采用线性核;
将所述支持向量机模型的输出与所述训练集中同一用户在第二预定采集时间内的血压特征进行比较,进而更新所述支持向量机模型的参数;所述第二预定采集时间晚于所述第一预定采集时间;
迭代执行上述步骤,直至所述支持向量机模型的参数收敛,得到第一预测模型。
5.如权利要求2所述的方法,其特征在于,步骤S4中所述利用所述训练集中的训练样本输入至支持向量机和/或梯度迭代决策树模型之中,训练得到预测模型,包括:
从所述训练集中提取同一用户的用户特征、单月的血压特征的平均值、半月的血压特征的平均值和第三预定采集时间内的血压特征的平均值,输入至梯度迭代决策树模型中,所述梯度迭代决策树模型的损失函数采用为最小平方差函数;
将所述梯度迭代决策树模型的输出与所述训练集中同一用户在第四预定采集时间内的血压特征进行比较,进而更新所述梯度迭代决策树模型的参数;所述第四预定采集时间晚于所述第三预定采集时间;
迭代执行上述步骤,直至所述梯度迭代决策树的参数收敛,得到第二预测模型。
6.如权利要求2所述的方法,其特征在于,步骤S4中所述利用所述训练集中的训练样本输入至支持向量机和/或梯度迭代决策树模型之中,训练得到预测模型,包括:
从所述训练集中提取同一用户的用户特征、单月的血压特征的平均值、半月的血压特征的平均值和第一预定采集时间内的血压特征的平均值,输入至支持向量机模型和中梯度迭代决策树模型,所述支持向量机模型采用回归模型,所述回归模型的核函数采用线性核;所述梯度迭代决策树模型的损失函数采用为最小平方差函数;
将所述支持向量机模型和所述梯度迭代决策树模型的输出分别与所述训练集中同一用户在第二预定采集时间内的血压特征进行比较,进而分别更新所述支持向量机模型和所述梯度迭代决策树模型的参数;所述第二预定采集时间晚于所述第一预定采集时间;
迭代执行上述步骤,直至所述支持向量机模型和所述梯度迭代决策树模型的参数收敛,得到第一预测模型。
7.如权利要求1所述的方法,其特征在于,步骤S1中从所述数据集中剔除异常值点,包括:
去除用户的年龄不在预定年龄范围内的用户信息和对应的血压数据;
去除用户的身高不在预定身高范围内的用户信息和对应的血压数据;
去除用户的体重不在预定体重范围内的用户信息和对应的血压数据;
去除用户的血压值不在预定血压范围内的用户信息和对应的血压数据;
去除用户的心率不在预定心率范围内的用户信息和对应的血压数据。
8.一种数据特征选择和预测装置,其特征在于,包括:
采集模块,用于采集用户信息和对应的血压观测数据,形成数据集,并从所述数据集中剔除异常值点;
用户特征提取模块,用于从所述数据集中的用户信息中提取用户特征;
血压特征提取模块,用于从所述数据集中的血压观测数据提取血压特征;
训练模块,用于将所提取的用户特征和血压特征进行归一化处理,处理结果作为训练样本形成训练集,利用所述训练集中的训练样本输入至支持向量机模型和/或梯度迭代决策树模型之中,训练得到预测模型。
9.根据权利要求7所述的装置,其特征在于,所述用户特征包括用户的年龄、性别和身体质量指数;所述血压特征包括高压、低压、心率。
10.根据权利要求2所述的方法,其特征在于,血压特征提取模块包括:
血压特征提取子模块,用于提取不同预测任务下的血压特征;所述不同预测任务包括长周期、短周期、粗粒度和细粒度预测任务。