一种基于多模型blending的智能锁异常检测方法与流程

文档序号:16900156发布日期:2019-02-19 17:54阅读:140来源:国知局
本发明涉及智能家居
技术领域
,尤其涉及区块链、以太坊及其智能合约使用中的一种基于多模型blending的智能锁异常检测方法。
背景技术
:《2017中国智能锁应用与发展白皮书》对中国智能锁的应用现状以及未来发展进行了全面解读和深度分析,报告还称,2016年中国智能锁零售市场正式爆发,进而带动中国智能锁市场进入快速发展时期,预计到2020年,中国智能门锁销量将突破3200万套,由此可见随着互联网的发展,智能锁的发展已经呈现出势不可挡的趋势。传统门锁以及一些新兴智能门锁如:密码锁、指纹锁、人脸锁等具有较好的安全性,但缺乏较好的灵活性,以房屋租赁市场智能锁应用为例,公寓租房基本业务模式是赚取服务费用和租金差价,规模化是整合个人、二房东、存量地产租赁物业的过程,市场需要更有竞争力的产品。对于房屋租赁所出现的场景下,如某房东为其房屋安装了指纹锁,然后他现将房屋租给了某租户,租户得到了开锁权限,但此时这个房门房东和租户都可以打开,租户的隐私和生命财产安全将受到威胁,在这样的场景下,锁的安全性大打折扣了。智能门锁降低了房租催缴成本以及客户体验上的冲突,结合互联网和标准住宿产品,能进一步实现客户自助看房、入住、退租过程。在加盟、合伙人、托管等新运营方式中,对租赁房屋进行更为细致的系统化管理,互联网智能门锁能够帮助公寓运营商,降低运营成本,提升管理效率,优化客户体验,逐步实现房屋租赁的互联网化。智能锁技术不但使租房者得到实惠和良好的体验,也会大大促进出租屋行业的快速发展。智能锁现在正处于家庭安全的重要位置,其安全性不言而喻,但而智能化的最终目标一定是为了安全性服务考虑,判断一套智能锁是否可靠的关键问题,是实现智能化后的电子信息保密问题、网络安全问题。随着人工智能和大数据等互联网技术不断渗透,依靠大数据科技主动收集、分析、整理智能锁相关数据,使得人们享受智能锁带来的便利的同时,信息被恶意窃取也将带来极大的信息安全隐患,因此减少因信息被恶意窃取带来极大的信息安全隐患,提高智能锁的安全性和可靠性是当前的核心问题。技术实现要素:针对上述
背景技术
所阐述的问题,本发明提供一种基于多模型blending的智能锁异常检测方法,通过对智能锁的基本信息数据、所记录的行为数据进行分析,有效地预测智能锁的是否异常。为了达到上述目的,本发明提供如下技术方案:一种基于多模型blending的智能锁异常检测方法,包括如下步骤:q1、数据预处理操作,根据用户行为、时间、使用场景数据预处理操作,对基础字段下使用场景数据由字符串转为离散型,用户行为、时间转化为字符串类型,使数据格式归一化,标准化;q2、依据交叉验证法对数据划分操作,将历史数据划分为训练集和测试集,目的在于探寻历史数据训练集中数据内在联系;q3、根据用户行为、时间、使用场景数据进行特征工程构建操作,特征采用用户行为、时序特征、使用场景特征和冷启动特征,建立算法模型,在特征工程构建时,防止特征衰减;q4、根据基于视图聚类及嵌入式特征排序进行特征选择操作,将全部特征放入构造集合a中,不断迭代将特征放入空集合b,当集合a训练误差增量和集合b训练误差减量,两者sum最小时停止迭代,然后在集合a、集合b通过xgboost分别输出特征重要性,删除特征重要性为0的特征;q5、建立多个机器学习模型,并进行模型融合操作,即:第一层通过构造特征工程,应用相应算法模型svm、lightgbm、xgboost对训练集进行训练,得到不同的机器学习模型,将输出的概率作为新的特征和原始特征组合在一起构成新的训练集;第二层通过第一层构造新的训练集随机抽取50%数据用svm、lightgbm、xgboost算法预测结果为x1、x2、x3,通过线性回归拟合剩下50%训练集的真实标签y,得到第二层的各个模型对应比例w1、w2、w3,公式为:y=x1*w1+x2*w2+x3*w3通过线性回归拟合训练集的真实标签y,得到第二层的各个模型对应比例w1、w2、w3;对于测试集使用svm、lightgbm、xgboost算法预测结果为xn,将其预测结果分别乘以第二层得到的权重w,得到最终的预测结果p:p=x1*w1+x2*w2+x3*w3测试集使用svm、lightgbm、xgboost算法预测结果为xn,将其预测结果分别乘以第二层得到的权重w,得到最终的预测结果p,从而判断智能锁是否存在异常。上述技术方案中,所述q1中,对基础字段下用户行为、时间、使用场景数据具体处理包括:热卡缺失值填充:对于一个包含空值的对象a,在完整数据中找到一个与包含空值的对象最相似的对象b,然后用这个相似对象b的值来进行填充;对原始数据进行标准归一化处理,将规格不同的数据转化为“单位向量”。上述技术方案中,所述q2中,将数据集划分为6个互斥的子集,即假设数据集为d,则d=d1∪d2∪…∪d6,di∩dj为空(i≠j),每次用5个子集的并集作为训练集,余下的那个子集作为测试集,进行6次训练和测试,最终返回这6个测试结果的均值。上述技术方案中,所述q3中,所述用户行为、时序特征、使用场景特征和冷启动特征为:时间序列特征:从用户使用智能锁的时间窗口统计特征、时序分解特征确定,时间窗口统计特征要统计用户每天使用智能锁总次数、平均值、方差、最大值、最小值;每个历史点的权值可以不一样,最自然的就是越近的点赋予越大的权重;时序分解特征,将用户智能锁使用时间分解为季节、月份、星期、是否节假日,挖掘用户行为在时序分解方向的季节性、周期性、趋势性特征;冷启动特征:提取用户是否为某时间段最早使用智能锁行为、最晚使用智能锁行为相应特征;使用场景特征:将智能锁品牌信息、应用场景信息、安装时间、开锁方式、开锁是否匹配等特征中,连续字段直接作为特征,非连续性特征离散化处理,在离散化特征出现维数大时,使用分箱处理,减少特征维数,又不丢失特征信息;构造好特征工程传入模型算法中,预测的结果组合原来特征形成新的特征集合传入下一个模型中,特征循环传播,防止特征衰减,防止特征衰减可以加强特征和目标变量之间的潜在的关系。本发明的有益效果是:通过对用用户行为、时间、使用场景数据进行预处理和分析提取特征,建立多个机器学习模型并进行blending模型融合,基于多个单模型的blending模型融合,实现简单,减少单个机器学习模型的扰动,多个模型优势相互补充,单模型进行融合整合,从而准确预测智能锁是否存在异常,减少因信息被恶意窃取带来极大的信息安全隐患,提高智能锁的安全性和可靠性。具体实施方式下面对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。作为实施例所示的一种基于多模型blending的智能锁异常检测方法,一种基于多模型blending的智能锁异常检测方法,包括如下步骤:q1、数据预处理操作,根据用户行为、时间、使用场景数据预处理操作,对基础字段下使用场景数据由字符串转为离散型,用户行为、时间转化为字符串类型,使数据格式归一化,标准化;对基础字段下用户行为、时间、使用场景数据具体处理包括:热卡缺失值填充:对于一个包含空值的对象a,在完整数据中找到一个与包含空值的对象最相似的对象b,然后用这个相似对象b的值来进行填充;对原始数据进行标准归一化处理,将规格不同的数据转化为“单位向量”。表1智能锁信息数据表,展示智能锁用户行为、时间、使用场景数据如下:表1智能锁信息数据表表2为表1在中的智能锁信息字段解释表表2智能锁信息字段解释表q2、依据交叉验证法对数据划分操作,将历史数据划分为训练集和测试集,目的在于探寻历史数据训练集中数据内在联系;将数据集划分为6个互斥的子集,即假设数据集为d,则d=d1∪d2∪...∪d6,di∩dj为空(i≠j),每次用5个子集的并集作为训练集,余下的那个子集作为测试集,进行6次训练和测试,最终返回这6个测试结果的均值。q3、根据用户行为、时间、使用场景数据进行特征工程构建操作,特征采用用户行为、时序特征、使用场景特征和冷启动特征,建立算法模型,在特征工程构建时,防止特征衰减;根据用户行为、时间、使用场景数据构建特征,表3为用户行为、时间、使用场景特征表:表3用户行为、时间、使用场景特征表表4是表3的用户行为、时间、使用场景特征字段说明表表3的用户行为、时间、使用场景特征字段说明表所述用户行为、时序特征、使用场景特征和冷启动特征为:时间序列特征:从用户使用智能锁的时间窗口统计特征、时序分解特征确定,时间窗口统计特征要统计用户每天使用智能锁总次数、平均值、方差、最大值、最小值;每个历史点的权值可以不一样,最自然的就是越近的点赋予越大的权重;划分时间窗口统计用户每天使用智能锁总次数、平均值、方差、最大值、最小值;每个历史点的权值可以不一样,最自然的就是越近的点赋予越大的权重。x为时间窗口t内用户行为总次数,a1、a2、a3......at为历史点的权值,x1、x2、x3......xt为历史每天行为次数。x=a1*x1+a2*x2+a3*x3+…...+at*xt时序分解特征,将用户智能锁使用时间分解为季节、月份、星期、是否节假日,挖掘用户行为在时序分解方向的季节性、周期性、趋势性特征;冷启动特征:利用专家知识分析用户行为,在历史数据中,用户某时间段最早一次使用智能锁时间,其发生早于该时间段使用智能锁可能出现异常情况;在历史数据用户某时间段最晚一次使用智能锁时间,其发生晚于该时间段使用智能锁可能出现异常情况。提取用户是否为某时间段最早使用智能锁行为、最晚使用智能锁行为相应特征。使用场景特征:将智能锁品牌信息、应用场景信息、安装时间、开锁方式、开锁是否匹配等特征中,连续字段直接作为特征,非连续性特征离散化处理,在离散化特征出现维数大时,使用分箱处理,减少特征维数,又不丢失特征信息;构造好特征工程传入模型算法中,预测的结果组合原来特征形成新的特征集合传入下一个模型中,特征循环传播,防止特征衰减,防止特征衰减可以加强特征和目标变量之间的潜在的关系。q4、根据基于视图聚类及嵌入式特征排序进行特征选择操作,将全部特征放入构造集合a中,不断迭代将特征放入空集合b,当集合a训练误差增量和集合b训练误差减量,两者sum最小时停止迭代,然后在集合a、集合b通过xgboost分别输出特征重要性,删除特征重要性为0的特征;q5、建立多个机器学习模型,并进行模型融合操作,即:第一层通过构造特征工程,应用相应算法模型svm、lightgbm、xgboost对训练集进行训练,得到不同的机器学习模型,将输出的概率作为新的特征和原始特征组合在一起构成新的训练集;xgboost分别输出特征重要性示意,见如下表5:表5xgboost分别输出特征重要性featureimportancescenes_fea0.0150day_sum_fea0.0090day_mean_fea0is_first0.0085is_last0.0077第二层通过第一层构造新的训练集随机抽取50%数据用svm、lightgbm、xgboost算法预测结果为x1、x2、x3,通过线性回归拟合剩下50%训练集的真实标签y,y真实标签已知,x1x2x3为第二层预测结果,通过线性回归求得w,这个公式就是求w,得到第二层的各个模型对应比例w1、w2、w3,公式为:y=x1*w1+x2*w2+x3*w3,第二层训练集使用svm、lightgbm、xgboost算法预测结果智能锁是否存在异常概率信息见如下表6:表6训练集智能锁预测结果示意lock_idlabelsvmlightgbmxgboost5001545963254452100.200.3020.1285001545963254452200.2450.1190.2675001545963254452300.10.320.415001545963254452410.9050.8110.8525001545963254452500.3210.2210.147测试集使用svm、lightgbm、xgboost算法预测结果智能锁是否存在异常概率信息见如下表7:表7测试集智能锁预测结果示意表lock_idsvmlightgbmxgboost415154595235524530.1140.4020.336415154595235524560.8510.8630.752415154595235524570.5210.6210.559415154595235524580.1130.4210.214415154595235524590.3240.1790.256对于测试集使用svm、lightgbm、xgboost算法预测结果为xn,将其预测结果分别乘以第二层得到的权重w,得到最终的预测结果p:p=x1*w1+x2*w2+x3*w3。预测结果p为智能锁是否存在异常的概率,当概率p>=0.5时,我们判断智能锁存在异常;当概率p<0.5时,我们判断智能锁不存在异常。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1