本技术涉及人工智能领域,可以用于金融领域,具体是一种基于概率的硬盘故障分析方法及装置。
背景技术:
1、硬盘作为数据存储的重要介质,提供了高密度、大容量、高性价比的存储空间。现有技术中,硬盘故障预测是一种基于机器学习模型判断磁盘是否会发生故障的技术,以期可以保证硬盘存储系统的数据安全,从而避免由硬盘故障引发的业务影响。
2、现有技术中,在银行数据中心环境下,硬盘故障预测不准确是一个常见的技术问题。举例而言,当银行生产环境出现存储类型的硬盘故障报警时,为保证生产,无论硬盘是否确实出现了故障,人们也往往会将更换硬盘作为首选方案实施。这种情况下,被更换下来的硬盘可能因此被错误地标注为故障。若以此错误的标注结果进行后续的硬盘故障分析模型的构建,又会进一步地影响未来依据模型进行故障预测分析的结果,产生新的错误报警,从而形成恶性循环。
技术实现思路
1、针对现有技术中的问题,本技术提供一种基于概率的硬盘故障分析方法及装置,能够基于硬盘故障标注的准确率,构建准确度较高的硬盘故障分析模型,从而提高设备运维的自动化水平。
2、为解决上述技术问题,本技术提供以下技术方案:
3、第一方面,本技术提供一种基于概率的硬盘故障分析方法,包括:
4、根据硬盘运行记录数据构建硬盘故障数据图集;其中,各硬盘运行记录数据与所述硬盘故障数据图集中的各点相对应;
5、根据所述硬盘故障数据图集中各点的位置信息构建硬盘故障分析训练集;
6、利用预先训练的硬盘故障分析模型分析新增硬盘故障,得到故障分析结果;其中,所述硬盘故障分析模型是利用所述硬盘故障分析训练集训练得到的。
7、进一步地,所述根据硬盘运行记录数据构建硬盘故障数据图集,包括:
8、检索所述硬盘运行记录数据,得到含有故障记录的硬盘运行记录数据作为硬盘故障记录数据;其中,所述硬盘故障记录数据包括硬盘故障类型;
9、将所述硬盘故障记录数据映射至多维空间坐标系中,得到所述硬盘故障数据图集。
10、进一步地,所述根据所述硬盘故障数据图集中各点的位置信息构建硬盘故障分析训练集,包括:
11、根据所述硬盘故障数据图集中的各点的位置信息确定各点对应的切边数量与切边距离;
12、根据各点对应的切边数量与切边距离判断所述硬盘故障记录数据是否正确;
13、根据判定的硬盘故障记录数据构建所述硬盘故障分析训练集。
14、进一步地,所述根据各点对应的切边数量与切边距离判断所述硬盘故障记录数据是否正确,包括:
15、根据各点对应的切边数量与切边距离确定各点对应的切边权重与切边权重和测量值;
16、根据所述硬盘故障类型与所述切边权重确定各点对应的切边权重和随机值;
17、根据所述切边权重和测量值与所述切边权重和随机值判断所述硬盘故障记录数据是否正确。
18、进一步地,所述根据各点对应的切边数量与切边距离确定各点对应的切边权重和测量值,包括:
19、根据所述切边距离计算所述切边权重;
20、根据所述切边数量与所述切边权重计算所述切边权重和测量值。
21、进一步地,根据所述硬盘故障类型与所述切边权重确定各点对应的切边权重和随机值,包括:
22、根据所述硬盘故障类型计算对应的故障类型占比;
23、根据所述故障类型占比计算所述切边权重和随机值。
24、进一步地,所述根据所述切边权重和测量值与所述切边权重和随机值判断所述硬盘故障记录数据是否正确,包括:
25、若根据所述切边权重和随机值确定所述切边权重和测量值属于第一预设区域,则判定所述硬盘故障记录数据正确;
26、若根据所述切边权重和随机值确定所述切边权重和测量值属于第二预设区域,则判定所述硬盘故障记录数据错误。
27、进一步地,所述根据判定的硬盘故障记录数据构建所述硬盘故障分析训练集,包括:
28、将判定为正确的硬盘故障记录数据直接纳入所述硬盘故障分析训练集;
29、对判定为错误的硬盘故障记录数据的标注结果进行取反操作后,纳入所述硬盘故障分析训练集。
30、进一步地,预先训练硬盘故障分析模型的步骤,包括:
31、将所述硬盘故障分析训练集输入极度梯度提升树进行训练,得到硬盘故障分析初始模型;
32、不断更新所述硬盘故障分析训练集,并利用更新的硬盘故障分析训练集优化所述硬盘故障分析初始模型的参数,得到所述硬盘故障分析模型。
33、第二方面,本技术提供一种基于概率的硬盘故障分析装置,包括:
34、故障图集构建单元,用于根据硬盘运行记录数据构建硬盘故障数据图集;其中,各硬盘运行记录数据与所述硬盘故障数据图集中的各点相对应;
35、训练集合确定单元,用于根据所述硬盘故障数据图集中各点的位置信息构建硬盘故障分析训练集;
36、硬盘故障分析单元,用于利用预先训练的硬盘故障分析模型分析新增硬盘故障,得到故障分析结果;其中,所述硬盘故障分析模型是利用所述硬盘故障分析训练集训练得到的。
37、进一步地,所述故障图集构建单元,包括:
38、记录数据检索模块,用于检索所述硬盘运行记录数据,得到含有故障记录的硬盘运行记录数据作为硬盘故障记录数据;其中,所述硬盘故障记录数据包括硬盘故障类型;
39、多维映射模块,用于将所述硬盘故障记录数据映射至多维空间坐标系中,得到所述硬盘故障数据图集。
40、进一步地,所述训练集合确定单元,包括:
41、切边确定模块,用于根据所述硬盘故障数据图集中的各点的位置信息确定各点对应的切边数量与切边距离;
42、故障数据判断模块,用于根据各点对应的切边数量与切边距离判断所述硬盘故障记录数据是否正确;
43、训练集合构建模块,用于根据判定的硬盘故障记录数据构建所述硬盘故障分析训练集。
44、进一步地,所述故障数据判断模块,包括:
45、测量值计算子模块,用于根据各点对应的切边数量与切边距离确定各点对应的切边权重与切边权重和测量值;
46、随机值计算子模块,用于根据所述硬盘故障类型与所述切边权重确定各点对应的切边权重和随机值;
47、故障数据判断子模块,用于根据所述切边权重和测量值与所述切边权重和随机值判断所述硬盘故障记录数据是否正确。
48、进一步地,所述测量值计算子模块,包括:
49、切边权重确定子模块,用于根据所述切边距离计算所述切边权重;
50、测量值确定子模块,用于根据所述切边数量与所述切边权重计算所述切边权重和测量值。
51、进一步地,所述随机值计算子模块,包括:
52、类型占比计算子模块,用于根据所述硬盘故障类型计算对应的故障类型占比;
53、随机值确定子模块,用于根据所述故障类型占比计算所述切边权重和随机值。
54、进一步地,所述故障数据判断子模块,包括:
55、数据正确判定子模块,用于若根据所述切边权重和随机值确定所述切边权重和测量值属于第一预设区域,则判定所述硬盘故障记录数据正确;
56、数据错误判定子模块,用于若根据所述切边权重和随机值确定所述切边权重和测量值属于第二预设区域,则判定所述硬盘故障记录数据错误。
57、进一步地,所述训练集合构建模块,包括:
58、正确数据纳入模块,用于将判定为正确的硬盘故障记录数据直接纳入所述硬盘故障分析训练集;
59、错误数据反置模块,用于对判定为错误的硬盘故障记录数据的标注结果进行取反操作后,纳入所述硬盘故障分析训练集。
60、进一步地,所述硬盘故障分析单元,包括:
61、初始模型构建模块,用于将所述硬盘故障分析训练集输入极度梯度提升树进行训练,得到硬盘故障分析初始模型;
62、分析模型构建模块,用于不断更新所述硬盘故障分析训练集,并利用更新的硬盘故障分析训练集优化所述硬盘故障分析初始模型的参数,得到所述硬盘故障分析模型。
63、第三方面,本技术提供一种电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述基于概率的硬盘故障分析方法的步骤。
64、第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述基于概率的硬盘故障分析方法的步骤。
65、第五方面,本技术提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述基于概率的硬盘故障分析方法的步骤。
66、针对现有技术中的问题,本技术提供的基于概率的硬盘故障分析方法及装置,能够以优化的方式对银行数据中心的故障硬盘数据集进行标注,进而基于概率统计原理筛选出标注准确率高的数据作为硬盘故障分析模型的训练集进行模型训练,克服了现有技术中,模型训练集数据标注准确性低的问题,优化了模型训练的效果,提高了硬盘故障分析的准确率,提高了设备运维的自动化水平。