1.一种去中心化机器学习(ml)系统,包括:
区块链网络的自修复计算机节点,所述区块链网络包括多个计算节点,所述自修复计算机节点从所述区块链网络内的故障状况恢复,并且被编程为:
生成第一区块链事务,所述第一区块链事务包括所述自修复计算机节点与训练机器学习模型的最新迭代不同步的指示,其中所述第一区块链事务将被添加到分布式分类账,并且通知所述多个计算节点所述自修复计算机节点尚未准备好参与训练所述机器学习模型的后续迭代;
从所述分布式分类账获得全局ml状态;
将所获得的所述全局ml状态与在所述自修复计算机节点处的本地ml状态进行比较,以确定所述本地ml状态是否与全局ml状态一致;
在确定所述本地ml状态与所述全局ml状态不一致时,使用所述区块链网络触发纠正动作,以将所述本地ml状态恢复为与所述全局ml状态一致;
生成第二区块链事务,所述第二区块链事务包括所述自修复计算机节点与训练机器学习模型的所述最新迭代同步的指示,其中所述第二区块链事务将被添加到所述分布式分类账,并且通知所述多个计算节点所述自修复计算机节点已准备好参与训练所述机器学习模型的后续迭代;以及
利用所述区块链网络重新登记,以参与训练所述机器学习模型的所述后续迭代。
2.根据权利要求1所述的系统,还包括:
来自在所述区块链网络上的所述多个节点的参与者节点,其中所述参与者节点被登记以参与训练机器学习模型的所述最新迭代;以及
在训练所述机器学习模型的最新迭代中,从所述参与者节点中选择的主节点。
3.根据权利要求2所述的系统,其中所述主节点被编程为:
接收所述自修复计算机节点与训练所述机器学习模型的最新迭代不同步的指示;以及
基于所述自修复计算机节点不同步的所述指示,排除所述自修复计算机节点参与训练所述机器学习模型的后续迭代,使得与所述自修复计算机节点的所述本地ml状态相关联的训练参数被避免被应用于所述机器学习模型。
4.根据权利要求3所述的系统,其中排除所述自修复计算机节点参与训练所述机器学习模型的后续迭代使得能够将所述机器学习模型训练为容忍在所述区块链网络内的所述故障状况。
5.根据权利要求2所述的系统,其中所述主节点被编程为:
接收所述自修复计算机节点与训练所述机器学习模型的最新迭代同步的所述指示;以及
基于所述自修复计算机节点同步的所述指示,包括所述自修复计算机节点来参与训练所述机器学习模型的所述后续迭代,使得与所述自修复计算机节点的所述本地ml状态相关联的训练参数被应用于所述机器学习模型。
6.根据权利要求5所述的系统,其中包括所述自修复计算机节点来参与训练所述机器学习模型的所述后续迭代将所述自修复计算机节点重新集成到去中心化机器学习中。
7.根据权利要求2所述的系统,其中所述自修复计算机节点还被编程为:
基于所述纠正动作的所述触发,获得由在所述区块链网络上的参与者节点生成的共享训练参数,其中所述共享训练参数基于在所述最新迭代期间被训练的所述参与者节点的本地模型;以及
将所述训练参数应用于更新在所述自修复计算机节点处的所述本地ml状态。
8.根据权利要求2所述的系统,其中所述主节点还被编程为:
从在所述区块链网络上的所述参与者节点获得共享训练参数,其中所述共享训练参数基于在所述最新迭代期间被训练的所述参与者节点的本地模型;
基于所述共享训练参数来生成合并训练参数;
生成包括所述主节点已生成所述合并训练参数的指示的事务;
使得所述事务作为块被写入在所述分布式分类账上。
9.根据权利要求8所述的系统,其中所述自修复计算机节点还被编程为:
基于所述纠正动作的所述触发,从所述主节点获得所述合并训练参数;
将所述合并训练参数应用于更新在所述自修复计算机节点处的所述本地ml状态。
10.根据权利要求1所述的系统,其中在所述区块链网络内的所述故障状况是网络连接中断、供电中断或计算节点崩溃。
11.根据权利要求9所述的系统,其中所述自修复计算机节点还被编程为:
自动执行节点重启来从所述故障状况恢复。
12.一种对包括多个计算节点的区块链网络的计算节点进行自修复的方法,自修复计算机节点从所述区块链网络内的故障状况恢复,所述方法包括:
由自修复计算机节点自动生成第一区块链事务,所述第一区块链事务包括所述自修复计算机节点与训练机器学习模型的最新迭代不同步的指示,其中所述第一区块链事务将被添加到分布式分类账,并且通知所述多个计算节点所述自修复计算机节点尚未准备好参与训练所述机器学习模型的后续迭代;
由所述自修复计算机节点从所述分布式分类账获得全局ml状态;
由所述自修复计算机节点将所获得的所述全局ml状态与在所述自修复计算机节点处的本地ml状态进行比较,以确定所述本地ml状态是否与全局ml状态一致;
在确定所述本地ml状态与所述全局ml状态不一致时,由所述计算节点使用所述区块链网络自动触发纠正动作,以将所述本地ml状态恢复为与所述全局ml状态一致;以及
由所述自修复计算机节点自动生成第二区块链事务,所述第二区块链事务包括所述自修复计算机节点与训练机器学习模型的所述最新迭代同步的指示,其中所述第二区块链事务将被添加到所述分布式分类账,并且通知所述多个计算节点所述自修复计算机节点已准备好参与训练所述机器学习模型的后续迭代;以及
由所述自修复计算机节点利用所述区块链网络重新登记,以参与训练所述机器学习模型的所述后续迭代。
13.根据权利要求12所述的方法,包括:
由主节点接收所述自修复计算机节点与训练所述机器学习模型的所述最新迭代不同步的指示;以及
由所述主节点基于所述自修复计算机节点不同步的所述指示,排除所述自修复计算机节点参与训练所述机器学习模型的所述后续迭代,使得与所述自修复计算机节点的所述本地ml状态相关联的训练参数被避免被应用于所述机器学习模型。
14.根据权利要求13所述的方法,其中排除所述自修复计算机节点参与训练所述机器学习模型的所述后续迭代使得能够将所述机器学习模型训练为容忍在所述区块链网络内的所述故障状况。
15.根据权利要求12所述的方法,包括:
由所述主节点接收所述自修复计算机节点与训练所述机器学习模型的最新迭代同步的所述指示;以及
由所述主节点基于所述自修复计算机节点同步的所述指示,包括所述自修复计算机节点来参与训练所述机器学习模型的所述后续迭代,使得与所述自修复计算机节点的所述本地ml状态相关联的训练参数被应用于所述机器学习模型。
16.根据权利要求5所述的方法,其中包括所述自修复计算机节点来参与训练所述机器学习模型的所述后续迭代将所述自修复计算机节点重新集成到去中心化机器学习中。
17.根据权利要求12所述的方法,包括:
基于所述纠正动作的所述触发,由所述自修复计算机节点获得由在所述区块链网络上的参与者节点生成的共享训练参数,其中所述共享训练参数基于在所述最新迭代期间被训练的所述参与者节点的本地模型;以及
由所述自修复计算机节点将所述训练参数应用于更新在所述自修复计算机节点处的所述本地ml状态。
18.根据权利要求12所述的方法,包括:
基于所述纠正动作的所述触发,在所述自修复计算机节点处获得由所述主节点生成的合并训练参数,其中所述合并训练参数基于合并来自在所述区块链网络上的参与者节点的并且在所述最新迭代期间生成的多个共享参数;以及
由所述自修复计算机节点将所述合并训练参数应用于更新在所述自修复计算机节点处的所述本地ml状态。
19.根据权利要求12所述的方法,包括:
由所述自修复计算机节点自动执行节点重启来从所述故障状况恢复。
20.一种非暂态机器可读存储介质,所述非暂态机器可读存储介质包括指令,所述指令由区块链网络的自修复计算机节点的处理器可执行,所述区块链网络包括多个计算节点,所述自修复计算机节点从在所述区块链网络内的故障状况恢复,所述指令将所述处理器编程为:
生成第一区块链事务,所述第一区块链事务包括所述自修复计算机节点与训练机器学习模型的最新迭代不同步的指示,其中所述第一区块链事务将被添加到分布式分类账,并且通知所述多个计算节点所述自修复计算机节点尚未准备好参与训练所述机器学习模型的后续迭代;
从所述分布式分类账获得全局ml状态;
将所获得的所述全局ml状态与在所述自修复计算机节点处的本地ml状态进行比较,以确定所述本地ml状态是否与所述全局ml状态一致;
在确定所述本地ml状态与所述全局ml状态不一致时,使用所述区块链网络触发纠正动作,以将所述本地ml状态恢复为与所述全局ml状态一致;以及
生成第二区块链事务,所述第二区块链事务包括所述自修复计算机节点与训练机器学习模型的所述最新迭代同步的指示,其中所述第二区块链事务将被添加到所述分布式分类账,并且通知所述多个计算节点所述自修复计算机节点已准备好参与训练所述机器学习模型的后续迭代;以及
利用所述区块链网络重新登记,以参与训练所述机器学习模型的所述后续迭代。