Federated Learning Models Based on DAG Blockchain: History
Please note this is an old version of this entry, which may differ significantly from the current revision.
Contributor: , , , , ,

随着电力物联网的发展,传统的集中式计算模式已经难以应用于电力负荷预测、变电站缺陷检测、需求侧响应等众多电力业务场景。如何在确保用户数据隐私不受侵犯的同时,高效可靠地执行机器学习任务,备受业界关注。基于区块链的联邦学习(FL)作为一种用于构建隐私增强物联网系统的新型去中心化和分布式学习框架,正受到越来越多的学者关注。

  • federated learning
  • DAG
  • communication overhead

1. 引言

随着物联网技术与电网的深度融合,电力物联网的智能化发展逐渐引起人们的关注。发电侧、用户侧、配电网之间的协调调度是电力系统发展的关键。场景包括智能巡检、电力负荷预测、需求侧响应等。这些任务需要具有可信数据共享能力和大数据挖掘能力的电力系统。然而,新型电力系统的发展面临着一些问题和挑战。首先,传统的中心化计算框架容易受到第三方攻击,数据传输过程存在数据泄露和篡改的风险[1]。其次,随着人工智能技术的发展,模型参数数量显著增加,物联网设备资源有限,使得适应大模型开发具有挑战性。第三,人们对隐私的意识和关注度正在提高。各国政府已经实施了数据隐私立法,例如欧盟委员会的《通用数据保护条例》(GDPR)[2]和美国《消费者隐私权利法案》[3]。
近年来,联邦学习(FL)被提议作为构建数据隐私增强电力系统的分布式学习框架。[4]的作者认为,联邦学习可以解决数据所有者的隐私问题。Lu等[5]提出了一种基于区块链的去中心化、安全的联邦学习模型。该模型将联邦学习集成到区块链的共识过程中,无需中心化信任即可提高系统的安全性。然而,传统的共识机制导致了极端的资源消耗。
为了避免区块链带来的额外资源消耗,Li等[6]提出了DAG共识,这是一种基于有向无环图(DAG)结构设计的共识机制。使用这种共识机制的区块链系统称为DAG区块链。与区块链中广泛使用的工作量证明(PoW)和权益证明(PoS)相比,基于DAG共识设计的共识机制可以克服资源消耗高、交易费用高、交易吞吐量低、确认延迟长等缺点。基于DAG的共识机制的一个重要方面是尖端选择算法[7,8]。该算法确定在发出下一笔交易时应批准的提示选择。这是已发布的新事务连接的父节点。在基于DAG共识的方案中,传统的小费选择算法在选择时总是选择权重最高的,其传统的交易权重是通过统计批准的交易数量来计算的。Cao等[9]首先将DAG区块链与FL(DAG-FL)相结合。DAG-FL采用异步联邦学习技术,通过验证TIPS和局部模型的精度来对节点进行批判,并选取局部模型精度相当的局部模型来构建全局模型。
然而,当前基于DAG区块链的联邦学习框架存在两个主要问题:一是系统通信开销随着联邦学习模型参与者数量的增加而增加。其次,模型传输过程容易受到梯度泄漏攻击[10,11,12]。因此,如何实现高效可信、学习准确率均衡的联邦学习框架成为亟待解决的问题。

2. DAG区块链与联邦学习的融合框架

学者们研究并提出了一个融合DAG区块链和联邦学习的框架。最早的一种是DAG-FL,由Mingrui Cao等[9]提出,旨在解决联邦学习框架中的设备异步和异常检测问题,避免区块链带来的额外资源消耗。它提出了一个使用基于直接无环图(DAG)的区块链的联邦学习框架,与现有的典型设备端联邦学习系统相比,该框架在训练效率和建模准确性方面取得了更好的性能。但是,它需要解决通信开销问题。基于此,Beilharz等[7]提出了一种称为有向无环图联邦学习(SDAGFL)的框架。它不仅克服了设备异构性、单点故障和中毒攻击等挑战,还为去中心化和个性化的联邦学习创造了统一的解决方案。但同样,它没有考虑通信开销。
然而,在物联网场景中,计算节点的计算和通信资源有限,能源约束严格。为了优化物联网SDAG-FL系统,薛晓峰等[15]提出了一种基于事件触发通信机制的节能SDAG-FL框架,即ESDAG-FL。ESDAG-FL可以合理地实现模型训练精度和专业化之间的平衡,降低近一半的能耗。受此启发,本文提出了一种新的SDAG-FL高效通信方案,称为CDAG-FL。我们设计了一种基于k-means机制的自适应模型压缩方法和一种改进的电力物联网CDAG-FL系统尖端选择算法。区块链和联邦学习架构的相关研究分析如表1所示。
表 1.将我们提出的方案与现有方法进行比较。

3. 通信开销问题

为了解决联邦学习中如何降低通信开销的问题,陈明哲等[16]使用随机梯度量化来压缩局部梯度。在多接入信道容量约束下,他优化了每个设备的量化水平,以最小化最优差距,从而降低了联邦学习的通信开销。Wei Yang等[13]分析了模型压缩中固定压缩率对训练过程中迭代次数和训练误差的影响,证明了合适的压缩率可以更好地执行压缩算法,并提出了一种自适应梯度压缩算法, 它根据每个客户端的实际特性为每个客户端提供唯一的压缩率,以提高通信性能。但是,它没有考虑客户培训过程的影响。Peng Luo等[14]提出了一种新的ProbComp-LPAC算法。ProbComp-LPAC 算法使用概率方程选择梯度,并在深度神经网络的不同层中使用不同的压缩率。在同一层中,参数越多,压缩率越低,精度越高。ProbComp-LPAC不仅训练速度更快,而且精度高。但是,每层的压缩率需要手动调整,其效果有限。

This entry is adapted from the peer-reviewed paper 10.3390/electronics12173712

This entry is offline, you can click here to edit this entry!
Video Production Service