联邦学习的分类:横向联邦学习、纵向联邦学习、联邦迁移学习

联邦学习的分类:横向联邦学习、纵向联邦学习、联邦迁移学习
最新回答
你永久不要离开我~

2022-04-27 14:49:48

联邦学习的分类:横向联邦学习、纵向联邦学习、联邦迁移学习

根据参与各方数据源分布的情况不同,联轮塌桐邦学习可以被分为三类:横向联邦学习、纵向联邦学习和联邦迁移学习。

一、横向联邦学习

横向联邦学习,联合不同用户建模。这种方法适用于两个数据集的用户特征重叠部分较大,而用户重叠部分较小的情况。在横向联邦学习中,数据集按照用户维度(横向)进行切分,取出双方用户特征相同而用户不完全相同的那部分数据进行训练。

  • 应用场景:比如业务相同但是分布在不同地区的两家企业,它们的用户群体分别来自各自所在的地区,相互的交集很小,但记录的用户特征是相同的。此时,就可以使用横向联邦学习来构建联合模型。
  • 与分布式机器学习的区别:横向联邦学习与分布式机器学习有部分相似的地方,但也存在显著差异。分布式机器学习中的数据是分布式存储和计算的,而横向联邦学习中的数据拥有方对本地数据具有完全的自治权限,可以自主决定何时加入联邦学习进行建模。此外,联邦学习更强调数据隐私保护,能够更好地应对未来愈加严格的数据隐私和数据安全监管环境。

二、纵向联邦学习

纵向联邦学习,联合不同特征建模。这种方法适用于两个数据集的用户重叠部分较大,而用户特征重叠部分较小的情况。在纵向联邦学习中,数据集按照特征维度(纵向)进行切分,取出双方用户相同而用户特征不完全相同的那部分数据进行训练。

  • 应用场景:比如有两个衫坦不同机构,一家是某地的银行,另一家是同一个地方的电商。它们的用户群体很有可能包含该地的大部分居民,因此用户的交集较大。但是,由于银行记录的是用户的收支行为与信用评级,而电商则保有用户的浏览与购买历史,因此它们的用户特征交集较小。此时,可以使用纵向联邦学习来增强模型能力。
  • 模型应用:目前,逻辑回归、决策树等机器学习模型均是建立在纵向联邦学习系统框架之下的。

三、联邦迁移学习

联邦迁移学习适用于两个数据集的用户与用户特征重叠都较少的情况。在这种情况下,不对数据进行切分,而是利用迁移学习来克服数据或标签不足的情况。

  • 应用场景:比如有两个不同机构,一家是位于中国的银行,另一家是位于美国的电商。由于受到地域限制,这两家机构的用户群体交集很小。同时,由于机构类型的不同,二者的数据特征也只有小部分重合。此时,可以使用联邦迁移学习来解决单边数据规模小和标签样本少的问题,从而提升模型的效果。
  • 迁移学习的作用:迁移学习通过引入其他领域的知识,帮助目标领域在数据不足的情况下进行建模,从而提高了模型的泛化能力。

小结

  • 横向联邦学习:适用于不同机构的数据样本重叠少、特征相似的情况。
  • 纵向联邦学习:适合数据样本有较多重叠但特征不同的情况。
  • 联邦迁移学习:用于当两个数据集在样本和特征上都没有重叠时,通过迁移知识来协作建模。

简单来说,就是“横向看样本,纵向看特征,迁移找关联”。这三种方法共同构成了联邦学习的框架,为不同场景下的数据隐私腊坦保护和模型训练提供了有效的解决方案。