您现在的位置是:亿华云 > 系统运维
五分钟技术趣谈 | 隐私安全计算之联邦学习
亿华云2025-10-09 01:36:22【系统运维】5人已围观
简介Labs 导读人工智能时代兴起,数据资源成为维持相关产业的基础原料,是否能够获取相关海量数据能力成为制约产业发展重要因素。然而,由于数据安全问题、竞争关系等因素,数据在各个行业甚至公司的内部以“数据孤
Labs 导读
人工智能时代兴起,分钟数据资源成为维持相关产业的技术计算基础原料,是趣谈否能够获取相关海量数据能力成为制约产业发展重要因素。然而,隐私由于数据安全问题、安全竞争关系等因素,邦学数据在各个行业甚至公司的分钟内部以“数据孤岛”的形式存在,随着数据隐私安全问题突出,技术计算国家管控越来越严格,趣谈先后发布《网络安全法》等法律法规,隐私在社会层面上,安全用户对个人隐私数据越发重视。邦学以往科技巨头它们通过提供基于云的分钟AI解决方案以及API,获取大量高质量的技术计算业务和个人数据模式,在未来发展中可能受到极大的趣谈限制。为此,研究如何在保护隐私和安全的前提下,解决数据孤岛问题实现数据共享需求越来越突出,隐私计算受到极大重视,联邦学习应运而生。
作者:聂文静,单位:中国移动研究院业务研究所
近年来
「数据隐私」成为网络热词
在大数据时代,
数据的流通和共享
为社会发展创造了巨大价值
但被泄露的个人隐私不在少数,
人们对企业的源码下载信任日益走低
......
那么有没有一种技术,
在安全合规、保障用户隐私的前提下,
让企业“看不见”数据,
也能利用数据创造价值、提供高效服务呢?
鱼和熊掌能否兼得?
隐私计算或许是一个答案
本期Labs和大家聊聊
隐私计算中联邦学习的那些事儿~
Part 01隐私计算技术概念
隐私计算涉及多方技术主要包括机器学习,分布式机器学习,密码学(同态加密,差分隐私等),安全多方计算,以及联邦学习等多种不同的技术。
机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。
分布式机器学习是一个由参数服务器将数据存储在分布式工作节点上,通过中央调度节点分配数据和计算资源的机器学习框架,服务器租用较集中式机器学习框架运算效率提高,更加适合大批数据建模。
多方安全计算是一个满足没有信任第三方情况下,互不信任参与方在保护各自隐私信息前提下协同建模的机器学习框架。这个框架能够同时确保输入的隐私性安全性和计算的正确性。
同态加密是一类具有特殊属性的加密方法,与一般加密算法相比,同态加密除了能实现基本的加密操作之外,还能实现密文间的多种计算功能,即先计算后解密可等价于先解密后计算。
差分隐私是密码学中的一种手段,简单地说,就是通过添加噪音在保留统计学特征的前提下去除个体特征以保护用户隐私。
联邦学习,又名联邦机器学习,联合学习,联盟学习,由谷歌公司于2016 年最先提出,最初是用于解决安卓手机终端用户在本地更新输入法中的频繁词模型的企商汇问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习.主要解决的问题就是,数据拥有方不出本地前提下,构建共有模型。联邦学习可以从技术上解决数据孤岛问题,让每一个参与方隐私数据在不用交换原始数据情况下,仅仅交换加密的模型参数,完成模型的建立的一种框架。联邦学习可使用的机器学习算法包括逻辑回归、神经网络、随机森林等,有望成为下一代人工智能协同算法和协作网络的基础。
隐私计算相关技术之间的关系可参见如下示意图:
Part 02 联邦学习技术特征与分类
- 技术特征
各方数据都保留在本地,不泄露隐私也不违反法规; 在联邦学习的体系下,各个参与者的身份和地位相同; 联邦学习的建模效果和将整个数据集放在一处建模的效果相同,或相差不大; 各个参与者联合数据建立虚拟的共有模型,并且共同获益的体系。- 技术分类
1. 横向联邦各方业务场景相似,用户重合度低,特征重合度高
各方特征重合度较低,用户重合度较高
各方特征重合度较低,用户重合度较低
Part 03联邦学习技术应用场景
根据联邦学习的应用领域及面向服务的受众对象,可将联邦学习的典型应用场景分为:面向个人用户(2C)、面向行业用户(2B)。
面向个人用户主要是基于个人终端隐私数据保护情况下的数据共享和协同的应用场景,比如Google输入法所采用的分布式建模应用。
面向行业用户主要是围绕企业内部以及跨公司跨行业的数据联合建模应用场景。
【本文为专栏作者“移动Labs”原创稿件,转载请联系原作者】
戳这里,看该作者更多好文
很赞哦!(4)
相关文章
- 在数以亿计的网站中,我们应该抓住每一个可能带来宣传的机会,域名可以带有企业的名字,一般可以使用汉语拼音或者英语单词或者是相关缩写的形式,只要用户记住了你企业的名字,就能很容易的打出你的网站域名,同样的,记住了网站域名也能很快的记住你公司的名字。
- 目前四字母com域名可以投资吗?一位大佬的经验分析
- 码农版隐秘的角落:作为开发者最讨厌的5件事
- 小聚手把手教你卖域名
- 众所周知,com域名拥有最大的流通市场和流通历史。最好选择com域名,特别是在购买域名时处理域名。其次可以是cn域名、net域名、org域名等主流域名,现在比较流行的王域名和顶级域名,都是值得注册和投资的。
- 注册中文域名好不好?有什么优势?
- 简述批量抢注域名的流程
- 域名转入和域名入库的区别
- 4、参加域名拍卖会
- 购买精品数字域名的几种方法