
图片来源:Pixabay
EPFL/INRIA的新研究首次发现,在不将数据授权给全球大型科技公司的前提下,我们的移动设备也可以作为分布式网络中的一员进行机器学习。
每次我们阅读新闻或搜索外出就餐的地方时,大型科技公司都会收集我们大量的行为数据。谷歌和Facebook表示,他们这样做是为了改善服务,使我们的在线体验更加个性化。
他们的AI会筛选出他们认为你会更感兴趣的新闻,推荐类似于你以前看过的视频,或根据以往的喜好,帮助你找到一家餐厅。另一方面,这些数据也用于投放针对于你的广告,并且可以与第三方共享,这便是数字隐私问题如此突出的一个关键原因。

图片来源:Pixabay
现在,EPFL计算机与通信科学学院(IC)和法国国家数字科学与技术研究所(INRIA)的分布式计算实验室和可扩展计算系统实验室的新研究首次表明,机器学习——基于经验自动改进的计算机算法的运行,可以在不影响移动设备正常性能,并且无须共享我们数据的前提下实时进行。
在EPFL/INRIA联合实验室的指引下,这项工作引入了FLeet,这是联合学习中的一个革命,联合学习是一个能将用户数据保存在本地,在移动设备上进行更新计算的全球模型。联合学习吸引人之处在于它的隐私性,但同时因为它的设计要求对移动设备没有能量或性能的影响,所以它不适合应用于需要频繁更新的应用程序,如新闻推荐上。
FLeet 能将标准联合学习的隐私性与在线学习的精确性相结合,这要归功于两个核心组件:一个是I-Prof,一个能预测并控制学习任务对移动设备影响的新型轻量级分析仪;另一个是能够适应延迟更新的新型自适应学习算法 AdaSGD。
作为该论文的作者之一,EPFL教授Rachid Guerraoui解释道,如今我们的智能手机同时拥有数据存储与供电能力,从而能支持运行分布式机器学习。
“利用Fleet,可以在使用手机的同时,将其部分电源用于机器学习任务,而不必担心你的通话或互联网搜索会中断。要实现这一点很重要的原因之一是,我们不希望机器学习只发生在你睡着或手机充电的时候,实时信息是被需求且有需要的。”

图片来源:Pixabay
Anne-Marie Kermarrec教授也是该论文的作者,“我们已经证明,如果我们把所有的手机放在一起,它们所构成的巨大的算力甚至与谷歌相媲美,这让人们可以选择使用集中的、强大的计算机场。这是真正的协作学习,使用户无须共享原始数据,保护用户隐私的同时,将本地模型聚合,为全球模型做出贡献,这是开发此架构背后的巨大动力。”
目前,Fleet模型仅是实验性的原型。Guerraoui和Kermarrec说,下一步是继续开发可用的最终产品,并研究Fleet模型设计中,包括如何使系统安全免受攻击等其他方面。”
Kermarrec总结道:现今的大趋势试图将机器学习活动带回个人用户,毕竟数据源于我们,我们应该要能够决定在我们的设备、我们的数据上会发生什么。像FLeet这样的模型给人们提供了另一个选择,即除了大型科技公司之外的选项。
翻译:彭琛
审校:董子晨曦
引进来源:techxplore

本文来自:中国数字科技馆
本文是中国数字科技馆(www.cdstm.cn)原创内容,转载请注明出处和作者,否则我们将依法追究侵权责任。
[责任编辑:环球科学]