5月5日,達摩院發布并開源新型聯邦學習框架FederatedScope,該框架支持大規模、高效率的聯邦學習異步訓練,能兼容不同設備運行環境,且提供豐富功能模塊,大幅降低了隱私保護計算技術開發與部署難度。
過去幾年,機器學習的迅猛發展是人工智能領域最引人注目的大事件,大數據則是隱藏在這波浪潮后面的重要功臣。過往的經驗告訴我們,如果要讓技術獲得令人滿意的成果,對數據的理解和應用都非常關鍵。
但現實并不總能很好滿足研究人員對數據的質量要求。更多時候,科學家們可以使用的都是數據孤島中的“小數據”——它們或者規模較小、或者缺少部分重要的特征。數據所有權意識上升帶來的數據隱私需求增強后,上述問題的重要性進一步凸顯出來。怎樣在保護隱私的同時推動人工智能發展,已經成為這個時代最重要的技術挑戰之一。
Gartner報告顯示,到2025年之前,約60%的大型企業預計將應用至少一種隱私保護計算技術。達摩院2022十大科技趨勢同樣將隱私保護計算列為重要趨勢,認為該技術將從覆蓋少量數據場景走向全域保護,從而激發數字時代的新生產力。
科學家必須想辦法使用那些不那么完美的數據,聯邦學習理念應運而生??茖W家曾經用一個形象的比喻來描述聯邦學習的思想——養羊就像機器學習,草料就像各類數據,沒有草料的持續供應,就沒有羊群的不斷壯大。以前,科學家選擇在全球收割草料并集中起來提供給羊群;現在,他們選擇趕著羊群進入一塊又一塊草場。
然而,隨著應用隱私保護計算的場景和行業日趨多元,涉及的數據類型日趨豐富,已有聯邦學習框架難以靈活高效地滿足越來越復雜的計算需求,“可用”到“好用”之間的技術挑戰困擾著各方。
為解決上述挑戰,達摩院智能計算實驗室研發了新型聯邦學習框架FederatedScope,該框架使用事件驅動的編程范式來構建聯邦學習,即將聯邦學習看成是參與方之間收發消息的過程,通過定義消息類型以及處理消息的行為來描述聯邦學習過程。通過這一方式,FederatedScope實現了支持在豐富應用場景中進行大規模、高效率的聯邦學習異步訓練。
同時,達摩院團隊對FederatedScope訓練模塊進行抽象,使其不依賴特定的深度學習后端,能兼容PyTorch、Tensorflow等不同設備運行環境,大幅降低了聯邦學習在科研與實際應用中的開發難度和成本。
為進一步適應不同應用場景,FederatedScope還集成了多種功能模塊,包括自動調參、隱私保護、性能監控、端模型個性化等。FederatedScope支持開發者通過配置文件便捷地調用集成模塊,方便快速入門;也允許通過注冊的方式添加新的算法實現并調用,支持定制化及深度開發。
達摩院智能計算實驗室隱私保護計算團隊負責人丁博麟表示,“數據已成為重要的生產要素,而隱私保護計算是保障這一要素發揮作用的關鍵技術。通過開源最新聯邦學習框架,我們希望促進隱私保護計算在研究和生產中的廣泛應用,讓醫藥研發、政務互通、人機交互等數據密集領域更安全、更順暢地發展?!?/p>
-
數據
+關注
關注
8文章
6531瀏覽量
87770 -
人工智能
+關注
關注
1780文章
44560瀏覽量
231301 -
隱私保護
+關注
關注
0文章
296瀏覽量
16343 -
機器學習
+關注
關注
66文章
8173瀏覽量
130888
發布評論請先 登錄
相關推薦
評論