IT之家 12 月 7 日消息,據中國聯(lián)通官方,近日,中國聯(lián)通研究院與浙江聯(lián)通、聯(lián)通服裝制造軍團協(xié)同攻關,針對 AI 敏感數據的本地存儲異地訓練需求提出了創(chuàng)新的業(yè)務模式,并成功在杭州與金華兩地間實施了業(yè)界首次 30TB 樣本數據的跨 200 公里存算分離拉遠訓練,經過實際測算,訓練效率高達 97% 以上。
IT之家從官方介紹獲悉,通過本次測試充分驗證了存算分離技術的安全性、可行性和高效性,為未來 AI 技術的發(fā)展提供了新的思路和方向。
存算分離技術是指將存儲數據的倉庫和對數據進行計算的加工廠獨立開來,在訓練時直接將數據從遠端存儲設備中拉過來進行計算,而不需要先存儲到本地的磁盤再進行處理,可以有效保證用戶數據的安全性和一致性。
中國聯(lián)通稱,海量樣本數據處理過程中存在兩大挑戰(zhàn):一是數據多存儲于企業(yè)端,部分安全性要求較高的數據不便外遷;二是樣本數據量激增,AI 智算中心在具備強大算力的同時,還需額外配備存儲資源,顯著提升了建設成本。在此背景下,業(yè)內對實現(xiàn)“存算分離拉遠、樣本隨訓隨拉”需求迫切。
本次存算拉遠測試驗證的主要特色包括:
第一,以跨地市 AI 大模型訓練能力創(chuàng)新重構智算訓練模式。傳統(tǒng)的智算集中訓練模式,需要用戶將樣本上傳到智算中心進行落盤訓練,但是部分用戶對隱私樣本落盤存在安全顧慮。浙江聯(lián)通通過 IP 廣域無損方案,實現(xiàn)了杭州存、金華訓的“數據不落盤”拉遠訓練,以算網協(xié)同的能力,為企業(yè)用戶隱私樣本訓練探索出了一條新路。
第二,樣本數據總量達 30TB,傳輸距離超 200 公里,計算拉遠效率大于 97%。通過聯(lián)通服裝制造軍團“衣瞳行業(yè)模型”的 AI 訓練存算分離現(xiàn)網測試。充分驗證了針對 AI 訓練業(yè)務存算拉遠的技術可行性,未來有相關數據敏感業(yè)務需求的用戶可通過運營商算力服務,完成隱私樣本不出園區(qū)的拉遠訓練,實現(xiàn)成本與安全的最佳平衡。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。