IT之家 2 月 28 日消息,DeepSeek 在開源周第五天發(fā)布了 3FS(Fire-Flyer File System),這是一個(gè)專為充分利用現(xiàn)代 SSD 和 RDMA 網(wǎng)絡(luò)帶寬而設(shè)計(jì)的并行文件系統(tǒng),具備驚人的數(shù)據(jù)訪問(wèn)性能,為深度學(xué)習(xí)等數(shù)據(jù)密集型應(yīng)用提供了強(qiáng)大的支持。
IT之家附上開源地址:https://github.com/deepseek-ai/3FS。
基于 3FS 的數(shù)據(jù)處理框架 Smallpond:https://github.com/deepseek-ai/smallpond。
3FS 性能亮點(diǎn)
集群高吞吐: 在 180 節(jié)點(diǎn)集群中,3FS 實(shí)現(xiàn)了高達(dá) 6.6 TiB/s 的聚合讀取吞吐量。
基準(zhǔn)測(cè)試優(yōu)異: 在 25 節(jié)點(diǎn)集群的 GraySort 基準(zhǔn)測(cè)試中,3FS 達(dá)到了 3.66 TiB / min 的吞吐量。
單節(jié)點(diǎn)高性能: 每個(gè)客戶端節(jié)點(diǎn)的 KVCache 查找峰值吞吐量超過(guò) 40 GiB/s。
架構(gòu)先進(jìn): 3FS 采用去中心化架構(gòu),并具備強(qiáng)一致性語(yǔ)義。
3FS 應(yīng)用場(chǎng)景
3FS (Fire-Flyer File System) 是一款高性能的分布式文件系統(tǒng),旨在解決 AI 訓(xùn)練和推理工作負(fù)載帶來(lái)的挑戰(zhàn),利用現(xiàn)代 SSD 和 RDMA 網(wǎng)絡(luò)提供共享存儲(chǔ)層,簡(jiǎn)化分布式應(yīng)用程序的開發(fā)。
其核心優(yōu)勢(shì)在于高性能、強(qiáng)一致性和易用性,能夠有效支持各種 AI 工作負(fù)載,包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)加載、檢查點(diǎn)設(shè)置和推理緩存。
3FS 在 DeepSeek 的 V3 / R1 版本中得到廣泛應(yīng)用,涵蓋了訓(xùn)練數(shù)據(jù)預(yù)處理、數(shù)據(jù)集加載、檢查點(diǎn)保存 / 重新加載、嵌入向量搜索以及推理過(guò)程中的 KVCache 查找等關(guān)鍵環(huán)節(jié)。
Smallpond
此外,DeepSeek 還開源了基于 3FS 的數(shù)據(jù)處理框架 Smallpond,是一款構(gòu)建于 DuckDB 和 3FS 之上的輕量級(jí)數(shù)據(jù)處理框架。它擁有高性能數(shù)據(jù)處理能力,可擴(kuò)展至 PB 級(jí)數(shù)據(jù)集,并且操作簡(jiǎn)便,無(wú)需長(zhǎng)期運(yùn)行的服務(wù)。
相關(guān)閱讀:
《DeepSeek 開源進(jìn)度 2/5:首個(gè)用于 MoE 模型訓(xùn)練和推理的 EP 通信庫(kù) DeepEP》
《DeepSeek 代碼庫(kù)開源進(jìn)度 1/5:為 Hopper GPU 優(yōu)化的高效 MLA 解碼內(nèi)核 FlashMLA》
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。