設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

月之暗面 Kimi 聯(lián)合清華大學等開源大模型推理架構(gòu) Mooncake

2024/11/28 13:06:19 來源:IT之家 作者:汪淼 責編:汪淼
感謝IT之家網(wǎng)友 Skyraver 的線索投遞!

IT之家 11 月 28 日消息,月之暗面 Kimi 和清華大學 MADSys 實驗室 2024 年 6 月聯(lián)合發(fā)布了 Kimi 底層的 Mooncake 推理系統(tǒng)設(shè)計方案。該系統(tǒng)基于以 KVCache 為中心的 PD 分離和以存換算架構(gòu),提升了推理吞吐量。

圖片

近日,為了進一步加速該技術(shù)框架的應用與推廣,月之暗面 Kimi 和清華大學 MADSys 實驗室聯(lián)合 9#AISoft、阿里云、華為存儲、面壁智能、趨境科技等共同發(fā)布開源項目 Mooncake,共建以 KVCache 為中心的大模型推理架構(gòu)。

11 月 28 日,Mooncake 技術(shù)框架已開源上線,IT之家附地址如下:

https://github.com/kvcache-ai/Mooncake

據(jù)介紹,Mooncake 開源項目從論文延伸,以超大規(guī)模 KVCache 緩存池為中心,通過以存換算的創(chuàng)新理念大幅度減少算力開銷,提升了推理吞吐量。

本次開源將采用分階段的方式,逐步開源高性能 KVCache 多級緩存 Mooncake Store 的實現(xiàn),同時針對各類推理引擎和底層存儲 / 傳輸資源進行兼容。其中傳輸引擎 Transfer Engine 部分現(xiàn)在已經(jīng)在 GitHub 全球開源。

Mooncake 開源項目的最終目標是,為大模型時代打造一種新型高性能內(nèi)存語義存儲的標準接口,并提供參考實現(xiàn)方案。

Mooncake 推理系統(tǒng)架構(gòu)圖

Mooncake 推理系統(tǒng)架構(gòu)圖

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Kimi,月之暗面,清華大學,大模型,推理框架,AI開源

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知