設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型,讓 Copilot+ PC 實(shí)現(xiàn)本地化 AI 推理

2025/1/30 12:50:04 來(lái)源:IT之家 作者:問(wèn)舟 責(zé)編:問(wèn)舟
感謝IT之家網(wǎng)友 莓變軟媒新友1933769ThinkBou 的線索投遞!

IT之家 1 月 30 日消息,人工智能正加速向著邊緣計(jì)算領(lǐng)域發(fā)展,Copilot+ PC 在其中扮演著重要角色。隨著 DeepSeek R1 出現(xiàn),微軟也意識(shí)到了這一模型可能會(huì)帶來(lái)了一系列變革。

微軟今日發(fā)文,宣布推出針對(duì) NPU 優(yōu)化的 DeepSeek-R1(IT之家注:已在 Azure AI Foundry 和 GitHub 上提供),首批將面向搭載高通驍龍 X 芯片的 Copilot+ PC 推出,隨后是英特爾酷睿 Ultra 200V 等平臺(tái)。

微軟表示,首個(gè)版本 DeepSeek-R1-Distill-Qwen-1.5B 將在 AI Toolkit 中提供,7B 和 14B 版本也將很快推出,從而幫助開(kāi)發(fā)者充分利用 Copilot+ PC 中強(qiáng)大的 NPU 配置。

微軟表示,Copilot+ PC 上的 NPU 開(kāi)啟了一種新的范式。在這種范式下,生成式 AI 不僅可以在被調(diào)用時(shí)執(zhí)行,還可以支持半連續(xù)運(yùn)行的服務(wù)。這使開(kāi)發(fā)者能夠利用 AI 推理引擎來(lái)構(gòu)建主動(dòng)和持續(xù)的體驗(yàn)。微軟表示:

通過(guò)我們?cè)?Phi Silica 上的工作,我們實(shí)現(xiàn)了高效的推理 —— 在首次生成 token 的時(shí)間和吞吐率方面表現(xiàn)出色,同時(shí)對(duì)電池續(xù)航和 PC 資源消耗的影響降至最低。針對(duì) NPU 優(yōu)化的 DeepSeek 模型借鑒了該項(xiàng)目的多項(xiàng)關(guān)鍵經(jīng)驗(yàn)和技術(shù),包括如何分離模型的各個(gè)部分以實(shí)現(xiàn)性能與效率的最佳平衡、低比特率量化以及將 Transformer 映射到 NPU。此外,我們還利用 Windows Copilot Runtime(WCR)通過(guò) ONNX QDQ 格式在多樣化的 Windows 生態(tài)系統(tǒng)中實(shí)現(xiàn)擴(kuò)展。

微軟表示,要想在 Copilot+ PC 上體驗(yàn) DeepSeek 只需下載 AI Toolkit VS Code 擴(kuò)展即可;以 ONNX QDQ 格式優(yōu)化的 DeepSeek 模型將很快出現(xiàn)在 AI Toolkit 的模型目錄中(直接從 Azure AI Foundry 中拉?。?。

用戶可以通過(guò)點(diǎn)擊“下載”按鈕將其下載到本地。下載完成后,只需打開(kāi) Playground 加載“deepseek_r1_1_5”模型,并給出提示詞即可開(kāi)始實(shí)驗(yàn)。

除了為 Copilot+ PC 優(yōu)化的 ONNX 模型外,您還可以通過(guò)點(diǎn)擊“DeepSeek R1”下的“Try in Playground”按鈕,在 Azure Foundry 中嘗試云托管的源模型。

如下圖所示,微軟還展示了原始模型和量化模型的示例,以展現(xiàn)兩者之間微小但確實(shí)存在的差異:

▲ 相同提示下原始模型(左)與 NPU 優(yōu)化模型(右)的響應(yīng)示例,包括模型的推理能力

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:微軟,Windows 11,Win11

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知