IT之家 1 月 30 日消息,人工智能正加速向著邊緣計(jì)算領(lǐng)域發(fā)展,Copilot+ PC 在其中扮演著重要角色。隨著 DeepSeek R1 出現(xiàn),微軟也意識(shí)到了這一模型可能會(huì)帶來(lái)了一系列變革。
微軟今日發(fā)文,宣布推出針對(duì) NPU 優(yōu)化的 DeepSeek-R1(IT之家注:已在 Azure AI Foundry 和 GitHub 上提供),首批將面向搭載高通驍龍 X 芯片的 Copilot+ PC 推出,隨后是英特爾酷睿 Ultra 200V 等平臺(tái)。
微軟表示,首個(gè)版本 DeepSeek-R1-Distill-Qwen-1.5B 將在 AI Toolkit 中提供,7B 和 14B 版本也將很快推出,從而幫助開(kāi)發(fā)者充分利用 Copilot+ PC 中強(qiáng)大的 NPU 配置。
微軟表示,Copilot+ PC 上的 NPU 開(kāi)啟了一種新的范式。在這種范式下,生成式 AI 不僅可以在被調(diào)用時(shí)執(zhí)行,還可以支持半連續(xù)運(yùn)行的服務(wù)。這使開(kāi)發(fā)者能夠利用 AI 推理引擎來(lái)構(gòu)建主動(dòng)和持續(xù)的體驗(yàn)。微軟表示:
通過(guò)我們?cè)?Phi Silica 上的工作,我們實(shí)現(xiàn)了高效的推理 —— 在首次生成 token 的時(shí)間和吞吐率方面表現(xiàn)出色,同時(shí)對(duì)電池續(xù)航和 PC 資源消耗的影響降至最低。針對(duì) NPU 優(yōu)化的 DeepSeek 模型借鑒了該項(xiàng)目的多項(xiàng)關(guān)鍵經(jīng)驗(yàn)和技術(shù),包括如何分離模型的各個(gè)部分以實(shí)現(xiàn)性能與效率的最佳平衡、低比特率量化以及將 Transformer 映射到 NPU。此外,我們還利用 Windows Copilot Runtime(WCR)通過(guò) ONNX QDQ 格式在多樣化的 Windows 生態(tài)系統(tǒng)中實(shí)現(xiàn)擴(kuò)展。
微軟表示,要想在 Copilot+ PC 上體驗(yàn) DeepSeek 只需下載 AI Toolkit VS Code 擴(kuò)展即可;以 ONNX QDQ 格式優(yōu)化的 DeepSeek 模型將很快出現(xiàn)在 AI Toolkit 的模型目錄中(直接從 Azure AI Foundry 中拉?。?。
用戶可以通過(guò)點(diǎn)擊“下載”按鈕將其下載到本地。下載完成后,只需打開(kāi) Playground 加載“deepseek_r1_1_5”模型,并給出提示詞即可開(kāi)始實(shí)驗(yàn)。
除了為 Copilot+ PC 優(yōu)化的 ONNX 模型外,您還可以通過(guò)點(diǎn)擊“DeepSeek R1”下的“Try in Playground”按鈕,在 Azure Foundry 中嘗試云托管的源模型。
如下圖所示,微軟還展示了原始模型和量化模型的示例,以展現(xiàn)兩者之間微小但確實(shí)存在的差異:
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。