微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型，讓 Copilot+ PC 實現(xiàn)本地化 AI 推理

2025/1/30 12:50:04 來源：IT之家作者：問舟責編：問舟

評論：

感謝IT之家網(wǎng)友莓變、軟媒新友1933769、ThinkBou 的線索投遞！

IT之家 1 月 30 日消息，人工智能正加速向著邊緣計算領(lǐng)域發(fā)展，Copilot+ PC 在其中扮演著重要角色。隨著 DeepSeek R1 出現(xiàn)，微軟也意識到了這一模型可能會帶來了一系列變革。

微軟今日發(fā)文，宣布推出針對 NPU 優(yōu)化的 DeepSeek-R1（IT之家注：已在 Azure AI Foundry 和 GitHub 上提供），首批將面向搭載高通驍龍 X 芯片的 Copilot+ PC 推出，隨后是英特爾酷睿 Ultra 200V 等平臺。

微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型，讓 Copilot+ PC 實現(xiàn)本地化 AI 推理

微軟表示，首個版本 DeepSeek-R1-Distill-Qwen-1.5B 將在 AI Toolkit 中提供，7B 和 14B 版本也將很快推出，從而幫助開發(fā)者充分利用 Copilot+ PC 中強大的 NPU 配置。

微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型，讓 Copilot+ PC 實現(xiàn)本地化 AI 推理

微軟表示，Copilot+ PC 上的 NPU 開啟了一種新的范式。在這種范式下，生成式 AI 不僅可以在被調(diào)用時執(zhí)行，還可以支持半連續(xù)運行的服務(wù)。這使開發(fā)者能夠利用 AI 推理引擎來構(gòu)建主動和持續(xù)的體驗。微軟表示：

通過我們在 Phi Silica 上的工作，我們實現(xiàn)了高效的推理 —— 在首次生成 token 的時間和吞吐率方面表現(xiàn)出色，同時對電池續(xù)航和 PC 資源消耗的影響降至最低。針對 NPU 優(yōu)化的 DeepSeek 模型借鑒了該項目的多項關(guān)鍵經(jīng)驗和技術(shù)，包括如何分離模型的各個部分以實現(xiàn)性能與效率的最佳平衡、低比特率量化以及將 Transformer 映射到 NPU。此外，我們還利用 Windows Copilot Runtime（WCR）通過 ONNX QDQ 格式在多樣化的 Windows 生態(tài)系統(tǒng)中實現(xiàn)擴展。

微軟表示，要想在 Copilot+ PC 上體驗 DeepSeek 只需下載 AI Toolkit VS Code 擴展即可；以 ONNX QDQ 格式優(yōu)化的 DeepSeek 模型將很快出現(xiàn)在 AI Toolkit 的模型目錄中（直接從 Azure AI Foundry 中拉?。?。

微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型，讓 Copilot+ PC 實現(xiàn)本地化 AI 推理

用戶可以通過點擊“下載”按鈕將其下載到本地。下載完成后，只需打開 Playground 加載“deepseek_r1_1_5”模型，并給出提示詞即可開始實驗。

除了為 Copilot+ PC 優(yōu)化的 ONNX 模型外，您還可以通過點擊“DeepSeek R1”下的“Try in Playground”按鈕，在 Azure Foundry 中嘗試云托管的源模型。

如下圖所示，微軟還展示了原始模型和量化模型的示例，以展現(xiàn)兩者之間微小但確實存在的差異：

微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型，讓 Copilot+ PC 實現(xiàn)本地化 AI 推理

▲ 相同提示下原始模型（左）與 NPU 優(yōu)化模型（右）的響應(yīng)示例，包括模型的推理能力

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

微軟宣布為 Win11 用戶優(yōu)化 DeepSeek-R1 模型，讓 Copilot+ PC 實現(xiàn)本地化 AI 推理

相關(guān)文章