IT之家 3 月 9 日消息,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)昨日晚宣布本周上線阿里巴巴開(kāi)源推理模型 QwQ-32B API 接口服務(wù),用戶可獲得免費(fèi) 100 萬(wàn) Tokens。
QwQ-32B 是阿里 Qwen 團(tuán)隊(duì)最新發(fā)布的推理模型,基于 Qwen2.5-32B + 強(qiáng)化學(xué)習(xí)構(gòu)建。據(jù)官方公示的基準(zhǔn)評(píng)測(cè)結(jié)果,在測(cè)試數(shù)學(xué)能力的 AIME24 評(píng)測(cè)集上,以及評(píng)估代碼能力的 LiveCodeBench 中,QwQ-32B 表現(xiàn)與 DeepSeek-R1 相當(dāng),勝于 o1-mini 及相同尺寸的 R1 蒸餾模型。
據(jù)介紹,超算互聯(lián)網(wǎng)第一時(shí)間完成 QwQ-32B 全面適配,包括基于 vLLM、PyTorch 的推理適配,平臺(tái)同步上線 QwQ-32B 模型鏡像、模型文件,用戶無(wú)需下載本地,可一鍵啟動(dòng) Notebook 功能,在平臺(tái)開(kāi)發(fā) QwQ-32B 模型,或引入專有數(shù)據(jù)進(jìn)一步私有化部署。
目前,超算互聯(lián)網(wǎng)除提供 QwQ-32B 模型 API 接口服務(wù)外,近期還上線有 DeepSeek-R1 全家桶、最高 671B 滿血版的 API 部署與 AI Web 應(yīng)用服務(wù)。IT之家附國(guó)家超算互聯(lián)網(wǎng)平臺(tái) QwQ-32B API 調(diào)用服務(wù)步驟如下:
用戶在超算互聯(lián)網(wǎng)商城首頁(yè)中搜索 QwQ-32B,點(diǎn)擊“QwQ-32B 接口服務(wù)”商品,購(gòu)買完成后,點(diǎn)擊“去使用”。
進(jìn)入 API 接口信息頁(yè)面:點(diǎn)擊“去使用”后會(huì)進(jìn)入 API 接口信息頁(yè)面。
按需選擇訪問(wèn)形式,有三種訪問(wèn)形式可選:使用 Postman、Apifox 等 http 工具訪問(wèn);使用 python 代碼訪問(wèn);以及在終端頁(yè)面直接訪問(wèn)。
目前超算互聯(lián)網(wǎng)已連接國(guó)內(nèi) 14 個(gè)省的 20 多家超算和智算中心。目前平臺(tái)上已有各類算力商品超 6500 款,其中 AI 模型服務(wù)近 240 款,既有 DeepSeek、Qwen 等國(guó)內(nèi)開(kāi)源模型,也有 Llama、Stable Diffusion、Gemma 等國(guó)外 AI 開(kāi)源模型。
相關(guān)閱讀:
《國(guó)家超算互聯(lián)網(wǎng)平臺(tái)宣布免費(fèi)開(kāi)放 3 個(gè)月 DeepSeek API 接口》
《支持 API 調(diào)用,國(guó)家超算互聯(lián)網(wǎng)平臺(tái)上線 DeepSeek-R1 滿血版》
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。