設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

阿里云宣布開源通義千問 140 億參數(shù)模型 Qwen-14B 及其對(duì)話模型,免費(fèi)可商用

2023/9/25 15:01:02 來源:IT之家 作者:問舟 責(zé)編:問舟

IT之家 9 月 25 日消息,阿里云今日宣布開源通義千問 140 億參數(shù)模型 Qwen-14B 及其對(duì)話模型 Qwen-14B-Chat,免費(fèi)可商用。

IT之家注:阿里云此前已經(jīng)開源了 70 億參數(shù)模型 Qwen-7B,一個(gè)多月下載量破 100 萬(wàn)。

通過阿里云給出的數(shù)據(jù)來看,Qwen-14B 在多個(gè)權(quán)威評(píng)測(cè)中超越同等規(guī)模模型,部分指標(biāo)甚至接近 Llama2-70B。

據(jù)介紹,Qwen-14B 是一款支持多種語(yǔ)言的高性能開源模型,整體訓(xùn)練數(shù)據(jù)超過 3 萬(wàn)億 Token,具備更強(qiáng)的推理、認(rèn)知、規(guī)劃和記憶能力,最大支持 8k 的上下文窗口長(zhǎng)度。

相對(duì)的,Qwen-14B-Chat 則是在基座模型上經(jīng)過精細(xì) SFT 得到的對(duì)話模型,可帶來更準(zhǔn)確的內(nèi)容,也更符合人類偏好,而且在內(nèi)容創(chuàng)作的想象力和豐富度方面也有擴(kuò)展。

今日起,用戶可從阿里魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺(tái)訪問和調(diào)用 Qwen-14B 和 Qwen-14B-Chat。

阿里云 CTO 周靖人表示,阿里云將持續(xù)擁抱開源開放,推動(dòng)中國(guó)大模型生態(tài)建設(shè)。阿里云篤信開源開放的力量,率先開源自研大模型,希望讓大模型技術(shù)更快觸達(dá)中小企業(yè)和個(gè)人開發(fā)者。

模型零代碼創(chuàng)空間體驗(yàn)地址:

https://modelscope.cn/stud/qwen/Qwen-14B-Chat-Demo

環(huán)境配置與安裝

  • python 3.8 及以上版本

  • pytorch 1.12 及以上版本,推薦 2.0 及以上版本

  • 建議使用 CUDA 11.4 及以上(GPU 用戶需考慮此選項(xiàng))

使用步驟

注:PAI-DSW 的環(huán)境配置下運(yùn)行 (可單卡運(yùn)行, 顯存最低要求 11G)。

  • Qwen-14B-Chat 模型鏈接:

  • https://modelscope.cn/models/qwen/Qwen-14B-Chat
  • Qwen-14B 模型鏈接:

  • https://modelscope.cn/models/qwen/Qwen-14B
  • Qwen-14B-Chat-Int4 模型鏈接:

  • https://www.modelscope.cn/models/qwen/Qwen-14B-Chat-Int4

社區(qū)支持直接下載模型的 repo:

from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download('qwen/Qwen-14B-Chat', 'v1.0.0')

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:阿里巴巴,阿里云,通義千問

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知