IT之家 5 月 12 日消息,艾倫人工智能研究所(AI2)、AMD 和 Large Unified Modern Infrastructure 合作,計劃在 2024 年大規(guī)模研究型開放語言模型(OLMo)。
IT之家注:包括 PaLM 2、GPT-4 在內(nèi),當(dāng)前生成式 AI 所用模型大部分都隱藏在 API 后面,研究人員無法確切查看內(nèi)部信息。因此越來越多的社區(qū)正嘗試創(chuàng)建開源 AI 模型。
AI2 的 NLP 研究高級主管 Hanna Hajishirzi 表示:“研究和技術(shù)社區(qū)需要通過訪問開放的語言模型,進(jìn)一步推動 AI 發(fā)展。通過 OLMo,我們正在努力通過建立有競爭力的語言模型來縮小公共和私人研究能力和知識之間的差距”。
AI2 不僅僅將 OLMo 視為一個模型,而是一個開放平臺,允許研究社區(qū)使用 AI2 創(chuàng)建的所有組件,并通過開源的方式進(jìn)行改進(jìn)。
Hajishirzi 說,AI2 為 OLMo 制作的演示、訓(xùn)練數(shù)據(jù)集和 API 等所有內(nèi)容將公開提供。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。