設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Meta 開發(fā)出文本生成圖像模型 CM3Leon,號稱業(yè)界最佳

2023/7/16 17:20:55 來源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋

IT之家 7 月 16 日消息,Meta 公司宣布開發(fā)出一款名為 CM3Leon 的人工智能模型,該模型可以根據(jù)文本生成高質(zhì)量的圖像,也可以為圖像生成文本描述,甚至可以根據(jù)文本指令編輯圖像。

IT之家注:CM3Leon 生成結(jié)果(上)對比 DALL-E 2 生成結(jié)果(下)

Meta 公司稱,這款模型在文本到圖像生成方面達到了業(yè)界最高水平,超過了谷歌、微軟等公司的產(chǎn)品。CM3Leon 是一種基于 Transformer 的模型,Transformer 是一種利用注意力機制來處理輸入數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。相比于其他基于擴散(diffusion)的模型,Transformer 模型更加高效,訓(xùn)練速度更快,計算成本更低。

Meta 公司展示了 CM3Leon 在不同任務(wù)上的優(yōu)異表現(xiàn),包括根據(jù)復(fù)雜的文本提示生成圖像,根據(jù)文本指令編輯圖像,以及生成圖像描述和回答。Meta 公司表示,CM3Leon 是圖像生成和理解領(lǐng)域的一大進步,但也承認(rèn)該模型可能存在數(shù)據(jù)偏見的問題,并呼吁行業(yè)加強透明度和監(jiān)管。

Meta 公司使用了數(shù)百萬張來自 Shutterstock 的授權(quán)圖片來訓(xùn)練 CM3Leon,最強大的版本有 70 億個參數(shù),比 OpenAI 的 DALL-E 2 模型多兩倍。

Meta 公司沒有透露是否會公開發(fā)布 CM3Leon 模型。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Meta,AI,CM3Leon

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知