IT之家 2 月 23 日消息,據(jù)界面新聞報(bào)道,從知情人士處獲悉,字節(jié)跳動(dòng)發(fā)布了文生圖開(kāi)放模型 SDXL-Lightning。據(jù)悉,該模型能夠在極短的時(shí)間內(nèi)生成高質(zhì)量和高分辨率的圖像,是目前最快的文生圖模型之一。
文生圖是一種利用人工智能技術(shù),根據(jù)文本描述生成圖像的技術(shù)。目前,文生圖領(lǐng)域的主流模型都采用了擴(kuò)散過(guò)程的生成技術(shù),即通過(guò)多次迭代,將噪聲逐漸轉(zhuǎn)化為圖像。這種技術(shù)雖然能夠生成逼真的圖像,但是也存在著計(jì)算資源消耗大、生成速度慢的缺點(diǎn)。生成一張高質(zhì)量圖像,大約需要 5 秒。
字節(jié)跳動(dòng)的 SDXL-Lightning 模型則采用了一種漸進(jìn)式對(duì)抗蒸餾的技術(shù),實(shí)現(xiàn)前所未有的生成速度,該模型能夠在 2 步或 4 步內(nèi)生成極高質(zhì)量和分辨率的圖像,將生成速度加快十倍,是 1024 分辨率下速度最快的文生圖模型,計(jì)算成本則降低為十分之一。
字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)稱(chēng),該模型是基于開(kāi)源的文生圖模型 SDXL 的改進(jìn)版本,與開(kāi)放模型社區(qū)的其他工具和插件兼容,SDXL-Lightning 可以作為增速插件無(wú)縫整合到卡通、動(dòng)漫等多樣風(fēng)格的 SDXL 模型中,并支持當(dāng)前流行的控制插件 ControlNet、生成軟件 ComfyUI,方便開(kāi)發(fā)者、研究人員和創(chuàng)意從業(yè)者結(jié)合使用這些工具,助力整個(gè)行業(yè)的創(chuàng)新和協(xié)作。
IT之家注意到,該模型已經(jīng)在 AI 開(kāi)源社區(qū) Hugging Face 上公開(kāi),躋身模型趨勢(shì)榜,同時(shí)也成為 Hugging Face Spaces 上的熱門(mén)模型。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。