IT之家 2 月 14 日消息,蘋果公司今天發(fā)布論文,展示名為 Keyframer 的全新 AI 大語言模型(LLMs),可以根據(jù)用戶輸入的提示詞加工靜態(tài)圖片,將其轉換為動畫。
該論文標題為《Keyframer:使用大型語言模型增強動畫設計能力》,IT之家附上專利摘要部分如下:
對于 Dall-E 和 Midjourney 等商業(yè) AI 服務來說,一句話文生圖是比較常見的 AI 應用。但實際場景下,需要考慮時間、協(xié)調(diào)等更復雜的因素,而這些因素很難在一次性提示中完全明確。
因此,可能需要采用其他方法,使用戶能夠迭代地構建和完善生成的設計,尤其是對于動畫而言。
我們結合設計藝術品的語言提示和大語言模型的代碼生成功能,打造出了 Keyframer 的新型人工智能動畫工具。
用戶通過 Keyframer,可以通過自然語言提示從靜態(tài)二維圖像中創(chuàng)建動畫插圖。使用 GPT-4,Keyframer 生成 CSS 動畫代碼,為輸入的可縮放矢量圖形(SVG)制作動畫。
蘋果公司展示了一個實際案例,用戶上傳太空火箭為主題的 SVG 格式圖片,然后輸入“要求生成天空有 3 個漸變色,且配有星星閃爍的動畫”提示詞。
Keyframer 會生成動畫的 CSS 代碼,然后用戶可以直接編輯代碼或輸入其他文本提示來完善動畫。
作者解釋說:
Keyframer 讓用戶能夠通過連續(xù)地提示迭代完善他們的設計,而不必預先考慮他們的整個設計。
通過這項工作,我們希望能夠啟發(fā)未來的動畫設計工具,將 LLMs 強大的生成能力與動態(tài)編輯器相結合,加快設計原型的制作,使創(chuàng)作者能夠保持創(chuàng)意控制。
論文稱,這項研究參考了對專業(yè)動畫設計師和工程師的訪談。論文引用了一位研究參與者的話:
出圖速度遠遠超出預期,幾句話就能搞定此前幾個小時的活。
IT之家附上論文參考地址
廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。