IT之家 4 月 23 日消息,Character.AI 公司今天(4 月 23 日)在 X 平臺發(fā)布推文,宣布推出 AvatarFX 模型,能夠讓靜態(tài)圖片中的人物“開口說話”。
用戶只需上傳一張圖片并挑選一個聲音,平臺即可生成會說話、會移動的形象。這些形象還能展現(xiàn)情感,呈現(xiàn)出令人驚嘆的真實(shí)感和流暢度。
公司表示,這得益于一種名為“SOTA DiT-based diffusion video generation model”的先進(jìn) AI 模型。該模型經(jīng)過精心訓(xùn)練,結(jié)合音頻條件優(yōu)化技術(shù),能高效生成高質(zhì)量視頻。IT之家附上演示視頻如下:
AvatarFX 的技術(shù)亮點(diǎn)在于其“高保真、時間一致性”的視頻生成能力。即便面對多角色、長序列或多輪對話的復(fù)雜場景,它也能保持驚人的速度和穩(wěn)定性。與 OpenAI 的 Sora 和 Google 的 Veo 等競爭對手相比,AvatarFX 并非從零開始或基于文本生成視頻,而是專注于將特定圖片動畫化。
這種獨(dú)特的工作流程為用戶提供了新穎體驗(yàn),但也帶來了潛在風(fēng)險(xiǎn)。用戶可能上傳名人或熟人照片,制作看似真實(shí)的虛假視頻,引發(fā)隱私和倫理爭議。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。