Meta 目前發(fā)布了 Voicebox AI 模型,相對(duì)于只能使用文字或圖片回復(fù)的競(jìng)品模型,Voicebox AI 模型的優(yōu)勢(shì)主要如其名,能夠生成用于回復(fù)的音頻消息。據(jù)悉,Voicebox AI 模型只需要一段 2 秒鐘的音頻樣本,即可準(zhǔn)確辨別出音頻細(xì)節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語(yǔ)音輸出。Meta 表示,他們意識(shí)到這種人工智能技術(shù)在虛假偽造方面,可能會(huì)帶來(lái)潛在危害,因此 Meta 目前正在努力找到一種有效的方式來(lái)區(qū)分真實(shí)語(yǔ)音和由 Voicebox 生成的音頻,在找到解決方案前,暫時(shí)不會(huì)向公眾公開(kāi)提供。