Meta 目前發(fā)布了 Voicebox AI 模型,相對于只能使用文字或圖片回復(fù)的競品模型,Voicebox AI 模型的優(yōu)勢主要如其名,能夠生成用于回復(fù)的音頻消息。據(jù)悉,Voicebox AI 模型只需要一段 2 秒鐘的音頻樣本,即可準確辨別出音頻細節(jié)、音色,并基于文字結(jié)果轉(zhuǎn)換為語音輸出。Meta 表示,他們意識到這種人工智能技術(shù)在虛假偽造方面,可能會帶來潛在危害,因此 Meta 目前正在努力找到一種有效的方式來區(qū)分真實語音和由 Voicebox 生成的音頻,在找到解決方案前,暫時不會向公眾公開提供。