Meta 發(fā)布全新 AI 模型 SeamlessM4T,可轉(zhuǎn)錄和翻譯近百種語(yǔ)言

2023/8/22 21:57:02 來(lái)源:IT之家 作者:問(wèn)舟 責(zé)編:問(wèn)舟
感謝IT之家網(wǎng)友 軟媒用戶(hù)1520111 的線(xiàn)索投遞!

IT之家 8 月 22 日消息,F(xiàn)acebook 的母公司 Meta Platforms 今日發(fā)布了一種能夠翻譯和轉(zhuǎn)錄數(shù)十種語(yǔ)言的人工智能模型 ——SeamlessM4T,可以讓說(shuō)不同語(yǔ)言的人更有效地進(jìn)行交流,為開(kāi)發(fā)人類(lèi)通用語(yǔ)言翻譯器提供了助力。

Meta 聲稱(chēng),SeamlessM4T 將與新的翻譯數(shù)據(jù)集 SeamlessAlign 一同開(kāi)源,它代表了人工智能驅(qū)動(dòng)的“語(yǔ)音到語(yǔ)音”和“語(yǔ)音到文本”領(lǐng)域的“重大突破”。

Meta 表示,該模型可以在近 100 種語(yǔ)言之間進(jìn)行文本到語(yǔ)音的翻譯,并支持 35 種語(yǔ)言的完全語(yǔ)音到語(yǔ)音翻譯,而此前要想實(shí)現(xiàn)類(lèi)似的操作只能在單獨(dú)的 AI 模型中分別進(jìn)行翻譯。SeamlessM4T 支持:

1、近 100 種語(yǔ)言的語(yǔ)音識(shí)別。

2、近 100 種輸入和輸出語(yǔ)言的語(yǔ)音到文本翻譯。

3、支持近 100 種輸入語(yǔ)言和 36 種輸出語(yǔ)言的語(yǔ)音到語(yǔ)音翻譯。

4、支持近 100 種語(yǔ)言的文本到文本翻譯。

5、支持近 100 種輸入語(yǔ)言和 35 種輸出語(yǔ)言的文本到語(yǔ)音翻譯。

目前,Meta 將以研究許可證的形式向公眾免費(fèi)提供該模型(僅限非商業(yè)用途),以便研究人員和開(kāi)發(fā)人員在此基礎(chǔ)上開(kāi)展工作。

據(jù)介紹,Meta 還將發(fā)布 SeamlessAlign 元數(shù)據(jù),這是迄今為止最大的開(kāi)放多模式翻譯數(shù)據(jù)集,挖掘的語(yǔ)音和文本對(duì)齊總計(jì)達(dá) 270000 小時(shí)。

馬克?扎克伯格表示,他堅(jiān)信這些工具將促進(jìn)來(lái)自全球各地的用戶(hù)在元宇宙中的互動(dòng),這也是他對(duì)該公司未來(lái)的賭注所在。

他還表示,開(kāi)放 AI 生態(tài)系統(tǒng)對(duì) Meta 有利,因?yàn)樵摴就ㄟ^(guò)有效地將創(chuàng)建面向消費(fèi)者的工具的任務(wù)眾包來(lái)獲得更多收益,而不是通過(guò)訪(fǎng)問(wèn)模型來(lái)收費(fèi)。

據(jù)稱(chēng),Meta 后續(xù)還將把這些翻譯和轉(zhuǎn)錄方面的 AI 進(jìn)展整合到 Facebook、Instagram、WhatsApp、Messenger 和 Threads 中。

關(guān)于 SeamlessM4T 模型,Meta 研究人員在一份研究論文中表示,他們從“爬取的網(wǎng)頁(yè)數(shù)據(jù)的公開(kāi)可用存儲(chǔ)庫(kù)中”收集了 400 萬(wàn)小時(shí)的“原始音頻”,但I(xiàn)T之家沒(méi)有找到具體是哪個(gè)存儲(chǔ)庫(kù)的說(shuō)明,官方只提到文本數(shù)據(jù)來(lái)自去年創(chuàng)建的數(shù)據(jù)集,而該數(shù)據(jù)集來(lái)自于維基百科及相關(guān)網(wǎng)站提取的內(nèi)容。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:meta

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知