IT之家 12 月 2 日消息,谷歌今天發(fā)布新聞稿,正式介紹推出了名為 Translatotron 3 的新 AI 模型,無需任何并行語音數(shù)據(jù)下,可以實現(xiàn)語音對語音的同聲傳譯翻譯。
谷歌于 2019 年推出了 Translatotron S2ST 系統(tǒng),于 2021 年 7 月推出第 2 個版本,在 2023 年 5 月 27 日發(fā)布的一篇論文中,宣布正在部署新方法,訓(xùn)練 Translatotron 3。
研究人員稱,Translatotron 2 已經(jīng)提供了卓越的翻譯質(zhì)量、語音魯棒性(Robust)和語音自然度,而 Translatotron 3 實現(xiàn)“第一個完全無監(jiān)督直接語音到語音翻譯的端對端模型”。
傳統(tǒng)上的 S2ST 通過自動語音識別 + 機器翻譯 + 文本到語音合成的級聯(lián)方法來解決,但 Translatotron 3 依賴一種新穎的端對端架構(gòu),直接將源語言語音映射到目標(biāo)語言,而不依賴中間文本表示。
Translatotron 3 模型還可用于創(chuàng)建幫助有語言障礙的人的工具,或者開發(fā)更具吸引力和有效性的個性化語言學(xué)習(xí)工具。
IT之家附上官方新聞稿地址,感興趣的用戶可以點擊深入閱讀。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。