在 Meta 公司 CEO 馬克?扎克伯格口中“全世界最快的超級計(jì)算機(jī)之一”的支持下,該公司的最新人工智能模型如今能夠翻譯 200 種不同的語言,包括許多缺少資源、不受目前翻譯系統(tǒng)支持的語種。
該公司將此次項(xiàng)目命名為“不落下一門語言”(No Language Left Behind),力爭每天能在 Meta 公司的 App 之間實(shí)現(xiàn)至少 250 億次翻譯。
雖然如今全球已有超過 7100 種已知語言,但其中許多都缺少足夠的數(shù)據(jù)集,無法對人工智能開展訓(xùn)練。這些所謂的低資源語言包括埃及阿拉伯語、巴厘語、撒丁語、尼日利亞富拉語、班詩蘭語、姆班杜語等等。這些語言的使用者不少,但在互聯(lián)網(wǎng)上為數(shù)不多。
“我們所用的人工智能模型技術(shù)正在幫助這些由全球數(shù)十億人使用的語言實(shí)現(xiàn)高質(zhì)量翻譯?!盡eta 公司 CEO 馬克?扎克伯格在 Facebook 上發(fā)表的一則聲明中表示。
該公司稱,該模型可以“高質(zhì)量地”翻譯 55 種非洲語言。
“要想感受這一項(xiàng)目的規(guī)模有多大,這套包含 200 種語言的模型有超過 5000 萬個參數(shù),我們用全世界最快的超級計(jì)算機(jī)之一 ——Research SuperCluster(RSC)對其展開了訓(xùn)練?!?/p>
“這些進(jìn)展讓我們的 App 每天可以進(jìn)行超過 250 億次翻譯?!?/p>
“跨語言交流正是 AI 的超能力之一,但隨著我們在 AI 方面不斷推進(jìn),我們所做的各項(xiàng)工作都在隨之進(jìn)步,比如在 Facebook 和 Instagram 上推送最有趣的內(nèi)容、推薦相關(guān)度最高的廣告、以及確保所有用戶的服務(wù)安全性等等。”
“這意味著,這項(xiàng)技術(shù)的影響將遍及全球數(shù)十億人,讓他們能夠用自己的語言進(jìn)行交流?!?Meta AI 研究科學(xué)家瑪塔?R?科斯塔尤薩在該項(xiàng)目宣傳視頻中指出。
Meta AI 用戶研究員艾爾?揚(yáng)布拉德也表示:“這將會改變?nèi)藗兩畹姆绞?、做生意的方式、以及受教育的方式?!宦湎乱婚T語言’項(xiàng)目的一切工作都以這項(xiàng)任務(wù)為核心,真正做到以人為本?!?/p>
為開展這一項(xiàng)目,這家科技巨頭首先需要對以低資源語言為母語的人士開展探索性訪談,了解他們的翻譯需求。接著研發(fā)出一套計(jì)算機(jī)模型,并利用針對低資源語言定制的數(shù)據(jù)挖掘技術(shù)收集的數(shù)據(jù)對模型開展了訓(xùn)練。
“最關(guān)鍵的是,我們用人工翻譯的基準(zhǔn)數(shù)據(jù)集 Flores-200 對 4 萬多個翻譯方向的翻譯表現(xiàn)進(jìn)行了評估?!毖芯繄F(tuán)隊(duì)在解釋這套 AI 模型的論文摘要中指出。
研究人員還指出,該項(xiàng)目將涵蓋更多低資源語言,從而減少數(shù)字不平等現(xiàn)象。
“由于‘不落下一門語言’項(xiàng)目以減少全球數(shù)字鴻溝為宗旨,未來將有越來越多的低資源語言被納入項(xiàng)目范圍中?!?/p>
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。