設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

字節(jié)跳動(dòng)機(jī)器翻譯技術(shù)論文獲 ACL 2021 年度最高獎(jiǎng)項(xiàng),中國(guó)團(tuán)隊(duì)第二次

2021/8/6 13:50:06 來源:IT之家 作者:信鴿 責(zé)編:信鴿

IT之家 8 月 6 日消息 今日字節(jié)跳動(dòng)官方宣布,8 月 5 日,國(guó)際頂級(jí)學(xué)術(shù)會(huì)議 ACL 2021 正式頒發(fā)了大會(huì)獎(jiǎng)項(xiàng),字節(jié)跳動(dòng) AI Lab 的機(jī)器翻譯技術(shù)論文當(dāng)選今年度“最佳論文”。這是 ACL 成立 59 年以來,中國(guó)科學(xué)家團(tuán)隊(duì)第二次贏得最高獎(jiǎng)項(xiàng)。此前由中科院計(jì)算所主導(dǎo)的研究項(xiàng)目曾被評(píng)為 ACL 2019“最佳長(zhǎng)論文”。

官方表示,ACL 2021 由國(guó)際計(jì)算語言學(xué)協(xié)會(huì)舉辦,是自然語言處理(NLP)與計(jì)算語言學(xué)領(lǐng)域最高級(jí)別的學(xué)術(shù)會(huì)議。本次共有 3350 篇論文參與評(píng)選。除了字節(jié)跳動(dòng),華為、騰訊、谷歌、微軟、亞馬遜等科技公司也投遞了論文。

自然語言處理被看作是“人工智能皇冠上的明珠”,在機(jī)器翻譯、搜索引擎、信息流、輸入法等領(lǐng)域有著廣泛的應(yīng)用。詞表是自然語言處理的基礎(chǔ)組件,與詞典索引類似,詞表預(yù)訓(xùn)練模型往往需要耗費(fèi)大量的時(shí)間和能源。

在這次 ACL 2021 獲獎(jiǎng)?wù)撐闹?,字?jié)跳動(dòng)技術(shù)團(tuán)隊(duì)提出了“面向機(jī)器翻譯的最佳運(yùn)輸詞表學(xué)習(xí)方案”(Vocabulary Learning via Optimal Transport for Machine Translation,簡(jiǎn)稱 VOLT)。研究人員用經(jīng)濟(jì)學(xué)領(lǐng)域的“邊際收益”定義了詞表質(zhì)量的評(píng)價(jià)指標(biāo),然后以數(shù)學(xué)領(lǐng)域的“最優(yōu)運(yùn)輸方法”解決最優(yōu)詞表的生成問題。

研究結(jié)果顯示,VOLT 在多種翻譯任務(wù)上取得了出色的效果。同時(shí),這種方法可以顯著減少詞表的學(xué)習(xí)和搜索時(shí)間,節(jié)約算力資源。

IT之家獲悉,業(yè)內(nèi)普遍會(huì)通過大量自然語言處理下游任務(wù)的訓(xùn)練以尋找最優(yōu)大小,使用 BPE 詞表的方式。而字節(jié)跳動(dòng)使用的 VOLT 方法,能夠節(jié)省 92% 的算力,這同時(shí)意味著所需電能的大量減少。巧合的是,這一技術(shù)的縮寫“VOLT”同時(shí)為電學(xué)單位伏特,未來能夠在工業(yè)應(yīng)用上有巨大潛力,有助于節(jié)能減排。

字節(jié)跳動(dòng)表示,目前,VOLT 研究項(xiàng)目已經(jīng)向全球開發(fā)者開源,并將在字節(jié)跳動(dòng)火山翻譯業(yè)務(wù)中逐步落地,為飛書、今日頭條等產(chǎn)品和火山引擎的企業(yè)級(jí)客戶提供機(jī)器翻譯支持。

字節(jié)跳動(dòng) VOLT 論文原文:點(diǎn)擊打開

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知