設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

剛剛,微軟宣布重大里程碑:中英機(jī)器翻譯水平可“與人類媲美”

2018/3/14 22:32:26 來(lái)源:IT之家 作者:玄隱 責(zé)編:玄隱

IT之家3月14日消息 根據(jù)微軟亞洲研究院消息,今天,微軟研究團(tuán)隊(duì)宣布其研發(fā)的機(jī)器翻譯系統(tǒng)在通用新聞報(bào)道測(cè)試集newstest2017的中-英測(cè)試集上達(dá)到了人類水平,這是首個(gè)在新聞報(bào)道的翻譯質(zhì)量和準(zhǔn)確率上可以比肩人工翻譯的翻譯系統(tǒng)。該系統(tǒng)模型包含了由微軟亞洲研究院研發(fā)的對(duì)偶學(xué)習(xí)、推敲網(wǎng)絡(luò)、聯(lián)合訓(xùn)練和一致性規(guī)范技術(shù)。機(jī)器翻譯是自然語(yǔ)言處理領(lǐng)域最具挑戰(zhàn)性的研究任務(wù)之一。

newstest2017新聞報(bào)道測(cè)試集由產(chǎn)業(yè)界和學(xué)術(shù)界的合作伙伴共同開(kāi)發(fā),并于去年秋天在WMT17大會(huì)上發(fā)布。為了確保翻譯結(jié)果準(zhǔn)確且達(dá)到人類的翻譯水平,微軟研究團(tuán)隊(duì)邀請(qǐng)了雙語(yǔ)語(yǔ)言顧問(wèn)將微軟的翻譯結(jié)果與兩個(gè)獨(dú)立的人工翻譯結(jié)果進(jìn)行了比較評(píng)估。

微軟技術(shù)院士,負(fù)責(zé)微軟語(yǔ)音、自然語(yǔ)言和機(jī)器翻譯工作的黃學(xué)東稱,這是對(duì)自然語(yǔ)言處理領(lǐng)域最具挑戰(zhàn)性任務(wù)的一項(xiàng)重大突破?!霸跈C(jī)器翻譯方面達(dá)到與人類相同的水平是所有人的夢(mèng)想,我們沒(méi)有想到這么快就能實(shí)現(xiàn)?!彼硎荆跋Z(yǔ)言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來(lái)為此付出的努力?!?/p>

微軟亞洲研究院副院長(zhǎng)、自然語(yǔ)言計(jì)算組負(fù)責(zé)人周明表示,在WMT17測(cè)試集上的翻譯結(jié)果達(dá)到人類水平很鼓舞人心,但仍有很多挑戰(zhàn)需要我們解決,比如在實(shí)時(shí)的新聞報(bào)道上測(cè)試系統(tǒng)等。

微軟機(jī)器翻譯團(tuán)隊(duì)研究經(jīng)理Arul Menezes表示,團(tuán)隊(duì)想要證明的是:當(dāng)一種語(yǔ)言對(duì)(比如中-英)擁有較多的訓(xùn)練數(shù)據(jù),且測(cè)試集中包含的是常見(jiàn)的大眾類新聞詞匯時(shí),那么在人工智能技術(shù)的加持下機(jī)器翻譯系統(tǒng)的表現(xiàn)可以與人類媲美。

沒(méi)有“正確的”翻譯結(jié)果

newstest2017新聞報(bào)道測(cè)試集包括約2000個(gè)句子,由專業(yè)人員從在線報(bào)紙樣本翻譯而來(lái)。微軟團(tuán)隊(duì)對(duì)測(cè)試集進(jìn)行了多輪評(píng)估,每次評(píng)估會(huì)隨機(jī)挑選數(shù)百個(gè)句子翻譯。為了驗(yàn)證微軟的機(jī)器翻譯是否與人類的翻譯同樣出色,微軟沒(méi)有停留在測(cè)試集本身的要求,而是從外部聘請(qǐng)了一群雙語(yǔ)語(yǔ)言顧問(wèn),將微軟的翻譯結(jié)果與人工翻譯進(jìn)行比較。

驗(yàn)證過(guò)程之復(fù)雜也從另一個(gè)側(cè)面體現(xiàn)了機(jī)器翻譯要做到準(zhǔn)確所面臨的復(fù)雜性。對(duì)于語(yǔ)音識(shí)別等其它人工智能任務(wù)來(lái)說(shuō),判斷系統(tǒng)的表現(xiàn)是否可與人類媲美相當(dāng)簡(jiǎn)單,因?yàn)槔硐虢Y(jié)果對(duì)人和機(jī)器來(lái)說(shuō)完全相同,研究人員也將這種任務(wù)稱為模式識(shí)別任務(wù)。

然而,機(jī)器翻譯卻是另一種類型的人工智能任務(wù),即使是兩位專業(yè)的翻譯人員對(duì)于完全相同的句子也會(huì)有略微不同的翻譯,而且兩個(gè)人的翻譯都不是錯(cuò)的。那是因?yàn)楸磉_(dá)同一個(gè)句子的“正確的”方法不止一種。周明表示:“這也是為什么機(jī)器翻譯比純粹的模式識(shí)別任務(wù)復(fù)雜得多,人們可能用不同的詞語(yǔ)來(lái)表達(dá)完全相同的意思,但未必能準(zhǔn)確判斷哪一個(gè)更好?!?/p>

復(fù)雜性讓機(jī)器翻譯成為一個(gè)極有挑戰(zhàn)性的問(wèn)題,但也是一個(gè)極有意義的問(wèn)題。劉鐵巖認(rèn)為,我們不知道哪一天機(jī)器翻譯系統(tǒng)才能在翻譯任何語(yǔ)言、任何類型的文本時(shí),都能在“信、達(dá)、雅”等多個(gè)維度上達(dá)到專業(yè)翻譯人員的水準(zhǔn)。不過(guò),他對(duì)技術(shù)的進(jìn)展表示樂(lè)觀,因?yàn)槊磕晡④浀难芯繄F(tuán)隊(duì)以及整個(gè)學(xué)術(shù)界都會(huì)發(fā)明大量的新技術(shù)、新模型和新算法,“我們可以預(yù)測(cè)的是,新技術(shù)的應(yīng)用一定會(huì)讓機(jī)器翻譯的結(jié)果日臻完善?!?/p>

研究團(tuán)隊(duì)還表示,此次技術(shù)突破將被應(yīng)用到微軟的商用多語(yǔ)言翻譯系統(tǒng)產(chǎn)品中,從而幫助其它語(yǔ)言或詞匯更復(fù)雜、更專業(yè)的文本實(shí)現(xiàn)更準(zhǔn)確、更地道的翻譯。此外,這些新技術(shù)還可以被應(yīng)用在機(jī)器翻譯之外的其他領(lǐng)域,催生更多人工智能技術(shù)和應(yīng)用的突破。

更多詳情內(nèi)容,點(diǎn)此了解。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知