春節(jié)假期已經(jīng)過去幾天了,不知道大家有沒有吃好玩好?朋友圈這幾天幾乎被美食、萌娃視頻和景點(diǎn)照片刷屏了,讓人好生羨慕。
朋友圈(為保護(hù)隱私,一些信息打了碼)
不知道大家注意到?jīng)]有,上面四條朋友圈消息,有一條是在俄羅斯發(fā)出來的。實(shí)際上,在這個(gè)傳統(tǒng)上要回鄉(xiāng)團(tuán)聚的日子里,也有相當(dāng)一部分人選擇全家出國旅游。根據(jù)中國旅行研究院與攜程旅行統(tǒng)計(jì),今年春節(jié)預(yù)計(jì)中國出境游人數(shù)將達(dá)到650萬人次,中國人在春節(jié)假日出境旅游幾乎可以“席卷全球”。
但出國旅游就有個(gè)問題:如何在當(dāng)?shù)亟涣鳎窟@可不是光學(xué)會幾句英語就能解決的問題,如果你要去不以英語為母語的國家,可能就麻煩了,不是每個(gè)當(dāng)?shù)厝硕紩v英語。這時(shí)候,手機(jī)上的翻譯軟件就有用處。
目前出國旅游比較流行的是谷歌翻譯。對于中國大陸用戶來說,近期比較重要的更新是在去年的3月29日,谷歌更新后的翻譯App可以在中國大陸地區(qū)無障礙使用,經(jīng)過一波宣傳,用的人越來越多。在知乎上“出國旅游有什么好的便攜式翻譯機(jī)或App可用?”這一問題中,得贊最多的回答首推谷歌翻譯App。
知乎上“出國旅游有什么好的便攜式翻譯機(jī)或App可用?”這一問題中,得贊最多的回答
但機(jī)器翻譯一向被專業(yè)譯員鄙視,即使谷歌為翻譯加持神經(jīng)網(wǎng)絡(luò)技術(shù)也沒有改變很多人類譯員的看法。最近美國《大西洋月刊》上的一篇文章中,作者道格拉斯·霍夫施塔特(Douglas Hofstadter)對谷歌翻譯diss(侮辱)了一把。他通過英語、法語、德語和中文四種語言翻譯比對,論證出一個(gè)結(jié)果:谷歌翻譯即使應(yīng)用人工智能技術(shù),也沒有真正理解語言。
他在文章中舉了中文翻譯英文的例子,文本是楊絳的《我們仨》中的一段。
原文:
鍾書到清華工作一年后,調(diào)任毛選翻譯委員會的工作,住在城里,周末回校。他仍兼管研究生。
毛選翻譯委員會的領(lǐng)導(dǎo)是徐永煐同志。介紹鍾書做這份工作的是清華同學(xué)喬冠華同志。
事定之日,晚飯后,有一位舊友特雇黃包車從城里趕來祝賀??腿ズ螅R書惶恐地對我說:
他以為我要做“南書房行走”了。這件事不是好做的,不求有功,但求無過。
谷歌翻譯版本:
After a year of work at Tsinghua,he was transferred to the Mao Translating Committee to live in the city and back to school on weekends。He is still a graduate student。
The leadership of the Mao Tse Translation Committee is Comrade Xu Yongjian。Introduction to the book to do this work is Tsinghua students Qiao Guanhua comrades。
On the day of the event,after dinner,an old friend hired a rickshaw from the city to congratulate。Guest to go,the book of fear in the book said to me:
He thought I had to do“South study walking?!盩his is not a good thing to do,not for meritorious service,but for nothing。
作者翻譯版本:
After Zhongshu had worked at Tsinghua University for a year,he was transferred to the committee that was translating selected works of Chairman Mao。He lived in the city,but each weekend he would return to school。He also was still supervising his graduate students。
The leader of the translation committee of Mao’s works was Comrade Xu Yongying,and the person who had arranged for Zhongshu to do this work was his old Tsinghua schoolmate,Comrade Qiao Guanhua。
On the day this appointment was decided,after dinner,an old friend specially hired a rickshaw and came all the way from the city just to congratulate Zhongshu。After our guest had left,Zhongshu turned to me uneasily and said:
“He thought I was going to become a‘South Study special aide?!疶his kind of work is not easy。You can’t hope for glory;all you can hope for is to do it without errors?!?/p>
作者在這里指出了谷歌版本不少問題:
翻譯中一次也沒提到過人名“鍾書”,而是分別翻譯成了“he”、“the book”和“the book of fear in the book”。很明顯,谷歌翻譯沒有理解出這是個(gè)人名;
原文是“他仍兼管研究生”,但翻譯變成了“He is still a graduate student”(他仍是個(gè)研究生);
原文的“徐永煐”(Xu Yongying)被翻譯成了“Xu Yongjian”。
“客去后”被翻譯成了“guest to go”(客人要走)。
“南書房行走”中的“行走“被翻譯成“walking”,這也是谷歌沒有理解原詞含義。
不光是這一段,作者從他當(dāng)下看的書中選擇了好多個(gè)段落進(jìn)行測試,幾乎每一段都會出現(xiàn)形式不一、大小各異的翻譯錯(cuò)誤,其中也包括上文所述的無法理解的句子。
為什么谷歌翻譯在上面的例子中還是不盡如人意?在作者看來,谷歌翻譯只是類似于處理密碼一樣處理語句,而沒有像人類一樣“閱讀“語句,它處理的符號和現(xiàn)實(shí)世界是分開的,沒有現(xiàn)實(shí)體驗(yàn),也就談不上理解。
谷歌翻譯不盡如人意,但它真的完全沒有用嗎?
既然谷歌翻譯在前面的例子中如此糟糕,那對于出國的游客來說,谷歌翻譯還有用嗎?
前面diss谷歌翻譯的作者霍夫施塔特指出,谷歌翻譯目前還不能做到準(zhǔn)確理解語句;但霍夫施塔特只分析了一類文本,那就是文學(xué)作品類。谷歌翻譯面對的可絕不僅僅是想了解文學(xué)作品的人,對于不同的需求,它的表現(xiàn)會不會有所變化?換句話說,對于出國游客來說,谷歌翻譯的表現(xiàn)會不會更好一點(diǎn)?做一個(gè)簡單測試也許能看出來。
新浪科技隨機(jī)挑選10個(gè)“出國常見語句”為樣本,輸入到iOS版谷歌翻譯App中測試(這里的測試語句除了常見的問路類型,還有相對比較復(fù)雜的),然后將這10句原文和翻譯分成三類,分別是“有歧義”、“不常用”和“正確”類型,結(jié)果如下:
分類結(jié)果
這里要注意的是,這里分類的依據(jù)是可理解的程度,而不是語法。這就意味著只要能夠被理解且不出現(xiàn)歧義,即使是有明顯語法錯(cuò)誤的,也可以被分到“不常用”類別,比如“How to get to the subway station”這種有語法錯(cuò)誤的句子,但還能通過單詞理解,就分到“不常用”類別中。
但即使按照這樣不太嚴(yán)格的標(biāo)準(zhǔn)來分類,可理解與有誤解的比例還是6:4,以下就來說說四個(gè)“有歧義”句子可能出現(xiàn)的誤解:
“我要退這張票”翻譯成“I want to withdraw this ticket”,可能會被誤解成“我要拿走這張票”,因?yàn)椤皐ithdraw”有“拿走”的意思,而沒有“退票”的含義;
“我想把這張50美元換開”中的“換開”不能翻譯成“swap”,因?yàn)檫@個(gè)英語單詞不能用于“換零錢”這個(gè)含義中;
“能給我張退稅表嗎?”的谷歌翻譯“Can you give me a tax return?”,把“表格”(form)這個(gè)含義在翻譯中丟失了,而且“tax return”是“報(bào)稅”的意思,而不是“退稅”的意思;
“這有免稅店嗎?”被谷歌翻譯錯(cuò)譯了“Is this duty-free shop?”(這家店是免稅店嗎?),這是一個(gè)只要稍微學(xué)過英語的人都會看出來的錯(cuò)誤。
從隨機(jī)的測試結(jié)果看來,谷歌翻譯的準(zhǔn)確度離滿足游客的需要還是差了一些距離。
為什么有了人工智能加持,谷歌翻譯還是不夠好?
前文中說過,谷歌近期比較重要的更新是可以在中國大陸地區(qū)無障礙使用。但實(shí)際上,谷歌在前年有一次更重要的更新,那就是將翻譯系統(tǒng)從原來的“基于詞組的機(jī)器翻譯”(PBMT)轉(zhuǎn)變?yōu)椤吧窠?jīng)機(jī)器翻譯”(NMT),也就是將神經(jīng)網(wǎng)絡(luò)技術(shù)引入到機(jī)器翻譯中。谷歌宣稱,經(jīng)過此次更新,翻譯結(jié)果更加通順,可用性更強(qiáng)。
按照百科上的說法,神經(jīng)網(wǎng)絡(luò)“是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型”。這個(gè)定義非專業(yè)人士不太好理解,沒關(guān)系,只要知道神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人工智能的基礎(chǔ)性技術(shù)就好了。
人工智能是這幾年的大熱新聞關(guān)鍵詞和最流行的技術(shù),連今年的春節(jié)晚會上都展示了人工智能技術(shù)加持的自動駕駛汽車。但新聞中常常被講的神乎其神的人工智能怎么在語言翻譯這方面都做不好?前文中那個(gè)diss谷歌翻譯的作者霍夫施塔特給了我們一個(gè)解釋。
霍夫施塔特認(rèn)為,很多人其實(shí)對人工智能的期待過高,從而“腦補(bǔ)過度”,這在心理學(xué)上被稱為“Eliza效應(yīng)”,大概意思是說人會過度解讀機(jī)器的結(jié)果。這里的“Eliza”是上個(gè)世紀(jì)60年代的早期人工智能項(xiàng)目,能通過腳本理解簡單的自然語言,并能進(jìn)行類似于人類的互動,與它互動過的許多人都認(rèn)為Eliza確實(shí)了解他們內(nèi)心的感覺。在霍夫施塔特看來,即使是一些人工智能領(lǐng)域的研究者,也難免落入“Eliza”效應(yīng)的陷阱中。
霍夫施塔特認(rèn)為,人類的翻譯是一個(gè)“閱讀-內(nèi)化-表達(dá)”的過程,人類讀到文本之后,會聯(lián)想到相關(guān)的現(xiàn)實(shí)場景,然后基于場景給出另一種語言對于這種場景的表達(dá)。但谷歌翻譯只是一個(gè)“解碼”過程,即使是人工智能加持,谷歌翻譯也沒有真正理解文本,它只是將原文看成被加密的譯文,只要解碼即可翻譯。這樣的過程缺乏現(xiàn)實(shí)體驗(yàn),談不上理解,當(dāng)然就難免出現(xiàn)錯(cuò)誤。
有人也許會問,神經(jīng)網(wǎng)絡(luò)技術(shù)就不能模仿人類思維來翻譯嗎?霍夫施塔特也給出了自己的答案,他認(rèn)為這類機(jī)器翻譯目前還沒有超越單詞和短語層面,這樣的人工智能在“讀”到文本之后,只是聯(lián)想到對應(yīng)語言的單詞,而不是聯(lián)想到現(xiàn)實(shí)場景,盡管用了復(fù)雜的統(tǒng)計(jì)詞語聚類算法,但這和人類的翻譯思維還是不一樣。這種技術(shù)加持下的谷歌翻譯,雖然能將原文和譯文的詞語對應(yīng)起來,還有一定能力組織成句子,但還是難以理解。
霍夫施塔特的說法在新浪科技的測試中也得到驗(yàn)證。此前的出國常用語句翻譯測試,從“退票”翻譯成“withdraw ticket”和“換開”翻譯成“swap”這兩個(gè)例子中,就能看出谷歌翻譯目前還停留在詞對詞或者短語對短語的層面,而不是聯(lián)想到實(shí)際場景,即使按照正確的語法組織起來,也難以讓人理解。借用一位翻譯學(xué)教授的話:“你每一個(gè)字看得懂,但連起來就不是人說的話?!?/p>
由此看出,谷歌翻譯距離完全無障礙的應(yīng)用還有一定距離。在這種情況下,出國的游客除了在手機(jī)裝上幾個(gè)翻譯App之外,最好還是多學(xué)點(diǎn)常用英語,再不濟(jì)也練一練畫圖技能,以備不時(shí)之需。當(dāng)然,人工智能的研究者還是要更深入的探究人類思維,并且開發(fā)出一款更好的翻譯App;如果真有這么一天,專業(yè)譯員也會對機(jī)器肅然起敬了。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。