機(jī)器翻譯世界杯的中英互譯冠軍實(shí)力如何?讓谷歌和它PK下就知道了

來(lái)源:網(wǎng)絡(luò) 時(shí)間:2017-09-20 14:03:17

機(jī)器翻譯世界杯的中英互譯冠軍實(shí)力如何?讓谷歌和它PK下就知道了

  機(jī)器翻譯,是利用計(jì)算機(jī)將一種自然語(yǔ)言(源語(yǔ)言)轉(zhuǎn)換為另一種自然語(yǔ)言(目標(biāo)語(yǔ)言)的過(guò)程,是AI(人工智能)的終極目標(biāo)之一。1954年,美國(guó)喬治敦大學(xué)研制出世界首個(gè)英俄機(jī)器翻譯系統(tǒng)。從早期的詞典匹配,到詞典結(jié)合語(yǔ)言學(xué)專家知識(shí)的規(guī)則翻譯,再到基于語(yǔ)料庫(kù)的統(tǒng)計(jì)機(jī)器翻譯,機(jī)器翻譯的技術(shù)研發(fā)歷程,可謂曠日持久。然而,計(jì)算機(jī)系統(tǒng)始終難以理解人類的語(yǔ)言,滿足不了生活工作所需的“聰明”程度。

  直到最近十年,隨著AI技術(shù)的信息突破,機(jī)器翻譯正在離開環(huán)境苛刻的實(shí)驗(yàn)室,開始為市場(chǎng)上的普通用戶提供服務(wù)。

  曾經(jīng)的機(jī)器翻譯,只是一個(gè)美好的科幻夢(mèng)想。

  如今,它正在變?yōu)榫哂袩o(wú)限可能性的現(xiàn)實(shí),一步步的向我們走來(lái)。

  人工智能時(shí)代的百家爭(zhēng)鳴,產(chǎn)品體驗(yàn)決定一切

  隨著國(guó)際化的進(jìn)一步加深,人們對(duì)于不同語(yǔ)種間的溝通需求也愈發(fā)迫切,傳統(tǒng)的人工翻譯行業(yè),或許要受到一次史無(wú)前例的挑戰(zhàn)。Google、Facebook、微軟、騰訊、阿里巴巴、搜狗,都不愿錯(cuò)過(guò)這一場(chǎng)人工智能的歷史進(jìn)程。各大科技巨頭公司的市場(chǎng)角逐中,產(chǎn)品體驗(yàn)上的易用性,成為了當(dāng)下評(píng)價(jià)機(jī)器翻譯產(chǎn)品的最好指標(biāo)。

  2006年,Google宣布上線Google Translate翻譯功能,拉開了最近十年的“人工智能+機(jī)器翻譯”的AI技術(shù)舞臺(tái)帷幕。2016年Google發(fā)布了GNMT-谷歌神經(jīng)機(jī)器翻譯系統(tǒng),將整個(gè)輸入句子視作翻譯的基本單元,大大提升了翻譯效率。在不同的語(yǔ)言對(duì)比中,GNMT把PBMT與人工翻譯的鴻溝縮小了58% ~85%,接近了人工翻譯的水平。許多人工翻譯工作者感慨:“作為翻譯,看到這個(gè)新聞的時(shí)候,我理解了18世紀(jì)紡織工人看到蒸汽機(jī)時(shí)的憂慮與恐懼?!?/p>

  Google率先拿出了神經(jīng)機(jī)器翻譯的概念,其他科技公司也不甘示弱,從產(chǎn)品和技術(shù)上展開了激烈的競(jìng)爭(zhēng)。9月7日,全球范圍內(nèi)最具權(quán)威的國(guó)際評(píng)測(cè)大賽WMT2017,在丹麥?zhǔn)锥几绫竟e行。WMT全稱Workshop on Machine Translation,是由來(lái)自歐洲和美國(guó)的高校、研究機(jī)構(gòu)的研究人員聯(lián)合舉辦的業(yè)界公認(rèn)的國(guó)際頂級(jí)機(jī)器翻譯比賽之一。在20多家國(guó)際知名機(jī)構(gòu)的激烈競(jìng)爭(zhēng)中,搜狗提交的中英和英中系統(tǒng),獲得了WMT2017人工評(píng)價(jià)指標(biāo)的雙向第一名。同時(shí),搜狗提交的中譯英系統(tǒng)在20個(gè)提交的系統(tǒng)中,獲得八項(xiàng)機(jī)器評(píng)價(jià)指標(biāo)中的七項(xiàng)第一,并且獲得主要機(jī)器指標(biāo)BLEU(Bilingual Evaluation Understudy)第一名。

  隨著深度學(xué)習(xí)理念的技術(shù)開發(fā),包括Google、Facebook、微軟、騰訊、阿里巴巴、搜狗在內(nèi)的各大巨頭,都在試圖將深度學(xué)習(xí)理念應(yīng)用到機(jī)器翻譯之中,推出各類產(chǎn)品來(lái)探索其應(yīng)用性。例如搜狗推出的輸入法“中英互譯”功能,將深度神經(jīng)元網(wǎng)絡(luò)翻譯系統(tǒng)與輸入相結(jié)合,利用搜索技術(shù)跨越信息阻隔,再用神經(jīng)元翻譯技術(shù)打破語(yǔ)言障礙,實(shí)現(xiàn)“一邊說(shuō)中文、一邊出英文”的智能機(jī)器同傳翻譯效果。

  顯而易見,中國(guó)的語(yǔ)音翻譯技術(shù),已經(jīng)進(jìn)入了世界最前沿的技術(shù)領(lǐng)域。

  作為普通用戶,我們能享受到多少AI翻譯的“紅利”?

  作為普通用戶,人們更關(guān)心的是AI智能翻譯技術(shù),究竟能在實(shí)際應(yīng)用中達(dá)到一個(gè)怎樣的表現(xiàn)水準(zhǔn)。尤其是當(dāng)用戶運(yùn)用口語(yǔ)化的聲音表達(dá)時(shí),AI能否準(zhǔn)確判斷出語(yǔ)音的語(yǔ)義理解,做出準(zhǔn)確的停頓思考,最終得到一個(gè)合格的翻譯成果。

  下面,我們就來(lái)做幾項(xiàng)實(shí)際的語(yǔ)音翻譯測(cè)試。通過(guò)和“谷歌翻譯”和“搜狗輸入法”的智能翻譯翻譯結(jié)果來(lái)做對(duì)比,挑戰(zhàn)各種高難度的翻譯語(yǔ)境,驗(yàn)證人工智能的機(jī)器翻譯水準(zhǔn)到底怎么樣。

  1、情感對(duì)話。漢語(yǔ)一向博大精深,許多時(shí)候我們說(shuō)話時(shí)的文字內(nèi)容沒(méi)有變化,可能僅僅只是前后序列稍加變動(dòng),整個(gè)語(yǔ)句的語(yǔ)義就大有不同。尤其是在詮釋情感對(duì)話時(shí),往往會(huì)更激烈、更直接、更不看重縝密的語(yǔ)法排列。對(duì)于機(jī)器翻譯成英文來(lái)說(shuō),這無(wú)疑是一個(gè)相當(dāng)難理解的挑戰(zhàn)。

  原文:曾經(jīng)我喜歡過(guò)一個(gè)人,現(xiàn)在我喜歡一個(gè)人過(guò)

  谷歌翻譯:I used to have a person, and now I like a person too

  

  搜狗輸入法翻譯:Once I liked a person, now I like to live alone

  

  機(jī)器翻譯世界杯的中英互譯冠軍實(shí)力如何?讓谷歌和它PK下就知道了

  “喜歡過(guò)一個(gè)人”和“喜歡一個(gè)人過(guò)”,有著明顯的語(yǔ)義區(qū)別。搜狗輸入法的理解要更準(zhǔn)確一些,基本完美的詮釋了前后兩句話中的中文意境。谷歌的翻譯則顯得“機(jī)翻”的味道太過(guò)嚴(yán)重,不符合生活實(shí)際。

  2、景點(diǎn)地名。當(dāng)我們身處海外時(shí),經(jīng)常都會(huì)有尋求當(dāng)?shù)厝藛?wèn)路的需要。對(duì)于那些不熟悉的景點(diǎn)地名,一個(gè)準(zhǔn)確直接的英文翻譯,肯定能幫上大忙。

  原文:格里菲斯天文臺(tái)怎么走?

  谷歌翻譯:How does the Griffith Observatory go?

  

  搜狗輸入法翻譯:How to get to Griffith Observatory?

  

  格里菲斯天文臺(tái)是洛杉磯的著名景點(diǎn),中國(guó)游客想要問(wèn)路前往該處,是比較常見的海外旅游對(duì)話。雙方都理解了中文的語(yǔ)義,但是谷歌的英文翻譯略有不足,而搜狗輸入法的英文翻譯更加準(zhǔn)確。

  3、詩(shī)詞古文典籍。詩(shī)詞古文,是中英文翻譯時(shí)的一大難點(diǎn)。因?yàn)橛迷~語(yǔ)法時(shí)的高度省略化,導(dǎo)致翻譯時(shí)難度倍增,許多人工翻譯都顯得力有未逮。我們選用了林則徐的一句著名詩(shī)句為例,這句詩(shī)詞寓意深遠(yuǎn)又朗朗上口,在中國(guó)互聯(lián)網(wǎng)上擁有很高的人氣。翻譯成英文時(shí),不知道能否準(zhǔn)確的還原語(yǔ)義呢?

  原文:茍利國(guó)家生死以,豈因禍福避趨之

  谷歌翻譯:Gou Li country life and death, not because of bad fortune to avoid the trend

  

  搜狗輸入法翻譯:He who would profit the life and death of his country will not avoid it because of misfortune and good fortune

  

  兩種英文翻譯,都有一些問(wèn)題。相對(duì)來(lái)說(shuō),搜狗輸入法的英文翻譯,稍微還原了林則徐這句詩(shī)的本意。而谷歌的翻譯完全是離題萬(wàn)里,“Gou Li”的翻譯一出,表明谷歌對(duì)于中文語(yǔ)境的本土化理解嚴(yán)重不足。

  總的來(lái)說(shuō),人工智能技術(shù),在機(jī)器翻譯領(lǐng)域確實(shí)表現(xiàn)出了讓人驚喜的水準(zhǔn)。無(wú)論是說(shuō)走就走的出國(guó)旅游,還是跨洋交流的留學(xué)辦公,使用語(yǔ)音翻譯軟件來(lái)實(shí)現(xiàn)“說(shuō)中文,出英文”的功能效果,基本都能滿足與外國(guó)人的日常交流,大大提升彼此的溝通效率。

  語(yǔ)音識(shí)別與同傳翻譯的組合,讓看起來(lái)還很遙遠(yuǎn)的人工智能概念,變得觸手可及。不知不覺中,更加“懂你”的AI技術(shù)正在影響著我們生活的每一個(gè)角落。

繼續(xù)閱讀與本文標(biāo)簽相同的文章

分享至:

你可能感興趣 換一換

分享到微信朋友圈 ×
打開微信,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。