安徽黃山不少出租車司機(jī)經(jīng)常拉“老外”,不會(huì)外文也能交流無(wú)礙;去年北京的全球機(jī)器智能峰會(huì)上,各國(guó)大咖扎堆演講,現(xiàn)場(chǎng)卻不見(jiàn)同聲傳譯者;更多中國(guó)人海外游,面對(duì)東京的日文菜單不再一頭霧水,漫步在巴黎街頭也不再因不懂法語(yǔ)而慌張。
這一切都源于一項(xiàng)近年來(lái)不斷取得突破的技術(shù)——機(jī)器翻譯。
人工智能推波助瀾
全球知名翻譯公司“一小時(shí)翻譯”首席執(zhí)行官奧弗·紹尚日前警告說(shuō),未來(lái)1至3年內(nèi),基于神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)的機(jī)器翻譯將會(huì)承擔(dān)價(jià)值400億美元翻譯市場(chǎng)上的近一半工作,預(yù)計(jì)會(huì)導(dǎo)致50萬(wàn)名翻譯失業(yè)。
神經(jīng)機(jī)器翻譯(NMT)自2014年在科學(xué)論文中首次被提及以來(lái),已使機(jī)器翻譯領(lǐng)域出現(xiàn)翻天覆地的變化,它開(kāi)始全面超越以統(tǒng)計(jì)模型為基礎(chǔ)的統(tǒng)計(jì)機(jī)器翻譯(SMT),快速成為在線翻譯系統(tǒng)的主流標(biāo)配。
神經(jīng)機(jī)器翻譯的“神經(jīng)元”可以學(xué)習(xí)和收集信息,模仿人類大腦的神經(jīng)元建立聯(lián)系。它克服了傳統(tǒng)方法將句子分割為不同片段進(jìn)行翻譯的缺點(diǎn),充分利用上下文信息,對(duì)句子進(jìn)行整體編碼和解碼,從而生成更為流暢的譯文。
市面上的神經(jīng)機(jī)器翻譯系統(tǒng)越來(lái)越多,國(guó)內(nèi)的阿里巴巴、騰訊、百度、科大訊飛、搜狗,國(guó)外的谷歌、臉書、微軟等都在布局,這使相關(guān)技術(shù)發(fā)生“質(zhì)變”。
如今,許多出租車司機(jī)都能用手機(jī)上的翻譯軟件,輕松和“老外”溝通。在不少國(guó)際會(huì)議上,機(jī)器翻譯干脆直接扮演現(xiàn)場(chǎng)同聲傳譯角色。
語(yǔ)音識(shí)別技術(shù)發(fā)展對(duì)這場(chǎng)翻譯革命也功不可沒(méi)。語(yǔ)音識(shí)別包括遠(yuǎn)場(chǎng)識(shí)別、噪音識(shí)別以及多輪交互,是人工智能的重要切入點(diǎn)。
因此,這場(chǎng)機(jī)器翻譯技術(shù)革命,正是人工智能革命夢(mèng)想照進(jìn)現(xiàn)實(shí)的重要一環(huán)。
應(yīng)用場(chǎng)景日漸豐富
“兩年前,人工智能的翻譯質(zhì)量往好了說(shuō),也就是讓你能對(duì)文本的內(nèi)容有個(gè)大致了解,專業(yè)翻譯寧愿自己從頭開(kāi)始翻,”“一小時(shí)翻譯”首席執(zhí)行官紹尚說(shuō),“今天,通過(guò)神經(jīng)機(jī)器翻譯,人們只要對(duì)機(jī)器翻譯內(nèi)容進(jìn)行少量修改,就能獲得人性化翻譯?!?/p>
機(jī)器翻譯應(yīng)用量正呈加速增加態(tài)勢(shì)。臉書的用戶高達(dá)數(shù)十億,為了打破用戶之間的溝通瓶頸,該公司去年上線神經(jīng)機(jī)器翻譯功能,機(jī)器翻譯的速度和水平均得到大幅提升。另?yè)?jù)官方信息顯示,機(jī)器翻譯在阿里巴巴內(nèi)部可以每天翻譯出幾十億量級(jí)的產(chǎn)品信息,每天的在線翻譯請(qǐng)求達(dá)到數(shù)億次。在電子郵件和網(wǎng)站頁(yè)面語(yǔ)言轉(zhuǎn)換方面,谷歌公司稱,其機(jī)器翻譯服務(wù)每天在全世界被使用超過(guò)10億次。
旅游業(yè)對(duì)翻譯需求更加旺盛。有數(shù)據(jù)顯示,中國(guó)已成為世界第一大出境旅游客源國(guó)。2017年中國(guó)公民出境旅游突破1.3億人次,花費(fèi)達(dá)1152.9億美元。解決語(yǔ)言溝通問(wèn)題正成為越來(lái)越多中國(guó)出境游客的迫切需求。
許多中國(guó)游客借助智能翻譯軟件和機(jī)器,輕松搞定國(guó)外道路路牌、餐館菜單和超市購(gòu)物,甚至在旅途中認(rèn)識(shí)外國(guó)朋友。各大技術(shù)企業(yè)也在爭(zhēng)奪這一巨大市場(chǎng)。
機(jī)器翻譯的應(yīng)用場(chǎng)景正不斷豐富,越來(lái)越多的政府和企業(yè)網(wǎng)站需將內(nèi)容“多語(yǔ)言化”;視頻網(wǎng)站可能需要借助機(jī)器翻譯將視頻內(nèi)容翻譯成多語(yǔ)言版本;就連人工翻譯服務(wù)供應(yīng)商也會(huì)借助機(jī)器翻譯來(lái)提升人工翻譯的效率。
人機(jī)翻譯相輔相成
人類翻譯,未來(lái)還有需求嗎?
人們發(fā)現(xiàn),對(duì)于“夫妻肺片”等專有名詞以及唐詩(shī)宋詞,機(jī)器翻譯能力已有了長(zhǎng)足進(jìn)步,但面對(duì)“杠精”等網(wǎng)絡(luò)熱詞以及新流行語(yǔ)的翻譯能力仍有待提高。
盡管在達(dá)沃斯年會(huì)等一些國(guó)際論壇上,智能同傳翻譯應(yīng)用越來(lái)越多,但在個(gè)別場(chǎng)合,機(jī)器翻譯也鬧過(guò)一些令人費(fèi)解的“烏龍”。
這說(shuō)明,人工智能翻譯要充分考慮復(fù)雜性。一些會(huì)議現(xiàn)場(chǎng)語(yǔ)言多樣,話題專業(yè)性強(qiáng),噪音干擾多,而且講話者的語(yǔ)言習(xí)慣和口音也各不相同,即使能從嘈雜的環(huán)境中提取主要音色,語(yǔ)義識(shí)別仍充滿挑戰(zhàn)。
專家認(rèn)為,人工翻譯是一個(gè)“閱讀-內(nèi)化-表達(dá)”的過(guò)程,人類讀到文本之后,會(huì)聯(lián)想到相關(guān)現(xiàn)實(shí)場(chǎng)景,然后給出另一種語(yǔ)言對(duì)這種場(chǎng)景的表達(dá)。但機(jī)器翻譯通常只是一個(gè)“解碼”過(guò)程,將原文看成被加密的譯文。這樣的過(guò)程缺乏現(xiàn)實(shí)體驗(yàn),談不上理解,自然難免出錯(cuò)。
總體而言,人工翻譯與紙面翻譯供給能力有限,但翻譯水準(zhǔn)專業(yè)、精準(zhǔn),至少目前依然不可缺少;日常交流溝通不需要特別高質(zhì)量的同聲傳譯,機(jī)器翻譯在這方面市場(chǎng)前景巨大。
因此,人機(jī)應(yīng)該成為一套耦合的系統(tǒng),適合機(jī)器干的,交給機(jī)器;適合人工做的,還是由人完成。不要因?yàn)闄C(jī)器翻譯的進(jìn)步,就吆喝著大家都別學(xué)外語(yǔ);也不要因?yàn)槿斯ぶ悄芊g的失誤,就否定其巨大作用。