機器翻譯、或是電腦輔助翻譯,早已經不是一個字與字替換的翻譯方案了,現在的程式使用複雜的系統,利用大型語言數據資料庫中的統計數據和變量來推斷上下文、估算正確的語言用法。然而是否有天機器翻譯能夠完全取代人工翻譯呢?如果可以,將會在何時成真?
在《銀河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)一書中,作者描述過一種嬌小、黃色的生命體,能夠瞬間翻譯任何外來語言並傳送至聽者的耳朵裡。雖然說目前我們並沒有這樣的能力、也沒有這樣的外星生命體在身邊,我們卻有Google翻譯和 BabelFish這類的機器翻譯來賦予我們理解地球上其他語言的能力,能在轉瞬之間,將文件從上千種配對語言中轉換。並且,隨著科技的發展,翻譯的品質也越來越接近人工翻譯的品質,不再是十年前的劣質翻譯水準。
然而,問題還是存在,人類是否有可能在世界語言翻譯上達到技術奇點?機器是否真的有能將世界上的萬千種語言都翻譯到文意及文化語境上都準確的能力?
技術奇點的概念簡介
技術奇點,也稱為技術奇異點,是用來描述假設人工智能(AI) 發展到了可以遞歸自我完善的程度,也就是說它可以識別自己的錯誤、解決這些錯誤、並從中學習。當電腦運行速度和其能力到了這種程度時,人工智能的指數性發展將形成人類所不能及也無法控制其過程的超人智慧,當人工智慧透過智慧擴大或智慧甦醒成超級智慧之時,技術奇點就發生了。
最常與技術奇點一起被提起的科學家,雷.庫茨維爾博士(Ray Kurzweil)將此概念從科幻小說和數學家之手,發展成庫茨維爾定理並系統的介紹了此概念的數學模型、基因工程的發展、奈米技術的展望和超越光速的可能性,他相信人工智能將於2020年有重大突破,並於2045年發展成完整的技術奇點。
但回歸到前面的問題,問題依舊還在,究竟在如此高智慧的智能之下,超級電腦是否可以推斷的出上下文含意、偵測到詞彙的細微之處、了解雙關語、掌握的了俗語和俚語?是否可以將文化語境加入到不同的語言系統中,或是能將情緒和其他感情因素都保持人性化?
機器翻譯為什麼兩難?
機器翻譯、或是說電腦輔助翻譯,早已經不是一個字與字替換的翻譯方案了,現在的程式使用複雜的系統,利用大型語言數據資料庫中的統計數據和變量來推斷上下文、估算正確的語言用法。根據美國牛津大學的電腦科學家和翻譯研究員Phil Blunsom博士所述:「從本質上來說,我們是用概率來尋找最適合的翻譯方案。電腦本身並不了解語言、也不懂什麼文法,但可以通過統計數據來確定〝狗的腿〞和〝狗腿〞是不同的意思。」
機器翻譯的準確度在增加的同時,是否已經發展出了替代母語級別人工翻譯的能力?即便是雷.庫茨維爾博士也有所懷疑。在一次採訪之中,他指出機器翻譯將於2029年達到與人工翻譯相應的品質,但,即便是最好的翻譯也不能完整的翻譯文學,因為有些事就不是能用另一種語言來表達的。
話已至此,姑且不論未來技術奇點後的機器翻譯,現在當在一個文件的作者選擇翻譯方案之前,必須要自問的一個問題:「翻譯的準確度對於此文件有多重要?」如果讀者只需要了解一個大致的要點、綱要即可,那個可以選擇省時、省錢的機器翻譯。然而,若是文件中關於計算、推理分析過程、語境相關元素的小錯誤都會造成影響(大部分的學術論文、專業文件與合約合同都屬於此範疇),則需要考慮你選擇機器翻譯所省下的時間和錢是否會造成你最終將付出更嚴重的代價。
了解機器翻譯的現狀
隨著我們離技術奇點的發生條件越來越近,機器翻譯未來的翻譯準確度和品質也勢必會隨之增長,愈發接近人工翻譯的品質,但不論技術奇點是否真的會發生,事實就是我們目前是無法理解或預知幾十年後的科學技術發展情況,就像是雷.庫茨維爾博士所說,即便科技有了重大的突破和進展,一定還是有機器翻譯所無法執行的翻譯要素。
尤其是那些將翻譯準確度視為關鍵的文件,即使機器翻譯是最高效的翻譯方案,卻還是與人工翻譯的準確度有數十年發展的差距。當機器提供出翻譯後的文件時,它並不了解其中的含意自然也就無法自我糾正和編輯校對,當一份文件需要在文字、語境、文化背景上有一定準確度時,最好是避免使用機器翻譯,或是是找存一份備份原始文件並且在機器翻譯後請兩種語言都達到流暢程度的譯者來校對和質量控制。
此外,機器沒有專業領域相關的知識,由於機器翻譯通常是基於共同知識的集成,面對特定領域當中的模糊用詞、縮寫或尚未被更新至知識集成當中最新、最先進研究的內容時,這些都是機器翻譯的盲點。因此,在提出新的數據和研究時,擁有特定專業知識的母語級別翻譯人員還是無可替代的!或許未來技術奇點將會顛覆我們的想像,但目前為止,機器翻譯的局限性依舊。