機器翻譯的精髓――翻譯記憶庫和術語庫

在翻譯界,有三種主要方式能將一種語言翻譯至另一種語言。這三種方式分別是機器翻譯(電腦軟體翻譯)、電腦輔助翻譯(電腦軟體翻譯過後,再由人工編修),以及歷時最為悠久、品質也最有保障的人工翻譯。

這三種翻譯方式各有優缺點,主要還是和所需時間成本準確度相關。普遍認為人工翻譯在準確度上遙遙領先於機器翻譯,但隨著科技發展,翻譯軟體日新月異,機器翻譯在結構較相近的語言對中,處理較為初階且重複性較高的文件時,幾乎能達到與人工翻譯相提並論的品質。而這樣的競爭優勢,主要還是歸功於機器翻譯的翻譯記憶庫(Translation memory)和術語庫(Termbase)功能的發展。

您走入翻譯記憶和術語庫的世界

術語庫,顧名思義就是一個充滿了術語詞彙的資料庫,可以想像成是語言之間的翻譯對照詞彙表,當一個字從一種語言被翻譯至另一種語言時,它就會被加進術語庫之中。術語庫通常不只有兩種語言配對,而是無數種語言相互對照,這也是為什麼您可以使用Google翻譯,在轉眼間翻譯五十種語言的「你好」出來。然而,術語庫所提供的翻譯,僅足以應付字與字之間的轉換,文化語境中相應的細節卻無法被翻譯出來。

至於翻譯記憶庫,則更為先進。它配備了更高端的翻譯系統,可以識別文字的使用方式、句式、文法等等。當術語庫只能識別「heart」是心臟時,「pulling the strings of my heart」會被翻譯成「拉動我心臟的線」;但若是有翻譯記憶庫的功能,就很可能查到這一句英文曾經被翻譯成「牽動我的心弦」。

英文是充斥著同音同形異義字、同音異形異義字、隱喻和明喻用法的語言,其用法既多且雜,增加了翻譯難度,還好有翻譯記憶功能可以把常用的複雜語境和慣用文法都加以儲存。若長期使用這項記憶功能,即使再困難的語言模式,也有機會準確地被電腦軟體翻譯出來。

翻譯記憶優點

  • 在翻譯高重複性且多專業術語的技術性文件時,翻譯記憶庫可是譯者的無價至寶!它能夠使這些頻繁使用的專業術語和詞彙,在譯文中保有一致性。
  • 翻譯大型文檔時,通常需要數名譯者協作,此時翻譯記憶庫能夠保證每一位譯者所翻譯出的專業術語和行文措辭皆一致且準確。
  • 當前後需要翻譯多個文檔時,一份有效的翻譯記憶庫能節省譯者重新翻譯常用詞彙,或是翻譯固定段落格式的時間。

翻譯記憶的侷限性

  • 當詞彙在上下文的使用方式一致,翻譯記憶庫可發揮極大功效。反之,當相同詞彙卻有著不同的意思及用法時,翻譯記憶庫則難以依照語境,判斷出適切的譯語。
  • 翻譯記憶庫有助於翻譯出具有一定水準的國際化文件,但若要將文件當地化,則需要針對在地語言的使用方式,建立一個新的語言翻譯記憶庫。
  • 一份文件交由不同的翻譯社來進行翻譯,除非他們使用同一術語庫和翻譯記憶庫,否則翻譯的結果極有可能不一致。尤其是翻譯過程可能有兼職譯者參與,這讓翻譯記憶庫的運作更為困難。這點也正好牴觸了翻譯記憶庫最大的優勢。
  • 若一段文字最初就被錯譯,除非錯誤經發現後校正,否則這段錯誤譯文將繼續被使用於類似的翻譯之中。因為譯者可能會順著翻譯記憶庫的建議譯法,不一定會逐字檢查翻譯內容是否符合文件上下文的語境。

目前為止還沒有任何一個方案能完全取代人工翻譯,但機器翻譯在近幾年所獲得的進步卻是毋庸置疑的。這些包括了翻譯記憶庫和術語庫相關程式和功能的進步,在合理的使用之下,都能夠節省翻譯文件時所耗費的大量時間和金錢,再加上人工校譯的機器翻譯+譯後編輯(Machine Translation Post-Editing,MTPE)亦是可以考慮的選擇。話又說回來,要是缺少了人工編修和品質監督,那您所得到的翻譯成果,可能也不比Google翻譯要好多少!

 

請發表您的意見評論

您的Email不會被公開

X

請訂閱以繼續閱讀

關於科研寫作和學術出版的文章與學術資源,包括:

  • 820 +文章
  • 50+ 免費線上講座
  • 10+ 專家Podcast
  • 10+ 電子書
  • 10+ 檢查清單
  • 50+ 資訊圖