翻譯語言對、機器翻譯與人類譯者

由於機器翻譯服務的進展,今日可應用的語言對數目遠遠多於以往,且數目仍不斷攀升。此外,翻譯科技的進步,使得機器翻譯能比以往更趨近於人工翻譯的精確度。即便如此,若沒有人類譯者的協助,機器翻譯仍潛藏隱憂。

當一種語言被譯為另一種語言時,就形成了一組語言對(a language pair)。當將英語翻譯成西班牙語時,即產生了所謂的英語―西班牙語語言對。若將訊息反向翻譯回去,則創造了第二組語言對(西班牙語―英語)。語言對使資訊得以共享,並可從一種語言(源語)流通到另一種語言(譯語)。

世界上仍被使用的語言大約有六千五百種。若每一種語言皆有相應的語言對,那語言對的總數將會超過三千六百萬種。假設您剔除當中少於一千名使用者的兩千種語言,則所需的語言對組數將降低至兩千萬出頭。這看起來仍是一場浩大工程,建議最好由現在網路流通的一千五百種語言下手。針對這一千五百種語言,可能產生的語言對僅有兩百二十五萬組而已。

目前世界十大語言,依使用者數量排序,分別為法語、馬來―印尼語、葡萄牙語、孟加拉語、阿拉伯語、俄語、西班牙語、印度斯坦語、英語與中文。若將這十大語言與其他一千四百九十種常用語言進行配對,則語言對數目僅剛好超過三萬組。假設將這些流通於網路世界的主要語言彼此配對,那麼不到三十萬組語言對即可與百分之九十九的網路使用者交流。

這重要之處在哪呢?商業研究的結果不斷證實,消費者傾向於購買以他們本地語言銷售的產品,或是較有意願接觸以其本地語言傳播的資訊。

世界總人口數逾二十億,然而,語言學家David Crystal 在《英語為全球語言》一書中道出,英文母語人士僅佔全球約四億人口,而另有六億人口以英文作為第二語言。如此說來,全世界仍有超過一半人口—逾十億人不說英語。若您的資訊僅以英語傳遞,這意謂著有一塊龐大的市場利益您尚未觸及。

機器翻譯及全球語言對

以電腦建置術語庫(termbase)與翻譯記憶資料庫(translation memory database)的方法已行之幾十載。電腦加速了費時的資料蒐集過程,並推進了翻譯演算法,使電腦翻譯的發展呈指數性增長。

術語庫會在某一語言中取一單字,並將之直譯為另一語言中相對應的文字。翻譯記憶庫(translation memory)則為一資料庫,儲存各詞組(特定片語、慣用語或概念)相對應的譯文。此做法不僅確保該譯文首尾一致,亦確保您所翻譯過的文件之間具連貫性。更具優勢之處為,這些被儲存下來的翻譯內容,可使您接下來的翻譯作業效率更高且成本更低。就效率與成本來說,您翻譯時所建置的術語庫與翻譯記憶庫越豐富,您完成翻譯專案的效率越高,並省下越多成本。

翻譯用的術語庫與翻譯記憶庫中運行著兩大系統:規則式系統(rules-based system)與統計式系統(statistical system)。規則式系統聚焦於文法規則,以及精確的術語應用等等。而比起語法規則,統計式系統更著重於分析資料,從先前翻譯過的資料中找出相應配對,使譯文讀來更為順暢。

學術論文、醫學論文等通常嚴格要求譯文精確度,並講求高可信度。由此,規則式系統翻譯更適合此類文稿。

機器翻譯遭遇的困境

機器翻譯打開了過去因語言對數目不足以應付全球市場,而緊閉的翻譯市場大門。機器翻譯的最大缺點是擺脫不了人類譯者的監看。目前,還沒有可以產出人工翻譯等級文件的電腦程式。有太多的慣用語與俗語、太多的多義詞彙與文化細微差異,這些因素使得機器翻譯讀起來就像是翻譯文章,而非母語作品。

毫無疑問地,機器翻譯造就了翻譯產業的成功,經由電腦科技催生出的語言對數目前所未見之多。但有時候,您只是要傳達一則訊息的要點而已,在這種情況下,您可以藉由機器翻譯的協助,將訊息傳達給全球大眾。然而,當誤差、誤解或誤判可能導致失去合約、嚴重的文化冒犯,或(若發生在醫療狀況)關乎性命時,一篇大致符合原文要旨的譯文是遠遠不夠的。
對於期盼傳達訊息至不斷膨脹的全球市場之企業組織,這塊翻譯市場已然時機成熟。然而不該忽視精通源語和譯語的人類譯者之重要性,以確保訊息準確度,並避免不精確、錯誤或可能造成尷尬及反感的用語。

請發表您的意見評論

您的Email不會被公開

X

請訂閱以繼續閱讀

關於科研寫作和學術出版的文章與學術資源,包括:

  • 820 +文章
  • 50+ 免費線上講座
  • 10+ 專家Podcast
  • 10+ 電子書
  • 10+ 檢查清單
  • 50+ 資訊圖