無論您的專案字數是一百、十萬或上百萬字,一份精準的譯文絕對是您追求的終極目標。想當然爾,您希望翻譯能以最快的速度、最低的價格完成。對許多專案來說,在翻譯開始前先行對文章進行術語抽取,有助於您實現這些理想。
在文章交由翻譯之前,可從正文抽取術語,使譯者得以建立特定語言,甚至特定作業的詞彙表或翻譯記憶資料庫。如此不僅可大大提高翻譯速度,也可降低專案的開支。
術語抽取的類型
術語抽取(term extraction)分為手動與自動兩種主要類型。手動術語抽取,是由譯者仔細看過正文、目錄文字後進行翻譯。而自動術語抽取,則是由電腦掃描文件,根據預設的參數快速且高效地抽取單字或片語。
您可能會發現,這兩種系統各有其優缺點。自動術語抽取似乎是不二之選,然而,它有一些嚴重的侷限性。舉例來說,電腦抽取術語時無法限制詞性(名詞、動詞、形容詞等)或語境。若您想找「跑」這個字,無論它的用法為何,都會被電腦抽取出來。
自動術語抽取經常與電腦翻譯「尋找與取代」這一特點結合。然而,像是尋找並取代「跑」這一字時,您的文章極有可能會瞬間充滿錯誤。在此情況下,一字具有多種未經定義的詞性變化,自動術語抽取即使在建立了術語庫或詞彙表後,幫助仍相當有限。
另一種與自動術語抽取器有些微差異的功能為用語索引(concordance)。用語索引軟體抽取特定術語的全部用法,並顯示在其相關的段落旁。這讓譯者更容易確定詞性與語境,方便他們在應用機器翻譯之前,更新翻譯記憶資料庫。
請注意,自動術語抽取與用語索引兩者皆需要人工分類術語,以區分單字與片語的種種變體與形式。
手動術語抽取有明顯的優勢。抽取術語的人可從上下文脈絡中觀察文字用法,並可同時給出適切的翻譯。人工審閱文件中的每個文字,與手動翻譯的原則大致相同,但前者可或多或少地節省一些時間。
一般來說,選用何種術語抽取類型取決於文章的長度。對於篇幅較短的文章,往往優先考慮手動術語抽取。而針對較長篇幅的文章,電腦作業後搭配人工譯後編修,通常會更有效率。
以術語抽取提升翻譯效益
若是術語抽取的效益不太明顯,不妨考慮下列幾項因素:
• 可將整份文件迅速有效地更新為譯文當地術語。
• 可將特定語言的術語翻譯有效地分配至一份文件。想想墨西哥語與安達盧西亞西班牙語之間的差異。若譯者知道他們尋找的特定片語或單字(西班牙語翻譯專家會知道),他們即可快速抽取那些術語、更新詞彙表或翻譯記憶資料庫,以改善該文件的翻譯內容。
• 可將特定專案語言抽出並更新至詞彙表。若作者沒有提供那些可能不在標準詞彙表內的詞彙列表,使用自動術語抽取會將它們一一找出,由此提供譯者一份需要翻譯的專用單字或片語。
在今日,大部分的商業翻譯與在地化專案項目在進行時,皆缺乏全面性、針對特定專案的最新詞彙表。一些可能包含於專案,但不在標準詞彙表中的重要資訊為:
客戶企業名稱 產品名稱 商標
慣用語措辭 新詞彙 行話
此外,想想看那些可能在醫學或科學期刊、論文和書籍中發現的新基因、化學化合物、藥物等等名稱的數目。用來解釋新資訊所創建的新訊息與新詞彙的數量,其增長速度連商業資料庫也望塵莫及。用語索引將可協助抽取這些詞彙以供翻譯使用。
有一些術語可能極度關鍵,若翻譯時出了錯,不僅導致局面嚴重尷尬,亦會造成整個專案失敗、失去合約,甚至失去公眾信任與聲望。從上下文來理解文章中的每一處細節,有助於確保翻譯適切妥當。
在翻譯作業開始之前先行抽取術語,能將使用率高的單字片語、新詞彙片語,以及關鍵的術語抽離出來。術語抽取同時也有助於整個翻譯團隊採取相同的翻譯手法,並使用統一詞彙。這不僅改善了文件或專案翻譯的整體流程,也節省了譯後編修與校正所需的時間。