本站小編為你精心準備了計算機輔助翻譯的核心模塊研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《江漢大學學報》2017年第3期
摘要:機器翻譯和計算機輔助翻譯極大地提高了翻譯效率。在機器翻譯尚不盡如人意的情況下,計算機輔助翻譯作為一種替代手段,成為翻譯人員的一種有效選擇,目前已有諸多商業產品問世。主流的計算機輔助翻譯工具的核心技術是翻譯記憶,其核心模塊是翻譯記憶系統、術語管理系統、對齊工具、翻譯項目管理工具等。立足于計算機輔助翻譯的原理和特點,分析計算機輔助翻譯的核心技術和核心模塊,介紹主流的計算機輔助翻譯軟件,以期對計算機輔助翻譯軟件的使用和推廣提供參考。
關鍵詞:機器翻譯;計算機輔助翻譯;翻譯記憶系統;核心模塊;術語管理;對齊工具;項目管理工具
0引言
在經濟和社會日趨全球化的背景下,翻譯在國際交流中不可缺少。信息時代的發展對各語種的翻譯工作提出了新的要求。由于需要翻譯的各語種文檔大幅增加,傳統的基于人工的翻譯模式不能適應時代的要求。同時,隨著計算機硬件及軟件技術的飛速發展,使得借助計算機的自動或半自動翻譯成為可能。近70年來,計算機翻譯包括機器翻譯和計算機輔助翻譯取得了長足的發展。現階段,基于計算機技術的全自動機器翻譯在原理和技術上尚未取得決定性突破,而與此同時,有人工參與的計算機輔助翻譯則取得了一定的成果。計算機輔助翻譯由機器翻譯發展而來,在翻譯過程中有人工參與,而其終極目標是實現全自動翻譯。基于計算機輔助翻譯的翻譯記憶系統也可用于基于統計和實例的機器翻譯系統。目前,計算機輔助翻譯已有諸多商業性產品問世,如SDLTrados、DéjàVuX、Wordfast、雅信CAT等,這些主流軟件采用的核心技術是翻譯記憶,其主要模塊包括翻譯記憶系統、術語管理系統、對齊工具、翻譯項目管理等。本文對計算機輔助翻譯的核心模塊進行了分析。
1計算機輔助翻譯
在翻譯材料和翻譯過程電子化的過程中,計算機輔助翻譯得到迅速發展,其起源是機器翻譯。計算機輔助翻譯是機器翻譯發展不理想情況下產生的暫時替代工具[1]。計算機輔助翻譯和機器翻譯的主要區別是翻譯工作由誰完成[2]。其一,機器翻譯與計算機輔助翻譯有不同的設計理念。機器翻譯的設計是讓機器完全替代人工翻譯,而計算機輔助翻譯則是由計算機輔助人工或人工輔助計算機完成翻譯。其二,二者應用范圍不同。機器翻譯可應用于重復性較高的文本或基于專業語料庫的文本,如產品說明書等。有些文本翻譯量過大,如網頁等,應用機器翻譯效率較高。文學文本一般不使用機器翻譯。法律文本由于其術語的敏感性,建議采用計算機輔助翻譯。其三,二者的翻譯引擎不同。機器翻譯是基于語法分析和語料庫。計算機輔助翻譯的翻譯引擎可實時存儲翻譯結果到記憶庫,之后可搜索記憶庫,根據匹配結果為翻譯人員提供參考,同時,計算機輔助翻譯提供強大的術語管理功能[3]。
計算機輔助翻譯的核心是翻譯記憶,其基本原理為翻譯記憶+機器翻譯+人工翻譯。計算機輔助翻譯的過程是翻譯人員在翻譯的同時,計算機輔助翻譯軟件在后臺啟用和建立翻譯記憶庫,通過翻譯記憶和數據庫,將源文本和譯文文本儲存起來。如果在翻譯過程中,有重復和相近的術語、短語、詞組、句子出現,通過系統的搜索和對比,為翻譯人員提供相近的翻譯文本,供翻譯人員參考,由翻譯人員決定采用、修改或棄用[3]。由此可見,文本的重復性是計算機輔助翻譯中翻譯記憶的關鍵,只有在重復性較高的文本中,翻譯記憶才能良好地發揮功效。目前,基于翻譯記憶的計算機輔助翻譯軟件已有多種商業化產品,這些軟件工具的問世,極大地改進了翻譯模式,起到了良好的效果。如使用雅信CAT,使翻譯人員的翻譯效率得到了較大提高,傳統的人工翻譯日工作量的瓶頸為5000漢字/天,而翻譯記憶系統可使效率提高一倍,達到10000漢字/天[4]。
2計算機輔助翻譯的核心模塊
計算機輔助翻譯軟件的技術核心是翻譯記憶,其核心模塊是翻譯記憶系統、術語管理系統、翻譯對齊工具、翻譯項目管理工具等。
2.1翻譯記憶
BOWKER[2]認為:翻譯記憶應定義為一種用于儲存原文和譯文的語言數據庫。在此基礎上,BOWKER總結了翻譯記憶的特征為重復利用,并對翻譯記憶的應用范圍做出分析,指出內部重復率高的科技文本和法律文本、外部重復率高的網站、同一領域的文本、更新文本是翻譯軟件的適用范圍,而文學文本不適用。翻譯記憶是將源語言及翻譯后的譯文對照地存入記憶庫中,由此可再利用而翻譯新的源語言。只有在重復性較高的文本中,翻譯記憶才能良好地發揮功效。翻譯記憶的工作原理是將待翻譯片段和數據庫中已有翻譯片段進行比較,在確定匹配率并達到標準時,將譯文提供給翻譯人員參考,翻譯人員可以采用、編輯修改或棄用[4]。
2.2術語管理
術語庫(術語數據庫)是為了利用和管理術語而建立的術語容器,是基于計算機的術語集合。計算機輔助翻譯領域的術語庫可以是雙語或多語對照詞表,并包括相關附屬信息,如定義、學科、詞性等[4-5]。術語庫的目的在于保持翻譯文本中術語的一致性,其工具是術語管理系統,其優勢在于自動和高效地保持翻譯項目中術語翻譯的一致性,不出現一詞多譯[6]。根據術語來源,可將術語表分為來源于客戶、來源于互聯網或來源于原文件整理。在術語表的基礎上就可建立術語庫。術語庫的創建包括導入、創建、實時更新和自動提取。①導入模式:首先利用Excel表格對術語進行整理、編校;然后利用相應工具將Excel格式轉換為術語庫定義文件和術語數據文件;接著創建新的空白的術語庫;最后將術語數據文件導入空白數據庫。②創建模式:在建立的術語庫文件中手動添加術語形成術語庫。③實時更新模式:在翻譯過程中,一邊翻譯,一邊系統會自動添加和修改術語,完成數據庫的實時更新和維護。④自動提取模式:由術語提取工具自動從文檔中提取術語,然而,目前此種方式的準確性還有待于完善[5]。術語管理包括兩層含義,翻譯過程中的術語管理和組織中的術語管理。兩者都包括用戶內部的業務語言標準化過程,包括:確定術語系統的范圍;審查詞匯表,確定核心術語庫;對術語庫進行審核和編輯,部署到譯者和用戶中;為每種目標語言中每個術語確定唯一翻譯;為其他用戶提供權限[4]。目前而言,主流的計算機輔助軟件大多帶有集成的術語管理軟件,此外,還有獨立的術語管理工具,如SDLMultiTerm等。集成式和獨立式工具都可對術語進行管理,集成式使用靈活而獨立式功能強大。總體而言,術語管理是系統化地管理特定領域專業詞匯的活動。
2.3對齊工具
對齊的含義是指將原文和譯文按翻譯單位一一對應匹配。在機器匹配的基礎上需要人工編校,以確保其準確性。對齊的語言單位可以是詞、句等,目前以句子作為對齊單位也比較常見。對齊的結果可以直觀地呈現給翻譯人員。對齊的結果可以輸入到記憶庫,協助擴大翻譯記憶,方便翻譯人員使用[7]。目前,對齊模塊的效果尚不理想,很多計算機輔助翻譯工具對齊模塊的對齊質量有所缺陷,還需要人工編校,其自動化水平尚待提高[8]。
2.4翻譯項目管理系統
2.4.1翻譯項目管理系統
翻譯項目管理是為了滿足翻譯需求,翻譯者依據項目的整體規劃和實際特點而制訂的翻譯方案。翻譯項目管理的要素是:翻譯質量、翻譯時間、翻譯成本。這3個要素是相互作用的。這3個要素也是翻譯項目管理的目的。翻譯項目管理的流程分為譯前、譯中和譯后管理。譯前管理是指項目經理接收相關項目后,依據客戶需求制訂項目章程,對翻譯過程進行規劃,包括項目描述、人員安排、三要素管理等。譯中管理是指在翻譯過程中對翻譯和審校監控,根據情況對翻譯計劃進行調整,進行翻譯中的溝通,確保三要素。譯后管理是指對翻譯項目進行質量評估,包括項目經理對項目質量的檢查和專家對項目的檢查,此外,還應對翻譯團隊做出評估[9]。其具體流程可歸納為:譯前準備(確定文本的基本信息和翻譯需求)、譯前格式處理(語料準備)、項目派發(確定翻譯人員、時間、要求、術語表等)、項目跟蹤(監督、稿件回收、調整計劃)、譯后排版、審校和質控、項目提交、項目總結[10-12]。
2.4.2翻譯項目管理模塊
計算機輔助翻譯的技術核心為翻譯記憶模塊,但翻譯項目管理模塊是確保翻譯項目運行的關鍵。目前,計算機輔助翻譯工具大多具有項目管理工具,可以自動化地完成翻譯項目管理。使用翻譯項目管理工具,翻譯人員可對照記憶庫,對需要翻譯的新內容進行分析,充分發揮翻譯記憶的功能。進而實現人工輔助的自動化和集約化,確保翻譯質量、節約翻譯時間、降低翻譯成本,實現翻譯項目管理的目的。
1)翻譯項目管理模塊的功能。其功能包括:源文本的導入、文本字數和字段分析、預翻譯、審校和質控,目標譯文導出。
2)翻譯項目管理模塊的操作。主要操作為:首先,建立翻譯項目文件夾(管理項目文件、記憶庫文件、術語庫文件、源語言文本、目標語文件);其次,將源文本導入翻譯工具(有可能需要做術語提取和格式轉換);然后,進行翻譯過程(翻譯中可實時與術語庫交流);最后,導出某格式的譯文。某些項目管理模塊有保存功能,可以自動保存、自動匯編、生成翻譯記憶,方便以后的翻譯作業[13]。
3)翻譯項目管理模塊的特性。主要特性如下:與其他內容管理系統一體化;工作流程管理;用戶許可、角色分配與溝通;以網絡為平臺的應用系統;遠距離寫作;支持多種方式提交譯文;提交項目報告;像接收者發送輸出文件;與其他應用軟件的對接[4]。
3常用計算機輔助翻譯軟件
目前,主流計算機輔助翻譯軟件大多具有以上幾種核心模塊,國內使用的商業化的計算機輔助翻譯工具主要有SDLTrados、DéjàVuX、雅信CAT等。互聯網調查發現,國內的SDLTrados市場占有率最高,雅信CAT次之,DéjàVuX再次[14]。英國的SDLTrados專業性強、功能齊備、操作高效,但成本較高,適用于翻譯公司進行專業性強的大型翻譯項目;西班牙的DéjàVuX功能齊備、操作簡單、術語庫和記憶庫可移植性強,有利于團隊合作,適用于團隊協作翻譯;中國的雅信CAT的自帶詞庫、語料庫功能強大、操作較為簡單、效率高,但響應速度慢、格式兼容性一般,適用于初學者和自由譯員。
4結語
目前,主流的計算機輔助翻譯工具大多包括翻譯記憶系統、術語管理系統、翻譯對齊工具、翻譯項目管理工具等核心模塊,對其基本模塊的分析將為計算機輔助翻譯工具的開發、應用、拓展提供理論基礎和實踐方法,為實現自動化翻譯提供思路。
參考文獻(References)
[1]靳光灑.計算機輔助翻譯技術的現狀與發展趨勢論析[J].沈陽工程學院學報(自然科學版),2010,6(3):264-266,280.
[3]陳永智.機器翻譯和計算機輔助翻譯的對比分析[J].現代交際(學術版),2016(18):154-155.
[4]錢多秀,郭麗麗,唐蘭,等.計算機輔助翻譯[M].北京:外語教學與研究出版社,2011.
[5]康寧,尉瑩,曲樂.計算機輔助翻譯環境下術語庫創建、應用與術語管理[J].青島科技大學學報(社會科學版),2015,31(3):107-110.
[6]文軍,錢多秀,孫三軍.翻譯實用手冊[M].北京:外語教學與研究出版社,2010.
[7]王穎,李潔,齊磊.計算機輔助翻譯資源探析:基于數字化翻譯教學資源背景[J].邊疆經濟與文化,2016(6):107-108.
[8]趙禮粉.淺議計算機輔助翻譯的現狀以及發展前景[J].佳木斯職業學院學報,2016(10):350-351.
[9]陳穎.翻譯項目管理初探[J].工業技術與職業教育,2015,13(2):83-85.
[10]陳露.翻譯項目管理淺析[J].文學教育,2014(1):122-123.
[11]王傳英,崔啟亮.本地化行業發展對職業翻譯訓練及執業認證的要求[J].中國翻譯,2010(4):76-79.
[12]顧偉.CAT課程采用翻譯項目管理模式的可行性分析[J].云南社會主義學院學報,2014(1):287-288.
[13]姜瑞紅.淺析計算機輔助翻譯[J].海外英語,2016(1):106-107.
[14]馬艷萍,劉英立.石油裝備科技文獻計算機輔助翻譯記憶庫及服務系統建設方案探討[J].山東化工,2016,45(20):135-136.
作者:陳曠 單位:江漢大學