本站小編為你精心準備了淺析譯員考核中差錯率統計方法參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
摘要:差錯率作為考核譯員譯文質量的重要指標,其數據的單一性讓結論片面,缺乏統計學的意義。因此,有必要綜合利用數據統計和繪圖工具RStudio和EXCEL2007,設計出在三種不同模式下對差錯率進行統計和分析的方法,以實現數據的合理和可靠。
關鍵詞:差錯率RStudio和EXCEL2007統計和分析方法
1引言
不論是在高校內的培養階段,還是在企業、機構內的深化培訓階段,考核譯員或譯者翻譯能力最直接的方法就是評析譯文質量。差錯率指的是“一份文件的翻譯或校對差錯數占該文件總字數的比率”(王林燕、何曉智,2014:84),是現行于翻譯行業的主要譯文評價標準。我國《翻譯服務譯文質量要求》提出:“根據翻譯服務的特點,譯文綜合差錯率不超過1.5‰。”運用這一統計方式,能夠獲得翻譯失誤方面的直觀數據,既可以對單個譯員的能力同行業標準進行比對,也可以用于優化翻譯團隊的管理。盡管這種量化考核結果的方法有著統計學的意義,但差錯率作為單項數據只能提供宏觀的譯文衡量尺度,不但無法在微觀層面對譯文和譯員進行分析,而且評價模式也過于單一。為探尋更為全面和科學的差錯率統計與分析方法,本研究利用主流統計和繪圖工具(RStudio和EXCEL2007),對自建實驗數據進行操作,構建出總體、個體和對比的評價模式。
2差錯率的統計與分析模式設計
單一方式觀察差錯率很難實現全面評估譯員或翻譯團隊,導致產生片面的評價結果,進而影響教師或管理階層的判斷,故設定不同的差錯率統計和分析模式就顯得尤為重要。本研究綜合參考“外語教學與研究出版差錯率計算規范”和“諾貝筆(NoblePen)差錯率計算方法”,設定一種翻譯差錯統計范式,主要包括:誤譯(2)、漏譯(2)、錯別字或拼寫錯誤(1)、用詞不準(1)、搭配不當(1)、觀點錯誤(5)、邏輯不通(2)和語言歐化(2)八種。其中括號內的數字指每次出現該類錯誤所需計入的差錯數。RStudio和EXCEL2007(下文簡稱R和EXCEL)是兩款有著強大的運算、統計和繪圖功能的工具,也是該研究所用的主要軟件。其中,R免費對外開放,“是專門為統計和數據分析開發的技術語言,”還有著“彈性的、互動的環境來分析、可視及展示數據”(譚振江、朱冰,2017:76),而EXCEL則是最常見的數據處理工具,操作相對簡便、易接受,它們各有所長,因而要綜合使用。經過研究,筆者設計出總體評估、個體評估和對比評估三種模式,以期形成一個從個體到團體的評價體系。
3不同模式下的操作及分析
R和EXCEL的優勢之處無需贅言,本研究也不針對軟件的基本操作進行說明,只討論該研究所涉及的操作步驟。總體評估模式下,主要展現差錯率數值的整體分布和曲線走勢,從而分析單次考核中,班級或團隊的整體水平;在個體評估模式下,更多地針對單獨譯員或差錯類型進行分析;對比評估模式下,則注重對同類數據進行比較以得出結論。
3.1總體評估
若將差錯率總體布局通過可視的圖形表現出來,最好使用R的繪圖功能。雖然EXCEL也能繪制出諸如直方圖一類的圖形,但R的優勢在于功能更多樣,能夠滿足操作者個性化的需求,比如在圖形之上增加曲線。以15名譯員(閆一、郭七、李十一,等)差錯率的數據為例,可繪制直方圖并加入密度曲線。實驗數據中這些譯員的差錯率分布可用圖展示,藍線為密度曲線。假定差錯率低于0.020為優秀,依圖可見這些譯員的差錯率集中于小數值區域(0.010到0.015之間),曲線由低數值到高數值呈走低的態勢,表明他們在本次考核中,整體表現良好,展現出較高的水平。該圖一方面讓教學或培訓人員直觀地獲取考核結果的分布數據和走勢,另一方面還能夠輔助他們結合更多外部條件,如文本類型,分析其背后的原因。如果這些譯員同處于一個翻譯培訓班級,通過繪制圖形和計算相關數據,觀察考核結果是否呈正態分布就有著重要的意義。R環境下將圖示法和運算法結合起來,可以更為直觀地、可靠地觀察數據的正態分布性。具體操作步驟是:a.正態分布圖示法;b.峰度和偏度檢驗,峰度檢驗值-1.055837,偏度檢驗值0.5488924;c.Shapiro-Wilk檢驗法,俗稱W檢驗,W=0.91615,P-Value=0.1682。以上操作過程中,步驟a屬于圖示法,而步驟b和步驟c為運算法。在步驟a中,紅色虛線為差錯率的理想正態分布曲線,藍色實線為密度曲線。此次考核的結果并未呈現出正態分布,但通過觀察步驟b所得的峰度值和偏度值(-1.055837和0.05488924),發現數據接近正態分布。步驟C運用Shapiro-Wilk檢驗法,計算所得p-value值為0.1682,明顯大于0.05,故差錯率服從正態分布。再次觀察步驟a中繪制的兩條曲線,發現問題在于橫坐標的間距較大,而數值差很小,因此影響了視覺判斷。因此,翻譯教學者應綜合計算數值,再下定結論。另一方面,差錯率服從正態分布,說明本次考核結果與譯員的實際水平一致,可以為今后的考核提供借鑒意義。差錯率的高低體現著譯員在本次考核中所展現的翻譯能力,教學人員或管理者會據此進行水平區分,以觀察團隊的整體翻譯水平。按照一定標準對差錯率進行等級劃分,如本例劃分為“R<0.020”“0.020≤R<0.025”“0.025≤R<0.030”和“R≥0.030”四個檔次。再根據所劃分的檔次,利用EXCEL的“COUNTIF”和“COUNTIFS”函數,便可計算出相應的人數。最后運用其繪圖功能,就可以得到直觀的統計圖形。根據統計數據和餅狀圖顯示,差錯率低于0.020的人數近半數,占據主導。如果將0.020設為優秀,則可以說明本次考核中,該團隊表現優異。團隊的管理者可據此觀察這些譯員的水平是否出現兩極分化,以便及時進行調整。
3.2個體評估
個體評估的模式并非只關注某個譯員的差錯率,而是每次運算或繪圖的目的在于研究某個譯員或者某類差錯類型。首先,選取某位譯員的考核結果為數據,以譯員“李十一”的成績為例,利用R繪制柱形,將譯員的翻譯差錯類型和數量更直觀地呈現。柱形圖有助于更為全面地分析某位譯員,而不是單純地依靠差錯率的數值進行判斷。本次考核中李十一的主要翻譯差錯集中于用詞不準、搭配不當和邏輯不同,但沒有出現漏譯和觀點錯誤。在翻譯教學方面,教師可根據這一結論幫助其進行提高;在團隊管理方面,可以由此判斷譯員是否能夠勝任某些文本的翻譯任務。同時,對某種差錯類型進行相關系數的計算和顯著性檢驗,可以明確那種差錯與差錯率有著顯著的相關。經過研究,運用R計算等級相關系數來進行顯著性檢驗,較之于積差相關系數矩陣的顯著性檢驗,不用考慮分界點的問題,效率更高。下面以誤譯和觀點錯位為例,檢驗誤譯和差錯率的等級相關,結果顯示:誤譯等級相關系數0.2369242,觀點錯誤等級相關系數0.6449018,誤譯與差錯率的P值為0.3952,遠高于0.01,說明二者不存在相關性;觀點錯誤和差錯率的P值則為0.009436,低于0.01,說明二者顯著相關。等級相關系數雖操作更為繁雜,每條結論的得出都需要單獨運算,但結果更為直接、簡單。還可以用R將以上述等級相關的運算結果進行圖形化,并以多圖同框的形式呈現出來。通過散點圖和曲線的結合,可以明顯觀察到觀點錯誤與差錯率有著顯著的相關性,另外兩類則不具備顯著相關,同上述計算結果所得結論一致。由于差錯類型的賦值存在差異,加之并非所有差錯類型都與差錯率相關,因而差錯率的高低也不能直接體現譯員的水平。通過計算“標準分”,可檢驗其是否與差錯率的結果一致。標準分是一種用途廣泛的統計量,指“以標準差為單位標定某一分數離開團體均數的距離”,最常用的是Z分數。利用EXCEL可以輕松完成這一運算,以譯員的相關數據為例進行運算,可以得出相應結果。在一般情況下,檢驗考核結果能否確實反應譯員間的差距,主要選取幾位成績相近的人進行分析。在前面分析中,K列的數據為所有譯員的考核標準分,假設挑選本次考核差錯率最低的張六進行分析,發現其Z分數確實也是最低的,而且略低于成績相近的鄭十二和歐陽十。由此說明,本次考核的差錯率能夠反映出譯員間能力的差異。除了整體評估和個體評估的模式,對比評估模式也是必不可少的一環。
3.3對比評估
對比評估模式下主要完成的是變量間的差異性檢驗,既可以進行針對全體譯員的總體對比評價,也可以對某兩個單獨的個體進行對比評價,還可以通過圖示將對比的結果圖形化。利用EXCEL數據分析工具或R語言的均值檢驗(t檢驗)皆可完成對比評估的相關操作和數據統計,但受限于R的檢驗方式,如樣本所在的總體必須是正態分布的總體,所以EXCEL工具更為簡便。
4結語
差錯率作為一項經過簡單運算后得出的數據,作為評價譯員的依據既單一、片面,在很多時候也缺乏統計學的意義。本研究綜合應用數據統計和繪圖工具R和EXCEL,結合實驗數據,創建出一套系統性的差錯率統計和分析方法。在該系統內,操作者可根據譯員的考核結果,在總體評估、個體評估和對比評估三種模式下根據自身需要整理數據,并根據統計結果全面地、詳細地觀察譯員在考核中的表現,幫助自己調整教學計劃或者團隊管理決策。
參考文獻
[1]譚振江,朱冰.基于R語言的學生成績分析[J].智能計算機與應用,2017(7):76-82.
[2]王隆文.實用文獻譯文如何使用“1.5‰綜合差錯率”規定[J].中國翻譯,2013(5):66-69.
作者:張翰旭 單位:浙江師范大學外國語學院