(武漢航海職業(yè)技術(shù)學(xué)院,武漢 430062)
為了提高我國船員的英語水平,適應(yīng)STCW公約的要求,國家海事局從1997年開始對所有參加二/三副、二/三管輪以上船員適任證書考試的人員增加航海英語聽力與會話評估考試,這一措施在一定程度上推動了船員的英語學(xué)習(xí)。但是相對于較高的通過率,中國船員的英語水平,尤其是口語水平并未得到根本性的提高。不少專家認為,這一結(jié)果與評估考試的反撥作用導(dǎo)致的應(yīng)試傾向有關(guān)。筆者認為,缺乏對航海英語口語測試的理論和實踐的研究,缺乏科學(xué)的測試體系,是導(dǎo)致以應(yīng)試為中心的一個根本原因。筆者通過對任務(wù)型口語測試的理論探討,結(jié)合航海英語口語的特點,分析影響航海英語口語測試信度和效度的因素,提出建立基于任務(wù)型的航海英語口語測試體系。
從20世紀90年代開始,語言交際能力理論的提出不但促進了交際法語言教學(xué),還使交際性語言測試的理論和實踐得到語言教育界認同。交際法語言測試的目的就是要評價語言學(xué)習(xí)者在真實且有意義的交際語境中運用語言的實際能力。
任務(wù)型語言測試基于交際語言能力測試理論,任務(wù)型語言測試通過任務(wù)型試題來有效地提取考生完成交際活動時目的語運用的樣本,通過考生在完成交際任務(wù)中的語言運用情況來推測出測試環(huán)境之外的考生實際語言運用的能力。因此,任務(wù)型測試的核心是任務(wù),測試項目的選擇和編寫均應(yīng)以任務(wù)為基本單位。測試中使用的任務(wù)應(yīng)是“現(xiàn)實生活中使用的語言任務(wù)的取樣”,[1]其特征必須和實際生活中的語言運用任務(wù)特征相一致。
(1)任務(wù)的真實性。Bachman提出應(yīng)該從以下兩個方面來定義測試任務(wù)的真實性:情景真實性和交際真實性。[2]所謂情景真實性,就是指測試方法特征與某一特定目的語使用的情景特征相關(guān)的程度。也就是說,在命制考題時,考試任務(wù)的特征必須與將來目的語使用的情景特征相一致。而交際真實性指的是考生在完成某一測試任務(wù)時,其語言交際能力的哪些方面參與完成該測試任務(wù),參與的程度如何。
(2)任務(wù)的難度。為了真實公平地評價應(yīng)試者的語言交際能力,即提高口語測試的效度,對同一被試群體測試所選擇的任務(wù)應(yīng)該處于相同的難度級別。但是關(guān)于任務(wù)難度的描述和定義在測試界迄今仍沒有很完善的說法。
為探究任務(wù)在任務(wù)型評價中如何用來評價學(xué)習(xí)者的語言運用能力以及任務(wù)的作用,首先要對“任務(wù)”的概念進行界定。Bygates、Skehan和Swain認為,假如測試是在語言教育的范疇內(nèi),那么,“任務(wù)即是一種活動,這種活動需要學(xué)習(xí)者注意意義,并通過語言的活動達到某個目的。同時,這種活動很有可能會提供給教師和學(xué)習(xí)者一些有助于教學(xué)的信息”[3]。該定義反映了任務(wù)目的的兩重性,一是任務(wù)本身所包含的非語言學(xué)習(xí)目的,二是任務(wù)設(shè)計者所期望任務(wù)參與者達到的語言學(xué)習(xí)目的。
Crookes通過觀察學(xué)生在課堂上完成各類任務(wù)的行為表現(xiàn)列舉了5種可能引起任務(wù)難度的因素:(1)完成任務(wù)所需的步驟;(2)參與完成任務(wù)的各方;(3)完成任務(wù)所需的知識;(4)任務(wù)對于智力的挑戰(zhàn)性;(5)空間-時間間距。他提出從兩個方面對任務(wù)進行分類:(1)根據(jù)任務(wù)特點的描述:任務(wù)目標,語言輸入刺激,完成任務(wù)步驟,回應(yīng)及刺激-回應(yīng)間的關(guān)系;(2)根據(jù)任務(wù)對人的能力要求。根據(jù)綜合能力要求和任務(wù)特點而確定的任務(wù)難度就代表任務(wù)的分類[4]。因此,在設(shè)計任務(wù)型測試時,除盡量保持測試任務(wù)與真實的交際任務(wù)一致性外,更重要的是要對任務(wù)難度有明確的描述分級。
(1)口語測試的類別。在日常教學(xué)中,按照學(xué)習(xí)階段來分階段性測試,如隨堂測試和期中、期末測試等。同時,這些測試也可用來考查學(xué)生對所學(xué)知識的掌握,可以當(dāng)做成績測試。水平測試則用來測試學(xué)生的語言能力,看其是否達到某一水平,從而決定其是否勝任某一項工作。這種測試與過去的教學(xué)內(nèi)容和學(xué)習(xí)方式?jīng)]有直接聯(lián)系。從這個意義上來講,海事局舉辦的航海英語聽力與會話評估測試應(yīng)當(dāng)屬于水平測試。
(2)口語測試的方法。口語測試的方法有直接型口試(OPI),即通過應(yīng)試者說話來評判其口語交際能力,其考試形式有多種,如面試、會話、討論等。直接型口試方法是根據(jù)考生的表現(xiàn)直接進行評分。在一些大規(guī)模考試中,由于考生多、考官少,做不到直接對所有的考生進行口試,于是采取半直接型口試(SOPI),即把事先準備的問題錄制在磁帶或光盤上,讓考生根據(jù)磁帶或光盤上的提問或其他的要求回答問題,或描述一個話題,并將回答錄制成磁帶或光盤,然后由考官根據(jù)考生的錄制結(jié)果進行評分。目前,海事局的航海英語聽力與會話評估采用的就是這種半直接型口試。
(3)口語測試的評分標準??谡Z測試評分標準的作用在于保證測試能夠準確、公正地測試出考生目的語運用的能力,即考試的效度;保證考官評分的一致性,即考試的信度。評分標準主要涉及考生話語輸出的準確性、 流利性、 適切性以及口語交際的互動性。評分方法主要分為分析法和綜合法。標準化口語測試通常采用分析法和綜合法相結(jié)合的方法進行評分。
分析法是把口語分解成若干要素,如語法、內(nèi)容、語音語調(diào)、流利程度、準確度、詞匯等,評分人員根據(jù)一定的標準對不同的要素(可做不同的加權(quán)處理)分別打分,各要素得分總和即為總分。綜合法是評分人員根據(jù)一定的標準,憑總體印象給考生打分。綜合法能從整體上把握考生口語表現(xiàn),效度比較高;分析法注重口語的各組成要素,更為客觀一些,信度較高。因此,一些大規(guī)模標準化口語測試,如劍橋大學(xué)考試委員會的口語測試,都是采用分析法和綜合法相結(jié)合的方法來評分,既保持總體印象又不忽視口語的各個要素。
Ellis和Johnson曾討論過作為特殊用途的商務(wù)英語的特點有目的性、跨文化交際性和準確交流性。[5]其實,同樣作為特殊用途的航海英語口語也有類似的特點:其一,很強的目的性。航海英語使用者的目的是完成某項任務(wù),達到某個目的而非僅僅學(xué)習(xí)使用這種語言。其二,航海英語同樣面臨跨文化交際,要能讓來自不同文化背景、不同母語的人愉快地理解、接受、交流,必須要掌握能為不同文化所共同認可的禮貌的說話方式,即跨文化的交際策略。其三,作為工作用語,清晰準確的交流是必需的。 根據(jù)航海英語口語的特點,采用任務(wù)型測試能比較真實地測試被試者在航海作業(yè)中的英語口語交際水平。
就任務(wù)型試題的真實性來講,航海英語口語測試應(yīng)以真實的駕駛員日常工作和環(huán)境為基礎(chǔ),提煉出常見且典型的語言交際的任務(wù)模塊。任務(wù)型測試的難點在于如何判定測試任務(wù)的難度?,F(xiàn)有的航海英語聽說教材或?qū)W習(xí)資料,大部分只按駕駛員的工作流程羅列出一些駕駛員的工作,還有一部分是把完成各種任務(wù)可能用到的句子羅列出來,如標準海事通信用語,即只有任務(wù)內(nèi)容,沒有任務(wù)難度的分級。雖然目前航海英語口語評估題庫按駕駛員職務(wù)不同對試題進行了簡單區(qū)分,但這種區(qū)分很粗糙,仍然缺乏針對性和區(qū)分度。根據(jù)Crookes 的任務(wù)分類法,從任務(wù)自身的特點和對被試者的能力要求來區(qū)分任務(wù)難度,以下從任務(wù)目標、語言輸入刺激、完成任務(wù)步驟等幾個方面來分析這些因素對航海英語口語任務(wù)型測試的任務(wù)難度的影響。
(1)任務(wù)目標:任務(wù)型口語測試的任務(wù)目標不同于實際工作中的任務(wù)目標。因為這個目標不僅關(guān)注是否能完成實際任務(wù),還關(guān)注在完成實際任務(wù)過程中語言使用的目標是否達到。比如向接班駕駛員交班,交班駕駛員要交接清楚船況、設(shè)備狀況、無線電、氣象、船長命令等內(nèi)容,任務(wù)涉及的專業(yè)內(nèi)容比較多。相比較申請破冰援助,駕駛員要說明船況、船位、表示申請援助等,專業(yè)內(nèi)容相對較少,因此,前者的難度可能要大于后者。
(2)語言輸入刺激:測試時,輸入內(nèi)容(熟悉或不熟悉)、語言輸入的方式(口頭或書面)、語篇的長度、語篇中低頻詞出現(xiàn)的比例、口頭輸入時說話者的語速和口音等因素,可能都會影響到任務(wù)難度。如同樣是回答問題,一般來講,以howwhy開頭的問題要比whatwhenwhere,或一般疑問句的問題回答起來要困難一些。同樣是回答whatwhenwhere開頭的問題,如果是問被試者熟悉的個人情況,就比詢問專業(yè)情況更容易。
(3)完成任務(wù)步驟:任務(wù)步驟從另外一個方面反映任務(wù)的復(fù)雜性。但是,在現(xiàn)有的口試測試方式中,只有直接測試才可能涉及任務(wù)步驟,才有互動和話語的轉(zhuǎn)換,而在半直接或間接測試方式中,被試者只是回答或描述說明。因此,完成任務(wù)步驟,只存在于直接測試的方法中,可能對任務(wù)難度造成影響。在直接測試的方法中,完成任務(wù)步驟越多,被試者所需交流的話語轉(zhuǎn)換就會越多,需要較強的語言交流能力和交際策略。因此,任務(wù)難度有可能更大一些。
目前的航海英語口語評估測試已經(jīng)被不少專家質(zhì)疑,主要問題是針對口語評估測試的信度和效度。就效度而言,目前的航海英語口語測試,題庫內(nèi)容少,題型單一,試題缺乏難度分級,考試內(nèi)容過多關(guān)注專業(yè)內(nèi)容,而缺乏對考生的語言應(yīng)用能力的考查,考試的方法均為人機對話,因此所得結(jié)果很難準確反映考生專業(yè)英語的口語交際能力;在考試信度方面,沒有明確統(tǒng)一的評分標準,各位評分員各自為政,無法保證信度。而且,這種評估測試帶來的反撥作用是一種應(yīng)試的傾向,不利于引導(dǎo)學(xué)生在人際交往中培養(yǎng)交際能力。
為了提高航海英語口語測試的信度和效度,促進被試者真正提高語言交際能力,建立一個完善科學(xué)的測試體系是非常必要的。這種測試體系必須具有可信度、有效性和可行性??尚哦戎副辉囌咴隗w系內(nèi)的不同次的測試,結(jié)果應(yīng)該是相同或相近的;有效性指測試的結(jié)果可以反映測試的意圖或目的;可行性指測試的可操作性和它對教學(xué)的指導(dǎo)和促進作用。這個測試體系應(yīng)該包括考試大綱、試題庫、評分標準以及相關(guān)的試題庫管理軟件。體系不僅關(guān)注最終的國家海事局的水平評估測試,還要對平時教學(xué)的階段性測試有相應(yīng)的描述。
考試大綱可分為階段性測試大綱和終結(jié)性水平測試大綱。階段性測試大綱與教學(xué)大綱、教學(xué)過程密切相關(guān),包括階段性測試的目標、內(nèi)容、方法和評價標準。終結(jié)性水平測試大綱與職業(yè)要求的語言水平緊密相關(guān),而與學(xué)習(xí)者的學(xué)習(xí)背景沒有直接關(guān)系。在描述測試目標時,應(yīng)從知識、能力、素質(zhì)等方面全面考慮。考試方法應(yīng)采用可全面測試被試者綜合語言能力的任務(wù)型測試法??谡Z測試的方式應(yīng)盡量結(jié)合航海英語口語的特點采用直接型口試。
口語試題庫的設(shè)計需考慮試題內(nèi)容、題型和難度分級。試題內(nèi)容除滿足STCW公約的要求外,還要根據(jù)船舶駕駛員不同職務(wù)、不同專業(yè)內(nèi)容進行分類,保證試題覆蓋面的全面性,同時又有針對性和區(qū)分度。試題的題型設(shè)計要提供真實的交際任務(wù),能夠全面考察被試者的綜合能力包括語言知識、技能和交際策略。所有試題應(yīng)該進行難度分級,難度分級要結(jié)合試題任務(wù)本身的特點和對被試者的能力要求。
口語測試的評分標準主要涉及考生話語輸出的準確性、流利性、適切性以及口語交際的互動性。平時階段性測試可采用分析法評分,能夠較準確判斷學(xué)生在交際中的問題。對大規(guī)模的考試可采用分析法和綜合法相結(jié)合,重要的是對所有評分員進行評分標準的培訓(xùn),針對幾種典型答題,根據(jù)評分標準首先進行試評估,以保證評估員對評分標準的統(tǒng)一理解,盡量縮小評估員個體之間差異。
作為一種職業(yè)語言能力的考核,航海英語口語測試應(yīng)該著重于對航海英語在駕駛員工作中的運用能力的考核。建立任務(wù)型的測試體系不僅有利于準確考核被試者的實際語言運用能力,其反撥作用也可以促進航海英語口語教學(xué)朝著培養(yǎng)學(xué)生語言交際能力的方向發(fā)展。
[1]韓寶成.語言測試的新進展:基于任務(wù)的語言測試[J].外語教學(xué)與研究,2003(5):352-358.
[2]陳 菁.從Bachman交際法語言測試理論模式看口譯測試中的重要因素[J].中國翻譯,2002(1):50-52.
[3]ELLIS R.Task-based language learning and teaching[M].Oxford: Oxford University Press,2003.
[4]NORRIS J M,BROWN J D,HUDSON T D.Examinee abilities and difficulty in task-based second language performance assessment[J].Language Testing,1986,19(4):395-418.
[5]ELLIS Mark,JOHNSON C.商務(wù)英語教學(xué)[M].上海:上海外語教育出版社,2002.