本站小編為你精心準備了美國教育問責評價模式探究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《外國教育研究雜志》2014年第八期
(一)狀態模型狀態模型(StatusModel,簡稱SM)也稱為成就模型,是NCLB中實現AYP的要求之一。各州通過年度考試成績測算特定分群(designatedgroups)的學生是否達到熟練標準,若學校中各分群學生的熟練人數比例超過各州設定的年度測算目標(AnnualMea⁃surableObjective,簡稱AMO),則該校達到當年的AYP。各州普遍采用2001-2002年數據設定學生達到熟練標準的初始比例,即AYP的原點,并以此設定逐年增長的預期目標,最終在2014年達到100%。根據法令,所有獲得聯邦政府TitleⅠ資助的學校/學區若連續兩年AYP不達標則應采取改善措施,如提供學生轉學的機會,加大學生課后輔導等,該校/區須預留TitleⅠ資助款項的20%用于改善項目,并向學區/州提交該校/區改善計劃。同時,雖然法令要求各州減小不同學生之間的學業成就差距,但并未對每年的實施過程和目標做出規定,各州的AMO設定是靈活的,有的州采用線性增長的方式,而有的州則是采用邊際增長量遞增的方式。同時,各州可對不同學生設定年度分群目標實現共同達標。在狀態模型中,學校要達到AYP需要滿足幾個條件。首先,學校必須有至少95%的NCLB報告分群學生參加閱讀(或語言藝術)及數學考試。NCLB報告分群包括了全體學生以及主要的種族子群、特殊教育學生、英語不利學生以及低收入家庭學生。若一個報告分群的全學年學生人數無法達到樣本量最小值n,則該分群可以不參與聯邦問責。大多數州將全學年定為每年秋季招生開始到春季考試結束的這段時期,并將分群的最小樣本量n定為0~50之間(如伊利諾伊州規定每組不少于45人)。其次,在每個合格的報告分群中,考試分數達到熟練標準的學生比例必須符合或超出年度測算目標,且必須保證一定的出勤率(小學)和畢業率(高中)。若有任何一個子群不合格,則整個學校當年AYP不合格。為降低學校不通過AYP的誤判率,法案為那些最終未能達標但有顯著學業進步的學校提供了一條額外的達標路徑,稱為改進式狀態模型或安全港(SafeHarbor)。該模型中,若學校無法達到本年度AMO,但在去年x%的達標率基礎上使10%的不合格學生達標,即達標學生比率能達到[10%(100-x)+x]%,則該校可認定為當年AYP合格。同時,各州還采取了一些額外措施:有的州對分群達標率采用置信區間表達,將上限設為AMO值。當置信區間的最大值高于AMO,則該子群可認定為通過AYP。有的州將分群學生幾年的平均考試成績與AMO平均成績進行對比,以此認定合格。有的州則在安全港模式中采用前幾年的平均不合格率的10%作為參照。
(二)增長模型根據美國州首席教育官員理事會(CCSSO)的解釋,問責增長模型是指通過跟蹤同一學生年度學業成就變化從而測算學生是否取得學業進步的一種教育問責模型。[3]相對于狀態模型對學生達到熟練比例的一年一測,增長模型(GrowthModel,簡稱GM)注重的是學生成就的變化過程。其可以是采取學生平均成績對學校和分群進行評測,或是通過具體信息對單個學生成就變化進行評估。為確保各州能設立年度增長目標,跟蹤每一個學生情況并測算學業進步,最終實現2014年人人達標,聯邦教育部提出了增長模型的七個核心原則:1)確保全體學生在2014年以前能達到學業熟練標準,為取消分群學生之間的差距設定年度目標;2)年度預期增長量不能基于學生的背景或學校的特點,而是基于統一的年級熟練標準;3)明確是對學校學生閱讀(或語言藝術)和數學學業成就的問責;4)確保被測年級的所有學生都參加問責和測評,確保對所有學校和學區中每一個學生分群的學業成就進行問責;5)測試系統必須有一年以上的運行史和NCLB同行評審過程的審核,并包括3~8年級以及高中的閱讀(或語言藝術)和數學,具備對不同年級或年代的測試結果進行比較的功能;6)州數據系統必須能跟蹤學生學業進展;7)各州問責系統必須包括學生出席考試率以及其他相關學業問責指標。[4]為此,增長模型通常在結構上具備六個要素:1)特定的州際學生身份號。每位學生綁定伴隨其成長的州際學生號及對應數據單元,以此實現每位學生的學業跟蹤;2)能對同一名學生在不同年級和不同時段進行縱向比較,這需要對年度的考試分數進行調節測算;3)能收集學生入學水平、人口背景以及學校背景信息;4)能收集不參加年度測算的學生信息,確保參與測算的學生數量及有效性;5)能收集學生畢業水平以及輟學率信息;6)能對數據的質量、信效度進行審查的州際審計系統。[5]美國教育問責增長評價模型類型表現各異,但核心都是通過設定學生的年度增長目標確保學生在規定的時間段內處在達標的“軌道”上,通常分為三種基本模型,即軌跡模型、變遷矩陣模型以及映射模型。
1.軌跡模型(TrajectoryModel)軌跡模型亦稱為增長達標模型,該模型通過未來幾年中學生基礎考試分值與學業成就標準的差距測算出該學生達標所需的增長量。學業的增長軌跡被分化設定為每年的年度增長目標,學校在預定年限中努力使學生沿著學業增長軌跡達到學業熟練標準。在AYP測評中,雖然一些學校在最初幾年都未能達到州的熟練標準比例AMO,但是其學生考分達到了年度增長目標,則也可認定為通過AYP。該模型受到許多州的推崇,包括阿拉斯加州、亞利桑那州、阿肯色州、佛羅里達州等。如圖2所示,豎軸代表學生學業成就的垂直排列范圍,橫軸則代表學生學習年級。每個實心點代表每段時期的學生熟練標準,每個空心點則代表學生在同一時期的實際學業成就。在3年級時,該生的成績為d,未能達到熟練標準c,不同于狀態模型中該生在8年級達到熟練標準a之前都將被認定為不合格,學生在軌跡模型中沿著自己的增長軌跡表明“在軌”達標,即從4年級s1到8年級p3的發展軌跡中,學生在6年級時若達到成績d+2(a-d)(/8-4),即s2增長軌跡點則可認定為該年度達標。值得注意的是,軌跡模型的學生學業標準軌跡(實心點)大部分州設定是線性的,即熟練標準年度增長相等,少數州如阿肯色州則采用非線性增長標準。
2.變遷矩陣模型(TransitionMatrixModel)該模型將學業成就劃分為許多等級并以此測算學生每年的學業進展。這些公共的成就等級對應所有年級,如不熟練、熟練、高級。從低到高的等級變遷反映了學生的學業增長。州政府通過實施該模型生成學校、學區以及州的問責報告,目前,使用這種模型的州有德拉華州、衣阿華州以及密西根州等。以下通過衣阿華州和德拉華州進行案例說明。如表1所示,衣阿華州第一年學業成就不達標的學生(熟練及以上為達標)若在第二年學業成就提升一個等級以上,那么該生被認定為“在軌”達標。同時,所有在第一年就達到學業熟練標準的學生若能繼續在第二年保持,則也認定為“在軌”達標。德拉華州采用的模式與衣阿華州大體相同,不同之處在于采用了一套分值系統,如表1括號中顯示,每位學生只有在第二年達到3~5熟練級才獲得最高分值300分,學業基礎處于1-2級這四個等級的學生,即使沒有通過熟練標準,仍能通過一定的學業進步獲得增長加權分值。[7]這樣學校或分群的年度測評可通過學生的平均增長量與年度增長目標進行比對獲得。3.映射模型(ProjectionModel)映射模型是采用統計學方法對學生當前和過去的分數進行分析預測,映射出未來某時段的學業成就。值得注意的是,與利用學生當前成績與未來熟練標準測算增長軌跡并設定年度增長目標的軌跡模型不同,該模型使用的是全州統一的年度熟練標準,利用學生當前成績與過去達標學生成績進行多元回歸的多重分值測算,當映射出的結果等于或大于該時段的熟練標準,則該學生認定為“在軌”達標。
如圖3所示,實心點代表每個時段的學業熟練標準,而空心點則代表學生每個時段的實際成績,圖中的實線是系統根據學生的當前學業成績以及過去的達標學生增長量測算出的映射軌跡,盡管在5年級時,學生成績s3并未達到p3標準,但是由于從映射軌跡的延長虛線可以預測出該生能在6年級高出標準p4,則該生可被認定為“在軌”達標。[9]
二、美國義務教育問責評價模型的特點
狀態模型與增長模型各有優劣且相互補充,最終共同服務于問責目標的實現。首先,狀態評價模型架構確保了學校對其學生是否達標有責可問,前美國教育部副秘書長雷蒙德(RaymondSimon)曾表示:“我們認為涵蓋了全體學生的測試,學生分群式問責以及100%熟練目標的州問責系統是一個偉大的進步,我們要繼續堅持下去甚至進一步深化。”[10]SM的一個核心前提就是:無論背景、出身,所有學生都是可被教育并能達到州設立的學業熟練標準的。同時,相較于增長模型,狀態模型更為經濟易懂,不僅降低了相關技術的培訓成本,還加大了政府決策者和公眾理解和問責的清晰度。但是,使用狀態模型來評判學校效能也遭到一定質疑。首先,由于高學業成就基礎的學生更容易達到熟練標準,許多學者認為使用狀態模型進行學校問責更多考察的是學生的人口背景而非學校教育的效能。“基于學生學業成就的狀態評價是對那些教育處于不利地位學生學校的不公正,這種不公正的評價事實有悖于NCLB提出的減少不同種族、社會經濟背景學生間學業差距的目標。在一個公正、公平的系統下,學校是否能獲得高評分不應取決于其接收的學生類型。”
其次,不同學生群體之間進行狀態模型比較的評估存在效度問題。賓夕法尼亞大學的希奧多爾(Theodore)認為NCLB提出的年度進步指標是針對不同群體的測評,就好比用蘋果與橘子進行比較評估,無法有效檢測出學生成就的提升。[12]大部分狀態模型將學校認定為合格與否兩類,這種“是或否”的評估方式誘使許多學校將大部分注意力放在有限的學生分群。在德克薩斯州的小學個案中發現,該校教師將學生分成三組類別,即安全組、值得關注組以及毫無希望組,并以此將學校資源進行區別分配。由于學校在這種評估模式中完全受制于達到熟練指標的學生比例,所有那些距離標準較遠的學生,無論其學業成就高低,都將被學校所忽視。
同時,不斷變化的州熟練標準也是狀態模型較為突出的實踐問題。部分州希望其更多學校能夠符合AYP要求,不斷降低對熟練標準的定義。2009年美國教育部委托國家教育統計中心(NCES)調查發現,2005-2007年有15個州熟練標準在數學或閱讀上要低于全國教育發展評估(NAEP)標準。另一方面,增長模型可以極大消弱學生學業成就與其社會家庭背景在狀態模型中的正相關影響,使學生可以最大程度地排除如種族、經濟等固定因素以獲得符合自身情況的成長,并有助于督促和鼓勵學校盡力改進每一個孩子的處境,而非僅僅關注那些最有可能達標的少部分學生。同時,增長模型可以為教師和管理人員提供學生的具體信息,從而使其教學、課程以及專業發展都更具有針對性,還可以幫助學區和州政府促進問責系統的完善。信效度方面,增長模型信度不如狀態模型,但相對更為有效。希佩爾在對增長模型和狀態模型進行信效度交互評估分析發現,效度高的模型能為學校效度評估帶來的收益要超過其信度成本。增長模型不僅比狀態模型更為有效,其效度帶來的最終收益要大于信度較小的損失。狀態模型盡管信度很高,但不能有效反映學校的效能。蘭德公司在給奧巴馬政府的一份政策提要中提出:問責系統應設立相對的增長目標而非僅要求每個學生達到一個絕對目標。若各州推行關注于學業成就增長的測算模型,NCLB的實施會更加有效。精確的增長測算可以很好地反映出學校的表現和效能。[16]當然,增長模型實施中也同樣面臨許多難題,首先是成本問題,增值模型的出現和實施極大增加了評估成本,這包括了每年每個學生的數據采集、跟蹤、管理和分析,針對學校教育效能的狀態標準和增長標準的設定,以及專業技術人員和相關人員的招聘培養。
其次,缺乏方法或統計控制的因果賦值會導致謬論的產生,這就要求系統對數據精確度的測算保障流程。再次,單一的增長模型無法滿足美國教育要求,正如美國前總統喬治•布什(GeorgeW.Bush)多次重申的,美國正面臨的是低下的期望值挑戰。單一的增長模型只會讓許多學生失去接受幫助的機會,沒有固定底線標準的保障,會讓學校為那些貧困的、英語不利的、少數民族或是特殊教育的學生的不達標提供借口。最后,復雜的統計公式使增長模型讓公眾和決策者難以理解,這也是狀態模型仍使用至今的主要原因之一。盡管增長模型在學術界引起廣泛關注和爭議,但卻未在教育政策團體中展開,這主要還是在于該模型過高的技術門檻,使大部分人難以理解,決策者也希望在政策上采用相對簡單易懂的方式對學校和教師進行評估。增長模型的推廣還面臨來自于富裕學區和學校的阻力,那些一直以來在狀態模型中受到好評,擁有較高教育資源和生源的學校和學區無法接受因為在增長模型中的低評而喪失撥款的可能性。
三、美國義務教育問責評價模型的啟示
終結性的狀態評價模型和形成性的增長評價模型有機結合在美國形成了一種新的發展性的多元評價思路和方法。這對目前我國以政府為主導進行教育資源均衡配置,通過科學評價引導學校均衡發展從而促進教育公平有一定啟示。
第一,影響因素量化分析,保障教育機會平等。學生學業成就的發展通常受到來自學校、家庭、社會以及學生個體自身等多方面因素影響,復雜的影響因素需要龐大的數據以及科學的分析手段。美國教育問責增長評價模型采用量化多元分析技術,對各類影響學業成就因素進行分析的同時,還基于追蹤設計的研究,將學生學業成就數據化,從而依靠高級信息技術對教育過程中教育資源均衡配置問題進行診斷。這樣,先天資質及家庭環境不同的學生群體的不同需求得到正視,多樣化的教育資源使每位學生可以得到充分發展。
第二,結果、過程并重,注重教育過程平等。教育公平的目標在于機會和成就的平等,而其聯結這兩者的核心則是學生在教育過程中的平等對待。美國問責評價考察學校與教師對學生學業的影響,既強調了成績的絕對“產出”又兼顧了教育過程的“輸入”。在狀態模型中,生源水平對學校最終是否達標影響很大,忽略起點的差異而采用統一的標準進行評估會導致人們僅關注高風險考試成績和少數學生的培養,而忽視大多數學生的發展,在實踐中損害教育過程的公平性;而增長模型則是基于每位學生的進步成就來計算學校或教師對學生學業的影響,這使得學校必須兼顧所有學生的發展和進步,并根據每個學生的情況,采取相應的教學措施。兩種評價模式保證并激勵了學校對每一個學生在每一個教育環節中的投入,從而實現“不讓一個孩子掉隊”的理想。
第三,多元多層評價,實現教育成就平等。從區域均衡發展層面上,美國各州利用狀態和增長模型指標建立了科學、完備的學校效能評價與監控體系,使教育行政部門可以更客觀、準確地評估學區或學校效能,從而有效、合理地進行教育決策和教育投入。評價數據也為區域教育改革和學校改進工作提供基本依據。從學校層面講,多元評價模式使學校之間的比較更為公平合理,使學校不斷關注學生的進步與學校的長遠發展而非“好生源”的爭搶。各類分析數據能幫助學校、教師準確地發現其效能存在的問題,實現自我改善。從學生和家長層面來講,美國問責評價模式能分析出與學生學習進步相關的各類因素,從而有針對性地促進學生改進,并能促進家長理性擇校,不再將升學率作為惟一標準,而是根據學校特點和效能以及孩子的實際情況,為孩子選擇合適的學校。
作者:王瑜吳春紅單位:廣西民族大學教育科學學院空軍航空大學飛行基礎訓練基地