向真正的責任:一個新的狀態評估係統
深入討論修改狀態評估。
•威金斯的藍圖狀態評估將為學生提供及時和有用的反饋如何改善他們的工作,一些作者認為當前全州問責製度未能做到的。
想象一下如果籃球賽季結束在一個特殊的測試中,在今年的最後一天,球員和教練——不知道提前演習他們會要求做。進一步想象,他們不會知道哪些照片了籃子裏,直到幾個月後。每年想象進一步統計學家發明了一係列不同的(秘密)這樣的“籃球”的測試。Finally, imagine a reporting system in which the coach and players receive the scores -- long after the season has ended -- without knowing exactly which drills were done well and which were not.
然後不可避免的發生(因為這些新籃球測試結果將會在報紙上報道)。教練變得扭曲的緊張努力解決考試的形式和內容。教練(即不再擔心複雜的性能。完全真實的遊戲),專注於讓學生實踐演習,以犧牲學生參與和真正的學習。
在這些條件下的比賽誰會改善嗎?
然而,這是在許多州叫做責任的學校當應用於學術標準和測試狀態。模擬表明,它是真正的錯覺的問責製。當前的測試提供極其粗略和延遲反饋,任務,不能反映真正的成就。當前測試和報告方法,事實上,無意中導致貧困,不豐富和創新,“為考試而教學”項目。作為一個反饋係統我們當前的測試失敗,換句話說,不管他們需要關注結果和標準的原因。
有一個更好的辦法:一個評估係統,基於常識原則人們如何改善並有動力去改善。更反應係統基於有用的反饋來改善學習。係統,使本地工作和教師的判斷更多的中央政府問責。係統旨在提供激勵學校每年更新和內置的專業發展所有老師。一個係統,將激勵更多創造性的教學而不是恐懼的行為。
我的藍圖狀態評估完成八個不同的任務的核心真正的(與虛幻的)責任。它將:
- 對國家標準衡量學生表現可信,用戶友好的方式,如何我們測試內容我們測試有更大的忠誠教學目標和國家標準;
- 為教師和學生提供及時、有效和有用的反饋,使進展會議標準;
- 確保教師所有年級和學科領域的工作作為一個團隊來滿足標準的負責任和響應;
- 為父母提供用戶友好的和有用的信息關於他們的學生現在正在做,長期趨勢是什麼,和指導家長如何幫助學生提高性能;
- 是最小程度的(不依賴耗時的,一次性的,測試對當前教學和學習沒有價值);
- 不斷加強和提供高質量的當地學生評估激勵;
- 為地區提供激勵不斷提高學生成績;
- 使決策者在州及地方級別知道學生們在所有的國家標準,並有信心結果。
提出了狀態係統性能
我不自稱擁有所有的答案“是什麼”和“如何”。Necessary details await future inquiry, discussion, experimentation, and ownership of the plan by所有關鍵選區。的關鍵假設是當地評估應該任何全州問責計劃的一個關鍵特性。係統將會是一個學生的基礎標準文件夾,證據與國家標準的集合,對通用標準和性能標準得分區域性團隊每年的教育工作者。文件夾中包含的工作將包括:
- 測試數據從國家標準化考試在識字和計算能力。
- 測試數據從district-mandated國家標準化測試。
- 結果locally-scored國家許可寫作提示和性能評估的任務。任務和提示將來自一個國家數據庫評估、管理本地教育工作者在任何時候在學年。
- 結果所有相關locally-designed評估。
該係統需要一個非常不同的職業責任的觀點,不僅廣泛的培訓。擬議的計劃,事實上,任何計劃無愧於一個全麵的評估係統——隻能意識到如果教學工作的定義是需要各種非接觸式天給出明確學生評估,如果學校安排和政策旨在使這樣的工作成為可能。
而不是思考的“專業發展”的一係列隨機天致力於在職培訓,我們必須重新定義的工作教學包括得分學生工作和調整教學根據分析的結果,時間分配。
其他迫切的需要的是足夠的資源在國家層麵確保國家網站提供全麵的指導係統應該如何操作,用戶友好的印刷品和圖書館視頻資源如何提高評估,並詳細說明工作人員如何解釋文件夾有用的結果。
更普遍的是,國家需要更多的業務提供模型的評估比僅僅呼籲當地地區找出自己評估。我們呼籲一個第一流的委員會,代表所有主要國家選區發展完整的係統我們隻有勾勒的藍圖。
任何可靠的和有效的政府評估係統的基本原則
一組5個指導原則構成我們的建議。這些原則可以作為有用的標準,換句話說,對它的細節或任何教育評估體係——應該判斷:
1。一個良好的問責製不僅僅是審計的性能。它是故意設計來提高性能。
雖然明白事理的,這一原則暴露出的弱點所有當前狀態測試係統。因為原則意味著,學生、老師和管理員必須得到及時的、持續的、用戶友好的反饋,為了可靠的性能問題。
集中和負責任的教學需要持續評估教育的核心目標:學生能否明智地使用和反思,不僅僅是回憶,知識在模擬複雜成人智力任務。隻有通過確保評估係統模型真正的性能;換句話說,隨著時間的推移將學生成績和教學改進的?且僅當評估體係持有所有教師負責成果係統可以提高(相對於高風險測試四個十二年的教育)。
2。評估必須可靠是否發生真正的改革。
任何有效的評估計劃必須可靠的所有關鍵選區。因此必須提供當地的“三角”和狀態數據,健壯和有益的反饋意見顯然值得教育工作者的任務,門外漢和可理解的信息。
真正的責任也需要可靠的評估任務,工作,更直接反映了語言的標準和成年生活的現實。更加現實的評估和評估更忠實於良好的教學關鍵測試結果超出當地借口。
3所示。“地方越好。”"Trust but verify" must be the motto of an effective state assessment system.
當地的是更好的在各行各業。標準總是維持在地方層麵,夜以繼日。國家不能承擔評估每個學生在所有重要的工作,全年,也不是明智的國家這樣做。
一個有效的狀態評估係統因此集中資源和政策保證當地的評估變得更加複雜、更嚴謹、更自我校正。這個目標最好是通過將更多的權力,而不是更少,在當地的手;然而,同時也確保當地評估滿足標準基於結果的評估和幹預,,他們有動機護理有關國家標準和良好的當地評估。
我們建議的係統是建立在這一邏輯:信任團隊教育者的責任區域的評分工作——為所有學科領域。公開結果,製定的標準。然後,驗證的地方和區域得分通過各種審計係統。學生,老師,家長,和董事會成員可以有信心,當地社區不會驚訝狀態評估結果。
4所示。一個有效的評估能力建設計劃必須高質量的評估,不僅外部每年測試一次。
評估係統應該改善本地測試的質量,標準、分級和報告。教師不能回應在一個通知,及時和有效的方式來測試結果如果他們被排除在設計和評估得分循環。
5。政府問責製必須旨在煽動當地創造力和更大的控製standard-upholding,不是一個可怕的合規的心態。
質量運動的兩個基本原則在商業過去二十年(w·戴明鉸接的)“驅逐恐懼”和“沒有配額。”The point is to ensure that staff is driven by the right incentives to understand their job is持續改進,獎勵的創造性的解決方案對會議取得進展的標準。
相比之下,老師現在避免創造性教學測試成績下降的恐懼。秘密的核心“安全”測試確保恐懼,沒有想象力,將驅動教學。由於未能提供真正的激勵當地性能的改善,我們進一步促進持續萎縮的位置問責和高質量的當地評估。
五項原則有助於展示為什麼當前狀態責任測試不足以提高學生和教師的表現。當前狀態的計劃相當正確地把當地教育工作者注意到當地的國家標準。但審計測試,在幾個成績在今年年底,使用秘密任務,本質上是無法提高教學和學習天天在所有的教室,我的建議是為了做任何嚐試公平、全麵改革必須做什麼。