看一個更深層次的評估對於理解
超越傳統的性能評估測試和作為一個重要的教學工具。
每年春天,成千上萬的學齡兒童在美國加強他們的2號鉛筆,準備把標準化測試的電池。這種儀式來代表國家對高學術標準和學校責任的承諾。
父母用考試成績來衡量孩子的學術優勢和劣勢,社區依靠這些分數來判斷他們的教師和行政人員的質量,和州和聯邦議員使用這些分數將公立學校負責提供高質量的教育每一個孩子都值得。
對許多人來說,這些標準化考試,和無數其他小測試在今天的教室是司空見慣的事,他們聽到這個詞,你會想到什麼評估。我們看演示會拚寫測試,end-of-quarter生物學考試,甚至高中退出考試,告訴我們我們的孩子是否發展技能和學習材料都需要成功的學校。
但是測試並不是唯一的方式來衡量一個學生的知識和能力,就像背誦公式和背元素周期表不是唯一的化學學習方法。全國各地,許多教育工作者都超越傳統的測試和使用性能評估在k - 12教室來衡量學生知道和能做什麼。
他們設計項目,要求學生運用他們所學習的真實世界的任務,就像設計一個學校建築或改善水質在附近的一個池塘。他們給學生的經驗,評估專家格蘭特•威金斯說,“被測試的曆史學家、數學家,博物館館長,科學家,和記者實際上是在工作場所進行測試。”
在課堂環境中,績效評估是項目學習不可或缺的伴侶。通過開發綜合評估準則來評估學生的表現,老師確保項目不僅僅是有趣和吸引人的活動。他們的真正測試學生的能力和知識,與標準,並記錄每個人——學生,家長和教育工作者,了解被評估。
“性能”可以包括一個廣泛的活動和任務:從研究論文,證明學生可以評價和表達一個意見來源的實驗或問題,使老師衡量一個學生的能力應用特定的數學或科學知識和技能。一些性能評估由單個項目;其他要求組學生朝著一個共同的目標一起工作。
但無論項目或問題,精心製作的績效評估共享一個共同的目的:給學生機會展示他們所知道的,能做的和為教師提供的工具來評估這些能力。
評估在行動
評估是一種生活方式在紐約市的120名學生城市學院:每一天,在每一節課,學生被鼓勵和預期來展示他們的學習。在憲法中,他們認為在一個模擬所需最高法院。在幾何,他們必須運用數學概念測量高度和體積的建築物或者南渡輪和斯塔頓島之間的距離使用自由女神像作為參考點。
在他們獲得高中文憑之前,學生必須完成獨立的績效評估(在城市學院被稱為學術熟練程度),展示他們的技能和知識在六個學術領域:數學、社會研究、科學、創造性藝術、批評和文學。
“這是一個係統的評估,而不是一個工具,”安·庫克說,城市學院的監視點。“這是一個係統基於大量的組件,它在全年,高潮在某些類型的任務,展示學生能做什麼。”
這些任務可能包括寫一個劇本,在它前麵的執行整個學校,閱讀和學習文學作品,然後能夠參與一個深思熟慮的談話,或原始設計進行科學實驗。每個水平,學生必須準備好與同學分享他們的工作,老師,和外部專家,他們經常借現實世界的經驗對城市學院的評估過程。
城市學院和30多個其他高中的一部分紐約財團性能標準采用了這些嚴格的性能評估替代董事會考試,高中學生在紐約州需要通過英語,數學,曆史,科學為了獲得文憑。
雖然他們的程序可能會有所不同,所有聯盟學校采用了一個係統的評估與國家標準一致,基於一係列明確的題目,所以學生和老師清楚地理解工作是評估的標準。的性能評估審查委員會外部團體的教育者,測試專家、研究人員、商業和法律社區的成員,監控學生的表現評估體係和評估樣本的工作。
該財團說,組長琳達·達令·哈蒙德,查爾斯·e·Ducommon斯坦福大學的教育學教授,代表試圖開發高質量的績效評估,可以可靠地評估。”Darling-Hammond, who has worked with the consortium for more than a decade, points to member schools' high college acceptance rate compared with that of all New York City schools (91 percent versus 62 percent) as a testament to their rigorous curriculum and assessment.
應用學習
全國高中Mountlake階地,Mountlake階地,華盛頓,幾何老師Eeva裏德開始實施績效評估當她意識到一個令人不安的模式在學生:他們可以測試過關但有相當大的困難轉移知識和技能從一個單位到另一個。
她的應對這一困境是項目合並到她的幾何課——小規模項目結束時,每一單位的研究,以及長期的最終項目,要求學生把抽象的技能和公式的實際設置。
完成一個項目,裏德說,“是你所知道的真正考驗。你可以看節目,茱莉亞的孩子蛋奶酥,你可以讀到蛋奶酥,”她補充道,但真正的考驗是“做一個你自己。”
在裏德的階級,真正的考驗她的學生幾何技能是一種體係結構挑戰。在六個星期,學生必須設計一個高中,在2050年將滿足學生的需要。在小團隊工作,學生需要開發一個網站計劃,創建一個規模模型,準備成本估算,並寫一份正式的提案。他們還必須展示他們的計劃,他們的同學和一群建築師作為導師和法官在整個項目。
設計項目的評估發生在幾個方麵。在項目的開始,學生們給他們的工作將被測量的評分標準。每個部分項目的評估是基於質量和準確性,清晰和表示,概念。裏德還評估團隊合作(參與、參與水平、工作質量作為一個團隊成員)在最後的項目。
“有兩個原因評估,”裏德說。“是提供一個學生反饋在他們工作的質量,特別是在如何改善你的生活質量。另一種是分配分數或等級。”Scoring is the easy part, she adds, and can be accomplished with the help of what she calls a "reasonably prepared" test.
“但你不能評估一個學生的一個主題的深刻理解和應用能力的概念通過傳統的紙筆,crank-out-the-formulas評估,”裏德說。“它要做性能評估。”
評估學生的增長
一個常見的性能評估是一個學生的發展組合——一個累積記錄學生的工作。這是一個練習的使用關鍵的學習社區,在印第安納波利斯k - 12學校,因為學校第一次開張於1987年的秋天。
項目學習和學生的工作是不可分割的一部分,學習評估項目的關鍵。每學期,學生選擇和全校研究項目,對應於一個主題。這些報告記錄在錄像帶,學生完成八年級的時候,他或她有一個投資組合記錄多達25個項目。
1999年,主要學習了高中(開始九年級學生首先是一個類),和年長的學生是朝著改善使用新技術來捕捉學生的工作。現在,學生在中學開始創建蘋果幾場和在高中繼續使用程序來記錄和展示他們的工作。
學生進度報告(沒有傳統的報告卡)是基於霍華德·加德納的多元智能理論人類共性的和歐內斯特•波伊爾的理論。
獲得高中文憑之前,主要學習老年人必須文檔和演示應用知識Boyer確定為八人的共性。其中包括共享使用的符號(主要通過建立一個多媒體演示),共同生產和消費(通過一個項目營銷和經濟學),和共享的時間和空間(通過一個項目的貢獻在印第安納波利斯的曆史或族群的發展城市)。
隨著學校的十一年級的學生開始準備大學申請過程,主要學習是調查方法來創建更小但代表投資組合的學生工作在cd - rom,它將用於大學招生部門。
很好的利用了時間
盡管存在許多分歧,但是,這三個學校共同致力於發展project-rich課程支持和影響一個深思熟慮的評估體係。教師、學生和家長都知道不會發生最有效的評估的單位。貫穿於課程和項目,經常因此無縫日常教學和學習是難以區分的。
毫無疑問,這些高質量的性能評估需要時間。典型的研究論文在城市學院,例如,將通過多個修訂之前,學生和他或她的老師把它完成。與每個修訂討論需要解決的關鍵問題,問題有待回答,概念需要進一步發展。
一個水平可能需要一個學期甚至一整年的學生完成,可能需要長時間的討論與城市學院教師和外部評估者。Mountlake階地,Eeva裏德花許多小時物流6個建築項目,如組織實地考察當地建築師辦公室和協調課堂活動與導師的繁忙的工作時間表。
“性能評估人參與工作和時間。學生發展表演。老師必須評估他們,”斯坦福組長琳達·達令·哈蒙德的承認。但她強調,“不是輸給了教學和學習的時間。的時間是教學和學習,因為實際進行的評估學生以及教師的學習經驗。它使教學。它給教師即時反饋,他們需要做什麼來滿足學生的需求。”
,即時反饋幹預的能力,改變方向時評估表明一個特定的教訓或戰略不是為學生工作,或為學生提供新的挑戰已經掌握一個概念或技巧。在這種情況下,性能評價研究員凱倫Sheingold說,評估和學習成為“一個硬幣的兩麵”,而不是單獨的和不同的活動。
評估與問責
在美國許多教室和學校,評估實踐不僅僅是改善個體學生的教學和學習。他們不可避免地綁定到公眾的需求更大的責任。所有50個州管理年度評估學生,結果可以確定學生是否促進或保留,教師是否得到獎金或一所學校被重建。
這些測試,因為他們的高股權,對教學實踐有一個令人難以置信的影響。例如,教師應對2000年的近70%教育周調查標準和責任說狀態評估是“強迫他們太專注於測試,損害其他重要領域的學習。”的teachers reported dropping longer units with rich assessment components in favor of more traditional lessons that reflected the type of material and format common in most state assessments.
很少有人會認為與需要,因為休價格,總統的全國城市聯盟,說,“知道孩子是否學習,無論他們是在年級水平低於或更好的方式”。But when the stakes are too high, this laudable goal gets distorted. Teachers begin teaching to the test to raise scores, often at the expense of more meaningful learning activities. And when the tests are too narrow a measure or aren't properly aligned to standards, they provide little concrete information teachers and schools can use to improve teaching and learning for individual students.
盡管大多數國家繼續使用多項選擇題和簡答題項目標準化考試,一些州已經把額外的措施到他們的年度評估。的馬裏蘭性能評估項目例如,經常表揚的方式呼籲學生展示多個能力在回答一個問題或問題。(看到布魯斯Alberts Edutopia.org文章“適合重振科學教育的評估”)。
此外,肯塔基州和佛蒙特州全州融入了投資組合的評估學生的成績,學生成績的另一個努力提供了一幅更廣闊的圖景,和馬薩諸塞州現在改革審查委員會召集各利益相關者團體的代表製定一個策略來擴大麻薩諸塞州綜合評估係統使它更公平、更全麵。
這些增加是重要的和必要的,克裏斯黛德說,哈佛大學的教育學教授,為了真正理解學生知道和能做什麼。“目前的改革運動是基於第一代標準和第一代評估問責,”黛德說。“雖然標準和責任是好的,”他補充道,“第一代是有缺陷的。而不是學生所知道的多個指標,我們最終得到一個測試成績,應該捕獲所有的學生的腦袋裏。”
黛德比作狀態評估年度訪問醫生,表明我們需要更多,而不是更少,信息來衡量一個學生的知識和能力。
“當我去醫生的身體,這是一個指標的整體健康,”他說。“我不隻是想知道我的血壓。我想知道關於我的膽固醇水平和各種各樣的其他指標。某人的教育幸福是更複雜的比他們的身體健康。“在我們第二代的標準,我們需要更深層次的關注更少的技能,是21世紀的核心,”他補充道。”,在我們的第二代評估,我們需要更廣泛的措施,多種措施,看不同種類的學生所學到的東西,掌握了。”