評估

格蘭特•威金斯:定義評估

2002年1月21日

格蘭特•威金斯是全國公認的評估專家已經在評估改革工作了25年以上。他是總統的教育谘詢公司真正的教育和傑,麥克泰《整合的作者之一了解設計屢獲殊榮的框架用於世界各地的課程設計。在這次采訪中,韋根分享了他對於績效評估的思考,標準化考試,等等。

•威金斯發表了幾篇文章為Edutopia.org。2002年,他寫道向真正的責任:一個新的狀態評估係統。2006年,他寫道健康測試很容易:真實的評估。

你使什麼區別之間的“測試”和“評估?”
什麼是真實的評估和為什麼它是重要的?
為什麼它是重要的是教師考慮評估之前就開始規劃課程或項目?
你如何評價基於項目的學習嗎?
技術支持和提高評估如何?
你如何回應的觀點,教師沒有足夠的時間來設計和開展真實或績效評估?
使用標準化的測試,如坐,由學校作為一個學生的未來的預測成功。這是一個有效的使用這些測試嗎?

1。你使什麼區別之間的“測試”和“評估”?

我們的觀點是,測試是評估的一小部分。需要照片的一部分。許多人最終anti-testing測深anti-evaluation anti-measurement。一個好的測試的作用。我們喜歡使用的語言,它是一個審計。這是一個快照。你別跑業務的審計。你想要超過一個快照,你想要一個完整的家庭相冊。但審計和快照在更大的圖片。

更複雜的測試能做什麼,績效,基於項目的事情不能做嗎?尋找離散為個人知識和技能的學生。許多項目,因為他們協作,最終讓你知道,嗯,個別學生呢?個別學生知道什麼?

例如,在一些基於狀態,基於績效的評估,他們總是有一個平行的紙筆考試對個體學生,這樣你有足夠的個人數據。另一種方式說,這是科學家和研究人員說,是什麼由三角形組成的信息。匹配的測試項目,對PowerPoint®演示。現在是整個圖片說什麼?所以,我們想說的是“測試”是一個投資組合。

2。什麼是真實的評估和為什麼它是重要的?

真實的評估,對我來說,並不意味著是短語,或費解的短語,它被很多人。當我們第一次開始使用它15年前,我們隻是為了表示真實的人實際上做的工作而不是填空題,紙筆,多項選擇題,簡答題測試,校本評估。這是真實的,這是真實的。這是現實的。如果你進入工作場所,他們不給你一個多項選擇題測試,看看你做你的工作。他們有一些性能評估,正如他們所說。

已經說過,有一個誤解。人們會說,”好吧,如果這不是真實的,它不可能是一個良好的評估。”We never said that. We never implied it. There's a lot of authentic work that doesn't make for good assessment because it's so messy and squishy and it involves so many different people and so many variables that you can't say with any certainty, "Well, what did that individual student know about those particular objectives in this complex project that occurred over a month?" So there's a place for unauthentic, non-real-world assessments. We're just making the distinction that you shouldn't leave school not knowing what big people actually do.

3所示。為什麼它是重要的是教師考慮評估之前就開始規劃課程或項目?

教學設計的一個挑戰,是一個好的設計師,你必須思考你想達到什麼樣的效果,以及工藝的內容和教學方法,而且評估。的一件事,我們過去一年所做的工作與教師與他們分享是多麼重要的說,“你要評估什麼?證據的目標,你有什麼主意?”Otherwise your teaching can end up being hit-or-miss.

我們叫它逆向設計。而不是跳的活動——“哦,我可以有孩子這樣做,噢,那太酷”——你說,“好,等一下。”Before you decide exactly what you're going to do with them, if you achieve your objective, what does it look like? What's the evidence that they got it? What's the evidence that they can now do it, whatever the "it" is? So you have to think about how it's going to end up, what it's going to look like. And then that ripples back into your design, what activities will get you there. What teaching moves will get you there?

4所示。你如何評價基於項目的學習嗎?

開始,我們的目標是什麼?和這個項目如何支持這些目標和我們如何評估這些目標?所以,你希望看到任何項目評分準則,一個標題,有明確的項目的鏈接,一些標準和標準我們價值相關的一些總體目標很明確,我們的目標是為教師。

有時我們遇到的問題,這個項目是一個生物的學生的學習興趣,毫無疑問,可愛的發生,但是我們忽略了一個事實,現在是完全超出了我們的控製。我們甚至不知道它的真正實現我們的目標以外的孩子學習很多和做一些關鍵的和創造性的工作。

我們必須做的是認識到,即使我們給這孩子自由去做很酷的項目,它仍然是有適合的上下文中一些目標,標準,和標準,我們將和框架的項目,這樣我們能說,“我有證據。我可以讓你學到一些實質性的和重要的,關係到學校的目標。”

5。技術支持和提高評估如何?

一旦我們超越的評估不僅僅是測驗和測試——和它的文檔,你這種情況下,學生所做的重要的東西,這方麵的證據,如果我們想堅持司法的比喻,實際上證明了學生學到了一些東西。

技術是一個明顯的夥伴因為無論是光盤,磁盤,或一個老式的技術像攝像機甚至管理費用,學生結合視覺、三維,紙筆的工作。我們希望能夠記錄和跟蹤學生的成就以及學生如何到達那裏。

話雖如此,我認為有時技術被濫用了,我們不足夠仔細思考我們需要的證據給年級,把成績單上的東西,隨著時間的推移和跟蹤信息。許多善意的人們說,“讓我們學生的k - 12學生的工作組合。”Well, that's fine for the student, but there's hardly another human being other than the kid's family that wants to wade through all that.

實際上是另一個角色的技術:這是一個很好的數據庫係統——信息管理,存儲和檢索,我們說,“我不想看整個投資組合。我想看到一些樣品,一些題目,了解學生的當前水平的性能。”Tracking information over time through technology is actually an important part of it as well.

6。你如何回應的觀點,教師沒有足夠的時間來設計和開展真實或績效評估?

的批評常常被夷為平地的替代形式的評估,是否我們稱之為性能,投資組合,真實的,真實的,或基於項目,是他們太密集,它們太貴了。太大的麻煩。回報是什麼?成本效益是什麼?

我能理解這個論點在州的水平。國家審計業務。的一件事我想我們這些年學到的是,考慮到他們需要省錢,不會太幹涉,使其可靠的評估,那麼他們不可能不得不做一些。但許多批評者的觀點使不耽誤在地區層麵。相反,它不是很貴。你有自己的地方的人都在評估業務。這不是不合適或浪費時間因為你不能滿足不做績效評估標準。

7所示。使用標準化的測試,如坐,由學校作為一個學生的未來的預測成功。這是一個有效的使用這些測試嗎?

標準化測試審計的作用,但是,許多政策製定者和家長忘記的一件事,或不知道,這些測試有一個非常狹窄的焦點和目的審計。他們隻是試圖找出如果你真的學會了你在學校學到的東西。

這些測試是否預測未來業績或成功——他們不。即使坐,ETS和大學理事會非常清楚,不預測。它隻是預測新生第一學期平均績點。這是所有。有大量的研究表明,在大學裏成績不與後來的成功。

所以,人們陷入麻煩的一件事是評估。這就像一個壞的電話。還記得你小時候玩的遊戲嗎?什麼開始作為一個完全理解的句子是一些野生年底扭曲的事情。

十或十五年前,教育部長在牆上的圖表對每個州的坐在表演——如果這是衡量學校和學校係統的成功。但SAT發明作為一個能力測試,不是一種成就測驗與課程有關。這隻是對一般智力。我們非常小心關於關於,這些評估結果做什麼和不的意思。大多數州和國家測試預測非常狹窄的結果對某些類型的在校表現。這是所有。