評估
在標準化考試失敗:主觀性和不精確會占上風
考試更善於衡量大局比評價學生。
通過
恩典魯賓斯坦
2008年3月18日
信貸:格裏高利Cherin
今天的標準化的評估可以用於發現大趨勢或衡量國家項目整體的有效性。然而,當用於高風險的責任,作為唯一指標的個體學生的成就或一個學校或學區的質量,這些測試可以不精確。創建和評分測試是複雜的。這裏有一些步驟的測試過程中主體性盛行和不準確的地方出現:
測試使
- 內容選擇:如果國家設置太多的標準,教師無法彌補全部損失,要想在測試。如果測試廠商包括對任何給定的技能太少的問題,結果可能不會真正展示學生可以執行它。
- 模棱兩可的問題:特別是對多項選擇題的問題,一個孩子可能會做一個合理的,甚至是創造性的,參數選擇的一個“正確”的答案,但格式不允許孩子解釋。
- 設置難度:這種決心,通常基於教育工作者和政府官員的意見,自然是主觀的。選擇最後一個問題,測試製造商經常試穿出來的學生,隻能隻要針對集團準確地代表了最終將參加考試的學生。
- 同比比較:為了防止作弊,國家通常每年問測試製造商創建新的問題。測試製造商必須執行的棘手試圖確保考試同樣困難,成績可以比較喜歡蘋果,蘋果。
測試以
- 測試準備:考試的教學策略可能會忙一些學生和防止他們的分數反映他們所知道的。
- 幹擾:是否內部或外部幹擾,如考試焦慮,個人問題,缺乏睡眠,一個生病的同學,或者破空調會扭曲學生的分數。
測試得分
- 機械或人為錯誤:錯誤可能發生在設置答案關鍵,喂養回答表得分機器,標記回答對或錯,或采取其他措施。
- 降低分數:這些截止點傳遞和先進的分數是部分基於教育工作者和官員的判斷,所以他們主觀的。也自然不精確的分數在這個圖表解釋說,一個學生的分數可能低於分界點沒有即使她是知識淵博的足夠的通過,反之亦然。