【校園記者國文101王嬿婷報導】考試能真正反映學生程度嗎?配合教育部101年系所評鑑,教學發展中心10月13日舉辦學習成果導向多元評量講座,針對不同學科領域說明多種測驗方式和新軟體,讓老師們更輕鬆掌握教學成效。
培養學生帶得走的知識,評量課程是某否達到教學目標,傳統測驗方式以分數定高下,已不能確實反映學生能力,教發中心舉辦第一場教學導向評量講座,邀請教育心理與輔導學系陳柏熹教授,說明各種評量方法,透過題目編定修改,老師因材施測,學生也能檢驗所學。
發掘學生個別差異 分數不再是最高標準
從傳授知識到引導能力,教育部提倡多元發展,評鑑系所更重視學生對課程的吸收程度,為幫助老師找出學生個別差異,進而輔導深入最適合的領域,必須改變傳統以分數掛帥的評量方式,課程內容連結職場競爭力,學生也會樂在其中。
陳教授指出,培養多元能力不代表所有學科都要涉獵,多元評量是根據不同課程指標來設計,否則剛教過的內容學生考完試就忘記,反覆詢問浪費時間,給他魚吃還不如確定已經學會釣魚,能舉一反三,每個人都會是成功的學習者。
規劃評量工具藍圖 鎖定認知歷程向度
要有效掌握教學成果,老師一開始就要定好測驗方向,根據Anderson認知領域教學目標規劃的知識和認知歷程向度,前者將知識分成事實、概念、程序和後設認知,是學生上考場前需循序漸進了解的先備知識,後者則反映重組概念的能力。
針對認知領域的目標去評量,除了檢驗學生對課本內容的記憶,老師也常透過摘要文本、自行解釋、分類舉例的方式讓學生推論,透過紙本或口頭測驗,效果顯而易見,不過如何讓學生結合不同能力,建立標準來評判事物,就必須設計全新情境題,讓學生應用技巧解答。
對文科閱讀測驗來說,給學生一篇文章,運用心智圖找出文章段落彼此間的關聯,可以考驗學生的組織分類能力,在新情境中融入所學,達到認知歷程應用、分析、評鑑、創造等向度,雖然沒有標準答案,但學生和他人比較,無形中也精進邏輯思考。
技能領域過程、成果並重 分項細部檢驗
不同於一般課程偏重理論應用,體育項目考驗動作標準、機械科需要組裝零件、烹飪課步驟繁複,動作順序不同就會影響結果,像這些重視實作的教學,無法用傳統紙筆測驗看出學習成效,評量項目須逐條劃分,檢驗學生是否能透過模仿動作,逐漸降低錯誤率。
陳教授舉生活例子說明,要評量是否具備開車能力,就要列出學生是否能熟記步驟、模仿動作、進入自動化並能結合所有重點流暢啟動車輛,透過觀察勾選,教學兩方都清楚未達成的目標,能針對問題做改善,甚至開發出比原教學更好的方式,這也是運動選手為何能青出於藍的道理。
實作技能方面,肢體動作考驗靈敏度、協調度和平衡感,有鑑於人為觀察評分標準不一,測驗花費時間長,心輔系推出電腦化多元智慧適性測驗,動作效度數據由電腦統計分析,目前已完成施測,開放全校系所諮詢使用。
結合認知、技能、情意目標 建立雙向評量藍圖
抽象感覺不易在考試中測出,課程中的情意目標雖然希望培養學生長遠道德感、美感價值觀,但就像教學生不可闖紅燈,人在不同情境下,往往以不同態度回應,從接受遵守交通規則到實際反應,評量需要長期觀察,此時可透過雙向細目表,列出符合認知、技能、情意表現的項目加總評分。
考過程還是結果? 選擇適當題型才有效
很多人以為考試只要把課本內容編成題目即可,其實在評量目標不明確的情況下,題目可能暗藏答案,或者純靠推理就能把選擇題變成是非題,而設計不好的申論題,答案模稜兩可,誤解之虞也增加批改困難度,要改善這些情況,題型選擇是關鍵。
如果評量偏重過程,應使用「行為檢核表」,把評分標準拆成細項;注重成果如美術作品,則可使用「評定量表」,以向度取代分數,缺點是把評分標準拆成多項,老師逐一評分,一次只能測驗一人,花的時間長。
若純粹測驗基礎認知能力,一般使用「選擇反應題」,作答快速且評分客觀;至於性格、生涯規劃類的測驗,評分者不易看到真實面,可讓學生互評或自評,同時多人評量,答案無對錯,又能降低亂猜機率。
性格測驗多元評量 社會互動關係更清晰
個性、生涯規劃測驗涉及個人隱私,受測者若不據實回答,就無法反應真實結果,教師除了透過評量表,客觀紀錄被觀察者的行為、提出主觀推測解釋外,還可利用「等級評量表」對同組學生的表現做排名,或用「分數評定表」根據既定標準來觀察學生行為。
行為檢核表分項逐條確認,陳老師特別提醒,如果要評定學生上課是否經常回答問題,只勾選是、否兩個選項並不客觀,不一定每堂課都有足夠回答問題的機會,對於無法觀察的情況,也該特別註明,同時設立反向計分機制,以便觀察正反行為出現的頻率。
受測者自評目前多使用「Likert量表」,學生對每個項目以一到四分回應,缺點是加總出來同分代表的意義含混不明,無法客觀解釋。以職業興趣來表來說,若採用自比量表,從一系列相近選項中勾選最喜歡和最不喜歡的項目,不必和他人比較,反能更清楚呈現個人興趣。
想了解學生在團體中人際相處的特質,老師看不見的,讓同儕互評更顯真實,「社會計量法」讓同學對彼此票選排序,透過分數累積可看出團體中的核心人物,也能對分數較低的同學進行輔導,做成社會互動關係圖。
避免投機行作答 題型設計學問多
選擇題在基礎課程考試中最常見,雖然只有四個選項,但未經設計過的題目,答案容易辨識,或可能妨害作答,實驗指出,選項最好設計成性質相近且兩兩一組,例如詢問日本首都是哪個城市時,選用日本都市取代容易辨認的外國都市名,用相似的敘述方式使選項具備誘答力。
閱讀能力多用長篇題組測驗,不過許多學生跳過文章直接答題,再加上「承上題」提示,與題組敘述一模一樣的往往就是答案,導致評量效果不高,要避免學生投機作答,除了題目情境表達清楚,也可透過填空、簡答題訓練學生主動思考。
申論題測驗應用和評鑑能力,採取分析式評分,分數依照老師主觀喜好調整,若能以文獻豐富度、目的、研究方法和邏輯性等向度為標準,給分更客觀,也能給學生實質回饋。
列出能力指標 好題目歷經反覆修正
不管採用何種題型,每份評量都須擁有大量題目和具體目標,以測量課堂中的學習態度為例,必須先列出想檢驗的具體行為:作筆記、主動提問等,再選出最具代表性的,轉化、修飾成簡潔易理解的文字敘述,每回測驗後回收數據,並針對學生意見不斷修改,建議完整資料庫。