進入李老師的腦與學習實驗室之後,第一份工作便是要弄懂如何施測。這裏的施測和之前在小學實習經驗中,每次段考發考卷、改考卷相似外,和小學月考不同的是,這裏的施測需要遵循一定的施測程序,以及將可能影響測驗準度的其他因素(控制變因:如學生情緒、指導語、環境等)降到最低,這樣施測後的資料才能送到實驗室工廠的下一個部門─統計(目前由統計前輩嘉恩執行)。
統計又是另一大學問,嘉恩建議我從林清山的教統開始下手(從沒想過畢業之後會再接觸統計,抱著小小的疑惑與擔憂,會不會因為統計而把自己身上的浪漫因子全部耗盡誤)。
等等,我離題了,今天的重點是教甄的考科與施測工作的結合─測驗與評量中的「信度」,一來是因為教甄書單中陳嘉陽第十四章,測驗與評量這章節剛好看到信度;二來是因為每次看指導手冊,看完封面後,就只能直接跳到最後面的「計分方式」,中間的效度、信度勉強吃力的啃著,看完了卻似懂非懂,所幸試試看弄懂它,用自己的話說說看,「信度是什麼?」
(這是很初淺的筆記,有很多的錯誤需要修正,正確版要看專書!!!)
信度有另一個重要的夥伴,效度。
如同射飛鏢,信度是每次射飛鏢射在同一點上的機率有多大,效度則是每次射中紅心的機率有多大。
效度比信度重要,如果每次射飛鏢都設在同一個點上,那個點卻離紅心非常遠,便是徒然。
這句話也可以拿來解釋「信度是效度的必要條件,而不是充分條件。」
●實際舉例說明:一個測驗進行施測,幾次測驗的結果一致性很高,就代表是好的測驗嗎?
A: 不一定。一致性很高,即誤差很小,代表信度很高。但是如果測到的不是想測到的特質,就算每次測的結果分數都很穩定,但整個測驗的目標卻沒有達成,當然不能稱作一個好的測驗。所以信度高,效度不一定高;效度高,信度一定高。
(大學背東背西背半天,現在重新看一次,原來有其緣由,理解了,記起來便不是難。)
信度(reliability)指的是評量的一致性,即在兩次測量間,測驗分數或評量結果的一致程度。(引用至教育測驗與評量, Robert L. Linn, M. David Miller著)
每一次施測可能會因為許多因素(記憶、注意力、努力、倦怠、情緒、猜測、間隔時間長短、學習經驗、健康狀態、遺忘、測量情境、不同評分者等...)而對測驗分數造成變動,而產生誤差。一份測驗的信度的高低(應改成測量結果的高低)即在檢驗誤差有多少。測量結果一致性越高、誤差越小,信度就越高。
選用不同的信度會有不同的誤差來源(如時間誤差、抽樣誤差、評分者誤差)。
反過來說,使用不同的方法估計信度,會有不同的測量結果的可靠性,並沒有哪一種方法是最好的,須依照測量結果的用途選用,才不會有錯誤的解釋。
○信度係數(相關係數)
○測量標準誤
留言列表