學習評量 (第二版) (電子書)

學習評量 (第二版) (電子書) pdf epub mobi txt 電子書 下載 2025

李坤崇
圖書標籤:
  • 學習評量
  • 教育評量
  • 測驗與評量
  • 教學評量
  • 評量工具
  • 教育心理學
  • 第二版
  • 電子書
  • 學習科學
  • 評量理論
想要找書就要到 小特書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

具體描述

  本書旨在探討學習評量理念與實例,內容包括三大部分:第一部分闡述學習評量理念,及教學目標與能力指標、學習錶現;第二部分申述紙筆測驗與實作評量理念,及紙筆測驗編製與題目分析、評定量錶、檢核錶、檔案評量之實例;第三部分剖析學期學習評量理念與實例,及學習評量通知單。

  全書最大特色在整閤理論與實務,從理念發展齣豐富的實作成果。除闡述多元評量理念外,更提齣豐富、多元、實用的紙筆測驗、實作評量、檔案評量、口語評量、軼事記錄與係列實作評量的實例。力求將理論實用化與簡便化、應用人性化與多元化,讓學習者易於上手,從實例體會中提升學習效能。
 
《教育測量與評估原理:深度解析與實踐指南(第三版)》 圖書簡介 本書旨在為教育工作者、課程設計師、政策製定者以及教育研究人員提供一個全麵、深入且極具實踐指導意義的教育測量與評估框架。作為該領域的權威著作,第三版在繼承前兩版堅實理論基礎之上,融入瞭最新的心理測量學研究成果、技術發展以及全球教育實踐中的前沿趨勢,特彆是對數字化轉型背景下的評估方法進行瞭重點拓展和深化。 本書結構嚴謹,內容涵蓋瞭從基礎概念到復雜模型構建的全過程,確保讀者不僅理解“是什麼”,更能掌握“如何做”以及“為何要這樣做”。全書共分為五大部分,三十餘章,邏輯清晰地引導讀者構建起一套係統化的評估思維體係。 --- 第一部分:教育測量與評估的基石 本部分著重奠定理論基礎,探討測量在教育科學中的核心地位和哲學基礎。 第一章:教育測量學的演進與核心概念 深入剖析測量學的曆史脈絡,從傳統客觀測量的局限性,過渡到現代信度和效度的現代解釋。本章詳細闡述瞭教育測量中“特質(Trait)”、“結構(Construct)”和“錶現(Performance)”這三個核心概念的辯證關係,並引入瞭關於教育公平與倫理在測量設計初期的考量。我們探討瞭定量與定性評估範式之間的互補性,強調評估的根本目的在於改進教學而非單純的篩選排序。 第二章:測量尺度與數據分布 對經典的斯蒂爾斯(Stevens)測量尺度——定類、定序、定距、定比——進行詳盡的介紹與應用場景分析。本章強調瞭不同測量尺度對後續統計分析方法的製約性。此外,深入講解瞭正態分布、偏態分布以及非常態分布在教育數據中的實際錶現,並引入瞭描述性統計工具,如集中趨勢、離散程度以及形態指標的精確計算與解釋,為讀者後續的數據解讀做好準備。 第三章:信度:測量的穩定性和一緻性 信度是評估工具質量的生命綫。本章係統梳理瞭信度的四大主要來源:重測信度、復本信度、內部一緻性信度(包括分半法和Cronbach's $alpha$的深入應用與局限),以及評分者信度。特彆地,本章引入瞭信度的“標準誤差(Standard Error of Measurement, SEM)”概念,並展示瞭如何利用SEM構建真正具有個體意義的預測區間,超越瞭對單一信度係數的盲目崇拜。 第四章:效度:測量的真實性和有效性 效度是測量工作的核心目標。本書采用現代效度理論框架,將效度解釋為一係列纍積的證據鏈。詳細闡述瞭內容效度(Content Validity)的係統化構建過程,標準參照效度(Criterion-Related Validity,包括預測效度和同期效度),以及結構效度(Construct Validity)的復雜性,包括探索性因子分析(EFA)和驗證性因子分析(CFA)在證據收集中的作用。本章強調效度論證是一個持續的、基於理論的論證過程,而非一次性的檢驗。 --- 第二部分:經典測驗理論(CTT)的深度應用與拓展 本部分專注於教育測量中最常用且最基礎的理論模型——CTT,並探討其在實際命題設計中的挑戰與優化。 第五章:項目分析與項目特徵麯綫(ICC) 項目分析是優化試題質量的關鍵步驟。本章詳述瞭難度(P值)和區分度(r係數)的計算與解釋。在對二分法項目進行分析後,本章引入瞭項目特徵麯綫(Item Characteristic Curve, ICC)的概念,並初步展示瞭如何通過麯綫的形狀來判斷題目的信息量分布,為後續項目反應理論(IRT)的介紹做鋪墊。 第六章:測驗編排與樣本量估算 高質量的測驗需要科學的編排。本章指導讀者如何根據測驗目標、時間限製以及信度要求,運用等值化技術(Equating)和項目池管理(Item Banking)來構建齣平衡的試題集。同時,針對不同測量目的(如形成性評估、總結性評估、診斷性評估),提供瞭詳盡的樣本量和測驗長度的統計學依據。 第七章:CTT下的誤差來源與偏差控製 超越瞭隨機誤差,本章聚焦於係統性誤差和偏誤(Bias)。探討瞭題型選擇、施測情境、評分者主觀性以及文化背景可能對測量結果産生的係統性影響。本章提齣瞭針對性強的質量控製清單(Checklist),以幫助實踐者在測試開發階段識彆並最小化這些非抽樣誤差。 --- 第三部分:現代測驗理論:項目反應理論(IRT) 本部分是本書的技術核心,深入講解瞭IRT如何解決經典理論中的諸多局限,尤其是在自適應測驗中的應用。 第八章:IRT的基本假設與模型 詳細闡述瞭IRT的兩個核心假設:局部獨立性和項目同質性。全麵介紹瞭最常用的三大模型: 單參數模型(1PL,Rasch模型): 側重於難度參數的估計,適用於測量同質性高的特質。 雙參數模型(2PL): 引入瞭區分度參數,能夠更精確地衡量項目的信息含量。 三參數模型(3PL): 引入猜測參數($c$值),更適用於多選題或有猜測空間的測試。 第九章:項目信息函數(Item Information Function, IIF)與測驗信息函數(Test Information Function, TIF) 這是IRT相較於CTT的重大優勢。本章著重講解如何通過IIF麯綫來直觀判斷一個項目在哪個能力水平上提供最大信息量。進而,通過疊加和整閤IIF,推導齣TIF,幫助評估人員科學地確定“最佳”的測試長度,確保在所需能力範圍內的測量精度最大化,實現資源的最優配置。 第十章:IRT在能力估計與測驗編排中的應用 演示瞭如何利用貝葉斯最大似然估計(MLE)進行能力參數 ($ heta$) 的估計。重點闡述瞭IRT在計算機化自適應測驗(CAT)中的核心算法,包括項目抽取策略(如最大信息量策略、貝葉斯後驗均值策略)和停止規則的設定,這是現代標準化考試的核心技術。 --- 第四部分:評估的類型、設計與實施 本部分將理論與教育實踐緊密結閤,探討不同評估目的下的具體操作方法。 第十一章:形成性評估與反饋機製的構建 強調形成性評估的“評估為瞭學習(Assessment for Learning)”理念。本章詳細介紹瞭反饋的質量標準(及時性、針對性、可行性),並探討瞭基於標準或錶現的反饋設計,以及如何利用“評估契機(Assessment Opportunities)”嵌入到日常教學活動中,形成持續的改進循環。 第十二章:總結性評估與成績解釋 關注期末考試、畢業考試等總結性評估。重點討論瞭分數的常模參照(Norm-Referenced)與標準參照(Criterion-Referenced)解釋的差異、適用場景及其潛在的倫理風險。引入瞭專傢組法在確定“及格標準”中的應用,如招募點法(Angoff Method)的實際操作流程。 第十三章:錶現式評估(Performance Assessment)的設計與評分 鑒於對高階思維能力評估的需求增加,本章深入研究瞭錶現式評估(如項目、作品集、口頭報告)的測量挑戰。核心內容包括評分錶(Rubric)的設計原則(清晰度、操作性、層次感)、多維評分的權重分配,以及如何通過校準會議(Calibration Session)來提高評分者間的一緻性。 第十四章:學習成果的組閤式評估:作品集與檔案袋 作品集作為學生長期學習證據的集閤,是深度學習評估的有力工具。本章指導讀者如何確定作品集的評估目標、選擇評估的“證據點”,以及如何在“過程”與“結果”之間取得平衡的評價策略。 --- 第五部分:測量結果的解讀、報告與倫理 評估的價值最終體現在其解釋和應用上,本部分關注評估的倫理責任和結果的有效傳播。 第十五章:測驗的比較與等值化技術 探討如何確保在不同時間、不同版本的測驗中獲得的成績具有可比性。深入解析瞭等值化(Equating)的必要性,包括綫性等值化和非綫性等值化方法的數學基礎,以及其在大型跨年度考試中的應用實例。 第十六章:評估結果的報告與可視化 有效的溝通是評估的最後一步。本章提供瞭麵嚮不同受眾(傢長、學生、行政人員)的報告模闆和技巧。強調使用清晰的圖錶(如能力分布圖、TIF圖示)來傳達測驗的強度與局限,避免使用晦澀的統計術語。 第十七章:教育測量中的公平性與偏誤檢測 本章將倫理置於核心地位。詳述瞭測量工具的文化公平性(Cultural Fairness)問題。重點介紹差異項目功能(Differential Item Functioning, DIF)的統計檢測方法(如Mantel-Haenszel法、秩和檢驗),用以識彆項目對特定群體(如性彆、族裔背景)是否存在係統性偏誤。 第十八章:數字化評估的前沿趨勢與未來展望 麵嚮快速發展的技術環境,本章探討瞭大數據、學習分析(Learning Analytics)對評估的顛覆性影響。討論瞭基於過程數據的評估(Process-Oriented Assessment)的可能性,以及人工智能在自動評分和反饋生成中的角色與挑戰,為評估的未來發展指明方嚮。 --- 本書的每一章節都配有詳盡的案例分析和可供練習的數據集,旨在將復雜的統計模型轉化為教育工作者手中可操作的工具。它不僅是研究生課程的理想教材,也是一綫教師和教育管理者進行係統性評估改革的必備參考手冊。通過本書的學習,讀者將能夠自信地設計、實施、分析並批判性地評估任何教育測量工具,從而真正驅動教學質量的提升。

著者信息

作者簡介

李坤崇


  現職:
  泉州海洋職業學院常務副校長
  南華大學校務顧問
  黑龍江職業學院校務顧

  學歷:
  國立政治大學教育研究所博士
  國立彰化師範大學輔導研究所碩士
  國立彰化師範大學輔導係學士
  省立臺南師專國校師資科畢業

  經歷:
  教育部主任祕書
  國傢教育研究院籌備處主任
  南臺科技大學學術副校長、教育領導與評鑑所教授
  南華大學講座教授兼學術副校長、教務長
  國立成功大學教育研究所教授兼所長、博士生導師
  臺北縣丹鳳小學教師
  香港教育學院「成果導嚮學習」專案研究計畫顧問
  香港中文大學學生活動教育文學碩士課程外審委員
  香港教育大學學位教師教育深造文憑課程外審委員
  澳門大學附屬學校教師長期培訓講座
  黑龍江職業學院校務顧問
  廈門華天涉外職業學院校務顧問
  福建黎明職業大學IEET之TAC/AD認證顧問
  武夷學院玉山健康管理學院講座教授

  齣版專書:
  李坤崇(2018)。成人成纔成功的成果導嚮教育。臺北:高等教育齣版社。
  李坤崇、王曉典、柏定國(2018)。成果導嚮教育與工程教育認證(簡)。哈爾濱:哈爾濱工程大學。
  李坤崇(2018)。成果導嚮教育與工程教育認證實務。臺北:高等教育齣版社。
  李坤崇(2017)。成果導嚮:大學課程發展。臺北:高等教育齣版社。
  李坤崇(2016)。學業評價:多種評價工具的設計及應用(簡)。上海:華東師範大學齣版社。
  李坤崇(2011)。大學課程發展與學習成效評量。臺北:高等教育齣版社。
  李坤崇(2011)。教學評估:多種評價工具的設計及應用(簡)。上海:華東師範大學齣版社。
  李坤崇(2010)。班級團體輔導(簡)。北京:中國人民大學齣版社。
  李坤崇(2009)。認知技能情意教育目標分類及其在評量的應用。臺北:高等教育齣版社。
  李坤崇(2006)。教學目標、能力指標與評量。臺北:高等教育齣版社。
  李坤崇(2006)。教學評量。臺北:心理齣版社。
  李坤崇(2004)。綜閤活動學習領域概論。臺北:心理齣版社。
  李坤崇(2001)。綜閤活動學習領域教材教法。臺北:心理齣版社。
  李坤崇、歐慧敏(1999)。統整課程理念與實務。臺北:心理齣版社。
  李坤崇(1999)。多元化教學評量。臺北:心理齣版社。
  李坤崇(1998)。班級團體輔導。臺北:五南圖書公司。
  吳鐵雄、李坤崇(1997)。師資培育與法令變革的省思。臺北:師大書苑。
 

圖書目錄

第 一 章 學習評量的理念
第一節 多元化學習評量
第二節 人性化學習評量
第三節 精確化學習評量
第四節 統整化學習評量
第五節 改善學習評量之行政配套

第 二 章 教學目標與能力指標、學習錶現
第一節 認知教學目標分類與評量
第二節 情意教學目標
第三節 動作技能教學目標
第四節 能力指標、學習錶現

第 三 章 紙筆測驗編製歷程與原則
第一節 紙筆測驗編製歷程
第二節 各類試題類型的編製原則
第三節 紙筆測驗試捲實例

第 四 章 紙筆測驗的題目分析
第一節 題目分析的理念
第二節 常模參照測驗題目分析
第三節 標準參照測驗題目分析
第四節 試題反應理論的題目分析
第五節 題目篩題原則
第六節 測驗題目分析實例

第 五 章 實作評量理念
第一節 實作評量的意涵
第二節 實作評量的類型
第三節 實作評量的編製
第四節 實作評量的信度與效度

第 六 章 評定量錶及檢核錶理念與實例
第一節 評定量錶
第二節 評定量錶實例
第三節 檢核錶
第四節 檢核錶實例

第 七 章 檔案評量理念與實例
第一節 檔案評量理念
第二節 檔案評量實例

第 八 章 口語評量及軼事記錄理念與實例
第一節 口語評量理念
第二節 口語評量實例
第三節 軼事記錄理念
第四節 軼事記錄實例

第 九 章 係列實作評量理念與實例
第一節 係列實作評量理念
第二節 係列實作評量實例

第 十 章 學期學習評量理念與實例
第一節 學期學習評量理念
第二節 學期學習評量實例

第十一章 學習評量通知單
第一節 呈現學習結果
第二節 學習評量通知單的功能與睏境
第三節 日本中小學評量通知單的實例與解析
第四節 國內學習評量通知單的實例與省思

參考文獻


 

圖書序言

  • ISBN:9789861918747
  • 規格:普通級 / 再版
  • 齣版地:颱灣
  • 檔案格式:EPUB流動版型
  • 建議閱讀裝置:手機、平闆
  • TTS語音朗讀功能:無
  • 檔案大小:113.3MB

圖書試讀



翻轉主體、學生中心、一起成長


  1999年齣版《多元化教學評量》一書,2006年齣版《教學評量》一書,感謝兩岸四地師生的支持,不僅後者四刷齣版,成為臺灣、香港、澳門各大學的教科用書外,更濛大陸華東師範大學齣版社齣版簡體版的《學業評價》一書。隨著兩岸四地的教育改革,教學主體由以教師為中心轉為以學生為中心,由教師的教轉為學生的學,順應此趨勢,乃將本書名更改為《學習評量》。

  教育改革強調「多元評量」,卻讓中小學教師誤以為多元評量就是廢除紙筆測驗,誤以為多元評量就隻是實作評量或檔案評量,誤以為多元纔對一元不對,誤以為多元評量是主觀的評量,誤以為多元評量可以解決所有教學與評量的問題。為釐清誤解,提齣「多元化」、「人性化」、「精確化」、「統整化」教學評量的趨勢。「多元化」教學評量強調專業多元、內涵多元、過程多元、時機多元、情境多元、方式多元、人員多元、計分多元及結果呈現多元化;「人性化」教學評量著重評量中心學生化、教學評量計畫化、評量內涵同理化、結果呈現增強化及結果解釋正嚮化;「精確化」教學評量強化編製歷程標準化、題目編擬通則化、題目分析質量化及結果解釋定錨化;「統整化」教學評量則重視課程與評量計畫化與統整化、教學與評量統閤化與適性化及學期評量計畫化與精緻化。

  2006年有感於中小學教師普遍缺乏編製紙筆測驗、實作評量、檔案評量、口語評量、軼事記錄的基本素養,不會繪製雙嚮細目錶、分析題目品質,使得紙筆測驗未必呼應教學目標、不能評量學生真正學習成果;有感於中小學教師對教學評量的誤解,對教學評量專業素養仍相當不足,及對多元評量理念與實作能力仍待加強,乃齣版《教學評量》一書,期能減少上述現象。然而,十年過去瞭,走訪兩岸四地中小學卻仍存在上述現象。因而,納入十二年國民基本教育課程核心素養的學習錶現,更名後再度彙整成書。

  本書的實例乃源自臺灣各縣市數萬名中小學教師、主任、校長提供寶貴的教學與評量經驗,感謝他們的智慧得以讓理論與實務更為契閤;感謝教育部、各縣市政府教育局(處)提供學習成長的機會,得以跟著實際推動的夥伴共同學習與成長;感謝綜閤活動深耕種子團隊、臺南市後甲國中、臺南市勝利國小吳思穎老師提供實例;感謝心理齣版社刊印成書。期能持續拋磚引玉,激起更多專傢學者與中小學教師、主任、校長的迴響,進而改善學習評量,落實教育改革。

李坤崇 謹識
2019年7月於臺南

 

用戶評價

评分

最後一點,這本書的「可讀性」和「實用性」是決定我會不會推薦給其他人的關鍵。很多學術著作雖然內容紮實,但文字 khô 燥難懂,一堆術語把人繞暈瞭,結果真正想實踐的時候卻無從下手。我希望這本評量專書能夠在理論的嚴謹性和實務操作的便利性之間找到平衡點。它有沒有提供大量的「評量工具範例」?比如,一份針對高中生探究與實作的評分規準(Rubric)應該長什麼樣子?一份針對國小低年級閱讀理解的口語評量設計草稿會是怎樣?如果書中能穿插一些實際的課堂情境,讓我們能馬上對照自己的教學經驗,邊讀邊思考「我下次的考捲可以怎麼改」,那纔是一本真正有用的工具書。不然,光是理解評量的各種測量學標準,對日常教學的幫助其實很有限。

评分

身為一個對教育改革有高度關注的讀者,我對「評量目的」的探討非常重視。評量到底是為瞭「診斷學習睏難,進行補救教學」,還是為瞭「對學生、教師、學校進行升等或處罰」?這兩種目的,會徹底改變我們設計試題和解讀分數的態度。如果目的是後者,大傢就會傾嚮於設計那些容易「得分」、容易「量化」的題目,反而犧牲瞭真正有深度的探究。我希望這本書能旗幟鮮明地支持形成性評量(Formative Assessment)的價值,強調評量是為瞭「促進學習」,而不是「衡量學習結果」這麼單一。它有沒有提到如何培訓教師,讓他們能更有效地根據評量迴饋,即時調整自己的教學策略?畢竟,評量做得再好,如果老師不知道怎麼解讀分數背後的意義,或者沒有時間去做後續的教學調整,那所有的努力都白費瞭。這本書如果能提供一套完整的「評量迴路」(Assessment Loop)的實踐指南,那價值就不隻是一本教科書瞭。

评分

說真的,颱灣的教育體係就是這樣,總是在追求「標準化」和「多元化」之間拉扯。這本《學習評量》如果能提供一個平衡點,我會給它高分。我比較好奇的是,它怎麼處理「公平性」的問題。你看,城鄉差距、不同資源學校的差異,都會直接影響到學生的學習錶現。當我們設計瞭一個看似很客觀的評量標準時,是不是真的能涵蓋到所有學生的起點?尤其是一些特殊教育的需求,或者傢庭背景差異大的學生,他們的學習歷程和展現齣來的成果本來就不一樣。傳統的量化評量常常會忽略這些脈絡,讓優秀但非主流的學習者被埋沒。我希望這本書能深入探討如何建立一個更具包容性的評量框架,可能要多談談質性評量在大型評鑑中的應用,或者如何透過「歷程性檔案」來補足期末考捲的不足。如果內容隻是停留在解釋信效度這些基礎統計概念,那對我們這些天天在跟學生互動的老師來說,幫助可能就有限瞭,畢竟理論要能落地,纔能解決現場的痛點啊。

评分

這本關於學習評量的書,光是看到「第二版」就讓人忍不住想翻開來看看,畢竟教育現場的東西變化得快,舊的觀念可能早就跟不上現在的需求瞭。我最期待的是它在「數位化評量」這塊有沒有加強。想當年我們在學校裡,評量製度總是跟不上時代,每次遇到新的教學法,評量方式卻還停留在考選擇題和寫申論題的階段,學生學瞭那麼多創新的知識,最後還是得迴到老一套的測驗方式,實在很可惜。希望這本書能針對現在很多學校推行的PBL(專題式學習)或素養導嚮教學,提供一些真正能反映學生「能力」而非僅是「知識記憶」的評量工具和設計邏輯。特別是現在AI工具這麼發達,我們怎麼評估學生的批判性思考和解決問題的能力,而不是他們能不能用AI快速找齣答案,這纔是關鍵。如果它能提供一些實用的案例,讓我們這些第一線的老師在設計校本評量時更有底氣,那就太棒瞭,不然每次要創新評量,自己摸索真的很辛苦。

评分

讓我換個角度來看,這本書的「第二版」對比前一版,在「資訊素養與數據分析」這一塊的著墨想必增加瞭不少吧?現在我們手邊有這麼多電子化測驗的數據,每次測完一大堆報錶齣來,很多老師看瞭也是一頭霧水,不知道哪些數據真正指嚮教學上的盲點。我真正想知道的是,它有沒有提供一些「使用者友善」的數據解讀方法,而不是一堆艱澀難懂的統計術語?例如,如何從「項目反應理論」(IRT)的分析結果中,反推我們的題目設計是不是有偏見?或者,如何用儀錶闆(Dashboard)的方式,讓校長和傢長都能快速掌握學生的學習圖像?如果它隻是老調重彈過去那套「平均數、標準差」的敘述統計,那對現今重視大數據分析的教育環境來說,實在是太保守瞭。我們需要的是能將冰冷的數字轉化為具體教學行動的「智慧解方」。

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版權所有