學習評量 (第二版) (電子書)

學習評量 (第二版) (電子書) pdf epub mobi txt 电子书 下载 2025

李坤崇
图书标签:
  • 學習評量
  • 教育評量
  • 測驗與評量
  • 教學評量
  • 評量工具
  • 教育心理學
  • 第二版
  • 電子書
  • 學習科學
  • 評量理論
想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

  本書旨在探討學習評量理念與實例,內容包括三大部分:第一部分闡述學習評量理念,及教學目標與能力指標、學習表現;第二部分申述紙筆測驗與實作評量理念,及紙筆測驗編製與題目分析、評定量表、檢核表、檔案評量之實例;第三部分剖析學期學習評量理念與實例,及學習評量通知單。

  全書最大特色在整合理論與實務,從理念發展出豐富的實作成果。除闡述多元評量理念外,更提出豐富、多元、實用的紙筆測驗、實作評量、檔案評量、口語評量、軼事記錄與系列實作評量的實例。力求將理論實用化與簡便化、應用人性化與多元化,讓學習者易於上手,從實例體會中提升學習效能。
 
《教育测量与评估原理:深度解析与实践指南(第三版)》 图书简介 本书旨在为教育工作者、课程设计师、政策制定者以及教育研究人员提供一个全面、深入且极具实践指导意义的教育测量与评估框架。作为该领域的权威著作,第三版在继承前两版坚实理论基础之上,融入了最新的心理测量学研究成果、技术发展以及全球教育实践中的前沿趋势,特别是对数字化转型背景下的评估方法进行了重点拓展和深化。 本书结构严谨,内容涵盖了从基础概念到复杂模型构建的全过程,确保读者不仅理解“是什么”,更能掌握“如何做”以及“为何要这样做”。全书共分为五大部分,三十余章,逻辑清晰地引导读者构建起一套系统化的评估思维体系。 --- 第一部分:教育测量与评估的基石 本部分着重奠定理论基础,探讨测量在教育科学中的核心地位和哲学基础。 第一章:教育测量学的演进与核心概念 深入剖析测量学的历史脉络,从传统客观测量的局限性,过渡到现代信度和效度的现代解释。本章详细阐述了教育测量中“特质(Trait)”、“结构(Construct)”和“表现(Performance)”这三个核心概念的辩证关系,并引入了关于教育公平与伦理在测量设计初期的考量。我们探讨了定量与定性评估范式之间的互补性,强调评估的根本目的在于改进教学而非单纯的筛选排序。 第二章:测量尺度与数据分布 对经典的斯蒂尔斯(Stevens)测量尺度——定类、定序、定距、定比——进行详尽的介绍与应用场景分析。本章强调了不同测量尺度对后续统计分析方法的制约性。此外,深入讲解了正态分布、偏态分布以及非常态分布在教育数据中的实际表现,并引入了描述性统计工具,如集中趋势、离散程度以及形态指标的精确计算与解释,为读者后续的数据解读做好准备。 第三章:信度:测量的稳定性和一致性 信度是评估工具质量的生命线。本章系统梳理了信度的四大主要来源:重测信度、复本信度、内部一致性信度(包括分半法和Cronbach's $alpha$的深入应用与局限),以及评分者信度。特别地,本章引入了信度的“标准误差(Standard Error of Measurement, SEM)”概念,并展示了如何利用SEM构建真正具有个体意义的预测区间,超越了对单一信度系数的盲目崇拜。 第四章:效度:测量的真实性和有效性 效度是测量工作的核心目标。本书采用现代效度理论框架,将效度解释为一系列累积的证据链。详细阐述了内容效度(Content Validity)的系统化构建过程,标准参照效度(Criterion-Related Validity,包括预测效度和同期效度),以及结构效度(Construct Validity)的复杂性,包括探索性因子分析(EFA)和验证性因子分析(CFA)在证据收集中的作用。本章强调效度论证是一个持续的、基于理论的论证过程,而非一次性的检验。 --- 第二部分:经典测验理论(CTT)的深度应用与拓展 本部分专注于教育测量中最常用且最基础的理论模型——CTT,并探讨其在实际命题设计中的挑战与优化。 第五章:项目分析与项目特征曲线(ICC) 项目分析是优化试题质量的关键步骤。本章详述了难度(P值)和区分度(r系数)的计算与解释。在对二分法项目进行分析后,本章引入了项目特征曲线(Item Characteristic Curve, ICC)的概念,并初步展示了如何通过曲线的形状来判断题目的信息量分布,为后续项目反应理论(IRT)的介绍做铺垫。 第六章:测验编排与样本量估算 高质量的测验需要科学的编排。本章指导读者如何根据测验目标、时间限制以及信度要求,运用等值化技术(Equating)和项目池管理(Item Banking)来构建出平衡的试题集。同时,针对不同测量目的(如形成性评估、总结性评估、诊断性评估),提供了详尽的样本量和测验长度的统计学依据。 第七章:CTT下的误差来源与偏差控制 超越了随机误差,本章聚焦于系统性误差和偏误(Bias)。探讨了题型选择、施测情境、评分者主观性以及文化背景可能对测量结果产生的系统性影响。本章提出了针对性强的质量控制清单(Checklist),以帮助实践者在测试开发阶段识别并最小化这些非抽样误差。 --- 第三部分:现代测验理论:项目反应理论(IRT) 本部分是本书的技术核心,深入讲解了IRT如何解决经典理论中的诸多局限,尤其是在自适应测验中的应用。 第八章:IRT的基本假设与模型 详细阐述了IRT的两个核心假设:局部独立性和项目同质性。全面介绍了最常用的三大模型: 单参数模型(1PL,Rasch模型): 侧重于难度参数的估计,适用于测量同质性高的特质。 双参数模型(2PL): 引入了区分度参数,能够更精确地衡量项目的信息含量。 三参数模型(3PL): 引入猜测参数($c$值),更适用于多选题或有猜测空间的测试。 第九章:项目信息函数(Item Information Function, IIF)与测验信息函数(Test Information Function, TIF) 这是IRT相较于CTT的重大优势。本章着重讲解如何通过IIF曲线来直观判断一个项目在哪个能力水平上提供最大信息量。进而,通过叠加和整合IIF,推导出TIF,帮助评估人员科学地确定“最佳”的测试长度,确保在所需能力范围内的测量精度最大化,实现资源的最优配置。 第十章:IRT在能力估计与测验编排中的应用 演示了如何利用贝叶斯最大似然估计(MLE)进行能力参数 ($ heta$) 的估计。重点阐述了IRT在计算机化自适应测验(CAT)中的核心算法,包括项目抽取策略(如最大信息量策略、贝叶斯后验均值策略)和停止规则的设定,这是现代标准化考试的核心技术。 --- 第四部分:评估的类型、设计与实施 本部分将理论与教育实践紧密结合,探讨不同评估目的下的具体操作方法。 第十一章:形成性评估与反馈机制的构建 强调形成性评估的“评估为了学习(Assessment for Learning)”理念。本章详细介绍了反馈的质量标准(及时性、针对性、可行性),并探讨了基于标准或表现的反馈设计,以及如何利用“评估契机(Assessment Opportunities)”嵌入到日常教学活动中,形成持续的改进循环。 第十二章:总结性评估与成绩解释 关注期末考试、毕业考试等总结性评估。重点讨论了分数的常模参照(Norm-Referenced)与标准参照(Criterion-Referenced)解释的差异、适用场景及其潜在的伦理风险。引入了专家组法在确定“及格标准”中的应用,如招募点法(Angoff Method)的实际操作流程。 第十三章:表现式评估(Performance Assessment)的设计与评分 鉴于对高阶思维能力评估的需求增加,本章深入研究了表现式评估(如项目、作品集、口头报告)的测量挑战。核心内容包括评分表(Rubric)的设计原则(清晰度、操作性、层次感)、多维评分的权重分配,以及如何通过校准会议(Calibration Session)来提高评分者间的一致性。 第十四章:学习成果的组合式评估:作品集与档案袋 作品集作为学生长期学习证据的集合,是深度学习评估的有力工具。本章指导读者如何确定作品集的评估目标、选择评估的“证据点”,以及如何在“过程”与“结果”之间取得平衡的评价策略。 --- 第五部分:测量结果的解读、报告与伦理 评估的价值最终体现在其解释和应用上,本部分关注评估的伦理责任和结果的有效传播。 第十五章:测验的比较与等值化技术 探讨如何确保在不同时间、不同版本的测验中获得的成绩具有可比性。深入解析了等值化(Equating)的必要性,包括线性等值化和非线性等值化方法的数学基础,以及其在大型跨年度考试中的应用实例。 第十六章:评估结果的报告与可视化 有效的沟通是评估的最后一步。本章提供了面向不同受众(家长、学生、行政人员)的报告模板和技巧。强调使用清晰的图表(如能力分布图、TIF图示)来传达测验的强度与局限,避免使用晦涩的统计术语。 第十七章:教育测量中的公平性与偏误检测 本章将伦理置于核心地位。详述了测量工具的文化公平性(Cultural Fairness)问题。重点介绍差异项目功能(Differential Item Functioning, DIF)的统计检测方法(如Mantel-Haenszel法、秩和检验),用以识别项目对特定群体(如性别、族裔背景)是否存在系统性偏误。 第十八章:数字化评估的前沿趋势与未来展望 面向快速发展的技术环境,本章探讨了大数据、学习分析(Learning Analytics)对评估的颠覆性影响。讨论了基于过程数据的评估(Process-Oriented Assessment)的可能性,以及人工智能在自动评分和反馈生成中的角色与挑战,为评估的未来发展指明方向。 --- 本书的每一章节都配有详尽的案例分析和可供练习的数据集,旨在将复杂的统计模型转化为教育工作者手中可操作的工具。它不仅是研究生课程的理想教材,也是一线教师和教育管理者进行系统性评估改革的必备参考手册。通过本书的学习,读者将能够自信地设计、实施、分析并批判性地评估任何教育测量工具,从而真正驱动教学质量的提升。

著者信息

作者簡介

李坤崇


  現職:
  泉州海洋職業學院常務副校長
  南華大學校務顧問
  黑龍江職業學院校務顧

  學歷:
  國立政治大學教育研究所博士
  國立彰化師範大學輔導研究所碩士
  國立彰化師範大學輔導系學士
  省立臺南師專國校師資科畢業

  經歷:
  教育部主任祕書
  國家教育研究院籌備處主任
  南臺科技大學學術副校長、教育領導與評鑑所教授
  南華大學講座教授兼學術副校長、教務長
  國立成功大學教育研究所教授兼所長、博士生導師
  臺北縣丹鳳小學教師
  香港教育學院「成果導向學習」專案研究計畫顧問
  香港中文大學學生活動教育文學碩士課程外審委員
  香港教育大學學位教師教育深造文憑課程外審委員
  澳門大學附屬學校教師長期培訓講座
  黑龍江職業學院校務顧問
  廈門華天涉外職業學院校務顧問
  福建黎明職業大學IEET之TAC/AD認證顧問
  武夷學院玉山健康管理學院講座教授

  出版專書:
  李坤崇(2018)。成人成才成功的成果導向教育。臺北:高等教育出版社。
  李坤崇、王曉典、柏定國(2018)。成果導向教育與工程教育認證(簡)。哈爾濱:哈爾濱工程大學。
  李坤崇(2018)。成果導向教育與工程教育認證實務。臺北:高等教育出版社。
  李坤崇(2017)。成果導向:大學課程發展。臺北:高等教育出版社。
  李坤崇(2016)。學業評價:多種評價工具的設計及應用(簡)。上海:華東師範大學出版社。
  李坤崇(2011)。大學課程發展與學習成效評量。臺北:高等教育出版社。
  李坤崇(2011)。教學評估:多種評價工具的設計及應用(簡)。上海:華東師範大學出版社。
  李坤崇(2010)。班級團體輔導(簡)。北京:中國人民大學出版社。
  李坤崇(2009)。認知技能情意教育目標分類及其在評量的應用。臺北:高等教育出版社。
  李坤崇(2006)。教學目標、能力指標與評量。臺北:高等教育出版社。
  李坤崇(2006)。教學評量。臺北:心理出版社。
  李坤崇(2004)。綜合活動學習領域概論。臺北:心理出版社。
  李坤崇(2001)。綜合活動學習領域教材教法。臺北:心理出版社。
  李坤崇、歐慧敏(1999)。統整課程理念與實務。臺北:心理出版社。
  李坤崇(1999)。多元化教學評量。臺北:心理出版社。
  李坤崇(1998)。班級團體輔導。臺北:五南圖書公司。
  吳鐵雄、李坤崇(1997)。師資培育與法令變革的省思。臺北:師大書苑。
 

图书目录

第 一 章 學習評量的理念
第一節 多元化學習評量
第二節 人性化學習評量
第三節 精確化學習評量
第四節 統整化學習評量
第五節 改善學習評量之行政配套

第 二 章 教學目標與能力指標、學習表現
第一節 認知教學目標分類與評量
第二節 情意教學目標
第三節 動作技能教學目標
第四節 能力指標、學習表現

第 三 章 紙筆測驗編製歷程與原則
第一節 紙筆測驗編製歷程
第二節 各類試題類型的編製原則
第三節 紙筆測驗試卷實例

第 四 章 紙筆測驗的題目分析
第一節 題目分析的理念
第二節 常模參照測驗題目分析
第三節 標準參照測驗題目分析
第四節 試題反應理論的題目分析
第五節 題目篩題原則
第六節 測驗題目分析實例

第 五 章 實作評量理念
第一節 實作評量的意涵
第二節 實作評量的類型
第三節 實作評量的編製
第四節 實作評量的信度與效度

第 六 章 評定量表及檢核表理念與實例
第一節 評定量表
第二節 評定量表實例
第三節 檢核表
第四節 檢核表實例

第 七 章 檔案評量理念與實例
第一節 檔案評量理念
第二節 檔案評量實例

第 八 章 口語評量及軼事記錄理念與實例
第一節 口語評量理念
第二節 口語評量實例
第三節 軼事記錄理念
第四節 軼事記錄實例

第 九 章 系列實作評量理念與實例
第一節 系列實作評量理念
第二節 系列實作評量實例

第 十 章 學期學習評量理念與實例
第一節 學期學習評量理念
第二節 學期學習評量實例

第十一章 學習評量通知單
第一節 呈現學習結果
第二節 學習評量通知單的功能與困境
第三節 日本中小學評量通知單的實例與解析
第四節 國內學習評量通知單的實例與省思

參考文獻


 

图书序言

  • ISBN:9789861918747
  • 規格:普通級 / 再版
  • 出版地:台灣
  • 檔案格式:EPUB流動版型
  • 建議閱讀裝置:手機、平板
  • TTS語音朗讀功能:無
  • 檔案大小:113.3MB

图书试读



翻轉主體、學生中心、一起成長


  1999年出版《多元化教學評量》一書,2006年出版《教學評量》一書,感謝兩岸四地師生的支持,不僅後者四刷出版,成為臺灣、香港、澳門各大學的教科用書外,更蒙大陸華東師範大學出版社出版簡體版的《學業評價》一書。隨著兩岸四地的教育改革,教學主體由以教師為中心轉為以學生為中心,由教師的教轉為學生的學,順應此趨勢,乃將本書名更改為《學習評量》。

  教育改革強調「多元評量」,卻讓中小學教師誤以為多元評量就是廢除紙筆測驗,誤以為多元評量就只是實作評量或檔案評量,誤以為多元才對一元不對,誤以為多元評量是主觀的評量,誤以為多元評量可以解決所有教學與評量的問題。為釐清誤解,提出「多元化」、「人性化」、「精確化」、「統整化」教學評量的趨勢。「多元化」教學評量強調專業多元、內涵多元、過程多元、時機多元、情境多元、方式多元、人員多元、計分多元及結果呈現多元化;「人性化」教學評量著重評量中心學生化、教學評量計畫化、評量內涵同理化、結果呈現增強化及結果解釋正向化;「精確化」教學評量強化編製歷程標準化、題目編擬通則化、題目分析質量化及結果解釋定錨化;「統整化」教學評量則重視課程與評量計畫化與統整化、教學與評量統合化與適性化及學期評量計畫化與精緻化。

  2006年有感於中小學教師普遍缺乏編製紙筆測驗、實作評量、檔案評量、口語評量、軼事記錄的基本素養,不會繪製雙向細目表、分析題目品質,使得紙筆測驗未必呼應教學目標、不能評量學生真正學習成果;有感於中小學教師對教學評量的誤解,對教學評量專業素養仍相當不足,及對多元評量理念與實作能力仍待加強,乃出版《教學評量》一書,期能減少上述現象。然而,十年過去了,走訪兩岸四地中小學卻仍存在上述現象。因而,納入十二年國民基本教育課程核心素養的學習表現,更名後再度彙整成書。

  本書的實例乃源自臺灣各縣市數萬名中小學教師、主任、校長提供寶貴的教學與評量經驗,感謝他們的智慧得以讓理論與實務更為契合;感謝教育部、各縣市政府教育局(處)提供學習成長的機會,得以跟著實際推動的夥伴共同學習與成長;感謝綜合活動深耕種子團隊、臺南市後甲國中、臺南市勝利國小吳思穎老師提供實例;感謝心理出版社刊印成書。期能持續拋磚引玉,激起更多專家學者與中小學教師、主任、校長的迴響,進而改善學習評量,落實教育改革。

李坤崇 謹識
2019年7月於臺南

 

用户评价

评分

讓我換個角度來看,這本書的「第二版」對比前一版,在「資訊素養與數據分析」這一塊的著墨想必增加了不少吧?現在我們手邊有這麼多電子化測驗的數據,每次測完一大堆報表出來,很多老師看了也是一頭霧水,不知道哪些數據真正指向教學上的盲點。我真正想知道的是,它有沒有提供一些「使用者友善」的數據解讀方法,而不是一堆艱澀難懂的統計術語?例如,如何從「項目反應理論」(IRT)的分析結果中,反推我們的題目設計是不是有偏見?或者,如何用儀表板(Dashboard)的方式,讓校長和家長都能快速掌握學生的學習圖像?如果它只是老調重彈過去那套「平均數、標準差」的敘述統計,那對現今重視大數據分析的教育環境來說,實在是太保守了。我們需要的是能將冰冷的數字轉化為具體教學行動的「智慧解方」。

评分

身為一個對教育改革有高度關注的讀者,我對「評量目的」的探討非常重視。評量到底是為了「診斷學習困難,進行補救教學」,還是為了「對學生、教師、學校進行升等或處罰」?這兩種目的,會徹底改變我們設計試題和解讀分數的態度。如果目的是後者,大家就會傾向於設計那些容易「得分」、容易「量化」的題目,反而犧牲了真正有深度的探究。我希望這本書能旗幟鮮明地支持形成性評量(Formative Assessment)的價值,強調評量是為了「促進學習」,而不是「衡量學習結果」這麼單一。它有沒有提到如何培訓教師,讓他們能更有效地根據評量回饋,即時調整自己的教學策略?畢竟,評量做得再好,如果老師不知道怎麼解讀分數背後的意義,或者沒有時間去做後續的教學調整,那所有的努力都白費了。這本書如果能提供一套完整的「評量迴路」(Assessment Loop)的實踐指南,那價值就不只是一本教科書了。

评分

這本關於學習評量的書,光是看到「第二版」就讓人忍不住想翻開來看看,畢竟教育現場的東西變化得快,舊的觀念可能早就跟不上現在的需求了。我最期待的是它在「數位化評量」這塊有沒有加強。想當年我們在學校裡,評量制度總是跟不上時代,每次遇到新的教學法,評量方式卻還停留在考選擇題和寫申論題的階段,學生學了那麼多創新的知識,最後還是得回到老一套的測驗方式,實在很可惜。希望這本書能針對現在很多學校推行的PBL(專題式學習)或素養導向教學,提供一些真正能反映學生「能力」而非僅是「知識記憶」的評量工具和設計邏輯。特別是現在AI工具這麼發達,我們怎麼評估學生的批判性思考和解決問題的能力,而不是他們能不能用AI快速找出答案,這才是關鍵。如果它能提供一些實用的案例,讓我們這些第一線的老師在設計校本評量時更有底氣,那就太棒了,不然每次要創新評量,自己摸索真的很辛苦。

评分

說真的,台灣的教育體系就是這樣,總是在追求「標準化」和「多元化」之間拉扯。這本《學習評量》如果能提供一個平衡點,我會給它高分。我比較好奇的是,它怎麼處理「公平性」的問題。你看,城鄉差距、不同資源學校的差異,都會直接影響到學生的學習表現。當我們設計了一個看似很客觀的評量標準時,是不是真的能涵蓋到所有學生的起點?尤其是一些特殊教育的需求,或者家庭背景差異大的學生,他們的學習歷程和展現出來的成果本來就不一樣。傳統的量化評量常常會忽略這些脈絡,讓優秀但非主流的學習者被埋沒。我希望這本書能深入探討如何建立一個更具包容性的評量框架,可能要多談談質性評量在大型評鑑中的應用,或者如何透過「歷程性檔案」來補足期末考卷的不足。如果內容只是停留在解釋信效度這些基礎統計概念,那對我們這些天天在跟學生互動的老師來說,幫助可能就有限了,畢竟理論要能落地,才能解決現場的痛點啊。

评分

最後一點,這本書的「可讀性」和「實用性」是決定我會不會推薦給其他人的關鍵。很多學術著作雖然內容紮實,但文字 khô 燥難懂,一堆術語把人繞暈了,結果真正想實踐的時候卻無從下手。我希望這本評量專書能夠在理論的嚴謹性和實務操作的便利性之間找到平衡點。它有沒有提供大量的「評量工具範例」?比如,一份針對高中生探究與實作的評分規準(Rubric)應該長什麼樣子?一份針對國小低年級閱讀理解的口語評量設計草稿會是怎樣?如果書中能穿插一些實際的課堂情境,讓我們能馬上對照自己的教學經驗,邊讀邊思考「我下次的考卷可以怎麼改」,那才是一本真正有用的工具書。不然,光是理解評量的各種測量學標準,對日常教學的幫助其實很有限。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有