物理教育领域四阶诊断测试研究综述

摘要
本研究旨在系统梳理物理教育领域中运用四阶测试诊断迷思概念的相关研究。研究选取 2010-2022 年间的 69 项符合标准的文献,其中 58 项以开发四阶迷思概念测试工具为核心目标,11 项直接运用已有的四阶诊断测试开展学习者迷思概念诊断(未涉及工具开发环节)。从发表类型、发表年份、作者数量、论文篇幅、工具原创性,以及测试涉及的物理主题、目标迷思概念数量、迷思概念判定标准、信效度检验方法、测试题量等维度进行了全面分析。研究发现,印度尼西亚是开展相关研究最多的国家;令人意外的是,现有研究对迷思概念的判定标准尚未形成共识;同时,多数研究未明确报告测试工具开发的关键环节信息。
关键词:四阶测试;迷思概念;物理教育
研究方法
本研究为综述研究。综述研究的主要目的包括:
(1)勾勒特定主题的研究趋势;(2)呈现该领域的研究现状;(3)识别已有研究结果的不一致性并解释其原因;(4)评价现有研究方法;(5)构建概念框架以整合和拓展已有研究;(6)指出研究洞见、现有空白和未来研究方向。
本研究通过系统梳理物理教育领域四阶测试的相关研究,为迷思概念研究者提供参考,同时为更高效地开发四阶诊断测试提供依据。
研究结果
全球首个四阶诊断测试由 Caleon 和 Subramaniam 于 2010 年在新加坡开发,主题为波现象,该研究基于 Caleon 同年的博士论文。四阶测试已覆盖电磁学、光学、热力学、运动学、动力学、引力、能量、冲量与动量、流体、波、振动、相对论、密度、压强、物质变化等多个物理主题。本研究系统梳理了 2010-2022 年间物理教育领域 69 项四阶诊断测试相关研究,其中 58 项为工具开发类,11 项为工具应用类。…
研究建议与局限性
本研究仅检索了指定数据库中 2010-2022 年间发表的英文和土耳其文全文文献,未纳入印尼文等其他语言的研究,这是本研究的主要局限性。Dirman 等人的研究中,38/50 的文献为印尼文,未来可进一步拓展检索范围。此外,本研究仅分析了发表特征、样本特征、工具特征和信效度等维度,未来可进一步探究四阶测试的诊断效果、与其他诊断工具的比较等问题。
基于研究结果,提出以下建议:
- 规范测试开发流程:研究者应完整报告测试开发的所有关键环节,包括原创性说明、开发方法、样本信息、题量、目标迷思概念、判定标准、信效度检验方法及结果等。
- 统一迷思概念判定标准:学界应尽快就四阶测试的迷思概念判定标准达成共识,以提高研究结果的可比性。
- 保证样本量充足:开展信效度检验时,样本量应至少达到 100 人,以确保统计结果的可靠性。
- 拓展研究主题和地域:目前四阶测试主要集中在基础物理领域,且仅在三个国家开展,未来应拓展至近代物理、天体物理等主题,并在更多国家推广应用。
- 完善信效度检验:除内容效度外,应加强结构效度和效标效度的检验;信度检验可结合多种方法,全面评估工具的稳定性。
- 提高测试诊断精度:适当增加每个迷思概念对应的测试题量,建议每个迷思概念至少对应 2-3 道题。
Kanlı和 Ilıcan 的研究发现,不同评估形式会显著影响学生的成绩和迷思概念诊断结果。因此,开发更多高质量、多主题的四阶诊断测试,对于准确诊断学生的迷思概念、优化物理教学具有重要意义。