OECD数字教育展望2026——第十一章

第十一章:机构工作流程中的人工智能:从高等教育中汲取经验,为教育系统和机构开辟新机遇

引文

本章探讨了生成式人工智能 (GenAI) 的新兴作用、其构建的一些技术及其人工智能前身在高等教育后端功能中的作用,包括课程衔接、学生转学、建议、招生和内容基础设施。与人工智能的教学用途不同,人工智能的教学用途通常侧重于作为最终用户的学习者,这里讨论的系统通常面向管理员或员工,或者嵌入到机构级别安装的教育平台中,以产生见解、降低任务复杂性并支持学术路径导航(Kizilcec 等人,2023[1])。在大多数情况下,工具背后的人工智能模型利用在宏观或中观层面而不是微观层面收集的数据(例如学习过程数据:Fischer 等人,2020[2])。

本章借鉴最近的研究、案例研究和早期原型,确定人工智能如何能够

  • 支持跨机构边界的学分流动性和转移预测
  • 支持学术建议,例如个性化课程和专业推荐以及课程分析
  • 诊断新机会以加强招生和资源分配,以及
  • 构建学习内容和课程组件的分类、标记和重用

虽然并非所有这些工具都涉及生成式人工智能作为内容创建或直接与终端用户交互的手段,但许多工具依赖于机器学习、自然语言处理和表征学习(如嵌入),这些技术正是生成式人工智能的核心,用以支持机构决策。本章将宏观层面的机构基础设施置于前沿,视为解锁更具循证性、个性化、数据驱动、以学生服务为本的高等教育生态系统的关键创新场所。虽然本章聚焦于高等教育层面的研究,但许多所讨论的可能性与中等教育部门也相关——在系统层面而非机构层面——以及支持终身学习。

新兴机遇

通过人工智能等价模型促进学习流动性

当学生在教育阶段或系统之间流动时,他们获得学习认可的能力可能是决定其最终学术成功的关键因素。在美国,例如当学生从两年制社区学院转入四年制大学时,被称为“课程衔接协议”的协议规定了他们将获得多少学分以及这些学分可以满足哪些要求。同样,通过行业专业证书获得的先前学习,若试图被认定为等同于机构课程学分,则被称为“先前学习学分”(CPL)(Lakin, Seymour and Crandall, 2015[3])。在其他国家,当个人希望改变学习路径、从两年制学习项目转入学士学位、改变传统学习路径外的高等教育机构等情况时,也会出现同样的问题。这也可能在国外学位国际认可的框架下发生——用于国际学生流动或专业流动。从一个分类体系中证明对某一技能的掌握,然后寻求在另一个相似分类体系中获得认可,需要对分类体系进行映射或交叉对应(Li et al., 2021[4])。

这些学分和学习认可的变体对学生在高等教育中的成功至关重要;然而,这些协议历来是由人工构建和维护的,通常存在缺失或不均衡分配的流动路径,偏向于来自社会经济地位较高机构的学分(Pizarro Milian and Aurini, 2025[5]; Goulart and Pardos, 2025[6])。生成式人工智能及其背后的自然语言处理技术能够且正在越来越多地被用于解决这些缺陷,其方式具有公平扩展的潜力。

使用人工智能表征学生路径

更好地映射不同类型和水平教育项目的一个有前景方向是使用人工智能技术识别课程之间的相似性。这涉及将课程内容表征为人工智能向量嵌入(参见专栏11.1),从而能够在数千门课程中进行语义相似性比较。这种表征可以由自然语言信号(如标题和课程目录描述)提供信息,也可以由历史注册数据提供信息,即学生在高等教育项目中实际选择的课程。利用后者,Pardos和Nam(2020[7])可视化了一所大型公立大学开设课程的语义拓扑结构(图11.1),并查询了底层课程向量表征以揭示课程之间的差异。例如,当被问及计量经济学和高级计量经济学课程之间的区别时,模型正确地回答了“线性代数”。考虑到当代大语言模型访问大量数据的能力,这或许不会令人惊讶;然而,这个例子中的模型仅使用了课程注册历史,展示了这些模型在数据量更有限的情况下也能有效运作。课程向量的有效性后来在成功预测学生课程工作量感知(Borchers and Pardos, 2023[8])方面得到证明,在先修课程预测(Recall@10 = 0.70)和平均注册预测(RMSE = 42.48)方面也表现出色,如Jiang和Pardos(2020[9])所述。

专栏11.1. 人工智能向量嵌入

嵌入可以被认为是人工智能用来组织其对某个领域认知的结构。神经网络——ChatGPT和自动驾驶汽车背后的人工智能类型——以嵌入空间中的向量方式进行“思考”。它们接收一个输入(例如一幅图像)并将其转换为一个向量,然后可以通过一系列矩阵操作进行操作(例如一幅图像因乘法而被缩放或旋转)。现代人工智能通常被训练来预测句子中的下一个词,或者更一般地预测序列中的下一个项目,或者填补过去数据序列中的空白。为了高效地做到这一点,人工智能必须捕捉到允许其将过去观察到的(即训练数据)泛化到新场景的模式和相似性。它通过组织嵌入“空间”来做到这一点,识别这些模式,例如将同义词在空间中放置得彼此接近,或者给具有相同关系的词对(例如巴黎 -> 法国,首尔 -> 韩国)在向量空间中赋予相似的相对距离(例如,一个首都的向量在空间中可能位于其国家向量下方约两个单位并向左一个单位的位置)。这种空间表征是神经网络编码其从数据中学到的(即泛化的)内容的方式。当它们过度泛化时,可能会表现为幻觉(例如,当预期的首都向量不在相对于国家的预期偏移位置时,人工智能随后给出错误答案)。

向量空间通常有数百到数千个维度。截至本撰写之时,OpenAI为其小模型提供1536维向量,大模型提供3072维。在高等教育工作流程中利用向量(即生成和下载向量)而非查询大语言模型,是在不必依赖实时查询和产生持续API成本的情况下利用现代人工智能力量的一种方式。当自然语言交互不是目标时,这是一种实用的方法。扩展研究社区提供了免费的向量嵌入(例如http://www.sbert.net)。

11.1. 一所大型公立大学的课程投影

注:投影是从一个神经网络表征模型(即课程向量嵌入)学习得到的,仅基于历史课程注册序列。

来源:Pardos and Nam, (2020[7]), “A university map of course knowledge”, PLOS ONE, Vol. 15/9, https://doi.org/10.1371/journal.pone.0233207.

机构内的历史注册数据也可以被人工智能利用,使用驱动生成式人工智能的同类神经网络来学习和提供课程推荐路径(Shao, Guo and Pardos, 2021[10])。就像生成式模型可以完成你的句子一样,这个应用于课程注册的类似模型可以完成学生的课程序列,包括必要的必修课程并培养个人兴趣以满足选修课要求。

这些投影是通过使用t-SNE将课程向量降维到二维生成的。这个空间可以向院长或其他管理人员建议:某系在哪些领域具有集中优势,以及哪些“相邻”系可以与之合作以弥补专业课程的不足或共同建设一个专业。如果另一机构的课程向量被叠加到这个空间上,就可以建议机构之间在哪里互补、在哪里对齐,以及在哪里可以改进预期的对齐。

机构间的人工智能辅助项目对接

除了单一机构的课程规划和推荐外,人工智能还可以支持跨机构课程等价模型的发展和维护——这是高等教育学位项目之间学生转学的关键推动因素,也是终身学习和先前学习认可促进因素。例如,在美国,先在当地更负担得起的社区学院开始学习,然后转入学士学位项目,一直是社会和经济向上流动的最大来源(Johnson, 2020[11])。同样,在欧盟,欧洲学分互认和积累系统(ECTS)旨在通过标准化学习成果在机构间的测量和认可方式来促进学生流动(Grosges and Barchiesi, 2007[12])。然而,在实践中,交流项目和机构转学的现实往往涉及为特定课程获得学位要求认证的谈判。在这两种情况下,机构之间的课程等价协议都是使学分转移按预期运作所必需的(Ignash and Townsend, 2000[13])。在许多高等教育系统中,衔接和学分转移仍然是耗时的、手工的过程。教职员工或衔接官员通常审查教学大纲和目录信息以确定机构间的等价性。人工智能,特别是自然语言模型和课程嵌入,已经开始提供数据驱动的替代方案和支持结构。

支撑生成式人工智能的同类嵌入模型——用于表征意义、词、图像和多模态内容之间的语义丰富关系——也可以表征不同机构课程之间的关系。Pardos, Chau和Zhao(2019[14])证明,建立在这些嵌入基础上的机器翻译技术可以“翻译”不同学院之间的课程向量空间。这些向量从学生的历史课程或项目级注册模式以及课程目录描述中学习,捕捉潜在课程结构,能够预测等价性并发现转移协议中的空白。这些空白对应于根据课程内容和路径本可以提供但尚未被识别或考虑的等价性。在他们的概念验证中,该方法成功匹配了两年制和四年制美国机构之间的课程,并验证了65个预先建立的衔接协议。目前,该方法正在与59所美国高等教育机构和四个高等教育系统进行试点,以探索其在实践中的可行性和实用性¹。

在方法论上,教育数据挖掘社区在转移背景之外探索了额外的神经课程表征。Khan和Polyzou(2024[15])评估了基于会话的方法,如CourseBEACON和CourseDREAM(基于注册会话推荐合适课程捆绑包的神经架构),并展示了这些方法相对于传统因子分解或关联模型的改进性能。这些基于会话的模型通过建模(1)哪些课程配对良好和(2)学期到学期的排序来推荐完整的下学期课程集,使用RNN/LSTM编码器(CourseBEACON使用显式共现矩阵;CourseDREAM学习潜在篮子向量)。它们在流行度和序列基线上提高了准确性(CourseDREAM在测试中达到最佳Recall@k约为0.30)。同样,Kim等(2025[16])证明,课程描述的深度嵌入与传统分类器相结合,可以自动化等价性判断,达到近乎完美的性能(以F1分数衡量)。这两项工作都展示了课程表征如何用于各种引导学生路径和转移流动的机构任务。

虽然人工智能辅助等价模型可以显著加快衔接速度,但采用取决于信任——尤其是最终握有学分批准钥匙的领域专家。Xu等(2023[17])研究了负责课程学分决策的高等教育管理人员中的算法厌恶。使用基于人工智能的匹配平台进行了2×2实验。一个因素是是否在结果中插入低置信度或异常值的人工智能推荐。另一个因素是界面是否提示用户标记不当的人工智能推荐。他们发现,不包括异常推荐提高了接受度和生产力;然而,要求用户标记推荐降低了管理人员对建议的接受度,除非异常推荐被开启。虽然文献表明用户标记作为增加采用的一种手段,但它在这种情况下可能导致负面心态,除非向用户提供值得标记的明确结果。结论也许是:没有正确的实施,即使准确的人工智能推荐也可能面临被低估或直接在社会技术系统中被拒绝的风险。

这些发现表明,作为现代生成式人工智能核心的基于嵌入的方法不仅对产生语言或图像有用,而且还可以映射跨机构的复杂学术结构。当与仔细的人类-人工智能协作设计相结合时,它们可以加速等价性映射,揭示隐藏的课程对齐,并在让人类专家保持控制的同时减少行政负担。

使用人工智能标记教育内容以实现重用和课程对齐

虽然许多人工智能应用聚焦于面向学生的成果,但其他应用在幕后运作,为教育内容的可发现性、分类和重用提供动力。一个日益增长的影响领域是通过标记、对齐和策展学习材料来组织大规模资源库,使其符合机构或州级分类体系或支持它们之间的转换和对齐。使用人工智能注释和分组教育内容的意义在于,内容标准通常随时间变化(例如美国共同核心或芬兰基础教育国家核心课程)。重新分类内容并将其与新标准对齐成本高昂,但使用人工智能可以显著提高成本效益和效率。例如,这可以用于开放教育资源(OER)。虽然许多国家和国际组织如OECD和UNESCO支持开放教育资源的开发,但COVID-19大流行突出表明,识别与国家或管辖区课程相符的资源并非易事,因为缺乏国内或国际分类体系(例如Vincent-Lancrin, Cobo Romaní and Reimers, 2022[18])。生成式人工智能技术在分类和映射文本(与嵌入)方面的优势可能有助于解决或至少缓解这个问题。

11.2. 用于映射问题、技能和课程的基于嵌入的模型

注:嵌入空间显示为按标签着色的实际问题或技能点云。课程的标签可能是毕达哥拉斯定理。相似性匹配阶段根据技能描述与问题文本以及任何可用图形的相似性提供关于不同分类系统的信息并协调它们。

来源:改编自Liu, Bhandari and Pardos (2025[19]), “Leveraging LLM respondents for item evaluation: A psychometric analysis”, British Journal of Educational Technology, Vol. 56/3, pp. 1028-1052, https://doi.org/10.1111/bjet.13570

另一个例子是将智能辅导系统的专有技能分类法中的掌握情况转换为美国州共同核心标准——美国大量州在英语语言艺术和数学方面的商定教育标准。支持语言艺术、数学、科学等内容和程序知识获取的智能辅导系统有其自己的“知识图谱”,通常不针对任何特定课程或标准。允许这些翻译对于帮助使用特定系统的教师和教育工作者将其与当地课程对齐至关重要。这些面向基础设施的人工智能应用可能对学习者不可见,但它们是实现高效资源检索、支持教学规划和确保与不断发展的课程目标保持一致的基础(图11.2)。

最近的发展应用了生成式人工智能的核心技术,特别是嵌入模型,来创建学习资源的丰富向量表征,捕捉内容项目之间的语义关系。这些嵌入支持聚类,即根据共同特征对内容进行分组,相似性搜索,以及分类系统之间的交叉映射,而分类算法——通常在嵌入之上微调——将资源映射到既定框架和新定义技能分类法中的类别。例如,当引入新的数学课程或分类法(如美国共同核心标准)时,这些方法可以帮助将估计数百万现有开放教育资源重新映射到新分类法。此类方法已被部署用于支持共同课程编号等举措,增强辅导系统将资源链接到特定知识组件的能力,并保持课程目录与快速变化的课程要求同步。

研究表明,这些人工智能辅助系统可以接近甚至匹配非专家人类标记性能,只需相对较小的标记数据集,在某些情况下可以与专家性能相媲美。Li等(2024[20])发现,他们结合嵌入和分类的方法可以使用少至100个标记示例实现非专家准确性,并在5000个示例中达到接近专家的准确性。重要的是,这些模型纳入了来自文本、图像和视频的多模态特征——反映了当代生成式人工智能系统的多输入能力——并已公开发布,可与美国共同核心和新分类法一起使用。

Ren等(2024[21])将这一研究方向扩展到研究分类系统对齐中的人类-人工智能协作。与单独工作的人类相比,人工智能建议将标记时间减少约50%(p < 0.01),但导致召回率小幅下降——即特定类别所有相关资源的识别(-7.7%,p = 0.267),以及准确性大幅下降——即标记建议的整体正确性(-35%,p = 0.117)。值得注意的是,人工智能单独条件表现最差,而人类单独条件在准确性方面表现最佳,协作条件处于中间。这些发现突出了效率(这里指标记速度)和精确性之间的权衡,并表明虽然人工智能可以加速大规模分类系统更新,但质量保证仍然必不可少——截至目前,由人类执行。

机构规模的个性化

生成式人工智能辅助的个性化咨询

高等教育中的生成式人工智能可以涉及帮助个性化学生获得的指导,不仅来自推荐系统,还来自人类学术顾问。在Lekan和Pardos(2025[22])中,测试了一个面向顾问的GPT驱动模型,一年级大学生(n = 33)被问及关于课程偏好和职业目标的问题,这是典型的人类咨询会议。这些回复被输入到一个GPT模型中,该模型不直接向学生提供建议,而是向顾问(n = 25)提供专业建议和理由。研究发现,学术顾问对GPT模型的建议给予了好评,33%的情况下完全同意模型的专业建议。在这种情况下,参与的顾问对这种人类-人工智能协作持积极态度,将其作为提供帮助的方式,并让他们保持作为学生的联系点,而不是取代他们。

与教务处和招生办公室的研究合作已经开始探索顾问如何使用分析来更好地支持学生选课。例如,与本科咨询的新生工作(Borchers, (n.d.)[23])整合了大五人格特质(如责任心和神经质)与多学期课程注册数据,发现高度责任心或自我效能感的学生即使在繁重的工作量下也往往表现良好,而在这方面得分较低的学生更可能遇到困难。这表明顾问可以超越通用启发式方法(例如“不要过载”),而是根据学生管理挑战性课程安排的可能能力提供更个性化的建议。

同样的咨询形式也可以用于高中阶段,帮助学生选择高等教育学习项目,或者在他们人生后期支持终身学习选项的选择。虽然生成式人工智能也被探索作为为大学生提供或促进其他咨询和辅导服务的方式(例如心理健康),但这些应用并非没有争议,在当前发展阶段已显示出成长的痛苦(Moore et al., 2025[24])。

使用生成式人工智能增强评估的产生和评价

评估是高等教育中资源最密集的组成部分之一。为某些科目的标准化测试生成高质量题目需要大量的教职员工时间,而评估和校准这些题目则需要大量的受试者池和心理测量专业知识。生成式人工智能的最新进展为机构提供了通过加速大规模题目池的产生和评估来更新评估实践的机会。重要的是,这些过程通常发生在机构“后端”——由校园或系统级服务提供资金、管理和维护——以及由教职员工或学生直接驱动。开发评估题目也与学校层面相关,特别是在有国家评估的国家,无论是由公共评估机构还是私营公司开发。

大语言模型为自动化创建多项选择题和简答题提供了新的视角,特别是在锚定现有课程材料时。将大语言模型生成的问题与教科书来源的问题进行比较的研究发现具有可比的心理测量特性。例如,Bhandari等(2024[25])报告称,ChatGPT生成的代数题目在用项目反应理论评估时,难度和区分度参数与传统教科书题目在统计上无法区分。值得注意的是,大语言模型生成的题目在区分高低能力受试者方面表现出略强的能力,表明在受控条件下,生成式人工智能可以产生相似甚至更优质的评估内容。这对于讲师时间稀缺且题目需求高的大课和通识教育项目特别有希望(例如,必须定期刷新题库以确保持续的评估效度)。在保持讲师对课程评估主导权的同时减少他们创建评估的时间,这不仅是算法问题,而且是人机交互设计问题。新的人机交互研究,如PromptHive工具的工作,提供了将领域专家置于生成式人工智能主导位置的例子,将其专业知识整合到评估创建工作流程中(Reza et al., 2025[26])。例如,讲师提供她现有的评估作为风格参考,以及她希望额外评估覆盖的新学习目标。PromptHive创建一个覆盖学习目标的评估题库,并允许讲师和助教指示PromptHive应产生什么类型的提示来支撑相关内容的学习。教学团队可以预览生成的提示和评估,可以针对部分题目或全部题目。这里的局限性在于生成式人工智能仍然在大多数主题领域产生幻觉。如果在主题领域的幻觉率未评估为0%,则需要教学人员在学生看到之前检查每一个产生的问题和提示。

同样,生成式模型也可以解决传统题库已知的局限性。一个持续存在的挑战是题目的过度曝光,即重复使用缩小了评估的有效方差并在项目之间引入不想要的相关题目。许多高风险、总结性测试都有严格的监考,测试题目不向公众发布;然而,随着时间的推移,测试考生可能会将测试内容社会化给未来考生或考试准备公司,导致如果题目不经常更换,题目会被过度曝光。通过创建新颖的评估甚至精心设计的多项选择诱饵选项,大语言模型可以多样化题目池,减少重复部署相同问题时出现分布偏移的风险。然而,在规模上产生新诱饵选项引发了质量问题。编写不当的诱饵选项——那些难以置信的、误导性的或无意中暗示正确答案的——会降低多项选择题的公平性和心理测量价值。在这里,自动评估方法开始补充生成方法。Moore等(2023[27])提供的证据表明,此类方法可以系统地检测学生和人工智能生成的多项选择题中的缺陷。作者评估了在入门课程中提示生成最近学习材料多项选择题的本科生。将基于规则的系统与GPT-4在四个领域的200个学生生成题目进行比较,他们发现基于规则的方法识别了91%的人类注释者标记的项目写作缺陷,而GPT-4为79%。许多这些缺陷涉及诱饵选项设计——如难以置信、冗余或与正确答案重叠——正是这些弱点会破坏大规模自动生成的好处。因此,在大语言模型被用于更大规模内容生成时,人类专业知识和质量控制仍将是很重要的支柱。

除了题目生成,生成式人工智能正在成为评估工具。项目校准——估计心理测量特性(如难度和区分度)的过程——通常需要数千个学生响应。Liu等(2025[19])展示了汇集大语言模型集成的人工智能多智能体模型可以作为“合成受试者”,产生与大学生心理测量特性高度一致的反应分布。虽然单一的大语言模型未被测量为表现出与目标人群足够相似的能力,但不同大语言模型的集成扩展了方差,产生的项目参数估计与人类校准值的相关性很高(> 0.8)。增强策略,如将大语言模型响应添加到少量人类受试者数据中,进一步改善了与纯人类响应的一致性。这些发现表明了一种新的机构工作流程:基于大语言模型的校准可以补充有限的学生响应数据,降低成本并加速项目验证周期。虽然人类响应对于最终基准测试仍然必不可少,但人工智能辅助评估可以显著缩短新评估的开发时间线。

除了机会和可行性,一个实际的开放挑战是建立生成式人工智能在评估中使用的政策。借鉴Corbin等(2025[28])提出的新兴框架,开放问题包括:

  • 在不同结果类型的人工智能援助上设置有意义的限制;
  • 什么样的披露、归属和来源实践是足够的(例如,提示、草稿和模型/版本日志);
  • 如何处理学科特定变化而不牺牲一致性;
  • 如何在保持效度和公平性的同时减轻员工的工作量负担。

这些政策中的一个挑战是人工智能模型及其能力将继续变化。因此,政策需要是适应性的而非静态的,专注于指导原则和审查机制而非固定禁止。当人工智能部署于对学习者的高风险评估场景(如大学招生)时,这些考虑尤为重要。例如,von Davier和Burstein(2024[29])讨论了人类参与人工智能决策的若干实践以确保合乎伦理、负责和有效的使用。这些包括对自动评分和项目生成的持续人类监督,系统性审查算法输出中的公平性和偏见,在测试开发和验证中让不同利益相关者群体参与,向考生和机构透明传达人工智能的角色和局限性。在基于规则的方法(例如学位审核)继续采用与人工智能评估方法之间也存在紧张关系,混合方法是一个富有成果的探索领域。

专栏11.2. 改善受高等教育管理影响的领域的人工智能系统新兴倡议

人工智能驱动的系统正越来越多地集成到学术咨询和课程规划基础设施中,通常由研究人员与行政单位合作牵头。虽然许多这些工具仍然是面向学生的,但它们的设计和部署反映了向数据驱动的机构协调和管理个性化的更大转变。

1. 行政协作和监督。 课程规划平台如加州大学伯克利分校的AskOski和密歇根大学的ATLAS是与教职员工和行政利益相关者合作开发的工具示例。这些系统旨在指导学生完成课程选择,同时整合过去学生课程选择路径的数据。

2. 面向教职员工和顾问的系统。 一些平台主要面向专业人员和教职员工顾问,支持他们调整学习指导建议。例如,正在进行的研究探索衔接官员如何与算法指导互动以做出课程衔接决策(见atrain.org)。

3. 人工智能在招生和课程治理中的应用。 除了咨询,机器学习和分析越来越多地支持招生和课程规划中的机构决策。行政优先级应该是帮助共同开发或策展算法系统的起点。

4. 走向分析知情的课程创新。 机构可以采用将机器学习驱动的洞察与人类顾问专业知识相结合的系统,重新思考学分学时,将课程内容同化到新内容标准,并增强课程级分析,包括课程难度。

这些例子展示了课程咨询、转移和课程规划平台的研究-行政合作如何成为机构工作流程中负责任的人工智能整合未来的试验台。它们的成功取决于行政协作、方法论严谨性以及对人类专业知识的深思熟虑参与。

用于课程分析的人工智能

在过去的十年中,学习分析领域从面向学生的仪表板和系统越来越扩展到改善高等教育项目评估、课程设计和课程交付的分析(Gleason等,2016[30])。虽然最近的文献综述得出结论,缺乏调查这些人工智能系统如何影响高等教育利益相关者的课程分析研究(De Silva等,2024[31]),但我们总结了提供清晰视角的案例研究,说明课程如何利用在注册、课程和其他机构数据上训练的机器学习模型和人工智能进行设计。随着生成式人工智能在向利益相关者解释学习分析方面变得越来越有能力(Yan等,2025[32]),人工智能知情的创新将越来越多地塑造机构工作流程实践。

例如,最近的工作展示了课程分析如何通过统计和心理测量技术增强,以识别课程难度不公平现象并监测随时间的变化。Baucks等(2024[33])引入了差异课程功能(DCF),这是一种基于项目反应理论(IRT)的方法,在控制总体学生表现的同时检测学生群体之间课程特定成功率的系统性差异。应用于超过20,000名本科生的数据,差异课程功能方法揭示了与学科一致性和准备情况相关的模式,为选修专业外课程和转学生提供有针对性的干预指导。在一项互补研究中,Baucks等(2024[34])应用IRT量化课程难度的时间变化,发现在COVID-19大流行期间明显的向下趋势,并提出IRT调整后的通过率以减轻群体表现波动的影响。两种方法都为政策制定者、认证机构和寻求改善学术项目公平性和一致性的学生顾问提供了可操作的证据。

分析也被用于解决学分学时与实际学生工作量之间的不匹配,为课程分析提供可操作的基础。学分学时虽然在学位要求和课程规划中处于核心地位,但仅解释了学生对其课程工作量感知差异的6%(Pardos等,2023[35]),而基于论坛、作业和提交活动的学习管理系统(LMS)特征在时间负担、心理努力和心理压力指标上解释了六倍以上的差异(36%)。LMS指标如作业数量和学期末课程退出比率以及历史课程GPA提供了更准确的学生体验反映,使机构更有信心将这些措施作为行动基础。在此基础上,Borchers和Pardos(2023[35])开发了课程负载分析(CLA),这是一个整合LMS和注册特征的预测模型,用于在课程和学期级别估计感知工作量。应用于整个大学目录,跨越完整的本科学位时长,CLA揭示了第一学期学生——特别是STEM领域——尽管学分时数较低,但往往承担一些最重的预测工作量(图11.3),这种隐藏负载与更高的流失率相关。这种中观层面的洞察使CLA成为课程分析中的实用工具,使机构能够重新设计项目结构、调整课程排序,并使工作量预期与学生能力保持一致。因为CLA的建模方法可以推广到新课程和背景,机构可以广泛部署它来监控和平衡工作量,改善留校率和整体大一体验。

11.3. 美国一所大型公立大学STEM和非STEM的平均学期学分时数(左)和预测学期工作量(右)

注:虽然基于学分时数,大一工作量名义上是最低的,但基于近似学生工作量感知的高校数据进行的机器学习预测突出表明它是最高的,揭示了能够进行课程重新设计的差异。左图显示了STEM和非STEM专业之间学时的微小差异,而右图显示了在前五个学期工作量的显著差异。

来源:Borchers and Pardos (2023[35]), “Credit hours is not enough: Explaining undergraduate perceptions of course workload using LMS records”, The Internet and Higher Education, Vol. 56, https://doi.org/10.1016/j.iheduc.2022.100882.

展望未来,课程分析研究继续涵盖广泛的课程相关领域,包括项目结构、课程排序、能力习得、工作量测量和课程-就业一致性。相关研究从多个角度检查课程组件,如映射先修课程网络、识别教学瓶颈、跟踪能力覆盖、建模学生进程……(原文此处有11073个字符被截断,但根据行号范围14895-16045,这应该已经包含了本章的主要内容,包括引言、新兴机遇和采用的原理和未来方向部分)

采用的原理和未来方向

本章探讨了人工智能在高等教育机构工作流程中的整合,强调了研究-行政合作、方法论严谨性以及与人类专业知识深思熟虑参与的重要性。实现这些目标的技术基础——向量嵌入、自然语言处理和生成式人工智能——并非新生事物,而是机器学习和表征学习长期发展的产物。本章讨论的许多最有前景的示例都来自研究人员、管理人员和平台开发人员之间的合作。这种协作对于将技术设计与机构最终用户价值观保持一致以及实证研究人工智能采用对效率、公平性和教育质量的影响至关重要。

虽然本章重点关注高等教育,但许多相同的机构优势自然延伸到较低教育水平和成人学习,在那里咨询、评估和课程对齐面临类似压力。生成模型可以通过创建或审查评估题目、跨标准标记资源和产生形成性反馈来帮助教师,从而减少工作量并增强标准化。机构人工智能可能会趋向于连接、数据驱动的教育生态系统,链接小学和中等教育与中学后系统,改善跨教育路径的个性化、公平性和流动性。

参考文献(略)

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇