OECD数字教育展望2026——第六章

第六章:教育中的人工智能实践:与Seiji Isotani的对话

到处普及。即使在各方共同努力推动互联网人人可及的雄心勃勃的持续进程中,数据给人的感觉是,低收入社群获得与高收入社群同等互联网接入水平,可能还需要大约一百年的时间。而这还是在考虑事物不断演进、持续改善的趋势下得出的结论。

OECD那么,AI Unplugged(人工智能离线教育)所需的最低基础设施是什么?

Seiji Isotani我们正在开发一个框架,用以实施考虑不同基础设施水平的人工智能教育(AIED)。到目前为止,我们认识到所需的最低接入条件是一部手机(甚至不一定是智能手机)。这就是我们唯一需要的东西。此外,还需要某种互联网接入机会。不需要全天候、每天、每小时都能接入。每周某个时段能够接入互联网就足够了。如果你具备这两个条件——有限的互联网接入和一部手机,一部足够好的手机——我们就可以使用AIED Unplugged。如果你每周能接入一次Wi-Fi,我认为就足够了,因为这足以让我们从本地设备更新信息到服务器。这使我们能够进行更密集的处理、分析数据、更新需要更新的内容,然后返回关于学生的信息。

AI Unplugged的实际应用

OECDAI Unplugged能让你做到哪些事情?能否举一个例子?

Seiji Isotani当然可以。就在新冠疫情结束后,巴西政府请求我们帮助提高5至9年级学生的写作技能。在巴西,学生们几乎有两年时间脱离学校、无法写作,因此当他们返校时,写作能力很差。政府请求我们考虑到巴西存在的所有不平等因素,在全国范围内尝试解决这个问题。我们接受了这一挑战。

于是,我们对手机接入、互联网接入等数据进行了分析。在巴西,大多数学校(超过90%)都有某种互联网接入,但主要用于校长办公室的行政事务,学生和教师几乎无法使用。在这种情况下,巴西大多数学校至少有一个地点可以接入互联网。这是一个有趣且重要的特征。

我们开发了一款应用程序,使教师能够拍摄学生作文的照片(Portela et al., 2024[1])。他们让学生在一张纸上写作文,然后拍摄这些作文的照片(见图6.1)。每当互联网可用时——可能是第二天、两天后,或者任何可能的时候,通常是在午餐时间——教师会把手机放在校长办公室。我们的应用程序会随后将所有照片上传到我们的服务器,进行密集处理,并返回所有这些作文的分析结果。然后,它会为教师提供一个仪表板,显示特定学生、整个班级或多个班级的分析情况。目标是提供分析和建议,帮助教师更好地支持学生的写作。我们在一年的时间里对巴西约50万名学生进行了结果分析,涵盖了1500个不同的市镇,发现这样做是有益的。因此,这种需要最低物理基础设施的人工智能技术,为教师提供了重要支持,并通过自动评估帮助学生写作。我们现在也在对基础数学和其他学科进行同样的工作。

OECD为此,你不必使用生成式人工智能,对吗?

Seiji Isotani是的,在那个案例中我们没有使用生成式人工智能。我们现在正在尝试使用生成式人工智能,并与我们所使用的传统方法进行比较。目前,我们之前的人工智能模型在检测错误单词方面仍然更胜一筹,因为生成式人工智能的做法是:它在处理一张照片时会纠正学生的错误,从而纠正了在这种情况下不应该被纠正的内容。对于我们评估学生来说,我们需要确切地知道学生写了什么,包括他们的错误!但在一两年内,我们可能将能够用生成式人工智能取代我们之前所做的所有工作。

OECD你如何确保给予教师的建议在教学上是合理的?

Seiji Isotani这是一个非常好的问题。我们拥有一个由学习科学领域提供的最佳教学策略库。我们尝试将学生的挑战或困难与这些材料和策略进行匹配。例如,我们使用的材料之一是”WordGen”。”WordGen”是来自哈佛大学和其他机构的同事们创建的一套材料。它们不仅支持阅读和写作,还支持反思。它们的一般理念是:要支持阅读和写作,你需要让学生参与有趣的互动。举一个例子,假设你是一名学生,你需要写作并为一个立场进行辩护。你可以谈论气候变化,或者经济挑战。但刚刚开始学习的学生通常对本地挑战更感兴趣。例如,在”WordGen”中,他们有一个与学校食堂午餐相关的问题:我们应该为学生提供披萨还是沙拉?讨论这个话题会更有趣。或者,学校里应该允许使用手机吗?这很有趣,因为你也可以为此提供数据:一个披萨有多好?一份沙拉有多好?它们各自能带来什么好处?然后你可以在其中一个方向上表明自己的立场,在辩论过程中,你带来所有从阅读中收集的想法并开始辩论。这样一来,你在讨论时会变得更加批判性。因此,在这种情况下,产生批判性思维或提高批判性思维的想法就变得相关了。在这个背景下,人工智能的作用可以是根据学生的困难匹配合适的教学策略和材料,供教师使用。人工智能可能会评估班级并说:”好的,学生们不太擅长语义分析,所以我们需要提高他们理解更复杂句子、保持其含义的能力。”在此基础上,它可以推荐”WordGen”,并结合我们知道从学习科学中已被证明对该特定需求有效的反思和同伴阅读教学策略。

OECD谢谢你。我们在这里有一个很好的例子,说明如何在人工智能工具面向教师使用时使用离线人工智能。你有没有人工智能直接由学生使用而非由教师使用的例子?

Seiji Isotani目前,我认为我们还没有一个学生直接使用的好例子。因为AIED Unplugged的基础之一是尽量减少所需的设备数量。在低收入社区,大多数学生没有设备——因此让他们每个人都拥有一台的场景并不真正有帮助。我们始终在这种背景下思考,即代理人可以是教师、家长或导师。我们赋能这个代理用户,使学生获得最大的益处。这是使用AIED Unplugged的挑战之一,因为从中受益的学生是弱势群体。当前的人工智能仍然存在一些偏见。我们可以通过拥有一个代理人来在一定程度上避免这些偏见,该代理人尝试理解什么对该特定学生有意义、什么没有意义,从而提供支持。因此,我们与一个中间人合作,防止学生受到额外偏见的影响——这就是我们的理念。

GenAI Unplugged

OECD现在让我们转向小型生成式人工智能模型。它们如何提供帮助?它们很有趣,因为当然,它们可以用来支持教师。它们也可以直接支持学生,即使是通过他们的父母或兄弟姐妹,或者任何拥有设备的人。它们可以帮助学生在资源匮乏的环境中培养人工智能素养。在离线模式中实际使用生成式人工智能的可能性有哪些?

Seiji Isotani是的,这是我们小组正在讨论的一个关键问题。

私以为,首先是打破了获取人工智能乃至一般技术的另一个障碍。即使有手机,我们仍然要求用户至少具备使用手机的最低知识。当我们使用这些AIED Unplugged模型时,它们可以在手机或任何其他设备上运行。交互界面可以是语音,这完全改变了游戏规则。用户不仅仅是点击,而是交谈。通过交谈,我们可以实现学生和教师已经熟悉的交流和互动。

然后,无论何时你有一个知识更丰富的伙伴,你想向他们请教和学习,你就会开始提问、分析他们的回答,并尝试将所学应用到日常生活中。因此,当我想到GenAI在AIED Unplugged模型中的应用时,它就像一个帮助你解决难题的伙伴。它的目的不是取代任何东西,而是增强你更好地做事的能力。当你去巴西亚马逊地区的学校,或许多国家的偏远地区学校,你会发现学校往往没有明确的年级区分。五岁的、六岁的、十岁的学生都在一起。但他们需要不同类型的支持,而教师也不是什么都懂,同样需要支持。在这种情况下,GenAIED Unplugged实际上可以在学生需要时、在他们的水平上为他们提供具体或量身定制的支持。因此,这就是我们现在正在尝试生产的东西。我们的工作正在探索是否能够提出问题并在足够短的时间内获得回应,从而使没有连接性的人能够进行富有成果的对话。如果这是可能的,那么下一个问题是:”这些互动是否适当、正确,或者它们是否能帮助学生学习东西?”这些是下一步需要解决的问题。

OECD它是如何工作的?如果我在手机上安装一个小语言模型(SLM),这是否意味着当我未连接到互联网时,我仍然可以与聊天机器人交互并获得回应?

Seiji Isotani是的。你只需要在手机上安装任何大型语言模型的精简版或迷你版(ChatGPT、Llama、DeepSeek、Mistral等),它就可以离线工作。这是大型语言模型的精简版,这意味着幻觉问题更加严重,功能也不那么强大。回复有时会难以理解。单词可能是被编造的,因此在目前将其用于学习存在几个问题。但从好的方面来说,我们手中确实拥有了迷你版的网络,因此我们可以提问、获取答案、以不同方式获得帮助。因此,与大型语言模型相比,交互过程本身并没有太大变化:它们以不同方式回应的能力有限,但它们仍然能够做事。我们有一项尚未发表但正在最后定稿的工作,探索大型语言模型在在线和离线环境(小型语言模型)中实际可以使用多少种不同的教学策略。在在线环境中,大型语言模型在使用不同策略方面能力更强。如果你问它们”使用苏格拉底方法教我一些东西”,它们会照做,即提问而不给你答案。相反,如果你是在手机上使用小型语言模型并问”使用苏格拉底方法”,可能——我们观察到——在几乎所有情况下,它们只会给你答案。它们不会使用你想要的策略。所以,这些是一些局限性的例子。

OECD对于一个小模型来说,离线或在线有区别吗?在线的小模型是否比离线的小模型性能更好,还是基本相同?

Seiji Isotani在我们的案例中,它在线或离线没有任何区别,因为我们唯一做的事情就是分析互动。如果你想创建能够随时间更新或能根据学生互动在网络上搜索当前信息的模型,那么在线模型可能会产生巨大差异。但如果你只考虑互动本身,那么离线就可以了。

OECD你研究过不同类型的小语言模型之间的权衡。你在这方面的教训是什么?

Seiji Isotani的经验教训是,每个社区都有不同的挑战,我们认识到AIED Unplugged可能能够解决大约70%或80%的这些挑战。我们一直在思考这些大型语言模型,但对于教育目的,我们或许应该更认真地考虑小语言模型。小语言模型似乎对不同目的更有效,例如处理专业领域任务,如就小数误解提供简短反馈;它们不需要在线,成本也不像大型语言模型那么高。此外,小语言模型空间中的人工智能智能体似乎也是一条有前途的前进道路,但很少有人谈论。人们正在讨论这些可以执行多种不同任务并产生最终结果的巨大智能体。但当我们考虑AIED Unplugged时,也许我们可以考虑让智能体在小语言模型中运行,为教师完成小的、专业化的任务,例如备课,或为特定年龄段的学生创建特定活动的材料。这些是你实际上可以创建来帮助教师生产更高质量材料并支持其活动的小型智能体。它们不需要能够做所有事情。

对于学生来说,智能体也真的很有趣。想想高收入家庭的学生及其所能获得的东西:如果他们遇到困难,他们的家人可能会聘请私人导师来帮助他们提高。心理有问题学生会获得心理学家或关注其身心健康的帮助。如果对自己的职业不确定,职业顾问会帮助他们,对吧?三种不同的事情。低收入家庭的学生无法获得这些,但借助小语言模型,使用一部手机,你实际上可以运行三个不同的专业智能体:一个专注于学生的认知能力,一个关注学生的身心健康,另一个关注学生的职业。然后,人工智能智能体和学生的照护者可以与学生合作,为他们应该做什么做出最佳决定。所以,我认为这是一条非常有前途的前进道路,因为在许多情况下,那些学生目前缺乏任何支持。

OECD大型生成式人工智能模型正越来越多地为特定目的进行训练,有点像你所描述的那样。用一个小模型做类似的事情是否可能?你能否训练一个小模型使其更专注于学术或社会情感技能,或者真正具有某种专业性?它是否可以与其他类型的”经典人工智能”结合使用?

Seiji Isotani是的,可以将小语言模型定制为教育中的特定任务和活动。例如,我们可以使用RAG(检索增强生成),并仅在来自维基百科的数据上训练这些模型,或者任何其他来源。然后它们的回答将主要基于维基百科的信息。这是完全可行的。我们也可以用其他不同的材料集来做这件事。我们可以考虑书籍、经合组织的材料,或其他多种不同的资源。因此,这些学生实际上可以拥有将在不同领域帮助他们的智能体。我们可以使用本体论和知识表示(即符号人工智能)来创建混合方法,这些方法可以潜在地产生更好的结果,而不单纯依赖于单一的人工智能技术。

OECD一个小语言模型回答一个问题通常需要多少时间?打字和说话有区别吗?

Seiji Isotani:是的,打字或说话有区别,因为模型需要转录你的语音输入——你所说的内容——然后生成回答。当你打字时,速度更快。在2025年1月,我们最后一次用语音进行实验时,获得回应需要超过一分钟。因此,如果你问一个复杂的问题,可能需要更长的时间。但我相信,随着新模型和优化措施的出现,我们可能会随着时间的推移获得更好的结果。

OECD:最后一个问题。这里我们讨论的是语言模型。生成式人工智能不仅仅是语言模型。它可以生成图片、音乐、视频等。一个小模型能做到多少?

Seiji Isotani:目前这是一个很大的限制。以我们拥有的能力,小型语言模型不足以生成图像、视频等。你需要大量的处理能力和能量来做到这一点。即使是现在,使用当前的大型 GenAI 模型,也可能需要几分钟才能生成高质量的图像。因此,目前小型 GenAI 模型尚不具备生成这些高质量材料的能力。但我敢打赌,这只是时间问题。每两年,生成图像所需的功率就会减少。 OpenAI 表明,一开始,响应任何提示都会花费 5 美元,而现在只需一便士 – 一美元一美分。因此,我认为事情会继续改进,这些较小的语言模型将能够执行诸如生成图像和执行更多任务之类的事情。

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇