无论是否做好准备，人工智能已经进入我们的学校

世界各地的学生都在使用生成式人工智能工具撰写论文和完成作业。教师们也在使用类似的工具来评分。这到底是怎么回事？这一切将走向何方？教育能回到人工智能出现之前的世界吗？

有多少学生在学校使用生成式人工智能？

2022 年，OpenAI 的 ChatGPT 等流行的生成式 AI 写作工具开始受到国际关注，许多高中和大学年龄的学生几乎立刻就接受了它们。其动机非常明显。当时，大型语言模型 (LLM) 只需几个简单的提示，就可以搜索其庞大的文章、书籍和档案数据库，并在几秒钟内生成相对连贯的简短文章或问题答案。这种语言并不完美，模型也容易捏造事实，但它们足以避开一些教育工作者，因为当时他们还没有准备好发现人工智能操纵的迹象。

这一趋势迅速蔓延。根据皮尤研究中心最近的一项调查，大约五分之一听说过 ChatGPT 的高中生表示，他们已经在课堂作业中使用过该工具。ACT 的另一份报告称，近一半 (46%) 的高中生已经使用人工智能来完成作业。ACT 是大学入学最受欢迎的两项标准化考试之一。高等教育领域也出现了类似的趋势。在线教育杂志 Intelligent.com 调查的超过三分之一的美国大学生 (37%) 表示，他们使用 ChatGPT 来产生想法、撰写论文或两者兼而有之。

这些人工智能工具正在进入评分论文。Turnitin 是一家著名的抄袭检测公司，受教育工作者的青睐。该公司最近告诉《连线》杂志，去年通过其服务提交的 2200 万份大学和高中论文中发现了人工智能操纵的证据。Turnitin 声称，在 2023 年提交的 2 亿份论文中，有 11% 的论文内容超过 20% 据称是使用人工智能生成的材料撰写的。尽管生成式人工智能的使用在公众中普遍降温，但学生们并没有表现出放松的迹象。

教育工作者转向不完善的人工智能检测工具

学生们开始使用人工智能写作工具后，老师们几乎立刻转向其他人工智能模型，试图阻止他们。截至撰写本文时，数十家科技公司和初创公司声称已经开发出能够检测人工智能生成文本迹象的软件。全国各地的教师和教授已经不同程度地依赖这些软件。但批评人士表示，即使在 ChatGPT 流行多年后，人工智能检测工具仍然远非完美。

《国际教育诚信杂志》最近对 18 种不同的 AI 检测工具进行了分析，结果显示这些工具缺乏全面的准确性。研究的所有模型均无法准确区分 AI 生成的材料和人类写作。更糟糕的是，只有五个模型的准确率超过 70%。随着 AI 写作模型的不断改进，检测可能会变得更加困难。

准确性问题并不是限制 AI 检测工具有效性的唯一问题。过度依赖这些仍在开发中的检测系统可能会惩罚那些可能使用其他有用的 AI 软件的学生，而在其他情况下，这些软件是被允许的。最近，北乔治亚大学一名名叫 Marley Stevens 的学生就遇到了这种情况，她声称 AI 检测工具将她使用流行的拼写和写作辅助工具 Grammarly 的行为解读为作弊。Stevens 声称她在那篇论文上得了零分，因此失去了获得奖学金的资格。

史蒂文斯在 TikTok 帖子中声称：“我与老师、系主任和院长谈过，他们说我是‘无意作弊’。”北乔治亚大学没有立即回应PopSci 的置评请求。

有证据表明，当前的人工智能检测工具还会错误地将真正的人类写作与人工智能内容混淆。除了一般的误报外，斯坦福大学的研究人员警告说，检测工具可能会不成比例地惩罚非母语人士的写作。研究中，超过一半（61.2%）的美国出生、非母语八年级学生撰写的论文被归类为人工智能生成。在研究中测试的七种不同的人工智能检测工具中，至少一种将 97% 的非母语人士的论文标记为人工智能生成。广泛推广的检测工具可能会给那些已经肩负着克服语言障碍重任的非母语人士带来更大压力。

学校如何应对人工智能的兴起？

教育工作者们正在努力寻找应对人工智能写作涌入的解决方案。纽约和洛杉矶的一些主要学区已选择完全禁止使用 ChatGPT 和相关工具。尽管认识到人工智能检测软件的准确性存在已知缺陷，但全国各地大学的教授们已经开始勉强使用这种软件。其中一位教育工作者、密歇根理工大学写作教授在接受Inside Higher Ed采访时将这些检测器描述为“一种可能有益但同时也认识到其缺陷并可能惩罚一些学生的工具”。

与此同时，其他一些机构则采取了相反的做法，更加开放地接受人工智能教育工具。据《德克萨斯论坛报》报道，德克萨斯州教育局本周刚刚开始用“自动评分系统”取代数千份人工标准化考试成绩。该机构声称，新系统将对州公共考试中的开放式书面答案进行评分，每年可为该州节省 1500 万至 2000 万美元。预计 2000 名临时评分员也将因此失业。据报道，在该州其他地方，一所小学正在试验使用人工智能学习模块向儿童教授基本的核心课程，然后再辅以人类教师。

教育领域的人工智能：新常态

虽然人工智能写作检测工具可能会不断改进，以提高准确性并减少误报，但仅凭这些工具不太可能将教育带回到 ChatGPT 出现之前的时代。一些学者认为，教育工作者不应该对抗新常态，而应该在课堂和演讲厅中采用人工智能工具，并指导学生如何有效地使用它们。麻省理工学院斯隆管理学院的研究人员在一篇博客文章中指出，教授和教师仍然可以限制某些工具的使用，但他们应该通过清晰的书面规则来解释他们这样做的理由。他们写道，学生应该放心地向老师询问人工智能工具何时合适，何时不合适。

其他人，比如前伊隆大学教授 CW Howell 则认为，在课堂上明确而有意地让学生接触人工智能生成的写作，实际上可能会降低他们使用人工智能的可能性。Howell 在《连线》杂志上写道，让学生对人工智能生成的论文进行评分，可以让学生亲身体验到人工智能经常捏造来源或从虚构的以太中产生幻觉引述的方式。从新的角度来看，人工智能生成的论文实际上可以改善教育。

豪厄尔写道：“向我的学生展示 ChatGPT 的缺陷有助于恢复他们对自己的思想和能力的信心。”

再说，如果人工智能确实像一些世界末日爱好者所认为的那样从根本上改变了经济格局，那么学生们就可以花时间学习如何设计提示来训练人工智能，并为构建新的由人工智能主导的未来做出贡献。

<<: 为遭受旱灾的巴拿马运河提出新解决方案

>>: 观看三脚架机器人测试其小行星跳跃技能