想要符合道德规范的人工智能？把钥匙交给中学生吧。

本文最初刊登在《大众科学》青年版。当前订阅者可以在此处访问整个数字版，或单击此处订阅。

李新章的夏令营从三明治开始——不是吃三明治，而是设计三明治。这位即将升入七年级的学生听着老师要求她和同学们写下制作理想的花生酱、果冻和面包混合物的说明。学生们埋头苦干，每个人都创造了自己的制作方法。

当他们回到 Zoom 数字面孔矩阵并互相讲述自己的制作过程时，他们意识到了一件事：他们每个人做的三明治都略有不同，偏向于他们所珍视的特征。不一定是好的，也不一定坏的，但绝对不是中性的。他们的三明治是有偏见的。因为他们有偏见，而且他们已经制定了配方。

这项活动名为“最佳 PB&J 算法”，张先生和波士顿地区其他 30 多名 10 至 15 岁的孩子一起开始了为期两周的人工智能入门课程——机器能够展示通常与人脑相关的智慧。在 18 节课中，他们将重点关注算法中蕴含的道德问题。这些算法贯穿了他们的一生，影响着他们的娱乐、社交生活，在很大程度上影响着他们对世界的看法。在这种情况下，也影响着他们的三明治。

“每个人对‘最好’的定义都不一样，”麻省理工学院的研究生丹妮拉·迪保拉 (Daniella DiPaola) 说道，她参与开发了这一系列名为“Everyday AI”的课程。“有些人可能喜欢含糖量最高的食物，或者他们正在针对过敏症进行优化，或者他们不想要脆皮。” 张把食物放进烤箱里，做成一顿温暖的点心。父母的准则可能会将成本考虑在内。

昂贵的 PB&J 在世界关注问题名单中排名靠后。但通过一个熟悉且营养丰富的例子，露营者可以眯起眼睛看待偏见，并辨别出它是如何潜入其他算法的。以波士顿于 2020 年禁止的面部识别软件为例：该市警察局可能会部署的这种代码将摄像头拍到的任何人与已知面孔的数据库进行匹配。但这种软件在识别有色人种方面普遍不准确，而且对女性面孔的识别效果比男性差——这两者都会导致错误匹配。美国国家标准与技术研究所 2019 年的一项研究使用了来自 99 位开发人员的 189 种算法来分析全球 849 万人的图像。报告发现，女性的假阳性率普遍更高，西非、东非和东亚人的假阳性率比东欧人高出 100 倍，而东欧人的假阳性率最低。查看国内的面部照片数据库，美洲印第安人的犯罪率最高，黑人和亚裔的犯罪率也较高。

孩子们的算法表明，偏好会悄悄地出现，即使是以良性的方式。“我们的价值观根植于花生酱和果酱三明治中，”迪保拉说。

该训练营的目的不是让学生认识到人工智能并非无所不知、中立，而是让他们了解并改变技术影响力的工具——作为未来的人工智能创造者、消费者、投票者和监管者。

为了实现这一目标，教师们以一项名为 DAILy（发展人工智能素养）的计划为基础，该计划由麻省理工学院的教育工作者、研究生和研究人员（包括 DiPaola）在过去几年中共同制定。该计划向中学生介绍了人工智能的技术、创意和道德影响，从制作 PB&J 到彻底重新设计 YouTube 的推荐算法。为了开展这个项目，麻省理工学院与一个名为 STEAM Ahead 的组织合作，这是一个非营利组织，其使命是为波士顿地区的孩子创造教育机会，这些孩子来自传统上在科学、技术和艺术领域代表性不足的群体。他们在 2020 年进行了试运行，然后在 2021 年为 Everyday AI 重复了课程，并将训练营扩大到包括中学教师。目标是让全国各地的教育工作者都能够轻松下载课程并实施。

DAILy 旨在让普通人更好地了解人工智能。“我知道人工智能对人类非常有帮助，它可能是我们生活中很重要的一部分，”张说，回顾她学到的东西。她说，刚开始的时候，“我只知道一点点，不是很多。”编码对她来说是全新的。

DAILy 的创建者和指导者是将道德融入开发过程的运动的先锋，而不是在代码完成后才考虑道德问题。该计划并非独一无二，尽管其他类似的计划也很少普及。草根性的努力包括印第安纳州的一项名为“AI Goes Rural”的中学道德项目，以及由明尼苏达州的一名程序员为教师创办的网站“Explore AI Ethics”。美国国家科学基金会 (NSF) 最近资助了一项名为 TechHive AI 的高中项目，该项目涵盖网络安全和 AI 道德。

[相关：人工智能完成了贝多芬的《最后一首交响曲》。这好吗？]

从历史上看，道德教育从未被纳入技术 AI 教育。马萨诸塞大学洛厄尔分校教学、学习和本科研究教授兼副院长 Fred Martin 表示：“这是一直缺乏的东西。”2018 年，Martin 共同创立了 AI4K12 计划，该计划制定了 K-12 学校 AI 教学指南。“我们构想了所谓的 AI 五大理念，第五个理念就是道德。”从那时起，他看到 AI 道德教育不断扩展并惠及更年轻的学生，AI4K12 不断增长的资源数据库就是明证。

该目录链接到麻省理工学院提供的服务，包括 DAILy。马丁说，道德是“他们工作的重中之重”。“让孩子们尽早开始学习道德很重要，这样他们才能成为知情的公民。”

在日常人工智能研讨会上，我们希望学生们能够感受到力量。“你确实有行动力，”2020 年试点营的讲师韦斯利·戴维斯说。“你有能力去理解。你有能力去探索好奇心，直至创造一个更好的系统，创造一个更好的世界。

“这有点华而不实，”他笑道。但这种理想主义和愤世嫉俗的奇特混合正是青少年的特质。因此，当被问及她是否认为有一天她能让人工智能比现在更好时，张锋回答道：“也许吧。”

DAILY 的初衷是为了纠正错误。2015 年，南卡罗来纳大学计算机科学专业的布莱克利·佩恩（原姓霍夫曼）和她最好的朋友一起出去玩，她的朋友刚刚申请了 Twitter 的一份工作。转眼间她就被拒绝了。这家公司怎么可能这么快就决定她“不适合”呢？他们认为，也许是算法根据特定的关键词做出了决定。佩恩很生气，开始阅读有关人工智能偏见及其造成的不公平现象的研究。

自佩恩的经历以来，人工智能在招聘中的偏袒已成为一个众所周知的巨大问题。例如，亚马逊在 2018 年登上头条新闻，当时路透社报道该公司的招聘引擎歧视女性——淘汰带有该关键词的简历（如“女子象棋俱乐部队长”），并惩罚就读女子大学的申请人。据路透社报道，事实证明，开发人员使用“10 年来提交给公司的简历”训练了他们的算法，其中大部分来自男性。 《国际选拔与评估杂志》 2021 年的一篇论文发现，人们普遍认为人类的招聘判断比算法更公平，尽管他们通常认为自动化更一致。

起初，整个情况让佩恩对自己的领域感到不满。但最终，她决定尝试改善这种情况。2017 年毕业后，她进入麻省理工学院攻读研究生，专注于人工智能伦理和教育最能发挥作用的人群：中学生。这个年龄段的孩子通常被称为“人工智能原住民”。他们从未不知道这项技术，已经长大到可以考虑其复杂性，长大后会开发出下一个版本。

在接下来的几年里，佩恩开发了首批针对中学生的人工智能伦理课程之一，她的硕士论文帮助制定了另一套名为“如何训练你的机器人”的互动课程。当她于 2020 年毕业并继续在科罗拉多大学博尔德分校进行研究时，像迪保拉这样的麻省理工学院学者继续并扩大了她的努力。

[相关：我们是否足够信任机器人，可以让它们来掌管一切？]

佩恩的项目为更大规模的 DAILy 项目奠定了基础，该项目于 2020 年 3 月由美国国家科学基金会资助。DAILy 是麻省理工学院谢勒教师教育计划 (STEP)、波士顿学院和麻省理工学院媒体实验室个人机器人小组之间的合作项目，麻省理工学院媒体实验室是 DiPaola 工作的跨学科中心。第二笔美国国家科学基金会的资助于 2021 年 3 月启动，用于资助一项培训计划，帮助教师在课堂上使用 DAILy。通过与佛罗里达州、伊利诺伊州、新墨西哥州和弗吉尼亚州的学区以及 STEAM Ahead 等青年教育非营利组织建立合作伙伴关系，麻省理工学院的教育工作者能够看到他们的象牙塔课程如何发挥作用。“任何课程的试验场都在真正的课堂和夏令营中，”DiPaola 说。

当这些孩子——甚至许多成年人——想到人工智能时，通常会想到一件事：机器人。“来自未来的机器人，将接管世界的杀手机器人，超级智能，”迪保拉说。“人工智能实际上存在于他们每天使用的技术中，这让他们大吃一惊。”

教师们经常告诉 STEP 实验室负责监督拨款的 Irene Lee，他们没有意识到人工智能正在被“部署”。他们认为这只是实验室里的一个抽象概念。“‘部署’？！”Lee 对他们说。“你们沉浸其中了！”

它存在于智能音箱中。它会推荐一部 Netflix 电影来放松心情。它会推荐新鞋。它会帮助银行贷款审批。公司用它来筛选求职者；学校用它来评分试卷。对于夏令营学生来说，也许最重要的是，它为 TikTok 等应用以及该平台发布的任何搞笑视频提供支持。

他们知道，当他们观看猫咪恶作剧的 TikTok 视频时，他们会得到类似视频的推荐，而且他们无限滚动的视频与朋友的不同。但他们通常没有意识到这些结果是人工智能的成果。“我不知道所有这些事实，”张说。

她的营友之一索哈姆·帕蒂尔 (Soham Patil) 对此表示赞同。帕蒂尔是一名八年级学生，在参加该项目之前，他已经研究了人工智能的工作原理，并花了几个月时间编写软件。“我知道如何编码，但并不真正了解人工智能的实际用途，”帕蒂尔说。“我知道如何使用它，但不知道它是用来做什么的。”

帕蒂尔、张和他们的同伴的下一个活动涉及不同的食物类别：面条。他们在屏幕上看到了一个奇怪的皇室成员——一只戴着皇冠、眼睛是爱心的猫。

“有一片意大利面食之国，以最美味的菜肴而闻名，那里的女王想把她那片土地上所有的干意大利面分类，并把它们存放在箱子里，”课文写道。“……作为 PastaLand 的主体，你的任务是建立一个分类系统，用来描述和分类意大利面，这样当女王想要某道菜时，她就可以轻松找到意大利面。”

抛开君主制伦理，学生们的目标是开发一种名为决策树的识别系统，该系统通过一系列问题根据物体的特征对物体进行分类，首先将物体分成两组，然后将每组再分成两组，然后再将每组再分成两组，直到每组中只剩下一种物体。对于意大利面，STEP 实验室的李解释说：“第一个问题可能是，‘它长吗？’‘它卷曲吗？’‘它有脊吗？’‘它是管状的吗？’”张的团队从“它是圆的吗？”、“它长吗？”和“它短吗？”开始。

不过，和以前一样，当孩子们重新聚在一起时，他们发现他们的问题都不一样了：有些人可能会问一片意大利面是否可以装很多酱汁还是只能装一点。另一个人可能会根据它们是否需要填馅来区分类型。帕蒂尔注意到，有些孩子会在每个关键时刻试图将未分类的意大利面分成两组大致相等的组。

“盲人能找到钥匙吗？”老师问道。那么简单地确定“长”的含义又有什么主观性呢？即使是意大利面也受到文化、经验和能力的影响。然后，学生们将这一认识（即很容易产生偏见、排斥他人或误认为您的意见是客观的）扩展到更高风险的情况。预测警务就是一个例子。该技术使用过去的犯罪数据来预测哪些区域风险高或谁最有可能犯罪。但任何使用遗留数据预测未来的人工智能都可能强化过去的偏见。2019 年《纽约大学法律评论》的一篇论文研究了伊利诺伊州、亚利桑那州和路易斯安那州的案例研究，并指出，如果不改革这些系统，可能会“造成持久后果，并将影响到整个刑事司法系统和更广泛的社会”。

[相关：谷歌的最新工具如何改变你的在线搜索方式]

学生们可以再次看到基于人工智能的选择如何影响结果。“他们可以知道，‘如果我这样设计，这些人会受到积极影响，这些人会受到消极影响，’”DiPaola 说。他们可以问自己，我如何确保最脆弱的人不会受到伤害？

人工智能开发人员发现自己越来越频繁地应对这些问题，部分原因是他们的工作现在触及人们生活的方方面面。他们代码中的偏见很大程度上是社会自身的偏见。以 YouTube 之类的推荐算法为例，前谷歌开发人员 Guillaume Chaslot 声称，这种算法会将观众引向更耸人听闻、更具分裂性、往往是错误信息的视频——以让更多人观看更长时间并吸引广告。这样的选择可以说更有利于利润而不是公正性。

通过早期教育，教育者希望让孩子们了解道德人工智能是什么样子、不公平是如何产生的以及如何解决它，让他们能够在不公平发生时认识到它，并制定策略来纠正问题。“道德要么是一门完全独立的课程，要么是学期课程的最后两三节课，”DiPaola 说。她说，这传达了一个隐含的教训：“道德不需要在你实际构建某些东西的同时考虑，否则道德就是一种事后的想法。”

对于数据库程序员 Denise Dreher 来说，更好地整合道德规范非常重要，她最近从明尼苏达州圣保罗的麦卡莱斯特学院 IT 系退休。作为一个个人项目，她一直在编目像 DAILy 这样的课程，并将 K-12 课程发布在她的网站 Explore AI Ethics 上，供教师在课堂上使用。她认为人工智能教育应该更像工程教学。“工程师培训在安全和道德方面有着悠久而良好的传统，”她说，“因为它是一种职业”，一种有固定职业道路的职业。你不能只是去建一座桥，或者在不考虑桥梁影响的情况下完成桥梁建设学校的学业。

“人工智能？”她继续说道。“你家地下室里任何一个 10 岁的孩子都能做到。”

随着夏令营的进展，伦理问题变得越来越大，学生们要面对的技术也越来越大。有一天，Facebook 首席执行官马克·扎克伯格 (Mark Zuckerberg) 出现在他们的屏幕上，Facebook 是一个主要由老年人组成的社交网络。扎克伯格说：“我希望我能一直告诉你们，我们的人生使命是连接人们，但事实并非如此。我们只是想预测你未来的行为。……你表达得越多，我们就越拥有你。”

那将是一次不同寻常的坦诚演讲。事实上，整个演讲看起来有点不对劲。扎克伯格的眼皮比身体其他部位稍微模糊一些。他盯着镜头不眨眼的时间比正常人要长。讲师指出，这些都是迹象。

他看起来不像一个正常人，因为他根本就不是正常人。他甚至不是一个真人。他是一个深度伪造的视频变形，正在发表深度伪造的演讲。深度伪造是人工智能在分析大量某人的镜头或照片后制作的镜头或图像。在这种情况下，该软件了解了扎克伯格在不同情况下说不同话时的外表和声音。有了这些材料，它拼凑出了一个不存在的扎克伯格，说了一些他从未说过的话。“很难想象人工智能如何制作视频，”帕蒂尔说。

张先生最喜欢的社交媒体是 YouTube，他观看了大量视频并认为并非所有视频都是“真实的”——但直到上这门课程之前，他还没有任何工具可以分辨真假。

这些营员可能都曾遇到过基于人工智能的造假。例如，一款名为 Reface 的应用程序可以让他们与另一个人交换面容——这是 TikTok 上的一项流行爱好。FaceTune 会将自拍照调整为符合欧洲传统的审美标准，漂白牙齿、瘦鼻子、撅嘴。但他们并不总是能分辨出别人是否做过调整。他们可能只是认为某某人今天肤色很好。

在虚假的视觉媒体中，真实与合成——人类与人工智能——有两张几乎一模一样的面孔。当孩子们完全理解这一点时，“可以说，这是一个事情变得真实的时刻，”加比·索萨说，他两个夏天都在夏令营工作。“他们知道你不能相信你看到的一切，这一点很重要，尤其是在我们这个充斥着如此多虚假信息的世界。”他们至少知道质疑所呈现的内容。

并非所有课程都进展顺利。“有些活动即使面对面也会让人难以理解，”讲师戴维斯说。例如，帕蒂尔很难理解神经网络的细节，神经网络是一种受大脑相互连接的神经元启发的软件。代码的目标是识别数据集中的模式并使用这些模式进行预测。例如，在天文学中，这样的程序可以学习预测望远镜图片中闪耀的星系类型。在夏令营中，孩子们就像神经网络的节点一样，预测一张松鼠在游泳池中“滑水”的照片的标题。它有点像传话游戏：老师向几名学生展示这张照片，他们写下描述它的关键词，然后每人将一个单词传递给没有看过这张照片的学生。这些孩子每人挑选两个单词传递给最后的营员，后者选择四个单词作为标题。对于“节点”来说，理解它们在网络中的作用并将其转换成软件是困难的。

但即使这些活动不会让年轻人的大脑融化，课程的效果也取决于“今天早上有多少学生吃了早餐，是星期一还是星期四下午，”戴维斯说。不像传统的夏令营，夏令营里只有独木舟和射箭。“这需要做很多工作，”张说。

让人工智能教育变得普及并多样化实施，比亲自向拥有 MacBook Pro 的私立学校学生讲授更为复杂。虽然合作伙伴一直计划将课程改为线上授课，以使其更容易普及，但疫情加快了这一计划的实施进度，并凸显了他们需要改进的地方，例如确保活动可以在不同的平台和设备上进行。

[相关：五角大楼让人工智能变得值得信赖的计划]

然后，媒体实验室的参与也带来了一些复杂情况。2019 年，该组织因从被定罪的性犯罪者杰弗里·爱泼斯坦 (Jeffrey Epstein) 那里收取金钱和表面上的文化声望而受到抨击，导致实验室主任离职。研究技术的社会和政治影响的作家叶夫根尼·莫罗佐夫 (Evgeny Morozov) 在《卫报》上指出，像实验室这样的组织所提倡的“第三种文化”——科学家和技术人员代表着社会最重要的“深度思想家”——是“在知识分子的旗帜下从事创业活动的完美盾牌”。也许你可以把这种批评应用到个人机器人总监辛西娅·布雷齐尔 (Cynthia Breazeal) 身上，她的公司在 2014 年至 2016 年期间获得了约 7000 万美元的资金，用于开发一款名为 Jibo 的“社交机器人”，这将有助于开启人机互动的新时代。这个故事有一个不愉快的结局：发货延迟、客户不满意、裁员、知识产权被抛售，没有真正的革命。

但这些也许也是学生在年轻时应该学习的好课程。华而不实的东西可能会以各种方式令人失望，即使是早期教授道德的地方也可能有自己的失误。也许这并不奇怪：毕竟，人工智能的问题只是人类的问题，没有人格化。

然而，人工智能的黑暗本质——它的歧视性、它的侵入性、它的欺骗性——并没有阻止营员们加入这个领域，正如张锋和帕蒂尔都在考虑的那样。

现在他们知道，无论他们申请什么工作，算法都很有可能帮助他们确定自己是否值得。有朝一日，他们也许会帮助重写这个算法。

这个故事最初刊登在 PopSci 2021 年秋季青年版上。阅读更多 PopSci+ 故事。

<<: 随着基础设施法案的出台，汽车前灯亟需升级

>>: Meta 首次公开展示其首款 VR 可穿戴设备