语言正在训练人工智能来复制人类的偏见

语言正在训练人工智能来复制人类的偏见

语言就是重复。你读到的每一个词都是人类创造的,然后被其他人使用,创造并强化语境,也就是语言的本质。当人类训练机器理解语言时,他们也在教机器复制人类的偏见。

普林斯顿大学信息技术政策中心的艾琳·卡利斯坎 (Aylin Caliskan) 表示:“我们能够展示和证明的主要科学发现是,语言反映了偏见。如果人工智能接受人类语言的训练,那么它必然会吸收这些偏见,因为它代表了世界的文化事实和统计数据。”

Caliskan 的研究成果与合著者 Joanna Bryson 和 Arvind Narayanan 于上周在《科学》杂志上发表。本质上,他们发现如果有人训练机器理解人类语言,那么它也会习得那些固有的偏见。

对于人类来说,测试偏见的最佳方法之一是隐性联想测试,该测试要求人们将“昆虫”等单词与“愉快”或“不愉快”等单词联系起来,然后测量延迟时间,即建立这种联系所需的时间。人们很快就会将昆虫标记为不愉快的,而将它们标记为愉快的则要慢一些,因此这是衡量联想的一个很好的指标。

在计算机中测试犹豫并不奏效,因此研究人员找到了另一种方法来查看计算机更愿意将哪些词与其他词联系起来。就像学生仅根据出现在单词附近的单词来猜测不熟悉单词的含义一样,研究人员训练人工智能将在线上出现的彼此接近的单词联系起来,而不将不接近的单词联系起来。

想象一下,每个单词都是三维空间中的一个向量。在同一个句子中常用的单词离它更近,而在句子中很少使用的单词则是离它更远的向量。两个单词越接近,机器就越有可能将它们联系起来。如果人们说“程序员”离“他”和“计算机”很近,但说“护士”离“她”和“服装”很近,这就说明了语言中存在隐性偏见。

向计算机提供这种语言数据来教它们并不是一个新概念。斯坦福的“词表示全局向量”等工具(在本文发表之前就已存在)根据相关词的使用情况绘制相关词之间的向量。GloVe 的词集包括从 20 亿条推文中提取的 270 亿个单词、2014 年从维基百科中提取的 60 亿个单词以及从互联网上随机搜索中提取的 8400 亿个单词。

“你可以说‘‘leash’在‘cat’附近出现了多少次?’和‘‘leash’在‘dog’附近出现了多少次?’和‘‘leash’在‘justice’附近出现了多少次?’,这将成为该词特征的一部分,”Bryson 说。“然后你可以将这些向量与余弦进行比较。cat 和 dog 有多接近?cat 和 justice 有多接近?”

正如内隐联想测试可以显示人类潜意识中认为哪些概念是好的,哪些是坏的一样,计算不同词组之间的平均距离可以向研究人员展示计算机在理解语言时开始表现出的偏见。经过语言理解训练的机器竟然能够察觉人类对花朵(它们令人愉悦)和昆虫(它们令人不快)的偏见,这真是令人惊叹,布赖森说,如果这仅仅是一项重要研究,那么这项研究的意义就不止于此。但它的研究远不止于此。

“还有第二个测试,即测量我们的发现与公开的统计数据之间的数量,”卡利斯坎说。“我查阅了 2015 年的劳工统计局,他们每年都会公布职业名称以及该职业中女性和黑人的比例。通过查看 50 个职业名称的构成并计算它们与男性或女性的关联,我得到了与劳工局数据 90% 的相关性,这非常令人惊讶,因为我没想到能够从如此嘈杂的数据中找到这样的相关性。”

因此,计算机通过将与工作相关的词语与特定性别或族群联系起来,来识别种族主义和性别歧视。本文强调的一个例子是“程序员”,它在英语中不是一个性别词,但通过它的使用,现在具有了男性职业的内涵。

“我们没有想过,当你说程序员时,你是指男性还是女性,”布赖森说,“但事实证明,它出现在该词通常出现的语境中。”

用语言使用数据集训练的机器(如 GloVe)会发现这种关联,因为这是当前语境,但这意味着未来的研究人员应该谨慎使用这些数据,因为同样的人类偏见是根深蒂固的。当卡利斯坎用维基百科词汇集训练该工具时,她发现它包含与她在从互联网上提取的更大词汇集中发现的偏见相同的偏见。

“为了意识到偏见,为了消除偏见,我们需要量化它,”卡利斯坎说,“偏见是如何进入语言的,人们是否从接触语言的方式开始产生偏见联想?了解这一点也有助于我们找到答案,也许可以减少未来的偏见。”

一个答案可能是研究其他语言。该研究重点关注互联网上的英语词汇,因此它发现的词汇使用偏见一般是能够使用互联网的英语人士的偏见。

“我们正在研究不同类型的语言,并根据语言的语法,试图了解它是否会影响性别刻板印象或性别歧视,仅仅是因为语言的语法,”卡利斯坎说。“有些语言没有性别,有些语言的性别稍多一些。在英语中,代词有性别,但在德语等语言中,名词有性别,而且性别差异更大。斯拉夫语中有性别形容词,甚至动词,我们想知道,这会如何影响社会中的性别偏见?”

了解偏见是如何进入语言的也是理解人们除了明确的定义之外还为单词添加哪些其他隐含含义的一种方式。

“在某种程度上,这有助于我思考意识,”这项研究的作者之一乔安娜·布赖森说。“意识的用处是什么?你想要拥有对世界的记忆,你想知道什么样的事情通常会发生。这就是你的语义记忆。”

语言的可变性,以及通过使用而形成语义上下文的方式,意味着这不一定是我们理解这个世界的唯一方式。

“你希望能够创造一个新的现实,”布赖森继续说道。“人类已经决定,我们现在已经把事情安排得足够好了,我们可以让女性工作和发展事业,这是完全可行的。现在我们可以协商一项新的协议,比如,“我们不会说‘程序员他’,我们会说‘程序员他们’,即使我们说的是单数,因为我们不想让人们觉得他们不能成为程序员。”

并且,除非人们在使用人类语言对机器进行编程时考虑到这些现有的偏见,否则他们创造的将不是没有偏见的机器,而是复制人类偏见的机器。

“许多人认为机器是中立的,”卡利斯坎说。“机器并不是中立的。如果你有一个顺序算法,可以按顺序做出决策,比如机器学习,你知道它是在一组人类数据上训练的,因此它必须呈现和反映这些数据,因为历史数据包含偏见,如果它是一个好的训练算法,训练模型也必须包括这些偏见。如果它足够准确,它将能够理解所有这些关联。机器学习系统会学习它所看到的东西。”

<<:  黑胶唱片又回来了。但直到现在,唱片制作还停留在 80 年代。

>>:  手机会致癌吗?意大利陪审团随机抽样调查显示,证据仍显示“不会”

推荐阅读

男人和女人在 Facebook 上聊天的不同方式

唉,我们怎么这么典型?一项针对不同人口统计学特征的 Facebook 用户在状态更新中使用的不同词语...

飞蛾用自己的声音对抗回声定位的蝙蝠

在漆黑的夜晚,蝙蝠会利用声波寻找飞蛾来吃。然而,这些昆虫在蝙蝠面前并非完全没有防御能力。有些飞蛾会利...

《花牌情缘3》:深入竞技歌牌世界的感人最终章和成长故事

花牌情缘3 青春的光辉与歌牌竞技的世界《花牌情缘3》是改编自末次雪的人气漫画的电视动画系列的第三季,...

《天的设计团》的号召力与评价:描绘神话世界的创意冒险

《天的设计团队》的号召与评价《天国设计队》是一部电视动画系列,改编自 Hebizo、Suzuki T...

物理学家刚刚为我们带来了“量子自旋液体”,一种奇怪的新物质状态

固体由或多或少被锁定在有序结构中的原子组成。另一方面,液体由可以自由流动和相互交错的原子组成。但想象...

这种古老的恐龙亲戚看起来惊人地像鳄鱼

阿根廷自然科学博物馆借助可以深入研究化石的激光扫描等先进技术,以及艰苦挖掘古代骨骼等传统方法,我们每...

海军版 Roomba 可检查价值数十亿美元的船舶是否受损

3 月 27 日,Gecko Robotics 宣布其船体检查机器人将用于评估美国海军驱逐舰和两栖攻...

大家的歌版《44只猫》的魅力与评价

44 只猫 - 44 只猫概述《44只猫》是一部时长只有两分钟的短篇动画作品,于 1969 年 4 ...

后期试验表明 Moderna 的 RSV 疫苗对老年人有效

1 月 17 日,Moderna 宣布,该公司针对呼吸道合胞病毒(RSV)的实验性信使 RNA(mR...

美国人过去经常吃鸽子——现在鸽子可能正在卷土重来

布罗布森·卢茨清楚地记得他第一次看到雏鸽。那是在 20 世纪 70 年代,当时他在纽约市现已关闭的法...

我们拥有量子计算机——现在亚马逊和哈佛想要量子互联网

计算和研究领域的两大参与者正在努力为未来的量子互联网奠定基础。亚马逊网络服务 (AWS) 正与哈佛大...

这位父亲为他的儿子制作了精彩的 CGI 视频

丹尼尔·桥本 (Daniel Hashimoto) 看起来是个很酷的爸爸。梦工厂工作室的 After...

这位 18 岁少年发明了一款可以为手机充电的咖啡杯

安·马科辛斯基的第一个玩具是一盒晶体管。从那时起,她就一直在捣鼓东西,用热胶枪和家用物品制作项目。几...

配备激光和机械臂的卡车将帮助空军处理炸弹

未爆炸的炸弹是一种可怕的威胁,空军正在投资配备强大激光和机械臂的装甲车,以安全地清除跑道上的未爆炸炸...

现视研第 2 代:特典视频的魅力与评价

“现视研第 2 代特典视频”-OVA 的魅力和背景《现视研第 2 代 Video Bonus》是 K...