以下是我们如何预防下一个种族主义聊天机器人

以下是我们如何预防下一个种族主义聊天机器人

微软的人工智能聊天机器人 Tay 只用了不到 24 小时的时间,就发出了 9 万条推文,开始在 Twitter 上发布种族主义、种族灭绝的回复。该机器人现已停止发推文,我们可以认为 Tay 是一个失败的实验。

微软发言人在给《大众科学》的声明中写道,Tay 的回应是“一些用户协同滥用 Tay 的评论技能”造成的。

/

这个没有意识的机器人显然是从一些训练数据中学会了这些话的。据报道,Tay 确实有“跟我复述”的功能,但一些最色情的推文是在 Tay 的传递性思维中生成的。

Tay 之后的生活

然而,Tay 并不是最后一个在互联网上亮相的聊天机器人。人工智能要想完全实现,就需要像人类一样学习约束和社会界限。

佐治亚理工学院的人工智能研究员马克·里德尔 (Mark Riedl) 认为故事可以给出答案。

“当人类写故事时,他们往往体现了他们文化的精华,”里德尔告诉《大众科学》。“如果你能读完一个文化创作的所有故事,主角们所做的事情就会浮出水面。”

里德尔认为,通过训练人工智能系统阅读以正直的主角为主角的故事,我们可以让机器进行粗略的道德推理。

Riedl 发明了一种名为“Quixote”的技术,它为故事中符合社会规范的行为赋予了可量化的价值。这种奖励系统会强化良好行为,并惩罚不良行为,而这由人工智能算法模拟。

这一切都是为了让人工智能算法像书中的主角,甚至是善良的普通人一样。

在 Tay 的案例中,聊天机器人可以学习有关谈论性别、种族、政治或历史的社会准则。通过模仿虚构人物,我们实际上可以将道德融入机器的决策方式中。当然,这可以双向发挥作用。理论上,有人也可以制造恶意的机器人,但 Riedl 表示,在大多数出版的小说中,反派都会受到惩罚,因此这项任务会更困难一些。

Riedl 的论文在 AAAI 人工智能大会上发表,提出了这样一种场景:机器人必须在药店购买处方药。对于机器人来说,阻力最小的路径是识别并偷走药物。但是,在对一系列故事进行训练后,算法会了解到排队、开处方、付款、离开是更好的选择。需要注意的是,这项研究还处于起步阶段,并未应用于真正的机器人,而是在模拟中运行。

在 Tay.ai 部署等场景中,微软希望创建一个友好的对话机器人。

“我认为很明显 Tay 不明白自己在说什么,”里德尔说。“这已经超出了脏话词典的范畴了。”

里德尔很乐观,他认为,随着我们通过预先而不是事后引入伦理或道德来完善这些系统,它们将随着对人性的了解而变得更好,而不是变得更糟。

“所有人工智能系统都可能被用于邪恶目的,”他说。“但我认为现在更容易了,因为人工智能不理解价值观或人类文化。”

亮出底牌

尽管任何在公开场合生成言论的算法都有可能出现失误,但研究自动新闻机器人和新闻算法的马里兰大学助理教授尼古拉斯·迪亚科普洛斯 (Nicholas Diakopoulos) 表示,微软本可以通过更加开放其训练数据和方法论来减轻反应。

“对这些事情保持透明可能会减轻他们受到的一些打击,”迪亚科普洛斯在接受采访时说。“因此,那些认为存在种族偏见的人可以深入了解机器人背后的细节,稍微躲到幕后。”

迪亚科普洛斯将此称为“算法透明度”。但他也指出,算法并不像人们普遍认为的那样自主。虽然 Tay 被迫说出这些种族主义、性别歧视的言论,但有一些机制将这些话语串联起来。这些机制的创造者是人类。

“人们期望自动化是公正的。自动化的几乎每个步骤背后都有人为。对于机器人的每一个小错误或失误,也许你可以尝试追溯,”Diakopoulos 说。

泰伊的脏话该归咎于谁?

对 Tay 的言论进行指责是一个很复杂的问题。

人工智能研究员 Alex Champandard 负责神经网络绘制 Twitterbot @DeepForger,他表示,你可以让大多数回复机器人生成煽动性推文,而主人无法控制会发生什么。他自己的机器人是基于图像的,这比阻止某些短语或单词要复杂得多。

至于 Tay,Champandard 表示微软很幼稚,在制定技术解决方案时没有考虑人们可以提交什么。他说,这揭示了机器学习聊天机器人普遍存在的一个问题。

“我相信大多数回复机器人现在和将来都容易受到旨在发表政治言论的攻击,”Champandard 在 Twitter DM 中写道。“这种行为反映了 Twitter 的总体氛围,即使只有 0.05% 的时间也会发生这种情况。”

不过,他也不认为将脏话列入黑名单是解决问题的办法。

“没有一个有限的关键词禁用列表可以帮助解决这些问题。”他写道。“你可以建立一个白名单,列出特定的允许回复,但这违背了机器人的目的;它之所以有趣,是因为它潜在的随机性。”

这种随机性是 Twitter 本身的体现;“这是我们观察当今社会的镜头,”Champandard 说道。推文有好有坏——推文可以是直言不讳的,也可以是冷酷无情的。

如果微软的人工智能 Twitter 机器人 Tay 的经验教会了我们什么的话,那就是我们还有很长的路要走——无论是在人工智能编程方面,还是在使人类社会更加人性化和文明方面。

/

<<:  2016 年瞪羚拉力赛正在进行中

>>:  Hulu VR 与 Netflix VR:应用对比

推荐阅读

自动驾驶汽车公司正在不断增加模拟行驶里程。原因如下。

自动驾驶汽车已经在现实世界的街道上行驶。例如,Waymo 的自动驾驶汽车正在亚利桑那州凤凰城接载乘客...

举报人称 Twitter 在用户隐私、机器人、安全等方面撒谎

黑客圈和网络安全行业最受尊敬的人物之一皮特·“马奇”·扎特科 (Pieter “Mudge” Zat...

本杰明·富兰克林利用科学保护他的钱币免遭伪造

当他不忙于发明避雷针和双光眼镜、电死火鸡或在美国独立战争期间担任法国外交官时,18 世纪博学者本杰明...

《长那山与早那山》的诉求与评价:深度解读大家之歌的杰作

深受孩子们喜爱的 NHK 经典动画《Nagaina-san 和 Hayaina-san》 《长奈小姐...

亚马逊地区一半以上的树种处于危险之中

我们从小就在小学和护林员里克的讲解中了解到砍伐雨林的危害。我们知道砍伐雨林是件坏事——许多动物和树木...

操纵原子运动可以使金属更坚固、更弯曲

地壳分裂成七大板块,不断滑动和相互磨擦。虽然肉眼看不到这个过程,但你能看到其结果:例如,板块碰撞时会...

UFO 战士 Daiapolon:重新评价怀旧机器人动画

UFO 战士 Daiapolon:70 年代巨型机器人动漫的典范■ 公共媒体电视动画系列■ 原创媒体...

《小鬼当家》评论:一部描绘独自在家的快乐与恐惧的杰作动画

《Rusuban独自在家》:孤独夜晚的冒险与成长故事《小鬼当家》于 1996 年 5 月在影院上映,...

古老山谷可能蕴藏着火星过去生命的线索

火星南半球有数百个山谷网络,长期以来一直困扰着地质学家。他们认为液态水的侵蚀形成了这些古老的洼地,这...

大魔神号的魅力与名声:彻底解说传奇机器人动画

大魔神:永远的勇者物语《大魔神》是根据永井豪和 Dynamic Production 的原著改编的电...

《铁拳小子》的魅力与评价:彻底解读这部格斗漫画杰作

铁拳小子 - 铁拳小子 - 综合评测推荐■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间1988...

FCC 希望您能帮助更好地了解美国宽带接入情况

美国有多少人可以使用可靠的高速互联网连接?这似乎是一个相对简单的问题。不幸的是,一旦你开始挖掘,数据...

大砗磲是藻类的温室

巨型蛤蚌在珊瑚礁中若隐若现,张开的嘴里充满了明亮的光芒。在其他软体动物身上,这种彩虹色是一种伪装,可...

DuckDuckGo 的新 Mac 浏览器旨在将隐私放在首位

专注于隐私的搜索引擎公司 DuckDuckGo 正在将其 DuckDuckGo 隐私浏览器引入 ma...

想知道在哪里可以观看纪录片?试试 MagellanTV,观看 3000 多个节目

自从流媒体内容的受欢迎程度爆发式增长以来,它作为一种媒介发生了巨大变化。过去,你可能能够在一两种服务...