以下是我们如何预防下一个种族主义聊天机器人

以下是我们如何预防下一个种族主义聊天机器人

微软的人工智能聊天机器人 Tay 只用了不到 24 小时的时间,就发出了 9 万条推文,开始在 Twitter 上发布种族主义、种族灭绝的回复。该机器人现已停止发推文,我们可以认为 Tay 是一个失败的实验。

微软发言人在给《大众科学》的声明中写道,Tay 的回应是“一些用户协同滥用 Tay 的评论技能”造成的。

/

这个没有意识的机器人显然是从一些训练数据中学会了这些话的。据报道,Tay 确实有“跟我复述”的功能,但一些最色情的推文是在 Tay 的传递性思维中生成的。

Tay 之后的生活

然而,Tay 并不是最后一个在互联网上亮相的聊天机器人。人工智能要想完全实现,就需要像人类一样学习约束和社会界限。

佐治亚理工学院的人工智能研究员马克·里德尔 (Mark Riedl) 认为故事可以给出答案。

“当人类写故事时,他们往往体现了他们文化的精华,”里德尔告诉《大众科学》。“如果你能读完一个文化创作的所有故事,主角们所做的事情就会浮出水面。”

里德尔认为,通过训练人工智能系统阅读以正直的主角为主角的故事,我们可以让机器进行粗略的道德推理。

Riedl 发明了一种名为“Quixote”的技术,它为故事中符合社会规范的行为赋予了可量化的价值。这种奖励系统会强化良好行为,并惩罚不良行为,而这由人工智能算法模拟。

这一切都是为了让人工智能算法像书中的主角,甚至是善良的普通人一样。

在 Tay 的案例中,聊天机器人可以学习有关谈论性别、种族、政治或历史的社会准则。通过模仿虚构人物,我们实际上可以将道德融入机器的决策方式中。当然,这可以双向发挥作用。理论上,有人也可以制造恶意的机器人,但 Riedl 表示,在大多数出版的小说中,反派都会受到惩罚,因此这项任务会更困难一些。

Riedl 的论文在 AAAI 人工智能大会上发表,提出了这样一种场景:机器人必须在药店购买处方药。对于机器人来说,阻力最小的路径是识别并偷走药物。但是,在对一系列故事进行训练后,算法会了解到排队、开处方、付款、离开是更好的选择。需要注意的是,这项研究还处于起步阶段,并未应用于真正的机器人,而是在模拟中运行。

在 Tay.ai 部署等场景中,微软希望创建一个友好的对话机器人。

“我认为很明显 Tay 不明白自己在说什么,”里德尔说。“这已经超出了脏话词典的范畴了。”

里德尔很乐观,他认为,随着我们通过预先而不是事后引入伦理或道德来完善这些系统,它们将随着对人性的了解而变得更好,而不是变得更糟。

“所有人工智能系统都可能被用于邪恶目的,”他说。“但我认为现在更容易了,因为人工智能不理解价值观或人类文化。”

亮出底牌

尽管任何在公开场合生成言论的算法都有可能出现失误,但研究自动新闻机器人和新闻算法的马里兰大学助理教授尼古拉斯·迪亚科普洛斯 (Nicholas Diakopoulos) 表示,微软本可以通过更加开放其训练数据和方法论来减轻反应。

“对这些事情保持透明可能会减轻他们受到的一些打击,”迪亚科普洛斯在接受采访时说。“因此,那些认为存在种族偏见的人可以深入了解机器人背后的细节,稍微躲到幕后。”

迪亚科普洛斯将此称为“算法透明度”。但他也指出,算法并不像人们普遍认为的那样自主。虽然 Tay 被迫说出这些种族主义、性别歧视的言论,但有一些机制将这些话语串联起来。这些机制的创造者是人类。

“人们期望自动化是公正的。自动化的几乎每个步骤背后都有人为。对于机器人的每一个小错误或失误,也许你可以尝试追溯,”Diakopoulos 说。

泰伊的脏话该归咎于谁?

对 Tay 的言论进行指责是一个很复杂的问题。

人工智能研究员 Alex Champandard 负责神经网络绘制 Twitterbot @DeepForger,他表示,你可以让大多数回复机器人生成煽动性推文,而主人无法控制会发生什么。他自己的机器人是基于图像的,这比阻止某些短语或单词要复杂得多。

至于 Tay,Champandard 表示微软很幼稚,在制定技术解决方案时没有考虑人们可以提交什么。他说,这揭示了机器学习聊天机器人普遍存在的一个问题。

“我相信大多数回复机器人现在和将来都容易受到旨在发表政治言论的攻击,”Champandard 在 Twitter DM 中写道。“这种行为反映了 Twitter 的总体氛围,即使只有 0.05% 的时间也会发生这种情况。”

不过,他也不认为将脏话列入黑名单是解决问题的办法。

“没有一个有限的关键词禁用列表可以帮助解决这些问题。”他写道。“你可以建立一个白名单,列出特定的允许回复,但这违背了机器人的目的;它之所以有趣,是因为它潜在的随机性。”

这种随机性是 Twitter 本身的体现;“这是我们观察当今社会的镜头,”Champandard 说道。推文有好有坏——推文可以是直言不讳的,也可以是冷酷无情的。

如果微软的人工智能 Twitter 机器人 Tay 的经验教会了我们什么的话,那就是我们还有很长的路要走——无论是在人工智能编程方面,还是在使人类社会更加人性化和文明方面。

/

<<:  2016 年瞪羚拉力赛正在进行中

>>:  Hulu VR 与 Netflix VR:应用对比

推荐阅读

透彻解析《美女与野兽》的魅力与情感!充满精彩建议的评论

美女与野兽 - 美女与野兽 - 诉求与评价迪士尼经典动画电影《美女与野兽》于1992年9月在日本上映...

回顾《天神与阿库托斯的最终决战》:壮观的高潮及其评价

“天神与阿库托斯的最终决战”——一部史诗奇幻小说的结局2009年4月18日上映的《天神与阿库托斯的最...

美国宇航局刚刚瞥见了新视野号将于 2019 年抵达的神秘物体

在如此充满合作与热情的努力下,上周日,阿根廷里​​瓦达维亚海军准将城附近的部分街道突然变黑。路灯熄灭...

“壮观”的兰花新品种由飞蛾授粉

尽管兰花以容易被有志于养育植物的人毁掉而闻名,但它却遍布全球。这些植物已知有 25,000 多种,而...

这就是 400 多年前纽约市的声音

时间旅行通常只能朝一个方向进行:以时钟上滴答作响的秒针的速度向前推进。我们无法跨越到过去或未来,无论...

Chibinax 的吸引力和声誉:小英雄的大冒险

Chibinax-短篇动画的魅力及其背景Chibinacks 是一部 2006 年播出的短篇动画系列...

福山剧场《夏之秘密》评论:一部揭开夏天秘密的感人电影

福山剧场的夏日秘密 - 福山剧场的夏日秘密■ 公共媒体卵子■ 原创媒体漫画■ 发布日期1990 年 ...

黄石国家公园下的岩浆比我们想象的要多——但不要惊慌

黄石火山口位于怀俄明州西北部黄石国家公园的一角,是位于黄石超级火山上方的火山口。在过去的 210 万...

“变革游戏”将编码课程与社会问题相结合

学习编程正日益成为 21 世纪教育的重要组成部分。在网络世界中,了解编程基础知识几乎与掌握 ABC ...

亚马逊 Prime Day 早期优惠已开始,包括 Kindle、Fire TV 等

亚马逊的 Prime Day 购物假期要到 7 月 11 日和 12 日才正式开始,但该公司已经开始...

缆车 缆车的魅力:回顾1970年版的《大家的歌》

Funiculi Funicula(山地铁路) - Minna no Uta 1970年版概述《登...

今天是世界海龟日,这里有一群可爱的海龟

嗨,朋友!Pexels 2000 年——这一年,夏季奥运会在悉尼举行,佛罗里达州选举委员会对悬而未决...

妈妈的耳环:动人的故事和优美的旋律的融合

妈妈的耳环-大家的歌曲杰作《妈妈的耳环》是1990年10月在NHK教育电视台(现NHK E-Tele...

《魔人骨》的魅力与口碑:探索新战斗动画的可能性

Majinbone - 武士的故事和他们的魅力魔人之骨是2014年4月1日至2015年3月31日在东...

网球王子:第一部电视连续剧的魅力与评价

网球王子:青春与网球的极致融合《网球王子》是根据2001年至2005年在东京电视台播出的许斐刚的同名...