ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户,但至少有一个迹象表明其存在局限性。尽管人工智能能力强大,但它却不会讲笑话。 更具体地说,它们讲不了多少笑话,更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样,两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道,ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论,它的喜剧曲目很可能是在训练阶段学习和记忆的,而不是在运行中产生的。 [相关:大型科技公司最新的人工智能末日警告可能只是同样的炒作。] 据研究人员称,ChatGPT 的所有回答在语法上都是正确的,而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”,而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”(复数)。正如Ars Technica最近指出的那样,即使是人工智能相对较少的独特生成数量,也是将其已经记住的笑话部分混合在一起的结果。更重要的是,它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的:“为什么这个人把钱放进搅拌机里?他想让时间飞逝。” 有趣的是,ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣,即使是经典的“反笑话”设置,例如“为什么小鸡要过马路?为了到达另一边。 ”然而,进一步的压力测试表明,这种能力存在于其先前的训练和记忆中。例如,当被问及小鸡“反笑话”的细微变化时,人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系:
[相关:不,人工智能聊天机器人(仍然)不具备感知能力。] Jentzch 和 Kersting 写道,这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后,研究人员得出结论,ChatGPT 到目前为止只学会了“一种特定的笑话模式,而不是能够真正地搞笑”,但它对笑话的生成、解释和识别关注的是笑话的含义和内容,而不是表面特征。与之前的大型语言模型相比,ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。 Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶,理由是存在安全性和滥用问题。当被要求解释这一难题时,OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”,“戏谑地讽刺了 AI 研究面临的挑战”。 很好,ChatGPT-4。 |
在以 440 亿美元收购社交媒体平台之后,埃隆·马斯克 (Elon Musk) 的 Twitter ...
Masamune Dateniruku - Masamune Dateniruku 的全面评论和推荐...
我的工作是寻找酷炫的东西。整个星期我都会花几个小时在网上搜索有用、有趣或便宜得离谱的东西。很多时候,...
波士顿动力公司的 Spot 和 Cheetah 等四足机器人的敏捷性几乎全部归功于精妙的步法。虽然它...
夏季野餐季节即将到来,而烧烤架无疑是烧烤活动的重头戏。Kamado Joe 已将其 13.5 英寸便...
Battle Spirits Double Drive - 激情战斗与友情的故事《Battle S...
《乌鸦不会选择主人》——深刻的故事和美丽的画面的融合《乌鸦不会选择主人》于2024年4月6日起在NH...
入侵物种会有意或无意地出现在它们不应该出现的地方。有时人们会在花园里种植漂亮的植物,比如喷泉草,然后...
《Mahoromatic 夏日 TV 特别节目》——回顾夏日回忆,真幌与优的对决《Mahoromat...
您可能听说过 Watson,这是 IBM 的超级智能超级计算机,不久前它在Jeopardy! 节目中...
《星际火枪手俾斯麦》:守护宇宙和平的战士们的故事■作品概要《星际火枪手俾斯麦》是一部电视动画,于 1...
在讨论美国联邦航空管理局耗资数十亿美元的 NextGen 计划时,飞机设计常常被忽视。该计划是一项精...
在我家,棋盘游戏非常有趣。在一次特别令人毛骨悚然的记忆之争中,我哥哥差点和一位家庭朋友大打出手,因为...
无人潜水器由厚度近一英寸的不锈钢外壳和超强蓝宝石水晶制成的窗户保护着,我们可以从潜水器上观察到在地球...
“Nanare Hana Nare” - Nonare Hana Nare - 评论和推荐概述《Na...