从科学角度来说，ChatGPT 并不好笑

ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户，但至少有一个迹象表明其存在局限性。尽管人工智能能力强大，但它却不会讲笑话。

更具体地说，它们讲不了多少笑话，更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样，两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道，ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论，它的喜剧曲目很可能是在训练阶段学习和记忆的，而不是在运行中产生的。

[相关：大型科技公司最新的人工智能末日警告可能只是同样的炒作。]

据研究人员称，ChatGPT 的所有回答在语法上都是正确的，而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”，而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”（复数）。正如Ars Technica最近指出的那样，即使是人工智能相对较少的独特生成数量，也是将其已经记住的笑话部分混合在一起的结果。更重要的是，它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的：“为什么这个人把钱放进搅拌机里？他想让时间飞逝。”

有趣的是，ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣，即使是经典的“反笑话”设置，例如“为什么小鸡要过马路？为了到达另一边。 ”然而，进一步的压力测试表明，这种能力存在于其先前的训练和记忆中。例如，当被问及小鸡“反笑话”的细微变化时，人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系：

问：你能解释一下为什么这个笑话好笑吗：为什么小鸡要穿过操场？为了到达另一张滑梯。
答： “这个笑话是文字游戏，使用了‘滑梯’一词的双重含义。在操场上，通常有两种滑梯——一种是孩子们可以滑下来的操场滑梯，另一种是棒球滑梯，这是棒球中使用的一种滑行技术。”

[相关：不，人工智能聊天机器人（仍然）不具备感知能力。]

Jentzch 和 Kersting 写道，这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后，研究人员得出结论，ChatGPT 到目前为止只学会了“一种特定的笑话模式，而不是能够真正地搞笑”，但它对笑话的生成、解释和识别关注的是笑话的含义和内容，而不是表面特征。与之前的大型语言模型相比，ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。

Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶，理由是存在安全性和滥用问题。当被要求解释这一难题时，OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”，“戏谑地讽刺了 AI 研究面临的挑战”。

很好，ChatGPT-4。

<<: 欧盟在监管人工智能方面迈出了一大步

>>: 谷歌的新人工智能将展示衣服穿在不同体型上的效果