ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户,但至少有一个迹象表明其存在局限性。尽管人工智能能力强大,但它却不会讲笑话。 更具体地说,它们讲不了多少笑话,更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样,两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道,ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论,它的喜剧曲目很可能是在训练阶段学习和记忆的,而不是在运行中产生的。 [相关:大型科技公司最新的人工智能末日警告可能只是同样的炒作。] 据研究人员称,ChatGPT 的所有回答在语法上都是正确的,而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”,而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”(复数)。正如Ars Technica最近指出的那样,即使是人工智能相对较少的独特生成数量,也是将其已经记住的笑话部分混合在一起的结果。更重要的是,它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的:“为什么这个人把钱放进搅拌机里?他想让时间飞逝。” 有趣的是,ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣,即使是经典的“反笑话”设置,例如“为什么小鸡要过马路?为了到达另一边。 ”然而,进一步的压力测试表明,这种能力存在于其先前的训练和记忆中。例如,当被问及小鸡“反笑话”的细微变化时,人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系:
[相关:不,人工智能聊天机器人(仍然)不具备感知能力。] Jentzch 和 Kersting 写道,这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后,研究人员得出结论,ChatGPT 到目前为止只学会了“一种特定的笑话模式,而不是能够真正地搞笑”,但它对笑话的生成、解释和识别关注的是笑话的含义和内容,而不是表面特征。与之前的大型语言模型相比,ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。 Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶,理由是存在安全性和滥用问题。当被要求解释这一难题时,OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”,“戏谑地讽刺了 AI 研究面临的挑战”。 很好,ChatGPT-4。 |
古罗马人是混凝土大师,他们将沙子、水和岩石混合在一起,打造出经久不衰的奇迹。他们用混凝土建造的桥梁、...
洗涤剂,准备被扰乱吧。新型织物柔顺剂 Sofft 的制造商表示,他们希望我们的衣服能与我们一起对抗臭...
随着技术进步以闪电般的速度飞速发展,成堆的软盘、VHS 录像带,甚至成堆的旧文件很可能无法从中提取信...
电动汽车是不可避免的未来。丰田和特斯拉等汽车制造商分别通过混合动力汽车和全电动化的努力为电气化铺平了...
今天,在火星上,一台 13 岁的美国机器人将从火星陨石坑向上拍摄新欧洲同伴的到来。这是太阳系的第一次...
今天早上,当我们坐在华盛顿特区 K 街对面的会议室里时,一名男子告诉在场的记者,这本该是好玩的。他们...
根据一项新研究,附近行星系统中一颗超地球大小的系外行星很可能主要由碳组成,这意味着它有一部分由钻石组...
通过 GIPHY以动词“移除”为例。作为人类,您了解该词的不同用法,并且您知道从视觉上看,场景会因移...
我们已经了解了您应该在桌面上使用 Instagram 网页版的原因——它在更大的显示屏上看起来很棒,...
此帖子已更新。飓风迈克尔于周二下午达到强飓风级别,并在周三逼近佛罗里达狭长地带时发展为四级飓风。飓风...
本周,谷歌宣布了一项突破,可以证明其量子计算机确实在使用量子力学。当研究人员向 D-Wave 2X ...
Charmy Kitty Vol.2 Charmy & Friends 的号召力与口碑200...
当你问人们生活中不可缺少什么技术时,他们通常会将汽车、互联网和室内管道列为舒适生活的必需品。但在今年...
如果你打算买一台新笔记本电脑,面对如此多的选择,你可能会感到有些不知所措,这是可以理解的。毕竟,市场...
几个世纪以来,古代石匠如何以及为何建造巨石阵一直困扰着历史学家和科学家。但研究人员现在认为,新的分析...