ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户,但至少有一个迹象表明其存在局限性。尽管人工智能能力强大,但它却不会讲笑话。 更具体地说,它们讲不了多少笑话,更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样,两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道,ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论,它的喜剧曲目很可能是在训练阶段学习和记忆的,而不是在运行中产生的。 [相关:大型科技公司最新的人工智能末日警告可能只是同样的炒作。] 据研究人员称,ChatGPT 的所有回答在语法上都是正确的,而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”,而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”(复数)。正如Ars Technica最近指出的那样,即使是人工智能相对较少的独特生成数量,也是将其已经记住的笑话部分混合在一起的结果。更重要的是,它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的:“为什么这个人把钱放进搅拌机里?他想让时间飞逝。” 有趣的是,ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣,即使是经典的“反笑话”设置,例如“为什么小鸡要过马路?为了到达另一边。 ”然而,进一步的压力测试表明,这种能力存在于其先前的训练和记忆中。例如,当被问及小鸡“反笑话”的细微变化时,人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系:
[相关:不,人工智能聊天机器人(仍然)不具备感知能力。] Jentzch 和 Kersting 写道,这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后,研究人员得出结论,ChatGPT 到目前为止只学会了“一种特定的笑话模式,而不是能够真正地搞笑”,但它对笑话的生成、解释和识别关注的是笑话的含义和内容,而不是表面特征。与之前的大型语言模型相比,ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。 Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶,理由是存在安全性和滥用问题。当被要求解释这一难题时,OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”,“戏谑地讽刺了 AI 研究面临的挑战”。 很好,ChatGPT-4。 |
“キラノウエ”:战前就深受喜爱的经典作品的魅力和历史■作品概要《キャンナクロ》是改编自田川水峰的人气...
4月5日和6日满粉红月亮4 月 7 日34P/PANSTARRS 彗星最近飞掠4 月 20 日日全食...
本文与Grist联合发布,Grist 是一家关注气候、正义和解决方案的非营利媒体组织。电动汽车在全国...
海洋生物学家布鲁克·安德森简直不敢相信自己的眼睛。几个月前,她给一条怀孕的、七英尺长的鲭鲨( Lam...
我们知道农业行业存在严重的温室气体问题。现在,更多研究表明,有一种可能简单的方法可以减少温室气体排放...
我们的世界变得越来越开放,能够使用多种语言进行交流的能力可以成为开启各种体验之门的强大工具。无论您是...
萨尔贡二世国王非常喜欢看到自己的名字出现在城中——至少,一位专家在审阅了一系列重复出现的、困扰研究人...
总有理由停下来欣赏生活中的点滴。自 2018 年以来,特蕾西和丹·考尔德通过年度特写摄影师大赛吸引人...
保护地球上所有生命的大气层之一只有两美分宽,悬在距离地球六到十英里的地方,人类活动使大气层的环境变得...
拼图是挑战大脑、与他人合作以及享受传统乐趣的绝佳机会。但是,如果您还可能通过完成拼图赚钱呢?这肯定会...
受日本折纸设计理论启发的加州理工学院研究人员正准备于 12 月将一颗小型卫星原型发射到轨道上。该原型...
佛罗里达群岛首次露天释放转基因蚊子的研究刚刚结束。该实验旨在证明这些转基因蚊子是否有助于抑制传播疾病...
站在投手丘上,大联盟棒球投手的投球高度为 60 英尺 6 英寸,投球前必须发出嘶嘶声。但投手的投球技...
车库是存放工具的理想场所,但有时您的工具也需要一间属于自己的小房子。如果您想在后院建一个棚子或其他形...
随着世界放慢脚步以阻止新冠病毒的传播,野生动物闯入如今已安静的城市街道的故事在网上疯传。其中一些故事...