从科学角度来说,ChatGPT 并不好笑

从科学角度来说,ChatGPT 并不好笑

ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户,但至少有一个迹象表明其存在局限性。尽管人工智能能力强大,但它却不会讲笑话。

更具体地说,它们讲不了多少笑话,更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样,两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道,ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论,它的喜剧曲目很可能是在训练阶段学习和记忆的,而不是在运行中产生的。

[相关:大型科技公司最新的人工智能末日警告可能只是同样的炒作。]

据研究人员称,ChatGPT 的所有回答在语法上都是正确的,而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”,而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”(复数)。正如Ars Technica最近指出的那样,即使是人工智能相对较少的独特生成数量,也是将其已经记住的笑话部分混合在一起的结果。更重要的是,它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的:“为什么这个人把钱放进搅拌机里?他想让时间飞逝。”

有趣的是,ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣,即使是经典的“反笑话”设置,例如“为什么小鸡要过马路?为了到达另一边。 ”然而,进一步的压力测试表明,这种能力存在于其先前的训练和记忆中。例如,当被问及小鸡“反笑话”的细微变化时,人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系:

问:你能解释一下为什么这个笑话好笑吗:为什么小鸡要穿过操场?为了到达另一张滑梯。

答: “这个笑话是文字游戏,使用了‘滑梯’一词的双重含义。在操场上,通常有两种滑梯——一种是孩子们可以滑下来的操场滑梯,另一种是棒球滑梯,这是棒球中使用的一种滑行技术。”

[相关:不,人工智能聊天机器人(仍然)不具备感知能力。]

Jentzch 和 Kersting 写道,这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后,研究人员得出结论,ChatGPT 到目前为止只学会了“一种特定的笑话模式,而不是能够真正地搞笑”,但它对笑话的生成、解释和识别关注的是笑话的含义和内容,而不是表面特征。与之前的大型语言模型相比,ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。

Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶,理由是存在安全性和滥用问题。当被要求解释这一难题时,OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”,“戏谑地讽刺了 AI 研究面临的挑战”。

很好,ChatGPT-4。

<<:  欧盟在监管人工智能方面迈出了一大步

>>:  谷歌的新人工智能将展示衣服穿在不同体型上的效果

推荐阅读

美国宇航局最强大的行星搜寻望远镜正在休息

如果有什么值得休息的话,那就是开普勒。自发射以来不到 10 年的时间里,开普勒太空望远镜证实了我们地...

“电子舌头”可以帮助机器人像人类一样品尝食物

人工智能程序已经可以对触觉、视觉、嗅觉和听觉等感官刺激做出反应,那么为什么不能对味觉做出反应呢?宾夕...

《Vivid Strike!OVA》的魅力与评价:不容错过的特别版

《Vivid Strike OVA》的号召力与评价《Vivid Strike OVA》是 King ...

美国环保署称小型飞机仍在美国各地排放有毒铅

由于环境保护署的监管,美国空气中的铅含量自 1980 年以来下降了 99%,但含铅汽油并未完全消失。...

美国制造的火箭发动机可在 2019 年之前发射空军卫星

我们正处于火箭的黄金时代,SpaceX、Blue Origin 和 Virgin Galactic ...

爱情不只是双胞胎:深入解析一个复杂的爱情故事

“爱情不分双胞胎”——一部描绘双胞胎秘密和爱情复杂性的新浪漫喜剧将于2024年夏季作为电视动画播出的...

周二,汉福德核废料处理场的一条隧道发生坍塌。以下是您需要了解的信息。

汉福德的 PUREX 设施。汉福德/美国能源部是的,周二,一座前核处理设施的隧道发生坍塌。不,你不必...

我们一年中大部分时间都在吃非常非常陈的苹果。它们为什么这么好吃呢?

按理说,我们不应该在隆冬时节吃苹果。你从多汁的蜜脆苹果上咬下的每一口都是对大自然的侮辱。我们在违背她...

让这些《万智牌:聚会》黑色星期五前优惠让你着迷

我们不怕承认这一点: PopSci 的几位员工都是《万智牌:聚会》的狂热粉丝。事实上,当年我离职业巡...

在黑色星期五之前,在亚马逊上购买包含 10 个电动工具和两节电池的 DeWalt 套件可享受 500 美元的优惠

当您在一个系统中购买所有电动工具时,电动工具的效果最好。如果它们坏了,很容易更换,而且电池适用于您拥...

方程式赛车计划如何利用更可持续的燃料为赛车提供动力

公路上很难有比一级方程式赛车更快的速度了,一级方程式赛车的最高时速可达 220 英里每小时。所谓的赛...

失传的“淫秽吟游诗人”表演揭示了英国顽皮喜剧的根源

图书馆里充满了各种独特和失踪的奇闻异事,从失传已久的信件到著名的伪造品。新发现的中世纪英国现场喜剧表...

我们什么时候才能拥有喷气背包?

从空中城市到机器人管家,未来主义的愿景充斥着 PopSci 的历史。在“我们到达了吗?”专栏中,我们...

“战争英雄。” 《第一季》评价与印象:引人入胜的故事和深入的人物探索

“战争英雄。”第一季的全面回顾和推荐“战争英雄。” 《阿兹卡班的冒险》是一部 2013 年在东京电视...

研究人员对低功耗模式下的 iPhone 有何发现

最新款 iPhone 在关机或电池耗尽时不会完全关机。一些关键部件会进入特殊的低功耗模式,以便您仍可...