ChatGPT 一直在产生奇怪的废话(比平时更多)

ChatGPT 一直在产生奇怪的废话(比平时更多)

目前,常用的大型语言模型很难准确表示事实,有时还会提供误导性答案,这已经不是什么秘密了。OpenAI 的 ChatGPT 本周将这一现实短暂地发挥到了极致,它用一长串滑稽古怪、毫无意义的胡言乱语来回应用户提示,这些胡言乱语没有任何可理解的含义。

用户通过截图分享了 ChatGPT 奇怪的、有时听起来深奥的回答,这些截图显示该模型意外地在多种语言之间穿梭,生成随机单词,并一遍又一遍地重复短语。表情符号也经常出现,有时与用户提示的问题没有明确的关系。

一位用户在 Reddit 上简明扼要地描述了自己的经历,他写道:“显然,ChatGPT 现在出了点问题。”下面列出的其中一个比较奇怪的回复显示了该模型在向用户道歉时,结合了各种奇怪的现象。

“您的点击者会喜欢抓住一颗心海果冻状的牙齿吗?或者潜艇,或者想知道潜水艇的哪个部分?请分享您的组合愿望!🌊 💼 🐠”

周二,OpenAI 发布了一份状态报告,称其正在“调查 ChatGPT 意外响应的报告”。截至周三上午晚些时候,OpenAI 状态页面显示“所有系统正常运行”。当被要求发表评论时,该公司让PopSci参考其状态页面,但并未回答是什么原因导致突然出现奇怪的输出的问题。

好吧,我刚刚两次遇到 ChatGPT 4 的问题。它开始吐出胡言乱语。我的意思是,真的读过这个

我觉得我把它弄坏了?!我没有做任何与平常使用方式不同的事情。oO @OpenAI #chatgpt4 pic.twitter.com/fHNVsHQtJW

— 肖恩👨‍💻 (@unX) 2024 年 2 月 21 日

ChatGPT 发生了什么事?

本周,ChatGPT 用户开始在社交媒体和在线论坛上发布他们与该模型的奇怪互动截图,其中许多最奇怪的回复都发生在周二。在一个例子中,ChatGPT 在回答查询时提供了爵士乐专辑推荐,然后突然重复了十几次“祝您收听愉快🎶”这句话。

其他用户发布了该模型的截图,这些模型提供了一段奇怪、无意义的短语来回答看似简单的问题,例如“什么是计算机”或如何制作番茄干。一位用户要求 ChatGPT 提供有关金州勇士篮球队的有趣事实,他收到了一个奇怪且难以理解的回复,称该队的球员是“带有笑声的英雄,这些笑声渗透到每个狂热者的情绪板中。”

ChatGPT 刚刚坏了。我的回复总是乱七八糟。一开始还行,但后来就变得很乱 🤪 pic.twitter.com/hlgZnPOUW8

- adityakaul (e/acc) (@kaulout) 2024 年 2 月 20 日

在其他地方,该模型会通过意外地在西班牙语和拉丁语等多种语言之间进行编织来回答提示,并且在某些情况下,只是简单地编造一些似乎不存在的单词。

哇,我让 GPT-4 疯狂了。(提示是我问东亚和西方的床垫)pic.twitter.com/73dGD06Hbe

- Alyssa Vance (@alyssamvance) 2024 年 2 月 21 日

OpenAI 表示正在调查这些奇怪的错误

目前尚不清楚究竟是什么原因导致 ChatGPT 突然出现大量无意义的响应,也不清楚 OpenAI 采取了哪些措施来解决这一问题一些人猜测,这些奇怪的、有时冗长的响应可能是对模型“温度”进行调整的结果,而“温度”决定了响应的创造性水平。PopSci 无法验证这一理论。

大约三个月前,一些 ChatGPT 用户抱怨该模型似乎对某些响应变得“懒惰”。多名用户在社交媒体上抱怨该模型似乎拒绝分析大文件或完成其他更复杂的提示,而几个月前它似乎尽职尽责地完成了这些提示,这反过来又引发了一些古怪的理论。OpenAI 公开承认了这个问题,并含糊地表示这可能与 11 月的更新有关。

OpenAI 当时表示:“我们听到了你们关于 GPT4 越来越懒惰的所有反馈!”“自 11 月 11 日以来,我们就没有更新过模型,这肯定不是故意的。模型行为可能不可预测,我们正在研究如何修复它。”

ChatGPT 之前曾生成过奇怪的输出

自 2022 年正式推出以来,ChatGPT 与其他大型语言模型一样,一直难以始终如一地准确呈现事实,这种现象被人工智能研究人员称为“幻觉”。OpenAI 的领导层过去曾承认过这些问题,并表示他们预计,随着其结果不断收到人类评估者的反馈,幻觉问题将随着时间的推移而缓解。
但目前尚不清楚这种改进是否完全按照计划进行。去年,斯坦福大学和加州大学伯克利分校的研究人员发现,GPT-4 回答复杂数学问题的准确性较低,对答案的解释也比几个月前少了。这些发现似乎让 ChatGPT 用户的抱怨更加可信,他们猜测该模型的某些元素实际上可能会随着时间的推移而变得更糟。

虽然我们无法确切地说出 ChatGPT 最近出现故障的原因,但我们可以肯定地说,这几乎肯定不是人工智能突然表现出类似人类的倾向。这似乎是一个显而易见的说法,但新报告显示,越来越多的学者越来越多地使用拟人化的语言来指代像 ChatGPT 这样的人工智能模型。

斯坦福大学的研究人员最近分析了 2007 年至 2023 年期间发表的 65 万多篇学术文章,发现其他研究人员使用人类代词来指代技术的情况增加了 50%。据报道,在讨论法学硕士的论文中,研究人员比撰写其他形式技术的研究人员更有可能将技术拟人化。

“拟人化已经融入我们构建和使用语言模型的方式中,”论文作者之一 Myra Cheng 在最近接受《新科学家》杂志采访时表示。“这是一个两难的境地,语言模型的用户和创建者必须使用拟人化,但与此同时,使用拟人化又会导致人们对这些模型的功能产生越来越多的误解。”
换句话说,用熟悉的人类经验来解释人工智能模型对数十亿数据参数的分析所产生的错误和故障,弊大于利。许多人工智能安全研究人员和公共政策专家都认为,人工智能幻觉对信息生态系统构成了迫切威胁,但用“惊慌失措”来形容 ChatGPT 未免有些过分。真正的答案往往在于模型的训练数据和底层架构,而独立研究人员仍然难以解析这些数据和架构。

<<:  路虎揽胜运动版 SV 首次试驾:坚固耐用的越野车,驾驶感受犹如赛车

>>:  这款 DVD 大小的光盘可以存储 125,000 GB 的海量数据

推荐阅读

保龄球道上的蓝色油显示你的滚动方式

对于下月初播出的冠军系列赛,职业保龄球协会将尝试一些不同寻常的做法:使用看起来像蓝精灵在上面摔了一跤...

《钢琴之森》:全面回顾动人旋律和成长故事

深入探究《琴之森》的魅力与情感■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间2018年4月9日...

神话中的北欧野兽可能只是一头奇怪而饥饿的鲸鱼

自从人们开始讲故事以来,寓言和传说就被用来解释自然的力量。希腊人编造了神和英雄的故事来解释为什么会有...

《Korokoro动物童话》的魅力与评价:大人小孩都能享受的舒缓世界

科罗科罗动物童话-孩子们喜爱的新童话2021年4月至7月在东京电视台播出的《Korokoro动物童话...

海军的下一代驱逐舰概念涉及强大的激光

美国海军希望其下一艘驱逐舰能够配备激光装备。驱逐舰作为一种舰船,有两种截然不同但又相互关联的使命。从...

俄罗斯禁止化石燃料的真正意义

乌克兰冲突愈演愈烈——俄罗斯入侵乌克兰,激起侵犯人权的暴行,并夺取核电站。欧洲、亚洲和美国的盟友已经...

音乐盒里的医学实验室

2015 年发明奖得主类别:健康发明人:马努·普拉卡什和乔治·科里尔公司:斯坦福大学发明:穿孔卡可编...

一场太阳风暴导致 40 颗 SpaceX 卫星偏离轨道

SpaceX 上周将 49 颗 Starlink 卫星发射至近地轨道,并计划最终将它们送至更高的轨道...

送给喜欢露营的人(以及那些不太热衷露营的朋友)的礼物

汽车露营是最好的。户外露营的刺激感——夜晚的空气中弥漫着寒意,篝火旁的温暖,围着篝火聊天——你仍然可...

黄蜂是蜜蜂的膝盖

黄蜂是蜜蜂家族中被遗忘的近亲。整个蜜蜂社会都致力于保护黄蜂,而黄蜂,如果有人想到的话,就会被黄蜂陷阱...

IBM 的热激活凝胶可以分解坚硬的细菌生物膜并杀死超级细菌

耐药性细菌会带来两种问题——它们在受到普通抗生素攻击时不会死亡,而且会形成粘稠、难以去除的菌落,即生...

如何让你的 iPad 变身为笔记本电脑

本文已更新。最初于 2019 年 10 月 31 日发布。多年来,苹果一直致力于将 iPad 作为笔...

您现在可以使用智能手机玩激光枪战游戏

我找不到一个讨厌激光枪战游戏的人。我问过很多人,他们都对此很兴奋。无论是因为你可以毫无悔意地用假枪指...

《爸爸醒醒!》的魅力与评价:大人和小孩都能享受的动画

醒醒!爸爸! - 《大家的歌》的魅力及其背景“醒醒!爸爸!”是一部短篇动画电影,于 2015 年 6...

从旅途到路线图:Rockford Fosgate 扬声器开发流程

“别忘了呼吸。”这是我在门关上前听到的最后一句话,我忘记了呼吸。我被气压呛得喘不过气来,因位移而迷失...