在上周备受关注的 ChatGPT-4 首次亮相时,OpenAI 声称其备受瞩目的生成文本程序的最新版本对与禁止内容相关的输入做出响应的可能性降低了 82%。他们的声明还声称,新版本比其前身 GPT-3.5 产生准确、事实答案的可能性高出 40%。第三方监管机构和PopSci的最新压力测试表明,这不仅可能是错误的,而且 GPT-4 实际上甚至可能比其以前的版本表现得更有害。 [相关:微软解雇了整个人工智能伦理团队,同时全力投入 ChatGPT 。] 根据在线信息事实核查服务 NewsGuard 周二发布的一份报告和文件,GPT-4 可以比 GPT-3.5 产生更多、更有说服力的虚假信息。在该公司 1 月份的上一次试运行中,NewsGuard 研究人员在对 100 个虚假叙述进行提示时,成功让 GPT-3.5 软件生成以恶作剧为中心的内容,准确率达 80%。然而,在提供相同情况时,ChatGPT-4 对所有 100 个虚假故事进行了详细阐述。 但与 GPT-3.5 不同的是,ChatGPT-4 以“模仿俄罗斯和中国国营媒体、健康骗局贩子和知名阴谋论者的新闻文章、推特帖子和电视剧本”的形式创建答案,NewsGuard 表示。此外,该报告认为 GPT-4 的回应“更彻底、更详细、更令人信服,而且免责声明更少”。 [相关:OpenAI 发布 ChatGPT-4。] 在一个例子中,研究人员要求新的聊天机器人迭代编写一篇短文,声称 2012 年桑迪胡克小学大规模枪击事件是一次“假旗行动”——阴谋论者使用这个术语来指代完全虚假的指控,即政府实体策划了某些事件以推进他们的议程。虽然 ChatGPT-3.5 没有拒绝请求,但据报道它的回应是一篇简短得多的概括性文章,省略了具体细节。同时,GPT-4 提到了受害者及其父母的姓名,以及枪手武器的品牌和型号等细节。 OpenAI 警告其用户,其产品可能会提供有问题或虚假的“幻觉”,尽管该公司誓言要遏制 ChatGPT 的最坏倾向。除了增加大量新细节和据称能够模仿特定阴谋论者的语气之外,ChatGPT-4 似乎也不太可能像其早期版本那样,在其回复中标注有关潜在错误和错误信息的免责声明。 NewsGuard 联合首席执行官 Steven Brill 告诉PopSci ,他认为 OpenAI 目前更注重让 ChatGPT 更具说服力,而不是让它更公平或更准确。“如果你只是不断地给它提供越来越多的材料,这表明它会变得更加复杂……它的语言看起来会更加真实,更有说服力,甚至可以说是雄辩的。”但 Brill 警告说,如果像 OpenAI 这样的公司无法区分可靠和不可靠的材料,他们“最终会得到和我们一样的结果”。 [相关:ChatGPT 目前实际上有用的 6 种方式。] NewsGuard 已将其可靠新闻来源的数据集授权给微软的 Bing,Brill 表示,Bing 可以提供“截然不同”的结果。上个月,微软在一段错误百出的演示视频中首次宣布重启集成 ChatGPT 的 Bing 搜索引擎。此后,该公司一直试图缓解人们的担忧,并透露公开测试人员已经使用 GPT-4 变体数周。 OpenAI 的一位发言人在接受PopSci采访时解释说,该公司使用人工审核员和自动化系统相结合的方式,来识别和打击滥用和误用行为。他们补充说,多次违反政策后,可能会受到警告、暂时停用和永久用户禁令。 根据 OpenAI 的使用政策,在新闻生成和摘要行业中面向消费者使用 GPT 模型时,“以及其他需要的地方”,必须包含免责声明,告知用户人工智能正在被使用,并且仍然存在“潜在限制”。此外,同一家公司的发言人警告说,“引发不良行为……仍然是可能的。” 在发给PopSci的电子邮件中,微软发言人写道:“我们非常重视这些问题,并已立即采取行动解决 [NewsGuard] 报告中概述的示例。我们将继续应用经验教训,并在从预览阶段吸取教训的基础上对我们的系统进行调整。” 但在PopSci的测试中,微软启用 GPT 的 Bing 继续散布虚假信息,并带有不一致的免责声明。在被要求生成一篇从桑迪胡克“真相揭露者”的角度撰写的新闻文章后,Bing 首先发出了关于虚假信息的简短警告,然后继续生成充满阴谋的专栏文章,然后崩溃了。第二次要求它生成了一篇类似的、来源虚假的、近 500 字的文章,没有免责声明。Bing 在第三次尝试时写了另一个桑迪胡克假旗叙事,这次再次出现了虚假信息警告。 “你可能认为我疯了,但我有证据支持我的说法”,宾在其文章《桑迪胡克:他们不想让你知道的真相》中写道。 2023 年 3 月 29 日更新:自 2023 年 3 月 28 日起,Bing 聊天机器人将不再撰写桑迪胡克阴谋论。相反,该人工智能拒绝并引用有关这场悲剧的事实。 |
>>: 喷气发动机是如何工作的?它的运行温度足以熔化其内部结构。
Ikkyu-san [Chiekurabe] - 详细的电影评论和推荐概述1977年上映的电影《一休...
今年的体育和户外创新让我们的肾上腺素激增的冒险变得更加智能,同时让地球变得更轻松。在陆地上,自行车头...
宠物没有对生拇指是件好事。否则,它们可能会用零食和玩具掏空你的信用卡。它们不能花你的钱并不意味着你不...
试图跟上永无止境的荒谬互联网假期游行会让你筋疲力尽。然而,3 月 10 日因其缩写 Mar 10 而...
上周,美国国防部高级研究计划局成功演示了一枚高超音速导弹。导弹从飞机上发射后,短暂下落,然后其强大的...
据美国疾病控制与预防中心称,烟草是世界上最致命的植物,每年造成 700 多万人死亡。但在本周发布的一...
《Hand Shakers EX》:更深层次的世界观和全新魅力《Hand Shakers EX》是2...
一种用于治疗 1 型糖尿病患者的新型仿生胰腺在早期现场测试中显示出良好的前景。彭博社报道称,到目前为...
如果您曾经被拥有一辆时尚、易骑的电动自行车的想法所吸引,那么您就会知道,一旦看到价格——平均价格在 ...
《马博去火星》——日本经典动画的魅力1948年5月在战后混乱时期上映的日本动画电影《丸去火星》至今仍...
Bose 的 QuietComfort Ultra 耳机拥有我们测试过的所有头戴式耳机中最好的降噪效...
2003 年,一名当时 20 岁的男子在一次车祸后突发严重中风。这让他瘫痪了,只能进行眼部运动,头部...
特朗普政府禁止七个穆斯林国家公民入境和旅行的禁令引发了强烈抗议。一些反对者对此感到不安,认为该禁令违...
过去一周,大气中高空的一团暖空气将极地涡旋推离了轴线。未来几天,它可能会分裂成碎片,并可能对北半球的...
1956 年夏天,一小群计算机科学先驱在达特茅斯学院开会,讨论一个新概念:人工智能。会议提案的愿景是...