人工智能能够进行对话并不意味着它很聪明

人工智能能够进行对话并不意味着它很聪明

对话式人工智能工具正在成为主流,这对许多虚假信息研究人员来说是一个主要担忧。本周,谷歌在巴黎的一次活动中宣布了 Bard,这是其对 Open AI 的 ChatGPT 的回应,并加倍努力在其许多核心产品中推出人工智能增强功能。同样,微软宣布 ChatGPT 将很快与其备受诟病的搜索引擎 Bing 整合。在未来几个月内,这些对话式工具将广泛使用,但一些问题已经开始显现。

对话式人工智能使用一种称为“大型语言模型”(LLM)的神经网络框架构建而成,非常擅长生成语法连贯、看似合理且与人类相似的文本。它们之所以能做到这一点,是因为它们接受了数百 GB 的人类文本训练,其中大部分文本都来自互联网。为了生成新文本,该模型将通过给定一系列标记来预测下一个“标记”(基本上是一个单词或一个复杂单词的片段)(许多研究人员将其与我们以前在学校做的“填空”练习进行了比较)。

例如,我要求 ChatGPT 撰写有关PopSci 的文章,它开头说“《大众科学》是一本于 1872 年首次出版的科学技术杂志”。在这里,很明显,它从我们的“关于”页面和维基百科页面等地方抄袭了信息,并计算出以“大众科学是……”开头的句子可能后续的词语。该段落以相同的思路继续,每个句子都是在 ChatGPT 所训练的内容类型中自然跟随的那种东西。

不幸的是,这种预测下一个单词和句子的方法意味着对话式人工智能经常会犯错误,除非你已经知道这些信息,否则你很容易被误导,因为它们听起来好像知道自己在说什么。从技术上讲, PopSci不再是一本杂志,但谷歌在推出 Bard 时更好地证明了这一点。(这也是为什么大型语言模型会重复阴谋论和其他令人反感的内容,除非经过专门训练。)

[相关:人工智能广阔世界的简单指南]

Google 公告(截至撰写本文时仍在生效)中的一个演示问题是“我可以告诉我 9 岁的孩子关于詹姆斯韦伯太空望远镜的哪些新发现?”作为回应,巴德提出了三点,其中一条是“詹姆斯韦伯太空望远镜拍摄了我们太阳系外行星的第一张照片。”

虽然这听起来像是有史以来最大的太空望远镜能够做到的事情——詹姆斯·韦伯太空望远镜确实发现了系外行星——但它并没有发现第一颗系外行星。据路透社和美国宇航局报道,这一荣誉属于欧洲南方天文台的甚大望远镜 (VLT),它在 2004 年发现了一颗系外行星。如果这件事是有人向巴德寻求建议,而不是公开宣布,就不会有数十名天文学专家准备介入并纠正它。

微软正在采取更直接的方法。The Verge发现,Bing 的新常见问题解答指出“人工智能可能会犯错误”,并且“Bing 有时会歪曲它找到的信息,你可能会看到听起来令人信服但不完整、不准确或不恰当的回答。”它继续呼吁用户运用自己的判断力,仔细检查人工智能提供的事实。(它还说你可以问 Bing:“你从哪里得到这些信息?”以找出它用来生成答案的来源。)

不过,这听起来有点像微软的逃避。是的,人们应该对他们在网上读到的信息持怀疑态度,但微软也有责任确保它向数百万用户提供的工具不是编造出来的,而是把它当成真的。像 Bing 这样的搜索引擎是人们用来核实事实的最佳工具之一——它们不应该增加虚假信息的数量。

而且这种责任可能具有法律效力。欧盟的《数字服务法案》将于 2024 年某个时候生效,其中有专门防止虚假信息传播的条款。不遵守新法律可能会导致公司被处以高达其年营业额 6% 的罚款。鉴于欧盟最近对美国科技公司处以巨额罚款,以及搜索引擎必须删除某些可证明不准确的信息的规定,欧盟 27 国可能会对谷歌或必应上突出显示的人工智能生成的虚假信息采取强硬立场。他们已经被迫对其他形式的虚假信息采取更严厉的立场,比如深度伪造和虚假社交媒体账户。

随着这些对话式人工智能即将广泛免费使用,我们很可能会看到更多关于其使用是否合适的讨论——尤其是因为它们声称是权威的信息来源。与此同时,让我们牢记,对于这类人工智能来说,编写语法连贯的废话要比编写经过充分事实核查的查询响应容易得多。

<<:  Twitter 宣布了一些新功能,随后暂时崩溃

>>:  一种新的解决方案可以使旧风力涡轮机叶片避免进入垃圾填埋场

推荐阅读

PopSci 夏季刊刚刚出版,内容很热门

在一位好友的祖母百岁生日之际,我们请她说出她一生中见过的最伟大的发明。她见证了福特生产线上第一批汽车...

《物神可可豆》评论:探索儿童动漫的吸引力和教育价值

《今野元帅的可爱宝贝》:儿童动漫的新魅力《Kokotama:万物之神》是万代制作的儿童动画系列,于 ...

名侦探柯南:蔚蓝之棺 第11部剧场版的魅力与评价

名侦探柯南:蔚蓝之棺 - 电影评论和详情概述《名侦探柯南:绀青之棺》是改编自青山刚昌的人气漫画《名侦...

回到过去

经过 10 年的迂回飞行,罗塞塔号开始向 67P/丘留莫夫-格拉西缅科彗星的冰冷黑色核心靠近。今年 ...

如何移动整座桥梁?

问题俄勒冈州波特兰市的塞尔伍德大桥于 1925 年建成,当时的设计承载能力并非每天 3 万辆汽车,也...

《世界愚人新闻》的吸引力和评分:不可错过的动漫体验

《世界愚人报》的号召力与评价《世界愚人新闻》是2014年在群马电视台播出的原创动画电视连续剧。该作品...

使用此应急发电站做好应对夏季风暴的准备

如果说夏季是最好的季节,那为什么它也是危险的季节呢?我们说的不是令人上瘾的美食、危险的游乐园游乐设施...

新型植入物可帮助患者仅利用脑信号拼出整个句子

加州大学伯克利分校的研究人员开发了一种大脑植入物,该植入物的最新改进使无法说话的瘫痪男子能够通过将其...

充分利用 VPN 的 7 个技巧

在计算机和其他设备上使用虚拟专用网络 (VPN) 的好处已广为人知。这些软件程序会重新路由并保护您的...

一个“腐烂的小塑料袋”实际上是一个有 5.14 亿年历史的化石

一种新发现的已灭绝的软体动物物种在 5 亿年前潜伏在海底,为了解这一多样化动物群的早期历史提供了新的...

《阿修罗之哭2》的魅力与评价:透彻解读续作的成功与进化

阿修罗之哭2:天选之人的战斗与命运《Asura Cryin' 2》于 2009 年 10 月...

索奇的边境探索:进入新的冒险世界

索基的边境探索:冒险与友谊的故事《Sokkies Frontier Quest》是一部动画系列,于 ...

全球最强大的可视化实验室如何将硬数据转化为科学电影

构建宇宙并不容易。有很多活动部件需要考虑,从天文数字到无穷小。但在伊利诺伊大学北部边缘的一座朴素的校...

DARPA 希望建立 Space-BACN,以便卫星通信蓬勃发展

DARPA 希望在卫星之间的空间中存在一种共同的语言。太空自适应通信节点 (Space-BACN) ...

《请问您今天要来点兔子吗?》的魅力与评价:治愈与欢笑的完美平衡

“订单是苍鹭吗?”?诉求与评价“订单是苍鹭吗?”? 》是一部改编自恋作原作漫画的电视动画,于2015...