人工智能能解决互联网上的假新闻问题吗?事实核查员正在调查。

人工智能能解决互联网上的假新闻问题吗?事实核查员正在调查。

你可能已经注意到:这是一个事实的奇怪时代。一方面,尽管人们对后真相世界感到焦虑,但事实仍然存在。另一方面,从错误信息、宣传和虚假新闻的下水道中挖掘事实变得越来越困难。1 无论是含有病毒的止痛药、2016 年总统大选中的 300 万张非法选票,还是名为 My First Vape 的新型儿童玩具,虚假消息充斥着互联网。事实核查员和记者竭尽全力揭露事实,但谎言太多,我们太少。普通公民被虚假新闻欺骗的频率尚不清楚。但有很多机会接触到虚假信息。皮尤研究中心去年报告称,超过三分之二的美国成年人在社交媒体上获取新闻,而社交媒体上充斥着虚假信息。我们也在寻找虚假信息。去年 12 月,普林斯顿大学、达特茅斯学院和埃克塞特大学的政治学家报告称,在 2016 年大选前后,四分之一的美国人访问过虚假新闻网站,其中大部分是通过 Facebook 点击进入。随着党派人士、评论家甚至政府将信息武器化,利用我们的地域、性别和种族差异,Facebook、谷歌和 Twitter 等大型科技公司面临着反击的压力。初创公司和大公司已开始尝试部署算法和人工智能来核实数字新闻。他们认为,开发智能软件,真相就有机会曝光。“过去,有新闻媒体会过滤掉不准确和疯狂的内容,”杜克大学新闻学教授比尔·阿代尔 (Bill Adair) 说,他负责一项这样的工作,即杜克科技与核查合作社 (Duke Tech & Check Cooperative)。“但现在没有过滤器。消费者需要新的工具来判断哪些是准确的,哪些不是。”该合作社获得了 120 万美元的资助,其中包括来自 Facebook 新闻项目的 20 万美元,用于支持虚拟事实核查工具的开发。到目前为止,这些工具包括 ClaimBuster,它可以扫描数字新闻报道或演讲记录,并将它们与已知事实的数据库进行核对;谈话要点追踪器,它可以标记政客和评论家的言论;以及 Truth Goggles,它可以使可靠的信息更容易被有偏见的读者接受。许多其他团体也在尝试构建类似的工具。作为一名记者和事实核查员,我希望算法能够发挥最佳作用。我们当然可以使用这种帮助。但我持怀疑态度。并不是因为我担心机器人会抢走我的工作,而是因为我知道它们面临的是什么。我写了一本关于事实核查的书(不,真的,它的名字是《芝加哥事实核查指南》2)。我还主持播客 Methods,探讨记者、科学家和其他专业真相发现者如何知道他们所知道的内容。从这些经历中,我可以告诉你,真相是复杂而模糊的。人类的大脑可以识别上下文和细微差别,这两者都是验证信息的关键。我们可以发现讽刺。我们知道反讽。我们知道语法可能会发生变化,即使基本信息保持不变。有时我们仍然会犯错。3 机器能接近吗?

媒体大肆报道人工智能如何拯救我们免受虚假新闻报道的困扰。但是这些数字大脑里面有什么?算法将如何工作?毕竟,人工智能在遵循严格规则时表现最佳。所以,是的,我们可以教计算机下国际象棋或围棋。但由于事实难以捉摸,数据科学家兼《数学毁灭武器:大数据如何加剧不平等并威胁民主》一书的作者 Cathy O'Neil 并不是一个人工智能乐观主义者。她说:“事实核查算法的概念,至少乍一看,是将陈述与已知的事实进行比较。由于没有用于真相的人工算法模型,所以它根本行不通。”

这意味着计算机科学家必须建立一个这样的系统。那么他们究竟是如何组建虚拟事实核查员大军的呢?他们的真相模型是什么?我们距离将他们的算法用于剔除假新闻还有多远?为了找到答案,《大众科学》杂志的编辑们让我试用一个自动事实核查器,用一则假新闻,并将其过程与我自己的过程进行比较。结果好坏参半,但可能不是因为你(或者至少是我)所想的原因。

李程凯是德克萨斯大学阿灵顿分校的计算机科学家。他是 ClaimBuster 的首席研究员,截至本文撰写时,ClaimBuster 是唯一一款公开可用的人工智能事实核查工具(尽管它仍在开发中)。从 2014 年底开始,李程凯和他的团队或多或少地按照其他正在开发的自动事实核查器的思路开发了 ClaimBuster。首先,他们创建了一种算法,即一种可以按照一组规则解决问题的计算机代码。然后,他们教代码识别断言(新闻报道或政治演讲中被断言为真实的陈述或短语),方法是输入大量句子,告诉它哪些句子是断言,哪些不是。由于李程凯的团队最初设计该工具是为了捕捉政治言论,他们输入的单词来自过去 30 场左右的美国总统辩论,总计约 20,000 条断言。“我们的目标是 2016 年大选,”李程凯说。“我们认为我们应该在总统候选人辩论时使用 ClaimBuster。”接下来,该团队向计算机教授代码,让计算机将说法与一组已知事实进行比较。算法没有识别事实的内在特征;必须由人类提供事实。我们通过构建我称之为真相数据库的东西来做到这一点。要发挥作用,这些数据库必须包含高质量和广泛的信息。李的团队使用了数千份事实核查——由专业事实核查员和记者撰写的文章和博客文章,旨在纠正可疑说法的记录——这些文章和博客文章来自 PolitiFact、Snopes、factcheck.org 和《华盛顿邮报》等知名新闻网站。我想看看 ClaimBuster 能否从一个已知的事实质疑帖子贩子:infowars.com 中检测出假科学新闻。4 我问李他怎么想。他说,虽然该系统在政治新闻上最成功,但它可能会奏效。“我认为 Infowars 的一个页面听起来很有趣,”他说。“为什么不试一试,让我们知道你发现了什么?”为了公平竞争,我和我的编辑商定了两条规则:我不能自己挑选假新闻,而且在我完成自己的事实核查之前不能测试人工智能。《大众科学》的一位资深事实核查员从《信息战争》中抽取了七篇虚假的科学报道,我和我的编辑一致同意其中一篇涉及政治话题:气候变化。由于李自 2016 年底以来就没有预算更新 ClaimBuster 的真相数据库,我们选择了一篇在那之前发表的文章:《气候重磅新闻:美国宇航局新数据显示极地冰盖自 1979 年以来没有消退》,发表于 2015 年 5 月。

气候变化否认者和假新闻作者经常歪曲真实的研究来支持他们的主张。在检查报告时,我依靠的只是那段时期的事实。

为了简短起见,我们使用了 Infowars 报道的前 300 个字。5对于实验的人类部分,我像检查任何文章一样逐行检查所选内容。我确定了基于事实的陈述(基本上是每一句话),并从主要来源(例如气候科学家和学术期刊)中寻找支持或反驳的证据。我还跟踪了 Infowars 报道中的链接,以评估其质量并查看它们是否支持论点。(我的事实核查样本在此处。)

以报道的第一句话为例:“NASA 更新了卫星读数数据,显示自 1979 年开始测量以来,地球的极地冰盖没有明显消退。” 在网上,“卫星读数数据”一词有一个超链接。为了查看报道中引用的数据,我点击了链接,进入了一个已停用的伊利诺伊大学网站 Cryosphere Today。没有找到。我给学校发了电子邮件。该大学大气科学系主任给了我一个曾在该网站工作的研究人员的电子邮件地址:约翰·沃尔什 (John Walsh),他现在是阿拉斯加国际北极研究中心的首席科学家,后来我通过电话采访了他。

沃尔什告诉我,“卫星读数数据”并非直接来自 NASA。相反,位于科罗拉多州博尔德的国家冰雪数据中心整理了 NASA 的北极海冰原始卫星数据。伊利诺伊大学随后对其进行了分析并发布。当我问沃尔什,这些数据是否表明,极地冰盖自 1979 年以来并没有像 Infowars 所声称的那样消退太多时,他说:“我无法将这一说法与网站过去显示的内容相提并论。”

除了与沃尔什交谈之外,我还使用谷歌学术查找相关科学文献,并在同行评议的《气候杂志》上找到了一篇关于全球海冰趋势的综合论文,该论文由美国气象学会出版,作者是美国宇航局戈达德太空飞行中心高级气候科学家克莱尔帕金森。我也采访了她。她向我介绍了她的研究与 Infowars 报道中的说法的对比,表明后者在哪些方面扭曲了数据。帕金森说,虽然全球海冰数据收集确实始于 1979 年,大约在相关卫星发射时,但随着时间的推移,测量结果显示全球总体呈消退趋势。Infowars 的报道还混淆了北极和南极海冰的数据;尽管极地海冰的大小每年都有所不同,但北极海冰一直呈现出持续的减少趋势,其速度超过了南极的增长趋势,导致全球总量大幅下降。 《信息战争》的作者史蒂夫·沃森在整篇文章中混淆了北极、南极、全球、年度和平均数据,并且可能挑选了南极繁荣年份的数据来支持他的主张。

在其他情况下,Infowars 的文章链接到了可靠的消息来源——并且错误引用。比如,其中一句话声称阿尔·戈尔警告说北极冰盖可能在 2014 年消失。这句话链接到的每日邮报文章——而非主要来源——其中包括一句据称来自戈尔 2007 年诺贝尔奖演讲的引言。但当我阅读演讲记录并在诺贝尔奖网站上观看视频时,我发现该报对引言进行了大量编辑,删除了警告和背景。至于 Infowars 故事的其余部分,我遵循了相同的过程。除了两句话之外,其他都是错误或误导的。(Infowars 的一位发言人表示作者拒绝置评。)在完成我自己的工作后,我很好奇 ClaimBuster 的表现如何。该网站要求两步进行事实核查。第一步,我将 300 字的摘录复制并粘贴到标有“输入您自己的文本”的框中,以识别文案中的事实主张。在一秒钟之内,AI 会根据 0 到 1 的等级对每行进行评分;分数越高,包含主张的可能性就越大。分数范围从 0.16 到 0.78。Li 建议将 0.4 作为值得进一步检查的主张的阈值。AI 为 16 个句子中的 12 个打出了该分数或以上的分数。总共 12 个句子中有 11 个值得检查的主张,这些主张我都已经识别出来了。但是 ClaimBuster 漏掉了四个。例如,它给一句话的低分是 0.16,这句话说气候变化“被认为是自然因素和人类因素共同造成的,但人类因素的影响要小得多”。这句话确实是主张,而且是错误的主张。科学界一致认为,人类是造成最近气候变化的主要原因。像这样的假阴性,即使一个句子值得检查,也会将其评为不值得检查,这可能会导致读者被谎言欺骗。既然媒体和学术期刊上已经有很多关于这个说法的文章,ClaimBuster 怎么会漏掉这个说法呢?李说他的人工智能很可能没有发现这句话,因为语言很模糊。“它没有提到任何具体的人或团体,”他说。因为这句话没有确切的数字,也没有提到任何可识别的人或机构,所以“没有什么可以量化的”。只有人类的大脑才能在没有明显立足点的情况下发现这个说法。接下来,我将识别出的 11 个说法中的每一个都输入到第二个窗口中,该窗口会与系统的真相数据库进行核对。在理想情况下,机器会将说法与现有的事实核查进行匹配,并将其标记为真或假。实际上,它吐出的信息大部分都是无关紧要的。

以文章的第一句话为例,它谈到了极地冰盖的消退。ClaimBuster 将这串词与数据库中的所有句子进行了比较。它搜索匹配项和同义词或语义相似性。然后对匹配项进行排序。最佳匹配来自 PolitiFact 的一篇报道——但主题涉及美国与伊朗之间的核谈判,而不是海冰或气候变化。李说,该系统可能抓住了与主题没有太大关系的类似词汇。例如,这两个句子都包含“自从”、“有”、“没有”等词,以及“更新”和“先进”等类似词。这涉及到一个基本问题:该程序尚未将更重要的词置于非特定词之上。例如,它无法判断伊朗报道是无关紧要的。

当我尝试搜索关于阿尔·戈尔的句子时,最热门的搜索结果更有希望:PolitiFact 的另一个链接与一篇报道中的一句话相匹配,该报道写道:“科学家预测北极将在 2013 年夏天无冰。”在这里,匹配更加明显;句子中共用一些词,包括“北极”,以及“消失”和“无冰”等同义词。但当我进一步挖掘时,发现 PolitiFact 报道是关于时任参议员约翰·克里 2009 年在《赫芬顿邮报》上发表的一篇专栏文章,而不是阿尔·戈尔在 2007 年诺贝尔演讲中发表的言论。当我测试报道中其余的说法时,我遇到了类似的问题。

当我向李报告这些结果时,他并不感到惊讶。问题是 ClaimBuster 的真相数据库没有包含关于这条特定假新闻的报告,或任何类似内容。请记住,它是由包括 PolitiFact 和《华盛顿邮报》在内的人工事实核查员的工作组成的。他说,由于该系统严重依赖人工提供的信息,因此结果“只是人工事实核查员不够用的另一个证据”。

这并不意味着人工智能事实核查全是坏事。积极的一面是,ClaimBuster 比我快得多。我花了六个小时进行事实核查。相比之下,人工智能只花了 11 分钟。另外,考虑到我一天结束时就下班了,人工智能不会睡觉。“它就像一个不知疲倦的实习生,24 小时坐着看电视,对事实主张有着敏锐的洞察力,”阿代​​尔说。随着李的团队测试新的人工智能来提高主张评分和事实核查能力,ClaimBuster 必将得到改进,其他公司也应该如此。阿代尔的合作社还使用 ClaimBuster 扫描有线电视上专家和政客的主张,突出显示最值得核查的言论,并将它们通过电子邮件发送给人类事实核查员进行确认。关键在于获得与这种效率相匹配的准确性。毕竟,我们目前的困境至少部分是由于算法。截至 2017 年底,谷歌和 Facebook 的用户数分别为 11.7 亿和 20.7 亿。如此庞大的受众群体激励着假新闻制造者和宣传者利用算法传播他们的材料——同样,操纵自动事实核查器也是可能的。而科技巨头最近修复人工智能的尝试并没有取得很好的效果。例如,2017 年 10 月,在拉斯维加斯发生大规模枪击事件,造成 851 人受伤,58 人死亡后,留言板 4chan 的用户能够在 Facebook 上宣传一个错误识别枪手的假新闻。去年秋天,谷歌 AdWords 在 PolitiFact 和 Snopes 上投放了假新闻标题。即使有一个不受错误和操纵影响的人工智能事实核查器,ClaimBuster 和类似项目以及一般的假新闻也会面临更大的问题。政治人物和党派读者通常不关心一篇文章是否故意犯错。只要能支持他们的议程——或者只是让他们窃笑——他们就会分享。根据 2017 年普林斯顿大学、达特茅斯学院和埃克塞特大学的研究,消费假新闻的人也会消费所谓的硬新闻——而具有政治知识的消费者实际上更有可能关注假新闻。换句话说,读者并不是不知道其中的区别。媒体不应该低估他们点击这种诱人内容的欲望。最后一个问题。随着公司推出一支 AI 事实核查员大军,双方的党派读者可能只会将其视为另一种宣传方式。唐纳德·特朗普总统将《纽约时报》和 CNN 等值得信赖的传统新闻机构称为“假新闻”。他所欣赏的网站 Infowars 维护着自己的假新闻来源名单,其中包括《华盛顿邮报》。Infowars 还将 Snopes 和 PolitiFact 等事实核查网站的工作比作审查制度。

尽管如此,人工智能事实核查员可能是我们阻止虚假新闻的最佳盟友。有很多数字愚蠢行为需要追踪。一家名为 Veracity.ai 的初创公司由 Knight Prototype Fund 支持,旨在帮助广告行业识别可能与在线广告一起出现的虚假新闻。该公司最近发现了 1,200 个虚假新闻网站和大约 400,000 条虚假帖子,该公司预计这个数字还会增长。撒谎是如此快速和便宜,而人类纠正谎言是如此昂贵和耗时。而且我们永远不能依靠读者点击进行事实核查。我们仍然需要记者雇用人工智能事实核查员在互联网上搜寻欺骗行为,并为真相数据库提供素材。

我问李,我的一篇经过事实核查的报道是否会产生影响,如果它能进入 ClaimBuster 真相数据库,会不会有什么影响。“一个完美的自动化工具会捕获你的数据,并将其作为存储库的一部分,”他说。

他补充道:“当然,现在还没有这样的工具。”

脚注:

1假新闻是一个备受争议的术语。它用于描述基于虚假、曲解或操纵的事实而故意误导他人(以获取政治或经济利益)的新闻。但党派人士也用它来抹黑声誉良好的传统媒体。在这里,我们使用前者的定义。

2这本书是芝加哥大学出版社的写作指南系列之一。没错,书中的事实在芝加哥以外也适用。

3一位《大众科学》事实核查员花了 15 个小时核实《情报特刊》的版面,并在我们付印前发现了 34 个错误。

4 Infowars 是一个媒体帝国和阴谋论交换所——从联邦政府控制天气到格伦贝克是中央情报局特工的想法。

5我们确保故事的其余部分不会提供影响我们事实核查的证据或背景。

本文最初发表于《大众科学》杂志2018年春季情报期刊

<<:  通过大力水手行动,美国政府将天气变成了战争工具

>>:  中国新型隐形战斗机采用自然界中不存在的强力材料

推荐阅读

手机 50 岁生日快乐

也许很难想象一个没有手机的世界,但肯定有那么一段时间,手机只是科幻小说中的东西。确切地说,直到 50...

观看机器人摄像机捕捉到的这些稀有海洋生物

还有什么比深海“暴风雪”中翻腾的巨大幻影水母更梦幻的吗?这取决于个人喜好。也许你会更喜欢像红外传感器...

科学家们距离太阳能回收工厂又近了一步

浪费资源是环境恶化的一大原因。按照目前的速度,到 2050 年,我们将产生 34 亿吨固体垃圾。无论...

金鱼如何利用酒度过艰难的冬天

无论我们把多少金鱼埋在海里,这些生物显然都具有相当强的适应力。把它们放在你办公桌上的碗里,它们可能比...

量子网络到底是什么?

虽然目前可以使用 Signal 等应用发送加密信息,但没有哪个系统是完全不可破解的。但有一天,加密可...

大肆宣传:初创公司竞相将超级高铁变成现实

也许是扬声器里播放着 Guns N' Roses 的歌曲。又或许是迪拜本身的魅力,这座新兴大...

我是不是感冒了或者流感了?

秋天来了,这意味着孩子们终于可以返校了,炎热潮湿的夏日即将过去(希望如此)。但凉爽的空气也预示着不可...

转基因植物可以消除食物中毒

转基因植物产生的抗菌蛋白可以杀死受污染肉类中的致命大肠杆菌 Flickr 用户 rick本周,由于沙...

美国正在寻找新型防空导弹

美国陆军希望研制一种新型便携式导弹,士兵可用来击落飞机。为了取代老旧的毒刺防空武器,陆军于 3 月 ...

今年,太空成为头条新闻。以下是我们最喜欢的故事

这十年发生了很多事。美国宇航局和其他太空机构完成了一系列大胆的任务,探索从冰卫星到矮行星的奇异天体。...

享受夏日假期的复古指南

本文最初发表于 2011 年 8 月 5 日。—编辑你可能会惊讶地发现,过去几十年来,夏季度假方式几...

用手机制作无钥匙汽车解锁器

开车时间长了,你最终会体验到这种感觉:当你发现钥匙锁在车里时,那种无助的感觉。在这种情况再次发生之前...

只需 20 美元即可获得 BJ 一年期会员资格,节省家居用品费用

在日常杂货店购买杂货可能不再像以前那样可持续。随着各地必需品价格上涨,现在是开始通过批发俱乐部会员资...

“地下气候变化”如何影响地球表面的生命

在夏季,与周边农村地区相比,城市会变得非常炎热——只需看看新奥尔良和纽约市与附近不透水表面较少的地区...

美国可能因乌克兰而窥探俄罗斯的电子战秘密

本文由公共诚信中心联合发表。这是有关核风险、军事技术以及俄罗斯入侵乌克兰后战争未来的十篇系列文章中的...