本周,Meta 推出了一种名为 Sphere 的新型人工智能模型,旨在自动验证维基百科的引文。Sphere 的知识库来自 1.34 亿个网页。 Meta 表示,它并未与维基媒体(wikipedia.com 的所有者,该非营利组织)合作开展这个项目,该项目仍处于研究阶段,并未用于推送维基百科的实时更新。不过,维基媒体最近宣布,它正在其内容翻译工具中使用 Meta 的技术。 Meta 在一篇博客文章中表示,Sphere 是一个执行知识密集型自然语言处理的人工智能模型,当你问手机上的虚拟助手“谁获得了第一届诺贝尔物理学奖?”时,它所做的任务与此相同。然后,这些模型将挖掘存储库以找到匹配的答案。 Sphere 使用的是来自“非结构化”开放网络而非搜索引擎的信息。“由于 Sphere 可以访问比当今标准模型多得多的公共信息,因此它可以提供它们无法提供的有用信息,”Meta 研究人员在一篇博客文章中写道。此外,Meta 的系统使用自然语言理解来“估计从来源推断出某个主张的可能性”。该技术将句子或短语分解为数学表示,然后将表示集相互比较。 [相关: Meta 希望通过研究人类大脑来改进其人工智能] 描述 Sphere 的预印本可以在 arXiv 上找到,软件本身在 GitHub 上开源。Meta 还创建了一个名为 KILT 的基准测试,它将用它来评估 Sphere 和其他类似模型在事实核查、问答对话和插入相关链接等广泛任务上的表现。 到目前为止,这种能力只用于扫描和检查维基百科引文。“它提醒人们注意可疑的引文,让人类编辑能够评估最有可能存在缺陷的案例,而不必筛选数千条正确引用的陈述,”Meta 解释道。“如果引文似乎不相关,我们的模型将建议更适用的来源,甚至指向支持该主张的具体段落。” [相关:‘采用错别字’和其他编辑维基百科的方式] 最终,学习理解维基百科条目中的文本段落与其引用的链接之间的关系也将提高模型解析现实世界知识的能力,因为引文编辑需要牢牢掌握人类语言的理解和推理能力。 “这些模型是潜在编辑器的首批组成部分,可以帮助实时验证文档。除了提供引文之外,系统还会根据网络上的相关文档提供自动完成文本建议,并提供校对更正,”Meta 说道。“理想情况下,这些模型可以理解多种语言,并能够处理多种类型的媒体,包括视频、图像和数据表。” |
<<: 2022 年亚马逊 Prime 会员日最佳无人机优惠
本文最初刊登于 High Country News。生态系统与其说是风景画,不如说是马赛克,不同的部...
打造一款出色的迷你投影仪意味着要在尺寸和性能之间取得平衡,而这对于大型投影仪来说则没有必要。没有哪家...
美国物理学家报告称,他们通过激光引发的聚变反应产生了比以往任何时候都多的能量。聚变是恒星内部发生的反...
交通太糟糕了。就连交通部也这么认为。在不久的将来的某一天——想象一下 Uber 在你醉酒时接你和超快...
大约 1.25 亿年前,当时的世界气候更温暖、更潮湿,海平面也更高,棘龙是兽脚类恐龙的一种。这些不同...
删除部分或全部推文的原因有很多。你可能想让自己在潜在雇主面前显得更专业,或者在过去一年左右经历的种种...
龙与虎! - Toradora - 全方位信息和评论■ 公共媒体电视动画系列■ 原创媒体轻小说■ 播...
当今的哺乳动物和鸟类因能够自己产生体温而享有诸多优势。温血动物的新陈代谢率高,这使它们比依赖周围环境...
俄罗斯入侵乌克兰时,世界上两个最大的核武库都处于阴影之下。这两个核武库是在冷战期间建立的,至今仍然是...
TL;DR:如果您对网络安全和 IT 感兴趣,这个完整的网络安全开发人员和 IT 技能课程包可以为您...
除了从事所有这些研究工作之外,NASA 还是互联网上精美太空图片的主要提供商。现在,NASA 正在使...
目前,Facebook 正在加利福尼亚州发布其新手机,或者至少是其新主屏幕。我们将在事件发生时实时更...
2017版《魔法阵咕噜咕噜》的诉求与评价《魔法阵Guru Guru》是一部电视动画,改编自江藤宏之的...
《开心汉堡店》有一集讲的是,鲍勃非常讨厌户外活动,但他却对户外装备产生了无可救药的痴迷。我从来没有这...
《小鹿的故事》——关于自然与成长的故事《鹿的故事》是一部52集的动画系列片,于1983年至1985年...