尽管人们很容易纠结于人工智能的潜在威胁,但更多时候,该领域承诺让人类的生活更加美好。人工智能算法旨在帮助我们与朋友联系、查找信息,甚至帮助我们穿越现实世界。 从今天开始,Facebook 将使用人工智能自动为 Facebook 上的每张照片生成文字说明,为盲人或视障人士提供急需的无障碍服务。 因为开发人员希望人工智能生成的文本极其准确,所以他们用 100 种不同类型的物体的图像对其进行了密集训练,所以目前它仅限于识别人类、披萨、棒球等,但随着研究的进展,字幕将变得越来越多样化和复杂。 视力受损者经常依靠屏幕阅读器来浏览互联网,屏幕阅读器会将文字口述到屏幕上。但是,屏幕阅读器的效果取决于它们能够阅读的内容。如果缺少文字,它们就无法阅读。网络标准规定,图像应该有一个称为替代文本的字段,用文字描述图像所描绘的内容。但是,在大多数 Facebook 图像上,屏幕阅读器唯一可用的文本是与照片一起发布的状态。 通过应用人工智能算法,Facebook 能够扫描每张图片并提取一些关于其内容的信息。如果有人上传了一张披萨图片,算法将能够自动将“披萨”一词放入图片的替代文本中,这样屏幕阅读器就可以告诉用户。该社交网络 15 亿用户中的大多数都看不到这些说明,但对于那些在日益视觉化的平台上看不到照片的人来说,这标志着一种转变。 Facebook 正利用这一机会使其研究方式更加民主化。该公司的无障碍和人工智能团队将获得用户的反馈,并利用这些反馈指导进一步的研究。今年 3 月,Facebook 与康奈尔大学联合发表了一项研究,探讨盲人如何使用 Facebook,希望打造一款满足社区需求的产品。 “应该以人们的需求为驱动力来推动研究,而不是以我们研究出的东西为驱动力来推动使用,”Paluri 说道。“反馈让我们能够进行更多调查。” 识别和描述图像的挑战是人工智能领域一个突出的研究类别。新技术和硬件正在实现深度学习,利用多层人工神经网络或模拟大脑神经元的微小数学方程簇来对数据进行分类并寻找模式。这些技术可以应用于图像、音频、文本或几乎任何类型的数据。在图像中,猫的照片中的图案与海豚的图案不同。 但单个物体很简单。当物体之间相互作用,或者当某个动作有背景时,情况就困难得多,因为机器需要真正了解物理世界,并知道物体之间的关系。对于一个天真的机器来说,没有重力、家庭关系或爱。只有数据。 因此,要理解父亲和女儿正在远足小径上行走,或者猫在床上,机器必须首先了解物理世界。 这也正是 Facebook 无障碍团队所需要的。目前,他们有这些可识别的对象,称为标签。标签是一只猫,标签是一张床,标签是一个人。有了这些信息,他们就可以说照片中有四个人拿着冰淇淋蛋筒,或者一个披萨饼。 “我们的目标是让它描述的内容远不止标签。标签如何互动?标签之间的关系是什么?”Paluri 说。“不只是说‘猫’和‘床’。你想说‘猫在床上’或‘猫跳过床’。所以这是一个起点。” 从很多方面来说,这都是一个起点。该团队不仅梦想着实现更多基于上下文的物体识别,而且还希望使识别更具交互性。Paluri 提出了一个潜在功能,用户可以点击图像的不同部分来听到特定信息。 但就 Facebook 的业务规模而言,精度必须放在首位。每天,Facebook、Instagram、Messenger 和 WhatsApp 上都会分享 20 亿张图片,因此即使 1% 的误差也可能意味着数百万个错误。工程师们根据正确分类物体的重要性,手动调整了算法可以检测到的大约 100 个概念中的每一个。例如,算法需要对性别之类的东西比物体是否是披萨更加确定。它可以从 100 个物体库中识别出物体,置信度从 80% 到 99%。Facebook 表示,它可以在 Facebook 上超过 50% 的照片中识别出至少一个物体。 机器能够理解的大多数概念都是关于人和物体的。它知道眼镜、棒球,甚至自拍。然而,据 Paluri 称,有些概念是团队故意没有加入的。其中包括某些动物。 人工智能系统所犯的错误,尤其是在对图像进行分类时,可能会具有文化敏感性,例如去年谷歌的照片应用将黑人标记为大猩猩。为了避免这种情况,“我们希望从我们非常有信心并且有很多积极反馈的地方开始,”Paluri 说。 信心也可以是无害的。Paluri 提到了猫爪。 “角落里可能有一只猫爪。图片里还有一只猫吗?这是一个悬而未决的问题,”他说。“也许这幅图就是关于爪子的,这就是它有趣的地方。” 研究可以朝很多方向发展,包括尝试检测幽默。但无论如何,任何改进都将依赖于更好的算法,这些算法是根据真实人类的需求而制定的。人工智能的前景是让人类的生活更轻松。我们正在将大脑中可以取代机器的部分外包出去。通过使用软件来增强我们自己,世界将变得更加容易接近。 该功能目前已在 Facebook 的 iOS 应用程序上推出,并将很快推广到其他平台以及英语以外的其他语言。 |
《宇宙兄弟#0》:在梦想与现实之间闪耀的兄弟故事《宇宙兄弟#0-宇宙兄弟零号》是一部于 2014 ...
杰米·M·齐泽尔是斯坦福大学睡眠科学中心的精神病学教授。以下是他向克莱尔·马尔达雷利讲述的他亲身经历...
7 月,卫生与公众服务部 (HSS) 将为希望拨打国家自杀预防生命线的人们推出新的拨号快捷方式——您...
乌贼是一种聪明狡猾的生物,长期以来一直让科学家着迷。它们是伪装大师,是解决问题的创造性专家,而且它们...
使用 2015 款雪佛兰 Impala 双燃料汽车,驾驶员可以将废弃副产品填满油箱,就像电影《回到未...
约翰霍普金斯大学神经学家 Gul Dolen //转述自 Alex Schwartz章鱼看起来和我们...
Sanrio 音乐视频 - 回顾怀旧 OVA 1993年12月21日发行的《Sanrio Musi...
汽车领域正在出现两个明显的趋势:第一是逐渐从内燃机转向电动汽车,第二是追求自动驾驶。Waymo 等公...
菲尔德博物馆地衣真菌馆馆长托尔斯滕·伦布施 (Thorsten Lumbsch) 利用地铁通勤时间阅...
《甲铁城的卡巴内瑞 海门之战》——激烈的战斗和不断深入的人性戏剧■ 公共信息《甲铁城的卡巴内瑞:...
本文与Grist联合发布,Grist 是一家关注气候、正义和解决方案的非营利媒体组织。电动汽车在全国...
格陵兰岛八成的土地被厚达数千英尺的冰墙覆盖。如果冰墙完全融化,其中的水足以使海平面上升20多英尺。受...
我们以为我们知道这颗有着宽阔条纹带的行星是什么样子。我们用蜡笔和记号笔在建筑纸上画下它的轮廓,用泡沫...
W3 - Wonder3 - 详细评测及推荐■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间19...
仿肉并不是一个新概念。杂货店里到处都是植物替代品——世界上的 Boca 和 Gardenburger...