尽管人们很容易纠结于人工智能的潜在威胁,但更多时候,该领域承诺让人类的生活更加美好。人工智能算法旨在帮助我们与朋友联系、查找信息,甚至帮助我们穿越现实世界。 从今天开始,Facebook 将使用人工智能自动为 Facebook 上的每张照片生成文字说明,为盲人或视障人士提供急需的无障碍服务。 因为开发人员希望人工智能生成的文本极其准确,所以他们用 100 种不同类型的物体的图像对其进行了密集训练,所以目前它仅限于识别人类、披萨、棒球等,但随着研究的进展,字幕将变得越来越多样化和复杂。 视力受损者经常依靠屏幕阅读器来浏览互联网,屏幕阅读器会将文字口述到屏幕上。但是,屏幕阅读器的效果取决于它们能够阅读的内容。如果缺少文字,它们就无法阅读。网络标准规定,图像应该有一个称为替代文本的字段,用文字描述图像所描绘的内容。但是,在大多数 Facebook 图像上,屏幕阅读器唯一可用的文本是与照片一起发布的状态。 通过应用人工智能算法,Facebook 能够扫描每张图片并提取一些关于其内容的信息。如果有人上传了一张披萨图片,算法将能够自动将“披萨”一词放入图片的替代文本中,这样屏幕阅读器就可以告诉用户。该社交网络 15 亿用户中的大多数都看不到这些说明,但对于那些在日益视觉化的平台上看不到照片的人来说,这标志着一种转变。 Facebook 正利用这一机会使其研究方式更加民主化。该公司的无障碍和人工智能团队将获得用户的反馈,并利用这些反馈指导进一步的研究。今年 3 月,Facebook 与康奈尔大学联合发表了一项研究,探讨盲人如何使用 Facebook,希望打造一款满足社区需求的产品。 “应该以人们的需求为驱动力来推动研究,而不是以我们研究出的东西为驱动力来推动使用,”Paluri 说道。“反馈让我们能够进行更多调查。” 识别和描述图像的挑战是人工智能领域一个突出的研究类别。新技术和硬件正在实现深度学习,利用多层人工神经网络或模拟大脑神经元的微小数学方程簇来对数据进行分类并寻找模式。这些技术可以应用于图像、音频、文本或几乎任何类型的数据。在图像中,猫的照片中的图案与海豚的图案不同。 但单个物体很简单。当物体之间相互作用,或者当某个动作有背景时,情况就困难得多,因为机器需要真正了解物理世界,并知道物体之间的关系。对于一个天真的机器来说,没有重力、家庭关系或爱。只有数据。 因此,要理解父亲和女儿正在远足小径上行走,或者猫在床上,机器必须首先了解物理世界。 这也正是 Facebook 无障碍团队所需要的。目前,他们有这些可识别的对象,称为标签。标签是一只猫,标签是一张床,标签是一个人。有了这些信息,他们就可以说照片中有四个人拿着冰淇淋蛋筒,或者一个披萨饼。 “我们的目标是让它描述的内容远不止标签。标签如何互动?标签之间的关系是什么?”Paluri 说。“不只是说‘猫’和‘床’。你想说‘猫在床上’或‘猫跳过床’。所以这是一个起点。” 从很多方面来说,这都是一个起点。该团队不仅梦想着实现更多基于上下文的物体识别,而且还希望使识别更具交互性。Paluri 提出了一个潜在功能,用户可以点击图像的不同部分来听到特定信息。 但就 Facebook 的业务规模而言,精度必须放在首位。每天,Facebook、Instagram、Messenger 和 WhatsApp 上都会分享 20 亿张图片,因此即使 1% 的误差也可能意味着数百万个错误。工程师们根据正确分类物体的重要性,手动调整了算法可以检测到的大约 100 个概念中的每一个。例如,算法需要对性别之类的东西比物体是否是披萨更加确定。它可以从 100 个物体库中识别出物体,置信度从 80% 到 99%。Facebook 表示,它可以在 Facebook 上超过 50% 的照片中识别出至少一个物体。 机器能够理解的大多数概念都是关于人和物体的。它知道眼镜、棒球,甚至自拍。然而,据 Paluri 称,有些概念是团队故意没有加入的。其中包括某些动物。 人工智能系统所犯的错误,尤其是在对图像进行分类时,可能会具有文化敏感性,例如去年谷歌的照片应用将黑人标记为大猩猩。为了避免这种情况,“我们希望从我们非常有信心并且有很多积极反馈的地方开始,”Paluri 说。 信心也可以是无害的。Paluri 提到了猫爪。 “角落里可能有一只猫爪。图片里还有一只猫吗?这是一个悬而未决的问题,”他说。“也许这幅图就是关于爪子的,这就是它有趣的地方。” 研究可以朝很多方向发展,包括尝试检测幽默。但无论如何,任何改进都将依赖于更好的算法,这些算法是根据真实人类的需求而制定的。人工智能的前景是让人类的生活更轻松。我们正在将大脑中可以取代机器的部分外包出去。通过使用软件来增强我们自己,世界将变得更加容易接近。 该功能目前已在 Facebook 的 iOS 应用程序上推出,并将很快推广到其他平台以及英语以外的其他语言。 |
《此生无悔:为美好的世界献上祝福!2 OVA》的魅力与评价《为美好的世界献上祝福!2 OVA》是 K...
《丑小鸭》:根据安徒生的杰作改编的美丽成长故事《丑小鸭》于1970年8月1日上映,是一部根据安徒生经...
本周你学到的最奇怪的事情是什么?好吧,不管是什么,我们保证如果你听 PopSci 的热门播客,你会得...
尽管如今时尚的新款 Xbox 360 深受游戏迷的追捧,但笨重的老款第一代 Xbox 却拥有 360...
卡门圣地亚哥——迷人的红色斗篷和她在世界各地的冒险1995年至1997年播出的电视动画《怪盗卡门圣地...
苹果一直致力于打造吸引人们眼球的产品。从 Apple Watch Ultra 到 iPhone 的摄...
《盗王惊魂七重天》——进入梦想与冒险的世界《盗贼王JING in Seventh Heaven》于2...
幽灵船-幽灵船全方位测评与推荐■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期1956 年 4 月■...
脚部刺痛通常是血液循环不良的结果。但有时,这也预示着更可怕的情况:寄生虫在啮齿动物、蛞蝓和蜗牛体内孵...
据世界卫生组织估计,每年有 10 万人死于蛇咬,数十万人因此致残。借助最先进的技术,有希望的新科学可...
几年前,真正的无线耳机还只是奢侈品。从那时起,这项技术变得更加触手可及,无线耳机已经变得像过去的白色...
白蚁以在蚁丘中建造通风口而闻名,这使得它们即使在中非炎热的日子里也能让凉爽的空气在地下深处流动。但它...
目前有多个脑机接口 (BCI) 项目正在进行中,但 BrainGate 是首批旨在帮助神经退行性疾病...
2015 年发明奖得主类别:航空发明人:斯特凡·克莱因和尤拉伊·瓦库里克公司:航空机动车发明:航空机...
作家有两种:一种是讨厌记录采访内容的作家,另一种是撒谎者。我认识的大多数作家几乎会想尽一切办法避免听...