Meta 刚刚发布了一款可帮助计算机“看到”图像中物体的工具

Meta 刚刚发布了一款可帮助计算机“看到”图像中物体的工具

在本周的一篇博客文章中,Meta AI 宣布发布一款新的 AI 工具,该工具可以识别图像中的哪些像素属于哪个对象。Segment Anything 模型 (SAM) 执行一项称为“分割”的任务,这是计算机视觉的基础,即计算机和机器人用来“查看”和理解周围世界的过程。除了新的 AI 模型外,Meta 还向外部研究人员开放了其训练数据集。

史蒂芬·平克 (Steven Pinker) 在 1994 年出版的《语言本能》一书中写道:“35 年的人工智能研究的主要教训是,难题很容易解决,容易的问题很难解决。”这个被称为莫拉维克悖论的悖论在 30 多年后仍然成立。像 GPT-4 这样的大型语言模型能够在几秒钟内生成读起来像人类写的文本,而机器人很难捡起形状奇特的积木——这项任务看似很简单,孩子们在一岁之前就为了好玩而做。

分割属于这种看似简单但技术上很难的类别。你可以看看你的桌子,立刻分辨出什么是电脑,什么是智能手机,什么是一堆纸,什么是揉成一团的纸巾。但对于处理 2D 图像的计算机来说(因为即使视频也只是一系列 2D 图像),一切都只是一堆具有不同值的像素。桌面在哪里结束,纸巾在哪里开始?

Meta 的新 SAM AI 试图以通用方式解决此问题,而不是使用专门设计用于识别某样事物(如面部或枪支)的模型。研究人员表示,“SAM 已经学会了什么是物体的一般概念,它可以为任何图像或视频中的任何物体生成蒙版,甚至包括训练期间未遇到的物体和图像类型。”换句话说,它不仅可以识别已学会识别的物体,还可以猜测不同的物体是什么。SAM 不需要展示数百张不同的揉皱纸巾来区分一张纸巾和你的办公桌,它对事物的一般感知就足够了。

[相关:Facebook 作为 Meta 的首批举措之一:教机器人触摸和感受]

您现在就可以在浏览器中使用自己的图像尝试 SAM。SAM 可以为您选中的任何对象生成蒙版,方法是用鼠标光标单击该对象或在它周围画一个框。它还可以为图像中检测到的每个对象创建蒙版。据研究人员称,SAM 还可以接受文本提示,例如:选择“猫”,但该功能尚未向公众发布。它在分割我们在PopSci上测试的图像方面做得相当不错。

Segment Anything 工具工作原理的可视化。Meta AI

虽然在网上很容易找到大量图像和视频,但高质量的分割数据却小众得多。为了让 SAM 达到这一点,Meta 必须开发一个新的训练数据库:Segment Anything 1-Billion 掩码数据集 (SA-1B)。它包含大约 1100 万张授权图像和超过 11 亿个分割掩码,“质量高、多样性强,在某些情况下甚至可与之前小得多、完全手动注释的数据集中的掩码相媲美”。为了“使分割民主化”,Meta 正在将其发布给其他研究人员。

新 AI 工具的一些行业应用。Meta AI

Meta 对其分割程序有着宏伟的计划。可靠的通用计算机视觉仍然是人工智能和机器人技术中尚未解决的问题——但它具有很大的潜力。Meta 表示,SAM 有朝一日可以识别通过增强现实 (AR) 眼镜看到的日常物品。该公司的另一个名为 Ego4D 的项目也计划通过不同的视角解决类似的问题。这两个项目有朝一日都可能成为一种工具,让用户可以按照说明和分步食谱进行操作,或者在狗碗上为伴侣留下虚拟便条。

更合理的解释是,SAM 在工业和研究领域也有很多潜在用途。Meta 建议用它来帮助农民统计奶牛数量,或者帮助生物学家在显微镜下追踪细胞——可能性无穷无尽。

<<:  “TikTok禁令”是TikTok之外的法律噩梦

>>:  量子计算机目前还不能传送物体

推荐阅读

Gundress 评论:迷人的设计与故事的融合

Gundress:未来城市中的战士和恐怖分子■ 公共媒体剧院■ 原创媒体其他的■ 发布日期1999 ...

这款股票筛选器将于总统日促销

在面临经济衰退威胁的时期进行投资是否明智,只有投资者自己(也就是你)才能回答。如果你现在不能冒着流动...

《恶之花》:描写青春黑暗与美丽的名作动画的回顾与评论

《恶之花》——描绘青春黑暗的独特作品《恶之花》是改编自押见修造同名漫画的电视动画,于2013年4月5...

如何建造桌面弹射器

本周末, 《大众科学》将在世界创客博览会上举办弹射器比赛。我们将指导与会者使用木钉和橡皮筋制作自己的...

本周无人机新闻:鹰袭击、无人机竞赛等

以下是本周无人机热门新闻汇总:无人机的军事、商业、非营利和娱乐应用。鹰攻击无人机一名剑桥男子在驾驶四...

档案中的片段:超导体终于成熟

为了纪念 150 周年,我们重新回顾了科普故事(成功和失败),这些故事有助于定义科学进步、理解和创新...

观看自制电磁炮向哈密瓜发射炮弹

电磁炮简直就是科幻小说。爱好者们喜欢制作这种步枪,它利用电磁力快速加速磁性金属弹头,然后将其抛向空中...

是的,皱鳃鲨确实很怪异。但还有其他“活化石”也同样怪异。

我们以前也遇到过这种情况:有人从海底捞出了一些看上去怪异的东西,现在谷歌新闻上充斥着关于“恐龙时代”...

《Yum. Yum. Yummy》第四季评论和评分:这部美味烹饪动漫的吸引力是什么?

Yanyan Yamii [第 4 季] - 引人入胜的短篇动漫2004年春季播出的电视动画《燕燕...

制作自己的定制加重毯,获得极致睡眠

当我们感到压力或焦虑时,几乎没有什么比一个紧紧的拥抱更舒服的了。我们感觉良好,不仅是因为靠近关心我们...

问任何问题:昆虫会发胖吗?

20 世纪 60 年代初,佛罗里达州的一位昆虫学家开始发表关于肥胖蚊子的研究,一些关于肥胖虫子的早...

你的双筒望远镜,但更好(它们有夜视和记录功能)

那是什么?就在草原对面。是八角雄鹿还是粘在巨石上的风滚草?你的直觉告诉你那只是一株杂草,但我们暂时借...

离线使用 Google Chrome 的 6 种方法

无论是有线还是无线,互联网接入已成为我们这个时代最宝贵的商品之一。但是,当我们失去这种接入时,我们却...

白宫里苍蝇成灾

白宫有瘟疫问题。Deposit Photos害虫困扰了美国总统好几代。据《白宫真实生活:美国最著名官...

驴企鹅像人一样说话

非洲企鹅的叫声似乎与人类的语言相去甚远。这种鸟类(也称为非洲企鹅)之所以获得这个绰号,并不是因为它们...