Facebook 正在开发 AI 工具来修复因眨眼而毁坏的照片

Facebook 正在开发 AI 工具来修复因眨眼而毁坏的照片

拍摄一张好的人像照片非常困难。从光线不好到姿势不好看,很多错误都会毁掉照片。然而,没有什么比不合时宜的眨眼更能毁掉一幅肖像了。然而,Facebook Research 正在研究一种方法,使用一种人工智能驱动的工具将闭上的眼睛替换为睁开的眼睛,这种方法力求超越简单地复制和粘贴新眼睛。

在肖像中睁开闭眼的想法并不新鲜,但这个过程通常需要直接从另一张照片中提取源材料并将其移植到眨眼的脸上。例如,Adobe 的 Photoshop Elements 软件(其专业图像编辑软件的简化版本)有一个专门为此目的构建的模式。当你使用它时,程序会提示你从同一会话中选择另一张照片(假设你拍摄了多张),其中的人的眼睛是睁开的。然后它可以使用 Adob​​e 的 AI 技术(称为 Sensei)尝试将前一张照片中的眼睛融入眨眼的照片中。

这项功能对于快速修复来说效果出奇地好——尤其是当你考虑到使用功能齐全的 Photoshop 版本仔细粘贴和混合一双新眼睛需要多少步骤时。但是,有些小细节它并不总是正确的,比如特定的照明条件或阴影的方向。

“理解阴影完全是直觉的,”达特茅斯学院计算机科学教授、照片取证专家 Hany Farid 表示。“我可以通过观察阴影推断出光源的位置。”当技术人员从另一张照片中复制粘贴一组眼睛时,可能并不总是考虑到阴影的细微变化等因素,研究表明,这有时会导致最终图像看起来几乎正确,但仍然莫名其妙地奇怪。这就是研究人员希望避免的恐怖谷现象。

Facebook Research 最近发表的一篇论文提出了一种替代闭眼的另一种解决方案,它依赖于深度神经网络,该网络实际上可以使用图像周围(而不仅仅是受影响区域)的背景信息来构建缺失的数据。Facebook 正在使用一种称为通用对抗网络 (GAN) 的技术来填充这些数据。这是最近一波“深度伪造”视频所采用的相同基本技术,在这些视频中,名人似乎说了和做了他们实际上没有做过的事情。

他们使用的 Exemplar GAN 模型从同一个人的其他图像中提取数据,但它只将其用作参考材料,从中了解对象的外观以及他们脸上可能存在的任何识别标记。然后,它使用一种称为“修复”的过程来生成所需信息,用真实的眼睛替换眼睑。这种深度学习需要的参考不只是一张简单的图像,这非常适合 Facebook 的基础设施,它通常可以分析同一用户的许多不同图像,通常是在各种不同的照明情况下。

尽管并不完美,但 Facebook 的初步成果令人印象深刻,但研究人员仍在努力寻找该过程背后算法的最佳训练方法,并解决不可预测的变量,例如照片中眼睛的一部分被头发或眼镜遮挡。

尽管如此,该公司相信这种计算是有用的,甚至不仅仅是修复照片中闪烁的主体。也许人工智能将来可以让我们的个人资料照片看起来更漂亮。除了照片之外,该公司还在开发类似的人工智能工具,将音乐从一种风格转换为另一种风格。

<<:  如果你害怕人工智能,你应该知道它已经无处不在

>>:  太空军并不是美国第一次尝试将军队送入轨道

推荐阅读

特斯拉更新了夹手指窗户的故障

特斯拉对汽车召回并不陌生——从摄像头问题到“自动驾驶”问题,再到今年早些时候每辆汽车都需要安全修复的...

有可能逃避日常监视吗?

有可能逃避日常监控吗?凯文·罗斯在为《纽约杂志》撰文时,受到爱德华·斯诺登泄露美国国家安全局棱镜计划...

即使在壳和子宫内,胚胎也在倾听

50 多年前,研究人员发现,鸡在孵化前就开始学习母鸡的叫声。该研究结果于 1967 年发表在《科学》...

抱歉,但这些授粉机器人无法取代蜜蜂

2007 年,化学家 Eijiro Miyako 发明了一种可以导电的粘稠凝胶。他希望这种凝胶可以用...

小羊肖恩:深入观察无声幽默与治愈的世界

《小羊肖恩》——放松与欢笑的完美平衡《小羊肖恩》是一部电视动画,于2010年10月3日开始播出,以其...

漫画中的文化和美食

和弟弟围坐在篝火旁,谈话总是围绕着两个话题:科学或食物。我生活在一个热爱实验的美食家庭,所以这是不可...

最好的免费语言学习应用程序,可帮助您积累词汇量和会话技巧

学习第二或第三语言可以帮助您更好地适应世界并在个人和职业上取得成功。但并非每个人都有钱参加私人辅导或...

这盏灯可以利用电磁铁悬浮起来。

你知道有个奖项叫搞笑诺贝尔奖吗?这是一个讽刺性的奖项,颁发给那些“先让人发笑,然后让人思考”的研究。...

体育赛事的旧镜头可以帮助科学家追踪气候变化

参加公路自行车赛的自行车手。Pexels皮特·德·弗伦纳 (Pieter De Frenne) 是一...

波音公司的新型自主战斗机拥有可拆卸、可更换的机头

美国军方最具未来感和问题最多的战斗机是 F-35,这是一种非常昂贵的飞机,空军每架飞机的成本约为 8...

这个古老的视觉错觉是一个有 14000 年历史的谜题

这个雕刻装饰物在 14,000 多年前就被固定在一个狩猎工具上,但幻觉仍然存在。集中注意力在左侧较高...

詹姆斯·韦伯太空望远镜发布著名超新星遗迹的新图像——略有不同

美国宇航局发布了詹姆斯韦伯太空望远镜 (JWST) 拍摄的超新星遗迹仙后座 A (Cas A) 的新...

白鲸可能通过摇动它们的脑袋来交流

动物进化出了各种各样奇怪而又奇妙的交流方式——从螳螂虾向彼此反射偏振光脉冲,到天堂鸟在丛林中四处游荡...

《强袭魔女》的魅力与评价:彻底解读美少女战斗的功绩

强袭魔女:天空少女物语2008 年播出的电视动画《强袭魔女》讲述了拥有魔法力量的少女与被称为“神经”...

在国家圆周率日享受此在线数学课程的优惠

长期以来,人们对数学一直怀有爱恨交织的关系。有些人天生就喜欢处理数字,而有些人则坚称自己根本不是“数...