Facebook 正在开发 AI 工具来修复因眨眼而毁坏的照片

Facebook 正在开发 AI 工具来修复因眨眼而毁坏的照片

拍摄一张好的人像照片非常困难。从光线不好到姿势不好看,很多错误都会毁掉照片。然而,没有什么比不合时宜的眨眼更能毁掉一幅肖像了。然而,Facebook Research 正在研究一种方法,使用一种人工智能驱动的工具将闭上的眼睛替换为睁开的眼睛,这种方法力求超越简单地复制和粘贴新眼睛。

在肖像中睁开闭眼的想法并不新鲜,但这个过程通常需要直接从另一张照片中提取源材料并将其移植到眨眼的脸上。例如,Adobe 的 Photoshop Elements 软件(其专业图像编辑软件的简化版本)有一个专门为此目的构建的模式。当你使用它时,程序会提示你从同一会话中选择另一张照片(假设你拍摄了多张),其中的人的眼睛是睁开的。然后它可以使用 Adob​​e 的 AI 技术(称为 Sensei)尝试将前一张照片中的眼睛融入眨眼的照片中。

这项功能对于快速修复来说效果出奇地好——尤其是当你考虑到使用功能齐全的 Photoshop 版本仔细粘贴和混合一双新眼睛需要多少步骤时。但是,有些小细节它并不总是正确的,比如特定的照明条件或阴影的方向。

“理解阴影完全是直觉的,”达特茅斯学院计算机科学教授、照片取证专家 Hany Farid 表示。“我可以通过观察阴影推断出光源的位置。”当技术人员从另一张照片中复制粘贴一组眼睛时,可能并不总是考虑到阴影的细微变化等因素,研究表明,这有时会导致最终图像看起来几乎正确,但仍然莫名其妙地奇怪。这就是研究人员希望避免的恐怖谷现象。

Facebook Research 最近发表的一篇论文提出了一种替代闭眼的另一种解决方案,它依赖于深度神经网络,该网络实际上可以使用图像周围(而不仅仅是受影响区域)的背景信息来构建缺失的数据。Facebook 正在使用一种称为通用对抗网络 (GAN) 的技术来填充这些数据。这是最近一波“深度伪造”视频所采用的相同基本技术,在这些视频中,名人似乎说了和做了他们实际上没有做过的事情。

他们使用的 Exemplar GAN 模型从同一个人的其他图像中提取数据,但它只将其用作参考材料,从中了解对象的外观以及他们脸上可能存在的任何识别标记。然后,它使用一种称为“修复”的过程来生成所需信息,用真实的眼睛替换眼睑。这种深度学习需要的参考不只是一张简单的图像,这非常适合 Facebook 的基础设施,它通常可以分析同一用户的许多不同图像,通常是在各种不同的照明情况下。

尽管并不完美,但 Facebook 的初步成果令人印象深刻,但研究人员仍在努力寻找该过程背后算法的最佳训练方法,并解决不可预测的变量,例如照片中眼睛的一部分被头发或眼镜遮挡。

尽管如此,该公司相信这种计算是有用的,甚至不仅仅是修复照片中闪烁的主体。也许人工智能将来可以让我们的个人资料照片看起来更漂亮。除了照片之外,该公司还在开发类似的人工智能工具,将音乐从一种风格转换为另一种风格。

<<:  如果你害怕人工智能,你应该知道它已经无处不在

>>:  太空军并不是美国第一次尝试将军队送入轨道

推荐阅读

使用野营炉烹饪美食的专家提示

在篝火旁露天用餐本身就是一种享受——手里拿着一杯最喜欢的饮料,空气中飘散着烤汉堡的香味,烤棉花糖的材...

中国减少燃煤供暖的决定或挽救了 23,000 人的生命

空气污染与多种健康问题有关,从哮喘到肺病和心脏病发病率和严重程度的增加。世界卫生组织 (WHO) 将...

一位生态学家的雄心勃勃的研究揭示了我们的森林

在夏威夷大岛上,一种名为 ceratocystis 的真菌正在杀死 Ōhi'a 树——过去八...

猫薄荷和葡萄柚正在开启驱虫剂的新时代

如果你一生中曾去过森林,你可能吃过、喝过或吸入过避蚊胺,然后就后悔不已。但这可能不会永远持续下去。过...

经过 11 年,NASA 的小行星跳跃航天器即将耗尽燃料

艺术家对谷神星和灶神星之间黎明号的印象。NASA/JPL-Caltech由于燃料即将耗尽,NASA ...

“大胆试试吧!” 《面包超人小甜心和鲁伦的绘本》的魅力与评价:深入了解面包超人系列电影第35期

“大胆试试吧!” 《面包超人小甜心和绘本鲁润》的评论与推荐“大胆试试吧!” 《面包超人:白金超人和鲁...

我们实际上是在返校季免费赠送这款 iPad Air

别再说了!如果你想买 iPad 上学,就不要去苹果——他们会多收你的钱。我们知道学生们的预算很紧张,...

基斯通输油管道在北达科他州湿地泄漏了 383,000 加仑石油

周二晚上,Keystone 输油管道向北达科他州湿地泄漏了 383,000 加仑原油,到加拿大天然气...

《亚光计划 2:大德寺财阀的阴谋》评论:续集的魅力与有深度的故事

《亚光计划2:大德寺财阀的阴谋》——80年代动画的魅力及其续集的评价介绍20 世纪 80 年代的动漫...

CEO 们已经在使用 ChatGPT 撰写电子邮件

尽管 ChatGPT 去年年底才正式开放,但它已经被世界上一些最有权势的人用于日常工作中。 Chat...

本周有一个特别大的窗口可以观看海狸月食

现在就为 2021 年的第二次月食设置清晨闹钟吧。这场壮观的月食被称为“海狸月食”,将于周五清晨在北...

山谷钟声:重新评价每个人动人的歌声

《谷中钟声》——动画重现昭和经典1964年12月在NHK教育电视台(现NHK电子电视台)播出的《谷中...

小山大将:大家的歌的魅力与评价

《大山大将》:NHK的经典动画及其魅力《大山的大将》是1967年在NHK教育电视台(现NHK E-T...

科学家用死蜘蛛制作抓娃娃机

本周你学到的最奇怪的事情是什么?好吧,不管是什么,我们保证如果你听PopSci的热门播客,你会得到一...

声波驱动乒乓球穿越水上障碍赛道

瑞士洛桑联邦理工学院 (EPFL) 的工程师们发明了一种系统,利用可听见的声波引导物体穿越难以预测的...