Dall-E Mini 图像生成器的荒谬性可能是它的主要吸引力

Dall-E Mini 图像生成器的荒谬性可能是它的主要吸引力

萨尔瓦多·达利是 1904 年出生的西班牙艺术家,他以超现实主义绘画而闻名:融化的钟表、腿细如昆虫的大象、扭曲的人脸和四肢。Dall-E(发音类似 Dalí)Mini 是一款于 6 月初首次亮相的新 AI 程序,它很快被公认为超现实主义艺术的另一个来源,它通过用户生成的请求生成图像,例如一瓶牧场酱在法庭上作证、wikihow 上关于如何吃锤子的说明,以及电影《寂静岭》中吃披萨的护士。

这些图像很有趣,该程序因其有趣的艺术作品在网上获得了关注。用户可以输入一个短语——任何短语——然后看到他们编写的人工智能生成的图像突然出现。Dall-E Mini 是一个开源项目,基于人工智能研究实验室 OpenAI 的原始 Dall-E 技术,该技术可以从文本生成逼真的图像和艺术作品。Dall-E Mini 制作的许多艺术作品都受到了人们的嘲笑。但随着这些技术变得越来越完善和广泛使用,滥用的风险也在增加——这可不是开玩笑的事。

Dall-E Mini 是继 OpenAI 于 2022 年 4 月正式发布的 Dall-E 2 之后推出的。Dall-E 2 的运作方式是建立数十亿张在线图像与其随附描述之间的关联。Dall-E Mini 的运作方式类似,但规模要小得多。该项目由 Boris Dayma 领导,使用了来自三个数据集的约 1500 万张图像来为其模型提供信息,其规模大约是 OpenAI 最初的 Dall-E 程序的 1/27。Dall-E Mini 由 Hugging Face 托管,该公司提供机器学习模型和工具,并表示他们的使命是“使良好的机器学习民主化”。

用户几乎可以制作任何他们想要的图像,尽管结果更倾向于滑稽而非准确。技术安全公司 F5 的前人工智能负责人 Shuman Ghosemajumder 表示,喜剧性和吸引力的一部分来自于意想不到的缺陷。“它之所以有趣,部分原因是图像并不完美,”Ghosemajumder 说。“有印象派图像,有噩梦般的图像,有疯狂的图像。所有这些都很有趣,而且分享起来也很有趣。”

Ghosemajumder 表示,他可以预见这种技术在公众眼中会经历几个不同的阶段。起初,人们对这种程序可能具有的能力感到好奇。随着人们探索他们所能创造的东西的复杂性,人们会感到惊奇和学习——正如网上已经展示的那样。然后,他说第二阶段更像是从纯粹的娱乐过渡到人们理解他们所能创造的东西的价值。

“你可以为特定目的生成基本的插图,并且可以更好地了解技术的当前状态,以便可以开始制定计划,规划未来如何使用这项技术的更先进版本,”Ghosemajumder 说。

展望未来,他认为这些技术被认知的第三阶段将是它们如何为未来更先进的创新奠定基础,例如高质量的合成视频。

但随着这些创新变得越来越好,危险和误导性图像的风险也随之增加。

[相关:让 Craiyon(前身为 Dall-E mini)屈服于你的意志的 5 种方法]

Ghosemajumder 表示,目前 Dall-E Mini 的图像“质量”很低,用户通常知道这些图像是人工智能生成的,不一定是实际拍摄的照片,比如一瓶牧场酒在法庭上作证的照片。但当越来越难以辨别某样东西是在人工智能平台上制作的还是在非数字世界中拍摄的时,人们将更容易制作图像,为网上的虚假信息活动提供素材。

“人们可以创造的不仅仅是图帕克或达斯·维达的印象派版本,”Ghosemajumder 说。“相反,它会让人觉得,‘哇,这看起来像是一个真实的人在做某事。’我可以创造一个政客做他们从未做过的事情的形象,最终创造一个完整的故事情节,并用它来传播虚假信息。”

目前,Dall-E 2 尚未向公众开放,而 OpenAI 的开发人员正在努力应对滥用的潜在风险。(Dall-E Mini 是类似但公开生产的开源版本。)同样,谷歌的文本转图像程序 Imagen 尚未发布对其平台的访问权限。在这两种情况下,这两家公司都聘请了研究人员和艺术家来测试程序并改进操作和训练数据,确保安全,并使艺术变得更好。Ghosemajumder 说,在全面发布之前进行有限发布是“广泛接受的软件原则”,他认为随着技术变得越来越复杂,这将变得越来越重要。

最终,Ghosemajumder 表示,Dall-E Mini 等技术的最大优势之一是,它们将使更多人能够比现在更轻松地看到事物。他认为这是高质量内容的民主化。

“它释放了人们的创造力,让人们能够更有效地沟通,”Ghosemajumder 说。“这有可能让人们更高效、更有效地生成他们想要可视化的不同概念的插图和照片。”

至于 Ghosemajumder,他的 Dall-E Mini 创作是一系列图像,描绘了 Chewbacca 如果有一份办公室工作的话会如何度过一天。

<<:  RIP Internet Explorer,感谢所有的表情包

>>:  7 个技巧让你的 Mac 上文件更容易找到

推荐阅读

人工智能现在可以在扑克牌桌上占据主导地位,而 Facebook 掌握着所有的牌

如果你曾经把生活中的竞争情况想象成一场象棋比赛,那么你可能会认为扑克是一个更好的比喻。象棋只是一场双...

经过《老友记》训练的神经网络可以识别讽刺

2019 年,当 AI 还只是科幻小说中的产物,而 GPT-2 距离发布还有几个月的时间时,一组研究...

科学家刚刚发现一颗类似太阳的恒星爆发了一场巨大风暴

距离地球 111 光年的年轻恒星天龙座 EK 的大小和温度与太阳差不多。然而,一份新报告显示,它目前...

我们在创造可再生能源方面做得很好——但我们没有实际利用可再生能源的基础设施

美国的风能和太阳能发电量一直在缓慢但稳步地增长。存款照片上周,一些罕见的积极环保消息进入公众视野:美...

FDA 批准美国首个非处方避孕药

7 月 13 日,美国食品药品管理局 (FDA) 首次批准了一种非处方避孕药,无需处方即可销售。该药...

Apple Watch ECG 功能现已推出。这是您需要了解的。

游泳后,我浑身湿透,将手指放在 Apple Watch 的数字表冠上,测量了我的心脏心电图。或者说,...

2013 年底特律车展上 9 款最佳汽车

从来没有人指责汽车行业疯狂地冲向未来。在底特律北美国际汽车展这样的活动上,每出现一个超清洁电动柴油充...

“它很有感染力。《节目的感染乐趣》的吸引力和评论:全面分析

“它很有感染力。——具有超现实世界观和独特幽默的 OVA “它会传染。” 是改编自吉田战社的超现实搞...

哈勃望远镜发现迄今为止最遥远的恒星

哈勃太空望远镜又有一项惊人发现:它发现了迄今为止发现的最远的恒星,这颗恒星在宇宙大爆炸后的第一个 1...

世界上最大的望远镜背后

通过巨型麦哲伦望远镜观察的天文学家也许有一天会拍摄到系外行星,或者回顾过去,看到我们宇宙的早期。要比...

湘南爆走族 10 FROM SAMANTHA - 最新评论与评价

《湘南爆走族10 FROM SAMANTHA》:青春赛车与友情的故事《湘南爆走族 10 FROM S...

你的电脑显示器颜色看起来不好,因为你没有校准它们

校准显示器意味着确保它能正确显示颜色 — 确保其他人创建的内容在您的屏幕上看起来准确,反之亦然。如果...

“有人叫你了,阿撒塞勒先生。” 《Z》的魅力与评价:推荐点详解

“有人叫你了,阿撒塞勒先生。” Z》——恶魔与人类的幽默共存“有人叫你了,阿撒塞勒先生。” 《Z》是...

《豌豆花》:重新评价大家动人的歌曲

《花生》:NHK 的经典动画及其魅力《豌豆花》是1969年在NHK教育电视台(现NHK电子电视台)播...

脑机 Beta 测试

释放“被关押”的患者神经学家 Philip Kennedy 发明了一种帮助完全瘫痪的人控制电脑光标的...