让 Craiyon(原名 Dall-E mini)听从你的意愿的 5 种方法

让 Craiyon(原名 Dall-E mini)听从你的意愿的 5 种方法

到目前为止,您几乎肯定已经见过 Dall-E mini(又名 Craiyon)的超现实九面板艺术作品。您可能还亲自摆弄过这个开源 AI 图像生成器,制作出偶尔被诅咒、经常荒谬的拼贴画,例如 Duolingo 猫头鹰的追踪摄像机镜头或最热门的新游戏厕所。有时你会得到你想要的东西。有时你得不到。这完全取决于你问什么以及如何问。

然而,找到正确的提示策略可能需要时间——你可能没有给它时间,Craiyon 可能需要长达三分钟才能生成图像。值得庆幸的是,自该项目风靡一时以来的几周里,用户已经开始弄清楚是什么让这个有趣的小程序运转起来,现在有很多技巧是本月早些时候我们还没有的。

重现艺术家、艺术风格、视频游戏、玩具等的风格

让 Craiyon 按照你的要求工作的最简单方法之一就是让它生成特定艺术家或艺术风格的图像。也许你想要“安迪·沃霍尔风格的 Jar Jar Binks”、“爱德华·蒙克的 Elmo”、“葛饰北斋的Elden Ring ”、“食蚁兽建造房屋的老照片”或“巨型鱿鱼的洞穴壁画”。

这些提示通常都很成功,但有时人工智能会简单地重现一幅知名画作,无论你输入了什么艺术家或风格。例如,Elmo 提示大多将红色布偶放在蒙克最著名的画作《呐喊》中,而Elden Ring 提示则多次重现了葛饰北斋的《神奈川冲浪里》

距离艺术家和艺术风格仅一步之遥的是电子游戏、电视节目、收藏品和玩具。“巴拉克·奥巴马在Fortnite中”、“Blastoise 出现在Judge Judy中”、“乔治·华盛顿 Funko Pop”是这一类别的代表性提示。用户还成功要求 Craiyon 生成看起来像是由安全摄像头、法庭素描艺术家或追踪摄像头拍摄的图像。

因为这里的提示结构有点多变,所以你必须注意单词的其他含义才能得到想要的结果。例如,“Blastoise on Judge Judy”并没有变成出现在法庭真人秀节目中的手持大炮的口袋妖怪的截图;相反,我们得到的是大蓝龟站在一个模糊地看起来像法官长凳的背景前的图像,或者真的坐在一个模糊地像法官 Judy Sheindlin 的恐怖幽灵上的图像。但是嘿,也许这就是你想要的。

我们还注意到,将不同的风格结合起来似乎效果并不好。一种风格似乎会吞并另一种风格。“乐高驿马车抢劫案的老照片”看起来就像是一张浅棕色调的乐高驿马车抢劫案。

将事物放置在适当位置或描述动作

你可以通过要求 Craiyon 将物体放在特定位置来扩大范围。尝试“罐子里的太阳”或“泰坦尼克号上的恶魔”,你应该至少得到一张与你想要的图像相似的图像。

[相关:谷歌的文本到图像合成器太棒了]

同样的情况也适用于涉及物体或角色做某事的提示,尽管在我们的体验中,这些提示的成功率略低。想想“贾贾·宾克斯与达斯·维达战斗”、“斯莫基熊点燃篝火”或“米老鼠抱着格罗古”。

做些食物

Craiyon 通常能够很好地理解食物的外观,但也有一些奇怪的例外。“肉饼”效果很好,“巧克力寿司”也很好。奇怪的是,人工智能似乎不明白什么是拉面,有时甚至不明白什么是面条。“座头鲸跳出拉面”和“座头鲸跳出面条”都只返回了鲸鱼正常跃出海面的图像。看不到咸面条,只有咸水。

详细阐述,但不要太详细

有时,你可能会幸运地得到非常复杂的文本提示,但似乎人工智能会用尽空间来描述你指令中的内容。我们让它相当准确地渲染了“一只熊假装是一名高中生,背着一个红色背包,在黑板上写字,而老师站在旁边”的图像,但一旦我们说老师“抱着一只鸡”,它就开始把老师换成鸡,或者只显示那只博学的熊。

您甚至可以粘贴大段文字,然后看看会发生什么。我们尝试了《白鲸记》的开头段落,Craiyon 找到了九张 19 世纪海上捕鲸船的图片。有些图片上甚至还有人影。以实玛利?也许吧。

有时细节很重要

有传言称,添加“细节”、“4K”、“8K”或“照片级真实感”会让 Craiyon 的图像更加细致。我们尝试了几次,但没有发现太大的区别。“比尔·奈,大理石雕塑”和“比尔·奈,大理石雕塑,细节”看起来几乎一样。

效果更好的是添加“解剖学上正确的”。话虽如此,老实说,我们不确定是否还想再看到“解剖学上正确的皮卡丘”——这是我们会保留给自己的创作。

什么不起作用(至少现在)

Craiyon 仍在学习,但目前它似乎还不理解否定。让它生成一个没有头部的特定角色,所有头部都会保留。为了控制程序开发人员认为使用他们的人工智能创建人们会觉得“令人不安、痛苦或冒犯”的图像是一种滥用这一事实,我们尝试了“没有火炬的自由女神像”,以避免潜在的血腥,但 Craiyon 的自由女神仍然高高举起她的灯塔。

如果它能生成单词,那也非常困难。“男人穿着一件印有我喜欢蛋糕的 T 恤”只会生成一个穿着 T 恤的男人拿着蛋糕,同时表达不同程度的兴奋感的图像。将“我喜欢蛋糕”放在引号中并没有改变任何东西。也许人工智能很难理解单词到底是什么以及它们应该是什么样子。

但这对我们来说并不重要,只要 Craiyon 知道如何将我们的文字变成有趣的艺术。所以请继续,给我们发送您最好的作品。

<<:  在哪里可以找到、编辑和删除浏览器所知道的有关您的所有信息

>>:  智能手机安全从锁屏开始。以下是保护锁屏的方法。

推荐阅读

《五胞胎》电影 #2 - 吸引力与评价:超越预期,人物性格深化

《五胞胎的魅力》——透彻解析影片的刺激与吸引力2023年7月14日上映的《终极五胞胎∽》是根据春叶涅...

超大质量黑洞有时会疯狂进食——这就是它们知道晚餐时间到了的方式

大多数星系的中心都有一个超大质量黑洞,其质量是太阳的数百万倍甚至数十亿倍。但究竟是什么让这些黑洞如此...

只需 450 美元即可通过网络星期一优惠购买 75 英寸 Roku 电视

网络星期一是一年中购买任何电子产品的最佳日子之一,从条形音箱和 WiFi 路由器到全新的披萨烤箱(所...

如何打造一套强大到让你惊叹的汽车音响系统

繁荣的殿堂。山姆·卡普兰如果你给汽车音响播放一段低音效果足够强的曲子,那么它真的会让你的头发向后飘。...

仅供参考:如何将恐龙运送到世界各地?

勇士特暴龙要回家了。虽然路途漫长,但并不难熬——尤其是对于像他(或她)这样 7000 万岁的老家伙来...

新梦想猎人雷姆梦想骑士 - 引人入胜的新章节评论和评级

《新梦猎人灵梦:梦的骑士》:梦境与现实之间展开的激烈战斗■ 公共媒体卵子■ 原创媒体动漫原创■ 发布...

如何仅用 3 美元制作激光瞄准吹管

吹箭筒是极其简单的武器。一支由射手肺部提供动力的飞镖管足以引导无声的射弹在空中快速穿梭,在木头、混凝...

可以预测宠物情绪的机器人?

有没有想过,当你的宠物用小狗般的眼神看着你,或者神秘地甩动尾巴时,它们到底是什么感觉?现在你不用猜了...

全面回顾《长腿叔叔》!动人的故事和人物究竟有何魅力?

《长腿叔叔》:感人的故事及其吸引力《长腿叔叔》是日本动画制作的电视动画系列,于1990年播出。该片...

野猫对全球生态系统构成巨大威胁

有没有想过为什么有些猫主人会在宠物的项圈上挂铃铛?不,这不是为了让它们在晚上找到奥利奥或在暴风雪中找...

2021 年是有记录以来第六热的一年

据世界各地的科学家称,这里的气温正在上升。他们说的“这里”指的是整个地球。周四,NASA 和 NOA...

灰质:将闪电困在方块中

俄亥俄州牛顿瀑布周围有许多不同寻常的景点——沃尔玛设有阿米什马车的拴马桩,军事基地里骄傲地停泊着直升...

乳牙揭示了侏罗纪小型哺乳动物惊人的长寿命

一支古生物学家团队在苏格兰化石丰富、雾气弥漫的斯凯岛进行搜寻时,发现了一种小型但令人兴奋的早期哺乳动...

问答:SpaceX 工程师 Garrett Reisman 谈建造世界上最安全的航天器

本月晚些时候,商业太空公司 SpaceX 将进行猎鹰 9 号火箭和无人龙飞船的关键试飞,其无人航天发...

海军希望从海洋发射威力巨大的电磁炮

2016 年,美国海军将在船上测试电磁炮——一种能够以超过 5,000 英里/小时的速度反复发射炮弹...