AI 文本转图像生成器在很短的时间内取得了长足进步,甚至可以说是令人不安,但是他们仍然无法完全掌握人体解剖学的一个部分:手。今年早些时候,佛罗里达大学 AI 与艺术副教授兼艺术家 Amelia Winger-Bearskin 在接受BuzzFeed采访时解释说,到目前为止,AI 程序在很大程度上不确定“手”到底是什么。“图像中的手非常微妙,”她当时说道。“它们通常抓着某物。或者有时抓着另一个人。”虽然过去几个月取得了一些进展,但仍有很大的改进空间。 虽然乍一看这听起来可能有点奇怪,但只要快速看一下我们肢体的复杂性,就能很快发现为什么会这样。除非能确定许多关节点、各种姿势、皮肤皱纹、静脉和无数其他精确的细节,否则手部的渲染很快就会陷入怪异和不准确的恐怖谷。更重要的是,人工智能程序根本没有像面部和全身那样多的大型高质量手部图像可供学习。但由于人工智能仍在努力解决这个问题——结果往往极其令人费解、荒谬和彻底令人不安——中国合肥科技大学的程序员正在研究一个出人意料的简单解决方案:训练人工智能专门研究和改进手部生成。 [相关:人工智能广阔世界的简单指南。] 在最近发表的一篇研究论文中,该团队详细介绍了他们如何摒弃更常见的扩散图像制作技术,转而采用所谓的神经辐射场(NeRF)。据《新科学家》杂志报道,这种 3D 建模依赖于神经网络,此前谷歌研究院和 Waymo 都曾利用该技术创建无缝、大规模的城市景观模型。 “通过将手部映射和射线合成策略引入 [NeRF],我们可以自然地处理交互接触,并补充双手中很少观察到的区域的几何形状和纹理,”论文摘要的一部分写道,并补充说该团队的“HandNeRF”程序兼容单手和双手交互。在这个更新的过程中,一只或两只手的多视角图像最初被“现成的骨架估计器”使用,从内部参数化手部姿势。然后,研究人员通过 HandNeRF 程序使用变形场,该程序生成我们上肢的图像结果,其形状和表面更加逼真。 尽管 NeRF 成像很难训练,而且无法单独生成完整的文本到图像结果,但《新科学家》杂志还解释说,将其与扩散技术相结合可能会为人工智能的进化提供一条新的道路。然而,在那之前,大多数程序员必须想办法解决人工智能对人类手的抓握能力较差的问题。 |
如果超级火山喷出令人窒息的二氧化碳云,即使其影响是致命和毁灭性的,地球大气层最终也会恢复正常。那么,...
有些人喜欢擦洗地板、清扫车库或清理被遗忘的书架。但对于我们许多人来说,春季大扫除是一年中最令人畏惧的...
从华盛顿特区到洛杉矶,美国各大城市都在变热。地方政府已经开始建设绿色基础设施,特别是采用行之有效的植...
AKB0048 系列 1 回顾和细节概述《AKB0048》是2012年4月29日至7月22日播出的电...
市场上有一些不错的廉价网络摄像头,但你可以自己动手,用手机代替。这需要一点设置,但现代智能手机无需额...
您真的想旅行吗?OneAir 推出了 Premium 和 Elite 终身订阅服务,通过提供无与伦比...
工业革命带来了更多的就业机会、更多的阶级流动性,但不幸的是,也带来了更多的污染。自 19 世纪中叶以...
NASA 海洋色彩是您可能不知道的项目之一。NASA白宫于周三晚间公布了 2018 财年预算提案,地...
航空学院 - 梦想天空的少年的故事《航空学院》是 2002 年播出的电视动画系列,描述了一个梦想天空...
四十年来,一项针对儿童的经典心理学实验一直在测试他们的意志力:幼儿会立即吃掉一颗棉花糖,还是会坚持吃...
随着兽医诊所和宠物美容服务机构的关闭,人们开始看到他们心爱的贵宾犬和宠物涂鸦犬变成了小棉球,而他们的...
当汽车制造商推出新车型时,外形和功能之间的平衡总是很微妙,因为创意设计师构思的奇妙造型要满足政府法规...
汽车起火是一个热门话题,尤其是起火的电动汽车。去年,通用汽车不得不召回所有 Bolt 电动汽车,因为...
无论你的任务是接听电话、玩游戏、随着鼓手的节奏跳舞还是创作自己的音乐,一副可靠的耳机都可以成为工作和...
自大约十年前首次推出以来,iPad 已经取得了长足的进步。它很快就不再只是早期的“大 iPhone”...