几周前的一个聚会上,我接到了一项艰巨的任务,试图用图画表现“芝麻街”。我画了一个看上去最可笑的斑点,应该是大鸟,却从我的干擦记号笔上流了下来。但当我把一个卷发脸的东西放在一个看起来像垃圾桶的东西上时,有人大声喊出了答案。我们人类非常擅长猜测彼此画得很糟糕。 然而,计算机并没有那么熟练。现在,布朗大学和柏林工业大学开发了一种新算法,旨在改善这种情况。这是第一个为抽象绘画的“语义理解”而设计的计算机应用程序,研究团队表示它可以改进搜索应用程序和基于草图的界面。有朝一日,基于这项研究和其他线条画计算机识别技术,你也许可以在 iPhone 上用手指画出一些东西,并得到真正的答案。 该程序识别简单抽象素描的准确率为 56%,而人类的平均准确率为 73%。即使是那些非常缺乏逼真度的素描也能被检测到,这是这里的关键突破。计算机已经可以识别准确的素描,例如,将警方绘制的嫌疑人素描与面部照片进行比较。但对于我们成长过程中接触的抽象素描类型,这是一个不同的挑战。 想想看——如果有人让你画一只兔子,你可能会画一只长着大牙齿、大耳朵和夸张胡须的兔子。其他人很容易就能认出这种卡通形象,就像我的朋友能看懂我抽象版的奥斯卡·格罗奇一样。但它实际上与真实的东西没有任何有意义的相似之处,所以计算机根本不知道它是什么。这有点像训练沃森玩“危险边缘!”——人类可以分辨出一些微妙的技巧和含义,但对于建立在黑白、1 和 0 的世界里的东西来说,这是一个艰巨的挑战。 布朗大学计算机科学助理教授 James Hays 和柏林工业大学的 Matthias Eitz 和 Marc Alexa 着手解决这个问题。他们设计了一份人们可能想涂鸦的日常事物清单,确定了 250 个类别,并使用亚马逊的 Mechanical Turk 众包平台聘请了一些素描艺术家。他们收集了 20,000 幅独特的素描,并将它们输入现有的机器学习算法中来训练系统。该项目最终形成了一款有趣的实时计算机画图猜词游戏,其中系统会在人们画出物体时尝试识别它们。请在页面底部观看它的实际操作。 有些图画非常有价值,而许多计算机猜测则非常搞笑。您可以在此处查看整套图画。其中一些图画非常受欢迎:长颈鹿的惊人准确性、海绵宝宝的创造性以及龙虾的惊人不准确性,龙虾就像狗一样,似乎什么都长得像。 为了扩大数据集,该团队正在考虑将这一概念游戏化,使其成为可以在 iOS 或 Android 设备上玩的游戏。目前已经有了 iPhone 应用程序,您可以在此处下载。 研究人员表示,他们的目标是改进基于草图的搜索。这可以提高计算机对语言、动作或读写障碍人士的可访问性——而且它还可以用于任何语言。该团队上个月在 SIGGRAPH 上展示了他们的项目。 [布朗大学供稿] |
这篇文章已更新。它最初于 2020 年 6 月 8 日发布。戴上一副好耳机,你的音乐会听起来很棒……...
亿万富翁埃隆·马斯克迫切希望启动他的超高速超级高铁城际交通系统。马斯克今天早上在推特上宣布,他“刚刚...
在流媒体时代,人们很容易忘记电影仍然以光盘形式发行,而 4K 蓝光播放器将提供比流媒体服务高得多的保...
魔法科高中的劣等生 - 轻松理解的魔法科高中! - OVA 评论和更多信息《魔法科高中的劣等生:轻松...
大麻的纤维表亲麻与汽车制造商有着悠久的历史。1941 年,亨利·福特推出了一款主要由有机纤维制成的汽...
本文最初由 Grist 发布。请在此订阅 Grist 的每周新闻通讯。当约翰尼·阿普尔西德走遍美国早...
RE:cycle of the PENGUINDRUM - 剧场版 企鹅鼓的循环概述《RE:cycl...
想象一下,你正在公园里散步,突然有成千上万辆大众甲壳虫汽车从空中落下。它们下落的速度是你奔跑速度的五...
札幌少女食品。第三季 - 美好回忆和全新挑战札幌少女食品。第三季是改编自松本彩香的人气漫画的电视动画...
佐治亚理工学院正在为第 27 届古斯曼乐器大赛做准备,并正式宣布了入围决赛的名单,这些入围作品突出了...
《En》:标志着日本动画黎明的杰作1. 工作概述《丸》是一部1932年上映的日本动画电影,因其历史意...
一只名叫 Chevy 的黑白波士顿梗犬,像穿着燕尾服的海豹一样光鲜亮丽,轻快地走进隔音测试室。当一组...
Jackery 在我们的太阳能发电机和便携式电站产品测试中经常名列前茅。目前,许多最受欢迎的型号在亚...
江户火箭 - 娱乐的永恒魅力2007 年播出的电视动画《江户火箭》改编自剧团新干线的舞台剧,由水岛诚...
本周末,由编剧兼导演里安·约翰逊( 《追凶》 、 《布鲁姆兄弟》)执导的一部充满张力的穿越惊悚片《环...