将强大的人工智能软件开源,让全世界所有人都能使用,这听起来像是科幻电影里的情节,但谷歌和微软近几个月都做到了这一点。现在 Facebook 更进一步,向全世界开放了其强大的人工智能计算机硬件设计。 这是一个重大举措,因为虽然软件平台确实可以使人工智能研究更容易、更可复制、更可共享,但如果没有强大的计算机,整个过程几乎是不可能的。 今天,Facebook 宣布将开放其服务器的设计源代码,并声称其运行速度是以前的两倍。新设计称为Big Sur ,除了中央处理器 (CPU)、硬盘和主板等计算机的其他传统部件外,还需要八个高性能图形处理单元 (GPU)。但 Facebook 表示,新的 GPU 尤其允许其研究人员使用两倍大小和速度的机器学习模型。 为什么重要定期处理图像或音频对于消费级设备来说可能很费力,某些类型的人工智能必须分解和学习 1000 万张图片才能从中学习。这个过程称为训练,需要强大的计算能力。 首先,让我们先了解一些基础知识——人工智能的底层可能令人生畏且复杂。人工智能是一个总称,指的是创建模仿人类思维和推理的人工系统的多种方法。实现这一目标的方法有很多;目前最流行的方法是用于深度学习的不同种类的人工神经网络。这些网络必须经过训练或展示示例,然后才能输出信息。要让计算机了解猫是什么,你需要向它展示数百万张猫的图片(尽管 Facebook 的方法已经大大减少了这个数字)。神经网络是数学单元的虚拟集群,可以单独处理像素等小信息,当它们组合在一起并分层时,可以处理无限复杂的任务。 这意味着数百万张照片、短语或音频片段需要分解,并由数百万个人工神经元以不同的抽象层次进行查看。如果我们要研究传统计算机中适合这项工作的部件,我们有两个选择:处理器 (CPU) 或图形处理器单元 (GPU)。 CPU和GPU之间的区别CPU 是现代计算机的主要“大脑”,非常适合处理一些常规计算任务。它的核心数量相对较少(消费类计算机和手机中为 4-8 个),但每个核心都具有更深的缓存,可以多次处理同一任务。它利用计算机的随机存取存储器 (RAM) 来获取其处理过程中所需的数据。 GPU 则相反。单个面向服务器的 GPU 可以拥有数千个核心,内存很少,专门用于执行微小的重复任务(如渲染图形)。回到人工智能,GPU 中的多个核心允许同时运行更多计算,从而加快整个过程。Facebook 人工智能研究工程总监 Serkan Piantino 表示,CPU 曾经是这种繁重处理的首选,但大型项目需要大量的网络芯片,比使用 GPU 计算所需的芯片还要多。 “GPU 的优势在于,在一个地方就能实现高密度计算,”Piantino 说道。“目前,对于我们关心的很多网络来说,GPU 是最好的选择。” Facebook 表示,Big Sur 可与来自不同制造商的各种 GPU 配合使用,但他们专门使用的是 Nvidia 最近发布的一款型号,Nvidia 一直大力推广其产品用于人工智能研究。在他们对 CPU 与 GPU 图像训练性能的测试中,双 10 核 Ivy Bridge CPU(读作:非常快)在 2 分 17 秒内处理了 256 张图像。他们的一款面向服务器的 K40 GPU 仅用 28.5 秒就处理了相同的图像。而 Facebook 在 Big Sur 中使用的较新型号 Nvidia 的 M40 实际上速度更快。 许多 Nvidia 设备还配备了计算统一设备架构 (CUDA) 平台,允许开发人员将 C 或 C++ 等本机代码直接写入 GPU,以更高的精度并行协调内核。CUDA 是许多 AI 研究中心(如 Facebook、微软和百度)的主要产品。 复制人类大脑?GPU 是现代人工智能的主力,但一些研究人员认为,计算的现状并不是答案。2013 年,美国联邦政府资助的 DARPA(国防高级研究计划局)与 IBM 合作开展 SyNapse 项目,目标是创建一种能够自然学习的新型计算机芯片——接收输入的行为本身就会教会硬件。结果就是 TrueNorth:一款于 2014 年发布的“神经形态”芯片。 TrueNorth 由 54 亿个晶体管组成,这些晶体管被构造成 100 万个人工神经元。这些人工神经元构建了 2.56 亿个人工突触,当接收到数据时,这些突触会将信息从一个神经元传递到另一个神经元。数据在神经元中传播,形成可以转化为网络可用信息的模式。 在欧洲,一组研究人员正在开展一个名为 FACETS(即具有突发瞬态的快速模拟计算)的项目。他们的芯片有 20 万个神经元,但有 5000 万个突触连接。IBM 和 FACETS 团队已将他们的芯片设计为可扩展的,这意味着能够并行工作以大幅提高计算能力。今年,IBM 集群了 48 个 TrueNorth 芯片,构建了一个 4800 万个神经元网络,而《麻省理工技术评论》报道称,FACETS 希望实现十亿个神经元和十万亿个突触。 即使有了这个数字,我们仍然远远无法重建人类的大脑,人类的大脑由 860 亿个神经元组成,可能包含 100 万亿个突触。(IBM 在之前的 TrueNorth 试验中已经达到了这个 100 万亿的数字,但该芯片的运行速度比实时速度慢 1542 倍,并且需要一台 96 机架的超级计算机。) Knowm 创始人兼 DARPA SyNapse 校友亚历克斯·纽金特 (Alex Nugent) 正尝试利用一种特殊的忆阻器来改变计算的未来,他表示这种忆阻器将取代依靠晶体管运行的 CPU、GPU 和 RAM。 自 1971 年计算机科学家 Leon Chua 首次提出“缺失电路元件”理论以来,忆阻器一直是科技行业的独角兽。从理论上讲,忆阻器可以替代传统晶体管,而晶体管是现代计算机的基石。 晶体管可以处于两种状态(开或关)。简单地说,计算机不过是大量在开和关之间波动的晶体管阵列。忆阻器利用电流改变金属的电阻,这为这些值提供了更大的灵活性。与晶体管的两种状态不同,忆阻器理论上可以有四种或六种状态,这使忆阻器阵列可以容纳的信息复杂度成倍增加。 生物效率Nugent 与博伊西州立大学的硬件开发人员 Kris Campbell 合作,实际创建了一种可与他所谓的 AHaH(反赫布和赫布)学习配合使用的特定芯片。这种方法使用忆阻器来模拟大脑中的神经元链。Nugent 说,忆阻器能够根据施加的电压双向改变其电阻,这与神经元传输自身微小电荷的方式非常相似。这使它们能够在使用时进行调整。由于它们的电阻充当了自然记忆,因此忆阻器将打破一些研究人员所说的冯·诺依曼瓶颈,即在处理器和 RAM 之间传输数据时产生的数据处理上限。 “AHaH 计算说‘让我们从这个构建块开始构建’,”Nugent 在接受《大众科学》采访时说。“通过基本上利用这些‘神经元’,以不同的方式连接它们,并以不同的方式配对它们的输出,你可以进行学习操作。” 这就是 Nugent 认为这项工作不仅适用于通用计算,而且专门面向机器学习的原因。 “只要你把我们今天已经可以达到的密度与忆阻器配对,将它与使我们能够使用它的理论配对,将芯片堆叠成三维空间,你就能获得生物效率,”纽金特说。“最终得到的是智能技术。” |
8 月 8 日,拜登总统签署了一项将大峡谷指定为国家纪念碑的协议,将当地印第安部落和环保主义者多年的...
无论您是经过认证的健身影响者,还是只是喜欢随意锻炼的人,廉价的蛋白粉总是好的。没有什么比健身后一瓶混...
过去 10 年里,每年 5 月,汤森路透分析师 David Pendlebury 都会坐下来仔细研究...
过去几年,“游戏机大战”的激烈程度有所减缓,因为每款游戏机的升级和更新都是循序渐进的,而不是惊天动地...
人类最好的朋友不仅仅是一句俗语——它有科学依据。至少这是本月早些时候发表的一项研究在比较狗幼崽和人类...
校园迷糊大王:第二学期 - 青春三角恋爱喜剧的续集《校园迷糊大王:第二学期》是一部于 2006 年播...
2000 年 7 月 25 日,一架从巴黎飞往纽约的协和式飞机坠毁,机上 109 名乘客和地面 4 ...
合法的无人机送货可能还有很长的路要走,但四轴飞行器多年来一直在将违禁品偷运到监狱。四轴飞行器价格低廉...
《宿がそば》——宫崎骏短篇动画的魅力与深刻的世界观■作品概要《宿がそば》是吉卜力工作室制作的一部动画...
混凝土独木舟 艾伦之子据说,希腊博学者阿基米德曾解开了浴缸浮力之谜。即使这个故事是杜撰的,但他的原理...
『向阳素描×蜂巢』——温暖又贴心的日常生活素描《向阳素描 x Honeycomb》是改编自青木梅创作...
谈论极地暴跌。本周,全美 50 个州在同一天经历了极寒天气。为今年冬天(可能)出现的极寒天气做准备已...
西班牙和美国的科学家团队从一组保存完好但受损的骨骼残骸中重建了一种已灭绝的类人猿物种的头骨。这些骨头...
“这是殭屍嗎?”第 13 集的详细评论和推荐概述“这是殭屍嗎?” ' 是一部根据木村新一所著...
《水果篮子-前奏曲》的吸引力和深度:动人的故事和人物发展《水果篮子 -prelude-》是 Ave...