2007 年 11 月,谷歌发布了开源手机操作系统 Android,为主导移动市场奠定了基础。八年后,Android 的市场份额达到 80%,谷歌也使用了同样的伎俩——这次是人工智能。 今天,谷歌宣布推出其机器学习开源平台 TensorFlow,任何人只要有电脑和网络连接(以及对深度学习算法有一定了解),即可访问有史以来最强大的机器学习平台之一。50 多种谷歌产品已采用 TensorFlow 来利用深度学习(使用深度神经网络的机器学习)作为工具,从在照片应用中识别您和您的朋友到改进其核心搜索引擎。谷歌已成为一家机器学习公司。现在,他们正在将其服务的独特之处带给全世界。 介绍 TensorFlow,AI 的 AndroidTensorFlow 是一个文件库,它允许研究人员和计算机科学家构建系统来分解数据(如照片或语音记录),并让计算机根据这些信息做出未来的决策。这是机器学习的基础:计算机理解数据,然后利用数据做出决策。当规模变得非常复杂时,机器学习可以尝试让计算机变得更聪明。这是人工智能中更广泛、定义更模糊的领域。TensorFlow 非常复杂,因为它在消化和输出数据方面非常精确和快速,可以毫无疑问地被归入人工智能工具的范畴。 以下是具体细节:TensorFlow 系统使用数据流图。在这个系统中,具有多个维度(值)的数据从数学计算传递到数学计算。这些复杂的数据位称为张量。数学位称为节点,数据从一个节点到另一个节点的变化方式说明了数据中的整体系统关系。这些张量流经节点图,这就是 TensorFlow 这个名字的由来。 当然,开源 TensorFlow 让研究人员甚至研究生有机会使用专业软件,但真正的效果是有可能为所有机器学习公司的研究提供参考。现在,各种规模的组织——从小型初创公司到与谷歌相当的大型公司——都可以采用 TensorFlow 系统,根据自己的需求进行调整,并用它来直接与谷歌竞争。最重要的是,此次发布让世界上最大的互联网公司在人工智能方面拥有了权威。 斯坦福大学计算机科学教授克里斯托弗·曼宁 (Christopher Manning) 在三个月前获得了 TensorFlow,他的学生有机会试用该系统。在亲自使用了几周后,曼宁决定将其纳入自己的课程。 除了 Android,他还将该平台比作谷歌无处不在的电子邮件应用程序 Gmail。Gmail 有竞争对手,但 Gmail 更简洁,在大多数应用程序中更有意义。 “这并不是说在此之前没有任何可用于深度学习的高级库,”曼宁说。“但一般来说,这些其他库都是由三位学者和一位研究生开发的。” 虽然其他的,尤其是 Torch 和 Theano,确实有小团队在更新,但与谷歌机器学习基础设施上的所有开发人员相比,还是差远了。曼宁说,虽然 TensorFlow 对社区来说是一份巨大的礼物(能够将优化神经网络的时间减少 100 倍),但他们可能会间接受益于开源他们的工具。 “极少数公司一直在试图聘用大量人工智能领域的人才,尤其是深度学习领域的人才,”曼宁说。“谷歌不是慈善机构,我相信他们也想到了,通过放弃这一点,我们将拥有大量进入大学的博士生,他们已经喜欢上了谷歌的深度学习工具。” Jeff Dean 是 Google 的顶级工程师之一,也是 TensorFlow 的两位作者之一(另一位是 Rajat Monga),他对估计社区的采用情况持谨慎态度。他说,虽然 Google 发现 TensorFlow 在自己的工作中非常有用,但真正的考验是社区是否会发现它的功能。我们的想法是提供一种工具,这样整个社区就能够更快地从想法转向实际实施。 “我们希望加速机器学习的研究和部署,”Dean 说道。虽然这是对社区的一份大礼,但理想的情况是社区回馈社会,与其他研究人员(以及谷歌)分享他们的成果。“机器学习社区非常擅长完善想法,这是一件非常好的事情,但这与完善与研究想法相关的工作代码是两码事,”Dean 说道。 他还提到,TensorFlow 将为谷歌实习生返回学校后提供帮助,因为他们现在可以访问他们在公司任职期间可能未完成的项目的曾经专有的系统。 对于个人研究人员来说,TensorFlow 系统是一个非常完整的软件包。该系统是一个完整的独立库,与工具和 Apache 2.0 许可证相关联,因此可以在商业环境中使用。它可以在台式机或笔记本电脑上编译,也可以部署在移动设备上(当然,首先是 Android,然后是 iOS)。它还附带有关如何修改和使用该平台的教程和文档。 曼宁认为,在移动设备上运行深度学习算法的能力将成为 TensorFlow 与其他开源系统区别开来的重要因素。 对于那些想要按原样使用该系统的人,谷歌提供了一个研究人员可以立即开始使用的版本(作为预构建的二进制文件)。还有一个应用程序编程接口(API),供软件开发人员训练和控制他们的 TensorFlow 模型。这不是山寨产品——它是谷歌应用程序和 50 多种其他产品中使用的字面系统。 谷歌人工智能实验室内部谷歌正在向全世界开放这个平台,这给了我们平等的机会去了解该公司如何思考开发机器学习系统。 在内部,谷歌在过去三年中一直在构建一个庞大的人工智能平台,现在他们正在向世界推出它。不过,谷歌更希望你称之为机器智能。他们认为人工智能这个词有太多内涵,从根本上说,他们试图创造真正的智能——只是在机器中。 这是他们在公司内部使用多年的模型:任何想要使用人工神经网络的工程师都可以将其从系统中分离出来并进行修改。这种开放式结构允许公司内的 100 个团队构建强大的机器学习技术。 “机器学习是一种核心的、变革性的方式,通过这种方式,我们可以重新思考我们做每件事的方式,”谷歌首席执行官 Sundar Pichai 在 2015 年 10 月的公司财报电话会议上表示。“我们正在精心地将它应用于我们所有的产品,无论是搜索、广告、YouTube 还是 Play。虽然我们还处于早期阶段,但你会看到我们以系统的方式将机器学习应用于所有这些领域。” 欢迎来到谷歌,这里一切都是人工智能,人工智能就是一切很难绘制出谷歌机器智能研究的具体图表,因为它总是在变化,并且渗透到公司几乎每个团队。 谷歌工程副总裁 John Giannandrea 将此称为“嵌入式模型”。2015 年秋天,我在阳光明媚的加利福尼亚州山景城谷歌总部的众多时尚现代建筑之一中见到了他。 我所在的楼层严格意义上来说不对公众开放,当我被单独留在那里片刻后,一名工程师向我走来,注意到我没有佩戴员工徽章。他问我是谁,说我是一名作家,但这并没有平息事态。谷歌以向公众开放其研究成果而自豪,但实验室的工作却被严格保密。 对我来说,谷歌的嵌入式模式意味着要走很多路。谷歌总部占地约七英亩,办公空间达 350 万平方英尺。谷歌员工骑着自行车往返于大楼之间,大楼周围是精心修整的公园,谷歌员工坐在那里,拿着笔记本电脑,毫无疑问,他们在午休时间里努力解决复杂的计算机科学难题或玩 Minecraft。不同的团队在不同的大楼里工作,嵌入式机器智能研究人员在换团队时也会换大楼。 里面,我看到的大部分东西看起来就像一栋普通的办公楼。里面有隔间、带大量显示器的电脑,还有人一边低声讨论工作,一边紧张地看着记者。墙上有洞,可以让人小憩一会儿——你知道,办公室里的东西。 从组织上看,有一批研究人员一直在研究一般的机器智能问题,而这些工作会反馈到 Google 的核心产品中,例如照片应用、语音搜索和搜索本身。有些项目最初只是 Google 想要改进的某项技术。Giannandrea 举了手写的例子。 “作为一家公司,我们希望了解人们如何书写单词。因此,即使我们没有产品,我们也会永远投资于此,”他说。 但由于 Google 的产品种类繁多,因此通常会有一款工具可以使用每个研究元素。(手写功能最终出现在笔记软件 Google Keep 中。) 当确定了用途后,研究人员就会加入产品团队,帮助实施。产品团队开发我们都使用的特定应用程序,例如照片应用程序或 Google 翻译。 在一般研究中,团队按其感兴趣的领域进行划分。有的团队专注于教计算机看,有的团队致力于理解语言,有的团队致力于提高语音识别能力,等等。 Giannandrea 表示:“谷歌希望拥有更好的语音识别、语言翻译和语言理解技术,因此我们一直在投资这些计算机科学研究的前沿领域。” 谷歌有 1000 多名研究人员致力于这些机器智能应用,他们不断在应用研究和理论研究之间轮换。其中一些研究人员研究的问题比较简单,从最严格的意义上讲,这些问题不算是人工智能,而更多的是统计预测方法。 据谷歌发言人 Jason Freidenfelds 称,谷歌的新母公司 Alphabet 不会对谷歌机器智能研究的继续发展产生重大影响。虽然研究团队仍将留在 Google Proper 内,但与 Life Sciences 或 Google [x] 合作开发机器学习应用不会有任何障碍。 未来之声语音搜索是 Google 工具目录中的一颗冉冉升起的新星。即使您不知道它到底是什么,您以前可能也遇到过它:它是 Google 主搜索栏中的小麦克风图标,按下它后,您可以向 Google 说出您的搜索查询,而不是直接输入。同样的小麦克风也出现在 Google 的 iPhone 和 Android 搜索应用中,并且可以在许多智能手机的 Android 搜索栏中找到。 尽管表面上谷歌语音搜索被认为是 Siri 的竞争对手,但实际上它已经成为谷歌庞大知识库的第二门户,让语言识别团队高兴的是,它终于变得更受欢迎了。 尽管谷歌没有公布语音搜索相对于文本搜索的百分比,但它确实提供了一个真实的统计数据:移动搜索现在比桌面搜索更受欢迎,移动语音搜索在去年翻了一番,大约 50% 的美国手机和平板电脑用户知道他们可以向谷歌提问,其中三分之一的用户实际上这样做了。 这是一个很长的句子,虽然谷歌不会透露进行了多少次语音搜索,但谷歌的新闻团队向我保证,数量很多。 除了每年几百次算法迭代之外,搜索多年来的运作方式基本相同。但让人们有足够的信心用他们的设备说话一直很困难。 高级研究员 Françoise Beaufays 致力于开发语音搜索背后的语音识别引擎,他表示采用率的提高是因为该功能现在运行得更好。 “当我们开始做语音识别时,用户并不完全有信心。他们在使用它,但你可以看出他们有犹豫,当时的技术不像现在这么好,”Beaufays 说。“快进到现在,人们可以轻松地在办公室用语音做任何可能的事情。” Beaufays 说话很快,带有法国口音,并且精通三种语言——此外,她还精通神经网络架构。她领导的语音团队刚刚拆除了用于识别声音的旧引擎,并将其替换为使用新品牌循环神经网络的更先进的新系统。 为了让机器理解语音,它首先需要了解单词和短语的发音。这意味着需要大量的音频文件。这些文件由算法处理,算法会创建一个巨大的图表,其中显示哪些声音与哪些声音、单词和短语相关。当音频片段呈现给计算机时,它会通过将音频波形推过图表来分析该片段,以尝试找到最能解释音频的路径。 “这条路径最终会说,‘我们经历了这个声音序列,并将其映射到这个单词序列,并构成了这个句子,’”博费斯说。 但这一切都依赖于那些初始音频文件,也就是所谓的训练数据。这些训练数据实际上是由谷歌用户的数百万次真实语音搜索组成的。每当你进行语音搜索时,音频都会上传到谷歌服务器,如果你选择让谷歌使用它,它可以被整合到用于训练机器的剪辑库中。 但在使用之前,数据要经过几个步骤。首先(对你来说最重要的是),它会清除你的所有信息。这意味着时间戳、位置数据、你的用户资料,一切。然后,原始波形被发送给人工转录员,因为算法需要可靠的文本与剪辑相关联。每个剪辑都需要这种元数据,“坏”剪辑实际上就是没有正确转录的剪辑。甚至有研究人员添加人工噪音的情况,以便机器理解不同单词在不同情况下的发音。 Beaufays 强调,该计划是可选的。这一点很重要,因为随着 Google 继续收集有关世界和我们生活的更多信息,隐私问题(这是合理的)经常出现。但如果你不想让 Google 使用你的声音,你不必让它使用。此外,事后还有办法删除你的搜索记录。 但这些技术让语音搜索变得更加有效。据谷歌称,两年前语音搜索的错误率为 25%,这意味着每四次搜索中就有一次是错误的。现在,这个数字已经下降到 8%。 但是当谷歌无法根据你的数据进行训练时会发生什么呢? 智能收件箱上周,谷歌宣布它开始在您的电子邮件中使用机器学习(如果您使用独立于 Gmail 的 Inbox 应用程序),是的,它是基于 TensorFlow 构建的,Gmail 产品总监 Alex Gawley 说。 “我们开始看到我们研究团队正在构建的神经网络的一些强大功能,”Gawley 说。“我们可能不仅能帮助理解和组织,还能帮助完成诸如写邮件之类的事情。” 这项功能称为“智能回复”,基本上就是一个循环神经网络读取你的电子邮件,然后将其交给第二个神经网络,后者会生成三个可能的回复。你选择,然后电子邮件就会发送。但电子邮件的敏感程度与照片一样,在某些情况下甚至更高。 记住,谷歌不会有人阅读你的电子邮件。但是,你做出的选择的数据会被发回给全局模型。这就是它学习的方式。通过这种方式,研究人员可以让机器回答某些问题,然后了解神经网络中可能需要修复的地方。软件对每个人来说都是一样的,这一点很重要。 智能回复还让我们一窥谷歌内部机器学习产品的构建方式。Inbox 团队在内部部署了这项功能,以测试并向机器灌输一些正确和错误的想法,这一过程称为 dogfooding。(这个短语源于吃自己的狗粮的想法,也是科技为何奇怪的一个例子。) 整个团队都在使用它,记录错误,并向它提供越来越多的信息。当应用程序在受控环境中正常运行并且可以扩展时,它就会发布。 内部测试让研究人员有机会预测神经网络在接触大量数据时可能出现的错误。例如,起初智能回复想告诉每个人“我爱你”。但那只是因为在私人电子邮件中,“我爱你”是一个非常常见的短语,所以机器认为它很重要。 这一切都是为了让你的工作更轻松——这也是该公司大多数产品的目标,尤其是 Google Now,它是 Google 世界的个人助理。该团队的口号是“在正确的时间提供正确的信息”。Google Now 负责人 Aparna Chennapragada 表示,在将机器智能嵌入平台时需要经过深思熟虑,以补充人类大脑。 “你应该选择那些对人类来说很难、对机器来说很容易的问题,而不是相反,”Chennapragada 说。“这是为了让技术为你完成繁重的工作,而不是你自己做。” 目前,该产品实际上只是在探索如何使用这些方法让你的生活更轻松。Chennapragada 将其比作 5 年前语音识别研究的现状——虽然还不错,但并不是每次都有效。 他们现在正在研究如何利用三种不同的数据来为你提供零碎的信息。他们认为手机是一种“部分注意力设备”,理想的服务不应该让你承受过多的信息。 “如果你观察一下我们每个人如何使用手机,就会发现它就在你生活中的各种事情之间。它就是你正在寻找的一小段信息,”Chennapragada 说。“我们考虑的事情之一就是我们如何能够始终主动地为你服务。” 这就是具有机器智能的智能手机的最终目标:真正的数字个人助理,最终具有预测能力和广博的知识——这是你大脑中并非与生俱来的那部分。 因此,为了实现这一目标,你的手机需要你的数据:你的日程安排、你搜索的内容、你听的音乐以及你去过的地方。这是最容易获取的信息,因为它已经存储在设备上了。 但当你通过 Google 的知识图谱(稍后会详细介绍)和来自其他用户的数据将个人信息与有关世界的知识结合起来时,世界就触手可及了。你可能不知道如何在机场导航,但你的手机知道。 谷歌利用大量用户数据的另一个例子是测量道路交通状况。通过从高速公路上的手机中提取匿名位置数据,谷歌可以判断汽车行驶速度比平时慢。同样,谷歌还可以判断餐厅或咖啡店何时人流较多。 Google Now 代表了 Google 对待机器智能的方式。他们意识到,能够翻译并告诉你图片内容的通用智能模型还需要很多年才能问世,因此,他们正在创建一套能够协调运作的工具组合,以提供尽可能最佳的体验。 整合全球信息好的,我之前提到过 Google Now 可以与 KnowledgeGraph 配合使用。那是什么? 谷歌前研究主管 John Giannandrea 于 2010 年加入谷歌。他创立了一家名为 Metaweb 的公司,该公司将互联网上的文本和对象关联起来。这与搜索在逻辑上是平行的——不仅能找到东西,还能找到类似的信息片段。他之前就从事过这个问题的研究,当时他是 Netscape 的首席技术官。(还记得 Netscape 吗?) 但这一切都体现在 KnowledgeGraph 中,它于 2012 年首次亮相,当你搜索事实时,它会自动弹出一些信息和文本。如果你搜索“Popular Science 是什么时候创立的?”Google 会提供答案(即 1872 年)。 谷歌不仅通过这种方式对互联网进行分类,还让互联网对用户来说更易于访问和实用。这也是人工智能首次渗入其主要产品——搜索。从那时起,谷歌就将其 15% 的每日搜索流量交给了名为 RankBrain 的人工智能模型。该系统是搜索的常识——它旨在捕捉传统算法无法理解的查询。 除了将其集成到核心搜索算法中并扩展到产品之外,Google 还准备了一些新计划。为此,他们依靠杰夫·辛顿。 Hinton 是人工智能领域的顶尖思想家之一,人们经常将他与其他高级研究人员相提并论,比如 Facebook 的 Yann LeCun、谷歌的 Andrew Ng 和 Yoshua Bengio。(事实上,LeCun、Hinton 和 Bengio 今年 5 月在《自然》杂志上发表了一篇关于深度学习的评论,读起来就像是人工智能的教科书。) 与 Hinton 交谈就像与生活在五年后的人交谈。我们的谈话围绕着将文档转化为思维向量展开,这样机器就可以理解和记住冗长的版本,并对我们的大脑学习算法进行逆向工程。 例如,当今许多计算机程序通过查找文档中单词的字典定义和语法来强行分析文本文档的含义。但为了像人类一样理解文档,计算机最好能够将文档分解为一系列不同的思想。 “谷歌希望能够读取一份文档,并找出其中的推理、文档的内容以及一个想法如何从之前的想法中得出,”Hinton 说。“如果我们能够开始这样做,那么它就可以为你提供更好的查询答案,因为它实际上会读取文档并理解它们。” 当被问及为什么我们还没有这样做时,Hinton 说,如果我们试图将理解能力与大脑相匹配,那么这是一个规模问题。研究人员现在使用的人工神经网络根本无法达到我们大脑的复杂性,即使扩展到目前的极限也是如此。我们拥有的最好的神经网络可能有数亿个可以操纵的权重(LeCun 用黑匣子类比,黑匣子外面有一百万个旋钮来解释如何摆弄权重。)但 Hinton 解释说,我们的大脑有 100 万亿个权重——也就是多 10 万倍的信息。 尽管规模不大,但 Hinton 仍然乐观地认为,人工智能研究的这股热潮不会像过去那样逐渐消退。(人工智能研究也曾经历过“寒冬”,进展未能达到预期,投资也逐渐减少。)其中很大一部分原因是前面提到的思维向量概念越来越受欢迎。但最让 Hinton 感到欣慰的是过去五年的进展,尤其是物体识别和语音。这些问题在过去常常被认为过于复杂,而现在标准化测试中的错误率已大幅下降。 “它们的表现正在接近人类水平。虽然不是在所有方面,但物体识别等方面都如此。几年前,计算机视觉专家会告诉你‘不,你多年内都无法达到那个水平。’所以这就是我们乐观的理由,”Hinton 说。 但无论机器如何完美地补充或模仿人脑,如果普通人无法弄清楚如何使用它,那就毫无意义。这就是谷歌主宰人工智能的计划——让它尽可能简单。虽然幕后的阴谋复杂而动态,但最终结果是无处不在的工具,以及改进这些工具的手段(如果你愿意的话)。 “魔法与神秘之间的界限非常模糊,”Google Now 的 Chennapragada 说道,“而我们希望能够站在正确的一边。” |
>>: 这些无气自行车轮胎采用专为 NASA 探测车设计的金属合金
在当今不断扩展的数字环境中,一台可靠的计算机比以往任何时候都更加重要。然而,新台式机和笔记本电脑的高...
当拖车终于停下来时,佩平已经在加拿大艾伯塔省家附近的高速公路边等了一个多小时。司机看着这位被困的电子...
洋基烈武士:一部关于斗争与信念的青春剧概述《Yankee Repputai》是根据元桥雅秀的漫画改编...
点击此处进入画廊160 年前的今天,世界上第一台电梯安全制动器的发明者伊莱沙·奥的斯创立了奥的斯电梯...
随着 OpenAI 的 ChatGPT 和谷歌的 Bard 等公司的出现,科技行业领导者正在继续向消...
半个世纪前,当美国宇航局的土星五号火箭将人类送上月球时,每次发射都以其威力让旁观者惊叹不已。发射时产...
我们的早期人类祖先是一群非常忙碌的人,他们在葡萄牙的洞穴中烹饪棕色螃蟹,掌握射箭技术,甚至开始编织。...
在撕碎包装纸、弄坏蝴蝶结、将五颜六色的纸巾散落在地板上之后,送礼的欢乐季节正式结束了。虽然我们的手臂...
《教教我北斋!-动画版-》的魅力与评价《教教我吧,北斋!-动画-》是一部网络动画,于 2021 年...
电影《Argonavis AXIA》的全面评论和推荐概述2023年3月24日上映的《阿尔戈纳维斯 A...
梦见童子 (Yumemi Doji) 的魅力和声誉概述《梦见童子》是一部由东映制作的动画短片,于 1...
以下是本周无人机热门新闻汇总,旨在捕捉无人机的军事、商业、非营利和娱乐应用。无人机狂欢节有人在芝加哥...
埃尔梅罗二世勋爵事件簿 铁轨齐柏林 Grace Note 的魅力与评价《君主·埃尔梅罗二世事件簿:铁...
您是否计划在树林中迷路,这样就没有人能听到您的求救声?当然您没有。这就是为什么这位 DIY 爱好者(...
“一名普通的高中女生尝试成为当地偶像。” 《Vol.2》的号召力与评价“一名普通的高中女生尝试成为当...