问答:Stephen Wolfram 谈论大数据的力量和挑战

问答:Stephen Wolfram 谈论大数据的力量和挑战

在忙碌地整理我们称之为“数据时代”的特别专题的过程中,高级副主编 Ryan Bradley 注意到 Stephen Wolfram 已经创建了数据历史进程中重要里程碑的时间表。我们认为这将是一个极好的背景粘合剂,可以应用于我们对数据蓬勃发展的力量的分析,这些数据被很好地运用,既照亮了我们的世界,也影响了我们的世界。幸运的是,Wolfram 同意了,时间表就像结缔组织一样沿着我们杂志的底部延伸。当时,Wolfram 即将在华盛顿特区举办第二届年度 Wolfram 数据峰会,数据库管理员、供应商和开源专家将齐聚一堂,讨论如何最好地培养、处理和释放我们几何级增长的数据宝藏。Wolfram 的数据处理答案引擎 Wolfram Alpha 是一个雄心勃勃、乐观向上的企业。它结合了他自己的Mathematica软件的算法能力和强大的数据管理能力,回答了用户可能甚至没有意识到自己在问的问题。我想和他聊聊数据会很有趣。

通话持续了大约一个小时 45 分钟,从我感谢他允许我们利用他的策展技巧,到询问他是否同意我们关于大数据蓬勃发展的主张,再到沃尔夫勒姆描述他对宇宙起源和规律的算法追求,基本上是对自然界辉煌而不可简化的复杂性(而不是人类工程的迭代式简单性)的混合注释。很有趣。我已经编辑了完整的记录以使其更清晰,并为您略微缩紧,但除此之外,我认为值得一读。祝您旅途愉快。

MARK JANNOT:首先,感谢您允许我们在数据专题中使用您的时间轴。我们将其用作一种有用的工具,引导读者顺利浏览整个专题,并以良好的方式将本期内容整合在一起,所以这真的很棒。

斯蒂芬·沃尔夫拉姆:我一直认为系统数据对文明进步很重要,但我不得不说,当我们把海报放在一起时,我真正意识到,正是因为有关于这个或那个的系统数据,或者人们可以依靠可用的数据,文明的重要方向的形成才得以实现。当然,由于收集了大量数据,历史上也发生了一些不好的事情,但我喜欢看到积极的进展。

您是否选择忽略时间线中的负面内容?

我对历史并不是很了解,但是一旦你能对人口进行人口普查,你就可以决定,我们不喜欢他们是谁,我们可以根据人口普查找出他们在哪里。

我想,任何事情都是如此——任何能带来进步的事物都会让我们遭受滥用和负面结果。我们发表的一篇文章是关于阿尔伯特·拉斯洛·巴拉巴西 (Albert-László Barabási) 以及他目前对枢纽和节点的思考的影响,以及了解哪些是行动枢纽和节点。一旦你知道了这一点,你就可以利用这些知识来控制那个系统,当然,虽然可以预见这样的事情会带来很多积极的结果,但你也可以很容易地想象所有潜在的负面后果。

我参与了这方面的两个方面。一个是数据作为内容,另一个是数据所代表的大量事物的科学。在这两个方面,我都看到了这些事情:人们担心了解恐怖组织如何建立的网络,了解网络如何弄清楚如何通过只针对重要人物而不是追随者来最小化营销预算,诸如此类的事情。我只是好奇,你在数据问题中都涵盖了什么?

所以,我首先要抛开这个观点,即数据收集、存储和处理能力的指数增长曲线已经将我们带入了真正的范式转变时刻,即数据既可以帮助我们理解世界,又可以改变世界。你同意这个观点吗?这与你自己在数据和计算方面的工作有何关联?

这里有几个不同的分支。首先,说到数据,当今世界的数据来源是什么?一个数据来源是人类汇编的数据——人口普查数据、化学物质特性数据。这主要是人工汇编的数据。如今,许多不同领域都有非常庞大的数据存储库。其中许多是在 30 年前开始的,并且一直在逐渐建立。这些数据存储库最初是由第一台大型机和后来的几代计算机的存在而实现的。这让很多人真正开始着手创建这些数据存储库。因此,数据的第一来源是人类的数据聚合。另一个刚刚大规模上线的数据来源是传感器数据。目前,存在某种公共传感器数据,无论是来自世界各地的地震仪还是交通流量传感器,还有许多基于传感器的私人数据,人们将其用于自己的目的。这导致了大量同质数据。它是“这条河的水位随时间的变化,过去每分钟都是如此。”

每个传感器数据组中的数据都是同质的,但是跨传感器数据集的数据不一定是同质的,从而可以进行跨计算?

没错,但每个单独的数据点都不需要额外的努力来收集。第三个数据源本质上是从计算宇宙生成的数据——也就是我们可以通过算法去解决的东西。运行这些算法并解决问题可能需要付出很多努力,但一旦解决了,我们就可以将其存储起来并用作数据。我们制作了这些巨大的数学函数属性表等,每个条目都需要付出很多努力才能生成,但一旦生成,它就是你可以使用的东西。我认为,从实践层面上讲,这些都是数据来源。现在的问题是,人们如何处理这些数据?我认为,这就是原始数据本身——专家可以利用原始数据本身;其他人通常不想要真正的原始数据。他们通常希望根据这些数据回答一些问题,为此,你真正需要的不仅仅是数据,还有知识,以及根据这些知识回答问题的能力。

几年前在 TED 上,蒂姆·伯纳斯-李带领观众高呼“现在要更多原始数据!”,所以他正在努力创建数据网络。你在 Wolfram Alpha 中的项目不是提供原始数据,而是提供允许将原始数据转化为意义的界面。

是的,我们正在尝试做的是——就我而言,所有这些数据的伟大之处在于,它有可能回答许多有关世界的问题,并预测世界上可能发生的事情,等等。但可能如何实现呢?专家可能会说:“好吧,天哪,我们有这些数据,我们知道某天的天气情况,我们知道某地的经济状况,所以现在我们可以从中找出一些东西。”但我感兴趣的是,人们是否能走到电脑前,基本上就能说:“好吧,回答我这个问题。”

因此,当你有问题时,你不必想出非常复杂的方法来处理原始数据,你知道的——找到数据,然后处理数据。它会神奇地自动处理。

是的。比如说,你正在尝试从我在地球上的位置找到月球现在的位置。现在,有基础数据。它是月球轨道的轨道元素,它是纬度/经度,它是各种时区数据,诸如此类。但是,应用这些轨道元素并找出“好的,使用这些坐标系我们可以计算这个东西等等”还有一定距离。这是一类事情。另一类事情可能是,嗯,你知道某个东西的价值,你知道一些经济指标,你知道某个国家的人口,那么,你可以得出人均数据,你可以将其与世界上其他所有国家进行比较。在第二种情况下,它几乎是一种更浅显的算术,而在第一种情况下,它涉及一些物理学,需要实际进入并从原始数据中进行计算并回答你想要回答的问题。告诉人们“这是人造卫星轨道元素表”是一回事。好吧,这很好,如果你碰巧上过一些天体力学课程,那么你就可以由此推算出国际空间站现在的位置。这有点像数据之外的额外计算步骤。所以在我看来,数据是底层,我们可以从中了解世界。实际上,需要两件大事:数据和算法。所以在人造卫星的例子中,数据是:轨道卫星的元素是什么?然后有一个算法,即:卫星如何在引力场中传播,并得到我可能会问的“卫星什么时候会再次升起”这个问题的实际答案?

对于我们来说,在试图了解如何使用数据时,还有另外两个问题。一个是,这些数据是存在的,但我如何实际访问、如何请求数据?下一个问题是,可能有关于某个特定城市规模的数据,但我说的是哪个城市?因为这个城市可能有俚语名称,可能有标准的官方政府名称,等等。我实际上如何引用事物?这不是原始数据的一部分。这不是传感器会为你拾取的东西。正是这种奇怪的东西将数据与我们的人类经验和我们引用事物的方式联系起来。

机器智能作为我们和数据之间的中介,需要理解我们的语言才能帮助我们访问数据。

我们必须以人类能够吸收的方式将这些知识传授给人类。而这需要对人类吸收信息的方式有一定的了解。它需要向我们学习。传感器本身可以收集所有它们能够收集到的数据,但除非我们的系统能够理解我们想要什么,否则我们无法连接这些数据。关于所有这些数据的另一点是,你通常可以生成大量结果、大量答案,那么问题就是,你如何呈现这些东西?这是另一件以人为本的事情。有人可能会说,好吧,这是一个结果;这是一个巨大的网络,里面有上百万个节点,就像一根微型意大利面条,但没有人能够以任何有意义的方式吸收它。我们必须以人类能够吸收的方式将这些知识传授给人类。而这需要对人类吸收信息的方式有一定的了解。这是原始数据之上的另一个元层,那么应该如何将其呈现给人类呢?在 Wolfram Alpha 中,我们发现一件有趣的事情是,我们做过实验,我们说,让我们给人们答案——一行答案。人们会问这样的问题:“意大利的 GDP 是多少?”答案是肯定的。它是一个数,以万亿美元为单位。但事实证明,人们实际上不只是想要答案。他们更感兴趣的是情节——这个数字的历史是什么,这个数字在世界各国中的排名是多少,这个数字与当地货币的换算是多少?人们会迅速吸收他们需要的周围环境,以吸收信息。

但你如何定义周围环境的界限呢?你可以继续朝那个方向走下去,走得太远,以至于我们不可能再从那些灌木丛中走出。

是的。例如,在 Wolfram Alpha 中,我们付出了很多努力,试图说,好吧,你首先要展示什么其他东西?然后你按下“更多”按钮,你会看到更多,你一次又一次地按下它,然后你点击链接,继续前进。所以这是最重要的事情,接下来最重要的事情是什么。这些都是元信息,是计算知识传递的一部分,而不仅仅是底层的原始数据。

关于如何呈现信息(焦距应该是多少)的决定是否需要由人类做出,或者它们可以在一定程度上实现自动化?

我们已经设法将它们自动化了一点。有一些特定的标准,例如,当你制作一个图表时。我们试图从人类的经验中抽象出,制作一个好看、易于理解的图表的设计原则是什么?然后我们可以自动应用这些设计原则。例如,当你布局一个网络,显示这个与那个相连,我们几乎完全自动化了布局的过程,我记得几年前,我曾经让人类尝试为我做这些布局,如果你知道这个与那个相连,那么做一个好的布局是相当困难的。事实上,我记得自己曾经做过很多大布局,你真的拿到几根绳子,然后把东西摆放好,放在不同的地方,有时看起来不错,你可以理解,有时却不行。这就是我们完全掌握的一个例子。我们完全自动化了这个过程。

那么首先要弄清楚什么才是好的图表呢?

好吧,人们可以推测出一些原则,说明什么会使它变好,什么不会使它变好。如果愿意的话,人们可以去把这些东西与人类认知的某种理论联系起来。我所做的通常比这更务实。从人们所了解的人类认知中获取一点信息,然后说,这些是设计规则;现在想办法创建一个算法,产生满足这些设计规则的视觉输出。在这个层面上,你可以问一个问题,比如,当你输入一些数量,比如 235 英寸时。问题是,根据 235 英寸,你想知道什么。你可能想把它转换成英尺,你可能想把它转换成米,你可能并不特别在意把它转换成微米。问题是,你如何知道人类希望把它转换成什么。在那个特定案例中,我们找出许多不同种类单位的方法是查看网络和学术文章等,然后对整个事物进行分析,我们查看人们谈论英寸、米、厘米、微米、纳米等时,他们是否说 1000 万纳米?可能不会。他们是否说 230 纳米?当然。事实证明,通过查看该数据集(即网络),您可以推断出一个分布,了解人们如何谈论单位之类的东西。

我想,在 235 英寸的情况下,人们将其输入到像你们这样的计算引擎中的可能性有多大?我认为说“235 英寸等于多少米”或类似的话更自然。令人震惊的是,他们没有更进一步。

事实并非如此。他们不知道。因为如果你仔细想想,就会发现某个数字是 235 英寸。然后你会问,这到底是多少?所以你输入它,我们会告诉你它是英尺、米、厘米或码的某个数字,他们会说,这就是我需要知道的。

因此,以米为单位来表示超出了他们想要知道的理解范围。

例如,假设他们正在阅读《大众科学》杂志上的一篇文章,上面说某某东西是某种尺寸,某种升数之类的。然后人们说,那是什么?然后他们输入,点击链接,结果显示它实际上也是 22.3 加仑之类的。好吧,也许我们也会生成这些比较,比如某某乘以可乐瓶的实际大小。现在他们会说,哦,现在我明白了,我可以做点什么了。这就是将原始数据与我们人类实际拥有的知识图谱联系起来。真正的问题是你如何将真实数据转化为对人类有用的东西,人类可以吸收的有用的东西。其中一件事是你必须从原始数据中计算出一些东西。另一件事是你必须提供与人类非常匹配的计算结果。

在我看来,让数据为人类所理解所涉及的问题范围或数量实际上是无限的。找出人们需要翻译事物的方式以使其易于理解,这项任务似乎非常费力。

你必须考虑世界上有多少种事物。有多少不同的知识领域?例如,像我这样处理数据的人,我可以告诉你一些随机事实,比如世界上有六百万条街道,一家典型的杂货店有三万种商品,我可以读出很多这些东西,但这些领域的数量是有限的。在每个领域中,都有大量类似的东西。领域的数量有数千个。在 Wolfram Alpha 中,我们已经研究了几千个这样的领域。每次我们遇到一个领域,都会有新的和不同的问题。选择一个领域——例如植物。有各种各样的植物问题:是什么物种,它能长到多高,如何收获。植物在某些临界温度下生长,它们开始发芽。这与气候有关,它们是如何联系在一起的?当你接触到一些新领域,比如植物时,你会说,这与这个、这个和其他领域非常相似,但它有自己必须处理的额外细节。每一个领域都需要付出相当大的努力,但努力是有限的,而且这些领域的数量也是有限的。在 Wolfram Alpha 项目中,有两个基本观察让我决定这个项目并非完全不可能。

当你明白这一点的时候,那一定是光荣的一天。

我在完全确定结论之前就开始了这个项目。其中一条结论是:世界上有很多数据,但这些数据是有限的。但事实并非如此。例如,就像网络一样。网络非常大。但数据有多大?网络上大概有 100 亿个有意义的页面。数据很大,但数据是有限的。你可以说,所有参考书中有多少东西?最大的参考图书馆有多大?这些参考图书馆里有什么样的内容?数据很大,但数据有数万亿个元素,也许是千万亿个元素,但数据是可以说出数字的。我们可以量化数据有多大;数据很大,但不是无限大。有时人们说,为了做这样的事情,你必须无限扩展。其实,你不必无限扩展。世界是一个有限的地方。大,但有限。

大多数人认为,我们讨论的数字规模非常大,甚至可能是无限的。这看起来太令人畏惧了。

我很幸运,因为在这些事情上我培养了某种荒谬的自信,认为即使它令人生畏,也并不意味着我做不到。比如,世界上有多少个命名定律,比如安培定律或万有引力定律?大概有 5,000 到 10,000 个。这意味着什么?好吧,也许要实现所有这些定律,需要 50 万行Mathematica代码。它很大,但有限。

这是第一个见解。

网络上大概有 100 亿个有意义的网页。对。第二个问题是,我曾想象过机器能够计算问题的答案,这在很大程度上是一种智能活动。那是 50 年代和 60 年代的科幻电影中的东西,人们走到电脑前和电脑交谈,电脑给出答案。我一直认为,计算机中需要的是通用人工智能。唯一能够很好地回答问题的方法就是模仿人类思考和找出问题答案时的行为。通过大量基础科学研究,我得出了一个结论——宇宙中复杂的事情是如何发生的?在物理学中,在其他地方。看起来像是智能的东西是什么样子的?自然界中复杂的事情是如何发生的?自然界中发生的事情的复杂性与我们用大脑能够做的事情的复杂性相比如何?我逐渐意识到——这是我所说的计算等价原理的一部分——实际上,自然界中发生的事情,或者计算宇宙中发生的事情——可能的程序和事物——与我们人类用心智能够做的事情之间并没有明显的区别。如果有人说,好吧,我们需要这个神奇的想法来创造人工智能,而这个想法在普通计算中并不存在,它是一个额外的想法,我逐渐意识到,智能和纯粹的计算之间并没有那种明确的界限。所以这让我意识到,你不需要建立一个完整的人工智能,就能回答人们期望专家回答的那些问题。让我有点惊讶的是,一个如此哲学的问题竟然产生了一个像一个网站一样实际的结果——创建 1500 万行代码,运行数十亿台服务器,诸如此类的事情。我发现,关于智能的哲学问题竟然会产生如此实际的影响,这真是太迷人了,至少对我来说,它确实如此,因为我意识到,你不必发明人工智能,就能成功构建一个能够进行计算知识的系统。更重要的是,在我们深入研究之后,我甚至意识到,我们人类对人工智能的思考方式完全是错误的,因为这会让你陷入这样的思维模式:“让我们以人类推理的方式去推理事物吧。”假设你正在尝试解决某个物理问题。你推理物理问题;就像你说的,这个机械物体推动另一个机械物体,然后它做这个,然后它做那个,等等,然后你就得到了一整条逻辑推理链。事实证明,这是一种非常低效的方式来弄清楚系统实际上会做什么。更有效的方法就是建立人们 150 年前发明的方程式来表示这些事物,然后使用最好的现代科学方法直接找到答案。

所以,你的人工智能(严格来说并不是人工智能)应该自己找到一种方法来解决这个问题,这种方法要比人类解决的混乱、迂回的方法更好,或者在需要的时候对其进行编程来解决这个问题?

我认为主要问题是,你能计算出答案吗?那么,弄清楚如何计算答案意味着什么呢?任何时候,只要有某种复杂程度的算法,它就会进行一定程度的弄清楚如何做,以及直接去得到答案。弄清楚如何做和得到答案之间实际上没有区别。稍微换个方向,我想你之前说过的一件事,也是我所好奇的事情之一,就是我们现在所处的世界,我们可以轻松地计算出很多关于世界的事情,我们可以弄清楚很多事情,我们可以预测一定数量的事情,我们可以提出一些问题,并且通常能够找出答案、预测等等。我们应该如何看待这对人们未来做事的方式意味着什么?我认为其中一个主题是:世界从人们只是猜测如何做事的时代,发展到人们真正以更精确的方式计算他们应该做什么的时代。我们看到这种情况在越来越多的地方发生,有时它发生在我们使用的设备中;它们会自动进行计算,自动对焦相机或其他东西。GPS 会确定要去哪里。有时它们只是告诉我们一些事情。我认为在不久的将来,知识的传递将更加主动。现在,我们获得的许多知识都是我们自己要求的。你走到 Wolfram Alpha 面前,问它一个问题。它不会主动告诉你一些你可能会感兴趣的东西。我认为,越来越多的事情将被设置成主动告诉你一些你可能会感兴趣的东西。这与我认为将在未来几年出现的另一个数据世界有关:个人分析数据世界。记录下关于你自己的一切,然后得出结论。像我这样的人,因为我一直对数据感兴趣,我记录了过去 20 年里我输入的每一个按键。我记录了大量其他东西——我并没有像往常那样经常查看它们,但我打算付出巨大努力,查看过去十年左右的所有数据,并尝试从中了解自己。这是一个很好的例子,说明仅仅拥有原始数据很有趣,但如果不能从中计算并知道如何呈现它,它就不会立即有用。我认为,根据对自己的记录,人们将越来越有能力预先提供相关的知识,计算有用的知识。

归根结底,这类事情能带来的最有用的见解是,了解哪些问题是正确的。你会想要了解一些你一开始甚至不会考虑问的事情。它会根据结果告诉你应该问什么问题。

这类似于当你得到结果时的问题,比如我们之前讨论的 235 英寸的例子——根据这个结果你想知道什么?你是否有算法和启发式方法可以找出可能相关的内容?至少对我来说,奇怪的是,在 Wolfram Alpha 的形式中,我们可以根据知识、数据等对事物做出预测的程度,但在我所做的许多科学中,科学的结果之一是,世界上实际可以预测的东西是有限的。归根结底,有些过程是计算上不可简化的。换句话说,当你观察一个系统在做什么时,它会经历一系列步骤来产生它的行为。问题是,我们能否跳过这一步,计算出系统将要做什么,比系统本身更高效?数学类科学的伟大成就之一往往是:让我们得到一个答案的公式。这是什么意思?嗯,这意味着我们不必遵循系统经历的所有步骤。我们只需将一个数字代入公式,我们就能立即得到系统将做什么的答案。计算不可约性是指当系统不允许你这样做时,在一系列令人惊讶的系统中发生的事情;它是不可约的。为了弄清楚系统将做什么,你必须经历与系统本身相同的一系列计算步骤。没有捷径可以得到答案。我认为在构建技术时,许多技术都是专门为避免使事物在计算上不可约而设置的。一台机器有一些简单的运动,你可以很容易地预测三秒钟后它将恢复到初始状态。所以,根据我们拥有的数据,世界上什么是可预测的,整个问题都归结为计算可约性与计算不可约性。有些事情我们可以预测;有些事情我们不能预测。我们经常将技术设定为可以预测的东西。大自然并不一定以同样的方式设定自己,所以最终会出现像天气这样难以预测的事情。我越来越怀疑技术最终会变得越来越难以预测,因为技术能够更高效是不可避免的特征,它遇到了这种计算不可约性,变得越来越难以预测。我们面临的挑战是利用所有这些数据、所有这些知识来预测可以预测的事情,并尽可能地利用那些我们只需计算就能知道会发生什么的事情。

我们是否可以设置它,以便我们运行它的速度比在现实生活中发生的速度要快得多?

经常,我期望在生物医学中出现的很多东西都会有这种计算性不可还原性问题,当我们了解所有这些蛋白质相互作用以及我们如何从基因组到实际生物医学的各种细节。要计算您以这种方式应用这些药物,等等,我想到的是整个宇宙的情况,在多大程度上是一个问题重要的是要获得我们的整个宇宙吗?我认为我们不知道潜在的种子需要有多大的规定。

您需要运行130亿年吗?

好吧,好的,是的,好消息是,我们的最佳希望是我们已经在特定模型中遇到了很多东西,这是我们的预期只是这些自我指出的事实之一。

在某种意义上,只要它具有降低的范围,它就不可否认的是,这不是宇宙,这不是宇宙,这是不可回报的。

这是继续的过程,宇宙是什么?宇宙将要做什么,然后您必须从基础规则中运行。这可能是这些问题的有效性,因为从数学角度来看,您会说有一些材料的配置,这些属性和该属性以及这些属性的基本规则,以使事物设置如何,这是一个很难回答的问题。为了找到某些过程的结果,您必须遵循一些步骤,并且您不能总是任意减少所需的计算工作量。

没有捷径。

对。的计算不可约性,那么您不能期望始终减少这种减少。如果您要问一个任意长时间后发生的问题,实际上它需要您任意长时间的回答,这就是在数学和戈德尔的定理等中出现的不可证明的现象的起源,这就是适用于物理学的结果,即使您知道基础理论,也可以使您能够更误解,这可能是可以解决的。

我认为,大多数人会认为,如果您知道基本理论,那么您知道所有管理宇宙的规则,而您的意思是,这不一定是正确的,并且实际上知道规则是什么,您必须运行宇宙。

实际上,进化比人们认为的谬误更接近技术,就像人们刻画根据逻辑行动的机器人总是描绘了它们时,在早期的科幻小说中,机器人具有基本的规则,即它的行为在某种程度上意味着它在某种程度上是在基本上的范围,即使您的规则是彼此的,因此,您的行为是可以的。在我在基础科学方面的努力中的基本规则和实际行为之间,如果您在可能的程序中看到一个可怕的属性,即使该程序很简单,这种行为是简单的,当我们做到这一点时,我们就无法实现这些措施。我们倾向于在当前的技术中进行行为很简单的事情,我们可以很容易地看到它会带来什么,我认为,技术中会发生的重要事物之一 - 我们已经可以看到越来越多的技术 - 在未来几十年中,可以通过搜索可能的algoriths,可能会在某些方面进行一些功能,从而可以找到一些能力,并且会在某些方面进行搜索。例如,当我们在Mathematica和Wolfram Alpha中构建程序时,我们会很容易预测,这些算法是通过算法发现的,我们在其中搜索了一些特定的言论,在其中搜索了一些特定的说法。这真的很聪明,有时候你说,天哪,我不愿意弄清楚这一点。这太复杂了,无法弄清楚它实际在做什么,但是我们可以看到它在做对我们有用的事情。

您无法弄清楚它的工作方式,但是您知道它在做什么。

您可以看到以这种方式扭曲这些位,并且它们总是以这种方式排队,并且可以自动证明某些特定的属性将永远是这种情况,而作为人类,人们永远不会在这种情况下以您的形式来创建它。 ,它正在工作,但现在以这种非常复杂的方式工作,在本质上,在生物学,物理学,其他地方,进化是一种有趣的事情,因为进化实际上是一个有趣的进化,因为进化比进化更加艰难了,这实际上是一个很复杂的事情。真正创新的东西。通常,它以类似于我们所做的许多工程的方式逐步做事。

大自然是否有可能对宇宙本身进行大型作用,除了渐进之外,还可以做任何其他事情吗?

是的!当您在不同的情况下查看不同的情况,在这种情况下,流体与这种情况相同,从而不需要一个情况下,它们可能会随机选择,这可能会改变这种情况关于大自然的事情是,任何人都应该能够理解这些事情有时会感到困惑。我认为自然界中倾向于发生的事情是,我们可以看一些不可理解的事情,我们可以在其中观察基本的组成部分,然后我们可以理解一些计算的过程,这就是当这些组件实际运行的过程中,我们在技术上和我们的工作中都可以找到一些事情。我们找到可以用于显示的液晶,或者我们在自然界中找到其他东西,我们可以为某些有用的目的来利用,我当然知道,我们当然要做的一件事正在进入这个可能的算法的计算宇宙中,从某种意义上说,在所有可能的范围内都可以按照某种范围的范围,但我们只是遍历了某种阶段,但我们只是遍历了某种范围,但我们只是读了一个元素。 ITHMS,存在哪些可能存在的宇宙?实际上,我们可以去看所有可能的算法,并说哪些人在做某种人类目的有用的事情?在我们进行工程的情况下,我们可以综合地做事,通常是典型的派对 - 型号:一个人是一个非常简单的东西,这是一个很好的事情,因为这是一个非常好的途径,所以这是一个非常好的,而且是人类的一遍, 。我怀疑当您越来越多地看待技术对象时,我们会在计算宇宙中发现它们,而它们确实是有用的东西,而它们并不是在逐步构建的东西。

当前的技术如何创建的概念是,它们基本上是从您所说的,这是从我们无法理解的计算宇宙中汲取了一些东西,并使用它来为我们推动前进。

不过,请记住,技术的组成部分通常是不可理解的,即使人们理解树木是如何实现的,这只是一个更加极端的版本。

我想我们可以永远降低这个兔子的洞,但是让它对宇宙理论的搜索对您来说不是理论上的。

在过去的几年中,我已经休息了一下,因为我一直在研究Wolfram Alpha及其周围的所有事情,这实际上我不得不休息一下,这真是令人沮丧,但是 - 但是 -

我看到了TED谈话,您提出了发现宇宙的实际初始算法的想法,您说这将在这十年之内。

这是我的希望。

似乎非常乐观。

不,我希望我们的宇宙是否有一个简单的规则。 ECKETECETE,等等。我们做了很多工作。事实证明,宇宙有一个规则,但有效地是一百万行代码。

您会想象有多简单?

这是一种思考这一点的方法。在您找到一个合理的情况下,如果您查看前10条规则并开始列举规则,则可能有不同的方式来列举它们,您使用的是不同的方案,因为组合物的工作方式,不同的方案的工作方式,不同不是我们的宇宙。我认为的情况是,在您发现几年前发现的不是我们的宇宙之前,您将不得不仔细阅读数十亿个候选人。偶然的是,您将开始这些事情之一,它将在周围起泡,您将遵循它,直到它(嗯,当我上次这样做时,大概是100亿个底层节点,然后它都偏离并跑来跑去,您会说,这是我们的宇宙,还是我们的宇宙?好吧,这是计算不可约性咬人的地方,因为您运行了多达100亿个节点,但这仍然是我们宇宙演变的10到58秒,这真的很难说出这件事是否会在其中有一个自然而然的技术,这是有什么效力的。 ,因为您正在学习这个宇宙,它在您的计算机中,然后在您的计算机上冒出来,然后您必须推断出什么是自然法则。因此,我的意思是,即使在前一千个候选宇宙中,也可能是我们的宇宙。我们需要成为我们的宇宙。

对我来说,这是一件有趣的事情,因为在现代科学中,一个卑鄙的哥白尼人都在某种程度上思考了这种谦虚的方式。宇宙是您可能会说的简单的,为什么不只是随机的宇宙?

您的理论是,如果一个宇宙可以从简单的算法中产生,那么所有宇宙都可以而且将会?

我们在科学上唯一的话题是我们的实际宇宙:我们只有一个纯粹的理论是,我们可能会在某个地方验证,但我们可以在某个地方进行验证。这是因为我们陷入了宇宙,如果我们的宇宙的规则非常复杂,那么这是我们的宇宙,因为有一个随机的宇宙,我们的宇宙将是一个非常复杂的规则。这将是一个大整数。如果只是随机选择,它不会是“ 8”。

现在,我有一个怀疑,当我们真正理解发生的事情时,在科学的历史上,这些形而上学的问题却崩溃了,因为它们不是一个正确的问题,或者事情以某种围绕问题而努力的方式,而不是在宣传我的言论我怀疑这只是一个奇怪的事情,这是一个奇怪的事情牛顿说:“一旦行星最初是建立的,他的运动定律就可以找出可以发生的事情,但是,这不是我们可以在300年后在科学上回答的问题。无论是他们的宇宙而言,这个数字都不是一个任意的数字。现在,如果我们有一个太阳系统,我们知道有太阳系的年龄,我们知道这是一个不可思议的想法。因此,让我们出去搜索它,因为这似乎是一种反欧洲的主张,这似乎是对我们和我们的宇宙的一个非常自大的主张。

您的企业有成功的潜力,并使您实际发现或确定宇宙的规则依赖于它是简单的规则之一。

这是正确的。我们永远不会通过搜索来找到它。

我认为这是关于科学的一个非常基本的事实 - 可以说,在这个方向上,这可能是所有人的基本事实,即宇宙中有秩序,这可能不是那样的。它可以通过法律来描述,这可能不是那样的,可能是宇宙充满了奇迹,而各种不受法律管理的时髦事件,但实际上它具有法律,并且它具有法律,并且有序地表现出某种程度的表现。很简单,在21世纪的早期,可以使用我们的计算机并找到一个问题:Wolfram Alpha何时可能会在40年前考虑Wolfram Alpha type?

[笑声]

也许是一些必要的中间步骤,如果您想这样做。

我不能以任何方式证明这是历史上的正确时间,看看宇宙是否有一个简单的规则。

这确实是一个有趣的问题:如果有一个早期的宇宙之一,这不是我们的宇宙,那本身就是一个非常奇怪的发现,因为人们可以说,有一个宇宙,而且它有一个八个半的千分之一,现在有一个奇怪的粒子,这是一个奇怪的事物。因此,它是自sonsect的,但与现在的方式不同,我们会通过检查这些候选宇宙来知道。

Wolfram Alpha的基本目标:促进和民主化的计算知识,这一事实的事实至少可以减慢我在找到有关宇宙的这些事情的努力,因为对于我来说,至少我倾向于在我倾向于供应,我倾向于一整天都可以尝试,因为我倾向于做一个问题这是错误的,整个十年都可以构建基础架构,甚至可以到达起点,这是计算知识变得可能会发生的十年,而且我认为可以从中遇到的互动,因为我认为他们的互动方式不断变化,所以我认为这是一个非常有趣的事物。这种情况在某种程度上改变了。有时候,大多数人都认为您可以轻松地获得基本的事实。

但是,我认为今天发生的一件事是,在我们的时间表上,可以说是在我们的时间表上,只有几个人可以使用这些书籍的寺院,然后在库中散布了事实。一些问题,您必须找到一个专家,而专家也许是一个很大的重量级过程,我认为计算知识将在本质上使该过程变得民主,如果我们的文明可以回答这个问题,那么您可以在五秒钟内回答这个问题。但是,如果它原则上是可以回答的,那么我认为我们可以非常民主化这一过程,并让任何人迅速回答。

可以公平地说,这是Wolfram Alpha的基本目标:促进和民主化计算知识?

这是我们的努力。当它变得容易得多,但它有点越过地平线,它变得可能会逐渐变得更容易。

Wolfram Alpha的持续发展在多大程度上仍然要求它成为您的主要重点?

我现在会花很多时间,因为它确实很有趣,而且有很多添加了知识的域名,我发现了如何做到这一点,因为我认为我们可以更快地进行计算知识。 ODAY您可以在不久的将来与Wolfram Alpha进行交流。

Will it tell you what the image is? Or what other things can you do with the image?

Not yet. It can't tell you what the image is yet. The typical thing is that you'll mix some linguistic thing with, I don't know, “closest paint color.” You got an image of some thing, and it knows the paints and it can see the image and figure that out. Or you might be able to say—there's all sorts of tricky things that you can do. Like there's a shadow in the image and we know what the geotagging of the image is and we know where the sun is and we can figure out based on the length of the shadow, we can figure out how high the thing is and all sorts of fancy things like that. The problem of recognizing images, we're working on that one, but it's a knotty problem. The most interesting things will probably be—one of the things that's always fun with this type of technology is that until you've built it to some level and you can really play with it fully, it's actually quite hard to tell what it will feel like. I know you can do a lot of really good toy things with uploading images and using images as input, but what will be the things that are the really, really useful things you can do? That will become clear once one is routinely doing it. Other things that are coming, like being able to get sensor data flowing into the system and asking questions of the data that's coming from some sensor that one has: you can say what types of flights are overhead and what speeds. You can get things from seismologists or weather stations. What I mean is your own personal data, like you connect it to your IMAP server and you'll be able to analyze the sequence of your receipt times of e-mails and things like that and be able to plot that as compared to when the sun rose on a particular day, and so on.

How else can we expect to see Wolfram Alpha develop in the near future?

I mentioned these things about preemptive delivery of information. Being able to provide knowledge based on what it can tell is going on for you, rather than based on what you specifically ask it, that's one type of thing. Another type of thing is watching what's happening in the world and being able to automatically figure out what's interesting. We have an unprecedented collection of feeds of all kinds coming into our servers, and we know all these kinds of things. We can see this peak in this curve: There's something. What we want it to do is figure out what's interesting. Of all the stuff that's coming in, what's newsworthy. What's worth telling people about and what's just the normal course of what happens on a Friday afternoon? That's another kind of thing: being able to figure out—because we do have the largest collection of data about different things going on around the world that anybody's every assembled. It comes in in real time, and we should be able to figure out what's happening, globally, what are the interesting things that are happening.

Another direction is, given that you have a complex task that you want to figure out how to do—that task might involve: you buy this component from this company, you connect it in this way, you do this, you do this. The question is, Can we figure out in some almost creative way, given that you describe your task in such-and-such a fashion, can we figure out how to achieve that task? How to perform that task? That's a thing we're trying to work towards. There's small cases. Like right now, if you type in some funny resistance, we'll be able to compute what pair of serial and parallel resistors will make that particular resistance. That's a very trivial case. But a much more complicated case is: One says, “This is what I want to make, and I'm going to describe it,” and I would go to a design engineer and say, “I want a thing that has this property and this property and this property.” They'll make it for me, figure out how to do that. That's a challenge that in a sense mixes together several different kinds of things. It mixes together—perhaps there may be a spark of creativity needed on the part of that design engineer. Maybe we can find that by searching some chunk of the computational universe. It mixes, but we have to know what actual resistors exist. How strong is this material? How far is it from this place to that place? So we have to have knowledge about the world. So the concept there is to what extent can we actually go from human description of the human's goals to how do you achieve those goals with the stuff that exists in the world and the stuff we can compute? And maybe a spark of inspiration that perhaps we can also get automatically. One of the most striking things to me is—in terms of this human inspiration thing—a few years ago we put up this site called WolframTones, which is a website that generates music based on a search of the computational universe. The thing that has been most bizarre to me about that is I keep on running into people saying, “I'm a composer and I use this site as inspiration.” That's sort of the exact opposite of what I would have expected. The role of the computer versus the role of the human. I would have expected the human as the one going, “I have an inspiration. I've got a human-created spark, and now I'm going to use the computer to work out that human-created spark and render it in the right way.” But instead what's happening is that these things that one is plucking from the computational universe, those are the sparks that the humans are then working through to develop into something that they find interesting. It's a simple case, but it's an encouraging sign. One of the big things that comes out of that is this mass-customization idea of, How expensive is creativity? What's the economics of creativity? Can you automate some of creativity? This idea of going from a description of a complex objective to how is that achieved—can you get the spark of inspiration automatically?

<<:  视频:一家公司的算法揭示了所有数据之间的隐藏联系

>>:  爱尔兰最大博彩公司给我们带来的四条数据教训

推荐阅读

科学家复活了一只通过嘴巴产子的疯狂灭绝青蛙

1983 年,世界上一种最奇怪的青蛙消失了。胃育蛙原产于澳大利亚昆士兰州的一小部分地区,它通过嘴巴产...

科学家称海洋正在改变颜色——这可能是我们的错

气候变化已经使地球遭受创纪录的高温炙烤,暴雨不断加剧,并使地球的八大稳定指标超标。温室气体排放增加的...

《野良美》:猫耳少女的冒险与成长的动人故事

《野良美》:一个由古怪人物交织而成的幽默与成长故事■作品概要《野良美》是改编自原一夫同名漫画的电视动...

海龟埃莉诺游过热带风暴并幸存下来

海龟埃莉诺是一位坚强的女士。她不仅安然度过了一场强大的热带风暴,而且做得非常出色。 “埃莉诺的‘海龟...

《瓦尼塔斯病例研究》第一季的吸引力与评价:描绘吸血鬼世界的新尝试

Vanitas 第 1 季案例研究 - Vanitas no Carte概述《Vanitas 事件簿...

家里的燃气设备可能泄漏多达 21 种有害污染物

人们每天都在家中使用天然气,包括厨房炉灶、火炉和加热器。所有这些电器背后的强大燃料是什么?甲烷。甲烷...

伊隆·马斯克将裁减推特的整个部门——这可能会对用户产生影响

这个故事正在发展。埃隆·马斯克正在毫不犹豫地兑现他关于裁减 Twitter 员工的传言。在最近以 4...

如何给老黑白照片上色

你可能会担心人工智能机器人会长期统治地球。但与此同时,你可以使用同样的技术来完成各种有用的任务。给老...

Tomica Heroes作业劳动专用组合机器人的魅力与评价:大人小孩都能享受的充满动感的作品

Tomica Heroes作业劳动专用组合机器人——承载孩子们梦想的新一代英雄2022年4月22日,...

电先生的魅力与治愈:深入电先生的世界

电传虫电传酱 - 大家的歌的魅力和背景《电光电虫》是一部时长只有两分钟的短篇动画作品,于 1974 ...

看看本田、吉普和雪佛兰的全新电动车阵容

本周,电动汽车新闻如雨后春笋般涌现,汽车制造商们纷纷吸引华尔街、媒体和未来买家的注意力。但帕加尼是个...

《去遥远的世界》:重新评价大家歌曲的情感

“去遥远的世界”——大家的歌的代表作回顾《在遥远的世界》是1975年10月在NHK教育电视台(现NH...

如何利用健身追踪器做更多事情

如果您最近购买了某种健身追踪器,那么您就会知道它们可以追踪您的步数、活动、睡眠模式,甚至您的食物和水...

与Hello Kitty一起享受日本民间故事——一次迷人的动漫体验回顾

与Hello Kitty一起看日本民间故事——日本传统与人物的迷人融合1993年12月21日发售的O...

让我们讨论一下飞机是如何飞行的

飞机是如何在空中飞行的?无论你是否在飞行时思考过这个问题,它仍然是一个令人着迷的复杂话题。下面简要介...