1846 年 10 月 6 日,战俘弗里德里希·阿道夫·维斯利泽努斯冒险进入墨西哥偏僻小镇库西胡里亚奇附近的岩石山丘采集一些植物。他和他的西行探险队在墨西哥-美国战争爆发时被捕,但这位圣路易斯的医生和博物学家决定在监禁期间继续他的研究。他拔出一朵深红色的野花,从此命名为Heuchera sanguinea ,然后徒步返回村庄。 他把这株细长的植物整理好,这样一旦它干燥并裱在纸上,未来的植物学家就可以看到它的叶子的两面,然后他把它压在报纸之间。1847 年春天,他获释后,把这株干枯的植物和许多其他植物带回圣路易斯,送给了他的朋友兼同事乔治·恩格尔曼医生。这就是这株脆脆的铁锈色样本留存的地方——这是植物学历史的一部分,也是一份重要的数据,是密苏里植物园马尼拉文件夹森林中储存的近 630 万个标本之一。 点击打开照片库 “生物多样性科学通常不被视为数据密集型或大数据。但我们拥有的是所有其他科学的基础数据,”MBG 生物多样性信息学中心主任 Chris Freeland 表示。“这些小植物、这些信息是我们关于地球生命的知识生态圈的一部分,我们需要尽可能地了解它们。” 为了与世界分享这些标本,一组档案管理员和植物学家正在精心拍摄每一个标本,并将它们放在网上供任何人访问。 密苏里植物园是世界上最大的植物数据库之一,数据以多种形式存在。它拥有稀有的初版书籍,包括可追溯到古腾堡时代的药用植物手册;数以千计的活植物,它们生长在圣路易斯市中心 79 英亩的土地上供公众欣赏;还有 600 多万个干燥标本——看不见的花园——用于研究世界各地植物物种的形态、分布和用途。除了 Wislizenus 和他的同事收集的样本外,植物园还收藏了查尔斯·达尔文、詹姆斯·库克以及几乎所有追随刘易斯和克拉克足迹向西旅行的博物学家收集的藏品。弗里兰说,所有这些数据,从书籍到扫描图像到标本标签,都将在几年内上线。植物园甚至正在构建 API 工具,以便其他人可以编写应用程序来挖掘所有这些数据。 Jim Solomon 是 MBG 植物标本馆的馆长,该馆是永久保存植物部件的馆藏。他的办公室里堆满了 12×16 英寸的马尼拉文件夹,每个文件夹都装有H. sanguinea等标本——有些用红绳捆在一起,有些则敞开着,里面露出多个植物碎片。他表示,这些庞大的文件夹只是 MoBot 全部藏品的一小部分。他估计,在全球 37 个植物标本馆中,大概有 4 亿个这样的文件夹。“与过去几个世纪生活在地球上的植物总数相比,这个数字微不足道,”他说。“然而,这是我们对地球植物所有知识的主要来源。” 走廊尽头是植物标本馆的一部分,它看起来和任何大学图书馆一样,有成排的可移动架子。所罗门转动着标本科植物标本行上的转盘,伸手去拿一个文件夹,里面装着一种藤黄属植物。他拿出一张卡片,上面覆盖着 4 英寸长的革质叶子、多节的根和一串小圆果实——这不是你期望从文件夹中抽出的东西,也不是你通常与大数据联系在一起的东西。 几十年来,希望挖掘这些数据的植物学家必须联系 MBG 或其他植物标本馆,并通过邮件索要样本。植物数据挖掘通常用于分类学研究——比如马达加斯加的一位植物学家发现了一种有趣的植物,它有直立的茎、二态叶和绿色花粉,他想知道它是独特的物种,还是新的杂交种。简单的形态学——植物的样子——仍然是实现这一目标的主要方式。为了帮助这项研究,MBG 档案管理员每年分发大约 100,000 个样本,包括借来的、赠送的和新加入的样本。但所有这些处理都会损坏样本,而且发展中国家(拥有最大的生物多样性地区)的植物学家很难发送和接收此类邮件。这是 MBG 对其拥有的每个标本的数据进行编目和数字化的动机之一。 到目前为止,该团队已经完成了 390 万份样本,扫描了约 169,000 张图像。这本身就是一项特殊的挑战,因为正如藤黄属植物样本所表明的那样,并非所有植物都是平整的。“有椰子、巨型龙舌兰和其他大块头,所以确实需要一些专门的设备,”弗里兰说。MBG 正在与英国皇家植物园合作,制造新的成像设备,以超高分辨率扫描样本,以便植物学家可以缩放和平移并查看细节。 为了避免这些藏品显得陈旧和尘封,请注意,现代植物数据也以系统发育材料的形式存在。尽管绝大多数分类学工作仍然基于形态学,但 MBG 确实有一个 DNA 库,其中包含约 11,000 个专门为 DNA 提取而保存的样本。植物学家收集叶子样本,将其保存在硅胶中并储存在 -20º C 下,这样它们可能会产生比植物标本质量更好的 DNA。所罗门说,遗留的藏品不会以这种方式进行测试,因为 DNA 提取过程需要破坏太多材料。 所有这些工作涉及 MBG 的几个不同项目,将帮助其他国家的植物学家研究本地植物,并帮助自然历史学家了解四个世纪以来植物的用途和分布。 例如,该植物园是参与“生命百科全书”项目的六家机构之一,该项目将对地球上每个物种的数据进行分类,并将其发布到网上,作为研究世界生物多样性的唯一访问点。弗里兰自称是一位开放获取的倡导者,鼓励其他植物标本馆和博物馆尽可能公开地分享他们的藏品。最终,他希望研究人员能够利用它绘制生命网络中的新联系。 “这就是我们想要记录的,就是那种‘顿悟’时刻,我坚信它们就在那里。这就是大数据挑战。传统上这是一个以人为中心的领域,人们出去收集植物,现在我们用算法来解决这个问题,”弗里兰说。“可用的数据越多,你的科学就会越全面。” |
>>: PopSci 问答:Seth Lloyd 谈论量子计算和 Quoogling
第一天,美国队长一拳打在阿道夫·希特勒的下巴上。这位星光熠熠的超级英雄打扮得像 7 月 4 日特别华...
更新:据传闻报道,截至美国东部时间周一晚上,Facebook 已开始恢复部分用户的使用。 Faceb...
在成功试运行后,一家名为 CarbonQuest 的初创公司正在扩大其在纽约市的业务范围。它的使命是...
多年来, 《大众科学》一直致力于解答你对我们生活的世界的疑问。月球上有什么?为什么我们没有飞行汽车?...
拍摄一张好的人像照片非常困难。从光线不好到姿势不好看,很多错误都会毁掉照片。然而,没有什么比不合时宜...
Hamigaki Ondo Minna no Uta的详细评论和推荐 - Hamigaki Ondo...
《借东西的小人阿莉埃蒂》:吉卜力工作室的新魅力和世界观■作品概要《借东西的小人阿莉埃蒂》是吉卜力工作...
艾莉森·戈普尼克 (Alison Gopnik) 的职业生涯始于一项心理学实验,现在她认为这项实验很...
今年年底,法国和英国海军将开始测试一种新型反水雷系统的原型,该系统旨在探测、识别甚至摧毁危险的水雷,...
在玛丽·斯图亚特(又名苏格兰女王玛丽)被处决 436 周年之际,一个国际密码破译小组发现了她被囚禁在...
1986 年,电影《太空营》上映,冻干冰淇淋在全国风靡一时。这些小包装的那不勒斯冰淇淋轻盈干燥,随处...
特朗普政府希望增加汽油中的乙醇含量,此举可能会缓解因总统与中国的贸易战而导致的大豆关税打击的农民,但...
1950 年,道格拉斯·麦克阿瑟将军向总统请求允许在朝鲜战争中投掷 34 枚原子弹。尽管他的请求被拒...
智利北部的阿塔卡马沙漠位于安第斯山脉的雨影区。尽管它毗邻太平洋,但被称为洪堡寒流的持续冷流使空气中的...
以下摘录自埃里克·霍尔特豪斯 (Eric Holthaus) 所著的《未来地球》。我们一生中都经历过...