1846 年 10 月 6 日,战俘弗里德里希·阿道夫·维斯利泽努斯冒险进入墨西哥偏僻小镇库西胡里亚奇附近的岩石山丘采集一些植物。他和他的西行探险队在墨西哥-美国战争爆发时被捕,但这位圣路易斯的医生和博物学家决定在监禁期间继续他的研究。他拔出一朵深红色的野花,从此命名为Heuchera sanguinea ,然后徒步返回村庄。 他把这株细长的植物整理好,这样一旦它干燥并裱在纸上,未来的植物学家就可以看到它的叶子的两面,然后他把它压在报纸之间。1847 年春天,他获释后,把这株干枯的植物和许多其他植物带回圣路易斯,送给了他的朋友兼同事乔治·恩格尔曼医生。这就是这株脆脆的铁锈色样本留存的地方——这是植物学历史的一部分,也是一份重要的数据,是密苏里植物园马尼拉文件夹森林中储存的近 630 万个标本之一。 点击打开照片库 “生物多样性科学通常不被视为数据密集型或大数据。但我们拥有的是所有其他科学的基础数据,”MBG 生物多样性信息学中心主任 Chris Freeland 表示。“这些小植物、这些信息是我们关于地球生命的知识生态圈的一部分,我们需要尽可能地了解它们。” 为了与世界分享这些标本,一组档案管理员和植物学家正在精心拍摄每一个标本,并将它们放在网上供任何人访问。 密苏里植物园是世界上最大的植物数据库之一,数据以多种形式存在。它拥有稀有的初版书籍,包括可追溯到古腾堡时代的药用植物手册;数以千计的活植物,它们生长在圣路易斯市中心 79 英亩的土地上供公众欣赏;还有 600 多万个干燥标本——看不见的花园——用于研究世界各地植物物种的形态、分布和用途。除了 Wislizenus 和他的同事收集的样本外,植物园还收藏了查尔斯·达尔文、詹姆斯·库克以及几乎所有追随刘易斯和克拉克足迹向西旅行的博物学家收集的藏品。弗里兰说,所有这些数据,从书籍到扫描图像到标本标签,都将在几年内上线。植物园甚至正在构建 API 工具,以便其他人可以编写应用程序来挖掘所有这些数据。 Jim Solomon 是 MBG 植物标本馆的馆长,该馆是永久保存植物部件的馆藏。他的办公室里堆满了 12×16 英寸的马尼拉文件夹,每个文件夹都装有H. sanguinea等标本——有些用红绳捆在一起,有些则敞开着,里面露出多个植物碎片。他表示,这些庞大的文件夹只是 MoBot 全部藏品的一小部分。他估计,在全球 37 个植物标本馆中,大概有 4 亿个这样的文件夹。“与过去几个世纪生活在地球上的植物总数相比,这个数字微不足道,”他说。“然而,这是我们对地球植物所有知识的主要来源。” 走廊尽头是植物标本馆的一部分,它看起来和任何大学图书馆一样,有成排的可移动架子。所罗门转动着标本科植物标本行上的转盘,伸手去拿一个文件夹,里面装着一种藤黄属植物。他拿出一张卡片,上面覆盖着 4 英寸长的革质叶子、多节的根和一串小圆果实——这不是你期望从文件夹中抽出的东西,也不是你通常与大数据联系在一起的东西。 几十年来,希望挖掘这些数据的植物学家必须联系 MBG 或其他植物标本馆,并通过邮件索要样本。植物数据挖掘通常用于分类学研究——比如马达加斯加的一位植物学家发现了一种有趣的植物,它有直立的茎、二态叶和绿色花粉,他想知道它是独特的物种,还是新的杂交种。简单的形态学——植物的样子——仍然是实现这一目标的主要方式。为了帮助这项研究,MBG 档案管理员每年分发大约 100,000 个样本,包括借来的、赠送的和新加入的样本。但所有这些处理都会损坏样本,而且发展中国家(拥有最大的生物多样性地区)的植物学家很难发送和接收此类邮件。这是 MBG 对其拥有的每个标本的数据进行编目和数字化的动机之一。 到目前为止,该团队已经完成了 390 万份样本,扫描了约 169,000 张图像。这本身就是一项特殊的挑战,因为正如藤黄属植物样本所表明的那样,并非所有植物都是平整的。“有椰子、巨型龙舌兰和其他大块头,所以确实需要一些专门的设备,”弗里兰说。MBG 正在与英国皇家植物园合作,制造新的成像设备,以超高分辨率扫描样本,以便植物学家可以缩放和平移并查看细节。 为了避免这些藏品显得陈旧和尘封,请注意,现代植物数据也以系统发育材料的形式存在。尽管绝大多数分类学工作仍然基于形态学,但 MBG 确实有一个 DNA 库,其中包含约 11,000 个专门为 DNA 提取而保存的样本。植物学家收集叶子样本,将其保存在硅胶中并储存在 -20º C 下,这样它们可能会产生比植物标本质量更好的 DNA。所罗门说,遗留的藏品不会以这种方式进行测试,因为 DNA 提取过程需要破坏太多材料。 所有这些工作涉及 MBG 的几个不同项目,将帮助其他国家的植物学家研究本地植物,并帮助自然历史学家了解四个世纪以来植物的用途和分布。 例如,该植物园是参与“生命百科全书”项目的六家机构之一,该项目将对地球上每个物种的数据进行分类,并将其发布到网上,作为研究世界生物多样性的唯一访问点。弗里兰自称是一位开放获取的倡导者,鼓励其他植物标本馆和博物馆尽可能公开地分享他们的藏品。最终,他希望研究人员能够利用它绘制生命网络中的新联系。 “这就是我们想要记录的,就是那种‘顿悟’时刻,我坚信它们就在那里。这就是大数据挑战。传统上这是一个以人为中心的领域,人们出去收集植物,现在我们用算法来解决这个问题,”弗里兰说。“可用的数据越多,你的科学就会越全面。” |
>>: PopSci 问答:Seth Lloyd 谈论量子计算和 Quoogling
3 月 21 日,拜登总统主持了白宫保护行动峰会。他的政府宣布了旨在保护和恢复土地的两座新国家纪念碑...
人们已经在胎盘、母乳、精液,甚至我们的大脑中发现了微小的降解微塑料。目前尚不清楚这些碎片究竟在做什么...
他们都骗了你。他们说双筒望远镜是发现雄鹿和老鹰的最佳方式,但他们错了。使用我们最畅销的手持望远镜,你...
现在正值美国感恩节周,这意味着黑色星期五促销活动已经全面展开。您可以在此处关注我们更广泛的黑色星期五...
《怪物君魔剑》:藤子不二雄的世界观及其魅力《怪物君:鬼之剑》于1982年3月13日上映,是根据藤子不...
过去几周,棕榈油短缺一直是新闻头条。4 月 28 日,传统上是世界上最大的棕榈油出口国的印度尼西亚禁...
Firefox 继续努力保护用户隐私,推出了一项新功能,当您点击链接时,该功能会删除 URL 标识符...
超短篇漫画——动画短片的魅力与评价概述超短漫画是在 GYAO 上播出的短篇动画系列!从2015年11...
养育新生儿意味着要确保他们具备成长所需的所有技能。但这可能是一个令人紧张的任务——尤其是因为外面有很...
Tenpo Suikoden NEO Tonosho Town Iberry CM - 深入评论和全...
人类免疫缺陷病毒的衣壳既是盾牌,也是敞开的后门。衣壳位于每个 HIV 粒子的中心,保护病毒的遗传物质...
在一些枫树茂盛的森林深处,季节的变换预示着成群的翅果的到来。但这些并不是虫子。这些种子有时被称为枫叶...
热浪使街道弯曲,山洪使整座城镇化为乌有,野火创造了自己的天气。就连最了解情况的科学家也对今年夏天的气...
机器人多年来一直在发动战争,在维基百科上默默无闻地争论细节,说实话,这很有趣。机器人之间有仇吗?拜托...
我们中的许多人认为 LinkedIn 是最差劲的社交网络。但那是因为我们没有充分利用它。使用正确的方...