逐片树叶,将生物多样性数据上传至网络

逐片树叶,将生物多样性数据上传至网络

1846 年 10 月 6 日,战俘弗里德里希·阿道夫·维斯利泽努斯冒险进入墨西哥偏僻小镇库西胡里亚奇附近的岩石山丘采集一些植物。他和他的西行探险队在墨西哥-美国战争爆发时被捕,但这位圣路易斯的医生和博物学家决定在监禁期间继续他的研究。他拔出一朵深红色的野花,从此命名为Heuchera sanguinea ,然后徒步返回村庄。

他把这株细长的植物整理好,这样一旦它干燥并裱在纸上,未来的植物学家就可以看到它的叶子的两面,然后他把它压在报纸之间。1847 年春天,他获释后,把这株干枯的植物和许多其他植物带回圣路易斯,送给了他的朋友兼同事乔治·恩格尔曼医生。这就是这株脆脆的铁锈色样本留存的地方——这是植物学历史的一部分,也是一份重要的数据,是密苏里植物园马尼拉文件夹森林中储存的近 630 万个标本之一。

点击打开照片库

“生物多样性科学通常不被视为数据密集型或大数据。但我们拥有的是所有其他科学的基础数据,”MBG 生物多样性信息学中心主任 Chris Freeland 表示。“这些小植物、这些信息是我们关于地球生命的知识生态圈的一部分,我们需要尽可能地了解它们。”

为了与世界分享这些标本,一组档案管理员和植物学家正在精心拍摄每一个标本,并将它们放在网上供任何人访问。

密苏里植物园是世界上最大的植物数据库之一,数据以多种形式存在。它拥有稀有的初版书籍,包括可追溯到古腾堡时代的药用植物手册;数以千计的活植物,它们生长在圣路易斯市中心 79 英亩的土地上供公众欣赏;还有 600 多万个干燥标本——看不见的花园——用于研究世界各地植物物种的形态、分布和用途。除了 Wislizenus 和他的同事收集的样本外,植物园还收藏了查尔斯·达尔文、詹姆斯·库克以及几乎所有追随刘易斯和克拉克足迹向西旅行的博物学家收集的藏品。弗里兰说,所有这些数据,从书籍到扫描图像到标本标签,都将在几年内上线。植物园甚至正在构建 API 工具,以便其他人可以编写应用程序来挖掘所有这些数据。

Jim Solomon 是 MBG 植物标本馆的馆长,该馆是永久保存植物部件的馆藏。他的办公室里堆满了 12×16 英寸的马尼拉文件夹,每个文件夹都装有H. sanguinea等标本——有些用红绳捆在一起,有些则敞开着,里面露出多个植物碎片。他表示,这些庞大的文件夹只是 MoBot 全部藏品的一小部分。他估计,在全球 37 个植物标本馆中,大概有 4 亿个这样的文件夹。“与过去几个世纪生活在地球上的植物总数相比,这个数字微不足道,”他说。“然而,这是我们对地球植物所有知识的主要来源。”

走廊尽头是植物标本馆的一部分,它看起来和任何大学图书馆一样,有成排的可移动架子。所罗门转动着标本科植物标本行上的转盘,伸手去拿一个文件夹,里面装着一种藤黄属植物。他拿出一张卡片,上面覆盖着 4 英寸长的革质叶子、多节的根和一串小圆果实——这不是你期望从文件夹中抽出的东西,也不是你通常与大数据联系在一起的东西。

几十年来,希望挖掘这些数据的植物学家必须联系 MBG 或其他植物标本馆,并通过邮件索要样本。植物数据挖掘通常用于分类学研究——比如马达加斯加的一位植物学家发现了一种有趣的植物,它有直立的茎、二态叶和绿色花粉,他想知道它是独特的物种,还是新的杂交种。简单的形态学——植物的样子——仍然是实现这一目标的主要方式。为了帮助这项研究,MBG 档案管理员每年分发大约 100,000 个样本,包括借来的、赠送的和新加入的样本。但所有这些处理都会损坏样本,而且发展中国家(拥有最大的生物多样性地区)的植物学家很难发送和接收此类邮件。这是 MBG 对其拥有的每个标本的数据进行编目和数字化的动机之一。

到目前为止,该团队已经完成了 390 万份样本,扫描了约 169,000 张图像。这本身就是一项特殊的挑战,因为正如藤黄属植物样本所表明的那样,并非所有植物都是平整的。“有椰子、巨型龙舌兰和其他大块头,所以确实需要一些专门的设备,”弗里兰说。MBG 正在与英国皇家植物园合作,制造新的成像设备,以超高分辨率扫描样本,以便植物学家可以缩放和平移并查看细节。

为了避免这些藏品显得陈旧和尘封,请注意,现代植物数据也以系统发育材料的形式存在。尽管绝大多数分类学工作仍然基于形态学,但 MBG 确实有一个 DNA 库,其中包含约 11,000 个专门为 DNA 提取而保存的样本。植物学家收集叶子样本,将其保存在硅胶中并储存在 -20º C 下,这样它们可能会产生比植物标本质量更好的 DNA。所罗门说,遗留的藏品不会以这种方式进行测试,因为 DNA 提取过程需要破坏太多材料。

所有这些工作涉及 MBG 的几个不同项目,将帮助其他国家的植物学家研究本地植物,并帮助自然历史学家了解四个世纪以来植物的用途和分布。

例如,该植物园是参与“生命百科全书”项目的六家机构之一,该项目将对地球上每个物种的数据进行分类,并将其发布到网上,作为研究世界生物多样性的唯一访问点。弗里兰自称是一位开放获取的倡导者,鼓励其他植物标本馆和博物馆尽可能公开地分享他们的藏品。最终,他希望研究人员能够利用它绘制生命网络中的新联系。

“这就是我们想要记录的,就是那种‘顿悟’时刻,我坚信它们就在那里。这就是大数据挑战。传统上这是一个以人为中心的领域,人们出去收集植物,现在我们用算法来解决这个问题,”弗里兰说。“可用的数据越多,你的科学就会越全面。”

<<:  通过扫描仪暗暗记录百年夜空

>>:  PopSci 问答:Seth Lloyd 谈论量子计算和 Quoogling

推荐阅读

这款用户友好的三合一磁性无线充电板可享受 52% 折扣

这款可折叠的三合一磁性无线充电板可以更高效地为您的 iPhone、Apple Watch 和 Air...

微重力西红柿、酸奶细菌和食用塑料的微生物将前往国际空间站

国际空间站通常非常繁忙,本周也不例外。本周,SpaceX 第 26 次商业补给任务 (CRM) 运抵...

Airbnb 最终禁止所有室内安保摄像头

某些 Airbnb 房东需要对其房屋进行一些调整。周一,这家短期租赁服务公司宣布,最终禁止使用所有室...

这种移民蚂蚁正在席卷纽约市

本周你学到的最奇怪的事情是什么?好吧,不管是什么,我们保证如果你听PopSci的热门播客,你会得到一...

对视频游戏真正重要的图形设置(及其作用)

大多数视频游戏,尤其是 PC 上的视频游戏,都有大量的设置列表,您可以调整这些设置以获得强大的图形和...

有声漫画的制作流程及评价

如何制作语音漫画 - 如何制作语音漫画20世纪40年代的日本电影界,有一部作为革新尝试而受到关注的电...

被逐出勇者队伍后,我在边疆发现的慢生活到底有什么吸引力?

“因为不是正牌同伴而被勇者队伍踢出,所以决定在边疆过慢生活”——边疆新冒险与慢生活的魅力2021年...

这款全面的电子学习终极套装限时仅售 99.97 美元

职业成功的关键在于终身学习。终极终身套餐包含 StackSkills、Infosec4TC 和 St...

煤炭副产品是稀土元素的重要来源

如果没有稀土元素,我们所知的文明将不复存在。没有智能手机、LED、风力涡轮机,甚至汽车电池。稀土元素...

三丽鸥世界杰作剧场的 Hello Kitty 和 Bad Badtz-Maru:回顾引人入胜的故事和角色

三丽鸥世界杰作剧场 Hello Kitty 的睡美人 / Bad Badtz-Maru 的蚂蚁和蚱蜢...

评论《Suimi-bune》:感人的故事和美丽的图像

“凉舟”的魅力与历史背景《凉舟》是一部1932年上映的日本动画电影,由于其独特的内容和历史背景,至今...

这些美丽的图像保存了可能永远消失的植物物种。

1859 年,查尔斯·达尔文终于在《物种起源》中发表了他酝酿已久的自然选择理论。这位以描述加拉帕戈...

如何在电脑上播放蓝光(以及为什么要这么做)

随着电影可以通过数字方式下载或订阅流媒体播放,实体媒体的受欢迎程度自然而然地下降了。百思买最近宣布将...

享受年底优惠,购买这些顶级买一送一无人机,现价 99.97 美元,截至 1 月 1 日

用一台的价格购买两台高品质无人机,在新的一年里节省开支。Alpha Z PRO 4K + Flyin...

氢燃料电池渡轮即将抵达湾区

少量氢燃料电池汽车开始出现在加州道路上,很快会有一辆或多辆氢燃料电池汽车穿越加州水域。桑迪亚国家实验...