Meta 的人工智能可能会改变我们研究蛋白质结构的方式

Meta 的人工智能可能会改变我们研究蛋白质结构的方式

蛋白质是维持生物体正常运转的重要成分。它们帮助修复细胞、清除废物,并将信息从身体的一端传递到另一端。

科学家们为破译蛋白质的结构和功能做了大量工作,为此,Meta 的人工智能研究团队今天宣布,他们使用了一种模型,可以根据蛋白质的氨基酸序列预测其三维结构。与 DeepMind 等该领域的先前研究不同,Meta 的人工智能基于语言学习模型,而不是形状和序列匹配算法。Meta 不仅发布了关于这项研究的预印本论文,还将向研究界和业界开放该模型和蛋白质数据库。

首先,为了说明理解蛋白质形状的重要性,我们来上一堂简短的生物学课。基因中的某些三联核苷酸序列由细胞中的一种称为核糖体的分子翻译成氨基酸。蛋白质是氨基酸链,它们会自行组合成独特的形式和结构。一门名为宏基因组学的新兴科学领域正在利用基因测序来发现、分类和注释自然界中的新蛋白质。

Meta 的 AI 模型是一种新的蛋白质折叠方法,其灵感来自大型语言模型,旨在预测宏基因组数据库中数亿个蛋白质序列的结构。了解这些蛋白质形成的形状将为研究人员提供线索,帮助他们了解蛋白质如何发挥作用,以及它们与哪些分子相互作用。

[相关:Meta 认为其新的 AI 工具可以使维基百科更加准确]

“我们首次大规模表征了宏基因组蛋白质。我们将数据库作为开放科学资源发布,其中包含超过 6 亿个蛋白质结构预测,”Meta AI 研究科学家 Alex Rives 说道。“这涵盖了一些最不为人所知的蛋白质。”

历史上,计算生物学家曾使用进化模式来预测蛋白质的结构。蛋白质在折叠之前是线性的氨基酸链。当蛋白质折叠成复杂的结构时,线性链中可能相距很远的某些序列可能会突然变得非常接近。

“你可以把它想象成一个拼图中的两块碎片,它们必须拼在一起。进化不能独立地选择这两个位置,因为如果错误的碎片在这里,结构就会崩溃,”里夫斯说。“这意味着如果你观察蛋白质序列的模式,它们包含有关折叠结构的信息,因为序列中的不同位置会相互变化。这将反映出蛋白质的一些潜在生物学特性。”

与此同时,DeepMind 的创新方法于 2018 年首次亮相,主要依赖于一种称为多序列比对的方法。它基本上会在大量蛋白质序列进化数据库中进行搜索,以找到与其预测的蛋白质相关的蛋白质。

“我们的方法的不同之处在于,我们直接根据氨基酸序列进行预测,而不是根据这组多个相关蛋白质进行预测并查看模式,”Rives 说。“语言模型以不同的方式学习了这些模式。这意味着我们可以大大简化结构预测架构,因为我们不需要处理这组序列,也不需要搜索相关序列。”

Rives 声称,这些因素使他们的模型比该领域的其他技术更快。

[相关:Meta 希望通过研究人类大脑来改进其人工智能]

他们如何训练这个模型来完成这项任务?这需要两个步骤。首先,他们必须对大量具有不同结构、来自不同蛋白质家族、并且贯穿整个进化时间线的蛋白质进行语言模型的预训练。他们使用了掩码语言模型的一个版本,其中他们删除了部分氨基酸序列并要求算法填写这些空白。“语言训练是无监督学习,它只对序列进行训练,”Rives 解释说。“这样做会使该模型学习数百万个蛋白质序列中的模式。”

然后,他们冻结语言模型并在其上训练折叠模块。在训练的第二阶段,他们使用监督学习。监督学习数据集由来自世界各地研究人员提交的蛋白质数据库中的一组结构组成。然后使用 AlphaFold(DeepMind 的技术)进行预测。“这个折叠模块接受语言模型输入,并基本上输出蛋白质的 3D 原子坐标(来自氨基酸序列)。”Rives 说。“这会产生这些表示,然后使用折叠头将它们投射到结构中。”

Rives 设想,该模型可用于研究应用,例如在生化水平上了解蛋白质活性位点的功能,这些信息对于药物开发和发现可能非常重要。他还认为,未来人工智能甚至可以用于设计新的蛋白质。

<<:  PopSci 的 High Issue 献给所有有远大梦想的人

>>:  火星快车刚刚与火卫一近距离接触

推荐阅读

使用这款售价 199 美元的高尔夫模拟器,像大师赛职业选手一样挥杆

Netflix 上《全挥杆》的火爆和即将举行的大师赛让世界各地的高尔夫球手兴奋不已。冬天仍是如火如荼...

Kuromi 的美丽旅程:魅力动漫的评分和推荐

Kuromi 的美丽旅程 - Kuromi 的冒险和成长故事由三丽鸥人气角色黑美主演的新动画系列《黑...

加拉帕戈斯群岛鸬鹚是如何忘记飞翔的

鸬鹚外形独特,羽毛呈深色,是捕鱼高手,它们会潜入深海追捕猎物。世界上有 40 种鸬鹚,它们都是游泳高...

戴帽子的机器人水母未来有一天可以探索海洋深处

为了更好地了解海洋的整体健康状况,研究人员希望利用一些进化最简单的生物作为评估水生生态系统的工具。他...

汉堡王“低甲烷”皇堡的难以忽视的真相

当我们胃不舒服时,我们可能会泡一杯草药茶。现在,似乎肉牛也可以从饲料中的草药(尤其是柠檬草)中受益,...

魔鬼桥评论:引人入胜的故事和深刻的人物

《鬼桥》——重新评价一部被遗忘的经典动漫1958年上映的动画电影《鬼桥》凭借其独特的世界观和优美的画...

天还没亮时如何醒来

本文已更新。最初于 2018 年 10 月 22 日发布。你正享受着舒适的美梦,直到闹钟突然响起。但...

最佳电子阅读器奖实际上是平局

本文已更新。最初于 2020 年 4 月 25 日发布。电子书阅读器是未来的最明显标志之一——在口袋...

五大湖的水位达到了前所未有的高度,我们不确定接下来会发生什么

苏必利尔湖附近的一条公路将密歇根州的基威诺湾印第安人社区与该州其他地区连接起来。大雨期间,岩石和木头...

纳米萤火虫技术可制造无需电力的灯

萤火虫通过化学反应照亮夏日黄昏的草坪,这种化学反应发生在发光物质和其相关酶之间。荧光素和荧光素酶分别...

皮卡正在使用应用程序、摄像头和其他技术来简化拖车

广告通常将皮卡买家描绘成拖运恶魔,不停地拖运他们的船、马和全地形车。然而,根据卡车制造商的说法,实际...

如何在电影院选择最佳座位以获得最佳音效和画面

几乎每个人都曾经历过这样的场景:从主角鼻子底下的牛奶胡子的视角观看大片。前排是迟到者被驱逐的地方,那...

《期末考试鲸鱼》的号召力与评价:感人的结局和深刻的人物

《期末考试鲸鱼》:荒诞世界的吸引力和令人心碎的故事介绍《期末考试鲸鱼》于 2007 年播出,是一部根...

海鹦以科学的名义戴上性感的小太阳镜

海鹦不需要太阳镜。尽管海水和雪地的光芒刺眼,这些小鸟多年来一直不借助时尚眼镜生存。是科学家,而不是海...

《财富之谜 L》的魅力与评价:冒险与命运的故事

财富探索 L - 财富探索 L - ■ 公共媒体电视动画系列■ 原创媒体轻小说■ 播出时间1997 ...