Meta 的人工智能可能会改变我们研究蛋白质结构的方式

Meta 的人工智能可能会改变我们研究蛋白质结构的方式

蛋白质是维持生物体正常运转的重要成分。它们帮助修复细胞、清除废物,并将信息从身体的一端传递到另一端。

科学家们为破译蛋白质的结构和功能做了大量工作,为此,Meta 的人工智能研究团队今天宣布,他们使用了一种模型,可以根据蛋白质的氨基酸序列预测其三维结构。与 DeepMind 等该领域的先前研究不同,Meta 的人工智能基于语言学习模型,而不是形状和序列匹配算法。Meta 不仅发布了关于这项研究的预印本论文,还将向研究界和业界开放该模型和蛋白质数据库。

首先,为了说明理解蛋白质形状的重要性,我们来上一堂简短的生物学课。基因中的某些三联核苷酸序列由细胞中的一种称为核糖体的分子翻译成氨基酸。蛋白质是氨基酸链,它们会自行组合成独特的形式和结构。一门名为宏基因组学的新兴科学领域正在利用基因测序来发现、分类和注释自然界中的新蛋白质。

Meta 的 AI 模型是一种新的蛋白质折叠方法,其灵感来自大型语言模型,旨在预测宏基因组数据库中数亿个蛋白质序列的结构。了解这些蛋白质形成的形状将为研究人员提供线索,帮助他们了解蛋白质如何发挥作用,以及它们与哪些分子相互作用。

[相关:Meta 认为其新的 AI 工具可以使维基百科更加准确]

“我们首次大规模表征了宏基因组蛋白质。我们将数据库作为开放科学资源发布,其中包含超过 6 亿个蛋白质结构预测,”Meta AI 研究科学家 Alex Rives 说道。“这涵盖了一些最不为人所知的蛋白质。”

历史上,计算生物学家曾使用进化模式来预测蛋白质的结构。蛋白质在折叠之前是线性的氨基酸链。当蛋白质折叠成复杂的结构时,线性链中可能相距很远的某些序列可能会突然变得非常接近。

“你可以把它想象成一个拼图中的两块碎片,它们必须拼在一起。进化不能独立地选择这两个位置,因为如果错误的碎片在这里,结构就会崩溃,”里夫斯说。“这意味着如果你观察蛋白质序列的模式,它们包含有关折叠结构的信息,因为序列中的不同位置会相互变化。这将反映出蛋白质的一些潜在生物学特性。”

与此同时,DeepMind 的创新方法于 2018 年首次亮相,主要依赖于一种称为多序列比对的方法。它基本上会在大量蛋白质序列进化数据库中进行搜索,以找到与其预测的蛋白质相关的蛋白质。

“我们的方法的不同之处在于,我们直接根据氨基酸序列进行预测,而不是根据这组多个相关蛋白质进行预测并查看模式,”Rives 说。“语言模型以不同的方式学习了这些模式。这意味着我们可以大大简化结构预测架构,因为我们不需要处理这组序列,也不需要搜索相关序列。”

Rives 声称,这些因素使他们的模型比该领域的其他技术更快。

[相关:Meta 希望通过研究人类大脑来改进其人工智能]

他们如何训练这个模型来完成这项任务?这需要两个步骤。首先,他们必须对大量具有不同结构、来自不同蛋白质家族、并且贯穿整个进化时间线的蛋白质进行语言模型的预训练。他们使用了掩码语言模型的一个版本,其中他们删除了部分氨基酸序列并要求算法填写这些空白。“语言训练是无监督学习,它只对序列进行训练,”Rives 解释说。“这样做会使该模型学习数百万个蛋白质序列中的模式。”

然后,他们冻结语言模型并在其上训练折叠模块。在训练的第二阶段,他们使用监督学习。监督学习数据集由来自世界各地研究人员提交的蛋白质数据库中的一组结构组成。然后使用 AlphaFold(DeepMind 的技术)进行预测。“这个折叠模块接受语言模型输入,并基本上输出蛋白质的 3D 原子坐标(来自氨基酸序列)。”Rives 说。“这会产生这些表示,然后使用折叠头将它们投射到结构中。”

Rives 设想,该模型可用于研究应用,例如在生化水平上了解蛋白质活性位点的功能,这些信息对于药物开发和发现可能非常重要。他还认为,未来人工智能甚至可以用于设计新的蛋白质。

<<:  PopSci 的 High Issue 献给所有有远大梦想的人

>>:  火星快车刚刚与火卫一近距离接触

推荐阅读

更长的赛季和更智能的旅行可以让体育运动更加可持续

去年春天,新冠疫情导致世界停摆,全球活动、音乐会和体育赛事也随之中止。世界不再那么喧嚣,排放量也创下...

Chrome 和 Safari 如何帮助你增强密码

本文已更新。最初于 2019 年 11 月 4 日发布。选择一个好的密码意味着要在简单到不会忘记的密...

这款 V-Frame BirdBike 在总统日期间可在网上以最优惠的价格购买

骑自行车是一种享受新鲜空气的好方法,既可以在日常通勤途中、跑腿时锻炼身体,也可以在想要冒险时使用。同...

为什么你社区的下一个太阳能电池板项目应该建在停车场上方

在停车场上方建造太阳能顶棚在全国各地越来越常见——您已经可以在大学校园、机场和商业办公楼附近的停车场...

如何制作宇宙香肠?

大约 100 亿年前,一个小星系与我们的银河系相撞,形成了一条宇宙香肠。所谓的“盖亚-土卫二香肠”(...

IBM 认为它可以让你成为更好的作家

使用 IBM 的 Tone Analyzer 进行示例分析。IBM Watson Developer...

增强您的骑行体验

我是一名机械工程师,喜欢骑自行车。2009 年,当油价飙升时,我骑自行车以省钱。我想在通勤期间为手机...

北极变暖导致南部海域交通堵塞

科学家们站在加拿大破冰船阿蒙森号附近的海冰上。David G. Barber在加拿大纽芬兰岛东北部海...

在亚马逊上购买 DEWALT 钻头和钻头驱动器套装可节省 90 美元

春天来了,白天也更长了,可以开始做整个冬天都没做过的 DIY 项目了。值得庆幸的是,DEWALT 为...

电子战如何影响俄罗斯-乌克兰危机

2014 年 2 月,俄罗斯军队占领乌克兰克里米亚半岛时,据报道俄罗斯海军干扰了手机信号。这种攻击,...

女皇之刃无限版——全面回顾迷人战士的全新冒险

女皇之刃无限 - 女皇之刃无限概述《Queen's Blade UNLIMITED》是一部以...

闪电、暴风雪:雷雪的形成

本月初,冬季风暴格雷森席卷美国东海岸,带来了一些不受欢迎的礼物——从弗吉尼亚州到缅因州,严寒、停电、...

石油先知

在《石油先知》一书中,梅森·英曼通过 M. King Hubbert 的故事,探讨了“石油峰值”的历...

从 Paint 3D 到 Teams,所有适用于 Windows 11 的免费应用程序

与早期版本的操作系统一样,Windows 11 内置有实用的免费应用程序。熟悉这些程序可以节省您下载...

欧洲订阅服务 Spotify 将改变美国人听音乐的方式

订阅音乐服务并不新鲜,即你每月支付费用(通常约为 10 美元)即可无限制地访问庞大的音乐目录。在美国...