跨越5亿年自然演化史,AI蛋白质生成模型ESM3诞生,辉达也投资 body classpost

生物学前端人工智慧研究实验室 EvolutionaryScale 近日宣布获得超 1.42 亿美元种子轮融资,同时释出里程碑式 AI 模型 ESM3。本文将探讨这间公司在 AI 生命科学领域的独特理念,以及生物相关的技术突破。
(前情提要: Meta招募「元宇宙AI专家」年薪破千万!要求以生成式工具创造新游戏体验)
(背景补充: 把MetaMask变金融卡》冷钱包Tangem合作Visa,年底推出「Tangem Pay」)

本文目录

生物学前端人工智慧研究实验室 EvolutionaryScale 近日宣布获得超 1.42 亿美元种子轮融资,同时释出里程碑式 AI 模型 ESM3。这家成立仅一年的公司在 AI 生命科学领域有着怎样独特的理念?全新的蛋白质大模型又有着怎样的技术突破?以下是我们的第 17 期内容,Enjoy。

一周前,在 Meta 如火如荼地卷文字生影片的时候,那个被它解散的蛋白质团队 EvolutionaryScale 获得了超 1.42亿美元的种子轮融资,这个融资额在整个生物技术领域都可以说是高得离谱。

去年八月,Meta 官宣旗下的蛋白质折叠团队 Meta-FAIR 解散。这个纯粹的 「科学 + AI」 专案并不能让 Meta 快速获得收益,Meta专注商业化 AI 的决定看似也是情理之中。

然而,这个不被看好的团队竟用仅仅一年的时间就打了 Meta 的脸。他们最新推出的 ESM3 被认为是生物学领域具有里程碑意义的生成式 AI模型,为生物学程式设计开创了新的可能性。

01. 分钟专案速览

1. 专案名称:EvolutionaryScale

2. 成立时间:2023 年 7 月

3. 产品简介:开发用于创造新型蛋白质和其他生物系统的大型语言模型 ——ESM,目前已迭代到 ESM-3。

4. 创办人团队:

5. 融资情况:
2024 年 6 月 25 日完成了高达 1.42 亿美元的种子轮融资。本次融资由 Nat Friedman 和 Daniel Gross 以及 LuxCapital 领投,亚马逊、NVentures(NVIDIA的风险投资部门)和天使投资人参投。

02. 团队协同一致的理念追求

人工智慧的进步为生物科学研究创造了前所未有的机会,包括设计功能性生物分子,尤其是蛋白质。将人工智慧运用于蛋白质设计,不仅可以提升蛋白质设计的效率及成功率,还通过快速应对传染病爆发等方式,来帮助人类解决一些正在面临的挑战。

Alexander Rives 等人正是看到了蛋白质设计方面的缺口,决定开发基于深度学习的大模型,从而推动产业级蛋白质设计进入 「全自动智慧生成时代」。

于是,EvolutionaryScale 应运而生。它是一家专注于生物科学领域的前端 AI 研究实验室,致力于推出生物学前端的语言大模型。

有意思的是,该公司创始团队的八位成员全都来自于 Meta 的 FAIR(基础人工智慧研究)部门。尽管在世界级的社交媒介巨头那里吃了瘪,但初始团队的核心人员都没有放弃,反而快速地投入新战地,开始在原有团队成果的基础上开发下一代模型。

EvolutionaryScale的大模型支援健康、环境科学等领域的研究与开发,不停探索生物学的扩展套件性,为突破性的科学研究提供动力。其中最显着的成果就是蛋白质折叠技术的突破,ESM模型揭示了数亿个巨集基因组蛋白质的结构,帮助世界各地的科学家来模拟和理解蛋白质。

EvolutionaryScale 旨在通过开放、安全的研究方式,来指导蛋白质设计领域的人工智慧技术开发。

在此基础上,该公司作为签署方,引领了超 160位来自学术界、政府以及民间的全球利益相关者,共同发展这项技术,确保其安全可靠,从而达成造福人类健康和社会的愿景。

正是由于怀着引领生物学界先进 AI 技术的责任感,Alexander Rives 和他的团队从未停止脚步。

此前,EvolutionaryScale 曾释出过大型语言模型 ESM1,这被认为是第一个用于蛋白质的 transformer 语言模型,由 EvolutionaryScale 的创始团队在 Meta 的 FAIR 部门工作期间所构建。作为 ESM1 升级模型的 ESM2 拥有 1500万个引数,并且相较于旧模型 ESM1b(拥有 6.5 亿个引数)表现更佳。

上周,EvolutionaryScale 释出了最新的 ESM3 AI模型,这是朝着生物学的未来所迈进的一大步。凭藉这种模型的能力,有可能会加速广泛应用的发现,有利于创造有助于捕获碳的蛋白质,从而开发出新的癌症治疗方法。

03. AI 在生物学应用的先驱

ESM3 是一个生成式的 AI模型,主要功能是生成新型蛋白质。该模型通过深度学习技术,使用大量的蛋白质资料进行训练,从而学习蛋白质的序列、结构和功能之间的关系。

ESM3 的训练使用了超过 1 兆 teraflops 的计算能力,这是目前已知生物学领域中最大的计算规模。它在地球上自然多样性的 27.8亿种蛋白质资料集上进行了训练,使其能够同时对蛋白质的序列、结构和功能进行推理。

ESM3 的主要工作流程可简略为以下四个步骤:

目前,ESM3 最引人注目的使用案例之一是生成了一种新的绿色荧光蛋白(GFP)。

GFP 是自然界中最美丽和独特的蛋白质之一,负责水母的发光和珊瑚的鲜艳荧光色。ESM3 通过一系列思考过程,跨越了 5亿年的进化,创造了这种新的荧光蛋白。这一过程在自然进化中可能需要超过 5 亿年,而 ESM3 通过计算方法实现了这一飞跃。

ESM3 的释出也为药物发现和合成生物学领域带来了革命性的变化。

在药物发现方面,ESM3 能够生成具有特定生物活性的新型蛋白质,为药物筛选和优化提供了更多的候选分子。同时,ESM3还能够预测和优化药物与靶点的相互作用机制,为药物的设计和开发提供更加科学的依据。

在合成生物学方面,ESM3 能够生成具有特定功能的生物系统,为生物制造和生物能源等领域提供了新的解决方案。例如,ESM3可以生成出将二氧化碳高效转化为有机物的酶系统,为碳捕获和利用提供了新的途径。

EvolutionaryScale 的 ESM3 模型代表了 AI 在生物学领域的新里程碑。通过其强大的生成能力和与行业领导者的合作,ESM3有望加速新型蛋白质的发现和生物系统的设计,为未来的药物开发、材料科学和环境科学等领域带来革命性的影响。

04. 生物学领域创新之旅

合成生物学:程式设计生命

合成生物学是 EvolutionaryScale 未来发展的一个重要方向。通过设计和合成新的基因电路和生物路径等方式,科学家们可以建立具有特定功能的生物体。

若此项技术能继续发展,不仅将推动科学研究的前端发展,还能为医药、环境保护和农业等领域带来重要的应用前景。

资料驱动的个性化医疗
EvolutionaryScale 正通过 AI 和大资料分析技术推动个性化医疗的进步,为患者提供更加精准和高效的医疗服务。

个性化医疗是基于每个患者的独特生物学资讯和临床资料,量身订制最合适的治疗方案。其中一个关键领域是基因组分析。通过对患者的基因组进行全面测序和分析,科学家可以识别出与疾病相关的基因变异。

EvolutionaryScale 利用 AI技术,快速准确地解析大量基因组资料,从中发现潜在的疾病风险因素。这种方法可以帮助医生在疾病的早期阶段做出诊断,并采取预防措施。例如,通过分析乳腺癌患者的 BRCA1 和 BRCA2 基因突变,可以预测其患病风险,从而进行早期筛查和干预。

如今,EvolutionaryScale正站在生物学与人工智慧融合的前端,通过不断创新和探索,致力于实现生物系统的程式设计和优化。后续或将实现更多技术性的突破,为人类开创一个更加智慧和健康的未来。

📍相关报导📍

AI「筛检癌症」准确率达98%!剑桥研究只要DNA,就能加速早期诊断与治疗

Meta新推Ray-Ban智慧眼镜热销,能录影+AI语音助理,打开元宇宙新大门

我到孙宇晨家吃饭:谈Vision Pro、AI、太空旅行…科技宅男无疑

Leave a Reply

Required fields are marked *