英伟达CEO说生命科学是未来 是想再称王?但安腾计算机已是霸主

近日,在阿联酋迪拜举行的2024年世界政府峰会上,当被问及“如果站在科技的前沿,人们到底应该学习什么”时,英伟达创始人兼CEO黄仁勋回答

近日,在阿联酋迪拜举行的2024年世界政府峰会上,当被问及“如果站在科技的前沿,人们到底应该学习什么”时,英伟达创始人兼CEO黄仁勋回答称,“学计算机的时代过去了,生命科学才是未来。”

image.png

图片来源:英伟达中国官方网站

为何要提生命科学?英伟达想在生物计算赛道再称王?

很显然,作为市值万亿美元公司的老板,算力大佬黄仁勋在公共场合说出来的每一句话背后必有深层的含义,多半是打着推动英伟达算力生意增长的如意算盘。所以在这样重要的场合,他为什么要特别提到生命科学呢?

首先,生命科学领域发展的背后离不开生物计算的支持。生物计算是以生物大分子作为“数据”的计算模型,相当于把试管和显微镜下的实验转移到电脑的数字空间中进行。生物计算可以用来预测蛋白质的三维结构,而后者无论对于病理研究还是药物研发来说都是最为至关重要的信息。不过,生物计算通常需要消耗极大量的高性能计算资源,显然这就是英伟达看上的生意大蛋糕。

黄仁勋认为,当把生物学带入计算机的世界将会是人类的一个奇迹。两者结合而成的数字生物学将会成为工程学而不是单纯的科学,这会让生命科学这个最复杂、最难以理解、同时又最具影响力的科学领域,不再是零星地、而是指数级地迎来革命性改进和发展。生物计算无疑是过程中最重要的工具手段之一,科技媒体量子位曾经的报道《被AI激活的计算生物赛道:发展30年不被主流接纳,如今一年投资近400亿元》也印证了生物计算这个新赛道的潜力与规模。

其实,黄仁勋一直在身体力行地带动整个行业来开拓这个新的大赛道。生物计算的应用场景之一就是在AI制药领域,自2023年以来,英伟达开始频繁在AI制药领域投资出手,5月至11月半年间陆续投资了9家AI制药公司。看起来,英伟达想在生物计算赛道再称王,让AI制药企业都用上他们的显卡。

image.png

图片来源:医药魔方

不过,英伟达是否真的在生物计算赛道中,同样具有跟人工智能领域一样不容置疑的绝对统治力呢?

在黄仁勋的观点下,有网友评论道:“化学需要的算力和运算方法是常规CPU解决不了的,大概在20年前,美国就有大咖投了很多钱开始开发生物化学专用的CPU,真是敢想敢干。……”

image.png

图为网友观点

这位网友提到美国大咖,大概率指的就是美国计算机领域天才级的人物David E. Shaw博士,以他的名字命名的D. E. Shaw研究所早在2007年就首次发布了一台名为安腾(Anton的专用超级计算机。英伟达引以为傲的超强算力性能,在这台超级计算机面前可以说是丝毫没有胜算。

image.png

图为安腾超级计算机

在生物计算赛道美国安腾超级计算机早已称霸世界十余年

在生物计算、AI制药等新兴赛道中,英伟达可能不会如愿成为唯一的主导者,安腾超级计算机(Anton)已经在生物计算赛道称霸超过十年以上了。

据公开数据显示,最新的第三代安腾超级计算机(Anton3)执行分子动力学模拟的速度比8张英伟达A100显卡还要快上100倍多,比现有通用超级计算机更是快1000倍以上,妥妥的降维打击。

为什么安腾(Anton)能比我们所熟知的英伟达还要厉害?

原因是因为安腾(Anton)在设计之初就只专注于实现一种计算的加速,那就是分子动力学模拟计算,这是生物计算领域中最常用的一种计算方法。彻底放弃了算力的通用性之后,换来的是所有软硬件资源的集中带来的究极加速性能,因此安腾(Anton)在运行分子动力学模拟计算时展现出碾压英伟达的性能是再正常不过的事情,在生物计算领域,安腾(Anton)可以说是毫无疑问的性能的“神”。

关于安腾超级计算机(Anton)的神话有很多,可以说,安腾(Anton)几乎凭借一己之力让美国生物计算领域的发展领先了世界十年。五六年前,制药上市公司Relay通过彼时还在第二代的安腾超级计算机(Anton2),仅用18 个月、不到 1 亿美金,就确认了一款胆管癌治疗药物 RLY-4008 的结构,这样的研发效率震惊了全球制药业,在过去的认知里,一款新药的研发最少也需要用至少10年、10亿美金才够!

安腾超级计算机与英伟达的生物计算路线之

实际上,安腾(Anton)和英伟达各自采取进入生物计算领域的技术路线也存在一定的差异。一般来说,生物计算的实现可以分为数据驱动和物理驱动这两种不同的技术路线。

图片来源:unsplash

数据驱动计算路线对应的就是我们非常熟知的AI计算,也是英伟达一手推动的路线。任何领域AI计算成功的前提都是基于海量数据的模型训练,并且由于AI模型的“黑盒”属性,人们也无法真正解释输入的数据和输出的模型之间的准确关系。目前,真正能掌握大量生物信息数据的机构可以说是凤毛麟角,因此哪怕是拥有了大量AI算力,也并不意味着一定能在生物计算领域取得成功。

而物理驱动计算路线则是基于物理定律来解释和预测生物系统的行为,完全不依赖于先验的数据,具备“天然准”的优势,安腾(Anton)专注解决的分子动力学计算就是一种典型的物理驱动方法,至今已经发展了六七十年,只需要知道蛋白质大分子的氨基酸序列,基于其初始三维结构状态和一系列环境参数的输入,就可以对蛋白质的结构变化和功能进行预测和研究,并且对于研究过程中的每一步都可以对数据进行分析和解释。

当然,生物计算要真正从襁褓期走向应用的成熟期,以上两种路线的发展都不可或缺。例如,数据驱动的AI计算仅从氨基酸序列就可以得到蛋白质初始结构,可以很方便地为物理驱动计算提供必要的初始数据输入,否则后者必须依赖大量的实验来得到初始的结构数据信息才能启动计算;而物理驱动计算则可以高效生成大量的蛋白质动态结构数据,而这些动态数据又将能替代实验数据成为AI模型训练最好的材料,从而不断提升AI预测模型的精度。

警惕再被卡脖子中国迫切需要发展属于自己的生物计算算力基础设施

眼看着生物计算领域即将迎来又一轮激烈的技术竞争,面对大量万亿GDP级别未被开拓的蓝海市场,以及面对人类生命终极奥秘的解析的科学竞赛,中国也迫切需要发展属于自己的生物计算算力基础设施。

由于美国搞科技霸权,一纸英伟达高端GPU的禁售令,让中国人工智能领域的发展受到很大限制。而到了生物计算领域情况也是一样,英伟达的高端GPU被禁售自不必说,世界上仅有的几台安腾超级计算机(Anton)更是在美国国家科学院独立专家委员会的监督下,严格对中国科学家实施禁售和禁用。

当下的中国,人们对于AI计算领域的卡脖子危险已经有了足够的认识和警觉,随着国内现有AI算力的使用场景和需求量迎来爆发,逐渐也有大量国产化替代的方案正在迎头追赶国外的技术壁垒。不过,在安腾超级计算机(Anton)这一端,由于其应用面的相对狭窄,过去一起没能引起更多人对于这条技术路线的注意。不过随着当下生命科学和生物计算领域发展势头的觉醒,安腾(Anton)代表的科学和产业价值将越来越不可被忽视。

据了解,安腾超级计算机(Anton)从硬件层面的芯片、主板、布线,到软件层面的专用软件Desmond的开发,均是由D. E. Shaw研究所特殊设计的。通过特殊定制的ASIC专用芯片,安腾(Anton)能够尽可能地减少数据的传输和运算,在芯片上精细化地分区域、分精度分配计算不同任务,从而一举突破制约分子模拟速度的瓶颈——原子间相互作用力的计算。

像安腾(Anton)这样的一台专用超级计算机的设计和研发,无疑需要动用巨大的金钱和时间代价,不过在基础生命研究、药物研发等重大领域,我们必须要从现在开始打好基础,建设好支撑海量生物计算算力的基础设施,才能在未来的竞争中逐渐稳扎稳打、最终实现弯道超车。