一个B200顶五个H100:黄仁勋真正打破了摩尔定律

科技 俣辰

那个爱穿皮衣的黄姓男人又带着他的 “ 家伙事 ” 来炸场了。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

昨天凌晨, NVIDIA GTC 大会正式拉开帷幕, NVIDIA 创始人兼 CEO 黄仁勋现场两个小时的演讲,让能容纳两万人的 SAP 体育中心直接被塞爆了。

有网友把黄仁勋比作是新的乔布斯,还问 NVIDIA 会不会成为新的苹果。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

就连马斯克也称赞 “ 现在没什么硬件能比 NVIDIA 的更适合 AI 。 ” 

反正这次大会,老黄和 NVIDIA 是又被捧到了新高度。

那这次开发者大会,到底都讲了些啥?大会演讲全程两个小时,没有耐心看完演讲的友友们,直接看我的总结就行。

之前,有网友调侃过老黄是科技圈的泰勒 · 斯威夫特,所以这次一开场,老黄就先水了一波观众:注意注意,这不是演唱会,这是开发者大会。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

接着又甩出一张图,跟大家伙儿唠了半小时计算机和 NVIDIA 的发展史,还 cue 到了当年把第一台 DGX-1 超级计算机送给 OpenAI 的事儿。

不过这些,都只是些餐前小甜点,真正的大菜在后面呢。因为这次演讲的主题叫做《 见证 AI 的变革时刻 》,估计大伙儿也能猜出个七七八八,大会内容基本跟 AI 脱不了关系。

首先就是,全新的GPU 架构 Blackwell ,和新芯片 B200 。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

大会现场,黄仁勋先是掏出了一块 H100 ,还夸它 “changed the world” 。

但下一秒 Blackwell 架构的 B200 出现以后,大伙儿的注意力就被老黄口中这个 “  NVIDIA 史上最成功的产品 ” 给吸引住了。

肉眼上看, B200 和 H100 最大的区别就是,前者要更大。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

根据介绍, B200 由两个 Die( 裸片 )封装组合而成的,包含了 2080 亿个晶体管( H100 是 800 亿个 ),可以支持参数量多达 10 万亿的 AI 模型搞训练推理。

并且, B200 的算力性能是 20PFlops ,而上一代 H100 只有 4PFlops 。

实际,在芯片制程上 B200 其实是没什么创新的,毕竟 4nm 工艺已经是目前这颗星球上的芯片极限了,所以 B200 另辟蹊径,两个芯片之间的数据传输速度足够快。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

这样,两块芯片就来了一波超级合体,约等于是一块芯片,但威力却加倍了。

大会上老黄还装了个 X :他说当他们被告知 Blackwell 的野心超出了物理极限时, NVIDIA 的工程师回了一句: 那又怎样?

另外,芯片还能继续像搭积木一样合体,把两块 B200 组合到一起,再跟 NVIDIA 的 Grace CPU 配对之后,又能整出一个超级芯片 GB200 。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

这个 GB200 ,直接把计算性能拉满了。

按照老黄的说法,在 1750 亿组参数的 GPT-3 模型基准测试中, GB200 的性能是 H100 的 7 倍.

以前要 90 天内训练一个 1.8 万亿参数的 MoE 架构 GPT 模型,需要 8000 个 H100 ,但现在,有 2000 个 GB200 就够了。

老黄在这,也算是非官方的透露了一下 GPT-4 的参数量, 1.8 万亿参数的 MoE ,和之前网友猜测的其实也大差不差。

更夸张的是,还有把 36 个 GB200 放一起的 GB200 NVL72 服务器,还有结合了 8 个 GB200 NVL72 的 DGX SuperPOD ,这些由 Blackwell GPU 垒起来的计算平台,一个比一个炸裂。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

甚至于,老黄也直接说 “ DGX SuperPOD 就是 AI 的革命工厂! ” 

之前科技公司不是老嚷嚷着搞大模型算力不够不够,这次老黄直接就整了个算力怪兽出来。

我只想说,友商连 H100 还没赶上呢,这 B200 怎么又遥遥领先了?

而且,操心底层算力还不算完, NVIDIA 这次连 AI 应用的落地也要掺和一脚。就说这个 NVIDIA 要推出的 NIM 推理服务吧,它可以提供预训练好的 AI 模型并开放 API ,再让客户自己来开发应用。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

举个例子, NVIDIA 这次推了 25 个医疗场景的微服务,这些微服务包括了一系列模型,比如预测蛋白质结构的 ESMFold 、生成化学的 MolMIM 等等等等,医疗公司就可以基于这些微服务,开发相关的应用出来。

按照老黄的说法,现在的 NVIDIA 就是一个 AI 代工厂,里面有模型、有模型开发工具,还有一系列基础设施。

这就相当于扩展了自己的 AI 生态链条, NVIDIA 一下子路就走宽了。

另外,这次大会还有个重头戏,那就是人形机器人基础模型 GROOT 。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

简单来理解,用 GROOT 驱动的人形机器人可以理解自然语言、模仿人类的行为,从而实现跟物理世界的交互,也就是咱们经常提到的具身智能。

为了配合人形机器人, NVIDIA 还专门发布了个人形机器人芯片 Jetson Thor 。这又是 GROOT 又是 Thor ,难不成老黄是要致敬漫威?

总的来说,这次 NVIDIA 的开发者大会干货还是挺多的。

反正新架构出来之后, NVIDIA 车载计算平台 “ NVIDIA DRIVE Thor ” 要升级的消息一传开,比亚迪以后也要把 NVIDIA DRIVE Thor 芯片用在自家车上了,还要用 NVIDIA 的基础设施来开发自动驾驶大模型。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

NVIDIA 的 Omniverse 平台也跟苹果来了波联动,让设计师可以戴着 Vision Pro 来设计汽车;台积电和新思科也要引入 NVIDIA 的光刻计算平台 cuLitho ,给芯片制造提一波速。

还有什么 AI 游戏数字人技术,地球气候数字孪生, NVIDIA 这次掏出来的东西基本上就没有水货。

AI 军火商果然名不虚传,反正从我的观察来看,今年以来 NVIDIA 的股价已经涨了超过 80% ,财报也是一片欣欣向荣。

但即便如此,不少人还是觉得 NVIDIA 的帝国背后,危机重重,有人觉得 NVIDIA 的生意太依赖谷歌、微软这些巨头了,不太具有持续性。

一个B200顶五个H100:黄仁勋真正打破了摩尔定律

也有人把 NVIDIA 比作是我们这个时代的思科,因为在上个世纪末,一堆人觉得思科的交换机和路由器,就是互联网时代的黄金,只要互联网在,思科的股价永远涨,可最后,思科的股价在互联网泡沫的破裂中,蒸发大半。

但不论如何,如今的 NVIDIA 依旧是 AI 芯片领域的最强话事人。

正如 NVIDIA 官网上说的那样,是他们发明了 GPU ,也是他们让 GPU 从专用的图形处理设备,变成了通用计算平台,从而推动了如今 AI 的发展。

所以在我的眼里, NVIDIA 不单单只是 AI “ 战争 ” 中的军火商,因为如今 AI 这个火热的场子,一定程度上都是 NVIDIA 搭起来的。

在新一代的 “ 军火 ” 亮相之后,我已经来不及想看下一阶段的 AI 大战,有多激烈和壮观了。

发表评论 取消回复
图片 链接