“AI军火商”英伟达是如何炼成的
我渴望活下去的意志,超过几乎所有人想要杀死我的意志。——黄仁勋
“这不是演唱会,你们是来参加开发者大会的!”今日凌晨4点,黄仁勋出场时,现场爆发出巨大的欢呼声
当地时间2024年3月18日,黄仁勋在英伟达GTC大会发表主题演讲。
“通用计算已经失去动力,现在我们需要更大的模型,我们需要更大的GPU,更需要将GPU堆叠在一起”,黄仁勋在英伟达 GTC 大会上说道。大模型参数量正在呈指数级增长,此前 OpenAI 最大的模型已经有 1.8T 参数,需要吞吐数十亿 token。即使是一块 PetaFLOP 级的 GPU,训练这样大的模型也需要 1000 年才能完成。“AI军火商”英伟达是如何炼成的?
全球的科技公司争抢H100芯片的势头于2023年年末开始有所减弱,但新一代“强心剂”已来。英伟达推出新一代的AI芯片“Blackwell”,“这是块非常非常大的GPU”。英伟达在发布会上表示,相较于之前的 H100 芯片,GB200 超级芯片可以为大语言模型(LLM)推理负载提供 30 倍的性能提升,并将成本和能耗降低 25 倍。
Blackwell的发布意味着,近8年来,AI算力增长了一千倍
人们已经发现:将深度学习应用到许多领域的科技公司,几乎每一个都是在英伟达的平台上构建的。一位华尔街分析师对此表示:“人工智能领域正在进行一场战争,而英伟达是唯一的军火商”。华尔街的追捧在2023年-2024之间上升到极致。短短八九个月,英伟达的市值从万亿美元飙升到两万亿美元。目前,英伟达已经成为全球市值第三大的公司,仅次于微软和苹果。“AI军火商”英伟达是如何炼成的?
不过,这家看似新锐的科技公司,已经走过了30年历程,几经浮沉。
目前,英伟达的产品仍然处于供不应求状态。在此背景下,英伟达毛利率拉至60%左右。在连年寻找新技术突破的大额支出之下,任何一家科技公司,想要保持这样的成绩单,都是难能可贵的。
GPU,英伟达的代名词
故事要从20世纪90年代说起。
当时,硅谷已有人提出,可以通过声卡、网卡这些功能指定的芯片,来降低 CPU(中央处理器)的工作负载。所以同理,做一张专门控制电脑图像输出的芯片,即显卡(Graphic Card),也是自然而然的。例如索尼在 1994 年年底推出的游戏机 PlayStation 就运用了显卡。
但显卡的技术路径,在当时有很多,英伟达找到的切入点是通过并行计算,实现3D图形加速,特别在游戏领域上进行应用。
1999年,英伟达推出了一款名为GeForce的显卡。
这款被冠以“全球首款GPU”的图形处理器,采用了220纳米制造工艺,如今英伟达H100所使用的制造工艺已到了4纳米。
GeForce最大的亮点是“并行计算”,即把一个复杂的任务拆分成小计算,然后同时处理它们。这与中央处理器 CPU(central processing unit)有着显著不同,在标准的计算机架构中,CPU 一次能处理一个问题。如果说把通用的CPU比作一辆货车,一次运送一个大包裹到一个目的地;那么GeForce则像是在一组摩托车车队,可以同时运送多个小包裹到多个目的地。