Jensen Huang(黄仁勋),NVIDIA 联合创始人兼 CEO,执掌这家公司超过 34 年,是全球任期最长的科技公司 CEO。NVIDIA 目前是全球市值最高的公司。
Lex Fridman,MIT 研究员、播客主持人,以长篇深度技术访谈著称,嘉宾涵盖科技、科学、哲学领域的顶尖人物。
原视频(2026-03-24 00:24 UTC+8,时长 2h25m):https://www.youtube.com/watch?v=vif8NQcjVf0
Lex Fridman 发布推文(2026-03-24 00:49 UTC+8):https://x.com/lexfridman/status/2036123301140111406
本文为该播客访谈的结构化整理,尽量忠实于原始对话内容。
这是 Lex Fridman Podcast 第 494 期。两人围绕 NVIDIA 的技术战略、AI 的四大 Scaling Law、CUDA 的诞生与豪赌、供应链管理、中国科技生态、以及 AI 时代下人类的角色展开了长达两个半小时的对话。以下是对话内容的结构化整理。
极致协同设计与机柜级工程
NVIDIA 长期以来的致胜之道是打造最好的 GPU,但如今它的野心已经远远超越了单颗芯片。被问及 NVIDIA 从芯片级设计扩展到机柜级设计的过程时,Jensen 首先解释了为什么需要极致协同设计:问题已经不再能装进一台计算机、被一块 GPU 加速了。
他描述了一个核心矛盾:你希望速度的提升超过你增加的计算机数量。比如你加了一万台计算机,但你希望它快一百万倍。要做到这一点,就必须把算法拆开、重构,对流水线做分片、对数据做分片、对模型做分片。而一旦进入这种分布式处理模式,所有东西都会成为瓶颈。
Jensen 用 Amdahl’s Law 来说明这个困境:对某个部分的加速效果取决于它在总工作量中占多大比例。如果计算只占问题的 50%,哪怕把计算加速一百万倍,总工作量也只快了两倍。因此,不仅要分布式地计算,还要想办法对流水线做分片,解决网络问题——因为所有计算机都连在一起。在 NVIDIA 这个规模的分布式计算中,CPU、GPU、网络、交换、工作负载分配,每一项都是问题。
这是一个极其复杂的计算机科学问题。所以我们必须把每一项技术都用上。
Jensen 强调,如果不这样做,就只能线性扩展,或者按摩尔定律的能力来扩展——而摩尔定律已经大幅放缓了,因为 Dennard scaling 已经放缓了。
Lex 指出,这里面涉及完全不同的学科领域——高带宽内存、NVLink 网络、NIC、光学和铜缆、供电、散热——每个领域都需要世界级的专家。Jensen 对此的回应很直接:这就是为什么他的直接下属团队如此庞大。
Jensen 如何管理 NVIDIA
谈到极致协同设计的具体方法论,Jensen 做了系统性的拆解。
第一个层面是"它是什么":NVIDIA 在整个技术栈上做优化——从软件架构到芯片、到系统、到系统软件、到算法、到应用。第二个层面是超越单一组件,横跨 CPU、GPU、网络芯片、纵向扩展交换机和横向扩展交换机,再加上供电和散热——因为这些计算机做了大量工作,能效很高,但总量加起来仍然消耗巨大的电力。第三个层面是"怎么做到的",而这正是 Jensen 认为 NVIDIA 的奇迹所在。
Jensen 用了一个类比:设计一台计算机需要一个操作系统;设计一家公司,首先应该想清楚这家公司要产出什么。他观察到很多公司的组织架构图长得都一样——汉堡公司、软件公司、汽车公司,组织架构图几乎没有区别。在他看来这毫无道理。
一家公司的目标,就是让公司成为一台机器、一个机制、一个系统,来产出输出。而那个输出就是我们想创造的产品。
公司的架构还应该反映它所处的环境。这几乎间接地决定了组织应该怎么设计。Jensen 的直接下属有 60 个人——实际上更多。其中几乎所有人都有工程背景:内存专家、CPU 专家、光学专家、GPU 架构师、算法专家、设计工程师。Jensen 时刻关注着整个技术栈,并且就整个技术栈的设计进行深入讨论。
Jensen 不做一对一会议,原因很直接:60 个直接下属不可能做一对一。更关键的是,NVIDIA 的每一个问题都不只涉及一个人。 他们提出一个问题,然后所有人一起攻克它——因为他们在做极致协同设计。即使在讨论某个特定组件(比如散热或网络),所有人都在旁听。有人可以随时指出"这对供电分配不行"或"这对内存不行"。谁想退出讨论就退出,但如果有人本可以贡献意见却没有参与,Jensen 会把他叫出来加入讨论。
从加速器到计算平台:NVIDIA 的演化之路
Lex 把话题引向了 NVIDIA 的转型起点——从游戏 GPU 到 AI 工厂,这个转变是从什么时候开始的?Jensen 做了一次系统性的推理。
NVIDIA 一开始是一家加速器公司。加速器的优势在于针对特定任务做了极致优化——任何专才都有这个优势。但过度专业化的问题在于,市场规模决定了研发能力,而研发能力最终决定了在计算领域能产生多大的影响力。Jensen 一直知道加速器只是第一步,必须找到一条路成为加速计算公司。但这里存在一个根本性的张力:作为计算公司做得越好,作为专才就做得越差;越是专才,在整体计算方面的能力就越有限。
这家公司必须找到那条非常窄的路径,一步一步地扩大我们的计算版图,同时不放弃我们最重要的专业化优势。
Jensen 回顾了 NVIDIA 一步步走向通用计算的历程。第一步是发明可编程像素着色器,这是走向可编程性的开端。第二步是在着色器中加入兼容 IEEE 标准的 FP32,这让所有做流处理器和数据流处理器的人注意到了 NVIDIA——他们发现这个计算能力超强的 GPU 突然可以运行之前在 CPU 上写的软件了。FP32 之上加了 C 语言支持(Cg),Cg 这条路最终通向了 CUDA。
CUDA 的豪赌
把 CUDA 放到 GeForce 上,是 Jensen 口中"第一个接近于生存威胁级别的战略决策"。
核心逻辑是装机量。Jensen 解释说,一个计算平台的核心是开发者,而开发者来一个平台,是因为装机量大——他们想开发能触达大量用户的软件。他用 x86 作为例子:从来没有哪个架构比 x86 招来更多批评——一个不太优雅的架构,但它却是当今的主导架构。相比之下,很多 RISC 架构虽然设计精美、由世界上最聪明的计算机科学家精心打造,最后基本上都失败了。
装机量定义了一个架构。其他一切都是次要的。
当时市场上有 CUDA、OpenCL 和其他几个竞争架构。NVIDIA 做出的关键决策是:把 CUDA 放到每年已经在卖几百万块的 GeForce GPU 上,把它装进每一台 PC,不管用户用不用,以此培育装机量。同时大规模推广——去大学、写教材、开课程,把 CUDA 带给每一个在校研究人员、每一个科学家、每一个工程学院学生。
但代价极其沉重。CUDA 大幅增加了 GPU 的成本——增加得如此之多,完全吞噬了公司所有的毛利润。当时 NVIDIA 的市值大概六七十亿美元,推出 CUDA 之后跌到了大概十五亿美元。公司在那个低谷待了一段时间,然后慢慢爬了回来。但 Jensen 一直让 GeForce 承载着 CUDA。
我总是说,NVIDIA 是 GeForce 建起来的房子,因为是 GeForce 把 CUDA 带给了每一个人。
研究人员、科学家、大学实验室里的人——他们在 GeForce 上发现了 CUDA,因为他们本来很多就是玩家,很多人自己攒 PC、用 PC 零件搭集群。Jensen 曾向管理团队说清楚毛利率会被碾压——GeForce 扛着 CUDA 的负担,但没有玩家会感激这一点,也不会为此买单。当时 NVIDIA 是一家毛利率 35% 的公司,而 CUDA 增加了 50% 的成本。
Jensen 说他可以通过推理说服自己负担得起——总有一天 CUDA 会进入工作站、进入超级计算机,在那些细分市场里能获得更高的利润。但那段路程整整花了十年。
塑造信念系统:Jensen 的领导方法论
Lex 追问这些生死攸关的决策背后的思维方式。Jensen 说他被强烈的好奇心所驱动。到某个时刻,一个推理系统会说服他:这个结果一定会发生。
我在脑海中确信了,而当我确信之后——你知道那种感觉——你在脑中构建了一个未来,那个未来如此令人信服,它不可能不发生。
中间会有很多煎熬,但必须坚信所相信的。他构想未来,然后从工程的角度把它变为现实。管理团队一起推理,所有人都参与。
Jensen 特别分享了他塑造组织信念的方法。很多领导者会保持沉默,突然发一个宣言——新的一年到了,大规模裁员、大规模组织调整、新使命宣言、全新 logo。Jensen 从来不那样做。当他了解到某件事并开始影响他的思考时,他会立刻让身边的人知道。他一步一步地推理,用外部信息、新洞察、新发现、新的工程突破来塑造其他人的信念体系。他每天都在做这件事——对董事会、对管理团队、对员工。
所以领导力有时候看起来像是在后面领导,但你一直在塑造他们的想法,以至于在你宣布的那天,百分之百的人都认同。
这样当他某天说"我们去收购 Mellanox 吧"或者"我们全力投入深度学习吧"的时候,所有人都觉得理所当然。Jensen 说他喜欢在宣布的那天听到员工说"你怎么现在才说"。他以 Grok 为例——他已经铺垫了两年半,回头看就会发现所有基础都是一步步铺好的。
GTC 的演讲也是这个策略的一部分。Jensen 不只是在公司内部塑造信念,他也在塑造行业合作伙伴的信念体系,并用它来反过来影响自己的员工。NVIDIA 本质上是一家计算平台公司——没有人能直接从 NVIDIA 买到最终产品。NVIDIA 做垂直设计和垂直整合来做优化,然后把整个平台的每一层都开放出来,让其他公司集成到他们的产品、服务、云和超级计算机中。如果不先说服整个生态,NVIDIA 就做不了它想做的事。
AI Scaling Laws:四条扩展定律
Jensen 明确表示他仍然相信 Scaling Laws,而且现在有更多的 Scaling Laws 了。他系统性地回顾了四条扩展定律的逻辑。
预训练 Scaling Law
最早的一条 Scaling Law 是预训练阶段的逻辑:模型越大,配合相应更多的数据,就能训练出更聪明的 AI。但 Ilya Sutskever 曾说出类似"我们没数据了"或"预训练已经结束了"的话,整个行业恐慌了,觉得 AI 到此为止了。
Jensen 认为这显然不对。训练数据的规模会继续扩大,其中很大一部分数据将是合成的。他指出,这一点让很多人困惑,但其实人类用来相互教授、传递信息的大部分数据本来就是"合成"的——不是从自然界直接产生的。信息在人与人之间不断被消费、修改、增强、重新生成。AI 现在也在做同样的事情:接收真实数据,对其进行增强,合成生成海量数据。
我们用来训练模型的数据总量将继续增长,直到训练不再受数据限制——数据的瓶颈变成了算力。
测试时计算 Scaling Law
Jensen 回忆说,曾经有人告诉他"推理很简单,预训练才难"。那种观点认为推理芯片会是小小的芯片,不像 NVIDIA 的芯片那么复杂和昂贵,推理会被商品化,所有人都能造自己的芯片。
Jensen 一直认为这不合逻辑,因为推理就是思考,而思考是很难的。他做了一个精妙的区分:预训练是记忆和泛化,是寻找数据中的模式和关系——那是"阅读"。而思考是推理、解决问题,面对从未探索过的新经验,把它分解成可解决的小块,通过第一性原理推理或借助以往经验来解决。 整个测试时计算的过程本质上就是思考——它关乎推理、规划、搜索。事实证明 NVIDIA 是对的:测试时计算需要极其密集的算力。
智能体 Scaling Law
第四条 Scaling Law 是智能体扩展。Jensen 解释说,现在大语言模型已经变成了一个智能体,它在测试时会去做研究、查询数据库、使用工具,而最关键的能力之一是它能衍生出一大批子智能体——这意味着我们在创建大型团队。
下一条 Scaling Law 就是智能体 Scaling Law。就像是在复制 AI。
Jensen 用 NVIDIA 自身做类比:通过招更多员工来扩展 NVIDIA,比扩展他自己容易得多。同理,复制 AI——你想生成多少个智能体就能生成多少个。
四条 Scaling Laws 的闭环
这四条 Scaling Laws 形成了一个循环:智能体系统在使用过程中会创造更多数据和经验,其中高质量的部分会回流到预训练阶段,被记忆和泛化,然后在后训练中精炼和微调,再通过测试时计算进一步增强,最后由智能体系统推向行业应用。这个循环不断持续下去。归根结底,智能的扩展取决于一样东西——算力。
预判未来的方法论
Lex 指出一个棘手的问题:AI 模型架构大概每六个月就有新发明,而系统架构和硬件架构大约每三年一个周期。NVIDIA 必须提前预判两三年后可能发生什么。
Jensen 介绍了几种方式。首先是内部研究——NVIDIA 自己构建模型,有亲身实践的经验,这是协同设计的一部分。其次是行业情报——NVIDIA 是世界上唯一一家跟全球几乎所有 AI 公司都合作的 AI 公司,能了解到人们正在遇到哪些挑战。最后是架构的灵活性——CUDA 一方面是极其强大的加速器,另一方面又非常灵活。专用化让 NVIDIA 能加速超越 CPU,通用化让它能适应不断变化的算法。
Jensen 举了一个具体的例子:当混合专家模型(Mixture of Experts)出现时,NVIDIA 做了 NVLink 72 而不是 NVLink 8,可以把一个四万亿甚至十万亿参数的模型放到一个计算域中,就好像在一块 GPU 上运行。他还对比了 Grace Blackwell 机架和 Vera Rubin 机架的架构差异——前者完全专注于处理大语言模型,而仅仅一年后的后者加入了存储加速器、全新 CPU Vera、以及一个新的额外机架 Rock,因为它是为运行智能体而设计的——智能体需要调用工具。
从第一性原理推演智能体
Jensen 认为预判未来的方法比很多人想象的简单:你只需要推理就行了。他做了一个思想实验:要让大语言模型成为一个"数字员工",它需要做什么?需要访问真实数据源(文件系统),需要能做研究(因为它不是什么都知道的),需要使用工具。
有人曾声称"AI 会彻底摧毁软件,不需要工具了"。Jensen 认为这太荒谬了,并用一个更生动的思想实验来反驳:假设你要创造未来十年最强大的智能体——一个人形机器人。它走进你家,是使用你现有的工具来完成工作更合理,还是它的手在某个时刻变成十磅重的锤子、另一个时刻变成手术刀、要烧水的时候从指尖发射微波?显然它更可能直接使用微波炉。它第一次走到微波炉前可能不知道怎么用,但它连着互联网,读一下说明书就瞬间成了专家。
Jensen 表示他在 GTC 上用的 OpenClaw 架构图实际上是两年前的东西——两年前他就在讲跟今天完全一致的智能体系统。当然,实现这一切需要很多事情汇聚到一起:Claude、GPT 等模型需要达到一定的能力水平,也需要有人创建一个足够强健和完整的开源项目。Jensen 认为 OpenClaw 对智能体系统的意义,就像 ChatGPT 对生成式 AI 的意义一样。
关于 OpenClaw 的安全问题,Jensen 介绍说 NVIDIA 立刻派了安全专家过去,做了 OpenShell 并集成进了 OpenClaw,同时推出了 NemoClaw。安全原则很清晰:智能体系统可以访问敏感信息、执行代码、对外通信——这三项能力中任何时候只给两项而不是全部三项,就能保证安全。在此基础上再提供基于企业授权的访问控制,并接入企业已有的策略引擎。
AI 扩展的最大障碍
话题转向了扩展的瓶颈。Jensen 指出能源是一个问题,但不是唯一的问题。这也是 NVIDIA 拼命推动极致协同设计的原因——让每瓦特每秒生成的 token 数每年都能提升几个数量级。
Jensen 给出了一个令人震撼的对比:过去十年,摩尔定律大概让算力提升了 100 倍。
而我们在过去十年把算力提升了一百万倍。
NVIDIA 会通过极致协同设计继续这样做。能效直接影响公司的收入和工厂的收入。虽然 NVIDIA 的计算机价格在上涨,但 token 生成效率的提升速度远远更快,所以 token 成本在持续下降——每年下降一个数量级。
关于能源问题的另一面——如何获得更多能源,Jensen 也表示认同。供应链中的其他瓶颈同样令人关注:ASML 的 EUV 光刻机、TSMC 的先进封装(CoWoS)、SK Hynix 的高带宽内存。
供应链
Jensen 对 NVIDIA 的供应链投入了极大的个人关注和推动力。他指出,历史上没有任何一家公司能在 NVIDIA 这样的规模下增长的同时还在加速增长,这件事本身就超出了大多数人的理解范围。在整个 AI 计算领域,NVIDIA 的市场份额仍在持续增加,这意味着上游和下游的供应链对公司的战略地位至关重要。
Jensen 花了大量时间与合作伙伴的 CEO 们沟通,向他们解释哪些动因会让增长持续甚至加速。在 GTC 主题演讲现场,他右手边坐着的几乎涵盖了整个 IT 行业上游和基础设施行业下游的 CEO,好几百位之多。他自己也不记得有哪场主题演讲吸引了如此多的 CEO 到场。
这些 CEO 来,一方面是因为 Jensen 会向他们坦诚报告 NVIDIA 当前的业务状况;另一方面,他还会描绘近期的增长驱动因素和未来方向,让他们据此决定如何投资。
我像对待自己员工一样向他们传达信息。
除了大型活动上的沟通,Jensen 还会亲自飞去拜访这些 CEO,明确告诉他们:“这个季度、明年、后年,这些事情会发生。”
内存:HBM 的崛起
大约三年前,HBM 内存的使用量还非常少,基本上只有超级计算机在用。但 Jensen 当时就预见到 HBM 将成为未来数据中心的主流内存,并亲自去说服了几位内存行业的 CEO。他承认这个判断在当时听起来很荒谬,但有几位 CEO 选择相信他,决定投资建设 HBM 内存产线。
Jensen 还推动了另一个看似更离谱的想法——将手机上使用的低功耗内存(LPDDR5)改造适配到数据中心的超级计算机上。当他向内存厂商提出这个方案时,对方的反应是:“手机内存用在超级计算机上?“但 Jensen 用第一性原理向他们解释了为什么这是可行的。如今看来,HBM4 和 LPDDR5 的产量已经极其可观,三家主要内存厂商都创造了历史最高年产量纪录——而这些都是有 45 年历史的公司。Jensen 将这种工作方式总结为自己职责的一部分:告知、塑造、激励。
被问及他是否在同时影响上游和下游的供应链时,Jensen 简洁地确认了这一点。他提到的合作伙伴不仅包括上游的 TSMC、ASML,也包括下游的 GEV、Caterpillar(卡特彼勒)等基础设施公司。换句话说,他在塑造的不仅仅是芯片制造链条,而是从半导体设备到电力基础设施的整条产业链。
谈到供应链的复杂程度,Jensen 用数据说话:仅一个 Vera Rubin 机架就包含 130 万到 150 万个零部件,涉及约 200 家供应商。 整个半导体行业涉及的深层科学、深层工程和精密制造令人叹为观止,其中很多制造环节已经在使用机器人。
Lex 问供应链问题是否让他夜不能寐。Jensen 的回答很坦然:他能安心睡觉,恰恰是因为他已经把这些问题逐一解决了。他会系统地推理每一个关键环节。
Jensen 举了一个具体的例子来说明供应链转型的深度。NVIDIA 把系统架构从最初的 DGX-I 演进到了 NVLink-72 机架级计算,这一转变的含义远不止技术层面。它意味着超级计算机的集成工作从数据中心搬到了供应链中的制造环节——超级计算机在出厂前就已经在供应链中完成了建造和测试。
这带来了一个新的现实问题:如果要构建 50 吉瓦总规模的超级计算机群、且制造周期为一周,那么供应链中每周就需要一吉瓦的电力专门用于构建和测试。NVL-72 机架以每架两三吨的重量整体出货,不再像以前那样拆成零件运到数据中心现场组装——因为 NVLink-72 的密度已经高到不允许现场组装了。
为此,Jensen 亲自飞到供应链合作伙伴那里,向他们解释制造方式的转变,并请他们各自投入数十亿美元的资本开支。他的方法是先解释正在发生什么、为什么会发生——比如推理市场的拐点即将到来、这将是一个巨大的市场——然后给对方充分的机会来质疑他的判断,用画图和第一性原理推理来回应每一个疑问。
等我跟他们谈完,他们就知道该怎么做了。
至于 ASML 的 EUV 设备产能、TSMC 的 CoWoS 封装扩展速度等具体瓶颈,Jensen 的回答非常干脆:不担心。因为他已经告诉了合作伙伴他需要什么,他们也说明了打算怎么做,而他相信他们会做到。整个供应链管理在他看来,本质上是关系的建立和对未来共同愿景的构建。
电力:被浪费的电网
谈到能源问题时,Jensen 主动提出了一个他特别想传达的观点。他解释说,电网是按照最坏情况再加上一定余量来设计的,但 99% 的时间里,实际用电量根本不会接近最坏情况。所谓最坏情况就是冬天的几天、夏天的几天以及极端天气期间。在绝大多数时候,电网大约只在峰值的 60% 左右运行,剩下的电力就那么闲着。但这些电力必须待命,因为一旦需要,医院、基础设施、机场等都需要供电保障。
基于这个观察,Jensen 提出了一个构想:能不能与电力公司合作,签订灵活的合同协议,设计能够动态调节功耗的计算机架构和数据中心?当电网需要为社会基础设施提供最大电力时,数据中心主动降低用电量。而这种需要全力供电的极端情况本身就非常罕见。在那段短暂的时间里,数据中心可以启用备用发电机补上差额,或者将工作负载转移到其他地区的数据中心,甚至干脆让计算机跑慢一点——降低性能、减少能耗,给用户的响应稍微慢一点点。
Jensen 指出,目前的合同条款非常严格,给电网带来了很大的压力,要求它们必须提升最大容量。但 NVIDIA 真正想用的只是电网闲置的那部分电力——那些电力就那么白白放在那里。他认为,如果数据中心不再要求 100% 的正常运行时间,很多问题都能迎刃而解。
Lex 追问是监管还是官僚主义在阻碍这件事。Jensen 将其分解为一个三方问题。
第一方是最终客户。 最终客户对数据中心的要求是永远不能宕机,期望完美的可用性。为了交付这种完美,数据中心需要备用发电机和电网供电的组合来保证六个九的可用性。Jensen 认为这里存在一个脱节:客户公司里负责签合同的人和 CEO 之间是脱节的。他敢打赌大多数 CEO 根本不知道合同里写了什么。两家公司的合同谈判人员在谈判多年期合同时,双方都想拿到最好的条款,结果 CSP(云服务提供商)就不得不去找电力公司要求六个九的可用性。Jensen 表示他要去和所有 CEO 谈谈,确保他们真正意识到自己到底在要求什么。
第二方是数据中心本身。 Jensen 认为必须建造能够"优雅降级"的数据中心。当电网通知需要降到 80% 功率时,数据中心应该能够说"完全没问题”,然后通过调配工作负载来应对——确保数据永远不会丢失,但可以降低计算速度、减少能耗,允许服务质量稍微下降。对于关键工作负载,立刻转移到其他数据中心,保持 100% 正常运行时间。被问及这种智能的、动态的电力分配作为工程问题有多难时,Jensen 的回答很直接:只要你能把需求明确定义出来,就能把它工程化。只要它符合物理定律和第一性原理,就没有问题。
第三方是电力公司。 Jensen 认为电力公司需要意识到这是一个机会。他们不应该说"我需要五年才能扩大电网容量”,而应该说"如果你愿意接受这个级别保障的电力,我下个月就能给你供上,价格是这个。"
如果电力公司也提供更多层次的电力交付承诺,那我觉得每个人都会知道该怎么做。
Jensen 总结道,现在电网里有太多浪费了,应该去解决这个问题。
Elon 与 Colossus
Lex 提到了 Elon Musk 和 xAI 在 Memphis 短短四个月内建成 Colossus 超级计算机的壮举——已拥有 200,000 个 GPU 且仍在快速增长。Jensen 给出了高度评价和详细分析。
Jensen 首先指出,Elon 在非常多不同的领域都有很深的涉猎,同时也是一个非常优秀的系统思考者。他能够跨多个学科进行思考,而且他会推动、质疑每一件事。Jensen 将 Elon 的方法归纳为三个层层递进的追问:第一,这件事是否必要?第二,必须用这种方式做吗?第三,必须花这么长时间吗?通过这种方式,他有能力质疑一切,直到每件事都精简到必要的最小量——你不可能再删掉任何东西了,但产品需要的核心能力还在。
他是你能想象到的最极致的极简主义者,而且他是在系统层面做到这一点的。
Jensen 还特别欣赏 Elon 亲临现场的习惯。如果有问题,他就直接到现场去,然后说"给我看看问题在哪。“当你把这些方法结合在一起——系统思考、极致精简、亲临现场——就能克服很多"我们一直就是这么做的"的惯性,以及"我在等他们回复"之类的借口。最后还有一点:当你个人表现出如此强的紧迫感时,每个人都会跟着行动起来。 每个供应商都有很多客户、很多同时进行的项目,而 Elon 通过以身作则让自己成为每个供应商的最高优先级。
Lex 补充了自己在现场观察到的细节。他回忆说,有一次他亲眼看到 Elon 在逐步了解如何把线缆插到机架里的整个流程——和一个正在做这项工作的工程师一起研究,试图理解每个步骤是什么样的,怎样才能减少出错。这种从每一个具体任务中建立直觉的方式,让人能够同时从细节层面和宏观系统层面看出低效在哪里,然后不断提升效率。再加上他手里有"一把大锤”——可以说"我们换一种完全不同的方式来做,把所有阻碍都清除掉。"
Jensen 的工程方法与领导力:“光速"思维
Lex 问 NVIDIA 的极端系统协同设计和 Elon 的系统工程方法之间是否有相似之处。Jensen 解释说,协同设计本身就是一个终极的系统工程问题,NVIDIA 从这个角度出发来组织工作。但他还分享了一个自己 30 年前就开始使用的方法论,叫做"光速”。
光速不仅仅是关于速度。光速是我的简称,代表的是"物理能做到的极限是什么"。
Jensen 解释说,NVIDIA 做的每一件事都会和"光速"进行对比——内存速度、计算速度、功耗、成本、时间、人力、制造周期。当你思考延迟和吞吐量的关系、成本和吞吐量的关系、成本和容量的关系时,都要针对光速来测试,看每个约束条件分别能达到什么极限。然后当你把它们综合在一起考虑时,你知道必须做出权衡——因为一个追求极低延迟的系统和一个追求极高吞吐量的系统,在架构上是根本不同的。但你要先知道每个方向的物理极限在哪里,才能做出有意义的权衡。
Jensen 表示他要求每个人在做任何事之前,先想清楚第一性原理是什么、物理极限是什么。他坦言自己不太喜欢另一种常见的方法——持续改进。持续改进的问题在于它容易让人陷入渐进式的优化。他举了一个例子:如果有人来找他说"这个东西现在需要 74 天,我们可以帮你做到 72 天",他不会接受这种思路。他宁愿把一切推倒归零,然后问:“首先,给我解释一下为什么是 74 天。让我们想想在今天的条件下,如果完全从零开始建造,需要多长时间?”
很多时候答案会令人大吃一惊——可能只需要六天。
剩下的从六天到 74 天之间的差距,可能都是有道理的——各种妥协、成本削减等等。但至少你知道它们是什么。
而且当你知道六天是可能的之后,从 74 天往六天方向谈判和优化,效率会高得多。
谈到 NVIDIA 产品的复杂度时,Lex 列举了 Vera Rubin pod 的参数:七种芯片类型、五种专用机架类型、40 个机架、1.2 千万亿个晶体管、近 20,000 个 NVIDIA 芯片、超过 1,100 个 Rubin GPU、60 exaflops 的算力、每秒 10 petabytes 的规模带宽。而这仅仅是一个 pod。Jensen 补充说,NVIDIA 大概每周要生产大约 200 个这样的 pod,以说明规模之大。单个 NVL 72 机架就包含 130 万个组件、1,300 个芯片、4,000 个连接器,全都塞进一个 19 英寸宽的机架里。
面对如此惊人的复杂度,Jensen 给出了他最常说的一句话作为设计准则:
我们需要让事物具备必要的复杂度,但尽可能地简洁。
所以问题永远是:所有这些复杂性是否都是必要的?NVIDIA 必须不断去检验这一点、质疑这一点。检验之后,超出必要范围的一切都是多余的。
Jensen 最后表示,这是人类有史以来制造的最复杂的计算机。整个半导体行业——TSMC、ASML、NVIDIA——就像在每个单项运动中都拿到金牌的选手,全部聚集在一起,而且必须协同工作。
中国:一个建设者的国度
谈到中国科技行业在过去十年取得的成就,Jensen 从几个事实出发展开了分析。
全球大约 50% 的 AI 研究人员是中国人,其中大多数仍然留在中国。中国的科技行业在一个恰到好处的时间窗口崛起——那正是移动互联网和云计算的时代,而中国参与这场变革的方式是通过软件。Jensen 指出,这个国家在科学和数学方面底子极好,教育出的孩子水平很高,科技行业是在软件时代创建的,因此他们非常擅长现代软件开发。
Jensen 还强调了中国内部竞争的激烈程度。中国并不是一个单一的巨大经济体,它有很多省份和城市,市长们都在互相竞争。这就是为什么会冒出那么多电动车公司、那么多 AI 公司——几乎每种类型的公司都会出现好几家。结果就是内部竞争极其残酷,而最后留下来的,都是了不起的公司。
在社会文化层面,Jensen 观察到一种独特的信息传播机制:家庭第一,朋友第二,公司第三。人与人之间的信息交流量非常大,他们本质上一直就是"开源"的。他解释说,工程师们的兄弟在那家公司,朋友在另一家公司,大家都是同学——而"同学"这个概念在中国意味着一辈子的兄弟。知识分享的速度因此变得非常快。保密技术在这种文化下没有意义,不如直接放到开源社区去。于是开源社区就放大并加速了整个创新过程。
优秀的人才、因开源和朋友文化带来的快速创新、以及疯狂的竞争。从公司之间的竞争中,涌现出了不可思议的成果。这是当今世界上创新最快的国家。
Jensen 认为,所有这些都根植于中国的基因——孩子们的成长方式、优秀的教育体系、父母对学业的期望、以及这个国家的文化特质。而他们恰好赶上了技术进入指数增长期的时候。
当被问及工程师在中国社会中的地位时,Jensen 用一句话做了概括:这是一个建设者的国度。 他对比了中美两国领导层的构成——美国注重法治和治理,领导人大多是律师;而中国是从贫困中建设起来的,领导人大多是杰出的工程师,是最聪明的一批人。
话题随后转向了开源。Jensen 解释了 NVIDIA 开源 Nemotron 3 Super(一个 1200 亿参数的开放权重 MoE 模型)背后的三重逻辑。
第一,协同设计的需要。作为一家 AI 计算公司,NVIDIA 必须理解 AI 模型是如何演进的。Nemotron 3 不仅仅是纯 Transformer 模型,而是 Transformer 和 SSM 的结合。NVIDIA 从条件 GAN 到渐进式 GAN 再到扩散模型,一直在模型架构和不同领域进行基础研究,这让他们能够看到未来的模型需要什么样的计算系统。
第二,AI 的普及需求。NVIDIA 一方面希望拥有世界级的专有模型作为产品,另一方面也希望 AI 能够扩散到每个行业、每个国家、每个研究人员和每个学生手中。如果所有东西都是专有的,做研究和创新就会变得很困难。开源对于让更多行业加入 AI 革命是根本必要的。
第三,AI 远不止语言。这些 AI 可能会使用工具、模型和子代理,它们在生物学、化学、物理定律、流体力学和热力学等信息模态上训练。Jensen 举例说,NVIDIA 不造车,但要确保每家汽车公司都能用上优秀的模型;NVIDIA 不做药物发现,但要确保 Lilly 有世界上最好的生物 AI 系统来发现药物。
Jensen 特别提到,Nemotron 3 不仅开源了模型和权重,还开源了数据以及制作过程,是真正意义上的开源。
TSMC 与台湾:信任的力量
Jensen 来自台湾,与 TSMC 有着长达三十年的紧密合作关系。谈到 TSMC 的成功秘诀,他首先纠正了一个常见的误解。
外界对 TSMC 最深的误解是认为他们的技术就是全部——好像他们有一个很厉害的晶体管,一旦别人搞出另一个晶体管就 game over 了。Jensen 承认 TSMC 的技术确实了不起——不只是晶体管,还包括金属化系统、封装、3D 封装、硅光子学等。但他认为技术并非 TSMC 最核心的竞争力。
他们真正厉害的是——他们有能力协调全球数百家公司动态变化的需求。
Jensen 描述了 TSMC 面对的复杂局面:全球客户不断在调整、扩大、缩减、推迟、提前需求,从一个客户切换到另一个客户,晶圆开始生产、停止生产、紧急插单。在这样持续变化的全球性复杂动态中,TSMC 竟然能保持高产出、高良率、出色的成本控制和优质的客户服务。 他们非常认真地对待自己的承诺——当你的晶圆承诺要到的时候,晶圆就会到,这样你才能正常运营你的公司。Jensen 称这套制造系统"简直是奇迹"。
TSMC 的第二个过人之处在于他们的文化。这种文化同时做到了两件看似矛盾的事情:一方面专注于推进技术前沿,另一方面又以客户服务为导向。Jensen 观察到,很多公司注重客户服务但技术上并不卓越,也有很多公司处于技术最前沿但客户服务做得不好。TSMC 不知怎么的把这两者平衡得恰到好处,而且两方面都是世界级的。
第三点,也是 Jensen 最看重的——信任。
我信任他们,愿意把我的公司建立在他们之上。这是非常重大的事情。
Jensen 透露了一个惊人的细节:三十年来,NVIDIA 通过 TSMC 做了不知多少个几百亿、上千亿美元的生意,但双方之间没有合同。这种信任完全建立在多年的合作表现和人与人之间的关系之上。
话题转到了一个广为流传的故事:2013 年,TSMC 创始人 Morris Chang 邀请 Jensen 出任 TSMC 的 CEO。Jensen 确认了这个故事的真实性。他表示自己并没有轻视这件事,而是深感荣幸。Morris 是他一生中最受尊敬的企业家之一,也是他的商业伙伴和私人朋友。
但 Jensen 婉拒了这个邀请。不是因为它不够分量——恰恰相反,这是一个令人难以置信的邀请。原因在于他在 NVIDIA 做的事情太重要了。Jensen 回忆说,在他的脑海中,他已经看到了 NVIDIA 将会成为什么样的公司,以及能产生怎样的影响。这是真正重要的工作,是他唯一的责任。
Jensen 最后补充说,留在 NVIDIA 让他现在可以同时帮助两家公司。
NVIDIA 的护城河
NVIDIA 最大的竞争优势是什么?Jensen 给出了明确的回答:CUDA 的装机量。
他解释说,NVIDIA 作为一家公司最重要的资产,就是计算平台的装机量。20 年前这个装机量还不存在,但今天它已经成为最核心的壁垒。Jensen 强调,就算有人搞出一个"GUDA"或"TUDA",也完全不会有什么影响。原因在于,CUDA 的成功从来都不仅仅是技术的问题。技术当然有着令人难以置信的远见,但关键在于整个公司都致力于此,坚持下来,不断扩展它的影响力。
让 CUDA 成功的不是三个人,而是 43000 名员工。还有数百万相信我们的开发者,他们相信我们会持续做出 CUDA 1、2、3、13……他们决定把自己的软件大厦移植并建立在 CUDA 之上。
Jensen 接着从开发者的视角阐述了这种优势为何如此牢固。当装机量与 NVIDIA 的执行速度结合起来——历史上没有任何公司曾经构建过如此复杂的系统,而且每年迭代一次——开发者面临的选择变得非常清晰。如果支持 CUDA,明天它就会好 10 倍,平均只需要等六个月。不仅如此,在 CUDA 上开发能触达数亿台计算机,进入每一个云平台、每一家计算机公司、每一个行业、每一个国家。而且开发者可以百分之百信任 NVIDIA 会一直维护 CUDA、改进它、持续优化库,直到永远。信任,是把所有这些优势粘合在一起的关键。
NVIDIA 的第二个护城河是生态系统。Jensen 描述了一种既纵向深入又横向广阔的布局:纵向集成了极其复杂的系统,横向整合进了几乎每一家公司的计算机里。NVIDIA 进入了 Google Cloud、Amazon、Azure,在 AWS 上疯狂扩展,也进入了 CoreWeave 和 Nscale 这样的新公司,进入了 Lilly 的超级计算机,进入了企业计算机、边缘的无线基站。一个架构覆盖了汽车、机器人、卫星、太空——覆盖了全世界几乎每一个行业。
谈到 CUDA 装机量的未来演变,Jensen 揭示了自己思维模型的转变。过去他想到 NVIDIA 构建的东西时,脑海中浮现的是那颗芯片——发布新一代产品时,他会举起那颗芯片。但那个时代已经过去了。
我现在的心智模型是一个巨大的吉瓦级的东西,连接着电网的发电系统,有冷却系统,有规模惊人的网络。
计算的单位已经从 GPU 变成了计算机,又变成了集群,现在是整个 AI 工厂。 启动这样一座工厂需要一万个人安装设备,数百名网络工程师在里面工作,数千名工程师在后面支撑。Jensen 表示,他希望自己的下一次认知升级是——当他想到构建计算机时,想的是行星级别的规模。
太空中的 AI 数据中心
Lex 把话题引向了 Elon 提出的太空计算方向。Jensen 的第一反应很直接:散热问题可不容易解决。
但 NVIDIA 并非只是在纸上谈兵。Jensen 透露,NVIDIA 的 GPU 是第一批进入太空的 GPU,而且他当时甚至都不知道这件事——事后得知时还有些遗憾没能提前大张旗鼓地宣布一下。
太空是做大量图像处理的理想场所。那些卫星搭载着非常高分辨率的成像系统,持续不断地扫描地球,要实现厘米级精度的全球覆盖成像,基本上就拥有了一切事物的实时遥测数据。但把 PB 级别的数据全部传回地球是不现实的,必须直接在边缘做 AI 处理——丢掉所有不需要的、之前见过的、没变化的数据,只保留有价值的部分。所以 AI 必须在边缘完成。
Jensen 分析了太空计算在物理层面的挑战和优势。如果把计算设施放在极地轨道,就有 24 小时不间断的太阳能。但太空中没有传导,也没有对流,基本上只能靠辐射散热。不过他以一种典型的务实乐观说道:太空很大,搞一些巨大的散热器放在那里就好了。
关于这个方向的时间表,Jensen 展现了他一贯的务实态度。他会先看下一桶最切实的机会在哪里,同时培育太空方向——派工程师去研究具体问题,包括如何应对辐射、如何应对性能退化、如何进行持续的测试和缺陷验证、如何处理冗余、如何优雅降级。这些前期的工程探索已经在进行中。
但在太空方向成熟之前,Jensen 最喜欢的短期答案是——消除浪费。地球上还有大量闲置的算力,他想尽快把它们利用起来。地球上仍然有大量唾手可得的资源可以用于 AI 扩展。
NVIDIA 会值 10 万亿美元吗?
面对 NVIDIA 能否达到 10 万亿美元市值这个问题,Jensen 的回答异常直接:NVIDIA 的增长是极其可能的,在他看来是必然的。他从两个基础性的技术原因展开了论证。
第一个原因是计算范式的根本转变。过去几乎一切都是文件——人们预先写好内容、预先录制内容、画好东西,放到网上、放进文件里,然后用推荐系统或某种智能过滤器来决定检索什么给用户。整个计算系统本质上是"人工预录制、文件检索"的体系。
而现在,AI 计算机是有上下文感知能力的,这意味着它必须实时处理和生成 token。所以我们从一个基于检索的计算系统,转变为了一个基于生成的计算系统。
在这个新世界里,所需的计算量比旧世界多得多——旧世界需要大量存储,新世界需要大量计算。Jensen 指出,唯一能让这个趋势逆转的情况是:这种计算密集型的方式——能生成与上下文相关、具有情境感知能力、在生成信息之前先基于新洞察进行推理的方式——被证明行不通。但过去五年给了他比之前十年更多的信心。
第二个原因更为根本:计算机的角色从仓库变成了工厂。
过去的计算机本质上是一个存储系统,是一个仓库,而仓库赚不了多少钱。但 NVIDIA 现在建造的是工厂——与公司的营收直接相关的工厂。这座工厂生产的产品是 token,而这些 token 对不同受众来说有不同的价值。Jensen 描述了 token 正在开始细分的趋势,就像 iPhone 一样——有免费 token、高端 token,以及中间的各种层级。
智能是一种可扩展的产品。有极高智能的产品,有用于特殊用途的 token,人们愿意为之付费。有人愿意为每百万 token 支付 1000 美元,这个时代已经近在咫尺。
当工厂生产的商品被证明确实有价值、能带来收入和利润时,接下来的问题就变成了:世界需要多少座这样的工厂?世界需要多少 token?社会愿意为这些 token 支付多少?如果生产力得到大幅提升,世界经济会发生什么?Jensen 对此表示绝对确定——世界 GDP 的增长会加速,而用于计算的 GDP 比例将会是过去的 100 倍,因为计算机不再是存储单元,而是产品生成单元。
在这个框架下反推 NVIDIA 的前景,Jensen 认为公司会变得大得多。他反问:NVIDIA 在不远的将来有没有可能成为一家 3 万亿美元营收的公司?答案当然是肯定的。他看不到任何物理极限说这不可能,而且 NVIDIA 的供应链负担由 200 家公司分担,是与整个生态系统合作来实现扩展的。
Jensen 回忆说,NVIDIA 第一次突破 10 亿美元营收的时候,有一位 CEO 告诉他"一家 fabless 半导体公司在理论上不可能超过 10 亿美元"。后来又有人告诉他不会超过 250 亿美元。这些说法都不是第一性原理的思考。
NVIDIA 不是在做抢占市场份额的生意。我刚才说的几乎所有东西目前都还不存在。这才是困难的地方。
Jensen 解释了外界理解 NVIDIA 增长潜力的困难所在:如果 NVIDIA 是一家试图抢市场份额的公司,股东很容易看到增长路径。但人们很难想象 NVIDIA 能有多大,因为它没有可以抢份额的对象——它在创造全新的市场。Jensen 坦言这是世界面临的挑战之一——对未来的想象力不足。但他有的是时间,会持续思考、持续谈论,每一届 GTC 都会让这一切变得越来越真实。
Token 的 iPhone 时刻
Jensen 在估值讨论的尾声抛出了一个让他兴奋的判断:token 的 iPhone 已经到来了。 那就是 Agent——广义上的 Agent。OpenClaw 是历史上增长最快的应用,使用曲线直线飙升。
OpenClaw 就是 token 的 iPhone。
Lex 承认了这种变革的切实体感。他提到来录制节目的路上,在机场第一次在公共场合对着笔记本电脑说话"编程"——像是在假装跟一个人类同事对话。他对每个人都走来走去跟自己的 AI 说话的未来还不太确定该作何感想,但承认这确实是一种非常高效的做事方式。
Jensen 给出了一个更大胆的预测:更可能的情况是,你的 AI 会不停地来打扰你。原因是它做事太快了,会不停地向你汇报"我搞定了"、“你接下来想让我做什么”。将来跟你聊天、发消息最频繁的,不是人类同事,而是你的 AI Agent。
压力下的领导力
NVIDIA 的成功牵动着整个美国乃至全球的经济格局——各国围绕它制定战略、规划财政拨款、布局 AI 基础设施。被问到如何承受如此巨大的压力时,Jensen 没有回避这个问题的重量。他说自己非常清楚 NVIDIA 对美国意味着什么:巨额税收、技术领先地位、国家安全的多维度保障、再工业化带来的大量就业机会,以及各种工厂、芯片、计算机和 AI 工厂向美国本土的回流。他还提到一个让他格外珍视的事实——许多普通投资者,教师、警察,出于各种原因买了 NVIDIA 的股票,如今成了百万富翁。他完全清楚 NVIDIA 处于一个庞大的生态系统核心,上游和下游都有大量的合作伙伴。
面对这些,Jensen 的应对方式是把压力拆解成可处理的单元。他会去推理:我们在做什么?这造成了什么?对其他人产生了什么影响?然后问自己:那你打算怎么办?
几乎对于我感受到的每一件事,我都会把它拆解开来,然后告诉自己:“好,情况是什么?什么发生了变化?什么是困难的?我打算怎么办?“我把它拆解、分解,这些情况经过分解就变成了我可以处理的事情。之后我唯一需要做的就是:“你做了吗?你要么自己做了,要么让别人去做了?如果你觉得需要做,却既没自己做也没让别人做,那就别再哭哭啼啼了。”
他对自己相当严格,但正是这种拆解让他不会陷入恐慌。他能安然入睡,因为所有可能让公司、合作伙伴、行业陷入危险的事情,他都已经告诉了某个人——而且是那个能对此做些什么的人。他要么把负担从心头卸下了,要么正在处理它。做完这些之后,还能再做什么呢?
被问到构建 NVIDIA 一路走来有没有心理上的低谷期,Jensen 直接回答:“当然有。一直都有。一直都有。“但他会迅速进入拆解模式。他强调这个过程中有一个关键要素——遗忘。就像 AI 学习中的系统性遗忘一样,人也需要知道什么时候该忘掉一些东西。他会非常快速地分解问题、推理问题,然后分担负担。不管什么让他担心的事,告诉别人,别自己扛着,同时也不要吓到对方——把问题分解成更小的部分,让人们有能力去行动。
还有一部分就是对自己狠一点:“得了吧,别哭了,走起来。“然后被下一个机会、下一个未来所吸引。他把这比作伟大运动员的心态——只关心下一分,上一分已经过去了,那些尴尬、那些挫折都随之而去。
Jensen 说过一句广为流传的话:如果他知道建设 NVIDIA 会有多难——比预期难一百万倍——他就不会去做了。但他认为这对所有值得做的事情都成立,而且恰恰揭示了一种不可思议的超能力:拥有孩子般的心态。
我经常对自己说,当我看着某件事时,几乎对每件事,我的第一个念头都是:“这能有多难?“你让自己进入那种状态——这能有多难?从来没人做过,看起来规模巨大,要花几千亿美元……你就说:“是啊,但能有多难呢?”
他的逻辑是:你不想提前模拟所有的挫折、磨难和失望,你想带着"一切会很完美、会很棒"的心态去开始。当身处其中时,你需要有耐力和毅力,让那些措手不及的挫折、失望和屈辱无法击垮你——这时启动另一个开关:忘掉它,继续前进。而且只要对未来的核心假设没有发生实质性改变,那他对未来的模拟预测仍然会实现,那就仍然要去追求。
这是几种人类特质的结合:以全新心态进入经历的能力、忘掉挫折的能力、相信自己并坚守信念的能力,加上不断重新评估。Jensen 说自己很幸运,大致具备了这些特质。他永远充满好奇,永远在学习,在模拟和模仿他观察到的每一个人,对他们所做的一切都抱有共情和尊重。
Lex 指出,Jensen 如今是地球上最富有、最成功的人之一,问他保持谦逊是否变得更难了——金钱、权力和名望是否让他更难承认错误、更难听取不同意见。Jensen 的回答是:令人意外地,没有。甚至恰恰相反。因为他的工作大部分是公开进行的,当他错了的时候,几乎所有人都能看到,他会被"打回谦逊的状态”。
Jensen 进一步解释了他管理和领导的核心方式:不断地在人们面前推理。他不会直接告诉别人结论,而是展示得出结论的每一步。这样对方可以自己判断是否认同。在与员工的会议中,他整天都在这样做——一步步推理,给每个人打断和反对的机会。这种方式的好处在于,人们不必反对最终结论,而是可以反对某个具体的推理步骤,然后把讨论拉向不同方向,一起继续推理。他形容这是一种"集体路径搜索"的方法。
Lex 评价说,Jensen 在解释事情时确实在当场真实地推理,带着持续的开放心态,而在多年的成功和痛苦之后还能保持这一点非常了不起——因为痛苦往往会让人封闭。Jensen 回应说,对尴尬的容忍度是其中的关键。多年来不断让自己出糗,在会议中提出想法然后被证明是错的,承认它并从中成长——这在人性层面确实非常困难。他半开玩笑地补了一句:“他们最近才知道我的第一份工作是刷厕所。”
电子游戏
谈到电子游戏,Jensen 透露 GeForce 至今仍然是 NVIDIA 排名第一的营销策略。人们在青少年时期通过玩 Call of Duty 或 Fortnite 了解了 NVIDIA,上大学后已经知道 NVIDIA 是谁,然后开始用 CUDA,再后来用 NVIDIA 的工具以及 Blender、Dassault、Autodesk 等专业软件。
围绕 DLSS 5 最近在玩家社区中引发了一些争议,玩家们担心它会让游戏画面变成所谓的"AI 泔水”(AI slop)。Jensen 表示他能理解玩家的出发点,因为他自己也不喜欢 AI 泔水——越来越多的 AI 生成内容看起来千篇一律,虽然很漂亮但缺乏个性。他对玩家的想法表示共情。
但他随即解释,这不是 DLSS 5 想要做的事。DLSS 5 是以 3D 为条件、以真实结构数据为引导的。几何结构由艺术家决定,系统对几何结构完全忠实——每一帧都是如此。它以纹理和艺术家的创意为条件,增强画面但不改变任何东西。而且 DLSS 5 是一个开放系统,开发者可以训练自己的模型来决定效果,将来甚至可以用提示词来控制风格——比如"我想要卡通着色器”——它会以那种风格生成,同时完全忠实于艺术家的创意和意图。
Jensen 认为玩家可能误以为游戏按原样发布后,NVIDIA 会在后面做后处理。但 DLSS 的本意不是这样——它是与艺术家集成在一起的 AI 工具、生成式 AI 工具,艺术家完全可以选择不用它。事实上,游戏行业的开发者们一直在寻找越来越多的工具来表达他们的艺术,比如过去几年 NVIDIA 推出的包含次表面散射的皮肤着色器。DLSS 5 只是又一个工具,用不用完全由开发者决定。
被问到有史以来最伟大或最具影响力的游戏是什么,Jensen 毫不犹豫地回答:Doom。从艺术角度、文化影响以及整个行业的角度来看,Doom 把 PC 从一个办公自动化工具变成了家庭和玩家的个人电脑,这是一个非常重要的时刻。飞行模拟公司更早出现,但没有 Doom 那样的普及度。从实际的游戏技术角度来说,他认为是 Virtua Fighter,并表示与这两款游戏的团队都是好朋友。
Lex 提到了 Cyberpunk 2077 的全光线追踪技术,以及自己对 Skyrim(Elder Scrolls 系列)的热爱——玩家社区发布的各种 mod 能让它变成一个完全不同的游戏,可以一遍又一遍地重玩。Jensen 回应说 NVIDIA 非常喜欢 mod 文化,还创建了一个叫 RTX Mod 的工具,让社区可以把最新的图形技术注入到老游戏中。两人都认同,一款伟大的电子游戏不只靠画面,还有故事和角色发展,但美丽的画面能增强沉浸感——那种被传送到另一个地方的感觉。
AGI 时间线
Lex 给出了一个具体的 AGI 定义来锚定讨论:一个能够创办、发展并运营一家市值超过十亿美元的成功科技公司的 AI 系统——需要创新、找到客户、销售、管理、组建团队,所有这些。他问 Jensen 这是五年、十年还是二十年以后的事。
Jensen 的回答出人意料:“我觉得就是现在。我认为我们已经实现了 AGI。”
他随即展开了推理。Lex 说了十亿美元,但没说要永远维持下去。一个 AI agent(他用 “Claw” 来指代)完全可以创建一个网络服务或某个有趣的小应用,然后突然间几十亿人以极低的价格使用了它——这并非不可能。然后它很快又倒闭了。互联网时代就有一大堆这种类型的公司,其中大多数网站的复杂程度并不比今天的 AI agent 能生成的东西更高。Jensen 承认他不知道具体会是什么形态,但他在过去也无法预测那些互联网公司中的任何一家。核心逻辑是:实现病毒式传播,然后把这种传播力变现——这在技术上已经是可能的。
编程的未来
Jensen 进一步指出,“启动一个 agent 然后赚钱"这件事正在发生。在中国,已经有大量的人在教他们的 AI agent 出去找工作、干活、赚钱。他不会感到惊讶如果某个数字网红、某个社交应用突然一夜爆红,很多人用了几个月然后消退。但他也坦率地说,十万个这样的 agent 去建造一个 NVIDIA 的概率是零。
话锋一转,Jensen 触及了一个更敏感的话题——人们对工作的担忧。他希望大家能区分两个概念:你工作的目的和你用来完成工作的任务与工具,这两者相关但不是同一回事。他自己做 CEO 已经 34 年,是全世界任期最长的科技公司 CEO,而他用来做这份工作的工具在过去 34 年里不断变化,有时在两三年内就天翻地覆。
他讲了一个关键的故事。计算机科学家和 AI 研究人员曾经预言第一个要消失的职业是放射科医生,因为计算机视觉将达到超人水平。计算机视觉确实在 2019—2020 年左右达到了超人水平,今天每一个放射学平台都是由 AI 驱动的。然而放射科医生的数量反而增长了,而且全世界还面临放射科医生短缺。
放射科医生的目的是诊断疾病、帮助患者和医生诊断疾病。因为我们现在能以更快的速度分析影像,你可以分析更多的影像,诊断得更好,更快地处理住院患者,看更多的病人。医院赚了更多的钱。医院有更多的患者。你需要更多的放射科医生。这一切是如此明显。
Jensen 说,那些危言耸听的警告走得太远了,它吓退了人们不去从事这个对社会非常重要的职业,实际上造成了伤害。同样的逻辑适用于 NVIDIA 的软件工程师——数量将会增长而不是减少,因为软件工程师的目的是解决问题、团队协作、诊断问题、评估结果、寻找新问题去解决、创新、连接不同的点,这些都不会消失。
对于编程的定义,Jensen 给出了一个大胆的重新界定:今天编程的定义就是规格描述(specification)。如果你想更具指导性,你甚至可以给 AI 一个你想要的软件架构。能够描述规格让计算机去构建的人有多少?他认为我们刚刚从三千万人扩展到了大约十亿人。
他描绘了一幅具体的图景:未来每一个木匠都会是一个编程者,一个有 AI 的木匠同时也是建筑师,他们能为客户交付的价值得到极大提升。每一个会计师同时也是财务分析师和财务顾问。所有这些职业都被提升了。“如果我是一个木匠,看到了 AI,我会完全疯狂地去用它。如果我是一个水管工,同样。如果我是农民,我绝对会用 AI。如果我是药剂师,我会用 AI。”
关于规格描述的"光谱”,Jensen 解释说,当他为公司制定战略时,他会描述到足够具体、可执行的程度,但有意地不过度指定,这样四万三千名员工就能让它变得比他想象的更好。每个人都需要学会自己想在这个光谱中处于什么位置——你可以选择非常具体(因为有特定的预期结果),也可以选择更探索性地不完全指定,让自己和 AI 来回交流,突破创造力的边界。编写规格就是编程,在这个光谱上找到自己的位置就是编程的未来。
Lex 把话题引向更广泛的社会层面——很多人在为自己的工作担忧,白领行业尤其焦虑。他承认没有人真正知道该怎么应对自动化和新技术带来的动荡,但所有人都需要有同理心,需要感受那些因失去工作而承受真实痛苦的个人和家庭。他也说自己最近编程比以往任何时候都开心,希望 AI 能自动化掉无聊的部分,把有创造性的部分保留给人类。
Jensen 的建议很直接:如果今天要招一个应届毕业生,面前有两个候选人——一个对 AI 一无所知,一个是使用 AI 的专家——他会选那个 AI 专家。不管是会计、市场营销、供应链、客服、销售、商务拓展还是律师,都一样。所以他的建议是:每一个大学生毕业时都应该是 AI 专家,每位老师都应该鼓励学生去使用 AI。不管你是木匠、电工、农民还是药剂师,去用 AI,看看它能怎样提升你的工作,让你成为革新行业的创新者。
他同时也坦承,这项技术确实会造成错位、会消除很多任务。如果你的工作就是那个任务本身,那很可能会被颠覆。如果你的工作目的包含了某些任务,那你必须去学会用 AI 来自动化那些任务。在这两者之间有一整个光谱。
两人还聊到了一个有趣的点:AI 本身就是学习 AI 的最好老师。Lex 说 AI 聊天机器人可以帮你拆解焦虑——“我担心我的工作,有哪些技能需要学?需要采取哪些步骤?“它会给你一个逐点的计划,就像一个很好的人生教练。Jensen 接过话说:你没法走到 Excel 面前说"我不会用 Excel”,但你可以走到 AI 面前说"我不知道怎么用 AI”,然后 AI 会说"好的,让我来教你”。AI 消除了作为初学者第一次使用任何东西时的入门摩擦。
Jensen 还提到即将去中国和台湾的行程,并建议去台湾时直接问 AI"Jensen 在台湾最喜欢的餐厅是哪些”——AI 的回答会是准确的,因为"整个台湾都知道”。
意识:智能与人性
被问到人类本性、人类意识中是否有什么东西是根本上非计算性的、是芯片无论多强大都永远无法复制的,Jensen 给出了一个精确的区分。他说他不知道芯片是否会紧张——导致焦虑、紧张或其他情绪的那些条件,AI 将能够识别和理解,但他不认为芯片会感受到它们。焦虑、兴奋……所有这些感受如何体现在人类表现中——同一情境对不同的人产生截然不同的结果和表现——这不是两台计算机在给予相同上下文时会展现的差异。计算机的输出会有统计上的不同,但那不是因为它们的感受不同。
Jensen 随后强调了一个他认为极其重要的概念辨析:智能不是一个恰好等于人性的词。我们有两个不同的词来描述它们,不应该过度幻想或浪漫化智能。智能有具体的含义——感知、理解、推理和规划能力的循环,这从根本上就是智能的本质。他甚至说自己认为智能是一种商品。
他用自身的例子来说明。他有 60 个直接汇报的人,他们在各自领域都比他更聪明、学历更高、上的学校更好、研究更深入。然而他坐在中间协调着这 60 个人。“一个洗碗工凭什么坐在超人们的中间?"——他用这个自嘲来说明,智能是一个功能性的东西,而人性不是用功能来定义的,它是一个大得多的词。人生经历、对痛苦的承受力、决心——这些都是与智能不同的维度。
智能是一个我们随着时间推移被抬到了很高位置的词。我们真正应该抬高的词是人性。
同理心、慷慨——这些才是超级力量,而智能即将被商品化。Jensen 说社会一直强调教育最重要,但上学获得的不仅仅是知识,人生远不止一个词能概括。他的人生经历表明,在智力曲线上低于周围每个人,并不改变他是最成功的这个事实。他希望这能给每个人启发:不要让智能的民主化、智能的商品化带来焦虑,你应该从中获得鼓舞。
Lex 回应说,他相信 AI 会帮助我们更多地赞美人类——首先赞美人性。让这个世界了不起的永远是人类,而 AI 是让人类变得更强大的工具。
死亡与希望
对话的最后一个话题触及了最根本的人类处境。Lex 指出,NVIDIA 的成功以及数百万人的生计都系于 Jensen 一身,但他终究是一个凡人。他问 Jensen 是否会想到自己的死亡,是否害怕死。
Jensen 的回答坦率得令人意外:
我真的不想死。我有美好的生活,美好的家庭,真正重要的工作。这不是一次"千载难逢"的经历——那个说法暗示很多人都经历过,只是一个人一辈子只能一次。我正在经历的,是一次人类历史上仅此一次的经历。
NVIDIA 是历史上最具影响力的科技公司之一,Jensen 对这份工作看得很重。但这自然引出了一个现实的问题——继任计划。Jensen 以不相信继任计划而闻名,他在这里解释了原因。不是因为他觉得自己不会死,而是因为他认为,如果你真的在为继任焦虑,那你应该把焦虑拆解到底,找到真正该做的事:尽可能频繁地、持续地传递知识、信息、洞察、技能和经验。
这正是他不断在团队面前推理一切的原因。每一次会议都是一次推理会议。在公司内外的每一个时刻,他都在尽可能快地传递知识。
我学到的任何东西都不会在我桌上停留超过一秒钟的零头。我甚至还没学完自己就在指给别人了——“快看这个,太酷了,你一定会想学的。”
他不断地传递知识、提升身边每一个人的能力。而他所追求的结果是——
在工作中死去。而且最好是瞬间的。
Lex 从一个粉丝的角度回应说,鉴于 Jensen 对文明的巨大积极影响,他当然希望 Jensen 能一直走下去。但更重要的是,看着 NVIDIA 正在做的事情本身就是一种享受——持续不断的创新速度、对工程的赞美、对伟大建造者的赞美。他问 Jensen:当你展望未来十年、二十年、五十年甚至一百年,什么给了你希望?
Jensen 说,他一直对人类的善良、慷慨、同情心和能力抱有极大的信心——有时候甚至超出了应有的程度。他确实会被人利用,但这从不让他停止信任。他的出发点永远是:人们想做好事,想帮助他人。而绝大多数时候,这个判断被证明是对的,而且常常超出他的预期。
让他充满希望的是:他看到了现在已经可能实现的事情,然后向前推演,基于当前正在进行的工作,有非常多好的事情很可能会发生。有那么多想要解决的问题,那么多想要建造的东西,那么多想要做的好事——这些现在都触手可及了,而且在他有生之年就能实现。
你简直不可能不为此感到浪漫。
他列举了几个他认为合理的期待:疾病的终结是一个合理的期待。污染的大幅减少是一个合理的期待。甚至以光速旅行——虽然是短距离——也在人类的未来之中。
然后 Jensen 描述了一个浪漫到近乎科幻的构想:很快他会把一个人形机器人送上太空飞船——他自己的人形机器人——尽快发射出去。它会在飞行过程中不断改进和增强。等到时机成熟,他一生的意识——所有的收件箱、做过的一切、说过的一切——都已经被收集起来,变成了他的 AI。
到时候,我们就把它以光速发射出去,追上我的机器人。
Jensen 还提到,理解生物机器就在眼前——不是十年,大概五年。 解释意识将会是一件令人震撼的事。这一切都在我们能够触及的范围之内。
对话在彼此的感谢中结束。Jensen 感谢了 Lex 多年来所做的深度访谈——那种深度、尊重和研究功夫。作为一个创新者,Lex 创造的这种长对话形式让他觉得不可思议又令人着迷。
Lex 以 Alan Kay 的话作为结尾:
预测未来的最好方式,就是去发明它。
最后修改于 2026-03-24

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。