• 正文
  • 相关推荐
申请入驻 产业图谱

黄仁勋预判:后训练时代,算力焦虑将贯穿下一个十年

原创
07/17 09:00
1003
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

英伟达创始人兼CEO黄仁勋近日的访华之旅,因为种种新变化又增加了不少关注度。这些变化背后既有中美AI博弈的新进展,又有英伟达自身所到达的新高度。

在他出席链博会开幕式的前一天,今年4月被禁的H20宣布解禁;而就在前一周,英伟达成为全球首个市值突破4万亿美元的公司。这些大开大合的变化背后,其实有一个关联因素——就是AI史无前例的重要性和开拓性,它重要到成为大国博弈的核心筹码,成为众多新老产业背后的支柱力量。

<与非网>及国内一些媒体受邀参加了昨日的媒体见面会。这位新晋全球市值第一的CEO被问到感受时表示深感荣幸,他强调,英伟达之所以经历了从零到巅峰的历程,核心成就就是“重塑计算”和“开创了AI产业”。在这一过程中,英伟达已经成为全球绝大部分地区AI计算基础设施的提供者,“我们正处在一个非常、非常激动人心的AI时代的开端”,他指出,“AI将成为一个国际性的全球科学领域,来自世界各地的科学审查将极大地帮助我们以安全的方式推进这项技术。”

算力焦虑真相:越智能,越渴求

在这个AI通过推理和思考来学习的时代,算力成为紧缺资源。我们都知道AI三要素是“算力”、“算法”和“数据”。那么在这个三角中,算力是被高估了,还是仍然不足?

黄仁勋说,英伟达内部有很多AI超级计算机工程师们使用,但他们每天仍然饱受算力焦虑之苦,他们每天都渴望能拥有多10倍的算力。这恰恰说明,这个新的计算时代不再是关于手工编码,而是关于AI机器学习。如果AI机器承担了大量的学习任务,那么你就会希望拥有更快、更大的机器,因为这样就能更快地解决更大的问题。

“我认为在未来十年里,我们都会经历算力焦虑。是的,这不会消失,任何在工程领域的人都会有“,他补充。

黄仁勋提出这一论断背后的核心是“后训练(post training)“,他指出,这一阶段需要海量的计算机和非常少的数据。

为何“少量数据+大量算力”可行?黄仁勋今年首次公开回应DeepSeek R1模型对算力的冲击时,对"后训练"概念进行了阐述。在他看来,预训练是基础,后训练才是智能的核心,真正的智能是在后训练阶段形成的。市场对DeepSeek R1的反应存在误解,认为AI已经发展到了顶峰不再需要大量算力,但实际上,后训练阶段仍然需要大量的计算资源。

他解释说,预训练赋予模型基础知识,而后训练教会模型如何解决问题,涉及复杂推理、策略调整和实际应用能力,这才是真正体现智能的环节。而推理越多,思考越多,AI表现就越好,这离不开强大的计算能力支持。

黄仁勋提出的“后训练”概念,核心指向大模型落地阶段的稀疏化微调与推理优化,其本质是通过算法架构创新+大量算力替代数据规模。这一策略当然反映了一定的技术趋势,但也不排除包括英伟达的商业意图,还需要进行辩证分析。

在今年的GTC大会上,英伟达所发布的人形机器人基础模型 Isaac GR00T N1,就从一定程度上证明了后训练理念的可行性。

当时黄仁勋展示了1X技术公司的NEO Gamma人形机器人,正是使用了基于GR00T N1模型构建的后训练策略。

该人形机器人基础模型 Isaac GR00T N1,包括了预训练+后训练的双阶段架构。其中系统1被描述为一种快速思维行动模型,其行为类似于人类的反射和直觉,相当于进行预训练,能够基于人类演示与合成数据训练,实现快速反射动作(如抓取、避障);系统2则相当于后训练,由视觉语言模型驱动,是一种慢思维模型,它对环境和接收到的指令进行推理以规划行动。这些计划被传递给系统1,将其转化为精确、连续的机器人动作,包括抓取、用单臂或双臂移动物体,以及涉及基本技能组合的更复杂的多步骤任务。

在AI发展的落地的过程中,我们一直都认为海量的数据必不可少。不过随着MoE的突破,这一趋势有所改变。1X公司的NEO Gamma机器人仅用少量后训练数据即可学会自主整理任务,验证了“小数据+大算力”的可行性。

工业数字孪生首款GPU,为何面向中国推出?

黄仁勋还专门针对中国市场推出了一款全新且完全兼容的RTX PRO GPU,宣称该产品“是为智能工厂和物流打造数字孪生 AI 的理想选择”。可以看出,英伟达避开了敏感的高算力训练场景,同时切入中国工业数字化转型的蓝海市场,可谓定位精准。

他指出,数字孪生需要强大的实时渲染和AI计算能力,而RTX PRO的技术特点正好契合这些需求。首先,RTX PRO 是为了运行NVIDIA Omniverse而设计的,是世界上首款此类产品,这对于智能工厂、机器人等应用非常重要。

该GPU基于Blackwell架构,同时拥有图形处理和光线追踪功能。而光线追踪技术对于传感器模拟非常重要,通过这一技术可以模拟数字工厂、自动驾驶汽车或者机器人的传感器。

“数字机器人之所以必要,是因为要教会一个物理机器人如何变得优秀,并能很好地执行任务,而这需要先在数字世界里进行训练”,黄仁勋强调,“RTX PRO是世界上首款此类产品,而中国拥有庞大的制造业基础,如此多的实体创新正在进行,如此多的智能工厂工作在这里完成。”

其次,他谈到,未来的AI工厂将更具敏捷性、更可配置、吞吐量更高——这是供应链工厂应该具备的特点。随着机器人技术和AI能力的提升,单位生产成本降低而生产力提升,产品的成本很可能会下降。

在这个商业逻辑的推演下,黄仁勋对RTX PRO的应用前景充满信心。“如果我们有更多的自动化,全世界都会更加繁荣”,他表示。

针对中国的人形机器人发展,黄仁勋谈到,人形机器人和AI的时机正在交汇,这令人非常兴奋。而中国发展人形机器人具备三个独特的条件:第一,拥有出色的AI技术;第二,擅长机械、电气工程;第三,拥有庞大的制造业基础。他毫不怀疑中国的老牌公司和初创公司在这方面的发展,小米、比亚迪都有望造出令人惊艳的机器人。

H20解禁,几家欢乐几家愁?

根据公开信息,H20配备96GB HBM3显存,显存带宽可达4TB/s,部分升级型号还提升至141GB显存、900GB/s的卡间互联带宽。其FP8和FP16算力分别为296 TFLOPS与148 TFLOPS,在AI训练、推理中仍具一定竞争力,尤其适合大模型推理阶段对带宽、内存容量要求较高的场景。

H20恢复对华销售的消息公布两天,就在中国市场掀起了复杂的涟漪效应。从最新行业动向看,这一事件可能正在深刻改写中国AI算力市场的竞争格局。

首先从英伟达的角度来看,对于H20回归后的市场预期有多大的确定性?

黄仁勋指出,H20的核心优势就是内存、带宽,非常适合DeepSeek、阿里千问等大模型,他确信H20会非常成功,且一定会非常有用。

不过,H20未来的订单还存在几个不确定因素:首先是客户的新订单时间点,毕竟之前的订单被取消了,他们的需求可能已经发生了变化;其次,重启供应链需要时间,英伟达目前的供应链周期长达9个月,虽然他们正在全力加速Hopper架构产品的产能恢复,但这确实需要持续努力。短期内,可能既无法预测订单量,也难以准确评估供应能力。但英伟达会竭尽全力满足客户需求,毕竟当前行业普遍存在的"算力焦虑"确实亟待缓解。

未来,他希望将更先进的芯片带入中国市场,因为技术总是在进步。H20虽然具备良好的推理能力和带宽表现,但随着更多、更好的新技术问世,只要在中国能被允许销售,相关产品也会持续不断地进步。

针对中国市场的特供芯片是英伟达在政治夹缝中的商业防守,但性能降规和供应链的反复波动,正在深刻地影响着我国的算力格局。

对于数据中心来说,算力得到缓解、AI需求得到释放,无疑是利好消息。不过近些年,国内新建的算力集群很多都开始采用异构系统架构,同步搭载了英伟达GPU和国产芯片。除了芯片上的突破,软件生态也在快速发展,AI Infra对于搭载不同芯片的混合算力也起到了关键作用。

对于H20的回归,大模型厂商短期可以缓解一定的算力焦虑,毕竟从训练+推理的算力缺口、集群的扩展性提升方面,H20都能带给市场积极影响,特别是在千卡规模集群中,其效率显著优于国产方案;另外在垂类模型领域,比如金融风控、医疗影像等场景,都需要大显存的支持,H20的“弱算力+高带宽”配置仍具有独到优势。

不过,更深层的挑战是“双刃”的——如果在禁令颁布后,一些厂商已经完成了向国产平台的迁移,他们是否愿意随着H20的解禁再次“回迁”?这其中的成本和代价有多大?H20卷土重来,究竟是给中国AI发展争取了更多的时间窗口,还是在一定程度上挤压了国产芯片的空间?这些还需要继续观察。

写在最后

黄仁勋此行带来两个大消息:H20解禁和面向中国工业领域的RTX PRO GPU。

一方面,通过合规芯片“收复失地”;另一方面,面向更大的蓝海市场推出全新产品规划,针对具体的落地场景带来新的算力支撑。而这套组合拳,很可能成为英伟达中国战略的关键转折。

来源: 与非网,作者: 张慧娟,原文链接: /article/1863799.html

英伟达

英伟达

NVIDIA(中国大陆译名:英伟达,港台译名:辉达),成立于1993年,是一家美国跨国科技公司,总部位于加利福尼亚州圣克拉拉市,由黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立。公司早期专注于图形芯片设计业务,随着公司技术与业务发展,已成长为一家提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。美国GPU及AI计算巨头,传感器技术应用于自动驾驶及机器人领域。

NVIDIA(中国大陆译名:英伟达,港台译名:辉达),成立于1993年,是一家美国跨国科技公司,总部位于加利福尼亚州圣克拉拉市,由黄仁勋、克里斯·马拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立。公司早期专注于图形芯片设计业务,随着公司技术与业务发展,已成长为一家提供全栈计算的人工智能公司,致力于开发CPU、DPU、GPU和AI软件,为建筑工程、金融服务、科学研究、制造业、汽车等领域的计算解决方案提供支持。美国GPU及AI计算巨头,传感器技术应用于自动驾驶及机器人领域。收起

查看更多

相关推荐