Part 01、前言
2024年12月9日,央视新闻报道,国家市场监管总局以涉嫌违反《反垄断法》为由,对英伟达展开立案调查,而最近传来H20芯片解禁的消息。
H20芯片,作为英伟达为中国市场量身定制的“合规”产品,性能较H100有所削弱,这是中国AI产业的重大利好吗?
“凡是封锁我们的产品,我们都能造的像模像样!”郑强教授这句话的含金量还在上升。
Part 02、国产芯盘点
1. 华为昇腾
华为昇腾910系列是国产AI芯片的“扛把子”。最新款昇腾910C,基于SMIC 7nm工艺(N+2),FP16算力飙升至800 TFLOPS,性能直追英伟达H100的60%,在DeepSeek R1模型推理等场景中甚至超越H800。内存带宽3.2 TB/s,性价比碾压H20,售价约7-8万元/颗。昇腾的CANN框架和MindSpore平台已适配70余个国产大模型,覆盖字节、百度、腾讯等巨头。
2024年,字节跳动订购10万颗910B,百度采购1600颗,市场需求旺盛。但良率问题仍是痛点,目前从20%提升至40%,目标2025年底达60%。生态方面,CANN框架算子优化和开发者社区与英伟达CUDA仍有差距,但华为正通过开源和扶持计划加速追赶。
2. 百度昆仑
百度昆仑芯片主打“自产自销”,昆仑2采用7nm工艺,FP16算力256 TFLOPS,专为ERNIE大模型和Apollo自动驾驶优化。XPU软件栈与PaddlePaddle框架无缝衔接,推理效率媲美英伟达A100在特定场景的表现。昆仑的市场化程度低,主要服务百度内部,外部订单远不及昇腾,生态开放性也需加强。
相比之下英伟达的H100和即将推出的Blackwell系列如B100/B200代表了AI芯片的顶尖水平。H100采用4nm工艺,配备HBM3内存,带宽高达3.35 TB/s,FP16算力远超昇腾和昆仑。
寒武纪思元590在推理场景表现亮眼,地平线征程系列主攻智能驾驶,燧原科技的邃思芯片也在云端训练崭露头角。这些芯片虽算力不及英伟达H100,但凭借场景优化和政策支持,正抢占细分市场。
英伟达H100算力1979 TFLOPS遥遥领先,H20 44 TFLOPS被昇腾910C 800 TFLOPS和昆仑2 256 TFLOPS完胜。价格方面H20约10万元/颗,昇腾910B约7-8万元,性价比完胜。昆仑价格未公开,但内部优化降低成本。生态方面CUDA仍是全球标杆,昇腾CANN和昆仑XPU需加倍努力。
Part 03、风浪越大,鱼越贵
昇腾910系列订单火爆,2024年潜在订单7万颗,价值20亿美元。昆仑主攻百度内部,市场化稍显不足。英伟达H20虽解禁,但高价低能让其吸引力大减,中国移动、商汤等企业已转向昇腾。
英伟达H20解禁看似王者归来,实则是国产芯片崛起下的无奈让步,凡是老外封锁不卖的,我们最后都能造出来!
有问题欢迎在评论区留言交流哦!
1034