• 正文
  • 相关推荐
申请入驻 产业图谱

PerfXCloud DeepSeek满血专线,立即体验!澎峰科技”十年磨一剑,今朝绽锋芒“

02/10 16:12
2190
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

零门槛体验DeepSeek-R1满血版本,性能对标OpenAI o1,即刻开启一场震撼人心的AI探索之旅。

??体验DeepSeek-R1满血效果

如果您是开发者,将需要使用DeepSeek API。注册成为PerfXCloud用户,即赠送2千万token!本服务获得了中国曙光、超算互联网、沐曦的大力支持和算力支撑。澎峰科技+海光DCU:自研推理框架全面支持DeepSeek系列模型

DeepSeek模型广场

DeepSeek-R1满血体验???????????

DeepSeek-R1满血版本和蒸馏版本的差异

满血版是与DeepSeek官网性能一致的V3和R1的全量参数模型,一般需要多台高性能GPU服务器并行才能流畅运行推理服务,低配也要数百万人民币。而蒸馏版是利用DeepSeek-R1生成的数据对其他模型进行微调,从而提升其模型性能,但效果差于满血版。DeepSeek-R1满血版本性能对标OpenAI o1商业版本水平,但价格只是它的1/30。

举例参数规模和模型大小:???????

  • DeepSeek-R1:参数为 671B,模型大小约 720G。
  • DeepSeek-R1-Distill-Qwen-7B:参数为 7B,模型大小约 15G
  • DeepSeek-R1-Distill-Llama-8B:参数为 8B,模型大小约 16G
  • DeepSeek-R1-Distill-Qwen-32B:参数为 32B,模型大小约 75G。

 

相关推荐