DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。
该团队拿到了一片看起来全新的 RTX 4090 TUF 显卡,上面还贴有保护膜,不过拆解后发现 GPU 芯片并非“AD102”,而是 GeForce RTX 3080 Ti 中的“GA102”。
然而,值得注意的是,尽管DeepSeek正在逐步适配国产GPU,但其在某些方面仍可能继续依赖英伟达的高端GPU。例如,英伟达的H800 GPU被用于训练DeepSeek V3模型,并且DeepSeek的某些版本仍然支持英伟达的CUDA平台。这表明DeepSeek的适配策略可能是渐进式的,既利用现有高端GPU资源,又逐步向国产GPU过渡。
“Llama 3 405B 使用了3080万GPU小时,而DeepSeek-V3 看起来是一个更强大的模型,仅使用了280万GPU 小时(计算量约为十分之一)。”前Open AI 联合创始人 ...