快科技2月3日消息,DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。
2月1日消息,随着中国人工智能模型开发商 DeepSeek 的 AI 模型 R1 显示出与领先的 OpenAI O1相当的性能,美国开始担心DeepSeek将对其人工智能领导地位构成威胁,并对其展开了调查。据彭博社报道,美国政府正在调查DeepSeek 是否通过新加坡的中介绕过美国的出口限制,从而采购对华禁售的英伟达(Nvidia) AI  GPU。 虽然DeepSeek 尚未透露用于训练其 R1 ...
DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。
然而,值得注意的是,尽管DeepSeek正在逐步适配国产GPU,但其在某些方面仍可能继续依赖英伟达的高端GPU。例如,英伟达的H800 GPU被用于训练DeepSeek V3模型,并且DeepSeek的某些版本仍然支持英伟达的CUDA平台。这表明DeepSeek的适配策略可能是渐进式的,既利用现有高端GPU资源,又逐步向国产GPU过渡。
2月1日消息,随着中国人工智能模型开发商 DeepSeek 的 AI 模型 R1 显示出与领先的 OpenAI ...
DeepSeek的出现,一夜之间戳破了算力之上的神话~从前大家都认为,要训练一个大模型往往需要大规模的算力集群才能够搞出一个ChatGPT出来。所以美国一直在对我们进行算力封锁。包括把一些高性能的计算卡禁止卖给中国。因此,国内的很多公司在训练大模型的 ...
大陆AI新创企业DeepSeek(深度探求)近期推出「DeepSeek-V3」与「DeepSeek-R1」两款最新的AI模型。这两款模型具备低廉的制造成本,且採用运算能力相对低阶的辉达H800晶片,却拥有与全球顶尖AI语言模型匹敌的表现(例 ...
DeepSeek以低成本和少量芯片实现了与OpenAI等巨头媲美的性能,引发国际AI界的广泛关注。这意味着如果算力不再是决定AI性能的关键因素,之前大量投资英伟达芯片的逻辑可能会发生变化,其他相关行业也将受到影响。一位首席经济学家在微博上表达了这一观点。
据了解,DeepSeek-V3完整训练只需2.788M H800 GPU小时,其训练成本仅为557万美元,却获得了媲美OpenAI的最先进模型GPT-4o的性能。当时著名人工智能科学家卡帕西(Andrej Karpathy)就发文表示,这个模型是在一个非常有限的预算下训练的(2048个GPU运行2个月,花费600万美元)。
活动首日,NVIDIA送出了“GeForce 256”,这款显卡于1999年8月发布,是NVIDIA历史上第一款以GPU命名并推向市场的产品 ... 活动的最后一天,NVIDIA送出了“GeForce RTX 3080”,这款显卡于2020年正式发布,NVIDIA在发布前曾预告,这将是PC游戏领域的一大突破。