每经记者:宋欣悦 每经编辑:兰素英2月6日,据外媒报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用,使用了16张英伟达H100 ...
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元 (约145.844元) 就能租到 。
【新智元导读】最近,李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型,而DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面:昔日称霸开源界Llama已悄然退位,新王加冕。
2月6日,据外媒报道,李飞飞等研究人员用不到50美元和16张英伟达H100 GPU,耗时26分钟训练出s1-32B人工智能推理模型。据外界分析,该模型基于预训练模型微调,成本未涵盖前期“烧钱”部分,且只在特定测试集上超过o1-preview,未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后,李飞飞团队重点研究了如何以简单方式实现“测试时拓展”,即模型在推理时多次迭代优化结果,还构建 ...
今天凌晨,据路透社报道,OpenAI 前首席科学家 Ilya Sutskever 所创公司Safe Superintelligence Inc.(SSI) 正就至少 200 亿美元的估值进行融资谈判。 加码融资的背后或许全靠 Ilya 刷脸,因为 ...
2025 年 1 月 1 日,百度掌门人李彦宏在公司 25 周年时发布全员信。信中,李彦宏指出,AI 原生应用正在各行各业迅速普及落地,而新的一年,又是 AI 应用井喷式增长的一年。
近期,人工智能(AI)领域迎来了一个备受瞩目的新闻。根据媒体报道,初创公司SafeSuperintelligence(SSI)正与投资者洽谈新一轮融资,预计此次融资后估值将达到惊人的200亿美元。这一公司由OpenAI的联合创始人及前首席科学家伊尔亚 ...
没有一个产品,没有任何收入,Ilya创业公司SSI又在洽谈新一轮融资了!据称,公司估值高达200亿美元,较5个月前翻了4倍。 Ilya又回来了! 路透独家爆料称,Ilya ...
媒体/自媒体的宣传出现了「一丢丢偏差」,我先结合论文简要说几点最关键的看法帮大家省流,然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。 下面的讨论主要基于最广为流传且被很多官媒转发的信息: ...
DeepSeek 系列模型被公认为是目前最先进的大语言模型之一,随着技术开源的推动,我们或许将见证生成式 AI 更快的发展。 我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。
但海外市场对此却态度微妙,OpenAI一度宣称Deepseek“偷窃”了其“技术成果”,但一转头,微软、英伟达等大厂都宣布在自家产品中接入Deepseek,OpenAI CEO山姆·奥特曼更表示Deepseek的R1模型“令人印象深刻”。
在一年前的访谈中,朱啸虎表态绝不会投资 6 家中国大模型创业公司中的任何一家。而在时隔一年之后,朱啸虎在访谈中反反复复用「太优美了」、「非常有深度」来评价 DeepSeek 与自己的交互,他表示「DeepSeek快让我相信AGI了。」 ...