作者 | AICon 全球人工智能开发与应用大会策划 | 李忠良在 AI 的快速发展中,Scaling Law 的瓶颈带来了新的竞争态势。AI 应用,尤其是深度学习、大规模并行计算、推理和训练等领域,要求计算能力以非线性、指数级的方式增长。为了应对这种需求,AI ...
据 TechCrunch ,这个训练过程消耗了不到50美元的 云计算 成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到 。
机器之心发布机器之心编辑部在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI ...
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元 (约145.844元) 就能租到 。
今天凌晨,据路透社报道,OpenAI 前首席科学家 Ilya Sutskever 所创公司Safe Superintelligence Inc.(SSI) 正就至少 200 亿美元的估值进行融资谈判。 加码融资的背后或许全靠 Ilya 刷脸,因为 ...
2月6日,据外媒报道,李飞飞等研究人员用不到50美元和16张英伟达H100 GPU,耗时26分钟训练出s1-32B人工智能推理模型。据外界分析,该模型基于预训练模型微调,成本未涵盖前期“烧钱”部分,且只在特定测试集上超过o1-preview,未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后,李飞飞团队重点研究了如何以简单方式实现“测试时拓展”,即模型在推理时多次迭代优化结果,还构建 ...
在传统解法中,人类参赛者通常会借助三角函数、复数或其他计算方法来求解。而对于AlphaGeometry而言,其DDAR系统仅依靠基本的角度关系推导和比例关系推导,因此需要引入一些辅助点的构造。
没有一个产品,没有任何收入,Ilya创业公司SSI又在洽谈新一轮融资了!据称,公司估值高达200亿美元,较5个月前翻了4倍。 Ilya又回来了! 路透独家爆料称,Ilya ...
媒体/自媒体的宣传出现了「一丢丢偏差」,我先结合论文简要说几点最关键的看法帮大家省流,然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。 下面的讨论主要基于最广为流传且被很多官媒转发的信息: ...
但海外市场对此却态度微妙,OpenAI一度宣称Deepseek“偷窃”了其“技术成果”,但一转头,微软、英伟达等大厂都宣布在自家产品中接入Deepseek,OpenAI CEO山姆·奥特曼更表示Deepseek的R1模型“令人印象深刻”。
在一年前的访谈中,朱啸虎表态绝不会投资 6 家中国大模型创业公司中的任何一家。而在时隔一年之后,朱啸虎在访谈中反反复复用「太优美了」、「非常有深度」来评价 DeepSeek 与自己的交互,他表示「DeepSeek快让我相信AGI了。」 ...