Scaling - 搜索 News

3 天

DeepSeek现象则是Scaling ...

作者 | AICon 全球人工智能开发与应用大会策划 | 李忠良在 AI 的快速发展中，Scaling Law 的瓶颈带来了新的竞争态势。AI 应用，尤其是深度学习、大规模并行计算、推理和训练等领域，要求计算能力以非线性、指数级的方式增长。为了应对这种需求，AI ...

1 天

成本不到150元！李飞飞等26分钟训出推理模型媲美R1，秘诀：蒸馏

据 TechCrunch ，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

腾讯网1 天

817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式

机器之心发布机器之心编辑部在追求人工智能极限的道路上，"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI ...

21 小时

成本不到150元！26分钟训出个推理模型媲美o1和R1

据TechCrunch，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

30 分钟

0 产品 0 营收，OpenAI 前首席科学家创办的新公司，就要冲击 200 亿 ...

今天凌晨，据路透社报道，OpenAI 前首席科学家 Ilya Sutskever 所创公司Safe Superintelligence Inc.（SSI）正就至少 200 亿美元的估值进行融资谈判。加码融资的背后或许全靠 Ilya 刷脸，因为 ...

来自MSN16 小时

李飞飞团队“50美元”复刻DeepSeek-R1？一文读透“白菜价”背后的真正 ...

2月6日，据外媒报道，李飞飞等研究人员用不到50美元和16张英伟达H100 GPU，耗时26分钟训练出s1-32B人工智能推理模型。据外界分析，该模型基于预训练模型微调，成本未涵盖前期“烧钱”部分，且只在特定测试集上超过o1-preview，未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后，李飞飞团队重点研究了如何以简单方式实现“测试时拓展”，即模型在推理时多次迭代优化结果，还构建 ...

10 分钟

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

在传统解法中，人类参赛者通常会借助三角函数、复数或其他计算方法来求解。而对于AlphaGeometry而言，其DDAR系统仅依靠基本的角度关系推导和比例关系推导，因此需要引入一些辅助点的构造。

1 小时

Ilya又回来了！神秘初创SSI估值200亿美元，5个月翻4倍，但没产品没收入

没有一个产品，没有任何收入，Ilya创业公司SSI又在洽谈新一轮融资了！据称，公司估值高达200亿美元，较5个月前翻了4倍。 Ilya又回来了！路透独家爆料称，Ilya ...

来自MSN3 小时

报道称李飞飞团队用不到 50 美元训练出媲美DeepSeek R1的 AI 推理模型 ...

媒体/自媒体的宣传出现了「一丢丢偏差」，我先结合论文简要说几点最关键的看法帮大家省流，然后还原一下这篇 AI 论文是如何在信息传递的过程中逐渐「被标题党」的。大家可以按需阅读。下面的讨论主要基于最广为流传且被很多官媒转发的信息： ...

2 小时

大厂“拥抱”Deepseek，打不过就加入？

但海外市场对此却态度微妙，OpenAI一度宣称Deepseek“偷窃”了其“技术成果”，但一转头，微软、英伟达等大厂都宣布在自家产品中接入Deepseek，OpenAI CEO山姆·奥特曼更表示Deepseek的R1模型“令人印象深刻”。

爱范儿2 小时

极越已成功为 61 名用户完成退款支付工作

在一年前的访谈中，朱啸虎表态绝不会投资 6 家中国大模型创业公司中的任何一家。而在时隔一年之后，朱啸虎在访谈中反反复复用「太优美了」、「非常有深度」来评价 DeepSeek 与自己的交互，他表示「DeepSeek快让我相信AGI了。」 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果