Scaling - 搜索 News

2 小时

图像生成迎来CoT时刻！港中文首次提出文生图的o1推理和Inference Scaling ...

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

红板报 on MSN10 小时

不断有人在问，这个中国模型到底有什么魔力？

作者｜Yoky邮箱｜yokyliu@pingwest.com DeepSeek、李飞飞、LIMO，全球的AI界近期几乎都被这几个名词环绕，而这一切的背后，都要从一个“大隐隐于市”的高手谈起。

来自MSN19 小时

李飞飞团队“50美元”复刻DeepSeek-R1？一文读透“白菜价”背后的真正 ...

2月6日，据外媒报道，李飞飞等研究人员用不到50美元和16张英伟达H100 GPU，耗时26分钟训练出s1-32B人工智能推理模型。据外界分析，该模型基于预训练模型微调，成本未涵盖前期“烧钱”部分，且只在特定测试集上超过o1-preview，未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后，李飞飞团队重点研究了如何以简单方式实现“测试时拓展”，即模型在推理时多次迭代优化结果，还构建 ...

1 天

817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式

在追求人工智能极限的道路上，"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域，业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而，来自上海交通大学的最新研究却给出了一个令人震惊的答案：仅需 817 ...

腾讯网1 天

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀 ...

据TechCrunch，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

1 天

成本不到150元！李飞飞等26分钟训出推理模型媲美R1，秘诀：蒸馏

据 TechCrunch ，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

1 天

“算力崩塌”，是真是假

就在DeepSeek-R1模型发布两天后，美国政府就联合OpenAI、软银、甲骨文等启动“星际之门”项目，计划在未来四年内最高投资5000亿美元。孙正义还宣布要给OpenAI投资250亿美元，巨头们期望通过“军备竞赛”，维持自身在AI领域的全球领导地位。

3 天

国盛证券：AI能力边界将迎来新一轮扩张节后主要关注两方向

智通财经APP获悉，国盛证券发布研报称，随着RL算法在预训练阶段逐渐取代自回归算法，同时使用更强大的算力和更多的数据，基于RL算法训练模型生成思维链，将共同构成AI新的Scaling ...

阿思達克財經網4 天

春节后的“红包”，DeepSeek概念股再次逆势大涨

Deepseek发酵了半个多月，期间以美国为首的多个国家发布禁令，以及一些科技企业试图禁止使用Deepseek，投资热度依旧不减。投资者向市场投出了信任票，港股概念股持续大涨，主要包括金山云、美图（01357）、商汤-W（00020）及金山软件（03 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果