AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
红板报 on MSN10 小时
不断有人在问,这个中国模型到底有什么魔力?作者|Yoky邮箱|yokyliu@pingwest.com DeepSeek、李飞飞、LIMO,全球的AI界近期几乎都被这几个名词环绕,而这一切的背后,都要从一个“大隐隐于市”的高手谈起。
19 小时
来自MSN李飞飞团队“50美元”复刻DeepSeek-R1?一文读透“白菜价”背后的真正 ...2月6日,据外媒报道,李飞飞等研究人员用不到50美元和16张英伟达H100 GPU,耗时26分钟训练出s1-32B人工智能推理模型。据外界分析,该模型基于预训练模型微调,成本未涵盖前期“烧钱”部分,且只在特定测试集上超过o1-preview,未超过“满血版”o1和DeepSeek-R1。在“白菜价”的背后,李飞飞团队重点研究了如何以简单方式实现“测试时拓展”,即模型在推理时多次迭代优化结果,还构建 ...
在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而,来自上海交通大学的最新研究却给出了一个令人震惊的答案:仅需 817 ...
据TechCrunch,这个训练过程消耗了不到50美元的云计算成本,约合人民币364.61元;而s1模型作者之一表示,训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到。
据 TechCrunch ,这个训练过程消耗了不到50美元的 云计算 成本,约合人民币364.61元;而s1模型作者之一表示, 训练s1所需的计算资源,在当下约花20美元(约145.844元)就能租到 。
就在DeepSeek-R1模型发布两天后,美国政府就联合OpenAI、软银、甲骨文等启动“星际之门”项目,计划在未来四年内最高投资5000亿美元。孙正义还宣布要给OpenAI投资250亿美元,巨头们期望通过“军备竞赛”,维持自身在AI领域的全球领导地位。
智通财经APP获悉,国盛证券发布研报称,随着RL算法在预训练阶段逐渐取代自回归算法,同时使用更强大的算力和更多的数据,基于RL算法训练模型生成思维链,将共同构成AI新的Scaling ...
Deepseek发酵了半个多月,期间以美国为首的多个国家发布禁令,以及一些科技企业试图禁止使用Deepseek,投资热度依旧不减。投资者向市场投出了信任票,港股概念股持续大涨,主要包括金山云、美图(01357)、商汤-W(00020)及金山软件(03 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果