Scaling - 搜索 News

15 小时

李飞飞、DeepSeek为何偏爱这个国产模型？

【新智元导读】最近，李飞飞团队仅用26分钟在Qwen基础上训出超越o1的模型，而DeepSeek更是直接选择了阿里通义千问Qwen蒸馏开源4款模型。一个不争的事实浮出水面：昔日称霸开源界Llama已悄然退位，新王加冕。

来自MSN16 小时

李飞飞团队“50美元”复刻DeepSeek-R1？一文读透“白菜价”背后的真正 ...

2月6日，据外媒报道，李飞飞等研究人员用不到50美元和16张英伟达H100 ...

腾讯网16 小时

李飞飞团队50美元复刻DeepSeek-R1？一文读透背后的真正逻辑

每经记者：宋欣悦每经编辑：兰素英2月6日，据外媒报道，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的费用，使用了16张英伟达H100 ...

19 小时

DeepSeek火爆出圈 AI热潮能否再掀巨浪？冠军基金经理雷志勇这样说

最近一段时间，DeepSeek无疑是科技圈焦点中的焦点。由幻方量化旗下人工智能初创公司深度求索公司推出的AI大模型，一度登顶多个应用商店全球下载榜单之首。DeepSeek的火爆出圈，也点燃了资本市场的热情，春节节后开盘以来，DeepSeek概念、云计算等指数一路高歌猛进，涨幅均超10%，计算机、传媒板块也在中信一级行业中涨幅居前（数据来源：Wind，截至2025.2.7）。

1 天

吴恩达：DeepSeek 启示

大约一周前，DeepSeek 发布了 DeepSeek-R1，这是一款性能对标 OpenAI o1 的杰出模型，且以 MIT 许可协议开放权重。通过 Qwen（我的团队已使用数月）、Kimi、InternVL 和 DeepSeek ...

1 天

817样本激发7倍推理性能：上交大「少即是多」定律挑战RL Scaling范式

在追求人工智能极限的道路上，"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域，业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而，来自上海交通大学的最新研究却给出了一个令人震惊的答案：仅需 817 ...

腾讯网1 天

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀 ...

据TechCrunch，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

1 天

成本不到150元！李飞飞等26分钟训出推理模型媲美R1，秘诀：蒸馏

据 TechCrunch ，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

2 天

国盛证券：AI能力边界将迎来新一轮扩张节后主要关注两方向

智通财经APP获悉，国盛证券发布研报称，随着RL算法在预训练阶段逐渐取代自回归算法，同时使用更强大的算力和更多的数据，基于RL算法训练模型生成思维链，将共同构成AI新的Scaling ...

3 天

中信证券：DeepSeek爆火全球关注三大主线

智通财经APP获悉，中信证券发布研报称，近期，DeepSeek爆火全球，其以强能力、低成本的特点著称，对全球AI产业链带来强借鉴意义。2025年1月20号发布的DeepSeek-R1性能对标OpenAI o1正式版，其强调强化学习技术路线，推理能力强、性价比突出。DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普及，加速AI应用全面落地;同时，其有望开启全新的Scaling Law ...

阿思達克財經網4 天

春节后的“红包”，DeepSeek概念股再次逆势大涨

Deepseek发酵了半个多月，期间以美国为首的多个国家发布禁令，以及一些科技企业试图禁止使用Deepseek，投资热度依旧不减。投资者向市场投出了信任票，港股概念股持续大涨，主要包括金山云、美图（01357）、商汤-W（00020）及金山软件（03 ...

5 天

复旦副教授谈DeepSeek：AI行业不只有“规模法则”，芯片需求可能不降 ...

尽管DeepSeek的模型降低了算力需求，但郑骁庆强调， AI模型仍需要一定的硬件基础来支持大规模训练和推理。此外，大规模数据中心和预训练仍是AI发展的重要组成部分，但未来可能会更注重高质量数据的微调和强化学习。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果