qwen - 搜索 News

来自MSN3 小时

斯坦福的S1和伯克利的TinyZero是研究人员越来越多地使用阿里巴巴技术降低AI训练成本的两个例子。随着美国计算机科学家（包括著名的华裔“AI教母”李飞飞）利用阿里巴巴的开源Qwen2.5模型，以不到50美元的成本训练出一种新的推理模型，在中国De ...

7 小时

阿里巴巴的开源Qwen2.5模型助力低成本AI训练，近期斯坦福大学与伯克利大学的研究人员利用这一技术成功开发出低于50美元的AI推理模型。斯坦福的S1推理模型和伯克利的TinyZero模型，均通过阿里巴巴的Qwen2.5-32b-Instruct模型训练而成。返回搜狐，查看更多 ...

来自MSN43 分钟

什么是蒸馏？模型蒸馏是机器学习（ML）中一种将知识从大型、复杂模型（通常称为教师模型）转移到较小、较简单模型（称为学生模型）的技术。目标是创建一个较小的模型，在保持较大模型大部分性能的同时，在计算资源、内存使用和推理速度方面更加高效。

9 小时

近日，复旦大学的一项突破性研究在AI领域引发了广泛关注。该研究揭示了大型语言模型（LLMs）在无人类干预的情况下实现自我复制的能力，标志着人工智能可能迈过了一个关键的技术门槛。这一发现不仅展示了AI技术的惊人潜力，也为人类社会敲响了警钟，促使我们重新 ...

2 小时

据IT之家此前报道，IBM 首席执行官本月初曾发表长文称，他们（DeepSeek）仅用约 2000 枚英伟达芯片，以大约 600 万美元的成本训练了最新的模型，远低于行业预期。这再次证明，小型、高效的模型也能带来实际成果，无需依赖庞大而昂贵的专有系统 ...

小熊财经 on MSN19 分钟

近日，阿里巴巴集团创始人马云再次成为公众焦点。据多方消息透露，2月11日中午，马云低调现身阿里巴巴杭州总部园区，这一举动迅速引起了市场的广泛关注。

在全球人工智能技术推动美国科技巨头市值持续攀升的背景下，中国本土人工智能公司DeepSeek的异军突起，正成为重塑国际投资者对中国科技资产认知的关键变量。这家以“低成本+高性能”开源模型为核心竞争力的初创企业，不仅通过技术突破挑战了市场对中美技术代差 ...

一些您可能无法访问的结果已被隐去。